DR exercise

Braliście kiedyś udział w przedsięwzięciu zwanym szumnie "DR exercise"?

DR to skrót od "disaster recovery" czyli po naszemu "co zrobić gdy terrorysta albo piorun walnie w naszą serwerownię i usmaży ją na węgiel?"

Jeżeli nie, to nie bierzcie. Jest to bowiem jeden z najnudniejszych kawałków w pracy w świecie IT.

Polega to na tym, że symuluje się awarię całej serwerowni oraz przełączenie automatyczne tejże serwerowni na serwerownię zapasową.

Brałem już udział w kilku tego typu zabawach, w różnych firmach. Jedno robią to lepiej, inni gorzej.

Najbardziej żmudne jest notowanie wszystkich czynności, które się wykonuje w ramach testów. Krok po kroku. Zrzuty ekranów, komunikaty błędów i tak dalej. Do znudzenia i poza nie.

Najbardziej niesamowite ćwiczenie typu DR robi jedna z irlandzkich firm (nazwę zachowam dla siebie) - nie widziałem tego na własne oczy, ale nasłuchałem się od kolegów, którzy widzieli, a to przecież praktycznie to samo.

Otóż raz na kwartał przełączają się oni z całością działalności z lokalizacji A na lokalizację B (lub odwrotnie). Nie jest to więc tylko "głupiutki" test, który ma wykazać na papierze, że w razie jakby co mamy działającą zapasową serwerownię, tylko faktycznie UŻYWAJĄ tej "zapasowej" serwerowni przez kolejny kwartał. Nie ma tu rozróżnienia między serwerownią "główną" a "zapasową", obydwie są "główne", równorzędne i gotowe na przejęcie obowiązków siostry - bliźniaczki w każdej chwili.

Mi się niedawno trafiło ćwiczenie typu DR w trybie trochę na rozpaczliwca. Końcem końców wszystko zadziałało, ale samo przełączenie między serwerowniami nie obyło się bez kilku "bumps and rough edges" jak mawiają lokalni.

Imprezka trwała pół dnia. Pod koniec tej połówki dnia, jak już wszystkie problemy zostały rozwiązane, zrobiło się tak nudno, że znalazłem nawet chwilę na popełnienie tego wpisu.

O.

6 komentarzy

  1. akuratnie dzisiaj miałem prezentacje jakiejś poznańskiej firmy która zajmuje się serwerowniami oraz sieciami teleinformatycznymi. Te serwerownie to chyba niezły interes. I coraz więcej tego się buduje. Robiłem niedawno chłodzenie i inne instalacje do czegoś takiego. Potrafią kosztować majątek.

    1. Serwerownie to osobny świat jest 😉 Najbardziej kosztowne w tym wszystkim jest zaopatrzenie tego cholerstwa w zasilanie – dlatego na przykład teraz jest wielka afera, bo Intel wypuścił nową, bardziej energooszczędną wersję procesora Xeon, ale ograniczył sprzedaż wyłącznie do Google i Facebooka – czyli największych “operatorów” serwerowni na świecie. Dzięki temu ta dwójka będzie mogła bardzo konkretnie zaoszczędzić na kosztach prowadzenia biznesu, co mocno wpływa na konkurencyjność – no i mamy chryję.

      Chłodzenie to osobna historia, Facebook ma te swoje słynne serwerownie gdzieś w Norwegii bodajże, w lodach i śniegach, żeby zaoszczędzić na chłodzeniu i odprowadzaniu ciepła.

      Kolejny duży kawałek tortu serwerowniowego to zasilanie awaryjne. Sam Microsoft w pojedynczej serwerowni w Dublinie potrzebuje zbiorniki na ropę (do agregatów zasilających) na jakieś półtora miliona litrów – wiem, bo znajomy pracuje w firmie (w Polsce! bo taniej…), która te zbiorniki produkuje. W razie padu zasilania mogą pociągnąć całą chmurę z zapasowego zasilania przez parę dni a może i tygodni (nie znam szczegółów).

      Do tego jeszcze dochodzą systemy ppoż, filtrujące powietrze, monitorujące i pierdylion innych o których nie mam bladego pojęcia 😉

  2. systemy p.poż. to butle z gazem wypierającym powietrze. W czasie pożaru otwierają się zawory, wpuszczany do serwerowni gaz wypiera powietrze i pożar samoistnie gaśnie. Serwerom nie powinno się nic stać przy tego typu gaszeniu. Przed wejście do pomieszczenia należy serwerownie przewentylować bo inaczej ludzie by się udusili. Wentylacja to żadne wielkie halo, praktycznie jak w zwykłych biurach. Budowana przeze mnie serwerownia produkowała tyle ciepła, że wykorzystano je do ogrzewania budynku. I zasadniczo przez okres jesienny i wiosenny wystarcza tego ciepła.

    1. Wiem, brałem nawet raz udział w tego typu testach ppoż – to jest niesamowita sprawa. Niby prosta fizyka, ale co innego o tym czytać, a co innego zobaczyć na własne oczy. Pewnie dla Ciebie to żadna frajda, skoro w tym siedzisz zawodowo, ale ja taką akcję widziałem na żywo tylko raz w życiu. Bardzo szybko i sprawnie to działa: czujka wykrywa dym, odpalają się samoczynnie gaśnice (w tym przypadku halonowe, ale pewnie inne gazy też mogą być), halon jako gaz gęstszy od powietrza “wylewa się” od dołu, więc ewentualni ludzie mają czas na spokojne opuszczenie serwerowni. A potem ogień po prostu gaśnie – i koniec. Trzeba tylko odczekać parę minut, żeby się upewnić, że wszystko dobrze wygasło i tyle, wietrzy się potem pomieszczenie, usuwa ewentualne szkody i po zawodach.

      Żeby było zabawniej miałem też okazję brać kilka razy w życiu w testach symulowanej awarii instalacji amoniakalnej – wyobraź sobie baniak z trzema tonami amoniaku, który się nagle rozszczelnia. Bez szybkiej reakcji służb specjalnych (strażacy z takimi fikuśnymi, jakby kosmicznymi kombinezonami) strefa śmierci rozciąga się nawet do dwóch kilometrów z wiatrem. Brrr. A ja koło takiego baniaka siedziałem dosłownie przez ścianę, przez ładnych parę lat.

  3. Ja w ogóle się na branży IT nie znam i nie będę kłamać, że jest inaczej, głównie dlatego, że nie lubię zaczynać znajomości od kłamstwa.Ale jednak jak tak czytam sposób w jaki piszesz, to jestem przekonana, że gdybym bardzo mocno się skupiła i gdybym mogła zadawać Ci nieskończoną ilość pytań, to bym zrozumiała! Także będę tutaj na bieżąco śledzić, może wzbogacę swoją wiedzę, co lubię robić bardzo, kto wie!

    1. Nieskończoną to może niekoniecznie 😉 Ale spoko, pytaj śmiało. Poza tym staram się nie ograniczać wyłącznie do tematyki komputerowej, więc jest szansa, że wygrzebiesz sobie jakieś inne ciekawe tematy.

Leave a Comment

Twój adres e-mail nie zostanie opublikowany.