Extra flopsy

Ludzkość oficjalnie wkroczyła w erę komputerów eksaflopowych. Amerykańcy zbudowali maszynę, która jest w stanie w trybie ciągłym pracować z prędkością 1.1 eksaflopsów (dokładnie 1.102 EF), a w szczycie nawet ponad 1.6 EF.

Co to właściwie znaczy?

Jeden flops to jedna operacja zmiennoprzecinkowa na sekundę. Dajmy na to, mnożymy 3.75 przez 1.23. Jeżeli zajmie nam to średnio jedną sekundę, to mamy wydajność jednego flopsa.

Megaflops to milion takich operacji na sekundę. Gigaflops - miliard.

Współczesne procesory montowane w komputerach kupowanych przez "zwykłych" zjadaczy bitów mają wydajności na poziomie dziesiątek lub setek gigaflopsów, głównie dzięki dużej liczbie rdzeni oraz zestawowi instrukcji SIMD (MMX, SSE i tak dalej). A więc - sto czy dwieście miliardów operacji zmiennoprzeciwnkowych na sekundę jest w zasięgu większości posiadaczy współczesnych laptopów czy pecetów.

Teraflops to tysiąc miliardów czyli bilion (nie mylić z angielskim billion) takich operacji na sekundę. Współcześnie żeby dostać się do takich prędkości, trzeba na ogół być maniakiem gier komputerowych. Wyższej klasy (czytaj: droższe) karty graficzne wchodzą w zakresy teraflopowe, podobnie zresztą jak "duże" konsole do gier. Microsoft twierdzi, że nowy XBox może osiągać do 12 TF czyli całkiem szybko.

Petaflops to tysiąc teraflopsów - to już są prędkości raczej nie do osiągnięcia w warunkach domowych, chyba że ktoś ma naprawdę głębokie kieszenie i dużo miejsca. Może dałoby się postawić kilkadziesiąt wypasionych pecetów, pospinać je jakoś gigabitowymi łączami, poeksperymentować ze specjalistycznymi dystrybucjami Linuksa... no i wywalić kupę kasy na comiesięczne rachunki za prund. Albowiem czym szybsze kumputery, tym wincy żro prundu. Bierze się to z prostych praw fizyki - przejście z jedynki na zero (i vice versa) wymaga zużycia odrobiny energii. Czym więcej takich przejść będziemy robić, tym więcej zapłacimy za prąd. Można oczywiście optymalizować procki pod kątem energożerności - w przypadku superkomputerów podaje się zwykle również wydajność energetyczną w GF na każdy wat - ale płacić trzeba tak czy siak.

Petaflopowe maszyny działają już od 2008 roku - pierwszy był IBM, potem dużo innych. Jednak dopiero niedawno udało się dotrzeć do wersji eksaflopowej, czyli tysiąc petaflopsów.

flops x 1000000 = gigaflops

gigaflops x 1000 = teraflops

teraflops x 1000 = petaflops

petaflops x 1000 = eksaflops

Czyli jeden eksaflops to tysiąc milionów milionów operacji zmiennoprzecinkowych na sekundę.

Biliard (ang. quadrillion) operacji na sekundę... jak to możliwe? Oczywiście dzięki przetwarzaniu równoległemu.

Oak Ridge National Laboratory to firma z siedzibą w stanie Tennessee (rzadki przypadek angielskiego słowa z trzema zdublowanymi literkami, coś jak Mississippi, aggressiveness, bookkeeper czy successfully). W 74 wielkich skrzyniach, z których każda waży ponad 3.5 tony, udało się upchać ponad 47 tysięcy procesorów (dwóch rodzajów), którym towarzyszy ponad 37.5 tysięcy kart graficznych. Łączna liczba rdzeni przetwarzających przekracza 8.7 miliona.

Komputerek ów ma ponad 9 petabajtów pamięci operacyjnej. Każda piątka procesorów ma też do swojej wyłącznej dyspozycji 37 petabajtów lokalnej szybkiej przestrzeni dyskowej, a do tego dochodzi jeszcze 716 petabajtów wspólnej przestrzeni dostępnej dla całej maszyny. Lokalne dyski osiągają maksymalnie 75 terabajtów na sekundę przy odczycie, 35 terabajtów przy zapisie oraz około 15 miliardów operacji wejścia / wyjścia na sekundę.

Wszystko to jest połączone kablami o łącznej długości ponad 144 kilometry.

Jak to schłodzić? Cztery pompy, każda o mocy 350 koni mechanicznych, tłoczą przez ten system ponad 22 tysiące litrów wody w ciągu każdej minuty, dzięki czemu temperatura utrzymuje się stale poniżej 30°C.

Maszynka zajmuje 372 metry kwadratowe i pobiera maksymalnie 40 megawatów prundu. Wydajność energetyczna to niecałe 63 gigaflopy na każdy wat.

1.1 EF to jest nominalna prędkość tej maszyny, potrafi ją utrzymać w sposób ciągły. Natomiast w szczycie, kiedy trzeba przyspieszyć, potrafi dobić prawie do 1.7 EF. Teoretyczna maksymalna wydajność w szczycie to okolice 2 EF, ale nie udało się tego póki co zaprezentować.

Dodam jeszcze, że operacje zmiennoprzecinkowe są najbardziej obciążające dla procesorów. Jeżeli komputerek ów pracuje w trybie mieszanym, z dużą liczbą operacji stałoprzecinkowych (typowych na przykład dla uczenia maszynowego), wówczas osiąga ponad 6.8 EF.

Wisienka na torcie: Chińczycyjuż od ponad roku mają co najmniej dwie lub trzy maszyny pracujące z eksaflopowymi prędkościami, tylko się nimi za bardzo nie chwalą. Tianhe-3 ma osiągać do 1.3 EF przy normalnej pracy i 1.7 EF w szczycie.

Nieważne jaki jesteś w czymś dobry, zawsze znajdzie się jakiś Azjata, który będzie w tym lepszy i tańszy 🙂

Leave a Comment

Twój adres e-mail nie zostanie opublikowany.