Układ graficzny na trzy lata, a potem do kosza. Inżynier Google zauważa problem

Układ graficzny na trzy lata, a potem do kosza. Inżynier Google zauważa problem

Anonimowy inżynier Google powiedział, że układy graficzne w centrach danych wytrzymują zaledwie około trzech lat, co dla Nvidii jest dobrą wiadomością.

Generatywna sztuczna inteligencja (GenAI) napędza rewolucję w sektorze technologicznym, a takie firmy jak Google i Microsoft inwestują miliardy dolarów w infrastrukturę niezbędną do jej rozwoju. W miarę jak modele AI stają się coraz bardziej złożone i wymagające, potrzeba coraz większej mocy obliczeniowej, którą dostarczają potężne procesory graficzne (GPU) w centrach danych. Według doniesień technologicznych, układy GPU mają jednak ograniczoną żywotność, co staje się problemem dla firm wydających krocie na tę technologię.

Firmy obawiające się zbyt szybkiego zużycia drogich akceleratorów AI mogą spróbować ograniczyć zużycie, ale to tylko oznacza, że ​​sprzęt będzie potrzebował więcej czasu, aby się zwrócić.

Krótkotrwałość GPU: Trzy lata intensywnej pracy

Według anonimowego źródła, będącego „głównym architektem GenAI w Alphabet” i cytowanego przez TechFund, procesory graficzne w centrach danych, które pracują na intensywnych obrotach, mogą przetrwać zaledwie trzy lata, zanim ulegną awarii. Oznaczałoby to, że operatorzy o wysokim stopniu wykorzystania akceleratorów AI, jak Lambda Labs i CoreWeave, mogą doświadczyć masowych problemów sprzętowych już po kilku latach eksploatacji. Użytkownicy podkreślają, że jedynie mniejsze obciążenie układów GPU może zapewnić im dłuższy czas pracy, choć wiąże się to ze spadkiem wydajności i potencjalnym opóźnieniem w realizacji dużych projektów AI.

Wysokie zużycie energii i cieplne obciążenia

Za krótką żywotność GPU odpowiada intensywne zapotrzebowanie na energię i ciepło generowane przez akceleratory. Najnowsze układy firmy Nvidia, takie jak Blackwell, wymagają mocy aż do 1000 watów, a ich poprzednicy z serii Hopper operowali na 700 W. Skala zużycia energii i wysokie temperatury wpływają negatywnie na krzem, co sprawia, że ​​GPU stają się podatne na uszkodzenia. Można to porównać do kart graficznych wykorzystywanych w procesie wydobywania kryptowalut, gdzie również dochodziło do ich przyspieszonego zużycia, co potwierdza liczne problemy techniczne zgłaszane przez graczy, którzy kupili karty z drugiej ręki pochodzące z takich operacji.

Kosztowna infrastruktura i niepewny zwrot z inwestycji

W miarę jak generatywna AI się rozwija, wydatki firm technologicznych na rozwój infrastruktury gwałtownie wzrastają. W ostatnim kwartale Google wydało 13,2 miliarda dolarów na sprzęt do przetwarzania AI, a plany zakładają dalsze zwiększenie wydatków. OpenAI, mimo partnerstwa z Microsoftem, prognozuje 5 miliardów dolarów straty w 2024 roku. Wysokie koszty i niepewny zwrot z inwestycji sprawiają, że inwestorzy coraz bardziej niepokoją się rentownością AI, której koszty szkolenia i działania wciąż sięgają astronomicznych kwot.

Jeżeli doniesienia o krótkiej żywotności GPU okażą się prawdziwe, centra danych, których zadaniem jest obsługa największych modeli AI, będą musiały regularnie odnawiać swoją infrastrukturę sprzętową, co znacznie podniesie ich koszty operacyjne. Operatorzy mogą próbować spowalniać obciążenie GPU, aby wydłużyć ich czas pracy, ale to z kolei może przełożyć się na spadek tempa rozwoju AI oraz opóźnienia w realizacji projektów.

Nvidia znajduje się w komfortowej sytuacji – firma odnotowała trzykrotny wzrost swojej wartości rynkowej, która w czerwcu 2024 r. wyniosła imponujące 3 biliony dolarów. Krótsza żywotność GPU może stanowić dla Nvidii nieustające źródło przychodów, jeśli kluczowi gracze AI będą zmuszeni regularnie inwestować w nowy sprzęt co trzy lata. W obecnym scenariuszu wydaje się, że każda z wielkich firm technologicznych, która liczy na szybki rozwój AI, stoi przed wyborem: albo regularna wymiana sprzętu, albo ryzyko częstych awarii w centrach danych.

Oczekiwania rynku względem AI pozostają wysokie, ale krótkie cykle życia GPU mogą znacząco zmienić realia branży. Konieczność regularnej wymiany procesorów graficznych wiąże się z ogromnymi wydatkami i rodzi pytania, czy boom na generatywną sztuczną inteligencję, który rozpoczął się dzięki szybkim innowacjom technologicznym, rzeczywiście przyniesie spodziewany zwrot.

Obserwuj nas w Google News

Pokaż / Dodaj komentarze do: Układ graficzny na trzy lata, a potem do kosza. Inżynier Google zauważa problem

 0
Kolejny proponowany artykuł
Kolejny proponowany artykuł
Kolejny proponowany artykuł
Kolejny proponowany artykuł