Rok 2024 zbliża się ku końcowi, a AMD stoi w obliczu mieszanych ocen dotyczących swojej najnowszej technologii.
Potężne układy MI300X, które miały być przełomem w rywalizacji z dominującą na rynku Nvidią, ujawniają obiecujące specyfikacje, ale także zmagają się z trudnościami, które opóźniają ich pełne wykorzystanie. Największym wyzwaniem okazała się nie sama architektura sprzętowa, lecz oprogramowanie, co, jak wynika z dochodzenia SemiAnalysis, skutecznie utrzymuje Nvidię na prowadzeniu.
AMD w walce o dominację nad Nvidią: potężne chipy MI300X nie wystarczają w obliczu problemów z oprogramowaniem. Mimo trudności analitycy wierzą jednak, że AMD ma potencjał, aby w przyszłości realnie konkurować z Nvidią.
Met with @LisaSu today for 1.5 hours as we went through everything
— Dylan Patel (@dylan522p) December 23, 2024
She acknowledged the gaps in AMD software stack
She took our specific recommendations seriously
She asked her team and us a lot of questions
Many changes are in flight already!
Excited to see improvements coming https://t.co/38aAwwIdEI
MI300X kontra H100: Starcie tytanów na papierze
Na pierwszy rzut oka MI300X, oparte na architekturze CDNA 3, wydaje się niezwykle konkurencyjne wobec układów Nvidia H100 i nadchodzącego H200. Chip AMD oferuje imponujące 1307 TeraFLOPS mocy obliczeniowej FP16 oraz aż 192 GB pamięci HBM3, co przewyższa specyfikacje konkurenta. Dodatkowo AMD promuje swoje rozwiązanie jako bardziej opłacalne pod względem kosztów eksploatacji, co czyni je atrakcyjną opcją dla firm poszukujących wydajności przy niższych nakładach finansowych. Jednak jak zauważyli analitycy SemiAnalysis, różnice między MI300X a produktami Nvidia wykraczają poza dane techniczne. O ile układy AMD błyszczą w teorii, o tyle ich praktyczne zastosowanie odsłania trudności wynikające z niedopracowanego ekosystemu oprogramowania.
Problematyczny ekosystem oprogramowania AMD
Rygorystyczne testy przeprowadzone przez SemiAnalysis, trwające ponad pięć miesięcy, ujawniły poważne problemy z oprogramowaniem AMD. W trakcie testów inżynierowie SemiAnalysis musieli wielokrotnie polegać na bezpośrednim wsparciu specjalistów AMD, którzy naprawiali błędy i debugowali oprogramowanie w czasie rzeczywistym. Jak wskazano w raporcie, kultura zapewniania jakości (QA) w AMD wymaga znacznych usprawnień, a doświadczenia z obsługi MI300X odbiegają od oczekiwań wobec sprzętu gotowego do użycia. Problemy AMD nie ograniczyły się wyłącznie do testów SemiAnalysis. Klienci firmy, w tym jej największy dostawca chmurowy Tensorwave, również odczuwali trudności. W niektórych przypadkach inżynierowie AMD musieli uzyskać dostęp do zakupionych przez klientów chipów MI300X, aby debugować oprogramowanie na ich urządzeniach. Tego rodzaju praktyki są dalekie od standardów Nvidii, której ekosystem CUDA uchodzi za płynny i niezawodny od momentu instalacji.
Jednym z największych atutów Nvidii jest jej kompleksowy ekosystem CUDA, który umożliwia łatwą integrację z popularnymi frameworkami AI, takimi jak PyTorch. AMD z kolei zmaga się z ograniczeniami wynikającymi z rozwidleń bibliotek AI Nvidii, co prowadzi do problemów z kompatybilnością i suboptymalnych wyników. Analitycy zauważają, że Nvidia nieustannie rozwija swój ekosystem, wprowadzając nowe funkcje, biblioteki i aktualizacje wydajności, co tylko pogłębia przewagę nad AMD.
Pomimo licznych problemów, analitycy dostrzegli potencjał w przedpremierowych wersjach oprogramowania MI300X, które w testach BF16 wykazały znacznie lepszą wydajność. To sugeruje, że AMD podejmuje kroki w kierunku poprawy swojego ekosystemu. Założyciel SemiAnalysis, Dylan Patel, spotkał się z CEO AMD, Lisą Su, aby omówić potrzebę zmian. Patel zauważył, że wiele poprawek jest już w fazie rozwoju, a Lisa Su wydaje się świadoma skali wyzwań.
Jednak walka AMD z dominacją Nvidii to wciąż wspinaczka pod górę. Lata zaniedbań w obszarze oprogramowania sprawiają, że AMD musi nadrobić ogromne zaległości. Tymczasem Nvidia przygotowuje się do wprowadzenia nowej generacji chipów Blackwell, które mogą umocnić jej pozycję lidera, choć podobno firma napotyka pewne problemy w fazie rozwoju tego projektu.
Pokaż / Dodaj komentarze do: Kiepskie oprogramowanie AMD daje wiatr w żagle Nvidii