NVIDIA chce zdominować AI. Architektura Feynman może być przełomem


NVIDIA chce zdominować AI. Architektura Feynman może być przełomem

NVIDIA szykuje nową generację układów znanych jako Feynman, które mają odegrać kluczową rolę w rozwoju sztucznej inteligencji, szczególnie w obszarze, w którym AI wykonuje konkretne zadania. Firma ma wykorzystać jednostki LPU i zintegrować je z nową architekturą GPU. Chodzi o zwiększenie wydajności przy jednoczesnym zmniejszeniu opóźnień.

NVIDIA może sięgnąć po technologię hybrid bonding od TSMC, która pozwala na łączenie kilku układów krzemowych. W tym przypadku główny rdzeń odpowiadający za obliczenia o nazwie Feynman zostałby wyprodukowany w nowoczesnym procesie technologicznym, a osobne układy otrzymałyby sporo pamięci SRAM i jednostki LPU. Przypomina to rozwiązanie stosowane w procesorach AMD, które wyposażone są w dodatkowe warstwy pamięci, choć oczywiście u NVIDII skala oraz złożoność byłyby znacznie większe.

Zamiast umieszczać ogromne ilości pamięci SRAM bezpośrednio w jednym monolitycznym rdzeniu, NVIDIA rozdzieli zadania między kilka elementów. Pozwoliłoby to lepiej wykorzystać drogi krzem w zaawansowanych litografiach i jednocześnie zwiększyć przepustowość przy niższym zużyciu energii. Kluczowe znaczenie ma tu właśnie hybrid bonding, który zapewnia szerokie połączenia między układami, a także zapewnia szybki dostęp do danych.

Wydajność kontra temperatura i elastyczność

Warto pamiętać jednak, iż układy o bardzo dużej mocy obliczeniowej generują sporo ciepła, a dokładanie kolejnych warstw może utrudnić jego skuteczne odprowadzanie. Przy zadaniach inferencyjnych, które często wymagają stałej, wysokiej przepustowości, tego rodzaju problemy mogą być poważne.

Drugim wyzwaniem jest sposób działania jednostek LPU. Są one projektowane z myślą o przewidywalnym, uporządkowanym przetwarzaniu danych, co dobrze pasuje do inferencji, ale gorzej do bardziej elastycznych zadań znanych z klasycznych GPU.

Może to prowadzić do konfliktu między deterministycznym działaniem LPU a elastycznością, jakiej oczekują programiści korzystający z platformy CUDA.

CUDA i software jako największe wyzwanie

Nawet jeśli NVIDIA poradzi sobie z tymi wyzwaniami, równie trudne może okazać się oprogramowanie. CUDA zostały zaprojektowane tak, aby abstrahować wiele szczegółów sprzętowych, podczas gdy jednostki LPU wymagają bezpośredniej kontroli nad pamięcią oraz kolejnością wykonywania operacji. Połączenie tych dwóch światów będzie wymagało dużych zmian i bardzo precyzyjnej optymalizacji.

Spodobało Ci się? Podziel się ze znajomymi!

Pokaż / Dodaj komentarze do:

NVIDIA chce zdominować AI. Architektura Feynman może być przełomem
 0