Biren BR100 to pierwsze chińskie GPU, które na poważnie rzuca wyzwanie NVIDII. Znamy szczegóły

Biren BR100 to pierwsze chińskie GPU, które na poważnie rzuca wyzwanie NVIDII. Znamy szczegóły

Birentech przedstawiło na Hot Chips 34 kilka nowych szczegółów dotyczących swojego nadchodzącego GPU Biren BR100, który ma być najpotężniejszym chińskim układem graficznym, rzucającym wyzwanie produktom NVIDII i AMD. 

GPU Birentech BR100 wykorzystuje autorską architekturę i produkowane jest na bazie 7 nm litografii, a całość składa się łącznie z 77 miliardów tranzystorów. Układ wykorzystuje konstrukcję 2.5D CoWoW firmy TSMC z 300 MB wbudowanej pamięci podręcznej z 64 GB pamięci HBM2e o przepustowości 2,3 TB/s na interfejsie PCIe 5.0 x16 (protokół CXL). Birentech używa dwóch chipletów na swoim GPU BR100, przy czym każdy z zawiera 16 SPC (klastrów przetwarzania strumieniowego). BR100 ma TDP 550 W i jest dostarczany w module OAM.

Biren BR100
 

Każdy z SPC ma 16 jednostek wykonawczych (EU), przy czym 4 EU tworzą wewnętrzną jednostkę obliczeniową (CU), która ma 64 KB pamięci podręcznej L1 (LSC), a ponadto SPC współdzieli 8 MB pamięci podręcznej L2 w ramach wszystkim jednostek wykonawczych (EU). W sumie BR100 ma 32 SPC z 512 EU, 256 MB pamięci podręcznej L2 i 8 MB pamięci podręcznej L1.

Biren BR100
 

Podczas Hot Chips 34 Birentech zaprezentował schemat architektury BR100, na którym widać, że jednostka wykonawcza ma 16 rdzeni przetwarzania strumieniowego (V-Core) i jeden silnik Tensor (T-Core)… co nasuwa skojarzenia z GPU NVIDII. Birentech ma 40 KB TLR (Thread Local Register), 4 SFU i TDA (Tensor Data Accelerator).

Biren BR100
 

Każda z jednostek CU może pomieścić łącznie 4, 8 lub do 16 jednostek UE. Nowe GPU BR100 od Birentech i jego V-Core to uniwersalny procesor SIMT z 16 rdzeniami, który obsługuje FP32, FP16, INT32 i INT16. Dostępne jest również wsparcie dla SFU, ładowania/przechowywania i przetwarzania danych, z operacjami głębokiego uczenia wykonywanymi w postaci Batch Norm, ReLu i innych. Ponadto BR100 zawiera ulepszony model SIMT, który jest w stanie uruchomić do 128 tys. wątków na 32 SP w trybie superskalowania (statycznym i dynamicznym). Rdzenie T-Core zostały zaprojektowane z myślą o przyspieszeniu zadań opartych na sztucznej inteligencji, takich jak MMA, Convulution itp.

Biren BR100
 

Birentech porównuje swój nowy procesor graficzny BR100 z Ampere A100, czyli profesjonalnym GPU obecnej generacji od NVIDII (firma właśnie przedstawiła swój procesor graficzny nowej generacji Hopper H100, który jest znacznie lepszy). W tych testach BR100 bije GPU Ampere A100 (choć lepiej poczekać na niezależne testy). BR100 pokonuje A100 w wielu obciążeniach HPC, osiągając 2,5-krotnie wyższą wydajność niż A100.

Biren BR100
 

Choć Hopper H100 jest już na horyzoncie, to nowy układ graficzny BR100 firmy Birentech i tak robi wrażenie. NVIDIA ma 80 miliardów tranzystorów tworzących GPU Hopper H100, Birentech ma 77 miliardów tranzystorów wewnątrz BR100. BR100 jest zbudowany na 7 nm, z kolei H100 bazuje na 4 nm (ulepszony 5 nm proces, zoptymalizowany przez TSMC dla NIVDII i H100).

Zobacz także:

Obserwuj nas w Google News

Pokaż / Dodaj komentarze do: Biren BR100 to pierwsze chińskie GPU, które na poważnie rzuca wyzwanie NVIDII. Znamy szczegóły

 0