Chiński startup DeepSeek zyskał ogromne zainteresowanie w świecie technologii, twierdząc, że jego najnowszy model AI – DeepSeek R1 – został wytrenowany przy użyciu zaledwie 2 048 GPU i budżetu 6 milionów dolarów. Model ten ma konkurować z rozwiązaniami OpenAI, które wydało setki miliony dolarów na swój model AI. Jednak według raportu SemiAnalysis, rzeczywistość jest znacznie bardziej skomplikowana, ponieważ chińska firma miała zainwestować 1,6 miliarda dolarów w sprzęt i dysponować 50 000 układami Hopper od NVIDII.
DeepSeek zdobył rozgłos, twierdząc, że opracował przełomowe metody treningu AI, które pozwalają na osiągnięcie wysokiej wydajności przy minimalnych nakładach. W rzeczywistości jednak analiza SemiAnalysis wskazuje, że firma dysponuje 10 000 jednostkami NVIDIA H800, 10 000 H100 oraz zamawia kolejne H20, rozlokowane w kilku centrach danych. Infrastruktura ta nie tylko wspiera rozwój AI, ale również umożliwia zastosowania w modelowaniu finansowym, co jest zrozumiałe, biorąc pod uwagę korzenie DeepSeek.
Jak podaje SemiAnalysis, chińska firma miała zainwestować 1,6 miliarda dolarów w sprzęt i dysponować 50 000 układami Hopper od NVIDII.
Firma wywodzi się z chińskiego funduszu hedgingowego High-Flyer, który wcześnie dostrzegł potencjał AI i masowo inwestował w GPU. W 2023 roku High-Flyer utworzył DeepSeek jako oddzielny podmiot skupiony wyłącznie na sztucznej inteligencji. W przeciwieństwie do wielu startupów, DeepSeek jest samofinansujący się, co pozwala mu na szybkie decyzje i brak zależności od zewnętrznych inwestorów. Mimo że publicznie przedstawia się jako niewielka firma, SemiAnalysis szacuje, że DeepSeek zainwestował już ponad 500 milionów dolarów w rozwój AI.
Własna infrastruktura = pełna kontrola nad AI
Jednym z głównych atutów DeepSeek jest posiadanie własnych centrów danych, co odróżnia go od większości startupów AI, które wynajmują moc obliczeniową od gigantów chmurowych. Posiadanie własnej infrastruktury daje firmie pełną kontrolę nad eksperymentami, optymalizacją modeli oraz szybkim wdrażaniem innowacji bez ograniczeń narzucanych przez dostawców usług chmurowych.
Startup podkreśla także swoje unikalne podejście do efektywności algorytmicznej, zamiast po prostu zwiększać moc obliczeniową, co potencjalnie może zmniejszyć globalne zapotrzebowanie na zaawansowane układy GPU, stanowiąc zagrożenie dla firm takich jak NVIDIA.
Wyjątkowa strategia rekrutacyjna – DeepSeek zatrudnia wyłącznie z Chin
Co ciekawe, DeepSeek nie stosuje agresywnej polityki podkradania talentów z USA czy Tajwanu, co jest rzadkością w branży AI. Firma rekrutuje wyłącznie w Chinach, koncentrując się na umiejętnościach oraz zdolnościach analitycznych, a nie na samych tytułach akademickich. Kluczowymi uczelniami dla DeepSeek są Uniwersytet Pekiński i Uniwersytet Zhejiang, gdzie startup oferuje wyjątkowo wysokie wynagrodzenia. Niektórzy naukowcy AI w DeepSeek zarabiają nawet ponad 1,3 miliona dolarów rocznie, co przewyższa stawki innych chińskich firm, takich jak Moonshot.
Dzięki takiemu podejściu DeepSeek udało się opracować architektonicznie innowacje AI, takie jak Multi-Head Latent Attention (MLA), które wymagały miesięcy pracy i ogromnej mocy obliczeniowej.
Czy DeepSeek naprawdę obniżył koszty trenowania AI?
Jednym z największych czynników hype’u wokół DeepSeek było twierdzenie, że jego model został wytrenowany za jedyne 6 milionów dolarów. Jednak SemiAnalysis precyzuje, że ta kwota dotyczy jedynie czasu obliczeniowego GPU wykorzystanego do wstępnego treningu i nie obejmuje kosztów badań, optymalizacji modeli, przetwarzania danych czy budowy całej infrastruktury. W rzeczywistości całkowite nakłady DeepSeek na AI przekroczyły 500 milionów dolarów, tak więc firma zainwestowała pieniądze na poziomie wielkich graczy technologicznych.
Nie ma cudów
DeepSeek pokazuje, że niezależny, dobrze finansowany startup AI może konkurować z gigantami, ale jego sukces nie wynika z magicznych rozwiązań. Firma zainwestowała ogromne pieniądze w sprzęt, zatrudnia najwybitniejsze talenty z Chin i posiada pełną kontrolę nad swoją infrastrukturą. Historia DeepSeek przypomina słowa Elona Muska, który stwierdził, że „jeśli chcesz konkurować w AI, musisz wydawać miliardy rocznie”. DeepSeek nie obniżył radykalnie kosztów trenowania AI – po prostu od początku dysponował odpowiednimi zasobami, by stać się jednym z liderów na rynku.
Pokaż / Dodaj komentarze do: Czy DeepSeek oszukał świat? Startup twierdzi, że stworzył AI za grosze, raport ujawnia prawdę