Deepseek, chiński podmiot zajmujący się rozwojem sztucznej inteligencji udostępnił otwartą wersję modelu językowego DeepSeek-R1. Producent twierdzi, że jego rozwiązanie działa lepiej od narzędzia OpenAI.
DeepSeek-R1 jest dostępny na platformie AI Hugging Face na licencji MIT, co oznacza, że można go używać komercyjnie bez ograniczeń. Według DeepSeek, R1 pokonuje OpenAI o1 w testach porównawczych AIME, MATH-500 i SWE-bench Verified. AIME wykorzystuje inne modele do oceny wydajności AI, podczas gdy MATH-500 to zbiór zadań tekstowych. SWE-bench Verified skupia się na zadaniach programistycznych.
Model AI DeepSeek-R1 dostępny dla każdego
Jak twierdzi producent R1 skutecznie weryfikuje fakty, co pomaga mu uniknąć niektórych pułapek, w które zwykle wpadają konkurencyjne narzędzia. Wspomniany model językowy wykorzystuje unikalną metodę „łańcucha myślowego” (chain-of-thought), w efekcie potrzebuje trochę czasu — zwykle sekund lub minut — aby udzielić odpowiedzi. Zaletą jest to, że teoretycznie model ten sprawdza się dobrze w takich dziedzinach jak fizyka, nauki ścisłe i matematyka.
Zdjęcie: DeepSeek
Łączna liczba parametrów DeepSeek-R1 wynosi aż 671 miliardów, aczkolwiek dla części osób jego uruchomienie może stanowić wyzwanie ze względy na wysokie wymagania sprzętowe. Jedna z funkcji pozwala uzyskać wgląd w tzw. reasoning tokens, czyli procesy rozumowania modelu. Dzięki temu jesteśmy w stanie zrozumieć działanie tego modelu AI. Całość ma jednak pewne wady.
DeepSeek R1 nie oferuje wsparcia dla function calling, co ogranicza tworzenie bardziej złożonych chatbotów połączonych z zewnętrznymi narzędziami, a także nie miewa problemy z udzielaniem dokładnych odpowiedzi w skomplikowanych scenariuszach np. w przypadku bardziej absurdalnych tekstów. Z drugiej strony potrafił udzielać ciekawych, a nawet śmiesznych odpowiedzi.
Pokaż / Dodaj komentarze do: DeepSeek R1 - chińska odpowiedź na OpenAI o1 dostępna dla każdego