Polacy nie gęsi i swoją AI mają. Może jeszcze nie każdy o niej słyszał, ale wszystko wskazuje na to, że projekt ten rozwija się w dobrym kierunku i wkrótce może się o nim zrobić naprawdę głośno. A mowa oczywiście o Bieliku stworzonym przez fundację SpeakLeash (Spichlerz) i ACK Cyfronet AGH.
Bielik nazywany jest często polskim ChatemGPT, ale nie jest to do końca dobre porównanie. ChatGPT opiera się bowiem na własnych modelach językowych stworzonych przez OpenAI (czyli np. GPT-4o, czy GPT-5), podczas gdy Bielik nie został oparty na polskim modelu, ale na (solidnie ulepszonym i zmodyfikowanym) francuskim Mistral 7B.
W odróżnieniu od zamkniętych modeli OpenAI, Mistral AI jest modelem otwartoźródłowym (można go uruchamiać lokalnie i modyfikować), mającym stanowić europejską alternatywę dla amerykańskich gigantów AI.
Wydawałoby się, że realną groźbę dla amerykańskiej potęgi AI stanowią Chiny, ale Europa - w tym Polska - nie powiedziała jeszcze w tej kwestii ostatniego słowa. Może nie powstanie tu AI, które będzie potrafiła skopać cyfrowe tyłki Groka, Gemini i ChataGPT, ale na pewno może tu powstać taka, która będzie się lepiej sprawdzać w warunkach lokalnych.
Bielik AI to model LLM zoptymalizowany pod względem języka polskiego
No właśnie - ale po co nam polski model AI, kiedy ChatGPT (OpenAI), Gemini (Google), Copilot (Microsoft), czy Grok (xAI) działają przecież po polsku i generują odpowiedzi w języku zapytania użytkownika? Owszem, te chaty AI obsługują język polski, ale ich wyszkolenie w języku polskim nie jest równe angielskiemu.
Spowodowane jest to tym, że najwięcej materiałów wykorzystanych do treningu tych AI dostępnych jest w języku angielskim, a więc chaty AI będą przy użyciu tego języka bardziej kreatywne, wszechstronne i precyzyjne. Gdy do akcji wchodzą niuanse kulturowe, zaawansowane rozumowanie czy specjalistyczna terminologia, to język angielski może dawać lepsze wyniki.
Co musisz wiedzieć o Bieliku
Do szkolenia Bielika wykorzystano dwa polskie superkomputery: Helios (oparty na AMD Epyc oraz NVIDIA H100 i GH200) i Athena (oparty na AMD Epyc i NVIDIA A100). Bielik v2 posiada 11 miliardów parametrów i oferuje 32 tysiące tokenów w oknie kontekstowym, a jego wysoką wydajność potwierdza Chat Arena.

Dostępny jest bez licencji i bez opłat, co stanowi świetną wiadomość choćby dla przedsiębiorców chętnych na AI, ale nie dysponujących dużymi budżetami. Jeśli dodamy do tego możliwość lokalnego hostowania modelu i większą precyzję w obsłudze języka polskiego, to otrzymamy naprawdę interesujący produkt.
NVIDIA daje Bielikowi okejkę
W czerwcu bieżącego roku przypomniano sobie o Bieliku, bowiem gruchnęła wiadomość, że Bielik AI otrzymał wsparcie NVIDII, które ma polegać na dostępie do technologii zarówno pod względem infrastruktury, jak i oprogramowania, ale i do wiedzy na temat tworzenia modeli wnioskujących. Celem odgórnym jest zbudowanie suwerennej AI w regionie EMEA.
Będzie można również wdrażać lokalne modele jako mikrousługi NIM. O, wspaniale… ale co to jest, to całe NIM? NVIDIA Inference Microservices (NIM) to zestaw usług, które przyśpieszają wdrażanie modeli generatywnej sztucznej inteligencji na dowolnej infrastrukturze - chmurze, centrach danych czy stacjach roboczych. NIM dostarcza gotowe rozwiązania i API, a deweloperzy mogą efektywnie zająć się wdrażaniem.
Jak można porozmawiać z Bielikiem?

Można to po prostu zrobić wchodząc na oficjalną stronę Bielika.

Można go również zainstalować lokalnie, choćby za pomocą LM Studio. Wystarczy pobrać ten darmowy program i na liście dostępnych modeli wyszukać Bielika w wersji która nas interesuje.
Polska musi się specjalizować w modelach niszowych
Jak na razie Bielik oczywiście ustępuje czołowym modelom AI jeśli chodzi o ogólną skalę zasobów. Powiedzmy sobie szczerze, że żadna polska nie firma nie dysponuje i nie będzie dysponować takimi środkami na rozwój AI jak OpenAI, xAI, czy Google. Bielik AI może jednak znaleźć swoją niszę i świetnie sprawdzać się naszych rodzimych zastosowaniach. Prace nad modelem nieustannie postępują i ostatnio otrzymaliśmy choćby Bielika v3 w wersjach 1.5B oraz 4.5B.
Wsparcie firmy NVIDIA daje szansę na zwiększenie tempa trenowania Bielika i szybkiego wzrostu modelu. Oczywiście na ten moment czekamy na efekty, bo nie wiemy, jak realnie przełoży się to na rozwój. Na ten moment mówi się, że Bielik ma znaleźć zastosowanie w administracji publicznej, przemyśle, czy też systemach edukacyjnych, a na jego bazie mogą powstać setki modeli dostosowanych do danych potrzeb.
Wsparcie NVIDII - chociaż niezwykle istotne - to jednak nie wszystko. Pojawiają się kolejne pomysły i inicjatywy, jak choćby Obywatel Bielik. To projekt, który ma promować polskie dziedzictwo, będzie miał postać aplikacji (webowej i mobilnej), gdzie każdy będzie mógł wrzucić swoje zdjęcia, które posłużą do szkolenia modelu Bielika. Chodzi o dostarczenie zdjęć lokalnych potraw, przyrody, tradycji, zabytków, tak by AI potrafiła je prawidłowo rozpoznawać i generować. Jak piszą sami twórcy Bielika: przełomy w AI to nie tylko nowe architektury i tona GPU. To też nowe podejście do zarządzania danymi, trenowania modeli i tworzenia jakościowych zbiorów.
Pozostaje nam trzymać kciuki i bacznie obserwować dalszy rozwój polskiej AI - a miejmy nadzieję, że kolejne dobre wieści dotrą do nas już wkrótce.

Pokaż / Dodaj komentarze do: Bielik, czyli polska AI. Wszystko co musisz o nim wiedzieć