Wikimedia Deutschland ogłosiło w środę uruchomienie nowego systemu, który ma uczynić zasoby wiedzy zgromadzonej na Wikipedii bardziej dostępnym dla modeli sztucznej inteligencji. Projekt o nazwie Wikidata Embedding Project może zmienić sposób, w jaki systemy AI korzystają z wiarygodnych źródeł informacji.
Nowa baza danych wykorzystuje wyszukiwanie semantyczne oparte na wektorach – technikę, która pomaga komputerom rozumieć znaczenie słów i relacje między nimi. System obejmuje niemal 120 milionów wpisów z Wikipedii i powiązanych platform. Dodatkowo wspiera Model Context Protocol, standard ułatwiający komunikację systemów AI ze źródłami danych, co sprawia, że zapytania w języku naturalnym stają się znacznie efektywniejsze.
Potężna AI nie musi być kontrolowana przez garstkę firm. Może być otwarta, współpracująca i stworzona dla wszystkich.
Projekt powstał we współpracy niemieckiego oddziału Wikimedia z firmą Jina.AI specjalizującą się w wyszukiwaniu neuronowym oraz DataStax, spółką IBM zajmującą się danymi treningowymi w czasie rzeczywistym.
Nowy system Wikimedia może zakończyć erę niepewnych odpowiedzi chatbotów
Choć Wikidata od lat oferowała dane maszynowo czytelne, dotychczasowe narzędzia ograniczały się do wyszukiwania słów kluczowych i zapytań SPARQL. Nowy system znacznie lepiej współpracuje z technologią RAG (retrieval-augmented generation), pozwalając modelom AI na pobieranie zewnętrznych informacji zweryfikowanych przez redaktorów Wikipedii.
Baza danych jest publicznie dostępna na platformie Toolforge, a 9 października Wikidata organizuje webinar dla zainteresowanych deweloperów.
Projekt pojawia się w momencie, gdy twórcy AI desperacko poszukują wysokiej jakości źródeł danych. Philippe Saadé, menedżer projektu, podkreśla jego niezależność: "Ten projekt pokazuje, że potężna AI nie musi być kontrolowana przez garstkę firm. Może być otwarta, współpracująca i stworzona dla wszystkich."
Spodobało Ci się? Podziel się ze znajomymi!
Pokaż / Dodaj komentarze do:
Wikipedia otwiera swoje zasoby dla sztucznej inteligencji. Bastion upada?