Darmowy GPT-4o potrafi rozmawiać, śmiać się i śpiewać jak człowiek. To robi wrażenie

Darmowy GPT-4o potrafi rozmawiać, śmiać się i śpiewać jak człowiek. To robi wrażenie

OpenAI ogłosiło GPT-4o, zupełnie nowy model sztucznej inteligencji, który według firmy jest o krok bliżej „znacznie bardziej naturalnej interakcji człowiek-komputer”. 

Nowy model przyjmuje jako dane wejściowe dowolną kombinację tekstu, dźwięku i obrazów, a do tego może generować dane wyjściowe we wszystkich trzech formatach. Potrafi także rozpoznawać emocje, pozwala przerwać w połowie mowy i reaguje niemal tak szybko jak człowiek podczas rozmowy.

„Wyjątkową cechą GPT-4o jest to, że jest to model o inteligencji na poziomie GPT-4 dostępny dla wszystkich, łącznie z naszymi darmowymi użytkownikami” – powiedziała Mira Murati, CTO OpenAI podczas prezentacji transmitowanej na żywo. „Po raz pierwszy robimy ogromny krok naprzód, jeśli chodzi o łatwość obsługi”.

W trakcie prezentacji OpenAI pokazało, jak GPT-4o tłumaczy na żywo między angielskim i włoskim, pomagając badaczowi rozwiązać równanie liniowe w czasie rzeczywistym na papierze i zapewniając wskazówki dotyczące głębokiego oddychania innemu dyrektorowi OpenAI, po prostu słuchając jego oddechów. Trzeba przyznać, że wyglądało to naprawdę imponująco. 

W trakcie prezentacji OpenAI pokazało, jak GPT-4o tłumaczy na żywo między angielskim i włoskim.

Litera „o” w GPT-4o oznacza „omni”, co jest odniesieniem do możliwości multimodalnych modelu. OpenAI stwierdziło, że GPT-4o został przeszkolony w zakresie tekstu, obrazu i dźwięku, co oznacza, że ​​wszystkie wejścia i wyjścia są przetwarzane przez tę samą sieć neuronową. Różni się to od poprzednich modeli firmy, GPT-3.5 i GPT-4, które umożliwiały użytkownikom zadawanie pytań po prostu poprzez mówienie, a następnie transkrypcję mowy na tekst. Pozbawiało to wypowiedź tonu i emocji oraz spowalniało interakcje.

OpenAI udostępni nowy model wszystkim, w tym użytkownikom bezpłatnej ChatGPT, w ciągu najbliższych kilku tygodni, a także wypuści wersję ChatGPT na komputery stacjonarne, początkowo dla komputerów Mac, do której płatni użytkownicy mają dostęp od wczoraj.

Ogłoszenie OpenAI następuje dzień przed Google I/O, coroczną konferencją programistów organizowaną przez firmę, która odbędzie się dziś wieczorem. Krótko po tym, jak OpenAI ujawniło GPT-4o, Google zademonstrowało wersję Gemini, własnego chatbota AI o podobnych możliwościach.

Obserwuj nas w Google News

Pokaż / Dodaj komentarze do: Darmowy GPT-4o potrafi rozmawiać, śmiać się i śpiewać jak człowiek. To robi wrażenie

 0