OpenAI ogłosiło GPT-4o, zupełnie nowy model sztucznej inteligencji, który według firmy jest o krok bliżej „znacznie bardziej naturalnej interakcji człowiek-komputer”.
Nowy model przyjmuje jako dane wejściowe dowolną kombinację tekstu, dźwięku i obrazów, a do tego może generować dane wyjściowe we wszystkich trzech formatach. Potrafi także rozpoznawać emocje, pozwala przerwać w połowie mowy i reaguje niemal tak szybko jak człowiek podczas rozmowy.
![](https://i.ytimg.com/vi/vgYi3Wr7v_g/hqdefault.jpg)
„Wyjątkową cechą GPT-4o jest to, że jest to model o inteligencji na poziomie GPT-4 dostępny dla wszystkich, łącznie z naszymi darmowymi użytkownikami” – powiedziała Mira Murati, CTO OpenAI podczas prezentacji transmitowanej na żywo. „Po raz pierwszy robimy ogromny krok naprzód, jeśli chodzi o łatwość obsługi”.
![](https://i.ytimg.com/vi/MirzFk_DSiI/hqdefault.jpg)
W trakcie prezentacji OpenAI pokazało, jak GPT-4o tłumaczy na żywo między angielskim i włoskim, pomagając badaczowi rozwiązać równanie liniowe w czasie rzeczywistym na papierze i zapewniając wskazówki dotyczące głębokiego oddychania innemu dyrektorowi OpenAI, po prostu słuchając jego oddechów. Trzeba przyznać, że wyglądało to naprawdę imponująco.
W trakcie prezentacji OpenAI pokazało, jak GPT-4o tłumaczy na żywo między angielskim i włoskim.
![](https://i.ytimg.com/vi/c2DFg53Zhvw/hqdefault.jpg)
Litera „o” w GPT-4o oznacza „omni”, co jest odniesieniem do możliwości multimodalnych modelu. OpenAI stwierdziło, że GPT-4o został przeszkolony w zakresie tekstu, obrazu i dźwięku, co oznacza, że wszystkie wejścia i wyjścia są przetwarzane przez tę samą sieć neuronową. Różni się to od poprzednich modeli firmy, GPT-3.5 i GPT-4, które umożliwiały użytkownikom zadawanie pytań po prostu poprzez mówienie, a następnie transkrypcję mowy na tekst. Pozbawiało to wypowiedź tonu i emocji oraz spowalniało interakcje.
OpenAI udostępni nowy model wszystkim, w tym użytkownikom bezpłatnej ChatGPT, w ciągu najbliższych kilku tygodni, a także wypuści wersję ChatGPT na komputery stacjonarne, początkowo dla komputerów Mac, do której płatni użytkownicy mają dostęp od wczoraj.
Ogłoszenie OpenAI następuje dzień przed Google I/O, coroczną konferencją programistów organizowaną przez firmę, która odbędzie się dziś wieczorem. Krótko po tym, jak OpenAI ujawniło GPT-4o, Google zademonstrowało wersję Gemini, własnego chatbota AI o podobnych możliwościach.
![Obserwuj nas w Google News](https://ithardware.pl/img/gn_1280x150.jpg)
Pokaż / Dodaj komentarze do: Darmowy GPT-4o potrafi rozmawiać, śmiać się i śpiewać jak człowiek. To robi wrażenie