OpenAI ogłosiło, że już wkrótce wszyscy użytkownicy ChatGPT będą mogli generować obrazy bezpośrednio w aplikacji. Funkcja ta zostanie udostępniona zarówno subskrybentom ChatGPT Plus, Pro i Team, jak i użytkownikom darmowej wersji. Generowanie obrazów stanie się domyślną opcją w modelu GPT-4o, eliminując konieczność osobnego korzystania z DALL·E. Co więcej, funkcja ta pojawi się także w Sora – innym narzędziu OpenAI do tworzenia treści wizualnych.
Nowy system umożliwi użytkownikom generowanie obrazów na podstawie wpisywanych promptów, kontekstu rozmowy oraz przesłanych plików graficznych. Co istotne, ChatGPT pozwoli również modyfikować istniejące obrazy zgodnie z instrukcjami użytkownika. OpenAI chwali się znaczącymi postępami w zakresie renderowania tekstu oraz lepszego zrozumienia kontekstu.
OpenAI ogłosiło, że już wkrótce wszyscy użytkownicy ChatGPT będą mogli generować obrazy bezpośrednio w aplikacji.
Nowe możliwości będą przydatne zarówno do użytku osobistego, jak i profesjonalnego. Firma podaje kilka przykładów zastosowań, w tym: tworzenie infografik, przygotowanie grafik promocyjnych na media społecznościowe czy generowanie obrazów zawierających duże ilości tekstu.
Say hello to GPT-4o, our new flagship model which can reason across audio, vision, and text in real time: https://t.co/MYHZB79UqN
— OpenAI (@OpenAI) May 13, 2024
Text and image input rolling out today in API and ChatGPT with voice and video in the coming weeks. pic.twitter.com/uuthKZyzYx
Realizm i inteligentne dopasowanie treści
Nowa technologia OpenAI oferuje zaawansowane możliwości w zakresie fotorealizmu, dokładnie odwzorowując światło, cienie i tekstury. Dzięki lepszemu zrozumieniu kontekstu, użytkownicy mogą generować np. plakat z ptakami zamieszkującymi Central Park lub wizualizację konkretnej epoki w historii sztuki omawianej wcześniej w rozmowie.
Krok w stronę „uniwersalnej sztucznej inteligencji”
Funkcja obrazowania została zbudowana na GPT-4o, modelu wydanym w ubiegłym roku. Litera „o” oznacza „omni”, co odnosi się do jego zdolności multimodalnych – obsługi zarówno tekstu, jak i obrazów. Możliwość przekształcania i edytowania przesyłanych plików to kolejny krok w stronę „jednej sztucznej inteligencji do wszystkiego”, o której wspominał Sam Altman w niedawnych wywiadach.

Pokaż / Dodaj komentarze do: Nowy rozdział dla ChatGPT. Narzędzie AI staje się jeszcze wszechstronniejsze