Gemini Omni stworzy film praktycznie z wszystkiego. Google pokazało nowy poziom AI.


Gemini Omni stworzy film praktycznie z wszystkiego. Google pokazało nowy poziom AI.

Podczas konferencji Google I/O 2026 firma zaprezentowała nowy model sztucznej inteligencji Gemini Omni Flash, który zdaniem Google będzie przełomem w rozwoju generatywnego AI. Według Google system potrafi tworzyć wysokiej jakości materiały wideo praktycznie z dowolnego rodzaju danych wejściowych, od tekstu i zdjęć po nagrania audio oraz filmy.

To kolejny krok po sukcesie modelu Nano Banana, który według firmy wygenerował już ponad 50 miliardów obrazów. Tym razem Google idzie jednak znacznie dalej i chce połączyć wszystkie media w jeden wielomodalny system AI.

AI wygeneruje film na podstawie rozmowy

Gemini Omni Flash pozwala użytkownikowi edytować materiały wideo za pomocą zwykłych poleceń tekstowych. W praktyce oznacza to możliwość dodawania nowych obiektów, zmiany otoczenia, wyboru innych kątów kamery czy modyfikacji stylu sceny bez konieczności ręcznej obróbki. Google podkreśla, że model zachowuje spójność postaci i sekwencji scen nawet podczas wielokrotnych zmian projektu. Możliwe jest również przesłanie własnego nagrania i poproszenie AI o dodanie efektów CGI, nowych bohaterów lub całkowitą zmianę klimatu filmu.

Gemini Omni Flash zdaniem Google będzie przełomem w rozwoju generatywnego AI.

Co więcej, firma twierdzi, że Omni posiada „intuicyjne rozumienie fizyki”, a generowane materiały korzystają z wiedzy Gemini dotyczącej historii, nauki i kontekstu kulturowego. Ma to poprawić realizm scen i jakość narracji.

AI stworzy także narrację i cyfrowego awatara

Nowy model potrafi generować kompletne filmy instruktażowe na podstawie krótkiego opisu tekstowego, łącznie z automatycznie wygenerowanym lektorem AI. Jako dane wejściowe można wykorzystać zdjęcia postaci, szkice czy obrazy scen.

Co ciekawe, Google umożliwi także stworzenie cyfrowego awatara użytkownika. Taki wirtualny sobowtór będzie mógł pojawiać się w materiałach generowanych przez AI, zachowując wygląd i głos właściciela. Na razie Omni obsługuje głównie próbki głosowe jako źródło audio, ale Google zapowiada rozszerzenie wsparcia dla kolejnych formatów dźwięku w przyszłości.

Google zabezpieczy filmy znakami wodnymi

Warto dodać, że wszystkie materiały tworzone przez Gemini Omni będą automatycznie oznaczane cyfrowym znakiem wodnym SynthID. Technologia pozwoli też rozpoznać treści wygenerowane przez AI między innymi w aplikacji Gemini, wyszukiwarce Google oraz przeglądarce Chrome.

Gemini Omni Flash trafia już do aplikacji Gemini oraz platformy Google Flow dla użytkowników subskrypcji Google AI Plus, Pro i Ultra. Model pojawi się także w YouTube Shorts oraz aplikacji YouTube Create, gdzie posłuży do remiksowania krótkich materiałów wideo.

Spodobało Ci się? Podziel się ze znajomymi!

Pokaż / Dodaj komentarze do:

Gemini Omni stworzy film praktycznie z wszystkiego. Google pokazało nowy poziom AI.
 0