Google DeepMind ogłosiło Genie 2 — przełomowe narzędzie, które potrafi generować interaktywne światy 3D na podstawie jednego obrazu wejściowego czy tekstu. To innowacyjne rozwiązanie otwiera nowe możliwości w tworzeniu gier czy szkoleniu i testowaniu agentów sztucznej inteligencji, umożliwiając im interakcję z dynamicznymi środowiskami za pomocą standardowych urządzeń, takich jak klawiatura i mysz.
Kluczowe możliwości Genie 2
- Sterowalność akcji: Genie 2 rozpoznaje i reaguje na akcje użytkownika lub agenta AI, takie jak ruchy klawiaturą czy myszą. Na przykład naciskanie strzałek powoduje poruszanie postacią, a nie przypadkowe przesuwanie obiektów, takich jak drzewa czy chmury.
- Długoterminowa pamięć horyzontu: Narzędzie zapamiętuje części świata, które znikają z widoku, i odtwarza je w momencie, gdy znów pojawią się w polu widzenia. Dzięki temu symulacja staje się bardziej ciągła i realistyczna.
- Tworzenie nowych treści w locie: Genie 2 dynamicznie generuje nowe elementy świata, jednocześnie zachowując jego spójność. Środowiska ewoluują w sposób naturalny, co zwiększa realizm symulacji.
- Emergentne zdolności: System symuluje złożone interakcje, takie jak fizyka, grawitacja, oświetlenie, ruch postaci czy efekty wody i dymu. Dzięki temu możliwe jest animowanie postaci oraz realistyczne modelowanie zachowań NPC.
- Symulacja kontrfaktyczna: Genie 2 potrafi generować różne scenariusze z tego samego punktu początkowego, co pozwala badaczom testować różne ścieżki i rezultaty.
- Realistyczne obrazy jako źródła: Narzędzie wykorzystuje nie tylko grafiki komputerowe, ale także zdjęcia z rzeczywistego świata, symulując naturalne elementy, takie jak kołysanie trawy na wietrze czy przepływ wody.
- Szybkie prototypowanie: Badacze mogą błyskawicznie tworzyć interaktywne doświadczenia, przekształcając szkice lub koncepty artystyczne w pełnowymiarowe, interaktywne światy.
Introducing Genie 2: our AI model that can create an endless variety of playable 3D worlds - all from a single image. 🖼️
— Google DeepMind (@GoogleDeepMind) December 4, 2024
These types of large-scale foundation world models could enable future agents to be trained and evaluated in an endless number of virtual environments. →… pic.twitter.com/qHCT6jqb1W
Kontrowersje wokół generatywnej AI
Chociaż Genie 2 zapowiada się rewolucyjnie, nie jest wolne od kontrowersji. Główne problemy dotyczą praw autorskich, ponieważ modele takie jak Genie 2 są często trenowane na danych pobieranych z internetu, w tym materiałach objętych prawem autorskim. Artyści, deweloperzy gier i firmy technologiczne już wyrażają swoje zaniepokojenie nieautoryzowanym wykorzystaniem ich treści.
Zresztą już pojawiły się pozwy przeciwko firmom takim jak OpenAI czy Stability AI, oskarżanym o wykorzystywanie chronionych dzieł bez zgody autorów. Podobne sprawy mogą dotknąć również DeepMind. Firmy, takie jak Meta czy X, również znalazły się pod ostrzałem krytyki za wykorzystywanie danych użytkowników do szkolenia modeli bez ich wyraźnej zgody.
Narzędzie to wydaje się być idealnym do tworzenia gier, ale specjaliści sugerują także szerokie wykorzystanie w interaktywnych reklamach.
Google DeepMind just dropped Genie 2.
— Min Choi (@minchoi) December 4, 2024
AI can now create diverse, interactive 3D worlds from a single image or text.
Gaming will never be the same.
10 wild examples:
1. Long video generation on the fly pic.twitter.com/ol4OD5Z7zT
Genie 2 to krok milowy w rozwoju sztucznej inteligencji i interaktywnych symulacji. Narzędzie może znaleźć zastosowanie w różnych dziedzinach, od szkolenia agentów AI, przez gry, aż po symulacje edukacyjne i badawcze. Jednak aby w pełni wykorzystać jego potencjał, konieczne będzie rozwiązanie problemów związanych z etyką i prawami autorskimi.
DeepMind planuje dalsze rozwijanie technologii Genie 2, a więcej szczegółów możemy spodziewać się w nadchodzących miesiącach. Narzędzie to wydaje się być idealnym do tworzenia gier, ale specjaliści sugerują także szerokie wykorzystanie w interaktywnych reklamach. Zobaczymy więc, jak wyglądać będzie to w praktyce.
Pokaż / Dodaj komentarze do: Czy to przyszłość gamingu? Google zmienia tekst w grywalną grą w czasie rzeczywistym