Zdjęcia Google otrzymują dużą funkcję AI o nazwie „Zapytaj zdjęcia”

Zdjęcia Google otrzymują dużą funkcję AI o nazwie „Zapytaj zdjęcia”

Google wprowadza model Gemini AI do wielu swoich usług, w tym Zdjęć Google, które otrzymują nową funkcję „Ask Photos” („Zapytaj zdjęcia”). Ta umożliwia użytkownikom korzystanie z zapytań w języku naturalnym w celu przeprowadzania złożonych i kontekstowych wyszukiwań w bibliotece zdjęć.

Sztuczna inteligencja była niewątpliwie gwiazdą wczorajszej konferencji Google I/O. Firma ogłosiła szereg funkcji AI, w tym jedną dla Zdjęć Google o nazwie „Ask Photos”. Ta umożliwia użytkownikom przeszukiwanie zdjęć i zadawanie pytań na ich temat za pomocą prostego języka naturalnego.

Funkcja obsługiwana przez Gemini wykracza daleko poza zwykłe wyszukiwanie zdjęcia psa. Ask Photos rozumie kontekst i odpowiada na bardziej złożone pytania. Na przykład prosząc go o zdjęcie dziecka chodzącego w wodzie, otrzymamy jedno lub wiele zdjęć tego typu. Jednak poproszenie go o pokazanie procesu nauki pływania przez dziecko dostarczy cały szereg wyników, od nauki chodzenia w wodzie po uzyskanie stosownych dyplomów. Gemini rozumie kontekst nauki pływania i wyciąga powiązane zdjęcia.

Chociaż niektórzy ludzie prawdopodobnie uznają tę funkcję za nieco przerażającą, podkreśla ona, jak zaawansowany jest model Google Gemini AI.

Innym przykładem było znalezienie zdjęć różnych miejsc wakacyjnych. Użytkownicy mogą poprosić sztuczną inteligencję o wyszukanie wszystkich punktów orientacyjnych w danym mieście lub zdjęcia pomnika Waszyngtona, pomnika Lincolna i Białego Domu z podróży do Waszyngtonu, które pozwolą uzyskać odpowiednie wyniki. Może nawet znaleźć zdjęcia z numerem tablicy rejestracyjnej (pod warunkiem, że mamy to zdjęcie). Dyrektor generalny Google, Sundar Pichai, zapytał sztuczną inteligencję: „Jaki jest mój numer rejestracyjny?” Aplikacja Zdjęcia pomyślnie podała numer jego tablicy rejestracyjnej. Zrobiła to na podstawie danych o lokalizacji i innych czynników.

Chociaż niektórzy ludzie prawdopodobnie uznają tę funkcję za nieco przerażającą, podkreśla ona, jak zaawansowany jest model Google Gemini AI. Może to pomóc wielu osobom znaleźć rzeczy na setkach (lub tysiącach) zdjęć przechowywanych w Zdjęciach Google. Koncentrowanie się na wprowadzaniu języka naturalnego jest również istotne, ponieważ modele sztucznej inteligencji przyspieszają w kierunku wprowadzania danych „multimodalnych”, takich jak przetwarzanie tekstu, dźwięku i wideo. 

Biorąc pod uwagę rozwój generatywnych modeli sztucznej inteligencji, ciągły nacisk Google na AI nie jest zaskoczeniem, a gigant wyszukiwania najwyraźniej zamierza dodawać tę technologię wszędzie, gdzie to tylko możliwe.

 

Obserwuj nas w Google News

Pokaż / Dodaj komentarze do: Zdjęcia Google otrzymują dużą funkcję AI o nazwie „Zapytaj zdjęcia”

 0