DeepMind, AI od Google, potrafi czytać z ruchu warg lepiej niż człowiek

DeepMind, AI od Google, potrafi czytać z ruchu warg lepiej niż człowiek

Wystarczy kilka tysięcy godzin programów publistycznych i Sztuczna Inteligencja przebija w czytaniu z ruchu warg ludzi specjalizujących się w tym fachu.

Google DeepMind AI

Google i Uniwersytet Oxford ściśle ze sobą współpracowały aby technologia AI Google - DeepMind mogła nauczyć się rozpoznawać wyrażenia i słowa przez zwykłe oglądanie TV. Proces przyswajania trwał 5,000 godzin.

Ostatecznie dokładność programu wyniosła 46,8% - aż o 12,4% więcej niż w przypadku osób profesjonalnie zajmujących się transkrypcją z ruchu warg. Jest to wynik niższy o 43,2% od LipNet - innego projektu z Uniwersytetu Oxford służącego do tego samego celu. Należy jednak wziąć pod uwagę, że LipNet opierał się na ograniczonej ilości odgórnie ustalonych fraz, a DeepMind został wdrożony w środowisku całkowicie naturalnym.

Technologia ma niewątpliwie duży potencjał i poprzez uczenie się może osiągnąć jeszcze wyższy stopień dokładności. Pytanie tylko, czy nie odbędzie się to kosztem prywatności użytkownika?

Obserwuj nas w Google News

Tagi

RTV AGD

Pokaż / Dodaj komentarze do: DeepMind, AI od Google, potrafi czytać z ruchu warg lepiej niż człowiek

 0