Wystarczy kilka tysięcy godzin programów publistycznych i Sztuczna Inteligencja przebija w czytaniu z ruchu warg ludzi specjalizujących się w tym fachu.
Google i Uniwersytet Oxford ściśle ze sobą współpracowały aby technologia AI Google - DeepMind mogła nauczyć się rozpoznawać wyrażenia i słowa przez zwykłe oglądanie TV. Proces przyswajania trwał 5,000 godzin.
Ostatecznie dokładność programu wyniosła 46,8% - aż o 12,4% więcej niż w przypadku osób profesjonalnie zajmujących się transkrypcją z ruchu warg. Jest to wynik niższy o 43,2% od LipNet - innego projektu z Uniwersytetu Oxford służącego do tego samego celu. Należy jednak wziąć pod uwagę, że LipNet opierał się na ograniczonej ilości odgórnie ustalonych fraz, a DeepMind został wdrożony w środowisku całkowicie naturalnym.
Technologia ma niewątpliwie duży potencjał i poprzez uczenie się może osiągnąć jeszcze wyższy stopień dokładności. Pytanie tylko, czy nie odbędzie się to kosztem prywatności użytkownika?
Pokaż / Dodaj komentarze do: DeepMind, AI od Google, potrafi czytać z ruchu warg lepiej niż człowiek