Centrum badań nad Sztuczną Inteligencją Microsoftu dokonało przełomu w dziedzinie rozpoznawania głosu - udało się im opracować system, który wychwytuje słowa równie dobrze co przeciętny człowiek. Naukowcy pod wodzą Xuedonga Huanga uważają to wydarzenie za "historyczne osiągnięcie".
Z badań wynika, że margines błędu to zaledwie 5.9 procent (w poprzednim miesiącu wynosił on 6.3%), co zdaniem Microsoftu jest wynikiem bardzo zbliżonym do profesjonalnych tłumaczy wykonujących transkrypcje. Mechanizm opracowany przez Microsoft używa modelu neurolingwistycznego, który grupuje podobne słowa, umożliwiając efektywne przybliżanie wypowiedzianych słów i uczy się rozpoznawać złożone zwroty. Amerykańska firma planuje zaimplementować to rozwiązanie w swojej wirtualnej asystentce Cortanie (dostępnej na Windows 10 PC, Windows 10 Mobile oraz Xbox One), jak również wprowadzić je do systemu przetwarzania mowy na tekst.
"Dzięki temu Cortana stanie się jeszcze potężniejszym narzędziem, dzięki któremu doczekamy się naprawdę inteligentnego asystenta" - Harry Shum, wiceprezes Centrum Badań nad Sztuczną Inteligencją Microsoftu
Pomimo sukcesu naukowców, nie oznacza to wcale końca pracy nad technologią rozpoznawania głosu. Microsoft musi teraz dopasować swoje rozwiązanie do różnorodnych sytuacji i typów głosów. Co więcej, istotne jest nie tylko usłyszenie samych słów, lecz także ich zrozumienie - dzięki czemu na przykład rozpoznawanie komend głosowych będzie znacznie bardziej organiczne.
Pokaż / Dodaj komentarze do: Nowy system rozpoznawania głosu Microsoftu dorównuje człowiekowi