Algorytmy znacznie poprawiły rozpoznawanie głosu ludzkiego, ale wydaje się, że technologia wciąż potrzebuje dużo prawdziwej ludzkiej pomocy, aby się szkolić, nawet jeśli dzieje się to kosztem prywatności. Ostatni raport rzuca światło na to, jak Google szkoli swojego wirtualnego asystenta, płacąc wykonawcom za transkrypcję nagrań audio, w tym również tych, w których nawet nie został przywołany osobisty asystent. Chociaż wirtualni asystenci są nadal bardzo popularni, wiele osób obawia się zagrożeń prywatności związanych z posiadaniem urządzeń, które słuchają rozmów zarówno w miejscu pracy, jak i w domowym salonie. Po doniesieniach o tym, jak działa Alexa od Amazon, wygląda na to, że Google stosuje prawie ten sam proces ulepszania swoich algorytmów. VRT NWS, belgijski nadawca publiczny, opublikował raport ujawniający, w jaki sposób był w stanie słuchać ponad tysiąca fragmentów nagranych za pomocą Google Assistant, a następnie konfrontował ludzi z ich nagraniami, które nadawca był w stanie znaleźć dzięki adresom i innym wrażliwym informacjom zawartym w plikach audio.
Google twierdzi, że fragmenty audio i nie są powiązane z żadnymi osobistymi lub identyfikowalnymi informacjami - rzeczywistość okazała się oczywiście całkiem inna.
Ludzie w Belgii i Holandii byli zaskoczeni, gdy usłyszeli siebie lub bliskie osoby na nagraniach. "To niezaprzeczalnie mój własny głos" -powiedział jeden z mężczyzn, podczas gdy inna para natychmiast rozpoznała głos ich syna i wnuka. "Dlaczego Google zapisuje te nagrania i dlaczego pracownicy ich słuchają? Nie interesuje ich to, co mówisz, ale sposób, w jaki to mówisz. System komputerowy Google składa się z inteligentnych, samouczących się algorytmów. Aby jednak zrozumieć subtelne różnice i cechy języka holenderskiego, nadal musi się wiele nauczyć" - zauważa VRT NWS dodając, że Google korzysta z narzędzia online Crowdsource, na wypadek, gdyby wyszukiwarka miała trudności z analizą określonego polecenia głosowego. Chociaż informacje o użytkownikach są oddzielone od fragmentów audio, aby zachować anonimowość, same nagrania ułatwiają poznanie czyjejś tożsamości, która może być również namierzona poprzez padające nazwy, które podwykonawcy sprawdzają w Google lub na Facebooku. Twórcy raportu mówią również, że z tysiąca fragmentów, które wysłuchali, 153 zostało nagranych przez "pomyłkę", co oznacza, że polecenie „OK Google” nie zostało wydane.
Nagrania obejmowały "rozmowy w sypialni, rozmowy między rodzicami i ich dziećmi, ale także kłótnie i biznesowe rozmowy telefoniczne zawierające wiele prywatnych informacji". Pracownik, który transkrybuje takie klipy audio, opowiadał również o kobiecie, która była w ogromnym stresie, ale biorąc pod uwagę brak wytycznych dotyczących takich przypadków, niewiele mógł zrobić. Nagrania ujawniają również, że mężczyźni często szukają pornografii, nawet za pośrednictwem inteligentnych głośników, choć samo to nie jest szczególnie zaskakujące. Google twierdzi również, że ich eksperci językowi oceniają tylko około 0,2 procent wszystkich fragmentów audio i że nie są one powiązane z żadnymi osobistymi lub identyfikowalnymi informacjami. Biorąc pod uwagę, że VRT NWS było w stanie skonfrontować ludzi z ich własnymi nagraniami, rzeczywistość wygląda zupełnie inaczej.
Pokaż / Dodaj komentarze do: Po nagraniach z Asystenta Google można dotrzeć do konkretnych użytkowników