OpenAI zaskoczyło swoją najnowszą technologią klonowania głosu, którą opracowała firma. Choć imponuje ona swoją jakością, z pewnością również budzi pewne obawy wśród użytkowników.
Technologia ta, znana jako Voice Engine, pozwala na sklonowanie głosu użytkownika, wystarczy jedynie 15-sekundowy klip z jego wypowiedzią. Co więcej, replikowany głos potrafi oddawać emocje oraz naturalny rytm mowy, co sprawia, że dialogi generowane przez sztuczną inteligencję brzmią niezwykle realistycznie. Firma OpenAI podaje, że silnik głosowy został opracowany pod koniec 2022 roku, aby wspierać funkcję zamiany tekstu na mowę dla ChatGPT. Niemniej jednak, zamiast udostępniać go publicznie, firma zdecydowała się na ostrożne podejście, uznając, że społeczeństwo może jeszcze nie być gotowe na pełne wykorzystanie tej technologii.
Technologia może sklonować głos danej osoby, wykorzystując jedynie 15-sekundowy klip audio.
OpenAI just launched Voice Engine,
— AshutoshShrivastava (@ai_for_success) March 29, 2024
It uses text input and a single 15-second audio sample to generate natural-sounding speech that closely resembles the original speaker.
Reference and Generated audio is very close and hard to differentiate.
More details in 🧵 pic.twitter.com/tJRrCO2WZP
„Podchodzimy ostrożnie i świadomie do rozpowszechnienia tej technologii, z uwagi na potencjalne ryzyko niewłaściwego wykorzystania głosu syntetycznego” – czytamy w poście na blogu firmy, który prezentuje działanie Voice Engine oraz kilka przykładów jego zastosowania.
Mowa generowana przez sztuczną inteligencję często jest niemal identyczna z dźwiękiem referencyjnym, co stwarza ryzyko wykorzystania tej technologii do manipulacji informacjami i dezinformacji opinii publicznej. Mimo tych potencjalnych nadużyć, OpenAI podkreśla, że Voice Engine może przynieść społeczeństwu korzyści.
W opublikowanym na blogu komunikacie firma informuje, że testowała Voice Engine z ograniczoną grupą zaufanych partnerów pod koniec ubiegłego roku. Badania wykazały, że klonowanie głosu może być pomocne w czytaniu dla dzieci w wieku szkolnym oraz może pełnić rolę tłumacza, umożliwiając mówienie w różnych językach przy użyciu głosu konkretnej osoby.
Kolejnym przypadkiem zastosowania technologii Voice Engine jest pomoc dla osób, które straciły zdolność mówienia, podobnie jak robi to firma Apple. W wyniku tych eksperymentów OpenAI zdecydowało się udostępnić Voice Engine wybranym partnerom w trybie podglądu, którzy zobowiązali się do uczciwego i etycznego wykorzystywania tej technologii, bez nieuprawnionego podszywania się pod inne osoby.
Pokaż / Dodaj komentarze do: OpenAI wprowadza technologię klonowania głosu. Technologia budzi uzasadnione obawy