OpenAI vyvíja umelú inteligenciu pre napodobňovanie ľudského hlasu. Počujete v nahrávkach podobu?

NETKY.SK • 2 Apríl 2024, 19:00 • 2 min
OpenAI vyvíja umelú inteligenciu pre napodobňovanie ľudského hlasu. Počujete v nahrávkach podobu?

Spoločnosť OpenAI predstavila nový nástroj umelej inteligencie, ktorý dokáže napodobňovať ľudské hlasy s prekvapujúcou presnosťou. Hlasový generátor AI má celý rad potenciálnych aplikácií vrátane služieb prístupnosti, ale mohol by tiež vyvolať obavy z dezinformácií a iných foriem zneužitia.

slovakia

left justify in out

Spoločnosť OpenAI zdieľala vzorky z prvých testov nástroja s názvom Voice Engine, ktorý používa 15-sekundovú vzorku hovoriaceho na vytvorenie presvedčivej repliky jeho hlasu. Používatelia pritom môžu zadať odsek textu a nástroj ho prečíta hlasom vygenerovaným umelou inteligenciou.

Pre verejnosť je už k dispozícii niekoľko služieb generovania hlasov umelou inteligenciou, ale podobne ako v prípade chatbota ChatGPT sa spoločnosť OpenAI ukázala ako mimoriadne schopná pri získavaní širokého prijatia nástrojov umelej inteligencie. Podľa spoločnosti by nástroj na prevod textu na hlas s umelou inteligenciou mohol pomôcť pri preklade, čítaní pre deti alebo pri pomoci ľuďom, ktorí stratili schopnosť hovoriť. Niektorí skeptici sa však obávajú, že by to mohlo podporiť vytváranie dezinformácií alebo uľahčiť páchanie podvodov.

Spoločnosť OpenAI tvrdí, že Voice Engine v súčasnosti využíva len "malá skupina dôveryhodných partnerov" vrátane vzdelávacích a zdravotníckych technologických spoločností a že na základe ich testov určí, či a ako umožní jej širšie používanie. Títo testeri sa podľa spoločnosti zaviazali, že nebudú reprodukovať hlasy ľudí bez ich výslovného súhlasu a že poslucháčom jasne oznámia, že to, čo počujú, je vytvorené umelou inteligenciou.

"Uvedomujeme si, že generovanie reči, ktorá sa podobá hlasom ľudí, má vážne riziká, ktoré sú obzvlášť aktuálne v roku volieb," uviedla spoločnosť OpenAI vo svojom blogu. Spoločnosť tiež napríklad navrhla postupné zrušenie overovania bankových účtov pomocou hlasu.

Voice Engine dokáže použiť hlasovú vzorku v jednom jazyku na vytvorenie repliky hlasu, ktorá dokáže hovoriť vo viacerých ďalších jazykoch.

Príspevok na blogu spoločnosti obsahuje príklad zvukového klipu, v ktorom človek číta text, spolu so zvukom vytvoreným umelou inteligenciou, ktorý znie ako hlas toho istého človeka čítajúceho ten istý úryvok v španielčine, mandarínčine, nemčine, francúzštine a japončine. V každej z ukážok vytvorených umelou inteligenciou je zachovaný tón a prízvuk pôvodného hovoriaceho.

Zvukové ukážky z OpenAI, ktoré ukazujú, ako Voice Engine funguje si môžete vypočuť na stránke OpenAI.

Ukážka Voice Engine prichádza v čase, keď by mala spoločnosť vydať nástroj Sora, ktorý spoločnosť OpenAI predstavila minulý mesiac. Sora dokáže z textových pokynov vytvoriť realisticky vyzerajúce 60-sekundové videá so schopnosťou vytvárať scény s viacerými postavami, špecifickými typmi pohybu a prepracovanými detailmi pozadia. Nástroj ChatGPT od spoločnosti OpenAI dokáže tiež generovať obrázky z textových pokynov.



twiterfacebooklinkedinwhatsapp

Za Netky.sk
Barbora Šimkaninová
Zdroj: CNN, Foto: Ilustračná (All In One Trendz)
Netky
LETNÉ PRÁZDNINY O
00 DNÍ 00 HODÍN 00 MINÚT 00 SEKÚND
logo
Copyright © 2023 PetsoftMedia Inc.
Všetky práva sú vyhradené. Publikovanie alebo ďalšie šírenie správ, fotografií a video správ zo zdrojov TASR, SITA, taktiež z vlastnej autorskej tvorby, je bez predchádzajúceho písomného súhlasu porušením autorského zákona

Pre používanie spravodajstva Netky.sk je potrebné povoliť cookies