A OpenAI – criadora do ChatGPT – revelou nesta sexta-feira, 29, o seu modelo de geração de áudio em inteligência artificial (IA) que copia vozes humanas. A empresa disse, porém, que está optando por apenas mostrar a tecnologia ao público, sem lançá-la "amplamente" neste momento, tendo em vista os riscos de mau uso.
A ferramenta Voice Engine consegue recriar a voz de uma pessoa específica e fazê-la ler mensagens escritas pelo usuário, baseada em uma gravação de apenas 15 segundos do orador original, segundo o comunicado da OpenAI. A companhia disse que desenvolveu a tecnologia no fim de 2022, e que começou a testá-la preliminarmente com um pequeno grupo de "parceiros confiáveis".
No anúncio desta sexta, a OpenAI compartilhou insights sobre as aplicações até agora com a justificativa de iniciar um diálogo sobre a adoção responsável do que chamou de "vozes sintéticas". "De acordo com as conversas e os resultados de pequenos testes, vamos tomar uma decisão mais informada sobre como ou se usaremos essa tecnologia", falou, em uma publicação no seu blog.
A OpenAI disse que identificou formas de aplicação "para o bem", como: fornecer assistência de leitura a pessoas que não sabem ler; traduzir conteúdos; ajudar pacientes a recuperarem a voz; e outros usos terapêuticos.
Por outro lado, a empresa reconheceu que a tecnologia representa sérios riscos, sobretudo em ano de eleições ao redor do mundo. A companhia falou esperar que o Voice Engine motive a construção de maior resiliência da sociedade contra os desafios. Ela propõe, por exemplo, eliminar aos poucos as autenticações por voz para acessar contas bancárias, explorar políticas para proteger o uso de vozes de indivíduos, acelerar o desenvolvimento de técnicas de identificação de conteúdo criado por IA.