OpenAI puede clonar voces, pero no lanzará tecnología al público por sus riesgos

 

La empresa de inteligencia artificial (IA) OpenAI anunció el desarrollo de su modelo Voice Engine, capaz de clonar voces humanas y reproducir sonidos naturales de manera «emotiva y realista» utilizando una muestra de apenas 15 segundos. Sin embargo, la compañía ha decidido no lanzar esta tecnología al público general debido a los riesgos que podría conllevar.

Voice Engine es un modelo de IA que convierte texto en voz para crear voces sintéticas. Según OpenAI, esta tecnología podría permitir a los creadores de contenido traducir su trabajo a otros idiomas sin perder sus acentos nativos, así como ayudar a personas con problemas de comunicación verbal, como la incapacidad para hablar, a utilizar su voz para realizar llamadas telefónicas, entre otros usos.

La compañía ha mostrado ejemplos donde la voz de una persona angloparlante se traduce a español, mandarín, alemán, francés y japonés, manteniendo el acento nativo de la persona.

Por el momento, solo algunas empresas tienen acceso a esta tecnología, incluyendo empresas de tecnología educativa, plataformas de narración visual y sistemas de salud, entre otros. OpenAI ha enfatizado que está adoptando un enfoque cauteloso debido al potencial de uso indebido de la voz sintética.

Entre las reglas establecidas para el uso de esta tecnología se encuentra la prohibición de utilizar la voz de alguien sin su consentimiento y la obligación de informar a los usuarios cuando están interactuando con voces sintéticas.

Además, OpenAI ha implementado medidas de seguridad, como marcas de agua para rastrear el origen del audio generado por Voice Engine, y monitoreo proactivo sobre su uso.

Se ha señalado que las voces sintéticas generadas por IA podrían ser utilizadas por estafadores para acceder a cuentas bancarias que utilizan autenticación de voz, lo que plantea un importante desafío en términos de seguridad.