¡Comparte y comenta!

Primero, OpenAI ofrecía una herramienta que permitía a las personas crear imágenes digitales simplemente describiendo lo que querían ver. Luego construyó una tecnología similar que generaba vídeo en movimiento completo, como algo sacado de una película de Hollywood.

Ahora, ha revelado una tecnología que puede recrear la voz de alguien.

La destacada empresa emergente de inteligencia artificial dijo el viernes que un pequeño grupo de empresas estaba probando un nuevo sistema OpenAI, Voice Engine, que puede recrear la voz de una persona a partir de una grabación de 15 segundos. Si envías una grabación tuya y un párrafo de texto, él podrá leer el texto usando una voz sintética similar a la tuya.

No es necesario que el texto esté en su idioma nativo. Si hablas inglés, por ejemplo, puede recrear tu voz en español, francés, chino o muchos otros idiomas.

OpenAI no comparte la tecnología más ampliamente porque todavía está tratando de comprender sus peligros potenciales. Al igual que los generadores de imágenes y vídeos, un generador de voz podría ayudar a difundir información errónea en las redes sociales. También podría permitir a los delincuentes hacerse pasar por personas en línea o durante llamadas telefónicas.

La compañía dijo que está particularmente preocupada de que este tipo de tecnología pueda usarse para descifrar autenticadores de voz que controlan el acceso a cuentas bancarias en línea y otras aplicaciones personales.

«Esto es algo delicado y es importante hacerlo bien», dijo Jeff Harris, gerente de producto de OpenAI, en una entrevista.

La compañía está explorando formas de marcar con agua las voces sintéticas o agregar controles que impidan que las personas usen la tecnología con las voces de políticos u otras figuras prominentes.

El mes pasado, OpenAI adoptó un enfoque similar cuando lanzó su generador de vídeo, Sora. Ella mostró la tecnología pero no la reveló públicamente.

OpenAI se encuentra entre muchas empresas que han desarrollado una nueva generación de tecnología de IA que puede generar voces sintéticas de forma rápida y sencilla. Incluyen gigantes tecnológicos como Google, así como empresas emergentes como ElevenLabs, con sede en Nueva York. (El New York Times ha demandado a OpenAI y su socio, Microsoft, por acusaciones de infracción de derechos de autor que involucran sistemas de inteligencia artificial que generan texto).

Las empresas pueden utilizar estas tecnologías para generar audiolibros, chatbots de voz en línea o incluso crear una estación de radio con DJ automatizada. Desde el año pasado, OpenAI ha estado utilizando su tecnología para impulsar una versión de ChatGPT que habla. Y desde hace mucho tiempo ofrece a las empresas una variedad de voces que pueden usarse para aplicaciones similares. Todos fueron construidos a partir de clips proporcionados por actores de doblaje.

Pero la empresa aún no ha ofrecido una herramienta pública que permita a individuos y empresas recrear voces a partir de un clip corto, como lo hace Voice Engine. La capacidad de recrear cualquier voz de esta manera, afirmó Harris, es lo que hace que la tecnología sea peligrosa. La tecnología puede ser particularmente peligrosa en un año electoral, afirmó.

En enero, los residentes de New Hampshire recibieron mensajes de llamadas automáticas que los disuadieron de votar en las primarias del estado en una voz que probablemente fue generada artificialmente para sonar como la del presidente Biden. Posteriormente, la Comisión Federal de Comunicaciones prohibió este tipo de llamadas.

Harris dijo que OpenAI no tenía planes inmediatos de ganar dinero con la tecnología. Dijo que la herramienta podría ser particularmente útil para las personas que han perdido la voz debido a enfermedades o accidentes.

Demostró cómo se utilizó la tecnología para recrear la voz de una mujer después de que un cáncer cerebral la dañara. Ahora podía hablar, dijo, después de hacer una breve grabación de una actuación que dio cuando era estudiante de secundaria.

MundoDaily – #OpenAI #revela #una #herramienta #audio #recrea #voces #humanas

Publish: 2024-03-29 13:00:08

OpenAI revela una herramienta de audio que recrea voces humanas – MundoDaily

Deja un comentarioCancelar respuesta

Fiscalía de Milán investiga a italianos por pagar para disparar a civiles en Sarajevo

La presencia de talibanes en Alemania pone en riesgo a afghanos residentes

Cameroon, Gabon, Nigeria y Congo DR luchan por el último boleto a la Copa del Mundo 2026

Entradas relacionadas

Revelado: El impactante secreto que nadie te contó sobre los Algoritmos – MundoDaily

Revelado: Cómo una empresa india orquestó un gigantesco hackeo global de líderes y celebridades – MundoDaily

Como una máquina de escribir china cambió la computación moderna – MundoDaily

Deja un comentarioCancelar respuesta

Fiscalía de Milán investiga a italianos por pagar para disparar a civiles en Sarajevo

La presencia de talibanes en Alemania pone en riesgo a afghanos residentes

Cameroon, Gabon, Nigeria y Congo DR luchan por el último boleto a la Copa del Mundo 2026