Nueva IA Voicebox de Meta

Nueva IA Voicebox de Meta

La nueva IA Voicebox de Meta es una herramienta de texto a voz que aprende como ChatGPT.

Así, Meta AI acaba de presentar un «revolucionario» generador de texto a voz (TTS).

Que, según afirma, produce resultados hasta 20 veces más rápidos.

Que los modelos de inteligencia artificial más avanzados con un rendimiento comparable.

La nueva iniciativa de IA, bautizada como Voicebox, evita la arquitectura TTS tradicional.

En favor de un modelo más parecido a ChatGPT de OpenAI o Bard de Google.

El producto de Meta puede generalizar a través del aprendizaje en contexto.

Esta es una de las principales diferencias entre Voicebox y modelos TTS similares, como ElevenLabs Prime Voice AI.

Al igual que ChatGPT u otros modelos de transformador, Voicebox utiliza conjuntos de datos de entrenamiento a gran escala.

Los esfuerzos anteriores por utilizar grandes cantidades de datos de audio dieron resultados muy degradados.

Por eso, la mayoría de los sistemas TTS utilizan conjuntos de datos pequeños, muy seleccionados y etiquetados.

Meta supera esta limitación gracias a un novedoso sistema de entrenamiento.

Que prescinde de las etiquetas y la curación en favor de una arquitectura capaz de «rellenar» la información de audio.

Como afirma Meta AI, Voicebox es el «primer modelo capaz de generalizar tareas de generación de voz”.

“Para las que no ha sido específicamente entrenado con un rendimiento de vanguardia».

Así, Voicebox puede traducir texto a voz, eliminar ruidos no deseados sintetizando voz de sustitución.

E incluso también aplicar la voz de un locutor a salidas en distintos idiomas.

Según un artículo de investigación que publicó Meta, su sistema Voicebox preentrenado puede lograr todo esto.

Utilizando sólo el texto de salida deseado y un clip de audio de tres segundos.

La llegada de la generación de discursos bien estructurada se produce en un momento especialmente delicado.

Pues las empresas de redes sociales siguen luchando con la moderación.

Y en Estados Unidos, las inminentes elecciones presidenciales amenazan con poner a prueba una vez más los límites de la detección de la desinformación en Internet.

Fuente: Cointelegraph