Podríamos decir que 2023 está siendo el gran año de la Inteligencia Artificial para el gran público. Las aplicaciones para generar imágenes a partir de texto están en plena ebullición, y modelos de lenguaje como el de ChatGPT están cambiando industrias enteras prácticamente de la noche a la mañana.
La clonación de voces mediante inteligencia artificial también está viviendo unos avances tremendos en los últimos meses, y ya se puede considerar una tecnología lo suficientemente madura como para tener multitud de uso prácticos con resultados de lo más creíbles.
Las 10 mejores aplicaciones para clonar voces
Si todavía no tienes muy claro para qué sirve esto de la clonación de voces, te interesará saber que se trata de una tecnología de tipo deepfake capaz de identificar, copiar y replicar el tono de voz, las inflexiones y los matices del habla de una persona mediante IA.
Una vez la IA ha sido entrenada y ha aprendido el funcionamiento de esa voz, podemos pedirle que lea cualquier texto usando la voz de esa persona. Esto nos permite usar la IA para que esa persona aparezca en un video o en una pista de audio hablando en otro idioma, pero también para muchas otras cosas. De hecho, a día de hoy ya puedes usar la clonación de voces para locutar videos, guiones o audiolibros, con tu propia voz sin necesidad de pasar por el arduo proceso de grabación o tener un buen equipo de sonido.
Recientemente se han viralizado multitud de memes y montajes humorísticos con voces clonadas de famosos. Ojo, ten en cuenta que clonar la voz de otra persona sin su permiso no es ético, y más allá de lo “divertido” que pueda llegar a ser en un momento dado, también puede tener consecuencias legales. Utiliza este tipo de herramientas únicamente con fines legítimos.
VoiceLab de ElevenLabs
ElevenLabs cuenta con uno de los mejores programas de clonación de voz del momento. Puedes clonar una voz con una muestra de audio de tan solo un minuto, y conseguir resultados extremadamente realistas y profesionales con un mínimo de 30 minutos de tu voz.
Un detalle interesante es que la aplicación cuenta con un sistema de verificación para comprobar que no estamos clonando la voz de otra persona. A partir de ahí, podemos clonar nuestra voz en hasta 28 idiomas y más de 50 acentos distintos.
En su versión gratuita ElevenLabs permite utilizar hasta 10.000 caracteres al mes, con 3 voces personalizadas y audio de alta calidad a 128kbps.
Resemble AI
Con Resemble puedes clonar tu voz grabando tan solo 25 frases con el micrófono, o lo que es lo mismo, facilitando unos 3 minutos de datos. A partir de ahí la IA podrá entrenarse y sintetizar tu voz correctamente, evitando los típicos sonidos robóticos que tan mal quedan en algunos clonadores de voz primitivos.
Gracias a sus resultados ultra-realistas Resemble actualmente cuenta ya con más de un millón de usuarios. Eso sí, ten en cuenta que se trata de una herramienta premium orientada al mercado profesional, con un precio básico de 0,006$ por segundo.
Si nos suscribimos al plan básico obtendremos hasta 10 voces personalizadas, localizaciones con acentos español (MX), francés e inglés británico, acceso a la API de Resemble y descarga ilimitada de audios, entre otras funciones.
Deep Voice 3
Deep Voice 3 es un software de clonación de voz de código abierto que puedes instalar en tu PC para usarlo de manera local. Está disponible a través de GitHub y se trata de una aplicación neuronal de texto a voz (TTS) que utiliza técnicas de deep learning para sintetizar voces humanas.
El proceso de instalación y configuración de Deep Voice 3 es bastante avanzado y requiere conocimientos técnicos, por lo que solo se recomienda para aquellos que tengan bastante tiempo libre y ganas de “salsear” un poco.
Entrar en la web de Deep Voice 3 en GitHub
Revoice de Podcastle
Podcastle es un conjunto de herramientas diseñadas para crear podcasts en el menor tiempo posible. Cuenta con un estudio de grabación, un editor de audio, un editor de video y hasta un generador de voces mediante IA llamado Revoice.
Dentro del generador de voces también encontramos la posibilidad de clonar nuestra propia voz, creando una copia digital sintetizada para crear una pista de audio a partir de un simple guion de texto.
Para que todo funcione correctamente tendremos que grabar una muestra de nuestra voz con 70 frases distintas. Después la IA de Podcastle necesitará 24 horas para entrenarse. Por último, ten en cuenta que aunque Podcastle se puede usar gratis, la herramienta de clonado solo está disponible mediante suscripción premium de 23.99$ al mes.
Entrar en Revoice de Podcastle
Tortoise-TTS
“Tortoise Text To Speech” es otra herramienta de código abierto para usuarios avanzados. La aplicación se ejecuta desde un Notebook de Google Colab y requiere el uso de un programa de grabación como Audacity para facilitar los audios de muestra para la IA.
La ventaja de este tipo de herramientas, al igual que Deep Voice 3, es que son gratuitas. Si quieres probarla puedes echar un vistazo a la web del proyecto en GitHub AQUÍ. También puedes encontrar un interesante tutorial en YouTube sobre cómo se realiza todo el proceso de clonado paso a paso.
Murf
Murf es una aplicación web con la que puedes clonar tu voz y generar una voz artificial que imite tu estilo y sonido particular, capaz de expresar emociones como el enfado, la alegría o la tristeza.
La aplicación permite ajustar detalles como el tono y la velocidad para que la voz resultante se adapte a lo que necesitas. Lo bueno de Murf es que cuenta con una versión gratuita con la que puedes generar 10 minutos de audio con tu voz clonada y 10 minutos de transcripción, algo que no ofrecen muchos clonadores de voz actualmente.
Speechify
Speechify cuenta con un extenso set de herramientas de texto a voz y tratamiento de voz con IA. Puedes clonar tu voz con tan solo 30 segundos de grabación, manteniendo el estilo y el acento original, y después usar el editor para narrar cualquier guion y emplear el contenido generado con fines comerciales.
Speechify es compatible con varios idiomas como el inglés, el español, italiano, francés, portugués y muchos otros. Aunque Speechify tiene una versión gratuita disponible, ésta es bastante limitada (nos deja ver cómo quedaría nuestra voz clonada mediante una pequeña prueba, pero poco más), y para usar el clonador de voces tendremos que suscribirnos a la versión Pro que tiene un precio realmente elevado de 129 dólares al mes.
LOVO
LOVO es otra de esas aplicaciones web especializada en la clonación de voces. Requiere como mínimo un minuto de grabación de voz, que puede ser mediante micrófono o un archivo de sonido. La verdad es que el proceso es realmente sencillo y directo.
Aunque estamos ante otra aplicación premium, LOVO cuenta con un periodo de prueba gratuito de 14 días y clonación de hasta 5 voces distintas, aunque sin posibilidad de descargar los audios generados.
PlayHT
El clonador de voces de PlayHT es capaz de generar voces de alta calidad con un 99% de aciertos. Está orientada a la creación de contenido, podcasts, anuncios y empresas que necesitan voces de calidad sin necesidad de invertir en costosos equipos de grabación y edición de sonido.
El plan básico de PlayHT tiene un precio de 31,2$ al mes, aunque también hay una versión gratuita que puedes usar para generar 2.500 palabras con tu voz clonada en cualquier idioma (aunque, eso sí, no puedes usarla para fines comerciales y requiere atribución).
Respeecher
Esta aplicación de clonado de voz está orientada a cineastas, desarrolladores de videojuegos (tiene más de 100 voces para NPCs) y creadores de contenido en general. La voz sintética es capaz de moldear el tono y las emociones de la voz para evitar tener que volver a grabar cualquier voz, lo cual resulta de lo más práctico.
También permite hacer modificaciones como convertir la voz de un adulto en la de un niño, gracias a sus algoritmos de procesamiento de señales digitales. Reespecher ofrece una versión de prueba gratuita de 3 días, y a partir de ahí su precio es de 0,09$ por segundo de voz generada.
¡Nos leemos en el siguiente post!