Alguna vez hemos hablado de cómo hacer una transcripción de audio a texto de forma gratuita, y la mejor solución que hemos encontrado hasta ahora ha sido Otter.ai. Lo malo de este tipo de herramientas es que casi todas son de pago, lo cual puede ser un problema si solo queremos transcribir un video o un audio de forma puntual.
Hoy en día las Inteligencias Artificiales están destacando en muchísimos ámbitos como la creación de imágenes y obras de arte, por no hablar de la famosa IA conversacional de ChatGPT. Sin embargo, la aplicación de la que queremos hablar hoy es una Inteligencia Artificial enfocada en la transcripción de pistas de audio y video.
Su nombre es FreeSubtitles.ai, una aplicación web diseñada para hacer transcripciones y generar subtítulos de forma automática, que utiliza el motor Whisper de Open AI con la ayuda de LibreTranslate para realizar la traducción a otros idiomas.
Cómo transcribir un archivo de video o audio con FreeSubtitles.ai
Uno de los aspectos más interesantes de FreeSubtitles.ai es que podemos usarlo directamente desde el navegador y de forma gratuita. El único límite impuesto es que el archivo debe pesar menos de 300MB y no superar la hora de duración.
A partir de ahí, solo tenemos que subir el archivo que queremos transcribir, seleccionar el idioma (hay 111 disponibles) y pulsar sobre el botón “Upload” para iniciar el proceso.
Como decíamos un poco más arriba, la aplicación también está pensada para generar subtítulos (no hay más que fijarse en su nombre), por lo que también podremos elegir el tamaño de los subtítulos desde la pestaña de “Model”. Incluso tendremos la opción de traducir el texto resultante a diferentes idiomas marcando la correspondiente casilla.
Hay que mencionar que el servidor de la aplicación utiliza un sistema de colas, lo que significa que el servidor procesará nuestro audio una vez haya finalizado las transcripciones pendientes de otros usuarios que hayan solicitado su servicio antes que nosotros.
Dependiendo de la hora del día el tiempo de espera puede variar, pero en las pruebas que nosotros hemos realizado al menos, todo el proceso ha sido bastante rápido (apenas 20 segundos para un audio de medio minuto).
La calidad de la transcripción también ha sido muy buena, rozando casi la perfección. La verdad es que la IA ha hecho un trabajo excelente, transcribiendo nombres propios y anglicismos sin aparente dificultad. Todo ello con sus correspondientes puntos y comas. Sorprendente cuanto menos.
Una vez procesado el audio, la aplicación nos llevará a un reproductor online donde podremos escuchar la transcripción completa y descargar una copia del texto en varios formatos: SRT, VTT y TXT. ¡Así de fácil!
En resumidas cuentas, una aplicación web de lo más útil y práctica, con una interfaz limpia, gratuita y sin anuncios. Si estás interesado en saber más puedes consultar la página web del proyecto en GitHub, donde también encontrarás todo el código para instalar la aplicación en tu propio servidor.