Ayer publicamos nuestra primera entrevista importante en el blog. Se trata de una charla que mantuvimos con los jefes de desarrollo de Diablo Immortal (Blizzard, Android/iOS), y tuvo una duración de unos 60 minutos que posteriormente tuve que transcribir. Evidentemente el grueso de la entrevista es un audio de larga duración, por lo que tuve que utilizar un método automatizado para pasarlo todo a formato texto de manera ágil y rápida. ¿Cómo lo hice?
Cómo transcribir un audio a formato texto de forma automática
La mayoría de aplicaciones de software que realizan este tipo de conversiones suelen ser de pago, y lo cierto es que no resulta sencillo encontrar una solución que te permita hacer la transcripción sin dejarte una pequeña suma de dinero por el camino. Algo que da bastante rabia, especialmente, si solo necesitas hacer una transcripción de manera puntual.
Actualmente existen varias herramientas de reconocimiento de voz que pueden cumplir esta función de gratuitamente, pero la mayoría -como las APIs desarrolladas por Google y Amazon– son utilidades para desarrolladores y no se pueden utilizar de manera independiente. Por suerte, todavía quedan alternativas que merecen bastante la pena, como por ejemplo, Otter.ai.
Transcripción online automatizada y gratuita con Otter.ai
Otter.ai es una aplicación web que te permite hacer transcripciones de audio a texto de manera automática. Todo online y desde el navegador, sin necesidad de instalar nada en tu equipo. Se trata de una herramienta de pago, aunque también ofrece un plan gratuito que nos permite transcribir a texto un máximo de 3 archivos de audio o video. Aparte de esto, la única limitación es que los archivos no pueden tener una duración de más de 40 minutos.
Si lo único que necesitas es hacer una transcripción de manera puntual resulta realmente práctico, ya que Otter.ai es capaz de identificar las diferentes personas que están participando en el audio y separar las intervenciones de cada uno de los oradores para entregar un texto claro y ordenado.
A mi personalmente os puedo asegurar que me ha salvado la papeleta, y debo admitir que el nivel de la transcripción también es bastante bueno. Si quieres probarlo por ti mismo tan solo tienes que seguir estos pasos:
- Lo primero que debes hacer es entrar en https://otter.ai.
- Inicia sesión o regístrate. Puedes crear una cuenta nueva o usar tu cuenta de Google, Microsoft o Apple.
- Una vez dentro del panel principal de la aplicación, pulsa sobre la opción “My conversations” que verás en el menú lateral.
- A continuación, añade la pista de audio o video que quieres transcribir pulsando sobre “Import audio/video”.
- Arrastra el archivo de audio a la ventana que acaba de abrirse o haz clic sobre el botón “Browse file” para seleccionar el archivo manualmente.
- Una vez procesada la carga del archivo pulsa sobre “Done”. La aplicación también te dará la opción de avisarte cuando la transcripción se haya completado. Mientras tanto, verás que el audio está siendo tratado porque justo debajo del mismo aparece el mensaje “In Processing”.
- El proceso de conversión a texto puede durar entre 5 y 10 minutos, dependiendo de la duración del audio. Una vez finalizado haz clic sobre la conversación para verla en formato texto.
Tal y como vemos en el pantallazo superior la aplicación es capaz de distinguir los diferentes participantes, separándolos por colores para evitar perder el hilo de la conversación. Así mismo, también tenemos la posibilidad de reproducir el audio que corresponde a cada parte del texto para revisar la transcripción y detectar errores.
Por último, también podemos exportar el texto pulsando sobre el botón de 3 puntos que veremos en la zona superior derecha de la pantalla. Seleccionamos “Export text” y elegimos el formato TXT o copiar en el portapapeles. Si optamos por la versión premium de Otter.ai también podremos exportar la transcripción a otros formatos como DOCX, PDF y SRT.
En definitiva, una herramienta de lo más funcional y una de las mejores formas de transcribir archivos de audio o video a formato texto de forma automática sin necesidad de rompernos mucho la cabeza. Siempre hay algunas palabras que no las identifica bien y sin duda te tocará hacer alguna que otra corrección, pero en líneas generales es una solución realmente eficaz y de lo más recomendable.