Las herramientas del futuro del subtitulado: transcripciones y subtítulos automáticos
En los últimos meses, he estado probando distintas herramientas que permiten crear subtítulos de manera automática. Si bien estas novedosas herramientas todavía no son milagrosas, sí que me ha sorprendido el buen resultado que dan en algunos vídeos. Algunas de estas herramientas ya las he mencionado en mis redes y las he llegado a mostrar en charlas recientes, como este webinario que hicimos en Traduversia sobre las herramientas del futuro del subtitulado, así que puede que alguna ya te suene, pero todavía no les había dedicado una entrada específica en el blog (principalmente porque he estado centrado en la preparación de mi nuevo curso de Subtitle Edit, que ya está disponible en Traduversia). Por fin he conseguido sacar un hueco para hablar de estos programas, así que quédate y te cuento un poquito sobre ellos.
Vídeo resumen de la entrada
Recientemente he subido un vídeo al canal de YouTube de Traduversia en el que te cuento lo más importante de esta entrada y te muestro las posibilidades de algunas herramientas con ejemplos y capturas de pantalla.
¿Qué hacen estas herramientas?
Estas herramientas generalmente pueden hacer una transcripción de las intervenciones de los personajes, sincronizar el texto transcrito e, incluso, llevar a cabo una traducción automática a partir de los subtítulos creados. Dicho así, suenan bastante milagrosas, ¿verdad?
Lo cierto es que son muy interesantes. No obstante, en la práctica hay que matizar que cada herramienta tiene sus propias funcionalidades. No podemos olvidar que estas herramientas son «nuevas» y están en constante desarrollo y evolución, por lo que cada herramienta ofrece soluciones distintas y resultados diferentes. Por eso considero que es importante que cada profesional que se plantee utilizarlas las pruebe primero y juzgue si el trabajo que hacen le sirve o no.
Podéis ver un ejemplo rápido de lo que pueden hacer estas herramientas en este vídeo que publicó la empresa Apptek. En él, podréis ver una comparativa entre los subtítulos que crea la máquina y los que crea un subtitulador profesional. Obviamente, los subtítulos del subtitulador profesional son mucho mejores, pero los automáticos se hacen en menos tiempo, lo que puede abrir un nuevo e interesante camino para mejorar la productividad.
Entonces, ¿estas herramientas verdaderamente ayudan a mejorar la productividad?
Pueden ayudar a mejorarla, sí, pero en la práctica —y según mi experiencia—, depende del vídeo. Los resultados que ofrecen estas herramientas son variables y a menudo sufren a la hora de subtitular vídeos o audios en los que las intervenciones no se oyen con claridad. No obstante, en productos como documentales, en los que por ejemplo haya un narrador o una narradora, o videotutoriales en los que solamente hable una persona, la verdad es que hacen un trabajo muy aprovechable.
Yo he usado algunas de estas herramientas (sobre todo, HappyScribe) durante los últimos meses como herramienta de apoyo para subtitular presentaciones, videotutoriales sobre tecnología o, incluso, recetas de cocina, y en todos estos casos he notado que trabajaba más rápido, sobre todo en vídeos largos. Bien es cierto que el trabajo que hacen no es milagroso, porque en todos los proyectos siempre tenía que acabar haciendo retoques o ajustes sobre el trabajo que hacía la máquina, pero sí que tardaba en menos en hacer todo el trabajo. Sobre todo, noté que ahorraba mucho tiempo a la hora de hacer el spotting o pautado.
¿Cuál sería la manera más idónea de usar estas herramientas?
Para usar estas herramientas de manera productiva, en primer lugar hay que habituarse a ellas y entender cómo funcionan, lo que lleva un tiempo. En muchos casos el funcionamiento es similar al de un editor de subtítulos tradicional. Accedes a un entorno de trabajo en el que cargas un vídeo y, pasado un tiempo (cada herramienta tiene sus ritmos), obtienes unos subtítulos automáticos que puedes retocar dentro de un editor que funciona en la nube. También puedes exportar los subtítulos en formatos como el SRT para hacer con el archivo lo que quieras.
Esta tecnología y sistema de trabajo abre distintas posibilidades de uso. Por ejemplo, puede que haya profesionales que las usen para hacer transcripciones sin más, para hacer un spotting automático (y encargarse luego ellos de hacer la traducción o transcripción de manera manual en otra herramienta) o para hacer todo el proceso completo (transcribir, sincronizar y traducir).
En mi experiencia, el traductor audiovisual debería trabajar con una metodología más parecida a la de un poseditor. Lo ideal es hacer varios barridos por el archivo a fin de ir detectando y resolviendo los problemas que la herramienta no ha sabido resolver con autonomía. Al principio, el ritmo de trabajo es más lento porque hay que superar la curva de aprendizaje inicial del método y de la herramienta que se esté usando, pero una vez superada, se trabaja bastante rápido.
Tras varios meses usándolas, a mí generalmente me basta con hacer dos barridos: uno para arreglar la sincronización de los subtítulos y otro para arreglar el texto. Esos arreglos se pueden hacer directamente en la propia herramienta (si está preparada para ello), o bien podemos exportar un archivo de subtítulos SRT o similar para hacer todos los ajustes en otro editor.
Por tanto, una propuesta realista podría ser la siguiente:
- Usamos herramienta de subtitulación automática (cargamos vídeo y creamos subtítulos automáticos).
- Exportamos un archivo o plantilla SRT con el trabajo que ha hecho esta herramienta.
- Abrimos esa plantilla en un editor de subtítulos como Subtitle Edit (o cualquier otro gratuito o comercial que nos sirva).
- Llevamos a cabo la posedición o revisión de los subtítulos automáticos.
Y aquí una propuesta más concreta y detallada en formato infografía:
¿Significa esto que dejaremos de usar editores como Subtitle Edit, Subtitle Workshop o Aegisub?
No lo creo. De hecho, en mi opinión, estas herramientas aún no están preparadas para reemplazar al subtitulador humano que trabaja de manera tradicional. Hay que tener en cuenta que subtitular no solo consiste en transcribir texto y sincronizarlo, sino que a menudo hay que cumplir con una larga lista de requisitos que pueden variar en función del cliente (las famosas guías de estilo). Estas guías de estilo pueden contener muchas pautas que, a día de hoy, requieren de la supervisión de un traductor humano, sobre todo si el objetivo final es conseguir unos subtítulos de calidad.
En cuanto al software libre, obviamente estas herramientas siempre suelen ir por detrás de las herramientas comerciales, ya que no cuentan con el mismo respaldo económico. Pero no me extrañaría que, en el futuro, estas herramientas también puedan actualizarse en esa dirección y sumar algunas de estas tecnologías. Por ejemplo, me consta que el editor gratuito Subtitle Edit sigue actualizándose con frecuencia. De hecho, hace apenas unas semanas le han añadido varios plugins que permiten integrar los motores de traducción automática de DeepL o Google Translate, así como llevar a cabo controles de calidad de las pautas de Netflix de manera rápida y precisa. Por tanto, puede que tarden en sumar este tipo de funcionalidades, pero antes o después podrían disponer de ellas.
Captura del cuadro de diálogo de plugins de Subtitle Edit.
Por último, hay que tener en cuenta también que todas estas nuevas herramientas, aunque permiten hacer el subtitulado automático, no siempre incorporan funcionalidades que son vitales para los subtituladores profesionales, como contadores de caracteres por línea/subtítulo, contadores de velocidad de lectura, configuración de espacio mínimo (gap) entre subtítulos, etc.
¿Qué herramientas ofrecen todas estas tecnologías? ¿Son muy caras?
A día de hoy, existen bastantes alternativas, aunque todas son comerciales. Los precios son variables, generalmente elevados, pero en algunos casos pueden llegar a ser asequibles si se hace un planteamiento correcto.
Echemos unas cuentas rápidas. Por ejemplo, HappyScribe ofrece una hora de vídeo por 12 euros. Si presupuestásemos un encargo de subtitulado (con pautado) de 1 hora a 7 euros el minuto, el proyecto nos daría un presupuesto total de 420 €. En mi experiencia, dedicar 12 euros de esos 420 a usar una herramienta de este tipo, puede merecer mucho la pena si el vídeo que hay que subtitular tiene audio limpio y no hay voces solapadas, ya que el ahorro de tiempo compensaría esa pequeña inversión. E incluso podría ser interesante con tarifas más bajas que la que he usado yo en este rápido ejemplo.
En cuanto a las herramientas que hay disponibles, por ahora voy a limitarme a ofrecer una lista de las herramientas que conozco, ya que aunque me encantaría ofrecer un análisis de cada una, es muy probable que ese análisis quedara obsoleto en cuestión de semanas, ya que estas herramientas están en constante desarrollo y añaden funcionalidades nuevas casi semanalmente. Por tanto, os invito a acceder a las páginas de cada herramienta y a estudiarlas por vuestra cuenta para ver qué ofrecen. Son muy fáciles de usar y la mayoría ofrecen versiones de prueba gratuitas.
- HappyScribe
- ClosedCaptionCreator
- Kapwing
- Veed.io
- YellaUmbrella
- Omniscien
- Apptek + Ooona
- Recastly
- MaestraSuite
Por no dejar la lista y ya, yo os recomiendo encarecidamente que probéis HappyScribe, pues la que a mí me ha dado mejores resultados. No obstante, si queréis saber más sobre alguna de estas herramientas, será un placer daros más info en los comentarios o en ForoTraduversia. También os invito a compartir vuestras impresiones sobre estos programas si ya los conocéis o si los habéis usado alguna vez.
Críticas y los retos del futuro
Tras haber probado estas herramientas, creo que lograrán convertirse en imprescindibles cuando ofrezcan transcripciones aún más precisas, puedan combinarse con memorias de traducción y permitan preconfigurar la subtitulación automática que hacen. A este respecto, sería genial poder configurar estas herramientas para que generen unos subtítulos con velocidades de lectura inferiores a un determinado número de CPS, con duraciones mínimas o máximas o que añadan guiones automáticamente cuando hablen dos personajes distintos dentro de un mismo subtítulo (puestos a pedir…). También sería genial poder cargar una memoria de traducción o glosarios, como de hecho ya puede hacerse en herramientas como SDL Trados Studio Subtitling o memoQ video preview tool para traducir subtítulos (que, por cierto, también mostré en este otro webinario).
Dicho lo anterior, paso a hacer una pequeña crítica. Para mí, la carencia más importante de estas herramientas no está tanto en su tecnología, que es muy prometedora, sino en el marketing y en su enfoque, que en algunos casos ni siquiera contempla a los traductores audiovisuales o empresas de la industria de la traducción. Algunas de estas herramientas parecen prometer al usuario final que el trabajo que llevan a cabo es un trabajo definitivo, que no requiere la supervisión de un traductor profesional. De hecho, hay herramientas que directamente están orientadas a usuarios de redes sociales que quieren añadir subtítulos a sus vídeos de manera rápida e inmediata. Esto me parece un error muy importante, ya que al final lo que hacen es ofrecer subtítulos de mala calidad a los usuarios tratando de venderlos como una solución definitiva, cuando realmente no es así.
No podemos olvidar nunca que:
Por eso, creo que estas herramientas, en manos de un subtitulador profesional, podrían ser un recurso muy útil e interesante. Casi podríamos comparar sus posibilidades con las de otras herramientas que ya son una realidad en nuestro sector, como las herramientas TAO, las memorias de traducción o los motores de traducción automática. Está demostrado que, en manos de un traductor profesional cualificado, estas herramientas pueden servir para acelerar ritmos y reducir costes, pero cuando se utilizan sin llevar a cabo ningún tipo de posedición o revisión, a menudo ofrecen resultados deficientes.
También es importante que los desarrolladores de estas herramientas aprendan de los subtituladores y se fijen en el mercado profesional que ya existe. Somos muchos los subtituladores que llevamos años dedicándonos a esto y que sabemos perfectamente cómo crear unos subtítulos de calidad, por lo que podemos visualizar de una manera muy rápida cuál sería el editor de subtítulos ideal para nosotros. Sería tan sencillo como que alguna de estas desarrolladoras se acercara y nos preguntara: «¿Qué necesitáis?». Y seguro que no les faltarían respuestas o sugerencias.
A este respecto, podemos poner como ejemplo a Ooona, que me consta que está en contacto directo con investigadores y profesionales del sector de la traducción audiovisual con el objetivo de ofrecer soluciones a los profesionales y empresas del sector. Para mí, el camino que sigue Ooona es el correcto, y no tanto el de ofrecer un producto milagro a un cliente final que valora la inmediatez por encima de obtener unos subtítulos de calidad.
Agradecimientos especiales
Quiero aprovechar esta entrada para trasladar mi agradecimiento al equipo de HappyScribe, con los que he estado en contacto en las últimas semanas e, incluso, me he llegado a reunir por videollamada para compartir mi análisis de su herramienta y darles sugerencias para mejorarla, que en algunos casos han seguido. Su programa es muy prometedor y recomiendo a todos los que leáis esta entrada que la probéis. No os dejará indiferente.
También quiero dar las gracias a mi colega Damián Santilli (@tradugeek), con el que he podido compartir comentarios y observaciones sobre algunas de estas herramientas, que sin duda me han ayudado a llegar más lejos en este pequeño análisis.
Por último, quiero agradecer también a Stavroula Sokoli y Belén Agulló sus aportes por las redes y durante el webinario de Traduversia, pues fue gracias a ellas que descubrí herramientas como Omniscien o YellaUmbrella.
Ahora espero vuestros comentarios y aportes. Hasta la próxima.
Recomiendo Sonix.ai, que es casi idéntico a HappyScribe (no me extrañaría que fuesen la misma empresa) y el valor por hora es menor. La calidad de la transcripción depende de varios factores, pero en general es muy buena, llegando a excelente en muchos casos. Es muy fácil editar los subtítulos e incluso pueden ser incorporados (hard-code/built-in) al video (si este dura menos de 30 min). Yo suelo descargarlos y revisarlos/editarlos en Subtitle Edit.
¡Genial! Muchísimas gracias por la recomendación, Alejandro. Lo probaremos próximamente.
Efectivamente, por ahora yo también prefiero descargarlos y revisarlos en un editor como Subtitle Edit, así que coincidimos en el enfoque. 🙂
Un saludo.
Hola Rafa, Descubrí estas herramientas hace poco y como lo comentas pueden ser de gran ayuda para bajar la carga de trabajo en el «spotting» y la transcipción pero siempre se deben de revisar ya que a mi me han tocado oraciones muy graciosas a veces. Y como dice Alejandroa, Sonix.ai también es buena, de hecho la uso además de HappyScribe pero tengo una preferencia por la última (no sabré decir porqué exactamente). Y de hecho en ésta he podido ajustar los límites de CPL y la duración de los subtítulos. Pero al igual que ustedes dos, descargo el archivo… Leer más »
Muy interesante y muy bien presentado.
No conocía tan en profundidad este campo.
Gracias por toda esta información.
Un saludo
De nada, es un placer. Muchas gracias a ti por tu comentario. 🙂
Hola, Rafa. Me ha encantado el post, da la casualidad de que es como una versión resumida de lo que quiero hacer en mi TFM.
Además de estas herramientas, que todas cuentan con una opción de pago, menos Kapwing, que le echaré un buen ojo, ¿conoces alguna que sea de software libre o completamente gratuita?
¡Muchas gracias y un saludo!
¡Hola, Mª Ángeles! Gracias a ti por tu comentario. Por desgracia esta es una tecnología en desarrollo y eso implica que tiene que haber inversión detrás para mantener las herramientas, por eso todas son de pago. Pero confío en que poco a poco se vayan incorporando algunas de estas funciones a herramientas gratuitas. Un ejemplo es Subtitle Edit. Aunque aún no incorpora todas estas tecnologías, sí incorpora algunas de manera parcial, como la posibilidad de usar el traductor de Google, hacer un spotting automatizado (con bastantes limitaciones) o usar el reconocimiento de voz o audio para hacer una transcripción (también… Leer más »
disculpa . he estado buscando si hay un programa que pueda agregar el tiempo en el texto que ya tengo . pero eso es lo que me hace falta..
no se si me di a entender.
tengo ya un un texto escrito del video que quiero insertar la trascripcion pero en forma automatica que me agrege los tiempos.
he visto muchos pero lo hacen en forma manual o hacen la trascripcion desde cero..
pero lo que quiero es que solo agrege como lo hace youtube en sus transcripciones.
ojala me puedan ayudar
victor