,

Herramientas gratuitas para crear, abrir o editar glosarios y bases terminológicas

Recientemente publiqué un vídeo en el canal de YouTube de Traduversia en el que explico cómo crear un glosario con una hoja de cálculo y con la herramienta Goldpan TBX/TMX Editor. Esto me ha animado a seguir indagando en las herramientas libres disponibles para llevar a cabo labores como esta. Aunque la mayoría de traductores usarán su herramientas TAO de pago preferida, es interesante conocer alternativas; bien para el ámbito educativo, bien para esas épocas en las que no tenemos licencia por distintos motivos (porque son caras, porque estamos empezando y queremos ahorrar, porque con software libre nos apañamos, etc.).

Vídeo relacionado

La importancia de conocer los formatos de archivo de los glosarios

Antes de hablar de herramientas, hay que estudiar un poco sobre formatos de archivo. El software libre a menudo requiere tener conocimientos sobre los formatos de archivo que son universales o compatibles con otras herramientas. También sobre conversiones, ya que es habitual que tengamos un glosario en un formato y queramos convertirlo a otro formato compatible con otra herramienta.

En el caso de los glosarios es habitual usar formatos como los siguientes:

TBX (TermBase eXchange)

El TBX es el formato de intercambio de bases terminológicas. En su día se propuso como el formato estándar libre para crear glosarios, pero en la práctica no se utiliza tanto, ya que la mayoría de traductores (sobre todo los menos geek) prefieren crear sus glosarios en sus herramientas TAO comerciales, o en su defecto en hojas de cálculo o en tablas de Word.

El TBX está basado en XML y su estructura interna es bastante sencilla, hasta el punto de que es posible hacer el truco de cambiar la extensión de manera manual de .tbx a .xml para abrir el archivo con un editor de código o en una hoja de cálculo que pueda abrir un xml como tabla (como Excel o las Hojas de cálculo de Google).

A continuación se puede ver un ejemplo de un fragmento de código de un archivo TBX:

Si te fijas, los términos siempre aparecen entre las etiquetas <term> y </term>. Para hacer un cambio, bastaría con cambiar manualmente el texto entre esas etiquetas, procurando no tocar nada del código.

Por cierto, que el fragmento de código anterior se vería como una simple tabla al abrir el archivo TBX con un editor como Goldpan TMX/TBX Editor. Puedes ver una imagen a continuación.

Captura de Goldpan TMX/TBX, con un glosario de ejemplo.

Como ves, el código se «traduce» en una tabla en la que se ordenan los términos en columnas por idioma. Es por esto que es mucho más interesante usar herramientas como Goldpan para hacer modificaciones en bases terminológicas, ya que hacerlas directamente en el código sería bastante improductivo.

Por otro lado, al importar el TBX en una herramienta TAO de pago como Trados Studio o memoQ, los términos se extraen y nos aparecen directamente filtrados, de modo que podremos consultarlos fácilmente en la ventana del programa reservada a la terminología, así como rescatarlos con un atajo de teclado cuando estamos traduciendo.

Captura del visor de base de datos terminológica de Trados Studio con el mismo glosario de ejemplo ya importado en un proyecto.

Por último, debes saber que en la página TBXinfo.net puedes encontrar toda la información sobre el formato de archivo TBX, e incluso utilizar herramientas online para hacer conversiones rápidas a otros formatos de glosarios o abrir un glosario TBX.

CSV (Comma-Separated Value)

El formato CSV es otro formato muy utilizado para la creación o conversión de glosarios. Presenta la ventaja de que su código es muy sencillo y que podemos abrirlo fácilmente con cualquier editor de código o con hojas de cálculo que conviertan el texto en tabla. También suele ser compatible con la mayoría de herramientas TAO, tanto gratuitas como comerciales.

Captura del código de un glosario en formato CSV:

Si analizas el código, primero se definen los idiomas usando el código >>L<<Idioma y debajo se añaden los términos separados por comas y respetando el orden en el que se pusieron los idiomas en la primera línea. Fácil, ¿no?

Reconozco que yo mismo he recurrido en alguna ocasión al truco de montar un glosario en CSV, aunque como ya he mencionado antes, a día de hoy lo normal es crear los glosarios directamente con una herramienta TAO comercial y el CSV ya solo se utiliza como «puente» para convertir glosarios de un formato a otro.

Excel y hojas de cálculo (XLS, XSLX, XML)

Como comento en el vídeo, es muy habitual que los traductores creen glosarios en Excel o en una hoja de cálculo. Sobre todo los que trabajan con herramientas gratuitas que no incorporan funcionalidades para la gestión de la terminología. Por ejemplo, uno de mis clientes de subtitulado trabaja con el editor de subtítulos Aegisub, pero como el programa es muy limitado para crear glosarios, al final los traductores creamos los glosarios en hojas de cálculo que se comparten a través de Google Drive con todo el equipo.

Captura de un glosario creado en una tabla de Excel

Los glosarios en formato de hoja de cálculo son muy socorridos porque son fáciles de crear (basta con respetar la estructura de columnas) y porque podemos usar las herramientas de la hoja de cálculo para hacer búsquedas y reemplazos, añadir comentarios o hasta mencionar a usuarios para que les lleguen notificaciones. Además, podemos exportarlos fácilmente a distintos formatos (XLS, XLSX, CSV, XML) para luego importarlos en herramientas TAO comerciales.

En el lado negativo, a la hora de traducir son poco prácticos porque no contamos con el reconocimiento inteligente de términos que sí incorporan las herramientas TAO. Por tanto, cuando trabajamos con estos glosarios tenemos que ir siempre con el radar puesto, porque (siguiendo con el ejemplo anterior) si un subtitulador está traduciendo en Aegisub y le aparece un término del glosario, tendrá que reconocerlo por su cuenta, salir a buscarlo a la hoja de cálculo y luego introducirlo en Aegisub manualmente.

Otros formatos que debemos conocer (XML, TMX, TXT, SDLTB)

Otros formatos muy habituales de glosarios son:

  • XML: El XML es bastante popular porque es el formato de intercambio de MultiTerm/Trados Studio. A menudo se utiliza para migrar glosarios de Trados Studio a otras herramientas comerciales como memoQ o Wordfast.
  • SDLTB: Es el formato de archivo de bases terminológicas de Trados Studio. Solo puede abrirse con Trados Studio, por lo que su uso suele estar reservado a usuarios de este programa. Existen herramientas que son compatibles con el SDLTB y también hay programas que permiten convertir un SDLTB a otros formatos.
  • TMX: Si bien el TMX es el formato libre de memorias de traducción (Translation Memory eXchange), este puede emplearse perfectamente para almacenar glosarios o como puente para convertirlos a otros formatos. No obstante, hay que tener en cuenta que quizá no es lo más ortodoxo usar los glosarios como memoria de traducción, ya que en la práctica la herramienta TAO que usemos nos ofrecería los resultados de coincidencias del glosario en la ventanita reservada a la memoria de traducción, lo que puede provocar que se nos mezcle con los resultados de otras memorias.
  • TXT: El TXT es el formato empleado por herramientas como OmegaT o Wordfast para exportar glosarios. Su estructura interna suele ser simple, a menudo muy similar a la de los CSV.

Herramientas para convertir bases terminológicas

La conversión o migración de bases terminológicas puede ser una auténtica pesadilla si no sabemos nada de formatos de archivo y no conocemos las herramientas compatibles. Sin duda el mejor conversor que existe ahora mismo es Glossary Converter.

Captura de la interfaz de Glossary Converter

Este programa permite convertir glosarios de Trados Studio (SDLTB o XML de MultiTerm) a una larga lista de formatos (es para lo que suele usarlo casi todo el mundo). Pero también sirve para hacer conversiones a otros formatos de glosarios. A continuación puedes ver una captura de los formatos compatibles.

Desafortunadamente, este programa solo está disponible para Windows, así que a menudo los usuarios de otros sistemas operativos como macOS tienen que buscar otras soluciones para hacer las conversiones, como usar una máquina virtual como Bootcamp o Parallels para ejecutar Glossary Converter.

Afortunadamente hay otras soluciones gratuitas para hacer conversiones, aunque son un poquito enrevesadas. Aquí se listan algunas:

  • La página TBXinfo.net, en su apartado Tools, ofrece varias herramientas online para gestión terminológica. Una de ellas es un conversor de archivos de Multiterm a TBX.
  • Goldpan TMX/TBX Editor nos permite convertir glosarios en formato de Excel a TMX y TBX. Esta solución puede valernos para poder importar un glosario en formato de Excel en una herramienta TAO que no sea compatible con glosarios en formato de Excel.
  • Si sabemos un poquito de código, siempre podemos jugar con las exportaciones de Excel para, por ejemplo, exportar un glosario de Excel en un CSV o TXT separado por comas.

Herramientas y métodos gratuitos para crear, abrir o editar bases terminológicas

Existen herramientas cuyo cometido principal es crear glosarios de manera independiente. Estas herramientas pueden ser útiles en casuísticas en las que el traductor trabaje fuera de una herramienta TAO pero quiera trabajar con glosarios. Yo recomiendo las siguientes:

Goldpan TMX/TBX Editor (Windows)

Es la mejor herramienta gratuita que he encontrado para crear o editar glosarios y memorias de traducción de manera independiente. Este programa nos permite abrir un glosario para editarlo y también crear uno desde cero. En el vídeo de la entrada muestro cómo puedes utilizarla, así que te remito a él si quieres saber más sobre el programa.

Anchovy (Windows y MacOS)

Anchovy es el gestor de bases terminológicas de Swordfish, una herramienta TAO de pago desarrollada por Maxprograms. Aunque Anchovy permite importar y editar glosarios, no es tan práctico como Goldpan, ya que está pensado para trabajar con su formato nativo (GlossML) y solo permite importar glosarios en CSV o TMX. Por eso, solo recomiendo usarlo para crear glosarios desde cero y hacer consultas dentro. Afortunadamente sí nos permite exportar a TBX, CSV y TMX, así que eso nos facilita la labor de exportar un glosario creado en Anchovy para llevárnoslo a otra herramienta.

Para poder usar Anchovy es necesario instalar la versión 3 de Swordfish sin licencia. Puede parecer confuso, pero es sencillo. Tras instalar Swordfish 3 en tu equipo, podrás usar Anchovy directamente (te aparecerá en la lista de programas). Puedes descargar Swordfish 3 con Anchovy desde aquí.

Hojas de cálculo de Google o Excel (multiplataforma)

Captura de un glosario creado en Excel

Aunque estas no son herramientas específicas para crear glosarios y bases terminológicas, al final son las que utiliza casi todo el mundo porque todos tenemos Excel instalado o una cuenta de Gmail. Además, los traductores en general estamos muy habituados a trabajar en Excel porque a menudo lo usamos también para otras tareas. De entre las dos, yo para glosarios siempre uso Hojas de cálculo de Google por lo fácil que es compartir los archivos con otros usuarios a través de Google Drive. Precisamente en el vídeo de la entrada te enseño a crear un glosario rápido en Hojas de cálculo de Google.

Virtaal (Windows, macOS, GNU/Linux)

Captura de Virtaal con un glosario TBX abierto.

Este programa es una navaja suiza para editar y traducir archivos de todo tipo. Entre los formatos de archivos compatibles aparecen el TBX y el TMX, así que puedes usar Virtaal para abrir y editar glosarios en estos formatos. Además, también es compatible con los glosarios de OmegaT. El problema de Virtaal es que no nos permite añadir nuevos términos o entradas a un glosario preexistente, ni tampoco crearlos desde cero. Solo podemos ver y editar, nada más.

Editores de código avanzados o bloc de notas (Notepad++ o Sublime Text)

Captura de un glosario CSV abierto en Sublime Text

A menudo usar un editor de código como Notepad++ o Sublime Text puede ser una solución para hacer un retoque rápido o una conversión. Por ejemplo, para corregir una errata en un término. Idealmente deberemos hacerlo solo con formatos como el CSV o el TXT (o como mucho, para XML o TBX, aunque esto ya es para los más valientes 😁), cuyo código no es difícil de interpretar. El método sería sencillo: solo habría que hacer clic derecho en el archivo del glosario, elegir «Abrir con» y elegir el editor de código deseado para abrirlo. Posteriormente, editaremos los términos con cuidado de no tocar el código.

Usar un editor de código también puede ser una solución para convertir un archivo de un formato a otro (por ejemplo, de TXT a CSV), o para hacer alguna modificación mediante «Buscar y reemplazar» o regex, como cambiar los caracteres de separación (habitualmente es la coma, pero puede que queramos reemplazar esa coma por otro carácter).

Visor online de glosarios TBX de TBXinfo.net

Captura del visor de glosarios de TBXinfo.net con un glosario TBX abierto

La página de TBXinfo.net nos ofrece un visor de glosarios TBX. Este visor solo nos permite abrir un archivo TBX y hacer búsquedas, así que es bastante limitado, aunque funciona bien. Sería genial si en el futuro añadieran la posibilidad de editar o crear glosarios online en una interfaz similar a la actual.

xBench (versión 2.9, Windows)

Captura de xBench con un glosario TBX abierto

Aunque cada vez queda más atrás en el tiempo, el viejo pero aún solvente xBench 2.9 sigue siendo una solución interesante para editar y mantener archivos de glosarios. Sobre todo por las funcionalidades que incorpora para control de calidad y gestión de terminología. En xBench vamos a poder importar archivos TBX, TXT, CSV o XML, entre otros. Lo malo es que el programa solo permite modificar archivos preexistentes, por lo que no podremos usarlo para crear un glosario desde cero. Por último, las opciones de exportación son limitadas, ya que esta versión de xBench solo nos permite exportar a TMX y TXT.

Herramientas TAO gratuitas que permiten crear y exportar glosarios (MateCAT, Wordfast Anywhere y OmegaT)

Captura del menú de creación de glosarios de MateCAT

Existe la posibilidad de usar herramientas TAO para crear glosarios desde cero. De entre las gratuitas disponibles, yo me quedo con MateCAT (en la nube), Wordfast Anywhere y OmegaT. El método para crear glosarios con estas herramientas consistiría en crear un proyecto (con un archivo sencillo de Word o similar, que podría incorporar los términos que queramos añadir al glosario) y crear el glosario de manera manual dentro. Para ello, usaríamos las herramientas para añadir términos o alimentaríamos la memoria de traducción. Cuando hayamos terminado, podremos exportar el glosario o memoria en formatos como TXT, XLSX, CSV o TMX para almacenarlo de manera local o usarlo con otra herramienta TAO.

Conclusiones finales

  • Como has podido ver, existen muchas soluciones para crear, abrir o modificar glosarios. El problema es que no todas las herramientas son completas, lo que a menudo obliga al usuario a informarse bien sobre qué herramienta usar según lo que quiera hacer.
  • Además, conviene informarse bien sobre la compatibilidad de los formatos de archivos de glosarios con las distintas herramientas de traducción asistida, a fin de evitar problemas de migración o de importación de glosarios. A menudo herramientas como Glossary Converter nos van a ayudar mucho, sobre todo con Trados Studio, pero los usuarios de Mac lo tienen un poco más complicado.
  • Si yo fuera usuario de un Mac y trabajara mucho con glosarios, buscaría alguna herramienta que sea compatible de manera nativa con los glosarios de Excel, CSV o TBX. A este respecto, herramientas TAO como Memsource (comercial), MateCAT (gratuita) o Wordfast Anywhere (gratuita) pueden ser las mejores opciones para los usuarios de un Mac, pues todas ellas permiten importar y exportar glosarios de manera sencilla.
  • Por último, creo que sería genial si surgieran más herramientas gratuitas para crear o editar glosarios TBX. Ahora mismo, la única herramienta que permite hacerlo es Goldpan, por lo que sería bueno tener alguna alternativa gratuita más. Si esa herramienta se desarrollara online para hacerla multiplataforma, sería increíble.

 

4.8 5 votes
Valoración
Suscribirse
Notificar de
guest
0 Comentarios
Inline Feedbacks
View all comments