Pasar directamente al contenido

¿Cómo utilizar diccionarios y glosarios en OmegaT?

2010 marzo 18

Uno de los aspectos de OmegaT que tal vez más confusión genera (o por lo menos que más lectores atrae a este blog ;) ) es el uso de diccionarios y glosarios en nuestros proyectos de traducción. Así pues, en lo que sigue trataré de dar respuesta a la pregunta que da título a esta entrada con miras a que quienes están empezando a utilizar OmegaT lo tengan un poco más fácil para sacar provecho de las posibilidades que ofrece.

Para entender mejor el tema de los glosarios y diccionarios parece adecuado partir de la diferenciación de tres elementos que funcionan de manera independiente:

  • Diccionarios para corrección ortográfica
  • Diccionarios generales
  • Glosarios especializados

Veamos ahora cómo utilizarlos.

Diccionarios para corrección ortográfica

Como su nombre lo indica, permiten a OmegaT señalar las palabras mal escritas o desconocidas (en L2) en el panel de edición. Para esto, OmegaT se basa en el corrector Hunspell, el mismo que utilizan proyectos como OpenOffice.org y Firefox, entre otros.

Para configurar la función de corrección ortográfica, en el menú Opciones seleccionamos Revisión de ortografía. Aparecerá entonces la ventana Configuración de la ortografía, donde debemos marcar la casilla de verificación Revisar automáticamente ortografía del texto. [Irónicamente, en la interfaz en español la palabra ortografía aparece mal escrita. :-/]

OmegaT - Configuración de la ortografía

OmegaT - Configuración de la ortografía

A continuación, en la misma ventana, debemos indicar la ubicación de los diccionarios. Si tenemos instalado OpenOffice.org [v 2.x] o Mozilla Firefox podemos indicar la ruta de sus diccionarios compartidos y OmegaT los cargara desde allí. Para encontrar posibles diccionarios instalados en nuestro ordenador podemos hacer una búsqueda por archivos .aff o .dic.

Si aún no tenemos ningún diccionario o queremos instalar uno nuevo, hacemos clic en el botón Instalar…, luego indicamos el diccionario que queremos y finalmente hacemos clic de nuevo en Instalar.

OmegaT - Instalador de diccionarios

OmegaT - Instalador de diccionarios

Aquí nos encontramos con un problema de usabilidad de OmegaT, ya que el programa no presenta ningún mensaje que indique al usuario si se ha instalado o no el diccionario. Lo que hay que hacer es esperar un poco (los diccionarios se descargan de Internet) y luego cerrar el cuadro de diálogo. Si se ha instalado correctamente, el nuevo diccionario aparecerá ahora listado en los idiomas disponibles y podemos cerrar la ventana haciendo clic en Aceptar.

Una vez activada la revisión automática de ortografía, en el editor veremos las palabras no reconocidas subrayadas en rojo. Estando en el segmento activo, un clic derecho sobre alguna de estas palabras abre un menú contextual con sugerencias y con las opciones de ignorar o agregar la palabra al diccionario. Las palabras que ignoremos y agreguemos se guardan en los archivos ignored_words.txt y learned_words.txt, respectivamente, que están ubicados en la subcarpeta /omegat de cada proyecto.

El último detalle importante en cuanto a los diccionarios para corrección automática es que, como se ve en la captura de pantalla anterior, los nombres de los diccionarios incluye tanto el código de lengua como el código de país. Para que nos funcione el corrector, el código de la lengua de llegada especificado en las propiedades de nuestro proyecto debe coincidir con el código del diccionario.

Diccionarios generales

Desde la versión 2.0.3 OmegaT nos permite utilizar diccionarios monolingües o bilingües en nuestros proyectos, de manera que podemos ver las definiciones/equivalentes de las palabras en el segmento activo (en L1) en uno de los paneles de la ventana principal de OmegaT.

OmegaT - panel de diccionarios

OmegaT - panel de diccionarios

Los diccionarios deben estar en el formato utilizado por StarDict, un programa libre para consulta de diccionarios con búsquedas avanzadas. Para descargar diccionarios en este formato podemos recurrir a la página del mismo proyecto StarDict o a la del proyecto XDXF (en formato de descarga seleccionar StarDict). El archivo comprimido (.tar.bz) que descargamos contiene tres archivos (.dict.dz, .idx y .ifo) que debemos extraer y guardar en la subcarpeta /dictionary de nuestro proyecto de OmegaT.

Ya que los diccionarios son generales, para que el panel no aparezca recargado con palabras que no nos interesan (artículos, preposiciones, etc.) hay un truquillo muy útil que ya expliqué en una entrada anterior.

Glosarios especializados

Al igual que los diccionarios generales, los glosarios también cuentan con su propio panel de visualización en la ventana principal y para utilizarlos basta guardarlos en la correspondiente subcarpeta del proyecto, en este caso /glossary. Pero a diferencia de aquellos, los glosarios están más pensados para ser creados y editados por el usuario con el vocabulario especializado de sus proyectos.

El formato de los glosarios debe ser texto delimitado por tabulaciones (término [tab] equivalente [tab] comentario opcional) y la extensión del archivo dependerá de su codificación de caracteres. Si se utiliza la codificación de caracteres por defecto en nuestro sistema operativo la extensión debe ser .tab; en cambio, si se utiliza la codificación UTF8 el archivo debe tener como extensión .utf8.

Además, como novedad en la versión beta del programa (2.1.3) también se pueden utilizar glosarios con extensión .csv y codificación UTF8 que utilicen la coma (,) como delimitador de campos y opcionalmente las comillas (“) como delimitador de texto.

Aquí es importante tener claro que tanto los archivos delimitados por tabulaciones (.tab) como los delimitados por comas (.csv) son sencillamente archivos de texto plano que se pueden crear en un editor de texto o en una hoja de cálculo, pero lo fundamental es saber qué parámetros utilizar al guardarlos (codificación, delimitadores y extensión).

Ya que OmegaT no incluye aún una opción que nos permita editar el glosario desde la interfaz del programa, si queremos agregar términos o hacer modificaciones mientras traducimos es necesario tener abierto el glosario en un editor de texto externo e ir guardando los cambios para que OmegaT los lea.

Como alternativa, aunque solo para agregar términos, podemos utilizar el script OmTAddTerm, sobre el que también escribí antes.

[Actualización (10-12-10): desde la versión 2.2.2 OmegaT incluye la opción "create glossary entry", disponible en el menú Edición o mediante el atajo de teclado Ctrl+Mayús+G. El glosario al que se agregan las entradas está ubicado en la subcarpeta /glossary del proyecto, su extensión es .txt, utiliza la codificación del sistema y tiene el mismo nombre del proyecto.]

Otra novedad en la versión beta de OmegaT relacionada con los glosarios es una opción denominada extrañamente TransTips. Al activar esta función (menú Opciones > TransTips), en el segmento activo en el editor nos aparecen subrayados en azul los términos que se encuentran en los glosarios y un clic derecho sobre ellos abre un menú contextual que nos permite insertar los equivalentes en la traducción. Si bien estaría mucho mejor poder utilizar un atajo de teclado para lograr el mismo fin sin depender del ratón, no deja de ser un paso importante en la mejora de la funcionalidad de los glosarios.

OmegaT-2.1.3_TransTips

OmegaT-2.1.3_TransTips

Para terminar creo que solo queda por aclarar que aunque los nombres de las subcarpetas predeterminadas para los diccionarios y glosarios (y también para las memorias) están en singular (/dictionary, /glossary, /tm), OmegaT nos permite utilizar en nuestros proyectos varios archivos de cada tipo. Naturalmente, también podemos modificar el nombre y ubicación de las carpetas en las propiedades del proyecto según nuestra manera de organizar y gestionar los recursos.

Actualización: desde la versión 2.1.4, OmegaT también nos permite utilizar glosarios con extensión .TXT y codificación UTF-8, y en formato .TBX.

<a href=”http://traduccionymundolibre.com/blog/wp-content/uploads/2010/03/OmegaT_diccionarios.png”><img class=”size-full wp-image-990  ” title=”OmegaT_diccionarios” src=”http://traduccionymundolibre.com/blog/wp-content/uploads/2010/03/OmegaT_diccionarios.png” alt=”OmegaT – panel de diccionarios” width=”453″ height=”339″ /></a>

OmegaT - panel de diccionarios

Entradas similares:

5 comentarios
  1. octubre 21, 2010

    ¡Hola laRusalka!
    Soy una alumna de Traducción y quería felicitarle por toda la información que comparte en este blog (que dicho sea de paso, me está sirviendo de muchísima ayuda). Estoy haciendo un trabajo con la ayuda del programa OmegaT, pero la verdad es que tengo algunas dudas sobre cómo utilizar las memorias de traducción. Creo que no he guardado correctamente una que había hecho en un proyecto. Y, si quiero traducir otro proyecto similar, ¿cómo puedo usar la memoria anterior?

    Muchas gracias de antemano!!!

  2. ANA BELEN enlace permanente
    febrero 1, 2011

    ¡Hola!
    Bueno en primer lugar felicidades por este blog. Estoy investigando en el campo de la extracción terminológica para su posterior uso en herramientas TAO, y estas entradas me están ayudando mucho.
    Tengo una pregunta, ¿cómo importamos los diccionarios/glosarios .tbx para utilizarlos con OmegaT? ¡No lo consigo! :(

    • febrero 1, 2011

      Hola:
      Gracias por pasar por aquí y comentar :)

      @Ana
      Si tienes una versión superior a la 2.1.4, en principio solo hay que guardar el archivo TBX en la carpeta de glosarios del proyecto para que OmegaT lo lea. Si no funciona, los típicos sospechosos son: codificación de caracteres (creo que no puede ser UTF-16), códigos de idiomas (que coincidan con los del proyecto) y extensión del archivo (debe ser .TBX; según de donde provenga el archivo podría haber sido renombrado como .XML).

  3. marzo 6, 2011

    Hola: Recién instalé OmegaT, cargué los diccionarios, creé el proyecto según el manual de introducción, el archivo fuente está en la carpeta source… En fin, todo bien. Salvo que no puedo abrir la ventana del Editor.
    Cuando hago click abajo, donde dice “Editor – miarchivo.odt” no se abre nada. En otras palabras se me desconfiguraron las ventanas cuando minimice la ayuda que se despliega al abrir el programa.
    Hasta probé desinstalar y volver a instalar el programa, pero me ocurre lo mismo. (Parece que en algún lugar queda algún archivo de configuración que no se borra al desinstalar el programa, pero no encontré dónde. Si no, ya estaría solucionado)
    ¿Qué puedo hacer? De esta manera no puedo usar el programa.
    Muchas gracias

    • marzo 6, 2011

      Hola Gustavo:
      Para volver a la disposición original de las ventanas, en el menú Opciones encontrarás la solución: Restaurar ventana principal.
      En cuanto a los archivos de configuarción, para que lo tengas presente para otra ocasión, la ubicación predeterminada depende de la plataforma. Si tu sistema operativo es Windows los encontrarás en:
      2000 y XP: Documents and Settings\[Nombre de Usuario]\Application Data\OmegaT
      Vista: Users\[Nombre de usuario]\AppData\Roaming\OmegaT
      Un saludo.

Los comentarios están cerrados.

Switch to our mobile site