« Cambiar para quedarse igual | Inicio | Para los integristas... »

25/02/05

Traduce, que no es poco

Gracias a mi amigo Fernando (se le ve que está muy ocioso con su pierna rota ;-), me llega la noticia de que los estadounidenses Kevin Knight y Daniel Marcu han desarrollado un software de traducción que se basa en información extraída de forma estadística de millones de documentos ya traducidos. También Enrique Dans comenta dicha noticia en su blog.

Pese a lo que pueda parecer, este sistema es bastante poco novedoso. Productos como Metal y Systran llevan muchos años en funcionamiento con impecables resultados, cada uno desde un punto de vista distinto en lo referente a procesamiento del lenguaje. En particular Systran es el usado en la Comisión Europea para traducir documentos y correos electrónicos (sistema Systrannet), gracias a su gigantesca base de documentación.

Puedo aventurarme a decir que esta base documental es de lo mejorcito que existe por dos datos fundamentales:

  1. La Comisión Europea es el mayor generador de documentación a nivel mundial, aparte de hacerlo simultáneamente en 12 idiomas (ahora creo que son 15). Cada documento en un idioma es exactamente equivalente a las versiones en el resto. Para ello cuenta con un enorme Servicio de Publicaciones y con el llamado SdT (Servicio de Traducción).
  2. Del SdT también depende el mayor banco de datos terminológico del mundo: Eurodicautom, que en 1994 contaba con 600.000 entradas, cada una de ellas en 12 idiomas. Para hacernos una idea, el diccionario Clave de SM tiene 40.000 entradas solo en castellano.

Retomando el tema central de este comentario, lo que los estadounidenses aportan es la automatización de una tarea frecuente en la traducción profesional: el "alineamiento" o emparejamiento de documentos y frases equivalentes en distintos idiomas para alimentar las memorias de traducción.

Gracias a los programas comerciales que existen en el mercado para realizar estas tareas (Translator Workbench de Trados, Déjà-Vu de Atril o TransIt de Star), aumenta de forma significativa la productividad del traductor o de la agencia de traducción, hasta tal punto que se abonan tarifas inferiores si el cliente sabe que se están utilizando este tipo de herramientas.

Este tipo de noticias me recuerdan a todo lo relacionado con Linux, que parece una innovación espectacular cuando yo ya usaba el Minix de Andrew S. Tanenbaum en la partición de 10 MB de mi Sanyo 286 allá por 1984.

TrackBack

URL del Trackback para esta entrada:
http://www.typepad.com/t/trackback/117886/1907594

Listados abajo están los enlaces de los weblogs que le referencian Traduce, que no es poco:

Comentarios

Publicar un comentario

Si tiene una cuenta en TypeKey o TypePad, por favor Iniciar sesión