Memoria de traducción
La memoria de traducción (PP, English translation memory , TM, a veces también llamada "unidad de traducción") es una base de datos que contiene un conjunto de segmentos de texto previamente traducidos .
Descripción
Una entrada de la base de datos de la memoria de traducción corresponde a un segmento o " unidad de traducción " ( unidad de traducción en inglés ), que generalmente se toma como una oración (con menos frecuencia, parte de una oración compuesta o párrafo ). Si la unidad de traducción del texto de origen coincide exactamente con la unidad de traducción almacenada en la base de datos ( coincidencia exacta ), se puede sustituir automáticamente en la traducción . El nuevo segmento también puede diferir ligeramente del almacenado en la base de datos (coincidencia aproximada, coincidencia aproximada en inglés ). Dicho segmento también se puede sustituir en la traducción, pero el traductor deberá realizar los cambios necesarios.
Además de acelerar el proceso de traducción de fragmentos repetitivos y cambios realizados en textos ya traducidos (por ejemplo, nuevas versiones de productos de software o cambios en la legislación), los sistemas PP también aseguran la uniformidad de la traducción de terminología en los mismos fragmentos, lo que es especialmente importante para la traducción técnica. Por otro lado, si un traductor sustituye regularmente coincidencias exactas extraídas de la memoria de traducción en su traducción sin control sobre su uso en un nuevo contexto, la calidad del texto traducido puede deteriorarse.
En cada sistema de PC específico, los datos se almacenan en su propio formato (formato de texto en Wordfast, base de datos de Access en Deja Vu), pero existe un estándar internacional TMX ( formato de intercambio de memoria de traducción en inglés ), que se basa en XML y se puede generar por casi todos los sistemas de PC. Gracias a esto, las traducciones realizadas pueden ser utilizadas en diferentes aplicaciones, es decir, un traductor que trabaje con OmegaT puede utilizar el BT creado en Trados , y viceversa.
La mayoría de los sistemas de software admiten al menos la creación y el uso de diccionarios de usuario, la creación de nuevas bases de datos basadas en textos paralelos ( alineación en inglés ), así como la extracción semiautomática de terminología de textos originales y paralelos.
Sistemas populares de software PP
De acuerdo con las revisiones del uso de los sistemas PP, los sistemas más populares incluyen [1] [2] :
- memoQ
- Nube XTM
- Fuente de memoria
- Deja Vu
- OmegaT (sistema libre licenciado bajo la GNU GPL )
- SDLX [3]
- Trados
- SmartCAT (software gratuito con reconocimiento de PDF integrado)
- Tránsito STAR
- Wordfast (implementado como un conjunto de macros para MS Word , la nueva versión 2009 es una aplicación separada)
La Wikipedia en inglés tiene una lista que compara las capacidades de diferentes sistemas.
Estándares y formatos de memorias de traducción [4]
- TMX (Formato de intercambio de memoria de traducción - Intercambio de memoria de traducción). Este estándar permite el intercambio entre diferentes proveedores de memorias de traducción. TMX es un formato de uso común entre los traductores y es el más adecuado para importar y exportar memorias de traducción. La última versión de este formato, 1.4b, le permite restaurar documentos originales y su traducción desde un archivo TMX.
- TBX (formato de intercambio de base de datos terminológica - intercambio de base de datos terminológica). Este formato de la Asociación de Estándares de la Industria de Localización (LISA) se está revisando y reeditando actualmente de acuerdo con ISO 30042 . Este estándar permite el intercambio de terminología, incluida información léxica detallada. La base principal de TBX está definida por las normas: ISO 12620 , ISO 12200 e ISO 16642 . ISO 12620 proporciona un registro de "categorías de datos" bien definidas con nombres estandarizados que funcionan como tipos de elementos de datos o valores predefinidos. ISO 12200 (también conocido como MARTIF ) proporciona el marco para el marco TBX. La ISO 16642 (también conocida como marco de marcado terminológico ) incluye un metamodelo estructural para los lenguajes de marcado terminológico en general.
- SRX está diseñado para mejorar el formato TMX y hacer que la transferencia de memorias de traducción entre programas sea más eficiente. La capacidad de especificar las reglas de segmentación que se usaron en la traducción anterior mejora la eficiencia de identificar segmentos en el texto actual con el contenido del PG.
- GMX GILT significa Globalización, Internacionalización, Localización y Traducción (Globalización, internacionalización , localización , traducción). El estándar GILT Metrics consta de tres partes: GMX-V para métricas de volumen, GMX-C para métricas de complejidad y GMX-Q para métricas de calidad. El estándar GILT Metrics propuesto tiene como objetivo cuantificar el alcance del trabajo y los requisitos de calidad para la implementación de los objetivos de GILT.
- OLIF es un estándar abierto compatible con XML que se utiliza para intercambiar datos terminológicos y léxicos. Aunque originalmente se usó como una forma de intercambiar datos léxicos entre léxicos privados de traducción automática, este formato se ha convertido gradualmente en un estándar de intercambio terminológico más general.
- XLIFF (Formato de archivo de intercambio de localización XML ) está diseñado como un formato de archivo de intercambio único que es reconocido por todo el software de localización. XLIFF es la mejor manera de intercambiar información en formato XML en la industria de la traducción actual. Algunas herramientas utilizan formatos XLIFF patentados que no permiten que los archivos creados en ellas se abran en otros programas.
- TransWS (Translation Web Services - servicios web de traducción), define los parámetros necesarios para llamar a los servicios web al enviar y recibir archivos y mensajes relacionados con proyectos de localización. Fue concebido como un sistema desplegado para automatizar el proceso de localización utilizando servicios en Internet .
- xml:tm , este enfoque de la memoria de traducción se basa en el concepto de memoria de texto, que permite combinar la memoria del autor y la memoria de traducción. El formato xml:tm se le dio a Lisa OSCAR por XML-INTL .
Ventajas y desventajas
Beneficios
- Reducir el tiempo y el volumen de trabajo del traductor.
- Mejorar la consistencia de la traducción, especialmente cuando un grupo de traductores está trabajando en el mismo proyecto.
- Incrementar las ganancias al aumentar la productividad del traductor, un grupo de traductores.
- Mejorar la calidad de los servicios aumentando la precisión y uniformidad de la traducción de términos, especialmente en textos especializados.
Desventajas
- Puede hacer que la traducción sea más "seca"; la esencia misma del texto se pierde si la traducción que utiliza la memoria de traducción la realiza un traductor poco calificado.
- A menudo no hay conexión entre la oración/texto propuesto por el programa con oraciones vecinas y con el texto como un todo.
- El original debe estar en formato electrónico.
- Un error no detectado puede extenderse a todo el proyecto.
- Es necesario aprender a trabajar en el programa mismo, y al cambiar de trabajo, quizás más de una vez (si los empleadores usan diferentes programas de MT).
- No apto para todo tipo de textos.
- Alto costo del software con licencia.
Véase también
Notas
- ↑ Consulte la página 26 en la Encuesta de memorias de traducción del Imperial College London 2006 Archivado el 25 de marzo de 2007 . (PDF)
- ↑ ITI Translation Memory Survey, 2007 (enlace descendente) (enlace descendente al 13-05-2013 [3456 días])
- ↑ Como resultado de la adquisición en junio de 2005 de Trados por parte de la empresa británica SDL International en 2006, apareció un único producto TRADOS SDLX 2006
- ↑ Estándares de la Asociación de Estándares de la Industria de Localización (LISA)
Literatura
- Grabovsky VN Technology Memoria de traducción // Puentes. Revista de Traductores. 2004. Nº 2. - S. 57-62.
Enlaces