Traducción automática interactiva

La traducción automática interactiva ( IMT ) es un subconjunto especializado del campo de la traducción informática . El paradigma de la traducción es que el software de computadora ayuda al traductor al tratar de predecir el texto que el usuario tendría que ingresar, dada toda la información que tiene disponible. Cuando tal conjetura es incorrecta, el sistema proporciona retroalimentación al usuario y se realiza una nueva predicción dada la nueva información. Este proceso se repite hasta que una traducción cumple con las expectativas del usuario.

La traducción automática interactiva es especialmente interesante para traducir textos en áreas donde no se permite la traducción con errores y por lo tanto se requiere que un usuario humano realice cambios en la traducción proporcionada por el sistema. En tales casos, se mejora la traducción automática interactiva para brindar beneficios a los usuarios potenciales. [1] [2] Sin embargo, no existen programas comerciales que implementen la traducción automática interactiva, y hasta ahora el trabajo está en el ámbito de la investigación académica .

Historia

Históricamente, la traducción automática interactiva nace como un desarrollo del paradigma de la traducción asistida por computadora , donde el traductor y los sistemas de traducción automática están diseñados para trabajar en conjunto . [3] Este primer trabajo fue ampliado por el proyecto de investigación TransType financiado por el gobierno canadiense . En este proyecto , la interacción hombre- máquina tenía como objetivo la obtención del texto final introduciendo técnicas de traducción automática basadas en la traducción interactiva transferida al entorno para conseguir las mejores cualidades de ambas técnicas: la eficiencia de un sistema automático y la fiabilidad de un traductor humano.

Posteriormente, el proyecto de investigación más grande TransType2 [1] [2] , financiado por la Comisión Europea , continuó este trabajo analizando la implementación de un sistema completo de traducción automática en el proceso , con el objetivo de obtener hipótesis de traducción completa que un usuario humano puede modificar o aceptar. Si el usuario decide cambiar la hipótesis, el sistema intenta hacer el mejor uso de esta retroalimentación para producir una nueva traducción de la hipótesis que tenga en cuenta los cambios realizados por el usuario.

Más recientemente, CASMACAT , [4] también financiada por la Comisión Europea , se ha centrado en desarrollar nuevos tipos de asistencia a los traductores e integrarlos en un nuevo entorno de desarrollo compuesto por un editor, un servidor y herramientas de análisis y visualización. El entorno de desarrollo se ha diseñado de forma modular y se puede combinar con las herramientas de traducción automática existentes. Además, el marco CASMACAT puede aprender de la interacción con el traductor, actualizando y corrigiendo sus modelos inmediatamente en función de la elección de traducción del usuario. [5] [6]

Un trabajo reciente que involucró a una amplia gama de usuarios [7] ha revelado el hecho de que la traducción automática interactiva puede ser utilizada incluso por aquellos usuarios que no hablan el idioma original para lograr una calidad de traducción casi profesional. Además, también sugiere que el escenario interactivo es más beneficioso que el clásico escenario posterior a la publicación.

Proceso

El proceso de traducción automática interactiva comienza cuando el sistema ofrece una hipótesis de traducción al usuario. El usuario puede entonces aceptar la oferta en su totalidad o cambiarla si cree que hay algunos errores. Por lo general, al cambiar una palabra determinada, se supone que el prefijo (oración) antes de esa palabra es correcto, es decir, esquema de interacción - de izquierda a derecha. Después de que el usuario haya cambiado la palabra que considera incorrecta, el sistema sugiere un nuevo sufijo, es decir, el resto de la oración. Este proceso continúa hasta que el usuario está satisfecho con la traducción.

Si bien esta explicación es a nivel de palabra, el proceso anterior también se puede realizar a nivel de carácter, por lo que el sistema proporciona el sufijo cada vez que el traductor ingresa un solo carácter. Además, se están realizando esfuerzos para cambiar el patrón típico de interacción de izquierda a derecha para facilitar la interacción hombre-máquina . [8] [9]

Se utiliza un enfoque similar en la herramienta de traducción Caitra .

Calificación

La evaluación es un tema complejo en la traducción automática interactiva. Idealmente, la evaluación debe hacerse en experimentos con usuarios. Sin embargo, dado el alto valor monetario, esto significa que este rara vez es el caso. Además, incluso cuando se considera la verdadera evaluación de las tecnologías de traducción automática interactiva por parte de los traductores, no está claro qué debe medirse en dichos experimentos, ya que hay muchas variables diferentes que deben tenerse en cuenta y no pueden controlarse, como el tiempo requerido. por parte del usuario para acostumbrarse al proceso. En el proyecto CASMACAT se realizaron algunos estudios de campo para examinar algunas de estas variables. [10] [11] [12]

Para una evaluación rápida en un entorno de laboratorio, la traducción automática interactiva se evalúa utilizando la cantidad de pulsaciones de teclas o la cantidad de palabras ingresadas . Dichos criterios intentan medir cuántas pulsaciones de teclas o palabras ingresadas por el usuario deben ingresarse antes de obtener una traducción final del documento. [2]

Diferencias con la traducción automática clásica

Aunque la traducción automática interactiva es un subcampo de la traducción asistida por computadora , la principal característica atractiva discutida en relación con esta última es la interactividad. En la traducción automática clásica, el sistema de traducción puede, en el mejor de los casos, sugerir una hipótesis de traducción, y luego el usuario debe editar dichas hipótesis. Por el contrario, en la traducción automática interactiva, el sistema produce una traducción de una nueva hipótesis cada vez que el usuario interactúa con el sistema, es decir, después de cada palabra (o letra) ingresada.

Véase también

Notas

  1. 1 2 Casacuberta, Francisco; Civera, Jorge; Cubel, Elsa; Lagarda, Antonio L.; Lapalme, Guy; Macklovitch, Elliot; Vidal, Enrique. Interacción humana para traducción automática de alta calidad  (inglés)  // Comunicaciones de la ACM  : revista. - 2009. - Vol. 52 , núm. 10 _ - P. 135-138 . -doi : 10.1145/ 1562764.1562798 . Archivado desde el original el 6 de julio de 2011. Copia archivada (enlace no disponible) . Consultado el 3 de agosto de 2016. Archivado desde el original el 6 de julio de 2011. 
  2. 1 2 3 Barrachina, Sergio; Bender, Oliver; Casacuberta, Francisco; Civera, Jorge; Cubel, Elsa; Jadivi, Shahram; Lagarda, Antonio L.; Ney, Hermann; Tomás, Jesús; Vidal, Enrique. Enfoques estadísticos para la traducción asistida por computadora  //  Lingüística computacional: revista. - 2009. - Vol. 25 , núm. 1 . - Pág. 3-28 . —doi : 10.1162 / coli.2008.07-055-r2-06-29 .
  3. Fomentar, George; Isabelle, Pierre; Plamondon, Pierre. Traducción automática interactiva mediada por texto de destino  //  Traducción automática: diario. - 1997. - vol. 12 , núm. 1 . - pág. 175-194 . -doi : 10.1023/a : 1007999327580 . Archivado desde el original el 27 de enero de 2020.
  4. Alabau, Vicent; dólar, cristiano; Carl, Michael; Casacuberta, Francisco; García-Martínez, Mercedes; Germann, Ulrich; González-Rubio, Jesús; Colina, Robin; Koehn, Philipp; Leyva, Luis; Mesa-Lao, Barto; Ortíz, Daniel; Saint-Amand, Hervé; Sanchís, alemán; Tsoukala, Chara (abril de 2014). “CASMACAT: un banco de trabajo de traducción asistida por computadora” (PDF) . Actas de la 14ª Conferencia del Capítulo Europeo de la Asociación de Lingüística Computacional . Los Ángeles, California: Asociación de Lingüística Computacional. páginas. 25-28. Archivado (PDF) desde el original el 13 de abril de 2015 . Consultado el 03-08-2016 . Parámetro obsoleto utilizado |deadlink=( ayuda )
  5. Ortiz-Martínez, Daniel; García-Varea, Ismael; Casacuberta, Francisco (junio de 2010). “Aprendizaje en línea para traducción automática estadística interactiva” (PDF) . Tecnologías del lenguaje humano: la conferencia anual de 2010 del capítulo norteamericano de la ACL . Asociación de Lingüística Computacional. páginas. 546-554. Archivado (PDF) desde el original el 5 de julio de 2010 . Consultado el 03-08-2016 . Parámetro obsoleto utilizado |deadlink=( ayuda )
  6. Martínez-Gómez, Pascual; Sanchis Trilles, alemán; Casacuberta, Francisco. Estrategias de adaptación en línea para la traducción automática estadística en escenarios de  posedición //  Reconocimiento de patrones: revista. - Elsevier, 2012. - Septiembre ( vol. 45 ). - Pág. 3193-3203 . -doi : 10.1016/ j.patcog.2012.01.011 .
  7. Koehn, Philipp (junio de 2010). “Habilitación de traductores monolingües: post-edición vs. Opciones” (PDF) . Tecnologías del lenguaje humano: la conferencia anual de 2010 del capítulo norteamericano de la Asociación de Lingüística Computacional (HLT/NAACL) . Los Ángeles, California: Asociación de Lingüística Computacional. páginas. 537-545. Archivado (PDF) desde el original el 10 de agosto de 2017 . Consultado el 03-08-2016 . Parámetro obsoleto utilizado |deadlink=( ayuda )
  8. Sanchis-Trilles, Germán; Ortiz-Martínez, Daniel; Civera, Jorge; Casacuberta, Francisco; Vidal, Enrique; Hoang, Hieu (octubre de 2008). “Mejora de la traducción automática interactiva a través de acciones del mouse” (PDF) . Actas de la Conferencia de 2008 sobre métodos empíricos en el procesamiento del lenguaje natural (EMNLP) . Honolulu, Hawái: Asociación de Lingüística Computacional. páginas. 485-494. Archivado (PDF) desde el original el 5 de julio de 2010 . Consultado el 03-08-2016 . Parámetro obsoleto utilizado |deadlink=( ayuda )
  9. González-Rubio, Jesús; Ortiz-Martínez, Daniel; Casacuberta, Francisco (julio de 2010). “Equilibrio del esfuerzo del usuario y el error de traducción en la traducción automática interactiva a través de medidas de confianza” (PDF) . Actas de los documentos breves de la conferencia ACL 2010 (ACL) . Uppsala, Suecia: Asociación de Lingüística Computacional. páginas. 173-177. Archivado (PDF) desde el original el 30 de septiembre de 2011 . Consultado el 03-08-2016 . Parámetro obsoleto utilizado |deadlink=( ayuda )
  10. Underwood, Nancy; Mesa-Lao, Bartolomé; García-Martínez, Mercedes; Carl, Michael; Alabau, Vicent; González-Rubio, Jesús; Leyva, Luis; Sanchis-Trilles, alemán; Ortiz-Martínez, Daniel; Casacuberta, Francisco (mayo de 2014). “Evaluación de los efectos de la interactividad en un banco de trabajo de edición posterior” (PDF) . Actas de la 29ª edición de las Jornadas de Evaluación y Recursos Lingüísticos (LREC) . Reikiavik, Islandia. páginas. 553-559. Archivado (PDF) desde el original el 4 de marzo de 2016 . Consultado el 03-08-2016 . Parámetro obsoleto utilizado |deadlink=( ayuda )
  11. Ortiz-Martínez, Daniel; González-Rubio, Jesús; Alabau, Vicent; Sanchis-Trilles, alemán; Casacuberta, Francisco. Integración del aprendizaje activo y en línea en un banco de trabajo de traducción asistida por computadora // Nuevas direcciones en la investigación empírica del proceso de traducción : exploración de CRITT TPR-DB  . — Springer, 2015. - Págs. 54-73.
  12. Alabau, Vicent; Carl, Michael; Casacuberta, Francisco; García-Martínez, Mercedes; Mesa-Lao, Bartolomé; Ortiz-Martínez, Daniel; González-Rubio, Jesús; Sanchis-Trilles, alemán; Schaeffer, Moritz. Aprendizaje de posedición avanzada // Nuevas direcciones en la investigación empírica del proceso de traducción : exploración de CRITT TPR-DB  . — Springer, 2015. - Págs. 95-111.

Enlaces externos