Traducción automática basada en transformación

La traducción automática basada en transformación es un tipo de traducción automática (MT). Actualmente es uno de los métodos de traducción automática más utilizados. A diferencia del modelo más simple de MT directa, la MT basada en transformación divide el proceso de traducción en tres etapas: análisis del texto del idioma de origen para determinar su estructura gramatical, traducción de la estructura resultante a una estructura adecuada para producir texto en el idioma de destino y generación de texto. Por lo tanto, los sistemas de traducción automática basados ​​en la transformación pueden utilizar el conocimiento del idioma de origen y el idioma de destino [1] .

Dispositivo

La traducción basada en la transformación y la traducción automática interlingüística se basan en la misma idea, según la cual, para traducir, es necesario obtener una representación intermedia. Con él, puede corregir el significado de la oración original, para que luego pueda construir la traducción correcta. En la traducción automática entre idiomas, dicha representación intermedia debe ser independiente tanto del idioma de origen como del idioma de destino, mientras que en el caso de la traducción automática basada en transferencia, existe un cierto grado de dependencia de un par de idiomas en particular. Las formas en que funcionan los sistemas de traducción automática basados ​​en la transformación difieren significativamente, pero en general siguen el mismo patrón: aplican conjuntos de reglas lingüísticas determinadas por las correspondencias entre la estructura del idioma de origen y el idioma de destino. La primera etapa consiste en analizar el texto de entrada en términos de morfología y sintaxis (a veces también semántica ) para crear una representación intermedia. A partir de la representación resultante se forma una traducción utilizando diccionarios bilingües y reglas de construcción gramatical. Esta estrategia le permite obtener una traducción de calidad suficientemente alta con una precisión de aproximadamente el 90% del original (sin embargo, la precisión depende en gran medida de un par de idiomas específico y está determinada por el grado de cercanía de dos idiomas específicos).

Proceso de traducción

En un sistema de traducción automática basado en reglas, el texto fuente se analiza primero en términos de morfología y sintaxis para obtener una representación sintáctica. En el futuro, esta presentación puede cambiar hacia una menor especificación, debido a la necesidad de prestar mayor atención a los fragmentos más significativos para la traducción, ignorando otro tipo de información. Durante el proceso de transformación, la representación final (todavía existente en el idioma de origen) se transforma en una representación del mismo nivel de instanciación en el idioma de destino. Estas dos vistas se denominan vistas intermedias . El proceso de transformar una representación en el idioma de destino en un texto terminado consta de pasos similares realizados en orden inverso.

Análisis y transformación

Antes de obtener el resultado final, es posible recurrir a varios métodos de análisis y transformación. Junto con los enfoques estadísticos, se puede aumentar el número de sistemas híbridos generadores. Los métodos seleccionados y las prioridades dependen en gran medida del diseño del sistema en sí. Sin embargo, la mayoría de los sistemas existentes incluyen al menos los siguientes pasos:

Tipos de transformaciones

Una de las principales características de los sistemas de traducción automática basados ​​en la transformación es la etapa en la que la representación intermedia del texto en el idioma de origen se traduce en la representación intermedia del texto en el idioma de destino. Este proceso puede tener lugar en uno de los niveles de análisis lingüístico o en el intervalo entre ellos. Los niveles se muestran a continuación:

Véase también

Notas

  1. Jurafsky, Daniel; Martín, James H. (2009). Procesamiento del habla y el lenguaje. Pearson. páginas. 906-908.