MXPA97004287A

MXPA97004287A - Metodo y aparato para traduccion de lenguaje

Info

Publication number: MXPA97004287A
Application number: MXPA/A/1997/004287A
Authority: MX
Inventors: Alshawi Hiyan
Original assignee: At&T Corp
Priority date: 1996-06-14
Filing date: 1997-06-10
Publication date: 1998-10-30

Abstract

La presente invención se refiere a métodos y sistemas para traducción de lenguaje. El traductor se basa en máquinas de estado finito que pueden convertir un par de secuencias de símbolos de alimentación a un par de secuencias de símbolos de salida. El traductor incluye un vocabulario que asocia una máquina de estado finito con un par de palabras de cabeza con significados correspondientes en los lenguajes fuente y objetivo . La máquina de estado para una palabra de cabeza de lenguaje fuente w y una palabra de cabeza de lenguaje objetivo V, lee las palabras dependientes de W a su izquierda y derecha en una oración fuente y propone dependientes correspondientes a izquierda y derecha de v en una oración de lenguaje objetivo construída, tomando en cuenta el orden de palabra requerido para el lenguaje objetivo. Las máquinas de estado se emplean por un motor de búsqueda de transducción para generar una pluralidad de traducciones candidatas mediante un proceso recursivo en donde, primero se traduce como se describióanteriormente una palabra de cabeza de lenguaje fuente, y luego las cabezas de cada una de las frases dependientes se traducen similarmente, y después sus dependientes y asíen adelante. Solo las máquinas de estado que corresponden a las palabras en la sarta de lenguaje fuente se activan y emplean por el motor de búsqueda. El traductor también incluye una tabla de parámetros que proporciona costos para acciones tomadas por cada máquina de estado finito al convertir entre el lenguaje fuente y el lenguaje objetivo. Los costos para transiciones de máquinas son indicativos de la pluralidad de co-ocurrencias de pares de palabras en el lenguaje fuente y entre pares de palabras correspondientes en el lenguaje objetivo. El motor de búsqueda de transducción proporciona un costo total utilizando la tabla de parámetros por cada una de las traducciones candidatas. El costo total de una traducción es la suma del costo para todas las acciones tomadas por cada máquina involucrada en la traducción.

Description

MÉTODO Y APARATO PARA TRADUCCIÓN DE LENGUAJE Campo de la Invención La presente invención se relaciona a traducción de lenguaje automática. Más particularmente, la presente invención se relaciona a métodos y aparatos para traducción directa utilizando un modelo de transducción de vocabulario probabilísitco. Antecedentes de la Invención La traducción de lenguaje involucra la conversión de oraciones de un lenguaje natural, usualmente referido como el lenguaje "fuente", en otro lenguaje, típicamente denominado el lenguaje "objetivo". Cuando se realiza por una máquina, por ejemplo una computadora, esta traducción se refiere como traducción automática de lenguaje o traducción de máquina. Muchos diferentes métodos para traducción automática de lenguaje se han propuesto e implementado en las recientes décadas. Ver Hutchins, W.J. y Somer, H. L. , An Introduction to Machine Translation (Una Introducción a Traducción de Máquina) (Academic Press, N.Y. 1992). La mayoría de los sistemas de traducción utilizan mapeo mediante representación intermedia. Por ejemplo, en los asi denominados sistemas de traducción "interlingua", la representación intermedia es una representación independiente del lenguaje, resultante de un análisis inicial de la frase de lenguaje fuente. La representación intermedia luego se convierte en el lenguaje REP: 24532 objetivo por una fase de generación. Ver por ejemplo Nirenburg y colaboradores, Machine Tr nslación: A. Kno ledse-Based Approach (Traducción de Máquina: Un Enfoque Basado en Conocimiento), (Morgan Kauf ann, San Mateo, Ca. 1992). Un segundo ejemplo de mapeo por representación intermedia son los sistemas de traducción de "transferencia". Estos sistemas incluyen tres fases; análisis de la frase de lenguaje fuente en una representación fuente, conversión de la representación fuente en una representación objetivo y generación de una frase o de una oración objetivo a partir de la representación objetivo. Ver, van Noord y colaboradores, "An Overvie of Mimo2,",(Una Revisión de Mimo2), v.6 Machine Translation, págs. 201-04, 1991. Un segundo tipo de sistema de traducción puede clasificarse como sistema de traducción "directo". Estos métodos directos no emplean representaciones intermedias. Algunos de los sistemas de traducción más tempranos utilizan métodos directos; sin embargo fueron ad-hoc en naturaleza, dependiendo de grandes colecciones de reglas y excepciones de traducción. Recientemente, se han propuesto métodos de traducción directa mas sistemáticos. Un método se basa en un modelo estadístico para mapear palabras de la oración fuente en palabras y posiciones de palabras en el lenguaje objetivo. Una desventaja de este método es que ignore el arreglo de frases en las oraciones fuente y objetivo cuando se mapea una palabra en su posición correspondiente en la oración de lenguaje objetivo. El método por lo tanto ignora relaciones de léxico que hacen una posición en la oración objetivo más probable que otra. Brown y colaboradores, "A Statistical Approach to Machine Translation" (Un Enfoque Estadísitco a Traducción de Máquina) v. 16 Co putational Linguistics, págs. 79-85, 1990. En otro método directo, un árbol de sintaxis se construye simultáneamente para las oraciones fuente y objetivo, utilizando regias de estructura de frase especiales que pueden invertir el orden de constituyentes sintácticos. Una desventaja de este método es que no toma en consideración asociaciones palabra a palabra en los lenguajes fuente y objetivo. Ver Wu, D. , "Trainable Coarse Bilingual Grammars for Parallel Text Brac eting" (Gramáticas Bilingües Burdas Entrenables para Agrupación de Texto en Paralelo) 1995 Proc. Workshop Very Large Corpora, Cambridge, Mass. Un tercer sistema de traducción directa se ha propuesto que utiliza transductores de estado finito izquierda-á-derecha standard para traducción. El uso de estos transductores de estado finito standard se limita la capacidad del método para permitir que palabras en la frase objetivo estén arbitrariamente alejadas de su posición original en la oración fuente. Esto se debe a que para vocabularios no triviales, el número requerido de estados de transductor se vuelve demasiado grande para uso práctico. Ver vilar y colaboradores, "Spoken-Language Machine Translation in Limited Domains: Can it be Achieved by Finite-State Models?" (Traducción de Máquina de Lenguaje Hablado en Dominios Limitados: Puede Lograrse por Modelos de Estado Finito?) 1995 Proc. Sixth Int'l. Conf. Theoretical and Methodological Issues in Machine Translation, Leuven, Bélgica. De esta manera hay necesidad por un sistema y método mejorados para traducción de lenguaje automática. compendio de la Invención Se describen un sistema y método directos mejorados para traducción de lenguaje. De acuerdo con la presente invención, el traductor consiste de una pluralidad de transductores de estado finito referidos como transductores de cabeza, un vocabulario bilingüe «que asocia pares de palabras de los dos lenguajes con transductores de cabeza particulares, una tabla de parámetros que especifica valores de "costo" para las acciones tomadas por los transductores y un motor de búsqueda de transducción para encontrar la traducción de más bajo costo de- una frase u oración alimentada. Los costos de acción codifican asociaciones de vocabulario de lenguaje fuente y objetivo; un costo menor corresponde a una más fuerte asociación de léxico.

Los transductores de cabeza empleados en la presente invención son distintos de los transductores de estado finito standard conocidos en la técnica. Los transductores standard típicamente se limitan a convertir una sola secuencia de alimentación en una sola secuencia de salida, usualmente leyendo la secuencia de alimentación de izquierda a derecha. Los presentes transductores de cabeza tienen capacidad por leer un par de oraciones, una explorada hacia la izquierda, la otra explorada hacia la derecha, y escribir un par de secuencias, una hacia la izquierda y la otra hacia la derecha. Cada transductor de cabeza se asocia con un par de "cabezas" con significados correspondientes en los lenguajes fuente y objetivo. Una palabra de cabeza típicamente es la palabra que transporta el significado básico o más importante de una frase. Palabras de cabeza se asocian con dependientes, que son las palabras de cabeza subfrases de la frase. El pccp?süD de un transductor para un acoplamiento de palabra de cabeza particular consiste en (i) reconocer palabras dependientes a izquierda y derecha de la palabra de cabeza en el* lenguaje fuente y (ii) proponer dependientes correspondientes a izquierda y derecha de la palabra cabeza del lencjuaje objetivo en la oración objetivo «que se construye. Un vocabulario bilingüe con transductores de cabeza asociados permitirá muchas traducciones posibles de una oración. Esto resulta de las muchas diferentes posibles elecciones para entradas del vocabulario, incluyendo selecciones de palabras objetivo, selecciones de cabezas de frases en la oración fuente y selecciones de palabras dependientes en las frases fuente y objetivo. La tabla de parámetros proporciona diferentes "costos" para estas selecciones que reflejan fuerzas de asociación, es decir indicativas de la probabilidad de co-ocurrencia, para traducciones de palabra fuente-objetivo y para pares de palabras dependiente de cabeza en cada uno de los dos lenguajes. De esta manera, un costo de traducción total puede definirse como la suma de los costos de todas las selecciones que llevan a esa traducción. La traducción con el costo total más bajo se elige como la salida del traductor, esto es la traducción. La búsqueda por la traducción de más bajo costo se lleva a cabo por el motor de búsqueda de transducción. El motor de búsqueda de transducción utiliza los transductores de cabeza para traducir en forma recursiva primero la palabra cabeza, luego las cabezas de cada una de las frases dependientes y luego sus dependientes y así en adelante. Este proceso se refiere aquí como transducción de cabeza recursiva. Los presentes sistema y método no requieren modelado de posiciones de palabra directamente, evitando la desventaja del método propuesto por Brown. Además, el presente sistema y métodos son puramente de vocabulario. Como tal, a diferencia del método propuesto por Wu, la presente invención no requiere reglas sintáticas. Por el contrario, la mejor traducción se elige en base a fuerzas de asociación palabra-a-palabra en el lenguaje fuente y en el lenguaje objetivo. Aún más, los transductores de cabeza empleados en la presente invención permiten que las palabras en la oración objetivo estén arbitrariamente alejadas de sus posiciones correspondientes en la oración fuente sin un incremento correspondiente en el número de estados de modelos. Breve Descripción de los Dibujos Adicionales aspectos de la invención serán más aparentes a partir de la siguiente descripción detallada de modalidades específicas de la misma cuando se lee en conjunto con los dibujos acompañantes en donde: La Figura 1 muestra una modalidad preferida de un traductor de acuerdo con la presente invención; La Figura 2 es un diagrama de flujo de un método para traducción de acuerdo con la presente invención utilizando el traductor de la Figura 1. * La Figura 3 ilustra transducción recursiva de una sarta de lenguaje fuente a una sarta de lenguaje objetivo; La Figura 4 ilustra acciones de transductor de cabeza ejemplares posibles para dos transductores de cabeza empleados para generar parte de la transducción ilustrada en la Figura 3; 3 La Figura 5 es un diagrama de flujo que ilustra una modalidad de un motor de búsqueda de transducción; y La Figura 6 ilustra un método por el cual se elige una sarta objetivo como la traducción a partir de la salida del motor de búsqueda de transducción. Descripción Detallada La presente invención se relaciona a sistemas y métodos mejorados para traducción automática de lenguaje. Habrá de entenderse que la presente invención es aplicable tanto al lenguaje escrito como hablado. Como tal, la presente invención puede emplearse como el componente de traducción de un sistema de traducción de texto impreso, un sistema de traducción escrito o un sistema de traducción hablado. Aún más, la presente invención se relaciona a traducción de lenguaje natural, así como la traducción de otros tipos de lenguajes tales como lenguajes de programación y semejantes. Por claridad de explicación, las modalidades ilustrativas de la presente invención se presentan como bloques funcionales individuales. Las funciones que representan estos bloques pueden proporcionarse, utilizando ya sea equipo físico compartido o dedicado, incluyendo sin limitación equipo físico capaz de ejecutar software. Modalidades ilustrativas pueden comprender equipo físico procesador de señal digital (DSP), memoria de solo lectura (ROM) para almacenar software que realiza las operaciones discutidas a continuación, memoria de acceso aleatorio (RAM) para almacenar resultados DSP y para almacenar datos empleados por el traductor para una traducción particular y memoria no volátil para almacenar el conjunto completo de datos, es decir vocabulario completo, parámetros de costo y semejantes empleados por el traductor. En el balance de esta especificación, la descripción de la invención se presentará como es en proporción con descripciones en la técnica. Por ejemplo, se realizarán operaciones en una "oración de lenguaje fuente" o una "sarta de lenguaje fuente " o una "frase de lenguaje fuente" para generar una "oración de lenguaje objetivo" o una "sarta de lenguaje objetivo" o una "frase de lenguaje objetivo". Habrá de entenderse que estas frases, sartas u oraciones de lenguaje fuente y objetivo pueden incorporarse como señales. Estas señales se procesan por el equipo físico descrito anteriormente. De esta manera, como se emplean aquí, las frases "oración de lenguaje fuente", "sarta de lenguaje fuente" y semejantes son intercambiables con la frase "señal de alimentación". Igualmente, las frases "oración de lenguaje ob etivo" , "frase de lenguaje objetivo" y semejantes son intercambiables con la frase "señal de salida". A manera ie definición, el término "palabra de cabeza" aquí se emplea para referirse típicamente a la palabra que transporta o que contiene el significado básico o más importante de una frase para traducción. Por ejemplo, el verbo principal de una oración puede elegirse como la palabra de cabeza. Habrá de entenderse sin embargo que los presentes métodos no requieren ninguna interpretación lingüistica particular del término. Los dependientes de una palabra de cabeza son las palabras de cabeza de subfrases de la frase. Por ejemplo, los dependientes de un verbo que encabeza una oración pueden incluir el pronombre principal de la frase pronombre del sujeto de la oración y también el pronombre principal de la frase nombre pronombre del objeto de la oración. Como aquí se emplean, los términos palabra, símbolo y carácter son intercambiables excepto como se anotó. La Figura 1 es una ilustración de una modalidad preferida de un traductor 1 de acuerdo con la presente invención y la Figura 2 es un diagrama de flujo de una modalidad de un método la para traducción, que utiliza el traductor 1 ilustrado en la Figura l. El traductor la incluye un preprocesador de lenguaje fuente opcional 5, un motor de búsqueda de transducción 10, una pluralidad de transductores de cabeza 13, un vocabulario bilingüe 15, una tabla de parámetros 17 "un selector de sarta objetivo 20. En la etapa 101, una alimentación de lenguaje fuente se proporciona para traducción. Como se describió previamente, el lenguaje fuente puede ser lenguaje escrito o hablado. En una modalidad preferida, la alimentación de lenguaje fuente se convierte a una pluralidad de registros de posición de palabra, como se indica en la etapa 105. Cada uno de estos registros de posición de palabra consiste de una palabra fuente, tv, dos indicadores de posición i y j, y un costo c0 por ejemplo {w , i, j , c0 ) . El registro de posición de palabra indica que hay una palabra, w, desde la posición i a la posición j en la alimentación con certidumbre indicada por el costo c0 , un costo menor indica una superior certidumbre. El formato de registro de posición de palabra se emplea debido a que es una forma compacta de representar sartas de alimentación posibles desde una cantidad de componentes de preprocesa iento de lenguaje fuente 5. Estas sartas de alimentación pueden estar en la forma de texto simple, o la salida de un reconocedor de habla o la salida de un segmentador de texto para lenguajes tales como chino, que no incluyen espacios entre las palabras. En el caso de texto simple, hay un registro por cada palabra alimentada y el costo cs es cero para todos los registros. De esta manera, el registro para una sarta de palabras alimentada "wie w2.. ,wn" es (wíf 0 , 1 , 0 ) , (w2, 1 , 2 , 0) , . . . (w„ , n-l , n, 0) . * = Para dispositivos de preprocesamiento 5, con cierto grado de incertidumbre respecto a la identidad de las palabras alimentadas o su posición, tal como por ejemplo un reconocedor de habla o un segmentador de texto chino, típicamente habrá más registros alimentados que para texto simple. En ese caso, los registros de alimentación de preferencia se organizan en una estructura de datos de red de palabras, que es una construcción bien conocida para almacenar una colección de sartas posibles, permitiendo que se compartan subsartas. En el caso de reconocimiento de habla, por ejemplo los índices i y j pueden corresponder a puntos en tiempos en la señal de habla de alimentación y el costo c2 indica el grado al cual la señal de habla de alimentación entre i y j corresponde con un patrón acústico de referencia para w. Un sistema de reconocimiento de lenguaje tal se describe en la solicitud de patente de los E.U.A. No. de serie 08/331,874 presentada en abril 10, 1996, otorgada a la presente cesionaria e incorporada aguí por referencia. En el caso de traducción de lenguaje hablado, la alimentación del motor de búsqueda de transducción 10 puede ser ya la pluralidad de hipótesis de sarta de palabras generada por el modelo acústico del reconocedor de habla o alternativamente, la "mejor" sarta de palabras selecta de la pluralidad de hipótesis de sarta de palabras por el modelo de lenguaje reconocedor de habla. De nuevo, si la alimentación es una pluralidad de hipótesis de sartas de palabras, se organiza de preferencia como una red de palabras, y si la alimentación es una sola "mejor" sarta, se organiza como registros de posición de palabras, como se describió anteriormente.

Un conjunto de índices J para el inicio de la alimentación y J para el fin de la alimentación debe ser identificado por igual. En el ejemplo de texto simple presentado anteriormente, I = { 0 } y J = {n} . Cualquier "trayectoria" a través de la red de palabras desde un miembro de I a un miembro de J, corresponde a una sarta fuente de alimentación posible que se extiende por toda la alimentación. La salida del traductor será una sarta objetivo "Vi, v2. . . " que es la traducción de más bajo costo de cualquier sarta que se extiende por toda la alimentación. Una descripción detallada de los diversos preprocesadores de lenguaje fuente 5 no se proporcionará; estos procesadores son conocidos por aquellos con destreza en la especialidad. En esencia, el preprocesador de lenguaje fuente 5 convierte el lenguaje escrito o hablado para traducción en un formato conveniente para utilizar por el motor de búsqueda de transducción 10. Los transductores de cabeza 13 son máquinas de estado finito. Cada transductor de cabeza 13 se asocia con un par de palabras de cabeza con significados correspondientes en los lenguajes fuente y objetivo. Por ejemplo, una de las palabras de cabeza puede ser un verbo en inglés, w, y el otro un verbo en chino v . Cuando se emplean para traducción de inglés a chino, el propósito de un transductor de cabeza 13 para w y v es reconocer o leer las palabras dependientes de w a su izquierda y derecha en la oración fuente ("la secuencia fuente izquierda" y "la secuencia fuente derecha") y propone dependientes correspondientes a la izquierda de v en la oración objetivo ("la secuencia objetivo izquierda" y " la secuencia objetivo derecha") generada. Al proponer a que secuencia escribir dependientes objetivo, el transductor de cabeza 13 toma en cuenta el orden de palabras requerido para el lenguaje objetivo. Las cabezas de cada una de las frases dependientes se traducen similarmente, y luego sus dependientes, y asi en adelante, por el motor de búsqueda de transducción. Este proceso aquí se refiere como transducción de cabeza recursiva. La transducción de cabeza recursiva se ilustra en la Figura 3, en donde una oración fuente "w ¿/ f¿*¿w6w1wa'' se convierte en una oración objetivo . Las cabezas correspondientes de nivel superior son wt y v4, y .los pares de palabras dependientes correspondientes son (w3 , v3 ) , (w* ' v* ) (wz* vz> • En el siguiente nivel, wt y v tienen un par de dependientes correspondientes simples (ws, v5) , y así en adelante. Hay que notar que en el ejemplo ilustrado en la Figura 3, el orden de palabras de la oración objetivo es diferente de aquel de la oración fuente. Esto puede ocurrir ya que el orden de palabras puede variar con el lenguaje. El transductor de cabeza 13 se caracteriza por un conjunto finito de estados, Q, y una tabla de acción de transductor que especifica acciones posibles que puede tomar el transductor de cabeza 13. Una acción posible incluye una acción de arranque; el transductor de cabeza puede empezar en el estado q e Q con secuencias objetivo vacías. Una segunda acción posible es una acción de parada; el transductor de cabeza puede parar en el estado q e Q, en cuyo caso ambas secuencias objetivo se consideran completas. Otra acción posible es una transición. Una transición ocurrirá si en el estado g, el transductor de cabeza 13 puede entrar al estado qf después de leer un símbolo w' desde una de las secuencias de alimentación y escribir un símbolo V a una de las secuencias objetivo. Las posiciones a partir de las cuales se leen y escriben los símbolos también se especifican en las transiciones. Para permitir la transducción de una sarta fuente en una sarta objetivo de una longitud diferente, se permite que los símbolos de alimentación y salida v' y v' sean la sarta vacia, denotada por e. Como se describió previamente, los tranductores de cabeza 13 utilizados en la presente invención son diferentes qué los transductores de estado finito "standard" conocidos en la especialidad. Estos últimos típicamente se limitan para convertir una sola secuencia de alimentación en una sencilla secuencia de salida, usualmente leyendo la secuencia de alimentación y escribiendo la secuencia de salida de iz«quierda a derecha. En comparación con estos transductores, un transductor de cabeza de acuerdo con la presente invención con el mismo número de estados como un transductor standard, es capaz de producir un mayor grado de divergencia entre el ordenamiento de palabras en las secuencias de alimentación y salida. Esta flexibilidad de ordenamiento adicional resulta de la capacidad de describir cada símbolo de salida, es decir carácter, identificador, palabra o semejante, a la secuencia de salida iz«quierda o derecha según sea necesario. Un beneficio adicional de los presentes transductores de cabeza es que trabajan hacia afuera desde la cabeza de una frase típicamente resultando en traducciones más precisas ya que el procesamiento puede iniciar con una palabra menos común limitando las posibilidades para traducción. En una modalidad preferida de un traductor de acuerdo con la presente invención, las posiciones de lectura y escritura para transiciones se restringen a ciertas "direcciones". En particular, correspondientes a las cuatro combinaciones fuente-objetivo (?, ?) , (. *-, ?) , ( •*, *-) , (*-,«-) de las dos secuencias fuente y dos objetivo ilustradas en la Figura 4, una transición puede especificar escritura al extremo derecho de la secuencia objetivo derecha 50, denotada ? , o escribir el extremo izquierdo de la secuencia objetivo izquierdo 55, denotado «-. Similarmente, una transición puede especificar el leer el siguiente símbolo de la secuencia fuente derecha 40 que va hacia la derecha desde el extremo izquierdo de esta secuencia denotado ?, o leer el siguiente símbolo de la secuencia fuente izquierda 45, pasando hacia la izquierda desde el extremo derecho de esa secuencia denotado *- . De esta manera, en esa modalidad preferida, hay cuatro variedades de transiciones. Habrá de entenderse que en otras modalidades, puede haber otras variedades de transiciones. Por ejemplo, en una modalidad alterna, hay 8 variedades de transiciones, en donde los transductores de cabeza pueden leer o escribir de los otros extremos de las secuencias. Entradas en el vocabulario bilingüe 15, son registros de la forma (w, v , M) . Este registro "estima" que la palabra fuente w puede traducirse en la palabra objetivo v y dependientes de w pueden convertirse en dependientes de v de acuerdo con el transductor de cabeza Af. Cuando esta entrada se aplica por el traductor 1, la entrada ha "activado" el transductor de cabeza M. Como se notó anteriormente, en una entrada bilingüe, una de las palabras w o v pueden ser la sarta vacía e en vez de una palabra normal en el vocabulario del lenguaje. Entradas con una sarta vacía se emplean para traducciones que involucran una palabra en un lenguaje sin una palabra correspondiente en el otro lenguaje. Ejemplos incluyen la introducción de un artículo o la traducción de una palabra fuente a dos palabras objetivo. Como se emplea aqui, los términos palabra, sarta y frase pueden significar sarta vacia, a menos que de otra forma se anote. En una modalidad preferida, el transductor de cabeza M de una entrada de vocabulario con una sarta vacía se restringe para tener un solo estado ge y sin transiciones. Como se describió previamente, la conversión de un par de secuencias fuente en un par de secuencias objetivo requiere una serie de acciones por un transductor de cabeza 13. Estas acciones incluyen una acción de arranque, una serie de cero o más transiciones y una acción de parada. Puede asignarse un costo a cada una de estas acciones. Un traductor de acuerdo con la presente invención genera traducciones posibles al aplicar transductores de cabeza 13 para convertir los dependientes de la cabeza de la oración fuente en los dependientes de la cabeza de la oración objetivo, y transducir recursivamente los dependientes de estos dependientes utilizando el motor de búsqueda de transducción 10. Un costo de traducción total puede definirse como la suma de los costos de todas las acciones tomadas por todos los transductores incolucrados en la traducción. La traducción con el menor costo total se elige como la salida del traductor, es decir la traducción. El costo de las diversas acciones tomadas por los diversos transductores de cabeza 13 se proporciona en la tabla de parámetros 17. De preferencia, los costos especificados en la tabla de parámetros 17 para un transductor de cabeza M toman en cuenta la identidad de la palabra fuente ir y la palabra objetivo v en la entrada de vocabulario bilingüe que lleva a la activación de M . Específicamente, el costo de una acción de inicio, f , es una función de M, w, v y el estado de inicio o arranque q es decir (M,w,v ,q) . El costo de una transición, g, es una función de M,w,v, los estados g y g' antes y después de transición, los dependientes fuente y objetivo w' y v', y las direcciones de lectura y escritura dk y d2 , es decir g(M,w,v,q,q' ,w ,w' ,v' ,d? ,d2 ) . El costo de una acción de parada, ft, es una función de M,w,v y el estado de parada g, es decir h(M,w,v,q) . De esta manera, el costo de la tabla de parámetros 17 no solo incluye costos por lo apropiado de traducir una palabra de lenguaje o fuente en una palabra en lenguaje objetivo correspondiente, sino también el costo de asociaciones entre palabras dependientes de cabeza en cada uno de los dos lenguajes. Las fuerzas de estas asociaciones, es decir la probabilidad de co-ocurrencia de estas palabras, puede influenciar la selección de la oración objetivo, una más fuerte asociación indicada por un costo menor. * Las Figuras 5A y 5B muestran transiciones ejemplares posibles para los transductores de cabeza M y M2, respectivamente, para generar parte de la transducción de sarta ilustrada en la Figura 3. Se ilustran estados como círculos y transiciones como flechas etiquetadas con direcciones fuente y objetivo. Estados en los cuales las acciones de parada pueden llevarse a cabo se ilustran como dobles círculos. Las entradas de tablas de parámetro relevantes requeridas para esta transducción también se ilustran a continuación en la Tabla 1. Las acciones de M¿ convierten las secuencias dependientes para w en aquellas para v« y las acciones de M2 convierten las secuencias fuentes dependientes para wz en aquellas para v7 Tabla 1 ENTRADA PE T?fllA QB PARAMETBOS COSTOS DE ACCIÓN DE PARTIDA M2 w7 v7 g4 c2 COSTOS DE TRANSICIÓN M1 w± v± w= v2 g¿ q2 <- «H- c MÍ v± vt wt v °í ?? ^ - ct M2 wz vz € v, g« q_ ? <- c« M2 w2 v, w2 v, g5 q¿ ? *- c, COSTOS DE ACCIÓN DE PARADA '• - M2 wz vz q s. Con referencia a la Figura 5A y la Tabla 1, el transductor de cabeza Mk, con qír q2 , q , se activan por una entrada de vocabulario (w±, v,, M1) , partiendo en el estado qí con costo Cj.. Una transición de gx a q2 con direcciones (*-, *-) y costo c2, lee la palabra fuente w2 hacia la izquierda y escribe la palabra objetivo v, también hacia la izquierda. Una transición de q2 a q2 con direcciones (-*,*-) lee la palabra fuente w¿ hacia la derecha y escribe la palabra objetivo v6 hacia la izquierda. Una tercer transición del estado g3 de regreso a g3 con direcciones (?,?) lee la palabra fuente w hacia la derecha y escribe la palabra objetivo vz también hacia la derecha. El transductor Mí luego se somete a una acción de parada en el estado qt con costo Cg. Ahora con referencia a la Figura 5B y la Tabla 1, el transductor de cabeza M2 se activa por una entrada ( w , v7, M2 ) , partiendo en estado w, con costo c2. M2 hace una transición al estado q , leyendo la sarta vacía e y escribiendo la palabra objetivo v2 hacia la izquierda. Luego realiza una transición al estado g5, leyendo la palabra w, hacia la derecha y escribiendo la palabra » hacia la izquierda. El transductor M2 luego se somete a una acción de parada en el estado g6 con costo s, . Regresando a la Figura 2, se genera una red de transducción basada en el lenguaje fuente de alimentación en la etapa 110. La red de transducción se genera por el motor de búsqueda de transducción 10. Este lector de sarta objetivo 20 elige la "traducción" de la salida del motor de búsqueda 10. La Fig. 6 ilustra una modalidad y un método por el cual el motor de búsqueda de transducción 10 construye la red de traducción.

Como se indica en la etapa 200, los registros de posición de palabra o red de palabras generados por preprocesador de lenguaje fuente 5 se reciben. El método empieza con la etapa de inicialización, que se logra en las etapas 205 a 220, identificadas colectivamente por el número de referencia 230. La inicialización se lleva a cabo al agregar a una lista de espera, un conjunto de registros de traducción (M,w,v, i , j ,q ,v, c2 ) desarrollados de los registros de posición de palabra. El conjunto de registros de transducción corresponde a activaciones de todas las entradas de vocabulario bilingüe (w,v,M) para la palabra fuente w de cada registro de posición para alimentación de palabra (\t ,i ,j ,CQ ) . El activar una entrada de vocabulario bilingüe, es decir activar un transductor de cabeza M, consiste en recuperar la entrada del vocabulario bilingüe 15 que se almacena en un dispositivo de memoria. La tabla de parámetros 17 incluye el costo ca=f (M,w,v,qo ) para iniciar el transductor de cabeza M en el estado q9 y Todos los transductores de cabeza por cada palabra w en la red de palabras o registros de posición de palabras se activan a través de los bucles configurados por los bloques de decisión 215 y 205. De acuerdo con la presente invención, solo los transductores de cabeza relacionados a las palabras fuente en los registros de posición de palabra de alimentación o red de palabras, se activan. En otras palabras, de acuerdo con la presente invención, no es necesario cargar todo el vocabulario en la RAM. En contraste, traductores de la técnica previa típicos requieren que todas sus colecciones de reglas gramaticales, reglas de traducción y semejantes sean cargados a la RAM. Los presentes sistema y método de traducción de esta manera pueden implementarse en computadoras que tienen una memoria RAM limitada. Las etapas restantes 240-295 forman un bucle que consume ítems de la lista de espera y crea nuevos registros de transducción. El bloque de decisión 240 interroga si la lista de espera esta vacia. Si lo está, entonces todos los registros de bajo costo que pueden desarrollarse desde las palabras fuente se han "extendido" lo más completamente posible, es decir todas las transiciones aplicables por los transductores de cabeza se han realizado. La red de transducción, es decir la colección de registros de transducción desarrollada por el motor de búsqueda de transducción 10, se procesa posteriormente en el selector de sarta objetivo 20 para elegir la mejor traducción, como se indica en la etapa 300. - Si la lista de espera no está vacía, el procesamiento continúa con la etapa 245, en donde se retira un registro de transducción de la lista de espera. En una modalidad preferida del presente método, el costo s de registro de transducción se compara con el registro de costo más bajo corriente en la etapa 250. El registro de costo mas bajo se identifica en la tabla de control. Las entradas en la tabla de control incluyen una clave de control (w,v,i , j,q,M) , y tienen un valor de control que es un puntero al registro de transducción. La tabla de control mantiene el puntero al registro de transducción de más bajo costo que se encuentra entre i y j encabezadas por w en el estado g de la máquina M. La información que constituye la clave de control se refiere como "estado completo" y c se refiere como el "costo de estado completo". Si el costo s del registro de transducción bajo consideración ("el registro corriente") no es menor que el costo de estado completo, el registro corriente se descarta o "corta". El procesamiento luego regresa a la etapa 240 para determinar si otro registro de transducción está disponible. Si el registro corriente tiene un menor costo que el registro de más bajo costo identificado en la tabla de control, se agrega a la red. de transducción en la etapa 255. Mientras que la etapa 250 no se requiere como una etapa en el presente método, mejora la eficiencia debido a que evita crear registros de transducción que se descartarán posteriormente. : * Si, después de agregar el registro de transducción a la red de transducción en la etapa 255, el registro de transducción es adyacente a otra frase, luego puede llevarse a cabo una acción de combinación. De esta manera, el bloque de decisión 260 interroga si hay o no más frases para combinar. De no ser asi, el procesamiento entra en bucle de regreso al bloque de decisión 240. Si hay más frases, una operación de combinación realizada por las etapas identificadas colectivamente por el número de referencia 280, resulta en un nuevo registro para una traducción parcial extendida. Los viejos registros aún permanecen en la red. Operaciones de combinación se describen con más detalle posteriormente en esta especificación. Por cada nuevo registro de transducción resultante de las operaciones combinadas, el costo de registro se compara en la etapa 285, con el costo de estado íntegro en la tabla de control. Si el costo del nuevo registro es superior que el costo de estado completo, entonces el procesamiento regresa a la etapa 260 sin agregar el nuevo registro a la lista de espera, de manera tal que se descarta efectivamente. Si el costo del nuevo registro es menor que el valor de estado completo, entonces se actualiza la entrada de tabla de control con el nuevo puntero de registro en la etapa 290 y el registro de estado completo viejo se retira de la red de transducción. El nuevo registro de bajo costo luegc se agrega a la lista de espera en la etapa 295 y el procesamiento continúa con la etapa 260. Después de que la lista de espera se ha vaciado, el procesamiento continúa con la etapa 300, en donde el selector de sarta objetivo 20 elige la sarta de palabras que tiene el más bajo costo. Un método para esta selección de sarta de bajo costo se ilustra en la Figura 7. En una primer etapa 310, una lista de todos los registros de red (M,w,v,i , j,q, t,c) de una posición de alimentación inicial i e I a una posición de alimentación final j e J se compila. En la etapa 320, el costo de acción de parada h(M,w,v,q) especificado en la tabla de parámetros 17 se agrega a cada registro en la lista. Finalmente, en la etapa 330, la sarta t del registro que tiene el costo mas bajo total, se elige como la traducción. Si hay varíaos de estos registros de extensión con el mismo costo, entonces elige uno de estos registros en forma aleatoria. Como se describió previamente, si agregar un registro de transducción a la red lo hace adyacente a otro registro de transducción, entonces puede llevarse a cabo una acción de combinación resultando en una traducción parcial extendida. Cada combinación corresponde a una acción de transición del transductor de cabeza para uno de los dos registros de transducción. Específicamente, la combinación es una acción de transición para el transductor «que actúa como la cabeza en la combinación. El otro registro actúa como el dependiente en la combinación. De ser exitosa, la operación de combinación resulta en un nuevo registro para una traducción parcial extendida, con los viejos registros que permanecen en la red. Las cuatro combinaciones de las direcciones de transición previamente descritas corresponden a cuatro tipos de etapas de transducción o combinación que surgen de la selección de la dirección de fuente izquierda o derecha y dirección objetivo izquierda o derecha. Una etapa de transducción ejemplar se describirá para una dirección fuente izquierda («-) y una dirección objetivo derecha (?) . Los otros tres tipos de etapas de transducción son análogos, con los registros de frase fuente y la concatenación de sarta objetivo invertida como sea apropiado. Si la red de transducción contiene traducciones parciales adyacentes (M1/wívii /k,qitlf c1) y (M2,w2,v2,k, j,q2t¿:2) , y la tabla de acción para Mt incluye una transición de q2 a q'2 con la dirección fuente «-, dirección objetivo ? y la tabla de parámetros 17 incluye un costo, c2=g(M2 ,w2 fv2 ,w ,ví ,q2 ,q'2 *- ,?) para esta transición, con la palabra dependiente fuente w y la palabra dependiente objetivo vk y la tabla de acción para Mx incluye una acción de parada en el estado j. para el cual la tabla de parámetros 17 incluye un costo ct=h(M1 ,W? f v1 /ql ) , entonces se crea una nueva traducción parcial extendida ÍWi,>v_2,'i,i, , 'j,t',C5j, en donde: c2=c?+c2+c2+c y t'=concatena ( tít t . En otras palabras, el transductor de cabeza M2, activado por una entrada bilingüe (w2 ,v2 ,M2 ) se ha sometido a un "consumo" de transición de una sarta fuente dependiente a la izquierda (encabezada por w?) y que extiende la sarta objetivo t2_ a su derecha por una sarta t (encabezada por v ) , x es la traducción de la sarta "consumida".

La etapa de transducción descrita anteriormente aplica a menos que la palabra fuente dependiente para la transición, por ejemplo w? en el ejemplo anterior es e, la sarta vacía. Para estas transiciones, solo el viejo registro para la palabra de cabeza, es decir (M2 ,w2 ,v2 , e ,k, j,q2, t2 , e2 ) se requiere para que se lleve a cabo la transición. La tabla de parámetros 17 luego debe incluir el costo *-,? , ) y el vocabulario debe incluir una entrada ( ,V ,M?) . Como se describió previamente, el transductor de cabeza Mk luego solo tendrá un estado sencillo e y sin transiciones. El nuevo registro creado por la etapa de transducción es en donde M2 fw2 ,v2 ,k, j y q'2 son como con anterioridad, c¿=c2+c2+f(M?, e ,ví fq9) +h(M , e ,V?,qo) , y t'- concatena ( t2_,vx . Las etapas de transducción «que involucran sartas vacías no pueden resultar en no terminación del proceso de búsqueda debido a la verificación del bucle de transducción asegurando que traducciones parciales agregadas a la lista de espera deben tener un costo menor que frases previas con el mismo estado completo. Respecto a parámetros de costo, la presente invención no requiere ninguna interpretación específica de los diversos parámetros de costo para acciones de transductor diferentes al requerimiento general, que costos menores que corresponden a traducciones mas deseables. En una modalidad preferida, las funciones de costo tiene probabilidad log negada. Costos de probabilidad log pueden determinarse como sigue para la presente invención. Las acciones de transductor se toman como eventos en un modelo, asi denominado generativo, específicamente un modelo probabilístico para generar simultáneamente una sarta de lenguaje fuente y una sarta de lenguaje objetivo. Un conjunto de datos de oraciones fuente para una aplicación de traducción particular se recolecta. Una tabla de parámetros se crea en la que todos los costos son del mismo valor constante. El traductor se corre con cada una de las oraciones fuente del conjunto de datos, manteniendo una cuenta de todas las acciones de transductor tomadas. Los pares de oraciones fuente y objetivo resultantes se presentan a un individuo competente en ambos idiomas de manera tal «que pueda clasificar las traducciones como aceptables o inaceptables..• Se descartan cuentas «que llevan a traducciones inaceptables y se estimas probabilidades de las cuentas restantes, utilizando métodos estadísticos standard. Para cada probabilidad estimada P(e) para una acción e, ajusta el costo para e igual a láqf Pf e) ) , y construye una nueva tabla de parámetros a partir de estos costos. Se apreciará que otros métodos para estimar probabilidades conocidos por aquellos con destreza en la especialidad pueden emplearse tales como expectación-maximización. Además, funciones de costo aparte de probabilidad log pueden emplearse tales como sin limitación, la proporción de probabilidad. La proporción de probabilidad es el número de veces en entrenamiento que una acción de transductor particular lleva a la sarta incorrecta y el número de veces que lleva a seleccionar una sarta correcta. Habrá de entenderse que las modalidades descritas aquí son ilustrativas de los principios de esta invención y que pueden ocurrirse diversas modificaciones e implementarse por aquellos con destreza en la especialidad sin apartarse del alcance y espíritu de esta invención. Por ejemplo, en otras modalidades de un traductor de acuerdo con la presente invención, pueden emplearse medios diferentes a "costos" para elegir la mejor transducción. Estos medios incluyen, sin limitación, restricciones. Ejemplos no limitantes de restricciones para utilizar en el presente traductor incluyen restricciones de unificación y restricciones de selección. En estos traductores basados en restricción, la tabla de parámetros 17 no se requiere. En algunas modalidades, una tabla de restricción 17a reemplazará la tabla de parámetros I7-T Hay que notar que en estos traductores basados en restricción, el motor de búsqueda de transducción 10a admitirá los resultados de combinaciones en una base diferente a costo. En modalidades alternas, la "mejor" traducción se elige al azar a partir de traducciones candidatas, de manera tal que un selector de sarta objetivo 20a no se requiera.

En la mayoría de las aplicaciones de traducción no triviales, se requiere una pluralidad de transductores de cabeza 13. En algunas aplicaciones simples, sin embargo, tales como traducir ciertas colecciones de instrucciones de computadora, pueden emplearse para traducir un transductor de cabeza sencilla 13. Se hace constar que con relación a esta fecha, el mejor método conocido por la solicitante para llevar a la práctica la citada invención, es el que resulta claro de la presente descripción de la invención. Habiéndose descrito la invención como antecede, se reclama como propiedad lo contenido en las siguientes:

Claims

REIVINDICACIONES 1. Un traductor para traducir una frase de un lenguaje fuente a una frase de lenguaje objetivo, caracterizado porque comprende: una pluralidad de transductores de cabeza, cada transductor de cabeza está asociado con un par de palabras de cabeza con significados correspondientes en los lenguajes fuente y objetivo, cada traductor de cabeza convierte secuencias de dependientes de lenguaje fuente ordenadas izquierda y derecha de la palabra de cabeza de lenguaje fuente en secuencias dependientes de lenguaje objetivo de orden izquierdo y derecho de la palabra de cabeza de lenguaje objetivo; un vocabulario bilingüe que asocia cada transductor con el par de palabras de cabeza; una tabla de parámetros que proporciona costos por cada acción tomada por cada transductor de cabeza; un motor de búsqueda de transducción que genera una pluralidad de traducciones candidatas de la frase de lenguaje fuente utilizando transductores de cabeza y proporciona un costo total por cada una de las traducciones candidatas, en donde el costo total de una traducción es la suma del costo para todas las acciones que se toman por cada transductor involucrado en la traducción; y un selector de sarta objetivo que elige una mejor traducción a partir de la pluralidad de traducciones candidatas, al buscar la traducción que tiene el más bajo costo.
2. El traductor de conformidad con la reivindicación 1, caracterizado porque las acciones se eligen del grupo que consiste de acciones de arranque, acciones de parada y transiciones, en donde una transición indica una primer dirección y una segunda dirección, la primera dirección para leer de las secuencias de lenguaje fuente en orden izquierdo y derecho y la segunda dirección para escribir a las secuencias de lenguaje objetivo de orden izquierdo y derecho, para afectar diferencias de ordenamiento deseadas entre las secuencias fuente y objetivo.
3. El traductor de conformidad con la reivindicación 2, caracterizado porque los costos para acciones de transición son indicativos de la probabilidad de co-ocurrencia para dos palabras de lenguaje fuente y la probabilidad de co-ocurrencia para dos palabras de lenguaje objetivo.
4. El traductor de conformidad con la reivindicación 1, caracterizado porque además comprende un preprocesador de lenguaje fuente para convertir la frase de lenguaje fuente en un formato utilizable por el motor de búsqueda de transducción. '- -
5. El traductor de conformidad con la reivindicación 4, caracterizado porque el formato es al menos un registro de posición de palabra.
6. Un medio de almacenamiento legible por computadora que comprende instrucciones de programa legibles por computadora codificadas para utilizar en conjunto con una computadora programable, estas instrucciones provocan que la computadora traduzca una frase de un lenguaje fuente en una frase de un lenguaje objetivo, utilizando una pluralidad de transductores de estado finito que convierten un par de secuencias del lenguaje fuente en un par de secuencias de lenguaje objetivo.
7. Un traductor para traducir una sarta de un lenguaje fuente en al menos una sarta en un lenguaje objetivo, caracterizado porque comprende: al menos un transductor de cabeza, el transductor de cabeza asociado con un par de palabras de cabeza con significados correspondientes en los lenguajes fuente y objetivo, el transductor de cabeza convierte secuencias de dependientes de lenguaje fuente con orden izquierdo y derecho de la palabra de cabeza de lenguaje fuente, en secuencias de dependientes del lenguaje objetivo con orden izquierdo y derecho de la palabra de cabeza del lenguaje objetivo; un vocabulario bilingüe que asocia el transductor con el par de palabras de cabeza; una tabla que contiene una pluralidad de parámetros seleccionados del grupo que consiste de* costos y restricciones, en donde un parámetro de la pluralidad se asigna a cada acción de al menos el transductor de cabeza; un motor de búsqueda de transducción que genera una pluralidad de traducciones candidatas de la frase de lenguaje fuente, utilizando el transductor de cabeza como mínimo y asigna un valor a la traducción en donde el valor es una función de los parámetros involucrados para todas las acciones tomadas por el transductor como mínimo involucrado en la traducción; y un selector de sarta de lenguaje objetivo, que elige una traducción a partir de una pluralidad de traducciones candidatas.
8. El traductor de conformidad con la reivindicación 7, caracterizado porque el selector de sarta de lenguaje objetivo elige la traducción con base en una comparación del valor asignado por cada traducción candidato de la pluralidad.
9. El traductor de conformidad con la reivindicación 7, caracterizado porque las restricciones son implícitas en las palabras de cabeza presentes en el vocabulario bilingüe.
10. El traductor de conformidad con la reivindicación 7, caracterizado porque las restricciones se eligen a partir de limitaciones de unificación y restricciones de selección.
11. Un dispositivo para utilizar en convertir una señal de alimentación indicativa del contenido de información a una señal de salida indicativa del contenido de información, ?a -señal de alimentación y la señal de salida caracterizables respectivamente como una secuencia de elementos de alimentación expresados en un primer formato y una secuencia de elementos de salida expresados en un segundo formato, caracterizado el dispositivo porque comprende: un transductor que lee dos sub-secuencias de alimentación a partir de la secuencia de elementos de alimentación y genera, con base en las subsecuencias de alimentación, dos subsecuencias de salida de los elementos de salida, en donde las dos sub-secuencias de salida se combinan para formar la secuencia de elementos de salida que comprenden la señal de salida.
12. El dispositivo de conformidad con la reivindicación 11, caracterizado porque los elementos son palabras, identificadoras o caracteres.
13. Un método para traducir una frase en un lenguaje fuente a una frase en un lenguaje objetivo, caracterizado porque comprende las etapas de: (a) activar máquinas de estado asociadas con cada palabra en la frase de lenguaje fuente, en donde las máquinas de estado activadas se eligen a partir de una pluralidad de estas máquinas de estado asociadas con una pluralidad de palabras que definen un vocabulario, cada una de las máquinas de estado activadas convierte un par de sartas de lenguaje fuente en un par de sartas de lenguaje objetivo y además en donde cada máquina de estado se caracteriza por un estado inicial; (b) generar una primer pluralidad de registros de^ransducción, en donde un registro de transducción se genera por cada palabra en la frase de lenguaje fuente y cada registro de transducción se caracteriza por una máquina de estado, una palabra fuente, una sarta objetivo, dos indicadores de posición para localizar la posición de la palabra fuente en la frase fuente, el estado inicial para la máquina de estado y un costo; (c) generar una red de transducción al formar una estructura de datos comprendida por los registros de transducción de la etapa (b); (d) generar una pluralidad de registros de transducción extendidos, en donde se forma un registro de transducción extendido cuando un registro de transducción dentro de una red de transducción consume un registro de transducción adyacente en la red de transducción por una transición de máquina de estado y en donde el registro de transducción extendido incluye una sarta objetivo extendida, construida al concatenar la sarta objetivo de los registros consumido y consumidor, en un orden indicado por las direcciones para la transición de máquina de estado, y un nuevo costo «que es la suma de los costos del registro consumido y el registro consumidor, un costo asociado con la transición de máquina de estado del registro consumidor y un costo asociado con una parada que se realiza por la máquina de estado consumida; (e) agregar el registro de transducción extendido a la red de transducción; (f) repetir las etapas (d) y (e) en donde un registro de transducción consume un registro de transducción adyacente hasta que todos los^ registros se han extendido completamente; y (g) elegir el registro de transducción de más bajo costo que se extiende por toda la frase de lenguaje fuente.
14. El método de conformidad con la reivindicación 13, caracterizado porque el costo asociado con la transición de máquina de estado es indicativo de la probabilidad de co-ocurrencia de las palabras que activan las máquinas de estado para los registros consumido y consumidor y la probabilidad de co-ocurrencia en el lenguaje objetivo de las palabras objetivo correspondientes para estos registros.
15. El método de conformidad con la reivindicación 13, caracterizado porque en la etapa (e), el registro de transducción se agrega a la red de transducción si el nuevo costo de registro de transducción extendido es menor que un costo de registro de transducción de referencia y la etapa (f) además comprende actualizar el costo de registro de transducción de referencia por los registros de transducción extendidos agregados a la red de transducción.
16. Un método para convertir una señal de alimentación representativa de palabras, caracteres o identificadores, caracterizados por un primer formato, en una señal de salida representativa de palabras, caracteres o identificadores caracterizados por un segundo formato, el método se caracteriza porque comprende las etapas de: dividir la señal de alimentación en dos subseñales de alimentación en una posición identificada por un elemento de la señal de alimentación; generar dos subseñales de salida representativas de las dos subseñales de alimentación de acuerdo con las acciones de una máquina de estado finito en cuyas transiciones especifica una dirección que indica una selección de una de las dos señales de salida para producir las diferencias de ordenamiento deseadas entre los elementos de las señales de alimentación y salida; y combinar las dos subseñales de salida. RESUMEN DE LA INVENCIÓN La presente invención se refiere a métodos y sistemas para traducción de lenguaje. El traductor se basa en máquinas de estado finito que pueden convertir un par de secuencias de símbolos de alimentación a un par de secuencias de símbolos de salida. El traductor incluye un vocabulario que asocia una máquina de estado finito con un par de palabras de cabeza con significados correspondientes en los lenguajes fuente y objetivo. La máquina de estado para una palabra de cabeza de lenguaje fuente w y una palabra de cabeza de lenguaje objetivo v, lee las palabras dependientes de w a su izquierda y derecha en una oración fuente y propone dependientes correspondientes a izquierda y derecha de v en una oración de lenguaje objetivo construida, tomando en cuenta el orden de palabra reguerido para el lenguaje objetivo. Las máquinas de estado se emplean por un motor de búsqueda de transducción para genera una pluralidad de traducciones candidatas mediante un proceso recursivo en donde, primero se traduce como se describió anteriormente una palabra de cabeza de lenguaje fuente, y luego las" cabezas de cada una de las frases dependientes se traducen similarmente, y después sus dependientes y asi en adelante. Solo las máquinas de estado que corresponden a las palabras en la sarta de lenguaje fuente se activan y emplean por el motor de búsqueda. El traductor tarabién incluye una tabla de parámetros que proporciona costos para acciones tomadas por cada máquina de estado finito al convertir entre el lenguaje fuente y el lenguaje objetivo. Los costos para transiciones de máquinas son indicativos de la pluralidad de co-ocurrencias de pares de palabras en el lenguaje fuente y entre pares de palabras correspondientes en el lenguaje objetivo. El motor de búsqueda de transducción proporciona un costo total utilizando la tabla de parámetros por cada una de las traducciones candidatas. El costo total de una traducción es la suma del costo para todas las acciones tomadas por cada máquina involucrada en la traducción.