ES2251211T3 - Sistema de traduccion y ordenador multifuncional, particularmente para tratar textos y traduccion en papel. - Google Patents

Sistema de traduccion y ordenador multifuncional, particularmente para tratar textos y traduccion en papel.

Info

Publication number
ES2251211T3
ES2251211T3 ES99937822T ES99937822T ES2251211T3 ES 2251211 T3 ES2251211 T3 ES 2251211T3 ES 99937822 T ES99937822 T ES 99937822T ES 99937822 T ES99937822 T ES 99937822T ES 2251211 T3 ES2251211 T3 ES 2251211T3
Authority
ES
Spain
Prior art keywords
translation
translated
language
words
text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
ES99937822T
Other languages
English (en)
Inventor
Giovanni D'agostini
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
DAgostini Organizzazione SRL
Original Assignee
DAgostini Organizzazione SRL
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by DAgostini Organizzazione SRL filed Critical DAgostini Organizzazione SRL
Application granted granted Critical
Publication of ES2251211T3 publication Critical patent/ES2251211T3/es
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • G06F40/47Machine-assisted translation, e.g. using translation memory
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • G06F40/44Statistical methods, e.g. probability models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • G06F40/45Example-based machine translation; Alignment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation

Abstract

Método de traducción automática para ser usado en un sistema de traducción automática que tiene un medio de ventana interactiva permitiendo al usuario introducir información relacionada a una parte determinada de la frase de entrada que debe ser traducida y dos campos desplazables (455, 456) uno para el texto que debe ser traducido y uno para el texto traducido, comprendiendo las fases siguientes: a) después de la traducción automática de la frase, dicho sistema de traducción presenta automáticamente al operador una primera ventana interactiva (46) con al menos: - en una línea la frase de entrada (462); - en otra línea la traducción automática que debe ser controlada por el operador (463); b) en la ventana (46) el operador realiza la corrección de la traducción, seleccionando el fragmento de la frase que incluye dicha corrección (4631); c) el sistema de traducción proporciona una ventana adicional mostrando: - dicha frase de entrada (462); - el fragmento de la traducción previamente seleccionado que incluye la corrección realizada (463); - un código de calificación de la función de sintaxis propuesta (4632, FM4) en referencia a dicho fragmento (4632); d) en la misma ventana, el operador selecciona la parte correspondiente en dicha frase de entrada donde él quiere introducir dicha información (4621) e) el sistema de traducción proporciona una ventana adicional donde en las tres líneas el operador puede controlar dicha información (4621; 4631), corrigiendo, si es necesario, el código de calificación de la función de sintaxis (4632, FM4), almacenándolo automáticamente en una memoria interactiva (FM), para una reutilización automática en traducciones posteriores, al menos: - (I) un campo para la primera palabra de la parte del fragmento de entrada (4621, FM1), - (II) un campo para la parte del fragmento de entrada que sigue a dicha primera palabra de entrada (4621, FM2), - (III) un campo para la traducción corregida (4631, FM3),

Description

Sistema de traducción y ordenador multifuncional, particularmente para tratar textos y traducción en papel.
Campo técnico
Esta invención tiene por objeto un sistema de traducción.
Estado de la técnica
En la técnica anterior se describe un gran número de ordenadores capaces de hacer traducciones y sistemas de traducción automática.
Los más conocidos son los siguientes:
US-5677835 - Oct. 14, 1997 - a nombre de Caterpillar Inc., Peoria, IL, USA.
Este sustancialmente hace referencia a un sistema de procesos integrados basados en el ordenador para el desarrollo de la información monolingüe y la traducción multilingüe.
Un editor de texto interactivo aplica limitaciones léxicas y gramaticales en un subconjunto de lenguaje natural utilizado por los autores para crear su texto.
El texto en la lengua fuente traducible es sometido a la traducción automática a una cualquiera de entre un grupo de lenguas meta, sin que el texto traducido requiera ningún tipo de postedición.
US-5510981; Oct. 28, 1993; (International Business Machines Corporation, Armonk, NY), hace referencia a un aparato de traducción de lenguas y a un método que utiliza modelos de traducción basados en un contexto.
Este sustancialmente se refiere a un aparato para traducir una serie de palabras fuente en una primera lengua hacia una serie de palabras meta en una segunda lengua. Para una serie de palabras fuente de entrada, surgen por lo menos dos hipótesis meta, cada una incluyendo una serie de palabras meta.
Cada palabra meta tiene un contexto comprendiendo al menos otra palabra en la hipótesis meta.
Para cada hipótesis meta, hay una puntuación de correspondencia del modelo de lengua comprendiendo una estimación de la probabilidad de incidencia de la serie de palabras en la hipótesis meta.
Se identifica por lo menos una alineación conectando cada palabra fuente con al menos una palabra meta en la hipótesis meta: -Para cada palabra fuente y cada hipótesis meta hay una puntuación de correspondencia de palabra comprendiendo una estimación de la probabilidad condicional de incidencia de la palabra fuente, dada la palabra meta en la hipótesis meta que está relacionada con la palabra fuente y dado el contexto en la hipótesis meta de la palabra meta que está relacionada con la palabra fuente.
Para cada hipótesis meta hay una puntuación de correspondencia de traducción comprendiendo puntuaciones de correspondencia de palabras para la hipótesis meta y las palabras fuente en las series de entrada de palabras fuente.
Una puntuación de correspondencia de hipótesis meta comprende una combinación de la puntuación de correspondencia del modelo de lengua para la hipótesis meta y la puntuación de correspondencia de traducción para la hipótesis meta. Se proporciona la hipótesis meta con la mejor puntuación de correspondencia de hipótesis meta.
US-5384701 - 7 Junio 1991 a nombre de British Telecommunications sociedad limitada pública, Londres, Inglaterra, hace referencia a un Sistema de Traducción de Lenguas, y en particular, un sistema de traducción de lenguas para traducir frases de una primera lengua a una segunda lengua comprendiendo un acumulador con un conjunto de frases en la segunda lengua.
Cada entrada de frases en la primera lengua se basa en una o más palabras clave proporcionando la frase correspondiente en la segunda lengua. Este tipo de enfoque de conjunto de frases hace posible la que efectivamente es una traducción rápida y precisa, incluso del lenguaje hablado.
Puesto que las frases en la segunda lengua están preparadas de antemano y almacenadas, no hay ningún problema de traducción pobre o gramaticalmente incorrecta.
La salida puede ser en texto, o, utilizando síntesis del habla, en forma de voz. Mediante la elección apropiada de las palabras claves es posible caracterizar un gran número de frases relativamente largas y complejas con solamente unas cuantas palabras claves.
US-5338976 - 16 Junio 1992, a nombre de Ricoh Company, Ltd., Tokio, Japón, hace referencia a un sistema de conversión lingüístico interactivo y, en particular, un sistema de conversión lingüístico incluye una base de datos de modelos de expresión en la lengua meta, un mecanismo de evaluación de relaciones para valorar una relevancia de cada modelo de expresión en la lengua meta respecto a una entrada en la lengua original, un mecanismo de recuperación e identificación para recuperar e identificar a partir de la entrada en la lengua original la información solicitada por el modelo de expresión en la lengua meta requerido para generar una salida en la lengua meta, un mecanismo de selección para seleccionar el modelo de expresión en la lengua meta según la entrada en el idioma original dependiendo de la relevancia valorada en el mecanismo de evaluación de relevancia, un mecanismo de salida para generar la salida en la lengua meta basada en la información requerida recuperada e identificada a partir de la entrada en la lengua original por el mecanismo de recuperación y de identificación, y un mecanismo de control para controlar secuencias de operaciones del mecanismo de evaluación de relevancia, el mecanismo de recuperación e identificación, el mecanismo de selección y el mecanismo de salida.
US-5659765: Sistema de traducción automática a nombre de Toppan Printing Co., Ltd., Tokio, Japón, solicitada el 14 de marzo de 1995, reivindica un sistema de traducción automática que comprende:
-
una primera lengua;
-
un segundo medio de entrada para introducir una segunda secuencia de caracteres escrita en una segunda lengua;
-
un medio de visualización para mostrar simultáneamente la primera y la segunda secuencia de caracteres de dichos primer y segundo medios de entrada;
-
un medio de enlace que tiene un primer medio de designación para designar una tercera secuencia de caracteres incluida en el primer carácter
-
una secuencia visualizada por dichos medios de visualización, y segundo medio de designación para designar una cuarta secuencia de caracteres incluida en la segunda secuencia de caracteres visualizada por dichos medios de visualización, y enlaza entre sí la tercera y la cuarta secuencias de caracteres;
-
un medio de registro para registrar la tercera y la cuarta secuencia de caracteres enlazada por dichos medios de conexión como un par; y
-
un medio para detectar la secuencia de caracteres que es más similar a una secuencia de caracteres original escrita en la primera lengua de una pluralidad de una tercera secuencia de caracteres registrada, y traduciendo la secuencia de caracteres original en una secuencia de caracteres escrita en la segunda lengua usando una cuarta secuencia de caracteres enlazada con la secuencia de caracteres detectada.
US-5426583 - 27 de enero de 1994 - a nombre de Uribe-Echebarria Diaz De Mendibil; Gregorio, Erandio, Bilbao, España, hace referencia a un sistema de traducción interlingüe automático, reivindicando un método para el uso en un ordenador para traducir automáticamente un primer texto basado en una lengua fuente a un segundo texto basado en una lengua meta diferente, dicho método incluyendo las etapas de:
(a) analizar dicho primer texto para conseguir una clarificación de tipo arborescente sobre las características morfológicas, sintácticas y semánticas de dicho primer texto;
(b) traducir el texto analizado a una primera lengua intermedia, donde dicha primera lengua intermedia contiene características estructurales de dicha lengua fuente;
(c) integrar el texto traducido en una interlengua, donde dicha interlengua contiene características morfológicas, sintácticas y semánticas de una pluralidad de lenguas;
(d) traducir el texto integrado a una segunda lengua intermedia, donde dicha segunda lengua intermedia contiene características estructurales de dicha lengua meta; y
(e) convertir el texto traducido e integrado a dicho segundo texto.
US-4604698 - 22 de diciembre de 1983 - a nombre de Sharp Kabushiki Kaisha, Osaka, Japón, hace referencia a un traductor electrónico que incluye claves de entrada de carácter para introducir una palabra de una primera lengua, un traductor para traducir la palabra de la primera lengua introducida a la palabra de la segunda lengua, un retraductor para traducir de nuevo la palabra de la segunda lengua otra vez a la palabra de la primera lengua, y una unidad de visualización para visualizar la palabra introducida, la palabra traducida y la palabra traducida de
nuevo.
US-4439836 de 22 de octubre de 1980 - a nombre de Sharp Kabushiki Kaisha, Osaka, Japón, hace referencia a un traductor electrónico, reivindicando un dispositivo traductor electrónico para obtener una segunda palabra representada en una segunda lengua equivalente a una palabra de entrada en una primera lengua, comprendiendo:
un medio de entrada para introducir la palabra de entrada;
un primer medio de memoria para memorizar una pluralidad de primeras palabras en la primera lengua, cada una de dichas primeras palabras comprendiendo una o más primeras letras permaneciendo inalterables a pesar de la inflexión y una o más segundas letras cambiando según la inflexión;
un medio de direccionamiento operativamente conectado a dicho medio de entrada y sensible a la entrada de la palabra de entrada para el direccionamiento de dicho primer medio de memoria para desarrollar una de la pluralidad de las primeras palabras;
un medio de detección operativamente conectado a dicho primer medio de memoria y sensible a dicho medio de direccionamiento para detectar la equivalencia entre la palabra de entrada y dichas primeras letras de las respectivas primeras palabras;
un segundo medio de memoria para memorizar una pluralidad de segundas palabras en la segunda lengua correspondiente a las primeras palabras almacenadas en dicho primer medio de memoria;
un primer medio operativamente conectado a dicho medio de detección para activar dicho segundo medio de memoria por lo cual dicho segundo medio de memoria desarrolla una segunda palabra correspondiente a la palabra de entrada cuando la palabra de entrada es equivalente a una de dichas primeras palabras; y
un segundo medio operativamente conectado a dicho medio de detección para indicar que una de dichas primeras palabras en dicho primer medio de memoria comprende una forma no alterada de la palabra de entrada.
US-4633435 - 22 de julio de 1985 - a nombre de Sharp Kabushiki Kaisha, Osaka, Japón, hace referencia a un traductor lingüístico electrónico capaz de modificar los artículos definidos, y en particular refiriéndose a un traductor electrónico donde las frases almacenadas son modificadas sustituyendo una o más palabras en una de las frases originales con una o más palabras nuevas y cambiando automáticamente una o más palabras adicionales en la frase original, dependiendo de la naturaleza de una o más palabras nuevas introducidas en la frase. Por ejemplo, una o más palabras adicionales pueden ser artículos definidos o preposiciones.
US-4831529 - 12 de febrero de 1987 - a nombre de Kabushiki Kaisha Toshiba, Kawasaki, Japón, hace referencia a un sistema de traducción automática, reivindicando un sistema de traducción automática para traducir una primera lengua en una segunda lengua, comprendiendo:
un medio de entrada para introducir una frase escrita original en la primera lengua en el sistema;
un medio de diccionario con al menos un primer diccionario para almacenar varias palabras en varias partes del discurso y su traducción en la segunda lengua respectivamente correspondiente a las palabras en la primera lengua, y un segundo diccionario para almacenar varias palabras designadas como sustantivos correspondientes a palabras en la primera lengua;
un medio de traducción para analizar la frase escrita original en la primera lengua, para recuperar dicho medio de diccionario y para ejecutar el proceso de traducción de la entrada original, cuando cualquier misma palabra designada como sustantivo almacenada en el primer diccionario es encontrada en el segundo diccionario, la palabra almacenada en el segundo diccionario tiene prioridad sobre aquella en el primer diccionario en el medio de traducción; y
un medio de salida para producir frases traducidas en la segunda lengua obtenidas de dicho medio de traducción.
US-5020021 - 10 de enero de 1986 - a nombre de Hitachi, Ltd., Tokio, Japón, hace referencia a un sistema de traducción lingüística automática utilizando diferentes áreas de almacenamiento del diccionario y una tabla de sustantivos, y en particular refiriéndose a un método de traducción para un sistema de traducción automática provisto de un aparato para analizar desde la sintaxis una frase lingüística fuente y para realizar una traducción en la lengua meta donde una frase omitida en la frase de la lengua fuente es identificada, y una palabra o frase que debe ser insertada en lugar de la frase omitida es seleccionada de palabras y frases almacenadas. Para identificar una frase omitida, se forma un modelo de frase correspondiente a un predicado en la frase de la lengua fuente para incluir no sólo casos determinados por el predicado sino también una característica semántica para cada caso. Comparando la frase de la lengua fuente con el modelo de frase, se identifica un caso que es omitido en la frase de la lengua fuente pero que no puede ser omitido en la traducción a la lengua meta. Para determinar una palabra o frase por colocar en la posición de la frase omitida, los sustantivos aparecidos en el texto de la lengua fuente son almacenados en un sustantivo, junto con la característica semántica, el género, la persona y el número de cada sustantivo buscándose un sustantivo con la misma característica semántica que la frase omitida. Cuando se forma una traducción a la lengua meta de la frase de la lengua fuente se usa un pronombre con el mismo género, persona y número que el de la frase omitida como un equivalente en la lengua meta para la frase omitida, y de esta forma se obtiene una traducción de la lengua meta que es gramáticamente correcta.
US-5093788 - 25 de junio del 987 - a nombre de Sharp Kabushiki Kaisha, Osaka, Japón, hace referencia a un sistema automático de traducción que separa y une frases.
Éste reivindica un sistema automático de traducción electrónica para traducir múltiples frases de una lengua fuente a una lengua meta comprendiendo:
un medio de entrada para introducir una pluralidad de frases fuente;
un primer medio de memoria en comunicación con dicho medio de entrada para almacenar dichas frases fuente;
un medio de designación de la posición acoplado con dicho primer medio de memoria para designar un punto de división que separe una frase fuente seleccionada en partes y para insertar un símbolo de designación de posición en dicha frase fuente seleccionada;
un medio de separación en comunicación con dicho primer medio de memoria para escanear dicha frase fuente seleccionada para encontrar dicho símbolo de designación de posición y, una vez encontrado, para separar dicha frase fuente seleccionada en partes y para almacenar dichas partes en dicho primer medio de memoria; y un medio de traducción para traducir las partes de dicha frase fuente seleccionada almacenada en dicho medio de memoria de dicha lengua fuente a dicha lengua meta.
US-5175684 -31 de diciembre de 1990 - a nombre de Trans-Link Internacional Corp., Honolulu, HI, hace referencia a una traducción de texto automática y a un sistema de enrutamiento, reivindicando un sistema de traducción automática comprendiendo:
un módulo de traducción automática que es capaz de realizar una traducción automática de un texto de entrada de una lengua fuente a un texto de salida de una lengua meta, dicho módulo de traducción automática teniendo una pluralidad de submódulos de lengua meta para realizar la traducción automática en una pluralidad de lenguas meta diferentes;
una interfaz de recepción para recibir por medio de una primera conexión de telecomunicación una entrada electrónica que está dividida en páginas, dichas páginas de entrada incluyendo un página de encabezamiento con campos predefinidos conteniendo información del sistema en su interior y al menos una página de texto en una lengua fuente, donde dicha página de encabezamiento incluye al menos un primer campo predefinido que designa una dirección de un destinatario al que el texto de salida traducido debe ser enviado, y un segundo campo predefinido que designa la lengua seleccionada de entre una pluralidad de lenguas meta diferentes hacia la que al menos un página del texto debe ser traducida, y donde dicha interfaz de recepción incluye un módulo de reconocimiento capaz de reconocer electrónicamente la dirección del destinatario designado en dicho primer campo predefinido de la página de encabezamiento de las páginas de entrada recibidas, y la lengua meta seleccionada designada en dicho segundo campo predefinido de la página de encabezamiento;
una interfaz de envío para enviar el texto de salida generado por dicho módulo de traducción automática a un destinatario por medio de una segunda conexión de telecomunicación; y
un medio de control acoplado a dicha interfaz receptora, dicho módulo de traducción automática, y dicha interfaz de envío para reconocer la dirección y la lengua meta designada en dichos campos predefinidos de dicha página de encabezamiento, para controlar que dicho módulo de traducción automática genere texto de salida de la lengua meta designada del texto de entrada de la lengua fuente y para operar dicha interfaz de envío para enviar automáticamente el texto de salida traducido por medio de la segunda conexión de telecomunicación a la dirección designada reconocida por dichos campos predefinidos de dicha página de encabezamiento.
US-5303151 - 26 de febrero de 1993 - a nombre de Microsoft Corporación, Redmond, WA, hace referencia a un Método y sistema para traducir documentos utilizando la traducción, y reivindicando un sistema de ordenador para traducir un documento en lengua fuente escrito en una lengua fuente a un documento de lengua meta escrito en una lengua meta, la lengua fuente incluyendo una multiplicidad de términos fuentes y la lengua meta incluyendo una multiplicidad de términos meta, el sistema de ordenador incluyendo una pantalla de visualización, el documento de la lengua fuente, un glosario de productos con una pluralidad de términos fuente de la lengua fuente y una pluralidad de términos meta de la lengua meta, cada término fuente siendo asociado al término meta correspondiente que traduce el término fuente en la lengua meta, el sistema de ordenador comprendiendo:
medios para presentar una parte de la pantalla de traducción en la pantalla de visualización, la parte de pantalla de la traducción incluyendo un punto de inserción corriente;
medios para mostrar el documento de lengua fuente en la parte de pantalla de la traducción;
medios para comparar cada uno de la pluralidad de términos fuente del glosario de productos con los términos fuente en el documento de la lengua fuente;
medios de inserción para insertar un carácter adyacente al término fuente en el documento de la lengua fuente, en respuesta a cada comparación por el medio de comparación que produce una confrontación entre uno de los términos fuente en el documento de la lengua fuente y uno de los términos fuente en el glosario de productos;
medios para asociar en un fichero de índice el carácter insertado con un término meta del glosario de productos que traduce el término fuente correspondiente de la lengua fuente a la lengua meta;
medios para introducir un comando del término meta insertado conteniendo un carácter que requiere la traducción correspondiente al carácter insertado;
medios para recuperar el carácter que requiere la traducción del comando del término meta insertado;
medios para recuperar del fichero de índice el término meta asociado con el carácter que requiere la traducción recuperado; y
medios para insertar el término meta recuperado en la parte de pantalla de la traducción en respuesta al comando del término meta insertado.
EP-A-0176858 (SHARP KK) Abril 1986, describe un sistema de traducción que realiza una traducción desde una primera lengua hacia una segunda lengua bajo un modo de interacción entre dicho sistema de traducción y un operador, comprendiendo medios para introducir una frase fuente que debe ser traducida, medios para traducir la frase de entrada de dicha primera lengua en frase de salida de dicha segunda lengua, donde el operador introduce información relacionada a al menos una palabra de la frase de entrada realizándose entonces la traducción en base a dicha información de entrada.
Inconvenientes de la técnica anterior
Los inconvenientes de la técnica anterior consisten sustancialmente en que no permiten al operador alcanzar un rendimiento operacional adecuado, incluso en la última solución EP-A-0176858 (SHARP KK), en la que el operador identifica primero la calificación de las palabras de la frase de entrada realizándose entonces la traducción.
Objetivo de la presente invención
El objetivo de la presente invención es el de evitar los inconvenientes anteriormente mencionados.
Descripción de la invención
El problema es resuelto por un método de traducción automática según la reivindicación 1.
Ventajas de la invención
Existe la ventaja de dar al operador la posibilidad de aplicar progresivamente durante la misma traducción no sólo las palabras o las frases repetitivas y comunes como en los sistemas conocidos de la técnica anterior, sino también fragmentos de frases, que gracias al código de calificación correspondiente dado por el operador se insertarán y serán idóneamente automodificados en la siguiente frase de traducción.
Así, debido a la repetición de expresiones en la traducción de documentos, el sistema pasa automática y rápidamente a las siguientes traducciones proporcionando, después del primer texto traducido, modificaciones, gracias a dicho proceso de autoaprendizaje de correcciones (FM1-FM2, FM3) con dicho código de calificación (FM4), dando como resultado un nivel de traducción de alta calidad.
Las pruebas realizadas dieron tales sorprendentes resultados que incluso después de sólo una pequeña traducción los errores en cada frase se redujeron al mínimo casi inmediatamente alcanzando el valor medio de error/frase comprendido entre 1 y 2, alcanzando luego el valor >1 de error/frase.
Características preferidas
Se proporcionan las características siguientes:
AA. Medios que proporcionan al menos tres líneas de control y de entrada:
\bullet
la primera superior como frase que debe ser traducida/parte de frase correspondiente a la corrección (entrada);
\bullet
la segunda como frase traducida/parte de frase corregida;
\bullet
la tercera como una línea para introducir el código de calificación correspondiente a la corrección.
\bullet
ventajosamente se proporciona la presencia de una línea que, mediante una serie de números, indica cómo se ha obtenido la composición de la frase, para palabras únicas y fragmentos de frase, permitiendo así al operador conocer cómo encontró el sistema las fuentes de traducción (palabras individuales combinadas con fragmentos de frase).
Así, existe la ventaja de operar rápidamente y con la máxima velocidad, con la posibilidad de llevar a cabo un control adecuado antes de la introducción.
BB. Una interfaz de traducción comprendiendo al menos dos campos verticalmente desplazables en paralelo; adyacentes y colocados el uno junto al otro, uno para el documento que debe ser traducido y uno para la traducción, el sistema de traducción teniendo medios adicionales que:
\bullet
permiten la variación simultánea de tamaño de ambos campos, uno para el texto que debe ser traducido y uno para el texto traducido, y
\bullet
mantienen los dos campos a la misma altura;
\bullet
permiten desplazar los dos campos en paralelo y simultáneamente;
\bullet
ajustan la anchura de ambos campos en proporción a la longitud de los dos documentos: el original (texto de entrada) y la traducción (salida o texto meta). Así se obtiene la gran ventaja de ser capaz de controlar y corregir la traducción comparándola, sustancialmente alineada con el original.
CC. Durante la visualización de una ventana de traducción interactiva,
\bullet
un control que, después de seleccionar una palabra o parte de frase que debe ser traducida en la ventana, habilita la consulta de un diccionario paralelo que sugiere traducciones alternativas de la palabra seleccionada. Así se da al operador la posibilidad de consultar en línea un respectivo diccionario de consulta:
\bullet
un control para detener la traducción interactiva en proceso, que almacena en acumulación en un par de campos separados:
-
la parte ya traducida y corregida y
-
la parte correspondiente del documento que tenía que ser traducido (texto de entrada),
y cuando se realiza esta detención, ésta es para:
-
dejar sólo lo que queda de la parte aún no traducida en el campo de la traducción en proceso (campo de salida meta), para recuperarla y
-
traducir la última frase aún no corregida correspondiendo a la primera frase de la parte de la traducción aún no traducida, que en ese momento estaba en la ventana interactiva para el control y corrección.
Así es posible:
-
interrumpir una traducción interactiva sin perder nada de lo que fue previamente traducido correctamente, y además,
-
intervenir en la postcorrección (postedición) con el sistema actuando tanto en la parte en dicho campo de entrada como en el recién traducido (en dicho campo meta de salida).
Así es posible almacenar todas las correcciones hechas más tarde (postedición), permitiendo utilizarlas nuevamente en las siguientes traducciones, según la característica siguiente.
DD. Medios para realizar la postcorrección después de la traducción automática completa del texto, en el campo de la traducción concretamente en el campo de salida meta; mediante medios que:
\bullet
localizan la posición del cursor en el área de corrección o de otra forma si una parte está almacenada poniéndola de relieve; el número de frases y palabras correspondientes del documento traducido son calculados automáticamente y,
\bullet
para mantener absolutamente las posiciones de puntuación, éstos proporcionan en una ventana de la pantalla:
-
la parte de frase previamente puesta de relieve en la zona de corrección o toda la frase de referencia localizada por la presencia del cursor desde la última corrección y
-
la frase correspondiente del documento que debe ser traducido, para permitir al operador:
I-
delimitar marcando el fragmento de frase correspondiente que debe ser corregido y
II-
proporcionar un código de calificación correspondiente para el almacenamiento, operando sustancialmente de un modo parecido al efectuado durante la traducción interactiva.
EE. En la parte superior de dicho par de campos, se proporciona una barra de control en forma de "T" donde la parte superior de la "T" corresponde a la barra de control que comprende una combinación de botones y la barra vertical de la "T" separa el campo de la derecha del campo de la izquierda de dicho par de campos.
FF. Considerando que los escáneres están siempre separados del ordenador y considerando que este hecho viene determinado por la dimensión del escáner y por la imposibilidad práctica de manipular hojas dentro del mismo ordenador, se pensó asociar al proprio ordenador un escáner integrado en el alojamiento del ordenador, y evitar dicha dimensión de la manipulación de las hojas de papel que deben ser leídas, de forma innovadora se pensó adoptar la entrada y la salida de la hoja de papel lateralmente, el todo asociado a un sistema OCR de reconocimiento de caracteres. De esta manera el documento de papel que debe ser traducido es automáticamente cargado en la máquina y en el sistema de traducción para un posible control, rectificación y posterior traducción. El resultado de esta estructura sustancialmente conlleva la posibilidad de integrar el escáner en el ordenador mismo y en consecuencia una mejora sensible del tiempo total para realizar la traducción de un documento en papel.
GG. Usando este ventajoso e innovador sistema es posible aplicar también una impresora en el lado opuesto al escáner.
Descripción de al menos una forma de realización de la invención
Estas y otras ventajas resultarán evidentes de la lectura de la siguiente descripción de una solución preferida, con la ayuda de los dibujos anexos, cuyos detalles no tienen que ser considerados limitativos sino sólo proporcionados como ejemplos.
La Figura 1 es una vista del ordenador de traducción.
La Figura 2 es una vista en sección del cuerpo de escáner insertado en el alojamiento del ordenador.
La Figura 3 es una vista esquemática del diagrama de bloques de la estructura del ordenador y un sistema de trabajo como en las figuras precedentes.
La Figura 4 es una vista de la imagen que aparece en la pantalla durante la traducción interactiva y de la ventana, para el control, la corrección y el autoaprendizaje de la parte relacionada con la corrección.
La Figura 5 es una visualización de la traducción completada, para el control final y la siguiente eventual postcorrección (postedición).
Las Figuras 6 a 11 se refieren a una serie de fases sucesivas del proceso de traducción en el modo interactivo-automático, utilizando un módulo en el caso específico, uno bidireccional, reincorporado por el sistema de gestión principal multilingüe (Figura 4-5) módulo bidireccional "Inglés-Italiano-Inglés". Aunque hay una pluralidad de estos módulos según las combinaciones posibles entre las diferentes lenguas y estando éstos reincorporados cada vez por el sistema principal, cada módulo puede operar también individualmente sin la asistencia del sistema de gestión o gestión principal.
La Figura 12 representa el dispositivo de almacenamiento de las nuevas palabras enseñadas y los fragmentos de frase codificados durante la operación de corrección interactiva.
La Figura 13 representa el dispositivo de elección del sector de trabajo dividido en una pluralidad de dominios del 1 al 33 con una opción personalizable 34 estando seleccionado en el caso específico el sector 10 (electrónica).
En el caso de las figuras 4 y 5 se ha indicado para simplificar sólo una frase, pero es evidente que al ser los campos desplazables, el documento que debe ser traducido puede ser de múltiples páginas.
Según las figuras y en particular en referencia a la Figura 1 se observa que el ordenador 1 tiene una caja de sobremesa de forma paralelepípeda con una entrada frontal para discos, CD etc. (11); una entrada lateral según la invención para el escáner (12) y una respectiva salida en el mismo lado (13) de la hoja escaneada.
La salida de las hojas impresas con alimentación del mismo papel en el lado del escáner (12) puede estar provista en el otro lado (lado opuesto) o con alimentación por un cajón subyacente extraible siempre en el lado.
El ordenador 1 obviamente está provisto de medios para formar un elemento operativo completo con el teclado 2, el ratón 3 y el monitor o la pantalla 4 tradicional o "LCD" u otra equivalente.
El grupo de escáner (122) está integrado en el alojamiento del ordenador (1) y está controlado por el botón pulsador (14), y en una versión simplificada, la hoja de papel (P) entra por el lado M1 y sale por el lado M2 para luego ser llevada por rodillos de transporte:
\bullet
en la solución de la Figura 1 con salida por el mismo lado mediante rotación de 180º, evitando así hacer pasar la hoja de papel por debajo o por encima de la tarjeta madre del procesador;
\bullet
en una solución alternativa con salida por el otro lado, donde un grupo de impresión por inyección de chorro de tinta de técnica conocida con la misma forma sustancial del escáner de la Figura 2 puede estar provista.
En tal caso es posible, usando el otro botón (15), cargar por el lado del escáner (12) una hoja de papel blanca "P" haciéndola salir impresa por el lado opuesto.
No se ilustra el grupo de impresión por ser de técnica conocida y sustancialmente similar a aquel del escáner donde en el lugar de la unidad de escáner (127) se instala una unidad de impresión (por ej. una de chorro de tinta o una térmica).
En particular el grupo de escáner (121) es del tipo estático y protegido en un alojamiento (122), y la hoja es hecha correr dentro de éste (P) entrando por un lado (M1) y saliendo por el otro (M2).
Para ello se provee un motor paso a paso controlado por el ordenador (15-PC-CPU) o procesador separado ((14-OCR-CPU - 123), que es accionado por el botón de control externo al ordenador (14).
El motor (123) empuja mediante una correa 124 respectivos rodillos de tracción de papel (125), colocados a lo largo del eje de soporte transversal (125') y operando por medio de contrarrodillos locos (126), en un alojamiento opuesto que se puede abrir (126) para el control y una eventual extracción de las hojas atascadas durante el avance.
Un prensador de papel 127 está provisto en el alojamiento opuesto inferior (126) para comprimir el papel de avance contra la unidad lineal de escáner de técnica conocida (127) que incluye el dispositivo de iluminación y el dispositivo para enviar la lectura al respectivo procesador (14-OCR-CPU) o de forma alternativa más simplemente al mismo procesador del ordenador (15-PC-CPU) donde a través del conocido programa OCR la lectura es capturada y transformada en texto "WP" para la traducción o en caso de un dibujo, guardado separadamente en una carpeta para guardar documentos escaneados (OCR o no).
La estructura del nuevo ordenador de traducción o estación de traducción o banco de traducción, en consecuencia preferiblemente incluye dichas características y al menos (véase Figura 3):
- en la caja paralelepípeda de sobremesa (1):
\bullet
un procesador central (15-PC-CPU) con respectiva tarjeta de gestión y control que está conectado a:
Memoria (RAM 16);
Memoria de disco duro (17-HDM);
Memorias extraibles tales como:
-
discos de memoria magnéticos (18-FDD)
-
discos de memoria ópticos (19-CDD);
Todo incluye al menos un sistema o software OCR (121 - OCR), pudiendo adicional y preferiblemente proveer un segundo procesador para el tratamiento separado del escáner (14-OCR-CPU) que siempre controla el grupo de escáner (121).
Externamente, como ya se ha dicho, la tarjeta del procesador (15 - PC-CPU) se puede unir al teclado (2-KB), al ratón (3- MAUS), y a la pantalla (4-DIS).
En caso de presencia del segundo procesador "ordenador de doble procesador", un procesador servirá para la rutina normal de traducción (15-PC-CPU) y un procesador (14-OCR-CPU) funcionará en paralelo y en consecuencia será también capaz de intervenir en el almacenamiento mientras que continúa la traducción por el procesador principal.
Así es posible una sobreproducción del trabajo y mientras se traduce o trabaja con el ordenador en WP, se puede hacer también otro trabajo, por ejemplo escanear, imprimir y demás.
Volviendo a las Figuras 6 a 11 se puede observar que, en el caso específico se indica el módulo bidireccional "Inglés-Italiano-Inglés". Es capaz incluso de operar "autónomamente" y está indicado con F1, habiendo muchos de estos módulos, cada uno para la combinación de pares de lenguas y con la misma configuración de pares de campos paralelos adyacentes en forma de "T" con la barra de control colocada en la parte superior.
Las fases de traducción con autoaprendizaje interactivo son las siguientes:
a1.
Introducción del texto en Inglés en el campo de la izquierda de la manera deseada (importación del texto, copiar y pegar, escritura o también procedente del sistema de escaneo automático mediante el sistema de identificación de caracteres (121-OCR), elección del modo de traducción interactiva (calidad total ) pulsando la tecla TQ y comienzo de la traducción;
a2.
Tras la traducción automática de la primera frase, dicha ventana interactiva 46 aparece automáticamente indicando (F1- Figura 6):
-
en la primera línea una fila de números que indica en el caso específico que la frase ha sido traducida palabra por palabra (1*4=4), no habiendo encontrado partes de frases memorizadas anteriormente (en el caso de la Figura 4, en cambio, la frase más larga tenía el número de línea 1*3+6+1*1+3+3 que significa = las tres primeras palabras traducidas individualmente, luego una secuencia de 6 palabras traducidas, luego una única palabra y luego dos secuencias de 3 palabras cada una. El puzzle así construido ha proporcionado la frase resultante que, como se puede observar, es de calidad aceptable;
-
en la segunda línea la frase que es traducida (frase de entrada);
-
en la tercera línea la frase automáticamente traducida que debe ser controlada por el operador.
a3.
(Ref. F2) El operador realiza la corrección de la parte de frase no aceptada (suministrada por el sistema del ordenador = sistema de procesamiento) que es marcada (4631 F2- Figura 7);
a4.
(Ref. F3) El operador tiene o la posibilidad de seguir, pulsando "OK" (464), o bien de salir pulsando "Cancel" (465):
-
si pulsa "Cancel" el sistema bien opcionalmente pregunta si quiere consultar una de las palabras en curso de traducción (de entrada) para proporcionar alternativas de traducción o detiene la traducción acumulando lo traducido en un acumulador;
-
si pulsa "OK" la ventana de F3-Figura 8 aparece donde se puede observar que en la línea 2 sólo aparece el fragmento de la frase corregida y pide adaptar (delimitar) la parte de frase correspondiente original (entrada) según la línea 2, proponiendo en una tercera línea un código de calificación;
a5.
(Ref.F4) Marcar (identificar, por ejemplo, seleccionando) la parte, el fragmento correspondiente de la frase en curso de traducción (básicamente la frase de entrada 4621-F4) en la primera línea y pulsar "OK" (F4- Figura 9);
a6.
Figura 10 (Ref. F5) aparece en tres líneas donde el operador debe controlar la enseñanza (4621-4631), en el caso específico él corrige de "sofs" (automáticamente suministrado por el procesador porque termina en "a")= sustantivo singular femenino en "soms" = sustantivo singular masculino (4632), y pulsando "OK" (464) la enseñanza es automáticamente guardada en la memoria interactiva (FM Figura.12), que incluye:
-
el campo de la primera palabra del fragmento para la búsqueda (FM1), el campo de la parte de fragmento que sigue a la primera palabra (FM2), el campo de la traducción (FM3, el campo del código de calificación (FM4), estando además proporcionado un campo de personalización (FM5), en función del sector elegido o del dominio de trabajo (DM);
a7.
Figura 11 (Ref.F6), la frase completa y perfectamente traducida y controlada aparece en el campo de la izquierda y la ventana interactiva aparece nuevamente proponiendo al traductor el control de la siguiente frase y así sucesivamente.
Con este sistema se descubrió:
-
una traducción prácticamente perfecta controlada y corregida por el operador;
-
una enseñanza progresiva de los fragmentos de frase relacionados a las correcciones evitando que el ordenador repita los errores anteriores;
-
el tiempo de traducción se reduce enormemente, superando el 50% y con calidad máxima.
En caso del TQ = sistema de "calidad total" (del inglés "Total Quality"), no se encontraron más errores considerables (como por ejemplo con la repetición de buenas traducciones como en la ventana de la Figura 11, será posible elegir la traducción automática y la postcorrección ="postedición", donde siempre será posible memorizar con el mismo método las respectivas correcciones.
En la solución preferida el escáner (121) está sustancialmente colocado en el lado y dispuesto para un trayecto de la hoja sustancialmente alrededor de la cabeza de escáner (127), haciendo que la hoja en curso de escaneado (P) siga un trayecto sustancialmente en "C" para entrar y salir por el mismo lado (P), en el lado del ordenador, girando alrededor de la cabeza de escáner (127). De esta manera se tiene la gran ventaja de poder extraer el cuerpo central del grupo de escáner (122) que para ello está lateralmente incluido dentro del alojamiento en "C" (126), para llevar fácilmente a cabo el mantenimiento y extraer una hoja eventualmente atascada.
De hecho el ordenador se caracteriza por el hecho de que dicho grupo de escáner (121) tiene un alojamiento sustancialmente en "C" como guía de papel (P) el cual se introduce y extrae lateralmente, externo (126), donde el grupo interno (122) contiene la cabeza de lectura (127) y el sistema de avance de papel (123-124/124'/124''-125).

Claims (4)

1. Método de traducción automática para ser usado en un sistema de traducción automática que tiene un medio de ventana interactiva permitiendo al usuario introducir información relacionada a una parte determinada de la frase de entrada que debe ser traducida y dos campos desplazables (455, 456) uno para el texto que debe ser traducido y uno para el texto traducido, comprendiendo las fases siguientes:
a)
después de la traducción automática de la frase, dicho sistema de traducción presenta automáticamente al operador una primera ventana interactiva (46) con al menos:
-
en una línea la frase de entrada (462);
-
en otra línea la traducción automática que debe ser controlada por el operador (463);
b)
en la ventana (46) el operador realiza la corrección de la traducción, seleccionando el fragmento de la frase que incluye dicha corrección (4631);
c)
el sistema de traducción proporciona una ventana adicional mostrando:
-
dicha frase de entrada (462);
-
el fragmento de la traducción previamente seleccionado que incluye la corrección realizada (463);
-
un código de calificación de la función de sintaxis propuesta (4632, FM4) en referencia a dicho fragmento (4632);
d)
en la misma ventana, el operador selecciona la parte correspondiente en dicha frase de entrada donde él quiere introducir dicha información (4621)
e)
el sistema de traducción proporciona una ventana adicional donde en las tres líneas el operador puede controlar dicha información (4621; 4631), corrigiendo, si es necesario, el código de calificación de la función de sintaxis (4632, FM4), almacenándolo automáticamente en una memoria interactiva (FM), para una reutilización automática en traducciones posteriores, al menos:
-
(I) un campo para la primera palabra de la parte del fragmento de entrada (4621, FM1),
-
(II) un campo para la parte del fragmento de entrada que sigue a dicha primera palabra de entrada (4621, FM2),
-
(III) un campo para la traducción corregida (4631, FM3),
-
(IV) un campo para dicho código de calificación (4632.FM4), donde dicho código de calificación (4632-FM4) es reutilizado en traducciones posteriores por el sistema de traducción automática como una instrucción para permitir que dicho fragmento de frase (4631) sea automáticamente automodificado según el contexto de la frase.
f)
la frase traducida y corregida, según la ha corregido el operador en dicha primera ventana en la fase anterior b) es introducida en el campo de texto traducido (456).
2. Método de traducción automática según la reivindicación 1, donde en la parte superior de los campos simultáneamente desplazables (455-456), está provista una barra de control en forma de "T" (451; 452; 454, ...) donde la parte superior de la "T" corresponde a la barra de control que comprende botones de control virtuales (451; 452;
454, ...), y la parte vertical de la "T" divide el campo de la derecha (456) del campo de la izquierda (455) de dicho par de campos desplazables simultáneamente (455-456).
3. Ordenador traductor automático (1), operativo según el método de traducción automática de la reivindicación 1, que comprende integrado en su alojamiento (1) un medio de escáner (121) asociado al sistema OCR para el reconocimiento de caracteres, el alojamiento del ordenador teniendo una ranura lateral (12) para introducir el papel que debe ser escaneado (P),
(ii)
- dicho escáner integrado (121) con un trayecto de hoja alrededor de una cabeza de escáner (127), haciendo que la hoja (P) siga un trayecto sustancialmente en forma de "C" de manera que entre y salga por el mismo lado del alojamiento del ordenador, el grupo interno (122) conteniendo la cabeza de lectura (127) y el sistema de avance de papel (123, 124, 124', 124'', 125) siendo lateralmente extraible,
el ordenador (1) teniendo un segundo procesador (14-OCR-CPU) para administrar dicho medio de escáner OCR y escáner (121), además de un procesador principal (15-PC-CPU) gestionando dicho sistema de traducción.
4. Ordenador traductor automático según la reivindicación anterior 3, que tiene integrado en su alojamiento un medio de impresión con ranura de salida (13) para el papel impreso (13) en el lateral del alojamiento.
ES99937822T 1998-03-03 1999-02-19 Sistema de traduccion y ordenador multifuncional, particularmente para tratar textos y traduccion en papel. Expired - Lifetime ES2251211T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
ITUD98A0032 1998-03-03
IT98UD000032A ITUD980032A1 (it) 1998-03-03 1998-03-03 Sistema di traduzione a macchina e rispettivo tradsistema di traduzione a macchina e rispettivo traduttore che comprende tale sistema uttore che comprende tale sistema

Publications (1)

Publication Number Publication Date
ES2251211T3 true ES2251211T3 (es) 2006-04-16

Family

ID=11422594

Family Applications (1)

Application Number Title Priority Date Filing Date
ES99937822T Expired - Lifetime ES2251211T3 (es) 1998-03-03 1999-02-19 Sistema de traduccion y ordenador multifuncional, particularmente para tratar textos y traduccion en papel.

Country Status (8)

Country Link
US (1) US6937974B1 (es)
EP (1) EP1058896B1 (es)
AT (1) ATE303633T1 (es)
AU (1) AU3272499A (es)
DE (1) DE69927000T2 (es)
ES (1) ES2251211T3 (es)
IT (1) ITUD980032A1 (es)
WO (1) WO1999045476A1 (es)

Families Citing this family (53)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2781964A1 (fr) * 1998-07-28 2000-02-04 Sylvie Massoni Pythoud Dispositif comprenant un systeme emetteur-recepteur a fibres optiques memorisees et numerisees permettant la traduction electronique automatique et instantanee autant sur support oral que supports ecrits par exemples telephonie, fax
IT1315160B1 (it) 2000-12-28 2003-02-03 Agostini Organizzazione Srl D Sistema e metodo di traduzione automatica o semiautomatica conposteditazione per la correzione degli errori.
US20020143823A1 (en) * 2001-01-19 2002-10-03 Stevens Mark A. Conversion system for translating structured documents into multiple target formats
US20030101044A1 (en) * 2001-11-28 2003-05-29 Mark Krasnov Word, expression, and sentence translation management tool
JP4050950B2 (ja) * 2002-07-26 2008-02-20 富士通株式会社 対訳候補表示装置および対訳候補表示プログラム
US20050216251A1 (en) * 2004-03-24 2005-09-29 Dorius Kirk D Bi-lingual language display and method
US20060083431A1 (en) * 2004-10-20 2006-04-20 Bliss Harry M Electronic device and method for visual text interpretation
AU2006219600A1 (en) * 2005-03-03 2006-09-08 Barend Petrus Wolvaardt Language information system
JP4428266B2 (ja) * 2005-03-22 2010-03-10 富士ゼロックス株式会社 翻訳装置およびプログラム
US9588958B2 (en) 2006-10-10 2017-03-07 Abbyy Infopoisk Llc Cross-language text classification
US8078450B2 (en) * 2006-10-10 2011-12-13 Abbyy Software Ltd. Method and system for analyzing various languages and constructing language-independent semantic structures
US8145473B2 (en) 2006-10-10 2012-03-27 Abbyy Software Ltd. Deep model statistics method for machine translation
US9633005B2 (en) 2006-10-10 2017-04-25 Abbyy Infopoisk Llc Exhaustive automatic processing of textual information
US9645993B2 (en) 2006-10-10 2017-05-09 Abbyy Infopoisk Llc Method and system for semantic searching
US8195447B2 (en) * 2006-10-10 2012-06-05 Abbyy Software Ltd. Translating sentences between languages using language-independent semantic structures and ratings of syntactic constructions
US9471562B2 (en) 2006-10-10 2016-10-18 Abbyy Infopoisk Llc Method and system for analyzing and translating various languages with use of semantic hierarchy
US8548795B2 (en) * 2006-10-10 2013-10-01 Abbyy Software Ltd. Method for translating documents from one language into another using a database of translations, a terminology dictionary, a translation dictionary, and a machine translation system
US9235573B2 (en) 2006-10-10 2016-01-12 Abbyy Infopoisk Llc Universal difference measure
US9495358B2 (en) 2006-10-10 2016-11-15 Abbyy Infopoisk Llc Cross-language text clustering
US8892423B1 (en) 2006-10-10 2014-11-18 Abbyy Infopoisk Llc Method and system to automatically create content for dictionaries
US8214199B2 (en) * 2006-10-10 2012-07-03 Abbyy Software, Ltd. Systems for translating sentences between languages using language-independent semantic structures and ratings of syntactic constructions
US9053090B2 (en) 2006-10-10 2015-06-09 Abbyy Infopoisk Llc Translating texts between languages
US9892111B2 (en) 2006-10-10 2018-02-13 Abbyy Production Llc Method and device to estimate similarity between documents having multiple segments
US9984071B2 (en) 2006-10-10 2018-05-29 Abbyy Production Llc Language ambiguity detection of text
US9189482B2 (en) 2012-10-10 2015-11-17 Abbyy Infopoisk Llc Similar document search
US9047275B2 (en) 2006-10-10 2015-06-02 Abbyy Infopoisk Llc Methods and systems for alignment of parallel text corpora
DE102007003862A1 (de) 2007-01-25 2009-02-05 Anders, Klaus E., 26127 Oldenburg Verfahren zur interkulturellen mehrsprachigen Kommunikation unter Einbeziehung einer Plansprache
US8959011B2 (en) 2007-03-22 2015-02-17 Abbyy Infopoisk Llc Indicating and correcting errors in machine translation systems
US8326598B1 (en) 2007-03-26 2012-12-04 Google Inc. Consensus translations from multiple machine translation systems
US8812296B2 (en) 2007-06-27 2014-08-19 Abbyy Infopoisk Llc Method and system for natural language dictionary generation
US20090299732A1 (en) * 2008-05-29 2009-12-03 Nokia Corporation Contextual dictionary interpretation for translation
EP2300939A4 (en) * 2008-06-09 2016-03-30 Nat Res Council Canada METHOD AND SYSTEM FOR USING ALIGNMENT MEANS IN TRANSLATION MATCHING
US9262409B2 (en) 2008-08-06 2016-02-16 Abbyy Infopoisk Llc Translation of a selected text fragment of a screen
US20100107114A1 (en) * 2008-10-28 2010-04-29 Zachcial Slawomir In context web page localization
US8185373B1 (en) * 2009-05-05 2012-05-22 The United States Of America As Represented By The Director, National Security Agency, The Method of assessing language translation and interpretation
US8515977B2 (en) 2010-09-10 2013-08-20 International Business Machines Corporation Delta language translation
US8670973B2 (en) 2010-09-16 2014-03-11 International Business Machines Corporation Language translation reuse in different systems
US20120209589A1 (en) * 2011-02-11 2012-08-16 Samsung Electronics Co. Ltd. Message handling method and system
US9063931B2 (en) * 2011-02-16 2015-06-23 Ming-Yuan Wu Multiple language translation system
WO2012170817A1 (en) * 2011-06-10 2012-12-13 Google Inc. Augmenting statistical machine translation with linguistic knowledge
US8996351B2 (en) * 2011-08-24 2015-03-31 Ricoh Company, Ltd. Cloud-based translation service for multi-function peripheral
US8971630B2 (en) 2012-04-27 2015-03-03 Abbyy Development Llc Fast CJK character recognition
US8989485B2 (en) 2012-04-27 2015-03-24 Abbyy Development Llc Detecting a junction in a text line of CJK characters
US9519641B2 (en) * 2012-09-18 2016-12-13 Abbyy Development Llc Photography recognition translation
US8914395B2 (en) 2013-01-03 2014-12-16 Uptodate, Inc. Database query translation system
RU2592395C2 (ru) 2013-12-19 2016-07-20 Общество с ограниченной ответственностью "Аби ИнфоПоиск" Разрешение семантической неоднозначности при помощи статистического анализа
RU2586577C2 (ru) 2014-01-15 2016-06-10 Общество с ограниченной ответственностью "Аби ИнфоПоиск" Фильтрация дуг в синтаксическом графе
RU2596600C2 (ru) 2014-09-02 2016-09-10 Общество с ограниченной ответственностью "Аби Девелопмент" Способы и системы обработки изображений математических выражений
US9805028B1 (en) * 2014-09-17 2017-10-31 Google Inc. Translating terms using numeric representations
US9626358B2 (en) 2014-11-26 2017-04-18 Abbyy Infopoisk Llc Creating ontologies by analyzing natural language texts
US10664656B2 (en) * 2018-06-20 2020-05-26 Vade Secure Inc. Methods, devices and systems for data augmentation to improve fraud detection
US11604930B2 (en) 2019-09-27 2023-03-14 Konica Minolta Business Solutions U.S.A., Inc. Generation of translated electronic document from an input image by consolidating each of identical untranslated text strings into a single element for translation
US11429795B2 (en) * 2020-01-13 2022-08-30 International Business Machines Corporation Machine translation integrated with user analysis

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS57201958A (en) * 1981-06-05 1982-12-10 Hitachi Ltd Device and method for interpretation between natural languages
JPS59206985A (ja) * 1983-05-11 1984-11-22 Hitachi Ltd 機械翻訳方式
DE3587009T2 (de) * 1984-09-18 1993-05-06 Sharp Kk Uebersetzungssystem.
US5351189A (en) * 1985-03-29 1994-09-27 Kabushiki Kaisha Toshiba Machine translation system including separated side-by-side display of original and corresponding translated sentences
US4800522A (en) * 1985-05-14 1989-01-24 Sharp Kabushiki Kaisha Bilingual translation system capable of memorizing learned words
US5349368A (en) * 1986-10-24 1994-09-20 Kabushiki Kaisha Toshiba Machine translation method and apparatus
US5257187A (en) * 1986-11-28 1993-10-26 Sharp Kabushiki Kaisha Translation machine system
JPH0645357B2 (ja) * 1988-11-22 1994-06-15 日発モース株式会社 船外機のトップカウリング脱着装置
JPH02240769A (ja) 1989-03-14 1990-09-25 Canon Inc 自然言語文生成装置
JPH02249064A (ja) * 1989-03-22 1990-10-04 Oki Electric Ind Co Ltd 電子辞書
US5289375A (en) * 1990-01-22 1994-02-22 Sharp Kabushiki Kaisha Translation machine
FR2659461A1 (fr) * 1990-03-06 1991-09-13 Kis France Sa Dispositif de traduction automatique d'un document.
US5239272A (en) * 1990-03-09 1993-08-24 Eev Limited Electron beam tube arrangements having primary and secondary output cavities
JPH0589165A (ja) * 1991-09-30 1993-04-09 Toshiba Corp 機械翻訳システム
JP2968151B2 (ja) * 1993-06-17 1999-10-25 シャープ株式会社 機械翻訳装置
US5697789A (en) * 1994-11-22 1997-12-16 Softrade International, Inc. Method and system for aiding foreign language instruction
US6085162A (en) * 1996-10-18 2000-07-04 Gedanken Corporation Translation system and method in which words are translated by a specialized dictionary and then a general dictionary
US6408266B1 (en) * 1997-04-01 2002-06-18 Yeong Kaung Oon Didactic and content oriented word processing method with incrementally changed belief system
IL121457A (en) * 1997-08-03 2004-06-01 Guru Internat Inc Computerized dictionary and thesaurus applications
US6499015B2 (en) * 1999-08-12 2002-12-24 International Business Machines Corporation Voice interaction method for a computer graphical user interface
JP2001117920A (ja) * 1999-10-15 2001-04-27 Sony Corp 翻訳装置および翻訳方法、並びに記録媒体
US6304742B1 (en) * 2000-02-24 2001-10-16 Xerox Corporation Printer with superposed trays for print output and document handling

Also Published As

Publication number Publication date
DE69927000D1 (de) 2005-10-06
ATE303633T1 (de) 2005-09-15
EP1058896B1 (en) 2005-08-31
EP1058896A1 (en) 2000-12-13
DE69927000T2 (de) 2006-07-13
AU3272499A (en) 1999-09-20
ITUD980032A1 (it) 1998-06-03
WO1999045476A1 (en) 1999-09-10
US6937974B1 (en) 2005-08-30

Similar Documents

Publication Publication Date Title
ES2251211T3 (es) Sistema de traduccion y ordenador multifuncional, particularmente para tratar textos y traduccion en papel.
US7580828B2 (en) Automatic or semiautomatic translation system and method with post-editing for the correction of errors
US6219453B1 (en) Method and apparatus for performing an automatic correction of misrecognized words produced by an optical character recognition technique by using a Hidden Markov Model based algorithm
US5303150A (en) Wild-card word replacement system using a word dictionary
JP4404211B2 (ja) マルチリンガル翻訳メモリ、翻訳方法および翻訳プログラム
US6154579A (en) Confusion matrix based method and system for correcting misrecognized words appearing in documents generated by an optical character recognition technique
Eeg-Olofsson et al. Automatic grammar checking for second language learners-the use of prepositions
Habash et al. Using deep morphology to improve automatic error detection in Arabic handwriting recognition
Palmero Aprosio et al. Adaptive complex word identification through false friend detection
Burton Automated concordances and word indexes: The process, the programs, and the products
JPH08263478A (ja) 中国語簡繁体字文書変換装置
JPH06259424A (ja) 文書表示装置及び文書要約装置並びにディジタル複写装置
Yuretich et al. The Chronicle of Constantine Manasses.[Translated Texts for Byzantinists 6.]
ITUD20000051U1 (it) Computer multifunzione, particolarmente per trattamento testi e tradu zione da cartaceo
Htun et al. Statistical Machine Translation System Combinations on Phrase-based, Hierarchical Phrase-based and Operation Sequence Model for Burmese and Pa’O Language Pair
SKJÆRVØ Methodological questions in Old Persian and Parthian epigraphy
Sandrelli et al. Tagging a Corpus of Interpreted Speeches: the European Parliament Interpreting Corpus (EPIC).
ITUD990171A1 (it) Sistema e procedimento di correzione automatica e rispettivamacchina di trattamento automatico
JP2928515B2 (ja) 訳語出力装置
JPH06316116A (ja) 文字処理装置及びディジタル複写装置
Kawada et al. Linguistic error correction of Japanese sentences
Amano et al. What Should a Translation Work Bench Be Like?'
JP2520289B2 (ja) 認識方法、認識装置および同装置を有する情報装置
Back Bilingual dictionaries for learners
Kipfer Computer applications in lexicography—summary of the state‐of‐the‐art