DE60029732T2 - Phrase translation method and system - Google Patents

Phrase translation method and system Download PDF

Info

Publication number
DE60029732T2
DE60029732T2 DE60029732T DE60029732T DE60029732T2 DE 60029732 T2 DE60029732 T2 DE 60029732T2 DE 60029732 T DE60029732 T DE 60029732T DE 60029732 T DE60029732 T DE 60029732T DE 60029732 T2 DE60029732 T2 DE 60029732T2
Authority
DE
Germany
Prior art keywords
phrase
database
text
translation
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE60029732T
Other languages
German (de)
Other versions
DE60029732D1 (en
Inventor
Michel Gastaldo
Gregory Grefenstette
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xerox Corp
Original Assignee
Xerox Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xerox Corp filed Critical Xerox Corp
Application granted granted Critical
Publication of DE60029732D1 publication Critical patent/DE60029732D1/en
Publication of DE60029732T2 publication Critical patent/DE60029732T2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • G06F40/45Example-based machine translation; Alignment

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Description

Hintergrund der ErfindungBackground of the invention

1. Feld der Erfindung1. Field of the invention

Die Erfindung bezieht sich allgemein auf die Übersetzung von Ausdrücken von einer natürlichen Sprache in eine andere natürliche Sprache und insbesondere auf die Unterstützung eines Übersetzers, um die richtige Übersetzung für irgendeine Phrase zu erhalten.The This invention relates generally to the translation of terms of a natural language into another natural one Language and in particular to the assistance of a translator to the right translation for any To get phrase.

2. Beschreibung des Standes der Technik2. Description of the state of the technique

Jeder Übersetzer wird gemäß zwei Kriterien bewertet: Übersetzungsgeschwindigkeit und Übersetzungsqualität. Eine Schwierigkeit, welche beide dieser Kriterien beeinflusst, ist das Vorkommen eines Wortes oder einer Gruppe von Wörtern, welche den Übersetzter zögern lässt. Das Auffinden einer passenden Übersetzung kann zu einer zeitaufwändigen manuellen Suche ohne Garantie für ein Ergebnis führen.Every translator is evaluated according to two criteria: speed of translation and translation quality. A Difficulty affecting both of these criteria is that Occurrence of a word or group of words representing the translator hesitate leaves. Finding a suitable translation Can be a time-consuming manual Search without warranty for lead to a result.

Derzeit wurden mehrere Techniken entwickelt, um einen Übersetzer zu unterstützen. Eine dieser Techniken beinhaltet die Verwendung von Nachschlagen in einem kontextabhängigen Wörterbuch. Kontextabhängige Wörterbücher ermöglichen es, die Übersetzung eines Wortes entsprechend dessen Kontext zu bekommen. Diese Technik ist in dem Ausmaß möglicher Übersetzungen stark beschränkt, d. h. beim Nachschlagen in einem kontextabhängigen Wörterbuch wird der Übersetzer nur mit einer kleinen Anzahl von vorgeschlagenen Übersetzungen versorgt.Currently Several techniques have been developed to support a translator. A These techniques involve the use of lookups in one context-sensitive Dictionary. Allow contextual dictionaries it, the translation to get a word according to its context. This technique is to the extent of possible translations severely limited, d. H. looking up a contextual dictionary becomes the translator only with a small number of suggested translations provided.

Weiterhin gibt es vielsprachige Terminologiedatenbanken, welche auf Übersetzungen von vorakzeptierten Begriffen basieren. Diese Technik ist stark auf den Satz der vorgespeicherten Begriffe begrenzt und der Übersetzer wird beim Übersetzen von Ausdrücken, welche nicht Teil des Satzes der vorakzeptierten Begriffe sind, nicht unterstützt.Farther There are multilingual terminology databases, which rely on translations based on pre-accepted terms. This technique is strong on limited to the set of pre-stored terms and the translator will translate of expressions, which are not part of the set of pre-accepted terms, unsupported.

Eine weitere Technik basiert auf der Verwendung eines Übersetzungsspeichers, welcher bereits übersetzte Sätze speichert. Wenn ein Satz übersetzt werden muss, fragt das System die Datenbank ab und schlägt automatisch eine Übersetzung vor. Dieses System erfordert jedoch die Übereinstimmung vollständiger Sätze, selbst wenn die Überein stimmung unscharf sein kann, so dass diese Technik in ihrer Anwendbarkeit ebenso stark beschränkt ist.A further technique is based on the use of a translation memory, which already translated Saves sentences. When a sentence is translated the system queries the database and automatically suggests a translation in front. However, this system requires the match of complete sentences, even if the agreement may be out of focus, making this technique in its applicability equally limited is.

Eine weitere Übersetzungstechnik wurde vorgeschlagen durch M. Nagao, "A Framework of a Mechanical Translation between Japanese and English by Analogy Principle", Artificial and Human Intelligence (A. Elithorn and R. Banerji, Hrsg.), Elsevier Science Publishers, 1984, S. 173–180. Diese Technik beinhaltet ein Ausrichten und linguistisches Analysieren der Sätze für die Maschinenübersetzung. Die Analysebäume von jedem Paar von Sätzen werden ebenso ausgerichtet. Ein Nachteil dieser Technik besteht darin, dass viele Maschinenübersetzungssysteme die Durchführung einer Gesamtanalyse der übersetzten Sätze erfordert. Ein weiterer Nachteil besteht darin, dass Unterbäume ausgerichtet werden müssen, was eine erhebliche große Computerleistung erfordert.A further translation technique was proposed by M. Nagao, "A Framework of a Mechanical Translation between Japanese and English by Analogy Principle ", Artificial and Human Intelligence (A. Elithorn and R. Banerji, ed.), Elsevier Science Publishers, 1984, p. 173-180. This technique involves alignment and linguistic analysis the sentences for the Machine translation. The analysis trees from every pair of sentences are aligned as well. A disadvantage of this technique exists in that many machine translation systems the implementation an overall analysis of the translated Requires sentences. Another disadvantage is that subtrees have to be aligned, which a considerable big one Computer performance required.

Zusammenfassung der ErfindungSummary the invention

Die vorliegende Erfindung wurde in Anbetracht der vorstehenden Situation gemacht und hat ihr primäres Ziel darin, einen Übersetzer zu unterstützen, eine verbesserte Qualität des resultierenden Dokumentes zu erhalten.The The present invention has been made in view of the above situation made and has their primary The goal is a translator to support, an improved quality of the resulting document.

Es ist ein weiteres Ziel der vorliegenden Erfindung, zu einer kontrollierten Übersetzung beizutragen, um die teure manuelle Suche von unbekannten Ausdrücken zu vermeiden, wodurch Funktionalität bereitgestellt wird zusätzlich zu derjenigen der Verwendung eines Übersetzungsspeichers und von Terminologiedatenbanken.It Another object of the present invention is to provide a controlled translation contribute to the expensive manual search of unknown expressions too avoid thereby providing functionality will be added to that of using a translation memory and of Terminology databases.

Es ist noch ein weiteres Ziel der vorliegenden Erfindung, den Übersetzer mit einem einfach bedienbaren, effizienten und zuverlässigen Werkzeug auszustatten, welches in der Lage ist, auf die Anfrage des Übersetzers für eine Unterstützung schnell zu antworten.It is yet another object of the present invention, the translator with an easy-to-use, efficient and reliable tool to be able to equip which, at the request of the translator for one support to answer quickly.

Ein weiteres Ziel der vorliegenden Erfindung besteht darin, mit bestehender Technologie und Programmierwerkzeugen kompatibel zu sein.One Another object of the present invention is that with existing Technology and programming tools to be compatible.

Die vorstehenden Ziele werden durch Bereitstellen eines Verfahren zum Übersetzen einer Wortphrase aus einer ersten natürlichen Sprache in eine zweite natürliche Sprache gemäß Anspruch 1, eines Systems zum Übersetzen eines Eingabetextes von einer natürliche Quellsprache zu einer natürlichen Zielsprache gemäß Anspruch 8 und eines computerlesbaren Speichermediums, welches Instruktionen für ein Verfahren zum Übersetzen einer Wortphrase von einer ersten natürlichen Sprache in eine zweite natürliche Sprache gemäß Anspruch 9 erreicht. Ausführungsformen der Erfindung sind in den abhängigen Ansprüchen niedergelegt.The The above objects are achieved by providing a method of translating a word phrase from a first natural language to a second one natural Language according to claim 1, a system for translating an input text from a natural source language to a natural target language according to claim 8 and a computer-readable storage medium containing instructions for a method to translate a word phrase from a first natural language to a second natural language according to claim 9 reached. embodiments of the invention are in the dependent claims resigned.

Wenn man die Vorgehensweise der vorliegenden Erfindung nutzt, wird die Datenbank nach Phrasen indiziert. Extrahierte Wortphrasen indizieren unmittelbar ganze Textfragmente. In bevorzugten Ausführungen werden Substantivphrasen verwendet, um eine Satzdatenbank zu indizieren. Die extrahierten Substantivphrasen indizieren unmittelbar gesamte Sätze, wodurch die Überlegung von entsprechenden Untereinheiten in den übersetzten Sätzen dem Übersetzer überlassen wird. Daher wird keine Gesamtanalyse der übersetzten Sätze durchgeführt und Unterbäume zur Ausrichtung sind nicht notwendig.Using the approach of the present invention, the database is indexed for phrases. Extracted word phrases directly index whole text fragments. In preferred embodiments, noun phrases are used to index a sentence database. The extra noun phrases directly indicate complete sentences, leaving the consideration of corresponding subunits in the translated sentences to the translator. Therefore, no overall analysis of the translated sentences is performed and subtrees for alignment are not necessary.

Die Erfindung ist weiterhin in der Beziehung vorteilhaft, dass sie bereits übersetztes Material verwendet und in einer bevorzugten Ausführung dem Übersetzer Sätze präsentiert, welche die jeweilige Substantivphrase sowohl in der Quell- als auch in der Zielsprache präsentieren. Durch die Verwendung einer phrasenindizierten Satzdatenbank wird sowohl die Übersetzungsgeschwindigkeit als auch die Übersetzungsqualität verbessert.The Invention is further advantageous in the relationship that it already translated Material used and presented in a preferred embodiment the translator sentences containing the respective noun phrase present in both the source and target languages. By using a phrase-indexed sentence database both the translation speed as well as the translation quality improved.

Kurze Beschreibung der ZeichnungenShort description the drawings

Die beiliegenden Zeichnungen sind in die Beschreibung einbezogen und bilden einen Teil derselben, um verschiedene Ausführungen der vorliegenden Erfindung zu veranschaulichen. Diese Zeichnungen, zusammen mit der Beschreibung, dienen dazu, die Prinzipien der Erfindung zu erklären. Die Zeichnungen dienen ausschließlich dem Zweck, bevorzugte alternative Beispiele zu veranschaulichen, wie die Erfindung durchgeführt und verwendet werden kann und sind nicht dazu gedacht, die Erfindung nur auf die veranschaulichten und beschriebenen Ausführungen zu beschränken. Weitere Merkmale und Vorteile werden von der nachfolgenden und eingehenderen Beschreibung der verschiedenen Ausführungen der Erfindung offenbar, wie sie in den beiliegenden Zeichnungen veranschaulicht wird.The accompanying drawings are included in the description and form a part of it to different designs of the present invention. These drawings, together with the description, serve the principles of the invention to explain. The drawings are for the sole purpose of being preferred to illustrate alternative examples of how the invention is carried out and can be used and are not meant to be the invention only to restrict to the illustrated and described embodiments. Further Features and benefits are covered by the following and more in-depth DESCRIPTION OF THE VARIOUS VERSIONS OF THE INVENTION as illustrated in the accompanying drawings.

1 veranschaulicht ein Übersetzungssystem gemäß der Erfindung; 1 illustrates a translation system according to the invention;

2 ist ein Ablaufdiagramm und veranschaulicht den Prozess zur Erzeugung einer phrasenindizierten Satzdatenbank gemäß der Erfindung; 2 Fig. 10 is a flow chart illustrating the process of generating a phrase-indexed sentence database according to the invention;

3 und 4 sind Ablaufdiagramme und veranschaulichen den Übersetzungsprozess gemäß der vorliegenden Erfindung; 3 and 4 FIG. 13 are flowcharts illustrating the translation process according to the present invention; FIG.

5 veranschaulicht eine erste Ausführung einer Nutzerschnittstelle gemäß der Erfindung; 5 illustrates a first embodiment of a user interface according to the invention;

6 veranschaulicht die Verwendung von Unterphrasen; und 6 illustrates the use of subphrases; and

7 veranschaulicht eine zweite Ausführung einer Nutzerschnittstelle gemäß der Erfindung. 7 illustrates a second embodiment of a user interface according to the invention.

Eingehende Beschreibung der Erfindungincoming Description of the invention

Gemäß der Erfindung werden Wortphrasen zur Indizierung von Textfragmenten verwendet, welche eine primäre grammatikalische Einheit darstellen, welche mindestens einen Nebensatz einschließt.According to the invention word phrases are used to index text fragments, which is a primary one represent grammatical unit, which at least one subordinate clause includes.

Phrasen und Ausdrücke bestehen üblicherweise nur aus wenigen Wörtern, welche eine einzige Idee bezeichnen oder einen getrennten Abschnitt eines Satzes ausbilden. Insbesondere ist eine Phrase eine Gruppe von zwei oder mehr verknüpften Wörtern, und enthält kein Subjekt und Prädikat. Substantivphrasen sind Phrasen, welche entweder Substantive oder Pronomen enthalten. Substantive sind Wörter, welche als Namen eines Dings, einer Eigenschaft oder einer Aktion verwendet werden, welche im Verstand existieren oder ausgedacht werden. Pronomen sind Wörter, welche als Substitute für ein Substantiv verwendet werden. Daher sind Substantivphrasen beispielsweise "Straßentest", "Drucktestbetrieb für Kraftstoff" oder "Verbphrase". Im Gegensatz dazu sind Verbphrasen solche Phrasen, welche ein oder mehrere Verben, wie etwa "ausgebreitet" oder "angepasst worden" beinhalten.phrases and expressions usually exist just a few words, which designate a single idea or a separate section train a sentence. In particular, a phrase is a group of two or more linked words, and contains no subject and predicate. Noun phrases are phrases that are either nouns or Pronouns included. Nouns are words that are named as a name Dings, a property or an action can be used which exist in the mind or are thought up. Pronouns are words which as substitutes for to use a noun. Therefore, noun phrases are, for example, "road test", "pressure test operation for fuel "or" verb phrase ". In contrast to this are Verbphrases such phrases that contain one or more verbs, such as include "spread" or "adapted".

Im Unterschied zu einer Phrase ist ein Nebensatz eine Gruppe von Wörtern, welche ein Subjekt und ein Prädikat enthält, das bedeutet, Nebensätze sind syntaktische Konstruktionen, welche einen Teil eines Satzes ausbilden oder einen gesamten einfachen Satz aufbauen. Sätze sind grammatikalische Einheiten von einem oder mehreren Wörtern, welche eine minimale syntaktische Beziehung zu Wörtern beinhalten, welche diesem vorausgehen oder folgen, d. h. einen minimalen Sinn von Vollständigkeit und einer Einheit umfassen. Sätze drücken einen vollständigen Gedanken aus, etwa die Feststellung einer Tatsache, eine Frage, eine Instruktion oder ein Ausruf.in the Unlike a phrase, a subordinate clause is a group of words which a subject and a predicate contains that means clauses are syntactic constructions that form part of a sentence train or build an entire simple sentence. Sentences are grammatical units of one or more words which involve a minimal syntactic relationship with words that this precede or follow, d. H. a minimal sense of completeness and a unit. sentences to press a complete one Thinking out, about finding a fact, a question, an instruction or an exclamation.

Daher können Nebensätze und Sätze als primäre grammatikalische Einheiten definiert werden. Während Sätze Nebensätze und Phrasen umfassen können und Nebensätze Phrasen umfassen können, können Phrasen keine Nebensätze oder Sätze umfassen. Die bevorzugte Ausführung der Erfindung verwendet Substantivphrasen, um Sätze zu indizieren.Therefore can Subordinate clauses and sentences as primary grammatical units are defined. While sentences can include subordinate clauses and phrases and Subordinate clauses Phrases may include phrases no subordinate clauses or sentences include. The preferred embodiment The invention uses noun phrases to index sentences.

Mit nachfolgendem Bezug auf die Zeichnungen und insbesondere auf 1 umfasst das Übersetzungssystem gemäß einer bevorzugten Ausführung der Erfindung eine Steuereinheit 14, welche ein Computer von irgendeiner Art sein kann, wie etwa ein PC oder eine Workstation, beispielsweise betrieben durch ein herkömmliches Betriebssystem, wie etwa Windows NT oder UNIX. Auf der Steuereinheit 14 läuft die Softwareanwendung, welche durch eine Zeigeeinrichtung 12 oder eine Tastatur 13 unter Verwendung einer Anzeige 11 gesteuert werden kann. Die Schnittstellensoftware kann beispielsweise in Visual Basic geschrieben sein und die resultierende Anwendung kann ein OLE-Server sein, welcher unmittelbar in irgendeinen Code von Visual Basic oder C/C++ integriert sein kann. Der Fachmann wird jedoch würdigen, dass viele andere Arten der Implementierung ebenso möglich sind.With reference to the drawings and in particular to 1 The translation system according to a preferred embodiment of the invention comprises a control unit 14 , which may be a computer of some kind, such as a PC or a workstation, for example, operated by a conventional operating system, such as Windows NT or UNIX. On the control unit 14 running the software application, which by a pointing device 12 or a keyboard 13 using a message 11 can be controlled. For example, the interface software may be written in Visual Basic and the resulting application This can be an OLE server, which can be integrated directly into any Visual Basic or C / C ++ code. However, one skilled in the art will appreciate that many other types of implementation are equally possible.

Das Anwendungsprogramm, welches auf der Steuereinheit 14 läuft, hat Zugriff auf die Satzdatenbank 17, welche eine Access- oder Oracle-Datenbank sein kann und vorzugsweise unter Verwendung einer UNIX Workstation erzeugt wurde. Die Größe der Datenbank hängt von dem Anwendungsgebiet ab, in welchem das System verwendet wird. Es ist wiederum zu würdigen, dass viele andere Implementierungen möglich sind.The application program, which is on the control unit 14 is running, has access to the sentence database 17 , which may be an Access or Oracle database, preferably created using a UNIX workstation. The size of the database depends on the area of application in which the system is used. Again, it is worth noting that many other implementations are possible.

Die Satzdatenbank 17 speichert eine Vielzahl von Sätzen in Englisch als der Quellsprache und speichert ebenso den zu jedem englischen Satz entsprechenden Satz in Französisch als der Zielsprache. Die Satzdatenbank 17 schließt weiterhin einen Phrasenindex ein, welcher Information zu jeder Substantivphrase hält, welche in irgendeinem Satz der Datenbank gespeichert ist und die Sätze anzeigt, in welchen die jeweilige Substan tivphrase gefunden werden kann. Die auf der Steuereinheit 14 laufende Übersetzungssoftware hat weiterhin Zugriff auf den Phrasenextraktor 15, welcher die Substantivphrasen aus einem Eingabetext unter Verwendung komplexer linguistischer Algorithmen extrahiert. Eingabetext kann von irgendeiner Textquelle, wie etwa einem Speichermedium, Scannern, Nachrichten, Spracherkennung, etc. kommen.The sentence database 17 stores a plurality of sentences in English as the source language and also stores the sentence corresponding to each English sentence in French as the target language. The sentence database 17 further includes a phrase index holding information about each noun phrase stored in any sentence of the database and indicating sentences in which the respective noun phrase can be found. The on the control unit 14 running translation software still has access to the Phrase Extractor 15 which extracts the noun phrases from an input text using complex linguistic algorithms. Input text may come from any text source, such as a storage medium, scanners, messages, speech recognition, etc.

Mit nachfolgendem Bezug auf die 2, welche ein Ablaufdiagramm des Prozesses zur Erzeugung der phrasenindizierten Satzdatenbank 17 veranschaulicht, bezieht das System als erstes in den Schritten 21 und 22 ein in der Quellsprache geschriebenes Dokument und ein entsprechendes, in der Zielsprache geschriebenes Dokument. Daraufhin werden in dem Schritt 23 in dem Paar aus Quell- und Zieldokument, die Sätze ausgerichtet. Das Ausrichten der Sätze bedeutet die Erstellung einer Verknüpfung zwischen jedem Quellsatz und dem entsprechenden Zielsatz. Nachdem die Sätze ausgerichtet worden sind, werden die Substantivphrasen aus jedem der Quellsätze in Schritt 24 extrahiert und die extrahierten Substantivphrasen werden dem Phrasenindex der Satzdatenbank 17 zusammen mit der jeweiligen Information, welche den Satz betrifft, von welchem die Substantivphrase extrahiert wurde, hinzugefügt. Nachdem die extrahierten Substantivphrasen zu dem Phrasenindex in Schritt 25 hinzugefügt worden sind, wird in dem Schritt 26 eine Entscheidung getroffen, ob ein weiteres Paar von Quell/Zieldokumenten eingelesen werden soll. Wenn dies der Fall ist, kehrt der Prozess zur Erzeugung der Datenbank zu Schritt 21 zum Beziehen der Dokumente, zum Ausrichten der Sätze und zum Extrahieren und Speichern der Substantivphrasen zurück. Durch Wiederholen der Schritte 21 bis 26 für einen Satz von übersetzten Dokumentenpaaren wird eine umfassende Datenbank aufgebaut, welche eine große Anzahl von zusammengehörigen Substantivphrasen mit den Sätzen, welche dieselben beinhalten, gespeichert.With reference to the following 2 , which is a flow chart of the process for generating the phrase-indexed sentence database 17 The system first refers to the steps in FIG 21 and 22 a document written in the source language and a corresponding document written in the target language. Thereupon, in the step 23 in the pair of source and target documents, the sentences aligned. Aligning sentences means creating a link between each source sentence and the corresponding destination sentence. After the sentences have been aligned, the noun phrases from each of the source sentences in step 24 extracted and the extracted noun phrases become the phrase index of the sentence database 17 together with the respective information concerning the sentence from which the noun phrase was extracted. After the extracted noun phrases to the phrase index in step 25 will be added in the step 26 made a decision as to whether another pair of source / target documents should be read. If so, the process of creating the database returns to step 21 to retrieve the documents, align the sentences and extract and save the noun phrases. By repeating the steps 21 to 26 For a set of translated document pairs, a comprehensive database is built that stores a large number of related noun phrases with the sentences that contain them.

Wenngleich der Prozess in 2 im Zusammenhang mit der Erzeugung der phrasenindizierten Satzdatenbank 17 beschrieben worden ist, wird der Fachmann würdigen, dass der veranschaulichte Prozess ebenso jederzeit verwendet werden kann, um eine bestehende Datenbank durch Speichern von Sätzen und Substantivphrasen von neuen Dokumentenpaaren zu erweitern. Es ist weiterhin für den Fachmann offenbar, dass der Prozess des Erweiterns und Generierens der Datenbank im Zusammenhang mit Dokumenten beschrieben worden ist, dass derselbe aber ebenso auf der Basis von Dokumententeilen durchgeführt werden kann.Although the process in 2 in connection with the generation of the phrase-indexed sentence database 17 It will be appreciated by those skilled in the art that the illustrated process may also be used at any time to augment an existing database by storing sentences and noun phrases from new document pairs. It will also be apparent to those skilled in the art that the process of expanding and generating the database has been described in the context of documents, but that the same may be done on the basis of parts of documents as well.

In einer weiteren bevorzugten Ausführungsform der vorliegenden Erfindung werden nur diejenigen Dokumente für den Aufbau der Datenbank verwendet, welche in einem und demselben Fachgebiet liegen, z. B. Dokumente für die Autowartung. Durch diese Maßnahme wird die Anzahl der möglichen Übersetzungen für jede Substantivphrase verringert, so dass, wenn die Datenbank groß genug ist, die meisten Substantivphrasen indiziert sein werden und für nahezu alle Anfragen eine Übersetzung zur Verfügung stehen wird.In a further preferred embodiment The present invention will only those documents for the construction the database used, which are in the same field, z. Eg documents for the car maintenance. By this measure will be the number of possible translations for every Substantial phrase decreases, so if the database is big enough is, most noun phrases will be indexed and for almost all requests a translation to disposal will stand.

Mit nachfolgendem Bezug auf die 3 und 4, welche ein Ablaufdiagramm des Übersetzungsprozesses veranschaulichen, gibt der Nutzer den zu übersetzenden Text in Schritt 31 ein. Der Text wird daraufhin derart angezeigt, dass der Nutzer ein unbekanntes Wort oder Gruppe von Wörtern auswählen kann, z. B. durch doppeltes Anklicken auf dem Wort. Sobald im Schritt 32 ein Wort ausgewählt worden ist, extrahiert der Phrasenextraktor 15 im Schritt 33 alle möglichen Substantivphrasen, welche sich auf das ausgewählte Wort beziehen. Der Satz von möglichen Substantivphrasen wird daraufhin in der Anzeige 34 angezeigt und es wird eine der Substantivphrasen im Schritt 35 entweder automatisch oder auf Nutzeranfrage ausgewählt. In der Voreinstellung wird die längste der extrahierten Substantivphrasen ausgewählt, ohne die Notwendigkeit für eine Nutzerauswahl. Diese automatische Auswahl kann ebenso abhängig davon, ob die extrahierte Substantivphrasen in der Datenbank vorhanden sind, durchgeführt werden. In diesem Fall wird die längste (Unter-) Substantivphrase ausgewählt, die in der Datenbank vorhanden ist. In jedem Fall kann die Auswahl durch den Nutzer durchgeführt oder geändert werden.With reference to the following 3 and 4 , which illustrate a flowchart of the translation process, the user gives the text to be translated in step 31 one. The text is then displayed so that the user can select an unknown word or group of words, e.g. By double-clicking on the word. Once in step 32 a word has been selected, the phrase extractor extracts 15 in step 33 all possible noun phrases that refer to the selected word. The sentence of possible noun phrases will then appear in the ad 34 and it becomes one of the noun phrases in the step 35 either automatically or on user request selected. By default, the longest of the extracted noun phrases is selected without the need for user selection. This automatic selection may also be performed depending on whether the extracted noun phrases exist in the database. In this case, the longest (sub) noun phrase that exists in the database is selected. In any case, the selection can be made or changed by the user.

Die 5 zeigt ein Beispiel, wie die erwähnte Information dem Nutzer präsentiert wird. Bei einem fenstergestützten System zeigt die Steuereinheit 14 ein Fenster 51 an, in welchem eine Anzahl von Feldern gezeigt werden. Das durch Doppelklicken in Schritt 32 ausgewählte Wort wird in Feld 55 angezeigt. Im Feld 53 wird der Satz an möglichen Substantivphrasen, welche im Schritt 33 extrahiert worden sind, angezeigt. Aus diesem Satz von Substantivfragen hat der Nutzer im Beispiel der 5 die Substantivphrase "Straßentest ausgewählt, welche daraufhin im Feld 52 gezeigt wird.The 5 shows an example like the one mentioned te information is presented to the user. In a window-based system, the control unit shows 14 a window 51 in which a number of fields are shown. Double click in step 32 selected word is in box 55 displayed. in The Field 53 becomes the set of possible noun phrases used in step 33 have been extracted. From this set of noun questions, the user in the example of the 5 the noun phrase "street test is selected, which then appears in the box 52 will be shown.

Sobald der Nutzer eine der möglichen Substantivphrasen ausgewählt hat, fragt die Steuereinheit 14 die phrasenindizierte Satzdatenbank 17 im Schritt 41 ab. Da alle Sätze in der phrasenindizierten Satzdatenbank 17 direkt durch die Substantivphrase indiziert sind, kann das System alle Paare von Sätzen, welche durch die ausgewählte Substantivphrase indiziert sind, ohne irgendeine wesentliche Verzögerung aufspüren. Das System sortiert daraufhin in Schritt 42 die aufgespürten Satzpaare entsprechend ihrer Bezugsnähe zu dem Originalsatz. Zu diesem Zweck werden alte Substantivphrasen in dem Originalsatz des Eingabetextes und diejenigen in den aufgespürten Sätzen verglichen und die Bezugsnähe hängt daraufhin von der Zahl der gemeinsamen Substantivphrasen ab. Daher ist das System in der Lage, im Schritt 43 dem Nutzer alle Satzpaare zu präsentieren, wobei diejenigen Sätze zuerst kommen, welche dem zu übersetzenden Satz am nächsten sind. Ein Beispiel für einen angezeigten, sortierten Satz von gepaarten Sätzen ist in der 5 als Feld 54 dargestellt.Once the user has selected one of the possible noun phrases, the control unit asks 14 the phrase-indexed sentence database 17 in step 41 from. Because all sentences in the phrase-indexed sentence database 17 directly indexed by the noun phrase, the system can track all pairs of sentences indexed by the selected noun phrase without any significant delay. The system then sorts in step 42 the pair of sentences tracked according to their proximity to the original sentence. For this purpose, old noun phrases in the original sentence of the input text and those in the detected sentences are compared, and the closeness of reference depends on the number of common noun phrases. Therefore, the system is able to step in 43 to present to the user all sentence pairs, with those sentences coming first which are closest to the sentence to be translated. An example of a displayed, sorted set of paired sentences is shown in FIG 5 as a field 54 shown.

Im Schritt 44 der 4 wählt der Nutzer einen der angezeigten Sätze des Feldes 54 aus, welcher daraufhin in die Felder 56 und 57 kopiert wird, um dem Nutzer ein genaueres Studium der vorgeschlagenen Übersetzung zu ermöglichen. Sobald der Nutzer entschieden hat, dass das ausgewählte Paar der übersetzten Sätze für die Übersetzung des ausgewählten Wortes aus dem Eingabetext verwendet werden soll, extrahiert der Phrasenextraktor 15 im Schritt 45 aus dem ausgewählten Satzpaar die Übersetzung der Substantivphrase und setzt die übersetzte Substantivphrase automatisch in die Übersetzung des Eingabetextes ein.In step 44 of the 4 the user selects one of the displayed sentences of the field 54 out, which then in the fields 56 and 57 is copied to allow the user to study the proposed translation more closely. Once the user has decided that the selected pair of translated sentences should be used to translate the selected word from the input text, the phrase extractor extracts 15 in step 45 translate the noun phrase from the selected sentence pair and automatically insert the translated noun phrase into the translation of the input text.

Im Schritt 46 entscheidet der Übersetzer, ob eine weitere Substantivphrase übersetzt werden muss. Wenn dies der Fall ist, kehrt der Prozess zu Schritt 32 zurück und der Nutzer wählt ein weiteres unbekanntes Wort aus.In step 46 the translator decides if another noun phrase needs translating. If so, the process returns 32 back and the user selects another unknown word.

Mit nachfolgendem Bezug auf die 6, weiche den Betrieb in dem Feld 52 gemäß einer bevorzugten Ausführung veranschaulicht, wird die Fähigkeit des Systems gemäß der vorliegenden Erfindung beschrieben, mit Substantiv-Unterphrasen zu arbeiten. In dem Fall, in dem der Nutzer im Schritt 35 aus dem Feld 53 eine Substantivphrase auswählt, welche keinen Eintrag in dem Phrasenindex der Satzdatenbank 17 aufweist, sucht das System automatisch nach teilweise übereinstimmenden Substantivphrasen oder präsentiert dem Nutzer in dem Feld 61 und 62 eine Liste von Unterphrasen, aus welchen der Nutzer einen Eintrag für die Bearbeitung mit dem Übersetzungsprozess auswählen kann. Wenn man annimmt, dass kein Satz die Substantivphrase "Prüfoperationen für Kraftstoffdruck" enthält, kann der Nutzer die Unterphrase "Prüfung Kraftstoffdruck" im Feld 62 auswählen, für welche der Phrasenindex der Datenbank 17 einen Eintrag aufweisen kann.With reference to the following 6 , soft operation in the field 52 In accordance with a preferred embodiment, the ability of the system according to the present invention to work with substantive subphrases is described. In the case where the user in step 35 out of the field 53 selects a noun phrase that does not have an entry in the phrase index of the sentence database 17 The system automatically searches for partially matching noun phrases or presents the user in the field 61 and 62 a list of subphrases from which the user can select an entry for editing with the translation process. Assuming that no sentence contains the noun phrase "fuel pressure check operations", the user may enter the subphrase "fuel pressure check" in the box 62 select for which the phrase index of the database 17 may have an entry.

Das Übersetzungssystem gemäß der vorliegenden Erfindung wurde für eine Substantivphrasen-indizierte Satzdatenbank 17 beschrieben. In der bevorzugten Ausführung der 1 schließt das System weiterhin eine Terminologiedatenbank 16 ein, auf welche die Übersetzungsanwendung, welche auf der Kontrolleinheit 14 läuft, Zugriff hat. Sobald der Nutzer im Schritt 35 eine zu übersetzende Substantivphrase ausgewählt hat, fragt das System die Terminologiedatenbank im Schritt 36 ab. In dem Fall, in dem die Terminologiedatenbank eine Übersetzung der ausgewählten Substantivphrase einschließt, präsentiert das System dem Nutzer in Feld 78 der 7 die gefundene Übersetzung. Der Nutzer kann daraufhin entweder die aus der Terminologiedatenbank 16 gefundene Übersetzung bestätigen und in dem Feld 78 anzeigen, oder die vorgeschlagene, aus der phrasenindizierten Satzdatenbank 17 gefundene Übersetzung bestätigen und diese aus der im Feld 74 angezeigten Liste auswählen. Um den Nutzer weiterhin bei der Entscheidung, welche Übersetzung verwendet werden soll, zu unterstützen, wird die in der Terminologiedatenbank 16 aufgefundene Übersetzung in der Liste des Feldes 74 an jeder Stelle, wo dieselbe erscheint, hervorgehoben.The translation system according to the present invention was for a noun phrase-indexed sentence database 17 described. In the preferred embodiment of 1 the system continues to close a terminology database 16 one to which the translation application is based on the control unit 14 is running, has access. As soon as the user in step 35 The system asks the terminology database in step to select a noun phrase to translate 36 from. In the case where the terminology database includes a translation of the selected noun phrase, the system presents the user in box 78 of the 7 the found translation. The user can then either the from the terminology database 16 Confirm found translation and in the field 78 display, or the proposed, from the phrase-indexed sentence database 17 Confirm found translation and this from the box 74 select the displayed list. To further assist the user in deciding which translation to use, the one in the terminology database 16 found translation in the list of the field 74 wherever it appears highlighted.

Wie im Vorhergehenden beschrieben, weist die vorliegende Erfindung viele Vorteile auf, indem dieselbe eine Substantivphrasen-indizierte Satzdatenbank verwendet, in welcher Substantivphrasen unmittelbar ganze Sätze indizieren, wobei das Erkennen der entsprechenden Untereinheiten in dem übersetzten Satz dem Nutzer überlassen werden. Daher wird keine Gesamtanalyse für übersetzte Sätze durchgeführt. Trotzdem kann das System gemäß der Erfindung mit weiteren herkömmlichen Werkzeugen für die Übersetzung von Ausdrücken integriert werden, wie etwa beispielgestützte Maschinenübersetzung, kontextgebundenes Wörterbuchnachschlagen, vielsprachige Terminologiedatenbanken oder Übersetzungsspeicher. Durch die Bereitstellung einer Übersetzungsumgebung, welche phrasenindizierte Satzdatenbanken verwendet und durch Integration bestehender Technologien, wird jeder Übersetzer mit einer leistungsstarken, neuen Übersetzungshilfe versorgt.As described above, the present invention has many advantages in that it uses a noun phrase-indexed sentence database in which noun phrases directly index whole sentences, leaving the recognition of the corresponding subunits in the translated sentence to the user. Therefore, no overall analysis is performed on translated sentences. Nevertheless, the system according to the invention may be integrated with other conventional expressive translation tools, such as example-based machine translation, context-sensitive dictionary lookup, multilingual terminology databases, or translation memories. By providing a translation environment that uses phrase-driven sentence databases and integrating existing technologies, each translator is provided with a powerful new translation tool provides.

Wenngleich die Erfindung mit Bezug auf die bevorzugten physischen Ausführungen beschrieben worden ist, welche gemäß derselben aufgebaut sind, wird dem Fachmann offenbar sein, dass verschiedene Modifikationen, Abwandlungen und Verbesserungen der vorliegenden Erfindung im Licht der vorstehenden Lehren und im Bereich der anhängigen Ansprüche durchgeführt werden können, ohne vom Geist und beabsichtigten Umfang der Erfindung abzuweichen. Weiterhin wurden diejenigen Gebiete, für welche angenommen wird, dass der Fachmann darin bewandert ist, hier nicht beschrieben, um die hier beschriebene Erfindung nicht unnötig zu verdecken. Es ist beispielsweise nicht notwendig, auszudrücken, dass der Nutzer das ausgewählte Wort zu jedem Zeitpunkt durch Eintippen einer neuen Substantivphrase oder durch Auswählen eines weiteren Elementes der Unterphrasenliste ändern kann.Although the invention with reference to the preferred physical embodiments has been described, which are constructed according to the same is The skilled person will be apparent that various modifications, modifications and improvements of the present invention in light of the above Teachings and in the field of pending claims carried out can be without departing from the spirit and intended scope of the invention. Furthermore, those areas for which it is believed that the person skilled in the art is not described here to the not described here unnecessarily obscure. It is for example not necessary to express that the user selects the one Word at any time by typing in a new noun phrase or by selecting another element of the subphrase list.

Demgemäß soll verstanden werden, dass die Erfindung nicht durch die spezifisch veranschaulichten Ausführungsformen, sondern ausschließlich durch den Umfang der anhängigen Ansprüche begrenzt sein soll.Accordingly, it should be understood that the invention is not illustrated by the specific ones Embodiments, but exclusively by the scope of the pending claims should be limited.

Claims (9)

Ein Verfahren zur Übersetzung einer Wortphrase aus einer ersten natürlichen Sprache in eine zweite natürliche Sprache, wobei die Wortphrase eine Gruppe von zwei oder mehr verknüpften Wörtern ist, wobei das Verfahren die Schritte umfasst: Eingeben (31) eines Textes, der in der ersten Sprache geschrieben ist; Extrahieren (33) der Wortphrase aus dem Text; Abfragen (41) einer Datenbank (17) nach der extrahierten Wortphrase; die Datenbank (17) enthält Paare von Textfragmenten, wobei jedes Paar ein Textfragment der ersten Sprache und ein entsprechendes Textfragment der zweiten Sprache einschließt; die Textfragmente repräsentieren eine primäre grammatikalische Einheit, welche mindestens einen Nebensatz einschließt; wobei der Nebensatz eine Gruppe von Wörtern ist, welche ein Subjekt und ein Prädikat enthalten; und Erhalten (45) einer Übersetzung der extrahierten Wortphrase basierend auf einem der Paare von Textfragmenten, welches während des Schrittes zum Abfragen einer Datenbank (17) gefunden wurde, dadurch gekennzeichnet, dass der Schritt zum Abfragen (41) einer Datenbank (17) einen Phrasenindex der Datenbank verwendet; der Phrasenindex indiziert die Textfragmente durch Wortphrasen.A method of translating a word phrase from a first natural language to a second natural language, wherein the word phrase is a group of two or more linked words, the method comprising the steps of: inputting ( 31 ) of a text written in the first language; Extract ( 33 ) the word phrase from the text; Interrogate ( 41 ) of a database ( 17 ) after the extracted word phrase; database ( 17 ) contains pairs of text fragments, each pair including a first-language text fragment and a second-language text fragment; the text fragments represent a primary grammatical unit which includes at least one subordinate clause; wherein the subordinate clause is a group of words containing a subject and a predicate; and receive ( 45 ) a translation of the extracted word phrase based on one of the pairs of text fragments, which during the step of querying a database ( 17 ), characterized in that the step of querying ( 41 ) of a database ( 17 ) uses a phrase index of the database; the phrase index indexes the text fragments by word phrases. Das Verfahren gemäß Anspruch 1, wobei die Wortphrase eines Substantivphrase ist.The method according to claim 1, where the word phrase is a noun phrase. Das Verfahren gemäß Anspruch 1, wobei die Wortphrase eine Verbphrase ist.The method according to claim 1, where the word phrase is a verb phrase. Verfahren gemäß Anspruch 1, wobei die Wortphrase eine Prädikat ist, welches mindestens ein Verb und ein Substantiv oder Adjektiv einbezieht, welches als ein Substantiv verwendet wird.Method according to claim 1, wherein the word phrase is a predicate which is at least a verb and a noun or adjective which is used as a noun. Verfahren gemäß Anspruch 1, wobei der Schritt zum Erhalten einer Übersetzung den Schritt einschließt, einem Nutzer die aufgefundenen Paare von Textfragmenten zu präsentieren (43).The method of claim 1, wherein the step of obtaining a translation includes the step of presenting to a user the found pairs of text fragments ( 43 ). Das Verfahren gemäß Anspruch 1, wobei der Schritt zum Erhalten einer Übersetzung den Schritt einschließt, einem Nutzer vorgeschlagene Übersetzungen von extrahierten Wortphrasen zu präsentieren, basierend auf den aufgefundenen Paaren von Textfragmenten.The method according to claim 1, wherein the step of obtaining a translation includes the step User suggested translations of extracted word phrases based on the found pairs of text fragments. Verfahren gemäß Anspruch 5 oder 6, wobei der Schritt zum Erhalten einer Übersetzung weiterhin den Schritt umfasst, eine der aufgefundenen Übersetzungen durch den Nutzer zu bestätigen und die bestätigte Übersetzung als Übersetzung der extrahierten Wortphrase zu verwenden.Method according to claim 5 or 6, wherein the step of obtaining a translation further includes the step includes, one of the found translations to be confirmed by the user and the confirmed translation as a translation the extracted word phrase. Ein System zum Übersetzen eines Eingabetextes aus einer natürlichen Quellsprache in eine natürliche Zielsprache, wobei das System umfasst: eine Speichereinrichtung zum Speichern einer Datenbank (16, 17), welche eine Vielzahl von Paaren von Textfragmenten enthält; die Textfragmente repräsentieren eine primäre grammatikalische Einheit, welche mindestens einen Nebensatz einschließt; der Nebensatz ist eine Gruppe von Wörtern, welche ein Subjekt und ein Prädikat enthalten; jedes Paar enthält ein Textfragment in der Quellsprache und ein entsprechendes Textfragment in der Zielsprache, wobei jedes Textfragment mindestens eine Wortphrase enthält, wobei die Wortphrase eine Gruppe von zwei oder mehr verknüpften Wörtern ist; einen Phrasenextraktor (15) zum Extrahieren einer Wortphrase aus einem Textfragment des Eingabetextes; eine Datenbankabfrageeinrichtung (14) zum Abfragen von Paaren von Textfragmenten, welche die extrahierte Wortphrase enthalten, aus der Datenbank (16, 17); und eine Nutzerschnittstelleneinrichtung (11, 12, 13), die es einem Nutzer ermöglicht, eines der abgefragten Paare von Textfragmenten auszuwählen, um eine Übersetzung der extrahierten Wortphrase zu erhalten; dadurch gekennzeichnet, dass die Datenbankabfrageeinrichtung (14) Paare von Textfragmenten aus der Datenbank (16, 17) unter Verwendung eines Phrasenindex der Datenbank abfragt, wobei der Phrasenindex die Textfragmente durch Wortphrasen indiziert.A system for translating an input text from a natural source language into a natural target language, the system comprising: memory means for storing a database ( 16 . 17 ) containing a plurality of pairs of text fragments; the text fragments represent a primary grammatical unit which includes at least one subordinate clause; the subordinate clause is a group of words containing a subject and a predicate; each pair contains a textual fragment in the source language and a corresponding textual fragment in the target language, each textual fragment containing at least one word phrase, the word phrase being a group of two or more linked words; a phrase extractor ( 15 ) for extracting a word phrase from a text fragment of the input text; a database query facility ( 14 ) for querying pairs of text fragments containing the extracted word phrase from the database ( 16 . 17 ); and a user interface device ( 11 . 12 . 13 ) that allows a user to select one of the queried pairs of text fragments to obtain a translation of the extracted word phrase; characterized in that the database query device ( 14 ) Pairs of text fragments from the database ( 16 . 17 ) using a phrase index of the database, where the phrase index indexes the text fragments by word phrases. Ein computerlesbares Speichermedium, welches Instruktionen speichert für ein Verfahren zum Übersetzen einer Wortphrase aus einer ersten natürlichen Sprache in eine zweite natürliche Sprache durch die Ausführung der Schritte: Eingeben (31) eines Textes, der in der ersten Sprache geschrieben ist; Extrahieren (33) der Wortphrase aus dem Text, wobei die Wortphrase eine Gruppe von zwei oder mehr verknüpften Wörtern ist; Abfragen (41) einer Datenbank (17) nach der extrahierten Wortphrase; die Datenbank (17) enthält Paare von Textfragmenten, wobei jedes Paar ein Textfragment der ersten Sprache und ein entsprechendes Textfragment der zweiten Sprache einschließt; die Textfragmente repräsentieren eine primäre grammatikalische Einheit, welche mindestens einen Nebensatz einschließt; wobei der Nebensatz eine Gruppe von Wörtern ist, welche ein Subjekt und ein Prädikat enthalten; und Erhalten (45) einer Übersetzung der extrahierten Wortphrase basierend auf einem der Paare von Textfragmenten, welches während des Schrittes zum Abfragen einer Datenbank (17) gefunden wurde, dadurch gekennzeichnet, dass der Schritt zum Abfragen einer Datenbank (17) einen Phrasenindex der Datenbank verwendet; der Phrasenindex indiziert die Textfragmente durch Wortphrasen.A computer-readable storage medium storing instructions for a method of translating a word phrase from a first natural language to a second natural language by performing the steps of: inputting ( 31 ) of a text written in the first language; Extract ( 33 ) the word phrase from the text, wherein the word phrase is a group of two or more linked words; Interrogate ( 41 ) of a database ( 17 ) after the extracted word phrase; database ( 17 ) contains pairs of text fragments, each pair including a first-language text fragment and a second-language text fragment; the text fragments represent a primary grammatical unit which includes at least one subordinate clause; wherein the subordinate clause is a group of words containing a subject and a predicate; and receive ( 45 ) a translation of the extracted word phrase based on one of the pairs of text fragments, which during the step of querying a database ( 17 ), characterized in that the step of querying a database ( 17 ) uses a phrase index of the database; the phrase index indexes the text fragments by word phrases.
DE60029732T 1999-12-20 2000-12-19 Phrase translation method and system Expired - Lifetime DE60029732T2 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US466823 1999-12-20
US09/466,823 US6473729B1 (en) 1999-12-20 1999-12-20 Word phrase translation using a phrase index

Publications (2)

Publication Number Publication Date
DE60029732D1 DE60029732D1 (en) 2006-09-14
DE60029732T2 true DE60029732T2 (en) 2006-11-30

Family

ID=23853235

Family Applications (1)

Application Number Title Priority Date Filing Date
DE60029732T Expired - Lifetime DE60029732T2 (en) 1999-12-20 2000-12-19 Phrase translation method and system

Country Status (4)

Country Link
US (1) US6473729B1 (en)
EP (1) EP1111514B1 (en)
JP (1) JP4504555B2 (en)
DE (1) DE60029732T2 (en)

Families Citing this family (102)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6498921B1 (en) * 1999-09-01 2002-12-24 Chi Fai Ho Method and system to answer a natural-language question
US5836771A (en) * 1996-12-02 1998-11-17 Ho; Chi Fai Learning method and system based on questioning
AU2440100A (en) 1999-03-19 2000-10-09 Trados Gmbh Workflow management system
US20060116865A1 (en) * 1999-09-17 2006-06-01 Www.Uniscape.Com E-services translation utilizing machine translation and translation memory
US7389221B1 (en) * 2000-07-17 2008-06-17 Globalenglish Corporation System and method for interactive translation
US7660740B2 (en) 2000-10-16 2010-02-09 Ebay Inc. Method and system for listing items globally and regionally, and customized listing according to currency or shipping area
US6983240B2 (en) 2000-12-18 2006-01-03 Xerox Corporation Method and apparatus for generating normalized representations of strings
US20030083860A1 (en) * 2001-03-16 2003-05-01 Eli Abir Content conversion method and apparatus
US7860706B2 (en) 2001-03-16 2010-12-28 Eli Abir Knowledge system method and appparatus
US8874431B2 (en) * 2001-03-16 2014-10-28 Meaningful Machines Llc Knowledge system method and apparatus
US7689405B2 (en) * 2001-05-17 2010-03-30 Language Weaver, Inc. Statistical method for building a translation memory
US8214196B2 (en) 2001-07-03 2012-07-03 University Of Southern California Syntax-based statistical translation model
US7752266B2 (en) * 2001-10-11 2010-07-06 Ebay Inc. System and method to facilitate translation of communications between entities over a network
US20030101044A1 (en) * 2001-11-28 2003-05-29 Mark Krasnov Word, expression, and sentence translation management tool
AU2003269808A1 (en) 2002-03-26 2004-01-06 University Of Southern California Constructing a translation lexicon from comparable, non-parallel corpora
US7941348B2 (en) * 2002-06-10 2011-05-10 Ebay Inc. Method and system for scheduling transaction listings at a network-based transaction facility
US8078505B2 (en) 2002-06-10 2011-12-13 Ebay Inc. Method and system for automatically updating a seller application utilized in a network-based transaction facility
US8719041B2 (en) 2002-06-10 2014-05-06 Ebay Inc. Method and system for customizing a network-based transaction facility seller application
US7308399B2 (en) * 2002-06-20 2007-12-11 Siebel Systems, Inc. Searching for and updating translations in a terminology database
US7171351B2 (en) * 2002-09-19 2007-01-30 Microsoft Corporation Method and system for retrieving hint sentences using expanded queries
US7293015B2 (en) * 2002-09-19 2007-11-06 Microsoft Corporation Method and system for detecting user intentions in retrieval of hint sentences
US7194455B2 (en) * 2002-09-19 2007-03-20 Microsoft Corporation Method and system for retrieving confirming sentences
US9881308B2 (en) 2003-04-11 2018-01-30 Ebay Inc. Method and system to facilitate an online promotion relating to a network-based marketplace
US7742985B1 (en) 2003-06-26 2010-06-22 Paypal Inc. Multicurrency exchanges between participants of a network-based transaction facility
US8548794B2 (en) 2003-07-02 2013-10-01 University Of Southern California Statistical noun phrase translation
WO2005059771A1 (en) * 2003-12-15 2005-06-30 Laboratory For Language Technology Incorporated Translation judgment device, method, and program
US20100262621A1 (en) * 2004-03-05 2010-10-14 Russ Ross In-context exact (ice) matching
US7983896B2 (en) 2004-03-05 2011-07-19 SDL Language Technology In-context exact (ICE) matching
US8296127B2 (en) 2004-03-23 2012-10-23 University Of Southern California Discovery of parallel text portions in comparable collections of corpora and training using comparable texts
EP1733304A2 (en) * 2004-04-02 2006-12-20 Star AG Computer-assisted aid (dynamic linking) for a method for creating documents in a foreign-language
US8666725B2 (en) 2004-04-16 2014-03-04 University Of Southern California Selection and use of nonstatistical translation components in a statistical machine translation framework
US9189568B2 (en) 2004-04-23 2015-11-17 Ebay Inc. Method and system to display and search in a language independent manner
GB2415518A (en) * 2004-06-24 2005-12-28 Sharp Kk Method and apparatus for translation based on a repository of existing translations
JP5452868B2 (en) 2004-10-12 2014-03-26 ユニヴァーシティー オブ サザン カリフォルニア Training for text-to-text applications that use string-to-tree conversion for training and decoding
US8719244B1 (en) 2005-03-23 2014-05-06 Google Inc. Methods and systems for retrieval of information items and associated sentence fragments
US7937396B1 (en) * 2005-03-23 2011-05-03 Google Inc. Methods and systems for identifying paraphrases from an index of information items and associated sentence fragments
US8886517B2 (en) 2005-06-17 2014-11-11 Language Weaver, Inc. Trust scoring for language translation systems
US8676563B2 (en) 2009-10-01 2014-03-18 Language Weaver, Inc. Providing human-generated and machine-generated trusted translations
JP4234698B2 (en) * 2005-06-20 2009-03-04 富士通株式会社 Structured document processing system
US7653531B2 (en) * 2005-08-25 2010-01-26 Multiling Corporation Translation quality quantifying apparatus and method
US7937265B1 (en) 2005-09-27 2011-05-03 Google Inc. Paraphrase acquisition
US10319252B2 (en) 2005-11-09 2019-06-11 Sdl Inc. Language capability assessment and training apparatus and techniques
US20070162481A1 (en) * 2006-01-10 2007-07-12 Millett Ronald P Pattern index
US7644082B2 (en) * 2006-03-03 2010-01-05 Perfect Search Corporation Abbreviated index
US8266152B2 (en) * 2006-03-03 2012-09-11 Perfect Search Corporation Hashed indexing
US20080213734A1 (en) * 2006-04-02 2008-09-04 Steve George Guide Method for Decoding Pictographic Signs Present on Ancient Artifacts
US8943080B2 (en) 2006-04-07 2015-01-27 University Of Southern California Systems and methods for identifying parallel documents and sentence fragments in multilingual document collections
US8668146B1 (en) 2006-05-25 2014-03-11 Sean I. Mcghie Rewards program with payment artifact permitting conversion/transfer of non-negotiable credits to entity independent funds
US8684265B1 (en) 2006-05-25 2014-04-01 Sean I. Mcghie Rewards program website permitting conversion/transfer of non-negotiable credits to entity independent funds
US9704174B1 (en) 2006-05-25 2017-07-11 Sean I. Mcghie Conversion of loyalty program points to commerce partner points per terms of a mutual agreement
US10062062B1 (en) 2006-05-25 2018-08-28 Jbshbm, Llc Automated teller machine (ATM) providing money for loyalty points
US7703673B2 (en) 2006-05-25 2010-04-27 Buchheit Brian K Web based conversion of non-negotiable credits associated with an entity to entity independent negotiable funds
US7865352B2 (en) * 2006-06-02 2011-01-04 Microsoft Corporation Generating grammatical elements in natural language sentences
US8209163B2 (en) * 2006-06-02 2012-06-26 Microsoft Corporation Grammatical element generation in machine translation
US7725306B2 (en) * 2006-06-28 2010-05-25 Microsoft Corporation Efficient phrase pair extraction from bilingual word alignments
US20080027911A1 (en) * 2006-07-28 2008-01-31 Microsoft Corporation Language Search Tool
US8886518B1 (en) 2006-08-07 2014-11-11 Language Weaver, Inc. System and method for capitalizing machine translated text
US8639782B2 (en) 2006-08-23 2014-01-28 Ebay, Inc. Method and system for sharing metadata between interfaces
US8521506B2 (en) * 2006-09-21 2013-08-27 Sdl Plc Computer-implemented method, computer software and apparatus for use in a translation system
US8433556B2 (en) 2006-11-02 2013-04-30 University Of Southern California Semi-supervised training for statistical word alignment
US9122674B1 (en) 2006-12-15 2015-09-01 Language Weaver, Inc. Use of annotations in statistical machine translation
AU2007339735A1 (en) * 2007-01-04 2008-07-10 Thinking Solutions Pty Ltd Linguistic analysis
US8468149B1 (en) 2007-01-26 2013-06-18 Language Weaver, Inc. Multi-lingual online community
NZ553484A (en) * 2007-02-28 2008-09-26 Optical Systems Corp Ltd Text management software
US8615389B1 (en) 2007-03-16 2013-12-24 Language Weaver, Inc. Generation and exploitation of an approximate language model
US8831928B2 (en) 2007-04-04 2014-09-09 Language Weaver, Inc. Customizable machine translation service
US9779079B2 (en) * 2007-06-01 2017-10-03 Xerox Corporation Authoring system
US8825466B1 (en) 2007-06-08 2014-09-02 Language Weaver, Inc. Modification of annotated bilingual segment pairs in syntax-based machine translation
US8548791B2 (en) * 2007-08-29 2013-10-01 Microsoft Corporation Validation of the consistency of automatic terminology translation
US7774353B2 (en) * 2007-08-30 2010-08-10 Perfect Search Corporation Search templates
US7912840B2 (en) * 2007-08-30 2011-03-22 Perfect Search Corporation Indexing and filtering using composite data stores
US7774347B2 (en) * 2007-08-30 2010-08-10 Perfect Search Corporation Vortex searching
US8135574B2 (en) * 2007-11-15 2012-03-13 Weikel Bryan T Creating and displaying bodies of parallel segmented text
KR100917784B1 (en) * 2007-12-24 2009-09-21 한성주 Method and system for retrieving information of collective emotion based on comments about content
US8032495B2 (en) * 2008-06-20 2011-10-04 Perfect Search Corporation Index compression
US9262403B2 (en) 2009-03-02 2016-02-16 Sdl Plc Dynamic generation of auto-suggest dictionary for natural language translation
GB2468278A (en) 2009-03-02 2010-09-08 Sdl Plc Computer assisted natural language translation outputs selectable target text associated in bilingual corpus with input target text from partial translation
US9189475B2 (en) * 2009-06-22 2015-11-17 Ca, Inc. Indexing mechanism (nth phrasal index) for advanced leveraging for translation
US8990064B2 (en) 2009-07-28 2015-03-24 Language Weaver, Inc. Translating documents based on content
US8380486B2 (en) 2009-10-01 2013-02-19 Language Weaver, Inc. Providing machine-generated translations and corresponding trust levels
US10417646B2 (en) 2010-03-09 2019-09-17 Sdl Inc. Predicting the cost associated with translating textual content
WO2011127655A1 (en) * 2010-04-14 2011-10-20 Hewlett-Packard Development Company, L.P. Method for keyword extraction
KR101416098B1 (en) 2010-10-12 2014-07-09 한국전자통신연구원 Method and apparatus for learning translation knowledge by phrase
KR101356417B1 (en) * 2010-11-05 2014-01-28 고려대학교 산학협력단 Apparatus and method for contructing verbal phrase translation pattern using bilingual paraelle corpus
US9128929B2 (en) 2011-01-14 2015-09-08 Sdl Language Technologies Systems and methods for automatically estimating a translation time including preparation time in addition to the translation itself
US11003838B2 (en) 2011-04-18 2021-05-11 Sdl Inc. Systems and methods for monitoring post translation editing
US8694303B2 (en) 2011-06-15 2014-04-08 Language Weaver, Inc. Systems and methods for tuning parameters in statistical machine translation
US8886515B2 (en) 2011-10-19 2014-11-11 Language Weaver, Inc. Systems and methods for enhancing machine translation post edit review processes
CN103164390B (en) * 2011-12-15 2016-05-18 富士通株式会社 Document processing method and document processing device, document processing
CN102591859B (en) * 2011-12-28 2014-11-05 华为技术有限公司 Method and relevant device for reusing industrial standard formatted files
US8942973B2 (en) 2012-03-09 2015-01-27 Language Weaver, Inc. Content page URL translation
US10261994B2 (en) 2012-05-25 2019-04-16 Sdl Inc. Method and system for automatic management of reputation of translators
US9152622B2 (en) 2012-11-26 2015-10-06 Language Weaver, Inc. Personalized machine translation via online adaptation
US9183197B2 (en) 2012-12-14 2015-11-10 Microsoft Technology Licensing, Llc Language processing resources for automated mobile language translation
US9213694B2 (en) 2013-10-10 2015-12-15 Language Weaver, Inc. Efficient online domain adaptation
US10747419B2 (en) * 2015-09-25 2020-08-18 CSOFT International Systems, methods, devices, and computer readable media for facilitating distributed processing of documents
US11200217B2 (en) 2016-05-26 2021-12-14 Perfect Search Corporation Structured document indexing and searching
US10635863B2 (en) 2017-10-30 2020-04-28 Sdl Inc. Fragment recall and adaptive automated translation
US10817676B2 (en) 2017-12-27 2020-10-27 Sdl Inc. Intelligent routing services and systems
US11256867B2 (en) 2018-10-09 2022-02-22 Sdl Inc. Systems and methods of machine learning for digital assets and message creation
RU2767965C2 (en) * 2019-06-19 2022-03-22 Общество С Ограниченной Ответственностью «Яндекс» Method and system for translating a source phrase in a first language with a target phrase in a second language
USD917549S1 (en) 2019-06-20 2021-04-27 Yandex Europe Ag Display screen or portion thereof with graphical user interface

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NL8900600A (en) 1989-03-13 1990-10-01 Bso Buro Voor Systeemontwikkel BILINGUAL KNOWLEDGE BANK.
JPH02301869A (en) * 1989-05-17 1990-12-13 Hitachi Ltd Method for maintaining and supporting natural language processing system
US5329446A (en) * 1990-01-19 1994-07-12 Sharp Kabushiki Kaisha Translation machine
JPH0417065A (en) 1990-05-11 1992-01-21 Hitachi Ltd Translation supporting device
GB2272091B (en) * 1992-10-30 1996-10-23 Canon Europa Nv Apparatus for use in aligning bilingual corpora
GB2279164A (en) * 1993-06-18 1994-12-21 Canon Res Ct Europe Ltd Processing a bilingual database.
JPH07114565A (en) * 1993-10-18 1995-05-02 Sharp Corp Electronic dictionary
US5659765A (en) * 1994-03-15 1997-08-19 Toppan Printing Co., Ltd. Machine translation system
JP3377290B2 (en) * 1994-04-27 2003-02-17 シャープ株式会社 Machine translation device with idiom processing function
JPH0950435A (en) 1995-08-04 1997-02-18 Sharp Corp Translation device
JP3254642B2 (en) * 1996-01-11 2002-02-12 株式会社日立製作所 How to display the index
US6098034A (en) * 1996-03-18 2000-08-01 Expert Ease Development, Ltd. Method for standardizing phrasing in a document
US6161083A (en) * 1996-05-02 2000-12-12 Sony Corporation Example-based translation method and system which calculates word similarity degrees, a priori probability, and transformation probability to determine the best example for translation
EP0887748B1 (en) 1997-06-27 2007-06-27 International Business Machines Corporation Multilingual terminology extraction system
US6535842B1 (en) 1998-12-10 2003-03-18 Global Information Research And Technologies, Llc Automatic bilingual translation memory system

Also Published As

Publication number Publication date
EP1111514A1 (en) 2001-06-27
US6473729B1 (en) 2002-10-29
EP1111514B1 (en) 2006-08-02
DE60029732D1 (en) 2006-09-14
JP2001195404A (en) 2001-07-19
JP4504555B2 (en) 2010-07-14

Similar Documents

Publication Publication Date Title
DE60029732T2 (en) Phrase translation method and system
DE60304331T2 (en) RETRIEVING CONFIRMATIVE DOCUMENTS BY POLLING IN A NATIONAL LANGUAGE
DE69911842T2 (en) Method and device for retrieving information and corresponding storage medium
DE69726339T2 (en) Method and apparatus for language translation
DE69820343T2 (en) Linguistic search system
DE69432575T2 (en) Document recognition system with improved effectiveness of document recognition
DE60029845T2 (en) SYSTEM FOR IDENTIFYING THE RELATIONSHIP BETWEEN INGREDIENTS IN TASK INFORMATION REVIEWING TASKS
DE69837979T2 (en) System for extracting multilingual terminology
DE69728282T2 (en) SYSTEM AND METHOD FOR EXTRACTION AND CODING OF MEDICAL LANGUAGE
DE69934371T2 (en) Apparatus and method for processing a natural language
DE69925831T2 (en) MACHINE ASSISTED TRANSLATION TOOLS
DE69530816T2 (en) Text editing system and method using a knowledge base
DE69725258T2 (en) System and method for retrieving documents in multiple languages
DE60208604T2 (en) Automatic process for creating image buttons
DE69834386T2 (en) TEXT PROCESSING METHOD AND RETENTION SYSTEM AND METHOD
DE69930690T2 (en) Method and device for producing an index, use of an index and a storage medium
DE69829074T2 (en) IDENTIFICATION OF LANGUAGE AND SYMBOLS FROM TEXT-REPRESENTATIVE DATA
DE19952769B4 (en) Search engine and method for retrieving information using natural language queries
DE2854837A1 (en) TRANSLATION DEVICE
DE102019001267A1 (en) Dialog-like system for answering inquiries
DE112012001750T5 (en) Automated self-service user support based on ontology analysis
DE112018006345T5 (en) GET SUPPORTING EVIDENCE FOR COMPLEX ANSWERS
DE102014113870A1 (en) Identify and display relationships between candidate responses
DE3901485A1 (en) Document retrieval system
DE69934195T2 (en) Identification of a phrase by modified keywords generated from transformations of consecutive suffixes

Legal Events

Date Code Title Description
8364 No opposition during term of opposition