DE60029732T2 - Phrasenübersetzungsverfahren und -system - Google Patents

Phrasenübersetzungsverfahren und -system Download PDF

Info

Publication number
DE60029732T2
DE60029732T2 DE60029732T DE60029732T DE60029732T2 DE 60029732 T2 DE60029732 T2 DE 60029732T2 DE 60029732 T DE60029732 T DE 60029732T DE 60029732 T DE60029732 T DE 60029732T DE 60029732 T2 DE60029732 T2 DE 60029732T2
Authority
DE
Germany
Prior art keywords
phrase
database
text
translation
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE60029732T
Other languages
English (en)
Other versions
DE60029732D1 (de
Inventor
Michel Gastaldo
Gregory Grefenstette
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xerox Corp
Original Assignee
Xerox Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xerox Corp filed Critical Xerox Corp
Application granted granted Critical
Publication of DE60029732D1 publication Critical patent/DE60029732D1/de
Publication of DE60029732T2 publication Critical patent/DE60029732T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • G06F40/45Example-based machine translation; Alignment

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Description

  • Hintergrund der Erfindung
  • 1. Feld der Erfindung
  • Die Erfindung bezieht sich allgemein auf die Übersetzung von Ausdrücken von einer natürlichen Sprache in eine andere natürliche Sprache und insbesondere auf die Unterstützung eines Übersetzers, um die richtige Übersetzung für irgendeine Phrase zu erhalten.
  • 2. Beschreibung des Standes der Technik
  • Jeder Übersetzer wird gemäß zwei Kriterien bewertet: Übersetzungsgeschwindigkeit und Übersetzungsqualität. Eine Schwierigkeit, welche beide dieser Kriterien beeinflusst, ist das Vorkommen eines Wortes oder einer Gruppe von Wörtern, welche den Übersetzter zögern lässt. Das Auffinden einer passenden Übersetzung kann zu einer zeitaufwändigen manuellen Suche ohne Garantie für ein Ergebnis führen.
  • Derzeit wurden mehrere Techniken entwickelt, um einen Übersetzer zu unterstützen. Eine dieser Techniken beinhaltet die Verwendung von Nachschlagen in einem kontextabhängigen Wörterbuch. Kontextabhängige Wörterbücher ermöglichen es, die Übersetzung eines Wortes entsprechend dessen Kontext zu bekommen. Diese Technik ist in dem Ausmaß möglicher Übersetzungen stark beschränkt, d. h. beim Nachschlagen in einem kontextabhängigen Wörterbuch wird der Übersetzer nur mit einer kleinen Anzahl von vorgeschlagenen Übersetzungen versorgt.
  • Weiterhin gibt es vielsprachige Terminologiedatenbanken, welche auf Übersetzungen von vorakzeptierten Begriffen basieren. Diese Technik ist stark auf den Satz der vorgespeicherten Begriffe begrenzt und der Übersetzer wird beim Übersetzen von Ausdrücken, welche nicht Teil des Satzes der vorakzeptierten Begriffe sind, nicht unterstützt.
  • Eine weitere Technik basiert auf der Verwendung eines Übersetzungsspeichers, welcher bereits übersetzte Sätze speichert. Wenn ein Satz übersetzt werden muss, fragt das System die Datenbank ab und schlägt automatisch eine Übersetzung vor. Dieses System erfordert jedoch die Übereinstimmung vollständiger Sätze, selbst wenn die Überein stimmung unscharf sein kann, so dass diese Technik in ihrer Anwendbarkeit ebenso stark beschränkt ist.
  • Eine weitere Übersetzungstechnik wurde vorgeschlagen durch M. Nagao, "A Framework of a Mechanical Translation between Japanese and English by Analogy Principle", Artificial and Human Intelligence (A. Elithorn and R. Banerji, Hrsg.), Elsevier Science Publishers, 1984, S. 173–180. Diese Technik beinhaltet ein Ausrichten und linguistisches Analysieren der Sätze für die Maschinenübersetzung. Die Analysebäume von jedem Paar von Sätzen werden ebenso ausgerichtet. Ein Nachteil dieser Technik besteht darin, dass viele Maschinenübersetzungssysteme die Durchführung einer Gesamtanalyse der übersetzten Sätze erfordert. Ein weiterer Nachteil besteht darin, dass Unterbäume ausgerichtet werden müssen, was eine erhebliche große Computerleistung erfordert.
  • Zusammenfassung der Erfindung
  • Die vorliegende Erfindung wurde in Anbetracht der vorstehenden Situation gemacht und hat ihr primäres Ziel darin, einen Übersetzer zu unterstützen, eine verbesserte Qualität des resultierenden Dokumentes zu erhalten.
  • Es ist ein weiteres Ziel der vorliegenden Erfindung, zu einer kontrollierten Übersetzung beizutragen, um die teure manuelle Suche von unbekannten Ausdrücken zu vermeiden, wodurch Funktionalität bereitgestellt wird zusätzlich zu derjenigen der Verwendung eines Übersetzungsspeichers und von Terminologiedatenbanken.
  • Es ist noch ein weiteres Ziel der vorliegenden Erfindung, den Übersetzer mit einem einfach bedienbaren, effizienten und zuverlässigen Werkzeug auszustatten, welches in der Lage ist, auf die Anfrage des Übersetzers für eine Unterstützung schnell zu antworten.
  • Ein weiteres Ziel der vorliegenden Erfindung besteht darin, mit bestehender Technologie und Programmierwerkzeugen kompatibel zu sein.
  • Die vorstehenden Ziele werden durch Bereitstellen eines Verfahren zum Übersetzen einer Wortphrase aus einer ersten natürlichen Sprache in eine zweite natürliche Sprache gemäß Anspruch 1, eines Systems zum Übersetzen eines Eingabetextes von einer natürliche Quellsprache zu einer natürlichen Zielsprache gemäß Anspruch 8 und eines computerlesbaren Speichermediums, welches Instruktionen für ein Verfahren zum Übersetzen einer Wortphrase von einer ersten natürlichen Sprache in eine zweite natürliche Sprache gemäß Anspruch 9 erreicht. Ausführungsformen der Erfindung sind in den abhängigen Ansprüchen niedergelegt.
  • Wenn man die Vorgehensweise der vorliegenden Erfindung nutzt, wird die Datenbank nach Phrasen indiziert. Extrahierte Wortphrasen indizieren unmittelbar ganze Textfragmente. In bevorzugten Ausführungen werden Substantivphrasen verwendet, um eine Satzdatenbank zu indizieren. Die extrahierten Substantivphrasen indizieren unmittelbar gesamte Sätze, wodurch die Überlegung von entsprechenden Untereinheiten in den übersetzten Sätzen dem Übersetzer überlassen wird. Daher wird keine Gesamtanalyse der übersetzten Sätze durchgeführt und Unterbäume zur Ausrichtung sind nicht notwendig.
  • Die Erfindung ist weiterhin in der Beziehung vorteilhaft, dass sie bereits übersetztes Material verwendet und in einer bevorzugten Ausführung dem Übersetzer Sätze präsentiert, welche die jeweilige Substantivphrase sowohl in der Quell- als auch in der Zielsprache präsentieren. Durch die Verwendung einer phrasenindizierten Satzdatenbank wird sowohl die Übersetzungsgeschwindigkeit als auch die Übersetzungsqualität verbessert.
  • Kurze Beschreibung der Zeichnungen
  • Die beiliegenden Zeichnungen sind in die Beschreibung einbezogen und bilden einen Teil derselben, um verschiedene Ausführungen der vorliegenden Erfindung zu veranschaulichen. Diese Zeichnungen, zusammen mit der Beschreibung, dienen dazu, die Prinzipien der Erfindung zu erklären. Die Zeichnungen dienen ausschließlich dem Zweck, bevorzugte alternative Beispiele zu veranschaulichen, wie die Erfindung durchgeführt und verwendet werden kann und sind nicht dazu gedacht, die Erfindung nur auf die veranschaulichten und beschriebenen Ausführungen zu beschränken. Weitere Merkmale und Vorteile werden von der nachfolgenden und eingehenderen Beschreibung der verschiedenen Ausführungen der Erfindung offenbar, wie sie in den beiliegenden Zeichnungen veranschaulicht wird.
  • 1 veranschaulicht ein Übersetzungssystem gemäß der Erfindung;
  • 2 ist ein Ablaufdiagramm und veranschaulicht den Prozess zur Erzeugung einer phrasenindizierten Satzdatenbank gemäß der Erfindung;
  • 3 und 4 sind Ablaufdiagramme und veranschaulichen den Übersetzungsprozess gemäß der vorliegenden Erfindung;
  • 5 veranschaulicht eine erste Ausführung einer Nutzerschnittstelle gemäß der Erfindung;
  • 6 veranschaulicht die Verwendung von Unterphrasen; und
  • 7 veranschaulicht eine zweite Ausführung einer Nutzerschnittstelle gemäß der Erfindung.
  • Eingehende Beschreibung der Erfindung
  • Gemäß der Erfindung werden Wortphrasen zur Indizierung von Textfragmenten verwendet, welche eine primäre grammatikalische Einheit darstellen, welche mindestens einen Nebensatz einschließt.
  • Phrasen und Ausdrücke bestehen üblicherweise nur aus wenigen Wörtern, welche eine einzige Idee bezeichnen oder einen getrennten Abschnitt eines Satzes ausbilden. Insbesondere ist eine Phrase eine Gruppe von zwei oder mehr verknüpften Wörtern, und enthält kein Subjekt und Prädikat. Substantivphrasen sind Phrasen, welche entweder Substantive oder Pronomen enthalten. Substantive sind Wörter, welche als Namen eines Dings, einer Eigenschaft oder einer Aktion verwendet werden, welche im Verstand existieren oder ausgedacht werden. Pronomen sind Wörter, welche als Substitute für ein Substantiv verwendet werden. Daher sind Substantivphrasen beispielsweise "Straßentest", "Drucktestbetrieb für Kraftstoff" oder "Verbphrase". Im Gegensatz dazu sind Verbphrasen solche Phrasen, welche ein oder mehrere Verben, wie etwa "ausgebreitet" oder "angepasst worden" beinhalten.
  • Im Unterschied zu einer Phrase ist ein Nebensatz eine Gruppe von Wörtern, welche ein Subjekt und ein Prädikat enthält, das bedeutet, Nebensätze sind syntaktische Konstruktionen, welche einen Teil eines Satzes ausbilden oder einen gesamten einfachen Satz aufbauen. Sätze sind grammatikalische Einheiten von einem oder mehreren Wörtern, welche eine minimale syntaktische Beziehung zu Wörtern beinhalten, welche diesem vorausgehen oder folgen, d. h. einen minimalen Sinn von Vollständigkeit und einer Einheit umfassen. Sätze drücken einen vollständigen Gedanken aus, etwa die Feststellung einer Tatsache, eine Frage, eine Instruktion oder ein Ausruf.
  • Daher können Nebensätze und Sätze als primäre grammatikalische Einheiten definiert werden. Während Sätze Nebensätze und Phrasen umfassen können und Nebensätze Phrasen umfassen können, können Phrasen keine Nebensätze oder Sätze umfassen. Die bevorzugte Ausführung der Erfindung verwendet Substantivphrasen, um Sätze zu indizieren.
  • Mit nachfolgendem Bezug auf die Zeichnungen und insbesondere auf 1 umfasst das Übersetzungssystem gemäß einer bevorzugten Ausführung der Erfindung eine Steuereinheit 14, welche ein Computer von irgendeiner Art sein kann, wie etwa ein PC oder eine Workstation, beispielsweise betrieben durch ein herkömmliches Betriebssystem, wie etwa Windows NT oder UNIX. Auf der Steuereinheit 14 läuft die Softwareanwendung, welche durch eine Zeigeeinrichtung 12 oder eine Tastatur 13 unter Verwendung einer Anzeige 11 gesteuert werden kann. Die Schnittstellensoftware kann beispielsweise in Visual Basic geschrieben sein und die resultierende Anwendung kann ein OLE-Server sein, welcher unmittelbar in irgendeinen Code von Visual Basic oder C/C++ integriert sein kann. Der Fachmann wird jedoch würdigen, dass viele andere Arten der Implementierung ebenso möglich sind.
  • Das Anwendungsprogramm, welches auf der Steuereinheit 14 läuft, hat Zugriff auf die Satzdatenbank 17, welche eine Access- oder Oracle-Datenbank sein kann und vorzugsweise unter Verwendung einer UNIX Workstation erzeugt wurde. Die Größe der Datenbank hängt von dem Anwendungsgebiet ab, in welchem das System verwendet wird. Es ist wiederum zu würdigen, dass viele andere Implementierungen möglich sind.
  • Die Satzdatenbank 17 speichert eine Vielzahl von Sätzen in Englisch als der Quellsprache und speichert ebenso den zu jedem englischen Satz entsprechenden Satz in Französisch als der Zielsprache. Die Satzdatenbank 17 schließt weiterhin einen Phrasenindex ein, welcher Information zu jeder Substantivphrase hält, welche in irgendeinem Satz der Datenbank gespeichert ist und die Sätze anzeigt, in welchen die jeweilige Substan tivphrase gefunden werden kann. Die auf der Steuereinheit 14 laufende Übersetzungssoftware hat weiterhin Zugriff auf den Phrasenextraktor 15, welcher die Substantivphrasen aus einem Eingabetext unter Verwendung komplexer linguistischer Algorithmen extrahiert. Eingabetext kann von irgendeiner Textquelle, wie etwa einem Speichermedium, Scannern, Nachrichten, Spracherkennung, etc. kommen.
  • Mit nachfolgendem Bezug auf die 2, welche ein Ablaufdiagramm des Prozesses zur Erzeugung der phrasenindizierten Satzdatenbank 17 veranschaulicht, bezieht das System als erstes in den Schritten 21 und 22 ein in der Quellsprache geschriebenes Dokument und ein entsprechendes, in der Zielsprache geschriebenes Dokument. Daraufhin werden in dem Schritt 23 in dem Paar aus Quell- und Zieldokument, die Sätze ausgerichtet. Das Ausrichten der Sätze bedeutet die Erstellung einer Verknüpfung zwischen jedem Quellsatz und dem entsprechenden Zielsatz. Nachdem die Sätze ausgerichtet worden sind, werden die Substantivphrasen aus jedem der Quellsätze in Schritt 24 extrahiert und die extrahierten Substantivphrasen werden dem Phrasenindex der Satzdatenbank 17 zusammen mit der jeweiligen Information, welche den Satz betrifft, von welchem die Substantivphrase extrahiert wurde, hinzugefügt. Nachdem die extrahierten Substantivphrasen zu dem Phrasenindex in Schritt 25 hinzugefügt worden sind, wird in dem Schritt 26 eine Entscheidung getroffen, ob ein weiteres Paar von Quell/Zieldokumenten eingelesen werden soll. Wenn dies der Fall ist, kehrt der Prozess zur Erzeugung der Datenbank zu Schritt 21 zum Beziehen der Dokumente, zum Ausrichten der Sätze und zum Extrahieren und Speichern der Substantivphrasen zurück. Durch Wiederholen der Schritte 21 bis 26 für einen Satz von übersetzten Dokumentenpaaren wird eine umfassende Datenbank aufgebaut, welche eine große Anzahl von zusammengehörigen Substantivphrasen mit den Sätzen, welche dieselben beinhalten, gespeichert.
  • Wenngleich der Prozess in 2 im Zusammenhang mit der Erzeugung der phrasenindizierten Satzdatenbank 17 beschrieben worden ist, wird der Fachmann würdigen, dass der veranschaulichte Prozess ebenso jederzeit verwendet werden kann, um eine bestehende Datenbank durch Speichern von Sätzen und Substantivphrasen von neuen Dokumentenpaaren zu erweitern. Es ist weiterhin für den Fachmann offenbar, dass der Prozess des Erweiterns und Generierens der Datenbank im Zusammenhang mit Dokumenten beschrieben worden ist, dass derselbe aber ebenso auf der Basis von Dokumententeilen durchgeführt werden kann.
  • In einer weiteren bevorzugten Ausführungsform der vorliegenden Erfindung werden nur diejenigen Dokumente für den Aufbau der Datenbank verwendet, welche in einem und demselben Fachgebiet liegen, z. B. Dokumente für die Autowartung. Durch diese Maßnahme wird die Anzahl der möglichen Übersetzungen für jede Substantivphrase verringert, so dass, wenn die Datenbank groß genug ist, die meisten Substantivphrasen indiziert sein werden und für nahezu alle Anfragen eine Übersetzung zur Verfügung stehen wird.
  • Mit nachfolgendem Bezug auf die 3 und 4, welche ein Ablaufdiagramm des Übersetzungsprozesses veranschaulichen, gibt der Nutzer den zu übersetzenden Text in Schritt 31 ein. Der Text wird daraufhin derart angezeigt, dass der Nutzer ein unbekanntes Wort oder Gruppe von Wörtern auswählen kann, z. B. durch doppeltes Anklicken auf dem Wort. Sobald im Schritt 32 ein Wort ausgewählt worden ist, extrahiert der Phrasenextraktor 15 im Schritt 33 alle möglichen Substantivphrasen, welche sich auf das ausgewählte Wort beziehen. Der Satz von möglichen Substantivphrasen wird daraufhin in der Anzeige 34 angezeigt und es wird eine der Substantivphrasen im Schritt 35 entweder automatisch oder auf Nutzeranfrage ausgewählt. In der Voreinstellung wird die längste der extrahierten Substantivphrasen ausgewählt, ohne die Notwendigkeit für eine Nutzerauswahl. Diese automatische Auswahl kann ebenso abhängig davon, ob die extrahierte Substantivphrasen in der Datenbank vorhanden sind, durchgeführt werden. In diesem Fall wird die längste (Unter-) Substantivphrase ausgewählt, die in der Datenbank vorhanden ist. In jedem Fall kann die Auswahl durch den Nutzer durchgeführt oder geändert werden.
  • Die 5 zeigt ein Beispiel, wie die erwähnte Information dem Nutzer präsentiert wird. Bei einem fenstergestützten System zeigt die Steuereinheit 14 ein Fenster 51 an, in welchem eine Anzahl von Feldern gezeigt werden. Das durch Doppelklicken in Schritt 32 ausgewählte Wort wird in Feld 55 angezeigt. Im Feld 53 wird der Satz an möglichen Substantivphrasen, welche im Schritt 33 extrahiert worden sind, angezeigt. Aus diesem Satz von Substantivfragen hat der Nutzer im Beispiel der 5 die Substantivphrase "Straßentest ausgewählt, welche daraufhin im Feld 52 gezeigt wird.
  • Sobald der Nutzer eine der möglichen Substantivphrasen ausgewählt hat, fragt die Steuereinheit 14 die phrasenindizierte Satzdatenbank 17 im Schritt 41 ab. Da alle Sätze in der phrasenindizierten Satzdatenbank 17 direkt durch die Substantivphrase indiziert sind, kann das System alle Paare von Sätzen, welche durch die ausgewählte Substantivphrase indiziert sind, ohne irgendeine wesentliche Verzögerung aufspüren. Das System sortiert daraufhin in Schritt 42 die aufgespürten Satzpaare entsprechend ihrer Bezugsnähe zu dem Originalsatz. Zu diesem Zweck werden alte Substantivphrasen in dem Originalsatz des Eingabetextes und diejenigen in den aufgespürten Sätzen verglichen und die Bezugsnähe hängt daraufhin von der Zahl der gemeinsamen Substantivphrasen ab. Daher ist das System in der Lage, im Schritt 43 dem Nutzer alle Satzpaare zu präsentieren, wobei diejenigen Sätze zuerst kommen, welche dem zu übersetzenden Satz am nächsten sind. Ein Beispiel für einen angezeigten, sortierten Satz von gepaarten Sätzen ist in der 5 als Feld 54 dargestellt.
  • Im Schritt 44 der 4 wählt der Nutzer einen der angezeigten Sätze des Feldes 54 aus, welcher daraufhin in die Felder 56 und 57 kopiert wird, um dem Nutzer ein genaueres Studium der vorgeschlagenen Übersetzung zu ermöglichen. Sobald der Nutzer entschieden hat, dass das ausgewählte Paar der übersetzten Sätze für die Übersetzung des ausgewählten Wortes aus dem Eingabetext verwendet werden soll, extrahiert der Phrasenextraktor 15 im Schritt 45 aus dem ausgewählten Satzpaar die Übersetzung der Substantivphrase und setzt die übersetzte Substantivphrase automatisch in die Übersetzung des Eingabetextes ein.
  • Im Schritt 46 entscheidet der Übersetzer, ob eine weitere Substantivphrase übersetzt werden muss. Wenn dies der Fall ist, kehrt der Prozess zu Schritt 32 zurück und der Nutzer wählt ein weiteres unbekanntes Wort aus.
  • Mit nachfolgendem Bezug auf die 6, weiche den Betrieb in dem Feld 52 gemäß einer bevorzugten Ausführung veranschaulicht, wird die Fähigkeit des Systems gemäß der vorliegenden Erfindung beschrieben, mit Substantiv-Unterphrasen zu arbeiten. In dem Fall, in dem der Nutzer im Schritt 35 aus dem Feld 53 eine Substantivphrase auswählt, welche keinen Eintrag in dem Phrasenindex der Satzdatenbank 17 aufweist, sucht das System automatisch nach teilweise übereinstimmenden Substantivphrasen oder präsentiert dem Nutzer in dem Feld 61 und 62 eine Liste von Unterphrasen, aus welchen der Nutzer einen Eintrag für die Bearbeitung mit dem Übersetzungsprozess auswählen kann. Wenn man annimmt, dass kein Satz die Substantivphrase "Prüfoperationen für Kraftstoffdruck" enthält, kann der Nutzer die Unterphrase "Prüfung Kraftstoffdruck" im Feld 62 auswählen, für welche der Phrasenindex der Datenbank 17 einen Eintrag aufweisen kann.
  • Das Übersetzungssystem gemäß der vorliegenden Erfindung wurde für eine Substantivphrasen-indizierte Satzdatenbank 17 beschrieben. In der bevorzugten Ausführung der 1 schließt das System weiterhin eine Terminologiedatenbank 16 ein, auf welche die Übersetzungsanwendung, welche auf der Kontrolleinheit 14 läuft, Zugriff hat. Sobald der Nutzer im Schritt 35 eine zu übersetzende Substantivphrase ausgewählt hat, fragt das System die Terminologiedatenbank im Schritt 36 ab. In dem Fall, in dem die Terminologiedatenbank eine Übersetzung der ausgewählten Substantivphrase einschließt, präsentiert das System dem Nutzer in Feld 78 der 7 die gefundene Übersetzung. Der Nutzer kann daraufhin entweder die aus der Terminologiedatenbank 16 gefundene Übersetzung bestätigen und in dem Feld 78 anzeigen, oder die vorgeschlagene, aus der phrasenindizierten Satzdatenbank 17 gefundene Übersetzung bestätigen und diese aus der im Feld 74 angezeigten Liste auswählen. Um den Nutzer weiterhin bei der Entscheidung, welche Übersetzung verwendet werden soll, zu unterstützen, wird die in der Terminologiedatenbank 16 aufgefundene Übersetzung in der Liste des Feldes 74 an jeder Stelle, wo dieselbe erscheint, hervorgehoben.
  • Wie im Vorhergehenden beschrieben, weist die vorliegende Erfindung viele Vorteile auf, indem dieselbe eine Substantivphrasen-indizierte Satzdatenbank verwendet, in welcher Substantivphrasen unmittelbar ganze Sätze indizieren, wobei das Erkennen der entsprechenden Untereinheiten in dem übersetzten Satz dem Nutzer überlassen werden. Daher wird keine Gesamtanalyse für übersetzte Sätze durchgeführt. Trotzdem kann das System gemäß der Erfindung mit weiteren herkömmlichen Werkzeugen für die Übersetzung von Ausdrücken integriert werden, wie etwa beispielgestützte Maschinenübersetzung, kontextgebundenes Wörterbuchnachschlagen, vielsprachige Terminologiedatenbanken oder Übersetzungsspeicher. Durch die Bereitstellung einer Übersetzungsumgebung, welche phrasenindizierte Satzdatenbanken verwendet und durch Integration bestehender Technologien, wird jeder Übersetzer mit einer leistungsstarken, neuen Übersetzungshilfe versorgt.
  • Wenngleich die Erfindung mit Bezug auf die bevorzugten physischen Ausführungen beschrieben worden ist, welche gemäß derselben aufgebaut sind, wird dem Fachmann offenbar sein, dass verschiedene Modifikationen, Abwandlungen und Verbesserungen der vorliegenden Erfindung im Licht der vorstehenden Lehren und im Bereich der anhängigen Ansprüche durchgeführt werden können, ohne vom Geist und beabsichtigten Umfang der Erfindung abzuweichen. Weiterhin wurden diejenigen Gebiete, für welche angenommen wird, dass der Fachmann darin bewandert ist, hier nicht beschrieben, um die hier beschriebene Erfindung nicht unnötig zu verdecken. Es ist beispielsweise nicht notwendig, auszudrücken, dass der Nutzer das ausgewählte Wort zu jedem Zeitpunkt durch Eintippen einer neuen Substantivphrase oder durch Auswählen eines weiteren Elementes der Unterphrasenliste ändern kann.
  • Demgemäß soll verstanden werden, dass die Erfindung nicht durch die spezifisch veranschaulichten Ausführungsformen, sondern ausschließlich durch den Umfang der anhängigen Ansprüche begrenzt sein soll.

Claims (9)

  1. Ein Verfahren zur Übersetzung einer Wortphrase aus einer ersten natürlichen Sprache in eine zweite natürliche Sprache, wobei die Wortphrase eine Gruppe von zwei oder mehr verknüpften Wörtern ist, wobei das Verfahren die Schritte umfasst: Eingeben (31) eines Textes, der in der ersten Sprache geschrieben ist; Extrahieren (33) der Wortphrase aus dem Text; Abfragen (41) einer Datenbank (17) nach der extrahierten Wortphrase; die Datenbank (17) enthält Paare von Textfragmenten, wobei jedes Paar ein Textfragment der ersten Sprache und ein entsprechendes Textfragment der zweiten Sprache einschließt; die Textfragmente repräsentieren eine primäre grammatikalische Einheit, welche mindestens einen Nebensatz einschließt; wobei der Nebensatz eine Gruppe von Wörtern ist, welche ein Subjekt und ein Prädikat enthalten; und Erhalten (45) einer Übersetzung der extrahierten Wortphrase basierend auf einem der Paare von Textfragmenten, welches während des Schrittes zum Abfragen einer Datenbank (17) gefunden wurde, dadurch gekennzeichnet, dass der Schritt zum Abfragen (41) einer Datenbank (17) einen Phrasenindex der Datenbank verwendet; der Phrasenindex indiziert die Textfragmente durch Wortphrasen.
  2. Das Verfahren gemäß Anspruch 1, wobei die Wortphrase eines Substantivphrase ist.
  3. Das Verfahren gemäß Anspruch 1, wobei die Wortphrase eine Verbphrase ist.
  4. Verfahren gemäß Anspruch 1, wobei die Wortphrase eine Prädikat ist, welches mindestens ein Verb und ein Substantiv oder Adjektiv einbezieht, welches als ein Substantiv verwendet wird.
  5. Verfahren gemäß Anspruch 1, wobei der Schritt zum Erhalten einer Übersetzung den Schritt einschließt, einem Nutzer die aufgefundenen Paare von Textfragmenten zu präsentieren (43).
  6. Das Verfahren gemäß Anspruch 1, wobei der Schritt zum Erhalten einer Übersetzung den Schritt einschließt, einem Nutzer vorgeschlagene Übersetzungen von extrahierten Wortphrasen zu präsentieren, basierend auf den aufgefundenen Paaren von Textfragmenten.
  7. Verfahren gemäß Anspruch 5 oder 6, wobei der Schritt zum Erhalten einer Übersetzung weiterhin den Schritt umfasst, eine der aufgefundenen Übersetzungen durch den Nutzer zu bestätigen und die bestätigte Übersetzung als Übersetzung der extrahierten Wortphrase zu verwenden.
  8. Ein System zum Übersetzen eines Eingabetextes aus einer natürlichen Quellsprache in eine natürliche Zielsprache, wobei das System umfasst: eine Speichereinrichtung zum Speichern einer Datenbank (16, 17), welche eine Vielzahl von Paaren von Textfragmenten enthält; die Textfragmente repräsentieren eine primäre grammatikalische Einheit, welche mindestens einen Nebensatz einschließt; der Nebensatz ist eine Gruppe von Wörtern, welche ein Subjekt und ein Prädikat enthalten; jedes Paar enthält ein Textfragment in der Quellsprache und ein entsprechendes Textfragment in der Zielsprache, wobei jedes Textfragment mindestens eine Wortphrase enthält, wobei die Wortphrase eine Gruppe von zwei oder mehr verknüpften Wörtern ist; einen Phrasenextraktor (15) zum Extrahieren einer Wortphrase aus einem Textfragment des Eingabetextes; eine Datenbankabfrageeinrichtung (14) zum Abfragen von Paaren von Textfragmenten, welche die extrahierte Wortphrase enthalten, aus der Datenbank (16, 17); und eine Nutzerschnittstelleneinrichtung (11, 12, 13), die es einem Nutzer ermöglicht, eines der abgefragten Paare von Textfragmenten auszuwählen, um eine Übersetzung der extrahierten Wortphrase zu erhalten; dadurch gekennzeichnet, dass die Datenbankabfrageeinrichtung (14) Paare von Textfragmenten aus der Datenbank (16, 17) unter Verwendung eines Phrasenindex der Datenbank abfragt, wobei der Phrasenindex die Textfragmente durch Wortphrasen indiziert.
  9. Ein computerlesbares Speichermedium, welches Instruktionen speichert für ein Verfahren zum Übersetzen einer Wortphrase aus einer ersten natürlichen Sprache in eine zweite natürliche Sprache durch die Ausführung der Schritte: Eingeben (31) eines Textes, der in der ersten Sprache geschrieben ist; Extrahieren (33) der Wortphrase aus dem Text, wobei die Wortphrase eine Gruppe von zwei oder mehr verknüpften Wörtern ist; Abfragen (41) einer Datenbank (17) nach der extrahierten Wortphrase; die Datenbank (17) enthält Paare von Textfragmenten, wobei jedes Paar ein Textfragment der ersten Sprache und ein entsprechendes Textfragment der zweiten Sprache einschließt; die Textfragmente repräsentieren eine primäre grammatikalische Einheit, welche mindestens einen Nebensatz einschließt; wobei der Nebensatz eine Gruppe von Wörtern ist, welche ein Subjekt und ein Prädikat enthalten; und Erhalten (45) einer Übersetzung der extrahierten Wortphrase basierend auf einem der Paare von Textfragmenten, welches während des Schrittes zum Abfragen einer Datenbank (17) gefunden wurde, dadurch gekennzeichnet, dass der Schritt zum Abfragen einer Datenbank (17) einen Phrasenindex der Datenbank verwendet; der Phrasenindex indiziert die Textfragmente durch Wortphrasen.
DE60029732T 1999-12-20 2000-12-19 Phrasenübersetzungsverfahren und -system Expired - Lifetime DE60029732T2 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US466823 1999-12-20
US09/466,823 US6473729B1 (en) 1999-12-20 1999-12-20 Word phrase translation using a phrase index

Publications (2)

Publication Number Publication Date
DE60029732D1 DE60029732D1 (de) 2006-09-14
DE60029732T2 true DE60029732T2 (de) 2006-11-30

Family

ID=23853235

Family Applications (1)

Application Number Title Priority Date Filing Date
DE60029732T Expired - Lifetime DE60029732T2 (de) 1999-12-20 2000-12-19 Phrasenübersetzungsverfahren und -system

Country Status (4)

Country Link
US (1) US6473729B1 (de)
EP (1) EP1111514B1 (de)
JP (1) JP4504555B2 (de)
DE (1) DE60029732T2 (de)

Families Citing this family (102)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5836771A (en) * 1996-12-02 1998-11-17 Ho; Chi Fai Learning method and system based on questioning
US6498921B1 (en) * 1999-09-01 2002-12-24 Chi Fai Ho Method and system to answer a natural-language question
EP2336899A3 (de) 1999-03-19 2014-11-26 Trados GmbH System zum Verwalten von Arbeitsabläufen
US20060116865A1 (en) * 1999-09-17 2006-06-01 Www.Uniscape.Com E-services translation utilizing machine translation and translation memory
US7389221B1 (en) * 2000-07-17 2008-06-17 Globalenglish Corporation System and method for interactive translation
US7660740B2 (en) 2000-10-16 2010-02-09 Ebay Inc. Method and system for listing items globally and regionally, and customized listing according to currency or shipping area
US6983240B2 (en) 2000-12-18 2006-01-03 Xerox Corporation Method and apparatus for generating normalized representations of strings
US8874431B2 (en) * 2001-03-16 2014-10-28 Meaningful Machines Llc Knowledge system method and apparatus
US7860706B2 (en) * 2001-03-16 2010-12-28 Eli Abir Knowledge system method and appparatus
US20030083860A1 (en) * 2001-03-16 2003-05-01 Eli Abir Content conversion method and apparatus
US7689405B2 (en) * 2001-05-17 2010-03-30 Language Weaver, Inc. Statistical method for building a translation memory
WO2003005166A2 (en) 2001-07-03 2003-01-16 University Of Southern California A syntax-based statistical translation model
US7752266B2 (en) * 2001-10-11 2010-07-06 Ebay Inc. System and method to facilitate translation of communications between entities over a network
US20030101044A1 (en) * 2001-11-28 2003-05-29 Mark Krasnov Word, expression, and sentence translation management tool
AU2003269808A1 (en) 2002-03-26 2004-01-06 University Of Southern California Constructing a translation lexicon from comparable, non-parallel corpora
US8719041B2 (en) 2002-06-10 2014-05-06 Ebay Inc. Method and system for customizing a network-based transaction facility seller application
US8078505B2 (en) 2002-06-10 2011-12-13 Ebay Inc. Method and system for automatically updating a seller application utilized in a network-based transaction facility
US7941348B2 (en) 2002-06-10 2011-05-10 Ebay Inc. Method and system for scheduling transaction listings at a network-based transaction facility
US7308399B2 (en) * 2002-06-20 2007-12-11 Siebel Systems, Inc. Searching for and updating translations in a terminology database
US7171351B2 (en) * 2002-09-19 2007-01-30 Microsoft Corporation Method and system for retrieving hint sentences using expanded queries
US7293015B2 (en) * 2002-09-19 2007-11-06 Microsoft Corporation Method and system for detecting user intentions in retrieval of hint sentences
US7194455B2 (en) 2002-09-19 2007-03-20 Microsoft Corporation Method and system for retrieving confirming sentences
US9881308B2 (en) 2003-04-11 2018-01-30 Ebay Inc. Method and system to facilitate an online promotion relating to a network-based marketplace
US7742985B1 (en) 2003-06-26 2010-06-22 Paypal Inc. Multicurrency exchanges between participants of a network-based transaction facility
US8548794B2 (en) 2003-07-02 2013-10-01 University Of Southern California Statistical noun phrase translation
CN1894688A (zh) * 2003-12-15 2007-01-10 有限会社言语技术研究所 对译判断装置、方法及程序
US7983896B2 (en) 2004-03-05 2011-07-19 SDL Language Technology In-context exact (ICE) matching
US20100262621A1 (en) * 2004-03-05 2010-10-14 Russ Ross In-context exact (ice) matching
US8296127B2 (en) 2004-03-23 2012-10-23 University Of Southern California Discovery of parallel text portions in comparable collections of corpora and training using comparable texts
DE202005021923U1 (de) * 2004-04-02 2011-06-09 Star Ag Computergestütztes Hilfsmittel für ein Verfahren zur Erstellung von fremdsprachigen Dokumenten
US8666725B2 (en) 2004-04-16 2014-03-04 University Of Southern California Selection and use of nonstatistical translation components in a statistical machine translation framework
US9189568B2 (en) 2004-04-23 2015-11-17 Ebay Inc. Method and system to display and search in a language independent manner
GB2415518A (en) * 2004-06-24 2005-12-28 Sharp Kk Method and apparatus for translation based on a repository of existing translations
WO2006042321A2 (en) 2004-10-12 2006-04-20 University Of Southern California Training for a text-to-text application which uses string to tree conversion for training and decoding
US7937396B1 (en) * 2005-03-23 2011-05-03 Google Inc. Methods and systems for identifying paraphrases from an index of information items and associated sentence fragments
US8719244B1 (en) 2005-03-23 2014-05-06 Google Inc. Methods and systems for retrieval of information items and associated sentence fragments
US8886517B2 (en) 2005-06-17 2014-11-11 Language Weaver, Inc. Trust scoring for language translation systems
US8676563B2 (en) 2009-10-01 2014-03-18 Language Weaver, Inc. Providing human-generated and machine-generated trusted translations
JP4234698B2 (ja) * 2005-06-20 2009-03-04 富士通株式会社 構造化文書処理システム
US7653531B2 (en) * 2005-08-25 2010-01-26 Multiling Corporation Translation quality quantifying apparatus and method
US7937265B1 (en) 2005-09-27 2011-05-03 Google Inc. Paraphrase acquisition
US10319252B2 (en) 2005-11-09 2019-06-11 Sdl Inc. Language capability assessment and training apparatus and techniques
US20070162481A1 (en) * 2006-01-10 2007-07-12 Millett Ronald P Pattern index
US8266152B2 (en) * 2006-03-03 2012-09-11 Perfect Search Corporation Hashed indexing
US7644082B2 (en) * 2006-03-03 2010-01-05 Perfect Search Corporation Abbreviated index
US20080213734A1 (en) * 2006-04-02 2008-09-04 Steve George Guide Method for Decoding Pictographic Signs Present on Ancient Artifacts
US8943080B2 (en) 2006-04-07 2015-01-27 University Of Southern California Systems and methods for identifying parallel documents and sentence fragments in multilingual document collections
US8668146B1 (en) 2006-05-25 2014-03-11 Sean I. Mcghie Rewards program with payment artifact permitting conversion/transfer of non-negotiable credits to entity independent funds
US7703673B2 (en) 2006-05-25 2010-04-27 Buchheit Brian K Web based conversion of non-negotiable credits associated with an entity to entity independent negotiable funds
US9704174B1 (en) 2006-05-25 2017-07-11 Sean I. Mcghie Conversion of loyalty program points to commerce partner points per terms of a mutual agreement
US8684265B1 (en) 2006-05-25 2014-04-01 Sean I. Mcghie Rewards program website permitting conversion/transfer of non-negotiable credits to entity independent funds
US10062062B1 (en) 2006-05-25 2018-08-28 Jbshbm, Llc Automated teller machine (ATM) providing money for loyalty points
US7865352B2 (en) * 2006-06-02 2011-01-04 Microsoft Corporation Generating grammatical elements in natural language sentences
US8209163B2 (en) * 2006-06-02 2012-06-26 Microsoft Corporation Grammatical element generation in machine translation
US7725306B2 (en) * 2006-06-28 2010-05-25 Microsoft Corporation Efficient phrase pair extraction from bilingual word alignments
US20080027911A1 (en) * 2006-07-28 2008-01-31 Microsoft Corporation Language Search Tool
US8886518B1 (en) 2006-08-07 2014-11-11 Language Weaver, Inc. System and method for capitalizing machine translated text
US8639782B2 (en) 2006-08-23 2014-01-28 Ebay, Inc. Method and system for sharing metadata between interfaces
US8521506B2 (en) 2006-09-21 2013-08-27 Sdl Plc Computer-implemented method, computer software and apparatus for use in a translation system
US8433556B2 (en) 2006-11-02 2013-04-30 University Of Southern California Semi-supervised training for statistical word alignment
US9122674B1 (en) 2006-12-15 2015-09-01 Language Weaver, Inc. Use of annotations in statistical machine translation
WO2008080190A1 (en) * 2007-01-04 2008-07-10 Thinking Solutions Pty Ltd Linguistic analysis
US8468149B1 (en) 2007-01-26 2013-06-18 Language Weaver, Inc. Multi-lingual online community
NZ553484A (en) * 2007-02-28 2008-09-26 Optical Systems Corp Ltd Text management software
US8615389B1 (en) 2007-03-16 2013-12-24 Language Weaver, Inc. Generation and exploitation of an approximate language model
US8831928B2 (en) 2007-04-04 2014-09-09 Language Weaver, Inc. Customizable machine translation service
US9779079B2 (en) * 2007-06-01 2017-10-03 Xerox Corporation Authoring system
US8825466B1 (en) 2007-06-08 2014-09-02 Language Weaver, Inc. Modification of annotated bilingual segment pairs in syntax-based machine translation
US8548791B2 (en) * 2007-08-29 2013-10-01 Microsoft Corporation Validation of the consistency of automatic terminology translation
US7912840B2 (en) * 2007-08-30 2011-03-22 Perfect Search Corporation Indexing and filtering using composite data stores
US7774353B2 (en) * 2007-08-30 2010-08-10 Perfect Search Corporation Search templates
US7774347B2 (en) * 2007-08-30 2010-08-10 Perfect Search Corporation Vortex searching
US8135574B2 (en) * 2007-11-15 2012-03-13 Weikel Bryan T Creating and displaying bodies of parallel segmented text
KR100917784B1 (ko) * 2007-12-24 2009-09-21 한성주 콘텐트에 대한 코멘트를 기반으로 한 집단 감성 정보 검색방법 및 시스템
US8032495B2 (en) * 2008-06-20 2011-10-04 Perfect Search Corporation Index compression
GB2468278A (en) 2009-03-02 2010-09-08 Sdl Plc Computer assisted natural language translation outputs selectable target text associated in bilingual corpus with input target text from partial translation
US9262403B2 (en) 2009-03-02 2016-02-16 Sdl Plc Dynamic generation of auto-suggest dictionary for natural language translation
US9189475B2 (en) * 2009-06-22 2015-11-17 Ca, Inc. Indexing mechanism (nth phrasal index) for advanced leveraging for translation
US8990064B2 (en) 2009-07-28 2015-03-24 Language Weaver, Inc. Translating documents based on content
US8380486B2 (en) 2009-10-01 2013-02-19 Language Weaver, Inc. Providing machine-generated translations and corresponding trust levels
US10417646B2 (en) 2010-03-09 2019-09-17 Sdl Inc. Predicting the cost associated with translating textual content
WO2011127655A1 (en) * 2010-04-14 2011-10-20 Hewlett-Packard Development Company, L.P. Method for keyword extraction
KR101416098B1 (ko) 2010-10-12 2014-07-09 한국전자통신연구원 구단위 번역 지식 학습 방법 및 이를 수행하는 장치
KR101356417B1 (ko) * 2010-11-05 2014-01-28 고려대학교 산학협력단 병렬 말뭉치를 이용한 동사구 번역 패턴 구축 장치 및 그 방법
US9128929B2 (en) 2011-01-14 2015-09-08 Sdl Language Technologies Systems and methods for automatically estimating a translation time including preparation time in addition to the translation itself
US11003838B2 (en) 2011-04-18 2021-05-11 Sdl Inc. Systems and methods for monitoring post translation editing
US8694303B2 (en) 2011-06-15 2014-04-08 Language Weaver, Inc. Systems and methods for tuning parameters in statistical machine translation
US8886515B2 (en) 2011-10-19 2014-11-11 Language Weaver, Inc. Systems and methods for enhancing machine translation post edit review processes
CN103164390B (zh) * 2011-12-15 2016-05-18 富士通株式会社 文档处理方法和文档处理装置
CN102591859B (zh) * 2011-12-28 2014-11-05 华为技术有限公司 一种重用行业标准格式文件的方法及相关装置
US8942973B2 (en) 2012-03-09 2015-01-27 Language Weaver, Inc. Content page URL translation
US10261994B2 (en) 2012-05-25 2019-04-16 Sdl Inc. Method and system for automatic management of reputation of translators
US9152622B2 (en) 2012-11-26 2015-10-06 Language Weaver, Inc. Personalized machine translation via online adaptation
US9183197B2 (en) 2012-12-14 2015-11-10 Microsoft Technology Licensing, Llc Language processing resources for automated mobile language translation
US9213694B2 (en) 2013-10-10 2015-12-15 Language Weaver, Inc. Efficient online domain adaptation
US10747419B2 (en) * 2015-09-25 2020-08-18 CSOFT International Systems, methods, devices, and computer readable media for facilitating distributed processing of documents
US11200217B2 (en) 2016-05-26 2021-12-14 Perfect Search Corporation Structured document indexing and searching
US10635863B2 (en) 2017-10-30 2020-04-28 Sdl Inc. Fragment recall and adaptive automated translation
US10817676B2 (en) 2017-12-27 2020-10-27 Sdl Inc. Intelligent routing services and systems
US11256867B2 (en) 2018-10-09 2022-02-22 Sdl Inc. Systems and methods of machine learning for digital assets and message creation
RU2767965C2 (ru) * 2019-06-19 2022-03-22 Общество С Ограниченной Ответственностью «Яндекс» Способ и система для перевода исходной фразы на первом языке целевой фразой на втором языке
USD917549S1 (en) 2019-06-20 2021-04-27 Yandex Europe Ag Display screen or portion thereof with graphical user interface

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NL8900600A (nl) 1989-03-13 1990-10-01 Bso Buro Voor Systeemontwikkel Tweetalige kennisbank.
JPH02301869A (ja) * 1989-05-17 1990-12-13 Hitachi Ltd 自然言語処理システム保守支援方式
US5329446A (en) * 1990-01-19 1994-07-12 Sharp Kabushiki Kaisha Translation machine
JPH0417065A (ja) 1990-05-11 1992-01-21 Hitachi Ltd 翻訳支援装置
GB2272091B (en) * 1992-10-30 1996-10-23 Canon Europa Nv Apparatus for use in aligning bilingual corpora
GB2279164A (en) * 1993-06-18 1994-12-21 Canon Res Ct Europe Ltd Processing a bilingual database.
JPH07114565A (ja) * 1993-10-18 1995-05-02 Sharp Corp 電子辞書
EP0672989A3 (de) * 1994-03-15 1998-10-28 Toppan Printing Co., Ltd. Maschinelles Übersetzungssystem
JP3377290B2 (ja) * 1994-04-27 2003-02-17 シャープ株式会社 イディオム処理機能を持つ機械翻訳装置
JPH0950435A (ja) 1995-08-04 1997-02-18 Sharp Corp 翻訳装置
JP3254642B2 (ja) * 1996-01-11 2002-02-12 株式会社日立製作所 索引の表示方法
US6098034A (en) * 1996-03-18 2000-08-01 Expert Ease Development, Ltd. Method for standardizing phrasing in a document
US6161083A (en) * 1996-05-02 2000-12-12 Sony Corporation Example-based translation method and system which calculates word similarity degrees, a priori probability, and transformation probability to determine the best example for translation
EP0887748B1 (de) 1997-06-27 2007-06-27 International Business Machines Corporation System zum Extrahieren einer mehrsprachigen Terminologie
US6535842B1 (en) 1998-12-10 2003-03-18 Global Information Research And Technologies, Llc Automatic bilingual translation memory system

Also Published As

Publication number Publication date
JP4504555B2 (ja) 2010-07-14
JP2001195404A (ja) 2001-07-19
EP1111514B1 (de) 2006-08-02
DE60029732D1 (de) 2006-09-14
US6473729B1 (en) 2002-10-29
EP1111514A1 (de) 2001-06-27

Similar Documents

Publication Publication Date Title
DE60029732T2 (de) Phrasenübersetzungsverfahren und -system
DE60304331T2 (de) Abrufen übereinstimmender dokumente durch abfragen in einer nationalen sprache
DE69911842T2 (de) Verfahren und Vorrichtung zum Wiederauffinden von Information und entsprechendes Speichermedium
DE69820343T2 (de) Linguistisches Suchsystem
DE69432575T2 (de) Dokumentenerkennungssystem mit verbesserter Wirksamkeit der Dokumentenerkennung
DE60029845T2 (de) System zum identifizieren der verhältnisse zwischen bestandteilen in aufgaben vom typ informations-wiederauffindung
DE69837979T2 (de) System zum Extrahieren einer mehrsprachigen Terminologie
DE69728282T2 (de) System und verfahren zur extraktion und kodierung von medizinischer fachsprache
DE69934371T2 (de) Apparat und Verfahren zum Verarbeiten einer natürlichen Sprache
DE69925831T2 (de) Maschinenunterstützte übersetzungswerkzeuge
DE69530816T2 (de) Textbearbeitungssystem und Verfahren unter Verwendung einer Wissensbasis
DE69725258T2 (de) System und Verfahren zur Wiederauffindung von Dokumenten in mehreren Sprachen
DE60208604T2 (de) Automatisches Verfahren zur Erzeugung von Image-buttons
DE69834386T2 (de) Textverarbeitungsverfahren und rückholsystem und verfahren
DE69930690T2 (de) Verfahren und Gerät um einen Index herzustellen, Benutzung von einem Index und ein Speichermedium
DE69829074T2 (de) Identifizierung der sprache und des zeichensatzes aus text-repräsentierenden daten
DE19952769B4 (de) Suchmaschine und Verfahren zum Abrufen von Informationen mit Abfragen in natürlicher Sprache
DE69829389T2 (de) Textnormalisierung unter verwendung einer kontextfreien grammatik
DE2854837A1 (de) Uebersetzungsvorrichtung
DE102019001267A1 (de) Dialogartiges System zur Beantwortung von Anfragen
DE3032664A1 (de) Elektronisches sprachuebersetzungsgeraet.
DE112012001750T5 (de) Automatisierte Selbstbedienungs-Benutzerunterstützung auf der Grundlage der Ontologieanalyse
DE102014113870A1 (de) Identifizieren und Anzeigen von Beziehungen zwischen Kandidatenantworten
DE69934195T2 (de) Identifikation einer Wortgruppe durch modifizierte Schlüsselwörter, die aus Transformationen von aufeinanderfolgenden Suffixen erzeugt sind
DE69733294T2 (de) Einrichtung und Verfahren zum Zugriff auf eine Datenbank

Legal Events

Date Code Title Description
8364 No opposition during term of opposition