DE68919030T2 - Computerunterstütztes Übersetzungsgerät. - Google Patents
Computerunterstütztes Übersetzungsgerät.Info
- Publication number
- DE68919030T2 DE68919030T2 DE68919030T DE68919030T DE68919030T2 DE 68919030 T2 DE68919030 T2 DE 68919030T2 DE 68919030 T DE68919030 T DE 68919030T DE 68919030 T DE68919030 T DE 68919030T DE 68919030 T2 DE68919030 T2 DE 68919030T2
- Authority
- DE
- Germany
- Prior art keywords
- dictionary
- language
- word
- sentence
- dictionaries
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000013519 translation Methods 0.000 title claims description 68
- 230000014616 translation Effects 0.000 claims description 68
- 238000001514 detection method Methods 0.000 claims description 4
- 238000004458 analytical method Methods 0.000 description 19
- 239000000872 buffer Substances 0.000 description 8
- 238000010586 diagram Methods 0.000 description 8
- 238000000034 method Methods 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000010276 construction Methods 0.000 description 2
- 235000016496 Panda oleosa Nutrition 0.000 description 1
- 240000000220 Panda oleosa Species 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000002035 prolonged effect Effects 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/211—Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/268—Morphological analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/42—Data-driven translation
- G06F40/47—Machine-assisted translation, e.g. using translation memory
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/55—Rule-based translation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Machine Translation (AREA)
Description
- Die Erfindung betrifft ein computerunterstütztes Sprachübersetzungsgerät, das dazu in der Lage ist, ein Übersetzungsausgangssignal so schnell und genau wie möglich zu erstellen.
- Wo eine Quellensprache unter Verwendung eines computerunterstützten Sprachübersetzungsgeräts in eine Zielsprache zu übersetzen ist, wird eine Informationssuche ausgeführt, die nicht nur auf ein unveränderliches Hauptwörterbuch Bezug nimmt, sondern auch auf ein unveränderliches technisches Wörterbuch, das mit technischen Begriffen für ein spezielles Wissenschaftsgebiet oder mehrere gefüllt ist, und auf ein benutzerspezifisches Wörterbuch, das vom Benutzer oder der Bedienperson mit Wörtern aufgefüllt wird, die für das Geschäft des Benutzers eigentümlich sind. Während des Betriebs des Übersetzungsgeräts erfolgt die vom Computersystem ausgeführte Informationssuche zunächst im benutzerspezifischen Wörterbuch, dann im unveränderlichen technischen Wörterbuch und schließlich im unveränderlichen Hauptwörterbuch, um in der Zielsprache ein geeignetes Wort zu finden, das einem Wort in der Quellensprache entspricht, wie es vom Benutzer über eine Tastatur eingegeben wurde. Anders gesagt, beginnt die Folge der vom im Übersetzungsgerät verwendeten Computersystem ausgeführten Folge der Wörterbuchbezugnahme mit dem vom Benutzer angepaßten Wörterbuch gefolgt vom technischen Wörterbuch und schließlich vom unveränderlichen Hauptwörterbuch.
- Diese Folge von Wörterbuchbezugnahme erscheint in den meisten Fällen als geeignet. Wenn der Bediener eines Übersetzungsgeräts es jedoch wünscht, daß das Übersetzungsgerät ein spezielles aus einer verfügbaren Anzahl von Wörtern in der Zielsprache auswählt, die alle einem Wort in der Quellensprache entsprechen, wird die vorstehend erörterte Folge der Wörterbuchbezugnahme häufig ungeschickt. Wenn eine Sprachübersetzung von Englisch in Japanisch betrachtet wird, kann das englische Wort "book" in einige japanische Wörter übersetzt werden, z.B. "HON" (mit einem japanischen Schriftzeichen oder einem Kanji ausgedrückt) und in "BUKKU" (durch japanische Silbenzeichen oder Kana ausgedrückt), die beide einen gebündelten Satz gedruckter Blätter Papier bedeuten. Im gewöhnlichen Sinn ist "HON" ein weit verbreitetes Wort japanischen Ursprungs und ist daher allgemein im unveränderlichen Hauptwörterbuch eingetragen, wohingegen "BUKKU" ein begrenzt verbreitetes japanisches Wort ist, das vom englischen Wort "book" hinsichtlich einer phonetischen Wiedergabe übertragen ist und das daher im allgemeinen im benutzerspezifischen Wörterbuch eingetragen sein wird.
- Wenn die vorstehend erörterte Folge von Wörterbuchbezugnahme gemäß dem Stand der Technik unter diesen Umständen verwendet wird, kann es geschehen, daß ein bestimmtes Wort in der Quellensprache in ein entsprechendes Wort in der Zielsprache übersetzt wird, das der Bediener des Übersetzungsgeräts nicht benötigt. Z.B. würde beim Beispiel der oben veranschaulichten Übersetzung von Englisch in Japanisch, bei dem angenommen ist, daß die Bedienperson des Übersetzungsgeräts es wünscht, daß das englische Wort "book" in das entsprechende japanische Wort "HON" übersetzt wird, die Wörterbuchbezugnahme gemäß der Folge aus dem Stand der Technik zu einer Übersetzung des englischen Worts "book" in das andere entsprechende japanische Wort "BUKKU" führen. Wenn dies auftritt, wird die Übersetzung von "book" in "BUKKU" häufig als fehlerhafte Übersetzung angesehen.
- Demgemäß würde das bekannte computerunterstütze Sprachübersetzungsgerät nicht notwendigerweise immer eine genaue Sprachübersetzung liefern, und wenn eine solche fehlerhafte Übersetzung auftritt, muß die Bedienperson eine Neudurchsicht vornehmen, was eine relativ verlängerte Zeit zum Abschließen einer Übersetzungsaufgabe erfordert.
- EP-A-0 176 858, wie vom vorliegenden Anmelder eingereicht, beschreibt ein Übersetzungssystem, in dem Information, die den "Satzteil" eines Worts in der Quellensprache "z.B. Substantiv, Verb usw.) zusammen mit dem Quellenwort eingegeben wird, um eine korrekte Übersetzung in der Zielsprache zu erzeugen.
- EP-A-0 235 739 beschreibt ein Übersetzungssystem, bei dem ein zweites von zwei Wörterbüchern automatisch bevorzugt für die Übersetzung eines eingegebenen Quellenworts konsultiert wird, das vom System als Substantiv erkannt wird und das sich in beiden Wörterbüchern findet.
- Die Erfindung wurde im Hinblick darauf entwickelt, die vorstehend beschriebenen Nachteile im wesentlichen zu überwinden, und es ist ihre Hauptaufgabe, eine schnelle und genaue Übersetzung von einem Wort in einer Quellensprache in ein Wort unter äquivalenten Wörtern in einer Zielsprache zu liefern.
- Die Erfindung schafft ein computerunterstütztes Sprachübersetzungsgerät mit einer Wörterbucheinrichtung zum Abspeichern mehrerer Wörterbücher, die Wörter in einer Quellensprache und Wörter in einer Zielsprache einander zuordnen; einer Einrichtung zum Eingeben eines aus Wörtern in der Quellensprache bestehenden Satzes und von Zusatzinformation betreffend mindestens ein Wort in der Quellensprache, und mit einer Einrichtung zum Erstellen eines entsprechenden Satzes in der Zielsprache unter Bezugnahme auf die Wörterbucheinrichtung, dadurch gekennzeichnet, daß die Zusatzinformation ein dem Wort in der Quellensprache zugeordneter Wörterbuchspezifiziercode ist, um bei der Übersetzung dieses Worts in der Quellensprache auf das durch diesen Code spezifizierte Wörterbuch zuzugreifen, wobei die Wörterbücher zu verschiedenen Übersetzungen des Worts in der Quellensprache führen, die in der Zielsprache entsprechende Bedeutungen haben und abhängig von vorgegebenen Kriterien auswählbar sind.
- Gemäß einem bevorzugten Ausführungsbeispiel der Erfindung ist ein computerunterstütztes Sprachübersetzungsgerät geschaffen, mit einem Morphemanalysator zum Abtrennen des eingegebenen Satzes in der Quellensprache in Morpheme unter Verwendung der Wörterbücher; einem Syntaxanalysator zum Analysieren der Syntax einer Kette aus den Morphemen, die durch den Morphemanalysator abgetrennt wurden, und zwar unter Verwendung eines Wörterbuchs und von Grammatikregeln; einem Umsetzer zum Umsetzen der Syntaxstruktur des Eingabesatzes, wie vom Syntaxanalysator analysiert, in eine Syntaxstruktur in der Zielsprache; einem Satzgenerator zum Erzeugen eines übersetzten Satzes abhängig von der Syntaxstruktur in der Zielsprache, wie vom Umsetzer umgesetzt; einer Codeeingabeeinrichtung zum Eingeben eines Wörterbuchspezifiziercodes für mindestens eines der Satzwörter in der Quellensprache, das die Verwendung eines speziellen der Wörterbücher erfordert, wie vom Morphemanalysator für die Wörterbuchbezugnahme verwendet, wenn eine Übersetzung in die Entsprechung in der Zielsprache erfolgt, wobei der Wörterbuchspezifiziercode dazu verwendet wird, das spezielle der Wörterbücher zu spezifizieren; einer Erkennungseinrichtung zum Ermitteln, ob ein Wörterbuchspezifiziercode durch die Codeeingabeeinrichtung zu einem der Wörter hinzugefügt wurde; und einer Wörterbuchbezugnahme-Einrichtung, die so arbeitet, daß sie, wenn die Erkennungseinrichtung ermittelt, daß einem der Wörter ein Wörterbuchspezifiziercode zugefügt wurde, auf das spezielle der Wörterbücher Bezug nimmt, und sie auch so arbeitet, daß sie dann, wenn die Erkennungseinrichtung ermittelt, daß keinem der Wörter ein Wörterbuchspezifiziercode zugefügt wurde, auf alle Wörterbücher abhängig von einer vorgegebenen Bezugnahmefolge Bezug nimmt.
- Gemäß der Erfindung wird, wenn ein Satz in einer Quellensprache, der über eine Tastatur in das computerunterstützte Sprachübersetzungsgerät eingegeben wird, mindestens ein Wort enthält, bei dem das System auf ein spezielles Wörterbuch Bezug nehmen muß, der Wörterbuchspezifiziercode, der ein solches spezielles Wörterbuch spezifiziert, von der Codeeingabeeinrichtung eingegeben, so daß der Wörterbuchspezifiziercode diesem Wort hinzugefügt werden kann.
- Wenn ein aus einer Kette von Wörtern bestehender Satz in einer Quellensprache, der ein Wort in der Quellensprache enthält, zu dem der Wörterbuchspezifiziercode in der vorstehend beschriebenen Weise hinzugefügt ist, in den Morphemanalysator eingegeben wird, wird der Satz in der Quellensprache in eine Morphemkette unterteilt, mit der die Erkennungseinrichtung so arbeitet, daß sie ermittelt, ob dem speziellen Wort ein Wörterbuchspezifiziercode hinzugefügt ist. Sollte die Erkennungseinrichtung feststellen, daß einem speziellen Wort ein Wörterbuchspezifiziercode hinzugefügt ist, verwendet die Wörterbuch-Bezugnahmeeinrichtung dasjenige der Wörterbücher, das durch den Wörterbuchspezifiziercode spezifiziert ist. Sollte die Erkennungseinrichtung dagegen ermitteln, daß keinem der Wörter im eingegebenen Satz ein Wörterbuchspezifiziercode hinzugefügt ist, verwendet die Wörterbuch-Bezugnahmeeinrichtung alle Wörterbücher abhängig von der vorgegebenen Folge für Wörterbuchbezugnahme. Auf diese Weise wird, wenn einem speziellen Wort ein Wörterbuchspezifiziercode hinzugefügt ist, demjenigen Wörterbuch, das dem Wörterbuchspezifiziercode zugeordnet ist, während der vom System ausgeführten Wörterbuchbezugnahme Priorität verliehen, um eine Entsprechung in der Zielsprache zu liefern, die dem Wunsch des Benutzers genügt.
- Die Syntaxstruktur der Morphemketten wird anschließend vom Syntaxanalysator abhängig von sowohl den grammatikalischen Regeln als auch derjenigen Information analysiert, die in der Zielsprache die Entsprechung zum speziellen Wort repräsentiert, das mit dem Wörterbuchspezifiziercode versehen ist. Die vom Syntaxanalysator erzeugte Syntaxstruktur wird dann vom Umsetzer in die Syntaxstruktur der Zielsprache umgesetzt.
- Die Syntaxstruktur in der Zielsprache wird vom Satzgenerator dazu verwendet, einen übersetzten Satz abhängig von der Syntaxstruktur der Zielsprache zu erzeugen.
- Nur beispielhaft wird unter Bezugnahme auf die beigefügten Zeichnungen, in denen gleiche Teile mit denselben Bezugszahlen gekennzeichnet sind, eine bevorzugte Ausführungsform beschrieben, wobei die Zeichnungen folgendes darstellen:
- Fig. 1 ist ein Blockdiagramm eines bevorzugten Ausführungsbeispiels eines erfindungsgemäßen computerunterstützten Sprachübersetzungsgeräts;
- Fig. 2 ist ein erläuterndes Diagramm der Übersetzungsniveaus bei automatischer Übersetzung;
- Fig. 3 ist ein Betriebsstrukturdiagramm des Übersetzungsmoduls beim bevorzugten Ausführungsbeispiel;
- Fig. 4 ist ein Blockdiagramm des Übersetzungsmoduls;
- Fig. 5 - 9 sind Diagramme, die den Inhalt jedes in Fig. 4 dargestellten Puffers zeigen;
- Fig. 10 ist ein Flußdiagramm für Wörterbuchbezugnahme; und
- Fig. 11 ist ein Diagramm, das einen Probentext in einer Quellensprache zeigt, wie er in das computerunterstützte Sprachübersetzungsgerät von Fig. 1 eingegeben wurde, und sie zeigt den entsprechenden Ausgangssatz (übersetzten Satz) in einer Zielsprache.
- Fig. 1 zeigt ein Blockdiagramm eines computerunterstützten Sprachübersetzungsgeräts gemäß der Erfindung. Das Übersetzungsgerät weist folgendes auf: eine Haupt-CPU (zentrale Verarbeitungseinheit) 1, einen Hauptspeicher 2, eine CRT 3 (Kathodenstrahlröhre 3), eine Tastatur 4, ein Übersetzungsmodul 5 und eine Speichervorrichtung 6, die Wörterbücher, Grammatikregeln und Baumstruktur-Umsetzregeln für die Übersetzung speichert.
- Wenn in das Übersetzungsmodul 5 ein Text in einer Quellensprache eingegeben wird, übersetzt es die Entsprechung in der Zielsprache und gibt sie aus. Genauer gesagt, wird der über die Tastatur 4 eingegebene Text in der Quellensprache vom Übersetzungsmodul 5 gesteuert durch die Haupt-CPU 1 übertragen. Das Übersetzungsmodul 5 verwendet mehrere abgespeicherte Wörterbücher, Grammatikregeln und Baumstruktur- Umsetzregeln, die im Speicher 6 abgespeichert sind, um den eingegebenen Text in der Quellensprache in die Entsprechung in der Zielsprache zu übersetzen, wie dies später beschrieben wird. Das Ergebnis dieser Übersetzung wird im Hauptspeicher 2 zwischengespeichert und auf der CRT 3 dargestellt.
- Automatische Übersetzung, wie sie vom Übersetzungsmodul 5 ausgeführt wird, besteht im allgemeinen auf den in Fig. 2 dargestellten Analyseniveaus. Wenn der Text in der Quellensprache eingegeben wird, wie dies oben links in Fig. 2 dargestellt ist, schreitet die Analyse über das Niveau L1, Wörterbuchbezugnahme, das Niveau L2, Morphemanalyse, das Niveau 3, grammatischer Aufbau oder Syntax, Analys usw. fort.
- Maschinenübersetzung kann grob gesprochen abhängig von diesen Analyseniveaus in zwei Haupttypen unterteilt werden. Eines ist das Angelverfahren, bei dem Sätze in der Quellensprache bis zum Niveau L6 analysiert werden, um eine Zwischensprache zu erhalten, die weder die Quellensprache noch die Zielsprache ist, jedoch für das Übersetzungsgerät spezifisch ist. Dann schreitet die Analyse über das Niveau L7, Kontexterzeugung, das Niveau L8, Semantikerzeugung, das Niveau L9, Syntaxerzeugung zum Niveau L10, Morphemerzeugung, fort, wo der Text in der Zielsprache, der dem Text in der Quellensprache entspricht, erzeugt wird.
- Das andere ist das Übertragungsverfahren, bei dem die vorstehend genannte Morphemanalyse gemäß dem Niveau L2, die Grammatikkonstruktionsanalyse gemäß dem Niveau L3, die Semantikanalyse gemäß dem Niveau L4 und die Kontextanalyse gemäß dem Niveau L5 ausgeführt werden, um die innere Syntax des Texts in der Quellensprache zu erhalten. Anschließend wird der Text in der Zielsprache erzeugt, nachdem die innere Syntax des Texts in der Quellensprache in die innere Syntax des Texts in der Zielsprache auf demselben Niveau umgesetzt wurde.
- Die vorstehend genannte Analyse wird nachfolgend erläutert.
- Es wird auf die im in Fig. 1 dargestellten Speicher 6 abgespeicherten Wörterbücher Bezug genommen, um den eingegebenen Satz in diskrete Morphemketten (Wortketten) zu unterteilen, um einen Satzteil und andere Grammatikinformation sowie Wortentsprechungen für einzelne Morpheme zu erhalten, und um die Zeitform, die Person und die Anzahl zu analysieren.
- Wie es später beschrieben wird, wird die Struktur (Syntaxanalysebaum) des Satzes einschließlich der Beziehung zwischen Wörtern ermittelt.
- Semantisch korrekte Konstruktionen werden aus den Ergebnissen der mehreren Syntaxanalysen abgeleitet und aufgebaut.
- Es wird auf das Thema des Satzes geschlossen und Abkürzungen und Mehrdeutigkeiten werden klargestellt.
- Das bei der Erfindung verwendete Übersetzungsmodul soll den eingegebenen Satz mindestens bis zum Niveau L3, Syntaxanalyse, analysieren. Genauer gesagt, soll das beim bevorzugten Ausführungsbeispiel verwendete Übersetzungsmodul als ein solches gedacht werden, das aus Komponententeilen besteht, wie sie in Fig. 3 dargestellt sind.
- Fig. 4 zeigt ein Blockdiagramm des Übersetzungsmoduls 5. Ferner zeigen die Fig. 5 bis 9 jeweils den Inhalt von in Fig. 4 abgespeicherten Puffern A bis E während der Übersetzung z.B. des englischen Satzes "This is a pen." in die japanische Entsprechung.
- Unter Bezugnahme auf Fig. 3 bis Fig. 9 wird nun die Weise beschrieben, wie der englische Satz "This is a Pen." in die japanische Entsprechung übersetzt wird.
- Zunächst wird der in das computerunterstützte Sprachübersetzungsgerät eingegebene englische Satz auf die in Fig. 5 dargestellte Weise im Puffer A abgespeichert. Wie durch eine Übersetzungs-CPU 15 abhängig von einem vorgegebenen Übersetzungsprogramm 16 gesteuert, wird die für jedes Wort erforderliche Information vom Wörterbuchbezugnahme-Morphemanalysator 11 erhalten, der die im Speicher 6 abgespeicherten Wörterbücher verwendet, und zwar gemäß dem im Puffer A abgespeicherten Originaltext, und diese Information wird dann in den Puffer B eingespeichert. Z.B. wird der Teil der Satzinformation, der Teil der vorstehend genannten erforderlichen Information ist, so abgespeichert, wie es in Fig. 6 dargestellt ist. Beim dargestellten Beispiel hat "this" die Bedeutung mehrerer Satzteile, wobei vom in Fig. 3 dargestellten Syntaxanalysator 12 auf eine einzige Bedeutung geschlossen wird. Der Syntaxanalysator 12 ermittelt den in Fig. 7 dargestellten Syntaxanalysebaum, der die Beziehung zwischen den einzelnen Wörtern, wie durch die Wörterbücher festgelegt, und grammatischen Regeln zeigt, wie im Speicher 6 abgespeichert, und dieser Syntaxanalysebaum wird im Puffer C abgespeichert. Dieser Syntaxanalysebaum wird wie folgt ermittelt, wobei für die Grammtikregeln im Speicher 6 speziell das gilt, was in Tabelle 1 dargestellt ist. Tabelle 1 Satz Subjekt Prädikat Nominalgruppe Nominalgruppe Subjekt, Prädikat Nominalgruppe Verb, Nominalgruppe Pronomen Artikel, Nomen
- Z.B. stellt die erste Regel fest, daß "ein Satz aus einem Subjekt und einem Prädikat besteht". In der folgenden Beschreibung wird der Syntaxanalysebaum abhängig von diesen Regeln bestimmt.
- Der in Fig. 3 dargestellte Umsetzer 13 setzt die Struktur des Syntaxanalysebaums (siehe Fig. 7) für den Satz in der Quellensprache (Englisch) in die Struktur des Satzes in der Zielsprache (Japanisch), wie in Fig. 8 dargestellt, unter Verwendung der im Speicher 6 abgespeicherten Baumstruktur- Umsetzregeln auf dieselbe Weise um, wie der ursprüngliche Baum durch den vorstehend genannten Syntaxanalysator erstellt wurde. Dann wird das Ergebnis im Puffer D in Fig. 4 abgespeichert. Ein in Fig. 3 dargestellter Satzgenerator 14 fügt den japanischen nachpositionierten Artikel "WA" und Hilfsverben hinzu, wie sie für die erhaltenen japanischen Wörter "KORE PEN DE ARU" geeignet sind (dies liest sich möglicherweise in Englisch als "This, a pen.") und gibt das Ergebnis, wie in Fig. 9 dargestellt, für anschließende Speicherung im Puffer E von Fig. 4 aus. Dieser japanische Satz "KORE WA PEN DE ARU" (auf Englisch liest sich dies "This is a pen.") wird vom Übersetzungsmodul 5 ausgegeben und im Hauptspeicher 2 abgespeichert und gleichzeitig auf der CRT 3 dargestellt.
- Bei dieser Gelegenheit wird der Wörterbuch-Bezugnahmeprozeß, auf den sich die Erfindung bezieht, im Wörterbuchbezug-Morphemanalysator 11 von Fig. 3 auf eine Weise ausgeführt, die nun beschrieben wird. Der Wörterbuch-Bezugnahmeprozeß ist dergestalt, daß ein Wörterbuchspezifiziercode, der eines der Speicherwörterbücher spezifiziert, das der Benutzer während der computerunterstützten Sprachübersetzung verwenden möchte, einem speziellen der den Text in der Quellensprache bildenden Wörter hinzugefügt wird. Wenn ein Wörterbuchspezifiziercode dem speziellen Wort hinzugefügt ist, prüft das Systen das mit dem Wörterbuchspezifiziercode versehende Wort hinsichtlich der Speicherwörterbücher, um vorzugsweise dasjenige der Speicherwörterbücher auszuwählen, das durch den Wörterbuchspezifiziercode repräsentiert wird.
- Fig. 10 veranschaulicht das Flußdiagramm für den Wörterbuch- Bezugnahmeprozeß, und auf dieses wird nun Bezug genommen, um eine detaillierte Erörterung vorzunehmen.
- In einem Schritt S1 erfolgt eine Entscheidung zum Ermitteln, ob ein einem Wort in einer Quellensprache folgender Wörterbuchspezifiziercode im Text in der Quellensprache enthalten ist, wie er in das computerunterstütze Sprachübersetzungsgerät eingegeben wird. Wenn zum Wort kein Wörterbuchspezifiziercode hinzugefügt ist, geht der Programmfluß zu einem Schritt S2 weiter, wenn ein solcher jedoch zum Wort hinzugefügt ist, geht der Programmfluß zu einem Schritt S5 weiter, in dem das System auf das durch den Wörterbuchspezifiziercode, wie er zum speziellen Wort hinzugefügt ist, spezifizierte der Wörterbücher zugreift.
- Im Schritt S2 nimmt das System auf das benutzerspezifische Wörterbuch Bezug, gefolgt von einem Schritt S3, in dem das System auf das technische Wörterbuch Bezug nimmt, und gefolgt von einem Schritt S4, in den das System auf das unveränderliche Hauptwörterbuch Bezug nimmt.
- Danach erfolgt in einem Schritt S6 eine Entscheidung zum Ermitteln, ob die Wörterbuchbezugnahme abgeschlossen ist. Sollte das Entscheidungsergebnis im Schritt S6 "Nein" sein, kehrt der Programmfluß zum Schritt S1 zurück, sollte es jedoch "Ja" sein, endet der Programmfluß.
- Fig. 11 ist ein Beispiel für einen englischen Text, der in das die Erfindung verkörpernde computerunterstützte Sprachbersetzungsgerät eingegeben wurde, und für die japanische Entsprechung, wie sie von diesem Übersetzungsgerät ausgegeben wird. Bei diesem Beispiel ist angenommen, daß Information, die das englische Wort "book" angibt und die nach Übersetzung in die japanische Entsprechung "BUKKU" sein sollte, im benutzerspezifischen Wörterbuch eingetragen ist, wohingegen Information, die das englische Wort "book" anzeigt und bei Übersetzung in die japanische Entsprechung "HON" sein sollte, in das unveränderliche Hauptwörterbuch eingetragen ist. Unter diesen Bedingungen übersetzt das System, wenn der englische Satz "This is a book.", wie in Fig. 11 unter EINGABE 1 dargestellt, in das die Erfindung verkörpernde Übersetzungsgerät in Wortform eingegeben wird, diesen Satz automatisch in den entsprechenden japanischen Satz "KORE WA BUKKU DE ARU." (in Japanisch ausgedrückt), wobei bevorzugt auf das benutzerspezifische Wörterbuch Bezug genommen wurde, wie in Fig. 11 unter AUSGABE 1 dargestellt, da keinem der Wörter im Satz ein Wörterbuchspezifiziercode hinzugefügt ist.
- Wenn dagegen der englische Satz "This is a kj_book.", wie unter EINGABE 2 in Fig. 11 dargestellt, in dem "kj_" einen Wörterbuchspezifiziercode repräsentiert, der nach dem unveränderlichen Hauptwörterbuch verlangt, in das die Erfindung verkörpernde Übersetzunggerät in Wortform eingegeben wird, übersetzt das System diesen Satz automatisch in einen anderen entsprechenden japanischen Satz "KORE WA HON DE ARU." (in Japanisch ausgedrückt), wobei bevorzugt auf das unveränderliche Hauptwörterbuch Bezug genommen wurde, wie in Fig. 11 unter AUSGABE 2 dargestellt.
- Wie vorstehend beschrieben, wird der Wörterbuchspezifiziercode mindestens einem der Wörter in der Quellensprache hinzugefügt, das unter Verwendung spezieller Information zu übersetzen ist, die in einem speziellen der Wörterbücher aufgezeichnet ist, und zwar bevor der Satz in der Quellensprache, der solche Wörter enthält, in das Übersetzungsgerät eingegeben wird. Durch den so hinzugefügten Wörterbuchspezifiziercode führt der Morphemanalysator 11, wenn er die Wörterbuchbezugnahme ausführt, bevorzugten Zugriff auf dieses spezielle unter den Wörterbüchern aus und sucht dort Information, um die erforderliche Information zu liefern, die während der von der Übersetzungsmaschine ausgeführten Sprachübersetzung verwendet wird. Demgemäß ist es deutlich, daß es mit der erfindungsgemäßen computerunterstützen Sprachübersetzungsmaschine möglich ist, übersetzte Ausgangsinformation so schnell und genau wie möglich zu erzielen.
- Obwohl die Erfindung in Verbindung mit ihrem bevorzugten Ausführungsbeispiel unter Bezugnahme auf die beigefügten Zeichnungen vollständig beschrieben wurde, ist zu beachten, daß verschiedene Änderungen und Modifizierungen dem Fachmann erkennbar sind. Z.B. ist, obwohl beim Beschreiben des bevorzugten Ausführungsbeispiels der Erfindung Bezugnahme auf ein Beispiel erfolgte, bei dem ein englischer Satz in Japanisch übersetzt wird, das Konzept der Erfindung in gleicher Weise auf die Übersetzung vom Japanischen oder von irgendeiner anderen Quellensprache in Englisch oder irgendeine andere Zielsprache möglich, die sich sprachlich von der Quellensprache unterscheidet.
Claims (3)
1. Computerunterstütztes Sprachübersetzungsgerät mit einer
Wörterbucheinrichtung (6) zum Abspeichern mehrerer
Wörterbücher, die Wörter in einer Quellensprache und Wörter in
einer Zielsprache einander zuordnen; einer Einrichtung (4) zum
Eingeben eines aus Wörtern in der Quellensprache bestehenden
Satzes und von Zusatzinformation betreffend mindestens ein
Wort in der Quellensprache, und mit einer Einrichtung (5)
zum Erstellen eines entsprechenden Satzes in der Zielsprache
unter Bezugnahme auf die Wörterbucheinrichtung, dadurch
gekennzeichnet, daß die Zusatzinformation ein dem Wort in der
Quellensprache zugeordneter Wörterbuchspezifiziercode ist,
um bei der Übersetzung dieses Worts in der Quellensprache
auf das durch diesen Code spezifizierte Wörterbuch
zuzugreifen, wobei die Wörterbücher zu verschiedenen Übersetzungen
des Worts in der Quellensprache führen, die in der
Zielsprache entsprechende Bedeutungen haben und abhängig von
vorgegebenen Kriterien auswählbar sind.
2. Ubersetzungsgerät nach Anspruch 1 mit einer Wörterbuch-
Prioritätseinstelleinrichtung, die für ein Wort in der
Quellensprache ohne solchen zugeordneten
Wörterbuchspezifiziercode betrieben wird, um dieses Wort mit vorgegebener
Prioritätsreihenfolge mit einem oder mehreren der Wörterbücher
in Beziehung zu setzen.
3. Übersetzungsgerät nach Anspruch 1, mit:
- einem Morphemanalysator (11) zum Abtrennen des
eingegebenen Satzes in der Quellensprache in Morpheme unter
Verwendung der Wörterbücher (6);
- einem Syntaxanalysator (12) zum Analysieren der Syntax
einer Kette aus den Morphemen, die durch den Morphemanalysator
abgetrennt wurden, und zwar unter Verwendung eines
Wörterbuchs und von Grammatikregeln (16);
- einem Umsetzer (13) zum Umsetzen der Syntaxstruktur des
Eingabesatzes, wie vom Syntaxanalysator analysiert, in eine
Syntaxstruktur in der Zielsprache;
- einem Satzgenerator (14) zum Erzeugen eines übersetzten
Satzes abhängig von der Syntaxstruktur in der Zielsprache,
wie vom Umsetzer umgesetzt;
- einer Codeeingabeeinrichtung zum Eingeben eines
Wörterbuchspezifiziercodes für mindestens eines der Satzwörter in
der Quellensprache, das die Verwendung eines speziellen der
Wörterbücher (6) erfordert, wie vom Morphemanalysator für
die Wörterbuchbezugnahme verwendet, wenn eine Übersetzung in
die Entsprechung in der Zielsprache erfolgt, wobei der
Wörterbuchspezifiziercode dazu verwendet wird, das spezielle
der Wörterbücher zu spezifizieren;
- einer Erkennungseinrichtung zum Ermitteln, ob ein
Wörterbuchspezifiziercode durch die Codeeingabeeinrichtung zu
einem der Wörter hinzugefügt wurde; und
- einer Wörterbuchbezugnahme-Einrichtung, die so arbeitet,
daß sie, wenn die Erkennungseinrichtung ermittelt, daß einem
der Wörter ein Wörterbuchspezifiziercode zugefügt wurde, auf
das spezielle der Wörterbücher Bezug nimmt, und sie auch so
arbeitet, daß sie dann, wenn die Erkennungseinrichtung
ermittelt, daß keinem der Wörter ein Wörterbuchspezifiziercode
zugefügt wurde, auf alle Wörterbücher abhängig von einer
vorgegebenen Bezugnahmefolge Bezug nimmt.
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP63214257A JPH0261763A (ja) | 1988-08-29 | 1988-08-29 | 機械翻訳装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
DE68919030D1 DE68919030D1 (de) | 1994-12-01 |
DE68919030T2 true DE68919030T2 (de) | 1995-05-24 |
Family
ID=16652757
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE68919030T Expired - Fee Related DE68919030T2 (de) | 1988-08-29 | 1989-08-24 | Computerunterstütztes Übersetzungsgerät. |
Country Status (3)
Country | Link |
---|---|
EP (1) | EP0357344B1 (de) |
JP (1) | JPH0261763A (de) |
DE (1) | DE68919030T2 (de) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02302873A (ja) * | 1989-05-18 | 1990-12-14 | Sanyo Electric Co Ltd | 機械翻訳装置 |
JPH03268062A (ja) * | 1990-03-19 | 1991-11-28 | Fujitsu Ltd | 機械翻訳電子メール装置における私用単語の登録装置 |
US5175684A (en) * | 1990-12-31 | 1992-12-29 | Trans-Link International Corp. | Automatic text translation and routing system |
US5477451A (en) * | 1991-07-25 | 1995-12-19 | International Business Machines Corp. | Method and system for natural language translation |
US6278967B1 (en) | 1992-08-31 | 2001-08-21 | Logovista Corporation | Automated system for generating natural language translations that are domain-specific, grammar rule-based, and/or based on part-of-speech analysis |
US6760695B1 (en) | 1992-08-31 | 2004-07-06 | Logovista Corporation | Automated natural language processing |
NL9300310A (nl) * | 1993-02-19 | 1994-09-16 | Oce Nederland Bv | Inrichting en werkwijze voor syntactische signaal-analyse. |
US5303151A (en) * | 1993-02-26 | 1994-04-12 | Microsoft Corporation | Method and system for translating documents using translation handles |
US6470306B1 (en) | 1996-04-23 | 2002-10-22 | Logovista Corporation | Automated translation of annotated text based on the determination of locations for inserting annotation tokens and linked ending, end-of-sentence or language tokens |
JP3743678B2 (ja) * | 1996-04-23 | 2006-02-08 | ロゴヴィスタ株式会社 | 自動自然言語翻訳 |
KR101762866B1 (ko) * | 2010-11-05 | 2017-08-16 | 에스케이플래닛 주식회사 | 구문 구조 변환 모델과 어휘 변환 모델을 결합한 기계 번역 장치 및 기계 번역 방법 |
US10592614B1 (en) | 2017-01-19 | 2020-03-17 | Amdocs Development Limited | System, method, and computer program for translating unified ticketing system (UTS) messages |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS58101326A (ja) * | 1981-12-10 | 1983-06-16 | Ricoh Co Ltd | カナ漢字変換処理装置 |
EP0176858B1 (de) * | 1984-09-18 | 1993-01-20 | Sharp Kabushiki Kaisha | Übersetzungssystem |
JPS62203273A (ja) * | 1986-03-04 | 1987-09-07 | Toshiba Corp | 機械翻訳システム |
-
1988
- 1988-08-29 JP JP63214257A patent/JPH0261763A/ja active Pending
-
1989
- 1989-08-24 EP EP89308613A patent/EP0357344B1/de not_active Expired - Lifetime
- 1989-08-24 DE DE68919030T patent/DE68919030T2/de not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JPH0261763A (ja) | 1990-03-01 |
EP0357344A2 (de) | 1990-03-07 |
EP0357344A3 (en) | 1990-08-08 |
EP0357344B1 (de) | 1994-10-26 |
DE68919030D1 (de) | 1994-12-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE69032750T2 (de) | Maschinelles Übersetzungssystem und -verfahren | |
DE3587009T2 (de) | Uebersetzungssystem. | |
DE3587832T2 (de) | Sprachverarbeitungslexikon zum Zweirichtungswiederfinden von morphemischen und semantischen Ausdrücken. | |
DE3789073T2 (de) | System zur maschinellen Übersetzung. | |
DE69427848T2 (de) | Unterstützungssystem zur Herstellung von Wörterbüchern | |
DE69712216T2 (de) | Verfahren und gerät zum übersetzen von einer sparche in eine andere | |
DE68928250T2 (de) | Übertragungssystem mit Übersetzung | |
DE3751276T2 (de) | Zergliedergerät für Naturalsprachen. | |
DE69934371T2 (de) | Apparat und Verfahren zum Verarbeiten einer natürlichen Sprache | |
DE68928231T2 (de) | Verfahren und Vorrichtung zur Maschinenübersetzung | |
DE3587993T2 (de) | Verfahren und Gerät zur Natursprachenverarbeitung. | |
DE69726339T2 (de) | Verfahren und Apparat zur Sprachübersetzung | |
DE68928693T2 (de) | Verfahren zur Behandlung von digitalen Textdaten | |
DE68926845T2 (de) | Maschinenübersetzungssystem | |
DE68913669T2 (de) | Namenaussprache durch einen Synthetisator. | |
DE69129107T2 (de) | Automatisches übersetzungs-und fernübertragungssystem | |
DE69230814T2 (de) | Datenbankauffindungssystem zur Beantwortung natursprachlicher Fragen mit dazugehörigen Tabellen | |
DE69829389T2 (de) | Textnormalisierung unter verwendung einer kontextfreien grammatik | |
DE69130747T2 (de) | Übersetzungsverfahren und -system zur Übertragung zwischen zwei Sprechern mit unterschiedlicher Sprache | |
DE69424350T2 (de) | Kontextsensitive Methode zum Auffinden von Informationen über ein Wort in einem elektronischen Wörterbuch | |
DE69033471T2 (de) | Natürliche Sprache verarbeitendes Gerät | |
DE69031354T2 (de) | Natursprachenverarbeitungssystem | |
DE68923981T2 (de) | Verfahren zur Bestimmung von Textteilen und Verwendung. | |
DE3751716T2 (de) | System zur maschinellen Übersetzung | |
DE69513369T2 (de) | Verfahren und vorrichtung zur zusammenfassung statischer prozesse in eine auf regeln basierende grammatikalisch definierte natuerliche sprache |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
8364 | No opposition during term of opposition | ||
8328 | Change in the person/name/address of the agent |
Free format text: PATENTANWAELTE MUELLER & HOFFMANN, 81667 MUENCHEN |
|
8339 | Ceased/non-payment of the annual fee |