DE68919030T2

DE68919030T2 - Computerunterstütztes Übersetzungsgerät.

Info

Publication number: DE68919030T2
Application number: DE68919030T
Authority: DE
Inventors: Yoji Fukumochi; Tokuyuki Hirai; Shuzo Kugimiya; Ichiko Takanohara-Urb Nakamura; Hitoshi Suzuki
Original assignee: Sharp Corp
Current assignee: Sharp Corp
Priority date: 1988-08-29
Filing date: 1989-08-24
Publication date: 1995-05-24
Anticipated expiration: 2009-08-25
Also published as: JPH0261763A; EP0357344A2; EP0357344A3; EP0357344B1; DE68919030D1

Description

HINTERGRUND DER ERFINDUNG

1. Gebiet der Erfindung

Die Erfindung betrifft ein computerunterstütztes Sprachübersetzungsgerät, das dazu in der Lage ist, ein Übersetzungsausgangssignal so schnell und genau wie möglich zu erstellen.

2. Beschreibung des Standes der Technik

Wo eine Quellensprache unter Verwendung eines computerunterstützten Sprachübersetzungsgeräts in eine Zielsprache zu übersetzen ist, wird eine Informationssuche ausgeführt, die nicht nur auf ein unveränderliches Hauptwörterbuch Bezug nimmt, sondern auch auf ein unveränderliches technisches Wörterbuch, das mit technischen Begriffen für ein spezielles Wissenschaftsgebiet oder mehrere gefüllt ist, und auf ein benutzerspezifisches Wörterbuch, das vom Benutzer oder der Bedienperson mit Wörtern aufgefüllt wird, die für das Geschäft des Benutzers eigentümlich sind. Während des Betriebs des Übersetzungsgeräts erfolgt die vom Computersystem ausgeführte Informationssuche zunächst im benutzerspezifischen Wörterbuch, dann im unveränderlichen technischen Wörterbuch und schließlich im unveränderlichen Hauptwörterbuch, um in der Zielsprache ein geeignetes Wort zu finden, das einem Wort in der Quellensprache entspricht, wie es vom Benutzer über eine Tastatur eingegeben wurde. Anders gesagt, beginnt die Folge der vom im Übersetzungsgerät verwendeten Computersystem ausgeführten Folge der Wörterbuchbezugnahme mit dem vom Benutzer angepaßten Wörterbuch gefolgt vom technischen Wörterbuch und schließlich vom unveränderlichen Hauptwörterbuch.
Diese Folge von Wörterbuchbezugnahme erscheint in den meisten Fällen als geeignet. Wenn der Bediener eines Übersetzungsgeräts es jedoch wünscht, daß das Übersetzungsgerät ein spezielles aus einer verfügbaren Anzahl von Wörtern in der Zielsprache auswählt, die alle einem Wort in der Quellensprache entsprechen, wird die vorstehend erörterte Folge der Wörterbuchbezugnahme häufig ungeschickt. Wenn eine Sprachübersetzung von Englisch in Japanisch betrachtet wird, kann das englische Wort "book" in einige japanische Wörter übersetzt werden, z.B. "HON" (mit einem japanischen Schriftzeichen oder einem Kanji ausgedrückt) und in "BUKKU" (durch japanische Silbenzeichen oder Kana ausgedrückt), die beide einen gebündelten Satz gedruckter Blätter Papier bedeuten. Im gewöhnlichen Sinn ist "HON" ein weit verbreitetes Wort japanischen Ursprungs und ist daher allgemein im unveränderlichen Hauptwörterbuch eingetragen, wohingegen "BUKKU" ein begrenzt verbreitetes japanisches Wort ist, das vom englischen Wort "book" hinsichtlich einer phonetischen Wiedergabe übertragen ist und das daher im allgemeinen im benutzerspezifischen Wörterbuch eingetragen sein wird.
Wenn die vorstehend erörterte Folge von Wörterbuchbezugnahme gemäß dem Stand der Technik unter diesen Umständen verwendet wird, kann es geschehen, daß ein bestimmtes Wort in der Quellensprache in ein entsprechendes Wort in der Zielsprache übersetzt wird, das der Bediener des Übersetzungsgeräts nicht benötigt. Z.B. würde beim Beispiel der oben veranschaulichten Übersetzung von Englisch in Japanisch, bei dem angenommen ist, daß die Bedienperson des Übersetzungsgeräts es wünscht, daß das englische Wort "book" in das entsprechende japanische Wort "HON" übersetzt wird, die Wörterbuchbezugnahme gemäß der Folge aus dem Stand der Technik zu einer Übersetzung des englischen Worts "book" in das andere entsprechende japanische Wort "BUKKU" führen. Wenn dies auftritt, wird die Übersetzung von "book" in "BUKKU" häufig als fehlerhafte Übersetzung angesehen.
Demgemäß würde das bekannte computerunterstütze Sprachübersetzungsgerät nicht notwendigerweise immer eine genaue Sprachübersetzung liefern, und wenn eine solche fehlerhafte Übersetzung auftritt, muß die Bedienperson eine Neudurchsicht vornehmen, was eine relativ verlängerte Zeit zum Abschließen einer Übersetzungsaufgabe erfordert.
EP-A-0 176 858, wie vom vorliegenden Anmelder eingereicht, beschreibt ein Übersetzungssystem, in dem Information, die den "Satzteil" eines Worts in der Quellensprache "z.B. Substantiv, Verb usw.) zusammen mit dem Quellenwort eingegeben wird, um eine korrekte Übersetzung in der Zielsprache zu erzeugen.
EP-A-0 235 739 beschreibt ein Übersetzungssystem, bei dem ein zweites von zwei Wörterbüchern automatisch bevorzugt für die Übersetzung eines eingegebenen Quellenworts konsultiert wird, das vom System als Substantiv erkannt wird und das sich in beiden Wörterbüchern findet.

ZUSAMMENFASSUNG DER ERFINDUNG

Die Erfindung wurde im Hinblick darauf entwickelt, die vorstehend beschriebenen Nachteile im wesentlichen zu überwinden, und es ist ihre Hauptaufgabe, eine schnelle und genaue Übersetzung von einem Wort in einer Quellensprache in ein Wort unter äquivalenten Wörtern in einer Zielsprache zu liefern.
Die Erfindung schafft ein computerunterstütztes Sprachübersetzungsgerät mit einer Wörterbucheinrichtung zum Abspeichern mehrerer Wörterbücher, die Wörter in einer Quellensprache und Wörter in einer Zielsprache einander zuordnen; einer Einrichtung zum Eingeben eines aus Wörtern in der Quellensprache bestehenden Satzes und von Zusatzinformation betreffend mindestens ein Wort in der Quellensprache, und mit einer Einrichtung zum Erstellen eines entsprechenden Satzes in der Zielsprache unter Bezugnahme auf die Wörterbucheinrichtung, dadurch gekennzeichnet, daß die Zusatzinformation ein dem Wort in der Quellensprache zugeordneter Wörterbuchspezifiziercode ist, um bei der Übersetzung dieses Worts in der Quellensprache auf das durch diesen Code spezifizierte Wörterbuch zuzugreifen, wobei die Wörterbücher zu verschiedenen Übersetzungen des Worts in der Quellensprache führen, die in der Zielsprache entsprechende Bedeutungen haben und abhängig von vorgegebenen Kriterien auswählbar sind.
Gemäß einem bevorzugten Ausführungsbeispiel der Erfindung ist ein computerunterstütztes Sprachübersetzungsgerät geschaffen, mit einem Morphemanalysator zum Abtrennen des eingegebenen Satzes in der Quellensprache in Morpheme unter Verwendung der Wörterbücher; einem Syntaxanalysator zum Analysieren der Syntax einer Kette aus den Morphemen, die durch den Morphemanalysator abgetrennt wurden, und zwar unter Verwendung eines Wörterbuchs und von Grammatikregeln; einem Umsetzer zum Umsetzen der Syntaxstruktur des Eingabesatzes, wie vom Syntaxanalysator analysiert, in eine Syntaxstruktur in der Zielsprache; einem Satzgenerator zum Erzeugen eines übersetzten Satzes abhängig von der Syntaxstruktur in der Zielsprache, wie vom Umsetzer umgesetzt; einer Codeeingabeeinrichtung zum Eingeben eines Wörterbuchspezifiziercodes für mindestens eines der Satzwörter in der Quellensprache, das die Verwendung eines speziellen der Wörterbücher erfordert, wie vom Morphemanalysator für die Wörterbuchbezugnahme verwendet, wenn eine Übersetzung in die Entsprechung in der Zielsprache erfolgt, wobei der Wörterbuchspezifiziercode dazu verwendet wird, das spezielle der Wörterbücher zu spezifizieren; einer Erkennungseinrichtung zum Ermitteln, ob ein Wörterbuchspezifiziercode durch die Codeeingabeeinrichtung zu einem der Wörter hinzugefügt wurde; und einer Wörterbuchbezugnahme-Einrichtung, die so arbeitet, daß sie, wenn die Erkennungseinrichtung ermittelt, daß einem der Wörter ein Wörterbuchspezifiziercode zugefügt wurde, auf das spezielle der Wörterbücher Bezug nimmt, und sie auch so arbeitet, daß sie dann, wenn die Erkennungseinrichtung ermittelt, daß keinem der Wörter ein Wörterbuchspezifiziercode zugefügt wurde, auf alle Wörterbücher abhängig von einer vorgegebenen Bezugnahmefolge Bezug nimmt.
Gemäß der Erfindung wird, wenn ein Satz in einer Quellensprache, der über eine Tastatur in das computerunterstützte Sprachübersetzungsgerät eingegeben wird, mindestens ein Wort enthält, bei dem das System auf ein spezielles Wörterbuch Bezug nehmen muß, der Wörterbuchspezifiziercode, der ein solches spezielles Wörterbuch spezifiziert, von der Codeeingabeeinrichtung eingegeben, so daß der Wörterbuchspezifiziercode diesem Wort hinzugefügt werden kann.
Wenn ein aus einer Kette von Wörtern bestehender Satz in einer Quellensprache, der ein Wort in der Quellensprache enthält, zu dem der Wörterbuchspezifiziercode in der vorstehend beschriebenen Weise hinzugefügt ist, in den Morphemanalysator eingegeben wird, wird der Satz in der Quellensprache in eine Morphemkette unterteilt, mit der die Erkennungseinrichtung so arbeitet, daß sie ermittelt, ob dem speziellen Wort ein Wörterbuchspezifiziercode hinzugefügt ist. Sollte die Erkennungseinrichtung feststellen, daß einem speziellen Wort ein Wörterbuchspezifiziercode hinzugefügt ist, verwendet die Wörterbuch-Bezugnahmeeinrichtung dasjenige der Wörterbücher, das durch den Wörterbuchspezifiziercode spezifiziert ist. Sollte die Erkennungseinrichtung dagegen ermitteln, daß keinem der Wörter im eingegebenen Satz ein Wörterbuchspezifiziercode hinzugefügt ist, verwendet die Wörterbuch-Bezugnahmeeinrichtung alle Wörterbücher abhängig von der vorgegebenen Folge für Wörterbuchbezugnahme. Auf diese Weise wird, wenn einem speziellen Wort ein Wörterbuchspezifiziercode hinzugefügt ist, demjenigen Wörterbuch, das dem Wörterbuchspezifiziercode zugeordnet ist, während der vom System ausgeführten Wörterbuchbezugnahme Priorität verliehen, um eine Entsprechung in der Zielsprache zu liefern, die dem Wunsch des Benutzers genügt.
Die Syntaxstruktur der Morphemketten wird anschließend vom Syntaxanalysator abhängig von sowohl den grammatikalischen Regeln als auch derjenigen Information analysiert, die in der Zielsprache die Entsprechung zum speziellen Wort repräsentiert, das mit dem Wörterbuchspezifiziercode versehen ist. Die vom Syntaxanalysator erzeugte Syntaxstruktur wird dann vom Umsetzer in die Syntaxstruktur der Zielsprache umgesetzt.
Die Syntaxstruktur in der Zielsprache wird vom Satzgenerator dazu verwendet, einen übersetzten Satz abhängig von der Syntaxstruktur der Zielsprache zu erzeugen.

KURZE BESCHREIBUNG DER ZEICHNUNGEN

Nur beispielhaft wird unter Bezugnahme auf die beigefügten Zeichnungen, in denen gleiche Teile mit denselben Bezugszahlen gekennzeichnet sind, eine bevorzugte Ausführungsform beschrieben, wobei die Zeichnungen folgendes darstellen:
Fig. 1 ist ein Blockdiagramm eines bevorzugten Ausführungsbeispiels eines erfindungsgemäßen computerunterstützten Sprachübersetzungsgeräts;
Fig. 2 ist ein erläuterndes Diagramm der Übersetzungsniveaus bei automatischer Übersetzung;
Fig. 3 ist ein Betriebsstrukturdiagramm des Übersetzungsmoduls beim bevorzugten Ausführungsbeispiel;
Fig. 4 ist ein Blockdiagramm des Übersetzungsmoduls;
Fig. 5 - 9 sind Diagramme, die den Inhalt jedes in Fig. 4 dargestellten Puffers zeigen;
Fig. 10 ist ein Flußdiagramm für Wörterbuchbezugnahme; und
Fig. 11 ist ein Diagramm, das einen Probentext in einer Quellensprache zeigt, wie er in das computerunterstützte Sprachübersetzungsgerät von Fig. 1 eingegeben wurde, und sie zeigt den entsprechenden Ausgangssatz (übersetzten Satz) in einer Zielsprache.

DETAILLIERTE BESCHREIBUNG DES BEVORZUGTEN AUSFÜHRUNGSBEISPIELS

Fig. 1 zeigt ein Blockdiagramm eines computerunterstützten Sprachübersetzungsgeräts gemäß der Erfindung. Das Übersetzungsgerät weist folgendes auf: eine Haupt-CPU (zentrale Verarbeitungseinheit) 1, einen Hauptspeicher 2, eine CRT 3 (Kathodenstrahlröhre 3), eine Tastatur 4, ein Übersetzungsmodul 5 und eine Speichervorrichtung 6, die Wörterbücher, Grammatikregeln und Baumstruktur-Umsetzregeln für die Übersetzung speichert.
Wenn in das Übersetzungsmodul 5 ein Text in einer Quellensprache eingegeben wird, übersetzt es die Entsprechung in der Zielsprache und gibt sie aus. Genauer gesagt, wird der über die Tastatur 4 eingegebene Text in der Quellensprache vom Übersetzungsmodul 5 gesteuert durch die Haupt-CPU 1 übertragen. Das Übersetzungsmodul 5 verwendet mehrere abgespeicherte Wörterbücher, Grammatikregeln und Baumstruktur- Umsetzregeln, die im Speicher 6 abgespeichert sind, um den eingegebenen Text in der Quellensprache in die Entsprechung in der Zielsprache zu übersetzen, wie dies später beschrieben wird. Das Ergebnis dieser Übersetzung wird im Hauptspeicher 2 zwischengespeichert und auf der CRT 3 dargestellt.
Automatische Übersetzung, wie sie vom Übersetzungsmodul 5 ausgeführt wird, besteht im allgemeinen auf den in Fig. 2 dargestellten Analyseniveaus. Wenn der Text in der Quellensprache eingegeben wird, wie dies oben links in Fig. 2 dargestellt ist, schreitet die Analyse über das Niveau L1, Wörterbuchbezugnahme, das Niveau L2, Morphemanalyse, das Niveau 3, grammatischer Aufbau oder Syntax, Analys usw. fort.
Maschinenübersetzung kann grob gesprochen abhängig von diesen Analyseniveaus in zwei Haupttypen unterteilt werden. Eines ist das Angelverfahren, bei dem Sätze in der Quellensprache bis zum Niveau L6 analysiert werden, um eine Zwischensprache zu erhalten, die weder die Quellensprache noch die Zielsprache ist, jedoch für das Übersetzungsgerät spezifisch ist. Dann schreitet die Analyse über das Niveau L7, Kontexterzeugung, das Niveau L8, Semantikerzeugung, das Niveau L9, Syntaxerzeugung zum Niveau L10, Morphemerzeugung, fort, wo der Text in der Zielsprache, der dem Text in der Quellensprache entspricht, erzeugt wird.
Das andere ist das Übertragungsverfahren, bei dem die vorstehend genannte Morphemanalyse gemäß dem Niveau L2, die Grammatikkonstruktionsanalyse gemäß dem Niveau L3, die Semantikanalyse gemäß dem Niveau L4 und die Kontextanalyse gemäß dem Niveau L5 ausgeführt werden, um die innere Syntax des Texts in der Quellensprache zu erhalten. Anschließend wird der Text in der Zielsprache erzeugt, nachdem die innere Syntax des Texts in der Quellensprache in die innere Syntax des Texts in der Zielsprache auf demselben Niveau umgesetzt wurde.
Die vorstehend genannte Analyse wird nachfolgend erläutert.

* Wörterbuchbezugnahme und Morphemanalyse

Es wird auf die im in Fig. 1 dargestellten Speicher 6 abgespeicherten Wörterbücher Bezug genommen, um den eingegebenen Satz in diskrete Morphemketten (Wortketten) zu unterteilen, um einen Satzteil und andere Grammatikinformation sowie Wortentsprechungen für einzelne Morpheme zu erhalten, und um die Zeitform, die Person und die Anzahl zu analysieren.

* Syntaxanalyse

Wie es später beschrieben wird, wird die Struktur (Syntaxanalysebaum) des Satzes einschließlich der Beziehung zwischen Wörtern ermittelt.

* Semantikanalyse

Semantisch korrekte Konstruktionen werden aus den Ergebnissen der mehreren Syntaxanalysen abgeleitet und aufgebaut.

* Kontextanalyse

Es wird auf das Thema des Satzes geschlossen und Abkürzungen und Mehrdeutigkeiten werden klargestellt.
Das bei der Erfindung verwendete Übersetzungsmodul soll den eingegebenen Satz mindestens bis zum Niveau L3, Syntaxanalyse, analysieren. Genauer gesagt, soll das beim bevorzugten Ausführungsbeispiel verwendete Übersetzungsmodul als ein solches gedacht werden, das aus Komponententeilen besteht, wie sie in Fig. 3 dargestellt sind.
Fig. 4 zeigt ein Blockdiagramm des Übersetzungsmoduls 5. Ferner zeigen die Fig. 5 bis 9 jeweils den Inhalt von in Fig. 4 abgespeicherten Puffern A bis E während der Übersetzung z.B. des englischen Satzes "This is a pen." in die japanische Entsprechung.
Unter Bezugnahme auf Fig. 3 bis Fig. 9 wird nun die Weise beschrieben, wie der englische Satz "This is a Pen." in die japanische Entsprechung übersetzt wird.
Zunächst wird der in das computerunterstützte Sprachübersetzungsgerät eingegebene englische Satz auf die in Fig. 5 dargestellte Weise im Puffer A abgespeichert. Wie durch eine Übersetzungs-CPU 15 abhängig von einem vorgegebenen Übersetzungsprogramm 16 gesteuert, wird die für jedes Wort erforderliche Information vom Wörterbuchbezugnahme-Morphemanalysator 11 erhalten, der die im Speicher 6 abgespeicherten Wörterbücher verwendet, und zwar gemäß dem im Puffer A abgespeicherten Originaltext, und diese Information wird dann in den Puffer B eingespeichert. Z.B. wird der Teil der Satzinformation, der Teil der vorstehend genannten erforderlichen Information ist, so abgespeichert, wie es in Fig. 6 dargestellt ist. Beim dargestellten Beispiel hat "this" die Bedeutung mehrerer Satzteile, wobei vom in Fig. 3 dargestellten Syntaxanalysator 12 auf eine einzige Bedeutung geschlossen wird. Der Syntaxanalysator 12 ermittelt den in Fig. 7 dargestellten Syntaxanalysebaum, der die Beziehung zwischen den einzelnen Wörtern, wie durch die Wörterbücher festgelegt, und grammatischen Regeln zeigt, wie im Speicher 6 abgespeichert, und dieser Syntaxanalysebaum wird im Puffer C abgespeichert. Dieser Syntaxanalysebaum wird wie folgt ermittelt, wobei für die Grammtikregeln im Speicher 6 speziell das gilt, was in Tabelle 1 dargestellt ist. Tabelle 1 Satz Subjekt Prädikat Nominalgruppe Nominalgruppe Subjekt, Prädikat Nominalgruppe Verb, Nominalgruppe Pronomen Artikel, Nomen
Z.B. stellt die erste Regel fest, daß "ein Satz aus einem Subjekt und einem Prädikat besteht". In der folgenden Beschreibung wird der Syntaxanalysebaum abhängig von diesen Regeln bestimmt.
Der in Fig. 3 dargestellte Umsetzer 13 setzt die Struktur des Syntaxanalysebaums (siehe Fig. 7) für den Satz in der Quellensprache (Englisch) in die Struktur des Satzes in der Zielsprache (Japanisch), wie in Fig. 8 dargestellt, unter Verwendung der im Speicher 6 abgespeicherten Baumstruktur- Umsetzregeln auf dieselbe Weise um, wie der ursprüngliche Baum durch den vorstehend genannten Syntaxanalysator erstellt wurde. Dann wird das Ergebnis im Puffer D in Fig. 4 abgespeichert. Ein in Fig. 3 dargestellter Satzgenerator 14 fügt den japanischen nachpositionierten Artikel "WA" und Hilfsverben hinzu, wie sie für die erhaltenen japanischen Wörter "KORE PEN DE ARU" geeignet sind (dies liest sich möglicherweise in Englisch als "This, a pen.") und gibt das Ergebnis, wie in Fig. 9 dargestellt, für anschließende Speicherung im Puffer E von Fig. 4 aus. Dieser japanische Satz "KORE WA PEN DE ARU" (auf Englisch liest sich dies "This is a pen.") wird vom Übersetzungsmodul 5 ausgegeben und im Hauptspeicher 2 abgespeichert und gleichzeitig auf der CRT 3 dargestellt.
Bei dieser Gelegenheit wird der Wörterbuch-Bezugnahmeprozeß, auf den sich die Erfindung bezieht, im Wörterbuchbezug-Morphemanalysator 11 von Fig. 3 auf eine Weise ausgeführt, die nun beschrieben wird. Der Wörterbuch-Bezugnahmeprozeß ist dergestalt, daß ein Wörterbuchspezifiziercode, der eines der Speicherwörterbücher spezifiziert, das der Benutzer während der computerunterstützten Sprachübersetzung verwenden möchte, einem speziellen der den Text in der Quellensprache bildenden Wörter hinzugefügt wird. Wenn ein Wörterbuchspezifiziercode dem speziellen Wort hinzugefügt ist, prüft das Systen das mit dem Wörterbuchspezifiziercode versehende Wort hinsichtlich der Speicherwörterbücher, um vorzugsweise dasjenige der Speicherwörterbücher auszuwählen, das durch den Wörterbuchspezifiziercode repräsentiert wird.
Fig. 10 veranschaulicht das Flußdiagramm für den Wörterbuch- Bezugnahmeprozeß, und auf dieses wird nun Bezug genommen, um eine detaillierte Erörterung vorzunehmen.
In einem Schritt S1 erfolgt eine Entscheidung zum Ermitteln, ob ein einem Wort in einer Quellensprache folgender Wörterbuchspezifiziercode im Text in der Quellensprache enthalten ist, wie er in das computerunterstütze Sprachübersetzungsgerät eingegeben wird. Wenn zum Wort kein Wörterbuchspezifiziercode hinzugefügt ist, geht der Programmfluß zu einem Schritt S2 weiter, wenn ein solcher jedoch zum Wort hinzugefügt ist, geht der Programmfluß zu einem Schritt S5 weiter, in dem das System auf das durch den Wörterbuchspezifiziercode, wie er zum speziellen Wort hinzugefügt ist, spezifizierte der Wörterbücher zugreift.
Im Schritt S2 nimmt das System auf das benutzerspezifische Wörterbuch Bezug, gefolgt von einem Schritt S3, in dem das System auf das technische Wörterbuch Bezug nimmt, und gefolgt von einem Schritt S4, in den das System auf das unveränderliche Hauptwörterbuch Bezug nimmt.
Danach erfolgt in einem Schritt S6 eine Entscheidung zum Ermitteln, ob die Wörterbuchbezugnahme abgeschlossen ist. Sollte das Entscheidungsergebnis im Schritt S6 "Nein" sein, kehrt der Programmfluß zum Schritt S1 zurück, sollte es jedoch "Ja" sein, endet der Programmfluß.
Fig. 11 ist ein Beispiel für einen englischen Text, der in das die Erfindung verkörpernde computerunterstützte Sprachbersetzungsgerät eingegeben wurde, und für die japanische Entsprechung, wie sie von diesem Übersetzungsgerät ausgegeben wird. Bei diesem Beispiel ist angenommen, daß Information, die das englische Wort "book" angibt und die nach Übersetzung in die japanische Entsprechung "BUKKU" sein sollte, im benutzerspezifischen Wörterbuch eingetragen ist, wohingegen Information, die das englische Wort "book" anzeigt und bei Übersetzung in die japanische Entsprechung "HON" sein sollte, in das unveränderliche Hauptwörterbuch eingetragen ist. Unter diesen Bedingungen übersetzt das System, wenn der englische Satz "This is a book.", wie in Fig. 11 unter EINGABE 1 dargestellt, in das die Erfindung verkörpernde Übersetzungsgerät in Wortform eingegeben wird, diesen Satz automatisch in den entsprechenden japanischen Satz "KORE WA BUKKU DE ARU." (in Japanisch ausgedrückt), wobei bevorzugt auf das benutzerspezifische Wörterbuch Bezug genommen wurde, wie in Fig. 11 unter AUSGABE 1 dargestellt, da keinem der Wörter im Satz ein Wörterbuchspezifiziercode hinzugefügt ist.
Wenn dagegen der englische Satz "This is a kj_book.", wie unter EINGABE 2 in Fig. 11 dargestellt, in dem "kj_" einen Wörterbuchspezifiziercode repräsentiert, der nach dem unveränderlichen Hauptwörterbuch verlangt, in das die Erfindung verkörpernde Übersetzunggerät in Wortform eingegeben wird, übersetzt das System diesen Satz automatisch in einen anderen entsprechenden japanischen Satz "KORE WA HON DE ARU." (in Japanisch ausgedrückt), wobei bevorzugt auf das unveränderliche Hauptwörterbuch Bezug genommen wurde, wie in Fig. 11 unter AUSGABE 2 dargestellt.
Wie vorstehend beschrieben, wird der Wörterbuchspezifiziercode mindestens einem der Wörter in der Quellensprache hinzugefügt, das unter Verwendung spezieller Information zu übersetzen ist, die in einem speziellen der Wörterbücher aufgezeichnet ist, und zwar bevor der Satz in der Quellensprache, der solche Wörter enthält, in das Übersetzungsgerät eingegeben wird. Durch den so hinzugefügten Wörterbuchspezifiziercode führt der Morphemanalysator 11, wenn er die Wörterbuchbezugnahme ausführt, bevorzugten Zugriff auf dieses spezielle unter den Wörterbüchern aus und sucht dort Information, um die erforderliche Information zu liefern, die während der von der Übersetzungsmaschine ausgeführten Sprachübersetzung verwendet wird. Demgemäß ist es deutlich, daß es mit der erfindungsgemäßen computerunterstützen Sprachübersetzungsmaschine möglich ist, übersetzte Ausgangsinformation so schnell und genau wie möglich zu erzielen.
Obwohl die Erfindung in Verbindung mit ihrem bevorzugten Ausführungsbeispiel unter Bezugnahme auf die beigefügten Zeichnungen vollständig beschrieben wurde, ist zu beachten, daß verschiedene Änderungen und Modifizierungen dem Fachmann erkennbar sind. Z.B. ist, obwohl beim Beschreiben des bevorzugten Ausführungsbeispiels der Erfindung Bezugnahme auf ein Beispiel erfolgte, bei dem ein englischer Satz in Japanisch übersetzt wird, das Konzept der Erfindung in gleicher Weise auf die Übersetzung vom Japanischen oder von irgendeiner anderen Quellensprache in Englisch oder irgendeine andere Zielsprache möglich, die sich sprachlich von der Quellensprache unterscheidet.

Claims

1. Computerunterstütztes Sprachübersetzungsgerät mit einer Wörterbucheinrichtung (6) zum Abspeichern mehrerer Wörterbücher, die Wörter in einer Quellensprache und Wörter in einer Zielsprache einander zuordnen; einer Einrichtung (4) zum Eingeben eines aus Wörtern in der Quellensprache bestehenden Satzes und von Zusatzinformation betreffend mindestens ein Wort in der Quellensprache, und mit einer Einrichtung (5) zum Erstellen eines entsprechenden Satzes in der Zielsprache unter Bezugnahme auf die Wörterbucheinrichtung, dadurch gekennzeichnet, daß die Zusatzinformation ein dem Wort in der Quellensprache zugeordneter Wörterbuchspezifiziercode ist, um bei der Übersetzung dieses Worts in der Quellensprache auf das durch diesen Code spezifizierte Wörterbuch zuzugreifen, wobei die Wörterbücher zu verschiedenen Übersetzungen des Worts in der Quellensprache führen, die in der Zielsprache entsprechende Bedeutungen haben und abhängig von vorgegebenen Kriterien auswählbar sind.

2. Ubersetzungsgerät nach Anspruch 1 mit einer Wörterbuch- Prioritätseinstelleinrichtung, die für ein Wort in der Quellensprache ohne solchen zugeordneten Wörterbuchspezifiziercode betrieben wird, um dieses Wort mit vorgegebener Prioritätsreihenfolge mit einem oder mehreren der Wörterbücher in Beziehung zu setzen.

3. Übersetzungsgerät nach Anspruch 1, mit:

- einem Morphemanalysator (11) zum Abtrennen des eingegebenen Satzes in der Quellensprache in Morpheme unter Verwendung der Wörterbücher (6);

- einem Syntaxanalysator (12) zum Analysieren der Syntax einer Kette aus den Morphemen, die durch den Morphemanalysator abgetrennt wurden, und zwar unter Verwendung eines Wörterbuchs und von Grammatikregeln (16);

- einem Umsetzer (13) zum Umsetzen der Syntaxstruktur des Eingabesatzes, wie vom Syntaxanalysator analysiert, in eine Syntaxstruktur in der Zielsprache;

- einem Satzgenerator (14) zum Erzeugen eines übersetzten Satzes abhängig von der Syntaxstruktur in der Zielsprache, wie vom Umsetzer umgesetzt;

- einer Codeeingabeeinrichtung zum Eingeben eines Wörterbuchspezifiziercodes für mindestens eines der Satzwörter in der Quellensprache, das die Verwendung eines speziellen der Wörterbücher (6) erfordert, wie vom Morphemanalysator für die Wörterbuchbezugnahme verwendet, wenn eine Übersetzung in die Entsprechung in der Zielsprache erfolgt, wobei der Wörterbuchspezifiziercode dazu verwendet wird, das spezielle der Wörterbücher zu spezifizieren;

- einer Erkennungseinrichtung zum Ermitteln, ob ein Wörterbuchspezifiziercode durch die Codeeingabeeinrichtung zu einem der Wörter hinzugefügt wurde; und

- einer Wörterbuchbezugnahme-Einrichtung, die so arbeitet, daß sie, wenn die Erkennungseinrichtung ermittelt, daß einem der Wörter ein Wörterbuchspezifiziercode zugefügt wurde, auf das spezielle der Wörterbücher Bezug nimmt, und sie auch so arbeitet, daß sie dann, wenn die Erkennungseinrichtung ermittelt, daß keinem der Wörter ein Wörterbuchspezifiziercode zugefügt wurde, auf alle Wörterbücher abhängig von einer vorgegebenen Bezugnahmefolge Bezug nimmt.