DE68919030T2 - Computerunterstütztes Übersetzungsgerät. - Google Patents

Computerunterstütztes Übersetzungsgerät.

Info

Publication number
DE68919030T2
DE68919030T2 DE68919030T DE68919030T DE68919030T2 DE 68919030 T2 DE68919030 T2 DE 68919030T2 DE 68919030 T DE68919030 T DE 68919030T DE 68919030 T DE68919030 T DE 68919030T DE 68919030 T2 DE68919030 T2 DE 68919030T2
Authority
DE
Germany
Prior art keywords
dictionary
language
word
sentence
dictionaries
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
DE68919030T
Other languages
English (en)
Other versions
DE68919030D1 (de
Inventor
Yoji Fukumochi
Tokuyuki Hirai
Shuzo Kugimiya
Ichiko Takanohara-Urb Nakamura
Hitoshi Suzuki
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Application granted granted Critical
Publication of DE68919030D1 publication Critical patent/DE68919030D1/de
Publication of DE68919030T2 publication Critical patent/DE68919030T2/de
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/268Morphological analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • G06F40/47Machine-assisted translation, e.g. using translation memory
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/55Rule-based translation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Description

    HINTERGRUND DER ERFINDUNG 1. Gebiet der Erfindung
  • Die Erfindung betrifft ein computerunterstütztes Sprachübersetzungsgerät, das dazu in der Lage ist, ein Übersetzungsausgangssignal so schnell und genau wie möglich zu erstellen.
  • 2. Beschreibung des Standes der Technik
  • Wo eine Quellensprache unter Verwendung eines computerunterstützten Sprachübersetzungsgeräts in eine Zielsprache zu übersetzen ist, wird eine Informationssuche ausgeführt, die nicht nur auf ein unveränderliches Hauptwörterbuch Bezug nimmt, sondern auch auf ein unveränderliches technisches Wörterbuch, das mit technischen Begriffen für ein spezielles Wissenschaftsgebiet oder mehrere gefüllt ist, und auf ein benutzerspezifisches Wörterbuch, das vom Benutzer oder der Bedienperson mit Wörtern aufgefüllt wird, die für das Geschäft des Benutzers eigentümlich sind. Während des Betriebs des Übersetzungsgeräts erfolgt die vom Computersystem ausgeführte Informationssuche zunächst im benutzerspezifischen Wörterbuch, dann im unveränderlichen technischen Wörterbuch und schließlich im unveränderlichen Hauptwörterbuch, um in der Zielsprache ein geeignetes Wort zu finden, das einem Wort in der Quellensprache entspricht, wie es vom Benutzer über eine Tastatur eingegeben wurde. Anders gesagt, beginnt die Folge der vom im Übersetzungsgerät verwendeten Computersystem ausgeführten Folge der Wörterbuchbezugnahme mit dem vom Benutzer angepaßten Wörterbuch gefolgt vom technischen Wörterbuch und schließlich vom unveränderlichen Hauptwörterbuch.
  • Diese Folge von Wörterbuchbezugnahme erscheint in den meisten Fällen als geeignet. Wenn der Bediener eines Übersetzungsgeräts es jedoch wünscht, daß das Übersetzungsgerät ein spezielles aus einer verfügbaren Anzahl von Wörtern in der Zielsprache auswählt, die alle einem Wort in der Quellensprache entsprechen, wird die vorstehend erörterte Folge der Wörterbuchbezugnahme häufig ungeschickt. Wenn eine Sprachübersetzung von Englisch in Japanisch betrachtet wird, kann das englische Wort "book" in einige japanische Wörter übersetzt werden, z.B. "HON" (mit einem japanischen Schriftzeichen oder einem Kanji ausgedrückt) und in "BUKKU" (durch japanische Silbenzeichen oder Kana ausgedrückt), die beide einen gebündelten Satz gedruckter Blätter Papier bedeuten. Im gewöhnlichen Sinn ist "HON" ein weit verbreitetes Wort japanischen Ursprungs und ist daher allgemein im unveränderlichen Hauptwörterbuch eingetragen, wohingegen "BUKKU" ein begrenzt verbreitetes japanisches Wort ist, das vom englischen Wort "book" hinsichtlich einer phonetischen Wiedergabe übertragen ist und das daher im allgemeinen im benutzerspezifischen Wörterbuch eingetragen sein wird.
  • Wenn die vorstehend erörterte Folge von Wörterbuchbezugnahme gemäß dem Stand der Technik unter diesen Umständen verwendet wird, kann es geschehen, daß ein bestimmtes Wort in der Quellensprache in ein entsprechendes Wort in der Zielsprache übersetzt wird, das der Bediener des Übersetzungsgeräts nicht benötigt. Z.B. würde beim Beispiel der oben veranschaulichten Übersetzung von Englisch in Japanisch, bei dem angenommen ist, daß die Bedienperson des Übersetzungsgeräts es wünscht, daß das englische Wort "book" in das entsprechende japanische Wort "HON" übersetzt wird, die Wörterbuchbezugnahme gemäß der Folge aus dem Stand der Technik zu einer Übersetzung des englischen Worts "book" in das andere entsprechende japanische Wort "BUKKU" führen. Wenn dies auftritt, wird die Übersetzung von "book" in "BUKKU" häufig als fehlerhafte Übersetzung angesehen.
  • Demgemäß würde das bekannte computerunterstütze Sprachübersetzungsgerät nicht notwendigerweise immer eine genaue Sprachübersetzung liefern, und wenn eine solche fehlerhafte Übersetzung auftritt, muß die Bedienperson eine Neudurchsicht vornehmen, was eine relativ verlängerte Zeit zum Abschließen einer Übersetzungsaufgabe erfordert.
  • EP-A-0 176 858, wie vom vorliegenden Anmelder eingereicht, beschreibt ein Übersetzungssystem, in dem Information, die den "Satzteil" eines Worts in der Quellensprache "z.B. Substantiv, Verb usw.) zusammen mit dem Quellenwort eingegeben wird, um eine korrekte Übersetzung in der Zielsprache zu erzeugen.
  • EP-A-0 235 739 beschreibt ein Übersetzungssystem, bei dem ein zweites von zwei Wörterbüchern automatisch bevorzugt für die Übersetzung eines eingegebenen Quellenworts konsultiert wird, das vom System als Substantiv erkannt wird und das sich in beiden Wörterbüchern findet.
  • ZUSAMMENFASSUNG DER ERFINDUNG
  • Die Erfindung wurde im Hinblick darauf entwickelt, die vorstehend beschriebenen Nachteile im wesentlichen zu überwinden, und es ist ihre Hauptaufgabe, eine schnelle und genaue Übersetzung von einem Wort in einer Quellensprache in ein Wort unter äquivalenten Wörtern in einer Zielsprache zu liefern.
  • Die Erfindung schafft ein computerunterstütztes Sprachübersetzungsgerät mit einer Wörterbucheinrichtung zum Abspeichern mehrerer Wörterbücher, die Wörter in einer Quellensprache und Wörter in einer Zielsprache einander zuordnen; einer Einrichtung zum Eingeben eines aus Wörtern in der Quellensprache bestehenden Satzes und von Zusatzinformation betreffend mindestens ein Wort in der Quellensprache, und mit einer Einrichtung zum Erstellen eines entsprechenden Satzes in der Zielsprache unter Bezugnahme auf die Wörterbucheinrichtung, dadurch gekennzeichnet, daß die Zusatzinformation ein dem Wort in der Quellensprache zugeordneter Wörterbuchspezifiziercode ist, um bei der Übersetzung dieses Worts in der Quellensprache auf das durch diesen Code spezifizierte Wörterbuch zuzugreifen, wobei die Wörterbücher zu verschiedenen Übersetzungen des Worts in der Quellensprache führen, die in der Zielsprache entsprechende Bedeutungen haben und abhängig von vorgegebenen Kriterien auswählbar sind.
  • Gemäß einem bevorzugten Ausführungsbeispiel der Erfindung ist ein computerunterstütztes Sprachübersetzungsgerät geschaffen, mit einem Morphemanalysator zum Abtrennen des eingegebenen Satzes in der Quellensprache in Morpheme unter Verwendung der Wörterbücher; einem Syntaxanalysator zum Analysieren der Syntax einer Kette aus den Morphemen, die durch den Morphemanalysator abgetrennt wurden, und zwar unter Verwendung eines Wörterbuchs und von Grammatikregeln; einem Umsetzer zum Umsetzen der Syntaxstruktur des Eingabesatzes, wie vom Syntaxanalysator analysiert, in eine Syntaxstruktur in der Zielsprache; einem Satzgenerator zum Erzeugen eines übersetzten Satzes abhängig von der Syntaxstruktur in der Zielsprache, wie vom Umsetzer umgesetzt; einer Codeeingabeeinrichtung zum Eingeben eines Wörterbuchspezifiziercodes für mindestens eines der Satzwörter in der Quellensprache, das die Verwendung eines speziellen der Wörterbücher erfordert, wie vom Morphemanalysator für die Wörterbuchbezugnahme verwendet, wenn eine Übersetzung in die Entsprechung in der Zielsprache erfolgt, wobei der Wörterbuchspezifiziercode dazu verwendet wird, das spezielle der Wörterbücher zu spezifizieren; einer Erkennungseinrichtung zum Ermitteln, ob ein Wörterbuchspezifiziercode durch die Codeeingabeeinrichtung zu einem der Wörter hinzugefügt wurde; und einer Wörterbuchbezugnahme-Einrichtung, die so arbeitet, daß sie, wenn die Erkennungseinrichtung ermittelt, daß einem der Wörter ein Wörterbuchspezifiziercode zugefügt wurde, auf das spezielle der Wörterbücher Bezug nimmt, und sie auch so arbeitet, daß sie dann, wenn die Erkennungseinrichtung ermittelt, daß keinem der Wörter ein Wörterbuchspezifiziercode zugefügt wurde, auf alle Wörterbücher abhängig von einer vorgegebenen Bezugnahmefolge Bezug nimmt.
  • Gemäß der Erfindung wird, wenn ein Satz in einer Quellensprache, der über eine Tastatur in das computerunterstützte Sprachübersetzungsgerät eingegeben wird, mindestens ein Wort enthält, bei dem das System auf ein spezielles Wörterbuch Bezug nehmen muß, der Wörterbuchspezifiziercode, der ein solches spezielles Wörterbuch spezifiziert, von der Codeeingabeeinrichtung eingegeben, so daß der Wörterbuchspezifiziercode diesem Wort hinzugefügt werden kann.
  • Wenn ein aus einer Kette von Wörtern bestehender Satz in einer Quellensprache, der ein Wort in der Quellensprache enthält, zu dem der Wörterbuchspezifiziercode in der vorstehend beschriebenen Weise hinzugefügt ist, in den Morphemanalysator eingegeben wird, wird der Satz in der Quellensprache in eine Morphemkette unterteilt, mit der die Erkennungseinrichtung so arbeitet, daß sie ermittelt, ob dem speziellen Wort ein Wörterbuchspezifiziercode hinzugefügt ist. Sollte die Erkennungseinrichtung feststellen, daß einem speziellen Wort ein Wörterbuchspezifiziercode hinzugefügt ist, verwendet die Wörterbuch-Bezugnahmeeinrichtung dasjenige der Wörterbücher, das durch den Wörterbuchspezifiziercode spezifiziert ist. Sollte die Erkennungseinrichtung dagegen ermitteln, daß keinem der Wörter im eingegebenen Satz ein Wörterbuchspezifiziercode hinzugefügt ist, verwendet die Wörterbuch-Bezugnahmeeinrichtung alle Wörterbücher abhängig von der vorgegebenen Folge für Wörterbuchbezugnahme. Auf diese Weise wird, wenn einem speziellen Wort ein Wörterbuchspezifiziercode hinzugefügt ist, demjenigen Wörterbuch, das dem Wörterbuchspezifiziercode zugeordnet ist, während der vom System ausgeführten Wörterbuchbezugnahme Priorität verliehen, um eine Entsprechung in der Zielsprache zu liefern, die dem Wunsch des Benutzers genügt.
  • Die Syntaxstruktur der Morphemketten wird anschließend vom Syntaxanalysator abhängig von sowohl den grammatikalischen Regeln als auch derjenigen Information analysiert, die in der Zielsprache die Entsprechung zum speziellen Wort repräsentiert, das mit dem Wörterbuchspezifiziercode versehen ist. Die vom Syntaxanalysator erzeugte Syntaxstruktur wird dann vom Umsetzer in die Syntaxstruktur der Zielsprache umgesetzt.
  • Die Syntaxstruktur in der Zielsprache wird vom Satzgenerator dazu verwendet, einen übersetzten Satz abhängig von der Syntaxstruktur der Zielsprache zu erzeugen.
  • KURZE BESCHREIBUNG DER ZEICHNUNGEN
  • Nur beispielhaft wird unter Bezugnahme auf die beigefügten Zeichnungen, in denen gleiche Teile mit denselben Bezugszahlen gekennzeichnet sind, eine bevorzugte Ausführungsform beschrieben, wobei die Zeichnungen folgendes darstellen:
  • Fig. 1 ist ein Blockdiagramm eines bevorzugten Ausführungsbeispiels eines erfindungsgemäßen computerunterstützten Sprachübersetzungsgeräts;
  • Fig. 2 ist ein erläuterndes Diagramm der Übersetzungsniveaus bei automatischer Übersetzung;
  • Fig. 3 ist ein Betriebsstrukturdiagramm des Übersetzungsmoduls beim bevorzugten Ausführungsbeispiel;
  • Fig. 4 ist ein Blockdiagramm des Übersetzungsmoduls;
  • Fig. 5 - 9 sind Diagramme, die den Inhalt jedes in Fig. 4 dargestellten Puffers zeigen;
  • Fig. 10 ist ein Flußdiagramm für Wörterbuchbezugnahme; und
  • Fig. 11 ist ein Diagramm, das einen Probentext in einer Quellensprache zeigt, wie er in das computerunterstützte Sprachübersetzungsgerät von Fig. 1 eingegeben wurde, und sie zeigt den entsprechenden Ausgangssatz (übersetzten Satz) in einer Zielsprache.
  • DETAILLIERTE BESCHREIBUNG DES BEVORZUGTEN AUSFÜHRUNGSBEISPIELS
  • Fig. 1 zeigt ein Blockdiagramm eines computerunterstützten Sprachübersetzungsgeräts gemäß der Erfindung. Das Übersetzungsgerät weist folgendes auf: eine Haupt-CPU (zentrale Verarbeitungseinheit) 1, einen Hauptspeicher 2, eine CRT 3 (Kathodenstrahlröhre 3), eine Tastatur 4, ein Übersetzungsmodul 5 und eine Speichervorrichtung 6, die Wörterbücher, Grammatikregeln und Baumstruktur-Umsetzregeln für die Übersetzung speichert.
  • Wenn in das Übersetzungsmodul 5 ein Text in einer Quellensprache eingegeben wird, übersetzt es die Entsprechung in der Zielsprache und gibt sie aus. Genauer gesagt, wird der über die Tastatur 4 eingegebene Text in der Quellensprache vom Übersetzungsmodul 5 gesteuert durch die Haupt-CPU 1 übertragen. Das Übersetzungsmodul 5 verwendet mehrere abgespeicherte Wörterbücher, Grammatikregeln und Baumstruktur- Umsetzregeln, die im Speicher 6 abgespeichert sind, um den eingegebenen Text in der Quellensprache in die Entsprechung in der Zielsprache zu übersetzen, wie dies später beschrieben wird. Das Ergebnis dieser Übersetzung wird im Hauptspeicher 2 zwischengespeichert und auf der CRT 3 dargestellt.
  • Automatische Übersetzung, wie sie vom Übersetzungsmodul 5 ausgeführt wird, besteht im allgemeinen auf den in Fig. 2 dargestellten Analyseniveaus. Wenn der Text in der Quellensprache eingegeben wird, wie dies oben links in Fig. 2 dargestellt ist, schreitet die Analyse über das Niveau L1, Wörterbuchbezugnahme, das Niveau L2, Morphemanalyse, das Niveau 3, grammatischer Aufbau oder Syntax, Analys usw. fort.
  • Maschinenübersetzung kann grob gesprochen abhängig von diesen Analyseniveaus in zwei Haupttypen unterteilt werden. Eines ist das Angelverfahren, bei dem Sätze in der Quellensprache bis zum Niveau L6 analysiert werden, um eine Zwischensprache zu erhalten, die weder die Quellensprache noch die Zielsprache ist, jedoch für das Übersetzungsgerät spezifisch ist. Dann schreitet die Analyse über das Niveau L7, Kontexterzeugung, das Niveau L8, Semantikerzeugung, das Niveau L9, Syntaxerzeugung zum Niveau L10, Morphemerzeugung, fort, wo der Text in der Zielsprache, der dem Text in der Quellensprache entspricht, erzeugt wird.
  • Das andere ist das Übertragungsverfahren, bei dem die vorstehend genannte Morphemanalyse gemäß dem Niveau L2, die Grammatikkonstruktionsanalyse gemäß dem Niveau L3, die Semantikanalyse gemäß dem Niveau L4 und die Kontextanalyse gemäß dem Niveau L5 ausgeführt werden, um die innere Syntax des Texts in der Quellensprache zu erhalten. Anschließend wird der Text in der Zielsprache erzeugt, nachdem die innere Syntax des Texts in der Quellensprache in die innere Syntax des Texts in der Zielsprache auf demselben Niveau umgesetzt wurde.
  • Die vorstehend genannte Analyse wird nachfolgend erläutert.
  • * Wörterbuchbezugnahme und Morphemanalyse
  • Es wird auf die im in Fig. 1 dargestellten Speicher 6 abgespeicherten Wörterbücher Bezug genommen, um den eingegebenen Satz in diskrete Morphemketten (Wortketten) zu unterteilen, um einen Satzteil und andere Grammatikinformation sowie Wortentsprechungen für einzelne Morpheme zu erhalten, und um die Zeitform, die Person und die Anzahl zu analysieren.
  • * Syntaxanalyse
  • Wie es später beschrieben wird, wird die Struktur (Syntaxanalysebaum) des Satzes einschließlich der Beziehung zwischen Wörtern ermittelt.
  • * Semantikanalyse
  • Semantisch korrekte Konstruktionen werden aus den Ergebnissen der mehreren Syntaxanalysen abgeleitet und aufgebaut.
  • * Kontextanalyse
  • Es wird auf das Thema des Satzes geschlossen und Abkürzungen und Mehrdeutigkeiten werden klargestellt.
  • Das bei der Erfindung verwendete Übersetzungsmodul soll den eingegebenen Satz mindestens bis zum Niveau L3, Syntaxanalyse, analysieren. Genauer gesagt, soll das beim bevorzugten Ausführungsbeispiel verwendete Übersetzungsmodul als ein solches gedacht werden, das aus Komponententeilen besteht, wie sie in Fig. 3 dargestellt sind.
  • Fig. 4 zeigt ein Blockdiagramm des Übersetzungsmoduls 5. Ferner zeigen die Fig. 5 bis 9 jeweils den Inhalt von in Fig. 4 abgespeicherten Puffern A bis E während der Übersetzung z.B. des englischen Satzes "This is a pen." in die japanische Entsprechung.
  • Unter Bezugnahme auf Fig. 3 bis Fig. 9 wird nun die Weise beschrieben, wie der englische Satz "This is a Pen." in die japanische Entsprechung übersetzt wird.
  • Zunächst wird der in das computerunterstützte Sprachübersetzungsgerät eingegebene englische Satz auf die in Fig. 5 dargestellte Weise im Puffer A abgespeichert. Wie durch eine Übersetzungs-CPU 15 abhängig von einem vorgegebenen Übersetzungsprogramm 16 gesteuert, wird die für jedes Wort erforderliche Information vom Wörterbuchbezugnahme-Morphemanalysator 11 erhalten, der die im Speicher 6 abgespeicherten Wörterbücher verwendet, und zwar gemäß dem im Puffer A abgespeicherten Originaltext, und diese Information wird dann in den Puffer B eingespeichert. Z.B. wird der Teil der Satzinformation, der Teil der vorstehend genannten erforderlichen Information ist, so abgespeichert, wie es in Fig. 6 dargestellt ist. Beim dargestellten Beispiel hat "this" die Bedeutung mehrerer Satzteile, wobei vom in Fig. 3 dargestellten Syntaxanalysator 12 auf eine einzige Bedeutung geschlossen wird. Der Syntaxanalysator 12 ermittelt den in Fig. 7 dargestellten Syntaxanalysebaum, der die Beziehung zwischen den einzelnen Wörtern, wie durch die Wörterbücher festgelegt, und grammatischen Regeln zeigt, wie im Speicher 6 abgespeichert, und dieser Syntaxanalysebaum wird im Puffer C abgespeichert. Dieser Syntaxanalysebaum wird wie folgt ermittelt, wobei für die Grammtikregeln im Speicher 6 speziell das gilt, was in Tabelle 1 dargestellt ist. Tabelle 1 Satz Subjekt Prädikat Nominalgruppe Nominalgruppe Subjekt, Prädikat Nominalgruppe Verb, Nominalgruppe Pronomen Artikel, Nomen
  • Z.B. stellt die erste Regel fest, daß "ein Satz aus einem Subjekt und einem Prädikat besteht". In der folgenden Beschreibung wird der Syntaxanalysebaum abhängig von diesen Regeln bestimmt.
  • Der in Fig. 3 dargestellte Umsetzer 13 setzt die Struktur des Syntaxanalysebaums (siehe Fig. 7) für den Satz in der Quellensprache (Englisch) in die Struktur des Satzes in der Zielsprache (Japanisch), wie in Fig. 8 dargestellt, unter Verwendung der im Speicher 6 abgespeicherten Baumstruktur- Umsetzregeln auf dieselbe Weise um, wie der ursprüngliche Baum durch den vorstehend genannten Syntaxanalysator erstellt wurde. Dann wird das Ergebnis im Puffer D in Fig. 4 abgespeichert. Ein in Fig. 3 dargestellter Satzgenerator 14 fügt den japanischen nachpositionierten Artikel "WA" und Hilfsverben hinzu, wie sie für die erhaltenen japanischen Wörter "KORE PEN DE ARU" geeignet sind (dies liest sich möglicherweise in Englisch als "This, a pen.") und gibt das Ergebnis, wie in Fig. 9 dargestellt, für anschließende Speicherung im Puffer E von Fig. 4 aus. Dieser japanische Satz "KORE WA PEN DE ARU" (auf Englisch liest sich dies "This is a pen.") wird vom Übersetzungsmodul 5 ausgegeben und im Hauptspeicher 2 abgespeichert und gleichzeitig auf der CRT 3 dargestellt.
  • Bei dieser Gelegenheit wird der Wörterbuch-Bezugnahmeprozeß, auf den sich die Erfindung bezieht, im Wörterbuchbezug-Morphemanalysator 11 von Fig. 3 auf eine Weise ausgeführt, die nun beschrieben wird. Der Wörterbuch-Bezugnahmeprozeß ist dergestalt, daß ein Wörterbuchspezifiziercode, der eines der Speicherwörterbücher spezifiziert, das der Benutzer während der computerunterstützten Sprachübersetzung verwenden möchte, einem speziellen der den Text in der Quellensprache bildenden Wörter hinzugefügt wird. Wenn ein Wörterbuchspezifiziercode dem speziellen Wort hinzugefügt ist, prüft das Systen das mit dem Wörterbuchspezifiziercode versehende Wort hinsichtlich der Speicherwörterbücher, um vorzugsweise dasjenige der Speicherwörterbücher auszuwählen, das durch den Wörterbuchspezifiziercode repräsentiert wird.
  • Fig. 10 veranschaulicht das Flußdiagramm für den Wörterbuch- Bezugnahmeprozeß, und auf dieses wird nun Bezug genommen, um eine detaillierte Erörterung vorzunehmen.
  • In einem Schritt S1 erfolgt eine Entscheidung zum Ermitteln, ob ein einem Wort in einer Quellensprache folgender Wörterbuchspezifiziercode im Text in der Quellensprache enthalten ist, wie er in das computerunterstütze Sprachübersetzungsgerät eingegeben wird. Wenn zum Wort kein Wörterbuchspezifiziercode hinzugefügt ist, geht der Programmfluß zu einem Schritt S2 weiter, wenn ein solcher jedoch zum Wort hinzugefügt ist, geht der Programmfluß zu einem Schritt S5 weiter, in dem das System auf das durch den Wörterbuchspezifiziercode, wie er zum speziellen Wort hinzugefügt ist, spezifizierte der Wörterbücher zugreift.
  • Im Schritt S2 nimmt das System auf das benutzerspezifische Wörterbuch Bezug, gefolgt von einem Schritt S3, in dem das System auf das technische Wörterbuch Bezug nimmt, und gefolgt von einem Schritt S4, in den das System auf das unveränderliche Hauptwörterbuch Bezug nimmt.
  • Danach erfolgt in einem Schritt S6 eine Entscheidung zum Ermitteln, ob die Wörterbuchbezugnahme abgeschlossen ist. Sollte das Entscheidungsergebnis im Schritt S6 "Nein" sein, kehrt der Programmfluß zum Schritt S1 zurück, sollte es jedoch "Ja" sein, endet der Programmfluß.
  • Fig. 11 ist ein Beispiel für einen englischen Text, der in das die Erfindung verkörpernde computerunterstützte Sprachbersetzungsgerät eingegeben wurde, und für die japanische Entsprechung, wie sie von diesem Übersetzungsgerät ausgegeben wird. Bei diesem Beispiel ist angenommen, daß Information, die das englische Wort "book" angibt und die nach Übersetzung in die japanische Entsprechung "BUKKU" sein sollte, im benutzerspezifischen Wörterbuch eingetragen ist, wohingegen Information, die das englische Wort "book" anzeigt und bei Übersetzung in die japanische Entsprechung "HON" sein sollte, in das unveränderliche Hauptwörterbuch eingetragen ist. Unter diesen Bedingungen übersetzt das System, wenn der englische Satz "This is a book.", wie in Fig. 11 unter EINGABE 1 dargestellt, in das die Erfindung verkörpernde Übersetzungsgerät in Wortform eingegeben wird, diesen Satz automatisch in den entsprechenden japanischen Satz "KORE WA BUKKU DE ARU." (in Japanisch ausgedrückt), wobei bevorzugt auf das benutzerspezifische Wörterbuch Bezug genommen wurde, wie in Fig. 11 unter AUSGABE 1 dargestellt, da keinem der Wörter im Satz ein Wörterbuchspezifiziercode hinzugefügt ist.
  • Wenn dagegen der englische Satz "This is a kj_book.", wie unter EINGABE 2 in Fig. 11 dargestellt, in dem "kj_" einen Wörterbuchspezifiziercode repräsentiert, der nach dem unveränderlichen Hauptwörterbuch verlangt, in das die Erfindung verkörpernde Übersetzunggerät in Wortform eingegeben wird, übersetzt das System diesen Satz automatisch in einen anderen entsprechenden japanischen Satz "KORE WA HON DE ARU." (in Japanisch ausgedrückt), wobei bevorzugt auf das unveränderliche Hauptwörterbuch Bezug genommen wurde, wie in Fig. 11 unter AUSGABE 2 dargestellt.
  • Wie vorstehend beschrieben, wird der Wörterbuchspezifiziercode mindestens einem der Wörter in der Quellensprache hinzugefügt, das unter Verwendung spezieller Information zu übersetzen ist, die in einem speziellen der Wörterbücher aufgezeichnet ist, und zwar bevor der Satz in der Quellensprache, der solche Wörter enthält, in das Übersetzungsgerät eingegeben wird. Durch den so hinzugefügten Wörterbuchspezifiziercode führt der Morphemanalysator 11, wenn er die Wörterbuchbezugnahme ausführt, bevorzugten Zugriff auf dieses spezielle unter den Wörterbüchern aus und sucht dort Information, um die erforderliche Information zu liefern, die während der von der Übersetzungsmaschine ausgeführten Sprachübersetzung verwendet wird. Demgemäß ist es deutlich, daß es mit der erfindungsgemäßen computerunterstützen Sprachübersetzungsmaschine möglich ist, übersetzte Ausgangsinformation so schnell und genau wie möglich zu erzielen.
  • Obwohl die Erfindung in Verbindung mit ihrem bevorzugten Ausführungsbeispiel unter Bezugnahme auf die beigefügten Zeichnungen vollständig beschrieben wurde, ist zu beachten, daß verschiedene Änderungen und Modifizierungen dem Fachmann erkennbar sind. Z.B. ist, obwohl beim Beschreiben des bevorzugten Ausführungsbeispiels der Erfindung Bezugnahme auf ein Beispiel erfolgte, bei dem ein englischer Satz in Japanisch übersetzt wird, das Konzept der Erfindung in gleicher Weise auf die Übersetzung vom Japanischen oder von irgendeiner anderen Quellensprache in Englisch oder irgendeine andere Zielsprache möglich, die sich sprachlich von der Quellensprache unterscheidet.

Claims (3)

1. Computerunterstütztes Sprachübersetzungsgerät mit einer Wörterbucheinrichtung (6) zum Abspeichern mehrerer Wörterbücher, die Wörter in einer Quellensprache und Wörter in einer Zielsprache einander zuordnen; einer Einrichtung (4) zum Eingeben eines aus Wörtern in der Quellensprache bestehenden Satzes und von Zusatzinformation betreffend mindestens ein Wort in der Quellensprache, und mit einer Einrichtung (5) zum Erstellen eines entsprechenden Satzes in der Zielsprache unter Bezugnahme auf die Wörterbucheinrichtung, dadurch gekennzeichnet, daß die Zusatzinformation ein dem Wort in der Quellensprache zugeordneter Wörterbuchspezifiziercode ist, um bei der Übersetzung dieses Worts in der Quellensprache auf das durch diesen Code spezifizierte Wörterbuch zuzugreifen, wobei die Wörterbücher zu verschiedenen Übersetzungen des Worts in der Quellensprache führen, die in der Zielsprache entsprechende Bedeutungen haben und abhängig von vorgegebenen Kriterien auswählbar sind.
2. Ubersetzungsgerät nach Anspruch 1 mit einer Wörterbuch- Prioritätseinstelleinrichtung, die für ein Wort in der Quellensprache ohne solchen zugeordneten Wörterbuchspezifiziercode betrieben wird, um dieses Wort mit vorgegebener Prioritätsreihenfolge mit einem oder mehreren der Wörterbücher in Beziehung zu setzen.
3. Übersetzungsgerät nach Anspruch 1, mit:
- einem Morphemanalysator (11) zum Abtrennen des eingegebenen Satzes in der Quellensprache in Morpheme unter Verwendung der Wörterbücher (6);
- einem Syntaxanalysator (12) zum Analysieren der Syntax einer Kette aus den Morphemen, die durch den Morphemanalysator abgetrennt wurden, und zwar unter Verwendung eines Wörterbuchs und von Grammatikregeln (16);
- einem Umsetzer (13) zum Umsetzen der Syntaxstruktur des Eingabesatzes, wie vom Syntaxanalysator analysiert, in eine Syntaxstruktur in der Zielsprache;
- einem Satzgenerator (14) zum Erzeugen eines übersetzten Satzes abhängig von der Syntaxstruktur in der Zielsprache, wie vom Umsetzer umgesetzt;
- einer Codeeingabeeinrichtung zum Eingeben eines Wörterbuchspezifiziercodes für mindestens eines der Satzwörter in der Quellensprache, das die Verwendung eines speziellen der Wörterbücher (6) erfordert, wie vom Morphemanalysator für die Wörterbuchbezugnahme verwendet, wenn eine Übersetzung in die Entsprechung in der Zielsprache erfolgt, wobei der Wörterbuchspezifiziercode dazu verwendet wird, das spezielle der Wörterbücher zu spezifizieren;
- einer Erkennungseinrichtung zum Ermitteln, ob ein Wörterbuchspezifiziercode durch die Codeeingabeeinrichtung zu einem der Wörter hinzugefügt wurde; und
- einer Wörterbuchbezugnahme-Einrichtung, die so arbeitet, daß sie, wenn die Erkennungseinrichtung ermittelt, daß einem der Wörter ein Wörterbuchspezifiziercode zugefügt wurde, auf das spezielle der Wörterbücher Bezug nimmt, und sie auch so arbeitet, daß sie dann, wenn die Erkennungseinrichtung ermittelt, daß keinem der Wörter ein Wörterbuchspezifiziercode zugefügt wurde, auf alle Wörterbücher abhängig von einer vorgegebenen Bezugnahmefolge Bezug nimmt.
DE68919030T 1988-08-29 1989-08-24 Computerunterstütztes Übersetzungsgerät. Expired - Fee Related DE68919030T2 (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63214257A JPH0261763A (ja) 1988-08-29 1988-08-29 機械翻訳装置

Publications (2)

Publication Number Publication Date
DE68919030D1 DE68919030D1 (de) 1994-12-01
DE68919030T2 true DE68919030T2 (de) 1995-05-24

Family

ID=16652757

Family Applications (1)

Application Number Title Priority Date Filing Date
DE68919030T Expired - Fee Related DE68919030T2 (de) 1988-08-29 1989-08-24 Computerunterstütztes Übersetzungsgerät.

Country Status (3)

Country Link
EP (1) EP0357344B1 (de)
JP (1) JPH0261763A (de)
DE (1) DE68919030T2 (de)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02302873A (ja) * 1989-05-18 1990-12-14 Sanyo Electric Co Ltd 機械翻訳装置
JPH03268062A (ja) * 1990-03-19 1991-11-28 Fujitsu Ltd 機械翻訳電子メール装置における私用単語の登録装置
US5175684A (en) * 1990-12-31 1992-12-29 Trans-Link International Corp. Automatic text translation and routing system
US5477451A (en) * 1991-07-25 1995-12-19 International Business Machines Corp. Method and system for natural language translation
US6278967B1 (en) 1992-08-31 2001-08-21 Logovista Corporation Automated system for generating natural language translations that are domain-specific, grammar rule-based, and/or based on part-of-speech analysis
US6760695B1 (en) 1992-08-31 2004-07-06 Logovista Corporation Automated natural language processing
NL9300310A (nl) * 1993-02-19 1994-09-16 Oce Nederland Bv Inrichting en werkwijze voor syntactische signaal-analyse.
US5303151A (en) * 1993-02-26 1994-04-12 Microsoft Corporation Method and system for translating documents using translation handles
US6470306B1 (en) 1996-04-23 2002-10-22 Logovista Corporation Automated translation of annotated text based on the determination of locations for inserting annotation tokens and linked ending, end-of-sentence or language tokens
JP3743678B2 (ja) * 1996-04-23 2006-02-08 ロゴヴィスタ株式会社 自動自然言語翻訳
KR101762866B1 (ko) * 2010-11-05 2017-08-16 에스케이플래닛 주식회사 구문 구조 변환 모델과 어휘 변환 모델을 결합한 기계 번역 장치 및 기계 번역 방법
US10592614B1 (en) 2017-01-19 2020-03-17 Amdocs Development Limited System, method, and computer program for translating unified ticketing system (UTS) messages

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58101326A (ja) * 1981-12-10 1983-06-16 Ricoh Co Ltd カナ漢字変換処理装置
EP0176858B1 (de) * 1984-09-18 1993-01-20 Sharp Kabushiki Kaisha Übersetzungssystem
JPS62203273A (ja) * 1986-03-04 1987-09-07 Toshiba Corp 機械翻訳システム

Also Published As

Publication number Publication date
JPH0261763A (ja) 1990-03-01
EP0357344A2 (de) 1990-03-07
EP0357344A3 (en) 1990-08-08
EP0357344B1 (de) 1994-10-26
DE68919030D1 (de) 1994-12-01

Similar Documents

Publication Publication Date Title
DE69032750T2 (de) Maschinelles Übersetzungssystem und -verfahren
DE3587009T2 (de) Uebersetzungssystem.
DE3587832T2 (de) Sprachverarbeitungslexikon zum Zweirichtungswiederfinden von morphemischen und semantischen Ausdrücken.
DE3789073T2 (de) System zur maschinellen Übersetzung.
DE69427848T2 (de) Unterstützungssystem zur Herstellung von Wörterbüchern
DE69712216T2 (de) Verfahren und gerät zum übersetzen von einer sparche in eine andere
DE68928250T2 (de) Übertragungssystem mit Übersetzung
DE3751276T2 (de) Zergliedergerät für Naturalsprachen.
DE69934371T2 (de) Apparat und Verfahren zum Verarbeiten einer natürlichen Sprache
DE68928231T2 (de) Verfahren und Vorrichtung zur Maschinenübersetzung
DE3587993T2 (de) Verfahren und Gerät zur Natursprachenverarbeitung.
DE69726339T2 (de) Verfahren und Apparat zur Sprachübersetzung
DE68928693T2 (de) Verfahren zur Behandlung von digitalen Textdaten
DE68926845T2 (de) Maschinenübersetzungssystem
DE68913669T2 (de) Namenaussprache durch einen Synthetisator.
DE69129107T2 (de) Automatisches übersetzungs-und fernübertragungssystem
DE69230814T2 (de) Datenbankauffindungssystem zur Beantwortung natursprachlicher Fragen mit dazugehörigen Tabellen
DE69829389T2 (de) Textnormalisierung unter verwendung einer kontextfreien grammatik
DE69130747T2 (de) Übersetzungsverfahren und -system zur Übertragung zwischen zwei Sprechern mit unterschiedlicher Sprache
DE69424350T2 (de) Kontextsensitive Methode zum Auffinden von Informationen über ein Wort in einem elektronischen Wörterbuch
DE69033471T2 (de) Natürliche Sprache verarbeitendes Gerät
DE69031354T2 (de) Natursprachenverarbeitungssystem
DE68923981T2 (de) Verfahren zur Bestimmung von Textteilen und Verwendung.
DE3751716T2 (de) System zur maschinellen Übersetzung
DE69513369T2 (de) Verfahren und vorrichtung zur zusammenfassung statischer prozesse in eine auf regeln basierende grammatikalisch definierte natuerliche sprache

Legal Events

Date Code Title Description
8364 No opposition during term of opposition
8328 Change in the person/name/address of the agent

Free format text: PATENTANWAELTE MUELLER & HOFFMANN, 81667 MUENCHEN

8339 Ceased/non-payment of the annual fee