DE69130246T2 - System zur Bildung von Sätzen - Google Patents

System zur Bildung von Sätzen

Info

Publication number
DE69130246T2
DE69130246T2 DE69130246T DE69130246T DE69130246T2 DE 69130246 T2 DE69130246 T2 DE 69130246T2 DE 69130246 T DE69130246 T DE 69130246T DE 69130246 T DE69130246 T DE 69130246T DE 69130246 T2 DE69130246 T2 DE 69130246T2
Authority
DE
Germany
Prior art keywords
sentence
evaluation
formation
condition
forming
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
DE69130246T
Other languages
English (en)
Other versions
DE69130246D1 (de
Inventor
Minoru Yokohama-Shi Kanagawa-Ken Fujita
Koichi Machida-Shi Tokyo Masegi
Shogo Shibuya-Ku Tokyo Shibata
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from JP20584290A external-priority patent/JP3192415B2/ja
Priority claimed from JP16151791A external-priority patent/JP3320078B2/ja
Priority claimed from JP3165732A external-priority patent/JPH0512329A/ja
Application filed by Canon Inc filed Critical Canon Inc
Application granted granted Critical
Publication of DE69130246D1 publication Critical patent/DE69130246D1/de
Publication of DE69130246T2 publication Critical patent/DE69130246T2/de
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/55Rule-based translation
    • G06F40/56Natural language generation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • G06F40/35Discourse or dialogue representation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Description

  • Die Erfindung betrifft ein Satzbildungsverfahren und -system zur Erzeugung von Sätzen in einer Sprache, wie beispielsweise japanisch oder englisch, aus einer semantischen Darstellung, die in das System eingegeben wurde. Des weiteren betrifft die Erfindung die Verbesserung des Satzstils, der bei der Übersetzung eines Satzes in einer ersten Sprache (beispielsweise japanisch) in einen Satz in einer zweiten Sprache (beispielsweise englisch) erzeugt wird, und insbesondere ein Satzbildungsverfahren, das sich gut für die maschinelle Übersetzung eignet.
  • Ein bei der maschinellen Übersetzung herkömmlicherweise angewandetes Satzbildungsverfahren beinhaltet die Analyse eines eingegebenen Satzes in einer ersten Sprache, die Umwandlung dieses Satzes in eine semantische Darstellung und die Erzeugung eines Satzes in einer zweiten Sprache aus dieser semantischen Darstellung. Bei diesem herkömmlichen Verfahren zur Bildung von Sätzen ist der Vorgang der Satzbildung üblicherweise eine Prozedur, bei der bezüglich einer gegebenen semantischen Darstellung die Wortreihenfolge eines Satzes gemäß grammatikalischen Regeln bestimmt wird, Oberflächenwörter und Redewendungen ausgewählt werden, und die ausgewählten Oberflächenwörter und Redewendungen (Ausdrücke) ausgegeben werden.
  • Da jedoch dieser herkömmliche Satzbildungsvorgang die Erzeugung eines Teilsatzes aus einem ganzen Satz beinhaltet, kann man sich keinen Überblick über das ganze verschaffen, während eine derartige teilweise Ausbildung läuft. Selbst wenn ein Teil eines Satzes mittels des herkömmlichen Verfahrens korrekt erzeugt werden kann, besteht demnach ein Nachteil darin, daß die Harmonie des gesamten Satzes nicht berücksichtigt wird.
  • Aus diesem Grund können Widersprüche und ein unnatürlicher Wortlaut auftreten, wenn ein Satz entsprechend dem herkömmlichen Satzbildungsverfahren aufgebaut wird, und es gibt Fälle, in denen Sätze erzeugt werden, die schwer zu verstehen sind, obwohl die Sätze keine grammatikalischen Fehler enthalten. Das heißt, liegt ein Satz in einer zweiten Sprache, der entsprechend dem herkömmlichen Verfahren in einem maschinellen Übersetzungssystem erzeugt und ausgegeben wird, nicht in der Muttersprache des Systembenutzers vor, bemerkt der Benutzer wahrscheinlich nicht, daß der ausgegebene Satz schwer zu verstehen ist. Und selbst wenn der Benutzer dieses bemerkt, sind ein hoher Grad an linguistischem Wissen und Fertigkeit erforderlich, um zu erkennen, welche Abschnitte des Satzes wie geändert werden sollten. Außerdem sieht sich der Benutzer einer erheblichen Belastung gegenüber, wenn er ausgegebene Sätze tatsächlich häufig überarbeiten muß.
  • Die Druckschrift "Science and Technology Agency's Mu Machine Translation Project" von M. Nagao et al., veröffentlicht in "Future Generations Computer Systems", Band 2, Nr. 2, Juni 1986, Amsterdam NL, Seiten 125-139, offenbart ein maschinelles Übersetzungssystem zur Übersetzung von japanischen Sätzen in englische Sätze, bei dem eine Analyse eines eingegebenen Satzes, eine Übertragung und Erzeugung durchgeführt wird. Während der Erzeugungs- bzw. Bildungsphase werden Abhängigkeitsstrukturen in Phrasenstrukturen bzw. Wendungsstrukturen umgewandelt, indem bei den Abhängigkeitsstrukturen rekursiv eine Ausbildungsuntergrammatik angewendet wird. In einer Nachverarbeitungsphase wird ein in einer vorhergehenden Phase erzeugter bzw. ausgebildeter englischer Satz in einen lesbareren englischen Satz umgewandelt, indem auf vorbestimmte Kriterien bezug genommen wird.
  • Erfindungsgemäß ist ein Satzbildungssystem ausgestaltet, wie es im Patentanspruch 1 definiert ist.
  • Erfindungsgemäß ist ferner ein Satzbildungsverfahren ausgestaltet, wie es im Patentanspruch 14 definiert ist.
  • In den Ausführungsbeispielen der Erfindung ist ein Satzbildungssystem ausgestaltet, das leicht lesbare Sätze mit hoher Geschwindigkeit erzeugen kann.
  • Ein weiteres hier beschriebenes Ausführungsbeispiel bezieht sich auf ein Satzbildungssystem, das leicht lesbare Sätze erzeugen kann, die nicht monoton sind.
  • Ein weiteres Ausführungsbeispiel der Erfindung betrifft ein maschinelles Übersetzungssystem, das Übersetzungen erzeugen kann, die leicht lesbar sind.
  • Weitere Merkmale und Vorteile sind aus der folgenden Beschreibung verschiedener Ausführungsbeispiele der Erfindung ersichtlich. In der Beschreibung wird auf die beiliegende Zeichnung bezug genommen, die einen Teil der Beschreibung bildet und ein Beispiel der Erfindung veranschaulicht. Ein derartiges Beispiel erschöpft allerdings nicht die verschiedenen Ausführungsbeispiele der Erfindung, und daher wird zur Bestimmung des Schutzbereichs der Erfindung auf die Patentansprüche verwiesen.
  • KURZBESCHREIBUNG DER ZEICHNUNG
  • Fig. 1 zeigt ein schematisches Blockschaltbild eines Ausführungsbeispiels eines maschinellen Übersetzungsgeräts, bei dem das erfindungsgemäße Satzbildungsverfahren angewendet wird,
  • Fig. 2 zeigt ein Blockschaltbild des Aufbaus einer Satzbildungsvorrichtung in dem Übersetzungsgerät in Fig. 1,
  • Fig. 3 zeigt ein Blockschaltbild des Hardwareaufbaus der Satzbildungsvorrichtung,
  • Fig. 4 zeigt ein Ablaufdiagramm einer Prozedur zur Satzbildungsverarbeitung (ein erstes Verfahren zur Bildung japanischer Sätze) in der Satzbildungsvorrichtung,
  • Fig. 5 zeigt eine Darstellung eines Beispiels einer semantischen Darstellung, die den Gegenstand der Satzbildungsverarbeitung bildet,
  • Fig. 6 zeigt eine Darstellung zur Beschreibung der Einzelheiten des Verarbeitungsablaufs in der Satzbildungsvorrichtung,
  • Fig. 7 zeigt ein Blockschaltbild des Aufbaus der Satzbildungsvorrichtung gemäß einem zweiten Verfahren,
  • Fig. 8A und 8B zeigen Ablaufdiagramme einer Prozedur zur Satzbildungsverarbeitung in der Satzbildungsvorrichtung gemäß dem zweiten Verfahren,
  • Fig. 9 zeigt ein Blockschaltbild des Aufbaus der Satzbildungsvorrichtung gemäß einem dritten Verfahren,
  • Fig. 10A und 10B zeigen Ablaufdiagramme einer Prozedur zur Satzbildungsverarbeitung in der in Fig. 11 gezeigten Satzbildungsvorrichtung,
  • Fig. 11 zeigt ein Blockschaltbild des Aufbaus einer Satzbildungsvorrichtung gemäß einem vierten Verfahren,
  • Fig. 12 zeigt ein Ablaufdiagramm einer Prozedur zur Satzbildungsverarbeitung in der in Fig. 11 gezeigten Satzbildungsvorrichtung,
  • Fig. 13, 14A und 14B zeigen Darstellungen zur Beschreibung von Einzelheiten des Verarbeitungsablaufs in der Satzbildungsvorrichtung gemäß dem vierten Verfahren,
  • Fig. 15 zeigt eine Darstellung eines Beispiels einer semantischen Darstellung, die den Gegenstand der Verarbeitung zur Erzeugung eines englischen Satzes bildet, und
  • Fig. 16 zeigt eine Darstellung von Einzelheiten der Änderungen in dem Verarbeitungsablauf zur Erzeugung eines englischen Satzes.
  • Beschreibung des bevorzugten Ausführungsbeispiels
  • Ein Ausführungsbeispiel der Erfindung wird nachstehend anhand der beiliegenden Zeichnung beschrieben, wobei ein erfindungsgemäßes Satzbildungsverfahren bei einer maschinellen Übersetzung zwischen englischen und japanischen Sätzen angewendet wird.
  • Fig. 1 zeigt ein Blockschaltbild des Aufbaus eines allgemeinen maschinellen Übersetzungssystems zur Übersetzung einer ersten Sprache in eine zweite Sprache.
  • Wie es in Fig. 1 gezeigt ist, gibt eine Eingabeeinrichtung 100 einen Satz in der ersten Sprache ein. Eine Satzstrukturanalyseeinrichtung 200 analysiert die Struktur des eingegebenen Satzes in der ersten Sprache und hat Wissen über die Teile der Sprache der den Satz in der ersten Sprache bildenden Wörter. Für Sprachen wie japanisch, bei denen die Zeichensetzung zwischen einen Satz bildenden Wörtern unklar ist (eine sogenannte agglutinierende Sprache), führt die Satzstrukturanalyseeinrichtung 200 eine Morphemanalyse zum Aufbrechen des Satzes in Worte aus. Beruhend auf den analytischen Ergebnissen von der Satzstrukturanalyseeinrichtung 200 erzeugt eine semantische Analyseeinrichtung 300 eine semantische Darstellung, wie sie beispielsweise in Fig. 5 gezeigt ist, die die Verbindung zwischen Bedeutungskonzepten darstellt. Im Fall, wenn ein Ausdruck bei der maschinellen Übersetzung als semantische Darstellung verwendet wird, der nicht von Sprachcharakteristiken abhängt, kann ein Satz in einer zweiten Sprache direkt aus einer semantischen Darstellung erhalten werden, die durch Analyse der ersten Sprache erhalten wird. Wenn andererseits die semantische Darstellung von der Sprache abhängig ist, wandelt die semantische Analyseeinrichtung 300 die durch Analyse der ersten Sprache erhaltene semantische Darstellung in der ersten Sprache in eine semantische Darstellung in der zweiten Sprache um und gibt dann die letztere semantische Darstellung aus. Eine Satzbildungsvorrichtung 400 bildet einen Satz in der zweiten Sprache aus der durch die semantische Analyseeinrichtung 300 ausgegebenen semantischen Darstellung. Eine Ausgabeeinrichtung 500 gibt den gebildeten Satz in der zweiten Sprache aus.
  • Das Übersetzungssystem gemäß diesem Ausführungsbeispiel kann eine maschinelle Übersetzung von englisch in japanisch und von japanisch in englisch durchführen. Der Grund dafür liegt darin, daß obwohl die Struktur einer semantischen Darstellung, die einen japanischen Satz ausdrückt, von dem Ausdruck eines englischen Satzes verschieden ist, die semantische Analyseeinrichtung 300 zur Umwandlung einer semantischen Darstellung in die andere eingerichtet bzw. angepaßt ist.
  • Ein charakterisierendes Hauptmerkmal des in Fig. 1 gezeigten Systems besteht in dem Verfahren zur Bildung von Sätzen, das durch die Satzbildungsvorrichtung 400 durchgeführt wird. Da, wie es vorstehend beschrieben ist, der herkömmliche Satzbildungsvorgang die Erzeugung eines teilweisen Satzes aus dem ganzen Satz beinhaltet, kann man keinen Überblick über das ganze gewinnen, während eine derartige teilweise Bildung in Gang ist. Selbst wenn ein Teil eines Satzes korrekt gebildet werden kann, besteht demzufolge ein auftretendes Problem darin, daß die Harmonie des gesamten Satzes nicht berücksichtigt wird. Um zu verstehend, wie die Satzbildungsvorrichtung 400 dieses Problem löst, wird zuerst ein Verfahren zur Bildung eines japanischen Satzes in einem maschinellen Englisch- Japanisch-Übersetzungsvorgang beschrieben, indem vier Verfahren (die als erstes bis viertes Verfahren bezeichnet werden) als Beispiele genommen werden, und dann wird ein Verfahren zur Bildung eines englischen Satzes in einem maschinellen Japanisch-Englisch-Übersetzungsvorgang beschrieben. Im Fall, daß ein japanischer Satz in einem maschinellen Englisch- Japanisch-Übersetzungsvorgang gebildet wird, weist die in die Satzerzeugungsvorrichtung 400 eingegebene semantische Darstellung die Struktur der japanischen Sprache auf. Im Fall, daß ein englischer Satz in einem maschinellen Japanisch- Englisch-Übersetzungsvorgang erzeugt wird, weist die in die Satzerzeugungsvorrichtung 400 eingegebene semantische Darstellung die Struktur der englischen Sprache auf. Dies wird nachstehend ausführlicher beschrieben.
  • Unter den in einem maschinellen Englisch-Japanisch- Übersetzungsvorgang verwendeten vier Verfahren zur Satzbildung besteht das erste Verfahren (Fig. 2) zur Erzeugung eines japanischen Satzes darin, daß leicht lesbare Sätze höherer Qualität erzeugt werden können. Die Aufgabe des zweiten und dritten Verfahrens (Fig. 7 und 9) zur Erzeugung japanischer Sätze besteht in der Erhöhung der Verarbeitungsgeschwindigkeit in Fällen, in denen die Qualität der ausgegebenen Sätze nicht hoch sein muß. Das vierte Verfahren (Fig. 11) zur Erzeugung japanischer Sätze bewirkt eine Verbesserung bezüglich monotoner Sätze, zu denen das erste bis dritte Verfahren tendieren, was auf die Satzbildungsverarbeitung immer nach den gleichen begrenzten Bedingungen zurückzuführen ist.
  • < Erstes Verfahren zur Bildung japanischer Sätze>
  • Fig. 2 zeigt ein Blockschaltbild des ersten Verfahrens zur Bildung japanischer Sätze in der Satzbildungsvorrichtung 400, die das Herz des maschinellen Übersetzungssystems in Fig. 1 bildet.
  • Aufbau und Betrieb des ersten Verfahrens
  • Wie es in Fig. 2 gezeigt ist, umfaßt die Satzbildungsvorrichtung 400 eine Semantikdarstellungs-Speichereinrichtung 401, n Satzbildungseinrichtungen 402, n Ergebnisspeichereinrichtungen 403, eine Ergebnisbewertungseinrichtung 404 zum Bewerten eines gebildeten Satzes, und eine Steuereinrichtung 407 zur Steuerung der Satzbildungseinrichtungen 402 und der Ergebnisbewertungseinrichtung 404. Die Semantikdarstellungs- Speichereinrichtung 401 empfängt einen zu bildenden Satz von der semantischen Analyseeinrichtung 300 (Fig. 1) und hält den Satz in der Form einer semantischen Darstellung. Die in der Semantikdarstellungs-Speichereinrichtung 401 gespeicherte semantische Darstellung wird in eine (402&sub1;) der n Satzbildungseinrichtungen 402 eingegeben, in der ein Satz gebildet wird, und das Ergebnis wird in einer (403&sub1;) der n Ergebnisspeichereinrichtungen 403 gespeichert. Die erste Satzbildungseinrichtung 4021 führt die Satzbildung auf der Grundlage der durch die Semantikdarstellungs-Speichereinrichtung bereitgestellten semantischen Darstellung durch und speichert das Ergebnis in der Ergebnisspeichereinrichtung 4031. Dann führt jede Satzbildungseinrichtung 402m nacheinander eine Satzbildung beruhend auf dem in der unmittelbar vorhergehenden Ergebnisspeichereinrichtung 403m-1 gespeicherten Satz durch, und das Ergebnis wird in der unmittelbar nachfolgenden Ergebnisspeichereinrichtung 403m gespeichert (m = 2, 3, ..., n). Wie es nachstehend beschrieben wird, ist jede Satzbildungseinrichtung 402 vorab mit ihrer eigenen individuellen Funktion versehen. Wie es beispielsweise in Tabelle 1 gezeigt ist, weist die Satzbildungseinrichtung 4021 eines Moduls mit der Nummer 1 eine Satzumwandlungsfunktion zur Durchführung einer Umwandlung zwischen einem einfachen Satz und einem zusammengesetzten Satz auf. Die Tabelle 1 zeigt ein Beispiel von Regeln zur Satzstilverbesserung, die in der Ergebnisbewertungseinrichtung verwendet werden, wobei das Ergebnis der Bewertung "Satz ist zu lang" ist. TABELLE 1
  • N STELLT DIE MAXIMALE ANZAHL VON VERBINDUNGEN IM SATZ DAR.
  • Die Ergebnisspeichereinrichtung 403n speichert den endgültigen ausgegebenen Satz.
  • Die Ergebnisbewertungseinrichtung 404, die Zwischenergebnisse bewertet, die in dem durch jede Satzbildungseinrichtung 402 durchgeführten Satzbildungsvorgang erzeugt werden, weist eine Tabelle von Bewertungsbezugswerten auf. Dabei handelt es sich um eine Tabelle zur Speicherung von Bezugswerten zur Bewertung der Lesbarkeit der in jeder Ergebnisspeichereinrichtung 403 gespeicherten Zwischenergebnisse. Eine Zeittabelle 406 legt fest, welche Art von Bewertung in Abhängigkeit von dem Satzbildungsvorgang durchzuführen ist. Die Bezugswerte sind beispielsweise Bezugswerte der Satzlänge zur Bestimmung, ob ein eingegebener Satz zu lang ist.
  • Die Steuereinrichtung 407 dient zur Steuerung einer Folge von Satzbildungsvorgängen und weist eine Beschränkungsspeichereinrichtung 408 auf, die verschiedene bei der Satzbildung erforderliche Beschränkungen speichert. Die Tabelle 2 zeigt den Aufbau der in der Beschränkungsspeichereinrichtung 408 gespeicherten Beschränkung. Tabelle 2
  • Die Steuereinrichtung 407 weist eine Satzverbesserungswissensbasis 409 auf, die bei der weiteren Verbesserung erzeugter in der Ergebnisspeichereinrichtung 403 gespeicherter Ergebnisse beruhend auf der durch die Ergebnisbewertungseinrichtung 404 durchgeführten Bewertung verwendet wird. Die Satzverbesserungswissenbasis 409 bestimmt ein Satzverbesserungsverfahren beruhend auf der durch die Ergebnisbewertungseinrichtung 404 durchgeführten Bewertung.
  • Fig. 3 zeigt eine Darstellung zur Beschreibung des Hardwareaufbaus der Satzbildungsvorrichtung 400. Gemäß Fig. 3 speichert ein Steuerspeicher 510 verschiedene Programme einschließlich eines Programms für die nachstehend in Verbindung mit dem Ablaufdiagramm in Fig. 4 beschriebene Verarbeitungsprozedur. Eine Zentraleinheit (CPU) 511 führt verschiedene Arithmetikoperationen und Entscheidungen entsprechend den vorstehend angeführten Programmen durch. Ein Schreib-Lese- Speicher (RAM) 512 wird als Arbeitsspeicher verwendet, der einen gegebenen eingegebenen Satz, die Ergebnisse der Satzstrukturanalyse, semantische Dartellungen und die in dem Satzbildungsvorgang erzeugten Ergebnisse speichert. Der RAM 512 speichert auch die für die Aufgabe erforderlichen Beschränkungen. Eine Platte 513 speichert die für die Satzbildung erforderliche Grammatik sowie Daten, wie Wörterbücher. Eine Eingabeeinrichtung 514 dient als Eingabemittel, wie eine Tastatur oder Maus.
  • Die Arbeitsweise des in den Fig. 2 und 3 gezeigten ersten Verfahrens der japanischen Satzerzeugung wird nachstehend unter Bezugnahme auf das Ablaufdiagramm in Fig. 4, ein Schaubild einer semantischen Darstellung in Fig. 5 und der in Tabelle 2 gezeigten Beschränkungstabelle beschrieben.
  • Das Gerät zur Ausübung des ersten Verfahrens dient zur Erzeugung eines japanischen Satzes aus eingegebenen semantischen Darstellungen. Zur Konkretisierung der Beschreibung wird die in Fig. 5 gezeigte semantische Darstellung als Beispiel herangezogen. Hier zeigt eine semantische Darstellung an, daß jedes Wort bezüglich seiner Bedeutung verbunden ist. Die in Fig. 5 gezeigten semantischen Darstellungen sind in japanisch folgende:
  • "Asa kara yuki ga futteori, kotsu kikan ga midaretanode, asa osokumade neteita Hanako wa kaisha ni chikoku shita." (1)
  • Die semantische Analyseeinrichtung bzw. Semantikanalyseeinrichtung 300 gibt eine semantische Darstellung mit dieser Bedeutung in japanisch aus, da der folgende englische Satz in die Eingabeeinrichtung 100 in dem System in Fig. 1 eingegeben wurde, das als Übersetzungsgerät dient:
  • "Beause snow had been falling since morning and the transit system was in disarray, Hanako, who had slept until late morning, arrived at the office late." (2)
  • In Fig. 5 kennzeichnen die Pfeile die Richtung der Verbindung zwischen Wörtern, und die Ausdrücke an den Pfeilen drücken die Bedeutung der Verbindung aus. Beispielsweise kennzeichnet die Beziehung zwischen "to be late" und "to be in disarray", daß "to be in disarray" die "Ursache" ist, die zu "to be late" führt. Des weiteren ist in dem Satzbeispiel (2) jeder individuellen semantischen Darstellung ein Oberflächenwort entsprechend dem Baum in Fig. 5 zugeordnet. Ein Oberflächenwort ist ein Wort, das (bezüglich eines Wörterbuchs) einer gegebenen semantischen Darstellung direkt entspricht. Demnach kann jeder semantischen Darstellung eine Vielzahl von Oberflächenwörtern zugeordnet werden. In Fig. 5 stellen die Abkürzungen "TTO" "Zeit bis", "TFR" "Zeit von", "STO" "Zustand zu" und "TIM" "Zeit" dar.
  • Somit empfängt die Satzbildungsvorrichtung 400 zum Ausüben des ersten Verfahrens die vorstehend angeführten semantischen Darstellungen als Eingangssignale und erzeugte einen Oberflächenwörter enthaltenden Satz. Wurde dies erreicht, bestimmt die Satzbildungsvorrichtung 400, daß der erzeugte Satz zu lang ist, und gibt schließlich die folgenden zwei Sätze (die tatsächlich in japanisch ausgegeben werden, hier aber in englisch angeführt sind) aus: "Snow had been falling since morning and the transit system was in disarray.", und "Therefore, Hanako, who had slept until late morning, arrived at the office late.".
  • In Schritt S2 des Ablaufdiagramms in Fig. 4 wartet das System auf die Zufuhr einer semantischen Darstellung in die Speichereinrichtung 401 von der semantischen Analyseeinrichtung 300.
  • Der Satzbildungsvorgang ist in n Abschnitte unterteilt, und die Verarbeitung zur Satzbildung wird in der Reihenfolge durch die Satzbildungseinrichtungen 402&sub1; bis 402n ausgeführt. Führt eine bestimmte Satzbildungseinrichtung 402m eine Satzbildungsverarbeitung in Schritt S2 durch, werden die erzeugten bzw. gebildeten Ergebnisse in der Ergebnisspeichereinrichtung 403m gespeichert. Zum Zeitpunkt der Satzbildung verarbeitet die Bildungseinrichtung 402 die gegebene semantische Darstellung unter Verwendung der zuvor in der Beschränkungsspeichereinrichtung 408 zur Satzbildung gespeicherten Beschränkungen, und die Ergebnisse werden in der Ergebnisspeichereinrichtung 403m gespeichert.
  • Der Ausdruck "Beschränkung" zur Satzbildung bedeutet eine Einschränkung der während des Vorgangs zur Bildung eines Satzes durchgeführten Auswahlrichtung. Die Beschränkungen sind in tabellarischer Form gegeben, wobei ein Beispiel in Tabelle 2 dargestellt ist.
  • Es gibt zwei Arten von Beschränkungen: eine feste Beschränkung, wie den Satzstil, bei der es keine Veränderung im Verlauf der Bildung eines Satzes gibt, und eine freie Beschrän kung, wie die Satzlänge, bei der es eine Veränderung im Verlauf der Satzbildung gibt. In dem Beispiel in Tabelle 2, zeigen der "Satztyp" und der "Satzstil", bei denen es sich um feste Beschränkungen handelt, einen "Beschreibungssatz" oder einen "Höflichkeitssatz" an. Bei dem Vorgang zur Erzeugung eines Satzes wird der Satz nicht in einen Fragesatz oder Befehlssatz geändert, wenn es sich um einen Beschreibungssatz handelt. Ein Höflichkeitssatz wird nicht in einen unhöflichen Satz geändert.
  • Vierzehn Satzverarbeitungsoperationen, wie eine "Einfachsatz/Zusammengesetzter-Satz-Umwandlungsverarbeitung", eine "Emphaseverarbeitung durch einen Relativsatz", eine "Prädikatentscheidungsverarbeitung", ..., eine "Hilfsverb- /Modusentscheidungsverarbeitung", sind in der Satzbildungsvorrichtung 400 ausgebildet. Modulnummern 1 bis 14 sind diesen 14 Verarbeitungsarten zugeordnet. Die bei der Einfachsatz/Zusammengesetzter-Satz-Umwandlungsverarbeitung geltende Beschränkung ist die Anzahl von Verbindungen in einem Satz. Dies ist die Anzahl von Satzgliedern. In geschriebenem Japanisch hat ein Satz mit einer großen Anzahl von Satzgliedern eine große Länge. Obwohl ein solcher Satz für den Leser einfach zu verstehen ist, vermittelt er den Eindruck von Langatmigkeit. Dagegen ist ein Satz mit einer geringen Anzahl von Satzgliedern kurz und vermittelt den Eindruck von Knappheit. Die für die Emphaseverarbeitung durch einen Relativsatz geltende Beschränkung ist die "Anzahl von Verschachtelungen von Relativsätzen". Diese Beschränkung schränkt die Anzahl von Schichten ein, mit der Sätze verschachtelt werden. In einem japanischen/englischen Satz wird ein logischer Eindruck vermittelt, wenn die Anzahl von Verschachtelungen groß ist. Sind allerdings zu viele Verschachtelungen vorhanden, wird ein umstrittener Eindruck vermittelt. Die Anzahl von Verschachtelungen wirkt sich auch auf die Satzlänge aus.
  • Für die Prädikatentscheidungsverarbeitung gibt es drei oder mehrere Beschränkungen. Diese beinhalten eine Beschränkung bezüglich der Länge eines in einem Prädikat verwendeten Oberflächenwortes, eine Beschränkung, ob Kanji (chinesische Schriftzeichen) oder Hiragana (japanische Silbenschreibschrift) in dem Oberflächenwort eines Prädikats verwendet wird, und eine Beschränkung, ob ein japanisches Verb oder ein Sa-hen-Verb in dem Prädikat verwendet wird. Das hier angeführte Sa-hen-Verb ist ein der japanischen Sprache eigenes Verb. Wird das japanische Wort "suru" (das dem Wort "do" oder "perform" in der englischen Sprache entspricht) an ein Handlungsnomen angefügt (das in einem chinesischen zusammengesetzten Wort aus chinesischen Schriftzeichen geschrieben ist), das die Bestimmung einer Handlung darstellt, kann das Ergebnis (das vorstehend angeführte Sa-hen-Verb) als Verb verwendet werden, das die die Durchführung der Handlung kennzeichnet. Beispielsweise ist das Nomen des Verbs "ugoku" ("move") "ido" ("movement"), und "ido suru" hat die gleiche Bedeutung wie das Verb "ugoku" ("move"). Da ein Sa-hen-Verb eine Kombination eines zusammengesetzten Worts aus chinesischen Schriftzeichen und suru in der japanischen Sprache ist, wird dem Leser der Eindruck eines harten oder gelehrten Stils vermittelt. Wenn allgemein ein Sa-hen-Verb (beispielsweise ido-suru) und das entsprechende japanische Verb (beispielsweise ugoku) verglichen werden, besteht kein Unterschied in der Bedeutung, jedoch vermittelt das japanische Verb einen sanfteren oder weicheren Eindruck. Dies kann beispielsweise aus dem Unterschied der Ausdrücke "to perform movement" und "to move" verstanden werden. In der japanischen Sprache unterscheiden sich ein japanisches Verb und ein Sahen-Verb mit der gleichen Bedeutung dahingehend, daß im allgemeinen das Sa-hen-Verb eine größere Anzahl von Zeichen erfordert, während das japanische Verb durch weniger Zeichen ausgedrückt werden kann. Demnach besteht die Beschränkung darin, daß es einen Einfluß auf die Satzlänge hat, ob ein japanisches Verb oder ein Sa-hen-Verb verwendet wird.
  • Ein chinesisches Schriftzeichen (Kanji) ist ein Ideogramm, und ein japanisches Hiragana-Zeichen ist ein phonetisches Symbol. Demzufolge hat die Auswahl eines Oberflächenwortes, das durch Hiragana dargestellt wird, oder eines Oberflächenwortes, das durch Kanji dargestellt wird, einen Einfluß auf die Satzlänge, und die Länge des Satzes ist ein Maßstab für die Lesbarkeit.
  • In der japanischen Sprache wird ein Hilfsverb an ein deklinierbares Wort oder dergleichen angefügt, um diesem verschiedene Bedeutungen zu verleihen und bei der Beschreibung zu helfen. Ein Hilfsverb kann auch an das Ende eines Nomens angefügt werden, um ihm eine beschreibende Bewegung zu verleihen. Demzufolge verleiht ein Hilfsnomen verschiedene Bedeutungen, wie Passiv, Bezug, Negation, Vergangenheit, Perfekt, Konjunktiv, Willen und Wunsch. In der englischen Sprache wird ein Hilfsverb an ein Verb angehängt und dient zum Ausdruck eines Modus oder einer Zeit. Demnach unterscheiden sich die Bedeutung eines gebildeten Satzes und der vermittelte Eindruck erheblich in Abhängigkeit von dem zugeordneten Oberflächenwort. Bei der Festlegung eines Hilfsverbs oder eines Modus wird die Satzlänge durch die für das Oberflächenwort ausgewählte Länge und in Abhängigkeit davon beeinlußt, ob Hiragana oder Kanji verwendet wird.
  • Bezüglich jeder Beschränkung bei den vorstehend beschriebenen verschiedenartigen Satzbildungsverarbeitungen werden die Länge eines gebildeten Satzes, die Qualität des Satzes und seine Lesbarkeit in Abhängigkeit davon festgelegt, welcher "Wert" für jede Beschränkung verwendet wird.
  • In dem Satzbildungsvorgang verändert die Steuereinrichtung 407 der Satzbildungsvorrichtung 400 den "Wert" der "Beschränkung" in Abhängigkeit von dem Ergebnis der durch die Bewertungseinrichtung 404 durchgeführten Bewertung. In der Tabelle 2 ist der "Anfangswert" einer freien Beschränkung ein Wert, der vorherrscht, wenn die Satzbildung beginnt. Der "aktuelle Wert" einer freien Beschränkung ist der gegenwärtig vorherrschende Wert der Beschränkung, und die "historischen Informationen" einer freien Beschränkung zeichnen den Verlauf der Änderung des Werts der Beschränkung auf. Der Wert einer Beschränkung wird beruhend auf bestimmten Regeln geändert. Die Regeln zur Bestimmung, wie dies ausgeführt wird, befinden sich in der Satzverbesserungswissensbasis 409.
  • Wenn die Satzbildungsverarbeitung durch eine bestimmte Satzbildungseinrichtung 402m endet, werden die Zwischenergebnisse in Schritt S2 der Satzbildungseinrichtung 402m+1 für den nächsten Satzbildungsschritt zugeführt, und die Satzbildung wird fortgeführt. Wird ein Satz aus den semantischen Darstellungen in Fig. 5 erzeugt, der durch die Operationen aller erforderlichen Verarbeitungseinrichtungen auf diese Weise erzielt wird, werden die gebildeten bzw. erzeugten Ergebnisse in Schritt S3 bewertet. Die Bewertung wird durch den Vergleich eines Bewertungswerts für die gegenwärtig erhaltenen Ergebnisse und eines vorab gegebenen Bewertungsbezugswerts durchgeführt. Der Bezugswert kann in Übereinstimmung mit dem Niveau des Lesers eingestellt werden. Genügen die Ergebnisse der Bewertung dem Bewertungsbezugswert, wird in Schritt S4 bestimmt, ob die Satzbildung bezüglich aller eingegebenen semantischen Darstellung durchgeführt wurde. Sind alle Satzbildungsvorgänge abgeschlossen, wird der das aktuelle Ergebnis bildende Satz ausgegeben, und die Verarbeitung beendet.
  • Genügen andererseits die Ergebnisse der Bewertung nicht dem Bewertungskriterium, wird die Satzbildung erneut über die aus den Schritten S5&rarr;S6&rarr;S7&rarr;S8&rarr;S2 gebildete Schleife durchgeführt. Die Schritte 55 bis 58 bilden eine Prozedur zur Änderung einer Beschränkung zum Erhalten besserer Ergebnisse. Das heißt, es handelt sich um eine Prozedur zur Veränderung des "Werts" einer Beschränkung.
  • In Schritt S5 wird das den Ergebnissen der Bewertung entsprechende Satzverbesserungswissen aus der Satzverbesserungswissensbasis 409 entnommen, um zu ermitteln, welcher Teil der ausgegebenen Ergebnisse ungeeignet ist, und wie er verbessert werden soll.
  • Fig. 6 stellt die Art und Weise dar, wie sich die erzeugten Ergebnisse und die Ergebnisse der Bewertung in einem Fall ändern, in dem die Schleife aus den Schritten 52 bis 57 bei dem vorstehend beschriebenen bestimmten Beispiel angewendet wird.
  • Gemäß diesem Ausführungsbeispiel wird die Bewertung in Schritt S3 darauf beruhend durchgeführt, ob der Satz lang oder kurz ist. Es wird angenommen, daß ein lesbarer japanischer Satz ein aus beispielsweise 35 Schriftzeichen oder weniger bestehender Satz ist. Demnach wird die Bewertung in Schritt S3 derart durchgeführt, daß ein erzeugter Satz als ungeeignet beurteilt wird, wenn der Satz mehr als 35 Zeichen aufweist.
  • In Schritt S3 wird der folgende Satz (der Satz ist hier in englisch angeführt, obwohl der tatsächlich bewertete Satz japanisch ist) bewertet:
  • "Because snow had been falling since morning and the transit system was in disarray, Hanako, who had slept until late morning, arrived at the office late." Dieser Staz ist das Ergebnis der Satzbildungsverarbeitung, die jedes Modul bei den semantischen Darstellungen anwendet, die von der semantischen Analyseeinrichtung 300 eingegeben werden, gemäß der "Beschränkung" des Anfangswerts. Diese Anfangsausgabe ist in a in Fig. 6 dargestellt. Die Ausgabe a besteht im ganzen aus 43 Schriftzeichen in Japanisch (25 Wörtern in Englisch). Da dies die obere Grenze von 35 Zeichen überschreitet, die das Bewertungskriterium darstellt, wird das Bewertungsergebnis b ("Satz ist zu lang") in Fig. 6 erhalten.
  • Die Tabelle 1 stellt die in dem Satzverbesserungswissen enthaltenen Regeln dar. Zum Bewirken einer Verbesserung im Ansprechen auf das Bewertungsergebnis, das angibt, daß der Satz zu lang ist, zeigen die Regeln, welche Beschränkung welches speziellen Satzbildungsmoduls wie geändert werden muß.
  • Der Satz (2) ist das Ergebnis der entsprechend den Beschränkungen (Tabelle 2) der Anfangswerte beruhend auf den semantischen Darstellungen in Fig. 5 durchgeführten Satzbildung. Im Fall, daß der somit erzeugte Satz als zu lang beurteilt wird, und eine Verbesserung zum Verkürzen des Satzes benötigt wird, besteht ein effektives Verfahren zum Verkürzen des Satzes in der Auswahl kurzer Oberflächenwörter oder der Auswahl von Oberflächenwörtern unter Verwendung vieler Kanji. Es gibt andere Verfahren zum Verkürzen eines Satzes, wobei Beispiele in der Tabelle 1 gezeigt sind.
  • Gemäß den Regeln in Tabelle 1 sind in der "Hilfsverb- /Modusentscheidung"-Verarbeitung (Modul Nr. 14) ein geänderter Wert (der Anfangswert ist "Zwischenlänge"), der "kurz" kennzeichnet, bezüglich einer Beschränkung, die ein "Schichtwort" (lang/kurz) kennzeichnet, und ein geänderter Wert (der Anfangswert ist "Hiragana"), der "Kanji" kennzeichnet, bezüglich einer Beschränkung gegeben, die "Oberflächenwort (Kanji/Hiragana)" kennzeichnet, wodurch eine Satzverkürzungsregel ausgedrückt wird. Bezüglich einer "Relativsatz-, Emphasen-Verarbeitung" (Modul Nr. 2) wird der Wert um 1 für die Beschränkung "Anzahl von Verknüpfungen von Relativsätzen" verringert, wodurch eine Satzverkürzungsregel ausgedrückt wird.
  • Die Satzbildungsvorrichtung 400 ist derart eingerichtet, daß eine Satzbildungsverarbeitungsoperation überall abgebrochen wird und durch eine Vielzahl von Bildungsverarbeitungsmodulen durchgeführt wird, damit ein Satz aus semantischen Darstellungen erzeugt werden kann. Wie es in der Tabelle 2 gezeigt ist, gibt es im ganzen 14 Verarbeitungsmodule von 1 bis 14. Das heißt, alle mit den 14 Modulen verknüpften Verarbeitungsoperationen werden in Schritt S2 (n = 14) in Fig. 4 ausgeführt, und infolgedessen wird ein von einem Menschen zu ver stehender Satz aus den semantischen Darstellungen in Fig. 5 gebildet. Diese Module führen die Funktionen aus, mit denen sie versehen wurden. Da die zu einem Modul gehörende Beschränkung sich direkt oder indirekt auf die dem Modul gegebene Funktion bezieht, ist es für ein bestimmtes Modul möglich, eine Beschränkung aufzuweisen, die sich nicht auf bestimmte Satzverbesserungsregeln bezieht. Demnach beschreibt eine Satzverbesserungsregel geänderte Werte, die alle Beschränkungen betreffen, die sich auf das Objekt der Verbesserung beziehen. In dem Beispiel der Tabelle 1 ist die Regel eine Verbesserungsregel für die Bewertung, die feststellt, daß der Satz zu lang ist. Aus diesem Grund ist sie derart eingerichtet, daß zwei Beschränkungen bezüglich der Modulnummer 14 (Hilfsverb-/Modusentscheidung) geändert werden, zwei Beschränkungen bezüglich der Modulnummer 13 (Konjunktionsausdrucksentscheidung) geändert werden, zwei Beschränkungen bezüglich der Modulnummer 8 (Pronomen/Ellipse/Sprichwort) geändert werden, sechs Beschränkungen bezüglich des Moduls 5 (Entscheidungen über Objekte, Ergänzungen und nähere Bestimmungen) geändert werden, sechs Beschränkungen bezüglich des Moduls 4 (Prädikatentscheidung) geändert werden, eine Entscheidung bezüglich der Modulnummer 2 (Relativsatz, Emphase) geändert wird, und eine Beschränkung bezüglich der Modulnummer 1 (Einfachsatz/zusammengesetzer Satz) geändert wird.
  • Somit wird bezüglich der Satzverbesserungsregeln, die die Verkürzung eines Satzes kennzeichnen, die Änderung der Werte mit dem Wissen hinsichtlich 20 Beschränkungen entschieden. Diese in das Satzverbesserungswissen geschriebene Verbesserungsregeln sind mit einer Prioritätsreihenfolge (Rangfolge) bezüglich der Anwendung versehen. Der Grund dafür ist, daß es unnötig für alle Verbesserungsregeln ist, gleichzeitig angewendet zu werden. In dem Beispiel der Tabelle 1 ist den 20 Beschränkungen in den sieben Verarbeitungsmodulen eine Rangfolge von 1 bis 20 gegeben.
  • Die Schritte S5 bis S7 in Fig. 4 beschreiben die Änderung von Regeln. Das heißt, das Satzverbesserungswissen der in Tabelle gezeigten Art wird in Schritt S5 entnommen. Der Wert der "Beschränkung" eines Verarbeitungsmoduls, die dem Wert in einem Rangzähler entspricht, der den aktuell verarbeiteten Rang anzeigt, wird in Schritt S6 geändert. Ist der Wert in dem Rangzähler beispielsweise "7", wird der Wert der Beschränkung geändert, die das "Oberflächenwort (lang/kurz)" der Verarbeitung "Entscheidung über Objekte, Ergänzungen und nähere Bestimmungen" des fünften Moduls kennzeichnet. Die Änderung von · Steuerwerten wird durch Änderung der gespeicherten Werte der "aktuellen Werte" in Tabelle 2 durchgeführt.
  • In Schritt S7 wird die in Übereinstimmung mit dem Rangzähler geänderte Verarbeitung bestimmt. Diese Bestimmung beinhaltet eine Bestimmung eines Verarbeitungsmoduls, das erneut auszuführen ist. Das Signifikante an der gleichzeitigen Neu- Durchführungsverarbeitung besteht darin, daß lediglich diese Module der Reihe nach in Schritt S2 ausgeführt werden. In Schritt S8 wird der Rangzähler zur Inkrementation aufgerufen. Somit werden in Schritt S2 lediglich die in Schritt S7 bestimmten Verarbeitungsmodule der Reihe nach ausgeführt. Ist die Verarbeitung des Schritts 52 beendet, werden die erzeugten Ergebnisse wiederum in Schritt S3 bewertet.
  • Dies wird mittels eines bestimmten Beispiels beschrieben. Bei dem Beispiel des Satzes (2) wird angenommen, daß eine Satzverbesserungsregel zur Bereitstellung einer Rückkopplung zu der Verarbeitung "Entscheidung über Objekte, Ergänzungen und nähere Bestimmungen" und zum Einschalten der Beschränkung "Anordnen von semantischen Satzdarstellungen" des Rangs 10 zu Beginn zur Verkürzung der Länge eines Satzes verwendet wurde. In diesem Fall wird in Schritt S7 die "Entscheidung über Objekte, Ergänzungen und nähere Bestimmungen" als zurückzuführende Satzbildungsverarbeitung bestimmt, und das Programm kehrt daraufhin zu Schritt S2 zurück. Die Verarbeitung "Entscheidung über Objekte, Ergänzungen und nähere Bestimmungen" wird in Schritt S2 ausgeführt. Es ist ersichtlich, daß bei der Anwendung der Beschränkung "Anordnen von semantischen Satzdarstellungen" bei dem Satz (2), der Abschnitt "slept until late morning" in "overslept" umgeordnet wird, wie es bei c in Fig. 6 dargestellt ist. Infolge dieser Wortlautänderung wird die Satzverkürzung bis zu einem gewissen Ausmaß erreicht. Der durch diese Verarbeitung neu erzeugte Satz d, d. h. "Because snow had been falling since morning and the transit system was in disarray, Hanako, who had overslept, arrived at the office late." wird durch die Bewertungseinrichtung 404 in Schritt S3 neu bewertet. (Das vorstehend Angeführte ist die englische Übersetzung. Der tatsächlich neu bewertete Satz ist in japanischer Sprache). Bei der Neubewertung wird herausgefunden, daß die Anzahl von Schriftzeichen in dem japanischen Satz 38 beträgt (23 in englisch). Obwohl dies eine Verbesserung darstellt, überschreitet die Anzahl der Zeichen immer noch die obere Grenze von 35, und daher liefert die Bewertung, daß der Satz zu lang ist (Bewertungsergebnis e).
  • Auf der Grundlage des Bewertungsergebnisses e wird eine Beschränkungsänderung wiederum entsprechend den Satzverbesserungsregeln der Tabelle 1 durchgeführt. Nun wird angenommen, daß eine Beschränkungsänderungsregel, die "Verringere die Anzahl von Verbindungen in dem Satz um 1" des Rangs 20 kennzeichnet, angewendet wird. Diese Beschränkungsänderung liefert die Beschränkung "Aufsplitten semantischer Darstellungen".
  • Wurde diese Beschränkung geändert, kehrt das Programm wiederum zu Schritt S2 zurück, und es wird eine "Einfachsatz- /Zusammengesetzter-Satz"-Verarbeitung ausgeführt. Die in Fig. 5 gezeigten semantischen Darstellungen werden an "Ursache" (die "to be late" und "to be in disarray" verbindet) getrennt, die eine Verbindung darstellt. In Schritt S2 werden die semantischen Darstellungen in Fig. 5 aufgespalten, woraus sich der Satz g ergibt, d. h. "Snow had been falling since morning and the transit system was in disarray. Therefore, Hanako, who had overlept, arrived at the office late." Dieser erzeugte Satz wird der Ergebnisbewertungseinrichtung 403 erneut zugeführt, wo der Satz bewertet wird.
  • Die zwei sich aus der vorhergehenden Teilung ergebenden Sätze bestehen jeweils aus 20 Zeichen im Japanischen (13 Wörtern in Englisch) und 26 Zeichen im Japanischen (10 Wörtern in Englisch). Da die Länge dieser Sätze passend ist, ist das Bewertungskriterium erfüllt, und die Verarbeitung wird beendet (h in Fig. 6).
  • Somit ermöglicht das erste Verfahren zur Erzeugung eines japanischen Satzes, daß ein leicht lesbarer japanischer Satz' durch Eingabe semantischer Darstellungen und dann durch Durchlaufen der folgenden Schleife entsprechend den Beschränkungsbedingungen erhalten wird: Satzbildung &rarr; Bewertung des gebildeten Satzes &rarr; Änderung von Beschränkungsbedingungen &rarr; Neubildung des Satzes &rarr; Neubewertung &rarr; ....
  • Abwandlung des ersten Verfahrens
  • Nachstehend wird eine Abwandlung des ersten Verfahrens beschrieben.
  • Bei dem vorstehend beschriebenen ersten Verfahren wurde ein japanischer Satz als veranschaulichender Satz beschrieben. Allerdings ist es auch möglich, andere Sprachen außer Japanisch anzuwenden, wie die englische Sprache, indem Bewertungskriterien, Beschränkungen und ein Verbesserungswissen entsprechend jeder Sprache bereitgestellt wird.
  • Obwohl die Bewertung eines gebildeten Satzes beruhend auf der Satzlänge durchgeführt wird, ist es möglich, einen gebildeten Satz unter Verwendung eines anderen Kriteriums zu bewerten.
  • Beispielsweise sind Höflichkeitssilben der japanischen Sprache eigen. Eine exzessive Verwendungen von Höflichkeitssilben macht einen Satz unnatürlich. Demnach kann die Quantitätsbestimmung eines Index des Höflichkeitsniveaus einen Maßstab für die Bewertung eines gebildeten Satzes liefern. Der Index kann beispielsweise durch die Wiederholungsperiode und Anzahl in einem Satz gemessen werden. Dann wird eine Satzverbesserungsregel angewendet, gemäß dieser, wenn das Höflichkeitsniveau durch eine derartige Quantitätsmessung bewertet wird, aufeinanderfolgend verwendete Höflichkeitssilben beispielsweise aus einem Satz entfernt, der als außerordentlich höflich eingestuft wird.
  • Gemäß dem vorstehend beschriebenen ersten Verfahren werden die semantischen Darstellungen eines Satzes entnommen und verarbeitet. Es ist allerdings auch möglich, die Satzbildung durch Zusammennehmen der semantischen Darstellungen eines vollständigen Texteils in einem Stück durchzuführen und diesen Text als Bewertungssubjekt zu verwenden.
  • Des weiteren ist es möglich, die bei dem ersten Verfahren verwendeten Bewertungsbezugswerte durch Umschreiben der Tabelle dieser Bewertungsbezugswerte zu überarbeiten. Durch eine derartige Überarbeitung können Sätze erzeugt werden, die für Leser auf verschiedenen Niveaus geeignet sind.
  • Bei dem vorstehend beschriebenen ersten Verfahren wird eine Wenn-Dann-Regel durch die Ausgabesatz-Bewertungseinrichtung 404 verwendet. Allerdings ist es auch möglich, eine Anordnung anzuwenden, bei der ein neuronales Netz zur Durchführung des Lernens verwendet wird, indem semantische Darstellungen und ein Satz von diesen entsprechenden geeigneten Ausgabesätzen verwendet und eine Bewertung beruhend auf den Ergebnissen des Lernens durchgeführt wird.
  • < Zweites Verfahren zur Bildung japanischer Sätze>
  • Bei dem vorstehend beschriebenen ersten Verfahren werden die Satzbildung und die Bewertung des gebildeten Satzes auf alternierende Weise wiederholt. Infolgedessen dauert die Ausgabe eines Satzes einige Zeit, wenn die Bewertungskriterien streng sind. Ist daher die benötigte Satzqualität nicht so hoch und soll die Satzbildung mit hoher Geschwindigkeit durchgeführt werden, kann das erste Verfahren Schwierigkeiten bereiten. Da außerdem Sätze beruhend auf voreingestellten Bewertungsbezugswerten in dem ersten Verfahren erzeugt werden, sind die erzeugten Sätze ähnlich im Aufbau und können monoton sein. Demnach ist das nachstehend beschriebene zweite Verfahren zur Erzeugung leicht lesbarer Sätze mit hoher Geschwindigkeit eingerichtet.
  • Aufbau und Arbeitsweise des zweiten Verfahrens
  • Fig. 7 zeigt ein Blockschaltbild der Satzbildungsvorrichtung 400 (Fig. 1) für das zweite Verfahren. Mit jenen in Fig. 1 identische Abschnitte der Satzbildungsvorrichtung 400 in Fig. 7 sind mit den gleichen Bezugszeichen bezeichnet. Hauptsächlich werden lediglich von jenen Abschnitten der Satzbildungsvorrichtung 400 für das erste in Fig. 2 dargestellte Verfahren verschiedene Abschnitte beschrieben. Neu hinzugefügte Elemente sind die Modusspeichereinrichtung 417, eine Einrichtung 418 zur Speicherung der Anzahl, wie oft Verbesserungen durchgeführt werden, und eine Oberer-Grenzwert- Speichereinrichtung 419.
  • Die Modusspeichereinrichtung 417 dient zur Speicherung eines Satzbildungsmodus. Gemäß dem zweiten Verfahren sind zwei Modi verfügbar, d. h. ein "Verbesserungsmodus" und ein "Hochgeschwindigkeitsmodus", von denen einer ausgewählt werden kann. Wird der Verbesserungsmodus ausgewählt wird die Satzerzeugung/-verbesserung entsprechend dem ersten Verfahren ausgeführt. Wird der Hochgeschwindigkeitsmodus ausgewählt, bewertet die Ergebnisbewertungseinrichtung 404 die durch die Satzbildungseinrichtung 402 gebildeten Ergebnisse nicht, und dadurch wird es möglich, Sätze mit hoher Geschwindigkeit zu erzeugen.
  • Die Speichereinrichtung 418 dient zur Speicherung, wie oft eine Satzverbesserung in der Satzbildungsvorrichtung 400 durchgeführt wurde. Überschreitet die Anzahl von Satzverbesserungen einen in der Speichereinrichtung 419 gespeicherten oberen Grenzwert TH&sub1;, weist die Speichereinrichtung 418 die Modusspeichereinrichtung 417 zur Auswahl des Hochgeschwindigkeitsmodus an.
  • Die Satzbildungsvorrichtung für das zweite Verfahren weist den in Fig. 3 gezeigten Hardware-Aufbau auf.
  • Die Fig. 8A und 8B zeigen ein Ablaufdiagramm einer Steuerprozedur zur Satzbildung gemäß dem zweiten Verfahren. In Schritt S10 des Ablaufdiagramms werden Anfangseinstellungen vorgenommen. Diese Einstellungen beinhalten eine Einstellung der in der Speichereinrichtung 418 gespeicherten Anzahl von Satzverbesserungen auf "0" und das Auswählen des Verbesserungsmodus als Satzbildungsmodus. Dann wartet das System auf die Eingabe einer semantischen Darstellung in Schritt S11. Wird eine semantische Darstellung der Bedeutungsdarstellungsspeichereinrichtung 401 zugeführt, geht das Programm zu Schritt S12 über. Die Verarbeitung in Schritt S12 ist die gleiche wie in Schritt S2 des ersten Verfahrens.
  • Ist der Schritt S12 beendet, wird der in der Speichereinrichtung 417 gehaltene Modus in Schritt S13 überprüft. Ist das Ergebnis der Modusüberprüfung der Hochgeschwindigkeitsmodus, wird in Schritt S15 festgelegt, ob der gesamte Satzbildungsvorgang beendet wurde. Ist der Satzbildungsvorgang beendet, wird der die aktuellen Ergebnisse anzeigende Satz ausgegeben und die Verarbeitung beendet.
  • Ist das Ergebnis der Modusüberprüfung in Schritt S13 der Verbesserungsmodus, werden die erzeugten Ergebnisse in Schritt S14 bewertet. Wie bei dem ersten Verfahren wird diese Bewertung durch Vergleichen eines Bewertungswerts für die aktuell erhaltenen Ergebnisse und eines vorab gegebenen Bewertungsbezugswerts ausgeführt. Genügen die Ergebnisse der Bewertung dem Bewertungsbezugswert, wird in Schritt S15 das Ende der Verarbeitung bestimmt.
  • Genügen andererseits die Ergebnisse der Bewertung nicht dem Bewertungskriterium (NEIN in Schritt S14), wird die Satzbildung erneut zum Bewirken einer Verbesserung durchgeführt. Die in der Speichereinrichtung 418 gespeicherte Anzahl von Satzverbesserungen wird in Schritt S16 um eins erhöht, und in Schritt S17 wird bestimmt, ob die Anzahl von Verbesserungen die obere Grenze TH&sub1; erreicht hat, die in der Oberer- Grenzwert-Speichereinrichtung 419 eingestellt ist. Wurde die obere Grenze nicht erreicht, wird die Satzverbesserung durch Änderung der Beschränkung zum Erhalten besserer Ergebnisse ausgeführt. Daher geht das Programm zuerst zu Schritt S18 über. Die Verarbeitung der Schritte S18 bis S21 ist die gleiche wie die Verarbeitung der Schritte S5 bis S8 des ersten Verfahrens. Insbesondere besitzt auch das zweite Verfahren Beschränkungen der Art, wie sie in der Tabelle 2 gezeigt sind, und ein Satzverbesserungswissen der Art, wie es in der Tabelle 1 gezeigt ist.
  • Der Vorgang, durch den ein Satz verbessert wird, ist der gleiche wie bei dem ersten Verfahren.
  • Beim Vorgang zur Verbesserung eines Satzes gibt es Fälle, in denen die Anzahl, wie oft die Verbesserungsverarbeitung ausgeführt wird, die in der Speichereinrichtung 419 gespeicherte obere Grenze überschreitet. Nachstehend wird ein Fall beschrieben, bei dem in Schritt S17 für die Anzahl von Verbesserungen bestimmt wurde, daß sie die obere Grenze überschreitet. Wurde eine derartige Bestimmung durchgeführt, sollte die als nächstes ausgeführte Satzbildungsoperation die letzte sein, daß sich kein Abfallen der Satzbildungseffizienz ergibt. Demnach geht das Programm von Schritt S17 zu Schritt S22 über, in dem der durch die Modusspeichereinrichtung 417 gespeicherte Modus in den Hochgeschwindigkeitsmodus geändert wird. Infolgedessen springt das Programm nach der Rückkehr des Programms zu Schritt S12 und nach der Durchführung einer Satzbildungsverarbeitung bedingungslos von Schritt S13 zu Schritt S15, die erzeugten Ergebnisse werden nicht bewertet und es wird keine weitere Verbesserung durchgeführt. Somit wird die Satzbildung mit hoher Geschwindigkeit durchgeführt. Beispielsweise wird angenommen, daß die semantischen Darstellungen von Fig. 5 wie bei dem ersten Verfahren eingegeben wurden. Wird die obere Grenze der Anzahl von Verbesserungen auf eins gesetzt, wird das Ergebnis d (Fig. 6) der ersten Verbesserung nicht länger bewertet, und das Ergebnis d wird angenommen.
  • Somit kann eine effizientere Satzbildung erreicht werden, indem mehr Satzverbesserungen als erforderlich verhindert werden.
  • Abwandlung des zweiten Verfahrens
  • Übertrifft die Anzahl von Satzverbesserungen die obere Grenze bei dem zweiten Verfahren, wird der Verbesserungsmodus oder der Hochgeschwindigkeitsmodus automatisch ausgewählt. Es kann jedoch auch eine Anordnung angewendet werden, in der der Benutzer den Modus manuell auswählt.
  • Wenn ferner der Hochgeschwindigkeitsmodus in dem zweiten Verfahren errichtet ist, werden die Ergebnisse für keine der n Satzbildungseinrichtungen 402 bewertet. Es kann jedoch auch eine Anordnung angewendet werden, bei der die Bewertung unabhängig bezüglich der erzeugten Ergebnisse von den einzelnen Satzbildungseinrichtungen bestimmt wird. <
  • Drittes Verfahren zur Erzeugung japanischer Sätze>
  • Das nachstehend beschriebene dritte Verfahren dient zur Realisierung der Hochgeschwindigkeitsverarbeitung auf eine Weise ähnlich der bei dem zweiten Verfahren. Bei dem dritten Verfahren wird der obere Grenzwert über die Anzahl von Satzverbesserungen für zwei, d. h. einen hohen und einen niedrigen Pegel eingestellt. Überschreitet die Anzahl von Verbesserungen den kleineren oberen Grenzwert, wird das Bewertungskriterium zur Bestimmung, ob ein erzeugter Satz verbessert wird oder nicht, allmählich jedesmal dann nachgelassen, wenn eine Verbesserung ausgeführt wird. Überschreitet die Anzahl von Verbesserungen den größeren oberen Grenzwert, werden die Bewertungen angehalten und die Satzbildung wird bedingungslos beendet. Infolgedessen werden Sätze mit hoher Geschwindigkeit erzeugt.
  • Aufbau und Arbeitsweise des dritten Verfahrens
  • Fig. 9 zeigt ein Blockschaltbild des Aufbaus der Satzbildungsvorrichtung 400 gemäß dem dritten Verfahren. Mit jenen in Fig. 2 identische Abschnitte in der Satzbildungsvorrichtung 400 in Fig. 9 sind mit dem gleichen Bezugszeichen bezeichnet. Verglichen mit dem ersten Verfahren sind neu hinzugefügte Elemente die Einrichtung 418 zur Speicherung der Anzahl, wie oft Verbesserungen durchgeführt werden, die Speichereinrichtung 419 zur Speicherung der oberen Grenze über die Anzahl, wie oft Verbesserungen durchgeführt werden, eine Bewertungsbezugswerteinstelleinrichtung 420 zur Änderung und Einstellung von Bezugswerten in der Bewertungsbezugswerttabelle 405, und ein Speicher 421 zur Speicherung neuer Bewertungsbezugswerte. Die Speichereinrichtungen 408 und 419 sind die gleichen wie jene in dem zweiten Verfahren.
  • In Fig. 9 bewertet die Ergebnisbewertungseinrichtung 404 die Lesbarkeit der Zwischenergebnisse. Die Bewertungsbezugswer teinstelleinrichtung 420 liest einen in der Bewertungsbezugswerttabelle 405 eingestellten Bewertungsbezugswert aus dem Speicher 421 und ändert den Wert. In Abhängigkeit von den Ergebnissen des Vergleichs der in der Speichereinrichtung 418 gehaltenen Anzahl von Verbesserungen mit jedem der in der Oberer-Grenzwert-Speichereinrichtung 419 gehaltenen zwei oberen Grenzwerte (TH&sub1;, TH&sub2;) entscheidet die Bewertungsbezugswerteinstelleinrichtung 420, welcher in dem Speicher 21 gespeicherte Bezugswert zu verwenden ist. Die Oberer-Grenzwert- Speichereinrichtung 419 speichert die zwei oberen Grenzwerte (TH&sub1;, TH&sub2;) der Anzahl von Verbesserungen, wie es vorstehend angeführt ist. Übersteigt die Anzahl, wie oft Verbesserungen durchgeführt werden, den ersten oberen Grenzwert TH&sub1;, setzt die Bewertungsbezugswerteinstelleinrichtung 420 einen Bewertungsbezugswert L herab.
  • Nachstehend ist ein Arithmetikausdruck auf der Grundlage gezeigt, mit der der Bezugswert durch die Bewertungsbezugswerteinstelleinrichtung 420 herabgesetzt wird. M stellt die durch die Bewertungseinrichtung 404 unmittelbar vor dem Erreichen des ersten oberen Grenzwerts TH&sub1; ausgegebenen Ergebnisse der Bewertung dar, und L&sub0; stellt den aktuellen Bewertungsbezugswert dar, der nahe M ist. Ein neuer Bewertungsschwellenwert L&sub1; ist wie folgt gegeben:
  • L&sub1; = L&sub0; + (M - L&sub0;)/2 (3)
  • Überschreitet die Anzahl von Satzverbesserungen den zweiten oberen Grenzwert TH&sub2;, setzt die Bewertungsbezugswerteinstelleinrichtung 420 den Bewertungsbezugswert L auf den maximalen Grad herab, so daß jeder Satz in die Toleranz fällt.
  • Der Hardware-Aufbau der Satzbildungsvorrichtung 400 gemäß dem dritten Verfahren ist der gleiche wie der in Verbindung mit Fig. 3 beschriebene.
  • Nachstehend wird die Verarbeitungsprozedur gemäß dem dritten Verfahren unter Bezugnahme auf das Ablaufdiagramm in den Fig. 10A und 10B beschrieben.
  • Die Verarbeitung in den Schritten S90 bis 594, die die Ausbildung eines Satzes und den Erhalt von Ergebnissen beinhalten, die dem Bewertungsbezugswert L genügen, entspricht der Schleife aus den Schritten S10 bis S15 in den Fig. 8A, 8B abgesehen von der den Modus betreffenden Verarbeitung.
  • Wird in Schritt S93 bestimmt, daß die Ergebnisse der Bewertung das Bewertungskriterium nicht erfüllen, wird noch einmal eine Satzbildung zur Verbesserung des Satzes durchgeführt. Demzufolge erhöht sich die in der Speichereinrichtung 418 gespeicherte Anzahl der Satzverbesserung in Schritt S95 um eins, und in Schritt S96 wird bestimmt, ob die Anzahl von Verbesserungen die größere obere Grenze TH&sub2; (> TH&sub1;) erreicht hat. Wurde der obere Grenzwert TH&sub2; nicht erreicht, wird in Schritt S97 bestimmt, ob die Anzahl von Verbesserungen die erste (kleinere) obere Grenze TH&sub1; erreicht hat.
  • Wird in Schritt S97 herausgefunden, daß der erste obere Grenzwert erreicht wurde, wird der neue Bewertungsbezugswert L&sub1; eingestellt, der gemäß Gleichung 3 erhalten wird. Wird der erste obere Grenzwert überschritten, oder wenn er auch nicht überschritten wird, erhöht sich die in der Speichereinrichtung 418 gespeicherte Anzahl von Satzverbesserungen in Schritt S98 um eins. Dann werden zum Erhalten besserer Ergebnisse die Schritte von S99 an ausgeführt.
  • Wurde andererseits in Schritt S96 herausgefunden, daß die Anzahl von Satzverbesserungen den zweiten oberen Grenzwert TH&sub2; überschritten hat, wird der Bewertungsbezugswert auf den maximalen Grad in Schritt S102 herabgesetzt, woraufhin das Programm zu Schritt S94 übergeht.
  • Somit wird ein gebildeter japanischer Satz auf effiziente Art und Weise verbessert. Das dritte Verfahren unterscheidet sich von dem zweiten Verfahren darin, daß der als Kriterium zur Bestimmung, ob die Satzverbesserung fortzuführen ist, auf graduelle Weise herabgesetzt wird. Gemäß dem zweiten Verfahren wird die Bestimmung, ob die Satzverbesserung fortzuführen ist, allein auf einem Vergleich mit einem Bezugswert durchgeführt. Somit liefert das dritte Verfahren einen höheren Grad an Verbesserung als das zweite Verfahren.
  • Modifikation des dritten Verfahrens
  • Bei dem vorstehend beschriebenen dritten Verfahren sind zwei obere Grenzen für die Anzahl von Satzverbesserungen eingestellt. Es kann allerdings auch eine Anordnung angewendet werden, bei der lediglich eine obere Grenze eingestellt ist, und das Kriterium allmählich herabgesetzt wird, wenn diese obere Grenze überschritten wird.
  • Es kann auch eine andere Anordnung angewendet werden, bei der keine obere Grenze eingestellt ist, sondern die Satzverbesserung bei allmählicher Herabsetzung des Kriteriums vom Beginn ausgeführt wird.
  • Ferner wird bei dem vorstehend beschriebenen Ausführungsbeispiel ein Bezugswert für jeden Satz durch die Bewertungsbezugswerteinstelleinrichtung 405 eingestellt. Infolgedessen wird, selbst wenn ein Bewertungsbezugswert herabgesetzt wird, der ursprüngliche Bewertungsbezugswert verwendet, wenn der nächste Satz erzeugt wird. Allerdings ist auch eine Anordnung möglich, bei der ein Bezugswert in dem Speicher gespeichert wird, wenn er einmal herabgesetzt ist.
  • Viertes Verfahren zur Erzeugung japanischer Sätze
  • Bei den vorstehend beschriebenen ersten und zweiten Verfahren ist der Bezugswert L zur Bewertung der Satzbildung immer fest. Bei dem dritten Verfahren wird der Bezugswert L, obwohl er nicht fest ist, derart geändert, daß er ein gleichmäßiger glatter Wert ist. Ist jedoch der Bezugswert fest eingestellt oder derart, daß er sich gleichmäßig verändert, gleichen die Strukturen ausgebildeter Sätze einander und werden zu einfach. Gemäß dem vierten Verfahren werden monotone Sätze verhindert. Um dies zu bewerkstelligen, ist der Bewertungsbezugswert L, der als Maßstab zur Erzeugung eines Satzes dient, mit einer Schwankung beaufschlagt, wodurch gebildete Sätze mit einer Verschiedenheit versehen werden. Dadurch wird die Vermeidung von Monotonie ermöglicht, die der Leser vielleicht empfindet.
  • Aufbau und Arbeitsweise des vierten Verfahrens
  • Fig. 11 zeigt ein Blockschaltbild eines Beispiels des Aufbaus der Satzbildungsvorrichtung 400, bei der das vierte Verfahren angewendet wird.
  • Das Merkmal des vierten Verfahrens, das dieses Verfahren von dem dritten Verfahren in Fig. 9 unterscheidet, besteht darin, daß die Einrichtung 418 zur Speicherung der Anzahl von Satzverbesserungen und die Einrichtung 419 zur Speicherung des oberen Grenzwerts in Fig. 9 weggelassen sind und eine Zufallszahlerzeugungseinrichtung 22 vorgesehen ist. Infolgedessen verwendet die Bewertungsbezugswerteinstelleinrichtung 420 eine durch die Zufallszahlerzeugungseinrichtung 422 erzeugte Zufallszahl anstatt der Bezugnahme auf die Anzahl, wie oft eine Satzverbesserung ausgeführt wird, wie es bei dem zweiten und dem dritten Verfahren durchgeführt wird. Das heißt, ein zuvor in dem Bewertungsbezugswert 421 eingestellter Bezugswert ist mit einer Schwankung durch einen durch die Zufallszahlerzeugungseinrichtung 18 erzeugten Zufallswert versehen, wodurch ein neuer Bezugswert für jeden Satz eingestellt wird.
  • Fig. 12 zeigt ein Ablaufdiagramm der Arbeitsweise des vierten Verfahrens. Abgesehen von dem Schritt S110, in dem von einer Zufallszahl zur Einstellung eines Bewertungsbezugswerts für jeden Satz Gebrauch gemacht wird, sind die Schritte dieses Ablaufdiagramms die gleichen wie jene in den Fig. 8 und 10.
  • Die Fig. 13 und 14 zeigen die Bewertung eines in dem vierten Verfahren erzeugten Satzes, sowie den Übergang einer Satzneuerzeugung zur Verbesserung. Zur Vereinfachung der Beschreibung wird die Diskussion von Bewertungsbesonderheiten lediglich auf die Satzlänge beschränkt.
  • Ein Prozedur zur Änderung des Bewertungsbezugswerts L mittels einer Zufallszahl wird zuerst beschrieben. Mit der Satzlänge als Bewertungsbezugswert sollte der Anfangswert LLI einer unteren Grenze LL 0 (Zeichen) sein, und der Anfangswert LMI einer oberen Grenze LM sollte 35 (Zeichen) sein. Die Zufallszahlerzeugungseinrichtung 18 erzeugt eine Zufallszahl R mit einem Wert von -0,5 bis +0,5 (eine Einstellung von ±50% ist möglich).
  • Ausführungsbeispiel 1
  • Fig. 13 zeigt ein Ausführungsbeispiel für den Fall mit R = +0,3.
  • Ein unterer Grenzwert LL1 und ein oberer Grenzwert LM1 eines neuen Bezugswerts L&sub1;, die vorherrschen, wenn ein Bezugswert L&sub0; auf den neuen Bezugswert L&sub1; geändert wird, sind wie folgt eingestellt:
  • LL1 = LL0 + LL0 · R = 0 + 0 · 0,3 = 0
  • LM1 = LM0 + LM0 · R = 35 + 35 · 0,3 = 46
  • wobei LL0 = LL1, LM0 = LM1 zu Beginn gelten.
  • Das zu Anfang erzeugte Ergebnis a (Fig. 13) bezüglich des Satzes (2), das ein Beispiel für das erste Verfahren ist, lautet "Because snow had been falling since morning and the transit system was in disarray, Hanako, who had slept until late morning, arrived at the office late.". Da die Länge dieses Satzes (in japanisch) 43 Zeichen beträgt, entscheidet die Bewertungseinrichtung 404, daß dies in den eingestellten Bereich der Bewertungsbezugswerte fällt (größer als 0 Zeichen und kleiner als 46 Zeichen) (Schritt S113), und infolgedessen ist die Satzbildung beendet. Da keine Satzverbesserung durchgeführt wird, wird die Ausbildung des japanischen Satzes mit hoher Geschwindigkeit durchgeführt.
  • Ausführungsbeispiel 2
  • Ein Beispiel für den Fall mit R = -0,5 ist in den Fig. 14A und 14B gezeigt.
  • Ein unterer Grenzwert LL1 und ein oberer Grenzwert LM1 eines neuen Bezugswerts L&sub1; sind wie folgt eingestellt:
  • LL1 = LL0 + LL0 · R = 0 + 0 · (-0,5) = 0
  • LM1 = LM0 + LM0 · R = 35 + 35 · (- 0,5) = 18
  • In den Fig. 14A und 14B unterscheiden sich a bis f von a bis f in Fig. 6 (des ersten Verfahrens) bezüglich des Bezugswerts, allerdings sind die Ergebnisse der Bewertung und die Verarbeitung exakt die gleichen. Daher wird auf diese Beschreibung verzichtet. In g in Fig. 14B wird der erste der zwei sich aus der Teilung ergebenden Sätze als Gegenstand der nachfolgenden Verarbeitung verwendet. Obwohl die Länge dieses Satzes 20 Zeichen in japanisch (13 Wörter in englisch) beträgt, ist dies immer noch nicht weniger als 18 Zeichen, die als Bewertungsbezugswert dienen. Das Ergebnis ist die Bewertung h, die anzeigt, daß der Satz zu lang ist.
  • Daraufhin wird entsprechend der Satzverbesserungsregel in Tabelle 1 die Beschränkung, die die semantische Darstellung aufspaltet, noch einmal gemäß Regel i eingeschaltet, d. h. "verringere Verbindungen im Satz um eins".
  • Ist die Beschränkung geändert, geht das Programm wiederum zur Satzbildung in Schritt S112 über. Die in Fig. 5 gezeigten semantischen Darstellungen werden nun an der Verbindung zwischen "to be in disarray" und "to fall" aufgetrennt.
  • In Schritt S112 wird der Satz "Snow had been falling since morning" (j in Fig. 14B) durch Auftrennen der semantischen Darstellungen gebildet.
  • Der gebildete Satz wird wiederum der Ergebnisspeichereinrichtung 403 zugeführt, wo der Satz erneut bewertet wird. Die sich aus der letzten Teilung ergebende Länge des Satzes beträgt 11 Zeichen (in japanisch), was geringer als der Bewertungsbezugswert ist (18 Zeichen). Infolgedessen ist die Verarbeitung beendet.
  • Da der erste der zwei sich aus der Teilung ergebenden Sätze eine Länge von 11 Zeichen hat, was den Bewertungsbezugswert erfüllt, ist die Satzbildung beendet. Der Satz, der mit "Transit facilities..." beginnt, wird mittels eines ähnlichen Verfahrens erzeugt, nachdem ein neuer Bewertungsbezugswert durch Berücksichtigung der Schwankung eingestellt ist.
  • Somit werden gemäß dem vierten Ausführungsbeispiel erzeugte Sätze nicht monoton, da eine Schwankung berücksichtigt wird.
  • Modifikation des vierten Verfahrens
  • In dem vierten Verfahren ist der Bereich der Schwankung des Bewertungsbezugswerts ±50%. Es ist allerdings auch eine Anordnung derart denkbar, daß der Bereich durch den Benutzer bestimmt werden kann.
  • Obwohl der Bereich der Schwankung ein Prozentsatz bezüglich des Bezugswerts in dem vierten Verfahren ist, kann der Bereich auch entsprechend der Anzahl von Zeichen beschränkt sein.
  • Im Fall, in dem die Satzverbesserungsregeln erschöpft sind, bevor der Bezugswert in dem vierten Verfahren erfüllt ist, wird die Satzbildung ausgesetzt. Wenn die Satzverbesserungsregeln erschöpft sind, ist es allerdings möglich, die Satzbildung durch Neueinstellung des Bewertungsbezugswerts wieder aufzunehmen.
  • In dem vierten Verfahren ist ein japanischer Satz als veranschaulichender Satz beschrieben. Allerdings ist es auch möglich, andere Sprachen als japanisch, wie beispielsweise die englische Sprache, durch das Ausbilden von Bewertungskriterien, Beschränkungen und eines Verbesserungswissens entsprechend jeder Sprache anzuwenden.
  • In dem vierten Verfahren werden die semantischen Darstellungen eines Satzes entnommen und verarbeitet. Allerdings ist es auch möglich, eine Satzbildung durch Zusammennehmen der semantischen Darstellungen eines vollständigen Textteils durchzuführen, und das Ergebnis als Gegenstand der Bewertung zu verwenden.
  • Des weiteren ist es möglich, den Bewertungsbezugswert in Abhängigkeit von dem Niveau des Lesers zu ändern. Infolge dieser Änderung können Sätze gebildet werden, die für den bestimmten Leser geeignet sind.
  • Es besteht das Risiko, daß eine Endlosschleife nicht nur durch Bestimmung wiederholter Beschränkungen der Satzbildung zum wiederholten Male, sondern auch dann gebildet wird, wenn Sätze mit dem gleichen Zustand gebildet werden. Demnach kann eine Anordnung verwendet werden, bei der die Satzbildung zwingend beendet wird.
  • In dem vorstehend beschriebenen vierten Verfahren wird eine Wenn-Dann-Regel als Regel verwendet, die durch die Ergebnisbewertungseinrichtung verwendet wird. Allerdings ist es auch möglich, eine Anordnung zu verwenden, bei der ein neuronales Netz zur Durchführung des Lernens benutzt wird, indem semantische Darstellungen und ein Satz entsprechender geeigneter Ausgabesätze angewendet werden, und eine Bewertung eines ausgegebenen Satzes beruhend auf den Ergebnissen des Lernens durchgeführt wird.
  • Die Erfindung kann bei einem System aus einer Vielzahl von Einrichtungen oder bei einer einzelnen Einrichtung angewendet werden. Natürlich kann die Erfindung auch in einem Fall angewendet werden, in dem einem System oder einer Einrichtung ein Programm zugeführt wird.
  • Vorteile des zweiten bis vierten Verfahrens
  • Gemäß dem zweiten bis vierten Verfahren wird ein erzeugter Satz unverzüglich bewertet, und die Ergebnisse der Bewertung werden rückgeführt, wie es vorstehend beschrieben ist. Demzufolge kann ein leicht lesbarer Satz erzeugt werden und es kann eine Verarbeitung mit hoher Geschwindigkeit durch Beschränkung dieser Rückkopplung bei Bedarf erreicht werden. Außerdem kann verhindert werden, daß erzeugte Sätze monoton werden, indem eine Veränderung des zur Bewertung verwendeten Bezugswerts angewendet wird.
  • < Erzeugung englischer Sätze>
  • Das vorstehend beschriebene Beispiel betrifft die Erzeugung eines japanischen Satzes aus einem eingegebenen englischen Satz und die Verbesserung des erzeugten japanischen Satzes in dem Übersetzungssystem in Fig. 1. Das nachstehend beschriebene Beispiel betrifft ein Verfahren zur Verbesserung eines englischen Satzes in der Satzbildungsvorrichtung 400, wenn ein japanischer Satz in das Übersetzungssystem in Fig. 1 eingegeben wird, und ein englischer Satz durch das System ausgegeben wird.
  • Der Aufbau der Satzbildungsvorrichtung 400 ist der gleiche wie in den Fig. 2 und 3 für die Japanisch-Englisch- Übersetzung gezeigte. Allerdings ergeben sich die Beschränkungen der Beschränkungsspeichereinrichtung 408 (Fig. 2) wie in Tabelle 3 gezeigt, und die Satzverbesserungswissensbasis wie in Tabelle 4 gezeigt, wobei das Ergebnis der Bewertung "Satz ist zu lang" ist. Tabelle 3 TABELLE 4
  • N STELLT DIE MAXIMALE ANZAHL VON VERBINDUNGEN IM SATZ DAR.
  • Fig. 15 zeigt ein Beispiel der in die Satzbildungsvorrichtung 400 für die Japanisch-Englisch-Übersetzung eingegebenen semantischen Darstellungen. Die in Fig. 15 gezeigten semantischen Darstellungen drücken folgendes aus: "I felt chill this morning but I went to my office to take part in an urgent conference so I got a high fever.".
  • Die durch die Satzbildungsvorrichtung 400 ausgeführte Steuerprozedur für dieses Übersetzungsbeispiel ist die gleiche wie in Fig. 4. In Schritt S1 in Fig. 4 wartet das System auf die Eingabe semantischer Darstellungen.
  • Werden die semantischen Darstellungen der Semantikdarstellungs-Speichereinrichtung 401 zugeführt, geht das Programm zu dem Satzbildungsprozeß in Schritt S2 über. Der Satzbildungsprozeß wird in n Abschnitte eingeteilt. In Schritt S2 werden die Satzbildungsverarbeitungsoperationen der entsprechenden n Satzbildungseinrichtungen 402&sub1;-402n der Reihe nach ausgeführt. Die Satzbildungseinrichtung 402m, die den Schritt S2 ausführt, verarbeitet die semantischen Darstellungen unter Verwendung von Beschränkungen, die zuvor der Einrichtung 407 zugeführt werden, die die Beschränkungen zur Satzbildung speichert, und die Ergebnisse der Verarbeitung werden in der Ergebnisspeichereinrichtung 403m gespeichert.
  • Die Beschränkungen zur Bildung englischer Sätze setzen die Richtung zur Auswahl fest, da englische Sätze gebildet werden, und sind in der Form einer Tabelle gegeben, wie es vorstehend angeführt ist. Beispiele der Beschränkungen sind in der Tabelle 3 gezeigt.
  • Die Beschränkungen für englische Sätze sind zweierlei Art, d. h. feste Beschränkungen, wie der Satzstil, die sich nicht ändern, während ein Satz den Bildungsvorgang durchläuft, und freie Beschränkungen, wie die Anzahl von Wörtern in einem englischen Satz, die sich während des Vorgangs der Satzbildung ändern können. Anfangswerte der freien Beschränkungen sind zuvor gegeben, und die aktuellen Werte werden in die Tabelle der Beschränkungsspeichereinrichtung 407 geschrieben, und historische Informationen bezüglich dieser Werte werden gesammelt. Dies gleicht dem vorstehend bezüglich der Tabelle (Tabelle 2) zur Erzeugung japanischer Sätze beschriebenen.
  • Ist Schritt S2 beendet, werden die erzeugten Ergebnisse in Schritt S3 bewertet. Diese Bewertung wird durch einen Vergleich eines Bewertungswerts für die gegenwärtig erhaltenen Ergebnisse und eines Bewertungsbezugswerts, der zuvor gegeben ist, durchgeführt. Der Bezugswert kann in Übereinstimmung mit dem Niveau des Lesers eingestellt sein.
  • In Schritt S4 wird bestimmt, ob alle Satzbildungsvorgänge abgeschlossen sind. Sind sie abgeschlossen, wird der das aktuelle Ergebnis bildende Satz ausgegeben und die Verarbeitung ist beendet.
  • Genügen andererseits die Ergebnisse der Bewertung nicht dem Bewertungskriterium, wird die Satzbildung noch einmal durchgeführt. Zum Erhalten besserer Ergebnisse bei der Neuausführung der Satzbildung werden die Beschränkungen entsprechend den Verbesserungsregeln in Tabelle 4 geändert. Daraufhin geht das Programm zu Schritt S5 über.
  • In Schritt S5 wird das mit den Ergebnissen der Bewertung übereinstimmende Satzverbesserungswissen aus der Satzverbesserungswissensbasis 409 zur Bestimmung extrahiert, welcher Teil der ausgegebenen Ergebnisse ungeeignet ist, und wie dieser verbessert werden sollte.
  • Fig. 16 zeigt eine Bewertung sowie den Übergang der Satzneubildung entsprechend diesem Beispiel.
  • Zuerst wird bestimmt, daß das zu Beginn erzeugte Ergebnis a, d. h. "I felt chill this morning but I went to my office to take part in an urgent conference so I got a high fever.", eine Länge von 24 Wörtern in Englisch hat. Da diese Länge eine obere Grenze von 20 Wörtern als eingestelltes Bewertungskriterium überschreitet, wird ein Bewertungsergebnis b (Fig. 16) bezüglich des Effekts, daß der Satz zu lang ist, erhalten. Das Satzverbesserungswissen für diese Bewertung ist in Tabelle 4 gezeigt.
  • Regeln darüber, wie ein Satz verbessert werden sollte, sind in das Satzverbesserungswissen geschrieben. Beispielsweise kann als Beispiel einer Verbesserungsregel für die Bewertung, daß der Satz zu lang ist, "Wähle Satz mit geringerer Wortanzahl." in der "Hilfsverb-/Modusentscheidung"-Verarbeitung oder "Verringere Anzahl von Verschachtelungen" in der "Relativsatz"-Verarbeitung gegeben sein, was eine Verbesserung bewirkt.
  • In dem Wissen sind Rangfolgen für die englische Satzverbesserung festgesetzt, wie im Fall der japanischen Satzverbesserung.
  • Beruhend auf dem in Schritt S5 extrahierten Satzverbesserungswissen werden die Beschränkungen für die Satzbildung in der unmittelbar vorhergehenden Erzeugungsverarbeitungsoperation, die eine Rückkopplung erfährt, in Schritt S6 geändert.
  • Zur Verkürzung der Satzlänge in diesem Beispiel wird eine Rückkopplung bei der "Prädikat-Entscheidung"-Verarbeitung angewendet, und eine die Beschränkung "Satzsemantikdarstellungen anordnen" des Rangs 17 in Tabelle 4 einschaltende Satzverbesserungsregel wird zu Beginn verwendet.
  • Die zurückzuführende Bildungsverarbeitung wird in Schritt S7 bestimmt, und das Programm kehrt dann zu der Bildungsverar beitung ("Prädikat-Entscheidung"-Verarbeitung in diesem Fall) in Schritt S2 zurück.
  • Werden das Objekt, Ergänzungen und nähere Bestimmungen der in Fig. 15 gezeigten semantischen Darstellungen neu berücksichtigt, ist verständlich, daß der Abschnitt "take part in" in "attend" umbenannt wird, wie es in c in Fig. 16 gezeigt ist. Der Satz wird noch einmal mit Ausführung dieser Umbenennung gebildet. Der neu gebildete Satz d, d. h. "I felt chill this morning but I went to my office to attend an urgent conference so I got a high fever.", wird durch die Bewertungseinrichtung 404 neu bewertet. Nun beträgt die Anzahl von Wörtern 22. Obwohl dies eine Verbesserung darstellt, überschreitet die Länge des Satzes immer noch die obere Grenze von 20 Wörtern. Infolgedessen ergibt die Bewertung, daß der Satz immer noch zu lang ist.
  • Beruhend auf dem Bewertungsergebnis e und entsprechend der Satzverbesserungsregeln der Tabelle 4 werden die semantischen Darstellungen entsprechend der Regel "Verringere Anzahl von Verbindungen in dem Satz um 1" des Rangs 20 unterteilt. Wenn somit die Beschränkung geändert ist, geht das Programm wieder zu Schritt S2 über. Es ist verständlich, daß die in Fig. 15 gezeigten semantischen Darstellungen an der "Ursache" (die "get" und "go" verbindet) getrennt werden, die die Verbindungsbeziehung darstellt. Demnach wird durch das Aufspalten (f in Fig. 16) der semantischen Darstellungen in Schritt S2 der folgende Satz g gebildet: "I felt chill this morning but I went to my office to take part in an urgent conference. So I got a high fever.".
  • Der erzeugte Satz wird wiederum der Ergebnisspeichereinrichtung 403 zur Neubewertung zugeführt.
  • Die zwei sich aus der vorhergehenden Trennung ergebenden Sätze bestehen jeweils aus 18 Wörtern und 6 Wörtern. Da die Län gen dieser Sätze passend sind, ist das Bewertungskriterium erfüllt und die Verarbeitung ist beendet (h in Fig. 16).
  • Modifikation der englischen Satzbildung
  • In dem vorstehend beschriebenen Beispiel zur Bildung eines englischen Satzes wird ein Fall als Beispiel verwendet, bei dem der ausgegebene übersetzte Satz in Englisch vorliegt. Allerdings kann die Erfindung wie bei dem vorhergehenden Ausführungsbeispiel auch in einem Fall angewendet werden, in dem die Sätze in anderen Sprachen als japanisch ausgegeben werden, indem Bewertungskriterien, Beschränkungen und ein Verbesserungswissen entsprechend jeder Sprache ausgebildet wird.
  • Gemäß dem vorstehend beschriebenen Ausführungsbeispiel werden semantische Darstellungen eines Satzes entnommen und verarbeitet. Allerdings ist es auch möglich, die Satzbildung durch Zusammenfassung der semantischen Darstellungen eines vollständigen Textteils mit einer Vielzahl von Sätzen durchzuführen und die erzeugten Ergebnisse als Gegenstand der Beurteilung zu verwenden.
  • In dem vorstehend beschriebenen Beispiel zur Bildung eines englischen Satzes werden die Bildung und Bewertung auf alternierende Art und Weise wiederholt, wie es auch in dem ersten Verfahren zur Bildung eines japanischen Satzes der Fall ist. Ist infolgedessen das Bezugskriterium zu streng, dauert es einige Zeit, bis ein Ausgabesatz erhalten wird. Demnach ist die Anwendung des zweiten bis vierten Verfahrens bei der Bildung eines englischen Satzes ähnlich wie bei der Erzeugung eines japanischen Satzes sehr geeignet. In diesem Fall besteht das Risiko, daß eine Endlosschleife nicht nur durch die Bestimmung einer Schleifenbeschränkung für einige Male sondern auch dann ausgebildet wird, wenn Sätze mit dem gleichen Zustand gebildet werden. Demnach kann eine Anordnung verwendet werden, bei der die Satzbildung zwingend beendet wird.
  • Ferner können durch die Überarbeitung von Bewertungsbezugswerten in Abhängigkeit von dem Niveau des englisch lesenden Lesers englischsprachige Sätze erzeugt werden, die für Leser verschiedener Niveaus geeignet sind.
  • Vier Verfahren zur Bildung japanischer Sätze und ein Verfahren zur Bildung englischer Sätze wurden vorstehend beschrieben. Obwohl vorstehend angeführt wurde, daß die Satzverbesserung der Satzlängenverkürzung dient, bedeutet dies keine Beschränkung auf den Zweck der Verbesserung. Wie es beispielsweise in Verbindung mit dem ersten Verfahren beschrieben ist, kann eine Satzverbesserung zur Verbesserung der verwendeten Ausdrucksweisen ausgeführt werden. Beispielsweise kann ein Satz, in dem sehr höfliche Ausdrücke verwendet werden, in einen Satz umgewandelt werden, in dem gemäßigtere Ausdrücke verwendet werden.

Claims (16)

1. Satzbildungssystem zum Bilden eines Satzes, mit einer Eingabeeinrichtung (100, 200, 300) zur Eingabe einer semantischen Satzdarstellung,
einer Bedingungsspeichereinrichtung (408) zur Speicherung einer Bedingung, die eine während einer Satzbildung durchgeführte Auswahl einer Satzdarstellung einschränkt,
einer Satzbildungseinrichtung (402) zum Bilden eines Satzes aus der eingegebenen semantischen Darstellung durch die Auswahl einer Satzdarstellung, die der in der Bedingungsspeichereinrichtung gespeicherten Bedingung genügt, und
einer Bewertungseinrichtung (404) zum Bewerten der durch die Satzbildungseinrichtung erzeugten Ergebnisse bezüglich eines in einer Bewertungskriterium-Speichereinrichtung (405) gespeicherten Bewertungskriteriums,
dadurch gekennzeichnet, daß
das System ferner eine Steuereinrichtung (407) aufweist, die im Ansprechen auf die durch die Bewertungseinrichtung durchgeführte Bewertung zur Änderung der gespeicherten Bedingung bezüglich in einer Regelspeichereinrichtung (409) gespeicherter Satzverbesserungsregeln betreibbar ist, um die Neu- Ausführung der Bildung des Satzes beruhend auf der geänderten Bedingung und eine Neu-Bewertung zu bewirken.
2. System nach Anspruch 1, dadurch gekennzeichnet, daß die Satzbildungseinrichtung eine Vielzahl von Teil- Satzbildungseinrichtungen (402&sub1;, 402&sub2;, 402n) aufweist, die jeweils einen Teil einer Satzbildungsverarbeitung ausführen, wobei die Bewertungseinrichtung von jeder der Vielzahl der Teil-Satzbildungseinrichtungen erzeugte Ergebnisse bewertet.
3. System nach Anspruch 1 oder 2, gekennzeichnet durch eine Ergebnisspeichereinrichtung (403) zur Speicherung von durch die Satzbildungseinrichtung erzeugten Ergebnissen, wobei die Bewertungseinrichtung die in der Ergebnisspeichereinrichtung gespeicherten Ergebnisse bewertet und Ergebnisse der Bewertung der Steuereinrichtung zuführt.
4. System nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, daß das in der Bewertungskriterium-Speichereinrichtung gespeicherte Bewertungskriterium eine Länge des durch die Satzbildungseinrichtung gebildeten Satzes ist.
5. System nach Anspruch 4, dadurch gekennzeichnet, daß die Regelspeichereinrichtung Satzverbesserungsregeln zum Verkürzen der Länge des gebildeten Satzes speichert, wobei diese Regeln Werte zum Verkürzen des Satzes im Hinblick auf die Bedingung beschreiben.
6. System nach Anspruch 5, dadurch gekennzeichnet, daß die Satzverbesserungsregeln die Wortlänge eines oberflächlichen Wortes regeln, das den gebildeten Satz bildet.
7. System nach Anspruch 5, dadurch gekennzeichnet, daß die Satzverbesserungsregeln die Anzahl von in dem gebildeten Satz enthaltenen Satzteilen regeln.
8. System nach einem der vorhergehenden Ansprüche, gekennzeichnet durch eine Zähleinrichtung (407, 418) zum Zählen der Anzahl, wie oft Satzbildungen von der Satzbildungseinrichtung ausgeführt werden, wobei die Steuereinrichtung, wenn eine Satzbildung beruhend auf der durch die Änderungseinrichtung geänderten Bedingung neu ausgeführt wird, eine Neu-Ausführung in Abhängigkeit von einem durch die Zähleinrichtung registrierten Zählwert steuert.
9. System nach Anspruch 8, dadurch gekennzeichnet, daß die Steuereinrichtung die Anzahl von Neu-Ausführungen begrenzt.
10. System nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, daß das System ferner eine Kriteriumänderungseinrichtung (420, 421) zur Änderung des in der Bewertungskriterium- Speichereinrichtung gespeicherten Bewertungskriteriums aufweist.
11. System nach Anspruch 10, dadurch gekennzeichnet, daß die Kriteriumänderungseinrichtung eine Zufallszahl- Erzeugungseinrichtung (422) zur Erzeugung einer Zufallszahl aufweist, wobei das Bewertungskriterium beruhend auf der durch die Zufallszahl-Erzeugungseinrichtung erzeugten Zufallszahl geändert wird.
12. System nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, daß
die Eingabeeinrichtung
eine Satzeingabeeinrichtung (100) zur Eingabe eines Satzes in einer ersten Sprache und
eine Analyseeinrichtung (200, 300) zur Ausgabe einer semantischen Darstellung auf eine Analyse des durch die Satzeingabeeinrichtung eingegebenen Satzes in der ersten Sprache hin aufweist,
wobei die Satzbildungseinrichtung den Satz in einer zweiten Sprache bildet und ausgibt.
13. System nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, daß die Steuereinrichtung die Neu-Ausführung in einem Fall anhält, wenn die Bewertungseinrichtung bestimmt hat, daß ein vorbestimmtes Bewertungskriterium erfüllt wurde.
14. Satzbildungsverfahren zum Bilden eines Satzes, mit den Schritten:
(a) Eingeben einer semantischen Satzdarstellung,
(b) Speichern einer Bedingung, die eine während einer Satzbildung durchgeführte Auswahl einer Satzdarstellung einschränkt,
(c) Bilden eines Satzes aus der eingegebenen semantischen Darstellung durch Auswählen einer Satzdarstellung, die der Bedingung genügt, die gespeichert wurde, und
(d) Bewerten von in Schritt (c) erzeugten Ergebnissen, wobei die Bewertung bezüglich eines Bewertungskriteriums durchgeführt wird,
gekennzeichnet durch die weiteren Schritte
(e) Ändern der gespeicherten Bedingung bezüglich Satzverbesserungsregeln beruhend auf der Bewertung in Schritt (d) und
(f) Wiederholen der Schritte (c) bis (e), bis die Bewertung in Schritt (d) ein vorbestimmtes Kriterium erfüllt.
15. Verfahren nach Anspruch 14, gekennzeichnet durch die weiteren Schritte:
(g) Zählen der Anzahl, wie oft Satzbildungen in Schritt
(c) ausgeführt werden, und
(h) Steuern einer Neu-Ausführung in Schritt (c) in Abhängigkeit von einem in Schritt (g) registrierten Zählwert, wenn Schritt (c) beruhend auf der in Schritt (e) geänderten Bedingung neu ausgeführt wird.
16. Verfahren nach Anspruch 14 oder 15, dadurch gekennzeichnet, daß
Schritt (a) die Schritte
(a1) Eingeben eines Satzes in einer ersten Sprache und (a2) Ausgeben einer semantischen Darstellung auf eine Analyse des eingegebenen Satzes in der ersten Sprache hin aufweist,
wobei in Schritt (a2) der Satz in einer zweiten Sprache gebildet und ausgegeben wird.
DE69130246T 1990-08-01 1991-07-31 System zur Bildung von Sätzen Expired - Fee Related DE69130246T2 (de)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP20584290A JP3192415B2 (ja) 1990-08-01 1990-08-01 文生成方式
JP16151791A JP3320078B2 (ja) 1991-07-02 1991-07-02 文生成装置及びその方法
JP3165732A JPH0512329A (ja) 1991-07-05 1991-07-05 機械翻訳方式

Publications (2)

Publication Number Publication Date
DE69130246D1 DE69130246D1 (de) 1998-10-29
DE69130246T2 true DE69130246T2 (de) 1999-03-18

Family

ID=27321868

Family Applications (1)

Application Number Title Priority Date Filing Date
DE69130246T Expired - Fee Related DE69130246T2 (de) 1990-08-01 1991-07-31 System zur Bildung von Sätzen

Country Status (3)

Country Link
US (1) US5369574A (de)
EP (1) EP0469884B1 (de)
DE (1) DE69130246T2 (de)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102018210003A1 (de) 2018-06-20 2019-12-24 Robert Bosch Gmbh Verfahren und Vorrichtung zum Anlernen eines Modells für maschinelles Lernen

Families Citing this family (63)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03129469A (ja) * 1989-10-14 1991-06-03 Canon Inc 自然言語処理装置
DE69333568T2 (de) * 1992-09-04 2004-10-21 Caterpillar Inc Integriertes entwurf- und übersetzungssystem.
US5675815A (en) * 1992-11-09 1997-10-07 Ricoh Company, Ltd. Language conversion system and text creating system using such
US5640581A (en) * 1994-08-12 1997-06-17 Masashi Saraki CD-ROM information editing apparatus
GB2295470A (en) * 1994-11-28 1996-05-29 Sharp Kk Machine translation system
JPH08235182A (ja) * 1995-02-28 1996-09-13 Canon Inc 文章処理方法とその装置
US6292767B1 (en) * 1995-07-18 2001-09-18 Nuance Communications Method and system for building and running natural language understanding systems
US5987404A (en) * 1996-01-29 1999-11-16 International Business Machines Corporation Statistical natural language understanding using hidden clumpings
US7051024B2 (en) * 1999-04-08 2006-05-23 Microsoft Corporation Document summarizer for word processors
US5956667A (en) * 1996-11-08 1999-09-21 Research Foundation Of State University Of New York System and methods for frame-based augmentative communication
DE19849855C1 (de) * 1998-10-29 2000-04-27 Ibm Verfahren zur automatischen Generierung einer textlichen Äußerung aus einer Bedeutungsrepräsentation durch ein Computersystem
US6401061B1 (en) * 1999-05-13 2002-06-04 Yuri L. Zieman Combinatorial computational technique for transformation phrase text-phrase meaning
US7269802B1 (en) * 1999-11-01 2007-09-11 Kurzweil Cyberart Technologies, Inc. Poetry screen saver
CN1465018A (zh) * 2000-05-11 2003-12-31 南加利福尼亚大学 机器翻译技术
JP2002108858A (ja) * 2000-09-20 2002-04-12 Internatl Business Mach Corp <Ibm> 機械翻訳方法、機械翻訳装置および記録媒体
US8214196B2 (en) 2001-07-03 2012-07-03 University Of Southern California Syntax-based statistical translation model
US20160132796A9 (en) * 2001-07-26 2016-05-12 Bernd Schneider CPW method with application in an application system
US7620538B2 (en) 2002-03-26 2009-11-17 University Of Southern California Constructing a translation lexicon from comparable, non-parallel corpora
US7711545B2 (en) 2003-07-02 2010-05-04 Language Weaver, Inc. Empirical methods for splitting compound words with application to machine translation
US8548794B2 (en) 2003-07-02 2013-10-01 University Of Southern California Statistical noun phrase translation
US7376552B2 (en) * 2003-08-12 2008-05-20 Wall Street On Demand Text generator with an automated decision tree for creating text based on changing input data
JP2005100335A (ja) * 2003-09-01 2005-04-14 Advanced Telecommunication Research Institute International 機械翻訳装置、機械翻訳コンピュータプログラム及びコンピュータ
JP3919771B2 (ja) * 2003-09-09 2007-05-30 株式会社国際電気通信基礎技術研究所 機械翻訳システム、その制御装置、及びコンピュータプログラム
US20050120002A1 (en) * 2003-10-02 2005-06-02 Hassan Behbehani Automated text generation process
US7698125B2 (en) 2004-03-15 2010-04-13 Language Weaver, Inc. Training tree transducers for probabilistic operations
US8296127B2 (en) 2004-03-23 2012-10-23 University Of Southern California Discovery of parallel text portions in comparable collections of corpora and training using comparable texts
US8666725B2 (en) 2004-04-16 2014-03-04 University Of Southern California Selection and use of nonstatistical translation components in a statistical machine translation framework
US7562008B2 (en) * 2004-06-23 2009-07-14 Ning-Ping Chan Machine translation method and system that decomposes complex sentences into two or more sentences
US8600728B2 (en) 2004-10-12 2013-12-03 University Of Southern California Training for a text-to-text application which uses string to tree conversion for training and decoding
US8886517B2 (en) 2005-06-17 2014-11-11 Language Weaver, Inc. Trust scoring for language translation systems
US8676563B2 (en) 2009-10-01 2014-03-18 Language Weaver, Inc. Providing human-generated and machine-generated trusted translations
US7974833B2 (en) 2005-06-21 2011-07-05 Language Weaver, Inc. Weighted system of expressing language information using a compact notation
US7389222B1 (en) 2005-08-02 2008-06-17 Language Weaver, Inc. Task parallelization in a text-to-text system
US7813918B2 (en) 2005-08-03 2010-10-12 Language Weaver, Inc. Identifying documents which form translated pairs, within a document collection
US7624020B2 (en) 2005-09-09 2009-11-24 Language Weaver, Inc. Adapter for allowing both online and offline training of a text to text system
US10319252B2 (en) 2005-11-09 2019-06-11 Sdl Inc. Language capability assessment and training apparatus and techniques
US8943080B2 (en) 2006-04-07 2015-01-27 University Of Southern California Systems and methods for identifying parallel documents and sentence fragments in multilingual document collections
US8886518B1 (en) 2006-08-07 2014-11-11 Language Weaver, Inc. System and method for capitalizing machine translated text
US8433556B2 (en) 2006-11-02 2013-04-30 University Of Southern California Semi-supervised training for statistical word alignment
US9122674B1 (en) 2006-12-15 2015-09-01 Language Weaver, Inc. Use of annotations in statistical machine translation
US8468149B1 (en) 2007-01-26 2013-06-18 Language Weaver, Inc. Multi-lingual online community
US8615389B1 (en) 2007-03-16 2013-12-24 Language Weaver, Inc. Generation and exploitation of an approximate language model
US8831928B2 (en) 2007-04-04 2014-09-09 Language Weaver, Inc. Customizable machine translation service
US8825466B1 (en) 2007-06-08 2014-09-02 Language Weaver, Inc. Modification of annotated bilingual segment pairs in syntax-based machine translation
CN102369524B (zh) * 2009-03-30 2014-08-13 日本电气株式会社 语言分析装置和语言分析方法
US8990064B2 (en) 2009-07-28 2015-03-24 Language Weaver, Inc. Translating documents based on content
US8380486B2 (en) 2009-10-01 2013-02-19 Language Weaver, Inc. Providing machine-generated translations and corresponding trust levels
US10417646B2 (en) 2010-03-09 2019-09-17 Sdl Inc. Predicting the cost associated with translating textual content
US9672204B2 (en) * 2010-05-28 2017-06-06 Palo Alto Research Center Incorporated System and method to acquire paraphrases
US11003838B2 (en) 2011-04-18 2021-05-11 Sdl Inc. Systems and methods for monitoring post translation editing
US8694303B2 (en) 2011-06-15 2014-04-08 Language Weaver, Inc. Systems and methods for tuning parameters in statistical machine translation
US8886515B2 (en) 2011-10-19 2014-11-11 Language Weaver, Inc. Systems and methods for enhancing machine translation post edit review processes
US20130166282A1 (en) * 2011-12-21 2013-06-27 Federated Media Publishing, Llc Method and apparatus for rating documents and authors
US8942973B2 (en) 2012-03-09 2015-01-27 Language Weaver, Inc. Content page URL translation
US10261994B2 (en) 2012-05-25 2019-04-16 Sdl Inc. Method and system for automatic management of reputation of translators
WO2014076525A1 (en) 2012-11-16 2014-05-22 Data2Text Limited Method and apparatus for expressing time in an output text
US9152622B2 (en) 2012-11-26 2015-10-06 Language Weaver, Inc. Personalized machine translation via online adaptation
US9213694B2 (en) 2013-10-10 2015-12-15 Language Weaver, Inc. Efficient online domain adaptation
US9864738B2 (en) 2014-09-02 2018-01-09 Google Llc Methods and apparatus related to automatically rewriting strings of text
US10467347B1 (en) 2016-10-31 2019-11-05 Arria Data2Text Limited Method and apparatus for natural language document orchestrator
US9977729B1 (en) * 2016-11-23 2018-05-22 Google Llc Testing applications with a defined input format
CA3106636A1 (en) * 2018-07-16 2020-01-23 W/You, Inc. System for choosing apparel and related methods
US11270075B2 (en) 2019-10-31 2022-03-08 International Business Machines Corporation Generation of natural language expression variants

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2848593B2 (ja) * 1985-05-07 1999-01-20 株式会社東芝 翻訳処理方法
JPS61255468A (ja) * 1985-05-08 1986-11-13 Toshiba Corp 機械翻訳処理装置
JPS62163179A (ja) * 1986-01-14 1987-07-18 Toshiba Corp 機械翻訳装置
JPH02240769A (ja) * 1989-03-14 1990-09-25 Canon Inc 自然言語文生成装置
JPH02242372A (ja) * 1989-03-15 1990-09-26 Toshiba Corp 文生成装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102018210003A1 (de) 2018-06-20 2019-12-24 Robert Bosch Gmbh Verfahren und Vorrichtung zum Anlernen eines Modells für maschinelles Lernen

Also Published As

Publication number Publication date
EP0469884B1 (de) 1998-09-23
DE69130246D1 (de) 1998-10-29
US5369574A (en) 1994-11-29
EP0469884A2 (de) 1992-02-05
EP0469884A3 (en) 1993-08-18

Similar Documents

Publication Publication Date Title
DE69130246T2 (de) System zur Bildung von Sätzen
DE69726339T2 (de) Verfahren und Apparat zur Sprachübersetzung
DE69710458T2 (de) Verfahren und system für die berechnung von semantischen logischen formen von syntaxbäumen
DE69033471T2 (de) Natürliche Sprache verarbeitendes Gerät
DE69230814T2 (de) Datenbankauffindungssystem zur Beantwortung natursprachlicher Fragen mit dazugehörigen Tabellen
DE68926845T2 (de) Maschinenübersetzungssystem
DE68928693T2 (de) Verfahren zur Behandlung von digitalen Textdaten
DE69530816T2 (de) Textbearbeitungssystem und Verfahren unter Verwendung einer Wissensbasis
DE68928231T2 (de) Verfahren und Vorrichtung zur Maschinenübersetzung
DE4015905C2 (de) Sprachanalyseeinrichtung, -verfahren und -programm
DE68923981T2 (de) Verfahren zur Bestimmung von Textteilen und Verwendung.
DE68929461T2 (de) Verfahren zur Verarbeitung von digitalen Textdaten
DE69829389T2 (de) Textnormalisierung unter verwendung einer kontextfreien grammatik
DE3587993T2 (de) Verfahren und Gerät zur Natursprachenverarbeitung.
DE69828141T2 (de) Verfahren und Vorrichtung zur Spracherkennung
DE69737884T2 (de) Textprozessor
DE3789073T3 (de) System zur maschinellen Übersetzung.
DE69226106T2 (de) Datenbankherstellungsverfahren und Gerät
DE69225173T2 (de) Spracherkennungsgerät
DE69427848T2 (de) Unterstützungssystem zur Herstellung von Wörterbüchern
DE69331044T2 (de) Vorrichtung und Verfahren zur syntaktischen Signalanalyse
DE3616751A1 (de) Uebersetzungssystem
AT6920U1 (de) Verfahren zur erzeugung natürlicher sprache in computer-dialogsystemen
DE19922974A1 (de) Verfahren und Vorrichtung zur Bearbeitung eines Dokuments
DE69025498T2 (de) Verfahren und Vorrichtung zur Übersetzung von Sätzen mit adverbialen Sätzen

Legal Events

Date Code Title Description
8364 No opposition during term of opposition
8339 Ceased/non-payment of the annual fee