DE69710458T2

DE69710458T2 - Verfahren und system für die berechnung von semantischen logischen formen von syntaxbäumen

Info

Publication number: DE69710458T2
Application number: DE69710458T
Authority: DE
Inventors: George Heidorn; Karen Jensen
Original assignee: Microsoft Corp
Current assignee: Microsoft Corp
Priority date: 1996-06-28
Filing date: 1997-06-27
Publication date: 2002-06-27
Anticipated expiration: 2017-06-28
Also published as: WO1998000793A1; US5966686A; HK1022027A1; CN1122231C; JP2000513473A; CN1226327A; EP0907923B1; JP4668363B2; EP0907923A1; DE69710458D1

Description

Die vorliegende Erfindung betrifft das Gebiet der Verarbeitung natürlicher Sprache (natural language processing - "NLP") und konkret ein Verfahren und ein System zum Erzeugen eines Graphen logischer Form aus einem Syntaxbaum.

Hintergrund der Erfindung

Bei Computersystemen zur automatischen Verarbeitung natürlicher Sprache kommt eine Vielzahl verschiedener Untersysteme zum Einsatz, die in etwa den linguistischen Bereichen der morphologischen, syntaktischen und semantischen Analyse entsprechen, um einen Eingabetext zu analysieren und ein maschinelles Verständnis natürlicher Sprache zu erreichen. Nachdem der eingegebene Text bis zu einem gewissen Grad verstanden worden ist, kann ein Computersystem beispielsweise grammatische und stilistische Veränderungen an dem eingegebenen Text vorschlagen, im eingegebenen Text gestellte Fragen beantworten oder Informationen, die von dem Eingabetext dargestellt werden, effektiv speichern.
Eine morphologische Analyse identifiziert eingegebene Wörter und stellt Informationen für jedes Wort bereit, die ein Mensch, der diese natürliche Sprache spricht, durch Verwendung eines Wörterbuches ermitteln könnte. Solche Informationen können die syntaktischen Rollen einschließen, die ein Wort spielen kann (z. B. Nomen oder Verb) und Möglichkeiten, dieses Wort durch Hinzufügen von Präfixen oder Suffixen zu modifizieren, um andere, damit verwandte Wörter zu erzeugen. Zum Beispiel könnte das Wörterbuch zusätzlich zu dem Wort "fish" eine Vielzahl von Wörtern auflisten, die mit dem Wort "fish" verwandt sind oder davon abgeleitet sind, dazu gehören "fishes", fished" fishing" fisher" fisherman" fishable" fishability" fishbowl" fisher- woman", "fishery", "fishhook", "fishnet" und "fishy".
Syntaktische Analysen analysieren jeden eingegebenen Satz mit Hilfe der als Ausgangspunkt dienenden Informationen, die durch die morphologische Analyse der eingegebenen Wörter bereitgestellt wurden, sowie mit dem Satz von Syntaxregeln, der die Grammatik der Sprache definiert, in der der eingegebene Satz geschrieben wurde. Bei Nachfolgendem handelt es sich um Muster von Syntaxregeln:
Satz = Nominalphrase + Verbalphrase
Nominalphrase = Adjektiv + Nomen
Verbalphrase = Adverb + Verb
Die syntaktische Analyse versucht, einen geordneten Teilsatz von Syntaxregeln zu ermitteln, der bei Anwendung auf die Wörter des eingegebenen Satzes Gruppen von Wörtern zu Phrasen und anschließend Phrasen zu einem kompletten Satz kombiniert. Betrachten wir z. B. den eingegebenen Satz: nBig dogs fiercely bite" (Große Hunde beißen heftig). Verwendet man nun die drei oben aufgelisteten einfachen Regeln, so würde die syntaktische Analyse die Wörter "big" und "dogs" als Adjektiv und Nomen identifizieren und die zweite Regel anwenden, mit der die Nominalphrase "Big dogs" erzeugt wird. Die syntaktische Analyse würde weiterhin die Wörter "fierce- ly" und "bite" als Adverb und Verb identifizieren und die dritte Regel anwenden, um die Verbalphrase "fiercely bite" zu erzeugen. Schließlich würde die syntaktische Analyse die erste Regel anwenden, um aus der zuvor erzeugten Nominalphrase und der Verbalphrase einen kompletten Satz zu bilden. Das Ergebnis der syntaktischen Analyse, oft dargestellt als ein sich azyklisch nach unten verzweigender Baum mit Knoten, welche Eingabewörter, Interpunktionssymbole, Phrasen und einen Wurzelknoten repräsentieren, der einen ganzen Satz darstellt, wird als Parse bezeichnet.
Einige Sätze hingegen haben mehrere verschiedene Parsen. Ein klassischer Beispielsatz für solche Mehrfach-Parsen ist: "Time flies like an arrow" (wörtliche Übersetzung: Die Zeit fliegt wie ein Pfeil. Übertragene Bedeutung: Die Zeit vergeht wie im Flug). Es gibt mindestens drei mögliche Parsen, die drei möglichen Bedeutungen dieses Satzes entsprechen. In dem ersten Parse ist "time" das Subjekt des Satzes, "flies" ist das Verb und "Iike an arrow" ist eine Präpositionalphrase, die das Verb "flies" modifiziert. Allerdings gibt es weiterhin mindestens zwei unerwartete Parsen. In dem zweiten Parse ist "time" ein Adjektiv, das "flies" modifiziert, "like" ist das Verb und,; an arrow" ist das Objekt des Verbs. Dieser Parse entspricht der Bedeutung, der zufolge Fliegen einer bestimmten Art, nämlich "time flies" (Zeitfliegen) einen Pfeil mögen bzw. von ihm angezogen werden. In dem dritten Parse ist "time" ein Imperativverb, "flies" ist das Objekt, "Like an arrow" ist eine Präpositionalphrase, welche "time" modifiziert. Dieser Parse entspricht ein Befehl, die Zeit von Fliegen im Flug zu stoppen, so wie man die Geschwindigkeit eines Pfeils messen würde, vielleicht mit einer Stoppuhr.
Häufig geht die Syntaxanalyse mit dem Erstellen von einem oder mehreren hierarchischen Bäumen einher, auch als Syntax-Parsebäume bzw. Syntaxbäume bezeichnet. Jeder Blattknoten des Syntaxbaums entspricht im Allgemeinen einem Wort oder einem Interpunktionssymbol des Eingabesatzes. Die Anwendung einer Syntaxregel erzeugt einen Knoten auf Zwischenebene, der von unten mit einem, zwei oder gelegentlich noch mehr vorhandenen Knoten verknüpft ist. Zu Beginn umfassen vorhandene Knoten lediglich Blattknoten, doch bei Anwendung von Syntaxregeln bei der syntaktischen Analyse umfassen die vorhandenen Knoten sowohl Blattknoten als auch Zwischenebenenknoten. Ein einzelner Wurzelknoten eines vollständigen Syntaxbaumes repräsentiert einen ganzen Satz.
Die semantische Analyse erzeugt einen Graphen logischer Form, der eine tiefer gehende Beschreibung des Eingabetextes vornimmt als dies mit dem Syntaxbaum allein geschieht. Der Graph logischer Form ist ein erster Versuch, den Eingabetext auf einer Ebene zu verstehen, die zu jener analog ist, die von einem Menschen erreicht wird, der die Sprache spricht.
Der Graph logischer Form verfügt über Knoten und Verknüpfungen (Links), ist jedoch im Unterschied zu dem oben beschriebenen Syntaxbaum nicht hierarchisch angeordnet. Die Links der Graphen logischer Form sind mit Etiketten versehen, um die Beziehung zwischen einem Knotenpaar anzugeben. So kann beispielsweise die semantische Analyse ein bestimmtes Nomen in einem Satz als das tiefe Subjekt identifizieren oder als das tiefe Objekt eines Verbs. Bei dem tiefen Subjekt eines Verbs handelt es sich um den Ausführenden der Handlung, und das tiefe Objekt eines Verbs ist das Objekt der Handlung, die von dem Verb angegeben wird. Das tiefe Subjekt eines Verbs in aktiver Form (active voice)kann das syntaktische Subjekt des Satzes sein, und das tiefe Objekt eines Verbs in aktiver Form kann das syntaktische Objekt des Verbs sein. Das tiefe Subjekt eines passiven Verbs kann jedoch auch in einer Agentive-by-Phrase ausgedrückt werden, und das tiefe Objekt eines passiven Verbs kann das syntaktische Subjekt des Satzes sein. Betrachten wir beispielsweise die beiden Sätze: (1) "Dogs bite people" (Hunde beißen Menschen) und (2) "People are bitten by dogs" (Menschen werden von Hunden gebissen). Im ersten Satz befindet sich ein Verb in aktiver Form und im zweiten Satz ein Verb in passiver Form. Das syntaktische Subjekt des ersten Satzes lautet "Dogs" und das syntaktische Objekt des Verbs "bite" ist "people". Demgegenüber ist das syntaktische Subjekt des zweiten Satzes "People" und die Verbalphrase "are bitten" wird durch die Agentive-by- Phrase "by dogs" modifiziert. Für beide Sätze ist "Dogs" das tiefe Subjekt und "People" das tiefe Objekt des Verbs bzw. der Verbalphrase des Satzes. Zwar sind die durch die syntaktische Analyse der obigen Sätze 1 und 2 erzeugten Syntaxbäume verschieden, doch die bei der semantischen Analyse erstellten Graphen logischer Form sind dieselben, da die beiden Sätzen zugrunde liegende Bedeutung identisch ist.
Für eine weitergehende semantische Verarbeitung nach Erzeugung des Graphen logischer Form können Wissensdatenbanken herangezogen werden, um den analysierten Text mit Konzepten und Begriffen der realen Welt in Verbindung zu setzen und dadurch noch tiefer gehende Verständnisebenen zu erreichen. Ein Beispiel einer solchen Wissensdatenbank wäre eine Online-Enzyklopädie, aus der noch genauere Definitionen und Kontextinformationen für bestimmte Wörter abgerufen werden können.
Die Zeitschrift "Scientific American", September 1984, USA, Band 251, Nr. 3, enthält einen Beitrag von T. Winograd mit dem Titel "Computer Software for working with language" und beschreibt ein Verfahren zum Verarbeiten natürlicher Sprache, wobei Schriftsprache im Wesentlichen vier Analyseschritten unterzogen wird: morphologisch, lexikalisch, syntaktisch und semantisch. Durch die ersten drei Analyseschritte entsteht ein konventioneller Syntaxbaum, der durch eine semantische Analyse mit Hilfe eines predicate calculus (Predicate-Berechnung) in eine "logische" Form umgewandelt wird.
EP-A2-0 413 132 beschreibt ein Computerverfahren zum Bestimmen von Prädikat- Argument-Strukturen in eingegebenen Prosasätzen im Englischen. Als Erstes wird der Eingabesatz mit Hilfe einer Regelkomponente geparst, die lediglich auf morphologische und syntaktische Informationen über die Wörter Zugriff hat, um eine Datenstruktur zu erzeugen, die aus Attribut/Wert-Paaren besteht, welche anschließend durch semantische Attribute erweitert werden.
Nachfolgend werden die drei NLP-Untersysteme - morphologisch, syntaktisch und semantisch - im Zusammenhang mit der Verarbeitung des eingegebenen Mustertextes beschrieben:
"The person whom I met was my friend" (Die Person, die ich traf, war mein Freund).. In Fig. 1 ist ein Blockdiagramm abgebildet, welches den Informationsfluss zwischen den NLP-Untersystemen verdeutlicht. Das morphologische Untersystem 101 empfängt den Eingabetext und gibt eine Identifikation der Wörter und Bedeutungen für jeden der einzelnen Teile des Textes aus, welche jedes Wort annehmen kann. Das syntaktische Untersystem 102 empfängt diese Information und erzeugt durch Anwendung von Syntaxregeln einen Syntaxbaum. Das semantische Untersystem 103 empfängt den Syntaxbaum und erzeugt einen Graphen logischer Form.
In den Fig. 2 bis 5 sind die auf einem elektronischen Speichermedium abgelegten Wörterbuchinformationen abgebildet, die für die Eingabewörter des Mustertextes während der morphologischen Analyse abgerufen werden. In Fig. 2 sind die Wörterbucheinträge für die Eingabewörter "the" 201 und "person" 202 abgebildet. Eintrag 201 umfasst das Schlüsselwort "the" 203 und eine Liste von Attribut/Wert-Paaren. Das erste Attribut "Adj" 204 hat als Wert die Symbole innerhalb der Klammern 205 und 206. Diese Symbole umfassen zwei weitere Attribut/Wert-Paare: (1) "Lemma"L "the" und (2); ; bits "/"Sing Plur Wa6 Det Art BO Def.". Ein Lemma ist die ungebeugte Grundform eines Wortes. Demzufolge gibt das Attribut "Lemma" an, dass "the" die ungebeugte Grundform des Wortes ist, das durch diesen Eintrag im Wörterbuch dargestellt wird. Das Attribut "bits" umfasst einen Satz von Abkürzungen, die bestimmte morphologische und syntaktische Informationen über ein Wort repräsentieren. Diese Information gibt an, dass "the": (1) Singular; (2) Plural; (3) nicht beugbar; (4) ein Bestimmungswort; (5) ein Artikel; (6) ein gewöhnliches Adjektiv und (7) endlich ist. Das Attribut 204 gibt an, dass das Wort "the" als Adjektiv dienen kann.. Attribut 212 gibt an, dass das Wort "the" als Adverb dienen kann. Das Attribut "Senses" 207 stellt die verschiedenen Bedeutungen des Wortes als separate Definitionen und Beispiele dar, von denen ein Teil in der Liste von Attribut/Wert-Paaren innerhalb der Klammern 208 bis 209 und in den Klammern 210 bis 211 angegeben ist. Weitere Bedeutungen, die tatsächlich unter dem Eintrag "the" zu finden sind, sind in Fig. 2 weggelassen worden, angegeben durch den in Klammern gefassten Ausdruck "more sense records" (weitere Aufzeichnungen von Bedeutungen) 213.
In dem ersten Schritt der Verarbeitung natürlicher Sprache erkennt das morphologische Untersystem jedes Wort und Interpunktionssymbol des Eingabetextes als separates Token und erstellt mit Hilfe der Wörterbuchinformation einen Attribut/Wert- Datensatz für jeden Sprachteil jedes Tokens. Attribute sind Felder innerhalb der Datensätze, die einen von mehreren für das spezielle Attribut definierten Werten aufweisen können. Anschließend werden diese Attribut/Wert-Datensätze zur weiteren Verarbeitung zum syntaktischen Untersystem geleitet, in dem sie als Blattknoten des Syntaxbaums verwendet werden, den das syntaktische Untersystem erstellt. Bei allen Knoten des Syntaxbaums und allen Graphen logischer Form, die von den nachfolgenden NLP-Untersystemen erstellt werden, handelt es sich um Attribut/Wert- Datensätze.
Das syntaktische Untersystem wendet Syntaxregeln auf die von dem morphologischen Untersystem zum syntaktischen Untersystem geleiteten Blattknoten an, um Knoten höherer Ebene eines möglichen Syntaxbaums zu erstellen, der den eingegebenen Mustersatz darstellt. Zu einem vollständigen Syntaxbaum gehören ein Wurzelknoten, Zwischenebenenknoten und Blattknoten. Der Wurzelknoten repräsentiert das syntaktische Konstrukt (z. B. den Deklarativsatz) für den eingegebenen Mustertext. Die Zwischenebenenknoten repräsentieren syntaktische Zwischenkonstrukte (z. B. Verbal-, Nominal- oder Präpositionalphrasen). Die Blattknoten repräsentieren den ursprünglichen Satz von Attribut/Wert-Datensätze.
Bei einigen NLP-Systemen werden Syntaxregeln von oben nach unten angewandt. Das hier beschriebene syntaktische Untersystem des NLP-Systems wendet Syntaxregeln auf Blattknoten von unten nach oben an. Das heißt, das syntaktische Untersystem versucht, Syntaxregeln einzeln nacheinander auf einzelne Blattknoten, dann auf Paare von Blattknoten und gelegentlich auf größere Gruppen von Blattknoten anzuwenden. Wenn für eine syntaktische Regel an zwei Blattknoten Operationen ausgeführt werden müssen, und bei einem Paar von Blattknoten beide Elemente Attribute enthalten, die den Erfordernissen der Regel entsprechen, dann wird die Regel auf sie angewandt, um ein syntaktisches Konstrukt höherer Ebene zu erzeugen. Zum Beispiel könnten die Wörter "my friend" ein Adjektiv und ein Nomen repräsentieren, die miteinander zu einem syntaktischen Konstrukt höherer Ebene einer Nominalphrase kombiniert werden können. Eine Syntaxregel entsprechend der Grammatikregel "Nominalphrase = Adjektiv + Nomen" würde einen Nominalphrasenknoten auf Zwischenebene und einen Link der beiden Blattknoten erzeugen, die "my" und "friend" mit dem neu erstellten Zwischenebenenknoten verknüpfen. Jedes Mal nachdem ein neuer Zwischenebenenknoten erzeugt worden ist, wird er mit bereits vorhandenen Blattknoten und Zwischenebenenknoten verknüpft und wird somit Teil des · Gesamtknotensatzes, auf den die Syntaxregeln angewandt werden. Der Prozess der Anwendung von Syntaxregeln auf den größer werdenden Satz von Knoten wird solange fortgesetzt, bis entweder ein vollständiger Syntaxbaum erstellt worden ist, oder bis keine weiteren Syntaxregeln angewandt werden können. Ein vollständiger Syntaxbaum schließt sämtliche Wörter des eingegebenen Satzes als Blattknoten ein und stellt einen möglichen Parsen des Satzes dar. Durch dieses Verfahren der Syntaxanalyse von unten nach oben entstehen viele Zwischenebenenknoten und Teilbäume, die niemals in einem endgültigen, vollständigen Syntaxbaum enthalten sein können. Darüber hinaus kann dieses Parsing-Verfahren gleichzeitig mehr als einen vollständigen Syntaxbaum erzeugen.
Das syntaktische Untersystem kann eine erschöpfende Suche nach sämtlichen möglichen vollständigen Syntaxbäumen ausführen, indem kontinuierlich die Regeln so- Lange angewandt werden, bis keine weiteren Regeln mehr dafür infrage kommen. Des Weiteren kann das syntaktische Untersystem verschiedene heuristische Ansätze auszuführen versuchen, um so zuerst die wahrscheinlichsten Knoten zu erzeugen. Nachdem ein oder einige wenige vollständige Syntaxbäume entstanden sind, kann das syntaktische Untersystem normalerweise die Suche beenden, da der Syntaxbaum, der am ehesten als jener ausgewählt wird, der den Eingabesatz am besten darstellt, wahrscheinlich einer der zuerst erzeugten Syntaxbäume ist. Wenn nach einer angemessenen Suche keine weiteren vollständigen Syntaxbäume mehr erzeugt werden, kann man einen passenden Parsen erhalten, indem die vielversprechendsten Unterbäume miteinander zu einem einzigen Baum kombiniert werden, wobei ein Wurzelknoten verwendet wird, der durch Anwendung einer speziellen Aggregationsregel entsteht.
In Fig. 6 sind die anfänglichen Blattknoten dargestellt, die von dem syntaktischen Untersystem für die anfangs in den Fig. 2 bis 5 dargestellten Wörterbucheinträge erzeugt wurden. Zu den Blattknoten gehören zwei Sonderknoten, 601 und 614, die den Anfang und das Ende des Satzes darstellen. Jeder der Knoten 602 bis 613 repräsentiert einen einzigen Teil von Sprache, den ein Eingabewort in einem Satz repräsentieren kann. Diese Sprachteile findet man in Wörterbucheinträgen als Attribut/Wert-Paare. So repräsentieren beispielsweise die Blattknoten 602 und 603 die beiden möglichen Sprachteile für das Wort "The", die in Fig. 2 als Attribute 204 und 212 angegeben sind.
Die Fig. 7 bis 22 zeigen die Regel-für-Regel-Konstruktion des endgültigen Syntaxbaums mit Hilfe des syntaktischen Untersystems. In jeder diesen Figuren ist die Anwendung einer einzigen Syntaxregel zur Erzeugung eines Zwischenebenenknotens angegeben worden, der eine syntaktische Struktur repräsentiert. Dabei sind lediglich jene Regeln abgebildet, die die Zwischenebenenknoten erstellen, welche den endgültigen Syntaxbaum aufweisen. Darüber hinaus erzeugt das syntaktische Untersystem viele Zwischenebenenknoten, die nicht in den endgültigen Syntaxbaum Eingang finden.
In den Fig. 7 bis 14 wendet das syntaktische Untersystem unäre Syntaxregeln an, die Zwischenebenenknoten erzeugen, welche einfache Verbal-, Nominal- und Adjektivphrasen repräsentieren. Beginnend bei Fig. 15 wendet das syntaktische Untersystem binäre Syntaxregeln an, die Verbal-, Nominal- und Adjektivphrasen zu syntaktischen Konstrukten aus mehreren Wörtern kombinieren. Dabei ordnet das syntaktische Untersystem die Regeln nach deren Wahrscheinlichkeit für eine erfolgreiche Anwendung und versucht sie dann einzeln nacheinander anzuwenden, bis eine Regel gefunden wurde, die erfolgreich auf die vorhandenen Knoten angewandt werden kann. Wie in Fig. 15 abgebildet, wendet das syntaktische Untersystem beispielsweise erfolgreich eine Regel an, die einen Knoten erzeugt, der eine Nominalphrase aus einer Adjektivphrase und einer Nominalphrase darstellt. Die Regelspezifiziert die Eigenschaften, die für Adjektiv- und Nominalphrasen erforderlich sind. Bei dem vorliegenden Beispiel muss die Adjektivphrase ein Bestimmungswort sein.
Wenn man den Zeiger vom Knoten 1501 zum Knoten 1503 zurückverfolgt und anschließend auf die im Knoten 1503 enthaltene morphologische Information zugreift, stellt das syntaktische Untersystem fest, dass Knoten 1501 ein Bestimmungswort repräsentiert. Nachdem nun die beiden Knoten 1501 und 1502, die die von der Regel geforderten Eigenschaften erfüllen, lokalisiert sind, wendet das syntaktische Untersystem anschließend die Regel an, um aus den beiden einfachen Phrasen 1501 und 1502 einen Zwischenebenenknoten zu erstellen, der die Nominalphrase "my friend" repräsentiert. In Fig. 22 erzeugt das syntaktische Untersystem den endgültigen, vollständigen Syntaxbaum, welcher den eingegebenen Satz repräsentiert, indem eine trinäre Regel angewandt wird, die den besonderen Blattknoten Begin1 2201', die Verbalphrase "The person whom I met was my friend" 2202 und den Blattknoten 2203, welcher die endgültige Abschlussperiode repräsentiert, miteinander verbindet, wodurch der Knoten 2204 gebildet wird, welcher den Deklarativsatz repräsentiert. Das semantische Untersystem erzeugt aus einem kompletten Syntaxbaum einen Graphen logischer Form. Bei einigen NLP-Systemen wird der Graph logischer Form aus Knoten eines Syntaxbaums konstruiert, zu denen Attribute und neue bidirektionale Links 'hinzugefügt werden. Der Graph logischer Form ist ein mit einer Kennung (Etikett) versehener, gerichteter Graph. Es handelt sich bei ihm um eine semantische Darstellung eines Eingabesatzes. Die von dem morphologischen Untersystem für jedes Wort eingegangenen Informationen sind über Referenzen auf Blattknoten des Syntaxbaums aus Knoten des Graphen logischer Form noch immer verfügbar. Sowohl die Richtungen als auch die Kennungen der Links des Graphen logischer Form repräsentieren semantische Informationen, einschließlich der funktionellen Rollen für die Knoten des Graphen logischer Form. Während der Analyse fügt das semantische Untersystem Links und Knoten hinzu, um (1) weggelassene, aber implizierte Wörter, (2) fehlende oder unklare Argumente und Adjunkte für Verbalphrasen und (3) die Objekte, auf die sich die Präpositionalphrasen beziehen, darzustellen.
Fig. 23 veranschaulicht den kompletten Graphen logischer Form, der von dem semantischen Untersystem für den eingegebenen Beispielsatz erzeugt wurde. Im Ergebnis der erfolgreichen Anwendung semantischer Regeln sind den Links 2301 bis 2306 von dem semantischen Untersystem bedeutsame. Kennungen zugewiesen worden. Die sechs Knoten 2307 bis 2312 zusammen mit den Links zwischen ihnen repräsentieren die wesentlichen Komponenten der semantischen Bedeutung des Satzes. Allgemein entsprechen die Knoten logischer Form in etwa den Eingabewörtern, doch bestimmte Wörter, die für die Vermittlung der semantischen Bedeutung unnötig sind, z. B. "the" und "whom", erscheinen nicht in dem Graphen logischer Form, und die Eingabeverben "met" und "was" erscheinen im Infinitiv "meet" und "be". Im Computersystem sind die Knoten als Datensätze dargestellt und enthalten zusätzliche Informationen, die nicht in Fig. 23 abgebildet sind. Die Tatsache; dass die Verben in der Einzahl und in der Vergangenheitsform eingegeben wurden, wird durch zusätzliche Informationen innerhalb der Knoten logischer Form entsprechend der Bedeutung der Verben, 2307 und 2310, angezeigt.
Die Unterschiede zwischen dem Syntaxbaum und dem Graphen logischer Form werden aus einem Vergleich der Fig. 23 und 22 sehr schnell deutlich. Der Syntaxbaum aus Fig. 22 schließt 10 Blattknoten und 16 Zwischenebenenknoten ein, die miteinander in einer strengen Hierarchie verknüpft sind, wohingegen der Graph Iogischer Form aus Fig. 23 nur 6 Knoten enthält. Anders als der Syntaxbaum ist der Graph logischer Form nicht hierarchisch angeordnet, wie aus den beiden Verknüpfungen mit entgegengesetzter Ausrichtung zwischen den Knoten 2307 und 2308 erkennbar wird. Wie bereits erwähnt, repräsentieren die Knoten außerdem nicht mehr die genaue Form der eingegebenen Wörter, sondern anstatt dessen ihre Bedeutungen.
Nach der semantischen Analyse finden weitere Schritte der Verarbeitung natürlicher Sprache statt. Dazu gehören das Kombinieren des Graphen logischer Form mit zusätzlichen Informationen aus Wissensdatenbanken, das Analysieren von Satzgruppen und allgemein der Versuch, um jeden Graphen logischer Form herum ein inhaltsreiches Kontextumfeld anzulegen, welches sich dem annähert, wie Menschen natürliche Sprache verarbeiten.
Verfahren nach dem bisherigen Stand zum Erzeugen von Graphen logischer Form umfassen rechnerisch komplexe Einstellungen des Syntaxbaums und Manipulationen an ihm. Dadurch wird es immer schwieriger, neue semantische Regeln zu einem NLP-System hinzuzufügen. Das Hinzufügen einer neuen Regel schließt eine neue Verfahrenslogik ein, die möglicherweise zu Konflikten mit der bereits in das semantische Untersystem einprogrammierten Verfahrenslogik führt. Und da Knoten des Syntaxbaumes erweitert und als Knoten für den Graphen logischer Form erneut verwendet werden, erzeugen die semantischen Untersysteme nach dem Stand der Technik große, umständliche und komplizierte Datenstrukturen. Die Größe und Komplexität eines Graphen logischer Form, der über einen Syntaxbaum gelegt ist, macht die weitere Nutzung der kombinierten Datenstruktur anfällig für Fehler und ineffizient. Dementsprechend wäre es wünschenswert, ein einfacher zu erweiterndes und handhabbares semantisches Untersystem zu schaffen, sodass einfache Datenstrukturen mit Graphen logischer Form erzeugt werden können.

Zusammenfassung der Erfindung

Die vorliegende Erfindung betrifft ein Verfahren und ein System zum Ausführen einer semantischen Analyse eines Eingabesatzes innerhalb eines NLP-Systems. Das Untersystem zur semantischen Analyse empfängt einen Syntaxbaum, der von dem morphologischen und syntaktischen Untersystem erzeugt wurde. Das semantische Analyse-Untersystem wendet zwei Sätze semantischer Regeln zur Ausführung von Einstellungen an dem eingegangenen Syntaxbaum an. Anschließend wendet das semantische Analyse-Untersystem einen dritten Satz semantischer Regeln an, mit dem aus dem Syntaxbaum ein Gerüst eines Graphen logischer Form erzeugt wird. Schließlich wendet das semantische Analyse-Untersystem zwei weitere Sätze semantischer Regeln auf das Gerüst des Graphen logischer Form an, um semantisch bedeutsame Etiketten für die Verknüpfungen des Graphen logischer Form zu schaffen und so zusätzliche Knoten mit Graphen logischer Form für fehlende Knoten zu erzeugen und redundante Knoten mit Graphen logischer Form zusammenzuführen. Der endgültige von dem semantischen Analyse-Untersystem erzeugte Graph logischer Form repräsentiert die vollständige semantische Analyse eines Eingabesatzes.

Kurze Beschreibung der Zeichnungen

Fig. 1 ist ein Blockdiagramm, welches den Informationsfluss zwischen den Untecsystemen eines NLP-Systems darstellt.
Die Fig. 2 bis 5 verdeutlichen die auf einem elektronischen Medium gespeicherten Wörterbuchinformationen, die für jedes Wort des eingegebenen Beispielsatzes "The person whom I met was my friend" abgerufen wird.
Fig. 6 zeigt die von dem syntaktischen Untersystem als ersten Schritt beim Parsen des eingegebenen Satzes erzeugten Blattknoten.
Die Fig. 7 bis 22 zeigen die aufeinanderfolgende Anwendung von Syntaxregeln durch das syntaktische Untersystem zum Parsen des Eingabesatzes und zum Erzeugen eines Syntaxbaums.
Fig. 23 veranschaulicht den Graphen logischer Form, der zur Darstellung der Bedeutung des eingegebenen Satzes von dem syntaktischen Untersystem erzeugt wird.
Fig. 24 zeigt ein Blockdiagramm, welches ein bevorzugtes Computersystem zur Verarbeitung natürlicher Sprache darstellt.
Fig. 25 veranschaulicht die drei Phasen des bevorzugten neuen semantischen Untersystems.
Fig. 26 ist ein Ablaufdiagramm für das neue semantische Untersystem (new semantic subsystem - NSS).
Fig. 27 zeigt den ersten Satz semantischer Regeln.
Fig. 28A veranschaulicht eine detaillierte Beschreibung der semantischen Regel PrLF_You aus dem ersten Satz semantischer Regeln.
Fig. 28B zeigt eine Beispielanwendung der semantischen Regel PrLF_You aus dem ersten Satz semantischer Regeln.
Fig. 29 verdeutlicht den zweiten Satz semantischer Regeln.
Die Fig. 30A bis 30B geben eine detaillierte Beschreibung der semantischen Regel PrLF_MoveProp aus dem zweiten Satz semantischer Regeln an.
Fig. 30C zeigt eine Beispielanwendung der semantischen Regel PrLF MoveProp aus dem zweiten Satz semantischer Regeln.
Fig. 31 zeigt ein Ablaufdiagramm für apptyrules.
Fig. 32 zeigt ein Ablaufdiagramm für Phase Eins des NSS.
Fig. 33 zeigt den dritten Satz semantischer Regeln.
Fig. 34A bis C zeigen eine detaillierte Beschreibung der semantischen Regel Syn- ToSem1 aus dem dritten Satz semantischer Regeln.
Fig. 34D zeigt eine Beispielanwendung der semantischen Regel SynToSem1 aus dem dritten Satz semantischer Regeln.
Fig. 35 gibt ein Ablaufdiagramm für Phase Zwei des NSS an.
Die Fig. 36 bis 38 zeigen den vierten Satz semantischer Regeln.
Fig. 39A zeigt eine detaillierte Beschreibung der semantischen Regel LF_Dobj2 aus dem vierten Satz semantischer Regeln.
Fig. 39B zeigt eine Beispielanwendung der semantischen Regel LF_Dobj2 aus dem vierten Satz semantischer Regeln.
Fig. 40 zeigt den fünften Satz semantischer Regeln.
Die Fig. 41A bis C gegen eine detaillierte Beschreibung der semantischen Regel PsLF_PronAnaphora aus dem fünften Satz semantischer Regeln an.
Fig. 41 D zeigt eine Beispielanwendung der semantischen Regel PsLF_PronAnaphora aus dem fünften Satz semantischer Regeln.
Fig. 42 zeigt ein Ablaufdiagramm für Phase Drei des NSS.
Fig. 43 ist ein Blockdiagramm eines Computersystems für das NSS.
Die Fig. 44 bis 59 zeigen jede erfolgreiche Anwendung einer Regel durch das NSS während der Verarbeitung des für den eingegebenen Beispielsatz erzeugten Syntaxbaums.

Detaillierte Beschreibung der Erfindung

Die vorliegende Erfindung schafft ein neues semantisches Verfahren und System zum Erzeugen eines Graphen logischer Form aus einem Syntaxbaum. Bei einer bevorzugten Ausführungsform führt ein neues semantisches Untersystem (NSS) die semantische Analyse in drei Phasen aus: (1) Ausfüllen und Einrichten des Syntaxbaums, (2) Erzeugen eines anfänglichen Graphen logischer Form und (3) Erzeugen bedeutsamer Etiketten für Links des Graphen logischer Form und Erstellen eines vollständigen Graphen logischer Form. Jede Phase entspricht der Anwendung von einem oder zwei Sätzen von Regeln auf entweder einen Satz aus Syntaxbaumknoten oder auf einen Satz von Knoten von Graphen logischer Form.
Das NSS wendet sich erkannten Mängeln bei semantischen Untersystemen nach dem bisherigen Stand der Technik, die oben im Hintergrundabschnitt beschrieben wurden, zu. Jede Phase des NSS ist ein einfaches und erweiterbares, auf Regeln basierendes Verfahren. Wenn zusätzliche Linguistische Phänomene erkannt werden, können Regeln zu deren Handhabung mühelos in einen von dem NSS verwendeten Regelsatz eingeschlossen werden. Des Weiteren erzeugt die zweite Phase des NSS einen vollständig separaten Graphen logischer Form und legt den Graphen logischer Form nicht über einen vorhandenen Syntaxbaum. Deshalb ist die von dem NSS erzeugte Datenstruktur des Graphen logischer Form im Vergleich zu Datenstrukturen von Graphen mit logischer Focm nach dem bisherigen Stand der Technik einfach und platzsparend.
Fig. 24 ist ein Blockdiagramm, das ein bevorzugtes Computersystem für ein NLP- System zeigt. Das Computersystem 2401 enthält eine zentrale Verarbeitungseinheit (CPU), einen Speicher, eine Speichervorrichtung und Eingabe- und Ausgabevörrichtungen. Normalerweise werden die NLP-Untersysteme 2406 bis 2409 aus einer rechnerlesbaren Speichervorrichtung, z. B. einer Platte, in den Speicher 2404 geladen. In den Speicher wird ebenfalls typischerweise ein Anwendungsprogramm 2405 geladen, das die von dem NLP-System bereitgestellten Dienste nutzt. Auf einer Speichervorrichtung, z. B. einer Platte 2410, ist das elektronische Wörterbuch 2411 gespeichert, auf dem zur Verwendung durch das morphologische Untersystem Einträge in den Speicher eingelesen werden. Bei einer Ausführungsform reagiert ein Anwender im Normalfall auf einen Bedienungshinweis, der auf der Ausgabevorrichtung 2403 angezeigt wird, indem er einen oder mehrere Sätze natürlicher Sprache an einem Eingabegerät 2404 eingibt. Diese Sätze natürlicher Sprache werden von der Anwendung empfangen, verarbeitet und anschließend über das morphologische Untersystem 2406 zum NLP-System weitergeleitet. Das morphologische Untersystem nutzt Informationen aus dem elektronischen Wörterbuch zur Erzeugung von Datensätzen, die jedes eingegebene Wort beschreiben, und leitet diese Datensätze weiter zum syntaktischen Untersystem 2407. Das syntaktische Untersystem parst die eingegebenen Wörter, um daraus einen Syntaxbaum zu erstellen und leitet den Syntaxbaum an das semantische Untersystem 2408 weiter. Aus dem empfangenen Syntaxbaum erzeugt das semantische Untersystem einen Graphen logischer Form und gibt diesen an andere NLP-Untersysteme 2409 weiter. Anschließend kann das Anwendungsprogramm Informationen an das Untersystem für natürliche Sprache 2409 senden und von ihm empfangen, um das maschinelle Verständnis des eingegebenen Textes durch das NLP-System auszunutzen und danach auf einer Ausgabevorrichtung 2403 schließlich eine Antwort an den Anwender auszugeben.
Fig. 25 veranschaulicht die drei Phasen des bevorzugten neuen semantischen Untersystems. Die Phasen 1-3 des NSS sind als 2502, 2504 und 2506 dargestellt. Die Zustände der relevanten Datenstrukturen, die in jeder Phase des NSS ein- und ausgegeben werden, sind in Fig. 25 mit den Kennungen 2501, 2503, 2505 und 2507 angezeigt. Das NSS empfängt einen Syntaxbaum 2501, der von dem syntaktischen Untersystem erzeugt wird. Die erste Phase des NSS 2702 vollendet den Syntaxbaum mit Hilfe von semantischen Regeln und leitet den vollständigen Syntaxbaum 2503 an die zweite Phase des NSS 2504 weiter. Die zweite Phase des NSS erzeugt einen anfänglichen Graphen logischer Form 2505 und übergibt diesen an die dritte Phase des NSS 2506. Die dritte Phase des NSS wendet semantische Regeln auf den anfänglichen Graphen logischer Form an, um bedeutungsvolle semantische Etiketten zu den Verknüpfungen des Graphen logischer Form hinzuzufügen, neue Verknüpfungen und Knoten zum Auffüllen der semantischen Darstellung des eingegebenen Satzes hinzuzufügen und gelegentlich redundante Knoten zu entfernen. Zur Verwendung bei der weiteren Interpretation des von dem Graphen logischer Form repräsentierten Eingabesatzes oder zur Beantwortung von Fragen bzw. zur Vorbereitung von Daten auf der Grundlage des Eingabesatzes wird der vollständige Graph logischer Form 2507 anschließend zu zwei anderen NLP-Untersystemen weitergeleitet.
In Fig. 26 ist ein Ablaufdiagramm für das NSS abgebildet. Darin wird der aufeinander folgende Aufruf der drei Phasen des NSS, 2601, 2602 und 2603, gezeigt. Nachstehend wird jede Phase des NSS im Detail beschrieben.

NSS Phase Eins - Vervollständigung syntaktischer Rollen des Syntaxbaums

In der Phase Eins des NSS modifiziert selbiges einen von dem syntaktischen Untersystem empfangenen Syntaxbaum, indem zwei verschiedene Sätze semantischer Regeln auf die Knoten des Syntaxbaums angewandt werden. Diese semantischen Rollen können die Verknüpfungsstruktur des Syntaxbaums verändern oder dazu führen, dass neue Knoten hinzugefügt werden.
Das NSS wendet einen ersten Satz semantischer Regeln an, um eine Vielzahl verschiedener möglicher Auslassungen zu kompensieren und Mängel zu beheben, was mit einer syntaktischen Analyse nicht geschehen kann. Die Anwendung dieses ersten Satzes semantischer Regeln bewirkt vorläufige Einstellungen an dem eingegebenen Syntaxbaum. Die linguistischen Phänomene, denen sich der erste Satz semantischer Regeln zuwendet, umfassen weggelassene Verben nach den Wörtern "to" oder "not", die von einem menschlichen Zuhörer jedoch als implizit angesehen werden, fehlende Pronomen, wie z. B. "you" oder "we", in Imperativsätzen, die Erweiterung von nebenordnenden Strukturen, zu denen Wörter "and" bzw. "or" sowie fehlende Objekte bzw. weggelassene Verbalphrasen gehören. Fig. 27 listet einen bevorzugten ersten Satz semantischer Regeln auf, der von dem NSS in Phase Eins angewandt wird. Für jede Regel wird der Name der Regel, gefolgt von einer präzisen Beschreibung des linguistischen Phänomens, dem sie sich zuwendet, dargestellt. Das allgemeine Format jeder semantischen Regel ist ein Satz von Bedingungen, der auf einen Knoten eines Syntaxbaums oder einen Knoten eines Graphen logischer Form angewandt wird, und eine Liste von Handlungen, die auf den Syntaxbaum bzw. den Graphen logischer Form angewandt wird. Zum Beispiel wendet das NSS die Bedingungen jeder Regel des ersten Satzes semantischer Regeln auf die Liste von Syntaxdatensätzen an, die den Syntaxbaum repräsentieren,- und für jede Regel, bei der alle Bedingungen jener Regel erfüllt sind, führt das NSS die Liste von in der Regel enthaltenen Handlungen aus, was zu konkreten Änderungen am Syntaxbaum führt. Natürlich hängt die tatsächliche Form jeder semantischen Regel von Einzelheiten der Darstellung des Syntaxbaums und des Graphen logischer Form ab, bei denen viele verschiedene Darstellungen möglich sind. In den nachfolgenden Figuren wird eine semantische Regel durch einen Konditionalausdruck beschrieben, dem das Wort "Wenn" (if) vorangestellt ist, gefolgt von einer Liste von Handlungen, der das Wort "Dann" (then) vorangestellt ist. Der "Wenn"-Teil der semantischen Regel repräsentiert die Bedingungen, die auf einen Knoten eines Syntaxbaums oder einen Knoten eines Graphen logischer Form angewandt werden müssen und erfüllt sein müssen, damit die Regel insgesamt auf den Knoten angewendet wird, und der "Dann"- Ausdruck repräsentiert eine Liste von Handlungen, die an dem Syntaxbaum oder dem Graphen logischer Form ausgeführt wird. Der angezeigte Ausdruck stimmt weitgehend mit dem Ausdruck des Computer-Quellencodes für die semantische Regel überein.
Fig. 28A gibt eine englischsprachige Darstellung der semantischen PrLF You aus dem ersten Satz semantischer Regeln an. Wie daraus hervorgeht, betrifft der "Wenn"-Ausdruck die Werte verschiedener Attribute des Syntaxbaumknotens, auf welche die Regel zutrifft, und der "Dann"-Ausdruck gibt die Erzeugung eines Pronomenknotens für das Lemma "you" und eines Nominalphrasen-Mutterknotens für den Pronomenknoten und die Zuordnung der erzeugten Knoten zum Syntaxbaum an.
Fig. 28B zeigt ein Beispiel der Anwendung der semantischen Regel PrLF. You auf den Syntaxbaum 2801, der von dem syntaktischen Untersystem für den Satz "Please dose the door" (Bitte schließen Sie die Tür) erzeugt wird. Die Anwendung von PrLF You resultiert in einem modifizierten Syntaxbaum 2802 mit zwei neuen Knoten 2803 und 2804, die mit dem Wurzelknoten für den Satz verbunden sind. Mit dieser semantischen Regel wird ausdrücklich ein mitverstandenes "you" (Sie) eines Imperativsatzes in den Syntaxbaum platziert.
Nachdem alle semantischen Regeln des ersten Satzes semantischer Regeln, die auf den eingegebenen Syntaxbaum angewendet werden können, auch angewandt worden sind, führt das NSS wichtige Anpassungen an dem vorläufig eingestellten Syntaxbaum durch, indem ein zweiter Satz semantischer Regeln auf die Knoten des vorläufig eingestellten Syntaxbaums angewandt wird. Zu diesem zweiten Satz von Regeln gehören jene, die dem Identifizieren und Auflösen von Erscheinungen weit auseinander liegender Zuordnungen, dem Umwandeln von Verbalphrasen in Verben mit Präpositionalphrasenobjekten und in bestimmten Fällen dem Ersetzen des Wortes "it" (es) durch einen lnfinitivsatz dienen.
Fig. 29 listet einen zweiten bevorzugten Satz semantischer Regeln auf, der von dem NSS in Phase Eins angewendet wird. Für jede Regel ist der Name der Regel, gefolgt von einer präzisen Beschreibung des linguistischen Phänomens, dem sie sich zuwendet, abgebildet. Die Fig. 30A bis 30B zeigen eine englischsprachige Darstellung der semantischen Regel TrLF_MoveProp aus dem zweiten Satz semantischer Regeln. Wie daraus hervorgeht, betrifft der Ausdruck "wenn" die Werte verschiedener Attribute des Knotens des Syntaxbaums, auf den die Regel angewendet wird, und verschiedene damit im Zusammenhang stehende Syntaxbaumknoten, und der Ausdruck "dann" gibt eine recht komplizierte Neuordnung des Syntaxbaum an.
Fig. 30C zeigt ein Beispiel der Anwendung der semantischen Regel TrLF_MoveProp auf den Syntaxbaum 3001, der von dem syntaktischen Untersystem für den Satz "I have no desire to see the man" (Ich möchte den Mann nicht sehen) erzeugt wird. Aus der Anwendung von TrLF_MoveProp ergibt sich der modifizierte Syntaxbaum 3002. Der von Knoten 3003 in dem ursprünglichen Syntaxbaum repräsentierte Infinitivsatz ist aus seiner Position als Kind von Knoten 3004 herausbewegt worden und wurde zum Kind 3005 des Wurzelknotens DECL1 3006 des modifizierten Syntaxbaums. Diese semantische Regel hat den Zweck, Sätze wie den Infinitivsatz 3003 von einer unteren Ebene auf eine höhere Ebene in dem Syntaxbaum zu bewegen, um dadurch den nachfolgenden Übergang von dem Syntaxbaum zu einem Graphen logischer Form zu erleichtern.
Bei der bevorzugten Ausführungsform der Erfindung sind semantische Regeln Anweisungen in einer Programmiersprache, die bei Ausführung einen neuen Baum bzw. Knoten eines Graphen aus einem, zwei oder gelegentlich mehr vorhandenen Baum- bzw. Graphenknoten sowie geeignete Links zwischen dem neu erzeugten Knoten und den vorhandenen Baum- bzw. Graphenknoten erzeugen. Bei der bevorzugten Ausführungsform gibt der linke Teil einer semantischen Regel Eigenschaften an, die der bzw. die vorhandenen Knoten aufweisen müssen, damit die Regel angewandt wird. Der rechte Teil der semantischen Regel gibt die Art des neuen Knotens an, der erzeugt wird, und die Werte für die Attribute des neuen Knotens. Die in Fig. 28 und in Fig. 30 beschriebenen Regeln geben ein Beispiel dieser Form an.
Bei der bevorzugten erfindungsgemäßen Ausführungsform wird jeder Syntaxbaum und jeder Graph logischer Form als eine Liste von Knoten dargestellt, wobei die Verknüpfungen zwischen den Knoten durch Attributwerte innerhalb der Knoten repräsentiert werden. Jeder Regelsatz ist ebenfalls als eine Liste dargestellt. Die Anwendung von Regelsätzen auf einen Syntaxbaum schließt das Auswählen aufeinander folgender Knoten aus der Knotenliste sowie den Versuch ein, jede Regel aus der Regelliste, die den Regelsatz darstellt, auf jeden ausgewählten Knoten anzuwenden. Eine bestimmte Regel kann dann erfolgreich auf einen Knoten angewandt werden, wenn jener Knoten die Eigenschaften aufweist, die im linken Teil der Regel angegeben sind. Gelegentlich ist es möglich, dass im Ergebnis einer erfolgreichen Anwendung einer Regel ein neuer Knoten erzeugt wird oder ein vorhandener Knoten zum Löschen markiert wird.
In Fig. 31 ist ein Ablaufdiagramm für die Subroutine "apply rules" abgebildet, die einen Satz von Regeln auf eine Liste von Knoten anwendet, die einen Syntaxbaum oder einen Graphen logischer Form darstellt. Die Subroutine "apply rules" wird von dem N'SS aufgerufen, um jeden Regelsatz während aller drei Phasen des NSS anzuwenden. In Schritt 3101 empfängt applyjules eine Liste von Knoten als erstes Argument und eine Liste von Regeln als zweites Argument. Die Schritte 3102 bis 3107 stellen eine äußere Schleife dar, die bei jeder Iteration versucht, sämtliche eingegebenen Regeln aus der eingegebenen Regelliste auf nacheinander aus der Eingabeliste ausgewählte Knoten anzuwenden. Die Schritte 3103 bis 3106 stellen eine innere Schleife dar, wobei bei jeder Iteration von ihr versucht wird, eine aus der Liste eingegebener Regeln ausgewählte Regel auf einen aus der eingegebenen Knotenliste ausgewählten Knoten anzuwenden. Im Schritt 3102 wählt apply rules den nächsten Knoten aus der eingegebenen Knotenliste aus, beginnend mit dem ersten. Im Schritt 3103 wählt applygules die nächste Regel aus der eingegebenen Regelliste aus, beginnend mit der ersten. Im Schritt 3104 bestimmt apply rules, ob der ausgewählte Knoten über die im linken Teil der ausgewählten Regel angegebenen Eigenschaften verfügt. Wenn der Knoten die angegebenen Eigenschaften aufweist, dann wendet apply rules in Schritt 3105 die ausgewählte Regel auf den ausgewählten Knoten an. Wenn apply_rules in Schritt 3106 feststellt, dass weitere Regeln vorhanden sind, bei denen versucht werden kann, sie auf den ausgewählten Knoten anzuwenden, kehrt apply rules zu Schritt 3103 zurück, um die nächste Regel auszuwählen. Bestimmt apply rules in Schritt 3107, dass weitere Knoten vorhanden sind, bei denen versucht werden kann, die Regeln aus der Eingaberegelliste auf sie anzuwenden, kehrt apply_rules zu Schritt 3102 zurück, um den nächsten Knoten auszuwählen.
In Fig. 32 ist ein Ablaufdiagramm für die in der ersten Phase des NSS erfolgte Verarbeitung zu sehen. In Schritt 3201 wird die Variable "parameter1" der Liste von Knoten des Syntaxbau ns zugeordnet, die den Syntaxbaum aufweisen, der von dem syntaktischen Untersystem erzeugt und in das NSS eingegeben wird. In Schritt 3202 wird die Variable "parameter2" einer Liste des ersten Satzes semantischer Regeln aus Fig. 27 zugeordnet. In Schritt 3203 ruft das NSS die Subroutine "applyrules" auf und leitet die Variablen "parameter1" und "parameter2" an die Subroutine weiter. Zur Durchführung vorläufiger Einstellungen wendet die Subroutine "apply rules" den ersten Satz semantischer Regeln auf den Syntaxbaum an. In Schritt 3204 wird die Variable "parameterl" der Liste von Syntaxbaum-Knoten zugeordnet, die den vorläufig eingestellten Syntaxbaum aufweisen. In Schritt 3205 wird die Variable "parameter2" einer Liste des zweiten Satzes semantischer Regeln aus Fig. 29 zugeordnet. In Schritt 3206 ruft das NSS die Subroutine "apply rules" auf und leitet die Variablen "parameterl" und "parameter2" an die Subroutine weiter. Die Subroutine "applyrules" wendet den zweiten Satz semantischer Regeln auf den Syntaxbaum an, um die Haupteinstellungen vorzunehmen.

NSS Phase Zwei - Erzeugung eines anfänglichen Graphen logischer Form

In Phase Zwei des NSS wendet selbiges einen dritten Satz semantischer Regeln auf die Knoten des eingestellten Syntaxbaums an. Jede erfolgreiche Anwendung von Regeln in Phase Zwei erzeugt einen neuen Knoten eines Graphenlogischer Form. Durch Anwendung dieses dritten Satzes von Regeln erzeugt das NSS einen neuen Graphen logischer Form. Die Knoten des Graphen logischer Form bestehen aus lediglich semantisch bedeutungsvollen Attributen und einem Zeiger zurück zu dem entsprechenden Knoten des Syntaxbaums. Im Unterschied zu semantischen Untersystemen nach dem Stand der Technik sind die Knoten des Graphen logischer Form, die von dem NSS in Phase Zwei erzeugt werden, vollständig separat und verschieden von den Knoten des Syntaxbaums. Das NSS erstellt ein Gerüst des Graphen logischer Form mit Verknüpfungen, die als Attribute innerhalb der Knoten gespeichert sind, welche die Knoten des Graphen logischer Form miteinander verbinden.
In Fig. 33 ist eine Liste des dritten Satzes semantischer Regeln angegeben, der in Phase Zwei von dem NSS angewandt wird. Darin ist für jede Regel deren Name angegeben, gefolgt von einer präzisen Beschreibung des linguistischen Phänomens, dem sie sich zuwendet. In diesem dritten Regelsatz befinden sich lediglich drei Regeln, und nur die erste Regel, SynToSem1, wird allgemein verwendet. Die zweite und dritte Regel finden nur in speziellen Situationen Anwendung, wenn ein passender Parse von dem syntaktischen Untersystem erzeugt wurde und der eingerichtete Syntaxbaum daher einen angepassten Syntaxknoten enthält.
Die Fig. 34A bis 34C zeigen eine englischsprachige Darstellung der semantischen Regel SynToSeml aus dem dritten Satz semantischer Regeln. Wie daraus hervorgeht, betrifft der "Wenn"-Ausdruck die Werte verschiedener Attribute für den Knoten des Syntaxbaums, auf den die Regel angewendet wird, und verschiedene dazugehörige Knoten des Syntaxbaums, und der "Dann"-Ausdruck gibt die Erzeugung eines Knotens von einem Graphen logischer Form und die Platzierung des neuen Knotens innerhalb des Anfangsgraphen logischer Form an.
Fig. 34D zeigt ein Beispiel der Anwendung der semantischen Regel SynToSem1 auf den Syntaxbaum 3401, der von dem syntaktischen Untersystem für den Satz "The book was written by John" (Das Buch wurde von John geschrieben) erzeugt wird. Durch die Anwendung von SynToSem1 entsteht das Gerüst des Graphen logischer Form 3402. Das Gerüst des Graphen logischer Form weist drei Knoten nebst temporären Modifikatoren auf, welche die Links kennzeichnen. Den neuen Knoten wurden Attribute zugewiesen, ausgehend von den syntaktischen Attributen der Knoten des Syntaxbaums, aus denen sie entstanden sind. In dem Graphen logischer Form befinden sich weit weniger Knoten als in dem entsprechenden Syntaxbaum, da der Graph logischer Form die semantische Bedeutung des Satzes darstellt. Die linguistische Bedeutung der Wörter "the", "was" und "by" in dem Originalsatz ist oder wird in die Attribute und Kennungen (Etiketten) des Graphen logischer Form integriert, und die komplexen Knotenhierarchien, die auf das Vorliegen in Form von Blattknoten in dem Syntaxbaum zurückzuführen sind, sind in dem Graphen logischer Form nicht nötig.
Fig. 35 zeigt ein Ablaufdiagramm für Phase Zwei des NSS. In Schritt 3501 wird die Variable "parameter1" der Liste von Knoten zugeordnet, die den eingestellten Syntaxbaum repräsentieren. In Schritt 3502 wird die Variable "parameter2" einer Liste des dritten Satzes semantischer Regeln aus Fig. 33 zugeordnet. In Schritt 3503 ruft das NSS die Subroutine "apply rules" auf, um den dritten Satz semantischer Regeln auf die Knoten des eingestellten Syntaxbaum anzuwenden und dadurch einen neuen Graphen logischer Form zu erzeugen, welcher dem eingestellten Syntaxbaum entspricht.

NSS Phase Drei-Vervollständigen des Graphen logischer Form

In Phase Drei des NSS wendet selbiges einen vierten Satzes semantischer Regeln auf das Gerüst des Graphen logischer Form an, um semantisch bedeutsame Etiketten zu den Links des Graphen logischer Form hinzuzufügen. Zu diesen Etiketten gehören "deep subject" ("Dsub"), "deep object" ("Dobj"), "deep indirect object" ("Dind"), "deep predicate nominative" ("Dnom"), "deep complement" ("Dcrnp") und "deep predicate adjective" ("Dadj").
In den Fig. 36 bis 38 ist eine Liste des vierten Satzes semantischer Regeln, der von dem NSS in Phase Drei angewandt wird, abgebildet. Für jede Regel ist in den Fig. 36 bis 38 der Name der Regel angegeben, gefolgt von einer präzisen Beschreibung des linguistischen Phänomens, dem sie sich zuwendet.
Fig. 39A zeigt eine Darstellung der semantischen Regel LF_Dobj2 aus dem vierten Satz semantischer Regeln in englischer Spräche. Wie aus Fig. 39A hervorgeht, betrifft der "Wenn"-Ausdruck die Werte verschiedener Attribute des Knotens des Graphen logischer Form, auf den die Regel angewandt wird, und der "Dann"-Ausdruck gibt das Etikett eines Links in dem Graphen logischer Form an.
Fig. 39B zeigt ein Beispiel der Anwendung der semantischen Regel LF_Dobj2 auf den Graphen logischer Form 3901, der von dem NSS für den Satz "The book was written by John" (Das Buch wurde von John geschrieben) erzeugt wurde. Die Anwendung von LF_Dobj2 auf einen Graphen logischer Form, der einen Passivsatz enthält, identifiziert das syntaktische Subjekt als das tiefe Objekt der Handlung. Dies wird wie in Fig. 39B erreicht, indem das Etikett des Links 3903 von dem eines vorübergehenden Modifikators auf das Etikett 3904 umbenannt wird, welches eine tiefe Objektbeziehung angibt.
Als letzten Schritt in Phase Drei führt das NSS Endeinstellungen an dem Graphen logischer Form aus, indem ein fünfter Satz semantischer Regeln angewandt wird. Dieser Satz schließt Regeln ein, die dem Vereinigen eines Relativpronomens mit dessen Bezugswort dienen sowie dem Auffinden und expliziten Einschließen fehlender Pronomen, dem Auflösen von Zahlenauslassungen, dem Bereitstellen fehlender tiefer Subjekte, dem Zusammenfassen redundanter Vorkommen von Personalpronomen und dem Zusammenziehen von nebenordnenden Strukturen, die in dem ersten Teilschritt der semantischen Analyse erweitert wurden. Des Weiteren befassen sich diese Regeln mit dem Problem des Aufnehmens eines Pronomens (oder "proform") und dem Identifizieren der Nominalphrase, auf die es sich bezieht. In vielen Fällen ist es mit dem Informationsstand, der durch den Graphen logischer Form bereitgestellt wird, nicht möglich, den korrekten Bezugsgegenstand der Nominalphrase zu identifzieren. In diesen Fällen wird eine Liste der wahrscheinlichsten Kandidaten erstellt, und die weitere Bearbeitung auf spätere Schritte des NLP-Systems verschoben, in denen globalere Informationen verwendet werden. In Fig. 40 ist eine Liste · des fünften Satzes semantischer Regeln abgebildet, der von dem NSS in Phase Drei angewandt wird. Für jede Regel zeigt Fig. 40 den Namen der Regel an, gefolgt von einer präzisen Beschreibung des linguistischen Phänomens, dem sie sich zuwendet. In den Fig. 41A bis 41C ist eine englischsprachige Darstellung der semantischen Regel PsLF_PronAnaphora aus dem fünften Satz semantischer Regeln zu sehen. Wie aus diesen Figuren hervorgeht, betrifft der "Wenn"-Ausdruck die Werte der verschiedenen Attribute des Knotens des Graphen logischer Form, auf den die Regel angewandt wird, und der dazugehörigen Knoten des Graphen Logischer Form, und der "Dann"-Ausdruck gibt das Hinzufügen eines Knotens des Graphen logischer Form an, der einen ausgelassenen Bezugsgegenstand eines Pronomens repräsentiert.
Fig. 410 zeigt ein Beispiel der Anwendung der semantischen Regel PsLF_PronAnaphora auf den Graphen logischer Form 4102, der von dem NSS für den Satz "Mary likes the man who came to dinner and Joan likes him too" (Mary mag den Mann, der zum Abendessen kam; und Joan mag ihn ebenfalls) erstellt wurde. Durch die Anwendung der Regel PsLF_PronAnaphora auf einen Graphen logischer Form, der einen Pronomenknoten mit einem Bezugsgegenstand in einem anderen Teil des Graphen logischer Form enthält, wird ein neuer Knoten hinzugefügt, mit dem der Pronomenknoten direkt verknüpft ist. In Fig. 41 D ist der neue Knoten 4103 durch Anwendung von PsLF_PronAnaphora hinzugefügt worden und gibt an, dass sich der Knoten "he1" auf "man" bezieht.
Ein Ablaufdiagramm für die in Phase Drei des NSS erfolgte Verarbeitung ist in Fig. 42 abgebildet. In Schritt 4201 wird die Variable "parameter1" der Liste von Knoten des Graphen logischer Form zugeordnet, die den während Phase Zwei des NSS erzeugten Graphen logischer Form umfassen. In Schritt 4202 wird die Variable "parameter2" einer Liste des vierten Satzes semantischer Regeln aus den Fig. 36 bis 38 zugeordnet. In Schritt 4203 ruft das NSS die Subroutine "apply rules" auf und leitet die Variablen "parameterl" und "parameter2" an die Subroutine weiter. Die Subroutine "apply rules" wendet den vierten Satz semantischer Regeln auf den Graphen logischer Form an, um semantisch sinnvolle Etiketten zu den Links des Graphen logischer Form hinzuzufügen. In Schritt 4204 wird die Variable "parameter1" der Liste von Knoten des Graphen logischer Form hinzugefügt, die den sinnvoll gekennzeichneten Graphen logischer Form umfassen, der in Schritt 4203 erzeugt wurde. In Schritt 4205 wird die Variable "parameter2" einer Liste des fünften Satzes semantischer Regeln aus Fig. 40 zugeordnet. In Schritt 4206 ruft das NSS die Subroutine "applyrules" auf und stellt ihr die Variablen "parameter1" und "parameter2" zur Verfügung. Die Subroutine applygules wendet den fünften Satz semantischer Regeln auf den Graphen logischer Form an, um endgültige Einstellungen vorzunehmen.
Fig. 43 ist ein Blockdiagramm eines Computersystems für das NSS. Der Computer 4300 enthält einen Speicher mit den semantischen Regeln 4304 bis 4308 und eine Regelanwendungsmaschine 4303. Die Regelanwendungsmaschine wendet, gesteuert von einer zentralen Verarbeitungseinheit, die fünf Sätze von Regeln auf den Syntaxbaum 4301 an, um einen entsprechenden Graphen logischer Form 4302 zu erzeugen. Vorzugsweise wird der Syntaxbaum von dem morphologischen und dem syntaktischen Untersystem erzeugt, die nicht abgebildet sind. Ebenso können der Syntaxbaum und der Graph logischer Form zum Lösen einer nachfolgenden Aufgabe verwendet werden, für die Informationen erforderlich sind, die analog zu jenen sind, die ein Mensch beim Lesen der eingegebenen Sätze erhalten würde. Zum Beispiel könnte ein Grammatikprüfprogramm eine neue Phrasierung für den Eingabesatz vorschlagen, der genauer und kürzer angibt, was in dem eingegebenen Satz steht. Als weiteres Beispiel könnte ein Computerbetriebssystem Rechenaufgaben ausführen, die in dem eingegebenen Satz beschrieben sind. Als wiederum ein anderes Beispiel könnten in dem eingegebenen Satz enthaltene Informationen zum späteren Abruf durch ein Datenbankverwaltungssystem kategorisiert und gespeichert werden.

Semantische Verarbeitung des eingegebenen Beispielsatzes

Die nachfolgende Erörterung und die Fig. 44 bis 59 beschreiben die vollständige NSS-Verarbeitung des Beispielsatzes "The person whom I met was my friend" (Die Person, die ich traf, war mein Freund). Dabei wird jede von dem NSS angewandte semantische Regel zusammen mit einer Darstellung der Ergebnisse der Anwendung dieser Regel beschrieben.
Keine vorläufigen Einstellregeln aus dem ersten Satz semantischer Regeln sind erfolgreich auf den Syntaxbaum angewandt worden, der in Phase Eins aus dem syntaktischen Untersystem in das NSS eingegebenen wurde. Eine Haupteinstellregel aus dem zweiten Satz semantischer Regeln wird auf den eingegebenen Syntaxbaum angewandt. Fig. 44 zeigt den Syntaxbaum 4400 in der Form, in der er eingegeben wird. Dabei ist zu beachten; dass er in Fig. 44 etwas einfacher als in Fig. 22 dargestellt ist. Das NSS wendet erfolgreich die semantische Regel TnLF_LongDistl, in Fig. 29 als Regel 1 abgebildet, auf den Relativsatzknoten RELCL1 mit der Ziffer 4401 des Syntaxbaums 4400 an, um so den eingestellten Syntaxbaum 4402 zu erzeugen. Durch diese Regel TrLF_LongDist1 wird bewirkt, dass ein direktes Objektattribut in den Nominalphrasenknoten 4403 eingefügt wird und dadurch anzeigt, dass das Wort "whom" das direkte Objekt der Phrase "I met" ist. Normalerweise folgt im Englischen das direkte Objekt eines Verbs dem Verb. Da in dem Satz, der zum Erstellen des Syntaxbaum 4400 geparst wurde, das Wort "whom" nicht hinter "I met" steht, wurde durch Anwendung syntaktischer Regeln nicht erkannt, dass "whom" das direkte Objekt von "I met" ist.
In Phase Zwei des NSS werden sieben Regeln aus dem dritten Satz semantischer Regeln erfolgreich angewandt. In Fig. 45 wendet das NSS erfolgreich die semantische Regel SynToSeml auf den Knoten des bestimmen Pronomens DETP2 4501 des Syntaxbaums an, um den Knoten des Graphen logischer Form "my" 4502 zu erzeugen. In Fig. 46 wendet das NSS erfolgreich die semantische Regel SynToSem1 auf den Nominalphrasenknoten NP4 4601 des Syntaxbaums an, um den Knoten des Graphen logischer Form "friend" 4602 und den Link 4603 zu dem temporären semantischen Etikett "Tmods" 4604 zu erzeugen. In Fig. 47 wendet das NSS erfolgreich die semantische Regel SynToSem1 auf den Nominalphrasenknoten NP3 4701 des Syntaxbaums an, um den Knoten des Graphen logischer Form "1" 4702 zu erzeugen. In Fig. 48 wendet das NSS erfolgreich die semantische Regel SynToSem1 auf den Nominalphrasenknoten NP2 4801 des Syntaxbaums an, um den Knoten des Graphen logischer Form "whom" 4802 zu erzeugen. In Fig. 49 wendet das NSS erfolgreich die semantische Regel SynToSem1 auf den Relativsatzknoten RELCL1 4901 des Syntaxbaums an, um den Knoten des Graphen logischer Form "meet" 4902 und den Link 4903 mit dem temporären semantischen Etikett "Tmods" 4904 zu erzeugen. Bn Fig. 50 wendet das NSS erfolgreich die semantische Regel SynToSem1 auf den Nominalphrasenknoten NP1 5001 des Syntaxbaums an, um den Knoten des Graphen logischer Form "person" 5002 und den Link 5003 mit dem temporären semantischen Etikett "Tmods" 5004 zu erzeugen. Ln Fig. 51 wendet das NSS erfolgreich die semantische Regel SynToSem1 auf den Knoten des Deklarativsatzes DECL1 5101 des Syntaxbaums an, um den Knoten des Graphen logischer Form "be" 5102 und den Link 5103 mit dem temporären semantischen Etikett "Tmods" 5104 zu erzeugen. Somit ist mit Abschluss der Phase Zwei des NSS ein Gerüst des Graphen logischer Form entstanden.
In Phase Drei des NSS werden sechs Regeln aus dem vierten Satz semantischer Regeln erfolgreich angewandt. In Fig. 52 wendet das NSS erfolgreich die semantische Regel LF Dsub1, in Fig. 36 als Regel 1 angegeben, auf den Knoten des Graphen logischer Form "be" 5201 an, um das Link-Etikett "Dsub" 5202 und den Link 5203 mit dem temporären semantischen Etikett "Tmods" 5204 zu erzeugen. In Fig. 53 wendet das NSS erfolgreich die semantische Regel LF Dnom, in Fig. 36 als Regel 10 angegeben, auf den Knoten des Graphen logischer Form "be" 5301 an, um das Link-Etikett "Dnom" 5302 zu erzeugen. In Fig. 54 wendet das NSS erfolgreich die semantische Regel LF_Props, in Fig. 38 als Regel 21 angegeben, auf den Knoten des Graphen logischer Form "person" 5401 an, um das Link-Etikett "Props" 5402 zu erzeugen. In Fig. 55 wendet das NSS erfolgreich die semantische Regel LF Dsub1, in Fig. 36 als Regel 1 angegeben, auf den Knoten des Graphen logischer Form "meet" 5501 an, um das Link-Etikett "Dsub" 5502 zu erzeugen. In Fig. 56 wendet das NSS erfolgreich die semantische Regel LF Dobj1, in Fig. 36 als Regel 3 angegeben, auf den Knoten des Graphen logischer Form "meet" 5601 an, um den Link mit dem Etikett "Dobj" 5603 zu erzeugen und so den Knoten "meet" mit dem Knoten "whom" 5602 zu verknüpfen. In Fig. 57 wendet das NSS erfolgreich die semantische Regel LF Ops, in Fig. 38 als Regel 22 angegeben, auf den Knoten des Graphen 'logischer Form "friend" 5701 an, um das Link-Etikett "PossBy" 5702 zu erzeugen.
In Phase Drei des NSS wird eine Regel aus dem fünften Satz semantischer Regeln erfolgreich angewandt. In Fig. 58 wendet das NSS erfolgreich die semantische Regel PsLF_ReIPro, in Fig. 40 als Regel 1 angegeben, auf den Knoten des Graphen logischer Form "whom", in Fig. 56 als 5602 angegeben, an, um den Link mit dem Etikett "Dobj" 5801 zu erzeugen und den Knoten "whom" zu entfernen. In Fig. 59 wendet das NSS erfolgreich die semantische Regel PsLF_UnifyPcons, in Fig. 40 als Regel 10 angegeben, auf den Graphen logischer Form an, um die Knoten "I" und "my" zu einem einzigen Knoten zu konsolidieren. Dies ist die letzte von dem NSS erfolgreich angewandte Regel. Fig. 59 zeigt daher den endgültigen, vollständigen Graphen logischer Form, der für den eingegebenen Satz "The person whom I met was my friend" erzeugt worden ist.

Claims

1. Verfahren in einem Computersystem (4300) zum Erzeugen eines Graphen logischer Form (2507, 4302) für einen Satz in einer natürlichen Sprache, wobei der Satz durch einen Syntaxbaum (2501, 4301) mit Knoten dargestellt wird, die syntaktische Konstrukte des Satzes darstellen, und der Syntaxbaum (2501, 4301) in einer Datenstruktur dargestellt wird, wobei das Verfahren umfasst:

Einrichten des Syntaxbaums (2501, 4301) auf der Grundlage einer semantischen Analyse des Syntaxbaums (2501, 4301), wobei bei dem Einrichten Einrichtungen vorgenommen werden, die auf der Grundlage einer syntaktischen Analyse des Syntaxbaums (2501, 4301) nicht vorgenommen werden können;

Erzeugen eines Gerüstes eines Graphen logischer Form (2505, Fig. 51) für den eingerichteten Syntaxbaum (2503), wobei das Gerüst des Graphen logischer Form (2505, Fig. 51) in einer Datenstruktur dargestellt wird, die separat von der Datenstruktur des Syntaxbaums (2501, 4301) ist; und

Ausführen semantischer Analyse des Gerüstes des Graphen logischer Form (2505, Fig. 51), um einen vollständigen Graph logischer Form (2507, 4302) zu erzeugen.

2. Verfahren nach Anspruch 1, wobei das Einrichten des Syntaxbaums (2501, 4301) das Hinzufügen einer syntaktischen Rolle für ein syntaktisches Konstrukt einschließt, die in dem Satz impliziert ist.

3. Verfahren nach Anspruch 2, wobei, wenn in dem Satz ein Verb nach einem vorgegebenen Wort fehlt, beim Hinzufügen einer syntaktischen Rolle ein syntaktisches Konstrukt für das fehlende Verb hinzugefügt wird.

4. Verfahren nach Anspruch 3, wobei das vorgegebene Wort das Wort "zu" (to) ist.

5. Verfahren nach Anspruch 3, wobei das vorgegebene Wort das Wort "nicht" (not) ist.

6. Verfahren nach Anspruch 2, wobei, wenn in dem Satz ein Pronomen fehlt, beim Hinzufügen einer syntaktischen Rolle ein syntaktisches Konstrukt für das fiehende Pronomen hinzugefügt wird.

7. Verfahren nach Anspruch 6, wobei das fehlende Pronomen das Wort "Du/Sie" (you) in einem Imperativsatz ist.

8. Verfahren nach Anspruch 2, wobei, wenn der Satz eine nebengeordnete Struktur enthält, beim Hinzufügen einer syntaktischen Rolle ein syntaktisches Konstrukt zur Erweiterung der nebengeordnete Struktur hinzugefügt wird.

9. Verfahren nach Anspruch 8, wobei die nebengeordnete Struktur das Wort "und" (and) enthält.

10. Verfahren nach Anspruch 8, wobei die nebengeordnete Struktur das Wort "oder" (or) enthält.

11. Verfahren nach Anspruch 2, wobei das Einrichten des Syntaxbaums (2501, 4301) das Auflösen von Erscheinungen weit auseinanderliegender Zuordnungen einschließt, nachdem syntaktische 'Rollen hinzugefügt worden sind.

12. Verfahren nach Anspruch 2, wobei das Einrichten des Syntaxbaums (2501, 4301) das Umwandeln von Verbalphrasen in Verben mit Präpositionalphrasenobjekten einschließt, nachdem die syntaktischen Rollen hinzugefügt worden sind.

13. Verfahren nach Anspruch 2, wobei das Einrichten des Syntaxbaums (2501, 4301) das Ersetzen des Wortes "es" (it) durch einen Infinitivsatz einschließt, nachdem die syntaktischen Rollen zugefügt worden sind.

14. Verfahren nach Anspruch 1, wobei das Erzeugen des Gerüsts des Graphen logischer Form (2505, Fig. 51) das Zuweisen von Attributen zu Knoten des Gerüsts des Graphen logischer Form (2505, Fig. 51) auf der Grundlage der Attribute des eingestellten Syntaxbaums (2503) einschließt.

15. Verfahren nach Anspruch 1, wobei das Ausführen semantischer Analyse des Gerüsts des Graphen logischer Form (2505, Fig. 51) das Hinzufügen semantischer Etiketten zu dem Gerüst des Graphen logischer Form (2505, Fig. 51) einschließt.

16. Verfahren nach Anspruch 15, wobei ein semantisches Etikett einen tiefen Satzteil kennzeichnet.

17. Verfahren nach Anspruch 15, wobei das Ausführen semantischer Analyse des Gerüsts des Graphen logischer Form (2505, Fig. 51) das Hinzufügen semantischer Konstrukte nach dem Hinzufügen semantischer Etiketten einschließt.

18. Computersystem (4300) zum Erzeugen eines Graphen logischer Form (2507, 4302) für eine Phrase in einer natürlichen Sprache, wobei die Phrase durch einen Syntaxbaum (2501, 4301) mit Knoten dargestellt wird, die syntaktische Konstrukte der Phrase darstellen, umfassend:

eine erste Komponente (2503), die den Syntaxbaum (2501) auf der Grundlage einer semantischen Analyse des Syntaxbaums (2501) einrichtet, wobei bei dem Einrichten Einrichtungen ausgeführt werden, die auf der Grundlage einer syntaktischen Analyse des Syntaxbaums (2501) nicht ausgeführt werden können;

eine zweite Komponente (2504), die ein Gerüst eines Graphen logischer Form (2505) für den eingerichteten Syntaxbaum (2503) erzeugt, wobei das Gerüst des Graphen logischer Form (2505) in einer Datenstruktur dargestellt wird, die separat von der Datenstruktur des Syntaxbaums (2501) ist; und

eine dritte Komponente (2501), die semantische Analyse des Gerüsts des Graphen logischer Form (25'05) ausführt, um den Graph logischer Form zu vervollständigen.

19. Computersystem nach Anspruch 18, wobei das Einrichten des Syntaxbaums (2501) das Hinzufügen einer semantischen Rolie für ein syntaktisches Konstrukt einschließt, die in der Phrase impliziert ist.

20. Computersystem nach Anspruch 19, wobei, wenn in der Phrase ein Verb nach einem vorgegebenen Wort fehlt, beim Hinzufügen einer syntaktischen Rolle ein syntaktisches Konstrukt für das fehlende Verb hinzugefügt wird.

21. Computersystem nach Anspruch 20, wobei das vorgegebene Wort das Wort "zu" (to) ist.

22. Computersystem nach Anspruch 20, wobei das vorgegebene Wort das Wort "nicht" (not) ist.

23. Computersystem nach Anspruch 19, wobei, wenn in der Phrase ein Pronomen fehlt, beim Hinzufügen einer syntaktischen Rolle ein syntaktisches Konstrukt für das fehlende Pronomen hinzugefügt wird.

24. Computersystem nach Anspruch 23, wobei das fehlende Pronomen das Wort "Du/Sie" (you) in einer Imperativphrase ist.

25. Computersystem nach Anspruch 19, wobei, wenn die Phrase eine nebengeordnete Struktur enthält, beim Hinzufügen einer syntaktischen Rolle ein syntaktisches Konstrukt zum Ausdehnen der nebengeordneten Struktur hinzugefügt wird.

26. Computersystem nach Anspruch 25, wobei die nebengeordnete Struktur das Wort "und" (and) enthält.

27. Computersystem nach Anspruch 25, wobei die nebengeordnete Struktur das Wort "oder" (or) enthält.

28. Computersystem nach Anspruch 19, wobei das Einrichten des Syntaxbaums (2501) das Auflösen von Erscheinungen weit auseinanderliegender Zuordnungen einschließt, nachdem syntaktische Rollen hinzugefügt worden sind.

29. Computersystem nach Anspruch 19, wobei das Einrichten des Syntaxbaums (2501) das Umwandeln von Verbalphrasen in Verben mit Präpösitionalphrasenobjekten einschließt, nachdem die syntaktischen Rollen hinzugefügt worden sind.

30. Computersystem nach Anspruch 19, wobei das Einrichten des Syntaxbaums (2501) das Ersetzen des Wortes "es" (it) durch einen lnfinitivsatz einschließt, nachdem die syntaktischen Rollen hinzugefügt worden sind.

31. Computersystem nach Anspruch 18, wobei das Erzeugen des Gerüsts des Graphen logischer Form (2505) das Zuweisen von Attributen zu Knoten des Gerüsts des Graphen logischer Form (2505) auf der Grundlage der Attribute des eingerichteten Syntaxbaums (2503) einschließt.

32. Computersystem nach Anspruch 18, wobei das Ausführen semantischer Analyse des Gerüsts des Graphen logischer Form (2505) das Hinzufügen semantischer Etiketten zu dem Gerüst des Graphen logischer Form (2505) einschließt.

33. Computersystem nach Anspruch 32, wobei ein semantisches Etikett einen tiefen Satzteil kennzeichnet.

34. Computersystem nach Anspruch 32, wobei das Ausführen semantischer Analyse des Gerüsts des Graphen logischer Form (2505) das Hinzufügen semantischer Konstrukte nach dem Hinzufügen semantischer Etiketten einschließt.