DE4311211A1

DE4311211A1 - Computersystem und Verfahren zur automatisierten Analyse eines Textes

Info

Publication number: DE4311211A1
Application number: DE4311211A
Authority: DE
Inventors: Angelika Storrer; Ulrike Dr Schwall
Original assignee: International Business Machines Corp
Current assignee: International Business Machines Corp
Priority date: 1993-04-05
Filing date: 1993-04-05
Publication date: 1994-10-06
Anticipated expiration: 2013-04-06
Also published as: DE4311211C2

Description

Die Erfindung betrifft ein Computersystem zur automatisierten Analyse eines Textes, der aus Wörtern einer natürlichen Sprache zusammengesetzt ist. Des weiteren betrifft die Erfindung ein Verfahren zur automatisierten Analyse eines Textes mit Hilfe eines Computersystems.

Ein derartiges Computersystem sowie ein derartiges Verfahren sind beispielsweise aus Übersetzungssystemen bekannt, mit deren Hilfe ein Text aus einer Quellsprache in eine Zielsprache automatisch übersetzt wird. Damit die Übersetzung von dem Computersystem korrekt ausgeführt werden kann, ist es erforderlich, daß das Computersystem durch eine Analyse des zu übersetzenden Textes erkennt, welche Funktion die einzelnen Wörter des Textes haben, ob also beispielsweise ein bestimmtes Wort das Subjekt, das Objekt oder dergleichen in dem zugehörigen Satz darstellt. Entsprechend ist es für eine korrekte Übersetzung ebenfalls erforderlich, daß das Computersystem erkennt, ob ein Wort innerhalb des zugehörigen Satzes ein Objekt im Akkusativ, ein Objekt im Dativ oder dergleichen darstellt.

Handelt es ich um ein Objekt, das im Dativ auftritt, so sind in der deutschen Sprache mehrere unterschiedliche Dativtypen möglich, die sich durch unterschiedliche Funktionen in dem zugehörigen Satz auszeichnen. Der am häufigsten auftretende Dativtyp ist der sogenannte Objektsdativ. Beispielsweise stellen die Wörter "seiner Schwester" in dem Satz "Er schickt seiner Schwester ein Buch." einen Objektsdativ dar. Ein weiterer Dativtyp ist der sogenannte possessive Dativ oder Pertinenzdativ. So enthält beispielsweise der Satz "Er streicht dem Kind über die Wangen." einen derartigen possessiven Dativ, nämlich hinsichtlich der Wörter "dem Kind". Durch den possessiven Dativ wird das Ganze in einer Teil-Ganzes-Relation bezeichnet, also in dem vorgenannten Beispielsatz das Kind, zu dem die Wangen gehören. In dem Satz "Peter singt der Oma nicht laut genug." stellen die Wörter "der Oma" einen Dativus Judicantis dar. Für diesen Dativtyp ist es erforderlich, daß eine Konstruktion mit den Wörtern "nicht . . . genug" oder mit dem Wort "zu" in dem zugehörigen Satz enthalten ist. Der Dativus Commodi und der Dativus Incommodi stellen weitere Dativtypen dar. Die Wörter "dem Baby" bilden in dem Satz "Die Mutter strickt dem Baby Wollsocken." einen Dativus Commodi. Bei diesem Dativtyp ist es erforderlich, daß in dem zugehörigen Satz ein Handlungsträger vorhanden ist. In dem vorgenannten Beispielsatz ist die Mutter der Handlungsträger, der dem Baby Wollsocken strickt. In dem Satz "Mir sind Peters Blumen verwelkt." bildet das Wort "mir" einen Dativus Incommodi. Bei diesem Dativtyp ist in dem zugehörigen Satz kein Handlungsträger enthalten. Der Verursacher des in dem Satz beschriebenen Vorgangs wird durch den Dativus Incommodi selbst genannt.

Die Übersetzung der verschiedenen Dativtypen unterscheidet sich voneinander. Der Objektsdativ kann zumeist ohne weitere Besonderheiten übersetzt werden. So ergibt die Übersetzung des Satzes "Er schickt seiner Schwester ein Buch." in die englische Sprache den Satz "He sends a book to his sister.". Hier ist bei der Übersetzung nur die Besonderheit zu berücksichtigen, daß das englische Verb "to send" im Dativ immer die Präposition "to" nach sich zieht. Beim possessiven Dativ ist für die Übersetzung die Kenntnis der genannten Teil-Ganzes-Relation erforderlich. Wie bereits erläutert wurde, stellt in dem Satz "Er streicht dem Kind über die Wangen." das Kind das Ganze dar, von dem die Wangen ein Teil sind. Dies führt in der Übersetzung zu dem Satz "He strikes the child′s cheek.". Die Teil-Ganzes-Relation äußert sich in der Übersetzung in den Wörtern "the child′s". Der Satz "Peter singt der Oma nicht laut genug." ergibt in der englischen Sprache den Satz "Peter doesn′t sing loud enough for Grandma." Der Dativus Judicantis wird also in der englischen Sprache mit Hilfe des Wortes "for" übersetzt. Der Dativus Commodi in dem Satz "Die Mutter strickt dem Baby Wollsocken." wird in der englischen Sprache mit dem Satz "The mother is knitting socks for the baby." in ähnlicher Weise übersetzt wie der Dativis Judicantis. Der Satz "Mir sind Peter′s Blumen verwelkt." ergibt hingegen in der englischen Sprache den Satz "It was my fault that Peter′s flowers wilted.". Der darin enthaltene Dativus Incommodi wird also durch die Wörter "It was my fault that" übersetzt.

Bei den bekannten Übersetzungssystemen ist zu jedem Verb, das mit einem Objektsdativ auftreten kann, eine entsprechende, auf diesen Objektsdativ hinweisende Kodierung im Speicher des Computersystems abgespeichert. Das Computersystem ist damit in der Lage, bei diesen Verben einen Objektsdativ zu erkennen und bei der Übersetzung zu berücksichtigen. Alle anderen Dativtypen sind bei den bekannten Übersetzungssystemen entweder gar nicht berücksichtigt oder es ist die korrekte Übersetzung bei jedem einzelnen Verb explizit im Speicher des Computersystems abgespeichert. Im ersten Fall, wenn also die anderen Dativtypen nicht berücksichtigt sind, ergeben sich bei Verben, die beispielsweise einen possessiven Dativ nach sich ziehen, automatisch Fehler bei der Übersetzung des zugehörigen Satzes aus der deutschen Sprache in eine Zielsprache. Im zweiten Fall hat die jeweilige explizite Abspeicherung der korrekten Übersetzung bei jedem Verb einen äußerst hohen Speicherplatzbedarf zur Folge. Dies um so mehr, als es unter Umständen erforderlich ist, zu ein und demselben Verb mehrere verschiedene Übersetzungen im Speicher des Computersystems abzuspeichern. Diese große Menge an abgespeicherten Informationen bewirkt gleichzeitig, daß die mittlere Zugriffszeit des Computersystems auf eine bestimmte Information größer wird. Je mehr Informationen im Speicher des Computersystems enthalten sind, desto mehr Zeit benötigt daß Computersystem, um diese Informationen zu verarbeiten.

Aufgabe der Erfindung ist es, ein Computersystem sowie ein entsprechendes Verfahren zur automatisierten Analyse eines Textes zu schaffen, bei dem die Dativtypen der deutschen Sprache in einer technisch sinnvollen Art und Weise berücksichtigt werden.

Die Erfindung löst diese Aufgabe dadurch, daß bei einem Computersystem der eingangs genannten Art zu einem Verb, das mit einem possessiven Dativ auftreten kann, eine auf den possessiven Dativ hinweisende Kodierung abgespeichert ist. Durch die genannte Kodierung ist es dem Computersystem möglich, einen possessiven Dativ korrekt zu erkennen. Dies hat zur Folge, daß das Computersystem den possessiven Dativ auch korrekt in eine Zielsprache übersetzen kann. Es ist somit nicht mehr erforderlich, daß sämtliche korrekten Übersetzungen des possessiven Dativs bei dem jeweiligen Verb abgespeichert sind. Statt dessen ist im Speicher des Computersystems zu dem jeweiligen Verb nur noch die auf den possessiven Dativ hinweisende Kodierung abgespeichert. Dies bedeutet eine wesentliche Verringerung des erforderlichen Speicherplatzbedarfes.

Die Kodierung besteht aus einer geringen Anzahl von Buchstaben, während die bisher erforderliche Abspeicherung der korrekten Übersetzungen eine Vielzahl von Wörtern umfaßte. Mit dieser Verringerung des Speicherplatzbedarfes geht gleichzeitig eine wesentliche Beschleunigung bei der Verarbeitung einher. Da eine geringere Anzahl von Informationen vorhanden ist, benötigt das Computersystem auch eine geringere mittlere Zugriffszeit auf eine bestimmte Information. Die Verarbeitungsgeschwindigkeit des Computersystems wird also größer.

Des weiteren wird durch die Kodierung des possessiven Dativs erreicht, daß auch die nunmehr noch verbleibenden Dativtypen vom Computersystem korrekt erkannt werden können, ohne daß es erforderlich wäre, irgendwelche Übersetzungen abzuspeichern. Dies hat zur Folge, daß auch für die Erkennung der verbleibenden Dativtypen wesentlich weniger Speicherplatz erforderlich ist. Die Verarbeitungsgeschwindigkeit des Computersystems wird dadurch weiter gesteigert.

Insgesamt ist es durch die Abspeicherung von Ko dierungen, die auf einen possessiven Dativ hinweisen, möglich, daß die Dativtypen der deutschen Sprache vom Computersystem automatisch und korrekt erkannt werden. Die Abspeicherung dieser Kodierungen ist dabei vollständig ausreichend. Zusätzliche Informationen, wie beispielsweise die bisher erforderlichen korrekten Übersetzungen für die einzelnen Dativtypen der deutschen Sprache, sind nicht mehr erforderlich.

Bei einer vorteilhaften Weiterbildung der Erfindung gibt die auf den possessiven Dativ hinweisende Kodierung an, auf welches andere Wort bzw. auf welche andere Wortgruppe des Textes sich der possessive Dativ bezieht. Wie erläutert wurde, tritt der possessive Dativ im Zusammenhang mit einer Teil-Ganzes-Relation auf. Es besteht nun die Möglichkeit, daß in einem Satz ein Teil angegeben ist, das zumindest theoretisch sich auf verschiedene, in dem Satz vorhandene andere Wörter bzw. Wortgruppen als Ganzes beziehen kann. Mit der Erkenntnis, daß es sich um einen possessiven Dativ handelt, wäre es somit noch nicht möglich, das Teil dem richtigen Ganzen zuzuordnen. Durch das zusätzliche Merkmal hingegen, daß die Kodierung angibt, auf welches andere Wort bzw. auf welche andere Wortgruppe des Textes sich der possessive Dativ bezieht, wird dieses Problem gelöst. Das Computersystem kann aus der zusätzlichen Information eindeutig die Beziehung des Teiles zu dem richtigen Ganzen herstellen. Eine korrekte Übersetzung des Textes ist somit auch in diesem Fall gewährleistet.

Die Erfindung löst die genannte Aufgabe auch dadurch, daß bei einem Verfahren zur automatisierten Analyse eines Textes, der aus Wörtern einer natürlichen Sprache zusammengesetzt ist, mit Hilfe eines Computersystems, geprüft wird, ob einem in dem Text enthaltenen Verb eine Kodierung zugeordnet ist, die auf einen Objektsdativ hinweist, und, falls dies nicht der Fall ist, danach geprüft wird, ob dem Verb eine Kodierung zugeordnet ist, die auf einen possessiven Dativ hinweist.

Liegt dem Computersystem ein Text beispielsweise zur Übersetzung vor, so prüft das Computersystem zuerst, ob dem Verb ein Objektsdativ zugeordnet ist. Ist dies der Fall, so kann dieser Objektsdativ korrekt in die Zielsprache, beispielsweise in die englische Sprache übersetzt werden. Ist dies nicht der Fall, so prüft das Computersystem in einem nächsten Schritt, ob dem Verb ein possessiver Dativ zugeordnet ist. Ist dies der Fall, so kann das Computersystem nunmehr den vorliegenden Satz ebenfalls korrekt in die Zielsprache übersetzen.

Bei einer vorteilhaften Ausgestaltung der Erfindung wird anhand der auf den possessiven Dativ hinweisenden Kodierung geprüft, auf welches andere Wort bzw. auf welche andere Wortgruppe des Textes sich der possessive Dativ bezieht. Durch diese zusätzliche Prüfung wird das Computersystem in die Lage versetzt, die erläuterte Teil-Ganzes-Relation korrekt zu erkennen. Das Computersystem kann dadurch das Teil und das zugehörige Ganze korrekt einander zuordnen und in die Zielsprache übersetzen.

Bei einer weiteren vorteilhaften Weiterbildung der Erfindung wird, falls der letzte Schritt nicht positiv der Fall war, geprüft, ob dem Verb eine Kodierung zugeordnet ist, die auf das Vorhandensein oder das Nicht-Vorhandensein eines Handlungsträgers hinweist. Ist dem Verb eine Kodierung zugeordnet, die auf das Vorhandensein eines Handlungsträgers hinweist, so bedeutet dies, daß es sich um einen Dativus Commodi handelt. Im anderen Fall, also wenn kein Handlungsträger vorhanden ist, ist dem Verb ein Dativus Incommodi zugeordnet. In beiden Fällen kann das Computersystem aufgrund des erkannten Dativtyps nunmehr den zugehörigen Text korrekt übersetzen, ohne daß hierzu weitere Informationen erforderlich wären.

Bei einer vorteilhaften Weiterbildung der Erfindung wird, falls der letzte Schritt nicht positiv der Fall war, geprüft, ob der Text in der Umgebung des Verbs eine Konstruktion mit "zu" oder mit "nicht . . . genug" enthält. Auf diese Weise erkennt das Computersystem, ob dem Verb ein Dativus Judicantis zugeordnet ist. Ist dies der Fall, so kann das Computersystem nunmehr diesen Dativtyp korrekt übersetzen. Zusätzliche Informationen, insbesondere die korrekten Übersetzungen sind also nicht mehr erforderlich. Besonders vorteilhaft ist es, diese Prüfung hinsichtlich des Dativus Judicantis nach den Prüfungen bezüglich des Objektsdativs und des possessiven Dativs und vor den Prüfungen bezüglich des Dativus Commodi und des Dativus Incommodi durchzuführen.

Weitere vorteilhafte Ausgestaltungen und Weiterbildungen der Erfindung ergeben sich aus der nachfolgenden Beschreibung eines Ausführungsbeispiels der Erfindung anhand der Zeichnungen.

Fig. 1 zeigt eine schematische Darstellung eines erfindungsgemäßen Verfahrens zur automatisierten Analyse eines Textes mit Hilfe eines Computersystems.

Fig. 2 zeigt eine Auszug aus einem Speicher eines erfindungsgemäßen Computersystems zur automatisierten Analyse eines Textes.

Fig. 3 ist eine Liste, in der die in Fig. 2 verwendeten Abkürzungen näher erläutert sind.

Fig. 4 enthält eine Anzahl von Beispielsätzen, mit deren Hilfe das erfindungsgemäße Verfahren zur automatisierten Analyse eines Textes näher erläutert wird.

Die Erfindung ist nachfolgend anhand eines Übersetzungssystems erläutert, das einen Text aus der deutschen Sprache automatisch in die englische Sprache übersetzt. Zu diesem Zweck ist in einem Speicher eines Computersystems ein Lexikon abgespeichert, in dem sämtliche deutschen Wörter mit einer Anzahl von Kodierungen sowie mit der zugehörigen Übersetzung in die englische Sprache abgespeichert sind. Anhand dieser Kodierungen kann das Computersystem erkennen, ob es sich bei dem jeweiligen Wort um ein Verb, ein Substantiv oder dergleichen handelt. Ebenfalls kann das Computersystem anhand dieser Kodierungen die Zusammenhänge zwischen einzelnen Wörtern feststellen.

Soll beispielsweise der in Fig. 4 angegebene Satz "Hans schickte einen Brief an Oma." übersetzt werden, so findet das Computersystem den Stamm des Wortes "schickte" in dem genannten Lexikon. Dieser Stamm "schick" mit den zugehörigen Kodierungen und der zugehörigen Übersetzung ist in der Fig. 2 angegeben. Gemäß der Fig. 3 hat die Abkürzung "v" die Bedeutung, daß es sich bei dem Wort mit dem Stamm "schick" um ein Verb handelt. Die Abkürzung "action" bedeutet, daß das Wort mit dem Stamm "schick" immer das Vorhandensein eines Handlungsträgers erfordert. In dem genannten Beispielsatz ist Hans der Handlungsträger, der einen Brief schickte. Das Zeichen "*" hat die Bedeutung eines Platzhalters für weitere Abkürzungen, die jedoch bei dem vorliegenden Wort nicht relevant sind. Die Abkürzung "obj" zeigt an, daß das Wort mit dem Stamm "schick" mit einem Akkusativobjekt verknüpft sein kann. Entsprechend zeigt die Abkürzung "iobj" an, daß das Wort mit dem Stamm "schick" mit einem Objektsdativ verknüpft sein kann. Die in der Klammer nach der Abkürzung "iobj" enthaltenen weiteren Abkürzungen stellen nähere Erläuterungen zu dem Objektsdativ dar. So hat die Abkürzung "n" die Bedeutung, daß es sich um einen normalen Objektsdativ handelt. Das Zeichen "!" stellt eine Oder-Verknüpfung dar. Die nachfolgende Abkürzung "p(an.acc)" bedeutet, daß der Objektsdativ mit der Präposition "an" gebildet wird. Insgesamt kann also der Objektsdativ normal oder mit der Präposition "an" gebildet sein. Die Abkürzung "t" in der nächsten Zeile zeigt an, daß danach die Übersetzung des Stammes "schick" folgt. Diese Übersetzung lautet "send". Die nachfolgende Abkürzung "pc(to)" hat die Bedeutung, daß das Wort "send" mit der nachfolgenden Präposition "to" gebildet werden muß.

Entsprechend der Fig. 1 und der bei dem Stamm "schick" abgespeicherten Kodierung "iobj" erkennt das Computersystem, daß in dem Beispielsatz "Hans schickte einen Brief an Oma." dem Verb "schickte" ein Objektsdativ zugeordnet ist, nämlich "an Oma". Bei diesem Objektsdativ handelt es sich nicht um einen normalen Objektsdativ, sondern um einen mit dem Wort "an" gebildeten Objektsdativ. Das Computersystem kann nunmehr den Beispielsatz übersetzen. Hierzu übernimmt es aus dem Lexikon die Übersetzung des Stammes "schick", also das Wort "send", sowie das nachfolgende Wort "to". Daraus und aus den Übersetzungen der anderen Wörter des Beispielsatzes bildet dann das Computersystem die Übersetzung zu "Hans sent a letter to Grandma." Der ebenfalls angegebene Beispielsatz "Hans schickte Oma einen Brief." führt zu derselben Übersetzung. In diesem Fall handelt es sich jedoch bei dem Wort "Oma" um einen normalen Objektsdativ, also ohne das Wort "an".

Bei dem in Fig. 4 angegebenen Beispielsatz "Oma kämmte ihm das Haar." stellt das Computersystem entsprechend der Fig. 1 fest, daß dem Stamm "kämm" keine Kodierung "iobj" zugeordnet ist, jedoch eine Kodierung "poss". Daraus erkennt das Computersystem, daß zu dem Verb "kämmte" ein possessiver Dativ gehört. Aus den abgespeicherten Kodierungen kann das Computersystem darüber hinaus erkennen, daß es sich um ein Verb handelt, das immer das Vorhandensein eines Handlungsträgers erfordert. Im vorliegenden Beispielfall ist die Oma der Handlungsträger. Des weiteren zeigt die abgespeicherte Kodierung "obj", daß dem Verb mit dem Stamm "kämm" ein Akkusativobjekt zugeordnet sein kann. Wie erwähnt hat die Abkürzung "poss(o)" die Bedeutung, daß dem Verb mit dem Stamm "kämm" ein possessiver Dativ zugeordnet ist. Die dabei in der Klammer angegebene Abkürzung, im vorliegenden Fall der Buchstabe "o", gibt an, auf welches andere Wort bzw. auf welche andere Wortgruppe sich der possessive Dativ bezieht. Entsprechend der Fig. 3 weist der Buchstabe "o" darauf hin, daß sich der possessive Dativ auf das Objekt des Satzes bezieht, der Buchstabe "s" sagt aus, daß der possessive Dativ auf das Subjekt bezogen ist, der Buchstabe "i" bedeutet einen Bezug auf das Objektsdativ, der Buchstabe "p" einen Bezug auf eine Präposition und der Buchstabe "g" hat die Bedeutung, daß sich der possessive Dativ auf das Genetivobjekt des Satzes bezieht. Für den vorliegenden Beispielsatz gibt das Lexikon gemäß der Fig. 2 an, daß zu dem Verb mit dem Stamm "kämm" ein possessiver Dativ vorhanden sein kann, der sich auf das Objekt bezieht. Das Objekt ist in diesem Fall "das Haar" und der possessive Dativ ist das Wort "ihm". Mit diesen Informationen sowie mit den zu den einzelnen Wörtern des Beispielsatzes gehörigen Übersetzungen kann das Computersystem den Beispielsatz zu "Grandma combed his hair." übersetzen.

Bei den weiteren, in der Fig. 4 angegebenen Beispielsätzen "Heinz lief der Oma zu schnell." und "Heintje singt der Oma nicht laut genug." stellt das Computersystem anhand des Lexikons der Fig. 2 fest, daß zu den Verben mit den Stämmen "lauf" und "sing" jeweils keine Kodierung abgespeichert ist, die auf einen Objektsdativ oder einen possessiven Dativ hinweist. Die Abkürzung "nil" hat dabei die Bedeutung, daß für den jeweiligen Stamm keine entsprechende Kodierung eingetragen ist. Gemäß der Fig. 1 prüft das Computersystem nunmehr, ob der Satz eine Konstruktion mit dem Wort "zu" oder eine Konstruktion mit den Worten "nicht . . . genug" enthält. In den beiden genannten Beispielsätzen ist dies der Fall. Das Computersystem erkennt dadurch, daß es sich um einen Dativus Judicantis handelt. Mit Hilfe von ebenfalls abgespeicherten Transferregeln für die Übersetzung ist es damit dem Computersystem möglich, die genannten Beispielsätze zu übersetzen, und zwar zu "Heinz ran too fast for Grandma." und "Heintje doesn′t sing loud enough for Grandma.".

Ein weiterer Beispielsatz in der Fig. 4 lautet "Karl baute der Oma ein Haus.". Zur Analyse dieses Satzes prüft das Computersystem die Kodierungen zu dem Stamm "bau" im Lexikon entsprechend der Fig. 2. Dort kann das Computersystem erkennen, daß dem Verb mit dem Stamm "bau" kein Objektsdativ oder possessiver Dativ zugeordnet sein kann. Des weiteren entnimmt das Computersystem dem Lexikon der Fig. 2, daß das Verb mit dem Stamm "bau" das Vorhandensein eines Handlungsträgers erfordert. Da in dem genannten Beispielsatz keine Konstruktion mit dem Wort "zu" oder mit den Worten "nicht . . . genug" enthalten ist, ergibt sich entsprechend der Fig. 1, daß es sich in dem Beispielsatz um einen Dativus Commodi handelt, wobei Karl der Handlungsträger ist. Mit Hilfe von abgespeicherten Transferregeln kann das Computersystem nunmehr den Beispielsatz übersetzen, und zwar zu "Karl built a house for Grandma."

Der letzte in Fig. 4 enthaltene Beispielsatz lautet "Ihm sind Oma′s Blumen verwelkt.". Aus dem Lexikon entnimmt das Computersystem, daß dem Stamm "verwelk" kein Objektsdativ und kein possessiver Dativ zugeordnet sein kann. Des weiteren ist in dem Lexikon zu dem Stamm "verwelk" die Abkürzung "event" angegeben. Gemäß der Fig. 3 weist diese Kodierung auf das Nicht-Vorhandensein eines Handlungsträgers hin. Mit Hilfe dieser Informationen, und da in dem Beispielsatz weder eine Konstruktion mit dem Wort "zu" noch mit den Wörtern "nicht . . . genug" enthalten ist, kommt das Computersystem zu dem Ergebnis, daß der Satz einen Dativus Incommodi enthalten muß. Im vorliegenden Beispielsatz stellt das Wort "ihm" diesen Dativus Incommodi dar. Mit Hilfe von entsprechenden abgespeicherten Transferregeln ist es dem Computersystem möglich, den Beispielsatz zu übersetzen. Dabei kann der Dativus Incommodi entweder in der Form von "Grandma′s flowers wilted on him." oder mit Hilfe einer "let-Konstruktion" als "He let Grandma′s flowers wilt." übersetzt werden.

Claims

1. Computersystem zur automatisierten Analyse eines Textes, der aus Wörtern einer natürlichen Sprache zusammengesetzt ist, dadurch gekennzeichnet, daß zu einem Verb, das mit einem possessiven Dativ auftreten kann, eine auf den possessiven Dativ hinweisende Kodierung abgespeichert ist.

2. Computersystem nach Anspruch 1, dadurch gekennzeichnet, daß die auf den possessiven Dativ hinweisende Kodierung angibt, auf welches andere Wort bzw. auf welche andere Wortgruppe des Textes sich der possessive Dativ bezieht.

3. Verfahren zur automatisierten Analyse eines Textes, der aus Wörtern einer natürlichen Sprache zusammengesetzt ist, mit Hilfe eines Computersystems, bei dem geprüft wird, ob einem in dem Text enthaltenen Verb eine Kodierung zugeordnet ist, die auf einen Objektsdativ hinweist, dadurch gekennzeichnet, daß, falls dies nicht der Fall ist, geprüft wird, ob dem Verb eine Kodierung zugeordnet ist, die auf einen possessiven Dativ hinweist.

4. Verfahren nach Anspruch 3, dadurch gekennzeichnet, daß anhand der auf den possessiven Dativ hinweisenden Kodierung geprüft wird, auf welches andere Wort bzw. auf welche andere Wortgruppe des Textes sich der possessive Dativ bezieht.

5. Verfahren nach Anspruch 3 oder 4, dadurch gekennzeichnet, daß, falls dies nicht der Fall ist, geprüft wird, ob dem Verb eine Kodierung zugeordnet ist, die auf das Vorhandensein oder das Nicht-Vorhandensein eines Handlungsträgers hinweist.

6. Verfahren nach Anspruch 5, dadurch gekennzeichnet, daß es sich bei Vorhandensein eines Handlungsträgers um einen Dativus Commodi handelt und bei Nicht-Vorhandensein eines Handlungsträgers um einen Dativus Incommodi.

7. Verfahren nach einem der Ansprüche 3 bis 6, dadurch gekennzeichnet, daß, falls dies nicht der Fall ist, geprüft wird, ob der Text in der Umgebung des Verbs eine Konstruktion mit "zu" oder mit "nicht . . . genug" enthält.