DE4311211A1 - Computersystem und Verfahren zur automatisierten Analyse eines Textes - Google Patents
Computersystem und Verfahren zur automatisierten Analyse eines TextesInfo
- Publication number
- DE4311211A1 DE4311211A1 DE4311211A DE4311211A DE4311211A1 DE 4311211 A1 DE4311211 A1 DE 4311211A1 DE 4311211 A DE4311211 A DE 4311211A DE 4311211 A DE4311211 A DE 4311211A DE 4311211 A1 DE4311211 A1 DE 4311211A1
- Authority
- DE
- Germany
- Prior art keywords
- dative
- computer system
- possessive
- verb
- text
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/253—Grammatical analysis; Style critique
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Machine Translation (AREA)
Description
Die Erfindung betrifft ein Computersystem zur
automatisierten Analyse eines Textes, der aus Wörtern
einer natürlichen Sprache zusammengesetzt ist. Des
weiteren betrifft die Erfindung ein Verfahren zur
automatisierten Analyse eines Textes mit Hilfe eines
Computersystems.
Ein derartiges Computersystem sowie ein derartiges
Verfahren sind beispielsweise aus Übersetzungssystemen
bekannt, mit deren Hilfe ein Text aus einer
Quellsprache in eine Zielsprache automatisch übersetzt
wird. Damit die Übersetzung von dem Computersystem
korrekt ausgeführt werden kann, ist es erforderlich,
daß das Computersystem durch eine Analyse des zu
übersetzenden Textes erkennt, welche Funktion die
einzelnen Wörter des Textes haben, ob also
beispielsweise ein bestimmtes Wort das Subjekt, das
Objekt oder dergleichen in dem zugehörigen Satz
darstellt. Entsprechend ist es für eine korrekte
Übersetzung ebenfalls erforderlich, daß das
Computersystem erkennt, ob ein Wort innerhalb des
zugehörigen Satzes ein Objekt im Akkusativ, ein Objekt
im Dativ oder dergleichen darstellt.
Handelt es ich um ein Objekt, das im Dativ auftritt,
so sind in der deutschen Sprache mehrere
unterschiedliche Dativtypen möglich, die sich durch
unterschiedliche Funktionen in dem zugehörigen Satz
auszeichnen. Der am häufigsten auftretende Dativtyp
ist der sogenannte Objektsdativ. Beispielsweise
stellen die Wörter "seiner Schwester" in dem Satz "Er
schickt seiner Schwester ein Buch." einen Objektsdativ
dar. Ein weiterer Dativtyp ist der sogenannte
possessive Dativ oder Pertinenzdativ. So enthält
beispielsweise der Satz "Er streicht dem Kind über die
Wangen." einen derartigen possessiven Dativ, nämlich
hinsichtlich der Wörter "dem Kind". Durch den
possessiven Dativ wird das Ganze in einer
Teil-Ganzes-Relation bezeichnet, also in dem
vorgenannten Beispielsatz das Kind, zu dem die Wangen
gehören. In dem Satz "Peter singt der Oma nicht laut
genug." stellen die Wörter "der Oma" einen Dativus
Judicantis dar. Für diesen Dativtyp ist es
erforderlich, daß eine Konstruktion mit den Wörtern
"nicht . . . genug" oder mit dem Wort "zu" in dem
zugehörigen Satz enthalten ist. Der Dativus Commodi
und der Dativus Incommodi stellen weitere Dativtypen
dar. Die Wörter "dem Baby" bilden in dem Satz "Die
Mutter strickt dem Baby Wollsocken." einen Dativus
Commodi. Bei diesem Dativtyp ist es erforderlich, daß
in dem zugehörigen Satz ein Handlungsträger vorhanden
ist. In dem vorgenannten Beispielsatz ist die Mutter
der Handlungsträger, der dem Baby Wollsocken strickt.
In dem Satz "Mir sind Peters Blumen verwelkt." bildet
das Wort "mir" einen Dativus Incommodi. Bei diesem
Dativtyp ist in dem zugehörigen Satz kein
Handlungsträger enthalten. Der Verursacher des in dem
Satz beschriebenen Vorgangs wird durch den Dativus
Incommodi selbst genannt.
Die Übersetzung der verschiedenen Dativtypen
unterscheidet sich voneinander. Der Objektsdativ kann
zumeist ohne weitere Besonderheiten übersetzt werden.
So ergibt die Übersetzung des Satzes "Er schickt
seiner Schwester ein Buch." in die englische Sprache
den Satz "He sends a book to his sister.". Hier ist
bei der Übersetzung nur die Besonderheit zu
berücksichtigen, daß das englische Verb "to send" im
Dativ immer die Präposition "to" nach sich zieht. Beim
possessiven Dativ ist für die Übersetzung die Kenntnis
der genannten Teil-Ganzes-Relation erforderlich. Wie
bereits erläutert wurde, stellt in dem Satz "Er
streicht dem Kind über die Wangen." das Kind das Ganze
dar, von dem die Wangen ein Teil sind. Dies führt in
der Übersetzung zu dem Satz "He strikes the child′s
cheek.". Die Teil-Ganzes-Relation äußert sich in der
Übersetzung in den Wörtern "the child′s". Der Satz
"Peter singt der Oma nicht laut genug." ergibt in der
englischen Sprache den Satz "Peter doesn′t sing loud
enough for Grandma." Der Dativus Judicantis wird also
in der englischen Sprache mit Hilfe des Wortes "for"
übersetzt. Der Dativus Commodi in dem Satz "Die Mutter
strickt dem Baby Wollsocken." wird in der englischen
Sprache mit dem Satz "The mother is knitting socks for
the baby." in ähnlicher Weise übersetzt wie der
Dativis Judicantis. Der Satz "Mir sind Peter′s Blumen
verwelkt." ergibt hingegen in der englischen Sprache
den Satz "It was my fault that Peter′s flowers
wilted.". Der darin enthaltene Dativus Incommodi wird
also durch die Wörter "It was my fault that"
übersetzt.
Bei den bekannten Übersetzungssystemen ist zu jedem
Verb, das mit einem Objektsdativ auftreten kann, eine
entsprechende, auf diesen Objektsdativ hinweisende
Kodierung im Speicher des Computersystems
abgespeichert. Das Computersystem ist damit in der
Lage, bei diesen Verben einen Objektsdativ zu erkennen
und bei der Übersetzung zu berücksichtigen. Alle
anderen Dativtypen sind bei den bekannten
Übersetzungssystemen entweder gar nicht berücksichtigt
oder es ist die korrekte Übersetzung bei jedem
einzelnen Verb explizit im Speicher des
Computersystems abgespeichert. Im ersten Fall, wenn
also die anderen Dativtypen nicht berücksichtigt sind,
ergeben sich bei Verben, die beispielsweise einen
possessiven Dativ nach sich ziehen, automatisch Fehler
bei der Übersetzung des zugehörigen Satzes aus der
deutschen Sprache in eine Zielsprache. Im zweiten Fall
hat die jeweilige explizite Abspeicherung der
korrekten Übersetzung bei jedem Verb einen äußerst
hohen Speicherplatzbedarf zur Folge. Dies um so mehr,
als es unter Umständen erforderlich ist, zu ein und
demselben Verb mehrere verschiedene Übersetzungen im
Speicher des Computersystems abzuspeichern. Diese
große Menge an abgespeicherten Informationen bewirkt
gleichzeitig, daß die mittlere Zugriffszeit des
Computersystems auf eine bestimmte Information größer
wird. Je mehr Informationen im Speicher des
Computersystems enthalten sind, desto mehr Zeit
benötigt daß Computersystem, um diese Informationen zu
verarbeiten.
Aufgabe der Erfindung ist es, ein Computersystem sowie
ein entsprechendes Verfahren zur automatisierten
Analyse eines Textes zu schaffen, bei dem die
Dativtypen der deutschen Sprache in einer technisch
sinnvollen Art und Weise berücksichtigt werden.
Die Erfindung löst diese Aufgabe dadurch, daß bei
einem Computersystem der eingangs genannten Art zu
einem Verb, das mit einem possessiven Dativ auftreten
kann, eine auf den possessiven Dativ hinweisende
Kodierung abgespeichert ist. Durch die genannte
Kodierung ist es dem Computersystem möglich, einen
possessiven Dativ korrekt zu erkennen. Dies hat zur
Folge, daß das Computersystem den possessiven Dativ
auch korrekt in eine Zielsprache übersetzen kann. Es
ist somit nicht mehr erforderlich, daß sämtliche
korrekten Übersetzungen des possessiven Dativs bei dem
jeweiligen Verb abgespeichert sind. Statt dessen ist
im Speicher des Computersystems zu dem jeweiligen Verb
nur noch die auf den possessiven Dativ hinweisende
Kodierung abgespeichert. Dies bedeutet eine
wesentliche Verringerung des erforderlichen
Speicherplatzbedarfes.
Die Kodierung besteht aus einer geringen Anzahl von
Buchstaben, während die bisher erforderliche
Abspeicherung der korrekten Übersetzungen eine
Vielzahl von Wörtern umfaßte. Mit dieser Verringerung
des Speicherplatzbedarfes geht gleichzeitig eine
wesentliche Beschleunigung bei der Verarbeitung
einher. Da eine geringere Anzahl von Informationen
vorhanden ist, benötigt das Computersystem auch eine
geringere mittlere Zugriffszeit auf eine bestimmte
Information. Die Verarbeitungsgeschwindigkeit des
Computersystems wird also größer.
Des weiteren wird durch die Kodierung des possessiven
Dativs erreicht, daß auch die nunmehr noch
verbleibenden Dativtypen vom Computersystem korrekt
erkannt werden können, ohne daß es erforderlich wäre,
irgendwelche Übersetzungen abzuspeichern. Dies hat zur
Folge, daß auch für die Erkennung der verbleibenden
Dativtypen wesentlich weniger Speicherplatz
erforderlich ist. Die Verarbeitungsgeschwindigkeit des
Computersystems wird dadurch weiter gesteigert.
Insgesamt ist es durch die Abspeicherung von Ko
dierungen, die auf einen possessiven Dativ hinweisen,
möglich, daß die Dativtypen der deutschen Sprache vom
Computersystem automatisch und korrekt erkannt werden.
Die Abspeicherung dieser Kodierungen ist dabei
vollständig ausreichend. Zusätzliche Informationen,
wie beispielsweise die bisher erforderlichen korrekten
Übersetzungen für die einzelnen Dativtypen der
deutschen Sprache, sind nicht mehr erforderlich.
Bei einer vorteilhaften Weiterbildung der Erfindung
gibt die auf den possessiven Dativ hinweisende
Kodierung an, auf welches andere Wort bzw. auf welche
andere Wortgruppe des Textes sich der possessive Dativ
bezieht. Wie erläutert wurde, tritt der possessive
Dativ im Zusammenhang mit einer Teil-Ganzes-Relation
auf. Es besteht nun die Möglichkeit, daß in einem Satz
ein Teil angegeben ist, das zumindest theoretisch sich
auf verschiedene, in dem Satz vorhandene andere Wörter
bzw. Wortgruppen als Ganzes beziehen kann. Mit der
Erkenntnis, daß es sich um einen possessiven Dativ
handelt, wäre es somit noch nicht möglich, das Teil
dem richtigen Ganzen zuzuordnen. Durch das zusätzliche
Merkmal hingegen, daß die Kodierung angibt, auf
welches andere Wort bzw. auf welche andere Wortgruppe
des Textes sich der possessive Dativ bezieht, wird
dieses Problem gelöst. Das Computersystem kann aus der
zusätzlichen Information eindeutig die Beziehung des
Teiles zu dem richtigen Ganzen herstellen. Eine
korrekte Übersetzung des Textes ist somit auch in
diesem Fall gewährleistet.
Die Erfindung löst die genannte Aufgabe auch dadurch,
daß bei einem Verfahren zur automatisierten Analyse
eines Textes, der aus Wörtern einer natürlichen
Sprache zusammengesetzt ist, mit Hilfe eines
Computersystems, geprüft wird, ob einem in dem Text
enthaltenen Verb eine Kodierung zugeordnet ist, die
auf einen Objektsdativ hinweist, und, falls dies
nicht der Fall ist, danach geprüft wird, ob dem Verb
eine Kodierung zugeordnet ist, die auf einen
possessiven Dativ hinweist.
Liegt dem Computersystem ein Text beispielsweise zur
Übersetzung vor, so prüft das Computersystem zuerst,
ob dem Verb ein Objektsdativ zugeordnet ist. Ist dies
der Fall, so kann dieser Objektsdativ korrekt in die
Zielsprache, beispielsweise in die englische Sprache
übersetzt werden. Ist dies nicht der Fall, so prüft
das Computersystem in einem nächsten Schritt, ob dem
Verb ein possessiver Dativ zugeordnet ist. Ist dies
der Fall, so kann das Computersystem nunmehr den
vorliegenden Satz ebenfalls korrekt in die Zielsprache
übersetzen.
Bei einer vorteilhaften Ausgestaltung der Erfindung
wird anhand der auf den possessiven Dativ hinweisenden
Kodierung geprüft, auf welches andere Wort bzw. auf
welche andere Wortgruppe des Textes sich der
possessive Dativ bezieht. Durch diese zusätzliche
Prüfung wird das Computersystem in die Lage versetzt,
die erläuterte Teil-Ganzes-Relation korrekt zu
erkennen. Das Computersystem kann dadurch das Teil und
das zugehörige Ganze korrekt einander zuordnen und in
die Zielsprache übersetzen.
Bei einer weiteren vorteilhaften Weiterbildung der
Erfindung wird, falls der letzte Schritt nicht positiv
der Fall war, geprüft, ob dem Verb eine Kodierung
zugeordnet ist, die auf das Vorhandensein oder das
Nicht-Vorhandensein eines Handlungsträgers hinweist.
Ist dem Verb eine Kodierung zugeordnet, die auf das
Vorhandensein eines Handlungsträgers hinweist, so
bedeutet dies, daß es sich um einen Dativus Commodi
handelt. Im anderen Fall, also wenn kein
Handlungsträger vorhanden ist, ist dem Verb ein
Dativus Incommodi zugeordnet. In beiden Fällen kann
das Computersystem aufgrund des erkannten Dativtyps
nunmehr den zugehörigen Text korrekt übersetzen, ohne
daß hierzu weitere Informationen erforderlich wären.
Bei einer vorteilhaften Weiterbildung der Erfindung
wird, falls der letzte Schritt nicht positiv der Fall
war, geprüft, ob der Text in der Umgebung des Verbs
eine Konstruktion mit "zu" oder mit "nicht . . . genug"
enthält. Auf diese Weise erkennt das Computersystem,
ob dem Verb ein Dativus Judicantis zugeordnet ist. Ist
dies der Fall, so kann das Computersystem nunmehr
diesen Dativtyp korrekt übersetzen. Zusätzliche
Informationen, insbesondere die korrekten
Übersetzungen sind also nicht mehr erforderlich.
Besonders vorteilhaft ist es, diese Prüfung
hinsichtlich des Dativus Judicantis nach den Prüfungen
bezüglich des Objektsdativs und des possessiven Dativs
und vor den Prüfungen bezüglich des Dativus Commodi
und des Dativus Incommodi durchzuführen.
Weitere vorteilhafte Ausgestaltungen und
Weiterbildungen der Erfindung ergeben sich aus der
nachfolgenden Beschreibung eines Ausführungsbeispiels
der Erfindung anhand der Zeichnungen.
Fig. 1 zeigt eine schematische Darstellung
eines erfindungsgemäßen Verfahrens zur
automatisierten Analyse eines Textes mit
Hilfe eines Computersystems.
Fig. 2 zeigt eine Auszug aus einem Speicher eines
erfindungsgemäßen Computersystems zur
automatisierten Analyse eines Textes.
Fig. 3 ist eine Liste, in der die in Fig. 2
verwendeten Abkürzungen näher erläutert
sind.
Fig. 4 enthält eine Anzahl von Beispielsätzen, mit
deren Hilfe das erfindungsgemäße Verfahren
zur automatisierten Analyse eines Textes
näher erläutert wird.
Die Erfindung ist nachfolgend anhand eines
Übersetzungssystems erläutert, das einen Text aus der
deutschen Sprache automatisch in die englische Sprache
übersetzt. Zu diesem Zweck ist in einem Speicher eines
Computersystems ein Lexikon abgespeichert, in dem
sämtliche deutschen Wörter mit einer Anzahl von
Kodierungen sowie mit der zugehörigen Übersetzung in
die englische Sprache abgespeichert sind. Anhand
dieser Kodierungen kann das Computersystem erkennen,
ob es sich bei dem jeweiligen Wort um ein Verb, ein
Substantiv oder dergleichen handelt. Ebenfalls kann das
Computersystem anhand dieser Kodierungen die
Zusammenhänge zwischen einzelnen Wörtern feststellen.
Soll beispielsweise der in Fig. 4 angegebene Satz
"Hans schickte einen Brief an Oma." übersetzt werden,
so findet das Computersystem den Stamm des Wortes
"schickte" in dem genannten Lexikon. Dieser Stamm
"schick" mit den zugehörigen Kodierungen und der
zugehörigen Übersetzung ist in der Fig. 2 angegeben.
Gemäß der Fig. 3 hat die Abkürzung "v" die Bedeutung,
daß es sich bei dem Wort mit dem Stamm "schick" um ein
Verb handelt. Die Abkürzung "action" bedeutet, daß das
Wort mit dem Stamm "schick" immer das Vorhandensein
eines Handlungsträgers erfordert. In dem genannten
Beispielsatz ist Hans der Handlungsträger, der einen
Brief schickte. Das Zeichen "*" hat die Bedeutung
eines Platzhalters für weitere Abkürzungen, die jedoch
bei dem vorliegenden Wort nicht relevant sind. Die
Abkürzung "obj" zeigt an, daß das Wort mit dem Stamm
"schick" mit einem Akkusativobjekt verknüpft sein
kann. Entsprechend zeigt die Abkürzung "iobj" an, daß
das Wort mit dem Stamm "schick" mit einem Objektsdativ
verknüpft sein kann. Die in der Klammer nach der
Abkürzung "iobj" enthaltenen weiteren Abkürzungen
stellen nähere Erläuterungen zu dem Objektsdativ dar.
So hat die Abkürzung "n" die Bedeutung, daß es sich um
einen normalen Objektsdativ handelt. Das Zeichen "!"
stellt eine Oder-Verknüpfung dar. Die nachfolgende
Abkürzung "p(an.acc)" bedeutet, daß der Objektsdativ
mit der Präposition "an" gebildet wird. Insgesamt kann
also der Objektsdativ normal oder mit der Präposition
"an" gebildet sein. Die Abkürzung "t" in der nächsten
Zeile zeigt an, daß danach die Übersetzung des Stammes
"schick" folgt. Diese Übersetzung lautet "send". Die
nachfolgende Abkürzung "pc(to)" hat die Bedeutung, daß
das Wort "send" mit der nachfolgenden Präposition "to"
gebildet werden muß.
Entsprechend der Fig. 1 und der bei dem Stamm "schick"
abgespeicherten Kodierung "iobj" erkennt das
Computersystem, daß in dem Beispielsatz "Hans schickte
einen Brief an Oma." dem Verb "schickte" ein
Objektsdativ zugeordnet ist, nämlich "an Oma". Bei
diesem Objektsdativ handelt es sich nicht um einen
normalen Objektsdativ, sondern um einen mit dem Wort
"an" gebildeten Objektsdativ. Das Computersystem kann
nunmehr den Beispielsatz übersetzen. Hierzu übernimmt
es aus dem Lexikon die Übersetzung des Stammes
"schick", also das Wort "send", sowie das nachfolgende
Wort "to". Daraus und aus den Übersetzungen der
anderen Wörter des Beispielsatzes bildet dann das
Computersystem die Übersetzung zu "Hans sent a letter
to Grandma." Der ebenfalls angegebene Beispielsatz
"Hans schickte Oma einen Brief." führt zu derselben
Übersetzung. In diesem Fall handelt es sich jedoch bei
dem Wort "Oma" um einen normalen Objektsdativ, also
ohne das Wort "an".
Bei dem in Fig. 4 angegebenen Beispielsatz "Oma kämmte
ihm das Haar." stellt das Computersystem entsprechend
der Fig. 1 fest, daß dem Stamm "kämm" keine Kodierung
"iobj" zugeordnet ist, jedoch eine Kodierung "poss".
Daraus erkennt das Computersystem, daß zu dem Verb
"kämmte" ein possessiver Dativ gehört. Aus den
abgespeicherten Kodierungen kann das Computersystem
darüber hinaus erkennen, daß es sich um ein Verb
handelt, das immer das Vorhandensein eines
Handlungsträgers erfordert. Im vorliegenden
Beispielfall ist die Oma der Handlungsträger.
Des weiteren zeigt die abgespeicherte Kodierung "obj",
daß dem Verb mit dem Stamm "kämm" ein Akkusativobjekt
zugeordnet sein kann. Wie erwähnt hat die Abkürzung
"poss(o)" die Bedeutung, daß dem Verb mit dem Stamm
"kämm" ein possessiver Dativ zugeordnet ist. Die dabei
in der Klammer angegebene Abkürzung, im vorliegenden
Fall der Buchstabe "o", gibt an, auf welches andere
Wort bzw. auf welche andere Wortgruppe sich der
possessive Dativ bezieht. Entsprechend der Fig. 3
weist der Buchstabe "o" darauf hin, daß sich der
possessive Dativ auf das Objekt des Satzes bezieht,
der Buchstabe "s" sagt aus, daß der possessive Dativ
auf das Subjekt bezogen ist, der Buchstabe "i"
bedeutet einen Bezug auf das Objektsdativ, der
Buchstabe "p" einen Bezug auf eine Präposition und der
Buchstabe "g" hat die Bedeutung, daß sich der
possessive Dativ auf das Genetivobjekt des Satzes
bezieht. Für den vorliegenden Beispielsatz gibt das
Lexikon gemäß der Fig. 2 an, daß zu dem Verb mit dem
Stamm "kämm" ein possessiver Dativ vorhanden
sein kann, der sich auf das Objekt bezieht. Das Objekt
ist in diesem Fall "das Haar" und der possessive Dativ
ist das Wort "ihm". Mit diesen Informationen sowie mit
den zu den einzelnen Wörtern des Beispielsatzes
gehörigen Übersetzungen kann das Computersystem den
Beispielsatz zu "Grandma combed his hair." übersetzen.
Bei den weiteren, in der Fig. 4 angegebenen
Beispielsätzen "Heinz lief der Oma zu schnell." und
"Heintje singt der Oma nicht laut genug." stellt das
Computersystem anhand des Lexikons der Fig. 2 fest,
daß zu den Verben mit den Stämmen "lauf" und "sing"
jeweils keine Kodierung abgespeichert ist, die auf
einen Objektsdativ oder einen possessiven Dativ
hinweist. Die Abkürzung "nil" hat dabei die Bedeutung,
daß für den jeweiligen Stamm keine entsprechende
Kodierung eingetragen ist. Gemäß der Fig. 1 prüft das
Computersystem nunmehr, ob der Satz eine Konstruktion
mit dem Wort "zu" oder eine Konstruktion mit den
Worten "nicht . . . genug" enthält. In den beiden
genannten Beispielsätzen ist dies der Fall. Das
Computersystem erkennt dadurch, daß es sich um einen
Dativus Judicantis handelt. Mit Hilfe von ebenfalls
abgespeicherten Transferregeln für die Übersetzung ist
es damit dem Computersystem möglich, die genannten
Beispielsätze zu übersetzen, und zwar zu "Heinz ran
too fast for Grandma." und "Heintje doesn′t sing loud
enough for Grandma.".
Ein weiterer Beispielsatz in der Fig. 4 lautet "Karl
baute der Oma ein Haus.". Zur Analyse dieses Satzes
prüft das Computersystem die Kodierungen zu dem Stamm
"bau" im Lexikon entsprechend der Fig. 2. Dort kann
das Computersystem erkennen, daß dem Verb mit dem
Stamm "bau" kein Objektsdativ oder possessiver Dativ
zugeordnet sein kann. Des weiteren entnimmt das
Computersystem dem Lexikon der Fig. 2, daß das Verb
mit dem Stamm "bau" das Vorhandensein eines
Handlungsträgers erfordert. Da in dem genannten
Beispielsatz keine Konstruktion mit dem Wort "zu" oder
mit den Worten "nicht . . . genug" enthalten ist, ergibt
sich entsprechend der Fig. 1, daß es sich in dem
Beispielsatz um einen Dativus Commodi handelt, wobei
Karl der Handlungsträger ist. Mit Hilfe von
abgespeicherten Transferregeln kann das Computersystem
nunmehr den Beispielsatz übersetzen, und zwar zu "Karl
built a house for Grandma."
Der letzte in Fig. 4 enthaltene Beispielsatz lautet
"Ihm sind Oma′s Blumen verwelkt.". Aus dem Lexikon
entnimmt das Computersystem, daß dem Stamm "verwelk"
kein Objektsdativ und kein possessiver Dativ
zugeordnet sein kann. Des weiteren ist in dem Lexikon
zu dem Stamm "verwelk" die Abkürzung "event"
angegeben. Gemäß der Fig. 3 weist diese Kodierung auf
das Nicht-Vorhandensein eines Handlungsträgers hin.
Mit Hilfe dieser Informationen, und da in dem
Beispielsatz weder eine Konstruktion mit dem Wort "zu"
noch mit den Wörtern "nicht . . . genug" enthalten ist,
kommt das Computersystem zu dem Ergebnis, daß der Satz
einen Dativus Incommodi enthalten muß. Im vorliegenden
Beispielsatz stellt das Wort "ihm" diesen Dativus
Incommodi dar. Mit Hilfe von entsprechenden
abgespeicherten Transferregeln ist es dem
Computersystem möglich, den Beispielsatz zu
übersetzen. Dabei kann der Dativus Incommodi entweder
in der Form von "Grandma′s flowers wilted on him."
oder mit Hilfe einer "let-Konstruktion" als "He let
Grandma′s flowers wilt." übersetzt werden.
Claims (7)
1. Computersystem zur automatisierten Analyse eines
Textes, der aus Wörtern einer natürlichen Sprache
zusammengesetzt ist, dadurch gekennzeichnet, daß
zu einem Verb, das mit einem possessiven Dativ
auftreten kann, eine auf den possessiven Dativ
hinweisende Kodierung abgespeichert ist.
2. Computersystem nach Anspruch 1, dadurch
gekennzeichnet, daß die auf den possessiven Dativ
hinweisende Kodierung angibt, auf welches andere
Wort bzw. auf welche andere Wortgruppe des Textes
sich der possessive Dativ bezieht.
3. Verfahren zur automatisierten Analyse eines
Textes, der aus Wörtern einer natürlichen Sprache
zusammengesetzt ist, mit Hilfe eines
Computersystems, bei dem geprüft wird, ob einem
in dem Text enthaltenen Verb eine Kodierung
zugeordnet ist, die auf einen Objektsdativ
hinweist, dadurch gekennzeichnet, daß, falls dies
nicht der Fall ist, geprüft wird, ob dem Verb
eine Kodierung zugeordnet ist, die auf einen
possessiven Dativ hinweist.
4. Verfahren nach Anspruch 3, dadurch
gekennzeichnet, daß anhand der auf den
possessiven Dativ hinweisenden Kodierung geprüft
wird, auf welches andere Wort bzw. auf welche
andere Wortgruppe des Textes sich der possessive
Dativ bezieht.
5. Verfahren nach Anspruch 3 oder 4, dadurch
gekennzeichnet, daß, falls dies nicht der Fall
ist, geprüft wird, ob dem Verb eine Kodierung
zugeordnet ist, die auf das Vorhandensein oder
das Nicht-Vorhandensein eines Handlungsträgers
hinweist.
6. Verfahren nach Anspruch 5, dadurch
gekennzeichnet, daß es sich bei Vorhandensein
eines Handlungsträgers um einen Dativus Commodi
handelt und bei Nicht-Vorhandensein eines
Handlungsträgers um einen Dativus Incommodi.
7. Verfahren nach einem der Ansprüche 3 bis 6,
dadurch gekennzeichnet, daß, falls dies nicht der
Fall ist, geprüft wird, ob der Text in der
Umgebung des Verbs eine Konstruktion mit "zu"
oder mit "nicht . . . genug" enthält.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE4311211A DE4311211C2 (de) | 1993-04-05 | 1993-04-05 | Computersystem und Verfahren zur automatisierten Analyse eines Textes |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE4311211A DE4311211C2 (de) | 1993-04-05 | 1993-04-05 | Computersystem und Verfahren zur automatisierten Analyse eines Textes |
Publications (2)
Publication Number | Publication Date |
---|---|
DE4311211A1 true DE4311211A1 (de) | 1994-10-06 |
DE4311211C2 DE4311211C2 (de) | 1998-04-30 |
Family
ID=6484827
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE4311211A Revoked DE4311211C2 (de) | 1993-04-05 | 1993-04-05 | Computersystem und Verfahren zur automatisierten Analyse eines Textes |
Country Status (1)
Country | Link |
---|---|
DE (1) | DE4311211C2 (de) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2001006407A1 (fr) * | 1999-07-19 | 2001-01-25 | Iliya Alexandrovich Boldov | Procede de conversion d'informations texte |
DE10015859A1 (de) * | 2000-03-30 | 2001-10-11 | Gunthard Born | Verfahren zu einer grammatische Inhalte bezogenen Kommunikation in natürlichen Sprachen und Einrichtung zur rechnergestützten Durchführung dieses Verfahrens |
DE10015858A1 (de) * | 2000-03-30 | 2001-10-11 | Gunthard Born | Verfahren zu einer auf semantische Inhalte bezogenen Kommunikation in natürlichen Sprachen und Einrichtung zur rechnergestützten Durchführung dieses Verfahrens |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE3616011A1 (de) * | 1985-05-14 | 1986-11-20 | Sharp K.K., Osaka | Uebersetzungsgeraet |
US4724523A (en) * | 1985-07-01 | 1988-02-09 | Houghton Mifflin Company | Method and apparatus for the electronic storage and retrieval of expressions and linguistic information |
-
1993
- 1993-04-05 DE DE4311211A patent/DE4311211C2/de not_active Revoked
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE3616011A1 (de) * | 1985-05-14 | 1986-11-20 | Sharp K.K., Osaka | Uebersetzungsgeraet |
US4724523A (en) * | 1985-07-01 | 1988-02-09 | Houghton Mifflin Company | Method and apparatus for the electronic storage and retrieval of expressions and linguistic information |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2001006407A1 (fr) * | 1999-07-19 | 2001-01-25 | Iliya Alexandrovich Boldov | Procede de conversion d'informations texte |
DE10015859A1 (de) * | 2000-03-30 | 2001-10-11 | Gunthard Born | Verfahren zu einer grammatische Inhalte bezogenen Kommunikation in natürlichen Sprachen und Einrichtung zur rechnergestützten Durchführung dieses Verfahrens |
DE10015858A1 (de) * | 2000-03-30 | 2001-10-11 | Gunthard Born | Verfahren zu einer auf semantische Inhalte bezogenen Kommunikation in natürlichen Sprachen und Einrichtung zur rechnergestützten Durchführung dieses Verfahrens |
DE10015858C2 (de) * | 2000-03-30 | 2002-03-28 | Gunthard Born | Verfahren zu einer auf semantische Inhalte bezogenen rechnergestützten Kommunikation in natürlichen Sprachen |
DE10015859C2 (de) * | 2000-03-30 | 2002-04-04 | Gunthard Born | Verfahren zu einer auf grammatische Inhalte bezogenen rechnergestützten Kommunikation in natürlichen Sprachen |
Also Published As
Publication number | Publication date |
---|---|
DE4311211C2 (de) | 1998-04-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE68923981T2 (de) | Verfahren zur Bestimmung von Textteilen und Verwendung. | |
DE68928230T2 (de) | System zur grammatikalischen Verarbeitung eines aus natürlicher Sprache zusammengesetzten Satzes | |
DE3042508C2 (de) | Elektronisches Sprachübersetzungsgerät | |
DE69818796T2 (de) | Maschinenorganisiertes verfahren und vorrichtung zum übersetzen einer wortorganisierten textquelle in einen wortorganisierten zieltext | |
DE2756352C3 (de) | Schaltungsanordnung zum Aussuchen und Sortieren von Daten in gleichartig aufgebauten Sätzen | |
DE2630304A1 (de) | Einrichtung zur ueberpruefung der gueltigkeit von alphabetischen eingangszeichen | |
DE2541204B2 (de) | Einrichtung zur Fehlerkorrektur | |
EP3100174A1 (de) | Verfahren zur automatischen sinnerkennung und messung der eindeutigkeit von text | |
DE4323241A1 (de) | Verfahren und Computersystem zur Suche fehlerhafter Zeichenketten in einem Text | |
Yngve et al. | Mechanical translation | |
DE10308550A1 (de) | System und Verfahren zur automatischen Daten-Prüfung und -Korrektur | |
DE19922974A1 (de) | Verfahren und Vorrichtung zur Bearbeitung eines Dokuments | |
DE69025091T2 (de) | Verfahren und Vorrichtung zur Übersetzung eines Satzes mit einem durch Trennung gebildeten, zusammengesetzten Wort | |
DE4135261C1 (de) | ||
DE19849855C1 (de) | Verfahren zur automatischen Generierung einer textlichen Äußerung aus einer Bedeutungsrepräsentation durch ein Computersystem | |
DE3853045T2 (de) | Verfahren zur Beseitigung von enklitischen Endungen aus Verben in romanischen Sprachen. | |
DE4311211C2 (de) | Computersystem und Verfahren zur automatisierten Analyse eines Textes | |
DE2312193A1 (de) | Uebersetzer und quellencode-erzeuger fuer eine problemorientierte sprache fuer rechenanlagen | |
DE4213533C2 (de) | Verfahren und Computersystem zum Zerlegen von zusammengesetzten Wörtern | |
DE102016114265A1 (de) | Verfahren zum zumindest teilweise maschinellen Transferieren einer in einer Quellsprache abgefassten Wortfolge in eine Wortfolge einer Zielsprache | |
DE4209280C2 (de) | Verfahren und Computersystem zur automatisierten Analyse von Texten | |
DE3511920A1 (de) | Elektronischer ratgeber | |
DE10210553B4 (de) | Verfahren zum automatischen Klassifizieren eines Textes durch ein Computersystem | |
DE2613703C2 (de) | Schaltungsanordnung zum Übersetzen von Programmtexten | |
WO2022122061A1 (de) | Vorrichtung zum syntaktischen parsing natürlicher sprachen |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
OP8 | Request for examination as to paragraph 44 patent law | ||
D2 | Grant after examination | ||
8363 | Opposition against the patent | ||
8331 | Complete revocation |