DE10015858A1 - Verfahren zu einer auf semantische Inhalte bezogenen Kommunikation in natürlichen Sprachen und Einrichtung zur rechnergestützten Durchführung dieses Verfahrens - Google Patents
Verfahren zu einer auf semantische Inhalte bezogenen Kommunikation in natürlichen Sprachen und Einrichtung zur rechnergestützten Durchführung dieses VerfahrensInfo
- Publication number
- DE10015858A1 DE10015858A1 DE10015858A DE10015858A DE10015858A1 DE 10015858 A1 DE10015858 A1 DE 10015858A1 DE 10015858 A DE10015858 A DE 10015858A DE 10015858 A DE10015858 A DE 10015858A DE 10015858 A1 DE10015858 A1 DE 10015858A1
- Authority
- DE
- Germany
- Prior art keywords
- text
- semantic
- assigned
- symbols
- probabilities
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/216—Parsing using statistical methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/55—Rule-based translation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Probability & Statistics with Applications (AREA)
- Machine Translation (AREA)
Abstract
Für eine Kommunikation in natürlichen Sprachen, wie sie von Menschen auch mehrsprachig beim Informationsaustausch, Übersetzen, Dolmetschen, Stenotypieren oder bei Textkorrekturen unter Beherrschung sowohl des Verstehens, auch zusammenhängend oder fehlerhaft, vorgebrachter Äußerungen als auch ihrer inhaltsgerechten Formulierung ausgeübt wird, liegen befriedigend maschinell durchführbare Verfahren bisher nicht vor. Wegen der Vielfalt der Erscheinungsformen, Kombinationsmöglichkeiten und hierdurch mitbestimmten Bedeutungsmöglichkeiten gebräuchlicher Wortformen war die, notwendig kontextabhängige, Verknüpfung von Sprachsignalen mit hierfür geeignet definierten grammatischen und semantischen Kommunikationsinhalten rechnerisch nicht bewältigbar. Durch ein Verfahren, welches Sprachsignale, auch nichtlinearer, probabilistisch mit neuartigen, auf angegebene Art universell für beliebige Sprachen festzulegenden Symbolen verknüpft, die gemäß den Eigenschaften hieraus zu superierender Oberbegriffe zu grammatischen und, hiervon abhängig, gemäß ihnen zugeordneter disjunkter Klassen von Sachbegriffen und Verwendungshinweisen hierfür zu semantischen Inhalten zusammengefügt werden, durch welche vorausgesetzte Kontexte in zu übermittelnde Sachverhalte abgeändert werden, wird die Kommunikationsaufgabe, auch unter Einsatz angegebener Vorrichtungen, lösbar gemacht.
Description
Die Erfindung betrifft ein Verfahren zu einer auf semantische Inhalte bezogenen,
ein- wie auch mehrsprachig zu führenden Kommunikation in natürlichen Sprachen
gemäß dem Oberbegriff des Anspruchs 1 und einer Einrichtung zur
rechnergestützten Durchführung dieses Verfahrens gemäß dem Oberbegriff des
Anspruchs 25. In Unteransprüchen sind Einzelheiten und Ausgestaltungen
angegeben, welche die Vielfalt der Erscheinungsformen, Kombinations- und
dadurch mitbestimmten Bedeutungsmöglichkeiten der in solchen Sprachen
eingeführten Symbole und hieraus auf unterschiedliche Arten kombinierbaren
Äußerungen sowie der damit zu verbindenden grammatischen und semantischen
Inhalte berücksichtigen und den Einsatz eines daran angepaßten Repertoires von, an
einer entsprechenden Zahl von Sprachbeispielen erläuterten, Maßnahmen vorsehen,
die mit neuartigen, hierfür geeigneten Sprachbegriffen durchzuführende sind,
welche einheitlichen, auf angegebene Art universell auf beliebige Sprachen
anzuwendenden Definitionen und Erzeugungsvorschriften genügen, so daß die
Kommunikationsaufgabe mit einem an die Kapazitäten verfügbarer Vorrichtungen
anpaßbaren Speicher- und Verarbeitungsaufwand lösbar wird.
Für Verfahren der erfindungsgemäßen Art konnten bisher keine befriedigenden
Lösungen vorgelegt werden. Wie unten weiter ausgeführt, stehen einer Realisierung
vielfältige, zum Teil bisher auch noch gar nicht ausreichend erkannte und definierte
Probleme entgegen, die vor allem auch der komplexen Organisation der
einzusetzenden natürlichen Sprachen zuzuschreiben sind. Diesem Stand
entsprechend existieren, wie auch den Literaturstellen //2//, S. 218 und //12// zu
entnehmen ist, zur Zeit auch keine einheitlichen terminologischen Konventionen, so
daß hier zunächst einige wesentliche der für die nachfolgende Beschreibung des
erfindungsgemäßen Verfahrens benützten, zum Teil auch für eine präzise,
sachgerechte Beurteilung des gegenwärtigen Standes sowie die Beschreibung der zu
lösenden Aufgabe benötigten Begriffe näher zu definieren sind: Unter natürlichen
Sprachen L oder kurz auch Sprachen L werden, //1//, S. 14 folgend, Institutionen
verstanden, mit deren Hilfe, dem gegenwärtigen Stand entsprechend natürliche,
Personen miteinander kommunizieren und unter Verwendung gewohnheitsmäßig
benutzter Symbole in Interaktion treten, wofür gemäß //2//, S. 235 endliche oder
gegebenenfalls auch unbegrenzte Mengen von Symbolkomplexen eingesetzt
werden, die über einem endlichen Vokabular von Symbolen gebildet werden. Im
Einklang mit dieser Definition umfassen solche Interaktionen gegebenenfalls auch
mehrsprachig zu führende Kommunikationsaktivitäten, wie sie von Menschen
allgemein beim Austausch von Informationen über Sachverhalte ausgeübt werden
und beispielsweise beim Gespräch oder Schriftwechsel etwa bei der Erteilung und
Entgegennahme von Aufträgen, beim Stellen und Beantworten von Fragen, beim
Übersetzen, Dolmetschen, Stenotypieren oder auch Korrigieren von Äußerungen
anfallen. Diesen vielfältigen Aktivitäten ist das Merkmal gemeinsam, daß ihre
Durchführung einheitlich sowohl eine Beherrschung der Fähigkeit zum Erzeugen
verständlicher, ausreichend korrekt und eindeutig formulierter Sprachtexte wie auch
zum Verstehen gegebenenfalls auch in zusammenhängender oder auch nicht
normgerechter Form vorgebrachter Äußerungen umfaßt, welche gemäß //3//, S. 156
ohne die genannte Beherrschung des Erzeugens von Sprachtexten nicht bewältigbar
ist. Dem gegenwärtigen Stand entsprechend lassen die zitierten Sprachdefinitionen
im einzelnen jedoch offen, welche Art von Symbolen einzusetzen ist, welche
Regeln bei deren gewohnheitsmäßiger Benutzung und Zusammenfügung zu
Komplexen insgesamt einzuhalten sind, und welcher Zusammenhang zwischen
solchen Komplexen und den Interaktionen der Kommunikationspartner anzusetzen
ist.
Für das erfindungsgemäße Verfahren werden als Symbole allgemein als Gs
bezeichnete Begriffe mit Eigenschaften H(Gs) eingesetzt, welche, häufig mit
Wahrscheinlichkeiten p unterhalb eins, weitere Begriffe A wie auch weitere
Symbole Gs anzeigen und somit symbolisieren. Bestimmte Symbole Gs werden
durch jeweils eine disjunkte Klasse von, entsprechend alternativ vorkommenden,
Komplexen Kp von Sprachsignalen T mit Eigenschaften H(T) angezeigt oder auch
als bestimmte klassen- oder auch komplexbildende Superierungen weiterer
Symbole Gs gebildet. Entsprechend ihren Eigenschaften H(Gs) werden für die
Symbole Gs auch weitere Bezeichnungen wie Gr, Gt, G, Vt und Z usw. verwendet.
Die genannten, zur Anzeige von Symbolen Gs in den verfügbaren Medien
beispielsweise akustisch, optisch, geometrisch oder elektronisch erzeugten Signale
//12// werden unabhängig von ihrem Umfang und somit abweichend von //12// als
Texte T, also nicht als Symbole, bezeichnet. In dieser Beschreibung angeführte
Beispiele von Texten T werden durch Zeichenfolgen, insbesondere auch
Buchstabenfolgen, repräsentiert beziehungsweise angenähert, die zwischen einfache
Schrägstriche gesetzt werden; auf Lautschrift-Alphabete und weitere Notationen
wird zur Vereinfachung verzichtet. Bestimmte Eigenschaften von Symbolen Gs wie
auch von Symbolkomplexen Kp = GsGs gelten als ihre Inhalte oder Bedeutungen.
Die als Erzeuger und Absender sowie als Empfänger und Verarbeiter von Texten T
ein- oder auch mehrsprachig miteinander kommunizierenden Personen oder
erfindungsgemäß in diesen Rollen eingesetzten Vorrichtungen werden auch als
Kommunikationspartner oder kurz Partner Pa bezeichnet, die Erzeuger auch als
Autoren At, die Empfänger auch als Hörer Hr und die Verwender solcher
Vorrichtungen auch als Nutzer, wobei gegebenenfalls auch Autoren At oder Hörer
Hr, welche Kommunikationsinhalte in Aktionen umsetzen, als Nutzer fungieren.
Ein in sich abgeschlossener, gegebenenfalls auch mehrere sprachübliche Sätze
umfassender Text T eines Autors At wird als Äußerung Tp bezeichnet, ein aus einer
oder mehreren Äußerungen Tp eines oder mehrerer Partner Pa zusammengesetzter
Kommunikationsvorgang auch als Kommunikationsakt. Wie in //3//, S. 243
vorgeschlagen, werden die mündliche und schriftliche Version einer jeweils in einer
Sprachgemeinschaft X benutzten Sprache im Regelfall als unterschiedliche
natürliche Sprachen L behandelt. Eindeutige Übertragungen eines Textes T = T1
einer Sprache L in andere Medien, beispielsweise eines akustisch nachzuweisenden
Textes T1 aus der mündlichen deutschen Sprache in einen elektronisch kodierten
Text T2 dieser Sprache, mit entsprechend eindeutigen Zuordnungen von
Textmerkmalen H(T1) zu Merkmalen H(T2), werden im Regelfall als gleiche Texte
T1 = T2 behandelt.
Entsprechend den Sprachfähigkeiten von Menschen ist die erfindungsgemäße
Kommunikation ein- oder auch mehrsprachig zu leisten und schließt somit die
Übersetzung von Texten T in andere Sprachen L, definitionsgemäß also
beispielsweise auch vom Mündlichen ins Schriftliche, mit ein. Wie beim
menschlichen Sprachgebrauch ist für ein solches Kommunikationsverfahren die
Beherrschung einer Reihe von Funktionen zu fordern, zu welchen neben der
genannten Bestimmung von Inhalten einlaufender, gegebenenfalls auch in
zusammenhängender oder auch fehlerbehafteter Form geäußerter Texte T auch die
inhaltsgerechte Abfassung und gegebenenfalls Korrektur von ausreichend
verständlich zu haltenden Texten T gehört. Daß von einem erfindungsgemäßen
Verfahren sowohl die Fähigkeit zur Erzeugung verständlicher Texte T als auch zur
Bestimmung von Bedeutungen von Texten T zu leisten ist, folgt auch aus der oben
zitierten Einsicht, daß Hörer Hr ihrer Aufgabe des Verstehens von Inhalten von
Texten T nur dann nachzukommen vermögen, wenn sie dabei auf das für die
Erzeugung dieser Texte verwendete Regelwerk zurückgreifen können, während
umgekehrt Autoren At die Verständlichkeit ihrer Texte, auch unter Vermeidung
irreführender Mehrdeutigkeiten, nur sichern können, wenn sie die Vorgehensweise
der Hörer Hr beim Verstehen der Inhalte berücksichtigen, ihnen diese also auch
bekannt ist.
Wie in //3//, S. 410f. und S. 445 traditionsgemäß, jedoch ohne weiterführende
Definitionen vorgeschlagen, werden Inhalte von Texten T auf unten näher
spezifizierte Art unterschieden in grammatische und semantische Inhalte, beide
auch Bedeutungen genannt. Zu ihrer Darstellung werden auch Begriffe mit von
//12// abweichenden Definitionen verwendet. Ein Text T, der, auch wenn er als
Äußerung Tp für sich allein steht, bezüglich eines ihm zugeordneten semantischen
Inhalts von Experten, definiert als Kenner der betreffenden Sprachen L und der
darin angesprochenen semantischen Inhalte, als zulässig beurteilt wird, wird als
korrekter Text T = Tf bezeichnet. Abweichend von //12// werden Sachverhalte
unabhängig davon, ob sie durch Texte T angesprochen werden oder nicht, als
pragmatisch bezeichnet; entsprechend werden durch Texte T angesprochene
semantische Inhalte allgemein auf pragmatische Sachverhalte, kurz auch Sachen
genannt, bezogen. In Anlehnung an //2//, S. 219 werden bestimmte Bezüge zwischen
Texten oder auch bestimmten Textteilen T oder grammatischen Inhalten wie auch
Teilen hiervon als grammatisch, Bezüge zwischen Textteilen T, auch unter
Berücksichtigung ihrer grammatischen Inhalte, und pragmatischen Sachverhalten
als semantisch, zwischen pragmatischen Sachverhalten, wie sie gegebenenfalls auch
durch bestimmte Vorstellungen der Kommunikationspartner Pa mitgeprägt sein
können, als pragmatisch, und zwischen bestimmten Textteilen T als syntaktisch
bezeichnet. Eine unter Beachtung grammatischer Inhalte von Texten T geführte
Kommunikation wird grammatikbezogen oder grammatisch und eine gemäß einem
Verfahren der erfindungsgemäßen Art unter zusätzlicher, gegebenenfalls auch
alleiniger Beachtung pragmatischer Sachverhalte geführte Kommunikation auch
pragmatik- oder semantikbezogen, kurz auch semantisch genannt. Entsprechend
wird unter einer erfindungsgemäß auf semantische Inhalte bezogenen
Kommunikation in natürlichen Sprachen L allgemein eine der Übermittlung vor
allem auch pragmatischer Sachverhalte dienende Sprachkommunikation verstanden.
Bei dieser Definition wird berücksichtigt, daß durch einen, einem Text T
zugeordneten, semantischen Inhalt je nach Situation auch unterschiedliche,
nachfolgend auch als Wk bezeichnete, pragmatische Sachverhalte angezeigt werden
können, wobei eine solche, im folgenden unter dem Begriff Kontext
zusammengefaßte, Situation beispielsweise durch objektiv vorliegende Tatbestände,
aber auch durch angrenzenden Texten T zuzuordnende Inhalte wie auch durch
subjektive Vorstellungen der Partner Pa usw. mitbestimmt sein kann. Allgemein
schließen die Sachverhalte Wk auch objektive, im Regelfall eindeutige, Tatbestände
ein, die einer weiteren sachlichen Verendung zuführbar sind, welche beispielsweise
auch eine Kombination mit weiteren Tatbeständen, etwa zur Auslösung,
Abänderung, Beendigung oder Kontrolle bestimmter Vorgänge, vorsieht.
Zur Abgrenzung von den erfindungsgemäß zu benutzenden Begriffen werden die
für Schriftsprachen L intuitiv, vielfach auch willkürlich als Wörter festgelegte,
durch Abstände von weiteren solchen Wörtern gekennzeichnete, Begriffe, wie sie
auch für die Beschreibung mündlicher Sprachen L übernommen wurden, streng als
natürliche Wörter oder auch Schriftwörter bezeichnet, entsprechend der Aufführung
bestimmter Flexionsformen hiervon in Lexika auch als lexikalische Wörter.
Entsprechend werden weitere in Sprachbeschreibungen benutzter Einheiten wie
Sätze, Fragen, Befehle, Ausrufe wie auch zu deren Aufbau benutzte Einheiten wie
Zeichen, Buchstaben, Interpunktionen, Silben, Laute usw. natürliche Sätze usw.,
natürliche Zeichen usw. genannt, wobei Regeln der Schreibweise beziehungsweise
der unter Prosodie //12// zusammengefaßten Aussprache zu beachten sind. Wie
unten ausgeführt, unterscheiden sich die erfindungsgemäß zu verwendenden
Symbole Gs im Regelfall von den gebräuchlichen, hier auch unter der Bezeichnung
natürliche Symbole zusammengefaßten, natürlichen Wörtern, Zeichen usw.
Sprachen L, deren Texten T eindimensional aneinandergereihte Symbole einer
festgelegten Art wie Wörter oder Zeichen oder Ideogramme usw. zuzuordnen sind,
werden als seriell bezeichnet. Wo nicht anders angegeben, erfolgt die
Erfindungsbeschreibung ohne Einschränkung der Allgemeingültigkeit am Beispiel
solcher serieller Sprachen L; eine Anwendung auch auf mehrdimensional,
beispielsweise zweidimensional-bildhaft angeordnete Symbolkomplexe ist
grundsätzlich ebenfalls vorgesehen. Beispielsweise werden mündliche oder
handschriftliche Texte T auch durch bestimmte Merkmale H(T) wie auch zugleich
anfallende Repertoires R(H(T)) hiervon, welche auch als entsprechend
mehrdimensionale Merkmalsvektoren bezeichnet werden, charakterisiert.
Bestimmte Kombinationen von Texten T und Inhalten A werden allgemein als
Nachrichten TA bezeichnet. Die Kombination eines Textes mit einem
grammatischen Inhalt A = B wird entsprechend als grammatische Nachricht TB
notiert, die Kombination mit einem semantischen Inhalt C als semantische
Nachricht TC. Die in natürlichen Sprachen L üblicherweise anzutreffenden
Kombinationen von semantischen Inhalten C mit jeweils einer grammatische
Nachricht TB werden ebenfalls semantische Nachrichten genannt, notiert als TBC,
kurz auch ebenfalls als TC. Erfindungsgemäß ist vorgesehen, semantische Inhalte C
und pragmatische Sachverhalte Wk als Kombinationen weiterer pragmatischer
Begriffe K mit Eigenschaften H(K) zu beschreiben, welche nachfolgend als
Sachbegriffe K, kurz ebenfalls als Sachen K bezeichnet werden.
Verfahren der erfindungsgemäßen Art sind auch dadurch näher gekennzeichnet, daß
sie nach //2//, S. 217f. als Voraussetzung für die Realisierung technischer
Vorrichtungen für eine Mensch-Maschine-Kommunikation in natürlichen Sprachen
L anzusehen sind, wie sie unter Funktions- und Gerätebezeichnungen wie
automatische Übersetzung, akustisches Verstehen von Sprache oder auch hörende
Schreibmaschine, elektronische Auskunftei und allgemein intelligente Maschinen
und sprachkundige Roboter diskutiert wurden.
Wie auch den in //2// und //4// gegebenen Schilderungen des gegenwärtigen Standes
von für den technischen Einsatz konzipierten Kommunikationsanlagen zu
entnehmen ist, liegen brauchbare Realisierungen der dazu benötigten Funktionen
und Vorrichtungen und entsprechend vorauszusetzenden Verfahren der
erfindungsgemäßen Art bisher nicht vor. Ungelöste Fragen werden insbesondere
einigen unter Mehrdeutigkeit, Vagheit und Kontextabhängigkeit zusammenfaßbaren
Problemkreisen natürlicher Sprachen //12// zugeordnet. Beispielsweise wird ein als
Symbol verstandenes lexikalisches Wort insbesondere bei mündlichem oder
handschriftlichem Vortrag häufig durch eine große Vielfalt von Sprachsignalen,
also Texten T, repräsentiert, so daß umgekehrt einer etwa durch die
Buchstabenfolge /tas/ angenäherten Lautfolge T verschiedene schriftdeutsche
Wörter wie /das/ oder /daß/ oder auch Teile von Wörtern wie /Tasse/ oder /Taste/
usw. zuordenbar werden. Des weiteren symbolisiert, abhängig von einem durch
weitere Wörter einer Äußerung oder auch eine Situation bestimmten Kontext, ein
identifiziertes Schriftwort häufig auch unterschiedliche grammatische wie auch
semantische Inhalte; letzteres auch dann, wenn dafür eine eindeutige grammatische
Funktion identifiziert wurde. So kann das englische Wort /like/ als Verb oder
Konjunktion mit entsprechend unterschiedlichen semantischen Inhalten fungieren,
das grammatisch eindeutig beispielsweise als Substantiv Nominativ Singular
identifizierte schriftdeutsche Wort /Ton/ semantisch ein Mineral, einen
Musikeindruck oder, wie im Text /Ton läuft./, eine Mikrophonanlage
symbolisieren, wobei, wie oben definiert, ein gegebenenfalls zu beachtender
Kontext nicht nur durch die weiteren natürlichen Wörter der betreffenden Äußerung
Tp, sondern auch durch den Inhalt vorangegangener oder auch nachfolgender
Äußerungen, die Vorstellungen der Kommunikationspartner Pa, ihre Situationen
usw. mitbestimmt sein kann. So könnte ein Autor At mit dem Schriftwort /groß/
einen oft nur vage festgelegten räumlichen Ausdehnungsbereich, einen durch
besondere Leistungen hervorgetretenen Angehörigen einer Berufsgruppe oder je
nach Situation ironisch auch das Gegenteil hiervon ansprechen. Mißverständnisse
können so auch daraus resultieren, daß die Partner Pa bei der Formulierung und
Interpretation von Texten T von unterschiedlichen Kontexten ausgehen, wobei
Menschen auf eine allerdings nicht näher spezifizierte Weise häufig intuitiv richtig
zu entscheiden vermögen, welche Kontextualisierung //12// bei einer Äußerung Tp
zweckmäßig vorgenommen werden sollte. Von den Partnern Pa wird hierbei
verlangt, einen Kommunikationsinhalt aus einer definitionsgemäß unbegrenzten
Vielfalt von Symbolkomplexen sowie zusätzlich auch von Kontexten zu
erschließen.
Bei Schrifttexten T werden dabei auch den für die Zeichensetzung //12// benutzten
nichtalphabetischen Interpunktionszeichen sowohl grammatische als auch
semantische Funktionen, also Inhalte, zugeordnet, ohne daß klargestellt wurde, ob
diese Zeichen als den lexikalischen Wörtern gleichgestellte Symbole oder als,
diesen zuzuordnende, Teile hiervon zu behandeln seien, welche Inhalte ihnen
zukommen und wie diese mit weiteren Inhalten zu kombinieren wären. Angesichts
der angetroffenen Vielfalt und Vieldeutigkeit der in bisherigen
Sprachbeschreibungen berücksichtigten Begriffe blieb unklar, durch welche Art von
Symbolen und Begriffen die Bedeutungen //12// von Texten T wie auch von
Kontexten zweckmäßig auszudrücken, welche Eigenschaften solchen Symbolen
zuzuordnen, nach welchen Regeln vorliegende Texte und Textabschnitte T mit
ihnen in Bezug zu setzen und auf sie aufzuteilen seien und auf welche Weise man
die Bedeutungen von Symbolkomplexen aus den Bedeutungsmöglichkeiten der
Einzelsymbole kombinieren und den Einfluß weiterer Kontextdaten dabei
berücksichtigen könnte. Angesichts dieser Problemvielfalt hat gemäß //3//, S. 411
niemand auch nur in Umrissen eine befriedigende und umfassende Semantiktheorie
angeboten. Dabei blieb offen, aus welchen Grundbausteinen, mit welchen
Wechselbeziehungen, ein Verfahren der erfindungsgemäßen Art überhaupt
aufgebaut werden könnte.
Zwar ist bekannt, daß Menschen nach ihrem gemäß //1//, S. 227f intuitiv
ablaufenden Erstsprachenerwerb in der Regel zu einer, ebenfalls intuitiv
ablaufenden, Beherrschung der angeführten und weiterer in Sprachen L
anzutreffender Einzelprobleme fähig sind, doch können sie gemäß //1//, S. 16 u.
S. 47f. weder angeben, wie ihr Spracherwerb stattfindet noch welche Daten, Begriffe
und Regeln sie sich dabei aneignen und bei der Kommunikation einsetzen, so daß
auch eine Realisierung eines Verfahrens der erfindungsgemäßen Art durch die
wünschenswerte Übertragung menschlicher Fähigkeiten auf die Arbeitsprinzipien
von Maschinen, wie sie etwa für mathematische Problemlösungen demonstriert
wurde, bei Sprachproblemen bisher nicht möglich war.
Wie auch in //1//, S. 128f. betont, konnte insbesondere auch die Frage nach der
Bedeutung von Sprache bisher nicht zufriedenstellend beantwortet werden, wobei
sogar bezweifelt wird, ob Sprache eine Brücke zwischen Laut und Bedeutung
schlage und Bedeutung überhaupt durch Begriffe beschreibbar sei. Auch
vorgeschlagene formale, nach den Prinzipien der Logik entwickelte
Semantiktheorien, welche Kriterien wie den "Wahrheitswert" //12// von Sätzen
berücksichtigen, werden nach //1//, S. 164 für unbrauchbar erachtet. So scheint nach
//2//, S. 239 das erwähnte Problem der Mehrdeutigkeiten eine so hohe
Differenzierung der einzusetzenden Symbole zu fordern, daß eine rechnerisch
beherrschbare Bearbeitung für nicht mehr möglich gehalten wird. Hierbei stellt sich
im einzelnen das Problem von mit der Zahl der Symbole exponentiell
anwachsenden kombinatorischen Explosionen der zu berücksichtigen Daten, wie sie
sowohl bei der Beschreibung der Symbole einschließlich ihrer vielfältigen
wechselseitigen Bezugsmöglichkeiten wie auch der in entsprechender Vielfalt
abzuarbeitenden Entscheidungsbäume für ihre Zuordnung zu gegebenen Texten T
und zueinander anfallen. Des weiteren erscheint der nach //3//, S. 413 als "Bezug"
bezeichnete Zusammenhang zwischen Textformen T und hierdurch bezeichneten,
auch "Relata" genannten, Gegenständen oder Inhalten für eine rechnergestützte
Behandlung nicht konkret genug formuliert. Aus den in //1//, S. 219 geäußerten
Zweifeln an der Verwendbarkeit von Begriffen läßt sich auch folgern, daß die
gemäß //3//, S. 411 festzustellende Unbrauchbarkeit angebotener Semantiksysteme
auch daran liegt, daß bisher nicht geklärt wurde, aus welchen Komponenten mit
welchen Eigenschaften, und auf welche Art, die durch Texte T wie auch durch die
zu berücksichtigenden Kontextsituationen angesprochenen semantischen Inhalte
wie auch die damit zu verbindenden pragmatischen Sachverhalte zusammensetzbar
sein könnten. So war es nach //12// oder auch //3//, S. 138 bisher auch nicht möglich,
eine als Voraussetzung für Verfahren der erfindungsgemäßen Art zu klärende
methodologische Abgrenzung zwischen Inhalten grammatischer und semantischer
Art mit den jeweils entsprechend zuzuordnenden Symbolen anzugeben. Geht man
nach //3//, S. 170f. davon aus, daß den, allerdings nur für Schriftsprachen
festgelegten, lexikalischen Wörtern die Rolle der genannten gewohnheitsmäßig
benutzten Symbole zuzuschreiben sei, so fehlen gemäß //2//, S. 227 bisher Kriterien,
nach denen sie befriedigend klassifiziert werden können. Beispielsweise halten auch
weitere, rein formal zu verstehende Kriterien wie "Wohlgeformtheit" oder
"Formalität" nach //1//, S. 47 der Kritik nicht stand. Auch wurden für die als
bedeutsam erachteten hierarchischen Beziehungen oder Dependenzen //12//
zwischen vorgeschlagenen Kategorien natürlicher Wörter nach //2//, S. 233 und
S. 238 widersprüchliche Vorstellungen entwickelt. So erwiesen sich herkömmliche
Sprachbegriffe wie beispielsweise Verb, Tempus, Person, Prädikat usw. wie auch
zusätzlich vorgeschlagene Konstituenten wie Verbalphrase, Nominalphrase usw.
//12// für die Entwicklung von Kommunikationsverfahren und
-systemen als nicht ausreichend streng definiert, wobei beispielsweise auch die
Verwendung diskontinuierlicher, also in Texten T durch Textabschnitte T anderer
Symbole unterbrochener Symbole für unzulässig erklärt wurde //12//.
Vorgeschlagene, auch als kontextfrei //12// bezeichnete Phrasenstruktur-
Grammatiksysteme //12// ließen es auch nicht zu, den Einfluß von beispielsweise
durch vorangegangene Äußerungen Tp gegebenen Kontexten bei der
Bedeutungsanalyse von Texten T ausreichend zu berücksichtigen //13//.
Als besonders schwierig erwies sich nach //12// allgemein die Grenzziehung
zwischen der semantischen, als "kontextinvariant" verstandenen Bedeutung einer
sprachlichen Äußerung und dem hierdurch im jeweiligen Einzelfall gemeinten,
häufig für eine eindeutige weitere Verwendung vorgesehenen pragmatischen
Sachverhalt, da dieser nämlich meist von der jeweils spezifischen, oben unter
Kontext zusammengefaßten Verwendungssituation abhängt. Ohne eine solche
Grenzziehung ist jedoch die sprachliche Übermittlung von, auf die jeweilige
Situation bezogenen, pragmatisch eindeutigen Sachverhalten Wk, die einer weiteren
sachlichen Verwendung zugeführt werden können, nicht möglich.
Für versuchsweise als Sprachsymbole benutzte Begriffe konnte, auch wegen der
angeführten Probleme und Defizite, des weiteren auch kein ausreichender
Zusammenhang angegeben werden zwischen der Frage, welche Information Texte
T bezüglich durch sie gegebenenfalls angezeigter Inhalte grammatischer und
semantischer Art liefern und der Informationstheorie, wie sie beispielsweise in //5//,
S. 87f. ansatzweise formuliert wurde. So wird nach heutigem Sprachgebrauch unter
Information häufig der übermittelte Sachverhalt selbst und nicht eine bestimmte
quantitative Eigenschaft einer solchen Übermittlung verstanden. Beispielsweise
wurde etwa in //6// bestritten, daß eine natürliche Sprache überhaupt Information
übermittle; sie rufe vielmehr nur eine - nicht näher spezifizierte - Interaktion
zwischen dem Gesagten und dem Hörer hervor. Weiterhin wurde an bisher
vorgeschlagenen Symbolen einerseits kritisiert, daß sie sich nicht auf empirisch
erfaßbare Merkmale zurückführen lassen //7//, S. 559, während andererseits ihre
Autoren sich nach //1//, S. 16 nicht als Empiristen verstehen wollen und die
Notwendigkeit einer solchen Beobachtbarkeit sogar bestreiten //8//, S. 124. Da
jedoch grundsätzlich davon auszugehen ist, daß technische Verfahren ganz
allgemein konkret beobachtbare Ergebnisse zu liefern haben, welche aus dem
Zusammenwirken von Gegenständen resultieren, deren Eigenschaften ebenfalls
prinzipiell mit einer in der Technik üblichen Genauigkeit und Widerspruchsfreiheit
der Beobachtung zugänglich sein müssen, ist entsprechend auch für Verfahren der
erfindungsgemäßen Art neben der grundsätzlich gegebenen Beobachtbarkeit
erzeugter Texte T auch eine solche für die dadurch übermittelten Symbole und
hieraus zusammengesetzten Inhalte, gegebenenfalls auch für dadurch ausgelöste
Aktionen, zu fordern. Geht man ferner davon aus, daß solche Verfahren neben der
Übertragung von Texten T auch der Übermittlung von Information über solche
Symbole und Inhalte zu dienen haben, so können bisher vorgeschlagene Methoden
mit Defiziten auf den Gebieten Beobachtbarkeit und Informationszuordnung
grundsätzlich nicht als Lösungswege geeignet sein.
In Anbetracht der angetroffenen Probleme bei der Festlegung von zur Beschreibung
von Texten T geeigneten Sprachbegriffen und -kategorien, welche auch in der
Unbrauchbarkeit von nach solchen Prinzipien versuchsweise entwickelten
technischen Vorrichtungen ihren Niederschlag fanden //4//, //9//, wurden unter
bewußt in Kauf genommenem Verzicht auf ein "Verstehen" von Bedeutungen auch
rein statistische Sprachmodelle eingesetzt, welche auf den für Schriftsprachen
festgelegten lexikalischen Wörtern und den als "hidden Markov-probabilities"
bezeichneten, durch jeweils vorangehende Wörter bedingten Häufigkeiten ihrer
Aufeinanderfolge beruhen, wobei bis zu 3 jeweils aufeinanderfolgende Wörter,
auch Trigramme genannt, berücksichtigt werden konnten //10//. Einer Erweiterung
dieser Zahl steht das genannte Problem der kombinatorischen Explosion der zu
beachtenden Daten entgegen, da beispielsweise bei einem Repertoire von 20.000
Wörtern bereits mehr als eine Billion Trigramme vorkommen können //10//. Dabei
ist aber bei Wortfolgen wie /Was er gestern gesagt hat, stimmt./ für das
Vorkommen des letzten Wortes erst dann eine verwertbare, vom Durchschnitt für
beliebige Wörter abweichende Häufigkeit zu erwarten, wenn auch das 5.
vorausgehende Wort mit eingeschlossen wird, so daß auch Hexagramme und je
nach Text T auch noch weit umfangreichere Komplexe zu berücksichtigen wären.
Auf solchen verfügbaren Sprachmodellen beruhende Verfahren sind so auch bei der
notwendigen Beschränkung auf wenige 1.000 Wörter je nach angestrebter Funktion
noch mit unbefriedigenden Fehlerraten von ca. 15% bis 30% behaftet //11//.
Entsprechend den geschilderten, für den gegenwärtigen Stand charakteristischen
ungelösten Problemen befassen sich bekannt gewordene Erfindungen mit einigen
untergeordneten Teilaspekten von natürlichsprachlichen
Kommunikationsprozessen. So beziehen sich die unter DE 30 42 408 C2,
DE 31 42 540 C2, DE 35 03 233 C2, DE 36 15 972 A1, DE 36 16 011 A1, DE 30 32 664 C2
und DE 31 51 106 A1 angegebenen Verfahren beziehungsweise Vorrichtungen auf
Fragestellungen elektronisch bedienbarer Lexika, die einem als Übersetzer tätigen
Menschen zu gegebenen, von ihm bereits vom restlichen vorliegenden Text T
abgeteilten und korrekt auch bezüglich zuzuordnenden grammatischer Kategorien
identifizierten natürlichen Wörtern beziehungsweise Phonemen einer
Ausgangssprache L einige Wörter beziehungsweise Phoneme einer Zielsprache L'
anbieten, jedoch weiter die Intelligenz und das Sprachwissen von Menschen
voraussetzen, um aus einem fortlaufenden Fluß akustischer beziehungsweise
schriftlicher Textsignale überhaupt die Wörter oder auch Phoneme beziehungsweise
Morpheme der Ausgangssprache L zu identifizieren und das Problem der vom
jeweiligen Textzusammenhang abhängigen Mehrdeutigkeit zu lösen. Ein in
DE 41 35 261 C1 vorgelegtes "Übersetzungssystem" dient der Reduzierung der
Datenmenge, die für die lexikalische Zuordnung von fremdsprachlichen Wörtern zu
identifizierten zusammengesetzten Wörtern, also Komposita, der Ausgangssprache
benötigt wird. In dem in DE 43 11 211 A1 für Übersetzungsarbeiten vorgeschlagenen
Textanalysesystem soll speziell auch berücksichtigt werden, daß deutschen Verben
verschiedene, entsprechend unterschiedlich zu übersetzende Formen von
Dativobjekten zuordenbar sind. DE 42 32 482 A1 schlägt vor, Übersetzungen unter
Zwischenschaltung einer künstlichen Standardsprache durchzuführen, ohne
Lösungen für das Problem von Mehrdeutigkeiten in den Ausgangs- und
Zielsprachen anzugeben. Verfahren zu der dort als "Spracherkennung"
bezeichneten Aufgabe, wie sie in DE 32 11 313 C2, DE 37 33 391 C2 und
DE 35 14 286 A1 beschrieben werden, bieten ebenfalls keine brauchbare Antwort auf
die Frage an, welche der alternativ möglichen Zuordnungen von natürlichen
Wörtern sowie Inhalten grammatischer oder auch semantischer Art je nach
Textzusammenhang zu bevorzugen und welche pragmatischen Sachverhalte damit
je nach Situation zu verknüpfen sind.
Der Erfindung liegt die Aufgabe zugrunde, ein Verfahren der eingangs genannten
Art für eine gemäß vorliegenden Vorgaben in einer oder auch mehreren natürlichen
Sprachen, also auch mehrsprachig, zu führende Kommunikation anzugeben, welche
mit, in den hierfür vorgesehenen Medien abzufassenden beziehungsweise
aufzunehmenden, Texten durchgeführt wird, die so mit semantischen Inhalten in
Bezug gesetzt werden, daß damit eine Übermittlung pragmatischer, also auch für
weitere sachliche Verwendungen geeigneter, Sachverhalte, auch unter
Berücksichtigung des jeweiligen Kontextes, einschließlich einer solche
Sachverhalte erhaltenden Übertragung in Texte weiterer natürlicher Sprachen, auch
vom Mündlichen ins Schriftliche und umgekehrt, möglich wird, wobei in solchen
Fällen, wo vorgegebene Daten oder auch ungenau oder fehlerhaft abgefaßte Texte
keine ausreichend sicheren und eindeutigen Text-Inhalts-Zuordnungen zulassen,
entsprechende Kennzeichnungen wie gegebenenfalls auch Text- beziehungsweise
auch Inhaltskorrekturen möglich werden, und eine Einrichtung zur
rechnergestützten Durchführung des Verfahrens zu beschreiben, so daß beim
gegenwärtigen Stand angetroffene Probleme lösbar und maschinelle Vorrichtungen
möglich werden, welche bisher bei der natürlichsprachigen Kommunikation von
Menschen wahrgenommene Funktionen der angeführten Art übernehmen und somit
eine solche Kommunikation zwischen Mensch und Maschine sowie zwischen
Maschinen möglich machen.
Diese Aufgabe wird durch die in Anspruch 1 aufgezeigten, in Unteransprüchen
weiter ausgeführten Maßnahmen, in einer Ausgestaltung auch unter Einsatz der in
Anspruch 25 beschriebenen Einrichtung, im Rahmen eines als Mp bezeichneten
Verfahrens gelöst. Verfahren Mp sieht vor, die Kommunikation in natürlichen
Sprachen L zwischen Kommunikationspartnern Pa unter Beachtung vorliegender,
von Nutzern des Verfahrens, gegebenenfalls auch Partnern Pa eingebrachter,
Vorgaben Vr unter Bezug auf semantische Inhalte F durchzuführen, durch welche
als Komplexe Kp = KK von Sachbegriffen K gebildete pragmatische Sachverhalte
Wk übermittelt werden. Diese Kommunikation wird mittels, von Autoren At aus
Sprachsignalen der für die betreffenden natürlichen Sprachen L vorgesehenen
Medien zu bildenden und auszugebenden und von deren Empfängern Hr
auszuwertenden, Texten T durchgeführt, welche durch Zuordnung grammatischer
Inhalte N unter Beachtung der Wahrscheinlichkeiten p(TN) zu grammatischen
Nachrichten TN ergänzt werden, welche weiterhin durch Zuordnung semantischer
Inhalte F unter Beachtung der Wahrscheinlichkeiten p(TNF) zu semantischen
Nachrichten TNF ergänzt werden, wobei zu übermittelnde pragmatische
Sachverhalte Wk = Wk2 durch Abänderung von, von den Kommunikationspartnern
Pa vorausgesetzten, pragmatischen Sachverhalten Wk = Wk1 gemäß den
semantischen Inhalten F dieser semantischen Nachrichten TNF erzeugt werden.
Diese semantischen Nachrichten (TNF) werden als Komplexe Kp = EmEm unter
Beachtung der, gegebenenfalls durch vorliegende Daten D wie auch weitere
Komponenten Em bedingten, Wahrscheinlichkeiten p(Em) aus Komponenten Em
zusammengefügt, welche durch Daten Wp beschriebene Sachbegriffe K und, in
Anpassung an die natürlichen Sprachen L festgelegte, Symbole Gs einschließen.
Diese umfassen jeweils zu einer disjunkten Klasse K1 = Vt von Textabschnitten T = Ts
superierte Textsymbole Vt = (Ts), deren Texte Ts jeweils bezüglich bestimmter,
durch Toleranzen dH näher definierter Texteigenschaften H(T) übereinstimmen,
sowie hieraus zu disjunkten Klassen K1 = Gr superierte grammatische Symbole
Gr = (Vt), die jeweils ein Repertoire R(Pr) von, durch Wahrscheinlichkeiten p näher
bestimmten, Möglichkeiten der ihnen in grammatischen Nachrichten TN
zuzuweisenden Anordnungen Pr vorgeben, welche ihnen und den ihnen jeweils
zugeordneten Textsymbolen Vt a Gr einen Rang Ra und eine oder mehrere
Positionen P zuweisen, welche die diesen Textsymbolen Vt zugeordneten
Textabschnitte Ts a Vt in Texten T einnehmen. Diesen Textsymbolen Gt ist jeweils
eine disjunkte Klasse K1 = (Fp) von, die Möglichkeiten ihrer Anordnungen Pr
berücksichtigenden, semantischen Hinweisen Fp zugeordnet, die jeweils einen
Sachbegriff K und ein Repertoire R(K1) von disjunkten Klassen K1 = (q) von
Verwendungshinweisen q für dessen unter Beachtung der Anordnung Pr
vorzunehmende Zuordnung zu semantischen Inhalten F von semantischen
Nachrichten TNF einschließlich seiner Verknüpfung mit Sachbegriffen K weiterer
in der betreffenden semantischen Nachricht vorliegender Textsymbole Vt sowie mit
Sachbegriffen K eines jeweils vorausgesetzten pragmatischen Sachverhalts Wk1
einschließlich dessen Abänderung zu einem Sachverhalt Wk2 umfassen. Hierbei
werden durch solche Texte T zu übermittelnde pragmatische Sachverhalte Wk2
unter Beachtung vorliegender Daten D einschließlich der Vorgaben Vr jeweils
dadurch erzeugt, daß ein oder mehrere hierdurch angezeigte grammatische Symbole
Gr und eine Permutation von diesen zugeordneten Textsymbolen Vt unter
Beachtung der Anordnungen Pr zu einem grammatischen Inhalt N zusammengefügt
werden, der durch einen, aus einer Permutation von diesen Symbolen Vt
zugeordneten, an durch diese Anordnungen Pr gegebenen Positionen P,
gegebenenfalls auch diskontinuierlich, angeordneten, Textabschnitten Ts
zusammengefügten Text T zu einer grammatischen Nachricht TNF ergänzt wird,
und daß weiterhin die Sachbegriffe K einer Permutation von diesen Textsymbolen
Vt zugeordneten semantischen Hinweisen Fp gemäß einer Permutation von diesen
Hinweisen Fp zugeordneten Verwendungshinweisen q unter Beachtung der durch
einen vorausgesetzten pragmatischen Sachverhalt Wk1 gegebenen
Wahrscheinlichkeiten p(K)1 wie auch weiterer, in den Daten Wp vorliegender,
Wahrscheinlichkeiten p(Em) ein, als Komplex Kp = KK dieser Sachbegriffe K mit
Wahrscheinlichkeiten p(K)2 zusammengefügter semantischer Inhalt F gebildet
wird, durch den diese grammatische Nachricht TN unter Beachtung der
Wahrscheinlichkeit p(TNF) zu einer semantischen Nachricht TNF ergänzt wird und
der vorausgesetzte pragmatische Sachverhalt Wk1 in den zu übermittelnden
pragmatischen Sachverhalt Wk2 abgeändert wird, welcher als aus der, bis dahin
geführten, Kommunikation resultierender Sachverhalt Wk2 einer den Vorgaben Vr
entsprechenden weiteren Verendung zuzuführen ist.
Verfahren Mp sieht vor, Sachbegriffe K zu verwenden, die jeweils als eine, auch als
Repertoire R(A) bezeichnete, Menge K = R(A) eines oder, im Regelfall, mehrerer
weiterer Begriffe A beschreibbar sind. Komplexe Kp = BB von Begriffen B werden
allgemein dadurch definiert, daß sie jeweils einen oder, im Regelfall, mehrere
Begriffe B enthalten, wobei im letzteren Fall bestimmte Bezüge zwischen
mindestens 2, gegebenenfalls aber auch mehreren oder auch sämtlichen dieser
Begriffe B a Kp bestehen. Bei den genannten pragmatischen Sachverhalten Wk, die
als Komplexe Wk = Kp = KK von Sachbegriffen K gebildet werden, gelten
entsprechend ihrer Definition als Mengen K = R(A) zwischen ihnen Bezüge, wie sie
allgemein für die Verknüpfungen von Mengen Verwendung finden und unten bei
der detaillierten Beschreibung der Verknüpfungshinweise q im einzelnen ausgeführt
sind. Wie oben notiert, wird die Zugehörigkeit eines Begriffes A zu einer Menge B
und so auch zu einem Repertoire R(A) einer Klasse K1(A) oder einem Komplex
Kp(A) allgemein durch A a B, A a R(A), usw. gekennzeichnet. In verschiedenen
Ausgestaltungen sieht die Erfindung vor, für die einzusetzenden natürlichen
Sprachen L jeweils neben dem genannten Repertoire R(Vt) von Textsymbolen Vt
auch weitere Repertoires R(Gt) weiterer Textsymbole Gt zu verwenden, deren
Texte T a Gt ebenfalls jeweils durch ein Repertoire R(H(T)) bestimmter
Textmerkmale H(T) gekennzeichnet sind. Nachfolgend werden allgemein die
Textsymbole Vt, mit Vt a Gt, ebenfalls den als Gt bezeichneten Textsymbolen Gt
zugerechnet und auch als solche bezeichnet.
Die Erfindung sieht vor, bei einem Kommunikationsakt die Möglichkeit des
Vorliegens einer disjunkten Klasse K1 = (Wk1x) von möglichen pragmatischen
Sachverhalten Wk1x = Wk11, Wk12 usw. zuzulassen, von denen gemäß der
vorgesehenen Beachtung der Wahrscheinlichkeiten p(TNF) bevorzugt ein
Sachverhalt Wk1x = Wk11 vorausgesetzt wird, mit dem sich unter Beachtung der
Daten Wp ein semantischer Inhalt F ergibt, der dieser Nachricht TN mit der
höchsten, einen Schwellwert ps nicht unterschreitenden Wahrscheinlichkeit p(TNF)
zuordenbar ist. Erfindungsgemäß wird hierbei berücksichtigt, daß die
Kommunikationspartner entsprechend den Möglichkeiten unterschiedlichen
Wissens und unterschiedlicher Meinungen auch von unterschiedlichen
Sachverhalten Wk1x ausgehen können. Soweit möglich, wird bei der
Kommunikation ein dem Partner Pa zuzuordnenden Sachverhalt Wk1x
vorausgesetzt. Die jeweils für die Kommunikation vorausgesetzte Klasse K1 = (Wk1x)
von Sachverhalten Wk1x wird dem Kontext des jeweiligen
Kommunikationsaktes zugerechnet.
Ein resultierender pragmatischer Sachverhalt Wk2, vereinfachend ausgedrückt auch
der von Wk1 abweichende Teil von Wk2 wie auch der dafür verantwortliche
semantische Inhalt F, wird auch als Botschaft einer vorliegenden grammatischen
Nachricht TN wie auch des ihr zugehörigen Textes T in der betreffenden
Kontextsituation bezeichnet. Die Kombination NF von grammatischen und
semantischen Inhalten N und F einer Nachricht TNF wird auch als Inhalt NF des
betreffenden Textes T bezeichnet.
Zu einem grammatischen Begriff Gr werden in einer bevorzugten Ausbildung
solche Textsymbole Vt superiert, für deren, auch durch die unten angeführten
Transformationen Qs nachweisbare, Verknüpfbarkeit in Anordnungen Pr
beziehungsweise auch Nicht-Verknüpfbarkeit mit weiteren Symbolen Vt in einer
semantischen Nachricht TNF, gegebenenfalls auch durch das Vorliegen weiterer
Symbole Vt bedingte, Wahrscheinlichkeiten p(Vt) gelten, die innerhalb
vorgegebener Toleranzen dp übereinstimmen, wobei in einer bevorzugten
Ausbildung die Toleranzen dp den Kapazitäten der verfügbaren Vorrichtungen und
den zu leistenden Kommunikationsakten angepaßt werden. Abweichend von
bekannten Transformationsgrammatiken //12//, generativen Grammatiken und
Semantiken //12// sowie Konstituentenstrukturgrammatiken //12// wie auch
Unifikationsgrammatiken //12// einschließlich der darin verwendeten, auch als
"Generalized Phrase Structure Grammar" //12// oder auch "Lexical Functional
Grammar" //12// bezeichneten Darstellungen funktionaler einschließlich
syntaktischer Zusammenhänge in natürlichen Sprachen L werden im
erfindungsgemäßen Verfahren Mp entsprechend den Transformationen Qs durch
Texte wie auch Textkomplexe T repräsentierte Textsymbole Vt verwendet, die
gegebenenfalls auch nur Teile lexikalischer Wörter oder, gegebenenfalls auch
diskontinuierlich angeordnete, Komplexe Kp mehrerer lexikalischer Wörter
umfassen, welche bei Schriftsprachen L auch Satzzeichen, Abstände wie auch unten
definierte Operatoren o zur Modifizierung zugeordneter Textabschnitte T mit
einschließen und sich so von den in den zitierten Grammatiken //12// verwendeten
Phrasen //12//, wie sie in //12//, S. 816f. oder auch in //1//, S. 116f. diskutiert werden,
unterscheiden. Dies hat zur Folge, daß die Symbole Vt zu einer vergleichsweise
geringen Anzahl von grammatischen Symbolen Gr zusammenfaßbar werden,
wodurch es möglich wird, die Zuordenbarkeit der Symbole Vt zu semantischen
Nachrichten TNF mit einer vorteilhaft geringen, den Symbolen Gr zugeordneten
Menge von Daten zu beschreiben. Dabei unterscheidet sich auch der unten näher
definierte Rang Ra von den für bekannte Dependenzgrammatiken //12//
eingeführten, beispielsweise durch Ersatzproben //12// näher bestimmten
Abhängigkeitsrelationen zwischen den hierfür wie auch die oben zitierten
Grammatiken //12// als Konstituenten von natürlichen Sätzen angenommenen
Begriffen.
Die angeführten Abhängigkeiten der erfindungsgemäß zu berücksichtigenden,
allgemein als p(A) notierten Wahrscheinlichkeiten bestimmter Größen A von
weiteren Größen wie B oder B und C oder B, C und D usw. werden durch bedingte
Wahrscheinlichkeiten der Form p(A/B), p(A/B; C), p(A/B; C; D) usw. ausgedrückt.
Entsprechend werden die unter Beachtung eines pragmatischen Sachverhalts Wk1
zu berücksichtigenden Wahrscheinlichkeiten p(TNF) semantischer Nachrichten
TNF streng auch als p(TNF; Wk1) notiert. Bei der Ergänzung eines gegebenen
Textes T zu einer grammatischen Nachricht TN ist dabei neben dem genannten
Wert p(TN) auch eine bedingte Wahrscheinlichkeit p(N/T) zu beachten, für deren
Ergänzung zu einer semantischen Nachricht TNF neben p(TNF) auch der bedingte
Wert p(F/TN), streng auch p(F/TN; Wk1), benötigt wird. Wie unten weiter
ausgeführt, sind allgemein bei der Bildung von Größen A aufgrund von mit
Sicherheit, also p(D) = 1, vorliegenden Daten D bedingte Wahrscheinlichkeiten
p(A/D) zu beachten.
Die bei der Zuordnung semantischer Inhalte F zu Texten T von grammatischen
Nachrichten TN vorgesehene Beachtung bedingter Wahrscheinlichkeiten p(F/TN;
Wk1) hat vorteilhaft zur Folge, daß für die im jeweiligen Zusammenhang
vorzuziehenden, durch Sachbegriffe K mit Wahrscheinlichkeiten p(K) näher
bestimmten Bedeutungen von Symbolen Vt sowohl Kontexte berücksichtigt
werden, wie sie durch den, durch die grammatische Nachricht TN bestimmten,
Textzusammenhang gegeben sind, als auch Kontexte, wie sie durch die, die
jeweiligen Situationen wie auch vorangegangene Äußerungen Tp wiedergebenden,
Sachverhalte Wk1 beschrieben werden, Aus der vorgesehenen Benutzung
quantitativer Wahrscheinlichkeitsdaten p folgt vorteilhaft weiterhin, daß ein als
Kommunikationsergebnis zu bevorzugender Sachverhalt Wk2 häufig auch in für
natürliche Sprachen L charakteristischen vieldeutigen Kommunikationssituationen
zu erzielen ist, die jeweils sowohl durch das Vorliegen eines mehrdeutigen Textes
T, dem sowohl disjunkt mehrere grammatische Inhalte N als auch semantische
Inhalte F und dementsprechende disjunkte Repertoires R von Nachrichten TN und
TNF zuordenbar sind, als auch durch das Vorliegen mehrdeutiger, durch ein
disjunktes Repertoire R(Wk1x) von Sachverhalten Wk1x beschriebener Situationen
gekennzeichnet sein können.
Abweichend von bisher beispielsweise in //1// und //13// beschriebenen
Semantikmodellen wird hierbei das Ergebnis eines Kommunikationsaktes nicht auf
einen bereits kontextbezogenen semantischen oder pragmatischen Inhalt einer
Äußerung Tp beschränkt, wie er erfindungsgemäß durch den semantischen Inhalt F
einer Nachricht TNF eines Textes T gegeben ist; vielmehr wird ein im Regelfall
wesentlich umfangreicherer, als Komplex Kp einer wesentlich größeren Anzahl von
Sachbegriffen K gebildeter Sachverhalt Wk2 als Kommunikationsergebnis Wk2
eingesetzt, bei dem sich im Regelfall nicht nur die durch Wahrscheinlichkeiten und
Wahrscheinlichkeitsbeziehungen p(K1) näher bestimmten Eigenschaften H(K1) der
im Inhalt F vertretenen Sachbegriffe K = K1, sondern gegebenenfalls auch die
Eigenschaften H(K2) weiterer, mit diesen durch weitere
Wahrscheinlichkeitsbeziehungen p(K2) verknüpfter Sachbegriffe K2 von den in
Sachverhalt Wk1 vorausgesetzten Eigenschaften H(K1) und H(K2) unterscheiden.
Aus der erfindungsgemäß vorgesehenen Verwendung eines solchen entsprechend
umfangreichen Kommunikationsergebnisses Wk2 als ein einer gegebenenfalls
nachfolgenden Äußerung Tp wiederum vorauszusetzender Sachverhalt Wk1 folgt
weiterhin vorteilhaft, daß diese stets in einem Kontext beurteilt wird, in welchem
die Botschaften F vorangegangener Äußerungen Tp angemessen berücksichtigt
werden.
Wie auch aus den unten angeführten Ausführungsformen und einer der Vielfalt
sprachlicher Ausdrucksmöglichkeiten angepaßten Anzahl von Textbeispielen T
hervorgeht, wird durch die vorgesehene Verwendung von Sprachsymbolen Vt mit
kontextunabhängig formulierten und so auf beliebige Kontexte anwendbaren und
diese entsprechend berücksichtigenden Eigenschaften, welche im einzelnen durch
bestimmte Zuordnungen jeweils eines, durch ein zugeordnetes grammatisches
Symbol Gr gegebenen, Repertoires R(Pr) von Möglichkeiten ihrer grammatischen
Anordnungen Pr, eine disjunkte Klasse K1 von Textabschnitten Ts und eine
entsprechend semantisch mehrdeutige Klasse K1 von semantischen Hinweisen Fp
gekennzeichnet sind, die durch Wahrscheinlichkeiten und
Wahrscheinlichkeitsbeziehungen p(K) näher bestimmte Sachbegriffe K wie auch,
auch Verknüpfungshinweise oder -parameter genannte, Verwendungshinweise q
hierfür umfassen, vorteilhaft auch die folgende bei Kommunikationsakten
anfallende Teilaufgabe lösbar: Einem Textabschnitt T = Ts, der, wie bei natürlichen
sprachen L üblich, etwa in einer lexikalischen Auflistung für sich allein stehend als
semantisch, gegebenenfalls zusätzlich auch als grammatisch, mehrdeutig gilt, läßt
sich in einer Äußerung Tp aufgrund der vorgesehenen Berücksichtigung von,
gegebenenfalls auch mehreren disjunkt anzunehmenden, Kontexten, wie sie durch
weitere, für sich allein ebenfalls semantisch mehrdeutige Textabschnitte T dieser
Äußerung Tp sowie durch, gegebenenfalls auch mehrere disjunkte, Sachverhalte
Wk1x, welche von anzutreffenden Situationen wie gegebenenfalls auch
vorangegangenen Äußerungen Tp abhängen, gegeben sind, ein mit einem
quantifizierbaren Maß an Sicherheit, bei Anwendung der unten beschriebenen
nichtlinearen Operationen Bb häufig auch eindeutig, identifizierbarer Anteil an
einem aus dem betreffenden Kommunikationsakt resultierenden, im Regelfall
ebenfalls eindeutig zu bevorzugenden Sachverhalt Wk2 zuordnen, wie es von
Menschen aufgrund ihres, weitgehend intuitiven, Umgangs mit den Eigenschaften
von Sprachen L und Kontexten erwartet wird. Dabei bietet die erfindungsgemäße
Verwendung von Symbolen Vt, die sowohl grammatisch bezüglich ihrer
Verknüpfungsmöglichkeiten Pr als auch semantisch bezüglich ihnen zuzuordnenden
Sachbegriffe K sowie hierfür geltender Verwendungshinweise q mehrdeutig sind,
den Vorteil, daß durch die Kommunikation eine sehr große Vielfalt auch
umfangreicher Sachverhalte Wk2 durch ein begrenztes, der Speicher- und
Verarbeitungskapazität verfügbarer Vorrichtungen anpaßbares, entsprechend der
oben angeführten Sprachdefinition auch als Vokabular zu bezeichnendes,
Repertoire R(Vt) von Symbolen Vt ausdrückbar und mittels Texten T mitteilbar
wird. Abweichend von der in bisherigen Sprachsystemen den darin verwendeten
lexikalischen Wörtern jeweils zugeordneten lexikalischen Bedeutung //12//
umfassen die erfindungsgemäßen Symbole Vt neben jeweils einer als Klasse von
Elementen //12//, S. 449 einzusetzenden Klasse K1 = (K) von Sachbegriffen K
zusätzlich auch jeweils auf diese anzuwendende disjunkte Klassen K1 = (q) von
Verwendungshinweisen q.
Zur weiteren Erfindungsbeschreibung wird die folgende, teilweise bereits oben
benutzte Symbolik verwendet: Eine beliebige Menge von Größen A wird als
Repertoire R(A) bezeichnet, eine solche Größe A auch als ein Element A = E1
hiervon. Ein Repertoire R von Größen A mit zugeordneten Wahrscheinlichkeiten
p(A) wird auch Feld R(A)genannt. Nachgestellte Kleinbuchstaben u. v, w, x, y und
z werden für laufende Indizes reserviert entsprechend Ax = A1, A2 usw., Axy =
A11, A12, . . . A21 usw., wobei im Interesse der Eindeutigkeit Indizes wie in
Ax.y = A1.12 auch durch Punkte separiert werden, hier also mit x = 1 und y = 12. Die
Beziehung B a A klassifiziert B als Untermenge von A. Eine Menge von
entsprechend der Bezeichnung B1 o B2 o B3 o . . . alternativ zu verwendenden
Größen Bx a A gilt als disjunktes Repertoire R(Bx) oder auch als disjunkte Klasse
K1 = A = (Bx) ihrer Elemente E1 = Bx. Eine Zusammenfügung von Komponenten
Em = Bx, bei der es auch auf deren wechselseitige Zuordnungen ankommt, wird als
Komplex Kp = A = BxBx bezeichnet, notiert auch als Bx, Bx, wobei
Zusammenstellungen von Komponenten Bx, die teilweise oder in Spezialfällen
auch sämtlich in Form ungeordneter Repertoires wie auch Felder R(Bx) vorliegen,
ebenfalls als Komplexe Kp definiert werden, wie es auch für die als Komplexe
Wk = KK definierten Sachverhalte Wk vorgesehen ist. Im einzelnen werden auch die
Notationen K1(Bx) = (Bx) und Kp(Bx) = BxBx verwendet. Die Definition von im
Regelfall durch mehrere Größen repräsentierten Repertoires oder Feldern R,
Massen K1 oder Komplexen Kp schließt die Zugehörigkeit von gegebenenfalls nur
einer oder auch gar keiner Größe zu diesen Mengen nicht aus. Durch nE wird das
Nicht-Vorliegen, die Nicht-Verwendung oder auch die unten näher definierte
Negation eines Begriffes B angezeigt. Die Zeichen +, - und = werden in der
konventionellen Bedeutung eingesetzt, Multiplikationen werden durch B1 × B2,
Divisionen durch B1/B2 angezeigt; Schrägstriche dienen zusätzlich auch der
genannten, jeweils aus dem Zusammenhang ersichtlichen Kennzeichnung von
bedingten Wahrscheinlichkeiten p sowie von Textbeispielen t. Ein vollständiges
Repertoire R(Bxy) von jeweils einer Einheit Bxy a Ax einer disjunkten Klasse Kl = Ax
aus einem Repertoire R(Ax) solcher Klassen Ax wird als Permutation
bezeichnet. Durch A1 ne A2 wird die Ungleichheit der Mengen oder auch Größen
A1 und A2 angezeigt. Als weitere Bezugssymbole werden ue in der Bedeutung
"ungefähr gleich", g ("größer als"), gg ("viel größer als"), k ("kleiner"), kk ("viel
kleiner"), ge ("größer oder gleich"), ke ("kleiner oder gleich") und nne ("nicht
notwendig gleich) verwendet. Die Positionen P seriell angeordneter Komponenten
Em in Komplexen Kp = EmEm werden entsprechend ihrer Reihenfolge Em1 vor
Em2 auch explizit gemäß P = Em1 : Em2 notiert, wobei, wie beispielsweise auch bei
der Anordnung von diskontinuierlichen Textabschnitten Ts in Texten T, nicht
ausgeschlossen wird, daß weitere Komponenten Emx wie auch Teile hiervon
dazwischen liegen. Entsprechend wird gemäß der Notierung P(a) auch ein
möglicher Abstandsbereich a zwischen Em1 und Em2 angezeigt.
Wie oben ausgeführt, sieht das erfindungsgemäße Verfahren Mp vor, die
Kommunikation unter Verwendung von, als Mengen von beliebig einander
zugeordneten, Gegenständen A gebildeten, nachfolgend kurz auch Sachen
genannten, Sachbegriffen K durchzuführen, welche entsprechend auch als Sachen
K = R(A) oder auch als Komplexe K = Kp mit Komponenten Em = A notiert werden.
Die unter Beachtung der Anordnungen Pr der grammatischen Symbole Gr
vorzunehmende Verwendung von Sachen K a Fp a Vt in den semantischen Inhalten
F, insbesondere auch Verknüpfungen mit weiteren Sachen K, werden gemäß
Verwendungshinweisen q a Fp a Vt a Gr vorgenommen, deren genannte Anpassung
an die betreffende Sprache L vorzugsweise auf eine Weise erfolgt, wie sie durch die
unten beschriebenen, an Texten T dieser Sprache L durchzuführenden
Transformationen Qs bestimmt ist. Entsprechend werden Hinweise q berücksichtigt,
von denen q = d eine Durchschnittsbildung, notiert auch als K2 d K1 oder auch K2
d1 K1, und q = s die Vereinigung gemäß K2 s1 K1 zweier Sachen oder auch
Sachkomplexe K2 und K1 fordert, wobei gleiche Indizierungen jeweils anzeigen,
daß, wie hier, q1 und K1 dem gleichen semantischen Hinweis Fp1 angehören.
Weiter wird durch q = m die Entfernung einer Sache K4 aus einer Obermenge K3
gemäß K3 m4 K4 und durch q = f das Ersetzen einer Sache K5 durch eine Negation
K6 = nK5 hiervon gemäß K5 f6 K6 angezeigt, welche gemäß K5a K9 und K6a K9
durch eine weitere Sache K9 näher zu definieren ist. Hinweis q = c sieht allgemein
das Ersetzen eines Sachbegriffs K7 oder auch Sachkomplexes K7 durch eine Sache
beziehungsweise einen Sachkomplex K8 gemäß K7 c8 K8 vor. Parameter q = c
schließt das Ersetzen einer Eigenschaft H(Kx)1 wie beispielsweise einer
Wahrscheinlichkeit p(Kx)1 durch eine hiervon abweichende Eigenschaft H(Kx)2
wie einer Wahrscheinlichkeit p(Kx)2 der betreffenden Sache Kx ein. Weiterhin
wird mit q = k gemäß einer Notierung K9 k K10 durch K10 a Fp10 und die
zugehörige Sache K10 a Fp10 das Ersetzen der Sache K9 durch eine Komplement-
Menge von K9, bezogen auf eine Obermenge K11 = K9 s K10 mit K9 d K10 = 0,
gefordert. Durch q = o wird, mit K14 = K12 o K13, die Bildung einer Sache K14
angezeigt, der die einander ausschließenden Teile der Mengen K12 und K13
angehören. In Anpassung an die betreffenden Sprachen L werden gegebenenfalls
auch weitere Verwendungshinweise q eingesetzt. Beispielsweise wird durch q = o
mit K15 = K12 o K13 o . . . auch die Bildung eines disjunkten Repertoires R = K15
zweier oder mehrerer alternativ geltender Sachen K12 oder K13 usw. angezeigt.
Die erfindungsgemäß vorgesehene Abwandlung eines pragmatischen Sachverhalts
Wk1 entsprechend den in einem gebildeten semantischen Inhalt F resultierenden
Wahrscheinlichkeiten p(Kx) der Sachen Kx a F in einen Sachverhalt Wk2 wird so
unter Verwendung von q = c auch als Wk2 = Wk1 c F notiert. Die Abwandlung
eines Inhalts Wk1 gemäß einem aus einer einzigen Sache K1 = F1 bestehenden
Inhalt F, wie sie beispielsweise einem unten definierten Kopf-Symbol Vt1 mit K1 a
Fp1 a Vt1 zugeordnet ist, wird entsprechend als Wk2 = Wk1 c Kx mit Kx = K1
notiert. Enthält beispielsweise Wk1 hierbei neben weiteren Sachen Kx eine Sache
K1 mit p(K1) = p1 und eine weitere Sache K2 mit p(K2) = p2 = 1-p(K1), und
folgt aus einer semantischen Nachricht T1N1F1 gemäß F1 für die Sache K1 eine
Wahrscheinlichkeit p(K1) = p3 mit p3 ne p1, so ergibt sich ein Sachverhalt Wk2, in
dem nicht nur K1 eine Wahrscheinlichkeit p(K1) = p3, sondern auch Sache K2 eine
Wahrscheinlichkeit p(K2) = p4 mit p4 = 1-p3 erhält. Führt Inhalt F 1
beispielsweise zu p3 = 1, so hat dies wegen p(K2) = 0 ein Verschwinden der Sache
K2 im Kommunikationsergebnis Wk2 zur Folge.
Gemäß der oben angefuhrten Bezeichnung wird durch q = o die Festlegung von
Sachbegriffen Kx gemäß K2 o K1 o . . . als disjunkte Mengen K1, K2 usw. eines
entsprechend disjunkten Repertoires R(Kx) angezeigt.
Durch die angeführte Zuordnung eines Repertoires R(K1(q)) von einer oder
mehreren Klassen K1(q) von Verknüpfungsparametern q zu einem semantischen
Hinweis Fp = Fp1 mit Fp1 q Vt1 a Gr1 wird berücksichtigt, daß Gr1 in Inhalten N
mehreren Anordnungen Pr1, Pr2 usw. mit mehreren weiteren grammatischen
Symbolen Gr2, Gr3 usw. verbunden sein kann, wobei entsprechend eine Sache K1 a
Fp1 mit mehreren weiteren Sachen K2 a Gr2, K3 a Gr3 usw. zu verknüpfen ist.
Durch die angeführte Zuordnung einer disjunkten Klasse K1 = (Fp) von
semantischen Hinweisen Fp, die sich nicht nur durch die Sachen K a Fp, sondern
bei gleicher Sache K auch durch die Verwendungshinweise q a Fp unterscheiden
können, wird berücksichtigt, daß bei einer solchen Zuordnung Pr1 eines Symbols
Gr2 zu Gr1 entsprechend unterschiedliche Verknüpfungen q der Permutationen von
Sachen K1yz a Vt1y a Gr und K2yz a Vt2y a Gr2 möglich sind, wobei, wie unten
an Beispielen erläutert, beispielsweise (q = d) o (q = s) gilt.
Für das erfindungsgemäße Verfahren Mp werden als Vorgaben Vr Hinweise wie
auch Vorschriften von Nutzern des Verfahrens und daraus abgeleitete Daten
berücksichtigt. Diese umfassen allgemein Angaben darüber, welche Anteile der
Kommunikation zu übernehmen und welche Hinweise hierbei gegebenenfalls zu
beachten sind. Hierzu gehören beispielsweise Anweisungen, als Autor At einem
Partner Pa bestimmte Sachverhalte Wk durch entsprechenden Nachrichten TNF
zugeordnete ausgehende Texte T mitzuteilen, als Hörer Hr einlaufenden Texten T
Nachrichten TNF und Sachverhalte Wk2 zuzuordnen und diese gegebenenfalls
einer weiteren Verwendung zuzuführen, einlaufende Texte T zu korrigieren, zu
übersetzen, bestimmte Sprachen L zu verwenden, Botschaften F einlaufender Texte
zu beurteilen, zu bestätigen, zu hinterfragen oder zu kommentieren, Fragen zu
beantworten usw. Weiter umfassen die Vorgaben Vr beispielsweise Angaben
darüber, welche oder auch welche Anteile vorliegender Sachverhalten Wk1
zugrunde zu legen sind, ob und wie weit einlaufenden Texten T zugeordnete
Sachverhalte Wk2 als weitere Vorgaben Vr zu akzeptieren sind, ob und wie weit,
beispielsweise auch abhängig von resultierenden Wahrscheinlichkeiten p,
Äußerungen Tp eines Autors At zugeordnete resultierende Sachverhalte Wk2 zu
übernehmen wie auch als Sachverhalte Wk1 einer nachfolgend herauszugebenden
Äußerung Tp zugrunde zu legen sind, festzustellen, ob Autor At und Hörer Hr von
unterschiedlichen Sachverhalten Wk1 ausgehen, dem Gesprächspartner Pa
zugeordnete Sachverhalte Wk1 wie auch Wk2 darauf zu überprüfen, ob sie
plausibel sind oder Irrtümer oder Unwahrheiten usw. enthalten, sie gegebenenfalls
abzustreiten oder auch zu korrigieren, sowie Hinweise, welche
Kommunikationsergebnisse Wk2, beispielsweise auch abhängig von resultierenden
Wahrscheinlichkeiten p(K)2 oder auch Änderungen p(K)2 - p(K)1 hiervon, den
Nutzern mitzuteilen oder in Aktionen umzusetzen sind usw. Hierbei wird durch die
Vorgaben Vr auch festgelegt, ob und auch welche Weise vorliegende Daten D, wie
sie beispielsweise in Form elektrischer, akustischer, optischer oder mechanischer
Daten anfallen, in den Sachverhalten Wk zu berücksichtigen sind.
Gegebenenfalls wird durch entsprechende Vorgaben Vr auch gefordert, davon
auszugehen, daß Kommunikationspartner Pa bei der Zuordnung von semantischen
Inhalten TNF zu, von ihnen als Autoren At verfaßten, ausgehenden Äußerungen Tp
oder zu, von ihnen als Hörer Hr empfangenen, einlaufenden Texten T pragmatische
Begriffe K zugrunde legen, deren Wahrscheinlichkeiten p(K) für ihre Zuordnung zu
Symbolen Vt oder auch weiteren Sachen K, beispielsweise in Sachverhalten Wk,
von als objektiv bekannten Werten in subjektiver oder auch fehlerhafter Weise
abweichen, wobei solche Abweichmöglichkeiten, beispielsweise durch
Voraussetzung entsprechender Klassen K1 = (Wk1x) von Sachverhalten Wk1x oder
auch entsprechend abgewandelter Daten Wp in der Kommunikation berücksichtigt
werden.
Unter einer Wahrscheinlichkeit p(A) wird erfindungsgemäß allgemein sowohl die
relative Häufigkeit verstanden, mit der ein Ereignis oder Gegenstand A in einer
Vielzahl von Fällen anzutreffen war, als auch der Erwartungswert für einen zu
behandelnden Einzelfall. Durch p(A) werden allgemein auch
Wahrscheinlichkeitsbeziehungen zu weiteren Größen B wie beispielsweise bedingte
Wahrscheinlichkeiten p(A/B) angezeigt. Solche Abhängigkeiten einer
Wahrscheinlichkeit p(K1) einer Sache K = K1 von weiteren Sachen K2, K3 usw.
wie auch von weiteren Begriffen wie Symbolen Vt usw. werden in entsprechend
expliziter Notierung als bedingte Wahrscheinlichkeiten 2. Ordnung O(2) gemäß
p(K1/K2) oder 3. Ordnung O(3) gemäß p(K1/K2; K3) oder höherer Ordnung O(n)
in Komplexen KK, Sachverhalten Wk und Inhalten F berücksichtigt, wobei auch
Einflußfaktoren wie beispielsweise eine Anordnung Pr durch Notierungen wie
p(K1/Vt1; Pr) usw. angezeigt werden. Als weitere, vereinfachend ebenfalls als
Wahrscheinlichkeiten p(K1) bezeichnete Wahrscheinlichkeitsbeziehungen werden
auch durch Algorithmen wie beispielsweise p(K1) = a-p(K2) usw. oder auch aus
Mengenansätzen wie Vereinigung, Durchschnitt, Zugehörigkeit, Komplement usw.
resultierende Bezüge berücksichtigt. Entsprechend obiger Definition werden unter
Wahrscheinlichkeiten p(K1) erster wie auch höherer Ordnung O(n) allgemein auch
Wahrscheinlichkeiten p dafür verstanden, daß eine Sache K1 in einer Äußerung Tp
zu erwarten ist, wodurch also streng jeweils eine, zur Vereinfachung der
Beschreibung nicht eigens notierte, bedingte Wahrscheinlichkeit p(K1/Tp),
p(K1/K2; Tp) usw. dafür angezeigt wird, daß Sache K1, wie gegebenenfalls aus
einem Korpus vorangegangener Äußerungen Tp ableitbar, in einer beliebigen
weiteren Äußerung Tp zu erwarten ist. In einer Ausbildung der Erfindung werden
diese bedingten Wahrscheinlichkeiten gemäß p(K1/Tps) auch auf eine, auf die
Länge des Textes T normierte, Standardäußerung Tp = Tps bezogen. Gemäß der
Beziehung p(A1) × p(A2/A1) = p(A2) × p(A1/A2) wird vorausgesetzt, daß mit
angegebenen bedingten Wahrscheinlichkeiten p(A2/A1) auch die invertierten Werte
p(A1/A2) bekannt sind; entsprechendes gilt für Werte höherer Ordnung. In weiteren
Ausbildungen werden bei Wahrscheinlichkeitsangaben p auch, beispielsweise durch
Standardabweichungen ausgedrückte, Unsicherheiten dp berücksichtigt
beziehungsweise vorausgesetzt. Durch die genannten Wahrscheinlichkeiten p(K)
wird das Vorkommen der, allgemein durch weitere Daten A näher definierten,
Sachen K einschließlich ihrer Bezüge in Komplexen Kp = KK zu weiteren Sachen
K, wie sie in pragmatischen Sachverhalten Wk, Inhalten F wie auch als Komplexe
Kp weiterer Sachen K beschriebener Sachen K vorkommen, festgelegt, wobei
gemäß obiger Definition nicht ausgeschlossen wird, daß die vereinfachend als
Komplexe Kp bezeichneten Sachverhalte Wk oder auch Inhalte F neben Komplexen
KK einander zugeordneter Sachen K auch Felder R(K) ungeordneter Sachen K mit
Wahrscheinlichkeiten p(K) enthalten.
Die Erfindung sieht vor, für die Kommunikation vorzugsweise Sachverhalte Wk
mit Sachbegriffen K einzusetzen, deren Vorkommen und wechselseitige Bezüge
überwiegend durch Daten, insbesondere auch bedingte Wahrscheinlichkeiten p,
niedriger Ordnung O(n) beschrieben werden. In einer bevorzugten Ausgestaltung
werden überwiegend Daten der Ordnung O(1) und O(2) und nur in mit der Ordnung
O(n) stark abnehmendem Umfang auch Daten 3. und höherer Ordnung verwendet,
wodurch das Risiko eines mit der Anzahl der Sachen K stark überproportionalen
Anstiegs der für die Durchführung des Verfahrens Mp bereitzustellenden Daten
Wp, verbunden mit kombinatorischen Explosionen der bei ihrer Abarbeitung zu
berücksichtigenden Entscheidungsbäume, vermeidbar bleibt. In einer Ausbildung
hiervon wird ein Repertoire R(K) von Sachbegriffen K berücksichtigt, deren
wechselseitige Bezüge durch bedingte Wahrscheinlichkeiten p(K) beschrieben
werden, deren Ordnung O(n) einen vorgegebenen, der Leistungsfähigkeit
verfügbarer Vorrichtungen angepaßten Wert n = n1 nicht überschreitet. Dies wird,
im Einklang mit der unten beschriebenen nichtlinearen Informationsverarbeitung
Bb, auch dadurch erreicht, daß bedingte Wahrscheinlichkeiten p k ps unterhalb von
Schwellwerten ps, die in Anpassung an die Kapazität verfügbarer Rechner
festzulegen sind, vernachlässigt werden. Des weiteren wird dies durch bevorzugte
Verwendung von als orthogonal definierten Sachbegriffen K erreicht, welche
keinen oder einen vernachlässigbaren Einfluß auf den Zusammenhang zwischen
bereits definierten Sachen K haben. Beispielsweise werden so bei einer Sache K2,
deren Vorliegen mit einer bedingten Wahrscheinlichkeit p(K2/K1) von einer Sache
K1 abhängt, weitere Sachen K3 usw. so definiert, daß p(K2/K1; K3) = p(K2/K1)
gilt.
Die durch die genannten semantischen Hinweise Fp = Fp1 mit K1 a Fp1 und q1 a
Fp1 bei der Bildung der Inhalte F vorgesehene Verknüpfung von Sachen K1, K2
usw. gemäß K2 q1 K1 usw. sieht erfindungsgemäß eine Berücksichtigung der
hierfür resultierenden Wahrscheinlichkeiten p(K2/K1) entsprechend den Hinweisen
q = q1 usw. und den in den Daten Wp und Sachverhalten Wk vorliegenden
Wahrscheinlichkeiten p(K) vor. In Anpassung an die Gegebenheiten der Sprachen L
werden bestimmten Verknüpfungshinweisen q1 a Fp1 usw. gegebenenfalls auch
Faktoren qr zur, von der Art der Verknüpfung abhängigen, Abänderung
resultierender Werte p(K2/K1), beispielsweise zu ihrer Reduzierung um bestimmte,
dem Gebrauch der Sprachen L angepaßte, Faktoren qr k 1 zugeordnet. In einer
weiteren Ausgestaltung werden den Verwendungshinweisen q a Fp a Vt auch die
genannten Wahrscheinlichkeiten p(K/Vt) der Sachen K a Fp a Vt zugeordnet,
welche bei der Bestimmung der zu berücksichtigenden Wahrscheinlichkeiten
p(F/TN; Wk1) eingesetzt werden.
Die eingeführten Verknüpfungen einer Sache Kxyz a Fpxyz a Vtxy a Grx mit
weiteren solchen Sachen gemäß beispielsweise K211 q111 K111 werden unter
Beachtung der jeweiligen Indizes vereinfachend auch als Fp q Fp, Vt q Vt und Gr q
Gr notiert, worunter Verknüpfungen gemäß Permutationen von den Symbolen Gr
usw. als disjunkte Klassen K1 zugeordneten Hinweisen Fp a (Fp) a (Vt) a Gr zu
verstehen sind. Entsprechende Notationen gelten für die Abwandlungen Wk q F von
Sachverhalten Wk gemäß disjunkten Klassen K1 = (F) zugeordneten Inhalten F.
Für die Sachen K der erfindungsgemäß durch Nachrichten TNF abzuändernden
Sachverhalte Wk1 werden neben Daten, die von Nutzern vorzugeben sind, gemäß
Vorgaben Vr auch weitere, durch Kontexte gegebene Daten berücksichtigt, welche
bei einem oder mehreren Partnern Pa aus vorangegangenen Nachrichten TNF wie
gegebenenfalls auch aus den Situationen entsprechenden nicht-sprachlichen
Datenübermittlungen anfallen, wie sie beispielsweise durch den Status von
erfindungsgemäß kommunizierenden Vorrichtungen und weiteren hiermit
verbundenen Vorrichtungen wie beispielsweise Rechnern und weiteren elektrischen
wie auch mechanischen Geräten usw. vorgegeben werden. Da, wie angeführt,
Autoren At und Hörer Hr auch von unterschiedlichen Sachverhalten Wk1 ausgehen
können, wird nicht ausgeschlossen, daß sie auch voneinander abweichende
Sachverhalte Wk2 erzeugen, wobei jedoch entsprechend den von den Partnern Pa
erfindungsgemäß zu bildenden Nachrichten F häufig auch eine Reduzierung der
Unterschiede zwischen zwei resultierenden Sachverhalten Wk2 im Vergleich zu
den zwischen zwei Ausgangssachverhalten Wk1 anzutreffenden Unterschieden
erreicht wird. Die gemäß den Inhalten F und dem Verknüpfungsparameter q = c
vorzunehmenden Abänderungen an Ausgangssachverhalten Wk1 betreffen
insbesondere jeweils die Wahrscheinlichkeiten p(K1) usw. der dort vorliegenden
Sachen K1 usw. und schließen bei Wahrscheinlichkeitsbeziehungen p(K) höherer
Ordnung entsprechende Abänderungen von Wahrscheinlichkeiten p(K2) von mit
K1 usw. hierüber verknüpften Sachen K2 usw. mit ein. Abhängig von
resultierenden Werten wird beispielsweise bei resultierenden Werten p(K1) k ps
unterhalb festzulegender Schwellwerte ps eine Entfernung von Sachen K1 aus Wk1
vorgenommen. Bei entsprechenden resultierenden Werten p(K1) ist auch eine
Hinzufügung von mit K1 verknüpften, in Wk1 nicht vorliegenden Sachen K2
vorgesehen, wenn sich dadurch für diese gemäß den Daten Wp ausreichend hohe
Wahrscheinlichkeiten p(K2) ergeben. Entsprechend dieser Vorgehensweise ist auch
eine als Lernen bezeichnete Hinzufügung neuer Sachen K2 zu einem Sachverhalt
Wk1 wie auch zu den Daten Wp vorgesehen, wobei Sache K2 als Komplex Kp von
gemäß Sachverhalten Wk beziehungsweise Daten Wp vorliegenden Sachen K3
usw. gebildet wird, welche K2 mit ausreichend hohen Wahrscheinlichkeiten
p(K2/K3) usw. anzeigen. Hierbei werden gegebenenfalls benötigte weitere,
einschließlich grammatischer, Daten für die Verknüpfung vorliegender
beziehungsweise möglicher Textabschnitte Ts, Symbole Vt, Anordnungen Pr usw.
in einer bevorzugten Ausbildung auch unter Anwendung des unten beschriebenen
grammatischen Kommunikationsverfahrens M, bereitgestellt.
Aus der angeführten Definition von Wahrscheinlichkeiten p(K) auch 1. Ordnung
von Sachen K als gegebenenfalls auch durch die Meinung eines Partners Pa sowie
das erwartete Vorkommen in einer Äußerung Tp = Tps bedingte
Wahrscheinlichkeiten p folgt, daß auch in solchen Fällen, in denen eine Sache K1
durch die Botschaft F = K1 einer vorliegenden grammatischen Nachricht TN
eindeutig mit Wahrscheinlichkeit p(K1/TN) = 1 angesprochen wird, bei der
vorgesehenen Abänderung eines voraus 99999 00070 552 001000280000000200012000285919988800040 0002010015858 00004 99880gesetzten Sachverhalts Wk1, in dem K1
beispielsweise mit einer Wahrscheinlichkeit p(K1) kk 1 angeführt ist, in einen
resultierenden Sachverhalt Wk2 dieser Wert im Regelfall nicht auf p(K1) = 1 zu
erhöhen ist, sondern auf einen, gegebenenfalls aus einem Korpus C von Texten T
auch empirisch zu ermittelnden, Wert p(K1) k 1. Hierbei sind in Wk2 für nicht in
Botschaft F angesprochene, aber mit K1 durch Wahrscheinlichkeitsbeziehungen,
beispielsweise gemäß p(K1) + p(K2) = 1, verknüpfte Sachen K2 entsprechende
Abänderungen der Wahrscheinlichkeiten p(K2) vorzunehmen, wobei in diesem
Beispiel also p(K2) g o folgt. In einer vereinfachten Ausführungsform werden für
mit K1 durch Wahrscheinlichkeitsbeziehungen p verknüpfte Sachen K2, für welche
in Wk1 niedrige Werte p(K2) kk 1 vorliegen, unabhängig von dem durch Botschaft
F für K1 erzielten Wert p(K1) diese Werte p(K2) aufwandsparend unverändert für
Sachverhalt Wk2 beibehalten. Diese Vorgehensweise schließt jedoch insbesondere
bei objektiv nachprüfbaren Sachverhalten Wk nicht aus, daß in Fällen, wo
Sachverhalt Wk1 als Komplex KuKu einer überschaubaren Anzahl von einander
entsprechend streng zugeordneten Sachen Ku repräsentiert wird, in Wk2 für K1
auch Werte p(K1) = 1 und für die weiteren Sachen Ku Werte p(Ku/K1) usw.
entsprechend den gegebenen Wahrscheinlichkeitsbeziehungen p(K), bei obigem
Beispiel also auch Werte p(K2) = 1-p(K1) = 0 eingesetzt werden. Entsprechend
der erfindungsgemäß zu berücksichtigenden Möglichkeit, daß die Botschaft F1
einer Äußerung Tp1 eine Unwahrheit erhält, sieht Verfahren Mp vor, als
Ausgangssachverhalt Wk11 einer weiteren Äußerung Tp2 neben dem gemäß F1
von Tp1 abgeänderten Sachverhalt Wk2 disjunkt hierzu auch den ursprünglichen
Sachverhalt Wk1 als Kommunikationsergebnis der Äußerung Tp1 zu verwenden
und diesen gegebenenfalls als Ausgangssachverhalt Wk1 weiterer Äußerungen Tp2
vorauszusetzen.
Die Erfindung sieht allgemein vor, Daten Wp zu verwenden, deren Repertoire
R(Em) von Komponenten Em den abzudeckenden Kommunikationsakten und damit
anzusprechenden Inhalten angepaßt ist. In einer Ausbildung, die besonders für die
Übermittlung von Botschaften durch menschliche Autoren At an gemäß Verfahren
Mp als Hörer Hr fungierende Einrichtungen geeignet ist, welche diese Botschaften
erfindungsgemäß einer weiteren Verwendung durch weitere, ihnen als Nutzer
zugeordnete maschinelle Vorrichtungen zuführen, werden beispielsweise Daten Wp
benutzt, bei denen einem vergleichsweise umfangreichen, den Sprachgebrauch von
Menschen wiedergebendes Repertoire R(Vt) von Symbolen Vt und entsprechend
lexikalischen Wörtern ein beschränktes, den Aufgabenbereichen der zugeordneten
Nutzer angepaßtes Repertoire R(K) von Sachbegriffen K gegenübergestellt ist.
Dieses Repertoire R(K) wird zweckmäßig so einem solchen Aufgabenbereich
angepaßt, daß die darin vorkommenden Sachverhalte durch, gemäß Verfahren Mp
übermittelten Äußerungen Tp zuordenbare und als Kombinationen solcher Sachen
K gebildete, semantische Inhalte F und Sachverhalte Wk zu beschreiben sind. In
einer Ausbildung hiervon werden solche Sachverhalte Wk auch durch gemäß
Vorgaben Vr eindeutig kodierte Signale beispielsweise elektrischer oder auch
mechanischer Art dargestellt, welche gegebenenfalls auch geeignet sind, durch
Äußerungen Tp aufgetragene, dem betreffenden Sachgebiet zugeordnete
Operationen der Nutzer auszulösen. Beispielsweise werden so für die
Kommunikation mit gemäß Verfahren Mp als Hörer Hr fungierenden
Vorrichtungen, denen als Nutzer Elektronenrechner zugeordnet sind, die im
Regelfall durch eindeutig kodierte Kommandos entsprechender
Programmiersprachen in Operation gesetzt werden, durch solche Kommandos,
gegebenenfalls auch die damit verknüpften elektrischen, gegebenenfalls auch
elektromechanischen Signalfolgen objektiv definierte, Rechenoperationen als
Sachverhalte Wk eines entsprechenden Sachgebiets berücksichtigt. Für als Nutzer
eingesetzte Werkzeugmaschinen wird entsprechend ein an deren Leistungsspektrum
angepaßtes Repertoire beispielsweise elektromechanisch induzierter Befehle als
Sachgebiet festgelegt. In einer bevorzugten Ausbildung werden die als Hörer Hr
fungierenden erfindungsgemäßen Einrichtungen durch entsprechende Vorgaben Vr
veranlaßt, bei durch sie nicht mit ausreichender Sicherheit und Eindeutigkeit
zuordenbaren Sachverhalten Wk den Autor At auf die jeweilige, beispielsweise auf
ungeeignete Wortwahl oder sachliche Mehrdeutigkeiten oder Fehler
zurückzuführende Problematik aufmerksam zu machen. Diese Beschränkung eines
von einem maschinellen Hörer Hr zu berücksichtigenden Repertoires R(K) von
Sachbegriffen K auf den für den abzudeckenden Sachbereich erforderlichen
Umfang führt zu vorteilhaften Einsparungen bei den hierfür bereitzustellenden
Speicher- wie auch Verarbeitungskapazitäten.
Als Daten Wp, wie sie gemäß obigen Angaben beim erfindungsgemäßen
Kommunikationsverfahren Mp zu berücksichtigen sind, werden allgemein
Zusammenstellungen der zur Bildung der Nachrichtenkomplexe Kp = TNF zu
verwendenden Komponenten Em mit den hierbei zu berücksichtigenden
Eigenschaften H(Em) eingesetzt. Zu diesen Eigenschaften zählen insbesondere
auch, beispielsweise auch durch Wahrscheinlichkeitsbeziehungen ausgedrückte,
Bezüge zu weiteren Komponenten Em wie auch zu als Adressen Ad eingesetzten
vorliegenden Begriffen, welche neben Komponenten Em beispielsweise als Daten
D vorliegende Merkmale H(T) von Texten T mit einschließen. Bei den
Anordnungen der Komponenten Em werden, wie unten ausgeführt, auch
Ordnungsprinzipien wie Reihenfolgen oder auch komplexbildende
Zusammenhänge, wie sie etwa für Sachbegriffe K gelten, berücksichtigt.
Die erfindungsgemäß zu berücksichtigenden Wahrscheinlichkeiten p(A) von
Begriffen A werden auch durch Informationen j = log(1/p(A)) ausgedrückt, worin
log für den Logarithmus zur Basis 2 steht und j den Informationsbetrag in bit
angibt, der zum sicheren Wissen, mit p = 1, daß A vorliegt, noch fehlt, wobei
bedingte Wahrscheinlichkeiten p durch entsprechende bedingte Informationen j
angezeigt werden.
Die für Verfahren Mp vorgesehene Beachtung der Wahrscheinlichkeiten p(TNF)
der zu bildenden semantischen Nachrichten TNF wie auch p(Em) der hierfür zu
verwendenden Komponenten Em wie Sachbegriffe K und Symbole Vt und Gr,
welche gegebenenfalls auch durch weitere Komponenten Em wie auch vorliegende
Daten D bedingt sind, erfolgt in einer bevorzugten Ausgestaltung unter Anwendung
des bekannten, hier als Ba bezeichneten Bayesschen Ansatzes, wie er beispielsweise
in //9// erläutert wurde. Hierfür werden allgemein als mit Sicherheit vorliegende
Daten D vorausgesetzt, welche beispielsweise gegebene Vorgaben Vr, Texte T wie
auch Merkmale H(T) und Komplexe Kp hiervon einschließen und allgemein
mehrdeutig eine Zuordnung von Sprachinhalten wie Symbolen Vt und Gr wie auch
hieraus gebildeten Komplexen wie N, F, NF wie auch Komplexen Kp hiervon
erlauben. Hierbei werden Komponenten Em, welche allgemein durch Daten D
einschließlich vorliegender, als Adressen Ad eingesetzter weiterer Komponenten
Em wie auch Textmerkmale H(T) mehrdeutig, also mit Wahrscheinlichkeiten p k 1
als disjunkte Repertoires R(Em) angezeigt werden, zu Komplexen Kp = Ks eines
entsprechend disjunkten Repertoires R(Ks) zusammengefügt, welche jeweils
definitionsgemäß eine dieser Komponenten Em, gegebenenfalls auch neben
weiteren diesem Komplex Kp vorher bereits zugeordneten Komponenten Em
weiterer Repertoires R(Em) enthalten und als Konkurrenzhypothesen Ks bezeichnet
werden. Die vorausgesetzten Daten D werden auch als Evidenz D bezeichnet.
Entsprechend gelten bei einer als Evidenz D vorliegenden grammatischen Nachricht
TN entsprechend den durch deren Symbole Vt a Gr als Adressen Ad angezeigten
disjunkten Repertoires R(Fp) von semantischen Hinweisen Fp a Vt a TN sowohl
dieser TN disjunkt zuzuordnenden semantischen Inhalte Fx = F1, F2, . . . Fm wie
auch die bei deren Aufbau als Zwischenergebnisse anfallenden disjunkten
Komplexe Kp = KK von Sachbegriffen K als Konkurrenzhypothesen Ks. Wird
hierbei durch eine Evidenz D bei einem Komplexbildungsschritt eine Anzahl m von
Konkurrenzhypothesen Ksx = Ks1, Ks2, . . . Ksm mit ausreichend hohen
Wahrscheinlichkeiten p(Ksx/D) angezeigt, so gilt gemäß Ba für Ks1 eine
Wahrscheinlichkeit p(Ks1/D) = p(Ks1) × p(D/Ks1)/Ne, wobei der Nenner Ne für
die Wahrscheinlichkeitssumme Ne = (p(Ks1) × p(D/Ks1) + . . . + p(Ksm) × p(D/Ksm))
steht. Die Wahrscheinlichkeiten p der weiteren Hypothesen Ksx werden
durch entsprechende Permutationen des Zählers gemäß p(Ks2) × p(D/Ks2) usw.
angezeigt.
Bei der in einer bevorzugten Ausgestaltung vorgesehenen Anwendung des unten
erläuterten grammatischen Kommunikationsverfahrens M wird neben einem
vorliegenden Text T vereinfachend auch das disjunkte Repertoire R(N) der gemäß
M diesem Text T mit Wahrscheinlichkeiten p(N/T) zugeordneten grammatischen
Nachrichten N wie auch das entsprechende Repertoire R(S) von als Komplexe Kp = VtVt
von Symbolen Vt gebildeten, den Inhalten N zugeordneten Sätzen S a N als
Evidenz D eingesetzt. Im häufig anzutreffenden Fall grammatisch eindeutiger Texte
T gilt entsprechend der zugeordnete Inhalt N wie auch die entsprechende
grammatische Nachricht TN als Evidenz D. Erfindungsgemäß zeigt hierbei ein
Symbol Vt a Gr a N unter Berücksichtigung seiner Anordnung Pr als Adresse Ad
jeweils eine disjunkte Klasse (Fp) a Vt von semantischen Hinweisen Fp an, deren
Sachbegriffe K a Fp ein entsprechend disjunktes Repertoire R(Em) von jeweils für
eine Konkurrenzhypothese Ksx = Fx zu berücksichtigenden Komponenten Em
bilden. Im Fall grammatisch mehrdeutiger Texte T werden entsprechend den damit
zusätzlich disjunkt zu berücksichtigenden Symbolen Vt a Gr a N entsprechend
jeweils mehrere disjunkte Repertoires R(Em) vorgegeben. Beispiele für die
erfindungsgemäße Anwendung des Ansatzes Ba folgen unten.
In einer besonders für den die Rolle des Autors At abdeckenden Verfahrensteil von
Mp geeigneten Ausbildung wird als Evidenz D auch ein gegebener, durch einen
Text T a TNF zu übermittelnder Sachverhalt Wk2 eingesetzt, wobei entsprechend
gemäß Ansatz Ba zu bildende Wahrscheinlichkeiten p(T/Wk2; Wk1) hierfür
gegebenenfalls disjunkt geeigneter Texte T berücksichtigt werden.
Entsprechend den für die betreffenden Sprachen L an Korpussen C von Texten T
ermittelten Häufigkeiten p(Em) von Komponenten Em werden für die in Ansatz Ba
zu verwertenden Wahrscheinlichkeiten p(Em) auch Unsicherheiten dp
berücksichtigte, welche allgemein um so höher angesetzt werden, je höher der
jeweils kleinere der Werte p(Em) oder 1-p(Em) für diese Komponente Em
ausfällt.
In einer bevorzugten Ausgestaltung sieht die Erfindung vor, bei den
vorzunehmenden Bestimmungen von Wahrscheinlichkeiten p(Kp) der zu bildenden
Komplexe Kp = TNF nichtlineare Verarbeitungsoperationen Bb anzuwenden.
Hierbei werden bei den unter Beachtung ihrer Wahrscheinlichkeiten p(Em)
vorzunehmenden Verknüpfungen von, disjunkten Klassen K1 zu entnehmenden,
Komponenten Em a K1 zu Komplexen Kp = TNF die Wahrscheinlichkeiten p(Em)
der Komponenten Em wie auch p(Kp) der als Konkurrenzhypothesen Kp = Ks
behandelten Komplexe Kp nichtlinear abhängig von der Höhe der jeweils
vorliegenden beziehungsweise ermittelten Werte p(Em) und p(Kp) abgeändert,
wobei unter Beachtung der für disjunkte Repertoires R(Em) beziehungsweise R(Ks)
geltenden Wahrscheinlichkeitssummen Ca Wahrscheinlichkeiten p k pr unterhalb
festzulegender Referenzwerte pc, gegebenenfalls auch auf p = 0, abgesenkt und
Werte p ge pr, gegebenenfalls auch auf p = 1, erhöht werden. Verfahrensteil Bb
wird dementsprechend auch als nichtlineare Wahrscheinlichkeits-, Informations- wie
allgemein auch Datenverarbeitung Bb bezeichnet. In einer bevorzugten
Ausbildung werden nach dem Bayesschen Ansatz Ba ermittelte
Wahrscheinlichkeitswerte p(Ks) zugrunde gelegt.
In einer vorteilhaft einfachen Ausgestaltung Bbd sieht Verfahrensteil Bb vor,
Referenzwerte pr = ps in Relation zu bestimmten Wahrscheinlichkeitswerten p(Em)
und p(Ks) bestimmter Komponenten Em und Komplexe Ks der jeweiligen
Repertoires R(Em) beziehungsweise R(Ks) festzulegen und Komponenten Em und
Komplexe Ks mit Wahrscheinlichkeiten p k ps für die betreffende wie
gegebenenfalls auch mehrere weitere Komplexbildungsstufen wie gegebenenfalls
auch endgültig zu vernachlässigen. Verfahrensteil Bb bezieht sich insbesondere
auch auf Sachbegriffe K als Komponenten Em und hieraus aufgebaute Inhalte F als
Komplexe Kp = Ks, wobei nachfolgend vereinfachend auch die Komponenten Em a
R(Em) als Konkurrenzhypothesen Ks bezeichnet werden.
Bei der nichtlinearen Datenverarbeitung Bb wird allgemein berücksichtigt, daß für
die gegebenen disjunkten Repertoires R(Ksx) von Konkurrenzhypothesen Ksx
jeweils eine Wahrscheinlichkeitssumme Ca = p(Ks1) + p(Ks2) + . . . gilt, wobei im
Regelfall Ca = 1 anzusetzen ist, allerdings andere Fälle mit Ca k 1 ebenfalls in
solchen Fällen möglich sind, wo ein Repertoires R(Ksx) auch durch keine der
vorgeschlagenen Hypothesen Ksx als Komplex Kp vertreten sein kann oder davon
auszugehen ist, daß neben den angeführten Hypothesen Ksx a R(Ksx) diesem
Repertoire R noch weitere, jedoch nicht explizit bekannte Hypothesen Ks
angehören können.
In der Ausgestaltung Bbd von Bb wird für ein Repertoire R(Ks1y) von Hypothesen
Ks1y ein Schwellwert ps1 = b1 × p(Ks11) mit b1 k1 festgelegt, wobei Ks11 die
Hypothese mit der höchsten Wahrscheinlichkeit p(Ks11) dieses Repertoires R
repräsentiert, und es werden sämtliche Hypothesen Ks1y mit Wahrscheinlichkeiten
p(Ks1y) k ps1 für bestimmte weiterführende Komplexbildungsschritte oder auch
endgültig vernachlässigt. In einer bevorzugten Ausbildung hiervon wird b1 um so
höher gewählt, je niedriger die verfügbare Arbeitskapazität oder auch Arbeitszeit
der verfügbaren Vorrichtungen anzusetzen ist. Als Folge hiervon werden
aufwandsparend nur solche, mindestens aber eine Konkurrenzhypothese Ks1y
berücksichtigt, für deren Vorkommen eine so als ausreichend gering definierte
Informationsmenge j k js1, mit js1 = log(1/ps1), fehlt.
In einer bevorzugten Ausbildung werden, hier mit Ksxy = Emxy, wegen einer zu
geringen, gegebenenfalls auch durch bereits in einen Komplex Kp eingefügte
weitere Komponenten Emxy bedingten, Zuordnungswahrscheinlichkeit p(Em1y) k
ps1 für die betreffende Komplexbildung Kp zunächst vernachlässigte Komponenten
Em1y a R(Em1y) gespeichert und nachfolgend doch wieder für die
Komplexbildung Kp berücksichtigt, falls sich bei weiterführenden
Komplexbildungsschritten mit Komponenten weiterer Repertoires R(Em2y),
R(Em3y) usw. in Relation zu einem absolut festgelegten Schwellwert psa1 k ps1 als
zu gering erachtete Zuordnungswahrscheinlichkeiten p(Em2y) k psa1 usw. ergeben.
In einer weiteren Ausgestaltung werden Daten Wp verwendet, in denen
Wahrscheinlichkeitsbezüge p(Em2/Em1) unterhalb festzulegender Schwellwerte
ps1, ps2 usw. vernachlässigt werden, wobei in einer Ausbildung hiervon auch
Datenblöcke Wpx a Wp mit stufenweise abgesenkten Schwellwerten ps und
entsprechend stufenweise ansteigenden Datenmengen verwendet werden und in
dieser Reihenfolge umfangreichere Blöcke Wp2 zu Komplexbildungen Kp
herangezogen werden, falls sich mit vorangehend berücksichtigten Blöcken Wp1
keine befriedigenden Lösungen ergaben.
Gemäß einer weiteren Ausgestaltung Bbr der nichtlinearen Datenverarbeitung Bb,
welche insbesondere bei der Komplexbildung von Sachbegriffen K = K1y als
Komponenten Em zu semantischen Inhalten F Anwendung findet, wird für ein
disjunktes Repertoire R(K1y) ein Schwellwert ps3 = b3 × p(K11) mit b3 g 1 und
(1-ps3) kk 1 festgelegt, wobei ps3 so gewählt wird, daß mindestens eine Sache K11
aa R(K1y) mit einer Wahrscheinlichkeit ps1 k p(K11) k ps3 vorliegt, und es werden
sämtliche Sachen K1y a R(K1y) mit p(K1y) g ps3, wieder für bestimmte
Komplexbildungsstufen oder endgültig, vernachlässigt. Als Folge hiervon wird die
Abfassung von semantischen Inhalten F a TNF, die weitgehend redundante
Komplexbildungen, insbesondere von Sachen K, enthalten, durch einen Autor At
wie auch die Interpretation einlaufender Texte T als solche von einem Autor At
unwahrscheinlich redundant abgefaßte Nachrichten TNF durch einen Hörer Hr
zugunsten informationsreicherer Nachrichten TNF vermieden. Die gemäß den
Ausbildungen Bbd und Bbr vorgenommene nichtlineare Datenverarbeitung Bb sieht
also allgemein vor, sowohl Nachrichten TNF mit sehr unwahrscheinlichen
Komplexbildungen, zu deren Vorliegen entsprechend hohe Informationsbeträge j g
js1 fehlen, als auch solche mit trivialen Komplexbildungen, die äußerst geringe
Informationsbeträge j k js3 liefern, zugunsten gegebenenfalls möglicher
Nachrichten TNF zu vernachlässigen, deren Angebot an Informationen j in einem
mittleren Bereich js3 g j g js1 liegt.
Die für Verfahren Mp vorgesehenen Möglichkeiten nichtlinearer
Datenverarbeitungsprozesse Bb werden zunächst anhand einiger näherungsweise
behandelter, als Beispiel 1) zusammengefaßter Textbeispiele T aus der deutschen
Schriftsprache erläutert, für welche zunächst eindeutige Zuordnungen von
grammatischen Nachrichten TN mit entsprechend eindeutig ihren Texten T = Ts
zugeordneten Symbolen Vt = Ts beziehungsweise Komplexen VtVt = TsTs hiervon
angenommen werden. Hierzu wird beispielhaft der Fall einlaufender Texte T
behandelt, wobei, wie oben angeführt, die zugeordneten Sachen K und
Sachkomplexe KK, soweit möglich, auf die Meinung des als
Kommunikationspartner Pa fungierenden Autors At bezogen werden. Hierbei
repräsentiere ein einlaufender Text T1 = /Schwarze./ als Äußerung Tp = T1 = Ts11
eine grammatische Nachricht T1N1, deren grammatischer Inhalt N1 ein einziges,
einem grammatischen Symbol Gr1 zugeordnetes Symbol Vt11 a Gr1 a N1 als
Evidenz D umfaßt, dem neben weiteren, hier vernachlässigten, Möglichkeiten 3
semantische Hinweise Fp11z mit jeweils einer Sache K11z zugeordnet sind, wie sie
hier wie auch in nachfolgenden Beispielen mittels zwischen Anführungszeichen
gesetzter umgangssprachlicher Ausdrücke näherungsweise umschrieben werden.
Hierfür gilt K111: "Autor At äußert sich über schwarzfarbige Gegenstände,
worunter allgemein auch Lebewesen, Personen usw. verstanden werden",
K112: ". . .über Menschen, die eine konservative Politik vertreten", und K113: " . . .über
Neger". Gemäß einem vorauszusetzenden Sachverhalt Wk1 = Wk11 werden, mit
numerischen Werten c kk 1, a ue 1 und c k b k a, Wahrscheinlichkeiten p(K11z)
zugrunde gelegt, für die wegen des genannten Bezugs auf das Vorkommen in einer
Äußerung Tp vergleichsweise niedrige absolute Werte entsprechend p(K111) ue
p(K112) ue p(K113) = c vorgegeben werden. Gemäß Vorgehensweise Bbd wird ein
Schwellwert ps 1 k c angesetzt, wobei Text T1 mit den 3 Botschaften F11z = K11z
entsprechend semantisch vieldeutig bleibt. Ist dagegen, beispielsweise aufgrund
vorangegangener Botschaften, ein Kontext mit einem Sachverhalt Wk1 = Wk12
vorauszusetzen, in dem p(K111) = b und p(K112) = p(K113) = c gelten, und wird
entsprechend ein Schwellwert c k ps1 k b festgelegt, so folgt eine praktisch
eindeutig auf die "Farbeigenschaft" K111 bezogene Botschaft F111. Hierbei wurde
ein grammatisches Symbol Gr1 zugrunde gelegt, dessen Repertoire R(Pr) von
Möglichkeiten seiner Anordnungen Pr relativ zu weiteren Symbolen Vt a Gr
weiterer möglicher Symbole Gr denen bestimmter Substantive im Nominativ Plural
entsprechen. Man beachte, daß Text T1 beispielsweise auch mit einer
grammatischen Nachricht T1N2 mit einem grammatischen Inhalt N2 = Vt41 mit
Vt41 a Gr4 a N2 vereinbar ist, worin das grammatische Symbol Gr4 bestimmte
Akkusativformen von Substantiven im Plural symbolisiert, welche in Beispiel 1)
nicht weiter berücksichtigt werden. Im Einklang mit den unten angeführten
Transformationen Qs wie auch Q werden in sämtlichen Textbeispielen des Beispiels
1) die Symbole Vt1y und Gr1 als Kopf Vtk1y beziehungsweise Grk1 eingesetzt.
Entsprechend einer der unten an weiteren Beispielen erläuterten Ausgestaltungen
wurde hier den semantischen Hinweisen Fp11z a Vt11 jeweils der gleiche, vom in
diesem Beispiel ebenfalls durch den Buchstaben c symbolisierten numerischen
Wert zu unterscheidenden, oben definierten Verwendungshinweis q11z = c
zugeordnet. Entsprechend der oben durch K7 c8 K8 ausgedrückten Notierung
erfolgt das durch c8 vorgegebene Ersetzen von K7 durch K8 in diesem Beispiel
dadurch, daß die im vorausgesetzten Sachverhalt Wk11 beziehungsweise Wk12 als
Eigenschaft H(K11z)1 gegebene a-priori-Wahrscheinlichkeit p(K11z) = p(K11z)1
eines Sachbegriffs K11z durch die für den betreffenden semantischen Inhalt F
resultierende Wahrscheinlichkeit p(K11z)2 als neue Eigenschaft H(K11z)2 des
anderweitig unveränderten, beispielsweise als Menge von Begriffen A gegebenen,
Sachbegriffs K11z ersetzt wird.
Beispiel 1) wird durch ein grammatisches Symbol Gr2 mit 2 Symbolen Vt21a Gr2
und Vt22 a Gr2 erweitert, mit welchen als weitere einlaufende Äußerungen Tp die
Texte T2 = /Schwarze sind rot./ und T3 = /Schwarze sind schwarz./ betrachtet
werden, wobei, auch wieder eindeutig, Ts21 = Vt21 = /sind rot/ und Ts22 = Vt22 =
/sind schwarz/ angesetzt wird. Hierbei gilt eine Anordnungsmöglichkeit Pr von Gr2
zu Gr1, die durch einen Rang Ra mit einer unten erläuterten Abhängigkeit Gr2 =
An(Gr1) sowie eine Position P bestimmt ist, in welcher Text Ts11 = Vt11
diskontinuierlich eingesetzt wird, wobei dessen Textteile T = /Schwarze/ und der
Punkt T = /./ jeweils durch einen Text Ts2y getrennt werden. Man beachte, daß die
Texte Ts2y a Vt2y jeweils mit einem, einen Abstand zum vorangestellten Wort
anzeigenden, Leerzeichen // beginnen, wie es auch den gemäß einer Ausbildung
der Erfindung zu berücksichtigenden, unten beschriebenen Text-Transformationen
Qs entspricht. Ein weiteres unten beschriebenes, die Großschreibung weiterer dem
Symbol Vt11 gegebenenfalls voranzustellender Text T betreffendes, als Operator o
fungierendes Zeichen wurde bei der Formulierung von Ts11 vernachlässigt, ebenso
ein den Text Ts11 einleitendes Leerzeichen.
Jedem Symbol Vt2y sind jeweils 2 semantische Hinweise Fp2yz zugeordnet, denen
jeweils der gleiche Verknüpfungshinweis q2yz = d für eine Durchschnittsbildung
der jeweiligen Sache K2yz a Fp2yz mit einer Sache K11z a Fp11z a Vt11
zugeordnet ist. Durch Vt21 = /sind rot/ werden 2 Sachen etwa im Sinne von
K211: "die vom Subjekt Gr1 angezeigten Gegenstände, wieder gemäß Autor At,
sind rotfarbig" und K212: ". . . sind politisch sozialistisch orientiert" angezeigt, durch
Vt22 = /sind schwarz/ entsprechend die Sachen K221: ". . . schwarzfarbig" und
K222: ". . . politisch konservativ". Gemäß Sachverhalt Wk11 sei von bedingten
Wahrscheinlichkeiten p(K221/K111) = p(K222/K112) = a und p(K211/K111) =
p(K212/K112) = c auszugehen, während für die weiteren Zuordnungen mittlere
Werte p(K2yz/K11z) ne b gelten, wobei ein Index wie hier z an unterschiedlichen
Positionen auch unterschiedliche Zahlenwerte repräsentieren kann. Wird hier
gemäß Bbd ein Schwellwert c k ps1 k b festgelegt, so werden für Text T2 die
Sachkomplexe F = K111K211 etwa im Sinne einer Autorenmeinung
"schwarzfarbige Gegenstände usw. sind rotfarbig" und F = K112K212 etwa gemäß
"Konservative sind sozialistisch orientiert" vernachlässigbar. Dagegen bleiben bei
den berücksichtigten Kontextbezügen für Text T2 Inhalte F im Sinne einer
Autorenmeinung K113K211: "Neger sind sozialistisch orientiert" und für T3 im
Sinne von K111K222: "schwarzfarbige, beispielsweise so gekleidete, Personen sind
konservativ" und K113K222: "Neger sind konservativ" selbst bei geringen Werten b
kk 1 nicht auszuschließen.
Die Ausgestaltung Bbr der nichtlinearen Datenverarbeitung Bb sieht vor, als
unnötig redundant betrachtete Inhaltsbildungen F = KK dadurch zu vermeiden, daß
Zuordnungen von Sachen Kb zu Sachen Ka mit Wahrscheinlichkeiten p(Kb/Ka) g
ps3, mit (1 - ps3) kk 1, zu vermeiden. Entsprechend wird für Beispiel 1) ein
Schwellwert b k ps3 k a vorgegeben, wodurch die quantitativ durch p(K221/K111)
= p(K222/K112) = a bestimmten Komplexbildungen KK wegen a g ps3 als zu
informationsarm vernachlässigbar werden. Zugunsten der oben genannten
Inhaltsbildungen sind gemäß Bbr also die gemäß Bb für Text T3 ebenfalls
möglichen Inhalte K111K211 im Sinne einer Autorenaussage "schwarzfarbige
Gegenstände usw. sind schwarzfarbig" und K112K222:"Konservative sind
konservativ" auszuschließen.
Entsprechend der erfindungsgemäß berücksichtigten Möglichkeit, auch disjunkt
unterschiedliche Ausgangssachverhalte Wk1x zuzulassen, wird in Beispiel 1)
zusätzlich zum betrachteten Sachverhalt Wk11 auch wieder der Sachverhalt Wk12
vorausgesetzt, in welchem anstelle von p(K111) = c ein Wert p(K111) = b gilt,
wobei gemäß den obigen Ausführungen die weiteren Wahrscheinlichkeiten p(K)
hier unverändert von Wk11 übernommen werden und auf die Einführung eines
Schwellwertes ps1 g c verzichtet wird. Unter Anwendung des oben erläuterten
Bayesschen Ansatzes Ba ergibt sich gemäß Bb, daß für die Texte T2 und T3 die
gleichen Botschaften F = KK ausreichend wahrscheinlich sind wie bei Wk11;
allerdings bewirkt Kontext Wk12, daß dem Text T3 ein Inhalt K111K222 mit
höherer Wahrscheinlichkeit p(F/TN) zuzuordnen ist als ein Inhalt K113K222.
Beispiel 1) erläutert auch den Fall ausgehender Texte T, wobei die genannten
Sachen Kxyz dann entsprechend auf die hierbei vorausgesetzte Meinung des als
Kommunikationspartner fungierenden Hörers Pa = Hr zu beziehen sind.
Das erfindungsgemäße Verfahren Mp wird in einer bevorzugten Ausgestaltung,
jedoch ohne Einschränkung der Allgemeingültigkeit, unter Zugrundelegung, in
einer Ausbildung hiervon auch unter Anwendung, eines grammatischen
Kommunikationsverfahrens M durchgeführt, welches in Patentanmeldung P. . .
beschrieben wird. Verfahren M sieht eine Kommunikation mit grammatischen
Nachrichten TN vor, die jeweils aus einem Text T und einem diesem
zuzuordnenden, dort ebenso bezeichneten, grammatischen Inhalt N bestehen,
welcher als Komplex Kp mit Struktur J aus unten im einzelnen beschriebenen
grammatischen Symbolen Gr als Komponenten Em gebildet wird. In einer
bevorzugten Ausbildung werden hierzu Symbole Gr eingesetzt, die in P. . .
beschriebenen, auf Texte T anzuwendenden, Transformationen Q genügen, deren
Ergebnisse durch, unter Mitwirkung von Experten der betreffenden Sprachen L
durchzuführende, Beobachtungen bestimmter Invarianzen I nachweisbar sind. Diese
Transformationen Q sind mit den, in einer der genannten Ausgestaltung dem
erfindungsgemäßen Verfahren Mp zugrunde gelegten, unten ausgeführten
Transformationen Qs vereinbar, unterscheiden sich jedoch von den für die
genannten bekannten Grammatiken //12// einschließlich
Transformationsgrammatiken //12// charakteristischen, auch als bedeutungsneutral
//12//, S. 800 bezeichneten Transformationen, so daß sich entsprechend auch die
Symbole Gr mit ihren Eigenschaften H(Gr) von den bisher eingesetzten Begriffen
wie auch Phrasen //12// unterscheiden. Gemäß Verfahren M werden einem Text T a
Tp einer Äußerung Tp eine wie gegebenenfalls auch mehrere solcher Nachrichten
TN, im Regelfall disjunkt, zugeordnet, welche entsprechend dem
erfindungsgemäßen Verfahren Mp weiterhin jeweils durch eine oder disjunkt
mehrere semantische Inhalte F zu entsprechenden semantischen Nachrichten TNF
zu ergänzen sind. Als grammatische Symbole Gr werden in Verfahren M den
Symbolen Vt von Verfahren Mp entsprechende, dort auch als objektive Wörter oder
kurz Wörter Vt bezeichnete Symbole Vt sowie den Symbolen Gr von Mp
entsprechende, dort auch als Einheiten G bezeichnete klassenbildende
Superierungen von objektiven Wörtern Vt zu disjunkten Klassen G = (Vt)
verwendet. Hierbei wird ein Wort Vt in Texten T durch die gleiche disjunkte Klasse
Vt = (Ts) von Textabschnitten repräsentiert wie das entsprechende Symbol Vt von
Verfahren Mp. Den Einheiten G = (Vt) ist jeweils ein Repertoire R(Pr) von
Möglichkeiten von, auch in M so bezeichneten, Anordnungen Pr der ihnen
zugeordneten Wörter Vt a G in grammatischen Nachrichten TN und entsprechend
semantischen Nachrichten TNF zugeordnet, welche durch Wahrscheinlichkeiten p
näher bestimmt sind, die für die Wörter Vt a G einer Einheit G innerhalb
vorgegebener Toleranzen dp übereinstimmen. Diese Anordnungen Pr sind, wie in
verfahren Mp, durch die Positionen P der Textabschnitte Ts a Vt und einen Rang Ra
gegeben und werden durch Valenzen Um beschrieben, die ebenfalls den genannten
Transformationen Q genügen und sich dementsprechend von den für herkömmliche
Sprachverfahren und diesen hinterlegten Grammatiken vorgeschlagenen und als
nicht zuverlässig erachteten Valenzen //12// unterscheiden. Gemäß Verfahren M
werden datensparend auch grammatische Symbole Gr verwendet, die als klassen
wie auch komplexbildende Superierungen solcher Symbole Gr wie Wörter Vt und
Einheiten G wie auch bestimmten Teilen hiervon erstellt werden. Durch eine
Valenz Um1.1 einer Einheit G1 wird allgemein festgelegt, daß diese Einheit G1 in
einem grammatischen Inhalt N mit maximal einer, in einer Anordnung Pr
zugeordneten, Einheit G2a (G)1 aus einer disjunkten Klasse (G)1 verknüpft sein
kann, diese Valenz Um1.1 also nach einer solchen Zuordnung als gesättigt gilt.
Hierbei wird der wechselseitige Rang Ra zweier über ihre jeweiligen Valenzen Um
einander zugeordneter Einheiten G durch die Wahrscheinlichkeiten p bestimmt, mit
denen eine Sättigung dieser Valenzen Um zu erwarten ist. Definitionsgemäß
umfassen die Anordnungen Pr sowohl die Möglichkeiten des, gegebenenfalls auch
alleinigen, Vorkommens von Symbolen Vt in Nachrichten TN unabhängig von
weiteren Symbolen Vt als auch ihres durch Bezüge zu weiteren solchen Symbolen
Vt bedingten Vorkommens. Vereinfachend werden auch die
Anordnungsmöglichkeiten der Symbole Vt a G einschließlich der Textabschnitte Ts
a Vt als Pr bezeichnet.
Die vorgesehene, durch die zugrunde gelegten Definitionen der Symbole Vt a G
möglich gemachte Beschreibung ihrer Anordnungsmöglichkeiten Pr in Nachrichten
TN und TNF durch Valenzen Um der Einheiten G hat vorteilhaft zur Folge, daß,
anders als bei lexikalischen Wörtern, die Vielzahl möglicher syntaktischer Bezüge
zwischen den Texten Ts a Vt objektiver Wörter Vt datensparend durch eine weitaus
geringere Anzahl von Superierungen G = (Vt) dieser Wörter Vt mit Eigenschaften
H(G) beschreibbar wird, wobei durch eine Valenz Um1.1 einer Einheit G1 = (Vt1y)
die Bezüge der Wörter Vt1y a G1 zu Wörtern Vtxy a Gx ausgedrückt werden, die
zusätzlich noch zu einer weiteren Superierung K1 = (Gx) von Superierungen Gx =
(Vtxy) zusammengefaßt werden, und wobei ferner die Bezugsdaten weitgehend auf,
kombinatorische Explosionen vermeidende, Daten der Ordnung O(2) beschränkt
bleiben.
Die bei Verfahren M zu beachtenden Daten einschließlich der zur Komplexbildung
der Nachrichten Kp = TN zu verwendenden Komponenten Em mit ihren
Eigenschaften H(Em) werden unter der Bezeichnung Ws zusammengefaßt und in
dieser Ausgestaltung der Erfindung den Daten Wp des erfindungsgemäßen
Verfahrens Mp zugeordnet. Wo nicht anders angegeben, erfolgt die weitere
Beschreibung des erfindungsgemäßen Verfahrens Mp ohne Einschränkung der
Allgemeingültigkeit unter Zugrundelegung des grammatischen Verfahrens M und
der hierfür, im Einklang mit Verfahren Mp festgelegten, Symbole Gs = Vt und Gs =
G und ihren Eigenschaften H(Gs).
Die nach dem grammatischen Verfahren M zu bildenden Inhalte N der Texte T
enthalten Komplexe Kp = GG von in Anordnungen Pr vorliegenden Einheiten G =
(Vt) und diesen entsprechend zugeordnete Komplexe Kp = VtVt von gemäß dem
vorliegenden Verfahren Mp als Symbole Vt einzusetzenden objektiven Wörtern Vt,
schließen jedoch die gemäß Verfahren Mp vorzunehmende Verknüpfung von
diesen Symbolen Vt zuzuordnenden semantischen Hinweisen Fp a Vt zu
semantischen Inhalten F und die Bildung entsprechender pragmatischer
Sachverhalte Wk nicht ein. Als in Verfahren Mp, wie oben angeführt, bei den
Verwendungshinweisen q a Fp zu beachtende Anordnungen Pr werden in dieser
Ausbildung die gemäß Verfahren M in den Nachrichten TN anzutreffenden
Anordnungen Pr der Einheiten G und entsprechend Wörter Vt berücksichtigt, wie
sie sich gemäß den Valenzen Um dieser Einheiten G in den Nachrichten TN
ergeben. Hierbei wird von 2 in einer Anordnung Pr einander zugeordneten
Einheiten G1 und G2 die ranghöhere Einheit G1 = Ar(G2) als Träger Ar von G2,
die rangniedrigere Einheit G2 = An(G1) als Anhänger An von G1 bezeichnet.
Entsprechend gelten so für die zugehörigen Wörter Vtxy a Gx und Textabschnitte
Tsxyz a Vtxy die Beziehungen Vt11 = Ar(Vt21) und Vt21 = An(Vt11) sowie Ts111
= Ar(Ts211) und Ts211 = An(Ts111) usw. Eine Kette hierarchisch einander
nachgeordneter Einheiten mit G1 = Ar(G2), G2 = Ar(G3) usw. bildet einen Ast
As(G1, G2, G2 . . .), wobei die ranghöchste Einheit G1 eines Inhalts N auch als Kopf
G1 = Gk1 dieses Inhalts N wie auch des Astes As bezeichnet wird, der sie angehört.
In einem solchen Ast As(G1, G2, G3 . . .) wird G2 in bezug auf G1 auch als
hierarchisch näherliegend oder rangnäher bezeichnet als G3, in bezug auf G1 und
G3 auch als rangmäßig dazwischenliegend. Vereinfachend werden solche
Rangordnungen auch als G1 g G2 g G3 wie auch Vt1y g Vt2y g Vt3y und
entsprechend G3 k G2 k G1, im einzelnen auch G1 g G3 usw. notiert. Ein
Sachbegriff Kxyu a Fpxyu a Vtxy a Gx eines Symbols Vtxy a Gx, das einer in
einem Inhalt N als Kopf Gk angeordneten Einheit Gx = Gkx zugeordnet ist, wird
auch, wie unten weiter ausgeführt, als Kopf Kkxyu des der betreffenden Nachricht
TNF zugeordneten semantischen Inhalts F bezeichnet, wie er auch durch die
genannten Transformationen Qs bestimmbar wird. Bei Zugrundelegung des
grammatischen Verfahrens M erfolgen die bei diesen Transformationen Qs, wie
unten gezeigt, jeweils an einem Text T1 = Tf1, mit T1 a TN, vorzunehmenden
Verkürzungen zu einem Text T2 = Tf2 um jeweils einen Textabschnitt Ts a Vt11 a
G1 einer Einheit G1 a N a TN, welche gemäß G1 = An(Gx) und G1 ne Ar(Gx) als
Anhänger An, nicht jedoch als Träger Ar einer weiteren Einheit Gx a N fungiert.
Entsprechend den für Verfahren M vorgesehenen Maßnahmen wird in dieser
Ausgestaltung zugrunde gelegt, daß ein Text T = Tp einer einlaufenden wie auch
einer zu bildenden ausgehenden Äußerung Tp als Teil jeweils einer grammatischen
Nachricht TN beziehungsweise bei Mehrdeutigkeit einer disjunkten Klasse K1 =
(TN) hiervon wie gegebenenfalls eines Komplexes TN, TN, bei seriellen Sprachen
also einer Folge, hiervon beziehungsweise bei Mehrdeutigkeit einer disjunkten
Klasse K1 = (TN, TN) solcher Folgen vorliegt oder bei vorgesehener Anwendung
des Verfahrens M auch erzeugt wird, so daß Text Tp in entsprechend unterteilter
Form auch als Komplex Kp = VtVt von entsprechend ihren Positionen P
angeordneten Symbolen Vt = Vtxy wie auch als Komplex Kp = TsTs von diesen
zugeordneten Textabschnitten Tsxyz a Vtxy beziehungsweise bei Mehrdeutigkeit
als entsprechende disjunkte Klasse K1 = (VtVt) und (TsTs) hiervon vorliegt. Gemäß
Verfahren M wird eine Permutation VtVt der Symbole Vtxy a Gx sämtlicher in
einem grammatischen Inhalt N gemäß ihren Valenzen Um angeordneten Einheiten
Gx auch als Satz VtVt = S bezeichnet, dessen als Permutation der Textabschnitte Ts
a Vt sämtlicher Symbole Vtxy a S gebildeter Text T a S im Regelfall als ein
bezüglich seines Inhalts F korrekter Text T = Tf beurteilt wird, falls die
Abweichungen der Textabschnitte Ts von ihren Normtexten Tsa vorgegebene
Toleranzen dT nicht übersteigen. Entsprechend liegt ein Text T = Tp auch als Satz
S oder Satzfolge SS beziehungsweise bei Mehrdeutigkeit als disjunkte Klasse K1 =
(S) oder (SS) hiervon vor. Man beachte, daß gemäß der Definitionen von korrekten
Texten Tf und der Transformationen Q wie auch Qs ein Satz S nicht notwendig
einen mindestens als Kombination zweier als Subjekt und Prädikat oder auch als
Nominalphrase und Verbalphrase bezeichneter Satzteile gebildeten natürlichen Satz
wie beispielsweise /Zwetschgen sind grün./ darstellen muß, sondern daß
beispielsweise auch prädikatfreie Äußerungen Tp wie /Grüne Zwetschgen./ oder
/Nein!/ als T = Tf = Tp gelten und somit Sätze S repräsentieren. Weiterhin schließt
Verfahren M wie Mp die Verwendung diskontinuierlich angeordneter
Textabschnitte Ts a Vt in Texten T und somit von diskontinuierlichen Wörtern Vt
in Sätzen S mit ein, wie sie oben auch in Beispiel 1) eingesetzt wurden.
Für die aufgabengemäß zu leistenden Übersetzungen sieht Verfahren Mp in einer
vorteilhaften Ausgestaltung die Verwendung weiterer für das grammatische
Verfahren M eingeführter, als Vokabeln Vqq bezeichneter Symbole vor, bei
welchen jeweils einem, ebenfalls Vokabel genannten, Komplex Kp = VtVt = Vq
von objektiven Wörtern Vt einer Ausgangssprache L, eine disjunkte Klasse K1 =
(Vq') von Vokabeln Vq' zugeordnet ist, die jeweils als Komplexe Kp = Vt'Vt' =
Vq' von Wörtern Vq' einer Zielsprache L' gebildet werden. Mit diesen Vokabeln
Vqq erfolgt eine Übersetzung dadurch, daß ein gegebener Text T der Sprache L zu
einer Folge grammatischer Nachrichten TN mit zugeordneten Sätzen S = VtVt
ergänzt wird und die Wörter Vt eines jeden Satzes S vollständig zu Vokabeln Vq
zusammengefaßt werden und dieser als Komplex S = Kp = VqVq = VqqVqq
vorliegt. Die Wörter Vt' einer Permutation von Vokabeln Vq' a Vqq der
Zielsprache L' dieses Satzes S werden zu einem grammatischen Inhalt N' a T'N'
einer grammatischen Nachricht T'N' von L' zusammengefügt, deren Text T' a T'N'
als Übersetzung des Textes T a TN der Sprache L gilt, wobei gemäß den Vokabeln
Vqq auch eine disjunkte Klasse K1 = (T'N') solcher Nachrichten T'N' mit
entsprechend unterschiedlichen Übersetzungstexten T' anfallen kann. Zusätzlich zu
den im grammatischen Verfahren M vorgesehenen Maßnahmen erfolgt im
erfindungsgemäßen Verfahren Mp, wie unten ausgeführt, eine Ergänzung der
Nachrichten TN und T'N' zu semantischen Nachrichten TNF und T'N'F' und die
Auswahl einer Nachricht T'N'F' mit Übersetzungstext T' a T'N'F', deren
semantischer Inhalt F' a F'N'F' am besten mit dem gegebenen Inhalt F a TNF
übereinstimmt.
Entsprechend einer für Verfahren M vorgesehenen bevorzugten Ausgestaltung
werden die Symbole Vt auch als Komplexe Vt = ZZ weiterer, auch Zeichen Z
genannter, Komponenten Em = Z formuliert, welche in Texten T jeweils durch eine
disjunkte Klasse K1 = Z = (Tr) von Textabschnitten Tr repräsentiert werden. Gemäß
einer Ausbildung hiervon genügen diese Textabschnitte Tr a Z jeweils bestimmten,
innerhalb festzulegender Toleranzen dT liegenden Textmerkmalen H(T) wie auch
Repertoires R(H(T)) wie auch Komplexen Kp hiervon. Es werden bevorzugt, auch
als Alphabete bezeichnete, geordnete Repertoires R(Z) von Zeichen Z wie auch
entsprechend geordnete Repertoires R(Vt), R(G) und R(Ad) der einzusetzenden
Symbole und Adressen Ad für ihre Anordnung in den Daten Ws verwendet. In einer
weiteren Ausbildung werden zur Darstellung der Wörter Vt in den Daten Ws und
Nachrichten TNF neben den betreffenden Sprachen L angepaßten Zeichen Z wie
Buchstaben, Silbenzeichen, Satzzeichen und Wortabständen beziehungsweise in
mündlichen Sprachen L entsprechenden prosodischen Elementen wie Betonungen,
Tonhöhenänderungen oder Pausen auch bestimmte, unten im einzelnen definierte
Operatoren o eingesetzt, welche bestimmte Abänderungen an ihnen gemäß ihren
Positionen P zugeordneten weiteren Zeichen Z und deren Textabschnitten Tr a Z in
Nachrichten TN bewirken, mit der Folge, daß, abhängig vom Textzusammenhang,
die Wörter Vt in Nachrichten TN auch durch Zeichenkomplexe ZZ2 repräsentiert
werden, die von den in den Daten Wp notierten Zeichenkomplexen ZZ1 abweichen.
Die in Verfahren M und entsprechend Mp als Komponenten Em der Nachrichten
TN und TNF zu verwendenden Symbole werden allgemein als Gs bezeichnet.
Hiervon werden als disjunkte Klassen K1 = (T) von Textabschnitten T zu bildende
Symbole Gs wie Vt und Z auch Textsymbole Gt, bestimmte klassenbildende
Superierungen K1 = (Gt) hiervon wie die Einheiten G auch grammatische Symbole
Gr und für die Bildung semantischer Inhalte F einzusetzende Komponenten Em
auch semantische Symbole Gp genannt. Als weitere Komponenten Em werden
entsprechend den Möglichkeiten disjunkter Anordnungen, auch bestimmte, als
Teilwörter bezeichnete Teile vt von Wörtern Vt sowie hieraus zu disjunkten
Klassen superierte Teileinheiten g a G eingesetzt.
Von bekannt gewordenen, mit natürlichen Sprachen L befaßten, Verfahren und
diesen zugrunde gelegten Grammatiken und Semantiken, wie sie auch oben zitiert
wurden, unterscheidet sich die vorliegende, in Verbindung mit dem grammatischen
Verfahren M anzuwendende Ausgestaltung des semantischen Verfahrens Mp auch
dadurch, daß sie unter Einsatz von, als Symbole Gs einzusetzenden objektiven
Wörtern Vt durchgeführt wird, welche vielfach von den für Schriftsprachen
festgelegten lexikalischen Wörtern der betreffenden Sprachen L abweichen, also in
Texten T beispielsweise auch durch nicht zusammenhängende oder
aneinandergrenzende Textabschnitte T a Vt repräsentiert werden oder in
Schriftsprachen L auch mehrere lexikalische Wörter oder nur Teile hiervon
umfassen und gegebenenfalls auch Abstände und Satzzeichen mit einschließen. Als
Folge hiervon werden sie, den Transformationen Qs und Q entsprechend, zu
erfindungsgemäß einzusetzenden Superierungen Gr wie Einheiten G wie auch
bestimmten Klassen K1 und Komplexen Kp hiervon zusammenfaßbar, die, wie oben
für die Valenzen Um dargelegt, in bekannt gewordenen Sprachverfahren bisher
nicht oder nicht ausreichend berücksichtigte, insbesondere auch quantitativ
festzulegende, Eigenschaften H(G) aufweisen, welche jeweils für eine Vielzahl
solcher Symbole Vt und diesen jeweils wieder zuordenbarer Textabschnitte Ts a Vt
gelten, so daß die erfindungsgemäß einzusetzenden Symbole Gs, Gr, wie
gegebenenfalls auch Gt unter Vermeidung kombinatorischer Explosionen durch nur
schwach überproportional mit der Anzahl der berücksichtigten objektiven Wörter
Vt und somit auch der darin anzutreffenden lexikalischen Wörter anwachsende
Datenmengen beschreibbar werden.
In einer weniger vorteilhaften Ausgestaltung der Erfindung, bei der auf eine
Anwendung des grammatischen Verfahrens M verzichtet wird und von Texten T
ausgegangen wird, die beispielsweise als Folgen lexikalischer Wörter mit diese
näher bestimmenden herkömmlichen grammatischen Bezeichnungen vorliegen,
sieht Verfahren Mp vor, Daten Wp zu verwenden, bei denen den gemäß Verfahren,
Mp zu verwendenden, vorzugsweise den Transformationen Qs entsprechenden
Symbolen Vt solche lexikalische Wörter und Wortkombinationen zugeordnet
werden, wobei in einem ersten Verfahrensschritt von Mp gemäß diesen Daten Wp
diese Texte T vollständig als entsprechende Komplexe von Symbolen Vt dargestellt
werden.
Die vorgesehene Anpassung der in Verfahren Mp einzusetzenden Symbole Vt und
Gr und ihrer Eigenschaften H(Vt) und H(Gr) an die betreffenden natürlichen
Sprachen L wird in einer bevorzugten Ausgestaltung dadurch erreicht, daß Symbole
Vt verwendet werden, die in Texten T durch jeweils eine disjunkte Klasse K1 = Vt =
(Ts) von Texten Ts repräsentiert werden, welche den oben genannten, nachfolgend
beschriebenen Transformationen Qs genügen, deren Ergebnisse unter Mitwirkung
von Experten, definitionsgemäß also Kennern der betreffenden Sprachen L wie
auch der dadurch angesprochenen semantischen und pragmatischen Inhalte,
universell an Texten T beliebiger Sprachen L beobachtbar und im Regelfall auch
mit den Ergebnissen der dem grammatischen Kommunikationsverfahren M
zugrunde gelegten Transformationen Q vereinbar sind. Von den für herkömmliche
Transformationsgrammatiken ((12)) vorgeschlagenen Transformationen
unterscheiden sich die Transformationen Qs wie auch Q bezüglich der
vorgesehenen Maßnahmen, beobachtbaren Eigenschaften wie auch Ergebnisse.
Gemäß den Transformationen Qs gilt: Für ein in Texten T durch einen
Textabschnitt Ts11z a Vt11 angezeigtes Symbol Vt11 mit zugeordneter disjunkter
Masse K1 = (Fp11u) von semantischen Hinweisen Fp11u a Vt11 existieren einer
oder mehrere, auch als Äußerungen T = Tp einsetzbare Texte T mit der folgenden
Eigenschaft: Ein Text T = T1, der von Experten bezüglich eines ihm von diesen
zugeordneten semantischen Inhalts F = F1 als korrekter Text T1 = Tf1 beurteilt
wird, wird bei Verkürzung um einen kürzestmöglichen, nicht notwendig
zusammenhängenden Textabschnitt T11, falls T11 = Ts11z und falls nicht, wie im
anschließend beschriebenen Fall, T1 = Tsk gilt, in einen Text T2 mit zugeordnetem,
von F1 abweichendem Inhalt F2 abgewandelt, der bezüglich F2 ebenfalls als
korrekter Text T2 = Tf2 beurteilt wird, wobei bei jedem dieser Texte T2 die
Verknüpfung des jeweiligen Inhalts F2 gemäß einem der semantischen Hinweise
Fp11u a Vt11 mit einem diesem zugeordneten Sachbegriff K11u a Fp11u
entsprechend einem diesem ebenfalls zugeordneten Verwendungshinweis q11u a
Fp11u in ausreichender Näherung jeweils wieder den Inhalt F1 ergibt. Die
Transformationen Qs fordern somit bei der vorgesehenen Abänderungen von
Texten T um T11 die Einhaltung einer durch T1 = Tf1 und T2 = Tf2 gegebenen
Invarianz I an solchen Textpaaren T1 und T2, welche durch Experten anzuzeigen
ist, wobei die statistische Signifikanz und somit Objektivität der erzielten
Ergebnisse durch Beobachtung einer ausreichend hohen Zahl von Experten durch
beliebige Beobachter dieser Reaktionen feststellbar ist.
Diese Transformation Qs gilt als notwendige Bedingung dafür, daß das betreffende
Symbol Vt11 mit untergeordnetem Rang R einem durch einen weiteren Textteil Ts'
a T2 des Textes T2 angezeigten Symbol Vt' zugeordnet ist, sowie als hinreichende
Bedingung dafür, daß kein durch einen weiteren Textteil Ts" a T1 angezeigtes
weiteres Symbol Vt" vorliegt, welchem das Symbol Vt11 mit einem
übergeordneten Rang Ra zugeordnet ist. Für die disjunkte Klasse K1 = (Ts11z) der
Textabschnitte Ts11z a Vt11 des Symbols Vt11 gilt eine entsprechend disjunkte
Klasse K1 = (Qs) von Transformationen Qs, bei welchen durch Verwendung des
nämlichen semantischen Hinweises Fp11u a Vt11 jeweils der gleiche Inhalt F1
wiederhergestellt wird.
Abhängig von den natürlichen Sprachen L gehorcht ein Symbol Vt11 der
Transformation Qs auch bei Anwendung auf weitere unterschiedliche, durch
entsprechend unterschiedliche semantische Inhalte F1 gekennzeichnete Texte T1 =
Tf1, welche durch Entfernen eines in T1 vorliegenden Textabschnitts T11z a Vt11
in Texte T2 = Tf2 mit entsprechend voneinander abweichenden Inhalten F2
abgewandelt werden, wobei jeweils auch unterschiedliche semantische Hinweise
Fp11u einer disjunkten Klasse (Fp11u) a Vt11 zur Wiederherstellung der jeweiligen
Ausgangsinhalte F1 Anwendung finden, welche sich sowohl hinsichtlich des
Sachbegriffs K11u a Fp11u als auch des Verwendungshinweises q11u a Fp11u
voneinander unterscheiden können. Abhängig vom für die betreffende Sprache L
erzielbaren Ergebnis wird die Klasse (Fp11u) a Vt11 der semantischen Hinweise
Fp11u dieses Symbols auch als disjunkte Klasse K1 der Permutationen der diesem
Symbol Vt11 zugeordneten disjunkten Klasse K1 = (K11v) von Sachbegriffen K11v
und ebenfalls zugeordneten disjunkten Klasse K1 = (q11w) von
Verwendungshinweisen q11w notiert. In einer weiteren Darstellung wird den
Sachen K11u a Vt11 auch jeweils eine disjunkte Klasse K1 = (q11uw) von
Verwendungsweisen q11uw zugeordnet, woraus sich für Vt11 eine entsprechende
Permutation von semantischen Hinweisen Fp11uv ergibt, bei denen Fp1111 durch
K111 und q1111, Fp1112 durch K111 und q1112 usw., des weiteren Fp1121 durch
K112 und q1111 usw. bestimmt ist.
Textabschnitte Ts a Vt von Symbolen Vt, für die Texte T = T1 existieren, die nur
aus diesem Text gemäß T1 = Ts aufgebaut sind und bei Anwendung von Qs
entsprechend auf T2 = 0 mit von F1 abweichendem Inhalt F2 = 0 verkürzt werden,
werden auch als Textabschnitte Ts = (Tsk a Vtk) von Symbolen Vt = Vtk
bezeichnet, welche wie in Verfahren M auch Kopf Vtk genannt werden, wobei auch
hierfür Invarianz I als erfüllt definiert wird. Definitionsgemäß sind die
Abänderungen von Texten T1 um Texte Tsk auch bei einem dabei resultierenden
Text T2 = 0 mit entsprechenden Abänderungen von vorausgesetzten Sachverhalten
Wk1 in Sachverhalte Wk2 verbunden.
Gemäß den Transformationen Qs wird von 2 in einer grammatischen Nachricht
T1N1 in einer Anordnung Pr voneinander zugeordneten Symbolen Vt11 und Vt21
dem Symbol Vt21 ein gegenüber Vt11 höherer Rang Ra verliehen, wenn Vt21 nicht
durch Anwendung der Transformationen Qs auf den Text T1 a T1N1 erzeugbar ist,
wohl aber durch Anwendung der Qs auf einen Text T1' a T1'N1', in welchem
durch, gegebenenfalls auch mehrfache, Anwendung der Qs auf T1 beziehungsweise
daraus gebildete Texte T", T''' usw. der Textabschnitt Ts11z a Vt11 und somit
auch Vt11 nicht mehr vorliegt. Vt11 gilt entsprechend als dem Symbol Vt21 in
T1N1 rangtiefer oder auch abhängig von Vt21 zugeordnet. Bei Anwendung des
grammatischen Verfahrens M, in welchem die als semantische Symbole Gp
eingesetzten Symbole Vt zugleich auch objektive Wörter Vt a G darstellen,
entsprechen solche Rangordnungen Ra auch den Rangordnungen, wie sie sich für
die als Klassen K1 = G = (Vt) von Symbolen Vt gebildeten Symbole G aus den M
zugrunde gelegten Transformationen Q bei solchen Texten T1 a T1N1 ergeben,
wobei mit Vt11 a G1 und Vt21 a G2 gemäß G1 = An(G2) und Vt11 = An(Vt21) die
Symbole G1 und Vt11 als Anhänger An von G2 beziehungsweise von Vt21
ausgewiesen werden. Entsprechend gilt mit G2 = Ar(G1) und Vt21 = Ar(Vt11)
Einheit G2 beziehungsweise Symbol Vt21 als Träger Ar. In Anlehnung hieran
werden die dem Symbol Vt11 zugeordneten Hinweise und Sachbegriffe ebenfalls
als Anhänger An gemäß Fp11u = An(Fp21u) und K11u = An(K21u) und
entsprechend Fp21 = Ar(Fp11) usw. als Träger Ar bezeichnet, wobei ein dem Vtk a
Gk zugeordneter Sachbegriff K a Fp a Vtk entsprechend auch als Kopf Kk a F des
Inhalts F a TNF fungiert.
Aus den genannten Transformationen Qs folgt weiterhin, auch wieder in Einklang
mit den Transformationen Q, daß das durch den entfernten Textteil T11
repräsentierte, als Anhänger Vt11 = An(Vt21) oder als Kopf Vtk11 in einer
grammatischen Nachricht T1N1 vorliegende Symbol Vt11 nicht zugleich als Träger
Vt11 = Ar(Vt31) eines weiteren, im Text T1 durch einen Textabschnitt Ts31z a
Vt31 repräsentierten Symbols Vt31 fungiert.
In einer bevorzugten Ausgestaltung werden nur solche Texte T11 a T1 einem durch
einen semantischen Hinweis Fp111 a Vt11 gekennzeichneten Symbol Vt1 a G1
einer eigenen Einheit G1 zugeordnet, für welche mindestens 2 unterschiedliche
Texte T1 = T1a und T1b mit unterschiedlichen Inhalten F1 = F1a und F1b
existieren, in denen die Trägereinheit G2 = Ar(G1) durch unterschiedliche Symbole
Vt2a und Vt2b repräsentiert werden, wobei die Inhalte F2 = F2a und F2b der
jeweils durch Kürzung um Textabschnitt T11 resultierenden Texte Ts = T2a und
T2b durch Kombination mit dem gleichen Hinweis Fp111 a Vt11 wieder in ihre
Ausgangsinhalte F1a und F1b zurückverwandelt werden. Falls dagegen in dieser
Sprache L nur ein Symbol Vt21 a G2 existiert, dem in Texten T1 Symbol Vt11 als
Anhänger Vt11 = An(Vt21) zuordenbar ist, wird vorzugsweise der T1 zugeordnete
Symbolkomplex Vt21Vt11 als Idiom Vtxy a Gx einer eigenen Einheit Gx
zugeordnet, wobei, abhängig von den Ergebnissen der auf die weiteren Symbole Vt
a G der Texte T1 usw. anzuwendenden Transformationen Qs, nicht ausgeschlossen
wird, daß Gx = G2 festgelegt wird. Diese, unten auch an einem Beispiel erläuterte,
Idiombildungsbedingung, wird auch als Transformation Qsa a Qs bezeichnet.
Die genannten, jeweils als eine disjunkte Klasse K1 = Gr1 = (Vt1y) von Symbolen
Vt = Vt1y gebildeten grammatischen Symbole Gr = Gr1 genügen einer weiteren
Klasse K1 von, unter Einhaltung der genannten Invarianzbedingung I
durchzuführenden Transformationen Qs. Danach existiert zu jedem Text T1 a
T1N1, in dessen Nachrichten durch, gegebenenfalls auch durch die genannte
mehrfache, Anwendung der Transformation Qs ein Symbol Vt11 a Gr1
nachgewiesen wurde, ein Text (T3 = Tf3) a T3N1 mit von F1 abweichendem
semantischem Inhalt F3 ne F1, der anstelle des durch die Transformation Qs,
beziehungsweise durch die genannte Folge hiervon, nachgewiesenen Textabschnitts
Ts11z a Vt11 a Gr1 einen Textabschnitt Ts1yz a Vt1y a Gr1 enthält, für den durch
Anwendung der Transformation Qs, beziehungsweise Folge hiervon, also durch
Kürzung um einen Textabschnitt T31 = Ts1yz, beziehungsweise auch nach
Kürzung um weitere Textabschnitte Ts' a Vt' usw. weiterer in Nachricht T3N1 von
Vt1y abhängiger Symbole Vt' usw., wieder Text T2 a T2N2 mit dem semantischen
Inhalt F2 erzeugt wird, der durch einen semantischen Hinweis Fp1yu a Vt1y,
beziehungsweise zusätzlich durch weitere Hinweise Fpu' a Vt' der Symbole Vt'
usw. wieder in Inhalt F3 abgewandelt wird.
Die genannten Rangordnungen Ra wie auch Anordnungen Pr unterscheiden sich
von den für herkömmliche Dependenzgrammatiken //12// vorgeschlagenen,
beispielsweise für Abhängigkeitsrelationen zwischen natürlichen Wörtern benutzten
Bezugsangaben. Für die weiterführende Beschreibung des erfindungsgemäßen
Verfahrens Mp wird, wo nicht anders angegeben, ohne Einschränkung der
Allgemeingültigkeit die Anwendung des Verfahrens M, insbesondere auch bei der
Beschreibung der grammatischen Nachrichten TN a TNF der semantischen
Nachrichten TNF zugrunde gelegt, wobei entsprechend bei den Anordnungen Pr der
Symbole G = (Vt) die diesen zugeordneten Valenzen Um und deren
Sättigungseigenschaften berücksichtigt werden.
Als Folge der im Regelfall anzutreffenden Vereinbarkeit der Transformationen Qs
mit den ebenfalls auf Beobachtungen von Invarianzen I, welche die durch T = Tf
gegebene einschließen, beruhenden Transformationen Q, durch welche die
grammatischen Symbole Gr des grammatischen Kommunikationsverfahrens M
definiert und bestimmbar werden, liefern die Transformationen Qs in Verbindung
mit den Transformationen Q ein universell auf beliebige natürliche Sprachen L
anwendbares Verfahren zur Festlegung von an diese Sprachen L angepaßten und für
maschinelle Kommunikationsverfahren geeigneten Symbolen Gs mit Eigenschaften
H(Gs), welche hierbei zugleich auch in einen grammatischen und einen
semantischen Bereich unterschieden werden. Aus den Transformationen Q und Qs
folgt, daß für beide Bereiche eine Beachtung lediglich formal-sprachlicher Kriterien
bei Äußerungen Tp, wie sie durch Attribute wie "Akzeptierbarkeit" oder
"Wohlgeformtheit" //3//, S. 157 ohne Bezug auf deren jeweils vorauszusetzende
pragmatische Inhalte anderen dem gegenwärtigen Stand entsprechenden
Sprachtheorien und -verfahren zugrunde gelegt wurden //12//, //1//, S. 234, nicht
ausreicht. Hierbei machen es die durch Qs und Q festgelegten Eigenschaften H(Gs)
möglich, die gestellte Kommunikationsaufgabe, gegebenenfalls auch unter
Anwendung der genannten nichtlinearen Verarbeitungsoperationen Bb, mit einem
der Speicher- und Verarbeitungskapazität verfügbarer Rechner angepaßten
Aufwand zu lösen.
In Erweiterung der oben eingeführten Bezeichnungen werden Bezüge zwischen
Textsymbolen Gt als syntaktisch oder auch grammatisch, zwischen Symbolen Gt
und Gr einschließlich G als grammatisch, zwischen Symbolen Gp und Inhalten F
als semantisch und zwischen Sachbegriffen K wie auch hieraus gebildeten
Komplexen wie semantischen Inhalten F oder auch Sachverhalten Wk als
pragmatisch bezeichnet. Entsprechend werden die eingeführten Symbole Gs = Vt
sowohl als semantische, grammatische und Textsymbole Gp, Gr und Gt eingesetzt.
Als Textsymbole Gt werden bevorzugt auch Zeichen Z mit Textmerkmalen H(T)
eingesetzt, die in Standardäußerungen Tps mit ausreichend hohen
Wahrscheinlichkeiten p(H(T)/Tps) vorkommen, wobei als Merkmale H(T) auch
bestimmte Repertoires R wie auch Komplexe Kp hiervon verwendet werden, die
auch Merkmalsvektoren genannt werden. Als Adressen Ad für Textsymbole Gt
werden bevorzugt Merkmale H(T) verwendet, die diese Symbole mit ausreichend
hohen Wahrscheinlichkeiten p(Gt/H(T)) anzeigen, welche vereinfachend auch
p(Gt/T) notiert werden. Die Texte T a Gt wie Tr a Z und Ts a Vt werden auch
dadurch festgelegt, daß sie um weniger als vorgegebene Toleranzen dT von
Normtexten T = Ta wie Tra und Tsa abweichen.
Die erfindungsgemäße Verwendung von Symbolen Gs = Vt, deren Texte Ts a Vt
durch, im Regelfall auch mehrfache, Anwendung der Transformationen Qs wie
gegebenenfalls auch Q auf als Äußerungen Tp einsetzbare Texte T = Tf = Tp
definiert und in den solchen Texten T zugeordneten grammatischen Nachrichten TN
durch entsprechende Positionen P und Rangordnungen Ra gekennzeichnet sind, hat
zur Folge, daß das Kommunikationsverfahren Mp mittels solchen Nachrichten TN
zugeordneter semantischer Nachrichten TNF durchgeführt wird, welche prinzipiell
in, im Regelfall mehreren, Stufen aus Nachrichten TuNuFu = T1N1F1, T2N2F2,
T3N3F3 usw. aufzubauen sind, welche jeweils Untermengen T1N1F1 a T2N2F2,
T2N2F2 a T3N3F3 usw. der höheren Aufbaustufen T2N2F2 usw. darstellen. Im
Falle semantisch mehrdeutiger grammatischer Nachrichten TN ist hierbei unter
einer Nachricht TuNuFu gegebenenfalls auch eine disjunkte Klasse K1 =
(TuNuFuv) mehrerer semantischer Nachrichten TuNuFuv zu verstehen; dieser
erfindungsgemäß ebenfalls abgedeckte Fall wurde in obiger Formulierung zur
Vereinfachung vernachlässigt. Es existiert hierbei für jede semantische Nachricht
TNF eine Nachricht T1N1F1 a TNF, deren grammatische Nachricht T1N1 aus dem
Kopfsymbol Vt11 = (Vtk11 a Grk1) der Nachricht TNF mit zugeordnetem Text
Tsk11z a Vtk11 gebildet wird. Den zugeordneten semantischen Inhalt F1 a T1N1F1
bildet mit Wahrscheinlichkeit p(K111/Vt11) = b eine Sache K111 a Fp111 eines
Vt11 zugeordneten semantischen Hinweises Fp111 a Vt11, dessen
Verwendungshinweis (q111 a Fp111) = c, wie oben ausgeführt, die Abwandlung
der im vorauszusetzenden Sachverhalt Wk1 für K111 vorgegebenen
Wahrscheinlichkeit p(K111) = a und gegebenenfalls weiterer von K111 abhängiger
Wahrscheinlichkeiten p(Kw/K111) weiterer Sachen Kw gemäß dem resultierenden
Wert p(K111) = b fordert, was zu einem entsprechenden Sachverhalt Wk2 = Wk21
führt. Eine weitere Nachricht T2N2F2 a TNF wird durch Hinzufügung eines vom
Kopfsymbol abhängigen Symbols Vt21 = An(Vt11) in einer durch diese
Rangordnung Ra und eine Positionierung P = P2 der Vt11 und Vt21 zugeordneten
Textabschnitte Ts11z und Ts211z im Text T2 erzeugt, durch deren semantischen
Inhalt F2 der nun für T2N2F2 als Sachverhalt Wk1 vorausgesetzte Sachverhalt
Wk21 in einen resultierenden Sachverhalt Wk22 abgewandelt wird usw. Auch
aufgrund der so möglichen Vorgehensweise bei der Erzeugung pragmatischer
Sachverhalte Wk2 und diese übermittelnder, entsprechenden Nachrichten TNF
zugeordnete Äußerungen T = Tp unterscheiden sich die Verknüpfungsstrukturen
der zur Komplexbildung semantischer Nachrichten TNF, Botschaften F und
pragmatischer Sachverhalte Wk2 verwendeten Komponenten Em von den für
herkömmliche, beispielsweise für Konstituentenstruktur-Grammatiken //12//,
vorgeschlagenen Strukturen.
Wie unten auch anhand von Beispielen ausgeführt wird, ist durch den prinzipiell in
der beschriebenen Reihenfolge durchzuführenden Aufbau der erfindungsgemäß
einzusetzenden semantischen Nachrichten TNF nicht grundsätzlich eine
Reihenfolge vorgegeben, nach denen Komplexbildungen zu solchen Nachrichten
TNF und Bestimmungen von Sachverhalten Wk gemäß Verfahren Mp in den
jeweiligen Kommunikationsakten vorzunehmen sind. Wie für Verfahren der
Computerlinguistik erwünscht //12//, S. 817, bietet Verfahren Mp vielmehr die
Möglichkeit, nach unterschiedlichen Verarbeitungsstrategien und Reihenfolgen
vorzugehen, wobei jedoch den betreffenden Sprachen L angepaßte, im einzelnen
den Verwendungshinweisen q a Fp a Vt der Symbole Vt zugeordnete Hinweise zur
Beachtung von Reihenfolgen von Komplexbildungen Kp = KK zu berücksichtigen
sind. Solche Reihenfolgen für die Abwandlung von Sachverhalten Wk1 in
Sachverhalte Wk2 folgen im Regelfall aus der Reihenfolge, nach der grammatische
Nachrichten TN in Texten T zuzuordnenden Komplexen TN, TN solcher
Nachrichten TN vorliegen. Des weiteren folgen Bedingungen für einzuhaltende
Reihenfolgen im Regelfall auch in solchen Fällen, wo bei einer Inhaltsbildung F ein
Wechsel von einer Menge A von Sachen K zu diese Mengen A ausschließenden
Mengen B vorzunehmen ist, wie es für die sprachüblichen, unten weiter diskutierten
Verneinungen mit q = f gefordert wird. Im Rahmen dieser sprachbedingten
Festlegungen läßt Verfahren Mp Raum für unterschiedliche Verarbeitungsstrategien
einschließlich Komplexbildungs-Reihenfolgen, welche effektive Abarbeitungen
entsprechend den zu leistenden Kommunikationsakten, den verfügbaren Daten und
den Kapazitäten der einzusetzenden Geräte ermöglichen. In einer vorteilhaften
Ausbildung sieht Verfahren Mp vor, jeweils unter Beachtung der genannten
Einschränkungen die Komplexbildung einer Nachricht TNF mit einer beliebigen,
durch vorliegende Daten D mit ausreichender Wahrscheinlichkeit p(Em/D)
angezeigten Komponente Em1 zu beginnen und mit beliebigen, durch die Daten D
und in den Komplex Kp eingefügte, als Adressen Ad eingesetzte Komponenten
Em1 mit ausreichenden Wahrscheinlichkeiten p(Em2/D) sowie p(Em2/Em1)
angezeigten weiteren Komponenten Em2 fortzuführen. Weitere Strategien sehen
beispielsweise vor, zunächst grammatische Nachrichten TN zu erstellen, denen in
einer zweiten Phase semantische Inhalte F zugeordnet werden, wobei jeweils
Komplexbildungen entweder in Richtung fallenden oder steigenden Rangs Ra
eingeschlagen werden, und wobei jeweils ein Evidenzumfang D wie beispielsweise
eine Textlänge T berücksichtigt werden, die mindestens 1, in einer weiteren
Ausbildung auch mindestens 2, Komponenten Em anzeigen, die als Kopfsymbol
Vtk a Gk eines Inhalts N einsetzbar sind.
Entsprechend der angeführten Definition der Sachen K als durch die,
gegebenenfalls auch voneinander abweichenden, Meinungen der
Kommunikationspartner Pa geprägte pragmatische Begriffe K, welche nicht
notwendig mit objektiv nachweisbaren Tatbeständen übereinstimmen, sieht die
Erfindung vor, bei der genannten Abwandlung vorausgesetzter Sachverhalte Wk1
gemäß Wk1 q K = Wk2 mit q = c die Möglichkeiten von Ungenauigkeiten wie auch
Irrtümern zu berücksichtigen. Insbesondere werden hierbei, neben einer gemäß der
nichtlinearen Datenverarbeitung Bb vorgesehenen Vernachlässigung bestimmter
Inhalte F, resultierende Wahrscheinlichkeiten p(K) = 0 oder p(K) = 1 durch Werte a
beziehungsweise 1 - a mit a kk 1 ersetzt. Beispielsweise werden so bei einer durch
Wk1 oder die Daten Wp gegebenen Wahrscheinlichkeitsbeziehung p(K1) + p(K2) =
1 bei Vorliegen eines Textes T1 mit zugeordneter semantischer Nachricht T1N1F1,
deren semantischer Inhalt F1, insbesondere auch bei Anwendung der nichtlinearen
Vorgehensweise Bb, für Sache K1 eine Wahrscheinlichkeit p(K1) = 1 anzeigt, für
den resultierenden Sachverhalt Wk2 Wahrscheinlichkeiten p(K1) = 1-a und p(K2)
= a gewählt. In einer weiteren Ausbildung werden solche Ungenauigkeiten auch
durch entsprechende Toleranzen dp der Wahrscheinlichkeiten p in den
vorausgesetzten Sachverhalten Wk und Daten Wp berücksichtigt, wobei allgemein
auch disjunkte Klassen K1 = (Wk1x) unterschiedlicher, dem Partner Pa
möglicherweise zu unterstellender, Sachverhalte Wk1x vorausgesetzt werden
können.
Wie oben bei der Beschreibung der Verwendungshinweise q a Fp a Vt ausgeführt,
werden in den Daten Wp neben den Symbolen Vt zugeordneten Sachbegriffen K =
K5 mit K5 a Fp a Vt auch weitere Sachbegriffe K = K11 verwendet, welche gemäß
K5 a K11 Oberbegriffe der Sachen K5 darstellen, wobei vorteilhaft die
Oberbegriffe K11 so eng definiert werden, daß für die Untermengen K5
ausreichend hohe Wahrscheinlichkeiten p(K5/K11) g pr oberhalb festzulegender
Referenzwerte pr gelten. Hierbei werden insbesondere auch Oberbegriffe K11
verwendet, die als Vereinigung K11 = K5 s nK5 von K5 mit dessen Negation K6 =
nK5 gebildet werden, wobei für deren Durchschnitt K5 d K6 = 0 gilt. Die oben
angeführten, entsprechend den Eigenschaften von Sprachen L gemäß K5 f6 K6 zu
leistenden Verneinungen von Sachbegriffen K5 werden entsprechend auch gemäß
K6 = K11 m5 K5 durch Entfernung der Sachen K5 aus solchen Oberbegriffen K11
erreicht.
Zur Erläuterung dieser Verwendung von Oberbegriffen K wird das oben diskutierte
Beispiel 1) durch ein Symbol Vt31 = /nicht/, mit Vt31 a G3, erweitert, welches,
neben weiteren möglichen, in weiteren Inhalten N realisierbaren Anordnungen Pr
hier in einer Anordnung Pr verwendet wird, die durch eine Rangordnung Ra gemäß
Gr2 = Ar(G3) und eine Positionsangabe P = gr21 : Gr3 : gr22 näher bestimmt ist,
wodurch sich das grammatische Symbol Gr2 = gr21gr22 als Komplex Kp zweier,
oben eingeführter, Teilsymbole gr a Gr mit Teilwörtern vt a gr manifestiert, welche
hier vt211 = /sind/, vt221 = /rot/ und vt222 = /schwarz/lauten, mit Vt21 =
vt211vt221 und Vt22 = vt211vt222. Ein semantischer Hinweis Fp311 a Vt31
umfasse eine Sache K311 und einen Verwendungshinweis q311 = f, welche
zusammen eine Verneinung einer durch den Träger Ar, hier Gr2, angezeigten Sache
K2yu a Vt2y vorsehen, wobei diese Sache K2yu gegebenenfalls auch durch die
semantischen Hinweise Fpxyu weiterer in einem oder mehreren Ästen As
rangniedriger hierzu angeordneter Symbole Vtxy k Vt21 modifiziert sein kann. Bei
einem mit Vt31 in Beispiel 1) zusätzlich möglichen Text T4 = /Schwarze sind nicht
rot./, bei dem außer Vt11 auch Symbol Vt21 nun diskontinuierlich zur Textbildung
beiträgt, wird der oben dem Text T2 = /Schwarze sind rot./ unter anderem
zugeordnete Inhalt F = K113K212: "Neger sind sozialistisch orientiert" unter
Verwendung einer weiteren, als Oberbegriff definierten Sache etwa im Sinne von
K2121: ". . . sind politisch orientiert" in einen weiteren Inhalt F = K113K2122 mit
K2122 = (K2121 m K212) etwa im Sinne von "Neger sind politisch nicht
sozialistisch orientiert" abgewandelt, wobei K2121, wie oben vorgegeben, als eng
gefaßter Oberbegriff von K212 a K2121 gemäß (K212 s K2122) = K2121 und
(K212 d K2122) = 0 festgelegt wurde.
Man beachte, daß bei einer Erweiterung von Beispiel 1) durch ein weiteres, als
Anhänger Gr4 = An(Gr2) von Gr2 einzusetzendes Symbol Vt41 = /immer/ mit
Vt41 a Gr4 eine weitere Textbildung T5 = /Schwarze sind nicht immer rot./ möglich
wird, für deren Inhalt N gemäß den Eigenschaften H(Gr3) und H(Gr4) eine
Anordnung Pr mit Vt31 = An(Vt41) gilt und gemäß Fp311 eine Verneinung einer
Sache K411 a Fp411 a Vt41 und nicht wie in T4 der Sache K212 vorzunehmen ist,
wozu ein entsprechend anderer Oberbegriff K4111 = (K411 s nK411) einzusetzen
ist.
Auch aus dem folgenden Beispiel 2) aus der mündlichen deutschen Sprache geht
hervor, daß gemäß den Transformationen Qs und Q gebildete Symbole Vt sich
häufig von den für eine Sprache L willkürlich festgelegten lexikalischen Wörtern
unterscheiden. Hierzu werden zunächst die folgenden, durch Folgen von
Kleinbuchstaben unter Verzicht auf Wortabstände angenäherten Texte T betrachtet:
T1 = /einpaß/, T2 = /keinpaß/, T3 = /eingültigerpaß/, T4 = /keingültigerpaß/, T5 =
/einungültigerpaß/ und T6 = /seinungültigerpaß/. Hierbei wird Text T5 als
ausreichend synonym zu T4 beurteilt. Gemäß den Transformationen Q sind, jeweils
mit Ts = Vt und Vtxy a Gx, diese und weitere Texte T = S unter Verwendung der
folgenden objektiven Wörter Vt darstellbar: Vt11 = /einpaß/, Vt21 = /k/, Vt22 =
/m/, Vt23 = /d/, Vt24 = /s/, Vt31 = /gültiger/ und Vt41 = /un/. Gemäß den Q gelten,
jeweils mit Vt11 = Vtk11, T1 = Vt11, Vt21 = An(Vt11) in T2 und T4, Vt31 =
An(Vt11) in T3, T4, T5 und T6, Vt41 = An(Vt31) in T5 und T6 sowie Vt24 =
An(Vt11) in T6.
Diese als Ergebnisse der Transformationen Q erzielbaren Symbol-Festlegungen
werden durch die Transformationen Qs auf folgende Weise ergänzt: Das objektive
Wort Vt31 erhält einen Verwendungshinweis q311 a Fp311 a Vt31 = d für eine
Durchschnittsbildung einer, gegebenenfalls durch Anhänger An(Vt31)
modifizierten, Sache K311 a Fp311 mit einer dessen Träger Ar(Vt31) zugeordneten,
gegebenenfalls durch weitere von diesem Träger Ar abhängige Symbole Vt
modifizierten oder noch zu modifizierenden Sache K. Für die Wörter Vt22, Vt23
und Vt24 gelten ebenfalls solche Verwendungshinweise q221 = q231 = q241 = d
für eine solche Durchschnittsbildung mit jeweils einer Sache K a Ar(Vt2y) ihrer
Träger Ar(Vt2y). Dem Kopfsymbol Vtk11 kommt ein Hinweis q111 a Fp111 a
Vt11 zu, der mit q111 = c das Ersetzen der Eigenschaften H(K)1 der Sachen K a
Wk1 durch die Eigenschaften H(K)2 dieser Sachen K, wie sie sich bei den
Komplexbildungen der Sachen K a Vt sämtlicher im betreffenden grammatischen
Inhalt N vorliegender, von Vt11 abhängiger Symbole Vt a N untereinander und mit
der Sache K111 a Fp111 a Vt11 ergeben. Weiterhin gilt q411 a Fp411 a Vt41
von Vt41 = /un/ die Verneinung q411 = f einer dem Träger Vtxy = Ar(Vt41)
zugeordneten Sache K a Vtxy, welche, wie oben ausgeführt, gegebenenfalls auch
durch weitere Sachen K a Vt weiterer als von diesem Träger Vtxy abhängig
angeordneter Symbole Vt modifiziert sein kann. Im Text T5 ist dies nicht der Fall,
so daß durch q411 a Fp411 hier die Negation einer mit der Eigenschaft "Gültigkeit"
umschriebenen Sache K311 a Fp311 aa Vt31 erfolgt. Dem objektiven Wort Vt21 =
/k/ werden dagegen 2 Verwendungshinweise q211 und q212 zugeordnet. Von
diesen fordert, mit einer durch den oben angeführten Faktor qr reduzierten
Wahrscheinlichkeit p, Hinweis q211 = f die Negation des Trägers Ar(Vt21), wie er
zur Erzeugung des Inhalts F des Textes T2 benötigt wird. Daneben fordert, mit
entsprechend höherer Wahrscheinlichkeit p, Hinweis q212 = f dem Sprachgebrauch
folgend die Negation eines Sachbegriffs K a Vt eines Wortes Vt, das dem Träger
Ar(Vt21) gegebenenfalls als weiterer Anhänger An(Ar(Vt21)) zugeordnet ist, wie
es in Text T4 als Vt31 = An(Vt11) vorliegt, wobei q212 Bezugsdaten der Ordnung
O(3) repräsentiert, welche die Beachtung einer entsprechenden
Verknüpfungsreihenfolge fordern. Den Transformationen Q und Qs gemäß sieht
Verfahren Mp alternativ aber auch die Verwendung von Daten Wp vor, bei denen
Texte wie T3 einem eigenen, aus Teilwörtern Vt11 und Vt31 gebildeten Wort
Vt111 zugeordnet werden, das in Text T4 wie auch im unten angeführten T7 jeweils
durch Vt21 = An(Vt111) zu einer semantischen Nachricht TNF ergänzt wird.
Zu beachten ist in Beispiel 2) also, daß die genannte Verneinung in T4 dem
Sprachgebrauch entsprechend im Regelfall semantisch nicht ausdrückt, daß "gar
kein Paß, auch kein gültiger" angesprochen wird, sondern, wie in T5, "ein
ungültiger Paß", also lediglich die Eigenschaft "Gültigkeit des Passes" negiert wird.
Durch die angeführte, für das erfindungsgemäße Verfahren Mp vorgesehene
Bildung möglichst eng gefaßter Oberbegriffe Ka zu Begriffen Kb a Ka mit
möglichst hohen Wahrscheinlichkeiten p(Kb/Ka) g pr wird einer dem
Sprachgebrauch gerecht werdenden Inhaltsbildung F von Negationen Kc f Kb
gemäß Kc = Ka m Kb Rechnung getragen, wobei hier Ka als Vereinigung Ka = Kb
s Kc der durch "gültiger Paß" und "ungültiger Paß" zu umschreibenden
Sachkomplexe Kb und Kc gebildet wird.
Wie auch an dem weiteren Text T7 = /keinungültigerpaß/ des Beispiels 2) zu zeigen
ist, umfassen die durch q211 und q411 definierten Verwendungshinweise zur
Verneinung auch die Möglichkeit zur Darstellung von in Sprachen L nicht
unüblichen doppelten Verneinungen, wobei auch hier von entsprechend eng zu
definierenden Oberbegriffen K auszugehen ist.
Weitere Möglichkeiten zur Berücksichtigung sprachüblicher Wendungen sind durch
die angeführte Verwendung numerischer Faktoren qr zu, den Sprachgebrauch
wiedergebenden, Abänderungen der für die Komplexe Kp = F resultierenden
Wahrscheinlichkeiten p(F) sowie durch Idiombildungen gegeben.
Bei einer Übertragung von Beispiel 2) auf die deutsche Schriftsprache L fordern
teilweise willkürlich festgelegt Schreibregeln eine Wiedergabe beispielsweise des
Textes T6 durch einen Schrifttext T6' = /Sein ungültiger Paß./, der sich aus
lexikalischen Wörtern zusammensetzt, die ein Possessivpronomen, eine
Flexionsform eines Adjektivs und ein Substantiv umfassen, wobei noch
Modifizierungen durch Großschreibung und Zeichensetzung hinzukommen. Wie
oben ausgeführt und unten an weiteren Beispielen erläutert, lassen diese
lexikalischen Wörter keine mit dem erfindungsgemäßen Verfahren Mp
vergleichbare Superierungen zu entsprechend daten- und aufwandsparend
einsetzbaren grammatischen Oberbegriffen wie den erfindungsgemäßen Symbolen
Gr wie auch G zu. Eine Anwendung der Transformationen Q und Qs führt jedoch
auch bei Schrifttexten T zu, den obigen mündlichen Symbolen Vt a Gr
entsprechenden, Symbolen Vt, die erfindungsgemäß entsprechend den zu
beachtenden Rechtschreibregeln mit Hilfe der oben genannten, unten im Detail
ausgeführten Operatoren o darstellbar werden. Analog zur mündlichen Sprache L
ergeben sich die Symbole Vt11 = /gein Paß./, Vt24 = /_s=/, Vt31 = /_gültiger/ und
Vt41/ = /_un=/, die sich zu entsprechenden Schriftsprachensymbolen Gr1, Gr2, Gr3
und Gr3 superieren lassen, welche wieder eine datensparende Erzeugung von
Schrifttexten T mit erfindungsgemäß zugeordneten grammatischen und
semantischen Inhalten N beziehungsweise F möglich machen. Hierbei ist
beispielsweise der Text Ts = /_gültiger/ neben Gr3 auch weiteren Symbolen Grx
zuzuordnen, andererseits aber umfaßt Symbol Gr3 datensparend die Eigenschaften
einer Vielzahl weiterer eingeführter, als Symbole Vt zu verwendender Texte Ts =
Vt.
Neben den genannten Vorgehensweisen beim Aufbau semantischer Nachrichten
TNF, welche im Rahmen der angeführten, auch durch Verwendungshinweise q a Fp
a Vt bedingten, Einschränkungen beliebige Reihenfolgen bei der Zusammenfügung
der Komponenten Em a TNF zulassen, sieht die Erfindung in vorteilhaften
Ausgestaltungen auch mehrere der folgenden, ebenfalls unter Beachtung der
genannten Einschränkungen durchzuführenden Vorgehensweisen vor:
Bei der Bestimmung von durch einlaufende Texte T eines Partners Pa übermittelten
Sachverhalten Wk2 werden diese Texte T durch den Hörer Hr zunächst vollständig
durch Zuordnung, gegebenenfalls auch disjunkt mehrerer, grammatischer Inhalte N
zu grammatischen Nachrichten TN ergänzt. Der Aufbau erfolgt beginnend von
Kopfsymbolen Vt a G in Richtung fallenden Ranges. Alternativ hierzu erfolgt der
Aufbau beginnend von mit ausreichend hohen Wahrscheinlichkeiten p(Em/D) durch
die Daten D angezeigten Komponenten Em = (Vt a G) in beliebige Rangrichtungen.
Die nachfolgende Ergänzung der Nachrichten TN zu semantischen Nachrichten
TNF erfolgt ausgehend von den, den Ästen As mit niedrigstem Rang Ra
zugeordneten, Symbolen Vt a G entlang dieser Äste As in Richtung steigenden
Ranges Ra. Der Aufbau der Inhalte F a TNF erfolgt in der Reihenfolge der einem
Text T zugeordneten Nachrichten TN. Der Aufbau eines Inhalts F a TNF eines aus
mehreren Ästen As aufgebauten grammatischen Inhalts N a TN erfolgt in der
Reihenfolge, in der die Äste As aufeinander folgen, in einer Ausbildung hiervon
auch in der Reihenfolge der rangtiefsten Anhänger An dieser Äste As. In einer
weiteren Ausbildung wird bei verzweigten Ästen As zuerst der kürzere Ast As
hiervon bearbeitet. Ein vorausgesetzter Sachverhalt Wk1 wird stufenweise jeweils
durch den Inhalt F a TNF in der Reihenfolge der Nachrichten TN in jeweils einen
Sachverhalt Wk2 abgewandelt, der jeweils wieder als Sachverhalt Wk1 die a-priori-
Wahrscheinlichkeiten p(K) für den in der folgenden Stufe zu bildenden Inhalt F' a
T'N'F' und den daraus resultierenden Sachverhalt Wk2' liefert usw. Alternativ
hierzu erfolgt, insbesondere bei umfangreichen, auch aus mehreren Ästen As
zusammengefügten Nachrichten TN, die Abwandlung des Sachverhalts Wk1
stufenweise für jeden Ast As a TN in der Reihenfolge der Anordnungen der Äste
As, wobei gegebenenfalls entsprechend den resultierenden abgewandelten
Sachverhalten Wk abgewandelte a-priori-Wahrscheinlichkeiten p(K) für die dem
jeweils nachfolgenden Ast As zugeordneten Sachen K a Fp a Vt a G a As eingesetzt
werden. Erfindungsgemäß werden mit der Abwandlung der durch einen Sachverhalt
Wk1 gegebenen Wahrscheinlichkeit p(K1) einer Sache K1 auch die
Wahrscheinlichkeiten p(K2) der mit Sache K1 durch
Wahrscheinlichkeitsbeziehungen p(K2/K1) verknüpften Sachen K2 entsprechend
abgeändert.
Die Anpassung an die zu leistenden Kommunikationsakte sowie die verfügbaren
Vorrichtungen und Daten Wp erfolgt bei disjunkt zu berücksichtigenden
semantischen Hinweisen Fp a Vt a G, deren Vorliegen gegebenenfalls auch durch
disjunkt unterschiedliche Symbole Vt a G entsprechend alternativ möglicher
Nachrichten TN bedingt ist, eine Reduzierung der in entsprechenden
Entscheidungsbäumen resultierenden Komplexbildungs-Möglichkeiten bei jedem
Komplexbildungsschritt unter Anwendung der angeführten nichtlinearen
Datenverarbeitung Bb, wobei Sachen K mit, durch vorliegende Daten D wie
gegebenenfalls durch eine oder mehrere bereits verwendete Sachen K bedingte,
Wahrscheinlichkeiten p(K) k ps1 unterhalb von Schwellwerten ps1 vorübergehend
oder auch endgültig vernachlässigt werden. Weitere Reduzierungen der Repertoires
R(Ks) der als Konkurrenzhypothesen Ks möglichen Sachkomplexe KK erfolgen
nichtlinear nach Komplexbildungsstufen KK, wie sie nach Berücksichtigung der
Hinweise Fp a Vt der Symbole Vt a N eines Inhalts N oder als Zwischenergebnisse
auch der Symbole Vt a As a N eines Astes As hiervon erreicht werden, wobei
jeweils der Komplex KK = F mit der höchsten, durch die Evidenz D und Daten Wp
bedingten Wahrscheinlichkeit p(F)1 ge ps2 zur Erzeugung des jeweils als
Kommunikationsergebnis dienenden Sachverhalts Wk2 verwendet wird. Bei
Vorliegen mehrerer Inhalte F mit Wahrscheinlichkeiten p(F)2 nahe dem Höchstwert
p(F1) werden entsprechend auch disjunkt mehrere Sachverhalte Wk2 berücksichtigt
und der durch Vorgaben Vr bestimmten weiteren Verwendung zugeführt.
Bei der Übermittlung von Sachverhalten Wk2 durch Texte T an einen Partner Pa
durch einen Autor At wird ein disjunktes Repertoire R(F) von als Komplexe F =
KK aus Sachen K zusammengefügten Inhalten F bestimmt, welche jeweils einen
beim Partner Pa vorauszusetzenden Sachverhalt Wk1, gegebenenfalls auch disjunkt
mehrere solche Sachverhalte Wk1x, in den zu übermittelnden Sachverhalt Wk2
abwandeln, wobei gemäß den Daten Wp Sachen K a Fp a Vt berücksichtigt werden,
die Wörtern Vt wie auch disjunkten Repertoires R(Vt) von Wörtern Vt der gemäß
Vorgaben Vr zu verwendenden Sprache L zugeordnet sind wie auch die genannten,
diesen auf angegebene Art zuzuordnenden Oberbegriffe K umfassen. Die Sachen K
a Vt eines Inhalts F werden jeweils in einer Reihenfolge festgelegt, die mit einer,
einem als Kopf Vt1 = Vtk1 zu verwendenden selbständigen Symbol Vt
zuzuordnenden, Sache K beginnt und jeweils mit Sachen K a Vt2 von jeweils als
Anhänger Vt2 = An(Vt1) der jeweils die vorausgehende Sache K a Vt1 anzeigenden
Symbole Vt1 fortgeführt wird, wobei die selbständigen Valenzen Ums der Symbole
Vt1 als Adressen Ad für die Symbole Vt mit zugeordneten Sachen eingesetzt
werden und gemäß einer Adresse Ad jeweils disjunkt auch mehrere Symbole Vt mit
für die Komplexbildung eines Inhalts F geeigneten Sachen K ausgewählt werden.
Die Reihenfolge der Auswahl von Sachen K a Vt gemäß den Adressen Ad erfolgt in
Richtung fallender Wahrscheinlichkeiten p der durch die Valenzen Um angezeigten
Symbole Vt a G. Es werden bevorzugt aus Sachen K a Vt von Symbolen Vt a G
zusammengefügte Inhalte F a R(F) verwendet, die sich aus diesen Symbolen Vt a G
zu bildenden grammatischen Nachrichten TN mit ausreichend hohen
Wahrscheinlichkeiten p(F/TN) und Eindeutigkeiten zuordnen lassen. Es werden
bevorzugt Inhalte F verwendet, die sich aus einer möglichst geringen Anzahl von
Sachen K a Vt von zu jeweils einer Nachricht TN zusammenfügbaren Symbolen Vt
a Gr zusammenfügen lassen, wobei entsprechend den Erfordernissen auch
Oberbegriffe K hiervon eingesetzt werden. Bei Übersetzungen werden Repertoires
R(F) von Inhalten F verwendet, die sich als Komplexe F = KK von den Vokabeln
Vq' a Vqq der Zielsprache L' zugeordneten Sachen K a Vq' zusammenfügen
lassen, wobei einem Repertoire R(F) ein entsprechend disjunktes Repertoire
R(R(Vq')) von Repertoires R(Vq') von Vokabeln Vq' a Vqq zugeordnet wird,
deren Vokabeln Vqq in einem vorausgehenden Verfahrensschritt dem zu
übersetzenden Text T der Ausgangssprache L zugeordnet wurden. Für die zu
bildende Nachricht T'N'F' der Zielsprache L' wird ein zu übermittelnder
Sachverhalt Wk2' zugrunde gelegt, der den durch die Nachricht TNF der
Ausgangssprache L übermittelten Sachverhalt Wk2 ausreichend genau wiedergibt.
In Anpassung an die Eigenschaften der Sprachen L werden in einer weiteren
Ausgestaltung der Erfindung, insbesondere bei der durch Hörer Hr
vorzunehmenden Zuordnung semantischer Inhalte F zu bereits Texten T
zugeordneten grammatischen Nachrichten TN, die Symbole Vt a TN derjenigen
Äste As zuerst zur Inhaltsbildung herangezogen, deren rangniedrigste Anhänger Vt
= An zum Kopf Vtk entsprechend den Positionen P der Textabschnitte Ts a Vt und
ts a Vtk den geringsten Abstand aufweisen, wobei von gleich weit entfernten
Symbolen Vt vorangestellte Symbole Vt vor den nachgestellten berücksichtigt
werden.
In einer weiteren Ausbildung werden die Komplexbildungen TNF in Reihenfolgen
vorgenommen, die sich nach der Verfügbarkeit der für die Bildung von Inhalten F
zu berücksichtigenden Wahrscheinlichkeitsbeziehungen p(K) der angesprochenen
Sachen K in den Daten Wp richten.
In einer weiteren Ausgestaltung werden bei der Zuordnung von semantischen
Nachrichten TNF zu einlaufenden Texten T durch Hörer Hr die Komponenten Em
in einer Reihenfolge nach fallenden, durch Wahrscheinlichkeiten p(Em/D; Wp)
gegebenen Sicherheiten verwendet, mit denen sie durch vorliegende Evidenzen D
unter Beachtung der Daten Wp einschließlich der Adressierungen Ad durch bereits
berücksichtigte Komponenten Em angezeigt werden, wobei durch die
Verwendungshinweise q gegebene Reihenfolgen berücksichtigt werden.
Die vorgesehene nichtlineare Datenverarbeitung Bb hat vorteilhaft zur Folge, daß
die sowohl in der Rolle des Hörers Hr als auch des Autors At abzuarbeitende
Vielfalt disjunkter Möglichkeiten bei der Komplexbildung von grammatischen
Nachrichten TN und semantischen Nachrichten TNF aus entsprechend disjunkten
Repertoires R(Em) von Komponenten Em, die grundsätzlich zu
Entscheidungsbäumen mit annähernd exponentiell mit der Zahl der zum jeweiligen
Komplex Kp zusammengefügten Komponenten Em anwachsenden Verzweigungen
führen würde, frühzeitig an jeder Verzweigungsmöglichkeit auf eine handhabbar
geringe, beispielsweise jeweils nur eine oder zwei Alternativen umfassende, jeweils
als Konkurrenzhypothesen Ks betrachtete Lösungen beschränkbar bleibt. Hierbei
macht es die vorgesehene vorläufige Zurückstellung von zunächst weniger
wahrscheinlichen Teillösungen Ks möglich, in solchen Fällen, wo bei
weiterführenden Komplexbildungen keine ausreichend wahrscheinlichen
Komplexbildungen Kp erzielbar sind, zunächst zurückgestellte Lösungen Ks zu
reaktivieren und so zu insgesamt ausreichend wahrscheinlichen Endergebnissen
TNF zu kommen. Erfindungsgemäß werden in einer weiteren Ausgestaltung gemäß
Vorgehensweise Bbr von Bb auch Konkurrenzhypothesen Ks zurückgestellt, bei
denen die Komponente Em a Ks des betreffenden Komplexbildungsschritts zu
wenig Information j k js zum semantischen Inhalt F beiträgt. Die infolge der den
Symbolen Gs zugrunde gelegten Transformationen Q mögliche Beschreibung ihrer
Eigenschaften H(Gs) durch Daten überwiegend niedriger Ordnung O(n) macht es
weiterhin möglich, die Kappung möglicher Lösungszweige j eweils bereits nach
n-1 Komplexbildungsschritten vorzunehmen, bei Daten der Ordnung O(2) also
nach jeweils einem Schritt.
Wie oben bereits für den Fall von Negationen gezeigt, sieht Verfahren Mp
allgemein vor, in den Daten Wp zusätzlich zu den in den semantischen Hinweisen
Fpxyz a Vtxy der Symbole Vtxy enthaltenen Sachen Kxyu a Fpxyu weitere Sachen
Kv zu berücksichtigen, die zu den Sachen Kxyu ausreichend hohe
Wahrscheinlichkeitsbezüge p(Kv/Kxyu) g p1 aufweisen. Dies wird beispielhaft
wieder an 2 Einheiten Gx der mündlichen deutschen Sprache erläutert, bei denen
G1 die, hierfür schriftdeutsch ausgedrückten, Symbole Vt11 = /Menschen/, Vt12 =
/Früchte/, Vt13 = /Bücher/, Vt14 = /Brillen/, Vt15 = /Schreiner/ und Vt16 =
/Zeugnisse/ und G2 das Symbol Vt21 = /gute/ umfaßt. Neben den diesen Symbolen
Vtxy zugeordneten, hier nicht explizit umschriebenen Sachen Kxyu a Fpxyu a Vtxy
wird eine Sache Kv = Ka berücksichtigt, wie sie etwa durch Ka: "eine für Menschen
wichtige Funktion oder Eigenschaft" ausdrückbar ist. Den Sachen Kxyu werden
außerdem Sachen Kxyu1 zugeordnet, welche näherungsweise als
K1111: "moralische Qualität", K1211: "Geschmack", K1311: "Lesenswertheit",
K1411: "optische Qualität", K1511: "handwerkliches Geschick" und
K1611: "geprüfte Fähigkeit" zu bezeichnen sind. Hinweis Fp211 a Vt21 umfaßt eine
Sache K211: "eine durch einen Träger Vt1y = Ar(Vt21) angezeigte Sache Ka ist in
einem befriedigenden Ausmaß anzutreffen" und einen Verknüpfungshinweis q211
= d für eine Durchschnittsbildung mit einer Sache K1y11 a Vt1y des Trägers Vt1y.
Angenommen werden vergleichsweise hohe bedingte Wahrscheinlichkeiten
p(Kxyu1/Kxyu) g p1, p(Ka/Kxyu) g p1 und p(K211/Ka) g p1. Für die mit G1 = Gk1
= Ar(G2) mündlich zu bildenden Sätze S = Vt21Vt11 = /gute Menschen/,
Vt21Vt12 = /gute Früchte/, Vt21Vt13 = /gute Bücher/, Vt21Vt14 = /gute Brillen/,
Vt21Vt15 = /gute Schreiner/ und Vt21Vt16 = /gute Zeugnisse/ ergeben sich so die
intuitiv zugeordneten Inhalte F als Komplexe K1yuK1yu1KaK211 der betreffenden
Sachen K etwa im Sinne von "moralisch gute Menschen", "wohlschmeckende
Früchte", "lesenswerte Bücher", "scharfe Brillen", "geschickte Schreiner" und
"Zeugnisse mit guten Noten", während andere Sachkombinationen, wie sie bei
anderen, die Transformationen Qs nicht beachtenden Inhaltszuordnungen zu den
genannten Wörtern formal resultieren können, etwa im Sinne von "moralisch gute
Früchte" oder "wohlschmeckende Menschen" usw., vermieden werden.
Einzelheiten der hierfür zugrunde gelegten Komplexbildungen KK, bei denen
insbesondere Durchschnitte gemäß q = d der Begriffe Kxyu, Kxyu1, Kq und K211
zu bilden sind, werden an weiteren Beispielen unten erläutert. Im vorliegenden Fall
erweist es sich insbesondere als vorteilhaft, daß hierbei datensparend eine bedingte
Wahrscheinlichkeit p(K211/Ka) bei der Bildung sämtlicher Inhalte F Anwendung
findet.
Die Formulierung der Eigenschaften H(K) der zu verwendenden Sachen K a Fp
erfolgt entsprechend den, auch durch Vorgaben Vr näher bestimmten,
Gegebenheiten der zu führenden Kommunikation, bezüglich derer die Partner
definitionsgemäß in Interaktion treten, wobei diese gegebenenfalls auch als Nutzer
fungieren und erfindungsgemäß menschliche wie auch maschinelle Nutzer zu
berücksichtigen sind. So werden in einer Ausbildung, welche eine
natürlichsprachige Kommunikation mit als Partner Pa eingesetzten
Elektronenrechnern leistet, Sachen K und Komplexe F = KK hiervon mit
definierten Symbolgehalten entsprechend den von Rechnern zu lösenden Aufgaben
verwendet, wie sie aus hierfür eindeutig definierten Kommandosprachen bekannt
sind. Für menschliche Nutzer, in einer Ausbildung auch für Partner Pa, werden für
Sachen K und deren Verknüpfungen q neben definierten Symbolen gegebenenfalls
auch in der betreffenden Sprache L vorzunehmende verbale Umschreibungen
verwendet, welche so ausführlich ausgeführt werden, daß ausreichend eindeutige
Unterscheidungen unterschiedlicher Sachen K und hieraus gebildeter Komplexe F
und Sachverhalte Wk resultieren wie auch eine definitionsgemäß vorgesehene,
gegebenenfalls auch durch Vorgaben Vr näher bestimmte, Interaktion zwischen den
Kommunikationspartnern Pa auf ausreichend eindeutige Weise möglich wird. Bei
der Formulierung der Sachen K a Fp a Wp ist hierbei zu beachten, daß ihre
Verknüpfungen gemäß den Hinweisen q a Fp wieder pragmatische Inhalte F und
Daten Wk ergeben, die mit den von Experten der Sprachen L und der damit zu
behandelnden Sachverhalte Wk erkannten Inhalten F ausreichend übereinstimmen,
wobei, wie beispielhaft angeführt, die Sachen K auch unter Verwendung weiterer
Begriffe A einschließlich Sachen K wie Oberbegriffen, Untermengen,
Komplementen usw. formuliert werden und entsprechend den durch
Wahrscheinlichkeiten höherer Ordnung p(K/K') usw. gegebenen Bezügen die
Daten Wp definitionsgemäß auch Komplexe Wk = KK solcher Komplexe KK mit
den Eigenschaften H(KK) enthalten.
In einer an die zu leistenden Kommunikationsakte angepaßten Ausgestaltung
werden Daten Wp mit einem beschränkten Repertoire R(K) von Sachbegriffen K
verwendet, welches den durch Sachverhalte Wk beschreibbaren Sachgebieten
angepaßt ist, die in der Kommunikation angesprochen werden. In einer hieran
angepaßten Ausbildung wird dabei ein Repertoire R(Vt) von Symbolen Vt
berücksichtigt, denen die Sachen K dieses Repertoires R(K) mit ausreichend hohen
Wahrscheinlichkeiten p(K/Vt) g ps zugeordnet sind, sowie von weiteren Symbolen
Vt, die in Äußerungen Tp, bezogen auf eine Standardlänge Tps, mit ausreichend
hohen Wahrscheinlichkeiten p(Vt/Tps) zu erwarten sind. In Anpassung an die
Gegebenheiten der Kommunikation werden hierbei beispielsweise Sachgebiete
berücksichtigt, welche die Bestellung und Lieferung bestimmter Waren- und
Dienstleistungssortimente, die Produktion bestimmter Güter, Transportangebote für
Güter und Menschen, Terminabsprachen, die Bedienung bestimmter Maschinen
einschließlich Rechnern oder auch Auskunfteien betreffen.
Entsprechend der erfindungsgemäß vorgesehenen Zuordnung semantischer
Nachrichten TNF sowohl zu einlaufenden wie auch ausgehenden Texten T sind die
Komplexbildungen hierzu durch sämtliche gemäß Verfahren Mp sowohl als Hörer
Hr wie auch Autor At maschinell arbeitende Kommunikationspartner Pa, welche
beispielsweise als Gesprächspartner, Übersetzer, Dolmetscher, Stenotypist oder
Korrektor eingesetzt sind, vorzunehmen, denen somit hierfür die Daten Wp zur
Verfügung zu stellen sind, welche gegebenenfalls die genannten Daten Ws und Wst
einschließen.
Die gemäß Verfahren Mp vorgesehene Beachtung der Anordnungen Pr der
Symbole Vtxy a Gx a N in einem grammatischen Inhalt N bei einer gemäß einem
Verknüpfungshinweis qxyu a Fpxyu a Vtxy eines Symbols Vtxy vorzunehmenden
Verknüpfung einer Sache Kxyu a Fpxyu mit weiteren Sachen Kxyu' weiterer
Symbole Vtxy' a Gx' a N wird allgemein durch Einhaltung der folgenden
Bedingungen Bc erreicht, welche unter Zugrundelegung von gemäß Verfahren M
erstellten grammatischen Nachrichten TN formuliert wird: Sache Kxyu wird auf
eine durch Hinweis qxyu angezeigte Weise mit einer oder mehreren Sachen Kxyu'
a Vtxy' verknüpft, welche, mit Vtxy' a Gx' a Gw' sowie Gx' a Gw', einer oder
mehreren Klassen K1 = Gw' = (Gx') von Einheiten Gx' angehören, die ebenfalls
durch Hinweis qxyu vorgegeben sind, wobei eine solche Einheit Gx' der Einheit Gx
im gleichen Ast As des Inhalts N am rangnächsten in einer ebenfalls durch Hinweis
qxyu vorgegebenen Rangrichtung zugeordnet ist. Bedingung Bc schließt die
Möglichkeit ein, daß anstelle einer dem Symbol Vtxy' zugeordneten Sache Kxyu'
auch ein Sachkomplex Kxyu" zur Verknüpfung mit Kxyu vorzusehen ist, der durch
Verknüpfung von Kxyu' mit weiteren Sachen Kxyu''' weiterer im Inhalt N mit
Vtxy' a Gx', insbesondere rangniedriger verknüpfter, Symbole Vtxy''' a Gx'''
modifiziert wurde, wobei gegebenenfalls auch, wie oben angeführt, den Sprachen L
angepaßte Reihenfolgen zu berücksichtigen sind.
In Anpassung an die Gegebenheiten der Sprachen L und die verfügbaren
Vorrichtungen werden bestimmte, in Nachrichten TNF in ausreichender Häufigkeit
vorkommende Komplexe VtVt von Symbolen Vt mit zugeordneten Komplexen KK
von diesen Symbolen Vt zugeordneten Sachen K auch als Idiome eingesetzt, welche
als zusätzliche, jeweils einem weiteren grammatischen Symbol Gr zugeordnete
Symbole Vt1 = VtVt mit jeweils zugeordneten semantischen Hinweisen Fp1 und
diesen zugeordneten Sachbegriffen K1 = KK und Verwendungshinweisen q1 a Fp1
Verwendung finden. Hierdurch wird auf Kosten eines geringfügig erhöhten
Speicheraufwandes eine Reduzierung des Verarbeitungsaufwandes bei der Bildung
der Nachrichten TNF erreicht.
In einer weiteren Ausbildung werden, soweit die Eigenschaften der Sprachen L dies
zulassen, den Symbolen Vt Verwendungshinweise q zugeordnet, welche
Verknüpfungen des betreffenden, einem Ast As zugeordneten Symbols Vt1y a G1
mit Symbolen Vt2y a G2 von Einheiten G2 dieses Astes As vorgeben, welche darin
in einer bestimmten Rangrichtung, beispielsweise ranghöher, angeordnet sind.
Hierbei bestimmt beispielsweise im Fall G1 k G2 ein Hinweis q1yu a Fp1yu a Vt1y
a G1 die Verknüpfung eines Symbols Vt1y mit einem Symbol Vt2y a G2. Der
damit verbundene Verzicht auf eine zusätzliche Zuordnung von Hinweisen q2yu zu
den Symbolen Vt2y a G2 für deren Verknüpfung mit den Wörtern Vt1y a G1 der
rangtieferen Einheiten G1 hat eine vorteilhafte Datenersparnis bei der Beschreibung
der Symbole Vt in den Daten Wp zur Folge.
Die Bildung semantischer Nachrichten TNF durch Zuordnung semantischer Inhalte
F zu Texten T mit zugeordneten grammatischen Nachrichten TN unter Anwendung
des oben beschriebenen Bayesschen Ansatzes Ba wird im folgenden Beispiel 3)
zunächst für den Fall grammatisch eindeutiger, entsprechend eindeutig
identifizierter und eindeutigen Nachrichten TN zugeordneter, Texte T a TN
erläutert, die hier zunächst abstrakt formuliert und unten durch reale Texte T
konkretisiert werden. Betrachtet werden zunächst 2 Einheiten G1 und G2, die in
einem Inhalt N1 in einer, durch die Valenzen Um dieser Einheiten vorgegebenen,
Anordnung Pr1 gemäß G1 = Gk1 = Ar(G2) entsprechend einer Positionierung P1 =
G2 : G1 vorliegen, wobei hier zunächst jeweils ein Wort Vt11 a G1 und Vt21 a G2
berücksichtigt wird, so daß Inhalt N1 ein Satz S11 a N1 = Vt21 Vt11 zugeordnet ist.
Entsprechend gilt hier neben Text T1 auch Nachricht T1N1, Inhalt N1 und Satz S1
als mit Sicherheit, also p = 1 vorliegende Evidenz D. Berücksichtigt werden Inhalte
F, die aus Sachen K a Fp a Vt gebildet werden, die durch die Evidenz D, hier also
durch die Komplexe S der Wörter Vt a N1, a priori mit ausreichend hohen
Wahrscheinlichkeiten p(K/Vt) g ps oberhalb festzulegender Schwellwerte ps
angezeigt werden. Hierbei sind Vt11 zwei Sachen K111 a Fp111 a Vt11 und K112
a Fp112 a Vt11 zugeordnet. Symbol Vt21 zeigt einen semantischen Hinweis Fp211
a Vt21 an, der eine Sache K211 a Fp211 und einen Verwendungshinweis q211 a
Fp211 umfaßt, der eine Verknüpfung von K211 gemäß (Klyu a Ar(G2)) q211
K211 mit q211 = d fordert. Der Evidenz D = S11 = Vt21Vt11 sind somit a priori
zwei Inhalte F111 = K111 d K211 und F112 = K112 d K211 mit
Wahrscheinlichkeiten p(F111) = p(K111) × p(K211/K111; Pr1) und p(F112) =
p(K112) × p(K211/K112; Pr1) zuzuordnen, worin Pr1 die oben angeführte
Anordnungsbedingung anzeigt. Für die in Ba weiterhin benötigten Werte p(D/F)
gilt hier, mit D = Vt21Vt11, p(D/Fu) = p(Vt21/K211) × p(Vt11/K11u) mit u = 1
oder 2.
Gemäß vorliegenden, einen vorausgesetzten Sachverhalt Wk1 einschließenden
Daten Wp gelte, mit t kk 1, für die in Ba einzusetzenden a-priori-
Wahrscheinlichkeiten in ausreichender Näherung p(Kxyu) = t3 und, unter der
vorgesehenen Beachtung von Bedingung Bc1, weiterhin p(K211/K111) = t,
p(K211/K112) = t3 und p(Vt21/K211) = 1, sowie, wie unten begründet,
p(Vt11/K111) = ½ und p(Vt11/K112) = 1 /2. Gemäß Ba folgt p(F111/D) ue 1 und
p(F112/D) ue t2, wobei Ne ue t4/2. Für die beiden Konkurrenzhypothesen
Ks1 = F111 und Ks2 = F112 folgt bezüglich der vorliegenden Evidenz D also p(Ks1/D gg
p(Ks2/D).
Beispiel 3) dient auch zur Erläuterung der in einer der genannten Ausbildungen des
erfindungsgemäßen Verfahrens Mp vorgesehenen nichtlinearen Verarbeitung Bb
der gemäß Ansatz Ba bestimmten Wahrscheinlichkeiten p(F/D). Verfahrensteil Bb
sieht vor, bei Konkurrenzhypothesen Ksx a (Ksx) einer definitionsgemäß disjunkten
Klasse K1 = (Ksx) Wahrscheinlichkeiten p(Ksx) ge pr oberhalb eines
festzulegenden Referenzwertes pr, gegebenenfalls auch bis auf p = 1, zu erhöhen
und Werte p(Ksx) k pr, gegebenenfalls auch auf p = 0, abzusenken, wobei die
Einhaltung der Wahrscheinlichkeitssumme Ca für diese Hypothesen Ksx
berücksichtigt wird. In der genannten bevorzugten Ausbildung werden
Referenzwerte pr so festgelegt, daß sie um einen bestimmten Faktor b k 1 unterhalb
der Wahrscheinlichkeit p(Ks1) der Hypothese Ks1 mit der höchsten
Wahrscheinlichkeit p(Ksx) liegen. Wird entsprechend im vorliegenden Beispiel 3)
ein Wert b = t gewählt, so folgt p(Ks1/D) = 1 und p(Ks2/D) = 0. Aufgrund der
vorliegenden Evidenz D wird somit die Wahrscheinlichkeit p(K111 d K211) dafür,
daß K111 und K211 zusammen vorliegen, gegenüber einem a priori gemäß den
Daten Wp vorauszusetzenden Sachverhalt Wk1 von einem Wert p = t4 auf einen
durch Sachverhalt Wk2 ausgedrückten Wert p = 1 erhöht.
Gemäß einer oben angeführten Ausgestaltung der Erfindung werden Sachverhalte
Wk durch eine aus mehreren grammatischen Symbolen Vt a G zusammengefügte
Evidenz D = TN auch stufenweise in weitere Evidenzen Wk abgewandelt, wobei
eine Reihenfolge beginnend mit dem Kopf G1 = Gk1 einzuhalten ist, die mit einem
Anhänger G2 = An(G1) und weiteren Anhängern von G2 wie gegebenenfalls auch
von Gk1 fortgeführt wird. Im angeführten Beispiel ergeben sich so zunächst
Sachverhalte Wk2 = Wk2', bei denen aufgrund der Evidenz D = Vt11
Wahrscheinlichkeiten p(K111/D) = ½ und p(K112/D) = ½ gelten, die bei der
anschließenden Berücksichtigung des Anhängers G2 = An(G1) in Sachverhalte
Wk2 = Wk3' abgewandelt werden, für die sich hier wieder die oben genannten
Wahrscheinlichkeitswerte p ergeben.
Im allgemein zu berücksichtigenden Fall eines grammatisch mehrdeutigen Textes
T, der als Evidenz D einer disjunkten Klasse (TN, TN) von Folgen grammatischer
Nachrichten TN zuzuordnen ist, ist vorgesehen, im Ansatz Ba entsprechende
weitere a-priori-Wahrscheinlichkeiten der Form p(T/N) und entsprechend p(T/N, N)
zu berücksichtigen. In einer vorteilhaften Ausführungsform wird gemäß dem
Prinzip der maximalen Entropie für diese Wahrscheinlichkeiten Gleichverteilung
angenommen, f 64848 00070 552 001000280000000200012000285916473700040 0002010015858 00004 64729alls keine hiervon ausreichend stark abweichenden, beispielsweise
aus dem grammatischen Verfahren M resultierenden Hinweise vorliegen.
Die erfindungsgemäß vorgesehene Verwendung von, in den Nachrichten TNF
zugleich als Textsymbole Gt, grammatische Symbole Gr und semantische Symbole
Gp einzusetzenden, Symbolen Vt, denen jeweils eine disjunkte Klasse K1 = (Gp)
alternativ geltender semantischer Hinweise Fp zugeordnet ist, die sowohl
unterschiedliche Sachbegriffe K als auch unterschiedliche Verwendungshinweise q
hierfür umfassen, erlaubt es einerseits, die für natürliche Sprachen L typische
semantische Vieldeutigkeit einzelner Textabschnitte T in ausreichendem an die
Sprachen L angepaßtem Maß wiederzugeben, während andererseits die vorgesehene
Berücksichtigung quantitativer Eigenschaften H(Vt) einschließlich H(K) der
Symbole Vt und Sachbegriffe K in Verbindung mit den quantitativen
Verarbeitungsverfahren Ba und Bb zugleich eine effektive und sichere Festlegung
des durch einen solchen Textabschnitt T in einer Nachricht TNF übermittelten
semantischen Inhalts möglich macht, wobei die für Sprachen L charakteristische
Abhängigkeit dieses Inhalts vom jeweiligen Kontext berücksichtigt wird, wie er
durch weitere Textabschnitte T dieser Nachricht TN sowie durch die betreffende,
durch einen vorausgesetzten pragmatischen Sachverhalt Wk1 beschriebene
Situation gegeben ist. Dabei hat diese Zuordnung jeweils mehrerer semantischer
Hinweise Fp zu einem Symbol Vt vorteilhaft zur Folge, daß in einer Sprache L eine
große Vielfalt von semantischen Inhalten F und pragmatischen Sachverhalten Wk
durch eine vergleichsweise geringe Zahl von Symbolen Vt dargestellt und
übermittelt werden kann, vorausgesetzt, daß der Speicher- und
Verarbeitungskapazität verfügbarer Vorrichtungen anpaßbare Vorgehensweisen zu
deren Kombination bereitstehen, wie sie durch das erfindungsgemäße Verfahren
Mp aufgezeigt werden. Dabei erlaubt es die vorgesehene Verwendung von Wörtern
Vt, die zugleich als grammatische Symbole Gr und als semantische Symbole Gp
fungieren, solche Kombinationen sowohl aufgrund grammatischer, syntaktische
Zusammenhänge berücksichtigender, Eigenschaften H(Gr) wie auch zusätzlich
aufgrund semantischer und pragmatischer Eigenschaften H(Gp) einschließlich H(K)
zu erzeugen, woraus eine erhöhte Sicherheit bei der Zuordnung semantischer
Nachrichten TNF insbesondere auch bei gestörten oder nicht normgerecht oder
fehlerhaft abgefaßten Texten resultiert. Verfahren Mp schließt nicht aus, zusätzlich
zu den genannten Daten H(Vt) weitere vorliegende Daten beispielsweise über
statistische Eigenschaften H(Gt) von Textsymbolen Gt wie Zeichen Z oder
Zeichenkomplexen ZZ zu berücksichtigen, wie sie beispielsweise in den genannten,
beim gegenwärtigen Stand verwendeten Markov-Wahrscheinlichkeiten für die
Aufeinanderfolge solcher Komplexe ZZ einschließlich lexikalischer Wörter
vorliegen.
Zur datensparenden Berücksichtigung der in Sprachen L anzutreffenden
Abhängigkeit der Schreib- beziehungsweise Ausspracheweise der zu verwendenden
Wörter Vt vom jeweiligen Textzusammenhang werden diese Wörter Vt in den
Daten Wp auch unter Verwendung der oben genannten, auch in Verfahren M
benutzten Operatoren o notiert, welche in Texten T bestimmte Abänderungen
bewirken und darin im Regelfall verschwinden. Hiervon fordert o = /g/ die
Großschreibung des ersten einem Text T a Su von Sätzen Su a N angehörigen
Worttextes Ts a Vt a Su a N sowie die Einhaltung eines Abstands zu einem diesem
vorangestellten Textabschnitt T. Operator o = /_/ fordert die Einhaltung eines, auch
durch einen Zeilenwechsel gewährleisteten, Abstands zu einem vorangestellten
Text T, o = /=/ die Zusammenschreibung als Präfix oder Suffix mit einem
angrenzenden Text T unter Aufhebung eines diesem gegebenenfalls zugeordneten
Abstandszeichens, wobei eine Großschreibung dieses Textes T gegebenenfalls vom
Präfix übernommen wird. Weitere den jeweiligen Sprachen L angepaßte Operatoren
o sehen beispielsweise im Englischen die Verlängerung des lexikalischen Wortes /a/
zu /an/ vor Vokalen vor usw. Operatorfunktionen werden beispielsweise auch
bestimmten Satzzeichen zugeordnet, welche beispielsweise den Wegfall
angrenzender Satzzeichen fordern, ohne im Text T zu verschwinden. Eine weitere
Dateneinsparung bei der Speicherung objektiver Wörter Vt a G in den Daten Wp
wird auch durch deren Notation als Komplexe Vt = vtvt der genannten Teilwörter vt
erreicht, welche, in entsprechenden Komplexen G = gg angeordneten, Teileinheiten
g = (vt) zugeordnet werden.
Zur weiteren Erläuterung des erfindungsgemäßen Verfahrens Mp werden die
Wörter Vt des obigen Beispiels 3) durch Texte Ts a Vt aus der deutschen
Schriftsprache L konkretisiert, welche durch ihre Normtexte Tsa, notiert auch als
Tsaxy = Vtxy, repräsentiert werden, die mit Hilfe der genannten Operatoren o als
Folgen von Druckbuchstaben und eingeführten Satzzeichen Z notiert werden.
Entsprechend der hierfür angenommenen Eindeutigkeit fallen die so notierten
Wörter Vt und Wortfolgen VtVt als eindeutige Evidenzen D an. Den angeführten
Daten Wp des Beispiels 3) werden zunächst die objektiven Wörter Vt11 =
vt111vt121vt131 = /gPflaumen./ mit vt111 = /g/, vt121 = /_Pflaumen/ und vt131 =
/./ sowie Vt21 = /_reife/ zugeordnet, die zum Satz S11 = vt111Vt21vt121vt131 =
/Reife Pflaumen./ kombiniert werden. Hierbei gilt G2 = An(G1), wobei diese
Anordnung Pr durch eine Positionsangabe P = g11 : G2 : g12 näher bestimmt ist, bei
welcher G2 definitionsgemäß weitere gegebenenfalls von G2 abhängige Einheiten
G mit einschließt.
Die den Symbolen Vt von Beispiel 3) zugeordneten Sachen K a Fp a Vt werden hier
durch die folgenden, mit Hilfe nicht explizit ausgeführter Mengen und Obermengen
A beschriebenen Umschreibungen charakterisiert: K111 = "Früchte der Art A11;
K112 = "Menschen A12 mit mangelhafter Leistung A21 a A2 in beliebigen
Disziplinen A2"; K211 = "den Reifegrad A3 von Früchten A11 betreffende
Eigenschaft A31". Die für Inhalt F111 von S11 vorzunehmende
Durchschnittsbildung F111 = K111 d K211 wird entsprechend verkürzt als
Mengenbildung A11 d A31 des Inhalts "gemäß A31 reife Früchte der Art A11"
umschrieben. Für F112 = K112 d K211 folgt ein durch "gemäß A3 reife
Minderleister A12 der Art A21" umschriebener Inhalt, dem den Daten Wp zufolge,
wie oben ausgeführt, eine im Vergleich zu p(F111) äußerst geringe
Wahrscheinlichkeit p(F112) zukommt. Die in den Daten Wp durch p(Vt11/K11u) = ½
angenäherten Wahrscheinlichkeiten drücken aus, daß K111 auch durch ein oben
nicht angeführtes Wort Vt12 mit dem Teilwort vt122 = /Zwetschgen/ und K112
auch durch ein weiteres Teilwort vt123 = /Flaschen/ angezeigt werden kann.
Wird in Beispiel 3) für das Symbol Vt21 zusätzlich ein weiterer Hinweis Fp212 =
(K212; q212) mit q211 = d und K212 etwa im Sinne von "nicht mehr
entwicklungsfähig und somit reif für die Ablösung durch andere Personen" mit
p(K212/K112) = t berücksichtigt, so folgt für den weiteren möglichen Inhalt F113 =
K112 d K212 annähernd p(F113/D) = p(F111/D). Wird ferner die Möglichkeit
berücksichtigt, daß dem Satz S11, etwa durch eine vorangegangene Aussage oder
geltende Situation, ein von den allgemeinen Daten Wp abweichender Sachverhalt
Wk1 vorauszusetzen ist, wonach mit hoher Wahrscheinlichkeit p(K112) = (1-pa),
mit pa kk 1, zu erwarten ist, daß besagte "Minderleister der Art A21" angesprochen
werden, so folgt sogar p(F113/D) g p(F111/D). Hinweis Fp212 wird im folgenden
vernachlässigt.
Weitere Verwendungsarten der pragmatischen Hinweise Fp werden an einer
Erweiterung des Beispiels 3) um ein objektives Wort Vt31 = /_un=/ mit Vt31 a G3
ersichtlich, bei dem der oben angeführte Operator o = /=/ eine
Zusammenschreibung von Ts311 = Vt31 als Präfix eines einem Träger Ar(G3)
zugeordneten Wortes wie Vt21 a G2 fordert. Zusammen mit Vt11 und Vt21 wird so
ein Satz S21 = vt111Vt31Vt21vt121vt131 = /Unreife Pflaumen./ mit S21 a N2
möglich, worin N2 durch G2 = An(G1) und G3 = An(G2) bestimmt ist. Gemäß
Fp311 a Vt31 ist, mit q311 = f, die oben behandelte Verneinung K21u f K311 des
Inhalts K2yu a Vt2y a G2 des Trägers G2 = Ar(G3) zu bilden. Wie oben erläutert,
gilt für die durch den Oberbegriff A3 = "den pflanzlichen Reifegrad betreffend"
charakterisierte Sache K211 = A31 a A3 die Beziehung A31 s A32 = A3, wobei
A32 für die Negation von A31, also für "unreif" steht, für welche in ausreichender
Näherung p(A31/A3) + p(A32/A3) = 1 gelte. Ferner gelte p(K211/K111) =
p(A3/K111) × p(A31/A3) = t mit p(A3/K111)= a, p(A31/A3) = b und a × b = t
sowie p(K311/K211, K111) = p(A3/K111) × (1 - p(A31/A3)) = a × (1-b). Da
p(A3/K112) ue p(K211/K112) = t3, folgt gemäß Ba und Bb auch für S21 ein
einziger pragmatischer Inhalt F211 mit ausreichender Wahrscheinlichkeit
p(F211/D)), der mit "Früchte A11 ohne Reife A31" zu umschreiben ist.
In Anpassung an den Sprachgebrauch lassen sich die Daten Wp des Beispiels 3)
durch eine weitere Sache K213a Fp213 a Gp21 a Vt21, ebenfalls mit q213 = d,
ergänzen, wonach das Wort /_reif/ auch "einen hohen Entwicklungsgrad von
Perfektion A22 in einer beliebigen Disziplin A2" anzeigen kann. Bei
Berücksichtigung von K213 läßt sich der Evidenz S21 neben F211 ein weiterer
Inhalt F212 etwa des Sinnes "unterentwickelte Nichtskönner" zuordnen, da den
hierfür benötigten Wahrscheinlichkeiten p(K112), p(A2/K112) und (1 - p(A22/A2))
ausreichend hohe Werte zukommen, so daß p(F212/S21) uep (F211/S21) folgt.
Zur weiteren Erläuterung der Funktion der Verwendungshinweise q wird Beispiel
3) durch eine weitere Einheit G4 mit den Wörtern Vt41 = /_und große/ und Vt42 =
/_und grüne/ erweitert. Gemäß dem angewandten grammatischen
Kommunikationsverfahren M werden hierbei grammatische Symbole Vt eingesetzt,
die im Einklang mit den dem Verfahren M und Mp zugrunde gelegten
Transformationen Q aus mehreren natürlichen Wörtern zusammengesetzt sind,
wogegen, ebenfalls im Einklang mit den Q, das oben angeführte Wort Vt31 einen
Teil eines natürlichen Wortes repräsentiert. Für die beiden semantischen Symbole
Gp4u a Vt4u werden, mit u = 1 oder 2 und v = 1 oder 2, jeweils 2 pragmatische
Hinweise Fp4uv berücksichtigt, die jeweils die gleiche Sache K4u1 = K4u2, jedoch
jeweils 2 unterschiedliche Verknüpfungshinweise q4ul und 14u2 beinhalten.
Hierzu gilt q411 = q421 = G4 d (Ar(G4)) d Ar(Ar(G4))) mit G1 a Ar(Ar(G4))) und
G2 a Ar(G4), wobei die angeführten Einheiten Gx die durch den Satz Sa N
angezeigten Hinweise Fpxyu a Gpxy a Vtxy a Gx a N symbolisieren. Weiterhin gilt
mit dieser Symbolik q412 = q422 = (G4 d Ar(Ar(G4))) s (Ar(G4) d Ar(Ar(G4))).
Die zugeordneten Sachen K41v a Gp41 a Vt41 werden durch K41v = "ein
bestimmtes Ausmaß A71 einer Eigenschaft räumliche Ausdehnung A7" und K42v
= "eine bestimmte Ausprägung A81 einer Eigenschaft Farbe A8" umschrieben.
Betrachtet werden die Sätze S31 = /Reife und große Pflaumen./ und S32 = /Reife
und grüne Pflaumen./ mit S31 a N3 und S32 a N3, wobei der grammatische Inhalt
N3 durch Erweiterung von N1 um den zusätzlichen Anhänger G4 = An(G2) erzeugt
wird. Bezogen beispielsweise auf Satz 31 zeigt q411 also an, daß ein Durchschnitt
von Vt41 mit dem Durchschnitt von Vt21 und Vt11 zu bilden ist, während q412 die
Vereinigung des Durchschnitts von Vt41 und Vt11 mit dem Durchschnitt von Vt21
und Vt11 fordert. Entsprechend sind also für die beiden Sätze S3u jeweils 2
semantische Inhalte F3uv in Betracht zu ziehen, wenn hier die oben
berücksichtigten Sachen K112 und K121 vernachlässigt werden. Gemäß Ansatz Ba
sind dabei, mit u = 1 oder 2, a priori zunächst die folgenden 4
Wahrscheinlichkeitswerte zu berücksichtigen:
p(F3u1) = p(K111) × p(K211/K111) × p(K4u1/K211, K111) und
p(F3u2) = p(K111) × p(K211/K111) + (p(K4u1/K111)-pu),
worin pu = p(K211/K111) × p(K4u1/K211, K111) die Wahrscheinlichkeit des Durchschnitts von K211 und K4u1 unter den angeführten Bedingungen anzeigt.
p(F3u1) = p(K111) × p(K211/K111) × p(K4u1/K211, K111) und
p(F3u2) = p(K111) × p(K211/K111) + (p(K4u1/K111)-pu),
worin pu = p(K211/K111) × p(K4u1/K211, K111) die Wahrscheinlichkeit des Durchschnitts von K211 und K4u1 unter den angeführten Bedingungen anzeigt.
Neben obigen Daten Wp gelte
p(K411/K211, K111) = 0,8,
p(K421 /K211, K111) = t2 und p(K4u1/K111) = t.
p(K411/K211, K111) = 0,8,
p(K421 /K211, K111) = t2 und p(K4u1/K111) = t.
Hiermit folgt p(F311) = 0,8t4, p(F312) = 1,2t4, p(F321) = t6 und p(F322) ue 2t4.
Unter der vereinfachenden, dem Sprachgebrauch allerdings häufig nicht
entsprechenden Annahme, daß für die in Ba weiterhin zu berücksichtigenden
Wahrscheinlichkeiten p(S/F) einheitlich gleich hohe Werte p(S3u/F3uv) = a,
beispielsweise mit a = 1 zu setzen seien, folgt bei Satz S32 für Inhalt F321, wonach
von "Pflaumen, die zugleich reif und grün sind," die Rede ist, eine sehr geringe
Wahrscheinlichkeit p(F321/S32) = 0,5t2, während sich für F322, wonach "reife
Pflaumen und zusätzlich grüne Pflaumen" angesprochen sind, p(F322/S32) ue 1
ergibt. Bei Satz S31, der gemäß Verfahren M, auch dem intuitiven Urteil von
Experten entsprechend, als grammatisch identisch mit Satz S32 eingestuft wird,
würden sich so dagegen für die Inhalte F311 = "Pflaumen, die zugleich reif und
groß sind" und F312 = "reife Pflaumen und zusätzlich große Pflaumen" annähernd
gleich hohe Wahrscheinlichkeiten p(F311/S31) = 0,4 und p(F312/S31) = 0,6
ergeben.
Da jedoch Inhalt F321 aufgrund zu beachtender a-priori-Wahrscheinlichkeiten
durch Satz S32 praktisch nicht ausdrückbar ist, ist dem Sprachgebrauch
entsprechend p(S32/F321) kk 1, im einzelnen auch p(Vt42/Fp421; Fp211) kk 1 zu
setzen. Gemäß Expertenurteil wird ferner durch Satz S31 nicht Inhalt F312, sondern
F311 ausgedrückt, wonach sich also ein Sprachgebrauch entwickelt hat, der durch
p(S31/F311) gg p(S31/F312) gekennzeichnet ist. Wird für die Daten Wp
entsprechend beispielsweise p(S31/F311) = 0,8 und p(S31/F312) = 0,2 festgelegt,
so folgen aus Ba dem Expertenurteil besser entsprechende Werte p(F311/S31) ue
0,7 und p(F312/S31) ue 0,3.
Um eine datensparende Formulierung der Daten Wp zu erreichen, sieht die
Erfindung vor, semantischen Hinweisen wie den Fp4yu a Vt4y der Wörter Vt4y
einer Einheit G4, soweit die betreffende Sprache L dies zuläßt, weitgehend
identische Verknüpfungshinweise, hier also q4yu1 = d und q4yu2 = s zuzuordnen.
Wegen der bei einem gemäß Wp vorliegenden Repertoire R(Vtxy) kombinatorisch
mit den Symbolen Vtxy explodierenden Möglichkeiten von Satzbildungen S = VtVt
werden ferner die genannten, für die Wahrscheinlichkeitsbestimmung gemäß Ba
benötigten, Wahrscheinlichkeiten p(S/F) als Produkte von Termen p(Vtxy/Fpxyu)
gebildet, die in den Daten Wp annähernd linear mit der Zahl der Wörter Vt
anwachsen. Werden so beispielsweise in Beispiel 3) vereinfachend Werte
p(Vt1y/Fp1yu) = 1, p(Vt2y/Fp2yu) = 1, p(Vt4y/Fp4yu1) = 1 und p(Vt4y/Fp4yu2) =
0,1 festgelegt, wobei, wie oben, q4yu1 = d und q4yu2 = s gilt, so folgen für die
genannten Sätze S31 = vt111Vt21Vt41vt121vt131 und S32 =
vt111Vt21Vt42vt121vt131 hieraus Zuordnungswahrscheinlichkeiten p(S31/F311) =
1, p(S31/F312) = 0,1, p(S32/F321) = 1 und p(S32/F322) = 0,1. Mit den oben
berechneten Werten p(F) ergeben sich bei S31 Wahrscheinlichkeiten p(F311/S31) =
0,87 und p(F312/S31) = 0,13, wonach der mit q = d gebildete Inhalt F als angezeigt
gilt. Für S32 folgen unter der Annahme t = 0,1 dagegen Wahrscheinlichkeiten
p(F321/S32) = 0,05 und p(F322/S32) = 0,95, wonach, ebenfalls im Einklang mit
einem Expertenurteil, der mit q = s gebildete Inhalt F als ausgedrückt gilt.
Entsprechend einer der genannten Ausgestaltungen sieht die Erfindung auch vor,
bei Verwendungshinweisen q die Verknüpfungsparameter wie q412 a Fp412 a Vt41
und q422 a Fp422 a Vt42 von Beispiel 3) durch Parameter qr zu ergänzen, welche
eine numerische Reduzierung der bei der Verknüpfung der Sachen K41w a F41
beziehungsweise K42w a F42 mit den Sachen K der Wörter Vt2y a G2 und Vt1y a
G1 dieses Beispiels erzielten Wahrscheinlichkeiten p(KK) der betreffenden
Komplexe KK bewirken. Wird beispielsweise dem Sprachgebrauch entsprechend
(qr a Fp412) = 0,1 gesetzt, so folgt, nun wieder unter der Annahme p(D/F) = 1,
intuitionsgerecht p(F311/S31) = 0,87 und p(F312/S31) = 0,13. Mit diesem qr-Wert
bleibt zugleich bei Satz S32 die Beziehung p(F321/S32) kk p(F322/S32) gewahrt,
wie es der Expertenmeinung entspricht. Beispielsweise folgen so bei einem Wert t =
0,1 Wahrscheinlichkeiten p(F321/F32) = 0,05 und p(F322/S32) ue 1.
Zur weiteren Erläuterung der durch Verfahren Mp gegebenen Möglichkeit, im
Einklang mit dem intuitiven menschlichen Sprachgebrauch durch Kombination an
sich mehrdeutiger Textabschnitte T mit quantitativ bestimmbarer Sicherheit und
Eindeutigkeit eine Vielzahl unterschiedlicher semantischer Inhalte F und
pragmatischer Sachverhalte Wk kontextgerecht auszudrücken, wird Beispiel 3)
durch weitere Symbole Vt erweitert. Betrachtet werden, jeweils wieder mit Vtxy a
Gx, die Wörter Vt14 = vt111vt124vt131 = /gForscher./ und Vt15 =
vt111vt125vt131 = /gGeschwindigkeiten./ mit den Sachen K141 a Fp141 a Vt44) =
"Menschen A12, die eine Forschungstätigkeit A51 wahrnehmen" und (K151 a
Fp151 a Vt15) = "den Zeitablauf A61 beliebiger Vorgänge A6 betreffend".
Weiterhin gilt Vt22 = /_große/ mit der bereits Vt41 zugeordneten Sache K221 =
K411 = "Ausmaß A71 einer räumlichen Ausdehnung A7". In Anpassung an den
Gebrauch dieser Sprache L wird Vt22 wie auch Vt41 noch eine weitere Sache
(K222 a Fp222) = (K412 a Fp412) zugeordnet, die als "bestimmtes Ausmaß A91
einer beliebigen Eigenschaft A9 betreffend" umschrieben wird. Für sämtliche
Verknüpfungsparameter gilt q21z = q41z = d. Dem oben betrachteten
grammatischen Inhalt N1 sind so die weiteren Sätze S12 = Vt22Vt14 = /Große
Forscher./ und S13 = Vt22Vt15 = /Große Geschwindigkeiten./ hinzuzufügen. Nach
den hierfür in Betracht gezogenen semantischen Hinweisen Fp läßt sich S12 zum
einen ein Inhalt F122 = K141K222 im Sinne von "hoch befähigte Forscher
A12A51" zuordnen, zum anderen scheint zunächst wegen der
Bedeutungsmöglichkeiten K221 = "räumlich groß" von Vt22 disjunkt auch ein
Inhalt F121 im Sinne von "hochgewachsene Forscher" nicht unmöglich. Es erweist
sich jedoch p(F122/S12) gg p(F121/S12), wenn die gemäß Ba zu
berücksichtigenden Werte p(Fxyu) × p(S12/Fxyu) verglichen werden. Im einzelnen
ergeben sich mit den eingeführten Oberbegriffen A unter Berücksichtigung
entsprechend bereitzustellender Daten Wp für die den Aufbau von Inhalt F122
bestimmenden Terme ausreichend hohe Wahrscheinlichkeiten p(F122) =
p(A12A51A91) = p(A12) × p(A51/A12) × p(A91/A51), wobei hier A51 = A9.
Weiterhin gelten auch ausreichend hohe Werte p(S12/F122) = p(Vt14/A12A51) x
p(Vt22/A91) für die Zuordnung der gewählten Wörter Vt zu diesem Inhalt. Der
alternative Inhalt F121 ist dagegen als Sachkomplex F121 = K141A7K221 =
A12A51A7A71 darzustellen, da sich nur so aufgrund der angesprochenen Begriffe
und diese verknüpfenden Bezüge eine ausreichend hohe Wahrscheinlichkeit
p(F121) = p(A12) × p(A51/A12) × p(A7/A12) × p(A71/A7) finden läßt. Die
Wortwahl S12 wird bei Inhalt F122 = "großartige Forscher" durch ausreichend
wahrscheinliche Terme gestützt gemäß p(S12/F122) = p(Vt14/A12A51) x
p(Vt22/A91). Dagegen ergibt sich für F121 = "hochgewachsene Forscher" ein nicht
ausreichend wahrscheinlicher Wert p(S12/F121) = p(Vt14/A12A51A7) x
p(Vt22/A71) für den ersten Produktterm, da zwar Vt22 häufig zum Ausdruck
räumlicher Größe benutzt wird, nicht jedoch das Wort Vt14 = /gForscher./, wenn
bei "Menschen A12" nicht nur ihre "Forschertätigkeit A51", sondern zusätzlich
auch ihre "räumliche Ausdehnung A7" angesprochen werden soll.
Auch in Satz S13 = /Große Geschwindigkeiten./ ist nicht vom "Ausdehnungsaspekt
A7" von Sache K221 a Vt22 die Rede, da für einen hierfür zugrunde zu legenden
Inhalt F132 = K151A7K221 mit K151 = A6A61 in der hierfür zu bildenden
Wahrscheinlichkeit p(F132) = p(A6) × p(A61/A6) × p(A7/A6) × p(A71/A7) dem
Term p(A7/A6) k ps und so auch p(F 132) k ps keine ausreichend hohen p-Werte
zukommen. Angesprochen wird durch S 13 also eindeutig ein Inhalt F131 =
K151K222 = A6A61A91 mit A61 = A9, der im Wortsinn "hohe
Geschwindigkeiten" bedeutet, bei dessen Wahrscheinlichkeit p(F131) = p(A6) x
p(A61/A6) × p(A91/A9) für alle Terme ausreichend hohe p-Werte anzunehmen
sind.
Die Vielfalt der in Verfahren Mp durch Kombination mehrdeutiger Symbole
abdeckbaren Sprachinhalte, die sich in Verfahren Mp durch Kombination
semantisch mehrdeutiger Symbole jeweils eindeutig abdecken lassen, wird weiter
verdeutlicht durch Ergänzung des Beispiels 3) durch eine weitere Einheit G5, deren
Möglichkeiten grammatischer Anordnungen Pr unter anderem durch eine
Rangangabe G2 = Ar(G5) und Positionsangabe P = Ar(G5) : G5 beschrieben werden.
Betrachtet werden die Wörter Vt51 = /, große/ und Vt52 = /,grüne/, denen
semantische Hinweise Fp5uv mit Sachen K511 = K411 und K521 = K421 sowie
gleiche Verwendungshinweise q511 = q521 = d zur Durchschnittsbildung d der
Sache KSuv mit einer Sache Kxyu a Vtxy a G1 eines Wortes Vtxy der rangnächsten
ranghöheren Einheit Gx g G5 zugeordnet sind, wobei definitionsgemäß Sache Kxyu
durch Sachen K a Vt a G weiterer Anhänger G = An(Gx) modifiziert sein kann.
Einem entsprechend gebildeten Satz S41 = /Reife, große Pflaumen./ wird hiermit
eindeutig ein Inhalt F411 = F311 zugeordnet, zu dessen Darstellung somit S41
wegen der Mehrdeutigkeit des oben gebrachten Satzes S31 vorzuziehen ist, woraus
auch, dem Gebrauch der deutschen Sprache L entsprechend, die oben angeführte
geringe, für Ansatz Ba benötigte, Wahrscheinlichkeit p(S31/F311) folgt. Dem mit
Vt52 erzeugbaren Satz S42 = /Reife, grüne Pflaumen./ wird mit den genannten
Daten ein Inhalt F421 = F321 im Sinne etwa von "grün und trotzdem reif" eindeutig
zuordenbar, während der gleiche Inhalt F321 wegen seiner, gemäß Ba zu
berücksichtigenden geringen sachlichen Wahrscheinlichkeit p(F321) = p(F421)
durch den oben genannten Satz S32 praktisch nicht ausdrückbar ist.
Die aus der Einführung der Teileinheiten g a G vorteilhaft resultierende
Datenersparnis bei der Formulierung der Daten Wp wird bei der Berücksichtigung
einer weiteren Einheit G6 = g11g61g12g13 in Beispiel 3) deutlich, welche unter
Verwendung der für G1 benützten Teileinheiten g11, g12 und g13 und einer
Teileinheit g61 mit Teilwörtern vt61y a g61 wie vt611 = /_die/ und vt612 = /_diese/
usw. formuliert wird. Bei Verwendung einer weiteren Einheit G7 mit Wörtern wie
Vt71 = /_reifen/, Vt71 = /_großen/ usw. werden mit G6 = Gk6 und G7 = An(G6)
bei Beachtung einer Positionierung P = g61 : G7 : g12 hiermit Sätze wie S51 = /Die
reifen Pflaumen./ usw. möglich. Daß Einheit G6 von Einheit G1 grammatisch zu
unterscheiden ist, folgt beispielsweise auch daraus, daß Anordnungen Pr mit G2 =
An(G6) und G7 = An(G1) zu nicht korrekten Texten T ne Tf wie T = /Die reife
Pflaumen./ beziehungsweise T = /Reifen Pflaumen./ führen würden.
Die erfindungsgemäße Bewältigung sprachüblicher Mehrdeutigkeiten wird auch aus
einer weiteren Erweiterung des Beispiels 3) durch eine Einheit G8 mit Verbformen
der 3. Person Plural wie Vt81 = /_schmecken/ und G9 mit Adverbien wie Vt91 =
/_gut/ und Vt92 = /_sauer/ ersichtlich. Gemäß den Daten Wp gelte für die
Anordnungen Pr neben weiteren Möglichkeiten G8 = An(G1) und G9 = An(G8) mit
entsprechenden Positionsangaben P, wonach Sätze wie S61 = /Pflaumen
schmecken./, S71 = /Pflaumen schmecken gut./ und S72 = /Pflaumen schmecken
sauer./ möglich werden. Den Transformationen Qs entsprechend werden Vt81
disjunkte semantische Hinweise Fp811 mit einer Sache K811 und Fp812 mit einer
Sache K812 = K811 d K911, beide mit einem Verknüpfungsparameter q811 = q812
= d zur Durchschnittsbildung mit einer Sache K a Ar(G8) zugeordnet. Weiter gilt
für Vt91 ein Hinweis Fp911 mit Sache K911 und für Vt92 ein Hinweis Fp921 mit
Sache K921, beide mit q911 = q921 = d für die Durchschnittsbildung mit einem
Sachkomplex KK mit Sachen K a Ar(G9) und K a Ar(Ar(G9)). Hierbei werden,
jeweils wieder vereinfachend, Autorenmeinungen angezeigt, wonach bei K811 eine
gemäß q811 verknüpfte Sache "beliebig auf die Geschmacksnerven wirkt", bei
K911 "einem gemäß q911 verknüpften Sachkomplex eine angenehme Wirkung
zukommt", und bei K912 "eine als sauer empfundene Wirkung zukommt". Unter
Sache K111 a Vt11 werden wie oben die "Früchte" verstanden. Dem
Sprachgebrauch entsprechend wird also Vt81 neben K811 eine weitere Sache K812
= K811 d K911 im Sinne von "angenehm auf die Geschmacksnerven wirkend"
zugeordnet.
Mit entsprechenden Daten Wp wird für Satz S61 ein semantischer Inhalt F611 =
K111 d K812 = K111 d K811 d K911 im Sinne von "Pflaumen schmecken gut"
gegenüber dem pragmatisch wahrscheinlicheren, semantisch aber weniger
wahrscheinlichen Inhalt F612 = K111 d K811 im Sinne von "Pflaumen schmecken
irgendwie" bevorzugt, da der Unterschied der in Ba einzusetzenden pragmatischen
Werte gemäß p(K812/K111) k p(K811/K111) durch den in Ba entgegen wirkenden
Unterschied im Sprachgebrauch gemäß p(Vt81/K812) gg p(Vt81/K811)
überkompensiert wird. Trotz dieses Sprachgebrauchs zeigt Wort Vt81 in den Sätzen
S71 und S72 nicht K812, sondern K811 an, da in S71 die Bildung eines Inhalts
F711 = K111 d K811 d K911 = F611 durch Hinzufügung der Sache K911 a Vt91 zu
Inhalt F611 a S61 wegen p(F71) = p(F611) keine Information j hinzufügen, also
Bedingung Bbr verletzen würde. In Satz S72 würde sich bei Hinzufügung von
Sache K921 a Vt92 zu F611 wegen p(K921/K911) ue 0 für einen mit K812 zu
bildenden pragmatischen Inhalt F722 = K111 d K812 d K921 wegen p(K921/K812)
kk 1 eine entsprechend zu vernachlässigende pragmatische Wahrscheinlichkeit
p(F722) ue 0 ergeben. Wie aus dem weiteren Textbeispiel /Köche schmecken den
Unterschied./ folgt, kann ein Textabschnitt t = /_schmecken/ auch als transitive
Verbform Vt eingesetzt werden, welche gemäß Verfahren M einem anderen als dem
angeführten Symbol Vt81 a G8 zuzuordnen ist und entsprechend weitere, in
Beispiel 3) nicht berücksichtigte semantische Hinweise Fp anzeigt. Daß das in
Beispiel 1) als Wort (Vt31 a G3) = /_nicht/ eingeführte Symbol nicht ebenfalls der
Einheit G9 des Beispiels 3) zuordenbar ist, folgt aus weiteren Texten T mit
Abschnitten wie /. . . schmecken sehr gut/, in denen bei den Transformationen Q bei
Ersatz von /_gut/ durch_/nicht/ Invarianzbedingungen I verletzt würden.
Die Bedeutung der Verwendung semantischer Hinweise Fp a Vt, welche den
Wörtern Vt jeweils nicht nur disjunkt unterschiedliche Sachbegriffe K a Fp, sondern
grundsätzlich auch disjunkt unterschiedliche Verwendungshinweise q a Fp
zuordnen, für eine sprachgerechte Anwendbarkeit des Verfahrens Mp läßt sich
anhand einer Erweiterung des Beispiels 3) durch ein weiteres Teilwort vt126 =
/_Fahnen/ eines entsprechenden Wortes Vt16 a G1 sowie durch ein Wort (Vt23 a
G2) = /_blaue/ und durch die Wörter (Vt32 a G3) = /_weiß=/ und (Vt33 a G3) =
/_grau=/ deutlich machen. Hierzu werden 2 Sätze S22 = /graublaue Pflaumen./ und
S23 = /Weißblaue Fahnen./ betrachtet, deren Inhalte F221a S22 grob durch
"Pflaumen A11, die einheitlich in einer aus blau B1 und grau B2 gemischten Farbe
B3 gefärbt sind" und F231a S23 mit "Fahnen B4, die blau gefärbt B1 und
zusätzlich (an anderen Stellen) weiß gefärbt B5 sind", umschrieben werden, wobei
neben dem oben eingeführten A11 die Begriffe Bx die entsprechenden Sachbegriffe
Kxyu a Fpxyu a Vtxy charakterisieren gemäß B1 = K231, B2 = K331, B4 = K161
und B5 = K321. Dem Sprachgebrauch angepaßt sind Verwendungshinweise q zu
berücksichtigen, die als q321 = q331 = d und vereinfachend q322 = q332 = s(d)
notiert werden. Hierin zeigt d eine Durchschnittsbildung G1 d G2 d G3 an, worin
die Einheiten G für die jeweiligen Sachen K a Vt a G stehen, während s(d)
komplexer eine Vereinigung von Durchschnitten gemäß (G1 d G2) s (G1 d G3)
fordert, wobei die Verknüpfungshinweise, wie allgemein definiert, sich jeweils auf
die am rangnächsten in Inhalt N angeordneten Einheiten G beziehen. Hiermit lassen
sich unter anderem die Inhalte (F221 a S22) = A11B3 mit B3 = B1B2 für Satz 22
und F231 = (B4 d B1) s (B4 d B5) für S23 bilden, für deren in Ansatz Ba zu
berücksichtigende Sachwahrscheinlichkeiten p(F) sich ausreichend hohe Werte
p(F221) = p(B1) × p(B2/B1) × p(A11/B3) sowie, im anzunehmenden Fall einander
ausschließender Inhalte (B4 d B1) und (B4 d B5), p(F231) = p(B4) × p(B5/B4) +
p(B4) × p(B1/B4) ergeben. Dagegen scheidet ein zu F231 a S23 alternativer Inhalt
F232 des Sinnes ". . . von aus blau B1 und weiß B5 gemischter Farbe B6" wegen
eines zu geringen Bezugs p(B6B1) k ps wie auch wegen p(Vt32Vt23B6) k ps aus,
da der Sprachgebrauch für eine solche Farbmischung B6 einen Wortkomplex
Vt3yVt23 = /_hellblau/ mit p(Vt3yVt23/B6) g ps vorziehen würde. Für einen mit
q332 = s(d) analog zu F231 ebenfalls möglich scheinenden Inhalt F222 a S22 ist
sach- wie sprachbedingt ebenfalls eine geringe Wahrscheinlichkeit p(F222/S22) kk
p(F221/S22) anzusetzen.
Gegenüber einer, wie oben angeführt, ebenfalls vorgesehenen Ausbildung der
Erfindung, bei welcher Wortkomplexe wie Vt33Vt23 = /_graublaue/ und
Vt32Vt23 = /_weißblaue/ als Idiome, also als zusätzliche Wörter Vtxy a Gx einer zusätzlichen
Einheit Gx mit entsprechend zu beschreibenden Sachbegriffen Kxyu a Fpxyu a
Vtxy behandelt werden, wobei in Beispiel 3) Gx = G2 gewählt werden kann, hat die
hier beispielhaft erläuterte Bildung semantischer Inhalte unter Verwendung von den
Transformationen Qs genügenden Symbolen Vt den Vorteil, daß die hierfür
bereitzustellenden Daten Wp der betreffenden Sprache L ein vergleichsweise
geringes Daten- und somit Speichervolumen erfordern, wobei sich aber der
Verarbeitungsaufwand wegen der zusätzlich anfallenden Komplexbildungen erhöht.
Entsprechend sieht die Erfindung vor, die Verwendung von Idiomen den Speicher- und
Verarbeitungskapazitäten der verfügbaren Geräte anzupassen. Unabhängig
davon, ob G3 als eigene Einheit beibehalten wird, wird Komplex Vt32Vt23 =
/_weißblaue/ vorteilhaft dann als eigenes Idiom-Symbol Vt2y a G2 in den Daten
Wp berücksichtigt, wenn in der Kommunikation hierdurch auch eine Sache K
ausgedrückt werden soll, die auch durch das Symbol Vt2x = /_bayrische/
abzudecken ist, wobei diese Idiombildung auch mit der oben angeführten
Transformationsbedingung Qsa a Q1 im Einklang ist.
Weitere Einzelheiten der durch Verfahren Mp mit Hilfe quantitativer Methoden
erzielbaren sprachgerechten Behandlung von, bestimmte lexikalische Wörter wie
das oben betrachtete Wort /und/ einschließenden, Symbolen Vt, deren semantische
Hinweise Fp nicht nur bezüglich zuordenbarer semantischer Inhalte K, sondern
auch bezüglich deren Verknüpfungen zu Komplexen KK und Inhalten F mehrdeutig
sind, werden nachfolgend noch anhand einer Erweiterung des Beispiels 3) um die,
zusätzlich zu den Symbolen Vt41 und Vt42 der Einheit G4 zugeordneten Wörter
Vt43 = /_oder grüne/ und Vt44 = /_oder blaue/ aufgezeigt. Betrachtet werden hierzu
2 weitere dem durch G1 = Gk1 = Ar(G2) und G2 = Ar(G4) gekennzeichneten
grammatischen Inhalt N3 zugeordnete Sätze S33 = vt111Vt21Vt43vt112vt113 =
/Reife oder grüne Pflaumen./ und S34 = vt111Vt21Vt44vt112vt113 = /Reife oder
blaue Pflaumen./ Den beiden Wörtern Vt4y, mit y = 3 oder 4, werden jeweils 2
disjunkte semantische Hinweise Fp4y1 und Fp4y2 zugeordnet, deren
Verwendungshinweise q vereinfachend durch q431 = q432 = o und q432 = q442 = s
angegeben werden, wobei letzterer Verknüpfung aber ein die Wahrscheinlichkeiten
p(F) der resultierenden Inhalte F deutlich reduzierender Faktor qr kk 1 beigeordnet
wird. Dieser Hinweis q4y2 fordert, wie oben q412 = q422 bei Vt41 und Vt42, die,
hier in der genannten vereinfachten Schreibweise notierte, Vereinigung gemäß Fb =
(G1 d G2) s (G1 d G4) der beiden Durchschnitte D1 und D2 der entsprechenden
Sachen Kxyu a Vtxy a Gx, etwa im Sinne von "oder auch" oder "sowohl als auch".
Dagegen fordert q4y1 die Bildung eines Inhalts Fa von einander ausschließenden
Alternativen gemäß Fa = (G1 d G2) o (G1 d G4) dieser Durchschnitte D1 und D2
im Sinn von "entweder oder". Beim anzuwendenden Ansatz Ba zu beachten sind
die hierfür jeweils geltenden Wahrscheinlichkeiten p(Fa) = p(D1) + p(D2) - 2p(D1
d D2) und p(Fb) = qr x(p(D1) + p(D2) - p(D1 d D2)). Bezogen auf die Sätze S33
und S34 ist hier also von einem Durchschnitt D1 im Sinne von "reife Pflaumen"
und 2 Durchschnitten D2 = D21 im Sinne von "blaue. . ." und D22 im Sinne von
"grüne Pflaumen" auszugehen. Zur Vereinfachung der Erläuterung wird
p(D1) = p(D21) = p(D22) angenommen, sowie weiter, daß die Mengen D1 und D21
einander völlig ausschließen, mit p(D1 d D21) = 0, und daß die Mengen D1 und
D22 sich vollständig überlappen, mit p(D1 d D22) = p(D1) = p(D22). Für Satz S33
ergibt sich so für den möglichen Inhalt F33a im Sinne von "entweder oder" eine
Sachwahrscheinlichkeit p(F33a) = p(D1) und für F33b im Sinne von "sowohl als
auch" ein um den eingeführten Faktor qr geringerer Wert p(F33b) = qr × p(D1). Für
Satz 34 folgt jedoch für die entsprechende Alternativaussage p(F34a) = 0, so daß,
mit p(F34b) = qr × p(D1), hier trotz des reduzierenden Faktors qr nur ein, etwas
überspitzt etwa durch "reife oder genauso gut auch blaue Zwetschgen" zu
umschreibender, Inhalt F34b angesprochen sein kann.
Der an Satz S33 zu beobachtende Sprachgebrauch, wonach durch das Wort /_oder/
bevorzugt einander ausschließende Inhalte F angesprochen werden, wird in einer
weiteren Ausbildung der Erfindung dadurch berücksichtigt, daß anstelle des oben
eingeführten Korrekturfaktors qr für die Wahrscheinlichkeiten p(F) unterschiedliche
Wahrscheinlichkeiten p(Vt/Fp) für die zu einem Hinweis Fp und somit auch zu
einer Verknüpfung q von Inhalten K vorzunehmende Wortwahl berücksichtigt
werden. Diese Bezüge sorgen neben den oben betrachteten, aus Verknüpfungen von
Sachbegriffen K resultierenden Sachwahrscheinlichkeiten p(F) entsprechend den in
Ansatz Ba zu berücksichtigenden Produkttermen p(F) × p(Vt/F) ebenfalls dafür, daß
die gemäß Mp vorgenommenen Zuordnungen von Inhalten F zu Wortkomplexen
VtVt und deren Texten T den Sprachgebrauch wiedergeben.
Entsprechend der durch die Erfindung ebenfalls abgedeckten Möglichkeit, daß auch
ungebräuchlich oder auch fehlerhaft abgefaßte Texte T zu bearbeiten sind, welche,
ebenso wie hieraus gegebenenfalls durch Übersetzen oder Stenotypieren zu
erzeugende Texte T, einen Inhalt F nur mit geringer Wahrscheinlichkeit p(F/T)
anzeigen, wobei die entsprechenden Nachrichten TNF auch aus Komponenten Em
aufgebaut sein können, die dem Inhalt F mit vergleichsweise geringen, unterhalb
von Schwellwerten ps liegenden Wahrscheinlichkeiten ps zugeordnet sind, sieht
Verfahren Mp in einer Ausgestaltung vor, solche Texte T und entsprechend Sätze S
den Kommunikationspartnern Pa wie gegebenenfalls auch Nutzen durch
entsprechende, durch Vorgaben Vr festgelegte Markierungen anzuzeigen. In einer
weiteren Ausbildung werden auch mehrdeutige Texte T, für deren
wahrscheinlichste Inhalte F Wahrscheinlichkeiten p(F/T) gelten, die sich um
entsprechend geringe Werte ps unterscheiden, unter Anwendung bekannter
Methoden entsprechend markiert.
Die Erfindung sieht vor, Daten Wp zu verwenden, in denen die einzusetzenden
Komponenten Em geordnet nach bestimmten Kriterien aufgelistet sind, so daß sie
mit entsprechend angepaßten Suchstrategien aufgrund vorliegender Daten mit
ausreichend geringem Aufwand auffindbar sind. Als solche Kriterien gelten auch
die genannten Adressen Ad. Es werden bevorzugt Adressen Ad verwendet, welche
ihre Komponenten Em mit ausreichend hohen Wahrscheinlichkeiten p(Em/Ad) g pr
oberhalb von Werten pr anzeigen, wobei auch Komponenten Em als Adressen Ad
für weitere Komponenten Em dienen, und wobei eine Komponente Em auch
mehrfach nach mehreren Adressen Ad aufgelistet wird, während andererseits nicht
ausgeschlossen wird, daß durch eine Adresse A mehrdeutig auch mehrere
Komponenten Em adressiert werden. Zu den in Wp geordnet aufzulistenden
Komponenten Em gehören die gemäß Verfahren Mp einzusetzenden Symbole Vt
mit ihren Normtexten Tsa und zugeordneten Größen Fp, K und q sowie die
Symbole Gr beziehungsweise G. Als Adresse Ad für ein Wort Vt wird im einzelnen
neben seinem Normtext Tsa auch ein Komplex Kp von Texteigenschaften H(T) mit
Toleranzen dH verwendet, welcher die Texte T5 a Vt dieses Wortes Vt, in einer
Ausbildung auch einen ausreichend hohen Anteil hiervon, umfaßt. In einer auch für
das grammatische Verfahren M angegebenen Ausbildung werden solche
Texteigenschaften H(T) auch als Komplexe Kp weiterer, oben als Zeichen Z
eingeführter, Textsymbole Z = H(T) dargestellt, wie sie beispielsweise in
Schriftsprachen durch Buchstaben oder auch Teile hiervon und bei mündlichen
Texten T durch Laute oder auch Lautkombinationen gegeben sind, wobei ein
Symbol Vt auch als Komplex Vt = Kp1 = ZZ solcher Zeichen Z notiert wird und
ein solcher Komplex Kp1 wie auch Teile Kp2 a Kp1 hiervon als Adressen Ad
verwendet werden. In einer weiteren Ausbildung werden auch die oben genannten
Teilwörter vt a Vt wie auch diesen zugeordnete Zeichenkomplexe ZZ a vt als
Adressen Ad für solche Wörter Vt wie auch Teileinheiten g und Einheiten G
verwendet. Insbesondere bei der von Verfahren Mp in der Rolle des Autors At zu
leistenden Übermittlung von Sachverhalten Wk2 durch Texte T werden auch
Sachbegriffe K als Adressen Ad für die hierfür einzusetzenden Symbole Vt
eingesetzt.
Verfahren Mp schließt die Anwendung bekannter Maßnahmen zur Aufnahme,
Speicherung und Ausgabe der die Kommunikationstexte T konstituierenden
Sprachsignale sowie der in der Rolle des Autors At zu übermittelnden oder des
Hörers Hr ermittelten Inhalte F und Sachverhalte Wk in entsprechend kodierter
Form mit ein.
Verfahren Mp wird in die folgenden, unter Beachtung oben angeführter
Einzelheiten durchzuführenden Verfahrensteile Mp1 bis Mp4 untergliedert: Die bei
der Kommunikation in der Rolle des Hörers Hr vorzunehmende Zuordnung
semantischer Nachrichten TNF zu einlaufenden Texten T einschließlich der
Bestimmung und Weitergabe der durch Kommunikationspartner Pa hierdurch
übermittelten Sachverhalte Wk wird im Rahmen eines Verfahrensteils Mp1
durchgeführt. Die in der Rolle des Autors At vorzunehmende Übermittlung
vorgegebener Sachverhalte Wk an Kommunikationspartner Pa durch semantischen
Nachrichten TNF zugeordnete auszugebende Texte T erfolgt, auch unter Benutzung
des Verfahrensteils M1, im Rahmen eines Verfahrensteils Mp2. Die bei der
Kommunikation gegebenenfalls vorzunehmende inhaltsgerechte Korrektur
einlaufender Texte T in entsprechend verbesserte, weiterzugebende Texte T dieser
Sprache L wird im Rahmen eines, die Teile Mp1 und Mp2 verwendenden,
Verfahrensteil Mp3 durchgeführt. Verfahrensteil Mp4 umfaßt die beim Übersetzen
und Dolmetschen unter Anwendung der Verfahrensteile Mp1, Mp2 und
gegebenenfalls auch Mp3 zu leistende Übertragung einlaufender Texte T einer
Ausgangssprache L in auszugebende Texte T' einer Zielsprache L' einschließlich
der beim Stenotypieren anfallenden Übertragung vom Mündlichen ins Schriftliche
wie auch der von Sprachgeneratoren zu leistenden Übertragung von schriftlichen in
mündliche Texte T.
Verfahrensteil Mp1 a Mp zur Ermittlung eines durch einen einlaufenden, von einem
Kommunikationspartner Pa verfaßten, Text T übermittelten Sachverhalts Wk2
durch einen Hörer Hr umfaßt mehrere der folgenden Maßnahmen: Die einlaufenden
Sprachsignale werden aufgenommen und gespeichert. Textmerkmale H(T), die als
Adressen Ad Symbole Gs von Sprachen L anzeigen, werden identifiziert. Die
Sprache L des Textes T wird identifiziert. Den Adressen Ad werden disjunkte
Repertoires Ra(Gs) von als Komponenten (Em) zu verwendenden Symbolen Gs
mit, die Positionen P der Adressen Ad berücksichtigenden, Entnahmebedingungen
Ve zugeordnet. Dem Text T wird ein entsprechend disjunktes Repertoire Rb(NN)
von jeweils entsprechend diesen Positionen P geordneten Komplexen Kpx = NN
von jeweils einem oder mehreren grammatischen Inhalten N zugeordnet. Die
Zuordnung von Inhalten N wird gemäß Verfahren M durchgeführt. Bei
fortlaufenden Texten T werden für die Bildung von Inhalten N jeweils
Textabschnitte T berücksichtigt, deren Mindestlänge dadurch gegeben ist, daß
durch ihre Adressen Ad jeweils mindestens 2 Repertoires Ra(Gs) angezeigt werden,
deren Symbole Gs als Kopfsymbole Vtk a Grk geeignet sind. Die Bildung der
Inhalte N a Kpx erfolgt in der Reihenfolge der einlaufenden Textabschnitte T. Ein
oder gegebenenfalls disjunkt mehrere Komplexe Kpx, deren Nachrichten N
ausreichend hohe Wahrscheinlichkeiten p(N/T) zukommen, werden einer
semantischen Weiterverarbeitung zugeführt. Hierfür wird ein durch Vorgaben Vr
festgelegtes Repertoire Rc(Wk1v) eines oder mehrerer beim Partner Pa
vorauszusetzender pragmatischer Sachverhalte Wk1v berücksichtigt. Permutationen
von semantischen Hinweisen Fp a Vt a N von Symbolen Vt jeweils eines Inhalts N
werden zu jeweils einem disjunkten Repertoire Rd(Fu) eines oder mehrerer
semantischer Inhalte Fu zusammengefügt, durch welche die Sachverhalte Wk1v in
ein entsprechend disjunktes Repertoire Rd(Wk2w) von Sachverhalten Wk2w
abgewandelt werden. Es werden Komponenten Em a Ra berücksichtigt, die den zu
bildenden Komplexen Kp = TNF mit ausreichend hohen Wahrscheinlichkeiten
p(Em) g ps oberhalb von Schwellwerten ps zuordenbar sind. Die Zuordnung
semantischer Inhalte F zu den grammatischen Inhalten N eines Komplexes Kpx und
die dadurch vorzunehmende Abwandlung vorausgesetzter Sachverhalte Wk1v in
Sachverhalte Wk2w erfolgt in der durch diesen Komplex Kpx gegebenen
Reihenfolge. Aus dem resultierenden Repertoire Rd(Wk2w) werden ein, oder
gegebenenfalls auch disjunkt mehrere, Sachverhalte Wk2w ausgewählt, die durch
die semantischen Inhalte F eines Komplexes Kpx erzeugt wurden, die dessen
grammatischen Nachrichten TN mit den höchsten, vorgegebene Schwellwerte ps
nicht unterschreitenden, Maximalwerte pr jedoch auch nicht überschreitenden
Wahrscheinlichkeiten p(F/TN; Wk1v) zugeordnet sind. Die resultierenden
Sachverhalte Wk2 werden gemäß Vorgaben Vr und hierdurch gegebene Kriterien
auf ihre Verwendbarkeit überprüft. Sie werden einer durch Vorgaben Vr
festgelegten weiteren Verwendung zugeführt. Die Sachverhalte Wk2 werden in
einer durch Nutzer verwendbaren, eindeutig kodierten Form an solche Nutzer
weitergegeben. Als Nutzer werden maschinelle Vorrichtungen eingesetzt, die durch
den Sachverhalten Wk2 entsprechende Kommandos bedient und in Operation
gesetzt werden. Als Nutzer werden Elektronenrechner zugeordnet, die durch die
Sachverhalte Wk2 gegebene, Kommandos der hierfür vorgesehenen
Programmiersprachen in Betrieb gesetzt werden.
Die in Verfahrensteil Mp1 gemäß Vorgaben Vr gegebenenfalls vorzunehmende
Überprüfung der Verwendbarkeit einlaufender Texte T und diesen gegebenenfalls
zuordenbarer Sachverhalte Wk2 schließt eine Überprüfung auf deren
Verwendbarkeit sowie die gegebenenfalls erforderliche Auslösung weiterer
Aktionen mit ein. Diese Aktionen werden unter Anwendung von Verfahrensteil
Mp2 durch Ausgabe von diese Aktionsinhalte übermittelnden
Kommunikationstexten T oder auch von diese Inhalte eindeutig wiedergebenden
Signalen ausgeführt. Solche Aktionen umfassen die Bekanntgabe einer
gegebenenfalls vorliegenden Unverständlichkeit eines Textes T an seinen Autor At,
beispielsweise auch des hierfür verantwortlichen Textabschnitts T. Es werden
Irrtümer konstatiert und dem Partner Pa bekanntgegeben, falls sich die durch seine
Botschaften F übermittelten Sachwahrscheinlichkeiten p(K) a Wk2 von als objektiv
richtig, insbesondere auch durch p(K) = 1 oder p(K) = 0 vorgegebenen Werten
unterscheiden. Es werden Unaufrichtigkeiten konstatiert und gegebenenfalls in
Aktionen umgesetzt, falls dem Hörer Hr gemäß vorliegenden Daten Wp bekannt ist,
daß Abweichungen der Wahrscheinlichkeiten p(K) in übermittelten Sachverhalten
Wk2 von den p(K)-Werten als objektiv richtig deklarierter Sachverhalte Wk dem
Autor der Botschaft F und Wk2 bekannt sind. Durch Texte T eines Partners Pa
übermittelte Sachverhalte Wk2, welche Aufforderungen oder Fragen enthalten, oder
welche sich um ausreichend hohe Wahrscheinlichkeitswerte p(K) von
vorgegebenen Sollwerten p(K) unterscheiden, werden in, durch entsprechend zu
übermittelnde Kommunikationstexte T oder Sachdaten K ausgedrückte, Aktionen
umgesetzt.
Verfahrensteil Mp2 a Mp zur Übermittlung eines als Komplex Kp von
Sachbegriffen K gegebenen Sachverhalts Wk an einen Kommunikationspartner Pa
durch einen von einem Autor At auszugebenden Text T umfaßt mehrere der
folgenden Maßnahmen: Es wird der von einem, beim Partner Pa vorauszusetzenden,
Sachverhalt Wk1 abweichende Anteil des zu übermittelnden Sachverhalts Wk
ermittelt und durch ein disjunktes Repertoire R1(Kpx) von Komplexen Kpx von
durch die Daten Wp gegebenen, den Symbolen Vt zugeordneten Sachbegriffen K a
Fp a Vt sowie weiteren, beispielsweise als Oberbegriffe K hiervon gebildeten
Sachbegriffen K dargestellt. Unter Beachtung des Verfahrensteils Mp1 von Mp
werden die Symbole Vt a Kpx jeweils eines Komplexes Kpx zu, ein disjunktes
Repertoire R2(Kpy) bildenden, Komplexen Kpy von grammatischen Nachrichten
TN zusammengefügt, die zu semantischen Nachrichten TNF mit semantischen
Inhalten F ergänzt werden. Von diesen wird ein Text T = T1 eines Komplexes Kp1
a R2 von Nachrichten TNF zur Übermittlung des Sachverhalts Wk ausgegeben,
dessen Inhalte F gemäß Verfahrensteil Mp1 mit ausreichend hohen
Wahrscheinlichkeiten p(F/TN; Wk1) und ausreichender Eindeutigkeit Sachverhalte
Wk2 ergeben, die den Sachverhalt Wk mit ausreichender Genauigkeit wiedergeben.
Verfahren Mp sieht vor, abhängig von vorliegenden Daten und von Vorgaben Vr
die erfindungsgemäß zu lösenden Kommunikationsaufgaben auch durch
Anwendung von Teilen eines oder beider Verfahrensteile Mp1 und Mp2
durchzuführen, wobei oben angegebene Einzelheiten der Erfindung entsprechend zu
berücksichtigen sind.
Eine gemäß Vorgaben Vr vorzunehmende Verbesserung eines durch einen
Kommunikationspartner Pa abgefaßten einlaufenden Textes T = T1 bezüglich der
durch ihn zu übermittelnden grammatischen Inhalte N und semantischen Inhalte F
wird gemäß einem Verfahrensteil Mp3 a Mp dadurch durchgeführt, daß dem Text
T1 gemäß Verfahrensteil Mp1 ein übermittelter Sachverhalt Wk = Wk2 zugeordnet
wird, dem gemäß Verfahrensteil Mp2 ein diesen Sachverhalt Wk2 übermittelnder
Text T2 zugeordnet wird, durch welchen die hiervon abweichenden Teile T3 von
Text T1 ersetzt werden. Neben Korrekturen von Fehlern bei der Rechtschreibung,
Zeichensetzung und Grammatik, wie sie etwa bei Flexionen und Positionierungen
natürlicher Wörter auffallen und häufig bei Autoren At anzutreffen sind, die eine
Sprache L nicht ausreichend beherrschen, schließt Verfahrensteil Mp3 auch
inhaltserhaltende stilistische Korrekturen ein, wie sie beispielsweise durch
Vermeidung von Wortwiederholungen, von mehrdeutigen oder mißverständlichen
Wörtern oder auch übermäßig verschachtelten oder unnötig kurzen natürlichen
Sätzen möglich sind. Entsprechend der vorgesehenen Anwendung sieht
Verfahrensteil Mp3 bei entsprechenden Vorgaben Vr auch die Verdeutlichung
gegebener Texte T bezüglich ihrer Botschaften F und Wk2 mit ein, wie sie durch
Zugrundelegung abgewandelter, beispielsweise weniger explizit vorausgesetzter
Ausgangs-Sachverhalte Wk1 und entsprechend konkreter auszudrückender
Botschaften F erfindungsgemäß möglich ist.
Verfahrensteil Mp4 zur Übertragung eines einlaufenden Textes (T) einer
Ausgangssprache L in einen bezüglich des hierdurch übermittelten Sachverhalts
Wk2 ausreichend gleichbedeutenden Text T' einer durch Vorgaben Vr festgelegten
Zielsprache (L'), welche definitionsgemäß schriftliche Übersetzungen schriftlicher
oder mündlicher Texte, Dolmetschertätigkeiten, beim Stenotypieren anfallende
Übertragungen vom Mündlichen ins Schriftliche und von Sprachgeneratoren zu
leistende Umwandlungen schriftlicher in mündliche Texte mit einschließt, umfaßt
mehrere der folgenden Maßnahmen: Unter Anwendung des Verfahrensteils Mp1
von Mp wird dem einlaufenden Text T ein Komplex Kp1 = TNF, TNF einer oder
mehrerer semantischer Nachrichten TNF zugeordnet, durch deren semantische
Inhalte F ein beim Autor At dieses Textes T vorauszusetzenden Sachverhalt Wk11
in den Sachverhalt Wk2 abgewandelt wird. Im Falle der Mehrdeutigkeit wird dem
Text T auch ein disjunktes Repertoire R(Wk2) solcher Sachverhalte Wk2 mit einem
entsprechenden Repertoire R(Kp1x) von Komplexen Kp1x solcher Nachrichten
TNF zugeordnet. Unter Anwendung des Verfahrensteils Mp2 von Mp wird der von
Sachverhalt (Wk11) abweichende Teil des jeweiligen Sachverhalts Wk2 als
disjunktes Repertoire R1(Kpx) von Komplexen Kpx von den Daten Wp' der
Zielsprache L' zugeordneten Sachbegriffen K' wiedergegeben. Symbole Vt' a Wp'
a L', denen diese Sachbegriffe K' a Fp' a Vt' über deren semantische Hinweise Fp'
zugeordnet sind, werden zu einem disjunkten Repertoire R2(Kpy) von Komplexen
Kpy von jeweils einer oder mehreren semantischen Nachrichten T'N'F' ergänzt.
Als Übertragung 1' des Textes T wird ein Text T' eines dieser
Nachrichtenkomplexe Kpy = T'N'F', T'N'F' einer durch die Vorgaben Vr
festgelegten weiteren Verwendung zugeführt, dessen semantische Inhalte F' gemäß
Verfahrensteil Mp1 mit ausreichend hoher Wahrscheinlichkeit p(F'/T'N'; Wk11')
und Eindeutigkeit einen beim Hörer Hr dieses Textes T' vorauszusetzenden
Sachverhalt (Wk11') in einen Sachverhalt (Wk2') abwandeln, der mit ausreichender
Genauigkeit mit dem Sachverhalt Wk2 übereinstimmt. Im Falle eines mehrdeutigen
Textes T werden entsprechend mehrere, disjunkt zu verwendende Texte T' oder ein
Text T' ausgegeben, dem entsprechend disjunkt mehrere Sachverhalte Wk2'
zuordenbar sind. Disjunkt als Übertragung zu verwendende Texte T' werden durch
entsprechende Markierungen für den Hörer Hr wie gegebenenfalls auch Nutzer
gekennzeichnet.
In einer bevorzugten Ausgestaltung wird Verfahrensteil Mp4 unter Anwendung des
grammatischen Verfahrens M durchgeführt. Hierbei werden die den grammatischen
Nachrichten TN des jeweiligen Komplexes Kp1 als Symbole Vt zugeordneten
objektiven Wörter Vt vollständig als Komplexe Kp11 von Vokabeln Vqq
zugeordneten Symbolkomplexen Vq = VtVt dargestellt, welche jeweils eine
disjunkte Klasse K1 = (Vq') von, diesen mit Wahrscheinlichkeiten p(Vq'/Vq)
zugeordneten Komplexen Vq' = Vt'Vt' von objektiven Wörtern Vt' der Zielsprache
L' anzeigen. Zur Bestimmung der Vokabeln Vqq in den Daten Wst der Daten Wp
werden die Wörter Vt a Kp1 als Adressen Ad eingesetzt. Die Wörter Vt eines
Komplexes Kp1 werden vollständig als Komplexe Vq a Vqq dargestellt. Die Wörter
Vt' a Vq' a Vqq der einem Komplex Kp1 zugeordneten Vokabeln Vqq werden
gemäß Verfahren M unter Beachtung der Anordnungen Pr zu einem entsprechend
disjunkten Repertoire R(Kp2) von Komplexen Kp2 von jeweils einer oder mehreren
grammatischen Nachrichten T'N' zusammengefügt. Die Nachrichten TN und T'N'
werden unter Anwendung von Verfahrensteil Mp1 zu semantischen Nachrichten
TNF und einem entsprechend disjunkten Repertoire R(Kp2) von Komplexen Kp2
von semantischen Nachrichten T'N'F' ergänzt. Es wird ein Text T' a Kp2 eines der
Komplexe Kp2 als Übertragung T' des Textes T ausgegeben und der festgelegten
weiteren Verwendung zugeführt, dessen semantische Inhalte F' einen beim Hörer
Hr dieses Textes T' vorauszusetzenden Sachverhalt Wk11' mit ausreichend hoher
Wahrscheinlichkeit p(F'/T'N'; Wk11') und Eindeutigkeit in den genannten
Sachverhalt (Wk2') abwandeln, der mit ausreichender Genauigkeit den durch Text
T übermittelten Sachverhalt Wk2 wiedergibt. Die Übereinstimmungsgenauigkeit
wird durch Toleranzen dp für die den Sachen K und K' in Wk2 und Wk2'
zukommenden Wahrscheinlichkeiten p(K) und p(K') festgelegt. Bei Mehrdeutigkeit
des Textes T werden entsprechend disjunkte Texte T' oder auch mehrere
Sachverhalte Wk2' ausgegeben.
Entsprechend dem in Patentanmeldung P. . . beschriebenen Verfahrensteil M3 des
angeführten grammatischen Kommunikationsverfahrens M sieht Verfahrensteil
Mp4 auch vor, Übertragungen aus einer Ausgangssprache L in eine Zielsprache L'
über eine oder auch mehrere Zwischensprachen L", L''' usw. durchzuführen.
Beispielsweise erfolgt in einer solchen Ausbildung die Übertragung von Texten T
der mündlichen deutschen Sprache L in Texte T' der englischen Schriftsprache L'
über Texte T" der deutschen Schriftsprache L"; entsprechendes gilt für die
Sprachen L anderer Sprachgemeinschaften. Des weiteren werden, wie in M3 a M,
Übertragungen aus einer beliebigen Sprache L, L' usw. eines Repertoires R(L) in
eine beliebige andere Sprache L' a R(L) auch über eine als Zentralsprache L" a
R(L) bezeichnete Sprache L" dieses Repertoires R(L) durchgeführt. In einer
weiteren Ausbildung sieht Verfahrensteil Mp4 auch die Anwendung des
Verfahrensteils Mp3 vor, wonach ein einlaufender fehlerhafter Text T = T1 einer
Ausgangssprache L gemäß Mp3 zunächst in einen Text T2 von L verbessert wird,
der dann in einen Text T' von L' übertragen wird. Bei den gemäß Verfahrensteil
Mp4 vorzunehmenden Übertragungen vom Mündlichen ins Schriftliche und
umgekehrt werden erfindungsgemäß Vokabeln Vqq verwendet, bei denen im
Regelfall jeweils einem Wort Vq = Vt der Ausgangssprache L jeweils ein Wort Vq'
= Vt' der Zielsprache L' zugeordnet ist, deren vom jeweiligen Textzusammenhang
abhängige Schreib- beziehungsweise Ausspracheweise in den Daten Wst a Wp
vorteilhaft mit Hilfe der genannten Operatoren o dargestellt wird.
In einer weiteren Ausgestaltung von Verfahrensteil Mp4 wird, auch gemäß
vorliegenden Vorgaben Vr, auch berücksichtigt, daß bei den
Kommunikationspartnern Pa unterschiedlicher Sprachgemeinschaften L und L'
gegebenenfalls auch voneinander abweichende, als Wk1' ne Wk1 notierte
Sachverhalte Wk1 beziehungsweise Wk1' vorauszusetzen sind, wobei entsprechend
auch unterschiedliche Wahrscheinlichkeiten p(Vt'/K1) ne p(Vt/K1) für die
Verwendung von die gleiche Sache K1 anzeigenden Symbolen Vt und Vt'
anzusetzen sind. Entsprechend werden in dieser Ausbildung den Texten T' der
Zielsprache L' von den Ausgangssachverhalten Wk1 von L abweichende
Sachverhalte Wk1' so zugrunde gelegt, daß sich in beiden Sprachen L und L' als
ausreichend gleich beurteilte Sachverhalte Wk2 und Wk2' erzielen lassen.
In einer Ausgestaltung der Erfindung wird Verfahrensteil Mp3 zur Verbesserung
einlaufender Texte auch als Spezialfall des Verfahrensteils Mp4 durchgeführt,
wobei die Übertragung aus einer Ausgangssprache L in eine Zielsprache L' erfolgt,
welche gleich der Ausgangssprache L' = L ist.
Wie aus der Beschreibung hervorgeht, schließt Verfahrensteil Mp4 a Mp die
Anwendung weiterer, gegebenenfalls auch sämtlicher in Verfahren Mp
beschriebenen Verfahrensteile und Maßnahmen mit ein. Einige der hierbei zu
lösenden Kommunikationsaufgaben werden anhand eines Beispiels 4) für
Übertragungen von Texten T aus der mündlichen deutschen Sprache L ins
Schriftenglische L' erläutert. Gegeben ist ein Text T1, dessen Lautfolge hier wieder
durch eine Buchstabenfolge T1 = /ainerwaissesget/ angenähert wird. Unter
Anwendung eines Teils M2 des grammatischen Verfahrens M wird diesem Text T1
ein disjunktes Repertoire Ra(Kpx) von Komplexen Kpx von jeweils einer oder
mehreren grammatischen Nachrichten TNxy mit zugeordneten Sätzen Sxy a Tnxy
zugeordnet, von denen einige hier durch Texte Tx" = Sx" beziehungsweise Tx" =
Sxy"Sxy" aus der deutschen Schriftsprache L" angezeigt werden: T1" = /Einer
weiß, es geht./, T2" = /Ein Erweis: Es geht./, T3" = /Einer: "Weißes geht!"/, T4" =
/Einer: "Weiß es Geet?"/. Diese Texte Tx" werden auch durch Anwendung des
Verfahrensteils M3a M von M zur grammatikbezogenen Übertragung von Texten
T aus der mündlichen deutschen Sprache L in die schriftliche L" erzeugt, wobei
/Geet/ in T4" einen Eigennamen anzeigt, vorausgesetzt, daß ein vorauszusetzender
Sachverhalt Wk11 einen entsprechenden Sachbegriff K mit ausreichender
Wahrscheinlichkeit p zuläßt. Ist gemäß Verfahrensteil Mp1 a Mp ein Sachverhalt
Wk12 vorauszusetzen, wonach, vereinfacht, "eine Diskussion zwischen
Geschäftsleuten über die Verkaufschancen verschiedenfarbiger Porzellansorten
stattfindet", so folgt gemäß Mp4, daß aus der Vielfalt möglicher Übersetzungen der
Texte Tx" eine Übersetzung wie beispielsweise T3' = /One of them: "White china
sells well."/ zu bevorzugen ist, wobei die Berücksichtigung des Kontextes Wk12
sich bereits als Beschränkung der Inhalte N des gegebenen Textes T1 auswirkt.
Beispiel 4) wird durch einen weiteren mündlichen Text T2 = /disertonklingthel/
erweitert, dessen mögliche Botschaften F gemäß M3 a M dem grammatisch
eindeutigen, semantisch aber mehrdeutigen zuordenbaren Schrifttext T5" = /Dieser
Ton klingt hell./ zu entnehmen sind. Gemäß Verfahrensteil Mp4 erfolgt hier die
Berücksichtigung eines vorauszusetzenden Sachverhaltes Wk12 vorrangig bei der
Auswahl des Wortkomplexes Vq' = Vt'Vt' der durch Vq1 = /gder Ton./
angezeigten Vokabel Vqq1. Ist also gemäß Wk12 mit ausreichend hohen
Wahrscheinlichkeiten p in etwa "von aus Ton gebrannten Gefäßen die Rede, auf die
man klopft, um aus dem Klang auf ihre Qualität und Unversehrtheit zu schließen",
so folgt als Übersetzung beispielsweise 15' = /The earthenware sounds clear./.
Die erfindungsgemäß vorgesehene Berücksichtigung unterschiedlicher
Ausgangssachverhalte Wk11 und Wk11' bei Kommunikationspartnern Pa
unterschiedlicher Sprachen L, welche entsprechend ihrer Herkunft auch
unterschiedliches Wissen einsetzen, wird in Beispiel 4) anhand des weiteren, hier
schriftdeutsch formulierten Textes T6 = /Morgen besuchen wir Hohenschwangau./
illustriert, der bayrischen Hörern Hr eine "Schloßbesichtigung" ankündigt,
ausländischen Touristen Hr aber mit ausreichender Sicherheit häufig erst dann,
wenn er in T5' = /Tomorrow we are going to visit Hohenschwangau castle./
übersetzt wird. Einzelheiten über die in Beispiel 4) verwendeten Symbole Vt, G,
Vqq, ihre Anordnungen Pr sowie Hinweise Fp und Sachen K folgen aus den oben
gebrachten, an Beispielen erläuterten Angaben.
Auf die Vorteile, welche sich aus der Anwendung der anzuwendenden
Verfahrensteile Mp1 bis Mp4 in den genannten Ausgestaltungen ergeben, wurde im
einzelnen jeweils im Zusammenhang mit den Beschreibungen der hierfür
einzusetzenden Maßnahmen hingewiesen.
Die Erfindung sieht in einer weiteren Ausgestaltung vor, das Verfahren Mp zur
semantischen Kommunikation in natürlichen Sprachen L mit einer
rechnergestützten Einrichtung 1 durchzuführen, welche die folgenden, durch eine
oder mehrere Stromversorgungsanlagen versorgten, jeweils aus einer oder mehreren
Untereinheiten aufgebauten Einheiten umfaßt: eine gemäß Verfahren Mp
programmierte zentrale Recheneinheit 11 zur Abwicklung der für die Erstellung
von semantischen Nachrichten TNF und zugehörigen semantischen Inhalten F a
TNF und pragmatischen Sachverhalten Wk wie auch weiterer hierbei anfallender
Daten sowie für die Ablauforganisation vorgesehenen Operationen. Eine
Speichereinheit 12 zur Speicherung der hierfür zu verwendenden Daten Wp der
betreffenden Sprachen L, der zu berücksichtigenden Sachverhalte Wk, der
anfallenden Zwischen- und Endergebnisse sowie einlaufender und auszugebender
Daten D einschließlich Texten T und Vorgaben Vr. Eine Einheit 13 zum Empfang
einlaufender und zur Ausgabe ausgehender Daten D einschließlich Texten T, diesen
gegebenenfalls zugeordneter Markierungen, wie auch Nachrichten TN wie auch
TNF und Sachverhalten Wk in den hierfür vorgesehenen Kodierungen und Medien,
wobei der Datenaustausch Kommunikationspartner Pa und, gegebenenfalls auch
maschinelle, Nutzer mit einschließt. Eine Bedieneinheit 14 zur Festlegung und
Überwachung von Betriebszuständen, zur Überwachung von Zwischen- und
Endergebnissen, zur Eingabe von Vorgaben Vr wie auch Daten Wp einschließlich
deren Ergänzung wie auch Abänderung in der Speichereinheit 12. Diese Einheiten
11 bis 14 sind durch Datenbusse 15 verbunden, welche den Aufgaben angepaßte
Bandbreiten aufweisen.
In verschiedenen Ausgestaltungen werden für die Speichereinheit 12 RAM-
Speicher (mit "read only memory") verwendet. RAM-Speicher-Module werden zur
Speicherung der den Daten Wp zugeordneten Symbole Gr, Vt, semantischen
Hinweise Fp, Sachbegriffe einschließlich deren Eigenschaften H(Gr) usw. und
Adressen Ad verwendet. Es werden Speicher 12 verwendet, welche eine Ergänzung
wie auch Korrektur der zu verwendenden Daten Wp erlauben. Es werden
Recheneinheiten 11 und Speicher 12 verwendet, die aus den Daten Wp und dem
Verfahren Mp angepaßten kundenspezifischen integrierten Schaltkreisen aufgebaut
sind. Es wird eine Vorrichtung 1 verwendet, die aus einer Zentraleinheit 111,
welche einen Zentralrechner 11 und einen Speicher 12 umfaßt, sowie aus einer
Anzahl von getrennt hiervon, vorzugsweise auch mobil, angeordneten
Nutzereinheiten 112 besteht, welche jeweils eine Bedieneinheit 14 und eine
Empfangs- und Ausgabeeinheit 13 umfassen, wobei die Nutzereinheiten 112 mit
der Zentraleinheit 111 durch, gegebenenfalls auch drahtlos, arbeitende Datenbusse
15 verknüpft sind. Diese Ausbildung hat den Vorteil, daß der mit der Zentraleinheit
111 verbundene Aufwand einer größeren Anzahl von Nutzern an den
vergleichsweise aufwandsarm aufgebauten Einheiten 112 zugute kommt, für deren
Verknüpfungen mit der Zentraleinheit 111 Datenbusse 15 mit vergleichsweise
niedrigen Bandbreiten genügen, wie sie beim Empfangen und Ausgeben von Texten
T sowie bei der Bedienung anfallen.
In einer weiteren Ausgestaltung werden die zentrale Recheneinheit 11 und die
Speichereinheit 12 unter Verwendung von Parallelrechnern aufgebaut, in denen den
Symbolen Vt a Gr und Sachen K a Fp a Vt Rechenmodule 1111 zugeordnet werden,
die entsprechend den in den Daten Wp gegebenen Bezügen parallel miteinander
verknüpft sind.
DE 30 42 408 C2
DE 31 42 540 C2
DE 35 03 233 C2
DE 36 15 972 A1
DE 36 16 011 A1
DE 30 32 664 C2
DE 31 51 106 A1
DE 32 11 313 C2
DE 37 33 391 C2
DE 35 14 286 A1
DE 37 10 507 A1
DE 37 11 348 A1
DE 41 35 261 C1
DE 42 32 482 A1
DE 43 11 211 A1.
DE 31 42 540 C2
DE 35 03 233 C2
DE 36 15 972 A1
DE 36 16 011 A1
DE 30 32 664 C2
DE 31 51 106 A1
DE 32 11 313 C2
DE 37 33 391 C2
DE 35 14 286 A1
DE 37 10 507 A1
DE 37 11 348 A1
DE 41 35 261 C1
DE 42 32 482 A1
DE 43 11 211 A1.
//1// John Lyons, Die Sprache, Beck, München (1992)
//2// Hermann Helbig, Künstliche Intelligenz und automatische Wissensverarbeitung, Technik, Berlin (1991)
//3// John Lyons, Einführung in die moderne Linguistik, Beck, München (1971)
//4// Dieter E. Zimmer, Payment may he made - Bezahlung kann sein gemacht, Die Zeit, Nr. 15 (5. April 1996)
//5// Helmar Frank, Kybernetische Grundlagen der Pädagogik, Agis, Baden- Baden (1996)
//6// Terry Winograd, Fernando Flores. On "Understanding Computers and Cognition": A New Foundation for Design, Artificial Intelligence, Vol. 31, S. 250 (1987)
//7// Edward O. Wilson, Sociobiology, Cambridge, Mass. und London (1975)
//8// Steven Pinker, The Language Instinct, Morrow, New York (1994)
//9// New Scientist, S. 53 (22. Okt. 1987)
//10// Marcus Spies, Aus dem Kopf in den Computer-Spracherkennung in elektronischen Diktiersystemen, Spektrum der Wissenschaft, Dossier 4/97, S. 47 (1997)
//11// Wolfgang Wahlster, Verbmobil: Erkennung, Analyse, Transfer, Generierung und Synthese von Spontansprache, Spektrum der Wissenschaft, Dossier 4/97, S. 52 (1997)
//12// Hadumod Bußmann, Lexikon der Sprachwissenschaft, Stuttgart (1990)
//13// Robert Jourdain, Music, the Brain, and Ecstasy, New York, S. 279 (1997).
//2// Hermann Helbig, Künstliche Intelligenz und automatische Wissensverarbeitung, Technik, Berlin (1991)
//3// John Lyons, Einführung in die moderne Linguistik, Beck, München (1971)
//4// Dieter E. Zimmer, Payment may he made - Bezahlung kann sein gemacht, Die Zeit, Nr. 15 (5. April 1996)
//5// Helmar Frank, Kybernetische Grundlagen der Pädagogik, Agis, Baden- Baden (1996)
//6// Terry Winograd, Fernando Flores. On "Understanding Computers and Cognition": A New Foundation for Design, Artificial Intelligence, Vol. 31, S. 250 (1987)
//7// Edward O. Wilson, Sociobiology, Cambridge, Mass. und London (1975)
//8// Steven Pinker, The Language Instinct, Morrow, New York (1994)
//9// New Scientist, S. 53 (22. Okt. 1987)
//10// Marcus Spies, Aus dem Kopf in den Computer-Spracherkennung in elektronischen Diktiersystemen, Spektrum der Wissenschaft, Dossier 4/97, S. 47 (1997)
//11// Wolfgang Wahlster, Verbmobil: Erkennung, Analyse, Transfer, Generierung und Synthese von Spontansprache, Spektrum der Wissenschaft, Dossier 4/97, S. 52 (1997)
//12// Hadumod Bußmann, Lexikon der Sprachwissenschaft, Stuttgart (1990)
//13// Robert Jourdain, Music, the Brain, and Ecstasy, New York, S. 279 (1997).
Claims (30)
1. Verfahren zu einer auf semantische Inhalte bezogenen, pragmatische Sachverhalte
übermittelnden Kommunikation in einer wie auch mehreren natürlichen Sprachen,
dadurch gekennzeichnet, daß
- 1. 1.1. die Kommunikation zwischen Kommunikationspartnern (Pa) unter Beachtung vorliegender Vorgaben (Vr) gemäß einem Verfahren (Mp) durchgeführt wird, wonach als Komplexe (Kp = KK) von Sachbegriffen (K) gebildete pragmatische Sachverhalte (Wk) mittels, von Autoren (At) aus Sprachsignalen der für die betreffenden natürlichen Sprachen (L) vorgesehenen Medien zu bildenden beziehungsweise von deren Empfängern (Hr) auszuwertenden, Texten (T) übermittelt werden, die durch Zuordnung grammatischer Inhalte (N) unter Beachtung der Wahrscheinlichkeiten (p(TN)) zu grammatischen Nachrichten (TN) und semantischer Inhalte (F) unter Beachtung der Wahrscheinlichkeiten (p(TNF)) zu semantischen Nachrichten (TNF) ergänzt werden, und die zu übermittelnden Sachverhalte (Wk = Wk2) durch Abänderung von, von den Kommunikationspartnern (Pa) vorausgesetzten, pragmatischen Sachverhalten (Wk = Wk1) entsprechend den semantischen Inhalten (F) erzeugt werden, wobei
- 2. 1.2. die semantischen Nachrichten (TNF) als Komplexe (Kp = EmEm) unter Beachtung ihrer, gegebenenfalls auch durch weitere Komponenten (Em) bedingten, Wahrscheinlichkeiten (p(Em)) aus, durch Daten (Wp) beschriebenen Komponenten (Em) zusammengefügt werden, welche Sachbegriffe (K) und an die natürlichen Sprachen (L) angepaßte Symbole (Gs) einschließen, die, jeweils zu einer disjunkten Klasse (K1 = (Vt)) von Textabschnitten (T = Ts) mit, durch Toleranzen (dH) näher bestimmten, Textmerkmalen (H(Ts)) superierte, Textsymbole (Vt = (Ts)) und, hieraus zu disjunkten Klassen (K1 = Gr) superierte, grammatische Symbole (Gr = (Vt)) umfassen, welche jeweils ein Repertoire (R(Pr)) von, durch Wahrscheinlichkeiten (p) näher bestimmten, Möglichkeiten ihrer, durch Rangordnungen (Ra) und die Positionen (P) der Textabschnitte (Ts) der diesen Symbolen (Gr) zugeordneten Textsymbole (Vt) in Texten (T) festgelegten, Anordnungen (Pr) vorgeben,
- 3. 1.3. die Textsymbole (Vt) jeweils eine disjunkte Klasse (K1 = (Fp)) von, die Möglichkeiten ihrer Anordnungen (Pr) berücksichtigenden, semantischen Hinweisen (Fp) vorgeben, die jeweils einen Sachbegriff (K) und ein Repertoire (R(K1)) von disjunkten Klassen (K1 = (q)) von Verwendungshinweisen (q) für dessen Zuordnung zu semantischen Nachrichten (TNF) einschließlich seiner Verknüpfung mit Sachbegriffen (K) weiterer in der betreffenden semantischen Nachricht (TNF) vorliegender Textsymbole (Vt) sowie mit Sachbegriffen (K) vorausgesetzter pragmatischer Sachverhalte (Wk1) einschließlich deren Abänderung umfassen, und wobei
- 4. 1.4. durch Texte (T) zu übermittelnde pragmatische Sachverhalte (Wk2) unter Beachtung vorliegender Daten (D) einschließlich Vorgaben (Vr) jeweils dadurch erzeugt werden, daß ein oder mehrere hierdurch angezeigte grammatische Symbole (Gr) und eine Permutation von diesen zugeordneten Textsymbolen (Gt) unter Beachtung der Anordnungen (Pr) zu einem grammatischen Inhalt (N) zusammengefügt werden, der durch einen, aus einer Permutation von diesen Symbolen (Gt) zugeordneten, an durch diese Anordnungen (Pr) gegebenen Positionen (P), gegebenenfalls auch diskontinuierlich, angeordneten, Textabschnitten (Ts) zusammengefügten Text (T) zu einer grammatischen Nachricht (TN) ergänzt wird, und daß die Sachbegriffe (K) einer Permutation von diesen Textsymbolen (Gt) zugeordneten semantischen Hinweisen (Fp) gemäß einer Permutation von diesen Hinweisen (Fp) zugeordneten Verwendungshinweisen (q) unter Beachtung der durch einen vorausgesetzten pragmatischen Sachverhalt (Wk1) gegebenen Wahrscheinlichkeiten (p(K)1) wie auch weiterer, in den Daten (Wp) vorliegender, Wahrscheinlichkeiten (p(Em)) ein, als Komplex (Kp = KK) dieser Sachbegriffe (K) mit Wahrscheinlichkeiten (p(K)2) zusammengefügter, semantischer Inhalte (F) gebildet wird, durch den die grammatische Nachricht (TN) zu einer semantischen Nachricht (TNF) ergänzt und der vorausgesetzte pragmatische Sachverhalt (Wk1) in den zu übermittelnden pragmatischen Sachverhalt (Wk2) abgeändert wird, der einer durch die Vorgaben (Vr) gegebenen weiteren Verwendung zuzuführen ist.
2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß für einen Text (T) aus einem
disjunkten Repertoire (R(Wk1x)) von vorausgesetzten Sachverhalten (Wk1x) ein
Sachverhalt (Wk11) ausgewählt wird, mit dem sich unter Beachtung der Daten (Wp) ein
semantischer Inhalt (F) ergibt, der einer gegebenen grammatischen Nachricht (TN) mit
der höchsten, einen Schwellwert (ps) nicht unterschreitenden Wahrscheinlichkeit
(p(TNF)) zuordenbar ist.
3. Verfahren nach Anspruch 1 und 2, dadurch gekennzeichnet, daß für die Kommunikation
ein Repertoire (R(Wk1x)) von Sachverhalten (Wk1x) mit Sachbegriffen (K) und
Wahrscheinlichkeiten (p(K)1) vorausgesetzt wird, welches die Möglichkeiten von
Meinungs- wie auch Wissensunterschieden zwischen den Kommunikationspartnern (Pa)
berücksichtigt.
4. Verfahren nach einem oder mehreren der Ansprüche 1 bis 3, dadurch gekennzeichnet, daß
aus einem bei vorausgesetzten pragmatischen Sachverhalten (Wk1) einem Text (T)
zugeordneten disjunkten Repertoire (R(Wk2x) von pragmatischen Sachverhalten (Wk2x)
ein Sachverhalt (Wk21) als zu übermittelnder Sachverhalt weiter verwendet wird, dem
aufgrund dieses Textes (T) Sachbegriffe (K) mit Wahrscheinlichkeiten (p(K)2)
zuzuordnen sind, die sich von den durch die Sachverhalte (Wk1) beziehungsweise Daten
(Wp) gegebenen Wahrscheinlichkeiten (p(K)1) um Beträge (p) unterscheiden, welche
zwischen festzulegenden Mindestwerten (p1) und Höchstwerten (p2) liegen.
5. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß die Kommunikation unter
Verwendung von, durch Texte (Ts) angezeigten, Textsymbolen (Vt) durchgeführt wird,
die dadurch an eine natürliche Sprache (L) angepaßt sind, daß die Texte (Ts) den
statistisch bewerteten Ergebnissen von Transformationen (Qs) an Texten (T) dieser
Sprache (L) genügen, wonach unter Einhaltung einer zu beobachtenden Invarianz (I) ein
bezüglich seines semantischen Inhalts (F1) als korrekt beurteilter Text (T1 = Tf1) bei
Verkürzung um einen kürzestmöglichen, einen oder auch mehrere, diskontinuierlich
angeordnete Textabschnitte (T) umfassenden Textteil (T11) in einen bezüglich des hierbei
abgewandelten semantischen Inhalts (F = F2) ebenfalls als korrekt beurteilten Text (T2 =
TV) abgeändert wird, wobei dieser Textteil (T11 = Ts) einem Symbol (Vt) zugeordnet
wird, dem ein, einen Sachbegriff (K) und einen Verwendungshinweis (q) hierfür
umfassender, semantischer Hinweis (Fp) zugeordnet wird, durch welchen der semantische
Inhalt (F2) in den ursprünglichen Inhalt (F1) abgeändert wird, und wobei diese
Transformation Qs als notwendige Bedingung dafür, daß das betreffende Symbol (Vt) mit
untergeordnetem Rang (Ra) einem durch einen weiteren Textteil (Ts') des Textes (T2)
angezeigten weiteren Symbol (Vt') zugeordnet ist, sowie als hinreichende Bedingung
dafür gilt, daß kein durch einen weiteren Textteil (Ts") des Textes (T1) angezeigtes
weiteres Symbol (Vt") vorliegt, welchem dieses Symbol (Vt) mit einem übergeordneten
Rang (Ra) zugeordnet ist.
6. Verfahren nach Anspruch 1 und 5, dadurch gekennzeichnet, daß die Kommunikation
unter Verwendung von, jeweils zu einer disjunkten Klasse (K1) von Symbolen (Vt)
superierten, grammatischen Symbolen (Gr = Grx) durchgeführt wird, welche den
Ergebnissen der Transformationen (Qs) genügen, die auf Texte (T1') angewandt werden,
die alternativ als Textteile (T11) jeweils einen Textabschnitt (Tsxyz a Vtxy)
unterschiedlicher Symbole (Vtxy a Grx) eines grammatischen Symbols (Grx) enthalten.
7. Verfahren nach einem oder mehreren der Ansprüche 1 bis 6, dadurch gekennzeichnet, daß
die unter Beachtung der Wahrscheinlichkeit (p(TNF)) vorzunehmende Komplexbildung
von semantischen Nachrichten (TNF) aus Komponenten (Em), welche gemäß, als Evidenz
vorliegenden, Daten (D) durch Adressen (Ad) wie auch Vorgaben (Vr) mit ausreichend
hohen Wahrscheinlichkeiten (p(Em)) in Form disjunkter Repertoires (R(Em)) angezeigt
werden, unter Berücksichtigung hierfür in den Daten (Wp) vorliegender
Wahrscheinlichkeiten (p(Em)), gemäß dem Bayesschen Ansatz (Ba) durchgeführt wird,
wonach die in den zu durchlaufenden Superierungsstufen anfallenden disjunkten
Komplexe (Kp = EmEm) als jeweils einer disjunkten Klasse (K1 = (Ks)) zugeordnete
Konkurrenzhypothesen (Ks) entsprechend ihren, auf die Daten (D) bezogenen,
Wahrscheinlichkeiten (p(Ks)) berücksichtigt werden, wobei in den Hypothesen (Ks)
bereits berücksichtigte Komponenten (Em) auch als Adressen (Ad) für weitere,
gegebenenfalls auch disjunkt zu verwendende Komponenten (Em) eingesetzt werden.
8. Verfahren nach einem oder mehreren der Ansprüche 1 bis 7, dadurch gekennzeichnet, daß
die bei der Komplexbildung semantischer Nachrichten (TNF), auch als
Zwischenergebnisse, anfallenden Konkurrenzhypothesen (Ks) unter Beachtung von
Wahrscheinlichkeiten (p(Ks)) berücksichtigt werden, welche unter Anwendung
nichtlinearer, von der Höhe der Wahrscheinlichkeiten (p) abhängiger
Verarbeitungsoperationen (Bb) bestimmt werden, wonach mit Wahrscheinlichkeiten
(p(Em)) zu verwendende, disjunkten Repertoires (R(Em)) zugeordnete Komponenten
(Em) sowie aus Komponenten (Em) mit resultierenden Wahrscheinlichkeiten (p(Ks))
zusammengefügte Konkurrenzhypothesen (Ks), deren Wahrscheinlichkeiten (p) jeweils
festzulegende Grenzwerte (ps) unterschreiten, unter Beachtung der für das jeweils
disjunkte Repertoire (R) von Komponenten (Em) beziehungsweise Hypothesen (Ks)
geltenden Wahrscheinlichkeitssummen (Ca) vernachlässigt werden, wobei Schwellwerte
(ps) so den zu leistenden Kommunikationsakten und verfügbaren Vorrichtungen angepaßt
werden, daß zulässige Bearbeitungszeiten und Fehlerraten nicht überschritten werden und
aus einem Repertoire (R) wenigstens eine Konkurrenzhypothese (Ks) Verwendung findet.
9. Verfahren nach einem oder mehreren der Ansprüche 1 bis 8, dadurch gekennzeichnet, daß
die Komplexbildung semantischer Nachrichten (TNF) unter Verwendung von als
disjunktes Repertoire (R(Em)) von als Komponenten (Em) zu verwendenden
Sachbegriffen (K) unter Anwendung nichtlinearer Verarbeitungsschritte (Bbr)
durchgeführt wird, wonach Komponenten (Em = Em1), die einer Nachricht (TNF) mit
einer einen nahe 1 liegenden Schwellwert (ps3) übertreffenden Wahrscheinlichkeit
(p(Em1)) zuordenbar sind, gegenüber weiteren, dem Repertoire (R(Em)) angehörigen
Komponenten (Em) mit Wahrscheinlichkeiten (p(Em)) unterhalb (ps3) vernachlässigt
werden.
10. Verfahren nach einem oder mehreren der Ansprüche 1 bis 9, dadurch gekennzeichnet, daß
die Kommunikation mit Sachbegriffen (K) durchgeführt wird, für deren Zuordnung zu
Texten (T) und semantischen Nachrichten (TNF) Zuordnungswahrscheinlichkeiten (p(K))
zu Textsymbolen (Vt) und weiteren Begriffen (K) vorausgesetzt werden, welche die
Möglichkeit der Verwendung subjektiver wie auch fehlerhafter, von objektiv gewonnenen
Daten (p(K)) abweichender Werte durch den Kommunikationspartner (Pa) mit
einschließen.
11. Verfahren nach einem oder mehreren der Ansprüche 1 bis 10, dadurch gekennzeichnet,
daß die Kommunikation unter Verwendung von Textsymbolen (Vt) zugeordneten
semantischen Hinweisen (Fp) durchgeführt wird, die jeweils einen als Menge von
Begriffen (A) gebildeten Sachbegriff (K) und ein Repertoire (R) von disjunkten Klassen
(K1) von Verwendungshinweisen (q) für dessen unter Beachtung der Anordnungen (Pr)
der grammatischen Symbole (Gr), denen die Symbole (Vt) angehören, vorzunehmende
Verknüpfungen mit weiteren Sachbegriffen (K) zu Komplexen (Kp = KK) umfassen,
welche mit (q = d) die Durchschnittsbildung und (q = s) die Vereinigung zweier
Sachbegriffe (K = K1) und (K2), mit (q = m) eine Entfernung eines gemäß (K3 m K4)
nachgestellten Begriffs K4 aus einem weiteren Begriff K3, mit (q = f) gemäß (K5 f K6)
das Ersetzen eines Begriffs (K5) durch eine Negation (K6 = nK5) dieses Begriffs (K5),
mit (q = c) gemäß (K7 c K8) das Ersetzen eines Begriffs (K7) durch einen in einer oder
mehreren Eigenschaften (H(K)) hiervon abweichenden Begriff (K8), sowie mit (q = o)
gemäß (K14 = K12 o K13) die Bildung eines disjunkten Sachbegriffs (K14) vorsehen,
welcher entweder die Begriffe (A) des Sachbegriffs (K12) oder des Sachbegriffs (K13)
umfaßt.
12. Verfahren nach einem oder mehreren der Ansprüche 1 bis 11, dadurch gekennzeichnet,
daß die Verknüpfungen von semantischen Hinweisen (Fp) zugeordneten Sachbegriffen
(K) mit weiteren Sachbegriffen (K) zugeordneten Sachbegriffen (K) gemäß
Verwendungshinweisen (q) erfolgen, welche von der Art der Verknüpfung abhängige
Abänderungen der für die hierdurch gebildeten Komplexe (Kp) von Sachbegriffen (K)
resultierenden Wahrscheinlichkeiten (p(Kp)) um an die betreffenden Sprachen (L)
angepaßte Faktoren (qr) vorgeben.
13. Verfahren nach einem oder mehreren der Ansprüche 1 bis 12, dadurch gekennzeichnet,
daß die Kommunikation unter Verwendung von durch die Daten (Wp) beschriebenen
Sachbegriffen (K) durchgeführt wird, die zu den jeweils einem semantischen Hinweis
(Fp) eines Symbols (Vt) zugeordneten Sachbegriffen (K = K5) jeweils einen Oberbegriff
(K11) enthalten, der als Vereinigung (K11 = K5 s K6) des Sachbegriffs (K5) mit einem
Sachbegriff (K6) gebildet wird, der eine Negation (K6 = nK5) des Begriffs (K5) darstellt,
wobei Oberbegriffe (K11) verwendet werden, denen die Begriffe (K5) jeweils mit
ausreichend hohen, einen Referenzwert (pr) nicht unterschreitenden Wahrscheinlichkeiten
(p(K5/K11)) zugeordnet werden, und wobei eine gemäß den Gegebenheiten der Sprachen
(L) gemäß (K5 f6 K6) vorzunehmende Negation (K6) eines einem Symbol (Vt)
zugeordneten Begriffs (K5) durch die Entfernung (K6 = K11 m K5) des Begriffs (K5) aus
dem Oberbegriff (K11) vorgenommen wird.
14. Verfahren nach einem oder mehreren der Ansprüche 1 bis 13, dadurch gekennzeichnet,
daß die Kommunikation unter Verwendung grammatischer Nachrichten (TN)
durchgeführt wird, welche jeweils aus einem Text (T) und einem diesem gemäß einem
grammatischen Kommunikationsverfahren (M) zugeordneten grammatischen Inhalt (N)
bestehen, der als Komplex (Kp) aus Komponenten (Em) gebildet wird, die Textsymbole
(Vt) und hieraus zu disjunkten Klassen (Kl) superierte grammatische Symbole (Gr = G)
umfassen, welche zusätzlich zu den Transformationen (Qs) bestimmten Transformationen
(Q) an Texten (T) genügen, deren Ergebnisse durch Beobachtungen bestimmter
Invarianzen (I) an den Texten (T) nachweisbar sind.
15. Verfahren nach einem oder mehreren der Ansprüche 1 bis 14, dadurch gekennzeichnet,
daß die Bildung der semantischen Inhalte (F) aus den semantischen Hinweisen (Fp) der
Symbole (Vt) zugeordneten Sachbegriffen (K1) unter Berücksichtigung von, durch die
Daten (Wp) beschriebenen, weiteren Sachbegriffen (K2) durchgeführt wird, welche den
Begriffen (K1) mit ausreichend hohen, vorgegebene Schwellwerte (ps) nicht
unterschreitenden Wahrscheinlichkeiten (p(K2/K1)) zugeordnet sind, wobei orthogonale
Sachbegriffe (K) verwendet werden, wonach weitere Sachbegriffe (K3) so festgelegt
werden, daß gemäß (p(K2/K1; K3) = p(K2/K1)) die Abhängigkeit eines Sachbegriffs (K2)
von einem Begriff (K1) durch die Begriffe (K3) nicht beeinflußt wird.
16. Verfahren nach einem oder mehreren der Ansprüche 1 bis 15, dadurch gekennzeichnet,
daß die Kommunikation unter Verwendung eines Repertoires (R(K)) von Sachbegriffen
(K) durchgeführt wird, deren wechselseitige Bezüge durch bedingte Wahrscheinlichkeiten
(p(K)) beschrieben werden, deren Ordnung (O(n)) einen vorgegebenen, der
Leistungsfähigkeit verfügbarer Vorrichtungen angepaßten Wert (n = n1) nicht
überschreitet.
17. Verfahren nach einem oder mehreren der Ansprüche 1 bis 16, dadurch gekennzeichnet,
daß der Aufbau von, einlaufenden Texten (T) zuzuordnenden, semantischen Nachrichten
(TNF) aus Komponenten (Em) unter Beachtung der Verwendungshinweise (q) in einer
Reihenfolge nach fallenden, durch die vorliegende Evidenz (D) und die Daten (Wp)
einschließlich der als Adressen (Ad) eingesetzten, bereits verwendeten Komponenten
(Em) bedingten, Wahrscheinlichkeiten (p(Em/D; Wp)) dieser Komponenten (Em)
durchgeführt wird.
18. Verfahren nach einem oder mehreren der Ansprüche 1 bis 17, dadurch gekennzeichnet,
daß Komplexe (Kp = VtVt = Vt1) von in Anordnungen (Pr) zusammengefügten
Textsymbolen (Vt) mit gemäß deren semantischen Hinweisen (Fp) diesen Komplexen
(Vt1) zugeordneten Komplexen (Kp = KK = K1) von Sachbegriffen (K), welche in
semantischen Nachrichten (TNF) mit ausreichender Häufigkeit vorkommen, als Idiome
(Vt1) mit einem diesem jeweils zugeordneten semantischen Hinweis (Fp1) und diesem
zugeordneten Sachbegriff (K1) verwendet werden.
19. Verfahren nach einem oder mehreren der Ansprüche 1 bis 18, dadurch gekennzeichnet,
daß Vorgaben (Vr) berücksichtigt werden, wonach Texte (T), denen keine semantischen
Nachrichten (TNF) zuordenbar sind, bei denen die Wahrscheinlichkeiten (p(Em))
sämtlicher Komponenten (Em) und (p(F)) des semantischen Inhalts (F) hierfür jeweils
festgelegte Schwellwerte (ps) überschreiten, den Kommunikationspartnern (Pa) wie
gegebenenfalls auch Nutzern des Verfahrens (Mp) durch entsprechende Markierungen
angezeigt werden.
20. Verfahren nach einem oder mehreren der Ansprüche 1 bis 19, dadurch gekennzeichnet,
daß die durch einen Empfänger (Hr) eines einlaufenden Textes (T) vorzunehmende
Bestimmung eines durch dessen Autor (At) übermittelten Sachverhalts (Wk2) gemäß
einem Verfahrensteil (Mp1) von Verfahren (Mp) durchgeführt wird, wonach die beim
Kommunikationsakt anfallenden Daten (D) einschließlich des einlaufenden Textes (T)
sowie der Vorgaben (Vr) aufgenommen und gespeichert werden, durch darin zu
identifizierende Adressen (Ad) angezeigte Repertoires (Ra(Em)) von für die
Komplexbildung von semantischen Nachrichten (TNF) zu berücksichtigenden
Komponenten (Em) mit Entnahmebedingungen (Ve) festgelegt werden, dadurch
gegebene, grammatischen Symbolen (Gr) zugeordnete Textsymbole (Vt) unter Beachtung
der Wahrscheinlichkeiten (p(N/T)) zu einem entsprechend disjunkten Repertoire (Rb) von
Komplexen (Kpx) von jeweils einer oder mehreren grammatischen Nachrichten (TN) mit
grammatischen Inhalten (N) zusammengefügt werden, wonach weiterhin die Sachbegriffe
(K a Fp a Vt) von Permutationen von den Symbolen (Vt a N a Kpx) der jeweils einem
Komplex (Kpx) zugeordneten semantischen Hinweise (Fp a Vt) gemäß ihren
Verwendungshinweisen (q a Fp) unter Beachtung eines disjunkten Repertoires (Rc) eines
oder mehrerer beim Partner (Pa) vorausgesetzter Sachverhalte (Wk1v) zu einem
disjunkten Repertoire (Rd) von Komplexen (Kpz) von den Komplexen (Kpx a Rb)
zugeordneten semantischen Nachrichten (TNF) mit semantischen Inhalten (F)
zusammengefügt werden, und wonach ein Sachverhalt (Wk11 a Wk1v), bei dem sich für
die semantischen Inhalte (F a TNF a Kp1) eines Komplexes (Kp1 a Kpz) die höchsten,
einen vorgegebenen Maximalwert (pr) nicht überschreitenden Wahrscheinlichkeiten
(p(F/TN; Wk11)) ergeben, durch diese semantischen Inhalte (F a Kp1) unter Beachtung
der durch diesen Komplex (Kp1) gegebenen Ordnung in den durch den Text (T)
übermittelten Sachverhalt (Wk2) abgewandelt wird, der einer durch Vorgaben (Vr)
festgelegten weiteren Verwendung zugeführt wird.
21. Verfahren nach einem oder mehreren der Ansprüche 1 bis 20, dadurch gekennzeichnet,
daß die in der Rolle eines Autors (At) durch einen auszugebenden Text (T)
vorzunehmende Übermittlung eines als Komplex (Kp) von Sachbegriffen (K) gegebenen
Sachverhalts (Wk) an einen Kommunikationspartner (Pa) gemäß einem Verfahrensteil
(Mp2) von Verfahren (Mp) durchgeführt wird, wonach der von einem beim Partner (Pa)
vorauszusetzenden Sachverhalt (Wk1) abweichende Teil des Sachverhalts (Wk) durch ein
disjunktes Repertoire (R1(Kpx)) von Komplexen (Kpx) von den Daten (Wp)
zugeordneten Sachbegriffen (K) dargestellt wird und Textsymbole (Vt), denen diese
Sachbegriffe (K a Fp a Vt) über deren semantische Hinweise (Fp) zugeordnet sind, zu
einem disjunkten Repertoire (R2(Kpy)) von jeweils den Komplexen (Kpx)
entsprechenden Komplexen (Kpy) von jeweils einer oder mehreren grammatischen
Nachrichten (TN) zusammengefügt werden, die durch Zuordnung von unter Beachtung
der Hinweise (Fp) gebildeten semantischen Inhalten (F) zu semantischen Nachrichten
(TNF) ergänzt werden, von denen ein Text (T1 a Kp1) eines Komplexes (Kp1 a R2) an
den Partner (Pa) ausgegeben wird, dessen gemäß Verfahrensteil (Mp1) zu ermittelnde
Inhalte (F) mit ausreichend hohen Wahrscheinlichkeiten (p(F/TN; Wk1) und
ausreichender Eindeutigkeit den vorausgesetzten Sachverhalt Wk1 in einen Sachverhalt
Wk2 abwandeln, der mit ausreichender Genauigkeit mit dem Sachverhalt Wk
übereinstimmt.
22. Verfahren nach einem oder mehreren der Ansprüche 1 bis 21, dadurch gekennzeichnet,
daß eine bei der Kommunikation gemäß Vorgaben (Vr) vorzunehmende Verbesserung
eines durch einen Kommunikationspartner (Pa) in einer Sprache (L) verfaßten
einlaufenden Textes (T = T1) bezüglich seiner Übermittlung grammatischer Inhalte (N)
und semantischer Inhalte (F) gemäß einem Verfahrensteil (Mp3) von Verfahren (Mp)
durchgeführt wird, wonach dem Text (T1) gemäß Verfahrensteil (Mp1) ein übermittelter
Sachverhalt (Wk = Wk2) zugeordnet wird, dem gemäß Verfahrensteil (Mp2) ein diesen
Sachverhalt (Wk2) übermittelnder Text (T2) zugeordnet wird, und die hiervon
abweichenden Teile von Text (T1) durch die entsprechenden Teile von Text (T2) ersetzt
werden.
23. Verfahren nach einem oder mehreren der Ansprüche 1 bis 22, dadurch gekennzeichnet,
daß die Übertragung eines einlaufenden Textes (T) einer Ausgangssprache (L) in einen
bezüglich des hierdurch übermittelten Sachverhalts (Wk2) ausreichend gleichbedeutenden
auszugebenden Text (T') einer durch Vorgaben (Vr) festgelegten Zielsprache (L')
entsprechend einem Verfahrensteil (Mp4) von Verfahren (Mp) durchgeführt wird, wonach
dem Text (T) gemäß Verfahrensteil (Mp1) von (Mp) ein Komplex (Kp1) einer oder
mehrerer semantischer Nachrichten (TNF) zugeordnet wird, durch deren semantische
Inhalte (F) ein beim Autor (At) dieses Textes (T) vorauszusetzender Sachverhalt (Wk11)
in den Sachverhalt (Wk2) abgewandelt wird, und wonach gemäß Verfahrensteil (Mp2)
von (Mp) unter Anwendung der Daten (Wp') der Zielsprache (L') dessen von Sachverhalt
(Wk11) abweichender Teil als disjunktes Repertoire (R1(Kpx)) von Komplexen (Kpx)
von den Daten (Wp') zugeordneten Sachbegriffen (K') dargestellt wird, und Symbole
(Vt') der Sprache (L'), denen diese Sachbegriffe (K' a Fp' a Vt') über deren semantische
Hinweise (Fp') zugeordnet sind, zu einem disjunkten Repertoire (R2(Kpy)) von
Komplexen (Kpy) von jeweils einer oder mehreren semantischen Nachrichten (T'N'F')
ergänzt werden, von denen ein Text (T1' a Kpy) als Übertragung des Textes (T) einer
durch die Vorgaben (Vr) festgelegten weiteren Verwendung zugeführt wird, dessen
Inhalte (F') gemäß Verfahrensteil (Mp1) mit ausreichend hoher Wahrscheinlichkeit
p(F'/T'N'; Wk11') und Eindeutigkeit einen beim Hörer (Hr) dieses Textes (1')
vorauszusetzenden Sachverhalt (Wk11') in einen Sachverhalt (Wk2') abwandeln, welcher
mit ausreichender Genauigkeit mit dem Sachverhalt (Wk2) übereinstimmt.
24. Verfahren nach einem oder mehreren der Ansprüche 1 bis 23, dadurch gekennzeichnet,
daß die gemäß Verfahrensteil (Mp4) vorzunehmende Übertragung eines einlaufenden
Textes (T) einer Ausgangssprache (L) in einen Text (T') einer Zielsprache (L') unter
Anwendung des grammatischen Kommunikationsverfahrens (M) durchgeführt wird,
wonach dem Text (T) ein Komplex (Kp1) einer oder mehrerer grammatischer Nachrichten
(TN) zugeordnet wird, deren Textsymbole (Vt) als Komplexe (Kp11) von, Vokabeln
(Vqq) zugeordneten, Symbolkomplexen (Vq = VtVt) dargestellt werden, welchen jeweils
eine disjunkte Klasse (K1 = Vq') von, diesen mit Wahrscheinlichkeiten (p(Vq'/Vq))
zugeordneten, Komplexen (Vq' = Vt'Vt') von Textsymbolen (Vt') der Zielsprache (L')
anzeigen, welche unter Beachtung der Anordnungen (Pr) zu einem entsprechend
disjunkten Repertoire (R(Kp2)) von Komplexen (Kp2) von jeweils einer oder mehreren
grammatischen Nachrichten (T'N') zusammengefügt werden, wobei die Nachrichten (TN)
und (T'N') zu semantischen Nachrichten (TNF) und einem entsprechenden Repertoire
(R(Kp2)) von Komplexen (Kp2) semantischer Nachrichten (T'N'F') ergänzt werden und
ein Text (T' a Kp2) eines Komplexes (Kp2) als Übertragung (T') des Textes (T)
ausgegeben wird, dessen semantische Inhalte (F') einen beim Hörer (Hr) dieses Textes
(T') vorauszusetzenden Sachverhalt (Wk11') mit ausreichend hoher Wahrscheinlichkeit
(p(F'/T'N'; Wk11')) und Eindeutigkeit in einen Sachverhalt (Wk2') abwandeln, der mit
ausreichender Genauigkeit den durch Text (T) übermittelten Sachverhalt (Wk2)
wiedergibt.
25. Einrichtung zur rechnergestützten Durchführung des Verfahrens nach den Ansprüchen
1 bis 24, dadurch gekennzeichnet, daß eine Vorrichtung (1) verwendet wird, die aus,
jeweils aus einer oder mehreren Untereinheiten zusammengesetzten, durch eine oder
mehrere Stromversorgungsanlagen versorgten Einheiten aufgebaut ist, welche eine
zentrale Recheneinheit (11) zur Abwicklung der für die Erstellung semantischer
Nachrichten (TNF), zugehöriger Texte (T), semantischer Inhalte (F), pragmatischer
Sachverhalte (Wk) wie auch weiterer anfallender Daten (D) sowie der bei der
Ablauforganisation anfallenden Operationen, eine Speichereinheit (12) zur Speicherung
der hierfür einzusetzenden Daten (Wp) der betreffenden Sprachen (L) einschließlich zu
berücksichtigender Sachverhalte (Wk), anfallender Zwischen- und Endergebnisse sowie
einlaufender und auszugebender Daten (D) einschließlich Texten (T) und Vorgaben (Vr),
eine Einheit (13) zum Austausch einlaufender und auszugebender Daten (D)
einschließlich Texten (T) und, gegebenenfalls auch zur Auslösung vorgegebener
Operationen bestimmter, Sachverhalte (Wk) mit Kommunikationspartnern (Pa) und,
maschinelle Vorrichtungen einschließenden, Nutzern in den hierfür vorgesehenen Medien
und Kodierungen sowie eine Bedieneinheit (14) zur Festlegung und Überwachung von
Betriebszuständen und Vorgaben (Vr) umfaßt, wobei diese Einheiten (11) bis (14) durch
Datenbusse (15) mit an die jeweiligen Datenraten angepaßten Bandbreiten verbunden
sind.
26. Einrichtung nach Anspruch 25, dadurch gekennzeichnet, daß in der Speichereinheit (12)
für die Daten (Wp) einschließlich der Symbole (Gs) und der diesen zugeordneten
semantischen Hinweise (Fp) RAM-Speichermodule verwendet werden.
27. Einrichtung nach Anspruch 25, dadurch gekennzeichnet, daß eine Vorrichtung (1)
eingesetzt wird, deren zentrale Recheneinheit (11) wie auch Speichereinheit (12) unter
Verwendung von dem Verfahren (Mp) einschließlich der Daten (Wp) angepaßten
kundenspezifischen integrierten Schaltkreisen aufgebaut sind.
28. Einrichtung nach einem oder mehreren der Ansprüche 25 bis 27, dadurch gekennzeichnet,
daß einer den Zentralrechner (11) und die Speichereinheit (12) umfassenden
Zentraleinheit (111) mehrere, gegebenenfalls auch räumlich hiervon und voneinander
getrennt angeordnete, jeweils für unterschiedliche Kommunikationspartner (Pa) und
Nutzer verfügbare Nutzereinheiten (112) zugeordnet sind, welche jeweils eine
Bedieneinheit (14) und eine Empfangs- und Ausgabeeinheit (13) umfassen und mit der
Zentraleinheit (111) durch, gegebenenfalls auch drahtlos zu realisierende, Datenbusse (15)
verbunden sind, deren Bandbreiten an die beim Einlesen und Ausgeben von Texten (T)
einschließlich diesen zugeordneter Daten (D) wie auch bei Bedienung und Nutzung
einschließlich der Übermittlung von Vorgaben (Vr) anfallenden Datenraten angepaßt sind.
29. Einrichtung nach einem oder mehreren der Ansprüche 25 bis 28, dadurch gekennzeichnet,
daß die zentrale Recheneinheit (11) und Speichereinheit (12) unter Verwendung von
Parallelrechnern aufgebaut werden, in denen den in semantischen Nachrichten (TNF) zu
verwendenden Symbolen (Gs) wie auch Sachbegriffen (K) Rechenmodule (1111)
zugeordnet werden, die entsprechend deren in den Daten (Wp) festgelegten Bezügen
parallel miteinander verknüpft werden.
30. Verfahren und Einrichtung nach einem oder mehreren der Ansprüche 1 bis 29, dadurch
gekennzeichnet, daß Verfahren (Mp) unter Verwendung von Daten (Wp) durchgeführt
wird, welche ein dem Sprachgebrauch menschlicher, als Autoren (At) auftretender
Kommunikationspartner (Pa) angepaßtes Repertoire R(Vt) von Symbolen (Vt) sowie ein
beschränktes Repertoire (R(K)) von Sachbegriffen (K) umfassen, das so an die durch die
Kommunikation abzudeckenden, die Auslösung vorgegebener Operationen
einschließenden Sachverhalte angepaßt ist, daß diese Sachverhalte durch eine gemäß
Verfahren (Mp) als Hörer (Hr) fungierende Vorrichtung (1) als einlaufenden Texten (T)
zuzuordnende, durch Verknüpfung dieser Sachbegriffe (K) erzeugbare semantische
Inhalte (F) und hierdurch bestimmte Sachverhalte (Wk2) darstellbar werden, welche in
Form von, durch Vorgaben (Vr) festgelegten, eindeutig kodierten Signalen einer weiteren,
die Auslösung vorgegebener Operationen bei als Nutzer zugeordneten maschinellen
Vorrichtungen einschließenden, Verwendung zugeführt werden.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE10015858A DE10015858C2 (de) | 2000-03-30 | 2000-03-30 | Verfahren zu einer auf semantische Inhalte bezogenen rechnergestützten Kommunikation in natürlichen Sprachen |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE10015858A DE10015858C2 (de) | 2000-03-30 | 2000-03-30 | Verfahren zu einer auf semantische Inhalte bezogenen rechnergestützten Kommunikation in natürlichen Sprachen |
Publications (2)
Publication Number | Publication Date |
---|---|
DE10015858A1 true DE10015858A1 (de) | 2001-10-11 |
DE10015858C2 DE10015858C2 (de) | 2002-03-28 |
Family
ID=7636996
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE10015858A Expired - Lifetime DE10015858C2 (de) | 2000-03-30 | 2000-03-30 | Verfahren zu einer auf semantische Inhalte bezogenen rechnergestützten Kommunikation in natürlichen Sprachen |
Country Status (1)
Country | Link |
---|---|
DE (1) | DE10015858C2 (de) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE102008003886A1 (de) | 2008-01-10 | 2009-07-16 | Grunert, Florian Silver | Verfahren zur Übertragung eines Textes einer beliebigen Ausgangssprache in einen Text einer beliebigen Zielsprache basierend auf dem Prinzip der von mir entwickelten Farbontologie |
DE102008003572A1 (de) | 2008-01-09 | 2009-10-01 | Grunert, Florian Silver | Verfahren zur Übertragung eines Textes einer beliebigen Ausgangssprache in einen Text einer beliebigen Zielsprache basierend auf dem Prinzip der von mir entwickelten Farbontologie |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE202016000135U1 (de) | 2016-01-08 | 2016-02-02 | Markus Robens | System zum kooperativen Verbessern von Sprachkenntnissen unter Zuhilfenahme von Terminologie-Datenbanken |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE3151106A1 (de) * | 1980-12-25 | 1982-07-08 | Casio Computer Co., Ltd., Tokyo | Elektronisches lexikon |
DE3032664C2 (de) * | 1979-08-30 | 1982-09-09 | Sharp K.K., Osaka | Elektronisches Sprachübersetzungsgerät. |
DE3514286A1 (de) * | 1985-04-19 | 1986-10-23 | Siemens AG, 1000 Berlin und 8000 München | System zur erkennung einzeln gesprochener woerter |
DE3616011A1 (de) * | 1985-05-14 | 1986-11-20 | Sharp K.K., Osaka | Uebersetzungsgeraet |
DE3615972A1 (de) * | 1985-05-14 | 1986-11-20 | Sharp K.K., Osaka | Zweisprachiges uebersetzungssystem mit eigen-intelligenz |
DE3142540C2 (de) * | 1980-10-28 | 1988-02-11 | Sharp K.K., Osaka, Jp | |
DE3211313C2 (de) * | 1981-03-27 | 1988-06-16 | At & T Technologies, Inc., New York, N.Y., Us | |
DE3503233C2 (de) * | 1985-07-26 | 1989-09-28 | Wladislaus 4000 Duesseldorf De Quasebarth | |
DE3733391C2 (de) * | 1986-10-03 | 1990-03-29 | Ricoh Co., Ltd., Tokio/Tokyo, Jp | |
DE4135261C1 (de) * | 1991-10-25 | 1993-03-18 | International Business Machines Corp., Armonk, N.Y., Us | |
DE4232482A1 (de) * | 1992-09-28 | 1994-06-01 | Siemens Ag | Verfahren zur Realisierung eines internationalen Sprachenverbundes in einem internationalen Kommunikationsnetz |
DE4311211A1 (de) * | 1993-04-05 | 1994-10-06 | Ibm | Computersystem und Verfahren zur automatisierten Analyse eines Textes |
-
2000
- 2000-03-30 DE DE10015858A patent/DE10015858C2/de not_active Expired - Lifetime
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE3032664C2 (de) * | 1979-08-30 | 1982-09-09 | Sharp K.K., Osaka | Elektronisches Sprachübersetzungsgerät. |
DE3142540C2 (de) * | 1980-10-28 | 1988-02-11 | Sharp K.K., Osaka, Jp | |
DE3151106A1 (de) * | 1980-12-25 | 1982-07-08 | Casio Computer Co., Ltd., Tokyo | Elektronisches lexikon |
DE3211313C2 (de) * | 1981-03-27 | 1988-06-16 | At & T Technologies, Inc., New York, N.Y., Us | |
DE3514286A1 (de) * | 1985-04-19 | 1986-10-23 | Siemens AG, 1000 Berlin und 8000 München | System zur erkennung einzeln gesprochener woerter |
DE3616011A1 (de) * | 1985-05-14 | 1986-11-20 | Sharp K.K., Osaka | Uebersetzungsgeraet |
DE3615972A1 (de) * | 1985-05-14 | 1986-11-20 | Sharp K.K., Osaka | Zweisprachiges uebersetzungssystem mit eigen-intelligenz |
DE3503233C2 (de) * | 1985-07-26 | 1989-09-28 | Wladislaus 4000 Duesseldorf De Quasebarth | |
DE3733391C2 (de) * | 1986-10-03 | 1990-03-29 | Ricoh Co., Ltd., Tokio/Tokyo, Jp | |
DE4135261C1 (de) * | 1991-10-25 | 1993-03-18 | International Business Machines Corp., Armonk, N.Y., Us | |
DE4232482A1 (de) * | 1992-09-28 | 1994-06-01 | Siemens Ag | Verfahren zur Realisierung eines internationalen Sprachenverbundes in einem internationalen Kommunikationsnetz |
DE4311211A1 (de) * | 1993-04-05 | 1994-10-06 | Ibm | Computersystem und Verfahren zur automatisierten Analyse eines Textes |
Non-Patent Citations (9)
Title |
---|
Dieter E. Zimmer, Payment may be made - Bezahlung kann sein gemacht, Die Zeit, Nr. 15 (5. April 1996) * |
Edward O. Wilson, Sociobiology, Cambridge, Mass. und Londong (1975) * |
Helmar Frank, Kybernetische Grundlagen der Pädagogik, Agis, Baden-Baden (1996) * |
Hermann Helbig, Künstliche Intelligenz und automatische Wissenverarbeitung, Technik, Berlin (1991) * |
John Lyons, Die Sprache, Beck, München (1992) * |
John Lyons, Einführung in die moderne Linguistik, Beck, München (1971) * |
New Scientist, S. 53 (22. Okt. 1987) * |
Steven Pinker, The Language Instinct, Morrow, New York (1994) * |
Terry Winograd, Fernando Flores, On "UnderstandingComputers and Cognition": A New Foundation for Design, Artificial Intelligence, Vol. 31, S. 250 (1984) * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE102008003572A1 (de) | 2008-01-09 | 2009-10-01 | Grunert, Florian Silver | Verfahren zur Übertragung eines Textes einer beliebigen Ausgangssprache in einen Text einer beliebigen Zielsprache basierend auf dem Prinzip der von mir entwickelten Farbontologie |
DE102008003886A1 (de) | 2008-01-10 | 2009-07-16 | Grunert, Florian Silver | Verfahren zur Übertragung eines Textes einer beliebigen Ausgangssprache in einen Text einer beliebigen Zielsprache basierend auf dem Prinzip der von mir entwickelten Farbontologie |
Also Published As
Publication number | Publication date |
---|---|
DE10015858C2 (de) | 2002-03-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Newmeyer | Linguistic theory in America | |
Black et al. | Statistically-driven computer grammars of English: The IBM/Lancaster approach | |
EP1336955B1 (de) | Verfahren zur Erzeugung natürlicher Sprache in Computer-Dialogsystemen | |
DE69530816T2 (de) | Textbearbeitungssystem und Verfahren unter Verwendung einer Wissensbasis | |
EP0925578B1 (de) | Sprachverarbeitungssystem und verfahren zur sprachverarbeitung | |
DE69908047T2 (de) | Verfahren und System zur automatischen Bestimmung von phonetischen Transkriptionen in Verbindung mit buchstabierten Wörtern | |
Oktapiani et al. | Women’s language features found in female character’s utterances in the Devil Wears Prada movie | |
WO2015113578A1 (de) | Verfahren zur automatischen sinnerkennung und messung der eindeutigkeit von text | |
DE102007004684A1 (de) | Verfahren und Datenverarbeitungssystem zum gesteuerten Abfragen strukturiert gespeicherter Informationen | |
Lokman et al. | Extension and prerequisite: An algorithm to enable relations between responses in chatbot technology | |
Hymes | Pidginization and Creolization of Languages: Their Social Contexts | |
DE10015858C2 (de) | Verfahren zu einer auf semantische Inhalte bezogenen rechnergestützten Kommunikation in natürlichen Sprachen | |
Tao et al. | ChatGPT Role-play Dataset: Analysis of User Motives and Model Naturalness | |
DE10015859C2 (de) | Verfahren zu einer auf grammatische Inhalte bezogenen rechnergestützten Kommunikation in natürlichen Sprachen | |
Janko | Linguistically integrated contractual interpretation: Incorporating semiotic theory of meaning-making into legal interpretation | |
Edmonds et al. | Reconciling fine-grained lexical knowledge and coarse-grained ontologies in the representation of near-synonyms | |
AlAfnan | Large Language Models as Computational Linguistics Tools: A Comparative Analysis of ChatGPT and Google Machine Translations | |
Gibbon et al. | Spoken Language Characterization | |
Гирин | Humanization tendencies in Present-day English grammar | |
EP3665619B1 (de) | Verfahren zum erzeugen einer sprachansage als rückmeldung zu einer handschriftlichen nutzereingabe sowie entsprechende bedienvorrichtung und kraftfahrzeug | |
Meck | Kontextabhängiges Prompt-und Flowdesign in Sprachassistenzsystemen | |
Saxena | A systematic Survey of Natural Language Processing (NLP) Models & it’s Application | |
Savargiv et al. | A structural method based on fuzzy approach at producing emotional data | |
Penner | The High German of Russian Mennonites in Ontario | |
Gultom et al. | A Contrastive Analysis between English and Indonesian Adjectives in Report Text |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
OP8 | Request for examination as to paragraph 44 patent law | ||
D2 | Grant after examination | ||
8364 | No opposition during term of opposition | ||
8330 | Complete disclaimer |