DE10015858A1 - Verfahren zu einer auf semantische Inhalte bezogenen Kommunikation in natürlichen Sprachen und Einrichtung zur rechnergestützten Durchführung dieses Verfahrens - Google Patents

Verfahren zu einer auf semantische Inhalte bezogenen Kommunikation in natürlichen Sprachen und Einrichtung zur rechnergestützten Durchführung dieses Verfahrens

Info

Publication number
DE10015858A1
DE10015858A1 DE10015858A DE10015858A DE10015858A1 DE 10015858 A1 DE10015858 A1 DE 10015858A1 DE 10015858 A DE10015858 A DE 10015858A DE 10015858 A DE10015858 A DE 10015858A DE 10015858 A1 DE10015858 A1 DE 10015858A1
Authority
DE
Germany
Prior art keywords
text
semantic
assigned
symbols
probabilities
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
DE10015858A
Other languages
English (en)
Other versions
DE10015858C2 (de
Inventor
Gunthard Born
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to DE10015858A priority Critical patent/DE10015858C2/de
Publication of DE10015858A1 publication Critical patent/DE10015858A1/de
Application granted granted Critical
Publication of DE10015858C2 publication Critical patent/DE10015858C2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/216Parsing using statistical methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/55Rule-based translation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Machine Translation (AREA)

Abstract

Für eine Kommunikation in natürlichen Sprachen, wie sie von Menschen auch mehrsprachig beim Informationsaustausch, Übersetzen, Dolmetschen, Stenotypieren oder bei Textkorrekturen unter Beherrschung sowohl des Verstehens, auch zusammenhängend oder fehlerhaft, vorgebrachter Äußerungen als auch ihrer inhaltsgerechten Formulierung ausgeübt wird, liegen befriedigend maschinell durchführbare Verfahren bisher nicht vor. Wegen der Vielfalt der Erscheinungsformen, Kombinationsmöglichkeiten und hierdurch mitbestimmten Bedeutungsmöglichkeiten gebräuchlicher Wortformen war die, notwendig kontextabhängige, Verknüpfung von Sprachsignalen mit hierfür geeignet definierten grammatischen und semantischen Kommunikationsinhalten rechnerisch nicht bewältigbar. Durch ein Verfahren, welches Sprachsignale, auch nichtlinearer, probabilistisch mit neuartigen, auf angegebene Art universell für beliebige Sprachen festzulegenden Symbolen verknüpft, die gemäß den Eigenschaften hieraus zu superierender Oberbegriffe zu grammatischen und, hiervon abhängig, gemäß ihnen zugeordneter disjunkter Klassen von Sachbegriffen und Verwendungshinweisen hierfür zu semantischen Inhalten zusammengefügt werden, durch welche vorausgesetzte Kontexte in zu übermittelnde Sachverhalte abgeändert werden, wird die Kommunikationsaufgabe, auch unter Einsatz angegebener Vorrichtungen, lösbar gemacht.

Description

Die Erfindung betrifft ein Verfahren zu einer auf semantische Inhalte bezogenen, ein- wie auch mehrsprachig zu führenden Kommunikation in natürlichen Sprachen gemäß dem Oberbegriff des Anspruchs 1 und einer Einrichtung zur rechnergestützten Durchführung dieses Verfahrens gemäß dem Oberbegriff des Anspruchs 25. In Unteransprüchen sind Einzelheiten und Ausgestaltungen angegeben, welche die Vielfalt der Erscheinungsformen, Kombinations- und dadurch mitbestimmten Bedeutungsmöglichkeiten der in solchen Sprachen eingeführten Symbole und hieraus auf unterschiedliche Arten kombinierbaren Äußerungen sowie der damit zu verbindenden grammatischen und semantischen Inhalte berücksichtigen und den Einsatz eines daran angepaßten Repertoires von, an einer entsprechenden Zahl von Sprachbeispielen erläuterten, Maßnahmen vorsehen, die mit neuartigen, hierfür geeigneten Sprachbegriffen durchzuführende sind, welche einheitlichen, auf angegebene Art universell auf beliebige Sprachen anzuwendenden Definitionen und Erzeugungsvorschriften genügen, so daß die Kommunikationsaufgabe mit einem an die Kapazitäten verfügbarer Vorrichtungen anpaßbaren Speicher- und Verarbeitungsaufwand lösbar wird.
Für Verfahren der erfindungsgemäßen Art konnten bisher keine befriedigenden Lösungen vorgelegt werden. Wie unten weiter ausgeführt, stehen einer Realisierung vielfältige, zum Teil bisher auch noch gar nicht ausreichend erkannte und definierte Probleme entgegen, die vor allem auch der komplexen Organisation der einzusetzenden natürlichen Sprachen zuzuschreiben sind. Diesem Stand entsprechend existieren, wie auch den Literaturstellen //2//, S. 218 und //12// zu entnehmen ist, zur Zeit auch keine einheitlichen terminologischen Konventionen, so daß hier zunächst einige wesentliche der für die nachfolgende Beschreibung des erfindungsgemäßen Verfahrens benützten, zum Teil auch für eine präzise, sachgerechte Beurteilung des gegenwärtigen Standes sowie die Beschreibung der zu lösenden Aufgabe benötigten Begriffe näher zu definieren sind: Unter natürlichen Sprachen L oder kurz auch Sprachen L werden, //1//, S. 14 folgend, Institutionen verstanden, mit deren Hilfe, dem gegenwärtigen Stand entsprechend natürliche, Personen miteinander kommunizieren und unter Verwendung gewohnheitsmäßig benutzter Symbole in Interaktion treten, wofür gemäß //2//, S. 235 endliche oder gegebenenfalls auch unbegrenzte Mengen von Symbolkomplexen eingesetzt werden, die über einem endlichen Vokabular von Symbolen gebildet werden. Im Einklang mit dieser Definition umfassen solche Interaktionen gegebenenfalls auch mehrsprachig zu führende Kommunikationsaktivitäten, wie sie von Menschen allgemein beim Austausch von Informationen über Sachverhalte ausgeübt werden und beispielsweise beim Gespräch oder Schriftwechsel etwa bei der Erteilung und Entgegennahme von Aufträgen, beim Stellen und Beantworten von Fragen, beim Übersetzen, Dolmetschen, Stenotypieren oder auch Korrigieren von Äußerungen anfallen. Diesen vielfältigen Aktivitäten ist das Merkmal gemeinsam, daß ihre Durchführung einheitlich sowohl eine Beherrschung der Fähigkeit zum Erzeugen verständlicher, ausreichend korrekt und eindeutig formulierter Sprachtexte wie auch zum Verstehen gegebenenfalls auch in zusammenhängender oder auch nicht normgerechter Form vorgebrachter Äußerungen umfaßt, welche gemäß //3//, S. 156 ohne die genannte Beherrschung des Erzeugens von Sprachtexten nicht bewältigbar ist. Dem gegenwärtigen Stand entsprechend lassen die zitierten Sprachdefinitionen im einzelnen jedoch offen, welche Art von Symbolen einzusetzen ist, welche Regeln bei deren gewohnheitsmäßiger Benutzung und Zusammenfügung zu Komplexen insgesamt einzuhalten sind, und welcher Zusammenhang zwischen solchen Komplexen und den Interaktionen der Kommunikationspartner anzusetzen ist.
Für das erfindungsgemäße Verfahren werden als Symbole allgemein als Gs bezeichnete Begriffe mit Eigenschaften H(Gs) eingesetzt, welche, häufig mit Wahrscheinlichkeiten p unterhalb eins, weitere Begriffe A wie auch weitere Symbole Gs anzeigen und somit symbolisieren. Bestimmte Symbole Gs werden durch jeweils eine disjunkte Klasse von, entsprechend alternativ vorkommenden, Komplexen Kp von Sprachsignalen T mit Eigenschaften H(T) angezeigt oder auch als bestimmte klassen- oder auch komplexbildende Superierungen weiterer Symbole Gs gebildet. Entsprechend ihren Eigenschaften H(Gs) werden für die Symbole Gs auch weitere Bezeichnungen wie Gr, Gt, G, Vt und Z usw. verwendet. Die genannten, zur Anzeige von Symbolen Gs in den verfügbaren Medien beispielsweise akustisch, optisch, geometrisch oder elektronisch erzeugten Signale //12// werden unabhängig von ihrem Umfang und somit abweichend von //12// als Texte T, also nicht als Symbole, bezeichnet. In dieser Beschreibung angeführte Beispiele von Texten T werden durch Zeichenfolgen, insbesondere auch Buchstabenfolgen, repräsentiert beziehungsweise angenähert, die zwischen einfache Schrägstriche gesetzt werden; auf Lautschrift-Alphabete und weitere Notationen wird zur Vereinfachung verzichtet. Bestimmte Eigenschaften von Symbolen Gs wie auch von Symbolkomplexen Kp = GsGs gelten als ihre Inhalte oder Bedeutungen. Die als Erzeuger und Absender sowie als Empfänger und Verarbeiter von Texten T ein- oder auch mehrsprachig miteinander kommunizierenden Personen oder erfindungsgemäß in diesen Rollen eingesetzten Vorrichtungen werden auch als Kommunikationspartner oder kurz Partner Pa bezeichnet, die Erzeuger auch als Autoren At, die Empfänger auch als Hörer Hr und die Verwender solcher Vorrichtungen auch als Nutzer, wobei gegebenenfalls auch Autoren At oder Hörer Hr, welche Kommunikationsinhalte in Aktionen umsetzen, als Nutzer fungieren. Ein in sich abgeschlossener, gegebenenfalls auch mehrere sprachübliche Sätze umfassender Text T eines Autors At wird als Äußerung Tp bezeichnet, ein aus einer oder mehreren Äußerungen Tp eines oder mehrerer Partner Pa zusammengesetzter Kommunikationsvorgang auch als Kommunikationsakt. Wie in //3//, S. 243 vorgeschlagen, werden die mündliche und schriftliche Version einer jeweils in einer Sprachgemeinschaft X benutzten Sprache im Regelfall als unterschiedliche natürliche Sprachen L behandelt. Eindeutige Übertragungen eines Textes T = T1 einer Sprache L in andere Medien, beispielsweise eines akustisch nachzuweisenden Textes T1 aus der mündlichen deutschen Sprache in einen elektronisch kodierten Text T2 dieser Sprache, mit entsprechend eindeutigen Zuordnungen von Textmerkmalen H(T1) zu Merkmalen H(T2), werden im Regelfall als gleiche Texte T1 = T2 behandelt.
Entsprechend den Sprachfähigkeiten von Menschen ist die erfindungsgemäße Kommunikation ein- oder auch mehrsprachig zu leisten und schließt somit die Übersetzung von Texten T in andere Sprachen L, definitionsgemäß also beispielsweise auch vom Mündlichen ins Schriftliche, mit ein. Wie beim menschlichen Sprachgebrauch ist für ein solches Kommunikationsverfahren die Beherrschung einer Reihe von Funktionen zu fordern, zu welchen neben der genannten Bestimmung von Inhalten einlaufender, gegebenenfalls auch in zusammenhängender oder auch fehlerbehafteter Form geäußerter Texte T auch die inhaltsgerechte Abfassung und gegebenenfalls Korrektur von ausreichend verständlich zu haltenden Texten T gehört. Daß von einem erfindungsgemäßen Verfahren sowohl die Fähigkeit zur Erzeugung verständlicher Texte T als auch zur Bestimmung von Bedeutungen von Texten T zu leisten ist, folgt auch aus der oben zitierten Einsicht, daß Hörer Hr ihrer Aufgabe des Verstehens von Inhalten von Texten T nur dann nachzukommen vermögen, wenn sie dabei auf das für die Erzeugung dieser Texte verwendete Regelwerk zurückgreifen können, während umgekehrt Autoren At die Verständlichkeit ihrer Texte, auch unter Vermeidung irreführender Mehrdeutigkeiten, nur sichern können, wenn sie die Vorgehensweise der Hörer Hr beim Verstehen der Inhalte berücksichtigen, ihnen diese also auch bekannt ist.
Wie in //3//, S. 410f. und S. 445 traditionsgemäß, jedoch ohne weiterführende Definitionen vorgeschlagen, werden Inhalte von Texten T auf unten näher spezifizierte Art unterschieden in grammatische und semantische Inhalte, beide auch Bedeutungen genannt. Zu ihrer Darstellung werden auch Begriffe mit von //12// abweichenden Definitionen verwendet. Ein Text T, der, auch wenn er als Äußerung Tp für sich allein steht, bezüglich eines ihm zugeordneten semantischen Inhalts von Experten, definiert als Kenner der betreffenden Sprachen L und der darin angesprochenen semantischen Inhalte, als zulässig beurteilt wird, wird als korrekter Text T = Tf bezeichnet. Abweichend von //12// werden Sachverhalte unabhängig davon, ob sie durch Texte T angesprochen werden oder nicht, als pragmatisch bezeichnet; entsprechend werden durch Texte T angesprochene semantische Inhalte allgemein auf pragmatische Sachverhalte, kurz auch Sachen genannt, bezogen. In Anlehnung an //2//, S. 219 werden bestimmte Bezüge zwischen Texten oder auch bestimmten Textteilen T oder grammatischen Inhalten wie auch Teilen hiervon als grammatisch, Bezüge zwischen Textteilen T, auch unter Berücksichtigung ihrer grammatischen Inhalte, und pragmatischen Sachverhalten als semantisch, zwischen pragmatischen Sachverhalten, wie sie gegebenenfalls auch durch bestimmte Vorstellungen der Kommunikationspartner Pa mitgeprägt sein können, als pragmatisch, und zwischen bestimmten Textteilen T als syntaktisch bezeichnet. Eine unter Beachtung grammatischer Inhalte von Texten T geführte Kommunikation wird grammatikbezogen oder grammatisch und eine gemäß einem Verfahren der erfindungsgemäßen Art unter zusätzlicher, gegebenenfalls auch alleiniger Beachtung pragmatischer Sachverhalte geführte Kommunikation auch pragmatik- oder semantikbezogen, kurz auch semantisch genannt. Entsprechend wird unter einer erfindungsgemäß auf semantische Inhalte bezogenen Kommunikation in natürlichen Sprachen L allgemein eine der Übermittlung vor allem auch pragmatischer Sachverhalte dienende Sprachkommunikation verstanden. Bei dieser Definition wird berücksichtigt, daß durch einen, einem Text T zugeordneten, semantischen Inhalt je nach Situation auch unterschiedliche, nachfolgend auch als Wk bezeichnete, pragmatische Sachverhalte angezeigt werden können, wobei eine solche, im folgenden unter dem Begriff Kontext zusammengefaßte, Situation beispielsweise durch objektiv vorliegende Tatbestände, aber auch durch angrenzenden Texten T zuzuordnende Inhalte wie auch durch subjektive Vorstellungen der Partner Pa usw. mitbestimmt sein kann. Allgemein schließen die Sachverhalte Wk auch objektive, im Regelfall eindeutige, Tatbestände ein, die einer weiteren sachlichen Verendung zuführbar sind, welche beispielsweise auch eine Kombination mit weiteren Tatbeständen, etwa zur Auslösung, Abänderung, Beendigung oder Kontrolle bestimmter Vorgänge, vorsieht.
Zur Abgrenzung von den erfindungsgemäß zu benutzenden Begriffen werden die für Schriftsprachen L intuitiv, vielfach auch willkürlich als Wörter festgelegte, durch Abstände von weiteren solchen Wörtern gekennzeichnete, Begriffe, wie sie auch für die Beschreibung mündlicher Sprachen L übernommen wurden, streng als natürliche Wörter oder auch Schriftwörter bezeichnet, entsprechend der Aufführung bestimmter Flexionsformen hiervon in Lexika auch als lexikalische Wörter. Entsprechend werden weitere in Sprachbeschreibungen benutzter Einheiten wie Sätze, Fragen, Befehle, Ausrufe wie auch zu deren Aufbau benutzte Einheiten wie Zeichen, Buchstaben, Interpunktionen, Silben, Laute usw. natürliche Sätze usw., natürliche Zeichen usw. genannt, wobei Regeln der Schreibweise beziehungsweise der unter Prosodie //12// zusammengefaßten Aussprache zu beachten sind. Wie unten ausgeführt, unterscheiden sich die erfindungsgemäß zu verwendenden Symbole Gs im Regelfall von den gebräuchlichen, hier auch unter der Bezeichnung natürliche Symbole zusammengefaßten, natürlichen Wörtern, Zeichen usw.
Sprachen L, deren Texten T eindimensional aneinandergereihte Symbole einer festgelegten Art wie Wörter oder Zeichen oder Ideogramme usw. zuzuordnen sind, werden als seriell bezeichnet. Wo nicht anders angegeben, erfolgt die Erfindungsbeschreibung ohne Einschränkung der Allgemeingültigkeit am Beispiel solcher serieller Sprachen L; eine Anwendung auch auf mehrdimensional, beispielsweise zweidimensional-bildhaft angeordnete Symbolkomplexe ist grundsätzlich ebenfalls vorgesehen. Beispielsweise werden mündliche oder handschriftliche Texte T auch durch bestimmte Merkmale H(T) wie auch zugleich anfallende Repertoires R(H(T)) hiervon, welche auch als entsprechend mehrdimensionale Merkmalsvektoren bezeichnet werden, charakterisiert.
Bestimmte Kombinationen von Texten T und Inhalten A werden allgemein als Nachrichten TA bezeichnet. Die Kombination eines Textes mit einem grammatischen Inhalt A = B wird entsprechend als grammatische Nachricht TB notiert, die Kombination mit einem semantischen Inhalt C als semantische Nachricht TC. Die in natürlichen Sprachen L üblicherweise anzutreffenden Kombinationen von semantischen Inhalten C mit jeweils einer grammatische Nachricht TB werden ebenfalls semantische Nachrichten genannt, notiert als TBC, kurz auch ebenfalls als TC. Erfindungsgemäß ist vorgesehen, semantische Inhalte C und pragmatische Sachverhalte Wk als Kombinationen weiterer pragmatischer Begriffe K mit Eigenschaften H(K) zu beschreiben, welche nachfolgend als Sachbegriffe K, kurz ebenfalls als Sachen K bezeichnet werden.
Verfahren der erfindungsgemäßen Art sind auch dadurch näher gekennzeichnet, daß sie nach //2//, S. 217f. als Voraussetzung für die Realisierung technischer Vorrichtungen für eine Mensch-Maschine-Kommunikation in natürlichen Sprachen L anzusehen sind, wie sie unter Funktions- und Gerätebezeichnungen wie automatische Übersetzung, akustisches Verstehen von Sprache oder auch hörende Schreibmaschine, elektronische Auskunftei und allgemein intelligente Maschinen und sprachkundige Roboter diskutiert wurden.
Wie auch den in //2// und //4// gegebenen Schilderungen des gegenwärtigen Standes von für den technischen Einsatz konzipierten Kommunikationsanlagen zu entnehmen ist, liegen brauchbare Realisierungen der dazu benötigten Funktionen und Vorrichtungen und entsprechend vorauszusetzenden Verfahren der erfindungsgemäßen Art bisher nicht vor. Ungelöste Fragen werden insbesondere einigen unter Mehrdeutigkeit, Vagheit und Kontextabhängigkeit zusammenfaßbaren Problemkreisen natürlicher Sprachen //12// zugeordnet. Beispielsweise wird ein als Symbol verstandenes lexikalisches Wort insbesondere bei mündlichem oder handschriftlichem Vortrag häufig durch eine große Vielfalt von Sprachsignalen, also Texten T, repräsentiert, so daß umgekehrt einer etwa durch die Buchstabenfolge /tas/ angenäherten Lautfolge T verschiedene schriftdeutsche Wörter wie /das/ oder /daß/ oder auch Teile von Wörtern wie /Tasse/ oder /Taste/ usw. zuordenbar werden. Des weiteren symbolisiert, abhängig von einem durch weitere Wörter einer Äußerung oder auch eine Situation bestimmten Kontext, ein identifiziertes Schriftwort häufig auch unterschiedliche grammatische wie auch semantische Inhalte; letzteres auch dann, wenn dafür eine eindeutige grammatische Funktion identifiziert wurde. So kann das englische Wort /like/ als Verb oder Konjunktion mit entsprechend unterschiedlichen semantischen Inhalten fungieren, das grammatisch eindeutig beispielsweise als Substantiv Nominativ Singular identifizierte schriftdeutsche Wort /Ton/ semantisch ein Mineral, einen Musikeindruck oder, wie im Text /Ton läuft./, eine Mikrophonanlage symbolisieren, wobei, wie oben definiert, ein gegebenenfalls zu beachtender Kontext nicht nur durch die weiteren natürlichen Wörter der betreffenden Äußerung Tp, sondern auch durch den Inhalt vorangegangener oder auch nachfolgender Äußerungen, die Vorstellungen der Kommunikationspartner Pa, ihre Situationen usw. mitbestimmt sein kann. So könnte ein Autor At mit dem Schriftwort /groß/ einen oft nur vage festgelegten räumlichen Ausdehnungsbereich, einen durch besondere Leistungen hervorgetretenen Angehörigen einer Berufsgruppe oder je nach Situation ironisch auch das Gegenteil hiervon ansprechen. Mißverständnisse können so auch daraus resultieren, daß die Partner Pa bei der Formulierung und Interpretation von Texten T von unterschiedlichen Kontexten ausgehen, wobei Menschen auf eine allerdings nicht näher spezifizierte Weise häufig intuitiv richtig zu entscheiden vermögen, welche Kontextualisierung //12// bei einer Äußerung Tp zweckmäßig vorgenommen werden sollte. Von den Partnern Pa wird hierbei verlangt, einen Kommunikationsinhalt aus einer definitionsgemäß unbegrenzten Vielfalt von Symbolkomplexen sowie zusätzlich auch von Kontexten zu erschließen.
Bei Schrifttexten T werden dabei auch den für die Zeichensetzung //12// benutzten nichtalphabetischen Interpunktionszeichen sowohl grammatische als auch semantische Funktionen, also Inhalte, zugeordnet, ohne daß klargestellt wurde, ob diese Zeichen als den lexikalischen Wörtern gleichgestellte Symbole oder als, diesen zuzuordnende, Teile hiervon zu behandeln seien, welche Inhalte ihnen zukommen und wie diese mit weiteren Inhalten zu kombinieren wären. Angesichts der angetroffenen Vielfalt und Vieldeutigkeit der in bisherigen Sprachbeschreibungen berücksichtigten Begriffe blieb unklar, durch welche Art von Symbolen und Begriffen die Bedeutungen //12// von Texten T wie auch von Kontexten zweckmäßig auszudrücken, welche Eigenschaften solchen Symbolen zuzuordnen, nach welchen Regeln vorliegende Texte und Textabschnitte T mit ihnen in Bezug zu setzen und auf sie aufzuteilen seien und auf welche Weise man die Bedeutungen von Symbolkomplexen aus den Bedeutungsmöglichkeiten der Einzelsymbole kombinieren und den Einfluß weiterer Kontextdaten dabei berücksichtigen könnte. Angesichts dieser Problemvielfalt hat gemäß //3//, S. 411 niemand auch nur in Umrissen eine befriedigende und umfassende Semantiktheorie angeboten. Dabei blieb offen, aus welchen Grundbausteinen, mit welchen Wechselbeziehungen, ein Verfahren der erfindungsgemäßen Art überhaupt aufgebaut werden könnte.
Zwar ist bekannt, daß Menschen nach ihrem gemäß //1//, S. 227f intuitiv ablaufenden Erstsprachenerwerb in der Regel zu einer, ebenfalls intuitiv ablaufenden, Beherrschung der angeführten und weiterer in Sprachen L anzutreffender Einzelprobleme fähig sind, doch können sie gemäß //1//, S. 16 u. S. 47f. weder angeben, wie ihr Spracherwerb stattfindet noch welche Daten, Begriffe und Regeln sie sich dabei aneignen und bei der Kommunikation einsetzen, so daß auch eine Realisierung eines Verfahrens der erfindungsgemäßen Art durch die wünschenswerte Übertragung menschlicher Fähigkeiten auf die Arbeitsprinzipien von Maschinen, wie sie etwa für mathematische Problemlösungen demonstriert wurde, bei Sprachproblemen bisher nicht möglich war.
Wie auch in //1//, S. 128f. betont, konnte insbesondere auch die Frage nach der Bedeutung von Sprache bisher nicht zufriedenstellend beantwortet werden, wobei sogar bezweifelt wird, ob Sprache eine Brücke zwischen Laut und Bedeutung schlage und Bedeutung überhaupt durch Begriffe beschreibbar sei. Auch vorgeschlagene formale, nach den Prinzipien der Logik entwickelte Semantiktheorien, welche Kriterien wie den "Wahrheitswert" //12// von Sätzen berücksichtigen, werden nach //1//, S. 164 für unbrauchbar erachtet. So scheint nach //2//, S. 239 das erwähnte Problem der Mehrdeutigkeiten eine so hohe Differenzierung der einzusetzenden Symbole zu fordern, daß eine rechnerisch beherrschbare Bearbeitung für nicht mehr möglich gehalten wird. Hierbei stellt sich im einzelnen das Problem von mit der Zahl der Symbole exponentiell anwachsenden kombinatorischen Explosionen der zu berücksichtigen Daten, wie sie sowohl bei der Beschreibung der Symbole einschließlich ihrer vielfältigen wechselseitigen Bezugsmöglichkeiten wie auch der in entsprechender Vielfalt abzuarbeitenden Entscheidungsbäume für ihre Zuordnung zu gegebenen Texten T und zueinander anfallen. Des weiteren erscheint der nach //3//, S. 413 als "Bezug" bezeichnete Zusammenhang zwischen Textformen T und hierdurch bezeichneten, auch "Relata" genannten, Gegenständen oder Inhalten für eine rechnergestützte Behandlung nicht konkret genug formuliert. Aus den in //1//, S. 219 geäußerten Zweifeln an der Verwendbarkeit von Begriffen läßt sich auch folgern, daß die gemäß //3//, S. 411 festzustellende Unbrauchbarkeit angebotener Semantiksysteme auch daran liegt, daß bisher nicht geklärt wurde, aus welchen Komponenten mit welchen Eigenschaften, und auf welche Art, die durch Texte T wie auch durch die zu berücksichtigenden Kontextsituationen angesprochenen semantischen Inhalte wie auch die damit zu verbindenden pragmatischen Sachverhalte zusammensetzbar sein könnten. So war es nach //12// oder auch //3//, S. 138 bisher auch nicht möglich, eine als Voraussetzung für Verfahren der erfindungsgemäßen Art zu klärende methodologische Abgrenzung zwischen Inhalten grammatischer und semantischer Art mit den jeweils entsprechend zuzuordnenden Symbolen anzugeben. Geht man nach //3//, S. 170f. davon aus, daß den, allerdings nur für Schriftsprachen festgelegten, lexikalischen Wörtern die Rolle der genannten gewohnheitsmäßig benutzten Symbole zuzuschreiben sei, so fehlen gemäß //2//, S. 227 bisher Kriterien, nach denen sie befriedigend klassifiziert werden können. Beispielsweise halten auch weitere, rein formal zu verstehende Kriterien wie "Wohlgeformtheit" oder "Formalität" nach //1//, S. 47 der Kritik nicht stand. Auch wurden für die als bedeutsam erachteten hierarchischen Beziehungen oder Dependenzen //12// zwischen vorgeschlagenen Kategorien natürlicher Wörter nach //2//, S. 233 und S. 238 widersprüchliche Vorstellungen entwickelt. So erwiesen sich herkömmliche Sprachbegriffe wie beispielsweise Verb, Tempus, Person, Prädikat usw. wie auch zusätzlich vorgeschlagene Konstituenten wie Verbalphrase, Nominalphrase usw. //12// für die Entwicklung von Kommunikationsverfahren und -systemen als nicht ausreichend streng definiert, wobei beispielsweise auch die Verwendung diskontinuierlicher, also in Texten T durch Textabschnitte T anderer Symbole unterbrochener Symbole für unzulässig erklärt wurde //12//. Vorgeschlagene, auch als kontextfrei //12// bezeichnete Phrasenstruktur- Grammatiksysteme //12// ließen es auch nicht zu, den Einfluß von beispielsweise durch vorangegangene Äußerungen Tp gegebenen Kontexten bei der Bedeutungsanalyse von Texten T ausreichend zu berücksichtigen //13//.
Als besonders schwierig erwies sich nach //12// allgemein die Grenzziehung zwischen der semantischen, als "kontextinvariant" verstandenen Bedeutung einer sprachlichen Äußerung und dem hierdurch im jeweiligen Einzelfall gemeinten, häufig für eine eindeutige weitere Verwendung vorgesehenen pragmatischen Sachverhalt, da dieser nämlich meist von der jeweils spezifischen, oben unter Kontext zusammengefaßten Verwendungssituation abhängt. Ohne eine solche Grenzziehung ist jedoch die sprachliche Übermittlung von, auf die jeweilige Situation bezogenen, pragmatisch eindeutigen Sachverhalten Wk, die einer weiteren sachlichen Verwendung zugeführt werden können, nicht möglich.
Für versuchsweise als Sprachsymbole benutzte Begriffe konnte, auch wegen der angeführten Probleme und Defizite, des weiteren auch kein ausreichender Zusammenhang angegeben werden zwischen der Frage, welche Information Texte T bezüglich durch sie gegebenenfalls angezeigter Inhalte grammatischer und semantischer Art liefern und der Informationstheorie, wie sie beispielsweise in //5//, S. 87f. ansatzweise formuliert wurde. So wird nach heutigem Sprachgebrauch unter Information häufig der übermittelte Sachverhalt selbst und nicht eine bestimmte quantitative Eigenschaft einer solchen Übermittlung verstanden. Beispielsweise wurde etwa in //6// bestritten, daß eine natürliche Sprache überhaupt Information übermittle; sie rufe vielmehr nur eine - nicht näher spezifizierte - Interaktion zwischen dem Gesagten und dem Hörer hervor. Weiterhin wurde an bisher vorgeschlagenen Symbolen einerseits kritisiert, daß sie sich nicht auf empirisch erfaßbare Merkmale zurückführen lassen //7//, S. 559, während andererseits ihre Autoren sich nach //1//, S. 16 nicht als Empiristen verstehen wollen und die Notwendigkeit einer solchen Beobachtbarkeit sogar bestreiten //8//, S. 124. Da jedoch grundsätzlich davon auszugehen ist, daß technische Verfahren ganz allgemein konkret beobachtbare Ergebnisse zu liefern haben, welche aus dem Zusammenwirken von Gegenständen resultieren, deren Eigenschaften ebenfalls prinzipiell mit einer in der Technik üblichen Genauigkeit und Widerspruchsfreiheit der Beobachtung zugänglich sein müssen, ist entsprechend auch für Verfahren der erfindungsgemäßen Art neben der grundsätzlich gegebenen Beobachtbarkeit erzeugter Texte T auch eine solche für die dadurch übermittelten Symbole und hieraus zusammengesetzten Inhalte, gegebenenfalls auch für dadurch ausgelöste Aktionen, zu fordern. Geht man ferner davon aus, daß solche Verfahren neben der Übertragung von Texten T auch der Übermittlung von Information über solche Symbole und Inhalte zu dienen haben, so können bisher vorgeschlagene Methoden mit Defiziten auf den Gebieten Beobachtbarkeit und Informationszuordnung grundsätzlich nicht als Lösungswege geeignet sein.
In Anbetracht der angetroffenen Probleme bei der Festlegung von zur Beschreibung von Texten T geeigneten Sprachbegriffen und -kategorien, welche auch in der Unbrauchbarkeit von nach solchen Prinzipien versuchsweise entwickelten technischen Vorrichtungen ihren Niederschlag fanden //4//, //9//, wurden unter bewußt in Kauf genommenem Verzicht auf ein "Verstehen" von Bedeutungen auch rein statistische Sprachmodelle eingesetzt, welche auf den für Schriftsprachen festgelegten lexikalischen Wörtern und den als "hidden Markov-probabilities" bezeichneten, durch jeweils vorangehende Wörter bedingten Häufigkeiten ihrer Aufeinanderfolge beruhen, wobei bis zu 3 jeweils aufeinanderfolgende Wörter, auch Trigramme genannt, berücksichtigt werden konnten //10//. Einer Erweiterung dieser Zahl steht das genannte Problem der kombinatorischen Explosion der zu beachtenden Daten entgegen, da beispielsweise bei einem Repertoire von 20.000 Wörtern bereits mehr als eine Billion Trigramme vorkommen können //10//. Dabei ist aber bei Wortfolgen wie /Was er gestern gesagt hat, stimmt./ für das Vorkommen des letzten Wortes erst dann eine verwertbare, vom Durchschnitt für beliebige Wörter abweichende Häufigkeit zu erwarten, wenn auch das 5. vorausgehende Wort mit eingeschlossen wird, so daß auch Hexagramme und je nach Text T auch noch weit umfangreichere Komplexe zu berücksichtigen wären. Auf solchen verfügbaren Sprachmodellen beruhende Verfahren sind so auch bei der notwendigen Beschränkung auf wenige 1.000 Wörter je nach angestrebter Funktion noch mit unbefriedigenden Fehlerraten von ca. 15% bis 30% behaftet //11//.
Entsprechend den geschilderten, für den gegenwärtigen Stand charakteristischen ungelösten Problemen befassen sich bekannt gewordene Erfindungen mit einigen untergeordneten Teilaspekten von natürlichsprachlichen Kommunikationsprozessen. So beziehen sich die unter DE 30 42 408 C2, DE 31 42 540 C2, DE 35 03 233 C2, DE 36 15 972 A1, DE 36 16 011 A1, DE 30 32 664 C2 und DE 31 51 106 A1 angegebenen Verfahren beziehungsweise Vorrichtungen auf Fragestellungen elektronisch bedienbarer Lexika, die einem als Übersetzer tätigen Menschen zu gegebenen, von ihm bereits vom restlichen vorliegenden Text T abgeteilten und korrekt auch bezüglich zuzuordnenden grammatischer Kategorien identifizierten natürlichen Wörtern beziehungsweise Phonemen einer Ausgangssprache L einige Wörter beziehungsweise Phoneme einer Zielsprache L' anbieten, jedoch weiter die Intelligenz und das Sprachwissen von Menschen voraussetzen, um aus einem fortlaufenden Fluß akustischer beziehungsweise schriftlicher Textsignale überhaupt die Wörter oder auch Phoneme beziehungsweise Morpheme der Ausgangssprache L zu identifizieren und das Problem der vom jeweiligen Textzusammenhang abhängigen Mehrdeutigkeit zu lösen. Ein in DE 41 35 261 C1 vorgelegtes "Übersetzungssystem" dient der Reduzierung der Datenmenge, die für die lexikalische Zuordnung von fremdsprachlichen Wörtern zu identifizierten zusammengesetzten Wörtern, also Komposita, der Ausgangssprache benötigt wird. In dem in DE 43 11 211 A1 für Übersetzungsarbeiten vorgeschlagenen Textanalysesystem soll speziell auch berücksichtigt werden, daß deutschen Verben verschiedene, entsprechend unterschiedlich zu übersetzende Formen von Dativobjekten zuordenbar sind. DE 42 32 482 A1 schlägt vor, Übersetzungen unter Zwischenschaltung einer künstlichen Standardsprache durchzuführen, ohne Lösungen für das Problem von Mehrdeutigkeiten in den Ausgangs- und Zielsprachen anzugeben. Verfahren zu der dort als "Spracherkennung" bezeichneten Aufgabe, wie sie in DE 32 11 313 C2, DE 37 33 391 C2 und DE 35 14 286 A1 beschrieben werden, bieten ebenfalls keine brauchbare Antwort auf die Frage an, welche der alternativ möglichen Zuordnungen von natürlichen Wörtern sowie Inhalten grammatischer oder auch semantischer Art je nach Textzusammenhang zu bevorzugen und welche pragmatischen Sachverhalte damit je nach Situation zu verknüpfen sind.
Der Erfindung liegt die Aufgabe zugrunde, ein Verfahren der eingangs genannten Art für eine gemäß vorliegenden Vorgaben in einer oder auch mehreren natürlichen Sprachen, also auch mehrsprachig, zu führende Kommunikation anzugeben, welche mit, in den hierfür vorgesehenen Medien abzufassenden beziehungsweise aufzunehmenden, Texten durchgeführt wird, die so mit semantischen Inhalten in Bezug gesetzt werden, daß damit eine Übermittlung pragmatischer, also auch für weitere sachliche Verwendungen geeigneter, Sachverhalte, auch unter Berücksichtigung des jeweiligen Kontextes, einschließlich einer solche Sachverhalte erhaltenden Übertragung in Texte weiterer natürlicher Sprachen, auch vom Mündlichen ins Schriftliche und umgekehrt, möglich wird, wobei in solchen Fällen, wo vorgegebene Daten oder auch ungenau oder fehlerhaft abgefaßte Texte keine ausreichend sicheren und eindeutigen Text-Inhalts-Zuordnungen zulassen, entsprechende Kennzeichnungen wie gegebenenfalls auch Text- beziehungsweise auch Inhaltskorrekturen möglich werden, und eine Einrichtung zur rechnergestützten Durchführung des Verfahrens zu beschreiben, so daß beim gegenwärtigen Stand angetroffene Probleme lösbar und maschinelle Vorrichtungen möglich werden, welche bisher bei der natürlichsprachigen Kommunikation von Menschen wahrgenommene Funktionen der angeführten Art übernehmen und somit eine solche Kommunikation zwischen Mensch und Maschine sowie zwischen Maschinen möglich machen.
Diese Aufgabe wird durch die in Anspruch 1 aufgezeigten, in Unteransprüchen weiter ausgeführten Maßnahmen, in einer Ausgestaltung auch unter Einsatz der in Anspruch 25 beschriebenen Einrichtung, im Rahmen eines als Mp bezeichneten Verfahrens gelöst. Verfahren Mp sieht vor, die Kommunikation in natürlichen Sprachen L zwischen Kommunikationspartnern Pa unter Beachtung vorliegender, von Nutzern des Verfahrens, gegebenenfalls auch Partnern Pa eingebrachter, Vorgaben Vr unter Bezug auf semantische Inhalte F durchzuführen, durch welche als Komplexe Kp = KK von Sachbegriffen K gebildete pragmatische Sachverhalte Wk übermittelt werden. Diese Kommunikation wird mittels, von Autoren At aus Sprachsignalen der für die betreffenden natürlichen Sprachen L vorgesehenen Medien zu bildenden und auszugebenden und von deren Empfängern Hr auszuwertenden, Texten T durchgeführt, welche durch Zuordnung grammatischer Inhalte N unter Beachtung der Wahrscheinlichkeiten p(TN) zu grammatischen Nachrichten TN ergänzt werden, welche weiterhin durch Zuordnung semantischer Inhalte F unter Beachtung der Wahrscheinlichkeiten p(TNF) zu semantischen Nachrichten TNF ergänzt werden, wobei zu übermittelnde pragmatische Sachverhalte Wk = Wk2 durch Abänderung von, von den Kommunikationspartnern Pa vorausgesetzten, pragmatischen Sachverhalten Wk = Wk1 gemäß den semantischen Inhalten F dieser semantischen Nachrichten TNF erzeugt werden. Diese semantischen Nachrichten (TNF) werden als Komplexe Kp = EmEm unter Beachtung der, gegebenenfalls durch vorliegende Daten D wie auch weitere Komponenten Em bedingten, Wahrscheinlichkeiten p(Em) aus Komponenten Em zusammengefügt, welche durch Daten Wp beschriebene Sachbegriffe K und, in Anpassung an die natürlichen Sprachen L festgelegte, Symbole Gs einschließen. Diese umfassen jeweils zu einer disjunkten Klasse K1 = Vt von Textabschnitten T = Ts superierte Textsymbole Vt = (Ts), deren Texte Ts jeweils bezüglich bestimmter, durch Toleranzen dH näher definierter Texteigenschaften H(T) übereinstimmen, sowie hieraus zu disjunkten Klassen K1 = Gr superierte grammatische Symbole Gr = (Vt), die jeweils ein Repertoire R(Pr) von, durch Wahrscheinlichkeiten p näher bestimmten, Möglichkeiten der ihnen in grammatischen Nachrichten TN zuzuweisenden Anordnungen Pr vorgeben, welche ihnen und den ihnen jeweils zugeordneten Textsymbolen Vt a Gr einen Rang Ra und eine oder mehrere Positionen P zuweisen, welche die diesen Textsymbolen Vt zugeordneten Textabschnitte Ts a Vt in Texten T einnehmen. Diesen Textsymbolen Gt ist jeweils eine disjunkte Klasse K1 = (Fp) von, die Möglichkeiten ihrer Anordnungen Pr berücksichtigenden, semantischen Hinweisen Fp zugeordnet, die jeweils einen Sachbegriff K und ein Repertoire R(K1) von disjunkten Klassen K1 = (q) von Verwendungshinweisen q für dessen unter Beachtung der Anordnung Pr vorzunehmende Zuordnung zu semantischen Inhalten F von semantischen Nachrichten TNF einschließlich seiner Verknüpfung mit Sachbegriffen K weiterer in der betreffenden semantischen Nachricht vorliegender Textsymbole Vt sowie mit Sachbegriffen K eines jeweils vorausgesetzten pragmatischen Sachverhalts Wk1 einschließlich dessen Abänderung zu einem Sachverhalt Wk2 umfassen. Hierbei werden durch solche Texte T zu übermittelnde pragmatische Sachverhalte Wk2 unter Beachtung vorliegender Daten D einschließlich der Vorgaben Vr jeweils dadurch erzeugt, daß ein oder mehrere hierdurch angezeigte grammatische Symbole Gr und eine Permutation von diesen zugeordneten Textsymbolen Vt unter Beachtung der Anordnungen Pr zu einem grammatischen Inhalt N zusammengefügt werden, der durch einen, aus einer Permutation von diesen Symbolen Vt zugeordneten, an durch diese Anordnungen Pr gegebenen Positionen P, gegebenenfalls auch diskontinuierlich, angeordneten, Textabschnitten Ts zusammengefügten Text T zu einer grammatischen Nachricht TNF ergänzt wird, und daß weiterhin die Sachbegriffe K einer Permutation von diesen Textsymbolen Vt zugeordneten semantischen Hinweisen Fp gemäß einer Permutation von diesen Hinweisen Fp zugeordneten Verwendungshinweisen q unter Beachtung der durch einen vorausgesetzten pragmatischen Sachverhalt Wk1 gegebenen Wahrscheinlichkeiten p(K)1 wie auch weiterer, in den Daten Wp vorliegender, Wahrscheinlichkeiten p(Em) ein, als Komplex Kp = KK dieser Sachbegriffe K mit Wahrscheinlichkeiten p(K)2 zusammengefügter semantischer Inhalt F gebildet wird, durch den diese grammatische Nachricht TN unter Beachtung der Wahrscheinlichkeit p(TNF) zu einer semantischen Nachricht TNF ergänzt wird und der vorausgesetzte pragmatische Sachverhalt Wk1 in den zu übermittelnden pragmatischen Sachverhalt Wk2 abgeändert wird, welcher als aus der, bis dahin geführten, Kommunikation resultierender Sachverhalt Wk2 einer den Vorgaben Vr entsprechenden weiteren Verendung zuzuführen ist.
Verfahren Mp sieht vor, Sachbegriffe K zu verwenden, die jeweils als eine, auch als Repertoire R(A) bezeichnete, Menge K = R(A) eines oder, im Regelfall, mehrerer weiterer Begriffe A beschreibbar sind. Komplexe Kp = BB von Begriffen B werden allgemein dadurch definiert, daß sie jeweils einen oder, im Regelfall, mehrere Begriffe B enthalten, wobei im letzteren Fall bestimmte Bezüge zwischen mindestens 2, gegebenenfalls aber auch mehreren oder auch sämtlichen dieser Begriffe B a Kp bestehen. Bei den genannten pragmatischen Sachverhalten Wk, die als Komplexe Wk = Kp = KK von Sachbegriffen K gebildet werden, gelten entsprechend ihrer Definition als Mengen K = R(A) zwischen ihnen Bezüge, wie sie allgemein für die Verknüpfungen von Mengen Verwendung finden und unten bei der detaillierten Beschreibung der Verknüpfungshinweise q im einzelnen ausgeführt sind. Wie oben notiert, wird die Zugehörigkeit eines Begriffes A zu einer Menge B und so auch zu einem Repertoire R(A) einer Klasse K1(A) oder einem Komplex Kp(A) allgemein durch A a B, A a R(A), usw. gekennzeichnet. In verschiedenen Ausgestaltungen sieht die Erfindung vor, für die einzusetzenden natürlichen Sprachen L jeweils neben dem genannten Repertoire R(Vt) von Textsymbolen Vt auch weitere Repertoires R(Gt) weiterer Textsymbole Gt zu verwenden, deren Texte T a Gt ebenfalls jeweils durch ein Repertoire R(H(T)) bestimmter Textmerkmale H(T) gekennzeichnet sind. Nachfolgend werden allgemein die Textsymbole Vt, mit Vt a Gt, ebenfalls den als Gt bezeichneten Textsymbolen Gt zugerechnet und auch als solche bezeichnet.
Die Erfindung sieht vor, bei einem Kommunikationsakt die Möglichkeit des Vorliegens einer disjunkten Klasse K1 = (Wk1x) von möglichen pragmatischen Sachverhalten Wk1x = Wk11, Wk12 usw. zuzulassen, von denen gemäß der vorgesehenen Beachtung der Wahrscheinlichkeiten p(TNF) bevorzugt ein Sachverhalt Wk1x = Wk11 vorausgesetzt wird, mit dem sich unter Beachtung der Daten Wp ein semantischer Inhalt F ergibt, der dieser Nachricht TN mit der höchsten, einen Schwellwert ps nicht unterschreitenden Wahrscheinlichkeit p(TNF) zuordenbar ist. Erfindungsgemäß wird hierbei berücksichtigt, daß die Kommunikationspartner entsprechend den Möglichkeiten unterschiedlichen Wissens und unterschiedlicher Meinungen auch von unterschiedlichen Sachverhalten Wk1x ausgehen können. Soweit möglich, wird bei der Kommunikation ein dem Partner Pa zuzuordnenden Sachverhalt Wk1x vorausgesetzt. Die jeweils für die Kommunikation vorausgesetzte Klasse K1 = (Wk1x) von Sachverhalten Wk1x wird dem Kontext des jeweiligen Kommunikationsaktes zugerechnet.
Ein resultierender pragmatischer Sachverhalt Wk2, vereinfachend ausgedrückt auch der von Wk1 abweichende Teil von Wk2 wie auch der dafür verantwortliche semantische Inhalt F, wird auch als Botschaft einer vorliegenden grammatischen Nachricht TN wie auch des ihr zugehörigen Textes T in der betreffenden Kontextsituation bezeichnet. Die Kombination NF von grammatischen und semantischen Inhalten N und F einer Nachricht TNF wird auch als Inhalt NF des betreffenden Textes T bezeichnet.
Zu einem grammatischen Begriff Gr werden in einer bevorzugten Ausbildung solche Textsymbole Vt superiert, für deren, auch durch die unten angeführten Transformationen Qs nachweisbare, Verknüpfbarkeit in Anordnungen Pr beziehungsweise auch Nicht-Verknüpfbarkeit mit weiteren Symbolen Vt in einer semantischen Nachricht TNF, gegebenenfalls auch durch das Vorliegen weiterer Symbole Vt bedingte, Wahrscheinlichkeiten p(Vt) gelten, die innerhalb vorgegebener Toleranzen dp übereinstimmen, wobei in einer bevorzugten Ausbildung die Toleranzen dp den Kapazitäten der verfügbaren Vorrichtungen und den zu leistenden Kommunikationsakten angepaßt werden. Abweichend von bekannten Transformationsgrammatiken //12//, generativen Grammatiken und Semantiken //12// sowie Konstituentenstrukturgrammatiken //12// wie auch Unifikationsgrammatiken //12// einschließlich der darin verwendeten, auch als "Generalized Phrase Structure Grammar" //12// oder auch "Lexical Functional Grammar" //12// bezeichneten Darstellungen funktionaler einschließlich syntaktischer Zusammenhänge in natürlichen Sprachen L werden im erfindungsgemäßen Verfahren Mp entsprechend den Transformationen Qs durch Texte wie auch Textkomplexe T repräsentierte Textsymbole Vt verwendet, die gegebenenfalls auch nur Teile lexikalischer Wörter oder, gegebenenfalls auch diskontinuierlich angeordnete, Komplexe Kp mehrerer lexikalischer Wörter umfassen, welche bei Schriftsprachen L auch Satzzeichen, Abstände wie auch unten definierte Operatoren o zur Modifizierung zugeordneter Textabschnitte T mit einschließen und sich so von den in den zitierten Grammatiken //12// verwendeten Phrasen //12//, wie sie in //12//, S. 816f. oder auch in //1//, S. 116f. diskutiert werden, unterscheiden. Dies hat zur Folge, daß die Symbole Vt zu einer vergleichsweise geringen Anzahl von grammatischen Symbolen Gr zusammenfaßbar werden, wodurch es möglich wird, die Zuordenbarkeit der Symbole Vt zu semantischen Nachrichten TNF mit einer vorteilhaft geringen, den Symbolen Gr zugeordneten Menge von Daten zu beschreiben. Dabei unterscheidet sich auch der unten näher definierte Rang Ra von den für bekannte Dependenzgrammatiken //12// eingeführten, beispielsweise durch Ersatzproben //12// näher bestimmten Abhängigkeitsrelationen zwischen den hierfür wie auch die oben zitierten Grammatiken //12// als Konstituenten von natürlichen Sätzen angenommenen Begriffen.
Die angeführten Abhängigkeiten der erfindungsgemäß zu berücksichtigenden, allgemein als p(A) notierten Wahrscheinlichkeiten bestimmter Größen A von weiteren Größen wie B oder B und C oder B, C und D usw. werden durch bedingte Wahrscheinlichkeiten der Form p(A/B), p(A/B; C), p(A/B; C; D) usw. ausgedrückt. Entsprechend werden die unter Beachtung eines pragmatischen Sachverhalts Wk1 zu berücksichtigenden Wahrscheinlichkeiten p(TNF) semantischer Nachrichten TNF streng auch als p(TNF; Wk1) notiert. Bei der Ergänzung eines gegebenen Textes T zu einer grammatischen Nachricht TN ist dabei neben dem genannten Wert p(TN) auch eine bedingte Wahrscheinlichkeit p(N/T) zu beachten, für deren Ergänzung zu einer semantischen Nachricht TNF neben p(TNF) auch der bedingte Wert p(F/TN), streng auch p(F/TN; Wk1), benötigt wird. Wie unten weiter ausgeführt, sind allgemein bei der Bildung von Größen A aufgrund von mit Sicherheit, also p(D) = 1, vorliegenden Daten D bedingte Wahrscheinlichkeiten p(A/D) zu beachten.
Die bei der Zuordnung semantischer Inhalte F zu Texten T von grammatischen Nachrichten TN vorgesehene Beachtung bedingter Wahrscheinlichkeiten p(F/TN; Wk1) hat vorteilhaft zur Folge, daß für die im jeweiligen Zusammenhang vorzuziehenden, durch Sachbegriffe K mit Wahrscheinlichkeiten p(K) näher bestimmten Bedeutungen von Symbolen Vt sowohl Kontexte berücksichtigt werden, wie sie durch den, durch die grammatische Nachricht TN bestimmten, Textzusammenhang gegeben sind, als auch Kontexte, wie sie durch die, die jeweiligen Situationen wie auch vorangegangene Äußerungen Tp wiedergebenden, Sachverhalte Wk1 beschrieben werden, Aus der vorgesehenen Benutzung quantitativer Wahrscheinlichkeitsdaten p folgt vorteilhaft weiterhin, daß ein als Kommunikationsergebnis zu bevorzugender Sachverhalt Wk2 häufig auch in für natürliche Sprachen L charakteristischen vieldeutigen Kommunikationssituationen zu erzielen ist, die jeweils sowohl durch das Vorliegen eines mehrdeutigen Textes T, dem sowohl disjunkt mehrere grammatische Inhalte N als auch semantische Inhalte F und dementsprechende disjunkte Repertoires R von Nachrichten TN und TNF zuordenbar sind, als auch durch das Vorliegen mehrdeutiger, durch ein disjunktes Repertoire R(Wk1x) von Sachverhalten Wk1x beschriebener Situationen gekennzeichnet sein können.
Abweichend von bisher beispielsweise in //1// und //13// beschriebenen Semantikmodellen wird hierbei das Ergebnis eines Kommunikationsaktes nicht auf einen bereits kontextbezogenen semantischen oder pragmatischen Inhalt einer Äußerung Tp beschränkt, wie er erfindungsgemäß durch den semantischen Inhalt F einer Nachricht TNF eines Textes T gegeben ist; vielmehr wird ein im Regelfall wesentlich umfangreicherer, als Komplex Kp einer wesentlich größeren Anzahl von Sachbegriffen K gebildeter Sachverhalt Wk2 als Kommunikationsergebnis Wk2 eingesetzt, bei dem sich im Regelfall nicht nur die durch Wahrscheinlichkeiten und Wahrscheinlichkeitsbeziehungen p(K1) näher bestimmten Eigenschaften H(K1) der im Inhalt F vertretenen Sachbegriffe K = K1, sondern gegebenenfalls auch die Eigenschaften H(K2) weiterer, mit diesen durch weitere Wahrscheinlichkeitsbeziehungen p(K2) verknüpfter Sachbegriffe K2 von den in Sachverhalt Wk1 vorausgesetzten Eigenschaften H(K1) und H(K2) unterscheiden. Aus der erfindungsgemäß vorgesehenen Verwendung eines solchen entsprechend umfangreichen Kommunikationsergebnisses Wk2 als ein einer gegebenenfalls nachfolgenden Äußerung Tp wiederum vorauszusetzender Sachverhalt Wk1 folgt weiterhin vorteilhaft, daß diese stets in einem Kontext beurteilt wird, in welchem die Botschaften F vorangegangener Äußerungen Tp angemessen berücksichtigt werden.
Wie auch aus den unten angeführten Ausführungsformen und einer der Vielfalt sprachlicher Ausdrucksmöglichkeiten angepaßten Anzahl von Textbeispielen T hervorgeht, wird durch die vorgesehene Verwendung von Sprachsymbolen Vt mit kontextunabhängig formulierten und so auf beliebige Kontexte anwendbaren und diese entsprechend berücksichtigenden Eigenschaften, welche im einzelnen durch bestimmte Zuordnungen jeweils eines, durch ein zugeordnetes grammatisches Symbol Gr gegebenen, Repertoires R(Pr) von Möglichkeiten ihrer grammatischen Anordnungen Pr, eine disjunkte Klasse K1 von Textabschnitten Ts und eine entsprechend semantisch mehrdeutige Klasse K1 von semantischen Hinweisen Fp gekennzeichnet sind, die durch Wahrscheinlichkeiten und Wahrscheinlichkeitsbeziehungen p(K) näher bestimmte Sachbegriffe K wie auch, auch Verknüpfungshinweise oder -parameter genannte, Verwendungshinweise q hierfür umfassen, vorteilhaft auch die folgende bei Kommunikationsakten anfallende Teilaufgabe lösbar: Einem Textabschnitt T = Ts, der, wie bei natürlichen sprachen L üblich, etwa in einer lexikalischen Auflistung für sich allein stehend als semantisch, gegebenenfalls zusätzlich auch als grammatisch, mehrdeutig gilt, läßt sich in einer Äußerung Tp aufgrund der vorgesehenen Berücksichtigung von, gegebenenfalls auch mehreren disjunkt anzunehmenden, Kontexten, wie sie durch weitere, für sich allein ebenfalls semantisch mehrdeutige Textabschnitte T dieser Äußerung Tp sowie durch, gegebenenfalls auch mehrere disjunkte, Sachverhalte Wk1x, welche von anzutreffenden Situationen wie gegebenenfalls auch vorangegangenen Äußerungen Tp abhängen, gegeben sind, ein mit einem quantifizierbaren Maß an Sicherheit, bei Anwendung der unten beschriebenen nichtlinearen Operationen Bb häufig auch eindeutig, identifizierbarer Anteil an einem aus dem betreffenden Kommunikationsakt resultierenden, im Regelfall ebenfalls eindeutig zu bevorzugenden Sachverhalt Wk2 zuordnen, wie es von Menschen aufgrund ihres, weitgehend intuitiven, Umgangs mit den Eigenschaften von Sprachen L und Kontexten erwartet wird. Dabei bietet die erfindungsgemäße Verwendung von Symbolen Vt, die sowohl grammatisch bezüglich ihrer Verknüpfungsmöglichkeiten Pr als auch semantisch bezüglich ihnen zuzuordnenden Sachbegriffe K sowie hierfür geltender Verwendungshinweise q mehrdeutig sind, den Vorteil, daß durch die Kommunikation eine sehr große Vielfalt auch umfangreicher Sachverhalte Wk2 durch ein begrenztes, der Speicher- und Verarbeitungskapazität verfügbarer Vorrichtungen anpaßbares, entsprechend der oben angeführten Sprachdefinition auch als Vokabular zu bezeichnendes, Repertoire R(Vt) von Symbolen Vt ausdrückbar und mittels Texten T mitteilbar wird. Abweichend von der in bisherigen Sprachsystemen den darin verwendeten lexikalischen Wörtern jeweils zugeordneten lexikalischen Bedeutung //12// umfassen die erfindungsgemäßen Symbole Vt neben jeweils einer als Klasse von Elementen //12//, S. 449 einzusetzenden Klasse K1 = (K) von Sachbegriffen K zusätzlich auch jeweils auf diese anzuwendende disjunkte Klassen K1 = (q) von Verwendungshinweisen q.
Zur weiteren Erfindungsbeschreibung wird die folgende, teilweise bereits oben benutzte Symbolik verwendet: Eine beliebige Menge von Größen A wird als Repertoire R(A) bezeichnet, eine solche Größe A auch als ein Element A = E1 hiervon. Ein Repertoire R von Größen A mit zugeordneten Wahrscheinlichkeiten p(A) wird auch Feld R(A)genannt. Nachgestellte Kleinbuchstaben u. v, w, x, y und z werden für laufende Indizes reserviert entsprechend Ax = A1, A2 usw., Axy = A11, A12, . . . A21 usw., wobei im Interesse der Eindeutigkeit Indizes wie in Ax.y = A1.12 auch durch Punkte separiert werden, hier also mit x = 1 und y = 12. Die Beziehung B a A klassifiziert B als Untermenge von A. Eine Menge von entsprechend der Bezeichnung B1 o B2 o B3 o . . . alternativ zu verwendenden Größen Bx a A gilt als disjunktes Repertoire R(Bx) oder auch als disjunkte Klasse K1 = A = (Bx) ihrer Elemente E1 = Bx. Eine Zusammenfügung von Komponenten Em = Bx, bei der es auch auf deren wechselseitige Zuordnungen ankommt, wird als Komplex Kp = A = BxBx bezeichnet, notiert auch als Bx, Bx, wobei Zusammenstellungen von Komponenten Bx, die teilweise oder in Spezialfällen auch sämtlich in Form ungeordneter Repertoires wie auch Felder R(Bx) vorliegen, ebenfalls als Komplexe Kp definiert werden, wie es auch für die als Komplexe Wk = KK definierten Sachverhalte Wk vorgesehen ist. Im einzelnen werden auch die Notationen K1(Bx) = (Bx) und Kp(Bx) = BxBx verwendet. Die Definition von im Regelfall durch mehrere Größen repräsentierten Repertoires oder Feldern R, Massen K1 oder Komplexen Kp schließt die Zugehörigkeit von gegebenenfalls nur einer oder auch gar keiner Größe zu diesen Mengen nicht aus. Durch nE wird das Nicht-Vorliegen, die Nicht-Verwendung oder auch die unten näher definierte Negation eines Begriffes B angezeigt. Die Zeichen +, - und = werden in der konventionellen Bedeutung eingesetzt, Multiplikationen werden durch B1 × B2, Divisionen durch B1/B2 angezeigt; Schrägstriche dienen zusätzlich auch der genannten, jeweils aus dem Zusammenhang ersichtlichen Kennzeichnung von bedingten Wahrscheinlichkeiten p sowie von Textbeispielen t. Ein vollständiges Repertoire R(Bxy) von jeweils einer Einheit Bxy a Ax einer disjunkten Klasse Kl = Ax aus einem Repertoire R(Ax) solcher Klassen Ax wird als Permutation bezeichnet. Durch A1 ne A2 wird die Ungleichheit der Mengen oder auch Größen A1 und A2 angezeigt. Als weitere Bezugssymbole werden ue in der Bedeutung "ungefähr gleich", g ("größer als"), gg ("viel größer als"), k ("kleiner"), kk ("viel kleiner"), ge ("größer oder gleich"), ke ("kleiner oder gleich") und nne ("nicht notwendig gleich) verwendet. Die Positionen P seriell angeordneter Komponenten Em in Komplexen Kp = EmEm werden entsprechend ihrer Reihenfolge Em1 vor Em2 auch explizit gemäß P = Em1 : Em2 notiert, wobei, wie beispielsweise auch bei der Anordnung von diskontinuierlichen Textabschnitten Ts in Texten T, nicht ausgeschlossen wird, daß weitere Komponenten Emx wie auch Teile hiervon dazwischen liegen. Entsprechend wird gemäß der Notierung P(a) auch ein möglicher Abstandsbereich a zwischen Em1 und Em2 angezeigt.
Wie oben ausgeführt, sieht das erfindungsgemäße Verfahren Mp vor, die Kommunikation unter Verwendung von, als Mengen von beliebig einander zugeordneten, Gegenständen A gebildeten, nachfolgend kurz auch Sachen genannten, Sachbegriffen K durchzuführen, welche entsprechend auch als Sachen K = R(A) oder auch als Komplexe K = Kp mit Komponenten Em = A notiert werden. Die unter Beachtung der Anordnungen Pr der grammatischen Symbole Gr vorzunehmende Verwendung von Sachen K a Fp a Vt in den semantischen Inhalten F, insbesondere auch Verknüpfungen mit weiteren Sachen K, werden gemäß Verwendungshinweisen q a Fp a Vt a Gr vorgenommen, deren genannte Anpassung an die betreffende Sprache L vorzugsweise auf eine Weise erfolgt, wie sie durch die unten beschriebenen, an Texten T dieser Sprache L durchzuführenden Transformationen Qs bestimmt ist. Entsprechend werden Hinweise q berücksichtigt, von denen q = d eine Durchschnittsbildung, notiert auch als K2 d K1 oder auch K2 d1 K1, und q = s die Vereinigung gemäß K2 s1 K1 zweier Sachen oder auch Sachkomplexe K2 und K1 fordert, wobei gleiche Indizierungen jeweils anzeigen, daß, wie hier, q1 und K1 dem gleichen semantischen Hinweis Fp1 angehören. Weiter wird durch q = m die Entfernung einer Sache K4 aus einer Obermenge K3 gemäß K3 m4 K4 und durch q = f das Ersetzen einer Sache K5 durch eine Negation K6 = nK5 hiervon gemäß K5 f6 K6 angezeigt, welche gemäß K5a K9 und K6a K9 durch eine weitere Sache K9 näher zu definieren ist. Hinweis q = c sieht allgemein das Ersetzen eines Sachbegriffs K7 oder auch Sachkomplexes K7 durch eine Sache beziehungsweise einen Sachkomplex K8 gemäß K7 c8 K8 vor. Parameter q = c schließt das Ersetzen einer Eigenschaft H(Kx)1 wie beispielsweise einer Wahrscheinlichkeit p(Kx)1 durch eine hiervon abweichende Eigenschaft H(Kx)2 wie einer Wahrscheinlichkeit p(Kx)2 der betreffenden Sache Kx ein. Weiterhin wird mit q = k gemäß einer Notierung K9 k K10 durch K10 a Fp10 und die zugehörige Sache K10 a Fp10 das Ersetzen der Sache K9 durch eine Komplement- Menge von K9, bezogen auf eine Obermenge K11 = K9 s K10 mit K9 d K10 = 0, gefordert. Durch q = o wird, mit K14 = K12 o K13, die Bildung einer Sache K14 angezeigt, der die einander ausschließenden Teile der Mengen K12 und K13 angehören. In Anpassung an die betreffenden Sprachen L werden gegebenenfalls auch weitere Verwendungshinweise q eingesetzt. Beispielsweise wird durch q = o mit K15 = K12 o K13 o . . . auch die Bildung eines disjunkten Repertoires R = K15 zweier oder mehrerer alternativ geltender Sachen K12 oder K13 usw. angezeigt.
Die erfindungsgemäß vorgesehene Abwandlung eines pragmatischen Sachverhalts Wk1 entsprechend den in einem gebildeten semantischen Inhalt F resultierenden Wahrscheinlichkeiten p(Kx) der Sachen Kx a F in einen Sachverhalt Wk2 wird so unter Verwendung von q = c auch als Wk2 = Wk1 c F notiert. Die Abwandlung eines Inhalts Wk1 gemäß einem aus einer einzigen Sache K1 = F1 bestehenden Inhalt F, wie sie beispielsweise einem unten definierten Kopf-Symbol Vt1 mit K1 a Fp1 a Vt1 zugeordnet ist, wird entsprechend als Wk2 = Wk1 c Kx mit Kx = K1 notiert. Enthält beispielsweise Wk1 hierbei neben weiteren Sachen Kx eine Sache K1 mit p(K1) = p1 und eine weitere Sache K2 mit p(K2) = p2 = 1-p(K1), und folgt aus einer semantischen Nachricht T1N1F1 gemäß F1 für die Sache K1 eine Wahrscheinlichkeit p(K1) = p3 mit p3 ne p1, so ergibt sich ein Sachverhalt Wk2, in dem nicht nur K1 eine Wahrscheinlichkeit p(K1) = p3, sondern auch Sache K2 eine Wahrscheinlichkeit p(K2) = p4 mit p4 = 1-p3 erhält. Führt Inhalt F 1 beispielsweise zu p3 = 1, so hat dies wegen p(K2) = 0 ein Verschwinden der Sache K2 im Kommunikationsergebnis Wk2 zur Folge.
Gemäß der oben angefuhrten Bezeichnung wird durch q = o die Festlegung von Sachbegriffen Kx gemäß K2 o K1 o . . . als disjunkte Mengen K1, K2 usw. eines entsprechend disjunkten Repertoires R(Kx) angezeigt.
Durch die angeführte Zuordnung eines Repertoires R(K1(q)) von einer oder mehreren Klassen K1(q) von Verknüpfungsparametern q zu einem semantischen Hinweis Fp = Fp1 mit Fp1 q Vt1 a Gr1 wird berücksichtigt, daß Gr1 in Inhalten N mehreren Anordnungen Pr1, Pr2 usw. mit mehreren weiteren grammatischen Symbolen Gr2, Gr3 usw. verbunden sein kann, wobei entsprechend eine Sache K1 a Fp1 mit mehreren weiteren Sachen K2 a Gr2, K3 a Gr3 usw. zu verknüpfen ist. Durch die angeführte Zuordnung einer disjunkten Klasse K1 = (Fp) von semantischen Hinweisen Fp, die sich nicht nur durch die Sachen K a Fp, sondern bei gleicher Sache K auch durch die Verwendungshinweise q a Fp unterscheiden können, wird berücksichtigt, daß bei einer solchen Zuordnung Pr1 eines Symbols Gr2 zu Gr1 entsprechend unterschiedliche Verknüpfungen q der Permutationen von Sachen K1yz a Vt1y a Gr und K2yz a Vt2y a Gr2 möglich sind, wobei, wie unten an Beispielen erläutert, beispielsweise (q = d) o (q = s) gilt.
Für das erfindungsgemäße Verfahren Mp werden als Vorgaben Vr Hinweise wie auch Vorschriften von Nutzern des Verfahrens und daraus abgeleitete Daten berücksichtigt. Diese umfassen allgemein Angaben darüber, welche Anteile der Kommunikation zu übernehmen und welche Hinweise hierbei gegebenenfalls zu beachten sind. Hierzu gehören beispielsweise Anweisungen, als Autor At einem Partner Pa bestimmte Sachverhalte Wk durch entsprechenden Nachrichten TNF zugeordnete ausgehende Texte T mitzuteilen, als Hörer Hr einlaufenden Texten T Nachrichten TNF und Sachverhalte Wk2 zuzuordnen und diese gegebenenfalls einer weiteren Verwendung zuzuführen, einlaufende Texte T zu korrigieren, zu übersetzen, bestimmte Sprachen L zu verwenden, Botschaften F einlaufender Texte zu beurteilen, zu bestätigen, zu hinterfragen oder zu kommentieren, Fragen zu beantworten usw. Weiter umfassen die Vorgaben Vr beispielsweise Angaben darüber, welche oder auch welche Anteile vorliegender Sachverhalten Wk1 zugrunde zu legen sind, ob und wie weit einlaufenden Texten T zugeordnete Sachverhalte Wk2 als weitere Vorgaben Vr zu akzeptieren sind, ob und wie weit, beispielsweise auch abhängig von resultierenden Wahrscheinlichkeiten p, Äußerungen Tp eines Autors At zugeordnete resultierende Sachverhalte Wk2 zu übernehmen wie auch als Sachverhalte Wk1 einer nachfolgend herauszugebenden Äußerung Tp zugrunde zu legen sind, festzustellen, ob Autor At und Hörer Hr von unterschiedlichen Sachverhalten Wk1 ausgehen, dem Gesprächspartner Pa zugeordnete Sachverhalte Wk1 wie auch Wk2 darauf zu überprüfen, ob sie plausibel sind oder Irrtümer oder Unwahrheiten usw. enthalten, sie gegebenenfalls abzustreiten oder auch zu korrigieren, sowie Hinweise, welche Kommunikationsergebnisse Wk2, beispielsweise auch abhängig von resultierenden Wahrscheinlichkeiten p(K)2 oder auch Änderungen p(K)2 - p(K)1 hiervon, den Nutzern mitzuteilen oder in Aktionen umzusetzen sind usw. Hierbei wird durch die Vorgaben Vr auch festgelegt, ob und auch welche Weise vorliegende Daten D, wie sie beispielsweise in Form elektrischer, akustischer, optischer oder mechanischer Daten anfallen, in den Sachverhalten Wk zu berücksichtigen sind.
Gegebenenfalls wird durch entsprechende Vorgaben Vr auch gefordert, davon auszugehen, daß Kommunikationspartner Pa bei der Zuordnung von semantischen Inhalten TNF zu, von ihnen als Autoren At verfaßten, ausgehenden Äußerungen Tp oder zu, von ihnen als Hörer Hr empfangenen, einlaufenden Texten T pragmatische Begriffe K zugrunde legen, deren Wahrscheinlichkeiten p(K) für ihre Zuordnung zu Symbolen Vt oder auch weiteren Sachen K, beispielsweise in Sachverhalten Wk, von als objektiv bekannten Werten in subjektiver oder auch fehlerhafter Weise abweichen, wobei solche Abweichmöglichkeiten, beispielsweise durch Voraussetzung entsprechender Klassen K1 = (Wk1x) von Sachverhalten Wk1x oder auch entsprechend abgewandelter Daten Wp in der Kommunikation berücksichtigt werden.
Unter einer Wahrscheinlichkeit p(A) wird erfindungsgemäß allgemein sowohl die relative Häufigkeit verstanden, mit der ein Ereignis oder Gegenstand A in einer Vielzahl von Fällen anzutreffen war, als auch der Erwartungswert für einen zu behandelnden Einzelfall. Durch p(A) werden allgemein auch Wahrscheinlichkeitsbeziehungen zu weiteren Größen B wie beispielsweise bedingte Wahrscheinlichkeiten p(A/B) angezeigt. Solche Abhängigkeiten einer Wahrscheinlichkeit p(K1) einer Sache K = K1 von weiteren Sachen K2, K3 usw. wie auch von weiteren Begriffen wie Symbolen Vt usw. werden in entsprechend expliziter Notierung als bedingte Wahrscheinlichkeiten 2. Ordnung O(2) gemäß p(K1/K2) oder 3. Ordnung O(3) gemäß p(K1/K2; K3) oder höherer Ordnung O(n) in Komplexen KK, Sachverhalten Wk und Inhalten F berücksichtigt, wobei auch Einflußfaktoren wie beispielsweise eine Anordnung Pr durch Notierungen wie p(K1/Vt1; Pr) usw. angezeigt werden. Als weitere, vereinfachend ebenfalls als Wahrscheinlichkeiten p(K1) bezeichnete Wahrscheinlichkeitsbeziehungen werden auch durch Algorithmen wie beispielsweise p(K1) = a-p(K2) usw. oder auch aus Mengenansätzen wie Vereinigung, Durchschnitt, Zugehörigkeit, Komplement usw. resultierende Bezüge berücksichtigt. Entsprechend obiger Definition werden unter Wahrscheinlichkeiten p(K1) erster wie auch höherer Ordnung O(n) allgemein auch Wahrscheinlichkeiten p dafür verstanden, daß eine Sache K1 in einer Äußerung Tp zu erwarten ist, wodurch also streng jeweils eine, zur Vereinfachung der Beschreibung nicht eigens notierte, bedingte Wahrscheinlichkeit p(K1/Tp), p(K1/K2; Tp) usw. dafür angezeigt wird, daß Sache K1, wie gegebenenfalls aus einem Korpus vorangegangener Äußerungen Tp ableitbar, in einer beliebigen weiteren Äußerung Tp zu erwarten ist. In einer Ausbildung der Erfindung werden diese bedingten Wahrscheinlichkeiten gemäß p(K1/Tps) auch auf eine, auf die Länge des Textes T normierte, Standardäußerung Tp = Tps bezogen. Gemäß der Beziehung p(A1) × p(A2/A1) = p(A2) × p(A1/A2) wird vorausgesetzt, daß mit angegebenen bedingten Wahrscheinlichkeiten p(A2/A1) auch die invertierten Werte p(A1/A2) bekannt sind; entsprechendes gilt für Werte höherer Ordnung. In weiteren Ausbildungen werden bei Wahrscheinlichkeitsangaben p auch, beispielsweise durch Standardabweichungen ausgedrückte, Unsicherheiten dp berücksichtigt beziehungsweise vorausgesetzt. Durch die genannten Wahrscheinlichkeiten p(K) wird das Vorkommen der, allgemein durch weitere Daten A näher definierten, Sachen K einschließlich ihrer Bezüge in Komplexen Kp = KK zu weiteren Sachen K, wie sie in pragmatischen Sachverhalten Wk, Inhalten F wie auch als Komplexe Kp weiterer Sachen K beschriebener Sachen K vorkommen, festgelegt, wobei gemäß obiger Definition nicht ausgeschlossen wird, daß die vereinfachend als Komplexe Kp bezeichneten Sachverhalte Wk oder auch Inhalte F neben Komplexen KK einander zugeordneter Sachen K auch Felder R(K) ungeordneter Sachen K mit Wahrscheinlichkeiten p(K) enthalten.
Die Erfindung sieht vor, für die Kommunikation vorzugsweise Sachverhalte Wk mit Sachbegriffen K einzusetzen, deren Vorkommen und wechselseitige Bezüge überwiegend durch Daten, insbesondere auch bedingte Wahrscheinlichkeiten p, niedriger Ordnung O(n) beschrieben werden. In einer bevorzugten Ausgestaltung werden überwiegend Daten der Ordnung O(1) und O(2) und nur in mit der Ordnung O(n) stark abnehmendem Umfang auch Daten 3. und höherer Ordnung verwendet, wodurch das Risiko eines mit der Anzahl der Sachen K stark überproportionalen Anstiegs der für die Durchführung des Verfahrens Mp bereitzustellenden Daten Wp, verbunden mit kombinatorischen Explosionen der bei ihrer Abarbeitung zu berücksichtigenden Entscheidungsbäume, vermeidbar bleibt. In einer Ausbildung hiervon wird ein Repertoire R(K) von Sachbegriffen K berücksichtigt, deren wechselseitige Bezüge durch bedingte Wahrscheinlichkeiten p(K) beschrieben werden, deren Ordnung O(n) einen vorgegebenen, der Leistungsfähigkeit verfügbarer Vorrichtungen angepaßten Wert n = n1 nicht überschreitet. Dies wird, im Einklang mit der unten beschriebenen nichtlinearen Informationsverarbeitung Bb, auch dadurch erreicht, daß bedingte Wahrscheinlichkeiten p k ps unterhalb von Schwellwerten ps, die in Anpassung an die Kapazität verfügbarer Rechner festzulegen sind, vernachlässigt werden. Des weiteren wird dies durch bevorzugte Verwendung von als orthogonal definierten Sachbegriffen K erreicht, welche keinen oder einen vernachlässigbaren Einfluß auf den Zusammenhang zwischen bereits definierten Sachen K haben. Beispielsweise werden so bei einer Sache K2, deren Vorliegen mit einer bedingten Wahrscheinlichkeit p(K2/K1) von einer Sache K1 abhängt, weitere Sachen K3 usw. so definiert, daß p(K2/K1; K3) = p(K2/K1) gilt.
Die durch die genannten semantischen Hinweise Fp = Fp1 mit K1 a Fp1 und q1 a Fp1 bei der Bildung der Inhalte F vorgesehene Verknüpfung von Sachen K1, K2 usw. gemäß K2 q1 K1 usw. sieht erfindungsgemäß eine Berücksichtigung der hierfür resultierenden Wahrscheinlichkeiten p(K2/K1) entsprechend den Hinweisen q = q1 usw. und den in den Daten Wp und Sachverhalten Wk vorliegenden Wahrscheinlichkeiten p(K) vor. In Anpassung an die Gegebenheiten der Sprachen L werden bestimmten Verknüpfungshinweisen q1 a Fp1 usw. gegebenenfalls auch Faktoren qr zur, von der Art der Verknüpfung abhängigen, Abänderung resultierender Werte p(K2/K1), beispielsweise zu ihrer Reduzierung um bestimmte, dem Gebrauch der Sprachen L angepaßte, Faktoren qr k 1 zugeordnet. In einer weiteren Ausgestaltung werden den Verwendungshinweisen q a Fp a Vt auch die genannten Wahrscheinlichkeiten p(K/Vt) der Sachen K a Fp a Vt zugeordnet, welche bei der Bestimmung der zu berücksichtigenden Wahrscheinlichkeiten p(F/TN; Wk1) eingesetzt werden.
Die eingeführten Verknüpfungen einer Sache Kxyz a Fpxyz a Vtxy a Grx mit weiteren solchen Sachen gemäß beispielsweise K211 q111 K111 werden unter Beachtung der jeweiligen Indizes vereinfachend auch als Fp q Fp, Vt q Vt und Gr q Gr notiert, worunter Verknüpfungen gemäß Permutationen von den Symbolen Gr usw. als disjunkte Klassen K1 zugeordneten Hinweisen Fp a (Fp) a (Vt) a Gr zu verstehen sind. Entsprechende Notationen gelten für die Abwandlungen Wk q F von Sachverhalten Wk gemäß disjunkten Klassen K1 = (F) zugeordneten Inhalten F.
Für die Sachen K der erfindungsgemäß durch Nachrichten TNF abzuändernden Sachverhalte Wk1 werden neben Daten, die von Nutzern vorzugeben sind, gemäß Vorgaben Vr auch weitere, durch Kontexte gegebene Daten berücksichtigt, welche bei einem oder mehreren Partnern Pa aus vorangegangenen Nachrichten TNF wie gegebenenfalls auch aus den Situationen entsprechenden nicht-sprachlichen Datenübermittlungen anfallen, wie sie beispielsweise durch den Status von erfindungsgemäß kommunizierenden Vorrichtungen und weiteren hiermit verbundenen Vorrichtungen wie beispielsweise Rechnern und weiteren elektrischen wie auch mechanischen Geräten usw. vorgegeben werden. Da, wie angeführt, Autoren At und Hörer Hr auch von unterschiedlichen Sachverhalten Wk1 ausgehen können, wird nicht ausgeschlossen, daß sie auch voneinander abweichende Sachverhalte Wk2 erzeugen, wobei jedoch entsprechend den von den Partnern Pa erfindungsgemäß zu bildenden Nachrichten F häufig auch eine Reduzierung der Unterschiede zwischen zwei resultierenden Sachverhalten Wk2 im Vergleich zu den zwischen zwei Ausgangssachverhalten Wk1 anzutreffenden Unterschieden erreicht wird. Die gemäß den Inhalten F und dem Verknüpfungsparameter q = c vorzunehmenden Abänderungen an Ausgangssachverhalten Wk1 betreffen insbesondere jeweils die Wahrscheinlichkeiten p(K1) usw. der dort vorliegenden Sachen K1 usw. und schließen bei Wahrscheinlichkeitsbeziehungen p(K) höherer Ordnung entsprechende Abänderungen von Wahrscheinlichkeiten p(K2) von mit K1 usw. hierüber verknüpften Sachen K2 usw. mit ein. Abhängig von resultierenden Werten wird beispielsweise bei resultierenden Werten p(K1) k ps unterhalb festzulegender Schwellwerte ps eine Entfernung von Sachen K1 aus Wk1 vorgenommen. Bei entsprechenden resultierenden Werten p(K1) ist auch eine Hinzufügung von mit K1 verknüpften, in Wk1 nicht vorliegenden Sachen K2 vorgesehen, wenn sich dadurch für diese gemäß den Daten Wp ausreichend hohe Wahrscheinlichkeiten p(K2) ergeben. Entsprechend dieser Vorgehensweise ist auch eine als Lernen bezeichnete Hinzufügung neuer Sachen K2 zu einem Sachverhalt Wk1 wie auch zu den Daten Wp vorgesehen, wobei Sache K2 als Komplex Kp von gemäß Sachverhalten Wk beziehungsweise Daten Wp vorliegenden Sachen K3 usw. gebildet wird, welche K2 mit ausreichend hohen Wahrscheinlichkeiten p(K2/K3) usw. anzeigen. Hierbei werden gegebenenfalls benötigte weitere, einschließlich grammatischer, Daten für die Verknüpfung vorliegender beziehungsweise möglicher Textabschnitte Ts, Symbole Vt, Anordnungen Pr usw. in einer bevorzugten Ausbildung auch unter Anwendung des unten beschriebenen grammatischen Kommunikationsverfahrens M, bereitgestellt.
Aus der angeführten Definition von Wahrscheinlichkeiten p(K) auch 1. Ordnung von Sachen K als gegebenenfalls auch durch die Meinung eines Partners Pa sowie das erwartete Vorkommen in einer Äußerung Tp = Tps bedingte Wahrscheinlichkeiten p folgt, daß auch in solchen Fällen, in denen eine Sache K1 durch die Botschaft F = K1 einer vorliegenden grammatischen Nachricht TN eindeutig mit Wahrscheinlichkeit p(K1/TN) = 1 angesprochen wird, bei der vorgesehenen Abänderung eines voraus 99999 00070 552 001000280000000200012000285919988800040 0002010015858 00004 99880gesetzten Sachverhalts Wk1, in dem K1 beispielsweise mit einer Wahrscheinlichkeit p(K1) kk 1 angeführt ist, in einen resultierenden Sachverhalt Wk2 dieser Wert im Regelfall nicht auf p(K1) = 1 zu erhöhen ist, sondern auf einen, gegebenenfalls aus einem Korpus C von Texten T auch empirisch zu ermittelnden, Wert p(K1) k 1. Hierbei sind in Wk2 für nicht in Botschaft F angesprochene, aber mit K1 durch Wahrscheinlichkeitsbeziehungen, beispielsweise gemäß p(K1) + p(K2) = 1, verknüpfte Sachen K2 entsprechende Abänderungen der Wahrscheinlichkeiten p(K2) vorzunehmen, wobei in diesem Beispiel also p(K2) g o folgt. In einer vereinfachten Ausführungsform werden für mit K1 durch Wahrscheinlichkeitsbeziehungen p verknüpfte Sachen K2, für welche in Wk1 niedrige Werte p(K2) kk 1 vorliegen, unabhängig von dem durch Botschaft F für K1 erzielten Wert p(K1) diese Werte p(K2) aufwandsparend unverändert für Sachverhalt Wk2 beibehalten. Diese Vorgehensweise schließt jedoch insbesondere bei objektiv nachprüfbaren Sachverhalten Wk nicht aus, daß in Fällen, wo Sachverhalt Wk1 als Komplex KuKu einer überschaubaren Anzahl von einander entsprechend streng zugeordneten Sachen Ku repräsentiert wird, in Wk2 für K1 auch Werte p(K1) = 1 und für die weiteren Sachen Ku Werte p(Ku/K1) usw. entsprechend den gegebenen Wahrscheinlichkeitsbeziehungen p(K), bei obigem Beispiel also auch Werte p(K2) = 1-p(K1) = 0 eingesetzt werden. Entsprechend der erfindungsgemäß zu berücksichtigenden Möglichkeit, daß die Botschaft F1 einer Äußerung Tp1 eine Unwahrheit erhält, sieht Verfahren Mp vor, als Ausgangssachverhalt Wk11 einer weiteren Äußerung Tp2 neben dem gemäß F1 von Tp1 abgeänderten Sachverhalt Wk2 disjunkt hierzu auch den ursprünglichen Sachverhalt Wk1 als Kommunikationsergebnis der Äußerung Tp1 zu verwenden und diesen gegebenenfalls als Ausgangssachverhalt Wk1 weiterer Äußerungen Tp2 vorauszusetzen.
Die Erfindung sieht allgemein vor, Daten Wp zu verwenden, deren Repertoire R(Em) von Komponenten Em den abzudeckenden Kommunikationsakten und damit anzusprechenden Inhalten angepaßt ist. In einer Ausbildung, die besonders für die Übermittlung von Botschaften durch menschliche Autoren At an gemäß Verfahren Mp als Hörer Hr fungierende Einrichtungen geeignet ist, welche diese Botschaften erfindungsgemäß einer weiteren Verwendung durch weitere, ihnen als Nutzer zugeordnete maschinelle Vorrichtungen zuführen, werden beispielsweise Daten Wp benutzt, bei denen einem vergleichsweise umfangreichen, den Sprachgebrauch von Menschen wiedergebendes Repertoire R(Vt) von Symbolen Vt und entsprechend lexikalischen Wörtern ein beschränktes, den Aufgabenbereichen der zugeordneten Nutzer angepaßtes Repertoire R(K) von Sachbegriffen K gegenübergestellt ist. Dieses Repertoire R(K) wird zweckmäßig so einem solchen Aufgabenbereich angepaßt, daß die darin vorkommenden Sachverhalte durch, gemäß Verfahren Mp übermittelten Äußerungen Tp zuordenbare und als Kombinationen solcher Sachen K gebildete, semantische Inhalte F und Sachverhalte Wk zu beschreiben sind. In einer Ausbildung hiervon werden solche Sachverhalte Wk auch durch gemäß Vorgaben Vr eindeutig kodierte Signale beispielsweise elektrischer oder auch mechanischer Art dargestellt, welche gegebenenfalls auch geeignet sind, durch Äußerungen Tp aufgetragene, dem betreffenden Sachgebiet zugeordnete Operationen der Nutzer auszulösen. Beispielsweise werden so für die Kommunikation mit gemäß Verfahren Mp als Hörer Hr fungierenden Vorrichtungen, denen als Nutzer Elektronenrechner zugeordnet sind, die im Regelfall durch eindeutig kodierte Kommandos entsprechender Programmiersprachen in Operation gesetzt werden, durch solche Kommandos, gegebenenfalls auch die damit verknüpften elektrischen, gegebenenfalls auch elektromechanischen Signalfolgen objektiv definierte, Rechenoperationen als Sachverhalte Wk eines entsprechenden Sachgebiets berücksichtigt. Für als Nutzer eingesetzte Werkzeugmaschinen wird entsprechend ein an deren Leistungsspektrum angepaßtes Repertoire beispielsweise elektromechanisch induzierter Befehle als Sachgebiet festgelegt. In einer bevorzugten Ausbildung werden die als Hörer Hr fungierenden erfindungsgemäßen Einrichtungen durch entsprechende Vorgaben Vr veranlaßt, bei durch sie nicht mit ausreichender Sicherheit und Eindeutigkeit zuordenbaren Sachverhalten Wk den Autor At auf die jeweilige, beispielsweise auf ungeeignete Wortwahl oder sachliche Mehrdeutigkeiten oder Fehler zurückzuführende Problematik aufmerksam zu machen. Diese Beschränkung eines von einem maschinellen Hörer Hr zu berücksichtigenden Repertoires R(K) von Sachbegriffen K auf den für den abzudeckenden Sachbereich erforderlichen Umfang führt zu vorteilhaften Einsparungen bei den hierfür bereitzustellenden Speicher- wie auch Verarbeitungskapazitäten.
Als Daten Wp, wie sie gemäß obigen Angaben beim erfindungsgemäßen Kommunikationsverfahren Mp zu berücksichtigen sind, werden allgemein Zusammenstellungen der zur Bildung der Nachrichtenkomplexe Kp = TNF zu verwendenden Komponenten Em mit den hierbei zu berücksichtigenden Eigenschaften H(Em) eingesetzt. Zu diesen Eigenschaften zählen insbesondere auch, beispielsweise auch durch Wahrscheinlichkeitsbeziehungen ausgedrückte, Bezüge zu weiteren Komponenten Em wie auch zu als Adressen Ad eingesetzten vorliegenden Begriffen, welche neben Komponenten Em beispielsweise als Daten D vorliegende Merkmale H(T) von Texten T mit einschließen. Bei den Anordnungen der Komponenten Em werden, wie unten ausgeführt, auch Ordnungsprinzipien wie Reihenfolgen oder auch komplexbildende Zusammenhänge, wie sie etwa für Sachbegriffe K gelten, berücksichtigt.
Die erfindungsgemäß zu berücksichtigenden Wahrscheinlichkeiten p(A) von Begriffen A werden auch durch Informationen j = log(1/p(A)) ausgedrückt, worin log für den Logarithmus zur Basis 2 steht und j den Informationsbetrag in bit angibt, der zum sicheren Wissen, mit p = 1, daß A vorliegt, noch fehlt, wobei bedingte Wahrscheinlichkeiten p durch entsprechende bedingte Informationen j angezeigt werden.
Die für Verfahren Mp vorgesehene Beachtung der Wahrscheinlichkeiten p(TNF) der zu bildenden semantischen Nachrichten TNF wie auch p(Em) der hierfür zu verwendenden Komponenten Em wie Sachbegriffe K und Symbole Vt und Gr, welche gegebenenfalls auch durch weitere Komponenten Em wie auch vorliegende Daten D bedingt sind, erfolgt in einer bevorzugten Ausgestaltung unter Anwendung des bekannten, hier als Ba bezeichneten Bayesschen Ansatzes, wie er beispielsweise in //9// erläutert wurde. Hierfür werden allgemein als mit Sicherheit vorliegende Daten D vorausgesetzt, welche beispielsweise gegebene Vorgaben Vr, Texte T wie auch Merkmale H(T) und Komplexe Kp hiervon einschließen und allgemein mehrdeutig eine Zuordnung von Sprachinhalten wie Symbolen Vt und Gr wie auch hieraus gebildeten Komplexen wie N, F, NF wie auch Komplexen Kp hiervon erlauben. Hierbei werden Komponenten Em, welche allgemein durch Daten D einschließlich vorliegender, als Adressen Ad eingesetzter weiterer Komponenten Em wie auch Textmerkmale H(T) mehrdeutig, also mit Wahrscheinlichkeiten p k 1 als disjunkte Repertoires R(Em) angezeigt werden, zu Komplexen Kp = Ks eines entsprechend disjunkten Repertoires R(Ks) zusammengefügt, welche jeweils definitionsgemäß eine dieser Komponenten Em, gegebenenfalls auch neben weiteren diesem Komplex Kp vorher bereits zugeordneten Komponenten Em weiterer Repertoires R(Em) enthalten und als Konkurrenzhypothesen Ks bezeichnet werden. Die vorausgesetzten Daten D werden auch als Evidenz D bezeichnet.
Entsprechend gelten bei einer als Evidenz D vorliegenden grammatischen Nachricht TN entsprechend den durch deren Symbole Vt a Gr als Adressen Ad angezeigten disjunkten Repertoires R(Fp) von semantischen Hinweisen Fp a Vt a TN sowohl dieser TN disjunkt zuzuordnenden semantischen Inhalte Fx = F1, F2, . . . Fm wie auch die bei deren Aufbau als Zwischenergebnisse anfallenden disjunkten Komplexe Kp = KK von Sachbegriffen K als Konkurrenzhypothesen Ks. Wird hierbei durch eine Evidenz D bei einem Komplexbildungsschritt eine Anzahl m von Konkurrenzhypothesen Ksx = Ks1, Ks2, . . . Ksm mit ausreichend hohen Wahrscheinlichkeiten p(Ksx/D) angezeigt, so gilt gemäß Ba für Ks1 eine Wahrscheinlichkeit p(Ks1/D) = p(Ks1) × p(D/Ks1)/Ne, wobei der Nenner Ne für die Wahrscheinlichkeitssumme Ne = (p(Ks1) × p(D/Ks1) + . . . + p(Ksm) × p(D/Ksm)) steht. Die Wahrscheinlichkeiten p der weiteren Hypothesen Ksx werden durch entsprechende Permutationen des Zählers gemäß p(Ks2) × p(D/Ks2) usw. angezeigt.
Bei der in einer bevorzugten Ausgestaltung vorgesehenen Anwendung des unten erläuterten grammatischen Kommunikationsverfahrens M wird neben einem vorliegenden Text T vereinfachend auch das disjunkte Repertoire R(N) der gemäß M diesem Text T mit Wahrscheinlichkeiten p(N/T) zugeordneten grammatischen Nachrichten N wie auch das entsprechende Repertoire R(S) von als Komplexe Kp = VtVt von Symbolen Vt gebildeten, den Inhalten N zugeordneten Sätzen S a N als Evidenz D eingesetzt. Im häufig anzutreffenden Fall grammatisch eindeutiger Texte T gilt entsprechend der zugeordnete Inhalt N wie auch die entsprechende grammatische Nachricht TN als Evidenz D. Erfindungsgemäß zeigt hierbei ein Symbol Vt a Gr a N unter Berücksichtigung seiner Anordnung Pr als Adresse Ad jeweils eine disjunkte Klasse (Fp) a Vt von semantischen Hinweisen Fp an, deren Sachbegriffe K a Fp ein entsprechend disjunktes Repertoire R(Em) von jeweils für eine Konkurrenzhypothese Ksx = Fx zu berücksichtigenden Komponenten Em bilden. Im Fall grammatisch mehrdeutiger Texte T werden entsprechend den damit zusätzlich disjunkt zu berücksichtigenden Symbolen Vt a Gr a N entsprechend jeweils mehrere disjunkte Repertoires R(Em) vorgegeben. Beispiele für die erfindungsgemäße Anwendung des Ansatzes Ba folgen unten.
In einer besonders für den die Rolle des Autors At abdeckenden Verfahrensteil von Mp geeigneten Ausbildung wird als Evidenz D auch ein gegebener, durch einen Text T a TNF zu übermittelnder Sachverhalt Wk2 eingesetzt, wobei entsprechend gemäß Ansatz Ba zu bildende Wahrscheinlichkeiten p(T/Wk2; Wk1) hierfür gegebenenfalls disjunkt geeigneter Texte T berücksichtigt werden.
Entsprechend den für die betreffenden Sprachen L an Korpussen C von Texten T ermittelten Häufigkeiten p(Em) von Komponenten Em werden für die in Ansatz Ba zu verwertenden Wahrscheinlichkeiten p(Em) auch Unsicherheiten dp berücksichtigte, welche allgemein um so höher angesetzt werden, je höher der jeweils kleinere der Werte p(Em) oder 1-p(Em) für diese Komponente Em ausfällt.
In einer bevorzugten Ausgestaltung sieht die Erfindung vor, bei den vorzunehmenden Bestimmungen von Wahrscheinlichkeiten p(Kp) der zu bildenden Komplexe Kp = TNF nichtlineare Verarbeitungsoperationen Bb anzuwenden. Hierbei werden bei den unter Beachtung ihrer Wahrscheinlichkeiten p(Em) vorzunehmenden Verknüpfungen von, disjunkten Klassen K1 zu entnehmenden, Komponenten Em a K1 zu Komplexen Kp = TNF die Wahrscheinlichkeiten p(Em) der Komponenten Em wie auch p(Kp) der als Konkurrenzhypothesen Kp = Ks behandelten Komplexe Kp nichtlinear abhängig von der Höhe der jeweils vorliegenden beziehungsweise ermittelten Werte p(Em) und p(Kp) abgeändert, wobei unter Beachtung der für disjunkte Repertoires R(Em) beziehungsweise R(Ks) geltenden Wahrscheinlichkeitssummen Ca Wahrscheinlichkeiten p k pr unterhalb festzulegender Referenzwerte pc, gegebenenfalls auch auf p = 0, abgesenkt und Werte p ge pr, gegebenenfalls auch auf p = 1, erhöht werden. Verfahrensteil Bb wird dementsprechend auch als nichtlineare Wahrscheinlichkeits-, Informations- wie allgemein auch Datenverarbeitung Bb bezeichnet. In einer bevorzugten Ausbildung werden nach dem Bayesschen Ansatz Ba ermittelte Wahrscheinlichkeitswerte p(Ks) zugrunde gelegt.
In einer vorteilhaft einfachen Ausgestaltung Bbd sieht Verfahrensteil Bb vor, Referenzwerte pr = ps in Relation zu bestimmten Wahrscheinlichkeitswerten p(Em) und p(Ks) bestimmter Komponenten Em und Komplexe Ks der jeweiligen Repertoires R(Em) beziehungsweise R(Ks) festzulegen und Komponenten Em und Komplexe Ks mit Wahrscheinlichkeiten p k ps für die betreffende wie gegebenenfalls auch mehrere weitere Komplexbildungsstufen wie gegebenenfalls auch endgültig zu vernachlässigen. Verfahrensteil Bb bezieht sich insbesondere auch auf Sachbegriffe K als Komponenten Em und hieraus aufgebaute Inhalte F als Komplexe Kp = Ks, wobei nachfolgend vereinfachend auch die Komponenten Em a R(Em) als Konkurrenzhypothesen Ks bezeichnet werden.
Bei der nichtlinearen Datenverarbeitung Bb wird allgemein berücksichtigt, daß für die gegebenen disjunkten Repertoires R(Ksx) von Konkurrenzhypothesen Ksx jeweils eine Wahrscheinlichkeitssumme Ca = p(Ks1) + p(Ks2) + . . . gilt, wobei im Regelfall Ca = 1 anzusetzen ist, allerdings andere Fälle mit Ca k 1 ebenfalls in solchen Fällen möglich sind, wo ein Repertoires R(Ksx) auch durch keine der vorgeschlagenen Hypothesen Ksx als Komplex Kp vertreten sein kann oder davon auszugehen ist, daß neben den angeführten Hypothesen Ksx a R(Ksx) diesem Repertoire R noch weitere, jedoch nicht explizit bekannte Hypothesen Ks angehören können.
In der Ausgestaltung Bbd von Bb wird für ein Repertoire R(Ks1y) von Hypothesen Ks1y ein Schwellwert ps1 = b1 × p(Ks11) mit b1 k1 festgelegt, wobei Ks11 die Hypothese mit der höchsten Wahrscheinlichkeit p(Ks11) dieses Repertoires R repräsentiert, und es werden sämtliche Hypothesen Ks1y mit Wahrscheinlichkeiten p(Ks1y) k ps1 für bestimmte weiterführende Komplexbildungsschritte oder auch endgültig vernachlässigt. In einer bevorzugten Ausbildung hiervon wird b1 um so höher gewählt, je niedriger die verfügbare Arbeitskapazität oder auch Arbeitszeit der verfügbaren Vorrichtungen anzusetzen ist. Als Folge hiervon werden aufwandsparend nur solche, mindestens aber eine Konkurrenzhypothese Ks1y berücksichtigt, für deren Vorkommen eine so als ausreichend gering definierte Informationsmenge j k js1, mit js1 = log(1/ps1), fehlt.
In einer bevorzugten Ausbildung werden, hier mit Ksxy = Emxy, wegen einer zu geringen, gegebenenfalls auch durch bereits in einen Komplex Kp eingefügte weitere Komponenten Emxy bedingten, Zuordnungswahrscheinlichkeit p(Em1y) k ps1 für die betreffende Komplexbildung Kp zunächst vernachlässigte Komponenten Em1y a R(Em1y) gespeichert und nachfolgend doch wieder für die Komplexbildung Kp berücksichtigt, falls sich bei weiterführenden Komplexbildungsschritten mit Komponenten weiterer Repertoires R(Em2y), R(Em3y) usw. in Relation zu einem absolut festgelegten Schwellwert psa1 k ps1 als zu gering erachtete Zuordnungswahrscheinlichkeiten p(Em2y) k psa1 usw. ergeben. In einer weiteren Ausgestaltung werden Daten Wp verwendet, in denen Wahrscheinlichkeitsbezüge p(Em2/Em1) unterhalb festzulegender Schwellwerte ps1, ps2 usw. vernachlässigt werden, wobei in einer Ausbildung hiervon auch Datenblöcke Wpx a Wp mit stufenweise abgesenkten Schwellwerten ps und entsprechend stufenweise ansteigenden Datenmengen verwendet werden und in dieser Reihenfolge umfangreichere Blöcke Wp2 zu Komplexbildungen Kp herangezogen werden, falls sich mit vorangehend berücksichtigten Blöcken Wp1 keine befriedigenden Lösungen ergaben.
Gemäß einer weiteren Ausgestaltung Bbr der nichtlinearen Datenverarbeitung Bb, welche insbesondere bei der Komplexbildung von Sachbegriffen K = K1y als Komponenten Em zu semantischen Inhalten F Anwendung findet, wird für ein disjunktes Repertoire R(K1y) ein Schwellwert ps3 = b3 × p(K11) mit b3 g 1 und (1-ps3) kk 1 festgelegt, wobei ps3 so gewählt wird, daß mindestens eine Sache K11 aa R(K1y) mit einer Wahrscheinlichkeit ps1 k p(K11) k ps3 vorliegt, und es werden sämtliche Sachen K1y a R(K1y) mit p(K1y) g ps3, wieder für bestimmte Komplexbildungsstufen oder endgültig, vernachlässigt. Als Folge hiervon wird die Abfassung von semantischen Inhalten F a TNF, die weitgehend redundante Komplexbildungen, insbesondere von Sachen K, enthalten, durch einen Autor At wie auch die Interpretation einlaufender Texte T als solche von einem Autor At unwahrscheinlich redundant abgefaßte Nachrichten TNF durch einen Hörer Hr zugunsten informationsreicherer Nachrichten TNF vermieden. Die gemäß den Ausbildungen Bbd und Bbr vorgenommene nichtlineare Datenverarbeitung Bb sieht also allgemein vor, sowohl Nachrichten TNF mit sehr unwahrscheinlichen Komplexbildungen, zu deren Vorliegen entsprechend hohe Informationsbeträge j g js1 fehlen, als auch solche mit trivialen Komplexbildungen, die äußerst geringe Informationsbeträge j k js3 liefern, zugunsten gegebenenfalls möglicher Nachrichten TNF zu vernachlässigen, deren Angebot an Informationen j in einem mittleren Bereich js3 g j g js1 liegt.
Die für Verfahren Mp vorgesehenen Möglichkeiten nichtlinearer Datenverarbeitungsprozesse Bb werden zunächst anhand einiger näherungsweise behandelter, als Beispiel 1) zusammengefaßter Textbeispiele T aus der deutschen Schriftsprache erläutert, für welche zunächst eindeutige Zuordnungen von grammatischen Nachrichten TN mit entsprechend eindeutig ihren Texten T = Ts zugeordneten Symbolen Vt = Ts beziehungsweise Komplexen VtVt = TsTs hiervon angenommen werden. Hierzu wird beispielhaft der Fall einlaufender Texte T behandelt, wobei, wie oben angeführt, die zugeordneten Sachen K und Sachkomplexe KK, soweit möglich, auf die Meinung des als Kommunikationspartner Pa fungierenden Autors At bezogen werden. Hierbei repräsentiere ein einlaufender Text T1 = /Schwarze./ als Äußerung Tp = T1 = Ts11 eine grammatische Nachricht T1N1, deren grammatischer Inhalt N1 ein einziges, einem grammatischen Symbol Gr1 zugeordnetes Symbol Vt11 a Gr1 a N1 als Evidenz D umfaßt, dem neben weiteren, hier vernachlässigten, Möglichkeiten 3 semantische Hinweise Fp11z mit jeweils einer Sache K11z zugeordnet sind, wie sie hier wie auch in nachfolgenden Beispielen mittels zwischen Anführungszeichen gesetzter umgangssprachlicher Ausdrücke näherungsweise umschrieben werden. Hierfür gilt K111: "Autor At äußert sich über schwarzfarbige Gegenstände, worunter allgemein auch Lebewesen, Personen usw. verstanden werden", K112: ". . .über Menschen, die eine konservative Politik vertreten", und K113: " . . .über Neger". Gemäß einem vorauszusetzenden Sachverhalt Wk1 = Wk11 werden, mit numerischen Werten c kk 1, a ue 1 und c k b k a, Wahrscheinlichkeiten p(K11z) zugrunde gelegt, für die wegen des genannten Bezugs auf das Vorkommen in einer Äußerung Tp vergleichsweise niedrige absolute Werte entsprechend p(K111) ue p(K112) ue p(K113) = c vorgegeben werden. Gemäß Vorgehensweise Bbd wird ein Schwellwert ps 1 k c angesetzt, wobei Text T1 mit den 3 Botschaften F11z = K11z entsprechend semantisch vieldeutig bleibt. Ist dagegen, beispielsweise aufgrund vorangegangener Botschaften, ein Kontext mit einem Sachverhalt Wk1 = Wk12 vorauszusetzen, in dem p(K111) = b und p(K112) = p(K113) = c gelten, und wird entsprechend ein Schwellwert c k ps1 k b festgelegt, so folgt eine praktisch eindeutig auf die "Farbeigenschaft" K111 bezogene Botschaft F111. Hierbei wurde ein grammatisches Symbol Gr1 zugrunde gelegt, dessen Repertoire R(Pr) von Möglichkeiten seiner Anordnungen Pr relativ zu weiteren Symbolen Vt a Gr weiterer möglicher Symbole Gr denen bestimmter Substantive im Nominativ Plural entsprechen. Man beachte, daß Text T1 beispielsweise auch mit einer grammatischen Nachricht T1N2 mit einem grammatischen Inhalt N2 = Vt41 mit Vt41 a Gr4 a N2 vereinbar ist, worin das grammatische Symbol Gr4 bestimmte Akkusativformen von Substantiven im Plural symbolisiert, welche in Beispiel 1) nicht weiter berücksichtigt werden. Im Einklang mit den unten angeführten Transformationen Qs wie auch Q werden in sämtlichen Textbeispielen des Beispiels 1) die Symbole Vt1y und Gr1 als Kopf Vtk1y beziehungsweise Grk1 eingesetzt. Entsprechend einer der unten an weiteren Beispielen erläuterten Ausgestaltungen wurde hier den semantischen Hinweisen Fp11z a Vt11 jeweils der gleiche, vom in diesem Beispiel ebenfalls durch den Buchstaben c symbolisierten numerischen Wert zu unterscheidenden, oben definierten Verwendungshinweis q11z = c zugeordnet. Entsprechend der oben durch K7 c8 K8 ausgedrückten Notierung erfolgt das durch c8 vorgegebene Ersetzen von K7 durch K8 in diesem Beispiel dadurch, daß die im vorausgesetzten Sachverhalt Wk11 beziehungsweise Wk12 als Eigenschaft H(K11z)1 gegebene a-priori-Wahrscheinlichkeit p(K11z) = p(K11z)1 eines Sachbegriffs K11z durch die für den betreffenden semantischen Inhalt F resultierende Wahrscheinlichkeit p(K11z)2 als neue Eigenschaft H(K11z)2 des anderweitig unveränderten, beispielsweise als Menge von Begriffen A gegebenen, Sachbegriffs K11z ersetzt wird.
Beispiel 1) wird durch ein grammatisches Symbol Gr2 mit 2 Symbolen Vt21a Gr2 und Vt22 a Gr2 erweitert, mit welchen als weitere einlaufende Äußerungen Tp die Texte T2 = /Schwarze sind rot./ und T3 = /Schwarze sind schwarz./ betrachtet werden, wobei, auch wieder eindeutig, Ts21 = Vt21 = /sind rot/ und Ts22 = Vt22 = /sind schwarz/ angesetzt wird. Hierbei gilt eine Anordnungsmöglichkeit Pr von Gr2 zu Gr1, die durch einen Rang Ra mit einer unten erläuterten Abhängigkeit Gr2 = An(Gr1) sowie eine Position P bestimmt ist, in welcher Text Ts11 = Vt11 diskontinuierlich eingesetzt wird, wobei dessen Textteile T = /Schwarze/ und der Punkt T = /./ jeweils durch einen Text Ts2y getrennt werden. Man beachte, daß die Texte Ts2y a Vt2y jeweils mit einem, einen Abstand zum vorangestellten Wort anzeigenden, Leerzeichen // beginnen, wie es auch den gemäß einer Ausbildung der Erfindung zu berücksichtigenden, unten beschriebenen Text-Transformationen Qs entspricht. Ein weiteres unten beschriebenes, die Großschreibung weiterer dem Symbol Vt11 gegebenenfalls voranzustellender Text T betreffendes, als Operator o fungierendes Zeichen wurde bei der Formulierung von Ts11 vernachlässigt, ebenso ein den Text Ts11 einleitendes Leerzeichen.
Jedem Symbol Vt2y sind jeweils 2 semantische Hinweise Fp2yz zugeordnet, denen jeweils der gleiche Verknüpfungshinweis q2yz = d für eine Durchschnittsbildung der jeweiligen Sache K2yz a Fp2yz mit einer Sache K11z a Fp11z a Vt11 zugeordnet ist. Durch Vt21 = /sind rot/ werden 2 Sachen etwa im Sinne von K211: "die vom Subjekt Gr1 angezeigten Gegenstände, wieder gemäß Autor At, sind rotfarbig" und K212: ". . . sind politisch sozialistisch orientiert" angezeigt, durch Vt22 = /sind schwarz/ entsprechend die Sachen K221: ". . . schwarzfarbig" und K222: ". . . politisch konservativ". Gemäß Sachverhalt Wk11 sei von bedingten Wahrscheinlichkeiten p(K221/K111) = p(K222/K112) = a und p(K211/K111) = p(K212/K112) = c auszugehen, während für die weiteren Zuordnungen mittlere Werte p(K2yz/K11z) ne b gelten, wobei ein Index wie hier z an unterschiedlichen Positionen auch unterschiedliche Zahlenwerte repräsentieren kann. Wird hier gemäß Bbd ein Schwellwert c k ps1 k b festgelegt, so werden für Text T2 die Sachkomplexe F = K111K211 etwa im Sinne einer Autorenmeinung "schwarzfarbige Gegenstände usw. sind rotfarbig" und F = K112K212 etwa gemäß "Konservative sind sozialistisch orientiert" vernachlässigbar. Dagegen bleiben bei den berücksichtigten Kontextbezügen für Text T2 Inhalte F im Sinne einer Autorenmeinung K113K211: "Neger sind sozialistisch orientiert" und für T3 im Sinne von K111K222: "schwarzfarbige, beispielsweise so gekleidete, Personen sind konservativ" und K113K222: "Neger sind konservativ" selbst bei geringen Werten b kk 1 nicht auszuschließen.
Die Ausgestaltung Bbr der nichtlinearen Datenverarbeitung Bb sieht vor, als unnötig redundant betrachtete Inhaltsbildungen F = KK dadurch zu vermeiden, daß Zuordnungen von Sachen Kb zu Sachen Ka mit Wahrscheinlichkeiten p(Kb/Ka) g ps3, mit (1 - ps3) kk 1, zu vermeiden. Entsprechend wird für Beispiel 1) ein Schwellwert b k ps3 k a vorgegeben, wodurch die quantitativ durch p(K221/K111) = p(K222/K112) = a bestimmten Komplexbildungen KK wegen a g ps3 als zu informationsarm vernachlässigbar werden. Zugunsten der oben genannten Inhaltsbildungen sind gemäß Bbr also die gemäß Bb für Text T3 ebenfalls möglichen Inhalte K111K211 im Sinne einer Autorenaussage "schwarzfarbige Gegenstände usw. sind schwarzfarbig" und K112K222:"Konservative sind konservativ" auszuschließen.
Entsprechend der erfindungsgemäß berücksichtigten Möglichkeit, auch disjunkt unterschiedliche Ausgangssachverhalte Wk1x zuzulassen, wird in Beispiel 1) zusätzlich zum betrachteten Sachverhalt Wk11 auch wieder der Sachverhalt Wk12 vorausgesetzt, in welchem anstelle von p(K111) = c ein Wert p(K111) = b gilt, wobei gemäß den obigen Ausführungen die weiteren Wahrscheinlichkeiten p(K) hier unverändert von Wk11 übernommen werden und auf die Einführung eines Schwellwertes ps1 g c verzichtet wird. Unter Anwendung des oben erläuterten Bayesschen Ansatzes Ba ergibt sich gemäß Bb, daß für die Texte T2 und T3 die gleichen Botschaften F = KK ausreichend wahrscheinlich sind wie bei Wk11; allerdings bewirkt Kontext Wk12, daß dem Text T3 ein Inhalt K111K222 mit höherer Wahrscheinlichkeit p(F/TN) zuzuordnen ist als ein Inhalt K113K222.
Beispiel 1) erläutert auch den Fall ausgehender Texte T, wobei die genannten Sachen Kxyz dann entsprechend auf die hierbei vorausgesetzte Meinung des als Kommunikationspartner fungierenden Hörers Pa = Hr zu beziehen sind.
Das erfindungsgemäße Verfahren Mp wird in einer bevorzugten Ausgestaltung, jedoch ohne Einschränkung der Allgemeingültigkeit, unter Zugrundelegung, in einer Ausbildung hiervon auch unter Anwendung, eines grammatischen Kommunikationsverfahrens M durchgeführt, welches in Patentanmeldung P. . . beschrieben wird. Verfahren M sieht eine Kommunikation mit grammatischen Nachrichten TN vor, die jeweils aus einem Text T und einem diesem zuzuordnenden, dort ebenso bezeichneten, grammatischen Inhalt N bestehen, welcher als Komplex Kp mit Struktur J aus unten im einzelnen beschriebenen grammatischen Symbolen Gr als Komponenten Em gebildet wird. In einer bevorzugten Ausbildung werden hierzu Symbole Gr eingesetzt, die in P. . . beschriebenen, auf Texte T anzuwendenden, Transformationen Q genügen, deren Ergebnisse durch, unter Mitwirkung von Experten der betreffenden Sprachen L durchzuführende, Beobachtungen bestimmter Invarianzen I nachweisbar sind. Diese Transformationen Q sind mit den, in einer der genannten Ausgestaltung dem erfindungsgemäßen Verfahren Mp zugrunde gelegten, unten ausgeführten Transformationen Qs vereinbar, unterscheiden sich jedoch von den für die genannten bekannten Grammatiken //12// einschließlich Transformationsgrammatiken //12// charakteristischen, auch als bedeutungsneutral //12//, S. 800 bezeichneten Transformationen, so daß sich entsprechend auch die Symbole Gr mit ihren Eigenschaften H(Gr) von den bisher eingesetzten Begriffen wie auch Phrasen //12// unterscheiden. Gemäß Verfahren M werden einem Text T a Tp einer Äußerung Tp eine wie gegebenenfalls auch mehrere solcher Nachrichten TN, im Regelfall disjunkt, zugeordnet, welche entsprechend dem erfindungsgemäßen Verfahren Mp weiterhin jeweils durch eine oder disjunkt mehrere semantische Inhalte F zu entsprechenden semantischen Nachrichten TNF zu ergänzen sind. Als grammatische Symbole Gr werden in Verfahren M den Symbolen Vt von Verfahren Mp entsprechende, dort auch als objektive Wörter oder kurz Wörter Vt bezeichnete Symbole Vt sowie den Symbolen Gr von Mp entsprechende, dort auch als Einheiten G bezeichnete klassenbildende Superierungen von objektiven Wörtern Vt zu disjunkten Klassen G = (Vt) verwendet. Hierbei wird ein Wort Vt in Texten T durch die gleiche disjunkte Klasse Vt = (Ts) von Textabschnitten repräsentiert wie das entsprechende Symbol Vt von Verfahren Mp. Den Einheiten G = (Vt) ist jeweils ein Repertoire R(Pr) von Möglichkeiten von, auch in M so bezeichneten, Anordnungen Pr der ihnen zugeordneten Wörter Vt a G in grammatischen Nachrichten TN und entsprechend semantischen Nachrichten TNF zugeordnet, welche durch Wahrscheinlichkeiten p näher bestimmt sind, die für die Wörter Vt a G einer Einheit G innerhalb vorgegebener Toleranzen dp übereinstimmen. Diese Anordnungen Pr sind, wie in verfahren Mp, durch die Positionen P der Textabschnitte Ts a Vt und einen Rang Ra gegeben und werden durch Valenzen Um beschrieben, die ebenfalls den genannten Transformationen Q genügen und sich dementsprechend von den für herkömmliche Sprachverfahren und diesen hinterlegten Grammatiken vorgeschlagenen und als nicht zuverlässig erachteten Valenzen //12// unterscheiden. Gemäß Verfahren M werden datensparend auch grammatische Symbole Gr verwendet, die als klassen­ wie auch komplexbildende Superierungen solcher Symbole Gr wie Wörter Vt und Einheiten G wie auch bestimmten Teilen hiervon erstellt werden. Durch eine Valenz Um1.1 einer Einheit G1 wird allgemein festgelegt, daß diese Einheit G1 in einem grammatischen Inhalt N mit maximal einer, in einer Anordnung Pr zugeordneten, Einheit G2a (G)1 aus einer disjunkten Klasse (G)1 verknüpft sein kann, diese Valenz Um1.1 also nach einer solchen Zuordnung als gesättigt gilt. Hierbei wird der wechselseitige Rang Ra zweier über ihre jeweiligen Valenzen Um einander zugeordneter Einheiten G durch die Wahrscheinlichkeiten p bestimmt, mit denen eine Sättigung dieser Valenzen Um zu erwarten ist. Definitionsgemäß umfassen die Anordnungen Pr sowohl die Möglichkeiten des, gegebenenfalls auch alleinigen, Vorkommens von Symbolen Vt in Nachrichten TN unabhängig von weiteren Symbolen Vt als auch ihres durch Bezüge zu weiteren solchen Symbolen Vt bedingten Vorkommens. Vereinfachend werden auch die Anordnungsmöglichkeiten der Symbole Vt a G einschließlich der Textabschnitte Ts a Vt als Pr bezeichnet.
Die vorgesehene, durch die zugrunde gelegten Definitionen der Symbole Vt a G möglich gemachte Beschreibung ihrer Anordnungsmöglichkeiten Pr in Nachrichten TN und TNF durch Valenzen Um der Einheiten G hat vorteilhaft zur Folge, daß, anders als bei lexikalischen Wörtern, die Vielzahl möglicher syntaktischer Bezüge zwischen den Texten Ts a Vt objektiver Wörter Vt datensparend durch eine weitaus geringere Anzahl von Superierungen G = (Vt) dieser Wörter Vt mit Eigenschaften H(G) beschreibbar wird, wobei durch eine Valenz Um1.1 einer Einheit G1 = (Vt1y) die Bezüge der Wörter Vt1y a G1 zu Wörtern Vtxy a Gx ausgedrückt werden, die zusätzlich noch zu einer weiteren Superierung K1 = (Gx) von Superierungen Gx = (Vtxy) zusammengefaßt werden, und wobei ferner die Bezugsdaten weitgehend auf, kombinatorische Explosionen vermeidende, Daten der Ordnung O(2) beschränkt bleiben.
Die bei Verfahren M zu beachtenden Daten einschließlich der zur Komplexbildung der Nachrichten Kp = TN zu verwendenden Komponenten Em mit ihren Eigenschaften H(Em) werden unter der Bezeichnung Ws zusammengefaßt und in dieser Ausgestaltung der Erfindung den Daten Wp des erfindungsgemäßen Verfahrens Mp zugeordnet. Wo nicht anders angegeben, erfolgt die weitere Beschreibung des erfindungsgemäßen Verfahrens Mp ohne Einschränkung der Allgemeingültigkeit unter Zugrundelegung des grammatischen Verfahrens M und der hierfür, im Einklang mit Verfahren Mp festgelegten, Symbole Gs = Vt und Gs = G und ihren Eigenschaften H(Gs).
Die nach dem grammatischen Verfahren M zu bildenden Inhalte N der Texte T enthalten Komplexe Kp = GG von in Anordnungen Pr vorliegenden Einheiten G = (Vt) und diesen entsprechend zugeordnete Komplexe Kp = VtVt von gemäß dem vorliegenden Verfahren Mp als Symbole Vt einzusetzenden objektiven Wörtern Vt, schließen jedoch die gemäß Verfahren Mp vorzunehmende Verknüpfung von diesen Symbolen Vt zuzuordnenden semantischen Hinweisen Fp a Vt zu semantischen Inhalten F und die Bildung entsprechender pragmatischer Sachverhalte Wk nicht ein. Als in Verfahren Mp, wie oben angeführt, bei den Verwendungshinweisen q a Fp zu beachtende Anordnungen Pr werden in dieser Ausbildung die gemäß Verfahren M in den Nachrichten TN anzutreffenden Anordnungen Pr der Einheiten G und entsprechend Wörter Vt berücksichtigt, wie sie sich gemäß den Valenzen Um dieser Einheiten G in den Nachrichten TN ergeben. Hierbei wird von 2 in einer Anordnung Pr einander zugeordneten Einheiten G1 und G2 die ranghöhere Einheit G1 = Ar(G2) als Träger Ar von G2, die rangniedrigere Einheit G2 = An(G1) als Anhänger An von G1 bezeichnet. Entsprechend gelten so für die zugehörigen Wörter Vtxy a Gx und Textabschnitte Tsxyz a Vtxy die Beziehungen Vt11 = Ar(Vt21) und Vt21 = An(Vt11) sowie Ts111 = Ar(Ts211) und Ts211 = An(Ts111) usw. Eine Kette hierarchisch einander nachgeordneter Einheiten mit G1 = Ar(G2), G2 = Ar(G3) usw. bildet einen Ast As(G1, G2, G2 . . .), wobei die ranghöchste Einheit G1 eines Inhalts N auch als Kopf G1 = Gk1 dieses Inhalts N wie auch des Astes As bezeichnet wird, der sie angehört. In einem solchen Ast As(G1, G2, G3 . . .) wird G2 in bezug auf G1 auch als hierarchisch näherliegend oder rangnäher bezeichnet als G3, in bezug auf G1 und G3 auch als rangmäßig dazwischenliegend. Vereinfachend werden solche Rangordnungen auch als G1 g G2 g G3 wie auch Vt1y g Vt2y g Vt3y und entsprechend G3 k G2 k G1, im einzelnen auch G1 g G3 usw. notiert. Ein Sachbegriff Kxyu a Fpxyu a Vtxy a Gx eines Symbols Vtxy a Gx, das einer in einem Inhalt N als Kopf Gk angeordneten Einheit Gx = Gkx zugeordnet ist, wird auch, wie unten weiter ausgeführt, als Kopf Kkxyu des der betreffenden Nachricht TNF zugeordneten semantischen Inhalts F bezeichnet, wie er auch durch die genannten Transformationen Qs bestimmbar wird. Bei Zugrundelegung des grammatischen Verfahrens M erfolgen die bei diesen Transformationen Qs, wie unten gezeigt, jeweils an einem Text T1 = Tf1, mit T1 a TN, vorzunehmenden Verkürzungen zu einem Text T2 = Tf2 um jeweils einen Textabschnitt Ts a Vt11 a G1 einer Einheit G1 a N a TN, welche gemäß G1 = An(Gx) und G1 ne Ar(Gx) als Anhänger An, nicht jedoch als Träger Ar einer weiteren Einheit Gx a N fungiert.
Entsprechend den für Verfahren M vorgesehenen Maßnahmen wird in dieser Ausgestaltung zugrunde gelegt, daß ein Text T = Tp einer einlaufenden wie auch einer zu bildenden ausgehenden Äußerung Tp als Teil jeweils einer grammatischen Nachricht TN beziehungsweise bei Mehrdeutigkeit einer disjunkten Klasse K1 = (TN) hiervon wie gegebenenfalls eines Komplexes TN, TN, bei seriellen Sprachen also einer Folge, hiervon beziehungsweise bei Mehrdeutigkeit einer disjunkten Klasse K1 = (TN, TN) solcher Folgen vorliegt oder bei vorgesehener Anwendung des Verfahrens M auch erzeugt wird, so daß Text Tp in entsprechend unterteilter Form auch als Komplex Kp = VtVt von entsprechend ihren Positionen P angeordneten Symbolen Vt = Vtxy wie auch als Komplex Kp = TsTs von diesen zugeordneten Textabschnitten Tsxyz a Vtxy beziehungsweise bei Mehrdeutigkeit als entsprechende disjunkte Klasse K1 = (VtVt) und (TsTs) hiervon vorliegt. Gemäß Verfahren M wird eine Permutation VtVt der Symbole Vtxy a Gx sämtlicher in einem grammatischen Inhalt N gemäß ihren Valenzen Um angeordneten Einheiten Gx auch als Satz VtVt = S bezeichnet, dessen als Permutation der Textabschnitte Ts a Vt sämtlicher Symbole Vtxy a S gebildeter Text T a S im Regelfall als ein bezüglich seines Inhalts F korrekter Text T = Tf beurteilt wird, falls die Abweichungen der Textabschnitte Ts von ihren Normtexten Tsa vorgegebene Toleranzen dT nicht übersteigen. Entsprechend liegt ein Text T = Tp auch als Satz S oder Satzfolge SS beziehungsweise bei Mehrdeutigkeit als disjunkte Klasse K1 = (S) oder (SS) hiervon vor. Man beachte, daß gemäß der Definitionen von korrekten Texten Tf und der Transformationen Q wie auch Qs ein Satz S nicht notwendig einen mindestens als Kombination zweier als Subjekt und Prädikat oder auch als Nominalphrase und Verbalphrase bezeichneter Satzteile gebildeten natürlichen Satz wie beispielsweise /Zwetschgen sind grün./ darstellen muß, sondern daß beispielsweise auch prädikatfreie Äußerungen Tp wie /Grüne Zwetschgen./ oder /Nein!/ als T = Tf = Tp gelten und somit Sätze S repräsentieren. Weiterhin schließt Verfahren M wie Mp die Verwendung diskontinuierlich angeordneter Textabschnitte Ts a Vt in Texten T und somit von diskontinuierlichen Wörtern Vt in Sätzen S mit ein, wie sie oben auch in Beispiel 1) eingesetzt wurden.
Für die aufgabengemäß zu leistenden Übersetzungen sieht Verfahren Mp in einer vorteilhaften Ausgestaltung die Verwendung weiterer für das grammatische Verfahren M eingeführter, als Vokabeln Vqq bezeichneter Symbole vor, bei welchen jeweils einem, ebenfalls Vokabel genannten, Komplex Kp = VtVt = Vq von objektiven Wörtern Vt einer Ausgangssprache L, eine disjunkte Klasse K1 = (Vq') von Vokabeln Vq' zugeordnet ist, die jeweils als Komplexe Kp = Vt'Vt' = Vq' von Wörtern Vq' einer Zielsprache L' gebildet werden. Mit diesen Vokabeln Vqq erfolgt eine Übersetzung dadurch, daß ein gegebener Text T der Sprache L zu einer Folge grammatischer Nachrichten TN mit zugeordneten Sätzen S = VtVt ergänzt wird und die Wörter Vt eines jeden Satzes S vollständig zu Vokabeln Vq zusammengefaßt werden und dieser als Komplex S = Kp = VqVq = VqqVqq vorliegt. Die Wörter Vt' einer Permutation von Vokabeln Vq' a Vqq der Zielsprache L' dieses Satzes S werden zu einem grammatischen Inhalt N' a T'N' einer grammatischen Nachricht T'N' von L' zusammengefügt, deren Text T' a T'N' als Übersetzung des Textes T a TN der Sprache L gilt, wobei gemäß den Vokabeln Vqq auch eine disjunkte Klasse K1 = (T'N') solcher Nachrichten T'N' mit entsprechend unterschiedlichen Übersetzungstexten T' anfallen kann. Zusätzlich zu den im grammatischen Verfahren M vorgesehenen Maßnahmen erfolgt im erfindungsgemäßen Verfahren Mp, wie unten ausgeführt, eine Ergänzung der Nachrichten TN und T'N' zu semantischen Nachrichten TNF und T'N'F' und die Auswahl einer Nachricht T'N'F' mit Übersetzungstext T' a T'N'F', deren semantischer Inhalt F' a F'N'F' am besten mit dem gegebenen Inhalt F a TNF übereinstimmt.
Entsprechend einer für Verfahren M vorgesehenen bevorzugten Ausgestaltung werden die Symbole Vt auch als Komplexe Vt = ZZ weiterer, auch Zeichen Z genannter, Komponenten Em = Z formuliert, welche in Texten T jeweils durch eine disjunkte Klasse K1 = Z = (Tr) von Textabschnitten Tr repräsentiert werden. Gemäß einer Ausbildung hiervon genügen diese Textabschnitte Tr a Z jeweils bestimmten, innerhalb festzulegender Toleranzen dT liegenden Textmerkmalen H(T) wie auch Repertoires R(H(T)) wie auch Komplexen Kp hiervon. Es werden bevorzugt, auch als Alphabete bezeichnete, geordnete Repertoires R(Z) von Zeichen Z wie auch entsprechend geordnete Repertoires R(Vt), R(G) und R(Ad) der einzusetzenden Symbole und Adressen Ad für ihre Anordnung in den Daten Ws verwendet. In einer weiteren Ausbildung werden zur Darstellung der Wörter Vt in den Daten Ws und Nachrichten TNF neben den betreffenden Sprachen L angepaßten Zeichen Z wie Buchstaben, Silbenzeichen, Satzzeichen und Wortabständen beziehungsweise in mündlichen Sprachen L entsprechenden prosodischen Elementen wie Betonungen, Tonhöhenänderungen oder Pausen auch bestimmte, unten im einzelnen definierte Operatoren o eingesetzt, welche bestimmte Abänderungen an ihnen gemäß ihren Positionen P zugeordneten weiteren Zeichen Z und deren Textabschnitten Tr a Z in Nachrichten TN bewirken, mit der Folge, daß, abhängig vom Textzusammenhang, die Wörter Vt in Nachrichten TN auch durch Zeichenkomplexe ZZ2 repräsentiert werden, die von den in den Daten Wp notierten Zeichenkomplexen ZZ1 abweichen.
Die in Verfahren M und entsprechend Mp als Komponenten Em der Nachrichten TN und TNF zu verwendenden Symbole werden allgemein als Gs bezeichnet. Hiervon werden als disjunkte Klassen K1 = (T) von Textabschnitten T zu bildende Symbole Gs wie Vt und Z auch Textsymbole Gt, bestimmte klassenbildende Superierungen K1 = (Gt) hiervon wie die Einheiten G auch grammatische Symbole Gr und für die Bildung semantischer Inhalte F einzusetzende Komponenten Em auch semantische Symbole Gp genannt. Als weitere Komponenten Em werden entsprechend den Möglichkeiten disjunkter Anordnungen, auch bestimmte, als Teilwörter bezeichnete Teile vt von Wörtern Vt sowie hieraus zu disjunkten Klassen superierte Teileinheiten g a G eingesetzt.
Von bekannt gewordenen, mit natürlichen Sprachen L befaßten, Verfahren und diesen zugrunde gelegten Grammatiken und Semantiken, wie sie auch oben zitiert wurden, unterscheidet sich die vorliegende, in Verbindung mit dem grammatischen Verfahren M anzuwendende Ausgestaltung des semantischen Verfahrens Mp auch dadurch, daß sie unter Einsatz von, als Symbole Gs einzusetzenden objektiven Wörtern Vt durchgeführt wird, welche vielfach von den für Schriftsprachen festgelegten lexikalischen Wörtern der betreffenden Sprachen L abweichen, also in Texten T beispielsweise auch durch nicht zusammenhängende oder aneinandergrenzende Textabschnitte T a Vt repräsentiert werden oder in Schriftsprachen L auch mehrere lexikalische Wörter oder nur Teile hiervon umfassen und gegebenenfalls auch Abstände und Satzzeichen mit einschließen. Als Folge hiervon werden sie, den Transformationen Qs und Q entsprechend, zu erfindungsgemäß einzusetzenden Superierungen Gr wie Einheiten G wie auch bestimmten Klassen K1 und Komplexen Kp hiervon zusammenfaßbar, die, wie oben für die Valenzen Um dargelegt, in bekannt gewordenen Sprachverfahren bisher nicht oder nicht ausreichend berücksichtigte, insbesondere auch quantitativ festzulegende, Eigenschaften H(G) aufweisen, welche jeweils für eine Vielzahl solcher Symbole Vt und diesen jeweils wieder zuordenbarer Textabschnitte Ts a Vt gelten, so daß die erfindungsgemäß einzusetzenden Symbole Gs, Gr, wie gegebenenfalls auch Gt unter Vermeidung kombinatorischer Explosionen durch nur schwach überproportional mit der Anzahl der berücksichtigten objektiven Wörter Vt und somit auch der darin anzutreffenden lexikalischen Wörter anwachsende Datenmengen beschreibbar werden.
In einer weniger vorteilhaften Ausgestaltung der Erfindung, bei der auf eine Anwendung des grammatischen Verfahrens M verzichtet wird und von Texten T ausgegangen wird, die beispielsweise als Folgen lexikalischer Wörter mit diese näher bestimmenden herkömmlichen grammatischen Bezeichnungen vorliegen, sieht Verfahren Mp vor, Daten Wp zu verwenden, bei denen den gemäß Verfahren, Mp zu verwendenden, vorzugsweise den Transformationen Qs entsprechenden Symbolen Vt solche lexikalische Wörter und Wortkombinationen zugeordnet werden, wobei in einem ersten Verfahrensschritt von Mp gemäß diesen Daten Wp diese Texte T vollständig als entsprechende Komplexe von Symbolen Vt dargestellt werden.
Die vorgesehene Anpassung der in Verfahren Mp einzusetzenden Symbole Vt und Gr und ihrer Eigenschaften H(Vt) und H(Gr) an die betreffenden natürlichen Sprachen L wird in einer bevorzugten Ausgestaltung dadurch erreicht, daß Symbole Vt verwendet werden, die in Texten T durch jeweils eine disjunkte Klasse K1 = Vt = (Ts) von Texten Ts repräsentiert werden, welche den oben genannten, nachfolgend beschriebenen Transformationen Qs genügen, deren Ergebnisse unter Mitwirkung von Experten, definitionsgemäß also Kennern der betreffenden Sprachen L wie auch der dadurch angesprochenen semantischen und pragmatischen Inhalte, universell an Texten T beliebiger Sprachen L beobachtbar und im Regelfall auch mit den Ergebnissen der dem grammatischen Kommunikationsverfahren M zugrunde gelegten Transformationen Q vereinbar sind. Von den für herkömmliche Transformationsgrammatiken ((12)) vorgeschlagenen Transformationen unterscheiden sich die Transformationen Qs wie auch Q bezüglich der vorgesehenen Maßnahmen, beobachtbaren Eigenschaften wie auch Ergebnisse.
Gemäß den Transformationen Qs gilt: Für ein in Texten T durch einen Textabschnitt Ts11z a Vt11 angezeigtes Symbol Vt11 mit zugeordneter disjunkter Masse K1 = (Fp11u) von semantischen Hinweisen Fp11u a Vt11 existieren einer oder mehrere, auch als Äußerungen T = Tp einsetzbare Texte T mit der folgenden Eigenschaft: Ein Text T = T1, der von Experten bezüglich eines ihm von diesen zugeordneten semantischen Inhalts F = F1 als korrekter Text T1 = Tf1 beurteilt wird, wird bei Verkürzung um einen kürzestmöglichen, nicht notwendig zusammenhängenden Textabschnitt T11, falls T11 = Ts11z und falls nicht, wie im anschließend beschriebenen Fall, T1 = Tsk gilt, in einen Text T2 mit zugeordnetem, von F1 abweichendem Inhalt F2 abgewandelt, der bezüglich F2 ebenfalls als korrekter Text T2 = Tf2 beurteilt wird, wobei bei jedem dieser Texte T2 die Verknüpfung des jeweiligen Inhalts F2 gemäß einem der semantischen Hinweise Fp11u a Vt11 mit einem diesem zugeordneten Sachbegriff K11u a Fp11u entsprechend einem diesem ebenfalls zugeordneten Verwendungshinweis q11u a Fp11u in ausreichender Näherung jeweils wieder den Inhalt F1 ergibt. Die Transformationen Qs fordern somit bei der vorgesehenen Abänderungen von Texten T um T11 die Einhaltung einer durch T1 = Tf1 und T2 = Tf2 gegebenen Invarianz I an solchen Textpaaren T1 und T2, welche durch Experten anzuzeigen ist, wobei die statistische Signifikanz und somit Objektivität der erzielten Ergebnisse durch Beobachtung einer ausreichend hohen Zahl von Experten durch beliebige Beobachter dieser Reaktionen feststellbar ist.
Diese Transformation Qs gilt als notwendige Bedingung dafür, daß das betreffende Symbol Vt11 mit untergeordnetem Rang R einem durch einen weiteren Textteil Ts' a T2 des Textes T2 angezeigten Symbol Vt' zugeordnet ist, sowie als hinreichende Bedingung dafür, daß kein durch einen weiteren Textteil Ts" a T1 angezeigtes weiteres Symbol Vt" vorliegt, welchem das Symbol Vt11 mit einem übergeordneten Rang Ra zugeordnet ist. Für die disjunkte Klasse K1 = (Ts11z) der Textabschnitte Ts11z a Vt11 des Symbols Vt11 gilt eine entsprechend disjunkte Klasse K1 = (Qs) von Transformationen Qs, bei welchen durch Verwendung des nämlichen semantischen Hinweises Fp11u a Vt11 jeweils der gleiche Inhalt F1 wiederhergestellt wird.
Abhängig von den natürlichen Sprachen L gehorcht ein Symbol Vt11 der Transformation Qs auch bei Anwendung auf weitere unterschiedliche, durch entsprechend unterschiedliche semantische Inhalte F1 gekennzeichnete Texte T1 = Tf1, welche durch Entfernen eines in T1 vorliegenden Textabschnitts T11z a Vt11 in Texte T2 = Tf2 mit entsprechend voneinander abweichenden Inhalten F2 abgewandelt werden, wobei jeweils auch unterschiedliche semantische Hinweise Fp11u einer disjunkten Klasse (Fp11u) a Vt11 zur Wiederherstellung der jeweiligen Ausgangsinhalte F1 Anwendung finden, welche sich sowohl hinsichtlich des Sachbegriffs K11u a Fp11u als auch des Verwendungshinweises q11u a Fp11u voneinander unterscheiden können. Abhängig vom für die betreffende Sprache L erzielbaren Ergebnis wird die Klasse (Fp11u) a Vt11 der semantischen Hinweise Fp11u dieses Symbols auch als disjunkte Klasse K1 der Permutationen der diesem Symbol Vt11 zugeordneten disjunkten Klasse K1 = (K11v) von Sachbegriffen K11v und ebenfalls zugeordneten disjunkten Klasse K1 = (q11w) von Verwendungshinweisen q11w notiert. In einer weiteren Darstellung wird den Sachen K11u a Vt11 auch jeweils eine disjunkte Klasse K1 = (q11uw) von Verwendungsweisen q11uw zugeordnet, woraus sich für Vt11 eine entsprechende Permutation von semantischen Hinweisen Fp11uv ergibt, bei denen Fp1111 durch K111 und q1111, Fp1112 durch K111 und q1112 usw., des weiteren Fp1121 durch K112 und q1111 usw. bestimmt ist.
Textabschnitte Ts a Vt von Symbolen Vt, für die Texte T = T1 existieren, die nur aus diesem Text gemäß T1 = Ts aufgebaut sind und bei Anwendung von Qs entsprechend auf T2 = 0 mit von F1 abweichendem Inhalt F2 = 0 verkürzt werden, werden auch als Textabschnitte Ts = (Tsk a Vtk) von Symbolen Vt = Vtk bezeichnet, welche wie in Verfahren M auch Kopf Vtk genannt werden, wobei auch hierfür Invarianz I als erfüllt definiert wird. Definitionsgemäß sind die Abänderungen von Texten T1 um Texte Tsk auch bei einem dabei resultierenden Text T2 = 0 mit entsprechenden Abänderungen von vorausgesetzten Sachverhalten Wk1 in Sachverhalte Wk2 verbunden.
Gemäß den Transformationen Qs wird von 2 in einer grammatischen Nachricht T1N1 in einer Anordnung Pr voneinander zugeordneten Symbolen Vt11 und Vt21 dem Symbol Vt21 ein gegenüber Vt11 höherer Rang Ra verliehen, wenn Vt21 nicht durch Anwendung der Transformationen Qs auf den Text T1 a T1N1 erzeugbar ist, wohl aber durch Anwendung der Qs auf einen Text T1' a T1'N1', in welchem durch, gegebenenfalls auch mehrfache, Anwendung der Qs auf T1 beziehungsweise daraus gebildete Texte T", T''' usw. der Textabschnitt Ts11z a Vt11 und somit auch Vt11 nicht mehr vorliegt. Vt11 gilt entsprechend als dem Symbol Vt21 in T1N1 rangtiefer oder auch abhängig von Vt21 zugeordnet. Bei Anwendung des grammatischen Verfahrens M, in welchem die als semantische Symbole Gp eingesetzten Symbole Vt zugleich auch objektive Wörter Vt a G darstellen, entsprechen solche Rangordnungen Ra auch den Rangordnungen, wie sie sich für die als Klassen K1 = G = (Vt) von Symbolen Vt gebildeten Symbole G aus den M zugrunde gelegten Transformationen Q bei solchen Texten T1 a T1N1 ergeben, wobei mit Vt11 a G1 und Vt21 a G2 gemäß G1 = An(G2) und Vt11 = An(Vt21) die Symbole G1 und Vt11 als Anhänger An von G2 beziehungsweise von Vt21 ausgewiesen werden. Entsprechend gilt mit G2 = Ar(G1) und Vt21 = Ar(Vt11) Einheit G2 beziehungsweise Symbol Vt21 als Träger Ar. In Anlehnung hieran werden die dem Symbol Vt11 zugeordneten Hinweise und Sachbegriffe ebenfalls als Anhänger An gemäß Fp11u = An(Fp21u) und K11u = An(K21u) und entsprechend Fp21 = Ar(Fp11) usw. als Träger Ar bezeichnet, wobei ein dem Vtk a Gk zugeordneter Sachbegriff K a Fp a Vtk entsprechend auch als Kopf Kk a F des Inhalts F a TNF fungiert.
Aus den genannten Transformationen Qs folgt weiterhin, auch wieder in Einklang mit den Transformationen Q, daß das durch den entfernten Textteil T11 repräsentierte, als Anhänger Vt11 = An(Vt21) oder als Kopf Vtk11 in einer grammatischen Nachricht T1N1 vorliegende Symbol Vt11 nicht zugleich als Träger Vt11 = Ar(Vt31) eines weiteren, im Text T1 durch einen Textabschnitt Ts31z a Vt31 repräsentierten Symbols Vt31 fungiert.
In einer bevorzugten Ausgestaltung werden nur solche Texte T11 a T1 einem durch einen semantischen Hinweis Fp111 a Vt11 gekennzeichneten Symbol Vt1 a G1 einer eigenen Einheit G1 zugeordnet, für welche mindestens 2 unterschiedliche Texte T1 = T1a und T1b mit unterschiedlichen Inhalten F1 = F1a und F1b existieren, in denen die Trägereinheit G2 = Ar(G1) durch unterschiedliche Symbole Vt2a und Vt2b repräsentiert werden, wobei die Inhalte F2 = F2a und F2b der jeweils durch Kürzung um Textabschnitt T11 resultierenden Texte Ts = T2a und T2b durch Kombination mit dem gleichen Hinweis Fp111 a Vt11 wieder in ihre Ausgangsinhalte F1a und F1b zurückverwandelt werden. Falls dagegen in dieser Sprache L nur ein Symbol Vt21 a G2 existiert, dem in Texten T1 Symbol Vt11 als Anhänger Vt11 = An(Vt21) zuordenbar ist, wird vorzugsweise der T1 zugeordnete Symbolkomplex Vt21Vt11 als Idiom Vtxy a Gx einer eigenen Einheit Gx zugeordnet, wobei, abhängig von den Ergebnissen der auf die weiteren Symbole Vt a G der Texte T1 usw. anzuwendenden Transformationen Qs, nicht ausgeschlossen wird, daß Gx = G2 festgelegt wird. Diese, unten auch an einem Beispiel erläuterte, Idiombildungsbedingung, wird auch als Transformation Qsa a Qs bezeichnet.
Die genannten, jeweils als eine disjunkte Klasse K1 = Gr1 = (Vt1y) von Symbolen Vt = Vt1y gebildeten grammatischen Symbole Gr = Gr1 genügen einer weiteren Klasse K1 von, unter Einhaltung der genannten Invarianzbedingung I durchzuführenden Transformationen Qs. Danach existiert zu jedem Text T1 a T1N1, in dessen Nachrichten durch, gegebenenfalls auch durch die genannte mehrfache, Anwendung der Transformation Qs ein Symbol Vt11 a Gr1 nachgewiesen wurde, ein Text (T3 = Tf3) a T3N1 mit von F1 abweichendem semantischem Inhalt F3 ne F1, der anstelle des durch die Transformation Qs, beziehungsweise durch die genannte Folge hiervon, nachgewiesenen Textabschnitts Ts11z a Vt11 a Gr1 einen Textabschnitt Ts1yz a Vt1y a Gr1 enthält, für den durch Anwendung der Transformation Qs, beziehungsweise Folge hiervon, also durch Kürzung um einen Textabschnitt T31 = Ts1yz, beziehungsweise auch nach Kürzung um weitere Textabschnitte Ts' a Vt' usw. weiterer in Nachricht T3N1 von Vt1y abhängiger Symbole Vt' usw., wieder Text T2 a T2N2 mit dem semantischen Inhalt F2 erzeugt wird, der durch einen semantischen Hinweis Fp1yu a Vt1y, beziehungsweise zusätzlich durch weitere Hinweise Fpu' a Vt' der Symbole Vt' usw. wieder in Inhalt F3 abgewandelt wird.
Die genannten Rangordnungen Ra wie auch Anordnungen Pr unterscheiden sich von den für herkömmliche Dependenzgrammatiken //12// vorgeschlagenen, beispielsweise für Abhängigkeitsrelationen zwischen natürlichen Wörtern benutzten Bezugsangaben. Für die weiterführende Beschreibung des erfindungsgemäßen Verfahrens Mp wird, wo nicht anders angegeben, ohne Einschränkung der Allgemeingültigkeit die Anwendung des Verfahrens M, insbesondere auch bei der Beschreibung der grammatischen Nachrichten TN a TNF der semantischen Nachrichten TNF zugrunde gelegt, wobei entsprechend bei den Anordnungen Pr der Symbole G = (Vt) die diesen zugeordneten Valenzen Um und deren Sättigungseigenschaften berücksichtigt werden.
Als Folge der im Regelfall anzutreffenden Vereinbarkeit der Transformationen Qs mit den ebenfalls auf Beobachtungen von Invarianzen I, welche die durch T = Tf gegebene einschließen, beruhenden Transformationen Q, durch welche die grammatischen Symbole Gr des grammatischen Kommunikationsverfahrens M definiert und bestimmbar werden, liefern die Transformationen Qs in Verbindung mit den Transformationen Q ein universell auf beliebige natürliche Sprachen L anwendbares Verfahren zur Festlegung von an diese Sprachen L angepaßten und für maschinelle Kommunikationsverfahren geeigneten Symbolen Gs mit Eigenschaften H(Gs), welche hierbei zugleich auch in einen grammatischen und einen semantischen Bereich unterschieden werden. Aus den Transformationen Q und Qs folgt, daß für beide Bereiche eine Beachtung lediglich formal-sprachlicher Kriterien bei Äußerungen Tp, wie sie durch Attribute wie "Akzeptierbarkeit" oder "Wohlgeformtheit" //3//, S. 157 ohne Bezug auf deren jeweils vorauszusetzende pragmatische Inhalte anderen dem gegenwärtigen Stand entsprechenden Sprachtheorien und -verfahren zugrunde gelegt wurden //12//, //1//, S. 234, nicht ausreicht. Hierbei machen es die durch Qs und Q festgelegten Eigenschaften H(Gs) möglich, die gestellte Kommunikationsaufgabe, gegebenenfalls auch unter Anwendung der genannten nichtlinearen Verarbeitungsoperationen Bb, mit einem der Speicher- und Verarbeitungskapazität verfügbarer Rechner angepaßten Aufwand zu lösen.
In Erweiterung der oben eingeführten Bezeichnungen werden Bezüge zwischen Textsymbolen Gt als syntaktisch oder auch grammatisch, zwischen Symbolen Gt und Gr einschließlich G als grammatisch, zwischen Symbolen Gp und Inhalten F als semantisch und zwischen Sachbegriffen K wie auch hieraus gebildeten Komplexen wie semantischen Inhalten F oder auch Sachverhalten Wk als pragmatisch bezeichnet. Entsprechend werden die eingeführten Symbole Gs = Vt sowohl als semantische, grammatische und Textsymbole Gp, Gr und Gt eingesetzt. Als Textsymbole Gt werden bevorzugt auch Zeichen Z mit Textmerkmalen H(T) eingesetzt, die in Standardäußerungen Tps mit ausreichend hohen Wahrscheinlichkeiten p(H(T)/Tps) vorkommen, wobei als Merkmale H(T) auch bestimmte Repertoires R wie auch Komplexe Kp hiervon verwendet werden, die auch Merkmalsvektoren genannt werden. Als Adressen Ad für Textsymbole Gt werden bevorzugt Merkmale H(T) verwendet, die diese Symbole mit ausreichend hohen Wahrscheinlichkeiten p(Gt/H(T)) anzeigen, welche vereinfachend auch p(Gt/T) notiert werden. Die Texte T a Gt wie Tr a Z und Ts a Vt werden auch dadurch festgelegt, daß sie um weniger als vorgegebene Toleranzen dT von Normtexten T = Ta wie Tra und Tsa abweichen.
Die erfindungsgemäße Verwendung von Symbolen Gs = Vt, deren Texte Ts a Vt durch, im Regelfall auch mehrfache, Anwendung der Transformationen Qs wie gegebenenfalls auch Q auf als Äußerungen Tp einsetzbare Texte T = Tf = Tp definiert und in den solchen Texten T zugeordneten grammatischen Nachrichten TN durch entsprechende Positionen P und Rangordnungen Ra gekennzeichnet sind, hat zur Folge, daß das Kommunikationsverfahren Mp mittels solchen Nachrichten TN zugeordneter semantischer Nachrichten TNF durchgeführt wird, welche prinzipiell in, im Regelfall mehreren, Stufen aus Nachrichten TuNuFu = T1N1F1, T2N2F2, T3N3F3 usw. aufzubauen sind, welche jeweils Untermengen T1N1F1 a T2N2F2, T2N2F2 a T3N3F3 usw. der höheren Aufbaustufen T2N2F2 usw. darstellen. Im Falle semantisch mehrdeutiger grammatischer Nachrichten TN ist hierbei unter einer Nachricht TuNuFu gegebenenfalls auch eine disjunkte Klasse K1 = (TuNuFuv) mehrerer semantischer Nachrichten TuNuFuv zu verstehen; dieser erfindungsgemäß ebenfalls abgedeckte Fall wurde in obiger Formulierung zur Vereinfachung vernachlässigt. Es existiert hierbei für jede semantische Nachricht TNF eine Nachricht T1N1F1 a TNF, deren grammatische Nachricht T1N1 aus dem Kopfsymbol Vt11 = (Vtk11 a Grk1) der Nachricht TNF mit zugeordnetem Text Tsk11z a Vtk11 gebildet wird. Den zugeordneten semantischen Inhalt F1 a T1N1F1 bildet mit Wahrscheinlichkeit p(K111/Vt11) = b eine Sache K111 a Fp111 eines Vt11 zugeordneten semantischen Hinweises Fp111 a Vt11, dessen Verwendungshinweis (q111 a Fp111) = c, wie oben ausgeführt, die Abwandlung der im vorauszusetzenden Sachverhalt Wk1 für K111 vorgegebenen Wahrscheinlichkeit p(K111) = a und gegebenenfalls weiterer von K111 abhängiger Wahrscheinlichkeiten p(Kw/K111) weiterer Sachen Kw gemäß dem resultierenden Wert p(K111) = b fordert, was zu einem entsprechenden Sachverhalt Wk2 = Wk21 führt. Eine weitere Nachricht T2N2F2 a TNF wird durch Hinzufügung eines vom Kopfsymbol abhängigen Symbols Vt21 = An(Vt11) in einer durch diese Rangordnung Ra und eine Positionierung P = P2 der Vt11 und Vt21 zugeordneten Textabschnitte Ts11z und Ts211z im Text T2 erzeugt, durch deren semantischen Inhalt F2 der nun für T2N2F2 als Sachverhalt Wk1 vorausgesetzte Sachverhalt Wk21 in einen resultierenden Sachverhalt Wk22 abgewandelt wird usw. Auch aufgrund der so möglichen Vorgehensweise bei der Erzeugung pragmatischer Sachverhalte Wk2 und diese übermittelnder, entsprechenden Nachrichten TNF zugeordnete Äußerungen T = Tp unterscheiden sich die Verknüpfungsstrukturen der zur Komplexbildung semantischer Nachrichten TNF, Botschaften F und pragmatischer Sachverhalte Wk2 verwendeten Komponenten Em von den für herkömmliche, beispielsweise für Konstituentenstruktur-Grammatiken //12//, vorgeschlagenen Strukturen.
Wie unten auch anhand von Beispielen ausgeführt wird, ist durch den prinzipiell in der beschriebenen Reihenfolge durchzuführenden Aufbau der erfindungsgemäß einzusetzenden semantischen Nachrichten TNF nicht grundsätzlich eine Reihenfolge vorgegeben, nach denen Komplexbildungen zu solchen Nachrichten TNF und Bestimmungen von Sachverhalten Wk gemäß Verfahren Mp in den jeweiligen Kommunikationsakten vorzunehmen sind. Wie für Verfahren der Computerlinguistik erwünscht //12//, S. 817, bietet Verfahren Mp vielmehr die Möglichkeit, nach unterschiedlichen Verarbeitungsstrategien und Reihenfolgen vorzugehen, wobei jedoch den betreffenden Sprachen L angepaßte, im einzelnen den Verwendungshinweisen q a Fp a Vt der Symbole Vt zugeordnete Hinweise zur Beachtung von Reihenfolgen von Komplexbildungen Kp = KK zu berücksichtigen sind. Solche Reihenfolgen für die Abwandlung von Sachverhalten Wk1 in Sachverhalte Wk2 folgen im Regelfall aus der Reihenfolge, nach der grammatische Nachrichten TN in Texten T zuzuordnenden Komplexen TN, TN solcher Nachrichten TN vorliegen. Des weiteren folgen Bedingungen für einzuhaltende Reihenfolgen im Regelfall auch in solchen Fällen, wo bei einer Inhaltsbildung F ein Wechsel von einer Menge A von Sachen K zu diese Mengen A ausschließenden Mengen B vorzunehmen ist, wie es für die sprachüblichen, unten weiter diskutierten Verneinungen mit q = f gefordert wird. Im Rahmen dieser sprachbedingten Festlegungen läßt Verfahren Mp Raum für unterschiedliche Verarbeitungsstrategien einschließlich Komplexbildungs-Reihenfolgen, welche effektive Abarbeitungen entsprechend den zu leistenden Kommunikationsakten, den verfügbaren Daten und den Kapazitäten der einzusetzenden Geräte ermöglichen. In einer vorteilhaften Ausbildung sieht Verfahren Mp vor, jeweils unter Beachtung der genannten Einschränkungen die Komplexbildung einer Nachricht TNF mit einer beliebigen, durch vorliegende Daten D mit ausreichender Wahrscheinlichkeit p(Em/D) angezeigten Komponente Em1 zu beginnen und mit beliebigen, durch die Daten D und in den Komplex Kp eingefügte, als Adressen Ad eingesetzte Komponenten Em1 mit ausreichenden Wahrscheinlichkeiten p(Em2/D) sowie p(Em2/Em1) angezeigten weiteren Komponenten Em2 fortzuführen. Weitere Strategien sehen beispielsweise vor, zunächst grammatische Nachrichten TN zu erstellen, denen in einer zweiten Phase semantische Inhalte F zugeordnet werden, wobei jeweils Komplexbildungen entweder in Richtung fallenden oder steigenden Rangs Ra eingeschlagen werden, und wobei jeweils ein Evidenzumfang D wie beispielsweise eine Textlänge T berücksichtigt werden, die mindestens 1, in einer weiteren Ausbildung auch mindestens 2, Komponenten Em anzeigen, die als Kopfsymbol Vtk a Gk eines Inhalts N einsetzbar sind.
Entsprechend der angeführten Definition der Sachen K als durch die, gegebenenfalls auch voneinander abweichenden, Meinungen der Kommunikationspartner Pa geprägte pragmatische Begriffe K, welche nicht notwendig mit objektiv nachweisbaren Tatbeständen übereinstimmen, sieht die Erfindung vor, bei der genannten Abwandlung vorausgesetzter Sachverhalte Wk1 gemäß Wk1 q K = Wk2 mit q = c die Möglichkeiten von Ungenauigkeiten wie auch Irrtümern zu berücksichtigen. Insbesondere werden hierbei, neben einer gemäß der nichtlinearen Datenverarbeitung Bb vorgesehenen Vernachlässigung bestimmter Inhalte F, resultierende Wahrscheinlichkeiten p(K) = 0 oder p(K) = 1 durch Werte a beziehungsweise 1 - a mit a kk 1 ersetzt. Beispielsweise werden so bei einer durch Wk1 oder die Daten Wp gegebenen Wahrscheinlichkeitsbeziehung p(K1) + p(K2) = 1 bei Vorliegen eines Textes T1 mit zugeordneter semantischer Nachricht T1N1F1, deren semantischer Inhalt F1, insbesondere auch bei Anwendung der nichtlinearen Vorgehensweise Bb, für Sache K1 eine Wahrscheinlichkeit p(K1) = 1 anzeigt, für den resultierenden Sachverhalt Wk2 Wahrscheinlichkeiten p(K1) = 1-a und p(K2) = a gewählt. In einer weiteren Ausbildung werden solche Ungenauigkeiten auch durch entsprechende Toleranzen dp der Wahrscheinlichkeiten p in den vorausgesetzten Sachverhalten Wk und Daten Wp berücksichtigt, wobei allgemein auch disjunkte Klassen K1 = (Wk1x) unterschiedlicher, dem Partner Pa möglicherweise zu unterstellender, Sachverhalte Wk1x vorausgesetzt werden können.
Wie oben bei der Beschreibung der Verwendungshinweise q a Fp a Vt ausgeführt, werden in den Daten Wp neben den Symbolen Vt zugeordneten Sachbegriffen K = K5 mit K5 a Fp a Vt auch weitere Sachbegriffe K = K11 verwendet, welche gemäß K5 a K11 Oberbegriffe der Sachen K5 darstellen, wobei vorteilhaft die Oberbegriffe K11 so eng definiert werden, daß für die Untermengen K5 ausreichend hohe Wahrscheinlichkeiten p(K5/K11) g pr oberhalb festzulegender Referenzwerte pr gelten. Hierbei werden insbesondere auch Oberbegriffe K11 verwendet, die als Vereinigung K11 = K5 s nK5 von K5 mit dessen Negation K6 = nK5 gebildet werden, wobei für deren Durchschnitt K5 d K6 = 0 gilt. Die oben angeführten, entsprechend den Eigenschaften von Sprachen L gemäß K5 f6 K6 zu leistenden Verneinungen von Sachbegriffen K5 werden entsprechend auch gemäß K6 = K11 m5 K5 durch Entfernung der Sachen K5 aus solchen Oberbegriffen K11 erreicht.
Zur Erläuterung dieser Verwendung von Oberbegriffen K wird das oben diskutierte Beispiel 1) durch ein Symbol Vt31 = /nicht/, mit Vt31 a G3, erweitert, welches, neben weiteren möglichen, in weiteren Inhalten N realisierbaren Anordnungen Pr hier in einer Anordnung Pr verwendet wird, die durch eine Rangordnung Ra gemäß Gr2 = Ar(G3) und eine Positionsangabe P = gr21 : Gr3 : gr22 näher bestimmt ist, wodurch sich das grammatische Symbol Gr2 = gr21gr22 als Komplex Kp zweier, oben eingeführter, Teilsymbole gr a Gr mit Teilwörtern vt a gr manifestiert, welche hier vt211 = /sind/, vt221 = /rot/ und vt222 = /schwarz/lauten, mit Vt21 = vt211vt221 und Vt22 = vt211vt222. Ein semantischer Hinweis Fp311 a Vt31 umfasse eine Sache K311 und einen Verwendungshinweis q311 = f, welche zusammen eine Verneinung einer durch den Träger Ar, hier Gr2, angezeigten Sache K2yu a Vt2y vorsehen, wobei diese Sache K2yu gegebenenfalls auch durch die semantischen Hinweise Fpxyu weiterer in einem oder mehreren Ästen As rangniedriger hierzu angeordneter Symbole Vtxy k Vt21 modifiziert sein kann. Bei einem mit Vt31 in Beispiel 1) zusätzlich möglichen Text T4 = /Schwarze sind nicht rot./, bei dem außer Vt11 auch Symbol Vt21 nun diskontinuierlich zur Textbildung beiträgt, wird der oben dem Text T2 = /Schwarze sind rot./ unter anderem zugeordnete Inhalt F = K113K212: "Neger sind sozialistisch orientiert" unter Verwendung einer weiteren, als Oberbegriff definierten Sache etwa im Sinne von K2121: ". . . sind politisch orientiert" in einen weiteren Inhalt F = K113K2122 mit K2122 = (K2121 m K212) etwa im Sinne von "Neger sind politisch nicht sozialistisch orientiert" abgewandelt, wobei K2121, wie oben vorgegeben, als eng gefaßter Oberbegriff von K212 a K2121 gemäß (K212 s K2122) = K2121 und (K212 d K2122) = 0 festgelegt wurde.
Man beachte, daß bei einer Erweiterung von Beispiel 1) durch ein weiteres, als Anhänger Gr4 = An(Gr2) von Gr2 einzusetzendes Symbol Vt41 = /immer/ mit Vt41 a Gr4 eine weitere Textbildung T5 = /Schwarze sind nicht immer rot./ möglich wird, für deren Inhalt N gemäß den Eigenschaften H(Gr3) und H(Gr4) eine Anordnung Pr mit Vt31 = An(Vt41) gilt und gemäß Fp311 eine Verneinung einer Sache K411 a Fp411 a Vt41 und nicht wie in T4 der Sache K212 vorzunehmen ist, wozu ein entsprechend anderer Oberbegriff K4111 = (K411 s nK411) einzusetzen ist.
Auch aus dem folgenden Beispiel 2) aus der mündlichen deutschen Sprache geht hervor, daß gemäß den Transformationen Qs und Q gebildete Symbole Vt sich häufig von den für eine Sprache L willkürlich festgelegten lexikalischen Wörtern unterscheiden. Hierzu werden zunächst die folgenden, durch Folgen von Kleinbuchstaben unter Verzicht auf Wortabstände angenäherten Texte T betrachtet: T1 = /einpaß/, T2 = /keinpaß/, T3 = /eingültigerpaß/, T4 = /keingültigerpaß/, T5 = /einungültigerpaß/ und T6 = /seinungültigerpaß/. Hierbei wird Text T5 als ausreichend synonym zu T4 beurteilt. Gemäß den Transformationen Q sind, jeweils mit Ts = Vt und Vtxy a Gx, diese und weitere Texte T = S unter Verwendung der folgenden objektiven Wörter Vt darstellbar: Vt11 = /einpaß/, Vt21 = /k/, Vt22 = /m/, Vt23 = /d/, Vt24 = /s/, Vt31 = /gültiger/ und Vt41 = /un/. Gemäß den Q gelten, jeweils mit Vt11 = Vtk11, T1 = Vt11, Vt21 = An(Vt11) in T2 und T4, Vt31 = An(Vt11) in T3, T4, T5 und T6, Vt41 = An(Vt31) in T5 und T6 sowie Vt24 = An(Vt11) in T6.
Diese als Ergebnisse der Transformationen Q erzielbaren Symbol-Festlegungen werden durch die Transformationen Qs auf folgende Weise ergänzt: Das objektive Wort Vt31 erhält einen Verwendungshinweis q311 a Fp311 a Vt31 = d für eine Durchschnittsbildung einer, gegebenenfalls durch Anhänger An(Vt31) modifizierten, Sache K311 a Fp311 mit einer dessen Träger Ar(Vt31) zugeordneten, gegebenenfalls durch weitere von diesem Träger Ar abhängige Symbole Vt modifizierten oder noch zu modifizierenden Sache K. Für die Wörter Vt22, Vt23 und Vt24 gelten ebenfalls solche Verwendungshinweise q221 = q231 = q241 = d für eine solche Durchschnittsbildung mit jeweils einer Sache K a Ar(Vt2y) ihrer Träger Ar(Vt2y). Dem Kopfsymbol Vtk11 kommt ein Hinweis q111 a Fp111 a Vt11 zu, der mit q111 = c das Ersetzen der Eigenschaften H(K)1 der Sachen K a Wk1 durch die Eigenschaften H(K)2 dieser Sachen K, wie sie sich bei den Komplexbildungen der Sachen K a Vt sämtlicher im betreffenden grammatischen Inhalt N vorliegender, von Vt11 abhängiger Symbole Vt a N untereinander und mit der Sache K111 a Fp111 a Vt11 ergeben. Weiterhin gilt q411 a Fp411 a Vt41 von Vt41 = /un/ die Verneinung q411 = f einer dem Träger Vtxy = Ar(Vt41) zugeordneten Sache K a Vtxy, welche, wie oben ausgeführt, gegebenenfalls auch durch weitere Sachen K a Vt weiterer als von diesem Träger Vtxy abhängig angeordneter Symbole Vt modifiziert sein kann. Im Text T5 ist dies nicht der Fall, so daß durch q411 a Fp411 hier die Negation einer mit der Eigenschaft "Gültigkeit" umschriebenen Sache K311 a Fp311 aa Vt31 erfolgt. Dem objektiven Wort Vt21 = /k/ werden dagegen 2 Verwendungshinweise q211 und q212 zugeordnet. Von diesen fordert, mit einer durch den oben angeführten Faktor qr reduzierten Wahrscheinlichkeit p, Hinweis q211 = f die Negation des Trägers Ar(Vt21), wie er zur Erzeugung des Inhalts F des Textes T2 benötigt wird. Daneben fordert, mit entsprechend höherer Wahrscheinlichkeit p, Hinweis q212 = f dem Sprachgebrauch folgend die Negation eines Sachbegriffs K a Vt eines Wortes Vt, das dem Träger Ar(Vt21) gegebenenfalls als weiterer Anhänger An(Ar(Vt21)) zugeordnet ist, wie es in Text T4 als Vt31 = An(Vt11) vorliegt, wobei q212 Bezugsdaten der Ordnung O(3) repräsentiert, welche die Beachtung einer entsprechenden Verknüpfungsreihenfolge fordern. Den Transformationen Q und Qs gemäß sieht Verfahren Mp alternativ aber auch die Verwendung von Daten Wp vor, bei denen Texte wie T3 einem eigenen, aus Teilwörtern Vt11 und Vt31 gebildeten Wort Vt111 zugeordnet werden, das in Text T4 wie auch im unten angeführten T7 jeweils durch Vt21 = An(Vt111) zu einer semantischen Nachricht TNF ergänzt wird.
Zu beachten ist in Beispiel 2) also, daß die genannte Verneinung in T4 dem Sprachgebrauch entsprechend im Regelfall semantisch nicht ausdrückt, daß "gar kein Paß, auch kein gültiger" angesprochen wird, sondern, wie in T5, "ein ungültiger Paß", also lediglich die Eigenschaft "Gültigkeit des Passes" negiert wird. Durch die angeführte, für das erfindungsgemäße Verfahren Mp vorgesehene Bildung möglichst eng gefaßter Oberbegriffe Ka zu Begriffen Kb a Ka mit möglichst hohen Wahrscheinlichkeiten p(Kb/Ka) g pr wird einer dem Sprachgebrauch gerecht werdenden Inhaltsbildung F von Negationen Kc f Kb gemäß Kc = Ka m Kb Rechnung getragen, wobei hier Ka als Vereinigung Ka = Kb s Kc der durch "gültiger Paß" und "ungültiger Paß" zu umschreibenden Sachkomplexe Kb und Kc gebildet wird.
Wie auch an dem weiteren Text T7 = /keinungültigerpaß/ des Beispiels 2) zu zeigen ist, umfassen die durch q211 und q411 definierten Verwendungshinweise zur Verneinung auch die Möglichkeit zur Darstellung von in Sprachen L nicht unüblichen doppelten Verneinungen, wobei auch hier von entsprechend eng zu definierenden Oberbegriffen K auszugehen ist.
Weitere Möglichkeiten zur Berücksichtigung sprachüblicher Wendungen sind durch die angeführte Verwendung numerischer Faktoren qr zu, den Sprachgebrauch wiedergebenden, Abänderungen der für die Komplexe Kp = F resultierenden Wahrscheinlichkeiten p(F) sowie durch Idiombildungen gegeben.
Bei einer Übertragung von Beispiel 2) auf die deutsche Schriftsprache L fordern teilweise willkürlich festgelegt Schreibregeln eine Wiedergabe beispielsweise des Textes T6 durch einen Schrifttext T6' = /Sein ungültiger Paß./, der sich aus lexikalischen Wörtern zusammensetzt, die ein Possessivpronomen, eine Flexionsform eines Adjektivs und ein Substantiv umfassen, wobei noch Modifizierungen durch Großschreibung und Zeichensetzung hinzukommen. Wie oben ausgeführt und unten an weiteren Beispielen erläutert, lassen diese lexikalischen Wörter keine mit dem erfindungsgemäßen Verfahren Mp vergleichbare Superierungen zu entsprechend daten- und aufwandsparend einsetzbaren grammatischen Oberbegriffen wie den erfindungsgemäßen Symbolen Gr wie auch G zu. Eine Anwendung der Transformationen Q und Qs führt jedoch auch bei Schrifttexten T zu, den obigen mündlichen Symbolen Vt a Gr entsprechenden, Symbolen Vt, die erfindungsgemäß entsprechend den zu beachtenden Rechtschreibregeln mit Hilfe der oben genannten, unten im Detail ausgeführten Operatoren o darstellbar werden. Analog zur mündlichen Sprache L ergeben sich die Symbole Vt11 = /gein Paß./, Vt24 = /_s=/, Vt31 = /_gültiger/ und Vt41/ = /_un=/, die sich zu entsprechenden Schriftsprachensymbolen Gr1, Gr2, Gr3 und Gr3 superieren lassen, welche wieder eine datensparende Erzeugung von Schrifttexten T mit erfindungsgemäß zugeordneten grammatischen und semantischen Inhalten N beziehungsweise F möglich machen. Hierbei ist beispielsweise der Text Ts = /_gültiger/ neben Gr3 auch weiteren Symbolen Grx zuzuordnen, andererseits aber umfaßt Symbol Gr3 datensparend die Eigenschaften einer Vielzahl weiterer eingeführter, als Symbole Vt zu verwendender Texte Ts = Vt.
Neben den genannten Vorgehensweisen beim Aufbau semantischer Nachrichten TNF, welche im Rahmen der angeführten, auch durch Verwendungshinweise q a Fp a Vt bedingten, Einschränkungen beliebige Reihenfolgen bei der Zusammenfügung der Komponenten Em a TNF zulassen, sieht die Erfindung in vorteilhaften Ausgestaltungen auch mehrere der folgenden, ebenfalls unter Beachtung der genannten Einschränkungen durchzuführenden Vorgehensweisen vor:
Bei der Bestimmung von durch einlaufende Texte T eines Partners Pa übermittelten Sachverhalten Wk2 werden diese Texte T durch den Hörer Hr zunächst vollständig durch Zuordnung, gegebenenfalls auch disjunkt mehrerer, grammatischer Inhalte N zu grammatischen Nachrichten TN ergänzt. Der Aufbau erfolgt beginnend von Kopfsymbolen Vt a G in Richtung fallenden Ranges. Alternativ hierzu erfolgt der Aufbau beginnend von mit ausreichend hohen Wahrscheinlichkeiten p(Em/D) durch die Daten D angezeigten Komponenten Em = (Vt a G) in beliebige Rangrichtungen. Die nachfolgende Ergänzung der Nachrichten TN zu semantischen Nachrichten TNF erfolgt ausgehend von den, den Ästen As mit niedrigstem Rang Ra zugeordneten, Symbolen Vt a G entlang dieser Äste As in Richtung steigenden Ranges Ra. Der Aufbau der Inhalte F a TNF erfolgt in der Reihenfolge der einem Text T zugeordneten Nachrichten TN. Der Aufbau eines Inhalts F a TNF eines aus mehreren Ästen As aufgebauten grammatischen Inhalts N a TN erfolgt in der Reihenfolge, in der die Äste As aufeinander folgen, in einer Ausbildung hiervon auch in der Reihenfolge der rangtiefsten Anhänger An dieser Äste As. In einer weiteren Ausbildung wird bei verzweigten Ästen As zuerst der kürzere Ast As hiervon bearbeitet. Ein vorausgesetzter Sachverhalt Wk1 wird stufenweise jeweils durch den Inhalt F a TNF in der Reihenfolge der Nachrichten TN in jeweils einen Sachverhalt Wk2 abgewandelt, der jeweils wieder als Sachverhalt Wk1 die a-priori- Wahrscheinlichkeiten p(K) für den in der folgenden Stufe zu bildenden Inhalt F' a T'N'F' und den daraus resultierenden Sachverhalt Wk2' liefert usw. Alternativ hierzu erfolgt, insbesondere bei umfangreichen, auch aus mehreren Ästen As zusammengefügten Nachrichten TN, die Abwandlung des Sachverhalts Wk1 stufenweise für jeden Ast As a TN in der Reihenfolge der Anordnungen der Äste As, wobei gegebenenfalls entsprechend den resultierenden abgewandelten Sachverhalten Wk abgewandelte a-priori-Wahrscheinlichkeiten p(K) für die dem jeweils nachfolgenden Ast As zugeordneten Sachen K a Fp a Vt a G a As eingesetzt werden. Erfindungsgemäß werden mit der Abwandlung der durch einen Sachverhalt Wk1 gegebenen Wahrscheinlichkeit p(K1) einer Sache K1 auch die Wahrscheinlichkeiten p(K2) der mit Sache K1 durch Wahrscheinlichkeitsbeziehungen p(K2/K1) verknüpften Sachen K2 entsprechend abgeändert.
Die Anpassung an die zu leistenden Kommunikationsakte sowie die verfügbaren Vorrichtungen und Daten Wp erfolgt bei disjunkt zu berücksichtigenden semantischen Hinweisen Fp a Vt a G, deren Vorliegen gegebenenfalls auch durch disjunkt unterschiedliche Symbole Vt a G entsprechend alternativ möglicher Nachrichten TN bedingt ist, eine Reduzierung der in entsprechenden Entscheidungsbäumen resultierenden Komplexbildungs-Möglichkeiten bei jedem Komplexbildungsschritt unter Anwendung der angeführten nichtlinearen Datenverarbeitung Bb, wobei Sachen K mit, durch vorliegende Daten D wie gegebenenfalls durch eine oder mehrere bereits verwendete Sachen K bedingte, Wahrscheinlichkeiten p(K) k ps1 unterhalb von Schwellwerten ps1 vorübergehend oder auch endgültig vernachlässigt werden. Weitere Reduzierungen der Repertoires R(Ks) der als Konkurrenzhypothesen Ks möglichen Sachkomplexe KK erfolgen nichtlinear nach Komplexbildungsstufen KK, wie sie nach Berücksichtigung der Hinweise Fp a Vt der Symbole Vt a N eines Inhalts N oder als Zwischenergebnisse auch der Symbole Vt a As a N eines Astes As hiervon erreicht werden, wobei jeweils der Komplex KK = F mit der höchsten, durch die Evidenz D und Daten Wp bedingten Wahrscheinlichkeit p(F)1 ge ps2 zur Erzeugung des jeweils als Kommunikationsergebnis dienenden Sachverhalts Wk2 verwendet wird. Bei Vorliegen mehrerer Inhalte F mit Wahrscheinlichkeiten p(F)2 nahe dem Höchstwert p(F1) werden entsprechend auch disjunkt mehrere Sachverhalte Wk2 berücksichtigt und der durch Vorgaben Vr bestimmten weiteren Verwendung zugeführt.
Bei der Übermittlung von Sachverhalten Wk2 durch Texte T an einen Partner Pa durch einen Autor At wird ein disjunktes Repertoire R(F) von als Komplexe F = KK aus Sachen K zusammengefügten Inhalten F bestimmt, welche jeweils einen beim Partner Pa vorauszusetzenden Sachverhalt Wk1, gegebenenfalls auch disjunkt mehrere solche Sachverhalte Wk1x, in den zu übermittelnden Sachverhalt Wk2 abwandeln, wobei gemäß den Daten Wp Sachen K a Fp a Vt berücksichtigt werden, die Wörtern Vt wie auch disjunkten Repertoires R(Vt) von Wörtern Vt der gemäß Vorgaben Vr zu verwendenden Sprache L zugeordnet sind wie auch die genannten, diesen auf angegebene Art zuzuordnenden Oberbegriffe K umfassen. Die Sachen K a Vt eines Inhalts F werden jeweils in einer Reihenfolge festgelegt, die mit einer, einem als Kopf Vt1 = Vtk1 zu verwendenden selbständigen Symbol Vt zuzuordnenden, Sache K beginnt und jeweils mit Sachen K a Vt2 von jeweils als Anhänger Vt2 = An(Vt1) der jeweils die vorausgehende Sache K a Vt1 anzeigenden Symbole Vt1 fortgeführt wird, wobei die selbständigen Valenzen Ums der Symbole Vt1 als Adressen Ad für die Symbole Vt mit zugeordneten Sachen eingesetzt werden und gemäß einer Adresse Ad jeweils disjunkt auch mehrere Symbole Vt mit für die Komplexbildung eines Inhalts F geeigneten Sachen K ausgewählt werden. Die Reihenfolge der Auswahl von Sachen K a Vt gemäß den Adressen Ad erfolgt in Richtung fallender Wahrscheinlichkeiten p der durch die Valenzen Um angezeigten Symbole Vt a G. Es werden bevorzugt aus Sachen K a Vt von Symbolen Vt a G zusammengefügte Inhalte F a R(F) verwendet, die sich aus diesen Symbolen Vt a G zu bildenden grammatischen Nachrichten TN mit ausreichend hohen Wahrscheinlichkeiten p(F/TN) und Eindeutigkeiten zuordnen lassen. Es werden bevorzugt Inhalte F verwendet, die sich aus einer möglichst geringen Anzahl von Sachen K a Vt von zu jeweils einer Nachricht TN zusammenfügbaren Symbolen Vt a Gr zusammenfügen lassen, wobei entsprechend den Erfordernissen auch Oberbegriffe K hiervon eingesetzt werden. Bei Übersetzungen werden Repertoires R(F) von Inhalten F verwendet, die sich als Komplexe F = KK von den Vokabeln Vq' a Vqq der Zielsprache L' zugeordneten Sachen K a Vq' zusammenfügen lassen, wobei einem Repertoire R(F) ein entsprechend disjunktes Repertoire R(R(Vq')) von Repertoires R(Vq') von Vokabeln Vq' a Vqq zugeordnet wird, deren Vokabeln Vqq in einem vorausgehenden Verfahrensschritt dem zu übersetzenden Text T der Ausgangssprache L zugeordnet wurden. Für die zu bildende Nachricht T'N'F' der Zielsprache L' wird ein zu übermittelnder Sachverhalt Wk2' zugrunde gelegt, der den durch die Nachricht TNF der Ausgangssprache L übermittelten Sachverhalt Wk2 ausreichend genau wiedergibt.
In Anpassung an die Eigenschaften der Sprachen L werden in einer weiteren Ausgestaltung der Erfindung, insbesondere bei der durch Hörer Hr vorzunehmenden Zuordnung semantischer Inhalte F zu bereits Texten T zugeordneten grammatischen Nachrichten TN, die Symbole Vt a TN derjenigen Äste As zuerst zur Inhaltsbildung herangezogen, deren rangniedrigste Anhänger Vt = An zum Kopf Vtk entsprechend den Positionen P der Textabschnitte Ts a Vt und ts a Vtk den geringsten Abstand aufweisen, wobei von gleich weit entfernten Symbolen Vt vorangestellte Symbole Vt vor den nachgestellten berücksichtigt werden.
In einer weiteren Ausbildung werden die Komplexbildungen TNF in Reihenfolgen vorgenommen, die sich nach der Verfügbarkeit der für die Bildung von Inhalten F zu berücksichtigenden Wahrscheinlichkeitsbeziehungen p(K) der angesprochenen Sachen K in den Daten Wp richten.
In einer weiteren Ausgestaltung werden bei der Zuordnung von semantischen Nachrichten TNF zu einlaufenden Texten T durch Hörer Hr die Komponenten Em in einer Reihenfolge nach fallenden, durch Wahrscheinlichkeiten p(Em/D; Wp) gegebenen Sicherheiten verwendet, mit denen sie durch vorliegende Evidenzen D unter Beachtung der Daten Wp einschließlich der Adressierungen Ad durch bereits berücksichtigte Komponenten Em angezeigt werden, wobei durch die Verwendungshinweise q gegebene Reihenfolgen berücksichtigt werden.
Die vorgesehene nichtlineare Datenverarbeitung Bb hat vorteilhaft zur Folge, daß die sowohl in der Rolle des Hörers Hr als auch des Autors At abzuarbeitende Vielfalt disjunkter Möglichkeiten bei der Komplexbildung von grammatischen Nachrichten TN und semantischen Nachrichten TNF aus entsprechend disjunkten Repertoires R(Em) von Komponenten Em, die grundsätzlich zu Entscheidungsbäumen mit annähernd exponentiell mit der Zahl der zum jeweiligen Komplex Kp zusammengefügten Komponenten Em anwachsenden Verzweigungen führen würde, frühzeitig an jeder Verzweigungsmöglichkeit auf eine handhabbar geringe, beispielsweise jeweils nur eine oder zwei Alternativen umfassende, jeweils als Konkurrenzhypothesen Ks betrachtete Lösungen beschränkbar bleibt. Hierbei macht es die vorgesehene vorläufige Zurückstellung von zunächst weniger wahrscheinlichen Teillösungen Ks möglich, in solchen Fällen, wo bei weiterführenden Komplexbildungen keine ausreichend wahrscheinlichen Komplexbildungen Kp erzielbar sind, zunächst zurückgestellte Lösungen Ks zu reaktivieren und so zu insgesamt ausreichend wahrscheinlichen Endergebnissen TNF zu kommen. Erfindungsgemäß werden in einer weiteren Ausgestaltung gemäß Vorgehensweise Bbr von Bb auch Konkurrenzhypothesen Ks zurückgestellt, bei denen die Komponente Em a Ks des betreffenden Komplexbildungsschritts zu wenig Information j k js zum semantischen Inhalt F beiträgt. Die infolge der den Symbolen Gs zugrunde gelegten Transformationen Q mögliche Beschreibung ihrer Eigenschaften H(Gs) durch Daten überwiegend niedriger Ordnung O(n) macht es weiterhin möglich, die Kappung möglicher Lösungszweige j eweils bereits nach n-1 Komplexbildungsschritten vorzunehmen, bei Daten der Ordnung O(2) also nach jeweils einem Schritt.
Wie oben bereits für den Fall von Negationen gezeigt, sieht Verfahren Mp allgemein vor, in den Daten Wp zusätzlich zu den in den semantischen Hinweisen Fpxyz a Vtxy der Symbole Vtxy enthaltenen Sachen Kxyu a Fpxyu weitere Sachen Kv zu berücksichtigen, die zu den Sachen Kxyu ausreichend hohe Wahrscheinlichkeitsbezüge p(Kv/Kxyu) g p1 aufweisen. Dies wird beispielhaft wieder an 2 Einheiten Gx der mündlichen deutschen Sprache erläutert, bei denen G1 die, hierfür schriftdeutsch ausgedrückten, Symbole Vt11 = /Menschen/, Vt12 = /Früchte/, Vt13 = /Bücher/, Vt14 = /Brillen/, Vt15 = /Schreiner/ und Vt16 = /Zeugnisse/ und G2 das Symbol Vt21 = /gute/ umfaßt. Neben den diesen Symbolen Vtxy zugeordneten, hier nicht explizit umschriebenen Sachen Kxyu a Fpxyu a Vtxy wird eine Sache Kv = Ka berücksichtigt, wie sie etwa durch Ka: "eine für Menschen wichtige Funktion oder Eigenschaft" ausdrückbar ist. Den Sachen Kxyu werden außerdem Sachen Kxyu1 zugeordnet, welche näherungsweise als K1111: "moralische Qualität", K1211: "Geschmack", K1311: "Lesenswertheit", K1411: "optische Qualität", K1511: "handwerkliches Geschick" und K1611: "geprüfte Fähigkeit" zu bezeichnen sind. Hinweis Fp211 a Vt21 umfaßt eine Sache K211: "eine durch einen Träger Vt1y = Ar(Vt21) angezeigte Sache Ka ist in einem befriedigenden Ausmaß anzutreffen" und einen Verknüpfungshinweis q211 = d für eine Durchschnittsbildung mit einer Sache K1y11 a Vt1y des Trägers Vt1y. Angenommen werden vergleichsweise hohe bedingte Wahrscheinlichkeiten p(Kxyu1/Kxyu) g p1, p(Ka/Kxyu) g p1 und p(K211/Ka) g p1. Für die mit G1 = Gk1 = Ar(G2) mündlich zu bildenden Sätze S = Vt21Vt11 = /gute Menschen/, Vt21Vt12 = /gute Früchte/, Vt21Vt13 = /gute Bücher/, Vt21Vt14 = /gute Brillen/, Vt21Vt15 = /gute Schreiner/ und Vt21Vt16 = /gute Zeugnisse/ ergeben sich so die intuitiv zugeordneten Inhalte F als Komplexe K1yuK1yu1KaK211 der betreffenden Sachen K etwa im Sinne von "moralisch gute Menschen", "wohlschmeckende Früchte", "lesenswerte Bücher", "scharfe Brillen", "geschickte Schreiner" und "Zeugnisse mit guten Noten", während andere Sachkombinationen, wie sie bei anderen, die Transformationen Qs nicht beachtenden Inhaltszuordnungen zu den genannten Wörtern formal resultieren können, etwa im Sinne von "moralisch gute Früchte" oder "wohlschmeckende Menschen" usw., vermieden werden. Einzelheiten der hierfür zugrunde gelegten Komplexbildungen KK, bei denen insbesondere Durchschnitte gemäß q = d der Begriffe Kxyu, Kxyu1, Kq und K211 zu bilden sind, werden an weiteren Beispielen unten erläutert. Im vorliegenden Fall erweist es sich insbesondere als vorteilhaft, daß hierbei datensparend eine bedingte Wahrscheinlichkeit p(K211/Ka) bei der Bildung sämtlicher Inhalte F Anwendung findet.
Die Formulierung der Eigenschaften H(K) der zu verwendenden Sachen K a Fp erfolgt entsprechend den, auch durch Vorgaben Vr näher bestimmten, Gegebenheiten der zu führenden Kommunikation, bezüglich derer die Partner definitionsgemäß in Interaktion treten, wobei diese gegebenenfalls auch als Nutzer fungieren und erfindungsgemäß menschliche wie auch maschinelle Nutzer zu berücksichtigen sind. So werden in einer Ausbildung, welche eine natürlichsprachige Kommunikation mit als Partner Pa eingesetzten Elektronenrechnern leistet, Sachen K und Komplexe F = KK hiervon mit definierten Symbolgehalten entsprechend den von Rechnern zu lösenden Aufgaben verwendet, wie sie aus hierfür eindeutig definierten Kommandosprachen bekannt sind. Für menschliche Nutzer, in einer Ausbildung auch für Partner Pa, werden für Sachen K und deren Verknüpfungen q neben definierten Symbolen gegebenenfalls auch in der betreffenden Sprache L vorzunehmende verbale Umschreibungen verwendet, welche so ausführlich ausgeführt werden, daß ausreichend eindeutige Unterscheidungen unterschiedlicher Sachen K und hieraus gebildeter Komplexe F und Sachverhalte Wk resultieren wie auch eine definitionsgemäß vorgesehene, gegebenenfalls auch durch Vorgaben Vr näher bestimmte, Interaktion zwischen den Kommunikationspartnern Pa auf ausreichend eindeutige Weise möglich wird. Bei der Formulierung der Sachen K a Fp a Wp ist hierbei zu beachten, daß ihre Verknüpfungen gemäß den Hinweisen q a Fp wieder pragmatische Inhalte F und Daten Wk ergeben, die mit den von Experten der Sprachen L und der damit zu behandelnden Sachverhalte Wk erkannten Inhalten F ausreichend übereinstimmen, wobei, wie beispielhaft angeführt, die Sachen K auch unter Verwendung weiterer Begriffe A einschließlich Sachen K wie Oberbegriffen, Untermengen, Komplementen usw. formuliert werden und entsprechend den durch Wahrscheinlichkeiten höherer Ordnung p(K/K') usw. gegebenen Bezügen die Daten Wp definitionsgemäß auch Komplexe Wk = KK solcher Komplexe KK mit den Eigenschaften H(KK) enthalten.
In einer an die zu leistenden Kommunikationsakte angepaßten Ausgestaltung werden Daten Wp mit einem beschränkten Repertoire R(K) von Sachbegriffen K verwendet, welches den durch Sachverhalte Wk beschreibbaren Sachgebieten angepaßt ist, die in der Kommunikation angesprochen werden. In einer hieran angepaßten Ausbildung wird dabei ein Repertoire R(Vt) von Symbolen Vt berücksichtigt, denen die Sachen K dieses Repertoires R(K) mit ausreichend hohen Wahrscheinlichkeiten p(K/Vt) g ps zugeordnet sind, sowie von weiteren Symbolen Vt, die in Äußerungen Tp, bezogen auf eine Standardlänge Tps, mit ausreichend hohen Wahrscheinlichkeiten p(Vt/Tps) zu erwarten sind. In Anpassung an die Gegebenheiten der Kommunikation werden hierbei beispielsweise Sachgebiete berücksichtigt, welche die Bestellung und Lieferung bestimmter Waren- und Dienstleistungssortimente, die Produktion bestimmter Güter, Transportangebote für Güter und Menschen, Terminabsprachen, die Bedienung bestimmter Maschinen einschließlich Rechnern oder auch Auskunfteien betreffen.
Entsprechend der erfindungsgemäß vorgesehenen Zuordnung semantischer Nachrichten TNF sowohl zu einlaufenden wie auch ausgehenden Texten T sind die Komplexbildungen hierzu durch sämtliche gemäß Verfahren Mp sowohl als Hörer Hr wie auch Autor At maschinell arbeitende Kommunikationspartner Pa, welche beispielsweise als Gesprächspartner, Übersetzer, Dolmetscher, Stenotypist oder Korrektor eingesetzt sind, vorzunehmen, denen somit hierfür die Daten Wp zur Verfügung zu stellen sind, welche gegebenenfalls die genannten Daten Ws und Wst einschließen.
Die gemäß Verfahren Mp vorgesehene Beachtung der Anordnungen Pr der Symbole Vtxy a Gx a N in einem grammatischen Inhalt N bei einer gemäß einem Verknüpfungshinweis qxyu a Fpxyu a Vtxy eines Symbols Vtxy vorzunehmenden Verknüpfung einer Sache Kxyu a Fpxyu mit weiteren Sachen Kxyu' weiterer Symbole Vtxy' a Gx' a N wird allgemein durch Einhaltung der folgenden Bedingungen Bc erreicht, welche unter Zugrundelegung von gemäß Verfahren M erstellten grammatischen Nachrichten TN formuliert wird: Sache Kxyu wird auf eine durch Hinweis qxyu angezeigte Weise mit einer oder mehreren Sachen Kxyu' a Vtxy' verknüpft, welche, mit Vtxy' a Gx' a Gw' sowie Gx' a Gw', einer oder mehreren Klassen K1 = Gw' = (Gx') von Einheiten Gx' angehören, die ebenfalls durch Hinweis qxyu vorgegeben sind, wobei eine solche Einheit Gx' der Einheit Gx im gleichen Ast As des Inhalts N am rangnächsten in einer ebenfalls durch Hinweis qxyu vorgegebenen Rangrichtung zugeordnet ist. Bedingung Bc schließt die Möglichkeit ein, daß anstelle einer dem Symbol Vtxy' zugeordneten Sache Kxyu' auch ein Sachkomplex Kxyu" zur Verknüpfung mit Kxyu vorzusehen ist, der durch Verknüpfung von Kxyu' mit weiteren Sachen Kxyu''' weiterer im Inhalt N mit Vtxy' a Gx', insbesondere rangniedriger verknüpfter, Symbole Vtxy''' a Gx''' modifiziert wurde, wobei gegebenenfalls auch, wie oben angeführt, den Sprachen L angepaßte Reihenfolgen zu berücksichtigen sind.
In Anpassung an die Gegebenheiten der Sprachen L und die verfügbaren Vorrichtungen werden bestimmte, in Nachrichten TNF in ausreichender Häufigkeit vorkommende Komplexe VtVt von Symbolen Vt mit zugeordneten Komplexen KK von diesen Symbolen Vt zugeordneten Sachen K auch als Idiome eingesetzt, welche als zusätzliche, jeweils einem weiteren grammatischen Symbol Gr zugeordnete Symbole Vt1 = VtVt mit jeweils zugeordneten semantischen Hinweisen Fp1 und diesen zugeordneten Sachbegriffen K1 = KK und Verwendungshinweisen q1 a Fp1 Verwendung finden. Hierdurch wird auf Kosten eines geringfügig erhöhten Speicheraufwandes eine Reduzierung des Verarbeitungsaufwandes bei der Bildung der Nachrichten TNF erreicht.
In einer weiteren Ausbildung werden, soweit die Eigenschaften der Sprachen L dies zulassen, den Symbolen Vt Verwendungshinweise q zugeordnet, welche Verknüpfungen des betreffenden, einem Ast As zugeordneten Symbols Vt1y a G1 mit Symbolen Vt2y a G2 von Einheiten G2 dieses Astes As vorgeben, welche darin in einer bestimmten Rangrichtung, beispielsweise ranghöher, angeordnet sind. Hierbei bestimmt beispielsweise im Fall G1 k G2 ein Hinweis q1yu a Fp1yu a Vt1y a G1 die Verknüpfung eines Symbols Vt1y mit einem Symbol Vt2y a G2. Der damit verbundene Verzicht auf eine zusätzliche Zuordnung von Hinweisen q2yu zu den Symbolen Vt2y a G2 für deren Verknüpfung mit den Wörtern Vt1y a G1 der rangtieferen Einheiten G1 hat eine vorteilhafte Datenersparnis bei der Beschreibung der Symbole Vt in den Daten Wp zur Folge.
Die Bildung semantischer Nachrichten TNF durch Zuordnung semantischer Inhalte F zu Texten T mit zugeordneten grammatischen Nachrichten TN unter Anwendung des oben beschriebenen Bayesschen Ansatzes Ba wird im folgenden Beispiel 3) zunächst für den Fall grammatisch eindeutiger, entsprechend eindeutig identifizierter und eindeutigen Nachrichten TN zugeordneter, Texte T a TN erläutert, die hier zunächst abstrakt formuliert und unten durch reale Texte T konkretisiert werden. Betrachtet werden zunächst 2 Einheiten G1 und G2, die in einem Inhalt N1 in einer, durch die Valenzen Um dieser Einheiten vorgegebenen, Anordnung Pr1 gemäß G1 = Gk1 = Ar(G2) entsprechend einer Positionierung P1 = G2 : G1 vorliegen, wobei hier zunächst jeweils ein Wort Vt11 a G1 und Vt21 a G2 berücksichtigt wird, so daß Inhalt N1 ein Satz S11 a N1 = Vt21 Vt11 zugeordnet ist. Entsprechend gilt hier neben Text T1 auch Nachricht T1N1, Inhalt N1 und Satz S1 als mit Sicherheit, also p = 1 vorliegende Evidenz D. Berücksichtigt werden Inhalte F, die aus Sachen K a Fp a Vt gebildet werden, die durch die Evidenz D, hier also durch die Komplexe S der Wörter Vt a N1, a priori mit ausreichend hohen Wahrscheinlichkeiten p(K/Vt) g ps oberhalb festzulegender Schwellwerte ps angezeigt werden. Hierbei sind Vt11 zwei Sachen K111 a Fp111 a Vt11 und K112 a Fp112 a Vt11 zugeordnet. Symbol Vt21 zeigt einen semantischen Hinweis Fp211 a Vt21 an, der eine Sache K211 a Fp211 und einen Verwendungshinweis q211 a Fp211 umfaßt, der eine Verknüpfung von K211 gemäß (Klyu a Ar(G2)) q211 K211 mit q211 = d fordert. Der Evidenz D = S11 = Vt21Vt11 sind somit a priori zwei Inhalte F111 = K111 d K211 und F112 = K112 d K211 mit Wahrscheinlichkeiten p(F111) = p(K111) × p(K211/K111; Pr1) und p(F112) = p(K112) × p(K211/K112; Pr1) zuzuordnen, worin Pr1 die oben angeführte Anordnungsbedingung anzeigt. Für die in Ba weiterhin benötigten Werte p(D/F) gilt hier, mit D = Vt21Vt11, p(D/Fu) = p(Vt21/K211) × p(Vt11/K11u) mit u = 1 oder 2.
Gemäß vorliegenden, einen vorausgesetzten Sachverhalt Wk1 einschließenden Daten Wp gelte, mit t kk 1, für die in Ba einzusetzenden a-priori- Wahrscheinlichkeiten in ausreichender Näherung p(Kxyu) = t3 und, unter der vorgesehenen Beachtung von Bedingung Bc1, weiterhin p(K211/K111) = t, p(K211/K112) = t3 und p(Vt21/K211) = 1, sowie, wie unten begründet, p(Vt11/K111) = ½ und p(Vt11/K112) = 1 /2. Gemäß Ba folgt p(F111/D) ue 1 und p(F112/D) ue t2, wobei Ne ue t4/2. Für die beiden Konkurrenzhypothesen Ks1 = F111 und Ks2 = F112 folgt bezüglich der vorliegenden Evidenz D also p(Ks1/D gg p(Ks2/D).
Beispiel 3) dient auch zur Erläuterung der in einer der genannten Ausbildungen des erfindungsgemäßen Verfahrens Mp vorgesehenen nichtlinearen Verarbeitung Bb der gemäß Ansatz Ba bestimmten Wahrscheinlichkeiten p(F/D). Verfahrensteil Bb sieht vor, bei Konkurrenzhypothesen Ksx a (Ksx) einer definitionsgemäß disjunkten Klasse K1 = (Ksx) Wahrscheinlichkeiten p(Ksx) ge pr oberhalb eines festzulegenden Referenzwertes pr, gegebenenfalls auch bis auf p = 1, zu erhöhen und Werte p(Ksx) k pr, gegebenenfalls auch auf p = 0, abzusenken, wobei die Einhaltung der Wahrscheinlichkeitssumme Ca für diese Hypothesen Ksx berücksichtigt wird. In der genannten bevorzugten Ausbildung werden Referenzwerte pr so festgelegt, daß sie um einen bestimmten Faktor b k 1 unterhalb der Wahrscheinlichkeit p(Ks1) der Hypothese Ks1 mit der höchsten Wahrscheinlichkeit p(Ksx) liegen. Wird entsprechend im vorliegenden Beispiel 3) ein Wert b = t gewählt, so folgt p(Ks1/D) = 1 und p(Ks2/D) = 0. Aufgrund der vorliegenden Evidenz D wird somit die Wahrscheinlichkeit p(K111 d K211) dafür, daß K111 und K211 zusammen vorliegen, gegenüber einem a priori gemäß den Daten Wp vorauszusetzenden Sachverhalt Wk1 von einem Wert p = t4 auf einen durch Sachverhalt Wk2 ausgedrückten Wert p = 1 erhöht.
Gemäß einer oben angeführten Ausgestaltung der Erfindung werden Sachverhalte Wk durch eine aus mehreren grammatischen Symbolen Vt a G zusammengefügte Evidenz D = TN auch stufenweise in weitere Evidenzen Wk abgewandelt, wobei eine Reihenfolge beginnend mit dem Kopf G1 = Gk1 einzuhalten ist, die mit einem Anhänger G2 = An(G1) und weiteren Anhängern von G2 wie gegebenenfalls auch von Gk1 fortgeführt wird. Im angeführten Beispiel ergeben sich so zunächst Sachverhalte Wk2 = Wk2', bei denen aufgrund der Evidenz D = Vt11 Wahrscheinlichkeiten p(K111/D) = ½ und p(K112/D) = ½ gelten, die bei der anschließenden Berücksichtigung des Anhängers G2 = An(G1) in Sachverhalte Wk2 = Wk3' abgewandelt werden, für die sich hier wieder die oben genannten Wahrscheinlichkeitswerte p ergeben.
Im allgemein zu berücksichtigenden Fall eines grammatisch mehrdeutigen Textes T, der als Evidenz D einer disjunkten Klasse (TN, TN) von Folgen grammatischer Nachrichten TN zuzuordnen ist, ist vorgesehen, im Ansatz Ba entsprechende weitere a-priori-Wahrscheinlichkeiten der Form p(T/N) und entsprechend p(T/N, N) zu berücksichtigen. In einer vorteilhaften Ausführungsform wird gemäß dem Prinzip der maximalen Entropie für diese Wahrscheinlichkeiten Gleichverteilung angenommen, f 64848 00070 552 001000280000000200012000285916473700040 0002010015858 00004 64729alls keine hiervon ausreichend stark abweichenden, beispielsweise aus dem grammatischen Verfahren M resultierenden Hinweise vorliegen.
Die erfindungsgemäß vorgesehene Verwendung von, in den Nachrichten TNF zugleich als Textsymbole Gt, grammatische Symbole Gr und semantische Symbole Gp einzusetzenden, Symbolen Vt, denen jeweils eine disjunkte Klasse K1 = (Gp) alternativ geltender semantischer Hinweise Fp zugeordnet ist, die sowohl unterschiedliche Sachbegriffe K als auch unterschiedliche Verwendungshinweise q hierfür umfassen, erlaubt es einerseits, die für natürliche Sprachen L typische semantische Vieldeutigkeit einzelner Textabschnitte T in ausreichendem an die Sprachen L angepaßtem Maß wiederzugeben, während andererseits die vorgesehene Berücksichtigung quantitativer Eigenschaften H(Vt) einschließlich H(K) der Symbole Vt und Sachbegriffe K in Verbindung mit den quantitativen Verarbeitungsverfahren Ba und Bb zugleich eine effektive und sichere Festlegung des durch einen solchen Textabschnitt T in einer Nachricht TNF übermittelten semantischen Inhalts möglich macht, wobei die für Sprachen L charakteristische Abhängigkeit dieses Inhalts vom jeweiligen Kontext berücksichtigt wird, wie er durch weitere Textabschnitte T dieser Nachricht TN sowie durch die betreffende, durch einen vorausgesetzten pragmatischen Sachverhalt Wk1 beschriebene Situation gegeben ist. Dabei hat diese Zuordnung jeweils mehrerer semantischer Hinweise Fp zu einem Symbol Vt vorteilhaft zur Folge, daß in einer Sprache L eine große Vielfalt von semantischen Inhalten F und pragmatischen Sachverhalten Wk durch eine vergleichsweise geringe Zahl von Symbolen Vt dargestellt und übermittelt werden kann, vorausgesetzt, daß der Speicher- und Verarbeitungskapazität verfügbarer Vorrichtungen anpaßbare Vorgehensweisen zu deren Kombination bereitstehen, wie sie durch das erfindungsgemäße Verfahren Mp aufgezeigt werden. Dabei erlaubt es die vorgesehene Verwendung von Wörtern Vt, die zugleich als grammatische Symbole Gr und als semantische Symbole Gp fungieren, solche Kombinationen sowohl aufgrund grammatischer, syntaktische Zusammenhänge berücksichtigender, Eigenschaften H(Gr) wie auch zusätzlich aufgrund semantischer und pragmatischer Eigenschaften H(Gp) einschließlich H(K) zu erzeugen, woraus eine erhöhte Sicherheit bei der Zuordnung semantischer Nachrichten TNF insbesondere auch bei gestörten oder nicht normgerecht oder fehlerhaft abgefaßten Texten resultiert. Verfahren Mp schließt nicht aus, zusätzlich zu den genannten Daten H(Vt) weitere vorliegende Daten beispielsweise über statistische Eigenschaften H(Gt) von Textsymbolen Gt wie Zeichen Z oder Zeichenkomplexen ZZ zu berücksichtigen, wie sie beispielsweise in den genannten, beim gegenwärtigen Stand verwendeten Markov-Wahrscheinlichkeiten für die Aufeinanderfolge solcher Komplexe ZZ einschließlich lexikalischer Wörter vorliegen.
Zur datensparenden Berücksichtigung der in Sprachen L anzutreffenden Abhängigkeit der Schreib- beziehungsweise Ausspracheweise der zu verwendenden Wörter Vt vom jeweiligen Textzusammenhang werden diese Wörter Vt in den Daten Wp auch unter Verwendung der oben genannten, auch in Verfahren M benutzten Operatoren o notiert, welche in Texten T bestimmte Abänderungen bewirken und darin im Regelfall verschwinden. Hiervon fordert o = /g/ die Großschreibung des ersten einem Text T a Su von Sätzen Su a N angehörigen Worttextes Ts a Vt a Su a N sowie die Einhaltung eines Abstands zu einem diesem vorangestellten Textabschnitt T. Operator o = /_/ fordert die Einhaltung eines, auch durch einen Zeilenwechsel gewährleisteten, Abstands zu einem vorangestellten Text T, o = /=/ die Zusammenschreibung als Präfix oder Suffix mit einem angrenzenden Text T unter Aufhebung eines diesem gegebenenfalls zugeordneten Abstandszeichens, wobei eine Großschreibung dieses Textes T gegebenenfalls vom Präfix übernommen wird. Weitere den jeweiligen Sprachen L angepaßte Operatoren o sehen beispielsweise im Englischen die Verlängerung des lexikalischen Wortes /a/­ zu /an/ vor Vokalen vor usw. Operatorfunktionen werden beispielsweise auch bestimmten Satzzeichen zugeordnet, welche beispielsweise den Wegfall angrenzender Satzzeichen fordern, ohne im Text T zu verschwinden. Eine weitere Dateneinsparung bei der Speicherung objektiver Wörter Vt a G in den Daten Wp wird auch durch deren Notation als Komplexe Vt = vtvt der genannten Teilwörter vt erreicht, welche, in entsprechenden Komplexen G = gg angeordneten, Teileinheiten g = (vt) zugeordnet werden.
Zur weiteren Erläuterung des erfindungsgemäßen Verfahrens Mp werden die Wörter Vt des obigen Beispiels 3) durch Texte Ts a Vt aus der deutschen Schriftsprache L konkretisiert, welche durch ihre Normtexte Tsa, notiert auch als Tsaxy = Vtxy, repräsentiert werden, die mit Hilfe der genannten Operatoren o als Folgen von Druckbuchstaben und eingeführten Satzzeichen Z notiert werden. Entsprechend der hierfür angenommenen Eindeutigkeit fallen die so notierten Wörter Vt und Wortfolgen VtVt als eindeutige Evidenzen D an. Den angeführten Daten Wp des Beispiels 3) werden zunächst die objektiven Wörter Vt11 = vt111vt121vt131 = /gPflaumen./ mit vt111 = /g/, vt121 = /_Pflaumen/ und vt131 = /./ sowie Vt21 = /_reife/ zugeordnet, die zum Satz S11 = vt111Vt21vt121vt131 = /Reife Pflaumen./ kombiniert werden. Hierbei gilt G2 = An(G1), wobei diese Anordnung Pr durch eine Positionsangabe P = g11 : G2 : g12 näher bestimmt ist, bei welcher G2 definitionsgemäß weitere gegebenenfalls von G2 abhängige Einheiten G mit einschließt.
Die den Symbolen Vt von Beispiel 3) zugeordneten Sachen K a Fp a Vt werden hier durch die folgenden, mit Hilfe nicht explizit ausgeführter Mengen und Obermengen A beschriebenen Umschreibungen charakterisiert: K111 = "Früchte der Art A11; K112 = "Menschen A12 mit mangelhafter Leistung A21 a A2 in beliebigen Disziplinen A2"; K211 = "den Reifegrad A3 von Früchten A11 betreffende Eigenschaft A31". Die für Inhalt F111 von S11 vorzunehmende Durchschnittsbildung F111 = K111 d K211 wird entsprechend verkürzt als Mengenbildung A11 d A31 des Inhalts "gemäß A31 reife Früchte der Art A11" umschrieben. Für F112 = K112 d K211 folgt ein durch "gemäß A3 reife Minderleister A12 der Art A21" umschriebener Inhalt, dem den Daten Wp zufolge, wie oben ausgeführt, eine im Vergleich zu p(F111) äußerst geringe Wahrscheinlichkeit p(F112) zukommt. Die in den Daten Wp durch p(Vt11/K11u) = ½ angenäherten Wahrscheinlichkeiten drücken aus, daß K111 auch durch ein oben nicht angeführtes Wort Vt12 mit dem Teilwort vt122 = /Zwetschgen/ und K112 auch durch ein weiteres Teilwort vt123 = /Flaschen/ angezeigt werden kann.
Wird in Beispiel 3) für das Symbol Vt21 zusätzlich ein weiterer Hinweis Fp212 = (K212; q212) mit q211 = d und K212 etwa im Sinne von "nicht mehr entwicklungsfähig und somit reif für die Ablösung durch andere Personen" mit p(K212/K112) = t berücksichtigt, so folgt für den weiteren möglichen Inhalt F113 = K112 d K212 annähernd p(F113/D) = p(F111/D). Wird ferner die Möglichkeit berücksichtigt, daß dem Satz S11, etwa durch eine vorangegangene Aussage oder geltende Situation, ein von den allgemeinen Daten Wp abweichender Sachverhalt Wk1 vorauszusetzen ist, wonach mit hoher Wahrscheinlichkeit p(K112) = (1-pa), mit pa kk 1, zu erwarten ist, daß besagte "Minderleister der Art A21" angesprochen werden, so folgt sogar p(F113/D) g p(F111/D). Hinweis Fp212 wird im folgenden vernachlässigt.
Weitere Verwendungsarten der pragmatischen Hinweise Fp werden an einer Erweiterung des Beispiels 3) um ein objektives Wort Vt31 = /_un=/ mit Vt31 a G3 ersichtlich, bei dem der oben angeführte Operator o = /=/ eine Zusammenschreibung von Ts311 = Vt31 als Präfix eines einem Träger Ar(G3) zugeordneten Wortes wie Vt21 a G2 fordert. Zusammen mit Vt11 und Vt21 wird so ein Satz S21 = vt111Vt31Vt21vt121vt131 = /Unreife Pflaumen./ mit S21 a N2 möglich, worin N2 durch G2 = An(G1) und G3 = An(G2) bestimmt ist. Gemäß Fp311 a Vt31 ist, mit q311 = f, die oben behandelte Verneinung K21u f K311 des Inhalts K2yu a Vt2y a G2 des Trägers G2 = Ar(G3) zu bilden. Wie oben erläutert, gilt für die durch den Oberbegriff A3 = "den pflanzlichen Reifegrad betreffend" charakterisierte Sache K211 = A31 a A3 die Beziehung A31 s A32 = A3, wobei A32 für die Negation von A31, also für "unreif" steht, für welche in ausreichender Näherung p(A31/A3) + p(A32/A3) = 1 gelte. Ferner gelte p(K211/K111) = p(A3/K111) × p(A31/A3) = t mit p(A3/K111)= a, p(A31/A3) = b und a × b = t sowie p(K311/K211, K111) = p(A3/K111) × (1 - p(A31/A3)) = a × (1-b). Da p(A3/K112) ue p(K211/K112) = t3, folgt gemäß Ba und Bb auch für S21 ein einziger pragmatischer Inhalt F211 mit ausreichender Wahrscheinlichkeit p(F211/D)), der mit "Früchte A11 ohne Reife A31" zu umschreiben ist.
In Anpassung an den Sprachgebrauch lassen sich die Daten Wp des Beispiels 3) durch eine weitere Sache K213a Fp213 a Gp21 a Vt21, ebenfalls mit q213 = d, ergänzen, wonach das Wort /_reif/ auch "einen hohen Entwicklungsgrad von Perfektion A22 in einer beliebigen Disziplin A2" anzeigen kann. Bei Berücksichtigung von K213 läßt sich der Evidenz S21 neben F211 ein weiterer Inhalt F212 etwa des Sinnes "unterentwickelte Nichtskönner" zuordnen, da den hierfür benötigten Wahrscheinlichkeiten p(K112), p(A2/K112) und (1 - p(A22/A2)) ausreichend hohe Werte zukommen, so daß p(F212/S21) uep (F211/S21) folgt.
Zur weiteren Erläuterung der Funktion der Verwendungshinweise q wird Beispiel 3) durch eine weitere Einheit G4 mit den Wörtern Vt41 = /_und große/ und Vt42 = /_und grüne/ erweitert. Gemäß dem angewandten grammatischen Kommunikationsverfahren M werden hierbei grammatische Symbole Vt eingesetzt, die im Einklang mit den dem Verfahren M und Mp zugrunde gelegten Transformationen Q aus mehreren natürlichen Wörtern zusammengesetzt sind, wogegen, ebenfalls im Einklang mit den Q, das oben angeführte Wort Vt31 einen Teil eines natürlichen Wortes repräsentiert. Für die beiden semantischen Symbole Gp4u a Vt4u werden, mit u = 1 oder 2 und v = 1 oder 2, jeweils 2 pragmatische Hinweise Fp4uv berücksichtigt, die jeweils die gleiche Sache K4u1 = K4u2, jedoch jeweils 2 unterschiedliche Verknüpfungshinweise q4ul und 14u2 beinhalten. Hierzu gilt q411 = q421 = G4 d (Ar(G4)) d Ar(Ar(G4))) mit G1 a Ar(Ar(G4))) und G2 a Ar(G4), wobei die angeführten Einheiten Gx die durch den Satz Sa N angezeigten Hinweise Fpxyu a Gpxy a Vtxy a Gx a N symbolisieren. Weiterhin gilt mit dieser Symbolik q412 = q422 = (G4 d Ar(Ar(G4))) s (Ar(G4) d Ar(Ar(G4))). Die zugeordneten Sachen K41v a Gp41 a Vt41 werden durch K41v = "ein bestimmtes Ausmaß A71 einer Eigenschaft räumliche Ausdehnung A7" und K42v = "eine bestimmte Ausprägung A81 einer Eigenschaft Farbe A8" umschrieben. Betrachtet werden die Sätze S31 = /Reife und große Pflaumen./ und S32 = /Reife und grüne Pflaumen./ mit S31 a N3 und S32 a N3, wobei der grammatische Inhalt N3 durch Erweiterung von N1 um den zusätzlichen Anhänger G4 = An(G2) erzeugt wird. Bezogen beispielsweise auf Satz 31 zeigt q411 also an, daß ein Durchschnitt von Vt41 mit dem Durchschnitt von Vt21 und Vt11 zu bilden ist, während q412 die Vereinigung des Durchschnitts von Vt41 und Vt11 mit dem Durchschnitt von Vt21 und Vt11 fordert. Entsprechend sind also für die beiden Sätze S3u jeweils 2 semantische Inhalte F3uv in Betracht zu ziehen, wenn hier die oben berücksichtigten Sachen K112 und K121 vernachlässigt werden. Gemäß Ansatz Ba sind dabei, mit u = 1 oder 2, a priori zunächst die folgenden 4 Wahrscheinlichkeitswerte zu berücksichtigen:
p(F3u1) = p(K111) × p(K211/K111) × p(K4u1/K211, K111) und
p(F3u2) = p(K111) × p(K211/K111) + (p(K4u1/K111)-pu),
worin pu = p(K211/K111) × p(K4u1/K211, K111) die Wahrscheinlichkeit des Durchschnitts von K211 und K4u1 unter den angeführten Bedingungen anzeigt.
Neben obigen Daten Wp gelte
p(K411/K211, K111) = 0,8,
p(K421 /K211, K111) = t2 und p(K4u1/K111) = t.
Hiermit folgt p(F311) = 0,8t4, p(F312) = 1,2t4, p(F321) = t6 und p(F322) ue 2t4. Unter der vereinfachenden, dem Sprachgebrauch allerdings häufig nicht entsprechenden Annahme, daß für die in Ba weiterhin zu berücksichtigenden Wahrscheinlichkeiten p(S/F) einheitlich gleich hohe Werte p(S3u/F3uv) = a, beispielsweise mit a = 1 zu setzen seien, folgt bei Satz S32 für Inhalt F321, wonach von "Pflaumen, die zugleich reif und grün sind," die Rede ist, eine sehr geringe Wahrscheinlichkeit p(F321/S32) = 0,5t2, während sich für F322, wonach "reife Pflaumen und zusätzlich grüne Pflaumen" angesprochen sind, p(F322/S32) ue 1 ergibt. Bei Satz S31, der gemäß Verfahren M, auch dem intuitiven Urteil von Experten entsprechend, als grammatisch identisch mit Satz S32 eingestuft wird, würden sich so dagegen für die Inhalte F311 = "Pflaumen, die zugleich reif und groß sind" und F312 = "reife Pflaumen und zusätzlich große Pflaumen" annähernd gleich hohe Wahrscheinlichkeiten p(F311/S31) = 0,4 und p(F312/S31) = 0,6 ergeben.
Da jedoch Inhalt F321 aufgrund zu beachtender a-priori-Wahrscheinlichkeiten durch Satz S32 praktisch nicht ausdrückbar ist, ist dem Sprachgebrauch entsprechend p(S32/F321) kk 1, im einzelnen auch p(Vt42/Fp421; Fp211) kk 1 zu setzen. Gemäß Expertenurteil wird ferner durch Satz S31 nicht Inhalt F312, sondern F311 ausgedrückt, wonach sich also ein Sprachgebrauch entwickelt hat, der durch p(S31/F311) gg p(S31/F312) gekennzeichnet ist. Wird für die Daten Wp entsprechend beispielsweise p(S31/F311) = 0,8 und p(S31/F312) = 0,2 festgelegt, so folgen aus Ba dem Expertenurteil besser entsprechende Werte p(F311/S31) ue 0,7 und p(F312/S31) ue 0,3.
Um eine datensparende Formulierung der Daten Wp zu erreichen, sieht die Erfindung vor, semantischen Hinweisen wie den Fp4yu a Vt4y der Wörter Vt4y einer Einheit G4, soweit die betreffende Sprache L dies zuläßt, weitgehend identische Verknüpfungshinweise, hier also q4yu1 = d und q4yu2 = s zuzuordnen. Wegen der bei einem gemäß Wp vorliegenden Repertoire R(Vtxy) kombinatorisch mit den Symbolen Vtxy explodierenden Möglichkeiten von Satzbildungen S = VtVt werden ferner die genannten, für die Wahrscheinlichkeitsbestimmung gemäß Ba benötigten, Wahrscheinlichkeiten p(S/F) als Produkte von Termen p(Vtxy/Fpxyu) gebildet, die in den Daten Wp annähernd linear mit der Zahl der Wörter Vt anwachsen. Werden so beispielsweise in Beispiel 3) vereinfachend Werte p(Vt1y/Fp1yu) = 1, p(Vt2y/Fp2yu) = 1, p(Vt4y/Fp4yu1) = 1 und p(Vt4y/Fp4yu2) = 0,1 festgelegt, wobei, wie oben, q4yu1 = d und q4yu2 = s gilt, so folgen für die genannten Sätze S31 = vt111Vt21Vt41vt121vt131 und S32 = vt111Vt21Vt42vt121vt131 hieraus Zuordnungswahrscheinlichkeiten p(S31/F311) = 1, p(S31/F312) = 0,1, p(S32/F321) = 1 und p(S32/F322) = 0,1. Mit den oben berechneten Werten p(F) ergeben sich bei S31 Wahrscheinlichkeiten p(F311/S31) = 0,87 und p(F312/S31) = 0,13, wonach der mit q = d gebildete Inhalt F als angezeigt gilt. Für S32 folgen unter der Annahme t = 0,1 dagegen Wahrscheinlichkeiten p(F321/S32) = 0,05 und p(F322/S32) = 0,95, wonach, ebenfalls im Einklang mit einem Expertenurteil, der mit q = s gebildete Inhalt F als ausgedrückt gilt.
Entsprechend einer der genannten Ausgestaltungen sieht die Erfindung auch vor, bei Verwendungshinweisen q die Verknüpfungsparameter wie q412 a Fp412 a Vt41 und q422 a Fp422 a Vt42 von Beispiel 3) durch Parameter qr zu ergänzen, welche eine numerische Reduzierung der bei der Verknüpfung der Sachen K41w a F41 beziehungsweise K42w a F42 mit den Sachen K der Wörter Vt2y a G2 und Vt1y a G1 dieses Beispiels erzielten Wahrscheinlichkeiten p(KK) der betreffenden Komplexe KK bewirken. Wird beispielsweise dem Sprachgebrauch entsprechend (qr a Fp412) = 0,1 gesetzt, so folgt, nun wieder unter der Annahme p(D/F) = 1, intuitionsgerecht p(F311/S31) = 0,87 und p(F312/S31) = 0,13. Mit diesem qr-Wert bleibt zugleich bei Satz S32 die Beziehung p(F321/S32) kk p(F322/S32) gewahrt, wie es der Expertenmeinung entspricht. Beispielsweise folgen so bei einem Wert t = 0,1 Wahrscheinlichkeiten p(F321/F32) = 0,05 und p(F322/S32) ue 1.
Zur weiteren Erläuterung der durch Verfahren Mp gegebenen Möglichkeit, im Einklang mit dem intuitiven menschlichen Sprachgebrauch durch Kombination an sich mehrdeutiger Textabschnitte T mit quantitativ bestimmbarer Sicherheit und Eindeutigkeit eine Vielzahl unterschiedlicher semantischer Inhalte F und pragmatischer Sachverhalte Wk kontextgerecht auszudrücken, wird Beispiel 3) durch weitere Symbole Vt erweitert. Betrachtet werden, jeweils wieder mit Vtxy a Gx, die Wörter Vt14 = vt111vt124vt131 = /gForscher./ und Vt15 = vt111vt125vt131 = /gGeschwindigkeiten./ mit den Sachen K141 a Fp141 a Vt44) = "Menschen A12, die eine Forschungstätigkeit A51 wahrnehmen" und (K151 a Fp151 a Vt15) = "den Zeitablauf A61 beliebiger Vorgänge A6 betreffend". Weiterhin gilt Vt22 = /_große/ mit der bereits Vt41 zugeordneten Sache K221 = K411 = "Ausmaß A71 einer räumlichen Ausdehnung A7". In Anpassung an den Gebrauch dieser Sprache L wird Vt22 wie auch Vt41 noch eine weitere Sache (K222 a Fp222) = (K412 a Fp412) zugeordnet, die als "bestimmtes Ausmaß A91 einer beliebigen Eigenschaft A9 betreffend" umschrieben wird. Für sämtliche Verknüpfungsparameter gilt q21z = q41z = d. Dem oben betrachteten grammatischen Inhalt N1 sind so die weiteren Sätze S12 = Vt22Vt14 = /Große Forscher./ und S13 = Vt22Vt15 = /Große Geschwindigkeiten./ hinzuzufügen. Nach den hierfür in Betracht gezogenen semantischen Hinweisen Fp läßt sich S12 zum einen ein Inhalt F122 = K141K222 im Sinne von "hoch befähigte Forscher A12A51" zuordnen, zum anderen scheint zunächst wegen der Bedeutungsmöglichkeiten K221 = "räumlich groß" von Vt22 disjunkt auch ein Inhalt F121 im Sinne von "hochgewachsene Forscher" nicht unmöglich. Es erweist sich jedoch p(F122/S12) gg p(F121/S12), wenn die gemäß Ba zu berücksichtigenden Werte p(Fxyu) × p(S12/Fxyu) verglichen werden. Im einzelnen ergeben sich mit den eingeführten Oberbegriffen A unter Berücksichtigung entsprechend bereitzustellender Daten Wp für die den Aufbau von Inhalt F122 bestimmenden Terme ausreichend hohe Wahrscheinlichkeiten p(F122) = p(A12A51A91) = p(A12) × p(A51/A12) × p(A91/A51), wobei hier A51 = A9. Weiterhin gelten auch ausreichend hohe Werte p(S12/F122) = p(Vt14/A12A51) x p(Vt22/A91) für die Zuordnung der gewählten Wörter Vt zu diesem Inhalt. Der alternative Inhalt F121 ist dagegen als Sachkomplex F121 = K141A7K221 = A12A51A7A71 darzustellen, da sich nur so aufgrund der angesprochenen Begriffe und diese verknüpfenden Bezüge eine ausreichend hohe Wahrscheinlichkeit p(F121) = p(A12) × p(A51/A12) × p(A7/A12) × p(A71/A7) finden läßt. Die Wortwahl S12 wird bei Inhalt F122 = "großartige Forscher" durch ausreichend wahrscheinliche Terme gestützt gemäß p(S12/F122) = p(Vt14/A12A51) x p(Vt22/A91). Dagegen ergibt sich für F121 = "hochgewachsene Forscher" ein nicht ausreichend wahrscheinlicher Wert p(S12/F121) = p(Vt14/A12A51A7) x p(Vt22/A71) für den ersten Produktterm, da zwar Vt22 häufig zum Ausdruck räumlicher Größe benutzt wird, nicht jedoch das Wort Vt14 = /gForscher./, wenn bei "Menschen A12" nicht nur ihre "Forschertätigkeit A51", sondern zusätzlich auch ihre "räumliche Ausdehnung A7" angesprochen werden soll.
Auch in Satz S13 = /Große Geschwindigkeiten./ ist nicht vom "Ausdehnungsaspekt A7" von Sache K221 a Vt22 die Rede, da für einen hierfür zugrunde zu legenden Inhalt F132 = K151A7K221 mit K151 = A6A61 in der hierfür zu bildenden Wahrscheinlichkeit p(F132) = p(A6) × p(A61/A6) × p(A7/A6) × p(A71/A7) dem Term p(A7/A6) k ps und so auch p(F 132) k ps keine ausreichend hohen p-Werte zukommen. Angesprochen wird durch S 13 also eindeutig ein Inhalt F131 = K151K222 = A6A61A91 mit A61 = A9, der im Wortsinn "hohe Geschwindigkeiten" bedeutet, bei dessen Wahrscheinlichkeit p(F131) = p(A6) x p(A61/A6) × p(A91/A9) für alle Terme ausreichend hohe p-Werte anzunehmen sind.
Die Vielfalt der in Verfahren Mp durch Kombination mehrdeutiger Symbole abdeckbaren Sprachinhalte, die sich in Verfahren Mp durch Kombination semantisch mehrdeutiger Symbole jeweils eindeutig abdecken lassen, wird weiter verdeutlicht durch Ergänzung des Beispiels 3) durch eine weitere Einheit G5, deren Möglichkeiten grammatischer Anordnungen Pr unter anderem durch eine Rangangabe G2 = Ar(G5) und Positionsangabe P = Ar(G5) : G5 beschrieben werden. Betrachtet werden die Wörter Vt51 = /, große/ und Vt52 = /,grüne/, denen semantische Hinweise Fp5uv mit Sachen K511 = K411 und K521 = K421 sowie gleiche Verwendungshinweise q511 = q521 = d zur Durchschnittsbildung d der Sache KSuv mit einer Sache Kxyu a Vtxy a G1 eines Wortes Vtxy der rangnächsten ranghöheren Einheit Gx g G5 zugeordnet sind, wobei definitionsgemäß Sache Kxyu durch Sachen K a Vt a G weiterer Anhänger G = An(Gx) modifiziert sein kann. Einem entsprechend gebildeten Satz S41 = /Reife, große Pflaumen./ wird hiermit eindeutig ein Inhalt F411 = F311 zugeordnet, zu dessen Darstellung somit S41 wegen der Mehrdeutigkeit des oben gebrachten Satzes S31 vorzuziehen ist, woraus auch, dem Gebrauch der deutschen Sprache L entsprechend, die oben angeführte geringe, für Ansatz Ba benötigte, Wahrscheinlichkeit p(S31/F311) folgt. Dem mit Vt52 erzeugbaren Satz S42 = /Reife, grüne Pflaumen./ wird mit den genannten Daten ein Inhalt F421 = F321 im Sinne etwa von "grün und trotzdem reif" eindeutig zuordenbar, während der gleiche Inhalt F321 wegen seiner, gemäß Ba zu berücksichtigenden geringen sachlichen Wahrscheinlichkeit p(F321) = p(F421) durch den oben genannten Satz S32 praktisch nicht ausdrückbar ist.
Die aus der Einführung der Teileinheiten g a G vorteilhaft resultierende Datenersparnis bei der Formulierung der Daten Wp wird bei der Berücksichtigung einer weiteren Einheit G6 = g11g61g12g13 in Beispiel 3) deutlich, welche unter Verwendung der für G1 benützten Teileinheiten g11, g12 und g13 und einer Teileinheit g61 mit Teilwörtern vt61y a g61 wie vt611 = /_die/ und vt612 = /_diese/ usw. formuliert wird. Bei Verwendung einer weiteren Einheit G7 mit Wörtern wie Vt71 = /_reifen/, Vt71 = /_großen/ usw. werden mit G6 = Gk6 und G7 = An(G6) bei Beachtung einer Positionierung P = g61 : G7 : g12 hiermit Sätze wie S51 = /Die reifen Pflaumen./ usw. möglich. Daß Einheit G6 von Einheit G1 grammatisch zu unterscheiden ist, folgt beispielsweise auch daraus, daß Anordnungen Pr mit G2 = An(G6) und G7 = An(G1) zu nicht korrekten Texten T ne Tf wie T = /Die reife Pflaumen./ beziehungsweise T = /Reifen Pflaumen./ führen würden.
Die erfindungsgemäße Bewältigung sprachüblicher Mehrdeutigkeiten wird auch aus einer weiteren Erweiterung des Beispiels 3) durch eine Einheit G8 mit Verbformen der 3. Person Plural wie Vt81 = /_schmecken/ und G9 mit Adverbien wie Vt91 = /_gut/ und Vt92 = /_sauer/ ersichtlich. Gemäß den Daten Wp gelte für die Anordnungen Pr neben weiteren Möglichkeiten G8 = An(G1) und G9 = An(G8) mit entsprechenden Positionsangaben P, wonach Sätze wie S61 = /Pflaumen schmecken./, S71 = /Pflaumen schmecken gut./ und S72 = /Pflaumen schmecken sauer./ möglich werden. Den Transformationen Qs entsprechend werden Vt81 disjunkte semantische Hinweise Fp811 mit einer Sache K811 und Fp812 mit einer Sache K812 = K811 d K911, beide mit einem Verknüpfungsparameter q811 = q812 = d zur Durchschnittsbildung mit einer Sache K a Ar(G8) zugeordnet. Weiter gilt für Vt91 ein Hinweis Fp911 mit Sache K911 und für Vt92 ein Hinweis Fp921 mit Sache K921, beide mit q911 = q921 = d für die Durchschnittsbildung mit einem Sachkomplex KK mit Sachen K a Ar(G9) und K a Ar(Ar(G9)). Hierbei werden, jeweils wieder vereinfachend, Autorenmeinungen angezeigt, wonach bei K811 eine gemäß q811 verknüpfte Sache "beliebig auf die Geschmacksnerven wirkt", bei K911 "einem gemäß q911 verknüpften Sachkomplex eine angenehme Wirkung zukommt", und bei K912 "eine als sauer empfundene Wirkung zukommt". Unter Sache K111 a Vt11 werden wie oben die "Früchte" verstanden. Dem Sprachgebrauch entsprechend wird also Vt81 neben K811 eine weitere Sache K812 = K811 d K911 im Sinne von "angenehm auf die Geschmacksnerven wirkend" zugeordnet.
Mit entsprechenden Daten Wp wird für Satz S61 ein semantischer Inhalt F611 = K111 d K812 = K111 d K811 d K911 im Sinne von "Pflaumen schmecken gut" gegenüber dem pragmatisch wahrscheinlicheren, semantisch aber weniger wahrscheinlichen Inhalt F612 = K111 d K811 im Sinne von "Pflaumen schmecken irgendwie" bevorzugt, da der Unterschied der in Ba einzusetzenden pragmatischen Werte gemäß p(K812/K111) k p(K811/K111) durch den in Ba entgegen wirkenden Unterschied im Sprachgebrauch gemäß p(Vt81/K812) gg p(Vt81/K811) überkompensiert wird. Trotz dieses Sprachgebrauchs zeigt Wort Vt81 in den Sätzen S71 und S72 nicht K812, sondern K811 an, da in S71 die Bildung eines Inhalts F711 = K111 d K811 d K911 = F611 durch Hinzufügung der Sache K911 a Vt91 zu Inhalt F611 a S61 wegen p(F71) = p(F611) keine Information j hinzufügen, also Bedingung Bbr verletzen würde. In Satz S72 würde sich bei Hinzufügung von Sache K921 a Vt92 zu F611 wegen p(K921/K911) ue 0 für einen mit K812 zu bildenden pragmatischen Inhalt F722 = K111 d K812 d K921 wegen p(K921/K812) kk 1 eine entsprechend zu vernachlässigende pragmatische Wahrscheinlichkeit p(F722) ue 0 ergeben. Wie aus dem weiteren Textbeispiel /Köche schmecken den Unterschied./ folgt, kann ein Textabschnitt t = /_schmecken/ auch als transitive Verbform Vt eingesetzt werden, welche gemäß Verfahren M einem anderen als dem angeführten Symbol Vt81 a G8 zuzuordnen ist und entsprechend weitere, in Beispiel 3) nicht berücksichtigte semantische Hinweise Fp anzeigt. Daß das in Beispiel 1) als Wort (Vt31 a G3) = /_nicht/ eingeführte Symbol nicht ebenfalls der Einheit G9 des Beispiels 3) zuordenbar ist, folgt aus weiteren Texten T mit Abschnitten wie /. . . schmecken sehr gut/, in denen bei den Transformationen Q bei Ersatz von /_gut/ durch_/nicht/ Invarianzbedingungen I verletzt würden.
Die Bedeutung der Verwendung semantischer Hinweise Fp a Vt, welche den Wörtern Vt jeweils nicht nur disjunkt unterschiedliche Sachbegriffe K a Fp, sondern grundsätzlich auch disjunkt unterschiedliche Verwendungshinweise q a Fp zuordnen, für eine sprachgerechte Anwendbarkeit des Verfahrens Mp läßt sich anhand einer Erweiterung des Beispiels 3) durch ein weiteres Teilwort vt126 = /_Fahnen/ eines entsprechenden Wortes Vt16 a G1 sowie durch ein Wort (Vt23 a G2) = /_blaue/ und durch die Wörter (Vt32 a G3) = /_weiß=/ und (Vt33 a G3) = /_grau=/ deutlich machen. Hierzu werden 2 Sätze S22 = /graublaue Pflaumen./ und S23 = /Weißblaue Fahnen./ betrachtet, deren Inhalte F221a S22 grob durch "Pflaumen A11, die einheitlich in einer aus blau B1 und grau B2 gemischten Farbe B3 gefärbt sind" und F231a S23 mit "Fahnen B4, die blau gefärbt B1 und zusätzlich (an anderen Stellen) weiß gefärbt B5 sind", umschrieben werden, wobei neben dem oben eingeführten A11 die Begriffe Bx die entsprechenden Sachbegriffe Kxyu a Fpxyu a Vtxy charakterisieren gemäß B1 = K231, B2 = K331, B4 = K161 und B5 = K321. Dem Sprachgebrauch angepaßt sind Verwendungshinweise q zu berücksichtigen, die als q321 = q331 = d und vereinfachend q322 = q332 = s(d) notiert werden. Hierin zeigt d eine Durchschnittsbildung G1 d G2 d G3 an, worin die Einheiten G für die jeweiligen Sachen K a Vt a G stehen, während s(d) komplexer eine Vereinigung von Durchschnitten gemäß (G1 d G2) s (G1 d G3) fordert, wobei die Verknüpfungshinweise, wie allgemein definiert, sich jeweils auf die am rangnächsten in Inhalt N angeordneten Einheiten G beziehen. Hiermit lassen sich unter anderem die Inhalte (F221 a S22) = A11B3 mit B3 = B1B2 für Satz 22 und F231 = (B4 d B1) s (B4 d B5) für S23 bilden, für deren in Ansatz Ba zu berücksichtigende Sachwahrscheinlichkeiten p(F) sich ausreichend hohe Werte p(F221) = p(B1) × p(B2/B1) × p(A11/B3) sowie, im anzunehmenden Fall einander ausschließender Inhalte (B4 d B1) und (B4 d B5), p(F231) = p(B4) × p(B5/B4) + p(B4) × p(B1/B4) ergeben. Dagegen scheidet ein zu F231 a S23 alternativer Inhalt F232 des Sinnes ". . . von aus blau B1 und weiß B5 gemischter Farbe B6" wegen eines zu geringen Bezugs p(B6B1) k ps wie auch wegen p(Vt32Vt23B6) k ps aus, da der Sprachgebrauch für eine solche Farbmischung B6 einen Wortkomplex Vt3yVt23 = /_hellblau/ mit p(Vt3yVt23/B6) g ps vorziehen würde. Für einen mit q332 = s(d) analog zu F231 ebenfalls möglich scheinenden Inhalt F222 a S22 ist sach- wie sprachbedingt ebenfalls eine geringe Wahrscheinlichkeit p(F222/S22) kk p(F221/S22) anzusetzen.
Gegenüber einer, wie oben angeführt, ebenfalls vorgesehenen Ausbildung der Erfindung, bei welcher Wortkomplexe wie Vt33Vt23 = /_graublaue/ und Vt32Vt23 = /_weißblaue/ als Idiome, also als zusätzliche Wörter Vtxy a Gx einer zusätzlichen Einheit Gx mit entsprechend zu beschreibenden Sachbegriffen Kxyu a Fpxyu a Vtxy behandelt werden, wobei in Beispiel 3) Gx = G2 gewählt werden kann, hat die hier beispielhaft erläuterte Bildung semantischer Inhalte unter Verwendung von den Transformationen Qs genügenden Symbolen Vt den Vorteil, daß die hierfür bereitzustellenden Daten Wp der betreffenden Sprache L ein vergleichsweise geringes Daten- und somit Speichervolumen erfordern, wobei sich aber der Verarbeitungsaufwand wegen der zusätzlich anfallenden Komplexbildungen erhöht. Entsprechend sieht die Erfindung vor, die Verwendung von Idiomen den Speicher- und Verarbeitungskapazitäten der verfügbaren Geräte anzupassen. Unabhängig davon, ob G3 als eigene Einheit beibehalten wird, wird Komplex Vt32Vt23 = /_weißblaue/ vorteilhaft dann als eigenes Idiom-Symbol Vt2y a G2 in den Daten Wp berücksichtigt, wenn in der Kommunikation hierdurch auch eine Sache K ausgedrückt werden soll, die auch durch das Symbol Vt2x = /_bayrische/ abzudecken ist, wobei diese Idiombildung auch mit der oben angeführten Transformationsbedingung Qsa a Q1 im Einklang ist.
Weitere Einzelheiten der durch Verfahren Mp mit Hilfe quantitativer Methoden erzielbaren sprachgerechten Behandlung von, bestimmte lexikalische Wörter wie das oben betrachtete Wort /und/ einschließenden, Symbolen Vt, deren semantische Hinweise Fp nicht nur bezüglich zuordenbarer semantischer Inhalte K, sondern auch bezüglich deren Verknüpfungen zu Komplexen KK und Inhalten F mehrdeutig sind, werden nachfolgend noch anhand einer Erweiterung des Beispiels 3) um die, zusätzlich zu den Symbolen Vt41 und Vt42 der Einheit G4 zugeordneten Wörter Vt43 = /_oder grüne/ und Vt44 = /_oder blaue/ aufgezeigt. Betrachtet werden hierzu 2 weitere dem durch G1 = Gk1 = Ar(G2) und G2 = Ar(G4) gekennzeichneten grammatischen Inhalt N3 zugeordnete Sätze S33 = vt111Vt21Vt43vt112vt113 = /Reife oder grüne Pflaumen./ und S34 = vt111Vt21Vt44vt112vt113 = /Reife oder blaue Pflaumen./ Den beiden Wörtern Vt4y, mit y = 3 oder 4, werden jeweils 2 disjunkte semantische Hinweise Fp4y1 und Fp4y2 zugeordnet, deren Verwendungshinweise q vereinfachend durch q431 = q432 = o und q432 = q442 = s angegeben werden, wobei letzterer Verknüpfung aber ein die Wahrscheinlichkeiten p(F) der resultierenden Inhalte F deutlich reduzierender Faktor qr kk 1 beigeordnet wird. Dieser Hinweis q4y2 fordert, wie oben q412 = q422 bei Vt41 und Vt42, die, hier in der genannten vereinfachten Schreibweise notierte, Vereinigung gemäß Fb = (G1 d G2) s (G1 d G4) der beiden Durchschnitte D1 und D2 der entsprechenden Sachen Kxyu a Vtxy a Gx, etwa im Sinne von "oder auch" oder "sowohl als auch". Dagegen fordert q4y1 die Bildung eines Inhalts Fa von einander ausschließenden Alternativen gemäß Fa = (G1 d G2) o (G1 d G4) dieser Durchschnitte D1 und D2 im Sinn von "entweder oder". Beim anzuwendenden Ansatz Ba zu beachten sind die hierfür jeweils geltenden Wahrscheinlichkeiten p(Fa) = p(D1) + p(D2) - 2p(D1 d D2) und p(Fb) = qr x(p(D1) + p(D2) - p(D1 d D2)). Bezogen auf die Sätze S33 und S34 ist hier also von einem Durchschnitt D1 im Sinne von "reife Pflaumen" und 2 Durchschnitten D2 = D21 im Sinne von "blaue. . ." und D22 im Sinne von "grüne Pflaumen" auszugehen. Zur Vereinfachung der Erläuterung wird p(D1) = p(D21) = p(D22) angenommen, sowie weiter, daß die Mengen D1 und D21 einander völlig ausschließen, mit p(D1 d D21) = 0, und daß die Mengen D1 und D22 sich vollständig überlappen, mit p(D1 d D22) = p(D1) = p(D22). Für Satz S33 ergibt sich so für den möglichen Inhalt F33a im Sinne von "entweder oder" eine Sachwahrscheinlichkeit p(F33a) = p(D1) und für F33b im Sinne von "sowohl als auch" ein um den eingeführten Faktor qr geringerer Wert p(F33b) = qr × p(D1). Für Satz 34 folgt jedoch für die entsprechende Alternativaussage p(F34a) = 0, so daß, mit p(F34b) = qr × p(D1), hier trotz des reduzierenden Faktors qr nur ein, etwas überspitzt etwa durch "reife oder genauso gut auch blaue Zwetschgen" zu umschreibender, Inhalt F34b angesprochen sein kann.
Der an Satz S33 zu beobachtende Sprachgebrauch, wonach durch das Wort /_oder/ bevorzugt einander ausschließende Inhalte F angesprochen werden, wird in einer weiteren Ausbildung der Erfindung dadurch berücksichtigt, daß anstelle des oben eingeführten Korrekturfaktors qr für die Wahrscheinlichkeiten p(F) unterschiedliche Wahrscheinlichkeiten p(Vt/Fp) für die zu einem Hinweis Fp und somit auch zu einer Verknüpfung q von Inhalten K vorzunehmende Wortwahl berücksichtigt werden. Diese Bezüge sorgen neben den oben betrachteten, aus Verknüpfungen von Sachbegriffen K resultierenden Sachwahrscheinlichkeiten p(F) entsprechend den in Ansatz Ba zu berücksichtigenden Produkttermen p(F) × p(Vt/F) ebenfalls dafür, daß die gemäß Mp vorgenommenen Zuordnungen von Inhalten F zu Wortkomplexen VtVt und deren Texten T den Sprachgebrauch wiedergeben.
Entsprechend der durch die Erfindung ebenfalls abgedeckten Möglichkeit, daß auch ungebräuchlich oder auch fehlerhaft abgefaßte Texte T zu bearbeiten sind, welche, ebenso wie hieraus gegebenenfalls durch Übersetzen oder Stenotypieren zu erzeugende Texte T, einen Inhalt F nur mit geringer Wahrscheinlichkeit p(F/T) anzeigen, wobei die entsprechenden Nachrichten TNF auch aus Komponenten Em aufgebaut sein können, die dem Inhalt F mit vergleichsweise geringen, unterhalb von Schwellwerten ps liegenden Wahrscheinlichkeiten ps zugeordnet sind, sieht Verfahren Mp in einer Ausgestaltung vor, solche Texte T und entsprechend Sätze S den Kommunikationspartnern Pa wie gegebenenfalls auch Nutzen durch entsprechende, durch Vorgaben Vr festgelegte Markierungen anzuzeigen. In einer weiteren Ausbildung werden auch mehrdeutige Texte T, für deren wahrscheinlichste Inhalte F Wahrscheinlichkeiten p(F/T) gelten, die sich um entsprechend geringe Werte ps unterscheiden, unter Anwendung bekannter Methoden entsprechend markiert.
Die Erfindung sieht vor, Daten Wp zu verwenden, in denen die einzusetzenden Komponenten Em geordnet nach bestimmten Kriterien aufgelistet sind, so daß sie mit entsprechend angepaßten Suchstrategien aufgrund vorliegender Daten mit ausreichend geringem Aufwand auffindbar sind. Als solche Kriterien gelten auch die genannten Adressen Ad. Es werden bevorzugt Adressen Ad verwendet, welche ihre Komponenten Em mit ausreichend hohen Wahrscheinlichkeiten p(Em/Ad) g pr oberhalb von Werten pr anzeigen, wobei auch Komponenten Em als Adressen Ad für weitere Komponenten Em dienen, und wobei eine Komponente Em auch mehrfach nach mehreren Adressen Ad aufgelistet wird, während andererseits nicht ausgeschlossen wird, daß durch eine Adresse A mehrdeutig auch mehrere Komponenten Em adressiert werden. Zu den in Wp geordnet aufzulistenden Komponenten Em gehören die gemäß Verfahren Mp einzusetzenden Symbole Vt mit ihren Normtexten Tsa und zugeordneten Größen Fp, K und q sowie die Symbole Gr beziehungsweise G. Als Adresse Ad für ein Wort Vt wird im einzelnen neben seinem Normtext Tsa auch ein Komplex Kp von Texteigenschaften H(T) mit Toleranzen dH verwendet, welcher die Texte T5 a Vt dieses Wortes Vt, in einer Ausbildung auch einen ausreichend hohen Anteil hiervon, umfaßt. In einer auch für das grammatische Verfahren M angegebenen Ausbildung werden solche Texteigenschaften H(T) auch als Komplexe Kp weiterer, oben als Zeichen Z eingeführter, Textsymbole Z = H(T) dargestellt, wie sie beispielsweise in Schriftsprachen durch Buchstaben oder auch Teile hiervon und bei mündlichen Texten T durch Laute oder auch Lautkombinationen gegeben sind, wobei ein Symbol Vt auch als Komplex Vt = Kp1 = ZZ solcher Zeichen Z notiert wird und ein solcher Komplex Kp1 wie auch Teile Kp2 a Kp1 hiervon als Adressen Ad verwendet werden. In einer weiteren Ausbildung werden auch die oben genannten Teilwörter vt a Vt wie auch diesen zugeordnete Zeichenkomplexe ZZ a vt als Adressen Ad für solche Wörter Vt wie auch Teileinheiten g und Einheiten G verwendet. Insbesondere bei der von Verfahren Mp in der Rolle des Autors At zu leistenden Übermittlung von Sachverhalten Wk2 durch Texte T werden auch Sachbegriffe K als Adressen Ad für die hierfür einzusetzenden Symbole Vt eingesetzt.
Verfahren Mp schließt die Anwendung bekannter Maßnahmen zur Aufnahme, Speicherung und Ausgabe der die Kommunikationstexte T konstituierenden Sprachsignale sowie der in der Rolle des Autors At zu übermittelnden oder des Hörers Hr ermittelten Inhalte F und Sachverhalte Wk in entsprechend kodierter Form mit ein.
Verfahren Mp wird in die folgenden, unter Beachtung oben angeführter Einzelheiten durchzuführenden Verfahrensteile Mp1 bis Mp4 untergliedert: Die bei der Kommunikation in der Rolle des Hörers Hr vorzunehmende Zuordnung semantischer Nachrichten TNF zu einlaufenden Texten T einschließlich der Bestimmung und Weitergabe der durch Kommunikationspartner Pa hierdurch übermittelten Sachverhalte Wk wird im Rahmen eines Verfahrensteils Mp1 durchgeführt. Die in der Rolle des Autors At vorzunehmende Übermittlung vorgegebener Sachverhalte Wk an Kommunikationspartner Pa durch semantischen Nachrichten TNF zugeordnete auszugebende Texte T erfolgt, auch unter Benutzung des Verfahrensteils M1, im Rahmen eines Verfahrensteils Mp2. Die bei der Kommunikation gegebenenfalls vorzunehmende inhaltsgerechte Korrektur einlaufender Texte T in entsprechend verbesserte, weiterzugebende Texte T dieser Sprache L wird im Rahmen eines, die Teile Mp1 und Mp2 verwendenden, Verfahrensteil Mp3 durchgeführt. Verfahrensteil Mp4 umfaßt die beim Übersetzen und Dolmetschen unter Anwendung der Verfahrensteile Mp1, Mp2 und gegebenenfalls auch Mp3 zu leistende Übertragung einlaufender Texte T einer Ausgangssprache L in auszugebende Texte T' einer Zielsprache L' einschließlich der beim Stenotypieren anfallenden Übertragung vom Mündlichen ins Schriftliche wie auch der von Sprachgeneratoren zu leistenden Übertragung von schriftlichen in mündliche Texte T.
Verfahrensteil Mp1 a Mp zur Ermittlung eines durch einen einlaufenden, von einem Kommunikationspartner Pa verfaßten, Text T übermittelten Sachverhalts Wk2 durch einen Hörer Hr umfaßt mehrere der folgenden Maßnahmen: Die einlaufenden Sprachsignale werden aufgenommen und gespeichert. Textmerkmale H(T), die als Adressen Ad Symbole Gs von Sprachen L anzeigen, werden identifiziert. Die Sprache L des Textes T wird identifiziert. Den Adressen Ad werden disjunkte Repertoires Ra(Gs) von als Komponenten (Em) zu verwendenden Symbolen Gs mit, die Positionen P der Adressen Ad berücksichtigenden, Entnahmebedingungen Ve zugeordnet. Dem Text T wird ein entsprechend disjunktes Repertoire Rb(NN) von jeweils entsprechend diesen Positionen P geordneten Komplexen Kpx = NN von jeweils einem oder mehreren grammatischen Inhalten N zugeordnet. Die Zuordnung von Inhalten N wird gemäß Verfahren M durchgeführt. Bei fortlaufenden Texten T werden für die Bildung von Inhalten N jeweils Textabschnitte T berücksichtigt, deren Mindestlänge dadurch gegeben ist, daß durch ihre Adressen Ad jeweils mindestens 2 Repertoires Ra(Gs) angezeigt werden, deren Symbole Gs als Kopfsymbole Vtk a Grk geeignet sind. Die Bildung der Inhalte N a Kpx erfolgt in der Reihenfolge der einlaufenden Textabschnitte T. Ein oder gegebenenfalls disjunkt mehrere Komplexe Kpx, deren Nachrichten N ausreichend hohe Wahrscheinlichkeiten p(N/T) zukommen, werden einer semantischen Weiterverarbeitung zugeführt. Hierfür wird ein durch Vorgaben Vr festgelegtes Repertoire Rc(Wk1v) eines oder mehrerer beim Partner Pa vorauszusetzender pragmatischer Sachverhalte Wk1v berücksichtigt. Permutationen von semantischen Hinweisen Fp a Vt a N von Symbolen Vt jeweils eines Inhalts N werden zu jeweils einem disjunkten Repertoire Rd(Fu) eines oder mehrerer semantischer Inhalte Fu zusammengefügt, durch welche die Sachverhalte Wk1v in ein entsprechend disjunktes Repertoire Rd(Wk2w) von Sachverhalten Wk2w abgewandelt werden. Es werden Komponenten Em a Ra berücksichtigt, die den zu bildenden Komplexen Kp = TNF mit ausreichend hohen Wahrscheinlichkeiten p(Em) g ps oberhalb von Schwellwerten ps zuordenbar sind. Die Zuordnung semantischer Inhalte F zu den grammatischen Inhalten N eines Komplexes Kpx und die dadurch vorzunehmende Abwandlung vorausgesetzter Sachverhalte Wk1v in Sachverhalte Wk2w erfolgt in der durch diesen Komplex Kpx gegebenen Reihenfolge. Aus dem resultierenden Repertoire Rd(Wk2w) werden ein, oder gegebenenfalls auch disjunkt mehrere, Sachverhalte Wk2w ausgewählt, die durch die semantischen Inhalte F eines Komplexes Kpx erzeugt wurden, die dessen grammatischen Nachrichten TN mit den höchsten, vorgegebene Schwellwerte ps nicht unterschreitenden, Maximalwerte pr jedoch auch nicht überschreitenden Wahrscheinlichkeiten p(F/TN; Wk1v) zugeordnet sind. Die resultierenden Sachverhalte Wk2 werden gemäß Vorgaben Vr und hierdurch gegebene Kriterien auf ihre Verwendbarkeit überprüft. Sie werden einer durch Vorgaben Vr festgelegten weiteren Verwendung zugeführt. Die Sachverhalte Wk2 werden in einer durch Nutzer verwendbaren, eindeutig kodierten Form an solche Nutzer weitergegeben. Als Nutzer werden maschinelle Vorrichtungen eingesetzt, die durch den Sachverhalten Wk2 entsprechende Kommandos bedient und in Operation gesetzt werden. Als Nutzer werden Elektronenrechner zugeordnet, die durch die Sachverhalte Wk2 gegebene, Kommandos der hierfür vorgesehenen Programmiersprachen in Betrieb gesetzt werden.
Die in Verfahrensteil Mp1 gemäß Vorgaben Vr gegebenenfalls vorzunehmende Überprüfung der Verwendbarkeit einlaufender Texte T und diesen gegebenenfalls zuordenbarer Sachverhalte Wk2 schließt eine Überprüfung auf deren Verwendbarkeit sowie die gegebenenfalls erforderliche Auslösung weiterer Aktionen mit ein. Diese Aktionen werden unter Anwendung von Verfahrensteil Mp2 durch Ausgabe von diese Aktionsinhalte übermittelnden Kommunikationstexten T oder auch von diese Inhalte eindeutig wiedergebenden Signalen ausgeführt. Solche Aktionen umfassen die Bekanntgabe einer gegebenenfalls vorliegenden Unverständlichkeit eines Textes T an seinen Autor At, beispielsweise auch des hierfür verantwortlichen Textabschnitts T. Es werden Irrtümer konstatiert und dem Partner Pa bekanntgegeben, falls sich die durch seine Botschaften F übermittelten Sachwahrscheinlichkeiten p(K) a Wk2 von als objektiv richtig, insbesondere auch durch p(K) = 1 oder p(K) = 0 vorgegebenen Werten unterscheiden. Es werden Unaufrichtigkeiten konstatiert und gegebenenfalls in Aktionen umgesetzt, falls dem Hörer Hr gemäß vorliegenden Daten Wp bekannt ist, daß Abweichungen der Wahrscheinlichkeiten p(K) in übermittelten Sachverhalten Wk2 von den p(K)-Werten als objektiv richtig deklarierter Sachverhalte Wk dem Autor der Botschaft F und Wk2 bekannt sind. Durch Texte T eines Partners Pa übermittelte Sachverhalte Wk2, welche Aufforderungen oder Fragen enthalten, oder welche sich um ausreichend hohe Wahrscheinlichkeitswerte p(K) von vorgegebenen Sollwerten p(K) unterscheiden, werden in, durch entsprechend zu übermittelnde Kommunikationstexte T oder Sachdaten K ausgedrückte, Aktionen umgesetzt.
Verfahrensteil Mp2 a Mp zur Übermittlung eines als Komplex Kp von Sachbegriffen K gegebenen Sachverhalts Wk an einen Kommunikationspartner Pa durch einen von einem Autor At auszugebenden Text T umfaßt mehrere der folgenden Maßnahmen: Es wird der von einem, beim Partner Pa vorauszusetzenden, Sachverhalt Wk1 abweichende Anteil des zu übermittelnden Sachverhalts Wk ermittelt und durch ein disjunktes Repertoire R1(Kpx) von Komplexen Kpx von durch die Daten Wp gegebenen, den Symbolen Vt zugeordneten Sachbegriffen K a Fp a Vt sowie weiteren, beispielsweise als Oberbegriffe K hiervon gebildeten Sachbegriffen K dargestellt. Unter Beachtung des Verfahrensteils Mp1 von Mp werden die Symbole Vt a Kpx jeweils eines Komplexes Kpx zu, ein disjunktes Repertoire R2(Kpy) bildenden, Komplexen Kpy von grammatischen Nachrichten TN zusammengefügt, die zu semantischen Nachrichten TNF mit semantischen Inhalten F ergänzt werden. Von diesen wird ein Text T = T1 eines Komplexes Kp1 a R2 von Nachrichten TNF zur Übermittlung des Sachverhalts Wk ausgegeben, dessen Inhalte F gemäß Verfahrensteil Mp1 mit ausreichend hohen Wahrscheinlichkeiten p(F/TN; Wk1) und ausreichender Eindeutigkeit Sachverhalte Wk2 ergeben, die den Sachverhalt Wk mit ausreichender Genauigkeit wiedergeben.
Verfahren Mp sieht vor, abhängig von vorliegenden Daten und von Vorgaben Vr die erfindungsgemäß zu lösenden Kommunikationsaufgaben auch durch Anwendung von Teilen eines oder beider Verfahrensteile Mp1 und Mp2 durchzuführen, wobei oben angegebene Einzelheiten der Erfindung entsprechend zu berücksichtigen sind.
Eine gemäß Vorgaben Vr vorzunehmende Verbesserung eines durch einen Kommunikationspartner Pa abgefaßten einlaufenden Textes T = T1 bezüglich der durch ihn zu übermittelnden grammatischen Inhalte N und semantischen Inhalte F wird gemäß einem Verfahrensteil Mp3 a Mp dadurch durchgeführt, daß dem Text T1 gemäß Verfahrensteil Mp1 ein übermittelter Sachverhalt Wk = Wk2 zugeordnet wird, dem gemäß Verfahrensteil Mp2 ein diesen Sachverhalt Wk2 übermittelnder Text T2 zugeordnet wird, durch welchen die hiervon abweichenden Teile T3 von Text T1 ersetzt werden. Neben Korrekturen von Fehlern bei der Rechtschreibung, Zeichensetzung und Grammatik, wie sie etwa bei Flexionen und Positionierungen natürlicher Wörter auffallen und häufig bei Autoren At anzutreffen sind, die eine Sprache L nicht ausreichend beherrschen, schließt Verfahrensteil Mp3 auch inhaltserhaltende stilistische Korrekturen ein, wie sie beispielsweise durch Vermeidung von Wortwiederholungen, von mehrdeutigen oder mißverständlichen Wörtern oder auch übermäßig verschachtelten oder unnötig kurzen natürlichen Sätzen möglich sind. Entsprechend der vorgesehenen Anwendung sieht Verfahrensteil Mp3 bei entsprechenden Vorgaben Vr auch die Verdeutlichung gegebener Texte T bezüglich ihrer Botschaften F und Wk2 mit ein, wie sie durch Zugrundelegung abgewandelter, beispielsweise weniger explizit vorausgesetzter Ausgangs-Sachverhalte Wk1 und entsprechend konkreter auszudrückender Botschaften F erfindungsgemäß möglich ist.
Verfahrensteil Mp4 zur Übertragung eines einlaufenden Textes (T) einer Ausgangssprache L in einen bezüglich des hierdurch übermittelten Sachverhalts Wk2 ausreichend gleichbedeutenden Text T' einer durch Vorgaben Vr festgelegten Zielsprache (L'), welche definitionsgemäß schriftliche Übersetzungen schriftlicher oder mündlicher Texte, Dolmetschertätigkeiten, beim Stenotypieren anfallende Übertragungen vom Mündlichen ins Schriftliche und von Sprachgeneratoren zu leistende Umwandlungen schriftlicher in mündliche Texte mit einschließt, umfaßt mehrere der folgenden Maßnahmen: Unter Anwendung des Verfahrensteils Mp1 von Mp wird dem einlaufenden Text T ein Komplex Kp1 = TNF, TNF einer oder mehrerer semantischer Nachrichten TNF zugeordnet, durch deren semantische Inhalte F ein beim Autor At dieses Textes T vorauszusetzenden Sachverhalt Wk11 in den Sachverhalt Wk2 abgewandelt wird. Im Falle der Mehrdeutigkeit wird dem Text T auch ein disjunktes Repertoire R(Wk2) solcher Sachverhalte Wk2 mit einem entsprechenden Repertoire R(Kp1x) von Komplexen Kp1x solcher Nachrichten TNF zugeordnet. Unter Anwendung des Verfahrensteils Mp2 von Mp wird der von Sachverhalt (Wk11) abweichende Teil des jeweiligen Sachverhalts Wk2 als disjunktes Repertoire R1(Kpx) von Komplexen Kpx von den Daten Wp' der Zielsprache L' zugeordneten Sachbegriffen K' wiedergegeben. Symbole Vt' a Wp' a L', denen diese Sachbegriffe K' a Fp' a Vt' über deren semantische Hinweise Fp' zugeordnet sind, werden zu einem disjunkten Repertoire R2(Kpy) von Komplexen Kpy von jeweils einer oder mehreren semantischen Nachrichten T'N'F' ergänzt. Als Übertragung 1' des Textes T wird ein Text T' eines dieser Nachrichtenkomplexe Kpy = T'N'F', T'N'F' einer durch die Vorgaben Vr festgelegten weiteren Verwendung zugeführt, dessen semantische Inhalte F' gemäß Verfahrensteil Mp1 mit ausreichend hoher Wahrscheinlichkeit p(F'/T'N'; Wk11') und Eindeutigkeit einen beim Hörer Hr dieses Textes T' vorauszusetzenden Sachverhalt (Wk11') in einen Sachverhalt (Wk2') abwandeln, der mit ausreichender Genauigkeit mit dem Sachverhalt Wk2 übereinstimmt. Im Falle eines mehrdeutigen Textes T werden entsprechend mehrere, disjunkt zu verwendende Texte T' oder ein Text T' ausgegeben, dem entsprechend disjunkt mehrere Sachverhalte Wk2' zuordenbar sind. Disjunkt als Übertragung zu verwendende Texte T' werden durch entsprechende Markierungen für den Hörer Hr wie gegebenenfalls auch Nutzer gekennzeichnet.
In einer bevorzugten Ausgestaltung wird Verfahrensteil Mp4 unter Anwendung des grammatischen Verfahrens M durchgeführt. Hierbei werden die den grammatischen Nachrichten TN des jeweiligen Komplexes Kp1 als Symbole Vt zugeordneten objektiven Wörter Vt vollständig als Komplexe Kp11 von Vokabeln Vqq zugeordneten Symbolkomplexen Vq = VtVt dargestellt, welche jeweils eine disjunkte Klasse K1 = (Vq') von, diesen mit Wahrscheinlichkeiten p(Vq'/Vq) zugeordneten Komplexen Vq' = Vt'Vt' von objektiven Wörtern Vt' der Zielsprache L' anzeigen. Zur Bestimmung der Vokabeln Vqq in den Daten Wst der Daten Wp werden die Wörter Vt a Kp1 als Adressen Ad eingesetzt. Die Wörter Vt eines Komplexes Kp1 werden vollständig als Komplexe Vq a Vqq dargestellt. Die Wörter Vt' a Vq' a Vqq der einem Komplex Kp1 zugeordneten Vokabeln Vqq werden gemäß Verfahren M unter Beachtung der Anordnungen Pr zu einem entsprechend disjunkten Repertoire R(Kp2) von Komplexen Kp2 von jeweils einer oder mehreren grammatischen Nachrichten T'N' zusammengefügt. Die Nachrichten TN und T'N' werden unter Anwendung von Verfahrensteil Mp1 zu semantischen Nachrichten TNF und einem entsprechend disjunkten Repertoire R(Kp2) von Komplexen Kp2 von semantischen Nachrichten T'N'F' ergänzt. Es wird ein Text T' a Kp2 eines der Komplexe Kp2 als Übertragung T' des Textes T ausgegeben und der festgelegten weiteren Verwendung zugeführt, dessen semantische Inhalte F' einen beim Hörer Hr dieses Textes T' vorauszusetzenden Sachverhalt Wk11' mit ausreichend hoher Wahrscheinlichkeit p(F'/T'N'; Wk11') und Eindeutigkeit in den genannten Sachverhalt (Wk2') abwandeln, der mit ausreichender Genauigkeit den durch Text T übermittelten Sachverhalt Wk2 wiedergibt. Die Übereinstimmungsgenauigkeit wird durch Toleranzen dp für die den Sachen K und K' in Wk2 und Wk2' zukommenden Wahrscheinlichkeiten p(K) und p(K') festgelegt. Bei Mehrdeutigkeit des Textes T werden entsprechend disjunkte Texte T' oder auch mehrere Sachverhalte Wk2' ausgegeben.
Entsprechend dem in Patentanmeldung P. . . beschriebenen Verfahrensteil M3 des angeführten grammatischen Kommunikationsverfahrens M sieht Verfahrensteil Mp4 auch vor, Übertragungen aus einer Ausgangssprache L in eine Zielsprache L' über eine oder auch mehrere Zwischensprachen L", L''' usw. durchzuführen. Beispielsweise erfolgt in einer solchen Ausbildung die Übertragung von Texten T der mündlichen deutschen Sprache L in Texte T' der englischen Schriftsprache L' über Texte T" der deutschen Schriftsprache L"; entsprechendes gilt für die Sprachen L anderer Sprachgemeinschaften. Des weiteren werden, wie in M3 a M, Übertragungen aus einer beliebigen Sprache L, L' usw. eines Repertoires R(L) in eine beliebige andere Sprache L' a R(L) auch über eine als Zentralsprache L" a R(L) bezeichnete Sprache L" dieses Repertoires R(L) durchgeführt. In einer weiteren Ausbildung sieht Verfahrensteil Mp4 auch die Anwendung des Verfahrensteils Mp3 vor, wonach ein einlaufender fehlerhafter Text T = T1 einer Ausgangssprache L gemäß Mp3 zunächst in einen Text T2 von L verbessert wird, der dann in einen Text T' von L' übertragen wird. Bei den gemäß Verfahrensteil Mp4 vorzunehmenden Übertragungen vom Mündlichen ins Schriftliche und umgekehrt werden erfindungsgemäß Vokabeln Vqq verwendet, bei denen im Regelfall jeweils einem Wort Vq = Vt der Ausgangssprache L jeweils ein Wort Vq' = Vt' der Zielsprache L' zugeordnet ist, deren vom jeweiligen Textzusammenhang abhängige Schreib- beziehungsweise Ausspracheweise in den Daten Wst a Wp vorteilhaft mit Hilfe der genannten Operatoren o dargestellt wird.
In einer weiteren Ausgestaltung von Verfahrensteil Mp4 wird, auch gemäß vorliegenden Vorgaben Vr, auch berücksichtigt, daß bei den Kommunikationspartnern Pa unterschiedlicher Sprachgemeinschaften L und L' gegebenenfalls auch voneinander abweichende, als Wk1' ne Wk1 notierte Sachverhalte Wk1 beziehungsweise Wk1' vorauszusetzen sind, wobei entsprechend auch unterschiedliche Wahrscheinlichkeiten p(Vt'/K1) ne p(Vt/K1) für die Verwendung von die gleiche Sache K1 anzeigenden Symbolen Vt und Vt' anzusetzen sind. Entsprechend werden in dieser Ausbildung den Texten T' der Zielsprache L' von den Ausgangssachverhalten Wk1 von L abweichende Sachverhalte Wk1' so zugrunde gelegt, daß sich in beiden Sprachen L und L' als ausreichend gleich beurteilte Sachverhalte Wk2 und Wk2' erzielen lassen.
In einer Ausgestaltung der Erfindung wird Verfahrensteil Mp3 zur Verbesserung einlaufender Texte auch als Spezialfall des Verfahrensteils Mp4 durchgeführt, wobei die Übertragung aus einer Ausgangssprache L in eine Zielsprache L' erfolgt, welche gleich der Ausgangssprache L' = L ist.
Wie aus der Beschreibung hervorgeht, schließt Verfahrensteil Mp4 a Mp die Anwendung weiterer, gegebenenfalls auch sämtlicher in Verfahren Mp beschriebenen Verfahrensteile und Maßnahmen mit ein. Einige der hierbei zu lösenden Kommunikationsaufgaben werden anhand eines Beispiels 4) für Übertragungen von Texten T aus der mündlichen deutschen Sprache L ins Schriftenglische L' erläutert. Gegeben ist ein Text T1, dessen Lautfolge hier wieder durch eine Buchstabenfolge T1 = /ainerwaissesget/ angenähert wird. Unter Anwendung eines Teils M2 des grammatischen Verfahrens M wird diesem Text T1 ein disjunktes Repertoire Ra(Kpx) von Komplexen Kpx von jeweils einer oder mehreren grammatischen Nachrichten TNxy mit zugeordneten Sätzen Sxy a Tnxy zugeordnet, von denen einige hier durch Texte Tx" = Sx" beziehungsweise Tx" = Sxy"Sxy" aus der deutschen Schriftsprache L" angezeigt werden: T1" = /Einer weiß, es geht./, T2" = /Ein Erweis: Es geht./, T3" = /Einer: "Weißes geht!"/, T4" = /Einer: "Weiß es Geet?"/. Diese Texte Tx" werden auch durch Anwendung des Verfahrensteils M3a M von M zur grammatikbezogenen Übertragung von Texten T aus der mündlichen deutschen Sprache L in die schriftliche L" erzeugt, wobei /Geet/ in T4" einen Eigennamen anzeigt, vorausgesetzt, daß ein vorauszusetzender Sachverhalt Wk11 einen entsprechenden Sachbegriff K mit ausreichender Wahrscheinlichkeit p zuläßt. Ist gemäß Verfahrensteil Mp1 a Mp ein Sachverhalt Wk12 vorauszusetzen, wonach, vereinfacht, "eine Diskussion zwischen Geschäftsleuten über die Verkaufschancen verschiedenfarbiger Porzellansorten stattfindet", so folgt gemäß Mp4, daß aus der Vielfalt möglicher Übersetzungen der Texte Tx" eine Übersetzung wie beispielsweise T3' = /One of them: "White china sells well."/ zu bevorzugen ist, wobei die Berücksichtigung des Kontextes Wk12 sich bereits als Beschränkung der Inhalte N des gegebenen Textes T1 auswirkt.
Beispiel 4) wird durch einen weiteren mündlichen Text T2 = /disertonklingthel/ erweitert, dessen mögliche Botschaften F gemäß M3 a M dem grammatisch eindeutigen, semantisch aber mehrdeutigen zuordenbaren Schrifttext T5" = /Dieser Ton klingt hell./ zu entnehmen sind. Gemäß Verfahrensteil Mp4 erfolgt hier die Berücksichtigung eines vorauszusetzenden Sachverhaltes Wk12 vorrangig bei der Auswahl des Wortkomplexes Vq' = Vt'Vt' der durch Vq1 = /gder Ton./ angezeigten Vokabel Vqq1. Ist also gemäß Wk12 mit ausreichend hohen Wahrscheinlichkeiten p in etwa "von aus Ton gebrannten Gefäßen die Rede, auf die man klopft, um aus dem Klang auf ihre Qualität und Unversehrtheit zu schließen", so folgt als Übersetzung beispielsweise 15' = /The earthenware sounds clear./.
Die erfindungsgemäß vorgesehene Berücksichtigung unterschiedlicher Ausgangssachverhalte Wk11 und Wk11' bei Kommunikationspartnern Pa unterschiedlicher Sprachen L, welche entsprechend ihrer Herkunft auch unterschiedliches Wissen einsetzen, wird in Beispiel 4) anhand des weiteren, hier schriftdeutsch formulierten Textes T6 = /Morgen besuchen wir Hohenschwangau./ illustriert, der bayrischen Hörern Hr eine "Schloßbesichtigung" ankündigt, ausländischen Touristen Hr aber mit ausreichender Sicherheit häufig erst dann, wenn er in T5' = /Tomorrow we are going to visit Hohenschwangau castle./ übersetzt wird. Einzelheiten über die in Beispiel 4) verwendeten Symbole Vt, G, Vqq, ihre Anordnungen Pr sowie Hinweise Fp und Sachen K folgen aus den oben gebrachten, an Beispielen erläuterten Angaben.
Auf die Vorteile, welche sich aus der Anwendung der anzuwendenden Verfahrensteile Mp1 bis Mp4 in den genannten Ausgestaltungen ergeben, wurde im einzelnen jeweils im Zusammenhang mit den Beschreibungen der hierfür einzusetzenden Maßnahmen hingewiesen.
Die Erfindung sieht in einer weiteren Ausgestaltung vor, das Verfahren Mp zur semantischen Kommunikation in natürlichen Sprachen L mit einer rechnergestützten Einrichtung 1 durchzuführen, welche die folgenden, durch eine oder mehrere Stromversorgungsanlagen versorgten, jeweils aus einer oder mehreren Untereinheiten aufgebauten Einheiten umfaßt: eine gemäß Verfahren Mp programmierte zentrale Recheneinheit 11 zur Abwicklung der für die Erstellung von semantischen Nachrichten TNF und zugehörigen semantischen Inhalten F a TNF und pragmatischen Sachverhalten Wk wie auch weiterer hierbei anfallender Daten sowie für die Ablauforganisation vorgesehenen Operationen. Eine Speichereinheit 12 zur Speicherung der hierfür zu verwendenden Daten Wp der betreffenden Sprachen L, der zu berücksichtigenden Sachverhalte Wk, der anfallenden Zwischen- und Endergebnisse sowie einlaufender und auszugebender Daten D einschließlich Texten T und Vorgaben Vr. Eine Einheit 13 zum Empfang einlaufender und zur Ausgabe ausgehender Daten D einschließlich Texten T, diesen gegebenenfalls zugeordneter Markierungen, wie auch Nachrichten TN wie auch TNF und Sachverhalten Wk in den hierfür vorgesehenen Kodierungen und Medien, wobei der Datenaustausch Kommunikationspartner Pa und, gegebenenfalls auch maschinelle, Nutzer mit einschließt. Eine Bedieneinheit 14 zur Festlegung und Überwachung von Betriebszuständen, zur Überwachung von Zwischen- und Endergebnissen, zur Eingabe von Vorgaben Vr wie auch Daten Wp einschließlich deren Ergänzung wie auch Abänderung in der Speichereinheit 12. Diese Einheiten 11 bis 14 sind durch Datenbusse 15 verbunden, welche den Aufgaben angepaßte Bandbreiten aufweisen.
In verschiedenen Ausgestaltungen werden für die Speichereinheit 12 RAM- Speicher (mit "read only memory") verwendet. RAM-Speicher-Module werden zur Speicherung der den Daten Wp zugeordneten Symbole Gr, Vt, semantischen Hinweise Fp, Sachbegriffe einschließlich deren Eigenschaften H(Gr) usw. und Adressen Ad verwendet. Es werden Speicher 12 verwendet, welche eine Ergänzung wie auch Korrektur der zu verwendenden Daten Wp erlauben. Es werden Recheneinheiten 11 und Speicher 12 verwendet, die aus den Daten Wp und dem Verfahren Mp angepaßten kundenspezifischen integrierten Schaltkreisen aufgebaut sind. Es wird eine Vorrichtung 1 verwendet, die aus einer Zentraleinheit 111, welche einen Zentralrechner 11 und einen Speicher 12 umfaßt, sowie aus einer Anzahl von getrennt hiervon, vorzugsweise auch mobil, angeordneten Nutzereinheiten 112 besteht, welche jeweils eine Bedieneinheit 14 und eine Empfangs- und Ausgabeeinheit 13 umfassen, wobei die Nutzereinheiten 112 mit der Zentraleinheit 111 durch, gegebenenfalls auch drahtlos, arbeitende Datenbusse 15 verknüpft sind. Diese Ausbildung hat den Vorteil, daß der mit der Zentraleinheit 111 verbundene Aufwand einer größeren Anzahl von Nutzern an den vergleichsweise aufwandsarm aufgebauten Einheiten 112 zugute kommt, für deren Verknüpfungen mit der Zentraleinheit 111 Datenbusse 15 mit vergleichsweise niedrigen Bandbreiten genügen, wie sie beim Empfangen und Ausgeben von Texten T sowie bei der Bedienung anfallen.
In einer weiteren Ausgestaltung werden die zentrale Recheneinheit 11 und die Speichereinheit 12 unter Verwendung von Parallelrechnern aufgebaut, in denen den Symbolen Vt a Gr und Sachen K a Fp a Vt Rechenmodule 1111 zugeordnet werden, die entsprechend den in den Daten Wp gegebenen Bezügen parallel miteinander verknüpft sind.
Patent-/Offenlegungsschriften
DE 30 42 408 C2
DE 31 42 540 C2
DE 35 03 233 C2
DE 36 15 972 A1
DE 36 16 011 A1
DE 30 32 664 C2
DE 31 51 106 A1
DE 32 11 313 C2
DE 37 33 391 C2
DE 35 14 286 A1
DE 37 10 507 A1
DE 37 11 348 A1
DE 41 35 261 C1
DE 42 32 482 A1
DE 43 11 211 A1.
Literaturverzeichnis
//1// John Lyons, Die Sprache, Beck, München (1992)
//2// Hermann Helbig, Künstliche Intelligenz und automatische Wissensverarbeitung, Technik, Berlin (1991)
//3// John Lyons, Einführung in die moderne Linguistik, Beck, München (1971)
//4// Dieter E. Zimmer, Payment may he made - Bezahlung kann sein gemacht, Die Zeit, Nr. 15 (5. April 1996)
//5// Helmar Frank, Kybernetische Grundlagen der Pädagogik, Agis, Baden- Baden (1996)
//6// Terry Winograd, Fernando Flores. On "Understanding Computers and Cognition": A New Foundation for Design, Artificial Intelligence, Vol. 31, S. 250 (1987)
//7// Edward O. Wilson, Sociobiology, Cambridge, Mass. und London (1975)
//8// Steven Pinker, The Language Instinct, Morrow, New York (1994)
//9// New Scientist, S. 53 (22. Okt. 1987)
//10// Marcus Spies, Aus dem Kopf in den Computer-Spracherkennung in elektronischen Diktiersystemen, Spektrum der Wissenschaft, Dossier 4/97, S. 47 (1997)
//11// Wolfgang Wahlster, Verbmobil: Erkennung, Analyse, Transfer, Generierung und Synthese von Spontansprache, Spektrum der Wissenschaft, Dossier 4/97, S. 52 (1997)
//12// Hadumod Bußmann, Lexikon der Sprachwissenschaft, Stuttgart (1990)
//13// Robert Jourdain, Music, the Brain, and Ecstasy, New York, S. 279 (1997).

Claims (30)

1. Verfahren zu einer auf semantische Inhalte bezogenen, pragmatische Sachverhalte übermittelnden Kommunikation in einer wie auch mehreren natürlichen Sprachen, dadurch gekennzeichnet, daß
  • 1. 1.1. die Kommunikation zwischen Kommunikationspartnern (Pa) unter Beachtung vorliegender Vorgaben (Vr) gemäß einem Verfahren (Mp) durchgeführt wird, wonach als Komplexe (Kp = KK) von Sachbegriffen (K) gebildete pragmatische Sachverhalte (Wk) mittels, von Autoren (At) aus Sprachsignalen der für die betreffenden natürlichen Sprachen (L) vorgesehenen Medien zu bildenden beziehungsweise von deren Empfängern (Hr) auszuwertenden, Texten (T) übermittelt werden, die durch Zuordnung grammatischer Inhalte (N) unter Beachtung der Wahrscheinlichkeiten (p(TN)) zu grammatischen Nachrichten (TN) und semantischer Inhalte (F) unter Beachtung der Wahrscheinlichkeiten (p(TNF)) zu semantischen Nachrichten (TNF) ergänzt werden, und die zu übermittelnden Sachverhalte (Wk = Wk2) durch Abänderung von, von den Kommunikationspartnern (Pa) vorausgesetzten, pragmatischen Sachverhalten (Wk = Wk1) entsprechend den semantischen Inhalten (F) erzeugt werden, wobei
  • 2. 1.2. die semantischen Nachrichten (TNF) als Komplexe (Kp = EmEm) unter Beachtung ihrer, gegebenenfalls auch durch weitere Komponenten (Em) bedingten, Wahrscheinlichkeiten (p(Em)) aus, durch Daten (Wp) beschriebenen Komponenten (Em) zusammengefügt werden, welche Sachbegriffe (K) und an die natürlichen Sprachen (L) angepaßte Symbole (Gs) einschließen, die, jeweils zu einer disjunkten Klasse (K1 = (Vt)) von Textabschnitten (T = Ts) mit, durch Toleranzen (dH) näher bestimmten, Textmerkmalen (H(Ts)) superierte, Textsymbole (Vt = (Ts)) und, hieraus zu disjunkten Klassen (K1 = Gr) superierte, grammatische Symbole (Gr = (Vt)) umfassen, welche jeweils ein Repertoire (R(Pr)) von, durch Wahrscheinlichkeiten (p) näher bestimmten, Möglichkeiten ihrer, durch Rangordnungen (Ra) und die Positionen (P) der Textabschnitte (Ts) der diesen Symbolen (Gr) zugeordneten Textsymbole (Vt) in Texten (T) festgelegten, Anordnungen (Pr) vorgeben,
  • 3. 1.3. die Textsymbole (Vt) jeweils eine disjunkte Klasse (K1 = (Fp)) von, die Möglichkeiten ihrer Anordnungen (Pr) berücksichtigenden, semantischen Hinweisen (Fp) vorgeben, die jeweils einen Sachbegriff (K) und ein Repertoire (R(K1)) von disjunkten Klassen (K1 = (q)) von Verwendungshinweisen (q) für dessen Zuordnung zu semantischen Nachrichten (TNF) einschließlich seiner Verknüpfung mit Sachbegriffen (K) weiterer in der betreffenden semantischen Nachricht (TNF) vorliegender Textsymbole (Vt) sowie mit Sachbegriffen (K) vorausgesetzter pragmatischer Sachverhalte (Wk1) einschließlich deren Abänderung umfassen, und wobei
  • 4. 1.4. durch Texte (T) zu übermittelnde pragmatische Sachverhalte (Wk2) unter Beachtung vorliegender Daten (D) einschließlich Vorgaben (Vr) jeweils dadurch erzeugt werden, daß ein oder mehrere hierdurch angezeigte grammatische Symbole (Gr) und eine Permutation von diesen zugeordneten Textsymbolen (Gt) unter Beachtung der Anordnungen (Pr) zu einem grammatischen Inhalt (N) zusammengefügt werden, der durch einen, aus einer Permutation von diesen Symbolen (Gt) zugeordneten, an durch diese Anordnungen (Pr) gegebenen Positionen (P), gegebenenfalls auch diskontinuierlich, angeordneten, Textabschnitten (Ts) zusammengefügten Text (T) zu einer grammatischen Nachricht (TN) ergänzt wird, und daß die Sachbegriffe (K) einer Permutation von diesen Textsymbolen (Gt) zugeordneten semantischen Hinweisen (Fp) gemäß einer Permutation von diesen Hinweisen (Fp) zugeordneten Verwendungshinweisen (q) unter Beachtung der durch einen vorausgesetzten pragmatischen Sachverhalt (Wk1) gegebenen Wahrscheinlichkeiten (p(K)1) wie auch weiterer, in den Daten (Wp) vorliegender, Wahrscheinlichkeiten (p(Em)) ein, als Komplex (Kp = KK) dieser Sachbegriffe (K) mit Wahrscheinlichkeiten (p(K)2) zusammengefügter, semantischer Inhalte (F) gebildet wird, durch den die grammatische Nachricht (TN) zu einer semantischen Nachricht (TNF) ergänzt und der vorausgesetzte pragmatische Sachverhalt (Wk1) in den zu übermittelnden pragmatischen Sachverhalt (Wk2) abgeändert wird, der einer durch die Vorgaben (Vr) gegebenen weiteren Verwendung zuzuführen ist.
2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß für einen Text (T) aus einem disjunkten Repertoire (R(Wk1x)) von vorausgesetzten Sachverhalten (Wk1x) ein Sachverhalt (Wk11) ausgewählt wird, mit dem sich unter Beachtung der Daten (Wp) ein semantischer Inhalt (F) ergibt, der einer gegebenen grammatischen Nachricht (TN) mit der höchsten, einen Schwellwert (ps) nicht unterschreitenden Wahrscheinlichkeit (p(TNF)) zuordenbar ist.
3. Verfahren nach Anspruch 1 und 2, dadurch gekennzeichnet, daß für die Kommunikation ein Repertoire (R(Wk1x)) von Sachverhalten (Wk1x) mit Sachbegriffen (K) und Wahrscheinlichkeiten (p(K)1) vorausgesetzt wird, welches die Möglichkeiten von Meinungs- wie auch Wissensunterschieden zwischen den Kommunikationspartnern (Pa) berücksichtigt.
4. Verfahren nach einem oder mehreren der Ansprüche 1 bis 3, dadurch gekennzeichnet, daß aus einem bei vorausgesetzten pragmatischen Sachverhalten (Wk1) einem Text (T) zugeordneten disjunkten Repertoire (R(Wk2x) von pragmatischen Sachverhalten (Wk2x) ein Sachverhalt (Wk21) als zu übermittelnder Sachverhalt weiter verwendet wird, dem aufgrund dieses Textes (T) Sachbegriffe (K) mit Wahrscheinlichkeiten (p(K)2) zuzuordnen sind, die sich von den durch die Sachverhalte (Wk1) beziehungsweise Daten (Wp) gegebenen Wahrscheinlichkeiten (p(K)1) um Beträge (p) unterscheiden, welche zwischen festzulegenden Mindestwerten (p1) und Höchstwerten (p2) liegen.
5. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß die Kommunikation unter Verwendung von, durch Texte (Ts) angezeigten, Textsymbolen (Vt) durchgeführt wird, die dadurch an eine natürliche Sprache (L) angepaßt sind, daß die Texte (Ts) den statistisch bewerteten Ergebnissen von Transformationen (Qs) an Texten (T) dieser Sprache (L) genügen, wonach unter Einhaltung einer zu beobachtenden Invarianz (I) ein bezüglich seines semantischen Inhalts (F1) als korrekt beurteilter Text (T1 = Tf1) bei Verkürzung um einen kürzestmöglichen, einen oder auch mehrere, diskontinuierlich angeordnete Textabschnitte (T) umfassenden Textteil (T11) in einen bezüglich des hierbei abgewandelten semantischen Inhalts (F = F2) ebenfalls als korrekt beurteilten Text (T2 = TV) abgeändert wird, wobei dieser Textteil (T11 = Ts) einem Symbol (Vt) zugeordnet wird, dem ein, einen Sachbegriff (K) und einen Verwendungshinweis (q) hierfür umfassender, semantischer Hinweis (Fp) zugeordnet wird, durch welchen der semantische Inhalt (F2) in den ursprünglichen Inhalt (F1) abgeändert wird, und wobei diese Transformation Qs als notwendige Bedingung dafür, daß das betreffende Symbol (Vt) mit untergeordnetem Rang (Ra) einem durch einen weiteren Textteil (Ts') des Textes (T2) angezeigten weiteren Symbol (Vt') zugeordnet ist, sowie als hinreichende Bedingung dafür gilt, daß kein durch einen weiteren Textteil (Ts") des Textes (T1) angezeigtes weiteres Symbol (Vt") vorliegt, welchem dieses Symbol (Vt) mit einem übergeordneten Rang (Ra) zugeordnet ist.
6. Verfahren nach Anspruch 1 und 5, dadurch gekennzeichnet, daß die Kommunikation unter Verwendung von, jeweils zu einer disjunkten Klasse (K1) von Symbolen (Vt) superierten, grammatischen Symbolen (Gr = Grx) durchgeführt wird, welche den Ergebnissen der Transformationen (Qs) genügen, die auf Texte (T1') angewandt werden, die alternativ als Textteile (T11) jeweils einen Textabschnitt (Tsxyz a Vtxy) unterschiedlicher Symbole (Vtxy a Grx) eines grammatischen Symbols (Grx) enthalten.
7. Verfahren nach einem oder mehreren der Ansprüche 1 bis 6, dadurch gekennzeichnet, daß die unter Beachtung der Wahrscheinlichkeit (p(TNF)) vorzunehmende Komplexbildung von semantischen Nachrichten (TNF) aus Komponenten (Em), welche gemäß, als Evidenz vorliegenden, Daten (D) durch Adressen (Ad) wie auch Vorgaben (Vr) mit ausreichend hohen Wahrscheinlichkeiten (p(Em)) in Form disjunkter Repertoires (R(Em)) angezeigt werden, unter Berücksichtigung hierfür in den Daten (Wp) vorliegender Wahrscheinlichkeiten (p(Em)), gemäß dem Bayesschen Ansatz (Ba) durchgeführt wird, wonach die in den zu durchlaufenden Superierungsstufen anfallenden disjunkten Komplexe (Kp = EmEm) als jeweils einer disjunkten Klasse (K1 = (Ks)) zugeordnete Konkurrenzhypothesen (Ks) entsprechend ihren, auf die Daten (D) bezogenen, Wahrscheinlichkeiten (p(Ks)) berücksichtigt werden, wobei in den Hypothesen (Ks) bereits berücksichtigte Komponenten (Em) auch als Adressen (Ad) für weitere, gegebenenfalls auch disjunkt zu verwendende Komponenten (Em) eingesetzt werden.
8. Verfahren nach einem oder mehreren der Ansprüche 1 bis 7, dadurch gekennzeichnet, daß die bei der Komplexbildung semantischer Nachrichten (TNF), auch als Zwischenergebnisse, anfallenden Konkurrenzhypothesen (Ks) unter Beachtung von Wahrscheinlichkeiten (p(Ks)) berücksichtigt werden, welche unter Anwendung nichtlinearer, von der Höhe der Wahrscheinlichkeiten (p) abhängiger Verarbeitungsoperationen (Bb) bestimmt werden, wonach mit Wahrscheinlichkeiten (p(Em)) zu verwendende, disjunkten Repertoires (R(Em)) zugeordnete Komponenten (Em) sowie aus Komponenten (Em) mit resultierenden Wahrscheinlichkeiten (p(Ks)) zusammengefügte Konkurrenzhypothesen (Ks), deren Wahrscheinlichkeiten (p) jeweils festzulegende Grenzwerte (ps) unterschreiten, unter Beachtung der für das jeweils disjunkte Repertoire (R) von Komponenten (Em) beziehungsweise Hypothesen (Ks) geltenden Wahrscheinlichkeitssummen (Ca) vernachlässigt werden, wobei Schwellwerte (ps) so den zu leistenden Kommunikationsakten und verfügbaren Vorrichtungen angepaßt werden, daß zulässige Bearbeitungszeiten und Fehlerraten nicht überschritten werden und aus einem Repertoire (R) wenigstens eine Konkurrenzhypothese (Ks) Verwendung findet.
9. Verfahren nach einem oder mehreren der Ansprüche 1 bis 8, dadurch gekennzeichnet, daß die Komplexbildung semantischer Nachrichten (TNF) unter Verwendung von als disjunktes Repertoire (R(Em)) von als Komponenten (Em) zu verwendenden Sachbegriffen (K) unter Anwendung nichtlinearer Verarbeitungsschritte (Bbr) durchgeführt wird, wonach Komponenten (Em = Em1), die einer Nachricht (TNF) mit einer einen nahe 1 liegenden Schwellwert (ps3) übertreffenden Wahrscheinlichkeit (p(Em1)) zuordenbar sind, gegenüber weiteren, dem Repertoire (R(Em)) angehörigen Komponenten (Em) mit Wahrscheinlichkeiten (p(Em)) unterhalb (ps3) vernachlässigt werden.
10. Verfahren nach einem oder mehreren der Ansprüche 1 bis 9, dadurch gekennzeichnet, daß die Kommunikation mit Sachbegriffen (K) durchgeführt wird, für deren Zuordnung zu Texten (T) und semantischen Nachrichten (TNF) Zuordnungswahrscheinlichkeiten (p(K)) zu Textsymbolen (Vt) und weiteren Begriffen (K) vorausgesetzt werden, welche die Möglichkeit der Verwendung subjektiver wie auch fehlerhafter, von objektiv gewonnenen Daten (p(K)) abweichender Werte durch den Kommunikationspartner (Pa) mit einschließen.
11. Verfahren nach einem oder mehreren der Ansprüche 1 bis 10, dadurch gekennzeichnet, daß die Kommunikation unter Verwendung von Textsymbolen (Vt) zugeordneten semantischen Hinweisen (Fp) durchgeführt wird, die jeweils einen als Menge von Begriffen (A) gebildeten Sachbegriff (K) und ein Repertoire (R) von disjunkten Klassen (K1) von Verwendungshinweisen (q) für dessen unter Beachtung der Anordnungen (Pr) der grammatischen Symbole (Gr), denen die Symbole (Vt) angehören, vorzunehmende Verknüpfungen mit weiteren Sachbegriffen (K) zu Komplexen (Kp = KK) umfassen, welche mit (q = d) die Durchschnittsbildung und (q = s) die Vereinigung zweier Sachbegriffe (K = K1) und (K2), mit (q = m) eine Entfernung eines gemäß (K3 m K4) nachgestellten Begriffs K4 aus einem weiteren Begriff K3, mit (q = f) gemäß (K5 f K6) das Ersetzen eines Begriffs (K5) durch eine Negation (K6 = nK5) dieses Begriffs (K5), mit (q = c) gemäß (K7 c K8) das Ersetzen eines Begriffs (K7) durch einen in einer oder mehreren Eigenschaften (H(K)) hiervon abweichenden Begriff (K8), sowie mit (q = o) gemäß (K14 = K12 o K13) die Bildung eines disjunkten Sachbegriffs (K14) vorsehen, welcher entweder die Begriffe (A) des Sachbegriffs (K12) oder des Sachbegriffs (K13) umfaßt.
12. Verfahren nach einem oder mehreren der Ansprüche 1 bis 11, dadurch gekennzeichnet, daß die Verknüpfungen von semantischen Hinweisen (Fp) zugeordneten Sachbegriffen (K) mit weiteren Sachbegriffen (K) zugeordneten Sachbegriffen (K) gemäß Verwendungshinweisen (q) erfolgen, welche von der Art der Verknüpfung abhängige Abänderungen der für die hierdurch gebildeten Komplexe (Kp) von Sachbegriffen (K) resultierenden Wahrscheinlichkeiten (p(Kp)) um an die betreffenden Sprachen (L) angepaßte Faktoren (qr) vorgeben.
13. Verfahren nach einem oder mehreren der Ansprüche 1 bis 12, dadurch gekennzeichnet, daß die Kommunikation unter Verwendung von durch die Daten (Wp) beschriebenen Sachbegriffen (K) durchgeführt wird, die zu den jeweils einem semantischen Hinweis (Fp) eines Symbols (Vt) zugeordneten Sachbegriffen (K = K5) jeweils einen Oberbegriff (K11) enthalten, der als Vereinigung (K11 = K5 s K6) des Sachbegriffs (K5) mit einem Sachbegriff (K6) gebildet wird, der eine Negation (K6 = nK5) des Begriffs (K5) darstellt, wobei Oberbegriffe (K11) verwendet werden, denen die Begriffe (K5) jeweils mit ausreichend hohen, einen Referenzwert (pr) nicht unterschreitenden Wahrscheinlichkeiten (p(K5/K11)) zugeordnet werden, und wobei eine gemäß den Gegebenheiten der Sprachen (L) gemäß (K5 f6 K6) vorzunehmende Negation (K6) eines einem Symbol (Vt) zugeordneten Begriffs (K5) durch die Entfernung (K6 = K11 m K5) des Begriffs (K5) aus dem Oberbegriff (K11) vorgenommen wird.
14. Verfahren nach einem oder mehreren der Ansprüche 1 bis 13, dadurch gekennzeichnet, daß die Kommunikation unter Verwendung grammatischer Nachrichten (TN) durchgeführt wird, welche jeweils aus einem Text (T) und einem diesem gemäß einem grammatischen Kommunikationsverfahren (M) zugeordneten grammatischen Inhalt (N) bestehen, der als Komplex (Kp) aus Komponenten (Em) gebildet wird, die Textsymbole (Vt) und hieraus zu disjunkten Klassen (Kl) superierte grammatische Symbole (Gr = G) umfassen, welche zusätzlich zu den Transformationen (Qs) bestimmten Transformationen (Q) an Texten (T) genügen, deren Ergebnisse durch Beobachtungen bestimmter Invarianzen (I) an den Texten (T) nachweisbar sind.
15. Verfahren nach einem oder mehreren der Ansprüche 1 bis 14, dadurch gekennzeichnet, daß die Bildung der semantischen Inhalte (F) aus den semantischen Hinweisen (Fp) der Symbole (Vt) zugeordneten Sachbegriffen (K1) unter Berücksichtigung von, durch die Daten (Wp) beschriebenen, weiteren Sachbegriffen (K2) durchgeführt wird, welche den Begriffen (K1) mit ausreichend hohen, vorgegebene Schwellwerte (ps) nicht unterschreitenden Wahrscheinlichkeiten (p(K2/K1)) zugeordnet sind, wobei orthogonale Sachbegriffe (K) verwendet werden, wonach weitere Sachbegriffe (K3) so festgelegt werden, daß gemäß (p(K2/K1; K3) = p(K2/K1)) die Abhängigkeit eines Sachbegriffs (K2) von einem Begriff (K1) durch die Begriffe (K3) nicht beeinflußt wird.
16. Verfahren nach einem oder mehreren der Ansprüche 1 bis 15, dadurch gekennzeichnet, daß die Kommunikation unter Verwendung eines Repertoires (R(K)) von Sachbegriffen (K) durchgeführt wird, deren wechselseitige Bezüge durch bedingte Wahrscheinlichkeiten (p(K)) beschrieben werden, deren Ordnung (O(n)) einen vorgegebenen, der Leistungsfähigkeit verfügbarer Vorrichtungen angepaßten Wert (n = n1) nicht überschreitet.
17. Verfahren nach einem oder mehreren der Ansprüche 1 bis 16, dadurch gekennzeichnet, daß der Aufbau von, einlaufenden Texten (T) zuzuordnenden, semantischen Nachrichten (TNF) aus Komponenten (Em) unter Beachtung der Verwendungshinweise (q) in einer Reihenfolge nach fallenden, durch die vorliegende Evidenz (D) und die Daten (Wp) einschließlich der als Adressen (Ad) eingesetzten, bereits verwendeten Komponenten (Em) bedingten, Wahrscheinlichkeiten (p(Em/D; Wp)) dieser Komponenten (Em) durchgeführt wird.
18. Verfahren nach einem oder mehreren der Ansprüche 1 bis 17, dadurch gekennzeichnet, daß Komplexe (Kp = VtVt = Vt1) von in Anordnungen (Pr) zusammengefügten Textsymbolen (Vt) mit gemäß deren semantischen Hinweisen (Fp) diesen Komplexen (Vt1) zugeordneten Komplexen (Kp = KK = K1) von Sachbegriffen (K), welche in semantischen Nachrichten (TNF) mit ausreichender Häufigkeit vorkommen, als Idiome (Vt1) mit einem diesem jeweils zugeordneten semantischen Hinweis (Fp1) und diesem zugeordneten Sachbegriff (K1) verwendet werden.
19. Verfahren nach einem oder mehreren der Ansprüche 1 bis 18, dadurch gekennzeichnet, daß Vorgaben (Vr) berücksichtigt werden, wonach Texte (T), denen keine semantischen Nachrichten (TNF) zuordenbar sind, bei denen die Wahrscheinlichkeiten (p(Em)) sämtlicher Komponenten (Em) und (p(F)) des semantischen Inhalts (F) hierfür jeweils festgelegte Schwellwerte (ps) überschreiten, den Kommunikationspartnern (Pa) wie gegebenenfalls auch Nutzern des Verfahrens (Mp) durch entsprechende Markierungen angezeigt werden.
20. Verfahren nach einem oder mehreren der Ansprüche 1 bis 19, dadurch gekennzeichnet, daß die durch einen Empfänger (Hr) eines einlaufenden Textes (T) vorzunehmende Bestimmung eines durch dessen Autor (At) übermittelten Sachverhalts (Wk2) gemäß einem Verfahrensteil (Mp1) von Verfahren (Mp) durchgeführt wird, wonach die beim Kommunikationsakt anfallenden Daten (D) einschließlich des einlaufenden Textes (T) sowie der Vorgaben (Vr) aufgenommen und gespeichert werden, durch darin zu identifizierende Adressen (Ad) angezeigte Repertoires (Ra(Em)) von für die Komplexbildung von semantischen Nachrichten (TNF) zu berücksichtigenden Komponenten (Em) mit Entnahmebedingungen (Ve) festgelegt werden, dadurch gegebene, grammatischen Symbolen (Gr) zugeordnete Textsymbole (Vt) unter Beachtung der Wahrscheinlichkeiten (p(N/T)) zu einem entsprechend disjunkten Repertoire (Rb) von Komplexen (Kpx) von jeweils einer oder mehreren grammatischen Nachrichten (TN) mit grammatischen Inhalten (N) zusammengefügt werden, wonach weiterhin die Sachbegriffe (K a Fp a Vt) von Permutationen von den Symbolen (Vt a N a Kpx) der jeweils einem Komplex (Kpx) zugeordneten semantischen Hinweise (Fp a Vt) gemäß ihren Verwendungshinweisen (q a Fp) unter Beachtung eines disjunkten Repertoires (Rc) eines oder mehrerer beim Partner (Pa) vorausgesetzter Sachverhalte (Wk1v) zu einem disjunkten Repertoire (Rd) von Komplexen (Kpz) von den Komplexen (Kpx a Rb) zugeordneten semantischen Nachrichten (TNF) mit semantischen Inhalten (F) zusammengefügt werden, und wonach ein Sachverhalt (Wk11 a Wk1v), bei dem sich für die semantischen Inhalte (F a TNF a Kp1) eines Komplexes (Kp1 a Kpz) die höchsten, einen vorgegebenen Maximalwert (pr) nicht überschreitenden Wahrscheinlichkeiten (p(F/TN; Wk11)) ergeben, durch diese semantischen Inhalte (F a Kp1) unter Beachtung der durch diesen Komplex (Kp1) gegebenen Ordnung in den durch den Text (T) übermittelten Sachverhalt (Wk2) abgewandelt wird, der einer durch Vorgaben (Vr) festgelegten weiteren Verwendung zugeführt wird.
21. Verfahren nach einem oder mehreren der Ansprüche 1 bis 20, dadurch gekennzeichnet, daß die in der Rolle eines Autors (At) durch einen auszugebenden Text (T) vorzunehmende Übermittlung eines als Komplex (Kp) von Sachbegriffen (K) gegebenen Sachverhalts (Wk) an einen Kommunikationspartner (Pa) gemäß einem Verfahrensteil (Mp2) von Verfahren (Mp) durchgeführt wird, wonach der von einem beim Partner (Pa) vorauszusetzenden Sachverhalt (Wk1) abweichende Teil des Sachverhalts (Wk) durch ein disjunktes Repertoire (R1(Kpx)) von Komplexen (Kpx) von den Daten (Wp) zugeordneten Sachbegriffen (K) dargestellt wird und Textsymbole (Vt), denen diese Sachbegriffe (K a Fp a Vt) über deren semantische Hinweise (Fp) zugeordnet sind, zu einem disjunkten Repertoire (R2(Kpy)) von jeweils den Komplexen (Kpx) entsprechenden Komplexen (Kpy) von jeweils einer oder mehreren grammatischen Nachrichten (TN) zusammengefügt werden, die durch Zuordnung von unter Beachtung der Hinweise (Fp) gebildeten semantischen Inhalten (F) zu semantischen Nachrichten (TNF) ergänzt werden, von denen ein Text (T1 a Kp1) eines Komplexes (Kp1 a R2) an den Partner (Pa) ausgegeben wird, dessen gemäß Verfahrensteil (Mp1) zu ermittelnde Inhalte (F) mit ausreichend hohen Wahrscheinlichkeiten (p(F/TN; Wk1) und ausreichender Eindeutigkeit den vorausgesetzten Sachverhalt Wk1 in einen Sachverhalt Wk2 abwandeln, der mit ausreichender Genauigkeit mit dem Sachverhalt Wk übereinstimmt.
22. Verfahren nach einem oder mehreren der Ansprüche 1 bis 21, dadurch gekennzeichnet, daß eine bei der Kommunikation gemäß Vorgaben (Vr) vorzunehmende Verbesserung eines durch einen Kommunikationspartner (Pa) in einer Sprache (L) verfaßten einlaufenden Textes (T = T1) bezüglich seiner Übermittlung grammatischer Inhalte (N) und semantischer Inhalte (F) gemäß einem Verfahrensteil (Mp3) von Verfahren (Mp) durchgeführt wird, wonach dem Text (T1) gemäß Verfahrensteil (Mp1) ein übermittelter Sachverhalt (Wk = Wk2) zugeordnet wird, dem gemäß Verfahrensteil (Mp2) ein diesen Sachverhalt (Wk2) übermittelnder Text (T2) zugeordnet wird, und die hiervon abweichenden Teile von Text (T1) durch die entsprechenden Teile von Text (T2) ersetzt werden.
23. Verfahren nach einem oder mehreren der Ansprüche 1 bis 22, dadurch gekennzeichnet, daß die Übertragung eines einlaufenden Textes (T) einer Ausgangssprache (L) in einen bezüglich des hierdurch übermittelten Sachverhalts (Wk2) ausreichend gleichbedeutenden auszugebenden Text (T') einer durch Vorgaben (Vr) festgelegten Zielsprache (L') entsprechend einem Verfahrensteil (Mp4) von Verfahren (Mp) durchgeführt wird, wonach dem Text (T) gemäß Verfahrensteil (Mp1) von (Mp) ein Komplex (Kp1) einer oder mehrerer semantischer Nachrichten (TNF) zugeordnet wird, durch deren semantische Inhalte (F) ein beim Autor (At) dieses Textes (T) vorauszusetzender Sachverhalt (Wk11) in den Sachverhalt (Wk2) abgewandelt wird, und wonach gemäß Verfahrensteil (Mp2) von (Mp) unter Anwendung der Daten (Wp') der Zielsprache (L') dessen von Sachverhalt (Wk11) abweichender Teil als disjunktes Repertoire (R1(Kpx)) von Komplexen (Kpx) von den Daten (Wp') zugeordneten Sachbegriffen (K') dargestellt wird, und Symbole (Vt') der Sprache (L'), denen diese Sachbegriffe (K' a Fp' a Vt') über deren semantische Hinweise (Fp') zugeordnet sind, zu einem disjunkten Repertoire (R2(Kpy)) von Komplexen (Kpy) von jeweils einer oder mehreren semantischen Nachrichten (T'N'F') ergänzt werden, von denen ein Text (T1' a Kpy) als Übertragung des Textes (T) einer durch die Vorgaben (Vr) festgelegten weiteren Verwendung zugeführt wird, dessen Inhalte (F') gemäß Verfahrensteil (Mp1) mit ausreichend hoher Wahrscheinlichkeit p(F'/T'N'; Wk11') und Eindeutigkeit einen beim Hörer (Hr) dieses Textes (1') vorauszusetzenden Sachverhalt (Wk11') in einen Sachverhalt (Wk2') abwandeln, welcher mit ausreichender Genauigkeit mit dem Sachverhalt (Wk2) übereinstimmt.
24. Verfahren nach einem oder mehreren der Ansprüche 1 bis 23, dadurch gekennzeichnet, daß die gemäß Verfahrensteil (Mp4) vorzunehmende Übertragung eines einlaufenden Textes (T) einer Ausgangssprache (L) in einen Text (T') einer Zielsprache (L') unter Anwendung des grammatischen Kommunikationsverfahrens (M) durchgeführt wird, wonach dem Text (T) ein Komplex (Kp1) einer oder mehrerer grammatischer Nachrichten (TN) zugeordnet wird, deren Textsymbole (Vt) als Komplexe (Kp11) von, Vokabeln (Vqq) zugeordneten, Symbolkomplexen (Vq = VtVt) dargestellt werden, welchen jeweils eine disjunkte Klasse (K1 = Vq') von, diesen mit Wahrscheinlichkeiten (p(Vq'/Vq)) zugeordneten, Komplexen (Vq' = Vt'Vt') von Textsymbolen (Vt') der Zielsprache (L') anzeigen, welche unter Beachtung der Anordnungen (Pr) zu einem entsprechend disjunkten Repertoire (R(Kp2)) von Komplexen (Kp2) von jeweils einer oder mehreren grammatischen Nachrichten (T'N') zusammengefügt werden, wobei die Nachrichten (TN) und (T'N') zu semantischen Nachrichten (TNF) und einem entsprechenden Repertoire (R(Kp2)) von Komplexen (Kp2) semantischer Nachrichten (T'N'F') ergänzt werden und ein Text (T' a Kp2) eines Komplexes (Kp2) als Übertragung (T') des Textes (T) ausgegeben wird, dessen semantische Inhalte (F') einen beim Hörer (Hr) dieses Textes (T') vorauszusetzenden Sachverhalt (Wk11') mit ausreichend hoher Wahrscheinlichkeit (p(F'/T'N'; Wk11')) und Eindeutigkeit in einen Sachverhalt (Wk2') abwandeln, der mit ausreichender Genauigkeit den durch Text (T) übermittelten Sachverhalt (Wk2) wiedergibt.
25. Einrichtung zur rechnergestützten Durchführung des Verfahrens nach den Ansprüchen 1 bis 24, dadurch gekennzeichnet, daß eine Vorrichtung (1) verwendet wird, die aus, jeweils aus einer oder mehreren Untereinheiten zusammengesetzten, durch eine oder mehrere Stromversorgungsanlagen versorgten Einheiten aufgebaut ist, welche eine zentrale Recheneinheit (11) zur Abwicklung der für die Erstellung semantischer Nachrichten (TNF), zugehöriger Texte (T), semantischer Inhalte (F), pragmatischer Sachverhalte (Wk) wie auch weiterer anfallender Daten (D) sowie der bei der Ablauforganisation anfallenden Operationen, eine Speichereinheit (12) zur Speicherung der hierfür einzusetzenden Daten (Wp) der betreffenden Sprachen (L) einschließlich zu berücksichtigender Sachverhalte (Wk), anfallender Zwischen- und Endergebnisse sowie einlaufender und auszugebender Daten (D) einschließlich Texten (T) und Vorgaben (Vr), eine Einheit (13) zum Austausch einlaufender und auszugebender Daten (D) einschließlich Texten (T) und, gegebenenfalls auch zur Auslösung vorgegebener Operationen bestimmter, Sachverhalte (Wk) mit Kommunikationspartnern (Pa) und, maschinelle Vorrichtungen einschließenden, Nutzern in den hierfür vorgesehenen Medien und Kodierungen sowie eine Bedieneinheit (14) zur Festlegung und Überwachung von Betriebszuständen und Vorgaben (Vr) umfaßt, wobei diese Einheiten (11) bis (14) durch Datenbusse (15) mit an die jeweiligen Datenraten angepaßten Bandbreiten verbunden sind.
26. Einrichtung nach Anspruch 25, dadurch gekennzeichnet, daß in der Speichereinheit (12) für die Daten (Wp) einschließlich der Symbole (Gs) und der diesen zugeordneten semantischen Hinweise (Fp) RAM-Speichermodule verwendet werden.
27. Einrichtung nach Anspruch 25, dadurch gekennzeichnet, daß eine Vorrichtung (1) eingesetzt wird, deren zentrale Recheneinheit (11) wie auch Speichereinheit (12) unter Verwendung von dem Verfahren (Mp) einschließlich der Daten (Wp) angepaßten kundenspezifischen integrierten Schaltkreisen aufgebaut sind.
28. Einrichtung nach einem oder mehreren der Ansprüche 25 bis 27, dadurch gekennzeichnet, daß einer den Zentralrechner (11) und die Speichereinheit (12) umfassenden Zentraleinheit (111) mehrere, gegebenenfalls auch räumlich hiervon und voneinander getrennt angeordnete, jeweils für unterschiedliche Kommunikationspartner (Pa) und Nutzer verfügbare Nutzereinheiten (112) zugeordnet sind, welche jeweils eine Bedieneinheit (14) und eine Empfangs- und Ausgabeeinheit (13) umfassen und mit der Zentraleinheit (111) durch, gegebenenfalls auch drahtlos zu realisierende, Datenbusse (15) verbunden sind, deren Bandbreiten an die beim Einlesen und Ausgeben von Texten (T) einschließlich diesen zugeordneter Daten (D) wie auch bei Bedienung und Nutzung einschließlich der Übermittlung von Vorgaben (Vr) anfallenden Datenraten angepaßt sind.
29. Einrichtung nach einem oder mehreren der Ansprüche 25 bis 28, dadurch gekennzeichnet, daß die zentrale Recheneinheit (11) und Speichereinheit (12) unter Verwendung von Parallelrechnern aufgebaut werden, in denen den in semantischen Nachrichten (TNF) zu verwendenden Symbolen (Gs) wie auch Sachbegriffen (K) Rechenmodule (1111) zugeordnet werden, die entsprechend deren in den Daten (Wp) festgelegten Bezügen parallel miteinander verknüpft werden.
30. Verfahren und Einrichtung nach einem oder mehreren der Ansprüche 1 bis 29, dadurch gekennzeichnet, daß Verfahren (Mp) unter Verwendung von Daten (Wp) durchgeführt wird, welche ein dem Sprachgebrauch menschlicher, als Autoren (At) auftretender Kommunikationspartner (Pa) angepaßtes Repertoire R(Vt) von Symbolen (Vt) sowie ein beschränktes Repertoire (R(K)) von Sachbegriffen (K) umfassen, das so an die durch die Kommunikation abzudeckenden, die Auslösung vorgegebener Operationen einschließenden Sachverhalte angepaßt ist, daß diese Sachverhalte durch eine gemäß Verfahren (Mp) als Hörer (Hr) fungierende Vorrichtung (1) als einlaufenden Texten (T) zuzuordnende, durch Verknüpfung dieser Sachbegriffe (K) erzeugbare semantische Inhalte (F) und hierdurch bestimmte Sachverhalte (Wk2) darstellbar werden, welche in Form von, durch Vorgaben (Vr) festgelegten, eindeutig kodierten Signalen einer weiteren, die Auslösung vorgegebener Operationen bei als Nutzer zugeordneten maschinellen Vorrichtungen einschließenden, Verwendung zugeführt werden.
DE10015858A 2000-03-30 2000-03-30 Verfahren zu einer auf semantische Inhalte bezogenen rechnergestützten Kommunikation in natürlichen Sprachen Expired - Lifetime DE10015858C2 (de)

Priority Applications (1)

Application Number Priority Date Filing Date Title
DE10015858A DE10015858C2 (de) 2000-03-30 2000-03-30 Verfahren zu einer auf semantische Inhalte bezogenen rechnergestützten Kommunikation in natürlichen Sprachen

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE10015858A DE10015858C2 (de) 2000-03-30 2000-03-30 Verfahren zu einer auf semantische Inhalte bezogenen rechnergestützten Kommunikation in natürlichen Sprachen

Publications (2)

Publication Number Publication Date
DE10015858A1 true DE10015858A1 (de) 2001-10-11
DE10015858C2 DE10015858C2 (de) 2002-03-28

Family

ID=7636996

Family Applications (1)

Application Number Title Priority Date Filing Date
DE10015858A Expired - Lifetime DE10015858C2 (de) 2000-03-30 2000-03-30 Verfahren zu einer auf semantische Inhalte bezogenen rechnergestützten Kommunikation in natürlichen Sprachen

Country Status (1)

Country Link
DE (1) DE10015858C2 (de)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102008003886A1 (de) 2008-01-10 2009-07-16 Grunert, Florian Silver Verfahren zur Übertragung eines Textes einer beliebigen Ausgangssprache in einen Text einer beliebigen Zielsprache basierend auf dem Prinzip der von mir entwickelten Farbontologie
DE102008003572A1 (de) 2008-01-09 2009-10-01 Grunert, Florian Silver Verfahren zur Übertragung eines Textes einer beliebigen Ausgangssprache in einen Text einer beliebigen Zielsprache basierend auf dem Prinzip der von mir entwickelten Farbontologie

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE202016000135U1 (de) 2016-01-08 2016-02-02 Markus Robens System zum kooperativen Verbessern von Sprachkenntnissen unter Zuhilfenahme von Terminologie-Datenbanken

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3151106A1 (de) * 1980-12-25 1982-07-08 Casio Computer Co., Ltd., Tokyo Elektronisches lexikon
DE3032664C2 (de) * 1979-08-30 1982-09-09 Sharp K.K., Osaka Elektronisches Sprachübersetzungsgerät.
DE3514286A1 (de) * 1985-04-19 1986-10-23 Siemens AG, 1000 Berlin und 8000 München System zur erkennung einzeln gesprochener woerter
DE3616011A1 (de) * 1985-05-14 1986-11-20 Sharp K.K., Osaka Uebersetzungsgeraet
DE3615972A1 (de) * 1985-05-14 1986-11-20 Sharp K.K., Osaka Zweisprachiges uebersetzungssystem mit eigen-intelligenz
DE3142540C2 (de) * 1980-10-28 1988-02-11 Sharp K.K., Osaka, Jp
DE3211313C2 (de) * 1981-03-27 1988-06-16 At & T Technologies, Inc., New York, N.Y., Us
DE3503233C2 (de) * 1985-07-26 1989-09-28 Wladislaus 4000 Duesseldorf De Quasebarth
DE3733391C2 (de) * 1986-10-03 1990-03-29 Ricoh Co., Ltd., Tokio/Tokyo, Jp
DE4135261C1 (de) * 1991-10-25 1993-03-18 International Business Machines Corp., Armonk, N.Y., Us
DE4232482A1 (de) * 1992-09-28 1994-06-01 Siemens Ag Verfahren zur Realisierung eines internationalen Sprachenverbundes in einem internationalen Kommunikationsnetz
DE4311211A1 (de) * 1993-04-05 1994-10-06 Ibm Computersystem und Verfahren zur automatisierten Analyse eines Textes

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3032664C2 (de) * 1979-08-30 1982-09-09 Sharp K.K., Osaka Elektronisches Sprachübersetzungsgerät.
DE3142540C2 (de) * 1980-10-28 1988-02-11 Sharp K.K., Osaka, Jp
DE3151106A1 (de) * 1980-12-25 1982-07-08 Casio Computer Co., Ltd., Tokyo Elektronisches lexikon
DE3211313C2 (de) * 1981-03-27 1988-06-16 At & T Technologies, Inc., New York, N.Y., Us
DE3514286A1 (de) * 1985-04-19 1986-10-23 Siemens AG, 1000 Berlin und 8000 München System zur erkennung einzeln gesprochener woerter
DE3616011A1 (de) * 1985-05-14 1986-11-20 Sharp K.K., Osaka Uebersetzungsgeraet
DE3615972A1 (de) * 1985-05-14 1986-11-20 Sharp K.K., Osaka Zweisprachiges uebersetzungssystem mit eigen-intelligenz
DE3503233C2 (de) * 1985-07-26 1989-09-28 Wladislaus 4000 Duesseldorf De Quasebarth
DE3733391C2 (de) * 1986-10-03 1990-03-29 Ricoh Co., Ltd., Tokio/Tokyo, Jp
DE4135261C1 (de) * 1991-10-25 1993-03-18 International Business Machines Corp., Armonk, N.Y., Us
DE4232482A1 (de) * 1992-09-28 1994-06-01 Siemens Ag Verfahren zur Realisierung eines internationalen Sprachenverbundes in einem internationalen Kommunikationsnetz
DE4311211A1 (de) * 1993-04-05 1994-10-06 Ibm Computersystem und Verfahren zur automatisierten Analyse eines Textes

Non-Patent Citations (9)

* Cited by examiner, † Cited by third party
Title
Dieter E. Zimmer, Payment may be made - Bezahlung kann sein gemacht, Die Zeit, Nr. 15 (5. April 1996) *
Edward O. Wilson, Sociobiology, Cambridge, Mass. und Londong (1975) *
Helmar Frank, Kybernetische Grundlagen der Pädagogik, Agis, Baden-Baden (1996) *
Hermann Helbig, Künstliche Intelligenz und automatische Wissenverarbeitung, Technik, Berlin (1991) *
John Lyons, Die Sprache, Beck, München (1992) *
John Lyons, Einführung in die moderne Linguistik, Beck, München (1971) *
New Scientist, S. 53 (22. Okt. 1987) *
Steven Pinker, The Language Instinct, Morrow, New York (1994) *
Terry Winograd, Fernando Flores, On "UnderstandingComputers and Cognition": A New Foundation for Design, Artificial Intelligence, Vol. 31, S. 250 (1984) *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102008003572A1 (de) 2008-01-09 2009-10-01 Grunert, Florian Silver Verfahren zur Übertragung eines Textes einer beliebigen Ausgangssprache in einen Text einer beliebigen Zielsprache basierend auf dem Prinzip der von mir entwickelten Farbontologie
DE102008003886A1 (de) 2008-01-10 2009-07-16 Grunert, Florian Silver Verfahren zur Übertragung eines Textes einer beliebigen Ausgangssprache in einen Text einer beliebigen Zielsprache basierend auf dem Prinzip der von mir entwickelten Farbontologie

Also Published As

Publication number Publication date
DE10015858C2 (de) 2002-03-28

Similar Documents

Publication Publication Date Title
Newmeyer Linguistic theory in America
Black et al. Statistically-driven computer grammars of English: The IBM/Lancaster approach
EP1336955B1 (de) Verfahren zur Erzeugung natürlicher Sprache in Computer-Dialogsystemen
DE69530816T2 (de) Textbearbeitungssystem und Verfahren unter Verwendung einer Wissensbasis
EP0925578B1 (de) Sprachverarbeitungssystem und verfahren zur sprachverarbeitung
DE69908047T2 (de) Verfahren und System zur automatischen Bestimmung von phonetischen Transkriptionen in Verbindung mit buchstabierten Wörtern
Oktapiani et al. Women’s language features found in female character’s utterances in the Devil Wears Prada movie
WO2015113578A1 (de) Verfahren zur automatischen sinnerkennung und messung der eindeutigkeit von text
DE102007004684A1 (de) Verfahren und Datenverarbeitungssystem zum gesteuerten Abfragen strukturiert gespeicherter Informationen
Lokman et al. Extension and prerequisite: An algorithm to enable relations between responses in chatbot technology
Hymes Pidginization and Creolization of Languages: Their Social Contexts
DE10015858C2 (de) Verfahren zu einer auf semantische Inhalte bezogenen rechnergestützten Kommunikation in natürlichen Sprachen
Tao et al. ChatGPT Role-play Dataset: Analysis of User Motives and Model Naturalness
DE10015859C2 (de) Verfahren zu einer auf grammatische Inhalte bezogenen rechnergestützten Kommunikation in natürlichen Sprachen
Janko Linguistically integrated contractual interpretation: Incorporating semiotic theory of meaning-making into legal interpretation
Edmonds et al. Reconciling fine-grained lexical knowledge and coarse-grained ontologies in the representation of near-synonyms
AlAfnan Large Language Models as Computational Linguistics Tools: A Comparative Analysis of ChatGPT and Google Machine Translations
Gibbon et al. Spoken Language Characterization
Гирин Humanization tendencies in Present-day English grammar
EP3665619B1 (de) Verfahren zum erzeugen einer sprachansage als rückmeldung zu einer handschriftlichen nutzereingabe sowie entsprechende bedienvorrichtung und kraftfahrzeug
Meck Kontextabhängiges Prompt-und Flowdesign in Sprachassistenzsystemen
Saxena A systematic Survey of Natural Language Processing (NLP) Models & it’s Application
Savargiv et al. A structural method based on fuzzy approach at producing emotional data
Penner The High German of Russian Mennonites in Ontario
Gultom et al. A Contrastive Analysis between English and Indonesian Adjectives in Report Text

Legal Events

Date Code Title Description
OP8 Request for examination as to paragraph 44 patent law
D2 Grant after examination
8364 No opposition during term of opposition
8330 Complete disclaimer