WO2003017252A1

WO2003017252A1 - Verfahren und vorrichtung zum erkennen einer phonetischen lautfolge oder zeichenfolge

Info

Publication number: WO2003017252A1
Application number: PCT/EP2001/009353
Authority: WO
Inventors: Hans Geiger
Original assignee: Knittel, Jochen
Priority date: 2001-08-13
Filing date: 2001-08-13
Publication date: 2003-02-27
Also published as: EP1417678A1; US20040199389A1; US7966177B2

Abstract

Die Erfindung betrifft ein Verfahren zum Erkennen einer phonetischen Lautfolge oder einer Zeichenfolge, z.B. nach dem ASC II-Standard, mit folgenden Verfahrensschritten: a) Die Abfolge wird einem neuronalen Netz zugeführt, b) in dem neuronalen Netz wird aus der phonetischen Abfolge bzw. Zeichenabfolge unter Berücksichtigung von phonetischen und/oder lexikalischen gespeicherten Informationen und/oder basierend auf einer Zeichenkettenabfolge (Leerzeichen) eine Abfolge von Merkmalen gebildet, c) die gebildet Merkmalsabfolge wird mit einer Merkmalskombination (H) eines definierten Aussagegehaltes vergliche, die aus gespeicherten lexikalischen und semantischen Informationen auf der Basis der Merkmalsabfolge gebildet wird, d) Schritt c) wird solange mit neuen Merkmalskombinationen wiederholt, bis unter Minimierung von Widersprüchen eine mit der Merkmalsabfolge zumindest weitgehend übereinstimmende Merkmalskombination gefunden wird, e) der Aussagegehalt der Merkmalskombination mit den wenigsten Widersprüchen wird als Resultat ausgegeben und/oder eine dem Aussagegehalt zugeordnete Aktion wird durchgeführt.

Description

VERFAHREN UND VORRICHTUNG ZUM ERKENNEN EINER PHONETISCHEN LAUTFOLGE ODER ZEICHENFOLGE

Die vorliegende Erfindung betrifft ein Verfahren und eine Vorrichtung zum Erkennen einer Abfolge phonetischer Laute oder Zeichen, z.B. einem Zeichenstring nach dem ASC Il-Standard.

Bei vielen Computeranwendungen erfolgt die Eingabe von Steuerungsbefehlen in fest vorgegebener Form, die durch die Befehlssprache der Computersoftware definiert ist. Eingaben, die nicht genau den vorgegebenen Befehlssätzen entsprechen, werden schlichtweg nicht erkannt und abgearbeitet. Die Eingabe kann entweder durch Eingabe einer Zeichenfolge über die Tastatur erfolgen oder durch Einsprechen eines Steuerungsbefehls in ein Mikrofon, das mit einem Spracherkennungssystem verbunden ist. Unabhängig davon, .auf welche Art der Steuerungsbefehl eingegeben wird, ist es' in jedem Fall erforderlich, daß der eingegebene bzw. erkannte Steuerungsbefehl genau einem durch die Com- putersoftware vorgegebenen Steuerungsbefehl entspricht.

Die US 5,737,485 zeigt eine Vorrichtung zur Spracherkennung, in- welcher sowohl hinter einem Mikrofon zum Nahsprechen als auch hinter einer Mikrofonanordnung zur Raumerfassung Merkmalsextra- hierer vorgesehen sind, die aus einer phonetischen Lautfolge eine Merkmalsabfolge bilden. Die Merkmalsabfolgen der Nah- und Raumerfassung werden einem neuronalen Netzwerk zugeführt, welches dazu vorgesehen ist in einer Lernphase Korrelationen zwischen gestörten Merkmalen und weitgehend störungsfreien Merkmalen zu erkennen und später in der Spracherkennung gestörte Merkmale entsprechend dem gelernten Wissen durch weitgehend störfreien Merkmale zu ersetzen, bevor die Merkmale einer Spracherkennung zugeführt werden. Nachteil dieser Vorrichtung ist die _.Unfähigkeit des Systems dynamisch auf Veränderungen in der Lauterzeugung zu reagieren. Weitrehin wird die Erkennung undeutlich gesprochener Wörter durch das System nicht verbessert.

Die DE 198 04 603 zeigt ein Spracherkennungssystem das aus einer phonetischen Abfolge eine Merkmalsabfolge in Form von Testsignalen generiert. Diese Testsignale werden dann mit lexikalischem Wissen in Form von Referenzsignalen, verglichen, wobei Folgen von Refernzsignalen Wörter darstellen, die aus einem Trainingssignal erhalten werden. Die Spracherkennung soll dadurch verbessert werden, dass die Merkmale in Form der Testsignale nicht nur mit dem so erlernten Vokabular verglichen werden sondern auch mit erlernten Kombinationen von Satzelementen, die mit höherer Wahrscheinlichkeit vorkommen. Die Genauigkeit der

I sprackerkennung bei undeutlich ausgesprochenen Wörtern wird

[hierdurch jedoch nicht verbessert.

Es ist nun Ziel der vorliegenden Erfindung, ein Verfahren und eine Vorrichtung zu schaffen, die eine Eingabe unformatierter Sprache oder Befehle erlauben, die eine verbesserte Erkennung der Sprache oder Befehle auch dann ermöglichen, wenn diese undeutlich, in veränderter Weise ausgesprochen oder durch verschiedene Personen ausgesprochen werden.

Die Erfindung wird gelöst durch ein Verfahren gemäß Anspruch 1 und durch eine Vorrichtung gemäß Anspruch 9 gelöst. Vorteilhafte Weiterbildungen der Erfindung sind Gegenstand der zugeordneten Unteransprüche.

Erfindungsgemäß wird die eingegebene Zeichenfolge oder phonetische Lautfolge einem neuronalen Netzwerk zugeführt, in welchem die Zeichenfolge entweder aufgrund phonetischer, semantischer und/oder lexikalischer gespeicherter Informationen oder bloß basierend auf Trennmarken (z.B. Leerzeichen, Sprechpause) in der Zeichenabfolge in einzelne Merkmale zerlegt wird. Diese Merkmale können kurze Zeichenketten/Wörter oder bestimmte Laute und Lautkombinationen sein. Basierend auf dieser Merkmalsabfolge stellt das neuronale Netz Merkmalskombinationen zusammen, die unter Berücksichtigung der Informationen aus einem Lexikon mit lexikalischen, semantischen und/oder phonetischen Informationen derart kombiniert werden, dass sie einen definierten Aussagegehalt haben. Das neuronale Netzwerk bildet viele dieser Merkmalskombinationen und vergleicht diese in Form zeitlich codierter Neuronen mit der Merkmalsabfolge. Es wird schließlich der Aussagegehalt derjenigen Merkmalskombination verwendet, die unter Minimierung der Widersprüche eine weitgehende Übereinstimmung mit der Merkmalsabfolge aufweist. Der definierte Aussagegehalt kann anschließend gegebenenfalls entsprechend einem vorgegebenen Befehlssatz einer Computersoftware in einen ausführbaren Befehl transformiert werden, der eine Aktion wie z.B. Ausgabe, Abfrage etc. bewirkt.

Führt der sequentiell durchgeführte Vergleich der Merkmalsabfolge mit den vom neuronalen Netzwerk aufgestellten Merkmalskombination zu keinem befriedigenden Ergebnis, so kann versucht werden, Teile der Merkmalsabfolge, die eine relativ gute Übereinstimmung mit einer Merkmalskombination zeigten, unverändert zu lassen und beispielsweise unter Zuhilfenahme einer Fuzzy Logic diejenigen Teile der Merkmalsabfolge zu verändern, die keine oder nur eine geringe Übereinstimmung mit den Merkmalskombinationen aufwies.

Wird bei dem Vergleich mit allen Merkmalskombinationen insge- samc kein zufriedenstellendes Ergebnis erzielt, so wird die in dem neuronalen Netzwerk gebildete Merkmalsabfolge neu definiert z.B. indem bei einer Lautabfolge die zusammenhängenden Laute, d.h. Merkmale anders definiert und zusammengestellt werden. Mit der neu gebildeten Merkmalsabfolge kann nun wiederum ein Vergleich mit den seitens des neuronalen Netzwerkes gefundenen Merkmalskombinationen durchgeführt werden.

Wenn sich lediglich eine Teilübereinstimmung der Merkmalsabfolge mit einer Merkmalskombination ergibt, kann der übereinstimmende Teil in einer Anzeige- oder Ausgabeeinheit als erkannt dargestellt werden und nach erneuter Eingabe des unerkannten Teils gefragt werden.

Vorzugsweise ist in dem Speicherbereich für das lexikalische und/oder semantische Wissen ein temporärer Speicherbereich vorgesehen, in dem aus der gerade zurückliegenden Erkennungstätig- keit erkannte, übereinstimmende Merkmale und Merkmalskombinationen abgelegt werden, auf die das neuronale Netz bei der Bildung der Merkmalskombinationen bevorzugt zugreift. Auf diese Weise fokussiert sich das System selbst auf einen angesprochenen Themen- bzw. Aussagebereich. Hierdurch wird die Erkennung der Zeichen oder Lautabfolge beträchtlich verbessert.

Durch die Erfindung wird erreicht, daß man Fragen oder Befehle völlig formlos und ohne Wissen einer Befehlssprache oder Befehlsterminologie in ein Eingabeterminal eingeben kann und damit gesteuert durch Sofcware bestimmte Aktionen auslösen kann. Das erfindungsge äße Verfahren und die erfindungsgemäße Vorrichtung übernehmen hierbei die Funktion der Schnittstelle zwischen der formlosen willkürlichen subjektiven Eingabe und dem seitens der ComputerSoftware erforderlichen vorgegebenen Befehlssatz. Die Erfindung fungiert als intelligente Schnittstelle, die sich auf subjektive Eigenheiten in der Eingabe einstellt und selbständig die Erkennung auf bestimmte Themen bzw. Aussage- oder Befehlsbereiche fokussiert.

In dem Speicher für das lexikalische Wissen können Zeichenabfolgen oder Lautfolgen zusammen mit ihrem Aussagegehalt und semantischer Information abgelegt sein, so daß es dem neuronalen Netz möglich ist , in der zusammengestellten Merkmalskombination aufgrund der semantischen Information sinnvolle Aussagegehalte der Merkmalskombination zu generieren, die klanglich oder von der Zeichenabfolge her in die Nähe der Merkmalsabfolge kommen . Die Nähe kann anhand charakteristischer Vokalfolgen, Konsonantenfolgen oder Vokal- /Konsonanten-Kombinationen erkannt werden .

Die Vorrichtung zum Erkennen der 3edeu ung bzw . der Aussage der phonetischen Lautfolge oder Zeichenfolge muß eine Eingabevorrichtung umfassen, in die ein Text eingesprochen oder beispielsweise über eine Tastatur eingegeben werden kann . Während bei einer eingegebenen Zeichenfolge die Merkmalsabfolge durch Trennzeichen wie z .B . Leerzeichen in der Regel vorgegeben ist , r muß die Merkmalsabfolge bei einer phonetischen Lautabfolge durch das neuronale Netz selbst gebildet werden. Sie bedient sich dabei des gespeicherten lexikalischen und semantischen Wissens in den Speicherbereichen, auf die das neuronale Netzwerk zurückgreift .

Die Bildung der Merkmalsabfolge kann durchgeführt werden unter Verwendung der associative word-recognition, wobei aus Lauten oder Zeichenbestandteilen Laut- bzw. Zeichenabfolgen gebildet werden, deren Existenz in der Laut- bzw. Zeichenabfolge durch einen Vektor dargestellt wird. Zusätzlich kann der Vektor noch Aussagen, z.B. semantischer Art, enthalten und/oder Aussagen im Zusammenhang mit vorgegebenen Steuerungsparametern einer Co pu- tersofcware. Die Erkennung kann dann durch Vergleich des Vektors der eingegebenen Laut- oder Zeichenfolge mit gespeicherten Vektoren realisiert werden.

Bei der Bildung der Merkmalskombination durch das neuronale Netzwerk kann letztendlich die Bildung der Merkmalskombination gleich unter Zugrundelegung eines Aussagegehalts erfolgen, der als vorgegebener Steuerungsbefehl einer Computersoftware unmit- telbar eine bestimmte Aktion veranlaßt. Der Merkmalsvergleich kann jedoch auch mit Merkmalskombinationen erfolgen, die überhaupt eine sinnvolle Aussage beinhalten. -Diese übereinstimmende Merkmalskombination kann anschließend daraufhin überprüft werden, ob diese sinnvolle Aussage mit einem vorgegebenen Steuerungsbefehl übereinstimmt.

Die Erfindung wird nachfolgend beispielsweise anhand der schematischen Zeichnung beschrieben.

Fig. 1 zeigt eine Erkennungsvorrichtung 10 für phonetische Fol-

| gen oder Zeichenfolgen, die über ein Eingabegerät 12 eingegeben 'werden. Das Eingabegerät kann beispielsweise eine Tastatur oder | ein Mikrophon sein. Der phonetische String. oder Zeichenstring ¹ wird ^" ann einem neuronalen Netzwerk 14 zugeführt, das mit einem

¹ ' j großen- Wissensspeicher 16 verbunden sind, .in dem lexikalisches | semantisches Wissen als auch Wissen über die korrespondierenden phonetischen Eigenschaften der lexikalischen Begriffe abgelegt sind. In dem Speicher 16 ist ein temporärer Speicher 18 enthalten, dessen Bedeutung später noch näher umschrieben wird. Das neuronale Netzwerk ist weiterhin mit einer Fuzzy Logik 20 verbunden, die dazu dient, nicht als übereinstimmend erkannte Merkmale oder Merkmalskombinationen zu bearbeiten. Ferner ist das neuronale Netzwerk 14 mit einer Ausgabeschnittstelle 22 verbunden, innerhalb der zulässige Befehlssätze für gewünschte Aktionen z.B. eine Ausgabe oder eine Abfrage oder dergleichen abgelegt sind.

Die Tätigkeit der Erkennungsvorrichtung aus Fig. 1 wird nachfolgend beschrieben. Der in das neuronale Netzwerk 14 überführte Zeichenstring oder phonetische String wird in eine Abfolge von Merkmalen gegliedert. Diese Gliederung kann entweder aufgrund von Trennzeichen in einer Zeichenfolge oder beispielsweise aufgrund von Sprechpausen in einer phonetischen Abfolge er- folgen. Die Gliederung kann jedoch auch basierend auf Informationen aus dem Speicher 16 erfolgen. Die untergliederten Einzelbestandteilen der Abfolge bilden Merkmale, so dass die phonetische oder Zeichenabfolge in eine Merkmalsabfolge überführt wird, die in dem neuronalen Netzwerk auf ihren Bedeutungsgehalt untersucht werden kann. Diese Erkennung des Bedeutungsinhalts wird realisiert durch einen Vergleich mit zeitcodierten Neuronen. Das neuronale Netz stellt Hypothesen in Form von Merkmalskombinationen auf, die ähnlich zur Merkmalsabfolge sind und einen definierten Aussagegehalt haben. Das neuronale Netzwerk bildet entsprechend dem zur Verfügung stehenden semantischen und lexikalischen Wissen aus dem Speicher 16 eine große Anzahl an derartigen Merkmalskombinationen, die zeitlich nacheinander mit der Merkmalsabfolge des phonetischen oder Zeichenstrings verglichen werden.'^' In Fig. 2 ist ein derartiges Vergleichsschema dargestellt: Hierbei, zeigt die Abszisse eine Auflistung ü- bereinstimmender Merkmale, im vorliegenden Beispiel von ιl bis 6, und die Ordinate stellt eine Zeitachse dar, die den Vergleich der Merkmalsabfolge des phonetischen oder Zeichenstrings mit den Merkmalskombinationen unterschiedlicher Hypothesen Hl bis H4 zeigt. Für jede Hypothese wird die Anzahl der Widersprüche zu den Merkmalen der Merkmalsabfolge und/oder zum lexikalischen/semantischen Wissen und/oder zum Befehlssatz der Datenschnittstelle 22 ermittelt. In einem ersten Zeitpunkt werden alle vier Hypothesen Hl bis H4 mit der Merkmalsabfolge verglichen. Nach dem ersten Vergleich wird eine Hypothese mit den meisten Widersprüchen eliminiert. Zum zweiten Zeitpunkt werden die verbleibenden Hypothesen abermals, gegebenenfalls unter Berücksichtigung neuer Parameter (Befehlssatzkompatibilität etc.) verglichen. Dies führt wiederum zum Herausfallen der widersprüchlichsten Hypothese. Die Vergleiche werden so oft durchgeführt, bis eine Hpothese (Merkmalskombination) übrigbleibt, die eine gute Übereinstimmung zur Merkmalsabfolge und die wenigsten Widersprüche aufweist. Als Aussagegehalt der Merkmalsabfolge wird derjenige Aussagegehalt definiert, der der verbleibenden Hypothese zugeordnet ist. In dem Vergleich wurde bereits als ein Parameter berücksichtigt, ob die Aussage der Merkmalskombi- nation mit einem Befehl der Ausgabeschnittstelle 16 übereinstimmt oder sich in einen derartigen Befehl transformieren läßt.

Falls sich bei dem Merkmalsvergleich herausstellt, dass die Merkmalskombination nur in Teilbereichen mit einer Hypothese übereinstimmt, kann durch Einspeisen des nicht erkannten Teils der Abfolge in die Fuzzy Logik 20 in Verbindung mit dem lexikalischen und semantischen Wissen aus dem Speicher 16 versucht werden, die unerkannte Merkmalsabfolge unter Gewichtung der

Reihenfolge und des Zusammenwirkens der Merkmale mit ähnlichen bekannten Merkmalskombinationen zu vergleichen, wobei die Abfolge der Merkmale als zusätzlicher Parameter bei der Gewichtung der Ähnlichkeit berücksichtigt werden kann. Auf diese Weise können unerkannte phonetische oder Zeichenfolgen möglicherweise durch Interpretation der Abfolge doch erkannt werden. Falls auch dieses Verfahren zu keinem Ergebnis führt, kann auf einem Display der erkannte Zeichen- oder Lautbestandteil angezeigt werden, und nach der Bedeutung, Beschreibung oder geänderten Eingabe des nicht erkannten phonetischen oder Zeichenstrings gefragt werden. Auf diese Weise wird der bedienenden Person vermittelt, welche Aussagen sie präzisieren muß.

Selbstverständlich führen nur zumindest weitgehend übereinstimmende Hypothesen zu einem Erfolg, deren Aussage mit dem Befehlssatz einer Ausgabe- oder Aktionsschnittstelle 22 korrespondiert. Dem kann entweder dadurch Rechnung getragen werden, dass das neuronale Netzwerk nur Hypothesen aufstellt, deren Aussagegehalt mit dem Befehlssatz der Ausgabeschnittstelle korrespondiert oder dass als übereinstimmend oder weitgehend übereinstimmend erkannte Hypothesen (Merkmalskombinationen) nur dann verwendet werden, wenn dem Aussagegehalt dieser Hypothesen in einem nachfolgenden Vergleichsvorgang ein Befehl aus dem Befehlssatz der Ausgabeschnittstelle 22 zugeordnet werden kann. Die Ausgabeschnittstelle 22 kann der Eingabebereich eines Com- puterprogrammes oder unterschiedlicher Computerprogramme sein, durch die unterschiedliche Aktionen veranlaßt werden können. So könnte beispielsweise die Erkennungsvorrichtung 10 in einem Auskunfts- oder Informationsterminal eines Flughafens oder der Bahn verwendet werden. Durch eine derartige Erkennungsvorrichtung können auch Terminals oder Computer gesteuert werden, um Zugriff auf Datenbestände zu ermöglichen, wobei das System in der .Lage wäre, Zuordnungen zwischen unterschiedlichen Daten aufgrund der eingegebenen/eingesprochenen Verknüpfungen selbst neu zu erstellen. Ein derartiges Terminal könnte somit nicht nur dazu verwendet werden, Daten auszugeben, sondern auch Daten neu zusammenzustellen bzw. neue Daten zu .generieren. Vorzugsweise enthält die Vorrichtung ein Display zur Darstellung des aus der Zeichen- oder phonetischen Abfolge bekannten bzw. abgeleiteten Befehls, der gegebenenfalls seitens der Bedienperson bestätigt werden muß, bevor die Aktion durchgeführt wird. Auf diese Weise läßt sich vermeiden, dass falsche Aktionen gestartet werden.

Claims

Patentansprüche

1. Verfahren zum Erkennen einer phonetischen Lautfolge oder einer Zeichenfolge, z.3. nach dem ASC Il-Standard, mit folgenden Verfahrensschritten: a) Die Abfolge wird einem neuronalen Netz zugeführt, b) in dem neuronalen Netz wird aus der phonecischen Abfolge bzw. Zeichenabfolge unter Berücksichtigung von phonetischen und/oder lexikalischen gespeicherten Informationen und/oder basierend auf einer Zeichenkettenabfolge (Leerzeichen) eine Abfolge von Merkmalen gebildet, c) die gebildete Merkmalsabfolge wird mit einer Merkmalskombination (H) eines definierten Aussagegehaltes verglichen, die aus gespeicherten lexikalischen und semantischen Informationen auf der Basis der Merkmalsabfolge gebildet wird, d) Schritt c) wird solange mit neuen Merkmalskombinationen wiederholt, bis unter Minimierung von Widersprüchen eine mit der Merkmalsabfolge zumindest weitgehend übereinstimmende Merkmals ombination gefunden wird, e) der Aussagegehalt der Merkmalskombination mit den wenigsten Widersprüchen wird dann als Resultat ausgegeben und/oder eine dem Aussagegehalt dieser MerkmalsKombination zugeordnete Aktion wird durchgeführt, wenn dieses Resultat plausibel ist, andernfalls wird durch das neuronale Netz eine neue definierte Merkmalsabfolge gemäß b) gebildet und die Schritte c) bis e) werden wiederholt.

2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß der Aussagegehalt einer übereinstimmenden Merkmals ombination nur dann als Resultat ausgegeben wird, wenn dieser Aussagegehalt in einem gespeicherten Bereich zulässiger Aussagegehalte enthalten ist.

3. Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, daß in vorhergehenden Erkennungsschritten erkannte übereinstimmende Merkmalskombinationen in einem temporären Speicher gespeichert werden, und daß die in dem temporären Speicher zwischengespeicherten Merkmale und/oder Merkmalskombinationen bevorzugt für einen Merkmalsvergleich verwendet werden.

4. Verfahren nach Anspruch 3, dadurch gekennzeichnet, daß die in dem temporären Speicher gespeicherten Informationen auf der Basis gespeicherter lexikalischer Informationen einem bestimmten Aussagebereich oder Themenbereich zugeordnet werden, und primär Merkmale aus diesem Aussagebefeich oder Themenbereich zur Bildung der Merkmalskombinationen verwendet werden.

5. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, daß wenn keine übereinstimmende Merkmalskombination gefunden wird, auf der Basis einer Merkmalskombination mit möglichst vielen Merkmalsübereinstimmungen der nicht übereinstimmende Teil der Abfolge verändert und die veränderte Abfolge der Erkennung in Schritt c) zugeführt wird.

6. Verfahren nach Anspruch 5, dadurch gekennzeichnet, daß der nicht übereinstimmende Teil der Merkmalsabfolge unter Verwendung einer Fuzzy Logik verändert wird, wobei die Veränderung des nicht übereinstimmenden Teils der Merkmalsabfolge unter Berücksichtigung der Ähnlichkeit und Abfolge der Merkmale mit der Abfolge in Merkmalskombinationen (H) definierten Aussagegehalts vorgenommen wird, sofern diese Ähnlichkeit einen definierten Wert oder Wertebereich überschreitet.

7. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, daß wenn keine übereinstimmende Merkmalskombination gefunden wird, die Merkmalsabfolge in Schritt b) neu definiert und der Erkennung in Schritt c) zugeführt wird.

8. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, daß bei der Bildung der Merkmalsabfolge Vektoren gebildet werden, die charakteristisch für die Abfolge und/oder Eigenschaften von phonetischen oder Zeichenseguenzen sind, und daß der Merkmalsvergleich anhand des Vergleichs dieser Vektoren durchgeführt wird.

9. Vorrichtung zum Erkennen der Bedeutung einer phonetischen Lautfolge oder einer Zeichenfolge, z.B. nach dem ASC II- Standard, mit folgenden Bestandteilen:

Einer Eingabevorrichtung (12) zur Spracheingabe und/oder zur Eingabe von Zeichen, z.B. eine Tastatur, einem neuronalen Netzwerk (14), das die in der Eingabevorrichtung eingegebene phonetische - oder Zeichenabfolge aufnimmt, einem Speicher (16) mit lexikalischem, semantischen und/oder phonetischen Informationen, einer ersten Ebene des neuronalen Netzwerkes, die unter Berücksichtigung der Informationen im Speicher aus der phonetischen oder Zeichenabfolge eine Merkmalsabfolge bildet, einem Speicherbereich (22) mit zulässigen Aussagegehalten oder Befehlssätzen, einer zweiten Ebene des neuronalen Netzwerkes, die unter Verwendung der Informationen aus dem Speicher Merkmalskombinationen mit einem definierten Aussagegehalt bildet, einer Vergleichsvorrichtung zum Vergleichen der Merkmals_¬ abfolge mit den Merkmalskombinationen, einer Bewertungseinrichtung zur Bewertung von Widersprü_¬ chen von aufgestellten Merkmalskombinationen mit der Merk_¬ malsabfolge und/oder den im Speicher gespeicherten lexika_¬ lischen/semantischen Informationen und gegebenenfall s den Befehlssätzen im Speicherbereich (22 ) , einer Vorrichtung, die ergebnisabhängig die erste Ebene des neuronalen Netzwerkes zur Bildung einer neuen Merkmalsabfolge veranlasst , einer Ausgabeeinrichtung zur Anzeige des Aussagegehalts der am wenigsten widersprüchlichen Merkmalskombination und/oder einer Einrichtung zum Durchführen einer dem Aussagegehalt dieser Merkmalskombination zugeordneten Aktion .

10. Vorrichtung nach Anspruch 9, gekennzeichnet durch eine Fuzzy Logik (20) zur Änderung zumindest eines Teils einer Merkmalsabfolge unter Berücksichtigung der Ähnlichkeit und Abfolge der Merkmale mit im Speicher gespeicherten Merkmalskombi ationen, welche Fuzzy Logik ausgangs- seitig mit der zweiten Ebene verbunden ist.

11. Vorrichtung nach Anspruch 9 oder 10, gekennzeichnet durch einen temporären Speicher, der erkannte Merkmalskombinationen aus den letzten Erkennungen speichert, welcher temporäre Speicher ausgangsseitig mit der zweiten Ebene des neuronalen Netzwerkes verbunden ist.

12. Vorrichtung nach einem der Ansprüche 9 bis 11, gekennzeichnet durch eine Vorrichtung, die ergebnisabhängig die erste Ebene des neuronalen Netzwerkes zur Bildung einer neuen Merkmalsabfolge veranlaßt.