DE4216455A1 - Sprachsteuereinrichtung - Google Patents

Sprachsteuereinrichtung

Info

Publication number
DE4216455A1
DE4216455A1 DE19924216455 DE4216455A DE4216455A1 DE 4216455 A1 DE4216455 A1 DE 4216455A1 DE 19924216455 DE19924216455 DE 19924216455 DE 4216455 A DE4216455 A DE 4216455A DE 4216455 A1 DE4216455 A1 DE 4216455A1
Authority
DE
Germany
Prior art keywords
switch
similarity
voice command
pressed
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
DE19924216455
Other languages
English (en)
Other versions
DE4216455C2 (de
Inventor
Keiichi Miyamoto
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from JP3349915A external-priority patent/JPH0535291A/ja
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Publication of DE4216455A1 publication Critical patent/DE4216455A1/de
Application granted granted Critical
Publication of DE4216455C2 publication Critical patent/DE4216455C2/de
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/10Speech classification or search using distance or distortion measures between unknown speech and reference templates

Description

Die Erfindung betrifft eine Sprachsteuereinrichtung nach dem Oberbegriff des Anspruchs 1 und betrifft insbesondere eine Sprachsteuereinrichtung, um automatisch ein sprachbetriebenes System durch eine Spracheingabe durch einen Benutzer automa­ tisch zu betreiben, wobei die Spracheingabe durch eine spre­ cherabhängige Spracherkennung erkannt wird. In dieser Einrich­ tung wird ein Sammeln bzw. Anhäufen von Vokabularwörtern in einem Wörterbuch entsprechend jeder der Erkennungsstufen für eine hohe Erkennungsgenauigkeit und -geschwindigkeit durchge­ führt.
Es ist bereits ein Spracherkennungssystem entwickelt worden, bei welchem eine seiner Anwendungen eine Spracheingabeeinrich­ tung ist, die in einem Personalcomputer, einem Wortprozessor und anderen Computersystemen verwendet worden ist. Im allge­ meinen sind Spracheingaben, welche durch das Spracherken­ nungssystem identifiziert werden, diskrete Meldungen, die von einem Benutzer in ein Mikrophon des Systems gesprochen worden sind, und die meisten Spracheingaben stellen einen Steuerbefehl, um ein sprachbetriebenes System zu betreiben, oder ein Steuerobjekt dar, das von einem Computersystem iden­ tifiziert worden ist. Wie bei der Spracherkennung sind die Erkennungsgenauigkeit und -geschwindigkeiten wichtige Merk­ male. Wenn die Anzahl an Vokublarworten, welche von dem Spracherkennungssystem erkannt werden müssen, zunimmt, wird die Erkennungsgenauigkeit geringer und die erforderliche Erkennungszeit wird größer. Um eine hohe Erkennungsgenauig­ keit und -geschwindigkeit zu erhalten, sollte bei dem Sprach­ erkennungssystem eine mimimale Anzahl an Vokabularworten ver­ wendet werden, welche für die jeweiligen Erkennungsstufen notwendig sind, die in dem System aufgetreten sind.
Beispielsweise enthält eine Sprachsteuereinrichtung zum Be­ treiben einer Wagenstereoeinheit in einem Kraftfahrzeug das Spracherkennungssystem, um eine von einem Benutzer eingegebe­ ne Sprache als einen Befehl zu erkennen, um die Einheit zu be­ treiben, um auf diese Weise automatische Operationen der Wa­ genstereoeinheit durchzuführen. Ebenso führt die Einrichtung ein automatisches Ein-/Ausschalten einer Klimaanlage in dem Kraftfahrzeug durch sowie ein automatisches Öffnen und Schlie­ ßen von Fensterscheiben in Türen der Kraftfahrzeuge durch.
Für eine solche Anwendungseinrichtung sollte eine minimale Anzahl an Vokabularworten verwendet werden, welche ent­ sprechend den jeweiligen Erkennungsstufen, die von dem Sprachsteuersystem angetroffen worden sind, erkannt werden können. Die Erkennungsstufen entsprechen Operationen, welche von einer sprachbetriebenen Einheit entsprechend Spracheinga­ ben des Sprachsteuersystems durchgeführt worden sind.
Zu diesem Zweck ist ein Befehlswörterbuch, in welchem mit Spracheingaben zu vergleichende Vokabularworte gespeichert sind, gemäß der Kategorie in einige Gruppen unterteilt, (wobei diese nachstehend als Teilwörterbücher bezeichnet werden). Jedes der Teilwörterbücher wird durch eine Identifizierungs- oder Kennummer ID identifiziert. Derartige Kennnummern sind den Vokabularworten in dem Wörterbuch zugeordnet, und es müs­ sen daher die Vokabularworte zusammen mit den zugeordneten Kennummern in das Wörterbuch des Sprachsteuersystems einge­ geben werden, so daß sie programmiert werden. Wenn ein Befehl von einem Benutzer in das Mikrophon des Sprachsteuersystems gesprochen wird, wird eine Kenn- oder ID-Nummer entsprechend dem Befehl spezifiziert, bevor die Spracherkennung gestartet wird. Dann wählt das Sprachsteuersystem eine Teilgruppe von Vokabularwörtern aus dem Wörterbuch vorher aus, wobei die Wörter eine zugeordnete Kennummer haben, die mit der spezi­ fizierten ID-Nummer übereinstimmt. Die Spracheingabe wird da­ durch erkannt, daß sie nur mit den Vokabularworten verglichen wird, die in dem durch die ID-Nummer spezifizierten Teil­ wörterbuch enthalten sind. Hierdurch ist es ermöglicht, daß das Sprachsteuersystem nur einen schmalen Bereich des Wörter­ buchs benutzt.
In Fig. 7 ist ein Befehlswörterbuch des vorerwähnten Typs dar­ gestellt, welches in einem herkömmlichen Sprachsteuersystem zum Betreiben einer Wagenstereoeinheit vorgesehen ist. Dies Wörterbuch ist in drei Teilwörterbüchern gemäß den Bedienun­ gen der Wagenstereoeinheit unterteilt, von denen jede durch eine Kenn- oder ID-Nummer identifiziert wird. Diese Wagen­ stereoeinheit hat drei Betriebsarten, und die Teilwörterbü­ cher entsprechen den einzelnen Betriebsarten. In Fig. 7 ist dieselbe ID-Nummer Vokabularworten in jeder der Teilwörter­ bücher zugeteilt, und solche Wörter mit derselben ID-Zahl sind Sprachbefehle, die wirksam nur bei der entsprechenden Betriebsart verwendet werden können.
Gemäß den Betriebsarten der Wagenstereoeinheit hat das Sprachsteuersystem drei Erkennungsstufen, nämlich eine "Radio"-, eine "Kassetten"- und eine "Radio/Kassetten"-Stufe. Gespro­ chene Worte, welche von dem Sprachsteuersystem in der "Radio"-Stufe richtig empfangen werden können, sind auf "Abtasten" bzw. "Suchen (scan) und "Kassette" in dem Wör­ terbuch beschränkt, und es ist ID = 1 diesen Sprachbefehlen zugeordnet. Gesprochene Wort im Falle der "Kassetten"-Stufe sind auf "Wiedergabe (play)", "Vorwärtsspulen (forward feed)", "Rückspulen (rewind)" und "Radio" in dem Wörterbuch begrenzt, und ID = 2 ist diesen Befehlen zugeordnet. Gesprochen Worte im Falle der "Radio/Kassette"-Stufe sind nicht be­ schränkt, und "Lautstärke laut (volume up)" und "Lautstärke leise (volume down) können in einer der drei Erkennungsstu­ fen erkannt werden. ID = 0 ist solchen Befehlen zugeordnet, und es wird nachstehend als umfassende ID- oder Kennummer bezeichnet. In diesem Fall ist die globale ID-Nummer ID = 0, und sie ist den Sprachbefehlen zugeordnet, welche der "Radio/ Kassetten"-Stufe entsprechen.
Wenn eine Spracheingabe in die "Radio"-Stufe gegeben wird, spezifiziert das Sprachsteuersystem die ID-Nummer, die ent­ weder gleich 0 oder 1 ist, und wählt vorher eine Teilgruppe von Vokabularworten aus dem Befehlswörterbuch aus, wobei die Worte eine zugeordnete ID-Nummer haben, welche mit der spe­ zifizierten ID-Nummer übereinstimmt. Die Spracheingabe wird dadurch erkannt, daß sie nur mit solchen Worten in dem Teil­ wörterbuch verglichen wird, welches durch die ID-Nummer spezifiziert worden ist. In der "Kassetten"-Stufe ist die ID-Nummer so spezifiziert, daß sie entweder gleich 0 oder 2 ist. Jedoch ergibt sich eine Schwierigkeit, daß ein Befehlsein­ gabeprozeß (oder ein Trainingsmode des Spracherkennungssy­ stems), welcher die ID-Numerierung erfordert, für den Be­ nutzer lästig ist. Wenn die festgelegte ID-Nummer von dem Sprachsteuersystem festgelegt wird, kann der Benutzer den Sprachbefehl nicht frei wählen, wenn das sprachbetriebene System in einem speziellen Betriebsmode arbeitet. In einem sprecherunabhängigen Spracherkennungssystem sind eine Folge notwendiger Operationen und ein Befehlswörterbuch vorpro­ grammiert. Ein Benutzer kann ein solches Spracherkennungs­ system benutzen, ohne daß von ihm selbst gesprochene Befehle in das Wörterbuch eingegeben werden müssen. Jedoch sind die Anzahl und die Art verwendbarer Worte zum Identifizieren der von dem System durchgeführten Operationen begrenzt und fest­ gelegt, und der Benutzer kann einen Befehl zum Betreiben des Systems nicht frei wählen. In einem sprecherabhängigen Sprach­ erkennungssystem kann ein gewünschter Sprachbefehl in das Wörterbuch eingegeben werden. Jedoch ist ein Prozeß zum Ein­ geben von Sprachbefehlen in das Wörterbuch schwierig zu ver­ walten, und der Benutzer kann nicht ohne weiteres den Befehls­ eingabeprozeß ausführen. Üblicherweise werden in dem spei­ cherabhängigen System Sprachbefehle in das Wörterbuch durch Bestimmen einer Wortzahl eingegeben, die jeden der Befehle identifiziert. Jedoch gibt es dann noch das weitere Problem, daß der Benutzer eine derartige Identifizierungszahl in dem Befehleingabeprozeß nennen muß, was für den Benutzer unbequem und lästig ist. Außerdem muß in dem Spracherkennungssystem eine größere Anzahl von Steuerschaltern vorgesehen sein und es weist einen komplizierten Aufbau auf, wenn die Anzahl an Sprachbefehlen in dem Wörterbuch größer wird. Es sollte daher ein einfaches und preiswertes System für den Benutzer ge­ schaffen werden.
Gemäß der Erfindung soll daher ein verbessertes Sprachsteuer­ system geschaffen werden, in welchem die vorerwähnten Schwie­ rigkeiten beseitigt sind, an welchem eine minimale Anzahl in Vokabularworten von einem Wörterbuch aus entsprechend einer Erkennungsstufe mit einer hohen Erkennungsgenauigkeit und -geschwindigkeit vorher ausgewählt werden, in welchem ferner Sprachbefehle ohne weiteres in ein Wörterbuch eingegeben werden, ohne eine Wortidentifizierungs- oder Kennzahl ver­ walten zu müssen, in welchem ferner Attributdaten, welche eine Befehlbarkeit anzeigen, von einem Benutzer ohne weiteres in Sprachbefehlen gegeben werden, und welches Sprachsteuer­ system schließlich einen einfachen und leicht zu bedienen­ den Tastenschalterteil mit einem kombinierten Tastenschalter aufweist, welcher zwei oder mehr Funktionen einer sprachbe­ triebenen Einheit betätigt.
Gemäß der Erfindung ist dies bei einer Sprachsteuereinrich­ tung nach dem Oberbegriff des Anspruchs 1 durch die Merkmale in dessen kennzeichnenden Teil erreicht. Vorteilhafte Wei­ terbildungen sind Gegenstand der auf den Anspruch 1 unmittel­ bar oder mittelbar rückbezogenen Ansprüche.
Nachfolgend werden bevorzugte Ausführungsformen unter Bezug­ nahme auf die anliegenden Zeichnungen im einzelnen erläutert. Es zeigen:
Fig. 1 ein Blockdiagramm einer ersten Ausführungsform einer Sprachsteuereinrichtung gemäß der Erfindung;
Fig. 2 ein Diagramm zum Erläutern der Inhalte eines Merkmalparameter-Wörterbuchs;
Fig. 3 eine schematische Darstellung eines Bedienungsfelds einer Wagenstereoeinheit, in welcher die Erfindung angewendet wird;
Fig. 4 ein Diagramm zum Erläutern der Inhalte des Merkmal­ parameter-Wörterbuchs mit einem auf den neuesten Stand gebrachten Cluster- oder Mehrfachdatenset;
Fig. 5 ein Diagramm, welches die Inhalte eines Cluster­ datensets wiedergibt, welches einem spezifischen Sprachbefehl entspricht;
Fig. 6 eine schematische Darstellung eines anderen Bedie­ nungsfeldes der Wagenstereoeinheit, deren Bedie­ nungsfeld gegenüber Fig. 3 verbessert ist;
Fig. 7 ein Diagramm zum Erläutern des Inhaltes eines herkömmlichen Merkmalparameter -Wörterbuchs;
Fig. 8 ein Blockdiagramm einer zweiten Ausführungsform der Sprachsteuereinrichtung gemäß der Erfindung;
Fig. 9 eine schematische Darstellung eines Bedienungs­ feldes der Wagenstereoeinheit, welche zusammen mit der Sprachsteuereinrichtung der Fig. 8 ver­ wendet ist;
Fig. 10 eine schematische Darstellung noch eines weiteren Bedienungsfeldes der Wagenstereoeinheit, deren Bedienungsfeld gegenüber demjenigen der Fig. 9 ver­ bessert ist;
Fig. 11 ein Blockdiagramm einer dritten Ausführungsform oder Sprachsteuereinheit gemäß der Erfindung;
Fig. 12 eine schematische Darstellung eines Bedienungs­ feldes der Wagenstereoeinheit, deren Bedienungs­ feld gegenüber demjenigen der Fig. 9 verbessert ist, und
Fig. 13 ein Diagramm zum Erläutern von Änderungen von Be­ dienungsbedingungen der Wagenstereoeinheit ent­ sprechend einer Spracheingabe in der Sprachsteuer­ einrichtung.
Anhand von Fig. 1 wird nunmehr eine erste Ausführungsform einer Sprachsteuereinrichtung gemäß der Erfindung beschrie­ ben. In Fig. 1 hat die Sprachsteuereinrichtung einen Merk­ malextrahierteil 1, um einen Merkmalparameter aus einer Sprach­ eingabe über ein Mikrophon zu extrahieren, ein Merkmalpara­ meter-Wörterbuch 2 zum Speichern einer Gruppe von Standard- Merkmalparametern, welche einer Gruppe von Standard-Sprachbe­ fehlen entsprechen, einen Ähnlichkeitsprüfteil 3, einen Aus­ gabeteil 4, einen Steuerteil 5, einen Tastenschalterteil 6, einen Vorwählteil 7 und einen Cluster- oder Mehrfachdaten­ teil 8. Der Merkmalextrahierteil 1 extrahiert einen Merkmal­ parameter aus der Spracheingabe. Nachdem die Spracheingabe empfangen ist, wählt der Vorwählteil 7 nur eine Teilgruppe von Standardmerkmalparametern aus den in dem Speicher 2 ge­ speicherten Standardmerkmalparametern aus. Der Ähnlichkeits­ teil 3 berechnet den Ähnlichkeitsgrad des extrahierten Para­ meters nur in Relation zu der Teilgruppe von Standardmerk­ malparametern, welche durch den Vorauswählteil 7 ausgewählt worden sind. Nachdem die Ähnlichkeitsgrade für alle ausge­ wählten Vokabularworte in dem Wörterbuch 2 berechnet sind, erkennt der Ähnlichkeitsprüfteil 3 die Spracheingabe, indem ein Wort, welches dem Merkmalparameter mit dem höchsten Ähn­ lichkeitsgrad entspricht, aus den Berechnungsergebnissen ausgewählt wird. Der Ausgabeteil 4 gibt schließlich das er­ kannte Wort an eine Anzeigeeinheit ab. In Fig. 2 ist ein An­ fangszustand des Merkmalparameter-Wörterbuchs 3 dargestellt. Der Cluster-Datenteil 8 hat Anfangscluster- oder Mehrfach­ daten, welche anzeigen, daß die ausgewählten Vokabularworte Kandidaten-bzw. Anwärterworte für die Spracheingabe in allen Betriebsarten sind.
In Fig. 3 ist ein Bedienungsfeld einer Wagenstereoeinheit dar­ gestellt, bei welcher die Erfindung verwendet ist. Das Be­ dienungsfeld entspricht dem Tastenschaltteil 6 der Erfindung. Bei diesem Bedienungsfeld sind ein Eingabeschalter 11, ein Startschalter 12 und ein Bestätigungsschalter 13 vorgesehen. Der Eingabeschalter 11 wird gedrückt, wenn ein neuer Sprach­ befehl in die Sprachsteuereinrichtung eingegeben wird, so daß ein entsprechender Merkmalparameter einer solchen Sprach­ eingabe in dem Merkmalparameter-Wörterbuch 2 gespeichert wird. Der Startschalter 12 wird gedrückt, um die Spracher­ kennung für einen von einem Benutzer eingegebenen Sprachbe­ fehl zu starten. Der Bestätigungsschalter 13 wird von dem Benutzer gedrückt, nachdem herausgefunden ist, daß das Er­ gebnis der Spracherkennung richtig ist. Weitere Steuerschal­ ter auf dem Bedienungsfeld der Wagen-Stereoeinheit sind be­ kannt, und brauchen daher hier nicht beschrieben zu werden.
Das in Fig. 3 dargestellte Bedienungsfeld der Wagenstereoein­ heit weist einen Löschschalter 14, einen Ausschließ-(exclude) Schalter 15 und einen Ausschließ-Löschschalter 16 auf. Wenn herausgefunden wird, daß das Erkennungsergebnis sich ent­ sprechend einem von dem Benutzer gesprochenen Spracheingabe von einem gewünschten Ergebnis unterscheidet, wird entweder der Löschschalter 14 oder der Ausschließschalter 15 gedrückt. Wenn der Löschschalter 14 gedrückt wird, erscheint ein Sekun­ där-Kandidatenwort auf einem Display des Bedienungsfeldes. Wenn der Schalter 14 wieder gedrückt wird, erscheint ein anderes Kandidatenwort anstelle des vorerwähnten Sekundär- Kandidaten. Wenn der Bestätigungsschalter gedrückt wird, wenn herausgefunden wird, daß eine korrekte Bezeichnung auf dem Display unter denjenigen Kandidatenworten erscheint, die nacheinander auf dem Display erscheinen, wird eine gewünsch­ te Operation durchgeführt. Wenn dagegen der Ausschließschal­ ter 15 gedrückt wird, tritt die vorerwähnte Änderung von Kan­ didatenworten auf dem Display ein, und außerdem werden ent­ sprechende Clusterdaten in dem Datenteil 8 auf den neuesten Stand gebracht, um so anzuzeigen, daß das gelöschte Wort aus den Eingaben von Sprachbefehlen in dem Merkmalparameter- Wörterbuch 2 ausgeschlossen ist, wenn die Betriebsart der Wagenstereoeinheit wieder auf die aktuelle Betriebsart zu­ rückgekehrt ist.
In Fig. 5 ist ein Clusterdaten-Set in dem Datenteil 8 darge­ stellt; diese Clusterdaten entsprechen einem Befehl "Wieder­ gabe" in dem Merkmalparameter-Wörterbuch 2. In Fig. 5 stellt ein Wert der Zeile "ID" in dieser Aufstellung jeden Betriebs­ mode der Sprachsteuereinrichtung dar und ein Wert der Zeile "AUS" zeigt an, ob ein entsprechender Clusterdatenwert auf "1" eingestellt ist (oder ein inaktiver Clusterdatenwert ist). Wenn beispielsweise die Wagenstereoeinheit in dem Befehlsein­ gabemode ist, wie vorstehend beschrieben ist, wird ein Clusterbit für die Kandidatenworte in dem Merkmalparameter- Wörterbuch 1 aktiviert. (Das Bit, welches der ID-Nummer ID = 0 entspricht, wird null gesetzt). Wie vorstehend beschrieben, hat die Wagenstereoeinheit drei Betriebsarten, den "Radio"- Betrieb (ID = 1), den "Kassetten"-Betrieb (ID = 2) und den "Radio/Kassetten"-Betrieb (ID = 0). Wenn der Ausschließ­ schalter 15 entsprechend einem Wort "Wiedergabe" gedrückt wird, welches unrichtig auf dem Display des Bedienungsfeldes erschienen ist, und sich die Stereoeinheit in dem "Radio"- Mode befindet, erscheint ein Sekundär-Kandidatenwort auf dem Display, und ein Cluster-Datenwert, welcher dem Wort "Wiedergabe" entspricht, wird auf den neuesten Stand gebracht. In Fig. 5 sind der aktualisierte Clusterdatensatz in dem Clusterdatenteil 8 die AUS-Bits, welche dem globalen Mode und dem "Radio" -Mode entsprechen, beide aktiviert (auf den Wert eins gesetzt). Hierdurch kann dann die vorerwähnte Befehls­ ausschließungsfunktion erreicht werden, um so den Befehl "Wiedergabe" aus den Eingaben von Befehlsdaten in dem Wörter­ buch 2 auszuschließen, wenn die Stereoeinheit entweder in dem "Radio/Kassetten"-Mode (ID = 0) oder in dem "Radio "-Mode (ID = 1) ist. Nachdem die Befehlsausschließungsfunktion gemäß der Erfindung wiederholt durchgeführt ist, werden schließlich die Inhalte des Merkmalparameter-Wörterbuchs 2 in diejenigen geändert, wie sie in Fig. 4 dargestellt sind. Der auf den neuesten Stand gebrachte Cluster-Datenwert wird jeder der Eingaben von in dem Wörterbuch 2 vorhandenen Sprachbe­ fehlen zugeteilt. Hierbei ist zu beachten, daß das vorstehend beschriebene Clusterdaten-Aktualisieren für Sprachbefehle nicht unbedingt notwendig ist, die weniger häufig als unrich­ tig festgestellt werden.
Der Ausschließ-Löschschalter 16 auf dem Bedienungsfeld der Fig. 3 wird gedrückt, um so die Befehlsausschließungsfunktion zu löschen und um das AUS-Bit der Clusterdaten (welche dem globalen Mode entsprechen) auf null zurückzusetzen. Wenn der Schalter 16 für kurze Zeit entsprechend dem Erkennungsergeb­ nis für eine Spracheingabe in einem Betriebszustand der Sprachsteuereinrichtung gedrückt wird, wird eine Clusterdaten­ gruppe (eine Gesamtheit von AUS-Bits) für das eingegebene Wort initialisiert (auf 0 rückgesetzt). Wenn der Schalter 16 fortwährend gedrückt wird, beispielsweise bei einem Wartebe­ trieb der Sprachsteuereinrichtung, werden die Clusterdaten- Gruppen für das Eingeben von Sprachbefehlen in das Wörter­ buch 2 insgesamt initialisiert (wobei die AUS-Bits auf null rückgesetzt werden).
In Fig. 6 ist ein weiteres Bedienungsfeld der Wagenstereoein­ heit dargestellt, welches gegenüber dem Bedienungsfeld der Fig. 3 verbessert worden ist. Auf diesem Bedienungsfeld ist ein Lösch-2-Schalter 17 mit einem Tastenschalter kombiniert, welcher gedrückt wird, um jede der vorstehend beschriebenen Funktionen der Schalter 14 bis 16 zu erreichen, wobei sich die Funktionen auf das Clusterdaten-Aktualisieren beziehen. Wenn der Schalter 17 für weniger als eine erste vorgeschrie­ bene Zeitspanne (z. B. eine Sekunde) gedrückt wird, wird die vorstehend beschriebene Funktion des Löschschalters 14 er­ reicht. Wenn der Schalter länger als die erste vorgeschrie­ bene Zeitspanne und kürzer als eine zweite vorgeschriebene Zeitspanne (z. B. zwei Sekunden) gedrückt wird, wird die vorstehend beschriebene Funktion des Ausschließschalters 15 erreicht. Wenn der Schalter 17 länger als die zweite vor­ geschriebene Zeitspanne gedrückt wird, wird die vorstehend beschriebene Funktion des Ausschließ-Löschschalters 16 er­ reicht. Wenn der Schalter 17 ständig gedrückt wird, wird vorzugsweise ein Piepston vom Lautsprecher der Stereoein­ heit erzeugt, um dem Benutzer anzuzeigen, welche Funktion durch Drücken des Schalters 17 eingegeben wird.
Als nächstes wird eine zweite Ausführungsform der Erfindung anhand von Fig. 8 und 9 beschrieben. In Fig. 8 weist diese Sprachsteuereinrichtung einen Speicher 22 zum Speichern von Standardmustern auf, welche eine Beziehung zwischen Sprach­ eingaben und entsprechenden Befehlsworten anzeigen. Wenn ein Startschalter 32 auf dem Bedienungsfeld der Fig. 9 von einem Benutzer gedrückt wird, werden ein Merkmalextrahierteil 21 und ein Ähnlichkeitsprüfteil 23 in einen Wartezustand gebracht. Dieser Wartezustand dauert an, bis eine Spracheingabe über ein Mikrophon in den Merkmalextrahierteil 21 gegeben wird.
Nachdem die Spracheingabe erfolgt ist, extrahiert der Merk­ malextrahierteil 21 einen Merkmalparameter aus der Sprachein­ gabe. Der Ähnlichkeitsprüfteil 23 berechnet den Ähnlichkeits­ grad des extrahierten Merkmalparameters in Relation zu den Standardmustern in dem Speicher 22. Nachdem der Ähnlichkeits­ grad des extrahierten Parameters für alle Standardmuster berechnet ist, wählt ein Auswählteil 24 ein Befehlswort aus, welches dem Standardmuster entspricht, welches den höchsten Ähnlichkeitsgrad zu dem extrahierten Merkmalmuster der Sprach­ eingabe unter den Berechnungsergebnissen hat. Dieses Befehls­ wort wird als ein erkanntes Wort, d. h. als ein Kandidatenwort mit dem höchsten Ähnlichkeitsgrad bezüglich der Spracheingabe identifiziert. Der Auswählteil 24 gibt das erkannte Wort an einen Abgabeteil 25 ab, so daß das Erkennungsergebnis dem Be­ nutzer in einer wahrnehmbaren Form gegeben wird. Der Abgabe­ teil 25 in dieser Ausführungsform ist eine Display-Einheit und der sich ergebende Datenwert auf der Display-Einheit ist eines von Kandidatenworten mit dem höheren Ähnlichkeitsgrad. Wenn beispielsweise entschieden wird, daß das Erkennungser­ gebnis entsprechend einer von dem Benutzer gesprochenen Spracheingabe "Wiedergabe" richtig ist, wird ein entsprechen­ des Ausgangswort "Wiedergabe" auf der Display-Einheit ange­ zeigt. Wenn entschieden wird, daß das auf dem Abgabeteil 25 erschienene Wort richtig ist, wird von dem Benutzer ein Be­ stätigungsschalter 33 auf dem Bedienungsfeld der Fig. 9 ge­ drückt, so daß ein gewünschter Betrieb der Stereoeinheit durchgeführt wird. Wenn entschieden wird, daß das auf dem Abgabeteil 25 erschienene Wort falsch ist, wird ein Lösch­ schalter 24 gedrückt, so daß kein Betrieb der Stereoeinheit durchgeführt wird. Als eine Modifikation ist es für den Aus­ wählteil 24 möglich, Sekundär-Kandidatenworte mit dem zweit­ höchsten Ähnlichkeitsgrad dem Abgabeteil 25 zuzuführen, nachdem das erste auf dem Abgabeteil 25 erscheinende Kandi­ datenwort als falsch befunden wird, und der Löschschalter 34 gedrückt wird. In einer solchen Modifikation ist es für den Benutzer wünschenswert und bequem, daß die Anzahl an Sekun­ där-Kandidatenworten, die nacheinander auf dem Abgabeteil 25 erscheinen, vorherbestimmt ist.
Wenn ein Befehlseingabeprozeß von der Sprachsteuereinheit der Fig. 8 durchgeführt wird, wird zuerst ein Eingabeschal­ ter 31 von dem Benutzer gedrückt und dann wird ein Steuer­ schalter auf dem Bedienungsfeld entsprechend einer neuen Befehlseingabe gedrückt. Nachdem der Eingabeschalter 31 gedrückt ist, werden der Merkmalextrahierteil 21 und der Ähnlichkeitsprüfteil 23 in einen Wartezustand gebracht, bis eine Spracheingabe, welche von dem Benutzer in das Mikro­ phon gesprochen wird, an den Merkmal-Extrahierteil 21 gege­ ben wird. Wenn die Spracheingabe erfolgt ist, extrahiert der Merkmalextrahierteil 21 einen Merkmalparameter aus der Spracheingabe, und der Extrahierparameter wird in dem Stan­ dardmusterspeicher 22 gespeichert. Der gespeicherte Para­ meter in dem Speicher 22 enthält Beziehungsdaten, welche eine Beziehung zwischen dem gespeicherten Standardmuster und der Operation festlegen, welche durch Drücken des Steuer­ schalters durchgeführt worden ist. Der Befehlseingabeprozeß ist folglich beendet. Da der Eingabeschalter 31 nur gedrückt wird, um den Befehlseingabeprozeß zu starten, wird ein Be­ trieb der Stereoeinheit, welche dem gedrückten Steuerschal­ ter entspricht, während des Befehlseingabeprozesses nicht durchgeführt.
In Fig. 10 ist ein anderes Bedienungsfeld der Wagenstereoein­ heit dargestellt, welche gegenüber dem Bedienungsfeld der Fig. 9 verbessert worden ist. In dem Bedienungsfeld der Fig. 10 sind der Eingabeschalter 31 und der Löschschalter 34 welche in Fig. 9 dargestellt sind, weggelassen, und es sind nur der Startschalter 32 und der Bestätigungsschalter 33 vorgesehen. Die vorstehend beschriebenen Funktionen der Schalter 31 bis 34 sind auf diesem Bedienungsfeld den beiden Schalters 33 zugeordnet. Folglich ist jeder der beiden Schal­ ter 32 und 33 der Fig. 10 ein kombinierter Tastenschalter, welchem zwei verschiedene Funktionen zugeteilt sind. Bei­ spielsweise wird der Startschalter 32 der Fig. 10 gedrückt, um entweder die Befehlseingabe-Funktion oder die Spracher­ kennungs-Startfunktion zu erreichen. Wenn der Startschalter 32 kürzer als eine Sekunde gedrückt wird, wird der Sprach­ erkennungsprozeß gestartet, wie vorstehend bezüglich des Startschalters 32 der Fig. 9 beschrieben worden ist. Wenn der Schalter 32 länger als eine Sekunde gedrückt wird, wird der Befehlseingabeprozeß gestartet, wie vorstehend in Ver­ bindung mit dem Eingabeschalter 31 der Fig. 9 beschrieben worden ist. Ebenso wird, wenn der Bestätigungsschalter 33 kürzer als eine Sekunde gedrückt wird, bestätigt, daß ein erkannter Sprachbefehl, welcher auf dem Abgabeteil 25 erscheint, richtig ist. Wenn der Bestätigungsschalter 33 länger als eine Sekunde gedrückt wird, wird ein falsch er­ kannter Sprachbefehl, welcher auf dem Abgabeteil 25 erscheint, gelöscht, wie vorstehend bezüglich des Schalters 34 der Fig. 9 beschrieben ist. Als nächstes wird eine dritte Ausführungs­ form der Erfindung anhand von Fig. 9 und 11 beschrieben. In Fig. 11 weist die Sprachsteuereinrichtung einen Speicher 22 auf, in welchem Standardmuster, welche eine Beziehung zwi­ schen Spracheingaben und entsprechenden Befehlsworten anzei­ gen, gespeichert werden. Ein Tastenschalterteil 25 dieser Sprachsteuereinrichtung entspricht dem in Fig. 9 dargestellten Bedienungsfeld. Wenn der Startschalter 32 auf dem Bedienungs­ feld der Fig. 9 von dem Benutzer gedrückt wird, werden ein Merkmal-Extrahierteil 21 und ein Ähnlichkeitsprüfteil 23 in einen Wartezustand gebracht. Dieser Wartezustand dauert an, bis eine Spracheingabe an dem Merkmal-Extrahierteil 21 gegeben wird.
Nach der Spracheingabe extrahiert der Merkmal-Extrahierteil 21 einen Merkmalsparameter aus der Spracheingabe. Der Ähn­ lichkeitsprüfteil 23 berechnet den Ähnlichkeitsgrad des ex­ trahierten Merkmalparameters bezüglich der Standardmuster in dem Speicher 22. In dieser Ausführungsform wird ein Vorauswählteil 29 von einem Steuerteil 26 instruiert, vor­ läufig eine Teilgruppe von Standardmustern aus den in dem Speicher 22 gespeicherten Standardmustern entsprechend ei­ nem aktuellen Betriebsmode eines gesteuerten Systems 28 (z. B. der Wagenstereoeinheit) auszuwählen, welche von der Spracheingabe gesteuert wird. Der Ähnlichkeitsgrad des ex­ trahierten Merkmalparameters wird nur in Relation zu der Teil­ gruppe der ausgewählten Standardmuster berechnet, welche durch den Vorauswählteil 29 spezifiziert worden ist. Nachdem der Ähnlichkeitsgrad in Relation zu der Gruppe der ausge­ wählten Standardmuster berechnet ist, wählt ein Auswahlteil 29 ein Befehlswort aus, welches unter den Berechnungsergeb­ nissen den höchsten Ähnlichkeitsgrad zu dem extrahierten Merkmalsmuster der Spracheingabe hat. Der Auswahlteil 24 legt ein solches erkanntes Wort an einen Abgabeteil 25 an, so daß das Ergebnis der Spracherkennung dem Benutzer in einer wahrnehmbaren Form gegeben wird.
Der Abgabeteil 25 in dieser Ausführungsform ist eine Display- Einheit auf dem Bedienungsfeld der Fig. 9. Wenn entschieden wird, daß das Wort auf dem Abgabeteil 25 richtig ist, wird der Bestätigungsschalter 33 der Fig. 9 von dem Benutzer ge­ drückt, so daß der gewünschte Betrieb des gesteuerten Systems 28, wie beispielsweise der Stereoeinheit, durchgeführt wird. Wenn entschieden wird, daß das Wort auf dem Abgabe­ teil 25 falsch ist, wird von dem Benutzer der Löschschalter 34 gedrückt, so daß kein Betrieb des Steuersystems 28 durch­ geführt wird.
Ebenso kann auch in der dritten Ausführungsform eine Modifi­ kation gemacht werden, wie vorstehend bezüglich der zweiten Ausführungsform beschrieben ist. Das heißt, es ist für den Auswählteil 24 möglich, Sekundär-Kandidatenworte mit einem höheren Ähnlichkeitsgrad dem Abgabeteil 25 zuzuführen, nachdem das erste Kandidatenwort in dem Abgabeteil 25 durch Drücken der Löschtaste 34 gelöscht ist. In einer solchen Modifikation ist es für den Benutzer wünschenswert und be­ quem, daß die maximale Anzahl an Sekundär-Kandidatenworten, welche nacheinander auf dem Abgabeteil 25 erscheinen, vorher­ bestimmt wird.
Nunmehr wird ein Befehlseingabeprozeß, welcher von der Sprachsteuereinrichtung in der dritten Ausführungsform aus­ geführt worden ist, beschrieben. Wenn dieser Befehlseingabe­ prozeß durchgeführt wird, wird zuerst der Eingabeschalter 31 auf dem Bedienungsfeld der Fig. 9 von dem Benutzer gedrückt, und dann wird ein Steuerschalter gedrückt, um eine gewünschte Betriebsart der Wagenstereoeinheit zu erreichen, welche einem neuen Sprachbefehl entspricht. Nachdem der Eingabeschalter 31 gedrückt ist, werden der Merkmalextrahierteil 21 und der Ähnlichkeitsprüfteil 22 in einen Wartezustand gebracht, bis eine Spracheingabe, welche von dem Benutzer in das Mikrophon gesprochen worden ist, an den Merkmalextrahierteil 21 gegeben wird. Nachdem die Spracheingabe erfolgt ist, extrahiert der Merkmalextrahierteil 21 einen Merkmalsparameter aus der Spracheingabe, und der extrahierte Parameter wird als ein neues Standardmuster in dem Standardspeicher 22 gespeichert. Das gespeicherte Muster in dem Speicher 22e enthält Bezie­ hungsdaten, welche eine Beziehung zwischen dem gespeicherten Standardmuster und dem Betrieb festlegen, welcher durch Drüc­ ken des Steuerschalters durchgeführt worden ist. Dann ist der Befehlseingabeprozeß beendet. Da der Eingabeschalter 31 zu­ erst nur gedrückt wird, um den Befehlseingabeprozeß zu star­ ten, wird ein Betrieb der Wagenstereoeinheit, welche dem ge­ drückten Schalter entspricht, während des Befehlseingabepro­ zesses nicht durchgeführt.
Wenn in der dritten Ausführungsform der Eingabeschalter 31 für eine verhältnismäßig kurze Zeit (z. B. für weniger als eine Sekunde) gedrückt wird, wird ein Cluster-Datenwert einem entsprechenden Standardmuster in dem Speicher 22 zugeordnet, und der Standardparameter mit dem zugeordneten Cluster-Daten­ wert wird in dem Speicher 22 zusammen mit den vorerwähnten Beziehungsdaten gespeichert. Der Cluster-Datenwert ist ein betriebsabhängiger Datenwert, welcher festlegt, daß der gerade eingegebene Sprachbefehl von der Sprachsteuereinrichtung nur erkannt wird, wenn das System 28 (die Wagenstereoeinheit) in einem spezifischen Betrieb arbeitet, welcher derselbe ist wie einer während des Befehlseingabeprozesses.
Der Cluster-Datenwert, welcher jedem der gespeicherten Stan­ dardmuster des Speichers 22 zugeordnet worden ist, wird durch einen Vorauswählteil 29 geprüft, um so festzustellen, ob das Standardmuster im voraus für die von dem Teil 23 durchgeführte Ähnlichkeitsberechnung ausgewählt ist oder nicht. Wenn der Eingabeschalter 31 für eine verhältnismäßig lange Zeit (z. B. für länger als eine Sekunde) gedrückt wird, werden Cluster- Daten einem entsprechenden Standardmuster in dem Speicher 22 zugeteilt. Dieser Cluster-Datenwert ist ein globaler Mode- Datenwert, welcher festlegt, daß der gerade eingegebene Sprach­ befehl unabhängig von dem augenblicklichen Betrieb, in wel­ chem das System 28 arbeitet, immer von der Sprachsteuerein­ richtung erkannt wird. Mit anderen Worten, der Sprachbefehl wird nicht nur erkannt, wenn das System 28 in demselben Mode wie während des Befehleingabeprozesses arbeitet, sondern auch, wenn das System 28 in irgendeinem anderem Mode betrieben wird.
In Fig. 12 ist noch ein weiteres Bedienungsfeld der Wagen­ stereoeinheit dargestellt, welches gegenüber dem Bedienungs­ feld der Fig. 9 verbessert worden ist. Auf dem Bedienungsfeld der Fig. 12 ist ein kombinierter Schalter 35, welchem die Be­ fehlseingabe- und die Spracherkennungs-Startfunktion zuge­ teilt sind, zusammen mit dem Bestätigungsschalter 33 und dem Löschschalter 34 vorgesehen. Der Schalter 35 entspricht dem Lösch-2-Schalter 17 der Fig. 6. Wenn beispielsweise der Schal­ ter 35 für weniger als eine Sekunde gedrückt wird, wird der Spracherkennungsprozeß gestartet. Wenn der Schalter für länger als eine Sekunde und kürzer als zwei Sekunden ge­ drückt wird, startet der vorstehend beschriebene Befehls­ eingabeprozeß der mode-abhängigen Type. Wenn der Schalter 35 für länger als zwei Sekunden gedrückt wird, startet der vorstehend beschriebene Befehlseingabeprozeß den globalen Modetyp. Wenn der Schalter 17 ständig gedrückt wird, wird vorzugsweise ein Piepston von einem Lautsprecher der Wagen­ stereoeinheit erzeugt, um dem Benutzer anzuzeigen, welche Funktion durch Drücken des Schalters 17 eingegeben ist.
In Fig. 13 sind Änderungen von Betriebsbedingungen der Wagen­ stereoeinheit entsprechend einer Spracheingabe an der Sprach­ steuereinheit dargestellt. In Fig. 13 zeigt ein ausgezogen wiedergegebener Pfeil eine Änderung von einem Betriebszustand in einen anderen entsprechend einem Sprachbefehl an; ein ge­ strichelt wiedergegebener Pfeil zeigt eine Änderung an, die automatisch bewirkt wird, nachdem eine einem Sprachbefehl entsprechende Operation durchgeführt ist.
Wie in Fig. 13 dargestellt, sind, wenn ein "Radio"-Befehl eingegeben ist und sich die Wagen-Stereoeinheit in dem Radio"-Betrieb befindet, Sprachbefehle, die wirksam erkannt werden, "Lautstärke laut (volume up)", "Lautstärke leise (volume down)" und "Abtasten/Suchen". Wenn ein "Kassetten"- Befehl eingegeben wird und die Stereoeinheit in "Kassetten"- Betrieb betrieben wird, sind Sprachbefehle, die wirksam er­ kannt werden "Lautstärke laut", "Lautstärke leise", "Vor­ wärtsspulen", "Rückspulen" und "Wiedergabe". Wenn der vor­ stehend beschriebene mode-abhängige Eingabeprozeß durchge­ führt ist, ist es möglich, daß Sprachbefehle, die Betriebsbe­ dingungen der Wagenstereoeinheit entsprechen, eingegeben werden, und Standardmuster bezüglich der Beziehungs- und Clusterdaten in dem Speicher 22 gespeichert werden. Wenn der vorstehend erwähnte Globalmode-Eingabeprozeß durchgeführt durchgeführt wird, ist es möglich, daß Sprachbefehle, die unabhängig von den Betriebsbedingungen wirksam sind, einge­ geben werden und Standardmuster mit den Beziehungs- und den Clusterdaten in dem Speicher 22 gespeichert werden.
Um zu verhindern, daß das System 28 einen größeren Schaden erleidet, müssen einige falsche Operationen (wie Befehlen "Lautstärke erhöhen", wenn die Stereoeinheit im Rückspul­ betrieb ist) automatisch unterbunden werden. Gemäß der Erfindung wird die Eingabe eines neuen Sprachbefehls, welcher einer falschen Operation bei dem Globalmode-Eingabeprozeß entspricht nur verhindert, wenn das gesteuerte System sich in einer vorgeschriebenen Betriebsart befindet. Es ist dann wünschenswert, daß der Benutzer durch eine entsprechende Displaymeldung informiert wird, daß ein Sprachbefehl nicht empfangen wird, wenn ihn der Benutzer eingibt.
In den vorstehend beschriebenen Ausführungsformen sind der Algorithmus einer Spracherkennung, der Vorauswählteil, um einen Merkmalsparameter jedes der Kandidatenworte aus dem Wörterbuch 2 durch Prüfen der Cluster-Daten auszuwählen, und die Technik zum Abgeben eines erkannten Wortes auf einer Display-Einheit Stand der Technik, so daß sie hier nicht mehr beschrieben zu werden brauchen.

Claims (13)

1. Sprachsteuereinrichtung, um ein sprachbetriebenes System durch einen Sprachbefehl zu betreiben, welcher durch eine Spracherkennung erkannt worden ist, wobei das System mit einer Anzahl Steuerschalter (6, 27) zum Auslösen von Operationen des Systems versehen ist, mit
einer Merkmalextrahiereinrichtung (1, 21) zum Extrahieren eines Merkmalparameters aus einer Spracheingabe;
einer Speichereinrichtung (2, 22) zum Speichern von Standard­ mustern, welche Merkmalparameter anzeigen, welche von der Merkmalextrahiereinrichtung aus einer Gruppe von Standard- Sprachbefehlen extrahiert worden sind;
einer Ähnlichkeitsprüfeinrichtung (3, 23), um einen Ähnlich­ keitsgrad des Merkmalparameters, welcher von der Merkmalex­ trahiereinrichtung extrahiert worden ist, in Beziehung zu jedem der in der Speichereinrichtung gespeicherten Standard­ muster zu berechnen, und
einer Auswähleinrichtung (4, 24), um einen Sprachbefehl, wel­ cher aus der Spracheingabe erkannt worden ist, auszuwählen, wobei der Sprachbefehl einen höchsten Ähnlichkeitsgrad be­ züglich der Standardmuster in dem Speicher unter den Ähnlich­ keitsgraden hat, welche mittels der Ähnlichkeitsprüfeinrich­ tung berechnet worden sind, dadurch gekennzeich­ net, daß die Einrichtung zumindest einen Eingabeschalter (11) zum Eingeben eines neuen Sprachbefehls in die Speicher­ einrichtung und einen Ausschließungsschalter (15) aufweist, um ein Standardmuster aus der Gruppe der Standardmuster zu löschen, damit, nachdem der Eingabeschalter (11) gedrückt wird, ein Merkmalsparameter, welcher aus dem neuen Sprachbe­ fehl extrahiert worden ist, als ein Standardmuster in der Speichereinrichtung (2, 22) zusammen mit Cluster-Daten ge­ speichert wird, die ein Attribut des gerade eingegebenen Stan­ dardmusters festlegen, wobei die Cluster-Daten anzeigen, daß ein Ähnlichkeitsgrad in Beziehung zu dem Standardmuster, welches dem neuen Sprachbefehl entspricht, immer mit Hilfe der Ähnlichkeitsprüfeinrichtung (3, 23) unabhängig von einer Betriebsart des Systems bei Drücken des Eingabeschalters (11) berechnet wird, und damit, nachdem der Ausschließungs­ schalter (15) entsprechend einem erkannten Sprachbefehl ge­ drückt wird, um so den erkannten Sprachbefehl zu löschen, die Cluster-Daten anzeigen, daß ein Grad der Ähnlichkeit be­ züglich des gelöschten Sprachbefehls nicht berechnet wird, wenn das System in einer Betriebsart betrieben wird, welche dieselbe ist wie die beim Drücken des Ausschließungsschal­ ters (15).
2. Sprachsteuereinrichtung nach Anspruch 1, dadurch ge­ kennzeichnet, daß die Einrichtung ferner einen Löschschalter (14) aufweist, um ein Standardmuster aus der Gruppe der Standardmuster in der Speichereinrichtung (2, 22) zu löschen, wobei, nachdem der Löschschalter (14) entspre­ chend einem erkannten Sprachbefehl gedrückt wird, die Cluster-Daten, welche dem gelöschten Standardmuster entspre­ chen, nicht in der Speichereinrichtung (2, 22) gespeichert werden, und ein Sprachbefehl mit einem zweithöchsten Ähnlich­ keitsgrad bezüglich der Standardmuster unter den zu berech­ nenden Ähnlichkeitsgraden mittels der Auswähleinrichtung (4, 24) ausgewählt wird, so daß der Sprachbefehl mit dem zweithöchsten Ähnlichkeitsgrad abgegeben wird.
3. Sprachsteuereinrichtung nach einem der Ansprüche 1 oder 2, dadurch gekennzeichnet, daß die Einrichtung ferner einen Ausschließ-Löschschalter (16) aufweist, um einen Ausschließungsbefehl zu löschen, welcher mittels des Löschschalters gegeben worden ist, wobei, nachdem der Aus­ schließungsschalter (15) entsprechend einem erkannten Sprach­ befehl während einer speziellen Betriebsart des Systems ge­ drückt wird, die Cluster-Daten anzeigen, daß ein Ähnlich­ keitsgrad bezüglich des Standardmusters, das dem Sprachbe­ fehl entspricht, immer durch die Ähnlichkeitsprüfeinrichtung (3, 23) unabhängig von der Betriebsart des Systems bei Drücken des Schalters (16) berechnet wird.
4. Sprachsteuereinrichtung nach Anspruch 1, dadurch ge­ kennzeichnet, daß die Einrichtung ferner einen Ausschließungs-Löschschalter (16) aufweist, um Cluster-Da­ ten zu initialisieren, welche der Gruppe der Standardmuster in dem Speicher (2, 22) entsprechen, wobei, wenn der Ausschlie­ ßungsschalter (16) für länger als eine vorgeschriebene Zeit­ spanne entsprechend einem erkannten Sprachbefehl während eines speziellen Betriebsmode des Systems gedrückt wird, die initialisierten Cluster-Daten anzeigen, daß ein Ähnlichkeits­ grad in Relation zu allen Standardmustern in dem Speicher (2, 22) immer von der Ähnlichkeitsprüfeinrichtung (3, 23) un­ abhängig von der Betriebsart des Systems bei Drücken des Schalters (16) berechnet wird.
5. Sprachsteuereinrichtung nach Anspruch 2 oder 3, dadurch gekennzeichnet, daß die Einrichtung ferner einen kombinierten Schalter (17) zum Befehlen einer der Funk­ tionen des Schloßschalters (14), des Ausschließungsschalters (15) und des Ausschließungs-Löschschalters (16) aufweist, wobei die Funktion des Löschschalters (14) durchgeführt wird, wenn der Schalter (17) kürzer als eine vorherbestimmte erste Zeitspanne gedrückt wird, die Funktion des Ausschließungs­ schalters (15) durchgeführt wird, wenn der Schalter (17) län­ ger als die vorgeschriebene erste Zeitspanne und kürzer als eine vorgeschriebene zweite Zeitspanne gedrückt wird, und die Funktion des Ausschließungs-Löschschalters (16) durch­ geführt wird, wenn der Schalter (17) länger als die vorge­ schriebene zweite Zeitspanne gedrückt wird.
6. Sprachsteuereinrichtung nach Anspruch 1, dadurch ge­ kennzeichnet, daß die Einrichtung ferner einen kombinierten Tastenschalter (35) aufweist, um entweder die Einrichtung in einen Wartezustand zu bringen, bevor eine Spracheingabe empfangen wird, oder um einen neuen Sprachbe­ fehl in die Speichereinrichtung (2, 22) einzugeben, wobei, wenn der Tastenschalter (35) für weniger als eine vorge­ schriebene Zeitspanne gedrückt wird, die Einrichtung in den Wartezustand gebracht wird, wobei, wenn der Tastenschalter länger als die vorgeschriebene Zeitspanne gedrückt wird und ein Steuerschalter unter den Steuerschaltern (6, 27) danach gedrückt wird, die Einrichtung davon instruiert wird, einen neuen Sprachbefehl einzugeben und ein entsprechendes Stan­ dardmuster in den Standardmustern der Speichereinrichtung zu speichern, wobei der neue Sprachbefehl einem ganz spe­ ziellen Betrieb des Systems entspricht, welches durch den gedrückten Steuerschalter instruiert worden ist.
7. Steuersystem nach Anspruch 1, dadurch gekenn­ zeichnet, daß die Einrichtung ferner einen ersten Schalter (31) aufweist, um zu bestätigen, daß ein erkannter Sprachbefehl, welcher durch die Auswähleinrichtung (4, 24) entsprechend einer Spracheingabe ausgewählt worden ist, richtig ist, um so einen gewünschten Betrieb des Systems zu starten, und einen zweiten Schalter (34) aufweist, um einen erkannten Sprachbefehl zu löschen, der fälschlicher­ weise durch die Auswähleinrichtung (4, 24) ausgewählt worden ist, so daß die Wähleinrichtung einen anderen Sprachbefehl mit einem zweithöchsten Ähnlichkeitsgrad auswählt, der durch die Ähnlichkeitsprüfeinrichtung (3, 23) berechnet worden ist.
8. Sprachsteuersystem nach Anspruch 1, dadurch gekenn­ zeichnet, daß die Einrichtung einen kombinierten Ta­ stenschalter (33) aufweist, um entweder zu bestätigen, daß ein erkannter Sprachbefehl, welcher durch die Auswähleinrich­ tung (4, 24) entsprechend einer Spracheingabe ausgewählt worden ist, richtig ist, oder um einen erkannten Sprachbefehl zu löschen, der fälschlicherweise durch die Auswähleinrich­ tung ausgewählt worden ist, so daß die Auswähleinrichtung einen anderen Sprachbefehl mit einem zweithöchsten Ähnlich­ keitsgrad auswählt, welcher durch die Ähnlichkeitsprüfein­ richtung (3, 23) berechnet worden ist,
wobei, wenn der Tastenschalter (33) für weniger als eine vor­ geschriebene Zeitspanne gedrückt wird, bestätigt wird, daß der erkannte Sprachbefehl richtig ist, und wenn der Tasten­ schalter (33) länger als die vorgeschriebene Zeitspanne ge­ drückt wird, der erkannte Sprachbefehl gelöscht und ein an­ derer Sprachbefehl mit einem zweithöchsten Ähnlichkeitsgrad durch die Auswähleinrichtung (4, 24) ausgewählt wird.
9. Sprachsteuereinrichtung nach Anspruch 1, dadurch ge­ kennzeichnet, daß die Einrichtung ferner eine Vorauswähleinrichtung (7, 29) aufweist, um eine Teilgruppe von Standardmustern aus der Gruppe der Standardmuster in dem Speicher (2, 22) entsprechend einer Betriebsart auszuwählen, in welcher das System betrieben wird, wenn eine Sprachein­ gabe empfangen wird, um der Ähnlichkeitsprüfeinrichtung (3, 23) zu ermöglichen, den Ähnlichkeitsgrad in Relation jeweils zu der Teilgruppe der Standardmuster zu berechnen, welche durch die Vorauswähleinrichtung ausgewählt worden ist.
10. Sprachsteuereinrichtung nach Anspruch 9, dadurch gekennzeichnet, daß die Sprachsteuereinrich­ tung ferner einen ersten Schalter (31) zum Eingeben eines mode-abhängigen Sprachbefehls und einen zweiten Schalter (31) zum Eingeben eines Globalmode-Sprachbefehls aufweist, wobei, wenn der erste Schalter und danach ein Steuerschalter unter den Steuerschaltern gedrückt wird, die Einrichtung instruiert wird, einen neuen Sprachbefehl einzugeben und ein entsprechendes Standardmuster in den Standardmustern der Speichereinrichtung (2, 22) zu speichern, wobei der neue Sprachbefehl einem Betrieb des Systems entspricht, das von dem Steuerschalter instruiert worden ist, wobei der neue Be­ fehl in die Speichereinrichtung (2, 22) zusammen mit mode-ab­ hängigen Daten eingegeben und gespeichert wird, welche mode- abhängigen Daten anzeigen, daß ein Ähnlichkeitsgrad zu dem Standardmuster durch die Ähnlichkeitsprüfeinrichtung (2, 23) nur berechnet wird, wenn das System in einem Mode betrieben wird, welcher derselbe ist wie derjenige beim Drücken des ersten Schalters, und
wobei, wenn der zweite Schalter und danach ein Steuerschal­ ter unter den Steuerschaltern gedrückt wird, die Einrichtung instruiert wird, einen neuen Sprachbefehl einzugeben und ein entsprechendes Standardmuster in den Standardmustern der Speichereinrichtung zu speichern, wobei der neue Sprachbefehl einem Betrieb des durch den Steuerschalter betätigten Systems entspricht, wodurch der neue Befehl eingegeben und in der Speichereinrichtung zusammen mit den Globalmode-Daten ge­ speichert wird, welche festlegen, daß ein Ähnlichkeitsgrad zu dem Standardmuster immer durch die Ähnlichkeitsprüfung unabhängig von einer Betriebsart beim Drücken des zweiten Schalters berechnet wird.
11. Sprachsteuereinrichtung nach Anspruch 9, dadurch ge­ kennzeichnet, daß die Einrichtung ferner einen kombinierten Tastenschalter (31) aufweist, um entweder einen mode-abhängigen Sprachbefehl oder einen Globalmode-Sprach­ befehl einzugeben,
wobei, wenn der Tastenschalter (31) für weniger als eine vorgeschriebene Zeitspanne gedrückt wird und danach ein Steuerschalter unter den Steuerschaltern (27) gedrückt wird, die Einrichtung instruiert wird, einen neuen Sprachbefehl einzugeben und ein entsprechendes Standardmuster in den Standardmustern der Speichereinrichtung (2, 22) zu speichern,
wobei der neue Sprachbefehl einem Betrieb des Systems ent­ spricht, das durch den Steuerschalter instruiert worden ist, wodurch der neue Befehl eingegeben und in der Speicherein­ richtung zusammen mit den mode-abhängigen Daten gespeichert wird, welche mode-abhängigen Daten anzeigen, daß ein Ähnlich­ keitsgrad in Relation zu dem Standardmuster durch die Ähn­ lichkeitsprüfeinrichtung (3, 23) nur berechnet wird, wenn das System in einem Mode betrieben wird, welcher derselbe ist, wie derjenige beim Drücken des Tastenschalters, und
wobei, wenn der Tastenschalter (31) für länger als die vor­ geschriebene Zeitspanne gedrückt wird und ein Steuerschalter unter den Steuerschaltern danach gedrückt wird, die Einrich­ tung instruiert wird, einen neuen Sprachbefehl einzugeben, und ein entsprechendes Standardmuster in den Standardmustern der Speichereinrichtung (2, 22) zu speichern, wobei der neue Sprachbefehl einem Betrieb des Systems entspricht, das mit­ tels des Steuerschalters betätigt worden ist, wodurch der neue Befehl eingegeben und in der Speichereinrichtung zusam­ men mit dem Globalmode-Daten gespeichert wird, die festlegen, daß ein Ähnlichkeitsgrad in Relation zu den Standardmustern von der Ähnlichkeitsprüfeinrichtung immer unabhängig von einer Betriebsart beim Drücken des Tastenschalters berechnet wird.
12. Sprachsteuereinrichtung nach Anspruch 9, dadurch gekennzeichnet, daß die Einrichtung ferner einen kombinierten Tastenschalter (35) aufweist, um die Einrichtung in einen Wartezustand zu bringen, einen mode- abhängigen Sprachbefehl einzugeben, oder einen Globalmode- Sprachbefehl einzugeben,
wobei, wenn der Tastenschalter (35) kürzer als eine vorge­ schriebene Zeitspanne gedrückt wird, die Einrichtung in einen Wartezustand gebracht wird, bevor eine Spracheingabe empfangen wird,
wobei, wenn der Tastenschalter (35) länger als die erste Zeitspanne und kürzer als eine vorgeschriebene zweite Zeit­ spanne gedrückt wird und danach ein Steuerschalter unter den Steuerschaltern gedrückt wird, die Einrichtung instruiert wird, einen neuen Sprachbefehl einzugeben und ein entspre­ chendes Standardmuster in den Standardmustern in der Spei­ chereinrichtung (2, 22) zu speichern, wobei der neue Sprach­ befehl einem Betrieb des Systems entspricht, das durch den Steuerschalter instruiert worden ist, wodurch der neue Befehl eingegeben und in der Speichereinrichtung zusammen mit den mode-abhängigen Daten gespeichert wird, welche mode-abhängi­ gen Daten anzeigen, daß ein Ähnlichkeitsgrad in Relation zu den Standardmustern mittels der Ähnlichkeitsprüfeinrichtung (3, 23) nur berechnet wird, wenn das System in Mode betrieben wird, welcher derselbe ist, wie beim Drücken des Tastenschal­ ters (35), und
wobei, wenn der Tastenschalter (35) länger als die zweite Zeitspanne gedrückt wird und danach ein Steuerschalter unter den Steuerschaltern gedrückt wird, die Einrichtung instruiert wird, einen neuen Sprachbefehl einzugeben und ein entspre­ chendes Standardmuster in den Standardmustern in der Spei­ chereinrichtung (2, 22) zu speichern, wobei der neue Sprach­ befehl einem Betrieb des Systems entspricht, das durch den Steuerschalter betätigt worden ist, wodurch der neue Befehl eingegeben und in der Speichereinrichtung zusammen mit Globalmode-Daten gespeichert wird, welche Globalmode-Daten anzeigen, daß ein Ähnlichkeitsgrad in Relation zu dem Stan­ dardmuster immer durch die Ähnlichkeitsprüfeinrichtung (3, 23) unabhängig von einem Betriebsmode beim Drücken des Tasten­ schalters berechnet wird.
13. Sprachsteuereinrichtung nach einem der Ansprüche 10 bis 12, dadurch gekennzeichnet, daß das Eingeben und Speichern eines neuen Sprachbefehls, welcher die Globalmode- Daten in der Speichereinrichtung (2, 22) aufweist, nur ver­ hindert werden, wenn das System sich in einer vorgeschriebenen Betriebsart befindet.
DE19924216455 1991-05-20 1992-05-19 Sprachsteuereinrichtung Expired - Fee Related DE4216455C2 (de)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP14386791 1991-05-20
JP14383591 1991-05-20
JP3349915A JPH0535291A (ja) 1991-05-20 1991-12-09 音声認識装置及び音声認識を利用した制御機器

Publications (2)

Publication Number Publication Date
DE4216455A1 true DE4216455A1 (de) 1992-11-26
DE4216455C2 DE4216455C2 (de) 1994-02-10

Family

ID=27318724

Family Applications (1)

Application Number Title Priority Date Filing Date
DE19924216455 Expired - Fee Related DE4216455C2 (de) 1991-05-20 1992-05-19 Sprachsteuereinrichtung

Country Status (1)

Country Link
DE (1) DE4216455C2 (de)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0718823A2 (de) 1994-12-23 1996-06-26 Siemens Aktiengesellschaft Verfahren zur Umwandlung von sprachlich eingegebenen Informationen in maschinenlesbare Daten
EP1083479A1 (de) 1999-09-08 2001-03-14 Volkswagen Aktiengesellschaft Verfahren zum Betrieb einer sprachgesteuerten Befehlseingabeeinheit in einem Kraftfahrzeug
WO2011076578A1 (de) * 2009-12-21 2011-06-30 Continental Automotive Gmbh Verfahren und vorrichtung zur bedienung technischer einrichtungen, insbesondere eines kraftfahrzeugs

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102010054217A1 (de) * 2010-12-11 2012-06-14 Volkswagen Aktiengesellschaft Verfahren zum Bereitstellen eines Sprachbediensystems in einem Fahrzeug und Sprachbediensystem dazu

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3238853A1 (de) * 1981-10-22 1983-05-11 Nissan Motor Co., Ltd., Yokohama, Kanagawa Sprachsteuerbare betaetigungseinrichtung fuer kraftfahrzeuge

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3238853A1 (de) * 1981-10-22 1983-05-11 Nissan Motor Co., Ltd., Yokohama, Kanagawa Sprachsteuerbare betaetigungseinrichtung fuer kraftfahrzeuge

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0718823A2 (de) 1994-12-23 1996-06-26 Siemens Aktiengesellschaft Verfahren zur Umwandlung von sprachlich eingegebenen Informationen in maschinenlesbare Daten
EP1083479A1 (de) 1999-09-08 2001-03-14 Volkswagen Aktiengesellschaft Verfahren zum Betrieb einer sprachgesteuerten Befehlseingabeeinheit in einem Kraftfahrzeug
DE19942871B4 (de) * 1999-09-08 2013-11-21 Volkswagen Ag Verfahren zum Betrieb einer sprachgesteuerten Befehlseingabeeinheit in einem Kraftfahrzeug
WO2011076578A1 (de) * 2009-12-21 2011-06-30 Continental Automotive Gmbh Verfahren und vorrichtung zur bedienung technischer einrichtungen, insbesondere eines kraftfahrzeugs

Also Published As

Publication number Publication date
DE4216455C2 (de) 1994-02-10

Similar Documents

Publication Publication Date Title
EP1071075B1 (de) Verfahren und Vorrichtung zur Eingabe von Daten
EP1264302B1 (de) Verfahren zur spracheingabe eines zielortes mit hilfe eines definierten eingabedialogs in ein zielführungssystem
DE60109105T2 (de) Hierarchisierte Wörterbücher für die Spracherkennung
DE60213195T2 (de) Verfahren, System und Computerprogramm zur Sprach-/Sprechererkennung unter Verwendung einer Emotionszustandsänderung für die unüberwachte Anpassung des Erkennungsverfahrens
DE3216800C2 (de)
EP1031456B1 (de) Verfahren und Vorrichtung zur Unterstützung eines Benutzers eines Kraftfahrzeugs bei der Bedienung von Fahrzeugkomponenten
DE3110788A1 (de) Tragbares geraet fuer die erstellung von kostenvoranschlaegen fuer reparaturen an automobilen
DE60126882T2 (de) Hierarchisierte Wörterbücher für die Spracherkennung
EP0994461A2 (de) Verfahren zur automatischen Erkennung einer buchstabierten sprachlichen Äusserung
EP0614172A2 (de) Verfahren und Anordnung zum Ermitteln von Wörtern in einem Sprachsignal
DE60118860T2 (de) Verfahren und Vorrichtung zum Suchen von Anlagen
DE3824976C2 (de) Informationssucheinrichtung
DE19837102A1 (de) Verfahren und Anordnung zum Durchführen einer Datenbankanfrage
DE69636731T2 (de) System und Verfahren zur Aufnahme von Namen in einer Spracherkennungsdatenbank
DE19839793B4 (de) Datenwiedergewinnungs- und -anzeigesystem
DE4216455A1 (de) Sprachsteuereinrichtung
DE4427444B4 (de) Einrichtung und Verfahren zur Sprachsteuerung eines Geräts
DE60022269T2 (de) Sprachbasiertes Manipulationsverfahren und -gerät
DE19942871B4 (de) Verfahren zum Betrieb einer sprachgesteuerten Befehlseingabeeinheit in einem Kraftfahrzeug
EP1076896B1 (de) Verfahren und vorrichtung zur erkennung mindestens eines schlüsselworts in gesprochener sprache durch einen rechner
DE4243181A1 (de)
EP0677835B1 (de) Verfahren zum Ermitteln einer Folge von Wörtern
DE2604318A1 (de) Geraet zur selbsttaetigen regelung des luftdrucks in einem behaelter, insbesondere in fahrzeugluftreifen
EP0793819B1 (de) Verfahren zur sprachsteuerung von anlagen und geräten
DE3438333A1 (de) Sprachempfindliche vorrichtung

Legal Events

Date Code Title Description
OP8 Request for examination as to paragraph 44 patent law
D2 Grant after examination
8364 No opposition during term of opposition
8339 Ceased/non-payment of the annual fee