DE102013000897B4 - Verfahren und Vorrichtung zur Spracherkennung in einem Kraftfahrzeug mittels Garbage-Grammatiken - Google Patents

Verfahren und Vorrichtung zur Spracherkennung in einem Kraftfahrzeug mittels Garbage-Grammatiken Download PDF

Info

Publication number
DE102013000897B4
DE102013000897B4 DE102013000897.2A DE102013000897A DE102013000897B4 DE 102013000897 B4 DE102013000897 B4 DE 102013000897B4 DE 102013000897 A DE102013000897 A DE 102013000897A DE 102013000897 B4 DE102013000897 B4 DE 102013000897B4
Authority
DE
Germany
Prior art keywords
garbage
parameter
grammar
motor vehicle
speech recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
DE102013000897.2A
Other languages
English (en)
Other versions
DE102013000897A1 (de
Inventor
Stefan Struhs
Mark Pleschka
Oliver Meyer
Stefan Schulz
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Volkswagen AG
Original Assignee
Volkswagen AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Volkswagen AG filed Critical Volkswagen AG
Priority to DE102013000897.2A priority Critical patent/DE102013000897B4/de
Publication of DE102013000897A1 publication Critical patent/DE102013000897A1/de
Application granted granted Critical
Publication of DE102013000897B4 publication Critical patent/DE102013000897B4/de
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/183Speech classification or search using natural language modelling using context dependencies, e.g. language models
    • G10L15/19Grammatical context, e.g. disambiguation of the recognition hypotheses based on word sequence rules
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/20Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech

Landscapes

  • Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Air-Conditioning For Vehicles (AREA)
  • Navigation (AREA)

Abstract

Verfahren zur Spracherkennung in einem Kraftfahrzeug, wobei die Spracherkennung auf einer Garbage-Grammatik mit einer vorgegebenen Anzahl von Grammatikregeln basiert, eine Grammatikregel mindestens ein Schlüsselwort und ein Garbage-Element aufweist, und ein Garbage-Element der Garbage-Grammatik mit einem Garbage-Parameter (P) beaufschlagt ist, dadurch gekennzeichnet, dass der Garbage-Parameter (P) als Funktion der Geschwindigkeit des Kraftfahrzeugs eingestellt wird.

Description

  • Die Erfindung betrifft ein Verfahren zur Spracherkennung in einem Kraftfahrzeug mittels Garbage-Grammatiken gemäß dem Oberbegriff des Anspruchs 1 sowie eine entsprechende Vorrichtung gemäß dem Oberbegriff des Anspruchs 5.
  • Spracherkennung beschreibt die Erkennung und Verarbeitung gesprochener Sprache durch Computer. Dieser Prozess läuft in zwei Schritten ab. Zuerst wird in einer akustischen Ebene der aufgenommene Sprachschall mit Hilfe eines Akustikmodells analysiert. Hierbei ist es nicht möglich einem gegebenen Schallmuster ein bestimmtes Wort zuzuordnen, sondern es werden pro Schallmuster mehrere Wortwahrscheinlichkeiten ermittelt. Die Analyse dieser Wortwahrscheinlichkeiten erfolgt in einem zweiten Schritt, der als Sprachmodell bezeichnet wird. Die Analyse auf der Ebene des Sprachmodells kann einerseits mittels Grammatiken auf der Basis von einfachen Wortfolgen oder andererseits mittels probabilistischer Sprachmodelle, wie beispielsweise N-Gram-Modellen, die statistische Beschreibungen der Sprache darstellen, erfolgen.
  • Für die Spracherkennung in einem Kraftfahrzeug, wie sie beispielsweise zur Bedienung von Fahrerassistenzeinrichtungen eingesetzt wird, werden weitgehend Grammatiken verwendet, da diese sich sehr gut dazu eignen Einzelwörter oder kurze Wortfolgen zu beschreiben, wie sie zur Bedienung und Steuerung von Fahrerassistenzsystemen zum Einsatz kommen. Dabei stellt eine Grammatik ein Regelwerk dar, nach dem Elemente einer Sprache miteinander zu einem Zusammenhang kombiniert werden, wobei das Regelwerk jedem Wort seine Funktion innerhalb der Grammatik zuweist. Das Regelwerk, d.h. die Grammatik, besteht aus einzelnen Grammatikregeln, wobei eine Grammatikregel eine oder mehrere mögliche Spracheingaben beschreibt, mit anderen Worten eine zulässige Wortkombination darstellt.
  • Nun kann die gesprochene Anweisung aus dem zur Steuerung notwendigen Schlüsselwort bzw. der notwendigen Schüsselwortkombination und beispielsweise einem oder mehreren Füllwörtern bestehen, wobei die Füllwörter für die Steuerung keine Bedeutung haben. Da die Grammatik nur Regeln bezüglich der zur Steuerung notwendigen Schlüsselwörter bzw. Schlüsselwortkombinationen aufweist, kann der Spracherkenner bei einer gesprochenen Anweisung bestehend aus Schlüsselwörtern und Füllwörtern keine Erkennung durchführen, sondern liefert als Ergebnis folglich die Feststellung eines Nichterkennens der Spracheingabe. Um dies zu vermeiden werden die Grammatikregeln um Füllwortelemente erweitert, die üblicherweise als Garbage-Elemente bezeichnet werden. So enthält eine Garbage-Grammatik zusätzlich zu den zulässigen Wörtern oder Wortkombinationen Garbage-Elemente, denen keine festgelegte Lautfolge zugewiesen ist, da die Garbage-Elemente für jegliche Wortfolgen stehen. Auf diese Weise können Spracheingaben besser erkannt werden, welche Füllwörter enthalten, die nicht in einer Grammatikregel spezifiziert sind.
  • Trotz der Verwendung von Garbage-Elementen kann es zu Fehl-Erkennungen kommen, indem beispielsweise ein Schlüsselwort einer Schlüsselwortkombination fälschlicherweise als Garbage-Element interpretiert wird. Um diesen Effekt zu verringern wird eine als Garbage-Parameter bezeichnete Kostenfunktion eingeführt, welche die Garbage-Elemente mit zusätzlichen „Kosten“ belegt. Dieser Garbage-Parameter hat üblicherweise einen Wert zwischen 0 und 100, wobei der Wert 100 für keine Kosten für das Garbage-Element steht, während der Wert 0 hohe Kosten für das Garbage-Element beinhaltet. Mit anderen Worten, wird der Garbage-Parameter auf einen geringen Wert gesetzt, so gibt es weniger Verwechselungsfehler, dafür ist der Spracherkenner weniger tolerant gegenüber Füllwörtern und wird öfter eine Spracheingabe nicht erkennen können.
  • Aus der Druckschrift US 7,392,188 B2 ist ein Verfahren zum Abbrechen oder Unterdrücken einer Sprachmeldung eines Kommunikationssystems durch eine Spracheingabe bekannt. Dabei wird das akustische Signal bestehend aus der Spracheingabe und der akustischen Rückkopplung der Sprachmeldung in einem Spracherkenner untersucht, welcher eine Garbage-Grammatik für die Sprachmeldung des Kommunikationssystems und ein akustisches Wortmodell für die Spracheingabe einsetzt.
  • Die Druckschrift EP 1 475 777 A2 offenbart eine Spracherkennungsvorrichtung unter Verwendung eines statistischen Modells, welches auch unter dem Namen „Hidden Markov Modell“ bekannt ist. Dabei werden in einem Speicher Sprachmodelle für die Schlüsselwörter und Sprachmodelle für mögliche Füllwörter, also Garbage, gespeichert. Die gespeicherten Sprachmodelle werden basierend auf früheren erkannten Schlüssel- und Füllwörtern sprecherindividuell aktualisiert.
  • Die Druckschrift DE 103 05 369 A1 beschreibt ein Verfahren zur Spracherkennung, wobei eines von mehreren Hintergrundgeräuschprofilen ausgewählt und die Spracherkennung unter Berücksichtigung dieses Hintergrundgeräuschprofils vorgenommen wird. Dabei entsprechen die Hintergrundgeräuschprofile jeweils unterschiedlichen Geräuschprofilen, wobei die Auswahl eines Hintergrundgeräuschprofils entweder automatisch oder von Benutzer vorgenommen werden kann.
  • Die Druckschrift DE 603 05 568 T2 betrifft eine Spracherkennungsvorrichtung zum Erkennen wenigstens eines der Schlüsselworte, enthalten in einer ausgesprochenen, spontanen Sprache aufweisend:
    • - eine Extraktionsvorrichtung zum Extrahieren eines Merkmalswerts einer spontanen Sprache, der ein Merkmalswert eines Sprachsegments der spontanen Sprache ist, durch Analysieren der spontanen Sprache;
    • - eine Datenbank, in der mindestens ein Datenteil eines Schlüsselwort-Merkmals einen Merkmalswert eines Sprachsegments des Schlüsselworts anzeigt und mindestens ein Merkmalsdatenteil einer belanglosen Sprache, der einen Merkmalswert eines Sprachsegments einer belanglosen Sprache anzeigt, vorab gespeichert ist,
    • - eine Berechnungsvorrichtung zum Berechnen einer Wahrscheinlichkeit, die eine Wahrscheinlichkeit anzeigt, dass mindestens ein Teil der Merkmalswerte der extrahierten, spontanen Sprache an die Schlüsselwort-Merkmalsdaten und die Merkmalsdaten der belanglosen Sprache angepasst ist;
    • - eine Bestimmungsvorrichtung zum Bestimmen mindestens eines der Schlüsselworte, um erkannt zu werden, und der belanglosen Sprache basierend auf der berechneten Wahrscheinlichkeit, wobei die Berechnungsvorrichtung die Wahrscheinlichkeit unter Verwendung eines vorbestimmten Korrekturwerts berechnet, wenn die Berechnungsvorrichtung die Wahrscheinlichkeit berechnet, die eine Wahrscheinlichkeit anzeigt, dass mindestens ein Teil der Merkmalswerte der extrahierten, spontanen Sprache an die Merkmalsdaten der belanglosen Sprache angepasst ist; und
    • - eine Einstellvorrichtung zum Einstellen des Korrekturwerts basierend auf einem Rauschpegel, im Bereich dessen die spontane Sprache ausgesprochen ist, wobei die Berechnungsvorrichtung die Wahrscheinlichkeit unter Verwendung des eingestellten Korrekturwerts berechnet, wenn die Berechnungsvorrichtung die Wahrscheinlichkeit berechnet, die eine Wahrscheinlichkeit anzeigt, dass mindestens ein Teil der Merkmalswerte der extrahierten, spontanen Sprache an die Merkmalsdaten der belanglosen Sprache angepasst ist.
  • Die Druckschrift US 2010 / 0 036 659 A1 betrifft ein Verfahren zur Signalverarbeitung, umfassend die Schritte der Bereitstellung eines Satzes von Prototypenspektralhüllkurven, der Bereitstellung eines Satzes von Referenzrauschprototypen, wobei die Referenzrauschprototypen aus mindestens einer Teilmenge des bereitgestellten Satzes von Prototyp-Spektralhüllen erhalten werden, wobei eine verbale Äußerung durch mindestens ein Mikrofon erkannt wird, um ein Mikrofonsignal zu erhalten, Verarbeitung des Mikrofonsignals zur Rauschunterdrückung basierend auf den bereitgestellten Referenzrauschprototypen, um ein verbessertes Signal zu erhalten, und Kodierung des erweiterten Signals basierend auf den bereitgestellten Prototyp-Spektralhüllen, um ein codiertes verbessertes Signal zu erhalten.
  • Bei dem Einsatz von Garbage-Grammatiken zur Spracherkennung von Schlüsselwörtern oder Schlüsselwortkombinationen in einem Kraftfahrzeug ist das Erkennungsergebnis von Umgebungsgeräuschen und Hintergrundgeräuschen stark abhängig.
  • Der Erfindung liegt daher die Aufgabe zugrunde, ein Verfahren und eine Vorrichtung zur Spracherkennung mittels Garbage-Grammatiken unter Verwendung eines Garbage-Parameters in einem Kraftfahrzeug zu verbessern und den Einfluss von Hintergrundgeräuschen zu vermindern.
  • Diese Aufgabe wird durch ein Verfahren mit den Merkmalen des Anspruchs 1 sowie durch eine Vorrichtung mit den Merkmalen des Anspruchs 5 gelöst. Bevorzugte Ausgestaltungen der Erfindung sind Gegenstand der Unteransprüche.
  • Bei dem erfindungsgemäßen Verfahren zur Spracherkennung in einem Kraftfahrzeug, wobei die Spracherkennung auf einer Garbage-Grammatik mit einer vorgegebenen Anzahl von Grammatikregeln basiert, eine Grammatikregel mindestens ein Schlüsselwort und ein Garbage-Element aufweist, und ein Garbage-Element der Garbage-Grammatik mit einem Garbage-Parameter beaufschlagt ist, wird der Garbage-Parameter als Funktion der Geschwindigkeit des Kraftfahrzeugs eingestellt.
  • Der optimale Wert des Garbage-Parameters, d.h. der Wert der zur niedrigsten Fehlerrate bei der Spracherkennung führt, ist abhängig von der Lautstärke der Umgebung. In einem Kraftfahrzeug ist die Umgebungslautstärke in erster Linie eine Funktion der Fahrzeuggeschwindigkeit. Durch die Verknüpfung der Fahrzeuggeschwindigkeit mit dem Garbage-Parameter wird für jede Fahrzeuggeschwindigkeit der für die Spracherkennung optimale Garbage-Parameter eingestellt und in der Spracherkennungsvorrichtung verwendet, so dass sich eine optimale Spracherkennungsrate ergibt.
  • Vorzugsweise weist der Garbage-Parameter einen Wertebereich zwischen 0 und 100 auf, wobei ein Garbage-Parameter von 100 für das Garbage-Element mit keinen Kosten verbunden ist, während ein Garbage-Parameter des Wertes 0 hohe Kosten für das Garbage-Element bedeutet. Ein anderer, den Umständen angepasster Wertebereich ist möglich, beispielsweise könnte die Kostenfunktion feiner oder gröber abgestuft sein oder könnte in Wahrscheinlichkeiten ausgedrückt werden.
  • Weiter bevorzugt kann die Geschwindigkeitsabhängigkeit des Garbage-Parameters in Form einer Kennlinie vorliegen, was zu einem schnellen Zugriff auf den einer Geschwindigkeit zugeordneten Garbage-Parameter führt.
  • Weiter bevorzugt kann die Funktion Garbage-Parameter - Kraftfahrzeuggeschwindigkeit parametrisch von den Umfeldbedingungen des Kraftfahrzeugs abhängen. Mit anderen Worten, beispielsweise bei einem heftigen Regen ist der funktionale Zusammenhang zwischen Fahrzeuggeschwindigkeit und Garbage-Parameter ein anderer wie bei einer trockenen Umgebung. Es kann daher sinnvoll sein, die Umfeldbedingungen des Kraftfahrzeugs zu klassifizieren, beispielsweise in „trockenes Umfeld“, „regnerisches Umfeld“ und „Starkregen“, so dass für jede Klasse der Umfeldbedingungen eine darauf abgestimmte Kennlinie oder Funktion verwendet wird. Die Unmfeldbedingungen können dabei mit einer geeigneten Umfeldsensorik bestimmt werden.
  • Die erfindungsgemäße Vorrichtung ausgelegt zur Durchführung des im Vorangegangenen beschriebenen Verfahrens umfasst eine Spracherkennungsvorrichtung basierend auf einer Garbage-Grammatik, eine Einrichtung zur Bestimmung der Geschwindigkeit des Kraftfahrzeugs, und eine Einrichtung zur Einstellung des Garbage-Parameters als Funktion der Fahrzeuggeschwindigkeit. Auf diese Weise kann der Garbage-Parameter an die Umgebungslautstärke angepasst werden, die in erster Linie von der Geschwindigkeit des Fahrzeugs abhängt.
  • Weiter bevorzugt weist die Vorrichtung eine Einrichtung zur Bestimmung und Klassifikation der Umfeldbedingungen des Kraftfahrzeugs auf, wobei die Einrichtung zur Bestimmung des Garbage-Parameters den Garbage-Parameter als Funktion der Geschwindigkeit des Fahrzeugs und der klassifizierten Umgebungsbedingungen bestimmt. Beispielsweise könnte die Umgebung in eine normale Geräuschkulisse, regnerische Geräuschkulisse und Starkregen klassifiziert werden.
  • Eine bevorzugte Ausführungsform der Erfindung wird nachfolgend anhand der Figuren erläutert. Dabei zeigt
    • 1 die erfindungsgemäßen Spracherkennungsvorrichtung in schematischer Darstellung, und
    • 2 Spracherkennungsraten als Funktion des Garbage-Parameters für verschiedene Fahrzeuggeschwindigkeiten.
  • Eine Spracherkennungs-Grammatik, wie sie in einer Spracherkennungsvorrichtung eines Kraftfahrzeugs zum Einsatz kommt, besteht aus einer Vielzahl einzelner Grammatikregeln, wobei eine Grammatikregel eine oder mehrere mögliche Spracheingaben, d.h. zulässige Wortkombinationen beschreibt.
  • Ein erstes Beispiel einer Grammatikregel für eine Spracherkennungsvorrichtung wäre: Grammatikregel _ 1 = Nummer w a ¨ hlen .
    Figure DE102013000897B4_0001
  • Bei einer Spracherkennungsgrammatik, die nur aus Grammatikregel_1 besteht, kann die Spracherkennungsvorrichtung nur die Spracheingabe „Nummer wählen“ erkennen. Wenn der Nutzer etwas anderes sagen würde, würde die Spracherkennungsvorrichtung daher entweder fälschlicherweise „Nummer wählen“ erkennen oder eine Fehlermeldung, wie beispielsweise „Nichts wurde erkannt“, ausgeben.
  • Eine Grammatik kann zusätzlich zu den zu erkennenden Wörtern, den Schlüsselwörtern, auch sogenannte Garbage-Elemente enthalten, die im Folgenden in einer Grammatikregel mit $GARBAGE bezeichnet werden. Einem Garbage-Element ist im Gegensatz zu einem Schlüsselwort keine festgelegte Lautfolge zugewiesen, sondern es kann für jegliche Lautfolge stehen. Auf diese Weise können Spracheingaben besser erkannt werden, die Füllwörter enthalten, welche nicht in der Grammatikregel spezifiziert wurden.
  • Ein weiteres Beispiel einer Grammatikregel wäre: Grammatikregel _ 2 = $GARBAGE Nummer w a ¨ hlen .
    Figure DE102013000897B4_0002
  • Passende Eingaben dazu wären Ausdrücke wie beispielsweise „Nummer wählen“, „Ich möchte eine Nummer wählen“, „Bitte Nummer wählen“ oder ähnliche Ausdrücke. Der Nachteil hierbei ist, dass durch die Verwendung von Garbage-Elementen die Gefahr von Verwechslungsfehlern, d.h. das Erkennen einer falschen Regel, steigt.
  • Ein Beispiel hierfür wären die folgenden Regeln: Grammatikregel _ 2 = $GARBAGE Nummer w a ¨ hlen;
    Figure DE102013000897B4_0003
    Grammatikregel _ 3 = Northfnummer w a ¨ hlen .
    Figure DE102013000897B4_0004
  • Bei einer Grammatik bestehend aus Grammatikregel_1 und Grammatikregel_2 könnte daher die Spracheingabe „Notrufnummer wählen“ fälschlicherweise als Grammatikregel 2 erkannt werden und der Bestandteil „Notruf“ des Schlüsselworts „Notrufnummer“ würde als Füllwort, d.h. als Garbage, betrachtet werden. Daher würde die Anweisung zur Wahl der Notrufnummer gemäß Grammatikregel_3 nicht befolgt werden.
  • Um diese Effekte zu beeinflussen und abzuschwächen, wird ein Garbage-Parameter P eingeführt, der Garbage-Elemente mit zusätzlichen „Kosten“ belegt. Der Garbage-Parameter P hat üblicherweise einem Wert zwischen 0 und 100, wobei der Wert 100 keine Kosten verursacht, während der Wert 0 für hohe Kosten steht. Wenn dem Garbage-Parameter P ein geringer Wert zugewiesen wird, treten weniger Verwechslungsfehler auf, dafür ist die Spracherkennungsvorrichtung jedoch auch weniger tolerant gegenüber Füllwörtern, da in diesem Fall der Garbage bzw. das Füllwort teurer bzw. unwahrscheinlicher ist.
  • 1 zeigt nun in schematischer Darstellung eine Vorrichtung zur Spracherkennung in einem Kraftfahrzeug. Dargestellt ist eine grammatikbasierte Spracherkennungsvorrichtung 1, deren Garbage-Parameter P mittels einer Vorrichtung 2 zur Einstellung des Garbage-Parameters P eingestellt wird. Die Vorrichtung 2 zur Einstellung des Garbage-Parameters P beinhaltet mindestens eine Funktion, vorzugsweise in Form einer Kennlinie, welche die funktionale Zuordnung des Garbage-Parameters zur aktuellen Geschwindigkeit des Fahrzeugs herstellt. Die aktuelle Geschwindigkeit des Fahrzeugs wird der Vorrichtung 2 zur Einstellung des Garbage-Parameters P von einem Fahrgeschwindigkeitsdetektor 3 geliefert.
  • Nun ist die Geräuschkulisse eines Fahrzeugs, d.h. die Fahrgeräusche, in erster Linie bedingt durch die Geschwindigkeit des Fahrzeugs. Allerdings kann in einer zweiten Ausführungsform die Ursache der Geräuschkulisse differenzierter betrachtet werden, indem eine Geräuschklassifikation der Fahrzeugumgebung durch einen Umfelddetektor 4 vorgenommen wird. So verändert sich beispielsweise die Umgebungsgeräuschkulisse von trockener Umgebung zu einer Starkregenumgebung. Mittels des Umfelddetektors 4 kann eine Klassifikation der Umfeld des Fahrzeugs hinsichtlich der Hintergrundgeräusche vorgenommen werden, so dass in der Vorrichtung 2 zur Einstellung des Garbage-Parameters P entsprechend der bestimmten Umfeldklasse eine Auswahl einer entsprechenden Garbage-Parameter-Funktion erfolgt. Im Fall der Verwendung von Kennlinien für den funktionalen Zusammenhang von Garbage-Parameter und Fahrzeuggeschwindigkeit würde dann in der Vorrichtung 2 zur Einstellung des Garbage-Parameters P jeweils eine Kennlinie pro Umfeldklasse vorliegen. Mit anderen Worten, die Kennlinien hängen parametrisch von den Umfeldklassen ab.
  • 2 zeigt ermittelte Spracherkennungsraten R in Prozent für die Garbage-Parameter mit den Werten 0, 10, 20, 40, 60, 80 und 100 für drei unterschiedliche Fahrzeuggeschwindigkeiten, nämlich 0 km/h, 50 km/h und 130 km/h. Zu erkennen ist im oberen Bild der 2, dass bei einem stehenden Fahrzeug ein Garbage-Parameter von 40 das beste Ergebnis liefert, nämlich eine Erkennungsrate R von 69%. Bei einer Geschwindigkeit von 50 km/h zeigt das mittlere Bild, das ein Garbage-Parameterbereich zwischen 10 und 40 eine Erkennungsrate R von 84 % bis 82% liefert, mit anderen Worten ein Plateau. Für hohe Geschwindigkeiten, wie hier das untere Bild der 2 für eine Geschwindigkeit von 130 km/h zeigt, liefert ein Garbage-Parameter von 10 das beste Erkennungsergebnis R von 80%. In erster Näherung muss daher für kleine Geschwindigkeiten ein relativ hoher Garbage-Parameter verwendet werden und für hohe Geschwindigkeiten ein kleiner Garbage-Parameter. Mit anderen Worten, je höher die Geschwindigkeit umso kleiner muss der Garbage-Parameter eingestellt werden.
  • Bezugszeichenliste
  • 1
    Spracherkennungsvorrichtung
    2
    Vorrichtung zur Einstellung des Garbage-Parameters P
    3
    Detektion der Fahrzeuggeschwindigkeit
    4
    Umfelddetektion
    P
    Garbage-Parameter
    R
    Spracherkennungsrate in Prozent

Claims (6)

  1. Verfahren zur Spracherkennung in einem Kraftfahrzeug, wobei die Spracherkennung auf einer Garbage-Grammatik mit einer vorgegebenen Anzahl von Grammatikregeln basiert, eine Grammatikregel mindestens ein Schlüsselwort und ein Garbage-Element aufweist, und ein Garbage-Element der Garbage-Grammatik mit einem Garbage-Parameter (P) beaufschlagt ist, dadurch gekennzeichnet, dass der Garbage-Parameter (P) als Funktion der Geschwindigkeit des Kraftfahrzeugs eingestellt wird.
  2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass der Garbage-Parameter (P) einen Wertebereich zwischen 0 und 100 aufweist.
  3. Verfahren nach einem der vorangegangenen Ansprüche, dadurch gekennzeichnet, dass die Geschwindigkeitsabhängigkeit des Garbage-Parameters (P) in Form einer Kennlinie vorliegt.
  4. Verfahren nach einem der vorangegangenen Ansprüche, dadurch gekennzeichnet, dass die Funktion Garbage-Parameter - Kraftfahrzeuggeschwindigkeit parametrisch von den Umfeldbedingungen des Kraftfahrzeugs abhängt.
  5. Vorrichtung ausgelegt zur Durchführung des Verfahrens zur Spracherkennung nach einem der vorangegangenen Ansprüche, mit einer Spracherkennungsvorrichtung (1) basierend auf einer Garbage-Grammatik und einer Einrichtung (3) zur Bestimmung der Geschwindigkeit des Kraftfahrzeugs, dadurch gekennzeichnet, dass die Vorrichtung eine Einrichtung (2) zur Einstellung des Garbage-Parameters (P) als Funktion der Fahrzeuggeschwindigkeit aufweist.
  6. Vorrichtung nach Anspruch 5, dadurch gekennzeichnet, dass die Vorrichtung eine Einrichtung (4) zur Bestimmung und Klassifikation der Umfeldbedingungen des Kraftfahrzeugs aufweist, wobei die Einrichtung (3) zur Bestimmung des Garbage-Parameters den Garbage-Parameter (P) als Funktion der Geschwindigkeit des Fahrzeugs und der Klasse der Umgebungsbedingungen bestimmt.
DE102013000897.2A 2013-01-18 2013-01-18 Verfahren und Vorrichtung zur Spracherkennung in einem Kraftfahrzeug mittels Garbage-Grammatiken Active DE102013000897B4 (de)

Priority Applications (1)

Application Number Priority Date Filing Date Title
DE102013000897.2A DE102013000897B4 (de) 2013-01-18 2013-01-18 Verfahren und Vorrichtung zur Spracherkennung in einem Kraftfahrzeug mittels Garbage-Grammatiken

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE102013000897.2A DE102013000897B4 (de) 2013-01-18 2013-01-18 Verfahren und Vorrichtung zur Spracherkennung in einem Kraftfahrzeug mittels Garbage-Grammatiken

Publications (2)

Publication Number Publication Date
DE102013000897A1 DE102013000897A1 (de) 2014-07-24
DE102013000897B4 true DE102013000897B4 (de) 2023-07-06

Family

ID=51063981

Family Applications (1)

Application Number Title Priority Date Filing Date
DE102013000897.2A Active DE102013000897B4 (de) 2013-01-18 2013-01-18 Verfahren und Vorrichtung zur Spracherkennung in einem Kraftfahrzeug mittels Garbage-Grammatiken

Country Status (1)

Country Link
DE (1) DE102013000897B4 (de)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE69323841T2 (de) 1992-12-11 1999-08-19 At & T Corp Klassifikation bei Spracherkennung von isolierten Wörtern in Schlüsselwörter und Nicht-Schlüsselwörter
US6195417B1 (en) 1997-11-18 2001-02-27 Telecheck International, Inc. Automated system for accessing speech-based information
DE10305369A1 (de) 2003-02-10 2004-11-04 Siemens Ag Benutzeradaptives Verfahren zur Geräuschmodellierung
EP1475777A2 (de) 2003-04-28 2004-11-10 Pioneer Corporation Verfahren und vorrichtung zur schlüsselworterkennung, programm zur schlüsselworterkennung, mit adaption von schlüsselwort- und nichtschlüsselwortmodellen.
DE60305568T2 (de) 2002-04-17 2007-04-26 Pioneer Corp. Schlüsselworterkennung in einem Sprachsignal
US7392188B2 (en) 2003-07-31 2008-06-24 Telefonaktiebolaget Lm Ericsson (Publ) System and method enabling acoustic barge-in
US20100036659A1 (en) 2008-08-07 2010-02-11 Nuance Communications, Inc. Noise-Reduction Processing of Speech Signals

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE69323841T2 (de) 1992-12-11 1999-08-19 At & T Corp Klassifikation bei Spracherkennung von isolierten Wörtern in Schlüsselwörter und Nicht-Schlüsselwörter
US6195417B1 (en) 1997-11-18 2001-02-27 Telecheck International, Inc. Automated system for accessing speech-based information
DE60305568T2 (de) 2002-04-17 2007-04-26 Pioneer Corp. Schlüsselworterkennung in einem Sprachsignal
DE10305369A1 (de) 2003-02-10 2004-11-04 Siemens Ag Benutzeradaptives Verfahren zur Geräuschmodellierung
EP1475777A2 (de) 2003-04-28 2004-11-10 Pioneer Corporation Verfahren und vorrichtung zur schlüsselworterkennung, programm zur schlüsselworterkennung, mit adaption von schlüsselwort- und nichtschlüsselwortmodellen.
US7392188B2 (en) 2003-07-31 2008-06-24 Telefonaktiebolaget Lm Ericsson (Publ) System and method enabling acoustic barge-in
US20100036659A1 (en) 2008-08-07 2010-02-11 Nuance Communications, Inc. Noise-Reduction Processing of Speech Signals

Also Published As

Publication number Publication date
DE102013000897A1 (de) 2014-07-24

Similar Documents

Publication Publication Date Title
DE102020205786B4 (de) Spracherkennung unter verwendung von nlu (natural language understanding)-bezogenem wissen über tiefe vorwärtsgerichtete neuronale netze
DE112017004374B4 (de) System und Verfahren zur Spracherkennung
DE602006000090T2 (de) Konfidenzmaß für ein Sprachdialogsystem
DE60023517T2 (de) Klassifizierung von schallquellen
DE60123161T2 (de) Verfahren und Vorrichtung zur Spracherkennung in einer Umgebung mit variablerem Rauschpegel
DE60124559T2 (de) Einrichtung und verfahren zur spracherkennung
DE102015213715A1 (de) Spracherkennungsvorrichtung und Spracherkennungsverfahren
DE102007051261A1 (de) Verfahren und Vorrichtung zur akustischen Beurteilung eines Kraftfahrzeuges
DE10334400A1 (de) Verfahren zur Spracherkennung und Kommunikationsgerät
DE102014118450A1 (de) Audiobasiertes System und Verfahren zur Klassifikation von fahrzeuginternem Kontext
DE112013007617T5 (de) Spracherkennungsvorrichtung und Spracherkennungsverfahren
EP3291234B1 (de) Verfahren zum beurteilen einer qualität eines stimmeinsatzes eines sprechenden
DE112013006770T5 (de) Spracherkennungsvorrichtung und Spracherkennungsverfahren
DE102017209262A1 (de) Verfahren und Vorrichtung zur automatischen Gestenerkennung
DE10119284A1 (de) Verfahren und System zum Training von jeweils genau einer Realisierungsvariante eines Inventarmusters zugeordneten Parametern eines Mustererkennungssystems
EP1182646A2 (de) Verfahren zur Zuordnung von Phonemen
DE102014207437B4 (de) Spracherkennung mit einer Mehrzahl an Mikrofonen
DE112015007163B4 (de) Spracherkennungsvorrichtung, Sprachhervorhebungsvorrichtung, Spracherkennungsverfahren, Sprachhervorhebungsverfahren und Navigationssystem
EP4189673A1 (de) Computerimplementiertes verfahren und computerprogramm zum maschinellen lernen einer robustheit eines akustischen klassifikators, akustisches klassifikationssystem für automatisiert betreibbare fahrsysteme und automatisiert betreibbares fahrsystem
DE102013000897B4 (de) Verfahren und Vorrichtung zur Spracherkennung in einem Kraftfahrzeug mittels Garbage-Grammatiken
EP0813734A1 (de) Verfahren zur erkennung mindestens eines definierten, durch hidden-markov-modelle modellierten musters in einem zeitvarianten messignal, welches von mindestens einem störsignal überlagert wird
EP0817167B1 (de) Spracherkennungsverfahren und Anordnung zum Durchführen des Verfahrens
DE102019207700A1 (de) Klassifikationsvorrichtung zur Objektdetektion in Umfeldsensordaten und Verfahren
DE10308611A1 (de) Ermittlung der Verwechslungsgefahr von Vokabulareinträgen bei der phonembasierten Spracherkennung
EP0962914B1 (de) Verfahren und Vorrichtung zum Ermitteln eines Zuverlässigkeitsmasses für die Spracherkennung

Legal Events

Date Code Title Description
R163 Identified publications notified
R012 Request for examination validly filed
R079 Amendment of ipc main class

Free format text: PREVIOUS MAIN CLASS: G10L0015220000

Ipc: G10L0015200000

R016 Response to examination communication
R018 Grant decision by examination section/examining division
R020 Patent grant now final