DE102005059390A1 - Spracherkennung im Kraftfahrzeug - Google Patents

Spracherkennung im Kraftfahrzeug Download PDF

Info

Publication number
DE102005059390A1
DE102005059390A1 DE200510059390 DE102005059390A DE102005059390A1 DE 102005059390 A1 DE102005059390 A1 DE 102005059390A1 DE 200510059390 DE200510059390 DE 200510059390 DE 102005059390 A DE102005059390 A DE 102005059390A DE 102005059390 A1 DE102005059390 A1 DE 102005059390A1
Authority
DE
Germany
Prior art keywords
recognition
speech
input
speech recognition
vocabulary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
DE200510059390
Other languages
English (en)
Inventor
Martin Dinkloh
Silvio Federau
Julia Ahlers
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Volkswagen AG
Original Assignee
Volkswagen AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Volkswagen AG filed Critical Volkswagen AG
Priority to DE200510059390 priority Critical patent/DE102005059390A1/de
Publication of DE102005059390A1 publication Critical patent/DE102005059390A1/de
Ceased legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60RVEHICLES, VEHICLE FITTINGS, OR VEHICLE PARTS, NOT OTHERWISE PROVIDED FOR
    • B60R16/00Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for
    • B60R16/02Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements
    • B60R16/037Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements for occupant comfort, e.g. for automatic adjustment of appliances according to personal settings, e.g. seats, mirrors, steering wheel
    • B60R16/0373Voice control

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Mechanical Engineering (AREA)
  • Navigation (AREA)

Abstract

Ein Verfahren zur Spracherkennung im Kraftfahrzeug, wobei zur Spracherkennung ein vorgegebener Gesamtwortschatz zur Verfügung steht, innerhalb dem die Spracherkennung durchgeführt wird, weist die folgenden Schritte auf: DOLLAR A - Durchführen einer ersten Spracherkennung mittels einer Ganzworterkennung einer ersten Spracheingabe in Form einer Ganzworteingabe durch einen Benutzer, wobei die Ganzworterkennung ein erstes Erkennergebnis ergibt, DOLLAR A - Präsentation des ersten Erkennergebnisses, DOLLAR A - Durchführen einer zweiten Spracherkennung aufgrund einer zweiten Spracheingabe durch den Benutzer, falls das erste Erkennergebnis durch den Benutzer als nicht übereinstimmend mit der Ganzworteingabe klassifiziert wird, wobei die zweite Erkennung ein zweites Erkennergebnis ergibt, welches eine Funktion des ersten Erkennergebnisses und der weiteren Spracheingabe ist, und DOLLAR A - Präsentation des zweiten Erkennergebnisses.

Description

  • Die Erfindung betrifft ein Verfahren zur Spracherkennung im Kraftfahrzeug, wobei zur Spracherkennung ein vorgegebener Gesamtwortschatz zur Verfügung steht, innerhalb dem die Spracherkennung durchgeführt wird, nach dem Oberbegriff des Anspruchs 1. Ferner betrifft die Erfindung die Verwendung des Verfahrens und eine entsprechende Vorrichtung gemäß dem Oberbegriff der Ansprüche 8 und 9.
  • Spracherkennungssysteme dienen beispielsweise zur vereinfachten Eingabe von Informationen und/oder Befehlen bzw. Anweisungen für geeignete Steuerungssysteme. So finden sich beispielsweise Spracherkennungssysteme im Mobilfunkbereich zur Abfrage der Mailbox oder bei elektronischen Anrufweiterleitungssystemen.
  • Eine weitere Anwendung der Spracherkennung betrifft die Eingabe von Daten, beispielsweise des Zielortes, in ein Navigationssystem eines Kraftfahrzeuges. Hier liegt die Schwierigkeit darin, dass aufgrund der großen Möglichkeiten und Vielfalt von Städte- und Straßennamen eine Erkennung des vom Fahrer eingegebenen Gesamtwortes aufgrund der beschränkten Ressourcen für eine Spracherkennung hinsichtlich der Erkennungsrate und der Performance schwierig ist. Daher existieren neben der manuellen Eingabe von Straßen- und Städtenamen in eine Navigationssystem bei der sprachlichen Eingabe verschiedene Lösungsansätze.
  • So offenbart die DE 10 2004 012 148 A1 eine Spracheingabe für eine Navigationssystem eines Kraftfahrzeugs, bei der die Spracherkennung unter Berücksichtigung der aktuellen geographischen Position durchgeführt wird, die von geeigneten Positionssensormitteln zum automatischen Feststellen der geographischen Position ermittelt wird.
  • Ferner zeigt die DE 198 35 556 A1 ein Navigationssystem für ein Fortbewegungsmittel, beispielsweise ein Kraftfahrzeug, ein Schiff oder ein Flugzeug, zur Navigation von einem Standort zu einem Zielort, wobei eine Eingabevorrichtung zur Eingabe von Befehlen und/oder des Zielortes und ggf. des Standortes vorgegeben ist. Hierbei umfasst die Eingabevorrichtung ein Spracheingabemodul, welches Sprache erkennt und entsprechende Eingaben an das Navigationssystem umwandelt.
  • Nachteilig bei dem bekannten Systemen ist die nicht zufriedenstellende Erkennungswahrscheinlichkeit der Spracherkennung aufgrund des umfangreichen Gesamtwortschatzes an Orts- und Straßennamen.
  • Der Erfindung liegt daher die Aufgabe zugrunde, ein Verfahren zur Spracherkennung in einem Kraftfahrzeug, eine geeignete Verwendung des Verfahrens sowie ein Spracherkennungssystem mit verbesserter Spracherkennungsfähigkeit zu schaffen.
  • Diese Aufgabe wird gelöst durch ein Verfahren zur Spracherkennung mit den Merkmalen des Anspruchs 1, eine Verwendung des besagten Verfahrens mit den Merkmalen des Anspruchs 8 sowie durch ein Spracherkennungssystem mit den Merkmalen des Anspruchs 9. Bevorzugte Ausgestaltung des Verfahrens sind Gegenstand der Unteransprüche.
  • Das erfindungsgemäße Verfahren zur Spracherkennung im Kraftfahrzeug, wobei für die Spracherkennung ein vorgegebener Gesamtwortschatz zur Verfügung steht, welcher zur Spracherkennung verwendet wird, umfasst die folgenden Schritte:
    • – Durchführen einer ersten Spracherkennung mittels einer Ganzworterkennung einer ersten Spracheingabe, wobei die Spracheingabe durch eine Ganzworteingabe durch einen Benutzer erfolgt, und wobei als Ergebnis der ersten Spracherkennung mittels der Ganzworterkennung ein erstes Erkennergebnis vorliegt,
    • – Präsentation des ersten Erkennergebnisses an den Benutzer,
    • – Durchführen einer zweiten Spracherkennung aufgrund einer zweiten Spracheingabe durch den Benutzer, falls das erste Erkennergebnis vom Benutzer als nicht übereinstimmend mit der Ganzworteingabe klassifiziert wird, wobei die zweite Erkennung ein zweites Erkennergebnis liefert, welches eine Funktion des ersten Erkennergebnisses und der zweiten Spracheingabe ist oder eine Funktion der Ganzworteingabe und der zweiten Spracheingabe ist, und
    • – Präsentation des zweiten Erkennergebnisses an den Benutzer.
  • Im Falle, dass der Benutzer mit dem ersten Erkennergebnis zufrieden ist, d.h. der Benutzer das erste Erkennergebnis als mit seinem eingegebenen Ganzwort als übereinstimmend klassifiziert hat, wird das erste Erkennergebnis als gültig eingestuft und im Anwendungsfall beispielsweise an ein Navigationssystem weitergegeben. Der Benutzer muss ebenfalls das zweite Erkennergebnis als gültig oder nicht gültig klassifizieren. Im Falle einer gültigen Klassifikation wird das zweite Erkennergebnis weiter verwendet, während im Falle der Klassifikation als nicht gültig beispielsweise das Verfahren ganz oder teilweise wiederholt wird oder auf eine andere Form der Eingabe zurückgegriffen wird.
  • Vorzugsweise berechnet die zweite Spracherkennung zuerst ein Teilerkennergebnis aufgrund der zweiten Spracheingabe. Nachfolgend wird aus dem Teilerkennergebnis und dem ersten Erkennergebnis oder aus dem Teilerkennergebnis und der Ganzworteingabe das zweite Erkennergebnis berechnet. Durch diese Verknüpfung der zweiten Spracherkennung mit dem Ergebnis der ersten Spracherkennung bzw. mit der Ganzworteingabe wird insgesamt das Ergebnis einer Spracherkennung verbessert.
  • Vorzugsweise wird zur Durchführung der ersten Spracherkennung ein erster Wortschatz einer vorgegebenen Größe bzw. eines vorgegebenen Umfangs verwendet, wobei das Eingabewort der ersten Spracheingabe innerhalb dieses ersten Wortschatzes gesucht wird. Dabei ist der erste Wortschatz eine Teilmenge des Gesamtwortschatzes. So kann derzeit eine Spracherkennung nur einen Wortschatz von ca. 30.000 Wörtern bearbeiten, d.h. gleichzeitig erkennen. Allerdings gibt es allein in Deutschland bereits ca. 70.000 Städte- bzw. Ortsnamen. So können daher in dem ersten Schritt ein erster Wortschatz von 30.000, beispielsweise für Deutschland fest definierte Städte geladen werden und die Spracherkennung sucht ähnlich klingende Städte aus diesem ersten Wortschatz aufgrund der Gesamtworteingabe der ersten Spracherkennung aus und bietet sie dem Benutzer zur Auswahl an.
  • Vorzugsweise wird zur Durchführung der zweiten Spracherkennung ein zweiter Wortschatz einer vorgegebenen Größe bzw. eines vorgegebenen Umfangs verwendet, wobei das Eingabewort der zweiten Spracherkennung innerhalb des zweiten Wortschatzes gesucht wird und wobei die Anzahl der Elemente des zweiten Wortschatzes kleiner ist als die des ersten Wortschatzes. Selbstverständlich ist der zweite Wortschatz ebenfalls eine Teilmenge des Gesamtwortschatzes. In einem Beispiel verdeutlicht heißt dies, dass in dem zweiten Schritt der zweiten Spracherkennung das Verfahren beispielsweise einen Wortschatz umfassend die 100 größten Städten aus Deutschland lädt und den Benutzer nach einer großen Stadt in der Nähe des Zielortes fragt. Das System erkennt aufgrund des geringen zweiten Wortschatzes die große Stadt mit hoher Genauigkeit und lässt sich diese in dem Präsentationsschritt bestätigen. Anschließend wird in einem weiteren dritten Schritt eine Auswahl von Städten bzw. Orten in der Umgebung der gefundenen großen Stadt in den Speicher geladen und es wird der erste Schritt der Gesamtworteingabe in diesem Umkreis der gefundenen großen Stadt wiederholt.
  • In einer weiteren bevorzugten Ausführungsform erfolgt die zweite Spracheingabe der zweiten Spracherkennung durch Buchstabieren des Eingabewortes. Insbesondere kann in diesem Fall für die zweite Spracherkennung der Gesamtwortschatz verwendet werden, da die Erkennungswahrscheinlichkeit bei der Buchstabierung eines Ortes hoch ist. Vorzugsweise, wie bereits in den Beispielen angedeutet, umfasst der Gesamtwortschatz der Spracherkennung die Orts- und Städtenamen eines vorgegebenen geographischen Bereichs, beispielsweise die Orts- und Städtenamen von Deutschland. Durch eine Abgrenzung des geographischen Bereichs können selbstverständlich auch Straßennamen im System abgelegt sein.
  • Vorzugsweise wird das im Vorangegangenen erläuterte Verfahren in einem Navigationssystem eines Kraftfahrzeuges verwendet, um beispielsweise den Zielort in das System einzugeben.
  • Ein erfindungsgemäßes Spracherkennungssystem in einem Kraftfahrzeug zur Durchführung des oben genannten Verfahrens umfasst eine Spracheingabeeinrichtung, eine Anzeigeeinrichtung zur Anzeige von Ergebnissen einer Spracherkennungseinrichtung, wobei die Spracherkennungseinrichtung einen Wortschatzspeicher, eine Berechnungseinheit zum Berechnen von Teilerkennergebnissen aufgrund der Spracheingabe, und einen Zwischenspeicher zum Speichern von Erkennergebnissen Teilerkennergebnisse aufweist.
  • Vorzugsweise weist das Spracherkennungssystem eine Sprachausgabeeinrichtung sowie ggf. eine manuelle Eingabeeinrichtung zur Eingabe von Daten auf.
  • Insbesondere kann das Spracherkennungssystem Bestandteil eines Navigationssystems eines Kraftfahrzeugs sein. Dabei werden vorzugsweise im Wortschatzspeicher des Spracherkennungssystems die Orts- und Städtenamen einer geographischen Region und/oder die Straßennamen der Orte einer vorgegebenen geographischen Region gespeichert.
  • Eine bevorzugte Ausführungsform der Erfindung wird nachfolgend anhand der Zeichnungen beschrieben. Dabei zeigt
  • 1 den Ablauf des Verfahrens in Form eines Blockdiagramms und
  • 2 eine Detailskizze zur Berechnung des zweiten Erkennergebnisses.
  • 1 zeigt den Verfahrensablauf anhand eines Beispiels in Form eines Blockdiagramms. Der Benutzer wird zunächst in einem ersten Schritt 1 zu einer Ganzworteingabe aufgefordert, beispielsweise zur Eingabe eines Städtenamens. Wahlweise kann diese Ganzworteingabe aber auch ein Land, eine Strasse, eine Kreuzung oder ähnliche Eingaben betreffen. Dabei wird in diesem ersten Schritt 1 das notwendige Vokabular in den Spracherkenner geladen, welches für eine Ganzworterkennung von Nöten ist. Dies ist der sogenannte erste Wortschatz, welcher eine Teilmenge des Gesamtwortschatzes ist. Beispielsweise können dies bei einem Navigationssystem mit Spracherkennung eine Liste von 30.000 deutschen Ortschaften und Städten sein, wobei die Gesamtanzahl deutscher Städte und Ortschaften ca. 70.000 beträgt. Im Falle eines Navigationssystems kann der Benutzer durch eine Sprachausgabe des Systems oder durch eine Ausgabe auf einer Anzeige beispielsweise durch die Aufforderung "Bitte nennen Sie eine Stadt", zur Ganzworteingabe aufgefordert werden.
  • Aufgrund der Aufforderung wird der Nutzer im nächsten Schritt 2 dann solch eine erste Spracheingabe in Form einer Gesamtworteingabe, beispielsweise durch die Eingabe "Berlin", tätigen.
  • Diese wird nun im Schritt 3 den spezifischen Auswertungsalgorithmen eines Spracherkenners unterworfen. Der Spracherkenner berechnet hierdurch das am wahrscheinlichsten genannte Ergebnis, das sogenannte best-Command, beziehungsweise die am wahrscheinlichsten genannten Ergebnisse, die auch als n-best-Liste bezeichnet wird.
  • Bei der anschließenden Präsentation im Schritt 4 auf einer Anzeige und/oder einer Sprachausgabe dieses Erkennergebnisses oder der Erkennergebnisse entscheidet der Nutzer, ob das Ergebnis (best-Command) der von ihm genannten Eingabe entspricht, beziehungsweise, ob die Ergebnisse (n-best-Liste) der vom ihm genannten Eingabe entsprechen. Für den Fall, dass eine Übereinstimmung zwischen Eingabe und Spracherkennergebnis auftritt, wie dies durch die Verzweigung "Y" dargestellt ist, kann dieser Teil des Sprachdialoges beendet und das Erkennergebnis der Ganzworteingabe im Schritt 5 übernommen werden. Eine weitere Verwendung der Ganzworteingabe des Nutzers ist damit hinfällig geworden und somit kann dieses Ergebnis verworfen werden. Für den Fall aber, dass keine Übereinstimmung zwischen der vom Nutzer gemachten Eingabe und des vom Erkenner präsentierten Ergebnisses (best-Command) beziehungsweise, der vom Spracherkenner präsentierten Ergebnisse (n-best-Liste) auftritt, wird der zweite Teil des Sprachdialoges im mit "N" gekennzeichneten Zweig angestoßen. Die Nutzereingabe der Ganzworteingabe wird in diesem Fall nicht verworfen, sondern für eine nachfolgende Auswertung bereitgehalten.
  • Um den Sprachdialog fortführen zu können, muss der Nutzer darauf hingewiesen werden, was er als nächstes zu tun hat. In diesem Fall wird der Nutzer im Schritt 9 aufgefordert, seine Eingabe zu buchstabieren. Auch hier wird das für den Spracherkenner notwendige Vokabular zum Buchstabieren geladen. Ob der Nutzer zwischen der Präsentation des ersten Erkennergebnisses im Schritt 4 und der Aufforderung zum Buchstabieren im Schritt 9 direkt über den Zweig 7 hingeführt oder durch einen Schritt 6 abgefragt wird, ob er sein Ergebnis verfeinern möchte, ist dabei abhängig von der Implementierung des Dialoges.
  • Nach der Aufforderung zum Buchstabieren der Eingabe und dem Laden des dafür notwendigen Vokabulars im Schritt 9, wird der Nutzer im Schritt 10 seine Eingabe buchstabieren. Am Ende der Eingabe der Buchstabenfolge wird nun nicht mehr nur die Buchstabenfolge an sich, sondern zusätzlich auch noch die vorgehaltene Ganzworteingabe des Schritts 2 über den Pfad 14 des Nutzers den spezifischen Auswertungsalgorithmen eines Spracherkenners im Schritt 11 unterworfen. Es ist auch möglich, das erste Erkennergebnis des Schritts 3 dem Auswertealgorithmus des Schritts 11 zu unterziehen. Die Berechnung des am wahrscheinlichsten genannten Ergebnisses (best-Command), beziehungsweise der am wahrscheinlichsten genannten Ergebnisse (n-best-Liste), also des zweiten Erkennergebnisses, basiert demzufolge nun nicht mehr nur auf der Buchstabenfolge des Schritts 10 allein, sondern auch noch auf der bereitgestellten Ganzworteingabe des Schritts 2. Diese werden dem Nutzer im Schritt 12 präsentiert und der Dialog wird wie im Schritt 4 fortgeführt. Das heißt, im Fall einer Übereinstimmung Y wird das zweite Erkennergebnis vom System übernommen und anschließend verworfen (Schritt 13). Im Fall keiner Übereinstimmung N kann beispielsweise eine manuelle Eingabe erfolgen oder der Schritt 9, d.h. die Buchstabeneingabe, wird wiederholt.
  • Die Verifizierung des präsentierten ersten Erkennergebnisses (best-command/n-best-Liste) der Ganzworteingabe im weiteren Dialogablauf kann ebenso eine Gewichtung dieses Erkennergebnisses beinhalten. Dadurch, dass das präsentierte erste Ergebnis 1 (best-command/n-best-Liste) schon einmal vom Nutzer abgewiesen wurde, ist es für eine weitere Auswertung irrelevant. Da es, vom Erkennsystem als wahrscheinlichstes genanntes Ergebnis (best-command), bzw. als die wahrscheinlichsten Ergebnisse (n-best-Liste) präsentiert, vom Nutzer aber verworfen wurde, ist es sogar das am wahrscheinlichsten falsche Ergebnis (best-command) bzw. die am wahrscheinlichsten falschen Ergebnisse (n-best-Liste) und kann in der folgenden Verifizierung mit einer anderen Wichtung (0 = gar nicht; 1 = zu 100%) behandelt werden.
  • 2 zeigt in einer genaueren Darstellung den Schritt 11 der 1. Dabei wird zunächst aus der Buchstabenfolge des Schritts 10 das am wahrscheinlichsten genannte Ergebnis (best-Command) beziehungsweise, die am wahrscheinlichsten genannten Ergebnisse (n-best-Liste) im Schritt 11a berechnet. Diese Ergebnisse werden in dem Teilergebnis 2.1 festgehalten (Schritt 11b). Dieses Teilergebnis 2.1 des Schritts 11b wird nun abermals den spezifischen Auswertungsalgorithmen eines Spracherkenners in einem Schritt 11c unterworfen. Als Eingabe wird hierbei jedoch die vorgehaltene Ganzworteingabe des Schritts 2 der 1 herangezogen, d.h. das erste Erkennergebnis. Die spezifischen Auswertungsalgorithmen des Spracherkenners liefern hierbei das Erkennergebnis 2 im Schritt 11d, welches wiederum aus dem am wahrscheinlichsten genanntem Ergebnis (best-Command), beziehungsweise der am wahrscheinlichsten genannten Ergebnisse (n-best-Liste) bestehen kann. Durch die Einbeziehung der vorgehaltenen Ganzworteingabe, wird nicht nur das Teilergebnis 2.1 des Schritts 11b um eine Vielzahl unwahrscheinlicherer Ergebnisse (bei einer n-best-Liste) reduziert, es wird auch die Wahrscheinlichkeit der ursprünglich genannten Eingabe erhöht werden. Also der Eingabe, die der Nutzer letztendlich gemeint hat.
  • Eine weitere Ausführungsform besteht darin, dass anstelle der Ausforderung zur Eingabe von Buchstaben im Schritt 10 die Eingabe einer größeren Stadt in der Umgebung des Zielortes abgefragt wird, was beinhaltet, dass ein zweiter Wortschatz bestehend aus den größeren Städten geladen wird, der die Basis der Spracherkennung diese zweiten Spracherkennungsschrittes bildet. Nach der Erkennung der größeren Stadt werden die Orte und Städte in der Umgebung der Zielstadt geladen und eine erneute Spracherkennung basierend auf der Ganzworteingabe des Schritts 2 durchgeführt, um jetzt den Zielort festzustellen.
  • 1
    Aufforderung zur Ganzworteingabe, Laden des ersten Wortschatzes
    2
    Ganzworteingabe
    3
    Berechnung des ersten Erkennergebnisses
    4
    Präsentation des ersten Erkennergebnisses
    5
    Übernahme und anschließende Verwertung des ersten Erkennergebnisses
    6
    Verfeinerung des ersten Erkennergebnisses gewünscht?
    7
    direkter Zugriff
    8
    Wiederholung der Ganzworteingabe, Verweis auf manuelle Eingabe
    9
    Aufforderung zur Eingabe einer Buchstabenfolge, Laden des Gesamtwortschatzes
    10
    Eingabe Buchstabenfolge
    11
    Berechnung des zweiten Erkennergebnisses
    11a
    Berechnung des Teilerkennergebnisses aus der Buchstabenfolge
    11b
    Teilerkennergebnis
    11c
    Berechnung des zweiten Erkennergebnis aus ersten Erkennergebnis und Teilerkennergebnis
    11d
    zweites Erkennergebnis
    12
    Präsentation des zweiten Erkennergebnisses
    13
    Übernahme und anschließende Verwerfung des zweiten Erkennergebnisses
    14
    Übernahme Ganzworteingabe
    Y
    Übereinstimmung
    N
    keine Übereinstimmung

Claims (12)

  1. Verfahren zur Spracherkennung im Kraftfahrzeug, wobei zur Spracherkennung ein vorgegebener Gesamtwortschatz zur Verfügung steht, innerhalb dem die Spracherkennung durchgeführt wird, gekennzeichnet durch die Schritte: – Durchführen einer ersten Spracherkennung mittels einer Ganzworterkennung einer ersten Spracheingabe in Form einer Ganzworteingabe durch einen Benutzer, wobei die Ganzworterkennung ein erstes Erkennergebnis liefert, – Präsentation des ersten Erkennergebnisses, – Durchführen einer zweiten Spracherkennung aufgrund einer zweiten Spracheingabe durch den Benutzer, falls das erste Erkennergebnis durch den Benutzer als nicht übereinstimmend mit der Ganzworteingabe klassifiziert wird, wobei die zweite Erkennung ein zweites Erkennergebnis ergibt, welches eine Funktion des ersten Erkennergebnisses und der weiteren Spracheingabe ist oder eine Funktion der Ganzworteingabe und der weiteren Spracheingabe ist, und – Präsentation des zweiten Erkennergebnisses.
  2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass die zweite Spracherkennung zuerst ein Teilerkennergebnis aufgrund der zweiten Spracheingabe berechnet, und nachfolgend aus dem Teilerkennergebnis und dem ersten Erkennergebnis das zweite Erkennergebnis oder aus dem Teilerkennergebnis und der Ganzworteingabe das zweite Erkennergebnis berechnet wird.
  3. Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, dass zur Durchführung der ersten Spracherkennung ein erster Wortschatz einer vorgegebenen Größe verwendet wird, wobei das Eingabewort der ersten Spracheingabe innerhalb des ersten Wortschatzes gesucht wird und der erste Wortschatz eine Teilmenge des Gesamtwortschatzes ist.
  4. Verfahren nach Anspruch 3, dadurch gekennzeichnet, dass zur Durchführung der zweiten Spracherkennung ein zweiter Wortschatz einer vorgegebenen Größe verwendet wird, wobei das Eingabewort der zweiten Spracherkennung innerhalb des zweiten Wortschatzes gesucht wird, die Anzahl der Elemente des zweiten Wortschatzes kleiner ist als die des ersten Wortschatzes und der zweite Wortschatz eine Teilmenge des Gesamtwortschatzes ist.
  5. Verfahren nach einem der Ansprüche 1 bis 3, dadurch gekennzeichnet, dass die zweite Spracheingabe der zweiten Spracherkennung durch Buchstabieren des Eingabewortes erfolgt.
  6. Verfahren nach Anspruch 5, dadurch gekennzeichnet, dass zur zweiten Spracherkennung der Gesamtwortschatz verwendet wird.
  7. Verfahren nach einem der vorangegangenen Ansprüche, dadurch gekennzeichnet, dass der Gesamtwortschatz die Orts- und Städtenamen eines vorgegebenen geographischen Bereichs umfasst.
  8. Verwendung des Verfahrens nach einem der vorangegangenen Ansprüche in einem Navigationssystem eines Kraftfahrzeugs.
  9. Spracherkennungssystem in einem Kraftfahrzeug zur Durchführung des Verfahrens nach einem der Ansprüche 1 bis 8 mit einer Spracheingabeeinrichtung, einer Anzeigeeinrichtung zur Anzeige von Informationen und einer Spracherkennungseinrichtung, wobei die Spracherkennungseinrichtung einen Wortschatzspeicher, eine Berechnungseinheit zum Berechnen von Erkennergebnissen und Teilerkennergebnissen, und einen Zwischenspeicher zum Speichern von Erkennergebnissen und Teilerkennergebnissen aufweist.
  10. Spracherkennungssystem nach Anspruch 9, dadurch gekennzeichnet, dass das Spracherkennungssystem eine Sprachausgabeeinrichtung und einen manuelle Eingabeeinrichtung aufweist.
  11. Spracherkennungssystem nach Anspruch 9 oder 10, dadurch gekennzeichnet, dass das Spracherkennungssystem Bestandteil eines Navigationssystems eines Kraftfahrzeugs ist.
  12. Spracherkennungssystem nach Anspruch 11, dadurch gekennzeichnet, dass der Wortschatzspeicher Ortsnamen einer geographischen Region und/oder Straßennamen der Orte einer vorgegebenen geographischen Region aufweist
DE200510059390 2005-12-09 2005-12-09 Spracherkennung im Kraftfahrzeug Ceased DE102005059390A1 (de)

Priority Applications (1)

Application Number Priority Date Filing Date Title
DE200510059390 DE102005059390A1 (de) 2005-12-09 2005-12-09 Spracherkennung im Kraftfahrzeug

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE200510059390 DE102005059390A1 (de) 2005-12-09 2005-12-09 Spracherkennung im Kraftfahrzeug

Publications (1)

Publication Number Publication Date
DE102005059390A1 true DE102005059390A1 (de) 2007-06-14

Family

ID=38056041

Family Applications (1)

Application Number Title Priority Date Filing Date
DE200510059390 Ceased DE102005059390A1 (de) 2005-12-09 2005-12-09 Spracherkennung im Kraftfahrzeug

Country Status (1)

Country Link
DE (1) DE102005059390A1 (de)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102008027958A1 (de) * 2008-03-03 2009-10-08 Navigon Ag Verfahren zum Betrieb eines Navigationssystems
DE102010026708A1 (de) 2010-07-10 2012-01-12 Volkswagen Ag Verfahren zum Betreiben eines Sprachdialogsystems und Sprachdialogsystem
DE102010040553A1 (de) * 2010-09-10 2012-03-15 Siemens Aktiengesellschaft Spracherkennungsverfahren
DE102013007964B4 (de) 2013-05-10 2022-08-18 Audi Ag Kraftfahrzeug-Eingabevorrichtung mit Zeichenerkennung

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19709518C1 (de) * 1997-03-10 1998-03-05 Daimler Benz Aerospace Ag Verfahren und Vorrichtung zur Spracheingabe einer Zieladresse in ein Zielführungssystem im Echtzeitbetrieb
DE19742054A1 (de) * 1997-09-24 1999-04-01 Philips Patentverwaltung Eingabesystem wenigstens für Orts- und/oder Straßennamen

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19709518C1 (de) * 1997-03-10 1998-03-05 Daimler Benz Aerospace Ag Verfahren und Vorrichtung zur Spracheingabe einer Zieladresse in ein Zielführungssystem im Echtzeitbetrieb
DE19742054A1 (de) * 1997-09-24 1999-04-01 Philips Patentverwaltung Eingabesystem wenigstens für Orts- und/oder Straßennamen

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102008027958A1 (de) * 2008-03-03 2009-10-08 Navigon Ag Verfahren zum Betrieb eines Navigationssystems
DE102010026708A1 (de) 2010-07-10 2012-01-12 Volkswagen Ag Verfahren zum Betreiben eines Sprachdialogsystems und Sprachdialogsystem
DE102010040553A1 (de) * 2010-09-10 2012-03-15 Siemens Aktiengesellschaft Spracherkennungsverfahren
DE102013007964B4 (de) 2013-05-10 2022-08-18 Audi Ag Kraftfahrzeug-Eingabevorrichtung mit Zeichenerkennung

Similar Documents

Publication Publication Date Title
EP1793371B1 (de) Verfahren zur Spracherkennung
DE60016722T2 (de) Spracherkennung in zwei Durchgängen mit Restriktion des aktiven Vokabulars
DE60032193T2 (de) Verfahren und System zur Auswahl erkannter Wörter bei der Korrektur erkannter Sprache
DE19709518C5 (de) Verfahren und Vorrichtung zur Spracheingabe einer Zieladresse in ein Zielführungssystem im Echtzeitbetrieb
EP1176395B1 (de) Verfahren zur Auswahl einer Ortsbezeichnung in einem Navigationssystem durch Spracheingabe
DE102009017177B4 (de) Spracherkennungsanordnung und Verfahren zur akustischen Bedienung einer Funktion eines Kraftfahrzeuges
DE102019119171A1 (de) Spracherkennung für fahrzeugsprachbefehle
EP1264302B1 (de) Verfahren zur spracheingabe eines zielortes mit hilfe eines definierten eingabedialogs in ein zielführungssystem
EP0994461A2 (de) Verfahren zur automatischen Erkennung einer buchstabierten sprachlichen Äusserung
DE112011105407T5 (de) Spracherkennungsvorrichtung und Navigationsvorrichtung
DE102007033472A1 (de) Verfahren zur Spracherkennung
DE102009010275A1 (de) Informationsgewinnungsvorrichtung, Informationsgewinnungssystem und Informationsgewinnungsverfahren
EP2567194B1 (de) Verfahren und vorrichtung zum betreiben einer nutzerschnittstelle
EP1071075A2 (de) Verfahren zur Eingabe von Daten in ein System
DE102005018174A1 (de) Verfahren zur gezielten Ermittlung eines vollständigen Eingabedatensatzes in einem Sprachdialog 11
EP3152753B1 (de) Assistenzsystem, das mittels spracheingaben steuerbar ist, mit einer funktionseinrichtung und mehreren spracherkennungsmodulen
DE112016006512T5 (de) Absichtseinschätzungsvorrichtung und Absichtseinschätzungsverfahren
DE102005059390A1 (de) Spracherkennung im Kraftfahrzeug
EP1238250B1 (de) Spracherkennungsverfahren und -einrichtung
DE102018132160A1 (de) System und verfahren zum verstehen von standardsprache und dialekten
DE102017211447B4 (de) Verfahren zum Auswählen eines Listeneintrags aus einer Auswahlliste einer Bedienvorrichtung mittels Sprachbedienung sowie Bedienvorrichtung
EP1076896B1 (de) Verfahren und vorrichtung zur erkennung mindestens eines schlüsselworts in gesprochener sprache durch einen rechner
DE102020131652A1 (de) Agentvorrichtung, Agentsystem und computerlesbares Speichermedium
DE102021212744A1 (de) Dialogsystem, fahrzeug mit demselben und verfahren zum steuern eines dialogsystems
DE102016003903A1 (de) Verfahren zur Spracherkennung in einem Kraftfahrzeug

Legal Events

Date Code Title Description
OM8 Search report available as to paragraph 43 lit. 1 sentence 1 patent law
R012 Request for examination validly filed

Effective date: 20120907

R079 Amendment of ipc main class

Free format text: PREVIOUS MAIN CLASS: G10L0015020000

Ipc: G10L0015320000

R016 Response to examination communication
R002 Refusal decision in examination/registration proceedings
R003 Refusal decision now final