-
HINTERGRUND
-
Bereich der Erfindung
-
Die vorliegende Erfindung bezieht sich auf ein Gerät und ein Verfahren für das Bearbeiten von Sprachbefehlen, und spezieller ausgedrückt, auf ein Gerät und ein Verfahren für das Bearbeiten von Sprachbefehlen, um neue Sprachbefehle zu lernen, basierend auf einer Wechselwirkung mit einem Benutzer.
-
Hintergrund der Erfindung
-
In jüngster Zeit wurden Fahrzeuge aufgrund der Entwicklung einer elektronischen Technologie und der Nachfrage des Verbrauchers mit verschiedenen modernen Elektroniksteuergeräten und Geräten für die Annehmlichkeit bzw. den Komfort ausgestattet. Im Allgemeinen werden in diesen jüngsten Anwendungen Operationen der elektronischen Steuergeräte und der Geräte für den Komfort entsprechend den Sprachbefehlen der Fahrer durchgeführt.
-
Um verschiedene Operationen verschiedener elektronischer Steuergeräte und Geräte für de Komfort, welche in Fahrzeugen eingebaut sind, durchzuführen, muss der Fahrer spezielle Sprachbefehle eingeben. Jedes Gerät ist mit einer Tabelle ausgestattet, welche eine Liste von Spracherkennungsbefehlen beinhaltet, welche für jede Anwendung geeignet sind, welche durch die Hersteller zum Zeitpunkt der Produktion eingegeben werden. Die eingegebenen Sprachbefehle werden aus der Tabelle erkannt, und dann werden die entsprechenden Operationen durchgeführt.
-
Beim Erstellen der Liste von Spracherkennungsbefehlen für jede Anwendung für jedes Gerät ist es realistischerweise unmöglich, die Anzahl der Wege zu berücksichtigen, über welche ein Benutzer einen Befehl anfordert. Deshalb wurde ein Verfahren für das Erstellen einer Liste von Spracherkennungsbefehlen basierend auf dem Fachgebiet eines Herstellers oder auf Muster-Übersichtsdaten als Grundlage benutzt.
-
Jedoch sind bei den aktuellen Systemen diese darin begrenzt, dass der Benutzer sich nicht an einen speziellen Befehl erinnern kann, oder das System erkennt nicht die spezielle Weise, auf welche ein Benutzer Sprachbefehle liefert, aufgrund des Akzents des Benutzers oder der Aussprachefähigkeiten, und deshalb stuft das aktuelle System die Erkennungsrate der Sprachbefehle herab. Als ein Ergebnis kann das System nicht die gewünschten Operationen einfach ausführen, da das System die Sprache des Benutzers nicht verstehen kann.
-
Zusätzlich informieren aktuelle Systeme die Benutzer über mögliche Sprachbefehle über ein Manual bzw. ein Handbuch, oder die Wiederholung durch das System selbst. Deshalb kann, wenn er nicht die Gelegenheit hatte, die Befehle zu studieren, der Fahrer in der Lage sein, normale Ergebnisse für die gewünschten Operationen zu erhalten.
-
ZUSAMMENFASSUNG
-
Die vorliegende Erfindung wurde in dem Bemühen durchgeführt, ein Gerät und ein Verfahren bereitzustellen, um Sprachbefehle zu bearbeiten, welche in der Lage sind, die Spracherkennungsrate zu erhöhen, ohne einen Prozess des Eingebens getrennter Sprachbefehle durchzuführen, indem eine Sprachbefehltabelle aktualisiert wird, basierend auf der Wechselwirkung mit einem Benutzer.
-
Entsprechend einer beispielhaften Ausführungsform der vorliegenden Erfindung wird ein Gerät für das Bearbeiten eines Sprachbefehls bereitgestellt, welches beinhaltet: eine Speichereinheit, welche konfiguriert ist, eine Sprachbefehltabelle zu speichern; eine Sprachbefehl-Eingabeeinheit, welche konfiguriert ist, die Sprachbefehle von einem Benutzer zu empfangen; eine Sprachbefehl-Erkennungseinheit, welche konfiguriert ist, die Sprachbefehle, welche von der Sprachbefehl-Eingabeeinheit empfangen werden, basierend auf der Sprachbefehltabelle zu erkennen; und eine Sprachbefehl-Bearbeitungseinheit, welche konfiguriert ist, ähnliche Befehle bereitzustellen, welche mit den Eingabe-Sprachbefehlen für den Benutzer korreliert sind, und die ähnlichen Befehle, welche von dem Benutzer mit den eingegebenen Sprachbefehlen ausgewählt sind, zu verbinden, um die Sprachbefehltabelle zu aktualisieren, wenn die Sprachbefehl-Erkennungseinheit die Sprachbefehle als einen abnormalen Sprachbefehl erkennt.
-
Entsprechend einer anderen beispielhaften Ausführungsform der vorliegenden Erfindung wird ein Verfahren für das Bearbeiten eines Sprachbefehls bereitgestellt, welches beinhaltet: Speichern einer Sprachbefehltabelle durch eine Speichereinheit; Empfangen der Sprachbefehle von einem Benutzer durch eine Sprachbefehl-Eingabeeinheit; Erkennen der eingegebenen Sprachbefehle durch eine Sprachbefehl-Erkennungseinheit, basierend auf der Sprachbefehltabelle; und Bereitstellen, durch eine Sprachbefehl-Bearbeitungseinheit, ähnlicher Befehle, welche zu den eingegebenen Sprachbefehlen zu dem Benutzer korreliert sind, und Verbinden der ähnlichen Sprachbefehle, welche von dem Benutzer ausgewählt sind, mit den eingegebenen Sprachbefehlen, um die Sprachbefehltabelle zu aktualisieren, wenn die Sprachbefehl-Erkennungseinheit die Sprachbefehle als abnormale Sprachbefehle erkennt.
-
KURZE BESCHREIBUNG DER ZEICHNUNGEN
-
Die obigen und anderen Aufgaben und Merkmale der vorliegenden Erfindung werden aus der folgenden Beschreibung der Ausführungsformen offensichtlich, welche in Verbindung mit den beigefügten Zeichnungen gegeben werden, in welchen:
-
1 eine Konfiguration einer beispielhaften Ausführungsform eines Gerätes für das Bearbeiten von Sprachbefehlen entsprechend einer beispielhaften Ausführungsform der vorliegenden Erfindung ist; und
-
2 ein Ablaufdiagramm eines Verfahrens für das Bearbeiten von Sprachbefehlen entsprechend einer anderen beispielhaften Ausführungsform der vorliegenden Erfindung ist.
-
DETAILLIERTE BESCHREIBUNG
-
Hier nachfolgend werden beispielhafte Ausführungsformen der vorliegenden Erfindung im Detail mit Bezug auf die beigefügten Zeichnungen beschrieben.
-
Es ist davon auszugehen, dass der Term ”Fahrzeug” oder ”fahrzeugartig” oder ein anderer ähnlicher Term, wie er hier benutzt wird, Motorfahrzeuge im Allgemeinen, wie z. B. Fahrgast-Automobile, wobei Fahrzeuge für den Sportgebrauch (SUV), Omnibusse, Lastwagen, verschiedene kommerzielle Fahrzeuge, Wasserkraftfahrzeuge, welche eine Vielzahl von Booten und Schiffen beinhaltet, Luftkraftfahrzeuge und Ähnliches beinhaltet und Hybridfahrzeuge, Einsteck-hybride-elektrische Fahrzeuge, Wasserstoff-angetriebene Fahrzeuge und andere Fahrzeuge mit alternativem Kraftstoff (z. B. Kraftstoffen, welche von anderen Ressourcen als Mineralöl abgeleitet sind) einschließt. Wie hier Bezug genommen wird, ist ein Hybridfahrzeug ein Fahrzeug, welches zwei oder mehr Leistungsquellen besitzt, z. B. sowohl mit Benzin angetriebene als auch elektrisch angetriebene Fahrzeuge.
-
1 ist eine Konfiguration einer beispielhaften Ausführungsform eines Gerätes für das Bearbeiten von Sprachbefehlen entsprechend einer beispielhaften Ausführungsform der vorliegenden Erfindung.
-
Wie in 1 gezeigt wird, beinhaltet das Gerät für das Bearbeiten von Sprachbefehlen entsprechend der beispielhaften Ausführungsform der vorliegenden Erfindung eine Speichereinheit 10, eine Sprachbefehl-Eingabeeinheit 20, eine Sprachbefehl-Erkennungseinheit 30, eine Sprachbefehl-Bearbeitungseinheit 40, eine Anzeigeeinheit 50 und eine Tasten-Eingabeeinheit 60.
-
Hier nachfolgend wird jede Komponente des Gerätes für das Bearbeiten von Sprachbefehlen im Detail nachfolgend beschrieben. Die Speichereinheit
10 speichert eine Sprachbefehltabelle, in welcher die Sprachbefehle, welche eine Operation einer elektronischen Einrichtung anzeigen, wie z. B. die folgende [Tabelle 1], mit den entsprechenden Funktionen abgeglichen sind. In diesem Fall sind die Sprachbefehle Befehle, welche verschiedene Operationen der elektronischen Einrichtungen anzeigen, wobei spezielle Befehle spezielle Operationen aktivieren. Diese unten dargestellten Befehle dienen nur für als beispielhafte Zwecke, und sie sind nicht dafür gedacht, den Umfang der vorliegenden Erfindung zu begrenzen. [Tabelle 1]
Nr. | Sprachbefehl | Funktion |
1 | Rufe John Smith an | Rufe John Smith an |
2 | Zeige mir die Liste | zeige mir die Liste |
3 | Drehe die Lautstärke hoch | Drehe die Lautstärke hoch |
: | : | : |
-
Die Spracheingabeeinheit 20 empfängt die Sprachbefehle von dem Benutzer. In diesem Fall, wenn die Sprachbefehls-Eingabeeinheit 20 mit Strom versorgt wird, kann die Sprachbefehl-Eingabeeinheit 20 auch in einem Aktivierungsmodus betrieben werden, um die Sprachbefehle von dem Benutzer zu empfangen, und wenn der Benutzer ein Signal eingibt, wobei er beabsichtigt, die Sprachbefehle über die Tasteneingabeeinheit 60 einzugeben, kann die Sprachbefehl-Eingabeeinheit 20 aktiviert werden, um die Sprachbefehle von dem Benutzer zu empfangen.
-
Wenn die Sprachbefehl-Eingabeeinheit 20 an einem Fahrzeug angewendet wird, kann die Sprachbefehl-Eingabeeinheit 20 auch in einem Aktivierungsmodus betrieben werden, wenn ein Startschlüssel eines Fahrzeugs in einem Zubehör-Zustand ist, um die eingegebenen Sprachbefehle an die Sprachbefehl-Erkennungseinheit 30 zu übertragen, und die Sprachbefehl-Eingabeeinheit 20 kann auch aktiviert werden, wenn der Benutzer das Signal eingibt, wobei er beabsichtigt, die Sprachbefehle über die Tasten-Eingabeeinheit 60 einzugeben, um die Sprachbefehle von dem Benutzer zu empfangen.
-
Die Sprachbefehl-Erkennungseinheit 30 bestimmt, ob die Sprachbefehle, welche durch die Sprachbefehl-Eingabeeinheit 20 empfangen werden, in der Sprachbefehltabelle vorhanden sind, und wenn dem so ist, informiert sie eine Treiber-Steuereinheit (nicht gezeigt), um die entsprechende Funktion auszuführen.
-
Falls nicht, überträgt die Sprachbefehl-Eingabeeinheit 20 die eingegebenen Sprachbefehle und die entsprechend erkannten Ergebnisse an die Sprachbefehl-Bearbeitungseinheit 40. D. h., die Sprachbefehl-Erkennungseinheit 20 überträgt nicht irgendeine Information an die Treiber-Steuereinheit, wenn die Sprachbefehle, welche durch die Spracheingabeeinheit 20 empfangen werden, Befehle sind, welche nicht in der Sprachbefehltabelle sind, und demnach führt sie nicht irgendwelche Operationen zu dieser Zeit aus.
-
In diesem Fall empfängt die Sprachbefehl-Bearbeitungseinheit 40 die Sprachbefehle und die erkannten Ergebnisse von der Sprachbefehl-Erkennungseinheit 30 und zeigt ähnliche Befehle an, welche miteinander in der Sprachbefehltabelle über die Anzeigeeinheit 50 korrelieren. Hierbei bedeuten die ähnlichen Befehle, welche miteinander korreliert sind, beispielsweise eine Phrase, welche die gleichen oder ähnlichen Wörter beinhalten. In Antwort darauf wählt der Benutzer die beabsichtigten Befehle innerhalb der diesbezüglichen ähnlichen, durch die Anzeigeeinheit 50 angezeigten Befehle aus.
-
Dann verbindet die Sprachbefehl-Bearbeitungseinheit 40 die Sprachbefehle, welche von der Befehl-Erkennungseinheit 30 übertragen sind, mit den Befehlen, welche durch die Tasten-Eingabeeinheit 60 ausgewählt sind. D. h., die Sprachbefehl-Bearbeitungseinheit 40 gleicht die Befehle, welche durch die Tasten-Eingabeeinheit 60 ausgewählt sind, mit den Sprachbefehlen ab, welche von der Sprachbefehl-Erkennungseinheit 30 übertragen sind, und speichert die abgeglichenen Befehle in der Sprachbefehltabelle.
-
In einigen Ausführungsformen liefert die Sprachbefehl-Erkennungseinheit 30 Sprachbefehlszahlen an die Treibersteuereinheit, um so die von dem Benutzer beabsichtigte Funktion durchzuführen, sogar dann, wenn die ähnlichen Befehle von der Sprachbefehl-Eingabeeinheit 20 später eingegeben sind. D. h., sogar wenn der Benutzer die ähnlichen Befehle später eingibt, kann die Sprachbefehl-Erkennungseinheit 30 die Funktionen entsprechend zu den Sprachbefehlen empfangen, welche mit den ähnlichen Befehlen abgeglichen sind, da jene ähnlichen Befehle nicht miteinander korreliert worden sind.
-
Beispielsweise, wenn der Benutzer ”John Smith” anzurufen wünscht, wenn der Sprachbefehl eingestellt ist, dass er ”Rufe Dr. Smith an” ist, kann der Benutzer nicht ”John Smith” anrufen, da der Sprachbefehl in der Sprachbefehltabelle als ”Rufe John Smith an” beschrieben ist. D. h., die Sprachbefehl-Erkennungseinheit 30 kann nicht nach ”Rufe Dr. Smith an” in der Sprachbefehltabelle suchen, da es als ein nicht korrekter Sprachbefehl interpretiert wird. Demnach überträgt die Einheit 30 keinerlei Ergebnisse an die Treiber-Steuereinheit, sondern überträgt vielmehr die Eingabe ”Rufe Dr. Smith an” und die entsprechenden erkannten Ergebnisse an den Sprachbefehlprozessor 40.
-
In diesem Fall zeigt die Sprachbefehl-Bearbeitungseinheit
40 an, dass ”Rufe John Smith an” ein ähnlicher Befehl in der Sprachbefehltabelle ist, und wenn der Benutzer ”Rufe John Smith an” auswählt, wird die Sprachbefehltabelle wie die folgende [Tabelle 2] aktualisiert. [Tabelle 2]
Nr. | Sprachbefehl | Funktion |
1 | Rufe John Smith an | Rufe John Smith an |
Rufe Dr. Smith an |
2 | zeige mir die Liste | Zeige mir die Liste |
3 | Drehe die Lautstärke hoch | Drehe die Lautstärke hoch |
: | : | : |
-
Die Anzeigeeinheit 50 ist konfiguriert, um verschiedene Informationen anzuzeigen. Im Einzelnen ist die Anzeige konfiguriert, um eine Sprachbefehlliste anzuzeigen, welche von der Sprachbefehl-Bearbeitungseinheit 40 bereitgestellt wird. In diesem Fall, wenn die Anzeigeeinheit 50 ein Berührungsbildschirm ist, können die Sprachbefehle direkt ausgewählt werden. In einigen Ausführungsformen der vorliegenden Erfindung kann der Benutzer auch einen Befehl über den Sprachbefehl auswählen (d. h. durch Auswählen einer Nummer, welche mit einem speziellen Befehl verbunden ist).
-
Die Tasten-Eingabeeinheit 60 beinhaltet verschiedene Eingabeverfahren, wie z. B. ein Tastentyp-Eingabeverfahren, Sprach-Hör-Eingabeverfahren und Wählen-Auswahl-Eingabeverfahren.
-
Das Gerät für das Bearbeiten von Sprachbefehlen entsprechend der beispielhaften Ausführungsform der vorliegenden Erfindung kann in einem Telematik-Terminal installiert sein und kann bei einem Telematiksystem angewendet werden, welche ein Telematik-Terminal und einen Telematik-Server beinhaltet, so dass die Eingabe und das Anzeigen der Sprachbefehle und die Tasteneingabe, welche zu der Auswahl der Sprachbefehle gehört, in dem Terminal durchgeführt werden, und das Aktualisieren der Spracherkennung und der Sprachbefehltabelle kann in einem entfernten Telematik-Server durchgeführt werden.
-
Zusätzlich, wenn die über die Spracheingabeeinheit 20 empfangenen Sprachbefehle Befehle sind, welche nicht in der Sprachbefehltabelle vorhanden sind, und ähnliche Befehle, welche zu den Befehlen korrelieren, nicht in der Sprachbefehltabelle vorhanden sind, kann die Sprachbefehl-Bearbeitungseinheit 40 konfiguriert sein, die Tasteneingabe zu überwachen, welche durch die Tasten-Eingabeeinheit 60 eingegeben ist.
-
Beispielsweise, wenn der Benutzer nicht definierte Funktionen eingibt, z. B. den Sprachbefehl (Basssteuerung), um einen Bassklang auf einem Steuerschirm anzuzeigen, werden die Sprachbefehle nicht in der Sprachbefehltabelle gespeichert, und die ähnlichen Befehle werden auch nicht darin gespeichert. Hierbei, obwohl sogar die ähnlichen Befehle in der Sprachbefehltabelle gespeichert sind, wenn ein Funktionseinstellsignal über die Tasten-Eingabeeinheit 60 eingegeben wird, werden die folgenden Funktions-Definitionsoperationen durchgeführt.
-
In diesem Fall speichert die Sprachbefehl-Bearbeitungseinheit 40 den Sprachbefehl, welcher die ”Basssteuerung” genannt wird, und überwacht die Tasten-Eingabeeinheit 60, so dass der Benutzer die Anzeigefunktion des Basssteuerungsschirmes definiert, entsprechend zu der ”Basssteuerung”, welche durch den Benutzer befohlen ist. Dies kann durch ein Log-File wahrgenommen werden.
-
Danach fügt die Sprachbefehl-Bearbeitungseinheit 40 die ”Basssteuerung” zu der Sprachbefehltabelle hinzu und fügt ”zeige den Bassklang-Steuerschirm” als die entsprechende Funktion hinzu. Außerdem kann der Benutzer die definierten Sprachbefehle und die entsprechenden Funktionen über die Drucktasten (Auslöschung, Eingabe, Speicherung, oder Ähnliches) oder einen designierten Sprachbefehl ändern und löschen.
-
Durch das obige System und den Prozess kann der Benutzer die Sprachbefehle hinzufügen und die entsprechenden Funktionen hinzufügen, wodurch die automatische Erfahrung des Benutzers maximiert wird.
-
2 ist ein Ablaufdiagramm eines Verfahrens für das Bearbeiten von Sprachbefehlen entsprechend einer anderen beispielhaften Ausführungsform der vorliegenden Erfindung. Zuerst speichert die Speichereinheit 10 die Sprachbefehltabelle (201). Danach empfängt die Sprachbefehl-Eingabeeinheit 20 die Sprachbefehle von dem Benutzer (202). Als Nächstes erkennt die Sprachbefehl-Erkennungseinheit 30 die Sprachbefehle, welche über die Sprachbefehl-Eingabeeinheit 20 eingegeben sind, basierend auf der Sprachbefehltabelle (203). Dann, wenn die Sprachbefehl-Erkennungseinheit 30 die Sprachbefehle als abnormale Sprachbefehle erkennt, liefert die Sprachbefehl-Bearbeitungseinheit 20 die ähnlichen Befehle, welche mit den eingegebenen Sprachbefehlen korrelieren, an den Benutzer und verbindet die eingegebenen Sprachbefehle mit den ähnlichen Befehlen, welche von dem Benutzer ausgewählt sind, um die Sprachbefehltabelle zu aktualisieren (204).
-
Durch den obigen Prozess kann der Benutzer einfach die Sprachbefehle einstellen, ohne getrennte Sprachbefehle individuell einzugeben, so dass die Spracherkennungsrate in Verbindung mit dem Spracherkennungssystem verbessert werden kann.
-
Obwohl die obige beispielhafte Ausführungsform beschrieben wird, indem eine Vielzahl von Einheiten benutzt wird, um den obigen Prozess durchzuführen, ist davon auszugehen, dass die obigen Prozesse auch durch ein einzelnes Steuerglied oder eine Einheit durchgeführt werden können.
-
Außerdem kann die Steuerlogik der vorliegenden Erfindung als nicht-transitorische computerlesbare Medien auf einem von einem Computer lesbaren Medium eingebettet sein, welches ausführbare Programminstruktionen enthält, welche durch einen Prozessor, ein Steuerglied oder Ähnliches ausgeführt werden. Beispiele des von einem Computer lesbaren Mediums beinhalten, sind jedoch nicht darauf begrenzt, ROM, RAM, Compact Disc-(CD-)ROMs, Magnetbänder, Floppy Disks, Flash-Laufwerke, Smartcards und optische Datenspeichereinrichtungen. Das vom Computer lesbare Aufzeichnungsmedium kann auch über ans Netz gekoppelte Computersysteme verteilt sein, so dass die vom Computer lesbaren Medien gespeichert und in einer verteilten Weise ausgeführt werden, z. B. durch einen Telematik-Server.
-
Wie oben dargelegt, können die beispielhaften Ausführungsformen der vorliegenden Erfindung die Sprachbefehl-Erkennungsrate erhöhen, ohne den Prozess des Eingebens der getrennten Sprachbefehle durchzuführen, indem die Liste der ähnlichen Befehle, welche mit den Sprachbefehlen korreliert sind, geliefert werden und indem die ähnlichen Befehle, welche von dem Benutzer ausgewählt sind, mit den Sprachbefehlen verbunden werden, da die Sprachbefehle von dem Benutzer nicht auf der Datenbank vorhanden sind.
-
Während die Erfindung mit Bezug auf die bevorzugten Ausführungsformen gezeigt und beschrieben wurde, wird von Fachleuten verstanden werden, dass verschiedene Änderungen und Modifikationen durchgeführt werden können, ohne vom Umfang der Erfindung abzuweichen, wie er in den folgenden Ansprüchen definiert ist.
-
Bezugszeichenliste
-
[Fig. 1]
- 20
- Sprachbefehl-Eingabeeinheit
- 30
- Sprachbefehl-Erkennungseinheit
- 10
- Speichereinheit
- 40
- Sprachbefehl-Bearbeitungseinheit
- 60
- Tasten-Eingabeeinheit
- 50
- Anzeigeeinheit
[Fig. 2] - 201
- speichere Sprachbefehltabelle
- 202
- empfange Sprachbefehl von Benutzer
- 203
- erkenne Eingabe-Sprachbefehl basierend auf Sprachbefehltabelle
- 204
- liefere ähnlichen Befehl an Benutzer und verbinde ähnlichen Befehl, welcher vom Benutzer ausgewählt ist, mit dem Eingabe-Sprachbefehl, um die Sprachbefehltabelle zu aktualisieren, wenn ein Sprachbefehl als abnormaler Sprachbefehl erkannt wird