Beschreibung description
Verfahren und Vorrichtung zur Bedienung technischer Einrichtungen, insbesondere eines Kraftfahrzeugs Method and device for operating technical equipment, in particular a motor vehicle
Die Erfindung bezieht sich auf ein Verfahren und auf eine Vorrichtung zur Bedienung technischer Einrichtungen, insbesondere eines Kraftfahrzeugs, wobei Spracheingaben durch eine Spracheingabeeinheit und Manuelleingaben durch eine manuelle Eingabeeinheit als Bedienanweisungen einer Steuereinheit zu¬ geleitet werden, durch die ein der Bedienanweisung entsprechender Befehl erzeugt und der entsprechenden technischen Einrichtung zugeleitet wird, die dann den der Bedienanweisung zugeordneten Bedienvorgang ausführt. The invention relates to a method and to a device for operating technical devices, in particular a motor vehicle, wherein voice inputs are passed through a voice input unit and manual inputs by a manual input unit as operating instructions to a control unit to ¬ generated by the command corresponding command and the corresponding technical device is supplied, which then executes the operating instruction associated with the operation.
Bei einer Vorrichtung der eingangs genannten Art ist es bekannt Bedienanweisungen entweder rein durch Navigieren und Betätigen eines Touchscreen-Menüs oder rein durch Drücken einer Push-to-talk-Taste und anschließender Spracheingabe ein- zugeben. In a device of the type mentioned above, it is known to enter operating instructions either purely by navigating and pressing a touchscreen menu or purely by pressing a push-to-talk key and then inputting speech.
Bei zunehmender Komplexität und Vielseitigkeit der elektri¬ schen und elektronischen Systeme in Kraftfahrzeugen wird auch die Bedienung aller Funktionen unüberschaubar. With increasing complexity and diversity of electrical ¬ rule and electronic systems in motor vehicles, the operation of all functions is unmanageable.
Werden nur die Tasten des Touchscreens benutzt, wird die An¬ zahl der Tasten unüberschaubar. If only the touch screen buttons used to the ¬ number of keys is unmanageable.
Eine reine Sprachbedienung stößt schnell an ihre Grenzen, wenn es um die Steuerung komplexer Mechanismen geht, da entweder ein natürlichsprachiger Dialog ermöglicht werden muss, was hohe Resourcenanforderungen mit sich bringt, oder der Benutzer gezwungen ist, eine Liste von Kommandos auswendig zu lernen . Pure voice control quickly reaches its limits when it comes to controlling complex mechanisms, as either natural-language dialogue must be enabled, which involves high resource requirements, or the user is forced to memorize a list of commands.
Aufgabe der Erfindung ist es daher ein Verfahren und eine Vorrichtung zur Bedienung technischer Einrichtungen zu schaf-
fen, wobei auch bei größerer Komplexität der technischen Einrichtungen eine einfache Bedienung ermöglicht ist. The object of the invention is therefore to provide a method and a device for operating technical devices. fen, whereby a simple operation is possible even with greater complexity of the technical facilities.
Diese Aufgabe wird für ein Verfahren dadurch gelöst, dass durch die Spracheingabeeinheit oder die manuelle Eingabeein¬ heit eine Grundstruktur des Befehls festgelegt wird und an¬ schließend durch die manuelle Eingabeeinheit oder die Sprach¬ eingabeeinheit eine Ergänzung der Grundstruktur des Befehls erfolgt . This object is achieved for a method in that a basic structure of the command is determined by the voice input unit or the manual Eingabeein ¬ standardized and ¬ closing through the manual input unit or the voice ¬ input unit is carried out an addition to the basic structure of the command.
Durch dieses Verfahren erfolgt zunächst eine Vorauswahl durch die zuerst aktivierte Eingabeeinheit und anschließend eine Unterauswahl durch die danach aktivierte Eingabeeinheit. Damit sind nur eine begrenzte Anzahl von Bedienanweisungen für die Spracheingabeeinheit und die manuelle Eingabeeinheit erforderlich . By this method, first a pre-selection by the first activated input unit and then a sub-selection by the then activated input unit. Thus, only a limited number of operating instructions are required for the voice input unit and the manual input unit.
Der Bedienvorgang kann eine Ansteuerung zum Betrieb eines Ge- räts sein. Weiterhin kann ein Bedienvorgang eine Ansteuerung eines oder mehrerer Komponenten eines Infotainmentsystems sein, das z. B. ein Telefonbuch oder Navigationsinformationen enthalten kann. Es versteht sich, dass auch noch weitere Eingabestufen vorhanden sein können. The operating procedure can be a control for the operation of a device. Furthermore, an operating process may be a control of one or more components of an infotainment system, the z. B. may contain a phone book or navigation information. It is understood that even more input levels can be present.
Wird die Spracheingabe kontinuierlich in einem Ringpuffer der Spracheingabeeinheit gespeichert, wobei der Ringpuffer einen Zeitabschnitt der Spracheingabe vor dem StartZeitpunkt derWhen the voice input is continuously stored in a ring buffer of the voice input unit, the ring buffer performs a period of voice input before the start time of the voice input
Spracherkennung für die Spracherkennung zur Verfügung stellt, so stehen immer die letzten Sekunden oder Minuten der aufgenommenen Spracheingabe für die Spracherkennung zur Verfügung. Eine Spracherkennung durch die Spracheingabeeinheit kann durch manuelle Betätigung eines Schaltelements und/oder durch ein Gestikerkennungselement aktiviert werden.
Dabei kann das Schaltelement ein separates Schaltelement oder aber auch ein Element der manuellen Eingabeeinheit sein. Speech recognition for speech recognition is available, so are always the last seconds or minutes of recorded voice input for speech recognition available. Speech recognition by the speech input unit may be activated by manual operation of a switching element and / or by a gesture recognition element. In this case, the switching element may be a separate switching element or else an element of the manual input unit.
Damit wird eine kontinuierlich im Hintergrund mitlaufende Spracherkennung vermieden, die sehr resourcenaufwendig wäre und leicht zu Fehlerkennungen führen würde. This avoids a continuous speech recognition in the background, which would be very resource-intensive and would easily lead to false identifications.
Die Bedienanweisungen der Spracheingabeeinheit bestehen vorzugsweise aus in der Steuereinheit gespeicherten Codeworten, die als Thesaurus gespeichert sind. The operating instructions of the speech input unit preferably consist of code words stored in the control unit, which are stored as a thesaurus.
Das Verfahren und die Vorrichtung sind vorzugsweise bei tech¬ nischen Einrichtungen eines Kraftfahrzeugs anwendbar. Die Erfindung ist aber nicht auf eine solche Anwendung beschränkt sondern kann auch auf anderen Anwendungsgebieten wie z. B. bei Fahrkartenautomaten angewendet werden. The method and the apparatus are preferably applicable to tech ¬ African devices of a motor vehicle. The invention is not limited to such an application but can also be applied to other applications such. B. be used in ticket machines.
Die Aufgabe wird bei einer Vorrichtung gelöst durch eine Spracheingabeeinheit und einer manuellen Eingabeeinheit zur Auslösung von Bedienanweisungen, die einer Steuereinheit zuleitbar sind und durch die ein der Bedienanweisung entsprechender Befehl erzeugbar und der entsprechenden technischen Einrichtung zuleitbar ist, durch die dann der der Bedienanweisung zugeordnete Bedienvorgang ausführbar ist, wobei durch die Spracheingabeeinheit oder die manuelle Eingabeeinheit ei¬ ne Grundstruktur des Befehls und anschließend durch die ma¬ nuelle Eingabeeinheit oder die Spracheingabeeinheit eine Er¬ gänzung der Grundstruktur des Befehls erfolgt. Dabei kann die manuelle Eingabeeinheit ein Tastenfeld aufwei¬ sen, wobei die Eingabeeinheit vorzugsweise ein berührungsemp¬ findliches Tastenfeld insbesondere ein Touchscreen aufweist. The object is achieved in a device by a voice input unit and a manual input unit for triggering operating instructions that can be fed to a control unit and by a command corresponding to the operating instruction generated and the corresponding technical device zuleitbar, then the operation of the operating instruction associated executable is, wherein by the voice input unit or the manual input unit ei ¬ ne basic structure of the command and then by the ma ¬ nual input unit or the voice input unit is a He ¬ completion of the basic structure of the command. Here, the manual input unit, a keypad aufwei ¬ sen, wherein the input unit preferably having a particular berührungsemp ¬ find pending keypad, a touch screen.
Weist weiterhin die Vorrichtung eine Anzeige mit einem Anzei- gefeld zum Anzeigen von Bilddarstellungen und/oder von durch die manuelle Eingabeeinheit oder die Spracheingabeeinheit festlegbaren Grundstrukturen der Befehle und/oder Ergänzungen
der Grundstrukturen der Befehle und/oder von Menüs und/oder von Untermenüs auf, so kann durch die Kombination mit der manuellen Eingabe die Speichereingabe in den Kontext eines auf dem Anzeigefeld dargestellten Objekts dargestellt werden, oh- ne das Vokabular des Spracherkenners vergrößern zu müssen. Wird in der Spracheingabe auf ein gewisses Objekt Bezug ge¬ nommen, kann es z. B. durch „hier", „da" oder „dieses" refe- renziert werden, anstatt es benennen zu müssen. Durch Einteilung des Tastenfeldes in verschiedene Domänen wie „Schalter", „Signallampen" und „Straßenkarte" für den Spracherkenner wird eine wesentliche Erhöhung der Erkennungsrate erreicht. Furthermore, the device has a display with a display field for displaying image representations and / or basic structures of the commands and / or additions that can be defined by the manual input unit or the speech input unit the basic structures of the commands and / or menus and / or submenus, the combination of the manual input, the memory input can be displayed in the context of an object displayed on the display field, without having to increase the vocabulary of the speech recognizer. Is to a certain object reference ge ¬ taken in the voice input, it can,. For example, it may be essential to refer to the speech recognizer by dividing the keypad into different domains such as "switches,""signallamps," and "road map" for the speech recognizer Increased detection rate.
Umgekehrt führt die Erweiterung eines Tastendrucks mit einer Spracheingabe zu einer Art gesprochenem Kontextmenü. Sind bei einem Verfahren nach dem Stand der Technik mehrere Aktionen als Reaktion auf das Drücken eines Tasters möglich, wird eine Liste (Kontextmenü) auf dem Anzeigefeld eingeblendet, aus der der Benutzer die gewünschte Option herausholen und anwählen muss. Bei dem erfindungsgemäßen Verfahren erfolgt diese Aus- wähl automatisch durch Auswertung der Spracheingabe. Conversely, the extension of a keystroke with a voice input leads to a kind of spoken context menu. In a prior art method, if several actions are possible in response to a button being pressed, a list (context menu) is displayed on the display panel from which the user must retrieve and select the desired option. In the method according to the invention, this selection takes place automatically by evaluating the speech input.
Vorzugsweise ist die Anzeige eine elektrooptische Anzeige wie z. B. ein LCD. Zur Kombination der manuellen Eingabeeinheit mit Darstellungen auf dem Anzeigefeld der Anzeige kann das Anzeigefeld der transparenten manuellen Eingabeeinheit hinterlegt sein. Preferably, the display is an electro-optical display such. As an LCD. To combine the manual input unit with representations on the display panel of the display, the display field of the transparent manual input unit can be stored.
Dadurch können sich sehr intuitive Bedienschritte ergeben wie z. B. das Tippen auf einem bestimmten Punkt einer angezeigten Land- oder Straßenkarte in Verbindung mit der Spracheingabe „führ mich dort hin" oder „wie weit ist es dort hin". This can result in very intuitive operating steps such. For example, tapping on a specific point on a displayed map or road map in conjunction with the voice input "take me there" or "how far is it there".
Durch die in der Spracheingabe enthaltene sematische Informa- tion kann sogar eine Folge von manuellen Eingaben zueinander in Bezug gesetzt werden wie z. B. durch das Drücken von zwei
verschiedenen Punkten auf der Landkarte in Verbindung mit der Frage „Wie weit ist es von da nach da?" The semantic information contained in the speech input can even be used to relate a sequence of manual inputs to one another, such as, for example, B. by pressing two various points on the map in connection with the question "how far is it from there to there?"
Ausführungsbeispiele der Erfindung sind in der Zeichnung dargestellt und werden im Folgenden näher beschrieben. Es zeigen : Embodiments of the invention are illustrated in the drawings and will be described in more detail below. Show it :
Figur 1 ein Blockschaltbild einer Vorrichtung zur Bedienung technischer Einrichtungen eines Kraftfahrzeugs, FIG. 1 shows a block diagram of a device for operating technical devices of a motor vehicle,
Figur 2 ein Ablaufdiagramm eines Verfahrens zur Ermittlung und Ansteuerung einer Funktion und 2 shows a flow chart of a method for determining and controlling a function and
Figur 3 ein Ablaufdiagramm eines Verfahrens zur Ermittlung und Ansteuerung eines Objekts. 3 shows a flow diagram of a method for determining and controlling an object.
Die in Figur 1 dargestellte Vorrichtung weist ein Mikrofon 1 für eine Spracheingabe in einen Ringpuffer 2 einer Spracheingabeeinheit 3 auf. The device shown in FIG. 1 has a microphone 1 for voice input into a ring buffer 2 of a voice input unit 3.
Die Spracheingabeeinheit 3 weist weiterhin einen Spracherken¬ ner 4 auf, durch den die Spracheingabe mit Codeworten eines gespeicherten Thesaurus an Codeworten verglichen und bei Erkennen einer Spracheingabe und Zuordnung zu einem oder mehreren gespeicherten Codewörtern ein entsprechendes Sprachsignal 11 erzeugt und einer Zusammenführeinheit 5 zugeleitet wird. The speech input unit 3 further comprises a Spracherken ¬ ner 4, by comparing the speech input with codewords of a stored thesaurus to codewords and upon detection of a voice input and assignment to one or more stored codewords generates a corresponding voice signal 11 and a merge unit 5 is fed.
Weiterhin ist ein LCD-Bildschirm 6 mit einem davor angeordneten transparenten Touchscreen 7 vorhanden, wobei der Furthermore, an LCD screen 6 is provided with a front arranged transparent touch screen 7, wherein the
Touchscreen 7 in eine Mehrzahl Tastpositionen eingeteilt ist. Touchscreen 7 is divided into a plurality of touch positions.
Das durch manuelles Beaufschlagen einer Tastposition erzeugte Tastsignal 12 wird in einer Touchscreeneinheit 8 registriert und ein entsprechendes Touchsignal 13 über eine die Anzeige auf dem LCD-Bildschirm 6 steuernde graphische Benutzeroberfläche 9 ebenfalls der Zusammenführeinheit 5 zugeleitet.
Das Touchsignal 13 und das Sprachsignal 11 werden von der Zu¬ sammenführeinheit 5 einer Steuereinheit 10 zugeführt, von der ein entsprechender Befehl 14 erzeugt und zur Ausführung einer nicht dargestellten technischen Einrichtung zugeleitet wird. The tactile signal 12 generated by the manual application of a touch position is registered in a touchscreen unit 8 and a corresponding touch signal 13 is likewise fed to the assembly unit 5 via a graphical user interface 9 controlling the display on the LCD screen 6. The touch signal 13 and the speech signal 11 are supplied from the to ¬ sammenführeinheit 5 a control unit 10, from which a corresponding command 14 is generated and fed to the execution of a technical device, not shown.
Die Spracheingabeeinheit 3 muss, wenn sie noch nicht akti¬ viert war, zuvor aktiviert werden. Dazu wird eine entspre¬ chende Start-Tastposition des Touchscreens 7 beaufschlagt, wodurch über die graphische Benutzeroberfläche ein Startsig- nal 15 der Steuereinheit 10 zugeleitet wir, die dann ein Ak¬ tivierungssignal 16 dem Spracherkenner 4 zuleitet und damit die Spracheingabeeinheit 3 aktiviert. The voice input unit 3 must, if it was not acti ¬ fourth, first be activated. For this purpose a entspre ¬ sponding start probe position of the touch screen 7 is applied, thereby using the graphical user interface a Startsig- nal 15 of the control unit 10 we fed, then 16 feeds a Ak ¬ tivierungssignal the speech recognizer 4, and thus the voice input unit 3 is activated.
Bei dem in Figur 2 dargestellten Ablaufdiagramm wird zunächst auf einem Touchscreen die gewünschte Funktion durch Betätigen der entsprechenden Touchscreenkoordinate ermittelt. In the flowchart shown in FIG. 2, the desired function is first determined on a touchscreen by actuating the corresponding touchscreen coordinate.
Wird weiterhin festgestellt, dass eine Spracheingabeeinheit aktiviert ist, wird ein Erkenner-Vokabular aus einem Code- wortthesaurus für die ausgewählte Funktion gesetzt. Further, when it is determined that a voice input unit is activated, a recognizer vocabulary is set from a code word thesaurus for the selected function.
Ein nun von einer Spracheingabeeinheit erfasster Name wird darauf geprüft, ob er gültig oder nicht gültig ist. Ist er nicht gültig, muss eine neue Spracheingabe erfolgen. A name now acquired by a speech input unit is checked to see if it is valid or not valid. If it is not valid, a new voice input must be made.
Ist er gültig, werden der Name (Codewort) mit der am If it is valid, the name (codeword) with the am
Touchscreen ausgewählten Funktion verknüpft und ein entsprechender Ausführungsbefehl ausgegeben. Touchscreen selected function linked and issued a corresponding execution command.
Ist die Spracheingabe nicht aktiviert, kann der Name (Code¬ wort) auch über eine graphische Benutzeroberfläche des If the voice input is not activated, the name (code ¬ word) can also be accessed via a graphical user interface of the
Touchscreens eingegeben werden und so den Ausführungsbefehl auslösen .
Bei dem in Figur 3 dargestellten Ablaufdiagramm wird zunächst auf einem Touchscreen das gewünschte Objekt durch Betätigen der entsprechenden Touchscreen-Koordinate ermittelt. Wird weiterhin festgestellt, dass eine Spracheingabeeinheit aktiviert ist, wird ein Erkenner-Vokabular für mögliche Kommandos aus einem Kommandothesarus für das ausgewählte Objekt gesetzt . Ein nun von einer Spracheingabeeinheit erfasstes gesprochenes Kommando wird darauf geprüft, ob es gültig oder ungültig ist. Touchscreens are entered and thus trigger the execution command. In the flowchart shown in FIG. 3, the desired object is first determined on a touchscreen by actuating the corresponding touchscreen coordinate. Further, if it is determined that a voice input unit is activated, a recognizer vocabulary for possible commands is set from a command to the selected object. A spoken command now detected by a speech input unit is checked for validity or invalidation.
Ist es nicht gültig, muss eine neue Spracheingabe erfolgen. Ist es gültig, werden das Kommando mit dem am Touchscreen ausgewählten Objekt verknüpft und ein entsprechender Ausführungsbefehl ausgegeben. If it is not valid, a new voice input must be made. If it is valid, the command is linked with the object selected on the touch screen and a corresponding execution command is issued.
Im Folgenden werden mehrere Ablaufbeispiele aufgeführt. In the following, several examples are listed.
Sprachbefehl nach Anwahl eines Displayobjekts Voice command after selecting a display object
Auswahl eines Objekts per Sprache Selection of an object by language
Benutzer hat die Kartendarstellung seines Infotainment- Systems offen und die Sonderziele-Symbole sind auf der Karte zu sehen User has the map display of his infotainment system open and the POI icons are visible on the map
Benutzer drückt auf den Touchscreen an der Position eines Hotelsymbols und spricht „Info" - System erkennt die Anwahl des Sonderziels
System erkennt anhand der Sprachaktivität, dass der User presses on the touchscreen at the position of a hotel symbol and says "Info" - system recognizes the selection of the POI System recognizes that the voice activity is the
Benutzer einen besonderen Wunsch hat. Bei fehlender User has a special request. If missing
Sprachaktivität passiert nichts - System lädt das Kommandovokabular für die entsprechende Voice activity does not happen - system loads the command vocabulary for the corresponding one
Bearbeitung und für die Spracherkennung mit den Audiodaten durch Editing and for speech recognition with the audio data
System erkennt das Kommando „Info" System recognizes the command "Info"
System zeigt ein pop-up Fenster mit der Information über dieses Hotel, z. B. Namen, Adresse und Telefon-Nr. System displays a pop-up window with information about this hotel, eg. Name, address and telephone number.
Auswahl einer Funktion per Sprache Selection of a function by language
Das Pop-up-Fenster hat z. B. zwei Tasten „Anrufen" und „Navigieren The pop-up window has z. For example, two buttons called "Call" and "Navigate
Benutzer drückt auf das Fenster an einer Position außer- halb der beiden Tasten und spricht „Anrufen" User presses the window at a position outside the two buttons and says "Call"
System lädt das Kommandovokabular für die entsprechende Bearbeitung und für die Spracherkennung mit den Audiodaten durch System loads the command vocabulary for appropriate editing and speech recognition with the audio data
System wählt die Telefon-Nr. des Hotels. System dials the telephone number. the hotel.
Sprachbefehl erfolgt vor einem Drücken auf eine Taste des Touchscreen Voice command occurs before pressing a button on the touch screen
Auswahl einer Funktion per Sprache
Benutzer hat Telefonbuch seines Infotainment-Systems offen und möchte einen Eintrag löschen Selection of a function by language User has phonebook of his infotainment system open and wants to delete an entry
Benutzer spricht „Lösche Eintrag" User speaks "delete entry"
Benutzer drückt auf den Touchscreen an der Listenposition des zu löschenden Eintrags User presses on the touch screen at the list position of the entry to be deleted
System erkennt die Auswahl des Listeneintrags System recognizes the selection of the list entry
System erkennt anhand der Sprachaktivität, dass der Benut¬ zer einen besonderen Wunsch hat. Bei fehlender Sprachaktivität würde z. B. die Standardfunktion „Wählen" ausgeführt werden System recognizes from the speech activity that Benut ¬ zer has a special request. In the absence of voice activity z. For example, you can run the default Select function
System lädt das Kommandovokabular für die Bearbeitung eines Listeneintrags und führt die Spracherkennung mit den gespeicherten Audiodaten durch System loads the command vocabulary for editing a list entry and performs speech recognition on the stored audio data
System erkennt das Kommando „Lösche Eintrag" System recognizes the command "delete entry"
System löscht den selektierten Listeneintrag. System deletes the selected list entry.
Auswahl eines Objekts per Sprache Selection of an object by language
Benutzer hat Media-Player seines Infotainment-Systems of¬ fen und möchte eine bestimmte CD oder Playlist zum Abspie len auswählen User has media player of his infotainment system of ¬ fen and would like to select a specific CD or playlist for Absprie len
Benutzer spricht „Beatles, Weißes Album" User speaks "Beatles, White Album"
Benutzer drückt auf den Touchscreen für die Funktionsaus¬ wahl „Play" User presses on the touch screen for Funktionsaus ¬ either "Play"
System erkennt die gewünschte Funktion „Play"
System erkennt anhand der Sprachaktivität, dass „Play" mit einer Nebenbedingung verknüpft werden soll System recognizes the desired function "Play" System recognizes by voice activity that "Play" should be associated with a constraint
System lädt das Vokabular für alle abspielbaren Medien und führt die Spracherkennung mit den gespeicherten Audiodaten durch System loads the vocabulary for all playable media and performs speech recognition with the stored audio data
System erkennt die Titelauswahl „Beatles, White Album" System detects track selection "Beatles, White Album"
System spielt die ausgewählte CD.
System plays the selected CD.