DE102011013755B4 - Method and device for alphanumeric voice input in motor vehicles - Google Patents
Method and device for alphanumeric voice input in motor vehicles Download PDFInfo
- Publication number
- DE102011013755B4 DE102011013755B4 DE102011013755.6A DE102011013755A DE102011013755B4 DE 102011013755 B4 DE102011013755 B4 DE 102011013755B4 DE 102011013755 A DE102011013755 A DE 102011013755A DE 102011013755 B4 DE102011013755 B4 DE 102011013755B4
- Authority
- DE
- Germany
- Prior art keywords
- input
- correction
- data block
- data sequence
- verification
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 23
- 238000012937 correction Methods 0.000 claims abstract description 37
- 238000012795 verification Methods 0.000 claims abstract description 24
- 230000001755 vocal effect Effects 0.000 claims abstract description 17
- 238000003780 insertion Methods 0.000 claims description 3
- 230000037431 insertion Effects 0.000 claims description 3
- 230000004044 response Effects 0.000 description 3
- 238000012790 confirmation Methods 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- BDAGIHXWWSANSR-UHFFFAOYSA-M Formate Chemical compound [O-]C=O BDAGIHXWWSANSR-UHFFFAOYSA-M 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 230000001427 coherent effect Effects 0.000 description 1
- 238000013479 data entry Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/048—Interaction techniques based on graphical user interfaces [GUI]
- G06F3/0487—Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser
- G06F3/0488—Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser using a touch-screen or digitiser, e.g. input of commands through traced gestures
- G06F3/04886—Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser using a touch-screen or digitiser, e.g. input of commands through traced gestures by partitioning the display area of the touch-screen or the surface of the digitising tablet into independently controllable areas, e.g. virtual keyboards or menus
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01C—MEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
- G01C21/00—Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
- G01C21/26—Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00 specially adapted for navigation in a road network
- G01C21/34—Route searching; Route guidance
- G01C21/36—Input/output arrangements for on-board computers
- G01C21/3605—Destination input or retrieval
- G01C21/3608—Destination input or retrieval using speech input, e.g. using speech recognition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/221—Announcement of recognition results
Landscapes
- Engineering & Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
Verfahren zur sprachlichen Eingabe einer Datensequenz in Form von Datenblöcken in eine Eingabe- und Erkennungseinrichtung eines Kraftfahrzeugs, wobei erkannte Datenblöcke zu einer aktuellen Datensequenz zusammengefasst werden und die aktuelle Datensequenz in einer Anzeige der Eingabe- und Erkennungseinrichtung dargestellt wird, dadurch gekennzeichnet, dass
der zuletzt eingegebene und erkannte Datenblock zur Verifikation und gegebenenfalls Korrektur in einer ersten Formatierung und nach der Verifikation in einer zweiten Formatierung dargestellt wird,
eine sprachliche Korrektur der aktuellen Datensequenz ein Löschen des zuletzt erkannten Datenblocks bewirkt, wobei nach dem Löschen des zuletzt erkannten Datenblocks der vorherige Datenblock zur erneuten Verifikation wieder in die erste Formatierung überführt wird,
eine haptische Korrektur des Erkennergebnisses das Löschen des letzten Zeichens der aktuellen Datensequenz bewirkt und die aktuelle Datensequenz in die zweite Formatierung überführt, wobei die haptische Korrektur eine größere Priorität als die sprachliche Korrektur aufweist.
Method for the verbal input of a data sequence in the form of data blocks into an input and recognition device of a motor vehicle, wherein recognized data blocks are combined into a current data sequence and the current data sequence is shown in a display of the input and recognition device, characterized in that
the data block last entered and recognized is displayed in a first format for verification and, if necessary, correction and, after verification, in a second format,
a linguistic correction of the current data sequence causes the last recognized data block to be deleted, with the previous data block being converted back to the first formatting for renewed verification after the last recognized data block has been deleted
a haptic correction of the recognition result causes the last character of the current data sequence to be deleted and transfers the current data sequence to the second formatting, the haptic correction having a higher priority than the linguistic correction.
Description
Die Erfindung betrifft ein Verfahren und einer Vorrichtung zur alphanumerischen Spracheingabe in Kraftfahrzeugen.The invention relates to a method and a device for alphanumeric voice input in motor vehicles.
Durch die zunehmende Anzahl von Komfortkomponenten in Kraftfahrzeugen, die über Multifunktionsbedieneinrichtungen bedien- und einstellbar sind, wird es für den Fahrzeugführer immer schwieriger, alle Bedienmöglichkeiten und deren Einstellmodalitäten parat zu haben. Ferner kann der Zugriff auf benötigte Befehle oder die Eingabe notwendiger Informationen, beispielsweise bei Infotainmentsystemen mit Navigations- und/oder Telefoneinrichtungen, relativ umständlich und damit zeitraubend sein. Insbesondere bei der Eingabe von Informationen wie Telefonnummern während der Fahrt kann dies zu einer Ablenkung des Fahrers führen.Due to the increasing number of comfort components in motor vehicles that can be operated and adjusted via multifunction control devices, it is becoming more and more difficult for the vehicle driver to have all operating options and their setting modalities at hand. Furthermore, access to the required commands or the input of necessary information, for example in the case of infotainment systems with navigation and / or telephone facilities, can be relatively cumbersome and thus time-consuming. In particular, when entering information such as telephone numbers while driving, this can lead to a distraction for the driver.
Zur Minimierung dieser Probleme werden zunehmend Spracheingabeeinrichtungen entwickelt und verwendet, so dass zur Befehls- und Dateneingabe der Fahrer die Hände nicht vom Lenkrad nehmen muss. Diese Art der Befehls- und Dateneingabe führt in der Praxis häufig zu anderen Problemen. So existiert bei vielen herkömmlichen Komponenten mit Sprachsteuerung ein fester Befehlssatz, den der Benutzer im Prinzip auswendig lernen muss. Daher entsteht dann häufig während der Fahrt das Problem, dass der Fahrer den nötigen Befehl vergessen hat und auch nicht in der Lage ist im Handbuch nachzusehen.To minimize these problems, voice input devices are increasingly being developed and used so that the driver does not have to take his hands off the steering wheel to enter commands and data. This type of command and data entry often leads to other problems in practice. With many conventional components with voice control, for example, there is a fixed set of commands that the user basically has to learn by heart. Therefore, the problem often arises while driving that the driver has forgotten the necessary command and is not able to look it up in the manual.
Aus der
Aus der
Die Druckschrift
Die Druckschrift
Die Druckschrift
- - Erkennen von Schlüsselworten, die durch einen Benutzer deutlich gesprochen werden, und in einer oder mehreren Sprachäußerungskette(n) mit einer variablen Anzahl von Schlüsselworten enthalten sind, wobei die Anzahl von deutlich gesprochenen Schlüsselworten bei Sprachäußerungsketten durch den Benutzer während des Aussprechens dieser Schlüsselworte bestimmt wird und jede Sprachäußerungskette gefolgt ist von einem Pausenzeitraum;
- - Schaffen eines Pausensignals, nachdem eine Sprachäußerungskette für die Dauer eines vorbestimmten Pausenzeitraums aufgehört hat;
- - Schaffen einer Anzeige von bestimmten erkannten Schlüsselworten für den Benutzer in Reaktion auf das Pausensignal, welche Anzeige der vor dem Pausensignal aufgetretenen Sprachäußerungskette entspricht; und
- - Korrigieren bestimmter Schlüsselworte in Reaktion auf das Pausensignal und in Reaktion auf das Erkennen eines vorbestimmten Fehlerbefehl-Schlüsselwortes, das in einer nach dem Pausensignal auftretenden Sprachäußerungskette enthalten ist.
- Recognition of key words which are clearly spoken by a user and which are contained in one or more speech utterance chain (s) with a variable number of key words, the number of clearly spoken key words in speech utterance chains being determined by the user during the utterance of these key words and each utterance chain is followed by a pause period;
- - providing a pause signal after a chain of utterances has ceased for the duration of a predetermined pause period;
- Providing the user with an indication of certain recognized key words in response to the pause signal, which indication corresponds to the speech utterance chain that occurred before the pause signal; and
- Correcting certain key words in response to the pause signal and in response to the recognition of a predetermined error command key word which is contained in a speech utterance chain occurring after the pause signal.
Die Druckschrift
Die Druckschrift
Der Erfindung liegt daher die Aufgabe zugrunde, ein Eingabeverfahren zur haptischen und sprachlichen Eingabe von Datensequenzen mit verbesserter Verifikation der eingegebenen Datensequenzen zu schaffen.The invention is therefore based on the object of creating an input method for the haptic and verbal input of data sequences with improved verification of the input data sequences.
Die Aufgabe wird durch ein Verfahren zur Eingabe von Datensequenzen in eine Eingabe- und Erkennungseinrichtung eines Kraftfahrzeugs mit den Merkmalen des Anspruchs 1 sowie durch eine entsprechende Vorrichtung mit den Merkmalen des Anspruchs 6 gelöst. Bevorzugte Ausgestaltungen der Erfindung sind Gegenstand der Unteransprüche.The object is achieved by a method for inputting data sequences into an input and recognition device of a motor vehicle with the features of
Bei dem erfindungsgemäßen Verfahren zur sprachlichen Eingabe einer Datensequenz als Folge von Datenblöcken in eine Eingabe- und Erkennungseinrichtung eines Kraftfahrzeugs, wobei erkannte Datenblöcke als aktuelle Datensequenz in einer Anzeige der Eingabe- und Erkennungseinrichtung dargestellt werden, wird der zuletzt eingegebene und erkannte Datenblock zur Verifikation und gegebenenfalls Korrektur in einer ersten Formatierung und nach der Verifikation in einer zweiten Formatierung dargestellt, wobei
- - eine sprachliche Korrektur der aktuellen Datensequenz ein Löschen des zuletzt erkannten Datenblocks bewirkt, wobei nach dem Löschen des zuletzt erkannten Datenblocks der vorherige Datenblock zur erneuten Verifikation wieder in die erste Formatierung überführt wird,
- - eine haptische Korrektur des Erkennergebnisses das Löschen des letzten Zeichens der aktuellen Datensequenz bewirkt und die aktuelle Datensequenz in die zweite Formatierung überführt, wobei die haptische Korrekturvorrichtung (4) eine größere Priorität als die sprachliche Korrekturvorrichtung aufweist.
- - a linguistic correction of the current data sequence causes the last recognized data block to be deleted, with the previous data block being converted back to the first formatting for renewed verification after the last recognized data block has been deleted,
- - a haptic correction of the recognition result causes the deletion of the last character of the current data sequence and converts the current data sequence into the second formatting, the haptic correction device (4) having a higher priority than the linguistic correction device.
Durch die Darstellung des zuletzt sprachlich eingegebenen Datenblocks in unterschiedlichen Formaten je nach Verifikationszustand wird dem Nutzer deutlich wahrnehmbarer und schneller erfassbar dargestellt, was erkannt wurde und von ihm bestätigt werden soll. Dies führt zu einer Erleichterung und damit Erhöhung der Sicherheit.By displaying the last verbally entered data block in different formats depending on the verification status, the user is shown clearly more perceptibly and more quickly what has been recognized and what is to be confirmed by him. This leads to a relief and thus an increase in security.
Eine sprachliche Korrektur der aktuellen Datensequenz bewirkt ein Löschen des zuletzt erkannten Datenblocks, d.h. des aktuellen Datenblocks. Hat also der Nutzer erkannt, dass die Erkennung des in der ersten Formatierung dargestellten aktuellen Datenblocks fehlerhaft war, so bewirkt eine sprachliche Korrektur, beispielsweise durch Eingabe eines Korrekturkommandos, ein Löschen des aktuellen Datenblocks.A linguistic correction of the current data sequence causes the last recognized data block, i.e. the current data block, to be deleted. If the user has recognized that the recognition of the current data block shown in the first formatting was incorrect, a linguistic correction, for example by entering a correction command, causes the current data block to be deleted.
Ferner wird nach dem Löschen des zuletzt erkannten aktuellen Datenblocks der vorherige Datenblock zur erneuten Verifikation wieder in die erste Formatierung überführt wird. Auf diese Weise ist auch noch eine sprachliche Korrektur der zurückliegenden Datenblöcke möglich.Furthermore, after the last recognized current data block has been deleted, the previous data block is transferred back to the first formatting for renewed verification. In this way, a linguistic correction of the previous data blocks is also possible.
Eine haptische Korrektur der aktuellen Datensequenz einschließlich des aktuellen, in der ersten Formatierung dargestellten Datenblocks bewirkt das Löschen des letzten Zeichens und die gesamte Datensequenz wird in die zweite Formatierung überführt. Die Korrektur des letzten Zeichens wird also als Übergang von der sprachlichen Eingabe zur haptischen Bedienung verstanden, wobei eine weitere haptische Korrektur des neuen letzten Zeichens in üblicher Weise möglich ist. Es ist aber auch eine Fortsetzung der sprachlichen Eingabe durch das Sprechen eines weiteren Datenblocks möglich.A haptic correction of the current data sequence including the current data block represented in the first formatting causes the last character to be deleted and the entire data sequence is transferred to the second formatting. The correction of the last character is thus understood as a transition from the verbal input to haptic operation, with a further haptic correction of the new last character being possible in the usual way. However, it is also possible to continue the verbal input by speaking another data block.
Die haptische Korrektur hat eine größere Priorität als die sprachliche Korrektur. Mit anderen Worten, eine haptische Korrektur hat Vorrang vor einer sprachlichen Korrektur und die Vorrichtung geht in den haptischen Bedienungsmodus über.The haptic correction has a higher priority than the linguistic correction. In other words, a haptic correction has priority over a linguistic correction and the device changes to the haptic operating mode.
Vorzugsweise weist ein Datenblock mindestens ein alphanumerisches Zeichen auf, wobei unter alphanumerischen Zeichen Buchstaben und Ziffern verstanden werden. Mit anderen Worten, ein Datenblock umfasst ein oder mehrere Zeichen, wobei die Anzahl der Zeichen pro Datenblock unterschiedlich sein kann. Insbesondere kann daher ein Datenblock einer Datensequenz aus einer Folge von Ziffern bestehen, wie dies beispielsweise bei einer sprachlichen Eingabe einer Telefonnummer der Fall ist. Die Folge von Datenblöcken von unterschiedlicher Länge ergibt dann in der Gesamtzusammenfassung die Datensequenz, wobei unter aktueller Datensequenz die Zusammenfassung der eingegebenen Datenblöcke einschließlich des aktuellen Datenblocks verstanden wird.A data block preferably has at least one alphanumeric character, alphanumeric characters being understood to mean letters and digits. In other words, a data block comprises one or more characters, it being possible for the number of characters per data block to be different. In particular, a data block can therefore be a data sequence from a sequence of digits exist, as is the case, for example, when entering a telephone number by voice. The sequence of data blocks of different lengths then results in the overall summary of the data sequence, the current data sequence being understood to mean the summary of the input data blocks including the current data block.
Vorzugsweise erfolgt eine sprachliche Verifikation des aktuellen Datenblocks durch die Eingabe eines weiteren Datenblocks oder durch eine sprachliche Eingabe eines Verifikationskommandos. Hat also der Nutzer erkannt, dass der zuletzt eingegebene Datenblock richtig erkannt wurde, so bewirkt die Eingabe eines nächsten Datenblocks automatisch die Verifikation des noch aktuellen Datenblocks. Es ist auch möglich die Verifikation durch ein eigenes Sprachkommando zu bewerkstelligen.A verbal verification of the current data block is preferably carried out by entering a further data block or by verbally entering a verification command. If the user has recognized that the data block entered last was correctly recognized, the input of the next data block automatically results in the verification of the still current data block. It is also possible to carry out the verification with a separate voice command.
Vorzugsweise erfolgt die zweite Formatierung durch eine Fettdarstellung, Kursivdarstellung, Unterstreichung, Wahl einer anderen Schriftart bezüglich der zuletzt erkannten Datensequenz und/oder Einfügung von Sonderzeichen vor der zuletzt erkannten Datensequenz. Durch diese auffällige erste Formatierung ist eine einfache Identifikation und Verifikation des aktuellen Datenblocks möglich.The second formatting is preferably carried out by means of bold display, italic display, underlining, selection of a different font with regard to the last recognized data sequence and / or the insertion of special characters before the last recognized data sequence. This conspicuous first formatting enables simple identification and verification of the current data block.
Die erfindungsgemäße Vorrichtung zur Durchführung des oben beschriebenen Verfahrens zur sprachlichen Eingabe einer Datensequenz in Form von Datenblöcken in eine Eingabe- und Erkennungseinrichtung eines Kraftfahrzeugs umfasst:
- - eine Einrichtung zur sprachlichen Eingabe und Erkennung von Datenblöcken,
- - eine Einrichtung zur Verifikation und Korrektur der sprachlich eingegebenen Datenblöcke,
- - eine Anzeigeeinrichtung zur Anzeige der aktuellen Datensequenz, und
- - eine Formatierungseinrichtung zur Formatierung der sprachlich eingegebenen und erkannten Datenblöcke in mindestens zwei unterschiedliche Formate.
- - a device for linguistic input and recognition of data blocks,
- - a device for the verification and correction of the linguistically entered data blocks,
- a display device for displaying the current data sequence, and
- - A formatting device for formatting the linguistically entered and recognized data blocks in at least two different formats.
Vorzugsweise umfasst die Vorrichtung ferner eine Eingabeeinrichtung zur haptischen Eingabe der Datensequenz und eine Einrichtung zur Korrektur der haptischen Eingabe.The device preferably further comprises an input device for haptic input of the data sequence and a device for correcting the haptic input.
Eine bevorzugte Ausführungsform der Erfindung wird nachfolgend anhand der Zeichnungen beschrieben. Dabei zeigt
-
1 einen Freitext-Speller für Telefonnummern in schematischer Darstellung, -
2 den Freitext-Speller nach Eingabe eines ersten Ziffernblocks, -
3 den Freitext-Speller nach der Eingabe eines zweiten Ziffernblocks, und -
4 den Freitext-Speller nach der Korrektur der zweiten Eingabe.
-
1 a free text speller for telephone numbers in a schematic representation, -
2 the free text speller after entering the first number block, -
3 the free text speller after entering a second number block, and -
4th the free text speller after correcting the second input.
Die
Aufgrund der verschiedenen Modalitäten, nämlich haptisch einerseits und sprachlich andererseits, kommen verschiedene Korrekturmechanismen zum Einsatz. Während sich zum Beispiel ein haptisches „Korrigieren“ meistens auf das Löschen des letzten Zeichens bezieht, was hier durch die „DEL“-Taste 4 bewirkt wird, kann ein sprachliches „Korrigieren“ zum Löschen von mehreren zuvor eingegebenen Zeichen, beispielsweise dem aktuellen Datenblock, führen.Due to the different modalities, namely haptic on the one hand and linguistic on the other, different correction mechanisms are used. For example, while a haptic "correction" mostly refers to the deletion of the last character, which is effected here by the "DEL" key 4, a linguistic "correction" can be used to delete several previously entered characters, for example the current data block, to lead.
Da die haptisch-visuellen Darstellungen, Formatierungen und Verifikationsmechanismen für eine rein haptische Bedienung in sich stimmig und hinreichend bekannt sind, wird hier nur auf die sprachliche Darstellung und Verifikation eingegangen, sowie - unter der Berücksichtigung eines vollständig multimodalen Systems - der Übergang von der sprachlichen Bedienung hin zu einer haptischen Bedienung und zurück betrachtet werden.Since the haptic-visual representations, formatting and verification mechanisms for a purely haptic operation are coherent and sufficiently known, only the linguistic representation and verification will be discussed here, as well as - taking into account a fully multimodal system - the transition from linguistic operation towards a haptic operation and back.
Eine sprachliche Zifferneingabe erfolgt in der Regel in Form von n Datenblöcken, bei der jeweils jeder der einzelnen Datenblöcke wiederum 1 bis k Ziffern enthalten kann. Dadurch ist es möglich eine Ziffernfolge in Form von ganzen Nummern oder als Folge von einzelnen Ziffern einzugeben. Der Standardfall wird im Allgemeinen im mittleren Bereich - aus einer Folge von mehreren kleineren Blöcken - zu finden sein.A verbal input of digits is usually made in the form of n data blocks, in which each of the individual data blocks can in turn contain 1 to k digits. This makes it possible to enter a sequence of digits in the form of whole numbers or as a sequence of individual digits. The standard case will generally be found in the middle area - made up of a sequence of several smaller blocks.
Davon ausgehend, dass der Nutzer haptisch oder sprachlich noch keine Ziffernfolge eingegeben hat und nun beginnt sprachlich den Nummerblock „1234“ einzugeben, ergibt sich das in
Der Nutzer sagt „1234“. Das System antwortet mit der erkannten Ziffernfolge, also zum Beispiel „1234“, und stellt das erkannte Ergebnis in dem Anzeigeblock
Da das Ergebnis jedoch seitens der Sprachbedienung in den Speller „geschrieben“ wurde, wird bei der sprachlichen Eingabe eine andere Art der Darstellung gewählt. Die hier dargestellte Formatierung des erkannten Datenblocks „1234“ erfolgt in fetter Schrift mit Unterstrich. Dieses Ergebnis kann nun mittels eines geeigneten Dialogs, beispielsweise den Kommandos „Korrigieren“, „Löschen“, usw., vom Nutzer korrigiert werden.However, since the result was "written" into the speller by voice control, a different type of representation is selected for the verbal input. The formatting of the recognized data block "1234" shown here is done in bold font with an underscore. This result can now be corrected by the user by means of a suitable dialog, for example the commands “Correct”, “Delete”, etc.
Bestätigt der Nutzer die Eingabe jedoch implizit, beispielsweise durch Nennen eines Datenblocks mit weiteren Einzelziffern oder explizit, also durch ein entsprechendes Kommando, so wird die Darstellungsform nun in die Standardformatierung der haptisch-visuellen Eingabe überführt werden, was hier durch die Normalschrift ohne Unterstrich dargestellt ist. Letztendlich hat der Nutzer ja somit auch die vorherige Eingabe verifiziert und bestätigt.However, if the user confirms the input implicitly, for example by naming a data block with additional single digits or explicitly, i.e. by means of a corresponding command, the display form will now be converted to the standard formatting of the haptic-visual input, which is shown here by normal writing without an underscore . Ultimately, the user has verified and confirmed the previous entry.
In unserem Beispiel führt der Nutzer nun den Dialog implizit durch Nennen weiterer Einzelziffern fort, wie dies in
Der Nutzer hat nun mehrere Möglichkeiten dieses als aktuelle Datensequenz angezeigte Erkennergebnis zu korrigieren. Durch ein sprachliches „Korrigieren“ würde beispielsweise der zuletzt erkannte Ziffernblock „567“ gelöscht werden und es könnte - der Nutzer befindet sich ja wieder in der Sprachbedienung - die zuvor eingegebene Ziffernfolge „1234“ wieder sprachbedienspezifisch markiert werden, nämlich „fett“ und „unterstrichen“. Bei einer haptischen Korrektur durch Drücken der Taste
Maßgeblich hierbei ist, dass bei der Detektion einer haptischen Korrektur, beispielsweise durch eine Annäherungssensorik oder Detektion des Druckes der Korrekturtaste
Wahlweise kann die sprachbedienspezifische Formatierung (fett) der letzten Eingabe - diese beträfe dann nur noch die Ziffernfolge „56“ -jedoch auch wieder aufgenommen werden, wenn der Sprachdialog erneut gestartet oder keine weitere haptische Bedienung beispielsweise durch eine Annäherungssensorik, erkannt wurde.Optionally, the voice control-specific formatting (bold) of the last entry - this would then only concern the digit sequence "56" - but can also be resumed if the voice dialog is started again or no further haptic control, for example by a proximity sensor, is recognized.
Dieses Wechselspiel der verschiedenen Formatierungen, das gegebenenfalls durch Animationen unterstützt werden kann, wird bei unterschiedlich genutzter Eingabemodalität nun solange fortgeführt, wie der Nutzer auch eine Zifferneingabe tätigt.This interplay of the various formatting, which can be supported by animations if necessary, is now continued for as long as the user also enters digits if the input modality is used differently.
Alternative Formatierungen der erkannten Ziffernfolge, gegenüber dem bereits dargestellten „fett“, wären beispielsweise:
- - kursiv: „1234567“
- - unterstrichen: „1234567”
- - Einfügen von Sonderzeichen (zum Beispiel Leerzeichen): „1234 567“
- - andere Schriftart
- - Kursiv und fett: „1234567'
- - mit Leerzeichen und fett: „1234 567“
- - mit Leerzeichen, kursiv und fett: „1234 567“
- - italic: "1234567"
- - underlined: "1234567"
- - Insertion of special characters (for example spaces): "1234 567"
- - different font
- - Italic and bold: "1234567"
- - with spaces and bold: "1234 567"
- - with spaces, italics and bold: "1234 567"
BezugszeichenlisteList of reference symbols
- 11
- Bildschirmscreen
- 22
- Anzeigedisplay
- 33
- ZifferntastenNumeric keys
- 44th
- LöschtasteDelete button
- 55
- BestätigungstasteConfirmation button
- 66th
- Taste „Menü Schließen“"Close menu" button
Claims (6)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE102011013755.6A DE102011013755B4 (en) | 2010-12-31 | 2011-03-12 | Method and device for alphanumeric voice input in motor vehicles |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE102010056501.6 | 2010-12-31 | ||
DE102010056501 | 2010-12-31 | ||
DE102011013755.6A DE102011013755B4 (en) | 2010-12-31 | 2011-03-12 | Method and device for alphanumeric voice input in motor vehicles |
Publications (2)
Publication Number | Publication Date |
---|---|
DE102011013755A1 DE102011013755A1 (en) | 2012-07-05 |
DE102011013755B4 true DE102011013755B4 (en) | 2021-07-08 |
Family
ID=46509331
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE102011013755.6A Active DE102011013755B4 (en) | 2010-12-31 | 2011-03-12 | Method and device for alphanumeric voice input in motor vehicles |
Country Status (1)
Country | Link |
---|---|
DE (1) | DE102011013755B4 (en) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0389514B1 (en) | 1987-10-19 | 1996-03-27 | Motorola, Inc. | Method for entering digit sequences by voice command |
DE10028869A1 (en) | 1999-07-06 | 2001-01-11 | Volkswagen Ag | Supporting command/data entry in motor vehicles involves input menu giving principal possible command/data entries via menu fields emphasizing available speech command/data entries |
DE19942871A1 (en) | 1999-09-08 | 2001-03-15 | Volkswagen Ag | Method for operating a voice-controlled command input unit in a motor vehicle |
EP1136984A2 (en) | 2000-03-21 | 2001-09-26 | Robert Bosch Gmbh | Method for voice command of an electric device |
DE102007037567A1 (en) * | 2007-08-09 | 2009-02-12 | Volkswagen Ag | Method for multimodal operation of at least one device in a motor vehicle |
DE102007052345A1 (en) | 2007-11-02 | 2009-05-07 | Volkswagen Ag | Method and device for operating a device of a vehicle with a voice control |
DE102008024974A1 (en) * | 2008-05-23 | 2009-12-03 | Siemens Aktiengesellschaft | A method for conveying a confidence to a user of an automatic speech dialogue system |
-
2011
- 2011-03-12 DE DE102011013755.6A patent/DE102011013755B4/en active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0389514B1 (en) | 1987-10-19 | 1996-03-27 | Motorola, Inc. | Method for entering digit sequences by voice command |
DE3855164T2 (en) | 1987-10-19 | 1996-10-10 | Motorola Inc | ENTRY PROCEDURE FOR DATA SEQUENCES BY VOICE CONTROL |
DE10028869A1 (en) | 1999-07-06 | 2001-01-11 | Volkswagen Ag | Supporting command/data entry in motor vehicles involves input menu giving principal possible command/data entries via menu fields emphasizing available speech command/data entries |
DE19942871A1 (en) | 1999-09-08 | 2001-03-15 | Volkswagen Ag | Method for operating a voice-controlled command input unit in a motor vehicle |
EP1136984A2 (en) | 2000-03-21 | 2001-09-26 | Robert Bosch Gmbh | Method for voice command of an electric device |
DE102007037567A1 (en) * | 2007-08-09 | 2009-02-12 | Volkswagen Ag | Method for multimodal operation of at least one device in a motor vehicle |
DE102007052345A1 (en) | 2007-11-02 | 2009-05-07 | Volkswagen Ag | Method and device for operating a device of a vehicle with a voice control |
DE102008024974A1 (en) * | 2008-05-23 | 2009-12-03 | Siemens Aktiengesellschaft | A method for conveying a confidence to a user of an automatic speech dialogue system |
Also Published As
Publication number | Publication date |
---|---|
DE102011013755A1 (en) | 2012-07-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP2200858B9 (en) | Vehicle system comprising an assistance functionality | |
EP1692606A2 (en) | Communication device and method for inputting and predicting text | |
EP2026328B1 (en) | Method for multimodal control of at least one device in a motor vehicle | |
EP2951663B1 (en) | System-initiated help function for operating an apparatus associated with a vehicle - input of spaces | |
EP1739655A2 (en) | Method for determining a list of hypotheses from the vocabulary of a speech recognition system | |
EP2939086B1 (en) | Method for inputting and identifying a character string | |
EP2217992A2 (en) | Method and apparatus for operating a device in a vehicle with a voice controller | |
EP2147363B1 (en) | Method and device for selecting designations from at least one predetermined word pool | |
DE102011013755B4 (en) | Method and device for alphanumeric voice input in motor vehicles | |
DE102013001885A1 (en) | System-initiated help function per trip and / or per user for the operation of a device associated with a vehicle | |
DE102008028477B4 (en) | Method for assisting a user when using a voice control system and voice control system | |
EP2972101B1 (en) | Vehicle speller input device having delete and/or list selection button | |
DE102010008355A1 (en) | Method for supporting user of motor car when operating car functions, involves detecting state of car devices during control step, and performing acoustic illustration of control step depending on detected state of car devices | |
EP2188594B1 (en) | Vehicle system of a motor vehicle having explanation function | |
DE102015007361B3 (en) | Method for operating at least one functional device of a motor vehicle | |
DE102017219596A1 (en) | Speech output voice of a voice control system | |
WO2024114960A1 (en) | Method for providing a dialogue control object of a digital assistant of a vehicle to a user of the vehicle, computer-readable medium, system, and vehicle | |
DE102017005755A1 (en) | Method and device for confirming automated selection proposals | |
DE19613318A1 (en) | Controlling Braille elements in Braille field | |
DE102021117350A1 (en) | METHOD OF DETERMINING A HANDS-OFF TIME FOR AN AUTOMATED MOTOR VEHICLE | |
DE102013001881A1 (en) | System-initiated help function for the operation of a device associated with a vehicle - erasing inputs | |
DE102018220692A1 (en) | Error-free operation of an operating unit with a screen | |
DE102004024260A1 (en) | Entry of alphabetic character strings in the data field of a road vehicle navigation system | |
EP3113178A1 (en) | Method and device for selecting a component of a speech input | |
DE102009013488A1 (en) | Motor vehicle, has optical display unit for displaying display page to operator, and another display page represented for input of content, where representation of action field within latter display page comprises description of action |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
R163 | Identified publications notified | ||
R163 | Identified publications notified |
Effective date: 20121022 |
|
R012 | Request for examination validly filed | ||
R016 | Response to examination communication | ||
R018 | Grant decision by examination section/examining division | ||
R020 | Patent grant now final |