DE102018205093A1 - Verfahren zum Betreiben einer Vorrichtung mittels Spracheingabe - Google Patents
Verfahren zum Betreiben einer Vorrichtung mittels Spracheingabe Download PDFInfo
- Publication number
- DE102018205093A1 DE102018205093A1 DE102018205093.7A DE102018205093A DE102018205093A1 DE 102018205093 A1 DE102018205093 A1 DE 102018205093A1 DE 102018205093 A DE102018205093 A DE 102018205093A DE 102018205093 A1 DE102018205093 A1 DE 102018205093A1
- Authority
- DE
- Germany
- Prior art keywords
- trigger signal
- acoustic
- trigger
- input
- period
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
Verfahren zum Betreiben einer Vorrichtung mittels Spracheingabe, umfassend die folgenden Schritte:
- Erfassen eines akustischen Triggersignals;
- Erfassen einer dem akustischen Triggersignal zugeordneten Triggergeste;
- bei Vorliegen des akustischen Triggersignals und der Triggergeste innerhalb eines Triggerzeitraums Starten eines Eingabezeitraums für Spracheingaben;
- Erfassen der Spracheingabe während des Eingabezeitraums;
- Betreiben der Vorrichtung entsprechend der Spracheingabe.
- Erfassen eines akustischen Triggersignals;
- Erfassen einer dem akustischen Triggersignal zugeordneten Triggergeste;
- bei Vorliegen des akustischen Triggersignals und der Triggergeste innerhalb eines Triggerzeitraums Starten eines Eingabezeitraums für Spracheingaben;
- Erfassen der Spracheingabe während des Eingabezeitraums;
- Betreiben der Vorrichtung entsprechend der Spracheingabe.
Description
- Die vorliegende Erfindung betrifft ein Verfahren zum Betreiben einer Vorrichtung mittels Spracheingabe gemäß dem Oberbegriff des Patentanspruch 1.
- Derartige Verfahren zum Betreiben einer Vorrichtung mittels Spracheingabe fassen ein vom Nutzer stammendes, definiertes Signal, beispielsweise ein bestimmtes Wort, als Trigger zum Start der Spracheingabefunktion auf, wonach ein in der Regel nach dem Signal folgender Sprachbefehl der Beeinflussung der Vorrichtung dient.
- Die gattungsbildende
DE 10 2013 002 680 B3 beschreibt ein Verfahren zum Betreiben einer Vorrichtung, bei welchem wenigstens eine vorgebbare Geste eines Nutzers der Vorrichtung mittels einer Gestenerfassungseinrichtung der Vorrichtung erfasst und in Abhängigkeit von der erfassten Geste eine Spracheingabefunktion der Vorrichtung aktiviert wird, mittels welcher die Vorrichtung dem Nutzer eine Möglichkeit bereitstellt, wenigstens eine Spracheingabe in die Vorrichtung zu tätigen, wobei als die vorgebbare Geste eine solche erfasst wird, bei welcher der Nutzer seine zur Faust geballte Hand vor sich hält. Es besteht allerdings die Gefahr einer fehlerhaften Erfassung der Geste, so dass die Spracheingabe entweder nicht oder unbeabsichtigt gestartet wird. - Aufgabe der vorliegenden Erfindung ist es daher ein Verfahren zum Betreiben einer Vorrichtung mittels Spracheingabe bereitzustellen, bei der die Aktivierung der Spracheingabe zuverlässiger erfolgt.
- Diese Aufgabe wird durch die Merkmale des Patentanspruchs 1 gelöst.
- Ein Verfahren zum Betreiben einer Vorrichtung mittels Spracheingabe umfasst die folgenden Schritte:
- - Erfassen eines akustischen Triggersignals;
- - Erfassen einer dem akustischen Triggersignal zugeordneten Triggergeste;
- - bei Vorliegen des akustischen Triggersignals und der Triggergeste innerhalb eines Triggerzeitraums Starten eines Eingabezeitraums für Spracheingaben;
- - Erfassen der Spracheingabe während des Eingabezeitraums;
- - Betreiben der Vorrichtung entsprechend der Spracheingabe.
- Indem eine Erfassung von akustischem Triggersignal und zugeordneter Triggergeste innerhalb eines Triggerzeitraums den Eingabezeitraum für Spracheingaben startet, wird die Zuverlässigkeit der Spracheingabe durch die Reduzierung fehlerhaft erkannter akustischer Triggersignale erhöht. Denn wird ein in Frage kommendes akustisches Triggersignal erkannt, so liefert erst die zugehörige Triggergeste während des Triggerzeitraums die finale Bestätigung, dass durch den Nutzer tatsächlich eine Spracheingabe gewünscht wird. Das Verfahren startet danach den Eingabezeitraum, während dem die Spracheingabe erfasst und anschließend zum Betreiben der Vorrichtung verarbeitet werden kann.
- In einer bevorzugten Ausführung ist das akustische Triggersignal ein gesprochenes Wort. Dabei handelt es sich um ein oder mehrere definierte Signalworte.
- In einer bevorzugten Ausführung ist das akustische Triggersignal ein durch wenigstens eine Gliedmaße eines Nutzers erzeugter Schall. Dies sind beispielsweise ein Fingerschnippen oder ein Klatschen.
- In einer bevorzugten Ausführung wird der Triggerzeitraum mit Erfassen des akustischen Triggersignals festgelegt und ist dem akustischen Triggersignal zeitlich anteilig vor- und nachgelagert. Dadurch wird sichergestellt, dass der Nutzer weniger darauf achten muss eine genaue zeitliche Reihenfolge von akustischem Triggersignal und Triggergeste einzuhalten.
- In einer bevorzugten Ausführung hängt die Triggergeste mit der Erzeugung des akustischen Triggersignals kausal zusammen. Ein solcher Zusammenhang besteht beispielsweise zwischen dem Fingerschnippen bzw. Klatschen und dem damit erzeugten, charakteristischen Schall.
- In einer bevorzugten Ausführung ist die Vorrichtung ein mobiles Endgerät oder eine Kraftfahrzeug. Ein mobiles Endgerät ist beispielsweise ein Smartphone, ein Tablet, eine Uhr oder ein intelligenter Lautsprecher („smart speaker“). Weiterhin denkbar sind auch ein Fernsehgerät, eine Streamingbox oder ein Computer.
- ZITATE ENTHALTEN IN DER BESCHREIBUNG
- Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.
- Zitierte Patentliteratur
-
- DE 102013002680 B3 [0003]
Claims (6)
- Verfahren zum Betreiben einer Vorrichtung mittels Spracheingabe, umfassend die folgenden Schritte: - Erfassen eines akustischen Triggersignals; - Erfassen einer dem akustischen Triggersignal zugeordneten Triggergeste; - bei Vorliegen des akustischen Triggersignals und der Triggergeste innerhalb eines Triggerzeitraums Starten eines Eingabezeitraums für Spracheingaben; - Erfassen der Spracheingabe während des Eingabezeitraums; - Betreiben der Vorrichtung entsprechend der Spracheingabe.
- Verfahren nach
Anspruch 1 , dadurch gekennzeichnet, dass das akustische Triggersignal ein gesprochenes Wort ist. - Verfahren nach
Anspruch 2 , dadurch gekennzeichnet, dass das akustische Triggersignal ein durch wenigstens eine Gliedmaße eines Nutzers erzeugter Schall ist. - Verfahren nach einem der
Ansprüche 1 bis3 , dadurch gekennzeichnet, dass der Triggerzeitraum mit Erfassen des akustischen Triggersignals festgelegt wird und dem akustischen Triggersignal zeitlich anteilig vor- und nachgelagert ist. - Verfahren nach einem der
Ansprüche 1 bis4 , dadurch gekennzeichnet, dass die Triggergeste mit der Erzeugung des akustischen Triggersignals kausal zusammenhängt. - Verfahren nach einem der
Ansprüche 1 bis5 , dadurch gekennzeichnet, dass die Vorrichtung ein mobiles Endgerät oder eine Kraftfahrzeug ist.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE102018205093.7A DE102018205093A1 (de) | 2018-04-05 | 2018-04-05 | Verfahren zum Betreiben einer Vorrichtung mittels Spracheingabe |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE102018205093.7A DE102018205093A1 (de) | 2018-04-05 | 2018-04-05 | Verfahren zum Betreiben einer Vorrichtung mittels Spracheingabe |
Publications (1)
Publication Number | Publication Date |
---|---|
DE102018205093A1 true DE102018205093A1 (de) | 2019-10-10 |
Family
ID=67991427
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE102018205093.7A Withdrawn DE102018205093A1 (de) | 2018-04-05 | 2018-04-05 | Verfahren zum Betreiben einer Vorrichtung mittels Spracheingabe |
Country Status (1)
Country | Link |
---|---|
DE (1) | DE102018205093A1 (de) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE102007042580A1 (de) * | 2007-09-07 | 2009-03-12 | Audi Ag | Verfahren zur Kommunikation zwischen einer natürlichen Person und einem künstlichen Sprachsystem sowie Kommunikationssystem |
DE102013002680B3 (de) | 2013-02-15 | 2014-05-22 | Audi Ag | Verfahren zum Betreiben einer Vorrichtung, insbesondere eines Kraftwagens oder eines mobilen Endgeräts, mittels Gestensteuerung sowie Vorrichtung |
DE102017122424A1 (de) * | 2016-09-28 | 2018-03-29 | Lenovo (Singapore) Pte. Ltd. | Gestendetektion |
-
2018
- 2018-04-05 DE DE102018205093.7A patent/DE102018205093A1/de not_active Withdrawn
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE102007042580A1 (de) * | 2007-09-07 | 2009-03-12 | Audi Ag | Verfahren zur Kommunikation zwischen einer natürlichen Person und einem künstlichen Sprachsystem sowie Kommunikationssystem |
DE102013002680B3 (de) | 2013-02-15 | 2014-05-22 | Audi Ag | Verfahren zum Betreiben einer Vorrichtung, insbesondere eines Kraftwagens oder eines mobilen Endgeräts, mittels Gestensteuerung sowie Vorrichtung |
DE102017122424A1 (de) * | 2016-09-28 | 2018-03-29 | Lenovo (Singapore) Pte. Ltd. | Gestendetektion |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP1256936A2 (de) | Verfahren zum Training oder zur Adaption eines Spracherkenners | |
EP3224831B1 (de) | Kraftfahrzeug-bedienvorrichtung mit korrekturstrategie für spracherkennung | |
DE102014017385B4 (de) | Kraftfahrzeug-Gerätebedienung mit Bedienkorrektur | |
DE60215272T2 (de) | Verfahren und Vorrichtung zur sprachlichen Dateneingabe bei ungünstigen Bedingungen | |
DE102008024258A1 (de) | Verfahren zur Klassifizierung und Entfernung unerwünschter Anteile aus einer Äußerung bei einer Spracherkennung | |
DE19847419A1 (de) | Verfahren zur automatischen Erkennung einer buchstabierten sprachlichen Äußerung | |
EP1892700A1 (de) | Verfahren zur Spracherkennung und Sprachwiedergabe | |
DE112014006409T5 (de) | Fahrzeugsteuervorrichtung und Fahrzeugsteuerverfahren | |
EP3430615B1 (de) | Fortbewegungsmittel, system und verfahren zur anpassung einer länge einer erlaubten sprechpause im rahmen einer spracheingabe | |
EP1884924A1 (de) | Verfahren zum Erzeugen einer kontextbasierten Sprachdialogausgabe in einem Sprachdialogsystem | |
DE102015106280B4 (de) | Systeme und Verfahren zum Kompensieren von Sprachartefakten in Spracherkennungssystemen | |
DE112017007562T5 (de) | Spracherkennungsvorrichtung und Spracherkennungsverfahren | |
DE102016221564A1 (de) | Multimodaler Dialog in einem Kraftfahrzeug | |
CN111402880A (zh) | 一种数据处理方法、装置及电子设备 | |
EP3117428B1 (de) | Verfahren zur identifikation und prüfung von sprechfunkmeldungen | |
DE102018205093A1 (de) | Verfahren zum Betreiben einer Vorrichtung mittels Spracheingabe | |
WO2010072453A2 (de) | Verfahren zum identifizieren einer sequenz von eingangssignalen | |
DE102005030965A1 (de) | Erweiterung des dynamischen Vokabulars eines Spracherkennungssystems um weitere Voiceenrollments | |
DE102010026708A1 (de) | Verfahren zum Betreiben eines Sprachdialogsystems und Sprachdialogsystem | |
EP3115886B1 (de) | Verfahren zum betreiben eines sprachsteuerungssystems und sprachsteuerungssystem | |
DE102016003903A1 (de) | Verfahren zur Spracherkennung in einem Kraftfahrzeug | |
DE19804047C2 (de) | Verfahren und Einrichtung zur Erhöhung der Erkennungswahrscheinlichkeit von Spracherkennungssystemen | |
DE102022124133B3 (de) | Verfahren zum Verarbeiten gestottert gesprochener Sprache mittels eines Sprachassistenten für ein Kraftfahrzeug | |
DE102013011922A1 (de) | Verfahren und Vorrichtung zum Verarbeiten einer Sprachäußerung eines Benutzers in einem Fahrzeug | |
DE102017203840A1 (de) | Ursachenanalyse sowie wiederherstellungssysteme und -verfahren |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
R163 | Identified publications notified | ||
R120 | Application withdrawn or ip right abandoned |