DE102018205093A1 - Verfahren zum Betreiben einer Vorrichtung mittels Spracheingabe - Google Patents

Verfahren zum Betreiben einer Vorrichtung mittels Spracheingabe Download PDF

Info

Publication number
DE102018205093A1
DE102018205093A1 DE102018205093.7A DE102018205093A DE102018205093A1 DE 102018205093 A1 DE102018205093 A1 DE 102018205093A1 DE 102018205093 A DE102018205093 A DE 102018205093A DE 102018205093 A1 DE102018205093 A1 DE 102018205093A1
Authority
DE
Germany
Prior art keywords
trigger signal
acoustic
trigger
input
period
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
DE102018205093.7A
Other languages
English (en)
Inventor
Arnold Kieferle
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Audi AG
Original Assignee
Audi AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Audi AG filed Critical Audi AG
Priority to DE102018205093.7A priority Critical patent/DE102018205093A1/de
Publication of DE102018205093A1 publication Critical patent/DE102018205093A1/de
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

Verfahren zum Betreiben einer Vorrichtung mittels Spracheingabe, umfassend die folgenden Schritte:
- Erfassen eines akustischen Triggersignals;
- Erfassen einer dem akustischen Triggersignal zugeordneten Triggergeste;
- bei Vorliegen des akustischen Triggersignals und der Triggergeste innerhalb eines Triggerzeitraums Starten eines Eingabezeitraums für Spracheingaben;
- Erfassen der Spracheingabe während des Eingabezeitraums;
- Betreiben der Vorrichtung entsprechend der Spracheingabe.

Description

  • Die vorliegende Erfindung betrifft ein Verfahren zum Betreiben einer Vorrichtung mittels Spracheingabe gemäß dem Oberbegriff des Patentanspruch 1.
  • Derartige Verfahren zum Betreiben einer Vorrichtung mittels Spracheingabe fassen ein vom Nutzer stammendes, definiertes Signal, beispielsweise ein bestimmtes Wort, als Trigger zum Start der Spracheingabefunktion auf, wonach ein in der Regel nach dem Signal folgender Sprachbefehl der Beeinflussung der Vorrichtung dient.
  • Die gattungsbildende DE 10 2013 002 680 B3 beschreibt ein Verfahren zum Betreiben einer Vorrichtung, bei welchem wenigstens eine vorgebbare Geste eines Nutzers der Vorrichtung mittels einer Gestenerfassungseinrichtung der Vorrichtung erfasst und in Abhängigkeit von der erfassten Geste eine Spracheingabefunktion der Vorrichtung aktiviert wird, mittels welcher die Vorrichtung dem Nutzer eine Möglichkeit bereitstellt, wenigstens eine Spracheingabe in die Vorrichtung zu tätigen, wobei als die vorgebbare Geste eine solche erfasst wird, bei welcher der Nutzer seine zur Faust geballte Hand vor sich hält. Es besteht allerdings die Gefahr einer fehlerhaften Erfassung der Geste, so dass die Spracheingabe entweder nicht oder unbeabsichtigt gestartet wird.
  • Aufgabe der vorliegenden Erfindung ist es daher ein Verfahren zum Betreiben einer Vorrichtung mittels Spracheingabe bereitzustellen, bei der die Aktivierung der Spracheingabe zuverlässiger erfolgt.
  • Diese Aufgabe wird durch die Merkmale des Patentanspruchs 1 gelöst.
  • Ein Verfahren zum Betreiben einer Vorrichtung mittels Spracheingabe umfasst die folgenden Schritte:
    • - Erfassen eines akustischen Triggersignals;
    • - Erfassen einer dem akustischen Triggersignal zugeordneten Triggergeste;
    • - bei Vorliegen des akustischen Triggersignals und der Triggergeste innerhalb eines Triggerzeitraums Starten eines Eingabezeitraums für Spracheingaben;
    • - Erfassen der Spracheingabe während des Eingabezeitraums;
    • - Betreiben der Vorrichtung entsprechend der Spracheingabe.
  • Indem eine Erfassung von akustischem Triggersignal und zugeordneter Triggergeste innerhalb eines Triggerzeitraums den Eingabezeitraum für Spracheingaben startet, wird die Zuverlässigkeit der Spracheingabe durch die Reduzierung fehlerhaft erkannter akustischer Triggersignale erhöht. Denn wird ein in Frage kommendes akustisches Triggersignal erkannt, so liefert erst die zugehörige Triggergeste während des Triggerzeitraums die finale Bestätigung, dass durch den Nutzer tatsächlich eine Spracheingabe gewünscht wird. Das Verfahren startet danach den Eingabezeitraum, während dem die Spracheingabe erfasst und anschließend zum Betreiben der Vorrichtung verarbeitet werden kann.
  • In einer bevorzugten Ausführung ist das akustische Triggersignal ein gesprochenes Wort. Dabei handelt es sich um ein oder mehrere definierte Signalworte.
  • In einer bevorzugten Ausführung ist das akustische Triggersignal ein durch wenigstens eine Gliedmaße eines Nutzers erzeugter Schall. Dies sind beispielsweise ein Fingerschnippen oder ein Klatschen.
  • In einer bevorzugten Ausführung wird der Triggerzeitraum mit Erfassen des akustischen Triggersignals festgelegt und ist dem akustischen Triggersignal zeitlich anteilig vor- und nachgelagert. Dadurch wird sichergestellt, dass der Nutzer weniger darauf achten muss eine genaue zeitliche Reihenfolge von akustischem Triggersignal und Triggergeste einzuhalten.
  • In einer bevorzugten Ausführung hängt die Triggergeste mit der Erzeugung des akustischen Triggersignals kausal zusammen. Ein solcher Zusammenhang besteht beispielsweise zwischen dem Fingerschnippen bzw. Klatschen und dem damit erzeugten, charakteristischen Schall.
  • In einer bevorzugten Ausführung ist die Vorrichtung ein mobiles Endgerät oder eine Kraftfahrzeug. Ein mobiles Endgerät ist beispielsweise ein Smartphone, ein Tablet, eine Uhr oder ein intelligenter Lautsprecher („smart speaker“). Weiterhin denkbar sind auch ein Fernsehgerät, eine Streamingbox oder ein Computer.
  • ZITATE ENTHALTEN IN DER BESCHREIBUNG
  • Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.
  • Zitierte Patentliteratur
    • DE 102013002680 B3 [0003]

Claims (6)

  1. Verfahren zum Betreiben einer Vorrichtung mittels Spracheingabe, umfassend die folgenden Schritte: - Erfassen eines akustischen Triggersignals; - Erfassen einer dem akustischen Triggersignal zugeordneten Triggergeste; - bei Vorliegen des akustischen Triggersignals und der Triggergeste innerhalb eines Triggerzeitraums Starten eines Eingabezeitraums für Spracheingaben; - Erfassen der Spracheingabe während des Eingabezeitraums; - Betreiben der Vorrichtung entsprechend der Spracheingabe.
  2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass das akustische Triggersignal ein gesprochenes Wort ist.
  3. Verfahren nach Anspruch 2, dadurch gekennzeichnet, dass das akustische Triggersignal ein durch wenigstens eine Gliedmaße eines Nutzers erzeugter Schall ist.
  4. Verfahren nach einem der Ansprüche 1 bis 3, dadurch gekennzeichnet, dass der Triggerzeitraum mit Erfassen des akustischen Triggersignals festgelegt wird und dem akustischen Triggersignal zeitlich anteilig vor- und nachgelagert ist.
  5. Verfahren nach einem der Ansprüche 1 bis 4, dadurch gekennzeichnet, dass die Triggergeste mit der Erzeugung des akustischen Triggersignals kausal zusammenhängt.
  6. Verfahren nach einem der Ansprüche 1 bis 5, dadurch gekennzeichnet, dass die Vorrichtung ein mobiles Endgerät oder eine Kraftfahrzeug ist.
DE102018205093.7A 2018-04-05 2018-04-05 Verfahren zum Betreiben einer Vorrichtung mittels Spracheingabe Withdrawn DE102018205093A1 (de)

Priority Applications (1)

Application Number Priority Date Filing Date Title
DE102018205093.7A DE102018205093A1 (de) 2018-04-05 2018-04-05 Verfahren zum Betreiben einer Vorrichtung mittels Spracheingabe

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE102018205093.7A DE102018205093A1 (de) 2018-04-05 2018-04-05 Verfahren zum Betreiben einer Vorrichtung mittels Spracheingabe

Publications (1)

Publication Number Publication Date
DE102018205093A1 true DE102018205093A1 (de) 2019-10-10

Family

ID=67991427

Family Applications (1)

Application Number Title Priority Date Filing Date
DE102018205093.7A Withdrawn DE102018205093A1 (de) 2018-04-05 2018-04-05 Verfahren zum Betreiben einer Vorrichtung mittels Spracheingabe

Country Status (1)

Country Link
DE (1) DE102018205093A1 (de)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102007042580A1 (de) * 2007-09-07 2009-03-12 Audi Ag Verfahren zur Kommunikation zwischen einer natürlichen Person und einem künstlichen Sprachsystem sowie Kommunikationssystem
DE102013002680B3 (de) 2013-02-15 2014-05-22 Audi Ag Verfahren zum Betreiben einer Vorrichtung, insbesondere eines Kraftwagens oder eines mobilen Endgeräts, mittels Gestensteuerung sowie Vorrichtung
DE102017122424A1 (de) * 2016-09-28 2018-03-29 Lenovo (Singapore) Pte. Ltd. Gestendetektion

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102007042580A1 (de) * 2007-09-07 2009-03-12 Audi Ag Verfahren zur Kommunikation zwischen einer natürlichen Person und einem künstlichen Sprachsystem sowie Kommunikationssystem
DE102013002680B3 (de) 2013-02-15 2014-05-22 Audi Ag Verfahren zum Betreiben einer Vorrichtung, insbesondere eines Kraftwagens oder eines mobilen Endgeräts, mittels Gestensteuerung sowie Vorrichtung
DE102017122424A1 (de) * 2016-09-28 2018-03-29 Lenovo (Singapore) Pte. Ltd. Gestendetektion

Similar Documents

Publication Publication Date Title
EP1256936A2 (de) Verfahren zum Training oder zur Adaption eines Spracherkenners
EP3224831B1 (de) Kraftfahrzeug-bedienvorrichtung mit korrekturstrategie für spracherkennung
DE102014017385B4 (de) Kraftfahrzeug-Gerätebedienung mit Bedienkorrektur
DE60215272T2 (de) Verfahren und Vorrichtung zur sprachlichen Dateneingabe bei ungünstigen Bedingungen
DE102008024258A1 (de) Verfahren zur Klassifizierung und Entfernung unerwünschter Anteile aus einer Äußerung bei einer Spracherkennung
DE19847419A1 (de) Verfahren zur automatischen Erkennung einer buchstabierten sprachlichen Äußerung
EP1892700A1 (de) Verfahren zur Spracherkennung und Sprachwiedergabe
DE112014006409T5 (de) Fahrzeugsteuervorrichtung und Fahrzeugsteuerverfahren
EP3430615B1 (de) Fortbewegungsmittel, system und verfahren zur anpassung einer länge einer erlaubten sprechpause im rahmen einer spracheingabe
EP1884924A1 (de) Verfahren zum Erzeugen einer kontextbasierten Sprachdialogausgabe in einem Sprachdialogsystem
DE102015106280B4 (de) Systeme und Verfahren zum Kompensieren von Sprachartefakten in Spracherkennungssystemen
DE112017007562T5 (de) Spracherkennungsvorrichtung und Spracherkennungsverfahren
DE102016221564A1 (de) Multimodaler Dialog in einem Kraftfahrzeug
CN111402880A (zh) 一种数据处理方法、装置及电子设备
EP3117428B1 (de) Verfahren zur identifikation und prüfung von sprechfunkmeldungen
DE102018205093A1 (de) Verfahren zum Betreiben einer Vorrichtung mittels Spracheingabe
WO2010072453A2 (de) Verfahren zum identifizieren einer sequenz von eingangssignalen
DE102005030965A1 (de) Erweiterung des dynamischen Vokabulars eines Spracherkennungssystems um weitere Voiceenrollments
DE102010026708A1 (de) Verfahren zum Betreiben eines Sprachdialogsystems und Sprachdialogsystem
EP3115886B1 (de) Verfahren zum betreiben eines sprachsteuerungssystems und sprachsteuerungssystem
DE102016003903A1 (de) Verfahren zur Spracherkennung in einem Kraftfahrzeug
DE19804047C2 (de) Verfahren und Einrichtung zur Erhöhung der Erkennungswahrscheinlichkeit von Spracherkennungssystemen
DE102022124133B3 (de) Verfahren zum Verarbeiten gestottert gesprochener Sprache mittels eines Sprachassistenten für ein Kraftfahrzeug
DE102013011922A1 (de) Verfahren und Vorrichtung zum Verarbeiten einer Sprachäußerung eines Benutzers in einem Fahrzeug
DE102017203840A1 (de) Ursachenanalyse sowie wiederherstellungssysteme und -verfahren

Legal Events

Date Code Title Description
R163 Identified publications notified
R120 Application withdrawn or ip right abandoned