DE102016008862A1 - Verfahren zum Konfigurieren einer sprachgesteuerten Bedienvorrichtung, Bedienvorrichtung mit Sprachsteuerung und Kraftfahrzeug - Google Patents

Verfahren zum Konfigurieren einer sprachgesteuerten Bedienvorrichtung, Bedienvorrichtung mit Sprachsteuerung und Kraftfahrzeug Download PDF

Info

Publication number
DE102016008862A1
DE102016008862A1 DE102016008862.1A DE102016008862A DE102016008862A1 DE 102016008862 A1 DE102016008862 A1 DE 102016008862A1 DE 102016008862 A DE102016008862 A DE 102016008862A DE 102016008862 A1 DE102016008862 A1 DE 102016008862A1
Authority
DE
Germany
Prior art keywords
operating device
vocabulary
keyword
data source
keywords
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
DE102016008862.1A
Other languages
English (en)
Inventor
Jan Dusik
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Audi AG
Original Assignee
Audi AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Audi AG filed Critical Audi AG
Priority to DE102016008862.1A priority Critical patent/DE102016008862A1/de
Priority to PCT/EP2017/061589 priority patent/WO2018015041A1/de
Publication of DE102016008862A1 publication Critical patent/DE102016008862A1/de
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/065Adaptation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/242Dictionaries

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Navigation (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

Die Erfindung betrifft ein Verfahren zum Konfigurieren einer Bedienvorrichtung (11), um durch die Bedienvorrichtung (11) in Abhängigkeit von einer Spracheingabe (16) eines Benutzers aus einer Datenquelle (13), welche mit der Zeit wechselnde Datensätze (24) bereitstellt, zumindest einen der aktuell bereitgestellten Datensätze (24) als jeweiligen Zieldatensatz (24) anzufordern, wobei durch eine Spracherkennungseinrichtung (17) der Bedienvorrichtung (10) zumindest ein den jeweiligen Zieldatensatz (24) identifizierendes Schlüsselwort (27) in der Spracheingabe (16) erkannt wird und anhand des zumindest einen erkannten Schlüsselworts (27) der Zieldatensatz (24) bei der Datenquelle (13) angefordert wird. Die Erfindung sieht vor, dass zu vorbestimmten Zeitpunkten eine Überwachungseinrichtung (28, 28') in den von der Datenquelle (13) bereitgestellten Datensätzen (24) jeweils zumindest ein in dem Datensatz (24) enthaltenes Schlüsselwort (27) gemäß einer vorbestimmten Auswahlvorschrift auswählt und alle aus den Datensätzen (24) ausgewählten Schlüsselwörter (27) zu einem Ergänzungsvokabular (18', 29) zusammenfasst und mittels des Ergänzungsvokabulars (18', 29) ein Erkennungsvokabular (18) der Spracherkennungseinrichtung (17) ergänzt.

Description

  • Die Erfindung betrifft ein Verfahren zum Konfigurieren einer Bedienvorrichtung, um mittels der Bedienvorrichtung in Abhängigkeit von einer Spracheingabe eines Benutzers aus einer Datenquelle zumindest einen Zieldatensatz anfordern zu können. Zum Beispiel kann mittels der Bedienvorrichtung zumindest eine Internetseite aus dem Internet angefordert werden. Zu der Erfindung gehören auch eine Bedienvorrichtung, die gemäß dem erfindungsgemäßen Verfahren betrieben wird, sowie ein Kraftfahrzeug mit der erfindungsgemäßen Bedienvorrichtung.
  • Um von einem Kraftfahrzeug aus einen Online-Dienst zu bedienen, also zum Beispiel mittels eines Internetbrowsers Internetseiten aus dem Internet herunterzuladen, kann eine Sprachbedienung für eine solche Bedienvorrichtung bereitgestellt sein. Online-Dienste, wie zum Beispiel eine Wettervorhersage oder Nachrichten oder Veranstaltungshinweise, mittels Sprachbedienung zu bedienen, ist bisher aber nur rudimentär möglich. Zwar lässt sich der konkrete Online-Dienst mittels eines Sprachbefehls auswählen oder aufrufen („Starte den Wetterdienst, bitte!”), die dann angezeigten Inhalte lassen sich aber nicht weiter durch Sprachbefehle konkretisieren. Die vom Benutzer im Kraftfahrzeug aktivierten Online-Dienste können nur innerhalb eines kleinen, sehr starren und vom Hersteller voreingestellten Bedienumfangs per Sprache gesteuert werden. Insbesondere das Navigieren innerhalb von Internetseiten eines Online-Dienstes ist nur gemäß einem festen Muster möglich. Grund dafür ist, dass die Spracherkennungseinrichtung beim Herstellen der Bedienvorrichtung nur mit solchen Sprachkommandos ausgestattet werden kann, die im Voraus bekannt sind. Der Inhalt einer Internetseite wird dagegen von den Betreibern des Online-Dienstes frei gestaltet, sodass stets neue Navigationsmöglichkeiten vorhanden sind, die beim Konfigurieren der Spracherkennungseinrichtung noch nicht bekannt waren und somit nicht durch Sprachbefehle abgedeckt oder berücksichtigt sind.
  • Aus der DE 10 2004 027 286 A1 ist bekannt, dass bei einem Kraftfahrzeug die Bedienvorrichtung mit Spracherkennungseinrichtung dahin konfiguriert werden kann, dass im Betrieb der Bedienvorrichtung ein Schlüsselwort dynamisch einer Position zugeordnet werden kann.
  • Auch aus der EP 2 180 293 A2 ist bekannt, dass eine Spracherkennungseinrichtung einer Bedienvorrichtung eines Kraftfahrzeugs einem Wort aus einem Erkennungsvokabular des Spracherkenners dynamisch eine Position zuordnen kann. Hierdurch lässt sich zum Beispiel ein Navigationsgerät bedienen, indem einem Schlüsselwort aus dem Erkennungsvokabular ein Navigationsziel zugeordnet wird.
  • Aus der JP 2007 257 134 A ist ein Schlüsselwortgenerator bekannt, welcher aus einem Text signifikante Schlüsselwörter heraussuchen kann, um damit ein Erkennungsvokabular für einen Spracherkenner automatisiert zu erzeugen.
  • Der Erfindung liegt die Aufgabe zugrunde, mittels einer Bedienvorrichtung eine Datenquelle durch Sprachbedienung abfragen zu können, wobei die Datenquelle mit der Zeit wechselnde Datensätze bereitstellt, die durch eine Spracheingabe ausgewählt werden können sollen.
  • Die Aufgabe wird durch die Gegenstände der unabhängigen Patentansprüche gelöst. Vorteilhafte Weiterbildungen der Erfindung sind durch die abhängigen Patentansprüche, die folgende Beschreibung sowie die Figur beschrieben.
  • Durch die Erfindung ist ein Verfahren zum Konfigurieren einer Bedienvorrichtung bereitgestellt. Die Bedienvorrichtung kann zum Beispiel für ein Kraftfahrzeug vorgesehen sein und zum Beispiel als Infotainmentsystem (Informations-Unterhaltungssystem) ausgestaltet sein. Durch die Bedienvorrichtung kann in Abhängigkeit von einer Spracheingabe eines Benutzers aus einer Datenquelle, welche mit der Zeit wechselnde Datensätze bereitstellt, zumindest einer dieser aktuell bereitgestellten Datensätze als jeweiliger Zieldatensatz angefordert werden. Bei der Datenquelle kann es sich zum Beispiel um das Internet oder einen Online-Dienst für das Internet, das heißt einen Server des Internets, handeln. Ein Datensatz ist in diesem Fall dann zum Beispiel eine Internetseite oder Web-Seite. Durch eine Spracherkennungseinrichtung der Bedienvorrichtung wird in der Spracheingabe des Benutzers, d. h. in dessen Sprachsignal, zumindest ein Schlüsselwort erkannt, welches den jeweiligen Zieldatensatz identifiziert. Beispielsweise kann die Spracheingabe lauten: Nachrichten zur aktuellen Automobilausstellung. Dies sind dann zum Beispiel zwei Schlüsselwörter, nämlich Nachrichten und Automobilausstellung. Anhand des zumindest einen erkannten Schlüsselworts wird dann der Zieldatensatz bei der Datenquelle identifiziert und angefordert. Beispielsweise kann durch die Bedienvorrichtung also eine Internetseite heruntergeladen werden, auf welcher z. B. Nachrichten zu der Automobilausstellung stehen. Während das Wort Nachrichten ein allgemeines Wort ist, das man der Bedienvorrichtung schon bei deren Herstellung in das Erkennungsvokabular speichern könnte, sind Datensätze mit aktuellen Themen, wie zum Beispiel die Automobilausstellung, nur vorübergehend in der Datenquelle enthalten. Deshalb ist beim Erzeugen des Erkennungsvokabulars nicht klar, welche Datensätze möglicherweise die Datenquelle aufweisen wird und welche zugehörigen Schlüsselworte bereitzustellen sind.
  • Um dennoch auch einen aktuell bereitgestellten Datensatz als Zieldatensatz mittels zumindest eine Schlüsselworts identifizieren oder auswählen oder angeben zu können, sieht das erfindungsgemäße Verfahren Folgendes vor. Zu vorbestimmten Zeitpunkten wählt eine Überwachungseinrichtung in den Datensätzen, die zu dem jeweiligen Zeitpunkt von der Datenquelle bereitgestellt werden, jeweils gemäß einer vorbestimmten Auswahlvorschrift zumindest ein in dem jeweiligen Datensatz enthaltenes Schlüsselwort aus. Mit anderen Worten sammelt die Überwachungseinrichtung in den Datensätzen der Datenquelle Schlüsselworte, die auf Grundlage der Auswahlvorschrift ausgewählt werden. Alle aus den Datensätzen ausgewählten Schlüsselwörter werden zu einem Ergänzungsvokabular zusammengefasst. Das Ergänzungsvokabular wird dem Erkennungsvokabular der Spracherkennungseinrichtung hinzugefügt. Das Erkennungsvokabular enthält somit diejenigen Schlüsselwörter, welche die aktuell in der Datenquelle bereitgestellten Datensätze zu dem jeweiligen Zeitpunkt beschreiben oder identifizieren. Somit stellt das Schlüsselwort also einen Sprachbefehl dar, der im Erkennungsvokabular enthalten ist und von der Spracherkennungseinrichtung in einer Spracheingabe erkannt werden kann. Natürlich kann zu jedem Schlüsselwort auch eine Verknüpfung zu dem zugehörigen Datensatz, in welchem das Schlüsselwort gefunden oder ausgewählt wurde, gespeichert werden, also z. B. ein URL (Uniform Resource Locator). Somit kann bei erkanntem Schlüsselwort der zugehörige Datensatz in der Datenquelle identifiziert und angefordert werden.
  • Durch die Erfindung ergibt sich der Vorteil, dass die Bedienvorrichtung Schlüsselwörter in ihrem Erkennungsvokabular bereitstellt, die mit der Zeit an die in der Datenquelle bereitgestellten Datensätze angepasst sind oder angepasst werden. Somit kann ein Benutzer auch Schlüsselworte, die aktuelle Datensätze beschreiben und zuvor nicht im Erkennungsvokabular enthalten waren, in einer Spracheingabe benützen oder aussprechen und diese können dann durch die Erkennungseinrichtung auf Grundlage des angepassten Erkennungsvokabulars erkannt werden.
  • Zu der Erfindung gehören auch optionale Weiterbildungen, durch deren Merkmale sich zusätzliche Vorteile ergeben.
  • Bevorzugt werden zumindest einige der Schlüsselwörter aus dem Ergänzungsvokabular jeweils als Einzelkommando des Erkennungsvokabulars erzeugt. Bei Erkennen des Einzelkommandos wird dann der dadurch identifizierte Zieldatensatz abgerufen. Dies kann in der beschriebenen Weise geschehen, indem zu dem Schlüsselwort oder Einzelkommando eine Verknüpfung zum Identifizieren des Zieldatensatzes gespeichert wird, wie zum Beispiel ein Internet-Link oder eine Internet-Adresse. Das Einzelkommando weist dabei den Vorteil auf, dass mit einem einzigen, bekannten Schlüsselwort sofort das Anfordern des zugehörigen Datensatzes ausgelöst werden kann.
  • Das Erkennungsvokabular kann aber zusätzlich oder alternativ dazu auch ein Stützvokabular aufweisen, welches Befehlsphrasen mit austauschbaren Schlüsselwörtern umfasst. Eine solche Befehlsphrase kann zum Beispiel lauten: Zeige die Nachrichten zu X an. In dieser Befehlsphrase ist X ein austauschbares Schlüsselwort. Mittels des Ergänzungsvokabulars können dann diese Schlüsselwörter für die Befehlsphrasen bereitgestellt werden. So kann zum Beispiel als Schlüsselwort eingefügt werden: Europameisterschaft, Automobilausstellung, Computermesse. Diese Weiterbildung weist den Vorteil auf, dass das Ergänzungsvokabular nur eine geringe Anzahl von Schlüsselwörtern umfassen muss und dennoch eine natürlich-sprachliche Bedienung auf der Grundlage von Befehlsphrasen oder Sätzen ermöglicht ist.
  • Um aus einem Datensatz Schlüsselworte zu extrahieren oder auszuwählen, ist insbesondere vorgesehen, dass die Auswahlvorschrift durch einen Schlüsselwort-Generator umgesetzt wird. Ein solcher Schlüsselwortgenerator wählt aus einem Datensatz nicht jedes Wort aus, zum Beispiel nur Worte einer bestimmten Klasse, zum Beispiel Substantive. Zusätzlich oder alternativ dazu kann vorgesehen sein, dass nur solche Wörter ausgewählt werden, die mit einer vorbestimmten Mindesthäufigkeit in dem Datensatz enthalten sind. Ein Schlüsselwortgenerator kann zum Beispiel auf der Grundlage des eHITS-Algorithmus oder des TermsNet-Algorithmus gebildet sein. Solche Algorithmen bieten eine Auswahlvorschrift, die sich beim Erzeugen aussagekräftiger oder zum Identifizieren eines Datensatzes geeigneter Schlüsselwörter bewährt haben.
  • Wie bereits ausgeführt, ist insbesondere vorgesehen, dass als Datenquelle das Internet abgefragt wird und dort als Datensätze Internetseiten oder Webseiten abgefragt oder heruntergeladen werden.
  • Ist nun der zumindest eine Zieldatensatz angefordert, so ist bevorzugt vorgesehen, dass in Abhängigkeit von dem zumindest einen Zieldatensatz ein Anzeigeinhalt einer Ausgabeeinrichtung gesteuert wird. Die Bedienvorrichtung zeigt also den zumindest einen Zieldatensatz einem Benutzer an. Handelt es sich bei einem Zieldatensatz um eine Internetseite oder Webseite, so kann diese zum Beispiel mittels eines Browsers gerendert und angezeigt werden.
  • Die beschriebene Überwachungseinrichtung kann zum Beispiel auf der Grundlage einer Prozessoreinrichtung gebildet sein, welche ein entsprechendes Programmmodul zum Durchführen der Schritte der Überwachungseinrichtung aufweist. Die Überwachungseinrichtung kann dabei zumindest teilweise durch die Bedienvorrichtung bereitgestellt sein. Dies weist den Vorteil auf, dass die Bedienvorrichtung selbständig ihr Erkennungsvokabular an die in der Datenquelle bereitgestellten Datensätze anpassen kann.
  • Zusätzlich oder alternativ dazu kann vorgesehen sein, dass die Überwachungseinrichtung zumindest teilweise durch eine Servervorrichtung des Internets bereitgestellt wird und hierbei von mehreren Bedienvorrichtungen der genannten Art genutzt wird. Dies weist den Vorteil auf, dass die Servervorrichtung dauerhaft mit der Datenquelle kommunizieren kann, während zum Beispiel eine Bedienvorrichtung abgeschaltet sein kann. Zudem kann die Überwachungseinrichtung für mehrere Bedienvorrichtungen genutzt werden. Die Servervorrichtung kann zum Beispiel auf der Grundlage eines Computers oder mehrerer Computer gebildet sein.
  • Es ist auch eine Kombination der beschriebenen Ausführungsformen möglich, dass nämlich die Überwachungseinrichtung verteilt sowohl in der Bedienvorrichtung als auch in der Servervorrichtung des Internets bereitgestellt wird. Hier sind entsprechende Programmmodule für die Bedienvorrichtung und die Servervorrichtung bereitzustellen.
  • Zu der Erfindung gehört auch entsprechend eine Bedienvorrichtung, die mittels des erfindungsgemäßen Verfahrens betrieben wird. Die Bedienvorrichtung ist also zum Anfordern zumindest eines Zieldatensatzes aus einer Datenquelle mittels Sprachbedienung vorgesehen. Die Bedienvorrichtung weist dabei eine Kommunikationseinrichtung zum Aussenden eines Anforderungssignals an die Datenquelle und zum Empfangen des zumindest einen Zieldatensatzes aus der Datenquelle auf. Die Kommunikationseinrichtung kann hierzu zum Beispiel ein Mobilfunkmodul und/oder ein WLAN-Funkmodul (WLAN – Wireless local area network) aufweisen. Die Bedienvorrichtung weist des Weiteren eine Prozessoreinrichtung auf, die dazu eingerichtet ist, eine Ausführungsform des erfindungsgemäßen Verfahrens durchzuführen. Die Prozessoreinrichtung kann hierzu zumindest einen Mikroprozessor und/oder zumindest einen Mikrocontroller aufweisen. Die Prozessoreinrichtung kann einen Programmcode aufweisen, der dazu eingerichtet ist, bei Ausführen durch die Prozessoreinrichtung eine Ausführungsform des erfindungsgemäßen Verfahrens durchzuführen. Der Programmcode kann in einem Datenspeicher der Prozessoreinrichtung gespeichert sein.
  • Bevorzugt ist vorgesehen, dass die erfindungsgemäße Bedienvorrichtung in einem Kraftfahrzeug bereitgestellt ist. Entsprechend umfasst die Erfindung auch ein Kraftfahrzeug mit einer Ausführungsform der erfindungsgemäßen Bedienvorrichtung. Das erfindungsgemäße Kraftfahrzeug ist bevorzugt als Kraftwagen, insbesondere als Personenkraftwagen, ausgestaltet.
  • Im Folgenden ist ein Ausführungsbeispiel der Erfindung beschrieben. Hierzu zeigt die einzige Figur (Fig.) Eine schematische Darstellung einer Ausführungsform des erfindungsgemäßen Kraftfahrzeugs.
  • Bei dem im Folgenden erläuterten Ausführungsbeispiel handelt es sich um eine bevorzugte Ausführungsform der Erfindung. Bei dem Ausführungsbeispiel stellen die beschriebenen Komponenten der Ausführungsform jeweils einzelne, unabhängig voneinander zu betrachtende Merkmale der Erfindung dar, welche die Erfindung jeweils auch unabhängig voneinander weiterbilden und damit auch einzeln oder in einer anderen als der gezeigten Kombination als Bestandteil der Erfindung anzusehen sind. Des Weiteren ist die beschriebene Ausführungsform auch durch weitere der bereits beschriebenen Merkmale der Erfindung ergänzbar.
  • In der Figur ist ein Kraftfahrzeug 10 dargestellt, bei dem es sich zum Beispiel um einen Kraftwagen, insbesondere einen Personenkraftwagen, handeln kann. Das Kraftfahrzeug 10 kann eine Bedienvorrichtung 11 aufweisen, die zum Beispiel als Steuergerät des Kraftfahrzeugs 10 ausgestaltet sein kann. Mittels der Steuervorrichtung 11 kann eine Sprachbedienung in dem Kraftfahrzeug 10 bereitgestellt sein, mittels welcher ein Benutzer (nicht dargestellt) Online-Datendienste 12 zum Beispiel des Internets 13 bedienen kann. Der Benutzer kann hierzu einen Sprachbefehl 14 in dem Kraftfahrzeug 10 aussprechen, der von einer Mikrofonanordnung 15 erfasst werden kann. Die Mikrofonanordnung 15 kann zum Beispiel eines oder mehrere Mikrofone umfassen. Der erfasste Sprachschall des Sprachbefehls 14 kann als Spracheingabe 16 an einen automatischen Spracherkenner 17 (ASR) als Eingangssignal übertragen werden. Der Spracherkenner 17 kann zum Beispiel auf der Grundlage eines Programmmoduls der Bedienvorrichtung 11 bereitgestellt sein. Der Spracherkenner 17 kann die Spracheingabe 16 auf der Grundlage eines Erkennungsvokabulars 18 in an sich bekannter Weise zum Beispiel auf der Grundlage von Hidden-Markov-Modellen (HMMs) dahingehend untersuchen, welchen Online-Dienst 12 der Benutzer mittels der Spracheingabe 16 aufrufen möchte. Der Spracherkenner 17 und das Erkennungsvokabular 18 repräsentieren eine Spracherkennungsrichtung des Kraftfahrzeugs 10.
  • In Abhängigkeit von zumindest einem Schlüsselwort 19, das in der Spracheingabe 16 enthalten ist, kann der Spracherkenner 17 einen Steuerbefehl 20 für zum Beispiel einen Internetbrowser 21 erzeugen, wobei der Steuerbefehl 20 zum Beispiel angibt, welche Internetadresse der Internetbrowser 21 laden soll. Durch den Internetbrowser 21 kann entsprechend durch Angabe einer Internetadresse oder eines Internet-Links 22 über eine Kommunikationseinrichtung COM des Kraftfahrzeugs 10 und eine Schnittstelle 23, welche die Kommunikationseinrichtung COM mit dem Internet 13 verbindet, die herunterzuladende Internetseite 24 identifiziert werden. Der Internet-Link 22 repräsentiert ein Anforderungssignal. Die Internetseite 24 stellt einen Zieldatensatz dar, zum Beispiel eine HTML-Datei. Das Interface 23 kann zum Beispiel eine Luftschnittstelle umfassen, also eine Funkverbindung, über welche das Kraftfahrzeug 10 in an sich bekannter Weise mit dem Internet 13 gekoppelt werden kann. Die heruntergeladene Internetseite 24 kann zum Beispiel durch den Internetbrowser 21 auf einer Anzeigeeinrichtung 25, zum Beispiel einem Bildschirm in einer Mittelkonsole des Kraftfahrzeugs 10, dargestellt werden, sodass ein Anzeigeinhalt 26 der Internetseite 24 für den Benutzer angezeigt oder sichtbar wird. Der Anzeigeinhalt 26 kann z. B. ein Text sein.
  • Die Datendienste 12 präsentieren ihre Anzeigeinhalte 26 durch Internetseiten 24. Damit der Benutzer einen Sprachbefehl 14 aussprechen kann, welcher eine der Internetseiten 24 eindeutig identifiziert, muss in dem Erkennungsvokabular 18 der Anzeigeinhalt 26 durch entsprechende Schlüsselwörter 27 repräsentiert oder identifiziert sein. Da sich der Anzeigeinhalt 26 der Internetseite 24 im Laufe der Zeit, zum Beispiel täglich oder wöchentlich, ändert, muss entsprechend auch die Sammlung der Schlüsselwörter 27 im Erkennungsvokabular 18 angepasst werden. Dies kann bei dem Kraftfahrzeug 10 in einer ersten Variante V1 in der folgenden Weise geschehen. Das Internet 13 stellt eine Datenquelle dar, in welcher mehrere, mit der Zeit veränderliche Datensätze, nämlich die Internetseiten 24, enthalten sind. In der Bedienvorrichtung 11 kann ein Schlüsselwort-Generator 28 bereitgestellt sein, welcher aus dem Internet 13 die Internetseiten 24 zu vorbestimmten Zeitpunkten abfragt, ohne dass der Benutzer die Internetseiten 24 tatsächlich anschauen oder lesen möchte. Der Schlüsselwortgenerator 28 erfasst in den Anzeigeinhalten 26 der Internetseiten 24 die darin enthaltenen Terme oder Schlüsselwörter, welcher zu Beschreibung des jeweiligen Textes der Internetseite 24 geeignet ist. Beispielsweise kann eine Internetseite 24 mit Nachrichten nach konkreten Themen durchsucht werden, wie zum Beispiel Bundeskanzlerwahl oder Fußballverein. Dazu können zum Beispiel bereits existierende Verfahren oder Algorithmen, wie eHITS oder TermsNet genutzt werden. Diese Schlüsselwortgenerierung oder Keyword-Generierung kann durch den Schlüsselwort-Generator 28 durchgeführt werden. Der Schlüsselwortgenerator 28 kann zum Beispiel auf der Grundlage eines Programmmoduls für die Bedienvorrichtung 11 gebildet sein.
  • Die ermittelten Schlüsselwörter können als Ergänzungsvokabular 29 dem Erkennungsvokabular 18 zugeführt werden. Sie stellen dann die aktuellen Schlüsselwörter 27 dar. Mit den Schlüsselwörtern 27 aus dem Erkennungsvokabular 18 können dann zum Beispiel direkt Bedienbefehle gebildet werden oder es können die Schlüsselwörter 27 als dynamische Daten für Befehlsphrasen 30 verwendet werden, z. B. Standardbefehle, wie zum Beispiel: Ich möchte Neuigkeiten zu X. Hier kann dann der Begriff X durch jeweils eines der Schlüsselwörter 27 ersetzt werden.
  • So kann der Spracherkenner 17 einen Steuerbefehl 20 aus einem Sprachbefehl 14 erzeugen, der Schlüsselwörter enthält, die zu Beginn bei Herstellung der Bedienvorrichtung 11 nicht verfügbar waren, sondern erst durch die zeitlich veränderlichen Anzeigeinhalte 26 der Internetseiten 24 vorhanden sind.
  • Bei einer zweiten Variante V2 ist ein Schlüsselwortgenerator 28' nicht im Kraftfahrzeug 10 durch die Bedienvorrichtung 11, sondern durch eine Servervorrichtung 31 bereitgestellt. Die Variante V2 kann zusätzlich oder alternativ zur Variante V1 bereitgestellt sein. Die Servervorrichtung 31 kann zum Beispiel ein Computer oder eine Recheneinrichtung sein, die ebenfalls über das Internet für das Kraftfahrzeug 10 verfügbar gemacht sein kann. Durch die Servervorrichtung 31 kann ebenfalls ein Schlüsselwort-Generator 28' bereitgestellt sein, der durch eine Recheneinrichtung 32 der Servervorrichtung 31 betrieben werden kann. Der Schlüsselwortgenerator 28' kann ein Ergänzungsvokabular 18' erzeugen, das dem Spracherkenner 17 des Kraftfahrzeugs 10 ebenfalls zur Verfügung gestellt werden kann. Hierzu kann das Ergänzungsvokabular 18' zum Beispiel über eine Funkverbindung von der Servervorrichtung 31 in das Kraftfahrzeug 10 übertragen werden.
  • Die Schlüsselwortgeneratoren 28 und 28' repräsentieren somit jeweils eine Überwachungseinrichtung.
  • Mit beiden Varianten V1, V2 können somit Inhalte von Online-Diensten 12 in regelmäßigen Abständen vom Kraftfahrzeug 10 (V1) oder einem weiteren Online-Dienst der Servervorrichtung 31 (V2) analysiert werden. Dabei kann je Anzeigeinhalt 26 zumindest ein Schlüsselwort oder Term, welcher zur Beschreibung des Anzeigeinhalts 26 geeignet ist, für eine spätere Sprachbarmachung des Online-Dienstes 12 generiert werden und als Ergänzungsvokabular 29 oder in dem externen Ergänzungsvokabular 18' dem Spracherkennungssystem mit dem Spracherkenner 17 des Kraftfahrzeugs 10 zugeführt werden.
  • Mit beiden Varianten V1, V2 können beispielsweise Nachrichten nach konkreten Themen, wie Bundeskanzlerwahl oder FC Bayern München durchsucht werden und der Benutzer erhält schneller und komfortabler und sicherer die gewünschten Informationen, als wenn er nur allgemeine Sprachbefehle, wie zum Beispiel „Nachrichten”, aussprechen könnte und dann die Suche nach der konkreten Internetseite 24 manuell durchführen müsste.
  • Im Prinzip wird somit der Inhalt jedes Online-Dienstes periodisch abgefragt und einem Verfahren zur Generierung von Schlüsselwörtern oder Keywords unterzogen. Die Schlüsselwörter sollen dabei in der Lage sein, den Inhalt des Textes zu repräsentieren (beispielsweise sind denkbare Schlüsselwörter für einen Text über Smartphones die folgenden: Android, Apple). Dazu können zum Beispiel bereits existierende Verfahren wie eHITS oder Terms Net genutzt werden. Diese Schlüsselwortgenerierung kann sowohl direkt auf dem Kraftfahrzeug (V1) oder auch in einer Servervorrichtung 31 eines angebundenen Datendienstes stattfinden. Die extrahierten Schlüsselwörter werden anschließend dem Spracherkenner 17 des Kraftfahrzeugs 10 als sprechbare Kommandos oder Kommandoergänzungen zugeführt, sodass ein Benutzer beispielsweise das Kommando: „Ich möchte alle Nachrichten zur Gesundheitsreform hören” sagen kann.
  • Insgesamt zeigt das Beispiel, wie durch die Erfindung mittels Sprachbedienung abrufbare Online-Informationen im Fahrzeug bereitgestellt werden können.
  • ZITATE ENTHALTEN IN DER BESCHREIBUNG
  • Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.
  • Zitierte Patentliteratur
    • DE 102004027286 A1 [0003]
    • EP 2180293 A2 [0004]
    • JP 2007257134 A [0005]

Claims (10)

  1. Verfahren zum Konfigurieren einer Bedienvorrichtung (11), um durch die Bedienvorrichtung (11) in Abhängigkeit von einer Spracheingabe (16) eines Benutzers aus einer Datenquelle (13), welche mit der Zeit wechselnde Datensätze (24) bereitstellt, zumindest einen der aktuell bereitgestellten Datensätze (24) als jeweiligen Zieldatensatz (24) anzufordern, wobei durch eine Spracherkennungseinrichtung (17) der Bedienvorrichtung (10) zumindest ein den jeweiligen Zieldatensatz (24) identifizierendes Schlüsselwort (27) in der Spracheingabe (16) erkannt wird und anhand des zumindest einen erkannten Schlüsselworts (27) der Zieldatensatz (24) bei der Datenquelle (13) identifiziert und angefordert wird, dadurch gekennzeichnet, dass zu vorbestimmten Zeitpunkten eine Überwachungseinrichtung (28, 28') in den zu dem jeweiligen Zeitpunkt von der Datenquelle (13) bereitgestellten Datensätzen (24) jeweils zumindest ein in dem Datensatz (24) enthaltenes Schlüsselwort (27) gemäß einer vorbestimmten Auswahlvorschrift auswählt und alle aus den Datensätzen (24) ausgewählten Schlüsselwörter (27) zu einem Ergänzungsvokabular (18', 29) zusammenfasst und mittels des Ergänzungsvokabulars (18', 29) ein Erkennungsvokabular (18) der Spracherkennungseinrichtung (17) ergänzt.
  2. Verfahren nach Anspruch 1, wobei zumindest einige der Schlüsselwörter (27) aus dem Ergänzungsvokabular (18', 29) jeweils als ein Einzelkommando des Erkennungsvokabulars (18) erzeugt werden und bei Erkennen des Einzelkommandos der dadurch identifizierte Zieldatensatz (24) abgerufen wird.
  3. Verfahren nach einem der vorhergehenden Ansprüche, wobei das Erkennungsvokabular (18) ein Stützvokabular aufweist, welches Befehlsphrasen (30) mit austauschbaren Schlüsselwörtern umfasst, und mittels des Ergänzungsvokabulars (18, 18') die Schlüsselwörter für die Befehlsphrasen (30) bereitgestellt werden.
  4. Verfahren nach einem der vorhergehenden Ansprüche, wobei die Auswahlvorschrift durch einen Schlüsselwort-Generator (28, 28'), insbesondere auf der Grundlage des eHITS-Algorithmus oder des TermsNet-Algorithmus, bereitgestellt wird.
  5. Verfahren nach einem der vorhergehenden Ansprüche, wobei als Datenquelle (13) das Internet mit Webseiten als Datensätzen (24) abgefragt wird.
  6. Verfahren nach einem der vorhergehenden Ansprüche, wobei in Abhängigkeit von dem zumindest einen Zieldatensatz (24) ein Anzeigeinhalt (26) einer Ausgabeeinrichtung (25) gesteuert wird.
  7. Verfahren nach einem der vorhergehenden Ansprüche, wobei die Überwachungseinrichtung (28) zumindest teilweise durch die Bedienvorrichtung (11) bereitgestellt wird.
  8. Verfahren nach einem der vorhergehenden Ansprüche, wobei die Überwachungseinrichtung (28') zumindest teilweise durch eine Servervorrichtung (31) des Internets (13) für mehrere Bedienvorrichtungen (11) der genannten Art bereitgestellt wird.
  9. Bedienvorrichtung (11) zum Anfordern zumindest eines Zieldatensatzes (24) aus einer Datenquelle (13) mittels Sprachsteuerung, wobei die Bedienvorrichtung (11) eine Kommunikationseinrichtung (COM) zum Aussenden eines Anforderungssignals (22) an die Datenquelle (13) und zum Empfangen des zumindest eines Zieldatensatzes (24) aus der Datenquelle (13) aufweist, dadurch gekennzeichnet, dass die Bedienvorrichtung (11) eine Prozessoreinrichtung aufweist, die dazu eingerichtet ist, ein Verfahren nach einem der Ansprüche 1 bis 7 durchzuführen.
  10. Kraftfahrzeug (10) mit einer Bedienvorrichtung (11) nach Anspruch 9.
DE102016008862.1A 2016-07-20 2016-07-20 Verfahren zum Konfigurieren einer sprachgesteuerten Bedienvorrichtung, Bedienvorrichtung mit Sprachsteuerung und Kraftfahrzeug Pending DE102016008862A1 (de)

Priority Applications (2)

Application Number Priority Date Filing Date Title
DE102016008862.1A DE102016008862A1 (de) 2016-07-20 2016-07-20 Verfahren zum Konfigurieren einer sprachgesteuerten Bedienvorrichtung, Bedienvorrichtung mit Sprachsteuerung und Kraftfahrzeug
PCT/EP2017/061589 WO2018015041A1 (de) 2016-07-20 2017-05-15 Verfahren zum konfigurieren einer sprachgesteuerten bedienvorrichtung, bedienvorrichtung mit sprachsteuerung und kraftfahrzeug

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE102016008862.1A DE102016008862A1 (de) 2016-07-20 2016-07-20 Verfahren zum Konfigurieren einer sprachgesteuerten Bedienvorrichtung, Bedienvorrichtung mit Sprachsteuerung und Kraftfahrzeug

Publications (1)

Publication Number Publication Date
DE102016008862A1 true DE102016008862A1 (de) 2018-01-25

Family

ID=59014567

Family Applications (1)

Application Number Title Priority Date Filing Date
DE102016008862.1A Pending DE102016008862A1 (de) 2016-07-20 2016-07-20 Verfahren zum Konfigurieren einer sprachgesteuerten Bedienvorrichtung, Bedienvorrichtung mit Sprachsteuerung und Kraftfahrzeug

Country Status (2)

Country Link
DE (1) DE102016008862A1 (de)
WO (1) WO2018015041A1 (de)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3480815A1 (de) * 2017-11-06 2019-05-08 Audi Ag Sprachsteuerung für ein fahrzeug
CN113335205A (zh) * 2021-06-09 2021-09-03 东风柳州汽车有限公司 语音唤醒方法、装置、设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102004027286A1 (de) 2003-06-06 2004-12-30 Mitsubishi Denki K.K. Automatisches Musikauswahlsystem in Mobileinheit
US6922733B1 (en) * 1999-06-30 2005-07-26 International Business Machines Corporation Method for coordinating visual and speech web browsers
JP2007257134A (ja) 2006-03-22 2007-10-04 Mitsubishi Electric Corp 音声検索装置、音声検索方法および音声検索プログラム
EP2180293A2 (de) 2008-10-20 2010-04-28 Nissan Motor Manufacturing (UK) Ltd. Verbesserungen bei Navigationssystemen

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9779722B2 (en) * 2013-11-05 2017-10-03 GM Global Technology Operations LLC System for adapting speech recognition vocabulary

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6922733B1 (en) * 1999-06-30 2005-07-26 International Business Machines Corporation Method for coordinating visual and speech web browsers
DE102004027286A1 (de) 2003-06-06 2004-12-30 Mitsubishi Denki K.K. Automatisches Musikauswahlsystem in Mobileinheit
JP2007257134A (ja) 2006-03-22 2007-10-04 Mitsubishi Electric Corp 音声検索装置、音声検索方法および音声検索プログラム
EP2180293A2 (de) 2008-10-20 2010-04-28 Nissan Motor Manufacturing (UK) Ltd. Verbesserungen bei Navigationssystemen

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
LAENDER, Alberto HF, et al. A brief survey of web data extraction tools. ACM Sigmod Record, 2002, 31. Jg., Nr. 2, S. 84-93. doi: 10.1145/565117.565137 *
SHAO, Zhiyan; CAPRA, Robert; PÉREZ-QUIÑONES, Manuel A. Transcoding HTML to VoiceXML using annotation. In: Tools with Artificial Intelligence, 2003. Proceedings. 15th IEEE International Conference on. IEEE, 2003. S. 249-258. doi: 10.1109/TAI.2003.1250198 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3480815A1 (de) * 2017-11-06 2019-05-08 Audi Ag Sprachsteuerung für ein fahrzeug
DE102017219616A1 (de) * 2017-11-06 2019-05-09 Audi Ag Sprachsteuerung für ein Fahrzeug
US10854201B2 (en) 2017-11-06 2020-12-01 Audi Ag Voice control for a vehicle
DE102017219616B4 (de) 2017-11-06 2022-06-30 Audi Ag Sprachsteuerung für ein Fahrzeug
CN113335205A (zh) * 2021-06-09 2021-09-03 东风柳州汽车有限公司 语音唤醒方法、装置、设备及存储介质
CN113335205B (zh) * 2021-06-09 2022-06-03 东风柳州汽车有限公司 语音唤醒方法、装置、设备及存储介质

Also Published As

Publication number Publication date
WO2018015041A1 (de) 2018-01-25

Similar Documents

Publication Publication Date Title
DE112014006614B4 (de) Benutzerschnittstellensystem, Benutzerschnittstellensteuereinrichtung, Benutzerschnittstellensteuerverfahren und Benutzerschnittstellensteuerprogramm
DE102009017177B4 (de) Spracherkennungsanordnung und Verfahren zur akustischen Bedienung einer Funktion eines Kraftfahrzeuges
DE102014109122A1 (de) Systeme und Verfahren für ergebnisbezogene Arbitrierung in Sprachdialogsystemen
EP1071075B1 (de) Verfahren und Vorrichtung zur Eingabe von Daten
DE102018113034A1 (de) Stimmenerkennungssystem und stimmenerkennungsverfahren zum analysieren eines befehls, welcher mehrere absichten hat
EP1721245B1 (de) Verfahren zur auswahl eines listeneintrags und informations- oder unterhaltungssystem, insbesondere für kraftfahrzeuge
DE102006029251B4 (de) Verfahren und System für einen Telefonbuchtransfer
DE102017219616B4 (de) Sprachsteuerung für ein Fahrzeug
EP2815396B1 (de) Verfahren zum phonetisieren einer datenliste und sprachgesteuerte benutzerschnittstelle
EP2567194A1 (de) Verfahren und vorrichtung zum betreiben einer nutzerschnittstelle
DE102015121098A1 (de) Multimodale Antwort auf eine Multimodale Suche
EP3152753B1 (de) Assistenzsystem, das mittels spracheingaben steuerbar ist, mit einer funktionseinrichtung und mehreren spracherkennungsmodulen
DE102016008862A1 (de) Verfahren zum Konfigurieren einer sprachgesteuerten Bedienvorrichtung, Bedienvorrichtung mit Sprachsteuerung und Kraftfahrzeug
DE60125597T2 (de) Vorrichtung für die Dienstleistungsvermittlung
DE102017211447B4 (de) Verfahren zum Auswählen eines Listeneintrags aus einer Auswahlliste einer Bedienvorrichtung mittels Sprachbedienung sowie Bedienvorrichtung
EP1321851B1 (de) Verfahren und System zum Nutzen von vom Nutzer frei zu wählenden Markierungsnamen als Einsprungposition in die Menustruktur eines Sprach-Dialogsystems
DE102006051331A1 (de) Verfahren zur Auswahl eines Fahrziels
DE102018130754A1 (de) Nahtloser berater-eingriff
DE102013223972A1 (de) Systemweite Suche in Fahrerinformationssystemen
DE102009058151B4 (de) Verfahren zum Betreiben eines Sprachdialogsystems mit semantischer Bewertung und Sprachdialogsystem dazu
EP3576084B1 (de) Effiziente dialoggestaltung
DE102016216200A1 (de) Verfahren für Fahrzeuge
DE102008025532B4 (de) Kommunikationssystem und Verfahren zum Durchführen einer Kommunikation zwischen einem Nutzer und einer Kommunikationseinrichtung
DE102019131886A1 (de) Verfahren zum Betreiben eines Kommunikationsassistenten
DE102016004287A1 (de) Verfahren zur Spracherkennung in einem Kraftfahrzeug

Legal Events

Date Code Title Description
R012 Request for examination validly filed
R016 Response to examination communication
R079 Amendment of ipc main class

Free format text: PREVIOUS MAIN CLASS: G06F0017200000

Ipc: G06F0040000000

R082 Change of representative

Representative=s name: HOFSTETTER, SCHURACK & PARTNER - PATENT- UND R, DE