DE102009024693B4

DE102009024693B4 - Infotainmentsystem für ein Fahrzeug und Verfahren zum Darstellen von Informationen

Info

Publication number: DE102009024693B4
Application number: DE102009024693.2A
Authority: DE
Inventors: Dr. Neugebauer Moritz; Gordon SEITZ
Original assignee: Volkswagen AG
Current assignee: Volkswagen AG
Priority date: 2009-06-12
Filing date: 2009-06-12
Publication date: 2019-07-11
Anticipated expiration: 2029-06-13
Also published as: DE102009024693A1

Abstract

Infotainmentsystem für ein Fahrzeug, wobei das Infotainmentsystem ein Spracherkennungssystem zum Umwandeln von Sprachbefehlen in Teilmengen von Textelementen und eine Ausgabeeinrichtung zur visuellen Darstellung von Informationen umfasst, wobei Bildelemente (6a - 6g, 12a - 12d, 15a - 15c) vorgesehen sind, die mit den Teilmengen verknüpft sind und auf der Ausgabeeinrichtung dargestellt werden, dadurch gekennzeichnet, dass das Spracherkennungssystem ausgebildet ist, zu einem Sprachbefehl eine Mehrzahl von Teilmengen bereitzustellen, wobei jeder Teilmenge eine Erkennungswahrscheinlichkeit zugeordnet ist und die Art der Darstellung der mit der Mehrzahl der Teilmengen verknüpften Bildelemente (6a - 6g, 12a - 12d, 15a - 15c) in Abhängigkeit der Erkennungswahrscheinlichkeit der jeweils verknüpften Teilmenge erfolgt.

Description

Die Erfindung betrifft ein Infotainmentsystem mit den Merkmalen des Oberbegriffs von Anspruch 1. Die Erfindung betrifft ferner ein Verfahren zum Darstellen von Informationen sowie ein Fahrzeug mit einem Infotainmentsystem.
Unter einem Infotainmentsystem wird ein elektronisches System für ein Fahrzeug (Landfahrzeug, Luftfahrzeug, Wasserfahrzeug) verstanden, bei dem einem Benutzer eine Eingabe- und/oder Auswahlmöglichkeit angeboten wird. Hierzu zählen insbesondere: Radiosysteme, CD-Systeme (CD, Compact Disc), TV-Systeme und Internetsysteme; Navigationssysteme; Kommunikationssysteme, wie z.B. Telefonsysteme; Bordinformationssysteme, wie z.B. für diverse Komfortfunktionen. Das Infotainmentsystem kann auch mehrere der vorgenannten Systeme umfassen, zwischen denen umgeschaltet werden kann.
Es ist bekannt, mit Hilfe der menschlichen Sprache steuernd auf ein elektronisches System einzuwirken. Die DE 10 2007 016 296 A1 offenbart ein Navigationsgerät mit einem Spracherkennungssystem. Ein Benutzer spricht den Namen einer Straße aus, und das Spracherkennungssystem versucht, den Straßennamen zu erkennen. Wird der Straßenname erkannt, erfolgt die Ausgabe des Straßennamens auf einem Display.
In der DE 103 13 222 A1 wird ebenfalls eine Navigationseinrichtung beschrieben, bei der ein Fahrziel mittels einer Spracheingabe erfolgen kann, wobei für den Fall, dass eine Ortsnamenszuordnung mehrdeutig ist, zur Auswahl des jeweiligen Ortes eine graphische Anzeige zur Unterscheidung der jeweiligen Orte gleichen Namens dargestellt wird. Ein ähnliches Verfahren wird auch in der nachveröffentlichten DE 10 2008 008 948 A1 offenbart.
Die Wahrnehmung der auf dem Display ausgegebenen Texte (etwa die erwähnten Straßennamen) ist dann nicht einfach, wenn sich der Benutzer auf etwas anderes konzentrieren muss, insbesondere der Fahrer eines Kraftfahrzeuges auf den Straßenverkehr.
Aufgabe der vorliegenden Erfindung ist es, dem Benutzer eines Fahrzeugs Informationen in einer übersichtlichen und schnell erfassbaren Art dargestellt werden.
Die Aufgabe wird durch ein Infotainmentsystem mit den Merkmalen von Anspruch 1, einem Verfahren mit den Merkmalen von Anspruch 2 sowie einem Fahrzeug mit den Merkmalen von Anspruch 3 gelöst.
Weitere Ausführungsformen sind in den Unteransprüchen dargestellt.
Das vorgestellte Infotainmentsystem umfasst ein Spracherkennungssystem zum Umwandeln von Sprachbefehlen in Teilmengen von Textelementen.
Sprachbefehle sind gesprochene Buchstaben, Zahlen, Symbole, Wörter und Wortfolgen.
Textelemente sind Buchstaben, Zahlen, Symbole, Wörter und Wortfolgen in Textform. Die Textelemente sind zweckmäßig in einer Datenbank in einer geeigneten Speichereinrichtung - zum Beispiel Festplatte, ROM (Read Only Memory), CD (Compact Disc), DVD (Digital Versatile Disc), USB-Datenträger (Universal Serial Bus) - gespeichert. Diese Datenbank wird auch als Wörterbuch oder Vokabular des Spracherkennungssystems bezeichnet.
Teilmengen von Textelementen sind Mengen mit wenigstens einem Textelement.
Das Infotainmentsystem umfasst weiter eine Ausgabeeinrichtung zur visuellen Darstellung von Informationen. Als Ausgabeeinrichtung kommt beispielsweise ein Flüssigkristallbildschirm (LCD, Liquid Crystal Display; TFT-Display, Thin Film Transistor) in Betracht.
Es sind weiter Bildelemente vorgesehen. Ein Bildelement umfasst mindestens eine Bilddatei. Die Bildelemente sind zweckmäßig in einer Datenbank in einer geeigneten Speichereinrichtung gespeichert. Die Bildelemente können in derselben Datenbank wie die Textelemente gespeichert sein oder in einer separaten Datenbank. Die separate Datenbank kann in derselben Speichereinrichtung wie die Datenbank der Textelemente oder in einer separaten Speichereinrichtung gespeichert sein.
Jedes Bildelement ist mit mindestens einer Teilmenge verknüpft. Über die Verknüpfung lässt sich zu einer Teilmenge ein Bildelement bestimmen, das auf der Ausgabeeinrichtung ausgegeben dargestellt wird. Die Darstellung des Bildelementes kann anstelle der Ausgabe der Teilmenge oder zusätzlich zu der Ausgabe der Teilmenge erfolgen.
Das vorgeschlagene Infotainmentsystem präsentiert dem Benutzer Informationen in einer Bilddarstellung. Die Bilddarstellung hat den Vorteil, dass sie einfacher und schneller von dem Benutzer zu erfassen ist. Insbesondere für den Fahrer eines Fahrzeugs ist es wichtig, für ihn nützliche oder notwendige Informationen schnell und einfach zu erfassen, damit seine Aufmerksamkeit nicht von dem Verkehrsgeschehen abgelenkt wird. Das vorgeschlagene Infotainmentsystem fördert damit die Sicherheit des Verkehrs.
Gemäß einem weiteren Aspekt ist das Spracherkennungssystem ausgebildet, zu einem Sprachbefehl eine Mehrzahl von Teilmengen bereitzustellen, wobei jeder Teilmenge eine Erkennungswahrscheinlichkeit (sogenanntes Konfidenzmaß) zugeordnet ist. Spracherkennungssysteme basieren auf statistischen Modellen, um Sprachbefehle in ihren Vokabularen zu identifizieren. Das Spracherkennungssystem ordnet einem Sprachbefehl nur mit einer bestimmten Erkennungswahrscheinlichkeit eine Teilmenge zu. Wird beispielsweise ein Schwellenwert für eine Erkennungswahrscheinlichkeit vorgegeben, oberhalb der ein Sprachbefehl als erkannt gilt, kann es - beispielsweise aufgrund von undeutlicher Aussprache oder Mehrdeutigkeit - vorkommen, dass mehrere Teilmengen mit ihren Erkennungswahrscheinlichkeiten oberhalb dieses Schwellenwertes liegen und als erkannt gelten. Diese erkannten Teilmengen können in einer Trefferliste zusammengefasst und nach ihren Erkennungswahrscheinlichkeiten geordnet werden.
Gemäß einem weiteren Aspekt sind die mit der Mehrzahl der Teilmengen verknüpften Bildelemente auf der Ausgabeeinrichtung darstellbar. Dabei können die Bildelemente gleichzeitig auf der Ausgabeeinrichtung dargestellt werden. Können nicht alle Bildelemente gleichzeitig dargestellt werden, etwa weil es zu viele sind, so können sie beispielsweise über eine sogenannte Scroll- oder Bildlaufleiste nacheinander darstellbar sein. Nacheinander umfasst sowohl die Darstellung jeweils eines einzigen Bildelementes als auch die teilweise gleichzeitige Darstellung mehrerer Bildelemente.
Gemäß einem weiteren Aspekt erfolgt die Art der Darstellung der Bildelemente in Abhängigkeit ihrer Erkennungswahrscheinlichkeiten. Unter der Art der Darstellung wird jede optisch wahrnehmbare Ausdrucksform verstanden, beispielsweise die Größe einer grafischen Darstellung, die Farbgestaltung, Rahmen, Schattierungen oder eine blinkende Darstellung.
Die Erfindung wird anhand der beiden in den folgenden Figuren dargestellten Ausführungsbeispiele näher erläutert.
Es zeigen:

1 und 2 zwei Darstellungen auf einer Ausgabeeinrichtung eines Musikplayers, und
3 bis 6 vier Darstellungen auf einer Ausgabeeinrichtung eines Navigationssystems.

1 zeigt ein Display 1 als Ausgabeeinrichtung. Das Display 1 ist in zwei Bildschirmbereiche 2a, 2b aufgeteilt. Auf dem Bildschirmbereich 2b ist ein Teil einer Benutzungsoberfläche eines als Musikplayer ausgebildeten Infotainmentsystems dargestellt. Auf dem Bildschirmbereich 2a wird als weitere Information eine Fahrzeuginnentemperatur angezeigt.
Bei dem Display 1 handelt es sich um ein Touchscreen Display. In einer Zeile 3 sind 6 Schaltflächen 4a, 4b, 4c, 4d, 4e, 4f angeordnet. Im Bereich dieser Schaltflächen 4a, 4b, 4c, 4d, 4e, 4f ist das Display 1 berührungssensitiv ausgebildet, wodurch ein Benutzer durch Berühren des Displays 1 einzelne dieser Schaltflächen 4a, 4b, 4c, 4d, 4e, 4f auswählen kann. Über die Auswahl einer Schaltfläche 4a, 4b, 4c, 4d, 4e, 4f wird dem Musikplayer ein Befehl gegeben. Berührt der Benutzer beispielsweise die Schaltfläche 4c, so springt der Musikplayer zu einem nächsten Musiktitel aus einer Liste mit mehreren Musiktiteln. Mit der Schaltfläche 4b kann der Benutzer das Abspielen eines Musiktitels unterbrechen (sogenannte Pausetaste).
Unterhalb der Zeile 3 ist auf dem Display 1 ein Informationsfenster 5 dargestellt. In dem Informationsfenster sind - zumindest teilweise - sieben Bildelemente 6a, 6b, 6c, 6d, 6e, 6f, 6g wiedergegeben. Die Bildelemente 6a, 6b, 6c, 6d, 6e, 6f, 6g sind grafische Darstellungen der Albencover von Musikalben. Die Albencover sind jeweils mit einer Teilmenge von Textelementen verknüpft. Vorliegend besteht eine Teilmenge aus dem Namen eines Albums. Die Albencover sind in 1 alphabetisch von links nach rechts angeordnet. Das Album zum Bild 6f hat den Titel „Feist“.
Unterhalb der Bildelemente 6a, 6b, 6c, 6d, 6e, 6f, 6g wird ein Titel eines aktuell ausgewählten Musiktitels angezeigt, hier der Musiktitel „Square One“. Unterhalb des Musiktitels ist eine Abspielfortschrittszeile 7 dargestellt, anhand der die Gesamtdauer des aktuellen Musiktitels und die bereits abgespielte Zeit des Musiktitels angezeigt werden. Diese Darstellungen erfolgen sowohl durch zahlenmäßige Zeitangaben als auch in grafischer Darstellung (hier als Fortschrittbalken 8).
Unterhalb der Abspielfortschrittsanzeige 7 ist eine Schaltfläche 9 angeordnet, über die der Benutzer in ein Menü des Musikplayers wechseln kann. Die Schaltfläche 9 wird über einen berührungssensitiven Bereich des Displays 1 aktiviert.
Eine Sprechblase 10 lässt erkennen, dass der Benutzer das Wort „Feist“ ausgesprochen hat.
Ein eingeblendetes Mikrophon 11 zeigt an, dass eine Spracherkennung aktiviert ist, so dass das gesprochene Wort „Feist“ aufgenommen worden ist und verarbeitet wird.
2 zeigt den Musikplayer aus 1 zu einem Zeitpunkt, nachdem der Benutzer das Wort „Feist“ ausgesprochen hat. Ein Spracherkennungssystem ermittelt mit Hilfe statistischer Methoden, die beispielsweise Hidden-Markov-Modelle anwenden, Teilmengen von Textelementen, die in einem Vokabular gespeichert sind. In diesem Beispiel werden insbesondere Teilmengen berücksichtigt, die jeweils eine Informationseinheit repräsentieren, da der Sprachbefehl aus genau einem Wort besteht. Das Spracherkennungssystem bestimmt diejenigen Teilmengen, deren Erkennungswahrscheinlichkeiten oberhalb eines vordefinierten Schwellenwertes liegen. Diese Teilmengen bilden eine Trefferliste. Die Teilmengen der Trefferliste werden nach ihrer Erkennungswahrscheinlichkeit sortiert. Die Teilmenge mit der höchsten Erkennungswahrscheinlichkeit besteht aus dem Wort „Feist“ und hat eine Erkennungswahrscheinlichkeit von 87%. Die zweitgrößte Erkennungswahrscheinlichkeit beträgt 77%, die drittgrößte 64% und die viertgrößte 59%, um nur einige Erkennungswahrscheinlichkeiten beispielhaft zu nennen.
Nachdem die Trefferliste bestimmt worden ist, werden diejenigen Bildelemente 12a, 12b, 12c, 12d ermittelt, die mit den Teilmengen der Trefferliste verknüpft sind. Beispielsweise ist das Bildelement 12a mit der Teilmenge „Feist“ verknüpft.
Anschließend werden die Bildelemente 12a, 12b, 12c, 12d (und weitere Bilder, auf die nicht eingegangen wird) auf dem Display 1 dargestellt. Das Bildelement 12a wird horizontal zentriert dargestellt und ist größer als die Bildelement 12b, 12c, 12d. Zudem hat es einen Rahmen. Durch diese hervorgehobene Art der Darstellung ist das Bildelement 12a auch bei nur flüchtigem Hinsehen schnell zu erkennen. Die Bildelemente 12b, 12c, 12d werden mit abnehmender Erkennungswahrscheinlichkeit abwechselnd links und rechts neben dem Bild 12a dargestellt.
In den 3 bis 6 wird ein erfindungsgemäßes Infotainmentsystem anhand eines Navigationssystems erläutert.
Das Infotainmentsystem umfasst ein Navigationssystem und wenigstens ein weiteres System.
Der Benutzer wählt über einen Hardkey des Infotainmentsystems einen Kontext „Navigation“ aus, wodurch er in das Navigationssystem gelangt.
3 zeigt einen Kartenausschnitt einer digitalen Karte auf einem Display 13.
Der Benutzer aktiviert über einen Dreh-/Drücksteller, Touchscreen oder Hardkey eine Spracheingabe. Die erfolgte Aktivierung wird in 4 durch ein eingeblendetes Mikrophon 14 angezeigt.
Daraufhin gibt der Benutzer einen Sprachbefehl, der aus der gesprochenen Wortfolge „Ingolstadt Regensburger Straße“ besteht.
Die Wörter „Ingolstadt“, „Regensburger“ und „Straße“ sind als Textelemente in dem Vokabular des Spracherkennungssystems enthalten.
Das Spracherkennungssystem erkennt die Wörter „Ingolstadt“ und „Straße“ mit eindeutigen Erkennungswahrscheinlichkeiten. Das Wort „Regensburger“ wird nicht eindeutig erkannt. Das Spracherkennungssystem erkennt auch das Wort „Manchinger“ und die Wortverbindung „Auto-Union“ mit signifikanten Erkennungswahrscheinlichkeiten.
Das Spracherkennungssystem ist ferner ausgebildet, die Wörter semantisch zu ordnen: das Wort „Ingolstadt“ wird als Ortsangabe interpretiert; die Wörter „Regensburger“, „Manchinger“, „Auto-Union“ und „Straße“ werden als die drei Treffer „Regensburger Straße“, „Manchinger Straße“ und „Auto-Union Straße“ als Straßennamen interpretiert. Jeder Treffer bildet eine Teilmenge von Textelementen.
5 zeigt, dass die drei Treffer „Regensburger Straße“, „Manchinger Straße“ und „Auto-Union Straße“ jeweils mit einem Bildelement 15a, 15b, 15c verknüpft sind. Da es sich hier jeweils um Straßennamen handelt, sind die Bildelemente 15a, 15b, 15c gleich gestaltet. Jedes Bildelement 15a, 15b, 15c enthält eine grafische Markierung 16, in diesem Fall eine Stecknadel.
Die Bildelemente der drei Treffer werden in der Karte auf dem Display 13 dargestellt. Die Platzierung der Bildelemente erfolgt derart, dass die Stecknadel 16 eines Straßennamens an einer repräsentativen geographischen Position dieser Straße in der Karte steckt. Jedes Bildelement enthält eine Zahl „1“, „2“ oder „3“, die ein Maß für die Erkennungswahrscheinlichkeit angibt. In diesem Beispiel hat „Regensburger Straße“ die höchste, „Manchinger Straße“ die zweithöchste und „Auto-Union Straße“ die geringste Erkennungswahrscheinlichkeit dieser drei Straßen. Deshalb erhält die „Regensburger Straße“ die Zahl „1“, „Manchinger Straße“ die Zahl „2“ und „Auto-Union Straße“ die Zahl „3“.
Der Benutzer kann diese drei grafisch dargestellten Straßen und die Rangordnung der Erkennungswahrscheinlichkeit schnell erfassen. Er wählt die Straße „Regensburger Straße“ aus den drei angezeigten Treffern aus. Dies erfolgt beispielsweise über einen Dreh/Drücksteller, ein Touchscreen oder eine Spracheingabe. Bei einer Spracheingabe reicht etwa die Angabe des Erkennungsranges, hier also eine der Zahlen „1“, „2“ oder „3“.
6 zeigt die Auswahl „Regensburger Straße“ durch farbliche Änderung des Stecknadelkopfes dieser Straße.
Das Navigationssystem übernimmt die „Regensburger Straße“ als Zielstraße und berechnet eine Route zu diesem Ziel.
Bezugszeichenliste

1: Display
2a, 2b: Bildschirmbereich
3: Zeile
4a - 4f: Schaltflächen
5: Informationsfenster
6a - 6g: Bildelemente
7: Abspielfortschrittsanzeige
8: Fortschrittsbalken
9: Schaltfläche
10: Sprechblase
11: Mikrophon
12a - 12d: Bildelemente
13: Display
14: Mikrophon
15a - 15c: Bildelemente
16: Stecknadel

Claims

Infotainmentsystem für ein Fahrzeug, wobei das Infotainmentsystem ein Spracherkennungssystem zum Umwandeln von Sprachbefehlen in Teilmengen von Textelementen und eine Ausgabeeinrichtung zur visuellen Darstellung von Informationen umfasst, wobei Bildelemente (6a - 6g, 12a - 12d, 15a - 15c) vorgesehen sind, die mit den Teilmengen verknüpft sind und auf der Ausgabeeinrichtung dargestellt werden, dadurch gekennzeichnet, dass das Spracherkennungssystem ausgebildet ist, zu einem Sprachbefehl eine Mehrzahl von Teilmengen bereitzustellen, wobei jeder Teilmenge eine Erkennungswahrscheinlichkeit zugeordnet ist und die Art der Darstellung der mit der Mehrzahl der Teilmengen verknüpften Bildelemente (6a - 6g, 12a - 12d, 15a - 15c) in Abhängigkeit der Erkennungswahrscheinlichkeit der jeweils verknüpften Teilmenge erfolgt.
Verfahren zum Darstellen von Informationen auf einer Ausgabeeinrichtung eines Infotainmentsystems nach Anspruch 1 mit den Schritten: Umwandeln eines Sprachbefehls in eine Teilmenge von Textelementen; Verknüpfen der Teilmenge mit einem Bildelement (6a - 6g, 12a - 12d, 15a - 15c); Ausgeben des mit der Teilmenge verknüpften Bildelementes (6a - 6g, 12a - 12d, 15a - 15c) auf der Ausgabeeinrichtung, dadurch gekennzeichnet, dass zu einem Sprachbefehl eine Mehrzahl von Teilmengen bereitgestellt wird, wobei jeder Teilmenge eine Erkennungswahrscheinlichkeit zugeordnet wird und die Art der Darstellung der mit der Mehrzahl der Teilmengen verknüpften Bildelemente (6a - 6g, 12a - 12d, 15a - 15c) in Abhängigkeit der Erkennungswahrscheinlichkeit der jeweils verknüpften Teilmenge erfolgt.
Fahrzeug, das ein Infotainmentsystem nach Anspruch 1 aufweist oder eingerichtet ist, ein Verfahren gemäß Anspruch 2 auszuführen.