DE102010040818B4 - Gefühlsansprechendes Beratungssystem zur Verwendung durch einen oder mehrere Insassen eines Kraftfahrzeugs - Google Patents

Gefühlsansprechendes Beratungssystem zur Verwendung durch einen oder mehrere Insassen eines Kraftfahrzeugs Download PDF

Info

Publication number
DE102010040818B4
DE102010040818B4 DE102010040818.2A DE102010040818A DE102010040818B4 DE 102010040818 B4 DE102010040818 B4 DE 102010040818B4 DE 102010040818 A DE102010040818 A DE 102010040818A DE 102010040818 B4 DE102010040818 B4 DE 102010040818B4
Authority
DE
Germany
Prior art keywords
avatar
responsive
audio
computer
occupant
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
DE102010040818.2A
Other languages
English (en)
Other versions
DE102010040818A1 (de
Inventor
Perry Robinson MacNeille
Oleg Yurievitch Gusikhin
Kacie Alane Theisen
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ford Global Technologies LLC
Original Assignee
Ford Global Technologies LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ford Global Technologies LLC filed Critical Ford Global Technologies LLC
Publication of DE102010040818A1 publication Critical patent/DE102010040818A1/de
Application granted granted Critical
Publication of DE102010040818B4 publication Critical patent/DE102010040818B4/de
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60KARRANGEMENT OR MOUNTING OF PROPULSION UNITS OR OF TRANSMISSIONS IN VEHICLES; ARRANGEMENT OR MOUNTING OF PLURAL DIVERSE PRIME-MOVERS IN VEHICLES; AUXILIARY DRIVES FOR VEHICLES; INSTRUMENTATION OR DASHBOARDS FOR VEHICLES; ARRANGEMENTS IN CONNECTION WITH COOLING, AIR INTAKE, GAS EXHAUST OR FUEL SUPPLY OF PROPULSION UNITS IN VEHICLES
    • B60K35/00Instruments specially adapted for vehicles; Arrangement of instruments in or on vehicles
    • B60K35/10Input arrangements, i.e. from user to vehicle, associated with vehicle functions or specially adapted therefor
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60KARRANGEMENT OR MOUNTING OF PROPULSION UNITS OR OF TRANSMISSIONS IN VEHICLES; ARRANGEMENT OR MOUNTING OF PLURAL DIVERSE PRIME-MOVERS IN VEHICLES; AUXILIARY DRIVES FOR VEHICLES; INSTRUMENTATION OR DASHBOARDS FOR VEHICLES; ARRANGEMENTS IN CONNECTION WITH COOLING, AIR INTAKE, GAS EXHAUST OR FUEL SUPPLY OF PROPULSION UNITS IN VEHICLES
    • B60K2360/00Indexing scheme associated with groups B60K35/00 or B60K37/00 relating to details of instruments or dashboards
    • B60K2360/11Instrument graphical user interfaces or menu aspects
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60KARRANGEMENT OR MOUNTING OF PROPULSION UNITS OR OF TRANSMISSIONS IN VEHICLES; ARRANGEMENT OR MOUNTING OF PLURAL DIVERSE PRIME-MOVERS IN VEHICLES; AUXILIARY DRIVES FOR VEHICLES; INSTRUMENTATION OR DASHBOARDS FOR VEHICLES; ARRANGEMENTS IN CONNECTION WITH COOLING, AIR INTAKE, GAS EXHAUST OR FUEL SUPPLY OF PROPULSION UNITS IN VEHICLES
    • B60K2360/00Indexing scheme associated with groups B60K35/00 or B60K37/00 relating to details of instruments or dashboards
    • B60K2360/148Instrument input by voice
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/226Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
    • G10L2015/228Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of application context
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed
    • G10L2021/02166Microphone arrays; Beamforming

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Chemical & Material Sciences (AREA)
  • Combustion & Propulsion (AREA)
  • Transportation (AREA)
  • Mechanical Engineering (AREA)
  • Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

Gefühlsansprechendes Beratungssystem zur Verwendung durch einen oder mehrere Insassen (12) eines Kraftfahrzeugs (14), wobei das System Folgendes umfasst: ein gerichtetes Lautsprecherarray (32); und einen Computer (20), der für Folgendes ausgelegt ist: – Empfangen von Eingaben, die einen Betriebszustand des Fahrzeugs angeben, und Eingaben, die einen emotionalen Zustand eines Insassen angeben, – Erzeugen (i) von Daten, die einen Avatar mit einem Aussehen repräsentieren, und (ii) Daten, die eine gesprochene Aussage für den Avatar mit mindestens einem Sprachcharakteristikum repräsentieren, wobei das Aussehen und das mindestens eine Sprachcharakteristikum dem Insassen einen simulierten emotionalen Zustand des Avatars übermitteln, wobei sich der simulierte emotionale Zustand nach dem Betriebszustand des Fahrzeugs und/oder dem emotionalen Zustand des Insassen (12) richtet, – Ausgeben der den Avatar repräsentierenden Daten zur visuellen Anzeige, – Bestimmen einer Audiorichtung und – Ausgeben der die Aussage für den Avatar repräsentierenden Daten zur Audiowiedergabe auf dem gerichteten Lautsprecherarray (32) dergestalt, dass das Audio von dem gerichteten Lautsprecherarray (32) in die bestimmte Audiorichtung gerichtet wird.

Description

  • ALLGEMEINER STAND DER TECHNIK
  • 1. Technisches Gebiet
  • Die Erfindung betrifft ein gefühlsansprechendes Beratungssystem (EAS – Emotive Advisory System) zur Verwendung durch einen oder mehrere Insassen eines Kraftfahrzeugs.
  • 2. Stand der Technik
  • Das Fahrzeugarmaturenbrett wird immer komplexer. Wenn neue Systeme hinzugefügt und existierende Systeme komplexer werden, besteht zusätzliche Konkurrenz um Platz auf dem Armaturenbrett und die Steuerelemente sind immer schwieriger zu verwenden. Neue Systeme umfassen Navigationssysteme, MP3-Player, freihändigen Mobilfunk und Satellitenradio; dagegen sind ältere Systeme, die komplexer werden, FM-AM-Radio, HVAC (Heizung, Ventilation und Klimaanlage), Fahrzeugbeleuchtung und Kraftübertragungs-Steuerelemente.
  • Es besteht zunehmend ein Trend weg von herkömmlichen Steuerelementen zu menschlichen Schnittstellen zur Verwaltung dieser Komplexität. Bei einem Ansatz werden mehrere Schnittstellen in einem Kraftfahrzeug in einem gefühlsansprechenden Beratungssystem (EAS) zu einer einzigen Schnittstelle konsolidiert.
  • Im Allgemeinen übermittelt das gefühlsansprechende Beratungssystem (EAS) für das Kraftfahrzeug Informationen gefühlsansprechend zu einem Insassen. Das System empfängt Eingaben, die einen Betriebszustand des Fahrzeugs angeben, transformiert die Eingaben in Daten, die einen simulierten emotionalen Zustand repräsentieren, und erzeugt Daten, die einen Avatar repräsentieren, der den simulierten emotionalen Zustand ausdrückt. Der Avatar kann angezeigt werden. Das System kann eine Anfrage von dem Insassen bezüglich des emotionalen Zustands des Avatars empfangen und auf die Anfrage reagieren. Ein beispielhaftes gefühlsansprechendes Beratungssystem und –verfahren werden in der US-Pub. Nr. 2008/0269958 A1 beschrieben.
  • Systeme wie EAS können alle diese Steuerelemente zu einer einzigen Schnittstelle konsolidieren, die außerdem für die Insassen ansprechender ist und neue Aussichten für eine Fahrzeugpersönlichkeit eröffnet. Sprach-/Avatar-orientierte Systeme wie EAS weisen jedoch auch neue Anforderungen auf. Sie benötigen in das Fahrzeug eingebaute Mikrofone, die es ihnen erlauben, zu hören, was die Insassen in dem Fahrzeug sagen, und zu wissen, von wo aus sie sprechen; und Lautsprecher, die denselben Eindruck von Direktionalität wie ein menschlicher Sprecher geben.
  • Ein anderer Aspekt des Beschallungssystems ist die Erzeugung von Schall, der wie die Stimme eines Menschen scheint und mit der Position des Avatars mit Bezug auf Objekte in dem wiedergegebenen Raum, Emotion, Prosodie, Aussprache und Gestik vereinbar ist. Die Aufgabe des Beschallungssystems besteht darin, es so klingen zu lassen, als ob sich der Avatar tatsächlich in dem Fahrzeug befindet und zu den Insassen spricht. Hierdurch ermöglicht es, Dialog zu entwickeln, der annimmt, dass der Avatar menschlich ist, wodurch die Insassen den Avatar höflich behandeln und in einer natürlichen Sprache zu ihm sprechen. Dies vergrößert seinerseits die Erkennungsrate und hilft dabei, eine emotionale Bindung zwischen dem Avatar und den Fahrzeuginsassen zu entwickeln.
  • Das EAS muss außerdem mehrere Stimmen verwenden. Es ist für den Zuhörer hilfreich, wenn sich diese Stimmen an verschiedenen Orten in dem Fahrzeug befinden. Wenn zum Beispiel die Nachrichten gelesen werden, kann die Stimme nützlich sein, um die Nachrichten von dem Avatar zu entkörpern. Hintergrundinformationen finden sich in der US-Pub. Nr. 2008/0269958 A1 .
  • Die US-2009/0063154 A1 betrifft ein emotionsbasiertes Informationssystem für den Benutzer eines Kraftfahrzeugs mit einem Computer, der konfiguriert ist, Informationen zu empfangen, die eine emotionale Befindlichkeit des Benutzers erkennen lassen, sowie Informationen über einen Betriebszustand des Kraftfahrzeugs zu empfangen, um Daten zu generieren, die eine simulierte emotionale Befindlichkeit, basierend auf zumindest einem Teil der empfangenen Informationen, repräsentieren.
  • Die DE 10345679 A1 betrifft eine Anordnung zur akustischen Navigation, wobei ein Navigationssystem vorgesehen ist, das über eine Positionsermittlungseinheit verfügt, Eingabemittel aufweist und einen Navigationsrechner umfasst, der eine Route von der augenblicklichen Position zur Zielposition unter Zuhilfenahme von in einer Datenbasis abgelegten Landkartendaten zu berechnen
  • KURZDARSTELLUNG
  • Bei einer Ausführungsform der Erfindung wird ein gefühlsansprechendes Beratungssystem zur Verwendung durch einen oder mehrere Insassen eines Kraftfahrzeugs bereitgestellt. Das System umfasst ein gerichtetes Lautsprecherarray und einen Computer. Der Computer ist dafür ausgelegt, Eingaben, die einen Betriebszustand des Fahrzeugs angeben, und Eingaben, die einen emotionalen Zustand eines Insassen angeben, zu empfangen. Der Computer ist ferner dafür ausgelegt Folgendes zu erzeugen: (i) Daten, die einen Avatar mit einem Aussehen repräsentieren, und (ii) Daten, die eine gesprochene Aussage für den Avatar mit mindestens einem Sprachcharakteristikum repräsentieren. Das Aussehen und das mindestens eine Sprachcharakteristikum übermitteln dem Insassen einen simulierten emotionalen Zustand des Avatars. Der simulierte emotionale Zustand richtet sich nach dem Betriebszustand des Fahrzeugs und/oder dem emotionalen Zustand des Insassen. Der Computer ist ferner dafür ausgelegt, die den Avatar repräsentierenden Daten zur visuellen Anzeige auszugeben und eine Audiorichtung zu bestimmen. Der Computer ist ferner dafür ausgelegt, die die Aussage für den Avatar repräsentierenden Daten für Audiowiedergabe auf dem gerichteten Lautsprecherarray dergestalt auszugeben, dass das Audio von dem gerichteten Lautsprecherarray in die bestimmte Audiorichtung gerichtet wird.
  • Es versteht sich, dass das gerichtete Lautsprecherarray abhängig von der Implementierung auf vielfältige verschiedene Weisen implementiert werden kann. Bei einem in Betracht gezogenen Ansatz umfasst das gerichtete Lautsprecherarray eine Beschallungsschiene, die eine Vielzahl von Lautsprechern umfasst.
  • Auf einem detaillierteren Niveau umschließt die Erfindung verschiedene zusätzliche Merkmale. Jedes beliebige oder mehrere dieser verschiedenen Merkmale können in verschiedenen Implementierungen der Erfindung verwendet werden. Zum Beispiel kann das System eine Schnittstelle natürlicher Sprache zum Empfangen von Eingaben in Form von natürlicher Sprache umfassen.
  • Bei einem anderen Beispiel kann das System eine Anzeigeeinrichtung umfassen. Der Computer ist dafür ausgelegt, die den Avatar repräsentieren den Daten zur visuellen Anzeige auf der Anzeigeeinrichtung dergestalt auszugeben, dass die Avatarorientierung der Audiorichtung entspricht. Das gerichtete Lautsprecherarray kann sich in der Nähe der Anzeigeeinrichtung befinden, so dass das Audio von dem gerichteten Lautsprecherarray dem Insassen von dem Avatar zu kommen scheint.
  • Der Computer kann dafür ausgelegt sein, die Audiorichtung so zu bestimmen, dass die Audiorichtung und die entsprechende Avatarorientierung das Audio und einen Blick des Avatars auf einen bestimmten Insassen richten, der angesprochen wird. Der Computer kann dafür ausgelegt sein, die Audiorichtung so zu bestimmen, dass die Audiorichtung und die entsprechende Avatarorientierung eine Emotion ausdrücken, indem nach unten geschaut und der Insasse angesprochen oder nach oben geschaut und der Insasse angesprochen wird. Der Computer kann dafür ausgelegt sein, die Audiorichtung so zu bestimmen, dass die Audiorichtung und die entsprechende Avatarorientierung die Aufmerksamkeit auf ein Objekt lenken, indem das Audio und ein Blick des Avatars auf das Objekt gerichtet werden.
  • In einem anderen Aspekt können Ausführungsformen der Erfindung eine Vielzahl von Mikrofonen umfassen. Der Computer kann dafür ausgelegt sein, einen Insassen, der spricht, zu lokalisieren. Genauer gesagt kann der Computer dafür ausgelegt sein, die Audiorichtung so zu bestimmen, dass die Audiorichtung das Audio auf den lokalisierten Insassen richtet.
  • KURZE BESCHREIBUNG DER ZEICHNUNGEN
  • 1 ist ein Blockdiagramm eines gefühlsansprechenden Beratungssystems für ein Kraftfahrzeug in einer Ausführungsform;
  • 2 zeigt ein gefühlsansprechendes Beratungssystem für ein Kraftfahrzeug mit einem gerichteten Lautsprecherarray;
  • 3 ist ein Blockdiagramm, das den Betrieb eines gefühlsansprechenden Beratungssystems in einer Ausführungsform der Erfindung veranschaulicht;
  • 4 ist ein Blockdiagramm, das ausführlichere Aspekte des Betriebs des gefühlsansprechenden Beratungssystems weiter veranschaulicht;
  • 5 ist ein Blockdiagramm, das ausführlichere Aspekte des Betriebs des gefühlsansprechenden Beratungssystems weiter veranschaulicht; und
  • 6 ist ein Blockdiagramm, das eine Kalibrationstechnik für ein Kanalmodell in dem gefühlsansprechenden Beratungssystem veranschaulicht.
  • AUSFÜHRLICHE BESCHREIBUNG
  • Ausführungsformen der Erfindung umschließen ein gefühlsansprechendes Beratungssystem (EAS) zur Verwendung durch einen oder mehrere Insassen eines Kraftfahrzeugs. Bei einem Ansatz zur Implementierung des Systems werden verschiedene Fahrzeugschnittstellen in dem Kraftfahrzeug in dem gefühlsansprechenden Beratungssystem (EAS) zu einer einzigen Schnittstelle konsolidiert.
  • Im Allgemeinen übermittelt das gefühlsansprechende Beratungssystem (EAS) für das Kraftfahrzeug Informationen einem Insassen auf gefühlsansprechende Weise. Das System empfängt Eingaben, die einen Betriebszustand des Fahrzeugs angeben, transformiert die Angaben in Daten, die einen simulierten emotionalen Zustand repräsentieren, und erzeugt Daten, die einen Avatar repräsentieren, der den simulierten emotionalen Zustand ausdrückt. Der Avatar kann angezeigt werden. Das System kann eine Anfrage von dem Insassen bezüglich des emotionalen Zustands des Avatars empfangen und auf die Anfrage reagieren. Ein beispielhaftes gefühlsansprechendes Beratungssystem und –verfahren wird in der US-Pub. Nr. 2008/0269958 A1 beschrieben.
  • Wie in 1 gezeigt, hilft eine Ausführungsform eines gefühlsansprechenden Beratungssystems (EAS) 10 einem Insassen/Benutzer 12 eines Fahrzeugs 14 beim Betrieb des Fahrzeugs 14 und beim Zugriff auf von dem Fahrzeug 14 abgesetzte Informationsquellen 16a, 16b, 16c, wie zum Beispiel Webserver usw., über ein Netzwerk 17. Natürlich können innerhalb des Kontextes einer beliebigen Art von Einrichtung und/oder Maschine andere Ausführungsformen des EAS 10 implementiert werden. Zum Beispiel kann das EAS 10 mit einem Haushaltsgerät, einem Handdatenverarbeitungsgerät usw. einhergehen. Bestimmte Ausführungsformen des EAS 10 können als ein integriertes Modul implementiert werden, das mit einer anderen Einrichtung und/oder Maschine gedockt werden kann. Ein Benutzer kann somit sein EAS 10 mit sich führen und es als Schnittstelle mit Einrichtungen und/oder Maschinen, mit denen er in Dialog treten möchte, verwenden. Es sind auch andere Konfigurationen und Anordnungen möglich.
  • Bei der Ausführungsform von 1 detektieren Sensoren 18 durch den Insassen 12 erzeugte Eingaben und setzen diese in digitale Informationen für einen Computer 20 um. Der Computer 20 empfängt diese Eingaben sowie Eingaben von den Informationsquellen 16a, 16b, 16c und Fahrzeugsystemen 22. Der Computer 20 verarbeitet diese Eingaben und erzeugt Ausgaben für mindestens eine der folgenden Alternativen: den Insassen 12, die Informationsquellen 16a, 16b, 16c und Fahrzeugsysteme 22. Aktoren/Ausgänge usw. 24 setzen die Ausgaben für den Insassen 12 aus einem digitalen Format in ein Format um, das von dem Insassen 12 wahrgenommen werden kann, wie zum Beispiel visuell, hörbar, tastend, haptisch usw.
  • Der Insasse 12 kann bei bestimmten Ausführungsformen durch gesprochenen Dialog mit dem EAS 10 kommunizieren, der Diskursregeln (z.B. die Maximen von Grice) befolgt. Zum Beispiel kann der Insasse 12 fragen „Gibt es gute Restaurants in der Nähe?“. Als Reaktion kann das EAS 10 entsprechende Informationsquellen 16a, 16b, 16c abfragen und zusammen mit geografischen Ortsinformationen von den Fahrzeugsystemen 22 eine Liste von gut bewerteten Restaurants in der Nähe des aktuellen Orts des Fahrzeugs 14 bestimmen. Das EAS 10 kann mit dem folgenden simulierten Dialog antworten: „Es gibt einige wenige. Möchten Sie die Liste hören?“ Eine bejahende Antwort von dem Insassen 12 kann bewirken, dass das EAS 10 die Liste liest.
  • Der Insasse 12 kann dem EAS 10 auch befehlen, bestimmte mit den Fahrzeugsystemen 22 assoziierte Parameter zu ändern. Zum Beispiel kann der Insasse 12 aussagen „Mir ist heute nach schnell fahren“. Als Reaktion kann das EAS 10 fragen „Möchten Sie, dass die Kraftübertragung für Performance-Fahren optimiert wird?“. Eine bejahende Reaktion von dem Insassen 12 kann bewirken, dass das EAS 10 Motor-Tuningparameter für verbesserte Performance ändert.
  • Bei bestimmten Ausführungsformen kann der gesprochene Dialog mit dem EAS 10 ohne Betätigung jeglicher Tasten oder anderweitige physische Eingabe in das EAS 10 eingeleitet werden. Diese Funktionalität des offenen Mikrofons ermöglicht es dem Insassen 12 ein Gespräch mit dem EAS 10 genauso einzuleiten, wie der Insasse 12 ein Gespräch mit einem anderen Insassen des Fahrzeugs 14 einleiten würde.
  • Der Insasse 12 kann dem EAS 10 auch „ins Wort fallen“, während es spricht. Zum Beispiel kann der Insasse 12, während das EAS 10 die obenerwähnte Liste von Restaurants liest, einwerfen: „Sag mir mehr über Restaurant X“. Als Reaktion kann das EAS 10 mit dem Lesen der Liste aufhören und entsprechende Informationsquellen 16a, 16b, 16c abfragen, um zusätzliche Informationen bezüglich des Restaurants X zu sammeln. Das EAS 10 kann dann die zusätzlichen Informationen dem Insassen 12 vorlesen.
  • Bei bestimmten Ausführungsformen umfassen die Aktoren/Ausgänge 24 einen Bildschirm, der selektiv einen Avatar anzeigt. Der Avatar kann eine grafische Repräsentation eines Menschen, eines Tiers, einer Maschine, einer Pflanze, eines Fahrzeugs usw. sein und kann Merkmale wie zum Beispiel ein Gesicht usw. umfassen, die in der Lage sind, visuell Emotion zu übermitteln. Der Avatar kann von der Sicht verborgen werden, wenn zum Beispiel eine Geschwindigkeit des Fahrzeugs 14 größer als eine Schwelle ist, die vom Hersteller oder vom Benutzer definiert werden kann. Die Stimme des Avatars kann jedoch weiter zu hören sein. Natürlich kann jede beliebige geeignete Art von Anzeigetechnologie verwendet werden, wie zum Beispiel eine holografische oder Head-Up-Anzeige.
  • Der simulierte menschliche emotionale Zustand des Avatars kann sich nach vielfältigen verschiedenen Kriterien richten, darunter ein geschätzter emotionaler Zustand des Insassen 12, ein Zustand des Fahrzeugs 14 und/oder die Qualität, mit der das EAS 10 eine Aufgabe ausführt usw. Zum Beispiel können die Sensoren 18 Kopfbewegungen, Sprachprosodie, biometrische Informationen usw. des Insassen 12 detektieren, die, wenn sie durch den Computer 20 verarbeitet werden, anzeigen, dass der Insasse 12 verärgert ist. Bei einer beispielhaften Reaktion kann das EAS 10 den Dialog, den es mit dem Insassen 12 einleitet, begrenzen oder unterbrechen, während der Insasse 12 verärgert ist. Bei einer anderen beispielhaften Reaktion kann der Avatar in blauen Farbtönen mit einem besorgten Gesichtsausdruck wiedergegeben werden und kann in einer ruhigen Stimme fragen „Ärgert Sie etwas?“. Wenn der Insasse 12 reagiert, indem er „Wegen dieses Verkehrs komm ich wahrscheinlich zu spät zur Arbeit“ sagt, kann der Avatar fragen „Soll ich eine schnellere Route finden?“ oder „Soll ich jemanden anrufen?“. Wenn der Insasse 12 reagiert, indem er „Nein. Es gibt keinen anderen Weg...“ sagt, kann der Avatar fragen „Möchten Sie etwas klassische Musik hören?“. Der Insasse 12 kann antworten „Nein. Aber kannst du mir etwas über die bevorstehenden Wahlen sagen?“. Als Reaktion kann das EAS 10 die entsprechenden Informationsquellen 16a, 16b, 16c abfragen, um die neuesten Nachrichten über die Wahlen zu sammeln. Während der Abfrage kann, wenn die Kommunikationsverbindung mit den Informationsquellen 16a, 16b, 16c stark ist, der Avatar froh aussehen. Wenn die Kommunikationsverbindung mit den Informationsquellen 16a, 16b, 16c jedoch schwach ist, kann der Avatar traurig aussehen, wodurch der Insasse dazu aufgefordert wird, zu fragen „Hast du Schwierigkeiten, Nachrichten über die Wahlen zu erhalten?“. Der Avatar kann antworten „Ja, ich habe Schwierigkeiten, eine Fernkommunikationsverbindung herzustellen“.
  • Während des obigen Austauschs kann der Avatar frustriert zu werden scheinen, wenn zum Beispiel das Fahrzeug 14 häufige Beschleunigung und Bremsung oder anderweitigen harschen Umgang erfährt. Diese Änderung der simulierten Emotion kann den Insassen 12 dazu auffordern, zu fragen „Was hast du?“. Der Avatar kann antworten „Ihr Fahrstil ist schlecht für meinen Kraftstoffverbrauch. Vielleicht sollten häufige Beschleunigung und Bremsung verringert werden“. Der Avatar kann auch verwirrt zu werden scheinen, wenn zum Beispiel der Avatar einen Befehl oder eine Anfrage von dem Insassen 12 nicht versteht. Diese Art von Dialog kann fortgesetzt werden, wobei der Avatar dynamisch über sein Aussehen, den Ausdruck, den Ton der Stimme, Wortwahl usw. seinen simulierten emotionalen Zustand ändert, um dem Insassen 12 Informationen zu übermitteln.
  • Das EAS 10 kann auch lernen, Anforderungen, Befehle und/oder Präferenzen des Insassen 12 auf der Basis einer Vorgeschichte des Dialogs zwischen dem Insassen 12 und dem EAS 10 zu antizipieren. Zum Beispiel kann das EAS 10 lernen, dass der Insasse 12 eine Fahrgastraumtemperatur von 22 °C (72° Fahrenheit) bevorzugt, wenn die Umgebungstemperaturen 27 °C (80° Fahrenheit) übersteigen, sowie eine Fahrgastraumtemperatur von 26 °C (78° Fahrenheit), wenn die Umgebungstemperaturen kleiner als 4 °C (40° Fahrenheit) sind und es ein wolkiger Tag ist. Eine Aufzeichnung solcher Klimasteuerungseinstellungen und Umgebungstemperaturen kann das EAS 10 bezüglich dieser anscheinenden Präferenz des Insassen 12 informieren. Ähnlich kann das EAS 10 lernen, dass der Insasse 12 bevorzugt, die lokalen Verkehrsdurchsagen zu hören, wenn das Fahrzeug startet. Eine Aufzeichnung mehrerer Anforderungen von Verkehrsnachrichten nach dem Fahrzeugstart kann das EAS 10 dazu auffordern, beim Fahrzeugstart solche Informationen zu sammeln und den Insassen 12 zu fragen, ob er den lokalen Verkehr hören möchte. Es sind auch andere erlernte Verhaltensweisen möglich.
  • Diese erlernten Anforderungen, Befehle und/oder Präferenzen können mit vom Insassen definierten Kriterien ergänzt und/oder initialisiert werden. Zum Beispiel kann der Insasse 12 das EAS 10 informieren, dass er nicht gerne über Sport diskutiert, aber gerne über Musik usw. In diesem Beispiel kann das EAS 10 davon absehen, Gespräche mit dem Insassen 12 über Sport einzuleiten, kann aber periodisch mit dem Insassen 12 über Musik sprechen.
  • Es versteht sich, dass ein gefühlsansprechendes Beratungssystem (EAS) auf vielfältige Weisen implementiert werden kann und dass die vorliegende Beschreibung beispielhaft ist. Eine weitere ausführlichere Beschreibung eines beispielhaften gefühlsansprechenden Beratungssystems wird in der US-Pub. Nr. 2008/0269958 A1 gegeben. Unter fortgesetzter Bezugnahme auf 1 kommuniziert im Allgemeinen der Computer 20 mit Informationsquellen 16a, 16b, 16c und kommuniziert mit verschiedenen Peripheriegeräten, wie zum Beispiel Tasten, einer Videokamera, einem Fahrzeug-BUS-Controller, einer Beschallungseinrichtung und einem privaten Fahrzeugnetzwerk. Der Computer 20 kommuniziert außerdem mit einer Anzeige, auf der der Avatar wiedergegeben werden kann. Es sind natürlich auch andere Konfigurationen und Anordnungen möglich.
  • 2 zeigt ein gefühlsansprechendes Beratungssystem (EAS) 30 für ein Kraftfahrzeug mit einem gerichteten Lautsprecherarray 32 in Form einer Beschallungsschiene in einer beispielhaften Implementierung. Als Alternative zu der Beschallungsschiene ist es auch möglich, ein mechanisches Sprechorgan und eine physische Stimmbandeinrichtung vorzusehen. Wie gezeigt werden die herkömmlichen Steuerelemente für Unterhaltung, Navigation, Kraftübertragung, Türverriegelung und HVAC in der Zentralkonsole mit EAS-Steuerelementen ersetzt. Das oberste Element ist eine Berührungsanzeige 34 mit einem Avatar-Fenster, einem Navigations- und Vielzweckfunktionsfenster, einem Textfenster und einem Tastenfenster. Unter der Berührungsanzeige 34 befindet sich das gerichtete Lautsprecherarray 32 für synthetische Sprache von dem Avatar. Dieses Array 32 befindet sich in der Nähe der Anzeige 34, so dass die Geräusche des Avatars dem Insassen des Fahrzeugs von dem Avatar zu kommen scheinen. Das Array 32 ist auch gerichtet, so dass die Stimme die Richtung wechselt, wenn der Avatar die Richtung wechselt. Dadurch kann der Avatar verschiedene Personen in dem Fahrzeug ansprechen, indem der Blick und die Sprache des Avatars in die Richtung der angesprochenen Person gerichtet wird. Bei einem anderen Beispiel kann die Sprache von einem bestimmten Ort in dem Fahrzeuginnenraum kommen. Wenn zum Beispiel die linke hintere Tür des Fahrzeugs offen ist und das System dem Fahrer mitteilt, dass die Tür offen ist, kann die Sprache von einem Bereich in der Nähe der linken hinteren Tür aus gerichtet werden. Der Avatar kann eine Emotion ausdrücken, indem er nach unten schaut und in Richtung des Bodens spricht, oder indem er nach oben schaut und ein Individuum anspricht. Der Avatar kann auch die Aufmerksamkeit auf ein Objekt, wie den Navigationsschirm 34, lenken, indem er seinen Blick und seine Stimme in diese Richtung verlagert.
  • Ausführungsformen der Erfindung können auch das Unterhaltungs-Beschallungssystem des Fahrzeugs nutzen, das typischerweise aus vier Lautsprechern in jeder Ecke des Autoinnenraums und einem Subwoofer besteht. Das Beschallungssystem ist so ausgelegt, dass das Lautsprecherarray zusammen mit der Avatar-Sprache für das Unterhaltungssystem verwendet werden kann, so dass das Unterhaltungssystem effektiv zu einem 5.1-System wird.
  • Zusätzliche Mikrofone 36 werden in dem Fahrgastraum angeordnet, um Effekte wie Echolöschung zu implementieren, durch die der Avatar so klingt, als befände er sich in einem sehr großen Raum, oder Geräuschunterdrückung, um sicherzustellen, dass Passagiere in dem Fahrzeug einen Hochprioritätsdialog zwischen dem Fahrer und dem Avatar nicht stören. Geräuschunterdrückung wird auch verwendet, um zu verhindern, dass die Stimme des Avatars seiner Spracherkennung „ins Wort fällt“. Die Geräuschunterdrückung kann auch unter Verwendung von Daten von Fahrzeugsystemen verbessert werden. Zum Beispiel lassen sich Motorgeräusche unter Verwendung der Drehzahl von Fahrzeugsystemen besser beseitigen. Scheibenwischer, Fahrzeuggeschwindigkeit, Beschleunigung, HVAC und Fensterstellung sind andere Gelegenheiten. Es könnte auch das Web verwendet werden, um bei der Geräuschunterdrückung zu helfen, indem Wetterbedingungen bestimmt werden, die sich auf Hintergrundgeräusche auswirken können, wie zum Beispiel Regen oder Hagel.
  • Ferner können es zusätzliche Mikrofone 36 ermöglichen, dass alle im Fahrzeug von dem Avatar gehört werden können, und jede Stimme zu lokalisieren und zu bestimmen, ob sie an den Avatar gerichtet ist. Dies hilft dem EAS 30 dabei, zu bestimmen, ob die Sprache ein ins Wort fallender Insasse, eine Unterbrechung oder ein nicht damit zusammenhängendes Gespräch ist. Genauer gesagt können Mikrofone, Lautsprecher, Schutzbleche usw. an verschiedenen Orten in dem Fahrzeug platziert werden, um es dem System zu erlauben, einen sprechenden Insassen zu lokalisieren. Zum Beispiel kann ein an der Rücklehne des Vordersitzes angeordnetes Mikrofon verwendet werden, um es dem System zu erlauben, zwischen Insassen im Vordersitz und Rücksitz zu unterscheiden.
  • Bei einer beispielhaften Implementierung emittiert das Beschallungssystem alle 10 Sekunden oder wenn ein Geräuschereignis stattfindet, einen Schallimpuls aus einem Muster von Lautsprechern. Der Impuls ist kurz genug, um unwahrnehmbar zu sein, aber ausreichend für das System zum Kalibrieren eines Kanalmodells der Übertragung von den Lautsprechern (darunter die Lautsprecher 32) zu den Mikrofonen (darunter die Mikrofone 36). Aus dem empfangenen Impuls können die Ausbreitungszeit, Dämpfung, Dispersion, Echos usw. zwischen jedem Lautsprecher und jedem Mikrofon charakterisiert werden.
  • Im Allgemeinen können Ausführungsformen der Erfindung die akustische Umgebung des Fahrzeugs normieren, so dass sie mit der akustischen Umgebung vergleichbar ist, in der die Systeme zur automatischen Spracherkennung trainiert werden. Zum Beispiel kann Geräuschunterdrückung, die unter Verwendung von Daten von Fahrzeugsystemen verbessert werden kann, Geräusche zum Beispiel aus Windgeräuschen von offenen Fenstern, fallendem Regen und HVAC unterdrücken. Anders ausgedrückt, können Ausführungsformen der Erfindung die Audioeingangssignale normieren, um die Spracherkennung zu verbessern. Es versteht sich, dass ein Zweck der Geräuschunterdrückung darin besteht, die Spracherkennung zu verbessern.
  • Bei einer beispielhaften Implementierung kann ferner, wenn sich der Avatar von der Anzeigeoberfläche 34 zurück und in einen geschlossenen Bereich im Hintergrund, wie zum Beispiel eine Garage oder einen Raum zurückbewegt, Hall hinzugefügt werden, um den Effekt zu produzieren, sich in einem eingegrenzten Raum zu befinden. Wenn sich der Avatar wieder in einen offenen Bereich bewegt, kann Echolöschung verwendet werden, damit der Avatar so klingt, als befände er sich in einem unendlichen Raum. Wenn der Avatar dem Navigationsschirm zugewandt ist, kann Hall hinzugefügt werden, um die Reflexion der Stimme von der Navigationsanzeige zu simulieren.
  • Mit diesen Effekten ist es möglich, zu bewirken, dass ein Avatar überzeugend an vielfältigen Aktivitäten teilnehmen kann und Emotion und Bedeutung zeigt, die nur mit Prosodie und Semantik nicht ausgedrückt werden können.
  • 35 sind Blockdiagramme, die den Betrieb eines gefühlsansprechenden Beratungssystems bei einer Ausführungsform der Erfindung veranschaulichen. In 3 empfängt im Block 50 der EAS-Computer Eingaben, die einen Betriebszustand des Fahrzeugs angeben, und Eingaben, die einen emotionalen Zustand eines Insassen angeben. Im Block 52 erzeugt der EAS-Computer Daten, die einen Avatar mit einem Aussehen repräsentieren, und Daten, die eine gesprochene Aussage für den Avatar mit mindestens einem Sprachcharakteristikum repräsentieren. Das Aussehen und das mindestens eine Sprachcharakteristikum übermitteln dem Insassen einen simulierten emotionalen Zustand des Avatars. Der simulierte emotionale Zustand richtet sich nach dem Betriebszustand des Fahrzeugs und/oder dem emotionalen Zustand des Insassen.
  • Im Block 54 werden die den Avatar repräsentierenden Daten zur visuellen Anzeige auf einer Anzeigeeinrichtung ausgegeben. Im Block 56 wird eine Audiorichtung bestimmt. Im Block 58 werden die Daten, die die Aussage für den Avatar repräsentieren, für Audiowiedergabe auf dem gerichteten Lautsprecherarray so ausgegeben, dass das Audio von dem gerichteten Lautsprecherarray in die bestimmte Audiorichtung gerichtet wird. Genauer gesagt wird der Avatar im Block 54 so auf der Anzeigeeinrichtung angezeigt, dass die Avatarorientierung der Audiorichtung entspricht.
  • 4 veranschaulicht ausführlichere Aspekte des Betriebs. Im Block 60 werden an einer Vielzahl von Mikrofonen Signale empfangen. Im Block 62 lokalisiert der EAS-Computer einen oder mehrere Insassen, die sprechen. Im Block 64 bestimmt der EAS-Computer, welche (etwaige) Insassen mit dem Avatar sprechen. Block 66 richtet das Audio und den Avatarblick auf einen lokalisierten Insassen. Wie im Block 68 gezeigt, kann der Avatar Emotion ausdrücken, indem er nach unten schaut und den Insassen anspricht oder nach oben schaut und den Insassen anspricht. Als letztes kann der Avatar wie im Block 70 abgebildet durch Richten des Audio und des Avatarblicks auf ein Objekt die Aufmerksamkeit auf ein Objekt lenken.
  • 5 zeigt ausführlichere Aspekte des Betriebs. Block 80 zeigt das Empfangen von Signalen an einer Vielzahl von Mikrofonen. Block 82 zeigt das Durchführen von Geräuschunterdrückung an empfangenen Signalen; Block 84 zeigt das Durchführen von Echolöschung an empfangenen Signalen. Im Block 86 findet Verarbeitung dergestalt statt, dass Schall von einem bestimmten lokalisierten Insassen verstärkt wird. Als letztes und wie im Block 88 abgebildet können Ausführungsformen der Erfindung aktive Echolöschung implementieren.
  • 6 ist ein Blockdiagramm, das eine Kalibrationstechnik für ein Kanalmodell in dem gefühlsansprechenden Beratungssystem veranschaulicht. Im Block 90 werden Daten, die einen Schallimpuls repräsentieren, zur Audiowiedergabe auf dem gerichteten Lautsprecherarray ausgegeben. Im Block 92 wird der Schallimpuls an der Vielzahl von Mikrofonen detektiert. Im Block 94 wird ein Kanalmodell der Übertragung zwischen dem gerichteten Lautsprecherarray und der Vielzahl von Mikrofonen kalibriert.
  • Weiterhin kann in einer bevorzugten Ausführungsform ein gefühlsansprechendes Beratungssystem zur Verwendung durch einen oder mehrere Insassen eines Kraftfahrzeugs vorgesehen sein, das insbesondere Folgendes umfasst:
    ein gerichtetes Lautsprecherarray;
    eine Anzeigeeinrichtung;
    eine Vielzahl von Mikrofonen; und
    einen Computer, der für Folgendes ausgelegt ist:
    • – Empfangen von Eingaben, die einen Betriebszustand des Fahrzeugs angeben, und von Eingaben, die einen emotionalen Zustand eines Insassen angeben,
    • – Erzeugen (i) von Daten, die einen Avatar mit einem Aussehen repräsentieren, und (ii) von Daten, die eine gesprochene Aussage für den Avatar mit mindestens einem Sprachcharakteristikum repräsentieren, wobei das Aussehen und das mindestens eine Sprachcharakteristikum dem Insassen einen simulierten emotionalen Zustand des Avatars übermitteln, wobei sich der simulierte emotionale Zustand nach dem Betriebszustand des Fahrzeugs und/oder dem emotionalen Zustand des Insassen richtet,
    • – Bestimmen einer Audiorichtung,
    • – Ausgeben der die Aussage für den Avatar repräsentierenden Daten zur Audiowiedergabe auf dem gerichteten Lautsprecherarray dergestalt, dass das Audio von dem gerichteten Lautsprecherarray in die bestimmte Audiorichtung gerichtet wird,
    • – Ausgeben der den Avatar repräsentierenden Daten zur visuellen Anzeige auf der Anzeigeeinrichtung dergestalt, dass die Avatarorientierung der Audiorichtung entspricht; und
    • – Lokalisieren eines Insassen, der spricht,
    wobei die Audiorichtung so bestimmt wird, dass die Audiorichtung und die entsprechende Avatarorientierung das Audio und einen Blick des Avatars auf einen bestimmten Insassen richten, der angesprochen wird.
  • Das vorstehen beschriebene System kann weiterhin bevorzugt umfassen:
    eine Vielzahl von Mikrofonen;
    ein Fahrzeuglautsprecherarray; und
    einen Computer, der für Folgendes ausgelegt ist:
    • – Lokalisieren einer Vielzahl von Insassen,
    • – Ausgeben von Daten, die eine gesprochene Aussage repräsentieren, zur Audiowiedergabe von dem Lautsprecherarray und
    • – Ausgeben von Daten, die einen Avatar repräsentieren, zur visuellen Anzeige,
    wobei ein visuelles Aussehen des Avatars und die gesprochene Aussage einen simulierten emotionalen Zustand übermitteln und
    das Audio von dem Lautsprecherarray auf einen bestimmten Insassen gerichtet wird.

Claims (18)

  1. Gefühlsansprechendes Beratungssystem zur Verwendung durch einen oder mehrere Insassen (12) eines Kraftfahrzeugs (14), wobei das System Folgendes umfasst: ein gerichtetes Lautsprecherarray (32); und einen Computer (20), der für Folgendes ausgelegt ist: – Empfangen von Eingaben, die einen Betriebszustand des Fahrzeugs angeben, und Eingaben, die einen emotionalen Zustand eines Insassen angeben, – Erzeugen (i) von Daten, die einen Avatar mit einem Aussehen repräsentieren, und (ii) Daten, die eine gesprochene Aussage für den Avatar mit mindestens einem Sprachcharakteristikum repräsentieren, wobei das Aussehen und das mindestens eine Sprachcharakteristikum dem Insassen einen simulierten emotionalen Zustand des Avatars übermitteln, wobei sich der simulierte emotionale Zustand nach dem Betriebszustand des Fahrzeugs und/oder dem emotionalen Zustand des Insassen (12) richtet, – Ausgeben der den Avatar repräsentierenden Daten zur visuellen Anzeige, – Bestimmen einer Audiorichtung und – Ausgeben der die Aussage für den Avatar repräsentierenden Daten zur Audiowiedergabe auf dem gerichteten Lautsprecherarray (32) dergestalt, dass das Audio von dem gerichteten Lautsprecherarray (32) in die bestimmte Audiorichtung gerichtet wird.
  2. Gefühlsansprechendes Beratungssystem nach Anspruch 1, wobei das gerichtete Lautsprecherarray (32) folgendes umfasst: eine Beschallungsschiene, die eine Vielzahl von Lautsprechern enthält.
  3. Gefühlsansprechendes Beratungssystem nach Anspruch 1, ferner umfassend: eine Sprachschnittstelle zum Empfangen von Eingaben in Form von natürlicher Sprache.
  4. Gefühlsansprechendes Beratungssystem nach Anspruch 1, ferner umfassend: eine Anzeigeeinrichtung, wobei der Computer (20) dafür ausgelegt ist, die den Avatar repräsentierenden Daten zur visuellen Anzeige auf der Anzeigeeinrichtung dergestalt auszugeben, dass die Avatarorientierung der Audiorichtung entspricht.
  5. Gefühlsansprechendes Beratungssystem nach Anspruch 4, wobei sich das gerichtete Lautsprecherarray (32) in der Nähe der Anzeigeeinrichtung befindet, so dass das Audio von dem gerichteten Lautsprecherarray (32) dem Insassen (12) von dem Avatar zu kommen scheint.
  6. Gefühlsansprechendes Beratungssystem nach Anspruch 4, wobei der Computer (20) dafür ausgelegt ist, die Audiorichtung so zu bestimmen, dass die Audiorichtung und die entsprechende Avatarorientierung das Audio und einen Blick des Avatars auf einen bestimmten Insassen richten, der angesprochen wird.
  7. Gefühlsansprechendes Beratungssystem nach Anspruch 4, wobei der Computer (20) dafür ausgelegt ist, die Audiorichtung so zu bestimmen, dass die Audiorichtung und die entsprechende Avatarorientierung eine Emotion ausdrücken, indem nach unten geschaut und der Insasse angesprochen oder nach oben geschaut und der Insasse angesprochen wird.
  8. Gefühlsansprechendes Beratungssystem nach Anspruch 4, wobei der Computer (20) dafür ausgelegt ist, die Audiorichtung so zu bestimmen, dass die Audiorichtung und die entsprechende Avatarorientierung die Aufmerksamkeit auf ein Objekt lenken, indem das Audio und ein Blick des Avatars auf das Objekt gerichtet werden.
  9. Gefühlsansprechendes Beratungssystem nach Anspruch 1, ferner umfassend: eine Vielzahl von Mikrofonen (36), wobei der Computer (20) dafür ausgelegt ist, einen Insassen (12), der spricht, zu lokalisieren.
  10. Gefühlsansprechendes Beratungssystem nach Anspruch 9, wobei der Computer (20) dafür ausgelegt ist, die Audiorichtung so zu bestimmen, dass die Audiorichtung das Audio auf den lokalisierten Insassen (12) richtet.
  11. Gefühlsansprechendes Beratungssystem nach Anspruch 9, wobei der Computer (20) dafür ausgelegt ist, Echolöschung an der Vielzahl von Mikrofonen (36) empfangenen Signalen auszuführen.
  12. Gefühlsansprechendes Beratungssystem nach Anspruch 9, wobei der Computer (20) dafür ausgelegt ist, Geräuschunterdrückung an der Vielzahl von Mikrofonen (36) empfangenen Signalen auszuführen.
  13. Gefühlsansprechendes Beratungssystem nach Anspruch 12, wobei der Computer (20) dafür ausgelegt ist, Geräuschunterdrückung an der Vielzahl von Mikrofonen (36) empfangenen Signalen auszuführen, um Schall von dem lokalisierten Insassen (12) zu verstärken.
  14. Gefühlsansprechendes Beratungssystem nach Anspruch 1, ferner umfassend: eine Vielzahl von Mikrofonen (36), wobei der Computer (20) dafür ausgelegt ist, einen oder mehrere Insassen (12), die sprechen, zu lokalisieren und zu bestimmen, welche etwaige Insassen (12) mit dem Avatar sprechen.
  15. Gefühlsansprechendes Beratungssystem nach Anspruch 1, ferner umfassend: eine Vielzahl von Mikrofonen (36), wobei der Computer (20) dafür ausgelegt ist, aktive Geräuschunterdrückung auf der Basis von an der Vielzahl von Mikrofonen (36) empfangenen Signalen durch Modifizieren von Audio aus dem gerichteten Lautsprecherarray (32) auszuführen.
  16. Gefühlsansprechendes Beratungssystem nach Anspruch 1, ferner umfassend: eine Vielzahl von Mikrofonen (36), wobei der Computer (20) für Folgendes ausgelegt ist: – Ausgeben von einen Schallimpuls repräsentierenden Daten zur Audiowiedergabe auf dem gerichteten Lautsprecherarray (32), – Detektieren des Schallimpulses an der Vielzahl von Mikrofonen (36) und – Kalibrieren eines Kanalmodells der Übertragung zwischen dem gerichteten Lautsprecherarray (32) und der Vielzahl von Mikrofonen (36).
  17. Gefühlsansprechendes Beratungssystem nach Anspruch 1, wobei der Computer (20) dafür ausgelegt ist, die Audiorichtung zu bestimmen, um so einen Audioeffekt bereitzustellen.
  18. Gefühlsansprechendes Beratungssystem nach Anspruch 17, wobei der Computer (20) dafür ausgelegt ist, Hall bereitzustellen.
DE102010040818.2A 2009-10-02 2010-09-15 Gefühlsansprechendes Beratungssystem zur Verwendung durch einen oder mehrere Insassen eines Kraftfahrzeugs Active DE102010040818B4 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US12/572,364 US8649533B2 (en) 2009-10-02 2009-10-02 Emotive advisory system acoustic environment
US12/572,364 2009-10-02

Publications (2)

Publication Number Publication Date
DE102010040818A1 DE102010040818A1 (de) 2011-04-07
DE102010040818B4 true DE102010040818B4 (de) 2018-02-15

Family

ID=43705851

Family Applications (1)

Application Number Title Priority Date Filing Date
DE102010040818.2A Active DE102010040818B4 (de) 2009-10-02 2010-09-15 Gefühlsansprechendes Beratungssystem zur Verwendung durch einen oder mehrere Insassen eines Kraftfahrzeugs

Country Status (3)

Country Link
US (1) US8649533B2 (de)
CN (1) CN102030008B (de)
DE (1) DE102010040818B4 (de)

Families Citing this family (43)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102009051508B4 (de) * 2009-10-30 2020-12-03 Continental Automotive Gmbh Vorrichtung, System und Verfahren zur Sprachdialogaktivierung und -führung
US20110298808A1 (en) * 2010-06-02 2011-12-08 Toyota Motor Engineering & Manufacturing North America, Inc. Animated Vehicle Attendance Systems
US10779761B2 (en) * 2010-06-07 2020-09-22 Affectiva, Inc. Sporadic collection of affect data within a vehicle
US11292477B2 (en) * 2010-06-07 2022-04-05 Affectiva, Inc. Vehicle manipulation using cognitive state engineering
KR101901417B1 (ko) * 2011-08-29 2018-09-27 한국전자통신연구원 감성기반 안전운전 자동차 서비스 시스템, 안전운전 서비스를 위한 감성인지 처리 장치 및 안전운전 서비스 장치, 감성기반 차량용 안전운전 서비스 방법
CN104488025A (zh) * 2012-03-16 2015-04-01 纽昂斯通讯公司 用户专用的自动语音识别
US8892046B2 (en) * 2012-03-29 2014-11-18 Bose Corporation Automobile communication system
EP2837211B1 (de) * 2012-04-13 2017-08-30 Nokia Technologies Oy Verfahren, gerät und computerprogramm zur erzeugung einer räumlichen audioausgabe auf basis einer räumlichen audioeingabe
US9141187B2 (en) * 2013-01-30 2015-09-22 Panasonic Automotive Systems Company Of America, Division Of Panasonic Corporation Of North America Interactive vehicle synthesizer
US20140282273A1 (en) * 2013-03-15 2014-09-18 Glen J. Anderson System and method for assigning voice and gesture command areas
CN103200492A (zh) * 2013-03-29 2013-07-10 苏州上声电子有限公司 基于波束控制的吊顶式音响装置
US9293135B2 (en) 2013-07-02 2016-03-22 Volkswagen Ag Countermeasures for voice recognition deterioration due to exterior noise from passing vehicles
US9731668B2 (en) 2013-08-09 2017-08-15 Ford Global Technologies, Llc Multi-vehicle settings
US10535260B2 (en) 2014-12-18 2020-01-14 Ford Global Technologies, Llc Rules of the road advisor using vehicle telematics
US9640169B2 (en) * 2015-06-25 2017-05-02 Bose Corporation Arraying speakers for a uniform driver field
DE102015111692A1 (de) * 2015-07-17 2017-01-19 Ford Global Technologies, Llc Verfahren, Fahrzeuginsassen akustisch auf eine Komponente oder ein Gerät des Fahrzeugs hinzuweisen
DE102015112637A1 (de) 2015-07-31 2017-02-02 Volkswagen Aktiengesellschaft Vorrichtung, Fahrzeug, Verfahren und Computerprogramm zur Berechnung zumindest eines Video- oder Steuersignals basierend auf Information entsprechend einem potentiellen Interesse
CN106910513A (zh) * 2015-12-22 2017-06-30 微软技术许可有限责任公司 情绪智能聊天引擎
CN107888653A (zh) * 2016-09-30 2018-04-06 本田技研工业株式会社 发话装置、沟通装置和移动体
JP6655726B2 (ja) * 2016-09-30 2020-02-26 本田技研工業株式会社 情報提供装置、及び移動体
JP6612707B2 (ja) * 2016-09-30 2019-11-27 本田技研工業株式会社 情報提供装置
JP6657048B2 (ja) * 2016-09-30 2020-03-04 本田技研工業株式会社 処理結果異常検出装置、処理結果異常検出プログラム、処理結果異常検出方法及び移動体
JP6655036B2 (ja) * 2017-03-15 2020-02-26 株式会社Subaru 車両の表示システム及び車両の表示システムの制御方法
US10922566B2 (en) * 2017-05-09 2021-02-16 Affectiva, Inc. Cognitive state evaluation for vehicle navigation
JP6596771B2 (ja) * 2017-05-19 2019-10-30 トヨタ自動車株式会社 情報提供装置および情報提供方法
DE102017117570A1 (de) * 2017-08-02 2019-02-07 Alexander Augst Verfahren, System, Anwendergerät sowie Computerprogramm zum Erzeugen einer auditiven Meldung in einem stationären Wohnraum
JP6988438B2 (ja) * 2017-12-20 2022-01-05 トヨタ自動車株式会社 車載制御装置、制御装置、制御方法、制御プログラム、及び発話応答方法
JP6984420B2 (ja) * 2018-01-09 2021-12-22 トヨタ自動車株式会社 対話装置
JP6965783B2 (ja) * 2018-02-13 2021-11-10 トヨタ自動車株式会社 音声提供方法および音声提供システム
JP7294775B2 (ja) * 2018-05-24 2023-06-20 トヨタ自動車株式会社 情報処理装置、プログラム、及び制御方法
JP2019212168A (ja) * 2018-06-07 2019-12-12 トヨタ自動車株式会社 音声認識システムおよび情報処理装置
KR102675289B1 (ko) 2018-10-29 2024-06-17 현대자동차주식회사 차량 및 그 제어 방법
US11021147B2 (en) * 2018-12-12 2021-06-01 Toyota Research Institute, Inc. Vehicles and methods for determining objects of driver focus
DE102018133695A1 (de) 2018-12-28 2020-07-02 Volkswagen Aktiengesellschaft Benutzerschnittstelle mit animiertem Avatar
DE102019119056A1 (de) * 2019-07-15 2021-01-21 Bayerische Motoren Werke Aktiengesellschaft Vorrichtung und Fortbewegungsmittel zum kontaktanalogen Darstellen eines virtuellen Insassen in einer Fahrgastzelle des Fortbewegungsmittels
EP3819157B1 (de) * 2019-11-08 2023-04-05 Volvo Car Corporation Unterhaltungssystem für ein fahrzeug mit einem geräuschemittierenden modul
FR3105499B1 (fr) 2019-12-18 2021-12-24 Psa Automobiles Sa Procédé et dispositif d’animation visuelle d’une interface de commande vocale d’un assistant personnel virtuel embarqué dans un véhicule automobile, et véhicule automobile l’incorporant
JP7474058B2 (ja) * 2020-02-04 2024-04-24 株式会社デンソーテン 表示装置および表示装置の制御方法
US11408745B2 (en) 2020-10-29 2022-08-09 Toyota Motor Engineering & Manufacturing North America, Inc Methods and systems for identifying safe parking spaces
US11741836B2 (en) 2020-10-29 2023-08-29 Toyota Motor Engineering & Manufacturing North America, Inc. Methods and systems for performing correlation-based parking availability estimation
JP7538025B2 (ja) * 2020-12-17 2024-08-21 トヨタ自動車株式会社 移動体
DE102022107809A1 (de) 2022-04-01 2023-10-05 Bayerische Motoren Werke Aktiengesellschaft Interaktive Steuerung eines Fahrzeugs
EP4420911A1 (de) 2023-02-24 2024-08-28 Bayerische Motoren Werke Aktiengesellschaft Steuervorrichtung und verfahren zum einstellen eines digitalen assistenten eines fahrzeugs

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE10345679A1 (de) * 2003-10-01 2005-05-04 Grundig Car Intermedia Sys Anordnung zur akustisch unterstützten Navigation
US20080269958A1 (en) * 2007-04-26 2008-10-30 Ford Global Technologies, Llc Emotive advisory system and method

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6778672B2 (en) * 1992-05-05 2004-08-17 Automotive Technologies International Inc. Audio reception control arrangement and method for a vehicle
US6249720B1 (en) * 1997-07-22 2001-06-19 Kabushikikaisha Equos Research Device mounted in vehicle
CN100375125C (zh) * 2004-05-18 2008-03-12 清华大学 一种车况监测和故障诊断装置
CN101268715B (zh) * 2005-11-02 2012-04-18 雅马哈株式会社 电话会议装置
CN101101576A (zh) * 2006-07-06 2008-01-09 李涛 一种车载多功能信息处理器
EP2018034B1 (de) * 2007-07-16 2011-11-02 Nuance Communications, Inc. Verfahren und System zur Verarbeitung von Tonsignalen in einem Multimediasystem eines Fahrzeugs
US20110004481A1 (en) * 2008-09-19 2011-01-06 Dell Products, L.P. System and method for communicating and interfacing between real and virtual environments
US20100217590A1 (en) * 2009-02-24 2010-08-26 Broadcom Corporation Speaker localization system and method

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE10345679A1 (de) * 2003-10-01 2005-05-04 Grundig Car Intermedia Sys Anordnung zur akustisch unterstützten Navigation
US20080269958A1 (en) * 2007-04-26 2008-10-30 Ford Global Technologies, Llc Emotive advisory system and method
US20090063154A1 (en) * 2007-04-26 2009-03-05 Ford Global Technologies, Llc Emotive text-to-speech system and method

Also Published As

Publication number Publication date
US8649533B2 (en) 2014-02-11
US20110083075A1 (en) 2011-04-07
CN102030008A (zh) 2011-04-27
CN102030008B (zh) 2016-01-20
DE102010040818A1 (de) 2011-04-07

Similar Documents

Publication Publication Date Title
DE102010040818B4 (de) Gefühlsansprechendes Beratungssystem zur Verwendung durch einen oder mehrere Insassen eines Kraftfahrzeugs
CN108281156B (zh) 语音界面和声乐娱乐系统
CN110070868B (zh) 车载系统的语音交互方法、装置、汽车和机器可读介质
DE102011002985A1 (de) Beratungssystem mit einem Zeitagenten
DE102010036666A1 (de) Intelligente Musikauswahl in Fahrzeugen
DE102010009888A1 (de) Kommunikationsverbesserung in Fahrzeugen
DE10008226C2 (de) Vorrichtung zur Sprachsteuerung und Verfahren zur Sprachsteuerung
DE102018211127A1 (de) Audioeinrichtung für ein Fahrzeug und Verfahren zum Betrieb einer Audioeinrichtung für ein Fahrzeug
DE102018107326A1 (de) Adaptives Insassengespräch-Frühwarnsystem
CN110696756A (zh) 一种车辆的音量控制方法及装置、汽车、存储介质
EP3661797A1 (de) Verfahren, vorrichtung, mobiles anwendergerät, computerprogramm zur steuerung eines audiosystems eines fahrzeugs
DE102016217026A1 (de) Sprachsteuerung eines Kraftfahrzeugs
DE102019102090A1 (de) Fahrzeuginterne medienstimmunterdrückung
DE102020112055A1 (de) Verfahren zur akustischen Fahrzeuginszenierung
CN111613201A (zh) 车内声音管理装置及方法
DE102015014916A1 (de) Verfahren zur Ausgabe von Audiosignalen
JP7489391B2 (ja) 車内ヘッドフォンの音響拡張現実システム
DE112018001454T5 (de) Vorrichtung und verfahren zur verbesserung der privatsphäre
DE102017213252A1 (de) Verfahren, Vorrichtung und Computerprogramm zum Variieren eines in einem Fahrzeug auszugebenden Audio-Inhalts
CN115830724A (zh) 基于多模态识别的车载识别交互方法及系统
DE112019007580B4 (de) Schallfeld-Steuerungsvorrichtung und Schallfeld-Steuerungsverfahren
CN115107674A (zh) 一种音量调节方法、装置及汽车
Kendrick Aural visions: sonic spectatorship in the dark
DE102013013695A1 (de) Kraftfahrzeug mit Spracherkennung
CN114842840A (zh) 基于车内子区域的语音控制方法和系统

Legal Events

Date Code Title Description
R012 Request for examination validly filed

Effective date: 20140120

R082 Change of representative

Representative=s name: MUELLER SCHUPFNER & PARTNER PATENT- UND RECHTS, DE

R016 Response to examination communication
R018 Grant decision by examination section/examining division
R020 Patent grant now final