-
Technisches Gebiet
-
Die vorliegende Offenbarung befasst sich mit der automatisierten Beantwortung von Sprachanrufen. Insbesondere befassen sich Ausführungsbeispiele mit einem computerimplementierten Verfahren sowie einem Datenverarbeitungssystem zur Beantwortung eines Sprachanrufs eines Nutzers.
-
Hintergrund
-
Fahrzeughersteller bieten für Nutzer eines Fahrzeugs einen Assistenzservice mit menschlichen Assistenten an. Beispielsweise bietet BMW den „BMW Concierge Service“ an, bei dem über eine Telefonverbindung 365 Tage im Jahr, rund um die Uhr ein persönlicher Berater für den Fahrzeugnutzer bereitsteht.
-
Die persönlichen Berater des Assistenzservices werden dabei von Fahrzeugnutzern häufig mit ähnlichen bzw. identischen Anfragen konfrontiert. Beispielsweise werden die persönlichen Berater des Assistenzservices häufig nach der nächstgelegenen Tankstelle oder dem Preis eines bestimmten Fahrzeugmodells gefragt. Ebenso werden die persönlichen Berater des Assistenzservices auch häufig gebeten, eine Restaurantbuchung für den Fahrzeugnutzer vorzunehmen.
-
Es ist daher wünschenswert, den mit menschlichen Assistenten operierenden Assistenzservice von solchen typischen Fragen zu entlasten. Es besteht daher ein Bedarf, eine möglichst automatisierte Beantwortung von Sprachanrufen bereitzustellen.
-
Zusammenfassung
-
Dieser Bedarf kann durch das computerimplementierte Verfahren sowie das Datenverarbeitungssystem zur Beantwortung eines Sprachanrufs eines Nutzers gemäß den unabhängigen Patentansprüchen gedeckt werden. Weitere Aspekte sowie Weiterbildungen der vorgeschlagenen Technologie sind in den abhängigen Ansprüchen, der folgenden Beschreibung sowie in den Figuren beschrieben.
-
Ein Ausführungsbeispiel betrifft ein computerimplementiertes Verfahren zur Beantwortung eines Sprachanrufs eines Nutzers. Das Verfahren umfasst ein Umsetzen des Sprachanrufs in Text sowie ein Interpretieren des Texts, um eine Frage des Nutzers zu bestimmen. Ferner umfasst das Verfahren ein Bestimmen, ob die Frage des Nutzers mit in einer Datenbank enthaltenen Informationen beantwortet werden kann. Falls bestimmt wird, dass die Frage des Nutzers nicht mit den in der Datenbank enthaltenen Informationen beantwortet werden kann, umfasst das Verfahren ein Aufbauen einer Verbindung zu einem Kommunikationsgerät eines menschlichen Sachbearbeiters, um Informationen über die Frage des Nutzers an den menschlichen Sachbearbeiter zu übermitteln. Weiterhin umfasst das Verfahren ein Empfangen von Informationen zur Beantwortung der Frage des Nutzers von dem Kommunikationsgerät des menschlichen Sachbearbeiters. Das Verfahren umfasst zudem ein Speichem der empfangenen Informationen zur Beantwortung der Frage des Nutzers in der Datenbank sowie ein Umsetzen der Informationen zur Beantwortung der Frage des Nutzers in eine Sprachausgabe für den Nutzer.
-
Ferner betrifft ein Ausführungsbeispiel ein nicht-flüchtiges maschinenlesbares Medium, auf dem ein Programm gespeichert ist mit einem Programmcode zum Durchführen des hierin beschriebenen Verfahrens, wenn das Programm auf einem Prozessor oder einer programmierbaren Hardwarekomponente ausgeführt wird.
-
Ein weiteres Ausführungsbeispiel betrifft ein Datenverarbeitungssystem zur Beantwortung eines Sprachanrufs eines Nutzers. Das Datenverarbeitungssystem umfasst eine Schnittstelle, die eingerichtet ist, den Sprachanruf des Nutzers zu empfangen. Ferner umfasst das Datenverarbeitungssystem einen oder mehreren Prozessoren, die eingerichtet sind, den Sprachanruf in Text umzusetzen und den Text zu interpretieren, um eine Frage des Nutzers zu bestimmen. Weiterhin sind der eine oder die mehreren Prozessoren eingerichtet, zu bestimmen, ob die Frage des Nutzers mit in einer Datenbank enthaltenen Informationen beantwortet werden kann. Falls bestimmt wird, dass die Frage des Nutzers nicht mit den in der Datenbank enthaltenen Informationen beantwortet werden kann, sind der eine oder die mehreren Prozessoren eingerichtet, eine Verbindung zu einem Kommunikationsgerät eines menschlichen Sachbearbeiters aufzubauen, um Informationen über die Frage des Nutzers an den menschlichen Sachbearbeiter zu übermitteln. Der eine oder die mehreren Prozessoren sind ferner eingerichtet, Informationen zur Beantwortung der Frage des Nutzers von dem Kommunikationsgerät des menschlichen Sachbearbeiters zu empfangen. Weiterhin sind der eine oder die mehreren Prozessoren eingerichtet, die empfangenen Informationen zur Beantwortung der Frage des Nutzers in der Datenbank zu speichern und die Informationen zur Beantwortung der Frage des Nutzers in eine Sprachausgabe für den Nutzer umzusetzen.
-
Zudem betrifft ein Ausführungsbeispiel ein System umfassend ein hierein beschriebenes Datenverarbeitungssystem und ein Fahrzeug. Dabei umfasst das Fahrzeug eine Sprachschnittstelle, die eingerichtet ist, eine Verbindung zu dem Datenverarbeitungssystem aufzubauen, um den Sprachanruf des Nutzers an das Datenverarbeitungssystem zu übertragen. Ferner ist die Sprachschnittstelle eingerichtet, die Sprachausgabe für den Nutzer nach Empfang von dem Datenverarbeitungssystem an den Nutzer auszugeben.
-
Gemäß der vorgeschlagenen Technologie können Sprachanrufe von Nutzern automatisiert mittels der in der Datenbank vorhandenen Informationen beantwortet werden. Auf menschlichen Sachbearbeiter bzw. persönliche Berater des Assistenzservices wird nur zurückgegriffen, falls eine Anfrage nicht bereits mit den in der Datenbank enthaltenen Informationen beantwortet werden kann. Aufgrund der weitestgehend automatisierte Beantwortung von Sprachanrufen kann ein mit menschlichen Assistenten bzw. Sachbearbeitern operierender Assistenzservice entlastet. Da die zur Beantwortung einer Frage eines Nutzers empfangenen Informationen des Sachbearbeiters in der Datenbank gespeichert werden, kann die Menge an verfügbaren Informationen in der Datenbank zudem vergrößert werden, so dass dieselbe oder eine ähnliche Anfrage beim nächsten Anruf vollautomatisch beantwortet werden kann. Die Zahl an automatisiert beantwortbaren Anfragen kann somit mit jeder Anfrage beim menschlichen Sachbearbeiter vergrößert werden.
-
Figurenliste
-
Einige Beispiele von Vorrichtungen und Verfahren werden nachfolgend bezugnehmend auf die beiliegenden Figuren lediglich beispielhaft näher erläutert. Es zeigen:
- 1 ein Ablaufdiagramm eines Ausführungsbeispiels eines computerimplementierten Verfahrens zur Beantwortung eines Sprachanrufs eines Nutzers;
- 2 und 3 Flussdiagramme eines weiteren Ausführungsbeispiels zur Beantwortung eines Sprachanrufs eines Nutzers; und
- 4 ein Ausführungsbeispiel eines Systems mit einem Fahrzeug und einer Datenverarbeitungsanlage zur Beantwortung eines Sprachanrufs eines Nutzers des Fahrzeugs.
-
Beschreibung
-
Verschiedene Beispiele werden nun ausführlicher Bezug nehmend auf die beiliegenden Figuren beschrieben, in denen einige Beispiele dargestellt sind. In den Figuren können die Stärken von Linien, Schichten und/oder Bereichen zur Verdeutlichung übertrieben sein.
-
Während sich weitere Beispiele für verschiedene Modifikationen und alternative Formen eignen, sind dementsprechend einige bestimmte Beispiele derselben in den Figuren gezeigt und werden nachfolgend ausführlich beschrieben. Allerdings beschränkt diese detaillierte Beschreibung weitere Beispiele nicht auf die beschriebenen bestimmten Formen. Weitere Beispiele können alle Modifikationen, Entsprechungen und Alternativen abdecken, die in den Rahmen der Offenbarung fallen. Gleiche oder ähnliche Bezugszeichen beziehen sich in der gesamten Beschreibung der Figuren auf gleiche oder ähnliche Elemente, die bei einem Vergleich miteinander identisch oder in modifizierter Form implementiert sein können, während sie die gleiche oder eine ähnliche Funktion bereitstellen.
-
Es versteht sich, dass, wenn ein Element als mit einem anderen Element „verbunden“ oder „gekoppelt“ bezeichnet wird, die Elemente direkt, oder über ein oder mehrere Zwischenelemente, verbunden oder gekoppelt sein können. Wenn zwei Elemente A und B unter Verwendung eines „oder“ kombiniert werden, ist dies so zu verstehen, dass alle möglichen Kombinationen offenbart sind, d. h. nur A, nur B sowie A und B, sofern nicht explizit oder implizit anders definiert. Eine alternative Formulierung für die gleichen Kombinationen ist „zumindest eines von A und B“ oder „A und/oder B“. Das Gleiche gilt, mutatis mutandis, für Kombinationen von mehr als zwei Elementen.
-
Die Terminologie, die hier zum Beschreiben bestimmter Beispiele verwendet wird, soll nicht begrenzend für weitere Beispiele sein. Wenn eine Singularform, z. B. „ein, eine“ und „der, die, das“ verwendet wird und die Verwendung nur eines einzelnen Elements weder explizit noch implizit als verpflichtend definiert ist, können weitere Beispiele auch Pluralelemente verwenden, um die gleiche Funktion zu implementieren. Wenn eine Funktion nachfolgend als unter Verwendung mehrerer Elemente implementiert beschrieben ist, können weitere Beispiele die gleiche Funktion unter Verwendung eines einzelnen Elements oder einer einzelnen Verarbeitungsentität implementieren. Es versteht sich weiterhin, dass die Begriffe „umfasst“, „umfassend“, „aufweist“ und/oder „aufweisend“ bei Gebrauch das Vorhandensein der angegebenen Merkmale, Ganzzahlen, Schritte, Operationen, Prozesse, Elemente, Komponenten und/oder einer Gruppe derselben präzisieren, aber nicht das Vorhandensein oder das Hinzufügen eines oder mehrerer anderer Merkmale, Ganzzahlen, Schritte, Operationen, Prozesse, Elemente, Komponenten und/einer Gruppe derselben ausschließen.
-
Sofern nicht anderweitig definiert, werden alle Begriffe (einschließlich technischer und wissenschaftlicher Begriffe) hier in ihrer üblichen Bedeutung auf dem Gebiet verwendet, zu dem Beispiele gehören.
-
1 zeigt ein Ablaufdiagramm eines computerimplementierten Verfahrens 100 zur Beantwortung eines Sprachanrufs eines Nutzers.
-
Das Verfahren 100 umfasst ein Umsetzen 102 des Sprachanrufs in Text bzw. ein Textsegment oder eine Textdatei sowie ein Interpretieren 104 des Texts bzw. des Textsegments oder der Textdatei, um eine Frage des Nutzers zu bestimmen. Das Umsetzen 120 des Sprachanrufs in Text erfolgt über an sich bekannte Verfahren zur Spracherkennung (engl. Automated Speech Recognition, ASR). Ebenso erfolgt das Interpretieren 104 des Texts, die Frage des Nutzers zu bestimmen, gemäß an sich bekannten Verfahren zur automatisierten Interpretation von Text.
-
Das Verfahren 100 umfasst ferner ein Bestimmen 106, ob die Frage des Nutzers mit in einer Datenbank enthaltenen Informationen beantwortet werden kann. In der Datenbank sind eine Vielzahl an Informationen für die automatisierte Beantwortung des Sprachanrufs des Nutzers gespeichert. Beispielsweise können in der Datenbank typische Nutzerfragen zusammen mit entsprechenden Antworten gespeichert sein. Um zu bestimmen, ob die Frage des Nutzers mit den in der Datenbank enthaltenen Informationen beantwortet werden kann, kann die Datenbank basierend auf der Frage des Nutzers durchsucht werden. Das Durchsuchen der Datenbank erfolgt dabei nach an sich bekannten Verfahren. Anschließend erfolgt eine Bewertung, ob die in der Datenbank vorhandenen bzw. gesammelten Information ausreichend für die Beantwortung der Frage des Nutzers sind.
-
Falls in Verfahrensschritt 106 bestimmt wird, dass die Frage des Nutzers nicht mit den in der Datenbank enthaltenen Informationen beantwortet werden kann, umfasst das Verfahren 100 ein Aufbauen 108 einer Verbindung zu einem Kommunikationsgerät eines menschlichen Sachbearbeiters, um Informationen über die Frage des Nutzers an den menschlichen Sachbearbeiter zu übermitteln. Der menschliche Sachbearbeiter ist ein menschlicher Assistent bzw. ein persönlicher Berater eines Assistenzservices. Das Kommunikationsgerät ist ein Gerät wie z.B. ein Computer, ein Telefon, ein Mobiltelefon, ein Tablet-Computer oder dergleichen, das die übermittelten Informationen bzgl. der Frage des Nutzers an den menschlichen Sachbearbeiter in einer Form ausgeben kann, die für den menschlichen Sachbearbeiter wahrnehmbar ist. Beispielsweise können die übermittelten Informationen bzgl. der Frage des Nutzers graphisch in Form eines Textes an den menschlichen Sachbearbeiter ausgegeben werden. Alternativ können die Informationen über die Frage des Nutzers gemäß bekannten Verfahren zur Sprachsynthese (engl. Text-To-Speech, TTS) in eine Sprachausgabe für den menschlichen Sachbearbeiter umgesetzt und die Sprachausgabe für den menschlichen Sachbearbeiter an das Kommunikationsgerät des menschlichen Sachbearbeiters übertragen werden. Der menschliche Sachbearbeiter kann die Frage des Nutzers entsprechend wahrnehmen und eine Antwort auf die Frage des Nutzers erarbeiten.
-
Das Verfahren 100 umfasst weiterhin ein Empfangen 110 von Informationen zur Beantwortung der Frage des Nutzers von dem Kommunikationsgerät des menschlichen Sachbearbeiters. Die Informationen zur Beantwortung der Frage des Nutzers können wiederum in vielfältiger Weise empfangen werden. Beispielsweise können die Informationen zur Beantwortung der Frage des Nutzers in Textform empfangen werden. Mit anderen Worten: Der menschliche Sachbearbeiter kann über das Kommunikationsgerät einen Antworttext zur Beantwortung der Frage des Nutzers übermitteln. Alternativ kann auch eine gesprochene Antwort des menschlichen Sachbearbeiters von dem Kommunikationsgerät des menschlichen Sachbearbeiters empfangen werden. Die gesprochene Antwort des menschlichen Sachbearbeiters wird dann mittels Spracherkennung in weiteren Text umgesetzt und der weitere Text anschließend interpretiert, um die Informationen zur Beantwortung der Frage des Nutzers zu bestimmen. Zwischen dem menschlichen Sachbearbeiter und einem Datenverarbeitungssystem auf dem das Verfahren 100 abläuft kann somit eine Art Dialog zur Beantwortung der Frage des Nutzers erfolgen.
-
Das Verfahren 100 umfasst zudem ein Speichern 112 der empfangenen Informationen zur Beantwortung der Frage des Nutzers in der Datenbank sowie ein Umsetzen 114 der Informationen zur Beantwortung der Frage des Nutzers in eine Sprachausgabe für den Nutzer.
-
Falls in Verfahrensschritt 106 bestimmt wird, dass die Frage des Nutzers bereits mit den in der Datenbank enthaltenen Informationen beantwortet werden kann, umfasst das Verfahren 100 ein Umsetzen 114 der in der Datenbank gesammelten Informationen zur Beantwortung der Frage des Nutzers in eine Sprachausgabe für den Nutzer. Entsprechend entfallen die oben beschriebenen Verfahrensschritte 108 bis 114. Mit anderen Worten: Der menschliche Sachbearbeiter wird nicht kontaktiert, falls die Frage des Nutzers bereits mit den in der Datenbank enthaltenen Informationen beantwortet werden kann.
-
Gemäß dem Verfahren 100 kann der Sprachanruf des Nutzers automatisiert mittels der in der Datenbank vorhandenen Informationen beantwortet werden. Auf menschlichen Sachbearbeiter bzw. persönliche Berater des Assistenzservices muss gemäß dem Verfahren 100 nur zurückgegriffen, falls eine Frage nicht mit den in der Datenbank enthaltenen Informationen beantwortet werden kann. Aufgrund der weitestgehend automatisierten Beantwortung des Sprachanrufs kann ein mit menschlichen Assistenten bzw. Sachbearbeitern operierender Assistenzservice entlastet werden. Da die zur Beantwortung der Frage des Nutzers empfangenen Informationen des menschlichen Sachbearbeiters ferner in der Datenbank gespeichert werden, kann die Menge an verfügbaren Informationen in der Datenbank vergrößert werden, so dass dieselbe oder eine ähnliche Frage bei zukünftigen Sprachanrufen vollautomatisch beantwortet werden kann. Die Zahl an automatisiert beantwortbaren Fragen kann somit mit jeder Anfrage beim menschlichen Sachbearbeiter vergrößert werden.
-
Das Verfahren 100 kann z.B. zur Assistenz eines Nutzers eines Fahrzeugs verwendet werden. Entsprechend kann ein Assistenzservice eines Herstellers des Fahrzeugs mit menschlichen Assistenten zum einen von typisch auftretenden Fragen des Nutzers entlastet werden. Zum anderen erhält der Nutzer zügig eine Antwort auf seine Frage.
-
Gemäß Ausführungsbeispielen können die in der Datenbank für die automatische Beantwortung von Sprachanrufen gespeicherten Informationen auch beschränkt sein. Die in der Datenbank gespeicherten Informationen können z.B. auf einzelne Themen- oder Sachgebiete beschränkt sein.
-
Bezogen auf Fahrzeuge kann die Datenbank beispielsweise so ausgestaltet sein, dass in der Datenbank keine Informationen über das Fahrzeug des Nutzers gespeichert sind. Mit anderen Worten: In der Datenbank sind keine Daten aus dem Fahrzeugökosystem wie etwa ein aktuelles Navigationsziel, ein aktueller Füllstand des Tanks bzw. Ladestand eines Akkumulators oder Informationen über eine Laufleistung des Fahrzeugs gespeichert. Daten aus dem Fahrzeugökosystem sind mitunter persönliche Daten des Nutzers, welche aus Gründen des Datenschutzes bzw. der Privatsphäre des Nutzers als auch aus Gründen der Fahrzeugsicherheit nicht allgemein für die Beantwortung von Sprachanrufen beliebiger Nutzer zur Verfügung stehen sollten.
-
Beim Bestimmen 106, ob die Frage des Nutzers mit in einer Datenbank enthaltenen Informationen beantwortet werden kann, kann auch geprüft werden, ob zur Beantwortung der Frage des Nutzers spezifische Informationen über das Fahrzeug des Nutzers benötigt werden. Falls bestimmt wird, dass zur Beantwortung der Frage des Nutzers spezifische Informationen über das Fahrzeug des Nutzers benötigt werden, umfasst das Verfahren 100 ein Abfragen der spezifischen Informationen über das Fahrzeug des Nutzers von einem Fahrzeuginformationssystems, da in der Datenbank selbst keine Informationen über das Fahrzeug des Nutzers gespeichert sind. Das Fahrzeuginformationssystem kann z.B. vom Hersteller des Fahrzeugs bereitgestellt sein und vorbestimmte Informationen des Fahrzeugs des Nutzers speichern. Ebenso kann das Fahrzeuginformationssystem eingerichtet sein, in Folge einer Abfrage von spezifischen Informationen über das Fahrzeug gemäß Verfahren 100, diese Informationen aus dem Fahrzeug abzurufen, um so anschließend für die automatisierte Beantwortung des Sprachanrufs zur Verfügung stellen zu können. Die vom Fahrzeuginformationssystem abgerufenen Daten werden nicht in der Datenbank gespeichert.
-
Frägt der Nutzer mittels des Sprachanrufs z.B. nach der nächstgelegenen Tankstelle, so wird die aktuelle Position seines Fahrzeugs zur Beantwortung der Frage benötigt. Die aktuelle Position des Fahrzeugs ist nicht in der Datenbank gespeichert und wird daher über das Fahrzeuginformationssystem abgefragt. Nach Erhalt der Informationen über die aktuelle Position des Fahrzeugs wird anschließend aus den in der Datenbank vorgehaltenen Informationen über Tankstellen die nächstgelegene Tankstelle ermittelt und in eine entsprechende Sprachausgabe für den Nutzer umgesetzt. Mit anderen Worten: Die in der Datenbank gesammelten Informationen zur Beantwortung der Frage des Nutzers werden zusammen mit den von dem Fahrzeuginformationssystem abgefragten spezifischen Informationen über das Fahrzeug des Nutzers in eine Sprachausgabe für den Nutzer umgesetzt.
-
In analoger Weise können auch vom Kommunikationsgerät des menschlichen Sachbearbeiters empfangenen Informationen zur Beantwortung der Frage des Nutzers mit von dem Fahrzeuginformationssystem abgefragten spezifischen Informationen über das Fahrzeug des Nutzers in eine Sprachausgabe für den Nutzer umgesetzt werden.
-
Die 2 und 3 zeigen Ablaufdiagramme eines weiteren Verfahrens 200 gemäß der vorgeschlagenen Technologie zur Beantwortung eines Sprachanrufs eines Fahrzeugnutzers. In 2 ist dabei der Fall gezeigt, dass eine Frage des Nutzers mit in einer Datenbank gespeicherten Informationen beantwortet werden kann. 3 zeigt den Fall, dass die in der Datenbank gespeicherten Informationen nicht zur Beantwortung der Frage ausreichen.
-
Wie 2 dargestellt, wird ein eingehender Sprachanruf 202 eines Nutzers 210 von einem interaktiven Sprachdialog (engl. Interactive Voice Response, IVR) -System 220 entgegengenommen. Bei Entgegennahme des Sprachanrufs 202 wird von dem IVR-System 220 zunächst eine sprachsynthetisierte Begrüßung 204 ausgegeben. Anschließend spricht der Nutzer 210 seine Frage, so dass das IVR-System 220 eine Spracheingabe 206 des Nutzers empfängt.
-
Das IVR-System 220 leitet eine Anfrage 208 für eine Spracherkennung der Spracheingabe 206 an ein Sprachumsetzungssystem 230 weiter. Das Sprachumsetzungssystem 230 setzt die Spracheingabe 206 des Nutzers mittels ASR in Text um und sendet diesen über eine entsprechende Antwort 212 zurück.
-
Anschließend sendet das IVR-System 220 eine Anfrage 214 für ein Dialogmanagementsystem 250 zur Beantwortung der in Text umgesetzten Spracheingabe 206 aus. Die Anfrage 214 wird über eine Schnittstelle 240 (z.B. ein Kommunikationsserver) an das Dialogmanagementsystem 250 weitergeleitet.
-
Das Dialogmanagementsystem 250 bestimmt aus der Textumsetzung der Spracheingabe 206 die Frage des Nutzers und durchsucht in einem Schritt 216 seine Datenbank. Dabei bestimmt das Dialogmanagementsystem 250, ob es die Frage des Nutzers mit den in der Datenbank vorgehaltenen Informationen beantworten kann.
-
Ebenso prüft das Dialogmanagementsystem 250, ob es zur Beantwortung der Frage des Nutzers spezifische Informationen über das Fahrzeug des Nutzers benötigt. Falls bestimmt wird, dass zur Beantwortung der Frage des Nutzers spezifische Informationen über das Fahrzeug des Nutzers benötigt werden, werden diese über eine Anfrage 218 bei einem Fahrzeuginformationssystem 260 (z.B. vom Fahrzeughersteller bereitgestellt bzw. betrieben) angefragt. Das Fahrzeuginformationssystem 260 übermittelt die angefragten Informationen über eine Antwort 222 an das Dialogmanagementsystem 250.
-
Bei dem in 2 dargestellten Fall reichen die in der Datenbank vorgehaltenen Informationen zur Beantwortung der Frage aus. Entsprechend formuliert das Dialogmanagementsystem 250 eine Antwort 224 auf die Frage des Nutzers basierend auf den in der Datenbank gesammelten Informationen und optional den vom Fahrzeuginformationssystem 260 abgefragten Informationen.
-
Die Antwort 224 des Dialogmanagementsystems 250 wird über die Schnittstelle 240 an das IVR-System 220 weitergeleitet.
-
Das IVR-System 220 leitet eine Anfrage 226 für eine Sprachsynthese der Antwort 224 des Dialogmanagementsystems 250 an das Sprachumsetzungssystem 230 weiter. Das Sprachumsetzungssystem 230 setzt die Antwort 224 des Dialogmanagementsystems 250 in Sprache um und sendet die in Sprache umgesetzte Antwort über eine entsprechende Antwort 228 an das IVR-System 230 zurück.
-
Das IVR-System 230 gibt die Antwort des Dialogmanagementsystems 250 dann in Form einer Sprachausgabe 232 an den Nutzer 210 aus, so dass die Frage des Nutzers 210 vollautomatisiert beantwortet wird.
-
Bei dem in 3 dargestellten Fall stellt das Dialogmanagementsystem 250 beim Durchsuchen 216 seiner Datenbank fest, dass die in der Datenbank vorgehaltenen Informationen zur Beantwortung der Frage nicht ausreichen.
-
Entsprechend sendet das Dialogmanagementsystem 250 eine Anfrage 234 für einen menschlichen Sachbearbeiter aus, um Informationen zur Beantwortung der Frage des Nutzers 210 zu erhalten.
-
Die Anfrage 234 wird über die Schnittstelle 240 an das IVR-System 220 weitergeleitet. Das IVR-System 220 veranlasst die Umsetzung der Anfrage 234 in Sprache mittels TTS über das Sprachumsetzungssystem 230, um eine Sprachausgabe 236 für den menschlichen Sachbearbeiter zu erhalten. Ferner baut das IVR-System 220 eine Verbindung zu einem Kommunikationsgerät 270 des menschlichen Sachbearbeiters (z.B. einem Call-Center Mitarbeiter) auf, um die Sprachausgabe 236 für den menschlichen Sachbearbeiter an das Kommunikationsgerät 270 zu übertragen.
-
Über die Verbindung empfängt das IVR-System 220 anschließend die gesprochene Antwort des menschlichen Sachbearbeiters von dem Kommunikationsgerät 270. Das IVR-System 220 veranlasst die Umsetzung der gesprochenen Antwort des menschlichen Sachbearbeiters in weiteren Text mittels des Sprachumsetzungssystems 230. Der weitere Text mit der Antwort des menschlichen Sachbearbeiters wird von dem IVR-System 220 über die Schnittstelle 240 an das Dialogmanagementsystem 250 weitergeleitet, welches die Antwort des menschlichen Sachbearbeiters in seiner Datenbank speichert und daraus eine Antwort auf die Frage des Nutzers formuliert.
-
Die Antwort des Dialogmanagementsystems 250 wird wie oben beschrieben wiederum über das IVR-System 220 an den Nutzer 210 ausgegeben.
-
Für das IVR-System 220 und das Sprachumsetzungssystem 230 kann beispielsweise ein bereits für einen Persönlichen Intelligenten Assistenten (IPA) des Fahrzeugs bestehendes Sprachökosystem genutzt werden. Effektiv wird das bereits bestehende Sprachökosystem des IPA gemäß der vorgeschlagenen Technologie somit um das Dialogmanagementsystem 250 erweitert, so dass eine Verknüpfung des IPA mit dem menschlichen Assistenzsystem des Fahrzeugherstellers erzielt wird. Das Dialogmanagementsystem 250 kann entsprechend als ein offboard, d.h. ein fahrzeugexternes, Dialogmanagementsystem ausgestaltet sein, das über eine Datenbank verfügt, in der häufig gestellte Fragen (engl. Frequently Asked Questions, FAQs) von Kunden abgebildet sind. Stellt das Dialogmanagementsystem bei einer Frage eines Kunden fest, dass es diese nicht beantworten kann, greift es gemäß der vorgeschlagenen Technologie über einen Kommunikationskanal auf den menschlichen Assistenzservice des Fahrzeugherstellers (z.B. BMW Concierge Service) zurück. Der Assistenzservice beantwortet die Frage dabei in einer Art und Weise, dass das Dialogmanagementsystem die Antwort eindeutig versteht und in geeigneter Weise an den fragenden Nutzer zurückgibt. Beispielsweise ist die Kommunikation zwischen dem Dialogmanagementsystem und dem Assistenzservice so gestaltet, dass dieser einem direkt Dialog zwischen dem Nutzer und dem Assistenzservice gleicht, jedoch sämtliche Interaktion über den Wissensknoten (d.h. die Datenbank) des Dialogmanagementsystems erfolgt. Derart kann das Dialogmanagementsystem aus dem Dialog mit dem Assistenzservice lernen und seine Wissensdatenbank effektiv und effizient befüllen. Da das Dialogmanagementsystem selbst keine Daten aus dem Fahrzeugökosystem hat, kann es z.B. über eine entsprechende Programmierschnittstelle (engl. Application Programming Interface, API) eine Get-Answer-Anfrage an das Fahrzeugökosystem (repräsentiert durch das Fahrzeuginformationssystem 260) richten, um sich bestimmte Parameter und Informationen zu besorgen.
-
Ein bestehendes Sprachökosystem kann mit der vorgeschlagenen Technologie effektiv um einen Bot, der einen Anruf für den Assistenzservice entgegennimmt, eine Kundenanfrage aus dem Anruf aufnimmt und sofern möglich eine automatisierte Antwort auf die Frage generiert, erweitert werden.
-
4 zeigt eine Übersicht über ein System umfassend ein Datenverarbeitungssystem 410 und ein Fahrzeug 440 gemäß der vorgeschlagenen Technologie. Das Datenverarbeitungssystem 410 dient der automatischen Beantwortung eines Sprachanrufs eines Nutzers des Fahrzeugs 440.
-
Das Fahrzeug 440 umfasst eine Sprachschnittstelle 441, die eingerichtet ist, eine Verbindung zu dem Datenverarbeitungssystem 410 aufzubauen, um den Sprachanruf des Nutzers an das Datenverarbeitungssystem 410 zu übertragen. Beispielsweise kann die Sprachschnittstelle 441 eines oder mehrere Mikrofon zur Aufnahme des Sprachanrufs sowie einen Sendeempfänger zur drahtlosen Übertragung der Sprachaufnahme des Sprachanrufs an das Datenverarbeitungssystem 410 umfassen. Die Verbindung zwischen dem Fahrzeug 440 und dem Datenverarbeitungssystem 410 kann z.B. über ein drahtloses lokales Netzwerk oder ein zelluläres Netzwerk erfolgen.
-
Das Datenverarbeitungssystem 410 umfasst eine Schnittstelle 411, die eingerichtet ist, den Sprachanruf des Nutzers von dem Fahrzeug 440 zu empfangen.
-
Ferner umfasst das Datenverarbeitungssystem 410, einen oder mehreren Prozessoren 412, die eingerichtet sind, den Sprachanruf gemäß den oben beschriebenen Grundsätzen der vorgeschlagenen Technologie zu verarbeiten, um eine Sprachausgabe für den Nutzer zur Beantwortung seiner Frage zu erzeugen.
-
Der eine oder die mehreren Prozessoren 412 sind somit eingerichtet, den Sprachanruf in Text umzusetzen und den Text zu interpretieren, um eine Frage des Nutzers zu bestimmen. Weiterhin sind der eine oder die mehreren Prozessoren 412 eingerichtet, gemäß den obigen Ausführungen zu bestimmen, ob die Frage des Nutzers mit in der Datenbank 413 enthaltenen Informationen beantwortet werden kann. Falls bestimmt wird, dass die Frage des Nutzers nicht mit den in der Datenbank 413 enthaltenen Informationen beantwortet werden kann, sind der eine oder die mehreren Prozessoren 412 eingerichtet, eine Verbindung zu einem Kommunikationsgerät 420 eines menschlichen Sachbearbeiters eines Assistenzservices des Fahrzeugherstellers aufzubauen, um Informationen über die Frage des Nutzers an den menschlichen Sachbearbeiter zu übermitteln. Der eine oder die mehreren Prozessoren 412 sind ferner eingerichtet, Informationen zur Beantwortung der Frage des Nutzers von dem Kommunikationsgerät 420 des menschlichen Sachbearbeiters zu empfangen. Weiterhin sind der eine oder die mehreren Prozessoren 412 eingerichtet, die empfangenen Informationen zur Beantwortung der Frage des Nutzers in der Datenbank 413 zu speichern und die Informationen zur Beantwortung der Frage des Nutzers in die Sprachausgabe für den Nutzer umzusetzen.
-
Falls bestimmt wird, dass die Frage des Nutzers mit den in der Datenbank 413 enthaltenen Informationen beantwortet werden kann, sind der eine oder die mehreren Prozessoren 412 eingerichtet, die in der Datenbank 413 gesammelten Informationen zur Beantwortung der Frage des Nutzers in die Sprachausgabe für den Nutzer umzusetzen.
-
Der eine oder die mehreren Prozessoren 412 sind gemäß Ausführungsbeispielen ferner eingerichtet, zu prüfen, ob zur Beantwortung der Frage des Nutzers spezifische Informationen über das Fahrzeug 440 benötigt werden. Wie bereits oben angedeutet, sind in der Datenbank 413 keine Informationen über das Fahrzeug 440 selbst gespeichert. Falls bestimmt wird, dass zur Beantwortung der Frage des Nutzers spezifische Informationen über das Fahrzeug 440 benötigt werden, sind der eine oder die mehreren Prozessoren 412 daher eingerichtet, die spezifischen Informationen über das Fahrzeug 440 von einem Fahrzeuginformationssystem 430 abzufragen. Die spezifische Informationen über das Fahrzeug 440 werden dann entsprechend den obigen Ausführungen mit den in der Datenbank 413 gesammelten Informationen oder den vom Kommunikationsgerät 420 des menschlichen Sachbearbeiters empfangen Informationen kombiniert vor der Umsetzung in die Sprachausgabe für den Nutzer.
-
Die Sprachausgabe für den Nutzer wird anschließend über die Schnittstelle 411 an die Sprachschnittstelle 441 des Fahrzeugs übertragen. Die Sprachschnittstelle 441 ist eingerichtet, die Sprachausgabe für den Nutzer nach Empfang von dem Datenverarbeitungssystem 410 an den Nutzer auszugeben, so dass der Nutzer die Antwort auf seine Frage erhält. Dazu kann die Sprachschnittstelle 441 einen oder mehrere Lautsprecher umfassen.
-
Die Aspekte und Merkmale, die zusammen mit einem oder mehreren der vorher detaillierten Beispiele und Figuren beschrieben sind, können auch mit einem oder mehreren der anderen Beispiele kombiniert werden, um ein gleiches Merkmal des anderen Beispiels zu ersetzen oder um das Merkmal in das andere Beispiel zusätzlich einzuführen.
-
Beispiele können weiterhin ein Programm mit einem Programmcode zum Ausführen eines oder mehrerer der obigen Verfahren sein oder sich darauf beziehen, wenn das Computerprogramm auf einem Computer, einem Prozessor oder einer sonstigen programmierbaren Hardwarekomponente ausgeführt wird. Schritte, Operationen oder Prozesse von verschiedenen, oben beschriebenen Verfahren können durch programmierte Computer oder Prozessoren ausgeführt werden. Beispiele können auch nicht-flüchtige maschinenlesbare Medien bzw. Programmspeichervorrichtungen, z. B. Digitaldatenspeichermedien, abdecken, die maschinen-, prozessor- oder computerlesbar sind und maschinenausführbare, prozessorausführbare oder computerausführbare Programme von Anweisungen codieren. Die Anweisungen führen einige oder alle der Schritte der oben beschriebenen Verfahren aus oder verursachen deren Ausführung. Die Programmspeichervorrichtungen können z. B. Digitalspeicher, magnetische Speichermedien wie beispielsweise Magnetplatten und Magnetbänder, Festplattenlaufwerke oder optisch lesbare Digitaldatenspeichermedien umfassen oder sein. Weitere Beispiele können auch Computer, Prozessoren oder Steuereinheiten, die zum Ausführen der Schritte der oben beschriebenen Verfahren programmiert sind, oder (feld)programmierbare Logik-Arrays ((F)PLAs = (Field) Programmable Logic Arrays) oder (feld-)programmierbare Gate-Arrays ((F)PGA = (Field) Programmable Gate Arrays), die zum Ausführen der Schritte der oben beschriebenen Verfahren programmiert sind, abdecken.
-
Ein Blockdiagramm kann zum Beispiel ein grobes Schaltdiagramm darstellen, das die Grundsätze der Offenbarung implementiert. Auf ähnliche Weise können ein Flussdiagramm, ein Ablaufdiagramm, ein Zustandsübergangsdiagramm, ein Pseudocode und dergleichen verschiedene Prozesse, Operationen oder Schritte repräsentieren, die zum Beispiel im Wesentlichen in einem maschinenlesbaren Medium dargestellt und so durch einen Computer oder Prozessor ausgeführt werden, ungeachtet dessen, ob ein solcher Computer oder Prozessor explizit gezeigt ist. In der Beschreibung oder in den Patentansprüchen offenbarte Verfahren können durch ein Bauelement implementiert werden, das ein Mittel zum Ausführen eines jeden der jeweiligen Schritte dieser Verfahren aufweist.
-
Es versteht sich, dass die Offenbarung mehrerer, in der Beschreibung oder den Ansprüchen offenbarter Schritte, Prozesse, Operationen oder Funktionen nicht als in der bestimmten Reihenfolge befindlich ausgelegt werden soll, sofern dies nicht explizit oder implizit anderweitig, z. B. aus technischen Gründen, angegeben ist. Daher werden diese durch die Offenbarung von mehreren Schritten oder Funktionen nicht auf eine bestimmte Reihenfolge begrenzt, es sei denn, dass diese Schritte oder Funktionen aus technischen Gründen nicht austauschbar sind. Ferner kann bei einigen Beispielen ein einzelner Schritt, Funktion, Prozess oder Operation mehrere Teilschritte, -funktionen, -prozesse oder -operationen einschließen und/oder in dieselben aufgebrochen werden. Solche Teilschritte können eingeschlossen sein und Teil der Offenbarung dieses Einzelschritts sein, sofern sie nicht explizit ausgeschlossen sind.