DE102011103528A1

DE102011103528A1 - Modulare Spracherkennungsarchitektur

Info

Publication number: DE102011103528A1
Application number: DE102011103528A
Authority: DE
Inventors: Robert D. Sims
Original assignee: GM Global Technology Operations LLC
Current assignee: GM Global Technology Operations LLC
Priority date: 2010-06-10
Filing date: 2011-06-07
Publication date: 2011-12-15
Also published as: CN102280105A; US20110307250A1

Abstract

Ein Spracherkennungssystem wird geschaffen. Das Spracherkennungssystem umfasst ein Spracherkennungsmodul; mehrere domänenspezifische Dialogmanagermodule, die mit dem Spracherkennungsmodul kommunizieren, um eine Spracherkennung durchzuführen; und ein Sprachschnittstellenmodul, das mit den mehreren domänenspezifischen Dialogmanagermodulen kommuniziert, um selektiv die Spracherkennung zu aktivieren.

Description

GEBIET DER ERFINDUNG
Beispielhafte Ausführungsformen der vorliegenden Erfindung beziehen sich auf Spracherkennungssysteme und insbesondere auf Spracherkennungssysteme und -verfahren für Fahrzeuganwendungen.
HINTERGRUND
Die Spracherkennung wandelt gesprochene Worte in Text um. Verschiedene Spracherkennungsanwendungen machen von dem Text Gebrauch, um eine Dateneingabe durchzuführen, um Baugruppen zu steuern und/oder um Dokumente zu erstellen.
Fahrzeuge können beispielsweise mehrere Anwendungen mit Spracherkennungsfähigkeiten umfassen. Systeme wie z. B. Navigationssysteme, Radiosysteme, Telematiksysteme, Telefonsysteme und Mediensysteme können beispielsweise jeweils eine Spracherkennungsanwendung umfassen. Jede Spracherkennungsanwendung wird unabhängig entwickelt und geprüft, bevor sie in die Fahrzeugarchitektur eingebaut wird. Eine solche unabhängige Entwicklung und Prüfung können redundant und zeitraubend sein. Folglich ist es erwünscht, ein einzelnes Spracherkennungssystem zu schaffen, das auf die Systeme des Fahrzeugs anwendbar sein kann.
ZUSAMMENFASSUNG DER ERFINDUNG
In einer beispielhaften Ausführungsform wird ein Spracherkennungssystem geschaffen. Das Spracherkennungssystem umfasst ein Spracherkennungsmodul; mehrere domänenspezifische Dialogmanagermodule, die mit dem Spracherkennungsmodul kommunizieren, um eine Spracherkennung durchzuführen; und ein Sprachschnittstellenmodul, das mit den mehreren domänenspezifischen Dialogmanagermodulen kommuniziert, um selektiv die Spracherkennung zu aktivieren.
Die obigen Merkmale und Vorteile und weitere Merkmale und Vorteile der vorliegenden Erfindung sind aus der folgenden ausführlichen Beschreibung der Erfindung in Verbindung mit den begleitenden Zeichnungen leicht ersichtlich.
KURZBESCHREIBUNG DER ZEICHNUNGEN
Weitere Aufgaben, Merkmale, Vorteile und Details zeigen sich nur beispielhaft in der folgenden ausführlichen Beschreibung von Ausführungsformen, wobei die ausführliche Beschreibung auf die Zeichnungen Bezug nimmt, in denen:
1 eine Darstellung eines Fahrzeugs mit einem modularen Spracherkennungssystem gemäß einer beispielhaften Ausführungsform ist;
2 bis 6 Datenflussidagramme sind, die das modulare Spracherkennungssystem gemäß beispielhaften Ausführungsformen darstellen; und
7 bis 9 Sequenzdiagramme sind, die modulare Spracherkennungsverfahren gemäß einer beispielhaften Ausführungsform darstellen.
BESCHREIBUNG DER AUSFÜHRUNGSFORMEN
Die folgende Beschreibung ist dem Wesen nach lediglich beispielhaft und soll die vorliegende Offenbarung, Anwendung oder Verwendungen nicht begrenzen. Selbstverständlich geben in den ganzen Zeichnungen entsprechende Bezugszeichen gleiche oder entsprechende Teile und Merkmale an. Wie hier verwendet, bezieht sich der Begriff Modul auf eine anwendungsspezifische integrierte Schaltung (ASIC), eine elektronische Schaltung, einen Prozessor (gemeinsam genutzt, zweckgebunden oder Gruppe) und einen Speicher, die ein oder mehrere Software- oder Firmwareprogramme ausführen, eine kombinatorische Logikschaltung und/oder andere geeignete Komponenten, die die beschriebene Funktionalität bereitstellen.
Gemäß beispielhaften Ausführungsformen der vorliegenden Erfindung wird ein modulares Spracherkennungssystem 10 als in einem Fahrzeug 12 mit mehreren sprachabhängigen Anwendungen enthalten gezeigt. Solche Anwendungen können beispielsweise eine Telefonanwendung 14, eine Navigationsanwendung 16, eine Medienanwendung 18, eine Telematikanwendung 20, eine Netzanwendung 22 oder irgendeine andere Sprachanwendung für Fahrzeuge umfassen, sind jedoch nicht darauf begrenzt. Wie zu erkennen ist, kann das modulare Spracherkennungssystem 10 auf verschiedene andere Systeme mit mehreren sprachabhängigen Anwendungen anwendbar sein und ist folglich nicht auf das vorliegende Fahrzeugbeispiel begrenzt.
Im Allgemeinen verwaltet das modulare Spracherkennungssystem 10 eine Spracheingabe, die beispielsweise von einem Mikrophon 24 empfangen wird. Im vorliegenden Beispiel wird die Spracheingabe von einem Fahrer oder Insassen des Fahrzeugs 12 vorgesehen, so dass sie mit einer oder mehreren der sprachabhängigen Anwendungen 14–22 zusammenwirkt. Das modulare Spracherkennungssystem 10 wird gemäß einer modularisierten Systemarchitektur implementiert, die jede der verschiedenen Spracherkennungsdomänen aufnimmt. Das modularisierte System ermöglicht, dass verschiedene Anwendungen mit dem Spracherkennungssystem 10 verbinden und dieses verwenden. Eine Steuerlogik für eine spezielle Domäne, die mit einer speziellen Anwendung in Beziehung steht, kann beispielsweise individuell entwickelt und/oder kalibriert werden. Wenn diese Domäne oder Anwendung in das Fahrzeug 12 eingebaut wird, kann die Steuerlogik in das modulare Spracherkennungssystem 10 geladen werden oder auf sie kann durch das modulare Spracherkennungssystem 10 beispielsweise über ein Netz 26 zugegriffen werden. Das Netz 26 kann ein beliebiges verdrahtetes oder drahtloses Netz innerhalb oder außerhalb des Fahrzeugs 12 sein. In dieser Weise kann die Steuerlogik für jede Anwendung oder Domäne ohne Ändern der Spracherkennungsfunktionalität aktualisiert werden.
Mit Bezug auf 2 bis 6 stellen Datenflussdiagramme das modulare Spracherkennungssystem 10 gemäß verschiedenen Ausführungsformen dar. Wie zu erkennen ist, können verschiedene Ausführungsformen von modularen Spracherkennungssystemen 10 gemäß der vorliegenden Offenbarung eine beliebige Anzahl von Modulen umfassen. Die in 2 gezeigten Module können kombiniert und/oder weiter unterteilt werden, um die Spracherkennung für die mehreren sprachabhängigen Anwendungen 14–22 ähnlich zu verwalten. Eingaben in das modulare Spracherkennungssystem 10 können von einer oder mehreren sensorischen Eingaben des Fahrzeugs 12 (1) empfangen werden, von anderen Modulen (nicht dargestellt) innerhalb des Fahrzeugs 12 (1) empfangen werden, durch andere Module (nicht dargestellt) innerhalb des modularen Spracherkennungssystems 10 bestimmt/modelliert werden und/oder von einer externen Quelle über ein Netz (z. B. das Internet) empfangen werden.
In verschiedenen Ausführungsformen umfasst das modulare Spracherkennungssystem 10 ein Mensch-Maschine-Schnittstellen-Modul (HMI-Modul) 30, ein Sprachschnittstellenmodul 32, ein oder mehrere domänenspezifische Dialogmanagermodule 34–42 und ein Spracherkennungsmodul 44. Die domänenspezifischen Dialogmanagermodule können beispielsweise ein Telefondialogmanagermodul 34, ein Navigationsdialogmanagermodul 36, ein Mediendialogmanagermodul 38, ein Telematikdialogmanagermodul 40 und ein Netzdialogmanagermodul 42 umfassen, ohne jedoch darauf begrenzt zu sein.
Das HMI-Modul 30 koppelt mit dem Sprachschnittstellenmodul 32 über eine Schnittstelle. Das HMI-Modul 30 verwaltet die Wechselwirkung zwischen einer Benutzerschnittstelle der sprachabhängigen Anwendung 14–20 (1) und dem Benutzer. Wie in 3 gezeigt, empfangt das HMI-Modul 30 beispielsweise eine Benutzereingabe 50 als Eingabe. Die Benutzereingabe 50 kann auf der Basis der Wechselwirkung eines Benutzers mit einer Benutzerschnittstelle der sprachabhängigen Anwendung 14–20 (1) erzeugt werden. Auf der Basis der Benutzereingabe 50 bestimmt das HMI-Modul 30, wann eine Spracherkennung erwünscht ist, und erzeugt eine Anforderung zum Aktivieren der Spracherkennung. Die Anforderung kann einen Sprachtastenidentifizierer 52 umfassen, der identifiziert, welche Anwendung die Spracherkennung anfordert. Nachdem die Spracherkennung aktiviert wurde, liefert das HMI-Modul 30 eine Anzeigerückmeldung oder steuert ein oder mehrere Merkmale der sprachabhängigen Anwendung 14–20 (1) über die Anzeige/Handlung 59 auf der Basis von Spracherkennungsinformationen 51. Die Spracherkennungsinformationen 51 können vom Sprachschnittstellenmodul 32 empfangen werden. Wie nachstehend genauer erörtert wird, können die Spracherkennungsinformationen 51 eine Sprachanzeige 54, eine Sprachhandlung 56 und einen HMI-Zustand 58 umfassen.
Mit Rückbezug auf 2 koppelt das Sprachschnittstellenmodul 32 über eine Schnittstelle mit dem HMI-Modul 30 und den verschiedenen domänenspezifischen Dialogmanagermodulen 34–42, um die Spracherkennung zu koordinieren. Wie in 4 gezeigt, verwaltet das Sprachschnittstellenmodul 32 beispielsweise ankommende Anforderungen vom HMI-Modul. Die ankommenden Anforderungen können Anforderungen zum Aktivieren der Spracherkennung umfassen, wie beispielsweise die Sprachtastenidentifizierer 52. In verschiedenen Ausführungsformen können die ankommenden Anforderungen kontextspezifische Domäneninformationen umfassen.
Auf der Basis der ankommenden Anforderungen koordiniert das Sprachschnittstellenmodul 32 mit einem oder allen der domänenspezifischen Dialogmanagermodule 34–42, um die Spracherkennung auszuführen. Das Sprachschnittstellenmodul 32 kann beispielsweise Domäneninformationen 60 von den domänenspezifischen Dialogmanagermodulen 34–42 empfangen, die die verfügbaren Grammatiklisten oder Landessprachmodelle für die oberen Befehle, die den Domänen zugeordnet sind, umfassen. Auf der Basis des Sprachtastenidentifizierers 52 und der Domäneninformationen 60 kann das Sprachschnittstellenmodul 32 einen Ladebefehl 62 für alle domänenspezifischen Dialogmanagermodule 34–42 zum Laden einer Grammatik und/oder eines Landessprachmodells oberer Ebene oder einen Ladebefehl 62 zum Laden einer Grammatik, die einem spezifischen Ereignis einer speziellen Domäne zugeordnet ist, senden.
Das Sprachschnittstellenmodul 32 verwaltet ferner Rückmeldungsinformationen 63 von den domänenspezifischen Dialogmanagermodulen 34–42. Wie nachstehend genauer erörtert wird, können die Rückmeldungsinformationen 63 eine Anzeigerückmeldung 64 und einen aktuellen Zustand 66 umfassen. Auf der Basis der Rückmeldungsinformationen 63 meldet das Sprachschnittstellenmodul 32 die Spracherkennungs-Rückmeldungsinformationen an das HMI-Modul 30 über eine Sprachanzeige 54, eine Sprachhandlung 56 und/oder einen HMI-Zustand 58. Die Sprachanzeige 54 umfasst die Anzeigeinformationen zum Anzeigen der erkannten Ergebnisse. Die Sprachhandlung 56 umfasst Spracherkennungsinformationen zum Steuern von sprachfähigen Komponenten (z. B. Abstimmen des Radios, Wiedergeben von Musik usw.). Der HMI-Zustand 58 umfasst den aktuellen Zustand der System-HMI.
Mit Rückbezug auf 2 koppeln die verschiedenen domänenspezifischen Dialogmanagermodule 34–42 über eine Schnittstelle mit dem Sprachschnittstellenmodul 32 und dem Spracherkennungsmodul 44. Jedes domänenspezifische Dialogmanagermodul 34–42 steuert den Dialog zwischen dem Benutzer und der Benutzerschnittstelle auf der Basis der domänenspezifischen Steuerlogik. Die Steuerlogik kann eine Anzeigelogik, eine Spracherkennungslogik und eine Fehlerlogik umfassen, ist jedoch nicht darauf begrenzt. In verschiedenen Ausführungsformen umfasst jedes domänenspezifische Dialogmanagermodul 34–42 eine oder mehrere Grammatiken und ein Landessprachmodell für diese spezifische Domäne, Die domänenspezifischen Dialogmanagermodule 34–42 steuern die Spracherkennung auf der Basis der Spracherkennungslogik, der Grammatik und des Landessprachmodells.
Wie in 5 gezeigt, kann jedes Domänendialogmanagermodul 34–42 Domäneninformationen 60 zum Sprachschnittstellenmodul 32 liefern. Die Domäneninformationen 60 können Steuertastenidentifizierer, die dieser Domäne zugeordnet sind, und eine Liste der verfügbaren Grammatiken und/oder Landessprachmodelle von diesem Modul umfassen, ohne jedoch darauf begrenzt zu sein. Das domänenspezifische Dialogmanagermodul 34–42 kann dafür einen Ladebefehl 62 zum Laden von einer oder mehreren Grammatiken und/oder Landessprachmodulen in das Spracherkennungsmodul 44 empfangen.
Jedes domänenspezifische Dialogmanagermodul 34–42 überträgt die Grammatik und/oder das Landessprachmodell 70 und eine Grammatiksteueranforderung 68 zum Spracherkennungsmodul 44 auf der Basis der Spracherkennungslogik und des Ladebefehls 62. Das domänenspezifische Dialogmanagermodul 34–42 empfängt dafür ein erkanntes Ergebnis 72 vom Spracherkennungsmodul 44. Jedes domänenspezifische Dialogmanagermodul 34–42 bestimmt die Anzeigerückmeldung 64 und den aktuellen Zustand 66 auf der Basis des erkannten Ergebnisses 72 und der Anzeigelogik und/oder der Fehlerlogik.
In verschiedenen Ausführungsformen können ein oder mehrere domänenspezifische Dialogmanagermodule 34–40 durch das Netzschnittstellenmodul 42 ersetzt oder als dieses verwendet werden. Wie zu erkennen ist, können die Steuerlogik, die Grammatik und/oder das Landessprachmodell ein Teil des Netzschnittstellenmoduls 42 ähnlich zu den anderen domänenspezifischen Dialogmanagermodulen sein. Alternativ kann die Steuerlogik entfernt angeordnet sein und mit ihr kann über das Netzschnittstellenmodul 42 kommuniziert werden. In verschiedenen anderen Ausführungsformen kann das Netzschnittstellenmodul 42 eine Steuerlogik zum Kommunizieren zwischen den Modulen umfassen. Wenn beispielsweise das Modul A eine spezifische Spracherkennungs-HMI-Logik enthält, kann das Modul A mit dem Modul B unter Verwendung des Netzschnittstellen-Dialogmanagermoduls 42 kommunizieren.
Mit Rückbezug auf 2 koppelt das Spracherkennungsmodul 44 mit jedem der domänenspezifischen Dialogmanagermodule 34–42 über eine Schnittstelle. Das Spracherkennungsmodul 44 führt eine Spracherkennung an vom Benutzer geäußerter Sprache durch. Wie in 6 gezeigt, empfängt das Spracherkennungsmodul 44 beispielsweise als Eingabe den vom Benutzer geäußerten Sprachbefehl 74. Das Spracherkennungsmodul 44 führt eine Spracherkennung am Sprachbefehl 74 auf der Basis der Grammatik und/oder des Landessprachmodells 70, die vom domänenspezifischen Dialogmanagermodul 34–42 empfangen werden, durch. Das Spracherkennungsmodul 44 lädt selektiv eine spezielle Grammatik, die im Spracherkennungsprozess verwendet werden soll, auf der Basis der Grammatiksteueranforderung 68, die vom spezifischen Dialogmanagermodul 34–42 ausgegeben wird. Die Grammatiksteueranforderung 68 kann eine Anforderung für ein spezielles statistisches Landessprachmodell umfassen. Das Spracherkennungsmodul 44 erzeugt dann das erkannte Ergebnis 72. Das erkannte Ergebnis 72 kann beispielsweise ein Ergebnis und/oder einen aktuellen Zustand des Erkennungsprozesses umfassen. Das erkannte Ergebnis 72 kann zum anfordernden domänenspezifischen Dialogmanagermodul 34–42 übertragen werden.
Mit Bezug auf 7 bis 9 stellen Sequenzdiagramme Spracherkennungsverfahren, die vom Modulspracherkennungssystem 10 (1) durchgeführt werden können, gemäß beispielhaften Ausführungsformen dar. Insbesondere stellt 7 ein Initialisierungsverfahren gemäß einer beispielhaften Ausführungsform dar. 8 stellt ein Managerdownloadverfahren gemäß einer beispielhaften Ausführungsform dar. 9 stellt ein Sprachwechselwirkungsverfahren gemäß einer beispielhaften Ausführungsform dar.
Wie in 7 gezeigt, fordert bei der Initialisierung eines geladenen Dialogmanagermoduls durch das HMI-Modul 30 bei 100 das Sprachschnittstellenmodul 32 domänenspezifische Steuerinformationen bei 102 an. Das spezielle Dialogmanagermodul 34–42 gibt die domänenspezifischen Steuerinformationen bei 104 zurück. Bei der Initialisierung eines entfernten Dialogmanagermoduls bei 106 fordert das Sprachschnittstellenmodul 32 bei 108 domänenspezifische Steuerinformationen an. Das Dialogmanagermodul 34–42 gibt die domänenspezifischen Steuerinformationen bei 110 zurück. Das Dialogmanagermodul 34–42 sendet dann seine Grammatik zum Spracherkennungsmodul 44 und registriert sie bei 112 und 114. Bei der Vollendung der Registrierung bestätigt das Spracherkennungsmodul 44 bei 116, dass die Registrierung vollständig ist.
Wie in 8 gezeigt, beginnt die Sequenz damit, dass das Sprachschnittstellenmodul 32 einen Download eines speziellen Dialogmanagermoduls 34–42 von irgendeiner externen Quelle bei 120 durchführt. Bei Vollendung des Downloads erzeugt das Sprachschnittstellenmodul 32 eine Anforderung zum Erzeugen oder Austauschen einer Schnittstelle, die dem Dialogmanagermodul 34–42 zugeordnet ist, und/oder eine Anforderung zum Erhalten von domänenspezifischen Schnittstelleninformationen bei 122 und 124. Das Dialogmanagermodul 34–42 gibt die domänenspezifischen Schnittstelleninformationen bei 126 zurück. Das Dialogmanagermodul 34–42 liefert dann seine Grammatik zum Spracherkennungsmodul 44 und registriert sie bei 128 und 130. Bei der Vollendung der Registrierung bestätigt das Spracherkennungsmodul 44 bei 132, dass die Registrierung vollständig ist. Nach dem Download des Dialogmanagermoduls 34–42 kann das Dialogmanagermodul 34–42 gespeichert werden, wenn es nicht ausgetauscht oder entfernt wird. Nach dem Download kann die reguläre Domäneninitialisierung durchgeführt werden, wie in 7 gezeigt.
Wie in 9 gezeigt, beginnt die Sequenz damit, dass ein Benutzer bei 140 eine Sprachtaste der Benutzerschnittstelle drückt. Das HMI-Modul 30 ruft dann das Sprachereignis auf der Basis des Sprachtastenidentifizierers bei 142 auf. Das Sprachschnittstellenmodul 32 stellt bei 144 fest, ob das Sprachereignis sich auf ein spezifisches Dialogmanagermodul 34–42 bezieht. Wenn sich das Sprachereignis auf ein spezifisches Dialogmanagermodul 34–42 bezieht, ruft das Sprachschnittstellenmodul 32 das für das Dialogmanagermodul spezifische Ereignis bei 146 auf. Wenn sich jedoch das Sprachereignis nicht auf ein spezifisches Dialogmanagermodul 34–42 bezieht, ruft das Sprachschnittstellenmodul 32 bei 148 alle Dialogmanagermodule zum Laden einer Grammatik oberer Ebene auf. Die Grammatiken und/oder Landessprachmodelle werden bei 150 oder 152 geladen. Der Benutzer äußert dann bei 154 einen Sprachbefehl. Unter Verwendung der geladenen Grammatik führt das Spracherkennungsmodul 44 auf die Äußerung hin eine Spracherkennung bei 156 durch. Das Spracherkennungsmodul 44 gibt die erkannten Ergebnisse an das Dialogmanagermodul bei 158 zurück. Das Dialogmanagermodul benachrichtigt das Sprachschnittstellenmodul 32 über die Ergebnisse bei 160. Das Sprachschnittstellenmodul 32 benachrichtigt das HMI-Modul über die Ergebnisse bei 162. Und der Betrachter betrachtet die Ergebnisse bei 164. Die Sequenz fährt fort, bis der Dialog vollendet ist.
Obwohl die Erfindung mit Bezug auf beispielhafte Ausführungsformen beschrieben wurde, ist für den Fachmann auf dem Gebiet verständlich, dass verschiedene Änderungen durchgeführt werden können und Elemente davon gegen Äquivalente ausgetauscht werden können, ohne vom Schutzbereich der Erfindung abzuweichen. Außerdem können viele Modifikationen vorgenommen werden, um eine spezielle Situation oder ein spezielles Material an die Lehren der Erfindung anzupassen, ohne von deren wesentlichem Schutzbereich abzuweichen. Daher ist vorgesehen, dass die Erfindung nicht auf die speziellen Ausführungsformen begrenzt ist, die als beste Art offenbart wurden, die zur Ausführung dieser Erfindung in Erwägung gezogen wird, sondern dass die Erfindung alle Ausführungsformen umfasst, die in den Schutzbereich der vorliegenden Anmeldung fallen.

Claims

Spracherkennungssystem, das umfasst: ein Spracherkennungsmodul; mehrere domänenspezifische Dialogmanagermodule, die mit dem Spracherkennungsmodul kommunizieren, um eine Spracherkennung durchzuführen; und ein Sprachschnittstellenmodul, das mit den mehreren domänenspezifischen Dialogmanagermodulen kommuniziert, um selektiv die Spracherkennung zu aktivieren.
System nach Anspruch 1, das ferner ein Mensch-Maschine-Schnittstellenmodul (HMI-Modul) umfasst, das mit dem Sprachschnittstellenmodul auf der Basis einer Benutzereingabe kommuniziert.
System nach Anspruch 2, wobei das Sprachschnittstellenmodul Spracherkennungsergebnisse an das HMI-Modul überträgt.
System nach Anspruch 3, wobei die domänenspezifischen Dialogmanagermodule die Spracherkennungsergebnisse an das Sprachschnittstellenmodul übertragen.
System nach Anspruch 1, wobei die mehreren domänenspezifischen Dialogmanagermodule jeweils eine domänenspezifische Steuerlogik umfassen.
System nach Anspruch 1, wobei die mehreren domänenspezifischen Dialogmanagermodule mindestens eine Grammatik umfassen.
System nach Anspruch 1, wobei die mehreren domänenspezifischen Dialogmanagermodule ein Landessprachmodell umfassen.
System nach Anspruch 1, wobei die mehreren domänenspezifischen Dialogmanagermodule ein Telefondialogmanagermodul und/oder ein Navigationsdialogmanagermodul und/oder ein Mediendialogmanagermodul und/oder ein Telematikdialogmanagermodul umfassen.
System nach Anspruch 1, wobei mindestens eines der mehreren domänenspezifischen Dialogmanagermodule ein Netzschnittstellen-Managermodul umfasst.
Fahrzeug, das umfasst: mehrere sprachfähige Anwendungen; und ein Spracherkennungssystem, das mit jeder der mehreren sprachfähigen Anwendungen kommuniziert, um eine Spracherkennung durchzuführen.