-
HINTERGRUND DER ERFINDUNG
-
In Suchmaschinen, Empfehlungssystemen und Sprachschnittstellen für Applikationen werden Suchergebnisse und Spracherkennung basierend auf Suchhistorie und zurückliegenden Mustern eines einzelnen Benutzers optimiert. Natürliche Sprache ist jedoch kompliziert und das gleiche Wort oder der gleiche Satz kann in Abhängigkeit von den Benutzerinteressen, Kontext, Situation und dergleichen verschiedene Dinge bedeuten. Als Ergebnis sind viele existierende Verfahren zur Spracherkennung und Suche ungenau.
-
Figurenliste
-
Die beigefügten Abbildungen, bei denen sich gleiche Bezugszahlen auf identische oder funktional ähnliche Elemente in den einzelnen Ansichten beziehen, sind zusammen mit der folgenden detaillierten Beschreibung einbezogen in die Beschreibung und bilden einen Teil derselben und dienen zum weiteren Veranschaulichen von Ausführungsformen und Konzepten, die die beanspruchte Erfindung beinhalten, und erklären verschiedene Prinzipien und Vorteile dieser Ausführungsformen.
- 1 ist eine Skizze eines Systems zum Optimieren von Spracherkennung und Informationssuche gemäß einigen Ausführungsformen.
- 2 ist eine Skizze eines Anrufcontrollers gemäß einigen Ausführungsformen.
- 3 ist eine Skizze einer Kommunikationsvorrichtung gemäß einigen Ausführungsformen.
- 4 ist eine Skizze eines Verfahrens zum Verbessern von Spracherkennung und Informationssuche gemäß einigen Ausführungsformen.
-
Fachleute werden erkennen, dass Elemente in den Figuren zum Zwecke der Einfachheit und Klarheit veranschaulicht sind und nicht notwendigerweise maßstabsgetreu gezeichnet sind. Zum Beispiel können die Abmessungen einiger der Elemente in den Figuren im Vergleich zu anderen Elementen übertrieben sein, um dabei zu helfen, das Verständnis von Ausführungsformen der vorliegenden Erfindung zu verbessern.
-
Die Vorrichtungs- und Verfahrenskomponenten wurden dort, wo es angemessen erscheint, durch konventionelle Symbole in den Zeichnungen dargestellt, wobei nur jene spezifischen Einzelheiten gezeigt werden, die für ein Verständnis der Ausführungsformen der vorliegenden Erfindung wesentlich sind, um so die Offenbarung nicht mit Einzelheiten zu verschleiern, die für jene Durchschnittsfachleute ohne weiteres erkennbar sind, die den Vorteil dieser Beschreibung genießen.
-
DETAILLIERTE BESCHREIBUNG DER ERFINDUNG
-
In Organisationen der öffentlichen Sicherheit haben es Ersthelfer häufig mit lauten Umgebungen zu tun. Bereits bestehende Verarbeitungstechniken sind eventuell nicht in der Lage in diesen lauten Umgebungen Sprache genau zu erkennen. Kommunikationssysteme der öffentlichen Sicherheit sind häufig in Gruppen organisiert (beispielsweise Gesprächsgruppen). In vielen Fällen werden Mitarbeitergruppen der öffentlichen Sicherheit entsandt für dieselbe Mission oder interessieren sich für ähnliche Dinge. Es ist auch wahrscheinlich, dass sie ähnliche Namen und Begriffe in ihren Kommunikationen verwenden werden.
-
Eine Ausführungsform stellt ein Verfahren zum Betreiben eines Anrufcontrollers bereit zum Verbessern von Spracherkennung und Informationssuche innerhalb einer Gesprächsgruppe. Das Verfahren beinhaltet das Bestimmen von Kontextdaten, die mit einer bestimmten Gesprächsgruppe, die eine Vielzahl von Kommunikationsvorrichtungen beinhaltet, assoziiert sind, und das Erzeugen einer Liste von gesprächsgruppenspezifischen Schlüsselwörtern, die mit den Kontextdaten assoziiert sind, die Liste von gesprächsgruppenspezifischen Schlüsselwörtern beinhaltet eine erste Charakteristik für jedes gesprächsgruppenspezifische Schlüsselwort. Das Verfahren beinhaltet auch das Empfangen, von einer ersten Kommunikationsvorrichtung der Vielzahl von Kommunikationsvorrichtungen, von Audiodaten, die mit einem Benutzer der ersten Kommunikationsvorrichtung assoziiert sind, und das Verarbeiten der Audiodaten, um einen anfänglichen Ausgabebegriff zu erzeugen. Das Verfahren beinhaltet ferner das Bestimmen einer zweiten Charakteristik des anfänglichen Ausgabebegriffs und das Bestimmen, ob die erste Charakteristik eines gesprächsgruppenspezifischen Schlüsselwortes aus der Liste von gesprächsgruppenspezifischen Schlüsselwörtern mit der zweiten Charakteristik des anfänglichen Ausgabebegriffs übereinstimmt. Das Verfahren beinhaltet auch das Ausgeben des gesprächsgruppenspezifischen Schlüsselwortes, wenn die erste Charakteristik mit der zweiten Charakteristik übereinstimmt.
-
Eine andere Ausführungsform stellt ein System bereit zum Optimieren von Spracherkennung und Informationssuche. Das System beinhaltet eine Vielzahl von Kommunikationseinrichtungen, die eine Gesprächsgruppe bilden. Das System beinhaltet ferner einen Anrufcontroller, der mit der Vielzahl von Kommunikationsvorrichtungen kommuniziert, die die Gesprächsgruppe bilden, und beinhaltet einen elektronischen Prozessor. Der elektronische Prozessor ist eingerichtet zum Bestimmen von Kontextdaten, die mit der Gesprächsgruppe, die die Vielzahl von Kommunikationsvorrichtungen beinhaltet, assoziiert sind, und erzeugt eine Liste von gesprächsgruppenspezifischen Schlüsselwörtern, die mit den Kontextdaten assoziiert sind, die Liste von gesprächsgruppenspezifischen Schlüsselwörtern beinhaltet eine erste Charakteristik für jedes gesprächsgruppenspezifische Schlüsselwort. Der elektronische Prozessor ist ferner konfiguriert zum Empfangen, von einer ersten Kommunikationsvorrichtung der Vielzahl von Kommunikationsvorrichtungen, von Audiodaten, die mit einem Benutzer der ersten Kommunikationsvorrichtung assoziiert sind, und verarbeitet die Audiodaten, um einen anfänglichen Ausgabebegriff zu erzeugen; der elektronische Prozessor ist ferner eingerichtet zum Bestimmen einer zweiten Charakteristik des anfänglichen Ausgabebegriffs und zum Bestimmen, ob die erste Charakteristik eines gesprächsgruppenspezifischen Schlüsselwortes aus der Liste von gesprächsgruppenspezifischen Schlüsselwörtern mit der zweiten Charakteristik des anfänglichen Ausgabebegriffs übereinstimmt. Der elektronische Prozessor gibt dann das gesprächsgruppenspezifische Schlüsselwort aus, wenn die erste Charakteristik mit der zweiten Charakteristik übereinstimmt.
-
1 ist eine Skizze einer Ausführungsform eines Systems 100 zum Verbessern von Spracherkennung und Informationssuche. In dem dargestellten Beispiel beinhaltet das System 100 einen Anrufcontroller 110. Der Anrufcontroller 110 kann beispielsweise ein Dispatch-Controller für eine Organisation der öffentlichen Sicherheit sein. Der Anrufcontroller 110 kommuniziert mit einer Vielzahl von Kommunikationsvorrichtungen 120A bis 120Z über ein Kommunikationsnetzwerk 130. Auf einer singulären Basis kann eine der Kommunikationsvorrichtungen 120A bis 120Z hierin als eine Kommunikationsvorrichtung 120 bezeichnet werden. Die Kommunikationsvorrichtungen 120A bis 120Z können beispielsweise mobile Zwei-Wege-Funkgeräte, ein Smartphone, eine Smartwatch, ein Laptop-Computer, ein Tablet-Computer oder andere ähnliche Vorrichtungen sein.
-
Das Kommunikationsnetzwerk 130 kann ein drahtgebundenes oder drahtloses Kommunikationsnetzwerk sein, wie zum Beispiel ein Mobilfunknetz, ein Landmobilfunk (LMR) -Netzwerk oder dergleichen. Teile des Kommunikationsnetzwerks 130 können implementiert sein unter Verwendung verschiedener Weitbereichsnetzwerke, beispielsweise dem Internet, und lokaler Bereichsnetzwerke, beispielsweise einem Bluetooth™-Netzwerk, einem drahtlosen lokalen Bereichsnetzwerk (beispielsweise Wi-Fi), sowie zukünftig entwickelter Netze oder einer Kombination davon.
-
Jede Kommunikationsvorrichtung 120 kann zu einer oder mehreren Gesprächsgruppen 140 gehören, zwischen denen der Benutzer der Kommunikationsvorrichtung 120 wechseln kann. Eine Gesprächsgruppe 140 ist ein virtueller Funkkanal auf einem digitalen Funksystem. Jeder Kommunikationsvorrichtung 120 in einer bestimmten Gesprächsgruppe 140 ist ein Gesprächsgruppenidentifizierer zugeordnet, der der Kommunikationsvorrichtung 120 erlaubt, mit anderen Kommunikationsvorrichtungen 120 zu kommunizieren, denen der gleiche Gesprächsgruppenidentifizierer zugeordnet ist. In dem dargestellten Beispiel gehören die Kommunikationsvorrichtungen 120A bis 120M zur Gesprächsgruppe 140A und die Kommunikationsvorrichtungen 120N bis 120Z gehören zur Gesprächsgruppe 140B. Beispielsweise gehören die Kommunikationsvorrichtungen 120A bis 120M, die an einem Gefahrgutmaterialeinsatz teilnehmen, zu der Gesprächsgruppe 140A. Zu Beginn des Gefahrgutmaterialeinsatzes werden die Kommunikationsvorrichtungen 120A bis 120M mit einem Gesprächsgruppenidentifizierer für die Gesprächsgruppe 140A versehen. Während des Gefahrgutmaterialeinsatzes, erlaubt die Gesprächsgruppe 140A den Benutzern der Kommunikationsvorrichtungen 120A bis 120M das Versenden von Kommunikationen zueinander und zu dem Anrufcontroller 110 über das Kommunikationsnetzwerk 130. Die Kommunikationsvorrichtungen 120 (und somit die Benutzer der Kommunikationsvorrichtungen 120) können einer Vielzahl von Gesprächsgruppen 140 zugeordnet sein. Wie in dieser Beschreibung verwendet, kann die Gesprächsgruppe 140 eine traditionelle statische oder dynamische Gesprächsgruppe, ein Ereignisbereichsnetzwerk mit mehreren Gesprächsgruppen, einen Geofence, Ausrüstung, die durch Mitglieder eines persönlichen Bereichsnetzwerks verwendet wird, und dergleichen beinhalten. In einigen Ausführungsformen kann die Ausrüstung 150 auch mit einer Gesprächsgruppe 140 assoziiert sein. Die Ausrüstung 150 kann beispielsweise einen intelligenten HAZMAT-Anzug, eine am Körper angebrachte Kamera, Pistolen, Feuerlöscher, und dergleichen beinhalten. Beispielsweise kann ein intelligenter HAZMAT-Anzug mit der Gesprächsgruppe 140A assoziiert sein, wenn die Kommunikationsvorrichtungen 120A bis 120M an einem Gefahrgutmaterialeinsatz teilnehmen.
-
1 stellt nur eine beispielhafte Ausführungsform eines Systems 100 dar. In anderen Ausführungsformen kann das System 100 mehr oder weniger Komponenten beinhalten und kann Funktionen ausführen, die hierin nicht explizit beschrieben sind. Zusätzlich kann, obwohl der Anrufcontroller 110 als mit allen Kommunikationsvorrichtungen 120A bis 120Z über ein einzelnes Kommunikationsnetzwerk 130 kommunizierend dargestellt ist, der Anrufcontroller 110 mit den Kommunikationsvorrichtungen 120A bis 120Z über mehrere Kommunikationsnetzwerke (konstruiert gemäß verschiedenen Netzwerkprotokollen) und Verbindungen (beispielsweise drahtgebundene oder drahtlose Verbindungen) kommunizieren. Ferner kann, obwohl das System 100 als zentralisiertes System gezeigt ist, das System 100 auch als ein dezentralisiertes System implementiert sein, in welchem die Funktionalität des Anrufcontrollers 110 in einer oder mehreren der Kommunikationsvorrichtungen 120 erreicht wird.
-
2 ist eine Skizze einer Ausführungsform des Anrufcontrollers 110. In dem dargestellten Beispiel beinhaltet der Anrufcontroller 110 einen elektronischen Prozessor 210, einen Speicher 220, einen Transceiver 230 und eine Eingabe/Ausgabe-Schnittstelle 240. Der elektronische Prozessor 210, der Speicher 220, der Transceiver 230 und die Eingabe/Ausgabe-Schnittstelle 240 kommunizieren über einen oder mehrere Kontroll- und/oder Datenbusse (beispielsweise einen Kommunikationsbus 250). 2 stellt nur eine beispielhafte Ausführungsform eines Anrufcontrollers 110 dar. Der Anrufcontroller 110 kann mehr oder weniger Komponenten beinhalten und kann andere als die hierin explizit beschriebenen Funktionen ausführen.
-
In einigen Ausführungsformen ist der elektronische Prozessor 210 als Mikroprozessor mit separatem Speicher, beispielsweise dem Speicher 220, implementiert. In anderen Ausführungsformen kann der elektronische Prozessor 210 als ein Mikrocontroller implementiert sein (mit Speicher 220 auf dem gleichen Chip). In anderen Ausführungsformen kann der elektronische Prozessor 210 unter Verwendung mehrerer Prozessoren implementiert sein. Zusätzlich kann der elektronische Prozessor 210 teilweise oder vollständig implementiert sein beispielsweise als feldprogrammierbares Gate-Array (FPGA) und anwendungsspezifische integrierte Schaltung (ASIC) und dergleichen, und der Speicher 220 kann nicht benötigt werden oder kann entsprechend modifiziert sein. In dem dargestellten Beispiel beinhaltet der Speicher 220 nicht flüchtigen, computerlesbaren Speicher, der Instruktionen speichert, die empfangen und ausgeführt werden durch den elektronischen Prozessor 210, um die Funktionalität des hierin beschriebenen Anrufcontrollers 110 auszuführen. Der Speicher 220 kann beispielsweise eine Programmspeicherbereich und einen Datenspeicherbereich beinhalten. Der Programmspeicherbereich und der Datenspeicherbereich können Kombinationen aus verschiedenen Arten von Speichern beinhalten, beispielsweise ROM und RAM.
-
Der Transceiver 230 ermöglicht drahtlose Kommunikation von dem Anrufcontroller 110 beispielsweise zu den Kommunikationsvorrichtungen 120A bis 120Z über das Kommunikationsnetzwerk 130. In anderen Ausführungsformen kann der Anrufcontroller 110 anstelle des Transceivers 230 separate Sende- und Empfangskomponenten beinhalten, beispielsweise einen Sender und einen Empfänger. In noch einer weiteren Ausführungsform kann der Anrufcontroller 110 keinen Transceiver 230 beinhalten und kann mit den Kommunikationsvorrichtungen 120A bis 120Z über eine Netzwerkschnittstelle und eine drahtgebundene Verbindung mit dem Kommunikationsnetzwerk 130 kommunizieren.
-
Wie vorstehend erwähnt, kann der Anrufcontroller 110 die Eingabe/Ausgabe-Schnittstelle 240 beinhalten. Die Eingabe/Ausgabe-Schnittstelle 240 kann einen oder mehrere Eingabemechanismen (beispielsweise einen Touchscreen, ein Keypad, eine Taste, einen Knopf und dergleichen), einen oder mehrere Ausgabemechanismen (beispielsweise ein Display, einen Drucker, einen Lautsprecher und dergleichen) oder eine Kombination davon beinhalten. Die Eingabe/Ausgabe-Schnittstelle 240 empfängt Eingaben von Eingabevorrichtungen, die von einem Benutzer betätigt werden, und stellt Ausgaben an Ausgabevorrichtungen bereit, mit denen ein Benutzer interagiert. In einigen Ausführungsformen kann, als eine Alternative oder zusätzlich zur Verwaltung von Eingaben und Ausgaben durch die Eingabe/Ausgabe-Schnittstelle 240, der Anrufcontroller 110 Benutzereingaben empfangen, Benutzerausgaben bereitstellen, oder beides durch Kommunizieren mit einer externen Vorrichtung, wie zum Beispiel einem Konsolencomputer („console computer“), über eine drahtgebundene oder drahtlose Verbindung.
-
3 ist eine Skizze einer Ausführungsform einer Kommunikationsvorrichtung 120. In dem dargestellten Beispiel beinhaltet die Kommunikationsvorrichtung 120, unter anderem einen elektronischen Vorrichtungsprozessor 310, einen Vorrichtungsspeicher 320, einen Vorrichtungstransceiver 330 und eine Vorrichtungs-Eingabe/Ausgabe-Schnittstelle 340. Der elektronische Vorrichtungsprozessor 310, der Vorrichtungsspeicher 320, der Vorrichtungstransceiver 330 und die Vorrichtungs-Eingabe/Ausgabe-Schnittstelle 340 kommunizieren über einen oder mehrere Kontroll- und/oder Datenbusse (beispielsweise einem Vorrichtungskommunikationsbus 350). 3 stellt nur eine exemplarische Ausführungsform der Kommunikationsvorrichtung 120 dar. Die Kommunikationsvorrichtung 120 kann mehr oder weniger Komponenten beinhalten als dargestellt und kann zusätzliche Funktionen ausführen, die von den hierin beschriebenen abweichen.
-
Der elektronische Vorrichtungsprozessor 310 kann auf unterschiedliche Weise implementiert werden, einschließlich solcher, die den vorstehend bezüglich des elektronischen Prozessors 210 beschriebenen ähneln. Ebenso kann der Vorrichtungsspeicher 320 auf unterschiedliche Weise implementiert werden, einschließlich solcher, die den bezüglich des Speichers 220 beschriebenen ähneln. Der Vorrichtungsspeicher 320 kann Anweisungen speichern, die von dem elektronischen Vorrichtungsprozessor 310 empfangen und ausgeführt werden, um die hierin beschriebene Funktionalität auszuführen.
-
Der Vorrichtungstransceiver 330 ermöglicht drahtlose Kommunikation von der Kommunikationsvorrichtung 120 beispielsweise zu dem Anrufcontroller 110 über das Kommunikationsnetzwerk 130. In anderen Ausführungsformen kann die Kommunikationsvorrichtung 120 anstatt eines Vorrichtungstransceivers 330 separate Sende- und Empfangskomponenten beinhalten, zum Beispiel einen Sender und einen Empfänger.
-
Die Vorrichtungs-Eingabe/Ausgabe-Schnittstelle 340 kann einen oder mehrere Eingabemechanismen (beispielsweise einen Touchscreen, ein Keypad, eine Taste, einen Knopf und dergleichen), einen oder mehrere Ausgabemechanismen (beispielsweise ein Display, einen Lautsprecher und dergleichen) oder eine Kombination davon beinhalten. Bei einigen Ausführungsformen kommuniziert die Kommunikationsvorrichtung 120 mit einer oder mehreren externen Vorrichtungen, die Teil eines persönlichen Bereichsnetzwerks (PAN) von Vorrichtungen sein können. Die eine oder mehreren externen Vorrichtungen können beispielsweise einen Holstersensor, einen Gassensor, einen oder mehrere Bekleidungssensoren oder -komponenten, wie beispielsweise solche in einem intelligenten Gefahrgutmaterial (HAZMAT) -Anzug, eine am Körper montierbare Kamera und dergleichen, beinhalten.
-
4 ist ein Flussdiagramm, das ein beispielhaftes Verfahren 400 zur Verbesserung von Spracherkennung und Informationssuche darstellt. Wie in 4 dargestellt, beinhaltet das Verfahren 400, dass der Anrufcontroller 110 unter Verwendung des elektronischen Prozessors 210 Kontextdaten bestimmt, die mit einer bestimmten Gesprächsgruppe 140, die eine Vielzahl von Kommunikationsvorrichtungen 120 beinhaltet, assoziiert sind (bei Block 410). In einigen Ausführungsformen beinhalten die Kontextdaten Schlüsselwörter, die von Sprachkommunikation innerhalb der Gesprächsgruppe 140 extrahiert sind. Der Anrufcontroller 110 kann die gesamte in der Gesprächsgruppe 140 stattfindende Sprachkommunikation aufzeichnen und in dem Speicher 220 speichern. Der Anrufcontroller 110 kann dann die gespeicherten Sprachkommunikationen (beispielsweise vorangegangene Sprachkommunikation) unter Verwendung bekannter Spracherkennungstechniken verarbeiten, um die Sprachkommunikation in Text zu konvertieren, welcher dann in dem Speicher 220 gespeichert werden kann. In einigen Ausführungsformen kann der Anrufcontroller 110 die Sprachkommunikation automatisch verarbeiten, ohne die Sprachkommunikation in dem Speicher 220 zu speichern. Der Anrufcontroller 110 kann etwas oder den gesamten von der Sprachkommunikation extrahierten Text speichern. In einigen Ausführungsformen beinhaltet der Text gewisse Schlüsselwörter, die für den Einsatz oder für die Mission, die von den Benutzern der Kommunikationsvorrichtungen 120 ausgeführt wird, einzigartig sind. Beispielsweise kann bei Verfolgungseinsätzen Verdächtiger der extrahierte Text Nummernschilder, Orientierungspunkte, Straßennamen und dergleichen beinhalten. In diesen Ausführungsformen kann der Anrufcontroller 110 nur die für den Einsatz oder die Mission einzigartigen Schlüsselwörter speichern. Alternativ kann der Anrufcontroller 110 alle Schlüsselwörter speichern, aber den für den Einsatz oder die Mission einzigartigen Schlüsselwörtern einen höheren Rang bereitstellen.
-
In einigen Ausführungsformen können Kontextdaten Statusaktualisierungen beinhalten, beispielsweise von einem computerunterstützten Dispatch-System. Der Anrufcontroller 110 kann einen computerunterstützten Dispatcher beinhalten, der den Status der Kommunikationsvorrichtungen 120, die mit der Gesprächsgruppe 140 assoziiert sind, den Status von Benutzern der Kommunikationsvorrichtungen 120, die mit der Gesprächsgruppe 140 assoziiert sind, den Status oder Information der Mission, die die Benutzer ausführen, und dergleichen führt. Basierend auf der von den Kommunikationsvorrichtungen 120 empfangenen Information kann der computerunterstützte Dispatcher den Status der Mission aktualisieren. Beispielsweise kann während eines Brandereignisses ein Benutzer die Entdeckung einer gefährlichen Chemikalie in der Nähe des Feuers kommunizieren. Der computerunterstützte Dispatcher kann dann den Status der Mission aktualisieren als einen Gefahrgutmaterialeinsatz beinhaltend.
-
In einigen Ausführungsformen können Kontextdaten Verwendung und Präsenz von Ausrüstung in einem persönlichen Bereichsnetzwerk einer Kommunikationsvorrichtung 120, die mit einer bestimmten Gesprächsgruppe 140 assoziiert ist, beinhalten. Die Kommunikationsvorrichtungen 120 detektieren die Präsenz ohne die Verwendung der Ausrüstung 150, beispielsweise eines Gefahrgutanzugs, einer Waffe oder dergleichen. Die Kommunikationsvorrichtungen 120 übertragen dann die Verwendungs- und Präsenzinformation an den Anrufcontroller 110. In einigen Ausführungsformen können Kontextdaten auch Daten von Sensoren beinhalten. Die Kommunikationsvorrichtungen 120 empfangen Sensordaten von Sensoren innerhalb eines persönlichen Bereichsnetzwerks der Kommunikationsvorrichtung 120. Beispielsweise kann eine erste Kommunikationsvorrichtung 120A Sensordaten beispielsweise von einem Holstersensor, einem Temperatursensor, einem Blutdrucksensor oder dergleichen empfangen, welcher von einem Beamten für die öffentliche Sicherheit (beispielsweise einem Gesprächsgruppenteilnehmer) getragen wird. Die erste Kommunikationsvorrichtung 120A überträgt dann die Sensorinformation an den Anrufcontroller 110. In einigen Ausführungsformen können Kontextdaten eine Position des Global Positioning Systems (GPS) der Kommunikationsvorrichtung 120 beinhalten (beispielsweise eine oder mehrere Positionen der Kommunikationsvorrichtungen 120), die von den Kommunikationsvorrichtungen 120 an den Anrufcontroller 110 übertragen werden. In einigen Ausführungsformen können die Benutzer der Kommunikationsvorrichtungen 120 Ausrüstung 150 haben, die nicht mit dem persönlichen Bereichsnetzwerk der Kommunikationsvorrichtungen 120 gepairt werden kann. In diesen Ausführungsformen kann der Anrufcontroller 110 weiterhin Kontextdaten empfangen, die Verwendung und Präsenz der Ausrüstung 150 beinhalten. Beispielsweise kann der Anrufcontroller 110 erkennen (unter Bezugnahme auf eine Nachschlagetabelle), dass eine bestimmte Ausrüstung 150 präsent ist oder verwendet wird, basierend auf der von der Gesprächsgruppe 140 ausgeführten Mission oder basierend auf der Art des Personals für die öffentliche Sicherheit, die der Gesprächsgruppe 140 zugeordnet ist. In einem anderen Beispiel kann der Anrufcontroller 110 die verwendete Ausrüstung 150 durch eine Benutzereingabe empfangen.
-
Das Verfahren 400 beinhaltet auch, dass der Anrufcontroller 110 unter Verwendung des elektronischen Prozessors 210 eine Liste von gesprächsgruppenspezifischen Schlüsselwörtern, die mit den Kontextdaten assoziiert sind, erzeugt (bei Block 420). Mit der bestimmten Gesprächsgruppe 140 assoziierte Kontextdaten werden zusammengeführt, um eine Liste von gesprächsgruppenspezifischen Schlüsselwörtern zu erzeugen. Wie vorstehend beschrieben bestimmt der Anrufcontroller 110 Kontextdaten basierend auf von einer Vielzahl von Kommunikationsvorrichtungen 120 empfangenen Kommunikationen, von der Vielzahl von Kommunikationsvorrichtungen empfangenen Sensordaten, Information über die Rollen und Verantwortlichkeiten der Mitglieder der Gesprächsgruppe 140, der Präsenz und Verwendung von Ausrüstung 150 durch die Mitglieder der Anrufgruppe 140 und dergleichen. Der Anrufcontroller 110 protokolliert diese Daten und baut eine Datenbank mit gesprächsgruppenspezifischen Schlüsselwörtern auf, indem er diese zahlreichen Eingaben zusammenführt. In einigen Ausführungsformen kann der Anrufcontroller 110 eine Nachschlagetabelle in dem Speicher 220 speichern, die eine Korrelation zwischen Kontextdaten und gewissen Schlüsselwörtern beinhaltet. Beispielsweise kann die Nachschlagetabelle gewisse chemische Namen für einen intelligenten HAZMAT-Anzug beinhalten. Wenn der Anrufcontroller 110 erkennt, dass die Kontextdaten einen intelligenten HAZMAT-Anzug beinhalten, greift der Anrufcontroller 110 auf die Nachschlagetabelle zurück, um die chemischen Namen, die mit dem intelligenten HAZMAT-Anzug zusammenhängen, zu extrahieren. In einigen Ausführungsformen beinhaltet die Datenbank auch Charakteristiken (zum Beispiel eine erste Charakteristik) der gesprächsgruppenspezifischen Schlüsselwörter. Die Charakteristiken beinhalten, zum Beispiel, eine Länge des gesprächsgruppenspezifischen Schlüsselwortes, einen anfänglichen Klang des gesprächsgruppenspezifischen Schlüsselwortes und dergleichen. Die Charakteristiken der gesprächsgruppenspezifischen Schlüsselwörter können beispielsweise bestimmt werden unter Verwendung bekannter Sprache-zu-Text- oder Text-zu-Sprache-Techniken. In einigen Ausführungsformen kann der Anrufcontroller 110 die gesprächsgruppenspezifischen Schlüsselwörter basierend auf Relevanz für eine Mission, die von den Benutzern der Kommunikationsvorrichtungen 120 ausgeführt wird, einordnen. Beispielsweise kann während eines Brandereignisses ein chemischer Name höher eingeordnet werden als ein Nummernschild. Der Anrufcontroller 110 kann die Datenbank ständig aktualisieren, während er neue Information und Kontextdaten von den Kommunikationsvorrichtungen 120 innerhalb der Anrufgruppe 140 empfängt.
-
Das Verfahren 400 beinhaltet das Empfangen, bei dem elektronischen Prozessor 210 von einer ersten Kommunikationsvorrichtung 120A, von Audiodaten, die mit einem Benutzer der ersten Kommunikationsvorrichtung 120A assoziiert sind (bei Block 430). Die Audiodaten entsprechen einer bei einer Kommunikationsvorrichtung 120 empfangenen verbalen Eingabe. Die Audiodaten (oder eine verbale Eingabe) können ein Sprachkommando oder eine Anfrage von dem Benutzer der ersten Kommunikationsvorrichtung 120A sein. Die Anfrage kann in Form einer Sprachanfrage oder eines Suchbegriffs erfolgen. Die erste Kommunikationsvorrichtung 120A sendet beim Empfangen von Audiodaten die Audiodaten über das Kommunikationsnetzwerk 130 an den Anrufcontroller 110. Beamte der öffentlichen Sicherheit arbeiten oft in lauten Umgebungen. Der Lärm kann die Audiodaten übertönen, so dass ein oder mehrere Wörter in den Audiodaten anfänglich nicht erkannt werden können. In einigen Ausführungsformen kann der Benutzer der ersten Kommunikationsvorrichtung 120A einen Befehl oder eine Anfrage eintippen. In diesen Ausführungsformen kann der Befehl oder die Anfrage falsch geschriebene oder unvollständige Wörter beinhalten.
-
Das Verfahren 400 beinhaltet das Verarbeiten, unter Verwendung des elektronischen Prozessors 210, der Audiodaten, um einen anfänglichen Ausgabebegriff zu erzeugen (bei Block 440). Der Anrufcontroller 110 kann bereits vorhandene Verarbeitungstechniken für natürliche Sprache verwenden, um einen anfänglichen Ausgabebegriff zu erzeugen. In einigen Ausführungsformen kann der anfängliche Ausgabebegriff, der von dem Anrufcontroller 110 erzeugt wird, eine beste Schätzung für die nicht erkannten Audiodaten sein. In einigen Ausführungsformen kann der Anrufcontroller 110 mehr als einen anfänglichen Ausgabebegriff erzeugen (beispielsweise eine zweite Liste von Schlüsselwörtern). Die erzeugten anfänglichen Ausgabebegriffe können basierend auf der Wahrscheinlichkeit, dass der nicht erkannte Ausdruck mit den erzeugten anfänglichen Ausgabebegriffen übereinstimmt, eingeordnet werden. Das heißt, die zweite Liste von Schlüsselwörtern ist nach der Wahrscheinlichkeit geordnet, die auf natürlicher Sprachverarbeitung der Audiodaten basiert.
-
Das Verfahren 400 beinhaltet das Bestimmen, unter Verwendung des elektronischen Prozessors 210, einer zweiten Charakteristik des anfänglichen Ausgabebegriffs (und somit der Audiodaten) (bei Block 450). Wie vorstehend beschrieben kann die zweite Charakteristik beispielsweise eine Länge des anfänglichen Ausgabebegriffs, einen anfänglichen Klang des anfänglichen Ausgabebegriffs und dergleichen beinhalten. In einigen Ausführungsformen kann der anfängliche Ausgabebegriff ein Teilbegriff sein, der ausreicht, um eine zweite Charakteristik der Audiodaten zu bestimmen. Das Verfahren 400 beinhaltet das Bestimmen, unter Verwendung des elektronischen Prozessors 210, ob die erste Charakteristik eines gesprächsgruppenspezifischen Schlüsselwortes von der Liste der gesprächsgruppenspezifischen Schlüsselwörter mit der zweiten Charakteristik des anfänglichen Ausgabebegriffs übereinstimmt (bei Block 460). Der Anrufcontroller 110 vergleicht die zweite Charakteristik des anfänglichen Ausgabebegriffs mit der Liste von gesprächsgruppenspezifischen Schlüsselwörtern. Der Anrufcontroller 110 bestimmt dann, ob es ein gesprächsgruppenspezifisches Schlüsselwort gibt, dessen erste Charakteristik mit der zweiten Charakteristik des anfänglichen Ausgabebegriffs übereinstimmt. Das Verfahren 400 beinhaltet das Ausgeben, unter Verwendung des elektronischen Prozessors 210, des gesprächsgruppenspezifischen Schlüsselwortes, wenn die erste Charakteristik mit der zweiten Charakteristik übereinstimmt (bei Block 470). Der Anrufcontroller 110 erkennt dann die Audiodaten und führt die durch die verbale Eingabe nachgefragte Funktion aus. Beispielsweise kann der Anrufcontroller 110 erkennen, dass die Audiodaten ein Befehl sind, die Einstellungen einer bestimmten Ausrüstung 150 anzupassen. Der Anrufcontroller 110 passt die Einstellungen der Ausrüstung 150 nach dem Erkennen der Audiodaten automatisch an. In einigen Ausführungsformen, in denen es kein gesprächsgruppenspezifisches Schlüsselwort gibt, dessen erste Charakteristik mit der zweiten Charakteristik des anfänglichen Ausgabebegriffs übereinstimmt, kann der Anrufcontroller 110 den anfänglichen Ausgabebegriff oder eine Fehlermeldung ausgeben.
-
Das Verfahren 400 wiederholt sich, um kontinuierlich zusätzliche Kontextdaten (beispielsweise zweite Kontextdaten) zu empfangen und aktualisiert die Liste von gesprächsgruppenspezifischen Schlüsselwörtern basierend auf den bestimmten Kontextdaten. Auf diese Weise optimiert der Anrufcontroller 110 kontinuierlich Spracherkennung und Informationssuche basierend auf Gesprächsgruppenaktivität. In einigen Ausführungsformen kann mehr als ein gesprächsgruppenspezifisches Schlüsselwort eine erste Charakteristik beinhalten, die mit der zweiten Charakteristik übereinstimmt. Der Anrufcontroller 110 kann die gesprächsgruppenspezifischen Schlüsselwörter, die sich auf Aktivitätsprotokolle beziehen, oder Kontextdaten, die von der Gesprächsgruppe 140 bestimmt werden, höher einordnen als jene gesprächsgruppenspezifischen Schlüsselwörter, die dies nicht tun. In einigen Ausführungsformen können die gesprächsgruppenspezifischen Schlüsselwörter, die sich auf mehr Aktivitätsprotokolle oder Kontextdaten beziehen, einen höheren Rang bekommen (beispielsweise basierend auf einer Art der Kontextdaten) als jene, die sich auf ältere Aktivitätsprotokolle oder Kontextdaten beziehen. Der Anrufcontroller 110 kann dann das gesprächsgruppenspezifische Schlüsselwort (beispielsweise ein zweites gesprächsgruppenspezifisches Schlüsselwort) mit dem höchsten Rang ausgeben. Alternativ kann der Anrufcontroller 110 alle übereinstimmenden gesprächsgruppenspezifischen Schlüsselwörter in der Reihenfolge ihres Rangs ausgeben.
-
Ein Vorteil der vorstehenden Techniken ist, dass Spracherkennung und Informationssuche verbessert und optimiert werden kann, um relevante gesprächsgruppenspezifische Schlüsselwörter basierend auf Kontextdaten basierend auf relevanten Aktivitäten und einer Vorgeschichte oder einer bestimmten Gesprächsgruppe, anstatt von einem einzelnen Benutzer zu bestimmen.
-
In der vorangehenden Spezifikation sind spezifische Ausführungsformen beschrieben worden. Fachleuten auf dem Gebiet ist jedoch klar, dass verschiedene Modifizierungen und Änderungen vorgenommen werden können, ohne von dem Geist der Erfindung abzuweichen, wie in den Ansprüchen unten dargelegt. Dementsprechend sind die Spezifikation und die Abbildungen in einem eher illustrativen als einem restriktiven Sinne zu verstehen und alle solche Modifikationen sollen in dem Schutzbereich der vorliegenden Lehren enthalten sein.
-
Die Nutzen, Vorteile, Problemlösungen und jedes denkbare Element, das dazu führt, dass irgendein Nutzen, Vorteil oder irgendeine Lösung eintritt oder ausgeprägter wird, sollen nicht als kritische, erforderliche oder essentielle Merkmale oder Elemente eines beliebigen Anspruchs oder aller Ansprüche ausgelegt werden. Die Erfindung wird ausschließlich durch die angehängten Ansprüche definiert, einschließlich jeder beliebigen Änderung, die während der Rechtshängigkeit der vorliegenden Anmeldung vorgenommen wird, und aller Äquivalente solcher Ansprüche, wie veröffentlicht.
-
Darüber hinaus sollen in diesem Dokument relationale Ausdrücke, wie zum Beispiel, erste und zweite, oben und unten, und dergleichen ausschließlich verwendet werden, um eine Entität oder Aktion von einer anderen Entität oder Aktion zu unterscheiden, ohne notwendigerweise irgend eine tatsächliche solche Beziehung oder Reihenfolge zwischen solchen Entitäten oder Aktionen zu erfordern oder zu implizieren. Die Ausdrücke „umfasst“, „umfassend“, „hat“, „habend“, „beinhalten“, „beinhaltend“, „enthalten“, „enthaltend“ oder eine beliebige Variation davon sollen eine nicht-exklusive Einbeziehung abdecken, so dass ein Prozess, Verfahren, Artikel oder eine Vorrichtung, die eine Liste von Elementen umfassen, haben, beinhalten, enthalten, nicht nur solche Elemente beinhalten, sondern andere Elemente beinhalten können, die nicht ausdrücklich aufgeführt werden, oder solchen Prozessen, Verfahren, Artikeln oder Vorrichtungen inhärent sind. Ein Element, das fortfährt mit „umfasst... ein“, „hat... ein“, „beinhaltet... ein“, „enthält... ein“, schließt nicht, ohne weitere Auflagen, die Existenz zusätzlicher identischer Elemente in dem Prozess, Verfahren, Artikel oder der Vorrichtung aus, die das Element umfassen, haben, beinhalten, enthalten. Die Ausdrücke „eine“ und „ein“ werden als eins oder mehr definiert, sofern hierin nichts anderes explizit festgelegt ist. Die Ausdrücke „im Wesentlichen“, „essentiell“, „ungefähr“, „etwa“ oder eine beliebige andere Version davon wurden als „nahe bei sein“ definiert, wie dem Fachmann auf dem Gebiet klar ist, und in einer nicht begrenzenden Ausführungsform wird der Ausdruck definiert, innerhalb von 10 %, in einer anderen Ausführungsform innerhalb von 5 % in einer anderen Ausführungsform innerhalb von 1 % und in einer anderen Ausführungsform innerhalb von 0,5 % zu sein. Der Ausdruck „gekoppelt“, wie er hierin verwendet wird, wird als „verbunden“ definiert, obwohl nicht notwendigerweise direkt und nicht notwendigerweise mechanisch. Eine Vorrichtung oder Struktur, die in einer bestimmten Art und Weise „konfiguriert“ ist, ist mindestens auf diese Art und Weise konfiguriert, kann aber auch auf mindestens eine Art und Weise konfiguriert sein, die nicht aufgeführt ist.
-
Es ist gewünscht, dass einige Ausführungsformen einen oder mehrere generische oder spezialisierte Prozessoren (oder „Verarbeitungsvorrichtungen“) umfassen, wie zum Beispiel Mikroprozessoren, digitale Signalprozessoren, kundenspezifische Prozessoren und freiprogrammierbare Feld-Gate-Arrays (FPGAs) und eindeutige gespeicherte Programmanweisungen (die sowohl Software als auch Firmware umfassen), die den einen oder mehrere Prozessoren steuern, um in Verbindung mit bestimmten Nicht-Prozessor-Schaltungen, einige, die meisten oder alle der Funktionen des Verfahrens und/oder der Vorrichtung, die hierin beschrieben werden, zu implementieren. Alternativ können einige oder alle Funktionen durch eine Zustandsmaschine implementiert werden, die über keine gespeicherten Programmanweisungen verfügt, oder in einer oder mehreren anwendungsspezifischen integrierten Schaltungen (ASICs), in denen jede Funktion oder einige Kombinationen von bestimmten der Funktionen, als kundenspezifische Logik implementiert sind. Selbstverständlich kann eine Kombination der zwei Ansätze verwendet werden.
-
Darüber hinaus kann eine Ausführungsform als ein computerlesbares Speichermedium implementiert sein, das über einen darauf gespeicherten computerlesbaren Code zum Programmieren eines Computers (der zum Beispiel einen Prozessor umfasst) verfügt, um ein hierin beschriebenes und beanspruchtes Verfahren durchzuführen. Beispiele solcher computerlesbaren Speichermedien umfassen, ohne darauf beschränkt zu sein: eine Festplatte, eine CD-ROM, eine optische Speichervorrichtung, eine magnetische Speichervorrichtung, einen ROM (Nur-Lese-Speicher), einen PROM (Programmierbarer Lesespeicher), einen EPROM (Löschbarer Programmierbarer Lesespeicher), einen EEPROM (Elektrisch Löschbarer Programmierbarer Lesespeicher) und einen Flash-Speicher. Weiterhin ist zu erwarten, dass ein Fachmann auf dem Gebiet, ungeachtet möglicher erheblicher Anstrengungen und einer großen Designauswahl, die zum Beispiel durch eine zur Verfügung stehende Zeit, der aktuellen Technologie und ökonomische Überlegungen begründet ist, geleitet durch die hierin offenbarten Konzepte und Prinzipien, ohne Weiteres in der Lage ist solche Softwareanweisungen und Programme und ICs mit minimalem Versuchsaufwand zu erzeugen.
-
Die Zusammenfassung der Offenbarung wird zur Verfügung gestellt, um dem Leser zu erlauben, die Natur der technischen Offenbarung schnell zu erkennen. Es wird mit dem Verständnis eingereicht, dass es nicht verwendet wird, um den Geist oder die Bedeutung der Ansprüche zu interpretieren oder zu begrenzen. Zusätzlich ist der vorangehenden ausführlichen Beschreibung zu entnehmen, dass verschiedene Merkmale in verschiedenen Ausführungsformen zusammengruppiert werden, um die Offenbarung zu straffen. Dieses Offenbarungsverfahren soll nicht als ein Reflektieren einer Intention interpretiert werden, dass die beanspruchten Ausführungsformen mehr Merkmale erfordern, als ausdrücklich in jedem Anspruch vorgetragen werden. Vielmehr liegt, wie aus den folgenden Ansprüchen hervorgeht, ein erfinderischer Gegenstand in weniger als allen Merkmalen einer einzelnen offenbarten Ausführungsform vor. Somit werden die folgenden Ansprüche hierdurch in die ausführliche Beschreibung integriert, wobei jeder Anspruch für sich alleine als ein getrennt beanspruchter Gegenstand steht.