DE102005024637A1 - Verfahren und Vorrichtung zur Sprachauswertung - Google Patents

Verfahren und Vorrichtung zur Sprachauswertung Download PDF

Info

Publication number
DE102005024637A1
DE102005024637A1 DE200510024637 DE102005024637A DE102005024637A1 DE 102005024637 A1 DE102005024637 A1 DE 102005024637A1 DE 200510024637 DE200510024637 DE 200510024637 DE 102005024637 A DE102005024637 A DE 102005024637A DE 102005024637 A1 DE102005024637 A1 DE 102005024637A1
Authority
DE
Germany
Prior art keywords
communication device
sequence
speech
sev
participant
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
DE200510024637
Other languages
English (en)
Inventor
Stephan Dr. Lechner
Klaus Lukas
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Siemens AG
Original Assignee
Siemens AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Siemens AG filed Critical Siemens AG
Priority to DE200510024637 priority Critical patent/DE102005024637A1/de
Publication of DE102005024637A1 publication Critical patent/DE102005024637A1/de
Ceased legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/26Devices for calling a subscriber
    • H04M1/27Devices whereby a plurality of signals may be stored simultaneously
    • H04M1/271Devices whereby a plurality of signals may be stored simultaneously controlled by voice recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Telephonic Communication Services (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

Eine Spracherkennungsvorrichtung überwacht den Gesprächsinhalt von einem Teilnehmer eines Gesprächs. Darin erkannte Ziffernfolgen wie Telefonnummern werden an eine Auswahlvorrichtung des anderen Teilnehmers übertragen und dort zur Auswahl angeboten. Mit den erkannten Ziffernfolgen können dann Folgeaktionen wie Rückruf ausgelöst werden.

Description

  • Die Erfindung betrifft ein Verfahren und eine Vorrichtung zur Sprachauswertung während einer Sprachverbindung zwischen einem ersten Teilnehmer und wenigstens einem zweiten Teilnehmer.
  • Die weite Verbreitung von mobilen Kommunikationsgeräten wie Handys hat dazu geführt, dass viele Ferngespräche heute mit zumindest einem mobilen Teilnehmer geführt werden. Während eines Gesprächs kann es vorkommen, dass eine Ziffernfolge, beispielsweise eine Telefonnummer, von einem Teilnehmer an einen anderen, mobilen Teilnehmer übertragen werden soll. Der mobile Teilnehmer möchte nun die Ziffernfolge aufnehmen für die spätere Verwendung, beispielsweise zum Rückruf. Eine Eingabe in das mobile Kommunikationsgerät ist zum Gesprächszeitpunkt typischerweise nicht möglich. Stattdessen kann er versuchen, die Ziffernfolge aufzunehmen, indem er sie sich merkt. Bei längeren Ziffernfolgen oder gar bei mehreren Telefonnummern ist das schwierig durchzuführen. Zum anderen könnte er sich die Nummern notieren. Der mobile Teilnehmer kann allerdings in der Situation sein, das nicht zu können. Im einfachsten Fall können Papier und Stift nicht vorhanden sein. Es ist aber auch möglich, dass der mobile Teilnehmer während des Gesprächs ein Fahrzeug lenkt.
  • Die der Erfindung zugrunde liegende Aufgabe ist es, eine Möglichkeit anzugeben, während eines Gesprächs von einem Teilnehmer des Gesprächs genannte Ziffernfolgen einem anderen Teilnehmer des Gesprächs so zur Verfügung zu stellen, dass sie von diesem auf einfache Weise weiter verwendet werden können.
  • Diese Aufgabe wird erfindungsgemäß gelöst durch ein Verfahren gemäß Anspruch 1 und eine Vorrichtung gemäß Anspruch 9.
  • Die Spracherkennungsvorrichtung kann als eigenständige Vorrichtung mit zumindest einem Prozessor und Speicher ausgeführt sein. Alternativ kann sie auch als Softwarelösung auf bestehender Hardware umgesetzt werden. Solche bestehende Hardware kann der Prozessor und Speicher in einem mobilen Kommunikationsgerät sein, aber auch Computersysteme, die einer Vermittlungsstation für Mobilfunk zugeordnet sind.
  • Die Spracherkennungsvorrichtung ist so ausgestaltet, dass sie eine ständige Überwachung der vom zweiten Teilnehmer gesprochenen Information vornehmen kann. Dazu wird die vom zweiten Teilnehmer gesprochene Information der Spracherkennungsvorrichtung zugeleitet. Dabei ist es möglich, dass die Spracherkennungsvorrichtung zwischen den Teilnehmern angeordnet ist, d.h. dass die vom zweiten Teilnehmer gesprochene Information in die Spracherkennungsvorrichtung geleitet wird und aus dieser heraus weiter an den ersten Teilnehmer. Dies hat den Vorteil, dass für den Fall, dass die gesprochene Information zur Übertragung komprimiert wird, die Spracherkennungsvorrichtung eine Dekomprimierung vornehmen kann und somit das Kommunikationsgerät des ersten Teilnehmers keine zusätzliche unnötige Dekomprimierung mehr vornehmen muss. Es ist aber auch möglich, dass die gesprochene Information der Spracherkennungsvorrichtung separat zugeleitet wird.
  • Des Weiteren ist die Spracherkennungsvorrichtung so ausgestaltet, dass sie Ziffern in der gesprochenen Information des zweiten Teilnehmers erkennen kann. Dazu kann sie so ausgestaltet sein, dass sie ausschließlich Ziffern erkennt. Das hat den Vorteil, dass sie mit wesentlich geringeren Ressourcen wie Prozessor und Speicher umsetzbar ist, als für die Erkennung von Buchstaben und Worten nötig wäre. Dies hat weiterhin den besonderen Vorteil, dass auch die sprecherunabhängige Erkennung mit wesentlich geringeren Hardwareanforderungen umsetzbar ist.
  • Ziffernfolgen, die wenigstens aus zwei aufeinander folgenden gesprochenen Ziffern bestehen, werden von der Spracherken nungsvorrichtung an eine dem ersten Teilnehmer zugeordnete Auswahlvorrichtung übertragen. Sind die Auswahlvorrichtung und die Spracherkennungsvorrichtung dabei räumlich getrennt, kann die Übertragung analog der Rufnummernanzeige eines Anrufers bei einem Mobiltelefon erfolgen. Dies ist beispielsweise der Fall, wenn die Spracherkennungsvorrichtung in einer Mobilfunk-Basisstation angeordnet ist und die Auswahlvorrichtung das Display eines Mobiltelefons des ersten Teilnehmers ist. Die beiden Vorrichtungen können aber auch beispielsweise in einem Mobiltelefon angeordnet sein. In diesem Fall ist lediglich eine übliche elektrische Übertragung erforderlich.
  • Die Auswahlvorrichtung ist dem ersten Teilnehmer zugeordnet. Das bedeutet, dass der erste Teilnehmer die Möglichkeit hat, durch die Auswahlvorrichtung von den erkannten Ziffernfolgen zu erfahren. Weiterhin hat er über die Auswahlvorrichtung die Möglichkeit, für wenigstens eine der erkannten Ziffernfolgen eine Folgeaktion auszulösen.
  • Es gibt verschiedene Arten, wie der erste Teilnehmer durch die Auswahlvorrichtung von den erkannten Ziffernfolgen erfahren kann. Beispielsweise kann die Auswahlvorrichtung aus einem Display bestehen, das die erkannten Ziffernfolgen anzeigt. Ein anderes Beispiel ist eine Wiedergabe der erkannten Ziffernfolgen in sprachlicher Form, durch eine Sprachsyntheseeinrichtung oder mithilfe gespeicherter Laute. Die Möglichkeiten der Wiedergabe können auch kombiniert miteinander verwendet werden.
  • Das Auslösen von Folgeaktionen durch den ersten Teilnehmer kann ebenfalls auf verschiedene Art und Weise erfolgen. Beispielsweise kann durch Tastendruck oder Betätigung anderer Sensortypen signalisiert werden, welche Folgeaktion gewünscht ist. Weiterhin ist es auch möglich, durch sprachliche Eingabe die gewünschte Folgeaktion zu signalisieren. Bei der sprachlichen Auswahl kann wiederum die Spracherkennungsvorrichtung zum Einsatz kommen, es ist aber auch möglich, eine andere Vorrichtung hierfür zu verwenden, beispielsweise eine Vor richtung, die bereits im Kommunikationsgerät des ersten Teilnehmers integriert ist.
  • Es ist möglich, dass die Sprachverbindung bidirektional ist. Eine bidirektionale Verbindung ist beispielsweise ein Telefongespräch, bei dem beide Teilnehmer zur gleichen Zeit hören und sprechen können.
  • Die Sprachverbindung kann aber auch unidirektional sein. Eine unidirektionale Sprachverbindung liegt beispielsweise bei sog. Push-to-Talk-Verbindungen vor, bei denen zu jeder Zeit nur ein Teilnehmer sprechen kann. Ein weiteres Beispiel für eine quasi unidirektionale Sprachverbindung liegt vor, wenn auf Seiten des ersten Teilnehmers ein Anrufbeantwortungssystem arbeitet.
  • In einer weiteren vorteilhaften Ausgestaltung und Weiterbildung der Erfindung wird die sprachliche Information zwischen den Teilnehmern in komprimierter Form übertragen. Wenn die Komprimierung, die hierbei verwendet wird, bereits eine Zerlegung in sprachliche Bestandteile vornimmt, so kann diese Zerlegung von der Spracherkennungsvorrichtung verwendet werden. Dadurch ergibt sich der Vorteil, dass die Spracherkennung vereinfacht wird. Ein weiterer Vorteil ergibt sich dadurch, dass die Spracherkennungsvorrichtung in diesem Fall keine vollständige Dekomprimierung vornehmen muss zur Spracherkennung. Dadurch wird es möglich, die Spracherkennungsvorrichtung mit geringeren Hardwareanforderungen umzusetzen. Gleichzeitig ergibt sich der Vorteil, dass die Spracherkennung beschleunigt wird, was wiederum die Speicheranforderungen senkt.
  • Eine weitere vorteilhafte Ausgestaltung und Weiterbildung der Erfindung besteht darin, dass durch die Spracherkennungsvorrichtung nach der Erkennung einer Ziffernfolge zusätzlich ausgewertet wird, ob die Ziffernfolge Eigenschaften einer Auswahl an Zahlengruppen aufweist. Eine solche Zahlengruppe kann beispielsweise die Gruppe der Telefonnummern sein. Bei spielhafte Eigenschaften für diese Gruppe sind eine führende Null und eine Länge von mehr als 5 Ziffern. Ein weiteres Beispiel für eine Gruppe ist die Gruppe der Telefonnummern aus dem Rufnummernbereich München. Eine beispielhafte Eigenschaft dieser Gruppe ist, dass die Ziffernfolge mit 089 beginnt. Ein weiteres Beispiel für eine solche Gruppe ist die Gruppe der Kontonummern. Ein weiteres Beispiel ist die Gruppe der deutschen Postleitzahlen, mit der beispielhaften Eigenschaft einer Länge von genau fünf Ziffern.
  • Die Auswahl an Zahlengruppen, auf deren Eigenschaften hin geprüft wird, kann dabei keine Zahlengruppe, eine oder mehrere Zahlengruppen einschließen. Es ist auch möglich, die Auswahl an Zahlengruppen zu verändern, beispielsweise durch ein Menü im Kommunikationsgerät des ersten Teilnehmers.
  • Ein besonderer Vorteil ergibt sich aus der Prüfung auf die Eigenschaften einer Auswahl aus wenigstens einer Zahlengruppe dadurch, dass die Übertragung an die Auswahlvorrichtung ausbleiben kann, falls keine Übereinstimmung gefunden wird. Dadurch kann die Anzahl der zur Auswahl bereitgestellten Ziffernfolgen reduziert werden. Dadurch ist es beispielsweise bei einem Display eher möglich, alle erkannten Ziffernfolgen auf dem Display gleichzeitig darzustellen. Bei Verwendung einer Sprachsyntheseeinheit werden die erkannten Ziffernfolgen in kürzerer Zeit wiedergegeben. Zusätzlich wird die Auswahl für den ersten Teilnehmer erleichtert.
  • Es ist auch möglich, dass erkannte Ziffernfolgen immer gespeichert werden und eine Änderung der Auswahl an zu prüfenden Zahlengruppen auch im Nachhinein erfolgen kann. Dadurch ergibt sich der Vorteil, dass der erste Teilnehmer auch nach einem Gespräch noch auf alle erkannten Ziffernfolgen zugreifen kann. Dies ist beispielsweise von Vorteil, wenn Ziffernfolgen unrichtig erkannt wurden durch die Spracherkennungsvorrichtung und dadurch keiner Zahlengruppe entsprechen. Eine weitere Möglichkeit ergibt sich wiederum dadurch, dass adaptiv entschieden werden kann, welche Gruppen von Ziffernfolgen übertragen werden. Beispielsweise werden alle erkannten Ziffernfolgen dann übertragen, wenn keine erkannte Ziffernfolge einer Zahlengruppe entspricht, während nur die einer Zahlengruppe entsprechenden Ziffernfolgen übertragen werden, sobald wenigstens eine Ziffernfolge den Eigenschaften der Gruppe entspricht.
  • Eine weitere vorteilhafte Ausgestaltung und Weiterbildung der Erfindung besteht darin, dass die Auswahlvorrichtung ein Display zur Darstellung und/oder eine Sprachsynthesevorrichtung zur Wiedergabe der Ziffernfolge hat.
  • Das Display kann dabei das bereits im Kommunikationsgerät des ersten Teilnehmers integrierte Display sein, beispielsweise das Display eines Mobiltelefons. Es ist aber auch möglich, dass das Display in einer speziellen Vorrichtung umgesetzt wird, die speziell für die Spracherkennungsvorrichtung und die Auswahlvorrichtung ausgestaltet wird. Auf dem Display können die erkannten Ziffernfolgen dargestellt werden, so dass der erste Teilnehmer die Ziffernfolgen dort ablesen kann. Zusätzlich können dort auch Steuermöglichkeiten für das Auslösen der Folgeaktionen abgebildet sein, beispielsweise vor jeder Ziffernfolge eine Nummer, die zu betätigen ist, um eine Folgeaktion für die Ziffernfolge auszulösen. Ein Vorteil eines Displays besteht darin, dass der erste Teilnehmer die erkannten Nummern schnell aufnehmen kann und gegebenenfalls auch viele Nummern gleichzeitig erfahren kann.
  • Alternativ oder zusätzlich zum Display kann auch eine Sprachausgabe der erkannten Ziffernfolgen vorgenommen werden. Dies kann mittels einer Sprachsynthesevorrichtung oder mittels gespeicherter Ziffernlaute erfolgen, wobei hierbei auch bereits vorhandene Vorrichtungen genutzt werden können. Der Vorteil der sprachlichen Ausgabe liegt darin, dass der erste Teilnehmer nicht auf ein Display blicken muss sondern die Ziffernfolgen durch Zuhören erfahren kann. Dies ist speziell von Vorteil, wenn der erste Teilnehmer beispielsweise ein Fahr zeug lenkt und daher seine Aufmerksamkeit nicht zur visuellen Erkennung von Ziffernfolgen von der Straße abwenden kann.
  • Eine weitere vorteilhafte Ausgestaltung und Weiterbildung der Erfindung besteht darin, dass die auswählbaren Folgeaktionen wenigstens die folgenden Folgeaktionen umfassen:
    • – Rückruf mit der Ziffernfolge als Rufnummer
    • – Speicherung der Ziffernfolge
  • Der erste Teilnehmer kann dabei durch das Auslösen der Folgeaktion „Rückruf" beispielsweise eine Sprachverbindung zu der entsprechenden Ziffernfolge als Rufnummer herstellen. In Verbindung mit einer sprachlichen Ausgabe der erkannten Ziffernfolgen und einer sprachlichen Auswahl ergibt sich hier der besondere Vorteil, dass der erste Teilnehmer eine ihm genannte Nummer sofort anrufen kann, auch wenn er ein Fahrzeug lenkt. Er muss hierbei die Nummer nicht aufschreiben und auch nicht wieder eingeben.
  • Der Rückruf muss hierbei nicht zu einer Sprachverbindung führen. Jede andere Art von Verbindung ist möglich, also beispielsweise eine Verbindung mit einem Fax-Gerät.
  • Als weitere Folgeaktion kann der erste Teilnehmer die erkannte Ziffernfolge auch speichern. Dies kann beispielsweise in einem bereits vorhandenen Adressbuch erfolgen. Des Weiteren kann dabei auch eine Zuordnung zu bereits vorhandenen Eintragungen vorgenommen werden, oder eine Änderung vorhandener Eintragungen, beispielsweise die Ersetzung einer veralteten Telefonnummer.
  • Es können auch mehrere Folgeaktionen verknüpft werden. Beispielsweise kann der erste Teilnehmer eine Ziffernfolge sowohl speichern als auch sofort anrufen.
  • Eine weitere vorteilhafte Ausgestaltung und Weiterbildung der Erfindung besteht darin, dass erkannte Ziffernfolgen dem ersten Teilnehmer nach der Beendigung der Sprachverbindung zur Auswahl angeboten werden. Das hat den Vorteil, dass der erste Teilnehmer diese sofort nutzen kann, beispielsweise um einen weiteren Anruf zu tätigen.
  • Eine weitere vorteilhafte Ausgestaltung und Weiterbildung der Erfindung besteht darin, dass erkannte Ziffernfolgen dem ersten Teilnehmer sofort nach der Erkennung zur Auswahl angeboten werden. Dadurch kann der erste Teilnehmer eine Konferenzschaltung mit mehr als zwei Teilnehmern initiieren, falls die Kommunikationsgeräte dies erlauben. Auch ist ein sofortiges Verwerfen einer erkannten Ziffernfolge möglich oder die Feststellung durch den ersten Teilnehmer, dass die Erkennung fehlgeschlagen ist, wobei der erste Teilnehmer den zweiten auffordern kann, die Nummer zu wiederholen.
  • Eine weitere vorteilhafte Ausgestaltung und Weiterbildung der Erfindung besteht darin, dass die Spracherkennungsvorrichtung auf dem Kommunikationsweg zwischen dem ersten und dem zweiten Teilnehmer angeordnet ist. Beispielsweise kann sie in einem Mobiltelefon des ersten Teilnehmers integriert sein. Sie kann aber auch bei einer Mobilfunk-Basisstation aufgebaut sein. Dies hat den Vorteil, dass bestehende Hardware wie leistungsstarke Computer genutzt werden können, was die Implementierung vereinfacht. Ein weiterer Vorteil besteht darin, dass die Spracherkennung nicht auf den ersten Teilnehmer beschränkt ist, sondern auch für andere Gespräche, die über die Basisstation vermittelt werden, durchgeführt werden kann.
  • Eine weitere vorteilhafte Ausgestaltung und Weiterbildung der Erfindung besteht darin, dass der erste Teilnehmer die überwachung mittels eines Sensors oder aber mittels der Auswahlvorrichtung ein- und ausschalten kann. Der Sensor kann bspw eine Taste sein. Es ist aber auch möglich, hier die Spracherkennungsvorrichtung oder die Auswahlvorrichtung zu nutzen, um sprachliche Kommandos zum Ein-/Ausschalten anzunehmen. Die Überwachung kann enden, sobald die Spracherkennungsvorrichtung keine Ziffern mehr erkennt, oder aber sobald der erste Teilnehmer das Ausschalten bewirkt. Es ist auch möglich, die Überwachung nur durchzuführen, wenn und solange der erste Teilnehmer eine Taste betätigt hält. Durch die manuelle Aktivierung ergibt sich der Vorteil, dass die Spracherkennungsvorrichtung genauer arbeiten kann, da im Idealfall im Sprachsignal nur Ziffern enthalten sind, während die Überwachung stattfindet. Ein weiterer Vorteil ergibt sich daraus, dass bei manueller Aktivierung der Spracherkennungsvorrichtung insgesamt weniger Ziffernfolgen erkannt werden und es somit bei einem Display eher möglich ist, alle erkannten Ziffernfolgen auf dem Display gleichzeitig darzustellen. Bei Verwendung einer Sprachsyntheseeinheit werden die erkannten Ziffernfolgen in kürzerer Zeit wiedergegeben.
  • Die Erfindung wird anhand von in der Zeichnung dargestellten Ausführungsbeispielen näher erläutert. Dabei zeigen:
  • 1 ein Verfahrensschema zur Spracherkennung;
  • 2 eine Ausgestaltung der Erfindung bei einem Gespräch zwischen zwei mobilen Teilnehmern;
  • 3 eine Ausgestaltung der Erfindung bei einem Gespräch zwischen einem mobilen und einem Festnetz-Teilnehmer bei zentraler Anordnung der Spracherkennungsvorrichtung;
  • 4 die Frontansicht einer Kommunikations-Anlage für die Verwendung in einem Fahrzeug.
  • 2 zeigt ein Ausführungsbeispiel, bei dem ein erster Teilnehmer und ein zweiter Teilnehmer über ein erstes Mobiltelefon M1 des ersten Teilnehmers und ein zweites Mobiltelefon M2 des zweiten Teilnehmers kommunizieren. Die Verbindung wird dabei durch zumindest eine Basisstation BS hergestellt, die die jeweiligen Funksignale aufnimmt und weiterleitet.
  • Das Mobiltelefon M2 ist dabei ein handelsübliches Mobiltelefon. Das Mobiltelefon M1 enthält zusätzlich zur handelsüblichen Ausstattung, die ein Display D und eine Tastatur T einschließt, eine Spracherkennungsvorrichtung SEV. Diese ist als Softwarelösung umgesetzt und arbeitet mit dem vorhandenen Speicher und Prozessor des Mobiltelefons M1.
  • Des Weiteren enthält das Mobiltelefon M1 eine Auswahlvorrichtung. Sie ist ebenfalls als Softwarelösung umgesetzt und verwendet hierbei das vorhandene Display D zur Anzeige erkannter Ziffernfolgen sowie die vorhandene Tastatur T zur Auswahl der Folgeaktionen.
  • Die Spracherkennungsvorrichtung SEV führt dabei das in 1 dargestellte Verfahren durch. Sie überwacht in einem ersten Schritt S1 die gesprochenen Informationen des zweiten Teilnehmers darauf, ob dieser Ziffernfolgen spricht.
  • In diesem Beispiel spricht der zweite Teilnehmer die Ziffernfolge „08963682000". Diese wird durch die Spracherkennungsvorrichtung SEV im ersten Schritt S1 erkannt und in einem zweiten Schritt S2 an die Auswahlvorrichtung weitergeleitet. In diesem Fall wird also die erkannte Ziffernfolge auf dem Display D des ersten Mobiltelefons M1 dargestellt mit den zusätzlichen vorangestellten Zeichen „1:". Drückt der erste Teilnehmer nun die Taste „1" auf der Tastatur T, wählt er diese Ziffernfolge aus. Er erhält nun als Folgeaktionen zur Auswahl: „Rückruf" und „Speichern". Wählt der erste Teilnehmer „Rückruf", wird vom Mobiltelefon M1 versucht, eine neue Telefonverbindung herzustellen. Wählt der erste Teilnehmer „Speichern", so wird er in das im Mobiltelefon M1 integrierte Adressbuch geleitet mit der Möglichkeit, die erkannte Ziffernfolge als neuen Eintrag hinzuzufügen oder einen bestehenden Eintrag zu ändern.
  • Spricht im weiteren Verlauf der Sprachverbindung der zweite Teilnehmer eine einzelne Ziffer aus, wie beispielsweise in „zwei Uhr", wird dies von der Spracherkennungsvorrichtung SEV ignoriert, da hier nur eine einzelne Ziffer vorliegt.
  • In einem weiteren Ausführungsbeispiel, das in 3 dargestellt ist, findet ein Gespräch zwischen einem mobilen ersten Teilnehmer mit einem ersten Mobiltelefon M1B statt und einem zweiten Teilnehmer, der in diesem Ausführungsbeispiel mit einem Festnetztelefon F2 telefoniert.
  • Hierbei wird die Verbindung wiederum durch zumindest eine Basisstation BS hergestellt, die die jeweiligen Signale aufnimmt und weiterleitet.
  • In diesem Beispiel ist die Spracherkennungsvorrichtung SEV bei der Basisstation BS angeordnet. Sie ist daher in der Lage, ihre Funktion für alle über die Basisstation BS vermittelten Gespräche auszuführen. Ebenso kann die Spracherkennungsvorrichtung SEV hier ihre Funktion in beide Richtungen ausführen, d.h. es ist hier möglich, jedem Teilnehmer, die vom jeweils anderen Teilnehmer, gesprochenen und von der Spracherkennungsvorrichtung SEV erkannten Ziffernfolgen zu übertragen. In einer alternativen Ausführung wird dieser Service nur registrierten Nutzern angeboten.
  • Von der Spracherkennungsvorrichtung SEV ermittelte Ziffernfolgen werden an den ersten Teilnehmer übertragen. Wie im ersten Ausführungsbeispiel werden die Ziffernfolgen dort auf dem Display D des Mobilteils M1B dargestellt zur Auswahl von Folgeaktionen.
  • In diesem Ausführungsbeispiel prüft die Spracherkennungsvorrichtung SEV in einem Zwischenschritt SZ, ob die erkannten Nummern Telefonnummern sein könnten. Dafür wird festgestellt, ob die Länge einer Ziffernfolge größer als 4 Ziffern ist und die erste Ziffer eine „0" ist. Nur solche Ziffernfolgen werden an das Mobiltelefon M1B des ersten Teilnehmers übertragen.
  • Durch Auswahl eines Menüeintrags seines Mobiltelefons M1B hat der erste Teilnehmer die Möglichkeit, der Spracherkennungsvorrichtung SEV zu signalisieren, dass er alle erkannten Ziffernfolgen zur Auswahl haben möchte. In diesem Fall kann die Spracherkennungsvorrichtung SEV nachträglich auch die Nummern an das Mobiltelefon übertragen, die nicht die Eigenschaften einer Telefonnummer aufweisen. Dies können beispielsweise Telefonnummern ohne Vorwahl sein oder beliebige andere Ziffernfolgen.
  • In einem weiteren Ausführungsbeispiel, dargestellt in 4, ist eine Kommunikations-Anlage KA in ein Fahrzeug integriert, die aus einer Spracherkennungsvorrichtung SEV, einer Sprachsyntheseeinrichtung und einem Display D besteht. Der erste Teilnehmer führt in diesem Beispiel über die Kommunikations-Anlage KA ein Gespräch mit einem zweiten Teilnehmer. Hierbei werden von der Spracherkennungsvorrichtung SEV erkannte Ziffernfolgen gespeichert und sowohl auf dem Display D angezeigt als auch mittels der Sprachsyntheseeinrichtung nach Beendigung des Gesprächs mit dem zweiten Teilnehmer wiedergegeben. Beide Formen der Wiedergabe geschehen unter Voranstellung einer Ziffer zur jeweiligen Ziffernfolge, wie auch in den vorangehenden Beispielen. Durch Sprechen der entsprechenden Ziffer kann der erste Teilnehmer eine der Ziffernfolgen auswählen. In der Folge werden Folgeaktionen wie im ersten Ausführungsbeispiel angeboten, jedoch wiederum sowohl sprachlich als auch auf dem Display und eine Auswahl ist wiederum mittels Sprechen einer Ziffer möglich. Dies kann problemlos geschehen, während der erste Teilnehmer das Fahrzeug lenkt. In einer Ausführungsform der Kommunikations-Anlage KA findet die Überwachung durch die Spracherkennungsvorrichtung SEV ständig statt. In einem alternativen Ausführungsbeispiel ist die Spracherkennungsvorrichtung SEV normalerweise deaktiviert. Der erste Teilnehmer kann die Überwachung aber durch eine am Lenkrad des Fahrzeugs integrierte Taste oder mittels eines Sprachkommandos aktivieren. Die Deaktivierung der Spracherkennungsvorrichtung geschieht automatisch, wenn vom zweiten Teilnehmer keine Ziffern mehr gesprochen werden.
  • Die Erfindung ist auf alle Kommunikations-Geräte anwendbar. Dies können Mobiltelefone M1,M2, PDAs oder Festnetz-Telefone F2 sein. Es ist aber auch möglich, dedizierte Geräte damit auszustatten, wie in Fahrzeugen integrierte Kommunikations-Anlagen KA.

Claims (10)

  1. Verfahren zur Sprachauswertung während einer Sprachverbindung zwischen einem ersten Teilnehmer mit einem ersten Kommunikationsgerät (M1,M1B) und wenigstens einem zweiten Teilnehmer mit einem zweiten Kommunikationsgerät (M2,F2), wobei durch eine Spracherkennungsvorrichtung (SEV) überwacht wird, ob vom zweiten Kommunikationsgerät (M2,F2) aufgenommene und an das erste Kommunikationsgerät (M1,M1B) übertragene Sprachsignale eine Ziffernfolge enthalten und die erkannte Ziffernfolge zu einer dem ersten Kommunikationsgerät (M1,M1B) zugeordneten Auswahlvorrichtung zur Auswahl von Folgeaktionen übertragen wird.
  2. Verfahren nach Anspruch 1, wobei das Sprachsignal komprimiert übertragen wird, wobei zur Komprimierung wenigstens teilweise eine Zerlegung in sprachliche Bestandteile durchgeführt wird und wobei diese Zerlegung von der Spracherkennungsvorrichtung (SEV) zur Vereinfachung der Erkennung verwendet wird.
  3. Verfahren nach einem der vorangehenden Ansprüche, dadurch gekennzeichnet, dass von der Spracherkennungsvorrichtung (SEV) ausgewertet wird, ob die Ziffernfolge Eigenschaften einer Zahlengruppe aufweist.
  4. Verfahren nach einem der vorangehenden Ansprüche, wobei die Auswahlvorrichtung ein Display (D) zur Darstellung und/oder eine Sprachsynthesevorrichtung zur Wiedergabe der Ziffernfolge hat.
  5. Verfahren nach einem der vorangehenden Ansprüche, wobei wenigstens die folgenden Aktionen als auswählbare Folgeaktionen zur Verfügung stehen: – Rückruf mit der Ziffernfolge als Rufnummer – Speicherung der Ziffernfolge
  6. Verfahren nach einem der vorangehenden Ansprüche, wobei die Ziffernfolge nach Beendigung der Sprachverbindung zur Auswahl angeboten wird.
  7. Verfahren nach einem der vorangehenden Ansprüche, wobei die Ziffernfolge unverzüglich nach der Erkennung zur Auswahl angeboten wird.
  8. Vorrichtung zur Sprachauswertung während einer Sprachverbindung zwischen einem ersten Teilnehmer mit einem ersten Kommunikationsgerät (M1,M1B) und wenigstens einem zweiten Teilnehmer mit einem zweiten Kommunikationsgerät (M2,F2) nach einem der vorangehenden Ansprüche, wobei durch eine Spracherkennungsvorrichtung (SEV) überwachbar ist, ob vom zweiten Kommunikationsgerät (M2,F2) aufgenommene und an das erste Kommunikationsgerät (M1,M1B) übertragene Sprachsignale eine Ziffernfolge enthalten und wobei die erkannte Ziffernfolge zu einer dem ersten Kommunikationsgerät (M1,M1B) zugeordneten Auswahlvorrichtung zur Auswahl von Folgeaktionen übertragbar ist.
  9. Vorrichtung nach Anspruch 8, wobei die Spracherkennungsvorrichtung (SEV) auf dem Kommunikationsweg zwischen dem ersten und dem zweiten Teilnehmer, beispielsweise in einer Mobilfunk-Basisstation angeordnet ist.
  10. Vorrichtung nach Anspruch 8 oder 9, wobei mittels der Auswahlvorrichtung oder mittels eines Sensors die Überwachung durch die Spracherkennungsvorrichtung (SEV) ein- und ausschaltbar ist.
DE200510024637 2005-05-30 2005-05-30 Verfahren und Vorrichtung zur Sprachauswertung Ceased DE102005024637A1 (de)

Priority Applications (1)

Application Number Priority Date Filing Date Title
DE200510024637 DE102005024637A1 (de) 2005-05-30 2005-05-30 Verfahren und Vorrichtung zur Sprachauswertung

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE200510024637 DE102005024637A1 (de) 2005-05-30 2005-05-30 Verfahren und Vorrichtung zur Sprachauswertung

Publications (1)

Publication Number Publication Date
DE102005024637A1 true DE102005024637A1 (de) 2006-12-07

Family

ID=37401719

Family Applications (1)

Application Number Title Priority Date Filing Date
DE200510024637 Ceased DE102005024637A1 (de) 2005-05-30 2005-05-30 Verfahren und Vorrichtung zur Sprachauswertung

Country Status (1)

Country Link
DE (1) DE102005024637A1 (de)

Similar Documents

Publication Publication Date Title
DE3819538C2 (de)
DE602004011109T2 (de) Verfahren und system zum senden von sprachnachrichten
DE1290570C2 (de) Datenuebertragungssystem fuer telefonleitungen
EP0173264B1 (de) Verfahren für eine programmgesteuerte Fernsprechvermittlungsanlage, insbesondere Wählnebenstellenanlage, bei der von einer jeweils berechtigten Teilnehmerstelle aus, verschiedene Leistungsmerkmale aktivierbar sind
EP0664635A2 (de) Automatisches Bestellsystem in Kommunikations-Vermittlungsanlagen
EP1298901A2 (de) Vermittlungsverfahren zwischen Dialogsystemen
EP0419948A2 (de) Verfahren zur Einleitung vermittlungstechnischer Funktionen und Dienste
DE3512787C1 (de) Verfahren zur Pruefung von Fernsprechapparaten,Leitungswegen und Teilen der Steuerung von Fernsprechvermittlungsanlagen,insbesondere Fernsprechnebenstellenanlagen
DE102007051015A1 (de) Dialogsystem für ein Kraftfahrzeug
DE69830822T2 (de) Kommunikationsgerät mit Mitteilung der Anrufinformation an den angerufenen Teilnehmer
DE3616368C2 (de) Verfahren und Vorrichtung zum Anwählen eines Fernsprechteilnehmers mit einer mobilen Funkfernsprecheinrichtung, insbesondere einem in einem Kraftfahrzeug eingebauten Autotelefon
DE102005024637A1 (de) Verfahren und Vorrichtung zur Sprachauswertung
DE60030702T2 (de) Steuerung der Kapazität eines verteilten Spracherkennungssystems
DE3328059C2 (de) Verfahren zur empfangsseitigen Auswahl von über eine Vermittlungsstelle einer Fernmelde- bzw. Fernsprechanlage laufende Daten- bzw. Sprechverbindungen
DE102018200431A1 (de) Verfahren zur Ausgabe eines Signals einer Drahtloskommunikationsverbindung zwischen einem ersten Anwender in einem Fortbewegungsmittel und einem externen Kommunikationsteilnehmer
DE3519327A1 (de) Verfahren fuer die sprachausgabe zur bedienerfuehrung an endgeraeten von fernmelde-, insbesondere fernsprechvermittlungsanlagen
DE2736045A1 (de) Verfahren zur herstellung einer verbindung ueber ein fernsprechwaehlnetz
DE10050360A1 (de) Verfahren zum Administrieren bzw. Einrichten von Diensten in einem Vermittlungssystem
EP0242770B1 (de) Verfahren zur Durchführung unterschiedlicher Prozesse in einem digitalen für Sprach- und Datenübertragung geeigneten Fernmeldeendgerät
DE19740862B4 (de) Verfahren und Einrichtung zur Informationsübermittlung über ein Telefonnetz
WO2004112361A1 (de) Verfahren zum betreiben eines mobilteils durch definition von menü short-cuts sowie mobilteil
EP1230782A2 (de) Telekommunikations-endgerät, multifunktions-bedienteil und verfahren zum herstellen einer fernsprechverbindung
DE3513244C2 (de)
WO1998041975A1 (de) Elektrisches gerät mit spracheingabe
DE60300452T2 (de) System und Verfahren für die Adressierung einer Kommunikation in einem geschalteten Netzwerk

Legal Events

Date Code Title Description
OP8 Request for examination as to paragraph 44 patent law
8131 Rejection