DE10306325A1 - Kommunikationsgerät - Google Patents

Kommunikationsgerät Download PDF

Info

Publication number
DE10306325A1
DE10306325A1 DE2003106325 DE10306325A DE10306325A1 DE 10306325 A1 DE10306325 A1 DE 10306325A1 DE 2003106325 DE2003106325 DE 2003106325 DE 10306325 A DE10306325 A DE 10306325A DE 10306325 A1 DE10306325 A1 DE 10306325A1
Authority
DE
Germany
Prior art keywords
information
microphone
input element
speaker
recorded
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
DE2003106325
Other languages
English (en)
Inventor
Philip Christal
Beate Dr. Specker
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Gigaset Communications GmbH
Original Assignee
Siemens AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Siemens AG filed Critical Siemens AG
Priority to DE2003106325 priority Critical patent/DE10306325A1/de
Publication of DE10306325A1 publication Critical patent/DE10306325A1/de
Ceased legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/26Devices for calling a subscriber
    • H04M1/27Devices whereby a plurality of signals may be stored simultaneously
    • H04M1/271Devices whereby a plurality of signals may be stored simultaneously controlled by voice recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2201/00Electronic components, circuits, software, systems or apparatus used in telephone systems
    • H04M2201/40Electronic components, circuits, software, systems or apparatus used in telephone systems using speech recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Telephone Function (AREA)

Abstract

Kommunikationsgerät mit Spracherkennungseinrichtung, die zur sprecherabhängigen und zur sprecherunabhängigen Spracherkennung eingerichtet ist.

Description

  • Die Erfindung betrifft ein Kommunikationsgerät, insbesondere ein Mobiltelefon, ein Schnurlostelefon oder einen tragbaren Computer, mit einer Spracherkennungseinrichtung.
  • Die rasante technische Entwicklung auf dem Gebiet der Mobilkommunikation hat in den letzten Jahren zu einer fortschreitenden Miniaturisierung der dabei verwendeten Endgeräte geführt.
  • Diese fortschreitende Miniaturisierung der Endgeräte bringt – nicht nur auf dem Gebiet der Mobilkommunikation – erhebliche Probleme hinsichtlich des Bedienkomforts mit sich, weil es aufgrund der kleinen Gehäuseoberflächen der miniaturisierten Endgeräte nicht mehr möglich ist, diese mit einer dem Funktionsumfang der Geräte entsprechenden Anzahl von Tasten zu versehen.
  • Bekannte Lösungen dieses Problems sehen entweder eine weitersteigende Mehrfachbelegung von Tasten, eine Sprachsteuerung, oder ergänzend zu Tasten ein Eingaberad vor, das durch ein Scrollen (= Rollen) von auswählbaren Zeichen über eine Anzeigefläche die Eingabe unterschiedlicher Informationen ermöglicht.
  • Aus dem deutschen Patent DE 19751123 C1 und der europäischen Anmeldung EP 0477 688 A2 sind bereits Spracherkennungsverfahren zur Anwendung im Telefoniebereich bekannt.
  • Der Erfindung liegt nun die Aufgabe zugrunde, mit einfachen Mitteln eine komfortable und zuverlässige Steuerung eines Kommunikationsgerätes mittels Sprache zu ermöglichen.
  • Diese Aufgabe wird durch die Merkmale der unabhängigen Ansprüche gelöst. Vorteilhafte und zweckmäßige Weiterbildungen ergeben sich aus den abhängigen Ansprüchen.
  • Erfindungsgemäß wird also eine sprecherabhängigen und eine sprecherunabhängigen Spracherkennung eingesetzt.
  • Dadurch ist es möglich, die ohnehin von dem Nutzer eingegebenen zu erkennenden Sprachinformationen, wie beispielsweise Namens-Sprachinformationen, im Rahmen einer sprecherabhängigen Spracherkennung zu verarbeiten und andere Sprachinformationen, wie beispielsweise Kommandos oder Ziffern im Rahmen einer sprecherunabhängigen Spracherkennung zu verarbeiten. Dies ermöglicht eine zuverlässige Spracherkennung mit einfachen Mitteln.
  • Ein Kommunikationsgerät bzw. eine Spracherkennungseinrichtung kann dabei insbesondere eine Prozessoreinrichtung enthalten oder durch eine Prozessoreinrichtung gesteuert werden.
  • Das Eingabeelement kann auch eine Taste oder ein in mehrere Kipp-Richtungen kippbares Navigationseingabeelement sein.
  • Weiterbildungen der Erfindung, welche durch aufwändige Untersuchungen an eigens für diesen Zweck geschaffenen Man-Machine-Interface-Simulatoren geschaffen wurden, ermöglichen eine besonders intuitive Bedienung eines Kommunikationsgerätes mittels einer Spracherkennungseinrichtung.
  • Die Erfindung wird im Folgenden anhand bevorzugter Ausführungsbeispiele näher beschrieben, zu deren Erläuterung nachstehend aufgelistete Figur dient:
  • 1 Blockschaltbild einer Mobilstation mit Bedieneinrichtung.
  • 1 zeigt als Kommunikationsgerät eine Mobilstation MS, insbesondere ein Mobiltelefon, welche eine Bedieneinrichtung MMI, eine Hochfrequenzeinrichtung HF und eine Prozessoreinrichtung PE enthält. Die Bedieneinrichtung MMI umfasst eine Anzeigeeinheit DPL, wie beispielsweise ein Grafikdisplay, ein Mikrofon MIC und ein Navigationseingabeelement NAV.
  • Gemäß einer Ausführungsvariante weist die Bedieneinrichtung ein Tastenfeld (nicht dargestellt) auf zur Eingabe von Buchstaben oder Ziffern.
  • Zur Steuerung der Mobilstation MS und insbesondere der Bedieneinrichtung MMI ist eine programmgesteuerte Prozessoreinrichtung PE, wie beispielsweise ein Mikrocontroller vorgesehen, der auch einen Prozessor CPU und eine Speichereinrichtung SPE umfassen kann. In der Speichereinrichtung SPE sind auch die Programmdaten, wie beispielsweise die Steuerbefehle oder Steuerprozeduren, die zur Steuerung der Mobilstation und insbesondere der Bedieneinrichtung MMI herangezogen werden, Telefonbucheinträge mit verknüpften Namens-Sprachinformationen und Steuerfunktionen mit verknüpften Kommando-Sprachinformationen oder Ziffern-Sprachinformationen gespeichert.
  • Die unterschiedlichen Komponenten der Prozessoreinrichtung können über ein Bussystem BUS oder Ein-/Ausgabeschnittstellen und gegebenenfalls geeignete Controller untereinander oder mit weiteren Komponenten der Mobilstation Daten austauschen. Es ist einem Fachmann hinreichend bekannt, zur Steuerung einer Mobilstation bzw. einer Bedieneinrichtung und zur Realisierung bestimmter Funktionen und Anwendungen der Mobilstation diese und weitere Komponenten einer Prozessoreinrichtung und damit die Prozessoreinrichtung programmtechnisch entsprechend einzurichten.
  • Die Prozessoreinrichtung kann dabei beispielsweise auch durch einen Chipsatz, der mehrere Prozessoren aufweisen kann, rea lisiert sein, der eigens zur Steuerung einer Bedieneinrichtung oder einer Mobilstation hergestellt worden ist.
  • Mittels des in vier Kipp-Richtungen kippbaren Navigationseingabeelementes NAV werden Steuerfunktionen ausgelöst oder ein Marker über die Anzeigeeinrichtung gescrollt.
  • Vereinfacht dargestellt werden sowohl bei der sprecherabhängigen als auch bei der sprecherunabhängigen Spracherkennung durch ein Mikrofon aufgenommene und ggf. weiterverarbeitete Audioinformationen mit einer Vielzahl von ggf. weiterverarbeiteten und abgespeicherten Sprachinformationen verglichen. Unterschreitet die Differenz zwischen aufgenommenen Audioinformationen und gespeicherten Sprachinformationen eine vorgegebene Schwelle, so werden die aufgenommenen Audioinformationen als die entsprechenden gespeicherten Sprachinformationen erkannt. Da sprecherabhängige und sprecherunabhängige Spracherkennungsverfahren als solche bekannt sind, wird an dieser Stelle darauf nicht näher eingegangen. Realisierungen einer Spracherkennung mittels einer Prozessoreinrichtung als solche sind dem Fachmann ebenfalls hinlänglich bekannt.
  • Im folgenden wird ein Ablauf einer Bedienung mittels Spracherkennung für ein Kommunikationsgerät erläutert.
  • Nach dem Einschalten befindet sich das Kommunikationsgerät im Standby-Betriebsmodus. Nach dem Betätigen des Eingabeelementes, beispielsweise dem Kippen eines Navigationseingabeelementes in eine bestimmte Kipp-Richtung wird die Spracherkennung aktiviert. Die nun über das Mikrofon aufgenommenen Sprachinformationen werden im Rahmen eines sprecherabhängigen Spracherkennungsverfahrens mit den abgespeicherten und mit Telefonbucheinträgen verknüpften Namens-Sprachinformationen, die durch verarbeitete Audioinformationen realisiert sind und die gesprochenen Namen eines Telefonbucheintrages repräsentieren, verglichen. Parallel dazu oder danach werden diese über das Mikrofon aufgenommenen Sprachinformationen im Rahmen eines sprecherunabhängigen Spracherkennungsverfahrens mit den abgespeicherten und mit Steuerfunktionen verknüpften Kommando-Sprachinformationen ("Clear", "Cancel", "Save", "Dial") und/oder Ziffer-Sprachinformationen verglichen, die durch verarbeitete Audioinformationen realisiert sind und gesprochene Kommandos und/oder Ziffern repräsentieren, verglichen. Namens-Sprachinformationen können dabei beliebige sprachliche Bezeichnungen eines Telefonbucheintrages, wie Vorname, Nachname, Unternehmensname, Kosename etc. sein.
  • Werden dabei aufgenommene Audioinformationen als gespeicherte Namens-Sprachinformation erkannt, so wird die dem entsprechenden Telefonbucheintrag zugeordnete Rufnummer automatisch gewählt. Durch eine Betätigung des Eingabeelementes kann dieser Rufaufbau unterbrochen werden.
  • Werden aufgenommene Audioinformationen als gespeicherte Kommando-Sprachinformationen erkannt, so wird die dem entsprechenden Kommando zugeordnete Steuerfunktion ausgelöst. Beispielsweise wird durch die Nummernwählkommando-Sprachinformation "Number", eine Steuerfunktion ausgelöst, die das Kommunikationsgerät in einen Rufnummerneingabemodus versetzt. Alternativ oder zusätzlich dazu, sieht eine Ausgestaltung der Erfindung vor, dass auch die Betätigung des Eingabeelementes eine Steuerfunktion auslöst, die das Kommunikationsgerät in einen Rufnummerneingabemodus versetzt. Eine Ausführungsvariante der Erfindung sieht dabei vor, dass nach dem Aktivieren der Spracherkennung im Standby-Betriebsmodus aufgenommene Audioinformationen zunächst nur mit Namens-Sprachinformationen und der Nummernwählkommando-Sprachinformation "Number" verglichen werden.
  • Werden in dem Rufnummerneingabemodus aufgenommene Audioinformationen als gespeicherte Ziffern-Sprachinformationen erkannt, so wird die der entsprechenden Ziffer zugeordnete Steuerfunktion ausgelöst, durch welche eine Eingabe der ent sprechenden Ziffer in einen aktuellen Rufnummernspeicher und deren Darstellung auf dem Display erfolgt.
  • Nach der Aufnahme von – mindestens eine Ziffer oder eine Vielzahl von Ziffern repräsentierenden – Audioinformationen werden auf der Anzeigeeinrichtung Informationen dargestellt, die den Nutzer auffordern, die Eingabe weiterer Ziffern zunächst zu unterbrechen, um der Sprachverarbeitungseinrichtung die erforderliche Verarbeitungszeit zu geben. Nachdem die bisher aufgenommenen Audioinformationen durch die Spracherkennungseinrichtung verarbeitet worden sind, werden auf der Anzeigeeinrichtung Informationen dargestellt, die den Nutzer auffordern, die Eingabe weiterer Ziffern fortzusetzen.
  • Falls nach der Aktivierung der Spracherkennung die aufgenommenen Audioinformationen nicht als Nummernwählkommando-Sprachinformation "Number" erkannt wird und keinem Telefonbucheintrag eine Namens-Sprachinformation zugeordnet ist, werden auf der Anzeigeeinrichtung Informationen dargestellt, die den Nutzer darauf hinweisen, dass kein Telefonbucheintrag mit einer Namens-Sprachinformation verknüpft ist.
  • Neben den oben erläuterten Ausführungsvarianten der Erfindung liegt eine Vielzahl weiterer Ausführungsvarianten im Rahmen der Erfindung, welche hier nicht weiter beschrieben werden, aber anhand der erläuterten Ausführungsbeispiele einfach in die Praxis umgesetzt werden können.

Claims (9)

  1. Kommunikationsgerät – mit einem Mikrofon, – mit einem Eingabeelement, und – mit einer mit dem Mikrofon und dem Eingabeelement gekoppelten Spracherkennungseinrichtung, die zur sprecherabhängigen und zur sprecherunabhängigen Spracherkennung eingerichtet ist.
  2. Kommunikationsgerät nach Anspruch 1, mit einer Speichereinrichtung für Telefonbucheinträge und da mit verknüpften Namens-Sprachinformationen, bei dem die Spracherkennungseinrichtung derart mit dem Mikrofon, dem Eingabeelement und der Speichereinrichtung gekoppelt ist, dass nach einer Betätigung des Eingabeelementes mittels des Mikrofons aufgenommene Audioinformationen im Rahmen einer sprecherabhängigen Spracherkennung mit Namens-Sprachinformationen von Telefonbucheinträgen verglichen werden und im Rahmen einer sprecherunabhängigen Spracherkennung mit abgespeicherten Kommando-Sprachinformationen und/oder abgespeicherten Ziffern-Sprachinformationen verglichen werden.
  3. Kommunikationsgerät nach einem der vorhergehenden Ansprüche, bei dem nach dem Erkennen der aufgenommenen Audioinformationen als Namens-Sprachinformation die mit der Namens-Sprachinformation über den Telefonbucheintrag verknüpfte Telefonnummer automatisch angewählt wird, wobei vorzugsweise dieses Anwählen durch eine Betätigung des Eingabeelementes abbrechbar ist.
  4. Kommunikationsgerät nach einem der vorhergehenden Ansprüche, bei dem nach der Betätigung des Eingabeelementes mittels des Mikrofons aufgenommene Audioinformationen mit Namens- Sprachinformationen von Telefonbucheinträgen verglichen werden.
  5. Kommunikationsgerät nach einem der vorhergehenden Ansprüche, bei dem nach der Betätigung des Eingabeelementes mittels des Mikrofons aufgenommene Audioinformationen mit einer Nummernwählkommando-Sprachinformation verglichen werden, und bei dem nach dem Erkennen der aufgenommenen Audioinformationen als Nummernwählkommando-Sprachinformation weitere mittels des Mikrofons aufgenommene Audioinformationen mit Ziffern-Sprachinformationen verglichen werden.
  6. Kommunikationsgerät nach einem der vorhergehenden Ansprüche, bei dem nach der Betätigung des Eingabeelementes mittels des Mikrofons aufgenommene Audioinformationen mit einer Nummernwählkommando-Sprachinformation verglichen werden, und bei dem nach einer weiteren Betätigung des Eingabeelementes weitere mittels des Mikrofons aufgenommene Audioinformationen mit Ziffern-Sprachinformationen verglichen werden.
  7. Kommunikationsgerät nach einem der vorhergehenden Ansprüche, bei dem nach der Betätigung des Eingabeelementes überprüft wird, ob ein Telefonbucheintrag mit einer Namens-Sprachinformation verknüpft ist, und bei dem auf einer Anzeigeeinrichtung entsprechende Hinweis-Informationen dargestellt werden, wenn kein Telefonbucheintrag mit einer Namens-Sprachinformation verknüpft ist.
  8. Kommunikationsgerät nach einem der vorhergehenden Ansprüche, bei dem die durch das Mikrofon aufgenommene Sprachinformationen zur Spracherkennung in Sprachinformations-Abschnitte aufgeteilt werden, wobei nach der Aufnahme eines Sprachabschnit tes auf der Anzeigeeinrichtung Informationen dargestellt werden, die den Nutzer auffordern, eine Sprechpause einzulegen.
  9. Kommunikationsgerät nach Anspruch 8, bei dem in Abhängigkeit von der Verarbeitung des zuletzt aufgenommenen Sprachinformations-Abschnittes auf der Anzeigeeinrichtung Informationen dargestellt werden, die den Nutzer auffordern, weiter zu sprechen.
DE2003106325 2003-02-14 2003-02-14 Kommunikationsgerät Ceased DE10306325A1 (de)

Priority Applications (1)

Application Number Priority Date Filing Date Title
DE2003106325 DE10306325A1 (de) 2003-02-14 2003-02-14 Kommunikationsgerät

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE2003106325 DE10306325A1 (de) 2003-02-14 2003-02-14 Kommunikationsgerät

Publications (1)

Publication Number Publication Date
DE10306325A1 true DE10306325A1 (de) 2004-08-26

Family

ID=32747875

Family Applications (1)

Application Number Title Priority Date Filing Date
DE2003106325 Ceased DE10306325A1 (de) 2003-02-14 2003-02-14 Kommunikationsgerät

Country Status (1)

Country Link
DE (1) DE10306325A1 (de)

Similar Documents

Publication Publication Date Title
DE69826091T2 (de) Handapparat für Funkgerät
DE10137215A1 (de) Verfahren zur Vereinfachung der Menüauswahl bei einem Mobiltelefon
EP0540570A1 (de) Verfahren zur durchführung eines variablen dialogs mit technischen geräten.
DE10242378A1 (de) Einrichtung zur Eingabe von Zeichen mittels eines Eigabeelements und Mobiltelefon
DE102006055252B4 (de) Anordnung und Verfahren zur multimodalen Auswahl von Objekten in Telekommunikationsanwendungen
DE102004002010B4 (de) Anordnung zur Sprachbedienung eines elektronischen Gerätes, insbesondere in einem Kraftfahrzeug
DE10306325A1 (de) Kommunikationsgerät
EP1083479B1 (de) Verfahren zum Betrieb einer sprachgesteuerten Befehlseingabeeinheit in einem Kraftfahrzeug
DE102012100564B4 (de) Anzeigeeinheit für eine Türstation
EP1230782B1 (de) Telekommunikations-endgerät und multifunktions-bedienteil
EP1413123B1 (de) Eigene rufnummer anzeigendes telefon
DE102005023963B4 (de) Betrieb eines in einem Telekommunikationsnetz nutzbaren Endgerätes
EP1285518B1 (de) Mobilfunktelefon mit assoziativer benutzeroberfläche
DE102013001310B4 (de) Verfahren zum Betreiben eines mobilen Kommunikationsendgeräts sowie mobiles Kommunikationsendgerät
DE10306321A1 (de) Eingabeeinrichtung und Kommunikationsgerät
DE4319206A1 (de) Endgerät
DE10326807A1 (de) Verfahren zum Betreiben eines Mobilteils sowie Mobilteil
DE19719163A1 (de) Multifunktionales Mobilkommunikationsgerät
DE10306322A1 (de) Eingabeeinrichtung und Kommunikationsgerät
DE102005023960A1 (de) Betrieb eines in einem Telekommunikationsnetz nutzbaren Endgerätes
DE10358730B4 (de) Kommunikationsgerät
DE10147938A1 (de) Verfahren und Vorrichtung zur Eingabe von Eingabeelementen
DE10050220A1 (de) Verfahren und Einrichtung zur sprachbefehlsgeteuerten Anwahl einer Telefonnummer
EP2136287A1 (de) Vorrichtung zur Eingabe von Eingabeelementen
DE102007004959A1 (de) Betrieb eines in Telekommunikationsnetzen nutzbaren Endgerätes

Legal Events

Date Code Title Description
8127 New person/name/address of the applicant

Owner name: GIGASET COMMUNICATIONS GMBH, 81379 MUENCHEN, DE

8110 Request for examination paragraph 44
R002 Refusal decision in examination/registration proceedings
R003 Refusal decision now final

Effective date: 20120609