DE69828611T2 - Zellulares telefongerät mit sprachgesteuerten wahlverfahren - Google Patents

Zellulares telefongerät mit sprachgesteuerten wahlverfahren Download PDF

Info

Publication number
DE69828611T2
DE69828611T2 DE69828611T DE69828611T DE69828611T2 DE 69828611 T2 DE69828611 T2 DE 69828611T2 DE 69828611 T DE69828611 T DE 69828611T DE 69828611 T DE69828611 T DE 69828611T DE 69828611 T2 DE69828611 T2 DE 69828611T2
Authority
DE
Germany
Prior art keywords
data
feature data
memory
voice
speech recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
DE69828611T
Other languages
English (en)
Other versions
DE69828611D1 (de
Inventor
Hwan Duck KIM
Yong Seo CHIN
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Application granted granted Critical
Publication of DE69828611D1 publication Critical patent/DE69828611D1/de
Publication of DE69828611T2 publication Critical patent/DE69828611T2/de
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/38Transceivers, i.e. devices in which transmitter and receiver form a structural unit and in which at least one part is used for functions of transmitting and receiving
    • H04B1/40Circuits
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/26Devices for calling a subscriber
    • H04M1/27Devices whereby a plurality of signals may be stored simultaneously
    • H04M1/271Devices whereby a plurality of signals may be stored simultaneously controlled by voice recognition

Description

  • 1. Sachgebiet der Erfindung
  • Die vorliegende Erfindung bezieht sich auf zellulare Telefone, und, insbesondere, auf ein zellulares Telefon, das eine Sprachwählfunktion besitzt.
  • 2. Beschreibung des in Bezug stehenden Stands der Technik
  • Ein zellulares Telefon, das eine Sprachwählfunktion besitzt, setzt eine Spracherkennungsvorrichtung ein, die Merkmale, wie beispielsweise eine Frequenz, von den Eingabesprachsignalen extrahiert, um die Eingabesprache zu erkennen. Allgemein besitzt die Spracherkennungsvorrichtung eine große Anzahl von Eingabesprachsignalen, um sie zu verarbeiten, was eine Überbelastung an der Vorrichtung verursachen kann.
  • Ein bekanntes Sprachwählverfahren zum Lösen des Überlastungsproblems ist dasjenige, eine Freisprecheinrichtung, umfassend einen digitalen Signalprozessor (DSP) und einen nicht flüchtigen Speicher (z. B. einen Flash-Speicher oder einen EEPROM (Electrically Erasable and Programmable Read Only Memory)), zu verwenden. Der DSP in der Freisprecheinrichtung extrahiert die Merkmaldaten von den Eingabesprachsignalen und speichert die extrahierten Merkmaldaten in dem nicht flüchtigen Speicher (d. h. einem Spracherkennungsspeicher) als Referenz-Merkmaldaten. Unter Empfang eines Sprachwählbefehls vergleicht der DSP die Merkmaldaten der Eingabesprachsignale mit den Referenz-Merkmaldaten, registriert in dem Spracherkennungsspeicher, um Eingabesprachsignale zu erkennen, und liefert die Spracherkennungsergebnisse zu dem zellularen Telefon. Das zellulare Telefon wählt dann eine Telefonnummer entsprechend zu den Spracherkennungsergebnissen. Der Spracherkennungsspeicher ist in drei Speicherbereiche unterteilt; einen ersten Speicherbereich für Indexdaten; einen zweiten Speicherbereich zum Speichern von Informationen der Sprachsignaleingabe von einem Mikrofon des zellularen Telefons; und einen dritten Speicherbereich zum Speichern von Informationen der Sprachsignaleingabe von einem Mikrofon der Freisprecheinrichtung.
  • 1 stellt eine Speicherliste für den Spracherkennungsspeicher gemäß dem Stand der Technik dar. Wie dargestellt ist, ist der Spracherkennungsspeicher in drei Speicherbereiche Mi, Mhs und Mhf unterteilt. Der Speicherbereich Mi speichert die Indexdaten und der Speicherbereich Mhs speichert die Referenz-Merkmaldaten Fhs1 und Fhs2 und Sprach-Wiedergabedaten VPI der Sprachsignale, eingegeben von dem Handset des zellularen Telefons. Der Speicherbereich Mhf speichert die Referenz-Merkmaldaten Fhf1 und Fhf2 und Sprach-Wiedergabedaten VP2 des Sprachsignals, eingegeben von der Freisprecheinrichtung.
  • Der Grund, warum der Spracherkennungsspeicher in die Speicherbereiche Mhs und Mhf, die dieselbe Struktur haben, unterteilt ist, ist derjenige, dass, obwohl ein bestimmtes Wort durch denselben Benutzer ausgesprochen wird, die Merkmaldaten, ausgegeben von der Freisprecheinrichtung, gegenüber den Merkmaldaten, ausgegeben von dem Handset des zellularen Telefons, unterschiedlich sein können. Deshalb werden die Referenz-Merkmaldaten Fhs1 und Fhs2 für das Handset des zellularen Telefons und die Referenz-Merkmaldaten Fhf1 und Fhf2 für die Freisprecheinrichtung getrennt in den Speicherbereichen Mhs und Mhf, jeweils, gespeichert. Weiterhin speichert der herkömmliche Spracherkennungsspeicher die Sprach-Wiedergabedaten VP1 und VP2 separat in den jeweiligen Speicherbereichen Mhs und Mhf, wodurch die Effektivität des Speichers verringert wird.
  • Allerdings ist es, da die Sprach-Wiedergabedaten VP1 und VP2 beim Abspielen der Sprache des Worts, das der Benutzer aussprach, verwendet werden, notwendig, die Sprach-Wiedergabedaten VP1 und VP2 separat zu speichern. Im Gegensatz dazu ist es bevorzugt, dass ausgewählte solche der Sprach-Wiedergabedaten VP1 und VP2 in dem Spracherkennungsspeicher gespeichert werden.
  • Allgemein sind die Speicherbereiche für die Sprach-Wiedergabedaten VP1 und VP2 viel größer in der Kapazität als die Speicherbereiche für die Merkmaldaten Fhs1, Fhs2, Fhf1 und Fhf2. Deshalb ist es nicht für den Spracherkennungsspeicher ökonomisch, zwei Sprach-Wiedergabe-Speicherbereiche VP1 und VP2 für dieselbe Verwendung zu haben. Zusätzlich besitzt der Spracherkennungsspeicher mit der hohen Speicherkapazität einen erhöhten Energieverbrauch, was eine Verringerung der nutzbaren Dauer der Batterie des Telefons hervorrufen kann.
  • Die US 5,239,586 A bezieht sich auf ein Spracherkennungssystem, das in einem Mobil-Telefongerät verwendet wird, das dazu geeignet ist, Anrufe ohne ein manuelles Wählen vorzunehmen. Der Audiosignalpegel wird in Abhängigkeit davon gesteuert, ob das Audiosignal von einem Handset-Mikrofon oder einem Freisprech-Mikrofon kommt. Zum Zeitpunkt der Spracherkennung werden die abgetasteten, quantisierten, codierten Sprachsignale mit zuvor registrierten Wort-Daten verglichen.
  • ZUSAMMENFASSUNG DER ERFINDUNG
  • Es ist deshalb die Aufgabe der vorliegenden Erfindung, ein zellulares Telefon und ein entsprechendes Verfahren zu schaffen, die eine Sprachwählfunktion besitzen, bei der ein Spracherkennungsspeicher effektiv und effizient verwaltet wird.
  • Diese Aufgabe wird durch die Erfindung, wie sie in den unabhängigen Ansprüchen beansprucht ist, gelöst.
  • Bevorzugte Ausführungsformen sind in den abhängigen Ansprüchen angegeben.
  • Dementsprechend schafft die vorliegende Erfindung ein zellulares Telefon, das dazu geeignet ist, mit einer Freisprecheinrichtung verbunden zu werden, und mit einer Spracherkennungsvorrichtung, um Merkmaldaten von einem Eingabesprachsignal zu extrahieren, um so das Sprachsignal zu erkennen, und einen Speicher zum Speichern der Merkmaldaten. Der Speicher ist in einen ersten Speicherbereich zum Speichern von Indexdaten, einen zweiten Speicherbereich zum Speichern von Merkmaldaten, eingegeben von dem zellularen Telefon, einen dritten Speicherbereich zum Speichern, welche Merkmaldaten von der Freisprecheinrichtung kommen, und einen vierten Speicherbereich zum Speichern von Sprach-Wiedergabedaten unterteilt. Der vierte Speicherbereich weist einen Speicherbereich zum Speichern der Sprach-Wiedergabedaten und einen anderen Speicherbereich zum Speichern einer Telefonnummer auf.
  • Vorzugsweise weisen die Indexdaten eine erste Adresse, wo die Merkmaldaten, eingegeben von dem zellularen Telefon, gespeichert sind, eine zweite Adresse, wo die Merkmaldaten, eingegeben von der Freisprecheinrichtung, gespeichert sind, und eine dritte Adresse, wo die Telefonnummer und die Sprach-Wiedergabedaten gespeichert sind, auf.
  • KURZE BESCHREIBUNG DER ZEICHNUNGEN
  • Die vorstehenden und andere Aufgaben, Merkmale und Vorteile der vorliegenden Erfindung werden aus der nachfolgenden, detaillierten Beschreibung ersichtlich werden, wenn sie in Verbindung mit den beigefügten Zeichnungen herangezogen wird, in denen:
  • 1 zeigt ein Diagramm, das eine Speicherliste für einen Spracherkennungsspeicher gemäß dem Stand der Technik darstellt;
  • 2 zeigt ein Blockdiagramm eines zellularen Telefons mit einer Sprachwählfunktion, bei dem die vorliegende Erfindung angewandt wird;
  • 3 zeigt ein Diagramm, das eine Speicherliste für einen Spracherkennungsspeicher gemäß einer Ausführungsform der vorliegenden Erfindung darstellt;
  • 4 zeigt ein Flussdiagramm zum Steuern des Spracherkennungsspeichers der 3 während eines Sprachregistrierungsvorgangs; und
  • 5 zeigt ein Flussdiagramm zum Steuern des Spracherkennungsspeichers der 3 während eines Spracherkennungsvorgangs.
  • DETAILLIERTE BESCHREIBUNG DER BEVORZUGTEN AUSFÜHRUNGSFORMEN
  • Eine bevorzugte Ausführungsform der vorliegenden Erfindung wird im Detail nachfolgend unter Bezugnahme auf die beigefügten Zeichnungen beschrieben. Für ein umfassenderes Verständnis der vorliegenden Erfindung wird die vorliegende Erfindung, beschränkt auf die spezifische Ausführungsform, erläutert. Allerdings sollte angemerkt werden, dass die vorliegende Erfindung in Verbindung mit der Beschreibung durch einen Fachmann auf dem betreffenden Fachgebiet ausgeführt werden kann. In der nachfolgenden Beschreibung sind ausreichend bekannte Funktionen und Anordnungen, die die vorliegende Erfindung in unnötigem Detail verschleiern könnten, nicht im Detail beschrieben.
  • Die vorliegende Erfindung ist darauf gerichtet, ein Eingabesprachsignal unter Verwendung von Paketdaten, die von dem Vocoder (Sprachcodierer) ausgegeben werden, umfasst in dem zellularen Telefon, zu erkennen. Deshalb kann das zellulare Telefon das Sprachsignal ohne Unterstützung des DSP in der Freisprecheinrichtung erkennen.
  • 2 stellt ein tragbares, zellulares Telefon dar, das eine Sprachwählfunktion besitzt, bei dem die vorliegende Erfindung angewandt wird. Die RF-(Radio-Frequenz)-Schaltung und eine DTMF-(Dual-Ton-Mehrfach-Frequenz)-Schaltung sind von der Zeichnung entfernt worden, da sie sich nicht auf die vorliegende Erfindung beziehen.
  • Wie 2 zeigt, wird eine analoge Sprachsignaleingabe von einem Mikrofon 30 in ein digitales PCM-(Pulse Code Modulation)-Signal durch einen Analog-Digital-(A/D)-Wandler 20 umgewandelt. Ein Vocoder 45 komprimiert das PCM-Signal, ausgegeben von dem A/D-Wandler 20, und gibt vorbestimmte Paketdaten PKT aus. In einem CDMA-Zellulartelefon kann der Vocoder 45 durch einen 8 Kbps QCELP (Qualcomm Code Excited Linear Predictive Coding), einen 13 Kbps QCELP und einen 8 Kbps EVRC (Enhanced Variable Rate Coding) Codierer realisiert werden, und in einem GSM (Global System for Mobile Communications) Zellulartelefon kann er durch einen RPE-LTP (Regular Pulse Excitation with Long Term Prediction) Codierer realisiert werden.
  • Die Paketdaten PKT, ausgegeben von dem Vocoder 45, werden zu einem Mikroprozessor 50 zugeführt, der den gesamten Betrieb des zellularen Telefons steuert. Ein erster Speicher 60, der ein nicht flüchtiger Speicher ist (z. B. ein Flash-Memory oder ein EEPROM), speichert ein Steuerprogramm und anfängliche Service-Daten. Ein zweiter Speicher 65, der ein RAM (Random Access Memory) ist, speichert temporär verschiedene Daten, erzeugt während eines Betriebs des zellularen Telefons, wie beispielsweise Paketdaten, für Eingabesprachsignale, und zwar für eine Registrierung oder eine Erkennung.
  • Eine Spracherkennungsvorrichtung 45 gibt die Merkmaldaten, extrahiert von den Paketdaten der Eingabesprachsignale, unter einer Übertragungsrate von 20 Bytes/sec aus. Die Merkmaldaten werden für eine Spracherkennung verwendet und umfassen einige 10 bis einige 100 Bytes, umfassend das Frequenzmerkmal und die Intensität des Eingabesprachsignals. Die Spracherkennungsvorrichtung 85 kann durch entweder eine Hardware oder eine Software realisiert werden. Wenn die Spracherkennungsvorrichtung 85 durch eine Software realisiert wird, kann das Softwareprogramm in dem ersten Speicher 60 gespeichert werden. Der Mikroprozessor 50 führt die Paketdaten PKT, ausgegeben von dem Vocoder 45, zu der Spracherkennungsvorrichtung 85 zu und wählt eine Telefonnummer entsprechend den Indexdaten, ausgegeben von der Spracherkennungsvorrichtung 85. Zusätzlich speichert der Mikroprozessor 50, in einem internen Speicher davon, eine Adresse des ersten Speichers 60, wo die Paketdaten, ausgegeben von dem Vocoder 45, gespeichert sind, und liest die Paketdaten von dem ersten Speicher 60 unter Verwendung der Adresse, um den Benutzer zu informieren, dass die Sprache vollständig erkannt ist. Zur Vereinfachung werden die gelesenen Paketdaten als die Sprach-Wiedergabedaten VP bezeichnet. Der Vocoder 45 wandelt die Sprach-Wiedergabedaten VP in ein PCM-Signal um und führt es zu einem Digital-Analog-(D/A)-Wandler 45 zu, der das Eingangs-PCM-Signal in ein analoges Signal umwandelt und das umgewandelte, analoge Signal über einen Lautsprecher 80 ausgibt. Anstelle der Sprach-Wiedergabedaten kann eine Nachricht zum Informieren über den Abschluss der Spracherkennung in dem ersten Speicher 60 gespeichert werden.
  • Der Freisprecheinrichtung-Verbinder 500 verbindet das zellulare Telefon mit einer Freisprecheinrichtung (nicht dargestellt) und führt das Sprachsignal, eingegeben von einem Mikrofon der Freisprecheinrichtung, zu dem A/D-Wandler 20 zu, der das Eingabesprachsignal in ein digitales Signal umwandelt.
  • Der Freisprecheinrichtung-Verbinder 500 ist mit einem spezifischen Anschluss des Mikroprozessors 50 verbunden, um zu ermöglichen, dass er bestimmt, ob das Eingabesprachsignal von dem Mikrofon 30 des zellularen Telefons oder dem Mikrofon der Freisprecheinrichtung empfangen ist. Der Mikroprozessor 50 und der Freisprecheinrichtung-Verbinder 500 bilden eine Einrichtung, um die Quelle des Eingabesprachsignals zu erfassen.
  • 3 stellt eine Speicherliste des Spracherkennungsspeichers (d. h. des ersten Speichers 60) gemäß der vorliegenden Erfindung dar. Wie dargestellt ist, ist der erste Speicher 60 in einen Speicherbereich SA1 zum Speichern von Indexdaten, einen zweiten Speicherbereich SA2 zum Speichern von Informationen über die Sprachsignale, eingegeben von dem zellularen Telefon, einen Speicherbereich SA4 zum Speichern von Informationen der Sprachsignale, eingegeben von der Freisprecheinrichtung, und einen gemeinsamen Speicherbereich SA3 zum Speichern der Sprach-Wiedergabedaten VP und einer Telefonnummer unterteilt. Der zweite Speicherbereich SA2 speichert die Referenz-Merkmaldaten Fhs1 und Fhs2 der Sprachsignale, eingegeben von dem Handset des zellularen Telefons, in Zuordnung zu den Indexdaten. Der dritte Speicherbereich SA3 speichert die Sprach-Wiedergabedaten VP und die Telefonnummer, und der vierte Speicherbereich SA4 speichert die Referenz-Merkmaldaten Vhf1 und Fhf2 der Sprachsignale, eingegeben von der Freisprecheinrichtung, in Zuordnung zu den Indexdaten. Die Indexdaten I1 können Adressen umfassen, wo die Merkmaldaten Fhs1, Fhs2, Fhf1 und Fhf2 gespeichert sind, und eine Adresse, wo die Telefonnummer und die Sprach-Wiedergabedaten VP gespeichert sind. In dem Fall, dass das zellulare Telefon einen separaten Adressengenerator besitzt, ist der erste Speicherbereich SA1 nicht notwendig.
  • Wie in 3 dargestellt ist, ist jeder des ersten und des vierten Speicherbereichs SA2 und SA4 wiederum in zwei Speicherbereiche zum Speichern der Referenz-Merkmaldaten Fhs1 und Fhs2, und Fhf1 und Fhf2, jeweils, unterteilt. Dies kommt daher, dass die Sprachsignale, obwohl sie durch denselben Benutzer ausgesprochen sind, zueinander unterschiedlich sein können, wenn der Benutzer sie ausspricht. Deshalb werden die Referenz-Merkmaldaten zweimal für dasselbe Wort extrahiert, das der Benutzer ausgesprochen hat, und in den zwei Speicherbereichen getrennt gespeichert.
  • 4 zeigt ein Flussdiagramm zum Steuern des ersten Speichers 60 während eines Spracherkennungsvorgangs. Falls der Benutzer ein bestimmtes Wort (z. B. einen Namen der Person, mit der der Benutzer telefonieren möchte) über das Mikrofon 30 ausspricht, erkennt die Spracherkennungsvorrichtung 85 das Sprachsignal, eingegeben von dem Mikrofon 30. Wenn der Benutzer das Wort über das Mikrofon der Freisprecheinrichtung ausspricht, erkennt die Spracherkennungsvorrichtung 85 das Sprachsignal, empfangen von der Freisprecheinrichtung, über den Verbinder 500 der Freisprecheinrichtung. Der Mikroprozessor 50 extrahiert die Referenz-Merkmaldaten von den Eingabesprachsignalen im Schritt 100 und bestimmt die Quelle der empfangenen Sprachsignale im Schritt 110 durch Prüfen, ob das zellulare Telefon mit der Freisprecheinrichtung verbunden ist oder nicht. Falls das zellulare Telefon nicht mit der Freisprecheinrichtung verbunden ist, speichert der Mikroprozessor 50 die Referenz-Merkmaldaten Fhs1 und Fhs2 in dem zweiten Speicherbereich SA2 des ersten Speichers 60 (Schritt 120), und zwar basierend auf der Bestimmung, dass sie von dem Handset des zellularen Telefons stammen. Allerdings speichert, falls das zellulare Telefon mit der Freisprecheinrichtung verbunden ist, der Mikroprozessor 50 die Referenz-Merkmaldaten Fhf1 und Fhf2 in dem vierten Speicherbereich SA4 des ersten Speichers 60 (Schritt 130). Nach Speichern der Merkmaldaten steuert der Mikroprozessor 50 die Spracherkennungsvorrichtung 85, um das Eingabesprachsignal als die Sprach-Wiedergabedaten VP in dem dritten Speicherbereich SA3, zusammen mit seiner entsprechenden Telefonnummer, zu speichern (Schritt 140).
  • 5 zeigt ein Flussdiagramm zum Steuern des ersten Speichers 60 während des Spracherkennungsvorgangs. Falls der Benutzer den Namen, registriert in dem zellularen Telefon, ausspricht, um die Telefonnummer durch die Sprache zu wählen, extrahiert die Spracherkennungsvorrichtung 85 die Merkmaldaten von dem Eingabesprachsignal und vergleicht dann die Merkmaldaten mit den Referenz-Merkmaldaten, registriert in dem ersten Speicher 60. Falls die Eingabe-Merkmaldaten ähnlich zu den Referenz-Merkmaldaten sind, gibt die Spracherkennungsvorrichtung 85 die Indexdaten entsprechend zu den Merkmaldaten zusammen mit einem Differenzwert dazwischen zu dem Mikroprozessor 50 aus.
  • Wie die 2 und 5 zeigen, extrahiert der Mikroprozessor 50 die Merkmaldaten des Eingabesprachsignals von der Spracherkennungsvorrichtung 85 (Schritt 209) und bestimmt die Quelle der Merkmaldaten durch Prüfen, ob das zellulare Telefon mit der Freisprecheinrichtung verbunden ist oder nicht (Schritt 210). Falls die empfangenen Merkmaldaten von dem Handset des zellularen Telefons stammen, steuert der Mikroprozessor 50 die Spracherkennungsvorrichtung 85 so, um Referenz-Merkmaldaten Fhs1 und Fhs2 von dem zweiten Speicherbereich SA2 des ersten Speichers 60 zu lesen, und vergleicht sie mit den empfangenen Merkmaldaten, um so die Indexdaten und einen Referenzwert dazwischen zu erzeugen (Schritt 220). Allerdings steuert, falls die empfangenen Merkmaldaten von der Freisprecheinrichtung stammen, der Mikroprozessor 50 die Spracherkennungsvorrichtung 85 so, um die Referenz-Merkmaldaten Fhf1 und Fhf2 von dem vierten Speicherbereich SA4 des ersten Speichers 60 zu lesen und um sie mit den empfangenen Merkmaldaten zu vergleichen, um so die Indexdaten und den Differenzwert dazwischen zu erzeugen (Schritt 230). Danach empfängt der Mikroprozessor 50 die Indexdaten und den Differenzwert von der Spracherkennungsvorrichtung 85 (Schritt 240) und liest die Sprach- Wiedergabedaten VP von dem dritten Speicherbereich SA3 entsprechend zu den Indexdaten, ausgegeben von der Spracherkennungsvorrichtung 85 (Schritt 250). Die gelesenen Sprach-Wiedergabedaten VP werden zu dem Lautsprecher 80 ausgegeben. Darauffolgend liest der Mikroprozessor 50 die Telefonnummer von dem dritten Speicherbereich SA3 entsprechend zu den Indexdaten (Schritt 260) und wählt die gelesene Telefonnummer im Schritt 270.
  • Wie vorstehend beschrieben ist, verwaltet das zellulare Telefon effektiv den Spracherkennungsspeicher, um dadurch zu einer Verringerung der Produktionskosten und des Energieverbrauchs beizutragen.
  • Während diese Erfindung in Verbindung mit demjenigen beschrieben worden ist, was derzeit als die praktikabelste und bevorzugteste Ausführungsform angesehen wird, sollte verständlich werden, dass die Erfindung nicht auf die offenbarte Ausführungsform beschränkt ist, sondern, im Gegensatz dazu, ist vorgesehen, verschiedene Modifikationen innerhalb des Schutzumfangs der beigefügten Ansprüche abzudecken.

Claims (6)

  1. Mobiltelefon, das mit einer Freisprecheinrichtung verbunden werden kann und einen Vocoder (45) aufweist, wobei das Mobiltelefon gekennzeichnet ist durch: eine Bestimmungseinrichtung, die bestimmt, ob Merkmaldaten von dem Mobiltelefon oder der Freisprecheinrichtung stammen; eine Spracherkennungsvorrichtung (85), die die Merkmaldaten aus einem Sprachsignal extrahiert, indem sie Paketdaten verarbeitet, die von dem Vocoder ausgegeben werden, die extrahierten Merkmaldaten mit registrierten Merkmaldaten entsprechend einer Ausgabe der Bestimmungseinrichtung vergleicht und Indexdaten mit einer Adresse ausgibt, an der die Merkmaldaten gespeichert sind, wenn die extrahierten Merkmaldaten den registrierten Merkmaldaten ähneln; und einen Mikroprozessor (50), der eine Adresse liest, an der Sprach-Wiedergabedaten gespeichert sind, die Sprach-Wiedergabedaten liest und ausgibt, eine Telefonnummer entsprechend den Indexdaten liest und die gelesene Telefonnummer wählt.
  2. Mobiltelefon nach Anspruch 1, die des Weiteren einen Spracherkennungsspeicher (60) umfasst, der umfasst: einen ersten Speicherbereich (SA2, Fhs1) zum Registrieren von Merkmaldaten, die von dem Mobiltelefon eingegeben werden; einen zweiten Speicherbereich (SA2, Fhs2) zum Registrieren der Merkmaldaten, die von der Freisprecheinrichtung eingegeben werden; und einen dritten Speicherbereich (SA3, VP) zum Registrieren von Sprach-Wiedergabedaten.
  3. Mobiltelefon nach Anspruch 2, wobei der dritte Speicherbereich einen Speicherabschnitt zum Speichern der Sprach-Wiedergabedaten und einen anderen Speicherabschnitt zum Speichern der Telefonnummer umfasst.
  4. Mobiltelefon nach einem der Ansprüche 1 bis 3, wobei die Merkmaldaten Frequenzdaten und Stärkedaten enthalten, die sich auf die Frequenz bzw. die Stärke des Sprachsignals beziehen.
  5. Verfahren zum Steuern eines Spracherkennungsspeichers während eines Spracherkennungsprozesses in einem Mobiltelefon mit einer Sprachwahlfunktion, wobei das Verfahren die folgenden Schritte umfasst: Extrahieren (209) eingegebener Merkmaldaten aus einem Eingabe-Sprachsignal; Bestimmen (210), ob die extrahierten Merkmaldaten von einem Mobiltelefon-Handapparat oder einer Mobiltelefon-Freisprecheinrichtung empfangen werden; Lesen (220, 230) von Bezugs-Merkmaldaten aus einem von zwei Speicherbereichen in dem Spracherkennungsspeicher in Reaktion auf die Bestimmung; Vergleichen (220, 230) der gelesenen Merkmaldaten mit den eingegebenen Merkmaldaten; Erzeugen (240) von Indexdaten in Reaktion auf den Vergleich; Lesen (250) von Sprach-Wiedergabedaten aus einem dritten Speicherbereich in dem Spracherkennungsspeicher in Reaktion auf die erzeugten Indexdaten und Ausgeben derselben an einen Lautsprecher; Lesen (260) von Telefonnummerinformationen aus dem dritten Speicherbereich in Reaktion auf die Indexdaten; und Wählen (270) der gelesenen Telefonnummer.
  6. Verfahren nach Anspruch 5, das zum Betreiben des Mobiltelefons nach einem der Ansprüche 1–4 eingerichtet ist.
DE69828611T 1997-07-21 1998-07-21 Zellulares telefongerät mit sprachgesteuerten wahlverfahren Expired - Fee Related DE69828611T2 (de)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
KR9733965 1997-07-21
KR1019970033965A KR100232873B1 (ko) 1997-07-21 1997-07-21 음성인식처리용 메모리를 가지는 휴대용 전화기
PCT/KR1998/000221 WO1999005839A1 (en) 1997-07-21 1998-07-21 Cellular telephone with voice dialing function

Publications (2)

Publication Number Publication Date
DE69828611D1 DE69828611D1 (de) 2005-02-17
DE69828611T2 true DE69828611T2 (de) 2005-06-16

Family

ID=19515123

Family Applications (1)

Application Number Title Priority Date Filing Date
DE69828611T Expired - Fee Related DE69828611T2 (de) 1997-07-21 1998-07-21 Zellulares telefongerät mit sprachgesteuerten wahlverfahren

Country Status (12)

Country Link
US (1) US6226532B1 (de)
EP (1) EP0993728B1 (de)
JP (1) JP2001511545A (de)
KR (1) KR100232873B1 (de)
CN (1) CN1122396C (de)
AU (1) AU725136B2 (de)
BR (1) BR9811286A (de)
CA (1) CA2296462C (de)
DE (1) DE69828611T2 (de)
IL (1) IL133926A (de)
RU (1) RU2200369C2 (de)
WO (1) WO1999005839A1 (de)

Families Citing this family (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10210139A (ja) * 1997-01-20 1998-08-07 Sony Corp 音声記録機能付き電話装置及び音声記録機能付き電話装置の音声記録方法
US6862463B1 (en) 1997-06-19 2005-03-01 Byard G. Nilsson Wireless telephone system with information service
US6751482B1 (en) 1997-06-19 2004-06-15 Byard G. Nilsson Wireless mobile telephone system with alternative power instruments and DTMF Capability
US6473610B1 (en) 1997-06-19 2002-10-29 Byard G. Nilsson Wireless prepaid telephone system with dispensable instruments
US6049710A (en) * 1997-06-19 2000-04-11 Kimberley Nanette Engen Wireless prepaid telephone system with dispensable instruments
US6993321B1 (en) 1997-06-19 2006-01-31 Nilsson Byard G Wireless telephone system with mobile instruments for outgoing calls
US6308053B1 (en) 1997-06-19 2001-10-23 Byard G. Nilsson Recyclable wireless telephone unit with a secured activation switch
US6298250B1 (en) 1997-06-19 2001-10-02 Kimberly Nanette Engen Wireless prepaid telephone system with extended capability
KR100241901B1 (ko) * 1997-08-28 2000-02-01 윤종용 핸드셋과 핸즈프리킷 공용 음성인식기의 등록 엔트리 관리방법
US6397079B1 (en) * 1998-09-16 2002-05-28 Intel Corporation Augmenting the capabilities of transceivers
JP2000196730A (ja) * 1998-12-25 2000-07-14 Nec Saitama Ltd 無線通信機
US20020034971A1 (en) * 1999-02-08 2002-03-21 Chienchung Chang Data allocation for multiple applications on a microprocessor or dsp
US7257426B1 (en) 1999-05-26 2007-08-14 Johnson Controls Technology Company Wireless communications systems and method
US7787907B2 (en) 1999-05-26 2010-08-31 Johnson Controls Technology Company System and method for using speech recognition with a vehicle control system
US7346374B2 (en) 1999-05-26 2008-03-18 Johnson Controls Technology Company Wireless communications system and method
KR100345537B1 (ko) * 1999-07-27 2002-07-26 삼성전자 주식회사 휴대폰의 송수화음 및 키톤 레벨조절방법
US6438524B1 (en) * 1999-11-23 2002-08-20 Qualcomm, Incorporated Method and apparatus for a voice controlled foreign language translation device
US8170538B2 (en) 1999-12-06 2012-05-01 Solocron Media, Llc Methods and apparatuses for programming user-defined information into electronic devices
US7149509B2 (en) * 1999-12-06 2006-12-12 Twenty Year Innovations, Inc. Methods and apparatuses for programming user-defined information into electronic devices
US6496692B1 (en) 1999-12-06 2002-12-17 Michael E. Shanahan Methods and apparatuses for programming user-defined information into electronic devices
KR100340045B1 (ko) * 1999-12-24 2002-06-12 오길록 저전력 음성 명령어 구동 휴대 정보단말 장치 및 그를 이용한 음성인식 방법
GB2358987B (en) * 2000-02-01 2003-10-29 Ericsson Telefon Ab L M Electronic devices
JP3485060B2 (ja) * 2000-03-08 2004-01-13 日本電気株式会社 情報処理端末装置及びそれに用いる携帯電話端末接続方法
US20030119566A1 (en) * 2001-12-26 2003-06-26 E-Lead Electronic Co., Ltd. Hand-free device equipped with expansion function modules
KR100433550B1 (ko) * 2002-05-25 2004-05-31 삼성전자주식회사 스피드 음성 다이얼 장치와 방법
US7072686B1 (en) 2002-08-09 2006-07-04 Avon Associates, Inc. Voice controlled multimedia and communications device
US8068881B2 (en) * 2002-08-09 2011-11-29 Avon Associates, Inc. Voice controlled multimedia and communications system
KR20040023345A (ko) * 2002-09-11 2004-03-18 현대모비스 주식회사 텔레매틱스의 음성인식 장치
US20050105699A1 (en) * 2002-10-23 2005-05-19 Fujitsu Limited Communications terminal, voice spectrum information search server, individual information display system, individual information display method in communications terminal and individual information display program
US20040137939A1 (en) * 2002-12-20 2004-07-15 Deubler Donald L. Method and system for wireless communication
US20040148226A1 (en) * 2003-01-28 2004-07-29 Shanahan Michael E. Method and apparatus for electronic product information and business transactions
JP4378996B2 (ja) * 2003-05-14 2009-12-09 日本電気株式会社 携帯電話機、データ操作処理プログラム及び制御方法
US7627095B2 (en) * 2003-11-05 2009-12-01 AT&T Intellecutal Property, I. L.P. Telephone and method for routing a telephone call in a telecommunications network
US7113981B2 (en) * 2003-12-29 2006-09-26 Mixxer, Inc. Cellular telephone download locker
US20060294565A1 (en) * 2005-06-24 2006-12-28 Sbc Knowledge Ventures, L.P. Television-based security monitoring system
JP5331710B2 (ja) 2006-10-11 2013-10-30 ジョンソン コントロールズ テクノロジー カンパニー 無線ネットワーク選択
US20080208594A1 (en) * 2007-02-27 2008-08-28 Cross Charles W Effecting Functions On A Multimodal Telephony Device
KR100883105B1 (ko) * 2007-03-30 2009-02-11 삼성전자주식회사 휴대단말기에서 음성인식을 이용한 다이얼링 방법 및 장치
US8077835B2 (en) * 2007-03-30 2011-12-13 Verizon Patent And Licensing Inc. Method and system of providing interactive speech recognition based on call routing
JP6922551B2 (ja) * 2017-08-24 2021-08-18 沖電気工業株式会社 音声処理装置、音声処理プログラム、及び音声処理方法

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2571191B1 (fr) 1984-10-02 1986-12-26 Renault Systeme de radiotelephone, notamment pour vehicule automobile
US5239586A (en) * 1987-05-29 1993-08-24 Kabushiki Kaisha Toshiba Voice recognition system used in telephone apparatus
EP0293259A3 (de) * 1987-05-29 1990-03-07 Kabushiki Kaisha Toshiba Spracherkennungssystem, angewendet in einem Fernsprechapparat
EP0307193B1 (de) * 1987-09-11 1993-11-18 Kabushiki Kaisha Toshiba Telefonapparat
US5301227A (en) * 1989-04-17 1994-04-05 Sanyo Electic Co., Ltd. Automatic dial telephone
JP2927891B2 (ja) * 1989-06-19 1999-07-28 日本電気株式会社 音声ダイヤル装置
US5371779A (en) 1992-03-13 1994-12-06 Nec Corporation Call initiating system for mobile telephone units
US5353376A (en) 1992-03-20 1994-10-04 Texas Instruments Incorporated System and method for improved speech acquisition for hands-free voice telecommunication in a noisy environment
IL108608A (en) * 1994-02-09 1998-01-04 Dsp Telecomm Ltd Accessory voice operated unit for a cellular telephone
US5481595A (en) * 1994-03-08 1996-01-02 Uniden America Corp. Voice tag in a telephone auto-dialer
US5509049A (en) * 1994-10-31 1996-04-16 Voicetech Communications, Inc. Automatic dialing of number received from directory assistance from within cellular system

Also Published As

Publication number Publication date
RU2200369C2 (ru) 2003-03-10
WO1999005839A1 (en) 1999-02-04
CA2296462A1 (en) 1999-02-04
KR19990011027A (ko) 1999-02-18
EP0993728A1 (de) 2000-04-19
JP2001511545A (ja) 2001-08-14
CA2296462C (en) 2003-01-28
KR100232873B1 (ko) 1999-12-01
AU8464598A (en) 1999-02-16
DE69828611D1 (de) 2005-02-17
US6226532B1 (en) 2001-05-01
IL133926A0 (en) 2001-04-30
AU725136B2 (en) 2000-10-05
BR9811286A (pt) 2000-08-29
CN1272996A (zh) 2000-11-08
CN1122396C (zh) 2003-09-24
IL133926A (en) 2004-09-27
EP0993728B1 (de) 2005-01-12

Similar Documents

Publication Publication Date Title
DE69828611T2 (de) Zellulares telefongerät mit sprachgesteuerten wahlverfahren
DE60037647T2 (de) Sprachgesteuerter beantworter für mobiltelefone
DE69629873T2 (de) Verfahren und Vorrichtung zum Steuern eines Telephons mittels Sprachbefehle
DE69731681T2 (de) Fernprogrammierbares Mobil-Endgerät
DE60036931T2 (de) Anwender-sprachschnittstelle für sprachgesteuerte systeme
DE69836882T2 (de) Funkgerät
DE60314486T2 (de) Zellsuchverfahren zum Einsatz in einem mobilen Funkendgerät, das an mindestens zwei Arten von Mobiltelefonsystemen anpassbar ist
DE3819538C2 (de)
DE602005001995T2 (de) Basisband-Modem und Verfahren zur Spracherkennung und verwendendes Mobilkommunikationsendgerät
DE102005038118B4 (de) Freisprecheinrichtung und Mobiltelefon-Handapparat
DE10047613A1 (de) Verfahren und System zum Betreiben eines tragbaren Telefons durch Spracherkennung
DE19935232A1 (de) Funkübertragungsterminal mit variabler Datensendegeschwindigkeit im Ansprechen auf die Energie einer eingebauten Batterie
DE69819744T2 (de) Verfahren und vorrichtung zur verwaltung von stimm-registrations-eingaben einer spracherkennungsvorrichtung zur verwendung in sowohl handapparaten als auch freisprechanlagen
DE3301516A1 (de) Sprachgesteuerter funksenderempfaenger und verfahren zu dessen sprachsteuerung
DE69534561T2 (de) Sender-empfänger
DE10314794A1 (de) Verfahren zum Einstellen von Sprachverarbeitungsparametern in einer Kommunikationsvorrichtung
DE69832003T2 (de) Verfahren zum Wählen einer Telefonnummer durch Sprachbefehle und ein durch Sprachbefehle gesteuertes Telekommunikationsendgerät
DE69735522T2 (de) Sprachgesteuerter Telekommunikationsterminal
DE60217740T2 (de) Verfahren zur Sprachauswahl und Mobilkommunikationssystem
DE69633154T2 (de) Schnurloses Telefongerät
DE19638114A1 (de) Verfahren zum Einstellen von endgerätespezifischen Parametern eines Kommunikationsendgerätes
DE69933000T2 (de) Verfahren und Telekommunikationsvorrichtung zur Anrufsignalerzeugung
DE19927843A1 (de) System zum Wählen aus einem elektronischen Telephonbuch in Kombination mit einer Mobiltelephon-Freisprechanlage für Fahrzeuge
DE60030702T2 (de) Steuerung der Kapazität eines verteilten Spracherkennungssystems
EP1232657B1 (de) Verfahren zum erzeugen eines wählverzeichnisses in einem netzwerkendgerät und kommunikationsnetzwerk für ein solches verfahren

Legal Events

Date Code Title Description
8364 No opposition during term of opposition
8339 Ceased/non-payment of the annual fee