DE602004001563T2 - Telefonnummerwiederfindungssystem und Verfahren - Google Patents

Telefonnummerwiederfindungssystem und Verfahren Download PDF

Info

Publication number
DE602004001563T2
DE602004001563T2 DE602004001563T DE602004001563T DE602004001563T2 DE 602004001563 T2 DE602004001563 T2 DE 602004001563T2 DE 602004001563 T DE602004001563 T DE 602004001563T DE 602004001563 T DE602004001563 T DE 602004001563T DE 602004001563 T2 DE602004001563 T2 DE 602004001563T2
Authority
DE
Germany
Prior art keywords
telephone number
voice
service
algorithm
telephone
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
DE602004001563T
Other languages
English (en)
Other versions
DE602004001563D1 (de
Inventor
Chan-Woo Ilsan-Gu Goyang Kim
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LG Electronics Inc
Original Assignee
LG Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by LG Electronics Inc filed Critical LG Electronics Inc
Publication of DE602004001563D1 publication Critical patent/DE602004001563D1/de
Application granted granted Critical
Publication of DE602004001563T2 publication Critical patent/DE602004001563T2/de
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/487Arrangements for providing information services, e.g. recorded voice services or time announcements
    • H04M3/493Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals
    • H04M3/4931Directory assistance systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/38Transceivers, i.e. devices in which transmitter and receiver form a structural unit and in which at least one part is used for functions of transmitting and receiving
    • H04B1/40Circuits
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/26Devices for calling a subscriber
    • H04M1/27Devices whereby a plurality of signals may be stored simultaneously
    • H04M1/271Devices whereby a plurality of signals may be stored simultaneously controlled by voice recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/26Devices for calling a subscriber
    • H04M1/27Devices whereby a plurality of signals may be stored simultaneously
    • H04M1/274Devices whereby a plurality of signals may be stored simultaneously with provision for storing more than one subscriber number at a time, e.g. using toothed disc
    • H04M1/2745Devices whereby a plurality of signals may be stored simultaneously with provision for storing more than one subscriber number at a time, e.g. using toothed disc using static electronic memories, e.g. chips
    • H04M1/2753Devices whereby a plurality of signals may be stored simultaneously with provision for storing more than one subscriber number at a time, e.g. using toothed disc using static electronic memories, e.g. chips providing data content
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L2015/088Word spotting
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2201/00Electronic components, circuits, software, systems or apparatus used in telephone systems
    • H04M2201/40Electronic components, circuits, software, systems or apparatus used in telephone systems using speech recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2201/00Electronic components, circuits, software, systems or apparatus used in telephone systems
    • H04M2201/60Medium conversion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2250/00Details of telephonic subscriber devices
    • H04M2250/68Details of telephonic subscriber devices with means for recording information, e.g. telephone number during a conversation

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Telephonic Communication Services (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Telephone Function (AREA)
  • Exchange Systems With Centralized Control (AREA)

Description

  • HINTERGRUND DER ERFINDUNG
  • 1. Gebiet der Erfindung
  • Die vorliegende Erfindung betrifft das Anzeigen und Speichern einer Telefonnummer. Insbesondere betrifft die Erfindung ein Telefonnummernabfragesystem zum Anzeigen und Speichern einer Telefonnummer von einem Telefonnummerndienst.
  • 2. Beschreibung der verwandten Technik
  • Wenn ein Benutzer eine Telefonnummer nicht weiß, ruft der Benutzer einen Telefonnummerndienst zwecks Unterstützung an. Ein Telefonist des Telefonnummerndienstes erhält eine Telefonnummeranforderung vom Benutzer, z. B. einem Geschäft oder Kaufhaus. Eine Suche nach der Telefonnummer wird durchgeführt. Der Telefonnummerndienst stellt dem Benutzer die Telefonnummer durch einen automatischen Antwortdienst (ARS; Automatic Response Service) bereit. Der Benutzer notiert oder speichert die z. B. durch eine mechanische Stimme des ARS bereitgestellte Telefonnummer. Der Benutzer ruft die Telefonnummer z. B. durch die automatische Verbindungsfunktion, die die Telefonnummer auf Basis von Anweisungen eines Benutzers wählt.
  • Wenn der Benutzer z. B. wegen eines Geräusches die mechanische Stimme des ARS nicht verstehen kann, muss der Benutzer den Telefonnummerndienst erneut kontaktieren. Diese Unannehmlichkeit resultiert in einem Zeitverlust und kann zur Zahlung einer oder mehrerer zusätzlichen Gebühren für den Zugriff auf den Telefonnummerndienst führen. Wenn der Benutzer den automatischen Verbindungsdienst nicht beanspruchen möchte, muss der Benutzer die Telefonnummer notieren. Ein Benutzer, der die Telefonnummer vergisst oder verliert, muss den Telefonnummerndienst erneut nutzen, was in Verlust von Zeit und Geld des Benutzers resultiert.
  • Die 1 und 2 zeigen Beispiele des Stands der Technik für Telefonnummerndienste, die eine von einem Benutzer angeforderte Telefonnummer automatisch wählen. Bei einem Beispiel des Stands der Technik erhält und lernt ein herkömmlicher neuronaler Netz-Algorithmus die mechanische Stimme des ARS. Herkömmlichen neuronalen Netz-Algorithmen bereitet es Schwierigkeiten, die Stimme eines Telefonisten von der mechanischen Stimme des ARS zu unterscheiden. Ein herkömmlicher Telefonnummerndienst verwendet Algorithmen zur Erkennung von mechanischer Sprache, wie z. B. das Hidden-Markov-Modell (HMM) oder eine neuronale Schaltung, die von der Stimme des Sprechers abhängen. Die voreingestellte mechanische Stimme eines ARS, der das Hidden-Markov-Modell (HMM) verwendet, oder ein neuronales Schaltungsnetzwerk bieten eine geringe Effizienz und schlechte Leistung beim genauen Bestimmen der Telefonnummer.
  • Algorithmen zur Erkennung von Einzelwörtern bereitet es Schwierigkeiten, vom ARS gesprochene Wörter von einer Zieltelefonnummer und/oder anderen Informationen zu unterscheiden. Wenn der Sprachtyp oder der Typ der automatischen Antwort geändert wird, können sich die herkömmlichen Spracherkennungsalgorithmen nicht effizient an diese Änderungen anpassen, um die gewünschte Telefonnummer genau zu erhalten.
  • Ein Verfahren zum Anzeigen einer Telefonnummer zur späteren Abfrage durch einen Benutzer, der auf einen Telefonnummerndienst zugreift, ist in der KR 2002 053 447 A offenbart.
  • Es besteht also ein Bedarf an einem Telefonnummernabfragesystem, das Verbesserungen gegenüber den Systemen des Stands der Technik bietet, wie z. B. eine verbesserte Erkennung der Telefonnummer selbst unter geräuschvollen Umgebungsbedingungen, und andere Vorteile bietet, wie z. B. eine Fähigkeit, die Telefonnummer zu speichern, falls ein Benutzer zu einer späteren Zeit anrufen will.
  • ZUSAMMENFASSUNG DER ERFINDUNG
  • Die vorliegende Erfindung ist ein Telefonnummernabfragesystem. Das hierin offenbarte Telefonnummernabfragesystem zeigt eine Telefonnummer von einem Telefonnummerndienst an und/oder speichert sie. Das System stellt eine Lösung von Problemen in Verbindung mit herkömmlichen Telefonnummernabfragesystemen wie Erkennen einer Telefonnummer unter geräuschvollen Bedingungen, Aktualisierungsfähigkeit, wenn sich ein Sprachtyp oder eine Antwort des Antwortsystems ändert, und Speichern der Telefonnummer, bis ein Benutzer anrufen will, bereit.
  • Gemäß einer Ausführungsform kontaktiert das Telefonnummernabfragesystem einen Telefonnummerndienst wie z. B. einen automatischen Antwortdienst (ARS). Der automatische Antwortdienst verwendet z. B. eine Referenz-Vektorfrequenz. Die Referenz-Vektorsequenz gibt ein Format vor, bei dem bestimmte Wörter oder Wortverbindungen vor oder nach Ziffern der Telefonnummer vom automatischen Antwortdienst hinzugefügt werden. Die bestimmten Wörter werden von einer Schlüsselwortauffindungsroutine erkannt. Die die bestimmten Wörter verbindenden Nummern werden extrahiert und verarbeitet, um eine erkannte Telefonnummer zu erzeugen.
  • Bei einer Ausführungsform wird das zwischen den bestimmten Wörtern verbundene Sprachsignal in einem Puffer gespeichert. Der Inhalt des Puffers treibt einen Nummernerkenner. Der Nummernerkenner verarbeitet den Inhalt und gibt eine erkannte Telefonnummer des Telefonnummerndienstes aus. Die erkannte Telefonnummer wird auf einem Endgerät angezeigt und/oder im Speicher wie z. B. einem Puffer gespeichert.
  • Bei einer anderen Ausführungsform wird die dynamische Zeitanpassung (Dynamic Time Warping, DTW) als der Nummernerkenner verwendet. Die DTW nutzt eine Ziffernsequenz (wie z. B. von 0 bis 9), um eine Merkmalsvektorsequenz zu erzeugen. Die Merkmalsvektorsequenz definiert ein Vektorreferenzmuster zur Bestimmung des Platzes der zum Erzeugen der Telefonnummer verwendeten Nummern. Gemäß einer alternativen Ausführungsform des Systems wird die Merkmalsvektorsequenz im Voraus definiert. Bei einer noch anderen Ausführungsform des Systems werden die Merkmalsvektorsequenzen unter Verwendung von Mel-Frequenz-Ceptrum-Koeffizienten (MFCC), linearen Prädiktions-Ceptrum-Koeffizienten (LPCC) oder perzeptorischer linearer Prädiktion (PLP) erzeugt. Bei einer noch anderen alternativen Ausführungsform des Systems werden die Merkmalsvektoren an das spezielle Format des Telefonnummerdienstes angepasst.
  • Bei einer anderen Ausführungsform kann das Hidden-Markov-Modell (HMM), eine Vektorquantisierung (VQ) oder ein neuronales Netz (NN) zusätzlich zur dynamischen Zeitanpassung (DTW) zur Erkennung der verbundenen Wörter verwendet werden, wenn der ARS eine Änderung des Sprachtyps oder Antworttyps aufweist, und ein entsprechendes Referenzmuster für die Merkmalsvektoren wird z. B. erneut heruntergeladen und gespeichert.
  • Weitere Merkmale und Vorteile der Erfindung werden in der folgenden Beschreibung dargelegt und sind teilweise anhand der Beschreibung ersichtlich oder erschließen sich durch die praktische Anwendung der Erfindung. Es versteht sich, dass die obige allgemeine Beschreibung und die folgende detaillierte Beschreibung der vorliegenden Erfindung beispiel haft und erläuternd sind und eine tiefer gehende Erklärung der beanspruchten Erfindung geben sollen.
  • Diese und andere Ausführungsformen werden dem Fachmann auch anhand der folgenden detaillierten Beschreibung der Ausführungsformen, die sich auf die beiliegenden Figuren bezieht, ohne weiteres offenbar, wobei die Erfindung auf keine speziellen offenbarten Ausführungsformen beschränkt ist.
  • KURZBESCHREIBUNG DER ZEICHNUNGEN
  • Die beiliegenden Zeichnungen, die beigefügt sind, um die Erfindung besser verständlich zu machen, und die in diese Patentbeschreibung aufgenommen sind und einen Teil von ihr bilden, veranschaulichen Ausführungsformen der Erfindung und dienen zusammen mit der Beschreibung zur Erklärung der Grundgedanken der Erfindung.
  • Merkmale, Elemente und Aspekte der Erfindung, die in verschiedenen Figuren mit den identischen Bezugszeichen gekennzeichnet sind, stellen die gleichen, entsprechenden oder ähnlichen Merkmale, Elemente oder Aspekte gemäß einer oder mehreren Ausführungsformen dar.
  • 1 ist eine Strukturansicht, die eine allgemeine Vorrichtung des Stands der Technik zum Suchen und automatischen Wählen einer Telefonnummer durch einen neuronalen Netz-Algorithmus darstellt.
  • 2 ist ein Flussdiagramm, das sequentielle Schritte des Stands der Technik eines allgemeinen Verfahrens zum Erkennen und automatischen Wählen einer Telefonnummer durch einen Algorithmus zur Erkennung sprecherabhängiger Einzelwörter darstellt.
  • 3 ist ein Flussdiagramm, das ein Verfahren zum Anzeigen und Speichern einer Telefonnummer einer automatischen Antwort gemäß einer Ausführungsform der Erfindung darstellt.
  • 4 ist ein Flussdiagramm, das sequentielle Schritte des Verfahrens zum Anzeigen und Speichern der Telefonnummer einer automatischen Antwort gemäß einer Ausführungsform der Erfindung darstellt.
  • 5 ist ein Blockdiagramm, das ein mobiles Kommunikationsgerät gemäß einer Ausführungsform der Erfindung darstellt.
  • 6 ist ein Blockdiagramm, das ein UTRAN gemäß einer Ausführungsform der Erfindung darstellt.
  • DETAILLIERTE BESCHREIBUNG DER BEVORZUGTEN AUSFÜHRUNGSFORMEN
  • Die vorliegende Erfindung betrifft das Anzeigen und Speichern einer Telefonnummer von einem Telefondienst. Insbesondere ist die vorliegende Erfindung ein Telefonnummernabfragesystem und Verfahren zum Anzeigen und Speichern einer Telefonnummer aus einer automatischen Antwort von einem Sprach- oder einem anderen Antwortsystem wie z. B. einem automatischen Antwortsystem (ARS, Automatic Response System) auf einem mobilen Endgerät. Die Telefonnummer aus der automatischen Antwort wird für im Wesentlichen augenblickliche Verwendung durch den Benutzer auf dem Endgerät angezeigt und/oder für eine spätere Verwendung in einem Telefonbuch des Endgeräts gespeichert. Dieses Speichermerkmal ermöglicht es dem Benutzer, einen Telefonanruf selektiv auszuführen.
  • Das Telefonnummernabfragesystem stellt eine Lösung für Probleme in Verbindung mit herkömmlichen Antwortsystemen wie z. B. Erkennen einer Telefonnummer unter geräuschvollen Bedingungen durch Bereitstellung einer vorgegebenen Sequenz bereit. Das Telefonnummernabfragesystem bietet Aktualisierungsfähigkeit und Vielseitigkeit, wenn sich ein Sprachtyp oder eine Antwort ändert, durch Herunterladen einer Vektorsequenz eines Telefonnummerndienstes. Das Telefonnummernabfragesystem besitzt Speicherkapazität zum Speichern der Telefonnummer, bis ein Benutzer anrufen möchte.
  • Obwohl das Telefonnummernabfragesystem mit Bezug auf ein Endgerät dargestellt ist, ist vorgesehen, dass die vorliegende Erfindung angewendet werden kann, um eine Telefonnummer von einem Antwortsystem in jeglichem Kommunikationsgerät anzuzeigen und zu speichern. In den folgenden detaillierten Beschreibungen sind hinreichend bekannte Funktionen oder Konstruktionen nicht detailliert beschrieben, weil sie die Erfindung mit unnötigen Einzelheiten unklar machen würden.
  • Ein Benutzer greift auf ein mobiles Endgerät zu und fordert eine Telefonnummer von einem Telefonnummerndienst an, der ein Antwortsystem wie z. B. ein automatisches Antwortsystem (ARS) hat. Das mobile Endgerät kann ein beliebiges mobiles Kommunikationsgerät wie z. B. ein Zellular-Mobiltelefon, Mobiltelefon, Persönlicher Datenassistent (Personal Data Assistant; PDA) oder dgl. sein. Bei einer alternativen Ausführungsform des Abfragesystems kann das Endgerät ein Basisstation-Endgerät sein.
  • Eine Referenzmerkmal-Vektorsequenz wird im Voraus erstellt und während der Herstellung des Endgeräts im Speicher gespeichert. Bestimmte Wörter, bei denen es sich um Wörter handelt, die Teil einer die Telefonnummer enthaltenden automatischen Antwort sind, werden im Voraus im Speicher des Endgeräts gespeichert. Der Referenzmerkmal-Vektor stellt das Format dar, in dem die Telefonnummer an einen Benutzer übertragen wird.
  • Ein Benutzer ruft vom Endgerät aus einen allgemeinen Telefondienst an, wobei er eine allgemeine informatorische Nummer verwendet, um eine Telefonnummer zu erhalten. Der Telefonnummerndienst stellt dem Benutzer eine Telefonnummer von einem ARS in einem formalisierten Format bereit. Das Format könnte z. B. lauten: "Die Nummer lautet xxx-xxxx. Die Nummer lautet xxx-xxxx. Wenn Ihre Verbindung direkt hergestellt werden soll, drücken Sie bitte die Ziffer Eins. Für Ihre Abfrage werden Ihnen 100 Won berechnet." X entspricht z. B. einer Zahl von 0 bis 9 dar.
  • In einem Beispiel lautet die vom Benutzer angeforderte Nummer 234-5678. Das ARS liefert dem Benutzer durch den Lautsprecher des mobilen Endgeräts eine mechanische Stimme wie z. B. "Die Nummer lautet 234-5678. Die Nummer lautet 234-5678. Wenn Ihre Verbindung direkt hergestellt werden soll, drücken Sie bitte die Ziffer Eins. Für Ihre Abfrage werden Ihnen 100 Won berechnet."
  • Das Nummernabfragesystem empfängt die Telefonnummer als eine empfangene Sprachantwort wie z. B. eine mechanische Stimme. Die empfangene Sprachantwort wird vom Nummernabfragesystem nach bestimmten Schlüsselwörtern durchsucht, die z. B. für den Telefonnummerndienst, auf den zugegriffen wird, einzigartig sind. Die Suche wird von einer Schlüsselwortauffindungsroutine für verbindende Wörter zwischen oder unter bestimmten Schlüsselwörtern ausgeführt. Die Schlüsselwortauffindungsroutine extrahiert bedeutungsvolle Schlüsselwörter aus aufeinander folgenden Schlüsselwörtern, wobei nahezu vollständige Genauigkeit bei derselben Stimme desselben Sprechers wie dem ARS des Telefonnummerndienstes erreicht wird. Deshalb können die den Nummern entspre chenden Stimmendaten von der Stimme des ARS mit nahezu vollständiger Genauigkeit getrennt werden.
  • Wie aus 3 ersichtlich ist, werden die verbindenden Wörter, die Nummern der Telefonnummer darstellen, in einem Puffer (S10) gespeichert. Ein Nummernerkenner verarbeitet den Inhalt im Puffer (S20), um die Telefonnummer zu erkennen. Die erkannte Telefonnummer wird auf einer Anzeige wie z. B. einer Flüssigkristallanzeige (LCD) angezeigt oder im Speicher (S30) gespeichert.
  • Wenn der Antworttyp des ARS geändert wird, ist eine Aktualisierung des Inhalts des Telefonabfragesystems erforderlich, um die Telefonnummer genau zu erkennen. Wenn z. B. ein Sprachtyp oder ein Antworttyp des Telefonnummerndienstes (wie z. B. ARS) geändert wird, bedarf die Software des Endgeräts einer Aufrüstung. Die Aktualisierung kann durch Herunterladen eines Referenzmusters, einer Merkmalsvektorsequenz oder einer Parameterdatei aus dem Internet durch einen verdrahteten und/oder drahtlosen Internetzugangsanschluss stattfinden. Bei einer Ausführungsform informiert der eine Formatänderung und einen Dienstanbieter aufweisende Telefonnummerndienst den Benutzer darüber, wie er den geänderten Inhalt herunterladen soll, und verlangt eine Gebühr in der Form eines Geschäftsmodells.
  • Andere Merkmale des Telefonabfragesystems beinhalten eine Sprach-Vorverarbeitung des empfangenen Signals. Eine Sprach-Vorverarbeitungstechnologie extrahiert die Kenndaten der empfangenen Sprachantwort. Zu einigen Beispielen für verwendete Sprach-Vorverarbeitungstechniken gehören: Mel-Frequenz-Ceptrum-Koeffizienten (MFCC), lineare Prädiktions-Ceptrum-Koeffizienten (LPCC) oder perzeptorische lineare Prädiktion (PLP).
  • Bei einem Beispiel ruft ein Benutzer einen Telefonnummerndienst an, eine Sprachantwort wird vom Endgerät eines Benutzers empfangen, die "Die Nummer lautet" als ein bestimmtes Schlüsselwort aufweist, nach dem in der Schlüsselwortauffindungsroutine gesucht wird. Eine Referenz-Vektorsequenz von Nummern erkennt die verbundenen Wörter, die die Telefonnummer enthalten, zwischen den bestimmten Schlüsselwörtern. Die den verbundenen Wörtern zugeordneten Nummern werden verarbeitet und zur Verwendung durch einen Benutzer auf dem Endgerät angezeigt oder zur späteren Verwendung im Speicher gespeichert.
  • Wie aus 4 ersichtlich ist, ruft ein Benutzer, der das Endgerät wie z. B. ein tragbares Endgerät oder einen allgemeinen Festnetzfernsprecher hat, den Telefonnummerndienst an, und die empfangene Stimme, nämlich die Stimme des Telefonisten und die mechanische Stimme des ARS werden gesucht (S100). Das Endgerät speichert in seinem Speicher die durch die Sprach-Vorverarbeitungstechnologie definierte Referenzmerkmal-Vektorsequenz von "Die Nummer lautet, 0, 1, 2, 3, 4, 5, 6, 7, 8, 9.".
  • "Die Nummer lautet" wird als ein Schlüsselwort aus der empfangenen Sprache durch den Schlüsselwortauffindungsalgorithmus gesucht (S110). Die Wortverbindung "Die Nummer lautet" wird durch den Schlüsselwortauffindungsalgorithmus nach dem gesuchten "Die Nummer lautet" noch einmal als ein Schlüsselwort aus der detektierten gesprochenen Sprache gesucht (S120). Sprachsignale zwischen "Die Nummer lautet" und "Die Nummer lautet", die vom Schlüsselwortauffindungsalgorithmus gesucht werden, werden im Puffer (S130) gespeichert. Die Sprachsignale enthalten die Telefonnummer angebende Nummerinformationen. Danach werden bei dieser Ausführungsform die Nummerinformationen durch einen Algorithmen zur Erkennung verbundener Wörter wie z. B. eine dynamische Zeitanpassung (DTW) erkannt. Die Merkmalsvektorsequenz 0, 1, 2, 3, 4, 5, 6, 7, 8, 9 wird als das Referenzmuster verwendet (S140).
  • Das hierin offenbarte Telefonnummernabfragesystem sieht im Gegensatz zu Systemen des Stands der Technik die Überwachung sich verändernder Kenndaten der empfangenen Sprache vor. Das hierin offenbarte Telefonnummernabfragesystem überwacht Variablen wie z. B. Zeitdauer der empfangenen Sprache, Länge bestimmter Wörter zwischen Nummern der Telefonnummer und Position von Nummern gemäß einer Zeitachse im Vergleich zu einem Vektorreferenzmuster.
  • Werden diese Variablen dagegen nicht überwacht und berücksichtigt, können diese Variablen Fehler oder Versagen bei der Nummererkennung verursachen. Software-Algorithmen wie z. B. DTW, die ein nichtlineares elastisches Zeitachsen-Matching-Verfahren verwenden, das auf dynamischer Programmierung (DP) von Vintsynk, Chiba und Sakoe beruht, können diese empfangenen Sprachzeitlängenschwankungen effizient verarbeiten.
  • Nachdem die Nummern erkannt worden sind, wird das Erkennungsergebnis auf der Anzeige des Endgeräts angezeigt oder im Telefonbuch des Endgeräts gespeichert (S150), so dass der Benutzer die Telefonnummer jederzeit anrufen kann.
  • Wie früher besprochen, wird durch das Verfahren zum Anzeigen und Speichern der Telefonnummer einer automatischen Antwort die Telefonnummer aus der Sprache des ARS mit kleinen Berechnungen unter Verwendung des Schlüsselwortauffindungsalgorithmus und des Algorithmus zur Erkennung verbundener Wörter genau erkannt und gesucht und die Telefonnummer auf der Anzeige des Endgeräts angezeigt oder die Telefonnummer im Telefonbuch des Endgeräts gespeichert, so dass der Benutzer die Telefonnummer bequem verwenden kann.
  • Wenn der Benutzer den Telefonnummerndienst einmal angerufen hat, muss er außerdem den Telefonnummerndienst nicht noch einmal anrufen oder eine Telefonnummernotiz suchen. Dass der Benutzer die im Endgerät gespeicherte Telefonnummer jederzeit anrufen kann, verschafft ihm einen hohen Bedienungskomfort. Dies ist auch wirtschaftlich vorteilhaft.
  • Obwohl die Erfindung bezüglich bestimmter bevorzugter Ausführungsformen dargestellt und beschrieben worden ist, versteht es sich für den Fachmann, dass verschiedene Änderungen bezüglich Form und Details daran vorgenommen werden können. Die vorliegende Erfindung kann z. B. angewendet werden, wenn die verbundenen Wörter durch das Hidden-Markov-Modell (HMM), Vektorquantisierung (VQ) oder ein neuronales Netz (NN) sowie dynamische Zeitanpassung (DTW) erkannt werden. Falls die mechanische Stimme oder der Antworttyp des ARS durch den Telefonnummerndienst geändert wird, kann sie bzw. er außerdem durch Herunterladen des geänderten Inhalts gehandhabt werden. Außerdem sind die obigen Verfahren wie unten beschrieben auf jedes mobile Kommunikationsgerät und/oder ein Basisstation-Endgerät anwendbar.
  • 5 zeigt ein Blockdiagramm eines mobilen Kommunikationsgeräts 500 der vorliegenden Erfindung wie z. B. einen mobilen Fernsprecher zum Ausführen der Verfahren der vorliegenden Erfindung. Das mobile Kommunikationsgerät 500 enthält eine Verarbeitungseinheit 510 wie z. B. einen Mikroprozessor oder digitalen Signalprozessor, ein HF-Modul 535, ein Leistungsmanagementmodul 505, eine Antenne 540, eine Batterie 555, eine Anzeige 515, eine Tastatur 520, eine Speichereinheit 530 wie z. B. einen Flash-Speicher, ROM oder SRAM, eine Lautsprecher 545 und ein Mikrofon 550.
  • Ein Benutzer gibt Anweisungsinformationen wie z. B. eine Telefonnummer beispielsweise durch Drücken der Tasten auf der Tastatur 520 oder durch sprachliche Aktivierung mittels eines Mikrofons 550 ein. Die Verarbeitungseinheit 510 empfängt und verarbeitet die Anweisungsinformationen, um die entsprechende Funktion, wie z. B. Wählen einer Telefonnummer, auszuführen. Betriebsdaten können aus der Speichereinheit 530 abgefragt werden, um die Funktion auszuführen. Außerdem kann die Verarbeitungseinheit 510 die Anweisungsinformationen und Betriebsinformationen zur Information und nach Belieben für den Benutzer auf der Anzeige 515 anzeigen.
  • Die Verarbeitungseinheit 510 gibt Anweisungsinformationen an das HF-Modul 535 aus, um die Kommunikation einzuleiten, z. B. Funksignale zu übertragen, die Sprachkommunikationsdaten aufweisen. Das HF-Modul 535 weist einen Empfänger und einen Sender auf, um Funksignale zu empfangen und zu senden. Die Antenne 540 erleichtert das Senden und Empfangen von Funksignalen. Beim Empfang von Funksignalen kann das HF-Modul 535 die Signale weiterleiten und in eine Basisbandfrequenz zur Verarbeitung durch die Verarbeitungseinheit 510 umwandeln. Die verarbeiteten Signale würden dann in über den Lautsprecher 545 ausgegebene hörbare oder lesbare Informationen gewandelt.
  • Die Verarbeitungseinheit 510 ist so ausgeführt, dass sie die oben in den 3 bis 4 veranschaulichten Verfahren ausführen kann. Beispielsweise kann die Verarbeitungseinheit 510 auf einen Telefonnummerndienst zugreifen und vom Telefonnummerndienst eine Sprachantwort empfangen, die einen Telefonnummerabschnitt enthält. Die Verarbeitungseinheit sucht nach mindestens einem bestimmten Wort des Telefonnummerndienstes innerhalb der Sprachantwort gemäß einer Schlüsselwortauffindungsroutine. Nummern zwischen den bestimmten Wörtern werden extrahiert und in einem Puffer gespeichert. Ein Nummernerkenner liest den Inhalt des Puffers und verarbeitet eine erkannte Telefonnummer aus dem Puffer. Die erkannte Telefonnummer wird an eine Anzeige wie z. B. ein mobiles Endgerät zur Betrachtung durch einen Benutzer und/oder an einen Speicherort wie z. B. ein Telefonbuch im mobilen Endgerät zur späteren Verwendung übertragen. Andere Merkmale, wie oben in den 3 und 4 beschrieben, können ebenfalls in die Verarbeitungseinheit 510 integriert werden.
  • Die Verarbeitungseinheit 510 speichert die von anderen Benutzern empfangenen Nachrichten und an andere Benutzer gesendete Nachrichten in der Speichereinheit 530, empfängt eine bedingte Aufforderung zur Nachrichteneingabe durch den Benutzer und verarbeitet die bedingte Aufforderung zum Lesen von Daten entsprechend der bedingten Aufforderung aus der Speichereinheit. Die Verarbeitungseinheit 510 gibt die Nachrichtendaten an die Anzeigeeinheit 515 aus. Die Speichereinheit 530 vermag empfangene und gesendete Nachrichtendaten der Nachrichten zu speichern.
  • 6 zeigt ein Blockdiagramm eines UTRAN 600 gemäß der bevorzugten Ausführungsform der vorliegenden Erfindung. Das UTRAN 600 enthält ein oder mehrere Funknetz-Subsysteme (radio network sub-systems, RNS) 625. Jedes RNS 625 enthält ein Funknetzsteuerung (radio network controller, RNC) 623 und eine Mehrzahl Knoten-Bs (Basisstationen) 621, die von der RNC verwaltet werden. Die RNC 623 handhabt die Zuordnung und Verwaltung der Funkressourcen und wirkt als ein Zugangspunkt bezüglich des Kernnetzes. Außerdem vermag die RNC 623 die Verfahren der vorliegenden Erfindung auszuführen.
  • Die Knoten-Bs 621 empfangen von der physikalischen Schicht des Endgeräts durch eine aufwärts gerichtete Verbindung gesendete Informationen und senden Daten durch eine abwärts gerichtete Verbindung an das Endgerät. Die Knoten-Bs 621 wirken als Zugangspunkte oder als ein Sender und Empfänger des UTRAN 600 für das Endgerät. Für den Fachmann ist es offensichtlich, dass das mobile Kommunikationsgerät 500 unter Verwendung z. B. der Verarbeitungseinheit 510 (von 5) oder eines anderen Daten- oder digitalen Verarbeitungsgeräts entweder allein oder zusammen mit externer Unterstützungslogik auf einfache Weise implementiert werden kann.
  • Durch Nutzung der vorliegenden Erfindung kann der Benutzer eines mobilen Kommunikationsgeräts Multimediadaten speichern, wie oben in den 3 bis 4 beschrieben. Beispielsweise vermag die Steuerung 610 auf einen Telefonnummerndienst zuzugreifen und vom Telefonnummerndienst eine Sprachantwort zu empfangen, die einen Telefonnummerabschnitt enthält. Die Steuereinheit sucht nach mindestens einem bestimmten Wort des Telefonnummerndienstes innerhalb der Sprachantwort gemäß einer Schlüsselwortauffindungsroutine. Nummern der Telefonnummer werden extrahiert und zwischen den bestimmten Wörtern in einem Puffer gespeichert. Ein Nummernerkenner liest und verarbeitet den Inhalt des Puffers, wobei er eine erkannte Telefonnummer erzeugt. Die erkannte Telefonnummer wird an eine Anzeige zur Betrachtung durch einen Benutzer und/oder an einen Speicherort zur späteren Verwendung übertragen.
  • Für den Fachmann ist es offensichtlich, dass die bevorzugten Ausführungsformen der vorliegenden Erfindung unter Verwendung z. B. der Verarbeitungseinheit 510 (von 5) oder eines anderen Daten- oder digitalen Verarbeitungsgeräts entweder allein oder zusammen mit externer Unterstützungslogik problemlos implementiert werden können.
  • Obwohl die vorliegende Erfindung im Kontext mobiler Kommunikation beschrieben ist, kann die vorliegende Erfindung auch in beliebigen drahtlosen Kommunikationssystemen verwendet werden, die mit drahtlosen Kommunikationsfähigkeiten ausgerüstete mobile Geräte wie z. B. PDAs und Laptop-Computer verwenden. Außerdem soll die Verwendung bestimmter Bezeichnungen zur Beschreibung der vorliegenden Erfindung den Gültigkeitsbereich der vorliegenden Erfindung nicht auf einen bestimmten Typ eines drahtlosen Kommunikationssystems wie z. B. UMTS beschränken. Die vorliegende Erfindung ist auch auf andere drahtlose Kommunikationssysteme anwendbar, die andere Luftschnittstellen und/oder physikalische Schichten verwenden, z. B. TDMA, CDMA, FDMA, WCDMA, etc.
  • Die bevorzugten Ausführungsformen können als ein Verfahren, eine Vorrichtung oder ein Herstellungsartikel unter Verwendung von Standard-Programmier- und/oder -Ingenieurstechniken zur Erzeugung von Software, Firmware, Hardware oder einer Kombination von ihnen implementiert werden. Die hierin verwendete Bezeichnung "Herstellungsartikel" bezieht sich auf Code oder Logik, implementiert in Hardware-Logik (z. B. ein integrierter Schaltungs-Chip, frei programmierbares Gatterfeld (FPGA), anwendungsspezifische integrierte Schaltung (ASIC) usw.) oder ein computerlesbares Medium (z. B. Magnetspeichermedium (z. B. Festplattenlaufwerke, Floppy-Disks, Band usw.), einen optischen Speicher (CD-ROMs, optische Scheiben usw.), flüchtige und nicht flüchtige Speichervorrichtungen (z. B. EEPROMs, ROMs, PROMs, RAMs, DRAMs, SRAMs, Firmware, programmierbare Logik usw.).
  • Ein Prozessor greift auf einen Code im computerlesbaren Medium zu und führt ihn aus. Ferner kann es möglich sein, durch ein Übertragungsmedium oder von einem Datei-Server aus über ein Netzwerk auf den Code, in dem bevorzugte Ausführungsformen implementiert sind, zuzugreifen. In solchen Fällen kann der Herstellungsartikel, in dem der Code implementiert ist, ein Übertragungsmedium wie z. B. eine Netzwerk-Übertragungsleitung, drahtloses Übertragungsmedium, sich durch Raum ausbreitende Signale, Funkwellen, Infrarotsignale usw. aufweisen. Der Fachmann erkennt natürlich, dass bei dieser Konfiguration viele Modifikationen vorgenommen werden können, ohne vom Gültigkeitsbereich der vorliegenden Erfindung abzuweichen, und dass der Herstellungsartikel jegliches im Fachgebiet bekannte Informationen tragende Medium aufweisen kann.
  • Die in den Figuren dargestellte Logik-Implementierung beschrieb spezielle Operationen als in einer bestimmten Reihenfolge auftretend. Bei alternativen Implementierungen können bestimmte der Logik-Operationen in einer anderen Reihenfolge, modifiziert oder verschoben, ausgeführt werden und dennoch bevorzugte Ausführungsformen der vorliegenden Erfindung implementieren. Außerdem können Schritte zur oben beschriebenen Logik hinzugefügt werden und dennoch Implementierungen der Erfindung entsprechen.
  • Die obigen Ausführungsformen und Vorteile sind nur beispielhaft und nicht als die vorliegende Erfindung einschränkend auszulegen. Die vorliegende Lehre kann ohne weiteres auf andere Vorrichtungstypen angewendet werden. Die Beschreibung der vorliegenden Erfindung soll der Veranschaulichung dienen und nicht den Umfang der Ansprüche einschränken. Zahlreiche Alternativen, Modifikationen und Variationen sind für den Fachmann offensichtlich. Folglich ist die Erfindung auf die vorstehend detailliert beschriebenen Ausführungsformen nicht präzise beschränkt.

Claims (38)

  1. Verfahren für ein mobiles Kommunikationsgerät zum Anzeigen und/oder Speichern einer erkannten Telefonnummer in einem Puffer zur späteren Abfrage durch einen Benutzer, wobei das Verfahren die Schritte aufweist: Zugreifen auf einen Telefonnummerndienst; Empfangen einer Sprachantwort vom Telefonnummerndienst, wobei die Sprachantwort einen Telefonnummernabschnitt aufweist; Suchen mindestens eines bestimmten Wortes des Telefonnummerndienstes innerhalb der Sprachantwort gemäß einer Schlüsselwortauffindungsroutine; Extrahieren und Speichern von Nummern zwischen bestimmten Wörtern in einem Puffer (S10); Auslesen einer erkannten Telefonnummer aus dem Inhalt des Puffers unter Verwendung eines Nummernerkenners (S20); und Übertragen der erkannten Telefonnummer zur Betrachtung durch einen Benutzer an mindestens entweder eine Anzeige oder einen Speicherplatz (S30).
  2. Verfahren nach Anspruch 1, bei dem der Telefonnummerndienst ein automatisches Antwortsystem ist.
  3. Verfahren nach Anspruch 1, bei dem der Telefonnummerndienst einen Sprachtyp oder einen Antworttyp hat, der geändert worden ist, und bei dem ein Endgerät eine Parameterdatei herunterlädt, um eine hohe Leistung des Telefondienstes aufrechtzuerhalten.
  4. Verfahren nach Anspruch 1, ferner die Schritte aufweisend: Bereitstellen von Informationen für den Benutzer durch einen Diensteanbieter, dass der Telefonnummerndienst eine Formatänderung hat und wie der geänderte Inhalt herunterzuladen ist, und Berechnen einer Gebühr in Form eines Geschäftsmodells.
  5. Verfahren nach Anspruch 1, ferner den Schritt aufweisend: Herunterladen des Referenzmusters oder der Parameterdatei durch das Endgerät über einen Personal Computer beim Empfangen von Informationen aus dem Internet.
  6. Verfahren nach Anspruch 2, ferner den Schritt des direkten Herunterladens des Referenzmusters auf einem drahtlosen Internet durch das Endgerät aufweisend.
  7. Verfahren nach Anspruch 1, ferner die Bereitstellung der Telefonnummer an den Benutzer durch mindestens entweder die Stimme eines Telefonisten oder einer sprecherabhängigen mechanischen Stimme eines automatischen Antwortsystems aufweisend.
  8. Verfahren nach Anspruch 1, bei dem die bestimmten Wörter mindestens ein spezifisches Wort vor und nach dem Nummernabschnitt der Telefonnummer enthalten.
  9. Verfahren nach Anspruch 1, bei dem die erkannte Telefonnummer von den Sprachsignalen durch einen Worterkennungsalgorithmus erkannt wird.
  10. Verfahren nach Anspruch 9, bei dem der Worterkennungsalgorithmus ein dynamischer Zeitanpassungsalgorithmus (Dynamic Time Warping Algorithm; DTW) ist.
  11. Verfahren nach Anspruch 9, bei dem der DTW-Algorithmus eine Merkmalsvektorsequenz von 0 bis 9 als Referenzmuster verwendet.
  12. Verfahren nach Anspruch 9, bei dem der Worterkennungsalgorithmus ein Hidden Markov Modell-Algorithmus ist.
  13. Verfahren nach Anspruch 9, bei dem der Worterkennungsalgorithmus ein Vektorquantisierungs-Algorithmus ist.
  14. Verfahren nach Anspruch 9, bei dem der Worterkennungsalgorithmus ein neuronaler Netz-Algorithmus ist.
  15. Verfahren nach Anspruch 1, ferner den Schritt der Definition von Merkmalsvektoren als eine Sequenz aufweisend, die durch eine Sprach-Vorverarbeitungstechnologie bei Abschluss der Schlüsselwortauffindungsroutine erzeugt werden.
  16. Verfahren nach Anspruch 15, ferner das Speichern der definierten Merkmalsvektoren im Speicher des Endgeräts aufweisend.
  17. Verfahren nach Anspruch 1, bei dem die Sprachantwort eine Sprach-Vorverarbeitungstechnologie einschließlich Mel-Frequenz-Ceptrum-Koeffizienten zum Extrahieren der Kenndaten der Sprachantwort nutzt.
  18. Verfahren nach Anspruch 15, bei dem die Sprach-Vorverarbeitungstechnologie lineare Prädiktions-Ceptrum-Koeffizienten zum Extrahieren der Kenndaten der Sprachantwort nutzt.
  19. Verfahren nach Anspruch 15, bei dem die Sprach-Vorverarbeitungstechnologie die perzeptorische lineare Prädiktion zum Extrahieren der Kenndaten der Sprachantwort nutzt.
  20. Verfahren für ein mobiles Kommunikationsendgerät zum Speichern einer spezifischen Referenzmerkmal-Vektorsequenz in einem Speicher, die zu einer Telefonnummer gehört, aufweisend: Suchen in einem Endgerät, das auf einen Telefonnummerndienst zugreift, nach mindestens entweder der Stimme eines Telefonisten oder der mechanischen Stimme eines automatischen Antwortsystems (S100); Suchen nach einem ersten vorgegebenen Wort (S110) und einem zweiten vorgegebenen Wort (S120) in mindestens entweder der Stimme des Telefonisten oder der mechanischen Stimme des automatischen Antwortsystems unter Verwendung einer Schlüsselwortauffindungsroutine (S130); Speichern einer Sprachantwort zwischen dem ersten vorgegebenen Wort und dem zweiten vorgegebenen Wort, nach denen ein Puffer durchsucht worden ist (S130); Anwenden eines Worterkennungsalgorithmus auf die im Puffer gespeicherte Sprachantwort; Erkennen einer Telefonnummer aus dem Inhalt des Puffers (S140); und Anzeigen der erkannten Telefonnummer auf der Anzeige und Speichern der Telefonnummer in einem Telefonbuch des Endgeräts (S150).
  21. Verfahren nach Anspruch 1, ferner die Schritte aufweisend: Definieren von Merkmalsvektoren als eine Sequenz gemäß einer Sprach-Vorverarbeitungstechnologie; und Anwenden der Schlüsselwortauffindungsroutine unter Verwendung eines aus den definierten Merkmalsvektoren erhaltenen spezifischen Referenzvektors.
  22. Verfahren nach Anspruch 21, bei dem die Sprach-Vorverarbeitungstechnologie Mel-Frequenz-Ceptrum-Koeffizienten zum Extrahieren der Kenndaten von Sprache nutzt.
  23. Verfahren nach Anspruch 21, bei dem die Sprach-Vorverarbeitungstechnologie lineare Prädiktions-Ceptrum-Koeffizienten zum Extrahieren der Kenndaten von Sprache nutzt.
  24. Verfahren nach Anspruch 21, bei dem die Sprach-Vorverarbeitungstechnologie die perzeptorische lineare Prädiktion zum Extrahieren der Kenndaten von Sprache nutzt.
  25. Verfahren nach Anspruch 21, bei dem die Schlüsselwortauffindungsroutine eine Merkmalsvektorsequenz The number is' (Die Nummer lautet) als ein Referenzmuster verwendet.
  26. Verfahren nach Anspruch 21, bei dem der Worterkennungsalgorithmus ein dynamischer Zeitanpassungsalgorithmus ist.
  27. Verfahren nach Anspruch 26, bei dem der dynamische Zeitanpassungsalgorithmus eine Merkmalsvektorsequenz '0, 1, 2, 3, 4, 5, 6, 7, 8, 9' als ein Referenzmuster verwendet.
  28. Verfahren nach Anspruch 20, bei dem der Worterkennungsalgorithmus ein Hidden Markov Modell-Algorithmus ist.
  29. Verfahren nach Anspruch 20, bei dem der Worterkennungsalgorithmus ein Vektorquantisierungs-Algorithmus ist.
  30. Verfahren nach Anspruch 20, bei dem der Worterkennungsalgorithmus ein neuronaler Netz-Algorithmus ist.
  31. Mobiles Kommunikationsgerät zur Verwaltung von Nachrichten, die in einem mobilen Kommunikationssystem übertragen werden, wobei das mobile Kommunikationsgerät aufweist: ein HF-Modul (535), das einen Sender und einen Empfänger aufweist, die Nachrichten in einem mobilen Kommunikationssystem austauschen; und Mittel zum Zugreifen auf einen Telefonnummerndienst; Mittel zum Empfangen einer Sprachantwort vom Telefonnummerndienst, die einen Telefonnummernabschnitt enthält; Mittel zum Suchen nach mindestens einem bestimmten Wort des Telefonnummerndienstes innerhalb der Sprachantwort gemäß einer Schlüsselwortauffindungsroutine; Mittel zum Extrahieren und Speichern von Nummern zwischen den bestimmten Wörtern in einen Puffer; Mittel zum Auslesen einer erkannten Telefonnummer aus dem Inhalt des Puffers unter Verwendung eines Nummernerkenners; und Mittel zum Übertragen der erkannten Telefonnummer an eine Anzeige zur Betrachtung durch einen Benutzer und/oder an einen Speicherplatz zur späteren Verwendung.
  32. Gerät nach Anspruch 31, bei dem der Telefonnummerndienst ein automatisches Antwortsystem ist.
  33. Gerät nach Anspruch 31, bei dem der Telefonnummerndienst einen Sprachtyp oder einen Antworttyp hat, der geändert worden ist, und bei dem ein Endgerät eine Parameterdatei herunterlädt, um eine hohe Leistung des Telefondienstes aufrechtzuerhalten.
  34. Gerät nach Anspruch 31, bei dem der Telefonnummerndienst eine Formatänderung und einen Diensteanbieter hat, um den Benutzer zu informieren, wie der geänderte Inhalt herunterzuladen ist und eine Gebühr in Form eines Geschäftsmodells zu berechnen.
  35. Netzwerk zur Funkkommunikation mit einem Endgerät in einem mobilen Kommunikationssystem, wobei das Netzwerk aufweist: mindestens einen Sender und mindestens einen Empfänger zur Kommunikation in einem mobilen Kommunikationsnetzwerk; wobei der Sender und der Empfänger aufweisen: Mittel zum Zugreifen auf einen Telefonnummerndienst; Mittel zum Empfangen einer Sprachantwort vom Telefonnummerndienst, die einen Telefonnummernabschnitt enthält; Mittel zum Suchen nach mindestens einem bestimmten Wort des Telefonnummerndienstes innerhalb der Sprachantwort gemäß einer Schlüsselwortauffindungsroutine; Mittel zum Extrahieren und Speichern von Nummern zwischen den bestimmten Wörtern in einen Puffer; Mittel zum Auslesen einer erkannten Telefonnummer aus dem Inhalt des Puffers unter Verwendung eines Nummernerkenners; und Mittel zum Übertragen der erkannten Telefonnummer an eine Anzeige zur Betrachtung durch einen Benutzer und an einen Speicherplatz zur späteren Verwendung.
  36. Netzwerk nach Anspruch 34, bei dem der Telefonnummerndienst ein automatisches Antwortsystem ist.
  37. Netzwerk nach Anspruch 35, bei dem der Telefonnummerndienst einen Sprachtyp oder einen Antworttyp hat, der geändert worden ist, und ein Endgerät zum Herunterladen eines Vektorreferenzmusters zum Ändern der Variablen des Telefondienstes.
  38. Netzwerk nach Anspruch 35, bei dem der Telefonnummerndienst eine Formatänderung und einen Diensteanbieter hat, um den Benutzer zu informieren, wie der geänderte Inhalt herunterzuladen ist und eine Gebühr in Form eines Geschäftsmodells zu berechnen.
DE602004001563T 2003-10-29 2004-10-28 Telefonnummerwiederfindungssystem und Verfahren Active DE602004001563T2 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR2003076089 2003-10-29
KR1020030076089A KR100595610B1 (ko) 2003-10-29 2003-10-29 전화번호 안내 방법 및 장치

Publications (2)

Publication Number Publication Date
DE602004001563D1 DE602004001563D1 (de) 2006-08-31
DE602004001563T2 true DE602004001563T2 (de) 2006-11-16

Family

ID=36782389

Family Applications (1)

Application Number Title Priority Date Filing Date
DE602004001563T Active DE602004001563T2 (de) 2003-10-29 2004-10-28 Telefonnummerwiederfindungssystem und Verfahren

Country Status (8)

Country Link
US (1) US7356356B2 (de)
EP (1) EP1528773B1 (de)
KR (1) KR100595610B1 (de)
CN (1) CN100514985C (de)
AT (1) ATE333750T1 (de)
DE (1) DE602004001563T2 (de)
ES (1) ES2268564T3 (de)
PT (1) PT1528773E (de)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2513022A1 (en) * 2005-07-22 2007-01-22 Research In Motion Limited System and method for communicating state management between a browser user-agent and a mobile data server
CA2513014A1 (en) * 2005-07-22 2007-01-22 Research In Motion Limited A method of controlling delivery of multi-part content from an origin server to a mobile device browser via a proxy server
CA2513018A1 (en) * 2005-07-22 2007-01-22 Research In Motion Limited Method for training a proxy server for content delivery based on communication of state information from a mobile device browser
CA2513016A1 (en) * 2005-07-22 2007-01-22 Research In Motion Limited A secure method of synchronizing cache contents of a mobile browser with a proxy server
CA2513019A1 (en) * 2005-07-22 2007-01-22 Research In Motion Limited A method for communicating state information between a server and a mobile device browser with version handling
CA2513010A1 (en) * 2005-07-22 2007-01-22 Research In Motion Limited A method for detecting state changes between data stored in a first computing device and data retrieved from a second computing device
KR100705580B1 (ko) * 2005-08-04 2007-04-10 삼성전자주식회사 브이오아이피 단말 및 그 단말의 정보관리방법
US20080208594A1 (en) * 2007-02-27 2008-08-28 Cross Charles W Effecting Functions On A Multimodal Telephony Device
US8761815B2 (en) 2007-03-21 2014-06-24 Motorola Mobility Llc Method, device and system for accessing mobile device user information
US8130275B2 (en) * 2008-06-13 2012-03-06 Nintendo Co., Ltd. Information-processing apparatus, and storage medium storing a photographing application launch program executed by information-processing apparatus
CN101651730B (zh) * 2009-06-30 2012-02-29 重庆重邮信科通信技术有限公司 一种电话簿条目快速读取方法
US20110014952A1 (en) * 2009-07-15 2011-01-20 Sony Ericsson Mobile Communications Ab Audio recognition during voice sessions to provide enhanced user interface functionality
US9137342B2 (en) 2012-08-22 2015-09-15 Mitel Networks Corporation Automatic contact population
KR101380430B1 (ko) * 2012-12-20 2014-04-01 주식회사 팬택 통화 중 편의정보를 제공하는 휴대 단말 및 휴대 단말 상에서 통화 중 편의정보를 제공하는 방법
KR20160003504A (ko) 2014-07-01 2016-01-11 김윤희 사용자의 음성 분석을 이용하는 전화 번호 안내 시스템 및 전화 번호 안내 방법
US10223066B2 (en) * 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
KR20190138915A (ko) * 2018-06-07 2019-12-17 현대자동차주식회사 음성 인식 장치, 이를 포함하는 차량 및 그 제어방법

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5297183A (en) 1992-04-13 1994-03-22 Vcs Industries, Inc. Speech recognition system for electronic switches in a cellular telephone or personal communication network
JPH1084419A (ja) * 1996-09-06 1998-03-31 Brother Ind Ltd 電話番号検索システム
JP3055514B2 (ja) * 1997-12-05 2000-06-26 日本電気株式会社 電話回線用音声認識装置
JPH11252283A (ja) 1998-03-06 1999-09-17 Canon Inc 携帯情報端末、携帯情報端末の制御方法および記憶媒体
KR100273642B1 (ko) 1998-06-22 2000-12-15 윤종용 안내 음성 디스플레이 기능을 갖는 전화 단말 장치 및 그 제어방법
KR20000003371A (ko) 1998-06-27 2000-01-15 윤종용 휴대통신단말기에서 전화번호 안내 서비스 시 전화번호 표시장치 및 방법
US6570964B1 (en) * 1999-04-16 2003-05-27 Nuance Communications Technique for recognizing telephone numbers and other spoken information embedded in voice messages stored in a voice messaging system
JP3847624B2 (ja) 1999-07-28 2006-11-22 三菱電機株式会社 携帯電話機
US9076448B2 (en) * 1999-11-12 2015-07-07 Nuance Communications, Inc. Distributed real time speech recognition system
KR20010008179A (ko) 2000-11-14 2001-02-05 이근철 음성 인식을 이용한 전화 안내 서비스 표시 방법 및시스템
US6868267B1 (en) * 2000-11-17 2005-03-15 Qualcomm Inc. Apparatus, method, and article of manufacture used to invoice for services consumed in a communications network
US6915262B2 (en) * 2000-11-30 2005-07-05 Telesector Resources Group, Inc. Methods and apparatus for performing speech recognition and using speech recognition results
US6731724B2 (en) * 2001-01-22 2004-05-04 Pumatech, Inc. Voice-enabled user interface for voicemail systems
KR20020065229A (ko) 2001-02-06 2002-08-13 (주)유니와이드 테크놀러지 지능형 전화서비스 시스템
JP2002300306A (ja) * 2001-03-30 2002-10-11 Tsubasa System Co Ltd 電話番号情報配信方法、電話番号情報配信プログラム、電話番号情報配信システム
JP2003152856A (ja) * 2001-11-15 2003-05-23 Nec Corp 通信端末装置、通信方法、およびそのプログラム
US7174191B2 (en) * 2002-09-10 2007-02-06 Motorola, Inc. Processing of telephone numbers in audio streams

Also Published As

Publication number Publication date
KR100595610B1 (ko) 2006-06-30
US20050094782A1 (en) 2005-05-05
DE602004001563D1 (de) 2006-08-31
EP1528773A1 (de) 2005-05-04
ES2268564T3 (es) 2007-03-16
ATE333750T1 (de) 2006-08-15
CN1620083A (zh) 2005-05-25
KR20050040628A (ko) 2005-05-03
US7356356B2 (en) 2008-04-08
PT1528773E (pt) 2006-09-29
EP1528773B1 (de) 2006-07-19
CN100514985C (zh) 2009-07-15

Similar Documents

Publication Publication Date Title
DE602004001563T2 (de) Telefonnummerwiederfindungssystem und Verfahren
DE60036931T2 (de) Anwender-sprachschnittstelle für sprachgesteuerte systeme
US20180166070A1 (en) System and Method for Mobile Automatic Speech Recognition
DE69433593T2 (de) Aufgeteiltes spracherkennungssystem
DE69839068T2 (de) System und Verfahren zur automatischen Verarbeitung von Anruf und Datenübertragung
FI125330B (fi) Menetelmä ja laitteisto monitasoiseksi hajautetuksi puheentunnistukseksi
DE10054583C2 (de) Verfahren und Vorrichtung zum Aufzeichnen, Suchen und Wiedergeben von Notizen
DE102019105269A1 (de) Spracherkennungs-arbitrierungslogik
DE60201939T2 (de) Vorrichtung zur sprecherunabhängigen Spracherkennung , basierend auf einem Client-Server-System
DE102005060072A1 (de) Verwaltung von mehrsprachigen Nametags für eingebettete Spracherkennung
DE10314794A1 (de) Verfahren zum Einstellen von Sprachverarbeitungsparametern in einer Kommunikationsvorrichtung
DE102006029251B4 (de) Verfahren und System für einen Telefonbuchtransfer
DE102018103188A1 (de) Verbesserte Aufgabenerledigung bei der Spracherkennung
CA2419526A1 (en) Voice recognition system
EP3095114B1 (de) Verfahren und system zur erzeugung eines steuerungsbefehls
DE102018128003A1 (de) Neuronales netzwerk zum anwenden bei der spracherkennungsarbitrierung
DE60214850T2 (de) Für eine benutzergruppe spezifisches musterverarbeitungssystem
DE60008893T2 (de) Sprachgesteuertes tragbares Endgerät
CN106603792B (zh) 一种号码查找设备
EP1009137B1 (de) Verfahren, Rechner und Rechnerprogrammprodukt zum Zugriff auf Ortsangaben enthaltende Daten
EP1220200B1 (de) Verfahren und Anordnung zur sprecherunabhängigen Spracherkennung für ein Telekommunikations- bzw. Datenendgerät
DE112004002337T5 (de) Verfahren und Vorrichtung zum Eingeben alphabetischer Zeichen
EP0951162A2 (de) Verfahren zum Steuern einer elektronischen Einrichtung, insbesondere einer Mobilstation eines Mobilfunknetzes
CN112820316A (zh) 一种智能客服的对话方法和系统
WO2002049325A1 (de) Verfahren zur konfigurierung einer benutzeroberfläche

Legal Events

Date Code Title Description
8364 No opposition during term of opposition