DE69531525T2 - Tonerkennung mit Minimierung falscher Identifikation - Google Patents

Tonerkennung mit Minimierung falscher Identifikation Download PDF

Info

Publication number
DE69531525T2
DE69531525T2 DE69531525T DE69531525T DE69531525T2 DE 69531525 T2 DE69531525 T2 DE 69531525T2 DE 69531525 T DE69531525 T DE 69531525T DE 69531525 T DE69531525 T DE 69531525T DE 69531525 T2 DE69531525 T2 DE 69531525T2
Authority
DE
Germany
Prior art keywords
frequency
energy
function
tone
circuit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE69531525T
Other languages
English (en)
Other versions
DE69531525D1 (de
Inventor
Jeffrey Wayne Lisle Daugherty
Richard Harry Wheaton Ketchum
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
AT&T Corp
Original Assignee
AT&T Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by AT&T Corp filed Critical AT&T Corp
Application granted granted Critical
Publication of DE69531525D1 publication Critical patent/DE69531525D1/de
Publication of DE69531525T2 publication Critical patent/DE69531525T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04QSELECTING
    • H04Q1/00Details of selecting apparatus or arrangements
    • H04Q1/18Electrical details
    • H04Q1/30Signalling arrangements; Manipulation of signalling currents
    • H04Q1/44Signalling arrangements; Manipulation of signalling currents using alternate current
    • H04Q1/444Signalling arrangements; Manipulation of signalling currents using alternate current with voice-band signalling frequencies
    • H04Q1/45Signalling arrangements; Manipulation of signalling currents using alternate current with voice-band signalling frequencies using multi-frequency signalling
    • H04Q1/457Signalling arrangements; Manipulation of signalling currents using alternate current with voice-band signalling frequencies using multi-frequency signalling with conversion of multifrequency signals into digital signals
    • H04Q1/4575Signalling arrangements; Manipulation of signalling currents using alternate current with voice-band signalling frequencies using multi-frequency signalling with conversion of multifrequency signals into digital signals which are transmitted in digital form
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04QSELECTING
    • H04Q1/00Details of selecting apparatus or arrangements
    • H04Q1/18Electrical details
    • H04Q1/30Signalling arrangements; Manipulation of signalling currents
    • H04Q1/44Signalling arrangements; Manipulation of signalling currents using alternate current
    • H04Q1/444Signalling arrangements; Manipulation of signalling currents using alternate current with voice-band signalling frequencies
    • H04Q1/46Signalling arrangements; Manipulation of signalling currents using alternate current with voice-band signalling frequencies comprising means for distinguishing between a signalling current of predetermined frequency and a complex current containing that frequency, e.g. speech current

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Selective Calling Equipment (AREA)
  • Digital Transmission Methods That Use Modulated Carrier Waves (AREA)

Description

  • Allgemeiner Stand der Technik
  • Die vorliegende Erfindung betrifft Tondetektoren.
  • Töne dienen vielfältigen Zwecken in Telekommunikationssystemen. Mehrfrequenztöne oder -signale (DTMF) werden von Fernsprechteilnehmern zur Eingabe der Rufnummer eines anzurufenden Teilnehmers verwendet. Außerdem dienen DTMF-Töne zum Identifizieren bestimmter Parameter oder Merkmale, deren Verwendung entweder vor, während oder nach der Herstellung einer Fernsprechverbindung mit dem anzurufenden Teilnehmer erwünscht ist. Eine Nebenstellenanlage (PBX) oder die Vermittlungsstelle, die einen Teilnehmer versorgt, erkennt von Teilnehmern sowohl für Anruf- als auch Steuerzwecke eingegebene DTMF-Töne.
  • Sprache, Musik, Daten oder andere Klänge, die von einem Tondetektor empfangen werden, können bewirken, daß der Detektor falsch meldet, daß ein Ton empfangen wurde. Die falsche Erkennung eines Tons aufgrund anderer Klangeingaben wird als ein „talk-off"-Zustand bezeichnet. Ausfälle, wie zum Beispiel falsche Steuerung oder Wählsequenzen ergeben sich aus solchen Falschdetektionen. Es wurden vielfältige vorbekannte Tondetektoren mit unterschiedlichem Erfolg eingesetzt, abhängig von der Anwendung und der Art von zu erkennenden Tönen. Ein Tondetektor mit verbesserter Fähigkeit zur Zurückweisung von talk-off-Zuständen wird zum Beispiel in dem US-Patent 5,325,427 beschrieben. Obwohl bei der Behandlung des talk-off-Problems Fortschritte erreicht wurden, werden immer noch ein Verfahren und eine Vorrichtung zur Tondetektion benötigt, bei denen das Problem weiter minimiert wird. Da immer mehr Fähigkeiten verfügbar werden, die auf Tonzeichengabe reagieren, wird noch mehr Wert darauf gelegt, das Vorhandensein eines Tons oder DTMF-Signals für Steuer- und Zeichengabezwecke korrekt erkennen zu können. Da solche Zeichengabetechniken mehr verwendet werden, sind Falscherkennungen ein immer wichtiger werdendes Problem. Es werden somit eine verbesserte Vorrichtung und ein verbessertes Verfahren zum Erkennen von Tönen benötigt, die im wesentlichen gegenüber talk-off- und Falschdetektionen immun sind.
  • Kurzdarstellung der Erfindung
  • Eine Aufgabe der vorliegenden Erfindung ist die Bereitstellung einer Vorrichtung und eines Verfahrens, die bzw. das die oben beschriebenen talk-off- und Falscherkennungsprobleme weiter minimiert.
  • Diese Aufgabe wird durch die in den unabhängigen Ansprüchen 1 und 5 definierten Merkmale gelöst.
  • Gemäß einer Ausführungsform der vorliegenden Erfindung werden Koeffizienten der linear-prädiktiven Codierung (LPC) für Informationen in einem Rahmen von Abtastwerten eines Eingangssignals, das einen zu erkennenden Ton tragen kann, berechnet. Die LPC-Koeffizienten werden für eine Reihe von Modellen bis herauf zu einer vorbestimmten Anzahl vorheriger Abtastwerte berechnet, wie zum Beispiel für ein Modell, das zwölf vorherige Abtastwerte verwendet. Wenn die Restenergie, d. h. von dem Modell unberücksichtigte Energie, kleiner als ein vorbestimmter Betrag von zum Beispiel 1 Prozent ist und die Ordnung des Modells kleiner als ein vorbestimmter Wert ist, wie zum Beispiel kleiner als die neunte Ordnung, wird bestimmt, daß der Rahmen einen gültigen Ton enthält. Bei der Ausführungsform der vorliegenden Erfindung wird vorzugsweise vor der LPC-Koeffizientenberechnung eine anfängliche Bestimmung durchgeführt, ob ein Ton mit einer bestimmten Frequenz vorhanden ist. Diese ist erwünscht, um die zur Implementierung der Technik notwendige Berechnungskomplexität und Rechenleistung möglichst gering zu halten; es ist jedoch ersichtlich, daß diese Technik zu Lasten einer rechnerischen Komplexität oder Leistung ohne die zuvor durchgeführte Tonbestimmung verwendet werden könnte.
  • Ein andere Aspekt gemäß einer Ausführungsform der vorliegenden Erfindung betrifft eine weitere Tonbestimmungstechnik, bei der an einem vorbestimmten Modell höchster Ordnung, für das LPC-Koeffizienten berechnet werden, eine diskrete Fouriertransformation durchgeführt wird. Gemäß der bevorzugten Ausführungsform ist eine Analyse durch diskrete Fouriertransformation (DFT) möglich, da zuvor eine vorbestimmte Identifikation des Tons und seiner Frequenz erfolgte. Vorzugsweise werden drei DFT-Berechnungen durchgeführt: eine bei der Energiespitze des Tons und zwei weitere DFTs an beabstandeten Frequenzen in gleichem Abstand von der Spitzenfrequenz, wie zum Beispiel um 2,5 Prozent. Die beiden Tal- oder Seiten-DFT-Antworten werden zusammen addiert und mit dem Spitzen-DFT-Wert verglichen. Wenn dieser Vergleich ein vorbestimmtes Minimum übersteigt, wird bestimmt, daß ein Ton existiert und es wird bestimmt, daß ein gültiger Ton empfangen worden ist.
  • Im Fall von Mehrfrequenztönen (DTMF-Tönen) werden entsprechende Spitze und Täler für jeden der beiden Töne, die gleichzeitig vorhanden sind, wenn ein DTMF-Ton vorhanden ist, berechnet. In diesem Fall müssen Vergleiche der Spitzen mit den Tälern für den hohen und den niedrigen Ton eines DTMF-Signals beide ein vorbestimmtes Minimum übersteigen, damit es zu einer Gültigkeitsbestimmung kommt.
  • Kurze Beschreibung der Zeichnungen
  • 1 ist ein Blockschaltbild einer Ausführungsform eines Tondetektors gemäß der vorliegenden Erfindung.
  • 2 ist ein Blockschaltbild einer Computerarchitektur, die zur Implementierung einer Ausführungsform des Tondetektors gemäß der vorliegenden Erfindung verwendet werden kann.
  • 3 ist ein Blockschaltbild der Ziffernbestimmungsschaltung von 1.
  • 4 liefert eine visuelle Abbildung der Beziehung von DTMF-Tönen, wobei die Verwendung eines Tons niedriger Frequenz und eines Tons hoher Frequenz zur Erzeugung von bis zu 16 DTMF-Signalen gezeigt ist.
  • 5 ist eine graphische Darstellung eines DTMF-Tons, der aus einem Ton niedriger Frequenz und einem Ton hoher Frequenz besteht.
  • 6 ist ein Graph eines um einen Ton zentrierten Detektionsfensters.
  • 7 ist ein Graph eines Detektionsfensters, das nicht in bezug auf einen zu erkennenden Ton zentriert ist.
  • Ausführliche Beschreibung
  • 1 ist ein Blockschaltbild einer Ausführungsform gemäß der vorliegenden Erfindung, die als drei Teile enthaltend angesehen werden kann: eine Ziffernbestimmungsschaltung 10, eine erste Ziffernvalidierungsschaltung 12 und eine zweite Ziffernvalidierungsschaltung 14. Die Ziffernbestimmungsschaltung 10 empfängt digitalisierte Abtastwerte eines Signals, das zum Beispiel auf einem Kommunikationskanal in einem Telekommunikationsnetz geführt wird, in dem die Töne für Zeichengabe- oder Befehlszwecke verwendet werden. Zum Beispiel könnten die Töne aus einem einzigen Audiofrequenzton mit einer gegebenen Frequenz bestehen, oder aus DTMF-Tönen, wie zum Beispiel den gewöhnlich im Fernsprechnetz verwendeten. Wie in 7 gezeigt, bestehen DTMF-Töne aus Paaren von Audiofrequenztönen, die gleichzeitig mit jeweiligen Frequenzen gesendet werden. Die Schaltung 10 bestimmt anfänglich, ob ein DTMF-Signal, das eine Ziffer darstellt, empfangen wurde.
  • Die beispielhafte Ausführungsform der ersten Validierungsschaltung 12 enthält einen Abtastwertpuffer 16, der einen Rahmen digitalisierter Eingangsabtastwerte speichert. Dieser Rahmen enthält mindestens denselben Rahmen, an dem die Ziffernbestimmungsschaltung 10 eine entsprechende Bestimmung durchgeführt hat. Ein Rahmen von Eingangsabtastwerten wird mit LPC-Koeffizienten dargestellt. Die Spektralhöhe der LPC-Funktion stimmt gut mit der des ursprünglichen Signals überein. Die LPC-Funktion kann unter Verwendung der folgenden Gleichung definiert werden:
    Figure 00050001
  • Dabei ist: sk das Signal zum Zeitpunkt k;
    an der LPC-Koeffizient für den n-ten vorherigen Abtastwert;
    Sk-n das Signal zum Zeitpunkt k-n, d. h. der n-te vorherige Abtastwert;
    ek der Prädiktionsfehler oder -rest zum Zeitpunkt k.
  • Die Funktion in Klammern in der obigen Gleichung stellt die LPC-Funktion dar, und ek die in dem abgetasteten Signal enthaltene Energie, die durch das LPC-Modell nicht berücksichtigt wird.
  • Wenn die Ziffernbestimmungsschaltung 10 eine positive Entscheidung durchführt, d. h. daß von mehreren vorbestimmten Tönen oder Ziffern einer bzw. eine empfangen wurde, wird das Abtastgatter 18 geschlossen, wodurch die gespeicherten Abtastwerte in dem Puffer 16 zu dem Multiplizierer 20 transferiert werden. Bei der beispielhaften Ausführungsform bilden 160 Abtastwerte einen Rahmen. Die andere Eingabe 22 für den Multiplizierer 20 kann aus einer Raised-Cosine-Funktion bestehen, die bei Multiplikation mit den Eingangsabtastwerten als ein Hamming-Fenster wirkt, das die Effekte des Isolierens der 160 Abtastwerte von dem kontinuierlichen Datenstrom glättet. Zum Beispiel kann die Raised-Cosine-Funktion folgendes umfassen: WH(k) = 0,54 – 0,46 cos(2πk/159)mit k = 0,1, ..., 159.
  • Die Ausgabe des Multiplizierers 20, die aus gewichteten Abtastwerten besteht, wird dem Autokorrelationskalkulator 24 als Eingabe zugeführt, der für eine Verzögerung von i Abtastwerten auf der Grundlage der Hamming-Fenster-Daten einen einzigen Autokorrelationswert berechnet. Bei Bezeichnung der Eingangssequenz für den Autokorrelationskalkulator 24 als sk wird der Autokorrelationswert „r" für eine Verzögerung von i Abtastwerten folgendermaßen definiert:
    Figure 00060001
    dabei identifiziert k einen ankommenden Abtastwert; i stellt die Leistung des LPC-Modells dar, die bei der beispielhaften Ausführungsform von 1 bis 12 reicht.
  • Es wird jedoch nur ein einziger Autokorrelationswert, d. h. eine gegebene Leistung, auf einmal berechnet. Die Autokorrelationswerte werden vorzugsweise in einem Array gehalten. Da die Autokorrelationsberechnung in der Regel der rechenintensivste Teil der Erzeugung einer Menge von LPC-Koeffizienten ist, kann das Berechnen des Werts von einer Zeitverzögerung auf einmal mit anschließender Auswertung der Anpassung des mit diesem Wert erzeugten LPC-Modells die Gesamtzahl von Berechnungen minimieren, wenn vor der Erreichung der maximalen Ordnung des Modells, wie zum Beispiel der zwölften Ordnung bei der beispielhaften Ausführungsform, eine Anpassung eines gewünschten Werts (später besprochen) bestimmt wird.
  • Der LPC-Koeffizientenkalkulator 26 empfängt die von dem Autokorrelationskalkulator 24 bestimmten Autokorrelationswerte als Eingaben und berechnet vorzugsweise den Reflexionskoeffizienten k des Index i auf der Grundlage des ersten Schritts der Levinson-Durbin-Rekursionslösung für die Normalgleichungen von Yule-Walker, mit der folgenden Definition:
    Figure 00070001
    dabei ist k der Reflexionskoeffizient für die i-te Ordnung;
    r ist der Autokorrelationswert für den referenzierten Index;
    a ist das j-te Element der Menge von LPC-Koeffizienten der Ordnung i-1;
    E ist das Quadrat des Restfehlers des LPC-Systems der Ordnung i-1.
  • Genau wie bei den Autokorrelationswerten wird für jede Ordnung nur ein Reflexionskoeffizient berechnet, d. h. für jede i-te Iteration. Nachdem sie berechnet wurden, werden diese Werte in einem Array gespeichert.
  • Der LPC-Koeffizientenkalkulator 26 berechnet weiterhin die Koeffizienten a(j) auf der Grundlage der folgenden Formeln: aj (i) = ki für j = i, und aj (i) = aj (i-1) – kia(i-1) für j = 1, 2, ..., i-1.
  • Die von den Elementen 24 bzw. 26 erzeugten Autokorrelationswerte und LPC-Koeffizienten erzeugen jeweils nur die entsprechenden Werte für eine Ebene, oder Ordnung des Modells auf einmal. Ein Entscheidungsschritt 28 bestimmt, ob die i-te Ordnung größer als 11 ist. Eine NEIN-Antwort führt zu einer weiteren Bestimmung im Schritt 30, ob die Restenergie kleiner als 1 Prozent ist, und ob die i-te Ordnung kleiner als 9 ist. Es wird angenommen, daß eine Restenergie im Bereich von 0,5% bis 4% geeignet ist, wobei 0,5% bis 2% bevorzugt sind. Es könnte eine i-te Ordnung von 4 bis 12 verwendet werden, obwohl ein Bereich von 6 bis 9 bevorzugt wird. Die Restenergie kann folgendermaßen berechnet werden: E(i) = (1 – k2i )E(i-1) dabei ist E(i) die Restenergie, die durch das LPC-Modell für die i-te Ordnung nicht berücksichtigt wird; k ist der oben für die i-te Ordnung definierte Koeffizient.
  • Die Restenergie für ein LPC-System der Ordnung Null (E(0)) ist die Energie der Hamming-Fenster-Daten, berechnet durch den Autokorrelationskalkulator 24. Die obigen Restenergieschwellen sind vorzugsweise Prozentsätze von E(0).
  • Eine NEIN-Bestimmung durch den Bestimmungsschritt 30 führt zu einer Erhöhung der Ordnung um 1, wie durch den Block 32 dargestellt, und zu einer Berechnung der LPC-Parameter der nächsthöheren Ordnung. Eine JA-Bestimmung durch den Bestimmungsschritt 30 gibt an, daß die Kriterien erfüllt wurden, wodurch eine Eingabe für das OR-Gatter 34 bereitgestellt wird. Die Ausgabe des OR-Gatters 34 liefert ein Ziffernvalidierungssignal, das an die Ziffernbestimmungsschaltung 10 angekoppelt wird und bewirkt, daß die Schaltung 10 die zuvor betrachtete Ziffer auf der Ausgangsleitung 36 an andere Schaltkreise in dem Telekommunikationssystem ausgibt, das die Ziffer zur Erzeugung eines Ergebnisses oder einer Aktion verwendet. Die Ausgabeziffer kann zum Beispiel die Eingabe eines Teilnehmers eines DTMF-Tons darstellen, der als Teil einer Rufnummer als Eingabewählziffer verwendet wird, oder die Auswahl eines Teilnehmers, einen Dienst zu empfangen, oder als Antwort auf ein dem Teilnehmer abgespieltes hörbares Menü, bedeuten kann.
  • In bezug auf die in 1 dargstellte erste Validierungsschaltung 12 hat die Prüfung empirische Daten ergeben, die zu den Auswahlmöglichkeiten der angegebenen Kriterien für die Entscheidungsschritte 28 und 30 führten. Obwohl die angegebenen Werte bevorzugt sind, ist für Fachleute erkennbar, daß die Auswahlmöglichkeiten der Parameter des Schritts 30 (die i-te Ordnung und die Restenergie E(i)) innerhalb von Bereichen veränderlich sein können und weiter Ergebnisse produzieren, die gemäß der vorliegenden Erfindung erwünscht sind. Eine Restenergieschwelle zwischen 0,5 Prozent und 4 Prozent kann verwendet werden, und die i-te Schwelle kann im Bereich von 4 bis 12 liegen. Ein weiterer bevorzugter Bereich für die i-te Ordnung existiert zwischen 6 und 9, und zwischen 0,5 Prozent und 2 Prozent für die Restenergieschwelle.
  • Der Vorteil der Durchführung einer früheren Validierungsbestimmung durch die erste Validierungsschaltung 12, ohne die maximale i-te Ordnung zu erreichen, liefert rechnerische Effizienzen durch Beseitigung von Berechnungen für Modelle höherer Ordnungen und beseitigt gemäß der vorliegenden Erfindung Aktionen durch die zweite Validierungsschaltung 14. Es ist zu beachten, daß die Schwelle für die i-te Ordnung im Schritt 30 (i < 9) kleiner als die im Schritt 28 angegebene maximale i-te Ordnung (i > 11) ist. Es wurde bestimmt, daß ein im Schritt 30 spezifizierter Restenergiepegel unerwünschterweise erreicht werden kann, wenn erlaubt wird, daß die i-te Ordnung einen Maximalwert übersteigt und somit eine falsche Validitätsbestimmung liefert. Für Modelle höherer Ordnung kann eine bessere Anpassung an Daten erreicht werden. Gemäß der vorliegenden Erfindung wird somit gewünscht, die i-te Schwelle im Schritt 30 auf weniger als und vorzugsweise mehr als zwei Ordnungen weniger als die Ordnung einzurichten, die für eine JA-Bestimmung durch den Schritt 28 erforderlich ist.
  • Die zweite Validierungsschaltung 14 enthält eine Schaltung 38, die die Mittenfrequenz für die Spitzenenergieantwort in einem gegebenen Fenster um die zuvor bestimmte bekannte Mittenfrequenz herum findet und eine DFT-Analyse an dem oben berechneten Modell auf der Grundlage von LPC-Koeffizienten berechnet. Die Berechnung durch die Schaltung 38 erfolgt auf der Grundlage der zwölften Ordnung, d. h. der minimalen Granularität, die für ein JA durch den Entscheidungsschritt 28 notwendig ist. Gemäß einer beispielhaften Ausführungsform führt die Schaltung 38 somit ihre Operationen auf der Grundlage eines LPC-Modells zwölfter Ordnung durch.
  • Wie nachfolgend in bezug auf 6 und 7 beschrieben werden wird, findet die Schaltung 38 vorzugsweise die Mitte einer Energieantwort in einem Fenster um eine für den entsprechenden Ton definierte vorbestimmte Mittenfrequenz herum. Für Fachleute ist erkennbar, daß ein Aufbau von Toleranzen dazu führen kann, daß die Spitzenenergie für eine antizipierte Frequenz in einem Bereich um die definierte Frequenz herum auftreten kann. Eine Aufgabe der Schaltung 38 besteht darin, innerhalb eines begrenzenden Fensters zu bestimmen, wo die Spitzenenergie liegt, falls sie nicht an der korrekt definierten Frequenz für den Ton liegt. Diese definierte Frequenz in dem Fenster der Spitzenantwort wird dann für die Spitzenberechnung der DFT verwendet.
  • Bei der beispielhaften Ausführungsform erfolgen DFT-Berechnungen vorzugsweise auf jeder Seite der vorbestimmten Frequenz der Spitzenenergieantwort. In dem Beispiel, bei dem ein DTMF-Ton erkannt werden soll, existieren zwei Mengen von Ausgaben aus der Schaltung 38, wobei jede Menge aus folgendem besteht: einem Wert, der die Energie an der Spitze darstellt, und entsprechenden Energiewerten, die über und unter der Frequenz der Spitzenenergie bestimmt werden, wie zum Beispiel bei 2,5% der Spitzenfrequenz über und unter der Spitzenfrequenz. Obwohl sich Talenergien bei ± 2,5% gut für diese Anwendung eignen, könnten auch Talenergien bei ± 0,5% bis 5% verwendet werden, wobei sich ± 1% bis 3% besonders eignen. Die Schaltung 40 empfängt die Spitzen- und die zwei Talenergieberechnungen, die sich aus der DFT für den hohen Ton ergeben, und die Schaltung 42 empfängt die Spitzen- und die beiden entsprechenden Talenergien für einen entsprechenden niederfrequenten Ton. Gemäß der beispielhaften Ausführungsform addiert die Schaltung 40 die für die beiden Talwerte berechneten Energien und dividiert das Ergebnis in die Energie, die dem Spitzenenergiewert zugeordnet ist. Die Schaltung 42 führt eine ähnlich Berechnung in Bezug auf den anderen DTMF-Ton durch, sodaß jede der Schaltungen 40 und 42 einen Wert ausgibt, der einen Vergleich zwischen der Energie bei der Spitzenfrequenz relativ zu der Energie in den bestimmten Tälern darstellt. Die Bestimmungsschritte 44 und 46 liefern eine Bestimmung auf der Grundlage der Ausgangsberechnung aus den Schaltungen 40 bzw. 42. Der von den Schaltungen 40 und 42 ausgegebene Wert betrifft im allgemeinen die Steigung der Spitzenenergien relativ zu den Werten. Ein vorbestimmter Minimalwert für die jeweiligen Töne mit hoher und niedriger Frequenz, wie durch die Schritte 44 bzw. 46 bestimmt, muß für die Ausgabe der Bestimmungsschritte 44 und 46 überschritten werden, um ein JA zu ergeben, das als Eingabe dem AND-Gatter 48 zugeführt wird. Die Ausgabe des AND-Gatters wird als Eingabe von dem OR-Gatter 34 empfangen. Das OR-Gatter liefert eine gültige-Ziffernbestimmungsausgabe, die zu der Ziffernbestimmungsschaltung 10 übertragen wird, die dann die vorläufig bestimmte Ziffer an dem Ausgang 36 als eine gültige Ziffer ausgibt. Eine NEIN-Bestimmung durch einen der Bestimmungsschritte 44 oder 46 führt dazu, daß das OR-Gatter 50 der Ziffernbestimmungsschaltung 10 eine Ausgabe zuführt, die einen Neustart bewirkt und anzeigt, daß die vorläufig bestimmte Ziffer, die von der Schaltung 10 als vorhanden angenommen wurde, nicht validiert wurde und somit nicht auf dem Ausgang 36 ausgegeben wird. Eine Ausgabe aus dem OR-Gatter 50 bewirkt also eine Neuinitialisierung, so daß die Ziffernbestimmungsschaltung 10 versucht, in späteren Datenrahmen nach dem Vorhandensein möglicherweise gültiger Ziffern oder Töne zu suchen.
  • Die entsprechenden Minimalwerte, die in den Schritten 44 und 46 für die Erkennung von DTMF-Ziffern verwendet werden, sind in der nachfolgenden Tabelle angegeben.
  • Tabelle
    Figure 00130001
  • Die obige Tabelle basiert auf empirischen Informationen, mit denen Bestimmungen durchgeführt werden, ob entsprechende DTMF-Ziffern gemäß der vorliegenden Erfindung als gültig bestimmt werden sollten. Es versteht sich, daß diese Steigungen für die konkrete Implementierung galten, die ein LPC-Modell zwölfter Ordnung enthält, das eine Anpassung an entsprechende DFT-Berechnungen auf der Grundlage einer zentrierten Spitzenfrequenzausgabe mit entsprechenden Tälern mit einem Trennungsabstand von 2,5 Prozent auf jeder Seite der Spitzenfrequenz liefert.
  • Die zweite Validierungsschaltung 14 liefert einen größeren Granularitätsgrad der Entscheidungsfindung, der die erste Validierungsschaltung 12 übersteigt. Für Fachleute ist erkennbar, daß die erste Validierungsschaltung besonders dafür nützlich ist, die erforderliche rechnerische Komplexität und Entscheidungsfindung zu verringern, d. h. es unnötig zu machen, daß die zweite Validierungsschaltung an den Daten wirkt. Die Entscheidung, die einer JA-Ausgabe durch den Entscheidungsschritt 30 zugeordnet ist, könnte beseitigt werden, wobei jeder Rahmen nur von der zweiten Validierungsschaltung 14 validiert wird. Es wäre jedoch eine wesentliche Zunahme der rechnerischen Komplexität/Leistung erforderlich, wenn die erste Validierungsschaltung beseitigt würde. Auf einer statistischen Grundlage wird eine beträchtliche Anzahl von Tönen als gültig validiert, ohne daß eine Aktion durch die zweite Validierungsschaltung erforderlich ist. Es wird als vorteilhaft angenommen, die erste Validierungsschaltung in Verdindung mit der zweiten Validierungsschaltung zu implementieren, da die durch die erste Validierungsschaltung zu verwendenden Parameter als Zwischenschritte bei der Erreichung der für die zweite Validierungsschaltung höhere Ordnung benötigten Parameter erzeugt werden. Somit dient man den Effizienzen und Wirtschaftlichkeiten am besten durch Benutzung der ersten Validierungsschaltung in Kombination mit der zweiten Validierungsschaltung.
  • 2 zeigt ein Blockschaltbild einer Computerarchitektur 60 zur Implementierung der vorliegenden Erfindung. Für Fachleute ist erkennbar, daß die vorliegende Erfindung durch spezifische Hardwareschaltungen, spezialisierte integrierte Schaltungen oder durch eine Computerarchitektur 60 wie in 2 gezeigt implementiert werden kann. Ein Mikroprozessor 62 wird von Nurlesespeicher (ROM) 64, Direktzugriffsspeicher (RAM) 66 und ein nichtflüchtiges Datenspeicherelement 68, das eine Festplatte umfassen kann, unterstützt. Außerdem wird ein digitaler Signalprozessor (DSP) 70 von ROM 64, RAM 66 und dem Datenspeicherelement 68 unterstützt. Ein Direktkommunikationskanal oder Bus 72 koppelt vorzugsweise den Mikroprozessor 62 und den DSP 70, um eine schnelle Übertragung von Daten zwischen ihnen zu ermöglichen.
  • Für Fachleute ist erkennbar, daß der DSP 70 besonders für die Ausführung von mathematischen Berechnungen, die gemäß der vorliegenden Erfindung benutzt werden, geeignet ist. Eine Eingangs-/Ausgangssteuerung 74 ist durch die Kommunikationsleitung 76 mit dem Mikroprozessor 62 und durch die Kommunikationsleitung 78 mit dem DSP 70 gekoppelt. Die Eingangs-/Ausgangssteuerung 74 liefert eine Eingangs-/Ausgangsschnittstelle zwischen dem Mikroprozessor 62 und dem DSP 70, den als Eingaben empfangenen digitalen Eingangsabtastwerten und der Ausgangsleitung 36, auf der gültige Ziffern übertragen werden. Ein gespeichertes Programm kann die für die Ausführungsform der vorliegenden Erfindung beschriebenen Aktionen implementieren.
  • 3 ist ein Blockschaltbild einer Ziffernbestimmungsschaltung 10, wie in 1 gezeigt. Ein Rahmenpuffer 100 speichert einen Rahmen von Eingangsabtastwerten. Eine Leistungsberechnungsschaltung 102 berechnet die Gesamtleistung, die in den Abtastwerten enthalten ist, die in dem aktuellen Rahmen enthalten sind, und liefert die berechnete Leistung an den Entscheidungsschritt 104. Wenn die berechnete Gesamtleistung eine vorbestimmte Schwelle übersteigt, führt der Bestimmungsschritt 104 zu einer JA-Entscheidung, die bewirkt, daß sich das Abtastgatter 106 schließt, wodurch die aktuellen Abtastwerte in dem Rahmen zu der Frequenzbereichsanalyseschaltung 108 transferiert werden. Eine NEIN-Bestimmung durch den Schritt 104 führt dazu, daß der Rahmenpuffer 100 zurückgesetzt wird und einen neuen Rahmen von Eingangsabtastwerten empfängt, an dem durch die Schaltung 102 eine weitere Gesamtleistungsberechnung durchgeführt wird. Dieser Teil der Ziffernbestimmungsschaltung 10 wirkt also als eine Schwellenbestimmung, um zu bestimmen, ob in den Abtastwerten eines Rahmens ausreichend Leistung existiert, um eine weitere Analyse zu rechtfertigen.
  • Die Frequenzbereichsanalyseschaltung 108 kann DFT-Berechungen an den acht DTMF-Tönen zugeordneten Frequenzen umfassen. Die Analyseschaltung 108 liefert 8 Ausgaben X(f1) ... X(f8) , wobei die Ausgaben jeweils eine berechnete Energie an jeder der acht Frequenzen, die den acht möglichen DTMF-Frequenzen zugeordnet sind, darstellen. Eine Ziffernauswahlschaltung 110 empfängt die acht Ausgaben aus der Analyseschaltung 108 und liefert einen Vergleich jeder der acht Ausgaben mit einer vorbestimmten Schwelle, um zu bestimmen, welche etwaige DTMF-Ziffer in dem aktuellen Rahmen vorliegt. Wenn bestimmt wird, daß keine Ziffer vorliegt, wird auf der Kommunikationsleitung 112 ein Ausgangssignal von der Ziffernauswahlschaltung 110 zu dem Rahmenpuffer 100 übertragen, wodurch bewirkt wird, daß der Puffer zurückgesetzt und die Verarbeitung des nächsten Rahmens Abtastwerte eingeleitet wird. Wenn die Ziffernauswahlschaltung 110 bestimmt, daß eine Ziffer vorliegt, wird die Ziffer identifiziert und zu der Schaltung 114 gesendet, die ein Register umfassen kann, das die erkannte Ziffer speichert. Die Schaltung 114 sendet die Ziffer jedoch erst dann zu der Ausgangsleitung 36, wenn sie von dem OR-Gatter 34 von 1 erzeugtes Ziffer-gültig-Signal empfängt. Nach der Verarbeitung durch die erste und die zweite Validierungsschaltung 12 bzw. 14 von 1 und der vorläufigen Bestimmung, die in der Schaltung 114 gespeichert wird, wird entweder ein Ziffer-gültig-Signal erzeugt oder das OR-Gatter 50 erzeugt ein Ziffernsuch-Neustart-Signal. Der Empfang des Ziffergültig-Signals durch die Schaltung 114 bewirkt, daß die gespeicherte Ziffer auf der Ausgangsleitung 36 übertragen wird. Im Anschluß an die Übertragung dieser Ziffer werden die Schaltkreise dann zurückgesetzt, um einen weiteren Rahmen von Daten zu verarbeiten. Wenn das NOR-Gatter 50 das Ziffernsuch-Neustart-Signal erzeugt, wird die in der Schaltung 114 gespeicherte Ziffer verworfen und nicht auf der Ausgangsleitung 36 übertragen. Das Ziffernsuch-Neustart-Signal sowie die Ziffer-gültig-Signale können an die Ziffernauswahlschaltung 110 angekoppelt werden, die zum Einleiten eines Rücksetzens der den Rahmenpuffer 100 enthaltenden Schaltkreise dienen, um den nächsten Rahmen von Daten zu empfangen.
  • Für Fachleute ist erkennbar, daß die Ziffernbestimmungsschaltung 10 vielfältige Arten von Schaltkreisen außer der in 3 gezeigten beispielhaften Schaltung umfassen kann. Zum Beispiel kann die Ziffernbestimmungsschaltung 10 einen Tondetektor umfassen, der in dem eigenen US-Patent 5,325,427 mit dem Titel „Apparatus and Robust Method for Detecting Tones" beschrieben wird. Auf dieses Patent wird hiermit ausdrücklich Bezug genommen.
  • 4 zeigt eine graphische Darstellung eines 4 × 4-Matrixtelefontastenfelds, das zur Kodierung von 16 DTMF-Symbolen verwendet werden kann. Für Fachleute ist erkennbar, daß die vierte Spalte auf einem Standardapparat im allgemeinen weggelassen wird. Die Zeilen stellen die Töne niedrigerer Frequenz von f1...f4 dar, während die Spalten die Töne höherer Frequenz f5...f8 darstellen. Die Frequenzen, die den niedrigen Tönen zugewiesen werden, reichen von 697 Hertz (Hz) für f1 bis zu 941 Hz für f4; die Töne höherer Frequenz reichen von 1209 Hz für f5 bis 1633 Hz für f8. Die Verwendung der Tasten auf einem Standardapparat führt zu der Übertragung der beiden entsprechenden Töne, die durch den Querschnitt der entsprechenden Zeilen- und Spaltenleitungen in 4 angegeben werden.
  • 5 zeigt einen Graph, in dem die Energieamplitude als Funktion der Frequenz für die hörbaren Frequenzen, die die DTMF-Tonfrequenzen enthalten, aufgetragen ist. In dem beispielhaften Graph stellt die Linie 150 eine Gesamtantwort dar, die eine Spitze 152 bei einer niedrigeren Frequenz und eine Spitze 154 bei einer höheren Frequenz enthält. Jede dieser Spitzen ist um eine niedrigere Frequenz f1 bzw. eine höhere Frequenz fh zentriert. Dieser Graph zeigt eine idealisierte Antwort für eine Empfangskurve einer DTMF-Ziffer, in der die niedrigere Frequenz der Spitze 152 und der Ton höherer Frequenz der Spitze 154 entspricht.
  • 6 zeigt einen ähnlichen Graph wie 5, in dem nur eine einzige Energiespitze 160 bei der Frequenz fL gezeigt ist. Ein Fenster 162, das bei der beispielhaften Ausführungsform in gleichem Abstand oder zentriert um die Frequenz der Spitze liegt, ist gezeigt. Bei der bevorzugten Ausführungsform stellt das Fenster einen Bereich um die Spitze dar, der ± 0,5% bis 5% der Frequenz fL umfassen kann, wobei 2,5% ein bevorzugtes Fenster ist. Die untere und obere Frequenz des Fensters werden durch die Frequenzen fL1 bzw. fL2 definiert. Dieser Graph zeigt die Spitzenenergie auf P(f1), so wie sie der Steigungsschaltung 42 zugeführt wird, sowie die Talenergiebestimmungen V (fL1) und V (fL2) , die der unteren und oberen Energiebestimmung an der entsprechenden unteren und oberen Frequenz des Fensters 162 entsprechen. Die Differenz zwischen den Energiepegeln an der Spitze und den Rändern des Fensters 162 wird bei der Bestimmung im Schritt 46 verwendet, ob ein gültiger Ton in der zweiten Validierungsschaltung 14 empfangen wurde. Für Fachleute ist erkennbar, daß für den Ton der oberen Frequenz, der der Steigungsschaltung 40 zugeordnet würde, eine im wesentlichen identische Technik verwendet und eine resultierende Bestimmung im Schritt 44 durchgeführt würde.
  • 7 zeigt einen Graph der Energieamplitude als Funktion der Frequenz, wobei die Spitzenenergie 170 in bezug auf ein Fenster 172 gezeigt ist. Bei dem veranschaulichenden Beispiel fällt die Frequenz fp der Energiespitze nicht mit der Frequenz fc zusammen, die die Mittenfrequenz des Fensters 172 darstellt. Dadurch wird graphisch ein Fall dargestellt, in dem ein empfangener Ton keine Energiespitze aufweist, die genau bei der für den Ton spezifizierten Frequenz liegt. Dazu kann es aufgrund von verschiedenen Faktoren kommen, darunter ein Toleranzaufbau, der zu der Erzeugung des Tons in einem Bereich seiner spezifizierten Frequenz führt. Gemäß der vorliegenden Erfindung wird bevorzugt, daß die diskreten Fouriertransformationen um die tatsächliche Frequenz, die der Spitzenenergie fp entspricht, herum durchgeführt wird, anstelle der Frequenz fc, an der der Ton aufgetreten sein sollte. In der Schaltung 38 (siehe 1) wird vorzugsweise eine Technik zur Bestimmung der tatsächlichen Spitzenfrequenz fp innerhalb eines durch das Fenster 172 definierten Bereichs von Frequenzen verwendet. Für Fachleute ist erkennbar, daß mehrere iterative Berechnungen über eine Menge von Frequenzen innerhalb des Fensters 172 verwendet werden kann, um zu bestimmen, wo der maximale Energiepegel besteht. Es kann eine alternative Technik verwendet werden, die das mathematische Convergenzprinzip verwendet, um die Frequenz zu bestimmen, an der die maximale Energie auftritt. Wenn die Spitzenenergie in dem Fenster 172 liegt, wird nach der Bestimmung der Frequenz fp dieser Spitzenenergie gemäß der vorliegenden Erfindung das Fenster 172 bewegt oder verschoben, so daß die Mittenfrequenz fc des Fensters mit der Mittenfrequenz der Spitze fp zusammenfällt. Dies ermöglicht eine bessere Erkennung von Tönen, wenn solche Töne nicht mit Spitzenenergien gesendet werden, die genau an ihrer definierten Frequenz auftreten.
  • Gemäß einer Ausführungsform der vorliegenden Erfindung werden vorzugsweise eine erste und eine zweite Validierungsschaltung verwendet, um die Bestimmung eines empfangenen Tons (einer empfangenen Ziffer) zu validieren. Durch eine Validierung durch die erste Validierungsschaltung wird eine weitere Verarbeitung durch die zweite Validierungsschaltung unnötig, und dadurch werden die erforderliche rechnerische Komplexität und die erforderlichen Betriebsmittel minimiert. In den Fällen, in denen die erste Validierungsschaltung keine Validierungsbestimmung bereitstellen kann, liefert die zweite Validierungsschaltung eine Auswertung mit feinerer Auflösung darüber, ob ein gültiger Ton empfangen wurde. Es ist ersichtlich, daß die zweite Validierungsschaltung zu Lasten einer zusätzlichen rechnerischen Komplexität und zusätzlicher Betriebsmittel ohne die erste Validierungsschaltung verwendet werden könnte. Gemäß der vorliegenden Erfindung können Ausführungsformen angepaßte integrierte Schaltungen, Hardwareschaltkreise oder eine Implementierung in einer Computerarchitektur, wie zum Beispiel in 2 gezeigt, umfassen. Es kann eine Kombination von Software und Hardware verwendet werden, um die Techniken gemäß der vorliegenden Erfindung zu implementieren.
  • Obwohl eine Ausführungsform der vorliegenden Erfindung in den Zeichnungen beschrieben und gezeigt wurde, wird der Schutzumfang der Erfindung durch die nachfolgenden Ansprüche definiert.

Claims (8)

  1. Computerimplementiertes Verfahren zum Validieren der Erkennung mindestens eines Tons mit einer ersten Frequenz, mit den folgenden Schritten: Berechnen von Parametern der linear-prädiktiven Codierung (LPC) eines Rahmens von Abtastwerten, die den Ton darstellen; Verwenden der LPC-Parameter zur Definition einer Funktion, die die Energie des Rahmens von Abtastwerten als Funktion der Zeit darstellt; Durchführen einer ersten Fouriertransformation der Funktion an der ersten Frequenz, um eine Frequenzbereichsdarstellung einer ersten Energie der Funktion an der ersten Frequenz zu erhalten; Durchführen einer zweiten Fouriertransformation der Funktion an einer zweiten Frequenz, um eine Frequenzbereichsdarstellung einer zweiten Energie der Funktion an der zweiten Frequenz zu erhalten, wobei die zweite Frequenz um einen vorbestimmten Betrag von der ersten Frequenz beabstandet ist; Durchführen einer Bestimmung, ob der mindestens eine Ton gültig ist, auf der Grundlage eines Vergleichs der ersten und der zweiten Energie relativ zu einer vorbestimmten ersten Schwelle.
  2. Verfahren nach Anspruch 1, weiterhin mit den folgenden Schritten: Durchführen einer dritten Fouriertransformation der Funktion an einer dritten Frequenz, um eine Frequenzbereichsdarstellung einer dritten Energie der Funktion an der dritten Frequenz zu erhalten, wobei die zweite und die dritte Frequenz im wesentlichen in gleichem Abstand um den vorbestimmten Betrag von der ersten Frequenz beabstandet sind; Erzeugen eines ersten Werts auf der Grundlage eines Vergleichs der ersten Energie mit der zweiten und der dritten Energie; Durchführen der Bestimmung, ob der mindestens eine Ton gültig ist, abhängig davon, ob der erste Wert die vorbestimmte erste Schwelle übersteigt.
  3. Verfahren nach Anspruch 1, wobei der vorbestimmte Betrag in einem Bereich von 0,5% bis 5,0% der ersten Frequenz liegt.
  4. Verfahren nach Anspruch 1, wobei der vorbestimmte Betrag in einem Bereich von 1,0% bis 3,0% der ersten Frequenz liegt.
  5. Vorrichtung zum Validieren der Erkennung mindestens eines Tons mit einer ersten Frequenz, umfassend: ein Mittel (12) zum Berechnen von Parametern der linear-prädiktiven Codierung (LPC) eines Rahmens von Abtastwerten, die den Ton darstellen; an das Berechnungsmittel angekoppelte Mittel (28, 30) zum Erzeugen einer Funktion, die die Energie des Rahmens von Abtastwerten als Funktion der Zeit darstellt, auf der Grundlage der LPC-Parameter; ein Mittel (38) zum Durchführen einer ersten Fouriertransformation der Funktion an der ersten Frequenz, um eine Frequenzbereichsdarstellung einer ersten Energie der Funktion an der ersten Frequenz zu erhalten; ein Mittel (38) zum Durchführen einer zweiten Fouriertransformation der Funktion an einer zweiten Frequenz, um eine Frequenzbereichsdarstellung einer zweiten Energie der Funktion an der zweiten Frequenz zu erhalten, wobei die zweite Frequenz um einen vorbestimmten Betrag von der ersten Frequenz beabstandet ist; Mittel (40, 42) zum Erzeugen eines ersten Werts auf der Grundlage eines Vergleichs der ersten und der zweiten Energie; Mittel (44, 46, 48, 34) zum Bestimmen, daß der mindestens eine Ton gültig ist, wenn der erste Wert eine vorbestimmte erste Schwelle übersteigt.
  6. Vorrichtung nach Anspruch 5, die weiterhin folgendes umfaßt: Mittel (38, 40, 42) zum Durchführen einer dritten Fouriertransformation der Funktion an einer dritten Frequenz, um eine Frequenzbereichsdarstellung einer dritten Energie der Funktion an der dritten Frequenz zu erhalten, wobei die zweite und die dritte Frequenz im wesentlichen in gleichem Abstand um den vorbestimmten Betrag von der ersten Frequenz beabstandet sind; Mittel (40, 42) zum Erzeugen eines ersten Werts auf der Grundlage eines Vergleichs der ersten Energie mit der zweiten und der dritten Energie.
  7. Vorrichtung nach Anspruch 5, wobei der vorbestimmte Betrag in einem Bereich von 0,5% bis 5,0% der ersten Frequenz liegt.
  8. Vorrichtung nach Anspruch 5, wobei der vorbestimmte Betrag in einem Bereich von 1,0% bis 3,0% der ersten Frequenz liegt.
DE69531525T 1994-06-28 1995-06-20 Tonerkennung mit Minimierung falscher Identifikation Expired - Lifetime DE69531525T2 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US267091 1981-05-22
US26709194A 1994-06-28 1994-06-28

Publications (2)

Publication Number Publication Date
DE69531525D1 DE69531525D1 (de) 2003-09-25
DE69531525T2 true DE69531525T2 (de) 2004-06-24

Family

ID=23017271

Family Applications (1)

Application Number Title Priority Date Filing Date
DE69531525T Expired - Lifetime DE69531525T2 (de) 1994-06-28 1995-06-20 Tonerkennung mit Minimierung falscher Identifikation

Country Status (5)

Country Link
US (1) US5765125A (de)
EP (1) EP0690634B1 (de)
JP (1) JPH0819008A (de)
CA (1) CA2149163C (de)
DE (1) DE69531525T2 (de)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102004047353B3 (de) * 2004-09-29 2005-05-25 Siemens Ag Verfahren zur Tonerkennung und Anordnung zur Durchführung des Verfahrens

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6560349B1 (en) 1994-10-21 2003-05-06 Digimarc Corporation Audio monitoring using steganographic information
JPH10105194A (ja) * 1996-09-27 1998-04-24 Sony Corp ピッチ検出方法、音声信号符号化方法および装置
JP3097586B2 (ja) * 1997-03-06 2000-10-10 日本電気株式会社 信号検出器
US5950158A (en) * 1997-07-30 1999-09-07 Nynex Science And Technology, Inc. Methods and apparatus for decreasing the size of pattern recognition models by pruning low-scoring models from generated sets of models
US5963902A (en) * 1997-07-30 1999-10-05 Nynex Science & Technology, Inc. Methods and apparatus for decreasing the size of generated models trained for automatic pattern recognition
AU6425798A (en) * 1997-11-27 1999-06-16 Northern Telecom Limited Method and apparatus for detecting tones
US6941275B1 (en) * 1999-10-07 2005-09-06 Remi Swierczek Music identification system
US6850616B2 (en) * 2001-01-22 2005-02-01 Cirrus Logic, Inc. Frequency error detection methods and systems using the same
US6590972B1 (en) * 2001-03-15 2003-07-08 3Com Corporation DTMF detection based on LPC coefficients
US6873701B1 (en) * 2001-03-29 2005-03-29 3Com Corporation System and method for DTMF detection using likelihood ratios
US20030123574A1 (en) * 2001-12-31 2003-07-03 Simeon Richard Corpuz System and method for robust tone detection
US7844048B2 (en) * 2004-03-08 2010-11-30 Freescale Semiconductor, Inc. Selective tone event detector and method therefor
US8219392B2 (en) * 2005-12-05 2012-07-10 Qualcomm Incorporated Systems, methods, and apparatus for detection of tonal components employing a coding operation with monotone function
WO2010001193A1 (en) * 2008-06-30 2010-01-07 Freescale Semiconductor, Inc. Multi-frequency tone detector

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NL7809383A (nl) * 1977-09-16 1979-03-20 Hitachi Ltd Ontvangstelsel voor multifrequentiesignalen.
US4689760A (en) * 1984-11-09 1987-08-25 Digital Sound Corporation Digital tone decoder and method of decoding tones using linear prediction coding
EP0243561B1 (de) * 1986-04-30 1991-04-10 International Business Machines Corporation Verfahren und Einrichtung zur Tonerkennung
US5136531A (en) * 1991-08-05 1992-08-04 Motorola, Inc. Method and apparatus for detecting a wideband tone
US5325427A (en) * 1992-03-23 1994-06-28 At&T Bell Laboratories Apparatus and robust method for detecting tones

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102004047353B3 (de) * 2004-09-29 2005-05-25 Siemens Ag Verfahren zur Tonerkennung und Anordnung zur Durchführung des Verfahrens

Also Published As

Publication number Publication date
EP0690634B1 (de) 2003-08-20
CA2149163C (en) 1999-01-26
CA2149163A1 (en) 1995-12-29
EP0690634A1 (de) 1996-01-03
DE69531525D1 (de) 2003-09-25
JPH0819008A (ja) 1996-01-19
US5765125A (en) 1998-06-09

Similar Documents

Publication Publication Date Title
DE69531525T2 (de) Tonerkennung mit Minimierung falscher Identifikation
DE2659096C2 (de)
DE69705830T2 (de) Sprachverarbeitung
DE3819178C2 (de)
DE3236832C2 (de) Verfahren und Gerät zur Sprachanalyse
DE69724408T2 (de) Zweitonmehrfrequenzdetektionssystem und -verfahren mit statischer und dynamischer schwellwertbestimmung
DE69627580T2 (de) Verfahren zur Rauschverminderung in einem Sprachsignal
DE69811310T2 (de) Verfahren und Vorrichtung zur Detektion und Endpunkt-Detektion von Vordergrund-Sprachsignalen
DE69329855T2 (de) Methode zur erkennung alphanumerischer zeichenketten, die über ein telefonnetz gesprochen werden
DE69428606T2 (de) Sprachgesteuerter kontozugang über ein fernsprechnetz
DE68914449T2 (de) Sprachgesteuerte bedienung.
DE3236885A1 (de) Verfahren und geraet zur sprachanalyse
DE69930961T2 (de) Vorrichtung und verfahren zur sprachsegmentierung
DE2825186A1 (de) Verfahren zur verringerung der falschanzeige in spracherkennungsverfahren fuer kontinuierliche sprachsignale
DE3853899T2 (de) Verfahren und Vorrichtung zur Codierung und Decodierung eines Signals.
DE2919085A1 (de) Vorverarbeitungsverfahren und -vorrichtung fuer eine spracherkennungsvorrichtung
DE69616724T2 (de) Verfahren und System für die Spracherkennung
DE4328752B4 (de) Spracherkennungssystem
DE69721395T2 (de) Verfahren und Vorrichtung zur Anpassung von Modellen zur Sprecherverifikation
EP0285222A2 (de) Verfahren zum Erkennen zusammenhängend gesprochener Wörter
DE19581667C2 (de) Spracherkennungssystem und Verfahren zur Spracherkennung
EP0595889B1 (de) Verfahren und anordnung zum erkennen von einzelwörtern gesprochener sprache
DE69801493T2 (de) Sprachanalysessystem
DE2756251A1 (de) Verfahren und digitalempfaenger zum erkennen von mehrfrequenzcodierten digitalisierten fernmeldesignalen
DE3929481A1 (de) Verfahren und vorrichtung zur vorbearbeitung von sprachsignalen

Legal Events

Date Code Title Description
8364 No opposition during term of opposition