DE2920041A1 - Verfahren und anordnung zum verifizieren von signalen, insbesondere sprachsignalen - Google Patents

Verfahren und anordnung zum verifizieren von signalen, insbesondere sprachsignalen

Info

Publication number
DE2920041A1
DE2920041A1 DE19792920041 DE2920041A DE2920041A1 DE 2920041 A1 DE2920041 A1 DE 2920041A1 DE 19792920041 DE19792920041 DE 19792920041 DE 2920041 A DE2920041 A DE 2920041A DE 2920041 A1 DE2920041 A1 DE 2920041A1
Authority
DE
Germany
Prior art keywords
memory
values
value
signal
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
DE19792920041
Other languages
English (en)
Other versions
DE2920041C2 (de
Inventor
Ernst Dipl Ing Dr Bunge
Michael Dipl Ing Dr Kuhn
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Philips Intellectual Property and Standards GmbH
Original Assignee
Philips Patentverwaltung GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Philips Patentverwaltung GmbH filed Critical Philips Patentverwaltung GmbH
Priority to DE2920041A priority Critical patent/DE2920041C2/de
Priority to FR8010606A priority patent/FR2484670B1/fr
Priority to US06/149,869 priority patent/US4344031A/en
Priority to GB8016076A priority patent/GB2052822B/en
Priority to JP6548980A priority patent/JPS55154670A/ja
Publication of DE2920041A1 publication Critical patent/DE2920041A1/de
Application granted granted Critical
Publication of DE2920041C2 publication Critical patent/DE2920041C2/de
Expired legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/42Global feature extraction by analysis of the whole pattern, e.g. using frequency domain transformations or autocorrelation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/50Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/192Recognition using electronic means using simultaneous comparisons or correlations of the image signals with a plurality of references
    • G06V30/194References adjustable by an adaptive method, e.g. learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Human Computer Interaction (AREA)
  • Databases & Information Systems (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Acoustics & Sound (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Complex Calculations (AREA)
  • Character Discrimination (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

Philips PatentVerwaltung GmbH, Steindamm 94, 2000 Hamburg
ff PHD 79-056
Verfahren und Anordnung zum Verifizieren von Signalen, insbesondere Sprachsignalen.
Die Erfindung betrifft ein Verfahren zum Verifizieren von Signalen mit mehreren Merkmalen, die mit variablen Werten auftreten, indem zunächst in einer Lernphase eine Anzahl Signale zugeführt und für jedes Signal getrennt die Werte der Merkmale gewonnen und daraus abgeleitete Merkmalgrößen gespeichert werden und in einer folgenden Testphase aus einem zu verifizierenden Signal in gleicher Weise wie in der Lernphase die Werte der Merkmale gewonnen und durch Bezugnahme auf die gespeicherten Merkmalgrößen ein Gesamtwert abgeleitet wird, der mit einem Ähnlichkeits-Schwellwert verglichen wird, bei dessen Überschreitung eine erfolgreiche Verifikation angezeigt wird, sowie eine Anordnung zur Durchführung des Verfahrens.
Signale mit mehreren Merkmalen können von verschiedenen Quellen stammen, wobei die Merkmale beispielsweise Frequenzen, Amplituden,Impulsformen oder die zeitlichen Verläufe der Signale sein können. Beispiele für solche Signale sind die bei der Zeichenerkennung und insbesondere die bei der Geräuschanalyse gewonnenen Signale. Bei solchen Signalen können die Merkmale zufälligen oder zeitlich bedingten Änderungen bzw» Variationen unterliegen.
030048/0194
8 PHD 79-056
Unter Verifizieren wird hier die Prüfung verstanden, ob ein Signal einer angegebenen Quelle entstammt oder nicht. Ein ähnliches Problem liegt vor bei der Klassifizierung von Signalen, wobei geprüft werden soll, ob und welcher Klasse von einer vorgegebenen Menge von Klassen ein Signal zugehört. In beiden Fällen wird zunächst anhand einer Anzahl Lernmuster von Signalen bestimmt, welche Merkmale bzw. welche Werte der Merkmale die Klasse bzw. die Klassen aufweisen, und diese Werte müssen gespeichert werden, um sie anschließend mit den Merkmalwerten des zu verifizierenden Signals vergleichen zu können. Dabei !tonnen die einzelnen Merkmalwerte direkt oder in abgeleiteter Form, beispielsweise als Mittelwert ait Varianz, gespeichert werden.
In manchen praktischen Anwendungsfällen ist der Speicherplatz für die Speicherung der Werte der Merkmale bzw. der abgeleiteten Werte begrenzt. Andererseits hängt die Güte einer Verifikation bzw. Klassifikation, d.h. das Verhältnis von richtigen Erkennungen zu falschen Erkennungen bzw. falsehen Rückweisungen, in einem gewissen Maße von der Anzahl der untersuchten und somit gespeicherten Merkmalen und deren Werten ab.
Aufgabe der Erfindung ist es daher, ein Verfahren der eingangs genannten Art anzugeben, bei dem nur eine geringe Anzahl von Daten gespeichert werden muß und dennoch eine Verifikation mit hoher Zuverlässigkeit möglich ist. Diese Aufgabe wird erfindungsgemäß dadurch gelöst, daß während der Lernphase für jeden Teilbereich der in aneinandergrenzende Teilbereiche unterteilten Wertebereiche der Merkmale die Anzahl der Signale, deren Wert des betreffenden Merkmals in diesen Teilbereich fällt, getrennt aufsummiert und dieser Häufigkeitswert als abgeleitete Merkmalgröße gespeichert wird, und daß während der Testphase der Gesamtwert durch Multiplikation der gespeicherten Häufigkeitswerte derjenigen Teilbereiche, in die die Werte der Merkmale des zu verifizierenden Signals fallen, erzeugt wird.
030048/0194
9 PHD 79-056
Dieses erfindungsgemäße Verfahren stellt eine technische Anwendung des Bayes-Algorithmus dar, nach dem ein Signal verifiziert ist, wenn die Wahrscheinlichkeit, daß das zu verifizierende Signal einer bzw. der bestimmten Klasse zugehört, größer als eine vorgegebene Schwelle ist. Die Wahrscheinlichkeit ist durch das Produkt der Einzelwahrscheinlichkeiten für die Einzelmerkmale gegeben. Die Einzelwahrscheinlichkeiten sind hier die Häufigkeiten, mit denen in der Lernphase Werte von Merkmalen in denjenigen Teilbereich fielen, in den auch der Merkmalwert bzw. die Merkmalwerte des zu verifizierenden Signals fallen.
Da die Häufigkeiten und insbesondere die Häufigkeitsverteilungen bei den einzelnen Merkmalen allgemein unterschiedlich ist, ist es zweckmäßig, daß die Wertebereiche mindestens einiger Merkmale in unterschiedliche Teilbereiche unterteilt sind. Dadurch läßt sich eine bessere Anpassung an die Gegebenheiten erreichen. Für eine technische Verarbeitung der Häufigkeitswerte ist es dabei zweckmäßig, daß die Anzahl der Teilbereiche für alle Merkmale gleich ist.
In vielen Fällen ist es möglich, daß die einzelnen Signale sich auch dadurch unterscheiden, daß die Werte der einzelnen Merkmale bedingt durch die Erzeugung des Signals um einen Proportionalitätsfaktor verschoben sind. Ein derartiger Maßstabsfaktor muß vor der Verarbeitung des Signals durch Normieren beseitigt werden. Hierzu ist es zweckmäßig, daß zur Normierung eines zugeführten Signals zu dem Wert jedes Merkmals ein vorbestimmter Bruchteil dieses Wertes so oft hinzuaddiert wird, bis ein aus den so entstandenen Werten abgeleiteter Gesamtsignalwert eine vorgegebene Gesamtsignalschwelle überschreitet. Auf diese Weise werden die Werte aller Merkmale um den gleichen Faktor verschoben. Dabei ist es meistens ausreichend, wenn der Gesamtsignalwert durch Summieren der Werte der Merkmale abgeleitet wird.
030048/0194
10 PHD 79-056
Da der Ähnlichkeits-Schwellwert von der Häufigkeitsverteilung der Merkmalwerte und insbesondere von den dabei auftretenden maximalen Häufigkeiten abhängt, ist es zweckmäßig, daß nach der Lernphase der Ähnlichkeits-Schwellwert aus der Multiplikation der maximalen Häufigkeitswerte der einzelnen Merkmale gebildet wird. Dabei wird das Produkt aus den maximalen Häufigkeiten mit einem Faktor kleiner 1 multipliziert, um in einem bestimmten Maße auch Abweichungen des zu verifizierenden Signals von den Lernsignalen zuzulassen.
Um die Qualität der Verifikation während des Betriebs zu verbessern, ist es zweckmäßig, daß nach einer erfolgreichen Verifikation eine erneute Lernphase angeschlossen wird, in der die Häufigkeitswerte derjenigen Teilbereiche, in die die Werte der Merkmale des zu verifizierenden Signals gefallen sind, um 1 erhöht werden. Auf diese Weise wird das verifizierte Signal außerdem als Lernsignal verwendet. Dabei muß selbstverständlich jeweils der Ähnlichkeits-Schwellwert neu bestimmt werden. Dabei ist es zweckmäßig, daß beim Überschreiten eines Häufigkeitswertes über einen vorgegebenen Wert alle Häufigkeitswerte durch einen konstanten Divisor geteilt werden. Dieser vorgegebene Wert kann die maximal speicherbare Häufigkeit sein. Dabei muß ebenfalls der Ähnlichkeits-Schwellwert neu bestimmt werden.
Ein besonders wichtiges Anwendungsgebiet des erfindungsgemäßen Verfahrens ist die Sprechererkennung bzw. die
3Q Sprecherverifikation. Dabei ist es zweckmäßig, daß das Signal ein Sprachsignal begrenzter Dauer und die Merkmale aneinandergrenzende Frequenz-Spektralbereiche sind, wobei die Energie des Sprachsignals in aufeinanderfolgenden gleichen Zeitabschnitten je Spektralbereich getrennt integriert und die einzelnen Integrale getrennt über das gesamte Sprachsignal aufsummiert werden und die Spektralsummen die Werte der Merkmale darstellen. Diese Spektral-
030048/0194
11 PHD 79-056
summen stellen in ihrer Gesamtheit das Langzeitspelstrum des Sprachsignals dar.
Eine einfache Realisierung ergibt sichj, wenn ζην Feststellung der Teilbereiches in die die einzelnen Spektral-
summen fallen^ während der Dauer des Sprachsignals für jeden Spektralbereich nach jeder Äufsummierung eines weiteren Integrals die dabei entstandene Teilsumme mit der oberen Grenze eines Teilbereichs verglichen wird und daß der Inhalt eines dem betreffenden Spektralbereich zugeordneten Zwischenspeicherplatzes um 1 erhöht x«/ird, wenn die Teilsuinme die Grenze überschreitet, und danach der Vergleich mit der oberen Grenze des nächsthöheren Teilbereiches durchgeführt wird. Auf diese Weise läuft in den einzelnen Spektralbereichen die Teilbereichsgrenze quasi mit,, so daß am Ende des Sprachsignals nicht der Wert jedes Merkmals nacheinander mit allen Teilbereichen verglichen werden muß. Es ist zweckmäßig,, wenn die Verfahrensschritte auch während der vorher angegebenen Noraie-
2Q rung durchgeführt werden. Dabei erfolgt dann der gleiche Ablauf wie bei der Analyse des Sprachsignals, so daß zur Durchführung keine besonderen Einrichtungen notwendig sind.
Dieses Verfahren der Sprecherverifikation kann auch für einen sogenannten Stimmausxireis verwendet werden. Dafür ist es zweckmäßig, daß die während der Lernphase gewonnenen Häufigkeitswerte auf einem Datenträger gespeichert sind und zum Verifizieren vor bzw. während der Zufuhr des zu verifizierenden Sprachsignals automatisch eingelesen und gespeichert werden. Der Datenträger ist dabei der Ausweis, auf dem die Häufigkeitswerte magnetisch oder in einem Halbleiterspeicher elektrisch gespeichert sind.
Anordnungen zur Durchführung des erfindungsgemäßen Verfahrens, insbesondere zur Sprecherverifikation, sind in
restlichen
den/Unteransprüchen gekennzeichnet.
030048/0194
12 PKD 79-056
Ausführimgsbeispiele der Erfindung werden nachstehend anhand der Zeichnung näher erläutert. Es zeigern
Fig, 1 ein Beispiel für die Häufigkeitsverteilung von drei Merkmalen in einem Signal,
Fig. 2 ein Blockschaltbild einer gesamten Anordnung
zur Verifikation,
Fig. 3 eine Anordnung zur Bestimmung der Teilbereiche
der Merkmale für ein System zur Sprecherer-
.
kennung,
Figo 4 eine andere Anordnung zur Bestimmung der Teilbereiche,
Fig. 5 ein Diagramm zur Erläuterung der Ermittlung der Bereichsgrenzen,
Fig. 6 eine Anordnung zum Einschreiben der Häufigkeitswerte in den Merkmalspeicher,
Fig. 7 eine Anordnung zur Bestimmung der Teilbereiche der Merkmale mit gleichzeitigem Einschreiben
in den Merkmalspeicher,
Fig. 8 eine Anordnung zur Ermittlung des Ähnlichkeits-Schwellwertes,
Fig. 9 eine Anordnung zum Verifizieren eines Signals.
In Fig. 1 sind drei verschiedene Diagramme a), b) und c) dargestellt, die jeweils die Häufigkeitsverteilung der Merkmalwerte für drei verschiedene Merkmale darstellen. Bei einem System zur Verifikation eines Sprechers können
diese drei Merkmale je ein Spektralbereich des Langzeitspektrums eines Sprachsignals darstellen, d.h. das Merkmal ist ein Frequenz-Spektralbereich, und der Wert des Merkmals ist die Gesamtenergie des Sprachsignals in dem betreffenden Spektralbereich. Die Ordinate, an der die Spektralenergie als Merkmalswert aufgetragen ist, ist hier der Übersichtlichkeit halber in gleiche Teilbereiche unterteilt, die jedoch nicht gleiche Wertabstände bedeuten müssen, d.h. die
030048/0194
13 PHD 79-056
Werte können in einem nichtlinearen Maßstab aufgetragen sein.
In allen drei Diagrammen hat jeder Teilbereich mindestens die Häufigkeit 1. Dies ist ein vorgegebener Anfangswert, der erhalten bleibt, wenn keines der Lernsignale einen Merkmalwert in dem betreffenden Teilbereich hat. Die angegebenen Häufigkeiten sind daher alle um diesen Anfangswert 1 größer als die tatsächliche Anzahl der Signale mit einem Merkmalswert in dem betreffenden Teilbereich. Aus den Diagrammen läßt sich daher ablesen, daß in dem dargestellten Beispiel 13 Lernsignale verwendet wurden. Die Anwendung eines Anfangswertes ungleich 0 beruht darauf, daß bei der Verifikation die Häufigkeiten der Teilbereiche, in die die Merkmalwerte des zu verifizierenden Signals fallen, miteinander multipliziert werden. Wenn nun bei dem zu verifizierenden Signal ein Merkmalwert in einen Teilbereich fällt, der bei den Lernsignalen nicht aufgetreten ist, würde bei der Multiplikation stets der Gesamtwert O herauskommen, unabhängig davon, welche Häufigkeitswerte aus den anderen Merkmalen als Faktor auftreten. Bei Verwendung eines Anfangswertes 1 kann beispielsweise, wenn bei den anderen Merkmalen die maximalen Häufigkeiten getroffen werden, der Gesamtwert möglicherweise die Schwelle noch überschreiten.
Aus den in Fig. 1 dargestellten Beispielen ist in Fig. 1 a) zu erkennen, daß eine merkliche Häufung in der Mitte der Teilbereiche auftritt, während im Diagramm b) eine ausgeprägte Bevorzugung bei hohen Werten auftritt, d.h. dieses Merkmal ist bei den Lernsignalen überwiegend mit hohen Werten aufgetreten. Im Diagramm c) ist dagegen eine wenig ausgeprägte Konzentration im mittleren Bereich zu erkennen, d.h. bei diesem Merkmal streuen die Merkmalwerte der Lernsignale sehr stark, und die maximale Häufigkeit ist am geringsten. Dieses Merkmal trägt für die Verifikation am wenigsten bei.
030048/0194
14 PHD 79-056
In Fig. 2 ist ein Blockschaltbild einer gesamten Anordnung zum Verifizieren dargestellt, die das Zusammenarbeiten der in den folgenden Figuren detaillierter dargestellten Teilanordnungen leichter verständlich machen soll. Über den Eingang 2 werden die Signale, und zwar die Lern-
signale sowie auch die zu verifizierenden Signale, dem Block 1 zugeführt, in dem die Werte der einzelnen Merkmale jedes Signals gewonnen werden. Außerdem werden die Merkmalwerte dabei quantisiert. Diese quantisierten Merkmalwerte werden der Einheit 3 zugeführt, die einen Merkmalspeicher enthält, der für jeden Teilbereich jedes Merkmals einen Speicherplatz für eine mehrstellige Zahl aufweist. Beim Zuführen eines quantisierten Merkmalwertes wird die bei dem betreffenden Teilbereich des Merkmals gespeicherte Häufigkeitszahl um 1 erhöht. Am Ende der Lernphase nach Abschluß der Auswertung einer vorgegebenen Anzahl von Lernsignalen werden die im Merkmalspeicher enthaltenen maximalen Häufigkeiten aller Merkmale einer Einheit 7 zugeführt, die eine Ähnlichkeits-Schwelle durch Multiplikation aller maximalen Häufigkeiten bestimmt.
Nun können zu verifizierende Signale zugeführt werden. Aus diesen werden in der Einheit 1 wieder in gleicher Weise wie vorher in der Lernphase die Merkmalwerte gewonnen und wieder der Einheit 3 mit dem Merkmalspeicher zugeführt. Dabei werden aber nun nicht die gespeicherten Häufigkeiten erhöht, sondern nur ausgelesen und einer Auswerteeinheit 5 zugeführt, die die Häufigkeitswerte multipliziert und mit der in der Einheit 7 bestimmten und von dieser zugeführten Ähnlichkeits-Schwelle verglichen. Sind die multiplizierten Häufigkeiten größer als die Ähnlichkeits-Schwelle, wird auf der Ausgangsleitung 8 ein "Erkannt"-Signal abgegeben. Zur Steuerung des Ablaufs der einzelnen Vorgänge sowie zum Umschalten von der Lernphase auf die Verifikation ist eine Ablaufsteuerung 9 vorgesehen, die Steuersignale an die Einheiten 1, 3, 5 und 7 abgibt und von diesem Rückmeldesigriale, insbesondere Ende-Signale empfängt. Diese Ablaufsteuerung kann in bekannter Weise einen Zähler mit Deco-
030048/0194
15 PHD 79-056
dierer enthalten«,
Die Fig. 3 stellt eine Teilanordnung zur Bestimmung der Merkmaliirerte von Sprachsignalen für ein System zur Verifikation von Sprechern dar. Das Sprachsignal wird von einem Mikrofon 11 aufgenommen und einer Filterbank 13 zugeführt, die das Sprachsignal in einzelne Frequenz-Spektralbereiche zerlegt und die Energie jedes Spektralbereichs über eine vorgegebene Zeit aufintegriert« Die integrierten Werte erscheinen an getrennten, jeweils einem anderen Spektralbereich zugeordneten Ausgängen, die mit einem Multiplexer 15 verbunden sind. Dieser Multiplexer wird von einem Taktsignal auf der Leitung 12 gesteuert und tastet innerhalb der vorgegebenen Integrationszeit der
Ί5 Filterbank nacheinander alle Ausgänge ab und verbindet sie jeweils mit einem Analog-Digital-Wandler 17. Jeweils nach dem Abtasten eines Ausgangs wird der betreffende Integrator in der Filterbank wieder auf 0 gesetzt.
Der Ausgang des Analog-Digital-Wandlers 17 ist über einen
20
Umschalter/mit dem einen Eingang eines Dualzahl-Addierers 19 verbunden, dessen Ausgangsleitung 16 mit dem Dateneingang eines Speichers 21 und dessen anderer Eingang mit dem Datenausgang dieses Speichers verbunden ist. Der Speieher 21 wird ebenfalls von dem Taktsignal auf der Leitung 12 gesteuert und enthält eine Anzahl Speicherplätze gleich der Anzahl Ausgänge der Filterbank 13, d.h. für jeden Spektralbereich einen Speicherplatz für eine mehrstellige Dualzahl. Durch das Taktsignal auf der Leitung 12 werden die Inhalte der Speicherplätze synchron mit der Abtastung der Filterbankausgänge durch den Multiplexer 15 dem Datenausgang und damit dem anderen Eingang des Addierers 19 zugeführt, so daß jeweils der aufintegrierte Wert eines Spektralbereichs zu der bis dahin bestimmten Zwischensumme dieses Spektralbereichs hinzuaddiert und über die Leitung 16 dem Speicher 21 wieder zugeführt wird. Der Speicher 21 kann daher ein mehrstufiges Schieberegister sein, bei dem der Inhalt mit jedem Taktsignal der Leitung 12 um eine
030-048/0184
2S20041
16 PHD 79-056
Stelle parallel verschoben und dabei der am Datenausgang stehende Wert gelöscht und der über die Leitung 16 dem Dateneingang zugeführte Wert neu eingeschrieben wird, oder der Speicher 21 adressiert zyklisch wiederholt nacheinander alle Speicherplätze, wobei nach dem Auslesen eines Speicherplatzes der dem Dateneingang zugeführte Wert in den gleichen Speicherplatz wieder eingeschrieben wird. Auf diese Weise entsteht im Speicher 21 das sogenannte Langzeitspektrum des Sprachsignals. Die Ausgangsleitung 16 des Addierers 19 ist außerdem mit einem Eingang eines Vergleichers 25 verbunden, dessen anderer Eingang mit dem Ausgang des Bereichsgrenzenspeichers 23 verbunden ist. Der Ausgang des Vergleichers 25 steuert eine Anordnung aus dem weiteren Addierer 27 und dem Zwischenspeicher 29, dessen Datenausgang über die Leitung 22 mit dem einen Eingang des Addierers 27 sowie mit dem Adressiereingang des Bereichsgrenzenspeichers 23 verbunden ist. Wenn der Wert der auf der Leitung 16 vorhandenen Dualzahl den Wert der aus dem Bereichsgrenzenspeicher ausgelesenen Dualzahl überschreitet, wird ein Umschalter 28 umgeschaltet, und der Addierer 27 addiert zu der aus dem Zwischenspeicher 29 ausgelesenen Zahl, die zu Beginn des Sprachsignals den Wert "0" hat, eine "1" hinzu und schreibt diesen erhöhten Wert wieder ein. Dies geschieht zyklisch nacheinander für alle Spektralbereiche. Wenn daher in dem nächsten Zyklus der nächste von der Filterbank 13 gelieferte Energiewert eines Spektralbereichs, der vorher gerade zu einer Erhöhung des zugehörigen Wertes in dem Speicher 29 geführt hatte, zu der im Speicher vorhandenen Zwischensumme dieses Spektralbereichs addiert wird, führt die Leitung 22 einen um 1 höheren Wert als vorher, so daß die nächste Bereichsgrenze aus dem Bereichsgrenzenspeicher 23 ausgelesen und dem Vergleicher 25 zugeführt wird. Auf diese Weise wird für alle Spektralbereiche getrennt gezählt, wie viele Bereichsgrenzen bereits überschritten sind, wodurch sich unmittelbar der tatsächliche Teilbereich des betreffenden Spektralbereichs am Ende des Sprachsignals ergibt.
030048/0194
17 PHD 79-056
Der Zwischenspeicher 29 kann in gleicher Weise aufgebaut sein wie der Speicher 21 und enthält für jeden Spektralbereich einen Speicherplatz, der eine Dualzahl aufnehmen muß, die maximal gleich der Anzahl der Teilbereiche des gesamten Wertebereiches der einzelnen Spektralbereiche ist. Der Zwischenspeicher 29 kann daher ein Schieberegister sein, dessen Takteingang die Taktsignale auf der Leitung 12 erhält und dabei jeweils seinen Inhalt parallel verschiebt und die vom Addierer 27 gelieferte Zahl neu einschreibt, oder ein Speicher mit wahlfreiem Zugriff, dessen Speicherplätze durch die Taktsignale auf der Leitung 12 zyklisch nacheinander adressiert werden. In diesem Falle kann auch der mit dem Umschalter 28 verbundene Eingang des Addierers 27 fest mit Signalen entsprechend der Zahl "1" verbunden sein, und der Vergleicher 25 steuert lediglich das Einschreiben des von dem Addierer 27 gelieferten Wertes, wenn die vom Addierer 19 auf der Leitung 16 gelieferte Zahl größer als die gerade adressierte Bereichsgrenze ist, während sonst der betreffende im Zwischen- speicher 29 vorhandene Wert lediglich nicht zerstörend ausgelesen und nicht überschrieben wird.
Es sei darauf hingewiesen, daß Leitungen, die Signale entsprechend Dualzahlen führen, wie insbesondere die Leitungen 16 und 22 sowie die Ausgangsleitungen des Analog-Digital -Wandlers 17, sowie der Speicher 21 und 23 tatsächlich aus mehreren einzelnen Verbindungen bestehen, auf denen die Dualzahlen parallel übertragen werden. Der Übersichtlichkeit halber sind in Fig. 3 sowie in den weiteren Figuren derartige Leitungen jedoch vereinfacht lediglich als eine Leitung bezeichnet.
Bei der Aufnahme des Sprachsignals über das Mikrofon 11 können, beispielsweise durch den Abstand des Sprechers vom Mikrofon beim Sprechen, absolute Lautstärkeunterschiede bei verschiedenen Sprachproben auftreten. Dadurch wäre es dann möglich, daß die einzelnen Spektralbereiche, die in verschiedenen Sprachsignalen relativ zueinander je-
030048/0194
weils im wesentlichen gleich sind, mit ihren Werten in verschiedene Teilbereiche fallen. Dadurch wird in der Lernphase die Häufigkeitsverteilung über die einzelnen Teilbereiche verbreitert, wodurch die Genauigkeit der Verifikation herabgesetzt wird, oder während der Testphase wird ein Sprecher aufgrund solcher absoluten Lautstärkeunterschiede fälschlicherweise nicht erkannt. Aus diesem Grunde wird an die Aufnahme jedes Sprachsignals ein Normierungsvorgang angeschlossen. Dafür ist die Ausgangsleitung 16 des Addierers 19 mit dem einen Eingang eines zusätzlichen Addierers 31 verbunden, dessen Ausgang auf einen Speicher 33 für eine vielsteilige Dualzahl führt, wobei der Ausgang dieses Speichers 33 mit dem anderen Eingang des Addierers 31 verbunden ist. Der Speicher 33 ist außerdem mit der Leitung 12 verbunden, so daß mit jedem Taktsignal der vom Addierer 31 gelieferte Wert eingeschrieben wird. Auf diese Weise enthält der Speicher 33 am Ende des Sprachsignals die Summe der Energien aller Spektralbereiche über das gesamte Sprachsignal. Diese Summe wird auch einem Vergleicher 35 zugeführt und dort mit einer fest eingestellten Konstanten C verglichen. Diese Konstante C ist empirisch anhand vieler Sprachproben so gewählt, daß sie von dem Wert der im Speicher 33 am Schluß des Sprachsignals enthaltenen Wert nicht erreicht wird.. Nun wird der Umschalter 20 in die Stellung b umgeschaltet und aus dem Speicher 21 die einzelnen Spektralwerte des Langzeitspektrums nacheinander ausgelesen. Diese Werte werden dem Addierer 19 einerseits wie während der Dauer des Sprachsignals direkt und andererseits über eine Dividieranordnung 39 und dem Umschalter 20 zugeführt. Deren Divisor wird zweckmäßig als ganze Potenz von
2 gewählt, z.B. 2 =16, so daß die Dividieranordnung 39 die aus dem Speicher 21 ausgelesenen Dualzahlen lediglich um die entsprechende Anzahl Stellen verschiebt. Dieser durch die Dividieranordnung 39 bestimmte Bruchteil wird zu dem betreffenden Spektralwert des Langzeitspektrums hinzuaddiert und wieder in den Speicher 21 eingeschrieben und auch'dem Addierer 31 zugeführt und zu dem Inhalt des Speichers 33 hinzuaddiert. Dies erfolgt nacheinander mit allen
030048/0194
19 292004lHD 79"056
Spektralwerten des im Speicher 21 enthaltenen Langzeitspektrums, und zwar zyklisch so oft wiederholt, bis am Ende eines solchen Zyklus der im Speicher 33 enthaltene Wert die Konstante C überschreitet. Sobald dies eintritt, gibt der Vergleicher 35 ein Signal auf der Ausgangsleitung 36 ab, das beispielsweise der Ablaufsteuerung 9 in Fig. 2 zugeführt wird und dieser signalisiert, daß die Normierung abgeschlossen ist. Da die Überschreitung der Konstanten allgemein bei einem Spektralbereich innerhalb des gesamten
lfi Spektrums erfolgen wird, müssen die restlichen Spektralwerte auch noch verarbeitet werden. Dabei wird die Konstante zwar mehr überschritten, jedoch stellt diese ohnehin nur einen ungefähren Grenzwert dar, und das Ausmaß der Überschreitung kann durch einen entsprechend großen Divisor der Dividieranordnung 39 klein gehalten werden. Allerdings steigt dadurch die Anzahl der Verarbeitungsschritte am Normiervorgang. Dabei ist zu berücksichtigen, daß der Bruchteil, der von der Dividieranordnung 39 an den Addierer 19 geliefert wird, mit fortschreitendem Normiervorgang absolut selbstverständlich größer wird, da die Werte des Langzeitspektrums wachsen, wenn die Dividieranordnung 39 nicht Speicher für die Anfangswerte beim Beginn der Normierung enthält.
Parallel zum Normiervorgang findet auch weiterhin der Vergleich mit den Bereichsgrenzen statt, denn für den Vergleicher 25 besteht kein Unterschied, ob die auf der Leitung erscheinende Dualzahl während der Verarbeitung eines Sprachsignals oder bei der Normierung entsteht. Wenn daher während der Normierung eine Bereichsgrenze überschritrten wird, wird auch dann für den betreffenden Spektralbereich die entsprechende Zahl im Speicher 29 um 1 erhöht. Damit enthält der Speicher 29 am Ende des Normiervorganges gerade die auf die Teilbereiche quantisierten Energiewerte der Spektralanteile des normierten Langzeitspektrums im Speicher 21, die dann dem Merkmalspeicher zugeführt werden können, wie später beschrieben wird.
030048/0194
ORIGINAL INSPECTED
Eine Anordnung für eine andere Möglichkeit der Bestimmung und Quantisierung der Merkmalwerte ist in Fig. 4 dargestellt. Diese Anordnung eignet sich besonders dann, wenn die Werte der einzelnen Merkmale nicht zeitlich nacheinander aufsummiert xirerden, kann jedoch auch anstelle der
oben beschriebenen Teilanordnung für ein System zur Verifizierung von Sprechern verwendet '»werden. Dabei sind die mit der Anordnung nach Fig. 3 übereinstimmenden Elemente mit gleichen Bezugszeichen versehen worden.
Zunächst wird davon ausgegangen, daß der Speicher 21 die Werte aller Merkmale eines Signals nacheinander gespeichert enthält. Der Speicher 21 wird hier ebenso wie der Bereichsgrenzenspeicher 23 und der Zwischenspeicher 29 als Speicher mit wahlfreiem Zugriff angenommen, die durch den Zähler 43 adressiert werden. Jeder Stellung des Zählers entspricht dann ein bestimmtes Merkmal, beispielsweise ein bestimmter Spektralbereich bei der vorher beschriebenen Verarbeitung eines Sprachsignals. Der Bereichsgrenzenspeieher 23 enthält hier für die einzelnen Merkmale bzw. Spektralbereiche unterschiedliche Bereichsgrenzen, wobei die einzelnen Bereichsgrenzen innerhalb eines Merkmals durch den Zähler 41 über einen weiteren Adresseneingang adressiert werden. Die beiden Adresseneingänge sind beispielsweise die höherwertigen bzw. die niedrigerwertigen Adresseneingangsleitungen üblicher Speicher.
Für die Erläuterung der Funktion wird zunächst angenommen, daß beide Zähler 41 und 43 in der Anfangsstellung stehen, was durch eine entsprechende, nicht dargestellte Rücksetzleitung bewirkt werden kann. Dadurch wird aus dem Speicher 21 der Wert des ersten Merkmals ausgelesen, und im Bereichsgrenzenspeicher 23 wird die obere Bereichsgrenze des ersten Merkmals ausgelesen, und beide Werte werden dem Vergleicher 25 zugeführt. Der Zähler 41 erhält nun über die Leitung 12 einen Taktpuls, der den Zähler weiterschaltet, so daß nacheinander die Bereichsgrenzen des ersten Merkmals ausgelesen und dem Vergleicher 25 zugeführt werden,
030048/0194
21 292004 fm 79-056
während der Speicher 21 weiterhin den Wert des ersten Merkmals am Ausgang abgibt. Sobald nun eine Bereichsgrenze aus dem Speicher 23 ausgelesen wird, der größer ist als der vom Speicher 21 gelieferte Merkmalwert, gibt der Vergleicher 25 ein Ausgangssignal ab, das die Stellung des Zählers
41, die dem Dateneingang des Speichers 29 zugeführt wird, in dessen vom Zähler 43 adressierten ersten Speicherplatz einschreibt, und außerdem wird der Zähler 41 auf die Anfangsstellung zurückgesetzt und der Zähler 43 um eine Stellung weitergeschaltet, und zwar gegebenenfalls verzögert, falls dies für das sichere Einschreiben des Speichers 29 notwendig ist.
Nun wird aus dem Speicher 21 der Wert des zweiten Merkmals ausgelesen, und im Bereichsgrenzenspeicher 23 werden die Bereichsgrenzen des zweiten Merkmals adressiert und über den wieder hochzählenden Zähler 41 nacheinander ausgelesen und dem Vergleicher 25 zugeführt, bis wieder eine Bereichsgrenze größer als der Merkmalwert auftritt. Dabei wird dann in den zweiten Speicherplatz des Speichers 29 die Zählerstellung des Zählers 41 eingeschrieben, usw. bis der Zähler 43 alle Stellungen durchlaufen hat und alle Merkmale mit den zugehörigen Bereichsgrenzen verglichen worden sind. Damit enthält der Speicher 29 für Jedes Merkmal die Nummer des Teilbereichs, in die der betreffende Merkmalwert gefallen ist.
Die Bereichsgrenzen der Teilbereiche der einzelnen Merkmale können auf verschiedene Weise festgelegt werden, beispielsweise durch gleichmäßige Unterteilung des gesamten Wertebereichs oder durch eine logarithmische Einteilung. Zweckmäßig ist es jedoch, wenn die Bereichsgrenzen so gewählt werden, daß jeder Teilbereich etwa gleich häufig auftritt.
Dazu werden viele Signale analysiert, beispielsweise beim System zur Verifikation von Sprechern jeweils mehrere Sprachsignale vieler Sprecher, und für jedes Merkmal bzw. jeden Spektralbereich wird die Häufigkeit des
030048/0194
Auftretens der einzelnen Energiewerte aufgetragen. Ein Beispiel für eine solche Kurve ist in Fig. 5 dargestellt. Die Fläche unter der Kurve wird nun in derartige Abschnitte eingeteilt, daß die einzelnen Teilflächen gleich groß sind. In Fig. 5 ist eine Einteilung in acht gleiche Flächen vorge-
nommen. Die Trennlinien zwischen den Teilflächen bestimmen dann die Bereichsgrenzen der Teilbereiche. Da die Häufigkeitsverteilung der Energiewerte der einzelnen Merkmale bei verschiedenen Merkmalen allgemein unterschiedlich sein wird, jo ergeben sich auch für verschiedene Merkmale unterschiedlich-Teilbereiche bzw. Bereichsgrenzen. Diese Bereichsgrenzen sind für die weitere Verwendung des Systems dann konstant, so daß der Bereichsgrenzenspeicher 23 ein Festwertspeicher sein kann.
In Fig. 6 ist eine Anordnung angegeben, mit der die im Zwischenspeicher 29 enthaltenen Nummern der Teilbereiche, in die die Merkmalwerte des untersuchten Signals gefallen sind, für die Aufsummierung der Häufigkeiten in den einzelnen Teilbereichen verwendet werden können. Diese Häufigkeiten werden in dem Merkmalspeicher 51 gespeichert, der für jedes Merkmal und jeden Teilbereich einen Speicherplatz für eine mehrstellige Dualzahl aufweist. Die Auswahl der Speicherplätze jeweils eines Merkmals erfolgt durch Adressierung aus dem Zähler 53, der auch den Zwischenspeicher 29 adressiert. Die Auswahl der Speicherplätze für die Teilbereiche innerhalb eines Merkmals erfolgt über die Leitung 22 aus dem Zwischenspeicher 29. Diese Adressierung kann wie bei der Adressierung des Bereichsgrenzenspeichers 23 in Fig. 4 als getrennte Adressierung von Reihen und Spalten eines entsprechend matrixförmig aufgeteilten Speichers angesehen werden, wobei die gesamten Adresseneingangsleitungen des Speichers in niedrigwertige und höherwertige Adressenleitungen aufgeteilt und mit der Leitung 22 bzw. dem Ausgang des Zählers 53 verbunden werden. Für die Funktion wird wieder zunächst angenommen, daß der Merkmalspeicher '51 vor dem ersten Signal überall "1" enthält. Der Zähler ist in der Anfangsstellung, so daß im Merkmal-
030048/0194
PHD 79-056
speicher 51 die Teilbereiche des ersten Merkmals adressiert und aus dem Zwischenspeicher 29 die Nummer des Teilbereichs des ersten Merkmals ausgelesen und über die Leitung 22 ü~m einen Adresseneingang des Merkmalspeicher 51 zugeführt wird,
g wodurch der Speicherplatz für den betreffenden Teilbereich des ersten Merkmals adressiert wird. Der Inhalt dieses Speicherplatzes wird ausgelesen und einem Addierer 55 zugeführt, dessen anderer Eingang fest den Wert "1" erhält Am Ausgang des Addierers 55 erscheint also der um 1 erhob l:e Inhalt des adressierten Speicherplatzes, der in diesen <x· ter Löschung des alten Inhalts eingeschrieben wird. Damit ist die Häufigkeit dieses Teilbereichs um 1 erhöht worden,
Durch ein Taktsignal auf der Leitung 12 wird der Zähler 53' um eine Stellung weitergeschaltet, so daß im Zwischenspeicher 29 und im Merkmalspeicher 51 die Speicherplätze für das nächste Merkmal .adressiert werden, und über die Leitung 22 wird dann wieder der Teilbereich dieses Merkmals ausgewählt und über den Addierer 55 um 1 erhöht, usw. bis alle Merkmale verarbeitet sind. Damit sind die Merkmalwerte eines zugeführten Signals bei den gespeicherten Häufigkeiten der Teilbereiche berücksichtigt, und das nächste Signal kann zugeführt werden. Die Elemente 56 bis 59 werden später erläutert.
Eine Anordnung zu einer anderen Art, um die Häufigkeiten der einzelnen Teilbereiche der Merkmalwerte von Signalen zu bestimmen, ist in Fig. 7 dargestellt, wobei kein Zwischenspeicher vorgesehen ist. Die Anordnung nach Fig. 7 entspricht zu einem gewissen Grade einer Kombination der Anordnungen nach Fig. 4 und Fig. 6, und gleiche Elemente sind auch mit gleichen Bezugszeichen versehen. Auch bei der Anordnung nach Fig. 7 wird wieder davon ausgegangen, daß der Speicher 21 die Werte aller Merkmale eines zugeführten Signals enthält. Diese Merkmalwerte können beispielsweise im Falle von Sprachsignalen mit der in der oberen Hälfte der Fig. 3 dargestellten Teilanordnung erzeugt werden. Sowohl für diesen Speicher 21 wie auch für den Bereichsgrenzenspeicher 23 und den Merkmalspeicher
030048/019Ä
ist zur gemeinsamen Adressierung ein Zähler 53 vorgesehen. Dieser Zähler adressiert sowohl im Bereichsgrenzenspeicher 23 wie auch im Merkmalspeicher 51 wieder die Speicherplätze für alle Teilbereiche jeweils eines Merkmals. Weitere ς Adresseneingänge dieser Speicher zur Adressierung des Teilbereichs innerhalb eines Merkmals sind mit dem Ausgang des Zählers 41 verbunden, der über die Leitung 12 einen Taktpuls als Zähltakt erhält=,
Zu Beginn stehen beide Zähler 41 und 53 in der Anfangsstellung, so daß in allen Speichern die Speicherplätze für das erste Merkmal bzw. für den ersten Teilbereich darin adressiert werden. Aus dem Speicher 21 wird dann der Wert des ersten Merkmals und aus dem Bereichsgrenzenspeicher 23 die erste und mit den folgenden Taktsignalen auf der Leitung 12 die folgenden Bereichsgrenzen dem Vergleicher zugeführt. Sobald eine Bereichsgrenze auftritt, die größer als der Merkmalv/ert aus dem Speicher 21 ist, wird der Inhalt der dann durch die Zähler 41 und 53 adressierten Speicherzelle des Merkmalspeichers 51 ausgelesen und dem Addierer 55 zugeführt, der diesen Wert am Ausgang um "1" erhöht.wieder abgibt und dem Dateneingang des Merkmalspeicher 51 zuführt, wo dieser erhöhte Wert in den ursprünglichen Speicherplatz wieder eingeschrieben wird.
Ferner wird durch das Ausgangssignal des Vergleichers 25, das in der Verzögerungsanordnung 57 um eine Zeit ausreichend für den Lese/Schreibvorgang im Merkmalspeicher 51 verzögert wird, der Zähler 41 über den Rücksetzeingang R in die Anfangsstellung gesetzt und der Zähler 53 um eine Stellung weitergeschaltet. In dieser Weise werden nacheinander alle Merkmale verarbeitet.
Nach Verarbeitung einer Anzahl Signale einer Klasse, beispielsweise einer Anzahl Sprachmuster eines Sprechers, in der Lernphase muß am Schluß der Ähnlichkeits-Schwellwert für den späteren Verifikationsvorgang bestimmt werden. Hierfür kann die in Fig. 8 dargestellte Anordnung verwendet werden. Darin ist wieder der Merkmalspeicher 51 sowie
Ü30048/019A
25 292004T79-056
der Zähler 53 vorhanden, der die Speicherplätze für die Teilbereiche jeweils eines Merkmals adressiert. Die Teilbereiche innerhalb der Merkmale werden durch den Zähler adressiert, sofern hierfür nicht der in Fig. 7 angegebene
Zähler 41 verwendet werden kann. Auch hier wird wieder ans
genommen, daß die Zähler 53 und 81 zunächst in der Anfangsstellung stehen. Durch Taktimpulse auf der Leitung 12 wird der Zähler 81 nacheinander durch alle Stellungen geschaltet f und dabei werden die im Merkmalspeieher 51 gespeicherten Häufigkeiten aller Teilbereiche des ersten Merkmals nacheinander am Ausgang abgegeben und einem Vergleicher 83 sowie einem Register 85 zugeführt. Der andere Eingang des Vergleichers 83 ist mit dem Ausgang des Registers 85 verbunden. Der Ausgang des Vergleichers 83 steuert die Übernähme eines Wertes in das Register jeweils dann, wenn der vom Merkmalspeicher 51 gelieferte Wert größer als der im Register 85 enthaltene Wert ist. Dadurch enthält das Register 85 nach einem Durchgang des Zählers 81, wenn also die Häufigkeiten aller Teilbereiche eines Merkmals am Ausgang des Merkmalspeichers 51 erschienen sind, die höchste aufgetretene Häufigkeit. Dieser Wert wird dem einen Eingang eines Multiplizierers 87 zugeführt, dessen anderer Eingang mit dem Ausgang eines Speichers 89 und dessen Ausgang mit dem Dateneingang des Speichers 89 verbunden ist. Der Speieher 89 enthält zu Beginn der Schwellwertbestimmung den Wert 1.
Wenn der Zähler 81 einen Durchgang vollendet hat, gibt er am Ausgang Ü ein Signal ab, daß das Ausgangssignal des MuI-tiplizierers 87 in den Speicher 89 einschreibt sowie das Register 85 auf O setzt und den Zähler 53 um eine Stellung weiterschaltet. Nun werden durch den Zähler 81 nacheinander die Speicherplätze für die Teilbereiche des zweiten Merkmals adressiert, und am Ende enthält das Register 85 die in diesem zweiten Merkmal aufgetretene maximale Häufigkeit, die mit der ersten, im Speicher 89 gespeicherten Häufigkeit multipliziert und im Speicher 89 abgespeichert wird. Dies geschieht nacheinander mit allen Merkmalen,
030048/0194
26 292004fHD 79'056
so daß zum Schluß der Speicher 89 das Produkt der Häufigkeiten aller Merkmale enthält.
Da während der Testphase dieses Produkt der maximalen Häufigkeiten praktisch nie erreicht werden kann, da das/verifizierende Signal fast immer von den während der Lernphase verwendeten Signalen abweicht, muß der Ähnlichkeits-Sch-ell wert noch mit einer Zahl kleiner 1 multipliziert werdeij Dafür kann der mit dem Ausgang des Registers 85 verbundene Eingang des Multiplizierers 87 abgeschaltet und auf ein^- festen oder von den Signalen während der Lernphase abhängigen Wert umgeschaltet werden, und danach erhält der .cpei eher 89 nochmals einen Übernahmetakt, so daß darin sch"'..* '3~ lieh der entgültige Ähnlichkeits-Schwellwert enthalten ist, der für die folgende Verifikation verwendet wird.
Wenn der Ausgang des Registers 85 außer mit dem Vergleicher 83 außerdem mit dem Eingang einer Logarithmieranordnung verbunden ist, kann der Multiplizierer 87 durch einen Addierer ersetzt werden, dessen einer Eingang mit dem Ausgang der Logarithmieranordnung verbunden wird. Dies kann vorteilhaft sein, da ein Addierer wesentlich einfacher aufgebaut ist und schneller arbeitet als ein Multiplizierer, während die Logarithmieranordnung nur relativ wenig Aufwand und Zeitbedarf erfordert. Der Speicher 89, der in diesem Falle den Anfangswert O oder noch besser einen Anfangswert enthält, der dem Logarithmus der Zahl entspricht, mit der das Produkt der maximalen Häufigkeiten zur Bestimmung der Ähnlichkeits-Schwelle multipliziert wird, enthält dann am
3Q Ende der Schwellwertbestimmung unmittelbar den Logarithmus des Ähnlichkeits-Schwellwertes. Dieser am Ausgang des Speichers 89 vorhandene Schwellwert bzw. dessen Logarithmus wird über die Leitung 88 der Anordnung zum Verifizieren eines Signals zugeführt.
Eine derartige Anordnung ist in Fig. 9 dargestellt. Diese enthält wieder den Merkmalspeicher 51 und den Zähler 53, der die Speicherplätze aller Teilbereiche jeweils eines
030048/0194
2 7 AAÄAA.Λ ?HD 79-056
Merkmals im Speicher 51 adressiert- Die Speicherplätze eines bestimmten Teilbereichs werden durch den Inhalt des Speicherplatzes des Zwischenspeichers 29 ausgexrählt, der ebenfalls von dem Zähler 53 adressiert wird. Dieser Speieher 29 enthält wieder die Nummern der Teilbereiche, in die die Merkmalwerte des zu verifizierenden Signals gefallen sind. Durch den Zähler 53? der durch Taktimpulse auf der Leitung 12 weitergeschaltet wirds wird somit nacheinander die im Merkmalspeicher 51 gespeicherte Häufigkeit jeweils eines Teilbereichs jedes Merkmals ausgelesen und einer Logarithmieranordnung 91 zugeführt. Deren Ausgang ist mit dem einen Eingang eines Addierers 93 verbunden, dessen anderer Eingang mit dem Ausgang eines Speichers 95 und dessen Ausgang mit dem Dateneingang dieses Speichers 95 verbunden ist. Ferner erhält der Speicher 95 die Taktimpulse auf der Leitung 12 als Übernahmetakt. Dadurch werden im Speicher 95 die Logarithmen aller aus dem Merkmalspeicher 51 ausgelesenen Häufigkeiten summiert, so daß nach einem vollen Durchlauf des Zählers 53, wenn alle Merkmale abgearbeitet sind, der Speicher 95 schließlich den Logarithmus des Produkts der ausgelesenen Häufigkeiten enthält. Hier ist also die bei der Beschreibung der Fig. angedeutete Realisierung der Multiplikation der Häufigkeiten durch Summation der Logarithmen durchgeführt. Statt dessen kann selbstverständlich auch der Logarithmierer 91 weggelassen und der Addierer 93 durch einen Multiplizierer ersetzt werden.
Das im Speicher 95 schließlich erhaltene Ergebnis wird dem einen Eingang eines Vergleichers 97 zugeführt, dessen anderer Eingang über die Leitung 88 den Ähnlichkeits-Schwellwert bzw. dessen Logarithmus aus der in Fig. 8 dargestellten Anordnung erhält. Das Signal auf der Ausgangsleitung des Vergleichers 97 gibt dann an, ob der im Speicher 95 erhaltene Wert größer ist als der Ähnlichkeits-Schwellwert auf der Leitung 88, was eine erfolgreiche Verifikation anzeigt, oder ob dies nicht der Fall ist.Das Signal auf der Leitung 8 kann gewünschtenfalls durch ein Übertragssignal
030048/0194
28 2920OfP79-056
aus dem Zähler 53 ausgewertet werden, das angibt, daß die Verifikation beendet ist.
Bisher wurde nur die Verifikation von Signalen einer Klasse bzw. von Sprachsignalen eines Sprechers beschrieben. In gleicher Weise ist auch die Verifikation beispielsweise verschiedener Sprecher möglich. Dafür muß dann der Merkmalspeicher 51 entsprechend erweitert werden, so daß er die Häufigkeitswerte aller Teilbereiche aller Merkmal von verschiedenen Sprechern getrennt speichert, und außerdem muß der Merkmalspeieher 51 weitere Adresseneingänge aufweiten, über die beispielsweise mittels einer eingegebenen Sprechernummer der diesem Sprecher zugeordnete Bereich im Speicher ausgewählt wird, und zwar sowohl während der Lernphase wie auch in der Testphase.
Der Ähnlichkeits-Schwellwert, der beispielsweise nach Fig.8 gewonnen werden kann, wird zweckmäßig für jeden Sprecher bzw. jede Klasse getrennt erzeugt, da die Häufigkeitsverteilungen in den einzelnen Klassen sehr unterschiedlich sein können. Um zu vermeiden, daß der Ähnlichkeits-Schwellwert jeweils vor jedem Verifiziervorgang erneut bestimmt werden muß, werden die Ähnlichkeits-Schwellwerte für alle Klassen am Ende der Lernphase bestimmt und dann zwischengespeichert. Diese Zwischenspeicherung muß ebenfalls durch Adressierung mittels der Klassen- bzw. Sprechernummer erfolgen. Für diesen Speicher kann auch der Merkmalspeicher 51 verwendet werden, so daß der Ähnlichkeits-Schwellwert im Anschluß an die Häufigkeitswerte der Teilbereiche des letzten Merkmals der betreffenden Klasse bzw. des Sprechers gespeichert wird.
Wenn die Anordnung für die Verifikation vieler Sprecher geeignet sein soll, wie es beispielsweise als Identitätsnachweis im Bankwesen erforderlich sein könnte, wird für den Merkmalspeicher 51 eine sehr große Kapazität erforderlich. Es kann daher zweckmäßig sein, die während der Lernphase gewonnenen Häufigkeitswerte im Speicher 51 der Anord-
030048/0184
nung nach Fig. 6 bzw. Fig. 7 einschließlich des Ähnlichkeits-Schwellwertes auszugeben und auf ein Speichermediuni aufzuzeichnen, beispielsweise auf den Magnetstreifan einer entsprechenden persönlichen Ausweiskarte. In diesem Falle müssen wegen der begrenzten Speicherkapazität auf dem Magnetstreifen die Häufigkeitswerte kodiert gespeichert werden, beispielsweise mittels einer Differenz-Kodierung. Dann wird vor bzw. während der Abgabe einer Sprachprobe diese Ausweiskarte abgetastet und der Inhalt dekodiert und in den Speicher 51 eingeschrieben, so daß am Ende der Sprachprobe die entsprechenden Häufigkeitswerte der dieser Sprachprobe entsprechenden Teilbereiche verarbeitet werden können. Dadurch ist die Anzahl der Sprecher, die auf diese Weise verifiziert werden können, praktisch unbegrenzt. Es kann auch eine Ausweiskarte mit einem darin eingebauten Halbleiterspeicher auf einer einzigen Halbleiterscheibe verwendet werden. Ein solcher Speicher weist eine höhere Speicherkapazität auf, so daß dann keine Kodierung der Häufigkeitswerte notwendig ist. In diesem Falle kann nicht nur der Speicher für die Zwischenspeicherung der Häufigkeitswerte, sondern die gesamte Anordnung, zumindestens von dem Analog-Digital-Wandler 17 in Fig. 3 an, auf einer Halbleiterscheibe integriert und in die Ausweiskarte eingebaut werden. In diesem Falle ist eine Fälschung der Daten auf der Ausweiskarte, d.h. das Aufbringen der Häufigkeitswerte eines nachzuahmenden, jedoch nicht zur Verfügung stehenden Sprechers, nicht möglich. Bei Anwendung eines Zwischenspeichers wie der Ausweiskarte kann die Lernphase über einen längeren Zeitraum erstreckt werden, um unterschiedliche körperliche Zustände und Stimmungen bei Abgabe der Sprachprobe zu erfassen. Jeweils vor Abgabe einer neuen Sprachprobe werden die alten Werte in den Merkmalspeieher 51 eingelesen und entsprechend ergänzt. Ein solcher Vorgang kann auch an jede erfolgreiche Verifikation angeschlossen werden, wobei das zu verifizierende Signal dann erneut als Lernsignal verarbeitet wird und in gleicher Weise wie bei den vorhergehenden Lernsignalen die entsprechenden Häufigkeitswerte im Merkmalspeicher 51 erhöht. Bei Verwendung des Zwischenspei-
030048/0194
chers 29 wie in der Anordnung nach Fig. 6 können die darin enthaltenen Werte unmittelbar zum Nachlernen verwendet werden.
Eine Schv/ierigkeit bei diesem Nachlernen kann dadurch auf-
treten, daß die Kapazität der einzelnen Speicherplätze des Merkmalspeichers 51, d.h. die Länge der darin .speicherbaren Dualzahlen, begrenzt ist. In der Lernphase kann die Anzahl der Lernmuster gleich dem maximalen Wert der speicherbaren Dualzahl oder wenig größer gewählt werden, so daß die maximal auftretende Häufigkeit in einem Teilmerkmal nie größer ist als der maximale Wert der speicherbaren Dualzahl. Diese Häufigkeit kann beim oben beschriebenen Nachlernen durch erfolgreich verifizierte Signale bzw. Sprachproben jedoch überschritten werden. Um dies zu berücksichtigen, ist in Fig. 6 der Ausgang des Addierers 55 mit dem einen Eingang eines Vergleichers 57 verbunden, der am anderen Eingang den maximalen Wert M der speicherbaren Dualzahl erhält. Sobald am Ausgang des Addierers 55 dieser maximale Wert auftritt, wird dieser zwar noch im Merkmalspeicher 51 wieder eingeschrieben, jedoch erzeugt außerdem der Vergleicher 57 ein Aus gangs signal auf der Leitung 59, das der übergeordneten Ablaufsteuerung, beispielsweise der Steueranordnung 9 in Fig. 2, zugeführt wird. Diese schaltet daraufhin am Ende der Verarbeitung des gesamten Signals den Umschalter 58 in die entgegengesetzte Stellung um, so daß der Dateneingang des Speichers 51 mit dem Ausgang einer Dividieranordnung 56 verbunden ist, deren Eingang mit dem Ausgang des Speichers 51 verbunden ist. Diese Dividieranordnung 56 bewirkt im einfachsten Falle eine Stellenverschiebung um eine Stelle und damit eine Division durch die Zahl 2. Gleichzeitig werden nacheinander durch Ansteuerung des Zählers 53 sowie eines weiteren, mit dem anderen Adresseneingang verbundenen Zählers, beispielsweise der Zähler 41 in Fig. 7, nacheinander die Häufigkeiten aller Teilbereiche aller Merkmale ausgelesen, in der Divi,dieranordnung 56 durch eine vorgegebene Zahl, beispielsweise wie vorstehend angedeutet die Zahl 2, dividiert und
030043/0194
an dem ursprünglichen Speicherplatz wieder eingeschrieben. Dadurch sind alle Häufigkeitswerte proportional um den gleichen Faktor verkleinert worden. Außerdem muß anschließend der Ähnlichkeits-Schwellwert neu bestimmt werden. Nun können erneut Signale bzw. Sprachproben zum Nachlernen verarbeitet werden, bis wieder in einem Merkmal der maximale Häufigkeitswert erreicht wird. Dadurch gehen die zuletzt verwendeten Lernsignale mit einem größeren Gewicht ein, oder anders ausgedrückt die zuerst verwendeten Lernsignale verlieren mit jedem Divisionsvorgang an Einfluß, jedoch ist dies insbesondere bei Sprachproben ein durchaus erwünschter Effekt, da auf diese Weise alterungsbedingte Änderungen der Stimme besonders gut erfaßt werden.
Die beschriebenen Anordnungen stellen nur beispielsweise Ausführungen für das erfindungsgemäße Verfahren dar. Insbesondere können einige oder alle Speicher, Zähler» Vergleicher und Addierer An jeweils ein Element zusammengefasst werden, dessen Eingänge entsprechend umgeschaltet werden. Insbesondere kann eine Realisierung des Verfahrens in Anlehnung an die beschriebenen Ausführüngsbeispiele durch einen fest programmierten Mikroprozessor zweckmäßig sein.
030048/0194
-3Ä-
Leerseite

Claims (1)

  1. Philips Patentvemraltung Gmbl·, G'.ei;id^:.r: 94, 200 ~) Hamburg
    PATENTANSPRÜCHE PHD 79-056
    1· Verfahren zum Verifizieren von Signalen mit mehreren
    mit
    Merkmalen, die/variablen Werten auftreten, indem zunächst in einer Lernphase eine Anzahl Signale zugeführt und für jedes Signal getrennt die Werte der Merkmale gewonnen und daraus abgeleitete Merkmalgrößen gespeichert werden und in einer folgenden Testphase aus einem zu verifizierenden Signal in gleicher Weise wie in der Lernphase die Werte der Merkmale gewonnen und durch Bezugnahme auf die gespeicherten Merkmalgrößen ein Gesamtwert abgeleitet wird, der mit einem Ähnlichkeit s-Schwellwert verglichen wird, bei dessen Überschreitung eine erfolgreiche Verifikation angezeigt wird, dadurch gekennzeichnet, daß während der Lernphase für jeden Teilbereich der in aneinandergrenzende Teilbereiche unterteilten Wertebereiche der Merkmale die Anzahl der Signale, deren Wert des betreffenden Merkmals in diesen Teilbereich fällt, getrennt aufsummiert und dieser Häufigkeitswert als abgeleitete Merkmalgröße gespeichert wird, und daß während der TSatphase der Gesamtwert durch Multiplikation der gespeicherten Häufigkeitswerte derjenigen Teilbereiche, in die die Werte der Merkmale des zu verifizierenden Signals fallen, erzeugt wird.
    030048/0194
    2 PHD 79-056
    2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß die Wertebereiche mindestens einiger Merkmale in unterschiedliche Teilbereiche unterteilt sind.
    3. Verfahren nach Anspruch 2, dadurch gekennzeichnet, daß die Anzahl der Teilbereiche für alle Merkmale gleich ist.
    4. Verfahren nach Anspruch 1 oder einem der folgenden, dadurch gekennzeichnet, daß zur Normierung eines zugeführten Signals zu dem Wert Jedes Merkmals ein vorbestimmter Bruchteil dieses Wertes so oft hinzuaddiert wird, bis ein aus den so entstandenen Werten abgeleiteter Gesamtsignalwert eine vorgegebene Gesamt signal schwelle überschreitet.
    5. Verfahren nach Anspruch A, dadurch gekennzeichnet, daß der Gesamtsignalwert durch Summieren der Werte der Merkmale abgeleitet wird.
    6. Verfahren nach Anspruch 1 oder einem der folgenden, dadurch gekennzeichnet, daß während der Testphase die Multiplikation der gespeicherten Häufigkeitswerte durch die Addition der logarithmierten Häufigkeitswerte ersetzt ist.
    7. Verfahren nach Anspruch 1 oder einem der folgenden, dadurch gekennzeichnet, daß nach der Lernphase der Ähnlichkeits-Schwellwert aus der Multiplikation der maximalen Häufigkeitswerte der einzelnen Merkmale ge-
    bildet wird.
    8. Verfahren nach Anspruch 1 oder einem der folgenden, dadurch gekennzeichnet, daß nach einer erfolgreichen Verifikation eine erneute Lernphase angeschlossen wird, in der die Häufigkeitswerte derjenigen Teilbereiche, in die die Werte der Merkmale des zu verifizierenden Signals gefallen sind, um 1 erhöht wer-
    030048/0184
    3 PHD 79-056
    den.
    9» Verfahren nach Anspruch 8, dadurch gekennzeichnet, daß "beim Überschreiten eines Häufigkeitswertes über einen vorgegebenen Wert alle Häufigkeitswerte durch einen konstanten Divisor geteilt werden,,
    10. Verfahren nach Anspruch 1 oder einem der folgenden,, dadurch gekennzeichnet, daß das Signal ein Sprachsignal begrenzter Dauer und die Merkmale aneinandergrenzende Frequenz-Spektralbereiche sinds wobei die Energie des Sprachsignals in aufeinanderfolgenden gleichen Zeitabschnitten je Spektralbereich getrennt integriert und die einzelnen Integrale getrennt über das gesarate Sprachsignal aufsummiert werden und die Spektralsummen die Werte der Merkmale darstellen.
    11» Verfahren nach Anspruch 10„ dadurch gekennzeichnet, daß zur Feststellung der Teilbereiche, in die die einzelnen Spektralsummen fallen, !fahrend der Dauer des Sprachsignals für jeden Speietralbereich nach jeder Aufsummierung eines weiteren Integrals die dabei entstandene Teilsumme mit der oberen Grenze eines Teilbereichs verglichen wird- und daß der Inhalt eines dem betreffenden Spektralbereich zugeordneten Zwischenspeicherplatzes um 1 erhöht wird, wenn die Teilsumme die Grenze überschreitet, und danach der Vergleich mit der oberen Grenze des nächsthöheren Teilbereiches durchgeführt wird.
    12. Verfahren nach Anspruch 11, dadurch gekeimzeichnet, daß die Verfahrensschr-itte auch während der Normierung nach Anspruch 4 oder 5 durchgeführt werden.
    13. Verfahren nach einem der Ansprüche 10 bis 12, dadurch gekennzeichnet, daß die während der Lernphase gewonnenen Häufigkeitswerte auf einem Datenträger
    030048/0194
    4 PHD 79-056
    gespeichert sind und zum Verifizieren vor bzw. während der Zufuhr des zu verifizierenden Sprachsignals automatisch eingelesen und gespeichert werden.
    Anordnung zur Durchführung des Verfahrens nach Anspruch 1 oder einem der folgenden, dadurch gekennzeichnet, daß ein Merkmalspeicher (51) mit je einem Speicherplatz für jeden Teilbereich jedes Merkmals
    .j0 vorgesehen ist, daß eine erste Adressieranordnung (53), die die Speicherplätze aller Teilbereiche jeweils eines Merkmals adressiert, und eine zweite Adressieranordnung (29; 41 ) vorgesehen ist, die jeweils einen Teilbereich adressiert, daß ein Bereichsgrenzenspeicher (23) vorgesehen ist, der mindestens von der zweiten Adressieranordnung angesteuert ist, daß eine Vergleichsanordnung (25) vorgesehen ist, die die Werte der Merkmale mit einer entsprechenden aus dem Bereichsgrenzenspeicher
    (23) ausgelesenen Bereichsgrenze vergleicht und bei einem Wert kleiner als die verglichene Bereichsgrenze, aber größer als die Bereichsgrenze des vorhergehenden Teilbereichs, ein Signal abgibt, das den gleichzeitig mit dem Bereichsgrenzenspeieher adressierten Speicherplatz des Merkmalspeichers (51) ausliest und während der Lernphase den ausgelesenen Inhalt in einem Häufigkeitsaddierer (55) um 1 erhöht und in den gleichen Speicherplatz wieder einschreibt und während der Testphase einer Verarbeitungseinheit (91, 93, 95) zuführt, die diesen Inhalt mit den Inhalten der bei den anderen Merkmalen ausgelesenen Speicherplätzen multipliziert und einem Ähnlichkeitsvergleicher (97) zuführt, dessen anderer Eingang den A'hnlichkeits-Schwellwert erhält und dessen Ausgang (98) das Verifizierungsergebnis liefert.
    030048/0194
    29200A1
    5 PHD 79-056
    15. Anordnung nach Anspruch 14 zur Durchführung des Verfahrens nach Anspruch 10, wobei das von einem Mikrofon erzeugte elektrische Sprachsignal eine Filterbank durchläuft, die das Sprachsignal in eine Anzahl Frequenz-Spektralbereiche aufteilt
    und die Energie in den einzelnen Spektralbereichen getrennt während aufeinanderfolgender gleich langer Zeitabschnitte integriert und die integrierten Signale einem Akkumulator aus einem Spektralwert-Addierer und einem Langzeitspektrum-Speicher mit einem eigenen Speicherplatz für jeden Spektralbereich zugeführt werden, der die integrierten Signale je Spektralbereich summiert, dadurch gekennzeichnet, daß die Vergleichsanordnung (25) die vom Spektralwert-Addierer (19) erzeugte Zwischensumme jedes Spektralbereichs erhält und mit der aus dem Bereichsgrenzenspeicher (23) ausgelesenen Bereichsgrenze vergleicht, daß die zweite Adressieranordnung einen Zwischen-Speicher (29) mit einem eigenen Speicherplatz je Spektralbereich umfasst, der von der ersten Adressieranordnung (53) adressiert wird und dessen ausgelesener Inhalt über einen weiteren Addierer (27) um eine Einheit erhöht wird, wenn die Vergleichsanordnung (25) anzeigt, daß die Zwischensumme größer als die ausgelesene Bereichsgrenze ist, und danach wieder in den Zwischenspeicher (29) eingeschrieben wird, und daß der Ausgang des Zwischenspeichers die Adressen der zweiten Adressieranordnung liefert.
    16. Anordnung nach Anspruch 15, dadurch gekennzeichnet, daß der Bereichsgrenzenspeicher (29) für jedes Merkmal und für jeden Teilbereich einen eigenen Bereichsgrenzenwert enthält und daß auch die erste Adressieranordnung (53) den Bereichsgrenzenspeicher (29) adressiert.
    030048/0194
    6 PHD 79-056
    17. Anordnung nach Anspruch 15 oder einem der folgenden, dadurch gekennzeichnet, daß der Merkmalspeicher (51) vor Beginn des ersten Lernsignals in allen Speicherplätzen den V/ert "1" enthält.
    030048/0184
DE2920041A 1979-05-18 1979-05-18 Verfahren zum Verifizieren von Signalen, und Anordnung zum Durchführen des Verfahrens Expired DE2920041C2 (de)

Priority Applications (5)

Application Number Priority Date Filing Date Title
DE2920041A DE2920041C2 (de) 1979-05-18 1979-05-18 Verfahren zum Verifizieren von Signalen, und Anordnung zum Durchführen des Verfahrens
FR8010606A FR2484670B1 (fr) 1979-05-18 1980-05-12 Procede et dispositif pour verifier des signaux, en particulier des signaux de parole
US06/149,869 US4344031A (en) 1979-05-18 1980-05-14 Method and device for verifying signals, especially speech signals
GB8016076A GB2052822B (en) 1979-05-18 1980-05-15 Method of and apparatus for verifying voice signals
JP6548980A JPS55154670A (en) 1979-05-18 1980-05-19 Method and device for signal collation

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE2920041A DE2920041C2 (de) 1979-05-18 1979-05-18 Verfahren zum Verifizieren von Signalen, und Anordnung zum Durchführen des Verfahrens

Publications (2)

Publication Number Publication Date
DE2920041A1 true DE2920041A1 (de) 1980-11-27
DE2920041C2 DE2920041C2 (de) 1986-09-04

Family

ID=6071022

Family Applications (1)

Application Number Title Priority Date Filing Date
DE2920041A Expired DE2920041C2 (de) 1979-05-18 1979-05-18 Verfahren zum Verifizieren von Signalen, und Anordnung zum Durchführen des Verfahrens

Country Status (5)

Country Link
US (1) US4344031A (de)
JP (1) JPS55154670A (de)
DE (1) DE2920041C2 (de)
FR (1) FR2484670B1 (de)
GB (1) GB2052822B (de)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0082304A1 (de) * 1981-11-20 1983-06-29 Siemens Aktiengesellschaft Verfahren zur Identifizierung einer Person unter Verwendung von Sprach-und Gesichtserkennung und Einrichtung zur Durchführung des Verfahrens

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2139389A (en) * 1983-04-29 1984-11-07 Voice Electronic Technology Li Identification apparatus
JPS60198597A (ja) * 1984-03-22 1985-10-08 株式会社リコー 音声スペクトルの2値化装置
US4827516A (en) * 1985-10-16 1989-05-02 Toppan Printing Co., Ltd. Method of analyzing input speech and speech analysis apparatus therefor
GB8630118D0 (en) * 1986-12-17 1987-01-28 British Telecomm Speaker identification
DE4020001C2 (de) * 1990-06-24 1995-01-26 Werner Dr Ing Brockmann Schaltungsanordnung einer Neuronenschaltung und eines damit aufgebauten neuronalen Netzes
DE4317424C2 (de) * 1993-05-26 2002-06-13 Eads Deutschland Gmbh Verfahren zur Ermittlung einer periodischen Struktur in einem Linienspektrum und Verwendung eines solchen Verfahrens zur Erkennung und/oder Klassifizierung eines Hubschraubers
US5625747A (en) * 1994-09-21 1997-04-29 Lucent Technologies Inc. Speaker verification, speech recognition and channel normalization through dynamic time/frequency warping
US20030014263A1 (en) * 2001-04-20 2003-01-16 Agere Systems Guardian Corp. Method and apparatus for efficient audio compression
US20130212840A1 (en) * 2006-10-20 2013-08-22 Michael Mansour Ahmadshahi Signal-activated lingerie

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3641331A (en) * 1969-11-12 1972-02-08 Honeywell Inc Apparatus for performing arithmetic operations on numbers using a multiple generating and storage technique
DE2348348A1 (de) * 1972-10-16 1974-04-25 Akad Wissenschaften Ddr Digital arbeitender belehrbarer matrixfoermiger zuordner
DE2753606A1 (de) * 1976-12-08 1978-06-15 Zentronik Veb K Digitale anordnung fuer lernfaehige klassifikatoren

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB1542843A (en) * 1975-04-03 1979-03-28 Solartron Electronic Group Signal processor
NL165863C (nl) * 1975-06-02 1981-05-15 Nederlanden Staat Inrichting voor het herkennen van tekens.
DE2536585C3 (de) * 1975-08-16 1981-04-02 Philips Patentverwaltung Gmbh, 2000 Hamburg Anordnung zur statistischen Signalanalyse

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3641331A (en) * 1969-11-12 1972-02-08 Honeywell Inc Apparatus for performing arithmetic operations on numbers using a multiple generating and storage technique
DE2348348A1 (de) * 1972-10-16 1974-04-25 Akad Wissenschaften Ddr Digital arbeitender belehrbarer matrixfoermiger zuordner
DE2753606A1 (de) * 1976-12-08 1978-06-15 Zentronik Veb K Digitale anordnung fuer lernfaehige klassifikatoren

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0082304A1 (de) * 1981-11-20 1983-06-29 Siemens Aktiengesellschaft Verfahren zur Identifizierung einer Person unter Verwendung von Sprach-und Gesichtserkennung und Einrichtung zur Durchführung des Verfahrens

Also Published As

Publication number Publication date
FR2484670B1 (fr) 1986-12-12
JPS55154670A (en) 1980-12-02
US4344031A (en) 1982-08-10
FR2484670A1 (fr) 1981-12-18
GB2052822A (en) 1981-01-28
DE2920041C2 (de) 1986-09-04
GB2052822B (en) 1983-03-16

Similar Documents

Publication Publication Date Title
DE3233637C2 (de) Vorrichtung zur Bestimmung der Dauer von Sprachsignalen
DE2536585C3 (de) Anordnung zur statistischen Signalanalyse
DE2753707A1 (de) Einrichtung zur erkennung des auftretens eines kommandowortes aus einer eingangssprache
CH627571A5 (de) Vorrichtung und verfahren zur bestimmung charakteristischer einzelheiten in einem elektronisch abgetasteten bildmuster.
EP0862161A2 (de) Verfahren zur Spracherkennung mit Sprachmodellanpassung
DE2844156A1 (de) Verfahren zum verifizieren eines sprechers
WO2005122136A1 (de) Vorrichtung und verfahren zum bestimmen eines akkordtyps, der einem testsignal zugrunde liegt
DE2920041C2 (de) Verfahren zum Verifizieren von Signalen, und Anordnung zum Durchführen des Verfahrens
DE2133638C3 (de) Verfahren zum Betrieb eines lernfähigen Systems aus in Kaskade geschalteten, zur nicht linearen Datenverarbeitung geeigneten lernfähigen Datenverarbeitungseinheiten
EP0285211B1 (de) Verfahren zum Erkennen kontinuierlich gesprochener Wörter
DE2922091A1 (de) Analog-digitale umwandlungsmethode sowie diese anwendende bildreproduktionsmethode
DE2719175A1 (de) Schallanalysiereinrichtung
DE2720666A1 (de) Verfahren und anordnung zur geraeuschanalyse
EP0685706A1 (de) Verfahren zur Echtzeitermittlung des Offsetanteils eines Messsignales
EP0272723B1 (de) Verfahren zur Bestimmung des zeitlichen Verlaufs eines Sprachparameters und Anordnung zur Durchführung des Verfahrens
DE2939077A1 (de) Verfahren und anordnung zum bestimmen charakteristischer werte aus einem geraeuschsignal
EP0677835B1 (de) Verfahren zum Ermitteln einer Folge von Wörtern
DE19718479C1 (de) Chipkarte mit Speicherzugriffsmaximierung und Protokollierung
EP2082331A1 (de) Verfahren und vorrichtung zur inkrementierung von in speicherzellen eines speichers gespeicherten zählerständen
DE19951188B4 (de) Verfahren und Einrichtung zur Aufzeichnung von Impulssignalen
DE3443794C2 (de)
EP0417854B1 (de) Verfahren zur Erkennung von N unterschiedlichen Wortketten in einem Sprachsignal
DE2834751C2 (de)
DE69029030T2 (de) Schallsynthesizer
DE3417816A1 (de) Programmierbares schaltnetz

Legal Events

Date Code Title Description
8110 Request for examination paragraph 44
D2 Grant after examination
8364 No opposition during term of opposition
8339 Ceased/non-payment of the annual fee