DE1547032A1 - Einrichtung zum Identifizieren einer Person - Google Patents
Einrichtung zum Identifizieren einer PersonInfo
- Publication number
- DE1547032A1 DE1547032A1 DE19671547032 DE1547032A DE1547032A1 DE 1547032 A1 DE1547032 A1 DE 1547032A1 DE 19671547032 DE19671547032 DE 19671547032 DE 1547032 A DE1547032 A DE 1547032A DE 1547032 A1 DE1547032 A1 DE 1547032A1
- Authority
- DE
- Germany
- Prior art keywords
- stored
- shift register
- pulse period
- signal
- accumulator
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03K—PULSE TECHNIQUE
- H03K5/00—Manipulating of pulses not covered by one of the other main groups of this subclass
- H03K5/22—Circuits having more than one input and one output for comparing pulses or pulse trains with each other according to input signal characteristics, e.g. slope, integral
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01R—MEASURING ELECTRIC VARIABLES; MEASURING MAGNETIC VARIABLES
- G01R29/00—Arrangements for measuring or indicating electric quantities not covered by groups G01R19/00 - G01R27/00
- G01R29/02—Measuring characteristics of individual pulses, e.g. deviation from pulse flatness, rise time or duration
- G01R29/027—Indicating that a pulse characteristic is either above or below a predetermined value or within or beyond a predetermined range of values
- G01R29/033—Indicating that a pulse characteristic is either above or below a predetermined value or within or beyond a predetermined range of values giving an indication of the number of times this occurs, i.e. multi-channel analysers (the characteristic being frequency)
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification
Description
IBM Deutschland
internationale Büro-Maschinen Gesellschaft mbH
Böblingen, 24. Februar 1969 bi-kr
Anmelderin: International Business Machines
Corporation, Armonk, N. Y. 10 504
Amtliches Aktenzeichen: P 15 47 032. 3
Aktenzeichen der Anmelderin: Docket 15 270
Die Erfindung bezieht sich auf eine Einrichtung zum Identifizieren einer Person
aufgrund ihrer Stimme.
Die Identität von Personen festzustellen ist z. B. erforderlich beim Zutritt
zu Sicherheitsbezirken, zu Fertigungs- oder Forschungsstellen oder bei Bankgeschäften. Die Identifizierung geschieht bisher gewöhnlich durch Feststellung
der physischen Merkmale mittels einer Photographic oder Beschreibung. Weiter wird die Unterschrift oder Finger abdrücke als ein Identifizierung
smerkmal benutzt. Das äußere Aussehen oder die Unterschrift können jedoch täuschen. Die Identifizierung mittels der Fingerabdrücke ist zwar
verläßlich, sie kann jedoch nicht überall angewandt werden. Es war bisher nicht möglich, den Vorgang zu automatisieren oder ihn ohne die physische
Gegenwart der Person durchzuführen.
Insbesondere für den Gebrauch von Kreditinstituten wird es jedoch wesentlich
ein verläßliches und etwa auch per Telefon abwickelbares Verfahren zu haben. Ebenso ist für die Mehrfachbenutzung von Computern über Telefonleitungen die
Neue-Unterlagen (*i 7 §, ^ 2 Nr., S3t2 ,_dea Ändörungsgeg.
909845/0496
Identifizierung von Bedeutung, da im Speicher des Computers Daten über Personen
oder Gesellschaften enthalten sein können, deren Kenntnis nicht in
fremde Hände geraten darf. Ein anderes Beispiel wäre die telefonische Aufgabe
großer Bestellungen oder die telefonische Anfrage über Bankkonten.
Sprachliche Identifizierung wurde zwar schon durch den Gebrauch von Losungsworten
oder Kennworten geübt, wobei der Nachweis eben in der Kenntnis dieses Wortes und nicht im Erkennen der Stimme einer Person besteht.
Es hat sich jedoch gezeigt, daß die Stimme einer Person gewisse Charakteristika
enthält, die nicht verborgen oder verfälscht werden können und die deshalb ebenso unveränderlich sind wie die Fingerabdrücke.
Es sind Untersuchungen bekannt, die mit Hilfe eines Spektrogramms Ähnlichkeiten
der Sprache von Familienmitgliedern betrafen. Eine Automatisierung
der Erkennung ist jedoch damit nicht möglich.
Die vorliegende Erfindung macht es sich zur Aufgabe, eine Identifizierungseinrichtung
für Personen zu schaffen, bei dem die physische Anwesenheit der Person nicht erforderlich ist, bei dem vielmehr die durch Funk oder Leitung
übermittelte Sprache der Person ausreichend ist und bei dem eine automatische Identifizierung ermöglicht wird. Außerdem ist bei dem erfindungsgemäßen
Einrichtung ein geringer Aufwand an Speicherkapazität und Schaltung erforderlich.
Gegenstand der Erfindung ist demnach eine Einrichtung zum Identifizieren
einer Person auf Grund ihrer Stimme durch Vergleich gespeicherter Merkmale
bestimmter Worte mit der gesprochenen Widergabe derselben Worte. Sie ist gekennzeichnet durch ein Schieberegister zur Aufnahme mehrerer
Paare von zusammengehörigen Spannungs- und Zeit-Koordinaten stimmhafter Sprachteile in digitaler Form, durch einen Analog-Digital-Wandler und Detektoren,
die aus der gesprochenen Wiedergabe nacheinander die entsprechen-
909845/0496
Docket 15 270
den Koordinatenwerte bestimmen, durch Vergleicher zur Ermittlung der jeweils
kleinsten Differenz zwischen einem Wertepaar der gesprochenen Wiedergabe
und allen gespeicherten Wertepaaren, durch Schaltungen zur Mittelwertbildung
für eine vorgegebene Zahl von Vergleichsvorgängen und durch einen Vergleicher zum Vergleich des Mittelwertes mit einem Festwert.
Zur Beschleunigung des Auswertevorganges hat es sich als vorteilhaft erwiesen,
den Vergleich der gesprochenen Wiedergabe gleichzeitig mit mehreren gespeicherten Wertepaaren vorzunehmen; dies geschieht zunächst in mehreren
Addierern, denen die gespeicherten Wertepaare mit negativen Vorzeichen zugeführt werden; zur Erleichterung des nachfolgenden Vergleichs werden die
so gebildeten Differenzen quadriert. Weitere Addierer vereinigen dann die
quadrierten Differenzen der Spannungs-Koordinaten und der Zeit-Koordinaten, die schließlich von einem Akkumulator zum Vergleich bereitgehalten
werden.
Erfindungsgemäß werden weiter die Werte von je zwei Akkumulatoren verglichen
und abhängig vom Vergleich einer der Akkumulatorwerte zu einem Summenakkumulator weitergeleitet ; das Vergleichsergebnis veranlaßt außerdem
einen Schiebevorgang im Schieberegister für die gespeicherten Wertepaare·
Das nachfolgend beschriebene Ausführungsbeispiel wird durch Zeichnungen
erläutert.
Fig. 1 zeigt ein Zeit-Spannungs-Diagramm eines Sprachlautes;
Fig. 2A - EC (zusammengesetzt nach der Vorschrift der Fig. 2) zeigen das
Blockschaltbild eines Ausführungsbeispiels zur Spracherkennung.
909845/0496
Docket 15 270
Die menschliche Sprache besteht aus stimmhaften Teilen und Reibelauten,
Die Reibelaute treten sporadisch auf und sind deshalb wenig geeignet, die Identität
einer Person zu beweisen. Die stimmhaften Teile der Sprache jedoch sind halbperiodisch und enthalten dem Individuum eigene Iribrmationen. Jedesmal
wenn ein stimmhafter Laut gebildet wird, bewegen sich die Stimmbänder, die wegen ihres anatomischen Baus besser Stimmfalten genannt werden
könnten, zusammen und auseinander, so daß die Öffnung zwischen ihnen sich ändert. Diese Öffnung wird als Stimmritze bezeichnet. Die Geschwindigkeit,
mit der sich die Stimmfalten zusammen und auseinanderbewegen, bestimmt den Grundton des stimmhaften Lautes. Während eines Teils jeder Periode
des stimmhaften Lautes, die Grundtonperiode genannt wird, ist die Stimmritze vollständig geschlossen und der Zustrom von Luft aus den Lungen
verursacht einen Druckanstieg, der zu dieser Zeit seinen höchsten Wert erreicht.
Wenn die Stimmritze sich öffnet, vermindert ein schlagartiger Luftdurchtritt den Druck. Bei jedem solchen Luftdurchtritt beginnt eine neue
Grundtonperiode.
Der Luftdurchtritt aus der Stimmritze passiert die Höhlungen der Rachenräume.
Der Mensch hat zwar bewußte Kontrolle über seine Stimmhöhe (d. h. über die Geschwindigkeit der Stimmritzenbewegung), er hat jedoch keine Kontrolle
über gewisse Eigenheiten der stimmhaften Laute, die von der Resonanz in den Höhlungen der Rachenräume herrühren. Der Vokaltrakt verursacht
zudem die Überlagerung gewisser höherer Frequenzkomponenten über die Kurvenform der Grundtonfrequenz. Da alle diese Harmonischen beim
öffnen der Stimmritze entstehen, sind die wenigen ersten Spitzen und Täler
jeder Periode im wesentlichen nicht von diesen Harmonischen beeinträchtigt. Die späteren Kurven der Impulsperiode enthalten jedoch diese Harmonischen
und sind deshalb weniger aussagefähig.
Ein anderes Charakteristikum des stimmhaften Teiles der menschlichen Sprache
besteht darin, daß jede Silbe eine große Zahl von Impulsperioden enthält
909845/0496
Docket 15270
(etwa 10 bis 30); nur zwei oder drei davon unterscheiden sich aber wesentlich
von den übrigen.
Die verschiedenen beschriebenen Merkmale des stimmhaften Teiles der
Sprache können zur Bestimmung der Identität einer Person benutzt werden, die eine bestimmte Gruppe von" Worten spricht. Diese bestimmte Wortgruppe,
gesprochen mit der Stimme der Person, kann als Stimm-Ausweis der Person
betrachtet werden. Der Begriff "Stimm-Ausweis" wird jedoch in der folgenden
Beschreibung unter Bezugnahme auf die gespeicherten Teile der gesprochenen Wortgruppe benutzt, deren Auswahl später zu beschreiben ist.
Zunächst gibt Fig. 1 die Form von drei charakteristischen Impulsperioden
(A, B, C) wieder. Auf der horizontalen Achse ist die Zeit abgetragen, vertikal die Spannung, Für die vorliegende Erfindung ist es bequem anzunehmen,
daß die Spitzen und Täler beide positive Spannung haben; der Spannungsmaßstab wurde entsprechend verschoben. Aus der Abbildung ist ersichtlich, daß
die ersten fünf Spitzen und Täler jeder Impulsperiode sich zwar in der Amplitude
geringfügig unterscheiden, jedoch etwa die gleiche Form haben, während die übrigen Spitzen und Täler der Impulsperiode sich davon stärker
unterscheiden. In Fig. 1 unterscheiden sich zwar die ersten fünf Spitzen
und Täler benachbarter Impulsperioden, in Wirklichkeit sind benachbarte
Impulsperioden praktisch identisch und merkliche Änderung tritt erst nach
einer Anzahl von Impulsperioden ein.
Die in Fig. 2a gezeigte Einrichtung zur Durchführung der Erfindung enthält
ein Schieberegister 10, in welchem die Koordinaten für V (Spannung) und t
(Zeit) der wenigen ersten Spitzen und Täler der gewählten Impulsperiode gespeichert
werden; diese Impulsperiode ist den stimmhaften Eingangs Signalen einer bestimmten Wortgruppe der zu identifizierenden Person entnommen.
In der folgenden Beschreibung werden Spitzen und Täler manchmal als charakteristische
Punkte bezeichnet. Die gewählten Impulsperioden, deren Ko-
909845/0496
Docket 15 270
ordinaten zu speichern sind, können z. B. die erste Impulsperiode des
stimmhaften Sprachausweises und jede folgende Impulsperiode sein, die koordinatenmäßig
eine wesentliche Änderung gegenüber der vorhergehenden gespeicherten Impulsperiode zeigt. Da eine wesentliche Änderung nur für etwa
5 bis 10 % der Impulsperioden eines normalen stimmhaften Eingangssignales zu erwarten ist, brauchen nur charakteristische Koordinaten von 5 bis 10 %
der Impulsperioden gespeichert zu werden. Da außerdem aus Fig. 1 zu entnehmen ist, daß nur die wenigen ersten Spitzen und Täler jeder Impulsperiode
tatsächlich von Bedeutung sind, während der Rest zufallsbedingte Abweichungen enthält, brauchen auch nur diese Koordinaten der wenigen ersten
Spitzen und Täler der gewählten Impulsperiode gespeichert zu werden. Dadurch ergibt sich ein geringer Umfang von gespeicherten Daten.
Aus später noch zu erläuternden Gründen werden die Werte für V und t im
Schieberegister 10 als negative und nicht als positive Größen gespeichert. Eine besonders codierte Marke M wird im Schieberegister 10 am Ende des
Sprachausweises gespeichert.
Das Schieberegister 10 ist zur Schleife geschlossen, so daß an der rechten
Seite aus dem Schieberegister herausgeschobene Daten links wieder eingegeben werden und umgekehrt. Alle Teile des Sprachausweises sind deshalb
jederzeit im Schieberegister verfügbar. Der Inhalt des Schieberegisters wird um eine Zeichenstelle (d.h. um die Zahl von Bitstellen, die zur Speicherung
eines Wertes V und eines Wertes t nötig sind) durch ein Signal auf Leitung 11 nach links verschoben; durch ein Signal auf Leitung 13 erfolgt eine Verschiebung
um eine Impulsperiode nach rechts; durch ein Signal auf Leitung 15 erfolgt eine Verschiebung um zwei Impulsperioden nach rechts. Die Erzeugung
der Signale auf den Leitungen 11, 13 und 15 wird noch erläutert.
Es wird davon ausgegangen, daß vor der Inbetriebnahme des Systems aus den
Fig. 2A bis 2C die fragliche Person sich zunächst identifiziert hat und daß
909845/0496
Docket 15 270
als Ergebnis dieser Identifizierung ein Sprachausweis der Person aus einem
Hauptspeicher in das Schieberegister 10 übertragen wird. Danach spricht die
Person ihren "Sprachausweis" in ein Telephon, Mikrophon oder dergl... Die
Einrichtung verwandelt die Stimme der Person in elektrische Signale, welche über die Leitungen 12 und den automatischen Lautstärkeregler 14 zu den Leitungen
16 gelangen. An diese Leitungen sind der Detektor zur Bestimmung des Periodenanfangs 18 und der Detektor 20 (dv/dt = 0) angeschlossen.
Diese beiden Detektoren sind nicht Gegenstand der vorliegenden Erfindung.
Ihre Wirkungsweise soll kurz erläutert werden. Der Detektor 18 arbeitet mit
der Speicherung der Spitze-Spitze-Ubergänge der Sprachwellenform und vergleicht
jeden Spitze-Spitze-Ubergang mit dem nächsten. Der größere von beiden
wird zum Vergleich mit dem folgenden festgehalten, bis nach einer gewissen Zeit der dann größte Wert gespeichert wird. Der Zeitpunkt des Auftretens
deses Maximums wird durch einen Wert in einem Zähler bestimmt.
Dieser Maximum-Wert stellt den Anfangszeitpunkt einer Grundtonperiode der Sprachwelle dar. Die Schaltung 20 ist von konventioneller Art; sie bestimmt
den Zeitpunkt, an dem die Steigung der Kurve zu Null wird.
Die Ausgangsleitung 22 des Detektors 18 stellt den Zeitzähler 24 und den
Spitze-Tal-Zähler 26 zurück und schaltet den Zähler 28 (P; Impulsperiode)
fort. Weiter wird die bistabile Schaltung 30 in ihren Zustand Eins überführt. Der Zeitzähler 24 wird über Leitung 29 aus der Taktimpulsquelle 31 fortgeschaltet.
Da der Anfang einer Impulsperiode eine Spitze ist, an der der Wert (dv/dt) Null ist^ liefert der Detektor 20 gleichzeitig auf Leitung 32 ein Ausgangesignal,
das den Zähler 26 fortschaltet und außerdem den Tor schaltungen 34 und 36 zugeführt, wird. Es ist davon auszugehen, daß der Zähler 26 auf
dem Zählwert Eins stehenbleibt, wenn ihm gleichzeitig ein Fortschalt- und Rückstell-Impuls zugeführt wird. Wenn nötig, kann das Signal auf Leitung 32
leicht verzögert werden, um dieses sicherzustellen.
909845/0496
Docket 15 270
Es soll weiter angenommen werden, daß das Signal auf Leitung 32 ausreichende
Dauer hat, um die bistabile Schaltung 30 nach Eins umzuschalten, damit die Torschaltung 34 zur Weitergabe des auf Lfeitung 32 anliegenden Signals
geöffnet ist. Dann entsteht auf Leitung 40 ein die T or schaltungen 42 und 44 vorbereitendes Signal. Die Informationseingänge der Torschaltungen 42
sind die Ausgangsleitungen 46 aus dem Analog-Digital-Wandler 48. Der Eingang zu diesem Wandler sind die Leitungen 16 vom automatischen Lautstärkeregler. Infolge des Signals auf Leitung 40 gelangen digitalisierte, den Analogwert der festgestellten Spitze darstellenden Beträge über die Tor schaltungen
42 und die Leitungen 50 zu der einen Gruppe von Eingangsklemmen der Addierer 52 bis 54. Die jeweils anderen Eingänge dieser Addierer sind die Leitungen
56 bis 58 aus der Speicherstelle des Schieberegisters 10, welche die V-Werte für die erste Spitze oder das erste Tal der ersten drei Impulsperioden
enthalten. Wie bereits gesagt, enthält das Schieberegister 10 die Werte für V und t als negative Werte, so daß das Ergebnis der Addition die Differenz
zwischen den auf Leitung 50 und auf den Leitungen 56 bis 58 vorliegenden
Werten darstellt. Diese Differenzen werden in den Quadrier schaltungen 60 bis 62 quadriert und über die Leitungen 64 bis 66 als jeweils ein Eingang
den Addierern 70 bis 72 zugeführt.
Das Signal auf Leitung'40 gelangt auch zum Vorbereitungseingang der Torschaltung
44 und läßt den im Zähler 24 gespeicherten Zeitwert über die Leitungen 76 als ein Eingang zu den Addierern 78 bis 80 gelangen. Die jeweils
anderen Eingänge der Addierer 78 bis 80 sind die Leitungen 82 bis 84 aus den Speicher stellen des Registers 10, welche den Wert t der ersten Spitze oder
des ersten Tales für die ersten drei Impulsperioden enthalten. Auch hier sind wieder die Werte t als negative Werte eröialten; die Ausgänge der Addierer
78 bis 80 auf den Leitungen 86 bis 88 stellen demnach die Differenzen der Werte auf den Leitungen 76 bzw. auf den Leitungen 82 bis 84 dar. Diese Differenzen
werden wiederum in den Quadier schaltungen 92 bis 94 quadriert und über Leitungen 96 bis 98 als zweite Eingänge zu den Addierern 70 bis 72 geführt.
Die Auegänge der Addierer 70 bis 72 auf den Leitungen 102 bis 104
909845/0496
stellen die Summe der Differenzen zwischen den Koordinaten für die Spitzen
oder Täler des Spracheingangs auf Leitung 12 bzw. den Speicherwerten des Registers 10 dar. Diese Summen gelangen zu den Akkumulatoren 106 bis
108 (Fig. 2C).
Wie schon gesagt, gelangt das* Signal auf der Leitung 32 vom Detektor 20
zum Eingang der Torschaltung 36 (Oder-Tor). Der Ausgang dieser Torschaltung
führt über die Verzögerungsleitung 112 zur Leitung 11, welche im Schieberegister 10 eine Links verschiebung um ein Zeichen hervorruft. Die
Verzögerungsdauer von 112 läßt den Schiebevorgang erst nach der Beendigung der Addition in den Addierern 52 bis 54 bzw. 78 bis 80 eintreten. Nach
der Verschiebung liegen die Koordinatenwerte von V und t der zweiten Spitze oder des zweiten Tales (für die Kurvenform der Fig. 1 wäre es das erste
Tal) für jede der drei interessierenden Impulsperioden an den Leitungen 56 bis 58 bzw. 82 bis 84.
Wenn der Detektor 20 wiederum die Bedingung (dv/dt = 0) feststellt, wird
der Zähler 26 auf den Wert Zwei erhöht; da die bistabile Schaltung 30 noch in ihrem Zustand Eins ist, gelangt durch die Torschaltung 34 und über die
Leitung 40 ein Signal zur Vorbereitung der Tor schaltungen 42 und 44, so daß die gegenwärtigen Werte V und t über die Leitungen 50 und 76 zu den Addierern
52 bis 54 bzw. 78 bis 80 laufen können. Zu den anderen Eingängen der Addierer gelangen aus dem Schieberegister 10 die negativen Werte V und t
für das erste Tal der betrachteten Impulsperiode; die Differenzen am Ausgang
der Addierer werden quadriert, summiert und in den Akkumulatoren 106 bis 108 aufaddiert. Nach Abschluß der Additionen in 52 bis 54 bzw. 78
bis 80 liefert das Oder-Tor 36 wieder ein verzögertes Signal an das Schieberegister
10, wodurch eine Linksverschiedung um ein Zeichen nun die Koordinaten
für den dritten charakteristischen Punkt (die zweite Spitze der Kurvenform von Fig. 1) den Leitungen 56 bis 58 bzw. 82 bis 84 verfügbar sind.
909845/0496
Docket 15 270
Die vorstehend beschriebene Operationsfolge wiederholt sich für jede Spitze
und jedes Tal, die vom Detektor 20 angetroffen werden; jeweils wird den
Akkumulatoren 106 bis 108 ein Wert zugefügt. Mit der Annahme, daß Spitzen- und Talwerte nach dem fünften Wert innerhalb einer Impulsperiode für das
Erkennen einer individuellen Stimme wenig Bedeutung haben, würde die Prüfschaltung
112 so eingestellt, daß sie den Zählwert 5 im Zähler 26 feststellt.
Wenn dann der Zähler 26 nach dem fünften vom Detektor 18 festgestellten Beginn einer Impulsperiode den Wert 5 erreicht, liefert die Schaltung 112 ein
Ausgangssignal über Leitung 114 zur Rückstellung der bistabilen Schaltung
30 in den Zustand Null. Da durch das Arbeiten des Zählers 26 und der Schaltung 112 Zeit Verzögerungen enthalten sind, kann angenommen werden, daß
der Impuls auf Leitung 32 die Torschaltung 34 und die Leitung 40 rechtzeitig passieren, um die Koordinatenwerte für die fünfte Spitze oder das fünfte
Tal zu den Addierwerken gelangen zu lassen, ehe die bistabile Schaltung 30 rückgestellt wird und die Torschaltung 34 sperrt. Gegebenenfalls könnten
noch zusätzliche Verzögerungen eingebaut werden. Die Rückstellung der Schaltung 30 auf Null verhindert den Zugang weiterer Daten zu den Bestimmung
s s chaltungen.
Mittels der Vergleicher schaltungen 118 bis 120 (Fig. 2C) wird der Inhalt der
Akkumulatoren 106 bis 108 fortwährend untereinander vergl ichen. Auf der
Ausgangsleitung 122 des Vergleichers 118 trittyauj, wenn der Inhalt des Akkumulators
106 größer oder gleich dem Inhalt des Akkumulators 107 ist. Auf Leitung 123 tritt ein Signal auf, wenn der Inhalt des Akkumulators 107 größer
oder gleich dem Inhalt des Akkumulators 108 ist; auf Leitung 124 tritt ein
Signal nur dann auf, wenn der Inhalt des Akkumulators 108 größer ist als der Inhalt des Akkumulators 106. Gleiche Vorbedingungen bei den Vergleichern
118 und 119 ergeben also ein positves Ausgangs signal auf den Leitungen 122
oder 123; Gleichheit beim Vergleicher 120 verursacht ein negatives Signal
auf Leitung 124. Die Ausgänge der drei Vergleicher führen zu der Schaltungslogik 126. Die Tabelle für diese logische Schaltung ist rechts daneben ge-
909845/0496
Docket 15 270 ßAD ORIGINAL
daß
zeichnet» Aus ihr läßt sich entnehmen, mit einem Signal auf Leitung 124 und keinem Signal auf Leitung 122 die Und-Schaltung 130 durchlässig ist und ein Ausgangs signal auf der Tl-Leitung 134 liefert, die als ein Eingang zu der Und-Schaltung 138 dient. Liegt ein Signal auf Leitung 122 und kein Signal auf der Leitung 123 vor, so kann die Und-Schaltung 131 auf der T2-Leitung ein Signal zur Und-Schaltung 139 liefern. Führt die Leitung 123 ein Signal und die Leitung 124 keines, so liefert die Und-Schaltung 132 auf der T3-Leitung 136 ein Ausgangssignal zur Und-Schaltung 140. Die anderen Eingangsvariablen für die Und-Schaltungen 138 bis 140 liefert die Leitung 144 (Fig. die von der Null-Seite der bistabilen Schaltung 30 über Leitung 147 gespeist wird. Wenn also diese bistabile Schaltung 30 bei einem bestimmten Stand (5 angenommen) des Zählers 26 zum Zustand Null zurückkehrt, liefert die Schaltung 146 über Leitung 144 ein Signal zu den Und-Schaltungen 138 bis 140. Welche der Und-Schaltungen nun durchlässig wird, wird dadurch bestimmt, welcher der Akkumulatoren 106 bis 108 dann den niedrigsten Wert enthält. Es werde vorläufig angenommen, daß die erste Impulsperiode des Sprachausweises im Schieberegister 10 bei den Leitungen 57 und 88 gespeichert ist und daß Leerstellen bei den Leitungen 56 und 82 vorliegen. Wenn unter diesen Bedigungen das Eingangssignal bei 12 (Fig. 2A) tatsächlich von der richtigen Person stammt, so wird der Akkumulator 107 in diesem Augenblick die kleinste Summe enthalten, und die Schaltung 126 liefert auf Leitung 135 und der Und-Schaltung 131 ein Signal. Dann wird die Und-Schaltung 139 durchlässig, die Leitvng 149 bereitet die Torschaltung 153 vor und läßt den Inhalt des Akkumulators 107 durch die Oder-Schaltung 156 zum Summen-Akkumulator 158 durchlaufen. Das Signal von der Differentiations schaltung 146 auf der Leitung 144 gelangt auch zu der Oder-Schaltung 36 und der Verzögerungs schaltung 112, wodurch das Schieberegister um eine Zeichenstelle nach links verschoben wird. Dadurch kämen an die Stelle der Leitungen 56 bis 58 und 82 bis 84 die Koordinaten des ersten charakteristischen Punktes der Impulsperiode, die der früher dort befindlichen benachbart ist; mit anderen Worten, die Linksverschiebung um eine Impulsperiode des Schieberegisterinhaltes würde voll-
zeichnet» Aus ihr läßt sich entnehmen, mit einem Signal auf Leitung 124 und keinem Signal auf Leitung 122 die Und-Schaltung 130 durchlässig ist und ein Ausgangs signal auf der Tl-Leitung 134 liefert, die als ein Eingang zu der Und-Schaltung 138 dient. Liegt ein Signal auf Leitung 122 und kein Signal auf der Leitung 123 vor, so kann die Und-Schaltung 131 auf der T2-Leitung ein Signal zur Und-Schaltung 139 liefern. Führt die Leitung 123 ein Signal und die Leitung 124 keines, so liefert die Und-Schaltung 132 auf der T3-Leitung 136 ein Ausgangssignal zur Und-Schaltung 140. Die anderen Eingangsvariablen für die Und-Schaltungen 138 bis 140 liefert die Leitung 144 (Fig. die von der Null-Seite der bistabilen Schaltung 30 über Leitung 147 gespeist wird. Wenn also diese bistabile Schaltung 30 bei einem bestimmten Stand (5 angenommen) des Zählers 26 zum Zustand Null zurückkehrt, liefert die Schaltung 146 über Leitung 144 ein Signal zu den Und-Schaltungen 138 bis 140. Welche der Und-Schaltungen nun durchlässig wird, wird dadurch bestimmt, welcher der Akkumulatoren 106 bis 108 dann den niedrigsten Wert enthält. Es werde vorläufig angenommen, daß die erste Impulsperiode des Sprachausweises im Schieberegister 10 bei den Leitungen 57 und 88 gespeichert ist und daß Leerstellen bei den Leitungen 56 und 82 vorliegen. Wenn unter diesen Bedigungen das Eingangssignal bei 12 (Fig. 2A) tatsächlich von der richtigen Person stammt, so wird der Akkumulator 107 in diesem Augenblick die kleinste Summe enthalten, und die Schaltung 126 liefert auf Leitung 135 und der Und-Schaltung 131 ein Signal. Dann wird die Und-Schaltung 139 durchlässig, die Leitvng 149 bereitet die Torschaltung 153 vor und läßt den Inhalt des Akkumulators 107 durch die Oder-Schaltung 156 zum Summen-Akkumulator 158 durchlaufen. Das Signal von der Differentiations schaltung 146 auf der Leitung 144 gelangt auch zu der Oder-Schaltung 36 und der Verzögerungs schaltung 112, wodurch das Schieberegister um eine Zeichenstelle nach links verschoben wird. Dadurch kämen an die Stelle der Leitungen 56 bis 58 und 82 bis 84 die Koordinaten des ersten charakteristischen Punktes der Impulsperiode, die der früher dort befindlichen benachbart ist; mit anderen Worten, die Linksverschiebung um eine Impulsperiode des Schieberegisterinhaltes würde voll-
909845/0496
Docket 15 270
endet sein. Da während der vorhergehenden Impulsperiode die beste Übereinstimmung
mit der mittleren der drei Impulsperioden gefunden wurde, ist es
erwünscht, diese Impulsperiode als mittlere für die Vergleiche mit den folgenden
Impulsperioden des Eingangs signals zu behalten. Es wird also eine Rechtsverschiebung um eine Impulsperiode erforderlich. Um dies zu bewirken,
wird das Signal auf der Leitung 149 von der Und-Schaltung 139 (Fig. 2C)
über die Verzögerungsleitung 160 zur Leitung 13 geführt. Der Inhalt des Schieberegisters
nimmt also dieselbe Lage ein, wie zum Beginn der Untersuchung.
Um die Arbeitsweise der Einrichtung noch besser zu verdeutlichen, soll angenommen
werden, daß die erste Impulsperiode des gespeicherten Sprachausweises in der Stelle benachbart den Leitungen 56 und 82 enthalten war. Wenn
dann auf Leitung 144 ein Signal erscheint, hätte der Akkumulator 106 die kleinste
Summe gespeichert, und die Schaltung 126 würde auf Leitung 134 von der Und-Schaltung 130 ein Signal liefern. Dieses Signal würde die Und-Schaltung
138 durchlässig machen und über Leitung 148 die Torschaltungen 152 zur Weiterleitung des Inhalts des Akkumulators 106 über die Oder-Schaltungen
156 zum Summenakkumulator 158 veranlassen. Über die Verzögerungsleitung
162 (Fig. 2A) gelangt dieses Signal auch zur Leitung 15, so daß der Inhalt des Schieberegisters 10 um zwei Impulsperioden nach rechts, verschoben wird.
Wie vorher schon gesagt, bringt die Verschiebung um eine Impulsperiode nach rechts den Inhalt dieses Registers in die zu Beginn der Impulsperiode eingenommene
Lage. Die Rechtsverschiebung um eine zweite Impulsperiode bringt nun die benachbarte Impulsperiode (die ursprünglich bei den Leitungen 56
und 82 stand) zu den Leitungen 57 und 83. Die mit dem Eingangssignal am meisten übereinstimmende Impulsperiode des Schieberegisters 10 gelangt also
auf diese Weise in die bei den Leitungen 57 und 83 angeordnete Stelle zum Vergleich
mit der folgenden Eingangs-Impulsperiode.
Das Signal auf der Ausgangsleitung 144 von der Differentiations schaltung 146
gelangt über die Verzögerungsleitung 164 (fig. 2C) und die Leitung 166 als
Rückstellsignal zu den Akkumulctoren 106 bis 108 und als Vorhereitungssig-
909845/0496
Docket 15 270
nal zu den T or schaltungen 168; der Inhalt des Summenakkumulators 158 gelangt
dadurch als Dividendeneingang zur Divisionseinrichtung 170, Der Divisoreingang wird vom P-Zähler 28 geliefert. Die Divisionseinrichtung 170 liefert über Leitungen 174 den Quotienten zum Mittelwertregister 176; der Quotient
ist die mittlere Abweichung der Impulsperioden des stimmhaften Eingangssignales von dem besten der drei Impulsperioden des Sprachausweises,
mit denen das Eingangssignal bis dato vergl ichen wurde. Der Betrag im
Mittelwertregister 76 wird mit dem Vergleicher 178 mit einem im Register
180 gespeicherten Vergleichswert in Beziehung gesetzt. Wenn der Speicherwert des Registers 176 größer ist als der Wert des Registers 180, liefert der
Vergleicher 178 ein Signal auf Leitung 182, das eine Fehlmeldung anzeigt. Von der gleichen Leitung wird über die Oder-Schaltung 183 (Fig. 2B) und die Leitung
185 der Zähler 28 rückgestellt.
Tritt auf Leitung 182 kein Signal auf, so kann die Einrichtung eine neue Impulsperiode
des stimmhaften Eingangs signals auf Leitung 12 entgegennehmen. Es
laufen dann die bereits beschriebenen Vorgänge wiederum ab, an deren Ende der Inhalt der Akkumulatoren 106 bis 108 zu der in Akkumulator 158 enthaltenen
Summe aufsummiert, durch den neuen Wert des Zählers 28 in der Divisionsschaltung
170 dividiert und eine neue mittlere Abweichung im Register 176 gespeichert wird. Diese mittlere Abweichung wird dann wieder mit dem
Mittelwert des Registers 180 verglichen; wenn der neue Mittelwert den Vorgabewert
überschreitet entsteht wieder ein Fehl signal auf Leitung 182. Die Leitungen
134 bis 136 der Schaltung 126 steuern auch die drei Impulsperioden im Schieberegister IQ mit denen die nächste Impulsperiode des Eingangs signals
zu vergleichen ist. Wie früher gesagt, sind dies drei Impulsperioden, welche diejenige mit der geringsten Abweichung als mittlere Periode haben.
Bei der ersten früher betrachteten Impulsperiode des Eingangs signals war angenommen
worden, daß entweder auf der Leitung 134 oder auf der Leitung 135 ein Signal entsteht. Da bei der gewöhnlichen Sprache zwischen auf einander f öl-
9 0 9 8 4 5/0496
Docket 15 270
genden Impulsperioden sehr geringe Änderungen auftreten, werden die zweite
und mehrere folgende Impulsperioden des Eingangs signals mit der beiden Leitungen
57 und 83 gespeicherten Impulsperiode weitgehend übereinstimmen; dieses führt zu Signalen auf Leitung 135 von der logischen Schaltung 126.
Schließlich wird jedoch eine größte Übereinstimmung mit der Impulsperiode bei den Leitungen 58 und 84 auftreten; dadurch liefert die Schaltung 126 ein
Signal auf Leitung 136. Infolgedessen wird dann der Inhalt des Akkumulators
108 zum Summenakkumulator 158 addiert. Das Signal auf Leitung 136 bedeutet,
daß der Inhalt des Schieberegisters gegenüber der Lage beim Beginn der Impulsperiode
um eine Impulsperiode nach links verschoben werden soll. Es ist erinnerlich, daß die Links verschiebung auf die Signale der Leitung 32 des
Detektors 20 hin eine Verschiebung um eine Zeichenstelle weniger als eine volle Impulsperiode bewirkten. Das Signal der Aus gangs leitung 144 von der
Differentiations schaltung 146 am Ende jeder Impulsperiode läuft über die
Oder-Schaltung 36 und die Verzögerungsleitung 112 und bewirkt diese fehlende
Linksverschiebung um ein Zeichen; der Inhalt des Schieberegisters ist dann
also um eine Impulsperiode nach links verschoben. Da also das Register bereits in der gewünschten Lage ist, braucht auf ein Signal der Leitung 136 hin
keine zusätzliche Schiebeoperation stattfinden.
Im Schieberegister ist eine das Ende des Sprachausweises anzeigende Markierung
vorgesehen. Ein Markierungs-Detektor 186 (Fig. 2A) prüft dauernd
die Stelle des Registers bei der Leitung 58. Wenn die Markierung an dieser Stelle angetroffen wird, liefert der Detektor 186 über Leitung 188 ein Signal,
das der Und-Schaltung 190 (Fig. 2C) zugeführt wird. Wenn keine Fehlmeldung
auf Leitung 182 vorhanden ist, kann der Inverter 192 dem anderen Eingang der Und-Schaltung 190 ein Signal zuführen. Falls beide Eingänge der
Und-Schaltung erregt sind, liefert sie ein Aus gangs signal auf Leitung 196 als
Zeichen dafür, daß die Identität der fraglichen Person festgestellt wurde. Das Signal auf Leitung 188 stellt auch über die Verzögerungsleitung 198, die Leitung
200, die Oder-Schaltung 183 und die Leitung 185 den Zähler 28 zurück.
909845/0496
Docket 15 270
Aus der vorstehenden Beschreibung ist zu entnehmen, daß mit der erfindungsgemäßen
Einrichtung eine automatische Prüfung der Identität einer Person aus ihrer Stimme möglich ist. Die Stimme kann von einer entfernten Stelle
über Telephonleitungen oder Funkwellen kommen. Die Person braucht also nicht an der Stelle der Prüfung anwesend sein. Ein weiterer Vorteil der Einrichtung
ist es, daß nur die Koordinaten von Spitzen und Täler (charakteristische
Koordinaten) der ersten charakteristischen Punkte weniger aus einer größeren Zahl ausgewählter Impulsperioden des Sprachausweises gespeichert
zu werden brauchen. Daraus resultiert eine beträchtliche Verminderung der
Speicheranforderungen. Der Vergleich mit drei benachbarten Impulsperioden des Sprachausweises gestattet die Fortschaltung der Speicherwerte in Synchronismus
mit dem Eingangssignal. Da außerdem die Identität nur bestätigt wird, wenn die Person die richtigen Worte spricht (d.h. den Sprachausweis),
ist eine zusätzliche Sicherheit für die Identifizierung gegeben.
Bisher wurde angenommen, daß der Einrichtung eine vorläufige Identifizierungsmitteäung
gegeben wird und der Sprachausweis der angeblichen Person in das Schieberegister verbracht wird. Natürlich ist es durch Änderung der
Einrichtung möglich, ein zugeführtes Eingangssignal mit einer Mehrzahl gespeicherter
Sprachausweise zu vergleichen und denjenigen Sprachausweis auszuwählen, der mit dem Eingangssignal am besten übereinstimmt. Während
bei dem Ausführungsbeispiel der Fig. ZA bis 2C den charakteristischen Koordinaten
der ersten (z. B. 5) charakteristischen Punkte das Gewicht Eins und den übrigen Koordinaten aller folgenden charakteristischen Punkte das Gewicht
Null gegeben wurde, können den charakterischen Punkten auch andere, kompliziertere Gewichts Verteilungen zugeordnet und damit schwierigere Identifizierungsfragen
gelöst werden. Da die Eingangswerte Analogweite sind, können als Speicherwerte auch Analogwerte für die charakteristischen Koordinaten
dienen; dabei könnte die nachfolgende Einrichtung analog oder digital Signale verarbeiten.
909845/0496
Docket 15 270
■Ί,ι,,Ί
Claims (3)
1. Einrichtung zum Identifizieren einer Person aufgrund ihrer Stimme
durch Vergleich gespeicherter Merkmale bestimmter Worte mit der gesprochenen Wiedergabe derselben Worte, gekennzeichnet durch ein
Schieberegister (10) zur Aufnahme mehrerer Paare von zusammenge- · hörigen Spannungs- und Zeit-Koordinaten stimmhafter Sprachteile in
digitaler Form, durch einen Analog-Digital-Wandler (48) und Detektoren (18 und 20), die aus der gesprochenen Wiedergabe nacheinander die
entsprechenden Koordinatenwerte bestimmen, durch Vergleicher (118-120) zur Ermittlung der jeweils kleinsten Differenz zwischen einem
Wertepaar der gesprochenen Wiedergabe und allen gespeicherten Wertepaaren, durch Schaltungen (158, 170, 176) zur Mittelwertbildung für eine
vorgegebene Zahl von Vergleichsvorgängen und durch einen Vergleicher (178) zum Vergleich des Mittelwertes mit einem Festwert (180).
2. Einrichtung nach Anspruch 1, dadurch gekennzeichnet, daß die Spannungskoordinaten
und die Zeitkoordinaten der gespeicherten Wertepaare mit negativem Vorzeichen je einem Addierer (52 - 54 bzw. 78 - 80) zugeführt
werden, deren zweite Eingänge mit dem Wertepaar der gesprochenen Wiedergabe gespeist werden, daß die Addierer-Ausgangssignale
Quadrier schaltungen (60 - 62; 92 - 94) zugeleitet werden, daß weitere Addierer (70 - 72) die quadrierten Differenzen der beiden Koordinatenwerte
vereinigen und daß Summenakkumulatoren das Ergebnis der Addi tion für die Vergleicher bereitstellen.
3. Einrichtung nach Anspruch 1 und 2, dadurch gekennzeichnet, daß jeder
Vergleicher (118 - 120) einen Größer/Gleich-Vergleich von je zwei
909845/0496
NeUe Unterlagen lArt. 7 S l Abs. 2 Nr. l Satz 3 cieä Äi*Jwuix«ie*. *.<-
Docket 15 270
Akkumulator-Werten vornimmt, daß eine Schaltungslogik (126) den Inhalt
des Akkumulators mit dem kleinsten Summenwert zu einem Summen-Akkumulator
(158) weiterleitet und gleichzeitig (über Leitungen 17 oder 15) eine vom Vergleichsergebnis abhängige Verschiebung der im Schieberegister
(10) gespeicherten Wertepaare als Vorbereitung für den
nächsten Vergleichsvorgang bewirkt»
nächsten Vergleichsvorgang bewirkt»
90 984 5/04 9 6
Docket 15 270
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US546945A US3466394A (en) | 1966-05-02 | 1966-05-02 | Voice verification system |
Publications (1)
Publication Number | Publication Date |
---|---|
DE1547032A1 true DE1547032A1 (de) | 1969-11-06 |
Family
ID=24182658
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE19671547032 Pending DE1547032A1 (de) | 1966-05-02 | 1967-04-29 | Einrichtung zum Identifizieren einer Person |
Country Status (4)
Country | Link |
---|---|
US (1) | US3466394A (de) |
JP (1) | JPS458243B1 (de) |
DE (1) | DE1547032A1 (de) |
GB (1) | GB1179029A (de) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE2104012A1 (de) * | 1970-01-30 | 1971-08-05 | Lannionnais Electronique | Adaptiver Sprachanalysator |
Families Citing this family (39)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3509280A (en) * | 1968-11-01 | 1970-04-28 | Itt | Adaptive speech pattern recognition system |
US3525811A (en) * | 1968-12-26 | 1970-08-25 | Fred C Trice | Remote control voting system |
US3673331A (en) * | 1970-01-19 | 1972-06-27 | Texas Instruments Inc | Identity verification by voice signals in the frequency domain |
US3659052A (en) * | 1970-05-21 | 1972-04-25 | Phonplex Corp | Multiplex terminal with redundancy reduction |
US3810156A (en) * | 1970-06-15 | 1974-05-07 | R Goldman | Signal identification system |
US3737580A (en) * | 1971-01-18 | 1973-06-05 | Stanford Research Inst | Speaker authentication utilizing a plurality of words as a speech sample input |
US3700815A (en) * | 1971-04-20 | 1972-10-24 | Bell Telephone Labor Inc | Automatic speaker verification by non-linear time alignment of acoustic parameters |
BE787377A (fr) * | 1971-08-09 | 1973-02-09 | Waterbury Nelson J | Cartes de securite et systeme d'utilisation de telles cartes |
US3770891A (en) * | 1972-04-28 | 1973-11-06 | M Kalfaian | Voice identification system with normalization for both the stored and the input voice signals |
US3883850A (en) * | 1972-06-19 | 1975-05-13 | Threshold Tech | Programmable word recognition apparatus |
US3919479A (en) * | 1972-09-21 | 1975-11-11 | First National Bank Of Boston | Broadcast signal identification system |
US3928722A (en) * | 1973-07-16 | 1975-12-23 | Hitachi Ltd | Audio message generating apparatus used for query-reply system |
JPS5220705A (en) * | 1975-08-09 | 1977-02-16 | Fuji Xerox Co Ltd | Identification discriminating system by peak point value envelope curv e of voice waveform |
DE2536585C3 (de) * | 1975-08-16 | 1981-04-02 | Philips Patentverwaltung Gmbh, 2000 Hamburg | Anordnung zur statistischen Signalanalyse |
US4032711A (en) * | 1975-12-31 | 1977-06-28 | Bell Telephone Laboratories, Incorporated | Speaker recognition arrangement |
US4053710A (en) * | 1976-03-01 | 1977-10-11 | Ncr Corporation | Automatic speaker verification systems employing moment invariants |
US5202929A (en) * | 1979-09-24 | 1993-04-13 | Lemelson Jerome H | Data system and method |
GB2139389A (en) * | 1983-04-29 | 1984-11-07 | Voice Electronic Technology Li | Identification apparatus |
GB2145864B (en) * | 1983-09-01 | 1987-09-03 | King Reginald Alfred | Voice recognition |
JPS60181798A (ja) * | 1984-02-28 | 1985-09-17 | 電子計算機基本技術研究組合 | 音声認識装置 |
US4773093A (en) * | 1984-12-31 | 1988-09-20 | Itt Defense Communications | Text-independent speaker recognition system and method based on acoustic segment matching |
US4739398A (en) * | 1986-05-02 | 1988-04-19 | Control Data Corporation | Method, apparatus and system for recognizing broadcast segments |
GB2224117B (en) * | 1988-10-12 | 1993-06-09 | Detector Electronics | Processing signals derived from electromagnetic radiation sources |
JP2504171B2 (ja) * | 1989-03-16 | 1996-06-05 | 日本電気株式会社 | 声門波形に基づく話者識別装置 |
GB2232801B (en) * | 1989-05-18 | 1993-12-22 | Medical Res Council | Apparatus and methods for the generation of stabilised images from waveforms |
US5434560A (en) * | 1993-05-11 | 1995-07-18 | Detector Electronics Corporation | System for detecting random events |
US6400835B1 (en) | 1996-05-15 | 2002-06-04 | Jerome H. Lemelson | Taillight mounted vehicle security system employing facial recognition using a reflected image |
US6137863A (en) * | 1996-12-13 | 2000-10-24 | At&T Corp. | Statistical database correction of alphanumeric account numbers for speech recognition and touch-tone recognition |
US6154579A (en) * | 1997-08-11 | 2000-11-28 | At&T Corp. | Confusion matrix based method and system for correcting misrecognized words appearing in documents generated by an optical character recognition technique |
US6219453B1 (en) | 1997-08-11 | 2001-04-17 | At&T Corp. | Method and apparatus for performing an automatic correction of misrecognized words produced by an optical character recognition technique by using a Hidden Markov Model based algorithm |
US6141661A (en) * | 1997-10-17 | 2000-10-31 | At&T Corp | Method and apparatus for performing a grammar-pruning operation |
US6122612A (en) * | 1997-11-20 | 2000-09-19 | At&T Corp | Check-sum based method and apparatus for performing speech recognition |
US6205428B1 (en) | 1997-11-20 | 2001-03-20 | At&T Corp. | Confusion set-base method and apparatus for pruning a predetermined arrangement of indexed identifiers |
US6223158B1 (en) | 1998-02-04 | 2001-04-24 | At&T Corporation | Statistical option generator for alpha-numeric pre-database speech recognition correction |
US7937260B1 (en) * | 1998-06-15 | 2011-05-03 | At&T Intellectual Property Ii, L.P. | Concise dynamic grammars using N-best selection |
US6400805B1 (en) | 1998-06-15 | 2002-06-04 | At&T Corp. | Statistical database correction of alphanumeric identifiers for speech recognition and touch-tone recognition |
US20050096900A1 (en) * | 2003-10-31 | 2005-05-05 | Bossemeyer Robert W. | Locating and confirming glottal events within human speech signals |
RU2419890C1 (ru) | 2009-09-24 | 2011-05-27 | Общество с ограниченной ответственностью "Центр речевых технологий" | Способ идентификации говорящего по фонограммам произвольной устной речи на основе формантного выравнивания |
AU2017274657B2 (en) * | 2016-06-02 | 2019-12-19 | Genesys Telecommunications Laboratories, Inc. | Technologies for authenticating a speaker using voice biometrics |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US2403986A (en) * | 1944-05-08 | 1946-07-16 | Bell Telephone Labor Inc | Wave translation |
US2685615A (en) * | 1952-05-01 | 1954-08-03 | Bell Telephone Labor Inc | Voice-operated device |
US2866899A (en) * | 1955-12-12 | 1958-12-30 | Itt | Electronic spectroanalysis computer |
US3036268A (en) * | 1958-01-10 | 1962-05-22 | Caldwell P Smith | Detection of relative distribution patterns |
US3202761A (en) * | 1960-10-14 | 1965-08-24 | Bulova Res And Dev Lab Inc | Waveform identification system |
US3129287A (en) * | 1961-03-20 | 1964-04-14 | Ibm | Specimen identification system |
-
1966
- 1966-05-02 US US546945A patent/US3466394A/en not_active Expired - Lifetime
-
1967
- 1967-04-19 GB GB07934/67A patent/GB1179029A/en not_active Expired
- 1967-04-29 DE DE19671547032 patent/DE1547032A1/de active Pending
-
1969
- 1969-03-07 JP JP1396767A patent/JPS458243B1/ja active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE2104012A1 (de) * | 1970-01-30 | 1971-08-05 | Lannionnais Electronique | Adaptiver Sprachanalysator |
Also Published As
Publication number | Publication date |
---|---|
GB1179029A (en) | 1970-01-28 |
US3466394A (en) | 1969-09-09 |
JPS458243B1 (de) | 1970-03-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE1547032A1 (de) | Einrichtung zum Identifizieren einer Person | |
DE3317325C2 (de) | ||
DE3236834C2 (de) | Verfahren und Gerät zur Sprachanalyse | |
DE2918533C2 (de) | ||
DE69327188T2 (de) | Einrichtung für automatische Spracherkennung | |
DE2953262C2 (de) | ||
EP0366192B1 (de) | Textverarbeitungsvorrichtung | |
DE4397100C2 (de) | Verfahren zum Erkennen von Sprachsignalen und Spracherkennungssystem mit rekursiver Grammatik mit endlicher Zustandsanzahl | |
DE4436692C2 (de) | Trainingssystem für ein Spracherkennungssystem | |
DE3236832A1 (de) | Verfahren und geraet zur sprachanalyse | |
DE19942178C1 (de) | Verfahren zum Aufbereiten einer Datenbank für die automatische Sprachverarbeitung | |
DE2326517A1 (de) | Verfahren und schaltungsanordnung zum erkennen von gesprochenen woertern | |
DE2844156A1 (de) | Verfahren zum verifizieren eines sprechers | |
DE2524804A1 (de) | Verfahren und vorrichtung zur automatischen spracherkennung | |
DE4031638C2 (de) | ||
DE2752607A1 (de) | Verfahren zur erkennung von sprache | |
DE2659083A1 (de) | Verfahren und vorrichtung zur sprechererkennung | |
DE2020753A1 (de) | Einrichtung zum Erkennen vorgegebener Sprachlaute | |
DE2357067A1 (de) | Vorrichtung zur sprachanalyse | |
DE19837102A1 (de) | Verfahren und Anordnung zum Durchführen einer Datenbankanfrage | |
EP0285222A2 (de) | Verfahren zum Erkennen zusammenhängend gesprochener Wörter | |
DE1937464A1 (de) | Sprachanalysiergeraet | |
DE2720666A1 (de) | Verfahren und anordnung zur geraeuschanalyse | |
DE3215868C2 (de) | ||
DE2357949A1 (de) | Verfahren zum ermitteln des der periode der anregungsfrequenz der stimmbaender entsprechenden intervalls |