DE2104012C3 - Elektrische Einrichtung zur Erkennung von Sprachlauten - Google Patents

Elektrische Einrichtung zur Erkennung von Sprachlauten

Info

Publication number
DE2104012C3
DE2104012C3 DE19712104012 DE2104012A DE2104012C3 DE 2104012 C3 DE2104012 C3 DE 2104012C3 DE 19712104012 DE19712104012 DE 19712104012 DE 2104012 A DE2104012 A DE 2104012A DE 2104012 C3 DE2104012 C3 DE 2104012C3
Authority
DE
Germany
Prior art keywords
filters
electrical device
numerical
memory
signals
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
DE19712104012
Other languages
English (en)
Other versions
DE2104012A1 (de
DE2104012B2 (de
Inventor
Pierre Lannion Lavanant
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alcatel CIT SA
Original Assignee
Compagnie Industrielle de Telecommunication CIT Alcatel SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Compagnie Industrielle de Telecommunication CIT Alcatel SA filed Critical Compagnie Industrielle de Telecommunication CIT Alcatel SA
Publication of DE2104012A1 publication Critical patent/DE2104012A1/de
Publication of DE2104012B2 publication Critical patent/DE2104012B2/de
Application granted granted Critical
Publication of DE2104012C3 publication Critical patent/DE2104012C3/de
Expired legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Stereophonic System (AREA)
  • Auxiliary Devices For Music (AREA)
  • Complex Calculations (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Description

Die Erfindung betrifft eine elektrische Einrichtung zur Erkennung von Sprachlauten der im Oberbegriff des Anspruchs 1 angegebenen Gattung.
Aus der DE-OS 15 47 032 ist eine Einrichtung zum
is Identifizieren einer Person bekannt, bei der die elektrischen, den Sprachlauten entsprechenden Signale digital verameitet werden. Dabei erfolgt eine Art »zweidimensional Verarbeitung«: Zunächst wurden zugehörige Spannungs- und Zeit-Koordinaten stimmhafter .Sprachteile in digitaler Form gespeichert, so daß sich ein zweidimensionales Muster ergibt; diese zweidimensionalen Muster, d. h. Wertepaare, werden mit gespeicherten Wertepaaren verglichen und anschließend der Mittelwert für eine vorgegebene Zahl von Vergleichsvorgängen gebildet, der schließlich mit einem Festwert verglichen wird.
Aus der CH-PS 4 56 .80 ist eine Spracherkennungseinrichtung bekannt, mit der sprachliche Informationen gespeichert und mit zugeordneten Erkennungs-Bezugs-
jo daten verglichen werden können.
Auf den Seiten 52 bis 55 der Zeitschrift »1966 IEEE International Convention Record, part 1« werden allgemeine Probleme bei der Spracherkennung beschrieben, wobei jedoch keine »adaptiven« Systeme
Ji erörtert werden. Insbesondere auf die Verwendung von festen Filtern wird ausführlich eingegangen.
Eine elektrische Einrichtung zur Erkennung von Sprachlauten der angegebenen Gattung ist schließlich aus der DEOS 11 63 567 bekannt Eine solche
•to elektrische Einrichtung weist Filter für die Frequenzanalyse, einen Speicher für den Spracnlauten entsprechende digitale Signale sowie eine Anordnung zur Identifikation des Sprechers durch Vergleich der Signale auf.
Γ) Diese bekannte ! nrichtung arbeitet mit einem analogen Verfahren, da die an den Filterausgängen vorliegenden Amplituden der elektrischen Signale gespeichert werden. Die Verarbeitung von analogen Signalen erfordert jedoch einen hohen apparativen
">o Aufwand. Außerdem wird bei der bekannten Einrichtung ebenfalls eine Art »zweidimensionales Verfahren« verwendet, da ein Verschiebespeicher zur /weidimensionalen Auswertung dient, indem dessen Zeilenzahl zumindest gleich der Filterzahl gesetzt wird. Das
■>· dadurch gebildete Frequenz/Zeit-Muster wird /weidi mensional mit vorgegebenen Mustern, insbesondere der l.autübergänge. verglichen.
Diese Erzeugung von /weidimensionalen Frequenz/ Zeit-Mustern erfordert ebenfalls einen großen kon-
ho struktiven Aufwand, da hier/u Gleichrichter, ein zweidimensionaler Verschiebespeicher, Impulsschalter, Impulsgeneratoren sowie entsprechende Identifikationseinrichtungen benötigt werden.
Der Erfindung liegt deshalb die Aufgabe zugrunde,
h> eine elektrische Einrichtung zur Erkennung von Sprachlauten der angegebenen Gattung zu schaffen, die einen konstruktiv einfachen Aufbau hat und trotzdem zuverlässig arbeitet.
Diese Aufgabe wird erfindungsgemäß durch die im kennzeichnenden Teil des Anspruchs 1 angegebenen Merkmale gelöst
Zweckmäßige Ausfilhrungsformen sind in den Unteransprüchen zusammengestellt
Die mit der Erfindung erzielten Vorteile beruhen auf folgender Funktionsweise: Die den Sprachlauten entsprechenden elektrischen Signale werden in digitale Signale umgewandelt die anschließend nur noch digital weiterverarbeitet werden. Die Verwendung von digitalen Signalen ermöglicht eine sehr exakte und zuverlässige Verarbeitung, zumal hierzu weitgehend bereits vorhandene, elektrische Bauelemente, insbesondere integrierte Schaltungen, zur Verfügung stehen. Die Analyse dieser digitalen Signale erfolgt in Reihe, indem die digitalen Signale nacheinander numerischen Bandfiltern zugeführt werden, die den gesamten nutzbaren Sprachfrequenzbereich überstreichen. Dabei wird eine Filteranordnung mit genau definiertem Aufbau verwendet, der nacheinander eine bestimmte vorgegebene Zahl von Konfigurationen einnehmen kann, die jeweils der Zahl der Grundlaute in der zu verarbeitenden brache entsprechen. So werden für die Erkennung eines Wortes der französischen Sprache beispielsweise 36 Grundlaute benötigt, d. h, die Filteranordnung kann nacheinander 36 verschiedene Konfigurationen annehmen, wenn ein Wort der französischen Sprache erkannt werden soll.
Der Filteranordnung werden gleichzeitig verschiedene Koeffizienten zugeführt, die bestimmten Sprechern zugeordnet sind. Wenn während einer Abtastung eine der Konfigurationen der Filteranordnung mit dem gleichzeitig eintreffenden Laut übereinstimm·. so erfolgt die Identifizierung des betreffenden Grundlautes.
In jeder Stellung des Schalters werden Koeffizienten angelegt, die den Sprachlauten eines bestimmten Sprechers entsprechen. Auf diese Weise kann festgestellt werden, ob die zugefuhrten Worte von einem bestimmten Sprecher stammen
Eine solche Einrichtung hat also einen relativ einfachen Aufbau, so daß die Spracherkennung auf einfache und damit wirtschaftliche Weise erfolgen kann. Die Anpassung an verschiedene Sprecher erfolgt nun dadurch, daß die gespeicherten Koeffizienten in entsprechender Weise geändert werden. Eine ausrei chende Genauigkeit wird bereits dann erreicht, wenn Insgesamt 16 numerische Bandfilter verwendet werden, da sich hierdurch das interessierende Sprachband von 300 bis 350OHz in 16 Bänder mit einer Breite von jeweils 200 Hz unterteilen IaJt.
Die Erfindung wird im einzelnen an Hand eines AusfuhrungsbiHspiels und der Zeichnung beschrieben.
Fig. 1 ist ein allgemeiner Schaltplan, der den Aufbau einer erfindungsgemäßen Vorrichtung veranschaulicht;
F i g. 2 ist ein Schaltbild, das die Vorgänge der Eingabe und Entnahme von Daten in einen bzw. aus einem Speicher zeigt, der Teil der Vorrichtung nach Fig. I ist;
Fig. 3 ist ein Schaltplan, der den Aufbau von Lerner Filtern veranschaulicht, wobei mehrere Resona toren parallel geschaltet und drei nebeneinanderliegencie Resonatoren aus einer Resonatorkette ausgewählt sind;
Fig. 4 ist ein Schaltbild, das den Aufbau eines Resonators für ein numerisches Lerner-Filter veranschaulicht;
Fig. 5 ist ein vereinfach is Prinzip-Schaltbild eines Lerner-Resonators entsprechend F i g. 4;
F i g. 6a und 6b sind Schaltbilder der dem Schaltbild nach F i g. 5 zugeordneten Korrekturschaltungen;
Fig.7 ist ein Schaltbild, das den Aufbau eines numerischen Filters zeigt und zwar durch Zuordnung ι von drei Resonatoren nach F i g. 5, die durch eine Summierungsschaltung abgeschlossen werden;
F i g. 8 ist das Schaltbild eines in der Summierungsschaltung der F i g. 7 enthaltenen Tiefpaß-Filters.
In Fig. 1 ist mit 11 ein Mikrophon bezeichnet in das
ι» ein Sprecher L hineinspricht und das Sprechströme abgibt die von der Abtastvorrichtung 12 mit einer von einem Taktgeber 13 festgelegten Kadenz, beispielsweise mit der Frequenz von 8 kHz und Intervallen von 125 \ls abtastet Die abgetasteten Werte werden in
ι") einem Analog/Digital-Umsetzer 14 quantisiert. Die Abtastung und die Quantisierung erfolgen sehr schnell mit der Geschwindigkeit von einigen Mikrosekunden. Die Quantisierung erfolgt beispielsweise in Form eines Wortes mit zehn Informationsbits und einem Prüfbit,
d. h. insgesamt elf Bits.
Ein solches Wort gelang: bei Λ in sw.cr, Pufferspei eher 15. dessen Kapazität beispielsweise 1024 Wörter beträgt. Wenn der Speicher von oben bis unten voll ist. beginnt die Eingabe erneut von oben usw, usf. Die Eingabe e:nes Wortes erfolgt alle 125 μ5, und der Speicher enthält ständig Informationen, die einem Zeitabschnitt von 125 μβ χ 1024 = 128 ms. d.h. der ungefähren Dauer eines Sprachlautes, entsprechen.
Jedes Wort mit 11 Bits, das aus dem Speicher 15 über
w die Ausgangsklemme B entnommen wird, wird über einen Schalter 16 mit 36 Stellungen, die der Anzahl der Laute der französischen Sprache entsprechen, auf eine Anordnung 17 mit 16 numerischen Filtern a. b ... ρ gegeben.
i> In jeder Stellung des Schalters 16 legt ein mit diesem fest verbundener Schalter 18 die Koeffizienten an. die einer aus 36 Matrizen ausgewählten Matrix entnommen sind. Diese Kennwerttafeln sind durch 36 waigererhte Linien veranschaulicht, die zu einer Matrix 19 gehören.
■ι» In jeder der 36 Stellungen des Schalters 18 werden in der A· Ordnung 17. die in einem gegebenen Augenblick einen Abtastwert empfängt, die Kenntwerte entsprechend der Stellung des Schalters 18 geändert.
Die Kennwerte der Matrix 19 werden entsprechend
4Ί den Koeffizienten des Sprechers Z, die im voraus eingespeichert wurden, angeglichen. Jede senkrechte Linie der Matrix 19 wird von einer senkrechten Linie der Anordnung 20 gebildet
Die Eingabe der Kennwerte der Anordnung 20 in die
>(i Matrix 19 erfolgt auf jede bekannte Weise.
An der Ausgangsklemme 21 wird ein logisches Signal abgegeben, wenn Koinzidenz eines eingespeicherten Lautes m-t ^iner der aufeinanderfolgenden 36 Filterkonfigurationen vorliegt.
υ Fig. 2 zeigt schema lisch den Speicher 15 mit Zusatzgeräten.
Der Speicher 15 enthält beispielsweise 1024 Zeilen mit 11 Bits. Er ist über ein Eingaberegiser 31 adressierbar, das alle I2r> μs infolge Betätigung durch
mi einen Taktgeber 13 um eine Einheit vorrückt.
Die Eingabe der quantisierten Werte (Wörter mit 11 Bits), die bei A ankommen, erfolgt auf der Leitung, deren Adresse vom Register 31 abgegeben wird.
Die Abtastung erfolgt über die Ausgangsklemme B
μ unter Steuerung durcli -iin Lcseadressen-Register 32, Jas jeweils um eine Einheit entsprechend einem Taktgeber 33 vorrückt, der auf die Betriebsgeschwindigkeii eingestellt is!
Aus F i g. 3 ist ersichtlich, daß es zur Bildung von Bandfiltern, im vorliegenden Fall von 16 Bandfiltern, besonders vorteilhaft, ist, den Aufbau der I.erner-Filter zu verwenden, der in »Proceedings of the IEEE«. März 1964, unter dem Titel »Band-pass filters with linear -, phase« beschrieben wird. Der interessanteste Kennwert eines solchen Filters ist die Phasenlinearität, durch die eine praktisch konstnnte Gruppenlaufzeit im Durchlaßbereich erzielt werden kann.
Zur Herstellung eines Lerner-Filters werden η m Resonatoren parallel geschaltet. Wenn beispielsweise η = 3 ist und drei Übertragungsfunktionszellen S]. S2. S1 vorhanden sind, ergibt sich eine Übertragungsfunktion von
Bei In + 1 Resonatoren, die in Parallelschaltung liegen, und infolge Kekursion zweier ungeradzahliger Resonatoren und eines geradzahligen Zwischenresona- > tors werden π Filter mit drei Übertragungsfunktionszellen erzielt.
Entsprechend F i g. 3 wird das an einer Klemme a ankommende Signal auf 2/7 + I Zellen G. C:. C,... C2n + 1 gegeben. Die Ausgangssignale der Zellen sind Sc\. r. Sc2 usw. Der Ausgang der ungeradzahligen Zellen Γ,. Cj ist mit einem Multipli kationsverstärker X1. ΑΊ versehen.
der eine Multiplikation mit -, vornimmt. Der Ausgang
des Filters 1 bestehl aus einer Summierungsschaltung s" 2] ι. die bei S\ die Summe
ergibt, wobei S1-1 das Ausgangssignal der Zelle C\ ist.
In gleicher Weise wird an der <\usgangsklemme .V; der Summierungsschaltung £: das Ausgangssignal des aus den Zellen Cj. Q. Cl usw. bestehenden Filiers erhalten.
F i g. 4 zeigt das Übersichtschaltbild eines Resonators fur ein numerisches Lirrner-riiier.
Das eintreffende Signal X wird auf einen ersten Summationsverstärki:r A\ gegeben, dessen Ausgangssignal V'einerseits einem sogenannten Erstwortspeicher 71 und einem zweiten Summationsverstärker A2 zugeführt wird. Der Ausgang Y\ von T\ liegt an einem zweiten Speicher T?, einem sogenannten Zweitwortspeicher, sowie am Eingang eines Verstärkers X3. der zur Multiplikation rrit einem Faktor - Si dient, und ferner am Eingang eines mit 5·/2 multiplizierenden Verstärkers Xh. Der Ausgang von 72 liegt an einem dritten Multiplikationsverstärker Xa der eine Multiplikation mit dem Faktor — Bi vornimmt. Die Speicher Ti und 7~2 speichern die Information während der Zeit T = 125us.
Die Ausgänge von X1 und Xc sind an zwei Eingänge des Summationsverstärkers A\ angelegt, und der Ausgang von Xb liegt an einem Eingang des Summa- tionsverstärkers A^ wobei der Ausgang S des Summationsverstärkers Ai am Ausgang des Resonators liegt.
F i g. 5 ist ein vereinfachtes Schaltbild eines numeri schen Lemer-Resonators entsprechend F i g. 4.
Die Multiplikationen nach dem Schema der Fig.4 erfolgen durch Summierung von Logarithmen, unter Umrechnung der arithmetischen Werte in Logarithmen. Addition der Logarithmen und entgegengesetzter Umrechnung der Summe der Logarithmen in den arithmetischen Wert.
Mit W1 ist ein Speicher bezeichnet, welcher den Wert log B\ für einen bestimmten Resonator enthält, der der Matrix 19 nach Fig. I entnommen ist. M2 ist ein Speicher mit dem Wert log Vi, der dem Speicher 7; nach gekennzeichnet Fig. 4 entspricht. Mi ist ein Speicher, der den Wert log Y2 enthält, der dem Speicher T2 der F i g. 4 entspricht, ist ein Speicher, der den Wert log Bi enthalt, der der Matrix 19 der F i g. 1 entnommen ist.
Mit Q\ und Oi sind zwei Summierungsschaltungen von Logarithmen bezeichnet, und Qi, Qi. Q^ sind Summierungsschaltungen linearer Größen.
Mit K] und K2 sind Umsetzer von Logarithmen in arithmetische Werte und mit Ki ist ein Umsetzer von arithmetischen Werten in Logarithmen bezeichnet.
Mit D ist ein Teiler durch 2 bezeichnet. X ist ein Eingaberegister, das der Klemme mit der gleichen Bezeichnung in F i g 4 entspricht.
Die Summierungsschaltung ζ)ι empfängt die Ausgangssignale Wi und M2; sie summiert sie und gibt deren Summe auf den Eingang des Umsetzers K\. Am Ausgang des Umsetzers K\ wird der Wert - B\ >, erzielt. Dieser Wert wird auf den ersten Eingang der Summierungsschaltung Q5 gegeben. Er wird ebenfalls auf den Eingang des Teilers durch zwei, D. gegeben. Letzterer liefert den Wert - B\ >Ί/2. der auf einen ersten Eingang der Summierungsschaltung Q, gegeben wird.
Das Ausgangssignal des Speichers M2 wird in den Speicher /V5 eingegeben, wobei die Taktgeb;rzeit um eine Einheit abweicht. Der Ausgang des Spe chers W) und der Ausgang des Speichers Ma liegen an den beiden Eingängen der Summierungsschaltung Qi. deren Ausgang mit dem Umsetzer Ki verbunden ist. Letzterer liefert den Wert -B2Y2. der auf einen Eingang der Summierungsschaitung Qi gegeben wird, die an einem anderen Eingang den Wert .-Vempfängt. Das Ausgangssignal de- MimmitTungsschaltung Qi wird einerseits an einen zweien f'ingang der Summierungsschiiltung Q--, angeieg'. dl'-* am 'Mjsgarig ueii Wei ι
Y = X - B1 V1 - B7 Y2
abgibt. Dieser Wert wird durch den Umsetzer Xj in den Logarithmus umgerechnet und auf den Eingang des Speichers M? gegeben.
Andererseits wird das Ausgangssignal der Summierungsschaliung Qi an einem zweiten Eingang der Summierungsschaltung Qt angelegt, die am Au-jang den Ausgangswert der Zelle abgibt, d. h.:
Fig.6a und 6b veranschaulichen, daß zur Erhöhung der Präzision der Berechnung mittels Logarithmen eine Korrektur bei der Umrechnung des Logarithmus in den arithmetischen Wert oder bei der entgegengesetzten Umrechnung erfolgt
Der Wert der Größe log Wwird ausgeherd von W von einem numerischen Generator geliefert^- wobei deren Funktion in Form von Segmenten einer Geraden unterschiedlicher Neigung eingespeichert wird. An den Schnittpunkten der Enden der Segmente mit der Kurve ist der Fehler gleich NuIL Auf der Mitte der Segmente ist die Abweichung zwischen dem richtigen Wert und dem angenäherten Wert auf ihrem Maximalv/erL Hier sind Mittel zur Korrektur dieses Fehlers vorgesehen.
Fig.6a zeigt die Korrekturvorrichtung für die
Umrechnung des Logariihmus in den arithmetischen Wert. Diese umfaßt einen Umsetzer Kj, der unmittelbar den Kennwert c des Logarithmus empfängt, während die Mantisse m einerseits auf eine Summierungsschaltung Qiund andererseits auf einen Korrekturspeicher M1 gegeben wird. Der Ausgang des Speichers M, liegt an einen1 zweiten Eingang der Summierungsschaltung Q\. Der Umsetzer ^,empfängt den Kennwert cund die von Ostammende, korrigierte Mantisse.
In Fig.6b ist eine Korrekturvorrichtnng für eine Umrechnung des arithmischen Werts in den Logarithmus dargestellt. Die aus dem Umsetzer K1 stammende Mantisse m wird auf eine Summierungsschaltung Q1 und in einen Korrekturspeichcr M1 gegeben, dessen Ausgangssignal an einen zweiten Eingang der Summierungsschaltung Qj angelegt wird. Am Ausgang der Summierungsschnltung Q1 wird der Logarithmus aus Kennwert cund berichtigter Mantisse erzielt.
F i g. 7 veranschaulicht die Anordnung dreier Resonatoren zur Bildung eines Lerner-Filters, wobei die Anzahl drei lediglich beispielsweise gilt, sowie die Ausgangsschaltung eines derartigen Lerner-Filters mit Einrichtungen zur Integration der abgegebenen Energie.
Der Wert Sc gemäß Fig. 5 wird der Reihe nach an drei Register Wi, R2, Rj gegeben, die zu einem bestimmten Zeitpunkt die Werte Sei. Sc2 bzw. Scj enthalten. Diese Größen werden von einer Schaltungsanordnung P auf drei Register R\, R'2, R'i gegeben, und iwar in Form von a^Sc\. a2S& bzw. ajScj. Die Koeffizienten haben den Wert
(Fig. 3). Diese Vorgänge werden durch einen Taktgeber W gesteuert.
Die Ausgangssignale der drei Register R\. R'2, R'} werden auf eine Summierungsschaltung Q gegeben, deren Ausgangswert in einem Register Rr mit dem Ausgang Sf umgewandelt wird (Ausgang des Bandfilters).
Das Register Λ/rbesitzt im Prinzip eine Klemme b, an
«fan n··* Ctotiei-rinnil οηΐτοΙαπΙ morrlon L·»» η r» ΓΛΐοΚΌ
Klemme wird in der in F i g. 7 gezeigten Schaltung nicht verwendet, und folglich hat das erzielte Signal die gleiche Polarität, ohne Rücksicht darauf welches die Polarität des aus Q austretenden Signals ist; mit anderen Worten, es erfolgt eine Ganzwellengleichrichtung.
Das aus RF austretende gleichgerichtete Signal wird auf eine Tiefpaß-Filterschaltung gegeben, die als Integrator dient. Diese Vorrichtung umfaßt vorteilhafterweise beispielsweise zwei numerische Tiefpaß-Filterzellen Fi und F2, die die im Speicher Mk erhaltenen Koeffizienten verwenden. Diese beiden Zellen weisen beispielsweise eine Übertragungskurve auf, die eine Filirrsteilheit von 18 dB je Oktave hat. Bei dem Speicher Mk kann es sich um einen Festspeicher handeln, der die Koeffizienten für eine feststehende Grenzfrequenz von beispielsweise 20 bis 25 Hz enthält. Der Speicher Mk kann auch komplexer ausgebildet sein und mehrere Koeffizientensätze enthalten, die entsprechend den jeweils erforderlichen Bedingungen automatisch ausgewählt werden, so beispielsweise eine Grenzfrequenz in der Größenordnung von 60 Hz für einen Explosivlaut.
Am Ausgang der zweiten Zelle F2, d. h. der Klemme (J, liefert eine Vorrichtung t. die beispielsweise mit 50 Hz arbeitet, das Ausgangssignal an eine Klemme S.
F i g. 8 zeigt ein Schaltschema der beiden Tiefpaß-Filterzellen Fi und F2 nach F i g. 7.
Die gesamte /orrichtung umfaßt drei Summierungsschaltungen Qf,, Qj, Qa, drei Speicher 7j, Tt, Ti, ähnlich den Speichern Ti und T2 nach F i g. 4, sowie vier Multiplikationsverstärker ΛΊ, X2, Xj und X*.
Das an einem Eingang von Qt ankommende Signal Sf wird mit dem Ausgangssignal vereinigt, das im Speicher Tj in Form von U\ verzögert wird, und es wird dann in X\ mit einem Koeffizienten JIc multipliziert.
Das Signal u des Ausgangs von Qs wird auf einen Eingang von Q7 gegeben, der ein Ausgangssignal ν abgibt. Dieses Signal ν wird im Speicher Ή verzögert und tritt bei vi aus. Das Signal vt wird auf den Verstärker X2 gegeben, der es mit - B\/2 multipliziert und der sein Ausgangssigna! v2 an einen zweiten Eingang von Q7 anlegt.
Das Signa! V1 wird ferner angelegt:
— an einen Eingang des Verstärkers Xj, in dem es mit B\ multipliziert wird;
— an den Eingang des Speichers 7s, dessen Ausgangs-
cinnqt t/. an einen Pinnnntr Hec VArctgrl/orc V.
angelegt wird, der es mit B2 multipliziert.
Die Summierungsschaltung Qa empfängt das Signal v, das Ausgangssignal vt und Xj und das Ausgangssignal vs von Xa. Der Ausgang der Summierungsschaltung ist die Klemme G. die aus F i g. 7 ersichtlich ist.
Hierzu 5 Blatt Zeichnungen

Claims (11)

Patentansprüche:
1. Elektrische Einrichtung zur Erkennung von Sprachlauten mit Filtern für die Frequenzanalyse, mit einem digitalen Speicher für den Sprachlauten entsprechende elektrische Signale und mit einer Anordnung zur Identifizierung des Sprechers durch Vergleich der Signale mit vorgegebenen Signalen, gekennzeichnet durch
a) einen bekannten Analog/Digital-Wandler (14) zur Umwandlung der in regelmäßigen zeitlichen Abständen abgetasteten elektrischen Signale in digitale Signale.
b) einen Hilfsspeicher (15) mit einer Kapazität für etwa der Dauer eines Sprachlautes entsprechende digitale Signale,
c) einen den gesamten nutzbaren Sprachfrequenzbereich überstreichenden Satz von numerischen Bandfiltem(17)und
d) einen Schalter (18, 18), der den numerischen Bandfiltern (17) eine der Zahl der möglichen Grundsprachlaute entsprechende Zahl von Konfigurationen zuordnet, wobei
e) von der Identifikationsanordnung (20) die Stimme des Sprechers kennzeichnende Koeffizienten über den Schalter (16, 18) auf die numerischen Bandfilter (17) gegeben werden.
2. Elektrische Einrichtung nach Anspruch 1, dadurch gekennzeichnet, daß die Identifikationsanordnung (20) l;e Stimmen mehrerer Sprecher kennzeichnende Koeffizienter enthält.
3. Elektrische Einrichtung nach Anspruch 2, dadurch gekennzeichnet, daß -ils numerische Bandfilter (17) Lerner-Filter verwendet werden, die durch Parallelschaltung mehrerer Resonatoren gebildet werden.
4. Elektrische Einrichtung nach Anspruch 3. dadurch gekennzeichnet, daß jedes Lerner-Filter drei numerische Resonatoren (C], O. Ci) aufweist, die ein/eine IJbertraguiigsfunktionen (S„ 5,.i. S,>2) durchführen.
5. Elektrische Einrichtung nach Anspruch 4, dadurch gekennzeichnet, daß zwei benachbarte Lerner- Filter einen gemeinsamen Resonator aufweisen.
6. Elektrische Einrichtung nach einem der Ansprüche I bis 5, gekennzeichnet durch insgesamt sechzehn numerische Bandfilter (17), die jeweils einen Durchlaßbereich in der Größenordnung von 200 H/ haben.
7 Elektrische Einrichtung nach einem der Ansprüche 4 bis 6. dadurch gekennzeichnet, daß der Ausgang eines aus der Verbindung dreier Resonatoren bestehenden Filters /ur Durchführung einer Gleichrichtung und Integration mit dem Eingang eines Tiefpasses (F], f)) verbunden ist.
8 f lcktnschc Einrichtung nach Anspruch 7. dadurch gskenn/eichnet. daß der Tiefpaß (f-\. Fi) zwei numerische Tiefpaßelemente aufweist
9. Elektrische Einrichtung nach Anspruch 8, dadurch gekennzeichnet, daß die Koeffizienten der numerischen Tiefpaßelemente in einem Festspeicher fM^enthalten sind.
10. Elektrische Einrichtung nach Anspruch 9, dadurch gekennzeichnet, daß die gespeicherten Koeffizienten entsprechend dem jeweiligen Bedarf auswählbar sind.
11. Elektrische Einrichtung nach Anspruch 10, dadurch gekennzeichnet, daß die Resonatoren und numerischen Filter im wesentlichen aus Summationsverstärkern und Speichern bestehen, wobei die Multiplikationen durch Additionen von Logarithmen erfolgen.
DE19712104012 1970-01-30 1971-01-28 Elektrische Einrichtung zur Erkennung von Sprachlauten Expired DE2104012C3 (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
FR7003429A FR2074813A1 (de) 1970-01-30 1970-01-30

Publications (3)

Publication Number Publication Date
DE2104012A1 DE2104012A1 (de) 1971-08-05
DE2104012B2 DE2104012B2 (de) 1980-08-07
DE2104012C3 true DE2104012C3 (de) 1981-05-27

Family

ID=9049881

Family Applications (1)

Application Number Title Priority Date Filing Date
DE19712104012 Expired DE2104012C3 (de) 1970-01-30 1971-01-28 Elektrische Einrichtung zur Erkennung von Sprachlauten

Country Status (3)

Country Link
DE (1) DE2104012C3 (de)
FR (1) FR2074813A1 (de)
GB (1) GB1303417A (de)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA1056504A (en) * 1975-04-02 1979-06-12 Visvaldis A. Vitols Keyword detection in continuous speech using continuous asynchronous correlation
DE3009785A1 (de) * 1980-03-14 1981-10-01 Deutsche Itt Industries Gmbh, 7800 Freiburg Spektralanalysator
CN103177723A (zh) * 2011-12-20 2013-06-26 上海博泰悦臻电子设备制造有限公司 语音处理装置、车载终端设备及语音处理方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE1163567B (de) * 1958-10-31 1964-02-20 E H K Kuepfmueller Dr Ing Einrichtung zur Erkennung von Sprachlauten
GB1055371A (en) * 1964-03-06 1967-01-18 Standard Telephones Cables Ltd Apparatus for the recognition of speech
US3466394A (en) * 1966-05-02 1969-09-09 Ibm Voice verification system

Also Published As

Publication number Publication date
GB1303417A (de) 1973-01-17
DE2104012A1 (de) 1971-08-05
DE2104012B2 (de) 1980-08-07
FR2074813A1 (de) 1971-10-08

Similar Documents

Publication Publication Date Title
DE2753277C2 (de) Verfahren und Einrichtung zur Spracherkennung
DE2524497C3 (de) Verfahren und Schaltungsanordnung zur Sprachsynthese
DE2934489C2 (de)
DE3510660C2 (de)
DE2613258A1 (de) System zur automatischen spracherkennung
DE2627405B2 (de) Schaltungsanordnung zur Berechnung der schnellen Fourier-Transformation (FFT)
DE2825082A1 (de) Verfahren zur spracherkennung
DE1965480C3 (de) Gerat zur Umwandlung eines in graphischen Zeichen gedruckten Textes in gesprochene Worte
DE4031638C2 (de)
DE2020753A1 (de) Einrichtung zum Erkennen vorgegebener Sprachlaute
DE2730662A1 (de) Verfahren und schaltung zum erzeugen eines autokorrelations-funktions-faktors
DE1301364B (de) Anordnung zur numerischen Verschluesselung von Analogsignalen
DE2104012C3 (de) Elektrische Einrichtung zur Erkennung von Sprachlauten
DE2719175A1 (de) Schallanalysiereinrichtung
DE2720666A1 (de) Verfahren und anordnung zur geraeuschanalyse
DE1905680A1 (de) Anlage zur Signalverarbeitung
DE2500059B2 (de) Schaltungsanordnung zur Erzeugung von Kombinationen von digital synthetisierten, sinusförmigen Wellenformen
DE2544121A1 (de) Digitaler pegelregler
DE3246712C2 (de)
EP0803861B1 (de) Verfahren zum Ableiten charakteristischer Werte aus einem Sprachsignal
DE1541624A1 (de) Verfahren zur Frequenzumsetzung
DE2051589A1 (de) Anordnung zur Synthese eines Signals
DE2028728A1 (de) Frequenzspektrum Analysator
DE2453873A1 (de) Fourier-analysator
DE2062589C3 (de) Verfahren zur Ermittlung der Grundfrequenze eines wenigstens zeitweise periodischen Signales

Legal Events

Date Code Title Description
OD Request for examination
OGA New person/name/address of the applicant
C3 Grant after two publication steps (3rd publication)
8339 Ceased/non-payment of the annual fee