DE2104012C3 - Elektrische Einrichtung zur Erkennung von Sprachlauten - Google Patents
Elektrische Einrichtung zur Erkennung von SprachlautenInfo
- Publication number
- DE2104012C3 DE2104012C3 DE19712104012 DE2104012A DE2104012C3 DE 2104012 C3 DE2104012 C3 DE 2104012C3 DE 19712104012 DE19712104012 DE 19712104012 DE 2104012 A DE2104012 A DE 2104012A DE 2104012 C3 DE2104012 C3 DE 2104012C3
- Authority
- DE
- Germany
- Prior art keywords
- filters
- electrical device
- numerical
- memory
- signals
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Circuit For Audible Band Transducer (AREA)
- Stereophonic System (AREA)
- Auxiliary Devices For Music (AREA)
- Complex Calculations (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
Description
Die Erfindung betrifft eine elektrische Einrichtung zur Erkennung von Sprachlauten der im Oberbegriff des
Anspruchs 1 angegebenen Gattung.
Aus der DE-OS 15 47 032 ist eine Einrichtung zum
is Identifizieren einer Person bekannt, bei der die
elektrischen, den Sprachlauten entsprechenden Signale digital verameitet werden. Dabei erfolgt eine Art
»zweidimensional Verarbeitung«: Zunächst wurden zugehörige Spannungs- und Zeit-Koordinaten stimmhafter
.Sprachteile in digitaler Form gespeichert, so daß sich ein zweidimensionales Muster ergibt; diese
zweidimensionalen Muster, d. h. Wertepaare, werden mit gespeicherten Wertepaaren verglichen und anschließend
der Mittelwert für eine vorgegebene Zahl von Vergleichsvorgängen gebildet, der schließlich mit
einem Festwert verglichen wird.
Aus der CH-PS 4 56 .80 ist eine Spracherkennungseinrichtung
bekannt, mit der sprachliche Informationen gespeichert und mit zugeordneten Erkennungs-Bezugs-
jo daten verglichen werden können.
Auf den Seiten 52 bis 55 der Zeitschrift »1966 IEEE International Convention Record, part 1« werden
allgemeine Probleme bei der Spracherkennung beschrieben, wobei jedoch keine »adaptiven« Systeme
Ji erörtert werden. Insbesondere auf die Verwendung von
festen Filtern wird ausführlich eingegangen.
Eine elektrische Einrichtung zur Erkennung von Sprachlauten der angegebenen Gattung ist schließlich
aus der DEOS 11 63 567 bekannt Eine solche
•to elektrische Einrichtung weist Filter für die Frequenzanalyse,
einen Speicher für den Spracnlauten entsprechende digitale Signale sowie eine Anordnung zur
Identifikation des Sprechers durch Vergleich der Signale auf.
Γ) Diese bekannte ! nrichtung arbeitet mit einem
analogen Verfahren, da die an den Filterausgängen vorliegenden Amplituden der elektrischen Signale
gespeichert werden. Die Verarbeitung von analogen Signalen erfordert jedoch einen hohen apparativen
">o Aufwand. Außerdem wird bei der bekannten Einrichtung
ebenfalls eine Art »zweidimensionales Verfahren« verwendet, da ein Verschiebespeicher zur /weidimensionalen
Auswertung dient, indem dessen Zeilenzahl zumindest gleich der Filterzahl gesetzt wird. Das
■>· dadurch gebildete Frequenz/Zeit-Muster wird /weidi
mensional mit vorgegebenen Mustern, insbesondere der
l.autübergänge. verglichen.
Diese Erzeugung von /weidimensionalen Frequenz/
Zeit-Mustern erfordert ebenfalls einen großen kon-
ho struktiven Aufwand, da hier/u Gleichrichter, ein
zweidimensionaler Verschiebespeicher, Impulsschalter, Impulsgeneratoren sowie entsprechende Identifikationseinrichtungen
benötigt werden.
Der Erfindung liegt deshalb die Aufgabe zugrunde,
h> eine elektrische Einrichtung zur Erkennung von
Sprachlauten der angegebenen Gattung zu schaffen, die einen konstruktiv einfachen Aufbau hat und trotzdem
zuverlässig arbeitet.
Diese Aufgabe wird erfindungsgemäß durch die im kennzeichnenden Teil des Anspruchs 1 angegebenen
Merkmale gelöst
Zweckmäßige Ausfilhrungsformen sind in den Unteransprüchen
zusammengestellt
Die mit der Erfindung erzielten Vorteile beruhen auf folgender Funktionsweise: Die den Sprachlauten
entsprechenden elektrischen Signale werden in digitale Signale umgewandelt die anschließend nur noch digital
weiterverarbeitet werden. Die Verwendung von digitalen Signalen ermöglicht eine sehr exakte und zuverlässige
Verarbeitung, zumal hierzu weitgehend bereits vorhandene, elektrische Bauelemente, insbesondere
integrierte Schaltungen, zur Verfügung stehen. Die Analyse dieser digitalen Signale erfolgt in Reihe, indem
die digitalen Signale nacheinander numerischen Bandfiltern zugeführt werden, die den gesamten nutzbaren
Sprachfrequenzbereich überstreichen. Dabei wird eine Filteranordnung mit genau definiertem Aufbau verwendet,
der nacheinander eine bestimmte vorgegebene Zahl von Konfigurationen einnehmen kann, die jeweils der
Zahl der Grundlaute in der zu verarbeitenden brache
entsprechen. So werden für die Erkennung eines Wortes der französischen Sprache beispielsweise 36 Grundlaute
benötigt, d. h, die Filteranordnung kann nacheinander 36 verschiedene Konfigurationen annehmen, wenn ein
Wort der französischen Sprache erkannt werden soll.
Der Filteranordnung werden gleichzeitig verschiedene Koeffizienten zugeführt, die bestimmten Sprechern
zugeordnet sind. Wenn während einer Abtastung eine der Konfigurationen der Filteranordnung mit dem
gleichzeitig eintreffenden Laut übereinstimm·. so
erfolgt die Identifizierung des betreffenden Grundlautes.
In jeder Stellung des Schalters werden Koeffizienten angelegt, die den Sprachlauten eines bestimmten
Sprechers entsprechen. Auf diese Weise kann festgestellt werden, ob die zugefuhrten Worte von einem
bestimmten Sprecher stammen
Eine solche Einrichtung hat also einen relativ
einfachen Aufbau, so daß die Spracherkennung auf einfache und damit wirtschaftliche Weise erfolgen kann.
Die Anpassung an verschiedene Sprecher erfolgt nun dadurch, daß die gespeicherten Koeffizienten in
entsprechender Weise geändert werden. Eine ausrei chende Genauigkeit wird bereits dann erreicht, wenn
Insgesamt 16 numerische Bandfilter verwendet werden, da sich hierdurch das interessierende Sprachband von
300 bis 350OHz in 16 Bänder mit einer Breite von jeweils 200 Hz unterteilen IaJt.
Die Erfindung wird im einzelnen an Hand eines AusfuhrungsbiHspiels und der Zeichnung beschrieben.
Fig. 1 ist ein allgemeiner Schaltplan, der den Aufbau
einer erfindungsgemäßen Vorrichtung veranschaulicht;
F i g. 2 ist ein Schaltbild, das die Vorgänge der
Eingabe und Entnahme von Daten in einen bzw. aus einem Speicher zeigt, der Teil der Vorrichtung nach
Fig. I ist;
Fig. 3 ist ein Schaltplan, der den Aufbau von
Lerner Filtern veranschaulicht, wobei mehrere Resona
toren parallel geschaltet und drei nebeneinanderliegencie
Resonatoren aus einer Resonatorkette ausgewählt sind;
Fig. 4 ist ein Schaltbild, das den Aufbau eines Resonators für ein numerisches Lerner-Filter veranschaulicht;
Fig. 5 ist ein vereinfach is Prinzip-Schaltbild eines
Lerner-Resonators entsprechend F i g. 4;
F i g. 6a und 6b sind Schaltbilder der dem Schaltbild nach F i g. 5 zugeordneten Korrekturschaltungen;
Fig.7 ist ein Schaltbild, das den Aufbau eines numerischen Filters zeigt und zwar durch Zuordnung
ι von drei Resonatoren nach F i g. 5, die durch eine Summierungsschaltung abgeschlossen werden;
F i g. 8 ist das Schaltbild eines in der Summierungsschaltung der F i g. 7 enthaltenen Tiefpaß-Filters.
In Fig. 1 ist mit 11 ein Mikrophon bezeichnet in das
ι» ein Sprecher L hineinspricht und das Sprechströme
abgibt die von der Abtastvorrichtung 12 mit einer von einem Taktgeber 13 festgelegten Kadenz, beispielsweise
mit der Frequenz von 8 kHz und Intervallen von 125 \ls abtastet Die abgetasteten Werte werden in
ι") einem Analog/Digital-Umsetzer 14 quantisiert. Die
Abtastung und die Quantisierung erfolgen sehr schnell mit der Geschwindigkeit von einigen Mikrosekunden.
Die Quantisierung erfolgt beispielsweise in Form eines Wortes mit zehn Informationsbits und einem Prüfbit,
d. h. insgesamt elf Bits.
Ein solches Wort gelang: bei Λ in sw.cr, Pufferspei
eher 15. dessen Kapazität beispielsweise 1024 Wörter beträgt. Wenn der Speicher von oben bis unten voll ist.
beginnt die Eingabe erneut von oben usw, usf. Die Eingabe e:nes Wortes erfolgt alle 125 μ5, und der
Speicher enthält ständig Informationen, die einem Zeitabschnitt von 125 μβ χ 1024 = 128 ms. d.h. der
ungefähren Dauer eines Sprachlautes, entsprechen.
Jedes Wort mit 11 Bits, das aus dem Speicher 15 über
w die Ausgangsklemme B entnommen wird, wird über
einen Schalter 16 mit 36 Stellungen, die der Anzahl der Laute der französischen Sprache entsprechen, auf eine
Anordnung 17 mit 16 numerischen Filtern a. b ... ρ gegeben.
i> In jeder Stellung des Schalters 16 legt ein mit diesem
fest verbundener Schalter 18 die Koeffizienten an. die einer aus 36 Matrizen ausgewählten Matrix entnommen
sind. Diese Kennwerttafeln sind durch 36 waigererhte Linien veranschaulicht, die zu einer Matrix 19 gehören.
■ι» In jeder der 36 Stellungen des Schalters 18 werden in
der A· Ordnung 17. die in einem gegebenen Augenblick einen Abtastwert empfängt, die Kenntwerte entsprechend
der Stellung des Schalters 18 geändert.
Die Kennwerte der Matrix 19 werden entsprechend
4Ί den Koeffizienten des Sprechers Z, die im voraus
eingespeichert wurden, angeglichen. Jede senkrechte Linie der Matrix 19 wird von einer senkrechten Linie
der Anordnung 20 gebildet
Die Eingabe der Kennwerte der Anordnung 20 in die
>(i Matrix 19 erfolgt auf jede bekannte Weise.
An der Ausgangsklemme 21 wird ein logisches Signal abgegeben, wenn Koinzidenz eines eingespeicherten
Lautes m-t ^iner der aufeinanderfolgenden 36 Filterkonfigurationen
vorliegt.
υ Fig. 2 zeigt schema lisch den Speicher 15 mit
Zusatzgeräten.
Der Speicher 15 enthält beispielsweise 1024 Zeilen
mit 11 Bits. Er ist über ein Eingaberegiser 31
adressierbar, das alle I2r>
μs infolge Betätigung durch
mi einen Taktgeber 13 um eine Einheit vorrückt.
Die Eingabe der quantisierten Werte (Wörter mit 11
Bits), die bei A ankommen, erfolgt auf der Leitung, deren Adresse vom Register 31 abgegeben wird.
Die Abtastung erfolgt über die Ausgangsklemme B
μ unter Steuerung durcli -iin Lcseadressen-Register 32,
Jas jeweils um eine Einheit entsprechend einem Taktgeber 33 vorrückt, der auf die Betriebsgeschwindigkeii
eingestellt is!
Aus F i g. 3 ist ersichtlich, daß es zur Bildung von
Bandfiltern, im vorliegenden Fall von 16 Bandfiltern, besonders vorteilhaft, ist, den Aufbau der I.erner-Filter
zu verwenden, der in »Proceedings of the IEEE«. März 1964, unter dem Titel »Band-pass filters with linear -,
phase« beschrieben wird. Der interessanteste Kennwert eines solchen Filters ist die Phasenlinearität, durch die
eine praktisch konstnnte Gruppenlaufzeit im Durchlaßbereich erzielt werden kann.
Zur Herstellung eines Lerner-Filters werden η m
Resonatoren parallel geschaltet. Wenn beispielsweise η
= 3 ist und drei Übertragungsfunktionszellen S]. S2. S1
vorhanden sind, ergibt sich eine Übertragungsfunktion von
Bei In + 1 Resonatoren, die in Parallelschaltung
liegen, und infolge Kekursion zweier ungeradzahliger
Resonatoren und eines geradzahligen Zwischenresona- > tors werden π Filter mit drei Übertragungsfunktionszellen
erzielt.
Entsprechend F i g. 3 wird das an einer Klemme a
ankommende Signal auf 2/7 + I Zellen G. C:. C,... C2n
+ 1 gegeben. Die Ausgangssignale der Zellen sind Sc\. r. Sc2 usw. Der Ausgang der ungeradzahligen Zellen Γ,. Cj
ist mit einem Multipli kationsverstärker X1. ΑΊ versehen.
der eine Multiplikation mit -, vornimmt. Der Ausgang
des Filters 1 bestehl aus einer Summierungsschaltung s"
2] ι. die bei S\ die Summe
ergibt, wobei S1-1 das Ausgangssignal der Zelle C\ ist.
In gleicher Weise wird an der <\usgangsklemme .V;
der Summierungsschaltung £: das Ausgangssignal des
aus den Zellen Cj. Q. Cl usw. bestehenden Filiers
erhalten.
F i g. 4 zeigt das Übersichtschaltbild eines Resonators
fur ein numerisches Lirrner-riiier.
Das eintreffende Signal X wird auf einen ersten
Summationsverstärki:r A\ gegeben, dessen Ausgangssignal
V'einerseits einem sogenannten Erstwortspeicher
71 und einem zweiten Summationsverstärker A2
zugeführt wird. Der Ausgang Y\ von T\ liegt an einem zweiten Speicher T?, einem sogenannten Zweitwortspeicher,
sowie am Eingang eines Verstärkers X3. der zur Multiplikation rrit einem Faktor - Si dient, und
ferner am Eingang eines mit 5·/2 multiplizierenden Verstärkers Xh. Der Ausgang von 72 liegt an einem
dritten Multiplikationsverstärker Xa der eine Multiplikation mit dem Faktor — Bi vornimmt. Die Speicher Ti
und 7~2 speichern die Information während der Zeit T =
125us.
Die Ausgänge von X1 und Xc sind an zwei Eingänge
des Summationsverstärkers A\ angelegt, und der
Ausgang von Xb liegt an einem Eingang des Summa-
tionsverstärkers A^ wobei der Ausgang S des
Summationsverstärkers Ai am Ausgang des Resonators
liegt.
F i g. 5 ist ein vereinfachtes Schaltbild eines numeri schen Lemer-Resonators entsprechend F i g. 4.
Die Multiplikationen nach dem Schema der Fig.4
erfolgen durch Summierung von Logarithmen, unter Umrechnung der arithmetischen Werte in Logarithmen.
Addition der Logarithmen und entgegengesetzter Umrechnung der Summe der Logarithmen in den
arithmetischen Wert.
Mit W1 ist ein Speicher bezeichnet, welcher den Wert
log B\ für einen bestimmten Resonator enthält, der der
Matrix 19 nach Fig. I entnommen ist. M2 ist ein
Speicher mit dem Wert log Vi, der dem Speicher 7; nach gekennzeichnet Fig. 4 entspricht. Mi ist ein
Speicher, der den Wert log Y2 enthält, der dem Speicher
T2 der F i g. 4 entspricht, ist ein Speicher, der den Wert
log Bi enthalt, der der Matrix 19 der F i g. 1 entnommen
ist.
Mit Q\ und Oi sind zwei Summierungsschaltungen
von Logarithmen bezeichnet, und Qi, Qi. Q^ sind
Summierungsschaltungen linearer Größen.
Mit K] und K2 sind Umsetzer von Logarithmen in
arithmetische Werte und mit Ki ist ein Umsetzer von
arithmetischen Werten in Logarithmen bezeichnet.
Mit D ist ein Teiler durch 2 bezeichnet. X ist ein
Eingaberegister, das der Klemme mit der gleichen Bezeichnung in F i g 4 entspricht.
Die Summierungsschaltung ζ)ι empfängt die Ausgangssignale
Wi und M2; sie summiert sie und gibt deren
Summe auf den Eingang des Umsetzers K\. Am Ausgang des Umsetzers K\ wird der Wert - B\
>, erzielt. Dieser Wert wird auf den ersten Eingang der
Summierungsschaltung Q5 gegeben. Er wird ebenfalls
auf den Eingang des Teilers durch zwei, D. gegeben. Letzterer liefert den Wert - B\
>Ί/2. der auf einen ersten Eingang der Summierungsschaltung Q, gegeben
wird.
Das Ausgangssignal des Speichers M2 wird in den
Speicher /V5 eingegeben, wobei die Taktgeb;rzeit um
eine Einheit abweicht. Der Ausgang des Spe chers W) und der Ausgang des Speichers Ma liegen an den beiden
Eingängen der Summierungsschaltung Qi. deren Ausgang
mit dem Umsetzer Ki verbunden ist. Letzterer liefert den Wert -B2Y2. der auf einen Eingang der
Summierungsschaitung Qi gegeben wird, die an einem
anderen Eingang den Wert .-Vempfängt. Das Ausgangssignal
de- MimmitTungsschaltung Qi wird einerseits an
einen zweien f'ingang der Summierungsschiiltung Q--,
angeieg'. dl'-* am 'Mjsgarig ueii Wei ι
Y = X - B1 V1 - B7 Y2
abgibt. Dieser Wert wird durch den Umsetzer Xj in den
Logarithmus umgerechnet und auf den Eingang des Speichers M? gegeben.
Andererseits wird das Ausgangssignal der Summierungsschaliung
Qi an einem zweiten Eingang der Summierungsschaltung Qt angelegt, die am Au-jang
den Ausgangswert der Zelle abgibt, d. h.:
Fig.6a und 6b veranschaulichen, daß zur Erhöhung
der Präzision der Berechnung mittels Logarithmen eine Korrektur bei der Umrechnung des Logarithmus in den
arithmetischen Wert oder bei der entgegengesetzten Umrechnung erfolgt
Der Wert der Größe log Wwird ausgeherd von W
von einem numerischen Generator geliefert^- wobei
deren Funktion in Form von Segmenten einer Geraden unterschiedlicher Neigung eingespeichert wird. An den
Schnittpunkten der Enden der Segmente mit der Kurve ist der Fehler gleich NuIL Auf der Mitte der Segmente
ist die Abweichung zwischen dem richtigen Wert und dem angenäherten Wert auf ihrem Maximalv/erL Hier
sind Mittel zur Korrektur dieses Fehlers vorgesehen.
Umrechnung des Logariihmus in den arithmetischen
Wert. Diese umfaßt einen Umsetzer Kj, der unmittelbar den Kennwert c des Logarithmus empfängt, während
die Mantisse m einerseits auf eine Summierungsschaltung Qiund andererseits auf einen Korrekturspeicher M1
gegeben wird. Der Ausgang des Speichers M, liegt an einen1 zweiten Eingang der Summierungsschaltung Q\.
Der Umsetzer ^,empfängt den Kennwert cund die von
Ostammende, korrigierte Mantisse.
In Fig.6b ist eine Korrekturvorrichtnng für eine
Umrechnung des arithmischen Werts in den Logarithmus dargestellt. Die aus dem Umsetzer K1 stammende
Mantisse m wird auf eine Summierungsschaltung Q1 und
in einen Korrekturspeichcr M1 gegeben, dessen Ausgangssignal
an einen zweiten Eingang der Summierungsschaltung Qj angelegt wird. Am Ausgang der
Summierungsschnltung Q1 wird der Logarithmus aus
Kennwert cund berichtigter Mantisse erzielt.
F i g. 7 veranschaulicht die Anordnung dreier Resonatoren
zur Bildung eines Lerner-Filters, wobei die Anzahl drei lediglich beispielsweise gilt, sowie die Ausgangsschaltung
eines derartigen Lerner-Filters mit Einrichtungen zur Integration der abgegebenen Energie.
Der Wert Sc gemäß Fig. 5 wird der Reihe nach an
drei Register Wi, R2, Rj gegeben, die zu einem
bestimmten Zeitpunkt die Werte Sei. Sc2 bzw. Scj
enthalten. Diese Größen werden von einer Schaltungsanordnung P auf drei Register R\, R'2, R'i gegeben, und
iwar in Form von a^Sc\. a2S& bzw. ajScj. Die
Koeffizienten haben den Wert
(Fig. 3). Diese Vorgänge werden durch einen Taktgeber
W gesteuert.
Die Ausgangssignale der drei Register R\. R'2, R'}
werden auf eine Summierungsschaltung Q gegeben, deren Ausgangswert in einem Register Rr mit dem
Ausgang Sf umgewandelt wird (Ausgang des Bandfilters).
Das Register Λ/rbesitzt im Prinzip eine Klemme b, an
«fan n··* Ctotiei-rinnil οηΐτοΙαπΙ morrlon L·»» η r» ΓΛΐοΚΌ
Klemme wird in der in F i g. 7 gezeigten Schaltung nicht verwendet, und folglich hat das erzielte Signal die
gleiche Polarität, ohne Rücksicht darauf welches die Polarität des aus Q austretenden Signals ist; mit anderen
Worten, es erfolgt eine Ganzwellengleichrichtung.
Das aus RF austretende gleichgerichtete Signal wird
auf eine Tiefpaß-Filterschaltung gegeben, die als Integrator dient. Diese Vorrichtung umfaßt vorteilhafterweise
beispielsweise zwei numerische Tiefpaß-Filterzellen Fi und F2, die die im Speicher Mk erhaltenen
Koeffizienten verwenden. Diese beiden Zellen weisen beispielsweise eine Übertragungskurve auf, die eine
Filirrsteilheit von 18 dB je Oktave hat. Bei dem Speicher Mk kann es sich um einen Festspeicher
handeln, der die Koeffizienten für eine feststehende Grenzfrequenz von beispielsweise 20 bis 25 Hz enthält.
Der Speicher Mk kann auch komplexer ausgebildet sein
und mehrere Koeffizientensätze enthalten, die entsprechend den jeweils erforderlichen Bedingungen automatisch
ausgewählt werden, so beispielsweise eine Grenzfrequenz in der Größenordnung von 60 Hz für
einen Explosivlaut.
Am Ausgang der zweiten Zelle F2, d. h. der Klemme
(J, liefert eine Vorrichtung t. die beispielsweise mit 50
Hz arbeitet, das Ausgangssignal an eine Klemme S.
F i g. 8 zeigt ein Schaltschema der beiden Tiefpaß-Filterzellen
Fi und F2 nach F i g. 7.
Die gesamte /orrichtung umfaßt drei Summierungsschaltungen
Qf,, Qj, Qa, drei Speicher 7j, Tt, Ti, ähnlich
den Speichern Ti und T2 nach F i g. 4, sowie vier
Multiplikationsverstärker ΛΊ, X2, Xj und X*.
Das an einem Eingang von Qt ankommende Signal Sf
wird mit dem Ausgangssignal vereinigt, das im Speicher Tj in Form von U\ verzögert wird, und es wird dann in X\
mit einem Koeffizienten JIc multipliziert.
Das Signal u des Ausgangs von Qs wird auf einen
Eingang von Q7 gegeben, der ein Ausgangssignal ν
abgibt. Dieses Signal ν wird im Speicher Ή verzögert
und tritt bei vi aus. Das Signal vt wird auf den Verstärker
X2 gegeben, der es mit - B\/2 multipliziert und der sein
Ausgangssigna! v2 an einen zweiten Eingang von Q7
anlegt.
Das Signa! V1 wird ferner angelegt:
— an einen Eingang des Verstärkers Xj, in dem es mit
B\ multipliziert wird;
— an den Eingang des Speichers 7s, dessen Ausgangs-
cinnqt t/. an einen Pinnnntr Hec VArctgrl/orc V.
angelegt wird, der es mit B2 multipliziert.
Die Summierungsschaltung Qa empfängt das Signal v, das Ausgangssignal vt und Xj und das Ausgangssignal vs von Xa. Der Ausgang der Summierungsschaltung ist die Klemme G. die aus F i g. 7 ersichtlich ist.
Die Summierungsschaltung Qa empfängt das Signal v, das Ausgangssignal vt und Xj und das Ausgangssignal vs von Xa. Der Ausgang der Summierungsschaltung ist die Klemme G. die aus F i g. 7 ersichtlich ist.
Hierzu 5 Blatt Zeichnungen
Claims (11)
1. Elektrische Einrichtung zur Erkennung von Sprachlauten mit Filtern für die Frequenzanalyse,
mit einem digitalen Speicher für den Sprachlauten entsprechende elektrische Signale und mit einer
Anordnung zur Identifizierung des Sprechers durch Vergleich der Signale mit vorgegebenen Signalen,
gekennzeichnet durch
a) einen bekannten Analog/Digital-Wandler (14) zur Umwandlung der in regelmäßigen zeitlichen
Abständen abgetasteten elektrischen Signale in digitale Signale.
b) einen Hilfsspeicher (15) mit einer Kapazität für
etwa der Dauer eines Sprachlautes entsprechende digitale Signale,
c) einen den gesamten nutzbaren Sprachfrequenzbereich überstreichenden Satz von numerischen
Bandfiltem(17)und
d) einen Schalter (18, 18), der den numerischen
Bandfiltern (17) eine der Zahl der möglichen Grundsprachlaute entsprechende Zahl von
Konfigurationen zuordnet, wobei
e) von der Identifikationsanordnung (20) die Stimme des Sprechers kennzeichnende Koeffizienten
über den Schalter (16, 18) auf die numerischen Bandfilter (17) gegeben werden.
2. Elektrische Einrichtung nach Anspruch 1, dadurch gekennzeichnet, daß die Identifikationsanordnung
(20) l;e Stimmen mehrerer Sprecher kennzeichnende Koeffizienter enthält.
3. Elektrische Einrichtung nach Anspruch 2, dadurch gekennzeichnet, daß -ils numerische Bandfilter
(17) Lerner-Filter verwendet werden, die durch Parallelschaltung mehrerer Resonatoren gebildet
werden.
4. Elektrische Einrichtung nach Anspruch 3. dadurch gekennzeichnet, daß jedes Lerner-Filter
drei numerische Resonatoren (C], O. Ci) aufweist,
die ein/eine IJbertraguiigsfunktionen (S„ 5,.i. S,>2)
durchführen.
5. Elektrische Einrichtung nach Anspruch 4, dadurch gekennzeichnet, daß zwei benachbarte
Lerner- Filter einen gemeinsamen Resonator aufweisen.
6. Elektrische Einrichtung nach einem der Ansprüche I bis 5, gekennzeichnet durch insgesamt
sechzehn numerische Bandfilter (17), die jeweils einen Durchlaßbereich in der Größenordnung von
200 H/ haben.
7 Elektrische Einrichtung nach einem der Ansprüche 4 bis 6. dadurch gekennzeichnet, daß der
Ausgang eines aus der Verbindung dreier Resonatoren bestehenden Filters /ur Durchführung einer
Gleichrichtung und Integration mit dem Eingang eines Tiefpasses (F], f)) verbunden ist.
8 f lcktnschc Einrichtung nach Anspruch 7.
dadurch gskenn/eichnet. daß der Tiefpaß (f-\. Fi)
zwei numerische Tiefpaßelemente aufweist
9. Elektrische Einrichtung nach Anspruch 8, dadurch gekennzeichnet, daß die Koeffizienten der
numerischen Tiefpaßelemente in einem Festspeicher fM^enthalten sind.
10. Elektrische Einrichtung nach Anspruch 9, dadurch gekennzeichnet, daß die gespeicherten
Koeffizienten entsprechend dem jeweiligen Bedarf auswählbar sind.
11. Elektrische Einrichtung nach Anspruch 10,
dadurch gekennzeichnet, daß die Resonatoren und numerischen Filter im wesentlichen aus Summationsverstärkern
und Speichern bestehen, wobei die Multiplikationen durch Additionen von Logarithmen
erfolgen.
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR7003429A FR2074813A1 (de) | 1970-01-30 | 1970-01-30 |
Publications (3)
Publication Number | Publication Date |
---|---|
DE2104012A1 DE2104012A1 (de) | 1971-08-05 |
DE2104012B2 DE2104012B2 (de) | 1980-08-07 |
DE2104012C3 true DE2104012C3 (de) | 1981-05-27 |
Family
ID=9049881
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE19712104012 Expired DE2104012C3 (de) | 1970-01-30 | 1971-01-28 | Elektrische Einrichtung zur Erkennung von Sprachlauten |
Country Status (3)
Country | Link |
---|---|
DE (1) | DE2104012C3 (de) |
FR (1) | FR2074813A1 (de) |
GB (1) | GB1303417A (de) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA1056504A (en) * | 1975-04-02 | 1979-06-12 | Visvaldis A. Vitols | Keyword detection in continuous speech using continuous asynchronous correlation |
DE3009785A1 (de) * | 1980-03-14 | 1981-10-01 | Deutsche Itt Industries Gmbh, 7800 Freiburg | Spektralanalysator |
CN103177723A (zh) * | 2011-12-20 | 2013-06-26 | 上海博泰悦臻电子设备制造有限公司 | 语音处理装置、车载终端设备及语音处理方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE1163567B (de) * | 1958-10-31 | 1964-02-20 | E H K Kuepfmueller Dr Ing | Einrichtung zur Erkennung von Sprachlauten |
GB1055371A (en) * | 1964-03-06 | 1967-01-18 | Standard Telephones Cables Ltd | Apparatus for the recognition of speech |
US3466394A (en) * | 1966-05-02 | 1969-09-09 | Ibm | Voice verification system |
-
1970
- 1970-01-30 FR FR7003429A patent/FR2074813A1/fr not_active Withdrawn
-
1971
- 1971-01-28 DE DE19712104012 patent/DE2104012C3/de not_active Expired
- 1971-04-19 GB GB2079671A patent/GB1303417A/en not_active Expired
Also Published As
Publication number | Publication date |
---|---|
GB1303417A (de) | 1973-01-17 |
DE2104012A1 (de) | 1971-08-05 |
DE2104012B2 (de) | 1980-08-07 |
FR2074813A1 (de) | 1971-10-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE2753277C2 (de) | Verfahren und Einrichtung zur Spracherkennung | |
DE2524497C3 (de) | Verfahren und Schaltungsanordnung zur Sprachsynthese | |
DE2934489C2 (de) | ||
DE3510660C2 (de) | ||
DE2613258A1 (de) | System zur automatischen spracherkennung | |
DE2627405B2 (de) | Schaltungsanordnung zur Berechnung der schnellen Fourier-Transformation (FFT) | |
DE2825082A1 (de) | Verfahren zur spracherkennung | |
DE1965480C3 (de) | Gerat zur Umwandlung eines in graphischen Zeichen gedruckten Textes in gesprochene Worte | |
DE4031638C2 (de) | ||
DE2020753A1 (de) | Einrichtung zum Erkennen vorgegebener Sprachlaute | |
DE2730662A1 (de) | Verfahren und schaltung zum erzeugen eines autokorrelations-funktions-faktors | |
DE1301364B (de) | Anordnung zur numerischen Verschluesselung von Analogsignalen | |
DE2104012C3 (de) | Elektrische Einrichtung zur Erkennung von Sprachlauten | |
DE2719175A1 (de) | Schallanalysiereinrichtung | |
DE2720666A1 (de) | Verfahren und anordnung zur geraeuschanalyse | |
DE1905680A1 (de) | Anlage zur Signalverarbeitung | |
DE2500059B2 (de) | Schaltungsanordnung zur Erzeugung von Kombinationen von digital synthetisierten, sinusförmigen Wellenformen | |
DE2544121A1 (de) | Digitaler pegelregler | |
DE3246712C2 (de) | ||
EP0803861B1 (de) | Verfahren zum Ableiten charakteristischer Werte aus einem Sprachsignal | |
DE1541624A1 (de) | Verfahren zur Frequenzumsetzung | |
DE2051589A1 (de) | Anordnung zur Synthese eines Signals | |
DE2028728A1 (de) | Frequenzspektrum Analysator | |
DE2453873A1 (de) | Fourier-analysator | |
DE2062589C3 (de) | Verfahren zur Ermittlung der Grundfrequenze eines wenigstens zeitweise periodischen Signales |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
OD | Request for examination | ||
OGA | New person/name/address of the applicant | ||
C3 | Grant after two publication steps (3rd publication) | ||
8339 | Ceased/non-payment of the annual fee |