DE2448909C3 - - Google Patents

Info

Publication number
DE2448909C3
DE2448909C3 DE19742448909 DE2448909A DE2448909C3 DE 2448909 C3 DE2448909 C3 DE 2448909C3 DE 19742448909 DE19742448909 DE 19742448909 DE 2448909 A DE2448909 A DE 2448909A DE 2448909 C3 DE2448909 C3 DE 2448909C3
Authority
DE
Germany
Prior art keywords
formant
frequency
pass filter
signals
circuit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
DE19742448909
Other languages
German (de)
Other versions
DE2448909A1 (en
DE2448909B2 (en
Inventor
Hubertus 3300 Braunschweig Bettin
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
AEG Olympia Office GmbH
Original Assignee
Olympia Werke AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Olympia Werke AG filed Critical Olympia Werke AG
Priority to DE19742448909 priority Critical patent/DE2448909B2/en
Publication of DE2448909A1 publication Critical patent/DE2448909A1/en
Publication of DE2448909B2 publication Critical patent/DE2448909B2/en
Application granted granted Critical
Publication of DE2448909C3 publication Critical patent/DE2448909C3/de
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition

Description

Die Erfindung betrifft eine elektrische Schiltungsanordnung der im Oberbegriff des Patentanspruchs 1 angegebenen Art.The invention relates to an electrical circuit arrangement of the type specified in the preamble of claim 1.

Es sind bereits Spracherkennungsverfahren bekanntgeworden, bei denen die aus der Sprache gewonnenen analogen elektrischen Wellenzüge ausgewertet werden. In der DE-OS 14 72 038 ist ein solches Verfahren beschrieben, bei dem sowohl die Nulldurchgänge der Wellenzüge als auch die Intervalle der Nulldurchgänge ermittelt werden. Die während einer bestimmten Zeitspanne ermittelten Intervalle der Nulldurchgänge werden entsprechend ihrer Länge sortiert Danach wird die Anzahl der gleich langen Intervalle ermittelt, und aufgrund des Zählergebnisses werden über eine Zuordnerschaltung die Worte erkannt.Speech recognition methods have already become known in which the ones obtained from speech analog electrical wave trains are evaluated. In DE-OS 14 72 038 such a method described in which both the zero crossings of the wave trains and the intervals of the zero crossings be determined. The intervals of the zero crossings determined during a certain period of time are sorted according to their length Then the number of intervals of the same length is determined, and based on the count result, the words are recognized via an allocation circuit.

Diese Lösung ist mit ihren Nachteilen stellvertretend für die meisten bekannten Spracherkennungsverfahren, bei denen nur eine geringe Anzahl von Wörtern, meist Zahlwörter und einige Befehle, verarbeitet wird, da die Selektionsmöglichkeit der einzelnen Phoneme zu ungenau ist. Um den Wortschatz zu vergrößern, wäre ein erheblicher Aufwand an Schaltungen und Speicherplätzen erforderlich. Doch auch dann ist es — ohne die Fehler allzusehr ansteigen zu lassen — nur möglich, Stimmen verwandter Charakteristik und ähnlicher Sprechgeschwindigkeit zu erkennen. Das heißt, die Verfahren müssen an den jeweiligen Sprecher angepaßt werden.With its disadvantages, this solution is representative of most of the known speech recognition methods, in which only a small number of words, mostly numerals and some commands, are processed because the The possibility of selecting the individual phonemes is too imprecise. To increase the vocabulary, would be a considerable amount of circuitry and storage space is required. But even then it is - without them Allowing errors to increase too much - only possible, voices of related characteristics and similar Recognize the speed of speech. This means that the procedures must be adapted to the respective speaker will.

In der DE-AS 12 02517 ist eine Einrichtung zur automatischen Erkennung von gesprochenen Silben oder Wörtern beschrieben worden, in der jeweils eine einen Schwellenwert überschreitende Meßgröße das Auftreten oder Nichtauftreten einer Grundschwingung und einer Oberschwingung feststellt. Die Bewertung erfolgt mit ja bzw. nein und wird als Code zur Einstufung des untersuchten Lautes in eine Lautgruppe mittels einer Verknüpfungsschaltung verwendet. Die Lautgruppen-Markiersignale werden in der Reihenfolge ihres Auftretens in einem Speicher geordnet und nach Beendigung der gesprochenen Silbe zu deren Identifizierung herangezogen.In DE-AS 12 02517 a device is for automatic recognition of spoken syllables or words have been described in each one a measured variable exceeding a threshold value the occurrence or non-occurrence of a fundamental oscillation and a harmonic. The assessment is made with yes or no and is used as a code for classification of the examined sound is used in a sound group by means of a logic circuit. The phonetic group marking signals are arranged in the order of their appearance in a memory and after the end of the spoken syllable for their identification used.

Auch diese Schaltungsanordnung stellt eine Lösung dar. hei der nur eine eerinee Anzahl von Wörtern, z. B.This circuit arrangement also represents a solution. In other words, only a few words, e.g. B.

Zahlwörter, erkannt werden können. Die Schaltungsanordnung bietet keine ausreichend exakte Unterscheidungsmöglichkeit, um andere als ausgewählte Wörter zu selektieren.Numerals, can be recognized. The circuit arrangement does not provide a sufficiently precise way of distinguishing between words other than those selected to select.

Um diese Nachteile auszuschalten, ist ein Verfahren entwickelt worden, bei dem das Frequenzspektrum in mehrere Frequenzbänder zerlegt und das Auftreten von Formanten in den Frequenzbändern bestimmt wird DE-OS 15 47 027). Bei diesem Verfahren wird das jeweilige End" von Formanten, getrennt in vielen Frequenzbändern, von Differenzierschaltungen ermittelt In nachgeschalteten Verriegelungsschaltungen werden die Formantverhältnisse (steigend, fallend, unveränderlich) für sehr viele Vokal-Vektorgrößen im Sprachspektrum angezeigt. Weiterhin werden Konsonant-Kriterien in einem Frequenzanalysator und anhand von Energiestößen ermittelt In einer Konsonantmatrix werden die Formantenergie sowie die Formantkriterien eingespeichert Auch die ermittelten Formanten gelangen über einen Formantgeber in die Konsonantenmatrix, so daß insgesamt eine Vielzahl von Vektorgrößen — in der bekannten Ausführungsform 56 — zur Verfügung stehen.To eliminate these disadvantages, a method has been developed in which the frequency spectrum in several frequency bands are broken down and the occurrence of formants in the frequency bands is determined DE-OS 15 47 027). In this process the respective end is "separated by formants" into many Frequency bands, determined by differentiating circuits In downstream interlocking circuits the formant ratios (rising, falling, unchangeable) for a large number of vowel vector sizes in the Language spectrum displayed. Furthermore, consonant criteria are in a frequency analyzer and based on of energy surges determined The formant energy and the formant criteria are determined in a consonant matrix stored The formants determined are also transferred to the consonant matrix via a form transmitter, so that a total of a large number of vector sizes - in the known embodiment 56 - be available.

Mit diesem Spracherkennungsverfahren ist es zwar möglich, einen sehr viel größeren Wortschatz zu verarbeiten, jedoch wird hierzu ein schaltungstechnischer Aufwand benötigt, der ein solches Gerät für den praktischen Einsatz unrealistisch erscheinen läßtWith this speech recognition process it is possible to use a much larger vocabulary process, but this requires a circuitry effort that such a device for the makes practical use seem unrealistic

Der Erfindung liegt die Aufgabe zugrunde, mit geringem schaltungstechnischen Aufwand aus dem Frequenzspektrum der Sprachsignale Kriterien zu schaffen, aus denen der gesprochene Text — ohne Einschränkung des Vokabular-Umfanges — maschinenauswertbar erkannt werden kann.The invention is based on the object with little circuitry complexity from the Frequency spectrum of the speech signals to create criteria from which the spoken text - without Limitation of the range of vocabulary - can be recognized in a machine-evaluable manner.

Diese Aufgabe wird durch die im Patentanspruch 1 angegebene Erfindung gelöst Weitere Ausgestaltungen sind in den Unteransprüchen angegeben.This object is achieved by the invention specified in claim 1. Further developments are specified in the subclaims.

Dem Erfindungsgedanken liegt die Erkenntnis zugrunde, daß sich die für die Spracherkennung wesentlichen Sprachmerkmale aus dem Energiedichte-Spektrum des elektrischen Sprechsignals ableiten lassen. Für die einzelnen Phoneme — also die kleinste lautliche Einheit, die in derselben lautlichen Umgebung einen Bedeutungsunterschied ausmacht — entstehen beim Sprechen immer drei ausgeprägte Frequenzschwerpunkte. Diese Formanten genannten Frequenzschwerpunkte weichen bei verschiedenen Sprechern nr.r wenig voneinander ab. Enisprechende Untersuchungen haben gezeigt, daß ausschließlich die beiden Formanten mit der niedrigsten Frequenz für die Verständlichkeit eines Phonems wichtig sind. Die erfindungsgemäße Schaltung erlaubt deshalb, jedes Phonem mit hoher Zuverlässigkeit allein aus diesen beiden Formanten zu erkennen.The idea of the invention is based on the knowledge that the essential for speech recognition Derive speech features from the energy density spectrum of the electrical speech signal. For the individual phonemes - that is, the smallest phonetic unit that unites in the same phonetic environment Difference in meaning - when speaking there are always three pronounced frequency focal points. These frequency emphases, called formants, differ little for different speakers from each other. Corresponding studies have shown that only the two formants with the lowest frequency are important for the intelligibility of a phoneme. The circuit according to the invention therefore allows each phoneme to be recognized with high reliability from these two formants alone.

Der Vorteil der Erfindung liegt insbesondere darin, daß nur sehr wenige Bauelemente erforderlich sind, um vier Kriterien aus den Sprechsignalen abzuleiten, mit denen unabhängig von der Sprechgeschwindigkeit und der Amplitude der Sprechsignale eine sichere Analyse möglich ist. Diese vier Kriterien sind ausreichend für einen beliebig großen WortvorratThe advantage of the invention is in particular that only very few components are required to to derive four criteria from the speech signals, with which independent of the speech speed and a reliable analysis of the amplitude of the speech signals is possible. These four criteria are sufficient for an arbitrarily large set of words

In den Zeichnungen ist ein Ausführungsbeispiel der Erfindung dargestellt und wird nachfolgend näher erläutert. Es zeigen:In the drawings, an embodiment of the invention is shown and will be explained in more detail below explained. Show it:

F i g. 1 eine erfindungsgemäß gestaltete Schaltungsanordnung als Blockschaltbild,F i g. 1 shows a circuit arrangement designed according to the invention as a block diagram,

F i g. 2 bis 7 die Aufteilung des Sprachbandes zur Formanterkennung,F i g. 2 to 7 the division of the voice band for formant recognition,

F i g. 8 eine Schaltungsanordnung zur Auswertung der erfindungsgemäß gewonnenen Kriterien undF i g. 8 a circuit arrangement for evaluating the criteria obtained according to the invention and

F i g. 9 und 10 Kurven zur Selektion erkannter Silben.F i g. 9 and 10 curves for the selection of recognized syllables.

Wie aus dem Blockschaltbild der F i g. 1 ersichtlich ist, wird der gesprochene Text der Schaltung über ein Mikrofon 1 angeboten, das die Schallschwingungen in elektrische Signale umwandelt Die in einer Verstärkerschaltung 2 verstärkten elektrischen Signale gelangen an einen ersten Schaltungsteil 10 der Schaltungsanordnung, in dem der frequenzniedrigste Formant ermittelt wird, außerdem an einen zweiten Schaltungsteil 20, in dem der Formant nächsthöherer Frequenz ermittelt wird, und gleichzeitig an einen weiteren Schaltungsteil 40, in dem Sprechpausen automatisch erkannt werden.As shown in the block diagram of FIG. 1 can be seen, the spoken text of the circuit is offered via a microphone 1, which the sound vibrations in converts electrical signals The electrical signals amplified in an amplifier circuit 2 arrive to a first circuit part 10 of the circuit arrangement in which the lowest-frequency formant is determined is, also to a second circuit part 20, in which the formant of the next higher frequency is determined is, and at the same time to a further circuit part 40, in which speech pauses are automatically recognized.

Zur Aussiebung des frequenzhöheren der beiden frequenzniedrigsten Formanten wird das mit einer Bandbreite von ca. 200-2800Hz vom Mikrofon kommende Sprachsignal in Schaltung 20 über ein Hochpaßfilter 11 geleitet, um eine bessere Hervorhebung der höheren Frequenzen zu erreichen. In einem nachfolgenden Phasendifferenzverstärker 12 wird das Signal phasenverschoben, und der höchste Formant wird ausgefiltert Durch die Größe der Phasenverschiebung kann der nächsthöhere Formant mit zwar höherer Frequenz aber viel kleinerer Amplitude sicher unterdrückt werden.To filter out the higher frequency of the two lowest frequency formants, this is done with a Bandwidth of approx. 200-2800Hz speech signal coming from the microphone in circuit 20 via a High-pass filter 11 passed in order to achieve a better emphasis on the higher frequencies. In one subsequent phase difference amplifier 12, the signal is phase shifted, and the highest formant is filtered out. Due to the size of the phase shift, the next higher formant can have a higher Frequency but much smaller amplitude can be safely suppressed.

Mit »Phasendifferenzverstärker« ist (auch im folgenden) eine Schaltung bezeichnet, die aus einem Dilferenzverstärker besteht dessen einem Eingang der direkte Ausgang der vorhergehenden Schaltung und dessen zweitem Eingang der Ausgang der vorhergehenden Schaltung phasenverschoben zugeführt wird und die die Frequenzdifferenz bildet.The term "phase difference amplifier" denotes a circuit (also in the following) which consists of a differential amplifier, one input of which is the direct output of the preceding circuit and the second input of which is the output of the preceding circuit in a phase-shifted manner and which forms the frequency difference.

Das Ausgangssignal des Phasendifferenzverstärkers 12, das bei stimmhaften Phonemen einen sägezahnförmigen Verlauf hat, wird über eine Leitung 16 einer Schaltung 30 zur Vokalerkennung zugeführt Dem Phasendifferenzverstärker 12 ist eine Impulsformerschaltung 13 nachgeschaltet, die beispielsweise aus einem übersteuerten Phasendifferenzverstärker besteht und die sinusförmigen Signale in Rechteckimpulse umwandelt Die diesen Formanten darstellenden Signale können am Ausgang 14 des Schaltungsteiles 20 abgenommen werden.The output signal of the phase difference amplifier 12, which for voiced phonemes is a sawtooth Has course, is fed via a line 16 to a circuit 30 for vowel recognition Dem Phase difference amplifier 12 is followed by a pulse shaping circuit 13, for example from an overdriven phase differential amplifier and the sinusoidal signals in square pulses The signals representing these formants can be converted at the output 14 of the circuit part 20 be removed.

Die Analyse des frequenzniedrigsten Formanten wird durch Frequenzumsetzung in der Schaltung 10 erreicht. Das vom Mikrofon 1 kommende Eingangssignal wird über ein Tiefpaßfilter 3 zur besseren Hervorhebung der niederen Frequenzen geleitet und in einem nachgeschalteten Modulator 4 mit Trägerunterdrückung mit einer von einem Frequenzgenerator 8 kommenden, 1,2 kHz betragenden Frequenz gemischt Es entstehen zwei Mischprodukte, und zwar (bezeichnet mar die vom Tiefpaßfilter 3 kommende Frequenz mit Fl) 1,2 kHz plus F1 und 1,2 kHz minus Fl. Das Produkt 1,2 kHz plus FI wird von einem aktiven Tiefpaßfilter 5 unterdrückt. Aus dem verbleibenden Produkt 1,2 kHz minus Fl kann die — nun umgekehrt liegende — niedrigste Frequenz als höchste Frequenz durch einen Phasendifferenzverstärker 6 ausgesiebt werden.The analysis of the lowest frequency formant is achieved by frequency conversion in the circuit 10. The input signal coming from the microphone 1 is passed through a low-pass filter 3 to better emphasize the lower frequencies and in a downstream modulator 4 with carrier suppression with a A frequency of 1.2 kHz coming from a frequency generator 8 is mixed. Two are produced Mixing products, namely (denotes the frequency coming from the low-pass filter 3 with Fl) 1.2 kHz plus F1 and 1.2 kHz minus Fl. The product 1.2 kHz plus FI is suppressed by an active low-pass filter 5. From the remaining product 1.2 kHz minus Fl can be the - now reversed - lowest frequency as the highest frequency by a phase difference amplifier 6 are screened out.

Der Ausgang des Phasendifferenzverstärkers 6 wird über eine Leitung 15 wiederum der Schaltung 30 zur Vokalerkennung zugeführt. Auch hier sorgt eine Impulsiormerschaltung 7 dafür, dab die jinur,fürmigen Signale in Recheckimpulse umgewandelt werden.The output of the phase difference amplifier 6 is in turn fed to the circuit 30 for vowel recognition via a line 15. Here, too, a pulse generator 7 ensures that the ji n u r , shaped signals are converted into square pulses.

Anhand der F i g. 2 bis 7 läCi sich in einfacher Weise erkennen, wie die beiden Formanten ausgesiebt werden. In F i g. 2 ist das GesamtSDrachband dargestellt, das der Schaltung vom Mikrofon angeboten wird. Zur Formant-Based on the F i g. 2 to 7 can be easily done recognize how the two formants are sifted out. In Fig. 2 shows the total Dragon band that the Circuit offered by the microphone. To the formant

erkennung wird jedoch nur ein Teil dieses Sprachbandes benutzt, das in F i g. 3 dargestellt ist. F i g. 4 zeigt das für den Formanten mit der zweitniedrigsten Frequenz benutzte Sana, wie e« durch das Hochpaßfilter 11 der Schaltung 20 in F ι g. 1 ausgesiebt wird. Durch das Tiefp:>riUkt r 3 der P"ha!tung 10 in I- i g. 1 wird da: Sprachband für den Formanten niedrigster Frequenz (Fig 5) ausgefiltert und nachfolgend im Modulator 4 mit Trägerfrequenzunterdrückung mit einer Frequenz von 1,2 kHz gemischt. Die entstehenden Mischprodukte sind in Fig.6 dargestellt. Es sind die beiden Produkte 1,2 kHz plus das in Fig.5 dargestellte Frequenzband und 1,2 kHz minus dem Frequenzband der Fig. 5 (umgekehrt liegend) erkennbar. F i g. 7 schließlich zeigt das Formantband des Formanten niedrigster Frequenz nach Unterdrückung des höherfrequenten Mischproduktes durch das aktive Tiefpaßfilter 5. Die umgekehrt liegende niedrigste Frequenz kann jetzt also als höchste Frequenz durch den Phasendifferenzverstärker 6 ausgesiebt werden.recognition, however, only a part of this voice band is used, which is shown in FIG. 3 is shown. F i g. 4 shows the Sana used for the formant with the second lowest frequency, such as e «through the high-pass filter 11 of the circuit 20 in FIG. 1 is screened out. The low p: > r iUkt r 3 of the P "hold! 10 in I- i g. 1 da: the voice band for the formant of the lowest frequency (Fig. 5) is filtered out and then in the modulator 4 with carrier frequency suppression with a frequency of 1, The resulting mixed products are shown in Fig. 6. The two products 1.2 kHz plus the frequency band shown in Fig. 5 and 1.2 kHz minus the frequency band of Fig. 5 (reversed) can be seen 7 finally shows the formant band of the formant with the lowest frequency after the higher-frequency mixed product has been suppressed by the active low-pass filter 5.

Weiterhin ist in F i g. 1 die Schaltung 30 zur Vokalerkennung, die mit den Leitungen 15 und 16 der beiden Formantanalysatoren 10 und 20 verbunden ist, dargestellt. Hierzu wird die Tatsache ausgenutzt, daß Vokale stimmhafte Laute sind und gleichzeitig der Formant niedrigster Frequenz eine bestimmte Amplitudenhöhe überschreitet. Jeder dieser Punkte ist für sich allein für die Vokalerkennung nicht ausreichend, da auch Konsonanten stimmhaft sein können (n, m) und andererseits Reibelaute oder Explosivlaute eine hohe Amplitude aufweisen.Furthermore, in FIG. 1 shows the circuit 30 for vowel recognition, which is connected to the lines 15 and 16 of the two formant analyzers 10 and 20. For this purpose, use is made of the fact that vowels are voiced sounds and at the same time the formant of the lowest frequency exceeds a certain amplitude level. Each of these points alone is not sufficient for vowel recognition, since consonants can also be voiced (n, m) and, on the other hand, fricatives or explosive sounds have a high amplitude.

Im unteren Zweig der Vokalerkennungsschaltung 30 wird deshalb der Formant niedrigster Frequenz aus dem Formantanalysator 10 einer Amplitudenprüfung, im oberen Zweig der Formant der nächsthöheren Frequenz aus dem Formantanalysator 20, einer Stimmhaftigkeitsprüfung unterzogen. Der frequenzniedrigste Formant gelangt über Leitung 15 an einen einstellbaren Verstärker 17 und wird in einer nachfolgenden Schaltung 18 gleichgerichtet und geglättet. Das so behandelte Signal wird über ein Tiefpaßfilter 19 und eine Impulsformerschaltung 21 einer Konjunktion 23 als erster Eingang 22 zugeführt.In the lower branch of the vowel recognition circuit 30, the formant of the lowest frequency is therefore derived from the Formant analyzer 10 of an amplitude test, in the upper branch the formant of the next higher frequency from the formant analyzer 20, subjected to a voicing test. The lowest frequency Formant arrives at an adjustable amplifier 17 via line 15 and is used in a subsequent Circuit 18 rectified and smoothed. The signal treated in this way is passed through a low-pass filter 19 and a pulse shaper circuit 21 is supplied to a conjunction 23 as a first input 22.

Bei der Prüfung auf stimmhafte Laute wird davon ausgegangen, das stimmhafte Laute mit der Periode der »Pitch«-Frequenz angeregt werden und dann ausklingend einen sägezahnähnlichen Amplitudenverlauf haben, der besonders in den höheren Formanten ausgeprägt ist Der frequenzhöhere Formant wird vom Formantanalysator 20 über Leitung 16 einer Schaltung 24 zum Gleichrichten und Glätten und danach einem Tiefpaßfilter 25 zugeführt Die entstandenen Sägezahnimpulse werden durch einen Verstärker 26 mit quadratischer Verstärkung stark überhöht und zur Ansteuerung eines Zeitgliedes 27 zur Überbrückung der Impulspausen verwendet Nach Umformung in einer Impulsfonnerschaltung 28 bilden die Signale den zweiten Eingang 29 der Konjunktion 23. Hier werden die Bedingungen »Amplitude« und »stimmhaft« zur Aussage »Vokal« vereinigt, die sich am Ausgang 31 der Konjunktion 23 abnehmen läßtWhen checking for voiced sounds, it is assumed that the voiced sound has the period of "Pitch" frequency are excited and then have a sawtooth-like amplitude curve when it fades away, which is particularly pronounced in the higher formants The higher frequency formant is from Formant analyzer 20 via line 16 to a circuit 24 for rectifying and smoothing and then a Low-pass filter 25 supplied. The sawtooth pulses produced are transmitted by an amplifier 26 quadratic gain greatly exaggerated and to control a timing element 27 to bypass the Pulse pauses used After conversion in a pulse converter circuit 28, the signals form the second input 29 of conjunction 23. Here the conditions "amplitude" and "voiced" become The statement "vowel" combined, which can be taken from the exit 31 of the conjunction 23

Schließlich weist die Schaltungsanordnung noch den Sprachschalter 40 auf. Dieser Sprachschalter wird zur Erkennung von Sprechpausen benötigt Dazu werden die vom Mikrofon 1 kommenden Signale einem einstellbaren Verstärker 32 zugeführt, von dem sie nach Gleichrichtung und Glättung in einer entsprechenden Schaltung 33 über ein Tiefpaßfilter 34 an eine linpulsformerschaltung 35 gelangen. Durch eine optimale Linsteilung des Verstärkers 32 wird enciohi, du'1 auch Zisch- und H3uch!.iu;o ein einwandfreies Durch schalten des Schwellwertschalters ergeben. Am Ausr. gang 36 des Sprachschalters 40 können die entsprechenden Signale abgenommen werden.Finally, the circuit arrangement also has the voice switch 40. This speech switch is required to recognize pauses in speech. An optimal line division of the amplifier 32 will result in enciohi, du ' 1 also hissing and H3uch! .Iu; o a perfect switching through of the threshold value switch. On the off r . passage 36 of the voice switch 40, the corresponding signals can be picked up.

F i g. 8 zeigt als Beispiel einen Schaltungsaufbau, in dem die gemäß Fig. 1 aus den Sprechsignalen gewonnenen Kriterien zur Spracherkennung ausge-F i g. 8 shows a circuit configuration as an example in FIG according to which the criteria for speech recognition obtained from the speech signals according to FIG.

ιι· niint werden können. Aus den Formantcrkennungssignalcn auf den Leitungen 9 und 14, den Vokalerkennungssignalen auf Leitung 31 und den Sprechpausensignaien auf Leitung 36 werden Sprachkurven gebildet die Merkmale für die Phoneme darstellen. Die Phonemeιι · niint can be. From the formant recognition signals on lines 9 and 14, the vowel recognition signals on line 31 and the pause signals Speech curves are formed on line 36 which represent the features for the phonemes. The phonemes

is sind in ihrem Übergangsverhalten sehr stark von der Nachbar-Phonemen abhängig, d. h, die Formantfrequenzen sind für gleiche Laute unterschiedlich. Sc haben z. B. Explosivlaute (t, b, p, k) in Verbindung mit anderen Vokalen auch andere Formantfrequenzen. Umis are in their transition behavior very strongly dependent on the neighboring phonemes, i. That is, the formant frequencies are different for the same sounds. Sc have e.g. B. Explosives (t, b, p, k) in connection with other vowels also have other formant frequencies. Around

2(i dennoch die Sprechsignale sicher erkennen zu können wird von der üblichen Analyse einzelner Phoneme abgewichen, und in der Schaltung nach F i g. δ werden die Phoneme zu längeren, von Sprechzeit und Lautstärke unabhängigen künstlichen Silben (im folgen2 (i can still reliably recognize the speech signals is deviated from the usual analysis of individual phonemes, and in the circuit according to FIG. δ become the phonemes into longer, artificial syllables independent of speaking time and volume (in the following

2r> den Pseudosilben genannt) verbunden. Es werden dabei Silben gebildet, die aus Vokalen, Konsonanten und Pausen bestehen und deren Mittelpunkte Konsonanter sind. Eine Pseudosilbe kann demnach aus2 r > called the pseudosyllables). Syllables are formed that consist of vowels, consonants and pauses and the centers of which are consonants. A pseudosyllable can therefore consist of

Pause-Konsonant-Pause
Pause-Konsonant-Vokal
Vokal-Konsonant-Vokal
Vokal-Konsonant-Pause
Pause-consonant-pause
Pause consonant vowel
Vowel-consonant-vowel
Vowel-consonant pause

bestehen.exist.

i" Der Ausgang des Sprachschalters 40 wird über einer Inverter 37 zwei Konjunktionen 38 und 39 zugefühn und bildet jeweils deren ersten Eingang. Der zweite Eingang der Konjunktion 38 wird mit dem frequenzniedrigsten Formanten aus dem Formantanalysator ICi "The output of the voice switch 40 is via a Inverter 37 adds two conjunctions 38 and 39 and forms their first input. The second The conjunction 38 is input with the lowest frequency formant from the formant analyzer IC

in und der zweite Eingang der Konjunktion 39 mit derr Formanten der nächsthöheren Frequenz aus derr Formantanalysator 20 beaufschlagt Die Ausgänge dei Konjunktionen 38 und 39 werden Zählern 41 und 42 zugeführt in denen die Impulse der beiden Formanterin and the second input of conjunction 39 with derr Formants of the next higher frequency from the formant analyzer 20 applied to the outputs of the Conjunctions 38 and 39 are fed to counters 41 and 42 in which the impulses of the two formants

l'i während definierter Zeitintervalle von 20 ms gezähli werden. l 'i are counted during defined time intervals of 20 ms.

Danach werden die Zählerstände jeweils in Speicherr 45 bis 48 abgespeichert, und zwar getrennt nach Konsonanten und Vokalen. Diese Unterscheidung wirdThe counter readings are then stored in memories 45 to 48, separately Consonants and vowels. This distinction is made

■>" vom Ausgang der Schaltung 30 zur Vokalerkennung gesteuert Deren Ausgangssignale betätigen Schalter 43 und 44 derart, daß bei Auftreten eines Vokals, alsc Vorhandensein eines Ausgangssignals auf Leitung 31 die Schalter 43, 44 in eine die Zählerstände in die■> "from the output of the circuit 30 for vowel recognition Their output signals operate switches 43 and 44 in such a way that when a vowel occurs, alsc Presence of an output signal on line 31 the switches 43, 44 in a the counter readings in the

•3 Speicher 47, 48 leitende Stellung gebracht werden während sie sich bei Abwesenheit eines Signals aul Leitung 31 in der in Fig.8 gezeichneten Stellung befinden.• 3 stores 47, 48 are brought into a leading position while in the absence of a signal on line 31 it is in the position shown in FIG are located.

Die Zählerstände für Konsonanten des frequenzThe counters for consonants of the frequenz

"<> niedrigsten Formanten werden demnach im Speichel 45, die für Konsonanten des Formanten der nächsthöhe ren Frequenz im Speicher 46 abgespeichert, während die Zählerstände für Vokale des frequenzniedrigster Formanten im Speicher 47 und die für Vokale de:"<> lowest formants are therefore found in saliva 45 stored in memory 46 for consonants of the formant of the next higher frequency, while the counter readings for vowels of the lowest frequency formant in memory 47 and those for vowels de:

'■'■ frequenzhöheren Formanten im Speicher 48 abgespeichert werden. Es hat sich außerdem als zweckmäßig herausgestellt, daß bei der Abspeicherung der Konsonanten eine Kurvenglättung durch Mittelwertbildung '■' ■ higher- frequency formants are stored in the memory 48. It has also been found to be useful that when the consonants are saved, the curve should be smoothed by averaging

zwischen zwei aufeinanderfolgenden Zählers'ηr:i'en zweckmäßig sein kann.between two successive counters'ηr: i'en can be appropriate.

Die in den Speichern 4/, 1* üdcheinander eingespeicherten Vokal-Zählerstände sind jeweils in eine erste und eine zweite Hälfte unterteilt, damit Doppelvokale {ei, au, eu) erkannt werden können. Liie Ausgänge dieser beiden Speicher sind einer Schaltung 50 zur Bildung von Vokalschwerpunkten zugeführt, in der Vokalst verpunkte in einer anhand der Fig. 9 bis 12 beschriebenen Weise durch Mittelwertbildung erzeugt werden.The vowel counter readings stored one after the other in the memories 4 /, 1 * are each subdivided into a first and a second half so that double vowels (ei, au, eu) can be recognized. The outputs of these two memories are fed to a circuit 50 for forming vowel focal points, in which vowel points are generated in a manner described with reference to FIGS. 9 to 12 by averaging.

Ebenso werden die Ausgänge der Speicher 45,46 für Konsonanten-Zählerstände einer Schaltung 49 zur Konsonantenausdünnung zugeführt, in der sie mit dem Ausgang der Schaltung 50 zur Bildung von Vokalschwerpunkten vereinigt und einer ebenfalls in Verbindung mit den Fig.9 bis 12 beschriebenen Behandlung unterzogen werden.Likewise, the outputs of the memories 45, 46 for consonant counts of a circuit 49 for Consonant thinning supplied, in which it is connected to the output of the circuit 50 for the formation of vowel emphases combined and a treatment also described in connection with FIGS be subjected.

Als Ergebnis sind am Ausgang der Schaltung 49 den gesprochenen Silben entsprechende Signale abnehmbar, die einem Merkmalvergleicher 51 zugeführt werden.As a result, signals corresponding to the spoken syllables can be picked up at the output of the circuit 49, which are fed to a feature comparator 51.

in F i g. 9 ist eine geglättete Sprachkurve dargestellt, die von den Konsonanten und Vokalen des gesprochenen Wortes »nein« dadurch gebildet wird, daß auf der Abszisse der Ausgang des Zählers 41 für den frequenzniedrigsten Formanten und auf der Ordinate der Ausgang des Zählers 42 für den frequenzhöheren Formanten aufgetragen ist Die Teilung von Abszisse und Ordinate entspricht dabei den Formantfrequenzen. Die so gebildete Kurve wird durch die Schaltung 49 zur Konsonantenausdünnung und die Schaltung 50 zur Bildung von Vokalschwerpunkten auf wenige signifikante Punkte ausgedünnt Dazu wird die Kurve in einzelne Abschnitte mit genau definierbaren Anfangsund Endpunkten zerlegt In den Fig.9 bis 12 sind die Vokale entsprechenden Kurvenpunkte durch χ und die Konsonanten entsprechenden Kurvenpunkte durch · dargestelltin Fig. 9 shows a smoothed speech curve derived from the consonants and vowels of the spoken word Word "no" is formed by the fact that the output of the counter 41 for the lowest frequency formants and on the ordinate the output of counter 42 for the higher frequency Formant is plotted The division of the abscissa and ordinate corresponds to the formant frequencies. The curve thus formed is given by the circuit 49 for consonant thinning and the circuit 50 for Formation of vowel emphases thinned out to a few significant points. The curve in individual sections with precisely definable start and end points are broken down Curve points corresponding to vowels by χ and curve points corresponding to consonants by shown

Fig. 10 zeigt den Ausgang der Schaltung 50 zur Bildung von Vokalschwerpunkten. Es ist ersichtlich, daß aus der Vielzahl der Vokalpunkte in Fig.9 nunmehr durch die Bildung eines Mittelwertes je ein Vokalschwerpunkt erzeugt worden istFig. 10 shows the output of the circuit 50 for forming vowel centroids. It can be seen that from the multitude of vowel points in Fig. 9 now a vowel centroid has been generated by forming a mean value

F i g. 11 zeigt die Sprachkurve unter Einbeziehung der beiden Vokalschwerpunkte. Es sind nunmehr zwei Kurvenzüge vorhanden, deren Begrenzungspunkte jeweils vom Nullpunkt der Koordinatenmatrix und den Vokalschwerpunkten gebildet werden.F i g. 11 shows the speech curve including the both vowel emphases. There are now two curves, their delimitation points are each formed from the zero point of the coordinate matrix and the vowel centroids.

Fig. 12 schließlich zeigt den Ausgang der Schaltung 49 zur Konsonnntenausdünnung. Die Ausdünnung der beiden Konsonanten-Kurvenzüge erfolgt in diesem Ausführungsbeispiel durch Auslöschung der Kurvenpunkte mit den jeweils größten Winkeln zu den Nachbarpunkten. Die Kriterien bei der Ausdünnung sind zum einen Erhaltung der signifikanten Punkte und zum zweiten eine für alle gesprochenen Silben gleiche Punktzahl, da mit diesen Kriterien der später beschrie-Finally, FIG. 12 shows the output of the circuit 49 on the thinning of consons. The thinning of the two consonant curves takes place in this one Embodiment by deleting the curve points with the largest angles to the Neighboring points. The criteria for thinning are, on the one hand, preservation of the significant points and secondly, the same number of points for all spoken syllables, since these criteria are used to

Hi bene Vergleich mit Mustersilben am einfachsten durchführbar ist. In diesem Beispiel bestehen die beiden verbliebenen Kurvenzüge 54 und 55 in Fig. 12 demzufolge aus den jeweils vier merkmalstärksten Punkten.Hi bene comparison with sample syllables is easiest is feasible. In this example, there are the two remaining curves 54 and 55 in FIG. 12 consequently from the four most characteristic points.

is Die solcherart für einen Vergleich aufbereitete gesprochene Silbe gelangt in einen Vergleicher 51 (F i g. 8), dem aus einem Merkmalspeicher 52 Mustersilben zuführbar sind. Der Merkmalspeicher 52 ist beispielsweise ein Festwertspeicher, der alle vorkom-is The spoken syllable prepared in this way for a comparison reaches a comparator 51 (Fig. 8), to which 52 sample syllables can be fed from a feature memory. The feature memory 52 is For example, a read-only memory that contains all

2ü menden Mustersilben, ausgedrückt durch die gleiche Punktzahl wie die aufbereiteten Silben (im Beispiel also vier), enthält. Durch den Vergleich der aufbereiteten Silben im Merkmalvergleicher 51 wird diejenige unter allen Mustersilben ausgesucht die die geringste Abweichung von der aufbereiteten Silbe aufweist.2ü mend pattern syllables expressed by the same Contains the same number of points as the processed syllables (i.e. four in the example). By comparing the processed Syllables in the feature comparator 51 are selected from among all the sample syllables that is the least Shows a deviation from the processed syllable.

Das ist für die in den F i g. 9 bis 12 dargestellten Silben in den F i g. 13 und 14 näher zu sehen. In F i g. 13 taucht strichpunktiert wieder der Kurvenzug 55 mit seinen vier signifikanten Punkten auf, während in Fig. 14 derThat is for those in the fig. 9 to 12 shown syllables in fig. 13 and 14 to be seen in more detail. In Fig. 13 the curve 55 appears again with its four dash-dotted lines significant points, while in FIG. 14 the

jo Kurvenzug 54 strichpunktiert dargestellt ist In Vollinien ist in beiden Figuren jeweils die am nächsten kommende Mustersilbe als Kurve 56, 57 eingezeichnet. Der Unterschied zwischen aufbereiteter Silbe und Mustersilbe ergibt sich jeweils aus den schraffiert dargestelltenjo curve 54 is shown in dash-dotted lines in solid lines the closest pattern syllable is shown as curve 56, 57 in both figures. Of the The difference between the processed syllable and the sample syllable results from the hatched areas

J5 Flächen zwischen den beiden Kurvenzügen. Die kleinste Fläche entspricht der größten Ähnlichkeit. Jeder Mustersilbe ist ein Kennzeichen zugeordnet, das vom Merkmalvergleicher 51 an den Ausgang 53 weitergegeben wird.J5 areas between the two curves. The smallest Area corresponds to the greatest similarity. Each sample syllable is assigned an identifier that is dated from Feature comparator 51 is passed on to output 53.

Die in der beschriebenen Weise ermittelten Mustersilben stellen in erster Annäherung die erkannten gesprochenen Silben dar. Um zu einer einwandfreien, orthographisch richtigen Silbenausgabe zu gelangen, ist noch eine weitere Aufbereitung erforderlich, die z. B.The pattern syllables determined in the manner described represent the recognized ones as a first approximation spoken syllables. In order to achieve a flawless, orthographically correct syllable output, is still another processing required, the z. B.

durch Zusammenfügung der Kennzeichen der Mustersilben zu Worten und erneutem Vergleich mit einem Musterwort-Vorrat aus einem weiteren Festwertspeicher erfolgen kann.by combining the characteristics of the sample syllables into words and comparing them again with a Pattern word reserve can be made from a further read-only memory.

Hierzu 5 Blatt ZeichnungenIn addition 5 sheets of drawings

Claims (5)

Patentansprüche:Patent claims: 1. Elektrische Schaltungsanordnung für eine Einrichtung zur maschinenauswertbaren Spracherkennung, mit der das Frequenzspektrum der in Form elektrischer Signale dargebotenen Sprachsignale in »Sprachbänder« zerlegt, daraus »Formanten« und aus diesen »Vokale« ermittelt werden und die einen Sprachschalter aufweist, dadurch gekennzeichnet, einen ersten Schaltungsteil <10) zur Ermittlung der Anzahl der Schwingungen der »Formanten« niedrigster Frequenz, in dem das untere Sprachband ausgefiltert und dessen Frequenz umgesetzt, das untere Seitenband ausgesiebt sowie die Phasendifferenz zwischen dem unteren Seitenband und dem phasenverschobenen unteren Seitenband gebildet werden,1. Electrical circuit arrangement for a device for machine-evaluable speech recognition, with which the frequency spectrum of the speech signals presented in the form of electrical signals in "Speech bands" are broken down, from which "formants" and from these "vowels" are determined and the one Has voice switch, characterized in that a first circuit part <10) for Determination of the number of vibrations of the "formants" lowest frequency in which the The lower voice band is filtered out and its frequency is converted, the lower sideband is screened out as well the phase difference between the lower sideband and the out-of-phase lower sideband be formed einen zweiten Schaltungsteil (20) zur Ermittlung der Anzahl der Schwingungen des »Formanten« nächsthöherer Frequenz, in dem das obere Sprachband ausgefiltert und die Phasendifferenz zwischen dem oberen Sprachband und dem phasenverschobenen oberen Sprachband gebildet wird,
einen dritten Schaltungsteil (30) zur Erkennung von »Vokalen«, in dem das Überschreiten einer definierten Amplitudenhöhe des »Formanten« niedrigster Frequenz in erste Signale und das Vorliegen von Stimmhaftigkeit durch Auswertung der Sägezahnimpulse des »Formanten« nächsthöherer Frequenz in zweite Signale umgesetzt werden und bei gleichzeitigem Auftreten von ersten und zweiten Signalen gemeinsame Ausgangssignale abgegeben werden und
a second circuit part (20) for determining the number of oscillations of the "formant" of the next higher frequency, in which the upper voice band is filtered out and the phase difference between the upper voice band and the phase-shifted upper voice band is formed,
a third circuit part (30) for recognizing "vowels", in which the exceeding of a defined amplitude level of the "formant" of the lowest frequency in first signals and the presence of voicing are converted into second signals by evaluating the sawtooth pulses of the "formant" of the next higher frequency and common output signals are emitted when first and second signals occur simultaneously, and
einen vierten Schaltungsteil (40) zur den zeitlichen Ablauf prägenden automatischen Erkennung von Pausen in den Sprachsignalen durch einen Schwellwertschalter, die in Abhängigkeit von Sprechpausen Ausgangssignale liefert,a fourth circuit part (40) for the automatic detection of Pauses in the speech signals through a threshold switch that depends on pauses in speech Supplies output signals, wobei zur Auswertung die Ausgangssignale des ersten und des zweiten Schaltungsteiles (10, 20) — gesteuert von den Ausgangssignalen des vierten Schaltungsteiles (40) — getrennt zählbar sind, die Zählergebnisse durch, die Ausgangssignale des dritten Schaltungsteiles (30) nach »Vokalen« und »Konsonanten« separierbar sind, woraus sich Merkmalsfolgen bilden und durch Vergleich mit gespeicherten Muster-Merkmalsfolgen »Silben« identifizieren lassen.where for evaluation the output signals of the first and second circuit parts (10, 20) - controlled by the output signals of the fourth circuit part (40) - which can be counted separately Counting results through, the output signals of the third circuit part (30) after "vowels" and »Consonants« can be separated, from which sequences of features are formed and by comparison with Identify stored pattern feature sequences »syllables«.
2. Schaltungsanordnung nach Anspruch 1, dadurch gekennzeichnet, daß die Ermittlung der Anzahl der Schwingungen des frequenzniedrigsten »Formanten« durch Hintereinanderschaltung eines Tiefpaßfilters (3), eines Modulators (4) mit Trägerunterdrükkung, dem der Ausgang des Tiefpaßfilters und eines Frequenz-Generators (8) zugeführt sind, eines weiteren aktiven Tiefpaßfilters (5), eines Differenzverstärkers (6), dem der Ausgang des Tiefpaßfilters (5) sowohl direkt als auch phasenverschoben zugeführt wird, und eines Impulsformers (7) erfolgt.2. Circuit arrangement according to claim 1, characterized characterized that the determination of the number of oscillations of the lowest frequency "formant" by connecting a low-pass filter (3), a modulator (4) with carrier suppression, to which the output of the low-pass filter and a frequency generator (8) are fed, one further active low-pass filter (5), a differential amplifier (6) to which the output of the low-pass filter (5) is fed both directly and out of phase, and a pulse shaper (7) takes place. 3. Schaltungsanordnung nach Anspruch 1, dadurch gekennzeichnet, daß die Ermittlung der Anzahl der Schwingungen der »Formanten« nächsthöherer Frequenz durch die Hintereinanderschaltung eines Hochpaßfilters (11), eines Differenzverstärkers (12), dem der Ausgang des Hochpaßfilters (11) sowohl direkt als auch phasenverschoben zugeführt wird, nnH pinr-t: ImniiUfnrmpr*; iit\ prfrtttrf3. Circuit arrangement according to claim 1, characterized in that the determination of the number of oscillations of the "formants" of the next higher frequency by the series connection of a high-pass filter (11), a differential amplifier (12) to which the output of the high-pass filter (11) is both direct and is fed out of phase, nnH pinr-t: ImniiUfnrmpr *; iit \ prfrtttrf 4. Schaltungsanordnung nach Anspruch 2 und 3, dadurch gekennzeichnet, daß die »Vokalerktnnung« durch Prüfung des Überschreitens einer definierten Amplitudenhöhe des »Formanten« niedrigster Frequenz in einer Hintereinanderschaltung eines Verstärkers (17), eines Gleichrichters (18) mit Glättung, eines Tiefpaßfilters (19) sowie eines Impulsformers (21) und durch Prüfung der Stimmhaftigkeit des »Formanten« nächsthöherer Frequenz in einer Hintereinanderschaltung eines Gleichrichters (24) mit Glättung, eines Tiefpaßfilters (25), eines Verstärkers (26), eines Zeitgliedes (27) sowie eines Impulsformers (28) erfolgt, deren Ausgangssignale einer Konjunktion (23) zugeführt sind.4. Circuit arrangement according to claim 2 and 3, characterized in that the "vocal recognition" by checking whether a defined amplitude level of the "formant" of the lowest frequency is exceeded in a series connection of an amplifier (17), a rectifier (18) with Smoothing, a low-pass filter (19) and a pulse shaper (21) and by checking the voicing of the "formant" of the next higher frequency in a series connection of a rectifier (24) with smoothing, a low-pass filter (25), an amplifier (26), a timing element (27) and a pulse shaper (28) takes place, the Output signals of a conjunction (23) are fed. 5. Schaltungsanordnung nach Anspruch 1, dadurch gekennzeichnet, daß die automatische Erkennung der »Sprechpausen« in einer Hintereinanderschaltung eines Verstärkers (32), eines Gleichrichters (33) mit Glättung, eines Tiefpaßfilters (34) und eines Impulsformers (35) erfolgt5. Circuit arrangement according to claim 1, characterized in that the automatic detection the "speaking pauses" in a series connection of an amplifier (32), a rectifier (33) with smoothing, a low-pass filter (34) and a pulse shaper (35)
DE19742448909 1974-10-15 1974-10-15 Electrical circuit arrangement for a device for speech recognition Granted DE2448909B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
DE19742448909 DE2448909B2 (en) 1974-10-15 1974-10-15 Electrical circuit arrangement for a device for speech recognition

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE19742448909 DE2448909B2 (en) 1974-10-15 1974-10-15 Electrical circuit arrangement for a device for speech recognition

Publications (3)

Publication Number Publication Date
DE2448909A1 DE2448909A1 (en) 1976-04-22
DE2448909B2 DE2448909B2 (en) 1978-12-07
DE2448909C3 true DE2448909C3 (en) 1979-08-16

Family

ID=5928269

Family Applications (1)

Application Number Title Priority Date Filing Date
DE19742448909 Granted DE2448909B2 (en) 1974-10-15 1974-10-15 Electrical circuit arrangement for a device for speech recognition

Country Status (1)

Country Link
DE (1) DE2448909B2 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2240867A (en) * 1990-02-08 1991-08-14 John Nicholas Holmes Speech analysis
DE4111995A1 (en) * 1991-04-12 1992-10-15 Philips Patentverwaltung CIRCUIT ARRANGEMENT FOR VOICE RECOGNITION

Also Published As

Publication number Publication date
DE2448909A1 (en) 1976-04-22
DE2448909B2 (en) 1978-12-07

Similar Documents

Publication Publication Date Title
DE2918533C2 (en)
EP0076233B1 (en) Method and apparatus for redundancy-reducing digital speech processing
DE2326517A1 (en) METHOD AND CIRCUIT ARRANGEMENT FOR DETECTING SPOKEN WORDS
DE2020753A1 (en) Device for recognizing given speech sounds
DE4031638C2 (en)
DE2357067A1 (en) SPEECH ANALYSIS DEVICE
DE3102385C2 (en)
DE2448909C3 (en)
DE2448908C3 (en) Electrical method and circuit arrangement for speech recognition
DE1547027C3 (en) Method and arrangement for the determination of consonants in speech signals
EP0817167B1 (en) Speech recognition method and device for carrying out the method
DE2904426A1 (en) ANALOG VOICE ENCODER AND DECODER
DE2431458A1 (en) Identifying speaker from sound of voice - uses labelling system and recording system correlating labels with known speakers
DE2062589C3 (en) Method for determining the fundamental frequency of an at least temporarily periodic signal
EP0138071B1 (en) Method of determining the excitation condition of a speech segment with an application to automatic speech recognition
DE3935308C1 (en) Speech recognition method by digitising microphone signal - using delta modulator to produce continuous of equal value bits for data reduction
DE1122274B (en) Method and arrangement for the automatic recognition of speech
DE2649259C2 (en) Method for the automatic detection of disturbed telephone speech
DE3200645C2 (en)
DE2363590A1 (en) VOICE RECOGNITION SYSTEM WITH CHARACTERISTICS ENCODING
DE3630518C2 (en) Device for loudly identifying a speech pattern
DE3009204C2 (en)
DE19854420C2 (en) Method and device for processing sound signals
DE102020003669A1 (en) Method for testing a sound input device for manipulation, control device set up to carry out such a method, sound input device with such a control device and motor vehicle with such a sound input device
DE3645119C2 (en) Speech or sound recognition device - has speech-sound models superimposed to reduce background hiss effects

Legal Events

Date Code Title Description
C3 Grant after two publication steps (3rd publication)
8327 Change in the person/name/address of the patent owner

Owner name: OLYMPIA AG, 2940 WILHELMSHAVEN, DE

8320 Willingness to grant licences declared (paragraph 23)
8327 Change in the person/name/address of the patent owner

Owner name: AEG OLYMPIA AG, 2940 WILHELMSHAVEN, DE

8327 Change in the person/name/address of the patent owner

Owner name: AEG OLYMPIA OFFICE GMBH, 2940 WILHELMSHAVEN, DE

8339 Ceased/non-payment of the annual fee