DE1797314B2 - Elektrische Schaltungsanordnung zur Bestimmung von Formanten in Sprachsignalen - Google Patents

Elektrische Schaltungsanordnung zur Bestimmung von Formanten in Sprachsignalen

Info

Publication number
DE1797314B2
DE1797314B2 DE1797314A DE1797314A DE1797314B2 DE 1797314 B2 DE1797314 B2 DE 1797314B2 DE 1797314 A DE1797314 A DE 1797314A DE 1797314 A DE1797314 A DE 1797314A DE 1797314 B2 DE1797314 B2 DE 1797314B2
Authority
DE
Germany
Prior art keywords
threshold
formant
speech
frequency
output
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
DE1797314A
Other languages
English (en)
Other versions
DE1797314C3 (de
DE1797314A1 (de
Inventor
Howard Wesley Gaithersburg Cotterman, Md.
John Hewitt Endwell N.Y. King Jun.
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of DE1797314A1 publication Critical patent/DE1797314A1/de
Publication of DE1797314B2 publication Critical patent/DE1797314B2/de
Application granted granted Critical
Publication of DE1797314C3 publication Critical patent/DE1797314C3/de
Expired legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Electrophonic Musical Instruments (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Description

Die Erfindung betrifft eine elektrische Schaltungsan-Ordnung zur Bestimmung von Formanten in Sprachsignalen nach dem Oberbegriff des Anspruchs 1.
Formanten sind bekannt als wesentliche Elemente für die automatische Spracherkennung. Es ist schon bekannt, das auszuwertende Sprachfrequenzband durch Bandfilter in Frequenzbänder zu zerlegen und Maxima innerhalb der einzelnen Frequenzbänder festzustellen (DE-PS 11 56 996). Die Kenntnis der spektralen Verteilung der Sprachenergie alleine ist jedoch für eine einigermaßen zuverlässige Spracherkennung nicht so ausreichend. Um beispielsweise Diphthonge oder einfache Silben erkennen zu können, muß noch eine weitere Information hinzugenommen werden, nämlich die zeitliche Verteilung der Sprachenergie während des Sprechvorganges. Eine Anordnung, die auf dieser Grundlage arbeitet, ist beispielsweise in der DE-PS 22 274 beschrieben.
Da die menschliche Sprache einen großen Dynamikbereich von etwa 40 db hat, innerhalb dessen die Formanten als relative Maxima erscheinen, erfordert die Bandfilter-Technik zur Formantbestimmung sehr umfangreiche und komplizierte Schaltungen zur Lokalisierung dieser relativen Maxima.
Ferner führt die Miterfassung des zeitlichen Verlaufs der Sprachsignale für die Spracherkennung zu relativ komplexen Schaltungsanordnungen, die entsprechend aufwendig und störanfällig sind.
Die Erfindung hat sich deshalb die Aufgabe gestellt, den Aufwand von Schaltungsanordnungen zur Formantbestimmung zu verringern und deren Komplexität und damit auch deren Fehlerneigung zu reduzieren.
Gelöst wird diese Aufgabe durch die im Hauptanspruch angegebenen Merkmale. Vorteilhafte Ausgestaltungen und Weiterbildungen sind den Unteransprüchen zu entnehmen.
Die Vorteile der Erfindung ergeben sich daraus, daß sie ohne Bandfilter auskommt.
Durch die Kombination eines Netzwerkes fester logischer Schaltungen mit Phasenverschiebefiltern aus Allpaß-Schaltungen, die amplitudenunabhängig eine frequenzabhängige Phasenverschiebung liefern, wird das Ausgangssignal von den 40 db der Sprach-Amplitudenschwankungen unabhängig. Das Problem der Formanterkennung läßt sich dadurch reduzieren auf den Vergleich zweier amplitudenbegrenzter Sprachsignale, aus denen Rechteck-Impulszüge abgeleitet werden, deren Wiederholungsfrequenz eine Funktion der Frequenz des Eingangssignales ist.
Ein Ausführungsbeispiel wird nachfolgend anhand von Zeichnungen beschrieben.
F i g. 1 ist ein Blockschaltbild der Anordnung zur Formantbestimmung;
F i g. 2a, 2b zeigen die Charakteristik eines idealen Phasenverschiebefilters;
Fig.3 zeigt Signalformen im Zusammenhang mit dem Phasenverschiebefilter;
F i g. 4 zeigt Schaltungseinzelheiten eines Bandes aus
der F i g. I;
Fig.5 zeigt den Zusammenhang zwischen einem Taktimpuls und einer Spannungsrampe;
Fig.6a zeigt Eingangs- und Ausgangs-Signalformen des Quadrantenbestimmers;
Fig.6b zeigt die räumliche Beziehung der Spannungen Lo und RLo beim Quadrantenbestimmer und
F i g. 6c zeigt die Bahnkurve des Vektors aus Hen Spannungen Lo und RLo.
Das Blockschaltbild der Anordnung, Fig. 1, zeigt links die Leitung 1, über die das Sprachsignal eingegeben wird. Von dort gelangt es zu den Phasenverschiebefiltern 2a bis 2/7. Die Ausgänge dieser Filter führen über die Leitungen 3a bis 3/7 zu den Bandbegrenzern 4a bis 4n. Über Leitungen 5a bis 5/j sind daran angeschlossen die Quadrantenbestimmer 6a bis 6/j, die je zwei Eingänge a' und b' haben und die bei gleichzeitiger Erregung beider Eingänge ein Ausgangssignal liefern. Alle Eingangsleitungen b' d^r Quadranten-Bestimmer sind über Leitung 9 aus dem Sammelbegrenzer 8 gespeist, der über Leitung 1 a ebenfalls aus der das Sprachsignal führenden Leitung 1 gespeist wird.
Die Ausgangssignale der Quadrantenbestimmer gelangen über die Leitungen 7a bis Tn zu den Tiefpässen 8a bis 8/7, die über Leitungen 9a bis 9n mit jedem einrn Eingang von Schwellwert-Triggerschaltungen 14a bh 14/; verbunden sind. Die jeweils anderen Eingänge der Schwellwert-Triggerschaltungen sind über Leitungen b' und 13 mit der Spannungsrampe 12 verbunden. Die Schwellwert-Triggerschaltungen lassen sich nur durch koinzidente Eingangssignale vom Aus-Zustand in den Ein-Zustand überführen. Leitungen 15a bis 15/7 verbinden die Schwellwert-Triggerschaltungen mit Invertern 16a bis 16n und, über Leitungen 15a' bis 15n' mit UND-Schaltungen 17a bis 17/7. Die UND-Schaltungen 17a und 17/? haben zwei Eingangsklemmen, die übrigen deren drei. Die Ausgänge aller Inverter (mit Ausnahme des ersten 16a und des letzten \bn) führen zu jeweils zwei benachbarten der nachfolgenden UND-Schaltungen; der Ausgang des Inverters 16ύ führt ζ. B. zu den UND-Schaltungen 17a und 17c usw. Bei Betrachtung der Schaltung leuchtet ein, daß jede UND-Schaltung (ausgenommen die erste und die letzte) nur dann erregt wird, wenn die unmittelbar benachbarten UND-Schaltungen ihrerseits nicht erregt sind. Es handelt sich also dabei um eine Meß-Anordnung zur Ermittlung der höchsten Formantenergie in benachbarten Bändern des Sprachspektrums;. Über die Leitungen 18a bis 18n speisen die UND-Schaltungen 17a bis 17/7 die Formant-Triggerschaltungen 19a bis 19/?. Die Ausgangsleitungen der Formant-Triggerschaltungen gelangen über Leitungen 20a bis 20/7 zum Formanten-Zähler 22, der nach Erreichen eines vorbestimmten Zählwertes auf Leitung 23 ein Signal zur Spannungsrampe 12 abgibt. Die Signale auf den Leitungen 23 und 11 steuern die Arbeit der Spannungsrampe 12.
Im folgenden soll die Arbeitsweise der Anordnung erläutert werden: Die Anordnung zur Bestimmung von Formanten besteht aus einer Zahl von »n« Phasenverschiebefiltern 2a bis 2n; die Zahl »/?« hängt von der Bandbreite jedes Filters und der Breite des nach Formanten zu untersuchenden Sprachspektrums ab. Ein Mindestwert von 15 hat sich bei einer Breite des Sprachspektrums von 3 kHz als praktisch erwiesen.
Das in Fig. 4 etwas ausführlicher dargestellte Phasenverschiebefilter 2a enthält einen Transformator 30 mit der Primärwicklung 30/3, die zwischen der Eingangsleitung 1 und Masse angeschlossen ist sowie aus der Sekundärwicklung 305, die von dem Potentiometer 31 überbrückt und mit dem /?Z.C-Netzwerk 33 verbunden ist. Mit dem Potentiometer 31 wird die Sekundärwicklung nach Anschluß des Netzwerkes 33 ■j Symmetrien, um einen ausgeglichenen Amplitudenverlauf über der Frequenz zu erhalten, wie er beispielsweise in Fig. 2a idealisiert dargestellt ist. Das Netzwerk 33 liefert an seinem Ausgang den in Fig. 2b gezeigten Phasengang; die Werte von L und C sind so gewählt,
ίο daß das Netzwerk auf die gewünschte Mittelfrequenz abgestimmt ist. Die Phasenbeziehung zwischen dem Sprachsignaleingang FIW und dem Phasenverschiebefilterausgang APO ist auf den Zeilen 1 und 3 der F i g. 3 wiedergegeben. Der Phasenverschiebefilterausgang er-
ls zeugt hinter dem Bandbegrenzer 4a die in Fig. 3, Zeile 4, mit »Begrenzerausgang LO« bezeichnete Kurvenform. Sie wird dem einen Eingang des Quadrantenbestimmers 6a zugeführt; sein anderer Eingang wird vom Sammelbegrenzer 8 mit der in F i g. 3, Zeiie 2, unter der Bezeichnung »Sammelbegrenzer RLOn gezeigten Kurvenform gespeist. Beide Rechteck-Wellenzüge der F i g. 3 (RLO und LO) können in Phase sein oder eine Phasenverschiebung zeigen, abhängig davon, ob das einlaufende Sprachsignal und die
'•j Resonanzfrequenz des betreffenden Phasenverschiebefilters übereinstimmen.
Die Messung des zeitlichen Zusammenfallens der Kurvenformen LO und RLO wird von den Quadrantenbestimmern 6a bis 6n ermittelt, dessen Ausgangssignale
jo eine Funktion der Frequenz-Phasen-Beziehungen sind.
Die Ermittlung der Formanten erfolgt, indem zunächst die Ausgangssignale der Quadrantenbestimmer 6a bis 6n durch die Tiefpässe 8a bis 8/7 geleitet und deren Ausgangssignale mit der Spannung der Spannungsrampe 12 verglichen werden. Letztere erreicht ihr Maximum innerhalb von etwa 10 μ^; innerhalb dieser Zeit erreichen die Ausgangssignale einiger der Tiefpässe einen vorbestimmten Wert, der zur Erregung der entsprechenden Schwellwert-Triggerschaltungen 14a bis 14/7 ausreicht. Aus der Zusammenschaltung der Schwellwert-Triggerschaltungen 14, der Inverter 15 und der UND-Schaltungen 17 ergibt sich, daß von drei nebeneinanderliegenden UND-Schaltungen nur eine erregt werden kann. Während eines Sprachabschnittes kann also, abhängig von der Gesamtzahl der UND-Schaltungen der Anordnung, nur eine begrenzte Zahl von UND-Schaltungen erregt sein und auch nur eine gleiche beschränkte Zahl von Formant-Triggerschaltungen 19 zur Anzeige des Auftretens einer entsprechen-
>o den Anzahl von Formanten umschalten. Das Auftreten eines Formanten wird weitergeleitet zum Formanten-Zähler 22, der darauf eingerichtet ist, einen bis mehrere Formanten abhängig von der gewünschten und benötigten Zahl (gewöhnlich drei) zu zählen; danach
51) wird der Formanten-Zähler auf Null gestellt, er stellt die Spannungsrampe 12 zurück, so daß ein neuer Arbeitszyklus beginnen kann, dessen Wiederholungsgeschwindigkeit (gewöhnlich 30 pro Sekunde) vom Takt 10 bestimmt wird.
Normalerweise ist die Zahl der hauptsächlichen Resonanzen des Vokaltraktes auf drei beschränkt; manchmal werden diese hauptsächlichen Resonanzen von weiteren schwächeren (stärker gedämpften) Resonanzen begleitet. Dann muß die Anordnung in der Lage sein, nur die Hauptresonanzen auszuwählen.
Die zwei Spannungswerte RLO und LO können als zwei Komponenten eines Vektors Vbetrachtet werden. Mit dieser Betrachtungsweise bestimmt das gleichzeitig
gewonnene Spannungs-Wertepaar die kartesischen Koordinaten eines Punktes auf einer Fläche.
Die Schaltung des Quadrantenbestimmers ist so ausgelegt, daß seine Ausgangsspannung einen von zwei Werten (hier den oberen) einnimmt, wenn RLO und JLO gleichzeitig einen willkürlich gewählten Wert Av überschreiten. Ohne diese Koinzidenz ist das Ausgangssignal des Quadrantenbestimmers auf einem niedrigen Wert. Da die Signale RLO und LO praktisch gedämpfte Sinusschwingungen mit einem Spitzenwert größer als Δν sind (Av<Vmax) und da zwischen beiden eine Phasenverschiebung besieht, die eine Funktion der Frequenzdifferenz zwischen der Mittelfrequenz des Phasenverschiebefilters und der Resonanzfrequenz des Vokaltraktes ist, beschreibt die Spitze des die Spannungswerte RLO und LO darstellenden Vektors eine elliptische Spirale; siehe dazu F i g. 6c. Solange sich die Vektorspitze innerhalb der gestrichelten Fläche bewegt, nimmt das Ausgangssignal des Quadrantenbestimmers den oberen Wert an; im übrigen Bereich ist er auf dem unteren seiner beiden möglichen Werte. Auf diese Weise wird erreicht, daß die Quadrantendetektoren 6a bis %n mit einem Schwellwert versehen sind, unterhalb dessen sie für die gedämpften Schwingungen des Vokaltraktes unempfindlich werden und allmählich nicht mehr ansprechen.
Der mittlere Schaltzyklus eines Quadrantendetektors ist deshalb proportional der Frequenzdifferenz zwischen der Formantfrequcnz und der Mittelfrequenz des Phasenverschiebefilters, der Dämpfung des Formanten und der absoluten Amplitude des Sprachsignals. Um das Verständnis der Wirkungsweise des Quadranten-Detektors zu erleichtern, wird nochmals auf die F i g. 6a und 6b verwiesen, bei denen die gedämpften Schwingungen LO und RLO mit einer kleinen Phasenverschiebung Δ ν gezeigt sind. Zunächst ist der Arbeitszyklus konstant und nur eine Funktion der Phasenlage. Nachdem die beiden Schwingungen jedoch etwas abgeklungen sind und die Spitzen nicht mehr den Wert Δν gleichzeitig überschreiten, hört der Arbeitszyklus schlagartig auf; der Vorgang wiederholt sich für jede Periode der Stimmritze. Der Mittelwert für den Arbeitszyklus wird durch Einspeisen der Ausgangssignale der Quadrantenbestimmer in den Tiefpässen 8a bis Sn erreicht. Die Lage der Frequenz eines Formanten wird auch dann noch durch ein relatives Spannungsmaximum bezeichnet, das am Ausgang eines Tiefpaßfilters auftritt. Das Anwachsen oder Abfallen eines Formanten kann außerdem noch verglichen werden mit dem Anwachsen oder Abfallen eines anderen Formanten, indem die Differenzen der zugehörigen Höchstspannungen auf den Leitungen 9a bis 9n verglichen werden. Jede Zahl m von (durch ihre relativen maximal angezeigten) Hauptformanten kann gewählt werden, indem die m größten relativen Ausgangsmaxima auf den Leitungen 9a bis 9n ermittelt werden. Das zugehörige Verfahren wird später beschrieben. Mit diesem neuartigen Verfahren ergibt sich die Möglichkeit zur Unterscheidung zwischen einer Anzahl von Formanten entsprechend ihrer relativen Dämpfung oder/und Absolutwerte; dabei ist die Anordnung andererseits unempfindlich gegen die Absolutwerte der Signalamplitudcn.
Die Spannungsrampe 12, die ebenfalls in Fig. 4 mit mehr Einzelheiten dargestellt ist, enthält eine aus den Dioden 41a und 41 b sowie dem Widersland 42 bestehende UND-Schaltung als Eingangsschaltung. Die nachfolgende Schaltung mit den Transistoren 45 und 50 ist eine Kippschaltung; jeweils einer der Transistoren 45 und 50 ist im Ein-, der andere im Aus-Zustand. Der Transistor 55 ist als Emitterfolger geschaltet. Wenn an beiden Eingängen der UND-Schaltung ein negatives Signal anliegt, dann ist der Transistor 45 eingeschaltet ί und der Transistor 50 ausgeschaltet. Der Kondensator 51 lädt sich dann über die Diode 54 und den Widerstand 53 auf; der Widerstand 53 und der Kondensator 51 bestimmen die Zeitkonstanie für die Spannungsrampe. Sobald beide Eingangssignale den hohen Wert anneh-
Ki men, wird der Transistor 55 abgeschaltet und der Transistor 50 leitend, so daß der Kondensator 51 entladen wird. Diese Entladung hat den auf der unteren Zeile von Fig. 5 dargestellten Spannungsverlauf auf Leitung 13 der Fig.4 zur Folge. Die Leistung für den
Γι Transistor 55 wird dem Kondensator 56 entnommen, der sich in den Arbeitspausen auflädt.
Die Ausgänge der Formant-Triggerschaltungen 19a bis 19/7 (F i g. 1) gelangen über Leitungen 20a bis 2On zu dem Formantenzähler 22 und sind dort über die
-'» einstellbaren Widerstände 60a bis 6On mit der Basis des Transistors 64 verbunden. Zwischen Basis und Emitter dieses Transistors ist die Tunneldiode 63 angeschlossen, Vom Kollektor wird die Signalspannung abgenommen, welche den zweiten UND-Eingang der Spannungsram-
2i pe 12 speist. Die Widerstände 60 sind so abgeglichen, daß eine gewünschte Anzahl erregter Formantentrigger den Schallstrom für die Tunneldiode 63 liefern kann.
Jede der an die Tiefpässe 8 angeschlossenen Schwellwert-Triggerschaltungen 14 besteht aus einer
3» Tunneldiode 73, die zwischen Basis und Emitter eines Transistors 74 angeschlossen ist. Die Leitung 13 von der Spannungsrampe ist über Widerstand 71 ebenfalls mit der Basis dieses Transistors verbunden. Der Ausgang des Tiefpasses 8a bildet das zweite Eingangssignal zur
" Schwellwert-Triggerschaltung; es ist über den Widerstand 70 angeschlossen. Der Kollektor-Widerstand 75 und der Widerstand 72 wirken als Strombegrenzung für den Transistor 74. Über Leitung 77 und den Kondensator 76e ist ein Ausgang vom Taktgeber 10 zugeführt, der
■ί" die Rückstellung der Schwellwert-Triggerschaltung bewirkt. Die Widerstände 70 und 71 sind so bemessen daß die Tunneldiode 73 beim Erreichen eines gewünschten Eingangspegels die Umschaltung bewirken und den Transistor 74 einschalten kann.
4r> Zwischen der Periodenzeit des Taktes 10 und der Anstiegszeit der Spannungsrampe ist eine solche Zeitbeziehung vorgesehen, daß die Anstiegszeit und die Rückstellzeit der Spannungsrampe kürzer ist als eine Periode des Taktes. Fig. 5 erläutert in diesem
"i|! Zusammenhang:
lic = Periodendauer des Taktes
Tr = Anstiegszeit der Spannungsrampe auf Leitung 13
-r Trs - Rückstellzeit der Spannungsrampe auf Leitung 13
Die Periodendauer des Taktes ist ihrerseits durch die Grenzfrequenz der Tiefpaßfilter 8a bis 8n bestimmt Experimentell wurde ermiltelt, daß eine Grenzfrequenz
wi zwischen 15 und 25 Hz bei normalen Sprachsignaler günstig ist, wenn die Schwächung im Phasenverschiebefilter — 12 db pro Oktave beträgt. Bei einer Grenzfrequenz des Tiefpaßfilters von 15 Hz ist eine Periodendauer des Taktes von 30 ms oder weniger ausreichend
iir) um jede wesentliche Änderung im Zustand der relativer Maximalspannungcn auf den Leitungen 9a bis 9n zi entdecken.
Zur Auswertung der Ergebnisse der Anordnung läßi
sich der Umschalt-Zustand der Formant-Triggerschaltungen 19a bis 19/7 oder der Schaltzustand des Formantenzählers 22 oder beide Zustände heranziehen, je nachdem in welcher Weise die weitere Auswertung erfolgen soll. Wenn für die weitere Auswertung die Lage auftretender Formanten in gewissen Bändern 1 bis
η von Bedeutung ist, dann muß die Einstellage der Formant-Triggerschaltungen abgefragt werden. Falls für die Auswertung nur festgestellt werden soll, ob während einer Abtastperiode die im Formantenzähler voreingestellte Zahl von Formanten auftritt, wird der Schaltzustand des Formantenzählers abgefühlt.
Hierzu 4 Blatt Zeichnungen
809 542/26

Claims (3)

Patentansprüche:
1. Elektrische Schaltungsanordnung zur Bestimmung von Formanten in Sprachsignalen mit auf bestimmte Frequenzbänder des Sprachbandes abgestimmten Filtern und Speichern zur Speicherung aufbereiteter Filterausgangssignale, gekennzeichnet durch von mit dem Sprachsignal (FIW) gespeisten Phasenverschiebefiltern (2a—2n; Fig. 1), deren Resonanzfrequenzen über den zu untersuchenden Sprachfrequenzbereich verteilt liegen und deren sprachfrequentes Ausgangssignal (APO) gegenüber dem Eingangssignal eine Phasenverschiebung proportional zur Frequenzdifferenz zwischen der Eingangssignalfrequenz und der Resonanzfrequenz aufweist, durch jedem Phasenverschiebefilter nachgeschakete Bandbegrenzer (4a~4n) und einen am Sprachsignal liegenden Bezugsbegrenzer (8), deren Ausgangssignale zu jedem Bandbegrenzer nachgeschalteten Quadrantenbestimmern (6a — 6n) übertragen werden, die bei Koinzidenz der Ausgangssignale der zugeordneten Bandbegrenzer und des Bezugsbegrenzers Ausgangssignale an nachgeschaltete Tiefpässe (8a — Sn) liefern, die ihrerseits Signale abgeben, die das Vorliegen von Sprachenergie im Spektrum angeben, ferner durch eine Spannungsrampe (12) zur Erzeugung einer periodischen Abtastspannung und durch den Tiefpässen nachgeschakete Formantdetektoren (14a— 14/7 bis 17a— \7n), die auf die Abtastspannung und die Tiefpaß-Ausgangssignale ansprechen und dadurch Formanten anzeigen, die im Sprachsignal vorliegen, und schließlich durch jedem Formantdetektor (z. B. 14a bis 17a^ nachgeschaltete Formant-
35 Triggerschaltung (z. B. 19a,), zui· Zwischenspeicherung des Formantanzeigesignales sowie durch einen von allen Formant-Triggerschaltungen (19a— \9n) gespeisten Zähler (22), der seine Eingangssign&le mit vorgebbaren Gewichten versieht und beim Einreichen des Sollwertes (z. B. 3) ein Signal abgibt, das die Spannungsrampe in die Anfangsstellung zurückstellt und dadurch einen neuen Arbeitszyklus startet, wobei auch der Zähler auf Null zurückgestellt wird.
2. Anordnung nach Anspruch 1, gekennzeichnet durch Begrenzer (8, 4a — 4n) zur Umwandlung der gegeneinander phasenverschobenen sprachfrequenten Signale (FlW, APO) in phasenverschobene amplitudenbegrenzte Signale (RLO, LO), durch Quadrantenbestimmer (6a-6n) zur Abgabe von Impulsen jeweils dann, wenn beide amplitudenbegrenzten Signale gleichzeitig einen Mindestpegel überschreilen und durch mit den impulsen gespeiste Tiefpässe (8a -Sn).
3. Anordnung nach den Ansprüchen 1 und 2, gekennzeichnet durch Schwellwert-Triggerschaltungen (14a—14/7,), die bei jedem Abiastzyklus durch einen linear ansteigenden Spannungswert vorbereitet werden und beim Auftreten eines Signals arn Ausgang des zugeordneten Tiefpasses (8a — Sn) umschalten und durch UND-Schaltungen (17a— I7n), deren drei Eingangsklemmen jeweils an die zugeordneten Schwellwert-Triggerschaltungen und über ebenfalls von diesen gespeiste Inverter (16a— \6n) an die Schwellwert-Triggerschaltungen der beiden Nachbar-Bänder angeschlossen sind.
DE1797314A 1967-09-14 1968-09-12 Elektrische Schaltungsanordnung zur Bestimmung von Formanten in Sprachsignalen ' Expired DE1797314C3 (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US66768167A 1967-09-14 1967-09-14

Publications (3)

Publication Number Publication Date
DE1797314A1 DE1797314A1 (de) 1971-08-05
DE1797314B2 true DE1797314B2 (de) 1978-10-19
DE1797314C3 DE1797314C3 (de) 1979-06-28

Family

ID=24679194

Family Applications (1)

Application Number Title Priority Date Filing Date
DE1797314A Expired DE1797314C3 (de) 1967-09-14 1968-09-12 Elektrische Schaltungsanordnung zur Bestimmung von Formanten in Sprachsignalen '

Country Status (4)

Country Link
US (1) US3499989A (de)
DE (1) DE1797314C3 (de)
FR (1) FR1594575A (de)
GB (1) GB1245414A (de)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4783807A (en) * 1984-08-27 1988-11-08 John Marley System and method for sound recognition with feature selection synchronized to voice pitch
US4833716A (en) * 1984-10-26 1989-05-23 The John Hopkins University Speech waveform analyzer and a method to display phoneme information

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3278685A (en) * 1962-12-31 1966-10-11 Ibm Wave analyzing system

Also Published As

Publication number Publication date
FR1594575A (de) 1970-06-08
US3499989A (en) 1970-03-10
DE1797314C3 (de) 1979-06-28
GB1245414A (en) 1971-09-08
DE1797314A1 (de) 1971-08-05

Similar Documents

Publication Publication Date Title
EP0296588B1 (de) Verfahren und Schaltungsanordnung zum automatischen Wiedererkennen von Signalfolgen
DE2945331C2 (de) Vorrichtung in einer Signal-oder Datenverarbeitungsanlage zur Einstellung einer Signalverarbeitungsschaltung
DE2825651C2 (de)
DE2246426C3 (de) Verfahren und Schaltungsanordnung zum Überprüfen von empfangenen Fernsteuerbefehlen
DE1516318B2 (de) Schaltung zur zeitgedehnten Wiederga be einer vielfach wiederholt auftretenden Impulswellenform
DE2802484C3 (de) Dampfungsschaltung für Lautsprecher
DE2846234A1 (de) Einrichtung zur automatischen verstaerkungsregelung eines einseitenband- empfaengers
DE2338882A1 (de) Verfahren und fernwirksystem zum einund ausschalten von elektrischen verbrauchern
DE1797314C3 (de) Elektrische Schaltungsanordnung zur Bestimmung von Formanten in Sprachsignalen &#39;
DE1803093A1 (de) Schaltungsanordnung zur Erkennung eines Identifizierungssignals in einem Zeitzeichen
DE2908194C2 (de) Verfahren zur Betriebszustandseinstellung eines Ultraschallverbrauchsmessers und nach diesem Verfahren arbeitender Verbrauchsmesser
DE3700417C2 (de)
DE2912566A1 (de) Ton-decodierschaltung
DE1547029A1 (de) Spracherkennungsgeraet
DE3345295C2 (de) FM Demodulatorschaltung
DE1772633A1 (de) Verfahren zur Spracherkennung
DE2719248C2 (de) Frequenzselektiver Zeichenempfänger für Fernmelde-, insbesondere Fernsprechanlagen
DE3006990C2 (de) Einrichtung zur automatischen Antennenumschaltung bei Mehrfachempfang
DE2516853A1 (de) Steuereinrichtung fuer messchaltungen fuer die spannung an kraftleitungen
DE2636216C3 (de) Anordnung zum Zählen von Querrinnen bzw. Stufen, insbesondere an Stapeln
DE1938137C3 (de) Anordnung zum selbsttätigen Prüfen frequenzabhängiger Größen
DE2601150A1 (de) Verfahren und schaltungsanordnung zur bildung von signalen fuer eine stillstandskontrolle eines elektrischen messwertgebers, insbesondere einer elektromagnetischen praezisions- und feinwaage
DE1954136A1 (de) Schaltungsanordnung zur Analyse eines Signalamplitudenbereichs mit Hilfe von Frequenzdiskriminatorverfahren
DE3043921C2 (de) Schaltung zur breitbandigen Detektion der Amplitudenmaxima von Signalen
DE1516318C (de) Schaltung zur zeitgedehnten Wiedergabe einer vielfach wiederholt auftretenden Impulswellenform

Legal Events

Date Code Title Description
C3 Grant after two publication steps (3rd publication)
8339 Ceased/non-payment of the annual fee