DE1487540A1 - Verfahren und Einrichtung zur Erfassung,UEbertragung oder Nachbildung der in einer Sprachschwingung enthaltenen Information - Google Patents
Verfahren und Einrichtung zur Erfassung,UEbertragung oder Nachbildung der in einer Sprachschwingung enthaltenen InformationInfo
- Publication number
- DE1487540A1 DE1487540A1 DE19661487540 DE1487540A DE1487540A1 DE 1487540 A1 DE1487540 A1 DE 1487540A1 DE 19661487540 DE19661487540 DE 19661487540 DE 1487540 A DE1487540 A DE 1487540A DE 1487540 A1 DE1487540 A1 DE 1487540A1
- Authority
- DE
- Germany
- Prior art keywords
- oscillation
- speech
- peak
- sizes
- amplitude
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000010355 oscillation Effects 0.000 title claims description 73
- 238000000034 method Methods 0.000 title claims description 23
- 239000003990 capacitor Substances 0.000 claims description 47
- 230000015654 memory Effects 0.000 claims description 23
- 230000005540 biological transmission Effects 0.000 claims description 8
- 238000011156 evaluation Methods 0.000 claims description 4
- 238000006243 chemical reaction Methods 0.000 claims description 2
- 238000001514 detection method Methods 0.000 claims 6
- 241001269524 Dura Species 0.000 claims 1
- 101100400378 Mus musculus Marveld2 gene Proteins 0.000 claims 1
- 230000001788 irregular Effects 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 13
- 239000011159 matrix material Substances 0.000 description 7
- 230000015572 biosynthetic process Effects 0.000 description 3
- 230000000903 blocking effect Effects 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000011084 recovery Methods 0.000 description 3
- 210000001015 abdomen Anatomy 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000010076 replication Effects 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 240000000731 Fagus sylvatica Species 0.000 description 1
- 235000010099 Fagus sylvatica Nutrition 0.000 description 1
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 239000007921 spray Substances 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Electric Clocks (AREA)
Description
- Verfahren und Einrichtung zur Erfassung, Übertragung oder Nachbildung der in einer Sprachschwingung enthaltenen Information Es sind verschiedene Verfahren bereits bekannt geworden, die das Ziel verfolgen, aus einer Sprachschwingung, die zu diesem Zweck.iiblicherweise in eine entsprechende elektrische Schwingung umgesetzt wird, Signalfolgen zu gewinnen, welche - immer mit der Forderung, daß die Sprachinformation in ihnen noch gen;igend deutlich enthalten bleibt - entweder nicht die gesamte Zeit der Sprachschwingung besetzen oder ganz von dieser Zeit losläsbar sind, oder, gegebenenfalls gleichzeitig damit, gegen,iber der Sprachschwingung in einer Weise abgewandelt, insbesondere vereinfacht sind, die die Übertragung oder eine automatische Erkennung erleichtert, namentlich dadurch, daß eine mit gequantelten Größen arbeitende Kodierung möglich wird. Wahrend weit iiberwiegend bisher zur Erreichung dieses Zieles mit Momentan-Ausziigen aus dem verinderlichen Frequenzapektrum der Sprachschwingungen gearbeitet wurde, sind auch Vorschläge bekannt geworden, die Signale ganz oder *iberwiegend aus extrahierten Form-Merkmalen der Sprachschwingung zi gewinnen. Hierhin (tann in gewisser Weise auch das bekannte Verfahren gerechnet werden, nur die ("Null"-) Durchgänge der Sprachschwingung durch eine gegebenenfalls rektifizierte Flankenhalbierende festzustellen und ohne die Amplituden--Information zu benutzen, wobei jedoch die Laut-R;ickgewinnung nur d;irftig ist. Die Erfindung schlägt ein Sprachschwingungs-Formmerkmee benutzendes Verfahren mit zugehörigen Einrichtungen vor, das die Erfassung, übertragung oder Nachbildung der in einer Sprachschwingung enthaltenen Information, insbesondere in kodierter Form, in verhältnism,ißig leicht durchf,*ihrbaxer Weise und mit weitgehend verlustfreier Mickgewinnbarkeit der Lautinformationen ermöglicht. Erreicht wird dies erfiridungsgemäß dadurch, daß die Scheitel (Maxima und Minima) der Sprachschwingung bei ihrem Auftreten festgestellt oder nachgebildet und deren Amplituden- und/oder Zeitlagen als Informationsgrößen weiter verarbeitet werden. Es werden also die Flankenverläufe zwischen den oberen und unteren Scheitelpunkten außer Betracht gelassen (was jedoch nicht aus- schließen soll, daß einzelne Punkte diesen Blanken, etwa Wendepunkte, gegebenenfalls hilfsweise mit herangezogen werden können).
- Die Möglichkeit, daß man aus einer Schwingung Proben gerade an den Stellen ihrer Scheitel entnehmen kann, ist an sich nicht unbekannt. Die Erfindung hat aber das Verdienst, erkannt zu haben, daß bei Sprachschwingungen die fortgesetzte Entnahmeoder Nachbildung der Spitzenpunkte - oder, wie sp,ter erl4utert wird, bestimmter ausgewUhlter Spitzenpunkte zu einer besonders informationskonformen Gewinnung eines zur . Lösung der eingangs genannten Aufgaben abgewandelten Signalverlaufs Uhrt: Die Erfindung sieht weiterhin insbesondere vor, daß fortlaufend die Hübe zwischen den Amplituden der aufeinander folgenden Scheitel ermittelt und verarbeitet werden. Diese Hubgrößen enthalten, auch wenn sie von ihrer ursnr,inglichen Zeitlage ganz abgelöst werden, immer noch eine Information Tiber den zeitlichen Ablauf der Sprachschwingungen, weil bei diesen bei größeren Amplitudenhüben im allgemeinen die Momentanfrequenz kleiner ist und umgekehrt. Weiterhin kann so vorgegangen werden, daß die vorgenannten Verfahren nur auf einzelne Abschnitte der SpraLhschwingung angewendet werden, insbesondere solche, die jeweils aus gleichartigen Abschnitten ausgew4hlt sind, wie an sich bekannt ist. Die Erfindung sieht dabei aber außerdem vor, daß von derartigen Abschnitten, die auch Grundperioden bzw. Segmente bei stimmlosen Lauten genannt werden, ,jeweils die am besten ausgebildeten ausgew4hlt werden, die maximale Amplituden bzw. Zeitdauern haben. Um solche Segmentierungen--zu gewinnen, sieht die Erfindung vor, daß nach Maßgabe einer Hüllkurve der Sprachschwingung oder ilbergeordneter Hüllkurven ausgewählte Scheitel ermittelt und deren Amplituden und/oder Zeitlagen mit verarbeitet werden.
- Es werden Einrichtungen vorgeschlagen, die zur Durchf;;ihrung des vorgenannten Verfahrens besonders geeignet sind, aber auch für die Umsetzung anderer Schwingungen verwendet werden können, und eine Schaltungsanordnung, die in mehreren-Stufen solcher Einrichtungen wiederkehrend verwendet werden kann. Weitere in diesem Rahmen vorgesehene Verfahrens- und Einrichtungsmerkmale, die der Durchfiihrung der Erfindung mehr im einzelnen dienen, sind den auf sie gerichteten Patentansprüchen entnehmbar. Sie beziehen sich insbesondere auf die Analyse, die Synthese und die automatische Erkennung von Sprachschwingungen bzw. Schwingungen.
- Nachfolgend werden beisvielsweise Ausf;ihrungsmöglichkeiten der Erfindung anhand der Zeichnungen näher beschrieben. Von den Abbildungen zeigen: Fig.'I eine Schaltungsanordnung, die die Scheitel der Sprachschwingung erkennt und dabei jeweils einen Torimpuls ausgibt, Fig.la Spannungsdiagramme hierzu, Fig.2 eine Schaltungsanordnung zur Speicherung von Scheitelamplituden, Fig.ga Spannungsdiagramme hierzu, Fig.3 eine Schaltungsanordnung zurErzeugung von Spannungen., die Hubwerte zwischen aufeinander folgenden Scheitelamplituden entsprechen, Fig.3a Spannungsdiagramme hierzu, Fig.4 ein Blockschaltbild einer Schaltungsanordnung zur Erfassung und Ausgabe der in einer Sprachschwingung enthaltenen Information durch Auswertung der Scheitel-_ amplituden.
- Fig.5 Formen von Sprachschwingungen, Fig.6 ein Blockschaltbild einer Einrichtung zur Erzeugung und Erkennung kodierter Sprache, Fig.? eine Einrichtung zur Bildung einer synthetischen Sprache, Fig.8 ein Blockschaltbild einer Einrichtung zur Rückgewinnung von Scheitelamplituden. Informationen aus Amplituden-Diff erenzen, Fig.8a und 8b Spannungsdiagramme hierzu.
- In den Schaltungsanordnungen nach Fig. 1, 2 .und 3 kehrt eine Teilschaltung immer wieder. Die Bezugszeichen ihrer Elemente sind mit doppeltem Index versehen, wobei jeweils der erste Index für einander entsprechende Elemente der gleiche ist. Gef Fig. 1 werden in einem Wandler W, z. B. einem Mikrophon oder auch Magnetkopf, Sprachschwingungen entsprechende elektrische Schwingungen erzeugt. Die Spannungen dieser Schwin-
gongen werden über einen Verstärker V verstärkt auf die Basis eines als Emitterfolger geschalteten Transistors T1 'f gegeben, dessen Emitterwiderstand mit w11 ezeichnet ist. Eine Verbindungsleitung v11 führt zu der Basiseines zwei- ten Transistors T21, der ebenfalls als Emitterfolger ge- schaltet ist, mit dem Emitterwiderstland W21. In einer rVer- bindungsstrecke zwischen den Emittern der Transistoren .T11'. - Die Sprachspannungen von dem Verstärker#V gelangen außerdem, durch einen Inverter I invertiert, auf eine Schaltung, die genauso wie die vorbesehriebene ausgebildet ist. Sie enthält die Transistoren T'11 und T'21 mit den Emitterwiderständen, w'11 und w'21, die Dioden D"11 und D'21, die Verbindungsleitung v''11 sowie den Kondensator C111. -_, ._ a Die Zeitung v'11 ist mit der Basis von Transistor T21 über ein Tor G1 verbundeng ds leitend oder nichtleitend gemacht werden kann. Ein entsprechendes Tor G''1 liegt vor der Basis des Transistors T'21.
- Das Tor G1 ist nichtleitend, während die vom Verstärker V ausgegebene Spannung ansteigt. Die dieser Spannung im wesentlichen entsprechende Spannung am Emitter von T11 wird dann ebenfalls positiver und lädt die obere Belegung des Kondensators, C11 entsprechend auf. Wenn die Spannung der Sprachschwingung einen Scheitelwert erreicht hat, d.h. wieder abzufallen beginnt, fällt dementsprechend auch die Spannung bei Ul an der Anode der Diode D11. Wegen der Sperrwirkung der Diode D11 kann die Spannung an dem Kondensator 011 (Punkt U2) nicht mit abfallen, sondern bleibt zunächst stehen. An den Punkt U1 ist *in Emitterfolger T3 und an den Punkt U2 ein Emitterfolger T+ angeschlossen. Zwischen den wittern dieser beiden Emitterfolger liegt ein Komparator K. Der Komparator g, der z.B. als ein Differenzverstärker mit nachgeschaltetem Schmitt-Trigger ausgebildet sein kann, stellt fest, daß die Spannung am Punkt U1 kleiner geworden ist als die am Punkt U2, und gibt dabei einen Impuls siN aus, welcher anzibt, d aß eben ein Maximum-Scheitelwert der Sprachschwingung durchgelaufen ist. Der Impuls siä wird auch einem bistabilen F@ip-Flop FF zugefiihrt und kippt dieses in die andere Zage. Vorher hatte das Flip-Flop FF durch die anseinem Ausgang a herrschende Spannung das Tor G1 nichtleitend und durch die am Ausgang a' herrschende Spannung das Tor G''1 leitend gehalten. Nach uem Kippen des Flip-Flops FF durch den Impuls siM wird nunmehr das Tor G1 leitend und das Tor G''1 nichtleitend. Dadurch, daß das Tor G1 leitend geworden ist, fällt nunmeh, die Spannung am Emitter von T21 zugleich mit der der Sprachschwingung ab, und der Kondensator C11 kann sich über die Diode D21 entladen. Die Spannung an seiner oberen Belegung folgt nunmehr der kleiner werdenden Spannung der Sprachschwingung (hierunter soll im folgenden immer die verstärkte Sprachschwingung verstanden werden). Zugleich damit steigt aber die Tiber den Inverter I an die Basis von T'11 gelegte Spannung, wahrend, wie angegeben, das Tor G'1 nicht leitend ist. Man erkennt ohne weiteres, daß die dem Inverter I nachgeschalteten Elemente für die Minima der Sprachschwingung dasselbe leistet wie die vorbeschriebene Schaltung f;ir die Maxima. Wenn die Sprachschwingung ein Minimum durchlaufen hat, so wird alsbald die Spannung an dem Punkt U"1 geringer als die Spannung an dem Kondensator C'1 (Punk- U'2). Die Differenz gelangt über die Emitterfolger T'3and T'4an den Komparator K' und veranlaßt diesen zur Ausgabe eines Impulses sim, welcher angibt, daß soeben ein Minimum durchgelaufen ist. Außerdem kippt dieser Impuls das Flip-Flop FF wieder um mit der Folge, daß das Tor G'1 leitend wird, der Kondensator C'`11 sich bis zur Spannung der Sprachschwingung entlädt und dieser folgt, während das Tor G1 nunmehr wieder nichtleitend ist und der obere Zweig der Schaltung die anfangs beschriebene Funktion zur Feststellung des nächstfolgenden Maximums der Sprachschwingung erneut ausführt. In Figur 1a, die diese Vorgänge veranschaulichen soll, ist
ei,.. Teil einer Sprachschwingung Sp mit den MaximalscheitelnAM - Mit den vorbeschriebenen Schaltungen werden also aus der Sprachschwingung die Amplituden ihrer Scheitelwerte (Maxima und Minima) herausselektiert. Jede Scheitelamplitude wird auf dem Kondensator C12 der Figur 2 so lange gespeichert und kann über einen an seine obere Belegung angeschlossenen Emitterfolger T5 abgenommen werden, bis ein nachfolgender Scheitel der Sprachwelle erscheint und der Kondensator C12 auf dessen Amplitude umgeladen wird. Die Scheitelamplituden können als charakteristische Teilmerkmale der Sprachschwingung anstelle der Sprachschwingung selbst zur Übertragung oder Erkennung der Sprachinformation benutzt werden. Durch ein dem Emitterfolger T5 nachgeschaltetes Tor, das, z. H.
- durch die Impulse siM und sim, nach dem Erscheinen eines Scheitelwertes kurzzeitig geöffnet wird, können z.B. aus dem zinnenförmigen Spannungsverlauf Z Impulse MA und mA ausgeblendet werden, wie sie in Figur 2a mit schraffierten Flächen dargestellt sind, und deren Amplituden entsprechend den Scheitelamplituden moduliert sind. 'Die zeitliche Zage dieser Impulse entspricht zunqchst der zeitlichen Zage der Scheitel der Sprachschwingung.
- Es kann aber nun z.B. so vorgegangen werden, daß die nacheinander erscheinenden Impulse MA und mA durch einen Verteiler abschnittsweise auf einen Satz von Kondensatoren ver-.
- teilt werden, so, d aß jeder Kondensator entsprechend der Amplitude eines Impulses aufgeladen wird. Die Kondensatoren dieses Satzes können dann in einem gleichmäßigen Takt durch einen Abnahme-Verteiler nacheinander wieder abgef;ihlt werden, um die amplitudenmodulierten Impulse in gleichmäßigen Zeitabständen auszugeben. Diese Zeitabstände können so gewählt werden, daß sich eine Zeitraffung gegeniiber der Zeitdauer des entsprechenden Abschnitts der Sprachschwingung ergibt. Die Zeitabstände sind aber auch so wählbar, daƒ zwischen den Scheitelamplituden-Impulsen andere Informationsimpulse eingeblendet und übertragen oder ausgewertet werden können. ,de ein: zwischen zwei Scheitelimpulsen liegender Impuls kann z.B. nach Maßgabe des zeitlichen Abstandes der benachbarten Scheitelimpulse moduliert werden, um auch diesen zeitlichen Abstand zur Wiedergewinnung der Information mit zu verwerten. Die Sprachschwingung ist so in einen Impulskode umgesetzt, der die Scheitelamplituden, und ggf. auch deren zeit-liche Abstände, enthält. Diese Kodierung erlaubt es, die Sprachinformation aus ihr wiederzugewinnen.
Eine demgegeniiber bevorzugte Form der Weiterverarbeitung der an die Stelle der Sprachschwingung Sp getretenen Zinnenlinie Z (Figur 2a) sei nunmehr anhand der Figuren 3 und 3a beschrie- ben. Die an dem Eüiitterfolger T5 der Figur 2 abgegriffenen Spannungen Z werden der Schaltung nach Figur 3 über die Klem- me Z zugeführt. An diese sind wiederum zwei Schaltungen des wiederkehrenden Grundaufbaues angeschlossen. Die obere Schal- tung der Figur 3 enthält die E@nitterfolger T13 und T2(mit Enitterwiderständen w13 und w23), die Dioden D 13 sowie D 23, die Verbindungsleitung v13 sowie den Kondensator 013. Die untere Schaltung enthält die Emitterfolger T''13 und T'`23 (mit Emitterwiderständen w'13 und w'23), die Dioden D'13 und D'23, die Verbindungsleitung v''13 und den Kondensator C''13. An den Kondensator C13 ist ein Emitterfolger T6 und an den Kondensator C''13 ein Emitterfolger T'6 angeschlossen. Vor der Basis von T13 liegt ein Tor G5, vor der Basis von T23 ein Tor G6, entsprechend liegen Tore G"5 und G'r vor den Basen von T'13 und T'23. Diese Schaltung ähnelt also der der .Figur 1, mit dem Unterschied jedoch, daA Tore, die vor den Die 11,#mitter des Emitterfolgers T6 einerseits und des F,mitter- folgers T'6 andererseits sind an einen Differenzverstärker DV angeschlossen. Am Ausgang dieses Verstärkers erscheinen mit- hin Spannungen H, die den Snannungsh;iben zwischen den Span- nungen jeweils aufeinander folgender Scheitel der Sprach- schwingung Sp bzw. der Zinnenlinie Z entsprechen. In Figur 3a -,eben punktierte Linien die Scheitelspannungen an, die zu- -,leich mit der ausgezogenen Spannung eines nachfolgenden Scheitels auf den Kondensatoren 013 bzw. C'13 festgehalten werden. Das mittlere Diagramm der Figur 3a zeigt den Ver- lauf der die Hübe darstellenden Spannungen H. Der Spannungsverlauf H ist wiederum ein "Zinnen"-Verlauf, der einen vereinfachten Extrakt aus der Sprachschwingung Sp darstellt. Der unter neuer Bezugnahme auf die x-Achse (Erde) hergestellte Spannungsverlauf H hat geringere Hilbe als der Verlauf Z. Die durch H nacheinander angegebenen Bubgiößen sind gute Träger der,9prachinformation. Es ist in diesen Hubgrößen in gewiesen Grenzen auch eine Information über die zeitlichen Abstände der Schwingungsscheitel enthalten, wie eingangs bereits erwähnt wurde. Gegebenenfalls können diese Zeitabstände aber bei einer auf den Hubgrößen beruhen- den Sprachkodierung in genauerer Form kodiert noch beige- fügt werden, ähnlich wie dien froher bei der Benutzung der amplitudenmodulierten Impulse 91 und mA angegeben wurde. - Es ist vorgesehen, für eine Sprachkodierung die Anzahlen von in Sprachschwingungs-Segmenten enthaltenen Scheiteln der Sprachschwingung zu ermitteln und diese in den Kode aufzunehmen. In Figur 4 sind Einrichtungen angegeben, die Derartiges ermöglichen. Es ist ein Impulszähler IZ2 dargestellt, dessen Zähleingang die Scheitelimpulse siM und sim zugef,*ihrt werden, so daß sie den Zähler aufwärts zählen. Es ist weiterhin ein Tor G10 dargestellt, über das der Inhalt des Zählers an einen Ausgang 8 gegeben werden kann. Weiterhin soll die Anordnung getroffen werden, daß in bekannter Weise mit der Ausgabe des Zählerinhalts immer eine sofort nach dieser Ausgabe erfolgende Löschung des Zählers verbunden ist Es kann nun dieser Vorgang z.B., wie durch die gezei^hnete Verbindung dargestellt, jeweils durch einen Impuls hsm ausgelöst werden, wodurch an den Ausgang 8 die Anzahlen er Sprachschwingungsscheitel gegeben werden, die jeweils in einem Bauch der oberen Hüllkurve der Sprachschwingung liegen. Es kann auch vorgesehen werden, den Zähler IZ2 von höheren SE-Stufen, ggf. wahlweise, abfragbar zu machen oder jeder vorgesehenen SE-Stufe einen solchen Zähler zuzuordnen. Es sei nun eine kurze Betrachtung von Sprachschwingungseigenschaften eingeschaltet. Man kann bei den Sprachschwingungen eine Unterscheidung zwischen g-(Grundwellen-) -Schwingungen und r-("Rauhigkeits"-, Oberwelligkeits-) -Schwingungen treffen, so wie dies in Fig. 5a dargestellt ist. Dabei kann eine dieser Komponenten fehlen, z.B. die r-Schwingungen bei Vokalen. Einige Schwingungsformen fair Vokale sind in Fig. 5b -f mit Segment-Abgrenzungen dargestellt. Fig. 5b zeigt ein geschlossenes u wie in "Mut". Im Segment Sg ist nur. eine Schwingung (Maximum M). Ein dunklerer (offener) u-Laut wie in "Mutter" weist, wie in Fig.5c dargestellt, im Grundsegment Sg noch eine zweite kleinere Schwingung auf (Maxima M'1, M2). 'Nächst das zweite Maximum M2 mehr und mehr und nähert sich dem größten Maximum Ml an, so entsteht schließlich das geschlossene o wie im Wort "Sohn", vgl. Fig. 5d. Das Herausbilden eines dritten Maximums M3 läßt das offene o wie in "Sonne" entstehen, vgl. Fig. 5e. Ein viertes Maximum M4 bringt das geschlossene a wie in "Mann", vgl. Fig. 4f. Das offene a wie in "Tat "'hat noch mehr Schwingungen. Die Anzahl der Scheitel ist z.B. in Fig. 5c und 5d gleich. Es kann aber eine Typisierung nach Typen T vorgenommen werden, je nach den gegenseitigen Größenverhqltnissen der Hübe zwischen den Scheiteln. Nach dem friiher Erläuterten erkennt man, daß man z.B. den Verlauf nach Fig. 3a fier diese Typisierung heranziehen kann. 'Wie die Anzahl N der Scheitel in einem Segment ermittelt werden kann, wurde ebenfalls erläutert. Eine Kodierung, welche die Angaben N und T für die g-Schwingung und für die r-Schwingung enthält, ermöglicht eine Unt,erscheidung und .Erkennung unterschiedlicher Laute einschließlich unterschiedlich ausgesprochener Vokale. Die "chwingungsformen nach Fig. 5b-f enthalten keinen r-Anteil. Eine Kodierung der genannten Art kann demnach wie folgt aussehen:
Fig. 5b N(g) = 1, T(g) = 1, N(r) = 0, T(r) = 0 Fig. 5c N(g) = 2, T(g) _ 'f, N(r) = 0, T(r) = 0 Fig. 5d N(g) = 2, T(g) = 2, N(r) = 0, T(r) = 0 Fig. 5e N(g) = 31 T(g) = 1, N(r) = 0, T(r) = 0 Fig. 5f N(g) = 41 T(g) = 1, N(r) ° 0, T(r) = 0 Fig. 6 zeigt ein Blockschaltbild einer nach diesen Gesichts- punkten arbeitenden Sprachkodier- und Erkennungsschaltung. Die nat,_irlichen Sprachschwingungen gelangen vom Wandler W Tiber einen Sprachverstärker V auf einen Scheitelwert- Extrahierer SA, der die Scheitelamplituden gemäß Fig. 2a er- mittelt und ausgibt. Danach werden in einem g-r-Separator Sg/r die Scheitelwerte des g- und des r-Anteiles der Schwin- -#,ung separiert. In einer nachfolgenden Stufe werden neben- einander die Größen N(g), T(g), N(r) und T(r) bereitgestellt. Diese Großen werden einer Umkodiermatrix Mx zugef;ihrt, an deren Ausgänge ein Lautanzeige-Speicher LSp angeschlossen ist. Von diesem aus können Lautindikatoren (Tasten, Lampen u. dgl.) betätigt werden. - Es werden nun in den Spalten der Matrix von links nach rechts Spannungswerte eingestellt, die z.B. den Scheitelsrannungswerten des Verlaufs t in Fig. 2a entsprechen. Werden z. B. Vertikalschieber benutzt, so machen deren Bedienungsknöpfe oder auch besondere Zeiger die Lage der Scheitelpunkte dabei auf der Einstellfläche sinnfällig sichtbar. Durch BetAtigung einer nicht dargestellten Einschalttaste o.dgl. wird sodann ein "L" in die erste Stufe der Schiebekette GZ gebracht, und der Schiebeimpulsgenerator GR wird in Gang gesetzt. Wenn der in RZ seinen Lauf beginnende Wert "L" erstmalig in die
erste (unterste) Stufe von RZ gelangt, wird das Flip-Flop FF1 umgeworfen und das Tor G12 durchlässig, so daß der Kondensa- tor C sich aufzuladen beginnt. Wenn danach der Wert "L" in RZ die Zeile des in der ersten Spalte einger;ickten, in der Zeichnung durch einen Kreis markierten Koppelelements erreicht, entsteht ein Zeilenimpuls, der Über das Koppelelement und das aktivierte Ausgangstor Ga dieser Spalte auf die Leitung r1 gelangt und das Flip-Flop FF1 zuriickwirft. Dadurch wird das Tor G12 gesperrt und der Kon- densator C nicht weiter aufgeladen. Der zweite Ausgang des Flip-Flops FF1 stößt ein Monoflop MF1 an, welches einen Durch- laßimpuls für ein Tor G13 ausgibt, Über das die Kondensator- spannung am Ausgang AS abgefragt wird. Heim Zurückfallen stößt das Monoflop MF1 ein zweites Monoflop MF2 an, welches einen Durchlaßimpuls auf ein Tor G14 gibt, Iber das der Kondensator C entladen wird. Um diese Auswertungszeit in jedem Fall be- reitzustellen, kann der Ringz4hler RZ oberhalb der obersten Matrixzeile noch Leerstufen enthalten, stattdessen können auch wUhrend der aktiven Zeiten der Monoflops MFl und MP'2 von diesen aus die Schiebeimpulse aus GR abgeriegelt werden. Wenn der "L"-Wert in RZ wieder in die erste Stufe gelangt, wird Tor G12 wieder leitend, außerdem wird der "L"-Wert in GZ in die zweite Stufe geschoben, so daß nunmehr die Aufladehöhe von C durch das in der zweiten Spalte eingedickte KoDnelete- ment bestimmt wird, und 3o fort. Im Ausgang AS entsteht also eine Folge von amplitudenverschiedenen Impulsen wie - rem, Dann gilt, wie man leicht erkennt
x1 - y1 = z1 z1 + x2 = z2 z2 - y2 = z3 z3 + x3 = z4 usw. y2 nach Syn, am Ausgang von DV1 erscheint der Wert z2-y2 - z3, der wieder über G18 ausgegeben und nach Szn gegeben wird, und so fort. Am Ausgang des Tores G18 erscheinen mithin die Impulse mit den Amplituden (x'1), z1, z2, z3, z4 .... Sie gelangen sodänn beispielsweise Tiber einen Tiefpa8 TP, der sie verschleift, und einen Verstärker VZ auf einen Laut- sprecher Z, in dem die Sprache entsrrechend einer Sprach- schwingung Sp, wie sie in Fig. 8b gestrichelt eingezeichnet ist, hörbar gemacht wird.
Claims (4)
- P a t e n t a n s p r ü c h e 1. Verfahren zur Erfassung, Übertragung oder Nachbildung der in einer Sprachschwingung enthaltenen Information in der Form von ext-ahierten Teilmerkmalen der Schwingung, dadurch gekennzeichnet, daß die Scheitel (Maxima und Minima) der Sprachschwingung bei ihrem Auftreten festgestellt oder nachgebildet und deren Amplituden und/oder Zeitlagen als Informationsgrößen weiter verarbeitet werden.
- 2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß fortlaufend die Hiibe zwischen den Amplituden der aufeinander folgenden Scheitel ermittelt oder nachgebildet und - gegebenenfalls nach Rückumsetzung in Scheitelamnlitudenwerte - verarbeitet werden.
- 3. Verfahren nach Ansuruch 1 oder 2, dadurch gekennzeichnet, daß die Amplitudengrößen und /oder die Zeitlagen und/oder die Hubgrößen oder weitere hiervon abgeleitete-Größen kodiert werden.
- 4. Vereahren nach Ansrruch 1 oder 2, dadurch gekennzeichnet, daß zusqtzlich nach Maßgabe einer Hüllkurve der Sprachschwingung oder iibergeordneter Hüllkurven ausgewählte Scheitel ermittelt und deren Amplituden und/oder Zeitlagen verarbeitet werden. 5. Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, daß dif Amplitudengrößen oder Hubgrößen und/oder die Zeitabstände d6r Scheitel als durch Impulse abgegrenzte Zeitintervalle dargestellt und verarbeitet werden. 6. Verfahren nach Anspruch 5, dadurch gekennzeichnet, daß die Amplitudengrößen oder Hubgrößen darstellende Zeitintervalle vom Zeitpunkt des Auftretens der Scheitel ausgehend abgegrenzt werden. 7, Verfahren nach einem der Anspr@iche 1 - 6, dadurch gekennzeichnet, daß die gewonnenen Größen zeitlich gerafft weitergegeben werden. B. Verfahren nach einem der Anspriiche 1 - 6, dadurch gekennzeichnet, daß die Größen nur aus ausgewqhlten Abschnitten der Schwingung gebildet und verarbeitet werden, insbesondere nur aus Grundperioden bzw. Segmenten, die maximale Amplituden bzw. Zeitdauern aufweisen. g. Verfahren nach Anspruch 8, dadurch gekennzeichnet, daß die durch einen Z4hler ermittelte Anzahl der Scheitel innerhalb der Abschnitte verarbeitet insbesondere zum Bestandteil einer Kodierung gemacht wird 10. Verfahren nach einem der Ansnriiche 1 - 9, dadurch gekennzeichnet, daß die Größen zur Erzeugung einer synthetißchen Sprache benutzt werden. 11. Einrichtung zur Durchfitihrung des Verfahrens nach einem der Ansprüche 1 - 9 oder zur Erfassung oder Übertragung der in einer andersartigen unregelmäßigen Schwingungsform enthaltenen Information, gekennzeichnet durch Scheitelerkennungsschaltungen (SE), die sowohl die oberen als auch die@unteren Scheitel der Schwingung erkennen und durch jeweils erzeugte Impulse Tore (G3, G4) steuern, über die die jeweiligen Scheitel-Amplitudengrößen in der Reihenfolge ihres Auftretens auf einen Scheitelwertspeicher (SS) Übermittelt werden, an den Übertragungseinrichtungen (T5 bzw. SD) zur Übertragung der .ScheitelamDlitudengrößen oder von diesen abgeleiteter Größen auf eine Leitung oder an Einrichtungen (IZl) zur Zusammenstellung der Größen zu einem Kode angeschlossen sind. 12. Einrichtung nach Anspruch 11, dadurch gekennzeichnet, daß den Scheitelerkennungsschaltungen Mittel zur Messung der zwischen Scheitelerkennungen liegenden Zeitabstände nachgeschaltet sind, und d aß solche. Zeitabstandsgrößen übertragen bzw. in den Kode aufgenommen werden. 13. Einrichtung nach Anspruch 11, dadurch gekennzeichnet, daß an den Scheitelamplitudenspeicher (SS) Schaltungen (SD) angeschlossen sind, die die Hübe zwischen aufeinander folgend gespeicherten Scheitelamplituden messen und an eine nachgeschaltete Auswertungsstufe (AM/DM) weitergeben. 14. Einrichtung nach Anspruch 13, dadurch gekennzeichnet, daß einer die Hübe in Form amplitudenmodulierter Impulse ausgebenden Stufe (SD) eine Stufe (AM/DM) nachgeschaltet ist, die die Differenzwerte in dauermodulierte Impulse umwandelt. 15. Einrichtung nach Anspruch 14, gekennzeichnet durch mindestens einen Zeitzähler (IZ1), der die durch die dauermodulierten Impulse abgegrenzten Zeitintervalle auszählt. 16. Einrichtung nach den Anspr;ichen 13 - 15, dadurch gekennzeichnet, daß in der die Hübe ermittelnden Schaltung (SD) ein Hub jeweils zum Zeitpunkt des Auftretens eines Scheitel-Zeitimpulses (sim, siM) gemessen wird und der Zeitzähler (IZ1)jeweils zu einem solchen Zeitpunkt in Gang gesetzt wird. 17. Einrichtung nach Anspruch 13, gekennzeichnet durch Schaltmittel (SE, G8) zur Übertragung
der .Amplituden nur der oberen (oder unteren) Scheitel auf eine weitere Scheitel-Erkennungsschaltung (SE1), welche Extremwert-Impulse (hsm, hsM) als Schwingungsabschnitts- Signale ausgibt. 18. 'Einrichtung nach .Anspruch 1?, gekennzeichnet durch ein durch die Schwingungsabschnitts- Signale (hsM) aufsteuerbares Tor (G9), das den zugehörigen Extremwert auf eine weitere Scheitelerkennungsschaltung (S E2) leitet. 19. Einrichtung nach Anspruch 18, dadurch gekennzeichnet, daß ihr weitere Stufen gleicher Art nachgeschaltet sind. 20. Einrichtung nach den Anspr;ichen 11 und 17 - 19, dadurch gekennzeichnet, daß einer S.heitelerkennungsschal- tung (SE) ein Zähler (IZ2) beigeschaltet ist, der die Extremwert-Impulse (sim, siM) in Intervallen zwischen Extremwert-Im-oulsen (hsm) einer nachgeordneten (Hüllkurven-) Scheitelerkennungsschaltung (SE1) zählt. 21. Einrichtung zur Durchf;ihrung des Verfahrens nach Anspruch 3 und 9, gekennzeichnet durch Mittel (Sg/r) zur Separierung von Grund- Trägerschwingungen und überlagerten Schwingungen, und durch für jede dieser beiden Komponenten vorgesehene Z4hler Scheitelamnlitudengrößen, sowie"eine Wickverbindung (t17), um'Werte aus dem letztgenenuteh Speicher (Szn) in einen der erstgenannten Speicher (qxn) £wecke jewoiligex Addition. mit einem neu eingehenden Rubwert zu übertregeh. 25. Schaltungsanordnung zur Erkennung von Scheiteln siner elek- trischen Schwingung oder zur jeweils vorübergehenden Spei-' cherung ausgewählter .Lmplitudengrößen der Schwingung oder hieraus abgelOiteter Größen, insbesondere zur Verwendung in Einrichtungen nach den Ansprüchen 11, 13 und 17 - 19, ggkönnäeigbiet durch eine Spannungsquelle veränderlicher Spannung (w)'zwei hieran mit ihren Basiselektroden ange- schlossene Emitterfolger (T1x, T2x bzw. T''1x, T-2x), wobei vor mindestens einer Basis ein ateuerbaree Tor zwischenge- schaltet tot, eine Verbindung zwischen den Ixtiittern der beiden -.ttrtolger` in der Owsi Dioden (t?1xt V2ebev D'UB'2x) mit gleioher` Durahle.ßxichtung hihtereitander liegen, Und einen zwischen den Dioden mit einer Belegung angegchloiisenen Kondensator (tbr bzw. 0'k), dessen andere BelegÜng an festem Potential liegt;
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DET0032642 | 1966-12-01 |
Publications (3)
Publication Number | Publication Date |
---|---|
DE1487540A1 true DE1487540A1 (de) | 1969-04-24 |
DE1487540B2 DE1487540B2 (de) | 1980-10-30 |
DE1487540C3 DE1487540C3 (de) | 1981-06-25 |
Family
ID=7557186
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE19661487540 Expired DE1487540C3 (de) | 1966-12-01 | 1966-12-01 | Verfahren für Analyse und Synthese von elektrischen Akustiksignalen |
Country Status (1)
Country | Link |
---|---|
DE (1) | DE1487540C3 (de) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE1963082A1 (de) * | 1969-12-16 | 1971-06-24 | Heinz Kusch | Verfahren und Einrichtung zur automatischen Sprachverarbeitung |
DE2853219A1 (de) * | 1978-12-09 | 1980-09-25 | Heinz Dipl Phys Kusch | Verfahren zur automatischen erkennung der tonhaltigkeit |
DE3329208A1 (de) * | 1983-08-12 | 1985-02-28 | H. Dipl.-Phys. 7801 Umkirch Kusch | Verfahren fuer datenreduktion von sprachsignalen |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GR58359B (en) * | 1977-08-09 | 1977-10-03 | Of Scient And Applied Res Ltd | Voice codification system |
-
1966
- 1966-12-01 DE DE19661487540 patent/DE1487540C3/de not_active Expired
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE1963082A1 (de) * | 1969-12-16 | 1971-06-24 | Heinz Kusch | Verfahren und Einrichtung zur automatischen Sprachverarbeitung |
DE2853219A1 (de) * | 1978-12-09 | 1980-09-25 | Heinz Dipl Phys Kusch | Verfahren zur automatischen erkennung der tonhaltigkeit |
DE3329208A1 (de) * | 1983-08-12 | 1985-02-28 | H. Dipl.-Phys. 7801 Umkirch Kusch | Verfahren fuer datenreduktion von sprachsignalen |
Also Published As
Publication number | Publication date |
---|---|
DE1487540C3 (de) | 1981-06-25 |
DE1487540B2 (de) | 1980-10-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE2533654C3 (de) | Verfahren zur Bildanalyse und Anordnung zum Durchfuhren dieses Verfahrens | |
DE2650255A1 (de) | Schaltungsanordnung zur automatischen erkennung kontinuierlicher sprachsignale, insbesondere eines oder mehrerer kontinuierlich gesprochener worte oder zahlen | |
DE2044177A1 (de) | Verfahren und Vorrichtung zur maschinellen Zeichenerkennung | |
DE1762188A1 (de) | Schaltungsanordnung zur Bestimmung des Impulses groesster Amplitude in einer Impulsfolge | |
DE2636281A1 (de) | Einrichtung zur identifizierung eines betaetigten tastenschalters von zahlreichen tastenschaltern | |
DE3878895T2 (de) | Verfahren und einrichtung zur spracherkennung. | |
DE1937464C3 (de) | Sprachanalysiergerät | |
DE1487540A1 (de) | Verfahren und Einrichtung zur Erfassung,UEbertragung oder Nachbildung der in einer Sprachschwingung enthaltenen Information | |
DE1422040A1 (de) | Verfahren zum automatischen Erkennen gesprochener Worte | |
DE2748422C2 (de) | Polyphones elektronisches Musikinstrument | |
DE1541712A1 (de) | Vorrichtung zum AEndern der Frequenz von sinusfoermigen elektrischen Signalen und hierfuer geeignete elektronische Schaltung | |
DE2637264A1 (de) | Elektronisches musikinstrument | |
DE1541624A1 (de) | Verfahren zur Frequenzumsetzung | |
DE976994C (de) | Einrichtung zur stoerungsfreien UEbertragung elektrischer Wellen mittels Codeimpulsgruppen | |
DE2438353C3 (de) | Aufnahmeanordnung mit Informationsaufnahmestellen in einem Halbleiterkörper | |
DE2051589A1 (de) | Anordnung zur Synthese eines Signals | |
DE1122754B (de) | Verfahren und Vorrichtung zur automatischen Zeichenerkennung | |
DE1292208B (de) | Abtastschaltungsanordnung, insbesondere fuer Fernsprechvermittlungsanlagen | |
DE2643429A1 (de) | Anordnung zum abfragen und festhalten eines tastsignals bei einem elektronischen musikinstrument | |
DE1940082A1 (de) | Verfahren zum Erkennen von Sprachmerkmalen und deren Aufzeichung mittels einer elektrisch gesteuerten Schreibmaschine | |
DE2025694C (de) | Elektronische Uhr mit einer Zeitbasis hoher Frequenz und einem elektronischen Frequenzteiler fur diese Frequenz | |
DE1448253A1 (de) | Hochfrequenzmassenspektrometer-Anordnung | |
DE2459242A1 (de) | Verfahren zur beseitigung von ausschwingvorgaengen an signalimpulsen und anordnung zur durchfuehrung dieses verfahrens | |
DE1933358C3 (de) | Einrichtung zur Bestimmung einer Bewegungsgröße eines für ein Uhrwerk vorgesehenen Unruh-Schwingsystem | |
DE1910973C3 (de) | Laufzeitschaltung für Einrichtungen der elektrischen Nachrichtentechnik |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
OF | Willingness to grant licences before publication of examined application | ||
OF | Willingness to grant licences before publication of examined application | ||
C3 | Grant after two publication steps (3rd publication) | ||
8339 | Ceased/non-payment of the annual fee |