DE1487540A1 - Verfahren und Einrichtung zur Erfassung,UEbertragung oder Nachbildung der in einer Sprachschwingung enthaltenen Information - Google Patents

Verfahren und Einrichtung zur Erfassung,UEbertragung oder Nachbildung der in einer Sprachschwingung enthaltenen Information

Info

Publication number
DE1487540A1
DE1487540A1 DE19661487540 DE1487540A DE1487540A1 DE 1487540 A1 DE1487540 A1 DE 1487540A1 DE 19661487540 DE19661487540 DE 19661487540 DE 1487540 A DE1487540 A DE 1487540A DE 1487540 A1 DE1487540 A1 DE 1487540A1
Authority
DE
Germany
Prior art keywords
oscillation
speech
peak
sizes
amplitude
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
DE19661487540
Other languages
English (en)
Other versions
DE1487540C3 (de
DE1487540B2 (de
Inventor
Heinz Kusch
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Telefunken Patentverwertungs GmbH
Original Assignee
Telefunken Patentverwertungs GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Telefunken Patentverwertungs GmbH filed Critical Telefunken Patentverwertungs GmbH
Publication of DE1487540A1 publication Critical patent/DE1487540A1/de
Publication of DE1487540B2 publication Critical patent/DE1487540B2/de
Application granted granted Critical
Publication of DE1487540C3 publication Critical patent/DE1487540C3/de
Expired legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Electric Clocks (AREA)

Description

  • Verfahren und Einrichtung zur Erfassung, Übertragung oder Nachbildung der in einer Sprachschwingung enthaltenen Information Es sind verschiedene Verfahren bereits bekannt geworden, die das Ziel verfolgen, aus einer Sprachschwingung, die zu diesem Zweck.iiblicherweise in eine entsprechende elektrische Schwingung umgesetzt wird, Signalfolgen zu gewinnen, welche - immer mit der Forderung, daß die Sprachinformation in ihnen noch gen;igend deutlich enthalten bleibt - entweder nicht die gesamte Zeit der Sprachschwingung besetzen oder ganz von dieser Zeit losläsbar sind, oder, gegebenenfalls gleichzeitig damit, gegen,iber der Sprachschwingung in einer Weise abgewandelt, insbesondere vereinfacht sind, die die Übertragung oder eine automatische Erkennung erleichtert, namentlich dadurch, daß eine mit gequantelten Größen arbeitende Kodierung möglich wird. Wahrend weit iiberwiegend bisher zur Erreichung dieses Zieles mit Momentan-Ausziigen aus dem verinderlichen Frequenzapektrum der Sprachschwingungen gearbeitet wurde, sind auch Vorschläge bekannt geworden, die Signale ganz oder *iberwiegend aus extrahierten Form-Merkmalen der Sprachschwingung zi gewinnen. Hierhin (tann in gewisser Weise auch das bekannte Verfahren gerechnet werden, nur die ("Null"-) Durchgänge der Sprachschwingung durch eine gegebenenfalls rektifizierte Flankenhalbierende festzustellen und ohne die Amplituden--Information zu benutzen, wobei jedoch die Laut-R;ickgewinnung nur d;irftig ist. Die Erfindung schlägt ein Sprachschwingungs-Formmerkmee benutzendes Verfahren mit zugehörigen Einrichtungen vor, das die Erfassung, übertragung oder Nachbildung der in einer Sprachschwingung enthaltenen Information, insbesondere in kodierter Form, in verhältnism,ißig leicht durchf,*ihrbaxer Weise und mit weitgehend verlustfreier Mickgewinnbarkeit der Lautinformationen ermöglicht. Erreicht wird dies erfiridungsgemäß dadurch, daß die Scheitel (Maxima und Minima) der Sprachschwingung bei ihrem Auftreten festgestellt oder nachgebildet und deren Amplituden- und/oder Zeitlagen als Informationsgrößen weiter verarbeitet werden. Es werden also die Flankenverläufe zwischen den oberen und unteren Scheitelpunkten außer Betracht gelassen (was jedoch nicht aus- schließen soll, daß einzelne Punkte diesen Blanken, etwa Wendepunkte, gegebenenfalls hilfsweise mit herangezogen werden können).
  • Die Möglichkeit, daß man aus einer Schwingung Proben gerade an den Stellen ihrer Scheitel entnehmen kann, ist an sich nicht unbekannt. Die Erfindung hat aber das Verdienst, erkannt zu haben, daß bei Sprachschwingungen die fortgesetzte Entnahmeoder Nachbildung der Spitzenpunkte - oder, wie sp,ter erl4utert wird, bestimmter ausgewUhlter Spitzenpunkte zu einer besonders informationskonformen Gewinnung eines zur . Lösung der eingangs genannten Aufgaben abgewandelten Signalverlaufs Uhrt: Die Erfindung sieht weiterhin insbesondere vor, daß fortlaufend die Hübe zwischen den Amplituden der aufeinander folgenden Scheitel ermittelt und verarbeitet werden. Diese Hubgrößen enthalten, auch wenn sie von ihrer ursnr,inglichen Zeitlage ganz abgelöst werden, immer noch eine Information Tiber den zeitlichen Ablauf der Sprachschwingungen, weil bei diesen bei größeren Amplitudenhüben im allgemeinen die Momentanfrequenz kleiner ist und umgekehrt. Weiterhin kann so vorgegangen werden, daß die vorgenannten Verfahren nur auf einzelne Abschnitte der SpraLhschwingung angewendet werden, insbesondere solche, die jeweils aus gleichartigen Abschnitten ausgew4hlt sind, wie an sich bekannt ist. Die Erfindung sieht dabei aber außerdem vor, daß von derartigen Abschnitten, die auch Grundperioden bzw. Segmente bei stimmlosen Lauten genannt werden, ,jeweils die am besten ausgebildeten ausgew4hlt werden, die maximale Amplituden bzw. Zeitdauern haben. Um solche Segmentierungen--zu gewinnen, sieht die Erfindung vor, daß nach Maßgabe einer Hüllkurve der Sprachschwingung oder ilbergeordneter Hüllkurven ausgewählte Scheitel ermittelt und deren Amplituden und/oder Zeitlagen mit verarbeitet werden.
  • Es werden Einrichtungen vorgeschlagen, die zur Durchf;;ihrung des vorgenannten Verfahrens besonders geeignet sind, aber auch für die Umsetzung anderer Schwingungen verwendet werden können, und eine Schaltungsanordnung, die in mehreren-Stufen solcher Einrichtungen wiederkehrend verwendet werden kann. Weitere in diesem Rahmen vorgesehene Verfahrens- und Einrichtungsmerkmale, die der Durchfiihrung der Erfindung mehr im einzelnen dienen, sind den auf sie gerichteten Patentansprüchen entnehmbar. Sie beziehen sich insbesondere auf die Analyse, die Synthese und die automatische Erkennung von Sprachschwingungen bzw. Schwingungen.
  • Nachfolgend werden beisvielsweise Ausf;ihrungsmöglichkeiten der Erfindung anhand der Zeichnungen näher beschrieben. Von den Abbildungen zeigen: Fig.'I eine Schaltungsanordnung, die die Scheitel der Sprachschwingung erkennt und dabei jeweils einen Torimpuls ausgibt, Fig.la Spannungsdiagramme hierzu, Fig.2 eine Schaltungsanordnung zur Speicherung von Scheitelamplituden, Fig.ga Spannungsdiagramme hierzu, Fig.3 eine Schaltungsanordnung zurErzeugung von Spannungen., die Hubwerte zwischen aufeinander folgenden Scheitelamplituden entsprechen, Fig.3a Spannungsdiagramme hierzu, Fig.4 ein Blockschaltbild einer Schaltungsanordnung zur Erfassung und Ausgabe der in einer Sprachschwingung enthaltenen Information durch Auswertung der Scheitel-_ amplituden.
  • Fig.5 Formen von Sprachschwingungen, Fig.6 ein Blockschaltbild einer Einrichtung zur Erzeugung und Erkennung kodierter Sprache, Fig.? eine Einrichtung zur Bildung einer synthetischen Sprache, Fig.8 ein Blockschaltbild einer Einrichtung zur Rückgewinnung von Scheitelamplituden. Informationen aus Amplituden-Diff erenzen, Fig.8a und 8b Spannungsdiagramme hierzu.
  • In den Schaltungsanordnungen nach Fig. 1, 2 .und 3 kehrt eine Teilschaltung immer wieder. Die Bezugszeichen ihrer Elemente sind mit doppeltem Index versehen, wobei jeweils der erste Index für einander entsprechende Elemente der gleiche ist. Gef Fig. 1 werden in einem Wandler W, z. B. einem Mikrophon oder auch Magnetkopf, Sprachschwingungen entsprechende elektrische Schwingungen erzeugt. Die Spannungen dieser Schwin-
    gongen werden über einen Verstärker V verstärkt auf die
    Basis eines als Emitterfolger geschalteten Transistors T1 'f
    gegeben, dessen Emitterwiderstand mit w11 ezeichnet ist.
    Eine Verbindungsleitung v11 führt zu der Basiseines zwei-
    ten Transistors T21, der ebenfalls als Emitterfolger ge-
    schaltet ist, mit dem Emitterwiderstland W21. In einer rVer-
    bindungsstrecke zwischen den Emittern der Transistoren .T11'.
    und T21 liegen, mit gleicher Polung hintereinander gesch.al-. tet, zwei Dioden D11 und D21 derart, daß die Diode D11 mit ihrer Anode an den Emitter von T11 und die Diode D21 mit ihrer Anode an den Emitter von T21 angeschlossen ist. Zwischen den beiden Dioden D11 und D21 ist die eine Belegung eines Kondensators C11 angeschlossen, dessen andere Belegung an Erde angeschlossen ist. Die den Eirittern abgewandten Enden der Widerstände w11 und v21 sind im vorliegenden Beispiel ebenfalls an Erde angeschlossen. Stattdessen kann auch ein Anschluß an eine positive Spannung vorgesehen werden. Die Kollektoren der Transistoren T11 und T21 liegen an negativer Spannung, da es sich um pnp-Transistoren handelt.
  • Die Sprachspannungen von dem Verstärker#V gelangen außerdem, durch einen Inverter I invertiert, auf eine Schaltung, die genauso wie die vorbesehriebene ausgebildet ist. Sie enthält die Transistoren T'11 und T'21 mit den Emitterwiderständen, w'11 und w'21, die Dioden D"11 und D'21, die Verbindungsleitung v''11 sowie den Kondensator C111. -_, ._ a Die Zeitung v'11 ist mit der Basis von Transistor T21 über ein Tor G1 verbundeng ds leitend oder nichtleitend gemacht werden kann. Ein entsprechendes Tor G''1 liegt vor der Basis des Transistors T'21.
  • Das Tor G1 ist nichtleitend, während die vom Verstärker V ausgegebene Spannung ansteigt. Die dieser Spannung im wesentlichen entsprechende Spannung am Emitter von T11 wird dann ebenfalls positiver und lädt die obere Belegung des Kondensators, C11 entsprechend auf. Wenn die Spannung der Sprachschwingung einen Scheitelwert erreicht hat, d.h. wieder abzufallen beginnt, fällt dementsprechend auch die Spannung bei Ul an der Anode der Diode D11. Wegen der Sperrwirkung der Diode D11 kann die Spannung an dem Kondensator 011 (Punkt U2) nicht mit abfallen, sondern bleibt zunächst stehen. An den Punkt U1 ist *in Emitterfolger T3 und an den Punkt U2 ein Emitterfolger T+ angeschlossen. Zwischen den wittern dieser beiden Emitterfolger liegt ein Komparator K. Der Komparator g, der z.B. als ein Differenzverstärker mit nachgeschaltetem Schmitt-Trigger ausgebildet sein kann, stellt fest, daß die Spannung am Punkt U1 kleiner geworden ist als die am Punkt U2, und gibt dabei einen Impuls siN aus, welcher anzibt, d aß eben ein Maximum-Scheitelwert der Sprachschwingung durchgelaufen ist. Der Impuls siä wird auch einem bistabilen F@ip-Flop FF zugefiihrt und kippt dieses in die andere Zage. Vorher hatte das Flip-Flop FF durch die anseinem Ausgang a herrschende Spannung das Tor G1 nichtleitend und durch die am Ausgang a' herrschende Spannung das Tor G''1 leitend gehalten. Nach uem Kippen des Flip-Flops FF durch den Impuls siM wird nunmehr das Tor G1 leitend und das Tor G''1 nichtleitend. Dadurch, daß das Tor G1 leitend geworden ist, fällt nunmeh, die Spannung am Emitter von T21 zugleich mit der der Sprachschwingung ab, und der Kondensator C11 kann sich über die Diode D21 entladen. Die Spannung an seiner oberen Belegung folgt nunmehr der kleiner werdenden Spannung der Sprachschwingung (hierunter soll im folgenden immer die verstärkte Sprachschwingung verstanden werden). Zugleich damit steigt aber die Tiber den Inverter I an die Basis von T'11 gelegte Spannung, wahrend, wie angegeben, das Tor G'1 nicht leitend ist. Man erkennt ohne weiteres, daß die dem Inverter I nachgeschalteten Elemente für die Minima der Sprachschwingung dasselbe leistet wie die vorbeschriebene Schaltung f;ir die Maxima. Wenn die Sprachschwingung ein Minimum durchlaufen hat, so wird alsbald die Spannung an dem Punkt U"1 geringer als die Spannung an dem Kondensator C'1 (Punk- U'2). Die Differenz gelangt über die Emitterfolger T'3and T'4an den Komparator K' und veranlaßt diesen zur Ausgabe eines Impulses sim, welcher angibt, daß soeben ein Minimum durchgelaufen ist. Außerdem kippt dieser Impuls das Flip-Flop FF wieder um mit der Folge, daß das Tor G'1 leitend wird, der Kondensator C'`11 sich bis zur Spannung der Sprachschwingung entlädt und dieser folgt, während das Tor G1 nunmehr wieder nichtleitend ist und der obere Zweig der Schaltung die anfangs beschriebene Funktion zur Feststellung des nächstfolgenden Maximums der Sprachschwingung erneut ausführt. In Figur 1a, die diese Vorgänge veranschaulichen soll, ist
    ei,.. Teil einer Sprachschwingung Sp mit den MaximalscheitelnAM
    und den Minimalscheiteln m dargestellt. Sp' ist die invertierte Form dieses Schwingungsverlaufs. 'Die punktiert angesetzten Linien zeigen den Verlauf der Spannung U2 bzw. u'2 dort, wo sie von der Spannung U1 bzw. U'1 abweicht. Die senkrechten punktierten Linien geben die Spannungsdifferenzen an, die zu der Erzeugung der Scheitelimpulse siM und im führen. Die punktiert angesetzten Strecken sind zwecks besserer Erkennbarkeit vergrößert dargestellt. Zwischen den beiden Schwingungskurven sind die Impulse siM und sim und in den unteren beiden Linien die Torspannungen angegeben, mittels derer das Flip-Flop FF die Tore Gl und G'1 steuert, wobei die positivere Spannung das Leitendmachen der Tore bewirkt. Die Schaltungsanordnung nach Figur 2 dient dazu, die Scheitelamplituden der Sprachschwingung bis jeweils zum Auftreten eines nachfolgenden .Scheitels zu speichern. 'fiese Schaltung hat wiederum den bereits angegebenen Grundaufbau mit Emitterfolgern T12 und T22 (Emitterwiderstände w12 bzw. w22), Dioden D12 sowie D22, einer Verbindungsleitung v12 und einem Kondensator C12. Es ist hier jedoch vor die Basis von T12 ein Tor G3 geschaltet. Auch vor der Basis von T22 liegt wieder ein Tor, hier mit G4 bezeichnet. An die Eingänge des Tores G3 sowie über die Verbindungsleitung v12 auch des Tores G4 sind die Ausgangsspannungen des Sprachverstärkers V angelegt. Das Tor G3 wird vom Ausgang a des Flip-Flops FF (Fig.1) und das Tor G4 vom Ausgang a' dieses Flir-Flops gesteuert. Das Tor G3 wird dann leitend gemacht (hingegen c@as Tor G4 nichtleitend), wenn soeben ein Maximum der Sprachwelle erschienen und in der vorher geschilderten 'Heise durch einen Impuls siM gemeldet worden ist, der das Flip-Flop FF umschaltet. Nunmehr wird also aber das leitende Tor G3 der Kondensator C12 auf die Spannung dieses Maximums aufgeladen. Obwohl die Spannung der Sprachschwingung und damit die am Emitter von T12 anschließend wieder kleiner wird, bleibt wegen der Sperrwirkung der Diode D12 die aufgenommene Scheitelspannung auf dem Kondensator 012 bestehen. 'Nie fr;zher angegeben, vliird das Flip-Flop FF umgeschaltet alsbald nach dem Erscheinen eines Minimums der Sprachschwingung. Es wird nun also das Tor G4 leitend mit der Folge, daß der Kondensator C'2 bis auf die geringere Spannung des Minimums der Sprachschwingung über die Diode D22 entladen wird. :Penn die Spannung der Sprachschwingeng und damit die des Emitters von T22 anschließend wieder größer wird, bleibt trotzdem wegen der Sperrwirkung der Diode D22 die Spannung am Kondensator C12 auf dem aufgenommenen Minimumwert stehen. Erst wenn anschließend ein Maximum erscheint, wird Tor G4 wieder nichtleitend und, Tor G3 leitend gemacht, so daß der Kondensator G12sich aber den Emitterfolger T12 und die Diode D'12 wieder auf die höhere Spannung des Maximum-Scheitels aufladen kann. Das geschilderte Spiel wiederholt sich während des Empfanges der Sprachschwingung, so daß also der Spannungszustand des Kondensators C12 so verläuft, wie es in Figur 2a oben durch den ausgezogenen "zinnen"-förmigen Linienzug Z dargestellt ist. Außer dieser "Zinnen"-Linie ist in Figur 2a gestrichelt auch der Verlauf der Sprachschwingungen Sp dargestellt, aus der der Zinnen-Verlauf durch die vorbeschriebenen Schaltungen, abgeleitet ist. Unten sind in Figur 2a wieder die Impulse siM und sim und die Verlaufe der Torsteuerspannungen für die Tore G3 und G4 angegeben.
  • Mit den vorbeschriebenen Schaltungen werden also aus der Sprachschwingung die Amplituden ihrer Scheitelwerte (Maxima und Minima) herausselektiert. Jede Scheitelamplitude wird auf dem Kondensator C12 der Figur 2 so lange gespeichert und kann über einen an seine obere Belegung angeschlossenen Emitterfolger T5 abgenommen werden, bis ein nachfolgender Scheitel der Sprachwelle erscheint und der Kondensator C12 auf dessen Amplitude umgeladen wird. Die Scheitelamplituden können als charakteristische Teilmerkmale der Sprachschwingung anstelle der Sprachschwingung selbst zur Übertragung oder Erkennung der Sprachinformation benutzt werden. Durch ein dem Emitterfolger T5 nachgeschaltetes Tor, das, z. H.
  • durch die Impulse siM und sim, nach dem Erscheinen eines Scheitelwertes kurzzeitig geöffnet wird, können z.B. aus dem zinnenförmigen Spannungsverlauf Z Impulse MA und mA ausgeblendet werden, wie sie in Figur 2a mit schraffierten Flächen dargestellt sind, und deren Amplituden entsprechend den Scheitelamplituden moduliert sind. 'Die zeitliche Zage dieser Impulse entspricht zunqchst der zeitlichen Zage der Scheitel der Sprachschwingung.
  • Es kann aber nun z.B. so vorgegangen werden, daß die nacheinander erscheinenden Impulse MA und mA durch einen Verteiler abschnittsweise auf einen Satz von Kondensatoren ver-.
  • teilt werden, so, d aß jeder Kondensator entsprechend der Amplitude eines Impulses aufgeladen wird. Die Kondensatoren dieses Satzes können dann in einem gleichmäßigen Takt durch einen Abnahme-Verteiler nacheinander wieder abgef;ihlt werden, um die amplitudenmodulierten Impulse in gleichmäßigen Zeitabständen auszugeben. Diese Zeitabstände können so gewählt werden, daß sich eine Zeitraffung gegeniiber der Zeitdauer des entsprechenden Abschnitts der Sprachschwingung ergibt. Die Zeitabstände sind aber auch so wählbar, daƒ zwischen den Scheitelamplituden-Impulsen andere Informationsimpulse eingeblendet und übertragen oder ausgewertet werden können. ,de ein: zwischen zwei Scheitelimpulsen liegender Impuls kann z.B. nach Maßgabe des zeitlichen Abstandes der benachbarten Scheitelimpulse moduliert werden, um auch diesen zeitlichen Abstand zur Wiedergewinnung der Information mit zu verwerten. Die Sprachschwingung ist so in einen Impulskode umgesetzt, der die Scheitelamplituden, und ggf. auch deren zeit-liche Abstände, enthält. Diese Kodierung erlaubt es, die Sprachinformation aus ihr wiederzugewinnen.
    Eine demgegeniiber bevorzugte Form der Weiterverarbeitung der
    an die Stelle der Sprachschwingung Sp getretenen Zinnenlinie Z
    (Figur 2a) sei nunmehr anhand der Figuren 3 und 3a beschrie-
    ben. Die an dem Eüiitterfolger T5 der Figur 2 abgegriffenen
    Spannungen Z werden der Schaltung nach Figur 3 über die Klem-
    me Z zugeführt. An diese sind wiederum zwei Schaltungen des
    wiederkehrenden Grundaufbaues angeschlossen. Die obere Schal-
    tung der Figur 3 enthält die E@nitterfolger T13 und T2(mit
    Enitterwiderständen w13 und w23), die Dioden D 13 sowie D 23,
    die Verbindungsleitung v13 sowie den Kondensator 013. Die
    untere Schaltung enthält die Emitterfolger T''13 und T'`23
    (mit Emitterwiderständen w'13 und w'23), die Dioden D'13
    und D'23, die Verbindungsleitung v''13 und den Kondensator C''13.
    An den Kondensator C13 ist ein Emitterfolger T6 und an den
    Kondensator C''13 ein Emitterfolger T'6 angeschlossen. Vor
    der Basis von T13 liegt ein Tor G5, vor der Basis von T23 ein
    Tor G6, entsprechend liegen Tore G"5 und G'r vor den Basen
    von T'13 und T'23. Diese Schaltung ähnelt also der der
    .Figur 1, mit dem Unterschied jedoch, daA Tore, die vor den
    Basen aller ßmitterfolger mit doppeltem Index liegen, ähnlich wie bei Figur 2, jedoch paarweise zueinander invers, gesteuert werden. Die Schaltung nach Figur 3 dient dazu, die Spannungshiibe zwischen den Spannungen aufeinander folgender Scheitel zu gewinnen. Zu diesem Zweck werden die Scheitelspannungen von dem Kondensator C12 der Figur 2 abwechselnd auf die Kondensatoren C13 und C''13 der Figur 3 übernommen, und zwar die Maxima-Werte auf den Kondensator 013 und die Minima-Werte auf den Kondensator C'13 und ferner so, daß zwei aufeinander folgende Scheitelamplituden-Werte auf dielten beiden Kondensatoren gleichzeitig bereit stehen, um ihre Differenz bilden zu können. Dies sei unter Mitheranziehung der Figur 3a beschrieben, in deren oberem Teil wieder gestrichelt die Sprachschwingung Sp und ausgezogen der Verlauf der zugehÖrigen Zinnenlinie Z dargestellt ist. Darunter sind die Steuerspannungen für die Tore G5 und G6 einerseits und für die Tore G''5 und G'6 andererseits dargestellt, die wieder von dem Flip-Flop FF der Figur 1 geliefert werden` können., Nach einem Maximum von Sp, das ein Maximumnii#eau von Z erzeugt, werden die Tore G5 und G6 leitend gemacht, die Tore G'5 und G'6 hingegen nichtleitend. Es wird also die Maximumniveau-Spannung von Z auf den Kondensator C13 iibarnommen. Beim Auftreten des nachfolgenden Minimums werden die Tore G5 und G6 nichtleitend, was zur Folge hat, daß die Maximumniveau-Spannung auf dem Kondensator C13 stehen bleibt; andererseits werden die Tore G''5 und G'6 leitend, was zur Folge hatt daB der Kondensator C"13 auf die Minimumniveau-Spannung va* Z ge- laden wird. Beide Spannungen stehen so lange auf den äondensatoren C13 und C'13, bis durch ein' erneutes Maximum die Tore G'5 und G'6 nichtleitend und die Tore G5 und G6 leitend gesteuert werden, was zur Folge hat, daß die Minimumniveau-Spannung auf dem Kondensator C'13 stehen bleibt und der Kondensator C13 sich nunmehr auf die inzwischen eingetretene neue Maximumniveau-Spannung umlädt. Beide Kondensatorspannungen bleiben wieder bestehen bis zum Eintreten des n:ichsten Minimums, und das Spiel setzt sich in dieser Weise fort.
    Die 11,#mitter des Emitterfolgers T6 einerseits und des F,mitter-
    folgers T'6 andererseits sind an einen Differenzverstärker DV
    angeschlossen. Am Ausgang dieses Verstärkers erscheinen mit-
    hin Spannungen H, die den Snannungsh;iben zwischen den Span-
    nungen jeweils aufeinander folgender Scheitel der Sprach-
    schwingung Sp bzw. der Zinnenlinie Z entsprechen. In Figur 3a
    -,eben punktierte Linien die Scheitelspannungen an, die zu-
    -,leich mit der ausgezogenen Spannung eines nachfolgenden
    Scheitels auf den Kondensatoren 013 bzw. C'13 festgehalten
    werden. Das mittlere Diagramm der Figur 3a zeigt den Ver-
    lauf der die Hübe darstellenden Spannungen H.
    Der Spannungsverlauf H ist wiederum ein "Zinnen"-Verlauf,
    der einen vereinfachten Extrakt aus der Sprachschwingung Sp
    darstellt. Der unter neuer Bezugnahme auf die x-Achse (Erde)
    hergestellte Spannungsverlauf H hat geringere Hilbe als der
    Verlauf Z. Die durch H nacheinander angegebenen Bubgiößen
    sind gute Träger der,9prachinformation. Es ist in diesen
    Hubgrößen in gewiesen Grenzen auch eine Information über
    die zeitlichen Abstände der Schwingungsscheitel enthalten,
    wie eingangs bereits erwähnt wurde. Gegebenenfalls können
    diese Zeitabstände aber bei einer auf den Hubgrößen beruhen-
    den Sprachkodierung in genauerer Form kodiert noch beige-
    fügt werden, ähnlich wie dien froher bei der Benutzung der
    amplitudenmodulierten Impulse 91 und mA angegeben wurde.
    In derselben Weise, wie dies frl'iher f,i.r den Spannungsverlauf Z (Figur 2a) angegeben wurde, können auch aus dem Spannungsverlauf H (Figur 3a) Impulse HA ausgeblendet werden, wie sie durch schraffierte Flächen angegeben sind, Impulse also, die entsprechend den E hgrößen amplitudenmoduliert sind und durch die Schaltung nach Figur 3 geliefert werden können, indem dem Differenzverstärker DV ein - beispielsweise wieder von den Impulsen siM und sim - jeweils kurzzeitig leitend gemachtes Tor nachgeschaltet wird. Auch im ;ibrigen kann mit diesen Impulsen so verfahren werden, wie das f,*ir die schraffierten Impulse der Figur 2a bereits angegeben worden ist. Eine spezielle Art 'd er Weiterverarbeitung der in Figur 3a schraffiert dargestellten Impulse sei anhand des Blockschaltbildes Figur 4 beschrieben. In dem Blockschaltbild ist wieder der Wandler W mit dem Sprachverstärker V dargestellt, der seine Spannungen auf einen Scheitel-Detektor SE gibt, wie er anhand der Figur 1 beschrieben wurde. Die Ausgangs-Impulse siYI und sim des Detektors SE steuern ;iber jetzt zusammenfassend mit G bezeichnete Torschaltungen die Speicherung der Scheitelamplituden in dem Scheitelwertspeicher SS, wie er anhand von Figur 2 beschrieben wurde. Mit SD ist der Scheitelaniplituden-Differenzbildner nach Figur 3 bezeichnet. Dieser möge in der bereits angegebenen Weise die in Figur 3a schraf-. fierten, nach Maßgabe der Scheitelwertdifferenzen modulierten Irpulse HA ausgeben. Diese Impulse gelangen auf eine Umsetzung schaltung AM/DM, die in bekannter Art die amplitudenmodulierten Impulse in dauermodulierte Impulse umsetzt. Diese Schaltung kann z.B., wie bekannt, aus einer Schaltung SG zur selbstgesteuerten Erzeugung von Sägezähnen bestehen, wobei ein Kondensator nach Maßgabe der Impulsamplitude aufgeladen wird und sich mit einer Zeitkonstanten wieder entlädt, sowie einer mit BG symbolisierten Begrenzerschaltung, die den oberen Teil jedes Sägezahns abschneidet und nur dessen Fußteil als dauermodulierten Impuls iibrig läßt. Um in eine digitalisierte Darstellung überzugehen, können die am Ausgang von AM/DM erscheinenden dauermodulierten Impulse z.B. einem Tor G7 zugef;ihrt werden, das während der Dauer jedes Impulses leitend gemacht wird und wAhrend dieser Zeit schnelle Impulse eines Impulsgenerators IG auf einen Impulszähler IZ'I gelangen läßt, so daß die Dauer der einzelnen Impulse ausgezählt wird und als Zählerbetrag übermittelt oder einem Kodespeicher übergeben werden kann. Gegebenenfalls kennen in dieser 'Weise auch die Zeitintervalle zwischen den Anstiegsflanken der dauermodulierten Impulse, also den Scheitel-Zeltpunkten, durch einen zweiten Zähler ausgezählt und dann als Zählerstand übertragen oder in die Sprachkodierung mit auggenommen werden. In dem Blockschaltbild der Figur 4 sind außer einer Klemme 6, von der die Zählerstände von IZ'I abgenommen werden können, noch Klemmen 1 bis 5 vorgesehen, die mit verschiedenen Zwischenpunkten der bisher angegebenen Schaltung verbunden sind. Es können zur weiteren Verwertung abgenommen werden: von der Klemme 1 die Impulse siM und sim, von der Klemme 2 der Spannungsverlauf Z (Figur 2a), von der Klemme 3 der Spannungsverlauf H (Fig.3a), von der Klemme 4 die in der Schaltung AM/DM erzeugten Sägezähne, von der Klemme 5 die am Au3gang dieser Schaltung erscheinenden, nach Maßgabe der Scheitelwert-Differenzen dauermodulierten Impulse. Es ist bekannt, daß in einer Sprachschwingung insbesondere die stimmhaften Laute durch mehrere Schwingungsabschnitte wiedergegeben werden, die einander ähnlich sind und deren jede die Lautinformation enthält e'Grundperiode"). Um die Lautinformation zu iibertragen oder automatisch zu erkennen, geniigt es, wenn hierzu nur eine Periode dieser gleichartigen Perioden benutzt wird. Zur Erkennung dieser Perioden können die erste Umh;illende der Sprachschwingungen sowie darauf aufbauend auch weitere Umh@illende benutzt werden. Es läßt sich auf diese 'Weise eine Periode auffinden, deren Umhiillende gegenüber den Umh;illenden der gleichartigen Perioden das größte Maximum bzw. Minimum bzw. die größte Gesamtauslenkung hat, und es ist g;instig, diese Periode für die Übertragung oder automatische Auswertung zu benutzen, da in ihr im allgemeinen die Information am besten ausgeprägt ist. In dem Blockschaltbild nach Figur 4 sind zusätzliche Schalteinrichtungen angegeben, die ein solches Verfahren ermöglichen, und zwar auf folgende Weise: Eine durch den Block SE1 symbolisierte Schaltung ist im wesentlichen aufgebaut wie die Schaltung SE, also entsprechend der Figur 1. Zwischen die Schaltung SE1 und den Sprachschwingungsverstärker V; an den sie ebenfalls angeschlossen ist, ist ein Tor G8 gelegt, das nur durch Impulse siM leitend gemacht wird. Das bedeutet, daß ein dem Kondensator 011 der Figur 1 in der Schaltung SE1 entsprechender Kondensator stufenweise entsprechend den Maxima der Sprachschwingung Sp (Fig.1a) auf höhere Werte geladen wird, solange die Amplitude dieser Maxima größer wird. Sobald jedoch eine Amplitude eines Maximums aufgenommen wird, die kleiner ist als die Amplitude des vorangegangenen Maximums, tritt der friiher beschriebene Effekt der Schaltung nach Figur 1 ein: Es wird ein Impuls hsM von der Schaltung SEI ausgegeben, der anzeigt, daß ein Spannungsmaximum, welches in diesem Fall ein Maximum der oberen Hüllkurve der Sprachschwingung ist, durchgelaufen ist. Eine in SEI enthaltene Schaltung, die der unteren Schaltung in Figur 1 entspricht, kann durch einen Impuls hsm anzeigen, daß die obere HFillkurve der Sprachschwingung ein Minimum durchlaufen hat, also ein neuer "Bauch" der Hüllkurve beginnt. Zwar erscheint der Maximalimruls hsg der Hüllkurve erst beim Auftreten des nachfolgenden niedrigeren oberen Scheitels der Sprachschwingung, jedoch ist dies von untergeordneter Bedeutung, da in erster Linie das Schwingungsraket ermittelt werden soll, das von c;leichartigen Schwingungspaketen die größten Amplituden aufweist. Dies wird erreicht durch die Anordnung einer weiteren Stufe von gleicher Art, bei der an den Ausgang des Sprachverstärkers V über ein Tor G9 eine Schaltung SE2 angeschlossen ist, die wirderum die Ausbildung der Schaltung nach Figur 1 hat. Das Tor G9 wird leitend gemacht während der Maximal-Impulse, die von der Schaltung SEI ausgegeben werden. Infolgedessen wird der dem Kondensator CII der Figur I entsprechende Kondensator in der Schaltung SE2 stufenweise umgeladen entsprechend den oberen Sprachschwingungsspitzen, die in den einzelnen Buchen der oberen Hzllkurve jeweils auf deren Maximum folgen. Wiederum zeigt die Schaltung SE2 nach dem angegebenen Prinzip durch einen Impuls h'sM an, wenn eine Spitze mit der größten Amplitude durchgelaufen ist, auf die eine niedrigere folgt. Dieser Impuls wird also das Schwingungspaket mit den größten Amplituden signalisieren. Wenn nebenher nach z.B. bei Störungsschreibern bekanntem Prinzip eine gewisse Länge der Sprachschwingung ständig beispielsweise auf einem Magnetspeicher aufgezeichnet wir( io kann auf diesem Speicher das Schwingungspaket mit dee größten Amplituden durch den letztgenannten Impuls h'sM markiert werden und für sich allein zur Weiterübertragung, Kodierung oder sonstigen Auswertung wieder abgenommen werden, insbesondere unter Mitwirkung der Minimum-Impulse hsm der Hüllkurve, die ebenfalls in dem Magnetspeicher markiert werden können. Die Stufe G9, SE2 ermittelt in etwa das Maximum der über die obere Hüllkurve der Sprachschwingung gelegten Hüllkurve, und es ist ersichtlich, daß durch Anordnung weiterer nachgeordneter Stufen dieser Art weitere Impulse gewonnen werden können, die sich auf den Durchlauf der Maxima weit rer, übergeordneter Hüllkurven beziehen. Auf diese Weise wird eine ,5egmentierung der Sprachschwingung nach Maßgabe von Hüllkurven verschiedener Ordnung möglich, die für die Analyse der Sprachschwingeng von Bedeutung ist und bei deren Weiterverarbeitung für die Bericksichtigung wesentlicher und Unterdr@ickung unwesentlicher Abschnitte dienen kann.
  • Es ist vorgesehen, für eine Sprachkodierung die Anzahlen von in Sprachschwingungs-Segmenten enthaltenen Scheiteln der Sprachschwingung zu ermitteln und diese in den Kode aufzunehmen. In Figur 4 sind Einrichtungen angegeben, die Derartiges ermöglichen. Es ist ein Impulszähler IZ2 dargestellt, dessen Zähleingang die Scheitelimpulse siM und sim zugef,*ihrt werden, so daß sie den Zähler aufwärts zählen. Es ist weiterhin ein Tor G10 dargestellt, über das der Inhalt des Zählers an einen Ausgang 8 gegeben werden kann. Weiterhin soll die Anordnung getroffen werden, daß in bekannter Weise mit der Ausgabe des Zählerinhalts immer eine sofort nach dieser Ausgabe erfolgende Löschung des Zählers verbunden ist Es kann nun dieser Vorgang z.B., wie durch die gezei^hnete Verbindung dargestellt, jeweils durch einen Impuls hsm ausgelöst werden, wodurch an den Ausgang 8 die Anzahlen er Sprachschwingungsscheitel gegeben werden, die jeweils in einem Bauch der oberen Hüllkurve der Sprachschwingung liegen. Es kann auch vorgesehen werden, den Zähler IZ2 von höheren SE-Stufen, ggf. wahlweise, abfragbar zu machen oder jeder vorgesehenen SE-Stufe einen solchen Zähler zuzuordnen. Es sei nun eine kurze Betrachtung von Sprachschwingungseigenschaften eingeschaltet. Man kann bei den Sprachschwingungen eine Unterscheidung zwischen g-(Grundwellen-) -Schwingungen und r-("Rauhigkeits"-, Oberwelligkeits-) -Schwingungen treffen, so wie dies in Fig. 5a dargestellt ist. Dabei kann eine dieser Komponenten fehlen, z.B. die r-Schwingungen bei Vokalen. Einige Schwingungsformen fair Vokale sind in Fig. 5b -f mit Segment-Abgrenzungen dargestellt. Fig. 5b zeigt ein geschlossenes u wie in "Mut". Im Segment Sg ist nur. eine Schwingung (Maximum M). Ein dunklerer (offener) u-Laut wie in "Mutter" weist, wie in Fig.5c dargestellt, im Grundsegment Sg noch eine zweite kleinere Schwingung auf (Maxima M'1, M2). 'Nächst das zweite Maximum M2 mehr und mehr und nähert sich dem größten Maximum Ml an, so entsteht schließlich das geschlossene o wie im Wort "Sohn", vgl. Fig. 5d. Das Herausbilden eines dritten Maximums M3 läßt das offene o wie in "Sonne" entstehen, vgl. Fig. 5e. Ein viertes Maximum M4 bringt das geschlossene a wie in "Mann", vgl. Fig. 4f. Das offene a wie in "Tat "'hat noch mehr Schwingungen. Die Anzahl der Scheitel ist z.B. in Fig. 5c und 5d gleich. Es kann aber eine Typisierung nach Typen T vorgenommen werden, je nach den gegenseitigen Größenverhqltnissen der Hübe zwischen den Scheiteln. Nach dem friiher Erläuterten erkennt man, daß man z.B. den Verlauf nach Fig. 3a fier diese Typisierung heranziehen kann. 'Wie die Anzahl N der Scheitel in einem Segment ermittelt werden kann, wurde ebenfalls erläutert. Eine Kodierung, welche die Angaben N und T für die g-Schwingung und für die r-Schwingung enthält, ermöglicht eine Unt,erscheidung und .Erkennung unterschiedlicher Laute einschließlich unterschiedlich ausgesprochener Vokale. Die "chwingungsformen nach Fig. 5b-f enthalten keinen r-Anteil. Eine Kodierung der genannten Art kann demnach wie folgt aussehen:
    Fig. 5b N(g) = 1, T(g) = 1, N(r) = 0, T(r) = 0
    Fig. 5c N(g) = 2, T(g) _ 'f, N(r) = 0, T(r) = 0
    Fig. 5d N(g) = 2, T(g) = 2, N(r) = 0, T(r) = 0
    Fig. 5e N(g) = 31 T(g) = 1, N(r) = 0, T(r) = 0
    Fig. 5f N(g) = 41 T(g) = 1, N(r) ° 0, T(r) = 0
    Fig. 6 zeigt ein Blockschaltbild einer nach diesen Gesichts-
    punkten arbeitenden Sprachkodier- und Erkennungsschaltung.
    Die nat,_irlichen Sprachschwingungen gelangen vom Wandler W
    Tiber einen Sprachverstärker V auf einen Scheitelwert-
    Extrahierer SA, der die Scheitelamplituden gemäß Fig. 2a er-
    mittelt und ausgibt. Danach werden in einem g-r-Separator
    Sg/r die Scheitelwerte des g- und des r-Anteiles der Schwin-
    -#,ung separiert. In einer nachfolgenden Stufe werden neben-
    einander die Größen N(g), T(g), N(r) und T(r) bereitgestellt.
    Diese Großen werden einer Umkodiermatrix Mx zugef;ihrt, an
    deren Ausgänge ein Lautanzeige-Speicher LSp angeschlossen
    ist. Von diesem aus können Lautindikatoren (Tasten, Lampen
    u. dgl.) betätigt werden.
    Die in Fig. 6 angegebene g-r-Separierung nach der Scheitelwert-Extraktion kann mit den Hiillkurven-Methoden durchgeführt werden, wie sie fr@iher beschrieben wurden. Es ist aber auch möglich, wenn auch weniger bevorzugt, die g-r-Separierung unmittelbar aus der Sprachschwingung selbst durch einen Tief-und einen Hochpaß zu bewirken und erst danach die Scheitel-Extraktionen fier die beiden Anteile gesondert durchzufiihren. Die Darstellung der Sprachinformation durch Scheitelwerte, insbesondere durch einen Verlauf, wie er in Fig. 2a dargestellt ist, ergibt auch vorteilhafte Möglichkeiten, eine Sprach- oder Lautinformation von vornherein synthetisch zu bilden. Eine Einrichtung, mit der das geschehen kann, ist in Fig.7 dargestellt. Hier ist ein Ringzähler RZ vorgesehen, in dem. durch die Impulse eines Schiebetaktgenerators GR ein L-Zustand von Stufe zu Stufe (in Fig. 7 nach oben) weiter- und von der letzten Stufe wieder in die erste Stufe geschoben wird. `Nenn das "L" in die erste Stufe gelangt, gibt diese Stufe über eine Zeitung s1 einen Impuls auf ein bistabiles Flim-Flop FF1, das hierdurch umgeschaltet wird und Tiber seinen Ausgang a1 ein Tor G12 durchlässig macht, Tiber welches ein Kondensator C sich linear aufzuladen beginnt. Die Höhe dieser Aufladung soll durch einen vorwählb aren Zählerstand des Ringzählers RZ bestimmt werden, indem eine vorgewählte Stufe von RZ, wenn das "L" in sie gelangt, einen Impuls auf eine Zeitung r1 gibt, welcher das Flip-Flop FF1 wieder zuriickwirft und so das Tor G12 sperrt. Die Signalleitungen mz von den einzelnen Stufen des Ringzählers RZ bilden die Zeilen einer Wählmatrix, jede Spaltenleitung ms dieser Matrix ist über ein ihr zugeordnetes Tor Gm an die Leitung r1 anschaltbar. Jedes Tor Gm ist aktivierbar durch einen "L"-Wert in einer dem Tor zugeordneten Stufe einer Schiebekette GZ, in welcher ein solcher "L"-Wert ebenfalls von Stufe zu Stufe (in der Zeichnung von links nach rechts) weitergeschoben wird. Ein Schiebeimpuls, der eine solche Verschiebung bewirkt, entsteht jeweils dann" wenn in dem Ringzähler RZ das "L" in die erste Stufe geschoben wird. An jedem Ifreuzungspunkt der Wählmatrix befindet sich ein einriickbares Koppelelement, z.B. ein Koppelkern, welches im einger;ickten Zustand bewirkt, dafl ein in der Zeilenleitung mz entstehender Impuls auf die Spaltenleitung ms übertragen wird. Durch Tasten, durch einen Vertikalschieber o.dgl. kann in jeder Spalte ein Koppelelement eingeruckt werden, um eine Aufladehöhe des Kondensators C zu bestimmen.
  • Es werden nun in den Spalten der Matrix von links nach rechts Spannungswerte eingestellt, die z.B. den Scheitelsrannungswerten des Verlaufs t in Fig. 2a entsprechen. Werden z. B. Vertikalschieber benutzt, so machen deren Bedienungsknöpfe oder auch besondere Zeiger die Lage der Scheitelpunkte dabei auf der Einstellfläche sinnfällig sichtbar. Durch BetAtigung einer nicht dargestellten Einschalttaste o.dgl. wird sodann ein "L" in die erste Stufe der Schiebekette GZ gebracht, und der Schiebeimpulsgenerator GR wird in Gang gesetzt. Wenn der in RZ seinen Lauf beginnende Wert "L" erstmalig in die
    erste (unterste) Stufe von RZ gelangt, wird das Flip-Flop FF1
    umgeworfen und das Tor G12 durchlässig, so daß der Kondensa-
    tor C sich aufzuladen beginnt.
    Wenn danach der Wert "L" in RZ die Zeile des in der ersten
    Spalte einger;ickten, in der Zeichnung durch einen Kreis
    markierten Koppelelements erreicht, entsteht ein Zeilenimpuls,
    der Über das Koppelelement und das aktivierte Ausgangstor Ga
    dieser Spalte auf die Leitung r1 gelangt und das Flip-Flop FF1
    zuriickwirft. Dadurch wird das Tor G12 gesperrt und der Kon-
    densator C nicht weiter aufgeladen. Der zweite Ausgang des
    Flip-Flops FF1 stößt ein Monoflop MF1 an, welches einen Durch-
    laßimpuls für ein Tor G13 ausgibt, Über das die Kondensator-
    spannung am Ausgang AS abgefragt wird. Heim Zurückfallen stößt
    das Monoflop MF1 ein zweites Monoflop MF2 an, welches einen
    Durchlaßimpuls auf ein Tor G14 gibt, Iber das der Kondensator C
    entladen wird. Um diese Auswertungszeit in jedem Fall be-
    reitzustellen, kann der Ringz4hler RZ oberhalb der obersten
    Matrixzeile noch Leerstufen enthalten, stattdessen können
    auch wUhrend der aktiven Zeiten der Monoflops MFl und MP'2 von
    diesen aus die Schiebeimpulse aus GR abgeriegelt werden.
    Wenn der "L"-Wert in RZ wieder in die erste Stufe gelangt,
    wird Tor G12 wieder leitend, außerdem wird der "L"-Wert in GZ
    in die zweite Stufe geschoben, so daß nunmehr die Aufladehöhe
    von C durch das in der zweiten Spalte eingedickte KoDnelete-
    ment bestimmt wird, und 3o fort. Im Ausgang AS entsteht
    also eine Folge von amplitudenverschiedenen Impulsen wie
    etwa MA und mA in Fig. 2a, und zwar in gleichmäßigen Zeitabst:incien. Diese Impulse können Übertragen oder unmittelbar ausgewertet werden. Auch die Schiebekette GZ kann, wie durch die gestrichelte Linie angedeutet, zu einem Ring r;#ckgekoppelt werden, um die Ausgabe der Impulsfolge beliebig oft automatisch zu wiederholen. Die Amplituden der Impulse können auch wahrend des Betriebes dieser Einrichtung beliebig durch Neueinstellungen abgewandelt werden. Es kann auch jede zweite Spalte der Matrix dazu benutzt werden, um die Amplitude eifies Impulses einzustellen, die nicht eine Scheitelamplitude angibt, sondern die Größe des Zeitabstands zwischen den durch die benachbarten Spalten angegebenen Scheiteln. Es ist ebenso möglich, statt eines Verlaufes wie Z in Fig. 2a einen Verlauf von H wie in Fig. 3a in 'd er Einstellmatrix einzustellen. Anhand von Fig. 8 mit 8a und 8b sei schließlich noch eine Einrichtung beschrieben, die es erlaubt, aus einem Hubgrößen-Verlauf wie H in Fig. 3a wieder den zugehörigen Scheitelamplituden-Verlauf wie Z in Fig. 2a zurückzugewinnen. Die aufeinander folgenden Amplitudenwerte eines Hubgrößen-Verlaufs H ;?,em:iß Fig. 8a seien mit x'1, y'1, x2, y2, ... bezeichnet, wie ch in der Zeichnung eingetragen. Die aufeinander folgenden Amnlitudenwerte des zugehörigen Scheitelamplitudenverlaufs Z f 1 *iß Fiz. 8b sind mit xl, zl, z2, z3, z4 ... bezeichnet.
  • rem, Dann gilt, wie man leicht erkennt
    x1 - y1 = z1
    z1 + x2 = z2
    z2 - y2 = z3
    z3 + x3 = z4
    usw.
    An den Eingang der Schaltung gemäß dem Blockschaltbild Fig. 8 wird der Hubgrößen-Verlauf H in Impulsform angelegt. Über ein Tor G15 werden die Impulse xn auf einen Speicher Sxn gegeben, wehrend die Impulse yn über ein. Tor G16 auf einen Speicher Syn gelangen. Die Speicher sind im Prinzip wie die nach Fig. 3 ausgebildet. Ihre Ausgänge sind ebenfalls an einen Differenzverstärker angeschlossen, hier mit DV1 bezeichnet. Der Ausgang von DV1 ist an einen Speicher für zn angeschlossen. Die Spannungsgrößen zn-können aus diesem Speicher Szn Tiber ein Tor G17 an den Speicher Sxn gegeben und zu in diesem enthaltenen Werten xn addiert werden. Am Ausgang von DV1 liegt ferner ein Ausgabetor G18. Die Tore G15, G16, G17 werden in dieser Reihenfolge zyklisch nacheinander leitend gemacht. Zunächst erscheint x1 in Sxn und wird (der Speicher Syn möge zuerst leer sein) über Tor G18 ausgegeben. Dann erscheint y1 in Syn und demnach die Differenz x1 - y1 = z1 am Ausgang von DV1. Dieser Wert wird ;iber G18 ausgegeben und außerdem in Szn gespeichert. Über Tor G17 wird z1 auf den zuvor zugleich mit Syn gelöschten Speicher Sxn gebracht. Sodann gelangt x2 in den Speicher Sxn, mithin wird in ihm der Wert z1 + x2 = z2 gebildet, der über DV1 auf das Tor G18 und in den Speicher Szn gelangt. Sodann gelangt
    y2 nach Syn, am Ausgang von DV1 erscheint der Wert z2-y2 - z3,
    der wieder über G18 ausgegeben und nach Szn gegeben wird,
    und so fort. Am Ausgang des Tores G18 erscheinen mithin
    die Impulse mit den Amplituden (x'1), z1, z2, z3, z4 ....
    Sie gelangen sodänn beispielsweise Tiber einen Tiefpa8 TP,
    der sie verschleift, und einen Verstärker VZ auf einen Laut-
    sprecher Z, in dem die Sprache entsrrechend einer Sprach-
    schwingung Sp, wie sie in Fig. 8b gestrichelt eingezeichnet
    ist, hörbar gemacht wird.

Claims (4)

  1. P a t e n t a n s p r ü c h e 1. Verfahren zur Erfassung, Übertragung oder Nachbildung der in einer Sprachschwingung enthaltenen Information in der Form von ext-ahierten Teilmerkmalen der Schwingung, dadurch gekennzeichnet, daß die Scheitel (Maxima und Minima) der Sprachschwingung bei ihrem Auftreten festgestellt oder nachgebildet und deren Amplituden und/oder Zeitlagen als Informationsgrößen weiter verarbeitet werden.
  2. 2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß fortlaufend die Hiibe zwischen den Amplituden der aufeinander folgenden Scheitel ermittelt oder nachgebildet und - gegebenenfalls nach Rückumsetzung in Scheitelamnlitudenwerte - verarbeitet werden.
  3. 3. Verfahren nach Ansuruch 1 oder 2, dadurch gekennzeichnet, daß die Amplitudengrößen und /oder die Zeitlagen und/oder die Hubgrößen oder weitere hiervon abgeleitete-Größen kodiert werden.
  4. 4. Vereahren nach Ansrruch 1 oder 2, dadurch gekennzeichnet, daß zusqtzlich nach Maßgabe einer Hüllkurve der Sprachschwingung oder iibergeordneter Hüllkurven ausgewählte Scheitel ermittelt und deren Amplituden und/oder Zeitlagen verarbeitet werden. 5. Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, daß dif Amplitudengrößen oder Hubgrößen und/oder die Zeitabstände d6r Scheitel als durch Impulse abgegrenzte Zeitintervalle dargestellt und verarbeitet werden. 6. Verfahren nach Anspruch 5, dadurch gekennzeichnet, daß die Amplitudengrößen oder Hubgrößen darstellende Zeitintervalle vom Zeitpunkt des Auftretens der Scheitel ausgehend abgegrenzt werden. 7, Verfahren nach einem der Anspr@iche 1 - 6, dadurch gekennzeichnet, daß die gewonnenen Größen zeitlich gerafft weitergegeben werden. B. Verfahren nach einem der Anspriiche 1 - 6, dadurch gekennzeichnet, daß die Größen nur aus ausgewqhlten Abschnitten der Schwingung gebildet und verarbeitet werden, insbesondere nur aus Grundperioden bzw. Segmenten, die maximale Amplituden bzw. Zeitdauern aufweisen. g. Verfahren nach Anspruch 8, dadurch gekennzeichnet, daß die durch einen Z4hler ermittelte Anzahl der Scheitel innerhalb der Abschnitte verarbeitet insbesondere zum Bestandteil einer Kodierung gemacht wird 10. Verfahren nach einem der Ansnriiche 1 - 9, dadurch gekennzeichnet, daß die Größen zur Erzeugung einer synthetißchen Sprache benutzt werden. 11. Einrichtung zur Durchfitihrung des Verfahrens nach einem der Ansprüche 1 - 9 oder zur Erfassung oder Übertragung der in einer andersartigen unregelmäßigen Schwingungsform enthaltenen Information, gekennzeichnet durch Scheitelerkennungsschaltungen (SE), die sowohl die oberen als auch die@unteren Scheitel der Schwingung erkennen und durch jeweils erzeugte Impulse Tore (G3, G4) steuern, über die die jeweiligen Scheitel-Amplitudengrößen in der Reihenfolge ihres Auftretens auf einen Scheitelwertspeicher (SS) Übermittelt werden, an den Übertragungseinrichtungen (T5 bzw. SD) zur Übertragung der .ScheitelamDlitudengrößen oder von diesen abgeleiteter Größen auf eine Leitung oder an Einrichtungen (IZl) zur Zusammenstellung der Größen zu einem Kode angeschlossen sind. 12. Einrichtung nach Anspruch 11, dadurch gekennzeichnet, daß den Scheitelerkennungsschaltungen Mittel zur Messung der zwischen Scheitelerkennungen liegenden Zeitabstände nachgeschaltet sind, und d aß solche. Zeitabstandsgrößen übertragen bzw. in den Kode aufgenommen werden. 13. Einrichtung nach Anspruch 11, dadurch gekennzeichnet, daß an den Scheitelamplitudenspeicher (SS) Schaltungen (SD) angeschlossen sind, die die Hübe zwischen aufeinander folgend gespeicherten Scheitelamplituden messen und an eine nachgeschaltete Auswertungsstufe (AM/DM) weitergeben. 14. Einrichtung nach Anspruch 13, dadurch gekennzeichnet, daß einer die Hübe in Form amplitudenmodulierter Impulse ausgebenden Stufe (SD) eine Stufe (AM/DM) nachgeschaltet ist, die die Differenzwerte in dauermodulierte Impulse umwandelt. 15. Einrichtung nach Anspruch 14, gekennzeichnet durch mindestens einen Zeitzähler (IZ1), der die durch die dauermodulierten Impulse abgegrenzten Zeitintervalle auszählt. 16. Einrichtung nach den Anspr;ichen 13 - 15, dadurch gekennzeichnet, daß in der die Hübe ermittelnden Schaltung (SD) ein Hub jeweils zum Zeitpunkt des Auftretens eines Scheitel-Zeitimpulses (sim, siM) gemessen wird und der Zeitzähler (IZ1)jeweils zu einem solchen Zeitpunkt in Gang gesetzt wird. 17. Einrichtung nach Anspruch 13, gekennzeichnet durch Schaltmittel (SE, G8) zur Übertragung der .Amplituden nur der oberen (oder unteren) Scheitel auf eine weitere Scheitel-Erkennungsschaltung (SE1), welche Extremwert-Impulse (hsm, hsM) als Schwingungsabschnitts- Signale ausgibt. 18. 'Einrichtung nach .Anspruch 1?, gekennzeichnet durch ein durch die Schwingungsabschnitts- Signale (hsM) aufsteuerbares Tor (G9), das den zugehörigen Extremwert auf eine weitere Scheitelerkennungsschaltung (S E2) leitet. 19. Einrichtung nach Anspruch 18, dadurch gekennzeichnet, daß ihr weitere Stufen gleicher Art nachgeschaltet sind. 20. Einrichtung nach den Anspr;ichen 11 und 17 - 19, dadurch gekennzeichnet, daß einer S.heitelerkennungsschal- tung (SE) ein Zähler (IZ2) beigeschaltet ist, der die Extremwert-Impulse (sim, siM) in Intervallen zwischen Extremwert-Im-oulsen (hsm) einer nachgeordneten (Hüllkurven-) Scheitelerkennungsschaltung (SE1) zählt. 21. Einrichtung zur Durchf;ihrung des Verfahrens nach Anspruch 3 und 9, gekennzeichnet durch Mittel (Sg/r) zur Separierung von Grund- Trägerschwingungen und überlagerten Schwingungen, und durch für jede dieser beiden Komponenten vorgesehene Z4hler
    (N(g), N(r)) zur Scheitelzählung innerhalb von Abschnitten der Sprachschwingung und Ausgabe der Zählwerte als Kodegrößen in Verbindung mit weiteren godegrößen-Bildnern (T(g), T(r)),' insbesondere solchen, die Typen von Hubgrößen-Verhältnissen angeben. 22. Einrichtung zur Nachbildung von Sprachinformationen, insbesondere zur Erzeugung synthetischer Sprache, gekennzeichnet durch Einstellmittel, um eine Mehrzahl von Scheitelamplitudengrößen oder Hubgrößen zwischen Scheiteln und gegebenenfalls Zeitabstände zwischen S-heiteln nebeneinander einzustellen, und Schaltmittel, die entsprechend solchen Größen modulierte Impulse nacheinander ausgeben. 23. Einrichtung nach Anspruch 22, gekennzeichnet durch ein matrixartiges Einstellfeld (ms, mz) mit Mitteln, um in diesem die Ord@natenwerte nach Maßgabe der Größen einzustellen.-.. r 24. Einrichtung zur Umsetzung von Hubwerten zwischen Scheitelamplituden in Scheitelamplitudengrößen einer Schwingung, insbesondere zur Durchf@ihrung des Verfahrens nach Anspruch 2, gekennzeichnet durch zwei Speicher (Syn, Sxn), die abwechselnd aufeinander folgende Hubwerte aufnehmen, einen diesen Speichern nachgeschalteten Differenzbildner (DV1) nebst einem hieran angeschlossenen Speicher (Szn) für Scheitelamnlitudengrößen, sowie"eine Wickverbindung (t17), um'Werte aus dem letztgenenuteh Speicher (Szn) in einen der erstgenannten Speicher (qxn) £wecke jewoiligex Addition. mit einem neu eingehenden Rubwert zu übertregeh. 25. Schaltungsanordnung zur Erkennung von Scheiteln siner elek- trischen Schwingung oder zur jeweils vorübergehenden Spei-' cherung ausgewählter .Lmplitudengrößen der Schwingung oder hieraus abgelOiteter Größen, insbesondere zur Verwendung in Einrichtungen nach den Ansprüchen 11, 13 und 17 - 19,
    ggkönnäeigbiet durch eine Spannungsquelle veränderlicher Spannung (w)'zwei hieran mit ihren Basiselektroden ange- schlossene Emitterfolger (T1x, T2x bzw. T''1x, T-2x), wobei vor mindestens einer Basis ein ateuerbaree Tor zwischenge- schaltet tot, eine Verbindung zwischen den Ixtiittern der beiden -.ttrtolger` in der Owsi Dioden (t?1xt V2ebev D'UB'2x) mit gleioher` Durahle.ßxichtung hihtereitander liegen, Und einen zwischen den Dioden mit einer Belegung angegchloiisenen Kondensator (tbr bzw. 0'k), dessen andere BelegÜng an festem Potential liegt;
DE19661487540 1966-12-01 1966-12-01 Verfahren für Analyse und Synthese von elektrischen Akustiksignalen Expired DE1487540C3 (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DET0032642 1966-12-01

Publications (3)

Publication Number Publication Date
DE1487540A1 true DE1487540A1 (de) 1969-04-24
DE1487540B2 DE1487540B2 (de) 1980-10-30
DE1487540C3 DE1487540C3 (de) 1981-06-25

Family

ID=7557186

Family Applications (1)

Application Number Title Priority Date Filing Date
DE19661487540 Expired DE1487540C3 (de) 1966-12-01 1966-12-01 Verfahren für Analyse und Synthese von elektrischen Akustiksignalen

Country Status (1)

Country Link
DE (1) DE1487540C3 (de)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE1963082A1 (de) * 1969-12-16 1971-06-24 Heinz Kusch Verfahren und Einrichtung zur automatischen Sprachverarbeitung
DE2853219A1 (de) * 1978-12-09 1980-09-25 Heinz Dipl Phys Kusch Verfahren zur automatischen erkennung der tonhaltigkeit
DE3329208A1 (de) * 1983-08-12 1985-02-28 H. Dipl.-Phys. 7801 Umkirch Kusch Verfahren fuer datenreduktion von sprachsignalen

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GR58359B (en) * 1977-08-09 1977-10-03 Of Scient And Applied Res Ltd Voice codification system

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE1963082A1 (de) * 1969-12-16 1971-06-24 Heinz Kusch Verfahren und Einrichtung zur automatischen Sprachverarbeitung
DE2853219A1 (de) * 1978-12-09 1980-09-25 Heinz Dipl Phys Kusch Verfahren zur automatischen erkennung der tonhaltigkeit
DE3329208A1 (de) * 1983-08-12 1985-02-28 H. Dipl.-Phys. 7801 Umkirch Kusch Verfahren fuer datenreduktion von sprachsignalen

Also Published As

Publication number Publication date
DE1487540C3 (de) 1981-06-25
DE1487540B2 (de) 1980-10-30

Similar Documents

Publication Publication Date Title
DE2533654C3 (de) Verfahren zur Bildanalyse und Anordnung zum Durchfuhren dieses Verfahrens
DE2650255A1 (de) Schaltungsanordnung zur automatischen erkennung kontinuierlicher sprachsignale, insbesondere eines oder mehrerer kontinuierlich gesprochener worte oder zahlen
DE2044177A1 (de) Verfahren und Vorrichtung zur maschinellen Zeichenerkennung
DE1762188A1 (de) Schaltungsanordnung zur Bestimmung des Impulses groesster Amplitude in einer Impulsfolge
DE2636281A1 (de) Einrichtung zur identifizierung eines betaetigten tastenschalters von zahlreichen tastenschaltern
DE3878895T2 (de) Verfahren und einrichtung zur spracherkennung.
DE1937464C3 (de) Sprachanalysiergerät
DE1487540A1 (de) Verfahren und Einrichtung zur Erfassung,UEbertragung oder Nachbildung der in einer Sprachschwingung enthaltenen Information
DE1422040A1 (de) Verfahren zum automatischen Erkennen gesprochener Worte
DE2748422C2 (de) Polyphones elektronisches Musikinstrument
DE1541712A1 (de) Vorrichtung zum AEndern der Frequenz von sinusfoermigen elektrischen Signalen und hierfuer geeignete elektronische Schaltung
DE2637264A1 (de) Elektronisches musikinstrument
DE1541624A1 (de) Verfahren zur Frequenzumsetzung
DE976994C (de) Einrichtung zur stoerungsfreien UEbertragung elektrischer Wellen mittels Codeimpulsgruppen
DE2438353C3 (de) Aufnahmeanordnung mit Informationsaufnahmestellen in einem Halbleiterkörper
DE2051589A1 (de) Anordnung zur Synthese eines Signals
DE1122754B (de) Verfahren und Vorrichtung zur automatischen Zeichenerkennung
DE1292208B (de) Abtastschaltungsanordnung, insbesondere fuer Fernsprechvermittlungsanlagen
DE2643429A1 (de) Anordnung zum abfragen und festhalten eines tastsignals bei einem elektronischen musikinstrument
DE1940082A1 (de) Verfahren zum Erkennen von Sprachmerkmalen und deren Aufzeichung mittels einer elektrisch gesteuerten Schreibmaschine
DE2025694C (de) Elektronische Uhr mit einer Zeitbasis hoher Frequenz und einem elektronischen Frequenzteiler fur diese Frequenz
DE1448253A1 (de) Hochfrequenzmassenspektrometer-Anordnung
DE2459242A1 (de) Verfahren zur beseitigung von ausschwingvorgaengen an signalimpulsen und anordnung zur durchfuehrung dieses verfahrens
DE1933358C3 (de) Einrichtung zur Bestimmung einer Bewegungsgröße eines für ein Uhrwerk vorgesehenen Unruh-Schwingsystem
DE1910973C3 (de) Laufzeitschaltung für Einrichtungen der elektrischen Nachrichtentechnik

Legal Events

Date Code Title Description
OF Willingness to grant licences before publication of examined application
OF Willingness to grant licences before publication of examined application
C3 Grant after two publication steps (3rd publication)
8339 Ceased/non-payment of the annual fee