-
Schaltung zur Verbesserung der Erkennbarkeit von Lauten bei der Schallanalyse
Die Erfindung betrifft eine Schaltung zur Verbesserung der Erkennbarkeit von Lauten
bei der Schallanalyse, insbesondere der menschlichen Sprache, bei der die akustischen
Wellen in elektrische Signale umgewandelt werden, unter Verwendung eines einen Hauptkanal
und einen dessen Verstärkungsgrad regelnden Nebenkanal enthaltenden Amplitudenkompressors.
-
Es sind bereits Amplitudenkompressoren bekannt, wie sie z. B. in Kompandern
zur Verbesserung des Signal-Geräusch-Verhältnisses oder in Antifadings zur Verminderung
von Schwunderscheinungen verwendet werden. Diese Kompressoren sind Verstärker mit
veränderlichem Verstärkungsfaktor in Abhängigkeit von der Signalamplitude. Es hat
sich aber herausgestellt, daß die bekannten Kompressoren nicht in der Lage sind,
die geringfügigen Unterschiede der Frequenzspektren der einzelnen Laute so zu verändern,
daß die informationsreichen, aber schwächeren Komponenten für die Schallanalyse
auswertbar sind.
-
Die Erfindung sieht daher einen Kompressor vor, bestehend aus einem
Hauptkanal und einem Nebenkanal, wobei im Nebenkanal ein Filter angeordnet ist,
welches nur die der eindeutigen Erkennbarkeit der Laute dienenden, aber amplitudenschwachen
Frequenzkomponenten hindurchläßt. Es wird also der Verstärkungsfaktor des Hauptkanals
in Abhängigkeit von den höheren, jedoch amplitudenschwächeren Frequenzkomponenten,
welche das Charakteristikum eines Lautes darstellen, gesteuert.
-
Es gelangt also nur die für die Schallanalyse nützliche und wesentliche
Information ohne Verzerrungen auf den nachgeschalteten logischen Teil. Die ungewollte
Dynamik wird ausgeschaltet und durch eine neue gewünschte Dynamik ersetzt, so daß
das Amplitudenspektrum des einzelnen Signals erhalten bleibt, jedoch die Amplitudenspektren
von aufeinanderfolgenden Signalen je nach dem erstrebten Ziel zueinander relativ
verändert werden.
-
Die Erfindung ist dadurch gekennzeichnet, daß im Nebenkanal ein Hochpaßfilter
vorgesehen ist, dessen untere Grenzfrequenz über dem jeweiligen Frequenzbereich
der für den zu analysierenden Laut möglichen Grundfrequenz liegt.
-
Gemäß der Erfindung wird das gesamte Spektrum des dem Klang. bzw.
Ton entsprechenden Signals durch mindestens einen Kompressor komprimiert, wobei
das Pegelsignal nur von einem Teildes gesamten Frequenzbandes des eingehenden Signals
gewonnen wird. Vorzugsweise wird zur Gewinnung des Pegelsignals des Kompressors
ein Bandfilter verwendet, der beispielsweise das Frequenzgebiet der Grundfrequenz
unter 400 Hz sperrt, so daß die Grundfrequenz zu der Kompression des Gesamtsignals
nichts beiträgt. Die Kompression wird somit ausschließlich durch die Komponenten
der eingehenden Signale gesteuert, deren Frequenzen über beispielsweise 400 Hz liegen.
Die Energie beispielsweise des phonetischen Lautes M liegt in dem Bereich der Grundfrequenz,
während die phonetische Energie des phonetischen Lautes A etwa bei 1000 Hz
liegt. Durch einen erfindungsgemäßen Kompressor wird nun die vergleichsweise schwache
Gesamtenergie des Lautes M relativ gesehen verstärkt, während das Gesamtsignal des
Lautes A stark komprimiert wird. Es wird an dieser Stelle erwähnt, daß selbstverständlich
mehrere verschiedene Amplitudenkompressoren gemäß der Erfindung verwendet werden
können, die jeweils unterschiedliche Filter in dem Nebenkanal enthalten, d. h. in
dem Kanal, der das Regelsignal erzeugt.
-
Aus obigem ergibt sich, daß der erfindungsgemäße Kompressor wegen.
der neu entstandenen Dynamik die Analyse und Erkennbarkeit von Lauten verbessert.
Dies gilt z. B. bei automatischer Umsetzung gesprochener Laute in phonetische Schrift
oder zur Korrektur der Verständlichkeit in elektrischen Nachrichtenübertragungssystemen.
Die Verbesserung der Verständlichkeit ist besonders bei Schwerhörigengeräten wichtig.
Die
Erfindung soll anschließend an Hand der Zeichnungen näher erläutert werden-, wobei
darstellt F i g. 1 ein Blockschaltbild mit einem rückwärts gesteuerten Kompressor,
gemäß einem Ausführungsbeispiel der Erfindung, F i g. 2 ein Blockschaltbild mit
einem vorwärts gesteuerten Kompressor gemäß einem weiteren Ausführungsbeispiel der
Erfindung, F i g. 3 eine graphische Darstellung mit den Durchlaßbereichen der verschiedenen
Filter der Kompressoren der F i g. 1 und 2, F i g. 4 das Spektrogramm von zwei Lauten
der menschlichen Sprache vor und nach der Modifizierung durch einen erfindungsgemäßen
Kompressor, F i g. 5 und 6 eine graphische Darstellung der Gesamtamplitude eines
gesprochenen Wortes vor und nach der erfindungsgemäßen Kompression, F i g. 7 eine
graphische Darstellung mit der Kennlinie des erfindungsgemäßen Kompressors als eine
Funktion der Frequenz des einkommenden Signals, F i g. 8 eine graphische Darstellung
des Ausgangssignals eines erfindungsgemäßen Kompressors in Abhängigkeit von der
Zeit, F i g. 9 das Linienschaltbild eines rückwärts gesteuerten Kompressbrs der
in F i g. 1 gezeigten Art, F i g. 10 eine Einrichtung zur Analyse der menschlichen
Sprache, als Blockschaltbild unter Verwendung von Kompressoren der in den F i g.
1, 2 und 9 gezeigten Art, F i g.11 das Blockschaltbild von den Formant-und Subformanteinheiten
der Einrichtung gemäß F i g.11, F i g. 12 ein Blockdiagramm mit Wellenformen der
Formanten und Subformanten zur Erläuterung der entsprechenden Einheiten der F i
g. 11, F i g. 13 ein weiteres Ausführungsbeispiel einer Formant- und einer Subformanteinheit,
F i g. 14 ein Blockdiagramm mit Wellenformen von Subformanten zur Erläuterung der
Ermittlung von Lauten mit Fluktuationen bzw. Modulationen, F i g. 15 ein Blockdiagramm
mit einer Anordnung von Formantfiltern zur Ermittlung der Grundfrequenz, F i g.
16 das Linienschaltbild eines Teiles der Fig. 15, F i g. 17a bis 17d verschiedene
Spektrogramme von zwei Lauten, gesprochen bei verschiedenen Grundfrequenzen, F i
g. 18 in schematischer Darstellung das Spektrogramm verschiedener Laute, F i g.
19 ein Schema zur Erläuterung der Analyse eines gesprochenen Wortes in einer Einrichtung
der in F i g. 10 gezeigten Art, F i g. 20 ein Flußbild zur Erläuterung der Verarbeitung
der eingehenden Wellenzüge und F i g. 21 ein schematisches Blockdiagramm einer Einrichtung
zur Gewinnung der phonetischen Schriftsignale von gesprochener Sprache.
-
Bei der erfindungsgemäßen Einrichtung zur Analyse beispielsweise der
menschlichen Sprache sind z. B. an ein Mikrophon mehrere Kanäle angeschlossen, wobei
jeder Kanal den eingehenden Wellenzug bezüglich des Vorhandenseins oder Nichtvorhandenseins
bestimmter charakteristischer Merkmale untersucht. Wie bereits erwähnt, muß das
ankommende Signal in jedem Kanal einer Amplitudenkompression unterzogen werden,
damit die im Durchschnitt etwa hundert möglichen Niveaus auf eine kleine Zahl wie
zwei oder drei reduziert wird. Jeder Amplitudenkompressor enthält beispielsweise
einen Hauptkanal und einen Nebenkanal, wobei das Signal durch einen Verstärker in
dem Hauptkanal verstärkt wird. -In dem Nebenkanal, der an den Hauptkanal angeschlossen
ist, wird ein Signal gewonnen, welches den Verstärkungsfaktor bzw. den Kompressionsgrad
des Verstärkers in dem Hauptkanal regelt. Es ergibt sich hierbei die Beziehung log
V2 = R - log V, -E- C, wobei Vl das ankommende Signal ist, V2 das Signal am Ausgang
des Verstärkers und R der Regelgrad, der zwischen 1 und 0 liegt. R = 1 entspricht
dabei einer Kompression 0; der Kompressionsgrad nimmt zu, je weiter sich R dem Wert
0 angleicht.
-
Gemäß der vorliegenden Erfindung enthält der Kompressor in dem Nebenkanal
einen Filter, so daß mindestens zwei unterschiedliche Regelgrade R in Abhängigkeit
oder der Spektralverteilung des eingebenden Signals gegeben sind.
-
In F i g. 1 ist mit 1 ein Mikrophon bezeichnet, an dessen Stelle selbstverständlich
auch ein Tonbandgerät oder eine andere Vorrichtung treten kann, die die zu analysierenden
Tonfolgen in Form von elektrischen Schwingungen abgibt. Das Mikrophon
1 ist mit einem Vorverstärker 2 verbunden, der die ankommenden Schwingungen
verstärkt. Vorzugsweise arbeitet dieser Vorverstärker 2 frequenzabhängig, wie dies
durch den Kondensator 3 angedeutet ist. Dieser Kondensator 3 bewirkt, daß die Frequenzen
unter etwa 1500 Hz geschwächt werden, so daß das am Ausgang des Vorverstärkers erscheinende
Signal bezüglich der Amplitudenverteilung in dem Hörbereich wenigstens angenähert
der physiologischen Hörkurve angeglichen ist. Es wird somit erreicht, daß z. B.
bei der Analyse der menschlichen Sprache die relativ großen Amplituden der Grundfrequenz
sowie der tieferen Formanten im Vergleich zu höheren Frequenzen geschwächt werden.
Der Vorverstärker 2 ist mit einer Verteilungsleitung 4 verbunden, von welcher
mehrere Abzweigungen 5, 6, 7 usw. zu den Kanälen führen, in denen das Signal verarbeitet
wird. In F i g. 1 ist der Kompressor Cl gezeigt, der sich an die Leitung 5 anschließt.
-
Das von der Verbindungsleitung 4 kommende Signal gelangt über die
Leitung 5 zu einem Hochpaßfilter 8, das in Abhängigkeit von der Aufgabe der an den
Kompressor angeschlossenen Stromkreise die Frequenzen aussiebt, die in diesen Kreisen
nicht verwendet werden. Das das Hochpaßfilter 8 verlassende Signal gelangt zu einem
Regelverstärker 9. Der Ausgang dieses gesteuerten Verstärkers 9 ist über einen weiteren
Verstärker 10a mit dem allgemein mit 10
bezeichneten Nebenkanal verbunden.
Der Nebenkanal erzeugt das Signal, welches den Verstärkungsfaktor des Regelverstärkers
9 steuert. Der Ausgang des Verstärkers 10a ist mit einem Filter 11 verbunden,
dessen Funktion später beschrieben wird. Vorzugsweise ist das Filter 11 als Bandpaßfilter
ausgebildet, wobei der Durchlaßbereich kleiner ist als der Durchlaßbereich des Filters
B. Der Filter 11 kann jedoch auch als Hochpaßfilter ausgebildet sein, wobei die
untere Grenzfrequenz über der entsprechenden Grenzfrequenz des Filters
8 des Hauptkanals liegt. Der Ausgang des Bandpaßfilters 11 ist mit einem
Gleichrichter 12 verbunden und dieser mit einem Tiefpaßfilter 14. Das Ausgangssignal
des Tiefpaßfilters 14 steuert nun den
Verstärkungsgrad des
Regelverstärkers 9; und zwar derart, daß der Verstärkungsfaktor herabgesetzt wird,
je höher die Amplitude des Eingangssignals auf den Leitungen 4 bzw.
5 ist. Regelung R erfolgt derart, daß zwischen dem Eingangssignal V1 und
dem Ausgangssignal VZ die oben gegebene Beziehung log VZ = R - log V1 +
C
besteht. Der Wert R nimmt dabei für Frequenzkomponenten innerhalb und außerhalb
des Durchlaßbereiches des Filters 11 verschiedene Werte an. Zur weiteren
Diskriminierung des am Ausgang des Regelverstärkers erscheinenden Signals ist eine
Reihe von Bandpaßfiltern bzw. Formantfiltern 16a, 16b an diesen Ausgang angeschlossen,
wobei die Filter vorzugsweise unterschiedliche, enge Durchlaßbereiche aufweisen.
-
Abweichend von dem Ausführungsbeispiel der F i g. 1 kann die Regelung
auch derart erfolgen, wie dies bei dem Kompressor C2 in F i g. 2 gezeigt ist. In
gleicher Weise wie bei dem Ausführungsbeispiel der F i g. 1 ist ein hier mit 21
bezeichnetes Mikrophon vorgesehen, welches über einen Kondensator 23 mit dem Vorverstärker
22 verbunden ist. Der Ausgang des Vorverstärkers 22 ist mit einer Verteilungsleitung
24 verbunden, von welcher Leitungen 25, 26, 27
abgehen, die die Verbindung
mit den verschiedenen Kanälen bzw. Stromkreisen herstellen. Die Funktion der Elemente
21 bis 27 ist die gleiche wie diejenige der Elemente 1 bis 7 bei dem Ausführungsbeispiel
der F i g. 1. In gleicher Weise ist der Nebenkanal 30 mit dem Verstärker 30a, dem
Band- oder Hochpaßfilter 31, dem Gleichrichter 32 und dem Tiefpaßfilter 33 gleich
aufgebaut wie der entsprechende Nebenkanal 10 bei dem Ausführungsbeispiel
der F i g. 1. Mit der Leitung 25 ist bei dem Ausführungsbeispiel der F i g. 2 ein
Hochpaßfilter 28 verbunden, dessen Ausgang einerseits mit dem Verstärker 30a und
andererseits mit einem Verzögerungsglied 34 verbunden ist. Der Ausgang des Verzögerungsgliedes
34 ist mit dem Regelverstärker 29 verbunden. Mit dem Ausgang des Verstärkers 29
sind mehrere Bandpaß-bzw. Formantfilter 17a, 17b zur Aufteilung der Frequenzkomponenten
verbunden.
-
Bei dem Ausführungsbeispiel der F i g. 1 ist eine sogenannte Rückwärtsregelung
vorgesehen, während bei dem Ausführungsbeispiel der F i g. 2 eine Vorwärtsregelung
vorgesehen ist.
-
An Hand der F i g. 3 soll nun die Funktion der verschiedenen Filter
8, 11 und 14 der F i g. 1 bzw. 28, 31 und 33 bei F i
g. 2 erläutert werden, wobei die F i g. 3 für beide Ausführungsbeispiele zutreffend
ist. Der Durchlaßbereich des Hochpaßfilters 8 bzw. 28 ist durch die Kurve
35 veranschaulicht, deren Anstiegsflanke bei f2 liegt. Der Durchlaßbereich des Bandpaßfilters
11 bzw. 31 ist durch die Kurve 36 veranschaulicht und enthält die Frequenz
f3. Der Durchlaßbereich des Tiefpaßfilters 14 bzw. 33 ist durch die Kurve
37 gezeigt; die Abfallflanke liegt bei der Frequenz f1. Es ist zunächst zu ersehen,
daß sich die Bereiche der Kurven 35 und 37 ausschließen. Der Tiefpaßfilter
14 bzw. 33 überträgt vorzugsweise nur Änderungen in der Amplitude der gleichgerichteten
Signale, nicht jedoch Komponenten dieses Signals selbst. Wenn beispielsweise in
einem bestimmten Kanal Frequenzen bis zu 400 Hz herab verarbeitet werden sollen,
beginnt der Durchlaßbereich der Hochpaßfilter 8 bzw. 28 bei beispielsweise
f, = 400 Hz, während der Durchlaßbereich des Tiefpaßfilters 14 bzw. 33 bei f1 =
380 Hz endet, so daß Amplitudenänderungen bis zu der Zeitkonstante T, des Regelvorganges
verarbeitet werden können, die der Beziehung
entsprechen. Zur Erläuterung der Aufgabe des neuen Bandpaßfilters 11 bzw. 31 sei
angeführt, daß es beispielsweise unter anderem die Aufgabe eines Kanals sein kann,
die Sprachlaute N und I zu unterscheiden. Unerwarteterweise ergibt sich bei einer
spektralen Aufteilung dieser Laute, daß sich diese ziemlich ähnlich sind. Zur Erläuterung
wird auf F i g. 4 verwiesen, welche die Amplitudenverteilung der Laute
I und N
in Abhängigkeit von der Frequenz bei einem bestimmten Sprecher
zeigt. Es ist zu ersehen, daß beide Laute I und N etwa bei 200 Hz
bzw. bei der Grundfrequenz 100 Hz je einen ersten Formanten Ii bzw. In aufweisen
und einen zweiten Formanten IIi bzw. IIn etwa bei 3000 Hz bzw. bei 2500 Hz.
-
Eine Unterscheidung der Laute ist durch die zweiten Formanten an sich
möglich. Bei einem normalen Kompressor würde jedoch der zweite Formans Il. des Lautes
N so schwach werden, daß das Niveau dieses Formanten praktisch nicht mehr in Erscheinung
tritt. Die große Schwächung ist darauf zurückzuführen, daß der erste Formant In
die Kompression auch des zweiten Formanten Itn regelt. Gemäß der vorliegenden Erfindung
ist nun in dem Neben- bzw. Regelkanal 10 bzw. 30 ein Filter, z. B. ein Bandpaßfilter
11 bzw. 31 vorgesehen, das beispielsweise die Komponenten unter 400 Hz unterdrückt,
so daß ausschließlich weitgehend die Amplitude des zweiten Formanten II" selbst
den Kompressionsgrad bestimmt. Praktisch hat dies zur Folge, daß die Amplitude des
zweiten Formanten des N derjenigen des zweiten Formanten des I angeglichen wird.
Zur Unterscheidung des Lautes N von dem Laut I
stehen nun zwei etwa
gleich hohe Pegel zur Verfügung, so daß der Frequenzunterschied der entsprechenden
Formanten leicht festgestellt werden kann. Durch den erfindungsgemäßen Kompressor
wird somit der zweite Formant des Lautes N stark angehoben, wie dies durch den ausgezogenen
Kurvenzug n' in F i g. 4 veranschaulicht ist.
-
Die Verhältnisse sollen nachfolgend an Hand der F i g. 5 und 6 nochmals
erläutert werden, welche in graphischer Darstellung die Amplitude des Wellenzuges
beispielsweise des Wortes »NOVELTI« darstellen. F i g. 5 zeigt den Wellenzug so,
wie er vor der erfindungsgemäßen Amplitudenkompression, und F i g. 6, wie er nach
dieser Kompression erscheint. Aus F i g. 5 ist zu ersehen, daß die Amplitude bei
den Konsonanten N, V, L sehr gering, hingegen bei den Vokalen O, E
und I vergleichsweise stark ist, so daß eine Auswertung nach einer üblichen
Amplitudenkompression praktisch auf große Schwierigkeiten stößt. Nach der erfindungsgemäßen
Amplitudenkompression sind die Gesamtamplituden der Konsonanten N, V, L im
Vergleich zu den Amplituden der Vokale angehoben, so daß ein Kurvenzug mit angeglichener
Amplitude verbleibt. Bei dem erfindungsgemäßen Kompressor ist dies darauf zurückzuführen,
daß die tiefen Komponenten der Konsonanten N, V, L
im Sperrbereich des Bandpaßfilters
11 (F i g. 1) und 31
(F i g. 2) liegen und daher zur
Kompression nichts beitragen.
-
Bei den Wellenzügen der F i g. 5 und 6 enthält die Anstiegsflanke
der Schwingung des I die Merkmale für den Buchstaben T. Hierauf soll weiter unten
mehr im einzelnen eingegangen werden.
-
Es sei an dieser Stelle darauf hingewiesen, daß auch bei den nachfolgenden
Betrachtungen immer die Schreibweisen verwendet werden, die einer phonetischen Wiedergabe
des gesprochenen Wortes entsprechen.
-
Schließlich sei zur weiteren Erläuterung der Amplitudenkompressoren
C, C2 gemäß F i g. 1 und 2 auf die F i g. 7 und 8 Bezug genommen, die die Frequenzabhängigkeit
der Charakteristik der Amplitudenkompressoren zeigen. Die Kurven 38, 39 und
40 zeigen die Ausgangsspannungen VZ des Kompressors als eine Funktion der
Frequenz. Die Spannungen stehen am Eingang des Kompressors in einem Verhältnis von
beispielsweise 1 : 20: 400. Bei der Frequenz f2 beträgt das Verhältnis der drei
Spannungen zueinander beispielsweise 1 : 10: 100, da auch bei dieser Frequenz, die
unterhalb des Durchlaßbereiches der Bandpaßfilter oder Hochpaßfilter 11 bzw. 31
(F i g. 1 und 2) liegt, aus praktischen Gründen eine wenn auch geringe Kompression
erfolgt. Es gelangt somit ein vergleichsweise kleines, die Verstärkung steuerndes
Signal von dem Nebenkanal zu dem gesteuerten Verstärker 9 bzw.29, so daß der Verstärkungsfaktor
geringfügig herabgesetzt wird. Zur Erläuterung ist der Durchlaßbereich des Filters
11 bzw. 31 in diese Figur nochmals gestrichelt eingezeichnet und mit
41 bezeichnet. Bei der Frequenz f3, d. h. innerhalb des Durchlaßbereiches
der Filter 11 und 31, gelangt ein vergleichsweise starkes Signal durch den Filter
11 bzw. 31 zu dem geregelten Verstärker 9 bzw. 29, so daß eine Kompression in einem
wesentlich höheren Ausmaß erzielt wird. Bei der Frequenz f3 ist das Verhältnis zwischen
den drei Spannungen V2 beispielsweise 1 : 2: 4. Das Kompressionsverhältnis beträgt
bei der Frequenz f2 beispielsweise 400: 100 = 4, während es bei der Frequenz f3
= 400: 4 = 100 beträgt.
-
Das Kompressionsverhältnis nimmt oberhalb des Durchlaßbereiches der
Bandpaßfilter 11 bzw. 31 wieder ab. Das Kompressionsverhältnis ist oberhalb des
Beginns des Durchlaßbereichs der Filter 11 bzw. 31
konstant, wenn diese
Filter als Hochpaßfilter ausgebildet sind. Um die Verhältnisse zu erläutern, die
bei höheren Frequenzen auftreten, wenn der Filter 11
bzw. 31 als Bandpaßfilter
ausgebildet ist, sei nochmals auf F i g. 3 verwiesen, welche in graphischer Darstellung
den Durchlaßbereich der verschiedenen Filter zeigt.
-
Es ist zu ersehen, daß mit höher werdenden Frequenzen die Impedanz
des Bandpaßfilters 11 bzw. 31
vorzugsweise langsam zunimmt, wie dies
durch die langsam abfallende Flanke 36' des Kurvenzuges 36 dargestellt ist. Mit
höher werdenden Frequenzen nimmt somit das Signal, welches durch den Nebenkanal
übertragen wird, wieder ab, so daß auch die Kompression wieder abnimmt. Dies ist
durch die Abstandsvergrößerungen der Kurven 38, 39 und 40 bei höher werdenden
Frequenzen in F i g. 7 veranschaulicht.
-
Bei einer Reihe von phonetischen Lauten sind Geschwindigkeiten der
Änderung der Amplituden charakteristisch. Es müssen daher in einer Einrichtung,
die von beispielsweise dem gesprochenen Wort gesteuert wird, Vorkehrungen getroffen
werden, um ein Signal zu gewinnen, welches ein Maß für die Geschwindigkeit der Amplitudenänderung
ist. Die Bestimmung der Geschwindigkeitsänderung eines Signals wird durch den beschriebenen
Kompressor erleichtert. Zur Erläuterung sei nochmals auf F i g. 1 Bezug genommen.
Wenn in der Leitung 5 eine sehr schnelle Amplitudenänderung auftaucht, wird diese
Änderung zunächst verstärkt und gelangt dann zu dem Ausgang des Verstärkers 9. Erst
wenn das Signal am Ausgang dieses Verstärkers erschienen ist, gelangt es in den
Nebenkanal 10 und wird hier auf die angegebene Weise modifiziert. - Der Verstärkungsfaktor
des Verstärkers 9 wird nun erst dann durch das Signal des Nebenkanals vermindert,
wenn an dem Ausgang des Verstärkers 9 das Signal bereits erschienen ist. Es entsteht
somit ein Signal V2, wie dies in F i g. 8 in Abhängigkeit von der Zeit aufgetragen
ist.' Das Ausgangssignal steigt zunächst auf einen Spitzewert 41 an, um anschließend
wieder auf die normale Spannung 42
abzusinken, die dem stationären Kompressionsgrad
bzw. Verstärkungsfaktor beidergegebenen Spannung V1 entspricht. Die Spannungsdifferenz
zwischen den Niveaus 41 und 42, die in F i g. 8 mit D bezeichnet ist,
ist nun eine Funktion der Geschwindigkeit der Amplitudenänderung. Weiter unten soll
erläutert werden, wie dieses »Überschwingen« zur Auswertung von phonetischen Elementen
verwendet werden kann.
-
Bei einem Kompressor gemäß F i g. 2 wird das Signal vor dem hier mit
29 bezeichneten Verstärker abgenommen, wobei vor dem Eingang des Verstärkers noch
ein Verzögerungsglied 34 eingeschaltet ist. Je nach der Einstellung des Verzögerungsgliedes
34 gelangt das in dem Nebenkanal 30 modifizierte Steuersignal vor, gleichzeitig
oder nach dem zu steuernden Signal zu dem Regelverstärker 29, so daß der stationäre
Zustand schnell oder langsam erreicht wird. Ist das Verzögerungsglied 34 auf eine
starke Verzögerung eingestellt, entsteht daher beispielsweise der Verlauf, wie er
durch die Kurven 43 und 44 angezeigt ist. Der genaue Verlauf kann
somit beispielsweise durch die Zeitkonstante des Verzögerungsgliedes 34 genau eingestellt
werden.
-
Wie nachfolgend noch erläutert werden wird, können beide Typen von
Kompressoren, d. h. der vorwärts gesteuerte und der rückwärts gesteuerte Kompressor,
zur Analyse von Wellenzügen beispielsweise der menschlichen Sprache verwendet werden.
-
In F i g. 9 ist das Linienschaltbild eines Kompressors der in F i
g. 1 beschriebenen Art dargestellt. Der Vorverstärker 58, der dem Vorverstärker
2 (F i g.1) entspricht, enthält eine Verstärkerröhre 60, an deren Gitter 60a über
ein erstes Eingangsklemmenpaar 61 ein Mikrophon 61 a angeschlossen werden
kann. Die Anode 60b der Röhre 60 ist an einem Hochpaßfilter 62 angeschlossen, das
dem Hochpaßfilter 8 bei F i g. 1 entspricht. Das Hochpaßfilter 62 besteht in üblicherweise
aus Serienkondensatoren 62a und parallelliegenden Induktivitäten 62b, die dem gewünschten
Durchlaßbereich entsprechend dimensioniert sind. Der Eingang des Hochpaßfilters
62 kann über einen Schalter 63 mit einem zweiten Eingangsklemmenpaar 64 verbunden
werden, an welches beispielsweise ein Tonbandgerät od. dgl. angeschlossen sein kann.
Zur Korrektur der Frequenzabhängigkeit z. B. des Ausganges eines Tonbandgerätes
sind Korrekturglieder 64a vorgesehen. Der Ausgang des Hochpaßfilters 62 ist mit
der ersten Verstärkerstufe 63 des Regelverstärkers verbunden. Diese Verstärkerstufe
irbeitet
als Vorverstärker und ist nicht geregelt. Sie Dnthält eine Röhre 65, deren Gitter
65a mit dem Abgriff eines Potentiometers 66 verbunden ist. Dieses Potentiometer
66 liegt zwischen dem Ausgang des Hochpaßfilters 62 und Masse. Mit dem Potentiometer
kann die Amplitude des zu dem Regelverstärker gelangenden Signals eingestellt werden.
Die Anode 65b der Röhre 65 ist über die Primärwicklung eines Transformators
66 mit dem positiven Pol einer Speisegleichspannungsquelle verbunden, deren negativer
Pol an Masse liegt (nicht gezeigt). Parallel zu der Primärwicklung des Transformators
66 liegt ein Kondensator 67, der gemeinsam mit dieser Wicklung einen Tiefpaß bildet,
um sehr hohe Frequenzen, z. B. über 8000 Hz, herauszusieben. Bei der Sprachanalyse
werden Frequenzen über diesen Wert meistens nicht benötigt.
-
Die Sekundärwicklung des Transformators 66 ist mit dem Eingang
einer allgemein mit 69 bezeichneten ersten gesteuerten Gegentaktverstärkerstufe
verbunden. In dieser Gegentaktverstärkerstufe 69 sind zwei Regelröhren 70 und 71
vorgesehen, deren Kathoden durch ein Potentiometer 72a miteinander verbunden sind,
wobei der Abgriff dieses Potentiometers mit Masse verbunden ist. Mit diesem Potentiometer
72a kann somit die Symmetrie der Gegentaktverstärkerstufe 69
eingestellt werden.
Die Endpunkte der Sekundärwicklung des Transformators 66 sind mit den Steuergittern
70a bzw. 71a der Röhren 70 und 71 verbunden. Zur Erzeugung einer Gleichstromvorspannung
für diese Gitter sind diese über Widerstände 72 und 73 mit einer Leitung 74 verbunden,
die weiterhin an den Abgriff eines Potentiometers 84 angeschlossen ist. Das
Steuersignal zur Steuerung des Verstärkungsgrades wird den Regelgittern 70b bzw.
71b der Röhren 70 und 71 über Widerstände 74a und 75 zugeführt, die mit der Leitung
76 verbunden sind. Die Regelspannung wird in dem Nebenkanal erzeugt, wie dies weiter
unten noch beschrieben werden soll.
-
An die Anoden der Röhren 70 und 71, die über je einen Widerstand
70c und 71e mit dem positiven Pol der Speisespannungsquelle verbunden
sind, ist weiterhin je ein Trennkondensator 77 bzw. 78 angeschlossen, über welche
das verstärkte Gegentaktsignal zu den Steuergittern der beiden Röhren 80 und 81
der nächstfolgenden Verstärkerstufe 79 gelangt, die ebenfalls im Gegentakt arbeitet.
Die Gegentaktverstärkerstufe 79 ist gleich aufgebaut wie die erste Gegentaktverstärkerstufe
69, weswegen sich eine erneute Beschreibung erübrigt. Es sei lediglich erwähnt,
daß die zweite Gegentaktverstärkerstufe 79 auch in gleicher Weise geregelt wird
wie die erste Gegentaktverstärkerstufe 69. Die Steuergitter 80 und
81 a der Röhren 80 und 81 der Verstärkerstufe 79 sind somit über Widerstände
82 und 83 ebenfalls an die Leitung 74 angeschlossen, die auch die einstellbare Vorspannung
für die Röhren 70 und 71 der ersten Gegentaktverstärkerstufe 69 überträgt.
In gleicher Weise sind auch die zur Einstellung des Verstärkungsgrades vorgesehenen
Regelgitter der Röhren 80 und 81 über je einen Widerstand 88a und
88b mit der Leitung 76 verbunden, die mit dem Signal aus dem noch zu beschreibenden
Nebenkanal gespeist wird.
-
Wie erwähnt, ist die Leitung 74 mit dem Abgriff eines Potentiometers
84 verbunden, dessen eines Ende an Masse und dessen anderes Ende über einen
Widerstand 85 an dem negativen Pol einer Spannungsquelle angeschlossen ist,
deren positiver Pol an Masse liegt. Mit dem Potentiometer 84 kann somit die
negative Vorspannung der Steuergitter der Röhren 70 und 71 der Gegentaktverstärkerstufe
69 und der Röhren 80
und 81 der Gegentaktverstärkerstufe 79 eingestellt
werden.
-
An den Anoden der Röhren 80 und 81 wird nun über je
einen Kondensator 86 und 87 das Eingangsgegentaktsignal für den Nebenkanal abgenommen.
Weiterhin ist an die Kondensatoren 86 und 87 eine weitere Gegentaktverstärkerstufe
89 angeschlossen und an diese eine Leistungsausgangsstufe 90. Die beiden
Gegentaktverstärkerstufen 89 und 90 sind in üblicher Weise aufgebaut,
so daß sich eine detaillierte Beschreibung erübrigt. Mit den Anoden der beiden in
Gegentakt geschalteten Röhrender Leistungsausgangsstufe 90 ist die Primärwicklung
eines Ausgangsübertragers 91 verbunden, an deren Sekundärseite das komprimierte
Signal erscheint.
-
Das an den Anoden der Röhren 80 und 81 erscheinende
Gegentaktsignal wird durch die Leitungen 92 und 93 auf einen einstufigen
Gegentaktverstärker 94
übertragen. Dieser Gegentaktverstärker entspricht dem
Verstärker 10a der F i g. 1. Die Anoden der beiden im Gegentakt geschalteten Röhren
des Verstärkers 94
sind mit dem Bandpaßfilter 95 verbunden, das dem Bandpaßfilter
11 der F i g. 1 entspricht und das, wie allgemein üblich, aus Induktivitäten
und Kapazitäten aufgebaut ist. Wie an Hand der F i g. 1 und 3 erläutert worden ist,
beginnt der Durchlaßbereich des Bandpaßfilters 95 über dem Beginn des Durchlaßbereiches
des Hochpaßfilters 62. Der Ausgang des Bandpaßfilters 95 ist mit den Gleichrichtern
96a und 96b verbunden, die das Ausgangssignal des Bandpaßfilters 95
gleichrichten.
-
Die beiden Gleichrichter 96a und 96b entsprechen somit der Gleichrichterstufe
12 bei dem Kompressor der F i g. 1. An die Gleichrichter 96a und 96b, die
ein negatives Signal erzeugen, ist ein Tiefpaßfilter 97 angeschlossen, das dem Tiefpaßfilter
14 (F i g. 1) entspricht und aus dem Serienwiderstand 97b und dem parallel
angeschlossenen Kondensator 97a besteht. An den Ausgang des Tiefpaßfilters 97 schließt
sich ein Integrierglied 98 an, welches aus dem Widerstand 98a und beispielsweise
drei Kondensatoren 98b, 98c und 98d besteht, von denen wahlweise je einer durch
einen Schalter 98e parallel zu dem Widerstand 98a geschaltet werden kann.
-
Durch die Wahl des Kondensators 98b, 98e, 98d kann die Regelzeit eingestellt
werden. Ein Kondensator mit großer Kapazität begünstigt das Überschwingen, da das
Regelsignal zu spät bei den Regelverstärkerstufen 69, 79 eintrifft, wogegen eine
kleine Kapazität das Überschwingen herabsetzt, da das Regelsignal früher eintrifft.
Das Integrierglied 98 ist mit der Leitung 76 verbunden und gibt somit die
Spannung ab, die den Verstärkungsgrad der beiden Gegentaktverstärkerstufen 69 und
79 regelt. Durch ein Potentiometer 99, das parallel zu dem Potentiometer
84 liegt, kann im übrigen eine konstante Vorspannung auf die Regelgitter
der Röhren 70 und 71 sowie 80 und 81 übertragen werden. Die einstellbare feste Vorspannung
gelangt über den Widerstand 98a zu der Leitung 74.
-
Die Wirkungsweise des gezeigten Kompressors ist ohne weiteres zu ersehen.
Wenn ein Signal mit hoher Amplitude und einer Frequenz, die im Durchlaßbereich des
Filters 95 liegt, zu dem die Stufen 69 und 79 aufweisenden Regelverstärker gelangt,
erscheint
auch am Ausgang des Hochpaßfilters 95 ein hohes Signal.
Dieses Signal wird durch die Gleichrichter 96a und 96b derart gleichgerichtet,
daß ein der Amplitude proportionales Gleichspannungssignal entsteht. Die Spannung
ist dabei durch entsprechende Polung der Gleichrichter 96a, 96b negativ gegenüber
Masse. Dieses Signal gelangt nun zu den Regelgittern der Röhren 70, 71 und 80, 81
und setzt den Verstärkungsgrad entsprechend herab. Die in F i g. 10 gezeigte Schaltung
arbeitet daher so, wie dies an Hand der F i g.1 bis 3 erläutert worden ist. An Hand
der F i g. 1 bis 9 wurden Amplitudenkompressoren gezeigt, bei denen das steuernde
Signal eine andere Frequenzabhängigkeit besitzt als das gesteuerte Signal. Es sei
erwähnt, daß es in gleicher Weise möglich ist, die Amplitude frequenzabhängig zu
expandieren. Es ist hierbei lediglich beispielsweise bei dem Ausführungsbeispiel
der F i g. 9 erforderlich, in die Leitung 76 eine Umkehrstufe einzuschalten. Die
Kompression wird dann vermindert bzw. die Verstärkung erhöht, wenn ein Signal des
Durchlaßbereiches des Filters 95 zu dem Nebenkanal gelangt. Schließlich sei noch
erwähnt, daß der Durchlaßbereich des Bandpaßfilters in dem Nebenkanal so vorgesehen
sein kann, daß höhere Frequenzen unterdrückt werden, während der Beginn des Durchlaßbereiches
beider Filter annähernd gleich ist. Bei dieser Variante werden die niedrigen Frequenzen
gegenüber den höheren Frequenzen angehoben.
-
F i g.10 zeigt als Blockschaltbild eine Einrichtung, die zur Analyse
der menschlichen Sprache geeignet ist und sechs Kompressoren der in F i g. 1, 2
und 9 gezeigten Art enthält. Mehr im einzelnen handelt es sich um eine Einrichtung,
die aus den z. B. durch ein Mikrophon gewonnenen elektrischen Wellen Signale isoliert,
die für die verschiedenen Laute bzw. Sprachelemente charakteristisch sind. Die gezeigte
Einrichtung kann beispielsweise zur Betätigung einer Schreibmaschine verwendet werden,
wobei in der Schreibmaschine die dem gesprochenen Laut entsprechende Taste ausgelöst
wird. In gleicher Weise, wie das an Hand von F i g. 1 und 2 erläutert worden ist,
ist ein Mikrophon 101 über einen Kondensator 102 mit einem Vorverstärker
103 verbunden. Der Ausgang des Vorverstärkers 103 ist über eine Verbindungsleitung
104 mit drei Kompressoren 105, 106 und 107 verbunden. Die drei
Kompressoranordnungen unterscheiden sich in erster Linie durch die Regelzeit, wobei
die Kompressoranordnung 105 langsam anspricht, die Kompressoranordnung 106
mittelschnell und die Kompressoranordnung 107 sehr schnell. Die Ansprechzeiten liegen
beispielsweise bei 10, 3 und 1 msec. Jede Kompressoranordnung 105, 106 und
107 besteht aus zwei in Serie geschalteten Kompressoren der an Hand von F
i g.1, 2 und 3 beschriebenen Art. Die Verwendung von zwei in Serie liegenden Kompressoren
kann erforderlich sein, wenn ein einzelner Kompressor nicht in der Lage ist, ohne
Verzerrung eine Kompression in dem gewünschten Ausmaß herbeizuführen.
-
Der mit 105a bezeichnete erste Kompressor der Kompressoranordnung
105 enthält einen Hochpaßfilter 109, eine Verzögerungsleitung 110
und einen Regelverstärker 111. Das Steuersignal für den Regelverstärker wird in
dem Nebenkanal geformt, welches einen Verstärker 108, einen Bandpaßfilter
112, einen Gleichrichter 113 und einen Tiefpaßfilter 114 enthält.
Der bis jetzt beschriebene Kompressor ist vorwärts geregelt, da das Eingangssignal
für den Verstärker 111
dem Ausgang des ersten Hochpaßfilters 109 entnommen
wird.
-
Damit der Kompressor gegebenenfalls auch rückwärts gesteuert werden
kann, sind die Schalter 115 und 116 vorgesehen, mit denen der Eingang de. Filters
112 mit dem Ausgang eines weiteren Verstärkers 117a verbunden werden kann,
wobei der Eingang des Verstärkers 117a über den Schalter 115 mit dem Ausgang des
Regelverstärkers 111 verbunden werden kann. Weiterhin sind zwei Schalter
117 und 118 vorgesehen, die es gestatten, die Verzögerungsleitung
110 mittels einer Leitung 119 zu überbrücken.
-
Der sich anschließende weitere Kompressor 105b
ist im wesentlichen
gleich aufgebaut wie der erstbeschriebene Kompressor, wobei jedoch die alternativ
vorgesehene Umschaltmöglichkeit für eine Rückwärtssteuerung nicht eingezeichnet
ist. Eine erneute Beschreibung dieses zweiten Kompressors 105b der Kompressorstufe
105 erübrigt sich. Die weiteren Kompressoranordnungen 106, 107 bestehen
ebenfalls aus je zwei in Serie liegenden einzelnen Kompressoren 106a, 106b bzw.
107a, 107b, die im wesentlichen gleich aufgebaut sind wie die erstbeschriebenen
Kompressoren.
-
Zur weiteren Erläuterung der gezeigten Einrichtung soll zunächst der
Teil der Schaltung betrachtet werden, der an den zweiten Kompressor 106b
der Kompressoranordnung 106 angeschlossen ist. An den Ausgang des Regelverstärkers
120 des Kompressors 106b sind eine Reihe von Formantfiltern parallel
zueinander angeschlossen, wie dies durch den Block 121 und den Block 122
angedeutet ist. Insgesamt sind beispielsweise zwanzig einzelne Formantfilter bzw.
Bandpaßfilter vorgesehen, die gemeinsam den Frequenzbereich von beispielsweise 80
bis 6000 Hz überdecken. In den Block 121 und in den Block 122 sind
die in der Mitte der jeweiligen Durchlaßbereiche liegenden Frequenzen der einzelnen
Filter zahlenmäßig angegeben. Die beschriebenen Formantfilter entsprechen den Formantfiltern
16a, 16b, 17a, 17b in den F i g. 1 und 2. An den Ausgang jedes Formantfilters ist
nun ein Gleichrichter 123 und ein Tiefpaßfilter 124 angeschlossen.
An dem Ausgang des Tiefpaßfilters 124
erscheint nur ein Signal, wenn in dem
Wellenzug, der durch den Verstärker 120 übertragen wird, eine Frequenzkomponente
entsprechend dem Durchlaßbereich des zugeordneten Formantfilters enthalten ist.
Zur Vereinfachung sind die Elemente, die sich vorzugsweise an jeden der zwanzig
Formantfilter anschließen, nur einmal gezeigt. An jedem Formantfilter ist somit
ein Gleichrichter 123 angeschlossen. An jeden Gleichrichter 123 schließt
sich ein Tiefpaßfilter 124 an, dessen Durchlaßbereich beispielsweise bei
76 Hz endet.
-
Der Ausgang dieses Tiefpaßfilters 124 ist nun über eine Leitung
125 und gegebenenfalls über einen weiteren Tiefpaßfilter 126 an einen Analog-Digital-Wandler
128 angeschlossen, in welchem die als Analogiesignale eintreffenden Informationen
in digitale Informationen umgewandelt werden. Vorzugsweise werden die eingehenden
Analogsignale einer von drei Stärkebereichen zugeordnet. Ein starkes Signal kann
dem Stärkebereich 2 zugeordnet werden, ein mittelstarkes Signal dem Stärkebereich
1, während das Fehlen eines analogen Signals über einem gegebenen Minimalpegel dem
Stärkegrad 0 entspricht. Die in die digitale Form umgewandelten Informationen gelangen
nun über eine Leitung 129 zu dem logischen System 127;
in
welchem aus den eintreffenden Informationen die phonetischen Schriftsymbole ermittelt
werden, die dem gesprochenen Laut entsprechen.
-
Durch die Filter 121 und 122 werden, wie ausgeführt, die Formanten
ermittelt, die für den quasistationären Teil eines bestimmten Sprachlautes charakteristisch
sind. DerbeispielsweisefürdenLaut Ncharakteristische zweite Formant Il. (F i g.
4) wird von dem der Frequenz zugeordneten Formantfilter 2600 Hz durchgelassen, so
daß auf der entsprechenden Leitung 129 ein digitales Signal zu dem logischen System
127 gelangt. Das logische System kann somit aus dem Vorhandensein eines Forrnanten
in dem Frequenzbereich 2600 Hz - gegebenenfalls in Kombination mit weiteren für
das N charakteristischen Kriterien -auf das Vorhandensein dieses Lautes schließen
und eine entsprechende Information weitergeben. Es ist somit zu ersehen, daß eine
Charakterisierung beispielsweise des Lautes N praktisch nur dann an Hand des zweiten
Formanten durchgeführt werden kann, wenn gesteuerte Kompressoren der eingangs beschriebenen
Art verwendet werden.
-
An den Ausgang der Tiefpaßfilter 124 ist weiterhin eine allgemein
mit 130 bezeichnete Einheit zur Bildung der »Subformanten« angeschlossen. Unter
»Subformanten« soll nachfolgend die Änderungsgeschwindigkeit der Amplitude eines
bereits gleichgerichteten, in der Regel für einen Formanten charakteristischen Signals
verstanden werden. Die Anstiegsgeschwindigkeit der Amplitude ist bei einer Reihe
von Lauten charakteristisch für diese. Beispielsweise ist für das T ein sehr steiler
Amplitudenanstieg charakteristisch. Bezüglich der Bedeutung; der Subformanten für
die Analyse sei beispielsweise auf die USA: Patentschrift X 2 540 660 vom 6. Februar
1951 verwiesen sowie auf die Schweizer Veröffentlichung »Phonetographe et Subformants«,
»Bulletin Technique PTT«, Februar 1957, von 1. A. D r e y f u s.
-
Die Subformanteinheit 130 umfaßt nun zwei Difl'erenzierglieder
131 und 132, die an den Ausgang des Tiefpaßfilters 124 angeschlossen sind.
Durch die Differentation wird nun aus dem Ausgangssignal des Tiefpaßfilters
124 direkt ein Signal gewonnen, welches ein Maß für die Änderungsgeschwindigkeit
der Amplitude der Schwingung der Frequenz des zugeordneten Formantfilters
121, 122 ist. In jedem der beiden Differenzierglieder 131 und
132 ist nun ein Gleichrichter vorgesehen, welcher bewirkt, daß nur die Änderungsgeschwindigkeit
der Amplitude in positiver Richtung oder in negativer Richtung als Ausgangssignal
weitergegeben wird. Die Gleichrichter sind nun so gepolt, daß beispielsweise das
Differenzierglied 131 eia, Signal abgibt, wenn die Amplitude eines eintreffenden
Wellenzuges ansteigt, während das Differenxierglied 132 ein Signal abgibt, wenn
die Amplitude eines Wellenzuges abfällt. Für die Sprachanalyse sind vorwiegend Anstiegsgeschwindigkeiten
bedeutungsvoll, die in einem bestimmten Bereich liegen. Um Signale, die in einem
nicht charakteristischen Bereich liegen und um weiterhin zufällige Störungen usw.
auszuschalten, sind an das Differenzierglied 131 zwei Bandpaßfilter angeschlossen,
die durch den Block 133 veranschaulicht sind. Diese Filter sollen nachfolgend als
Subformantfilter bezeichnet werden. Die beiden parallel an das Differenzierglied
131 angeschlossenen. Subformantfilter haben beispielsweise einen Durchlaßbereich
von 16 bis 46 Hz und von 46 bis 76 Hz. Wenn nun ein Amplitudenanstieg erscheint,
steigt auch die Spannung am Ausgang des Differenziergliedes 131 an. Dieses Signal
regt nun einen oder beide Subformantfilter 133 an. Ein langsamer Anstieg regt in
erster Linie das auf die niedrigeren Frequenzen (16 bis 46 Hz) abgestimmte Subformantfilter
an. Bei einem schnellen Anstieg werden beide Filter zur Schwingung angeregt. Es
sei an dieser Stelle erwähnt, daß die Amplitude dieser Schwingungen durch die Regelzeit
der Kompressoren beeinflußt werden kann. Es ist ohne weiteres einzusehen, daß ein
Überschwingen, wie es etwa bei 41 in F i g. 8 veranschaulicht ist, die Entstehung
von Schwingungen in den beiden Bandpaßsubformantfiltern 133 begünstigt. An jedem
der beiden Subformantfilter 133 ist ein Gleichrichter 134 zur Gleichrichtung der
erzeugten Schwingung angeschlossen. Das gleichgerichtete Signal gelangt nun jeweils
zu einem Tiefpaßfilter 135, welches die verbliebene Wechselstromkomponente der Schwingung
aussiebt. Das Signal, welches den Tiefpaßfilter 135 verläßt, ist nun ein Maß für
die charakteristische Anstiegsgeschwindigkeit der Amplitude der Frequenakomponente
des zugeordneten Formantfilters 121, 122. Dieses Analogiesignal wird nun in einem
Analog-Digital-Wandler 136 in ein Digitalsignal umgewandelt und gelangt über
eine Leitung 137 zu dem logischen System 127.
-
Den Teilen 133,134,135,136 und 137 entsprechende Elemente 133', 134',
135', 136' und 137' sind auch an das Diffferenzierglied 132 angeschlossen. Das Digitalsignal,
welches den Wandler 136' verläßt, ist somit eine Anzeige für die Abfallgeschwindigkeit
der Amplitude der Schwingung des zugeordneten Formantfiiters 121, 122. Es
sei an dieser Stelle erwähnt, daß für die Analyse der meisten Sprachen die Abfallgeschwindigkeit
der Laute nicht als besonders charakteristisch angesehen werden kann. Es dürfte
daher für die meisten Zwecke hinreichend sein, wenn nur ein einziger Bandpaßsubformantfilter
133' vorgesehen ist, dessen Durchlaßbereich sich dann von beispielsweise
16 bis 76 Hz erstreckt. Gegebenenfalls kann auf eine Auswertung der Abfallgeschwindigkeit
der Amplituden überhaupt verzichtet werden; in diesem Fall sind dann die Elemente
133'; 133', 134', 135', 136' und 137' nicht erforderlich.
-
Der Aufbau und die Funktionsweise der. Anordnung zur Gewinnung der
Formanten und Subformanten soll an Hand der F i g. 11 und 12 nochmals erläutert
werden, wobei F i g. 11 die Formantfilter und die an diese angeschlossenen Schaltelemente
zur Gewinnung der Formanteh und Subformanten zeigt und F i g. 12 graphische Darstellungen
zur Erläuterung der Funktionsweise der verschiedenen Elemente.
-
Zur Erläuterung dieser Elemente sollen die gleichen Bezugszeichen
verwendet werden wie in F i g. 10.
-
In F i g. 11 ist mit 106 wiederum die aus zwei Einzelkompressoren
106a und 106b bestehende Kompressoranordnung bezeichnet. Die Kompressoren wurden
bereits erläutert, weswegen sich eine erneute Beschreibung erübrigt. An den Kompressor
106b
schließen sich nun beispielsweise 25 Filter 121, 122 an. An jedem dieser
Filter ist ein Zwischenverstärker 142 angeschlossen, von denen zwei gezeigt
sind. Die sich an den Zwischenverstärker anschließenden Schaltelemente dienen zur
Ermittlung der Formanten, aus denen dann auch die Subformanten ermittelt werden
können. An den Zwischenverstärker 142 ist der Gleichrichter 123 angeschlossen und
an diesen der Tiefpaßfilter 124, dessen Durchlaßbereich zwischen
0
und 76 Hz liegt. An den Tiefpaßfilter schließt sich ein weiterer Zwischenverstärker
143 an. Der Ausgang des Verstärkers 143 ist über die Leitung 125 mit
dem Tiefpaßfilter 126 verbunden, dessen Durchlaßbereich von 0 bis 30 Hz reicht.
Am Ausgang des Tiefpaßfilters 126 erscheint nun ein Analogiesignal, dessen
Höhe die Stärke der Formanten eines bestimmten Sprachelementes bzw. die Stärke der
Komponenten anzeigt, die beispielsweise zwischen 5200 und 6800 Hz liegt.
-
Das logische System 127 (F i g. 10) soll die Signale, die einem gesprochenen
Laut entsprechen, gleichzeitig übermittelt erhalten. Da die Bildung eines den Subformanten
entsprechenden Signals mehr Zeit in Anspruch nimmt als die Ermittlung der den Formanten
entsprechenden Signale, ist ein Verzögerungsglied 144 (F i g. 11) vorgesehen, welches
die Übermittlung des Analogiesignals von dem Tiefpaßfilter 126 zu dem Analog-Digital-Wandler
128 verzögert. Das Signal, das beispielsweise am Ausgang des Formantfilters
für den Durchlaßbereich von 5200 bis 6800 Hz erscheint, wenn in das Mikrophon ein
Laut gesprochen wird, der eine Komponente in dem betreffenden Bereich aufweist,
ist beispielsweise in F i g. 12 bei A gezeigt. Dieses Signal bzw. diese Schwingung
wird nun in dem Gleichrichter 123 gleichgerichtet, so daß beispielsweise die untere
Halbwelle entfällt, wie dies in F i g. 12 bei B veranschaulicht ist, die das Signal
am Ende des Tiefpaßfilters 126 zeigt. In dem Verzögerungsglied 144 wird nun das
Signal um die Zeit t7, verzögert, wie dies in F i g. 12 bei C gezeigt ist. Das gewonnene
Analogiesignal wird nun in dem Wandler 128 in eine digitale Information umgesetzt.
Das den Wandler 128 verlassende Digitalsignal ist nun eine Anzeige dafür, ob der
gesprochene Laut eine starke, mittlere oder keine bzw. eine vernachlässigbare Komponente
in dem Frequenzbereich des zugehörigen Formantfilters 121, 122 aufweist.
Die Unterteilung des Analogiesignals in drei Stärkebereiche kann in manchen Fällen
auch durch eine Unterteilung in zwei Stärkebereiche ersetzt werden.
-
Mit dem Ausgang des Zwischenverstärkers 143 ist weiterhin die
Subformanteinheit 130 verbunden. Unmittelbar an den Ausgang des Zwischenverstärkers
143 schließen sich die Differenzierglieder 131 und 132 an. An das Diferenzierglied
131 schließen sich die beiden Subformantbandpaßfilter 133a und 133b an, wobei der
Durchlaßbereich des Bandpaßfilters 133a zwischen 16 und 46 Hz und derjenigen des
Ba4paßfilters 133b zwischen 46 und 76 Hz liegt. An die beiden Subformantbandpaßfilter
133a und 133b schließt sich je ein Zwischenverstärker 146a und 146b
an und an diese je ein Gleichrichter 134a und 134b. Der Ausgang dieser Gleichrichter
ist mit je einem Tiefpaßfilter 135a und 135b verbunden. Die die beiden Tiefpaßfilter
verlassenden Signale gelangen nun zu je einem Analog-Digital-Umwandler 136a und
136b.
-
An das Differenzierglied 132, welches zur Ermittlung der Steilheit
der abfallenden Flanke dient, ist ein Bandfilter 133' angeschlossen, welches einen
Durchlaßbereich von 16 bis 76 Hz aufweist. Statt dieses einen Bandfilters 133' können
auch zwei parallelliegende Bandfilter vorgesehen sein, die je ein Durchlaßbereich
von 16 bis 46 Hz aufweisen, wie dies an Hand von F i g. 10 angegeben worden ist.
An den Bandfilter 133' ist nun ein Zwischenverstärker 146' angeschlossen und an
diesen der Gleichrichter 134'. Zur Glättung ist wiederum ein Tiefpaßfilter 135'
angeschlossen. Das den Tiefpaßfilter verlassende Signal wird in einem Analog-Digital-Wandler
136' in ein Digitalsignal mit beispielsweise den Stärkegraden 0, 1 und 2 oder den
Stärkegraden 0 und 1 umgewandelt.
-
Die Spannung, die an dem Ausgang des Zwischenverstärkers 143 erscheint,
ist in F i g. 12 bei dgraphisch dargestellt. Dieses Signal wird nun in den Differenziergliedern
131 und 132 differenziert. Das Signal, welches am Ausgang des Differenziergliedes
131 erscheint, ist in F i g. 12 bei e graphisch dargestellt und dasjenige, welches
das Differenzierglied 132 verläßt, bei f. Das in F i g. 12 bei e dargestellte Signal
regt nun die Bandfilter 133a und 133b zum Schwingen an, wie dies in F i g. 12 bei
g und h dargestellt ist. Diese Schwingungen werden nun in dem Gleichrichter 134a
und 134b gleichgerichtet, so daß jeweils ein positives Signal entsteht, wie es in
F i g. 12 bei i und k gezeigt ist. Die Höhe der Signale bei
i bzw. k ist nun ein Maß für die Anstiegssteilheit der Schwingung
in dem Frequenzbereich des zugeordneten Formantfilters 121, 122. Diese Analogiesignale
werden nun durch die auch in F i g. 12 eingezeichneten Analog-Digital-Wandler 136a
und 136b in Analogiesignale entsprechend beispielsweise drei oder zwei Stärkegraden
umgewandelt.
-
In gleicher Weise regt das in F i g. 12 bei f gezeigte Signal das
Bandfilter 133' zum Schwingen an, so daß der bei e gezeigte Spannungsverlauf entsteht.
Das Signal, welches nach der Gleichrichtung entsteht, ist bei m gezeigt; die Höhe
dieses Signals ist nun ein Maß für die Abfallgeschwindigkeit der Spannung am Ende
eines Wellenzuges. Dieses Analogiesignal wird nun in dem Wandler 136' in ein Digitalsignal
umgewandelt. Die einzelnen Darstellungen der F i g. 12 sind so angeordnet, daß gleichzeitig
auftretende Signale in je einer gemeinsamen vertikalen Linie liegen. Es ist somit
ohne weiteres zu ersehen, daß die Signale der Darstellungen c, i, k und
m praktisch gleichzeitig zu den Analog-Digital-Wandlern 128, 136a,
136b bzw. 136' gelangen, so daß das angeschlossene logische System zu einem bestimmten
Zeitpunkt gleichzeitig alle Informationen übermittelt erhält, die erforderlich sind,
um eine bestimmte Type beispielsweise einer Schreibmaschine in Abhängigkeit von
einem bestimmten gesprochenen Laut auszulösen.
-
F i g. 13 zeigt das Linienbild einer etwas abgewandelten Variante
einer Formant- und einer Subformanteinheit, d. h. die Schaltung, die sich jeweils
an einen der Formantfilter 121, 122 anschließt. Das zugehörige Formantfilter ist
in F i g. 14 mit 150 bezeichnet. An dieses Filter 150 schließt sich ein Zwischenverstärker
151 an, an dessen Ausgang die Primärwicklung 152 eines Transformators 153 angeschlossen
ist. Dieser Transformator besitzt eine erste Sekundärwicklung 154, die zur
Gewinnung der Formanten dient, und eine zweite Sekundärwicklung 155, die zur Gewinnung
der Subformanten dient. An die Sekundärwicklung 154 ist eine Allweggleichrichteranordnung
156 angeschlossen, die das übermittelte Wechselstromsignal gleichrichtet. An den
Gleichrichter 156 schließt sich ein üblich aufgebauter Tiefpaßfilter 157 an, dessen
Funktion der Funktion des Tiefpaßfilters 126 (F i g.11) entspricht und dessen
Durchlaßbereich zwischen 0 und 30 Hz liegt. Der Ausgang des Tiefpaßfilters ist nun
über ein Verzögerungsglied 158k mit dem Analog-Digital-Wandler 159k verbunden.
Das Verzögerungsglied 158 ist im wesentlichen gleich aufgebaut wie der
Tiefpaßfilter
157 und bewirkt, daß das Signal des Formanten gleichzeitig mit dem Signal des Subformanten
zu dem logischen System 127 gelangt, wie dies an Hand der F i g. 12 erläutert worden
ist.
-
An die Sekundärwicklung 155 des Transformators 153 ist ebenfalls
eine Gleichrichterschaltung 160 angeschlossen. Das gleichgerichtete Signal
gelangt nun zu dem Tiefpaßfilter 161, dessen Funktion dem Tiefpaßfilter 124 (F i
g. 11) entspricht und dessen Durchlaßbereich zwischen 0 und 76 Hz liegt. Die Ausgangsspannung
des Tiefpaßfilters wird über einen Zwischenverstärker 162 zwei Differenziergliedern
163 und 164
übermittelt, die den Differenziergliedern 130 und
131
(F i g. 11) entsprechen. Wie dies bereits beschrieben wurde, ist in beiden
Differenziergliedern 163, 164 je ein Gleichrichter vorgesehen, wobei diese
Gleichrichter entgegengesetzt gerichtet sind, so daß beispielsweise das Differenzierglied
163 nur bei positiver Änderung des ankommenden Signals eine Spannung abgibt und
das Differenzierglied 164 nur bei einer Änderung des ankommenden Signals
in negativer Richtung. Das Ausgangssignal des Differenziergliedes 163 wird in dem
Zwischenverstärker 165 verstärkt und gelangt nun zu zwei parallelliegenden Subformantbandpaßfiltern
166 und 167, die ein Durchlaßbereich von 16 bis 46 bzw. 46 bis 76 Hz aufweisen.
Diese beiden Bandpaßfilter entsprechen den Subformantbandpaßfiltern 132a und 132b
des Ausführungsbeispieles der F i g. 11. Die Ausgänge beider Bandpaßfilter sind
mit Verstärkern 168 und 169 verbunden. Der Ausgang beispielsweise
des Zwischenverstärkers 168 ist mit der Primärwicklung eines Transformators
170 verbunden, dessen Sekundärwicklung an eine Allweggleichrichterschaltung 171
angeschlossen ist. Mit dieser Gleichrichterschaltung ist ein Tiefpaßfilter 172 verbunden,
dessen Durchlaßbereich zwischen 0 und 30 Hz liegt und das dem Tiefpaßfilter 134a
(F i g. 11) entspricht. Das Ausgangssignal des Tiefpaßfilters 172 gelangt nun in
einen Analog-Digital-Umwandler 173, der wieder an das logische System angeschlossen
ist. In gleicher Weise wird das Signal behandelt, welches den Verstärker
169 verläßt.
-
Das Differenzierglied 164 für die abfallende Flanke wird in
einem Verstärker 175 verstärkt und gelangt zu einem Subformantbandpaßfilter 176,
dessen Durchlaßbereich zwischen 16 und 76 Hz liegt. Dieses Bandpaßfilter entspricht
dem Filter 133' (F i g. 11). Das Signal gelangt nach Verlassen des Bandfilters 176
nacheinander zu dem Zwischenverstärker 177, dem Transformator 178 der Gleichrichteranordnung
179, dem Tiefpaßfilter 180 und dem Analog-Digital-Wandler 181. Das
an dem Ausgang des Wandlers 181
erscheinende Signal ist eine Anzeige für die
Geschwindigkeit des Abfallens einer Schwingung mit der Frequenz des zugeordneten
Formantfilters 150.
-
Der Unterschied zwischen den Ausführungsbeispielen der F i g. 11 und
13 besteht darin, daß bei F i g. 13 die Formanteinheiten und die Subformanteinheiten
unmittelbar am Ausgang des Verstärkers 171 voneinander getrennt werden. Im Gegensatz
hierzu findet bei dem Ausführungsbeispiel der F i g. 11 eine Trennung erst nach
dem Verstärker 143
statt, so daß der Gleichrichter 123, das Tiefpaßfilter
124 und der Verstärker 143 beiden Einheiten angehört. Beide Schaltungsmöglichkeiten
sind anwendbar, wobei die Schaltung gemäß F i g. 11 den Vorteil aufweist, daß ein
Gleichrichter und ein Verstärker eingespart werden. An Hand der F i g. 10 und 11
wurde bereits darauf hingewiesen, daß an den Ausgang der Kompressoranordnung beispielsweise
zwanzig Formantfilter angeschlossen sind, um die diversen frequenzabhängigen charakteristischen
Elemente für die verschiedenen Sprachlaute auszusieben. Die Auswahl der Durchlaßbereiche
der einzelnen Filter muß dabei entsprechend den Lauten, die unterschieden werden
sollen, getroffen werden. Man kann mehr im einzelnen drei Frequenzgebiete unterscheiden.
Das erste Gebiet umfaßt den Bereich von 400 bis 1200 Hz und dient zur Unterscheidung
der Laute O, R und A. Es enthält vorzugsweise die drei folgenden Filter: F2 mit
einem Durchlaßbereich von 400 bis 600 Hz, F3 mit einem Durchlaßbereich von 600 bis
800 Hz und F4 mit einem Durchlaßbereich von 800 bis 1200 Hz. Das zweite Gebiet enthält
die Frequenzen zwischen 1200 und 2000 Hz und dient zur Unterscheidung der Laute
a, oe und e. Dieses zweite Gebiet ist vorzugsweise in drei Einzelfilter
aufgeteilt, die je einen Frequenzbereich von 400 Hz umfassen, d. h. die Filter F4
mit einem Durchlaßbereich von 800 bis 1200 Hz, F5 mit einem Durchlaßbereich von
1200 bis 1600 Hz und F, mit einem Durchlaßbereich von 1600 bis 2000 Hz. Das dritte
Gebiet umfaßt die Frequenzen von 2000 bis 3200 Hz, wobei der Durchlaßbereich der
diesem Gebiet angehörenden Filter ebenfalls jeweils 400 Hz beträgt. Dieses dritte
Gebiet dient zur Unterscheidung der Laute E, M und N. Es enthält mehr im einzelnen
die folgenden Filter: F, mit einem Durchlaßbereich von 2000 bis 2400 Hz, F8 mit
einem Durchlaßbereich von 2400 bis 2800 Hz und F9 mit einem Durchlaßbereich von
2800 bis 3200 Hz. Selbstverständlich werden vorzugsweise noch eine Reihe von weiteren
Formantfiltern zur Feststellung von feinen Unterschieden zwischen Lauten mit ähnlicher
Charakteristik vorgesehen. Ein Beispiel auch für die Bereiche von weiteren Filtern
ist in F i g. 11 aufgeführt. Es sei an dieser Stelle erwähnt, daß es selbstverständlich
auch möglich ist, Filter vorzusehen, deren Durchlaßbereich sich mit dem Durchlaßbereich
benachbarter Filter überschneidet. Derartige zusätzliche Filter sind in F i g. 11
gestrichelt eingezeichnet. Weiterhin kann zu Vergleichszwecken ein Filter vorgesehen
werden, welches den gesamten Bereich von 400 bis 6800 Hz umfaßt, wie dies ebenfalls
in Fig. 11 eingezeichnet ist.
-
Der bisher beschriebene Teil der F i g. 10 betrifft die Gewinnung
von Signalen, die eine Anzeige für das Vorhandensein von bestimmten harmonischen
Komponenten bzw. Formanten sind, sowie weiterhin die Gewinnung von Signalen, die
eine Anzeige für das Vorhandensein bzw. Nichtvorhandensein von Subformanten sind.
Die Formanten, die durch die Formantfilter 121, 122 ermittelt werden, können als
»quasifix«, d. h. bei einer bestimmten Grundfrequenz als nahezu unveränderlich betrachtet
werden. Daneben sind jedoch noch die veränderlichen Formanten zu berücksichtigen,
die bei der Sprache in einem niedrigeren Frequenzbereich liegen. Weiterhin müssen
die sogenannten »Fluktuationen« bzw. »Modulationen« ermittelt werden, wie dies nachfolgend
beschrieben wird.
An den geregelten Verstärker 185 (F i g. 10)
des zweiten Kompressors 105b der Kompressoranordnung 105 sind nun Formantfilter
186 angeschlossen. An jedes dieser Filter 186 sind wiederum ein Gleichrichter
187 und ein Tiefpaßfilter 188 angeschlossen. An jeden Tiefpaßfilter 188 schließt
sich nun eine Subformanteinheit 184 an, der ein Differenzierglied 189 enthält,
wobei durch einen Gleichrichter, der parallel zu dem Widerstand des Differenziergliedes
liegt, wiederum erreicht wird, daß nur positive Änderungen des Signals einen Ausgangsimpuls
hervorrufen in gleicher Weise, wie dies für das Dif%renzierglied 131 der
Subformanteinheit 130 beschrieben worden ist. An das Differenzierglied 189
sind wiederum zwei Subformantbandpaßfilter 190 angeschlossen, deren Durchlaßbereich
zwischen 16 und 46 Hz sowie zwischen 46 und 76 Hz liegt. An jeden der beiden Filter
190 schließt sich wiederum ein Gleichrichter 191 an und an jeden der Gleichrichter
191 ein Tiefpaßfilter 192, dessen Durchlaßbereich zwischen 0 und 30
Hz liegt. Das Filter 192 ist über einen Analog-Digital-Wandler 193 mit dem
logischen System 127 verbunden. Es ist somit zu ersehen, daß die Elemente 189 bis
1.93 im wesentlichen gleich ausgebildet sind wie die Elemente 131 bis 137.
-
Zur Erläuterung der Funktionsweise der Elemente 186 bis 193 sei erwähnt,
daß die Laute R (gerollt), CH, F und S sich durch eine Fluktuation
auszeichnen. Diese Fluktuation kann als Modulation einer niedrigen Frequenz auf
einen Träger betrachtet werden. Die Forrnantfilter 186 sind nun auf die Trägerfrequenz
abgestimmt, während die Fluktuation bzw. Modulation durch die Elemente
189 bis 193 erfaßt wird.
-
Die graphische Darstellung der Schwingung, die beispielsweise am Ausgang
des Formantfilters 186 erscheint, dessen Durchlaßbereich zwischen beispielsweise
400 und 600 Hz liegt, ist in F i g. 14 mit n bezeichnet. Der Träger dieser Schwingung
wird nun in dem Gleichrichter 187 gleichgerichtet, so daß das Signal die in F i
g. 14 bei o gezeigte Form annimmt. Durch die Differentiation in dem Differenzierglied
189 werden die Ampiitudenänderungen der Fluktuation bzw. Modulation hervorgehoben,
so daß der Kurvenzug etwa das Aussehen erhält, wie es bei p in Fig. 14 gezeigt ist.
Diese einzelnen Impulse regen nun die beiden Bandpaßfilter 190 an. Die Frequenz
der Fluktuation bzw. Modulation kann beispielweise bei dem Laut R derart sein, daß
in erster Linie derjenige Bandfilter 190 zum Schwingen angeregt wird, dessen
Durchlaßbereich zwischen 16 und 46 Hz liegt. Die entstehende Schwingung ist bei
Q) gezeigt. Gleichzeitig wird auch der Bandfilter 190 angeregt, dessen Durchlaßbereich
zwischen 46 und 76 Hz liegt, jedoch ist die angefachte Schwingung wesentlich schwächer,
wie dies bei s gezeigt ist. Die beiden Signale werden nun durch die Gleichrichter
191 gleichgerichtet, so daß sie die Form erhalten, wie dies bei
t und v in F i g. 14 gezeigt ist. Die gezeigten Signale werden nun
durch je einen Analog-Digital-Wandler 193 in digitale Signale umgewandelt. Erscheint
beispielsweise an dem Wandler 193 des Subformantkreises, der an den Formantfrlter
186 mit dem Durchlaßbereich von 400 bis 600 Hz angeschlossen ist, ein Signal
reit dem Wert 2, so kann dies als eine Anzeige für das Vorhandensein des gerollten
R betrachtet werden.
-
An den Tiefpaßfilter 188 ist weiterhin ein Differenzierglied
194 angeschlossen, welches im wesentlichen gleich aufgebaut ist wie das Differenzierglied
189, jedoch nur ein Signal erzeugt, das eine Anzeige für die Abfallgeschwindigkeit
der Fluktuationen ist. Die sich an das Differenzierglied 194 anschließenden
Elemente sind gleich ausgebildet wie die Elemente, die an das Differenzierglied
189 angeschlossen sind, so daß sich eine erneute Beschreibung erübrigt. Es sei jedoch
erwähnt, daß der Informationsgehalt, den die an das Differenzierglied 194 angeschlossenen
Elemente übertragen können, gering ist, da das Vorhandensein und die Frequenz einer
Fluktuation bereits durch die Elemente 190 bis 193 erfaßt werden.
-
Es sei noch darauf hingewiesen, daß die Gewinnung der Fluktuation
bzw. Modulation durch die langsame Regelzeit von z. B. 10 msec der Kompressoren
1054 und 105b der Kompressoranordnung 105 sehr stark begünstigt wird.
Es entsteht somit das an Hand von F i g. 8 erläuterte Überschwingen, welches die
Fluktuation verstärkt. Bei einer Zeitkonstanten der Kompressoranordnung 105 von
10 msec wird z. B, die etwa bei 30 Hz liegende Modulation des gerollten Lautes R
klar erkennbar.
-
Mit dem geregelten Verstärker 185 der Kompressoranordnung
105 ist eine weitere Serie von Formantfiltern 195 verbunden. Diese Serie
von Formantfiltern dient zur Ermittlung der mobilen Formanten bzw. der Formanten
zwischen 76 und 384 Hz, die auch die Bestimmung der Grundfrequenz ermöglichen. Dir
Formanteinheiten, die mit jedem der Filter 195 verbunden sind, sollen an
Hand von F i g. 15 und 1e mehr im einzelnen erläutert werden. In F i g. 1: sind
wiederum gleiche Teile mit den gleichen Bezugszeichen versehen wie in F i g. 16.
An einen Formantbandfilter 195` (F i g. 16) ist ein Verstärker 196 angeschlossen.
Der Ausgang dieses Verstärkers 196 ist mit der Primärwicklung eines Transformators
191 )
verbunden, an dessen Sekundärwicklung eine Vollweg. gleichrichteranordnung
198 angeschlossen ist. Die Gleichrichteranordnung ist weiterhin mit einem Tiefpaßfilter
199 verbunden, dessen Durehlaßbereieh bei. spielsweise zwischen 0 und 15 Hz liegt.
An den Tief. paßfilter ist ein Verzögerungsglied 200 angeschlossen, welches in gleicher
Weise wie das Verzögerungsglied 144 (F i g. 11) die Aufgabe erfüllt, daß die übertragene
Information zu einer vorgegebenen Zeit zu dem logischen System 127 gelangt. Der
Ausgang de; Verzögerungsgliedes 200 ist mit einem ersten Analog. Digital-Wandler
201 und über einen Verstärker 2(l1 mit einem zweiten Analog-Digital-Wandler
203 ver. bunden.
-
Zur Erläuterung der Wirkungsweise beispielsweise der in F i g. 16
gezeigten Formanteinheit ist zunächs darauf hinzuweisen, daß es aus verschiedenen
Gründer erwünscht ist, die Grundfrequenz des Sprechers zu ermitteln. Es hat sich
gezeigt, daß sich die charakte ristische Frequenz der höheren Formanten bzw. quasi
fixen Formanten aller vokalartigen Laute in Ab hängigkeit von der Grundfrequenz
etwas ändert. E@ muß daher die Grundfrequenz ermittelt werden, da mit in Abhängigkeit
von der Grundfrequenz eine der artige Steuerung vorgenommen werden kann, daß eir
bestimmter Laut auch dann eindeutig identifizier werden kann, wenn sich die Frequenz
des quasifixej Formanten zufolge einer Änderung der Grundfrequen: etwas verschoben
hat. Weiterhin kann die Grund Frequenz dazu verwendet werden, die allgemeine Ton
höhe festzustellen. Schließlich deutet ein Abfallei der Grundfrequenz auf das Ende
eines Satzes hii und das Ansteigen auf eine Zäsur in einem Satz, s@
daß
eine Änderung der Grundfrequenz auch zur Ermittlung von Interpunktionszeichen verwendet
werden kann.
-
Die Grundfrequenz ist jedoch häufig derartig stark von Komponenten
höherer Frequenzen überlagert, daß die Ermittlung dieser Grundfrequenz mittels Resonanzkreisen
nicht ohne weiteres möglich ist. Bei den beschriebenen Formanteinheiten (F i g.
16) wird nun die Grundfrequenz dadurch ermittelt, daß man denjenigen Formantkreis
feststellt, an dem bei einer bestimmten Verstärkung kein Signal erscheint, dessen
Pegel über einem vorgegebenen Wert liegt. Es kann ohne weiteres angenommen werden,
daß die Grundfrequenz in den Bereich des Formantfilters fällt, der sich zu höheren
Frequenzen hin an diesen ersten Formantfilter anschließt. Erscheint beispielsweise
an dem Analog-Digital-Wandler 201 der Formanteinheit, dessen Formantfilter einen
Durchlaßbereich von 68 bis 85 Hz aufweist, kein Signal, d. h., gibt die Sekundärseite
des Wandlers 201 die Information 0 ab und gibt der entsprechende Wandler des nächsten
Formantkreises, dessen Filter einen Durchlaßbereich von 85 bis 108 Hz aufweist,
die Information 1 oder 2 ab, kann ohne weiteres angenommen werden, daß bei dem besprochenen
Beispiel die Grundfrequenz in dem Bereich zwischen 85 und 108 Hz liegt.
-
Zur Erläuterung der Aufgabe, die dem Verstärker 202 und dem
Analog-Digital-Wandler 203 zukommt, sei in F i g. 17a bis 17d verwiesen,
welche das Frequenzband von vier gesprochenen Lauten zeigt. In der graphischen Darstellung
der F' i g. 17a ist die Spektralverteilung des gesprochenen Lautes I gezeigt, 'wobei
die Grundfrequenz bei f, = 100 Hz liegt. Es ist der Darstellung zu entnehmen, daß
sich unterhalb der Grundfrequenz von 100 Hz keine Komponenten mehr befinden. Das
gleiche trifft für das bei einer Grundfrequenz von f, = 200 Hz gesprochene I zu,
wie dies in der graphischen Darstellung der F i g. 17b gezeigt ist. Aus dem Vergleich
der graphischen Darstellungen der F i g. 17a und 17b ist zunächst zu ersehen, daß
der charakteristische zweite quasifixe Fomant Il in der graphischen Darstellung
der F i g. 17b bei etwas höheren Frequenzen liegt als in der graphischen Darstellung
der F i g. 17a. Es ist somit zu ersehen, daß sich die charakteristische Frequenz
des zweiten Formanten des I mit der Grundfrequenz etwas erhöht.
-
Die Spektralverteilung des Lautes V bei einer Grundfrequenz von
100 Hz ist in der graphischen Darstellung der F i g. 17c und bei einer Grundfrequenz
von 200 Hz in der Darstellung der F i g. 17d
gezeigt. Es ist zunächst wiederum
die Verschiebung des zweiten Formanten II zu höheren Frequenzen hin bei höher liegender
Grundfrequenz f, erkennbar. Wie oben ausgeführt, ist diese Verschiebung ein Grund
dafür, daß eine Korrektur bei der Auswertung insbesondere der Signale der »quasifixen«
Formantenkreise in Abhängigkeit von der Grundfrequenz anzustreben ist. Weiterhin
ist den graphischen Darstellungen der F i g. 17 c und 17 d zu entnehmen, daß bei
dem gesprochenen V phonetisch eine kleine Komponente unterhalb der Grundfrequenz
liegt. Dieser Bereich unterhalb der Grundfrequenz mit endlicher Amplitude ist in
den Darstellungen der F i g. 17c und 17d schraffiert. Bemerkenswert ist hierbei,
daß die Komponente unterhalb der Grundfrequenz bei dem gesprochenen Laut V sich
jeweils mit dieser verschiebt. Da diese Komponenten unterhalb der Grundfrequenz,
die nachfolgend als »Folgeformanten« bezeichnet werden sollen, zur Unterscheidung
einer Reihe von Lauten herangezogen werden können, ist der Verstärker
202 vorgesehen, der das Ausgangssignal des Verzögerungsgliedes 200 nochmals
verstärkt. Erscheint nun am Ausgang des Analog-Digital-Wandlers 203 der Formanteinheit,
deren Formantfilter auf dem Frequenzbereich abgestimmt ist, der unterhalb des Bereiches
der ermittelten Grundfrequenz liegt, die Information 1 oder 2, so kann dies als
Anzeige für einen Folgeformanten betrachtet werden, was für eine Reihe von Lauten
ein charakteristisches Kennzeichnen ist. Es sei noch erwähnt, daß an die Kompressoranordnung
105 neben den Filtern des Frequenzbereiches von 46 bis 348 Hz, d. h. dem
Bereich der »mobilen Formanten«, auch nochmals ein .Satz Formantfilter des Bereiches
von 400 bis 6000 Hz, d. h. des Bereiches der »quasifixen Formanten«, angeordnet
sein kann. Die den quasifixen Formanten entsprechenden Signale erscheinen dann zweimal,
sind jedoch durch Kompressoren unterschiedlicher Zeitkonstante übertragen worden,
was für die Auswertung bedeutungsvoll sein kann.
-
Die Analog-Digital-Wandler 201 und 203 sind mit einem
logischen System 127' verbunden, welches als ein Teil des Systemes betrachtet werden
kann, welches in F i g. 10 mit 127 bezeichnet ist. Die zu dem System 127'
gelangenden Informationen gestatten zunächst die Unterscheidung der Lautpaare, die
bei 205 eingezeichnet sind, durch die Folgeformanten. Neben der Unterscheidung dieser
Laute kann in dem System 127' eine Information für eine Reihe von Vorgängen gewonnen
werden. Es kann beispielsweise über einen Meßverstärker 206 ein Signal gewonnen
werden, welches die Änderung der Tonhöhe während des Sprechvorganges wiederzugeben
gestattet, wie dies bei 207
angedeutet ist. Weiterhin kann ein Signal gewonnen
werden, welches mit einer Schreibmaschine das Schreiben der jeweils auftretenden
Tonhöhe in Buchstaben gestattet, wie dies bei 208 angedeutet ist. Es besteht
auch die Möglichkeit, beispielsweise die Relativstellung des Papieres in bezug auf
den Typenhammer so zu steuern, daß die Tonhöhe in Noten auf ein Notenpapier geschrieben
wird, etwa in der Art, wie dies bei 210 gezeigt ist. Schließlich kann aus der ermittelten
Satzmelodie auf das sinngemäße Vorhandensein von Interpunktionszeichen, z. B. Punkt,
Fragezeichen, Ausrufezeichen usw., geschlossen werden, wie dies bei 211 und 212
angedeutet ist.
-
Die Kompressoranordnung 107 (F i g. 10) hat, wie bereits ausgeführt,
eine sehr geringe Regelzeit; die Regelzeit liegt beispielsweise bei 1 ursec. Die
Kompressoranordnung 107 dient zur Ermittlung sehr schnell ablaufender Vorgänge,
wie sie z. B. bei den Buchstaben P, T und K, d. h. bei »Explosivlauten«, auftreten.
Entsprechend beginnt der Durchlaßbereich des hier mit 215 bezeichneten Hochpaßfilters
des ersten Kompressors 107a der Kompressoranordnung 107 erst bei 800 Hz. Entsprechend
höher liegt auch der Durchlaßbereich des Bandpaßfilters 216 des Nebenkanals; der
Bereich umfaßt beispielsweise die Frequenzen von 1600 bis 3200 Hz. Der Durchlaßbereich
des Tiefpaßfilters 217 des Nebenkanals liegt zwischen 0 und 600 Hz. An den
Ausgang des Regelverstärkers 218 des zweiten Kompressors 107b der Kompressoranordnung
107 schließen sich beispielsweise vier Formantfilter 220 an, deren Durchlaßbereich
beispielsweise
bei 1400, 1800, 2200 und 3000 Hz liegt. Ein weiterer
Formantfilter 221, der ebenfalls an den Ausgang des Kompressors 107b angeschlossen
ist und der den gesamten Bereich von 800 bis 4000 Hz durchläßt, dient zur Ermittlung
des Vorhandenseins eines Explosivlautes, während mit den Formantfiltern eine Unterscheidung
zwischen den einzelnen Explosivlauten P, K, T durchgeführt wird. An jedes
der Formantfilter 220 und an das Formantfilter 221
schließt sich nun
ein Gleichrichter 222 und an diese je ein Tiefpaßfilter 223 an. An jedes
Tiefpaßfilter 223
ist nun eine Subformanteneinheit 224 der Art angeschlossen,
wie sie beispielsweise in F i g. 13 gezeigt ist. Die Ausgangssignale der Subformanteinheiten
224 gestatten nun die Feststellung des Vorhandenseins und die Unterscheidung zwischen
den Lauten P, K und T.
-
Es wurde bereits darauf hingewiesen, daß die. Lage der quasifixen
Formanten von der Grundfrequenz fo etwas abhängig ist. Eine entsprechende Auswertung
der mit der Grundfrequenz gegebenen Information kann in dem logischen System 127
geschehen. Es besteht jedoch auch die Möglichkeit, die Resonanzfrequenz bzw. den
Durchlaßbereich der Formantfilter 121, 122 in Abhängigkeit von der Grundfrequenz
zu beeinflussen. Die Information gelangt somit beispielsweise von dem logischen
System 127 zu diesen Formantfiltern, wie dies durch die gestrichelte Linie
225 angedeutet ist.
-
Weiterhin kann von sämtlichen oder wenigstens einer Reihe von Tiefpaßfiltern,
die am Ausgang der Subformanteinheiten 130, 184 und 224 angeordnet
sind, über je einen Widerstand (nicht gezeigt) ein Signal gewonnen werden, wie dies
durch die Leitung 226 angedeutet ist. Das Signal, welches in dieser Leitung erscheint,
ist eine Information bezüglich des Rhythmus der Sprache. Das Signal wird beispielsweise
einem Taktgeber 227 übermittelt, durch welchen jeweils nach Abschluß eines gesprochenen
Lautes der entsprechende Typenhebel einer Schreibmaschine ausgelöst wird. Schließlich
sind die Nebenkanäle der jeweils zweiten Kompressoren 105b, 106b und 107b durch
eine Leitung 229 miteinander verbunden. Das Signal der Leitung 229 ist ein Maß für
die Lautstärke der zu dem Mikrophon 101 gelangenden Schallwellen. Dieses Signal
kann ebenfalls dem logischen System 127 zugeführt werden und gegebenenfalls von
der Lautstärke abhängige Korrekturen auslösen. Die das logische System 127 verlassenden
Informationen dienen zunächst zur aufeinanderfolgenden Auslösung der Tasten einer
Schreibmaschine, wie dies durch den Block 230 angedeutet ist. Weiterhin kann eine
Schreibmaschine mit Notentypen vorgesehen werden, wie dies durch den Block
231 angedeutet ist. Schließlich kann auch der Rhythmus und die Lautstärke
durch Zahlendrucken einer Schreibmaschine notiert werden, wie dies durch den Block
232 und den Block 233 angedeutet ist.
-
Gemäß F i g. 18 werden schematisch und beispielsweise die Spektren
der 30 wichtigsten französischen Sprachlaute gezeigt, wie sie durch eine erfindungsgemäße
Experimentiereinrichtung ermittelt würden. Die Experimentiereinrichtung unterscheidet
sich von der in F i g. 10 gezeigten Einrichtung dadurch, daß nur ein einziger Kompressor
mit Hauptkanalbandfilter etwa 80 bis 6000 Hz und Nebenkanalhochpaßfilter über 380
Hz vorgesehen war. Der Sprecher sprach monoton mit einer Grundfrequenz von etwa
150 Hz und langsam, d. h. mit etwa 4,5 Lauten prc Sekunde. Die Kolonne I betrifft
die Spektoren von Lauten innerhalb des Sprachflusses.
-
Die Kolonne 1I betrifft die Spektren von Lauten, die isoliert 1 Sekunde
lang ausgesprochen wurden. Bei einigen Lauten ist angegeben, ob diese mit einem
anschließenden A oder I gesprochen werden. Ein weißer Kreis entspricht
dem Pegel 0, ein kleiner schwarzer Kreis dem Pegel 1, ein großer schwarzer Kreis
dem Pegel 2, ein kleiner Halbkreis dem Pegel 0 oder 1, ein schwarzer Kreis in einem
größeren weißen Kreis dem Pegel 1 oder 2, drei ineinanderliegende Kreise dem Pegel
1, 2 oder 3 und ein unterteilter kleiner Kreis dem Pegel 1 mit etwa 80 %
Sicherheit. Ein kleiner Punkt seitlich bedeutet eine 10o/oige Unsicherheit und ein
kleines Punkt ein unsicheres, nicht ohne weiteres auswertbares Signal.
-
Schließlich bedeutet eine Wellenlinie eine Ondulation. In der Gruppe
FIX. FORM sind die Spektren der quasifixen Formanten aufgeführt, in der Gruppe
MOB. FORM die Spektren der mobilen und Folgeformanten, wobei die Informationen
der zweiten Reihe nach einer zusätzlichen Verstärkung ermittelt würden, und in der
Gruppe SUB. FORM die Spektren steigender Subformanten.
-
Die angegebenen Spektren können in erster Annäherung dazu dienen,
eine Dioden- oder Widerstandsmatrix im logischen Teil aufzubauen.
-
F i g. 19 zeigt schematisch die Anordnung der Spektren (Formanten
und Subformanten) in Funktion der Zeit t, wenn das Wort NOVELTI (phonetisch
geschrieben) in die Experimentiermaschine hineingesprochen wird. Die Kurven wurden
mittels eine Mehrkanaloszillographen gewonnen.
-
Die Hüllkurve der Amplituden nach Nivellierung durch einen erfindungsgemäßen
Kompressor ist arr. Kopf der F i g. 19 eingezeichnet. Die Kurve y zeige das regulierende
Signal im Kompressor als Funktion der Zeit. Kanäle 1 bis 8 des Oszillographen zeigen
ir der Gruppe FIX. FORM den Verlauf der Amplituden die durch die quasifixen
Formantfilter in dem Bereicl von 150 bis 3200 Hz geliefert werden. Die eingezeich.
neten schwarzen Rechtecke 1, 2 bezeichnen die Pegel 1 und 2 nach Digitalisierung.
Die Kurve in de Gruppe MOB. FORM entsprechen den zwei mobiler Folgeformanten
unter dem konstanten Grundtor 150 Hz, wobei die mit 2 bezeichnete Kurve nach eine
zusätzlichen Verstärkung ermittelt wurde. Die 15 Ka. näle MOB. FORM, 25 bis
40, zwischen 150 und 384 Hs zeigen die mobilen Formanten, die noch ohne beson. dere
Verstärkung ein meßbares Niveau ergeben. Dic gestrichelten Kurven MEL zeigen eine
zeitliche Ände. rung des Grundtones x, d. h. die »Melodie«. Die fün: leeren Kanäle
MOB. FORM, 20 bis 24, zwischen 8d und 150 Hz entsprechen den
mobilen Formanten, dis ohne besondere Verstärkung kein meßbares Niveai ergeben.
Die schwarzen Impulse der acht Kanäle SUB. FORM, P und N' zeigen die Niveaus
und Daue: der Subformanten, wobei die Werte P den positiver und die Werte N den
negativen Amplitudenänderunger bzw. Subformanten entsprechen. Gemäß F i g. 2( durchläuft
die durch ein Mikrophon gegebene Infor mation bei einer erfindungsgemäßen Einrichtung
zu
Sprachanalyse die folgenden Einheiten: den Kompressor 301, die
Gruppe von Filtern 302 zur Aufteilung der Information, die Analog-Digital-Wandler
303, eine Einheit 304 zur Normalisierung der eingehenden Informationen
den Taktimpulsgeber 305, eventuell die Impuls-Sampling-Vorrichtung 306, die Matrix
307, den Speicher 308 und die Druckmaschinen 309.
-
Diese Einheiten und insbesondere der logische Teil (nach den Analog-Digital-Wandlern)
sollen an Hand von F i g. 21 kurz wie folgt beschrieben werden. Die Eingangssignale
werden durch das Mikrophon 300 geliefert. Die drei Kompressoren 301
a, 301 b und 301 c haben verschiedene Zeitkonstanten
und verschiedene regulierende Bandpaßfilter 311, 312 und 313 in ihren
Nebenkanälen. Die Signale dieser Nebenkanäle werden in einem Differenziator 302a
mit dem entsprechenden Signal eines konventionellen Verstärkers 301d verglichen,
das durch die Leitung 314 übermittelt wird. Aus dem Vergleich können die folgenden
drei Dynamikkomponenten von gesprochener Sprache ermittelt werden: a) Phonetik,
b) Betonung, c) Sprachhärte (Variation der Betonung). Diese drei Dynamikkomponenten
in Funktion der Zeit können durch drei Kanäle eines Mehrkanaloszillographen 316
registriert werden, wie dies bei 315 angedeutet ist. Der analoge Teil
302 der schematisch gezeigten Einrichtung enthält drei Filtergruppen, und
zwar die Filtergruppe 302b für die mobilen bzw. Folgeformanten, die Filtergruppe
302c für die quasifixen Formanten, die Filtergruppe 302d für die Subformanten.
Die Filtergruppen für quasifixe Formanten und die Subformanten zerfallen je in zwei
parallele Untergruppen, die von verschiedenen schnellen Kompressoren 301
a, 301 b bzw. 301c, 301d die Eingangssignale erhalten.
Hierdurch können die Zeitcharakteristiken der diversen Sprachlaute analysiert werden,
z. B. kurze und lange Vokale bzw. Konsonanten vorliegen.
-
Die durch die Filtergruppen gewonnenen analogen Informationen können
z. B. über 20 -I- 24 -I- 24 = 68 weiteren Leitungen dem Oszillographen 316 zugeführt
werden, wie dies bei 317, 318 und 319 angedeutet ist. Der Oszillograph muß somit
insgesamt beispielsweise 91 Kanäle aufweisen, was jedoch eine sehr detaillierte
Schallanalyse ergibt, die es erlaubt, über Phonetik, Dynamik, Harmonie, Melodie,
Rhythmus und Individualcharakter des Sprechers Aufschluß zu gewinnen. Die gewonnenen
Informationen werden durch die Analog-Digital-Wandler 303a, 303b, 303c, 303d, 303e,
,303f und 303g entsprechend zwei oder drei einstellbaren Pegelbereichen in digitale
Informationen umgewandelt und in den Zwischenspeichern 304a, 304b, 304c, 304d und
304e miteinander verglichen. Hierbei werden diverse Korrekturen zur Normalisierung
der Informationselemente für z. B. phonetische Schrift ausgeführt. Die quasifixen
Formanten in dem Speicher 304d werden über die Leitung 321 durch die in dem Speicher
304c gespeicherten Informationen bezüglich der Melodie korrigiert, ferner über die
Leitung 322, manuell oder automatisch, bezüglich Sprachengruppen, wie näselnde gutturale
Sprachen usw.
-
Die quasifixen Formanten in dem Speicher 304d und die Subformanten
in dem Speicher 304e werden manuell oder automatisch über Leitung 323 gespeicherter
Informationen bezüglich diverser Sprachen wie Englisch, Deutsch oder auch Mundarten,
Dialekte usw. entsprechend korrigiert, wie dies bei 304f angedeutet ist. Die automatischen
Korrekturen können z. B. in der Art erfolgen, daß der Sprecher einen Standardsatz
in die Maschine spricht, die sich darauf automatisch entsprechend einstellt.
-
Die Korrektur könnte auch im analogen Teil erfolgen, wie dies durch
Leitungen 322a und 323a angedeutet ist. Die normalisierten Informationselemente
stehen in den Speichern 305a, 305b, 305c, 305d und 305e zur Verfügung.
Man kann nun irgendeine der aus der Computertechnik bekannten Arbeitsweisen verwenden,
um diese Informationen über eine Matrix 307a die Schreibmaschine 307b betätigen
zu lassen. Die Taktimpulse hierfür stammen aus einem Taktgeber 305f,
der seinerseits
durch die Subformanten in den Speicher 304e synchronisiert wird. Der Taktgeber steuert
auch das Abfragen der Speicher, wie dies bei 305h und 305g schematisch dargestellt
ist. Zwischenspeicher wie 307c, 307d können vorgesehen werden, um die Schreibmaschinentasten
im richtigen Moment betätigen zu können. Der Schalter 307e ist vorgesehen, um Laute
innerhalb einer gewissen Dauer 0-, 1- und 2mal usw. zu wiederholen, was zur Unterscheidung
von Homophonen eventuell nützlich sein kann.
-
Die Informationen gelangen nun zu der Matrix 307a, in der die Informationen
für die Betätigung z. B. der Schreibmaschine ermittelt werden. Es sei an dieser
Stelle angeführt, daß die Normalisierungsvorrichtungen für Sprachen usw. auch mit
der Matrix 307a verbunden werden können, wie dies bei 307f, 307g und 307h angedeutet
ist. Es können auswechselbare Matrizen vorgesehen werden.
-
Man kann fünf Gruppen von mechanischen Betätigungen in Funktion der
vorhandenen Information vorsehen, nämlich die Buchstaben 3071, die Zwischenräume
307k, die Zeilenschaltung 307c oder allgemein die Papier- oder Hammerposition 307m.
-
Andere Informationsgruppen, wie Dynamik, Melodie, Harmonie, Einschwingvorgänge
(Geräusche und Rhythmus), kann man speziellen zusätzlichen Schreibmaschinen 307p
zuordnen, die Zahlen oder Positionen drucken.
-
Durch Verwenden eines weiteren Speichers kann man ganze Worte oder
Sätze drucken. Ferner kann man die phonetische Schrift in orthographische umwandeln,
wenn man dem Speicher 307d eine Übersetztypmaschine 307g anschließt sowie eine Schreibmaschine
307r. Allerdings würde der Aufwand hierzu um ein Vielfaches denjenigen der phonetischen
Schreibmaschine übersteigen.