DE2050512A1 - Vorrichtung zur Verarbeitung von Ton bzw Sprachsignalen - Google Patents
Vorrichtung zur Verarbeitung von Ton bzw SprachsignalenInfo
- Publication number
- DE2050512A1 DE2050512A1 DE19702050512 DE2050512A DE2050512A1 DE 2050512 A1 DE2050512 A1 DE 2050512A1 DE 19702050512 DE19702050512 DE 19702050512 DE 2050512 A DE2050512 A DE 2050512A DE 2050512 A1 DE2050512 A1 DE 2050512A1
- Authority
- DE
- Germany
- Prior art keywords
- speech
- signal
- signals
- output
- parameters
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000015654 memory Effects 0.000 claims description 84
- 239000000872 buffer Substances 0.000 claims description 53
- 230000005284 excitation Effects 0.000 claims description 27
- 125000004122 cyclic group Chemical group 0.000 claims description 23
- 238000000034 method Methods 0.000 claims description 16
- 230000005540 biological transmission Effects 0.000 claims description 6
- 230000004044 response Effects 0.000 claims description 5
- 230000010355 oscillation Effects 0.000 claims description 4
- 238000010586 diagram Methods 0.000 description 15
- 230000008569 process Effects 0.000 description 10
- 238000005070 sampling Methods 0.000 description 10
- 239000002131 composite material Substances 0.000 description 5
- 230000005236 sound signal Effects 0.000 description 5
- 238000010276 construction Methods 0.000 description 4
- 238000001228 spectrum Methods 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 230000001755 vocal effect Effects 0.000 description 3
- 238000003491 array Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 150000001875 compounds Chemical class 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000003111 delayed effect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 150000002500 ions Chemical class 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000007493 shaping process Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Time-Division Multiplex Systems (AREA)
Description
Nippon Telegraph And Telephone Public Corporation
Tokio, Japan 14.10.1970
Die Erfindung betrifft eine Ton- bzw. Sprachsignale verarbeitende Vorrichtung mit einem elektronischen Pschner, der
verschiedene Informationsdienste anbietet, und insbesondere eine neuartige, Ton- bzw. Sprachsignale verarbeitende Vorrichtung,
bei welcher die Ton- bzw. Sprachsignale, die f beantwortet werden sollen, zuvor in Form von Sprachparametern
gespeichert werden, um anschließend entsprechend den Befehlen eines elektronischen Rechners gelesen und unter Verwendung
eines Normal-Prequenzgenerators wieder zu einer Rede zusammengesetzt
zu werden.
Bekannte Vorrichtungen der vorstehend umrissenen Art arbeiten
nach dem sogenannten "Kompiler"-Verfahren mit einer bereits
aufgezeichneten Sprache, bei welchem im folgenden als "Spracheinheiten11 bezeichnete Sprachteile beispielsweise
in Form von Wort-Spracheinheiten in einem Speicher gespeichert werden und die gespeicherten Spracheinheiten nacheinander -
in entsprechender Reihenfolge ausgewählt werden, um sie ^
entsprechend den Befehlen eines elektronischen Rechners in eine Sprachmitteilung umzubauen bzw. zusammenzustellen«
Bei diesem Verfahren werden die Spracheinheiten im allgemeinen unmittelbar als Audiosignale in Wellenformen aufgezeichnet,
wobei als Aufzeichnungsmedium im allgemeinen eine langsam umlaufende Analog-Magnettrommel verwendet wird,
deren Umdrehungsperiode der zeitlichen Länge einer Spracheinheit entspricht, so daß sie je Spur eine Spracheinheit
109835/0945
205051?
aufzeichnet. Bei dieser Konstruktion ist es jedoch schweig,
nicht nur die Kapazität der Analog-Magnettrommeln sondern auch die Anzahl von Spracheinheiten, die aufgezeichnet
werden können, auf 100 bis 200 oder mehr zu erhöhen.
Zur Überwindung dieser Schwierigkeiten des Kompiler-Verfahrens mit voraufgezeichneten Spracheinheiten besteht die Möglichkeit,
anstelle der unmittelbar aufgezeichneten Sprachsignale Informationen verdichteter Signale aufzuzeichnen, um Sprachsignale
mittels eines Sprach-Normal-Frequenzgenerators zu rekonstruieren. Beispielsweise wendet eine derartige
auf Tonsignale ansprechende Vorrichtung das Prinzip eines Kanal-Vokoders (vergl. beispielsweise R.H. Buron: I.E.E,E.
Trans. AU-16, 1, 1968), doch ist bei Verwendung eines Kanal-Vokoders
die Qualität des Tonausgangsignals mangelhaft. Außerdem muß an jedem Ausgangskanal ein teurer Sprach-Prequenzgenerator
vorgesehen sein.
Aufgabe der Erfindung ist demgegenüber in erster Linie die
Schaffung einer neuartigen, Ton- bzw. Sprachsignale verarbeitenden Vorrichtung, welcher ein Sprachsignal über einen
neuen, im folgenden als "Teilautokorrelations^Koeffizient"
bezeichneten Parameter dargeboten bzw. dngespeist wird, der zur Bildung einer Anzahl von Spracheinheiten benutzt wird,
so daß Sprach-Ausgangssignale ausgezeichneter Qualität erzeugt werden. In diesem Zusammenhang bezweckt die Erfindung die
Schaffung einer neuartigen Sprachparameter-Extraktionsvorrichtung zur Bildung eines Teilautokorrelation-Koeffizienten
und einer Information betreffend die die Sprachsignale erzeugende AnregungJ^Hfs Schaffung einer kostensparenden
zyklischen Speichervorrichtung, welche mehrere Parameter in Form von Teilautokorrelations-Koeffizienten als Spracheinheiten
zu speichern vermag, sowie die Schaffung eines einfachen Sprach-Normal-Frequenzgenerators (synthesizer)
mit mehreren Digitalfiltern in Kaskadenschaltung ewp-
1 09835/09A B
zur Rekonstruktion einer Sprache aus mehreren aus der Speichervorrichtung ausgewählten Spracheinheiten.
Vorzugsweise soll bei dieser Ton- bzw« Sprachsignale
verarbeitenden Vorrichtung ein einziger Sprach-Normal-Frequenzgenerator gemeinsam für mehrere Ausgangskanäle
verwendet werden können.
Diese Aufgabe wird erfindungsgemäß dadurch gelöst, daß jeweils an zwei dicht nebeneinander liegenden Zeitpunkten
Sprachsignalwerte ausgewählt und die zwischen diesen
Zeitpunkten liegenden Sprachsignalwerte zur Bestimmung ή
des Unterschieds zwischen nach dem Verfahren der kleinsten Quadrate vorherbestimmten Signalwerten an diesen beiden
Zeitpunkten und den zu diesen Zeitpunkten tatsächlich ermittelten Signalwerten, d.h. zur Bestimmung des Teilautokorrelations-Koeffizienten
herangezogen werden. Weiterhin ist eine Einrichtung zur Änderung des Zeitintervalls
zwischen den beiden Zeitpunkten vorgesehen, um den Teilautokorrelations-Koeffizienten zu zwei neuen
Zeitpunkten bestimmen zu können. Durch Wiederholung dieser Vorgänge können mehrere Teilautokorrelations-Koeffizienten
bestimmt werden. Da diese Koeffizienten eng mit der Hüllkurve des Frequenzspektrums des Sprachsignals zusammenhängen,
kann eine Sprache aus Informationen bezüglich % der Anregungsquelle, wie Grundfrequenz, Amplitude der Grundfrequenz
und Geräuschamplitude zusammengesetzt werden, die aus dem Sprachsignal erhalten werden. Zu diesem Zweck
ist ein durch die betreffenden Informationen über die Anregungsquelle gesteuerter Generator vorgesehen, dessen
Ausgangssignale durch den Teilautokorrelations-Koeffizienten gesteuert werden, um die Hüllkurve des Frequenzspektrums
zu reproduzieren.
109835/0945
Erfindungsgemäß kann für die Parameter-Speichervorrichtung zur Speicherung mehrerer Teilautokorrelations-Koeffizienten
ein billiger Speicher großer Kapazität verwendet werden, während der Digital-Sprachfrequenzgenerator zur Wiedergabe
der HUllkurve des Prequenzspektrums so ausgelegt sein kann,
daß er auf Zeitteiler- bzw. Zeitmultiplex-Basls verwendet
wird.
Im folgenden sind einige bevorzugte Ausführungsformen der Erfindung anhand der Zeichnungen näher erläutert.
Es zeigen:
Fig. 1 ein schematisches Schaltbild zur Veranschaulichung
des Grundprinzips einer Ton- bzw. Sprachsignale verarbeitenden Vorrichtung mit den Merkmalen der
Erfindung,
Fig. 2 eine Sprachsignal-Kurve zur Erläuterung des Teilautokorrelations-Koeffizienten,
Fig. 3 ein Schaltbild einer Vorrichtung zum Extrahieren
der Teilautokorrelations-Koeffizienten und der Informationen bezüglich der Anregungsquelle,
Fig. 4 ein Schaltbild <iner Vorrichtung zur Bestimmung
des bei der Erfindung verwendeten Korrelations-Koeffizienten,
Fig. 5 ein Schaltbild einer beispielhaften Autokorrelations-Vorrlchtung,
Fig. 6 ein Schaltbild eines beispielhaften Sprach-Frequenzgenerators,
109835/0945
Fig. 7 ein Schaltbild der erfindungsgemäßen Vorrichtung, bei welcher der Prequenzgenerator in Zeitmultiplexschaltung
verwendet wird,
Fig. 8 eine zyklische Speicheranordnung der Sprachparameter
auf einer Magnettrommel bei der Ausführungsform gemäß Fig. 7,
Fig. 9 ein Blockschaltbild der bei der Ausführungsform gemäß Fig. 7 verwendeten Wort-Synchronisiereinrichtung,
Fig. 10 ein Zeitdiagramm der auf der Magnettrommel aufgezeichneten
Steuersignale,
Fig. 11 ein Blockschaltbild bzw. ein Diagramm der Zeitab- und 12 hängigkeit der bei der AusfUhrungsform gemäß
Fig. 7 verwendeten Programmsteuerung,
Fig. 13 ein Blockschaltbild des Eingangssteuerkreises
gemäß Fig. 7,
Fig. 14 ein Blockschaltbild einer abgewandelten Vorrichtung
mit den Merkmalen der Erfindung und
Fig. 15 ein Blockschaltbild des Eingangssteuerkreises bei der Vorrichtung gemäß Fig. 14.
Gemäß Fig. 1 können über einen angeschlossenen Fernsprechapparat
1 und über eine Vermittlung 2 Anfragen nach irgendwelchen Informationen an einen elektronischen Rechner3gestellt
werden. Wenn diese Verbindung hergestellt ist, wird der Rechner 3 vom Fernsprechapparat 1 angesteuert und werden die
- 6 -109835/0945
-6- 2050513
die vom Rechner abgegebenen Signale in Form einer Code-Reihe
von zu beantwortenden Spracheinheiten einer Tonbzw. Sprachsignale verarbeitenden Vorrichtung 4 zugeleitet,
die Speicher für die Teilautokorrelations-Koeffizienten und für die Informationen bezüglich der Anregungsquelle
aufweist, welche zur Zusammenstellung der in Sprachform abgegebenen Antwort nötig sind, und diese Speicher werden
beim Auftreten eines vom Rechner 5 abgegebenen Signals abgefragt, um gesprochene Worte aufzubauen. Das hergestellte
Sprachsignal wird sodann über die Vermittlung 2 wieder an den Fernsprechapparat 1 übertragen. Gemäß Fig.
ist an die Vorrichtung 4 ein Sprachparameter-Extraktor 5 angeschlossen, welcher die Sprachparameter, d.h. die Teilautokorrelat
ions-Koeffizient en und die Informationen bezüglich der Anregungsquelle, die in der Vorrichtung 4
gespeichert werden sollen, aus der Sprache aufnimmt und gewünschtenfalls die in der Vorrichtung 4 zu speichernden
Sprachparameter überprüft oder durch neue ersetzt.
Der Teilautokorrelations-Koeffizient, der den einen der erfindungsgemäß zum Aufbau der Sprache verwendeten Parameter
darstellt, läßt sich wie folgt definieren: Wenn das Sprachsignal beispielsweise gemäß Fig. 2 mit einer
Frequenz von 8 kHz abgetastet wird, wird die Teilautokorrelation zwischen den Werten des^Sprachsignale an
zwei vergleichsweise dicht beieinander liegenden Abtast-Zeitpunkten tQ und t, durch die Korrelation des Unterschieds
X0 bzw. X-j zwischen den tatsächlichen
Abtastwerten X0 und X-, und zwei nach der Methode des kleinsten
Quadrats vorherbestimmten Werten XQ bzw. X-* ausgedrückt,
die durch Verwendung der au zwei im Zeitintervall zwischen den Zeitpunkten tg und t~ liegenden Zeitpunkten
t.· bzw. t2 abgetasteten Werte X^ und Xgerhalten werden.
109835/0945
Das Intervall zwischen den AbtastZeitpunkten wird fortlaufend
auf T, 2T, 3T, 4T ... variiert und es werden die Teilautokorrelations-Koeffizienten
für diese Zeitspannen bestimmt. Der Teilautokorrelations-Koeffizient läßt sich durch die
Gleichung
E [(Ax0) (Axn))
K =
ausdrücken, in welcher nT das Intervall zwischen den Abtastzeitpunkten
bedeutet. f
Dabei gilt für die Abweichungen ■£$ Xn und ^Δ Xn von den
•ν α υ n
vorherbestimmten Werten X0 bzw. Xn unter Verwendung eines
Verzögerungs-Operators D:
£ χ0 = )__ ö χ = <
Z^ α D1
worin ck^ und ^»i so ausgewählt sind, daß die Werte von
\ (Δχη ) J xrnd E j (^Xn)2J minimal werden, D
durch eine Gleichung
den durch eine Gleichung
± i · A
n-1
ausgedrückten Operator darstellt und Bn-^ (D) Fehleroperatoren
sind. Mit diesen Parametern läßt sich der Teilautokorrelations-Koeffizient
Kn wie folgt ausdrücken:
109835/0945 - 8 -
Eb läßt sich nachweisen, daß für An (D), Bn (D) und Kn
die Gleichungen
An <D) - An-1 <D>
- KnBn-1 <D>
r (5)
gelten.
D[Bn-1 <D>
- KnAn-1 (DO (6)
Wenn also A _.. (D) und B1. (D) bestimmt sind, kann Kn und
können damit auch An (D) und Bn(D) bestimmt werden. Auf
diese Weise können die Teilautokorrelations-Koeffizienten bestimmt werden. Da sich diese Koeffizienten vergleichsweise
allmählich mit der Zeit ändern, werden sie während jeder Periode bestimmt, deren Länge ausreicht, um die
erforderlichen Sprachparameter zu ermitteln, ohne daß sich dabei das Wesen der Sprache ändert, beispielsweise
alle 15 ms, und der so erhaltene Koeffizient wird dann verschlüsselt und gespeichert.
Fig. 3 zeigt ein Beispiel eines Extraktors 5 zum Herausziehen
von Teilautokorrelations-Koeffizienten und Informationen bezüglich Anregungsquelle aus einem Sprachsignal. Der in
Fig. 3 dargestellte Extraktor weist η Detektorstufen 14a bis I4n für Teilautokorrelations-Koeffizienten auf, die in
Kaskadenschaltung aufgebaut sind. Da die jeweiligen Detektorstufen jeweils gleiche Konstruktion besitzen, ist
- 9 -109835/0945
im folgenden nur die Konstruktion der Stufe 14a näher
erläutert. Genauer gesagt, weist jede dieser Stufen ein Verzögerungsnetzwerk 7 zur Verzögerung des Sprachsignals
um ein Abtastintervall T, ein Rechengerät 8 zur Berechnung des Korrelationskoeffizienten, zwei Multiplier 9 und 11,
zwei Addierwerke 10 und 12 sowie einen Größenwandler bzw. Umsetzer 15 auf. Einein Fig. 3 am linken Ende der Detektorstufe
14a eingezeichnete Eingangs-Klemme 6 empfangt das
Sprachsignal und die Ausgangs-Klemmai15 der Umsetzer 15 der ein
zelnen Stufen liefern jeweils den in der betreffenden Stufe quantisierten Teilautokorrelations-Koeffizienten. Die Ausgangsklemme
des Addierwerksl2der letzten Detektorstufe I4n ist offen,
während die Ausgangsklemme des Addierwerks 10 dieser Stufe an einen Autokorrelator 16 angeschlossen ist, dessen
Ausgangssignale einem Maximalwert-Wähler 17 eingespeist werden,
welcher an einen von zwei Größenwandlern bzw. Umsetzern 18 oder 20 angeschlossen werden kann.
Das an der Eingangs-Klemme 6 erscheinende Sprachsignal wird
einerseits über das Korrelationskoeffizient-Rechengerät 8 und den Multiplier 9 dem einen Addierwerk 12 eingespeist,
nachdem es im Verzögerungsnetzwerk 7 um eine Abtastperiode
T verzögert worden ist, und andererseits über das Rechengerät 8 und den Multiplier 11 dem anderen Addierwerk eingespeist.
Fig. 4 zeigt ein Beispiel für den Schaltungsaufbau des Korrelationskoeffizient-Rechengeräts 8 mit
Addierwerken 22, Quadriervorrichtungen 2J>, Addierwerken 24,
Tiefpaßfiltern 25 und einer Teil-oder Verhältnisschaltung 26,
Unter der Voraussetzung, daß das Rechengerät 8 zwei Eingangssignale Bn-1 (D) Xn bzw. An-1 (D) Xn empfängt, lassen
sich die Eingangssignale der beiden Tiefpaßfilter 25
jeweils durch folgende Gleichungen ausdrücken:
- 10 -
109835/0945
Γ ι ν —
(D)Xn + An-1 (D) Xn)2 - (Bn-1 (D)Xn - A^1 (D)Xn)2 = (γ)
Die Tiefpaßfilter 25 bestimmen die Mittelwerte dieser Eingangssignale über eine kurze Zeit. Da die Mittelwerte von
(An-1(D)Xn)2 und (Bn-1(D)Xn)2 annähernd gleich sind, gilt
die Gleichung:
Mittelwert von 2
Mittelwert von
wobei der Wert von K durch das Ausgangssignal der Verhältnisschaltung
26 gegeberPwird, Dieses Ausgangssignal wird den
Multipliern 9 und 11 eingespeist, wodurch am Ausgang des
Multipliers 11 ein vorbestimmter Wert X^ von X4 auftritt.
ι 'A
Das Addierwerk 10 liefert den Unterschied (X1. - X1) zwischen
dem vorherbestimmten Wert X1 und dem wirklichen Wert X...
Außerdem erzeugt der Multiplier 9 als Ausgangssignal den vor-
herbestimmten Wert Xq von XQ und liefert der Addierer 12 den
Unterschied (XQ - X0^* ^as Ausgangssignal des Korrelationskoeffizient-Rechengeräte
8 wird dem Umsetzer 13 eingespeist,
., 11 ~ 109835/0945
der daraufhin ein quantisiertes Ausgangssignal des Teilautokorrelations-Koeffizienten
an der Klemme 15 erzeugt.
Ähnliche Arbeitsgänge werden auch durch die anderen, der Stufe 14a nachgeschalteten Detektorstufen durchgeführt. Genauer
gesagt, liefern die Addierwerke 10 und 12 der zweiten Teilautokonelations-Koeffizienten-Detektorstufe
14b Differenzwerte (X2 - X2) bzw. (Xq - Xq) bis zu der letzten Detektorstufe I4n
(Xp - Xp) bzw.(X0 - Xq), wobei in diesem Pall X den abgegriffenen
Wert des wellenförmigen Tonsignals zu einem AbtastZeitpunkt
tn, welcher der p-te Punkt beginnend von tn ist, darstellt und
p g n , -
X und X0 die vorherbestimmten abgetasteten Werte bei tQ und ^
t darstellen, die anhand der abgetasteten Werte zu den beiden Zeitpunkten tQ bzw. tp vorherbestimmt worden sind. Auf diese
Weise werden quantisierte Werte der Teilautokorrelations-Koeffizienten unterschiedlicher Zeitintervalle T, 2T, ys ... pT
an den Ausgangsklemmen der betreffenden Umsetzer 15 in den
jeweiligen Detektorstufen 14a, 14b ... I4n erzeugt. Wenn
das Eingangs-Sprachsignal die letzte Stufe einer Reihe von in Kaskade geschalteten Detektorstufen 14a, 14b ... I4n erreicht,
wird die Korrelation zwischen den dicht nebeneinanderliegenden abgetasteten Werten des Sprachsignals aufgehoben, wobei die dem
Formant der Sprache entsprechende Autokorrelatbn eliminiert wird. Die der Grundfrequenz der Sprache entsprechende Korrela- M
tion wird jedoch beibehalten, ohne unterdrückt zu werden. Wenn das Ausgangssignal des einen Addierwerks 10 der letzten
Teilautokorrelations-Koeffizienten-Detektorstufe I4n an den Autokorrelator 16 angelegt wird, um dessen Autokorrelation
zu bestimmen, wird aus diesem Grund eine charakteristische Spitze mit einer der Periode der Grundfrequenz entsprechenden
Zeitverzögerung gebildet, wenn das empfangene Sprachsignal ein Stimmlaut ist, während keine Spitze gebildet wird,wenn das
Sprachsignal ein stimmloser Laut ist. Wenn daher das Eingangs-Sprachsignal ein Stimmlaut ist, wird das Ausgangssignal des
- 12 -
109835/0945
wert Autokorrelators 16 an den Maximal-Wähler 17 angelegt
und wird die Grundschwingungsperiodendauer der Sprache durch Messung des Intervalls zwischen den Höchstwerten
zweier benachbarter Autokorrelations-Koeffizienten bestimmt.
In Fig. 5 ist eine Ausführungsform des Autokorrellators
beispielhaft dargestellt. Bei dieser Ausführungsform weist
der Autokorrelator 16 mehrere Verzögerungsnetzwerke 27,
mehrere Multiplier 28 und mehrere Tiefpaßfilter 29 auf. Die Grundschwingungsperiodendauer der Sprache, die durch
den Wähler 17 ermittelt wurde, wird durch den Umsetzer quantisiert und erscheint dann an einer Ausgangsklemme
(Fig. 5).
Wenn dagegen das Eingangs-Sprachsignal ein stimmloser Ton ist, erscheint die Gnirifeehwingungs-Periodendauer der Sprache
nicht an der Klemme 19. In diesem Fall wird diese Information als weißes Rauschsignal der Information bezüglich der
Anregungsquelle verwertet.
Die vom Amplitudenwert des dem Autokorrelator 16 eingespeisten Eingangssignale erhaltene Amplitude des die Information
bezüglich der Anregungsquelle enthaltenden Signals wird durch die Umsetzschaltung 20 quantisiert und erscheint dann
an einer Ausgangsklemme 21.
Auf diese Weise werden der Tellautokorrelations-Koeffizient und die Information bezüglich der Anregungsquelle, welche für die Zusammenstellung der Sprache erforderlich
sind, an den Ausgangsklemmen 15, 19 und 21 erzeugt. Da die zeitmäßige Veränderung des die Information bezüglich
der Anregungsquelle enthaltenden Signals ebenso wie beim
- 15 -109835/0945
Teilautokorrelations-Koeffizient vergleichsweise allmählich erfolgt, reicht es aus, sie beispielsweise alle 15 ms
zu bestimmen. Die erhaltenen Informationen werden verschlüsselt und gespeichert.
Erfindungsgemäß werden mehrere Teilautokorrelations-Koeffizienten der Sprache sowie die Grundschwingungs-Periodendauer
und die Amplitude der Sprache, die als die Informationen bezüglich der Anregungsquelle enthaltenden Signale verwendet
und durch die vorstehend beschriebenen Vorgänge erhalten werden, in der Vorrichtung 4 gemäß Fig. 1 gespeichert.
Wenn die Vorrichtung 4 vom Rechner 3 einen Befehl von einer Codereihe empfängt, der die zusammenzustellende Rede
betrifft, wählt die Vorrichtung 4 der Reihe nach die Teilautokorrelations-Koeffizienten
und die Informationen bezüglich der Anregungsquelle enthaltenen Signale, die im voraus im
Speicher gespeichert warden, entsprechend dem Befehl aus, so daß die betreffende Rede aufgebaut wird.
Fig. 6 veranschaulicht ein Blockschaltbild einer Vorrichtung zum Zusammensetzen der ausgewählten Rede. Diese Vorrichtung
weist einen Impulsgenerator 30 für Stimmlaute, einen Generator 31 für weißes Rauschen für stimmlose Laute und
einen Amplituden-Regler 32 auf, deren Arbeitsweise durch an
Eingangs-Klemmen 33 und 34 angelegte Signale gesteuert wird.
Die Klemme 33 empfängt eines der Informationen bezüglich der Anregungsquelle enthaltenden Signale, die vorher in der
Vorrichtung 4 gespeichert und durch den elektronischen Rechner 3 ausgewählt wurden, d.h. die Information, welche
die Grundschwingungsdauer der Sprache betrifft, so daß der Impulsgenerator 30 eine Impulsreihe mit der Einheitsleistung
von derselben Periode wie die Grundschwingungsperiode erzeugt. Während eines Intervalls, in welchem keine sich auf die Periode
- 14 -109835/0945
der Grundschwingung beziehende Information an die Eingangsklemme 33 angelegt wird (d.h. während des stimmlosen Tonintervalls)
, erzeugt der Generator 31 ein Signal aus weißem Räuschen mit der Einheitsleistung. Auf gleiche Weise
empfängt der Amplitudenregler 32 eine Information bezüglich
der Signalamplitude und gleichzeitig ein Informationen bezüglich der Anregungsquelle enthaltendes Signal von der
Eingangs-Klemme 34, um die Amplitude des Ausgangssignals
zu steuern.
Das Ausgangssignal des Amplituden-Reglers 32 wird mehreren
in Kaskade geschalteten Digitalfiltern 35n ··· 35b und 35a
zugeführt, die alle in gleicher Weise aufgebaut sind und jeweils drei Addierwerke 36, 38 und 39# ein Verzögerungsnetzwerk
40 und einen Multiplier 37 aufweisen. Ein vorher gespeicherter und durch den Rechner ausgewählter Teilautokorrelations-Koeffizient
wird über eine Klemme 41 dem Multiplier 37 eingespeist. Die Eingangs-Klemme des Verzögerungskreises 40 des Digitalfilters 35n ist offen, während an
der Ausgangs-Klemme 42 des Digitalfilters 35a das zusammengesetzte Sprach-Ausgangssignal erscheint, welches außerdem
über ein Verzögerungsnetzwerk 43 dem Addierwerk 39 des Digitalfilters
35a eingespeist wird. Jedes Digitalfilter 35n 35^ und 35a entspricht einer der Teilautokorrelations-Koeffizient-Detektorstufen
I4n τ.. I4b und I4a gemäß Fig„ 3· Der durch den elektronischen Rechner ausgewählte,
an die Eingangs-Klemme 41 des Digitalfilters 35n angelegte
Teilautokorrelations-Koeffizient ist daher der Teilautokorrelations-Koeffizient,
der durch die Detektorstufe I4n gemäß Fig. 3 erzeugt und gespeichert wurde. Auf gleiche Weise
wurde der an die Eingangsklemme des Digitalfilters 35a angelegte Teilautokorrelations-Koeffizient vorher durch die
Detektorstufe I4a gemäß Fig. 3 erzeugt. Ersichtlicherweise
sind somit die Ubertragungsfunktionen der Digitalfilter
- 15 109835/0945
gegenüber denen der Teilautokorrelations-Koeffizient-Detektorstufen
invertiert, so daß die Korrelation zwischen den durch eine entsprechende Detektorstufe eliminierten
Sprachwellenformen dem Ausgangssignal des Amplituden-Reglers 32 aufgeprägt wird. Wenn dieses Ausgangssignal
nacheinander durch die Digitalfilter 35n ... 35b und 35a
hindurchgelangt, gleicht sich folglich die Hüllkurve des Frequenzspektrums allmählich der Hüllkurve der Origjnalrede
an.
Obgleich bei dieser Ausführungsform der Sprachaufbauvor- Λ
richtung Digitalschaltungen dargestellt sind, welche die ™
durch die Teilautokorrelations-Koeffizienten angesteuerten Digitalfilter darstellen, können die Digitalfilter ersichtlicherweise
auch durch Analogschaltungen ersetzt werden. Bei dem die Digitalschaltungen verwendenden System wird
es durch Verwendung von sehr schnell arbeitenden Elementen möglich, die Sprachaufbauvorrichtung auf Zeitmultiplexbasis
zu verwenden, wodurch das mehrfache Ausnutzen der Antwortrede einfach wird, wie dies noch näher erläutert
werden wird.
Um erfindungsgemäß eine zusammengesetzte Rede ausgezeichneter Qualität zu erzeugen, kann der Maximalwert des Zeitunter- λ
schieds zwischen dem Teilautokorrelations-Koeffizienten etwa 8t betragen. Wenn der Teilautokorrelations-Koeffizient
für jedes Zeitintervall zu einem aus fünf Bit bestehenden Code verschlüsselt und mit einer Rahmenperiode von 15ms
extrahiert wird, beträgt die Informationskapazität der Teilautokorrelations-Koeffizienten 2667 Bit je Sekunde.
Wenn andererseits das Informationen bezüglich der Anregungsquelle enthaltende Signal mit einer Frequenz von 15 Bit
je 15 ms geliefert wird, beläuft sich die Gesamtkapazität auf 3667 Bit je Sekunde. Der benutzte Ausdruck "Rahmenperiode"
- 16 -
109835/0945
bedeutet eine Periode, in welcher die Sprachparameter in einem Speicher gespeichert werden und welche vom
Abtastintervall zu unterscheiden ist.
Diese Informationskapazität beläuft sich auf etwa 1/15
derjenigen der Sprachwellenform. Aus diesem Grund kann eine zusammengesetzte Rede hoher Qualität mit Hilfe von Steuersignalen
kleiner Kapazität erzielt werden. Folglich ist es mit Hilfe der erfindungsgemäßen Vorrichtung möglich, die
Zahl der zusammensetzbaren Wörter im Vergleich zu herkömmlichen Vorrichtungen um den Paktor 15 zu erhöhen.
Wie erwähnt, w6ist gemäß Fig. 6 jede Digitalfilterstufe 55a
einen Multiplier yj und drei Addierwerke J>6, ?8, 39 auf.
Wenn die Arbeitsweise dieses Multipliers und dieser Addierwerke durch eine Taktfrequenz von 10 MHz gesteuert wird,
beträgt die Arbeitszeit jeder einzelnen Stufe 35 etwa
1,8 Mikrosekunden. Bei Annahme eines Maximums von 8T für den Zeitunterschied der Teilautokorrelations-Koeffizienten
wird ein abgetasteter Wert der zusammengesetzten Rede innerhalb eines Intervalls von etwa 14,4 Mikrosekunden gebildet,
doch da jede Stufe ihren Arbeitsgang alle 1,8 Mikrosekunden durchführt, ist es möglich, an den Eingang der Digitalfilter
alle 1,8 Mikrosekunden eine Information bezüglich der Anregungsquelle anzulegen, so daß die zusammengesetzten
Sprach-Ausgangssignale alle 1,8 Mikrosekunden erzeugt werden. Folglich wirkt die gennante Periode von 14,4 Mikrosekunden
als reine Verzögerungszeit, die zum Zusammensetzen eines Teils des Sprach-Ausgangssignals erforderlich ist. Bei Annahme
einer Abtastfrequenz von 8 kHz für die zusammengesetzte Rede können daher im Multiplier etwa vierundsechzig Kanäle verwendet
werden.
- 17 -
109835/0945
Bei der erfindungsgemäßen Ton- bzw. Sprachsignale verarbeitenden
Vorrichtung kann die Periode der Grundschwingung durch jede beliebige andere bekannte Einrichtung als die beschriebene
abgegriffen werden. Obgleich bei der vorstehend beschriebenen Ausführungsform der Teilautokorrelations-Koeffizient
von einem abgetasteten Wert der Tonsignalwellenform erhalten wurde, ist zu beachten, daß dieser Koeffizient durch ■Vorherbestimmung
der Werte zweier dicht benachbarter Zeitpunkte durch ein Signal bestimmt werden kann, welches zwischen diesen
Zeitpunkten auftritt, worauf die Korrelation der Differenzen zwischen den den vorherbestimmten Werten entsprechenden
wirklichen Werten und den vorherbestimmten Werten ermittelt · j wird. Obgleich bei der vorher beschriebenen Ausführungsform
mehrere Digitalfilterstufen in Kaskade geschaltet sind, kann ersichtlicherweise ein einziges Filter wiederholt zur
Lieferung der gewünschten zusammengesetzten Rede benutzt werden.
Die vorstehend beschriebene Ton- bzw. Sprachsignale verarbeitende Vorrichtung weist einen Speicher zur Speicherung der
Teilautokorrelations-Koeffizienten eines Sprachsignals und der Periode der Grundschwingung sowie der Signalamplitude,
die als Informationen bezüglich der Anregnngsquelle benutzt werden, sowie einen Sprach-Prequenzgenerator auf, der in
Abhängigkeit von einem Befehl eines elektronischen Rechners Λ
die im Speicher gespeicherten Sprachparameter zum Aufbau einer Rede auswählt. Wenn bei der erfindungsgemäßen Vorrichtung der
Sprach-Prequenzgenerator auf Zeitteiler- bzw. Zeitmultiplexbasis verwendet wird, können gleichzeitig mehrere verschiedene
Reden zusammengesetzt werden, die gleichzeitig an entsprechenden Ausgangskanälen auftreten.
Im folgenden ist eine verbesserte Ton- bzw. Sprachsignale verarbeitende Vorrichtung beschrieben, die mehrere verschiedene
Sprachsignale gleichzeitig über mehrere Ausgangskanäle abzugeben vermag. - 18 -
109835/0945
Es gibt zahlreiche Arten von Speichervorrichtungen, die Sprachparameter zu speichern vermögen, beispielsweise
solche mit Magnetkernen, Magnettrommeln, Magnetplatten usw. Wenn einige tausend Worter gespeichert werden sollen,
werden kostensparende Magnettrommeln großer Kapazität oder Magnetscheibenspeicher bevorzugt. Aus diesem Grund
werden bei den beiden im folgenden beschriebenen Ausführungsformen der Erfindung Magnettrommelspeicher
109835/0945
zur Speicherung von Sprachparametern verwendet, wobei gleichzeitig auf vierundsechzig Kanälen Antworten gegeben
werden können.
Fig. 7 zeigt ein Schaltbild einer solchen Ausführungsform, bei welcher die Spracheinheit bzw. Sprachinformation eines
Worts auf dner Magnettrommel in Form eines Sprachparameters und in solcher Reihenfolge aufgezeichnet wird, daß die
Sprachparameter mehrerer Wörter auf Zeitteiler- bzw. Zeit-Multiplexbasis
herausgelesen werden können.
Fig. 8 zeigt eine typische Anordnung einzelner Sprachparameter M
auf einer Magnettrommel. Bei dieser Anordnung wird in jedem der in Fig. 8 dargestellten Blöcke 735 ein Satz von Sprachparametern
aufgezeichnet. Jeder Block 75 weist soviel Bit auf, wie für die Aufzeichnung eines Satzes von Sprachparametern
erforderlich ist. Die linken Ziffern in den einzelnen Blöcken bezeichnen die Wortziffern bzw. Spracheinheitsziffern,
während die rechten Ziffern ihre Rahmenziffern angeben. Im Fall eines Worts "1" werden beispielsweise die jeweiligen
Sprachparameter, die mit einer Rahmenperiode von 15 ms extrahiert
worden sind, in Abständen von jeweils 15 ms in getrennten Blöcken "1,1", "1,2" usw. aufgezeichnet, so daß bei einer
Wortdauer von L Sekunden sein letzter Sprachparameter in einem vom Block "1, 1" um L Sekunden entfernten Block "1, N" aufge- |
zeichnet wird. Gemäß Fig. 8 ist ein Verhältnis von N = L/15x1O"5
gegeben. Die jeweiligen Sprachparameter des Worts "2" werden in Blöcken "2, 1","2,2" ... "2, N" derselben zyklischen
Speicheranordnung auf derselben Magnettrommel gespeichert, wobei diese Blöcke um einen Block gegenüber den Blöcken zur
Speicherung des Worts "1" versetzt sind. Die Worte bis zu einem Wort "M" werden auf gleiche Weise aufgezeichnet. Auf dieselbe
Weise werden die jeweiligen Sprachparameter anderer Worte in der anderen zyklischen Speicheranordnung der Magnettrommel
- 20 -
109835/09Λ5
aufgezeichnet. Die Anzahl der Worte M, die im Multiplex in derselben zyklischen Speicheranordnung der Magnettrommel
wie vorstehend beschrieben aufgezeichnet werden kann, ist durch die Rahmenperiode von 15 ms und die Bitzahl
der Magnettrommel begrenzt.
In der folgenden Beschreibung wird auf eine Magnettrommel zur Aufzeichnung von Sprachparametern Bezug genommen,
die eine Umdrehungsperiode von 20 ms, eine Bitgeschwindigkeit von 2048 kHz, eine Bitzahl «Je Spur von 40960 Bits
und 800 Spuren aufweist. Weiterhin wird angenommen, daß jeder Block in der zyklischen Speicheranordnung 64 Bit
enthält. (Obgleich die Größe des Blocks 73 55 Bit betragen kann, was der Größe eines Satzes von Sprachparametern entspricht,
sind zum Zweck der Erläuterung 64 Bit gewählt worden.) In diesem Fall beträgt die Zahl M der Wörter 480,
und wenn eine Wortlänge von etwa 2 s angenommen wird, würde
N etwa 133 betragen. Im Fall einer Wortlänge von 2 s ist es unmöglich, in einer einzigen Spur alle Sprachparameter
aufzuzeichnen, welche die zyklische Speicheranordnung gemäß Fig. 8 darstellen. Infolgedessen werden in diesem Fall die
Spuren bei jeder 20 ms dauernden Umdrehung der Trommel der Reihe nach weitergeschaltet, so daß eine lange zyklische
Speicheranordnung der in Fig. 8 dargestellten Art mit einer Anzahl von Spuren gebildet wird. Mit anderen Worten
wird in diesem Fall ein Wort von 2 s Länge in 100 Spuren gespeichert, die der Reihe nach weitergeschaltet werden.
Genauer gesagt, damit die Spuren einer Magnettrommel mit einer Drehperiode von 20 ms zur alle 15 ms erfolgenden
Aufzeichnung der Reihe nach weitergeschaltet werden können, und um zu gewährleisten, daß die zyklische Speicheranordnung
perfekt zyklisch ist, sollte die Dauer des Worts ein gemeinsames Vielfaches von 20 ms und 15 ms sein. Aus diesem Grund
wird in der folgenden Beschreibung angenommen, daß ein Wort mit einer Dauer von 1,98 Sekunden auf 99 Spuren aufgezeichnet
werden soll, die der Reihe nach weitergeschaltet
- 21 -
109835/0945
werden. In diesem Fall ist die Zahl N gemäß Fig. 8 gleich
132. Wenn die Zahl der Spuren 8OO beträgt, können 8
zyklische Speicheranordnungen (Fig. 8) gebildet werden. Da, wie erwähnt, die Anzahl der Worte M, die in Multiplex
in einer zyklischen Speicheranordnung (mit 99 Spuren) aufgezeichnet werden, 480 Worte beträgt, ist es möglich,
Sprachparameter der Worte mit einer Gesamtzahl von 480 χ
= j584o in acht zyklischen Speicheranordnungen aufzuzeichnen.
Die Sprachparameter jedes Worts werden gemäß Fig. 8 zyklisch von links nach rechts durch Wiedergabe-Schaltkreise herausgelesen,
von denen je einer für jede zyklische Speicheranordnung vorgesehen ist. Genauer gesagt, erscheinen bei der
zyklischen Speicheranordnung 1 die Sprachparameter des ersten Satzes, bestehend aus den Worten "1", "2", ... "48θ" der
Reihe nach im Wiedergabekreis innerhalb einer Rahmenperiode, d.h. in 15 ms. Hierauf erscheinen der Reihe nach die Sprachparameter
des zweiten Satzes mit den Worten "1", "2", "48o". Auf die gleiche Weise werden aufeinanderfolgende
Sätze von Sprachparametern nacheinander wiedergegeben . Im Fall einer Wortlänge von 1,98 s ist ein Arbeitszyklus
beendet, wenn die Sprachparameter der Worte des einhundertzweiunddreißigsten
Satzes erscheinen.
Die Ausführungsform gemäß Fig. 7 weist eine Magnettrommel zur Aufzeichnung der jeweiligen Sprachparameter der betreffenden
Worte in zyklischer Speicheranordnung gemäß Fig. 8 sowie Spurwähl-Matrizen 61-1 ... 61-8 zum Umschalten der
Spuren der Magnettrommel 6O bei jeder Umdrehung derselben auf, um acht zyklische Speieheranordnungen mit jeweils einer
Periode von 1,98 s zu bilden. Jede Matrix ist für 99 Spuren vorgesehen, und die Ausgangssignale von den Spurwähl-Matrizen
werden über Lese-Verstärker 62-1 bis 62-8, die jeweils eine entsprechende Impulsformschaltung aufweisen, Reihen-Parallel-Wandlern
63-1 bis 63-8 zugeführt. Die aufeinanderfolgend
- 22 -
109835/0945
herausgelesenen Sprachparameter werden durch die Wandler 63-1 bis 63-8 in Sätze paralleler Signale aus jeweils
55 Bit . umgewandelt.und dann in Parameter Pufferspeicher
64-1 bis 64-8 eingeschrieben, welche jeden Satz von 55 Bit der Sprachparameter je Wort in der jeweiligen zyklischen
Speicheranordnung zu speichern vermögen. Jeder Parameter-Pufferspeicher weist eine Lese-Einschreib-Steuerschaltung
auf und besitzt im allgemeinen zwei Ebenen zum gleichzeitigen Einschreiben an der einen und Lesen an der anderen Seite.
Die selektiv aus den Parameter-Pufferspeichern herausgelesenen Sprachparameter werden dann einem vorher beschriebenen
Digital-Sprachfrequenzgenerator 65 eingespeist, und die von diesem in PMC-^Form (Pulszahlenmodulation) gelieferten
Sprachsignale werden in einen für jeden Ausgangskanal vorgesehenen Ausgangs-Pufferspeicher 66 eingeschrieben, wo
sie während einer Rahmenperiode von 15 nis gespeichert werden.
Ähnlich den Parameter-Pufferspeichern 64-1 bis 64-8 weist der ÄBgangs-Pufferspeicher 66 zwei Ebenen sowie eine Lese-Einschreib-Steuerschaltung
auf. Der Speicher 66 liefert einem Digital-Analog-Wandler 67 PCM-Code einen jedem
Ausgangssignal entsprechenden Teil, um diese PCM-Code in
PAM (Impuls-Amplitudenmodulation)-Signale umzuwandeln. Das Ausgangssignal dee Wandlers 67 wird über PAM-Gatter
68-1 bis 68-64, von denen je eines für jeden Ausgangskanal vorgesehen ist, Tiefpaßfiltern 69-I bis 69-64 eingespeist,
um in ein kontinuierliches Sprachwellensignal umgewandelt zu werden. Außerdem ist ein Eingangssteuerkreis 71 vorgesehen,
der an den elektronischen Rechner angeschlossen ist und Informationen bezüglich der Wortzahl der an jeden
Ausgangskanal anzulegenden Worte empfängt. Um den Signalfluß von den Parameter-Pufferspeichern 64-1 bis 64-8 zu den
für jeden Ausgangskanal vorgesehenen PAM-Gattern 68-1
bis 68-64 auf Zeitmultiplex-Basis zu steuern, ist eine
Programmsteuerung 72 vorgesehen. Weiterhin ist eine Wort-Synchronisierungseinrichtung
70 zu» Gewährleistung eines
- 23 -
109835/0946
Befehls nach einer Übertragung an den Rechner und zur Bestimmung der Einschreibadresse in den Parameter-Pufferspeichern
64-1 bis 64-8 vorgesehen. Obgleich neben der Wort-Synchronisierungseinrichtung 70 noch eine Lese-Einschreib-Steuerung
für die Magnettrommel vorgesehen sein muß, ist diese in Fig. 7 nicht dargestellt.
Die Magnettrommel· 60, die Matrizen 61-1 bis 61-8, die Leseverstärker 62-1 bis 62-8 und die Serien-Parallelwandler
63-I bis 63-8 gemäß.Fig. 7 können herkömmliche
Einrichtungen sein, wie sie üblicherweise in Digitalrechnern
verwendet werden. Weiterhin können die Pufferspeicher 64-1 bis 64-8 und der Ausgangs-Pufferspeicher 66
Magnetkernspeicher sein, wie sie verbreitet in gewöhnlichen elektronischen Rechnern als Hauptspeicher verwendet werden.
Außerdem können auch der Digital-Analog-Wandler 67, die
PAM-Gatter 68 und die Tiefpaßfilter 69 herkömmliche Einrichtungen sein, wie sie üblicherweise in PCM-Übertragungssystemen
verwendet werden.
Im folgenden sind die Einzelheiten der Wort-Synchronisierungs einrichtung 70, des Eingangs-Steuerkreises 71 und der
Programmsteuerung 72 erläutert.
Fig. 9 zeigt ein Beispiel für den Aufbau der Wort-Synchronisierdnrichtung
70. Zwei an der linken Seite von Fig. 9 dargestellte Eingangssignale TIMING und MARK stellen die
Steuersignale dar, die auf bestimmten Spuren des Magnettrommelspeichers 60 gespeichert wurden. Das Zeitdiagramm
dieser Steuersignale ist in Fig. 10 dargestellt, wonach das Signal Del jeder vollen Umdrehung der Magnettrommel
erzeugt wird, während das Signal MARK den Block 73 markiert,
welcher einem Satz von Sprachparametern gemäß Fig. 8 entspricht. Bei dem in Fig. 8 dargestellten Ausführungsbeispiel
enthält jeder Block 64 Bits, so daß ein Satz von Sprachparametern mit 55 Bits in einem Block aufgezeichnet werden
109835/0945 - 24 -
kann. Ein in Fig. 10 dargestelltes anderes, mit TAKT bezeichnetes Signal stellt die Bitposition auf der
Magnettrommel dar und ist beim vorliegenden AusfUhrungsbeispiel eine Impulsfolge mit einer Frequenz von 2048 kHz.
Da, wie erwähnt, nacheinander auf die Spuren umgeschaltet werden muß, um bei jeder Drehung der Magnettrommel die
darauf aufgezeichneten Informationen herauszulesen, werden die TAKT-Signale bei der Schaltung gemäß Fig. 9 durch
einen 99-Schritt-Zähler 75 gezählt, um sie so zu entschlüsseln, daß eine abzulesende Spur ausgewählt wird. Das
Auegangssignal eines Dekoders 74 wird parallel an entsprechende Spurwahl-Matrizen 61-1 bis 61-8 angelegt. Ein
durch den Zähler 75 erzeugtes überlaufsignal 78 bedeutet,
daß die Periode von 1,98 s abgelaufen ist und wird dazu benutzt, einen Übertragungs-Befehl bzw. ein entsprechendes
Signal zum Rechner zu senden. Bei Empfang dieses Signals beginnt der Rechner die vorgesehenen, auf den betreffenden
Ausgangskanälen auszusendenden Wortinformationen zu übertragen. Die MARK-Impulse werden dagegen für die Anzeige der
Adressen zum Einschreiben von Sprachparametern gezählt, die der Reihe nach von der Magnettrommel gelesen werden und
den entsprechenden Parameter-Pufferspeicher eingeschrieben werden. Da, wie erwähnt, beim Ausführungsbeispiel gemäß
Fig. 8 M - 480 ist, werden die MARK-Impulse durch einen 48O-SchritteZähler 76 gezählt, wobei die resultierenden,
gezählten Werte zur Anzeige der Einschreibadressen der betreffenden Pufferspeicher benutzt werden. Da außerdem
Jeder Parameter-Pufferspeicher zwei Ebenen besitzt, muß eine einzuschreibende Fläche bestimmt werden. Zu diesem
Zweck ist ein Flip-Flop 77 vorgesehen, der das vom 480-Schritt-Zähler 76 gelieferte Überlaufsignal 79 empfängt,
und jedesmal die Polarität seines Auegangssignals umkehrt, wenn der Zähler 76 in 15 ms bis zu 480 MARK-Impulse zählt,
um die Ebene anzuzeigen, in welche die Information eingeschrieben werden soll. nc
109835/0945
.25- 205051?
Pig. 11 zeigt ein Beispiel für den Aufbau der Programmsteuerung
72 und Fig. 12 veranschaulicht das Zeitverhältnis zwischen den verschiedenen Signalen in Flg. 12. Die Programmsteuerung
72 wird durch ein von der Magnettrommel geliefertes TAKT-Signal mit einer Frequenz von 2048 kHz
betätigt, welches durch einen 4 Schritte umfassenden Zähler 80 in ein Signal 87 mit einer Frequenz von 512 kHz
umgewandelt wird. Dieses Signal 87 wird einer Zählerschaltung
aufgeprägt, die einen Zähler 84 mit 64 Schritten und
einen Zähler 85 mit 120 Schritten in Kaskadenschaltung aufweist, wobei der Inhalt dieser Zähler die Adresse des
zu diesem Zeitpunkt abzulesenden Ausgangs-Pufferspeichers angibt. Die Adresse wird zum Pufferspeicher 66 übertragen, . ä
um den dieser Adresse entsprechenden Inhalt herauszulesen, und der gelesene Inhalt wird durch den Analog-Digital-Wandler
67 in ein Analogsignal umgewandelt. Zu diesem Zeitpunkt entschlüsselt ein Dekodierer 86 das Atqgangssignal
des 64-Schritt-Zählers 84 zur Erzeugung von Signalen
G-1 bis G-64 zum Ansteuern, d.h. zum Durchschalten der
PAM-Gatter 68-1 bis 68-8 in den Ausgangskanälen, und zwar in den Zeitverhältnissen gemäß Fig. 12. Auf diese Weise wird
das aus dem Ausgangs-Pufferspeicher 66 herausgelesene und durch den Wandler 67 in Analogform umgewandelte Signal zu
dem durch den Zähler 84 bestimmten Ausgangskanal übertragen. Das Ausgangs-Signal 87 des 4-Schritt-Zählers 80 wird einer
Zählerschaltung eingespeist, die aus einem 120-Schritt- %
Zähler 81 und einem 64-Schritt-Zähler 82 besteht, welche
in Kaskade geschaltet sind. Die Inhalte dieser Zähler zeigen die Adresse an, in welche die zu diesem Zeitpunkt durch
den Fiequenzgenerator 65 aufgebauten PCM-Code im Ausgangs-Pufferspeicher
66 eingeschrieben werden sollen. Gemäß Fig. wird das Überlaufsignal 88 des 120-Schritt-Zählers 81
alle 254 ms erzeugt und dem nachgeschalteten 64-Schritt-Zähler
82 eingespeist. Außerdem wird das Signal 88 zum Anstoßen des Eingangs-Steuerkreises 71 benutzt.
- 26 -
109835/0945
Das überlaufsignal 89 des 64-Schritt-Zählers 82, das
alle 120 »64 kHz & 15 ms erzeugt wird, wird einem
Flip-Flop-^ zugeführt, dessen Binärausgang anzeigt, in welche der beiden Ebenen des Ausgangs-Pufferspeichers
66 eingeschrieben oder welche gelesen werden soll. Das Ausgangs-Signal 87 des 4-Schritt«Zählers 80 wird dem
Frequenzgenerator 65 aufgeprägt und betätigt ihn im Oleichlauf mit dem Einschreib« und Lesevorgang am Ausgangs-Pufferspeicher
66.
Fig, 15 zeigt ein Beispiel für den Aufbau des Eingangs-Steuerkreises
71· Wenn durohdas Uberlaufsignal 78 ein Übertragungsbefehl von der Wort-Synchronisiereinrichtung
70 zum Rechner übertragen wird, werden Informationen, welche die Wortzahlen der zu den betreffenden Ausgangskanälen
CH-1 bis CH-64 zu sendene?nformationen bestimmen, vom Rechner
übertragen und vorübergehend in den betreffenden Ausgangskanälen entsprechenden Registern 93-1 bis 93-64 gespeichert.
Nach Ablauf der Wortlänge von 1,98 gibt die Wort-Synchronisiereinrichtung
70, wie vorher erläutert, ein Befehlsignal an den Rechner ab, doch wird das Signal 78 auch den im
Eingangssteuerkreis 71 vorgesehenen Gattern 92 als Durchlaßsignal
eingespeist, wodurch der Inhalt von Registern in Register 9I-I bis 91-64 übertragen wird. Wie erwähnt,
liefert die Programmsteuerung 72 alle 234 Mikrosekunden
ein Start-Signal 88 an den Eingangssteuerkreis 71» wobei dieses Zeitintervall von einem 64-Schritt-Zähler 95 gezahlt
wird. Der Inhalt des Zählers 95 wird durch einen Dekodierer 94 entschlüsselt, welcher Durchlaß-Signale 96-I bis 96-64
für Gatter 90-1 bis 90-64 erzeugt* Beim Durchschalten der Gatter 90-1 bis 90-64 werden die Inhalte der Register 91
nacheinander als gelesene Adressen in Intervallen von 234
Mikrosekunden auf die Parameter-Pufferspeicher übertragen, um diese abzulesen. Wenn bei Annahme einer Wortlänge von
1,98 s die Inhalte der einzelnen Register 91 132-mal (132 Rahmen) zum Parameter-Pufferspeicher übertragen werden,
- 27 -109835/09^5
werden die Informationen zur Bestimmung des nächsten Worts, die vom elektronischen Rechner übertragen wurden und in den
entsprechenden Registern 93 gespeichert sind, durch das
durch die Wort-Synchronisiereinrichtung 70 zu diesem Zeitpunkt erzeugte Signal 78 in die Register 91 übertragen.
Die vorstehend beschriebenen Vorgänge werden im Gleichlauf mit der Wort-Dauer wiederholt.
Gemäß Fig. 7 werden die aus der Magnettrommel 6O herausgelesenen
und in jedem Satz in parallele Signale umgewandelten Sprachparameter in die Adressen der betreffenden
Parameter-Pufferspeicher 64-1 bis 64-8 eingeschrieben, welche je Satz den acht zyklischen Speicheranordnungen
entsprechen. Polglich besitzt jede Adresse dieser Speicher 64-1 bis 64-8 jeweils 55 Bit für einen Satz von Sprachparametern.
Selbstverständlich wird der vorstehend beschriebene Vorgang für die acht zyklischen Speicheranordnungen
parallel durchgeführt, so daß ein Satz von Sprachparametern, welcher ein Wort von 384o Worten betrifft,
auf die vorher beschriebene Weise in die Parameter-Pufferspeicher 64 eingeschrieben wird. Dieser Einschreibvorgang
in die Parameter-Pufferspeicher wird mit einer Rahmenperiode von 15 ms beendet. Sodann beginnt ein Lesezyklus für die
Parameter-Pufferspeicher 64 für jeden Ausgangskanal. Während des Ablaufs dieses Lesezyklus werden die Sprachparameter
für die nächste Rahmenperiode, die aus der Magnettrommel herausgelesen wurden, in die andere Ebene der Parameter-Pufferspeicher
64 eingeschrieben, die, wie erwähnt, zwei Ebenen aufweisen. Während des Lesezyklus werden die
Inhalte der Register 91-1 bis 91-8 des Eingangssteuerkreises 71 entsprechend der Reihenfolge der Ausgangskanäle
unter der Steuerung durch das Signal 88 von der Programmsteuerung 72 zu Parameter-Pufferspeichern übertragen,
um die Inhalte (Sprachparameter eines Satzes) der Adressen der Parameter-Pufferspeicher 64 herauszulesen, wobei die
herausgelesenen Inhalte zum Sprach-Prequenzgeneraltor 65
- 28 109835/09Λ5
~ 28 -
gesandt werden· Wie vorstehend im einzelnen erläutert,
bewirkt der Frequnezgenerator ξ>5 bei Empfang der herausgelesenen
Inhalte eine Zusammenstellung von PCM-Sprachkoden,
beispielsweise 120 PAM-Teilen, die innerhalb einer Rahmenperlode
erzeugt werden sollen· Diese zusammengestellten Code werden nacheinander In Adressen des Ausgangs-Pufferspeiohers
66 gespeichert, wobei diese Adressen durch den 120-Sohritt-Zähler 81, den 64-Schritt-Zähler 82 und das
Flip-Flop 83 der Kanal-Programmsteuerung 72 angezeigt werden.
Jede Adresse des Ausgänge-Pufferspeichers 66 weist beispielsweise
8 Bit auf, was für die Speicherung eines Satzes von PCM-Sprachkoden ausreicht. Dieser Vorgang wird in einer 1/64
eines Rahmens (12 ms) bzw. 2^4 MikroSekunden entsprechenden
Zeitspanne durchgeführt. Infolgedessen wird dieser Vorgang während einer Rahmenperiode für 64 Ausgangskanäle auf
Zeltmultiplex-Basis durchgeführt. Auf diese Weise werden
während einer Rahmenperiode bzw, innerhalb von I5 ms 120
PCM-Codetelle für Jeden Auegangskanal in die den jeweiligen Ausgangskanälen der Auegangs-Pufferspeieher entsprechenden
Adressen eingeschrieben· Die Inhalte des Ausgangs-Pufferspeichers 66 werden auf Zeitmultiplex-Basis unter der Steuerung
der Programmeteuerung 72 im Oleichlauf mit den Gatter-Signalen
G-I bis 0-64 der PAM-Oatter 68-1 bis 68-64 der entsprechenden
Ausgangsknäle herausgelesen. Die gelesenen
Signale werden durch den Digital-Analog-Wandler 67 in PAM-Signale umgewandelt, die über entsprechende Tiefpaßfilter
69 als kontinuierliche Sprachwelle bzw. Sprachband auf die Ausgangskanäle übertragen werden.
Eine Reihe der vorstehend beschriebenen Arbeitsvorgänge wird
- 29 -
109835/0945
mit der Rahmenperiode von 15ms wiederholt, um äne der
Wortdauer entsprechende Sprachwelle für die betreffenden Ausgangskanäle zu erzeugen. Die Wortzahlen der das nächste
Mal zu behandelnden Wörter sind bereits durch das Überlauf-Signal 78 der Wort-Synchronisiereinrichtung 70 vor Beginn
der Behandlung der nächsten Wörter vom Rechner zu den Registern 93 des Eingangs-Steuerkreises 71 übertragen worden·
der Wortdauer
Durch Wiederholung dieser Arbeitsgänge mit einer/ entsprechenden Periode von beispielsweise 1,98 s werden zusammengestellte
Ton- bzw· Hörsignal-Nachrichten an die betreffenden Ausgangskanäle übertragen.
Obgleich beim vorstehend beschriebenen Ausführungsbeispiel der Ton- bzw« Sprachsignale verarbeitenden Vorrichtung eine
Magnettrommel als Speicher für die Sprachparameter benutzt wird, kann ersichtlicherweise jede andere Art von Speicher
benutzt werden, solange dieser die Sprachparameter in Form von zyklischen Speicheranordnungen aufzuzeichnen vermag.
Im folgenden 1st eine weitere Ausführungsform der eine Magnettrommel
als Speicher für Sprachparameter verwendenden erfindungsgemäßen Vorrichtung beschrieben. Im Unterschied zur
ersten Ausführungsform, bei welcher die aus den jeweiligen Wörtern extrahierten Sprachparameter in Intervallen auf den
Spuren einer Magnettrommel aufgezeichnet wurden, werden bei dieser Abwandlung die Sprachparameter kontinuierlich aufgezeichnet,
und zwar beginnend mit einer bestimmten Adresse. Genauer gesagt, wird jedes Wort kontinuierlich ohne jede
Überlappung in I32 Blöcken aufgezeichnet, falls die Dauer
jedes Worts z.B. 1,98 s beträgt, und zwar beginnend mit der ersten Adresse der Trommel, die für jedes Wort vorbestimmt ist.
Wenn die Wortzahlen der den Ausgangskanälen zuzuführenden Wörter vom elektronischen Rechner übertragen werden, werden
Sprachparameter, die jeweils aus 132 Sätzen bestehen, für die
- 30 -
109835/09k5
m 30 -
an den Ausgangskanälen vorgesehenen Wörter aus der Magnettrommel herausgelesen und im Parameter-Pufferspeicher
gespeichert. Danach wird auf dieselbe Weise wie bei der zuerst beschriebenen Ausführungsform das Sprachsignal für
Jeden Rahmen zusammengesetzt, im Ausgang-Pufferspeicher gespeichert und als kontinuierliches Sprachsignal für das
vorgesehene Wort über den Digital-Analog-Wandler, das PAM-Gatter und das Tiefpaßfilter dem Ausgangskanal zugeführt.
Pig, 14 zeigt eine weitere Ausführungsform der Erfindung mit
einer Magnettrommel 6O zur Speicherung von Sätzen von Sprachsignalen für die betreffenden Wörter, einem Parameter-Pufferspeicher
98 zur vorübergehenden Speicherung der Sprachparameter der selektiv aus der Magnettrommel 60 herausgelesenen
Sprachparameter, einem Eingangssteuerkreis 100 zur Speicherung der vom Rechner übermittelten Informationen
zur Bestimmung der Wortzahl und zur Übermittlung der herausgelesenen Adresse zum Parameter-Pufferspeicher 98 zu jedem
festgelegten Zeitpunkt und einer auf die Befehle des Eingangssteuerkreises 100 ansprechenden Magnettrommelsteuerung
97 zum Lesen des Inhalts aus der Magnettrommel 60 und zum Einschreiben desselben in den Parameter-Pufferspeicher 98.
Diese abgewandelte Ausführungsform weist weiterhin einen Sprach-Frequenzgenerator 65 zum Aufbau einer Sprache(aus
120 Teilen) von einem Rahmen (I5 ms) aus einem Satz von
aus dem Parameter-Pufferspeicher 98 herausgelesenen Sprachparametern
auf. Dieser Frequenzgenerator weist Digitalfilter zum Zusammensetzen der Sprachsignale auf Zeitmultiplex-Basis
für jeden Ausgangskanal, einen Ausgangs-Pufferspeicher 66 zur vorübergehenden Speicherung einer Gruppe von dem durch den
Frequenzgenerator 65 aufgebauten Sprachsignal entsprechenden PCM-Coden, einen Digital-Analog-Wandler 67 zur Umwandlung
109835/0945
der aus dem Ausgang-Pufferspeicher herausgelesenen Digitalcode
in Analogsignale, PAM-Gatter 68-1, 68-2 ... 68-64 zur Verteilung der vom Wandler 67 gelieferten Analogeignale
auf die verschiedenen Ausgangekanäle CH-1, CH-2 ... CH-64,
Tiefpaßfilter 69-I, 69-2 ... 69-64 zur Umwandlung der
Ausgangssignale der jeweiligen PAM-Gatter in eine kontinuierliche Welle bzw. ein kontinuierliches Bandsignal sowie eine
Programmsteuerung 99 zur Steuerung der verschiedenen vorstehend beschriebenen Bauteile auf.
Von diesen Bauteilen sind die Magnettrommel 6O, der Parameter- ™
Pufferspeicher 98, der Ausgang-Pufferspeicher 66, der Wandler 67, die PAM-Gatter 68 und die Tiefpaßfilter 69 ebenfalls
herkömmliche Geräte, wie sie verbreitet in elektronischen Rechnern und in PCM-Ubertragungaeystemen verwendet werden.
Die Magnettrommelsteuerung 97 entspricht praktisch einer herkömmlichen Magnettrommel-Kanalvorrichtung. Bei herkömmlichen
Rechnern müssen zum Herauslesen aus der Magnettrommel mittels einer Magnetirommel-Kanallesevorrichtung und zur Speicherung
der gelesenen Information im Hauptspeicher, welcher dem Parameter-Pufferspeicher 98 gemäß Fig. 14 entspricht, gewisse
Einrichtungen vorgesehen sein, um die Adresse an die Magnettrommel-Kanallesevorrichtung
zum Ablesen der Trommel, die Λ Anzahl der Wörter und das Einschreiben der Adresse des
Hauptspeichers zu geben, doch ist bei der Magnettrommel-Steuerung 97 gemäß Fig. 14 die Anzahl der herauszulesenden
Wörter konstant gleich 152 Wörtern je Spracheinheit mit
einer Länge von 1,98 s, was durch die Dauer der Spracheinheit bestimmt wird, und ändert eich die Einschreib-Adresse des
Parameter-Pufferspeichers regelmäßig, so daß es nicht nötig ist, diese Werte durch den Eingangs-Steuerkreis 100 zu bestimmen.
Die Programmsteuerung 99 entspricht praktisch der
- 52 10Ö835/084S
Programmsteuerung T2 der ersten AuefUhrungsfarm, nur mit
dem Unterschied, dafl »1« durch unabhängige Takt signale
gesteuert wird« d.lu mit anderen Worten» nicht mit der
Drehung dir Magnetroranel synchronisiert wird·
Flg. 15 fctlgt dl· Einzelheiten de« EingangB-Steuerkrelees
100· Die Vom Rechner übermittelten Informationen zur Bestimmung
der an die einzelnen Ausgangskanäle zu sendenden Wörter werden in Regietern 104·1, 104-2 ... 104-64 gespeichert«
welche den betreffenden Ausgangekanälen CH entsprechen. Die übertragung dieser Informationen zu Registern 102-1
bis 102*64 erfolgt über Gatter 10>1 bis 10>64, die durch
ein überlaufsignal 111 betätigt werden, welches auch als
übertragungsbefehlssignal für den Rechner dient und durch
einen 132-Sohritt-ZIChler 108 mit einer Periode entsprechend
der Wortdauer erzeugt wird. Diese Informationen werden nacheinander
In der Reihenfolge der Register 102-1 bis 102-64 zur Magnettrommel-Steuerung 97 übertragen« wodurch letztere
abgelesen wird· Die Sl|HaTe 88 des Eingangs-Steuerkreisea,
die von der Programrasteuerung 99 In einem Intervall von 2^4
MikroseJcunden ausgesandt werden, werden durch einen 152-Schritt-ZMhXer
105 und einen 64-Sohritt-Zähler 106 gezählt. Der
Inhalt de» 64-3ohritt-Zahlere 106 wird durch einen Dekodierer
112 entschlüsselt, der Signale 110-1 bis 110-64 an Gatter
101-1 bis 101-64 abgibt, wodurch diese jeweils etwa 30 ms
lang auf Durchlaß geschaltet werden und die Inhalte der Register 102 nacheinander an die Magnettrommel-Steuerung 97
übertragen· Alle Parameter eines durch die Inhalte der Register 102 bestimmtenWorte müssen während der Wortdauer,
d.h. innerhalb von 1,98 s, gelesen und im Parameter-Pufferspeicher
98 gespeichert werden« Da jedoch eine Nagnettrommel
im allgemeinen eine vergleiobjnreise lange Zugriffezelt hat,
dauert es maximal 25 ms, bit die das Wort bestimmende
InformaUan voa Eineana*steuerkreis 100 zur Magnettrommel-Steuerung
97 übermittelt wird tnd alle Parameter der Worte
- 33 -
herausgelesen werden, um sie im Parameter-Pufferspeicher
zu speichern. Da die Gatter 101 jeweils 50 ms lang auf Durchlaß geschaltet sind, steht genügend Zeit zum Ablesen
der Magnettrommel 60 zur Verfügung.
Die Startsignale 88 des Eingangssteuerkreises werden ebenfalls durch einen 64-Schritt-Zähler 107 und 152-Schritt-Zähler
108 gezählt und die Inhalte dieser Zähler werden zum Parameter-Pufferspeicher 98 als Adresse für diesen
übermittelt, um zu diesem Zeitpunkt abgelesen zu werden. Da das Einschreiben der Sprachparameter von der Magnettrommel
60 und das Lesen der den Eingangssteuerkreis bestimmenden Adresse parallel erfolgen, ist der Parameter-Pufferspeicher
98 wie bei der zuerst beschriebenen Ausführungsform mit zwei Ebenen versehen. Zur Auswahl einer dieser Ebenen ist ein
Flip-Flop 109 vorgesehen, das die Polarität des Ausgangssignals in Abhängigkeit vom Überlaufsignal 111 des 152-Schritt-Zähiers
I08 umkehrt.
Während der Zeitspanne, in welcher die Magnettrommel 60 durch den Inhalt der Register 102 abgelesen wird, werden
die vom Rechner zur Bestimmung der nächsten Wörter übermittelten Informationen empfangen und in den Registern 104
gespeichert. Auf diese Weise werden Informationen zur Bestimmung von Wörtern nacheinander vom Rechner empfangen,
um dabei verschiedene vorgesehene Tonfrequenz-Mitteilungen bzw. Informationen an die einzelnen Ausgangskanäle zu übertragen.
Selbstverständlich kann anstelle der Magnettrommel auch ein Magnetplattenspeicher zur Speicherung der Sprachparameter
benutzt werden.
Wie vorstehend erläutert, werden bei der erfindungsgemäßen Vorrichtung Sprachsignale als verdichtete Informationen
unter Verwendung von Tellautokorrelations-Koeffizienten als Parameter aufgezeichnet, so daß auf wirtschaftliche Weise eine
große Anzahl von Wörtern untergebracht und herausgelesen werden kann. Da außerdem nur ein einziger Digjfcal-Sprach-Frequenz-
109835/0945 -34
generator verwendet wird, kann ein einziger Frequenzgenerator gemeinsam für zahlreiche Ausgangskanäle, beispielsweise fUr
64 Kanäle, auf Zeitmultiplex-Basis verwendet werden, was äußerst wirtschaftlich ist.
Selbstverständlich soll die Erfindung keinesfalls auf die speziell dargestellten und beschriebenen Einzelheiten
beschränkt sein, da Innerhalb des Rahmens der Erfindung zahlreiche Änderungen und Abwandlungen möglich sind.
Zusammenfassend schafft die Erfindung eine Ton- bzw. Sprachsignale
verarbeitende Vorrichtung zur Speicherung von Sprachparametern mit Teilautokorrelations-Koeffizienten
zwischen jeweils zwei dichtnebeneinander liegenden Zeitpunkten
eines Sprachsignals, welche durch Unterdrückung der übrigen Komponenten von den tatsächlichen Sprachsignalpegeln der
beiden benachbarten Zeitpunkte erhalten werden, und zwar unter Berücksichtigung der zwischen den beiden Zeitpunkten
liegenden Abtastpegel und einer Information bezüglich der Anregungsquelle, die anhand der abgetasteten Werte an
voneinander entfernten Zeitpunkten bestimmt wird. Diese Vorrichtung weist einen Speicher zur Speicherung der Sprachparameter,
Leseeinrichtungen zum Lesen von Sprachparametern aus dem Speicher, die durch einen elektronischen Rechner
bestimmt werden, und einen Sprach-Normal-Frequenzgenerator zur Rekonstruktion des Sprachsignals aus dem Ausgangssignal
der Leseeinrichtung auf. Der Frequenzgenerator besteht aus sehr schnell arbeitenden logischen Elementen und setet
Mehrkanal-Tonfrequenz-Ausgangssignale auf Zeitmultiplex-Basis zusammen.
109835/0945
Claims (1)
- 'l;l" 1J! rii|;" ""f" ; 811- 55 -PatentansprücheVorrichtung zur rVerar&eltisig von fön- bzw· Spraohslgnalen, dadurch gekennseelchnet, daß sie Einrichtungen zur vorübergehenden Speicherung von Spraohparametem aufweist, zu denen Teilautokorrelations-Koeffizienten zwischen jeweils zwei dicht nebeneinander liegenden Zeltpunkten eines gewünschten Antwort-Sprachsignals, welche für mehrere Abtast-Zeltpunkte bestimmt werden und die Korrelation des Differenzwerts zwischen nach der Methode des kleinsten Quadrate aus den abgetasteten Werten zwischen diesen beiden Zeitpunkten vorherbestimmten Fehlerwerten und den tatsächlichen Werten des Sprachsignals zu den beiden Zeitpunkten darstellen, sowie Informationen bezüglich der Anregungsquelle gehören, welche durch Bestimmung der Autokorrelation zwischen weiter voneinander entfernten, abgetasteten Werten erhalten werden, und daß ein elektronischer Rechner zur Lieferung eines Befehlssignals zur Bestimmung der Sprachparameter eines zusammen zusetzenden Sprachsignale, eine Einrichtung zum Lesen der durch das Befehlssignal bestimmten Sprachparameter aus den Speiehereinrichtungen sowie ein Sprach-Normal-Prequenzgenerator vorgesehen sind, der auf das Ausgangssignal der Leseeinrichtung zum Zusammensetzen eines gewünschten Sprachsignals anspricht.2. Vorrichtung nach Anspruch 1, gekennzeichnet durch einen einen Autokorrelationskoeffizient-Sxtraktor aufweisenden Sprachparameter-Extraktor mit mehreren in Kaskade geschalteten Teilautokorrelations-Koeffizient-Detektorstufen, von denen jede ein zum Empfangen eines Sprach-- 36 -109835/0945ffiWiflignala geechalteteB Veriögerungsnet«werk, ein KorvelationsleoeffiAient-Rechengerat zum Empfangen dee Ausgangseignals des Verzögerungsnetzwerks und sum unmittelbaren Empfangen des Sprachsignale, einen zum Empfangen des AusgangsaignalB des netiwerke und dec Ausgangs signal a vom Korrelat ionsicoeff lzient-Rechengerät geschalteten Multiplier, einen unmittelbar zum Empfangen des Auegangssignals des Korrelat lonskoeffizient-Rechengeräts und des Sprachsignale geschalteten Multiplier, ein Addierwerk zum Addieren des Ausgangesignals des Verzögerungsnet zvrerks und des Auegangseignals des zweitgenannten Multipliers, ein Addierwerk zum Addieren des Ausgangssignals des erstgenannten Multipliers und des Sprachsignals sowie einen Größenwandler bzw. Umsetzer zum Quantisieren des Auegangssignale des Korrelationskoeffizient-Rechengeräte zur Bestimmung eines Teilautokorrelations-Koeffizienten zwischen den beiden Zeitpunkten aufweist, mit einem an die eine Auegangsklemme der letzten Detektorstufe angeschlossenen Autokorrelator und mit einer Maxlmalwert-wahleinrichtung zur Bestimmung der Periode und Amplitude eines Informationen bezüglich einer Anregungsquelle enthaltenden Signals aus einer Gruppe von Ausgangssignalen des Autokorrelators.j5» Vorrichtung nach Anspruch 1, dadurch gekennzeichnet, daß der Sprachsignal-Frequenzgenerator einen Impulsgenerator und einlRfFuT°ifeißee Rauschen, die durch die Grundschwlngungs-Periode der Sprache angesteuert werden, einen mit den Generatoren verbundenen und durch die Information bezüglich der Grundschwlngungsamplltüde der Anregungsquelle gesteuerten Amplitudenregler sowie eine Einrichtungzur Steuerung des Ausgangssignals des ', Amplitudenreglers in Übereinstimmung mit dem durch den elektronischen Rechner bezeichneten Teilautokorrelations-Koeffizienten aufweist, welche das Sprachsignal durch10983S/0946 - 37 -die Korrelation zwischen einer Gruppe von Korrelationskoeffizienten rekonstruiert,4. Vorrichtung zur Verarbeitung von Ton- bzw. Sprachsignalen, gekennzeichnet durch eine Einrichtung zur Ableitung von Sprachparametern aus Teilautokorrelations-Koeffizienten und aus einer Information bezüglich der Anregungsquelle von bestimmten Sprachsignalen für mehrere zur Beantwortung benötigter Sprachsignale, eine Speichereinrichtung zur Speicherung der Sprachparameter, einen elektronischen Rechner zur Übermittlung eines Befehlssignals, welches die Sprachparameter für die betreffenden Ausgangskanäle , M bestimmt, um die Antworten mehreren Ausgangskanälen zuzuführen, mehrere Leseeinrichtungen zum Lesen der durch den Rechner bestimmten Sprachparameter aus der Speichereinrichtung, einen einzigen Sprach-Normal-Frequenzgenerator, der mehrere Sprachparameter-Sätze von den Leseeinrichtungen auf Zeltmultipiex-Basis empfängt und eine Gruppe von Digitalkoden bildet, welche entsprechende Sätze der bestimmten Sprachwelle von den Informationen bezüglich der Anregungsquelle darstellen und letzteren sowie den Teilautokorrelat ions-Koeffizient en der betreffenden Sätze der Sprachparameter entsprechen, eine Einrichtung zum Lesen einer Gruppe von Digitalkoden aus dem Sprach-Frequenzgenerator auf Zeitmultiplex-Basis und zum Umwandeln der Digitalkode ^ in impulsamplitudenmodulierte Signale, und eine Takt-Gattereinrichtung zur Verteilung der modulierten Signale auf mehrere Ausgangskanäle.. Vorrichtung nach Anspruch Kt gekennzeichnet durch eine zyklische Speichereinrichtung zur Speicherung der Sprachparameter einschließlich der Informationen bezüglich der Anregungsquelle und der Teilautokorrelations-Koeffizienten für mehrere Spracheinheiten einer vorbestimmten konstanten Länge, die zur Übermittlung einer Antwort benötigt werden,- 58 -109835/0945in mehreren zyklischen Speicheranordnungen, die jeweils in mehrere Rahmen unterteilt sind, durch einen Parameter-Pufferspeicher zur vorübergehenden Speicherung der Sprachparameter der aus der zyklischen Speichereinrichtung herausgelesenen Spracheinheit in den betreffenden Rahmen, durch einen Sprach-Frequenzgenerator mit rein digitalen logischen Einrichtungen, der auf die durch den elektronischen Rechner bestimmten und zur Beantwortung zu einer Anzahl von Ausgangskanälen zu übertragenden Spracheinheiten anspricht und die Informationen bezüglich der Anregungsquelle enthaltenen Signale entsprechend den Sprachlnformationen der Sprachparameter in Wechselbeziehung bringt, welche durch den Parameter-Pufferspeicher unter der Steuerung der Teilautokorrelations-Koeffizienten herausgelesen wurden, so daß die Sprachparameter in eine Gruppe von Digitalkoden umgewandelt werden, welche Wellenformen der betreffenden bestimmten Sprachsignale darstellen, durch einen Ausgangs-Pufferspeicher zur vorübergehenden Speicherung der Gruppe von Digitalkoden vom Sprach-Frequenzgenerator und durch eine Einrichtung zur Umwandlung der aus dem Ausgangs-Pufferspeicher herausgelesenen Digitalkode in Analogsignale.6. Vorrichtung nach Anspruch 4, gekennzeichnet durch eine Einrichtung zum Speichern von Sprachparametern, die jeweils eine Information bezüglich der Anregungsq^uelle und einen Teilautokorrelations-Koeffizienten betreffend mehrere für die Abgabe einer Antwort vorbestimmter Länge erforderlicher Spracheinheiten in unbesetzten Adressen eines Speichers, aurcn einen Parameter-Pufferspeicher zur vorübergehenden Speicherung der Sprachparameter einer Spracheinheit, welche aus einer Adresse im Speicher herausgelesen wurde und welche der durch den Speicher bestimmten und auf mehreren Auagangskanälen als Antwort abzugebenden Sprach-- 39 -109835/0945einheit entspricht, und durch eine Einrichtung zum aufeinanderfolgenden Lesen der Sprachparameter aus dem Parameter-Pufferspeicher und zum Eingeben der herausgelesenen Sprachparameter in den Sprach-Prequenzgenerator.109835/0945Leerseite
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP45010992A JPS527282B1 (de) | 1970-02-07 | 1970-02-07 | |
JP45010993A JPS5229121B1 (de) | 1970-02-07 | 1970-02-07 |
Publications (3)
Publication Number | Publication Date |
---|---|
DE2050512A1 true DE2050512A1 (de) | 1971-08-26 |
DE2050512B2 DE2050512B2 (de) | 1973-09-13 |
DE2050512C3 DE2050512C3 (de) | 1974-04-04 |
Family
ID=26346352
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE2050512A Expired DE2050512C3 (de) | 1970-02-07 | 1970-10-14 | Vorrichtung zur Ableitung von Sprachparametern und zur Erzeugung synthetischer Sprache |
Country Status (5)
Country | Link |
---|---|
US (1) | US3662115A (de) |
DE (1) | DE2050512C3 (de) |
FR (1) | FR2065978A5 (de) |
GB (1) | GB1318985A (de) |
SE (1) | SE361537B (de) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE2636032A1 (de) * | 1975-08-22 | 1977-02-24 | Nippon Telegraph & Telephone | Schaltungsanordnung zum extrahieren der grundfrequenz aus einem sprachsignal |
US4328008A (en) * | 1979-05-30 | 1982-05-04 | Texaco Development Corporation | Method for the production of cleaned and cooled synthesis gas |
Families Citing this family (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3816722A (en) * | 1970-09-29 | 1974-06-11 | Nippon Electric Co | Computer for calculating the similarity between patterns and pattern recognition system comprising the similarity computer |
US4074069A (en) * | 1975-06-18 | 1978-02-14 | Nippon Telegraph & Telephone Public Corporation | Method and apparatus for judging voiced and unvoiced conditions of speech signal |
US4344148A (en) * | 1977-06-17 | 1982-08-10 | Texas Instruments Incorporated | System using digital filter for waveform or speech synthesis |
US4209844A (en) * | 1977-06-17 | 1980-06-24 | Texas Instruments Incorporated | Lattice filter for waveform or speech synthesis circuits using digital logic |
CA1100641A (en) * | 1977-09-16 | 1981-05-05 | Akira Ichikawa | Multifrequency signal receiving system |
US4130729A (en) * | 1977-09-19 | 1978-12-19 | Scitronix Corporation | Compressed speech system |
JPS5919358B2 (ja) * | 1978-12-11 | 1984-05-04 | 株式会社日立製作所 | 音声内容伝送方式 |
US4479124A (en) * | 1979-09-20 | 1984-10-23 | Texas Instruments Incorporated | Synthesized voice radio paging system |
JPS5650397A (en) * | 1979-10-01 | 1981-05-07 | Hitachi Ltd | Sound synthesizer |
JPS5853358B2 (ja) * | 1980-03-31 | 1983-11-29 | 株式会社東芝 | 音声分析装置 |
JPS56140400A (en) * | 1980-04-03 | 1981-11-02 | Tokyo Shibaura Electric Co | Signal synthesizing circuit |
US4401855A (en) * | 1980-11-28 | 1983-08-30 | The Regents Of The University Of California | Apparatus for the linear predictive coding of human speech |
US4464784A (en) * | 1981-04-30 | 1984-08-07 | Eventide Clockworks, Inc. | Pitch changer with glitch minimizer |
US4378469A (en) * | 1981-05-26 | 1983-03-29 | Motorola Inc. | Human voice analyzing apparatus |
US4443859A (en) * | 1981-07-06 | 1984-04-17 | Texas Instruments Incorporated | Speech analysis circuits using an inverse lattice network |
US4398262A (en) * | 1981-12-22 | 1983-08-09 | Motorola, Inc. | Time multiplexed n-ordered digital filter |
US4544919A (en) * | 1982-01-03 | 1985-10-01 | Motorola, Inc. | Method and means of determining coefficients for linear predictive coding |
JPS5922165A (ja) * | 1982-07-28 | 1984-02-04 | Nippon Telegr & Teleph Corp <Ntt> | アドレス制御回路 |
ATE36206T1 (de) * | 1983-01-03 | 1988-08-15 | Motorola Inc | Verbessertes verfahren und mittel zur bestimmung von koeffizienten zur linearen vorhersagekodierung. |
US4581747A (en) * | 1984-03-05 | 1986-04-08 | At&T Bell Laboratories | Arrangement for equalizing the variable attenuation of a signal on a communication line |
US5315687A (en) * | 1986-03-07 | 1994-05-24 | Adler Research Associates | Side fed superlattice for the production of linear predictor and filter coefficients |
US5237642A (en) * | 1986-03-07 | 1993-08-17 | Adler Research Associates | Optimal parametric signal processor |
US5251284A (en) * | 1986-03-07 | 1993-10-05 | Adler Research Associates | Optimal parametric signal processor with lattice basic cell |
US5101432A (en) * | 1986-03-17 | 1992-03-31 | Cardinal Encryption Systems Ltd. | Signal encryption |
US5265217A (en) * | 1987-03-03 | 1993-11-23 | Adler Research Associates | Optimal parametric signal processor for least square finite impulse response filtering |
US5920842A (en) * | 1994-10-12 | 1999-07-06 | Pixel Instruments | Signal synchronization |
US5587910A (en) * | 1995-02-06 | 1996-12-24 | Rockwell International Corporation | Vehicle navigation system with non-overflow digital filter |
CA2459428A1 (en) * | 2004-03-03 | 2005-09-03 | Spotwave Wireless Inc. | Signal recognition in an on-frequency repeater |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3069507A (en) * | 1960-08-09 | 1962-12-18 | Bell Telephone Labor Inc | Autocorrelation vocoder |
US3209074A (en) * | 1961-06-06 | 1965-09-28 | Ibm | System for multiple output of spoken messages |
US3281789A (en) * | 1962-11-02 | 1966-10-25 | Frederick P Willcox | Multiple remote interrogated information system |
-
1970
- 1970-10-09 GB GB4806570A patent/GB1318985A/en not_active Expired
- 1970-10-09 US US79430A patent/US3662115A/en not_active Expired - Lifetime
- 1970-10-12 SE SE13744/70A patent/SE361537B/xx unknown
- 1970-10-14 DE DE2050512A patent/DE2050512C3/de not_active Expired
- 1970-10-14 FR FR7037183A patent/FR2065978A5/fr not_active Expired
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE2636032A1 (de) * | 1975-08-22 | 1977-02-24 | Nippon Telegraph & Telephone | Schaltungsanordnung zum extrahieren der grundfrequenz aus einem sprachsignal |
US4328008A (en) * | 1979-05-30 | 1982-05-04 | Texaco Development Corporation | Method for the production of cleaned and cooled synthesis gas |
Also Published As
Publication number | Publication date |
---|---|
SE361537B (de) | 1973-11-05 |
GB1318985A (en) | 1973-05-31 |
DE2050512B2 (de) | 1973-09-13 |
DE2050512C3 (de) | 1974-04-04 |
FR2065978A5 (de) | 1971-08-06 |
US3662115A (en) | 1972-05-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE2050512A1 (de) | Vorrichtung zur Verarbeitung von Ton bzw Sprachsignalen | |
DE2159848A1 (de) | System zur abschnittweisen Unter teilung von Sprach und Digitalsignalen und zur Herstellung gedruckter Texte | |
DE3222314C2 (de) | ||
DE2132004A1 (de) | Multiplex-Information-UEbertragungsanlage | |
DE2546446C3 (de) | PCM-Zeitmultiplex-System | |
DE1774941C3 (de) | Einrichtung zur Übertragung von Informationen zwischen zwei dynamischen Speichern. Ausscheidung aus: 1474025 | |
DE2617344C2 (de) | Verfahren zur Herstellung mehrerer, gleichzeitiger Konferenzverbindungen in einem Pulscodemodulation-Vermittlungssystem und Vorrichtung zur Durchführung des Verfahrens | |
DE2344340C3 (de) | Signalübertragungssystem insbesondere Stehbildübertragungssystem | |
DE2524063C3 (de) | Elektronisches Musikinstrument mit digitaler Musiktonerzeugung | |
DE69232964T2 (de) | Informationsansageeinrichtung | |
EP0010600B1 (de) | Verfahren zur codierten Übertragung von Sprachsignalen, Verwendung des Verfahrens in einem Zeitmultiplex-Übertragungssystem und Anordnung zur Durchführung des Verfahrens | |
DE2855151A1 (de) | Digitaler hoertongenerator | |
DE2535786A1 (de) | Tastenschaltersystem | |
DE2836736B2 (de) | Verfahren zur Aufzeichnung von beim Spielen eines tastenbetätigten Musikinstruments entstehenden Tonsignalen und den damit verbundenen Spielausdrücken, insbesondere der Lautstärke, entsprechenden Datensignalfolgen auf einem Aufzeichnungsträger und Vorrichtung zur Durchführung des Verfahrens | |
DE2836737B2 (de) | Verfahren zur Aufzeichnung von beim Spielen eines tastenbetätigten Musikinstruments entstehenden Tonsignalen entsprechenden Datensignalfolgen auf einem Aufzeichnungsträger | |
DE3129155A1 (de) | Datenkompressorsystem | |
DE3037276A1 (de) | Tonsynthesizer | |
DE2529420B2 (de) | Verfahren und vorrichtung zum abgeben von gespeicherten informationen in gesprochener form an fernsprechteilnehmer | |
DE2051589A1 (de) | Anordnung zur Synthese eines Signals | |
DE2826570C2 (de) | ||
DE2657430A1 (de) | Einrichtung zum synthetisieren der menschlichen sprache | |
DE3226600A1 (de) | Mit einem nachhalltonerzeugungsapparat ausgestattetes elektronisches musikinstrument | |
DE2335818C3 (de) | Elektrische Anordnung zur automatischen Erzeugung von gesprochenen Sätzen | |
AT311077B (de) | Einrichtung zur Synthetisierung von Audio-Informationen | |
DE2905080A1 (de) | Digitales zeitmultiplex-nachrichtenuebertragungssystem mit einzelkanal-kodierung/dekodierung |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C3 | Grant after two publication steps (3rd publication) | ||
E77 | Valid patent as to the heymanns-index 1977 | ||
8328 | Change in the person/name/address of the agent |
Free format text: KERN, R., DIPL.-ING., PAT.-ANW., 8000 MUENCHEN |
|
8327 | Change in the person/name/address of the patent owner |
Owner name: NIPPON TELEGRAPH AND TELEPHONE CORP., TOKIO/TOKYO, |