DE2050512B2 - Vorrichtung zur Ableitung von Sprachparametern und zur Erzeugung synthetischer Sprache - Google Patents
Vorrichtung zur Ableitung von Sprachparametern und zur Erzeugung synthetischer SpracheInfo
- Publication number
- DE2050512B2 DE2050512B2 DE2050512A DE2050512A DE2050512B2 DE 2050512 B2 DE2050512 B2 DE 2050512B2 DE 2050512 A DE2050512 A DE 2050512A DE 2050512 A DE2050512 A DE 2050512A DE 2050512 B2 DE2050512 B2 DE 2050512B2
- Authority
- DE
- Germany
- Prior art keywords
- speech
- signal
- output
- parameters
- signals
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000015654 memory Effects 0.000 claims description 81
- 239000000872 buffer Substances 0.000 claims description 54
- 230000005284 excitation Effects 0.000 claims description 24
- 125000004122 cyclic group Chemical group 0.000 claims description 21
- 238000000034 method Methods 0.000 claims description 10
- 238000005070 sampling Methods 0.000 claims description 10
- 230000010355 oscillation Effects 0.000 claims description 5
- 230000004044 response Effects 0.000 claims 3
- 238000010586 diagram Methods 0.000 description 16
- 238000001228 spectrum Methods 0.000 description 9
- 230000005540 biological transmission Effects 0.000 description 8
- 230000008569 process Effects 0.000 description 6
- 239000002131 composite material Substances 0.000 description 5
- 230000005236 sound signal Effects 0.000 description 4
- 150000001875 compounds Chemical class 0.000 description 3
- 238000010276 construction Methods 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000005755 formation reaction Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Time-Division Multiplex Systems (AREA)
Description
Die Erfindung betrifft eine Vorrichtung zur Ableitung von Sprachparametern und zur Erzeugung
synthetischer Sprache mit einem elektronischen Rechner, der verschiedene Informationsdienste anbietet,
bei welcher die Sprachsignale, die ausgegeben werden sollen, zuvor in Form von Sprachparametern gespeichert
werden, um anschließend entsprechend den Befehlen des elektronischen Rechners gelesen und
unter Steuerung eines Sprachsignal-Frequenzgenerators wieder zu einer Rede zusammengesetzt zu werden.
Bekannte Vorrichtungen der vorstehend umrissenen Art arbeiten nach dem sogenannten »Kompiler«-
Verfahren mit einer bereits aufgezeichneten Sprache, bei welchem im folgenden als »Spracheinheiten« bezeichnete
Sprachteile beispielsweise in Form von Wort-Spracheinheiten in einem Speicher gespeichert
werden und die gespeicherten Spracheinheiten nacheinander in entsprechender Reihenfolge ausgewählt
werden, um sie entsprechend den Befehlen eines elektronischen Rechners zu einer Sprachmitteilung
zusammenzustellen. Bei diesem Verfahren werden die Spracheinheiten im allgemeinen unmittelbar als Audiosignale
in Analogform aufgezeichnet, wobei als Aufzeichnungsmedium im allgemeinen eine langsam umlaufende
Analog-Magnettrommel verwendet wird, deren Umdrehungsperiode der zeitlichen Länge einer
Spracheinheit entspricht, so daß sie je Spur eine Spracheinheit aufzeichnet. Bei dieser Konstruktion ist
es jedoch schwierig, nicht nur die Kapazität der Analog-Magnettrommeln, sondern auch die Anzahl von
Spracheinheiten, die aufgezeichnet werden können, auf 100 bis 200 oder mehr zu erhöhen.
Zur Überwindung dieser Schwierigkeiten des Kompiler-Verfahrens
mit vorauf gezeichneten Spracheinheiten
besteht die Möglichkeit, an Stelle der unmittelbar aufgezeichneten Sprachsignale Informationen verdichteter
Signale aufzuzeichnen, um Sprachsignale mittels eines Sprach-Normal-Frequenzgenerators zu
rekonstruieren. Beispielsweise wendet eine derartige auf Tonsignale ansprechende Vorrichtung das Prinzip
eines Kanal-Vocoders an (vgl. beispielsweise R. H.
ίο B u r ο η : »IEEE [Transactions on Audio and Electroacustics«
Vol.] AU-16, Nr. 1, 1968, S. 21 bis 25), doch
ist bei Verwendung eines Kanal-Vocoders die Qualität des Sprachausgangsignals mangelhaft. Außerdem muß
an jedem Ausgangskanal ein teurer Sprachsignal-Frequenzgenerator vorgesehen sein.
In den USA.-Patentschriften 3 069 507 und 3 109 070 sind Autokorrelationsvocoder beschrieben, die jeweils
einen Autokorrelations-Koeffizienten als Parameter für die Spektrumhüllkurve benutzen; das Frequenzspektrum
eines aufgebauten Sprachsignals wird hierbei durch das quadrierte Frequenzspektrum eines tatsächlichen
Sprachsignals ausgedrückt. Um ein zusammengesetztes Sprachsignal hoher Güte zu erhalten,
muß das Spektrum des zusammengesetzten Sprachsignals, das als Ausgangssignal des Vocoders geliefert
wird, vor seiner Weiterverwendung dequadriert werden.
Aufgabe der Erfindung ist demgegenüber in erster Linie die Schaffung einer neuartigen Vorrichtung,
welcher ein Sprachsignal in Form eines neuen im folgenden als »Teilautokorrelations-Koeffizient« bezeichneten Parameters eingespeist wird, der zur Bildung
einer Anzahl von Spracheinheiten benutzt wird und die Erzeugung von Sprach-Ausgangssignalen ausgezeichneter
Qualität ermöglicht. In diesem Zusammenhang bezweckt die Erfindung die Schaffung einer
neuartigen Sprachparameter- Extraktionsvorrichtung zur Ableitung von Teilautokorrelations-Koeffizienten
und einer Information betreffend die die Sprachsignale erzeugende Anregungsquelle, die Schaffung einer
kostensparenden zyklischen Speichervorrichtung, welche mehrere Parameter in Form von Teilautokorrelations-Koeffizienten
als Spracheinheiten zu speichern vermag, sowie die Schaffung eines einfachen Sprachsignal-Frequenzgenerators mit mehreren Digitalfiltern
in Kaskadenschaltung zui Rekonstruktion einer Sprache aus mehreren aus der Speichervorrichtung
ausgewählten Spracheinheiten. .
Vorzugsweise soll bei dieser Sprachsignale verarbeitenden Vorrichtung ein einziger Sprachsignal-Frequenzgenerator
gemeinsam für mehrere Ausgangskanäle verwendet werden können.
Diese Aufgabe wird erfindungsgemäß durch die im Patentanspruch 1 angegebenen Maßnahmen gelöst.
Da die abgeleiteten Koeffizienten eng mit der Hüllkurve
des Frequenzspektrums des Sprachsignals zusammenhängen, kann eine Sprache aus Informationen bezüglich
der Anregungsquelle, wie Grundfrequenz, Amplitude der Grundfrequenz und Geräuschamplitude,
zusammengesetzt werden, die aus dem Sprachsignal erhalten werden. Zu diesem Zweck ist ein durch die
betreffenden Informationen über die Anregungsquelle gesteuerter Generator vorgesehen, dessen Ausgangssignale
durch die Teilautokorrelations-Koeffizienten gesteuert werden, um die Hüllkurve des Frequenzspektrums
zu reproduzieren.
Weitere Ausgestaltungen dieser Vorrichtung sind den Unteransprüchen zu entnehmen.
Im folgenden sind einige bevorzugte Ausführungsformen der Erfindung an Hand der Zeichnungen näher
erläutert. Es zeigt
F i g. 1 ein schematisches Schaltbild zur Veranschaulichung
des Grundprinzips einer Vorrichtung mit den Merkmalen der Erfindung,
F i g. 2 eine Sprachsignalkurve zur Erläuterung des Teilautokorrelations-Koeffizienten,
F i g. 3 ein Schaltbild einer Vorrichtung zum Ableiten der Teilautokorrelations-Koeffizienten und der
Anregungsinformationen,
F i g. 4 ein Schaltbild einer Vorrichtung zur Bestimmung des bei der Erfindung verwendeten Korrelations-Koeffizienten,
F i g. 5 ein Schaltbild einer beispielhaften Autokorrelations-Vorrichtung
für die Anregungsinformation,
F i g. 6 ein Schaltbild eines beispielhaften Sprachsignal-Frequenzgenerators,
F i g. 7 ein Schaltbild einer erfindungsgemäßen Vorrichtung, bei welcher der Sprachsignal-Frequenzgenerator
in Zeitmultiplexschaltung arbeitet,
F i g. 8 eine zyklische Speicheranordnung für die Sprachparameter auf einer Magnettrommel bei der
Ausführungsform gemäß F i g. 7,
F i g. 9 ein Blockschaltbild der bei der Ausführungsform gemäß F i g. 7 verwendeten Wort-Synchronisiereinrichtung,
F i g. 10 ein Zeitdiagramm der auf der Magnettrommel aufgezeichneten Steuersignale,
F i g. 11 und 12 ein Blockschaltbild bzw. ein Diagramm der Zeitabhängigkeit der bei der Ausführungsform
gemäß F i g. 7 verwendeten Programmsteuerung,
. F i g. 13 ein Blockschaltbild des Eingangssteuerkreises gemäß F i g. 7,
F i g. 14 ein Blockschaltbild einer abgewandelten Vorrichtung mit den Merkmalen der Erfindung und
F i g. 15 ein Blockschaltbild des Eingangssteuerkreises bei der Vorrichtung gemäß F i g. 14.
Gemäß F i g. 1 können über einen angeschlossenen Fernsprechapparat 1 und über eine Vermittlung 2
Anfragen nach irgendwelchen Iiuormationen an einen elektronischen Rechner 3 gestellt werden. Wenn diese
Verbindung hergestellt ist, wird der Rechner 3 vom Fernsprechapparat 1 angesteuert, und es werden die
vom Rechner abgegebenen Signale in Form einer Code-Reihe von auszugebenden Spracheinheiten einer
Sprachsignale verarbeitenden Vorrichtung 4 zugeleitet, die Speicher für die Teilautokorrelations-Koeffizienten
und für die Informationen bezüglich der Anregungsquelle aufweist, welche zur Zusammenstellung der in
Sprachform auszugebenden Antwort nötig sind, und diese Speicher werden beim Auftreten eines vom
Rechner 3 abgegebenen Signals abgefragt, um gesprochene Worte aufzubauen. Das hergestellte Sprachsignal
wird sodann über die Vermittlung 2 an den Fernsprechapparat 1 übertragen. Gemäß F i g. 1 ist
an die Vorrichtung 4 ein Sprachparameter-Extraktor 5 angeschlossen, welcher die Sprachparameter, d. h. die
Teilautokorrelations-Koeffizienten und die Informationen bezüglich der Anregungsquelle, die in der Vorrichtung
4 gespeichert werden sollen, aus der Sprache ableitet und gewünschtenfalls die in der Vorrichtung 4
zu speichernden Sprachparameter überprüft oder durch neue ersetzt.
Der Teilautokorrelations-Koeffizient, der den einen der eriindungsgemäß zum Aufbau der Sprache verwendeten
Parameter darstellt, läßt sich wie folgt definieren: Wenn das Sprachsignal beispielsweise
gemäß F i g. 2 mit einer Frequenz von 8 kHz abgetastet wird, wird die Teilautokorrelation zwischen
den Werten des Sprachsignals zu zwei vergleichsweise dicht beieinanderliegenden Abtast-Zeitpunkten round t3
durch Korrelation des Unterschieds AX0 bzw. AX3
zwischen den tatsächlichen Abtastwerten X0 und Xs
und zwei nach der Methode des kleinsten Quadrats
ίο vorherbestimmten Werten X0 bzw. X3 ausgedrückt,
die durch Auswertung der zu zwei im Zeitintervall zwischen den Zeitpunkten /0 und t3 liegenden Zeitpunkten
I1 bzw. t2 abgetasteten Werte X1 und X2 erhalten
werden.
Das Intervall zwischen den Abtastzeitpunkten wird fortlaufend auf T, IT, IT, AT... variiert, und es
werden die Teilautokorrelations-Koeffizienten für diese Zeitspannen bestimmt. Der Teilautokorrelations-Koeffizient
läßt sich durch die Gleichung
Kn = -
E {(A X0) ■ (A Xn))
[E {(Δ X0)2) ■ {(A Xn
(1)
ausdrucken, in welcher nT das Intervall zwischen den
Abtastzeitpunkten bedeutet.
Dabei gilt für die Abweichungen ZlX0 und AXn von
den vorherbestimmten Werten X0 bzw. Xn unter Verwendung
eines Verzögerungs-Operators D:
AXn = "2«iXn-! = [§>d\-Xu = An-^D) ■ Xn,
/ = o [/ = 0 J £2)
AX0= 2ßt Xn-, = (JT ßtDt)■ Xn = Bn-x(D) ■ Xn, '-1 [l=1 J (3)
worin on und /?,· so ausgewählt sind, daß die Werte von
E {(A XnY) und E{(AXoy}
minimal werden, D den durch eine Gleichung
ausgedrückten Operator darstellt und Bn-^(D) Fehleroperatoren
sind. Mit diesen Parametern läßt sich der Teilautokorrelations-Koeffizient Kn wie folgt ausdrücken:
Kn = —
E {(An-X(D) ■ Xn) Bn-^D) Xn))
AD) ■ XnY) E ((Bn^1(D)Xn
Es läßt sich nachweisen, daß für An(D), Bn(D) und
Kn die Gleichungen
An(D) = An-I(D)-KnBn-AD), (5)
Bn(D) = D [Β-Ύ(D) - KnAn-AD)I (6)
gelten.
Wenn also An^(D) und Bn^1(D) bestimmt sind,
kann Kn und können damit auch An(D) und Bn(D)
bestimmt werden. Auf diese Weise können die Teilautokorrelations-Koeffizienten
bestimmt werden. Da sich diese Koeffizienten vergleichsweise allmählich mit der Zeit ändern, werden sie während jeder Periode
bestimmt, deren Länge ausreicht, um die erforderlichen Sprachparameter zu ermitteln, ohne daß sich dabei
das Wesen der Sprache ändert, beispielsweise alle 15 ms, und der so erhaltene Koeffizient wird dann
verschlüsselt und gespeichert.
F i g. 3 zeigt ein Beispiel eines Extraktors 5 zum Ableiten von Teilautokorrelations-Koeffizienten und
Informationen bezüglich der Anregungsquelle aus einem Sprachsignal. Der in F i g. 3 dargestellte Extraktor
weist « Detektorstufen 14σ bis 14h für Teilautokorrelations-Koeffizienten
auf, die in Kaskadenschaltung aufgebaut sind. Da die jeweiligen Detektorstufen jeweils den gleichen Aufbau besitzen, ist im
folgenden nur der Aufbau der Stufe 14« näher erläutert. Im einzelnen weist jede, dieser Stufen ein
Verzögerungsnetzwerk 7 zur Verzögerung des Sprachsignals um ein Abtastintervall T, ein Rechengerät 8
zur Berechnung des Korrelationskoeffizienten, zwei Multiplier 9 und 11, zwei Addierwerke 10 und 12
sowie einen Umsetzer 13 auf. Eine in F i g. 3 am linken Ende der Detektorstufe 14ö eingezeichnete
Eingangsklemme 6 empfängt das Sprachsignal, und die Ausgangsklemmen 15 der Umsetzer 13 der einzelnen
Stufen liefern jeweils den in der betreffenden Stufe quantisierten Teilautokorrelations-Koeffizienten.
Die Ausgangsklemme des Addierwerks 12 der letzten Detektorstufe 14« ist offen, während die Ausgangs-
[(Bn-AD) Xn + An^1(D) Xn)Y - [(Bn-AD) Xn -
[(Bn-AD) Xn + An-AD) X,,)]2 + [(Bn-AD) Xn ~
Die Tiefpaßfilter 25 bestimmen die Mittelwerte dieser Eingangssignale über eine kurze Zeit. Da die
Mittelwerte von (An^(D)XnY und (Bn-^D)Xn)2 annähernd
gleich sind, gilt die Gleichung:
Mittelwert von
2 ((An-AD) Xn)2 + (Bn-^D) Xn)2) ,
sä Mittelwert von
sä Mittelwert von
4 ((An-AD) Xn)2 ■ (Bn-AD) Xn)2)
wobei der Wert von Kn durch das Ausgangssignal der
Verhältnisschaltung 26 gegeben wird. Dieses Ausgangssignal wird den Multipliern 9 und 11 eingespeist,
wodurch am Ausgang des Multipliers 11 ein vorbestimmter Wert X1 von X1 auftritt. Das Addierwerk 10
liefert den Unterschied (X1-X1) zwischen dem vorherbestimmten
Wert X1 und dem wirklichen Wert X1.
Außerdem erzeugt der Multiplier 9 als Ausgangssignal den vorherbestimmten Wert X0 von AT0, und der
Addierer 12 liefert den Unterschied (X0-X0). Das
Ausgangssignal des Korrelationskoeffizient-Rechengeräts 8 wird dem Umsetzer 13 eingespeist, der
daraufhin ein quantisiertes Ausgangssignal des Teilautokorrelations-Koeffizienten
an der Klemme 15 erzeugt.
Ähnliche Arbeitsgänge werden auch durch die anderen der Stufe 14a nachgeschalteten Detektorstufen
durchgeführt. Im einzelnen liefern die Addierwerke 10 und 12 der zweiten Teilautokorrelations-Kjpeffizienten-Detektorstufe
14d Differenzwerte (X2 — X2)
bzw. (Xq — X0) bis zu der letzten Detektorstufe 14«
(Xp — Xp) bzw. (AO — AO), wobei in diesem Fall Xv
den abgegriffenen Wert des wellenförmigen Tonsignals zu einem Abtastzeitpunkt tp, welcher der p-te Punkt
beginnend von t0 ist, darstellt und Xv und AO die
vorherbestimmten abgetasteten Werte bei t0 und tv
darstellen, die an Hand der abgetasteten Werte zu den beiden Zeitpunkten t0 bzw. /;, vorherbestimmt worden
sind. Auf diese Weise werden quantisierte Werte der Teilautokorrelations- Koeffizienten unterschiedlicher
klemme des Addierwerks 10 dieser Stufe an einen Autokorrelator 16 angeschlossen ist, dessen Ausgangssignale
einem Maximalwertwähler 17 eingespeist werden, welcher an einen von zwei Umsetzern 18 oder 20
angeschlossen werden kann.
Das an der Eingangsklemme 6 erscheinende Sprachsignal wird einerseits über das Korrelationskoeffizient-Rechengerät
8 und den Multiplier 9 dem einen Addierwerk 12 eingespeist, nach dem es im Verzögerungsnetzwerk
7 um eine Abtastperiode T verzögert worden ist, und andererseits über das Rechengerät 8 und den
Multiplier 11 dem anderen Addierwerk 11 eingespeist. F i g. 4 zeigt ein Beispiel für den Schaltungsaufbau
des Korrelationskoeffizient-Rechengeräts 8 mit Addierwerken 22, Quadriervorrichtungen 23, Addierwerken
24, Tiefpaßfiltern 25 und einer Teil- oder Verhältnisschaltung 26.
Unter der Voraussetzung, daß das Rechengerät 8 zwei Eingangssignale B„-1(D)Xn bzw. An^1(D)Xn
empfängt, lassen sich die Eingangssignale der beiden Tiefpaßfilter 25 jeweils durch folgende Gleichungen
ausdrucken:
An-I(D) Xn)]2 *=.4 (An _!(D) Xn ■ Bn -\(D) Xn), (7)
An -! (D) XnW = 2 {(An-AP) Xn)2 + (Bn -, (D) XnY) .
Zeitintervalle T, 27, 3T ... pT an den Ausgangsklemmen
der betreffenden Umsetzer 13 in den jeweiligen Detektorstufen 14a, \4b ... 14« erzeugt.
Wenn das Eingangs-Sprachsignal die letzte Stufe einer Reihe von in Kaskade geschalteten Detektorstufen 14«,
146 ... 14« erreicht, wird die Korrelation zwischen den dicht nebeneinanderliegenden abgetasteten Werten
des Sprachsignals aufgehoben, wobei die dem Formant der Sprache entsprechende Autokorrelation eliminiert
wird. Die der Grundfrequenz der Sprache entsprechende Korrelation wird jedoch beibehalten, ohne unterdrückt
zu werden. Wenn das Ausgangssignal des einen Addierwerks 10 der letzten Teilautokorrelations-Koeffizienten-Detektorstufe
14« an den Autokorrelator 16 angelegt wird, um dessen Autokorrelation zu bestimmen, wird
aus diesem Grund eine charakteristische Spitze mit einer der Periode der Grundfrequenz entsprechenden
Zeitverzögerung gebildet, wenn das empfangene Sprachsignal ein stimmhafter Laut ist, während keine
Spitze gebildet wird, wenn das Sprachsignal ein stimmloser Laut ist. Wenn daher das Eingangs-Sprachsignal
ein stimmhafter Laut ist, wird das Ausgangssignal des Autokorrelators 16 an den Maximalwertwähler 17 angelegt
und wird die Grundschwingungsperiodendauer der Sprache durch Messung des Intervalls zwischen
den Höchstwerten zweier benachbarter Autokorre-Iations-Koeffizienten bestimmt.
In F i g. 5 ist eine Ausführungsform des Autokorrelators
16 beispielhaft dargestellt. Bei dieser Ausführungsform weist der Autokorrelator 16 mehrere
Verzögerungsnetzwerke 27, mehrere Multiplier 28 und mehrere Tiefpaßfilter 29 auf. Die Grundschwingungsperiodendauer
der Sprache, die durch den Wähler 17 ermittelt wurde, wird durch den Umset/.er 18 qiiantisiert
und erscheint dann an einer Auseanasklemme 19 (F ig. 3).
Wenn dagegen das Eingangs-Sprachsignal ein stimmloser Laut ist, erscheint die Grundschwingungsperiodendauer
der Sprache nicht an der Klemme 19. In diesem Fall wird diese Ir.formalion als weißes
309 537/419
9 10
Rauschsignal der Information bezüglich der An- dem Multiplier 37 eingespeist. Die Eingangsklemme
regungsquelle verwertet. Die vom Amplitudenwert des Verzögerungskreises 40 des Digitalfilters 35« ist
des dem Autokorrelator 16 eingespeisten Eingangs- offen, während an der Ausgangsklemme 42 des
signals erhaltene Amplitude des die Information be- Digitalfilters 35α das zusammengesetzte Sprach-Auszüglich
der Anregungsquelle enthaltenden Signals wird 5 gangssignal erscheint, welches außerdem über ein
durch die Umsetzschaltung 20 quantisiert und er- Verzögerungsnetzwerk 43 dem Addierwerk 39 des
scheint dann an einer Ausgangsklemme 21. Digitalfilters 35a eingespeist wird. Jedes Digitalfilter
Auf diese Weise werden der Teilautokorrelations- 35« ... 35Z>
und 35a entspricht einer der Teilauto-Koeffizient und die Information bezüglich der An- korrelations-Koeffizient-Detektorstufen 14« ... 14b
regungsquelle, welche für die Zusammenstellung der io und 14a gemäß F i g. 3. Der durch den elektronischen
Sprache erforderlich sind, an den Ausgangsklemmen 15, Rechner ausgewählte, an die Eingangsklemme 41 des
19 und 21 erzeugt. Da die zeitmäßige Veränderung Digitalfilters 35« angelegte Teilautokorrelations-Kodes
die Information bezüglich der Anregungsquelle effizient ist daher der Teilautokorrelations-Koeffizient,
enthaltenden Signals ebenso wie beim Teilautokorre- der durch die Detektorstufe 14n gemäß F i g. 3 erlations-Koeffizient
vergleichsweise allmählich erfolgt, 15 zeugt und gespeichert wurde. Auf gleiche Weise wurde
reicht es aus, sie beispielsweise alle 15 ms zu bestimmen. der an die Eingangsklemme 41 des Digitalfilters 35a
Die erhaltenen Informationen werden verschlüsselt angelegte Teilautokorrelations-Koeffizient vorher
und gespeichert. durch die Detektorstufe 14a gemäß F i g. 3 erzeugt.
Erfindungsgemäß werden mehrere Teilautokorre- Ersichtlicherweise sind somit die Übertragungslations-Koeffizienten
der Sprache sowie die Grund- 20 funktionen der Digitalfilter gegenüber denen der Teilschwingungs-Periodendauer
und die Amplitude der autokorrelations-Koeffizient-Detektorstufen invertiert, Sprache, die als die Informationen bezüglich der An- so daß die Korrelation zwischen den durch eine entregungsquelle
enthaltenden Signale verwendet und sprechende Detektorstufe eliminierten Sprachwellendurch
die vorstehend beschriebenen Vorgänge er- formen dem Ausgangssignal des Amplitudenreglers 32
halten "werden, in der Vorrichtung 4 gemäß F i g. 1 25 aufgeprägt wird. Wenn dieses Ausgangssignal nachgespeichert.
Wenn die Vorrichtung 4 vom Rechner 3 einander durch die Digitalfilter 35« ... 35b und 35a
einen Befehl von einer Codereihe empfängt, der die hindurchgelangt, gleicht sich folglich die Hüllkurve
zusammenzustellende Rede betrifft, wählt die Vor- des Frequenzspektrums allmählich der Hüllkurve der
richtung 4 der Reihe nach die Teilautokorrelations- Originalrede an.
Koeffizienten und die Informationen bezüglich der 30 Wie bereits erwähnt wurde, sind die Frequenz-Anregungsquelle
enthaltenden Signale, die im voraus Übertragungscharakteristiken der Digitalfilter 35a, 35b
im Speicher gespeichert wurden, entsprechend dem bis 35« (F i g. 6) gegenüber den Frequenzübertragungs-Befehl
aus, so daß die betreffende Rede aufgebaut wird. Charakteristiken der in F i g. 3 dargestellten Detektor-
F i g. 6 veranschaulicht ein Blockschaltbild einer stufen 14a, 14b bis 14« für die Teilautokorrelations-
Vorrichtung zum Zusammensetzen der ausgewählten 35 Koeffizienten invertiert; jedes Eingangssignal der
Rede. Diese Vorrichtung weist einen Impulsgenerator Klemme 6 in F i g. 3 und jedes Ausgangssignal der
30 für stimmhafte Laute, einen Generator 31 für Klemme 34 in F i g. 6 besitzt eine flache Hüllkurve des
weißes Rauschen für stimmlose Laute und einen Frequenzspektrums, das geringe Korrelationen zwi-
Amplitudenregler 32 auf, deren Arbeitsweise durch an sehen den abgegriffenen Werten an zwei dicht neben-
Eingangsklemmen 33 und 34 angelegte Signale ge- 40 einanderliegenden Sprachsignalwerten aufzeigt. Des-
steuert wird. Die Klemme 33 empfängt eines der wegen ähnelt die Hüllkurve des Frequenzspektrums
Informationen bezüglich der Anregungsquelle ent- des zusammengesetzten Sprachsignals — das als
haltenden Signale, die vorher in der Vorrichtung 4 Ausgangssignal an Klemme 42 in F i g. 6 erscheint —
gespeichert und durch den elektronischen Rechner 3 der des tatsächlichen Sprachsignals, so daß die
ausgewählt wurden, d. h. die Information, welche 45 Rekonstruktion des Sprachsignals, d. h. die Sprach-
die Grundschwingungsdauer der Sprache betrifft, so synthese von hoher Güte ist.
daß der Impulsgenerator 30 eine Impulsreihe mit der Obgleich bei dieser Ausführungsform der Sprach-Einheitsleistung
von derselben Periode wie die Grund- anbauvorrichtung Digitalschaltungen dargestellt sind,
Schwingungsperiode erzeugt. Während eines Intervalls, welche die durch die Teilautokorrelations-Koeffizienten
in welchem keine sich auf die Periode der Grund- 50 angesteuerten Digitalfilter darstellen, können die
schwingung beziehende Information an die Eingangs- Digitalfilter ersichtlicherweise auch durch Analogklemme
33 angelegt wird (d. h. während des stimm- schaltungen ersetzt werden. Bei dem mit Digitallosen
Tonintervalls), erzeugt der Generator 31 ein schaltungen arbeitenden System wird es durch VerSignal
aus weil; em Rauschen mit der Einheitsleistung, wendung von sehr schnell arbeitenden Elementen
Auf gleiche Weise empfängt der Amplitudenregler 32 55 möglich, die Sprachaufbauvorrichtung auf Zeitmultieine
Information bezüglich der Signalamplitude und plexbasis zu verwenden, wodurch das mehrfache
gleichzeitig ein Informationen bezüglich der An- Ausnutzen der Antwortrede einfach wird, wie dies
regungsquelle enthaltendes Signal von der Eingangs- noch näher erläutert werden wird,
klemme 34, um die Amplitude des Ausgangssignals Um eine zusammengesetzte Rede ausgezeichneter
zu steuern. 60 Qualität zu erzeugen, kann der Maximalwert des
Das Ausgangssignal des Amplitudenreglers 32 wird Zeitunterschieds zwischen den Teilautokorrelations-
mehreren in Kaskade geschalteten Digitalfiltern Koeffizienten etwa 8 T betragen. Wenn der Teilauto-
35« ... 35b und 35a zugeführt, die alle in gleicher korrelations-Koeffizient für jedes Zeitintervall zu
Weise aufgebaut sind und jeweils drei Addierwerke 36, einem aus fünf Bit bestehenden Code verschlüsselt
38 und 39, ein Verzögerungsnetzwerk 40 und einen 65 und mit einer Rahmenperiode von 15 ms extrahiert
Multiplier 37 aufweisen. Ein vorher gespeicherter wird, beträgt die Informationskapazität der Teilauto-
und durch den Rechner ausgewählter Teilauto- korrelations-Koeffizienten 2667 Bit je Sekunde. Wenn
korrelations-Koeffizient wird über eine Klemme 41 andererseits das Informationen bezüglich der An-
11 12
regungsquelle enthaltende Signal mit einer Frequenz parameter zum Aufbau einer Rede auswählt. Wenn bei
von 15 Bit je 15 ms geliefert wird, beläuft sich die der erfindungsgemäßen Vorrichtung der Sprach-Gesamtkapazität
auf 3667 Bit je Sekunde. Der benutzte Frequenzgenerator auf Zeitmultiplexbasis verwendet
Ausdruck »Rahmenperiode« bedeutet eine Periode, in wird, können gleichzeitig mehrere verschiedene Reden
welcher die Sprachparameter in einem Speicher 5 zusammengesetzt werden, die gleichzeitig an entgespeichert
werden und welche vom Abtastintervall sprechenden Ausgangskanälen auftreten,
zu unterscheiden ist. Im folgenden ist eine verbesserte Sprachsignale ver-
zu unterscheiden ist. Im folgenden ist eine verbesserte Sprachsignale ver-
Diese Informationskapazität beläuft sich auf etwa arbeitende Vorrichtung beschrieben, die mehrere
ein Fünfzehntel derjenigen der Sprachwellenform. verschiedene Sprachsignale gleichzeitig über mehrere
Aus diesem Grund kann eine zusammengesetzte Rede ίο Ausgangskanäle abzugeben vermag,
hoher Qualität mit Hilfe von Steuersignalen kleiner Es gibt zahlreiche Arten von Speichervorrichtungen,
Kapazität erzielt werden. Folglich ist es mit Hilfe die Sprachparameter zu speichern vermögen, beispiels-
der erfindungsgemäßen Vorrichtung möglich, die Zahl weise solche mit Magnetkernen, Magnettrommeln,
der zusammensetzbaren Wörter im Vergleich zu her- Magnetplatten usw. Wenn einige tausend Wörter
kömmlichen Vorrichtungen um den Faktor 15 zu 15 gespeichert werden sollen, werden kostensparende
erhöhen. Magnettrommeln großer Kapazität oder Magnet-
Wie erwähnt, weist gemäß F i g. 6 jede Digital- scheibenspeicher bevorzugt. Aus diesem Grund werden
filterstufe 35 einen Multiplier 37 und drei Addier- bei den beiden im folgenden beschriebenen Auswerke
36, 38,' 39 auf. Wenn die Arbeitsweise dieses führungsformen der Erfindung Magnettrommelspeicher
Multipliers und dieser Addierwerke durch eine Takt- 20 zur Speicherung von Sprachparametern verwendet,
frequenz von 10 MHz gesteuert wird, beträgt die Ar- wobei gleichzeitig auf 64 Kanälen Antworten gegeben
beitszeit jeder einzelnen Stufe 35 etwa 1,8 Mikro- werden können.
Sekunden. Bei Annahme eines Maximums von 8 Γ für F i g. 7 zeigt ein Schaltbild einer solchen Ausden
Zeitunterschied der Teilautokorrelations-Koeffi- führungsform, bei welcher die Sprachinformation eines
zienten wird ein abgetasteter Wert der zusammen- 25 Worts auf einer Magnettrommel in Form von Sprachgesetzten Rede innerhalb eines Intervalls von etwa parametern und in solcher Reihenfolge aufgezeichnet
14,4 Mikrosekunden gebildet, doch da jede Stufe ihren wird, daß die Sprachparameter mehrerer Wörter auf
Arbeitsgang alle 1,8 Mikrosekunden durchführt, ist Zeit-Multiplexbasis herausgelesen werden können,
es möglich, an den Eingang der Digitalfilter alle F i g. 8 zeigt eine typische Anordnung einzelner 1,8 Mikrosekunden eine Information bezüglich der 30 Sprachparameter auf einer Magnettrommel. Bei dieser Anregungsquelle anzulegen, so daß die zusammen- Anordnung wird in jedem der in F i g. 8 dargestellten gesetzten Sprach-Ausgangssignale alle 1,8 Mikro- Blöcke 73 ein Satz von Sprachparametern aufgezeichsekunden erzeugt werden. Folglich wirkt die genannte net. Jeder Block 73 weist so viel Bit auf, wie für die Periode von 14,4 Mikrosekunden als reine Ver- Aufzeichnung eines Satzes von Sprachparamstern zögerungszeit, die zum Zusammensetzen eines Teils 35 erforderlich sind. Die linken Ziffern in den einzelnen des Sprach-Ausgangssignals erforderlich ist. Bei An- Blöcken bezeichnen die Wortziffern bzw. Sprachnahme einer Abtastfrequenz von 8 kHz für die zu- einheitsziffern, während die rechten Ziffern ihre sammengesetzte Rede können daher im Multiplier Rahmenziffern angeben. Im Fall eines Wortes »1« etwa 64 Kanäle verwendet werden. werden beispielsweise die jeweiligen Sprachparameter,
es möglich, an den Eingang der Digitalfilter alle F i g. 8 zeigt eine typische Anordnung einzelner 1,8 Mikrosekunden eine Information bezüglich der 30 Sprachparameter auf einer Magnettrommel. Bei dieser Anregungsquelle anzulegen, so daß die zusammen- Anordnung wird in jedem der in F i g. 8 dargestellten gesetzten Sprach-Ausgangssignale alle 1,8 Mikro- Blöcke 73 ein Satz von Sprachparametern aufgezeichsekunden erzeugt werden. Folglich wirkt die genannte net. Jeder Block 73 weist so viel Bit auf, wie für die Periode von 14,4 Mikrosekunden als reine Ver- Aufzeichnung eines Satzes von Sprachparamstern zögerungszeit, die zum Zusammensetzen eines Teils 35 erforderlich sind. Die linken Ziffern in den einzelnen des Sprach-Ausgangssignals erforderlich ist. Bei An- Blöcken bezeichnen die Wortziffern bzw. Sprachnahme einer Abtastfrequenz von 8 kHz für die zu- einheitsziffern, während die rechten Ziffern ihre sammengesetzte Rede können daher im Multiplier Rahmenziffern angeben. Im Fall eines Wortes »1« etwa 64 Kanäle verwendet werden. werden beispielsweise die jeweiligen Sprachparameter,
Bei der erfindungsgemäßen Sprachsignale verarbei- 40 die mit einer Rahmenperiode von 15 ms extrahiert
tenden Vorrichtung kann die Periode der Grund- worden sind, in Abständen von jeweils 15 ms in
Schwingung durch jede beliebige andere bekannte getrennten Blöcken »1,1«, »1,2« usw. aufgezeichnet,
Einrichtung als die beschriebene abgegriffen werden. so daß bei einer Wortdauer von L Sekunden sein letzter
Obgleich bei der vorstehend beschriebenen Aus- Sprachparameter in einem vom Block »1,1« um L Seführungsform
der Teilautokorrelations-Koeffizient von 45 künden entfernten Block' »1,M<
aufgezeichnet wird, einem abgetasteten Wert der Tonsignalwellenform er- Gemäß F i g. 8 ist ein Verhältnis von N = Lj\5 · 10~3
halten wurde, ist zu beachten, daß dieser Koeffizient gegeben. Diejeweiligen Sprachparameter des Wortes »2«
durch Vorherbestimmung der Werte zweier dicht werden in Blöcken »2,1«, »2,2« ... »2,N« derselben
benachbarter Zeitpunkte durch ein Signal bestimmt zyklischen Speicheranordnung auf derselben Magnetwerden
kann, welches zwischen diesen Zeitpunkten 50 trommel gespeichert, wobei diese Blöcke um einen
auftritt, worauf die Korrelation der Differenzen Block gegenüber den Blöcken zur Speicherung des
zwischen den den vorherbestimmten Werten ent- Wortes »1« versetzt sind. Die Wörter bis zu einem
sprechenden wirklichen Werten und den vorher- Wort »M« werden auf gleiche Weise aufgezeichnet,
bestimmten Werten ermittelt wird. Obgleich bei der Auf dieselbe Weise werden die jeweiligen Sprachvorher
beschriebenen Ausführungsform mehrere Di- 55 parameter anderer Wörter in der anderen zyklischen
gitalfilterstufen in Kaskade geschaltet sind, kann Speicheranordnung der Magnettrommel aufgezeichnet,
ersichtlicherweise ein einziges Filter wiederholt zur Die Anzahl der Wörter M, die im Multiplex in der-Lieferung
der gewünschten zusammengesetzten Rede selben zyklischen Speicheranordnung der Magnetbenutzt
werden. trommel, wie vorstehend beschrieben, aufgezeichnet
Die vorstehend beschriebene Sprachsignale ver- 60 werden kann, ist durch die Rahmenperiode von 15 ms
arbeitende Vorrichtung weist einen Speicher zur und die Bitzahl der Magnettrommel begrenzt.
Speicherung der Teilautokorrelations-Koeffizienten In der folgenden Beschreibung wird auf eine eines Sprachsignals und der Periode der Grund- Magnettrommel zur Aufzeichnung von Sprachparaschwingung sowie der Signalamplitude, die als In- metern Bezug genommen,die eine Umdrehungsperiode formationen bezüglich der Anregungsquelle benutzt 65 von 20 ms, eine Bitgeschwindigkeit von 2048 kHz, werden, sowie einen Sprach-Frequenzgenerator auf, eine Bitzahl je Spur von 40 960 Bits und 800 Spuren der in Abhängigkeit von einem Befehl eines elektro- aufweist. Weiterhin wird angenommen, daß jeder nischen Rechners die im Speicher gespeicherten Sprach- Block in der zyklischen Speicheranordnung 64 Bit
Speicherung der Teilautokorrelations-Koeffizienten In der folgenden Beschreibung wird auf eine eines Sprachsignals und der Periode der Grund- Magnettrommel zur Aufzeichnung von Sprachparaschwingung sowie der Signalamplitude, die als In- metern Bezug genommen,die eine Umdrehungsperiode formationen bezüglich der Anregungsquelle benutzt 65 von 20 ms, eine Bitgeschwindigkeit von 2048 kHz, werden, sowie einen Sprach-Frequenzgenerator auf, eine Bitzahl je Spur von 40 960 Bits und 800 Spuren der in Abhängigkeit von einem Befehl eines elektro- aufweist. Weiterhin wird angenommen, daß jeder nischen Rechners die im Speicher gespeicherten Sprach- Block in der zyklischen Speicheranordnung 64 Bit
13 14
enthält. (Obgleich die Größe des Blocks 73 55 Bit durch die Wandler 63-1 bis 63-8 in Sätze paralleler
betragen kann, was der Größe eines Satzes von Signale aus jeweils 55 Bit umgewandelt und dann in
Sprachparametern entspricht, sind zum Zweck der Parameter-Pufferspeicher 64-1 bis 64-8 eingeschrieben,
Erläuterung 64 Bit gewählt worden.) In diesem Fall welche jeden Satz von 55 Bits der Sprachparameter
beträgt die Zahl M der Wörter 480, und wenn eine 5 je Wort in der jeweiligen zyklischen Speicheranordnung
Wortlänge von etwa 2 Sekunden angenommen wird, zu speichern vermögen. Jeder Parameter-Pufferspeicher
würde N etwa 133 betragen. Im Fall einer Wortlänge weist eine Lese-Einschreib-Steuerschaltung auf und
von 2 Sekunden ist es unmöglich, in einer einzigen besitzt im allgemeinen zwei Ebenen zum gleichzeitigen
Spur alle Sprachparameter aufzuzeichnen, welche die Einschreiben an der einen und Lesen an der anderen
zyklische Speicheranordnung gemäß F i g. 8 darstellen. i<> Seite. Die selektiv aus den Parameter-Pufferspeichern
Infolgedessen werden in diesem Fall die Spuren bei herausgelesenen Sprachparameter werden dann einem
jeder 20 ms dauernden Umdrehung der Trommel der vorher beschriebenen Digital-Sprachfrequenzgenerator
Reihe nach weitergeschaltet, so daß eine lange zy- 65 eingespeist, und die von diesem in PCM-Form
klische Speicheranordnung der in F i g. 7 dargestellten (Pulscodemodulation) gelieferten Sprachsignale wer-Art
mit einer Anzahl von Spuren gebildet wird. Mit 15 den in einen für jeden Ausgangskanal vorgesehenen
anderen Worten wird in diesem Fall ein Wort von Ausgangs-Pufferspeicher 66 eingeschrieben, wo sie
2 Sekunden in 100 Spuren gespeichert, die der Reihe während einer Rahmenperiode von 15 ms gespeichert
nach weitergeschaltet werden. Genauer gesagt, damit werden. Ähnlich den Paramter-Pufferspeichern 64-1
die Spuren einer Magnettrommel mit einer Drehperiode bis 64-8 weist der Ausgangs-Pufferspeicher 66 zwei
von 20 ms zur alle 15 ms erfolgenden Aufzeichnung 20 Ebenen sowie eine Lese-Einschreib-Steuerschaltung auf.
der Reihe nach weitergeschaltet werden können, und Der Speicher 66 liefert einem Digital-Analog-Wandler
um zu gewährleisten, daß die zyklische Speicher- 67 PCM-Codes in einen jedem Ausgangssignal entanordnung
perfekt zyklisch ist, sollte die Dauer des sprechenden Teil, um diese PCM-Codes in PAM-Wortes
ein gemeinsames Vielfaches von 20 und 15 ms (Impuls-Amplitudenmodulation)-Signale umzuwansein.
Aus diesen Grund wird in der folgenden Be- 25 dein. Das Ausgangssignal des Wandlers 67 wird über
Schreibung angenommen, daß ein Wort mit einer PAM-Gatter 68-1 bis 68-64, von denen je eines für
Dauer von 1,98 Sekunden auf 99 Spuren aufgezeichnet jeden Ausgangskanal vorgesehen ist, Tiefpaßfiltern 69-1
werden soll, die der Reihe nach weitergeschaltet bis 69-64 eingespeist, um in ein kontinuierliches
werden. In diesem Fall ist die Zahl N gemäß F ig. 8 Sprachwellensignal umgewandelt zu werden. Außerdem
gleich 132. Wenn die Zahl der Spuren 800 beträgt, 30 ist ein Eingangssteuerkreis 71 vorgesehen, der an den
können acht zyklische Speicheranordnungen (F i g. 8) elektronischen Rechner angeschlossen ist und Ingebildet
werden. Da, wie erwähnt, die Anzahl der formationen bezüglich der Wortzahl der an jeden
Wörter M, die in Multiplex in einer zyklischen Ausgangskanal anzulegenden Wörter empfängt. Um
Speicheranordnung (mit 99 Spuren) aufgezeichnet den Signalfluß von den Parameter-Pufferspeichern 64-1
werden, 480 Wörter beträgt, ist es möglich, Sprach- 35 bis 64-8 zu den für jeden Ausgangskanal vorgesehenen
parameter der Wörter mit einer Gesamtzahl von PAM-Gattern 68-1 bis 68-64 auf Zeitmultiplexbasis
480 · 8 = 3840 in acht zyklischen Speicheranordnungen zu steuern, ist eine Programmsteuerung 72 vorgesehen,
aufzuzeichnen. Weiterhin ist eine Wort-Synchronisierungseinrichtung Die Sprachparameter jedes Wortes werden gemäß 70 zur Gewährleistung eines Befehls nach einer Über-F
i g. 8 zyklisch von links nach rechts durch Wieder- 40 tragung an den Rechner und zur Bestimmung der
gabe-Schaltkreise herausgelesen, von denen je einer Einschreibadresse in den Parameter-Pufferspeichern
für jede zyklische Speicheranordnung vorgesehen ist. 64-1 bis 64-8 vorgesehen. Obgleich neben der Wort-Genauer
gesagt, erscheinen bei der zyklischen Speicher- Synchronisierungseinrichtung 70 noch eine Lese-Einanordnung
1 die Sprachparameter des ersten Satzes, schreib-Steuerung für die Magnettrommel vorgesehen
bestehend aus den Wörtern »1«, »2« ... »480« der 45 sein muß, ist diese in F i g. 7 nicht dargestellt.
Reihe nach im Wiedergabekreis innerhalb einer Die Magnettrommel 60, die Matrizen 61-1 bis 61-8,
Rahmenperiode, d.h. in 15 ms. Hierauf erscheinen die Leseverstärker 62-1 bis 62-8 und die Serien-Parallelder
Reihe nach die Sprachparameter des zweiten Wandler63-1 bis 63-8 gemäß Fig. 7 können her-Satzes
mit den Wörtern »1«, »2« ... »480«. Auf die kömmliche Einrichtungen sein, wie sie üblicherweise
gleiche Weise werden aufeinanderfolgende Sätze von 50 in Digitalrechnern verwendet werden. Weiterhin
Sprachparametern nacheinander wiedergegeben. Im können die Pufferspeicher 64-1 bis 64-8 und der Aus-Fall
einer Wortlänge von 1,98 Sekunden ist ein Arbeits- gangs-Pufferspeicher 66 Magnetkernspeicher sein, wie
zyklus beendet, wenn die Sprachparameter der Wörter sie verbreitet in gewöhnlichen elektronischen Rechnern
des 132. Satzes erscheinen. als Hauptspeicher verwendet werden. Außerdem Die Ausführungsform gemäß F i g. 7 weist eine 55 können auch der Digital-Analog-Wandler 67, die
Magnettrommel 60 zur Aufzeichnung der jeweiligen PAM-Gatter 68 und die Tiefpaßfilter 69 herkömmliche
Sprachparameter der betreffenden Wörter in zyklischer Einrichtungen sein, wie sie üblicherweise in PCM-Speicheranordnung
gemäß F i g. 8 sowie Spurwähl- Übertragungssystemen verwendet werden,
matrizen 61-1 ... 61-8 zum Umschalten der Spuren Im folgenden sind die Einzelheiten der Wortder
Magnettrommel 60 bei jeder Umdrehung derselben 60 Synchronisierungseinrichtung 70, des Eingangs-Steuerauf,
um acht zyklische Speicheranordnungen mit je- kreises 71 und der Programmsteuerung 72 erläutert,
weils einer Periode von 1,98 Sekunden zu bilden. Jede F i g. 9 zeigt ein Beispiel für den Aufbau der Wort-Matrix
ist für 99 Spuren vorgesehen, und die Ausgangs- Synchronisiereinrichtung 70. Zwei an der linken Seite
signale von den Spurwählmatrizen werden über Lese- von F i g. 9 dargestellte Eingangssignale TIMING und
verstärker 62-1 bis 62-8, die jeweils eine entsprechende 65 Abzustellen die Steuersignale dar, die auf bestimmten
Impulsformschallung aufweisen, Reihen-Parallel- Spuren des Magnettrommelspeichers 60 gespeichert
Wandlern 63-1 bis 63-8 zugeführt. Die aufeinander- wurden. Das Zeitdiagramm dieser Steuersignale ist in
folgend herausgelesenen Sprachparameter werden F i g. 10 dargestellt, wonach das Signal TIMING bei
jeder vollen Umdrehung der Magnettrommel erzeugt wird, während das Signal MARK den Block 73 markiert,
welcher einem Satz von Sprachparametern gemäß F i g. 8 entspricht. Bei dem in F i g. 8 dargestellten
Ausführungsbeispiel enthält jeder Block 64 Bits, so daß ein Satz von Sprachparametern mit
55 Bits in einem Block aufgezeichnet werden kann. Ein in F i g. 10 dargestelltes anderes, mit TAKT
bezeichnetes Signal stellt die Bitposition auf der Magnettrommel dar und ist beim vorliegenden Ausführungsbeispiel
eine Impulsfolge mit einer Frequenz von 2048 kHz. Da, wie erwähnt, nacheinander auf die
Spuren umgeschaltet werden muß, um bei jeder Drehung der Magnettrommel die darauf aufgezeichneten
Informationen herauszulesen, werden die TAKT-Signale bei der Schaltung gemäß F i g. 9 durch einen
99-Schritt-Zähler 75 gezählt, um sie so zu entschlüsseln, daß eine abzulesende Spur ausgewählt wird. Das
Aiisgangssignal eines Dekoders 74 wird parallel an entsprechende Spurwahlmatrizen 61-1 bis 61-8 angelegt.
Ein durch den Zähler 75 erzeugtes Überlaufsignal 68 bedeutet, daß die Periode von 1,98 Sekunden
abgelaufen ist und wird dazu benutzt, einen Übertragungsbefehl bzw. ein entsprechendes Signal zum
Rechner zu senden. Bei Empfang dieses Signals beginnt der Rechner die vorgesehenen, auf den betreffenden
Ausgangskanälen auszusendenden Wortinformationen zu übertragen. Die MARK-lmpulse
werden dagegen für die Anzeige der Adressen zum Einschreiben von Sprachparametern gezählt, die der
Reihe nach von der Magnettrommel gelesen werden und den entsprechenden Parameter-Pufferspeichern
eingeschrieben werden. Da, wie erwähnt, beim Ausführungsbeispiel gemäß F i g. 8 M = 480 ist, werden
die MARK-lmpulse durch einen 480-Schritt-Zähler 76 gezählt, wobei die resultierenden, gezählten Werte
zur Anzeige der Einschreibadressen der betreffenden Pufferspeicher benutzt werden. Da außerdem jeder
Parameter-Pufferspeicher zwei Ebenen besitzt, muß eine einzuschreibende Fläche bestimmt werden. Zu
diesem Zweck ist ein Flip-Flop 77 vorgesehen, der das vom 480-Schritt-Zähler 76 gelieferte Überlauf signal 79
empfängt und jedesmal die Polarität seines Ausgangssignals umkehrt, wenn der Zähler 76 in 15 ms bis zu
480 MARK-lmpulse zählt, um die Ebene anzuzeigen, in welche die Information eingeschrieben werden soll.
F i g. 11 zeigt ein Beispiel für den Aufbau der Programmsteuerung 72, und F i g. 12 veranschaulicht das
Zeitverhältnis zwischen den verschiedenen Signalen in F i g. 11. Die Programmsteuerung 72 wird durch ein
von der Magnettrommel geliefertes TAKT-Signal mit einer Frequenz von 2048 kHz betätigt, welches durch
einen vier Schritte umfassenden Zähler 80 in ein Signal 87 mit einer Frequenz von 512 kHz umgewandelt
wird. Dieses Signal 87 wird einer Zählerschaltung aufgeprägt, die einen Zähler 84 mit 64 Schritten und
einen Zähler 85 mit 120 Schritten in Kaskadenschaltung aufweist, wobei der Inhalt dieser Zähler die
Adresse des zu diesem Zeitpunkt abzulesenden Ausgangs-Pufferspeichers 66 angibt. Die Adresse wird zum
Pufferspeicher 66 übertragen, um den dieser Adresse entsprechenden Inhalt herauszulesen, und der gelesene
Inhalt wird durch den Analog-Digital-Wandler 67 in ein Analogsignal umgewandelt. Zu diesem Zeitpunkt
entschlüsselt ein Dekodierer 86 das Ausgangssignal des 64-Schritt-Zählers 84 zur Erzeugung von Signalen G-I
bis G-64 zum Ansteuern, d. h. zum Durchschalten der PAM-Gatter 68-1 bis 68-64 in den Ausgangskanälen,
und zwar in den Zeitverhältnissen gemäß F i g. 12. Auf diese Weise wird das aus dem Ausgangs-Pufferspeicher
66 herausgelesene und durch den Wandler 67 in Analogform umgewandelte Signal zu dem durch
den Zähler 84 bestimmten Ausgangskanal übertragen. Das Ausgangs-Signal 87 des 4-Schritt-Zählers 80 wird
einer Zählerschaltung eingespeist, die aus einem 120-Schritt-Zähler 81 und einem 64-Schritt-Zähler 82
besteht, welche in Kaskade geschaltet sind. Die Inhalte dieser Zähler zeigen die Adresse an, in welche die zu
diesem Zeitpunkt durch den Frequenzgenerator 65 aufgebauten PCM-Code im Ausgangs-Pufferspeicher 66
eingeschrieben werden sollen. Gemäß F i g. 12 wird das Überlauf signal 88 des 120-Schritt-ZähIers 81 alle
234 ms erzeugt und dem nachgeschalteten 64-Schritt-Zähler 82 eingespeist. Außerdem wird das Signal 88
zum Anstoßen des Eingangs-Steuerkreises 71 benutzt. Das Überlaufsignal 89 des 64-Schritt-Tählers 82, das
„ 120 · 64 , .. Λr ■ , · ■ ■·
alle -■·■--— kHz ^ 15 ms erzeugt wird, wird einem
Flip-Flop 83 zugeführt, dessen Binärausgang anzeigt, in welche der beiden Ebenen des Ausgangs-Pufferspeichers
66 eingeschrieben oder welche gelesen werden soll. Das Ausgangssignal 87 des 4-Schritt-Zählers 80
wird dem Frequenzgenerator 65 aufgeprägt und betätigt ihn im Gleichlauf mit dem Einschreib- und Lesevorgang
am Ausgangs-Pufferspeicher 66.
Fig. 13 zeigt ein Beispiel für den Aufbau des Eingangs-Steuerkreises 71. Wenn durch das Überlaufsignal
78 ein Übertragungsbefehl von der Wort-Synchronisiereinrichtung 70 zum Rechner übertragen
wird, werden Informationen, welche die Wortzahlen der zu den betreffenden Ausgangskanälen C//-1 bis
C//-64 zu sendenden Informationen bestimmen, vom
Rechner übertragen und vorübergehend in den betreffenden Ausgangskanälen entsprechenden Registern
93-1 bis 93-64 gespeichert. Nach Ablauf der Wortlänge von 1,98 Sekunden gibt die Wort-Synchronisiereinrichtung
70, wie vorher erläutert, ein Befehlssignal an den Rechner ab, doch wird das Signal 78 auch den
im Eingangssteuerkreis 71 vorgesehenen Gattern 92 als Durchlaßsignal eingespeist, wodurch der Inhalt
von Registern 93 in Register 91-1 bis 91-64 übertragen wird. Wie erwähnt, liefert die Programmsteuerung 72
alle 234 Mikrosekunden ein Startsignal 88 an den Eingangssteuerkreis
71, wobei dieses Zeitintervall von einem 64-Schritt-Zähler 95 gezählt wird. Der Inhalt
des Zählers 95 wird durch einen Dekodierer 94 entschlüsselt, welcher Durchlaßsignale 96-1 bis 96-64 für
Gatter 90-1 bis 90-64 erzeugt. Beim Durchschalten der Gatter 90-1 bis 90-64 werden die Inhalte der
Register 91 nacheinander als gelesene Adressen in Intervallen von 234 Mikrosekunden auf die Parameter-Pufferspeicher
64 übertragen, um diese abzulesen. Wenn bei Annahme einer Wortlänge von 1,98 Sekunden
die Inhalte der einzelnen Register 91 132mal (132 Rahmen) zum Parameter-Pufferspeicher 64 übertragen
werden, werden die Informationen zur Bestimmung des nächsten Wortes, die vom elektronischen
Rechner übertragen wurden und in den entsprechenden Registern 93 gespeichert sind, durch das durch die
Wort-Synchronisiereinrichtung 70 zu diesem Zeitpunkt erzeugte Signal 78 in die Register 91 übertragen. Die
vorstehend beschriebenen Vorgänge werden im Gleichlauf mit der Worldaucr wiederholt.
Gemäß F i g. 7 werden die aus der Magnettrommel 60 herausgelesenen und in jedem Sat/ in parallele
Signale umgewandelten Sprachparameter in die Adrcs-
: 309 537/419
sen der betreffenden Parameter-Pufferspeicher 64-1 bis 64-8 eingeschrieben, welche je Satz den acht zyklischen
Speicheranordnungen entsprechen. Folglich besitzt jede Adresse dieser Speicher 64-1 bis 64-8 jeweils
55 Bits für einen Satz von Sprachparametern. Selbstverständlich wird der vorstehend beschriebene Vorgang
für die acht zyklischen Speicheranordnungen parallel durchgeführt, so daß ein Satz von Sprachparametern,
welcher 3840 Wörter betrifft, auf die vorher beschriebene Weise in die Parameter-Pufferspeicher
64 eingeschrieben wird. Dieser Einschreibvorgang in.die Parameter-Pufferspeicher wird mit einer
Rahmenperiode von 15 ms beendet. Sodann beginnt ein Lesezyklus für die Parameter-Pufferspeicher 64 für
jeden Ausgangskanal. Während des Ablaufs dieses Lesezyklus werden die Sprachparameter für die nächste
Rahmenperiode, die aus der Magnettrommel 60 herausgelesen wurden, in die andere Ebene der Parameter-Pufferspeicher
64 eingeschrieben, die, wie erwähnt, zwei Ebenen aufweisen. Während des Lesezyklus
werden die Inhalte der Register 91-1 bis 91-64 des Eingangssteuerkreises 71 entsprechend der Reihenfolge
der Ausgangskanäle unter der Steuerung durch das Signal 88 von der Programmsteuerung 72 zu
Parameter-Pufferspeichern 64 übertragen, um die Inhalte (Sprachparameter eines Satzes) der Adressen
der Parameter-Pufferspeicher 64 herauszulesen, wobei die herausgelesenen Inhalte zum Sprach-Frequenzgenerator
65 gesandt werden. Wie vorstehend im einzelnen erläutert, bewirkt der Frequenzgenerator 65
bei Empfang der herausgelesenen Inhalte eine Zusammenstellung von PCM-Sprachcodes, beispielsweise
120 PAM-Teilen, die innerhalb einer Rahmenperiode erzeugt werden sollen. Diese zusammengestellten
Codes werden nacheinander in Adressen des Ausgangs-Pufferspeichers 66 gespeichert, wobei
diese Adressen durch den 120-Schritt-Zähler 81, den
64-Schritt-Zähler 82 und das Flip-Flop 83 der Kanal-Programmsteuerung
72 angezeigt werden. Jede Adresse des Ausgangs-Pufferspeichers 66 weist beispielsweise
8 Bits auf, was für die Speicherung eines Satzes von PCM-Sprachcodes ausreicht. Dieser Vorgang wird in
einer ein Vierundsechzigstel eines Rahmens (12 ms) bzw. 234 Mikrosekunden entsprechenden Zeitspanne
durchgeführt. Infolgedessen wird dieser Vorgang während einer Rahmenperiode für 64 Ausgangskanäle
auf Zeitmultiplexbasis durchgeführt. Auf diese Weise werden während einer Rahmenperiode bzw. innerhalb
von 15 ms 120 PCM-Codeteile für jeden Ausgangskanal in die den jeweiligen Ausgangskanälen der
Ausgangs-Pufferspeicher entsprechenden Adressen eingeschrieben. Die Inhalte des Ausgangs-Pufferspeichers
66 werden auf Zeitmultiplexbasis unter Steuerung der Programmsteuerung 72 im Gleichlauf mit den Gatter-Signalen
G-I bis G-64 der PAM-Gatter 68-1 bis 68-64
der entsprechenden Ausgangskanäle herausgelesen. Die gelesenen Signale werden durch den Digital-Analog-Wandler
67 in PAM-Signale umgewandelt, die über entsprechende Tiefpaßfilter 69 als kontinuierliches
Sprachband auf die Ausgangskanäle übertragen werden.
Eine Reihe der vorstehend beschriebenen Arbeitsvorgänge wird mit der Rahmenperiode von 15 ms
wiederholt, um eine der Wortdauer entsprechende Sprachwelle für die betreffenden Ausgangskanäle zu
erzeugen. Die Wortzahlen der das nächste Mal zu behandelnden Wörter sind bereits durch das Überlauf-Signal
78 der Wort-Synchronisiereinrichtung 70 vor Beginn der Behandlung der nächsten Wörter vom
Rechner zu den Registern 93 des Eingangs-Steuerkreises 71 übertragen worden. Durch Wiederholung
dieser Arbeitsgänge mit einer der Wortdauer entsprechenden Periode von beispielsweise 1,98 Sekunden
werden zusammengestellte Sprachsignale an die betreffenden Ausgangskanäle übertragen.
Obgleich beim vorstehend beschriebenen Ausführungsbeispiel der Sprachsignale verarbeitenden
ίο Vorrichtung eine Magnettrommel als Speicher für
die Sprachparameter benutzt wird, kann ersichtlicherweise jede andere Art von Speicher benutzt werden,
soweit dieser die Sprachparameter in Form von zyklischen Speicheranordnungen aufzuzeichnen vermag.
Im folgenden ist eine weitere Ausführungsform der eine Magnettrommel als Speicher für Sprachparameter
verwendenden erfindungsgemäßen Vorrichtung beschrieben. Im Unterschied zur ersten Ausführungsform,
bei welcher die aus den jeweiligen Wörtern extrahierten Sprachparameter in Intervallen auf den Spuren einer
Magnettrommel aufgezeichnet wurden, werden bei dieser Abwandlung die Sprachparameter kontinuierlich
aufgezeichnet, und zwar beginnend mit einer bestimmten Adresse. Genauer gesagt, wird jedes Wort
kontinuierlich ohne jede Überlappung in 132 Blöcken aufgezeichnet, falls die Dauer jedes Wortes z. B.
1,98 Sekunden beträgt, und zwar beginnend mit der ersten Adresse der Trommel, die für jedes Wort vorbestimmt
ist. Wenn die Wortzahlen der den Ausgangskanälen zuzuführenden Wörter vom elektronischen
Rechner übertragen werden, werden Sprach parameter, die jeweils aus 132 Sätzen bestehen, für die an den
Ausgangskanälen vorgesehenen Wörter aus der Magnettrommel herausgelesen und im Parameter-Pufferspeicher
gespeichert. Danach wird auf dieselbe Weise wie bei der zuerst beschriebenen Ausführungsform
das Sprachsignal für jeden Rahmen zusammengesetzt, im Ausgangs-Pufferspeicher gespeichert und als kontinuierliches
Sprachsignal für das vorgesehene Wort über den Digital-Analog-Wandler, das PAM-Gatter
und das Tiefpaßfilter dem Ausgangskanal zugeführt.
F i g. 14 zeigt diese weitere Ausführungsform der
Erfindung mit einer Magnettrommel 60 zur Speicherung von Sätzen von Sprachsignalen für die betreffenden
Wörter, einem Parameter-Pufferspeicher 98 zur vorübergehenden Speicherung der selektiv aus der Magnettrommel
60 herausgelesenen Sprach parameter, einem Eingangssteuerkreis 100 zur Speicherung der vom
Rechner übermittelten informationen zur Bestimmung der Wortzahl und zur Übermittlung der herausgelesenen
Adresse zum Parameter-Pufferspeicher 98 zu jedem festgelegten Zeitpunkt und einer auf die Befehle
des Eingangssteuerkreises 100 ansprechenden Magnettrommelsteuerung 97 zum Lesen des Inhalts aus der
Magnettrommel 60 und zum Einschreiben desselben in den Parameter-Pufferspeicher 98. Diese abgewandelte
Ausführungsform weist weiterhin einen Sprach-Frequenzgenerator 65 zum Aufbau einer Sprache
(aus 120 Teilen) von einem Rahmen (15 ms) aus einem Satz von aus dem Parameter-Pufferspeicher 98 herausgelesenen
Sprachparametern auf. Dieser Frequenzgenerator weist Digitalfilter zum Zusammensetzen
der Sprachsignale auf Zeitmultiplexbasis für jeden Ausgangskanal, einen Ausgangs-Pufferspeicher 66 zur
vorübergehenden Speicherung einer Gruppe von dem durch den Frequenzgenerator 65 aufgebauten Sprachsignal
entsprechenden PCM-Codes, einen Digital-Analog-Wandler 67 zur Umwandlung der aus dem
Ausgangs-Pufferspeicher herausgelesenen Digitalcodes in Analogsignale, PAM-Gatter 68-1, 68-2 ... 68-64
zur Verteilung der vom Wandler 67 gelieferten Analogsignale auf die verschiedenen Ausgangskanäle CH-I,
CH-I ... CH-64, Tiefpaßfilter 69-1,69-2 ... 69-64 zur
Umwandlung der Ausgangssignale der jeweiligen PAM-Gatter in ein kontinuierliches Sprachsignal
sowie eine Programmsteuerung 99 zur Steuerung der verschiedenen vorstehend beschriebenen Bauteile auf.
Von diesen Bauteilen sind die Magnettrommel 60, der Parameter-Pufferspeicher 98, der Ausgangs-Pufferspeicher
66, der Wandler 67, die PAM-Gatter 68 und die Tiefpaßfilter 69 ebenfalls herkömmliche Geräte,
wie sie verbreitet in elektronischen Rechnern und in PCM-Übertragungssystemen verwendet werden. Die
Magnettrommelsteuerung 97 entspricht praktisch einer herkömmlichenMagnettrommel-Kanallesevorrichtung.
Bei herkömmlichen Rechnern müssen zum Herauslesen aus der Magnettrommel mittels einer Magnettrommel-Kanallesevorrichtung
und zur Speicherung der gelesenen Information im Hauptspeicher, welcher dem
Parameter-Pufferspeicher98 gemäß F i g. 14 entspricht,
gewisse Einrichtungen vorgesehen sein, um die Adresse an die Magnettrommel-Kanallesevorrichtung zum Ablesen
der Trommel, die Anzahl der Wörter und das Einschreiben der Adresse des Hauptspeichers zu geben,
doch ist bei der Magnettrommelsteuerung 97 gemäß F i g. 14 die Anzahl der herauszulesenden Wörter
konstant gleich 132 Wörtern je Spracheinheit mit einer Länge von 1,98 Sekunden, was durch die Dauer
der Spracheinheit bestimmt wird, und ändert sich die Einschreib-Adressedes Parameter-Pufferspeichers regelmäßig,
so daß es nicht nötig ist, diese Werte durch den Eingangs-Steuerkreis 100 zu bestimmen. Die Programmsteuerung
99 entspricht praktisch der Programmsteuerung 72 der ersten Ausführungsform, nur
mit dem Unterschied, daß sie durch unabhängige Taktsignale gesteuert wird, d. h. mit anderen Worten,
nicht mit der Drehung der Magnettrommel synchronisiert wird.
F i g. 15 zeigt die Einzelheiten des Eingangs-Steuerkreises 100. Die vom Rechner übermittelten
Informationen zur Bestimmung der an die einzelnen Ausgangskanäle zu sendenden Wörter werden in
Registern 104-1, 104-2 ... 104-64 gespeichert, welche den betreffenden Ausgangskanälen CH entsprechen.
Die Übertragung dieser Informationen zu Registern 102-1 bis 102-64 erfolgt über Gatter 103-1 bis 103-64,
die durch ein Überlaufsignal 111 betätigt werden, welches auch als Übertragungsbefehlssignal für den
Rechner dient und durch einen 132-Schritt-Zähler 108
mit einer Periode entsprechend der Wortdauer erzeugt wird. Diese Informationen werden nacheinander in der
Reihenfolge der Register 102-1 bis 102-64 zur Magnettrommelsteuerung
97 übertragen, wodurch letztere abgelesen wird. Die Überlaufsignale 88 des Eingangs-Steuerkreises,
die von der Programmsteuerung 99 in einem Intervall von 234 Mikrosekunden ausgesandt
werden, werden durch einen 132-Schritt-Zähler 105 und einen 64-Schritt-ZähIer 106 gezählt. Der Inhalt
des 64-Schritt-Zählers 106 wird durch einen Dekodierer 112 entschlüsselt, der Signale 110-1 bis 110-64
an Gatter 101-1 bis 101-64 abgibt, wodurch diese jeweils etwa 30 ms lang auf Durchlaß geschaltet
werden und. die Inhalte der Register 102 nacheinander an die Magnettrommelsteuerung 97 übertragen.
Alle Parameter eines durch die Inhalte der Register 102 bestimmten Wortes müssen während der
Wortdauer, d. h. innerhalb von 1,98 Sekunden, gelesen
ίο und im Parameter-Pufferspeicher 98 gespeichert werden.
Da jedoch eine Magnettrommel· im allgemeinen eine vergleichsweise lange Zugriffszeit hat, dauert es
maximal 25 ms, bis die das Wort bestimmende Information vom Eingangssteuerkreis 100 zur Magnettrommel-Steuerung
97 übermittelt wird und alle Parameter der Wörter herausgelesen werden, um sie im
Parameter-Pufferspeicher 98 zu speichern. Da die Gatter 101 jeweils 30 ms lang auf Durchlaß geschaltet
sind, steht genügend Zeit zum Ablesen der Magnettrommel 60 zur Verfügung.
Die Startsignale 88 des Eingangssteuerkreises werden ebenfalls durch einen 64-Schritt-Zähler 107 und 132-Schritt-Zähler
108 gezählt, und die Inhalte dieser Zähler werden zum Parameter-Pufferspeicher 98 als
Adresse für diesen übermittelt, um zu diesem Zeitpunkt abgelesen zu werden. Da das Einschreiben der Sprachparameter
von der Magnettrommel 60 und das Lesen der den Eingangssteuerkreis bestimmenden Adresse
parallel erfolgen, ist der Parameter-Pufferspeicher 98 wie bei der zuerst beschriebenen Ausführungsform
mit zwei Ebenen versehen. Zur Auswahl einer dieser Ebenen ist ein Flip-Flop 109 vorgesehen, das
die Polarität des Ausgangssignals in Abhängigkeit vom Überlaufsignal 111 des 132-Schritt-Zählers 108
umkehrt.
Während der Zeitspanne, in welcher die Magnettrommel 60 durch den Inhalt der Register 192 abgelesen
wird, werden die vom Rechner zur Bestimmung der nächsten Wörter übermittelten Informationen
empfangen und in den Registern 104 gespeichert. Auf diese Weise werden Informationen zur Bestimmung
von Wörtern nacheinander vom Rechner empfangen, um dabei verschiedene vorgesehene Tonfrequenz-Mitteilungen
bzw. Informationen an die einzelnen Ausgangskanäle zu übertragen. Selbstverständlich
kann an Stelle der Magnettrommel auch ein Magnetplattenspeicher zur Speicherung der Sprachparameter
benutzt werden.
Wie vorstehend erläutert, werden bei der erfindungsgemäßen Vorrichtung Sprachsignale als verdichtete
Informationen unter Verwendung von Teilautokorrelations-Koeffizienten als Parameter aufgezeichnet,
so daß auf wirtschaftliche Weise eine große Anzahl von Wörtern untergebracht und herausgelesen werden
kann. Da außerdem nur ein einziger Digital-Sprach-Frequenzgenerator verwendet wird, kann ein einziger
Frequenzgenerator gemeinsam für zahlreiche Ausgangskanäle, beispielsweise für 64 Kanäle, auf Zeitmultiplexbasis
verwendet werden, was äußerst wirtschaftlich ist.
Hierzu 3 Blatt Zeichnungen
Claims (5)
1. Vorrichtung zur Ableitung von Sprachparametern und zur Erzeugung synthetischer
Sprache mit einer Speichereinrichtung für Sprachparameter, einem elektronischen Rechner, einer
Leseeinrichtung und einem Sprachsignal-Frequenzgenerator, dadurch gekennzeichnet,
daß die Speichereinrichtung vorübergehend Sprachparameter speichert, die Teilautokorrelations-Koeffizienten
zwischen jeweils zwei dicht nebeneinanderliegenden Zeitpunkten (/0 und /3) eines
Sprachsignals und Anregungsinformationen für den Sprachsignal-Frequenzgenerator beinhalten,
welche für mehrere Abtast-Zeitpunkte bestimmt werden, wobei die Teilautokorrelations-Koeffizienten
die Korrelation des Differenzwerts (AX0 bzw. AX3) zwischen zwei nach der Methode des kleinsten
Quadrats aus Abtastwerten (X1 bzw. X2) zwischen
diesen beiden Zeitpunkten vorherbestimmten Fehlerwerten (X0 bzw. X3) und den tatsächlichen
Abtastwerten (AO bzw. X3) des Sprachsignals zu den
beiden Zeitpunkten O0 und /3) darstellen und die
Anregungsinformationen durch Bestimmung der Autokorrelation zwischen weiter voneinander entfernten
Abtastwerten erhalten werden, daß der elektronische Rechner (3) zur Abgabe eines Befehlssignals zwecks Auswahl der Sprachparameter eines
zusammenzusetzenden Sprachsignals, die Leseeinrichtung zum Lesen der durch das Befehlssignal
ausgewählten Sprachparameter aus der Speichereinrichtung und der Sprachsignal-Frequenzgenerator
zum Ansprechen auf das Ausgangssignal der Leseeinrichtung zwecks Zusammensetzen eines
gewünschten Sprachsignals dient, daß ein einen Autokorrelationskoeffizient-Extraktor aufweisender
Sprachparameter-Extraktor (5) mit mehreren in Kaskade geschalteten Teilautokorrelations-Koeffizient-Detektorstufen
vorgesehen ist, von dem jede Detektorstufe (14a ... 14«) ein zum Empfangen
eines Sprachsignals geschaltetes Verzögerungsnetzwerk (7), ein Korrelationskoeffizient-Rechengerät
(8) zum Empfangen des Ausgangssignals des Verzögerungsnetzwerks (7) und zum unmittelbaren Empfangen des Sprachsignals, einen
zum Empfangen des Ausgangssignals des Verzögerungsnetzwerks (7) und des Ausgangssignals
vom Korrelationskoeffizient-Recherigerät (8) geschalteten Multiplier (9), einen unmittelbar zum
Empfangen des Ausgangssignals des Korrelationskoeffizient-Rechengeräts (8) und des Sprachsignals
geschalteten Multiplier (11), ein Addierwerk (10) zum Addieren des Ausgangssignals des Verzögerungsnetzwerks
und des Ausgangssignals des zweitgenannten Multipliers (H), ein Addierwerk (12) zum Addieren des Ausgangssignals des erstgenannten
Multipliers (9) und des Sprachsignals sowie einen Umsetzer (13) zum Quantisieren des
Ausgangssignals des Korrelationskoeffizient-Rechengeräts (8) zur Bestimmung eines Teilautokorrelations-Koeffizienten
zwischen den beiden Zeitpunkten aufweist, und daß an die eine Ausgangsklemme der letzten Detektorstufe (14 n) ein
Autokorrelator (16) angeschlossen und eine Maximalwert-Wähleinrichtung
(17) zur Bestimmung der Periode und Amplitude eines Informationen bezüglich einer Anregungsquelle enthaltenden Signals
aus einer Gruppe von Ausgangssignalen des Autokorrelators (16) vorgesehen ist (F i g. 1 bis 3).
2. Vorrichtung nach Anspruch 1, dadurch gekennzeichnet, daß der Sprachsignal-Frequenzgenerator
einen Impulsgenerator (30) und einen Generator (31) für weißes Rauschen, die durch die
Grundschwingungsperiode der Sprache angesteuert werden, einen mit den Generatoren verbundenen
und durch die Information bezüglich der Grundschwingungsamplitude der Anregungsquelle gesteuerten
Amplitudenregler (32) sowie eine Einrichtung (35a ... 35«) zur Steuerung des Ausgangssignals
des Amplitudenreglers in Überein-Stimmung mit dem durch den elektronischen Rechner bezeichneten Teilautokorrelations-Koeffizienten
aufweist, welche das Sprachsignal durch Korrelation zwischen einer Gruppe von Korrelationskoeffizienten
rekonstruiert (F i g. 6).
3. Vorrichtung nach Anspruch 1, dadurch gekennzeichnet, daß eine Einrichtung (65, 67) zum
Herauslesen einer Gruppe von Digitalcodes aus dem Sprachsignal-Frequenzgenerator auf Zeitmultiplexbasis
und zur Umwandlung der Digitalcodes in impulsamplitudenmodulierte Signale und
eine Takt-Gattereinrichtung (68-1 ... 68-64) zur Verteilung der amplitudenmodulierten Signale auf
mehrere Ausgangskanäle (CH 1 ... CH64) vorgesehen
sind, daß die Einrichtung (60) zur Speicherung der Sprachparameter letztere für mehrere
auszugebende Sprachsignale speichert, daß der elektronische Rechner ein Befehlssignal übermittelt,
welches die Sprachparameter für die betreffenden Ausgangskanäle bestimmt, um die Antworten
mehreren Ausgangskanälen zuzuführen, daß die Leseeinrichtung die durch den elektronischen
Rechner aus der Speichereinrichtung bestimmten Sprachparameter herausliest, daß der Sprachsignal-Frequenzgenerator
mehrere Sprachparametersätze aus der Leseeinrichtung auf Zeitmultiplexbasis
empfängt und eine Gruppe von Digitalcodes bildet, welche entsprechende Sätze des bestimmten Sprachsignals
von den durch die Anregungsquelle erhaltenen Informationen darstellen und letzteren
sowie den Teilautokorrelations-Koeffizienten der betreffenden Sätze der Sprachparameter entsprechen
(F i g. 7).
4. Vorrichtung nach Anspruch 3, gekennzeichnet durch eine zyklische Speichereinrichtung (60) zur
Speicherung der Sprachparameter bezüglich der Anregungsquelle und der Teilautokorrelations-Koeffizienten
für mehrere Spracheinheiten einer vorbestimmten konstanten Länge, die zur Ausgabe
einer Antwort benötigt werden, in mehreren zyklischen Speicheranordnungen, die jeweils in mehrere
Rahmen unterteilt sind, durch Parameter-Pufferspeicher (64-1 ... 64-8) zur vorübergehenden
Speicherung der Sprachparameter der aus der zyklischen Speichereinrichtung herausgelesenen
Spracheinheiten in den betreffenden Rahmen, durch einen Sprachsignal-Frequenzgenerator (65)
mit rein digitalen logischen Einrichtungen, der auf die durch den elektronischen Rechner bestimmten
und zur Beantwortung zu einer Anzahl von Ausgangskanälen zu übertragenden Spracheinheiten
anspricht und die Informationen bezüglich der Anregungsquelle enthaltenden Signale entsprechend
den Sprachinformationen der Sprachparameter in Wechselbeziehung bringt, welche
durch die Parameter-Pufferspeicher unter Steuerung der Teilautokorrelations-Koeffizienten herausgelesen
wurden, so daß die Sprachparameter in eine Gruppe von Digitalcodes umgewandelt werden,
welche Wellenformen der betreffenden bestimmten Sprachsignale darstellen, durch einen Ausgangs-Pufferspeicher
(66) zur vorübergehenden Speicherung der Gruppe von Digitalcodes vom Sprachsignal-Frequenzgenerator
(65) und durch eine Einrichtung (67) zur Umwandlung der aus dem Ausgangs-Pufferspeicher
herausgelesenen Digitalcodes in Analogsignale (F i g. 7).
5. Vorrichtung nach Anspruch 3, gekennzeichnet durch eine Einrichtung (60) zum Speichern von
Sprachparametern, die jeweils Informationen bezüglich der Anregungsquelle und der Teilautokorrelations-Koeffizienten
für mehrere für die Abgabe einer Antwort vorbestimmter Länge erforderliche Spracheinheiten in unbesetzten Adressen
eines Speichers enthalten, durch einen Parameter-Pufferspeicher (98) zur vorübergehenden Speicherung
der Sprachparameter einer Spracheinheit, welche aus einer Adresse im Speicher herausgelesen
wurde und welche der durch den Speicher bestimmten und auf mehreren Ausgangskanälen als
Antwort abzugebenden Spracheinheit entspricht, und durch eine Einrichtung zum aufeinanderfolgenden
Lesen der Sprach parameter aus dem Parameter-Pufferspeicher (98) und zum Eingeben
der herausgelesenen Sprachparameter in den Sprachsignal-Frequenzgenerator (65) (F i g. 14).
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP45010992A JPS527282B1 (de) | 1970-02-07 | 1970-02-07 | |
JP45010993A JPS5229121B1 (de) | 1970-02-07 | 1970-02-07 |
Publications (3)
Publication Number | Publication Date |
---|---|
DE2050512A1 DE2050512A1 (de) | 1971-08-26 |
DE2050512B2 true DE2050512B2 (de) | 1973-09-13 |
DE2050512C3 DE2050512C3 (de) | 1974-04-04 |
Family
ID=26346352
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE2050512A Expired DE2050512C3 (de) | 1970-02-07 | 1970-10-14 | Vorrichtung zur Ableitung von Sprachparametern und zur Erzeugung synthetischer Sprache |
Country Status (5)
Country | Link |
---|---|
US (1) | US3662115A (de) |
DE (1) | DE2050512C3 (de) |
FR (1) | FR2065978A5 (de) |
GB (1) | GB1318985A (de) |
SE (1) | SE361537B (de) |
Families Citing this family (30)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3816722A (en) * | 1970-09-29 | 1974-06-11 | Nippon Electric Co | Computer for calculating the similarity between patterns and pattern recognition system comprising the similarity computer |
US4074069A (en) * | 1975-06-18 | 1978-02-14 | Nippon Telegraph & Telephone Public Corporation | Method and apparatus for judging voiced and unvoiced conditions of speech signal |
JPS6051720B2 (ja) * | 1975-08-22 | 1985-11-15 | 日本電信電話株式会社 | 音声の基本周期抽出装置 |
US4344148A (en) * | 1977-06-17 | 1982-08-10 | Texas Instruments Incorporated | System using digital filter for waveform or speech synthesis |
US4209844A (en) * | 1977-06-17 | 1980-06-24 | Texas Instruments Incorporated | Lattice filter for waveform or speech synthesis circuits using digital logic |
CA1100641A (en) * | 1977-09-16 | 1981-05-05 | Akira Ichikawa | Multifrequency signal receiving system |
US4130729A (en) * | 1977-09-19 | 1978-12-19 | Scitronix Corporation | Compressed speech system |
JPS5919358B2 (ja) * | 1978-12-11 | 1984-05-04 | 株式会社日立製作所 | 音声内容伝送方式 |
US4328008A (en) * | 1979-05-30 | 1982-05-04 | Texaco Development Corporation | Method for the production of cleaned and cooled synthesis gas |
US4479124A (en) * | 1979-09-20 | 1984-10-23 | Texas Instruments Incorporated | Synthesized voice radio paging system |
JPS5650397A (en) * | 1979-10-01 | 1981-05-07 | Hitachi Ltd | Sound synthesizer |
JPS5853358B2 (ja) * | 1980-03-31 | 1983-11-29 | 株式会社東芝 | 音声分析装置 |
JPS56140400A (en) * | 1980-04-03 | 1981-11-02 | Tokyo Shibaura Electric Co | Signal synthesizing circuit |
US4401855A (en) * | 1980-11-28 | 1983-08-30 | The Regents Of The University Of California | Apparatus for the linear predictive coding of human speech |
US4464784A (en) * | 1981-04-30 | 1984-08-07 | Eventide Clockworks, Inc. | Pitch changer with glitch minimizer |
US4378469A (en) * | 1981-05-26 | 1983-03-29 | Motorola Inc. | Human voice analyzing apparatus |
US4443859A (en) * | 1981-07-06 | 1984-04-17 | Texas Instruments Incorporated | Speech analysis circuits using an inverse lattice network |
US4398262A (en) * | 1981-12-22 | 1983-08-09 | Motorola, Inc. | Time multiplexed n-ordered digital filter |
US4544919A (en) * | 1982-01-03 | 1985-10-01 | Motorola, Inc. | Method and means of determining coefficients for linear predictive coding |
JPS5922165A (ja) * | 1982-07-28 | 1984-02-04 | Nippon Telegr & Teleph Corp <Ntt> | アドレス制御回路 |
ATE36206T1 (de) * | 1983-01-03 | 1988-08-15 | Motorola Inc | Verbessertes verfahren und mittel zur bestimmung von koeffizienten zur linearen vorhersagekodierung. |
US4581747A (en) * | 1984-03-05 | 1986-04-08 | At&T Bell Laboratories | Arrangement for equalizing the variable attenuation of a signal on a communication line |
US5315687A (en) * | 1986-03-07 | 1994-05-24 | Adler Research Associates | Side fed superlattice for the production of linear predictor and filter coefficients |
US5237642A (en) * | 1986-03-07 | 1993-08-17 | Adler Research Associates | Optimal parametric signal processor |
US5251284A (en) * | 1986-03-07 | 1993-10-05 | Adler Research Associates | Optimal parametric signal processor with lattice basic cell |
US5101432A (en) * | 1986-03-17 | 1992-03-31 | Cardinal Encryption Systems Ltd. | Signal encryption |
US5265217A (en) * | 1987-03-03 | 1993-11-23 | Adler Research Associates | Optimal parametric signal processor for least square finite impulse response filtering |
US5920842A (en) * | 1994-10-12 | 1999-07-06 | Pixel Instruments | Signal synchronization |
US5587910A (en) * | 1995-02-06 | 1996-12-24 | Rockwell International Corporation | Vehicle navigation system with non-overflow digital filter |
CA2459428A1 (en) * | 2004-03-03 | 2005-09-03 | Spotwave Wireless Inc. | Signal recognition in an on-frequency repeater |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3069507A (en) * | 1960-08-09 | 1962-12-18 | Bell Telephone Labor Inc | Autocorrelation vocoder |
US3209074A (en) * | 1961-06-06 | 1965-09-28 | Ibm | System for multiple output of spoken messages |
US3281789A (en) * | 1962-11-02 | 1966-10-25 | Frederick P Willcox | Multiple remote interrogated information system |
-
1970
- 1970-10-09 GB GB4806570A patent/GB1318985A/en not_active Expired
- 1970-10-09 US US79430A patent/US3662115A/en not_active Expired - Lifetime
- 1970-10-12 SE SE13744/70A patent/SE361537B/xx unknown
- 1970-10-14 DE DE2050512A patent/DE2050512C3/de not_active Expired
- 1970-10-14 FR FR7037183A patent/FR2065978A5/fr not_active Expired
Also Published As
Publication number | Publication date |
---|---|
DE2050512A1 (de) | 1971-08-26 |
SE361537B (de) | 1973-11-05 |
GB1318985A (en) | 1973-05-31 |
DE2050512C3 (de) | 1974-04-04 |
FR2065978A5 (de) | 1971-08-06 |
US3662115A (en) | 1972-05-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE2050512B2 (de) | Vorrichtung zur Ableitung von Sprachparametern und zur Erzeugung synthetischer Sprache | |
DE2524497C3 (de) | Verfahren und Schaltungsanordnung zur Sprachsynthese | |
DE2546446C3 (de) | PCM-Zeitmultiplex-System | |
DE3800065A1 (de) | Schaltungsanordnung zur erstellung von gemaess den wuenschen von kunden zusammengestellten, bespielten tontraegern | |
DE2847801A1 (de) | Digitales einspur-nf-aufzeichnungsgeraet und schaltung mit fehlerkorrektur zur verwendung in diesem | |
DE2920298A1 (de) | Binaere interpolatorschaltung fuer ein elektronisches musikinstrument | |
DE2836738C3 (de) | Verfahren zur Aufzeichnung von beim Spielen eines tastenbetätigten Musikinstruments entstehenden Tonsignalen und den damit verbundenen Spielausdrücken, insbesondere der Lautstärke, entsprechenden Datensignalfolgen auf einem Aufzeichnungsträger und Vorrichtungen zur Durchführung des Verfahrens | |
DE2836736C3 (de) | Verfahren zur Aufzeichnung von beim Spielen eines tastenbetätigten Musikinstruments entstehenden Tonsignalen und den damit verbundenen Spielausdrücken, insbesondere der Lautstärke, entsprechenden Datensignalfolgen auf einem Aufzeichnungsträger und Vorrichtung zur Durchführung des Verfahrens | |
DE2524063C3 (de) | Elektronisches Musikinstrument mit digitaler Musiktonerzeugung | |
DE2628261C2 (de) | Ultraschallwellen-Sende- und -Empfangsvorrichtung | |
EP0010600B1 (de) | Verfahren zur codierten Übertragung von Sprachsignalen, Verwendung des Verfahrens in einem Zeitmultiplex-Übertragungssystem und Anordnung zur Durchführung des Verfahrens | |
DE2429871A1 (de) | Verfahren und einrichtung zum naturgetreuen nachbilden von klaengen unterschiedlicher lautstaerke | |
DE2855151A1 (de) | Digitaler hoertongenerator | |
DE2836737C3 (de) | Verfahren zur Aufzeichnung von beim Spielen eines tastenbetätigten Musikinstruments entstehenden Tonsignalen entsprechenden Datensignalfolgen auf einem Aufzeichnungsträger | |
DE3226619A1 (de) | Modulationseffektvorrichtung | |
DE2637264A1 (de) | Elektronisches musikinstrument | |
DE2854601C2 (de) | Verfahren zur Tonaufbereitung und Ton-Synthesator zu seiner Durchführung | |
DE3226600A1 (de) | Mit einem nachhalltonerzeugungsapparat ausgestattetes elektronisches musikinstrument | |
DE2826570C2 (de) | ||
DE3037276A1 (de) | Tonsynthesizer | |
DE2051589A1 (de) | Anordnung zur Synthese eines Signals | |
DE2335818C3 (de) | Elektrische Anordnung zur automatischen Erzeugung von gesprochenen Sätzen | |
DE2431989A1 (de) | Verfahren und einrichtung zur erzeugung kuenstlichen nachhalls | |
DE2657430A1 (de) | Einrichtung zum synthetisieren der menschlichen sprache | |
EP0094681B1 (de) | Schaltungsanordnung zur elektronischen Sprachsynthese |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C3 | Grant after two publication steps (3rd publication) | ||
E77 | Valid patent as to the heymanns-index 1977 | ||
8328 | Change in the person/name/address of the agent |
Free format text: KERN, R., DIPL.-ING., PAT.-ANW., 8000 MUENCHEN |
|
8327 | Change in the person/name/address of the patent owner |
Owner name: NIPPON TELEGRAPH AND TELEPHONE CORP., TOKIO/TOKYO, |