DE2050512B2 - Vorrichtung zur Ableitung von Sprachparametern und zur Erzeugung synthetischer Sprache - Google Patents

Vorrichtung zur Ableitung von Sprachparametern und zur Erzeugung synthetischer Sprache

Info

Publication number
DE2050512B2
DE2050512B2 DE2050512A DE2050512A DE2050512B2 DE 2050512 B2 DE2050512 B2 DE 2050512B2 DE 2050512 A DE2050512 A DE 2050512A DE 2050512 A DE2050512 A DE 2050512A DE 2050512 B2 DE2050512 B2 DE 2050512B2
Authority
DE
Germany
Prior art keywords
speech
signal
output
parameters
signals
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
DE2050512A
Other languages
English (en)
Other versions
DE2050512A1 (de
DE2050512C3 (de
Inventor
Fumitada Houya Itakura
Tsunehiko Koganei Koike
Masaaki Mitaka Nishikawa
Shuzo Sakuragaoka Saito
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from JP45010992A external-priority patent/JPS527282B1/ja
Priority claimed from JP45010993A external-priority patent/JPS5229121B1/ja
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Publication of DE2050512A1 publication Critical patent/DE2050512A1/de
Publication of DE2050512B2 publication Critical patent/DE2050512B2/de
Application granted granted Critical
Publication of DE2050512C3 publication Critical patent/DE2050512C3/de
Expired legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Time-Division Multiplex Systems (AREA)

Description

Die Erfindung betrifft eine Vorrichtung zur Ableitung von Sprachparametern und zur Erzeugung synthetischer Sprache mit einem elektronischen Rechner, der verschiedene Informationsdienste anbietet, bei welcher die Sprachsignale, die ausgegeben werden sollen, zuvor in Form von Sprachparametern gespeichert werden, um anschließend entsprechend den Befehlen des elektronischen Rechners gelesen und unter Steuerung eines Sprachsignal-Frequenzgenerators wieder zu einer Rede zusammengesetzt zu werden.
Bekannte Vorrichtungen der vorstehend umrissenen Art arbeiten nach dem sogenannten »Kompiler«- Verfahren mit einer bereits aufgezeichneten Sprache, bei welchem im folgenden als »Spracheinheiten« bezeichnete Sprachteile beispielsweise in Form von Wort-Spracheinheiten in einem Speicher gespeichert werden und die gespeicherten Spracheinheiten nacheinander in entsprechender Reihenfolge ausgewählt werden, um sie entsprechend den Befehlen eines elektronischen Rechners zu einer Sprachmitteilung zusammenzustellen. Bei diesem Verfahren werden die Spracheinheiten im allgemeinen unmittelbar als Audiosignale in Analogform aufgezeichnet, wobei als Aufzeichnungsmedium im allgemeinen eine langsam umlaufende Analog-Magnettrommel verwendet wird, deren Umdrehungsperiode der zeitlichen Länge einer Spracheinheit entspricht, so daß sie je Spur eine Spracheinheit aufzeichnet. Bei dieser Konstruktion ist es jedoch schwierig, nicht nur die Kapazität der Analog-Magnettrommeln, sondern auch die Anzahl von Spracheinheiten, die aufgezeichnet werden können, auf 100 bis 200 oder mehr zu erhöhen.
Zur Überwindung dieser Schwierigkeiten des Kompiler-Verfahrens mit vorauf gezeichneten Spracheinheiten besteht die Möglichkeit, an Stelle der unmittelbar aufgezeichneten Sprachsignale Informationen verdichteter Signale aufzuzeichnen, um Sprachsignale mittels eines Sprach-Normal-Frequenzgenerators zu rekonstruieren. Beispielsweise wendet eine derartige auf Tonsignale ansprechende Vorrichtung das Prinzip eines Kanal-Vocoders an (vgl. beispielsweise R. H.
ίο B u r ο η : »IEEE [Transactions on Audio and Electroacustics« Vol.] AU-16, Nr. 1, 1968, S. 21 bis 25), doch ist bei Verwendung eines Kanal-Vocoders die Qualität des Sprachausgangsignals mangelhaft. Außerdem muß an jedem Ausgangskanal ein teurer Sprachsignal-Frequenzgenerator vorgesehen sein.
In den USA.-Patentschriften 3 069 507 und 3 109 070 sind Autokorrelationsvocoder beschrieben, die jeweils einen Autokorrelations-Koeffizienten als Parameter für die Spektrumhüllkurve benutzen; das Frequenzspektrum eines aufgebauten Sprachsignals wird hierbei durch das quadrierte Frequenzspektrum eines tatsächlichen Sprachsignals ausgedrückt. Um ein zusammengesetztes Sprachsignal hoher Güte zu erhalten, muß das Spektrum des zusammengesetzten Sprachsignals, das als Ausgangssignal des Vocoders geliefert wird, vor seiner Weiterverwendung dequadriert werden.
Aufgabe der Erfindung ist demgegenüber in erster Linie die Schaffung einer neuartigen Vorrichtung, welcher ein Sprachsignal in Form eines neuen im folgenden als »Teilautokorrelations-Koeffizient« bezeichneten Parameters eingespeist wird, der zur Bildung einer Anzahl von Spracheinheiten benutzt wird und die Erzeugung von Sprach-Ausgangssignalen ausgezeichneter Qualität ermöglicht. In diesem Zusammenhang bezweckt die Erfindung die Schaffung einer neuartigen Sprachparameter- Extraktionsvorrichtung zur Ableitung von Teilautokorrelations-Koeffizienten und einer Information betreffend die die Sprachsignale erzeugende Anregungsquelle, die Schaffung einer kostensparenden zyklischen Speichervorrichtung, welche mehrere Parameter in Form von Teilautokorrelations-Koeffizienten als Spracheinheiten zu speichern vermag, sowie die Schaffung eines einfachen Sprachsignal-Frequenzgenerators mit mehreren Digitalfiltern in Kaskadenschaltung zui Rekonstruktion einer Sprache aus mehreren aus der Speichervorrichtung ausgewählten Spracheinheiten. .
Vorzugsweise soll bei dieser Sprachsignale verarbeitenden Vorrichtung ein einziger Sprachsignal-Frequenzgenerator gemeinsam für mehrere Ausgangskanäle verwendet werden können.
Diese Aufgabe wird erfindungsgemäß durch die im Patentanspruch 1 angegebenen Maßnahmen gelöst.
Da die abgeleiteten Koeffizienten eng mit der Hüllkurve des Frequenzspektrums des Sprachsignals zusammenhängen, kann eine Sprache aus Informationen bezüglich der Anregungsquelle, wie Grundfrequenz, Amplitude der Grundfrequenz und Geräuschamplitude, zusammengesetzt werden, die aus dem Sprachsignal erhalten werden. Zu diesem Zweck ist ein durch die betreffenden Informationen über die Anregungsquelle gesteuerter Generator vorgesehen, dessen Ausgangssignale durch die Teilautokorrelations-Koeffizienten gesteuert werden, um die Hüllkurve des Frequenzspektrums zu reproduzieren.
Weitere Ausgestaltungen dieser Vorrichtung sind den Unteransprüchen zu entnehmen.
Im folgenden sind einige bevorzugte Ausführungsformen der Erfindung an Hand der Zeichnungen näher erläutert. Es zeigt
F i g. 1 ein schematisches Schaltbild zur Veranschaulichung des Grundprinzips einer Vorrichtung mit den Merkmalen der Erfindung,
F i g. 2 eine Sprachsignalkurve zur Erläuterung des Teilautokorrelations-Koeffizienten,
F i g. 3 ein Schaltbild einer Vorrichtung zum Ableiten der Teilautokorrelations-Koeffizienten und der Anregungsinformationen,
F i g. 4 ein Schaltbild einer Vorrichtung zur Bestimmung des bei der Erfindung verwendeten Korrelations-Koeffizienten,
F i g. 5 ein Schaltbild einer beispielhaften Autokorrelations-Vorrichtung für die Anregungsinformation,
F i g. 6 ein Schaltbild eines beispielhaften Sprachsignal-Frequenzgenerators,
F i g. 7 ein Schaltbild einer erfindungsgemäßen Vorrichtung, bei welcher der Sprachsignal-Frequenzgenerator in Zeitmultiplexschaltung arbeitet,
F i g. 8 eine zyklische Speicheranordnung für die Sprachparameter auf einer Magnettrommel bei der Ausführungsform gemäß F i g. 7,
F i g. 9 ein Blockschaltbild der bei der Ausführungsform gemäß F i g. 7 verwendeten Wort-Synchronisiereinrichtung,
F i g. 10 ein Zeitdiagramm der auf der Magnettrommel aufgezeichneten Steuersignale,
F i g. 11 und 12 ein Blockschaltbild bzw. ein Diagramm der Zeitabhängigkeit der bei der Ausführungsform gemäß F i g. 7 verwendeten Programmsteuerung,
. F i g. 13 ein Blockschaltbild des Eingangssteuerkreises gemäß F i g. 7,
F i g. 14 ein Blockschaltbild einer abgewandelten Vorrichtung mit den Merkmalen der Erfindung und F i g. 15 ein Blockschaltbild des Eingangssteuerkreises bei der Vorrichtung gemäß F i g. 14.
Gemäß F i g. 1 können über einen angeschlossenen Fernsprechapparat 1 und über eine Vermittlung 2 Anfragen nach irgendwelchen Iiuormationen an einen elektronischen Rechner 3 gestellt werden. Wenn diese Verbindung hergestellt ist, wird der Rechner 3 vom Fernsprechapparat 1 angesteuert, und es werden die vom Rechner abgegebenen Signale in Form einer Code-Reihe von auszugebenden Spracheinheiten einer Sprachsignale verarbeitenden Vorrichtung 4 zugeleitet, die Speicher für die Teilautokorrelations-Koeffizienten und für die Informationen bezüglich der Anregungsquelle aufweist, welche zur Zusammenstellung der in Sprachform auszugebenden Antwort nötig sind, und diese Speicher werden beim Auftreten eines vom Rechner 3 abgegebenen Signals abgefragt, um gesprochene Worte aufzubauen. Das hergestellte Sprachsignal wird sodann über die Vermittlung 2 an den Fernsprechapparat 1 übertragen. Gemäß F i g. 1 ist an die Vorrichtung 4 ein Sprachparameter-Extraktor 5 angeschlossen, welcher die Sprachparameter, d. h. die Teilautokorrelations-Koeffizienten und die Informationen bezüglich der Anregungsquelle, die in der Vorrichtung 4 gespeichert werden sollen, aus der Sprache ableitet und gewünschtenfalls die in der Vorrichtung 4 zu speichernden Sprachparameter überprüft oder durch neue ersetzt.
Der Teilautokorrelations-Koeffizient, der den einen der eriindungsgemäß zum Aufbau der Sprache verwendeten Parameter darstellt, läßt sich wie folgt definieren: Wenn das Sprachsignal beispielsweise gemäß F i g. 2 mit einer Frequenz von 8 kHz abgetastet wird, wird die Teilautokorrelation zwischen den Werten des Sprachsignals zu zwei vergleichsweise dicht beieinanderliegenden Abtast-Zeitpunkten round t3 durch Korrelation des Unterschieds AX0 bzw. AX3 zwischen den tatsächlichen Abtastwerten X0 und Xs und zwei nach der Methode des kleinsten Quadrats
ίο vorherbestimmten Werten X0 bzw. X3 ausgedrückt, die durch Auswertung der zu zwei im Zeitintervall zwischen den Zeitpunkten /0 und t3 liegenden Zeitpunkten I1 bzw. t2 abgetasteten Werte X1 und X2 erhalten werden.
Das Intervall zwischen den Abtastzeitpunkten wird fortlaufend auf T, IT, IT, AT... variiert, und es werden die Teilautokorrelations-Koeffizienten für diese Zeitspannen bestimmt. Der Teilautokorrelations-Koeffizient läßt sich durch die Gleichung
Kn = -
E {(A X0) ■ (A Xn)) [E {(Δ X0)2) ■ {(A Xn
(1)
ausdrucken, in welcher nT das Intervall zwischen den Abtastzeitpunkten bedeutet.
Dabei gilt für die Abweichungen ZlX0 und AXn von den vorherbestimmten Werten X0 bzw. Xn unter Verwendung eines Verzögerungs-Operators D:
AXn = "2«iXn-! = [§>d\-Xu = An-^D) ■ Xn, / = o [/ = 0 J £2)
AX0= 2ßt Xn-, = (JT ßtDt)■ Xn = Bn-x(D) ■ Xn, '-1 [l=1 J (3)
worin on und /?,· so ausgewählt sind, daß die Werte von
E {(A XnY) und E{(AXoy} minimal werden, D den durch eine Gleichung
ausgedrückten Operator darstellt und Bn-^(D) Fehleroperatoren sind. Mit diesen Parametern läßt sich der Teilautokorrelations-Koeffizient Kn wie folgt ausdrücken:
Kn = —
E {(An-X(D) ■ Xn) Bn-^D) Xn))
AD) ■ XnY) E ((Bn^1(D)Xn
Es läßt sich nachweisen, daß für An(D), Bn(D) und Kn die Gleichungen
An(D) = An-I(D)-KnBn-AD), (5) Bn(D) = D [Β-Ύ(D) - KnAn-AD)I (6)
gelten.
Wenn also An^(D) und Bn^1(D) bestimmt sind, kann Kn und können damit auch An(D) und Bn(D) bestimmt werden. Auf diese Weise können die Teilautokorrelations-Koeffizienten bestimmt werden. Da sich diese Koeffizienten vergleichsweise allmählich mit der Zeit ändern, werden sie während jeder Periode bestimmt, deren Länge ausreicht, um die erforderlichen Sprachparameter zu ermitteln, ohne daß sich dabei das Wesen der Sprache ändert, beispielsweise alle 15 ms, und der so erhaltene Koeffizient wird dann verschlüsselt und gespeichert.
F i g. 3 zeigt ein Beispiel eines Extraktors 5 zum Ableiten von Teilautokorrelations-Koeffizienten und Informationen bezüglich der Anregungsquelle aus einem Sprachsignal. Der in F i g. 3 dargestellte Extraktor weist « Detektorstufen 14σ bis 14h für Teilautokorrelations-Koeffizienten auf, die in Kaskadenschaltung aufgebaut sind. Da die jeweiligen Detektorstufen jeweils den gleichen Aufbau besitzen, ist im folgenden nur der Aufbau der Stufe 14« näher erläutert. Im einzelnen weist jede, dieser Stufen ein Verzögerungsnetzwerk 7 zur Verzögerung des Sprachsignals um ein Abtastintervall T, ein Rechengerät 8 zur Berechnung des Korrelationskoeffizienten, zwei Multiplier 9 und 11, zwei Addierwerke 10 und 12 sowie einen Umsetzer 13 auf. Eine in F i g. 3 am linken Ende der Detektorstufe 14ö eingezeichnete Eingangsklemme 6 empfängt das Sprachsignal, und die Ausgangsklemmen 15 der Umsetzer 13 der einzelnen Stufen liefern jeweils den in der betreffenden Stufe quantisierten Teilautokorrelations-Koeffizienten. Die Ausgangsklemme des Addierwerks 12 der letzten Detektorstufe 14« ist offen, während die Ausgangs-
[(Bn-AD) Xn + An^1(D) Xn)Y - [(Bn-AD) Xn -
[(Bn-AD) Xn + An-AD) X,,)]2 + [(Bn-AD) Xn ~
Die Tiefpaßfilter 25 bestimmen die Mittelwerte dieser Eingangssignale über eine kurze Zeit. Da die Mittelwerte von (An^(D)XnY und (Bn-^D)Xn)2 annähernd gleich sind, gilt die Gleichung:
Mittelwert von
2 ((An-AD) Xn)2 + (Bn-^D) Xn)2) ,
sä Mittelwert von
4 ((An-AD) Xn)2 ■ (Bn-AD) Xn)2)
wobei der Wert von Kn durch das Ausgangssignal der Verhältnisschaltung 26 gegeben wird. Dieses Ausgangssignal wird den Multipliern 9 und 11 eingespeist, wodurch am Ausgang des Multipliers 11 ein vorbestimmter Wert X1 von X1 auftritt. Das Addierwerk 10 liefert den Unterschied (X1-X1) zwischen dem vorherbestimmten Wert X1 und dem wirklichen Wert X1. Außerdem erzeugt der Multiplier 9 als Ausgangssignal den vorherbestimmten Wert X0 von AT0, und der Addierer 12 liefert den Unterschied (X0-X0). Das Ausgangssignal des Korrelationskoeffizient-Rechengeräts 8 wird dem Umsetzer 13 eingespeist, der daraufhin ein quantisiertes Ausgangssignal des Teilautokorrelations-Koeffizienten an der Klemme 15 erzeugt.
Ähnliche Arbeitsgänge werden auch durch die anderen der Stufe 14a nachgeschalteten Detektorstufen durchgeführt. Im einzelnen liefern die Addierwerke 10 und 12 der zweiten Teilautokorrelations-Kjpeffizienten-Detektorstufe 14d Differenzwerte (X2 — X2) bzw. (Xq — X0) bis zu der letzten Detektorstufe 14« (Xp — Xp) bzw. (AO — AO), wobei in diesem Fall Xv den abgegriffenen Wert des wellenförmigen Tonsignals zu einem Abtastzeitpunkt tp, welcher der p-te Punkt beginnend von t0 ist, darstellt und Xv und AO die vorherbestimmten abgetasteten Werte bei t0 und tv darstellen, die an Hand der abgetasteten Werte zu den beiden Zeitpunkten t0 bzw. /;, vorherbestimmt worden sind. Auf diese Weise werden quantisierte Werte der Teilautokorrelations- Koeffizienten unterschiedlicher klemme des Addierwerks 10 dieser Stufe an einen Autokorrelator 16 angeschlossen ist, dessen Ausgangssignale einem Maximalwertwähler 17 eingespeist werden, welcher an einen von zwei Umsetzern 18 oder 20 angeschlossen werden kann.
Das an der Eingangsklemme 6 erscheinende Sprachsignal wird einerseits über das Korrelationskoeffizient-Rechengerät 8 und den Multiplier 9 dem einen Addierwerk 12 eingespeist, nach dem es im Verzögerungsnetzwerk 7 um eine Abtastperiode T verzögert worden ist, und andererseits über das Rechengerät 8 und den Multiplier 11 dem anderen Addierwerk 11 eingespeist. F i g. 4 zeigt ein Beispiel für den Schaltungsaufbau des Korrelationskoeffizient-Rechengeräts 8 mit Addierwerken 22, Quadriervorrichtungen 23, Addierwerken 24, Tiefpaßfiltern 25 und einer Teil- oder Verhältnisschaltung 26.
Unter der Voraussetzung, daß das Rechengerät 8 zwei Eingangssignale B„-1(D)Xn bzw. An^1(D)Xn empfängt, lassen sich die Eingangssignale der beiden Tiefpaßfilter 25 jeweils durch folgende Gleichungen ausdrucken:
An-I(D) Xn)]2 *=.4 (An _!(D) Xn ■ Bn -\(D) Xn), (7)
An -! (D) XnW = 2 {(An-AP) Xn)2 + (Bn -, (D) XnY) .
Zeitintervalle T, 27, 3T ... pT an den Ausgangsklemmen der betreffenden Umsetzer 13 in den jeweiligen Detektorstufen 14a, \4b ... 14« erzeugt. Wenn das Eingangs-Sprachsignal die letzte Stufe einer Reihe von in Kaskade geschalteten Detektorstufen 14«, 146 ... 14« erreicht, wird die Korrelation zwischen den dicht nebeneinanderliegenden abgetasteten Werten des Sprachsignals aufgehoben, wobei die dem Formant der Sprache entsprechende Autokorrelation eliminiert wird. Die der Grundfrequenz der Sprache entsprechende Korrelation wird jedoch beibehalten, ohne unterdrückt zu werden. Wenn das Ausgangssignal des einen Addierwerks 10 der letzten Teilautokorrelations-Koeffizienten-Detektorstufe 14« an den Autokorrelator 16 angelegt wird, um dessen Autokorrelation zu bestimmen, wird aus diesem Grund eine charakteristische Spitze mit einer der Periode der Grundfrequenz entsprechenden Zeitverzögerung gebildet, wenn das empfangene Sprachsignal ein stimmhafter Laut ist, während keine Spitze gebildet wird, wenn das Sprachsignal ein stimmloser Laut ist. Wenn daher das Eingangs-Sprachsignal ein stimmhafter Laut ist, wird das Ausgangssignal des Autokorrelators 16 an den Maximalwertwähler 17 angelegt und wird die Grundschwingungsperiodendauer der Sprache durch Messung des Intervalls zwischen den Höchstwerten zweier benachbarter Autokorre-Iations-Koeffizienten bestimmt.
In F i g. 5 ist eine Ausführungsform des Autokorrelators 16 beispielhaft dargestellt. Bei dieser Ausführungsform weist der Autokorrelator 16 mehrere Verzögerungsnetzwerke 27, mehrere Multiplier 28 und mehrere Tiefpaßfilter 29 auf. Die Grundschwingungsperiodendauer der Sprache, die durch den Wähler 17 ermittelt wurde, wird durch den Umset/.er 18 qiiantisiert und erscheint dann an einer Auseanasklemme 19 (F ig. 3).
Wenn dagegen das Eingangs-Sprachsignal ein stimmloser Laut ist, erscheint die Grundschwingungsperiodendauer der Sprache nicht an der Klemme 19. In diesem Fall wird diese Ir.formalion als weißes
309 537/419
9 10
Rauschsignal der Information bezüglich der An- dem Multiplier 37 eingespeist. Die Eingangsklemme regungsquelle verwertet. Die vom Amplitudenwert des Verzögerungskreises 40 des Digitalfilters 35« ist des dem Autokorrelator 16 eingespeisten Eingangs- offen, während an der Ausgangsklemme 42 des signals erhaltene Amplitude des die Information be- Digitalfilters 35α das zusammengesetzte Sprach-Auszüglich der Anregungsquelle enthaltenden Signals wird 5 gangssignal erscheint, welches außerdem über ein durch die Umsetzschaltung 20 quantisiert und er- Verzögerungsnetzwerk 43 dem Addierwerk 39 des scheint dann an einer Ausgangsklemme 21. Digitalfilters 35a eingespeist wird. Jedes Digitalfilter Auf diese Weise werden der Teilautokorrelations- 35« ... 35Z> und 35a entspricht einer der Teilauto-Koeffizient und die Information bezüglich der An- korrelations-Koeffizient-Detektorstufen 14« ... 14b regungsquelle, welche für die Zusammenstellung der io und 14a gemäß F i g. 3. Der durch den elektronischen Sprache erforderlich sind, an den Ausgangsklemmen 15, Rechner ausgewählte, an die Eingangsklemme 41 des 19 und 21 erzeugt. Da die zeitmäßige Veränderung Digitalfilters 35« angelegte Teilautokorrelations-Kodes die Information bezüglich der Anregungsquelle effizient ist daher der Teilautokorrelations-Koeffizient, enthaltenden Signals ebenso wie beim Teilautokorre- der durch die Detektorstufe 14n gemäß F i g. 3 erlations-Koeffizient vergleichsweise allmählich erfolgt, 15 zeugt und gespeichert wurde. Auf gleiche Weise wurde reicht es aus, sie beispielsweise alle 15 ms zu bestimmen. der an die Eingangsklemme 41 des Digitalfilters 35a Die erhaltenen Informationen werden verschlüsselt angelegte Teilautokorrelations-Koeffizient vorher und gespeichert. durch die Detektorstufe 14a gemäß F i g. 3 erzeugt.
Erfindungsgemäß werden mehrere Teilautokorre- Ersichtlicherweise sind somit die Übertragungslations-Koeffizienten der Sprache sowie die Grund- 20 funktionen der Digitalfilter gegenüber denen der Teilschwingungs-Periodendauer und die Amplitude der autokorrelations-Koeffizient-Detektorstufen invertiert, Sprache, die als die Informationen bezüglich der An- so daß die Korrelation zwischen den durch eine entregungsquelle enthaltenden Signale verwendet und sprechende Detektorstufe eliminierten Sprachwellendurch die vorstehend beschriebenen Vorgänge er- formen dem Ausgangssignal des Amplitudenreglers 32 halten "werden, in der Vorrichtung 4 gemäß F i g. 1 25 aufgeprägt wird. Wenn dieses Ausgangssignal nachgespeichert. Wenn die Vorrichtung 4 vom Rechner 3 einander durch die Digitalfilter 35« ... 35b und 35a einen Befehl von einer Codereihe empfängt, der die hindurchgelangt, gleicht sich folglich die Hüllkurve zusammenzustellende Rede betrifft, wählt die Vor- des Frequenzspektrums allmählich der Hüllkurve der richtung 4 der Reihe nach die Teilautokorrelations- Originalrede an.
Koeffizienten und die Informationen bezüglich der 30 Wie bereits erwähnt wurde, sind die Frequenz-Anregungsquelle enthaltenden Signale, die im voraus Übertragungscharakteristiken der Digitalfilter 35a, 35b im Speicher gespeichert wurden, entsprechend dem bis 35« (F i g. 6) gegenüber den Frequenzübertragungs-Befehl aus, so daß die betreffende Rede aufgebaut wird. Charakteristiken der in F i g. 3 dargestellten Detektor-
F i g. 6 veranschaulicht ein Blockschaltbild einer stufen 14a, 14b bis 14« für die Teilautokorrelations-
Vorrichtung zum Zusammensetzen der ausgewählten 35 Koeffizienten invertiert; jedes Eingangssignal der
Rede. Diese Vorrichtung weist einen Impulsgenerator Klemme 6 in F i g. 3 und jedes Ausgangssignal der
30 für stimmhafte Laute, einen Generator 31 für Klemme 34 in F i g. 6 besitzt eine flache Hüllkurve des
weißes Rauschen für stimmlose Laute und einen Frequenzspektrums, das geringe Korrelationen zwi-
Amplitudenregler 32 auf, deren Arbeitsweise durch an sehen den abgegriffenen Werten an zwei dicht neben-
Eingangsklemmen 33 und 34 angelegte Signale ge- 40 einanderliegenden Sprachsignalwerten aufzeigt. Des-
steuert wird. Die Klemme 33 empfängt eines der wegen ähnelt die Hüllkurve des Frequenzspektrums
Informationen bezüglich der Anregungsquelle ent- des zusammengesetzten Sprachsignals — das als
haltenden Signale, die vorher in der Vorrichtung 4 Ausgangssignal an Klemme 42 in F i g. 6 erscheint —
gespeichert und durch den elektronischen Rechner 3 der des tatsächlichen Sprachsignals, so daß die
ausgewählt wurden, d. h. die Information, welche 45 Rekonstruktion des Sprachsignals, d. h. die Sprach-
die Grundschwingungsdauer der Sprache betrifft, so synthese von hoher Güte ist.
daß der Impulsgenerator 30 eine Impulsreihe mit der Obgleich bei dieser Ausführungsform der Sprach-Einheitsleistung von derselben Periode wie die Grund- anbauvorrichtung Digitalschaltungen dargestellt sind, Schwingungsperiode erzeugt. Während eines Intervalls, welche die durch die Teilautokorrelations-Koeffizienten in welchem keine sich auf die Periode der Grund- 50 angesteuerten Digitalfilter darstellen, können die schwingung beziehende Information an die Eingangs- Digitalfilter ersichtlicherweise auch durch Analogklemme 33 angelegt wird (d. h. während des stimm- schaltungen ersetzt werden. Bei dem mit Digitallosen Tonintervalls), erzeugt der Generator 31 ein schaltungen arbeitenden System wird es durch VerSignal aus weil; em Rauschen mit der Einheitsleistung, wendung von sehr schnell arbeitenden Elementen Auf gleiche Weise empfängt der Amplitudenregler 32 55 möglich, die Sprachaufbauvorrichtung auf Zeitmultieine Information bezüglich der Signalamplitude und plexbasis zu verwenden, wodurch das mehrfache gleichzeitig ein Informationen bezüglich der An- Ausnutzen der Antwortrede einfach wird, wie dies regungsquelle enthaltendes Signal von der Eingangs- noch näher erläutert werden wird, klemme 34, um die Amplitude des Ausgangssignals Um eine zusammengesetzte Rede ausgezeichneter zu steuern. 60 Qualität zu erzeugen, kann der Maximalwert des
Das Ausgangssignal des Amplitudenreglers 32 wird Zeitunterschieds zwischen den Teilautokorrelations-
mehreren in Kaskade geschalteten Digitalfiltern Koeffizienten etwa 8 T betragen. Wenn der Teilauto-
35« ... 35b und 35a zugeführt, die alle in gleicher korrelations-Koeffizient für jedes Zeitintervall zu
Weise aufgebaut sind und jeweils drei Addierwerke 36, einem aus fünf Bit bestehenden Code verschlüsselt
38 und 39, ein Verzögerungsnetzwerk 40 und einen 65 und mit einer Rahmenperiode von 15 ms extrahiert
Multiplier 37 aufweisen. Ein vorher gespeicherter wird, beträgt die Informationskapazität der Teilauto-
und durch den Rechner ausgewählter Teilauto- korrelations-Koeffizienten 2667 Bit je Sekunde. Wenn
korrelations-Koeffizient wird über eine Klemme 41 andererseits das Informationen bezüglich der An-
11 12
regungsquelle enthaltende Signal mit einer Frequenz parameter zum Aufbau einer Rede auswählt. Wenn bei von 15 Bit je 15 ms geliefert wird, beläuft sich die der erfindungsgemäßen Vorrichtung der Sprach-Gesamtkapazität auf 3667 Bit je Sekunde. Der benutzte Frequenzgenerator auf Zeitmultiplexbasis verwendet Ausdruck »Rahmenperiode« bedeutet eine Periode, in wird, können gleichzeitig mehrere verschiedene Reden welcher die Sprachparameter in einem Speicher 5 zusammengesetzt werden, die gleichzeitig an entgespeichert werden und welche vom Abtastintervall sprechenden Ausgangskanälen auftreten,
zu unterscheiden ist. Im folgenden ist eine verbesserte Sprachsignale ver-
Diese Informationskapazität beläuft sich auf etwa arbeitende Vorrichtung beschrieben, die mehrere
ein Fünfzehntel derjenigen der Sprachwellenform. verschiedene Sprachsignale gleichzeitig über mehrere
Aus diesem Grund kann eine zusammengesetzte Rede ίο Ausgangskanäle abzugeben vermag,
hoher Qualität mit Hilfe von Steuersignalen kleiner Es gibt zahlreiche Arten von Speichervorrichtungen,
Kapazität erzielt werden. Folglich ist es mit Hilfe die Sprachparameter zu speichern vermögen, beispiels-
der erfindungsgemäßen Vorrichtung möglich, die Zahl weise solche mit Magnetkernen, Magnettrommeln,
der zusammensetzbaren Wörter im Vergleich zu her- Magnetplatten usw. Wenn einige tausend Wörter
kömmlichen Vorrichtungen um den Faktor 15 zu 15 gespeichert werden sollen, werden kostensparende
erhöhen. Magnettrommeln großer Kapazität oder Magnet-
Wie erwähnt, weist gemäß F i g. 6 jede Digital- scheibenspeicher bevorzugt. Aus diesem Grund werden filterstufe 35 einen Multiplier 37 und drei Addier- bei den beiden im folgenden beschriebenen Auswerke 36, 38,' 39 auf. Wenn die Arbeitsweise dieses führungsformen der Erfindung Magnettrommelspeicher Multipliers und dieser Addierwerke durch eine Takt- 20 zur Speicherung von Sprachparametern verwendet, frequenz von 10 MHz gesteuert wird, beträgt die Ar- wobei gleichzeitig auf 64 Kanälen Antworten gegeben beitszeit jeder einzelnen Stufe 35 etwa 1,8 Mikro- werden können.
Sekunden. Bei Annahme eines Maximums von 8 Γ für F i g. 7 zeigt ein Schaltbild einer solchen Ausden Zeitunterschied der Teilautokorrelations-Koeffi- führungsform, bei welcher die Sprachinformation eines zienten wird ein abgetasteter Wert der zusammen- 25 Worts auf einer Magnettrommel in Form von Sprachgesetzten Rede innerhalb eines Intervalls von etwa parametern und in solcher Reihenfolge aufgezeichnet 14,4 Mikrosekunden gebildet, doch da jede Stufe ihren wird, daß die Sprachparameter mehrerer Wörter auf Arbeitsgang alle 1,8 Mikrosekunden durchführt, ist Zeit-Multiplexbasis herausgelesen werden können,
es möglich, an den Eingang der Digitalfilter alle F i g. 8 zeigt eine typische Anordnung einzelner 1,8 Mikrosekunden eine Information bezüglich der 30 Sprachparameter auf einer Magnettrommel. Bei dieser Anregungsquelle anzulegen, so daß die zusammen- Anordnung wird in jedem der in F i g. 8 dargestellten gesetzten Sprach-Ausgangssignale alle 1,8 Mikro- Blöcke 73 ein Satz von Sprachparametern aufgezeichsekunden erzeugt werden. Folglich wirkt die genannte net. Jeder Block 73 weist so viel Bit auf, wie für die Periode von 14,4 Mikrosekunden als reine Ver- Aufzeichnung eines Satzes von Sprachparamstern zögerungszeit, die zum Zusammensetzen eines Teils 35 erforderlich sind. Die linken Ziffern in den einzelnen des Sprach-Ausgangssignals erforderlich ist. Bei An- Blöcken bezeichnen die Wortziffern bzw. Sprachnahme einer Abtastfrequenz von 8 kHz für die zu- einheitsziffern, während die rechten Ziffern ihre sammengesetzte Rede können daher im Multiplier Rahmenziffern angeben. Im Fall eines Wortes »1« etwa 64 Kanäle verwendet werden. werden beispielsweise die jeweiligen Sprachparameter,
Bei der erfindungsgemäßen Sprachsignale verarbei- 40 die mit einer Rahmenperiode von 15 ms extrahiert tenden Vorrichtung kann die Periode der Grund- worden sind, in Abständen von jeweils 15 ms in Schwingung durch jede beliebige andere bekannte getrennten Blöcken »1,1«, »1,2« usw. aufgezeichnet, Einrichtung als die beschriebene abgegriffen werden. so daß bei einer Wortdauer von L Sekunden sein letzter Obgleich bei der vorstehend beschriebenen Aus- Sprachparameter in einem vom Block »1,1« um L Seführungsform der Teilautokorrelations-Koeffizient von 45 künden entfernten Block' »1,M< aufgezeichnet wird, einem abgetasteten Wert der Tonsignalwellenform er- Gemäß F i g. 8 ist ein Verhältnis von N = Lj\5 · 10~3 halten wurde, ist zu beachten, daß dieser Koeffizient gegeben. Diejeweiligen Sprachparameter des Wortes »2« durch Vorherbestimmung der Werte zweier dicht werden in Blöcken »2,1«, »2,2« ... »2,N« derselben benachbarter Zeitpunkte durch ein Signal bestimmt zyklischen Speicheranordnung auf derselben Magnetwerden kann, welches zwischen diesen Zeitpunkten 50 trommel gespeichert, wobei diese Blöcke um einen auftritt, worauf die Korrelation der Differenzen Block gegenüber den Blöcken zur Speicherung des zwischen den den vorherbestimmten Werten ent- Wortes »1« versetzt sind. Die Wörter bis zu einem sprechenden wirklichen Werten und den vorher- Wort »M« werden auf gleiche Weise aufgezeichnet, bestimmten Werten ermittelt wird. Obgleich bei der Auf dieselbe Weise werden die jeweiligen Sprachvorher beschriebenen Ausführungsform mehrere Di- 55 parameter anderer Wörter in der anderen zyklischen gitalfilterstufen in Kaskade geschaltet sind, kann Speicheranordnung der Magnettrommel aufgezeichnet, ersichtlicherweise ein einziges Filter wiederholt zur Die Anzahl der Wörter M, die im Multiplex in der-Lieferung der gewünschten zusammengesetzten Rede selben zyklischen Speicheranordnung der Magnetbenutzt werden. trommel, wie vorstehend beschrieben, aufgezeichnet
Die vorstehend beschriebene Sprachsignale ver- 60 werden kann, ist durch die Rahmenperiode von 15 ms arbeitende Vorrichtung weist einen Speicher zur und die Bitzahl der Magnettrommel begrenzt.
Speicherung der Teilautokorrelations-Koeffizienten In der folgenden Beschreibung wird auf eine eines Sprachsignals und der Periode der Grund- Magnettrommel zur Aufzeichnung von Sprachparaschwingung sowie der Signalamplitude, die als In- metern Bezug genommen,die eine Umdrehungsperiode formationen bezüglich der Anregungsquelle benutzt 65 von 20 ms, eine Bitgeschwindigkeit von 2048 kHz, werden, sowie einen Sprach-Frequenzgenerator auf, eine Bitzahl je Spur von 40 960 Bits und 800 Spuren der in Abhängigkeit von einem Befehl eines elektro- aufweist. Weiterhin wird angenommen, daß jeder nischen Rechners die im Speicher gespeicherten Sprach- Block in der zyklischen Speicheranordnung 64 Bit
13 14
enthält. (Obgleich die Größe des Blocks 73 55 Bit durch die Wandler 63-1 bis 63-8 in Sätze paralleler betragen kann, was der Größe eines Satzes von Signale aus jeweils 55 Bit umgewandelt und dann in Sprachparametern entspricht, sind zum Zweck der Parameter-Pufferspeicher 64-1 bis 64-8 eingeschrieben, Erläuterung 64 Bit gewählt worden.) In diesem Fall welche jeden Satz von 55 Bits der Sprachparameter beträgt die Zahl M der Wörter 480, und wenn eine 5 je Wort in der jeweiligen zyklischen Speicheranordnung Wortlänge von etwa 2 Sekunden angenommen wird, zu speichern vermögen. Jeder Parameter-Pufferspeicher würde N etwa 133 betragen. Im Fall einer Wortlänge weist eine Lese-Einschreib-Steuerschaltung auf und von 2 Sekunden ist es unmöglich, in einer einzigen besitzt im allgemeinen zwei Ebenen zum gleichzeitigen Spur alle Sprachparameter aufzuzeichnen, welche die Einschreiben an der einen und Lesen an der anderen zyklische Speicheranordnung gemäß F i g. 8 darstellen. i<> Seite. Die selektiv aus den Parameter-Pufferspeichern Infolgedessen werden in diesem Fall die Spuren bei herausgelesenen Sprachparameter werden dann einem jeder 20 ms dauernden Umdrehung der Trommel der vorher beschriebenen Digital-Sprachfrequenzgenerator Reihe nach weitergeschaltet, so daß eine lange zy- 65 eingespeist, und die von diesem in PCM-Form klische Speicheranordnung der in F i g. 7 dargestellten (Pulscodemodulation) gelieferten Sprachsignale wer-Art mit einer Anzahl von Spuren gebildet wird. Mit 15 den in einen für jeden Ausgangskanal vorgesehenen anderen Worten wird in diesem Fall ein Wort von Ausgangs-Pufferspeicher 66 eingeschrieben, wo sie 2 Sekunden in 100 Spuren gespeichert, die der Reihe während einer Rahmenperiode von 15 ms gespeichert nach weitergeschaltet werden. Genauer gesagt, damit werden. Ähnlich den Paramter-Pufferspeichern 64-1 die Spuren einer Magnettrommel mit einer Drehperiode bis 64-8 weist der Ausgangs-Pufferspeicher 66 zwei von 20 ms zur alle 15 ms erfolgenden Aufzeichnung 20 Ebenen sowie eine Lese-Einschreib-Steuerschaltung auf. der Reihe nach weitergeschaltet werden können, und Der Speicher 66 liefert einem Digital-Analog-Wandler um zu gewährleisten, daß die zyklische Speicher- 67 PCM-Codes in einen jedem Ausgangssignal entanordnung perfekt zyklisch ist, sollte die Dauer des sprechenden Teil, um diese PCM-Codes in PAM-Wortes ein gemeinsames Vielfaches von 20 und 15 ms (Impuls-Amplitudenmodulation)-Signale umzuwansein. Aus diesen Grund wird in der folgenden Be- 25 dein. Das Ausgangssignal des Wandlers 67 wird über Schreibung angenommen, daß ein Wort mit einer PAM-Gatter 68-1 bis 68-64, von denen je eines für Dauer von 1,98 Sekunden auf 99 Spuren aufgezeichnet jeden Ausgangskanal vorgesehen ist, Tiefpaßfiltern 69-1 werden soll, die der Reihe nach weitergeschaltet bis 69-64 eingespeist, um in ein kontinuierliches werden. In diesem Fall ist die Zahl N gemäß F ig. 8 Sprachwellensignal umgewandelt zu werden. Außerdem gleich 132. Wenn die Zahl der Spuren 800 beträgt, 30 ist ein Eingangssteuerkreis 71 vorgesehen, der an den können acht zyklische Speicheranordnungen (F i g. 8) elektronischen Rechner angeschlossen ist und Ingebildet werden. Da, wie erwähnt, die Anzahl der formationen bezüglich der Wortzahl der an jeden Wörter M, die in Multiplex in einer zyklischen Ausgangskanal anzulegenden Wörter empfängt. Um Speicheranordnung (mit 99 Spuren) aufgezeichnet den Signalfluß von den Parameter-Pufferspeichern 64-1 werden, 480 Wörter beträgt, ist es möglich, Sprach- 35 bis 64-8 zu den für jeden Ausgangskanal vorgesehenen parameter der Wörter mit einer Gesamtzahl von PAM-Gattern 68-1 bis 68-64 auf Zeitmultiplexbasis 480 · 8 = 3840 in acht zyklischen Speicheranordnungen zu steuern, ist eine Programmsteuerung 72 vorgesehen, aufzuzeichnen. Weiterhin ist eine Wort-Synchronisierungseinrichtung Die Sprachparameter jedes Wortes werden gemäß 70 zur Gewährleistung eines Befehls nach einer Über-F i g. 8 zyklisch von links nach rechts durch Wieder- 40 tragung an den Rechner und zur Bestimmung der gabe-Schaltkreise herausgelesen, von denen je einer Einschreibadresse in den Parameter-Pufferspeichern für jede zyklische Speicheranordnung vorgesehen ist. 64-1 bis 64-8 vorgesehen. Obgleich neben der Wort-Genauer gesagt, erscheinen bei der zyklischen Speicher- Synchronisierungseinrichtung 70 noch eine Lese-Einanordnung 1 die Sprachparameter des ersten Satzes, schreib-Steuerung für die Magnettrommel vorgesehen bestehend aus den Wörtern »1«, »2« ... »480« der 45 sein muß, ist diese in F i g. 7 nicht dargestellt. Reihe nach im Wiedergabekreis innerhalb einer Die Magnettrommel 60, die Matrizen 61-1 bis 61-8, Rahmenperiode, d.h. in 15 ms. Hierauf erscheinen die Leseverstärker 62-1 bis 62-8 und die Serien-Parallelder Reihe nach die Sprachparameter des zweiten Wandler63-1 bis 63-8 gemäß Fig. 7 können her-Satzes mit den Wörtern »1«, »2« ... »480«. Auf die kömmliche Einrichtungen sein, wie sie üblicherweise gleiche Weise werden aufeinanderfolgende Sätze von 50 in Digitalrechnern verwendet werden. Weiterhin Sprachparametern nacheinander wiedergegeben. Im können die Pufferspeicher 64-1 bis 64-8 und der Aus-Fall einer Wortlänge von 1,98 Sekunden ist ein Arbeits- gangs-Pufferspeicher 66 Magnetkernspeicher sein, wie zyklus beendet, wenn die Sprachparameter der Wörter sie verbreitet in gewöhnlichen elektronischen Rechnern des 132. Satzes erscheinen. als Hauptspeicher verwendet werden. Außerdem Die Ausführungsform gemäß F i g. 7 weist eine 55 können auch der Digital-Analog-Wandler 67, die Magnettrommel 60 zur Aufzeichnung der jeweiligen PAM-Gatter 68 und die Tiefpaßfilter 69 herkömmliche Sprachparameter der betreffenden Wörter in zyklischer Einrichtungen sein, wie sie üblicherweise in PCM-Speicheranordnung gemäß F i g. 8 sowie Spurwähl- Übertragungssystemen verwendet werden, matrizen 61-1 ... 61-8 zum Umschalten der Spuren Im folgenden sind die Einzelheiten der Wortder Magnettrommel 60 bei jeder Umdrehung derselben 60 Synchronisierungseinrichtung 70, des Eingangs-Steuerauf, um acht zyklische Speicheranordnungen mit je- kreises 71 und der Programmsteuerung 72 erläutert, weils einer Periode von 1,98 Sekunden zu bilden. Jede F i g. 9 zeigt ein Beispiel für den Aufbau der Wort-Matrix ist für 99 Spuren vorgesehen, und die Ausgangs- Synchronisiereinrichtung 70. Zwei an der linken Seite signale von den Spurwählmatrizen werden über Lese- von F i g. 9 dargestellte Eingangssignale TIMING und verstärker 62-1 bis 62-8, die jeweils eine entsprechende 65 Abzustellen die Steuersignale dar, die auf bestimmten Impulsformschallung aufweisen, Reihen-Parallel- Spuren des Magnettrommelspeichers 60 gespeichert Wandlern 63-1 bis 63-8 zugeführt. Die aufeinander- wurden. Das Zeitdiagramm dieser Steuersignale ist in folgend herausgelesenen Sprachparameter werden F i g. 10 dargestellt, wonach das Signal TIMING bei
jeder vollen Umdrehung der Magnettrommel erzeugt wird, während das Signal MARK den Block 73 markiert, welcher einem Satz von Sprachparametern gemäß F i g. 8 entspricht. Bei dem in F i g. 8 dargestellten Ausführungsbeispiel enthält jeder Block 64 Bits, so daß ein Satz von Sprachparametern mit 55 Bits in einem Block aufgezeichnet werden kann. Ein in F i g. 10 dargestelltes anderes, mit TAKT bezeichnetes Signal stellt die Bitposition auf der Magnettrommel dar und ist beim vorliegenden Ausführungsbeispiel eine Impulsfolge mit einer Frequenz von 2048 kHz. Da, wie erwähnt, nacheinander auf die Spuren umgeschaltet werden muß, um bei jeder Drehung der Magnettrommel die darauf aufgezeichneten Informationen herauszulesen, werden die TAKT-Signale bei der Schaltung gemäß F i g. 9 durch einen 99-Schritt-Zähler 75 gezählt, um sie so zu entschlüsseln, daß eine abzulesende Spur ausgewählt wird. Das Aiisgangssignal eines Dekoders 74 wird parallel an entsprechende Spurwahlmatrizen 61-1 bis 61-8 angelegt. Ein durch den Zähler 75 erzeugtes Überlaufsignal 68 bedeutet, daß die Periode von 1,98 Sekunden abgelaufen ist und wird dazu benutzt, einen Übertragungsbefehl bzw. ein entsprechendes Signal zum Rechner zu senden. Bei Empfang dieses Signals beginnt der Rechner die vorgesehenen, auf den betreffenden Ausgangskanälen auszusendenden Wortinformationen zu übertragen. Die MARK-lmpulse werden dagegen für die Anzeige der Adressen zum Einschreiben von Sprachparametern gezählt, die der Reihe nach von der Magnettrommel gelesen werden und den entsprechenden Parameter-Pufferspeichern eingeschrieben werden. Da, wie erwähnt, beim Ausführungsbeispiel gemäß F i g. 8 M = 480 ist, werden die MARK-lmpulse durch einen 480-Schritt-Zähler 76 gezählt, wobei die resultierenden, gezählten Werte zur Anzeige der Einschreibadressen der betreffenden Pufferspeicher benutzt werden. Da außerdem jeder Parameter-Pufferspeicher zwei Ebenen besitzt, muß eine einzuschreibende Fläche bestimmt werden. Zu diesem Zweck ist ein Flip-Flop 77 vorgesehen, der das vom 480-Schritt-Zähler 76 gelieferte Überlauf signal 79 empfängt und jedesmal die Polarität seines Ausgangssignals umkehrt, wenn der Zähler 76 in 15 ms bis zu 480 MARK-lmpulse zählt, um die Ebene anzuzeigen, in welche die Information eingeschrieben werden soll. F i g. 11 zeigt ein Beispiel für den Aufbau der Programmsteuerung 72, und F i g. 12 veranschaulicht das Zeitverhältnis zwischen den verschiedenen Signalen in F i g. 11. Die Programmsteuerung 72 wird durch ein von der Magnettrommel geliefertes TAKT-Signal mit einer Frequenz von 2048 kHz betätigt, welches durch einen vier Schritte umfassenden Zähler 80 in ein Signal 87 mit einer Frequenz von 512 kHz umgewandelt wird. Dieses Signal 87 wird einer Zählerschaltung aufgeprägt, die einen Zähler 84 mit 64 Schritten und einen Zähler 85 mit 120 Schritten in Kaskadenschaltung aufweist, wobei der Inhalt dieser Zähler die Adresse des zu diesem Zeitpunkt abzulesenden Ausgangs-Pufferspeichers 66 angibt. Die Adresse wird zum Pufferspeicher 66 übertragen, um den dieser Adresse entsprechenden Inhalt herauszulesen, und der gelesene Inhalt wird durch den Analog-Digital-Wandler 67 in ein Analogsignal umgewandelt. Zu diesem Zeitpunkt entschlüsselt ein Dekodierer 86 das Ausgangssignal des 64-Schritt-Zählers 84 zur Erzeugung von Signalen G-I bis G-64 zum Ansteuern, d. h. zum Durchschalten der PAM-Gatter 68-1 bis 68-64 in den Ausgangskanälen, und zwar in den Zeitverhältnissen gemäß F i g. 12. Auf diese Weise wird das aus dem Ausgangs-Pufferspeicher 66 herausgelesene und durch den Wandler 67 in Analogform umgewandelte Signal zu dem durch den Zähler 84 bestimmten Ausgangskanal übertragen. Das Ausgangs-Signal 87 des 4-Schritt-Zählers 80 wird einer Zählerschaltung eingespeist, die aus einem 120-Schritt-Zähler 81 und einem 64-Schritt-Zähler 82 besteht, welche in Kaskade geschaltet sind. Die Inhalte dieser Zähler zeigen die Adresse an, in welche die zu diesem Zeitpunkt durch den Frequenzgenerator 65 aufgebauten PCM-Code im Ausgangs-Pufferspeicher 66 eingeschrieben werden sollen. Gemäß F i g. 12 wird das Überlauf signal 88 des 120-Schritt-ZähIers 81 alle 234 ms erzeugt und dem nachgeschalteten 64-Schritt-Zähler 82 eingespeist. Außerdem wird das Signal 88 zum Anstoßen des Eingangs-Steuerkreises 71 benutzt. Das Überlaufsignal 89 des 64-Schritt-Tählers 82, das
„ 120 · 64 , .. Λr ■ , · ■ ■·
alle -■·■--— kHz ^ 15 ms erzeugt wird, wird einem
Flip-Flop 83 zugeführt, dessen Binärausgang anzeigt, in welche der beiden Ebenen des Ausgangs-Pufferspeichers 66 eingeschrieben oder welche gelesen werden soll. Das Ausgangssignal 87 des 4-Schritt-Zählers 80 wird dem Frequenzgenerator 65 aufgeprägt und betätigt ihn im Gleichlauf mit dem Einschreib- und Lesevorgang am Ausgangs-Pufferspeicher 66.
Fig. 13 zeigt ein Beispiel für den Aufbau des Eingangs-Steuerkreises 71. Wenn durch das Überlaufsignal 78 ein Übertragungsbefehl von der Wort-Synchronisiereinrichtung 70 zum Rechner übertragen wird, werden Informationen, welche die Wortzahlen der zu den betreffenden Ausgangskanälen C//-1 bis C//-64 zu sendenden Informationen bestimmen, vom Rechner übertragen und vorübergehend in den betreffenden Ausgangskanälen entsprechenden Registern 93-1 bis 93-64 gespeichert. Nach Ablauf der Wortlänge von 1,98 Sekunden gibt die Wort-Synchronisiereinrichtung 70, wie vorher erläutert, ein Befehlssignal an den Rechner ab, doch wird das Signal 78 auch den im Eingangssteuerkreis 71 vorgesehenen Gattern 92 als Durchlaßsignal eingespeist, wodurch der Inhalt von Registern 93 in Register 91-1 bis 91-64 übertragen wird. Wie erwähnt, liefert die Programmsteuerung 72 alle 234 Mikrosekunden ein Startsignal 88 an den Eingangssteuerkreis 71, wobei dieses Zeitintervall von einem 64-Schritt-Zähler 95 gezählt wird. Der Inhalt des Zählers 95 wird durch einen Dekodierer 94 entschlüsselt, welcher Durchlaßsignale 96-1 bis 96-64 für Gatter 90-1 bis 90-64 erzeugt. Beim Durchschalten der Gatter 90-1 bis 90-64 werden die Inhalte der Register 91 nacheinander als gelesene Adressen in Intervallen von 234 Mikrosekunden auf die Parameter-Pufferspeicher 64 übertragen, um diese abzulesen. Wenn bei Annahme einer Wortlänge von 1,98 Sekunden die Inhalte der einzelnen Register 91 132mal (132 Rahmen) zum Parameter-Pufferspeicher 64 übertragen werden, werden die Informationen zur Bestimmung des nächsten Wortes, die vom elektronischen Rechner übertragen wurden und in den entsprechenden Registern 93 gespeichert sind, durch das durch die Wort-Synchronisiereinrichtung 70 zu diesem Zeitpunkt erzeugte Signal 78 in die Register 91 übertragen. Die vorstehend beschriebenen Vorgänge werden im Gleichlauf mit der Worldaucr wiederholt.
Gemäß F i g. 7 werden die aus der Magnettrommel 60 herausgelesenen und in jedem Sat/ in parallele Signale umgewandelten Sprachparameter in die Adrcs-
: 309 537/419
sen der betreffenden Parameter-Pufferspeicher 64-1 bis 64-8 eingeschrieben, welche je Satz den acht zyklischen Speicheranordnungen entsprechen. Folglich besitzt jede Adresse dieser Speicher 64-1 bis 64-8 jeweils 55 Bits für einen Satz von Sprachparametern. Selbstverständlich wird der vorstehend beschriebene Vorgang für die acht zyklischen Speicheranordnungen parallel durchgeführt, so daß ein Satz von Sprachparametern, welcher 3840 Wörter betrifft, auf die vorher beschriebene Weise in die Parameter-Pufferspeicher 64 eingeschrieben wird. Dieser Einschreibvorgang in.die Parameter-Pufferspeicher wird mit einer Rahmenperiode von 15 ms beendet. Sodann beginnt ein Lesezyklus für die Parameter-Pufferspeicher 64 für jeden Ausgangskanal. Während des Ablaufs dieses Lesezyklus werden die Sprachparameter für die nächste Rahmenperiode, die aus der Magnettrommel 60 herausgelesen wurden, in die andere Ebene der Parameter-Pufferspeicher 64 eingeschrieben, die, wie erwähnt, zwei Ebenen aufweisen. Während des Lesezyklus werden die Inhalte der Register 91-1 bis 91-64 des Eingangssteuerkreises 71 entsprechend der Reihenfolge der Ausgangskanäle unter der Steuerung durch das Signal 88 von der Programmsteuerung 72 zu Parameter-Pufferspeichern 64 übertragen, um die Inhalte (Sprachparameter eines Satzes) der Adressen der Parameter-Pufferspeicher 64 herauszulesen, wobei die herausgelesenen Inhalte zum Sprach-Frequenzgenerator 65 gesandt werden. Wie vorstehend im einzelnen erläutert, bewirkt der Frequenzgenerator 65 bei Empfang der herausgelesenen Inhalte eine Zusammenstellung von PCM-Sprachcodes, beispielsweise 120 PAM-Teilen, die innerhalb einer Rahmenperiode erzeugt werden sollen. Diese zusammengestellten Codes werden nacheinander in Adressen des Ausgangs-Pufferspeichers 66 gespeichert, wobei diese Adressen durch den 120-Schritt-Zähler 81, den 64-Schritt-Zähler 82 und das Flip-Flop 83 der Kanal-Programmsteuerung 72 angezeigt werden. Jede Adresse des Ausgangs-Pufferspeichers 66 weist beispielsweise 8 Bits auf, was für die Speicherung eines Satzes von PCM-Sprachcodes ausreicht. Dieser Vorgang wird in einer ein Vierundsechzigstel eines Rahmens (12 ms) bzw. 234 Mikrosekunden entsprechenden Zeitspanne durchgeführt. Infolgedessen wird dieser Vorgang während einer Rahmenperiode für 64 Ausgangskanäle auf Zeitmultiplexbasis durchgeführt. Auf diese Weise werden während einer Rahmenperiode bzw. innerhalb von 15 ms 120 PCM-Codeteile für jeden Ausgangskanal in die den jeweiligen Ausgangskanälen der Ausgangs-Pufferspeicher entsprechenden Adressen eingeschrieben. Die Inhalte des Ausgangs-Pufferspeichers 66 werden auf Zeitmultiplexbasis unter Steuerung der Programmsteuerung 72 im Gleichlauf mit den Gatter-Signalen G-I bis G-64 der PAM-Gatter 68-1 bis 68-64 der entsprechenden Ausgangskanäle herausgelesen. Die gelesenen Signale werden durch den Digital-Analog-Wandler 67 in PAM-Signale umgewandelt, die über entsprechende Tiefpaßfilter 69 als kontinuierliches Sprachband auf die Ausgangskanäle übertragen werden.
Eine Reihe der vorstehend beschriebenen Arbeitsvorgänge wird mit der Rahmenperiode von 15 ms wiederholt, um eine der Wortdauer entsprechende Sprachwelle für die betreffenden Ausgangskanäle zu erzeugen. Die Wortzahlen der das nächste Mal zu behandelnden Wörter sind bereits durch das Überlauf-Signal 78 der Wort-Synchronisiereinrichtung 70 vor Beginn der Behandlung der nächsten Wörter vom Rechner zu den Registern 93 des Eingangs-Steuerkreises 71 übertragen worden. Durch Wiederholung dieser Arbeitsgänge mit einer der Wortdauer entsprechenden Periode von beispielsweise 1,98 Sekunden werden zusammengestellte Sprachsignale an die betreffenden Ausgangskanäle übertragen.
Obgleich beim vorstehend beschriebenen Ausführungsbeispiel der Sprachsignale verarbeitenden
ίο Vorrichtung eine Magnettrommel als Speicher für die Sprachparameter benutzt wird, kann ersichtlicherweise jede andere Art von Speicher benutzt werden, soweit dieser die Sprachparameter in Form von zyklischen Speicheranordnungen aufzuzeichnen vermag.
Im folgenden ist eine weitere Ausführungsform der eine Magnettrommel als Speicher für Sprachparameter verwendenden erfindungsgemäßen Vorrichtung beschrieben. Im Unterschied zur ersten Ausführungsform, bei welcher die aus den jeweiligen Wörtern extrahierten Sprachparameter in Intervallen auf den Spuren einer Magnettrommel aufgezeichnet wurden, werden bei dieser Abwandlung die Sprachparameter kontinuierlich aufgezeichnet, und zwar beginnend mit einer bestimmten Adresse. Genauer gesagt, wird jedes Wort kontinuierlich ohne jede Überlappung in 132 Blöcken aufgezeichnet, falls die Dauer jedes Wortes z. B. 1,98 Sekunden beträgt, und zwar beginnend mit der ersten Adresse der Trommel, die für jedes Wort vorbestimmt ist. Wenn die Wortzahlen der den Ausgangskanälen zuzuführenden Wörter vom elektronischen Rechner übertragen werden, werden Sprach parameter, die jeweils aus 132 Sätzen bestehen, für die an den Ausgangskanälen vorgesehenen Wörter aus der Magnettrommel herausgelesen und im Parameter-Pufferspeicher gespeichert. Danach wird auf dieselbe Weise wie bei der zuerst beschriebenen Ausführungsform das Sprachsignal für jeden Rahmen zusammengesetzt, im Ausgangs-Pufferspeicher gespeichert und als kontinuierliches Sprachsignal für das vorgesehene Wort über den Digital-Analog-Wandler, das PAM-Gatter und das Tiefpaßfilter dem Ausgangskanal zugeführt.
F i g. 14 zeigt diese weitere Ausführungsform der
Erfindung mit einer Magnettrommel 60 zur Speicherung von Sätzen von Sprachsignalen für die betreffenden Wörter, einem Parameter-Pufferspeicher 98 zur vorübergehenden Speicherung der selektiv aus der Magnettrommel 60 herausgelesenen Sprach parameter, einem Eingangssteuerkreis 100 zur Speicherung der vom Rechner übermittelten informationen zur Bestimmung der Wortzahl und zur Übermittlung der herausgelesenen Adresse zum Parameter-Pufferspeicher 98 zu jedem festgelegten Zeitpunkt und einer auf die Befehle des Eingangssteuerkreises 100 ansprechenden Magnettrommelsteuerung 97 zum Lesen des Inhalts aus der Magnettrommel 60 und zum Einschreiben desselben in den Parameter-Pufferspeicher 98. Diese abgewandelte Ausführungsform weist weiterhin einen Sprach-Frequenzgenerator 65 zum Aufbau einer Sprache (aus 120 Teilen) von einem Rahmen (15 ms) aus einem Satz von aus dem Parameter-Pufferspeicher 98 herausgelesenen Sprachparametern auf. Dieser Frequenzgenerator weist Digitalfilter zum Zusammensetzen der Sprachsignale auf Zeitmultiplexbasis für jeden Ausgangskanal, einen Ausgangs-Pufferspeicher 66 zur vorübergehenden Speicherung einer Gruppe von dem durch den Frequenzgenerator 65 aufgebauten Sprachsignal entsprechenden PCM-Codes, einen Digital-Analog-Wandler 67 zur Umwandlung der aus dem
Ausgangs-Pufferspeicher herausgelesenen Digitalcodes in Analogsignale, PAM-Gatter 68-1, 68-2 ... 68-64 zur Verteilung der vom Wandler 67 gelieferten Analogsignale auf die verschiedenen Ausgangskanäle CH-I, CH-I ... CH-64, Tiefpaßfilter 69-1,69-2 ... 69-64 zur Umwandlung der Ausgangssignale der jeweiligen PAM-Gatter in ein kontinuierliches Sprachsignal sowie eine Programmsteuerung 99 zur Steuerung der verschiedenen vorstehend beschriebenen Bauteile auf.
Von diesen Bauteilen sind die Magnettrommel 60, der Parameter-Pufferspeicher 98, der Ausgangs-Pufferspeicher 66, der Wandler 67, die PAM-Gatter 68 und die Tiefpaßfilter 69 ebenfalls herkömmliche Geräte, wie sie verbreitet in elektronischen Rechnern und in PCM-Übertragungssystemen verwendet werden. Die Magnettrommelsteuerung 97 entspricht praktisch einer herkömmlichenMagnettrommel-Kanallesevorrichtung. Bei herkömmlichen Rechnern müssen zum Herauslesen aus der Magnettrommel mittels einer Magnettrommel-Kanallesevorrichtung und zur Speicherung der gelesenen Information im Hauptspeicher, welcher dem Parameter-Pufferspeicher98 gemäß F i g. 14 entspricht, gewisse Einrichtungen vorgesehen sein, um die Adresse an die Magnettrommel-Kanallesevorrichtung zum Ablesen der Trommel, die Anzahl der Wörter und das Einschreiben der Adresse des Hauptspeichers zu geben, doch ist bei der Magnettrommelsteuerung 97 gemäß F i g. 14 die Anzahl der herauszulesenden Wörter konstant gleich 132 Wörtern je Spracheinheit mit einer Länge von 1,98 Sekunden, was durch die Dauer der Spracheinheit bestimmt wird, und ändert sich die Einschreib-Adressedes Parameter-Pufferspeichers regelmäßig, so daß es nicht nötig ist, diese Werte durch den Eingangs-Steuerkreis 100 zu bestimmen. Die Programmsteuerung 99 entspricht praktisch der Programmsteuerung 72 der ersten Ausführungsform, nur mit dem Unterschied, daß sie durch unabhängige Taktsignale gesteuert wird, d. h. mit anderen Worten, nicht mit der Drehung der Magnettrommel synchronisiert wird.
F i g. 15 zeigt die Einzelheiten des Eingangs-Steuerkreises 100. Die vom Rechner übermittelten Informationen zur Bestimmung der an die einzelnen Ausgangskanäle zu sendenden Wörter werden in Registern 104-1, 104-2 ... 104-64 gespeichert, welche den betreffenden Ausgangskanälen CH entsprechen. Die Übertragung dieser Informationen zu Registern 102-1 bis 102-64 erfolgt über Gatter 103-1 bis 103-64, die durch ein Überlaufsignal 111 betätigt werden, welches auch als Übertragungsbefehlssignal für den Rechner dient und durch einen 132-Schritt-Zähler 108 mit einer Periode entsprechend der Wortdauer erzeugt wird. Diese Informationen werden nacheinander in der Reihenfolge der Register 102-1 bis 102-64 zur Magnettrommelsteuerung 97 übertragen, wodurch letztere abgelesen wird. Die Überlaufsignale 88 des Eingangs-Steuerkreises, die von der Programmsteuerung 99 in einem Intervall von 234 Mikrosekunden ausgesandt werden, werden durch einen 132-Schritt-Zähler 105 und einen 64-Schritt-ZähIer 106 gezählt. Der Inhalt des 64-Schritt-Zählers 106 wird durch einen Dekodierer 112 entschlüsselt, der Signale 110-1 bis 110-64 an Gatter 101-1 bis 101-64 abgibt, wodurch diese jeweils etwa 30 ms lang auf Durchlaß geschaltet werden und. die Inhalte der Register 102 nacheinander an die Magnettrommelsteuerung 97 übertragen. Alle Parameter eines durch die Inhalte der Register 102 bestimmten Wortes müssen während der Wortdauer, d. h. innerhalb von 1,98 Sekunden, gelesen
ίο und im Parameter-Pufferspeicher 98 gespeichert werden. Da jedoch eine Magnettrommel· im allgemeinen eine vergleichsweise lange Zugriffszeit hat, dauert es maximal 25 ms, bis die das Wort bestimmende Information vom Eingangssteuerkreis 100 zur Magnettrommel-Steuerung 97 übermittelt wird und alle Parameter der Wörter herausgelesen werden, um sie im Parameter-Pufferspeicher 98 zu speichern. Da die Gatter 101 jeweils 30 ms lang auf Durchlaß geschaltet sind, steht genügend Zeit zum Ablesen der Magnettrommel 60 zur Verfügung.
Die Startsignale 88 des Eingangssteuerkreises werden ebenfalls durch einen 64-Schritt-Zähler 107 und 132-Schritt-Zähler 108 gezählt, und die Inhalte dieser Zähler werden zum Parameter-Pufferspeicher 98 als Adresse für diesen übermittelt, um zu diesem Zeitpunkt abgelesen zu werden. Da das Einschreiben der Sprachparameter von der Magnettrommel 60 und das Lesen der den Eingangssteuerkreis bestimmenden Adresse parallel erfolgen, ist der Parameter-Pufferspeicher 98 wie bei der zuerst beschriebenen Ausführungsform mit zwei Ebenen versehen. Zur Auswahl einer dieser Ebenen ist ein Flip-Flop 109 vorgesehen, das die Polarität des Ausgangssignals in Abhängigkeit vom Überlaufsignal 111 des 132-Schritt-Zählers 108 umkehrt.
Während der Zeitspanne, in welcher die Magnettrommel 60 durch den Inhalt der Register 192 abgelesen wird, werden die vom Rechner zur Bestimmung der nächsten Wörter übermittelten Informationen empfangen und in den Registern 104 gespeichert. Auf diese Weise werden Informationen zur Bestimmung von Wörtern nacheinander vom Rechner empfangen, um dabei verschiedene vorgesehene Tonfrequenz-Mitteilungen bzw. Informationen an die einzelnen Ausgangskanäle zu übertragen. Selbstverständlich kann an Stelle der Magnettrommel auch ein Magnetplattenspeicher zur Speicherung der Sprachparameter benutzt werden.
Wie vorstehend erläutert, werden bei der erfindungsgemäßen Vorrichtung Sprachsignale als verdichtete Informationen unter Verwendung von Teilautokorrelations-Koeffizienten als Parameter aufgezeichnet, so daß auf wirtschaftliche Weise eine große Anzahl von Wörtern untergebracht und herausgelesen werden kann. Da außerdem nur ein einziger Digital-Sprach-Frequenzgenerator verwendet wird, kann ein einziger Frequenzgenerator gemeinsam für zahlreiche Ausgangskanäle, beispielsweise für 64 Kanäle, auf Zeitmultiplexbasis verwendet werden, was äußerst wirtschaftlich ist.
Hierzu 3 Blatt Zeichnungen

Claims (5)

Patentansprüche:
1. Vorrichtung zur Ableitung von Sprachparametern und zur Erzeugung synthetischer Sprache mit einer Speichereinrichtung für Sprachparameter, einem elektronischen Rechner, einer Leseeinrichtung und einem Sprachsignal-Frequenzgenerator, dadurch gekennzeichnet, daß die Speichereinrichtung vorübergehend Sprachparameter speichert, die Teilautokorrelations-Koeffizienten zwischen jeweils zwei dicht nebeneinanderliegenden Zeitpunkten (/0 und /3) eines Sprachsignals und Anregungsinformationen für den Sprachsignal-Frequenzgenerator beinhalten, welche für mehrere Abtast-Zeitpunkte bestimmt werden, wobei die Teilautokorrelations-Koeffizienten die Korrelation des Differenzwerts (AX0 bzw. AX3) zwischen zwei nach der Methode des kleinsten Quadrats aus Abtastwerten (X1 bzw. X2) zwischen diesen beiden Zeitpunkten vorherbestimmten Fehlerwerten (X0 bzw. X3) und den tatsächlichen Abtastwerten (AO bzw. X3) des Sprachsignals zu den beiden Zeitpunkten O0 und /3) darstellen und die Anregungsinformationen durch Bestimmung der Autokorrelation zwischen weiter voneinander entfernten Abtastwerten erhalten werden, daß der elektronische Rechner (3) zur Abgabe eines Befehlssignals zwecks Auswahl der Sprachparameter eines zusammenzusetzenden Sprachsignals, die Leseeinrichtung zum Lesen der durch das Befehlssignal ausgewählten Sprachparameter aus der Speichereinrichtung und der Sprachsignal-Frequenzgenerator zum Ansprechen auf das Ausgangssignal der Leseeinrichtung zwecks Zusammensetzen eines gewünschten Sprachsignals dient, daß ein einen Autokorrelationskoeffizient-Extraktor aufweisender Sprachparameter-Extraktor (5) mit mehreren in Kaskade geschalteten Teilautokorrelations-Koeffizient-Detektorstufen vorgesehen ist, von dem jede Detektorstufe (14a ... 14«) ein zum Empfangen eines Sprachsignals geschaltetes Verzögerungsnetzwerk (7), ein Korrelationskoeffizient-Rechengerät (8) zum Empfangen des Ausgangssignals des Verzögerungsnetzwerks (7) und zum unmittelbaren Empfangen des Sprachsignals, einen zum Empfangen des Ausgangssignals des Verzögerungsnetzwerks (7) und des Ausgangssignals vom Korrelationskoeffizient-Recherigerät (8) geschalteten Multiplier (9), einen unmittelbar zum Empfangen des Ausgangssignals des Korrelationskoeffizient-Rechengeräts (8) und des Sprachsignals geschalteten Multiplier (11), ein Addierwerk (10) zum Addieren des Ausgangssignals des Verzögerungsnetzwerks und des Ausgangssignals des zweitgenannten Multipliers (H), ein Addierwerk (12) zum Addieren des Ausgangssignals des erstgenannten Multipliers (9) und des Sprachsignals sowie einen Umsetzer (13) zum Quantisieren des Ausgangssignals des Korrelationskoeffizient-Rechengeräts (8) zur Bestimmung eines Teilautokorrelations-Koeffizienten zwischen den beiden Zeitpunkten aufweist, und daß an die eine Ausgangsklemme der letzten Detektorstufe (14 n) ein Autokorrelator (16) angeschlossen und eine Maximalwert-Wähleinrichtung (17) zur Bestimmung der Periode und Amplitude eines Informationen bezüglich einer Anregungsquelle enthaltenden Signals aus einer Gruppe von Ausgangssignalen des Autokorrelators (16) vorgesehen ist (F i g. 1 bis 3).
2. Vorrichtung nach Anspruch 1, dadurch gekennzeichnet, daß der Sprachsignal-Frequenzgenerator einen Impulsgenerator (30) und einen Generator (31) für weißes Rauschen, die durch die Grundschwingungsperiode der Sprache angesteuert werden, einen mit den Generatoren verbundenen und durch die Information bezüglich der Grundschwingungsamplitude der Anregungsquelle gesteuerten Amplitudenregler (32) sowie eine Einrichtung (35a ... 35«) zur Steuerung des Ausgangssignals des Amplitudenreglers in Überein-Stimmung mit dem durch den elektronischen Rechner bezeichneten Teilautokorrelations-Koeffizienten aufweist, welche das Sprachsignal durch Korrelation zwischen einer Gruppe von Korrelationskoeffizienten rekonstruiert (F i g. 6).
3. Vorrichtung nach Anspruch 1, dadurch gekennzeichnet, daß eine Einrichtung (65, 67) zum Herauslesen einer Gruppe von Digitalcodes aus dem Sprachsignal-Frequenzgenerator auf Zeitmultiplexbasis und zur Umwandlung der Digitalcodes in impulsamplitudenmodulierte Signale und eine Takt-Gattereinrichtung (68-1 ... 68-64) zur Verteilung der amplitudenmodulierten Signale auf mehrere Ausgangskanäle (CH 1 ... CH64) vorgesehen sind, daß die Einrichtung (60) zur Speicherung der Sprachparameter letztere für mehrere auszugebende Sprachsignale speichert, daß der elektronische Rechner ein Befehlssignal übermittelt, welches die Sprachparameter für die betreffenden Ausgangskanäle bestimmt, um die Antworten mehreren Ausgangskanälen zuzuführen, daß die Leseeinrichtung die durch den elektronischen Rechner aus der Speichereinrichtung bestimmten Sprachparameter herausliest, daß der Sprachsignal-Frequenzgenerator mehrere Sprachparametersätze aus der Leseeinrichtung auf Zeitmultiplexbasis empfängt und eine Gruppe von Digitalcodes bildet, welche entsprechende Sätze des bestimmten Sprachsignals von den durch die Anregungsquelle erhaltenen Informationen darstellen und letzteren sowie den Teilautokorrelations-Koeffizienten der betreffenden Sätze der Sprachparameter entsprechen (F i g. 7).
4. Vorrichtung nach Anspruch 3, gekennzeichnet durch eine zyklische Speichereinrichtung (60) zur Speicherung der Sprachparameter bezüglich der Anregungsquelle und der Teilautokorrelations-Koeffizienten für mehrere Spracheinheiten einer vorbestimmten konstanten Länge, die zur Ausgabe einer Antwort benötigt werden, in mehreren zyklischen Speicheranordnungen, die jeweils in mehrere Rahmen unterteilt sind, durch Parameter-Pufferspeicher (64-1 ... 64-8) zur vorübergehenden Speicherung der Sprachparameter der aus der zyklischen Speichereinrichtung herausgelesenen Spracheinheiten in den betreffenden Rahmen, durch einen Sprachsignal-Frequenzgenerator (65) mit rein digitalen logischen Einrichtungen, der auf die durch den elektronischen Rechner bestimmten und zur Beantwortung zu einer Anzahl von Ausgangskanälen zu übertragenden Spracheinheiten anspricht und die Informationen bezüglich der Anregungsquelle enthaltenden Signale entsprechend den Sprachinformationen der Sprachparameter in Wechselbeziehung bringt, welche
durch die Parameter-Pufferspeicher unter Steuerung der Teilautokorrelations-Koeffizienten herausgelesen wurden, so daß die Sprachparameter in eine Gruppe von Digitalcodes umgewandelt werden, welche Wellenformen der betreffenden bestimmten Sprachsignale darstellen, durch einen Ausgangs-Pufferspeicher (66) zur vorübergehenden Speicherung der Gruppe von Digitalcodes vom Sprachsignal-Frequenzgenerator (65) und durch eine Einrichtung (67) zur Umwandlung der aus dem Ausgangs-Pufferspeicher herausgelesenen Digitalcodes in Analogsignale (F i g. 7).
5. Vorrichtung nach Anspruch 3, gekennzeichnet durch eine Einrichtung (60) zum Speichern von Sprachparametern, die jeweils Informationen bezüglich der Anregungsquelle und der Teilautokorrelations-Koeffizienten für mehrere für die Abgabe einer Antwort vorbestimmter Länge erforderliche Spracheinheiten in unbesetzten Adressen eines Speichers enthalten, durch einen Parameter-Pufferspeicher (98) zur vorübergehenden Speicherung der Sprachparameter einer Spracheinheit, welche aus einer Adresse im Speicher herausgelesen wurde und welche der durch den Speicher bestimmten und auf mehreren Ausgangskanälen als Antwort abzugebenden Spracheinheit entspricht, und durch eine Einrichtung zum aufeinanderfolgenden Lesen der Sprach parameter aus dem Parameter-Pufferspeicher (98) und zum Eingeben der herausgelesenen Sprachparameter in den Sprachsignal-Frequenzgenerator (65) (F i g. 14).
DE2050512A 1970-02-07 1970-10-14 Vorrichtung zur Ableitung von Sprachparametern und zur Erzeugung synthetischer Sprache Expired DE2050512C3 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP45010992A JPS527282B1 (de) 1970-02-07 1970-02-07
JP45010993A JPS5229121B1 (de) 1970-02-07 1970-02-07

Publications (3)

Publication Number Publication Date
DE2050512A1 DE2050512A1 (de) 1971-08-26
DE2050512B2 true DE2050512B2 (de) 1973-09-13
DE2050512C3 DE2050512C3 (de) 1974-04-04

Family

ID=26346352

Family Applications (1)

Application Number Title Priority Date Filing Date
DE2050512A Expired DE2050512C3 (de) 1970-02-07 1970-10-14 Vorrichtung zur Ableitung von Sprachparametern und zur Erzeugung synthetischer Sprache

Country Status (5)

Country Link
US (1) US3662115A (de)
DE (1) DE2050512C3 (de)
FR (1) FR2065978A5 (de)
GB (1) GB1318985A (de)
SE (1) SE361537B (de)

Families Citing this family (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3816722A (en) * 1970-09-29 1974-06-11 Nippon Electric Co Computer for calculating the similarity between patterns and pattern recognition system comprising the similarity computer
US4074069A (en) * 1975-06-18 1978-02-14 Nippon Telegraph & Telephone Public Corporation Method and apparatus for judging voiced and unvoiced conditions of speech signal
JPS6051720B2 (ja) * 1975-08-22 1985-11-15 日本電信電話株式会社 音声の基本周期抽出装置
US4344148A (en) * 1977-06-17 1982-08-10 Texas Instruments Incorporated System using digital filter for waveform or speech synthesis
US4209844A (en) * 1977-06-17 1980-06-24 Texas Instruments Incorporated Lattice filter for waveform or speech synthesis circuits using digital logic
CA1100641A (en) * 1977-09-16 1981-05-05 Akira Ichikawa Multifrequency signal receiving system
US4130729A (en) * 1977-09-19 1978-12-19 Scitronix Corporation Compressed speech system
JPS5919358B2 (ja) * 1978-12-11 1984-05-04 株式会社日立製作所 音声内容伝送方式
US4328008A (en) * 1979-05-30 1982-05-04 Texaco Development Corporation Method for the production of cleaned and cooled synthesis gas
US4479124A (en) * 1979-09-20 1984-10-23 Texas Instruments Incorporated Synthesized voice radio paging system
JPS5650397A (en) * 1979-10-01 1981-05-07 Hitachi Ltd Sound synthesizer
JPS5853358B2 (ja) * 1980-03-31 1983-11-29 株式会社東芝 音声分析装置
JPS56140400A (en) * 1980-04-03 1981-11-02 Tokyo Shibaura Electric Co Signal synthesizing circuit
US4401855A (en) * 1980-11-28 1983-08-30 The Regents Of The University Of California Apparatus for the linear predictive coding of human speech
US4464784A (en) * 1981-04-30 1984-08-07 Eventide Clockworks, Inc. Pitch changer with glitch minimizer
US4378469A (en) * 1981-05-26 1983-03-29 Motorola Inc. Human voice analyzing apparatus
US4443859A (en) * 1981-07-06 1984-04-17 Texas Instruments Incorporated Speech analysis circuits using an inverse lattice network
US4398262A (en) * 1981-12-22 1983-08-09 Motorola, Inc. Time multiplexed n-ordered digital filter
US4544919A (en) * 1982-01-03 1985-10-01 Motorola, Inc. Method and means of determining coefficients for linear predictive coding
JPS5922165A (ja) * 1982-07-28 1984-02-04 Nippon Telegr & Teleph Corp <Ntt> アドレス制御回路
ATE36206T1 (de) * 1983-01-03 1988-08-15 Motorola Inc Verbessertes verfahren und mittel zur bestimmung von koeffizienten zur linearen vorhersagekodierung.
US4581747A (en) * 1984-03-05 1986-04-08 At&T Bell Laboratories Arrangement for equalizing the variable attenuation of a signal on a communication line
US5315687A (en) * 1986-03-07 1994-05-24 Adler Research Associates Side fed superlattice for the production of linear predictor and filter coefficients
US5237642A (en) * 1986-03-07 1993-08-17 Adler Research Associates Optimal parametric signal processor
US5251284A (en) * 1986-03-07 1993-10-05 Adler Research Associates Optimal parametric signal processor with lattice basic cell
US5101432A (en) * 1986-03-17 1992-03-31 Cardinal Encryption Systems Ltd. Signal encryption
US5265217A (en) * 1987-03-03 1993-11-23 Adler Research Associates Optimal parametric signal processor for least square finite impulse response filtering
US5920842A (en) * 1994-10-12 1999-07-06 Pixel Instruments Signal synchronization
US5587910A (en) * 1995-02-06 1996-12-24 Rockwell International Corporation Vehicle navigation system with non-overflow digital filter
CA2459428A1 (en) * 2004-03-03 2005-09-03 Spotwave Wireless Inc. Signal recognition in an on-frequency repeater

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3069507A (en) * 1960-08-09 1962-12-18 Bell Telephone Labor Inc Autocorrelation vocoder
US3209074A (en) * 1961-06-06 1965-09-28 Ibm System for multiple output of spoken messages
US3281789A (en) * 1962-11-02 1966-10-25 Frederick P Willcox Multiple remote interrogated information system

Also Published As

Publication number Publication date
DE2050512A1 (de) 1971-08-26
SE361537B (de) 1973-11-05
GB1318985A (en) 1973-05-31
DE2050512C3 (de) 1974-04-04
FR2065978A5 (de) 1971-08-06
US3662115A (en) 1972-05-09

Similar Documents

Publication Publication Date Title
DE2050512B2 (de) Vorrichtung zur Ableitung von Sprachparametern und zur Erzeugung synthetischer Sprache
DE2524497C3 (de) Verfahren und Schaltungsanordnung zur Sprachsynthese
DE2546446C3 (de) PCM-Zeitmultiplex-System
DE3800065A1 (de) Schaltungsanordnung zur erstellung von gemaess den wuenschen von kunden zusammengestellten, bespielten tontraegern
DE2847801A1 (de) Digitales einspur-nf-aufzeichnungsgeraet und schaltung mit fehlerkorrektur zur verwendung in diesem
DE2920298A1 (de) Binaere interpolatorschaltung fuer ein elektronisches musikinstrument
DE2836738C3 (de) Verfahren zur Aufzeichnung von beim Spielen eines tastenbetätigten Musikinstruments entstehenden Tonsignalen und den damit verbundenen Spielausdrücken, insbesondere der Lautstärke, entsprechenden Datensignalfolgen auf einem Aufzeichnungsträger und Vorrichtungen zur Durchführung des Verfahrens
DE2836736C3 (de) Verfahren zur Aufzeichnung von beim Spielen eines tastenbetätigten Musikinstruments entstehenden Tonsignalen und den damit verbundenen Spielausdrücken, insbesondere der Lautstärke, entsprechenden Datensignalfolgen auf einem Aufzeichnungsträger und Vorrichtung zur Durchführung des Verfahrens
DE2524063C3 (de) Elektronisches Musikinstrument mit digitaler Musiktonerzeugung
DE2628261C2 (de) Ultraschallwellen-Sende- und -Empfangsvorrichtung
EP0010600B1 (de) Verfahren zur codierten Übertragung von Sprachsignalen, Verwendung des Verfahrens in einem Zeitmultiplex-Übertragungssystem und Anordnung zur Durchführung des Verfahrens
DE2429871A1 (de) Verfahren und einrichtung zum naturgetreuen nachbilden von klaengen unterschiedlicher lautstaerke
DE2855151A1 (de) Digitaler hoertongenerator
DE2836737C3 (de) Verfahren zur Aufzeichnung von beim Spielen eines tastenbetätigten Musikinstruments entstehenden Tonsignalen entsprechenden Datensignalfolgen auf einem Aufzeichnungsträger
DE3226619A1 (de) Modulationseffektvorrichtung
DE2637264A1 (de) Elektronisches musikinstrument
DE2854601C2 (de) Verfahren zur Tonaufbereitung und Ton-Synthesator zu seiner Durchführung
DE3226600A1 (de) Mit einem nachhalltonerzeugungsapparat ausgestattetes elektronisches musikinstrument
DE2826570C2 (de)
DE3037276A1 (de) Tonsynthesizer
DE2051589A1 (de) Anordnung zur Synthese eines Signals
DE2335818C3 (de) Elektrische Anordnung zur automatischen Erzeugung von gesprochenen Sätzen
DE2431989A1 (de) Verfahren und einrichtung zur erzeugung kuenstlichen nachhalls
DE2657430A1 (de) Einrichtung zum synthetisieren der menschlichen sprache
EP0094681B1 (de) Schaltungsanordnung zur elektronischen Sprachsynthese

Legal Events

Date Code Title Description
C3 Grant after two publication steps (3rd publication)
E77 Valid patent as to the heymanns-index 1977
8328 Change in the person/name/address of the agent

Free format text: KERN, R., DIPL.-ING., PAT.-ANW., 8000 MUENCHEN

8327 Change in the person/name/address of the patent owner

Owner name: NIPPON TELEGRAPH AND TELEPHONE CORP., TOKIO/TOKYO,