DE2050512A1 - Vorrichtung zur Verarbeitung von Ton bzw Sprachsignalen - Google Patents

Vorrichtung zur Verarbeitung von Ton bzw Sprachsignalen

Info

Publication number
DE2050512A1
DE2050512A1 DE19702050512 DE2050512A DE2050512A1 DE 2050512 A1 DE2050512 A1 DE 2050512A1 DE 19702050512 DE19702050512 DE 19702050512 DE 2050512 A DE2050512 A DE 2050512A DE 2050512 A1 DE2050512 A1 DE 2050512A1
Authority
DE
Germany
Prior art keywords
speech
signal
signals
output
parameters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
DE19702050512
Other languages
English (en)
Other versions
DE2050512B2 (de
DE2050512C3 (de
Inventor
Shuzo Sakuragaoka Itakura Fumitada Houya Nishikawa Masaaki Mitaka Koike Tsunehiko Koganei Tokio Saito (Japan) P
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from JP45010992A external-priority patent/JPS527282B1/ja
Priority claimed from JP45010993A external-priority patent/JPS5229121B1/ja
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Publication of DE2050512A1 publication Critical patent/DE2050512A1/de
Publication of DE2050512B2 publication Critical patent/DE2050512B2/de
Application granted granted Critical
Publication of DE2050512C3 publication Critical patent/DE2050512C3/de
Expired legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Time-Division Multiplex Systems (AREA)

Description

Nippon Telegraph And Telephone Public Corporation
Tokio, Japan 14.10.1970
Vorrichtung zur Verarbeitung von Ton- bzw. Sprachsignalen
Die Erfindung betrifft eine Ton- bzw. Sprachsignale verarbeitende Vorrichtung mit einem elektronischen Pschner, der verschiedene Informationsdienste anbietet, und insbesondere eine neuartige, Ton- bzw. Sprachsignale verarbeitende Vorrichtung, bei welcher die Ton- bzw. Sprachsignale, die f beantwortet werden sollen, zuvor in Form von Sprachparametern gespeichert werden, um anschließend entsprechend den Befehlen eines elektronischen Rechners gelesen und unter Verwendung eines Normal-Prequenzgenerators wieder zu einer Rede zusammengesetzt zu werden.
Bekannte Vorrichtungen der vorstehend umrissenen Art arbeiten nach dem sogenannten "Kompiler"-Verfahren mit einer bereits aufgezeichneten Sprache, bei welchem im folgenden als "Spracheinheiten11 bezeichnete Sprachteile beispielsweise in Form von Wort-Spracheinheiten in einem Speicher gespeichert werden und die gespeicherten Spracheinheiten nacheinander -
in entsprechender Reihenfolge ausgewählt werden, um sie ^
entsprechend den Befehlen eines elektronischen Rechners in eine Sprachmitteilung umzubauen bzw. zusammenzustellen« Bei diesem Verfahren werden die Spracheinheiten im allgemeinen unmittelbar als Audiosignale in Wellenformen aufgezeichnet, wobei als Aufzeichnungsmedium im allgemeinen eine langsam umlaufende Analog-Magnettrommel verwendet wird, deren Umdrehungsperiode der zeitlichen Länge einer Spracheinheit entspricht, so daß sie je Spur eine Spracheinheit
109835/0945
205051?
aufzeichnet. Bei dieser Konstruktion ist es jedoch schweig, nicht nur die Kapazität der Analog-Magnettrommeln sondern auch die Anzahl von Spracheinheiten, die aufgezeichnet werden können, auf 100 bis 200 oder mehr zu erhöhen.
Zur Überwindung dieser Schwierigkeiten des Kompiler-Verfahrens mit voraufgezeichneten Spracheinheiten besteht die Möglichkeit, anstelle der unmittelbar aufgezeichneten Sprachsignale Informationen verdichteter Signale aufzuzeichnen, um Sprachsignale mittels eines Sprach-Normal-Frequenzgenerators zu rekonstruieren. Beispielsweise wendet eine derartige auf Tonsignale ansprechende Vorrichtung das Prinzip eines Kanal-Vokoders (vergl. beispielsweise R.H. Buron: I.E.E,E. Trans. AU-16, 1, 1968), doch ist bei Verwendung eines Kanal-Vokoders die Qualität des Tonausgangsignals mangelhaft. Außerdem muß an jedem Ausgangskanal ein teurer Sprach-Prequenzgenerator vorgesehen sein.
Aufgabe der Erfindung ist demgegenüber in erster Linie die Schaffung einer neuartigen, Ton- bzw. Sprachsignale verarbeitenden Vorrichtung, welcher ein Sprachsignal über einen neuen, im folgenden als "Teilautokorrelations^Koeffizient" bezeichneten Parameter dargeboten bzw. dngespeist wird, der zur Bildung einer Anzahl von Spracheinheiten benutzt wird, so daß Sprach-Ausgangssignale ausgezeichneter Qualität erzeugt werden. In diesem Zusammenhang bezweckt die Erfindung die Schaffung einer neuartigen Sprachparameter-Extraktionsvorrichtung zur Bildung eines Teilautokorrelation-Koeffizienten und einer Information betreffend die die Sprachsignale erzeugende AnregungJ^Hfs Schaffung einer kostensparenden zyklischen Speichervorrichtung, welche mehrere Parameter in Form von Teilautokorrelations-Koeffizienten als Spracheinheiten zu speichern vermag, sowie die Schaffung eines einfachen Sprach-Normal-Frequenzgenerators (synthesizer) mit mehreren Digitalfiltern in Kaskadenschaltung ewp-
1 09835/09A B
zur Rekonstruktion einer Sprache aus mehreren aus der Speichervorrichtung ausgewählten Spracheinheiten.
Vorzugsweise soll bei dieser Ton- bzw« Sprachsignale verarbeitenden Vorrichtung ein einziger Sprach-Normal-Frequenzgenerator gemeinsam für mehrere Ausgangskanäle verwendet werden können.
Diese Aufgabe wird erfindungsgemäß dadurch gelöst, daß jeweils an zwei dicht nebeneinander liegenden Zeitpunkten Sprachsignalwerte ausgewählt und die zwischen diesen
Zeitpunkten liegenden Sprachsignalwerte zur Bestimmung ή
des Unterschieds zwischen nach dem Verfahren der kleinsten Quadrate vorherbestimmten Signalwerten an diesen beiden Zeitpunkten und den zu diesen Zeitpunkten tatsächlich ermittelten Signalwerten, d.h. zur Bestimmung des Teilautokorrelations-Koeffizienten herangezogen werden. Weiterhin ist eine Einrichtung zur Änderung des Zeitintervalls zwischen den beiden Zeitpunkten vorgesehen, um den Teilautokorrelations-Koeffizienten zu zwei neuen Zeitpunkten bestimmen zu können. Durch Wiederholung dieser Vorgänge können mehrere Teilautokorrelations-Koeffizienten bestimmt werden. Da diese Koeffizienten eng mit der Hüllkurve des Frequenzspektrums des Sprachsignals zusammenhängen, kann eine Sprache aus Informationen bezüglich % der Anregungsquelle, wie Grundfrequenz, Amplitude der Grundfrequenz und Geräuschamplitude zusammengesetzt werden, die aus dem Sprachsignal erhalten werden. Zu diesem Zweck ist ein durch die betreffenden Informationen über die Anregungsquelle gesteuerter Generator vorgesehen, dessen Ausgangssignale durch den Teilautokorrelations-Koeffizienten gesteuert werden, um die Hüllkurve des Frequenzspektrums zu reproduzieren.
109835/0945
Erfindungsgemäß kann für die Parameter-Speichervorrichtung zur Speicherung mehrerer Teilautokorrelations-Koeffizienten ein billiger Speicher großer Kapazität verwendet werden, während der Digital-Sprachfrequenzgenerator zur Wiedergabe der HUllkurve des Prequenzspektrums so ausgelegt sein kann, daß er auf Zeitteiler- bzw. Zeitmultiplex-Basls verwendet wird.
Im folgenden sind einige bevorzugte Ausführungsformen der Erfindung anhand der Zeichnungen näher erläutert. Es zeigen:
Fig. 1 ein schematisches Schaltbild zur Veranschaulichung des Grundprinzips einer Ton- bzw. Sprachsignale verarbeitenden Vorrichtung mit den Merkmalen der Erfindung,
Fig. 2 eine Sprachsignal-Kurve zur Erläuterung des Teilautokorrelations-Koeffizienten,
Fig. 3 ein Schaltbild einer Vorrichtung zum Extrahieren der Teilautokorrelations-Koeffizienten und der Informationen bezüglich der Anregungsquelle,
Fig. 4 ein Schaltbild <iner Vorrichtung zur Bestimmung des bei der Erfindung verwendeten Korrelations-Koeffizienten,
Fig. 5 ein Schaltbild einer beispielhaften Autokorrelations-Vorrlchtung,
Fig. 6 ein Schaltbild eines beispielhaften Sprach-Frequenzgenerators,
109835/0945
Fig. 7 ein Schaltbild der erfindungsgemäßen Vorrichtung, bei welcher der Prequenzgenerator in Zeitmultiplexschaltung verwendet wird,
Fig. 8 eine zyklische Speicheranordnung der Sprachparameter auf einer Magnettrommel bei der Ausführungsform gemäß Fig. 7,
Fig. 9 ein Blockschaltbild der bei der Ausführungsform gemäß Fig. 7 verwendeten Wort-Synchronisiereinrichtung,
Fig. 10 ein Zeitdiagramm der auf der Magnettrommel aufgezeichneten Steuersignale,
Fig. 11 ein Blockschaltbild bzw. ein Diagramm der Zeitab- und 12 hängigkeit der bei der AusfUhrungsform gemäß Fig. 7 verwendeten Programmsteuerung,
Fig. 13 ein Blockschaltbild des Eingangssteuerkreises gemäß Fig. 7,
Fig. 14 ein Blockschaltbild einer abgewandelten Vorrichtung mit den Merkmalen der Erfindung und
Fig. 15 ein Blockschaltbild des Eingangssteuerkreises bei der Vorrichtung gemäß Fig. 14.
Gemäß Fig. 1 können über einen angeschlossenen Fernsprechapparat 1 und über eine Vermittlung 2 Anfragen nach irgendwelchen Informationen an einen elektronischen Rechner3gestellt werden. Wenn diese Verbindung hergestellt ist, wird der Rechner 3 vom Fernsprechapparat 1 angesteuert und werden die
- 6 -109835/0945
-6- 2050513
die vom Rechner abgegebenen Signale in Form einer Code-Reihe von zu beantwortenden Spracheinheiten einer Tonbzw. Sprachsignale verarbeitenden Vorrichtung 4 zugeleitet, die Speicher für die Teilautokorrelations-Koeffizienten und für die Informationen bezüglich der Anregungsquelle aufweist, welche zur Zusammenstellung der in Sprachform abgegebenen Antwort nötig sind, und diese Speicher werden beim Auftreten eines vom Rechner 5 abgegebenen Signals abgefragt, um gesprochene Worte aufzubauen. Das hergestellte Sprachsignal wird sodann über die Vermittlung 2 wieder an den Fernsprechapparat 1 übertragen. Gemäß Fig. ist an die Vorrichtung 4 ein Sprachparameter-Extraktor 5 angeschlossen, welcher die Sprachparameter, d.h. die Teilautokorrelat ions-Koeffizient en und die Informationen bezüglich der Anregungsquelle, die in der Vorrichtung 4 gespeichert werden sollen, aus der Sprache aufnimmt und gewünschtenfalls die in der Vorrichtung 4 zu speichernden Sprachparameter überprüft oder durch neue ersetzt.
Der Teilautokorrelations-Koeffizient, der den einen der erfindungsgemäß zum Aufbau der Sprache verwendeten Parameter darstellt, läßt sich wie folgt definieren: Wenn das Sprachsignal beispielsweise gemäß Fig. 2 mit einer Frequenz von 8 kHz abgetastet wird, wird die Teilautokorrelation zwischen den Werten des^Sprachsignale an zwei vergleichsweise dicht beieinander liegenden Abtast-Zeitpunkten tQ und t, durch die Korrelation des Unterschieds X0 bzw. X-j zwischen den tatsächlichen Abtastwerten X0 und X-, und zwei nach der Methode des kleinsten Quadrats vorherbestimmten Werten XQ bzw. X-* ausgedrückt, die durch Verwendung der au zwei im Zeitintervall zwischen den Zeitpunkten tg und t~ liegenden Zeitpunkten t.· bzw. t2 abgetasteten Werte X^ und Xgerhalten werden.
109835/0945
Das Intervall zwischen den AbtastZeitpunkten wird fortlaufend auf T, 2T, 3T, 4T ... variiert und es werden die Teilautokorrelations-Koeffizienten für diese Zeitspannen bestimmt. Der Teilautokorrelations-Koeffizient läßt sich durch die Gleichung
E [(Ax0) (Axn))
K =
ausdrücken, in welcher nT das Intervall zwischen den Abtastzeitpunkten bedeutet. f
Dabei gilt für die Abweichungen ■£$ Xn und ^Δ Xn von den
•ν α υ n vorherbestimmten Werten X0 bzw. Xn unter Verwendung eines Verzögerungs-Operators D:
£ χ0 = )__ ö χ = < Z^ α D1
worin ck^ und ^»i so ausgewählt sind, daß die Werte von
\ χη ) J xrnd E j (^Xn)2J minimal werden, D durch eine Gleichung
den durch eine Gleichung
± i · A
n-1
ausgedrückten Operator darstellt und Bn-^ (D) Fehleroperatoren sind. Mit diesen Parametern läßt sich der Teilautokorrelations-Koeffizient Kn wie folgt ausdrücken:
109835/0945 - 8 -
Eb läßt sich nachweisen, daß für An (D), Bn (D) und Kn die Gleichungen
An <D) - An-1 <D> - KnBn-1 <D> r (5)
gelten.
D[Bn-1 <D> - KnAn-1 (DO (6)
Wenn also A _.. (D) und B1. (D) bestimmt sind, kann Kn und können damit auch An (D) und Bn(D) bestimmt werden. Auf diese Weise können die Teilautokorrelations-Koeffizienten bestimmt werden. Da sich diese Koeffizienten vergleichsweise allmählich mit der Zeit ändern, werden sie während jeder Periode bestimmt, deren Länge ausreicht, um die erforderlichen Sprachparameter zu ermitteln, ohne daß sich dabei das Wesen der Sprache ändert, beispielsweise alle 15 ms, und der so erhaltene Koeffizient wird dann verschlüsselt und gespeichert.
Fig. 3 zeigt ein Beispiel eines Extraktors 5 zum Herausziehen von Teilautokorrelations-Koeffizienten und Informationen bezüglich Anregungsquelle aus einem Sprachsignal. Der in Fig. 3 dargestellte Extraktor weist η Detektorstufen 14a bis I4n für Teilautokorrelations-Koeffizienten auf, die in Kaskadenschaltung aufgebaut sind. Da die jeweiligen Detektorstufen jeweils gleiche Konstruktion besitzen, ist
- 9 -109835/0945
im folgenden nur die Konstruktion der Stufe 14a näher erläutert. Genauer gesagt, weist jede dieser Stufen ein Verzögerungsnetzwerk 7 zur Verzögerung des Sprachsignals um ein Abtastintervall T, ein Rechengerät 8 zur Berechnung des Korrelationskoeffizienten, zwei Multiplier 9 und 11, zwei Addierwerke 10 und 12 sowie einen Größenwandler bzw. Umsetzer 15 auf. Einein Fig. 3 am linken Ende der Detektorstufe 14a eingezeichnete Eingangs-Klemme 6 empfangt das
Sprachsignal und die Ausgangs-Klemmai15 der Umsetzer 15 der ein zelnen Stufen liefern jeweils den in der betreffenden Stufe quantisierten Teilautokorrelations-Koeffizienten. Die Ausgangsklemme des Addierwerksl2der letzten Detektorstufe I4n ist offen, während die Ausgangsklemme des Addierwerks 10 dieser Stufe an einen Autokorrelator 16 angeschlossen ist, dessen Ausgangssignale einem Maximalwert-Wähler 17 eingespeist werden, welcher an einen von zwei Größenwandlern bzw. Umsetzern 18 oder 20 angeschlossen werden kann.
Das an der Eingangs-Klemme 6 erscheinende Sprachsignal wird einerseits über das Korrelationskoeffizient-Rechengerät 8 und den Multiplier 9 dem einen Addierwerk 12 eingespeist, nachdem es im Verzögerungsnetzwerk 7 um eine Abtastperiode T verzögert worden ist, und andererseits über das Rechengerät 8 und den Multiplier 11 dem anderen Addierwerk eingespeist. Fig. 4 zeigt ein Beispiel für den Schaltungsaufbau des Korrelationskoeffizient-Rechengeräts 8 mit Addierwerken 22, Quadriervorrichtungen 2J>, Addierwerken 24, Tiefpaßfiltern 25 und einer Teil-oder Verhältnisschaltung 26,
Unter der Voraussetzung, daß das Rechengerät 8 zwei Eingangssignale Bn-1 (D) Xn bzw. An-1 (D) Xn empfängt, lassen sich die Eingangssignale der beiden Tiefpaßfilter 25 jeweils durch folgende Gleichungen ausdrücken:
- 10 -
109835/0945
Γ ι ν —
(D)Xn + An-1 (D) Xn)2 - (Bn-1 (D)Xn - A^1 (D)Xn)2 = (γ)
Die Tiefpaßfilter 25 bestimmen die Mittelwerte dieser Eingangssignale über eine kurze Zeit. Da die Mittelwerte von (An-1(D)Xn)2 und (Bn-1(D)Xn)2 annähernd gleich sind, gilt die Gleichung:
Mittelwert von 2
Mittelwert von
wobei der Wert von K durch das Ausgangssignal der Verhältnisschaltung 26 gegeberPwird, Dieses Ausgangssignal wird den Multipliern 9 und 11 eingespeist, wodurch am Ausgang des Multipliers 11 ein vorbestimmter Wert X^ von X4 auftritt.
ι 'A
Das Addierwerk 10 liefert den Unterschied (X1. - X1) zwischen dem vorherbestimmten Wert X1 und dem wirklichen Wert X... Außerdem erzeugt der Multiplier 9 als Ausgangssignal den vor-
herbestimmten Wert Xq von XQ und liefert der Addierer 12 den
Unterschied (XQ - X0^* ^as Ausgangssignal des Korrelationskoeffizient-Rechengeräte 8 wird dem Umsetzer 13 eingespeist,
., 11 ~ 109835/0945
der daraufhin ein quantisiertes Ausgangssignal des Teilautokorrelations-Koeffizienten an der Klemme 15 erzeugt.
Ähnliche Arbeitsgänge werden auch durch die anderen, der Stufe 14a nachgeschalteten Detektorstufen durchgeführt. Genauer gesagt, liefern die Addierwerke 10 und 12 der zweiten Teilautokonelations-Koeffizienten-Detektorstufe 14b Differenzwerte (X2 - X2) bzw. (Xq - Xq) bis zu der letzten Detektorstufe I4n (Xp - Xp) bzw.(X0 - Xq), wobei in diesem Pall X den abgegriffenen Wert des wellenförmigen Tonsignals zu einem AbtastZeitpunkt tn, welcher der p-te Punkt beginnend von tn ist, darstellt und
p g n , -
X und X0 die vorherbestimmten abgetasteten Werte bei tQ und ^ t darstellen, die anhand der abgetasteten Werte zu den beiden Zeitpunkten tQ bzw. tp vorherbestimmt worden sind. Auf diese Weise werden quantisierte Werte der Teilautokorrelations-Koeffizienten unterschiedlicher Zeitintervalle T, 2T, ys ... pT an den Ausgangsklemmen der betreffenden Umsetzer 15 in den jeweiligen Detektorstufen 14a, 14b ... I4n erzeugt. Wenn das Eingangs-Sprachsignal die letzte Stufe einer Reihe von in Kaskade geschalteten Detektorstufen 14a, 14b ... I4n erreicht, wird die Korrelation zwischen den dicht nebeneinanderliegenden abgetasteten Werten des Sprachsignals aufgehoben, wobei die dem Formant der Sprache entsprechende Autokorrelatbn eliminiert wird. Die der Grundfrequenz der Sprache entsprechende Korrela- M tion wird jedoch beibehalten, ohne unterdrückt zu werden. Wenn das Ausgangssignal des einen Addierwerks 10 der letzten Teilautokorrelations-Koeffizienten-Detektorstufe I4n an den Autokorrelator 16 angelegt wird, um dessen Autokorrelation zu bestimmen, wird aus diesem Grund eine charakteristische Spitze mit einer der Periode der Grundfrequenz entsprechenden Zeitverzögerung gebildet, wenn das empfangene Sprachsignal ein Stimmlaut ist, während keine Spitze gebildet wird,wenn das Sprachsignal ein stimmloser Laut ist. Wenn daher das Eingangs-Sprachsignal ein Stimmlaut ist, wird das Ausgangssignal des
- 12 -
109835/0945
wert Autokorrelators 16 an den Maximal-Wähler 17 angelegt und wird die Grundschwingungsperiodendauer der Sprache durch Messung des Intervalls zwischen den Höchstwerten zweier benachbarter Autokorrelations-Koeffizienten bestimmt.
In Fig. 5 ist eine Ausführungsform des Autokorrellators beispielhaft dargestellt. Bei dieser Ausführungsform weist der Autokorrelator 16 mehrere Verzögerungsnetzwerke 27, mehrere Multiplier 28 und mehrere Tiefpaßfilter 29 auf. Die Grundschwingungsperiodendauer der Sprache, die durch den Wähler 17 ermittelt wurde, wird durch den Umsetzer quantisiert und erscheint dann an einer Ausgangsklemme (Fig. 5).
Wenn dagegen das Eingangs-Sprachsignal ein stimmloser Ton ist, erscheint die Gnirifeehwingungs-Periodendauer der Sprache nicht an der Klemme 19. In diesem Fall wird diese Information als weißes Rauschsignal der Information bezüglich der Anregungsquelle verwertet.
Die vom Amplitudenwert des dem Autokorrelator 16 eingespeisten Eingangssignale erhaltene Amplitude des die Information bezüglich der Anregungsquelle enthaltenden Signals wird durch die Umsetzschaltung 20 quantisiert und erscheint dann an einer Ausgangsklemme 21.
Auf diese Weise werden der Tellautokorrelations-Koeffizient und die Information bezüglich der Anregungsquelle, welche für die Zusammenstellung der Sprache erforderlich sind, an den Ausgangsklemmen 15, 19 und 21 erzeugt. Da die zeitmäßige Veränderung des die Information bezüglich der Anregungsquelle enthaltenden Signals ebenso wie beim
- 15 -109835/0945
Teilautokorrelations-Koeffizient vergleichsweise allmählich erfolgt, reicht es aus, sie beispielsweise alle 15 ms zu bestimmen. Die erhaltenen Informationen werden verschlüsselt und gespeichert.
Erfindungsgemäß werden mehrere Teilautokorrelations-Koeffizienten der Sprache sowie die Grundschwingungs-Periodendauer und die Amplitude der Sprache, die als die Informationen bezüglich der Anregungsquelle enthaltenden Signale verwendet und durch die vorstehend beschriebenen Vorgänge erhalten werden, in der Vorrichtung 4 gemäß Fig. 1 gespeichert. Wenn die Vorrichtung 4 vom Rechner 3 einen Befehl von einer Codereihe empfängt, der die zusammenzustellende Rede betrifft, wählt die Vorrichtung 4 der Reihe nach die Teilautokorrelations-Koeffizienten und die Informationen bezüglich der Anregungsquelle enthaltenen Signale, die im voraus im Speicher gespeichert warden, entsprechend dem Befehl aus, so daß die betreffende Rede aufgebaut wird.
Fig. 6 veranschaulicht ein Blockschaltbild einer Vorrichtung zum Zusammensetzen der ausgewählten Rede. Diese Vorrichtung weist einen Impulsgenerator 30 für Stimmlaute, einen Generator 31 für weißes Rauschen für stimmlose Laute und einen Amplituden-Regler 32 auf, deren Arbeitsweise durch an Eingangs-Klemmen 33 und 34 angelegte Signale gesteuert wird. Die Klemme 33 empfängt eines der Informationen bezüglich der Anregungsquelle enthaltenden Signale, die vorher in der Vorrichtung 4 gespeichert und durch den elektronischen Rechner 3 ausgewählt wurden, d.h. die Information, welche die Grundschwingungsdauer der Sprache betrifft, so daß der Impulsgenerator 30 eine Impulsreihe mit der Einheitsleistung von derselben Periode wie die Grundschwingungsperiode erzeugt. Während eines Intervalls, in welchem keine sich auf die Periode
- 14 -109835/0945
der Grundschwingung beziehende Information an die Eingangsklemme 33 angelegt wird (d.h. während des stimmlosen Tonintervalls) , erzeugt der Generator 31 ein Signal aus weißem Räuschen mit der Einheitsleistung. Auf gleiche Weise empfängt der Amplitudenregler 32 eine Information bezüglich der Signalamplitude und gleichzeitig ein Informationen bezüglich der Anregungsquelle enthaltendes Signal von der Eingangs-Klemme 34, um die Amplitude des Ausgangssignals zu steuern.
Das Ausgangssignal des Amplituden-Reglers 32 wird mehreren in Kaskade geschalteten Digitalfiltern 35n ··· 35b und 35a zugeführt, die alle in gleicher Weise aufgebaut sind und jeweils drei Addierwerke 36, 38 und 39# ein Verzögerungsnetzwerk 40 und einen Multiplier 37 aufweisen. Ein vorher gespeicherter und durch den Rechner ausgewählter Teilautokorrelations-Koeffizient wird über eine Klemme 41 dem Multiplier 37 eingespeist. Die Eingangs-Klemme des Verzögerungskreises 40 des Digitalfilters 35n ist offen, während an der Ausgangs-Klemme 42 des Digitalfilters 35a das zusammengesetzte Sprach-Ausgangssignal erscheint, welches außerdem über ein Verzögerungsnetzwerk 43 dem Addierwerk 39 des Digitalfilters 35a eingespeist wird. Jedes Digitalfilter 35n 35^ und 35a entspricht einer der Teilautokorrelations-Koeffizient-Detektorstufen I4n τ.. I4b und I4a gemäß Fig„ 3· Der durch den elektronischen Rechner ausgewählte, an die Eingangs-Klemme 41 des Digitalfilters 35n angelegte Teilautokorrelations-Koeffizient ist daher der Teilautokorrelations-Koeffizient, der durch die Detektorstufe I4n gemäß Fig. 3 erzeugt und gespeichert wurde. Auf gleiche Weise wurde der an die Eingangsklemme des Digitalfilters 35a angelegte Teilautokorrelations-Koeffizient vorher durch die Detektorstufe I4a gemäß Fig. 3 erzeugt. Ersichtlicherweise sind somit die Ubertragungsfunktionen der Digitalfilter
- 15 109835/0945
gegenüber denen der Teilautokorrelations-Koeffizient-Detektorstufen invertiert, so daß die Korrelation zwischen den durch eine entsprechende Detektorstufe eliminierten Sprachwellenformen dem Ausgangssignal des Amplituden-Reglers 32 aufgeprägt wird. Wenn dieses Ausgangssignal nacheinander durch die Digitalfilter 35n ... 35b und 35a hindurchgelangt, gleicht sich folglich die Hüllkurve des Frequenzspektrums allmählich der Hüllkurve der Origjnalrede an.
Obgleich bei dieser Ausführungsform der Sprachaufbauvor- Λ
richtung Digitalschaltungen dargestellt sind, welche die ™
durch die Teilautokorrelations-Koeffizienten angesteuerten Digitalfilter darstellen, können die Digitalfilter ersichtlicherweise auch durch Analogschaltungen ersetzt werden. Bei dem die Digitalschaltungen verwendenden System wird es durch Verwendung von sehr schnell arbeitenden Elementen möglich, die Sprachaufbauvorrichtung auf Zeitmultiplexbasis zu verwenden, wodurch das mehrfache Ausnutzen der Antwortrede einfach wird, wie dies noch näher erläutert werden wird.
Um erfindungsgemäß eine zusammengesetzte Rede ausgezeichneter Qualität zu erzeugen, kann der Maximalwert des Zeitunter- λ
schieds zwischen dem Teilautokorrelations-Koeffizienten etwa 8t betragen. Wenn der Teilautokorrelations-Koeffizient für jedes Zeitintervall zu einem aus fünf Bit bestehenden Code verschlüsselt und mit einer Rahmenperiode von 15ms extrahiert wird, beträgt die Informationskapazität der Teilautokorrelations-Koeffizienten 2667 Bit je Sekunde. Wenn andererseits das Informationen bezüglich der Anregungsquelle enthaltende Signal mit einer Frequenz von 15 Bit je 15 ms geliefert wird, beläuft sich die Gesamtkapazität auf 3667 Bit je Sekunde. Der benutzte Ausdruck "Rahmenperiode"
- 16 -
109835/0945
bedeutet eine Periode, in welcher die Sprachparameter in einem Speicher gespeichert werden und welche vom Abtastintervall zu unterscheiden ist.
Diese Informationskapazität beläuft sich auf etwa 1/15 derjenigen der Sprachwellenform. Aus diesem Grund kann eine zusammengesetzte Rede hoher Qualität mit Hilfe von Steuersignalen kleiner Kapazität erzielt werden. Folglich ist es mit Hilfe der erfindungsgemäßen Vorrichtung möglich, die Zahl der zusammensetzbaren Wörter im Vergleich zu herkömmlichen Vorrichtungen um den Paktor 15 zu erhöhen.
Wie erwähnt, w6ist gemäß Fig. 6 jede Digitalfilterstufe 55a einen Multiplier yj und drei Addierwerke J>6, ?8, 39 auf. Wenn die Arbeitsweise dieses Multipliers und dieser Addierwerke durch eine Taktfrequenz von 10 MHz gesteuert wird, beträgt die Arbeitszeit jeder einzelnen Stufe 35 etwa 1,8 Mikrosekunden. Bei Annahme eines Maximums von 8T für den Zeitunterschied der Teilautokorrelations-Koeffizienten wird ein abgetasteter Wert der zusammengesetzten Rede innerhalb eines Intervalls von etwa 14,4 Mikrosekunden gebildet, doch da jede Stufe ihren Arbeitsgang alle 1,8 Mikrosekunden durchführt, ist es möglich, an den Eingang der Digitalfilter alle 1,8 Mikrosekunden eine Information bezüglich der Anregungsquelle anzulegen, so daß die zusammengesetzten Sprach-Ausgangssignale alle 1,8 Mikrosekunden erzeugt werden. Folglich wirkt die gennante Periode von 14,4 Mikrosekunden als reine Verzögerungszeit, die zum Zusammensetzen eines Teils des Sprach-Ausgangssignals erforderlich ist. Bei Annahme einer Abtastfrequenz von 8 kHz für die zusammengesetzte Rede können daher im Multiplier etwa vierundsechzig Kanäle verwendet werden.
- 17 -
109835/0945
Bei der erfindungsgemäßen Ton- bzw. Sprachsignale verarbeitenden Vorrichtung kann die Periode der Grundschwingung durch jede beliebige andere bekannte Einrichtung als die beschriebene abgegriffen werden. Obgleich bei der vorstehend beschriebenen Ausführungsform der Teilautokorrelations-Koeffizient von einem abgetasteten Wert der Tonsignalwellenform erhalten wurde, ist zu beachten, daß dieser Koeffizient durch ■Vorherbestimmung der Werte zweier dicht benachbarter Zeitpunkte durch ein Signal bestimmt werden kann, welches zwischen diesen Zeitpunkten auftritt, worauf die Korrelation der Differenzen zwischen den den vorherbestimmten Werten entsprechenden wirklichen Werten und den vorherbestimmten Werten ermittelt · j wird. Obgleich bei der vorher beschriebenen Ausführungsform mehrere Digitalfilterstufen in Kaskade geschaltet sind, kann ersichtlicherweise ein einziges Filter wiederholt zur Lieferung der gewünschten zusammengesetzten Rede benutzt werden.
Die vorstehend beschriebene Ton- bzw. Sprachsignale verarbeitende Vorrichtung weist einen Speicher zur Speicherung der Teilautokorrelations-Koeffizienten eines Sprachsignals und der Periode der Grundschwingung sowie der Signalamplitude, die als Informationen bezüglich der Anregnngsquelle benutzt werden, sowie einen Sprach-Prequenzgenerator auf, der in Abhängigkeit von einem Befehl eines elektronischen Rechners Λ
die im Speicher gespeicherten Sprachparameter zum Aufbau einer Rede auswählt. Wenn bei der erfindungsgemäßen Vorrichtung der Sprach-Prequenzgenerator auf Zeitteiler- bzw. Zeitmultiplexbasis verwendet wird, können gleichzeitig mehrere verschiedene Reden zusammengesetzt werden, die gleichzeitig an entsprechenden Ausgangskanälen auftreten.
Im folgenden ist eine verbesserte Ton- bzw. Sprachsignale verarbeitende Vorrichtung beschrieben, die mehrere verschiedene Sprachsignale gleichzeitig über mehrere Ausgangskanäle abzugeben vermag. - 18 -
109835/0945
Es gibt zahlreiche Arten von Speichervorrichtungen, die Sprachparameter zu speichern vermögen, beispielsweise solche mit Magnetkernen, Magnettrommeln, Magnetplatten usw. Wenn einige tausend Worter gespeichert werden sollen, werden kostensparende Magnettrommeln großer Kapazität oder Magnetscheibenspeicher bevorzugt. Aus diesem Grund werden bei den beiden im folgenden beschriebenen Ausführungsformen der Erfindung Magnettrommelspeicher
109835/0945
zur Speicherung von Sprachparametern verwendet, wobei gleichzeitig auf vierundsechzig Kanälen Antworten gegeben werden können.
Fig. 7 zeigt ein Schaltbild einer solchen Ausführungsform, bei welcher die Spracheinheit bzw. Sprachinformation eines Worts auf dner Magnettrommel in Form eines Sprachparameters und in solcher Reihenfolge aufgezeichnet wird, daß die Sprachparameter mehrerer Wörter auf Zeitteiler- bzw. Zeit-Multiplexbasis herausgelesen werden können.
Fig. 8 zeigt eine typische Anordnung einzelner Sprachparameter M auf einer Magnettrommel. Bei dieser Anordnung wird in jedem der in Fig. 8 dargestellten Blöcke 735 ein Satz von Sprachparametern aufgezeichnet. Jeder Block 75 weist soviel Bit auf, wie für die Aufzeichnung eines Satzes von Sprachparametern erforderlich ist. Die linken Ziffern in den einzelnen Blöcken bezeichnen die Wortziffern bzw. Spracheinheitsziffern, während die rechten Ziffern ihre Rahmenziffern angeben. Im Fall eines Worts "1" werden beispielsweise die jeweiligen Sprachparameter, die mit einer Rahmenperiode von 15 ms extrahiert worden sind, in Abständen von jeweils 15 ms in getrennten Blöcken "1,1", "1,2" usw. aufgezeichnet, so daß bei einer Wortdauer von L Sekunden sein letzter Sprachparameter in einem vom Block "1, 1" um L Sekunden entfernten Block "1, N" aufge- | zeichnet wird. Gemäß Fig. 8 ist ein Verhältnis von N = L/15x1O"5 gegeben. Die jeweiligen Sprachparameter des Worts "2" werden in Blöcken "2, 1","2,2" ... "2, N" derselben zyklischen Speicheranordnung auf derselben Magnettrommel gespeichert, wobei diese Blöcke um einen Block gegenüber den Blöcken zur Speicherung des Worts "1" versetzt sind. Die Worte bis zu einem Wort "M" werden auf gleiche Weise aufgezeichnet. Auf dieselbe Weise werden die jeweiligen Sprachparameter anderer Worte in der anderen zyklischen Speicheranordnung der Magnettrommel
- 20 -
109835/09Λ5
aufgezeichnet. Die Anzahl der Worte M, die im Multiplex in derselben zyklischen Speicheranordnung der Magnettrommel wie vorstehend beschrieben aufgezeichnet werden kann, ist durch die Rahmenperiode von 15 ms und die Bitzahl der Magnettrommel begrenzt.
In der folgenden Beschreibung wird auf eine Magnettrommel zur Aufzeichnung von Sprachparametern Bezug genommen, die eine Umdrehungsperiode von 20 ms, eine Bitgeschwindigkeit von 2048 kHz, eine Bitzahl «Je Spur von 40960 Bits und 800 Spuren aufweist. Weiterhin wird angenommen, daß jeder Block in der zyklischen Speicheranordnung 64 Bit enthält. (Obgleich die Größe des Blocks 73 55 Bit betragen kann, was der Größe eines Satzes von Sprachparametern entspricht, sind zum Zweck der Erläuterung 64 Bit gewählt worden.) In diesem Fall beträgt die Zahl M der Wörter 480, und wenn eine Wortlänge von etwa 2 s angenommen wird, würde N etwa 133 betragen. Im Fall einer Wortlänge von 2 s ist es unmöglich, in einer einzigen Spur alle Sprachparameter aufzuzeichnen, welche die zyklische Speicheranordnung gemäß Fig. 8 darstellen. Infolgedessen werden in diesem Fall die Spuren bei jeder 20 ms dauernden Umdrehung der Trommel der Reihe nach weitergeschaltet, so daß eine lange zyklische Speicheranordnung der in Fig. 8 dargestellten Art mit einer Anzahl von Spuren gebildet wird. Mit anderen Worten wird in diesem Fall ein Wort von 2 s Länge in 100 Spuren gespeichert, die der Reihe nach weitergeschaltet werden. Genauer gesagt, damit die Spuren einer Magnettrommel mit einer Drehperiode von 20 ms zur alle 15 ms erfolgenden Aufzeichnung der Reihe nach weitergeschaltet werden können, und um zu gewährleisten, daß die zyklische Speicheranordnung perfekt zyklisch ist, sollte die Dauer des Worts ein gemeinsames Vielfaches von 20 ms und 15 ms sein. Aus diesem Grund wird in der folgenden Beschreibung angenommen, daß ein Wort mit einer Dauer von 1,98 Sekunden auf 99 Spuren aufgezeichnet werden soll, die der Reihe nach weitergeschaltet
- 21 -
109835/0945
werden. In diesem Fall ist die Zahl N gemäß Fig. 8 gleich 132. Wenn die Zahl der Spuren 8OO beträgt, können 8 zyklische Speicheranordnungen (Fig. 8) gebildet werden. Da, wie erwähnt, die Anzahl der Worte M, die in Multiplex in einer zyklischen Speicheranordnung (mit 99 Spuren) aufgezeichnet werden, 480 Worte beträgt, ist es möglich, Sprachparameter der Worte mit einer Gesamtzahl von 480 χ = j584o in acht zyklischen Speicheranordnungen aufzuzeichnen.
Die Sprachparameter jedes Worts werden gemäß Fig. 8 zyklisch von links nach rechts durch Wiedergabe-Schaltkreise herausgelesen, von denen je einer für jede zyklische Speicheranordnung vorgesehen ist. Genauer gesagt, erscheinen bei der zyklischen Speicheranordnung 1 die Sprachparameter des ersten Satzes, bestehend aus den Worten "1", "2", ... "48θ" der Reihe nach im Wiedergabekreis innerhalb einer Rahmenperiode, d.h. in 15 ms. Hierauf erscheinen der Reihe nach die Sprachparameter des zweiten Satzes mit den Worten "1", "2", "48o". Auf die gleiche Weise werden aufeinanderfolgende Sätze von Sprachparametern nacheinander wiedergegeben . Im Fall einer Wortlänge von 1,98 s ist ein Arbeitszyklus beendet, wenn die Sprachparameter der Worte des einhundertzweiunddreißigsten Satzes erscheinen.
Die Ausführungsform gemäß Fig. 7 weist eine Magnettrommel zur Aufzeichnung der jeweiligen Sprachparameter der betreffenden Worte in zyklischer Speicheranordnung gemäß Fig. 8 sowie Spurwähl-Matrizen 61-1 ... 61-8 zum Umschalten der Spuren der Magnettrommel 6O bei jeder Umdrehung derselben auf, um acht zyklische Speieheranordnungen mit jeweils einer Periode von 1,98 s zu bilden. Jede Matrix ist für 99 Spuren vorgesehen, und die Ausgangssignale von den Spurwähl-Matrizen werden über Lese-Verstärker 62-1 bis 62-8, die jeweils eine entsprechende Impulsformschaltung aufweisen, Reihen-Parallel-Wandlern 63-1 bis 63-8 zugeführt. Die aufeinanderfolgend
- 22 -
109835/0945
herausgelesenen Sprachparameter werden durch die Wandler 63-1 bis 63-8 in Sätze paralleler Signale aus jeweils 55 Bit . umgewandelt.und dann in Parameter Pufferspeicher 64-1 bis 64-8 eingeschrieben, welche jeden Satz von 55 Bit der Sprachparameter je Wort in der jeweiligen zyklischen Speicheranordnung zu speichern vermögen. Jeder Parameter-Pufferspeicher weist eine Lese-Einschreib-Steuerschaltung auf und besitzt im allgemeinen zwei Ebenen zum gleichzeitigen Einschreiben an der einen und Lesen an der anderen Seite. Die selektiv aus den Parameter-Pufferspeichern herausgelesenen Sprachparameter werden dann einem vorher beschriebenen Digital-Sprachfrequenzgenerator 65 eingespeist, und die von diesem in PMC-^Form (Pulszahlenmodulation) gelieferten Sprachsignale werden in einen für jeden Ausgangskanal vorgesehenen Ausgangs-Pufferspeicher 66 eingeschrieben, wo sie während einer Rahmenperiode von 15 nis gespeichert werden. Ähnlich den Parameter-Pufferspeichern 64-1 bis 64-8 weist der ÄBgangs-Pufferspeicher 66 zwei Ebenen sowie eine Lese-Einschreib-Steuerschaltung auf. Der Speicher 66 liefert einem Digital-Analog-Wandler 67 PCM-Code einen jedem Ausgangssignal entsprechenden Teil, um diese PCM-Code in PAM (Impuls-Amplitudenmodulation)-Signale umzuwandeln. Das Ausgangssignal dee Wandlers 67 wird über PAM-Gatter 68-1 bis 68-64, von denen je eines für jeden Ausgangskanal vorgesehen ist, Tiefpaßfiltern 69-I bis 69-64 eingespeist, um in ein kontinuierliches Sprachwellensignal umgewandelt zu werden. Außerdem ist ein Eingangssteuerkreis 71 vorgesehen, der an den elektronischen Rechner angeschlossen ist und Informationen bezüglich der Wortzahl der an jeden Ausgangskanal anzulegenden Worte empfängt. Um den Signalfluß von den Parameter-Pufferspeichern 64-1 bis 64-8 zu den für jeden Ausgangskanal vorgesehenen PAM-Gattern 68-1 bis 68-64 auf Zeitmultiplex-Basis zu steuern, ist eine Programmsteuerung 72 vorgesehen. Weiterhin ist eine Wort-Synchronisierungseinrichtung 70 zu» Gewährleistung eines
- 23 -
109835/0946
Befehls nach einer Übertragung an den Rechner und zur Bestimmung der Einschreibadresse in den Parameter-Pufferspeichern 64-1 bis 64-8 vorgesehen. Obgleich neben der Wort-Synchronisierungseinrichtung 70 noch eine Lese-Einschreib-Steuerung für die Magnettrommel vorgesehen sein muß, ist diese in Fig. 7 nicht dargestellt.
Die Magnettrommel· 60, die Matrizen 61-1 bis 61-8, die Leseverstärker 62-1 bis 62-8 und die Serien-Parallelwandler 63-I bis 63-8 gemäß.Fig. 7 können herkömmliche Einrichtungen sein, wie sie üblicherweise in Digitalrechnern verwendet werden. Weiterhin können die Pufferspeicher 64-1 bis 64-8 und der Ausgangs-Pufferspeicher 66 Magnetkernspeicher sein, wie sie verbreitet in gewöhnlichen elektronischen Rechnern als Hauptspeicher verwendet werden. Außerdem können auch der Digital-Analog-Wandler 67, die PAM-Gatter 68 und die Tiefpaßfilter 69 herkömmliche Einrichtungen sein, wie sie üblicherweise in PCM-Übertragungssystemen verwendet werden.
Im folgenden sind die Einzelheiten der Wort-Synchronisierungs einrichtung 70, des Eingangs-Steuerkreises 71 und der Programmsteuerung 72 erläutert.
Fig. 9 zeigt ein Beispiel für den Aufbau der Wort-Synchronisierdnrichtung 70. Zwei an der linken Seite von Fig. 9 dargestellte Eingangssignale TIMING und MARK stellen die Steuersignale dar, die auf bestimmten Spuren des Magnettrommelspeichers 60 gespeichert wurden. Das Zeitdiagramm dieser Steuersignale ist in Fig. 10 dargestellt, wonach das Signal Del jeder vollen Umdrehung der Magnettrommel erzeugt wird, während das Signal MARK den Block 73 markiert, welcher einem Satz von Sprachparametern gemäß Fig. 8 entspricht. Bei dem in Fig. 8 dargestellten Ausführungsbeispiel enthält jeder Block 64 Bits, so daß ein Satz von Sprachparametern mit 55 Bits in einem Block aufgezeichnet werden
109835/0945 - 24 -
kann. Ein in Fig. 10 dargestelltes anderes, mit TAKT bezeichnetes Signal stellt die Bitposition auf der Magnettrommel dar und ist beim vorliegenden AusfUhrungsbeispiel eine Impulsfolge mit einer Frequenz von 2048 kHz. Da, wie erwähnt, nacheinander auf die Spuren umgeschaltet werden muß, um bei jeder Drehung der Magnettrommel die darauf aufgezeichneten Informationen herauszulesen, werden die TAKT-Signale bei der Schaltung gemäß Fig. 9 durch einen 99-Schritt-Zähler 75 gezählt, um sie so zu entschlüsseln, daß eine abzulesende Spur ausgewählt wird. Das Auegangssignal eines Dekoders 74 wird parallel an entsprechende Spurwahl-Matrizen 61-1 bis 61-8 angelegt. Ein durch den Zähler 75 erzeugtes überlaufsignal 78 bedeutet, daß die Periode von 1,98 s abgelaufen ist und wird dazu benutzt, einen Übertragungs-Befehl bzw. ein entsprechendes Signal zum Rechner zu senden. Bei Empfang dieses Signals beginnt der Rechner die vorgesehenen, auf den betreffenden Ausgangskanälen auszusendenden Wortinformationen zu übertragen. Die MARK-Impulse werden dagegen für die Anzeige der Adressen zum Einschreiben von Sprachparametern gezählt, die der Reihe nach von der Magnettrommel gelesen werden und den entsprechenden Parameter-Pufferspeicher eingeschrieben werden. Da, wie erwähnt, beim Ausführungsbeispiel gemäß Fig. 8 M - 480 ist, werden die MARK-Impulse durch einen 48O-SchritteZähler 76 gezählt, wobei die resultierenden, gezählten Werte zur Anzeige der Einschreibadressen der betreffenden Pufferspeicher benutzt werden. Da außerdem Jeder Parameter-Pufferspeicher zwei Ebenen besitzt, muß eine einzuschreibende Fläche bestimmt werden. Zu diesem Zweck ist ein Flip-Flop 77 vorgesehen, der das vom 480-Schritt-Zähler 76 gelieferte Überlaufsignal 79 empfängt, und jedesmal die Polarität seines Auegangssignals umkehrt, wenn der Zähler 76 in 15 ms bis zu 480 MARK-Impulse zählt, um die Ebene anzuzeigen, in welche die Information eingeschrieben werden soll. nc
109835/0945
.25- 205051?
Pig. 11 zeigt ein Beispiel für den Aufbau der Programmsteuerung 72 und Fig. 12 veranschaulicht das Zeitverhältnis zwischen den verschiedenen Signalen in Flg. 12. Die Programmsteuerung 72 wird durch ein von der Magnettrommel geliefertes TAKT-Signal mit einer Frequenz von 2048 kHz betätigt, welches durch einen 4 Schritte umfassenden Zähler 80 in ein Signal 87 mit einer Frequenz von 512 kHz umgewandelt wird. Dieses Signal 87 wird einer Zählerschaltung aufgeprägt, die einen Zähler 84 mit 64 Schritten und einen Zähler 85 mit 120 Schritten in Kaskadenschaltung aufweist, wobei der Inhalt dieser Zähler die Adresse des zu diesem Zeitpunkt abzulesenden Ausgangs-Pufferspeichers angibt. Die Adresse wird zum Pufferspeicher 66 übertragen, . ä um den dieser Adresse entsprechenden Inhalt herauszulesen, und der gelesene Inhalt wird durch den Analog-Digital-Wandler 67 in ein Analogsignal umgewandelt. Zu diesem Zeitpunkt entschlüsselt ein Dekodierer 86 das Atqgangssignal des 64-Schritt-Zählers 84 zur Erzeugung von Signalen G-1 bis G-64 zum Ansteuern, d.h. zum Durchschalten der PAM-Gatter 68-1 bis 68-8 in den Ausgangskanälen, und zwar in den Zeitverhältnissen gemäß Fig. 12. Auf diese Weise wird das aus dem Ausgangs-Pufferspeicher 66 herausgelesene und durch den Wandler 67 in Analogform umgewandelte Signal zu dem durch den Zähler 84 bestimmten Ausgangskanal übertragen. Das Ausgangs-Signal 87 des 4-Schritt-Zählers 80 wird einer Zählerschaltung eingespeist, die aus einem 120-Schritt- %
Zähler 81 und einem 64-Schritt-Zähler 82 besteht, welche in Kaskade geschaltet sind. Die Inhalte dieser Zähler zeigen die Adresse an, in welche die zu diesem Zeitpunkt durch den Fiequenzgenerator 65 aufgebauten PCM-Code im Ausgangs-Pufferspeicher 66 eingeschrieben werden sollen. Gemäß Fig. wird das Überlaufsignal 88 des 120-Schritt-Zählers 81 alle 254 ms erzeugt und dem nachgeschalteten 64-Schritt-Zähler 82 eingespeist. Außerdem wird das Signal 88 zum Anstoßen des Eingangs-Steuerkreises 71 benutzt.
- 26 -
109835/0945
Das überlaufsignal 89 des 64-Schritt-Zählers 82, das alle 120 »64 kHz & 15 ms erzeugt wird, wird einem Flip-Flop-^ zugeführt, dessen Binärausgang anzeigt, in welche der beiden Ebenen des Ausgangs-Pufferspeichers 66 eingeschrieben oder welche gelesen werden soll. Das Ausgangs-Signal 87 des 4-Schritt«Zählers 80 wird dem Frequenzgenerator 65 aufgeprägt und betätigt ihn im Oleichlauf mit dem Einschreib« und Lesevorgang am Ausgangs-Pufferspeicher 66.
Fig, 15 zeigt ein Beispiel für den Aufbau des Eingangs-Steuerkreises 71· Wenn durohdas Uberlaufsignal 78 ein Übertragungsbefehl von der Wort-Synchronisiereinrichtung 70 zum Rechner übertragen wird, werden Informationen, welche die Wortzahlen der zu den betreffenden Ausgangskanälen CH-1 bis CH-64 zu sendene?nformationen bestimmen, vom Rechner übertragen und vorübergehend in den betreffenden Ausgangskanälen entsprechenden Registern 93-1 bis 93-64 gespeichert. Nach Ablauf der Wortlänge von 1,98 gibt die Wort-Synchronisiereinrichtung 70, wie vorher erläutert, ein Befehlsignal an den Rechner ab, doch wird das Signal 78 auch den im Eingangssteuerkreis 71 vorgesehenen Gattern 92 als Durchlaßsignal eingespeist, wodurch der Inhalt von Registern in Register 9I-I bis 91-64 übertragen wird. Wie erwähnt, liefert die Programmsteuerung 72 alle 234 Mikrosekunden ein Start-Signal 88 an den Eingangssteuerkreis 71» wobei dieses Zeitintervall von einem 64-Schritt-Zähler 95 gezahlt wird. Der Inhalt des Zählers 95 wird durch einen Dekodierer 94 entschlüsselt, welcher Durchlaß-Signale 96-I bis 96-64 für Gatter 90-1 bis 90-64 erzeugt* Beim Durchschalten der Gatter 90-1 bis 90-64 werden die Inhalte der Register 91 nacheinander als gelesene Adressen in Intervallen von 234 Mikrosekunden auf die Parameter-Pufferspeicher übertragen, um diese abzulesen. Wenn bei Annahme einer Wortlänge von 1,98 s die Inhalte der einzelnen Register 91 132-mal (132 Rahmen) zum Parameter-Pufferspeicher übertragen werden,
- 27 -109835/09^5
werden die Informationen zur Bestimmung des nächsten Worts, die vom elektronischen Rechner übertragen wurden und in den entsprechenden Registern 93 gespeichert sind, durch das durch die Wort-Synchronisiereinrichtung 70 zu diesem Zeitpunkt erzeugte Signal 78 in die Register 91 übertragen. Die vorstehend beschriebenen Vorgänge werden im Gleichlauf mit der Wort-Dauer wiederholt.
Gemäß Fig. 7 werden die aus der Magnettrommel 6O herausgelesenen und in jedem Satz in parallele Signale umgewandelten Sprachparameter in die Adressen der betreffenden Parameter-Pufferspeicher 64-1 bis 64-8 eingeschrieben, welche je Satz den acht zyklischen Speicheranordnungen entsprechen. Polglich besitzt jede Adresse dieser Speicher 64-1 bis 64-8 jeweils 55 Bit für einen Satz von Sprachparametern. Selbstverständlich wird der vorstehend beschriebene Vorgang für die acht zyklischen Speicheranordnungen parallel durchgeführt, so daß ein Satz von Sprachparametern, welcher ein Wort von 384o Worten betrifft, auf die vorher beschriebene Weise in die Parameter-Pufferspeicher 64 eingeschrieben wird. Dieser Einschreibvorgang in die Parameter-Pufferspeicher wird mit einer Rahmenperiode von 15 ms beendet. Sodann beginnt ein Lesezyklus für die Parameter-Pufferspeicher 64 für jeden Ausgangskanal. Während des Ablaufs dieses Lesezyklus werden die Sprachparameter für die nächste Rahmenperiode, die aus der Magnettrommel herausgelesen wurden, in die andere Ebene der Parameter-Pufferspeicher 64 eingeschrieben, die, wie erwähnt, zwei Ebenen aufweisen. Während des Lesezyklus werden die Inhalte der Register 91-1 bis 91-8 des Eingangssteuerkreises 71 entsprechend der Reihenfolge der Ausgangskanäle unter der Steuerung durch das Signal 88 von der Programmsteuerung 72 zu Parameter-Pufferspeichern übertragen, um die Inhalte (Sprachparameter eines Satzes) der Adressen der Parameter-Pufferspeicher 64 herauszulesen, wobei die herausgelesenen Inhalte zum Sprach-Prequenzgeneraltor 65
- 28 109835/09Λ5
~ 28 -
gesandt werden· Wie vorstehend im einzelnen erläutert, bewirkt der Frequnezgenerator ξ>5 bei Empfang der herausgelesenen Inhalte eine Zusammenstellung von PCM-Sprachkoden, beispielsweise 120 PAM-Teilen, die innerhalb einer Rahmenperlode erzeugt werden sollen· Diese zusammengestellten Code werden nacheinander In Adressen des Ausgangs-Pufferspeiohers 66 gespeichert, wobei diese Adressen durch den 120-Sohritt-Zähler 81, den 64-Schritt-Zähler 82 und das Flip-Flop 83 der Kanal-Programmsteuerung 72 angezeigt werden. Jede Adresse des Ausgänge-Pufferspeichers 66 weist beispielsweise 8 Bit auf, was für die Speicherung eines Satzes von PCM-Sprachkoden ausreicht. Dieser Vorgang wird in einer 1/64 eines Rahmens (12 ms) bzw. 2^4 MikroSekunden entsprechenden Zeitspanne durchgeführt. Infolgedessen wird dieser Vorgang während einer Rahmenperiode für 64 Ausgangskanäle auf Zeltmultiplex-Basis durchgeführt. Auf diese Weise werden während einer Rahmenperiode bzw, innerhalb von I5 ms 120 PCM-Codetelle für Jeden Auegangskanal in die den jeweiligen Ausgangskanälen der Auegangs-Pufferspeieher entsprechenden Adressen eingeschrieben· Die Inhalte des Ausgangs-Pufferspeichers 66 werden auf Zeitmultiplex-Basis unter der Steuerung der Programmeteuerung 72 im Oleichlauf mit den Gatter-Signalen G-I bis 0-64 der PAM-Oatter 68-1 bis 68-64 der entsprechenden Ausgangsknäle herausgelesen. Die gelesenen Signale werden durch den Digital-Analog-Wandler 67 in PAM-Signale umgewandelt, die über entsprechende Tiefpaßfilter 69 als kontinuierliche Sprachwelle bzw. Sprachband auf die Ausgangskanäle übertragen werden.
Eine Reihe der vorstehend beschriebenen Arbeitsvorgänge wird
- 29 -
109835/0945
mit der Rahmenperiode von 15ms wiederholt, um äne der Wortdauer entsprechende Sprachwelle für die betreffenden Ausgangskanäle zu erzeugen. Die Wortzahlen der das nächste Mal zu behandelnden Wörter sind bereits durch das Überlauf-Signal 78 der Wort-Synchronisiereinrichtung 70 vor Beginn der Behandlung der nächsten Wörter vom Rechner zu den Registern 93 des Eingangs-Steuerkreises 71 übertragen worden·
der Wortdauer
Durch Wiederholung dieser Arbeitsgänge mit einer/ entsprechenden Periode von beispielsweise 1,98 s werden zusammengestellte Ton- bzw· Hörsignal-Nachrichten an die betreffenden Ausgangskanäle übertragen.
Obgleich beim vorstehend beschriebenen Ausführungsbeispiel der Ton- bzw« Sprachsignale verarbeitenden Vorrichtung eine Magnettrommel als Speicher für die Sprachparameter benutzt wird, kann ersichtlicherweise jede andere Art von Speicher benutzt werden, solange dieser die Sprachparameter in Form von zyklischen Speicheranordnungen aufzuzeichnen vermag.
Im folgenden 1st eine weitere Ausführungsform der eine Magnettrommel als Speicher für Sprachparameter verwendenden erfindungsgemäßen Vorrichtung beschrieben. Im Unterschied zur ersten Ausführungsform, bei welcher die aus den jeweiligen Wörtern extrahierten Sprachparameter in Intervallen auf den Spuren einer Magnettrommel aufgezeichnet wurden, werden bei dieser Abwandlung die Sprachparameter kontinuierlich aufgezeichnet, und zwar beginnend mit einer bestimmten Adresse. Genauer gesagt, wird jedes Wort kontinuierlich ohne jede Überlappung in I32 Blöcken aufgezeichnet, falls die Dauer jedes Worts z.B. 1,98 s beträgt, und zwar beginnend mit der ersten Adresse der Trommel, die für jedes Wort vorbestimmt ist. Wenn die Wortzahlen der den Ausgangskanälen zuzuführenden Wörter vom elektronischen Rechner übertragen werden, werden Sprachparameter, die jeweils aus 132 Sätzen bestehen, für die
- 30 -
109835/09k5
m 30 -
an den Ausgangskanälen vorgesehenen Wörter aus der Magnettrommel herausgelesen und im Parameter-Pufferspeicher gespeichert. Danach wird auf dieselbe Weise wie bei der zuerst beschriebenen Ausführungsform das Sprachsignal für Jeden Rahmen zusammengesetzt, im Ausgang-Pufferspeicher gespeichert und als kontinuierliches Sprachsignal für das vorgesehene Wort über den Digital-Analog-Wandler, das PAM-Gatter und das Tiefpaßfilter dem Ausgangskanal zugeführt.
Pig, 14 zeigt eine weitere Ausführungsform der Erfindung mit einer Magnettrommel 6O zur Speicherung von Sätzen von Sprachsignalen für die betreffenden Wörter, einem Parameter-Pufferspeicher 98 zur vorübergehenden Speicherung der Sprachparameter der selektiv aus der Magnettrommel 60 herausgelesenen Sprachparameter, einem Eingangssteuerkreis 100 zur Speicherung der vom Rechner übermittelten Informationen zur Bestimmung der Wortzahl und zur Übermittlung der herausgelesenen Adresse zum Parameter-Pufferspeicher 98 zu jedem festgelegten Zeitpunkt und einer auf die Befehle des Eingangssteuerkreises 100 ansprechenden Magnettrommelsteuerung 97 zum Lesen des Inhalts aus der Magnettrommel 60 und zum Einschreiben desselben in den Parameter-Pufferspeicher 98. Diese abgewandelte Ausführungsform weist weiterhin einen Sprach-Frequenzgenerator 65 zum Aufbau einer Sprache(aus 120 Teilen) von einem Rahmen (I5 ms) aus einem Satz von aus dem Parameter-Pufferspeicher 98 herausgelesenen Sprachparametern auf. Dieser Frequenzgenerator weist Digitalfilter zum Zusammensetzen der Sprachsignale auf Zeitmultiplex-Basis für jeden Ausgangskanal, einen Ausgangs-Pufferspeicher 66 zur vorübergehenden Speicherung einer Gruppe von dem durch den Frequenzgenerator 65 aufgebauten Sprachsignal entsprechenden PCM-Coden, einen Digital-Analog-Wandler 67 zur Umwandlung
109835/0945
der aus dem Ausgang-Pufferspeicher herausgelesenen Digitalcode in Analogsignale, PAM-Gatter 68-1, 68-2 ... 68-64 zur Verteilung der vom Wandler 67 gelieferten Analogeignale auf die verschiedenen Ausgangekanäle CH-1, CH-2 ... CH-64, Tiefpaßfilter 69-I, 69-2 ... 69-64 zur Umwandlung der Ausgangssignale der jeweiligen PAM-Gatter in eine kontinuierliche Welle bzw. ein kontinuierliches Bandsignal sowie eine Programmsteuerung 99 zur Steuerung der verschiedenen vorstehend beschriebenen Bauteile auf.
Von diesen Bauteilen sind die Magnettrommel 6O, der Parameter- ™ Pufferspeicher 98, der Ausgang-Pufferspeicher 66, der Wandler 67, die PAM-Gatter 68 und die Tiefpaßfilter 69 ebenfalls herkömmliche Geräte, wie sie verbreitet in elektronischen Rechnern und in PCM-Ubertragungaeystemen verwendet werden. Die Magnettrommelsteuerung 97 entspricht praktisch einer herkömmlichen Magnettrommel-Kanalvorrichtung. Bei herkömmlichen Rechnern müssen zum Herauslesen aus der Magnettrommel mittels einer Magnetirommel-Kanallesevorrichtung und zur Speicherung der gelesenen Information im Hauptspeicher, welcher dem Parameter-Pufferspeicher 98 gemäß Fig. 14 entspricht, gewisse Einrichtungen vorgesehen sein, um die Adresse an die Magnettrommel-Kanallesevorrichtung zum Ablesen der Trommel, die Λ Anzahl der Wörter und das Einschreiben der Adresse des Hauptspeichers zu geben, doch ist bei der Magnettrommel-Steuerung 97 gemäß Fig. 14 die Anzahl der herauszulesenden Wörter konstant gleich 152 Wörtern je Spracheinheit mit einer Länge von 1,98 s, was durch die Dauer der Spracheinheit bestimmt wird, und ändert eich die Einschreib-Adresse des Parameter-Pufferspeichers regelmäßig, so daß es nicht nötig ist, diese Werte durch den Eingangs-Steuerkreis 100 zu bestimmen. Die Programmsteuerung 99 entspricht praktisch der
- 52 10Ö835/084S
Programmsteuerung T2 der ersten AuefUhrungsfarm, nur mit dem Unterschied, dafl »1« durch unabhängige Takt signale gesteuert wird« d.lu mit anderen Worten» nicht mit der Drehung dir Magnetroranel synchronisiert wird·
Flg. 15 fctlgt dl· Einzelheiten de« EingangB-Steuerkrelees 100· Die Vom Rechner übermittelten Informationen zur Bestimmung der an die einzelnen Ausgangskanäle zu sendenden Wörter werden in Regietern 104·1, 104-2 ... 104-64 gespeichert« welche den betreffenden Ausgangekanälen CH entsprechen. Die übertragung dieser Informationen zu Registern 102-1 bis 102*64 erfolgt über Gatter 10>1 bis 10>64, die durch ein überlaufsignal 111 betätigt werden, welches auch als übertragungsbefehlssignal für den Rechner dient und durch einen 132-Sohritt-ZIChler 108 mit einer Periode entsprechend der Wortdauer erzeugt wird. Diese Informationen werden nacheinander In der Reihenfolge der Register 102-1 bis 102-64 zur Magnettrommel-Steuerung 97 übertragen« wodurch letztere abgelesen wird· Die Sl|HaTe 88 des Eingangs-Steuerkreisea, die von der Programrasteuerung 99 In einem Intervall von 2^4 MikroseJcunden ausgesandt werden, werden durch einen 152-Schritt-ZMhXer 105 und einen 64-Sohritt-Zähler 106 gezählt. Der Inhalt de» 64-3ohritt-Zahlere 106 wird durch einen Dekodierer 112 entschlüsselt, der Signale 110-1 bis 110-64 an Gatter 101-1 bis 101-64 abgibt, wodurch diese jeweils etwa 30 ms lang auf Durchlaß geschaltet werden und die Inhalte der Register 102 nacheinander an die Magnettrommel-Steuerung 97 übertragen· Alle Parameter eines durch die Inhalte der Register 102 bestimmtenWorte müssen während der Wortdauer, d.h. innerhalb von 1,98 s, gelesen und im Parameter-Pufferspeicher 98 gespeichert werden« Da jedoch eine Nagnettrommel im allgemeinen eine vergleiobjnreise lange Zugriffezelt hat, dauert es maximal 25 ms, bit die das Wort bestimmende InformaUan voa Eineana*steuerkreis 100 zur Magnettrommel-Steuerung 97 übermittelt wird tnd alle Parameter der Worte
- 33 -
herausgelesen werden, um sie im Parameter-Pufferspeicher zu speichern. Da die Gatter 101 jeweils 50 ms lang auf Durchlaß geschaltet sind, steht genügend Zeit zum Ablesen der Magnettrommel 60 zur Verfügung.
Die Startsignale 88 des Eingangssteuerkreises werden ebenfalls durch einen 64-Schritt-Zähler 107 und 152-Schritt-Zähler 108 gezählt und die Inhalte dieser Zähler werden zum Parameter-Pufferspeicher 98 als Adresse für diesen übermittelt, um zu diesem Zeitpunkt abgelesen zu werden. Da das Einschreiben der Sprachparameter von der Magnettrommel 60 und das Lesen der den Eingangssteuerkreis bestimmenden Adresse parallel erfolgen, ist der Parameter-Pufferspeicher 98 wie bei der zuerst beschriebenen Ausführungsform mit zwei Ebenen versehen. Zur Auswahl einer dieser Ebenen ist ein Flip-Flop 109 vorgesehen, das die Polarität des Ausgangssignals in Abhängigkeit vom Überlaufsignal 111 des 152-Schritt-Zähiers I08 umkehrt.
Während der Zeitspanne, in welcher die Magnettrommel 60 durch den Inhalt der Register 102 abgelesen wird, werden die vom Rechner zur Bestimmung der nächsten Wörter übermittelten Informationen empfangen und in den Registern 104 gespeichert. Auf diese Weise werden Informationen zur Bestimmung von Wörtern nacheinander vom Rechner empfangen, um dabei verschiedene vorgesehene Tonfrequenz-Mitteilungen bzw. Informationen an die einzelnen Ausgangskanäle zu übertragen. Selbstverständlich kann anstelle der Magnettrommel auch ein Magnetplattenspeicher zur Speicherung der Sprachparameter benutzt werden.
Wie vorstehend erläutert, werden bei der erfindungsgemäßen Vorrichtung Sprachsignale als verdichtete Informationen unter Verwendung von Tellautokorrelations-Koeffizienten als Parameter aufgezeichnet, so daß auf wirtschaftliche Weise eine große Anzahl von Wörtern untergebracht und herausgelesen werden kann. Da außerdem nur ein einziger Digjfcal-Sprach-Frequenz-
109835/0945 -34
generator verwendet wird, kann ein einziger Frequenzgenerator gemeinsam für zahlreiche Ausgangskanäle, beispielsweise fUr 64 Kanäle, auf Zeitmultiplex-Basis verwendet werden, was äußerst wirtschaftlich ist.
Selbstverständlich soll die Erfindung keinesfalls auf die speziell dargestellten und beschriebenen Einzelheiten beschränkt sein, da Innerhalb des Rahmens der Erfindung zahlreiche Änderungen und Abwandlungen möglich sind.
Zusammenfassend schafft die Erfindung eine Ton- bzw. Sprachsignale verarbeitende Vorrichtung zur Speicherung von Sprachparametern mit Teilautokorrelations-Koeffizienten zwischen jeweils zwei dichtnebeneinander liegenden Zeitpunkten eines Sprachsignals, welche durch Unterdrückung der übrigen Komponenten von den tatsächlichen Sprachsignalpegeln der beiden benachbarten Zeitpunkte erhalten werden, und zwar unter Berücksichtigung der zwischen den beiden Zeitpunkten liegenden Abtastpegel und einer Information bezüglich der Anregungsquelle, die anhand der abgetasteten Werte an voneinander entfernten Zeitpunkten bestimmt wird. Diese Vorrichtung weist einen Speicher zur Speicherung der Sprachparameter, Leseeinrichtungen zum Lesen von Sprachparametern aus dem Speicher, die durch einen elektronischen Rechner bestimmt werden, und einen Sprach-Normal-Frequenzgenerator zur Rekonstruktion des Sprachsignals aus dem Ausgangssignal der Leseeinrichtung auf. Der Frequenzgenerator besteht aus sehr schnell arbeitenden logischen Elementen und setet Mehrkanal-Tonfrequenz-Ausgangssignale auf Zeitmultiplex-Basis zusammen.
109835/0945

Claims (1)

  1. 'l;l" 1J! rii|;" ""f" ; 811
    - 55 -
    Patentansprüche
    Vorrichtung zur rVerar&eltisig von fön- bzw· Spraohslgnalen, dadurch gekennseelchnet, daß sie Einrichtungen zur vorübergehenden Speicherung von Spraohparametem aufweist, zu denen Teilautokorrelations-Koeffizienten zwischen jeweils zwei dicht nebeneinander liegenden Zeltpunkten eines gewünschten Antwort-Sprachsignals, welche für mehrere Abtast-Zeltpunkte bestimmt werden und die Korrelation des Differenzwerts zwischen nach der Methode des kleinsten Quadrate aus den abgetasteten Werten zwischen diesen beiden Zeitpunkten vorherbestimmten Fehlerwerten und den tatsächlichen Werten des Sprachsignals zu den beiden Zeitpunkten darstellen, sowie Informationen bezüglich der Anregungsquelle gehören, welche durch Bestimmung der Autokorrelation zwischen weiter voneinander entfernten, abgetasteten Werten erhalten werden, und daß ein elektronischer Rechner zur Lieferung eines Befehlssignals zur Bestimmung der Sprachparameter eines zusammen zusetzenden Sprachsignale, eine Einrichtung zum Lesen der durch das Befehlssignal bestimmten Sprachparameter aus den Speiehereinrichtungen sowie ein Sprach-Normal-Prequenzgenerator vorgesehen sind, der auf das Ausgangssignal der Leseeinrichtung zum Zusammensetzen eines gewünschten Sprachsignals anspricht.
    2. Vorrichtung nach Anspruch 1, gekennzeichnet durch einen einen Autokorrelationskoeffizient-Sxtraktor aufweisenden Sprachparameter-Extraktor mit mehreren in Kaskade geschalteten Teilautokorrelations-Koeffizient-Detektorstufen, von denen jede ein zum Empfangen eines Sprach-
    - 36 -
    109835/0945
    ffiWi
    flignala geechalteteB Veriögerungsnet«werk, ein KorvelationsleoeffiAient-Rechengerat zum Empfangen dee Ausgangseignals des Verzögerungsnetzwerks und sum unmittelbaren Empfangen des Sprachsignale, einen zum Empfangen des AusgangsaignalB des netiwerke und dec Ausgangs signal a vom Korrelat ionsicoeff lzient-Rechengerät geschalteten Multiplier, einen unmittelbar zum Empfangen des Auegangssignals des Korrelat lonskoeffizient-Rechengeräts und des Sprachsignale geschalteten Multiplier, ein Addierwerk zum Addieren des Ausgangesignals des Verzögerungsnet zvrerks und des Auegangseignals des zweitgenannten Multipliers, ein Addierwerk zum Addieren des Ausgangssignals des erstgenannten Multipliers und des Sprachsignals sowie einen Größenwandler bzw. Umsetzer zum Quantisieren des Auegangssignale des Korrelationskoeffizient-Rechengeräte zur Bestimmung eines Teilautokorrelations-Koeffizienten zwischen den beiden Zeitpunkten aufweist, mit einem an die eine Auegangsklemme der letzten Detektorstufe angeschlossenen Autokorrelator und mit einer Maxlmalwert-wahleinrichtung zur Bestimmung der Periode und Amplitude eines Informationen bezüglich einer Anregungsquelle enthaltenden Signals aus einer Gruppe von Ausgangssignalen des Autokorrelators.
    j5» Vorrichtung nach Anspruch 1, dadurch gekennzeichnet, daß der Sprachsignal-Frequenzgenerator einen Impulsgenerator und einlRfFuT°ifeißee Rauschen, die durch die Grundschwlngungs-Periode der Sprache angesteuert werden, einen mit den Generatoren verbundenen und durch die Information bezüglich der Grundschwlngungsamplltüde der Anregungsquelle gesteuerten Amplitudenregler sowie eine Einrichtungzur Steuerung des Ausgangssignals des ', Amplitudenreglers in Übereinstimmung mit dem durch den elektronischen Rechner bezeichneten Teilautokorrelations-Koeffizienten aufweist, welche das Sprachsignal durch
    10983S/0946 - 37 -
    die Korrelation zwischen einer Gruppe von Korrelationskoeffizienten rekonstruiert,
    4. Vorrichtung zur Verarbeitung von Ton- bzw. Sprachsignalen, gekennzeichnet durch eine Einrichtung zur Ableitung von Sprachparametern aus Teilautokorrelations-Koeffizienten und aus einer Information bezüglich der Anregungsquelle von bestimmten Sprachsignalen für mehrere zur Beantwortung benötigter Sprachsignale, eine Speichereinrichtung zur Speicherung der Sprachparameter, einen elektronischen Rechner zur Übermittlung eines Befehlssignals, welches die Sprachparameter für die betreffenden Ausgangskanäle , M bestimmt, um die Antworten mehreren Ausgangskanälen zuzuführen, mehrere Leseeinrichtungen zum Lesen der durch den Rechner bestimmten Sprachparameter aus der Speichereinrichtung, einen einzigen Sprach-Normal-Frequenzgenerator, der mehrere Sprachparameter-Sätze von den Leseeinrichtungen auf Zeltmultipiex-Basis empfängt und eine Gruppe von Digitalkoden bildet, welche entsprechende Sätze der bestimmten Sprachwelle von den Informationen bezüglich der Anregungsquelle darstellen und letzteren sowie den Teilautokorrelat ions-Koeffizient en der betreffenden Sätze der Sprachparameter entsprechen, eine Einrichtung zum Lesen einer Gruppe von Digitalkoden aus dem Sprach-Frequenzgenerator auf Zeitmultiplex-Basis und zum Umwandeln der Digitalkode ^ in impulsamplitudenmodulierte Signale, und eine Takt-Gattereinrichtung zur Verteilung der modulierten Signale auf mehrere Ausgangskanäle.
    . Vorrichtung nach Anspruch Kt gekennzeichnet durch eine zyklische Speichereinrichtung zur Speicherung der Sprachparameter einschließlich der Informationen bezüglich der Anregungsquelle und der Teilautokorrelations-Koeffizienten für mehrere Spracheinheiten einer vorbestimmten konstanten Länge, die zur Übermittlung einer Antwort benötigt werden,
    - 58 -
    109835/0945
    in mehreren zyklischen Speicheranordnungen, die jeweils in mehrere Rahmen unterteilt sind, durch einen Parameter-Pufferspeicher zur vorübergehenden Speicherung der Sprachparameter der aus der zyklischen Speichereinrichtung herausgelesenen Spracheinheit in den betreffenden Rahmen, durch einen Sprach-Frequenzgenerator mit rein digitalen logischen Einrichtungen, der auf die durch den elektronischen Rechner bestimmten und zur Beantwortung zu einer Anzahl von Ausgangskanälen zu übertragenden Spracheinheiten anspricht und die Informationen bezüglich der Anregungsquelle enthaltenen Signale entsprechend den Sprachlnformationen der Sprachparameter in Wechselbeziehung bringt, welche durch den Parameter-Pufferspeicher unter der Steuerung der Teilautokorrelations-Koeffizienten herausgelesen wurden, so daß die Sprachparameter in eine Gruppe von Digitalkoden umgewandelt werden, welche Wellenformen der betreffenden bestimmten Sprachsignale darstellen, durch einen Ausgangs-Pufferspeicher zur vorübergehenden Speicherung der Gruppe von Digitalkoden vom Sprach-Frequenzgenerator und durch eine Einrichtung zur Umwandlung der aus dem Ausgangs-Pufferspeicher herausgelesenen Digitalkode in Analogsignale.
    6. Vorrichtung nach Anspruch 4, gekennzeichnet durch eine Einrichtung zum Speichern von Sprachparametern, die jeweils eine Information bezüglich der Anregungsq^uelle und einen Teilautokorrelations-Koeffizienten betreffend mehrere für die Abgabe einer Antwort vorbestimmter Länge erforderlicher Spracheinheiten in unbesetzten Adressen eines Speichers, aurcn einen Parameter-Pufferspeicher zur vorübergehenden Speicherung der Sprachparameter einer Spracheinheit, welche aus einer Adresse im Speicher herausgelesen wurde und welche der durch den Speicher bestimmten und auf mehreren Auagangskanälen als Antwort abzugebenden Sprach-
    - 39 -
    109835/0945
    einheit entspricht, und durch eine Einrichtung zum aufeinanderfolgenden Lesen der Sprachparameter aus dem Parameter-Pufferspeicher und zum Eingeben der herausgelesenen Sprachparameter in den Sprach-Prequenzgenerator.
    109835/0945
    Leerseite
DE2050512A 1970-02-07 1970-10-14 Vorrichtung zur Ableitung von Sprachparametern und zur Erzeugung synthetischer Sprache Expired DE2050512C3 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP45010992A JPS527282B1 (de) 1970-02-07 1970-02-07
JP45010993A JPS5229121B1 (de) 1970-02-07 1970-02-07

Publications (3)

Publication Number Publication Date
DE2050512A1 true DE2050512A1 (de) 1971-08-26
DE2050512B2 DE2050512B2 (de) 1973-09-13
DE2050512C3 DE2050512C3 (de) 1974-04-04

Family

ID=26346352

Family Applications (1)

Application Number Title Priority Date Filing Date
DE2050512A Expired DE2050512C3 (de) 1970-02-07 1970-10-14 Vorrichtung zur Ableitung von Sprachparametern und zur Erzeugung synthetischer Sprache

Country Status (5)

Country Link
US (1) US3662115A (de)
DE (1) DE2050512C3 (de)
FR (1) FR2065978A5 (de)
GB (1) GB1318985A (de)
SE (1) SE361537B (de)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE2636032A1 (de) * 1975-08-22 1977-02-24 Nippon Telegraph & Telephone Schaltungsanordnung zum extrahieren der grundfrequenz aus einem sprachsignal
US4328008A (en) * 1979-05-30 1982-05-04 Texaco Development Corporation Method for the production of cleaned and cooled synthesis gas

Families Citing this family (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3816722A (en) * 1970-09-29 1974-06-11 Nippon Electric Co Computer for calculating the similarity between patterns and pattern recognition system comprising the similarity computer
US4074069A (en) * 1975-06-18 1978-02-14 Nippon Telegraph & Telephone Public Corporation Method and apparatus for judging voiced and unvoiced conditions of speech signal
US4344148A (en) * 1977-06-17 1982-08-10 Texas Instruments Incorporated System using digital filter for waveform or speech synthesis
US4209844A (en) * 1977-06-17 1980-06-24 Texas Instruments Incorporated Lattice filter for waveform or speech synthesis circuits using digital logic
CA1100641A (en) * 1977-09-16 1981-05-05 Akira Ichikawa Multifrequency signal receiving system
US4130729A (en) * 1977-09-19 1978-12-19 Scitronix Corporation Compressed speech system
JPS5919358B2 (ja) * 1978-12-11 1984-05-04 株式会社日立製作所 音声内容伝送方式
US4479124A (en) * 1979-09-20 1984-10-23 Texas Instruments Incorporated Synthesized voice radio paging system
JPS5650397A (en) * 1979-10-01 1981-05-07 Hitachi Ltd Sound synthesizer
JPS5853358B2 (ja) * 1980-03-31 1983-11-29 株式会社東芝 音声分析装置
JPS56140400A (en) * 1980-04-03 1981-11-02 Tokyo Shibaura Electric Co Signal synthesizing circuit
US4401855A (en) * 1980-11-28 1983-08-30 The Regents Of The University Of California Apparatus for the linear predictive coding of human speech
US4464784A (en) * 1981-04-30 1984-08-07 Eventide Clockworks, Inc. Pitch changer with glitch minimizer
US4378469A (en) * 1981-05-26 1983-03-29 Motorola Inc. Human voice analyzing apparatus
US4443859A (en) * 1981-07-06 1984-04-17 Texas Instruments Incorporated Speech analysis circuits using an inverse lattice network
US4398262A (en) * 1981-12-22 1983-08-09 Motorola, Inc. Time multiplexed n-ordered digital filter
US4544919A (en) * 1982-01-03 1985-10-01 Motorola, Inc. Method and means of determining coefficients for linear predictive coding
JPS5922165A (ja) * 1982-07-28 1984-02-04 Nippon Telegr & Teleph Corp <Ntt> アドレス制御回路
ATE36206T1 (de) * 1983-01-03 1988-08-15 Motorola Inc Verbessertes verfahren und mittel zur bestimmung von koeffizienten zur linearen vorhersagekodierung.
US4581747A (en) * 1984-03-05 1986-04-08 At&T Bell Laboratories Arrangement for equalizing the variable attenuation of a signal on a communication line
US5315687A (en) * 1986-03-07 1994-05-24 Adler Research Associates Side fed superlattice for the production of linear predictor and filter coefficients
US5237642A (en) * 1986-03-07 1993-08-17 Adler Research Associates Optimal parametric signal processor
US5251284A (en) * 1986-03-07 1993-10-05 Adler Research Associates Optimal parametric signal processor with lattice basic cell
US5101432A (en) * 1986-03-17 1992-03-31 Cardinal Encryption Systems Ltd. Signal encryption
US5265217A (en) * 1987-03-03 1993-11-23 Adler Research Associates Optimal parametric signal processor for least square finite impulse response filtering
US5920842A (en) * 1994-10-12 1999-07-06 Pixel Instruments Signal synchronization
US5587910A (en) * 1995-02-06 1996-12-24 Rockwell International Corporation Vehicle navigation system with non-overflow digital filter
CA2459428A1 (en) * 2004-03-03 2005-09-03 Spotwave Wireless Inc. Signal recognition in an on-frequency repeater

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3069507A (en) * 1960-08-09 1962-12-18 Bell Telephone Labor Inc Autocorrelation vocoder
US3209074A (en) * 1961-06-06 1965-09-28 Ibm System for multiple output of spoken messages
US3281789A (en) * 1962-11-02 1966-10-25 Frederick P Willcox Multiple remote interrogated information system

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE2636032A1 (de) * 1975-08-22 1977-02-24 Nippon Telegraph & Telephone Schaltungsanordnung zum extrahieren der grundfrequenz aus einem sprachsignal
US4328008A (en) * 1979-05-30 1982-05-04 Texaco Development Corporation Method for the production of cleaned and cooled synthesis gas

Also Published As

Publication number Publication date
SE361537B (de) 1973-11-05
GB1318985A (en) 1973-05-31
DE2050512B2 (de) 1973-09-13
DE2050512C3 (de) 1974-04-04
FR2065978A5 (de) 1971-08-06
US3662115A (en) 1972-05-09

Similar Documents

Publication Publication Date Title
DE2050512A1 (de) Vorrichtung zur Verarbeitung von Ton bzw Sprachsignalen
DE2159848A1 (de) System zur abschnittweisen Unter teilung von Sprach und Digitalsignalen und zur Herstellung gedruckter Texte
DE3222314C2 (de)
DE2132004A1 (de) Multiplex-Information-UEbertragungsanlage
DE2546446C3 (de) PCM-Zeitmultiplex-System
DE1774941C3 (de) Einrichtung zur Übertragung von Informationen zwischen zwei dynamischen Speichern. Ausscheidung aus: 1474025
DE2617344C2 (de) Verfahren zur Herstellung mehrerer, gleichzeitiger Konferenzverbindungen in einem Pulscodemodulation-Vermittlungssystem und Vorrichtung zur Durchführung des Verfahrens
DE2344340C3 (de) Signalübertragungssystem insbesondere Stehbildübertragungssystem
DE2524063C3 (de) Elektronisches Musikinstrument mit digitaler Musiktonerzeugung
DE69232964T2 (de) Informationsansageeinrichtung
EP0010600B1 (de) Verfahren zur codierten Übertragung von Sprachsignalen, Verwendung des Verfahrens in einem Zeitmultiplex-Übertragungssystem und Anordnung zur Durchführung des Verfahrens
DE2855151A1 (de) Digitaler hoertongenerator
DE2535786A1 (de) Tastenschaltersystem
DE2836736B2 (de) Verfahren zur Aufzeichnung von beim Spielen eines tastenbetätigten Musikinstruments entstehenden Tonsignalen und den damit verbundenen Spielausdrücken, insbesondere der Lautstärke, entsprechenden Datensignalfolgen auf einem Aufzeichnungsträger und Vorrichtung zur Durchführung des Verfahrens
DE2836737B2 (de) Verfahren zur Aufzeichnung von beim Spielen eines tastenbetätigten Musikinstruments entstehenden Tonsignalen entsprechenden Datensignalfolgen auf einem Aufzeichnungsträger
DE3129155A1 (de) Datenkompressorsystem
DE3037276A1 (de) Tonsynthesizer
DE2529420B2 (de) Verfahren und vorrichtung zum abgeben von gespeicherten informationen in gesprochener form an fernsprechteilnehmer
DE2051589A1 (de) Anordnung zur Synthese eines Signals
DE2826570C2 (de)
DE2657430A1 (de) Einrichtung zum synthetisieren der menschlichen sprache
DE3226600A1 (de) Mit einem nachhalltonerzeugungsapparat ausgestattetes elektronisches musikinstrument
DE2335818C3 (de) Elektrische Anordnung zur automatischen Erzeugung von gesprochenen Sätzen
AT311077B (de) Einrichtung zur Synthetisierung von Audio-Informationen
DE2905080A1 (de) Digitales zeitmultiplex-nachrichtenuebertragungssystem mit einzelkanal-kodierung/dekodierung

Legal Events

Date Code Title Description
C3 Grant after two publication steps (3rd publication)
E77 Valid patent as to the heymanns-index 1977
8328 Change in the person/name/address of the agent

Free format text: KERN, R., DIPL.-ING., PAT.-ANW., 8000 MUENCHEN

8327 Change in the person/name/address of the patent owner

Owner name: NIPPON TELEGRAPH AND TELEPHONE CORP., TOKIO/TOKYO,