DE3037276A1 - Tonsynthesizer - Google Patents

Tonsynthesizer

Info

Publication number
DE3037276A1
DE3037276A1 DE19803037276 DE3037276A DE3037276A1 DE 3037276 A1 DE3037276 A1 DE 3037276A1 DE 19803037276 DE19803037276 DE 19803037276 DE 3037276 A DE3037276 A DE 3037276A DE 3037276 A1 DE3037276 A1 DE 3037276A1
Authority
DE
Germany
Prior art keywords
circuit part
filter
signal
parameters
output signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
DE19803037276
Other languages
English (en)
Other versions
DE3037276C2 (de
Inventor
Fumitada Houya Tokyo Itakura
Noboru Iruma Saitama Sugamura
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph & Telephone Public Corp Tokyo
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from JP12836679A external-priority patent/JPS5651116A/ja
Priority claimed from JP54128365A external-priority patent/JPS5853352B2/ja
Application filed by Nippon Telegraph & Telephone Public Corp Tokyo, Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph & Telephone Public Corp Tokyo
Publication of DE3037276A1 publication Critical patent/DE3037276A1/de
Application granted granted Critical
Publication of DE3037276C2 publication Critical patent/DE3037276C2/de
Expired legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • G10L19/07Line spectrum pair [LSP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • G10L13/04Details of speech synthesis systems, e.g. synthesiser structure or memory management
    • G10L13/047Architecture of speech synthesisers

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Signal Processing (AREA)
  • Electrophonic Musical Instruments (AREA)
  • Stereophonic System (AREA)

Description

- 7 - 80/8773· - -
Beschreibung
Tonsynthesizer
Die Erfindung betrifft ein Verfahren zur Tonsynthese nach dem Oberbegirff des Anspruchs 18 sowie einen Tonsynthesizer nach dem Oberbegriff des Anspruchs 1.
Beispielsweise im Fall des Aufbaus von Sprache aus charakteristischen Parametern der Originalsprache werden beim Stand der Technik das Ausgangssignal eines Impulsgenerators, der die Vibration der Stimmbänder simuliert, und das Ausgangssignal eines Rauschgenerators, der die Turbulenz simuliert, in Abhängigkeit davon umgeschaltet oder zusammengemischt, ob ein stimmhafter oder ein stimmloser Laut vorliegt. Das resultierende Ausgangssignal wird entsprechend der Sprachamplitude amplitudenmoduliert, um ein Anregungsquellensignal zu erzeugen, das an ein Filter geliefert wird, welches zum Erhalt der synthetischen oder Kunstsprache den Stimmtrakt simuliert. Ein Synthesesystem, bei dem partielle Autokorrelationskoeffizienten (PARCOR) verwendet werden, sowie ein Formantsynthesesystem sind Beispiele solcher Sprachsynthesesysteme, die charakteristische Parameter benutzen. Das erstere ist beispielsweise dargestellt in J.D. Markel et al., "Linear Prediction of Speech", Seiten 92 bis 128, Springer-Verlag, 1976. Bei diesem System werden die partiellen Autokorrelationskoeffizienten oder sog. PARCOR-Koeffizienten einer Sprachwellenform als charak-
130015/1023
teristische Parameter verwendet. Wenn die absoluten Werte dieser PARCOR-Koeffizienten alle kleiner als 1 sind, dann ist das Sprachsynthesefilter stabil. Die PARCOR-Koeffizienten mögen eine relativ geringe Informationsmenge zur Sprachsynthese erfordern und lassen sich relativ leicht automatisch geiwnnen, jedoch unterscheiden sich die einzelnen Parameter sehr stark bezüglich der Spektralempfindlichkeit. Wenn demzufolge alle Parameter unter Verwendung derselben Bitanzahl quantisiert werden, dann ergeben sich große Unterschiede bei der Spektralverzerrung, die auf Quantisierungsfehlern bei den jeweiligen Parametern beruhen. Ferner sind die PARCOR-Koeffizienten ungünstig bezüglich ihrer Interpolationseigenschaften. Bei der Interpolation dieser Parameter treten Rausch- oder Störsignale auf, die zu einer undeutlichen Sprache führen. Besonders bei einer niedrigen Bit-rate wird die Sprachqualität durch die Spektralverzerrung verschlechtert, so daß sich keine zufriedenstellende Qualität der Kunstsprache erzielen läßt. Außerdem entsprechen die PARCOR-Koeffizienten nicht direkt Spektraleigentümlichkeiten wie Formantfrequenzen, so daß PARCOR-Koeffizienten in der Regel für die Sprachsynthese nicht geeignet sind.
Das Formantsynthesesystem ist beispielsweise in J.L. Flanagan, "Speech Analysis, Synthesis and Perception", Seiten 339 bis 34 7, Springer-Verlag, 1972 offenbart. Es handelt sich hier um ein System, das Kunstsprache unter Verwendung der Formantfrequenzen und ihrer Intensität als Parameter bildet und insofern vorteilhaft ist, als die Informationsmenge für die Parameter gering sein kann, und insofern, als die Beziehung der Parameter zu Spektralgrößen leicht zu erhalten ist. Zur Gewinnung der Formantfrequenz und ihrer Intensität ist es jedoch nötig, Gebrauch von allgemeinen dynamischen Charakteristiken und statistischen Eigentümlichkeiten der Parameter zu machen, so daß eine völlig automatisehe Gewinnung der Formantfrequenz und ihrer Intensität schwierig ist. Demzufolge ist es schwierig, automatisch
2/3 13-0 01 S/102
Kunstsprache hoher Qualität zu erhalten und wahrscheinlich, daß eine merkliche Verschlechterung der Qualität der Kunstsprache durch einen Fehler bei der Gewinnung der Parameter auftritt.
Aufgabe der Erfindung ist es, ein Verfahren und eine Vorrichtung zur Tonsynthese zu schaffen, die die Synthese eines Tons hoher Qualität unter Verwendung einer geringen Informationsmenge erlauben, so daß synthetisch ein Ton im wesentlichen in der gleichen Qualität wie der Originalton aus dessen Merkmalen, die übertragen werden oder in einem Speicher gespeichert sind, aufgebaut werden kann.
Diese Aufgabe wird erfindungsgemäß durch die Merkmale in den Ansprüchen 18 bzw. 1 gelöst. Vorteilhafte Weiterbildungen der Erfindung sind in den Unteransprüchen enthalten. Der erfindungsgemäße Tonsynthesizer erlaubt es, die charakteristischen Parameter relativ leicht zu gewinnen und arbeitet stabil. Die Unterschiede der Spektraempfindlichkeit unter den Parametern sind gering und die Quantisierungsgenauigkeit der Parameter ist bei gleicher Anzahl der Quantisierungsbits gleich. Die Interpolationseigenschaften für die verwendeten Parameter sind ausgezeichnet, und schließlich besitzt der Tonsynthesizer einen verhältnismäßig einfachen Aufbau.
Bei einer linearen prädiktiven Analyse wird die Sprachspektralumhüllende durch eine übertragungsfunktion eines Allpolfilters angenähert, die durch folgende Gleichung (1) gegeben ist:
A (Z) 1 +Ot1Z + OC2ZZ + ... + Ot ZP
wobei Z = e"-3 , <^ eine normierte Kreisfrequenz 2Tf 4τ, Δ T eine Abtastperiode, f eine Abtastfreguenz, ρ der Analy-
3/4 -
13001S/1023
segrad, CC-. (i=1,2, ...ρ) Prädilctorkoeff izienten, die Parameter zur Steuerung der Resonanzeigenschaften des Filters darstellen, und CT die Verstärkung des Filters sind. A (Z) wird durch die Summe von zwei Polynomen dargestellt, was wie folgt ausgedrückt werden kann:
A (Z) = 1/2[P(Z) + Q(Z)]'
,P, ,„-L
P(Z) = A (Z) -Z- ZFA (Z ) (3] P P
Q(Z) = A (Z) + Z · ZPA (Z~1)
(a) Wenn der Analysegrad ρ gerade ist, können die Gleichungen (3) und (4) wie folgt in Faktoren zerlegt werden:
(5)
%P (Z) = (1 - ζ) P/2
JT
(1 - 2COSO1Z + ζ2)
i = 1
Q (Z) = (1 + Z) P/2
π
(1 - 2cos θ.ζ
J i = 1
(b) Wenn der Analysegrad ρ ungerade ist, werden Glei chungen (3) und (4) wie folgt in Faktoren zerlegt:
(P-D/2
9 P(Z) = (1 - Z)
(1 - 2COSÖ.Z + Z
Q(Z) =
(p+D/2 Jf
i = 1
(1 - 2cos θ.ζ- + Z
O i und Q^ in den Ausdrücken (5) und (6) werden ein Linienspektrumpaar (nachfolgend als LSP bezeichnet) genannt
4/5
.130016/1023
und bei der Erfindung als Parameter zur Darstellung der Spektralumhüllenden-Information verwendet.
Durch Umschreiben von Gleichung (1) und Ersetzen von A (Z) gemäß Gleichung (2) ergibt sich die Übertragungsfunktion H(Z) wie folgt:
Ap(Z)
1 + 1/2Ü>(Z) - 1 + Q(Z) - 1 1 (7)
Die Übertragungsfunktion H(Z) wii'd auch als Filter mit zwei Rückkopplungskreisen gebildet, deren übertragungs-' ~* funktionen P(Z) - 1 bzw. Q(Z) - 1 sind. Die Übertragungsfunktionen P(Z) und Q(Z) sind die von Antiresonanzkreisen, deren Ausgangssignal bei Θ. bzw. CJ .Null wird. Die Frequenzkennlinie von A (Z) wird wie folgt:
P/2
j A (Z) j z = 2P [cos - // (cos O- cosW.)
4. · 2C3 ΊΓ , rs , ,2 N (8)
+ sm — .'' (cos CJ - cos O-) 1
wobei Z = e ^ . Nach Gleichung (8) scheint, daß in einem Bereich, in dem benachbarte Linienspektralfrequenzen dicht beieinanderliegen, | A (Z)[ klein ist und die. Übertragungsfunktion H(Z) eine starke Resonanzcharakteristik zeigt. Durch Ändern der Werte der LSP-Parameter O . und θ., die die Resonanzcharakteristik der Übertragungsfunktionen beschreiben, kann eine willkürliche Sprachspektralumhüllende erhalten werden.
5/6 .
130015/10 23
Die Prozedur zur Gewinnung der LSP-Parameter ist folgende: In einem ersten Schritt erhält man Autokorrelationskoeffizienten einer Sprachwelle in Intervallen von beispielsweise 10 bis 20 ms. Im zweiten Schritt erhält man von den Autokorrelationskoeffizienten Prädiktorkoeffizienten OC.der Übertragungsfunktion H(Z). im dritten Schritt erhält man von den Prädiktorkoeffizienten auf der Basis der Beziehung der Gleichung (2) die Lösungen der beiden Polynome P(Z) und Q(Z), und auf diese Weise die LSP-Parameter Cb ■ und Θ.. Durch Steuerung der Koeffizienten des Synthesefilters unter Verwendung der Parameter, die die Information über die Sprachspektralumhüllende darstellen, kann man ein Filter erhalten, dessen Übertragungsfunktion H(Z) der Sprachspektralumhüllenden äquivalent ist. Die Übertragungsfunktion der Rückkopplungsschleife im Synthesefilter ist in Form einer Kaskadenschaltung von Filtern zweiter Ordnung vorgesehen, deren Nullstellen auf einem Einheitskreis in einer Ebene Z liegen, wie durch die Ausdrücke (5) und (6) angegeben. Da diese beiden Filter zweiter Ordnung im Aufbau identisch sind, kann man den Aufbau auch durch Mehrfachverwendung von einem Filter zweiter Ordnung unter Einsatz eines Zeitteilungsbetriebs oder einer sog. Pipeline-Operation vereinfachen. Es ist auch möglich, den Filterbetrieb durch Verarbeitung eines elektronischen Rechners ohne Ausbildung der Filter zweiter Ordnung als Schaltungskreise durchzuführen.
Wie oben beschrieben/ werden bei der vorliegenden Erfindung die Eigenschaften oder Kennwerte des Synthesefilters durch die vorgenannten Parameter 0. und CJ . gesteuert. Zusätzlich zu diesen LSP-Parametern Θ. und (J · werden aber ein Grundfrequenzparameter und ein Amplitudenparameter eingesetzt, wie dies auch bei bislang benutzten Sprachsynthesizern der Fall ist. Durch den Grundfrequenzparameter wird eine stimmhafte Tonquelle gesteuert, einen Impuls oder eine Gruppe von Impulsen der durch den Parameter angezeigten Frequenz zu erzeugen. Das Ausgangssignal dieser stimmhaften
6/7 13001S/1023
ORIGINAL INSPECTED
Tonguelle oder das Ausgangssignal von einer Rauschquelle wird abhängig davon ausgewählt, ob der zu rekonstruierende Ton bzw. Laut stimmhaft oder stimmlos ist. Das ausgewählte Ausgangssignal wird an das Tonsynthesefilter angelegt. Die Größe eines Signals am Eingang oder am Ausgang des Synthesefilters wird mittels des Amplitudenparameters gesteuert. Die LSP-Parameter Θ. und CD. werden mittels einer Parametertransformierungseinrichtung einer Kosinustransformation zu -2cos 6^. rnd -2cos0. unterworfen, und diese transformierten Parameter als Steuerparameter zur Steuerung der Koeffizienten der den jeweiligen Parametern entsprechenden Filter zweiter Ordnung des Tonsynthesefilters verwendet. Die Steuerparameter werden mittels einer Interpolationseinrichtung in der Form von kosinustransformierten LSP-Parametern -2cos0. und -2cosCJ. interpoliert. Die Interpolationseinrichtung kann auch für die Interpolation des Amplitudenparameters eingesetzt werden. Die LSP-Parameter Θ. und <li . sind sehr gut interpolationsfähig, und die Interpolation wird in Zeitintervallen die gleich oder zwei Mal so groß wie die Abtastperiode des zur Erzeugung der Parameter dienenden Originaltons sind, durchgeführt. Beispielsweise werden die LSP-Parameter Θ. und Co. nach jeder Blockzeit von 20 ms erneuert und die Parameter in jedem Block alle 125 ps interpoliert. Es ist auch möglich, die Interpolation im Stadium der LSP-Parameter Θ. und CO. durchzuführen und diese dann in die Steu-
-L JL
erparameter umzusetzen.
Die Informationsmenge pro Block ist bei den LSP-Parametern Θ. und OJ. gering im Vergleich zu den Steuerparametern für das Synthesefilter zur Sprachsynthese in der Vergangenheit. Sie sind ferner ausgezeichnet interpolationsfähig. Demzufolge ist es möglich, die LSP-Parameter Θ. und W. zu übertragen oder zu speichern wie sie sind, und ebenfalls möglich, die empfangenen oder rekonstruierten LSP-Parameter θ und Co·
i ! in die Steuerparameter für das Synthesefilter, das bei ande-
7/8
130015/1023
3037278
ren Sprachsynthesesystemen verwendet wird, d.h. die PARCOR-Koeffizienten oder lineare Pradiktorkoeffizienten umzusetzen. Auf diese Weise können die LSP-Parameter Θ. und CO. auch bei vorhandenen Sprachsynthesizern verwendet werden. Der Tonsynthesizer der vorliegenden Erfindung eignet sich nicht nur zur Synthese gewöhnlicher Sprache, sondern auch solcher von Tönen eines Zeitsignaltons, eines Alarmtons, eines Musikinstrumenttons usw.
Die Erfindung wird nachfolgend unter Bezug auf die beiliegenden Zeichnungen an Ausführungsbeispielen näher erläutert. Es zeigen:
Fig. 1 ein Blockschaltbild des grund-
sätzlichen Aufbaus einer Ausfüh
rungsform des erfindungsgemäßen Tonsynthesizers,
Fig. 2 ein Blockschaltbild eines speziel-
len Betriebsbeispiels des Tonsyn
thesizers,
Fig. 3 ein Schaltbild eines Beispiels eines
Filters erster Ordnung oder zweiter Ordnung,- die den Synthesefil
ter schaltungsteil bilden,
Fig. 4A ein Schaltbild zur Erläuterung
eines Beispiels des Synthesefilterschaltungsteils für den Fall, daß
der Analysegrad gerade ist,
Fig. 4B ' ein Schaltbild zur Erläuterung
eines Beispiels des Synthesefilterschaltungsteils für den Fall, daß
der Analysegrad ungerade ist,
130015/1023
15 " 3037278
Fig. 5 ein Diagramm des Verhältnisses
zwischen den LSP-Parametern Θ. und (*>. und der Sprachspektralumhüllenden,
Fig. 6 ein Schaltbild eines speziellen
Betriebsbeispiels des Synthesefilterschaltungsteils für den Fall, daß der Analysegrad 4 ist,
Fig. 7 ein Schaltbild eines speziellen
Betriebsbeispiels des Synthesefilterschaltungsteils, das sich durch eine äquivalente Umwandlung der in Fig. 6 gezeigten Schaltung ergibt,
Fig. 8 ein Schaltbild eines spezieülen
Beispiels des Synthesefilterschaltungsteils für den Fall, daß der Analysegrad 5 ist,
Fig. 9 ein Schaltbild eines speziellen Be
triebsbeispiels des Synthesefilter-Schaltungsteils, das sich durch eine äquivalente Umwandlung der in Fig.
gezeigten Schaltung ergibt,
Fig. 1o ein Blockschaltbild eines Beispiels
des Synthesefilterschaltungsteils, das von einem Pipeline-Rechensy
stem Gebrauch macht,
Fig. 11A bis 111 Zeittafeln, die die Änderungen von Signalen an jeweiligen Stellen beim Betrieb des in Fig. 10 gezeigten
Synthesefilterschaltungsteils wiedergeben ,
13001B/10S3
303727a
Fig. 12 ein Schaltbild, das den Fall zeigt,
bei dem die durch den in Fig. 11 gezeigten Betrieb erreichte Filterarbeitsweise durch eine Reihenschaltung von Filtern erzielt wird,
Fig. 13 ein Blockschaltbild eines Beispiels
des einen Mikrocomputer verwendenden Synthesefilters,
10
Fig. 14A ein Diagramm, das die Änderungen
der Stärke mit der Zeit für den Fall einer Lautfolge "ba ku ο N ga" wiedergibt,
15
Fig. 14b ein Diagramm, das die Schwankungen
der LSP-Parameter Θ. und CO. mit
ι ι
der Zeit für den Fall dieser Lautfolge zeigt,
20
Fig. 15 ein Diagramm, das die Verteilungen
der relativen Frequenz der LSP-Parameter θ. und Ci . über der Frequenz zeigt,
Fig. 16 ein Diagramm, das die Beziehung
zwischen der Anzahl von Quantisierungsbits pro Block und der Spektralverzerrung durch die Quantisierung zeigt,
Fig. 17 ein Diagramm, das die Beziehung der
Spektralverzerrung durch Interpolation über der Blocklänge für den Fall zeigt, daß die Parameter inter
poliert wurden, und
10/11
130015/1023
Fig. 18 ein Diagramm, das ein Beispiel
zur Sprachsynthese durch Umwandlung der LSP-Parameter Θ. und CO. zu OC-Parametern zeigt.
Es wird zunächst auf- Fig. 1 Bezug genommen, bei der die charakteristischen Parameter von synthetisch zu bildender Sprache (Kunstsprache) von einem EingangsanschIuβ 11 nach jeweils einer konstanten Zeitperiode (die nachfolgend als Blockperiode bezeichnet werden soll) von beispielsweise jeweils 20 ms an einen Interface-Schaltungsteil 12 angelegt und dort festgehalten werden. Von diesen so eingegebenen Parametern werden die LSP-Parameter Θ. und ω die eine Information über die Spektralumhüllende darstellen, an einen Parametertransformierungs-Schaltungsteil (PT-Schaltungsteil) 13 geliefert. Von den Parametern, die eine Tonquelleninformation darstellen, wird die Amplitudeninformation an einen Parameterinterpolations-Schaltungsteil (PI-Schaltungsteil) 14 geliefert, während die anderem Parameter, d.h. die die Grundperiode (Tonhöhe) der Sprache angebende Information und die Information, die angibt, ob es sich um einen stimmhaften oder stimmlosen Laut handelt, an einen Tonquellensignalgenerator-Schaltungsteil (TQSG-Schaltungsteil) 15 geliefert werden.
In dem PT-Schaltungsteil 13 werden die eingegebenen LSP-Parameter Θ. und ■&>. in Steuerparameter -2cos0. und -2cos Φ . für einen Synthesefilter-Schaltungsteil (SF-Schaltungsteil) 16 transformiert und diese Parameter dem Pl-Schaltungsteil 14 geliefert. Im Pl-Schaltungsteil 14 werden in regelmäßigen Zeitintervallen die jeweiligen Interpolationswerte für die Steuerparameter und den Tonquellenamplitudenparamter errechnet, so daß die Spektralumhüllende einer stetigen Änderung unterliegen kann. Die so interpolierten Steuerparameter werden dem SF-Schaltungsteil 16 geliefert, während der Tonquellenamplitudenparameter an den TQSG-Schaltungsteil 15 angelegt wird. Im TQSG-Schaltungsteil 15 wird abhängig von den
11/12
1 3001S/1023
Eigenheiten der Sprache ein Tonquellensignal auf der Basis der Tonhöheninformation und der Information, ob der Laut stimmhaft oder stimmlos, erzeugt und dieses Tonquellensignal zusammen mit dem interpolierten Tonquellenamplitudenparameter an den SF-Schaltungsteil 16 angelegt. Im SF-Schaltungsteil 16 wird aus dem Tonquellensignal und den Steuerparametern Kunstsprache erzeugt. Das Ausgangssignal vom SF-Schaltungsteil 16 wird zu einem Digital/Analog-Umsetzschaltungsteil (DAÜ-Schaltungsteil) 17 geliefert un<3- an dessen Aus gangs ans chluß 18 als Analogsignal abgenommen. Ein Steuerschaltungsteil 19 erzeugt verschiedene Taktsignale zur richtigen Aktivierung des Sprachsynthesizers und liefert diese den jeweiligen Schaltungsteilen.
Fig. 2 zeigt in etwas konkreterer Form die einzelnen Schaltungsteile von Fig. 1 . Nach leder Blockperiode wird die Information darüber, ob der Sprachlaut stimmhaft oder stimmlos ist, vom Interface-Schaltungsteil 12 an ein Stimmhaft-Register 23 und ein Stimmlos-Register 24 angelegt, während ein Sprachfrequenzparameter, der die Sprachtonhöhe angibt, in einem Tonhöhenregister 25 gespeichert wird. Ein Abwärtszähler 27 wird auf den Inhalt des Tonhöhenregisters 25 voreingestellt. Der Abwärtszähler 27 zählt in Abwärtsrichtung Impulse einer Abtastfrequenz, die an einem Anschluß 26 anstehen. Jedesmal, wenn der Zählerinhalt Null wird, liefert er einen Impuls an ein Tor oder Verknüpfungsglied 31 und wird gleichzeitig auf den Inhalt des Tonhöhenregi-. sters 25 voreingestellt. An das Verknüpfungsglied 31 werden der Ausgang vom Stimmhaft-Register 23 und ein Ausgangsimpuls oder Ausgangsimpulse von einem Impulsgenerator 28 angelegt, und,wenn diese Eingangssignale übereinstimmen, der Inhalt eines Tonquellenamplitudenregisters (nachfolgend einfach als Amplitudenregister bezeichnet) 34 über das Verknüpfungsglied 31 an einen Addierer 32 angelegt.
Mit anderen Worten wird die Ämplitudeninformation vom Ampli-
13/14
130016/1023
3037278
tudenregister 34 nach jeweils einer Periode entsprechend der Sprachgrundfrequenz im Tonhöhenregister 25 an den Addierer 3 2 angelegt, wenn der zu erzeugende Kunstsprachlaut stimmhaft ist. Die Amplitudeninformation vom Amplitudenregister 34 wird in diesem vom Pl-Schaltungsteil 14 voreingestellt.
Handelt es sich bei dem zu erzeugenden Kunstsprachlaut um einen stimmlosen Laut, werden das Ausgangssignal vom Stimmlosregister 2 4 und ein Pseudozufallsserienimpuls von einem Pseudozuf allssignal-(PZS-)Generator 36 an ein Tor oder Verknüpfungsglied 37 geliefert. Bei jedem Zusammenfallen beider Eingangssignale wird die Amplitudeninformation aus demAmplitudenregister 34 über das Verknüpfungsglied 37 an den Addierer 32 geliefert. Das in dieser Weise vom Addierer 32 abgeleitete Tonquellensignal wird, falls nötig, von einem Verstärker 39 verstärkt und dann an den SF-Sehaltungsteil 16 angelegt.
Im PT-Schaltungsteil 13 werden die LSP-Parameter Θ. und L>
-L JL
und der Amylitudenparameter von dem Interface-Schaltungsteil 12 nach jeder Blockperiode in ein Register 21 eingegeben. Die LSP-Parameter Θ. und O. werden einem Parameterumsetzer 22 geliefert, in welchem sie zu den Steuerparametern -2cosÖ. und -2cos Oj transformiert werden. Der Parameterumsetzer 22 ist beispielsweise durch eine Umsetzungstabelle eines Festwertspeichers (ROM) gebildet, der bei Zugriff mit Adressen, die Θ. und Cu. entsprechen, -2cos Θ. bzw. -2cos CO .
J- -L JL -L
ausgibt. Ein Schieberegister 20 erhält abwechselnd ^.as ausgangssignal vom Parameterumsetzer 22 und den im Register gespeicherten Amplitudenparameter und setzt diese in ein " serielles Signal um, das an den Pl-Schaltungsteil 14 angelegt wird.
14/15
130015/1023
Beim dargestellten Ausführungsbeispiel führt der PI-Schaltungsteil 14 eine lineare Interpolation durch. Nach Einschalten eines Schalters 29 werden die Parameter eines Blocks einem Subtraktor 30 geliefert, der eine Differenz zwischen diesem Parameter und demjenigen des vorigen Blocks von einem Addierer 33 ermittelt. Diese Differenz wird in einem Differenzwertregister 38 über einen Schalter 91 gespeichert. Danach wird der Schalter 91 auf die Ausgangsseite des Differenzwertregisters 38 umgeschaltet und dessen Inhalt in Umlauf gebracht. Hierbei wird der Inhalt des Differenzwertregisters 38 für Bitstellen, die höher als eine vorgegebene Bitstelle sind, herausgezogen und dem Addierer 33 geliefert, wo er zum Inhalt eines Interpolationsergebnisregisters 92 hinzuaddiert wird. Wenn beispielsweise die Parameterauffrischungsperiode oder Blockperiode 16 ms ist und Interpolationsparameter 128 Mal während einer Blockperiode geliefert werden sollen, dann ist die Interpolationsschrittbreite ein Wert, der sich aus der Division des Differenzwerts durch 128 ergibt. Diesen Wert erhält man durch Verschieben des Differenzwerts im Differenzwertregister 38 um 7 Bits zur Seite des niedrigeren Stellenwerts hin. Das Ergebnis der vom Addierer 33 durchgeführten Addition wird dem Interpolationsergebnisregister 92 geliefert und gleichzeitig als Ausgangsgröße des Pl-Schaltungsteils 14 verwendet. Auf diese Weise werden vom Addierer 33 die Werte abgeleitet, die dadurch erhalten werden, daß sequentiell mit jedem Umlauf des Differenzwertregisters 38 einmal, zweimal, dreimal, ... der verschobene Wert des Differenzwertregisters 38 zum Parameter des vorigen Blocks im Interpolationsergebnisregister 92 addiert wird.
Bei diesem Beispiel wird der PI-Schaltungsteil 14 für den Steuerparameter und den Amplitudenparameter auf einer Zeitteilungsbasis verwendet, so daß, obwohl nicht gezeigt, der Steuerparameter und der Amplitudenparameter abwechselnd
15/16
130018/1023
interpoliert werden und das Interpolationserqebnisreqister für beide Parameter gemeinsam genutzt wird. Der im PI-Schaltungsteil 14 interpolierte Amplitudenpararaeter wird dem Amplitudenregister 3 4 im TQSG-Schaltungsteil 15 zugeführt, während der in oben erwähnter Weise interpolierte Steuerparameter als Information zur Steuerung des Filterkoeffizienten des SF-Schaltungsteils 16 diesem zugeführt wird. Die Blockperiode, d.h. die Zeitspanne, nach der die Parameter erneuert werden, wird so ausgewählt, daß sie im Bereich von 10 bis 20 ms liegt, während die Interpolationsperiode so ausgewählt wird, daß sie im Bereich von 1 bis 2 Abtastintervallen liegt. Die Art der Interpolation ist nicht speziell auf die lineare Interpolation beschränkt, es können auch andere Interpolationsarten sein. Wichtig ist, daß stetige Änderungen der interpolierten Parameter sichergestellt sind.
Der SF-Schaltungsteil 16 ist mit einer Rückkopplungsschleife zur Rückführung des Ausgangssignals über zueinander parallelgeschaltete Filterschaltungen 41 und 42 versehen.
Die Filterschaltungen 41 und 42 werden über einen Eingangsanschluß 44 mit dem interpolierten Steuerparameter versorgt, während ihre Ausgangssignale mit Hilfe eines Addierers 43 addiert werden, dessen Ausgangssignal seinerseits in einem Addierer 45 dem Eingangssignal des SF-Schaltungsteils hinzuaddiert wird. Das addierte Ausgangssignal vom Addierer 45 wird über die Filterschaltungen 41 und 42 zurückgeführt und gleichzeitig an einem AusgangsanSchluß 55 abgenommen.
Für beide Filterschaltungen 41 und 42 wird von einem Schaltungskreis Gebrauch gemacht, der eine Vielzahl von Nullstellen auf einem Einheitskreis in einer komplexen Ebene aufweist. Beide Filterschaltungen 41 und 42 können durch eine mehrstufige Kaskadenverbindung von Filtern erster Ordnung und/oder zweiter Ordnung gebildet sein. Bei Ausbildung der
16/17
130016/1023
Filterschaltungen als Digitalfilter kann von einem Filter erster Ordnung Gebrauch gemacht werden, wie es als Beispiel in Fig. 3A gezeigt ist, von einem Filter zweiter Ordnung, wie es in Fig. 3B gezeigt ist und von einem Filter zweiter Ordnung, wie es in Fig. 3C gezeigt ist. Das Filter gemäß Fig. 3A ist aus einer Verzögerungsschaltung 51 mit einer Verzögerung von einer Abtastperiode und einem Addierer 52 zusammengesetzt, der das verzögerte Ausgangssignal und ein unverzögertes Eingangssignal addiert. Das Filter gemäß Fig.
3B besteht aus zwei Stufen von Verzögerungsschaltungen 51 und einem Addierer 52, der das verzögerte Ausgangssignal und das nicht verzögerte Eingangssignal addiert. Das Filter gemäß Fig. 3C enthält einen Multiplizierer 53, der das verzögerte Ausgangssignal von einer Stufe-;einer Verzögerungsschaltung 51 mit -2coso. multipliziert, sowie einen Addierer 52, der das verzögerte Ausgangssignal von zwei Stufen von Verzögerungsschaltungen 51, das nicht verzögerte Eingangssignal und das Ausgangssignal des Multiplizierers 53 addiert. Die Übertragungsfunktionen der in den Fig. 3A, 3B und 3C gezeigten Filter sind 1*Z, 1-Z bzw. 1-2cosO.Z+Z . Es ist auch möglich, Filter höherer Ordnung einzusetzen.
Die Kombination und die Anzahl solcher Filter hängt vom Grad der Analyse ab und wird gemäß Fig. 4A oder 4B in Abhängigkeit davon ausgewählt, ob der Analysegrad gerade oder ungerade ist. In Fig. 4A ist der Analysegrad 10, d.h. eine gerade Zahl, und die Filterschaltung 41 ist gebildet von einer Reihenschaltung aus einem Filter 56 erster Ordnung mit der Übertragungsfunktion 1-Z und Filtern 57 bis 61 zweiter Ord-
2 nung, deren jeweilige Übertragungsfunktion 1-2cos<D.Z+Z ist. Das Ausgangssignal am Ausgangsanschluß 55 wird in einem Multiplizierer 63 mit +1/2 multipliziert und an die Reihenschaltung angelegt. Das Ausgangssignal des Filter 61 der letzten Stufe und das Ausgangssignal vom Multiplizierer 63 werden mittels eines Addierers 62 addiert und dessen Additionsausgangssignal zum Addierer 43 geliefert. In der Filterschaltung 42 wird das Ausgangssignal vom Multiplizierer 63
130015/1023
17/18
einer Reihenschaltung aus einem Filter 64 erster Ordnung mit der übertragungsfunktion 1+Z und Filtern 65 bis 69 zweiter Ordnung, die jeweils die Übertragungsfunktion 1-2cosQ.Z+Z besitzen, zugeführt. Das Ausgangssignal der Reihenschaltung und das Ausgangssignal vom Multiplizierer 63 werden in einem Addierer 71 addiert und dessen Additionsausgangssignal dem Addierer 43 zugeführt. Den Multiplizierern 53 (vgl. Fig. 3C) der Filter 57 bis 61 zweiter Ordnung werden jeweils Steuerparameter a- = -2cos Co bis a5 = -2cos<ü5 eingegeben, während den Multiplizierern 53 der Filter 65 bis 69 zweiter Ordnung jeweils Steuerparameter b- = -2COsQ1 bis b,- = -2cos Qr eingegeben werden.
Fig. 4B zeigt den Fall, daß der Analysegrad 11, d.h. eine ungerade Zahl ist. In der Filterschaltung 41 ist das Filter 56 erster Ordnung, das im Fall von Fig. 4A verwendet wird, weggelassen und stattdessen wird ein Filter 72 zweiter Ord-
2 nung mit einer übertragungsfunktion 1-Z verwendet. In der Filterschaltung 42 ist das Filter 64 erster Ordnung weggelassen und stattdessen ein Filter 7 3 zweiter Ordnung verwendet, dem ein Parameter bfi = -2COsQ6 eingegeben wird.
In den Filterschaltungen 41 und 42 stellen die Steuerparameter CO. und Q. Antiresonanzfrequenzen dar, bei denen die Ausgangswerte der Filterschaltungen 41 und 42 0,5 werden. Für den Fall, daß die den Filterschaltungen 41 und 42 zugeführten Antiresonanzfrequenzen nahe beieinanderliegen, kommt der Ausgangswert des Addierers 43 nahe an 1, so daß sich auch die Verstärkung der Rückkopplungsschleife dem Wert 1 annähert.
Als Folge tritt am Ausgangsanschluß 55 eine hohe Resonanzcharakteristik auf. GJ ^ bis C^5 und Q^ bis Q5 sind hier Antiresonanzfrequenzen, die charakteristisch für die Sprachspektralumhüllüngsinformation sind. Diese Parameter und die Sprachumhüllungscharakteristik besitzen ein Verhältnis, wie es in Fig. 5 wiedergegeben ist. Aus Fig. 5 ist ersichtlich,
19/20
130015/1023
daß die Resonanzcharakteristik des Spektrums durch den Abstand zwischen benachbarten Parametern ausgedrückt werden kann. Diese Parameter stehen der Reihe nach in folgender Beziehung zueinander:
O < G1 < CO1 < Q2 < CO2 - · · < ei < ^1 < It (81)
Eigenart des Synthesefilters ist, daß es stabil ist, wenn
diese Voraussetzung erfüllt ist.
10
Als nächstes soll ein spezielles Beispiel des SF-Schaltungsteils 16 beschrieben werden. Entsprechend dem in Klammern gesetzten Term im Nenner von Gleichung (7) erhält man die
folgenden identischen Gleichungen aus Gleichung (5): 15
P/2 2
P(Z) - 1 = (1 - Z) jr- (1 - 2cosCJ±Z + Z ) - 1
i=1
p/2-1 i
= Z (Ca1 + Z) + Σ (a.+1 + Z) Τ/ (1 + a.Z + Zz) i=1 j=1 3
P/2 2 -
- JJ- (1 + ajZ + Zz)j (9)
25
p/2-1 ■ i . 9
Q(Z) - 1 = Z { (b1 + Z) + Σ (b, .- + Z) Jf (1 + b.Z + Z^
1 i=1 1+l j=1 D
P/2 ■ 2
+ TT (1 + b.Z + Zz)f (10)
j=1
a. = -2cos &> .
b± =
O <C0 ± , θ± < IT (11)
20/21
130016/1023
Es wird ein Digitalfilter gebildet, das eine Allpoiübertragungsfunktion besitzt, die die Sprachspektralumhüllende annähert und unter Verwendung der durch die Gleichungen (7), (9) und (10) gegebenen Beziehungen durch Gleichung (1) gegeben ist. Fig. 6 zeigt den Fall für ρ = 4. In Fig. 6 sind Teile, die solchen in den Fig. 3B bis 4 entsprechen, mit denselben Bezugszahlen bezeichnet. Das Eingangssignal bzw. der Eingangswert vom Anschluß 54 wird mit Hilfe des Addierers 45 zum Ausgangssignal bzw. Ausgangswert vom Addierer 43 hinzuaddiert. Das Additionsergebnis wird an den Ausgangsanschluß 55 geliefert und gleichzeitig im Multiplizierer 63 mit +1/2 multipliert. Diese Multiplikation mit 1/2 entspricht derjenigen im Nenner von Gleichung (7). Das Ausgangssignal vom Multiplizierer 6 3 wird an eine Verzögerungsschaltung 74 angelegt, deren Verzögerungszeit eine Abtastperiode, d.h. gleich der Zeiteinheit ist. Das verzögerte Ausgangssignal wird als Eingangssignal an die beiden Filter 57 und 65 zweiter Ordnung angelegt, in denen es den Verzögerungsschaltungen 51, den Multiplizierern 53 und den Addierern 52 zugeführt wird. In beiden Multiplizierern 53 werden die jeweiligen Eingangssignale mit a- bzw. b1 multipliziert und die multiplizierten Ausgangssignale in beiden Filtern 57 und 65 jeweils an einen Addierer 9 4 zur Addition mit dem Ausgangssignal der zugehörigen Verzögerungsschaltung 51 angelegt. Die Ausgangssignale beider Addierer 94 werden an einen gemeinsamen Addierer 81 angelegt und gleichzeitig in beiden Filtern 57 und 65 über eine jeweilige Verzögerungsschaltung 95 mit einer Verzögerungszeit gleich einer Abtastperiode an den Addierer 52 angelegt. Die Ausgangssignale von beiden Addierern 52 werden als jeweilige Ausgangssignale der Filter 57 und 65 den Filtern 58 und 66 zweiter Ordnung der nächsten Stufe zugeführt. Die Filter 58 und 66 stimmen im Aufbau mit den Filtern 57 und 65 überein, nur sind hier die Koeffizienten für die Multiplizierer 53 a bzw. b~ . Das Ausgangssignal vom Addierer 9 4 jedes dieser Filter 58 und 66 wird an einen Addierer 82 zur Addition mit dem Ausgangssignal vorn Addierer
21/22 130016/1023
3037278
angelegt. Die Ausgangssignale von den Addierern 52 der beiden Filter 58 und 66 werden dem Addierer 43 zugeführt, um voneinander subtrahiert zu werden. Der Addierer 43 erhält ferner das Ausgangssignal vom Addierer 82. 5
Die Verzögerungsschaltung 74 entspricht Z außerhalb der Klammern in den Gleichungen (9) und (10), und die Filter
57 und 58 stellen je ein Filter zweiter Ordnung mit einer Übertragungsfunktion 1 + Z(a. + Z) dar. In ähnlicher Weise stellen die Filter 65 und 66 je ein Filter zweiter Ordnung mit einer übertragungsfunktion 1 +Z (b. +Z) dar. Demzufolge wird mittels der Reihenschaltung der Filter 57 und 58 der dritte Term in der Klammer in Gleichung (9) realisiert, während die Verzögerungsschaltung 51, der Multiplizierer 53 und der Addierer 94 im Filter
58 (a·.-! + Z) realisieren. Folglich wird durch diese Schaltung und das Filter 57 der zweite Term in der Klammer in Gleichung (9) realisiert, wobei das Ausgangssignal über den Addierer 82 zum Addierer 83 geliefert wird. Die Verzögerungsschaltung 51, der Multiplizierer 53 und der Addierer 94 im Filter 57 realisieren (ai+-j + Z) , und das Ausgangssignal wird dem Addierer 43 über die Addierer 81 und 82 geliefert. Auf diese Weise werden die Terme in den Klammern in Gleichung (9) durch die Filter 57 und 58 zweiter Ordnung und die Addierer 43, 81 und 82 realisiert. In ähnlicher Weise werden die Terme in den Klammern in Gleichung (10) durch die Filter 65 und 66 zweiter Ordnung und die Addierer 43, 81 und 82 realisiert. Die Gleichungen (9) und (10) unterscheiden sich formal nur dadurch, daß die Vorzeichen der dritten Terme in den Klammern unterschiedlich sind und daß deshalb das Vorzeichen des Eingangssignals zum Addierer 43 sich unterscheidet. Demzufolge realisieren der Addierer 43, die Filter 57, 58, 65 und 66, der Multiplizierer 63 und die Verzögerungsschaltung 74 die Gleichung (2), während die Schaltungsanordnung von Fig. 6 als Ganzes
22/23
130015/1023
3037278
der Anzapfung 97 zum Addierer 43 dem zweiten Term in den Klammern in Gleichung (9) entspricht. Die Filter 65 und zweiter Ordnung der Filterschaltung 41 sind in ähnlicher Weise ausgebildet. In Verbindung mit der Filterschaltung wird das Ausgangssignal von der Verzögerungsschaltung 74 in einem Multiplizierer 9 8 mit -1 multipliziert, um das Minuszeichen für den dritten Term in den Klammern der Gleichung (9) zu verwirklichen.
Für den Fall, daß ρ ungerade ist, erhält man aus Gleichung (8) die folgende identische Gleichung, die dem Term in den Klammern im Nenner der Gleichung (7) entspricht:
(p-3)/2 i 2
P(Z) -I=Z Ua1H-Z) + Z (a-i+i + z) 7Γ ^ i=1 X ' j=1
(p-1)/2 ri
- Z 77· (1 + a.Z + Z^)J (12)
j=1 J
(p-D/2
Q(Z) - 1 = Z Hb1H-Z) + £ (b,.- +
i=1 X
Jf (1 + b.Z + Z^H (13)
j=1 D
a. = -2cos
b. = -2cos
0 έ W1 f θ± < Tl (14)
Wie in dem Fall, daß ρ gerade ist, lassen sich zwei Arten von Digitalfiltern, die als Anzapfungsausgangstyp und als Anzapfungseingangstyp bezeichnet werden können, aus den Verhältnissen der Gleichungen (7), (12) und (13) in den in den Fig. 8 und 9 gezeigten Formen realisieren. In den
24/25
13001S/1Ö23
Fig. 8 und 9 ist angenommen, daß ρ = 5 ist. In den Fig. 8 und 9 entspricht das Filter 7 2 erster Ordnung Z im dritten Term in den Klammern in Gleichung (13), während das Filter 7 3 zweiter Ordnung zur Erzielung einer solchen Charakterstik dient, daß die Produkte der übertragungsfunktionen (1 + b.jZ + Z2) und (1 + L3Z + !
(b, + Z) multipliziert werden.
(1 + b.jZ + Z2) und (1 + b„Z + Z2) der Filter 65 und 66 mit
Wie man den Fig. 6 bis 9 entnehmen kann, können der Multiplizierer 63 zur Multiplikation mit 1/2 und die Verzögerungsschaltung 74 an irgendwelchen Stellen in der Rückkopplungsschleife angeordnet werden. Da die Filter zweiter Ordnung von gleichem Typ sind, ist es möglich, die Hardware dadurch zu vereinfachen, daß die Schaltungsanordnung so ausgebildet wird, daß ein sog. Pipelinebetrieb unter Verwendung eines Multiplizierers 53, der Vielzahl von Addierern 53 und 9 4 und der Vielzahl von Verzögerungsschaltungen 51 und 95, die ein Filter zweiter Ordnung ausmachen, auf einer Zeitmultiplexbasis durchgeführt wird. Fig. 10 zeigt den Fall, daß das Beispiel des in Fig. 12 gezeigten Filters zur Durchführung des Pipelinebetriebs angeordnet ist. Bei diesem Beispiel ist ρ = 10, und die Verarbeitung eines Satzes von Parametern, die vom Pl-Schaltungsteil angelegt werden, ist innerhalb einer Periode von 176 Takten beendet. In Fig. 10 sind Teile, die solchen von Fig. 12 entsprechen, mit denselben Bezugszahlen bezeichnet. Die Eingangsseite eines statischen 16-Bit-Schieberegisters 74, das die Funktion der Verzögerungsschaltung 74 ausführt, wird mit Hilfe eines Schalters S- zwischen der Ausgangsseite des Schieberegisters selbst und der Ausgangsseite des Addierers 45 umgeschaltet. Die Multiplikanden-Eingangsseite des Multiplizierers 53 und die Eingangsseite des Addierers 52 werden mittels eines Schalters S- zwischen der Ausgangsseite des Schieberegisters 74, der Ausgangsseite einer (27-d)-ten Stufe des Schieberegisters (vom Eingang des Schieberegisters
25/26
130015/1023
74 an gezählt) und der Ausgangsseite eines31-Bit-Schieberegisters 101 umgeschaltet, wobei d eine Betriebsverzögerung des Multiplizierers 53 ist. Der Multiplizierer 53 ist an einem Ende mit dem Ausgangsanschluß 55 und der Eingangsseite des Addierers 9 4 verbunden und leitet am anderen Ausgangsende das um Takte verzögerte Multiplikanden-Eingangssignal ab, das dem (154 + d)-Bit-Schieberegister 51 geliefert wird. Das Ausgangssignal vom Addierer 81 wird über ein Verknüpfungsglied 102 und ein 16-Bit-Schieberegister 103 zu seiner Eingangsseite zurückgeführt, wodurch mittels der Addierer 81 und 82 in Fig. 12 eine kumulative Addition durchgeführt wird. Ein Verknüpfungsglied 102 ist nur während des Zeitintervalls zwischen d+2 und 145+d durchgeschaltet· Eine Eingangsseite des Addierers 43 wird mittels eines Umschalters S-. zwischen den Ausgangsseiten der Addierer 52 und 81 umgeschaltet, während die andere Eingangsseite des Addierers 43 mittels eines Schalters S, zwischen den Ausgangsseiten einer 16. und einer (d+1)-ten Stufe des Schieberegisters 101 umgeschaltet wird. Die Eingangsseite des Schieberegisters 101 wird mittels eines Schalters S,- zwischen den Ausgangsseiten der Addierer 43 und 52 umgeschaltet.
Die Schalter S1 bis S1- sind während einer Arbeitsperiode, d.h. 176 Takten, während einer bei den jeweiligen Kontakten angegebenen Taktperiode mit diesen verbunden. Die Schieberegister 51, 95, 101 und 103 sind (154+d)-Bit, (175-d)-Bit, 31-Bit bzw. 16-Bit dynamische Schieberegister, die ständig mit Schxebetaktimpulsen versorgt werden. Die jeweilige gestrichelte Eingangsleitung zu den Addierern 43, 45, 52 und 81 gibt die Zeitsteuerung der Betriebsgrenze für die einzelnen Parameter an. Beispielsweise kennzeichnet 0O eine Wiederholung nach jeweils 16 Takten. Die Betriebsverzögerung der einzelnen Addierer ist zu einem Takt gewählt. Fig. 11 ist eine Zeittafel des Betriebs der einzelnen Teile in Fig. 10. Fig. 11A zeigt die Taktzeitpunkte, Fig.HB die Zeitpunkte der Eingabe der Koeffizienten a., b. und A in
26/27/28
130018/1033
die Multiplizierer 53 vom Eingangsanschluß 44, Fig. 11C die der Eingabe des Multiplikanden des Multiplizieren 53, Fig. 11D die eines Eingangssignals zum Addierer 94 vom Multiplizierer 53, Fig. 11E die des anderen Eingangssignals zum Addierer 94, Fig. 11F die des Ausgangssignals vom Addierer 94, Fig. 11G die des Ausgangssignals vom Addierer 81 und folglich des Inhalts des Registers 103, Fig. 11H die des Eingangssignals zum Addierer 52 vom Schieberegister 95 und Fig. 111 die des Ausgangssignals vom Addierer 52. Fig. 12 zeigt diese Eingangssignale und Ausgangssignale in Form von an den jeweiligen Baugliedern auftretenden Signalen für den Fall einer Kaskadenschaltung der Filter zweiter Ordnung.
Wie aus Fig. 11 ersichtlich, werden in der Zeitspanne zwischen den Takten O und 16 ein Koeffizient a^(t) und ein Multiplikand X1(t) im Multiplizierer 53 miteinander multipliziert, um die Multiplikation im Filter zweiter Ordnung 57 in Fig. 12 zu bewirken. Das Ergebnis dieser Multiplikation erhält man beim d-ten Takt. Wie in den Fig. 11B und 11C gezeigt, v/erden in der Zeitspanne zwischen den Takten 16 und 32 ein Koeffizient b (t) und ein Multiplikand y., (t) multipliziert, um die Multiplikation im Filter 65 zweiter Ordnung auszuführen. Der Multiplikand x.. (t) wird durch das Schieberegister 51 zusammen mit 22 Bits des Multiplizierers 53 um (176 + d) Takte verzögert, so daß, wie Fig. 11E zeigt, ein Multiplikand x..(t-1) beim d-ten Takt an den Addierer angelegt und zu dem zu diesem Zeitpunkt vom Multiplizierer 53 abgeleiteten Ausgangssignal a^x. addiert wird. Das addierte Ausgangssignal X.'(t) wird über den Addierer 81 zwecks Akkumulation an das Schieberegister 103 geliefert. Das heißt, das Ausgangssignal vom Addierer 81 wird dem Signalsystem der Addierer 81, 82 ... in Fig. 12 zugeführt.
wie Fig. 11H zeigt, wird das Ausgangssignal vom Addierer auch dem (175-d)-Bit-Schieberegister 95 geliefert. Demgemäß
28/29
130016/1023
ist in der Zeitspanne zwischen den Takten O und 16 das Ausgangssignal vom Schieberegister x.Mt-1), wie dies in Fig. 11H gezeigt ist, und wird im Addierer 52 zum Multiplikanden x-(t) addiert. Das Ausgangssignal x,(t) des Addierers 52 wird dem Filter zweiter Ordnung 58 in Fig. 12 als Eingangssignal geliefert. Das Ausgangssignal x„(t) vom Addierer 52 wird über das Schieberegister 101 dem Multiplizierer 53 zugeführt. Wie in Fig. 11C gezeigt, wird das Ausgangssignal x„(t) in der Zeitspanne zwischen den Takten 32 und 48 im Multiplizierer 53 mit dem Koeffizienten a~(t) multipliziert. Vor dieser Multiplikation werden b-(t) und Y1(t), wie zuvor beschrieben, multipliziert und das multiplizierte Ausgangssignal in ähnlicher Weise verarbeitet, um hierdurch in der Zeitspanne zwischen den Takten 48 und 64 vom Filter zweiter Ordnung 65 das Ausgangssignal y~(t) zu erhalten. Auf diese Weise werden die Multiplikation des Koeffizienten a und des Multiplikanden χ und die Multiplikation des Koeffizienten b und des Multiplikanden y abwechselnd alle 16 Takte ausgeführt und die Produkte an das Schieberegister 51 angelegt, wie dies durch a-jX-j , b^y- , a2 x2' b2y2' *"* in Fi9* 11D angedeutet ist. Ferner leiten die Filter zweiter Ordnung 57, 58, 59, 60 und 61 X1Mt), X3 1 (t) , X3Mt), X4Mt) bzw. X5 1 (t) und X2 (t), X3 (t), χ. (t) , xJt) bzw. Xg (t), die den Schieberegistern 95 und 101 geliefert werden, von den Produkten ab. In ähnlicher Weise werden Y1Mt) bis Yc Mt) bzw. Y2(^) bis γ,(t) von den Filtern zweiter Ordnung 65 bis 69 erhalten und diese Ausgangssignale abwechselnd mit xMt) bzw. x(t) an die Schieberegister 9 5 und 101 angelegt. In der Zeitspanne zwischen den Takten 145 und 161 wird das zu diesem Zeitpunkt vom Addierer 52 abgeleitete Ausgangssignal yg und das vorher im Schieberegister vorgesehene xß im Addierer 43 voneinander subtrahiert und (χ,-γ,) über den Schalter S1- dem Schieberegister 101 geliefert, wo diese Differenz um (d+1) Takte verzögert wird. Das verzögerte Ausgangssignal wird vom Schalter S4 abgenommen und in der Zeitspanne zwischen den Takten 147+d und 163Hd in den Addierer 43 eingegeben. Das zu diesem Zeit-
29/30 130015/1023
punkt vom Schieberegister 103 gewonnene Ausgangssignal wird dem Addierer 43 über den Addierer 81 und den Schalter S3 geliefert. Das Ausgangssignal vom Addierer 43 zu diesem Zeitpunkt wird das Ausgangssignal vom Addierer in Fig. 12.
Dieses Ausgangssignal wird an den Addierer 45 angelegt, wo es zur Bildung von Z(t) zum Eingangssignal am Anschluß 54 addiert wird. Das addierte Ausgangssignal Z(t) wird an das Register 74 geliefert, das die Verzögerung der Verzögerungsschaltung 74 von Fig. 12 ausführt. Das verzögerte Ausgangs- signal wird an den Multiplizierer 53 angelegt und zu diesem Zeitpunkt der Koeffizient A als Amplitudeninterpolations-Ausgangssignal am Anschluß 44 bereitgestellt, so daß vom Multiplizierer 53 am Ausgangsanschluß 55 A>Z(t) abgenommen werden kann. Diese Multiplikation wird in dem Fall ausgeführt, daß das Ausgangssignal vom SF-Schaltungsteil 16 in einem Multiplizierer 104 in Fig. 12 mit der Amplitudeninformation A multipliziert wird. Vom Schieberegister 74 wird ein Ausgangssignal Z(t)/2 abgenommen, das um 1 Bit nach unten verschoben wurde. Dieses Ausgangssignal wird in der nächstfolgenden Arbeitsperiode für einen neuen Satz von Parametern über den Schalter S2 dem Multiplizierer 53 als Z(t-1)/2, d.h. als x(t) und y(t) zugeführt. Das Ausgangssignal am Ausgangsanschluß 55 kann auch über einen Ausgangspuffer 105 eines statischen Schieberegisters als Parallelsignal erhalten werden.
Der voranstehend beschriebene Pipelinebetrieb ist auf andere Arten von SF-Schaltungsteilen 16 anwendbar. Es dürfte aus dem Aufbau von Fig. 10 ferner entnehmbar sein, daß die Filterfunktion durch Addition, Multiplikation und Verzögerung erreicht wird, so daß diese Filterverarbeitung auch unter Verwendung eines Mikrocomputers durchgeführt werden könnte. In Fig. 13 beispielsweise werden durch aufeinanderfolgendes Auslesen, Interpretieren und Durchführen von Programmen in einem Programmspeicher 107 von einem Eingangstor 111 ein Tonquel-
30/31
130015/1023
33 " "'121%
lensignal bzw. Steuerparameter eingegeben, die von dem TQSG-Schaltungsteil 15 und dem pi-Schaltungsteil 14 an Anschlüsse 108 und 109 angelegt werden. Die Zentraleinheit 106 führt daraufhin nacheinander die zuvor auf Fig.11 beschriebenen Operationen aus. Ein Schreib-Lese-Speicher 112 wird anstelle der Register 51, 74, 95, 101, 103 und 105 in Fig.10 verwendet. Die Ergebnisse der Operationen werden in den Speicher 112 eingeschrieben und zum geeigneten Zeitpunkt aus ihm ausnelesen, um Operationen auszuführen. Das so erzielte Ausgangssignal wird von einem Ausgangstor 113 an den Ausgangsanschluß 55 angelegt. Die Zentraleinheit 6, die Speicher 107 und 112 und die Tor 111 und 113 sind mit einem Bus 114 verbunden.
Das Ausgangssignal vom SF-Schaltungsteil, d.h. vom Synthesefilterschaltungsteil 16 läßt sich auf irgendeine der oben erwähnten Weisen erzielen. Das Ausgangssignal wird in Fig. 2 mit Hilfe des DAU-Schaltungsteils 17 in ein analoges Signal umgesetzt, um ein Sprachausgangssignal zu erhalten. Wenn das Eingangssignal zum DAU-Schaltungsteil 17 ein serielles Signal ist, dann wird es an ein Schieberegister 115 angelegt und der Inhalt des Schieberegisters 115 mittels eines DA-Umsetzers 116 in analoge Form umgesetzt.
Wie zuvor beschrieben, können die LSP-Parameter &>. und Θ. in den charakteristischen Sprachparametern, die bei der Erfindung verwendet werden, durch Lösen der Gleichungen (5) und (6) erhalten werden. In den Fig. 14A und 14B sind die Ergebnisse einer Analyse der Lautfolge "bakuoNga" unter Verwendung der LSP-Parameter Cd . und Θ. gezeigt. In den Fig. 14A und 14B ist auf der Abszisse die Zeit t, in Fig. 14A auf der Ordinate die Stärke und in Fig. 14B auf der Ordinate die normierte Kreisfrequenz aufgetragen. Betrachtet man Momentanpunkte in Fig. 14B, dann steigt die Frequenz in der Reihenfolge der Parameter Q1, OJ , θ , Cu0... Θ5' ^5* Diese Reihenfolge ändert sich nicht, und Θ. und
31/32
130015/1023
CO . fallen innerhalb eines Blocks nicht zusammen. Es ist demzufolge garantiert, daß der SF-Schaltungsteil 16 ständig stabil ist. Die Frequenzverteilungen der LSP-Parameter Θ. und CO. sind in Fig. 15 gezeigt, in der auf der Abszisse die normierte Kreisfrequenz f und auf der Ordinate die relative Frequenz D aufgetragen sind. Wie in Fig. 15 gezeigt, sind die einzelnen Parameter nicht über ein breites Frequenzband verteilt, sondern auf ein relativ schmales Frequenzband beschränkt, so daß die LSP-Parameter CO- und θ. in Verbindung mit dem Frequenzbereich, über den sie sich erstrecken, quantisiert v/erden können.
Die LSP-Parameter CO. und θ. sind gering bezüglich Quantisierungsverzerrung. Fig. 16 zeigt eine Spektralverzerrung D„ einer Kunstsprache, wenn verschiedene Parameter verschieden quantisiert werden. Die Abszisse stellt die Anzahl von QuantisierungsbitsB per Block und die Ordinate die Spektralverzerrung D dar. Die Linie 117 zeigt den Fall, wo unter Berücksichtigung allein der Parameterverteilung der PARCOR-Koeffizient linear quanitisiert ist, nur im Koeffizient war verteilt. Die Linie 118 zeigt den Fall, daß die Anzahl von Quantisierungsbits für den PARCOR-Koeffizient unter Berücksichtigung der Spektralempfindlichkeit zusätzlich zur Parameterverteilung im Fall von Linie 117, speziell im Fall einer merklichen Beeinflussung des Spektrums, vergrößert wurde. Die Linie 119 zeigt den Fall, daß die LSP-Parameter Co. und θ, unter Berücksichtigung nur der Parametervertei-
-L JL
lung quantisiert wurden. Die Linie 121 zeigt den Fall, daß die LSP-Parameter CO. und θ. unter Berücksichtigung der Parameterverteilung und der Spektralempfindlichkeit quantisiert wurden. Man kann Fig. 16 entnehmen, daß im Fall der Verwendung der gleichen Anzahl von Quantisierungsbits die Spektralverzerrung in der Reihenfolge der Linien 117, 118, 119 und 121 kleiner wird. Da die Linien 119 und 121 nahe beieinanderliegen, v/erden die LSP-Parameter CO. und θ. bezüglich der Spektralverzerrung nicht so sehr beeinflußt,
32/33
130015/1023
3Q37276
auch wenn die Spektralempfindlichkeit nicht in Betracht gezogen wird. Da es also ausreicht, die Quantisierung unter Berücksichtigung des Parameterverteilungsbereichs allein durchzuführen, ist diese Quantisierung einfach.
Teilt man die Anzahl von Quantisierungsbits pro Block, bei der die Spektralverzerrung im Fall der Linie 119 ein dB ist durch die Anzahl der Quantisierungsbits im Fall der Linie 117, ergibt sich ein Wert 0,7. In ähnlicher Weise wird das Verhältnis der Anzahl von Quantisierungsbits pro Block, bei der die Spektralverzerrung 1dB ist, zwischen den Linien 118 und 121, 0,8. Hieraus geht hervor, daß die LSP-Parameter 65 . und 9. ausgezeichnet sind. Ein dB ist eine Differenzempfindungsgrenze der Spektralverzerrung von Kunstsprache.
Fig. 17 zeigt Interpolationseigenschaften, wobei die Abszisse eine Blocklänge T und die Ordinate die Spektralverzerrung Dg darstellen. Fig. 17 zeigt die Spektralverzerrung von Kunstsprache für den Fall, daß ein Block, in dem Originalsprachlaute in 1o ms analysiert wurden, als Bezug verwendet wurde, die Blocklänge auf 20 bis 70 ms erhöht wurde und die Parameter alle 10 ms interpoliert wurden. Die Linie 122 zeigt den Fall, wo die PARCOR-Koeffizienten verwendet wurden, während die Linie 123 den Fall zeigt, daß die LSP-Parameter £D . und Θ. verwendet wurden. Wie aus Fig. 17 erkennbar, kann bei derselben Verzerrung die Blocklänge T£ bei Verwendung der LSP-Parameter langer als die Blocklänge Tf bei Verwendung der PARCOR-Koeffizienten gemacht v/erden, d.h. die Periode zur Erneuerung der Parameter kann verlängert werden, so daß die Gesamtin formationsmenge hierdurch verringert v/erden kann. Da ferner die Anzahl von Bits pro Block bei den LSP-Parametern geringer als bei den PARCOR-Koeffizienten ist, wie man aus ■ Fig. 16 entnimmt, wird die Informationsmenge bei derselben Verzerrung um das Produkt der Verminderungsverhältnisse in den Fig. 16 und 17 geringer. Das heißt im Fall der
34/35 130015/1023
LSP-Parameter kann die Informationsmenge etwa 60 % derjenigen im Fall der PARCOR-Koeffizienten betragen.
Bei Einsatz der LSP-Parameter ist es wie im Fall anderer Parameter ohne Bedeutung, daß sie mit einer kürzeren Periode als der Äbtastperiode der Originalsprache, die zur Gewinnung der Parameter verwendet wird, interpoliert werden. Experimente ergaben, daß die Interpolationsperiode etwa zweimal so groß oder weniger als die Äbtastperiode der Originalsprache sein kann, daß jedoch, wenn die erstere etwa zweimal so groß wie die letztere ist, Störungen oder Rauschen eingeführt wird, das die Kunstsprache undeutlich macht. Es ist daher vorzuziehen, daß die Interpolationsperiode gleich der oder zweimal so groß wie die Äbtastperiode der Originalspräche ist.
Wie im Vorangehenden beschrieben, ist es relativ leicht, die LSP-Paramter automatisch herauszuziehen, so daß dies auf Echtzeitbasis erfolgen kann. Ferner sind die LSP-Parameter ausgezeichnet bezüglich der Interpolationseigenschaft, haben geringe Abweichung bezüglich der Quantisierungseigenschaft und erlauben Übertragung und Speicherung von Sprache mit geringer Informationsmenge. Bei der Sprachsynthese kann Sprache hoher Qualität wiedergewonnen und mit einer geringen Informationsmenge künstlich aufgebaut werden., wobei die Stabilität des Synthetisierungsfilters garantiert ist, solange das Verhältnis von Gleichung (8) gilt.
Bei der Anordnung gemäß Fig. 2 ist es auch möglich, das Spektrum dadurch auszuweiten, daß vom Impulsgenerator 28 eine Kette von Impulsgruppen, wie etwa die Barker-Folge, anstelle der Impulskette erzeugt wird. Der Pl-Schaltungsteil 14 kann auch in der demPT-Schaltungsteil 13 vorangehenden Stufe vorgesehen werden. Das heißt, die LSP-Parameter vom Interface-Schaltungsteil 12 können auch nach ihrer Interpolation der
35/36
130015/1023
Kosinustransformation im PT-Schaltungsabschnitt 13 unterzogen werden. In diesem Fall ist die Verwendung eines Pestspeichers unwirtschaftlich, da seine Speicherkapazität enorm sein müßte. Demzufolge ist es vorzuziehen, die Parameterumsetzung unter Verwendung einer Näherungsfunktion des Kosinus durchzuführen, statt den in Verbindung mit dem Beispiel von Fig. 2 beschriebenen Festspeicher zu verwenden. In Fig. 2 wird die Information, die angibt, ob es sich um einen stimmhaften oder stimmlosen Sprachlaut handelt, in das Stimmhaftregister 23 und das Stimmlosregister 24 eingespeichert. Diese Information muß jedoch nicht immer vorgesehen werden. Das heißt, es wird eine Detektorschaltung vorgesehen, die ermittelt, ob der an das Tonhöhenregister 25 angelegte Grundperiodenparameter Null ist oder nicht. Wird festgestellt, daß dieser Parameter Null ist, dann gilt dies als Entscheidung, daß der Laut stimmlos ist, so daß das Verknüpfungsglied 37 durchgeschaltet wird. Im Fall von von Null abweichenden Werten wird der Laut als stimmhaft betrachtet und das Verknüpfungsglied 31 durchgeschaltet. Die Steuerung durch den Amplitudenparameter kann auch in Verbindung mit dem Ausgang des SF-Schaltungsteils 16 durchgeführt werden, wie dies vorangehend unter Bezug auf die Ausführungsform von Fig. 12 erläutert wurde.
Bei der vorangehenden Beschreibung wurde als Synthesefilter ein Filter verwendet, das im Rückkopplungskreis Mittel enthält, um eine Vielzahl von Filtern erster Ordnung und zweiter Ordnung unterschiedlicher Koeffizienten in Reihe zu schalten, die die Nullstelle auf einem Einheitskreis besitzen. Dies erfolgte unter Benutzung der LSP-Parameter. Das Synthesefilter muß jedoch nicht immer speziell auf solch ein Filter beschränkt sein. Vielmehr kann die Sprachsynthese auch durchgeführt werden, indem die LSP-Parameter in andere Parametertypen transformiert werden und andere Filter verwendet werden. In Fig. 18 z.B., in der Teile,
130015/1023
36/37
die solchen von Fig. 1 entsprechen, mit gleicher Bezugszahl bezeichnet sind, wird der Grundperiodenparameter in den charakteristischen Parametern, die dem Interface-Schaltungsabschnitt 12 zugeführt werden, dem TOSG-Schaltungsteil 15 zugeführt, während der Amplitudenparameter dem PI-Schaltungsteil 14 geliefert wird. Der auf diese Weise interpolierte Amplitudenparameter wird an den TQSG-Schaltungsteil 15 angelegt und in diesem in der zuvor unter Bezug auf Fig. 2 erläuterten Weise verarbeitet, wobei an den SF-Schaltungsteil.16 ein Tonquellensignal geliefert wird. Die LSP-Parameter werden einem LSP-Parametertransformierungs-Schaltungsteil 124 geliefert, in welchem sie zu anderen Parametertypen, etwa einem cC-Parameter, PARCOR-Parameter oder andere transformiert werden. Beispielsweise werden von den LSP-Parametern unter Verwendung der Gleichung (5) oder (6) Polynome P(Z) und Q(Z) gewonnen und von den Polynomen unter Verwendung der Gleichungen (1) und (2) die Prädiktorkoeffizienten OC. der Übertragungsfunktion H(Z). Durch Interpolation der so erhaltenen Prädiktorkoeffizienten D^. im Pl-Schaltungsteil 14 in der erforderlichen Weise werden die Eigenschaften des SF-Schaltungsteils 16 gesteuert. Der SF-Schaltungsteil 16 ist beispielsweise als ein zyklisches Filter ausgebildet, in dem, wie in Fig. 18 gezeigt, das Tonquellensignal vom TQSG-Schaltungsteil 15 mittels eines Multiplizierers 125 um & vervielfacht und zur Subtraktion vom Ausgangssignal eines Addierers 127 an einen Addierer 126 angelegt wird. Das Ausgangssignal vom Addierer 126 wird dem Ausgangsanschluß 55 geliefert. Das so gewonnene Ausgangssignal· am Ausgangsanschluß 55 wird an eine Reihenschaltung von Verzögerungsschaltungen D1 bis D angelegt, von· denen jede eine Verzögerungszeit gleich einer Abtastperiode besitzt. Die Ausgangssignale von den Verzögerungsschaltungen D1 bis D werden mit jeweiligen Ko-
effizienten 06- bis Ot vom Pl-Schaltungsteil 14 in Multiplizierern M1 bis M multipliziert. Die multiplizierten
38/39 130015/1023
Ausgangssignale werden der Reihe nach addiert und dann im Addierer 127 zusammenaddiert.
ι to·*
Leerseite

Claims (18)

  1. BLUMBACH · WESER · BQReEN - KRAU^R ZWIRNER · HOFFMANN
    PATENTANWÄLTE IN MÜNCHEN UND WIESBADEN 3037276
    Patentconsult RadectestraCe 43 8000 München 60 Telefon (039) 883603/833604 Telex 05-212313 Telegramme Patentconsult Palentconsult Sonnenberger SUaCe 43 6200 Wiesbaden Telefon (06121) 5629 Ί3/561998 Telex 04-186237 Telegramme Palentconsult
    Nippon Telegraph & Telephone 80/8773
    Public Corporation ho/1
    1-6, üchisaiwai-cho
    1-chome, Chiyoda-ku
    Tokyo/ Japan
    Patentansprüche
    Tonsynthesizer, bei dem ein Tonquellen sign eil und Steuerparameter zur Steuerung der Eigenschaften eines Filters an einen Synthesefilter-Schaltungsteil angelegt werden und die Filterkoeffizienten des Synthesefilter-Schaltungsteils von den Steuerparametern zur Erzielung eines synthetischen Tonsignals gesteuert werden, dadurch gekennzeichnet , daß der Synthesefilter-Schaltungsteil (16) aus Filteranordnungen zweiter Ordnung (57 bis 61, 65 bis 69) zusammengesetzt ist, die als Filter zweiter Ordnung dienen und je die Nullstelle auf einem Einheitskreis in einer komplexen Ebene besitzen, daß eine Einrichtung zum Kaskadenbetrieb solcher Filteranordnungen mit unterschiedlichen Koeffizienten sowie eine Rückkopplungseinrichtung (41, 42) zur Rückführung des Ausgangssignals vom Synthesefilter-Schaltungsteil zu dessen Eingang über zwei Arten solcher Einrichtungen zum Kaskadenbetrieb vorhanden sind.
  2. 2. Tonsynthesizer nach Anspruch 1, dadurch gekennzeichnet, daß ein das Tonquellensignal liefernder Tonquellensignalgenerator-Schaltungsteil (15) aus einer Grundperio-dentonquelle (25, 27), einer Rauschquelle (36) zur Erzeugung von Zufallsimpulsen und einer Auswahleinrichtung (31, 37) zusammengesetzt ist, wobei die Grundperi-
    München: R. Kramer Dipl.-Ing. · W. Weser Dipl.-Phys. Dr. rer. na'. · E. Hoffmann Dipl.-!ng. Wiesbaden: P. G. Blumbach Dipl.-Ing. · P. Bergen Prof.Dr. jur. Dipl.-Ing., Pat.-Ass., Pal.-Anw.bis 1979 · G. Z.virner Dipl.-Ing. Dipl.-W.-Ing.
    40
    130016/1023
    2 - 3037278
    odentonquelle (25, 27) von einem Grundperiodenparameter zur Erzeugung eines Impulses oder einer Impulsgruppe einer durch den Parameter bestimmten Periode steuerbar ist und die Auswahleinrichtung (31, 37) das Ausgangssignal von der Grundperiodentonquelle oder das Ausgangs-signal von der Rauschquelle abhängig davon auswählt, ob es sich bei einem synthetisch zusammenzusetzenden Sprachlaut um einen stimmhaften oder stimmlosen Laut handelt.
  3. 3. Tonsynthesizer nach einem der vorhergehenden Ansprüche, gekennzeichnet ferner durch eine Amplitudensteuereinrichtung (34) zur Steuerung der Größe eines Signals am Eingang oder am Ausgang des Synthesefilter-Schaltungsteils (16) durch einen Amplitudenparameter.
  4. 4. Tonsynthesizer nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, daß die Filteranordnungen zweiter Ordnung zusammengesetzt sind aus einerr, ersten Verzögerungsglied (95) zur Verzögerung des Eingangssignals um eine Einheitszeit, einem ersten Addierer (52), der das verzögerte Ausgangssignal und das Ausgangssignal vom Synthesefilter-Schaltungsteil (16) erhält, einem zweiten Verzögerungsglied (51) zur Verzögerung des Ausgangssignals des ersten Addierers um eine Einheitszeit, einem Multiplizierer (53) zur Multiplikation des Ausgangssignals vom ersten Addierer mit dem Koeffizienten (a.^, bi) und einem zweiten Addierer (94), der das multiplizierte Ausgangssignal, das Ausgangssignal vom zweiten Verzögerungsglied und das Eingangssignal der Pilteranordnung zweiter Ordnung zu deren Ausgangssignal zusammenaddiert.
  5. 5. Tonsynthesizer nach einem der Ansprüche 1 bis 3, dadurch gekennzeichnet, daß die Filteranordnungen zweiter Ordnung (57 bis 61, 65 bis 69) zusammengesetzt sind aus einem ersten Verzögerungsglied (51) zur Verzögerung des Eingangssignals der Filteranordnung um eine Einheitszeit,
    40/41 130016/1023
    einem Multiplizierer (53) zur Multiplikation des Eingangssignals der Filteranordnung mit einem Koeffizienten der Filteranordnung (a., b.), einem ersten Addierer (94) zur Addition des multiplizierten Ausgangssiqnals und des Ausgangssignals vom ersten Verzögerungsglied, ein zweites Verzögerungsglied (95) zur Verzögerung des addierten Ausgangssignals um eine Einheitszeit und einem zweiten Addierer (52) zur Addition des Ausgangssignals vom zweiten Verzögerungsglied und des Eingangssignals der FiI-teranordnung und zur Lieferung von deren Ausgangssignal.
  6. 6. Tonsynthesizer nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, daß die Filteranordnung zweiter Ordnung als Filterschaltung zweiter Ordnung ausgebildet ist, daß eine Vielzahl solcher Filter zweiter Ordnung verschiedener Koeffizienten zur Bildung der Kaskadenbetriebseinrichtung in Kaskade geschaltet sind, und daß ein Paar von kaskadegeschalteten Filterschaltungen zweiter Ordnung unterschiedlicher Filterkoeffizienten die beiden Rückkopplungseinrichtungen bilden.
  7. 7. Tonsynthesizer nach einem der Ansprüche 4 oder 5, dadurch gekennzeichnet, daß die Filteranordnung zweiter Ordnung als Digitalfilterschaltung zweiter Ordnung ausgebildet ist und dadurch auf einer Multiplexbasis durch ein Pipelinebetriebssystem verwendet wird, daß die Filterschaltung innerhalb einer Einheitszeit mehrere Male betrieben wird, wobei für jeden Betrieb der Koeffizient der Filterschaltung geändert wird.
  8. 8. Tonsynthesizer nach einem der Ansprüche 1 bis 5, dadurch gekennzeichnet, daß die Filteranordnung und die Kaskadenbetriebseinrichtung von einem Betriebsmittel zur Durchführung einer Filterverarbeitung durch Interpretieren und Ausführen eines Programms gebildet sind.
    41/42
    130015/1023
  9. 9. -Tonsynthesizer nach einem der vorhergehenden Ansprüche, gekennzeichnet ferner durch eine Parametertransformierungs-Schaltungseinheit (13) zum Erhalt der Steuerparameter durch Kosinustransformation von Parametern zur Steuerung der Eigenschaften des Synthesefilter-Schaltungsteils (16).
  10. 10. Tonsynthesizer nach einem der vorhergehenden Ansprüche, ferner gekennzeichnet durch eine Interpolations-Schaltungseinheit (14) zur Interpolation der Steuerparameter und Lieferung von diesen an den Synthesefilter-Schaltungsteil (16) .
  11. 11. Tonsynthesizer nach Anspruch 9, dadurch gekennzeichnet, daß ein Interpolations-Schaltungsteil (14) zur Interpolation der die Eigenschaften des Synthesefilter-Schaltungsteils (16) repräsentierenden Parameter vorhanden ist, und daß die interpolierten Parameter im Parametertransformierungs-Schaltungsteil (13) einer Kosinustransformation unterworfen werden.
  12. 12. Tonsynthesizer nach den Ansprüchen 10 oder 11, dadurch gekennzeichnet, daß die Interpolationsperiode im Interpolations-Schaltungsteil (14) gleich oder zwei Mal so groß wie die Abtastperiode eines Original-Tonsignals ist.
  13. 13. Tonsynthesizer nach einem der Ansprüche 10 bis 12, dadurch gekennzeichnet, daß der Interpolations-Schaltungsteil (14) auf einer Multiplexbasis zur Interpolation eines Amplitudenparameters verwendbar ist.
  14. 14. Tonsynthesizer mit einem Tonquellensignalgenerator-Schaltungsteil zur Erzeugung eines Tonquellensignals, gekennzeichnet durch eine LSP-Parameterquelle zur Erzeugung von LSP-Parametern, einen Parametertransformierungs-Schaltungsteil (13) zur Transformierung der LSP-Parameter zu Steuerparametern eines v.on den LSP-Parametern
    13001S/1&23
    42/43
    ORIGINAL INSPECTED
    3037278
    verschiedenen Typs, und durch einen Tonsynthesefilter-Schaltungsteil (16), dem das Tonquellensignal geliefert wird und der von den transformierten Steuerparametern in seinen Eigenschaften gesteuert wird. 5
  15. 15. Tonsynthesizer nach Anspruch 14, dadurch gekennzeichnet, daß ein das Tonquellensignal liefernder Tonquellensignalgenerator-Schaltungsteil (15) aus einer Grundperiodentonquelle (25, 27), «.iner Rauschquelle (36) zur Erzeugung von Zufallsimpulsen und einer Auswahleinrichtung (31, 37) zusammengesetzt ist, wobei die Grundperi-■ odentonquelle (25, 27) von einem Gründperiodenparametcr zur Erzeugung eines Impulses oder einer Impulsgruppe einer durch den Parameter bestimmten Periode steuerbar ist und die Auswahleinrichtung (31, 37) das Ausgangssignal von der Grundperiodentonquelle oder das Ausganssignal von der Rauschquelle abhängig davon auswählt, ob es sich bei einem synthetisch zusammenzusetzenden Sprachlaut um einen .stimmhaften oder stimmlosen Laut handelt.
  16. 16. Tonsynthesizer nach einem der Ansprüche 14 oder 15, gekennzeichnet durch eine Amplitudensteuereinrichtung (34) zur Steuerung der Größe eines Signals am Eingang oder am Ausgang des Synthesefilter-Schaltungsteils (16) durch einen Amplitudenparameter.
  17. 17. Tonsynthesizer nach einem der Ansprüche 14 bis 16, dadurch gekennzeichnet, daß der Parametertransformierungs-Schaltungsteil (13) eine Einrichtung" zur Transformierung der LSP-Parameter zu Prädiktorkoeffizienten ist und daß der Tonsynthesefilter-Schaltungsteil (16) ein zyklisches Digitalfilter ist.
  18. 18. Verfahren zur Tonsynthese, bei dem Tonquellensignalparameter, die ein Tonquellensignal repräsentieren und Steuerparameter zur Steuerung von Eigenschaften einer Filteranordnung einem Medium geliefert werden, das Tonquellen-
    130Ό1Β/1023
    43/44
    3037278
    signal entsprechend dem Tonquellensignalparameter von dem Medium erzeugt wird und das Tonquellensignal der Filteranordnung geliefert wird, während die Eigenschaften der Filteranordnung von den Steuerparametern von dem Medium gesteuert werden und dadurch ein synthetisches Steuersignal erzeugt wird, dadurch gekennzeichnet, daß eine Spektralumhüllende eines Originaltons durch eine übertragungsfunktion
    H(Z) .
    A (Z) 1 + Ot^Z + <&2Z + + Od ZP
    der Filteranordnung angenähert wird, wobei Z = e J , O" eine Konstante, 6J die normierte Kreisfrequenz
    2 Iff ΔΤ, /IT eine Abtastfrequenz, f die Frequenz, ρ der Analysegrad und OC-. (i = 1 , 2, ... p) Prädiktorkoeffizienten sind, und wobei A (Z) weiter als Summe von zwei Polynomen P(Z) und Q(Z) nachfolgender Art ausgedrückt ist
    ■ ■ ■
    A (Z) = - [P(Z) + Q(Z)]
    P(Z) = A (Z) - Z · ZPAp(Z~1)
    Q(Z) = A (Z) + Z * ZPA (Z~1)
    P P
    wobei die Polynome je in Faktoren zerlegt sind und die Kreisfrequenzen, bei denen die Polynome Null sind,als jene Steuerparameter verwendet werden. 30
    45
    .130015/1023
DE19803037276 1979-10-03 1980-10-02 Tonsynthesizer Expired DE3037276C2 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP12836679A JPS5651116A (en) 1979-10-03 1979-10-03 All pole type digital filter
JP54128365A JPS5853352B2 (ja) 1979-10-03 1979-10-03 音声合成器

Publications (2)

Publication Number Publication Date
DE3037276A1 true DE3037276A1 (de) 1981-04-09
DE3037276C2 DE3037276C2 (de) 1985-08-01

Family

ID=26464060

Family Applications (2)

Application Number Title Priority Date Filing Date
DE19803037276 Expired DE3037276C2 (de) 1979-10-03 1980-10-02 Tonsynthesizer
DE19803050742 Expired DE3050742C2 (de) 1979-10-03 1980-10-02 Tonsyntheseverfahren

Family Applications After (1)

Application Number Title Priority Date Filing Date
DE19803050742 Expired DE3050742C2 (de) 1979-10-03 1980-10-02 Tonsyntheseverfahren

Country Status (5)

Country Link
DE (2) DE3037276C2 (de)
FR (1) FR2466826A1 (de)
GB (2) GB2059726B (de)
NL (1) NL189320C (de)
SE (1) SE444730B (de)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3226637A1 (de) * 1981-07-20 1983-02-03 Nippon Gakki Seizo K.K., Hamamatsu, Shizuoka Nachhalltonerzeugungsapparat
US4731835A (en) * 1984-11-19 1988-03-15 Nippon Gakki Seizo Kabushiki Kaisha Reverberation tone generating apparatus

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4660163A (en) * 1983-01-17 1987-04-21 OKI Electric Co. Ltd Adaptive digital filter
BE1007428A3 (nl) * 1993-08-02 1995-06-13 Philips Electronics Nv Transmissiesysteem met reconstructie van ontbrekende signaalmonsters.
US5704001A (en) * 1994-08-04 1997-12-30 Qualcomm Incorporated Sensitivity weighted vector quantization of line spectral pair frequencies
JPH09230896A (ja) * 1996-02-28 1997-09-05 Sony Corp 音声合成装置
CN106233381B (zh) * 2014-04-25 2018-01-02 株式会社Ntt都科摩 线性预测系数变换装置和线性预测系数变换方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3624302A (en) * 1969-10-29 1971-11-30 Bell Telephone Labor Inc Speech analysis and synthesis by the use of the linear prediction of a speech wave

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2199427A5 (de) * 1972-09-12 1974-04-05 Ibm France
GB1603993A (en) * 1977-06-17 1981-12-02 Texas Instruments Inc Lattice filter for waveform or speech synthesis circuits using digital logic

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3624302A (en) * 1969-10-29 1971-11-30 Bell Telephone Labor Inc Speech analysis and synthesis by the use of the linear prediction of a speech wave

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
US-Proceedings of the IEEE, Bd. 63, April 1975, S. 561-580 *
US-The Journal of the Acoustical Society of America, Vol. 50, 1971, No. 2 (Part 2), Seiten 637 bis 655

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3226637A1 (de) * 1981-07-20 1983-02-03 Nippon Gakki Seizo K.K., Hamamatsu, Shizuoka Nachhalltonerzeugungsapparat
US4731835A (en) * 1984-11-19 1988-03-15 Nippon Gakki Seizo Kabushiki Kaisha Reverberation tone generating apparatus

Also Published As

Publication number Publication date
DE3037276C2 (de) 1985-08-01
GB2131659B (en) 1984-12-12
FR2466826B1 (de) 1984-09-14
GB2131659A (en) 1984-06-20
DE3050742C2 (de) 1987-01-15
NL189320C (nl) 1993-03-01
GB2059726A (en) 1981-04-23
FR2466826A1 (fr) 1981-04-10
NL189320B (nl) 1992-10-01
GB8318893D0 (en) 1983-08-17
NL8005449A (nl) 1981-04-07
SE8006850L (sv) 1981-04-04
GB2059726B (en) 1984-06-27
SE444730B (sv) 1986-04-28

Similar Documents

Publication Publication Date Title
DE3041423C1 (de) Verfahren und Vorrichtung zur Verarbeitung eines Sprachsignals
DE2524497C3 (de) Verfahren und Schaltungsanordnung zur Sprachsynthese
DE3883034T2 (de) System zur Sprachsynthese.
DE3036680C2 (de) Sprachsynthesizer mit dehnbarer und komprimierbarer Sprachzeit
DE3244476C2 (de)
DE2945414C2 (de) Sprachsignal-Voraussageprozessor und Verfahren zur Verarbeitung eines Sprachleistungssignals
DE2229149A1 (de) Verfahren zur Übertragung von Sprache
DE2551632C2 (de) Verfahren zum Zusammensetzen von Sprachnachrichten
DE69329569T2 (de) Digitale Kodierung von Sprachsignalen
DE2115258A1 (de) Sprachsynthese durch Verkettung von in Formant Form codierten Wortern
DE3407078A1 (de) Elektronisches musikinstrument
DE3736193C2 (de)
DE2920298A1 (de) Binaere interpolatorschaltung fuer ein elektronisches musikinstrument
DE69017842T2 (de) Verfahren und Einrichtung zur Codierung von Prädiktionsfiltern in Vocodern mit sehr niedriger Datenrate.
DE3019823C2 (de)
DE68923771T2 (de) Sprachübertragungssystem unter Anwendung von Mehrimpulsanregung.
DE2730662A1 (de) Verfahren und schaltung zum erzeugen eines autokorrelations-funktions-faktors
DE3226637C2 (de) Vorrichtung zur Erzeugung eines künstlichen Nachhalls
DE3037276A1 (de) Tonsynthesizer
DE3226538A1 (de) Stimm-synthesizer
DE3226619A1 (de) Modulationseffektvorrichtung
DE69603360T2 (de) Verfahren und vorrichtung zur synthetisierung von musiktönen durch frequenzmodulation und mittels eines filters
DE3246712C2 (de)
DE2826570C2 (de)
DE2435654C2 (de) Verfahren und Vorrichtung zur Analyse und Synthese von menschlicher Sprache

Legal Events

Date Code Title Description
8172 Supplementary division/partition in:

Ref country code: DE

Ref document number: 3050742

Format of ref document f/p: P

Q171 Divided out to:

Ref country code: DE

Ref document number: 3050742

D2 Grant after examination
8364 No opposition during term of opposition
8327 Change in the person/name/address of the patent owner

Owner name: NIPPON TELEGRAPH AND TELEPHONE CORP., TOKIO/TOKYO,

AH Division in

Ref country code: DE

Ref document number: 3050742

Format of ref document f/p: P

8328 Change in the person/name/address of the agent

Free format text: HOFFMANN, E., DIPL.-ING., PAT.-ANW., 82166 GRAEFELFING