- 7 - 80/8773· - -
Beschreibung
Tonsynthesizer
Die Erfindung betrifft ein Verfahren zur Tonsynthese nach dem Oberbegirff des Anspruchs 18 sowie einen Tonsynthesizer
nach dem Oberbegriff des Anspruchs 1.
Beispielsweise im Fall des Aufbaus von Sprache aus charakteristischen
Parametern der Originalsprache werden beim Stand der Technik das Ausgangssignal eines Impulsgenerators,
der die Vibration der Stimmbänder simuliert, und das Ausgangssignal eines Rauschgenerators, der die Turbulenz
simuliert, in Abhängigkeit davon umgeschaltet oder zusammengemischt, ob ein stimmhafter oder ein stimmloser Laut vorliegt.
Das resultierende Ausgangssignal wird entsprechend der Sprachamplitude amplitudenmoduliert, um ein Anregungsquellensignal
zu erzeugen, das an ein Filter geliefert wird, welches zum Erhalt der synthetischen oder Kunstsprache
den Stimmtrakt simuliert. Ein Synthesesystem, bei dem partielle Autokorrelationskoeffizienten (PARCOR) verwendet
werden, sowie ein Formantsynthesesystem sind Beispiele solcher
Sprachsynthesesysteme, die charakteristische Parameter benutzen. Das erstere ist beispielsweise dargestellt
in J.D. Markel et al., "Linear Prediction of Speech", Seiten 92 bis 128, Springer-Verlag, 1976. Bei diesem System
werden die partiellen Autokorrelationskoeffizienten oder sog. PARCOR-Koeffizienten einer Sprachwellenform als charak-
130015/1023
teristische Parameter verwendet. Wenn die absoluten Werte
dieser PARCOR-Koeffizienten alle kleiner als 1 sind, dann ist das Sprachsynthesefilter stabil. Die PARCOR-Koeffizienten
mögen eine relativ geringe Informationsmenge zur Sprachsynthese erfordern und lassen sich relativ leicht automatisch
geiwnnen, jedoch unterscheiden sich die einzelnen Parameter sehr stark bezüglich der Spektralempfindlichkeit. Wenn demzufolge
alle Parameter unter Verwendung derselben Bitanzahl quantisiert werden, dann ergeben sich große Unterschiede bei
der Spektralverzerrung, die auf Quantisierungsfehlern bei den jeweiligen Parametern beruhen. Ferner sind die PARCOR-Koeffizienten
ungünstig bezüglich ihrer Interpolationseigenschaften. Bei der Interpolation dieser Parameter treten
Rausch- oder Störsignale auf, die zu einer undeutlichen Sprache führen. Besonders bei einer niedrigen Bit-rate wird
die Sprachqualität durch die Spektralverzerrung verschlechtert, so daß sich keine zufriedenstellende Qualität der
Kunstsprache erzielen läßt. Außerdem entsprechen die PARCOR-Koeffizienten
nicht direkt Spektraleigentümlichkeiten wie Formantfrequenzen, so daß PARCOR-Koeffizienten in der Regel
für die Sprachsynthese nicht geeignet sind.
Das Formantsynthesesystem ist beispielsweise in J.L. Flanagan,
"Speech Analysis, Synthesis and Perception", Seiten 339 bis 34 7, Springer-Verlag, 1972 offenbart. Es handelt
sich hier um ein System, das Kunstsprache unter Verwendung der Formantfrequenzen und ihrer Intensität als Parameter
bildet und insofern vorteilhaft ist, als die Informationsmenge für die Parameter gering sein kann, und insofern, als
die Beziehung der Parameter zu Spektralgrößen leicht zu erhalten ist. Zur Gewinnung der Formantfrequenz und ihrer Intensität
ist es jedoch nötig, Gebrauch von allgemeinen dynamischen Charakteristiken und statistischen Eigentümlichkeiten
der Parameter zu machen, so daß eine völlig automatisehe Gewinnung der Formantfrequenz und ihrer Intensität
schwierig ist. Demzufolge ist es schwierig, automatisch
2/3 13-0 01 S/102
Kunstsprache hoher Qualität zu erhalten und wahrscheinlich, daß eine merkliche Verschlechterung der Qualität der Kunstsprache
durch einen Fehler bei der Gewinnung der Parameter auftritt.
Aufgabe der Erfindung ist es, ein Verfahren und eine Vorrichtung zur Tonsynthese zu schaffen, die die Synthese
eines Tons hoher Qualität unter Verwendung einer geringen Informationsmenge erlauben, so daß synthetisch ein Ton im
wesentlichen in der gleichen Qualität wie der Originalton aus dessen Merkmalen, die übertragen werden oder in einem
Speicher gespeichert sind, aufgebaut werden kann.
Diese Aufgabe wird erfindungsgemäß durch die Merkmale in
den Ansprüchen 18 bzw. 1 gelöst. Vorteilhafte Weiterbildungen
der Erfindung sind in den Unteransprüchen enthalten. Der erfindungsgemäße Tonsynthesizer erlaubt es, die charakteristischen
Parameter relativ leicht zu gewinnen und arbeitet stabil. Die Unterschiede der Spektraempfindlichkeit
unter den Parametern sind gering und die Quantisierungsgenauigkeit der Parameter ist bei gleicher Anzahl der Quantisierungsbits
gleich. Die Interpolationseigenschaften für die verwendeten Parameter sind ausgezeichnet, und schließlich
besitzt der Tonsynthesizer einen verhältnismäßig einfachen Aufbau.
Bei einer linearen prädiktiven Analyse wird die Sprachspektralumhüllende
durch eine übertragungsfunktion eines Allpolfilters angenähert, die durch folgende Gleichung (1)
gegeben ist:
A (Z) 1 +Ot1Z + OC2ZZ + ... + Ot ZP
wobei Z = e"-3 , <^ eine normierte Kreisfrequenz 2Tf 4τ,
Δ T eine Abtastperiode, f eine Abtastfreguenz, ρ der Analy-
3/4 -
13001S/1023
segrad, CC-. (i=1,2, ...ρ) Prädilctorkoeff izienten, die
Parameter zur Steuerung der Resonanzeigenschaften des Filters darstellen, und CT die Verstärkung des Filters
sind. A (Z) wird durch die Summe von zwei Polynomen dargestellt, was wie folgt ausgedrückt werden kann:
A (Z) = 1/2[P(Z) + Q(Z)]'
,P, ,„-L
P(Z) = A (Z) -Z- ZFA (Z ) (3]
P P
Q(Z) = A (Z) + Z · ZPA (Z~1)
(a) Wenn der Analysegrad ρ gerade ist, können die Gleichungen
(3) und (4) wie folgt in Faktoren zerlegt werden:
(5)
%P |
(Z) |
= (1
|
- ζ)
|
P/2
JT |
(1 - 2COSO1Z |
+ ζ2)
|
|
|
|
|
i = 1
|
|
Q |
(Z) |
= (1
|
+ Z) |
P/2
π
|
(1 - 2cos θ.ζ |
|
|
J i = 1
(b) Wenn der Analysegrad ρ ungerade ist, werden Glei chungen (3) und (4) wie folgt in Faktoren zerlegt:
(P-D/2
9 P(Z) = (1 - Z)
(1 - 2COSÖ.Z + Z
Q(Z) =
(p+D/2 Jf
i = 1
(1 - 2cos θ.ζ- + Z
O i und Q^ in den Ausdrücken (5) und (6) werden ein Linienspektrumpaar
(nachfolgend als LSP bezeichnet) genannt
4/5
.130016/1023
und bei der Erfindung als Parameter zur Darstellung der Spektralumhüllenden-Information verwendet.
Durch Umschreiben von Gleichung (1) und Ersetzen von A (Z) gemäß Gleichung (2) ergibt sich die Übertragungsfunktion
H(Z) wie folgt:
Ap(Z)
1 + 1/2Ü>(Z) - 1 + Q(Z) - 1 1 (7)
Die Übertragungsfunktion H(Z) wii'd auch als Filter mit
zwei Rückkopplungskreisen gebildet, deren übertragungs-' ~* funktionen P(Z) - 1 bzw. Q(Z) - 1 sind. Die Übertragungsfunktionen P(Z) und Q(Z) sind die von Antiresonanzkreisen,
deren Ausgangssignal bei Θ. bzw. CJ .Null wird. Die Frequenzkennlinie
von A (Z) wird wie folgt:
P/2
j A (Z) j z = 2P [cos - // (cos O- cosW.)
4. · 2C3 ΊΓ , rs , ,2 N (8)
+ sm — .'' (cos CJ - cos O-) 1
wobei Z = e ^ . Nach Gleichung (8) scheint, daß in einem
Bereich, in dem benachbarte Linienspektralfrequenzen dicht beieinanderliegen, | A (Z)[ klein ist und die. Übertragungsfunktion
H(Z) eine starke Resonanzcharakteristik zeigt. Durch Ändern der Werte der LSP-Parameter O . und θ., die
die Resonanzcharakteristik der Übertragungsfunktionen beschreiben,
kann eine willkürliche Sprachspektralumhüllende erhalten werden.
5/6 .
130015/10 23
Die Prozedur zur Gewinnung der LSP-Parameter ist folgende:
In einem ersten Schritt erhält man Autokorrelationskoeffizienten einer Sprachwelle in Intervallen von beispielsweise
10 bis 20 ms. Im zweiten Schritt erhält man von den Autokorrelationskoeffizienten Prädiktorkoeffizienten
OC.der Übertragungsfunktion H(Z). im dritten Schritt erhält
man von den Prädiktorkoeffizienten auf der Basis der Beziehung der Gleichung (2) die Lösungen der beiden Polynome
P(Z) und Q(Z), und auf diese Weise die LSP-Parameter Cb ■ und Θ.. Durch Steuerung der Koeffizienten des Synthesefilters
unter Verwendung der Parameter, die die Information über die Sprachspektralumhüllende darstellen, kann
man ein Filter erhalten, dessen Übertragungsfunktion H(Z) der Sprachspektralumhüllenden äquivalent ist. Die Übertragungsfunktion
der Rückkopplungsschleife im Synthesefilter ist in Form einer Kaskadenschaltung von Filtern zweiter
Ordnung vorgesehen, deren Nullstellen auf einem Einheitskreis in einer Ebene Z liegen, wie durch die Ausdrücke
(5) und (6) angegeben. Da diese beiden Filter zweiter Ordnung im Aufbau identisch sind, kann man den Aufbau
auch durch Mehrfachverwendung von einem Filter zweiter
Ordnung unter Einsatz eines Zeitteilungsbetriebs oder einer sog. Pipeline-Operation vereinfachen. Es ist auch
möglich, den Filterbetrieb durch Verarbeitung eines elektronischen
Rechners ohne Ausbildung der Filter zweiter Ordnung als Schaltungskreise durchzuführen.
Wie oben beschrieben/ werden bei der vorliegenden Erfindung
die Eigenschaften oder Kennwerte des Synthesefilters
durch die vorgenannten Parameter 0. und CJ . gesteuert. Zusätzlich
zu diesen LSP-Parametern Θ. und (J · werden aber
ein Grundfrequenzparameter und ein Amplitudenparameter eingesetzt, wie dies auch bei bislang benutzten Sprachsynthesizern
der Fall ist. Durch den Grundfrequenzparameter wird eine stimmhafte Tonquelle gesteuert, einen Impuls oder eine
Gruppe von Impulsen der durch den Parameter angezeigten Frequenz zu erzeugen. Das Ausgangssignal dieser stimmhaften
6/7 13001S/1023
ORIGINAL INSPECTED
Tonguelle oder das Ausgangssignal von einer Rauschquelle wird abhängig davon ausgewählt, ob der zu rekonstruierende
Ton bzw. Laut stimmhaft oder stimmlos ist. Das ausgewählte Ausgangssignal wird an das Tonsynthesefilter angelegt.
Die Größe eines Signals am Eingang oder am Ausgang des Synthesefilters wird mittels des Amplitudenparameters
gesteuert. Die LSP-Parameter Θ. und CD. werden mittels
einer Parametertransformierungseinrichtung einer Kosinustransformation
zu -2cos 6^. rnd -2cos0. unterworfen, und
diese transformierten Parameter als Steuerparameter zur Steuerung der Koeffizienten der den jeweiligen Parametern
entsprechenden Filter zweiter Ordnung des Tonsynthesefilters verwendet. Die Steuerparameter werden mittels einer
Interpolationseinrichtung in der Form von kosinustransformierten
LSP-Parametern -2cos0. und -2cosCJ. interpoliert.
Die Interpolationseinrichtung kann auch für die Interpolation des Amplitudenparameters eingesetzt werden. Die
LSP-Parameter Θ. und <li . sind sehr gut interpolationsfähig,
und die Interpolation wird in Zeitintervallen die gleich oder zwei Mal so groß wie die Abtastperiode des
zur Erzeugung der Parameter dienenden Originaltons sind, durchgeführt. Beispielsweise werden die LSP-Parameter Θ.
und Co. nach jeder Blockzeit von 20 ms erneuert und die Parameter in jedem Block alle 125 ps interpoliert. Es ist
auch möglich, die Interpolation im Stadium der LSP-Parameter Θ. und CO. durchzuführen und diese dann in die Steu-
-L JL
erparameter umzusetzen.
Die Informationsmenge pro Block ist bei den LSP-Parametern
Θ. und OJ. gering im Vergleich zu den Steuerparametern für
das Synthesefilter zur Sprachsynthese in der Vergangenheit. Sie sind ferner ausgezeichnet interpolationsfähig. Demzufolge
ist es möglich, die LSP-Parameter Θ. und W. zu übertragen oder zu speichern wie sie sind, und ebenfalls möglich,
die empfangenen oder rekonstruierten LSP-Parameter θ und Co·
i ! in die Steuerparameter für das Synthesefilter, das bei ande-
7/8
130015/1023
3037278
ren Sprachsynthesesystemen verwendet wird, d.h. die PARCOR-Koeffizienten
oder lineare Pradiktorkoeffizienten umzusetzen. Auf diese Weise können die LSP-Parameter Θ. und CO.
auch bei vorhandenen Sprachsynthesizern verwendet werden. Der Tonsynthesizer der vorliegenden Erfindung eignet sich
nicht nur zur Synthese gewöhnlicher Sprache, sondern auch solcher von Tönen eines Zeitsignaltons, eines Alarmtons, eines Musikinstrumenttons usw.
Die Erfindung wird nachfolgend unter Bezug auf die beiliegenden Zeichnungen an Ausführungsbeispielen näher erläutert.
Es zeigen:
Fig. 1 ein Blockschaltbild des grund-
sätzlichen Aufbaus einer Ausfüh
rungsform des erfindungsgemäßen
Tonsynthesizers,
Fig. 2 ein Blockschaltbild eines speziel-
len Betriebsbeispiels des Tonsyn
thesizers,
Fig. 3 ein Schaltbild eines Beispiels eines
Filters erster Ordnung oder zweiter Ordnung,- die den Synthesefil
ter schaltungsteil bilden,
Fig. 4A ein Schaltbild zur Erläuterung
eines Beispiels des Synthesefilterschaltungsteils
für den Fall, daß
der Analysegrad gerade ist,
Fig. 4B ' ein Schaltbild zur Erläuterung
eines Beispiels des Synthesefilterschaltungsteils für den Fall, daß
der Analysegrad ungerade ist,
130015/1023
15 " 3037278
Fig. 5 ein Diagramm des Verhältnisses
zwischen den LSP-Parametern Θ. und (*>. und der Sprachspektralumhüllenden,
Fig. 6 ein Schaltbild eines speziellen
Betriebsbeispiels des Synthesefilterschaltungsteils
für den Fall, daß der Analysegrad 4 ist,
Fig. 7 ein Schaltbild eines speziellen
Betriebsbeispiels des Synthesefilterschaltungsteils,
das sich durch eine äquivalente Umwandlung der in Fig. 6 gezeigten Schaltung ergibt,
Fig. 8 ein Schaltbild eines spezieülen
Beispiels des Synthesefilterschaltungsteils für den Fall, daß der
Analysegrad 5 ist,
Fig. 9 ein Schaltbild eines speziellen Be
triebsbeispiels des Synthesefilter-Schaltungsteils, das sich durch eine
äquivalente Umwandlung der in Fig.
gezeigten Schaltung ergibt,
Fig. 1o ein Blockschaltbild eines Beispiels
des Synthesefilterschaltungsteils, das von einem Pipeline-Rechensy
stem Gebrauch macht,
Fig. 11A bis 111 Zeittafeln, die die Änderungen von Signalen an jeweiligen Stellen beim
Betrieb des in Fig. 10 gezeigten
Synthesefilterschaltungsteils wiedergeben
,
13001B/10S3
303727a
Fig. 12 ein Schaltbild, das den Fall zeigt,
bei dem die durch den in Fig. 11 gezeigten Betrieb erreichte Filterarbeitsweise
durch eine Reihenschaltung von Filtern erzielt wird,
Fig. 13 ein Blockschaltbild eines Beispiels
des einen Mikrocomputer verwendenden Synthesefilters,
10
Fig. 14A ein Diagramm, das die Änderungen
der Stärke mit der Zeit für den Fall einer Lautfolge "ba ku ο N ga"
wiedergibt,
15
Fig. 14b ein Diagramm, das die Schwankungen
der LSP-Parameter Θ. und CO. mit
ι ι
der Zeit für den Fall dieser Lautfolge zeigt,
20
Fig. 15 ein Diagramm, das die Verteilungen
der relativen Frequenz der LSP-Parameter θ. und Ci . über der Frequenz
zeigt,
Fig. 16 ein Diagramm, das die Beziehung
zwischen der Anzahl von Quantisierungsbits pro Block und der Spektralverzerrung
durch die Quantisierung zeigt,
Fig. 17 ein Diagramm, das die Beziehung der
Spektralverzerrung durch Interpolation über der Blocklänge für den
Fall zeigt, daß die Parameter inter
poliert wurden, und
10/11
130015/1023
Fig. 18 ein Diagramm, das ein Beispiel
zur Sprachsynthese durch Umwandlung der LSP-Parameter Θ. und CO.
zu OC-Parametern zeigt.
Es wird zunächst auf- Fig. 1 Bezug genommen, bei der die
charakteristischen Parameter von synthetisch zu bildender Sprache (Kunstsprache) von einem EingangsanschIuβ 11 nach
jeweils einer konstanten Zeitperiode (die nachfolgend als Blockperiode bezeichnet werden soll) von beispielsweise
jeweils 20 ms an einen Interface-Schaltungsteil 12 angelegt und dort festgehalten werden. Von diesen so eingegebenen
Parametern werden die LSP-Parameter Θ. und ω die eine Information über die Spektralumhüllende darstellen, an
einen Parametertransformierungs-Schaltungsteil (PT-Schaltungsteil)
13 geliefert. Von den Parametern, die eine Tonquelleninformation
darstellen, wird die Amplitudeninformation an einen Parameterinterpolations-Schaltungsteil (PI-Schaltungsteil)
14 geliefert, während die anderem Parameter,
d.h. die die Grundperiode (Tonhöhe) der Sprache angebende Information und die Information, die angibt, ob es
sich um einen stimmhaften oder stimmlosen Laut handelt, an einen Tonquellensignalgenerator-Schaltungsteil (TQSG-Schaltungsteil)
15 geliefert werden.
In dem PT-Schaltungsteil 13 werden die eingegebenen LSP-Parameter
Θ. und ■&>. in Steuerparameter -2cos0. und -2cos Φ .
für einen Synthesefilter-Schaltungsteil (SF-Schaltungsteil)
16 transformiert und diese Parameter dem Pl-Schaltungsteil
14 geliefert. Im Pl-Schaltungsteil 14 werden in regelmäßigen Zeitintervallen die jeweiligen Interpolationswerte für die
Steuerparameter und den Tonquellenamplitudenparamter errechnet, so daß die Spektralumhüllende einer stetigen Änderung
unterliegen kann. Die so interpolierten Steuerparameter werden dem SF-Schaltungsteil 16 geliefert, während der Tonquellenamplitudenparameter
an den TQSG-Schaltungsteil 15 angelegt
wird. Im TQSG-Schaltungsteil 15 wird abhängig von den
11/12
1 3001S/1023
Eigenheiten der Sprache ein Tonquellensignal auf der Basis der Tonhöheninformation und der Information, ob der Laut
stimmhaft oder stimmlos, erzeugt und dieses Tonquellensignal
zusammen mit dem interpolierten Tonquellenamplitudenparameter
an den SF-Schaltungsteil 16 angelegt. Im SF-Schaltungsteil
16 wird aus dem Tonquellensignal und den Steuerparametern Kunstsprache erzeugt. Das Ausgangssignal
vom SF-Schaltungsteil 16 wird zu einem Digital/Analog-Umsetzschaltungsteil
(DAÜ-Schaltungsteil) 17 geliefert un<3- an dessen Aus gangs ans chluß 18 als Analogsignal abgenommen.
Ein Steuerschaltungsteil 19 erzeugt verschiedene
Taktsignale zur richtigen Aktivierung des Sprachsynthesizers und liefert diese den jeweiligen Schaltungsteilen.
Fig. 2 zeigt in etwas konkreterer Form die einzelnen Schaltungsteile
von Fig. 1 . Nach leder Blockperiode wird die Information
darüber, ob der Sprachlaut stimmhaft oder stimmlos ist, vom Interface-Schaltungsteil 12 an ein Stimmhaft-Register
23 und ein Stimmlos-Register 24 angelegt, während ein Sprachfrequenzparameter, der die Sprachtonhöhe angibt,
in einem Tonhöhenregister 25 gespeichert wird. Ein Abwärtszähler 27 wird auf den Inhalt des Tonhöhenregisters 25
voreingestellt. Der Abwärtszähler 27 zählt in Abwärtsrichtung Impulse einer Abtastfrequenz, die an einem Anschluß
26 anstehen. Jedesmal, wenn der Zählerinhalt Null wird, liefert er einen Impuls an ein Tor oder Verknüpfungsglied
31 und wird gleichzeitig auf den Inhalt des Tonhöhenregi-. sters 25 voreingestellt. An das Verknüpfungsglied 31 werden
der Ausgang vom Stimmhaft-Register 23 und ein Ausgangsimpuls
oder Ausgangsimpulse von einem Impulsgenerator 28 angelegt, und,wenn diese Eingangssignale übereinstimmen,
der Inhalt eines Tonquellenamplitudenregisters (nachfolgend einfach als Amplitudenregister bezeichnet) 34 über
das Verknüpfungsglied 31 an einen Addierer 32 angelegt.
Mit anderen Worten wird die Ämplitudeninformation vom Ampli-
13/14
130016/1023
3037278
tudenregister 34 nach jeweils einer Periode entsprechend
der Sprachgrundfrequenz im Tonhöhenregister 25 an den Addierer 3 2 angelegt, wenn der zu erzeugende Kunstsprachlaut
stimmhaft ist. Die Amplitudeninformation vom Amplitudenregister
34 wird in diesem vom Pl-Schaltungsteil 14 voreingestellt.
Handelt es sich bei dem zu erzeugenden Kunstsprachlaut um
einen stimmlosen Laut, werden das Ausgangssignal vom Stimmlosregister 2 4 und ein Pseudozufallsserienimpuls von einem
Pseudozuf allssignal-(PZS-)Generator 36 an ein Tor oder Verknüpfungsglied 37 geliefert. Bei jedem Zusammenfallen
beider Eingangssignale wird die Amplitudeninformation aus demAmplitudenregister 34 über das Verknüpfungsglied 37 an
den Addierer 32 geliefert. Das in dieser Weise vom Addierer 32 abgeleitete Tonquellensignal wird, falls nötig, von
einem Verstärker 39 verstärkt und dann an den SF-Sehaltungsteil
16 angelegt.
Im PT-Schaltungsteil 13 werden die LSP-Parameter Θ. und L>
-L JL
und der Amylitudenparameter von dem Interface-Schaltungsteil
12 nach jeder Blockperiode in ein Register 21 eingegeben. Die LSP-Parameter Θ. und O. werden einem Parameterumsetzer
22 geliefert, in welchem sie zu den Steuerparametern -2cosÖ. und -2cos Oj transformiert werden. Der Parameterumsetzer
22 ist beispielsweise durch eine Umsetzungstabelle eines Festwertspeichers (ROM) gebildet, der bei Zugriff mit Adressen,
die Θ. und Cu. entsprechen, -2cos Θ. bzw. -2cos CO .
J- -L JL -L
ausgibt. Ein Schieberegister 20 erhält abwechselnd ^.as ausgangssignal
vom Parameterumsetzer 22 und den im Register gespeicherten Amplitudenparameter und setzt diese in ein "
serielles Signal um, das an den Pl-Schaltungsteil 14 angelegt wird.
14/15
130015/1023
Beim dargestellten Ausführungsbeispiel führt der PI-Schaltungsteil
14 eine lineare Interpolation durch. Nach Einschalten eines Schalters 29 werden die Parameter
eines Blocks einem Subtraktor 30 geliefert, der eine Differenz zwischen diesem Parameter und demjenigen
des vorigen Blocks von einem Addierer 33 ermittelt. Diese Differenz wird in einem Differenzwertregister 38 über
einen Schalter 91 gespeichert. Danach wird der Schalter 91 auf die Ausgangsseite des Differenzwertregisters 38
umgeschaltet und dessen Inhalt in Umlauf gebracht. Hierbei wird der Inhalt des Differenzwertregisters 38 für
Bitstellen, die höher als eine vorgegebene Bitstelle sind, herausgezogen und dem Addierer 33 geliefert, wo er zum Inhalt
eines Interpolationsergebnisregisters 92 hinzuaddiert wird. Wenn beispielsweise die Parameterauffrischungsperiode
oder Blockperiode 16 ms ist und Interpolationsparameter
128 Mal während einer Blockperiode geliefert werden sollen, dann ist die Interpolationsschrittbreite ein Wert,
der sich aus der Division des Differenzwerts durch 128 ergibt. Diesen Wert erhält man durch Verschieben des Differenzwerts
im Differenzwertregister 38 um 7 Bits zur Seite des niedrigeren Stellenwerts hin. Das Ergebnis der
vom Addierer 33 durchgeführten Addition wird dem Interpolationsergebnisregister 92 geliefert und gleichzeitig als
Ausgangsgröße des Pl-Schaltungsteils 14 verwendet. Auf
diese Weise werden vom Addierer 33 die Werte abgeleitet, die dadurch erhalten werden, daß sequentiell mit jedem
Umlauf des Differenzwertregisters 38 einmal, zweimal, dreimal,
... der verschobene Wert des Differenzwertregisters 38 zum Parameter des vorigen Blocks im Interpolationsergebnisregister
92 addiert wird.
Bei diesem Beispiel wird der PI-Schaltungsteil 14 für den
Steuerparameter und den Amplitudenparameter auf einer Zeitteilungsbasis verwendet, so daß, obwohl nicht gezeigt,
der Steuerparameter und der Amplitudenparameter abwechselnd
15/16
130018/1023
interpoliert werden und das Interpolationserqebnisreqister
für beide Parameter gemeinsam genutzt wird. Der im PI-Schaltungsteil
14 interpolierte Amplitudenpararaeter wird dem Amplitudenregister 3 4 im TQSG-Schaltungsteil 15 zugeführt,
während der in oben erwähnter Weise interpolierte Steuerparameter als Information zur Steuerung des Filterkoeffizienten
des SF-Schaltungsteils 16 diesem zugeführt wird. Die Blockperiode, d.h. die Zeitspanne, nach der die
Parameter erneuert werden, wird so ausgewählt, daß sie im Bereich von 10 bis 20 ms liegt, während die Interpolationsperiode so ausgewählt wird, daß sie im Bereich von 1 bis
2 Abtastintervallen liegt. Die Art der Interpolation ist nicht speziell auf die lineare Interpolation beschränkt,
es können auch andere Interpolationsarten sein. Wichtig ist, daß stetige Änderungen der interpolierten Parameter
sichergestellt sind.
Der SF-Schaltungsteil 16 ist mit einer Rückkopplungsschleife
zur Rückführung des Ausgangssignals über zueinander parallelgeschaltete Filterschaltungen 41 und 42 versehen.
Die Filterschaltungen 41 und 42 werden über einen Eingangsanschluß 44 mit dem interpolierten Steuerparameter versorgt,
während ihre Ausgangssignale mit Hilfe eines Addierers 43 addiert werden, dessen Ausgangssignal seinerseits
in einem Addierer 45 dem Eingangssignal des SF-Schaltungsteils hinzuaddiert wird. Das addierte Ausgangssignal vom
Addierer 45 wird über die Filterschaltungen 41 und 42 zurückgeführt und gleichzeitig an einem AusgangsanSchluß 55
abgenommen.
Für beide Filterschaltungen 41 und 42 wird von einem Schaltungskreis
Gebrauch gemacht, der eine Vielzahl von Nullstellen auf einem Einheitskreis in einer komplexen Ebene aufweist.
Beide Filterschaltungen 41 und 42 können durch eine mehrstufige Kaskadenverbindung von Filtern erster Ordnung
und/oder zweiter Ordnung gebildet sein. Bei Ausbildung der
16/17
130016/1023
Filterschaltungen als Digitalfilter kann von einem Filter erster Ordnung Gebrauch gemacht werden, wie es als Beispiel
in Fig. 3A gezeigt ist, von einem Filter zweiter Ordnung, wie es in Fig. 3B gezeigt ist und von einem Filter zweiter
Ordnung, wie es in Fig. 3C gezeigt ist. Das Filter gemäß Fig. 3A ist aus einer Verzögerungsschaltung 51 mit einer
Verzögerung von einer Abtastperiode und einem Addierer 52 zusammengesetzt, der das verzögerte Ausgangssignal und ein
unverzögertes Eingangssignal addiert. Das Filter gemäß Fig.
3B besteht aus zwei Stufen von Verzögerungsschaltungen 51
und einem Addierer 52, der das verzögerte Ausgangssignal und das nicht verzögerte Eingangssignal addiert. Das Filter
gemäß Fig. 3C enthält einen Multiplizierer 53, der das verzögerte Ausgangssignal von einer Stufe-;einer Verzögerungsschaltung
51 mit -2coso. multipliziert, sowie einen Addierer 52, der das verzögerte Ausgangssignal von zwei Stufen
von Verzögerungsschaltungen 51, das nicht verzögerte Eingangssignal
und das Ausgangssignal des Multiplizierers 53 addiert. Die Übertragungsfunktionen der in den Fig. 3A, 3B
und 3C gezeigten Filter sind 1*Z, 1-Z bzw. 1-2cosO.Z+Z .
Es ist auch möglich, Filter höherer Ordnung einzusetzen.
Die Kombination und die Anzahl solcher Filter hängt vom Grad der Analyse ab und wird gemäß Fig. 4A oder 4B in Abhängigkeit
davon ausgewählt, ob der Analysegrad gerade oder ungerade ist. In Fig. 4A ist der Analysegrad 10, d.h. eine gerade
Zahl, und die Filterschaltung 41 ist gebildet von einer Reihenschaltung aus einem Filter 56 erster Ordnung mit der
Übertragungsfunktion 1-Z und Filtern 57 bis 61 zweiter Ord-
2 nung, deren jeweilige Übertragungsfunktion 1-2cos<D.Z+Z
ist. Das Ausgangssignal am Ausgangsanschluß 55 wird in einem
Multiplizierer 63 mit +1/2 multipliziert und an die Reihenschaltung angelegt. Das Ausgangssignal des Filter 61 der
letzten Stufe und das Ausgangssignal vom Multiplizierer 63 werden mittels eines Addierers 62 addiert und dessen Additionsausgangssignal
zum Addierer 43 geliefert. In der Filterschaltung 42 wird das Ausgangssignal vom Multiplizierer 63
130015/1023
17/18
einer Reihenschaltung aus einem Filter 64 erster Ordnung
mit der übertragungsfunktion 1+Z und Filtern 65 bis 69
zweiter Ordnung, die jeweils die Übertragungsfunktion 1-2cosQ.Z+Z besitzen, zugeführt. Das Ausgangssignal der
Reihenschaltung und das Ausgangssignal vom Multiplizierer 63 werden in einem Addierer 71 addiert und dessen Additionsausgangssignal
dem Addierer 43 zugeführt. Den Multiplizierern 53 (vgl. Fig. 3C) der Filter 57 bis 61 zweiter Ordnung
werden jeweils Steuerparameter a- = -2cos Co bis
a5 = -2cos<ü5 eingegeben, während den Multiplizierern 53
der Filter 65 bis 69 zweiter Ordnung jeweils Steuerparameter b- = -2COsQ1 bis b,- = -2cos Qr eingegeben werden.
Fig. 4B zeigt den Fall, daß der Analysegrad 11, d.h. eine ungerade Zahl ist. In der Filterschaltung 41 ist das Filter
56 erster Ordnung, das im Fall von Fig. 4A verwendet wird, weggelassen und stattdessen wird ein Filter 72 zweiter Ord-
2 nung mit einer übertragungsfunktion 1-Z verwendet. In der
Filterschaltung 42 ist das Filter 64 erster Ordnung weggelassen und stattdessen ein Filter 7 3 zweiter Ordnung verwendet,
dem ein Parameter bfi = -2COsQ6 eingegeben wird.
In den Filterschaltungen 41 und 42 stellen die Steuerparameter CO. und Q. Antiresonanzfrequenzen dar, bei denen die Ausgangswerte
der Filterschaltungen 41 und 42 0,5 werden. Für den Fall, daß die den Filterschaltungen 41 und 42 zugeführten
Antiresonanzfrequenzen nahe beieinanderliegen, kommt der Ausgangswert
des Addierers 43 nahe an 1, so daß sich auch die Verstärkung der Rückkopplungsschleife dem Wert 1 annähert.
Als Folge tritt am Ausgangsanschluß 55 eine hohe Resonanzcharakteristik
auf. GJ ^ bis C^5 und Q^ bis Q5 sind hier Antiresonanzfrequenzen,
die charakteristisch für die Sprachspektralumhüllüngsinformation sind. Diese Parameter und die
Sprachumhüllungscharakteristik besitzen ein Verhältnis, wie es in Fig. 5 wiedergegeben ist. Aus Fig. 5 ist ersichtlich,
19/20
130015/1023
daß die Resonanzcharakteristik des Spektrums durch den Abstand zwischen benachbarten Parametern ausgedrückt werden
kann. Diese Parameter stehen der Reihe nach in folgender Beziehung zueinander:
O < G1
< CO1 < Q2
< CO2 - · · < ei
< ^1 < It (81)
Eigenart des Synthesefilters ist, daß es stabil ist, wenn
diese Voraussetzung erfüllt ist.
10
Als nächstes soll ein spezielles Beispiel des SF-Schaltungsteils
16 beschrieben werden. Entsprechend dem in Klammern gesetzten Term im Nenner von Gleichung (7) erhält man die
folgenden identischen Gleichungen aus Gleichung (5): 15
P/2 2
P(Z) - 1 = (1 - Z) jr- (1 - 2cosCJ±Z + Z ) - 1
i=1
p/2-1 i
= Z (Ca1 + Z) + Σ (a.+1 + Z) Τ/ (1 + a.Z + Zz)
i=1 j=1 3
P/2 2 -
- JJ- (1 + ajZ + Zz)j (9)
25
p/2-1 ■ i . 9
Q(Z) - 1 = Z { (b1 + Z) + Σ (b, .- + Z) Jf (1 + b.Z + Z^
1 i=1 1+l j=1 D
P/2 ■ 2
+ TT (1 + b.Z + Zz)f (10)
j=1
a. = -2cos &> .
b± =
O <C0 ± , θ± <
IT (11)
20/21
130016/1023
Es wird ein Digitalfilter gebildet, das eine Allpoiübertragungsfunktion
besitzt, die die Sprachspektralumhüllende annähert und unter Verwendung der durch die Gleichungen (7),
(9) und (10) gegebenen Beziehungen durch Gleichung (1) gegeben ist. Fig. 6 zeigt den Fall für ρ = 4. In Fig. 6 sind
Teile, die solchen in den Fig. 3B bis 4 entsprechen, mit denselben Bezugszahlen bezeichnet. Das Eingangssignal bzw.
der Eingangswert vom Anschluß 54 wird mit Hilfe des Addierers 45 zum Ausgangssignal bzw. Ausgangswert vom Addierer
43 hinzuaddiert. Das Additionsergebnis wird an den Ausgangsanschluß 55 geliefert und gleichzeitig im Multiplizierer
63 mit +1/2 multipliert. Diese Multiplikation mit 1/2 entspricht derjenigen im Nenner von Gleichung (7).
Das Ausgangssignal vom Multiplizierer 6 3 wird an eine Verzögerungsschaltung
74 angelegt, deren Verzögerungszeit eine Abtastperiode, d.h. gleich der Zeiteinheit ist. Das
verzögerte Ausgangssignal wird als Eingangssignal an die beiden Filter 57 und 65 zweiter Ordnung angelegt, in denen
es den Verzögerungsschaltungen 51, den Multiplizierern 53 und den Addierern 52 zugeführt wird. In beiden Multiplizierern
53 werden die jeweiligen Eingangssignale mit a- bzw. b1 multipliziert und die multiplizierten Ausgangssignale
in beiden Filtern 57 und 65 jeweils an einen Addierer 9 4 zur Addition mit dem Ausgangssignal der zugehörigen
Verzögerungsschaltung 51 angelegt. Die Ausgangssignale beider Addierer 94 werden an einen gemeinsamen Addierer 81
angelegt und gleichzeitig in beiden Filtern 57 und 65 über eine jeweilige Verzögerungsschaltung 95 mit einer Verzögerungszeit
gleich einer Abtastperiode an den Addierer 52 angelegt. Die Ausgangssignale von beiden Addierern 52 werden
als jeweilige Ausgangssignale der Filter 57 und 65 den
Filtern 58 und 66 zweiter Ordnung der nächsten Stufe zugeführt. Die Filter 58 und 66 stimmen im Aufbau mit den Filtern
57 und 65 überein, nur sind hier die Koeffizienten für die Multiplizierer 53 a bzw. b~ . Das Ausgangssignal vom
Addierer 9 4 jedes dieser Filter 58 und 66 wird an einen Addierer 82 zur Addition mit dem Ausgangssignal vorn Addierer
21/22 130016/1023
3037278
angelegt. Die Ausgangssignale von den Addierern 52 der
beiden Filter 58 und 66 werden dem Addierer 43 zugeführt, um voneinander subtrahiert zu werden. Der Addierer 43 erhält
ferner das Ausgangssignal vom Addierer 82.
5
Die Verzögerungsschaltung 74 entspricht Z außerhalb der
Klammern in den Gleichungen (9) und (10), und die Filter
57 und 58 stellen je ein Filter zweiter Ordnung mit einer Übertragungsfunktion 1 + Z(a. + Z) dar. In ähnlicher Weise
stellen die Filter 65 und 66 je ein Filter zweiter Ordnung mit einer übertragungsfunktion 1 +Z (b. +Z)
dar. Demzufolge wird mittels der Reihenschaltung der Filter 57 und 58 der dritte Term in der Klammer in Gleichung
(9) realisiert, während die Verzögerungsschaltung 51, der Multiplizierer 53 und der Addierer 94 im Filter
58 (a·.-! + Z) realisieren. Folglich wird durch diese
Schaltung und das Filter 57 der zweite Term in der Klammer in Gleichung (9) realisiert, wobei das Ausgangssignal
über den Addierer 82 zum Addierer 83 geliefert wird. Die Verzögerungsschaltung 51, der Multiplizierer 53 und der
Addierer 94 im Filter 57 realisieren (ai+-j + Z) , und das
Ausgangssignal wird dem Addierer 43 über die Addierer 81
und 82 geliefert. Auf diese Weise werden die Terme in den Klammern in Gleichung (9) durch die Filter 57 und 58 zweiter
Ordnung und die Addierer 43, 81 und 82 realisiert. In ähnlicher Weise werden die Terme in den Klammern in Gleichung
(10) durch die Filter 65 und 66 zweiter Ordnung und die Addierer 43, 81 und 82 realisiert. Die Gleichungen (9)
und (10) unterscheiden sich formal nur dadurch, daß die Vorzeichen der dritten Terme in den Klammern unterschiedlich
sind und daß deshalb das Vorzeichen des Eingangssignals zum Addierer 43 sich unterscheidet. Demzufolge realisieren
der Addierer 43, die Filter 57, 58, 65 und 66, der Multiplizierer
63 und die Verzögerungsschaltung 74 die Gleichung (2), während die Schaltungsanordnung von Fig. 6 als Ganzes
22/23
130015/1023
3037278
der Anzapfung 97 zum Addierer 43 dem zweiten Term in den
Klammern in Gleichung (9) entspricht. Die Filter 65 und zweiter Ordnung der Filterschaltung 41 sind in ähnlicher
Weise ausgebildet. In Verbindung mit der Filterschaltung
wird das Ausgangssignal von der Verzögerungsschaltung 74
in einem Multiplizierer 9 8 mit -1 multipliziert, um das Minuszeichen für den dritten Term in den Klammern der Gleichung
(9) zu verwirklichen.
Für den Fall, daß ρ ungerade ist, erhält man aus Gleichung (8)
die folgende identische Gleichung, die dem Term in den Klammern im Nenner der Gleichung (7) entspricht:
(p-3)/2 i 2
P(Z) -I=Z Ua1H-Z) + Z (a-i+i + z) 7Γ ^
i=1 X ' j=1
(p-1)/2 ri
- Z 77· (1 + a.Z + Z^)J (12)
j=1 J
(p-D/2
Q(Z) - 1 = Z Hb1H-Z) + £ (b,.- +
i=1 X
Jf (1 + b.Z + Z^H (13)
j=1 D
a. = -2cos
b. = -2cos
0 έ W1 f θ±
< Tl (14)
Wie in dem Fall, daß ρ gerade ist, lassen sich zwei Arten von Digitalfiltern, die als Anzapfungsausgangstyp und als
Anzapfungseingangstyp bezeichnet werden können, aus den Verhältnissen der Gleichungen (7), (12) und (13) in den
in den Fig. 8 und 9 gezeigten Formen realisieren. In den
24/25
13001S/1Ö23
Fig. 8 und 9 ist angenommen, daß ρ = 5 ist. In den Fig. 8 und 9 entspricht das Filter 7 2 erster Ordnung Z im dritten
Term in den Klammern in Gleichung (13), während das Filter
7 3 zweiter Ordnung zur Erzielung einer solchen Charakterstik dient, daß die Produkte der übertragungsfunktionen
(1 + b.jZ + Z2) und (1 + L3Z + !
(b, + Z) multipliziert werden.
(1 + b.jZ + Z2) und (1 + b„Z + Z2) der Filter 65 und 66 mit
Wie man den Fig. 6 bis 9 entnehmen kann, können der Multiplizierer
63 zur Multiplikation mit 1/2 und die Verzögerungsschaltung 74 an irgendwelchen Stellen in der Rückkopplungsschleife
angeordnet werden. Da die Filter zweiter Ordnung von gleichem Typ sind, ist es möglich, die Hardware
dadurch zu vereinfachen, daß die Schaltungsanordnung so ausgebildet wird, daß ein sog. Pipelinebetrieb unter Verwendung
eines Multiplizierers 53, der Vielzahl von Addierern
53 und 9 4 und der Vielzahl von Verzögerungsschaltungen 51 und 95, die ein Filter zweiter Ordnung ausmachen, auf
einer Zeitmultiplexbasis durchgeführt wird. Fig. 10 zeigt den Fall, daß das Beispiel des in Fig. 12 gezeigten Filters
zur Durchführung des Pipelinebetriebs angeordnet ist. Bei diesem Beispiel ist ρ = 10, und die Verarbeitung eines Satzes von Parametern, die vom Pl-Schaltungsteil angelegt werden,
ist innerhalb einer Periode von 176 Takten beendet. In Fig. 10 sind Teile, die solchen von Fig. 12 entsprechen,
mit denselben Bezugszahlen bezeichnet. Die Eingangsseite eines statischen 16-Bit-Schieberegisters 74, das die Funktion
der Verzögerungsschaltung 74 ausführt, wird mit Hilfe eines Schalters S- zwischen der Ausgangsseite des Schieberegisters
selbst und der Ausgangsseite des Addierers 45 umgeschaltet. Die Multiplikanden-Eingangsseite des Multiplizierers
53 und die Eingangsseite des Addierers 52 werden mittels eines Schalters S- zwischen der Ausgangsseite des
Schieberegisters 74, der Ausgangsseite einer (27-d)-ten
Stufe des Schieberegisters (vom Eingang des Schieberegisters
25/26
130015/1023
74 an gezählt) und der Ausgangsseite eines31-Bit-Schieberegisters
101 umgeschaltet, wobei d eine Betriebsverzögerung des Multiplizierers 53 ist. Der Multiplizierer 53 ist an
einem Ende mit dem Ausgangsanschluß 55 und der Eingangsseite
des Addierers 9 4 verbunden und leitet am anderen Ausgangsende das um Takte verzögerte Multiplikanden-Eingangssignal
ab, das dem (154 + d)-Bit-Schieberegister 51 geliefert wird. Das Ausgangssignal vom Addierer 81 wird über ein Verknüpfungsglied
102 und ein 16-Bit-Schieberegister 103 zu seiner Eingangsseite
zurückgeführt, wodurch mittels der Addierer 81 und 82 in Fig. 12 eine kumulative Addition durchgeführt wird.
Ein Verknüpfungsglied 102 ist nur während des Zeitintervalls zwischen d+2 und 145+d durchgeschaltet· Eine Eingangsseite
des Addierers 43 wird mittels eines Umschalters S-. zwischen
den Ausgangsseiten der Addierer 52 und 81 umgeschaltet, während
die andere Eingangsseite des Addierers 43 mittels eines Schalters S, zwischen den Ausgangsseiten einer 16. und einer
(d+1)-ten Stufe des Schieberegisters 101 umgeschaltet wird.
Die Eingangsseite des Schieberegisters 101 wird mittels eines Schalters S,- zwischen den Ausgangsseiten der Addierer
43 und 52 umgeschaltet.
Die Schalter S1 bis S1- sind während einer Arbeitsperiode,
d.h. 176 Takten, während einer bei den jeweiligen Kontakten angegebenen Taktperiode mit diesen verbunden. Die Schieberegister
51, 95, 101 und 103 sind (154+d)-Bit, (175-d)-Bit, 31-Bit bzw. 16-Bit dynamische Schieberegister, die ständig
mit Schxebetaktimpulsen versorgt werden. Die jeweilige gestrichelte Eingangsleitung zu den Addierern 43, 45, 52 und
81 gibt die Zeitsteuerung der Betriebsgrenze für die einzelnen Parameter an. Beispielsweise kennzeichnet 0O eine Wiederholung
nach jeweils 16 Takten. Die Betriebsverzögerung der einzelnen Addierer ist zu einem Takt gewählt. Fig. 11
ist eine Zeittafel des Betriebs der einzelnen Teile in Fig. 10. Fig. 11A zeigt die Taktzeitpunkte, Fig.HB die
Zeitpunkte der Eingabe der Koeffizienten a., b. und A in
26/27/28
130018/1033
die Multiplizierer 53 vom Eingangsanschluß 44, Fig. 11C
die der Eingabe des Multiplikanden des Multiplizieren 53, Fig. 11D die eines Eingangssignals zum Addierer 94
vom Multiplizierer 53, Fig. 11E die des anderen Eingangssignals
zum Addierer 94, Fig. 11F die des Ausgangssignals vom Addierer 94, Fig. 11G die des Ausgangssignals vom
Addierer 81 und folglich des Inhalts des Registers 103, Fig. 11H die des Eingangssignals zum Addierer 52 vom
Schieberegister 95 und Fig. 111 die des Ausgangssignals vom Addierer 52. Fig. 12 zeigt diese Eingangssignale und
Ausgangssignale in Form von an den jeweiligen Baugliedern
auftretenden Signalen für den Fall einer Kaskadenschaltung der Filter zweiter Ordnung.
Wie aus Fig. 11 ersichtlich, werden in der Zeitspanne zwischen den Takten O und 16 ein Koeffizient a^(t) und ein
Multiplikand X1(t) im Multiplizierer 53 miteinander multipliziert,
um die Multiplikation im Filter zweiter Ordnung 57 in Fig. 12 zu bewirken. Das Ergebnis dieser Multiplikation
erhält man beim d-ten Takt. Wie in den Fig. 11B und 11C gezeigt, v/erden in der Zeitspanne zwischen den Takten
16 und 32 ein Koeffizient b (t) und ein Multiplikand y., (t)
multipliziert, um die Multiplikation im Filter 65 zweiter Ordnung auszuführen. Der Multiplikand x.. (t) wird durch das
Schieberegister 51 zusammen mit 22 Bits des Multiplizierers 53 um (176 + d) Takte verzögert, so daß, wie Fig. 11E zeigt,
ein Multiplikand x..(t-1) beim d-ten Takt an den Addierer
angelegt und zu dem zu diesem Zeitpunkt vom Multiplizierer 53 abgeleiteten Ausgangssignal a^x. addiert wird. Das addierte
Ausgangssignal X.'(t) wird über den Addierer 81 zwecks
Akkumulation an das Schieberegister 103 geliefert. Das heißt, das Ausgangssignal vom Addierer 81 wird dem Signalsystem der
Addierer 81, 82 ... in Fig. 12 zugeführt.
wie Fig. 11H zeigt, wird das Ausgangssignal vom Addierer
auch dem (175-d)-Bit-Schieberegister 95 geliefert. Demgemäß
28/29
130016/1023
ist in der Zeitspanne zwischen den Takten O und 16 das
Ausgangssignal vom Schieberegister x.Mt-1), wie dies
in Fig. 11H gezeigt ist, und wird im Addierer 52 zum
Multiplikanden x-(t) addiert. Das Ausgangssignal x,(t)
des Addierers 52 wird dem Filter zweiter Ordnung 58 in Fig. 12 als Eingangssignal geliefert. Das Ausgangssignal
x„(t) vom Addierer 52 wird über das Schieberegister 101 dem Multiplizierer 53 zugeführt. Wie in Fig. 11C gezeigt,
wird das Ausgangssignal x„(t) in der Zeitspanne zwischen den Takten 32 und 48 im Multiplizierer 53 mit dem Koeffizienten
a~(t) multipliziert. Vor dieser Multiplikation werden b-(t) und Y1(t), wie zuvor beschrieben, multipliziert
und das multiplizierte Ausgangssignal in ähnlicher
Weise verarbeitet, um hierdurch in der Zeitspanne zwischen den Takten 48 und 64 vom Filter zweiter Ordnung 65 das
Ausgangssignal y~(t) zu erhalten. Auf diese Weise werden
die Multiplikation des Koeffizienten a und des Multiplikanden
χ und die Multiplikation des Koeffizienten b und des
Multiplikanden y abwechselnd alle 16 Takte ausgeführt und die Produkte an das Schieberegister 51 angelegt, wie dies
durch a-jX-j , b^y- , a2 x2' b2y2' *"* in Fi9* 11D angedeutet
ist. Ferner leiten die Filter zweiter Ordnung 57, 58, 59, 60 und 61 X1Mt), X3 1 (t) , X3Mt), X4Mt) bzw. X5 1 (t) und
X2 (t), X3 (t), χ. (t) , xJt) bzw. Xg (t), die den Schieberegistern
95 und 101 geliefert werden, von den Produkten ab. In ähnlicher Weise werden Y1Mt) bis Yc Mt) bzw. Y2(^) bis
γ,(t) von den Filtern zweiter Ordnung 65 bis 69 erhalten
und diese Ausgangssignale abwechselnd mit xMt) bzw. x(t) an die Schieberegister 9 5 und 101 angelegt. In der Zeitspanne
zwischen den Takten 145 und 161 wird das zu diesem Zeitpunkt
vom Addierer 52 abgeleitete Ausgangssignal yg und das vorher
im Schieberegister vorgesehene xß im Addierer 43 voneinander
subtrahiert und (χ,-γ,) über den Schalter S1- dem Schieberegister
101 geliefert, wo diese Differenz um (d+1) Takte verzögert wird. Das verzögerte Ausgangssignal wird vom Schalter
S4 abgenommen und in der Zeitspanne zwischen den Takten 147+d
und 163Hd in den Addierer 43 eingegeben. Das zu diesem Zeit-
29/30 130015/1023
punkt vom Schieberegister 103 gewonnene Ausgangssignal wird
dem Addierer 43 über den Addierer 81 und den Schalter S3
geliefert. Das Ausgangssignal vom Addierer 43 zu diesem Zeitpunkt wird das Ausgangssignal vom Addierer in Fig. 12.
Dieses Ausgangssignal wird an den Addierer 45 angelegt, wo es zur Bildung von Z(t) zum Eingangssignal am Anschluß 54 addiert
wird. Das addierte Ausgangssignal Z(t) wird an das
Register 74 geliefert, das die Verzögerung der Verzögerungsschaltung 74 von Fig. 12 ausführt. Das verzögerte Ausgangs-
signal wird an den Multiplizierer 53 angelegt und zu diesem Zeitpunkt der Koeffizient A als Amplitudeninterpolations-Ausgangssignal
am Anschluß 44 bereitgestellt, so daß vom Multiplizierer 53 am Ausgangsanschluß 55 A>Z(t) abgenommen
werden kann. Diese Multiplikation wird in dem Fall ausgeführt, daß das Ausgangssignal vom SF-Schaltungsteil 16 in
einem Multiplizierer 104 in Fig. 12 mit der Amplitudeninformation
A multipliziert wird. Vom Schieberegister 74 wird ein Ausgangssignal Z(t)/2 abgenommen, das um 1 Bit
nach unten verschoben wurde. Dieses Ausgangssignal wird in der nächstfolgenden Arbeitsperiode für einen neuen Satz
von Parametern über den Schalter S2 dem Multiplizierer 53
als Z(t-1)/2, d.h. als x(t) und y(t) zugeführt. Das Ausgangssignal am Ausgangsanschluß 55 kann auch über einen Ausgangspuffer
105 eines statischen Schieberegisters als Parallelsignal erhalten werden.
Der voranstehend beschriebene Pipelinebetrieb ist auf andere Arten von SF-Schaltungsteilen 16 anwendbar. Es dürfte aus
dem Aufbau von Fig. 10 ferner entnehmbar sein, daß die Filterfunktion durch Addition, Multiplikation und Verzögerung erreicht
wird, so daß diese Filterverarbeitung auch unter Verwendung eines Mikrocomputers durchgeführt werden könnte. In
Fig. 13 beispielsweise werden durch aufeinanderfolgendes Auslesen, Interpretieren und Durchführen von Programmen in einem
Programmspeicher 107 von einem Eingangstor 111 ein Tonquel-
30/31
130015/1023
33 " "'121%
lensignal bzw. Steuerparameter eingegeben, die von dem TQSG-Schaltungsteil 15 und dem pi-Schaltungsteil 14 an
Anschlüsse 108 und 109 angelegt werden. Die Zentraleinheit 106 führt daraufhin nacheinander die zuvor auf Fig.11
beschriebenen Operationen aus. Ein Schreib-Lese-Speicher 112 wird anstelle der Register 51, 74, 95, 101, 103 und
105 in Fig.10 verwendet. Die Ergebnisse der Operationen werden in den Speicher 112 eingeschrieben und zum geeigneten
Zeitpunkt aus ihm ausnelesen, um Operationen auszuführen.
Das so erzielte Ausgangssignal wird von einem Ausgangstor 113 an den Ausgangsanschluß 55 angelegt. Die Zentraleinheit
6, die Speicher 107 und 112 und die Tor 111 und 113 sind mit einem Bus 114 verbunden.
Das Ausgangssignal vom SF-Schaltungsteil, d.h. vom Synthesefilterschaltungsteil
16 läßt sich auf irgendeine der oben erwähnten Weisen erzielen. Das Ausgangssignal wird in
Fig. 2 mit Hilfe des DAU-Schaltungsteils 17 in ein analoges
Signal umgesetzt, um ein Sprachausgangssignal zu erhalten. Wenn das Eingangssignal zum DAU-Schaltungsteil 17 ein
serielles Signal ist, dann wird es an ein Schieberegister 115 angelegt und der Inhalt des Schieberegisters 115 mittels
eines DA-Umsetzers 116 in analoge Form umgesetzt.
Wie zuvor beschrieben, können die LSP-Parameter &>. und Θ.
in den charakteristischen Sprachparametern, die bei der Erfindung verwendet werden, durch Lösen der Gleichungen
(5) und (6) erhalten werden. In den Fig. 14A und 14B sind
die Ergebnisse einer Analyse der Lautfolge "bakuoNga" unter Verwendung der LSP-Parameter Cd . und Θ. gezeigt. In den
Fig. 14A und 14B ist auf der Abszisse die Zeit t, in Fig. 14A auf der Ordinate die Stärke und in Fig. 14B auf der
Ordinate die normierte Kreisfrequenz aufgetragen. Betrachtet man Momentanpunkte in Fig. 14B, dann steigt die Frequenz
in der Reihenfolge der Parameter Q1, OJ , θ , Cu0...
Θ5' ^5* Diese Reihenfolge ändert sich nicht, und Θ. und
31/32
130015/1023
CO . fallen innerhalb eines Blocks nicht zusammen. Es ist demzufolge garantiert, daß der SF-Schaltungsteil 16 ständig
stabil ist. Die Frequenzverteilungen der LSP-Parameter Θ. und CO. sind in Fig. 15 gezeigt, in der auf der Abszisse
die normierte Kreisfrequenz f und auf der Ordinate die relative
Frequenz D aufgetragen sind. Wie in Fig. 15 gezeigt, sind die einzelnen Parameter nicht über ein breites Frequenzband
verteilt, sondern auf ein relativ schmales Frequenzband beschränkt, so daß die LSP-Parameter CO- und θ. in
Verbindung mit dem Frequenzbereich, über den sie sich erstrecken, quantisiert v/erden können.
Die LSP-Parameter CO. und θ. sind gering bezüglich Quantisierungsverzerrung.
Fig. 16 zeigt eine Spektralverzerrung D„ einer Kunstsprache, wenn verschiedene Parameter verschieden
quantisiert werden. Die Abszisse stellt die Anzahl von QuantisierungsbitsB per Block und die Ordinate die Spektralverzerrung
D dar. Die Linie 117 zeigt den Fall, wo unter Berücksichtigung allein der Parameterverteilung der PARCOR-Koeffizient
linear quanitisiert ist, nur im Koeffizient war verteilt. Die Linie 118 zeigt den Fall, daß die Anzahl von
Quantisierungsbits für den PARCOR-Koeffizient unter Berücksichtigung
der Spektralempfindlichkeit zusätzlich zur Parameterverteilung im Fall von Linie 117, speziell im Fall
einer merklichen Beeinflussung des Spektrums, vergrößert wurde. Die Linie 119 zeigt den Fall, daß die LSP-Parameter
Co. und θ, unter Berücksichtigung nur der Parametervertei-
-L JL
lung quantisiert wurden. Die Linie 121 zeigt den Fall, daß die LSP-Parameter CO. und θ. unter Berücksichtigung der Parameterverteilung
und der Spektralempfindlichkeit quantisiert wurden. Man kann Fig. 16 entnehmen, daß im Fall der
Verwendung der gleichen Anzahl von Quantisierungsbits die Spektralverzerrung in der Reihenfolge der Linien 117, 118,
119 und 121 kleiner wird. Da die Linien 119 und 121 nahe
beieinanderliegen, v/erden die LSP-Parameter CO. und θ. bezüglich der Spektralverzerrung nicht so sehr beeinflußt,
32/33
130015/1023
3Q37276
auch wenn die Spektralempfindlichkeit nicht in Betracht
gezogen wird. Da es also ausreicht, die Quantisierung unter Berücksichtigung des Parameterverteilungsbereichs
allein durchzuführen, ist diese Quantisierung einfach.
Teilt man die Anzahl von Quantisierungsbits pro Block, bei der die Spektralverzerrung im Fall der Linie 119 ein
dB ist durch die Anzahl der Quantisierungsbits im Fall der Linie 117, ergibt sich ein Wert 0,7. In ähnlicher
Weise wird das Verhältnis der Anzahl von Quantisierungsbits pro Block, bei der die Spektralverzerrung 1dB ist,
zwischen den Linien 118 und 121, 0,8. Hieraus geht hervor, daß die LSP-Parameter 65 . und 9.
ausgezeichnet sind. Ein dB ist eine Differenzempfindungsgrenze
der Spektralverzerrung von Kunstsprache.
Fig. 17 zeigt Interpolationseigenschaften, wobei die Abszisse eine Blocklänge T und die Ordinate die Spektralverzerrung
Dg darstellen. Fig. 17 zeigt die Spektralverzerrung von Kunstsprache für den Fall, daß ein Block, in
dem Originalsprachlaute in 1o ms analysiert wurden, als
Bezug verwendet wurde, die Blocklänge auf 20 bis 70 ms erhöht wurde und die Parameter alle 10 ms interpoliert wurden.
Die Linie 122 zeigt den Fall, wo die PARCOR-Koeffizienten
verwendet wurden, während die Linie 123 den Fall zeigt, daß die LSP-Parameter £D . und Θ. verwendet wurden.
Wie aus Fig. 17 erkennbar, kann bei derselben Verzerrung die Blocklänge T£ bei Verwendung der LSP-Parameter langer
als die Blocklänge Tf bei Verwendung der PARCOR-Koeffizienten
gemacht v/erden, d.h. die Periode zur Erneuerung der Parameter kann verlängert werden, so daß die Gesamtin
formationsmenge hierdurch verringert v/erden kann. Da ferner die Anzahl von Bits pro Block bei den LSP-Parametern
geringer als bei den PARCOR-Koeffizienten ist, wie man aus ■
Fig. 16 entnimmt, wird die Informationsmenge bei derselben
Verzerrung um das Produkt der Verminderungsverhältnisse in den Fig. 16 und 17 geringer. Das heißt im Fall der
34/35 130015/1023
LSP-Parameter kann die Informationsmenge etwa 60 % derjenigen
im Fall der PARCOR-Koeffizienten betragen.
Bei Einsatz der LSP-Parameter ist es wie im Fall anderer Parameter ohne Bedeutung, daß sie mit einer kürzeren Periode
als der Äbtastperiode der Originalsprache, die zur Gewinnung
der Parameter verwendet wird, interpoliert werden. Experimente ergaben, daß die Interpolationsperiode etwa zweimal
so groß oder weniger als die Äbtastperiode der Originalsprache sein kann, daß jedoch, wenn die erstere etwa zweimal
so groß wie die letztere ist, Störungen oder Rauschen eingeführt wird, das die Kunstsprache undeutlich macht. Es
ist daher vorzuziehen, daß die Interpolationsperiode gleich der oder zweimal so groß wie die Äbtastperiode der Originalspräche
ist.
Wie im Vorangehenden beschrieben, ist es relativ leicht, die LSP-Paramter automatisch herauszuziehen, so daß dies auf
Echtzeitbasis erfolgen kann. Ferner sind die LSP-Parameter
ausgezeichnet bezüglich der Interpolationseigenschaft, haben geringe Abweichung bezüglich der Quantisierungseigenschaft
und erlauben Übertragung und Speicherung von Sprache mit geringer Informationsmenge. Bei der Sprachsynthese kann Sprache
hoher Qualität wiedergewonnen und mit einer geringen Informationsmenge
künstlich aufgebaut werden., wobei die Stabilität des Synthetisierungsfilters garantiert ist, solange das
Verhältnis von Gleichung (8) gilt.
Bei der Anordnung gemäß Fig. 2 ist es auch möglich, das Spektrum
dadurch auszuweiten, daß vom Impulsgenerator 28 eine
Kette von Impulsgruppen, wie etwa die Barker-Folge, anstelle
der Impulskette erzeugt wird. Der Pl-Schaltungsteil 14 kann
auch in der demPT-Schaltungsteil 13 vorangehenden Stufe vorgesehen
werden. Das heißt, die LSP-Parameter vom Interface-Schaltungsteil 12 können auch nach ihrer Interpolation der
35/36
130015/1023
Kosinustransformation im PT-Schaltungsabschnitt 13 unterzogen
werden. In diesem Fall ist die Verwendung eines Pestspeichers unwirtschaftlich, da seine Speicherkapazität
enorm sein müßte. Demzufolge ist es vorzuziehen, die Parameterumsetzung unter Verwendung einer Näherungsfunktion
des Kosinus durchzuführen, statt den in Verbindung mit dem Beispiel von Fig. 2 beschriebenen Festspeicher
zu verwenden. In Fig. 2 wird die Information, die angibt, ob es sich um einen stimmhaften oder stimmlosen Sprachlaut
handelt, in das Stimmhaftregister 23 und das Stimmlosregister
24 eingespeichert. Diese Information muß jedoch nicht immer vorgesehen werden. Das heißt, es wird eine
Detektorschaltung vorgesehen, die ermittelt, ob der an das Tonhöhenregister 25 angelegte Grundperiodenparameter Null ist oder
nicht. Wird festgestellt, daß dieser Parameter Null ist, dann gilt dies als Entscheidung, daß der Laut stimmlos
ist, so daß das Verknüpfungsglied 37 durchgeschaltet wird. Im Fall von von Null abweichenden Werten wird der
Laut als stimmhaft betrachtet und das Verknüpfungsglied 31 durchgeschaltet. Die Steuerung durch den Amplitudenparameter
kann auch in Verbindung mit dem Ausgang des SF-Schaltungsteils 16 durchgeführt werden, wie dies vorangehend
unter Bezug auf die Ausführungsform von Fig. 12 erläutert
wurde.
Bei der vorangehenden Beschreibung wurde als Synthesefilter ein Filter verwendet, das im Rückkopplungskreis Mittel
enthält, um eine Vielzahl von Filtern erster Ordnung und zweiter Ordnung unterschiedlicher Koeffizienten in Reihe
zu schalten, die die Nullstelle auf einem Einheitskreis besitzen. Dies erfolgte unter Benutzung der LSP-Parameter.
Das Synthesefilter muß jedoch nicht immer speziell auf solch ein Filter beschränkt sein. Vielmehr kann die Sprachsynthese
auch durchgeführt werden, indem die LSP-Parameter in andere Parametertypen transformiert werden und andere
Filter verwendet werden. In Fig. 18 z.B., in der Teile,
130015/1023
36/37
die solchen von Fig. 1 entsprechen, mit gleicher Bezugszahl bezeichnet sind, wird der Grundperiodenparameter
in den charakteristischen Parametern, die dem Interface-Schaltungsabschnitt 12 zugeführt werden, dem TOSG-Schaltungsteil
15 zugeführt, während der Amplitudenparameter
dem PI-Schaltungsteil 14 geliefert wird. Der auf
diese Weise interpolierte Amplitudenparameter wird an den TQSG-Schaltungsteil 15 angelegt und in diesem in der
zuvor unter Bezug auf Fig. 2 erläuterten Weise verarbeitet, wobei an den SF-Schaltungsteil.16 ein Tonquellensignal
geliefert wird. Die LSP-Parameter werden einem
LSP-Parametertransformierungs-Schaltungsteil 124 geliefert,
in welchem sie zu anderen Parametertypen, etwa einem cC-Parameter, PARCOR-Parameter oder andere transformiert
werden. Beispielsweise werden von den LSP-Parametern unter Verwendung der Gleichung (5) oder (6) Polynome
P(Z) und Q(Z) gewonnen und von den Polynomen unter Verwendung der Gleichungen (1) und (2) die Prädiktorkoeffizienten
OC. der Übertragungsfunktion H(Z). Durch Interpolation
der so erhaltenen Prädiktorkoeffizienten D^. im
Pl-Schaltungsteil 14 in der erforderlichen Weise werden
die Eigenschaften des SF-Schaltungsteils 16 gesteuert.
Der SF-Schaltungsteil 16 ist beispielsweise als ein zyklisches Filter ausgebildet, in dem, wie in Fig. 18 gezeigt,
das Tonquellensignal vom TQSG-Schaltungsteil 15 mittels eines Multiplizierers 125 um & vervielfacht und zur Subtraktion
vom Ausgangssignal eines Addierers 127 an einen Addierer 126 angelegt wird. Das Ausgangssignal vom Addierer
126 wird dem Ausgangsanschluß 55 geliefert. Das so gewonnene Ausgangssignal· am Ausgangsanschluß 55 wird an
eine Reihenschaltung von Verzögerungsschaltungen D1 bis D
angelegt, von· denen jede eine Verzögerungszeit gleich einer Abtastperiode besitzt. Die Ausgangssignale von den
Verzögerungsschaltungen D1 bis D werden mit jeweiligen Ko-
effizienten 06- bis Ot vom Pl-Schaltungsteil 14 in Multiplizierern
M1 bis M multipliziert. Die multiplizierten
38/39 130015/1023
Ausgangssignale werden der Reihe nach addiert und dann
im Addierer 127 zusammenaddiert.
ι to·*
Leerseite