DE3883034T2

DE3883034T2 - System zur Sprachsynthese.

Info

Publication number: DE3883034T2
Application number: DE88302313T
Authority: DE
Inventors: Tatsuro Matsumoto; Yasuhiro Nara
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 1987-03-18
Filing date: 1988-03-17
Publication date: 1993-12-02
Anticipated expiration: 2008-03-18
Also published as: EP0283277B1; EP0283277A2; JPS63229499A; DE3883034D1; EP0283277A3; JP2595235B2; US5007095A

Description

Die vorliegende Erfindung bezieht sich auf ein systematisches Sprachsynthesesystem, das zum Beispiel als Vorrichtungen zum Ausgeben von Tastatureingabesätzen als Sprache, um die Tastatureingabe zu bestätigen, Schreibmaschinen für Blinde und Sprachantwortmaschinen unter Verwendung von Telefonen verwendet werden kann.
Bei der Sprachsynthese sollte der Ausgabeklang oder Ausgabeton der menschlichen Stimme so nahe wie möglich kommen, d. h., einer Sprache, die so natürlich wie möglich ist. Ein Typ der Sprachsynthese ist die systematische Sprachsynthese. Bei solch einer Sprachsynthese wird die Sprache unter Verwendung von Impulsen für Vokale und von Zufallszahlen für Konsonanten synthetisiert. Bei der menschlichen Sprache wird jedoch die Stimme moduliert, d. h., die Stimme schwankt. Wenn zum Beispiel der Vokal "ah" zu "ahhh" gedehnt wird, bleiben die Amplitude der Sprachwellenform, die Tonhöhe, die Frequenz, etc., nicht vollkommen konstant, sondern werden moduliert (oder schwanken). Selbst wenn zu einem anderen Ton gewechselt wird, unterliegen die Amplitude, die Tonhöhe, etc. keiner gleitenden Veränderung, sondern werden moduliert. Aus diesem Grund kann, wenn Sprache synthetisiert wird, falls die Amplitude, die Tonhöhe und andere Parameter an den beständigen Abschnitten der Sprache konstantgehalten werden und die Amplitude, die Tonhöhe und andere Parameter an den unbeständigen Abschnitten gleitend verändert werden, nur eine mechanische, monotone Sprache erhalten werden. Deshalb sind bei vorher vorgeschlagenen Systemen Versuche unternommen worden, die Ausgabe von Sprachsynthetisatoren zu modulieren, um eine sehr natürliche synthetische Sprache zu erzeugen.
Andererseits erfolgt beim Synthetisieren von Sprache eine Umsetzung von der Eingabe von Sätzen T Umsetzung in Tonkodes T Vorbereitung von Syntheseparametern T Ausgabe von Sprache. Wenn Sprache für einen beliebigen Satz synthetisiert wird, werden die Parameter gemäß vorbestimmter Regeln verknüpft, wobei sie mit jeder Syntheseeinheit funktionieren, die kleiner als ein einzelner Satz ist, zum Beispiel Sprachelemente oder -silben, um eine Zeitfolge von Parametern zu bilden. Falls eine geeignete Verknüpfung in diesem Fall nicht ausgeführt wird, tritt in der synthetischen Sprache ein Rauschen auf und die natürliche Eigenschaft der synthetischen Sprache geht verloren. Deshalb müssen die Parameter der individuellen Sprachsyntheseeinheiten gleitend geändert werden, wie bei der tatsächlichen Sprache, und somit wird ein Verfahren für eine Interpolation von Parametern vorgeschlagen.
Alle vorher vorgeschlagenen Systeme leiden jedoch unter dem Problem, daß eine stabile, sehr natürliche, modulierte Sprachsynthese nicht erreicht werden kann. Beispiele von solch vorher vorgeschlagenen Systemen werden unter Bezugnahme auf die beiliegenden Zeichnungen eingehender erläutert.
Demzufolge ist es wünschenswert, eine Sprachsynthese vorrichtung vorzusehen, die in der Lage ist, eine stabile, sehr natürliche, modulierte Sprache auszugeben.
Es ist auch wünschenswert, eine Sprachsynthesevorrichtung mit einfachem Aufbau vorzusehen.
Ferner bedarf der Aufbau von Filtern, die für die Sprachsynthese verwendet werden, einer Vereinfachung.
DE-A-3 314 674 offenbart ein Sprachsynthesesystem gemäß der Präambel von jedem der beiliegenden unabhängigen Ansprüche. Natürlichklingende Sprache wird erzeugt, indem die Sprachtonhöhe unabhängig von den Formantfrequenzen verändert wird, zum Beispiel unter Verwendung von gespeicherten Tabellen von Tonhöhenwerten als Funktion der Zeit.
Gemäß einem ersten Aspekt der vorliegenden Erfindung ist ein Sprachsynthesesystem vorgesehen, das umfaßt:-
ein erstes Signalerzeugungsmittel, das ein Impulsfolgesignal erzeugt, das als Tonquelle für stimmhafte Töne dient; ein zweites Signalerzeugungsmittel zum Erzeugen eines Rauschsignals, das als Tonquelle für stimmlose Töne dient, und das ein Mittel zum Erzeugen von Zufallsdaten hat;
ein Mittel zum Auswählen eines des genannten Impulsfolgesignals oder Rauschsignals, ansprechend auf ein Auswahlsignal; und
ein Mittel zum Empfangen eines Ausgabesignals von dem genannten Auswahlmittel und zum Filtern des empfangenen Signals auf der Grundlage eines Stimmtraktsimulationsverfahrens;
gekennzeichnet durch:-
ein Filtermittel, das mit dem genannten Zufallsdatenerzeugungsmittel operativ verbunden ist, um die Zufallsdaten davon zu empfangen und zu filtern, und eine Verzögerungsübertragungsfunktion erster Ordnung H(s) : 1/(sτ + α) hat, wobei τ eine Zeitkonstante und α ein Koeffizient ist, zum Ausgeben von mit erster Ordnung verzögerten Zufallsdaten; und
bei dem das erste Signalerzeugungsmittel und das zweite Signalerzeugungsmittel ein gemeinsames Parameterinterpolationsmittel umfassen, zum Empfangen eines ersten Signals, das die Grundfrequenz des stimmhaften Tons aufweist, eines zweiten Signals, das die Amplitude der stimmhaften Tonquelle aufweist, und eines dritten Signals, das die Amplitude der stimmlosen Tonquelle aufweist, und zum Interpolieren der empfangenen ersten bis dritten Signale, um erste bis dritte interpolierte Signale auszugeben;
bei dem das erste Signalerzeugungsmittel ein Mittel zum Erzeugen eines Impulsfolgesignals umfaßt, das durch das erste interpolierte Signal frequenzgesteuert wird, und ein Mittel zum Multiplizieren des Impulsfolgesignals mit dem zweiten interpolierten Signal, um dem Auswahlmittel ein erstes multipliziertes Signal zuzuführen,
bei dem das zweite Signalerzeugungsmittel ferner ein Mittel umfaßt zum Multiplizieren der Zufallsdaten darin, die von dem Zufallsdatenerzeugungsmittel ausgegeben wurden, mit dem dritten interpolierten Signal, um dem Auswahlmittel ein zweites multipliziertes Signal zuzuführen; und
bei dem das Sprachsynthesesystem ein Mittel zum Addieren einer Konstante als systematische Abweichung zu den mit erster Ordnung verzögerten Zufallsdaten von dem Verzögerungsmittel erster Ordnung umfaßt, und ein Mittel zum Multiplizieren eines addierten Signals von dem Addiermittel mit der Ausgabe von dem Stimmtraktsimulationsfiltermittel, um ein Sprachsignal auszugeben.
Gemäß einem zweiten Aspekt der vorliegenden Erfindung ist auch ein Sprachsynthesesystem vorgesehen, das umfaßt:-
ein erstes Signalerzeugungsmittel zum Erzeugen eines Impulsfolgesignals, das als Tonquelle für stimmhafte Töne dient; ein zweites Signalerzeugungsmittel zum Erzeugen eines Rauschsignals, das als Tonquelle für stimmlose Töne dient, und das ein Mittel zum Erzeugen von Zufallsdaten hat;
ein Mittel zum Auswählen eines des genannten Impulsfolgesignals oder Rauschsignals, ansprechend auf ein Auswahlsignal; und
ein Mittel zum Empfangen eines Ausgabesignals von dem genannten Auswahlmittel und zum Filtern des empfangenen Signals auf der Grundlage eines Stimmtraktsimulationsverfahrens;
gekennzeichnet durch:-
ein Filtermittel, das mit dem genannten Zufallsdatenerzeugungsmittel operativ verbunden ist, um die Zufallsdaten davon zu empfangen und zu filtern, und eine Verzögerungsübertragungsfunktion erster Ordnung H(s) : 1/(sτ + α) hat, wobei τ eine Zeitkonstante und α ein Koeffizient ist, zum Ausgeben von mit erster Ordnung verzögerten Zufallsdaten; und durch
ein Mittel zum Addieren einer Konstante als systematische Abweichung zu den mit erster Ordnung verzögerten Zufallsdaten von dem Verzögerungsmittel erster Ordnung;
bei dem das erste Signalerzeugungsmittel und das zweite Signalerzeugungsmittel ein gemeinsames Parameterinterpolationsmittel umfassen, zum Empfangen eines ersten Signals, das die Grundfrequenz des stimmhaften Tons aufweist, eines zweiten Signals, das die Amplitude der stimmhaften Tonquelle aufweist, und eines dritten Signals, das die Amplitude der stimmlosen Tonquelle aufweist, und zum Interpolieren der empfangenen ersten bis dritten Signale, um erste bis dritte interpolierte Signale auszugeben;
bei dem das erste Signalerzeugungsmittel ferner ein erstes Multiplikationsmittel umfaßt, das das erste interpolierte Signal mit dem addierten Signal von dem Addiermittel multipliziert, ein Mittel zum Erzeugen eines Impulsfolgesignals, das durch das multiplizierte Signal von dem ersten Multiplikationsmittel frequenzgesteuert wird, ein zweites Multiplikationsmittel zum Multiplizieren des zweiten interpolierten Signals mit dem addierten Signal von dem Addiermittel, und ein drittes Multiplikationsmittel zum Multiplizieren des Impulsfolgesignals mit dem zweiten multiplizierten Signal von dem zweiten Multiplikationsmittel, um dem Auswahlmittel das multiplizierte Signal zuzuführen; und
bei dem das zweite Signalerzeugungsmittel ferner ein viertes Multiplikationsmittel zum Multiplizieren des addierten Signals von dem Addiermittel mit dem dritten interpolierten Signals umfaßt, und ein fünftes Multiplikationsmittel zum Multiplizieren des Zufallsdatensignals von dem Zufallsdatenerzeugungsmittel darin mit dem fünften multiplizierten Signal von dem fünften Multiplikationsmittel, um dem Auswahlmittel das fünfte multiplizierte Signal zuzuführen.
Gemäß einem dritten Aspekt der vorliegenden Erfindung ist auch ein Sprachsynthesesystem vorgesehen, das umfaßt:-
ein erstes Signalerzeugungsmittel zum Erzeugen eines Impulsfolgesignals, das als Tonquelle für stimmhafte Töne dient; ein zweites Signalerzeugungsmittel zum Erzeugen eines Rauschsignals, das als Tonquelle für stimmlose Töne dient, und das ein Mittel zum Erzeugen von Zufallsdaten hat;
ein Mittel zum Auswählen eines des genannten Impulsfolgesignals oder Rauschsignals, ansprechend auf ein Auswahlsignal; und
ein Mittel zum Empfangen eines Ausgabesignals von dem genannten Auswahlmittel und zum Filtern des empfangenen Signals auf der Grundlage eines Stimmtraktsimulationsverfahrens;
gekennzeichnet durch:-
ein Filtermittel, das mit dem genannten Zufallsdatenerzeugungsmittel operativ verbunden ist, um die Zufallsdaten davon zu empfangen und zu filtern, und eine Verzögerungsübertragungsfunktion erster Ordnung H(s) : 1/(sτ + α) hat, wobei τ eine Zeitkonstante und α ein Koeffizient ist, zum Ausgeben von mit erster Ordnung verzögerten Zufallsdaten; und dadurch, daß
das erste Signalerzeugungsmittel und das zweite Signalerzeugungsmittel ein gemeinsames Parameterinterpolationsmittel umfassen, zum Empfangen eines ersten Signals, das die Grundfrequenz des stimmhaften Tons aufweist, eines zweiten Signals, das die Amplitude der stimmhaften Tonquelle aufweist, und eines dritten Signals, das die Amplitude der stimmlosen Tonquelle aufweist, und zum Interpolieren der empfangenen ersten bis dritten Signale, um erste bis dritte interpolierte Signale auszugeben;
das erste Signalerzeugungsmittel ferner ein erstes Addiermittel zum Addieren des ersten interpolierten Signals zu dem mit erster Ordnung verzögerten Signal von dem Verzögerungsmittel erster Ordnung umfaßt, ein Mittel zum Erzeugen eines Impulsfolgesignals, das durch das erste addierte Signal von dem ersten Addiermittel frequenzgesteuert wird, ein zweites Addiermittel zum Addieren des zweiten interpolierten Signals zu dem mit erster Ordnung verzögerten Signal und ein erstes Multiplikationsmittel zum Multiplizieren des Impulsfolgesignals mit dem zweiten addierten Signal von dem zweiten Addiermittel, um an das Auswahlmittel das erste multiplizierte Signal aus zugeben; und daß
das zweite Signalerzeugungsmittel ferner ein drittes Addiermittel zum Addieren des dritten interpolierten Signals zu dem mit erster Ordnung verzögerten Signal umfaßt, und ein zweites Multiplikationsmittel zum Multiplizieren der Zufallsdaten von dem Zufallsdatenerzeugungsmittel darin mit dem dritten addierten Signal von dem dritten Addiermittel, um an das Auswahlmittel das zweite multiplizierte Signal aus zugeben.
Die Verzögerungseinheit erster Ordnung kann eine Addiereinheit enthalten, eine integrale Einheit, die mit der Addiereinheit verbunden ist, um eine Ausgabe von der Addiereinheit zu empfangen, und ein Gegenkopplungsmittel, das zwischen einem Ausgangsanschluß der integralen Einheit und einem Eingangsanschluß der Addiereinheit vorgesehen ist, zum Multiplizieren der Ausgabe von der integralen Einheit mit einem Koeffizienten α und zum Invertieren des Vorzeichens des multiplizierten Wertes. Die Addiereinheit addiert die Zufallsdaten von der Zufallsdatenerzeugungseinheit zu dem invertiert-multiplizierten Wert von dem Gegenkopplungsmittel.
Die integrale Einheit der Verzögerungseinheit erster Ordnung kann eine Multiplikationseinheit enthalten, eine Addiereinheit, eine Datenhalteeinheit und eine Rückkopplungsleitung, die zwischen einem Ausgangsanschluß der Datenhalteeinheit und einem Eingangsanschluß der Addiereinheit vorgesehen ist. Die Multiplikationseinheit multipliziert die Ausgabe von der Addiereinheit der Verzögerungseinheit erster Ordnung mit dem Faktor 1/τ. Die Addiereinheit in der integralen Einheit addiert die Ausgabe von der Multiplikationseinheit zu der Ausgabe von der Datenhalteeinheit durch die Rückkopplungsleitung.
Der Koeffizient α kann eins sein.
Die gemeinsame Parameterinterpolationseinheit kann eine lineare Interpolationseinheit sein, oder sie kann eine erste Datenhalteeinheit, eine aperiodisch oder kritisch dämpfende Filtereinheit zweiter Ordnung und eine zweite Datenhalteeinheit enthalten, die seriell verbunden sind.
Die kritisch dämpfende Filtereinheit zweiter Ordnung kann seriell verbundene erste und zweite Addiereinheiten enthalten, seriell verbundene erste und zweite integrale Einheiten, eine erste Multiplikationseinheit, die zwischen einem Ausgangsanschluß der ersten integralen Einheit und einem Eingangsanschluß der zweiten Addiereinheit vorgesehen ist, zum Multiplizieren der Ausgabe der ersten integralen Einheit mit einem Dämpfungsfaktor DF und zum Invertieren eines Vorzeichens des multiplizierten Wertes, und eine zweite Multiplikationseinheit, die zwischen einem Ausgangsanschluß der zweiten integralen Einheit und einem Eingangsanschluß der ersten Addiereinheit vorgesehen ist, zum Multiplizieren einer Ausgabe von der zweiten integralen Einheit mit einem Koeffizienten und zum Invertieren eines Vorzeichens des multiplizierten Wertes. Die erste Addiereinheit addiert eine Ausgabe von der ersten Datenhalteeinheit in der gemeinsamen Parameterinterpolationseinheit zu dem invertiert multiplizierten Wert von der zweiten Multiplikationseinheit. Die zweite Addiereinheit addiert eine Ausgabe von der ersten Addiereinheit zu dem invertiert multiplizierten Wert von der ersten Multiplikationseinheit.
Jede der ersten und zweiten integralen Einheiten kann eine Multiplikationseinheit, eine Addiereinheit, eine Datenhalteeinheit und eine Rückkopplungsleitung enthalten, die zwischen einem Ausgangsanschluß der Datenhalteeinheit und einem Eingangsanschluß der Addiereinheit vorgesehen ist. Die Multiplikationseinheit multipliziert die Eingabe mit dem Faktor 1/τ. Die Addiereinheit addiert die Ausgabe von der Multiplikationseinheit zu der Ausgabe von der Datenhalteeinheit, die über die Rückkopplungsleitung empfangen wurde.
Der Dämpfungsfaktor DF, der bei der ersten Multiplikationseinheit verwendet wird, kann zwei sein, und der Koeffizient, der bei der zweiten Multiplikationseinheit verwendet wird, kann eins sein.
Die kritisch oder aperiodisch dämpfende Filtereinheit zweiter Ordnung kann seriell verbundene erste und zweite Verzögerungseinheiten erster Ordnung enthalten, die jeweils eine Addiereinheit enthalten, eine integrale Einheit und eine Multiplikationseinheit, die zwischen einem Ausgangsanschluß der integralen Einheit und einem Eingangsanschluß der Addiereinheit vorgesehen ist, zum Multiplizieren einer Ausgabe der integralen Einheit mit einem Koeffizienten und zum Invertieren derselben. Die Addiereinheit addiert eine Eingabe zu dem invertiert-multiplizierten Wert von der Multiplikationseinheit und führt der integralen Einheit einen addierten Wert zu.
Die integrale Einheit kann eine Multiplikationseinheit, eine Addiereinheit, eine Datenhalteeinheit und eine Rückkopplungsleitung enthalten, die zwischen einem Ausgangsanschluß der Datenhalteeinheit und einem Eingangsanschluß der Addiereinheit vorgesehen ist. Das Multiplikationsmittel multipliziert die Eingabe mit dem Faktor 1/τ. Die Addiereinheit addiert eine Ausgabe von der Addiereinheit zu der Ausgabe von der Datenhalteeinheit, die über die Rückkopplungsleitung empfangen wurde.
Als Beispiel wird Bezug auf die beiliegenden Zeichnungen genommen, in denen:-
Fig. 1 ein Blockdiagramm einer vorher vorgeschlagenen Synthesevorrichtung für modulierte Sprache ist;
Fig. 2 ein Blockdiagramm einer anderen vorher vorgeschlagenen Synthesevorrichtung für modulierte Sprache ist;
Fig. 3 ein Diagramm zum Erläutern eines vorher vorgeschlagenen linearen Interpolationsverfahrens von Parametern bei der Sprachsynthese ist;
Fig. 4 ein Diagramm zum Erläutern von Ausgabekennlinien solch eines Parameterinterpolationsverfahrens unter Verwendung eines vorher vorgeschlagenen kritisch dämpfenden Filters zweiter Ordnung ist;
Fig. 5 ein Blockdiagramm solch eines kritisch dämpfenden Filters zweiter Ordnung ist;
Fig. 6 ein Diagramm zum Erläutern eines vorher vorgeschlagenen Verfahrens zum Erzeugen einer Modulation ist;
Fig. 7 eine grafische Darstellung der Spektralkennlinien eines Modulationszeitfolgesignals ist, das durch das Modulationsverfahren von Fig. 6 erzeugt wurde;
Fig. 8 ein Wellenformendiagramm eines herkömmlichen Zufallsdatensignals ist;
Fig. 9 ein Wellenformendiagramm eines Modulationszeitfolgesignals ist, das durch das vorher vorgeschlagene Modulationsverfahren erzeugt wurde;
Fig. 10 ein Blockdiagramm einer Sprachsynthesevorrichtung ist, die die vorliegende Erfindung verkörpert;
Fig. 11 ein Diagramm zum Erläutern eines Modulationsverfahrens ist, das die vorliegende Erfindung verkörpert;
Fig. 12 eine grafische Darstellung der Spektralkennlinien eines Modulationszeitfolgesignals ist, das durch das Modulationsverfahren von Fig. 11 erzeugt wurde;
Fig. 13 eine Strukturansicht eines Verzögerungsfilters erster Ordnung bei dem Modulationsverfahren von Fig. 11 ist;
Fig. 14 ein Wellenformendiagramm eines Modulationszeitfolgesignals ist, das durch das Modulationsverfahren von Fig. 11 erzeugt wurde;
Fig. 15 eine detaillierte Strukturansicht des Verzögerungsfilters erster Ordnung von Fig. 11 ist;
Fig. 16 ein Blockdiagramm einer anderen Sprachsynthesevorrichtung ist, die die vorliegende Erfindung verkörpert;
Fig. 17 ein Blockdiagramm von noch einer anderen Sprachsynthesevorrichtung ist, die die vorliegende Erfindung verkörpert;
Fig. 18 ein Diagramm zum Erläutern eines Parameterinterpolationsverfahrens unter Verwendung eines kritisch dämpfenden Filters zweiter Ordnung ist;
Fig. 19 ein Blockdiagramm eines kritisch dämpfenden Filters zweiter Ordnung ist, das die vorliegende Erfindung verkörpert;
Fig. 20 ein Blockdiagramm eines kritisch dämpfenden Filters zweiter Ordnung ist, das die vorliegende Erfindung verkörpert;
Fig. 21 eine spezifische Strukturansicht des kritisch dämpfenden Filters zweiter Ordnung von Fig. 20 ist;
Fig. 22a und 22b grafische Darstellungen des Stufenfrequenzganges des kritisch dämpfenden Filters zweiter Ordnung von Fig. 21 sind;
Fig. 23 ein Blockdiagramm eines kritisch dämpfenden Filters zweiter Ordnung ist, das die vorliegende Erfindung verkörpert;
Fig. 24 eine detalliertere Ansicht von Fig. 23 ist;
Fig. 25 ein Blockdiagramm eines kritisch dämpfenden Filters zweiter Ordnung ist, das bei einem Modulationsinkorporationsverfahren verwendet wird, das die vorliegende Erfindung verkörpert;
Fig. 26 eine grafische Darstellung des Stufenfrequenzganges des kritisch dämpfenden Filters zweiter Ordnung ist, das bei dem Modulationsinkorporationsverfahren von Fig. 25 verwendet wird;
Fig. 27 ein Blockdiagramm einer Sprachsynthesevorrichtung ist, die einen anderen Aspekt der vorliegenden Erfindung verkörpert;
Fig. 28 ein Blockdiagramm eines Integrators ist, der die vorliegende Erfindung verkörpert;
Fig. 29 ein Blockdiagramm eines Zweitordnungsfilters des unendlichen Zweitordnungsimpulscharakteristik- (IIR) Typs ist, das die vorliegende Erfindung verkörpert;
Fig. 30 eine Strukturansicht eines Verzögerungsfilters erster Ordnung ist, das das IIR-Typ-Filter von Fig. 29 verwendet; und
Fig. 31 ein Blockdiagramm eines kritisch dämpfenden Filters zweiter Ordnung ist, das die vorliegende Erfindung verkörpert.
Bevor die bevorzugten Ausführungsformen der vorliegenden Erfindung beschrieben werden, werden zum Vergleich Beispiele nach Stand der Technik beschrieben.
Figur 1 zeigt den Aufbau einer vorher vorgeschlagenen Sprachsynthesevorrichtung zum Modulieren einer Sprachausgabe.
In der Figur gibt ein Konstantfrequenz-Sinuswellenoszillator 41 eine Sinuswelle mit konstanter Frequenz aus. Ein analoger Addierer 42 addiert einen positiven Bezugswert (systematische Abweichung) zu der Ausgabe des Konstantfrequenz-Sinuswellenoszillators 41 und gibt ein variables Amplitudensignal mit einer Amplitude aus, die sich zu der positiven Seite ändert. Ein spannungsgesteuerter Oszillator 43 empfängt das variable Amplitudensignal von dem analogen Addierer 42 und erzeugt ein Taktsignal CLOCK mit einer Frequenz, die der Veränderung der Amplitude entspricht, und führt dasselbe einem digitalen Sprachsynthetisator 44 zu. Der digitale Sprachsynthetisator 44 ist ein Sprachsynthetisator des volldigitalen Typs, der ein Taktsignal mit einer sich verändernden Frequenz als Standardisierungssignal verwendet und synthetische Sprache mit einer modulierten Frequenzkomponente erzeugt und ausgibt.
Bei dem Sprachsynthetisator von Fig. 1 wird die Modulation (Schwankung) durch eine einfache Sinuswelle bewirkt, so bleibt noch ein gewisser mechanischer unnatürlicher Ton bestehen. Auch wird die Modulation nur für die standardisierte Frequenz vorgenommen und ist nicht in der Amplitudenkomponente der synthetischen Sprache enthalten.
Figur 2 zeigt den Aufbau einer anderen vorher vorgeschlagenen Sprachsynthesevorrichtung zum Modulieren der Sprachausgabe. Wenn ein Gleichstrom von 0 Volt dem Eingang des Operationsverstärkers 51 eingegeben wird, der eine extrem große Verstärkungsrate von zum Beispiel über 10 000 hat, wird die Ausgabe nicht vollständig ein Gleichstrom von 0 Volt, sondern wird auf Grund der Drift des Operationsverstärkers moduliert. Die Vorrichtung von Fig. 2 nutzt die Drift. Das auf diese Weise erzeugte Modulationssignal ist ein analoges Signal von verschiedenen kleinen positiven und negativen Werten. Der Operationsverstärker 51 erzeugt das Modulationssignal und fügt es zu dem analogen Addierer 52 hinzu. Der analoge Addierer 52 addiert einen positiven Bezugswert (systematische Abweichung) zu dem Eingangsmodulationssignal, um ein moduliertes Amplitudensignal DATAF mit einer sich auf der positiven Seite verändernden Amplitude zu erzeugen, und gibt dasselbe dem Bezugsspannungsanschluß REF des multiplizierenden Digital-Analog-Umsetzers 53 ein. Andererseits gibt der digitale Sprachsynthetisator 54 die digitalen Daten DATA und den Takt CLOCK der Sprache, die durch das digitale Verfahren synthetisiert wurde, dem DIN- Anschluß und dem CK-Anschluß des multiplizierenden Digital- Analog-Umsetzers 53 ein. Der multiplizierende Digital- Analog-Umsetzer 53 multipliziert einen Wert, der die digitalen Daten DATA aufweist, die an dem DIN-Anschluß eingegeben wurden, und einen Wert, der das modulierte Amplitudensignal (Spannung) aufweist, das an dem REF- Anschluß eingegeben wurde, und gibt eine analoge Spannung, die dem Wert der Summe der zwei DATAF X DATA entspricht, als Sprachausgabe aus. Demzufolge wird ein analoges Sprachsignal mit einer modulierten Amplitude erhalten. Der Vorteil ist der, daß diese Modulation der Modulation von natürlicher Sprache nahekommt. Es sei angemerkt, daß bei diesem Sprachsyntheseverfahren nur die Amplitude der Ausgabe moduliert wird, d. h., die Frequenzkomponente wird nicht moduliert, aber es ist möglich, auch die Frequenzkomponente zu modulieren. Zum Beispiel ist es möglich, einen Sprachsynthetisator des analogen Typs als Sprachsynthetisator zu verwenden und ein Modulationssignal zu den Parametern zum Steuern der Frequenzkennlinien (ausgedrückt durch die Spannung) zu addieren, um eine modulierte Frequenzkomponente zu realisieren. Ferner ist es möglich, wenn ein Sprachsynthetisator des digitalen Typs verwendet wird, das Modulationssignal in eine digitale Form durch einen Digital- Analog-Umsetzer umzusetzen und dasselbe zu einem Digitalausdrucksprachsynthetisator hinzuzufügen.
Der Sprachsynthetisator von Fig. 2 hat den Vorteil, Sprache mit einem modulierten Ton, die natürlicher Sprache nahekommt, auszugeben, aber umgekehrt wird die Modulation durch ein analogartiges Mittel erreicht, so differiert die Größe der Modulation in Abhängigkeit von den individuellen Differenzen des Operationsverstärkers 51, und es tritt das Problem auf, daß es unmöglich ist, dieselben Kennlinien zu erreichen. Ferner tritt das Problem der Alterung auf, mit der eine Instabilität, d. h. Veränderungen der Modulationskennlinien, einhergeht.
Als nächstes erfolgt eine Erläuterung eines vorher vorgeschlagenen Parameterinterpolationsverfahrens bei Sprachsynthetisatoren unter Bezugnahme auf Fig. 3 und Fig. 4.
Figur 3 zeigt ein Parameterinterpolationsverfahren des linearen Interpolationstyps. Bei dem linearen Interpolationsverfahren wird, falls die Parameter der Zeit T1 und T2 F1 bzw. F2 sind, die Interpolation für das lineare Verändern der Parameter zwischen der Zeit T1 und der Zeit T2 ausgeführt. Falls der Parameter während der Periode t von der Zeit T1 bis zu der Zeit T2 F(t) ist, ist F(t) durch die folgende Gleichung (1) gegeben:
F(t) = (F2 - F1) (t - T1) / (T2 - T1) + F1 ... (1)
wobei T1 ≤ t ≤ T2 ist.
Das lineare Interpolationsverfahren gestattet die Interpolation von Parametern durch einfache Berechnungen, aber andererseits werden die Kennlinien der Veränderung der Parameter durch Polygonlinien dargestellt und unterscheiden sich somit von der tatsächlichen gleitenden Veränderung der Parameter, und das bedeutet, daß eine Synthese natürlicher Sprache nicht möglich ist.
Als Parameterinterpolationsverfahren, das die Mängel des linearen Interpolationsverfahrens eliminiert und eine gleitende Verbindung von Parametern gestattet, existiert das Verfahren, das ein kritisch dämpfendes Filter zweiter Ordnung verwendet, das in Fig. 4 gezeigt ist. Das heißt, dieses Verfahren gibt dem nächsten Zielwert Befehle als stufenweise Veränderungen der Parameter ein, glättet die stufenweisen Veränderungen und gibt ein lineares System aus, das durch das kritisch dämpfende Filter zweiter Ordnung approximiert wird. Demzufolge werden die Veränderungen bei den Parametern gleitend ausgeführt, wie dargestellt.
Die Übertragungsfunktion Hc(s) und der Stufenfrequenzgang S(t) des kritisch dämpfenden Filters zweiter Ordnung sind durch die folgenden Gleichungen (2) und (3) gegeben:
Hc(s) = ω²/(s² + 2ωs + ω²) ... (2)
S(t) = 1 - (1 + ωt)exp(-wt) ... (3)
wobei ω = 1/τ (τ: Zeitkonstante)
Hier sind, wenn der Parameter zu der Zeit t&sub1; F&sub1; ist und den Zielwerten F&sub2; , F&sub3; , ... , Fm zu den Zeiten t&sub2; , t&sub3; , ... tm Befehle erteilt werden, die Eingabe C(t) für das kritisch dämpfende Filter zweiter Ordnung und der Frequenzgang f(t) des Systems auf die Eingabe C(t) durch die folgenden Gleichungen (4) und (5) gegeben (siehe zum Beispiel The Journal of the Acoustical Society of Japan, Bd. 34, Nr. 3, S. 177 bis 185):
Hier ist t ≥ tj , u ist die Einheitsstufenfunktion, und der Wert 0 wird genommen, wenn t - tj < 0 ist, und der Wert 1 wird genommen, wenn t - tj ≥ 0 ist.
Figur 5 zeigt ein kritisch dämpfendes Filter zweiter Ordnung, das den Frequenzgang f(t) von Gleichung (5) erreicht. In Fig. 5 ist 61 ein Zähler, der die Zeit t zählt. Bezugszeichen 62j (j = 2 bis m) ist ein Subtrahierglied, das Fj - Fj-1 (j = 2 bis m) berechnet. Bezugszeichen 63j (j = 2 bis m) ist auch ein Subtrahierglied, das t - Tj (j = 2 bis m) berechnet. Bezugszeichen 64j (j = 2 bis m) ist eine Einheitsschaltung, die die Operation der folgenden Gleichung (6) ausführt und die Ausgabe Oj (j = 2 bis m) erzeugt:
Oj = (Fj - Fj-1)u(t - tj) [1 - {1 + ω(t - tj)}exp{-ω(t - tj)}] ... (6)
Der Inhalt von Gleichung (6) ist derselbe wie der Inhalt der Terme in Σ von Gleichung (5). Bezugszeichen 65 ist ein Addierer, der die Ausgabe Oj und F&sub1; der Einheitsschaltungen 64j (j = 2 bis m) addiert, um eine Interpolationsausgabe zu erzeugen, d. h. den Frequenzgang f(t) von Gleichung (5).
Die Tatsache, daß der Frequenzgang f(t) von Gleichung (5) durch den Aufbau von Fig. 5 erhalten werden kann, ist daraus ersichtlich, daß die Ausgabe Oj der Einheitsschaltung von Gleichung (6) den Wert der Terme in Σ von Gleichung (5) aufweist. Unter Verwendung solch eines kritisch dämpfenden Filters zweiter Ordnung wird, da die Geschwindigkeit am Startpunkt 0 ist und der Zielwert Fj allmählich schwingungsfrei approximiert wird und die Parameter gleitend verbunden werden können, der tatsächliche Zustand der Veränderung von Sprachparametern approximiert, und der Sprachsynthese kann sogar im Vergleich zu der linearen Interpolation ein besserer natürlicher Ton verliehen werden.
Das Verfahren der Parameterübertragung unter Verwendung eines kritisch dämpfenden Filters zweiter Ordnung hat jedoch die Probleme, daß der Aufbau des Filters zum Erreichen einer kritischen Zweitordnungsdämpfung kompliziert ist und die Menge der damit verbundenen Berechnung groß ist, und so ist die praktische Anwendbarkeit schlecht. Wenn zum Beispiel (m - 1) Zielwerte vorhanden sind, erhöht sich jedes Mal, wenn die Zeit eine Befehlszeit (t&sub2; , t&sub3; , ... , tm) passiert, die Anzahl von Berechnungen eines exponentiellen Teils, bis schließlich eine Anzahl von (m - 1) Berechnungen des exponentiellen Teils erforderlich sind, somit wird die Berechnungsmenge extrem groß.
Ein anderer vorher vorgeschlagener Sprachsynthetisator wird unter Bezugnahme auf Fig. 6 erläutert. Figur 6 zeigt in einem Blockdiagramm den Aufbau des Sprachsynthetisators, der in der japanischen Patentanmeldung Nr. 58-186800 offenbart ist.
In der Figur ist Bezugszeichen 10A ein Mittel zum Erzeugen eines Modulations- (Schwankungs-) Zeitfolgesignals, das aus einem Zufallszahlenzeitfolgegenerator 11 und einem Integrationsfilter 12A besteht. Der Zufallsdatengenerator 11 erzeugt eine Zeitfolge von Zufallszahlen, zum Beispiel einheitliche Zufallszahlen, und gibt die Zufallszahlenzeitfolge zu gleichen Zeitintervallen aufeinanderfolgend aus. Das Integrationsfilter 12A ist ein Digitaltyp-Integrationsfilter und besteht aus einem Integrator 31 mit einer Übertragungsfunktion von 1/sτ, wobei τ eine Zeitkonstante mit einer Größe ist, die experimentell bestimmt ist, um eine ziemlich natürliche, modulierte synthetische Sprache zu erreichen. Zu beachten ist, daß ω = 1/τ ist. Unten erfolgt die Erläuterung unter Verwendung von τ anstelle von ω. Die Zufallszahlenzeitfolge, die durch den Zufallszahlenzeitfolgegenerator 11 erzeugt wurde, wird durch das Integrationsfilter 12A gefiltert und ein Modulationszeitfolgesignal wird ausgegeben.
Figur 7 zeigt ein Profil des Spektrums eines Modulationszeitfolgesignals, das durch ein Modulationszeitfolgesignalerzeugungsmittel 101 erzeugt wurde, und die Form einer Hyperbel hat. Die Figur setzt den Fall voraus, daß der Zufallszahlenzeitfolgegenerator 11 einheitliche Zufallszahlen (weißes Rauschen) ausgibt, das heißt, den Fall eines flachen Spektrums der Zufallszahlenzeitfolge. Wenn das Spektrum der Zufallszahlenzeitfolge nicht flach ist, wird das Spektrum am Ende mit dem Spektrum von Fig. 7 multipliziert. In jedem der beiden Fälle nimmt das Spektrum eine Form nahe 1/f an (wobei f die Frequenz ist).
Figur 8 zeigt als Beispiel die Wellenform von einheitlichen Zufallszahlen mit einem Bereich von -25 bis +25.
Figur 9 zeigt ein Beispiel eines Modulationszeitfolgesignals, das durch Integrationsfiltern der einheitlichen Zufallszahlen, die in Fig. 8 gezeigt sind, durch das Integrationsfilter 12 erzeugt wurde. Die Zeitkonstante ist in diesem Fall 32.
Auf diese Weise ist es möglich, ein gewünschtes Modulationszeitfolgesignal durch einen einfachen Aufbau zu erzeugen.
Jedoch sind die Spektralkennlinien eines Modulationszeitfolgesignals, das durch das zuvor erwähnte Modulationsverfahren erzeugt wurde, grenzenlos, wenn die Frequenz f 0 ist, wie in Fig. 7 gezeigt. Deshalb wird, falls auch nur eine leichte Gleichstromkomponente in der Zufallszahlenzeitfolge enthalten ist, die durch den Zufallszahlenzeitfolgegenerator 11 erzeugt wurde, die Gleichstromkomponente vervielfacht und der Mittelwert der Ausgabe (Modulationszeitfolgesignal) wird immer größer. Jedoch sind Zufallszahlen, die durch das digitale Verfahren erzeugt wurden, keine vollkommenen Zufallszahlen, sondern haben im allgemeinen eine Periode. Deshalb ist da eine Periodizität vorhanden, wo dieselbe Zufallszahlenfolge, falls mehr als eine gewisse Anzahl von Zufallszahlen erzeugt werden, wiederholt wird, und somit gibt es keine Garantie, daß die Summe bei dem allgemeinen Zufallszahlenerzeugungsverfahren null sein wird. In der grafischen Darstellung des Modulationszeitfolgesignals, das in Fig. 9 gezeigt ist, ist der Zustand der Gleichstromkomponente gezeigt, wenn sie vervielfacht und überlagert ist. Falls ein Versuch unternommen wird, die Summe der Zufallszahlenzeitfolge exakt auf null zu bringen, würde die Verbindung des Zufallszahlenzeitfolgegenerators 11 kompliziert. Das heißt, das zuvor erwähnte Modulationsverfahren hat einen einfachen Aufbau, leidet aber unter dem Problem einer Vervielfachung der Gleichstromkomponente.
Unten erfolgt eine Erläuterung eines Sprachsynthetisators unter Verwendung eines Modulationsverfahrens, das die vorliegende Erfindung verkörpert und die Probleme der vorher vorgeschlagenen Modulationsverfahren lösen kann, die unter Bezugnahme auf Fig. 6 bis Fig. 9 beschrieben sind, und das einen Mittelwert des Modulationszeitfolgesignals von null, d. h., eine Gleichstromkomponente von null, erreicht. Ferner erfolgt eine Beschreibung einer Ausführungsform der vorliegenden Erfindung, die mit einem einfachen Aufbau das kritisch dämpfende Filter zweiter Ordnung realisieren kann, das für den Sprachsynthetisator verwendet wird, der die vorliegende Erfindung verkörpert.
Figur 10 zeigt den Aufbau eines Sprachsynthetisators einer ersten Ausführungsform der vorliegenden Erfindung, welcher Sprachsynthetisator von Fig. 10 aus einem Sprachsynthesemittel 20A und einem Modulationszeitfolgesignal datengenerator 10B besteht.

(A) Modulationsmittel

Zuerst erfolgt unter Bezugnahme auf Fig. 11 eine Beschreibung des Modulations- (Schwankungs-) Erzeugungsmittels der vorliegenden Erfindung, das das Problem bei einem herkömmlichen Modulationserzeugungsmittel löst.
In der Figur ist Bezugszeichen 10B ein Modulations- (Schwankungs-) Zeitfolgesignalerzeugungsmittel, das aus einem Zufallszahlenzeitfolgegenerator 11 und einem Integrationsfilter 12B besteht.
Der Zufallszahlenzeitfolgegenerator 11 erzeugt wie beim Stand der Technik Zeitfolgedaten von Zufallszahlen, zum Beispiel einheitliche Zufallszahlen, und gibt die Zufallszahlenzeitfolgedaten zu gleichen Zeitintervallen auf der Grundlage eines Abtasttaktes sequentiell aus. Die Zufallszahlenzeitfolgedaten werden durch verschiedene bekannte Verfahren erzeugt. Zum Beispiel ist es durch Multiplikation des Ausgabewertes zu einem gewissen Zeitpunkt mit einer großen Konstante und dann durch Addieren einer anderen Konstante möglich, die Ausgabe eines anderen Zeitpunktes zu erhalten. In diesem Fall wird ein Überlauf ignoriert. Ein anderes Verfahren besteht darin, den Ausgabewert zu einem gewissen Zeitpunkt um ein Bit auf der höheren Bitseite oder der niedrigeren Bitseite zu verschieben und den Ein-Bit- Wert, der durch eine EXKLUSIV-ODER-Verbindung von mehreren vorbestimmten Bits mit dem Wert vor der Verschiebung erhalten wurde, auf das undefinierte Bit des niedrigsten oder höchsten Bits anzuwenden, das durch die Verschiebung gebildet wurde (bekannt als M-Folge). Die Modulationszeitfolgesignaldaten, die auf diese Weise erzeugt wurden, sind Zufallszahlenzeitfolgedaten und vermeiden somit eine mechanische Unnatürlichkeit.
Das Integrationsfilter 12B besteht aus einem Verzögerungsfilter erster Ordnung, das eine Übertragungsfunktion von 1/(sτ + α) hat. Durch Unterziehen der Zufallszahlenzeitfolgedaten, die durch den Zufallszahlenzeitfolgegenerator 11 erzeugt wurden, einer Verzögerungsfilterung erster Ordnung durch das Integrationsfilter 12B werden die Modulationszeitfolgesignaldaten erzeugt.
Figur 12 zeigt die Spektralkennlinien der Übertragungsfunktion 1/(sτ + α), das heißt, die Spektralkennlinien der Modulationszeitfolgesignaldaten, die erzeugt werden, wenn das Spektrum der Zufallszahlenzeitfolgedaten flach ist. Wie in Fig. 12 gezeigt, ist das Spektrum des Verzögerungsfilters erster Ordnung ein endlicher Wert von 1/α bei einem Gleichstrom (f = 0), so daß es, selbst wenn eine Gleichstromkomponente in den Zufallszahlenzeitfolgedaten enthalten ist, wie in Fig. 9 gezeigt, nicht weiter akkumuliert wird, wie in Fig. 9 gezeigt.
Figur 13 zeigt durch ein Blockdiagramm ein Beispiel eines Verzögerungsfilters erster Ordnung 12B. Bezugszeichen 31 ist ein Integrator mit einer Übertragungsfunktion von 1/s, 122 ein Addierer und 123 eine Gegenkopplungseinheit zur Gegenkopplung des Koeffizienten α. Der Integrator 31 hat denselben Aufbau wie der Integrator 12A von Fig. 6. Durch diesen Aufbau wird ein Verzögerungsfilter erster Ordnung mit einer Übertragungsfunktion von 1/(sτ + α) realisiert. Hier ist α experimentell bestimmt, aber falls -α = -1 ausgewählt wird, wird dann die Gegenkopplung durch eine einfache Kodeumsetzung der Ausgabe (zum Beispiel Komplement von 2) realisiert, und so kann ein Verzögerungsfilter erster Ordnung mit einem einfachen Aufbau verwendet werden, um die Summe der Modulationszeitfolgesignaldaten, das heißt, die Summe einer Gleichstromkomponente, auf null zu bringen. Figur 14 zeigt ein Beispiel von Modulationszeitfolgesignaldaten, die durch das Modulationsverfahren von Fig. 11 in dem Fall der Verwendung eines Verzögerungsfilters erster Ordnung mit -α = -1 erzeugt wurden, wobei die Zeitkonstante τ 32 ist. Durch Unterziehen der Zufallszahlenzeitfolgedaten einer Verzögerungsfilterung erster Ordnung, wie in Fig. 14 gezeigt, wird der Mittelwert des Modulationszeitfolgesignals null. Es ist möglich, die Erscheinung der Trennung des Mittelwertes von null mit der Zeit zu eliminieren, wie nach Stand der Technik.
Figur 15 zeigt den detaillierten Aufbau des Verzögerungsfilters erster Ordnung 12B, das auf diese Weise konstruiert ist. Bezugszeichen 122 ist ein Addierer, und 123 ist ein Multiplizierer, der die Ausgabe des Integrators 31 mit der Konstante "-1" multipliziert und das Resultat zu dem Addierer 122 hinzugefügt.

(B) Modulationsinkorporationsverfahren

Auf der Grundlage des Modulationszeitfolgesignals, das durch das oben erläuterte Modulationsverfahren der vorliegenden Erfindung erzeugt wurde, synthetisiert das Sprachsynthesemittel modulierte Sprache. Die Modulations- (Schwankungs-) Inkorporationsverarbeitung, um der Sprache eine Modulation zu verleihen, wird in diesem Fall durch verschiedene Verfahren ausgeführt. Unten erfolgt eine Erläuterung verschiedener Modulationsinkorporationsverfahren, die durch das Sprachsynthesemittel ausgeführt werden.

(B1) Modulationsinkorporationsverfahren (1)

Das Modulationsinkorporationsverfahren (1) wird unter Bezugnahme auf Fig. 10 erläutert. Das Sprachsynthesemittel 20A hat einen Sprachsynthetisator 21. Bezugszeichen 211 ist ein Parameterinterpolator, der in dem Sprachsynthetisator 21 enthalten ist. Dieser gibt bei jeder Rahmenperiode von 5 bis 10 ms oder bei jeder Ereignisänderung oder -erscheinung, wie eine Veränderung eines Tonelementes, einen Parameter ein, führt eine Parameterinterpolationsverarbeitung aus und gibt zu jeder Abtastperiode von etwa 100 Mikrosekunden einen interpolierten Parameter aus. Im allgemeinen gibt es viele Typen von Parametern, die durch Sprachsynthesevorrichtungen verwendet werden, aber Fig. 10 zeigt nur jene, die sich auf die Modulationsinkorporationsverarbeitung beziehen. Fs gibt die Grundfrequenz eines stimmhaften Tones an (s: Quelle), As gibt die Amplitude der Tonquelle bei einem stimmhaften Ton an, und An gibt die Amplitude der Tonquelle bei einem stimmlosen Ton an (n: Rauschen). Ferner sind F's, A's und A'n Parameter, die durch den Parameterinterpolator 211 interpoliert wurden. Bezugszeichen 212 ist ein Impulsfolgegenerator, der eine Impulsfolge erzeugt, die als Tonquelle des stimmhaften Tons dient. Die Ausgabe wird durch den Parameter F's frequenzgesteuert und wird ferner durch Multiplikation mit dem Parameter A's durch den Multiplizierer 213 amplitudengesteuert, um eine Wellenform einer stimmhaften Tonquelle zu erzeugen. Bezugszeichen 214 ist ein Zufallszahlenzeitfolgesignalgenerator, der ein Rauschen erzeugt, das als Tonquelle für die stimmlosen Töne dient. Die Ausgabe wird durch Multiplikation mit dem Parameter A'n in dem Multiplizierer 215 amplitudengesteuert, um die Wellenform der stimmlosen Tonquelle zu erzeugen. Bezugszeichen 216 ist ein Stimmtraktkennliniensimulationsfilter, das die Tonübertragungskennlinien der Luftröhre, des Mundes und von anderen Teilen des Stimmtraktes simuliert. Es empfängt als Eingabe Wellenformen von stimmhaften oder stimmlosen Tonquellen von dem Impulsfolgegenerator 212 und dem Zufallszahlenzeitfolgesignalgenerator 21 durch einen Schalter 217 und verändert die internen Parameter (nicht gezeigt), um Sprache zu synthetisieren. Zum Beispiel werden durch langsames Verändern der Parameter Vokale gebildet und durch schnelles Verändern von ihnen Konsonanten. Der Schalter 217 schaltet die stimmhaften und stimmlosen Tonquellen und wird durch einen der Parameter (nicht gezeigt) gesteuert.
Der oben erläuterte Sprachsynthetisator 21, der 211 bis 217 umfaßt, hat denselben Aufbau wie der herkömmliche Sprachsynthetisator und hat keine Modulationsfunktion. Der Sprachsynthetisator 21 synthetisiert nichtmodulierte Sprache auf dieselbe Weise wie nach Stand der Technik und gibt digitale synthetische Sprache durch das Stimmtraktkennlinienfilter 216 aus.
Bezugszeichen 22 ist ein Addierer, der eine positive Konstante mit einem festen positiven Pegel zu einem Modulationszeitfolgesignal addiert, das von einem Modulationszeitfolgesignalerzeugungsmittel 10B eingegeben wurde. Das heißt, das Modulationszeitfolgesignal ändert sich von positiv zu negativ innerhalb eines festen Pegels, aber die Addition einer positiven Konstante als systematische Abweichung erzeugt ein Modulationszeitfolgesignal mit einer Modulation des Pegels in positiver Richtung. Das Verhältnis zwischen dem Modulationspegel des Modulationszeitfolgesignals und dem Pegel der positiven Konstante ist experimentell festgelegt, aber bei dieser Ausführungsform ist für das Verhältnis 0,1 ausgewählt worden.
Bezugszeichen 23 ist ein Multiplizierer, der die digitale synthetische Sprache, d. h., die Ausgabezeitfolge des Sprachsynthetisators 21, mit dem Modulationszeitfolge signal, das von dem Addierer 22 eingegeben wurde, multipliziert.
Dadurch wird eine amplitudenmodulierte digitale synthetische Sprache erzeugt. Diese digitale synthetische Sprache wird durch einen Digital-Analog-Umsetzer (nicht gezeigt) in normale analoge Sprachsignale umgesetzt und ferner über einen Verstärker zu einem Lautsprecher (beide nicht gezeigt) übertragen, um einen modulierten Ton zu erzeugen.
Es sei angemerkt, daß der Zufallszahlenzeitfolgegenerator 11 in dem Modulationszeitfolgesignalerzeugungsmittel 10B und der Zufallszahlenzeitfolgegenerator 214 in dem Sprachsynthesemittel 20 Zufallszahlenzeitfolgen mit demselben Inhalt erzeugen, und somit können die zwei durch eine einzelne Einheit ersetzt werden. Dies gestattet eine weitere Vereinfachung des Aufbaus der Sprachsynthesevorrichtung. Figur 10 zeigt einen Aufbau, bei dem der Zufallszahlenzeitfolgegenerator 214 des Sprachsynthesemittels 20 für den Zufallszahlenzeitfolgegenerator 11 des Modulationszeitfolgesignalerzeugungsmittels 10B eingesetzt wird. Dasselbe trifft bei den anderen Modulationsinkorporationsverfahren zu.

(B2) Modulationsinkorporationsverfahren (2)

Unter Bezugnahme auf Fig. 16 wird das Modulationsinkorporationsverfahren (2) erläutert.
Das Modulations- (Schwankungs-) Inkorporationsverfahren (1) modulierte die Amplitude des Ausgabezeitfolgesignals des Sprachsynthetisators, aber das Modulationsinkorporationsverfahren (2) verleiht dem Zeitfolgeparameter, der bei dem Sprachsynthesemittel 20B verwendet wird, eine Modulation und synthetisiert somit Sprache, die sowohl amplituden- als auch frequenzmoduliert ist.
In Fig. 16 haben das Modulationszeitfolgesignalerzeugungsmittel 10B und, in dem Sprachsynthesemittel 20B, der Sprachsynthetisator 21, der Parameterinterpolator 211, der in dem Sprachsynthetisator 21 vorgesehen ist, der Impulsfolgegenerator 212, der Zufallszahlenzeitfolgegenerator 214, die Multiplizierer 213 und 215, das Stimmtraktkennliniensimulationsfilter 216, der Schalter 217 und der Addierer 22 denselben Aufbau wie jene in Fig. 10.
In dem Sprachsynthesemittel 20B bezeichnen die Bezugszeichen 24, 25 und 26 Elemente, die für das Modulationsinkorporationsverfahren (2) neu vorgesehen sind. Da sie mit dem Sprachsynthetisator 21 integral gebildet sind, sind sie innerhalb des Sprachsynthetisators 21 dargestellt.
Der Multiplizierer 24 multipliziert den Parameter F's, der von dem Parameterinterpolator 211 eingegeben wurde, mit dem Modulationszeitfolgesignal, das von dem Addierer 22 eingegeben wurde, um dem Parameter F's eine Modulation zu verleihen. Dadurch wird der Impulszeitfolge der stimmhaften Tonquelle, die durch den Impulsfolgesignalgenerator 212 ausgegeben wurde, eine Modulation bei der Frequenzkomponente verliehen. Der Multiplizierer 25 multipliziert den Parameter A's, der von dem Parameterinterpolator 211 eingegeben wurde, mit dem Modulationszeitfolgesignal, das von dem Addierer 22 eingegeben wurde. Dadurch wird der Wellenform der stimmhaften Tonquelle, die von dem Multiplizierer 213 ausgegeben wurde, sowohl bei der Frequenz als auch bei der Amplitude eine Modulation verliehen.
Der Multiplizierer 26 multipliziert den Parameter A'n, der von dem Parameterinterpolator 211 eingegeben wurde, mit dem Modulationszeitfolgesignal, das von dem Addierer 22 eingegeben wurde, um dem Parameter A'n eine Modulation zu verleihen. Dadurch wird der Wellenform der stimmlosen Tonquelle, die von dem Multiplizierer 215 ausgegeben wurde, eine Modulation bei der Amplitudenkomponente verliehen. Das Stimmtraktkennliniensimulationsfilter 216 empfängt als Eingabe über einen Schalter 217 eine Wellenform einer stimmhaften Tonquelle, die bei den Amplituden- und Frequenzkomponenten eine Modulation besitzt, oder eine Wellenform einer stimmlosen Tonquelle, die bei der Amplitudenkomponente eine Modulation besitzt, verändert die internen Parameter und synthetisiert amplituden- und frequenzmodulierte Sprache. Die Ausgabezeitfolge des Sprachsynthetisators 21 wird auf dieselbe Weise wie im Fall des Modulationsinkorporationsverfahrens (1) der Digital-Analog-Umsetzung unterzogen, verstärkt und als Ton von Lautsprechern ausgegeben.
Auf obige Weise ist es möglich, sowohl die Amplituden- als auch die Frequenzkomponenten zu modulieren und eine natürlichere Sprache zu synthetisieren.
Es sei angemerkt, daß es als andere Ausführungsform des Modulationsinkorporationsverfahrens (2) möglich ist, nur den Multiplizierer 24 vorzusehen und nur die Frequenzkomponente zu modulieren. Ferner ist es möglich, beide Multiplizierer 25 und 26 vorzusehen und nur die Amplitudenkomponente zu modulieren.
Ferner ist es durch Multiplizieren der Parameter (nicht gezeigt) in dem Stimmtraktkennliniensimulationsfilter 216 mit dem Modulationszeitfolgesignal von dem Addierer 22 möglich, eine feinere Modulation zu verleihen.

(B3) Modulationsinkorporationsverfahren (3)

Unter Bezugnahme auf Fig. 17 wird das Modulationsinkorporationsverfahren (3) erläutert.
Das Modulationsinkorporationsverfahren (3) moduliert wie das Modulationsinkorporationsverfahren (2) die Parameterzeitfolge des Sprachsynthesemittels 20C, um modulierte Sprache zu synthetisieren, realisiert dies aber durch ein unterschiedliches Verfahren.
In Fig. 17 sind das Modulationszeitfolgesignalerzeugungsmittel 10B und, in dem Sprachsynthesemittel 20C, der Sprachsynthetisator 21, der Parameterinterpolator 211, der in dem Sprachsynthetisator 21 vorgesehen ist, der Impulsfolgegenerator 212, der Zufallszahlenzeitfolgegenerator 214, die Multiplizierer 213 und 215, das Stimmtraktkennliniensimulationsfilter 216 und der Schalter 217 dem Aufbau nach dieselben wie jene in Fig. 16.
Bei dem Modulationsinkorporationsverfahren (3) sind, wie in Fig. 17 gezeigt, die Addierer 27, 28 und 29 anstelle der Multiplizierer 24, 25 und 26 bei dem Modulationsinkorporationsverfahren (2) von Fig. 16 vorgesehen. Addierer 22 ist nicht vorgesehen. Bei diesem Aufbau wird das Modulationszeitfolgesignal, das durch das Modulationszeitfolgesignalerzeugungsmittel 10 erzeugt wurde, direkt zu den Addierern 27 bis 29 addiert.
Der Addierer 27 addiert zu dem Parameter F's, der von dem Parameterinterpolator 211 eingegeben wurde, das Modulationszeitfolgesignal, das von dem Modulationszeitfolgesignalerzeugungsmittel 10B eingegeben wurde, um dem Parameter F's eine Modulation zu verleihen. Dadurch wird der Impulszeitfolge der stimmhaften Tonquelle, die durch den Impulsfolgesignalgenerator 212 ausgegeben wurde, eine Modulation bei der Frequenzkomponente verliehen. Der Addierer 28 addiert zu dem Parameter A's, der von dem Parameterinterpolator 211 eingegeben wurde, das Modulationszeitfolgesignal, das von dem Modulationszeitfolgesignalerzeugungsmittel 10B eingegeben wurde, um dem Parameter A's eine Modulation zu verleihen. Dadurch wird der Wellenform der stimmhaften Tonquelle, die von dem Multiplizierer 213 ausgegeben wurde, eine Modulation sowohl bei den Frequenzals auch Amplitudenkomponenten verliehen. Der Addierer 29 addiert zu dem Parameter A'n, der von dem Parameterinterpolator 211 eingegeben wurde, das Modulationszeitfolgesignal, das von dem Modulationszeitfolgesignalerzeugungsmittel 10 eingegeben wurde, um dem Parameter A'n eine Modulation zu verleihen. Dadurch wird der Wellenform der stimmlosen Tonquelle, die von dem Multiplizierer 215 ausgegeben wurde, eine Modulation bei der Amplitudenkomponente verliehen. Das Stimmtraktkennliniensimulationsfilter 216 empfängt als Eingabe über einen Schalter 217 eine Wellenform einer stimmhaften Tonquelle, die bei den Amplituden- und Frequenzkomponenten eine Modulation besitzt, oder eine Wellenform einer stimmlosen Tonquelle, die bei der Amplitudenkomponente eine Modulation besitzt, verändert die internen Parameter und synthetisiert Sprache, die bei den Amplituden- und Frequenzkomponenten moduliert ist. Die Zeitfolgeausgabe des Sprachsynthetisators 21 wird auf dieselbe Weise wie im Fall des Modulationsinkorporationsverfahrens (2) der Digital-Analog-Umsetzung unterzogen, verstärkt und als Ton von Lautsprechern ausgegeben.
Auf obige Weise ist es möglich, sowohl die Amplituden- als auch die Frequenzkomponenten zu modulieren und eine natürlichere Sprache zu synthetisieren.
Es sei angemerkt, daß es als andere Ausführungsform des Modulationsinkorporationsverfahrens (3) auf dieselbe Weise wie bei dem Modulationsinkorporationsverfahren (2) möglich ist, nur den Addierer 27 vorzusehen und nur die Frequenzkomponente zu modulieren. Ferner ist es möglich, beide Addierer 28 und 29 vorzusehen und nur die Amplitudenkomponente zu modulieren.
Ferner ist es durch Addieren des Modulationszeitfolgesignals von dem Modulationszeitfolgesignalerzeugungsmittel 10 zu den Parametern (nicht gezeigt) in dem Stimmtraktkennliniensimulationsfilter 216 möglich, eine feinere Modulation zu verleihen.

(C) Kritisch dämpfendes Filter zweiter Ordnung

Der Parameterinterpolator 211, der in Fig. 10, Fig. 16 und Fig. 17 dargestellt ist, empfängt als Eingabe bei jeder Rahmenperiode von 5 bis 10 ms oder bei jeder Ereignisänderung oder -erscheinung, wie eine Veränderung des Tonelementes, Parameter, führt eine Interpolation aus und gibt bei jeder Abtastperiode von etwa 100 Mikrosekunden einen interpolierten Parameter aus. Zu dieser Zeit wird, um die Veränderung von Parametern zu glätten (interpolieren), das Filtern unter Verwendung eines kritisch dämpfenden Filters zweiter Ordnung ausgeführt, wie schon erläutert wurde.
Figur 18 zeigt das Prinzip des Parameterinterpolationsverfahrens unter Verwendung eines kritisch dämpfenden Filters zweiter Ordnung in dem Parameterinterpolator. In Fig. 18 ist Bezugszeichen 30S ein kritisch dämpfendes Filter zweiter Ordnung und 301 und 302 sind Register. Bei diesem Aufbau empfängt das Register 301 eine Parameterzeitfolge bei jeder Ereignisänderung oder -erscheinung und hält dieselbe. Das kritisch dämpfende Filter zweiter Ordnung 30S verbindet die Veränderungen bei den Parameterwerten des Registers 301 gleitend und schreibt die Ausgabe bei jedem kurzen Intervall von zum Beispiel etwa 100 Mikrosekunden in das Register 302. Dadurch wird der interpolierte Zeitfolgeparameter in dem Register 302 gehalten.
Die Übertragungsfunktion H(s) des kritisch dämpfenden Filters zweiter Ordnung 30 zur Interpolation der Parameterzeitfolge wird durch die zuvor genannte Gleichung (2) ausgedrückt, d. h.,
H(s) = ω²/(s² + 2ωs + ω²)
Die Übertragungsfunktion H(s) kann unter Verwendung des Integrators (ω/s) gebildet werden. Zum Beispiel ist es durch Abwandeln von H(s) zu
H(s) = {ω/(s + ω)} {ω/(s + ω)}
möglich, die Übertragungsfunktion durch Seriellverbindung des primären Verzögerungsfilters von ω/(s + ω) zu realisieren. Ferner wird das Verzögerungsfilter erster Ordnung durch den Integrator mit einer Übertragungsfunktion, die durch ω/s ausgedrückt ist, und einer Gegenkopplung realisiert. Deshalb kann das kritisch dämpfende Filter zweiter Ordnung 30 durch den in Fig. 19 gezeigten Aufbau realisiert werden. In Fig. 19 sind Bezugszeichen 31a und 31b Integratoren, und 32a und 32b sind Addierer. Auf diese Weise kann das kritisch dämpfende Filter zweiter Ordnung 30 unter Verwendung des Integrationsfilters 31 als bildendes Element realisiert werden.
Das kritisch dämpfende Filter zweiter Ordnung von Fig. 19 approximiert die digitale Integration des Integrators 31 durch das einfache Eulersche Integrationsverfahren.
Unter Verwendung des auf diese Weise konstruierten Integrators 31 ist es möglich, ein kritisch dämpfendes Filter zweiter Ordnung 30 einfach zu realisieren. Ferner ist es möglich, durch die gleitende Verbindung von Parametern eine sehr natürliche synthetische Sprache zu erhalten.
Es gibt verschiedene Verfahren zum Konstruieren des kritisch dämpfenden Filters zweiter Ordnung von Fig. 19, aber hier erfolgt eine Erläuterung der kritisch dämpfenden Filter zweiter Ordnung einer Ausführungsform der vorliegenden Erfindung.

(C1) Konstruktionsverfahren des kritisch dämpfenden Filters zweiter Ordnung (1)

Hier erfolgt eine Erläuterung des Konstruktionsverfahrens (1) eines kritisch dämpfenden Filters zweiter Ordnung unter Bezugnahme auf Fig. 20.
Die Übertragungsfunktion Hg(s) des Zweitordnungsfilters wird im allgemeinen durch die folgende Formel (7) ausgedrückt:
Hg(s) = (1/(s²τ² + DF Sτ + 1) ... (7)
wobei DF der Dämpfungsfaktor ist.
Die Gleichung (7) kann zu der Gleichung (8) verändert werden:
Hg(s) = 1/{sτ(sτ + DF) + 1} ... (8)
Das Zweitordnungsfilter mit dieser Übertragungsfunktion besteht aus einem Verzögerungsfilter erster Ordnung mit einer Übertragungsfunktion von 1/(Sτ + DF), einem Integrator mit einer Übertragungsfunktion von 1/sτ und einer Gegenkopplungsschleife mit einem Koeffizienten von 1. Ferner besteht das Verzögerungsfilter erster Ordnung mit der Übertragungsfunktion von 1/(sτ + DF) aus einem Integrator mit einer Übertragungsfunktion von 1/sτ und einer Gegenkopplungsschleife mit einem Koeffizienten von DF. Deshalb wird das Zweitordnungsfilter mit der Übertragungsfunktion Hg(s) der Gleichung (8) durch den Aufbau von Fig. 20 realisiert.
In Fig. 20 sind die Bezugszeichen 31a und 31b Integratoren mit Übertragungsfunktionen von 1/sτ, 321 und 322 sind Addierer, und 331 und 332 sind Multiplizierer. Die Addierer 321 und 322 und die Integratoren 31a und 31b sind seriell verbunden. Der Multiplizierer 331 multipliziert die Ausgabe des Integrators 31a mit dem Koeffizienten DF und fügt das Resultat zu dem Addierer 322 hinzu. Der Addierer 322 multipliziert die Ausgabe des Integrators 31b mit dem Koeffizienten -1 und fügt das Resultat zu dem Addierer 321 hinzu.
Durch solch einen Aufbau des Integrators 31a, der Gegenkopplungsschleife des Multiplizierers 331 und des Addierers 322 kann ein Filter erster Ordnung mit einer Übertragungsfunktion von DF/(sτ + DF) realisiert werden. Durch die Seriellverbindung des Verzögerungsfilters erster Ordnung mit dem Integrator 31b und die Gegenkopplung des Koeffizienten -1 durch den Multiplizierer 332 wird ein Zweitordnungsfilter mit einer Übertragungsfunktion von Hg(s) konstruiert. Das kritisch dämpfende Filter zweiter Ordnung wird durch Auswahl von DF als 2 gebildet.
Figur 21 zeigt ein kritisch dämpfendes Filter zweiter Ordnung, das auf diese Weise konstruiert ist. Teile, die dieselben Bezugszeichen wie in Fig. 20 tragen, bezeichnen dieselben Teile. Das heißt, 31a und 31b sind Integratoren, und 311a und 311b sind Register. Ferner sind 312a, 312b, 321 und 322 Addierer und 313a, 313b, 331 und 332 Multiplizierer.
Figuren 22a und 22b zeigen die Stufenansprechkennlinien des kritisch dämpfenden Filters von Fig. 21, wobei Fig. 22a die Stufeneingabe- und Fig. 22b die Stufenansprechkennlinie zeigt.

(C2) Konstruktionsverfahren des kritisch dämpfenden Filters zweiter Ordnung (2)

Hier erfolgt eine Erläuterung des Konstruktionsverfahrens (2) eines kritisch dämpfenden Filters zweiter Ordnung unter Bezugnahme auf Fig. 23.
In dem Fall eines kritisch dämpfenden Filters zweiter Ordnung beträgt der Dämpfungsfaktor 2, so ändert sich die Übertragungsfunktion Hg(s) wie in der folgenden Gleichung (9):
Hc(s) = 1/(s²τ² + 2sτ + 1) = 1/(sτ + 1)²
= 1/{(sτ + 1)} {1/(sτ + 1)} ... (9)
Deshalb wird das kritisch dämpfende Filter zweiter Ordnung durch Seriellverbindung eines primären Filters mit einer Übertragungsfunktion von 1/(sτ + 1) realisiert und kann so durch den in Fig. 23 gezeigten Aufbau realisiert werden.
In Fig. 23 sind Bezugszeichen 31a und 31b Integratoren mit Übertragungsfunktionen von 1/sτ, dieselben wie im Fall von Fig. 20, 323 und 324 sind Addierer, und 333 und 334 sind Multiplizierer. Multiplizierer 333 multipliziert die Ausgabe des Integrators 31a mit dem Koeffizienten -1 und fügt das Resultat zu dem Addierer 323 hinzu. Der Multiplizierer 334 multipliziert die Ausgabe des Integrators 32 mit dem Koeffizienten -1 und addiert das Resultat zu dem Addierer 324.
Durch solch einen Aufbau des Integrators 31a, der Gegenkopplungsschleife des Multiplizierers 333 und eines Addierers 323 kann ein primäres Verzögerungsfilter mit einer Übertragungsfunktion von 1/(sτ + 1) realisiert werden. Ähnlich kann durch den Integrator 31b, die Gegenkopplungsschleife des Multiplizierers 334 und den Addierer 324 ein primäres Verzögerungsfilter mit derselben Übertragungsfunktion 1/(sτ + 1) konstruiert werden. Durch Seriellverbindung der zwei primären Verzögerungsfilter wird ein kritisch dämpfendes Filter zweiter Ordnung mit einer Übertragungsfunktion von 1/(sτ + 1)² konstruiert.
Das Konstruktionsverfahren des kritisch dämpfenden Filters zweiter Ordnung (2) umfaßt eine zweistufige Reihe von primären Verzögerungsfiltern mit demselben Aufbau, so ist die Konstruktion einfacher und leichter als bei dem Konstruktionsverfahren des kritisch dämpfenden Filters zweiter Ordnung (1).
Figur 24 zeigt Fig. 23 ausführlicher.

(D) Modulationsinkorporationsverfahren (4)

Unter Bezugnahme auf Fig. 25 bis Fig. 27 erfolgt eine Erläuterung des Modulationsinkorporationsverfahrens (4).
Anders als die Modulationsinkorporationsverfahren (1) bis (3) fügt das Modulationsinkorporationsverfahren (4) eine Zufallszahlenzeitfolge zu dem Verzögerungsfilterverbinder erster Ordnung hinzu, der ein kritisch dämpfendes Filter zweiter Ordnung bildet, und erzeugt modulierte Interpolationsparameter.
Figur 25 zeigt ein kritisch dämpfendes Filter zweiter Ordnung 30B, das aus einer zweistufigen Seriellverbindung von Verzögerungsfiltern erster Ordnung besteht und denselben Aufbau wie das kritisch dämpfende Filter zweiter Ordnung 30B von Fig. 23 hat. Entsprechende Teile tragen entsprechende Bezugszeichen. Das heißt, 31a und 31b sind Integratoren, 323 und 324 sind Addierer, und 333 und 334 sind Multiplizierer mit Multiplikationskonstanten von -1. Bei diesem Aufbau werden, falls eine Zufallszahlenzeitfolge zu dem Addierer 324 hinzugefügt wird, der dem Verbinder der zwei Verzögerungsfilter erster Ordnung entspricht, modulierte Interpolationsparameter erzeugt.
Figur 26 zeigt die Stufenansprechkennlinien, die durch das Modulationsinkorporationsverfahren (4) von Fig. 25 erhalten wurden. Die Stufenveränderungen können gleitend interpoliert werden, wie in der Figur gezeigt, und es ist möglich, modulierte Interpolationsparameter zu erzeugen, die dem Modulationszeitfolgesignal entsprechen.
Figur 27 zeigt durch ein Blockdiagramm einen spezifischen Aufbau des Modulationsinkorporationsverfahrens (4). Der Aufbau des Sprachsynthesemittels 20D ist derselbe wie jener von Fig. 10, mit der Ausnahme, daß der Parameterinterpolator 211D des Sprachsynthetisators 21D durch das kritisch dämpfende Filter zweiter Ordnung 30B von Fig. 25 konstruiert ist. Die Operation des Modulationsinkorporationsverfahrens (4) von Fig. 27 geht aus Fig. 24 und der Erläuterung der Operation der verschiedenen Modulationsinkorporationsverfahren hervor, so wird die Erläuterung weggelassen.

(E) Integrationsaufbau

Wie aus der Erläuterung bis jetzt hervorgeht, nutzen das primäre Verzögerungsfilter und das kritisch dämpfende Filter zweiter Ordnung beide als bildende Elemente einen Integrator mit einer Übertragungsfunktion von 1/sτ (= ω/s). Deshalb würde eine Vereinfachung des Aufbaus dieses Integrators eine Vereinfachung des Aufbaus des primären Verzögerungsfilters und des kritisch dämpfenden Filters zweiter Ordnung gestatten.
Bei der vorliegenden Erfindung vereinfacht eine Approximation der digitalen Integration in dem Integrator durch das einfache Eulersche Integrationsverfahren den Aufbau des Integrators. Unten erfolgt eine Erläuterung des Integratorkonstruktionsverfahrens der vorliegenden Erfindung unter Bezugnahme auf Fig. 28.
In Fig. 28 ist Bezugszeichen 31 ein Integrator, der aus einem Register 311, Addierer 312 und Multiplizierer 313 besteht. Der Multiplizierer 313, Addierer 312 und das Register 311 sind seriell verbunden. Zu dem Wert des Registers 311 zu einem Zeitpunkt wird durch den Addierer 312 ein Eingabewert addiert und als Wert des Registers 311 zu dem nächsten Zeitpunkt verwendet. Für den Takt, der die Zeit regelt, wird von demselben Zeitlagentakt Gebrauch gemacht, wie er für die Erzeugung der Zufallszahlenzeitfolge verwendet wird. Der Multiplizierer 313 multipliziert den umgekehrten Wert der Zeitkonstante τ (1/τ = ω) mit der Eingabe und fügt das Resultat dem Addierer 312 hinzu. Falls eine Potenz von 2 als Wert der Zeitkonstante τ ausgewählt wird, dann ist es möglich, diese Multiplikation durch eine Verschiebung zu ersetzen. In diesem Fall ist der Betrag der Verschiebung immer konstant und kann so durch Verschieben der Verbindungsleitung realisiert werden. Es sind keine Addierschaltungen (Funktionskomponenten) erforderlich, und so kann die Schaltung vereinfacht werden.
Durch den obigen Aufbau wird eine Integrationsverarbeitung ausgeführt, die durch das Eulersche Integrationsverfahren approximiert ist, und ein Integrator kann durch einen einfachen Aufbau realisiert werden.

(F) Anderer Aufbau des Verzögerungsfilters erster Ordnung

Das primäre Verzögerungsfilter kann durch die Verwendung des zuvor unter (E) genannten Integrators als Integrator 31 des primären Verzögerungsfilters realisiert werden. Ferner ist es möglich, ein primäres Verzögerungsfilter mittels anderer Prinzipien zu konstruieren. Unten erfolgt eine Erläuterung von anderen Verfahren des Aufbaus von primären Verzögerungsfiltern unter Bezugnahme auf Fig. 29 und Fig. 30.
Ein typischer Sprachsynthetisator wird von Dr. Dennis H. Klatt in "Journal of the Acoustic Society of America", 67(3), März 1980, S. 971 bis 995 "Software for a cascade/parallel format synthesizer" beschrieben. Das Stimmtraktkennliniensimulationsfilter des Sprachsynthetisators verwendet, wie in Fig. 29 gezeigt, 17 Zweitordnungseinheitsfilter. Das Zweitordnungseinheitsfilter von Fig. 29 ist ein digitales Filter des unendlichen Zweitordnungsimpulscharakteristiktyps (IIR). In der Figur ist Bezugszeichen 35 (35a und 35b) ein Verzögerungselement mit einer Abtastperiode von T, 361 und 362 sind Addierer, 371, 372 und 373 sind Multiplizierer mit Konstanten A, B und C. Ein Signal Sa, bestehend aus der Eingabe, die mit der Konstante A durch den Multiplizierer 371 multipliziert wurde, wird dem Verzögerungselement 35a eingegeben, die Ausgabe des Verzögerungselementes 35a wird dem Verzögerungselement 35b eingegeben, und die Summe der drei Signale von Signal Sa, bestehend aus der Eingabe, die durch den Multiplizierer 371 mit der Konstante A multipliziert wurde, Signal Sb, bestehend aus der Ausgabe des Verzögerungselementes 35a, die durch den Multiplizierer 372 mit der Konstante B multipliziert wurde, und Signal Sc, bestehend aus der Ausgabe des Verzögerungselementes 35b, die durch den Multiplizierer 373 mit der Konstante C multipliziert wurde, wird ausgegeben. Die so gebildeten 17 Zweitordnungseinheitsfilter haben alle denselben Aufbau, aber die Multiplikationskonstanten A, B und C unterscheiden sich bei den individuellen Einheitsfiltern. Das heißt, indem den Multiplikationskonstanten A, B und C geeignete Werte verliehen werden, können die Zweitordnungseinheitsfilter Bandfilter oder Bandsperrfilter werden und es können verschiedene Mittenfrequenzen erhalten werden. Der Hauptteil des Sprachsynthetisators wird durch eine Auswahl von Filtern identischen Aufbaus realisiert, so besteht der Vorteil, wenn dieser softwaremäßig realisiert wird, daß eine einzelne Subroutine gemeinsam genutzt werden kann, und der Vorteil, wenn dieser hardwaremäßig realisiert wird, daß die Entwicklungskosten durch die Verwendung einer Anzahl von Schaltungen desselben Aufbaus und IC's desselben Aufbaus reduziert werden können.
Die Übertragungsfunktion H(z) und die Multiplikationskonstanten A, B und C in dem Fall der Verwendung des Zweitordnungseinheitsfilters von Fig. 29 als Bandfilter im obenstehenden Abschnitt sind durch die folgenden Gleichungen gegeben:
Hk(z) = A/(1 - BZ&supmin;¹ - CZ&supmin;²) ... (10)
C = -exp(-2π BW T) ... (11)
B = 2 exp(-π BW T)cos(2π f T) ... (12)
A = 1 - B - C ... (13)
wobei T: Abtastperiode
F: Resonanzfrequenz des Filters
BW: Frequenzbandbreite des Filters
Bei einem anderen Verfahren des Aufbaus eines Verzögerungsfilters erster Ordnung wurde festgestellt, daß durch Verwendung des obengenannten Zweitordnungseinheitsfilters ein Verzögerungsfilter erster Ordnung unter Verwendung eines oben bei (E) herausgefundenen Integrators konstruiert werden kann.
Wenn ein Verzögerungsfilter erster Ordnung unter Verwendung eines oben bei (E) gefundenen Integrators 31 konstruiert wird, ist das Resultat so wie in Fig. 30 gezeigt. In der Figur ist Bezugszeichen 32 ein Addierer und 33 ein Multiplizierer. Hier nimmt das Register 311 die Eingabe eines gewissen Zeitpunktes auf und gibt sie bei dem nächsten Zeitpunkt (das heißt, Abtastperiode) zur Wiedereingabe aus, und entspricht somit dem Verzögerungselement 35 (35a und 35b) des Zweitordnungseinheitsfilters von Fig. 21. Deshalb würde, falls die Übertragungsfunktion H&sub1;(z) des primären Verzögerungsfilters von Fig. 30 unter Verwendung derselben Zeichen wie die Übertragungsfunktion Hk(z) des Zweitordnungseinheitsfilters von Fig. 29 ausgedrückt wird, H&sub1;(z) durch die folgende Gleichung (14) ausgedrückt werden und könnte ferner zu Gleichung (15) verändert werden:
Ein Vergleich mit Hk(z) = A(1 - Bz&supmin;¹ - Cz&supmin;²) von Gleichung (10) ergibt folgende Gleichung (16):
A = 1/τ + 1, B = τ/τ + 1, C = 0 ... (16)
Unter Verwendung von A, B und C von Gleichung (16) ist es möglich, ein primäres Verzögerungsfilter durch ein Zweitordnungsfilter des IIR-Typs zu konstruieren.
Solch eine Konstruktion eines Verzögerungsfilters erster Ordnung kann nicht nur als Stimmtraktfilter eines Sprachsynthetisators verwendet werden, sondern auch als Filter erster Ordnung bei den zuvor genannten Modulationsverfahren und Konstruktionsverfahren des kritisch dämpfenden Filters zweiter Ordnung.

(G) Aufbau des kritisch dämpfenden Filters zweiter Ordnung

Das Konstruktionsverfahren des kritisch dämpfenden Filters zweiter Ordnung (3) konstruiert ein kritisch dämpfendes Filter zweiter Ordnung unter Verwendung des obengenannten Zweitordnungseinheitsfilters (IIR- Zweitordnungsfilter) und des Integrators von (E). Unten erfolgt eine Erläuterung des Verfahrens des Aufbaus (3) des kritisch dämpfenden Filters zweiter Ordnung unter Bezugnahme auf Fig. 31.
Das kritisch dämpfende Filter zweiter Ordnung ist durch die obengenannte Gleichung (9) und die zweistufige Seriellverbindung der Verzögerungsfilter erster Ordnung konstruiert, wie in Fig. 23 gezeigt.
Falls die Übertragungsfunktion Hc(s) des kritisch dämpfenden Filters zweiter Ordnung von Gleichung (9) unter Verwendung derselben Zeichen wie bei der Übertragungsfunktion Hk(z) des Zweitordnungsfilters, die in Gleichung (10) gezeigt ist, ausgedrückt wird (gezeigt durch H&sub2;(z)), wird Gleichung (17) erhalten:
Ein Vergleich von H&sub2;(z) von Gleichung (17) und von Hk(z) = A/(1 - Bz&supmin;¹ - Cz&supmin;²) von Gleichung (10) ergibt die folgende Gleichung (18):
Unter Verwendung von A, B und C von Gleichung (18) ist es möglich, ein kritisch dämpf endes Filter zweiter Ordnung 30c durch ein Zweitordnungsfilter des IIR-Typs zu konstruieren, wie in Fig. 31 gezeigt ist.
In dem kritisch dämpfenden Filter zweiter Ordnung 30c von Fig. 31 ist Bezugszeichen 311 (311a und 311b) ein Register und 325 und 326 sind Addierer. Bezugszeichen 335, 336 und 337 sind Multiplizierer zum Multiplizieren der Konstanten A, B und C von Gleichung (18).
Wie oben erläutert, werden gemäß den verschiedenen Aspekten der vorliegenden Erfindung die folgenden Effekte erreicht:
(a) Da durch das vollkommen digitale Verfahren eine Modulation verliehen wird, ist es möglich, Sprache mit stabilen Modulationskennlinien zu synthetisieren.
(b) Da der ausgegebenen Sprache auf der Grundlage eines Modulationszeitfolgesignals, das durch das Integrationsfilter einer Zufallszeitfolge erhalten wurde, eine Modulation verliehen wird, ist es möglich, Sprache sehr natürlich zu synthetisieren.
(c) Das kritisch dämpfende Filter zweiter Ordnung, das die Parameterinterpolation während der Sprachsynthese ausführt, kann unter Verwendung von digitalen Filtern sehr einfach konstruiert werden.
(d) Wenn ein kritisch dämpfendes Filter zweiter Ordnung verwendet wird, ist eine gleitende Verbindung von Parametern möglich, und so ist es zusammen mit Obigem (b) möglich, eine sehr natürliche synthetische Sprache zu erhalten.
Viele sehr unterschiedliche Ausführungsformen der vorliegenden Erfindung können konstruiert werden, ohne den Umfang der vorliegenden Erfindung zu verlassen, und die vorliegende Erfindung ist nicht auf die spezifischen, oben beschriebenen Ausführungsformen begrenzt, außer wie in den beigefügten Ansprüchen definiert.

Claims

1. Ein Sprachsynthesesystem mit:-

einem ersten Signalerzeugungsmittel (211, 212, 213) zum Erzeugen eines Impulsfolgesignals, das als Tonquelle für stimmhafte Töne dient; einem zweiten Signalerzeugungsmittel (211, 214, 215) zum Erzeugen eines Rauschsignals, das als Tonquelle für stimmlose Töne dient, und das ein Mittel (214) zum Erzeugen von Zufallsdaten hat;

einem Mittel (217) zum Auswählen eines des genannten Impulsfolgesignals oder Rauschsignals, ansprechend auf ein Auswahlsignal; und

einem Mittel (216) zum Empfangen eines Ausgabesignals von dem genannten Auswahlmittel (217) und zum Filtern des empfangenen Signals auf der Grundlage eines Stimmtraktsimulationsverfahrens;

gekennzeichnet durch:-

ein Filtermittel (12B), das mit dem genannten Zufallsdatenerzeugungsmittel (214) operativ verbunden ist, um die Zufallsdaten davon zu empfangen und zu filtern, und eine Verzögerungsübertragungsfunktion erster Ordnung H(s) : 1/(sτ + α) hat, wobei τ eine Zeitkonstante und α ein Koeffizient ist, zum Ausgeben von mit erster Ordnung verzögerten Zufallsdaten; und

bei dem das erste Signalerzeugungsmittel und das zweite Signalerzeugungsmittel ein gemeinsames Parameterinterpolationsmittel (211) umfassen, zum Empfangen eines ersten Signals (Fs), das die Grundfrequenz des stimmhaften Tons aufweist, eines zweiten Signals (As), das die Amplitude der stimmhaften Tonquelle aufweist, und eines dritten Signals (AN), das die Amplitude der stimmlosen Tonquelle aufweist, und zum Interpolieren der empfangenen ersten bis dritten Signale, um erste bis dritte interpolierte Signale (F's, A's, A'N) auszugeben;

bei dem das erste Signalerzeugungsmittel ein Mittel (212) zum Erzeugen eines Impulsfolgesignals umfaßt, das durch das erste interpolierte Signal (F's) frequenzgesteuert wird, und ein Mittel (213) zum Multiplizieren des Impulsfolgesignals mit dem zweiten interpolierten Signal (A's), um dem Auswahlmittel ein erstes multipliziertes Signal zuzuführen,

bei dem das zweite Signalerzeugungsmittel ferner ein Mittel (215) umfaßt zum Multiplizieren der Zufallsdaten darin, die von dem zufallsdatenerzeugungsmittel (214) ausgegeben wurden, mit dem dritten interpolierten Signal (A'N), um dem Auswahlmittel ein zweites multipliziertes Signal zuzuführen; und

bei dem das Sprachsynthesesystem ein Mittel (22) zum Addieren einer Konstante als systematische Abweichung zu den mit erster Ordnung verzögerten Zufallsdaten von dem Verzögerungsmittel erster Ordnung (12B) umfaßt, und ein Mittel (23) zum Multiplizieren eines addierten Signals von dem Addiermittel mit der Ausgabe von dem Stimmtraktsimulationsfiltermittel (216), um ein Sprachsignal auszugeben.

2. Ein Sprachsynthesesystem mit:-

einem ersten Signalerzeugungsmittel (211, 212, 213, 24, 25) zum Erzeugen eines Impulsfolgesignals, das als Tonquelle für stimmhafte Töne dient; einem zweiten Signalerzeugungsmittel (211, 214, 215, 26) zum Erzeugen eines Rauschsignals, das als Tonquelle für stimmlose Töne dient, und das ein Mittel (214) zum Erzeugen von Zufallsdaten hat;

gekennzeichnet durch:-

ein Filtermittel (12B), das mit dem genannten Zufallsdatenerzeugungsmittel (214) operativ verbunden ist, um die Zufallsdaten davon zu empfangen und zu filtern, und eine Verzögerungsübertragungsfunktion erster Ordnung H(s) : 1/(sτ + α) hat, wobei τ eine Zeitkonstante und α ein Koeffizient ist, zum Ausgeben von mit erster Ordnung verzögerten Zufallsdaten; und durch

ein Mittel (22) zum Addieren einer Konstante als systematische Abweichung zu den mit erster Ordnung verzögerten Zufallsdaten von dem Verzögerungsmittel erster Ordnung (12B);

bei dem das erste Signalerzeugungsmittel ferner ein erstes Multiplikationsmittel (24) umfaßt, das das erste interpolierte Signal (F's) mit dem addierten Signal von dem Addiermittel (22) multipliziert, ein Mittel (212) zum Erzeugen eines Impulsfolgesignals, das durch das multiplizierte Signal von dem ersten Multiplikationsmittel (24) frequenzgesteuert wird, ein zweites Multiplikationsmittel (25) zum Multiplizieren des zweiten interpolierten Signals (A's) mit dem addierten Signal von dem Addiermittel (22) und ein drittes Multiplikationsmittel (213) zum Multiplizieren des Impulsfolgesignals mit dem zweiten multiplizierten Signal von dem zweiten Multiplikationsmittel (25), um dem Auswahlmittel (217) das multiplizierte Signal zuzuführen; und

bei dem das zweite Signalerzeugungsmittel ferner ein viertes Multiplikationsmittel (26) zum Multiplizieren des addierten Signals von dem Addiermittel (22) mit dem dritten interpolierten Signal (A'N) umfaßt, und ein fünftes Multiplikationsmittel (215) zum Multiplizieren des Zufallsdatensignals von dem Zufallsdatenerzeugungsmittel (214) darin mit dem fünften multiplizierten Signal von dem fünften Multiplikationsmittel (26), um dem Auswahlmittel (217) das fünfte multiplizierte Signal zuzuführen.

3. Ein Sprachsynthesesystem mit:-

einem ersten Signalerzeugungsmittel (211, 212, 213, 27, 28) zum Erzeugen eines Impulsfolgesignals, das als Tonquelle für stimmhafte Töne dient; einem zweiten Signalerzeugungsmittel (211, 214, 215, 29) zum Erzeugen eines Rauschsignals, das als Tonquelle für stimmlose Töne dient, und das ein Mittel (214) zum Erzeugen von Zufallsdaten hat;

gekennzeichnet durch:-

ein Filtermittel (12B), das mit dem genannten Zufallsdatenerzeugungsmittel (214) operativ verbunden ist, um die Zufallsdaten davon zu empfangen und zu filtern, und eine Verzögerungsübertragungsfunktion erster Ordnung H(s) : 1/(sτ + α) hat, wobei τ eine Zeitkonstante und α ein Koeffizient ist, zum Ausgeben von mit erster Ordnung verzögerten Zufallsdaten; und dadurch, daß

das erste Signalerzeugungsmittel und das zweite Signalerzeugungsmittel ein gemeinsames Parameterinterpolationsmittel (211) umfassen, zum Empfangen eines ersten Signals (Fs), das die Grundfrequenz des stimmhaften Tons aufweist, eines zweiten Signals (As), das die Amplitude der stimmhaften Tonquelle aufweist, und eines dritten Signals (AN), das die Amplitude der stimmlosen Tonquelle aufweist, und zum Interpolieren der empfangenen ersten bis dritten Signale, um erste bis dritte interpolierte Signale (F's, A's, A'N) auszugeben;

das erste Signalerzeugungsmittel ferner ein erstes Addiermittel (27) zum Addieren des ersten interpolierten Signals (F's) zu dem mit erster Ordnung verzögerten Signal von dem Verzögerungsmittel erster Ordnung umfaßt, ein Mittel (212) zum Erzeugen eines Impulsfolgesignals, das durch das erste addierte Signal von dem ersten Addiermittel (27) frequenzgesteuert wird, ein zweites Addiermittel (28) zum Addieren des zweiten interpolierten Signals (A's) zu dem mit erster Ordnung verzögerten Signal und ein erstes Multiplikationsmittel (213) zum Multiplizieren des Impulsfolgesignals mit dem zweiten addierten Signal von dem zweiten Addiermittel (28), um an das Auswahlmittel das erste multiplizierte Signal auszugeben; und daß

das zweite Signalerzeugungsmittel ferner ein drittes Addiermittel (29) zum Addieren des dritten interpolierten Signals (A'N) zu dem mit erster Ordnung verzögerten Signal umfaßt, und ein zweites Multiplikationsmittel (215) zum Multiplizieren der Zufallsdaten von dem Zufallsdatenerzeugungsmittel (214) darin mit dem dritten addierten Signal von dem dritten Addiermittel (29), um an das Auswahlmittel (217) das zweite multiplizierte Signal auszugeben.

4. Ein Sprachsynthesemittel nach Anspruch 1, 2 oder 3, bei dem das Verzögerungsmittel erster Ordnung (12B) ein Addiermittel (122) umfaßt, ein integrales Mittel (31), das mit dem Addiermittel verbunden ist, um eine Ausgabe von dem Addiermittel zu empfangen, und ein Gegenkopplungsmittel (123), das zwischen einem Ausgangsanschluß des integralen Mittels und einem Eingangsanschluß des Addiermittels vorgesehen ist, zum Multiplizieren der Ausgabe von dem integralen Mittel mit dem Koeffizienten α und zum Invertieren eines Vorzeichens des multiplizierten Wertes, wobei das Addiermittel die Zufallsdaten von dem Zufallsdatenerzeugungsmittel (214) zu dem invertiert-multiplizierten Wert von dem Gegenkopplungsmittel addiert.

5. Ein Sprachsynthesemittel nach Anspruch 4, bei dem das integrale Mittel (31) des Verzögerungsmittels erster Ordnung (12B) ein Multiplikationsmittel (313) umfaßt, ein Addiermittel (312), ein Datenhaltemittel (311) und ein Rückkopplungsleitungsmittel, das zwischen einem Ausgangsanschluß des Datenhaltemittels und einem Eingangsanschluß des Addiermittels vorgesehen ist;

wobei das Multiplikationsmittel (313) die Ausgabe von dem Addiermittel (122) des Verzögerungsmittels erster Ordnung mit einem Faktor von 1/τ multipliziert; und

das Addiermittel (312) in dem integralen Mittel die Ausgabe von dem Multiplikationsmittel (313) zu der Ausgabe von dem Datenhaltemittel (311) durch das Rückkopplungsleitungsmittel addiert.

6. Ein Sprachsynthesesystem nach irgendeinem vorhergehenden Anspruch, bei dem der Koeffizient α eins ist.

7. Ein Sprachsynthesesystem nach irgendeinem vorhergehenden Anspruch, bei dem das gemeinsame Parameterinterpolationsmittel (211) ein lineares Interpolationsmittel ist.

8. Ein Sprachsynthesesystem nach irgendeinem der Ansprüche 1 bis 6, bei dem das gemeinsame Parameterinterpolationsmittel (211) ein erstes Datenhaltemittel (301), ein kritisch dämpfendes Filtermittel zweiter Ordnung (305) und ein zweites Datenhaltemittel (302) umfaßt, die seriell verbunden sind.

9. Ein Sprachsynthesesystem nach Anspruch 8, bei dem das kritisch dämpfende Filtermittel zweiter Ordnung (30S) erste und zweite seriell verbundene Addiermittel (321, 322) umfaßt, seriell verbundene erste und zweite integrale Mittel (31a, 31b), ein erstes Multiplikationsmittel (331), das zwischen einem Ausgangsanschluß des ersten integralen Mittels (31a) und einem Eingangsanschluß des zweiten Addiermittels (322) vorgesehen ist, zum Multiplizieren der Ausgabe des ersten integralen Mittels mit einem Dämpfungsfaktor DF und zum Invertieren eines Vorzeichens des multiplizierten Wertes, und ein zweites Multiplikationsmittel (332), das zwischen einem Ausgangsanschluß des zweiten integralen Mittels (31b) und einem Eingangsanschluß des ersten Addiermittels (321) vorgesehen ist, zum Multiplizieren einer Ausgabe von dem zweiten integralen Mittel (31b) mit einem Koeffizienten, und zum Invertieren eines Vorzeichens des multiplizierten Wertes,

wobei das erste Addiermittel (321) eine Ausgabe von dem ersten Datenhaltemittel (301) des gemeinsamen Parameterinterpolationsmittels (211) zu dem invertiert multiplizierten Wert von dem zweiten Multiplikationsmittel (322) addiert; und

das zweite Addiermittel (322) eine Ausgabe von dem ersten Addiermittel (321) zu dem invertiert multiplizierten Wert von dem ersten Multiplikationsmittel (331) addiert.

10. Ein Sprachsynthesesystem nach Anspruch 9, bei dem jedes der ersten und zweiten integralen Mittel (31a, 31b) Multiplikationsmittel (313a, 313b), Addiermittel (312a, 312b), Datenhaltemittel (311a, 311b) und eine Rückkopplungsleitung umfaßt, die zwischen einem Ausgangsanschluß der Datenhaltemittel (311a, 311b) und einem Eingangsanschluß der Addiermittel (312a, 312b) vorgesehen ist;

wobei die Multiplikationsmittel (313a, 313b) die Eingabe mit dem Faktor 1/τ multiplizieren und die Addiermittel (312a, 312b) die Ausgabe von den Multiplikationsmitteln (313a, 313b) zu der Ausgabe von den Datenhaltemitteln (311a, 311b), die über die Rückkopplungsleitung empfangen wurde, addieren.

11. Ein Sprachsynthesesystem nach Anspruch 10, bei dem der Dämpfungsfaktor DF zwei und der Koeffizient, der in dem zweiten Multiplikationsmittel (332) verwendet wird, eins ist.

12. Ein Sprachsynthesesystem nach Anspruch 8, bei dem das kritisch dämpfende Filter zweiter Ordnung (30S) seriell verbundene erste und zweite Verzögerungsmittel erster Ordnung umfaßt, wovon jedes Addiermittel (323, 324) enthält, integrale Mittel (31a, 31b) und Multiplikationsmittel (333, 334), die zwischen einem Ausgangsanschluß der integralen Mittel (31a, 31b) und einem Eingangsanschluß der Addiermittel (323, 324) vorgesehen sind, zum Multiplizieren einer Ausgabe der integralen Mittel (31a, 31b) mit einem Koeffizienten und zum Invertieren derselben;

wobei die Addiermittel (323, 324) eine Eingabe zu dem invertiert multiplizierten Wert von den Multiplikationsmitteln (333, 334) addieren und einen addierten Wert den integralen Mitteln (31a, 31b) zuführen.

13. Ein Sprachsynthesesystem nach Anspruch 12, bei dem die integralen Mittel (31a, 31b) Multiplikationsmittel, Addiermittel, Datenhaltemittel und eine Rückkopplungsleitung umfassen, die zwischen einem Ausgangsanschluß der Datenhaltemittel und einem Eingangsanschluß der Addiermittel vorgesehen ist;

wobei die Multiplikationsmittel die Eingabe mit dem Faktor 1/τ multiplizieren und die Addiermittel eine Ausgabe von den Multiplikationsmitteln zu der Ausgabe von den Datenhaltemitteln, die über die Rückkopplungsleitung erhalten wurde, addieren.

14. Ein Sprachsynthesesystem nach Anspruch 12 oder 13, bei dem der Koeffizient, der in den genannten Multiplikationsmitteln (333, 334) verwendet wird, eins ist.