DE3883034T2 - System zur Sprachsynthese. - Google Patents
System zur Sprachsynthese.Info
- Publication number
- DE3883034T2 DE3883034T2 DE88302313T DE3883034T DE3883034T2 DE 3883034 T2 DE3883034 T2 DE 3883034T2 DE 88302313 T DE88302313 T DE 88302313T DE 3883034 T DE3883034 T DE 3883034T DE 3883034 T2 DE3883034 T2 DE 3883034T2
- Authority
- DE
- Germany
- Prior art keywords
- signal
- output
- multiplying
- generating
- random data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 230000015572 biosynthetic process Effects 0.000 title claims description 52
- 238000003786 synthesis reaction Methods 0.000 title claims description 52
- 238000000034 method Methods 0.000 claims abstract description 85
- 230000001755 vocal effect Effects 0.000 claims abstract description 20
- 230000004044 response Effects 0.000 claims abstract description 19
- 230000003111 delayed effect Effects 0.000 claims abstract description 18
- 238000001914 filtration Methods 0.000 claims abstract description 17
- 238000004088 simulation Methods 0.000 claims abstract description 17
- 238000013016 damping Methods 0.000 claims description 69
- 238000012546 transfer Methods 0.000 claims description 39
- 230000002194 synthesizing effect Effects 0.000 abstract description 6
- 230000006870 function Effects 0.000 description 38
- 238000010348 incorporation Methods 0.000 description 33
- 238000010586 diagram Methods 0.000 description 25
- 238000010276 construction Methods 0.000 description 13
- 230000010354 integration Effects 0.000 description 13
- 230000008859 change Effects 0.000 description 11
- 238000001228 spectrum Methods 0.000 description 10
- 238000013461 design Methods 0.000 description 6
- 238000005070 sampling Methods 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 230000003595 spectral effect Effects 0.000 description 3
- 230000009897 systematic effect Effects 0.000 description 3
- 239000000470 constituent Substances 0.000 description 2
- 230000032683 aging Effects 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000012938 design process Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 230000010355 oscillation Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000001308 synthesis method Methods 0.000 description 1
- 210000003437 trachea Anatomy 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/08—Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Electrophonic Musical Instruments (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Complex Calculations (AREA)
Description
- Die vorliegende Erfindung bezieht sich auf ein systematisches Sprachsynthesesystem, das zum Beispiel als Vorrichtungen zum Ausgeben von Tastatureingabesätzen als Sprache, um die Tastatureingabe zu bestätigen, Schreibmaschinen für Blinde und Sprachantwortmaschinen unter Verwendung von Telefonen verwendet werden kann.
- Bei der Sprachsynthese sollte der Ausgabeklang oder Ausgabeton der menschlichen Stimme so nahe wie möglich kommen, d. h., einer Sprache, die so natürlich wie möglich ist. Ein Typ der Sprachsynthese ist die systematische Sprachsynthese. Bei solch einer Sprachsynthese wird die Sprache unter Verwendung von Impulsen für Vokale und von Zufallszahlen für Konsonanten synthetisiert. Bei der menschlichen Sprache wird jedoch die Stimme moduliert, d. h., die Stimme schwankt. Wenn zum Beispiel der Vokal "ah" zu "ahhh" gedehnt wird, bleiben die Amplitude der Sprachwellenform, die Tonhöhe, die Frequenz, etc., nicht vollkommen konstant, sondern werden moduliert (oder schwanken). Selbst wenn zu einem anderen Ton gewechselt wird, unterliegen die Amplitude, die Tonhöhe, etc. keiner gleitenden Veränderung, sondern werden moduliert. Aus diesem Grund kann, wenn Sprache synthetisiert wird, falls die Amplitude, die Tonhöhe und andere Parameter an den beständigen Abschnitten der Sprache konstantgehalten werden und die Amplitude, die Tonhöhe und andere Parameter an den unbeständigen Abschnitten gleitend verändert werden, nur eine mechanische, monotone Sprache erhalten werden. Deshalb sind bei vorher vorgeschlagenen Systemen Versuche unternommen worden, die Ausgabe von Sprachsynthetisatoren zu modulieren, um eine sehr natürliche synthetische Sprache zu erzeugen.
- Andererseits erfolgt beim Synthetisieren von Sprache eine Umsetzung von der Eingabe von Sätzen T Umsetzung in Tonkodes T Vorbereitung von Syntheseparametern T Ausgabe von Sprache. Wenn Sprache für einen beliebigen Satz synthetisiert wird, werden die Parameter gemäß vorbestimmter Regeln verknüpft, wobei sie mit jeder Syntheseeinheit funktionieren, die kleiner als ein einzelner Satz ist, zum Beispiel Sprachelemente oder -silben, um eine Zeitfolge von Parametern zu bilden. Falls eine geeignete Verknüpfung in diesem Fall nicht ausgeführt wird, tritt in der synthetischen Sprache ein Rauschen auf und die natürliche Eigenschaft der synthetischen Sprache geht verloren. Deshalb müssen die Parameter der individuellen Sprachsyntheseeinheiten gleitend geändert werden, wie bei der tatsächlichen Sprache, und somit wird ein Verfahren für eine Interpolation von Parametern vorgeschlagen.
- Alle vorher vorgeschlagenen Systeme leiden jedoch unter dem Problem, daß eine stabile, sehr natürliche, modulierte Sprachsynthese nicht erreicht werden kann. Beispiele von solch vorher vorgeschlagenen Systemen werden unter Bezugnahme auf die beiliegenden Zeichnungen eingehender erläutert.
- Demzufolge ist es wünschenswert, eine Sprachsynthese vorrichtung vorzusehen, die in der Lage ist, eine stabile, sehr natürliche, modulierte Sprache auszugeben.
- Es ist auch wünschenswert, eine Sprachsynthesevorrichtung mit einfachem Aufbau vorzusehen.
- Ferner bedarf der Aufbau von Filtern, die für die Sprachsynthese verwendet werden, einer Vereinfachung.
- DE-A-3 314 674 offenbart ein Sprachsynthesesystem gemäß der Präambel von jedem der beiliegenden unabhängigen Ansprüche. Natürlichklingende Sprache wird erzeugt, indem die Sprachtonhöhe unabhängig von den Formantfrequenzen verändert wird, zum Beispiel unter Verwendung von gespeicherten Tabellen von Tonhöhenwerten als Funktion der Zeit.
- Gemäß einem ersten Aspekt der vorliegenden Erfindung ist ein Sprachsynthesesystem vorgesehen, das umfaßt:-
- ein erstes Signalerzeugungsmittel, das ein Impulsfolgesignal erzeugt, das als Tonquelle für stimmhafte Töne dient; ein zweites Signalerzeugungsmittel zum Erzeugen eines Rauschsignals, das als Tonquelle für stimmlose Töne dient, und das ein Mittel zum Erzeugen von Zufallsdaten hat;
- ein Mittel zum Auswählen eines des genannten Impulsfolgesignals oder Rauschsignals, ansprechend auf ein Auswahlsignal; und
- ein Mittel zum Empfangen eines Ausgabesignals von dem genannten Auswahlmittel und zum Filtern des empfangenen Signals auf der Grundlage eines Stimmtraktsimulationsverfahrens;
- gekennzeichnet durch:-
- ein Filtermittel, das mit dem genannten Zufallsdatenerzeugungsmittel operativ verbunden ist, um die Zufallsdaten davon zu empfangen und zu filtern, und eine Verzögerungsübertragungsfunktion erster Ordnung H(s) : 1/(sτ + α) hat, wobei τ eine Zeitkonstante und α ein Koeffizient ist, zum Ausgeben von mit erster Ordnung verzögerten Zufallsdaten; und
- bei dem das erste Signalerzeugungsmittel und das zweite Signalerzeugungsmittel ein gemeinsames Parameterinterpolationsmittel umfassen, zum Empfangen eines ersten Signals, das die Grundfrequenz des stimmhaften Tons aufweist, eines zweiten Signals, das die Amplitude der stimmhaften Tonquelle aufweist, und eines dritten Signals, das die Amplitude der stimmlosen Tonquelle aufweist, und zum Interpolieren der empfangenen ersten bis dritten Signale, um erste bis dritte interpolierte Signale auszugeben;
- bei dem das erste Signalerzeugungsmittel ein Mittel zum Erzeugen eines Impulsfolgesignals umfaßt, das durch das erste interpolierte Signal frequenzgesteuert wird, und ein Mittel zum Multiplizieren des Impulsfolgesignals mit dem zweiten interpolierten Signal, um dem Auswahlmittel ein erstes multipliziertes Signal zuzuführen,
- bei dem das zweite Signalerzeugungsmittel ferner ein Mittel umfaßt zum Multiplizieren der Zufallsdaten darin, die von dem Zufallsdatenerzeugungsmittel ausgegeben wurden, mit dem dritten interpolierten Signal, um dem Auswahlmittel ein zweites multipliziertes Signal zuzuführen; und
- bei dem das Sprachsynthesesystem ein Mittel zum Addieren einer Konstante als systematische Abweichung zu den mit erster Ordnung verzögerten Zufallsdaten von dem Verzögerungsmittel erster Ordnung umfaßt, und ein Mittel zum Multiplizieren eines addierten Signals von dem Addiermittel mit der Ausgabe von dem Stimmtraktsimulationsfiltermittel, um ein Sprachsignal auszugeben.
- Gemäß einem zweiten Aspekt der vorliegenden Erfindung ist auch ein Sprachsynthesesystem vorgesehen, das umfaßt:-
- ein erstes Signalerzeugungsmittel zum Erzeugen eines Impulsfolgesignals, das als Tonquelle für stimmhafte Töne dient; ein zweites Signalerzeugungsmittel zum Erzeugen eines Rauschsignals, das als Tonquelle für stimmlose Töne dient, und das ein Mittel zum Erzeugen von Zufallsdaten hat;
- ein Mittel zum Auswählen eines des genannten Impulsfolgesignals oder Rauschsignals, ansprechend auf ein Auswahlsignal; und
- ein Mittel zum Empfangen eines Ausgabesignals von dem genannten Auswahlmittel und zum Filtern des empfangenen Signals auf der Grundlage eines Stimmtraktsimulationsverfahrens;
- gekennzeichnet durch:-
- ein Filtermittel, das mit dem genannten Zufallsdatenerzeugungsmittel operativ verbunden ist, um die Zufallsdaten davon zu empfangen und zu filtern, und eine Verzögerungsübertragungsfunktion erster Ordnung H(s) : 1/(sτ + α) hat, wobei τ eine Zeitkonstante und α ein Koeffizient ist, zum Ausgeben von mit erster Ordnung verzögerten Zufallsdaten; und durch
- ein Mittel zum Addieren einer Konstante als systematische Abweichung zu den mit erster Ordnung verzögerten Zufallsdaten von dem Verzögerungsmittel erster Ordnung;
- bei dem das erste Signalerzeugungsmittel und das zweite Signalerzeugungsmittel ein gemeinsames Parameterinterpolationsmittel umfassen, zum Empfangen eines ersten Signals, das die Grundfrequenz des stimmhaften Tons aufweist, eines zweiten Signals, das die Amplitude der stimmhaften Tonquelle aufweist, und eines dritten Signals, das die Amplitude der stimmlosen Tonquelle aufweist, und zum Interpolieren der empfangenen ersten bis dritten Signale, um erste bis dritte interpolierte Signale auszugeben;
- bei dem das erste Signalerzeugungsmittel ferner ein erstes Multiplikationsmittel umfaßt, das das erste interpolierte Signal mit dem addierten Signal von dem Addiermittel multipliziert, ein Mittel zum Erzeugen eines Impulsfolgesignals, das durch das multiplizierte Signal von dem ersten Multiplikationsmittel frequenzgesteuert wird, ein zweites Multiplikationsmittel zum Multiplizieren des zweiten interpolierten Signals mit dem addierten Signal von dem Addiermittel, und ein drittes Multiplikationsmittel zum Multiplizieren des Impulsfolgesignals mit dem zweiten multiplizierten Signal von dem zweiten Multiplikationsmittel, um dem Auswahlmittel das multiplizierte Signal zuzuführen; und
- bei dem das zweite Signalerzeugungsmittel ferner ein viertes Multiplikationsmittel zum Multiplizieren des addierten Signals von dem Addiermittel mit dem dritten interpolierten Signals umfaßt, und ein fünftes Multiplikationsmittel zum Multiplizieren des Zufallsdatensignals von dem Zufallsdatenerzeugungsmittel darin mit dem fünften multiplizierten Signal von dem fünften Multiplikationsmittel, um dem Auswahlmittel das fünfte multiplizierte Signal zuzuführen.
- Gemäß einem dritten Aspekt der vorliegenden Erfindung ist auch ein Sprachsynthesesystem vorgesehen, das umfaßt:-
- ein erstes Signalerzeugungsmittel zum Erzeugen eines Impulsfolgesignals, das als Tonquelle für stimmhafte Töne dient; ein zweites Signalerzeugungsmittel zum Erzeugen eines Rauschsignals, das als Tonquelle für stimmlose Töne dient, und das ein Mittel zum Erzeugen von Zufallsdaten hat;
- ein Mittel zum Auswählen eines des genannten Impulsfolgesignals oder Rauschsignals, ansprechend auf ein Auswahlsignal; und
- ein Mittel zum Empfangen eines Ausgabesignals von dem genannten Auswahlmittel und zum Filtern des empfangenen Signals auf der Grundlage eines Stimmtraktsimulationsverfahrens;
- gekennzeichnet durch:-
- ein Filtermittel, das mit dem genannten Zufallsdatenerzeugungsmittel operativ verbunden ist, um die Zufallsdaten davon zu empfangen und zu filtern, und eine Verzögerungsübertragungsfunktion erster Ordnung H(s) : 1/(sτ + α) hat, wobei τ eine Zeitkonstante und α ein Koeffizient ist, zum Ausgeben von mit erster Ordnung verzögerten Zufallsdaten; und dadurch, daß
- das erste Signalerzeugungsmittel und das zweite Signalerzeugungsmittel ein gemeinsames Parameterinterpolationsmittel umfassen, zum Empfangen eines ersten Signals, das die Grundfrequenz des stimmhaften Tons aufweist, eines zweiten Signals, das die Amplitude der stimmhaften Tonquelle aufweist, und eines dritten Signals, das die Amplitude der stimmlosen Tonquelle aufweist, und zum Interpolieren der empfangenen ersten bis dritten Signale, um erste bis dritte interpolierte Signale auszugeben;
- das erste Signalerzeugungsmittel ferner ein erstes Addiermittel zum Addieren des ersten interpolierten Signals zu dem mit erster Ordnung verzögerten Signal von dem Verzögerungsmittel erster Ordnung umfaßt, ein Mittel zum Erzeugen eines Impulsfolgesignals, das durch das erste addierte Signal von dem ersten Addiermittel frequenzgesteuert wird, ein zweites Addiermittel zum Addieren des zweiten interpolierten Signals zu dem mit erster Ordnung verzögerten Signal und ein erstes Multiplikationsmittel zum Multiplizieren des Impulsfolgesignals mit dem zweiten addierten Signal von dem zweiten Addiermittel, um an das Auswahlmittel das erste multiplizierte Signal aus zugeben; und daß
- das zweite Signalerzeugungsmittel ferner ein drittes Addiermittel zum Addieren des dritten interpolierten Signals zu dem mit erster Ordnung verzögerten Signal umfaßt, und ein zweites Multiplikationsmittel zum Multiplizieren der Zufallsdaten von dem Zufallsdatenerzeugungsmittel darin mit dem dritten addierten Signal von dem dritten Addiermittel, um an das Auswahlmittel das zweite multiplizierte Signal aus zugeben.
- Die Verzögerungseinheit erster Ordnung kann eine Addiereinheit enthalten, eine integrale Einheit, die mit der Addiereinheit verbunden ist, um eine Ausgabe von der Addiereinheit zu empfangen, und ein Gegenkopplungsmittel, das zwischen einem Ausgangsanschluß der integralen Einheit und einem Eingangsanschluß der Addiereinheit vorgesehen ist, zum Multiplizieren der Ausgabe von der integralen Einheit mit einem Koeffizienten α und zum Invertieren des Vorzeichens des multiplizierten Wertes. Die Addiereinheit addiert die Zufallsdaten von der Zufallsdatenerzeugungseinheit zu dem invertiert-multiplizierten Wert von dem Gegenkopplungsmittel.
- Die integrale Einheit der Verzögerungseinheit erster Ordnung kann eine Multiplikationseinheit enthalten, eine Addiereinheit, eine Datenhalteeinheit und eine Rückkopplungsleitung, die zwischen einem Ausgangsanschluß der Datenhalteeinheit und einem Eingangsanschluß der Addiereinheit vorgesehen ist. Die Multiplikationseinheit multipliziert die Ausgabe von der Addiereinheit der Verzögerungseinheit erster Ordnung mit dem Faktor 1/τ. Die Addiereinheit in der integralen Einheit addiert die Ausgabe von der Multiplikationseinheit zu der Ausgabe von der Datenhalteeinheit durch die Rückkopplungsleitung.
- Der Koeffizient α kann eins sein.
- Die gemeinsame Parameterinterpolationseinheit kann eine lineare Interpolationseinheit sein, oder sie kann eine erste Datenhalteeinheit, eine aperiodisch oder kritisch dämpfende Filtereinheit zweiter Ordnung und eine zweite Datenhalteeinheit enthalten, die seriell verbunden sind.
- Die kritisch dämpfende Filtereinheit zweiter Ordnung kann seriell verbundene erste und zweite Addiereinheiten enthalten, seriell verbundene erste und zweite integrale Einheiten, eine erste Multiplikationseinheit, die zwischen einem Ausgangsanschluß der ersten integralen Einheit und einem Eingangsanschluß der zweiten Addiereinheit vorgesehen ist, zum Multiplizieren der Ausgabe der ersten integralen Einheit mit einem Dämpfungsfaktor DF und zum Invertieren eines Vorzeichens des multiplizierten Wertes, und eine zweite Multiplikationseinheit, die zwischen einem Ausgangsanschluß der zweiten integralen Einheit und einem Eingangsanschluß der ersten Addiereinheit vorgesehen ist, zum Multiplizieren einer Ausgabe von der zweiten integralen Einheit mit einem Koeffizienten und zum Invertieren eines Vorzeichens des multiplizierten Wertes. Die erste Addiereinheit addiert eine Ausgabe von der ersten Datenhalteeinheit in der gemeinsamen Parameterinterpolationseinheit zu dem invertiert multiplizierten Wert von der zweiten Multiplikationseinheit. Die zweite Addiereinheit addiert eine Ausgabe von der ersten Addiereinheit zu dem invertiert multiplizierten Wert von der ersten Multiplikationseinheit.
- Jede der ersten und zweiten integralen Einheiten kann eine Multiplikationseinheit, eine Addiereinheit, eine Datenhalteeinheit und eine Rückkopplungsleitung enthalten, die zwischen einem Ausgangsanschluß der Datenhalteeinheit und einem Eingangsanschluß der Addiereinheit vorgesehen ist. Die Multiplikationseinheit multipliziert die Eingabe mit dem Faktor 1/τ. Die Addiereinheit addiert die Ausgabe von der Multiplikationseinheit zu der Ausgabe von der Datenhalteeinheit, die über die Rückkopplungsleitung empfangen wurde.
- Der Dämpfungsfaktor DF, der bei der ersten Multiplikationseinheit verwendet wird, kann zwei sein, und der Koeffizient, der bei der zweiten Multiplikationseinheit verwendet wird, kann eins sein.
- Die kritisch oder aperiodisch dämpfende Filtereinheit zweiter Ordnung kann seriell verbundene erste und zweite Verzögerungseinheiten erster Ordnung enthalten, die jeweils eine Addiereinheit enthalten, eine integrale Einheit und eine Multiplikationseinheit, die zwischen einem Ausgangsanschluß der integralen Einheit und einem Eingangsanschluß der Addiereinheit vorgesehen ist, zum Multiplizieren einer Ausgabe der integralen Einheit mit einem Koeffizienten und zum Invertieren derselben. Die Addiereinheit addiert eine Eingabe zu dem invertiert-multiplizierten Wert von der Multiplikationseinheit und führt der integralen Einheit einen addierten Wert zu.
- Die integrale Einheit kann eine Multiplikationseinheit, eine Addiereinheit, eine Datenhalteeinheit und eine Rückkopplungsleitung enthalten, die zwischen einem Ausgangsanschluß der Datenhalteeinheit und einem Eingangsanschluß der Addiereinheit vorgesehen ist. Das Multiplikationsmittel multipliziert die Eingabe mit dem Faktor 1/τ. Die Addiereinheit addiert eine Ausgabe von der Addiereinheit zu der Ausgabe von der Datenhalteeinheit, die über die Rückkopplungsleitung empfangen wurde.
- Als Beispiel wird Bezug auf die beiliegenden Zeichnungen genommen, in denen:-
- Fig. 1 ein Blockdiagramm einer vorher vorgeschlagenen Synthesevorrichtung für modulierte Sprache ist;
- Fig. 2 ein Blockdiagramm einer anderen vorher vorgeschlagenen Synthesevorrichtung für modulierte Sprache ist;
- Fig. 3 ein Diagramm zum Erläutern eines vorher vorgeschlagenen linearen Interpolationsverfahrens von Parametern bei der Sprachsynthese ist;
- Fig. 4 ein Diagramm zum Erläutern von Ausgabekennlinien solch eines Parameterinterpolationsverfahrens unter Verwendung eines vorher vorgeschlagenen kritisch dämpfenden Filters zweiter Ordnung ist;
- Fig. 5 ein Blockdiagramm solch eines kritisch dämpfenden Filters zweiter Ordnung ist;
- Fig. 6 ein Diagramm zum Erläutern eines vorher vorgeschlagenen Verfahrens zum Erzeugen einer Modulation ist;
- Fig. 7 eine grafische Darstellung der Spektralkennlinien eines Modulationszeitfolgesignals ist, das durch das Modulationsverfahren von Fig. 6 erzeugt wurde;
- Fig. 8 ein Wellenformendiagramm eines herkömmlichen Zufallsdatensignals ist;
- Fig. 9 ein Wellenformendiagramm eines Modulationszeitfolgesignals ist, das durch das vorher vorgeschlagene Modulationsverfahren erzeugt wurde;
- Fig. 10 ein Blockdiagramm einer Sprachsynthesevorrichtung ist, die die vorliegende Erfindung verkörpert;
- Fig. 11 ein Diagramm zum Erläutern eines Modulationsverfahrens ist, das die vorliegende Erfindung verkörpert;
- Fig. 12 eine grafische Darstellung der Spektralkennlinien eines Modulationszeitfolgesignals ist, das durch das Modulationsverfahren von Fig. 11 erzeugt wurde;
- Fig. 13 eine Strukturansicht eines Verzögerungsfilters erster Ordnung bei dem Modulationsverfahren von Fig. 11 ist;
- Fig. 14 ein Wellenformendiagramm eines Modulationszeitfolgesignals ist, das durch das Modulationsverfahren von Fig. 11 erzeugt wurde;
- Fig. 15 eine detaillierte Strukturansicht des Verzögerungsfilters erster Ordnung von Fig. 11 ist;
- Fig. 16 ein Blockdiagramm einer anderen Sprachsynthesevorrichtung ist, die die vorliegende Erfindung verkörpert;
- Fig. 17 ein Blockdiagramm von noch einer anderen Sprachsynthesevorrichtung ist, die die vorliegende Erfindung verkörpert;
- Fig. 18 ein Diagramm zum Erläutern eines Parameterinterpolationsverfahrens unter Verwendung eines kritisch dämpfenden Filters zweiter Ordnung ist;
- Fig. 19 ein Blockdiagramm eines kritisch dämpfenden Filters zweiter Ordnung ist, das die vorliegende Erfindung verkörpert;
- Fig. 20 ein Blockdiagramm eines kritisch dämpfenden Filters zweiter Ordnung ist, das die vorliegende Erfindung verkörpert;
- Fig. 21 eine spezifische Strukturansicht des kritisch dämpfenden Filters zweiter Ordnung von Fig. 20 ist;
- Fig. 22a und 22b grafische Darstellungen des Stufenfrequenzganges des kritisch dämpfenden Filters zweiter Ordnung von Fig. 21 sind;
- Fig. 23 ein Blockdiagramm eines kritisch dämpfenden Filters zweiter Ordnung ist, das die vorliegende Erfindung verkörpert;
- Fig. 24 eine detalliertere Ansicht von Fig. 23 ist;
- Fig. 25 ein Blockdiagramm eines kritisch dämpfenden Filters zweiter Ordnung ist, das bei einem Modulationsinkorporationsverfahren verwendet wird, das die vorliegende Erfindung verkörpert;
- Fig. 26 eine grafische Darstellung des Stufenfrequenzganges des kritisch dämpfenden Filters zweiter Ordnung ist, das bei dem Modulationsinkorporationsverfahren von Fig. 25 verwendet wird;
- Fig. 27 ein Blockdiagramm einer Sprachsynthesevorrichtung ist, die einen anderen Aspekt der vorliegenden Erfindung verkörpert;
- Fig. 28 ein Blockdiagramm eines Integrators ist, der die vorliegende Erfindung verkörpert;
- Fig. 29 ein Blockdiagramm eines Zweitordnungsfilters des unendlichen Zweitordnungsimpulscharakteristik- (IIR) Typs ist, das die vorliegende Erfindung verkörpert;
- Fig. 30 eine Strukturansicht eines Verzögerungsfilters erster Ordnung ist, das das IIR-Typ-Filter von Fig. 29 verwendet; und
- Fig. 31 ein Blockdiagramm eines kritisch dämpfenden Filters zweiter Ordnung ist, das die vorliegende Erfindung verkörpert.
- Bevor die bevorzugten Ausführungsformen der vorliegenden Erfindung beschrieben werden, werden zum Vergleich Beispiele nach Stand der Technik beschrieben.
- Figur 1 zeigt den Aufbau einer vorher vorgeschlagenen Sprachsynthesevorrichtung zum Modulieren einer Sprachausgabe.
- In der Figur gibt ein Konstantfrequenz-Sinuswellenoszillator 41 eine Sinuswelle mit konstanter Frequenz aus. Ein analoger Addierer 42 addiert einen positiven Bezugswert (systematische Abweichung) zu der Ausgabe des Konstantfrequenz-Sinuswellenoszillators 41 und gibt ein variables Amplitudensignal mit einer Amplitude aus, die sich zu der positiven Seite ändert. Ein spannungsgesteuerter Oszillator 43 empfängt das variable Amplitudensignal von dem analogen Addierer 42 und erzeugt ein Taktsignal CLOCK mit einer Frequenz, die der Veränderung der Amplitude entspricht, und führt dasselbe einem digitalen Sprachsynthetisator 44 zu. Der digitale Sprachsynthetisator 44 ist ein Sprachsynthetisator des volldigitalen Typs, der ein Taktsignal mit einer sich verändernden Frequenz als Standardisierungssignal verwendet und synthetische Sprache mit einer modulierten Frequenzkomponente erzeugt und ausgibt.
- Bei dem Sprachsynthetisator von Fig. 1 wird die Modulation (Schwankung) durch eine einfache Sinuswelle bewirkt, so bleibt noch ein gewisser mechanischer unnatürlicher Ton bestehen. Auch wird die Modulation nur für die standardisierte Frequenz vorgenommen und ist nicht in der Amplitudenkomponente der synthetischen Sprache enthalten.
- Figur 2 zeigt den Aufbau einer anderen vorher vorgeschlagenen Sprachsynthesevorrichtung zum Modulieren der Sprachausgabe. Wenn ein Gleichstrom von 0 Volt dem Eingang des Operationsverstärkers 51 eingegeben wird, der eine extrem große Verstärkungsrate von zum Beispiel über 10 000 hat, wird die Ausgabe nicht vollständig ein Gleichstrom von 0 Volt, sondern wird auf Grund der Drift des Operationsverstärkers moduliert. Die Vorrichtung von Fig. 2 nutzt die Drift. Das auf diese Weise erzeugte Modulationssignal ist ein analoges Signal von verschiedenen kleinen positiven und negativen Werten. Der Operationsverstärker 51 erzeugt das Modulationssignal und fügt es zu dem analogen Addierer 52 hinzu. Der analoge Addierer 52 addiert einen positiven Bezugswert (systematische Abweichung) zu dem Eingangsmodulationssignal, um ein moduliertes Amplitudensignal DATAF mit einer sich auf der positiven Seite verändernden Amplitude zu erzeugen, und gibt dasselbe dem Bezugsspannungsanschluß REF des multiplizierenden Digital-Analog-Umsetzers 53 ein. Andererseits gibt der digitale Sprachsynthetisator 54 die digitalen Daten DATA und den Takt CLOCK der Sprache, die durch das digitale Verfahren synthetisiert wurde, dem DIN- Anschluß und dem CK-Anschluß des multiplizierenden Digital- Analog-Umsetzers 53 ein. Der multiplizierende Digital- Analog-Umsetzer 53 multipliziert einen Wert, der die digitalen Daten DATA aufweist, die an dem DIN-Anschluß eingegeben wurden, und einen Wert, der das modulierte Amplitudensignal (Spannung) aufweist, das an dem REF- Anschluß eingegeben wurde, und gibt eine analoge Spannung, die dem Wert der Summe der zwei DATAF X DATA entspricht, als Sprachausgabe aus. Demzufolge wird ein analoges Sprachsignal mit einer modulierten Amplitude erhalten. Der Vorteil ist der, daß diese Modulation der Modulation von natürlicher Sprache nahekommt. Es sei angemerkt, daß bei diesem Sprachsyntheseverfahren nur die Amplitude der Ausgabe moduliert wird, d. h., die Frequenzkomponente wird nicht moduliert, aber es ist möglich, auch die Frequenzkomponente zu modulieren. Zum Beispiel ist es möglich, einen Sprachsynthetisator des analogen Typs als Sprachsynthetisator zu verwenden und ein Modulationssignal zu den Parametern zum Steuern der Frequenzkennlinien (ausgedrückt durch die Spannung) zu addieren, um eine modulierte Frequenzkomponente zu realisieren. Ferner ist es möglich, wenn ein Sprachsynthetisator des digitalen Typs verwendet wird, das Modulationssignal in eine digitale Form durch einen Digital- Analog-Umsetzer umzusetzen und dasselbe zu einem Digitalausdrucksprachsynthetisator hinzuzufügen.
- Der Sprachsynthetisator von Fig. 2 hat den Vorteil, Sprache mit einem modulierten Ton, die natürlicher Sprache nahekommt, auszugeben, aber umgekehrt wird die Modulation durch ein analogartiges Mittel erreicht, so differiert die Größe der Modulation in Abhängigkeit von den individuellen Differenzen des Operationsverstärkers 51, und es tritt das Problem auf, daß es unmöglich ist, dieselben Kennlinien zu erreichen. Ferner tritt das Problem der Alterung auf, mit der eine Instabilität, d. h. Veränderungen der Modulationskennlinien, einhergeht.
- Als nächstes erfolgt eine Erläuterung eines vorher vorgeschlagenen Parameterinterpolationsverfahrens bei Sprachsynthetisatoren unter Bezugnahme auf Fig. 3 und Fig. 4.
- Figur 3 zeigt ein Parameterinterpolationsverfahren des linearen Interpolationstyps. Bei dem linearen Interpolationsverfahren wird, falls die Parameter der Zeit T1 und T2 F1 bzw. F2 sind, die Interpolation für das lineare Verändern der Parameter zwischen der Zeit T1 und der Zeit T2 ausgeführt. Falls der Parameter während der Periode t von der Zeit T1 bis zu der Zeit T2 F(t) ist, ist F(t) durch die folgende Gleichung (1) gegeben:
- F(t) = (F2 - F1) (t - T1) / (T2 - T1) + F1 ... (1)
- wobei T1 ≤ t ≤ T2 ist.
- Das lineare Interpolationsverfahren gestattet die Interpolation von Parametern durch einfache Berechnungen, aber andererseits werden die Kennlinien der Veränderung der Parameter durch Polygonlinien dargestellt und unterscheiden sich somit von der tatsächlichen gleitenden Veränderung der Parameter, und das bedeutet, daß eine Synthese natürlicher Sprache nicht möglich ist.
- Als Parameterinterpolationsverfahren, das die Mängel des linearen Interpolationsverfahrens eliminiert und eine gleitende Verbindung von Parametern gestattet, existiert das Verfahren, das ein kritisch dämpfendes Filter zweiter Ordnung verwendet, das in Fig. 4 gezeigt ist. Das heißt, dieses Verfahren gibt dem nächsten Zielwert Befehle als stufenweise Veränderungen der Parameter ein, glättet die stufenweisen Veränderungen und gibt ein lineares System aus, das durch das kritisch dämpfende Filter zweiter Ordnung approximiert wird. Demzufolge werden die Veränderungen bei den Parametern gleitend ausgeführt, wie dargestellt.
- Die Übertragungsfunktion Hc(s) und der Stufenfrequenzgang S(t) des kritisch dämpfenden Filters zweiter Ordnung sind durch die folgenden Gleichungen (2) und (3) gegeben:
- Hc(s) = ω²/(s² + 2ωs + ω²) ... (2)
- S(t) = 1 - (1 + ωt)exp(-wt) ... (3)
- wobei ω = 1/τ (τ: Zeitkonstante)
- Hier sind, wenn der Parameter zu der Zeit t&sub1; F&sub1; ist und den Zielwerten F&sub2; , F&sub3; , ... , Fm zu den Zeiten t&sub2; , t&sub3; , ... tm Befehle erteilt werden, die Eingabe C(t) für das kritisch dämpfende Filter zweiter Ordnung und der Frequenzgang f(t) des Systems auf die Eingabe C(t) durch die folgenden Gleichungen (4) und (5) gegeben (siehe zum Beispiel The Journal of the Acoustical Society of Japan, Bd. 34, Nr. 3, S. 177 bis 185):
- Hier ist t ≥ tj , u ist die Einheitsstufenfunktion, und der Wert 0 wird genommen, wenn t - tj < 0 ist, und der Wert 1 wird genommen, wenn t - tj ≥ 0 ist.
- Figur 5 zeigt ein kritisch dämpfendes Filter zweiter Ordnung, das den Frequenzgang f(t) von Gleichung (5) erreicht. In Fig. 5 ist 61 ein Zähler, der die Zeit t zählt. Bezugszeichen 62j (j = 2 bis m) ist ein Subtrahierglied, das Fj - Fj-1 (j = 2 bis m) berechnet. Bezugszeichen 63j (j = 2 bis m) ist auch ein Subtrahierglied, das t - Tj (j = 2 bis m) berechnet. Bezugszeichen 64j (j = 2 bis m) ist eine Einheitsschaltung, die die Operation der folgenden Gleichung (6) ausführt und die Ausgabe Oj (j = 2 bis m) erzeugt:
- Oj = (Fj - Fj-1)u(t - tj) [1 - {1 + ω(t - tj)}exp{-ω(t - tj)}] ... (6)
- Der Inhalt von Gleichung (6) ist derselbe wie der Inhalt der Terme in Σ von Gleichung (5). Bezugszeichen 65 ist ein Addierer, der die Ausgabe Oj und F&sub1; der Einheitsschaltungen 64j (j = 2 bis m) addiert, um eine Interpolationsausgabe zu erzeugen, d. h. den Frequenzgang f(t) von Gleichung (5).
- Die Tatsache, daß der Frequenzgang f(t) von Gleichung (5) durch den Aufbau von Fig. 5 erhalten werden kann, ist daraus ersichtlich, daß die Ausgabe Oj der Einheitsschaltung von Gleichung (6) den Wert der Terme in Σ von Gleichung (5) aufweist. Unter Verwendung solch eines kritisch dämpfenden Filters zweiter Ordnung wird, da die Geschwindigkeit am Startpunkt 0 ist und der Zielwert Fj allmählich schwingungsfrei approximiert wird und die Parameter gleitend verbunden werden können, der tatsächliche Zustand der Veränderung von Sprachparametern approximiert, und der Sprachsynthese kann sogar im Vergleich zu der linearen Interpolation ein besserer natürlicher Ton verliehen werden.
- Das Verfahren der Parameterübertragung unter Verwendung eines kritisch dämpfenden Filters zweiter Ordnung hat jedoch die Probleme, daß der Aufbau des Filters zum Erreichen einer kritischen Zweitordnungsdämpfung kompliziert ist und die Menge der damit verbundenen Berechnung groß ist, und so ist die praktische Anwendbarkeit schlecht. Wenn zum Beispiel (m - 1) Zielwerte vorhanden sind, erhöht sich jedes Mal, wenn die Zeit eine Befehlszeit (t&sub2; , t&sub3; , ... , tm) passiert, die Anzahl von Berechnungen eines exponentiellen Teils, bis schließlich eine Anzahl von (m - 1) Berechnungen des exponentiellen Teils erforderlich sind, somit wird die Berechnungsmenge extrem groß.
- Ein anderer vorher vorgeschlagener Sprachsynthetisator wird unter Bezugnahme auf Fig. 6 erläutert. Figur 6 zeigt in einem Blockdiagramm den Aufbau des Sprachsynthetisators, der in der japanischen Patentanmeldung Nr. 58-186800 offenbart ist.
- In der Figur ist Bezugszeichen 10A ein Mittel zum Erzeugen eines Modulations- (Schwankungs-) Zeitfolgesignals, das aus einem Zufallszahlenzeitfolgegenerator 11 und einem Integrationsfilter 12A besteht. Der Zufallsdatengenerator 11 erzeugt eine Zeitfolge von Zufallszahlen, zum Beispiel einheitliche Zufallszahlen, und gibt die Zufallszahlenzeitfolge zu gleichen Zeitintervallen aufeinanderfolgend aus. Das Integrationsfilter 12A ist ein Digitaltyp-Integrationsfilter und besteht aus einem Integrator 31 mit einer Übertragungsfunktion von 1/sτ, wobei τ eine Zeitkonstante mit einer Größe ist, die experimentell bestimmt ist, um eine ziemlich natürliche, modulierte synthetische Sprache zu erreichen. Zu beachten ist, daß ω = 1/τ ist. Unten erfolgt die Erläuterung unter Verwendung von τ anstelle von ω. Die Zufallszahlenzeitfolge, die durch den Zufallszahlenzeitfolgegenerator 11 erzeugt wurde, wird durch das Integrationsfilter 12A gefiltert und ein Modulationszeitfolgesignal wird ausgegeben.
- Figur 7 zeigt ein Profil des Spektrums eines Modulationszeitfolgesignals, das durch ein Modulationszeitfolgesignalerzeugungsmittel 101 erzeugt wurde, und die Form einer Hyperbel hat. Die Figur setzt den Fall voraus, daß der Zufallszahlenzeitfolgegenerator 11 einheitliche Zufallszahlen (weißes Rauschen) ausgibt, das heißt, den Fall eines flachen Spektrums der Zufallszahlenzeitfolge. Wenn das Spektrum der Zufallszahlenzeitfolge nicht flach ist, wird das Spektrum am Ende mit dem Spektrum von Fig. 7 multipliziert. In jedem der beiden Fälle nimmt das Spektrum eine Form nahe 1/f an (wobei f die Frequenz ist).
- Figur 8 zeigt als Beispiel die Wellenform von einheitlichen Zufallszahlen mit einem Bereich von -25 bis +25.
- Figur 9 zeigt ein Beispiel eines Modulationszeitfolgesignals, das durch Integrationsfiltern der einheitlichen Zufallszahlen, die in Fig. 8 gezeigt sind, durch das Integrationsfilter 12 erzeugt wurde. Die Zeitkonstante ist in diesem Fall 32.
- Auf diese Weise ist es möglich, ein gewünschtes Modulationszeitfolgesignal durch einen einfachen Aufbau zu erzeugen.
- Jedoch sind die Spektralkennlinien eines Modulationszeitfolgesignals, das durch das zuvor erwähnte Modulationsverfahren erzeugt wurde, grenzenlos, wenn die Frequenz f 0 ist, wie in Fig. 7 gezeigt. Deshalb wird, falls auch nur eine leichte Gleichstromkomponente in der Zufallszahlenzeitfolge enthalten ist, die durch den Zufallszahlenzeitfolgegenerator 11 erzeugt wurde, die Gleichstromkomponente vervielfacht und der Mittelwert der Ausgabe (Modulationszeitfolgesignal) wird immer größer. Jedoch sind Zufallszahlen, die durch das digitale Verfahren erzeugt wurden, keine vollkommenen Zufallszahlen, sondern haben im allgemeinen eine Periode. Deshalb ist da eine Periodizität vorhanden, wo dieselbe Zufallszahlenfolge, falls mehr als eine gewisse Anzahl von Zufallszahlen erzeugt werden, wiederholt wird, und somit gibt es keine Garantie, daß die Summe bei dem allgemeinen Zufallszahlenerzeugungsverfahren null sein wird. In der grafischen Darstellung des Modulationszeitfolgesignals, das in Fig. 9 gezeigt ist, ist der Zustand der Gleichstromkomponente gezeigt, wenn sie vervielfacht und überlagert ist. Falls ein Versuch unternommen wird, die Summe der Zufallszahlenzeitfolge exakt auf null zu bringen, würde die Verbindung des Zufallszahlenzeitfolgegenerators 11 kompliziert. Das heißt, das zuvor erwähnte Modulationsverfahren hat einen einfachen Aufbau, leidet aber unter dem Problem einer Vervielfachung der Gleichstromkomponente.
- Unten erfolgt eine Erläuterung eines Sprachsynthetisators unter Verwendung eines Modulationsverfahrens, das die vorliegende Erfindung verkörpert und die Probleme der vorher vorgeschlagenen Modulationsverfahren lösen kann, die unter Bezugnahme auf Fig. 6 bis Fig. 9 beschrieben sind, und das einen Mittelwert des Modulationszeitfolgesignals von null, d. h., eine Gleichstromkomponente von null, erreicht. Ferner erfolgt eine Beschreibung einer Ausführungsform der vorliegenden Erfindung, die mit einem einfachen Aufbau das kritisch dämpfende Filter zweiter Ordnung realisieren kann, das für den Sprachsynthetisator verwendet wird, der die vorliegende Erfindung verkörpert.
- Figur 10 zeigt den Aufbau eines Sprachsynthetisators einer ersten Ausführungsform der vorliegenden Erfindung, welcher Sprachsynthetisator von Fig. 10 aus einem Sprachsynthesemittel 20A und einem Modulationszeitfolgesignal datengenerator 10B besteht.
- Zuerst erfolgt unter Bezugnahme auf Fig. 11 eine Beschreibung des Modulations- (Schwankungs-) Erzeugungsmittels der vorliegenden Erfindung, das das Problem bei einem herkömmlichen Modulationserzeugungsmittel löst.
- In der Figur ist Bezugszeichen 10B ein Modulations- (Schwankungs-) Zeitfolgesignalerzeugungsmittel, das aus einem Zufallszahlenzeitfolgegenerator 11 und einem Integrationsfilter 12B besteht.
- Der Zufallszahlenzeitfolgegenerator 11 erzeugt wie beim Stand der Technik Zeitfolgedaten von Zufallszahlen, zum Beispiel einheitliche Zufallszahlen, und gibt die Zufallszahlenzeitfolgedaten zu gleichen Zeitintervallen auf der Grundlage eines Abtasttaktes sequentiell aus. Die Zufallszahlenzeitfolgedaten werden durch verschiedene bekannte Verfahren erzeugt. Zum Beispiel ist es durch Multiplikation des Ausgabewertes zu einem gewissen Zeitpunkt mit einer großen Konstante und dann durch Addieren einer anderen Konstante möglich, die Ausgabe eines anderen Zeitpunktes zu erhalten. In diesem Fall wird ein Überlauf ignoriert. Ein anderes Verfahren besteht darin, den Ausgabewert zu einem gewissen Zeitpunkt um ein Bit auf der höheren Bitseite oder der niedrigeren Bitseite zu verschieben und den Ein-Bit- Wert, der durch eine EXKLUSIV-ODER-Verbindung von mehreren vorbestimmten Bits mit dem Wert vor der Verschiebung erhalten wurde, auf das undefinierte Bit des niedrigsten oder höchsten Bits anzuwenden, das durch die Verschiebung gebildet wurde (bekannt als M-Folge). Die Modulationszeitfolgesignaldaten, die auf diese Weise erzeugt wurden, sind Zufallszahlenzeitfolgedaten und vermeiden somit eine mechanische Unnatürlichkeit.
- Das Integrationsfilter 12B besteht aus einem Verzögerungsfilter erster Ordnung, das eine Übertragungsfunktion von 1/(sτ + α) hat. Durch Unterziehen der Zufallszahlenzeitfolgedaten, die durch den Zufallszahlenzeitfolgegenerator 11 erzeugt wurden, einer Verzögerungsfilterung erster Ordnung durch das Integrationsfilter 12B werden die Modulationszeitfolgesignaldaten erzeugt.
- Figur 12 zeigt die Spektralkennlinien der Übertragungsfunktion 1/(sτ + α), das heißt, die Spektralkennlinien der Modulationszeitfolgesignaldaten, die erzeugt werden, wenn das Spektrum der Zufallszahlenzeitfolgedaten flach ist. Wie in Fig. 12 gezeigt, ist das Spektrum des Verzögerungsfilters erster Ordnung ein endlicher Wert von 1/α bei einem Gleichstrom (f = 0), so daß es, selbst wenn eine Gleichstromkomponente in den Zufallszahlenzeitfolgedaten enthalten ist, wie in Fig. 9 gezeigt, nicht weiter akkumuliert wird, wie in Fig. 9 gezeigt.
- Figur 13 zeigt durch ein Blockdiagramm ein Beispiel eines Verzögerungsfilters erster Ordnung 12B. Bezugszeichen 31 ist ein Integrator mit einer Übertragungsfunktion von 1/s, 122 ein Addierer und 123 eine Gegenkopplungseinheit zur Gegenkopplung des Koeffizienten α. Der Integrator 31 hat denselben Aufbau wie der Integrator 12A von Fig. 6. Durch diesen Aufbau wird ein Verzögerungsfilter erster Ordnung mit einer Übertragungsfunktion von 1/(sτ + α) realisiert. Hier ist α experimentell bestimmt, aber falls -α = -1 ausgewählt wird, wird dann die Gegenkopplung durch eine einfache Kodeumsetzung der Ausgabe (zum Beispiel Komplement von 2) realisiert, und so kann ein Verzögerungsfilter erster Ordnung mit einem einfachen Aufbau verwendet werden, um die Summe der Modulationszeitfolgesignaldaten, das heißt, die Summe einer Gleichstromkomponente, auf null zu bringen. Figur 14 zeigt ein Beispiel von Modulationszeitfolgesignaldaten, die durch das Modulationsverfahren von Fig. 11 in dem Fall der Verwendung eines Verzögerungsfilters erster Ordnung mit -α = -1 erzeugt wurden, wobei die Zeitkonstante τ 32 ist. Durch Unterziehen der Zufallszahlenzeitfolgedaten einer Verzögerungsfilterung erster Ordnung, wie in Fig. 14 gezeigt, wird der Mittelwert des Modulationszeitfolgesignals null. Es ist möglich, die Erscheinung der Trennung des Mittelwertes von null mit der Zeit zu eliminieren, wie nach Stand der Technik.
- Figur 15 zeigt den detaillierten Aufbau des Verzögerungsfilters erster Ordnung 12B, das auf diese Weise konstruiert ist. Bezugszeichen 122 ist ein Addierer, und 123 ist ein Multiplizierer, der die Ausgabe des Integrators 31 mit der Konstante "-1" multipliziert und das Resultat zu dem Addierer 122 hinzugefügt.
- Auf der Grundlage des Modulationszeitfolgesignals, das durch das oben erläuterte Modulationsverfahren der vorliegenden Erfindung erzeugt wurde, synthetisiert das Sprachsynthesemittel modulierte Sprache. Die Modulations- (Schwankungs-) Inkorporationsverarbeitung, um der Sprache eine Modulation zu verleihen, wird in diesem Fall durch verschiedene Verfahren ausgeführt. Unten erfolgt eine Erläuterung verschiedener Modulationsinkorporationsverfahren, die durch das Sprachsynthesemittel ausgeführt werden.
- Das Modulationsinkorporationsverfahren (1) wird unter Bezugnahme auf Fig. 10 erläutert. Das Sprachsynthesemittel 20A hat einen Sprachsynthetisator 21. Bezugszeichen 211 ist ein Parameterinterpolator, der in dem Sprachsynthetisator 21 enthalten ist. Dieser gibt bei jeder Rahmenperiode von 5 bis 10 ms oder bei jeder Ereignisänderung oder -erscheinung, wie eine Veränderung eines Tonelementes, einen Parameter ein, führt eine Parameterinterpolationsverarbeitung aus und gibt zu jeder Abtastperiode von etwa 100 Mikrosekunden einen interpolierten Parameter aus. Im allgemeinen gibt es viele Typen von Parametern, die durch Sprachsynthesevorrichtungen verwendet werden, aber Fig. 10 zeigt nur jene, die sich auf die Modulationsinkorporationsverarbeitung beziehen. Fs gibt die Grundfrequenz eines stimmhaften Tones an (s: Quelle), As gibt die Amplitude der Tonquelle bei einem stimmhaften Ton an, und An gibt die Amplitude der Tonquelle bei einem stimmlosen Ton an (n: Rauschen). Ferner sind F's, A's und A'n Parameter, die durch den Parameterinterpolator 211 interpoliert wurden. Bezugszeichen 212 ist ein Impulsfolgegenerator, der eine Impulsfolge erzeugt, die als Tonquelle des stimmhaften Tons dient. Die Ausgabe wird durch den Parameter F's frequenzgesteuert und wird ferner durch Multiplikation mit dem Parameter A's durch den Multiplizierer 213 amplitudengesteuert, um eine Wellenform einer stimmhaften Tonquelle zu erzeugen. Bezugszeichen 214 ist ein Zufallszahlenzeitfolgesignalgenerator, der ein Rauschen erzeugt, das als Tonquelle für die stimmlosen Töne dient. Die Ausgabe wird durch Multiplikation mit dem Parameter A'n in dem Multiplizierer 215 amplitudengesteuert, um die Wellenform der stimmlosen Tonquelle zu erzeugen. Bezugszeichen 216 ist ein Stimmtraktkennliniensimulationsfilter, das die Tonübertragungskennlinien der Luftröhre, des Mundes und von anderen Teilen des Stimmtraktes simuliert. Es empfängt als Eingabe Wellenformen von stimmhaften oder stimmlosen Tonquellen von dem Impulsfolgegenerator 212 und dem Zufallszahlenzeitfolgesignalgenerator 21 durch einen Schalter 217 und verändert die internen Parameter (nicht gezeigt), um Sprache zu synthetisieren. Zum Beispiel werden durch langsames Verändern der Parameter Vokale gebildet und durch schnelles Verändern von ihnen Konsonanten. Der Schalter 217 schaltet die stimmhaften und stimmlosen Tonquellen und wird durch einen der Parameter (nicht gezeigt) gesteuert.
- Der oben erläuterte Sprachsynthetisator 21, der 211 bis 217 umfaßt, hat denselben Aufbau wie der herkömmliche Sprachsynthetisator und hat keine Modulationsfunktion. Der Sprachsynthetisator 21 synthetisiert nichtmodulierte Sprache auf dieselbe Weise wie nach Stand der Technik und gibt digitale synthetische Sprache durch das Stimmtraktkennlinienfilter 216 aus.
- Bezugszeichen 22 ist ein Addierer, der eine positive Konstante mit einem festen positiven Pegel zu einem Modulationszeitfolgesignal addiert, das von einem Modulationszeitfolgesignalerzeugungsmittel 10B eingegeben wurde. Das heißt, das Modulationszeitfolgesignal ändert sich von positiv zu negativ innerhalb eines festen Pegels, aber die Addition einer positiven Konstante als systematische Abweichung erzeugt ein Modulationszeitfolgesignal mit einer Modulation des Pegels in positiver Richtung. Das Verhältnis zwischen dem Modulationspegel des Modulationszeitfolgesignals und dem Pegel der positiven Konstante ist experimentell festgelegt, aber bei dieser Ausführungsform ist für das Verhältnis 0,1 ausgewählt worden.
- Bezugszeichen 23 ist ein Multiplizierer, der die digitale synthetische Sprache, d. h., die Ausgabezeitfolge des Sprachsynthetisators 21, mit dem Modulationszeitfolge signal, das von dem Addierer 22 eingegeben wurde, multipliziert.
- Dadurch wird eine amplitudenmodulierte digitale synthetische Sprache erzeugt. Diese digitale synthetische Sprache wird durch einen Digital-Analog-Umsetzer (nicht gezeigt) in normale analoge Sprachsignale umgesetzt und ferner über einen Verstärker zu einem Lautsprecher (beide nicht gezeigt) übertragen, um einen modulierten Ton zu erzeugen.
- Es sei angemerkt, daß der Zufallszahlenzeitfolgegenerator 11 in dem Modulationszeitfolgesignalerzeugungsmittel 10B und der Zufallszahlenzeitfolgegenerator 214 in dem Sprachsynthesemittel 20 Zufallszahlenzeitfolgen mit demselben Inhalt erzeugen, und somit können die zwei durch eine einzelne Einheit ersetzt werden. Dies gestattet eine weitere Vereinfachung des Aufbaus der Sprachsynthesevorrichtung. Figur 10 zeigt einen Aufbau, bei dem der Zufallszahlenzeitfolgegenerator 214 des Sprachsynthesemittels 20 für den Zufallszahlenzeitfolgegenerator 11 des Modulationszeitfolgesignalerzeugungsmittels 10B eingesetzt wird. Dasselbe trifft bei den anderen Modulationsinkorporationsverfahren zu.
- Unter Bezugnahme auf Fig. 16 wird das Modulationsinkorporationsverfahren (2) erläutert.
- Das Modulations- (Schwankungs-) Inkorporationsverfahren (1) modulierte die Amplitude des Ausgabezeitfolgesignals des Sprachsynthetisators, aber das Modulationsinkorporationsverfahren (2) verleiht dem Zeitfolgeparameter, der bei dem Sprachsynthesemittel 20B verwendet wird, eine Modulation und synthetisiert somit Sprache, die sowohl amplituden- als auch frequenzmoduliert ist.
- In Fig. 16 haben das Modulationszeitfolgesignalerzeugungsmittel 10B und, in dem Sprachsynthesemittel 20B, der Sprachsynthetisator 21, der Parameterinterpolator 211, der in dem Sprachsynthetisator 21 vorgesehen ist, der Impulsfolgegenerator 212, der Zufallszahlenzeitfolgegenerator 214, die Multiplizierer 213 und 215, das Stimmtraktkennliniensimulationsfilter 216, der Schalter 217 und der Addierer 22 denselben Aufbau wie jene in Fig. 10.
- In dem Sprachsynthesemittel 20B bezeichnen die Bezugszeichen 24, 25 und 26 Elemente, die für das Modulationsinkorporationsverfahren (2) neu vorgesehen sind. Da sie mit dem Sprachsynthetisator 21 integral gebildet sind, sind sie innerhalb des Sprachsynthetisators 21 dargestellt.
- Der Multiplizierer 24 multipliziert den Parameter F's, der von dem Parameterinterpolator 211 eingegeben wurde, mit dem Modulationszeitfolgesignal, das von dem Addierer 22 eingegeben wurde, um dem Parameter F's eine Modulation zu verleihen. Dadurch wird der Impulszeitfolge der stimmhaften Tonquelle, die durch den Impulsfolgesignalgenerator 212 ausgegeben wurde, eine Modulation bei der Frequenzkomponente verliehen. Der Multiplizierer 25 multipliziert den Parameter A's, der von dem Parameterinterpolator 211 eingegeben wurde, mit dem Modulationszeitfolgesignal, das von dem Addierer 22 eingegeben wurde. Dadurch wird der Wellenform der stimmhaften Tonquelle, die von dem Multiplizierer 213 ausgegeben wurde, sowohl bei der Frequenz als auch bei der Amplitude eine Modulation verliehen.
- Der Multiplizierer 26 multipliziert den Parameter A'n, der von dem Parameterinterpolator 211 eingegeben wurde, mit dem Modulationszeitfolgesignal, das von dem Addierer 22 eingegeben wurde, um dem Parameter A'n eine Modulation zu verleihen. Dadurch wird der Wellenform der stimmlosen Tonquelle, die von dem Multiplizierer 215 ausgegeben wurde, eine Modulation bei der Amplitudenkomponente verliehen. Das Stimmtraktkennliniensimulationsfilter 216 empfängt als Eingabe über einen Schalter 217 eine Wellenform einer stimmhaften Tonquelle, die bei den Amplituden- und Frequenzkomponenten eine Modulation besitzt, oder eine Wellenform einer stimmlosen Tonquelle, die bei der Amplitudenkomponente eine Modulation besitzt, verändert die internen Parameter und synthetisiert amplituden- und frequenzmodulierte Sprache. Die Ausgabezeitfolge des Sprachsynthetisators 21 wird auf dieselbe Weise wie im Fall des Modulationsinkorporationsverfahrens (1) der Digital-Analog-Umsetzung unterzogen, verstärkt und als Ton von Lautsprechern ausgegeben.
- Auf obige Weise ist es möglich, sowohl die Amplituden- als auch die Frequenzkomponenten zu modulieren und eine natürlichere Sprache zu synthetisieren.
- Es sei angemerkt, daß es als andere Ausführungsform des Modulationsinkorporationsverfahrens (2) möglich ist, nur den Multiplizierer 24 vorzusehen und nur die Frequenzkomponente zu modulieren. Ferner ist es möglich, beide Multiplizierer 25 und 26 vorzusehen und nur die Amplitudenkomponente zu modulieren.
- Ferner ist es durch Multiplizieren der Parameter (nicht gezeigt) in dem Stimmtraktkennliniensimulationsfilter 216 mit dem Modulationszeitfolgesignal von dem Addierer 22 möglich, eine feinere Modulation zu verleihen.
- Unter Bezugnahme auf Fig. 17 wird das Modulationsinkorporationsverfahren (3) erläutert.
- Das Modulationsinkorporationsverfahren (3) moduliert wie das Modulationsinkorporationsverfahren (2) die Parameterzeitfolge des Sprachsynthesemittels 20C, um modulierte Sprache zu synthetisieren, realisiert dies aber durch ein unterschiedliches Verfahren.
- In Fig. 17 sind das Modulationszeitfolgesignalerzeugungsmittel 10B und, in dem Sprachsynthesemittel 20C, der Sprachsynthetisator 21, der Parameterinterpolator 211, der in dem Sprachsynthetisator 21 vorgesehen ist, der Impulsfolgegenerator 212, der Zufallszahlenzeitfolgegenerator 214, die Multiplizierer 213 und 215, das Stimmtraktkennliniensimulationsfilter 216 und der Schalter 217 dem Aufbau nach dieselben wie jene in Fig. 16.
- Bei dem Modulationsinkorporationsverfahren (3) sind, wie in Fig. 17 gezeigt, die Addierer 27, 28 und 29 anstelle der Multiplizierer 24, 25 und 26 bei dem Modulationsinkorporationsverfahren (2) von Fig. 16 vorgesehen. Addierer 22 ist nicht vorgesehen. Bei diesem Aufbau wird das Modulationszeitfolgesignal, das durch das Modulationszeitfolgesignalerzeugungsmittel 10 erzeugt wurde, direkt zu den Addierern 27 bis 29 addiert.
- Der Addierer 27 addiert zu dem Parameter F's, der von dem Parameterinterpolator 211 eingegeben wurde, das Modulationszeitfolgesignal, das von dem Modulationszeitfolgesignalerzeugungsmittel 10B eingegeben wurde, um dem Parameter F's eine Modulation zu verleihen. Dadurch wird der Impulszeitfolge der stimmhaften Tonquelle, die durch den Impulsfolgesignalgenerator 212 ausgegeben wurde, eine Modulation bei der Frequenzkomponente verliehen. Der Addierer 28 addiert zu dem Parameter A's, der von dem Parameterinterpolator 211 eingegeben wurde, das Modulationszeitfolgesignal, das von dem Modulationszeitfolgesignalerzeugungsmittel 10B eingegeben wurde, um dem Parameter A's eine Modulation zu verleihen. Dadurch wird der Wellenform der stimmhaften Tonquelle, die von dem Multiplizierer 213 ausgegeben wurde, eine Modulation sowohl bei den Frequenzals auch Amplitudenkomponenten verliehen. Der Addierer 29 addiert zu dem Parameter A'n, der von dem Parameterinterpolator 211 eingegeben wurde, das Modulationszeitfolgesignal, das von dem Modulationszeitfolgesignalerzeugungsmittel 10 eingegeben wurde, um dem Parameter A'n eine Modulation zu verleihen. Dadurch wird der Wellenform der stimmlosen Tonquelle, die von dem Multiplizierer 215 ausgegeben wurde, eine Modulation bei der Amplitudenkomponente verliehen. Das Stimmtraktkennliniensimulationsfilter 216 empfängt als Eingabe über einen Schalter 217 eine Wellenform einer stimmhaften Tonquelle, die bei den Amplituden- und Frequenzkomponenten eine Modulation besitzt, oder eine Wellenform einer stimmlosen Tonquelle, die bei der Amplitudenkomponente eine Modulation besitzt, verändert die internen Parameter und synthetisiert Sprache, die bei den Amplituden- und Frequenzkomponenten moduliert ist. Die Zeitfolgeausgabe des Sprachsynthetisators 21 wird auf dieselbe Weise wie im Fall des Modulationsinkorporationsverfahrens (2) der Digital-Analog-Umsetzung unterzogen, verstärkt und als Ton von Lautsprechern ausgegeben.
- Auf obige Weise ist es möglich, sowohl die Amplituden- als auch die Frequenzkomponenten zu modulieren und eine natürlichere Sprache zu synthetisieren.
- Es sei angemerkt, daß es als andere Ausführungsform des Modulationsinkorporationsverfahrens (3) auf dieselbe Weise wie bei dem Modulationsinkorporationsverfahren (2) möglich ist, nur den Addierer 27 vorzusehen und nur die Frequenzkomponente zu modulieren. Ferner ist es möglich, beide Addierer 28 und 29 vorzusehen und nur die Amplitudenkomponente zu modulieren.
- Ferner ist es durch Addieren des Modulationszeitfolgesignals von dem Modulationszeitfolgesignalerzeugungsmittel 10 zu den Parametern (nicht gezeigt) in dem Stimmtraktkennliniensimulationsfilter 216 möglich, eine feinere Modulation zu verleihen.
- Der Parameterinterpolator 211, der in Fig. 10, Fig. 16 und Fig. 17 dargestellt ist, empfängt als Eingabe bei jeder Rahmenperiode von 5 bis 10 ms oder bei jeder Ereignisänderung oder -erscheinung, wie eine Veränderung des Tonelementes, Parameter, führt eine Interpolation aus und gibt bei jeder Abtastperiode von etwa 100 Mikrosekunden einen interpolierten Parameter aus. Zu dieser Zeit wird, um die Veränderung von Parametern zu glätten (interpolieren), das Filtern unter Verwendung eines kritisch dämpfenden Filters zweiter Ordnung ausgeführt, wie schon erläutert wurde.
- Figur 18 zeigt das Prinzip des Parameterinterpolationsverfahrens unter Verwendung eines kritisch dämpfenden Filters zweiter Ordnung in dem Parameterinterpolator. In Fig. 18 ist Bezugszeichen 30S ein kritisch dämpfendes Filter zweiter Ordnung und 301 und 302 sind Register. Bei diesem Aufbau empfängt das Register 301 eine Parameterzeitfolge bei jeder Ereignisänderung oder -erscheinung und hält dieselbe. Das kritisch dämpfende Filter zweiter Ordnung 30S verbindet die Veränderungen bei den Parameterwerten des Registers 301 gleitend und schreibt die Ausgabe bei jedem kurzen Intervall von zum Beispiel etwa 100 Mikrosekunden in das Register 302. Dadurch wird der interpolierte Zeitfolgeparameter in dem Register 302 gehalten.
- Die Übertragungsfunktion H(s) des kritisch dämpfenden Filters zweiter Ordnung 30 zur Interpolation der Parameterzeitfolge wird durch die zuvor genannte Gleichung (2) ausgedrückt, d. h.,
- H(s) = ω²/(s² + 2ωs + ω²)
- Die Übertragungsfunktion H(s) kann unter Verwendung des Integrators (ω/s) gebildet werden. Zum Beispiel ist es durch Abwandeln von H(s) zu
- H(s) = {ω/(s + ω)} {ω/(s + ω)}
- möglich, die Übertragungsfunktion durch Seriellverbindung des primären Verzögerungsfilters von ω/(s + ω) zu realisieren. Ferner wird das Verzögerungsfilter erster Ordnung durch den Integrator mit einer Übertragungsfunktion, die durch ω/s ausgedrückt ist, und einer Gegenkopplung realisiert. Deshalb kann das kritisch dämpfende Filter zweiter Ordnung 30 durch den in Fig. 19 gezeigten Aufbau realisiert werden. In Fig. 19 sind Bezugszeichen 31a und 31b Integratoren, und 32a und 32b sind Addierer. Auf diese Weise kann das kritisch dämpfende Filter zweiter Ordnung 30 unter Verwendung des Integrationsfilters 31 als bildendes Element realisiert werden.
- Das kritisch dämpfende Filter zweiter Ordnung von Fig. 19 approximiert die digitale Integration des Integrators 31 durch das einfache Eulersche Integrationsverfahren.
- Unter Verwendung des auf diese Weise konstruierten Integrators 31 ist es möglich, ein kritisch dämpfendes Filter zweiter Ordnung 30 einfach zu realisieren. Ferner ist es möglich, durch die gleitende Verbindung von Parametern eine sehr natürliche synthetische Sprache zu erhalten.
- Es gibt verschiedene Verfahren zum Konstruieren des kritisch dämpfenden Filters zweiter Ordnung von Fig. 19, aber hier erfolgt eine Erläuterung der kritisch dämpfenden Filter zweiter Ordnung einer Ausführungsform der vorliegenden Erfindung.
- Hier erfolgt eine Erläuterung des Konstruktionsverfahrens (1) eines kritisch dämpfenden Filters zweiter Ordnung unter Bezugnahme auf Fig. 20.
- Die Übertragungsfunktion Hg(s) des Zweitordnungsfilters wird im allgemeinen durch die folgende Formel (7) ausgedrückt:
- Hg(s) = (1/(s²τ² + DF Sτ + 1) ... (7)
- wobei DF der Dämpfungsfaktor ist.
- Die Gleichung (7) kann zu der Gleichung (8) verändert werden:
- Hg(s) = 1/{sτ(sτ + DF) + 1} ... (8)
- Das Zweitordnungsfilter mit dieser Übertragungsfunktion besteht aus einem Verzögerungsfilter erster Ordnung mit einer Übertragungsfunktion von 1/(Sτ + DF), einem Integrator mit einer Übertragungsfunktion von 1/sτ und einer Gegenkopplungsschleife mit einem Koeffizienten von 1. Ferner besteht das Verzögerungsfilter erster Ordnung mit der Übertragungsfunktion von 1/(sτ + DF) aus einem Integrator mit einer Übertragungsfunktion von 1/sτ und einer Gegenkopplungsschleife mit einem Koeffizienten von DF. Deshalb wird das Zweitordnungsfilter mit der Übertragungsfunktion Hg(s) der Gleichung (8) durch den Aufbau von Fig. 20 realisiert.
- In Fig. 20 sind die Bezugszeichen 31a und 31b Integratoren mit Übertragungsfunktionen von 1/sτ, 321 und 322 sind Addierer, und 331 und 332 sind Multiplizierer. Die Addierer 321 und 322 und die Integratoren 31a und 31b sind seriell verbunden. Der Multiplizierer 331 multipliziert die Ausgabe des Integrators 31a mit dem Koeffizienten DF und fügt das Resultat zu dem Addierer 322 hinzu. Der Addierer 322 multipliziert die Ausgabe des Integrators 31b mit dem Koeffizienten -1 und fügt das Resultat zu dem Addierer 321 hinzu.
- Durch solch einen Aufbau des Integrators 31a, der Gegenkopplungsschleife des Multiplizierers 331 und des Addierers 322 kann ein Filter erster Ordnung mit einer Übertragungsfunktion von DF/(sτ + DF) realisiert werden. Durch die Seriellverbindung des Verzögerungsfilters erster Ordnung mit dem Integrator 31b und die Gegenkopplung des Koeffizienten -1 durch den Multiplizierer 332 wird ein Zweitordnungsfilter mit einer Übertragungsfunktion von Hg(s) konstruiert. Das kritisch dämpfende Filter zweiter Ordnung wird durch Auswahl von DF als 2 gebildet.
- Figur 21 zeigt ein kritisch dämpfendes Filter zweiter Ordnung, das auf diese Weise konstruiert ist. Teile, die dieselben Bezugszeichen wie in Fig. 20 tragen, bezeichnen dieselben Teile. Das heißt, 31a und 31b sind Integratoren, und 311a und 311b sind Register. Ferner sind 312a, 312b, 321 und 322 Addierer und 313a, 313b, 331 und 332 Multiplizierer.
- Figuren 22a und 22b zeigen die Stufenansprechkennlinien des kritisch dämpfenden Filters von Fig. 21, wobei Fig. 22a die Stufeneingabe- und Fig. 22b die Stufenansprechkennlinie zeigt.
- Hier erfolgt eine Erläuterung des Konstruktionsverfahrens (2) eines kritisch dämpfenden Filters zweiter Ordnung unter Bezugnahme auf Fig. 23.
- In dem Fall eines kritisch dämpfenden Filters zweiter Ordnung beträgt der Dämpfungsfaktor 2, so ändert sich die Übertragungsfunktion Hg(s) wie in der folgenden Gleichung (9):
- Hc(s) = 1/(s²τ² + 2sτ + 1) = 1/(sτ + 1)²
- = 1/{(sτ + 1)} {1/(sτ + 1)} ... (9)
- Deshalb wird das kritisch dämpfende Filter zweiter Ordnung durch Seriellverbindung eines primären Filters mit einer Übertragungsfunktion von 1/(sτ + 1) realisiert und kann so durch den in Fig. 23 gezeigten Aufbau realisiert werden.
- In Fig. 23 sind Bezugszeichen 31a und 31b Integratoren mit Übertragungsfunktionen von 1/sτ, dieselben wie im Fall von Fig. 20, 323 und 324 sind Addierer, und 333 und 334 sind Multiplizierer. Multiplizierer 333 multipliziert die Ausgabe des Integrators 31a mit dem Koeffizienten -1 und fügt das Resultat zu dem Addierer 323 hinzu. Der Multiplizierer 334 multipliziert die Ausgabe des Integrators 32 mit dem Koeffizienten -1 und addiert das Resultat zu dem Addierer 324.
- Durch solch einen Aufbau des Integrators 31a, der Gegenkopplungsschleife des Multiplizierers 333 und eines Addierers 323 kann ein primäres Verzögerungsfilter mit einer Übertragungsfunktion von 1/(sτ + 1) realisiert werden. Ähnlich kann durch den Integrator 31b, die Gegenkopplungsschleife des Multiplizierers 334 und den Addierer 324 ein primäres Verzögerungsfilter mit derselben Übertragungsfunktion 1/(sτ + 1) konstruiert werden. Durch Seriellverbindung der zwei primären Verzögerungsfilter wird ein kritisch dämpfendes Filter zweiter Ordnung mit einer Übertragungsfunktion von 1/(sτ + 1)² konstruiert.
- Das Konstruktionsverfahren des kritisch dämpfenden Filters zweiter Ordnung (2) umfaßt eine zweistufige Reihe von primären Verzögerungsfiltern mit demselben Aufbau, so ist die Konstruktion einfacher und leichter als bei dem Konstruktionsverfahren des kritisch dämpfenden Filters zweiter Ordnung (1).
- Figur 24 zeigt Fig. 23 ausführlicher.
- Unter Bezugnahme auf Fig. 25 bis Fig. 27 erfolgt eine Erläuterung des Modulationsinkorporationsverfahrens (4).
- Anders als die Modulationsinkorporationsverfahren (1) bis (3) fügt das Modulationsinkorporationsverfahren (4) eine Zufallszahlenzeitfolge zu dem Verzögerungsfilterverbinder erster Ordnung hinzu, der ein kritisch dämpfendes Filter zweiter Ordnung bildet, und erzeugt modulierte Interpolationsparameter.
- Figur 25 zeigt ein kritisch dämpfendes Filter zweiter Ordnung 30B, das aus einer zweistufigen Seriellverbindung von Verzögerungsfiltern erster Ordnung besteht und denselben Aufbau wie das kritisch dämpfende Filter zweiter Ordnung 30B von Fig. 23 hat. Entsprechende Teile tragen entsprechende Bezugszeichen. Das heißt, 31a und 31b sind Integratoren, 323 und 324 sind Addierer, und 333 und 334 sind Multiplizierer mit Multiplikationskonstanten von -1. Bei diesem Aufbau werden, falls eine Zufallszahlenzeitfolge zu dem Addierer 324 hinzugefügt wird, der dem Verbinder der zwei Verzögerungsfilter erster Ordnung entspricht, modulierte Interpolationsparameter erzeugt.
- Figur 26 zeigt die Stufenansprechkennlinien, die durch das Modulationsinkorporationsverfahren (4) von Fig. 25 erhalten wurden. Die Stufenveränderungen können gleitend interpoliert werden, wie in der Figur gezeigt, und es ist möglich, modulierte Interpolationsparameter zu erzeugen, die dem Modulationszeitfolgesignal entsprechen.
- Figur 27 zeigt durch ein Blockdiagramm einen spezifischen Aufbau des Modulationsinkorporationsverfahrens (4). Der Aufbau des Sprachsynthesemittels 20D ist derselbe wie jener von Fig. 10, mit der Ausnahme, daß der Parameterinterpolator 211D des Sprachsynthetisators 21D durch das kritisch dämpfende Filter zweiter Ordnung 30B von Fig. 25 konstruiert ist. Die Operation des Modulationsinkorporationsverfahrens (4) von Fig. 27 geht aus Fig. 24 und der Erläuterung der Operation der verschiedenen Modulationsinkorporationsverfahren hervor, so wird die Erläuterung weggelassen.
- Wie aus der Erläuterung bis jetzt hervorgeht, nutzen das primäre Verzögerungsfilter und das kritisch dämpfende Filter zweiter Ordnung beide als bildende Elemente einen Integrator mit einer Übertragungsfunktion von 1/sτ (= ω/s). Deshalb würde eine Vereinfachung des Aufbaus dieses Integrators eine Vereinfachung des Aufbaus des primären Verzögerungsfilters und des kritisch dämpfenden Filters zweiter Ordnung gestatten.
- Bei der vorliegenden Erfindung vereinfacht eine Approximation der digitalen Integration in dem Integrator durch das einfache Eulersche Integrationsverfahren den Aufbau des Integrators. Unten erfolgt eine Erläuterung des Integratorkonstruktionsverfahrens der vorliegenden Erfindung unter Bezugnahme auf Fig. 28.
- In Fig. 28 ist Bezugszeichen 31 ein Integrator, der aus einem Register 311, Addierer 312 und Multiplizierer 313 besteht. Der Multiplizierer 313, Addierer 312 und das Register 311 sind seriell verbunden. Zu dem Wert des Registers 311 zu einem Zeitpunkt wird durch den Addierer 312 ein Eingabewert addiert und als Wert des Registers 311 zu dem nächsten Zeitpunkt verwendet. Für den Takt, der die Zeit regelt, wird von demselben Zeitlagentakt Gebrauch gemacht, wie er für die Erzeugung der Zufallszahlenzeitfolge verwendet wird. Der Multiplizierer 313 multipliziert den umgekehrten Wert der Zeitkonstante τ (1/τ = ω) mit der Eingabe und fügt das Resultat dem Addierer 312 hinzu. Falls eine Potenz von 2 als Wert der Zeitkonstante τ ausgewählt wird, dann ist es möglich, diese Multiplikation durch eine Verschiebung zu ersetzen. In diesem Fall ist der Betrag der Verschiebung immer konstant und kann so durch Verschieben der Verbindungsleitung realisiert werden. Es sind keine Addierschaltungen (Funktionskomponenten) erforderlich, und so kann die Schaltung vereinfacht werden.
- Durch den obigen Aufbau wird eine Integrationsverarbeitung ausgeführt, die durch das Eulersche Integrationsverfahren approximiert ist, und ein Integrator kann durch einen einfachen Aufbau realisiert werden.
- Das primäre Verzögerungsfilter kann durch die Verwendung des zuvor unter (E) genannten Integrators als Integrator 31 des primären Verzögerungsfilters realisiert werden. Ferner ist es möglich, ein primäres Verzögerungsfilter mittels anderer Prinzipien zu konstruieren. Unten erfolgt eine Erläuterung von anderen Verfahren des Aufbaus von primären Verzögerungsfiltern unter Bezugnahme auf Fig. 29 und Fig. 30.
- Ein typischer Sprachsynthetisator wird von Dr. Dennis H. Klatt in "Journal of the Acoustic Society of America", 67(3), März 1980, S. 971 bis 995 "Software for a cascade/parallel format synthesizer" beschrieben. Das Stimmtraktkennliniensimulationsfilter des Sprachsynthetisators verwendet, wie in Fig. 29 gezeigt, 17 Zweitordnungseinheitsfilter. Das Zweitordnungseinheitsfilter von Fig. 29 ist ein digitales Filter des unendlichen Zweitordnungsimpulscharakteristiktyps (IIR). In der Figur ist Bezugszeichen 35 (35a und 35b) ein Verzögerungselement mit einer Abtastperiode von T, 361 und 362 sind Addierer, 371, 372 und 373 sind Multiplizierer mit Konstanten A, B und C. Ein Signal Sa, bestehend aus der Eingabe, die mit der Konstante A durch den Multiplizierer 371 multipliziert wurde, wird dem Verzögerungselement 35a eingegeben, die Ausgabe des Verzögerungselementes 35a wird dem Verzögerungselement 35b eingegeben, und die Summe der drei Signale von Signal Sa, bestehend aus der Eingabe, die durch den Multiplizierer 371 mit der Konstante A multipliziert wurde, Signal Sb, bestehend aus der Ausgabe des Verzögerungselementes 35a, die durch den Multiplizierer 372 mit der Konstante B multipliziert wurde, und Signal Sc, bestehend aus der Ausgabe des Verzögerungselementes 35b, die durch den Multiplizierer 373 mit der Konstante C multipliziert wurde, wird ausgegeben. Die so gebildeten 17 Zweitordnungseinheitsfilter haben alle denselben Aufbau, aber die Multiplikationskonstanten A, B und C unterscheiden sich bei den individuellen Einheitsfiltern. Das heißt, indem den Multiplikationskonstanten A, B und C geeignete Werte verliehen werden, können die Zweitordnungseinheitsfilter Bandfilter oder Bandsperrfilter werden und es können verschiedene Mittenfrequenzen erhalten werden. Der Hauptteil des Sprachsynthetisators wird durch eine Auswahl von Filtern identischen Aufbaus realisiert, so besteht der Vorteil, wenn dieser softwaremäßig realisiert wird, daß eine einzelne Subroutine gemeinsam genutzt werden kann, und der Vorteil, wenn dieser hardwaremäßig realisiert wird, daß die Entwicklungskosten durch die Verwendung einer Anzahl von Schaltungen desselben Aufbaus und IC's desselben Aufbaus reduziert werden können.
- Die Übertragungsfunktion H(z) und die Multiplikationskonstanten A, B und C in dem Fall der Verwendung des Zweitordnungseinheitsfilters von Fig. 29 als Bandfilter im obenstehenden Abschnitt sind durch die folgenden Gleichungen gegeben:
- Hk(z) = A/(1 - BZ&supmin;¹ - CZ&supmin;²) ... (10)
- C = -exp(-2π BW T) ... (11)
- B = 2 exp(-π BW T)cos(2π f T) ... (12)
- A = 1 - B - C ... (13)
- wobei T: Abtastperiode
- F: Resonanzfrequenz des Filters
- BW: Frequenzbandbreite des Filters
- Bei einem anderen Verfahren des Aufbaus eines Verzögerungsfilters erster Ordnung wurde festgestellt, daß durch Verwendung des obengenannten Zweitordnungseinheitsfilters ein Verzögerungsfilter erster Ordnung unter Verwendung eines oben bei (E) herausgefundenen Integrators konstruiert werden kann.
- Wenn ein Verzögerungsfilter erster Ordnung unter Verwendung eines oben bei (E) gefundenen Integrators 31 konstruiert wird, ist das Resultat so wie in Fig. 30 gezeigt. In der Figur ist Bezugszeichen 32 ein Addierer und 33 ein Multiplizierer. Hier nimmt das Register 311 die Eingabe eines gewissen Zeitpunktes auf und gibt sie bei dem nächsten Zeitpunkt (das heißt, Abtastperiode) zur Wiedereingabe aus, und entspricht somit dem Verzögerungselement 35 (35a und 35b) des Zweitordnungseinheitsfilters von Fig. 21. Deshalb würde, falls die Übertragungsfunktion H&sub1;(z) des primären Verzögerungsfilters von Fig. 30 unter Verwendung derselben Zeichen wie die Übertragungsfunktion Hk(z) des Zweitordnungseinheitsfilters von Fig. 29 ausgedrückt wird, H&sub1;(z) durch die folgende Gleichung (14) ausgedrückt werden und könnte ferner zu Gleichung (15) verändert werden:
- Ein Vergleich mit Hk(z) = A(1 - Bz&supmin;¹ - Cz&supmin;²) von Gleichung (10) ergibt folgende Gleichung (16):
- A = 1/τ + 1, B = τ/τ + 1, C = 0 ... (16)
- Unter Verwendung von A, B und C von Gleichung (16) ist es möglich, ein primäres Verzögerungsfilter durch ein Zweitordnungsfilter des IIR-Typs zu konstruieren.
- Solch eine Konstruktion eines Verzögerungsfilters erster Ordnung kann nicht nur als Stimmtraktfilter eines Sprachsynthetisators verwendet werden, sondern auch als Filter erster Ordnung bei den zuvor genannten Modulationsverfahren und Konstruktionsverfahren des kritisch dämpfenden Filters zweiter Ordnung.
- Das Konstruktionsverfahren des kritisch dämpfenden Filters zweiter Ordnung (3) konstruiert ein kritisch dämpfendes Filter zweiter Ordnung unter Verwendung des obengenannten Zweitordnungseinheitsfilters (IIR- Zweitordnungsfilter) und des Integrators von (E). Unten erfolgt eine Erläuterung des Verfahrens des Aufbaus (3) des kritisch dämpfenden Filters zweiter Ordnung unter Bezugnahme auf Fig. 31.
- Das kritisch dämpfende Filter zweiter Ordnung ist durch die obengenannte Gleichung (9) und die zweistufige Seriellverbindung der Verzögerungsfilter erster Ordnung konstruiert, wie in Fig. 23 gezeigt.
- Falls die Übertragungsfunktion Hc(s) des kritisch dämpfenden Filters zweiter Ordnung von Gleichung (9) unter Verwendung derselben Zeichen wie bei der Übertragungsfunktion Hk(z) des Zweitordnungsfilters, die in Gleichung (10) gezeigt ist, ausgedrückt wird (gezeigt durch H&sub2;(z)), wird Gleichung (17) erhalten:
- Ein Vergleich von H&sub2;(z) von Gleichung (17) und von Hk(z) = A/(1 - Bz&supmin;¹ - Cz&supmin;²) von Gleichung (10) ergibt die folgende Gleichung (18):
- Unter Verwendung von A, B und C von Gleichung (18) ist es möglich, ein kritisch dämpf endes Filter zweiter Ordnung 30c durch ein Zweitordnungsfilter des IIR-Typs zu konstruieren, wie in Fig. 31 gezeigt ist.
- In dem kritisch dämpfenden Filter zweiter Ordnung 30c von Fig. 31 ist Bezugszeichen 311 (311a und 311b) ein Register und 325 und 326 sind Addierer. Bezugszeichen 335, 336 und 337 sind Multiplizierer zum Multiplizieren der Konstanten A, B und C von Gleichung (18).
- Wie oben erläutert, werden gemäß den verschiedenen Aspekten der vorliegenden Erfindung die folgenden Effekte erreicht:
- (a) Da durch das vollkommen digitale Verfahren eine Modulation verliehen wird, ist es möglich, Sprache mit stabilen Modulationskennlinien zu synthetisieren.
- (b) Da der ausgegebenen Sprache auf der Grundlage eines Modulationszeitfolgesignals, das durch das Integrationsfilter einer Zufallszeitfolge erhalten wurde, eine Modulation verliehen wird, ist es möglich, Sprache sehr natürlich zu synthetisieren.
- (c) Das kritisch dämpfende Filter zweiter Ordnung, das die Parameterinterpolation während der Sprachsynthese ausführt, kann unter Verwendung von digitalen Filtern sehr einfach konstruiert werden.
- (d) Wenn ein kritisch dämpfendes Filter zweiter Ordnung verwendet wird, ist eine gleitende Verbindung von Parametern möglich, und so ist es zusammen mit Obigem (b) möglich, eine sehr natürliche synthetische Sprache zu erhalten.
- Viele sehr unterschiedliche Ausführungsformen der vorliegenden Erfindung können konstruiert werden, ohne den Umfang der vorliegenden Erfindung zu verlassen, und die vorliegende Erfindung ist nicht auf die spezifischen, oben beschriebenen Ausführungsformen begrenzt, außer wie in den beigefügten Ansprüchen definiert.
Claims (14)
1. Ein Sprachsynthesesystem mit:-
einem ersten Signalerzeugungsmittel (211,
212, 213) zum Erzeugen eines Impulsfolgesignals, das als
Tonquelle für stimmhafte Töne dient; einem zweiten
Signalerzeugungsmittel (211, 214, 215) zum Erzeugen eines
Rauschsignals, das als Tonquelle für stimmlose Töne dient, und das
ein Mittel (214) zum Erzeugen von Zufallsdaten hat;
einem Mittel (217) zum Auswählen eines des
genannten Impulsfolgesignals oder Rauschsignals, ansprechend
auf ein Auswahlsignal; und
einem Mittel (216) zum Empfangen eines
Ausgabesignals von dem genannten Auswahlmittel (217) und zum
Filtern des empfangenen Signals auf der Grundlage eines
Stimmtraktsimulationsverfahrens;
gekennzeichnet durch:-
ein Filtermittel (12B), das mit dem genannten
Zufallsdatenerzeugungsmittel (214) operativ verbunden ist,
um die Zufallsdaten davon zu empfangen und zu filtern, und
eine Verzögerungsübertragungsfunktion erster Ordnung H(s) :
1/(sτ + α) hat, wobei τ eine Zeitkonstante und α ein
Koeffizient ist, zum Ausgeben von mit erster Ordnung
verzögerten Zufallsdaten; und
bei dem das erste Signalerzeugungsmittel und
das zweite Signalerzeugungsmittel ein gemeinsames
Parameterinterpolationsmittel (211) umfassen, zum Empfangen eines
ersten Signals (Fs), das die Grundfrequenz des stimmhaften
Tons aufweist, eines zweiten Signals (As), das die Amplitude
der stimmhaften Tonquelle aufweist, und eines dritten
Signals (AN), das die Amplitude der stimmlosen Tonquelle
aufweist, und zum Interpolieren der empfangenen ersten bis
dritten Signale, um erste bis dritte interpolierte Signale
(F's, A's, A'N) auszugeben;
bei dem das erste Signalerzeugungsmittel ein
Mittel (212) zum Erzeugen eines Impulsfolgesignals umfaßt,
das durch das erste interpolierte Signal (F's)
frequenzgesteuert wird, und ein Mittel (213) zum Multiplizieren des
Impulsfolgesignals mit dem zweiten interpolierten Signal
(A's), um dem Auswahlmittel ein erstes multipliziertes
Signal zuzuführen,
bei dem das zweite Signalerzeugungsmittel
ferner ein Mittel (215) umfaßt zum Multiplizieren der
Zufallsdaten darin, die von dem zufallsdatenerzeugungsmittel
(214) ausgegeben wurden, mit dem dritten interpolierten
Signal (A'N), um dem Auswahlmittel ein zweites
multipliziertes Signal zuzuführen; und
bei dem das Sprachsynthesesystem ein Mittel
(22) zum Addieren einer Konstante als systematische
Abweichung zu den mit erster Ordnung verzögerten Zufallsdaten von
dem Verzögerungsmittel erster Ordnung (12B) umfaßt, und ein
Mittel (23) zum Multiplizieren eines addierten Signals von
dem Addiermittel mit der Ausgabe von dem
Stimmtraktsimulationsfiltermittel (216), um ein Sprachsignal auszugeben.
2. Ein Sprachsynthesesystem mit:-
einem ersten Signalerzeugungsmittel (211,
212, 213, 24, 25) zum Erzeugen eines Impulsfolgesignals, das
als Tonquelle für stimmhafte Töne dient; einem zweiten
Signalerzeugungsmittel (211, 214, 215, 26) zum Erzeugen
eines Rauschsignals, das als Tonquelle für stimmlose Töne
dient, und das ein Mittel (214) zum Erzeugen von
Zufallsdaten hat;
einem Mittel (217) zum Auswählen eines des
genannten Impulsfolgesignals oder Rauschsignals, ansprechend
auf ein Auswahlsignal; und
einem Mittel (216) zum Empfangen eines
Ausgabesignals von dem genannten Auswahlmittel (217) und zum
Filtern des empfangenen Signals auf der Grundlage eines
Stimmtraktsimulationsverfahrens;
gekennzeichnet durch:-
ein Filtermittel (12B), das mit dem genannten
Zufallsdatenerzeugungsmittel (214) operativ verbunden ist,
um die Zufallsdaten davon zu empfangen und zu filtern, und
eine Verzögerungsübertragungsfunktion erster Ordnung H(s) :
1/(sτ + α) hat, wobei τ eine Zeitkonstante und α ein
Koeffizient ist, zum Ausgeben von mit erster Ordnung
verzögerten Zufallsdaten; und durch
ein Mittel (22) zum Addieren einer Konstante
als systematische Abweichung zu den mit erster Ordnung
verzögerten Zufallsdaten von dem Verzögerungsmittel erster
Ordnung (12B);
bei dem das erste Signalerzeugungsmittel und
das zweite Signalerzeugungsmittel ein gemeinsames
Parameterinterpolationsmittel (211) umfassen, zum Empfangen
eines ersten Signals (Fs), das die Grundfrequenz des
stimmhaften Tons aufweist, eines zweiten Signals (As), das
die Amplitude der stimmhaften Tonquelle aufweist, und eines
dritten Signals (AN), das die Amplitude der stimmlosen
Tonquelle aufweist, und zum Interpolieren der empfangenen
ersten bis dritten Signale, um erste bis dritte
interpolierte Signale (F's, A's, A'N) auszugeben;
bei dem das erste Signalerzeugungsmittel
ferner ein erstes Multiplikationsmittel (24) umfaßt, das das
erste interpolierte Signal (F's) mit dem addierten Signal
von dem Addiermittel (22) multipliziert, ein Mittel (212)
zum Erzeugen eines Impulsfolgesignals, das durch das
multiplizierte Signal von dem ersten Multiplikationsmittel
(24) frequenzgesteuert wird, ein zweites
Multiplikationsmittel (25) zum Multiplizieren des zweiten interpolierten
Signals (A's) mit dem addierten Signal von dem Addiermittel
(22) und ein drittes Multiplikationsmittel (213) zum
Multiplizieren
des Impulsfolgesignals mit dem zweiten
multiplizierten Signal von dem zweiten Multiplikationsmittel (25),
um dem Auswahlmittel (217) das multiplizierte Signal
zuzuführen; und
bei dem das zweite Signalerzeugungsmittel
ferner ein viertes Multiplikationsmittel (26) zum
Multiplizieren des addierten Signals von dem Addiermittel (22) mit
dem dritten interpolierten Signal (A'N) umfaßt, und ein
fünftes Multiplikationsmittel (215) zum Multiplizieren des
Zufallsdatensignals von dem Zufallsdatenerzeugungsmittel
(214) darin mit dem fünften multiplizierten Signal von dem
fünften Multiplikationsmittel (26), um dem Auswahlmittel
(217) das fünfte multiplizierte Signal zuzuführen.
3. Ein Sprachsynthesesystem mit:-
einem ersten Signalerzeugungsmittel (211,
212, 213, 27, 28) zum Erzeugen eines Impulsfolgesignals, das
als Tonquelle für stimmhafte Töne dient; einem zweiten
Signalerzeugungsmittel (211, 214, 215, 29) zum Erzeugen
eines Rauschsignals, das als Tonquelle für stimmlose Töne
dient, und das ein Mittel (214) zum Erzeugen von
Zufallsdaten hat;
einem Mittel (217) zum Auswählen eines des
genannten Impulsfolgesignals oder Rauschsignals, ansprechend
auf ein Auswahlsignal; und
einem Mittel (216) zum Empfangen eines
Ausgabesignals von dem genannten Auswahlmittel (217) und zum
Filtern des empfangenen Signals auf der Grundlage eines
Stimmtraktsimulationsverfahrens;
gekennzeichnet durch:-
ein Filtermittel (12B), das mit dem genannten
Zufallsdatenerzeugungsmittel (214) operativ verbunden ist,
um die Zufallsdaten davon zu empfangen und zu filtern, und
eine Verzögerungsübertragungsfunktion erster Ordnung H(s) :
1/(sτ
+ α) hat, wobei τ eine Zeitkonstante und α ein
Koeffizient ist, zum Ausgeben von mit erster Ordnung verzögerten
Zufallsdaten; und dadurch, daß
das erste Signalerzeugungsmittel und das
zweite Signalerzeugungsmittel ein gemeinsames
Parameterinterpolationsmittel (211) umfassen, zum Empfangen eines
ersten Signals (Fs), das die Grundfrequenz des stimmhaften
Tons aufweist, eines zweiten Signals (As), das die Amplitude
der stimmhaften Tonquelle aufweist, und eines dritten
Signals (AN), das die Amplitude der stimmlosen Tonquelle
aufweist, und zum Interpolieren der empfangenen ersten bis
dritten Signale, um erste bis dritte interpolierte Signale
(F's, A's, A'N) auszugeben;
das erste Signalerzeugungsmittel ferner ein
erstes Addiermittel (27) zum Addieren des ersten
interpolierten Signals (F's) zu dem mit erster Ordnung verzögerten
Signal von dem Verzögerungsmittel erster Ordnung umfaßt, ein
Mittel (212) zum Erzeugen eines Impulsfolgesignals, das
durch das erste addierte Signal von dem ersten Addiermittel
(27) frequenzgesteuert wird, ein zweites Addiermittel (28)
zum Addieren des zweiten interpolierten Signals (A's) zu dem
mit erster Ordnung verzögerten Signal und ein erstes
Multiplikationsmittel (213) zum Multiplizieren des
Impulsfolgesignals mit dem zweiten addierten Signal von dem
zweiten Addiermittel (28), um an das Auswahlmittel das erste
multiplizierte Signal auszugeben; und daß
das zweite Signalerzeugungsmittel ferner ein
drittes Addiermittel (29) zum Addieren des dritten
interpolierten Signals (A'N) zu dem mit erster Ordnung verzögerten
Signal umfaßt, und ein zweites Multiplikationsmittel (215)
zum Multiplizieren der Zufallsdaten von dem
Zufallsdatenerzeugungsmittel (214) darin mit dem dritten addierten
Signal von dem dritten Addiermittel (29), um an das
Auswahlmittel (217) das zweite multiplizierte Signal auszugeben.
4. Ein Sprachsynthesemittel nach Anspruch 1, 2 oder
3, bei dem das Verzögerungsmittel erster Ordnung (12B) ein
Addiermittel (122) umfaßt, ein integrales Mittel (31), das
mit dem Addiermittel verbunden ist, um eine Ausgabe von dem
Addiermittel zu empfangen, und ein Gegenkopplungsmittel
(123), das zwischen einem Ausgangsanschluß des integralen
Mittels und einem Eingangsanschluß des Addiermittels
vorgesehen ist, zum Multiplizieren der Ausgabe von dem
integralen Mittel mit dem Koeffizienten α und zum
Invertieren eines Vorzeichens des multiplizierten Wertes, wobei das
Addiermittel die Zufallsdaten von dem
Zufallsdatenerzeugungsmittel (214) zu dem invertiert-multiplizierten Wert von
dem Gegenkopplungsmittel addiert.
5. Ein Sprachsynthesemittel nach Anspruch 4, bei dem
das integrale Mittel (31) des Verzögerungsmittels erster
Ordnung (12B) ein Multiplikationsmittel (313) umfaßt, ein
Addiermittel (312), ein Datenhaltemittel (311) und ein
Rückkopplungsleitungsmittel, das zwischen einem
Ausgangsanschluß des Datenhaltemittels und einem Eingangsanschluß
des Addiermittels vorgesehen ist;
wobei das Multiplikationsmittel (313) die
Ausgabe von dem Addiermittel (122) des Verzögerungsmittels
erster Ordnung mit einem Faktor von 1/τ multipliziert; und
das Addiermittel (312) in dem integralen
Mittel die Ausgabe von dem Multiplikationsmittel (313) zu
der Ausgabe von dem Datenhaltemittel (311) durch das
Rückkopplungsleitungsmittel addiert.
6. Ein Sprachsynthesesystem nach irgendeinem
vorhergehenden Anspruch, bei dem der Koeffizient α eins ist.
7. Ein Sprachsynthesesystem nach irgendeinem
vorhergehenden
Anspruch, bei dem das gemeinsame
Parameterinterpolationsmittel (211) ein lineares Interpolationsmittel ist.
8. Ein Sprachsynthesesystem nach irgendeinem der
Ansprüche 1 bis 6, bei dem das gemeinsame
Parameterinterpolationsmittel (211) ein erstes Datenhaltemittel (301), ein
kritisch dämpfendes Filtermittel zweiter Ordnung (305) und
ein zweites Datenhaltemittel (302) umfaßt, die seriell
verbunden sind.
9. Ein Sprachsynthesesystem nach Anspruch 8, bei dem
das kritisch dämpfende Filtermittel zweiter Ordnung (30S)
erste und zweite seriell verbundene Addiermittel (321, 322)
umfaßt, seriell verbundene erste und zweite integrale Mittel
(31a, 31b), ein erstes Multiplikationsmittel (331), das
zwischen einem Ausgangsanschluß des ersten integralen
Mittels (31a) und einem Eingangsanschluß des zweiten
Addiermittels (322) vorgesehen ist, zum Multiplizieren der Ausgabe
des ersten integralen Mittels mit einem Dämpfungsfaktor DF
und zum Invertieren eines Vorzeichens des multiplizierten
Wertes, und ein zweites Multiplikationsmittel (332), das
zwischen einem Ausgangsanschluß des zweiten integralen
Mittels (31b) und einem Eingangsanschluß des ersten
Addiermittels (321) vorgesehen ist, zum Multiplizieren einer
Ausgabe von dem zweiten integralen Mittel (31b) mit einem
Koeffizienten, und zum Invertieren eines Vorzeichens des
multiplizierten Wertes,
wobei das erste Addiermittel (321) eine
Ausgabe von dem ersten Datenhaltemittel (301) des
gemeinsamen Parameterinterpolationsmittels (211) zu dem invertiert
multiplizierten Wert von dem zweiten Multiplikationsmittel
(322) addiert; und
das zweite Addiermittel (322) eine Ausgabe
von dem ersten Addiermittel (321) zu dem invertiert
multiplizierten
Wert von dem ersten Multiplikationsmittel (331)
addiert.
10. Ein Sprachsynthesesystem nach Anspruch 9, bei dem
jedes der ersten und zweiten integralen Mittel (31a, 31b)
Multiplikationsmittel (313a, 313b), Addiermittel (312a,
312b), Datenhaltemittel (311a, 311b) und eine
Rückkopplungsleitung umfaßt, die zwischen einem Ausgangsanschluß der
Datenhaltemittel (311a, 311b) und einem Eingangsanschluß der
Addiermittel (312a, 312b) vorgesehen ist;
wobei die Multiplikationsmittel (313a, 313b)
die Eingabe mit dem Faktor 1/τ multiplizieren und die
Addiermittel (312a, 312b) die Ausgabe von den
Multiplikationsmitteln (313a, 313b) zu der Ausgabe von den
Datenhaltemitteln (311a, 311b), die über die Rückkopplungsleitung
empfangen wurde, addieren.
11. Ein Sprachsynthesesystem nach Anspruch 10, bei dem
der Dämpfungsfaktor DF zwei und der Koeffizient, der in dem
zweiten Multiplikationsmittel (332) verwendet wird, eins
ist.
12. Ein Sprachsynthesesystem nach Anspruch 8, bei dem
das kritisch dämpfende Filter zweiter Ordnung (30S) seriell
verbundene erste und zweite Verzögerungsmittel erster
Ordnung umfaßt, wovon jedes Addiermittel (323, 324) enthält,
integrale Mittel (31a, 31b) und Multiplikationsmittel (333,
334), die zwischen einem Ausgangsanschluß der integralen
Mittel (31a, 31b) und einem Eingangsanschluß der
Addiermittel (323, 324) vorgesehen sind, zum Multiplizieren einer
Ausgabe der integralen Mittel (31a, 31b) mit einem
Koeffizienten und zum Invertieren derselben;
wobei die Addiermittel (323, 324) eine
Eingabe zu dem invertiert multiplizierten Wert von den
Multiplikationsmitteln (333, 334) addieren und einen
addierten Wert den integralen Mitteln (31a, 31b) zuführen.
13. Ein Sprachsynthesesystem nach Anspruch 12, bei dem
die integralen Mittel (31a, 31b) Multiplikationsmittel,
Addiermittel, Datenhaltemittel und eine Rückkopplungsleitung
umfassen, die zwischen einem Ausgangsanschluß der
Datenhaltemittel und einem Eingangsanschluß der Addiermittel
vorgesehen ist;
wobei die Multiplikationsmittel die Eingabe
mit dem Faktor 1/τ multiplizieren und die Addiermittel eine
Ausgabe von den Multiplikationsmitteln zu der Ausgabe von
den Datenhaltemitteln, die über die Rückkopplungsleitung
erhalten wurde, addieren.
14. Ein Sprachsynthesesystem nach Anspruch 12 oder 13,
bei dem der Koeffizient, der in den genannten
Multiplikationsmitteln (333, 334) verwendet wird, eins ist.
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP62061149A JP2595235B2 (ja) | 1987-03-18 | 1987-03-18 | 音声合成装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
DE3883034D1 DE3883034D1 (de) | 1993-09-16 |
DE3883034T2 true DE3883034T2 (de) | 1993-12-02 |
Family
ID=13162769
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE88302313T Expired - Fee Related DE3883034T2 (de) | 1987-03-18 | 1988-03-17 | System zur Sprachsynthese. |
Country Status (4)
Country | Link |
---|---|
US (1) | US5007095A (de) |
EP (1) | EP0283277B1 (de) |
JP (1) | JP2595235B2 (de) |
DE (1) | DE3883034T2 (de) |
Families Citing this family (116)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR920008259B1 (ko) * | 1990-03-31 | 1992-09-25 | 주식회사 금성사 | 포만트의 선형전이구간 분할에 의한 한국어 합성방법 |
JPH07104788A (ja) * | 1993-10-06 | 1995-04-21 | Technol Res Assoc Of Medical & Welfare Apparatus | 音声強調処理装置 |
US6101469A (en) * | 1998-03-02 | 2000-08-08 | Lucent Technologies Inc. | Formant shift-compensated sound synthesizer and method of operation thereof |
DE19908137A1 (de) | 1998-10-16 | 2000-06-15 | Volkswagen Ag | Verfahren und Vorrichtung zur automatischen Steuerung mindestens eines Gerätes per Sprachdialog |
US8645137B2 (en) | 2000-03-16 | 2014-02-04 | Apple Inc. | Fast, language-independent method for user authentication by voice |
US8103505B1 (en) * | 2003-11-19 | 2012-01-24 | Apple Inc. | Method and apparatus for speech synthesis using paralinguistic variation |
US8677377B2 (en) | 2005-09-08 | 2014-03-18 | Apple Inc. | Method and apparatus for building an intelligent automated assistant |
US9318108B2 (en) | 2010-01-18 | 2016-04-19 | Apple Inc. | Intelligent automated assistant |
US8977255B2 (en) | 2007-04-03 | 2015-03-10 | Apple Inc. | Method and system for operating a multi-function portable electronic device using voice-activation |
JP4246792B2 (ja) * | 2007-05-14 | 2009-04-02 | パナソニック株式会社 | 声質変換装置および声質変換方法 |
US9330720B2 (en) | 2008-01-03 | 2016-05-03 | Apple Inc. | Methods and apparatus for altering audio output signals |
US8996376B2 (en) | 2008-04-05 | 2015-03-31 | Apple Inc. | Intelligent text-to-speech conversion |
US10496753B2 (en) | 2010-01-18 | 2019-12-03 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
US20100030549A1 (en) | 2008-07-31 | 2010-02-04 | Lee Michael M | Mobile device having human language translation capability with positional feedback |
JP5428297B2 (ja) * | 2008-11-10 | 2014-02-26 | ソニー株式会社 | 発電装置 |
US9959870B2 (en) | 2008-12-11 | 2018-05-01 | Apple Inc. | Speech recognition involving a mobile device |
US9858925B2 (en) | 2009-06-05 | 2018-01-02 | Apple Inc. | Using context information to facilitate processing of commands in a virtual assistant |
US10706373B2 (en) | 2011-06-03 | 2020-07-07 | Apple Inc. | Performing actions associated with task items that represent tasks to perform |
US10241752B2 (en) | 2011-09-30 | 2019-03-26 | Apple Inc. | Interface for a virtual digital assistant |
US10241644B2 (en) | 2011-06-03 | 2019-03-26 | Apple Inc. | Actionable reminder entries |
US9431006B2 (en) | 2009-07-02 | 2016-08-30 | Apple Inc. | Methods and apparatuses for automatic speech recognition |
US10276170B2 (en) | 2010-01-18 | 2019-04-30 | Apple Inc. | Intelligent automated assistant |
US10705794B2 (en) | 2010-01-18 | 2020-07-07 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
US10679605B2 (en) | 2010-01-18 | 2020-06-09 | Apple Inc. | Hands-free list-reading by intelligent automated assistant |
US10553209B2 (en) | 2010-01-18 | 2020-02-04 | Apple Inc. | Systems and methods for hands-free notification summaries |
WO2011089450A2 (en) | 2010-01-25 | 2011-07-28 | Andrew Peter Nelson Jerram | Apparatuses, methods and systems for a digital conversation management platform |
US8682667B2 (en) | 2010-02-25 | 2014-03-25 | Apple Inc. | User profiling for selecting user specific voice input processing information |
US10762293B2 (en) | 2010-12-22 | 2020-09-01 | Apple Inc. | Using parts-of-speech tagging and named entity recognition for spelling correction |
US9262612B2 (en) | 2011-03-21 | 2016-02-16 | Apple Inc. | Device access using voice authentication |
US10057736B2 (en) | 2011-06-03 | 2018-08-21 | Apple Inc. | Active transport based notifications |
US8994660B2 (en) | 2011-08-29 | 2015-03-31 | Apple Inc. | Text correction processing |
US10134385B2 (en) | 2012-03-02 | 2018-11-20 | Apple Inc. | Systems and methods for name pronunciation |
US9483461B2 (en) | 2012-03-06 | 2016-11-01 | Apple Inc. | Handling speech synthesis of content for multiple languages |
US9280610B2 (en) | 2012-05-14 | 2016-03-08 | Apple Inc. | Crowd sourcing information to fulfill user requests |
US9721563B2 (en) | 2012-06-08 | 2017-08-01 | Apple Inc. | Name recognition system |
US9495129B2 (en) | 2012-06-29 | 2016-11-15 | Apple Inc. | Device, method, and user interface for voice-activated navigation and browsing of a document |
US9576574B2 (en) | 2012-09-10 | 2017-02-21 | Apple Inc. | Context-sensitive handling of interruptions by intelligent digital assistant |
US9547647B2 (en) | 2012-09-19 | 2017-01-17 | Apple Inc. | Voice-based media searching |
KR20150104615A (ko) | 2013-02-07 | 2015-09-15 | 애플 인크. | 디지털 어시스턴트를 위한 음성 트리거 |
US9368114B2 (en) | 2013-03-14 | 2016-06-14 | Apple Inc. | Context-sensitive handling of interruptions |
WO2014144579A1 (en) | 2013-03-15 | 2014-09-18 | Apple Inc. | System and method for updating an adaptive speech recognition model |
CN105027197B (zh) | 2013-03-15 | 2018-12-14 | 苹果公司 | 训练至少部分语音命令系统 |
US9582608B2 (en) | 2013-06-07 | 2017-02-28 | Apple Inc. | Unified ranking with entropy-weighted information for phrase-based semantic auto-completion |
WO2014197334A2 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for user-specified pronunciation of words for speech synthesis and recognition |
WO2014197336A1 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for detecting errors in interactions with a voice-based digital assistant |
WO2014197335A1 (en) | 2013-06-08 | 2014-12-11 | Apple Inc. | Interpreting and acting upon commands that involve sharing information with remote devices |
US10176167B2 (en) | 2013-06-09 | 2019-01-08 | Apple Inc. | System and method for inferring user intent from speech inputs |
EP3008641A1 (de) | 2013-06-09 | 2016-04-20 | Apple Inc. | Vorrichtung, verfahren und grafische benutzeroberfläche für gesprächspersistenz über zwei oder mehrere instanzen eines digitaler assistenten |
AU2014278595B2 (en) | 2013-06-13 | 2017-04-06 | Apple Inc. | System and method for emergency calls initiated by voice command |
CN105453026A (zh) | 2013-08-06 | 2016-03-30 | 苹果公司 | 基于来自远程设备的活动自动激活智能响应 |
US9620105B2 (en) | 2014-05-15 | 2017-04-11 | Apple Inc. | Analyzing audio input for efficient speech and music recognition |
US10592095B2 (en) | 2014-05-23 | 2020-03-17 | Apple Inc. | Instantaneous speaking of content on touch devices |
US9502031B2 (en) | 2014-05-27 | 2016-11-22 | Apple Inc. | Method for supporting dynamic grammars in WFST-based ASR |
US9715875B2 (en) | 2014-05-30 | 2017-07-25 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
US9842101B2 (en) | 2014-05-30 | 2017-12-12 | Apple Inc. | Predictive conversion of language input |
US9633004B2 (en) | 2014-05-30 | 2017-04-25 | Apple Inc. | Better resolution when referencing to concepts |
US10078631B2 (en) | 2014-05-30 | 2018-09-18 | Apple Inc. | Entropy-guided text prediction using combined word and character n-gram language models |
US9760559B2 (en) | 2014-05-30 | 2017-09-12 | Apple Inc. | Predictive text input |
US9430463B2 (en) | 2014-05-30 | 2016-08-30 | Apple Inc. | Exemplar-based natural language processing |
US10170123B2 (en) | 2014-05-30 | 2019-01-01 | Apple Inc. | Intelligent assistant for home automation |
TWI566107B (zh) | 2014-05-30 | 2017-01-11 | 蘋果公司 | 用於處理多部分語音命令之方法、非暫時性電腦可讀儲存媒體及電子裝置 |
US10289433B2 (en) | 2014-05-30 | 2019-05-14 | Apple Inc. | Domain specific language for encoding assistant dialog |
US9734193B2 (en) | 2014-05-30 | 2017-08-15 | Apple Inc. | Determining domain salience ranking from ambiguous words in natural speech |
US9785630B2 (en) | 2014-05-30 | 2017-10-10 | Apple Inc. | Text prediction using combined word N-gram and unigram language models |
US9338493B2 (en) | 2014-06-30 | 2016-05-10 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US10659851B2 (en) | 2014-06-30 | 2020-05-19 | Apple Inc. | Real-time digital assistant knowledge updates |
US10446141B2 (en) | 2014-08-28 | 2019-10-15 | Apple Inc. | Automatic speech recognition based on user feedback |
US9818400B2 (en) | 2014-09-11 | 2017-11-14 | Apple Inc. | Method and apparatus for discovering trending terms in speech requests |
US10789041B2 (en) | 2014-09-12 | 2020-09-29 | Apple Inc. | Dynamic thresholds for always listening speech trigger |
US9606986B2 (en) | 2014-09-29 | 2017-03-28 | Apple Inc. | Integrated word N-gram and class M-gram language models |
US10074360B2 (en) | 2014-09-30 | 2018-09-11 | Apple Inc. | Providing an indication of the suitability of speech recognition |
US9646609B2 (en) | 2014-09-30 | 2017-05-09 | Apple Inc. | Caching apparatus for serving phonetic pronunciations |
US9668121B2 (en) | 2014-09-30 | 2017-05-30 | Apple Inc. | Social reminders |
US9886432B2 (en) | 2014-09-30 | 2018-02-06 | Apple Inc. | Parsimonious handling of word inflection via categorical stem + suffix N-gram language models |
US10127911B2 (en) | 2014-09-30 | 2018-11-13 | Apple Inc. | Speaker identification and unsupervised speaker adaptation techniques |
US10552013B2 (en) | 2014-12-02 | 2020-02-04 | Apple Inc. | Data detection |
US9711141B2 (en) | 2014-12-09 | 2017-07-18 | Apple Inc. | Disambiguating heteronyms in speech synthesis |
US9865280B2 (en) | 2015-03-06 | 2018-01-09 | Apple Inc. | Structured dictation using intelligent automated assistants |
US9886953B2 (en) | 2015-03-08 | 2018-02-06 | Apple Inc. | Virtual assistant activation |
US10567477B2 (en) | 2015-03-08 | 2020-02-18 | Apple Inc. | Virtual assistant continuity |
US9721566B2 (en) | 2015-03-08 | 2017-08-01 | Apple Inc. | Competing devices responding to voice triggers |
US9899019B2 (en) | 2015-03-18 | 2018-02-20 | Apple Inc. | Systems and methods for structured stem and suffix language models |
US9842105B2 (en) | 2015-04-16 | 2017-12-12 | Apple Inc. | Parsimonious continuous-space phrase representations for natural language processing |
US10083688B2 (en) | 2015-05-27 | 2018-09-25 | Apple Inc. | Device voice control for selecting a displayed affordance |
US10127220B2 (en) | 2015-06-04 | 2018-11-13 | Apple Inc. | Language identification from short strings |
US10101822B2 (en) | 2015-06-05 | 2018-10-16 | Apple Inc. | Language input correction |
US10186254B2 (en) | 2015-06-07 | 2019-01-22 | Apple Inc. | Context-based endpoint detection |
US11025565B2 (en) | 2015-06-07 | 2021-06-01 | Apple Inc. | Personalized prediction of responses for instant messaging |
US10255907B2 (en) | 2015-06-07 | 2019-04-09 | Apple Inc. | Automatic accent detection using acoustic models |
US10671428B2 (en) | 2015-09-08 | 2020-06-02 | Apple Inc. | Distributed personal assistant |
US10747498B2 (en) | 2015-09-08 | 2020-08-18 | Apple Inc. | Zero latency digital assistant |
US9697820B2 (en) | 2015-09-24 | 2017-07-04 | Apple Inc. | Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks |
US11010550B2 (en) | 2015-09-29 | 2021-05-18 | Apple Inc. | Unified language modeling framework for word prediction, auto-completion and auto-correction |
US10366158B2 (en) | 2015-09-29 | 2019-07-30 | Apple Inc. | Efficient word encoding for recurrent neural network language models |
US11587559B2 (en) | 2015-09-30 | 2023-02-21 | Apple Inc. | Intelligent device identification |
US10691473B2 (en) | 2015-11-06 | 2020-06-23 | Apple Inc. | Intelligent automated assistant in a messaging environment |
US10049668B2 (en) | 2015-12-02 | 2018-08-14 | Apple Inc. | Applying neural network language models to weighted finite state transducers for automatic speech recognition |
US10223066B2 (en) | 2015-12-23 | 2019-03-05 | Apple Inc. | Proactive assistance based on dialog communication between devices |
US10446143B2 (en) | 2016-03-14 | 2019-10-15 | Apple Inc. | Identification of voice inputs providing credentials |
US9934775B2 (en) | 2016-05-26 | 2018-04-03 | Apple Inc. | Unit-selection text-to-speech synthesis based on predicted concatenation parameters |
US9972304B2 (en) | 2016-06-03 | 2018-05-15 | Apple Inc. | Privacy preserving distributed evaluation framework for embedded personalized systems |
US10249300B2 (en) | 2016-06-06 | 2019-04-02 | Apple Inc. | Intelligent list reading |
US10049663B2 (en) | 2016-06-08 | 2018-08-14 | Apple, Inc. | Intelligent automated assistant for media exploration |
DK179588B1 (en) | 2016-06-09 | 2019-02-22 | Apple Inc. | INTELLIGENT AUTOMATED ASSISTANT IN A HOME ENVIRONMENT |
US10490187B2 (en) | 2016-06-10 | 2019-11-26 | Apple Inc. | Digital assistant providing automated status report |
US10067938B2 (en) | 2016-06-10 | 2018-09-04 | Apple Inc. | Multilingual word prediction |
US10586535B2 (en) | 2016-06-10 | 2020-03-10 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
US10192552B2 (en) | 2016-06-10 | 2019-01-29 | Apple Inc. | Digital assistant providing whispered speech |
US10509862B2 (en) | 2016-06-10 | 2019-12-17 | Apple Inc. | Dynamic phrase expansion of language input |
DK179049B1 (en) | 2016-06-11 | 2017-09-18 | Apple Inc | Data driven natural language event detection and classification |
DK201670540A1 (en) | 2016-06-11 | 2018-01-08 | Apple Inc | Application integration with a digital assistant |
DK179415B1 (en) | 2016-06-11 | 2018-06-14 | Apple Inc | Intelligent device arbitration and control |
DK179343B1 (en) | 2016-06-11 | 2018-05-14 | Apple Inc | Intelligent task discovery |
US10593346B2 (en) | 2016-12-22 | 2020-03-17 | Apple Inc. | Rank-reduced token representation for automatic speech recognition |
DK179745B1 (en) | 2017-05-12 | 2019-05-01 | Apple Inc. | SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT |
DK201770431A1 (en) | 2017-05-15 | 2018-12-20 | Apple Inc. | Optimizing dialogue policy decisions for digital assistants using implicit feedback |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4128737A (en) * | 1976-08-16 | 1978-12-05 | Federal Screw Works | Voice synthesizer |
BG24190A1 (en) * | 1976-09-08 | 1978-01-10 | Antonov | Method of synthesis of speech and device for effecting same |
US4304964A (en) * | 1978-04-28 | 1981-12-08 | Texas Instruments Incorporated | Variable frame length data converter for a speech synthesis circuit |
US4264783A (en) * | 1978-10-19 | 1981-04-28 | Federal Screw Works | Digital speech synthesizer having an analog delay line vocal tract |
US4228517A (en) * | 1978-12-18 | 1980-10-14 | James N. Constant | Recursive filter |
JPS55133099A (en) * | 1979-04-02 | 1980-10-16 | Fujitsu Ltd | Voice synthesizer |
JPS5660499A (en) * | 1979-10-22 | 1981-05-25 | Casio Computer Co Ltd | Audible sounddsource circuit for voice synthesizer |
US4433210A (en) * | 1980-06-04 | 1984-02-21 | Federal Screw Works | Integrated circuit phoneme-based speech synthesizer |
US4470150A (en) * | 1982-03-18 | 1984-09-04 | Federal Screw Works | Voice synthesizer with automatic pitch and speech rate modulation |
JPS58186800A (ja) * | 1982-04-26 | 1983-10-31 | 日本電気株式会社 | 音声合成装置 |
US4653099A (en) * | 1982-05-11 | 1987-03-24 | Casio Computer Co., Ltd. | SP sound synthesizer |
CA1181859A (en) * | 1982-07-12 | 1985-01-29 | Forrest S. Mozer | Variable rate speech synthesizer |
JPS6017496A (ja) * | 1983-07-11 | 1985-01-29 | 株式会社日立製作所 | 楽音合成装置 |
JPS623958A (ja) * | 1985-06-29 | 1987-01-09 | Toshiba Corp | 記録方法 |
-
1987
- 1987-03-18 JP JP62061149A patent/JP2595235B2/ja not_active Expired - Lifetime
-
1988
- 1988-03-17 EP EP88302313A patent/EP0283277B1/de not_active Expired - Lifetime
- 1988-03-17 DE DE88302313T patent/DE3883034T2/de not_active Expired - Fee Related
-
1989
- 1989-12-29 US US07/462,295 patent/US5007095A/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
EP0283277B1 (de) | 1993-08-11 |
EP0283277A2 (de) | 1988-09-21 |
JPS63229499A (ja) | 1988-09-26 |
DE3883034D1 (de) | 1993-09-16 |
EP0283277A3 (en) | 1990-06-20 |
JP2595235B2 (ja) | 1997-04-02 |
US5007095A (en) | 1991-04-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE3883034T2 (de) | System zur Sprachsynthese. | |
DE3036680C2 (de) | Sprachsynthesizer mit dehnbarer und komprimierbarer Sprachzeit | |
DE3853916T2 (de) | Digitaler-sprachkodierer mit verbesserter vertoranregungsquelle. | |
DE2229149A1 (de) | Verfahren zur Übertragung von Sprache | |
DE69017129T2 (de) | Frequenzsynthesizer mit gebrochenem teilverhältnis. | |
DE2431161C2 (de) | Tonerzeugungseinrichtung für ein elektronisches Musikinstrument | |
DE2551632C2 (de) | Verfahren zum Zusammensetzen von Sprachnachrichten | |
EP0406469B1 (de) | Digitale Steuerschaltung für Abstimmsysteme | |
DE68925882T2 (de) | Vorrichtung und Verfahren zur Erzeugung von musikalischen Tonwellenformen | |
DE2736082A1 (de) | Elektronisches geraet zur phonetischen synthetisierung menschlicher sprache (sprach-synthesizer) | |
DE2530380A1 (de) | Sprachsynthetisatorsystem | |
DE4491015C2 (de) | Verfahren zum Erzeugen eines Spektralrauschbewertungsfilters zur Verwendung in einem Sprachcoder | |
DE68923771T2 (de) | Sprachübertragungssystem unter Anwendung von Mehrimpulsanregung. | |
DE69018687T2 (de) | Musiksynthesizer. | |
DE69114129T2 (de) | Dezimationsfilter für Sigma-Delta Konverter und Datenendeinrichtung mit einem solchen Filter. | |
DE68912348T2 (de) | Verfahren zur phasenregelung eines taktgebers in bezug auf ein datensignal. | |
CH622113A5 (de) | ||
DE69727503T2 (de) | System und verfahren zur tonsynthese mittels einer längenmodulierten digitalen verzögerungsleitung | |
DE69014680T2 (de) | Einrichtung zur Stimmensynthese. | |
DE3226538C2 (de) | LSP-Stimmsynthetisierer | |
DE60128696T2 (de) | Frequenzsynthesizer | |
DE3037276C2 (de) | Tonsynthesizer | |
DE3101590C2 (de) | Anordnung zum Erzeugen eines Sprachsignals | |
DE2813857C2 (de) | ||
DE60125491T2 (de) | Tiefpaßfilterung des Anregungssignals für die Sprachkodierung |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
8364 | No opposition during term of opposition | ||
8339 | Ceased/non-payment of the annual fee |