DE2740520A1

DE2740520A1 - Verfahren und anordnung zur synthese von sprache

Info

Publication number: DE2740520A1
Application number: DE19772740520
Authority: DE
Inventors: Ljubomir Jordanov Dipl Antonov
Original assignee: EDINEN ZENTAR PHYS
Current assignee: EDINEN ZENTAR PHYS
Priority date: 1976-09-08
Filing date: 1977-09-08
Publication date: 1978-04-20
Also published as: FR2364522B3; BG24190A1; JPS5953560B2; SU691918A1; US4278838A; HU176776B; FR2364522A1; GB1592473A; DD143970A1; SE7709773L; JPS5367301A

Description

BESCHREIBUNG

Die Erfindung betrifft ein Verfahren und eine Anordnung zur Synthese von Sprache, welche in der Rechentechnik als Kommunikationsmittel zwischen der Rechenmaschine und dem Menschen anwendbar sind.

Es sind ein Verfahren und eine Anordnung zur Synthese von Sprache bekannt, bei denen die Synthese aufgrund ganzer Wörter oder Silben erfolgt, wobei die Anordnung einen Magnetplattenspeicher mit sehr großem Speichervermögen benötigt. Trotzdem hat diese Anordnung einen sehr begrenzten Y/ortschatz.

Es sind auch ein Verfahren und eine Anordnung zur Synthese von Sprache bekannt, bei denen die Bildung der einzelnen Phoner^ durch Mischen von Sinusschwingungen mit geeigneter Amplitude und Frequenz erfolgt. Diese Anordnung ist ziemlich kompliziert und benötigt Analog-Generatoren mit komplizierter Abstimmung.

Der Erfindung liegt die Aufgabe zugrunde, ein Verfahren und eine Anordnung zur Synthese von Sprache zu entwickeln, wobei die Anordnung einen kleinen Bedarf an Speicherplätzen hat und eine nicht komplizierte Abstimmung der Apparatur erfordert.

Diese Aufgabe v/ird erfindungsgemäß dadurch gelöst, daß die Synthese der Sprache aufgrund von digitalen elektronischen Schaltungen synthetisierter Phoneme, die anschließend durch Digital-Analog-Umwandler in Analogsignale umgesetzt v/erden, erfolgt. Die Synthetisierung der Phoneme aus einem gegebenen Text erfolgt aufgrund der in einem Speicher eingespeicherten Laut-Perioden von Phonemen unterschiedlicher Forinant-Verteilungen, Elemente von Rausch-Phonemen, Information für die Stellen der Betonungen, typische AmplitudencharaktorLstiken der entsprechenden Phoneme, Folge von Laut- und Rausch-Elementen, die zur Synthese eines gegebenen Phonems notwendig

809816/OSdO

sind, Tabellen für die quasizufällige Veränderung der Phoneme, sowie aus der Analyse des Satzes gewonnene EBten für die Intonation, die Dauer der Pausen und die für die Hauptübergänge zwischen den Phonemen erforderlichen Iaut-Elemente. Die Sätze des zu synthetisierenden Textes werden mit Hilfe eines Programms einer grammatischen Analyse unterworfen, um die Grundcharakteristiken des betreffenden Satzes festzustellen - die Art der Veränderung der Stimmhöhe als Frequenzcharakteristik, die Art der Veränderung der Stärke der Stimme als Amplitudencharakteristik und die Dauer der Pausen. Es wird auch die Folge von Phonemen analysiert, um den Einfluß der Nachbar-Phoneme auszuwerten und die Plätze und die Art der Veränderung innerhalb der Folge zu bestimmen. Bei festgelegten Grundcharakteristiken des Satzes v/erden jedem Phonem eine bestimmte Art und Anzahl von Perioden von Lautschwingungen mit charakteristischer Formant -V orte i lung , mit entsprechender Periodendauer und Amp]itudenwert, sowie eine bestimmte Art und Anzahl von Elementen der Rausch-Phoneme mit entsprechender Dauer und Spektralverteilung gegenübergestellt. Die erwähnten Perioden der Lautschwingungen und die Elemente der Rausch-Phoneme, die für jede Sprache vorher bestimmt werden müssen, v/erden in digitaler Form als Folge von Amplitudenwerten der entsprechenden Schwingung Jn einem Speicher eingespeichert. Zur Gev/innung der entsprechenden Frequenzcharakteristiken der Phoneme kann der Lesevorgang der Schwingungswerte vor dem Ende der Periode unterbrochen oder nach dem Ende der Periode mit Nullwerten weitergeführt v/erden. Um die Sprachnatürlichkeit erreichen zu können, wird eine quasizufällige Veränderung der Längen und der Amplituden der Schwingungsperioden beim Lesen vorgenommen, und um gleichmäßige Spektralverteilungen bei der Synthetisierung von Rauschund Misch-Phonemen zu erreichen, werden Teile von Rausch-Phonemen mit quasizufälliger Anfangsadresse, quasizufälliger Dauer und quasizufnlliger Leserichtung ausgelesen. Zur Gewinnung verschiedener Phoneme aus gleichen eingespeichorten Elementen wird die Lesefrequenz der eingespeicherten Amplitudenwerte geändert, zur Gewinnung verschiedener Phoneme aus gleichen eingespeicherten Elementen werden die Amplitudencharakteristiken der Phoneme

809816/0590

geändert und zur Gewinnung von Misch-Phonemen werden Kombinationen von Laut-Perioden und Rauschteilen verwendet. Zur Realisierung glatter Phonemübergänge werden Perioden mit Formant-Verteilungen, die dem Übergang zv/ischen den Phonemen entsprechen, verwendet, und zur Realisierung glatter Phonemübergänge werden die Amplituden im Bereich der betreffenden übergänge vermindert. Die aufgrund der Analyse der Phonemzusammensetzung und der Grundcharakteristiken des Satzes für die betreffenden Sprache vorbereiteten Daten werden zur Steuerung der Wiedergabe der im Speicher eingespeicherten Sprachelemente benutzt. Die Amplitudencharakteristiken der Phoneme werden durch Beeinflussen der Verstärkung des durch Umwandlung der digitalen Werte gewonnenen Signals der synthetisierten Phoneme mittels einem Analogsignal, das den digitalen Werten der Amplitudencharakteristiken der Phoneme entspricht, gebildet.

Die Anordnung zur Realisierung des Verfahrens besteht aus einer elektronischen Rechenmaschine, deren Ausgang an einem Adressenregister-Zähler eines Festwertspeichers angeschlossen ist. Ein weiterer Ausgang der Rechenmaschine ist an einem Register für die Zählrichtung angeschlossen, dessen Ausgang mit dem Adressenregister-Zähler verbunden ist. Zwei weitere Ausgänge der Rechenmaschine sind entsprechend an einem Register zur Bestimmung der Zählfrequenz und an einem Register für die Anzahl der Leseadressen angeschlossen, wobei die Ausgänge der beiden letzten Register an einem Impulsgenerator mit vorgegebener Anzahl und Frequenz angeschlossen sind. Der Ausgang dieses Impulsgenerators ist mit dem Zahl-Eingang des Adressenregister-Zählers verbunden. Ein weiterer Ausgang der Rechenmaschine ist mit einem Digital-Analog-Umwandler verbunden, dessen Ausgang mit dem Eingang zur Änderung der Verstärkung eines Verstärker-Modulators verbunden ist. Der Ausgang des Festwertspeichers ist an einen zweiten Digital-Analog-Umwandler angeschlossen, dessen Ausgang mit dem Eingang des Verstärker-Modulators verbunden ist. Der Ausgang des Verstärker-Modulators ist an einen Lautsprecher und einen Übertragungskanal angeschlossen. Der

809816/0890

Ausgang der Steuereinheit ist mit dem Eingang der Rechenmaschine verbunden und ein weiterer Ausgang der Rechenmaschine ist mit dem Eingang der Steuereinheit verbunden.

Die Aufgabe ist weiterhin dadurch gelöst, daß die Veränderung der Periodendauer - 40 % betragen kann, und die quasizufällige Veränderung der Periodendauer und der Amplituden der Schwingungen beim Lesen - 3 % betragen kann. Zur Verbesserung der Natürlichkeit der Sprache werden auch quasizufällig die Perioden der Lautschwingungen, ihrer Amplitude, die Periode der modulierten Amplituden-Rauschschwingungen zur Gewinnung von Misch-Phonemen, sowie die Periode der amplitudenmodulierten Lautschwingungen zur Gewinnung des Phonems "P" bulgarisch ("R" lateinisch) geändert.

Die Erfindung hat die Vorteile, daß sie einen verhältnismäßig kleinen Speicher ohne mechanisch bewegte Elemente benötigt, daß keine Generatoren für Analog-Kurven für die Synthese erforderlich sind, daß sie eine große Vielfältigkeit bei der Synthetisierung der Phoneme gemäß den konkreten Anforderungen des Satzes ermöglicht, daß die Veränderung der Art der Phoneme allein durch Austausch des Speicherinhaltes erfolgen kann, daß sie die Nachahmung von quasizufälligen Änderungen der Periodizität der Lautschwingungen und ihrer Amplituden erlaubt und damit zur Natürlichkeit der Sprache führt, daß sie die Bildung gewünschter Intonation und die erforderlichen Betonungen im Satz ermöglicht, daß sie keine bestimmte Geschwindigkeit und Speicherplätze von der Rechenmaschine erfordert, daß sie die Wiedergabe wegen Ausfallen der Abstimmungsoperationen erleichtert, daß die Anwendung von neuen elektronischen Elementen mit hoher Integration wie Speicher, Mikrorechner usw. gestattet ist und daß sie zum Aufbau veon Einrichtungen mit kleineren Abmessungen und Gewicht, grös- serer Zuverläßigkeit und niedrigem Preis führt.

Ein Ausführungsbeispiel der Anordnung, gemäß der Erfindung, ist in den Zeichnungen dargestellt und wird nachfolgend näher erläutert.

809816/06Θ0

~¹⁰~ 27A0520

Es zeigen:

Figur 1 eine Block-Schaltung der Anordnung;

Figur 2 die Aufzeichnung der AmpIitudenkurve des Wortes "ΠΗΗΑ" von einem Sprecher ausgesprochen;

Figur 3 Aufzeichnung der Amplitudenkurve des synthetisierten Wortes "ΠΗΗΑ", gemäß der Erfindung;

Figur 4 Aufzeichnung der Amplitudenkurve des Wortes "MHMH", von einem Sprecher ausgesprochen;

Figur 5 Aufzeichnung der Amplitudenkurve des synthetisierten V/ortes "MHMH", gemäß der Erfindung;

Figur 6 Sonagramm des V/ortes "MHMH", von einem Sprecher ausgesprochen;

Figur 7 Sonagramm des synthetisierten V/ortes "MHMH", gemäß der Erfindung.

Die Anordnung, gemäß Figur 1 , besteht aus einer elektronischen Rechenmaschine 1, deren Ausgang 2 am Adressenregister-Zähler 3 des Festwertspeichers 4 angeschlossen ist. Der Ausgang 5 der Rechenmaschine 1 ist am Register 6 für die Zählrichtung angeschlossen, dessen Ausgang mit dem Adressenregister-Zähler 3 verbunden ist. Die Ausgänge 7 und 8 der Rechenmaschine 1 sind am Register 9 zur Bestimmung der Zählfrequenz bzw. am Register 10 für die Anzahl der Leseadressen angeschlossen, wobei die Ausgänge der Register 9 und 10 mit dem Impulsgenerator 11 verbunden sind. Der Ausgang des Impulsgenerators 11 ist mit dem Zähl-Eingang des Adressenregister-Zählers 3 verbunden. Der Ausgang 12 der Rechenmaschine 1 ist über das Register 13 zur Amplitudensteuerung am Digital-Analog-Umwandler 14 angeschlossen, dessen Ausgang mit dem Eingang zur Änderung der Verstärkung des Verstärker-Modulators 15 verbunden ist. Der Ausgang des Festwertspeichers 4 ist am Digital-Analog-Umwandler 16, dessen Ausgang mit dem Eingang des Verstärker-Modulators 15 verbunden ist, angeschlossen. Der Ausgang des Verstärker-Modulators 15 ist mit dem Lautsprecher 17 und mit dem Ubertragungskanal 18 verbunden. Der Ausgang der Steuereinheit 19 ist mit dem Eingang 21 der Rechenmaschine 1 verbunden und der Ausgang 20 der Rechenmaschine

809816/0590

ist mit dem Eingang der Steuereinheit ^\9 verbunden.

Im folgenden werden die wichtigsten von den verwendeten Begriffen erläutert:

Synthese von Sprache - ist die Erzeugung von einem akustischen Ausgangssignal irgendeiner Einrichtung gemeint, in dem eine Sprache, nicht unbedingt bulgarisch, erkennbar ist;

Formant-Verteilungen - die Frequenzverteilung der entsprechenden Komponenten eines bestimmten Phonems;

Sprachelemente - os sind Kurvenabschnitte gemeint, die die Sprache als akustische Funktion kennzeichenen;

Die sprachbegleitenden Laute - z.B. der Laut bei Einatmung oder Ausatmung am Anfang und am Ende der Phrase, oder bei Interpunktion;

Laut-Periode - Perioden, die die Laut-Phoneme bilden.

Aufgrund einiger Besonderheiten, die auch mit der Methode ihrer Synthetisierung zusammenhängen, werden folgende Gruppen von Phonemen betrachtet: Laut-Phoneme, Rausch-Phoneme und Misch-Phoneme. Jede Gruppe enthält kurze und dauerhafte Phoneme.

Die Laut-Phoneme werden durch aufeinanderfolgende Wiedergabe einer Folge von Laut-Perioden, die in einem Speicher eingespeichert und aus einer natürlichen Sprache gewonnen sind, oder vorher synthetisiert sind und eine bestimmte Formant-Verteilung kennzeichnen, gebildet. Die Anzahl und die Art der Perioden zur Synthese eines gegebenen Laut-Phonems werden gemäß dem Charakter des Phonems in der betreffenden Sprache, der Art und dem Charakter der Nachbar-Phoneme, der Stelle der Betonung, der Intonation des Satzes usw. festgestellt. Demzufolge entsprechen der linguistischen Einheit Phoneme nach dem Gesichtspunkt der Methode zur Synthese einer Menge von verschiedenen Periodenfolgen.

809816/0590

Im konkreten Fall werden die erforderlichen Kombinationen von Lautperioden, ihrer Anzahl, Dauer und Amplituden mit Hilfe eines Programms gemäß einem bestimmten Algorithmus in Real-Zeit ausgerechnet, nachdem sie zu ihrer Wiedergabe in eine Wiedergabeeinrichtung weitergeführt werden. Die Natürlichkeit der synthetisierten Sprache wird durch quasizufällige Modulation der Amplituden und der Dauer der einzelnen Perioden erreicht.

Die Rausch-Phoneme werden durch Lesen aus dem Speicher eventuell mit Amplitudenmodulation oder durch aufeinanderfolgende Wiedergabe quasizufällig ausgewühlter Teile eines eingespeicherten Abschnittes von dem entsprechenden Rausch-Phonem synthetisiert, wobei die Amplitudenmodulation und die Dauer entsprechend dem Algorithmus der Synthese bestimmt werden.

Die Misch-Phoneme werden teilweise wie die Laut-Phoneme, teilweise wie die Rausch-Phoneme mit zusätzlicher Amplitudenmodulation der Rausch-Teile mit der Periode der Laut-Phoneme synthethisiert.

Beispiele:

Bei dem Phonem "P" ("R" lateinisch) wirddie synthetisierte Stimme einer Amplitudenmodulation mit der Schwingungsfrequenz der Zunge unterworfen.

In der bulgarischen Sprache können als Laut-Phoneme "A", ¹¹E", "H", "0", "¹B", «Υ», »Η», "Λ", »Μ», "H" und »Ρ», als Rausch-Phoneme "Φ", "C", »1», "X", "II", "H", "K", "Π", und »T» und als Misch-Phoneme "B", "3", "K", "B", ¹W. "Γ", "Λ3" und »;ρκ" synthetisiert werden.

Die Verbindung zwischen den Phonemen wird durch eventuelles Einfügen von Laut-Perioden mit der für einen glatten übergang notwendigen Formant-Verteilung hergestellt.

Der Hauptteil der Anordnung zur Synthese der Sprache ist der Festwertspeicher 4, in dem die Information, die zur Synthese

809816/0590

der Sprache gemäß des vorgeschlagenen Verfahrens verwendet wird, eingespeichert ist. Diese Information stellt digitale Werte der Amplitude von Teilen der Laut- und Rausch-Phoneme und von Tönen, die die Sprache begleiten, dar. Die Anfangsadressen und die Längen der Folgen von Amplitudenwerten der verschiedenen Sprachelemente , die im Festwertspeicher 4 eingespeichert sind, stellen die Steuerinformation für den Lesevorgang dar und sind im Speicher der Rechenmaschine leingespeichert. Der Auswahl der Sprachelemente, die zur Synthese einer Sprache im Festwertspeicher eingeschrieben werden müssen, erfolgt gemäß der phonetischen Besonderheiten der betreffenden Sprache, so daß die gewählten Elemente ein vollständiges System hinsichtlich der Phonetik der Sprache darstellen. Im Speicher der Rechenmaschine 1 ist das Programm eingespeichert, das das vorgeschlagene Verfahren realisiert und es berücksichtigt die Intonation und die Betonung der konkreten Sprache.

Eingangsinformation für das Programm ist eine Textkonstante, die eventuell auch phonetische Zeichen enthält und die Aufzeichnung eines Satzes in der betreffenden Sprache ist. In der Rechenmaschine 1 wird der Satz grammatisch und phonetisch nach den Regeln der betreffenden Sprache untersucht, um seinen Frequenz- und Amplitudencharakteristiken, sowie auch die Stellen und die Dauer der Pausen und die die Sprache begleitenden Töne festzustellen. Danach werden nach diesen Charakteristiken und dem Einfluß der Machbar-Phoneme im Satz die Zusammensetzung (die Art der Perioden, von denen die Phoneme gebildet werden), die Amplitudencharakteristik und die Dauer jedes Phonems festgestellt. Es werden auch für jedes Sprachelement, das in dem zu synthetisierenden Satz enthalten ist, die Amplitude, die Dauer, die Anfangsadresse im Festwertspeicher 4 und die Leserichtung bestimmt. Auf diese Weise wird der Satz in einige Folgen von Sprachelementen und Pausen untergliedert, die durch die obenerwähnten Größen gekennzeichnet sind. Alle das betreffende Sprachelement kennzeichnenden Größen werden in der Rechenmaschine 1 mit Hilfe eines Programms in Real-Zeit ermittelt und durch die

809816/0590

Steuereinheit nacheinander den entsprechenden Blöcken bei Anforderung zugeführt. Aufgrund dieser Daten wird aus dem Speicher 4 ein Sprachelement aus der im Adressenregister-Zähler enthaltenen Anfangsadresse ausgelesen, wobei die Leserichtung durch das Register zur Bestimmung der Leserichtung 6 angegeben wird. Die Lesegeschwindigkeit aus dem Festwertspeicher 4 wird von dem im Register zur Bestimmung der Lesefrequenz 9 enthaltenen Wert bestimmt, und die Anzahl von den zu lesenden Daten wird von dem im Register für die Anzahl der Leseadressen 10 enthaltenen Wert bestimmt. Die im Register 9 und 10 enthaltene Information steuert die Arbeit des Impulsgenerators 11, der seinerseits die Änderung des Inhaltes des Adressenregister-Zählers 3 in der Zeit steuert.

Die Amplitudenwerte des auf diese Weise bestimmten Sprachelementes werden nacheinander dem Digital-Analog-Umwandler 16 mit der vom Register 9 vorgegebenen Lesegeschwindigkeit zugeführt. Der Ausgang des Digital-Analog-Umwandlers 16 ist mit dem Eingang des Verstärker-Modulators 15 verbunden, dessen Verstärkung durch den Ausgang des zur Umwandlung der digitalen Werte der Wiedergabeamplitude des in diesemMoment synthetisierten Sprachelementes dienenden Digital-Analog-Umwandlers 14 gesteuert wird. Das im Verstärker-Modulator 15 verstärkte Signal wird zur Wiedergabe dem Lautsprecher 17 und dem Übertragungskanal 18 zugeführt. Nach dem Ende der Wiedergabe des entsprechenden Elements gibt die Steuereinheit der Rechenmaschine 1 Anweisung zur Herstellung von neuen Daten zum Weiterführen der Synthese.

Während des Auslesens aus dem Festwertspeicher 4 und der Wiedergabe des entsprechenden Elementes ist die Rechenmaschine frei und führt die Analyse zur Vorbereitung von neuen Daten zur Steuerung der Synthese durch.

Bei der Anwendung einer Rechenmaschine ausreichender Geschwindigkeit ist es möglich, eine Rechenmaschine zur Steuerung mehrerer Anordnungen zur Synthese von Sprache zu verwenden. Als

809816/0590

Rechenmaschine 1 kann eine universale Rechenmaschine, ein Minirechner oder ein Mikroprozessor benutzt werden.

Aus der Figur 2 ist der kurze Explosivlaut "n" ersichtlich, danach folgen einige Perioden von "H" und eine längere Folge von Perioden "A". Es folgen zwei Gruppen von Lautperioden, die den Phonemen "H" und "A" entsprechen. Die aufgezeichnete Amplitudencharakteristik gehört einem Wort, das von einem Sprecher ausgesprochen ist und bei dem die Glätte der Formant-Ubergänge auf eine natürliche Weise zustande gekommen ist.

Im synthetisierten Wort, das in Figur 3 gezeigt ist, sind nacheinander "n"f zwei Perioden von "H", Perioden von "E", die einen glatten Formant-Ubergang zwischen "H" und das folgende "A" gewährleisten, Perioden von den Laut-Phonemen "A", "H", und "A" mit Längen, die so ausgewählt sind, daß eine glatte Veränderung des Grundtones gewährleistet ist, angeordnet.

In analoger Beziehtung stehen die Figuren 4 und 5, in denen das Einfügen des Phonems "U" zwischen dem ersten "M" und dem ersten "K" zum Gewährleisten eines glatten Grundformant-Uberganges ersichtlich ist.

Die Sonogramme der Wörter von Fig. 4 und 5 sind in Fig. 6 und 7 dargestellt. Das Sonagramm des Wortes von natürlichem Ursprung ( Fig. 6) ist viel reicher an Formanten, doch unabhängig davon empfängt das Ohr das synthetisierte Wort richtig.

809816/0590

-46 ' Leerseite

Claims

PAT L . vJ TA .'ν WA LT J.

SCHIFF ν. FUN F. R STREHL SC H ÜBEL-H OPF EBßlNGHAUS FlNCK

MARIAHILFPLATZ 2 A 3, MUNCHtN 9O 2 / H U b 4U U

POSTAOfn-.SiiE: F⁵OSTFACH 95 OI GO, D-BOOO MÖNCHEN 95

KARL LUOWIO SCMIFF

DIPL. CHEM. nt-ΐ. ALEXANDER v. KÖNER

DIPL. INO. Pf. TE-IR STREHL

DIPL. CHlEM lift. LKiSLILA SCHÜHEL-HOPK

DIPL. ING. DtECTER EBDINGHAUb

DR. INCi. DITTi R FINCK

EDINEIJ ZJSNTAR PO PIIYSIKA

DA-18 168

TELEFON (OBO) 48SO64

KILtX Γ. 23!5Gr, AURO LI

TELEGRAMMt-: AUROMARCPAT MÜNCHEN

8. September 1977

Verfahren und Anordnung; zur Synthese vnn Sprache

PATENTANSPRÜCHE

f1.ι Vorfahren zur Synthese von Sprache, dadurch gekennzeichnet , daß jedes Phonem von in einem Speicher eingespeicherten Phonem-Elementen gebildet wird, daß diese Phonem-Elemente aus dem Speicher in Reihe, Geschwindigkeit, Richtung und Anzahl nach der Art und der Länge jedes Phonems gemäß den Satzcharakteristiken und der' Art der Nachbnr-Phoneme ausgelesen v/erden, und der zu synthetisierende Text grammatisch und phonetisch Satz für Satz nach den Regeln der Sprache zur Bestimmung der Grundcharakterisfciken - die Veränderung der Stjmmhöhe als Frequenzcharakteristik, die Veränderung der Stärke der Stimme als Amplitudencharakteristik und die Dauer der Pausen - des betreffenden Satzes, der als Textkonstnntc aufgeschrieben ist, die erforderlichenfalls auch phonetische Zeichen enthalten kann, analysiert wird, nachdem die Folge von Phonemen zur Auswertung des Einflußes der Nachbar-

809816/0590

274052Q

Phoneme analysiert wird und die Plätze und die Art der Veränderung der Phoneme innerhalb der Folge bestimmt werden, daß jedem Phonem bei Festhalten der Grundcharakteristiken des Satzes bestimmte Arten und eine Anzahl von Perioden von Lautschwingungen mit charakteristischer Formant-Verteilung, die aus einer natürlichen Sprache gewonnen sind und/oder künstlich synthetisiert sind, sowie bestimmte Arten und eine Anzahl von Zeit-Abschnitten von Rausch-Phonemen mit entsprechender Dauer, Amplituden und Spektralverteilung gegenübergestellt werden, daß die erwähnten Perioden der Lautschwingungen und die Elemente der Rausch-Phoneme, die für die Sprache vorbestimmt sind, in digitaler Form als Folge von Amplitudenwerten der entsprechenden Schwingung in einem Speicher eingespeichert sind, und zur Gewinnung der entsprechenden Frequenzcharakteristik der Phoneme der Lesevorgang der Amplitudenwerte der Schwingungen vor dem Ende der Periode zur Frequenzerhöhtuig unterbrochen und nach dem Ende der Periode zur Frequenzverminderung mit Nullwerten der Lesevorgang verlängert wird, daß zum Erreichen der Natürlichkeit der Sprache eine quasizufällige Veränderung der Längen der Perioden und der Amplituden der Schwingungen beim Lesen vorgenommen wird, daß zum Erreichen gleichmäßiger Spektral-Verteilungen bei der Synthetisierung von Rausch- und Misch-Phonemen Teile von Rausch-Elementen mit quasizufälliger Anfangeadresse, quasizufälliger Dauer und quasizufälliger Leserichtung ausgelesen werden, und zur Gewinnung verschiedener Phoneme aus gleichen eingespeicherten Rausch-Elementen die Lesefrequenz der eingespeicherten Amplitudenwerte geändert wird oder mit dem gleichen Ziel die Amplitudencharakteristiken der

809816/0690

Phoneme Reändert werden, daß die Gewinnung von Misch-Phonernen durch entsprechendes Verbinden von Laut-Perioden und Rausch-Teile realisiert, und die Realisierung glatter Phonem-Übergänge durch Benutzen von Perioden mit Formant --Verteilungen, die dem Charakter den Übergangs zwischen den Phonemen entsprechen, erreicht wird, daß zum Erreichen eines glatten Phonem-tiborgnngs die Amplituden der Schwingungen im Bereich des betreffenden Übergangs vermindert werden, daß die Steuerung der Wiedergabe der· im Speicher eingespeicherten Sprach-Elemente aufgrund der bei der Analyse der Phonem-Zusammensetzung und der Grundoharnkteristiken vorbereiteten Daten erfolgt, und daß die Amplituiencharaktcristiken der Phoneme durch Steuerung der Verstärkung des durch Umwandlung der digitalen Werte gewonnenen Analogsignale der synthetisierten Phoneme mittels einem Analogsignal, das den digitalen Werten der Amplitudencharnkteristjkon der Phoneme entspricht, gebildet werden.
2. Verfahren gemäß Anspruch 1, dadurch gekennzeichnet , daß die Veränderung der Längen der Perioden i AO % betragen kann.
3. Verfahren gemäß Anspruch 1, dadurch gekennzeichnet , daß die quasizufällige Veränderung der Längen der Perioden und der Amplituden beim Lesen - 3 % betragen kann.

809816/0500
4. Verfahren gemäß Anspruch 1, dadurch gekennzeichnet , daß zum Erreichen der Natürlichkeit der Sprache quacizufällig die Periode der Lautschwingungen, ihrer Amplitude, die Periode der modulierten Amplituden-Rausch-Schwingungen zur Gewinnung von Misch-Phonemen und die Periode der amplitudenmoduliert en Laut-Schwingungen zur Gev/innung des Phonems "P" bulgarisch ("R" lateinisch) verändert werden.
5. Anordnung zur Synthese von Sprache, die eine Rechenmaschine benutzt, dadurch gekennzeichnet , daß ein Ausgang (2) der Rechenmaschine (1) an einem Adressenregister-Zähler (3) eines Festwertspeichers (4) angeschlossen ist, ein zweiter Ausgang (5) der Rechenmaschine (1) an einem Register (6) für Zählrichtung angeschlossen ist, dessen Ausgang mit dem Adressenregister-Zähler (3) verbunden ist, ein dritter und ein vierter Ausgang (7, 0) der Rechenmaschine (1) entsprechend an einem Register (9) zur Bestimmung der Zählfrequenz und an einem Register (10) für die Anzahl der Leseadressen angeschlossen sind, die Ausgänge der beiden letzten Register (9, 10) mit einem Impulsgenerator (11) mit vorgegebener Anzahl und Frequenz verbunden sind, dessen Ausgang mit dem Zähl-Eingang des Adressenregister-Zählers (3) verbunden ist, ein fünfter Ausgang (12) der Rechenmaschine (1) über ein Register (13) zur Amplitudensteuerung an einen Digital-Analog-Umwandler (14) angeschlossen ist, dessen Ausgang mit dem Eingang zur Änderung der Verstärkung eines Verstärker-Modulators (15) verbunden ist, der Ausgang des Festwertspeichers (4) an

809816/0590

einem zweiten Digital-Analog-Umwandler (16) angeschlossen ist, dessen Ausgang mit dem Eingang des Verstärker-Modulators (15) verbunden ist, der Ausgang des Verstärker-Modulators (15) mit einem Lautsprecher (17) und einem Ubertragungskanal (18) verbunden ist und der Ausgang der Steuereinheit (19) mit dem Eingang (21) der Rechenmaschine (1) verbunden ist, deren sechster Ausgang (20) mit dem Eingang der Steuereinheit (19) verbunden ist.

809816/0690