DE3218755A1 - Schaltungsanordnung zur elektronischen sprachsynthese - Google Patents
Schaltungsanordnung zur elektronischen sprachsyntheseInfo
- Publication number
- DE3218755A1 DE3218755A1 DE3218755A DE3218755A DE3218755A1 DE 3218755 A1 DE3218755 A1 DE 3218755A1 DE 3218755 A DE3218755 A DE 3218755A DE 3218755 A DE3218755 A DE 3218755A DE 3218755 A1 DE3218755 A1 DE 3218755A1
- Authority
- DE
- Germany
- Prior art keywords
- filter
- speech
- circuit arrangement
- filters
- individual
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 230000015572 biosynthetic process Effects 0.000 title claims description 17
- 238000003786 synthesis reaction Methods 0.000 title claims description 17
- 230000005284 excitation Effects 0.000 claims description 30
- 238000005516 engineering process Methods 0.000 claims description 10
- 239000011159 matrix material Substances 0.000 claims description 9
- 238000003860 storage Methods 0.000 claims description 3
- 150000003839 salts Chemical class 0.000 claims 1
- 238000005070 sampling Methods 0.000 abstract description 3
- 230000002194 synthesizing effect Effects 0.000 abstract 1
- 230000015654 memory Effects 0.000 description 14
- 238000000034 method Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 3
- 238000001208 nuclear magnetic resonance pulse sequence Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 241000544066 Stevia Species 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000009415 formwork Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000012432 intermediate storage Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- HELXLJCILKEWJH-NCGAPWICSA-N rebaudioside A Chemical compound O([C@H]1[C@H](O)[C@@H](CO)O[C@H]([C@@H]1O[C@H]1[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O1)O)O[C@]12C(=C)C[C@@]3(C1)CC[C@@H]1[C@@](C)(CCC[C@]1([C@@H]3CC2)C)C(=O)O[C@H]1[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O1)O)[C@@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@H]1O HELXLJCILKEWJH-NCGAPWICSA-N 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 238000001308 synthesis method Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
- G10L13/04—Details of speech synthesis systems, e.g. synthesiser structure or memory management
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Electrophonic Musical Instruments (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Photoreceptors In Electrophotography (AREA)
- Machine Translation (AREA)
- Toys (AREA)
Description
ti It ■··· t» tt
• I III
< · . ,
< > ti ι··· ι
>t <
• I I I · ■ « .
1 · > I < I · ·
11 ti ·«« la ···■
SIEMENS AKTIENGESELLSCHAFT Unser Zeichen Berlin und München VPA ^n ι t η 3
Die Erfindung betrifft eine Schaltungsanordnung zur elektronischen Sprachsynthese, wobei Sprachelemente
5. durch signifikante Parameter dargestellt werden und einzelne Sprachelemente zu längeren Sprachsegmenten
zusammengesetzt werden können, wobei ein Anregungssignal zur Darstellung stimmhafter bzw. stimmloser
Laute durch einen Ton- bzw. Rauschgenerator unter Verwendung mindestens eines Teils der signifikanten
Parameter erzeugt und einer FiIterschaltung zugeführt
wird und wobei die filterausgangsseitigen elektrischen Signale zur akustischen Wiedergabe der gewünschten
Sprachelemente und -segmente aufbereitet werden.
Es sind bereits Verfahren zur Erzeugung von Sprachelementen bekannt, die zur Bildung von längeren Sprachsegmenten
zusammengesetzt werden können; diese Verfahren . lassen sich in die folgenden zwei Gruppen einteilen. Zur
ersten Gruppe gehören die Verfahren, bei denen'die zunächst
in einer Analyse abgetasteten, eventuell digitalisierten und beispielsweise in einem Festwertspeicher abgespeicherten
Sprachelemente zur Sprachsynthese aus dem Speicher wieder abgerufen und zusammengesetzt werden; dabei werden
auch redundante, für die Verständlichkeit der Sprache nicht notwendige Bestandteile abgespeichert, so daß
Dl 1 KeI / 13.5.82
ti aiii ι · · ·
Il I I · ·
- 2 - VPA- 82 P H O 3 DE " j
auf diese Weise an sich Sprache guter Qualität erzeugt
werden kann, wobei zur Darstellung eines umfangreichen Wortschatzes allerdings ein entsprechend hoher Speicherbedarf
besteht. Bei der zweiten Gruppe der Sprachsyntheseverfahren
sind" redundante Sprachbestandteile weitgehend ausgeblendet und die Sprache ist in Form von signifikanten
Parametern von Sprachelementen gespeichert, aus denen sich so bei wesentlich geringerem Speicherbedarf für den Hörer
gut verständliche Sprache erzeugen läßt. Das Kernstück bekannter Schaltungsanordnungen für die Durchführung der
letztgenannten Verfahren bilden FiIterschaltungen
mit variablen Filter-Koeffizienten. So ist beispielsweise aus der DE-AS 22 09 548 eine Sprachsyntheseschaltung
bekannt, bei der ein mit signifikanten Sprachparametern beaufschlagtes Anregungssignal einer Filterschaltung
mit variablen Filterkoeffizienten zugeführt wird. Diese Filterkoeffizienten werden durch weitere signifikante.
Sprachparameter fortlauferü während des gesamten Synthesevorganges
gesteuert, so daß die Schaltungsanordnung zur Durchführung dieser Verfahren Einrichtungen zur Speicherung
eben dieser Filterkoeffizienten aufzuweisen hat. Außerdem ist die Schaltungsanordnung mit Steuereinrichtungen zum
Abrufen dieser Koeffizienten aus dem Speicher und ihrer
Zuführung in die Filter zu versehen. Solche abstimmbare Filter weisen dabei relativ große Abmessungen auf und
lassen sich mit den für gute Sprachqualität notwendigen engen Toleranzen nur schwer und nur unter großem
Aufwand realisieren.
32Ί8755 - 3 - VPA 82 P H 03 DE
Der Erfindung liegt nun die Aufgabe zugrunde, eine einfacher realisierbare Schaltungsanordnung zur elektronischen Sprachsynthese
zu schaffen, die gut verständliche Sprache erzeugt.
Die Aufgabe wird erfindungsgemäß dadurch gelöst, daß die Filterschaltung aus Einzelfiltern besteht, von
denen jeweils nur diejenigen Einzelfilter, deren Filterkoeffizienten die restlichen signifikanten Parameter
der tatsächlich sequentiell gewünschten Sprachelemente darstellen, sequentiell angesteuert werden.
Die Erfindung bringt den Vorteil eines geringeren Speicheraufwandes mit sich, verbunden mit dem Vorteil
einer einfacheren Realisierbarkeit von Filtern mit
festen Koeffizienten.
Weitere vorteilhafte Ausgestaltungen der Erfindungen ergeben sich aus den Unteransprüchen. So können in
Analogtechnik aufgebaute Einzelfilter vorgesehen sein, die mit einem zeitdiskreten Analog-Anregungssignal
beaufschlagbar sind; die Realisierung solcher Analogfilter 1st besonders einfach. Dies gilt
um so mehr, wenn sie zweckmaßigerweise in einer weiteren Ausgestaltung der Erfindung als Transversalfilter
in sogenannter CCD-Technik aufgebaut sind.
•\ Alternativ können auch in Digitaltechnik aufgebaute
Einzelfilter vorgesehen sein, ·
■ · ι ■ ■ · ·
- 4 _ VPA
82 P H O 3 DE
• die mit einem zeitdiskreten Digital-Anregungssignal beaufschlagbar sind, was den Vorteil, mit -sich bringt,
die. Parameterwerte der Sprachsignale in besonders einfacher Weise abspeichern zu können.
In weiterer Ausgestaltung der Erfindung können die Einzelfilter zur Darstellung von Sprachelementen
filterindividuell adressiert werden. Eine Schaltungsanordnung
gemäß der Erfindung kann eine solche Anzahl.
von Einzelfiltern enthalten, daß alle Phoneme einer bestimmten Sprache darstellbar sind. Mehrere Phoneme
können in bestimmter zeitlicher Reihenfolge erzeugt und entsprechend der' Charakteristik der menschlichen
Stimme miteinander verbunden werden.'
• In weiterer Ausgestaltung der Erfindung können die Einzelfilter
in Filtersätzen zur Darstellung längerer Sprachsegmente zusammengeschaltet s_ein, wobei eine v/ahlfreie
Ansteuerung der Filtersätze durch filtersatzindividuelle Adressierung erfolgt. Eine solche Alternative zeichnet
sich durch geringeren Speieheraufwand aus und ist besonders
für die Darstellung von Sprache geeignet, in der gleiche Sprachsegmente v/iederholt auftreten. Die Einzelfilter
können "auch in einer Matrix angeordnet sein, in der jeweils die Einzelfilter einer Matrixzeile parallel mit
dem jeweiligen Anregungssignal beaufschlagt werden, und
die Einzelfilterausgänge jeweils einer Matrixzeile sequentiell mit dem. Matrixausgang verbindbar sind.
In weiterer Ausgestaltung der Erfindung können die Einzelfilter als Linearprädiktions- bzw. als Formantfilter ausgebildet sein. Die Formantfilter v/eisen feste Formantmittenfrequenzen
und -bandbreiten auf. Die Darstellung von Sprachelementen erfolgt dabei durch die Wiedergabe
mindestens der drei tiefsten Formanten.
- 5 - VPA 82 P H O 3 DE
Die Einzelfilter können in einer v/eiteren Ausgestaltung
der Erfindung in sogenannter CCD-Technik realisiert sein. Auch können sie. als Transversalfilter ausgebildet sein..
Die Erfindung wird nun in einem zum Verständnis erforderlichen Umfang anhand von Zeichnungen näher beschrieben.
Dabei zeigt .
FIG 1 ein Blockschaltbild einer Schaltungsanordnung zur Sprachsynthese.
FIG 2 zeigt das Blockschaltbild eines Ausführungsbeispiels
der Erfindung mit in Matrixform angeordneten Einzelfiltern·. FIG 3 und FIG 4 zeigen die Verwendung von Linearprädiktions-
bzw. Formantfiltern.
FIG 1 zeigt ein Blockschaltbild einer Schaltungsanordnung gemäß der Erfindung, die im Kern eine Filterschaltung F,
eine Anregungsgeneratoreinrichtung G und eine Steuereinheit StE umfaßt, die ihrerseits mit einer Eingabeeinheit EG
bzw. mit einem Tiefpaß TP und einem elektroakustisehen
Wandler in Verbindung stehen. '·
Die Eingabeeinheit EG möge Informationen über zu synthetisierende Sprachelemente an die Steuereinheit StE abgeben.
Diese Informationen können beispielsweise über ein " Tastenfeld eingegeben werden. Ebenso können Informationen
über zu synthetisierende Sprachelemente aber auch aus systemexternen Einrichtungen in systemkonformer Darstellung
zugeführt werden. Die Steuereinheit StE möge Einrichtungen zur Zwischenspeicherung und Abarbeitung
dieser Informationen z.B. im sogenannten "handshake-3etrieb"
mit der Filterschaltung F sowie Speicher umfassen, in denen Sprechparameter abgespeichert sind. Vie in FIG 1*
angedeutet ist, können von der Steuereinheit StE zu der Filterschaltung F beispielsweise zwei Leitungsverbindungen
führen, nämlich eine für ein Filterwechseltaktsignal Tw und eine für ein digitales Sprachelementauswahlsignal
SEA, wobei das Filterwechseltaktsignal
32Ί8755
_ 6 _ VPA 82 P H O 3 DE
in der Filterschaltung F die Synthese desjenigen Sprachelements
steuert, das durch das Sprachelementauswahlsignal
SEA bestimmt wird. Die Filterschaltung F, die beispielsweise in der aus FIG 2 dargestellten ¥eise ausge-
bildet sein kann, enthält unter anderem Einzelfilter
(F11... in FIG 2)mit festen Koeffizienten. Mit Hilfe
dieser Einzelfilter wird die Sprachsynthese durchgeführt, wobei die Einzelfilter einem Ausgang SA der
Filterschaltung F ein (elektrisches) Sprachsignal liefern,
(F11... in FIG 2)mit festen Koeffizienten. Mit Hilfe
dieser Einzelfilter wird die Sprachsynthese durchgeführt, wobei die Einzelfilter einem Ausgang SA der
Filterschaltung F ein (elektrisches) Sprachsignal liefern,
das gegebenenfalls nach Digital/Analog-Wandlung über ein |
Tiefpaßfilter TP und gegebenenfalls über einen nach- $■
folgenden Verstärker einem elektroakustischen Wandler |
zugeführt wird. Wie in FIG 1 weiter angedeutet ist, kann | die Filterschaltung F der Steuereinheit StE über eine
Steuerleitung E ein Digitalsignal zuführen, das das
Ende des Synthesevorgangs eines Sprachelements anzeigt
und im bereits erwähnten handshake-Betrieb die erforderfür
! liehen Informationen üen SyntheseVorgang des durch die |
eingegebene Information bestimmten nachfolgenden Sprachen
* elements anfordert.
* elements anfordert.
FIG 2 zeigt schaltungstechnische Einzelheiten eines Ausführungsbeispiels
der Filterschaltung F, der Anregungsgenerator|
einrichtung G sowie der Steuereinheit StE.
· ■ .. ■
· ■ .. ■
Dabei geht die Darstellung in FIG 2 von einer Anordnung |
der 2S?%xner f-fatrix aus. Die Filter schaltung F umfaßt f
dabei neben den in- Spalten F11, F21,.. .Fn 1;... und |
Zeilen F11, F12,.. .F1Z;.... angeordneten Einzelfiltern, |j
zeilenindividuelle Multiplexer M1, M2,...Mn einen |
Zeilenauswahlmultiplexer ZMF, eine Auswahlschaltung ZME $
sowie gegebenenfalls eine in FIG 2 nicht näher darge- k
stellte, zwischen Anregungsgenerator einrichtung G und f\
den Einzelfiltern eingefügten Zeitfensterschaltung. &
_ .7 - VPA 82 P H O 3 DE
Die Anregungsgeneratoreinrichtung G besteht gemäß FIG 2 aus de einem steuerbaren Impuls- und Rauschgenerator IG
bzw. RG -sowie einer Schaltvorrichtung. Die Steuereinheit
StE umfaßt unter anderem Speicher S1.'..Sn, in denen 5 Sprachparameterwerte abgespeichert sind, einen Filterwechseltaktgenerator
FwG, sowie eine. Speicherauswahl- . . schaltung ZMA. Die Filterschaltung F erhält von der
Steuereinheit StE einen Filterwechsel-Taktpuls Tw und ein Sprachelementauswahlsignal SEA. Der in der Steuer-10
einheit StE angeordnete Filterwechseltaktgenerator FwG
erzeugt äquidistante Filterwechseltaktimpulse mit einer Impulsperiode Tw, die beispielsweise zwischen 10 und 25 ms
betragen kann. Die Filterwechseltaktimpulse werden allen in der FiIterschaltung F befindlichen zeilenindividuellen
15 Multiplexern ΙΊ1... und den, in der Steuereinheit StE
angeordneten Speichern S1...gleichzeitig zugeführt.· Bei
dem hier betrachteten Ausführungsbeispiel ist die Anzahl i der zeilenindividuellen Multiplexer M gleich der Anzahl ■
I der genannten Speicher S. Diese Zahl entspricht der . . :
I 20 Zeilenzahl der Filtermatrix. Wenn - wie oben unterstellt -
I . durch die Filterschaltung F ηunterschiedliche Sprachseg-.
I Eiente. erzeugbar sind,so weist die Filterschaltung F.n
I zeilenweise angeordnete FiItersatze auf. Jeder Filtersatz
I umfaßt mindestens ein Einzelfilter. Das im Filtersatz if 25 erzeugte Sprachsegment kann aus mehreren Sprachele'menten
iff . ·
'I zusammengesetzt werden, die in den zu diesem Filtersatz
\\ gehörenden Filtern erzeugt werden. Die Dauer -eines
p Sprachelementes beträgt t ; die Dauer eines aus m ;ji Sprachelementen zusammengesetzten Sprachsegments beträgt
; 30 dann m«tw. Die Anzahl der für die Erzeugung eines solchen
;:i Sprachsegments erforderlichen Einzelfilter kann kleiner ;' als m sein, wenn das betreffende Sprachsegment unterein-
':■; ander gleiche Sprachelemente enthält, die in gleichen
Einzelfiltern des betreffenden Filtersatzes synthetisiert 35 werden. Die (analogen) Sprachelementsignäle werden durch ·
- 8 - VPA 82 P H O 3 DE
den jeweiligen zeilenindividuellen Multiplexer M im . Filterwechseltakt Tv zum (analogen) Sprachsignal SA
zusammengeschaltet. Die vom Filterwechseltaktgenerator F;7G
erzeugte Impulsfolge mit der Frequenz 1/tw v/ird auch allen
in der Steuereinheit StE befindlichen, zeilenindividuellen Speichern S zugeführt, in denen die Parameterwerte
der Anregungssignale, z.B. deren Frequenz f \md Amplitude U abgespeichert sind. Durch die vom Filterwechseltaktgenerator
FwG erzeugte Impulsfolge werden diese Parameterwerte aus den Speichern S abgerufen und der Speicherauswahlschaltung
ZMA zugeführt. Diese wählt dann nach MaG--gäbe
des ihr ebenfalls zugeführten Sprachelementauswahlsignals SEA die Parameterwerte des zu erzeugenden Sprachsegments
aus und führt diese der steuerbaren Anregungsgeneratoreinrichtung G zu.' Die Anregungsgeneratoreinrichtung
G umfaßt einen in Frequenz und Amplitude steuerbaren Impulsgenerator IG sowie einen in der Amplitude steuerbaren
Rauschgenerator RG. Die in der Anregungsgeneratoreinrichtung G ausgangsseitig vorgesehene Schaltvorrichtung
wird durch die aus den Speichern S abgerufene Information über die Frequenz gesteuert: Für Frequenzwerte gleich Null
v/ird der Rauschgenerator RG an die Filterschaltung F' gekoppelt, für Frequenzwert ungleich Null wird der Impulsgenerator
IG an die Filterschaltung F gekoppelt.
Die Anregungsgeneratoreinrichtung G liefert abhängig von ·
den Parameterwerten f und U Impuls- oder Rauschsignale bestimmter Amplitude und ggf. Frequenz. Stimmlose
Sprachelemente werden durch Rauschsignale, stimmhafte
Sprachelemente bestimmter Frequenz durch Impulsfolgen eben dieser Frequenz nachgebildet. Die.von der steuerbaren
Anregungsgeneratoreinrichtung G erzeugten Anregungssignale werden bei dem hier beschriebenen Ausführungsbeispiel allen Filter Sätzen zugeführt, also auch denjenigen,
die nicht der Erzeugung des ausgewählten Sprachsegments dienen. Alle in den FiItersatzen erzeugten
-9 - VPA 82 P H 03 DE
(Analog)signale werden über die zeilenindividuellen
Multiplexer M dem Zeilenauswahlmultiplexer ZMF zugeführt,
in dem mittels des Sprachelementauswahlsignals SGA das gewünschte Sprachsignal ausgewählt wird, das dann
am Ausgang SA des Zeilenauswahlmultiplexers auftritt. Das Sprachsignal SA wird dem Tiefpaß TP zugeführt, der etwa
auf Grund impulsartiger Anregung der Filter im Sprachsignal enthaltene höhere Frequenzbestandteile ausfiltert.
Es sei Her bemerkt, daß die vorstehenden Erläuterungen nicht auf eine Sprachsignalsynthese mittels durch Analog-Anregungssignale
beaufschlagte Analogfilter beschränkt sind, sondern in entsprechender Weise auch für eine
Sprach signalancrdraung.ni.tt eis durch Digital-Ar.regungssignale
beaufschlagte Digitalfilter gelten, wobei""dann das Filterausgangssignal
noch einer, Digital-Analog-Umwandlung unterzogen wird. Nach einer gegebenenfalls noch erforderlichen
Verstärkung wird schließlich das elektrische Analog-■ Sprachsignal, über einen elektroakustischen Wandler
wiedergegeben.
Die zeilenindividuellen Multiple.-er Il geben gleichzeitig mit dem Durchschalten des letzten in dem betreffenden
Filtersatz erzeugten Sprachelements ein Digitalsignal E an die Auswahlschaltung ZME ab, das den
zeitlichen Abschluß des Spradhsynthesevorgangs in dem Filtersatz kennzeichnet. Die ebenso wie der Zeilenauswahlmultiplexer
ZMF von dem momentanen Sprachelementauswahlsignal SEA i-n eine entsprechende Schaltstellung
gebrachte Auswahlschaltung ZME schaltet nun das entsprechende Digitalsignal zu der Steuereinheit StE durch,
die damit den Synthese-rargang des nächstfolgenden Sprachsegments
auslösen kann.
Abweichend von der Darstellung in FIG 2 können die Einzelfilter mit festen Koeffizienten auch einzeln adressierbar
sein. In diesem Fall v/eist die Filterschaltung (F in FIG 2)
3218755 \ 82 ρ η 03 DE
keinen Zeilenauswahlinultiplexer (ZMF in FIG 2) und keine '
Auswahlschaltung (ZME in FIC- 2) sowie keine zeilenindi-; <
viduellen Multiplexer (M in FIG 2) der oben beschriebenen ί
Art auf. Vielmehr verfügt die Steuereinheit (StE in FIG 2) Ά
dann über Einrichtungen zur Speicherung individuell " ■ %
adressierbarer Parameterwerte für die Anregungssignale §
und zur Zusammenschaltung der in den Einzelfiltern erzeug- ||
baren Sprachelementesignale. Der Filterwechseltaktgenera- %
tor FwG (in FIG 2) und die steuerbare Anregungs- \
Generator einrichtung G (in FIG 2) (ggf. mit Zeitfenster- · . \
schaltung) erfüllen auch bei dieser Ausführungsfora die ■ |
oben beschriebenen Funktionen. Eine solche durch wahlfreie »1
Ansteuerung von Einzelfiltern mittels einzelfilterindi- ' i!;
vidueller Adressierung gekennzeichnete Ausfuhrungsform 1A
braucht nur unterschiedliche Einzelfilter. . aufzuweisen. i!
* h
während bei dem Ausführungsbeispiel gemäß FIG 2 auch ■ i|
untereinander gleiche Einzelfilter in den verschiedenen . ■ ί
Filtersätzen, ggf. auch in ein- und demselben Filter- |
satz angeordnet sein können. Die letzteren Alterna- |j
tiven, die sich wegen der filtersatzindividuellen J
Adressierung gegenüber der einzelfilterindividu- |
eilen Adressierung mit geringerem steuertechnisc>>»n |
Aufwand realisieren lassen, sind besonders für die "Wieder-- ' |
gäbe von Sprache geeignet, die wiederholt gleiche Sprach- |
* 25 segmente enthält. Praktisch bedeutsam werden AusfUhrungs- %
formen sein, die sowohl in Filtersätzen verbundene ... f
Einzelfilter als auch unabhängige"Einzelfilter enthalten. t
Auf diese Weise läßt sich die Zahl der verwendeten Einzel- |
filter und der notwendige steuertechnische Aufwand optimie- |
|
Die erfindungsgemäß verwendeten Einzelfilter können .
auch als Linearpräidiktionsfilter mit festen Koeffizienten i gemäß FIG 3 ausgebildet sein. Lineare Prädiktion als
35. solche ist bekannt und in der einschlägigen Fachliteratur
• (so beispielsweise FLANAGAN, Speech" Analysis Synthesis . '
. and Perception, Springer-Verlag Berlin, Heidelberg,
auch als Linearpräidiktionsfilter mit festen Koeffizienten i gemäß FIG 3 ausgebildet sein. Lineare Prädiktion als
35. solche ist bekannt und in der einschlägigen Fachliteratur
• (so beispielsweise FLANAGAN, Speech" Analysis Synthesis . '
. and Perception, Springer-Verlag Berlin, Heidelberg,
-11-- VPA 82 P H 03 DE
New York 1972, S. 367 ff., S.390 ff.) beschrieben,
so daß sich hier eine nähere Darstellung erübrigt. Dabei ist die erreichbare Sprachqualität in bestimmten
Grenzen proportional zur Zahl der Koeffizienten.. Gute
5 Sprachqualität läßt sich bereits mit etwa 10 Filterkoeffizienten
realisieren. Ein solches Prädiktionsfilter wird mit seinen.in FIG 3 mit A11 und B11 bezeichneten
Anschlußklemmen an die entsprechend bezeichneten Anschlußklemmen der Filterschal'tung F gemäß FIG 2 angeschlossen,
10 um dort das Einzelfilter F11 zu bilden. Die erfindungsgemäß verwendeten Linearpräidiktionsfilter können als
Analog- oder als Digitalfilter ausgebildet sein. Dementsprechend werden den Filtern Anregungssignale in analoger
oder digitaler Form vom Anregungsgenerator zugeführt;
15 entsprechend ergeben sichan den FiIterausgangen analoge
oder digitale Signale.
I Die erfindungsgeraäß verwendeten Einzelfilter können, wie
I in FIG 4 dargestellt, auch als Formantfilter mit festen
[ι 20 Filterkoeffizienten ausgebildet sein, wobei jedem Einzel-
i filter eine Parallelschaltung von drei Formantfiltern zur
I Nachbildung mindestens der ersten drei (niederfrequenten)
tjj Sprachformanten entsprechen kann. Die Spracherzeugung
;; durch Formant synthese ist bekannt und hinreichend be-
I 25 schrieben (so beispielsweise in der bereits zitierten
Ü Literatur FLAN/GAN S.339 ff.), so daß sich eine. Dar-
$ stellung an dieser Stelle wiederum erübrigt. Die Formant-
I filter sind zweckma,ßigerweise als Bandpässe mit bestimmten
festen Durchlaßbereichen und Mittenfrequenzen
,j. 30 dieser Durchlaßbereiche ausgebildet. Auch eine solche
I FiIterschaltung kann in Analog- und Digitaltechnik
te realisiert sein.
$ Die Einzelfilter können in allen vorstehend genannten
w ■
i . 35 Fällen in sogenannter CCD-Technik realisiert sein.
- 12 - VPA 82 P H 03DE
Bei Verwendung von Transversalfilter^ "beziehungsweise
Rekursivfiltern wird das Anregung.·=!signal den Einzelfiltern
in zeitdiskreter Form zugeführt. Hierzu kann die
FiIterschaltung (F in FIG 2) eine in FIG 2 nicht näher
α dargestellte Zeitfensterschaltung enthalten. Die Zeit-
Rekursivfiltern wird das Anregung.·=!signal den Einzelfiltern
in zeitdiskreter Form zugeführt. Hierzu kann die
FiIterschaltung (F in FIG 2) eine in FIG 2 nicht näher
α dargestellte Zeitfensterschaltung enthalten. Die Zeit-
fensterschalung kann entsprechend dem Abtasttheorem j£j
\\ ein Abtastsignal fester Frequenz erzeugen, die mindestens f;
die doppelte Frequenz bezogen auf das abzutastende Netz- |!
signal aufweist. Mit diesem so erzeugten Abtastsignal ρ
werden die steuerbare Anregungsgeneratoreinrichtung G i*j
sowie sämtliche Einzelfilter in die FiIt er schaltung F ;|
getaktet. If
Claims (11)
- ···· f t * t- 13 - VPA 82 P H 03 DEPatentansprücheM.j Schaltungsanordnung zur elektronischen Sprachsynthese, wobei Sprachelemente durch signifikante Parameter dargestellt werden und einzelne Sprachelemente zu längeren Sprachsegmenten zusammengesetzt werden können, wobei ein Anregungssignal zur Darstellung stimmhafter bzw. stimmloser Laute durch einen Ton- bzw. Rauschgenerator unter Verwendung mindestens eines Teils der signifikanten Parameter erzeugt unl einer Filterschaltung zugeführt wird und wobei die filterausgangsseitigen elektrischen Signale zur akustischen Wiedergabe der gewünschten Sprachelemente und -Segmente aufbereitet werden, dadurch gekennzeichnet, daß die Filterschaltung aus Einzelfiltern besteht, von denen jeweils nur diejenigen Einzelfilter, deren Filterkoeffizienten die restlichen signifikanten Parameter der tatsächlich sequentiell gewünschten Sprachelemente darstellen, sequentiell angesteuert werden.
- 2. Schaltungsanordnung nach Anspruch 1, dadurch gekenn- ■ zeichnet, daß in Analogtechnik aufgebaute Einzelfilter vorgesehen sind, die mit einem zeitdiskreten Analog-Anregungssignal beaufschlagbar sind.
- 3. Schaltungsanordnung nach Anspruch .1, dadurch gekennzeichnet, daß in Digitaltechnik aufgebaute Einzelfilter vorgesehen sind, die mit einem zeitdiskreten Digital-Anregungssignal beaufschlagbar sind und daß daa gewonnene Sprachsignal zur sprachlichen Wiedergabe digital/analoggewandelt wird.
- 4. Schaltungsanordnung nach Anspruch 2 oder 3, gekennzeichnet durch wahlfreie Ansteuerung der Einzelfilter durch einzelfilterindividuelle Adressierung.
- 5. Schaltungsanordnung nach Anspruch 2 oder 3, dadurch gekennzeichnet, daß die Einzelfilter in Filtersätzen zur Darstellung längerer Sprachsegmente angeordnet sind,
I ti Il · » · B
Il I t If
I » Il I · t tf · · ·
B · · ·
I · · ·82 P 1 J I M8755 ! ι ' ι * * i ·' * I · · - 14 - VPA h 0 3DE wobei eine wahlfreie Ansteuerung der Filtersätze durch filtersatzindividuelle Adressierung erfolgt. - 6. Schaltungsanordnung nach Anspruch 5, dadurch gekennzeichnet, daß die Einzelfilter in einer Matrix angeordnet sind, in der jeweils die Einzelfilter einer Mätrixzeile parallel mit dem jeweiligen Anregungssignal beaufschlagt werden und die Einzelfilterausgänge jeweils einer Matrixzeile sequentiell mit dem Matrixausgang verbindbar sind.
- 7. Schaltungsanordnung nach Anspruch 5 oder 6, dadurch gekennzeichnet, daß pro Filtersalz eine Speichereinheit vorgesehen ist, in der Parameter des Anregungssignals zur Darstellung eines Sprachsegments abgespeichert sind.
- 8. Schaltungsanordnung nach einem der Ansprüche 4 bis 7, dadurch gekennzeichnet, daß die Einzelfilter als sogenannte Linear-Predictive-Filter ausgebildet sind.
- 9. Schaltungsanordnung nach einem der Ansprüche 4 bis 7» dadurch gekennzeichnet, daß die Einzelfilter als Formantfilter mit festen Formantmittenfrequenz- und -bandbreitenkoeffizienten zur Erzeugung von Sprache durch die Wiedergabe mindestens der drei tiefsten Formanten ausgebildet sind.
- 10. Schaltungsanordnung nach einem der Ansprüche 4 bis 9, dadurch gekennzeichnet, daß die Einzelfilter in sogenannter CCD-Technik realisiert sind.
- 11. Schaltungsanordnung nach einem der Ansprüche 4 bis 10, dadurchgekennzeichnet, daß die Einzelfilter als Transversalfilter ausgebildet sind.
Priority Applications (6)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE3218755A DE3218755A1 (de) | 1982-05-18 | 1982-05-18 | Schaltungsanordnung zur elektronischen sprachsynthese |
US06/491,581 US4694496A (en) | 1982-05-18 | 1983-05-04 | Circuit for electronic speech synthesis |
JP58081841A JPS58205200A (ja) | 1982-05-18 | 1983-05-12 | 電子音声合成回路装置 |
EP83104873A EP0094681B1 (de) | 1982-05-18 | 1983-05-17 | Schaltungsanordnung zur elektronischen Sprachsynthese |
DE8383104873T DE3370707D1 (en) | 1982-05-18 | 1983-05-17 | Arrangement for electronic speech synthesis |
AT83104873T ATE26354T1 (de) | 1982-05-18 | 1983-05-17 | Schaltungsanordnung zur elektronischen sprachsynthese. |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE3218755A DE3218755A1 (de) | 1982-05-18 | 1982-05-18 | Schaltungsanordnung zur elektronischen sprachsynthese |
Publications (1)
Publication Number | Publication Date |
---|---|
DE3218755A1 true DE3218755A1 (de) | 1983-11-24 |
Family
ID=6163962
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE3218755A Withdrawn DE3218755A1 (de) | 1982-05-18 | 1982-05-18 | Schaltungsanordnung zur elektronischen sprachsynthese |
DE8383104873T Expired DE3370707D1 (en) | 1982-05-18 | 1983-05-17 | Arrangement for electronic speech synthesis |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE8383104873T Expired DE3370707D1 (en) | 1982-05-18 | 1983-05-17 | Arrangement for electronic speech synthesis |
Country Status (5)
Country | Link |
---|---|
US (1) | US4694496A (de) |
EP (1) | EP0094681B1 (de) |
JP (1) | JPS58205200A (de) |
AT (1) | ATE26354T1 (de) |
DE (2) | DE3218755A1 (de) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE19860133A1 (de) * | 1998-12-17 | 2001-07-12 | Cortologic Ag | Verfahren und Vorrichtung zur Sprachkompression |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE3888777T2 (de) * | 1987-10-06 | 1994-07-14 | Toshiba Kawasaki Kk | Verfahren und Einrichtung zur Spracherkennung. |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US2060321A (en) * | 1936-02-18 | 1936-11-10 | Jr Elmer E Johnson | Safety razor |
US2121142A (en) * | 1937-04-07 | 1938-06-21 | Bell Telephone Labor Inc | System for the artificial production of vocal or other sounds |
US2194298A (en) * | 1937-12-23 | 1940-03-19 | Bell Telephone Labor Inc | System for the artificial production of vocal or other sounds |
US2881257A (en) * | 1956-08-16 | 1959-04-07 | Bell Telephone Labor Inc | Spectrum synthesizer |
US3624301A (en) * | 1970-04-15 | 1971-11-30 | Magnavox Co | Speech synthesizer utilizing stored phonemes |
US3836717A (en) * | 1971-03-01 | 1974-09-17 | Scitronix Corp | Speech synthesizer responsive to a digital command input |
NL7306902A (de) * | 1972-05-26 | 1973-11-28 | ||
NL7902238A (nl) * | 1978-04-27 | 1979-10-30 | Kawai Musical Instr Mfg Co | Inrichting voor het opwekken van een vocaal geluids- signaal in een elektronisch muziekinstrument. |
JPS56140400A (en) * | 1980-04-03 | 1981-11-02 | Tokyo Shibaura Electric Co | Signal synthesizing circuit |
US4454609A (en) * | 1981-10-05 | 1984-06-12 | Signatron, Inc. | Speech intelligibility enhancement |
US4475228A (en) * | 1981-11-27 | 1984-10-02 | Bally Manufacturing Corporation | Programmable sound circuit for electronic games |
-
1982
- 1982-05-18 DE DE3218755A patent/DE3218755A1/de not_active Withdrawn
-
1983
- 1983-05-04 US US06/491,581 patent/US4694496A/en not_active Expired - Fee Related
- 1983-05-12 JP JP58081841A patent/JPS58205200A/ja active Pending
- 1983-05-17 DE DE8383104873T patent/DE3370707D1/de not_active Expired
- 1983-05-17 EP EP83104873A patent/EP0094681B1/de not_active Expired
- 1983-05-17 AT AT83104873T patent/ATE26354T1/de not_active IP Right Cessation
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE19860133A1 (de) * | 1998-12-17 | 2001-07-12 | Cortologic Ag | Verfahren und Vorrichtung zur Sprachkompression |
DE19860133C2 (de) * | 1998-12-17 | 2001-11-22 | Cortologic Ag | Verfahren und Vorrichtung zur Sprachkompression |
Also Published As
Publication number | Publication date |
---|---|
JPS58205200A (ja) | 1983-11-30 |
ATE26354T1 (de) | 1987-04-15 |
US4694496A (en) | 1987-09-15 |
EP0094681B1 (de) | 1987-04-01 |
EP0094681A1 (de) | 1983-11-23 |
DE3370707D1 (en) | 1987-05-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE3041423C1 (de) | Verfahren und Vorrichtung zur Verarbeitung eines Sprachsignals | |
DE2934489C2 (de) | ||
DE69816221T2 (de) | Sprachschnellheitsveränderungsverfahren und vorrichtung | |
DE2945414C2 (de) | Sprachsignal-Voraussageprozessor und Verfahren zur Verarbeitung eines Sprachleistungssignals | |
EP0069398B1 (de) | Verfahren zur Prüfung von Analog-Digital-Wandlern und/oder von Digital-Analog-Wandlern oder von nachrichtentechnischen Übertragungsabschnitten, die solche Wandler enthalten oder mit ihnen in Reihe geschaltet sind, insbesondere zur Prüfung von Codecs für PCM-Geräte, sowie Vorrichtung zur Durchführung des Verfahrens | |
DE2115258A1 (de) | Sprachsynthese durch Verkettung von in Formant Form codierten Wortern | |
DE2229149A1 (de) | Verfahren zur Übertragung von Sprache | |
DE2524497B2 (de) | Verfahren und Schaltungsanordnung zur Sprachsynthese | |
DE2920298A1 (de) | Binaere interpolatorschaltung fuer ein elektronisches musikinstrument | |
DE9006717U1 (de) | Anrufbeantworter für die digitale Aufzeichnung und Wiedergabe von Sprachsignalen | |
DE2622423B2 (de) | Elektrische Anordnung zur Übertragung oder Speicherung eines Sprachoder Tonsignals in kodierter Form | |
DE3019823C2 (de) | ||
DE3006339C2 (de) | Sprachsyntesizer | |
DE2906519C2 (de) | Verfahren zur Analog-Digitalwandlung | |
DE69233622T2 (de) | Vorrichtung zur Erzeugung von Ansagen | |
DE3246712C2 (de) | ||
EP0094681B1 (de) | Schaltungsanordnung zur elektronischen Sprachsynthese | |
DE3101590C2 (de) | Anordnung zum Erzeugen eines Sprachsignals | |
DE2649540A1 (de) | Verfahren und anordnung zur sprachsynthese | |
DE3037276C2 (de) | Tonsynthesizer | |
DE2826570C2 (de) | ||
DE2051589A1 (de) | Anordnung zur Synthese eines Signals | |
DE2657430A1 (de) | Einrichtung zum synthetisieren der menschlichen sprache | |
DE3232835C2 (de) | ||
DE4426534C2 (de) | Verfahren zur Steuerung der Signalaufzeichnung für einen digitalen Anfrufbeantworter |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
8130 | Withdrawal |