DE3218755A1 - Schaltungsanordnung zur elektronischen sprachsynthese - Google Patents

Schaltungsanordnung zur elektronischen sprachsynthese

Info

Publication number
DE3218755A1
DE3218755A1 DE3218755A DE3218755A DE3218755A1 DE 3218755 A1 DE3218755 A1 DE 3218755A1 DE 3218755 A DE3218755 A DE 3218755A DE 3218755 A DE3218755 A DE 3218755A DE 3218755 A1 DE3218755 A1 DE 3218755A1
Authority
DE
Germany
Prior art keywords
filter
speech
circuit arrangement
filters
individual
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
DE3218755A
Other languages
English (en)
Inventor
Hans Dipl.-Ing. Brandl
Werner Dipl.-Ing. 8000 München Liegl
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Siemens AG
Original Assignee
Siemens AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Siemens AG filed Critical Siemens AG
Priority to DE3218755A priority Critical patent/DE3218755A1/de
Priority to US06/491,581 priority patent/US4694496A/en
Priority to JP58081841A priority patent/JPS58205200A/ja
Priority to EP83104873A priority patent/EP0094681B1/de
Priority to DE8383104873T priority patent/DE3370707D1/de
Priority to AT83104873T priority patent/ATE26354T1/de
Publication of DE3218755A1 publication Critical patent/DE3218755A1/de
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • G10L13/04Details of speech synthesis systems, e.g. synthesiser structure or memory management

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Electrophonic Musical Instruments (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Photoreceptors In Electrophotography (AREA)
  • Machine Translation (AREA)
  • Toys (AREA)

Description

ti It ■··· t» tt
• I III < · . ,
< > ti ι··· ι >t <
• I I I · ■ « . 1 · > I < I · ·
11 ti ·«« la ···■
SIEMENS AKTIENGESELLSCHAFT Unser Zeichen Berlin und München VPA ^n ι t η 3
Schaltungsanordnung zur elektronischen Sprachsynthese
Die Erfindung betrifft eine Schaltungsanordnung zur elektronischen Sprachsynthese, wobei Sprachelemente
5. durch signifikante Parameter dargestellt werden und einzelne Sprachelemente zu längeren Sprachsegmenten zusammengesetzt werden können, wobei ein Anregungssignal zur Darstellung stimmhafter bzw. stimmloser Laute durch einen Ton- bzw. Rauschgenerator unter Verwendung mindestens eines Teils der signifikanten Parameter erzeugt und einer FiIterschaltung zugeführt wird und wobei die filterausgangsseitigen elektrischen Signale zur akustischen Wiedergabe der gewünschten Sprachelemente und -segmente aufbereitet werden.
Es sind bereits Verfahren zur Erzeugung von Sprachelementen bekannt, die zur Bildung von längeren Sprachsegmenten zusammengesetzt werden können; diese Verfahren . lassen sich in die folgenden zwei Gruppen einteilen. Zur ersten Gruppe gehören die Verfahren, bei denen'die zunächst in einer Analyse abgetasteten, eventuell digitalisierten und beispielsweise in einem Festwertspeicher abgespeicherten Sprachelemente zur Sprachsynthese aus dem Speicher wieder abgerufen und zusammengesetzt werden; dabei werden auch redundante, für die Verständlichkeit der Sprache nicht notwendige Bestandteile abgespeichert, so daß
Dl 1 KeI / 13.5.82
ti aiii ι · · ·
Il I I · ·
- 2 - VPA- 82 P H O 3 DE " j
auf diese Weise an sich Sprache guter Qualität erzeugt werden kann, wobei zur Darstellung eines umfangreichen Wortschatzes allerdings ein entsprechend hoher Speicherbedarf besteht. Bei der zweiten Gruppe der Sprachsyntheseverfahren sind" redundante Sprachbestandteile weitgehend ausgeblendet und die Sprache ist in Form von signifikanten Parametern von Sprachelementen gespeichert, aus denen sich so bei wesentlich geringerem Speicherbedarf für den Hörer gut verständliche Sprache erzeugen läßt. Das Kernstück bekannter Schaltungsanordnungen für die Durchführung der letztgenannten Verfahren bilden FiIterschaltungen mit variablen Filter-Koeffizienten. So ist beispielsweise aus der DE-AS 22 09 548 eine Sprachsyntheseschaltung bekannt, bei der ein mit signifikanten Sprachparametern beaufschlagtes Anregungssignal einer Filterschaltung mit variablen Filterkoeffizienten zugeführt wird. Diese Filterkoeffizienten werden durch weitere signifikante. Sprachparameter fortlauferü während des gesamten Synthesevorganges gesteuert, so daß die Schaltungsanordnung zur Durchführung dieser Verfahren Einrichtungen zur Speicherung eben dieser Filterkoeffizienten aufzuweisen hat. Außerdem ist die Schaltungsanordnung mit Steuereinrichtungen zum Abrufen dieser Koeffizienten aus dem Speicher und ihrer Zuführung in die Filter zu versehen. Solche abstimmbare Filter weisen dabei relativ große Abmessungen auf und lassen sich mit den für gute Sprachqualität notwendigen engen Toleranzen nur schwer und nur unter großem Aufwand realisieren.
32Ί8755 - 3 - VPA 82 P H 03 DE
Der Erfindung liegt nun die Aufgabe zugrunde, eine einfacher realisierbare Schaltungsanordnung zur elektronischen Sprachsynthese zu schaffen, die gut verständliche Sprache erzeugt.
Die Aufgabe wird erfindungsgemäß dadurch gelöst, daß die Filterschaltung aus Einzelfiltern besteht, von denen jeweils nur diejenigen Einzelfilter, deren Filterkoeffizienten die restlichen signifikanten Parameter der tatsächlich sequentiell gewünschten Sprachelemente darstellen, sequentiell angesteuert werden. Die Erfindung bringt den Vorteil eines geringeren Speicheraufwandes mit sich, verbunden mit dem Vorteil einer einfacheren Realisierbarkeit von Filtern mit festen Koeffizienten.
Weitere vorteilhafte Ausgestaltungen der Erfindungen ergeben sich aus den Unteransprüchen. So können in Analogtechnik aufgebaute Einzelfilter vorgesehen sein, die mit einem zeitdiskreten Analog-Anregungssignal beaufschlagbar sind; die Realisierung solcher Analogfilter 1st besonders einfach. Dies gilt um so mehr, wenn sie zweckmaßigerweise in einer weiteren Ausgestaltung der Erfindung als Transversalfilter in sogenannter CCD-Technik aufgebaut sind.
•\ Alternativ können auch in Digitaltechnik aufgebaute
Einzelfilter vorgesehen sein, ·
■ · ι ■ ■ · ·
- 4 _ VPA
82 P H O 3 DE
• die mit einem zeitdiskreten Digital-Anregungssignal beaufschlagbar sind, was den Vorteil, mit -sich bringt, die. Parameterwerte der Sprachsignale in besonders einfacher Weise abspeichern zu können.
In weiterer Ausgestaltung der Erfindung können die Einzelfilter zur Darstellung von Sprachelementen filterindividuell adressiert werden. Eine Schaltungsanordnung gemäß der Erfindung kann eine solche Anzahl.
von Einzelfiltern enthalten, daß alle Phoneme einer bestimmten Sprache darstellbar sind. Mehrere Phoneme können in bestimmter zeitlicher Reihenfolge erzeugt und entsprechend der' Charakteristik der menschlichen Stimme miteinander verbunden werden.'
• In weiterer Ausgestaltung der Erfindung können die Einzelfilter in Filtersätzen zur Darstellung längerer Sprachsegmente zusammengeschaltet s_ein, wobei eine v/ahlfreie Ansteuerung der Filtersätze durch filtersatzindividuelle Adressierung erfolgt. Eine solche Alternative zeichnet sich durch geringeren Speieheraufwand aus und ist besonders für die Darstellung von Sprache geeignet, in der gleiche Sprachsegmente v/iederholt auftreten. Die Einzelfilter können "auch in einer Matrix angeordnet sein, in der jeweils die Einzelfilter einer Matrixzeile parallel mit dem jeweiligen Anregungssignal beaufschlagt werden, und die Einzelfilterausgänge jeweils einer Matrixzeile sequentiell mit dem. Matrixausgang verbindbar sind.
In weiterer Ausgestaltung der Erfindung können die Einzelfilter als Linearprädiktions- bzw. als Formantfilter ausgebildet sein. Die Formantfilter v/eisen feste Formantmittenfrequenzen und -bandbreiten auf. Die Darstellung von Sprachelementen erfolgt dabei durch die Wiedergabe mindestens der drei tiefsten Formanten.
- 5 - VPA 82 P H O 3 DE
Die Einzelfilter können in einer v/eiteren Ausgestaltung der Erfindung in sogenannter CCD-Technik realisiert sein. Auch können sie. als Transversalfilter ausgebildet sein..
Die Erfindung wird nun in einem zum Verständnis erforderlichen Umfang anhand von Zeichnungen näher beschrieben. Dabei zeigt .
FIG 1 ein Blockschaltbild einer Schaltungsanordnung zur Sprachsynthese.
FIG 2 zeigt das Blockschaltbild eines Ausführungsbeispiels der Erfindung mit in Matrixform angeordneten Einzelfiltern·. FIG 3 und FIG 4 zeigen die Verwendung von Linearprädiktions- bzw. Formantfiltern.
FIG 1 zeigt ein Blockschaltbild einer Schaltungsanordnung gemäß der Erfindung, die im Kern eine Filterschaltung F, eine Anregungsgeneratoreinrichtung G und eine Steuereinheit StE umfaßt, die ihrerseits mit einer Eingabeeinheit EG bzw. mit einem Tiefpaß TP und einem elektroakustisehen Wandler in Verbindung stehen. '·
Die Eingabeeinheit EG möge Informationen über zu synthetisierende Sprachelemente an die Steuereinheit StE abgeben. Diese Informationen können beispielsweise über ein " Tastenfeld eingegeben werden. Ebenso können Informationen über zu synthetisierende Sprachelemente aber auch aus systemexternen Einrichtungen in systemkonformer Darstellung zugeführt werden. Die Steuereinheit StE möge Einrichtungen zur Zwischenspeicherung und Abarbeitung dieser Informationen z.B. im sogenannten "handshake-3etrieb" mit der Filterschaltung F sowie Speicher umfassen, in denen Sprechparameter abgespeichert sind. Vie in FIG 1* angedeutet ist, können von der Steuereinheit StE zu der Filterschaltung F beispielsweise zwei Leitungsverbindungen führen, nämlich eine für ein Filterwechseltaktsignal Tw und eine für ein digitales Sprachelementauswahlsignal SEA, wobei das Filterwechseltaktsignal
32Ί8755
_ 6 _ VPA 82 P H O 3 DE
in der Filterschaltung F die Synthese desjenigen Sprachelements steuert, das durch das Sprachelementauswahlsignal SEA bestimmt wird. Die Filterschaltung F, die beispielsweise in der aus FIG 2 dargestellten ¥eise ausge-
bildet sein kann, enthält unter anderem Einzelfilter
(F11... in FIG 2)mit festen Koeffizienten. Mit Hilfe
dieser Einzelfilter wird die Sprachsynthese durchgeführt, wobei die Einzelfilter einem Ausgang SA der
Filterschaltung F ein (elektrisches) Sprachsignal liefern,
das gegebenenfalls nach Digital/Analog-Wandlung über ein | Tiefpaßfilter TP und gegebenenfalls über einen nach- $■ folgenden Verstärker einem elektroakustischen Wandler | zugeführt wird. Wie in FIG 1 weiter angedeutet ist, kann | die Filterschaltung F der Steuereinheit StE über eine
Steuerleitung E ein Digitalsignal zuführen, das das
Ende des Synthesevorgangs eines Sprachelements anzeigt
und im bereits erwähnten handshake-Betrieb die erforderfür ! liehen Informationen üen SyntheseVorgang des durch die |
eingegebene Information bestimmten nachfolgenden Sprachen
* elements anfordert.
FIG 2 zeigt schaltungstechnische Einzelheiten eines Ausführungsbeispiels der Filterschaltung F, der Anregungsgenerator| einrichtung G sowie der Steuereinheit StE.
· ■ .. ■
Dabei geht die Darstellung in FIG 2 von einer Anordnung |
der 2S?%xner f-fatrix aus. Die Filter schaltung F umfaßt f
dabei neben den in- Spalten F11, F21,.. .Fn 1;... und |
Zeilen F11, F12,.. .F1Z;.... angeordneten Einzelfiltern, |j
zeilenindividuelle Multiplexer M1, M2,...Mn einen |
Zeilenauswahlmultiplexer ZMF, eine Auswahlschaltung ZME $
sowie gegebenenfalls eine in FIG 2 nicht näher darge- k
stellte, zwischen Anregungsgenerator einrichtung G und f\
den Einzelfiltern eingefügten Zeitfensterschaltung. &
_ .7 - VPA 82 P H O 3 DE
Die Anregungsgeneratoreinrichtung G besteht gemäß FIG 2 aus de einem steuerbaren Impuls- und Rauschgenerator IG bzw. RG -sowie einer Schaltvorrichtung. Die Steuereinheit StE umfaßt unter anderem Speicher S1.'..Sn, in denen 5 Sprachparameterwerte abgespeichert sind, einen Filterwechseltaktgenerator FwG, sowie eine. Speicherauswahl- . . schaltung ZMA. Die Filterschaltung F erhält von der Steuereinheit StE einen Filterwechsel-Taktpuls Tw und ein Sprachelementauswahlsignal SEA. Der in der Steuer-10 einheit StE angeordnete Filterwechseltaktgenerator FwG erzeugt äquidistante Filterwechseltaktimpulse mit einer Impulsperiode Tw, die beispielsweise zwischen 10 und 25 ms betragen kann. Die Filterwechseltaktimpulse werden allen in der FiIterschaltung F befindlichen zeilenindividuellen 15 Multiplexern ΙΊ1... und den, in der Steuereinheit StE angeordneten Speichern S1...gleichzeitig zugeführt.· Bei dem hier betrachteten Ausführungsbeispiel ist die Anzahl i der zeilenindividuellen Multiplexer M gleich der Anzahl ■
I der genannten Speicher S. Diese Zahl entspricht der . . :
I 20 Zeilenzahl der Filtermatrix. Wenn - wie oben unterstellt - I . durch die Filterschaltung F ηunterschiedliche Sprachseg-.
I Eiente. erzeugbar sind,so weist die Filterschaltung F.n I zeilenweise angeordnete FiItersatze auf. Jeder Filtersatz I umfaßt mindestens ein Einzelfilter. Das im Filtersatz if 25 erzeugte Sprachsegment kann aus mehreren Sprachele'menten
iff . ·
'I zusammengesetzt werden, die in den zu diesem Filtersatz \\ gehörenden Filtern erzeugt werden. Die Dauer -eines
p Sprachelementes beträgt t ; die Dauer eines aus m ;ji Sprachelementen zusammengesetzten Sprachsegments beträgt ; 30 dann m«tw. Die Anzahl der für die Erzeugung eines solchen ;:i Sprachsegments erforderlichen Einzelfilter kann kleiner ;' als m sein, wenn das betreffende Sprachsegment unterein- ':■; ander gleiche Sprachelemente enthält, die in gleichen
Einzelfiltern des betreffenden Filtersatzes synthetisiert 35 werden. Die (analogen) Sprachelementsignäle werden durch ·
- 8 - VPA 82 P H O 3 DE
den jeweiligen zeilenindividuellen Multiplexer M im . Filterwechseltakt Tv zum (analogen) Sprachsignal SA zusammengeschaltet. Die vom Filterwechseltaktgenerator F;7G erzeugte Impulsfolge mit der Frequenz 1/tw v/ird auch allen in der Steuereinheit StE befindlichen, zeilenindividuellen Speichern S zugeführt, in denen die Parameterwerte der Anregungssignale, z.B. deren Frequenz f \md Amplitude U abgespeichert sind. Durch die vom Filterwechseltaktgenerator FwG erzeugte Impulsfolge werden diese Parameterwerte aus den Speichern S abgerufen und der Speicherauswahlschaltung ZMA zugeführt. Diese wählt dann nach MaG--gäbe des ihr ebenfalls zugeführten Sprachelementauswahlsignals SEA die Parameterwerte des zu erzeugenden Sprachsegments aus und führt diese der steuerbaren Anregungsgeneratoreinrichtung G zu.' Die Anregungsgeneratoreinrichtung G umfaßt einen in Frequenz und Amplitude steuerbaren Impulsgenerator IG sowie einen in der Amplitude steuerbaren Rauschgenerator RG. Die in der Anregungsgeneratoreinrichtung G ausgangsseitig vorgesehene Schaltvorrichtung wird durch die aus den Speichern S abgerufene Information über die Frequenz gesteuert: Für Frequenzwerte gleich Null v/ird der Rauschgenerator RG an die Filterschaltung F' gekoppelt, für Frequenzwert ungleich Null wird der Impulsgenerator IG an die Filterschaltung F gekoppelt.
Die Anregungsgeneratoreinrichtung G liefert abhängig von · den Parameterwerten f und U Impuls- oder Rauschsignale bestimmter Amplitude und ggf. Frequenz. Stimmlose Sprachelemente werden durch Rauschsignale, stimmhafte Sprachelemente bestimmter Frequenz durch Impulsfolgen eben dieser Frequenz nachgebildet. Die.von der steuerbaren Anregungsgeneratoreinrichtung G erzeugten Anregungssignale werden bei dem hier beschriebenen Ausführungsbeispiel allen Filter Sätzen zugeführt, also auch denjenigen, die nicht der Erzeugung des ausgewählten Sprachsegments dienen. Alle in den FiItersatzen erzeugten
-9 - VPA 82 P H 03 DE
(Analog)signale werden über die zeilenindividuellen Multiplexer M dem Zeilenauswahlmultiplexer ZMF zugeführt, in dem mittels des Sprachelementauswahlsignals SGA das gewünschte Sprachsignal ausgewählt wird, das dann am Ausgang SA des Zeilenauswahlmultiplexers auftritt. Das Sprachsignal SA wird dem Tiefpaß TP zugeführt, der etwa auf Grund impulsartiger Anregung der Filter im Sprachsignal enthaltene höhere Frequenzbestandteile ausfiltert. Es sei Her bemerkt, daß die vorstehenden Erläuterungen nicht auf eine Sprachsignalsynthese mittels durch Analog-Anregungssignale beaufschlagte Analogfilter beschränkt sind, sondern in entsprechender Weise auch für eine Sprach signalancrdraung.ni.tt eis durch Digital-Ar.regungssignale beaufschlagte Digitalfilter gelten, wobei""dann das Filterausgangssignal noch einer, Digital-Analog-Umwandlung unterzogen wird. Nach einer gegebenenfalls noch erforderlichen Verstärkung wird schließlich das elektrische Analog-■ Sprachsignal, über einen elektroakustischen Wandler wiedergegeben.
Die zeilenindividuellen Multiple.-er Il geben gleichzeitig mit dem Durchschalten des letzten in dem betreffenden Filtersatz erzeugten Sprachelements ein Digitalsignal E an die Auswahlschaltung ZME ab, das den zeitlichen Abschluß des Spradhsynthesevorgangs in dem Filtersatz kennzeichnet. Die ebenso wie der Zeilenauswahlmultiplexer ZMF von dem momentanen Sprachelementauswahlsignal SEA i-n eine entsprechende Schaltstellung gebrachte Auswahlschaltung ZME schaltet nun das entsprechende Digitalsignal zu der Steuereinheit StE durch, die damit den Synthese-rargang des nächstfolgenden Sprachsegments auslösen kann.
Abweichend von der Darstellung in FIG 2 können die Einzelfilter mit festen Koeffizienten auch einzeln adressierbar sein. In diesem Fall v/eist die Filterschaltung (F in FIG 2)
3218755 \ 82 ρ η 03 DE
keinen Zeilenauswahlinultiplexer (ZMF in FIG 2) und keine '
Auswahlschaltung (ZME in FIC- 2) sowie keine zeilenindi-; <
viduellen Multiplexer (M in FIG 2) der oben beschriebenen ί
Art auf. Vielmehr verfügt die Steuereinheit (StE in FIG 2) Ά
dann über Einrichtungen zur Speicherung individuell " ■ %
adressierbarer Parameterwerte für die Anregungssignale §
und zur Zusammenschaltung der in den Einzelfiltern erzeug- ||
baren Sprachelementesignale. Der Filterwechseltaktgenera- %
tor FwG (in FIG 2) und die steuerbare Anregungs- \
Generator einrichtung G (in FIG 2) (ggf. mit Zeitfenster- · . \
schaltung) erfüllen auch bei dieser Ausführungsfora die ■ |
oben beschriebenen Funktionen. Eine solche durch wahlfreie »1
Ansteuerung von Einzelfiltern mittels einzelfilterindi- ' i!;
vidueller Adressierung gekennzeichnete Ausfuhrungsform 1A
braucht nur unterschiedliche Einzelfilter. . aufzuweisen. i!
* h
während bei dem Ausführungsbeispiel gemäß FIG 2 auch ■ i|
untereinander gleiche Einzelfilter in den verschiedenen . ■ ί
Filtersätzen, ggf. auch in ein- und demselben Filter- |
satz angeordnet sein können. Die letzteren Alterna- |j
tiven, die sich wegen der filtersatzindividuellen J
Adressierung gegenüber der einzelfilterindividu- |
eilen Adressierung mit geringerem steuertechnisc>>»n |
Aufwand realisieren lassen, sind besonders für die "Wieder-- ' |
gäbe von Sprache geeignet, die wiederholt gleiche Sprach- |
* 25 segmente enthält. Praktisch bedeutsam werden AusfUhrungs- %
formen sein, die sowohl in Filtersätzen verbundene ... f
Einzelfilter als auch unabhängige"Einzelfilter enthalten. t
Auf diese Weise läßt sich die Zahl der verwendeten Einzel- |
filter und der notwendige steuertechnische Aufwand optimie- |
|
Die erfindungsgemäß verwendeten Einzelfilter können .
auch als Linearpräidiktionsfilter mit festen Koeffizienten i gemäß FIG 3 ausgebildet sein. Lineare Prädiktion als
35. solche ist bekannt und in der einschlägigen Fachliteratur
(so beispielsweise FLANAGAN, Speech" Analysis Synthesis . '
. and Perception, Springer-Verlag Berlin, Heidelberg,
-11-- VPA 82 P H 03 DE
New York 1972, S. 367 ff., S.390 ff.) beschrieben, so daß sich hier eine nähere Darstellung erübrigt. Dabei ist die erreichbare Sprachqualität in bestimmten Grenzen proportional zur Zahl der Koeffizienten.. Gute
5 Sprachqualität läßt sich bereits mit etwa 10 Filterkoeffizienten realisieren. Ein solches Prädiktionsfilter wird mit seinen.in FIG 3 mit A11 und B11 bezeichneten Anschlußklemmen an die entsprechend bezeichneten Anschlußklemmen der Filterschal'tung F gemäß FIG 2 angeschlossen,
10 um dort das Einzelfilter F11 zu bilden. Die erfindungsgemäß verwendeten Linearpräidiktionsfilter können als Analog- oder als Digitalfilter ausgebildet sein. Dementsprechend werden den Filtern Anregungssignale in analoger oder digitaler Form vom Anregungsgenerator zugeführt;
15 entsprechend ergeben sichan den FiIterausgangen analoge oder digitale Signale.
I Die erfindungsgeraäß verwendeten Einzelfilter können, wie
I in FIG 4 dargestellt, auch als Formantfilter mit festen
[ι 20 Filterkoeffizienten ausgebildet sein, wobei jedem Einzel-
i filter eine Parallelschaltung von drei Formantfiltern zur
I Nachbildung mindestens der ersten drei (niederfrequenten)
tjj Sprachformanten entsprechen kann. Die Spracherzeugung
;; durch Formant synthese ist bekannt und hinreichend be-
I 25 schrieben (so beispielsweise in der bereits zitierten
Ü Literatur FLAN/GAN S.339 ff.), so daß sich eine. Dar-
$ stellung an dieser Stelle wiederum erübrigt. Die Formant-
I filter sind zweckma,ßigerweise als Bandpässe mit bestimmten festen Durchlaßbereichen und Mittenfrequenzen
,j. 30 dieser Durchlaßbereiche ausgebildet. Auch eine solche
I FiIterschaltung kann in Analog- und Digitaltechnik
te realisiert sein.
$ Die Einzelfilter können in allen vorstehend genannten
w ■
i . 35 Fällen in sogenannter CCD-Technik realisiert sein.
- 12 - VPA 82 P H 03DE
Bei Verwendung von Transversalfilter^ "beziehungsweise
Rekursivfiltern wird das Anregung.·=!signal den Einzelfiltern
in zeitdiskreter Form zugeführt. Hierzu kann die
FiIterschaltung (F in FIG 2) eine in FIG 2 nicht näher
α dargestellte Zeitfensterschaltung enthalten. Die Zeit-
fensterschalung kann entsprechend dem Abtasttheorem j£j
\\ ein Abtastsignal fester Frequenz erzeugen, die mindestens f;
die doppelte Frequenz bezogen auf das abzutastende Netz- |!
signal aufweist. Mit diesem so erzeugten Abtastsignal ρ
werden die steuerbare Anregungsgeneratoreinrichtung G i*j
sowie sämtliche Einzelfilter in die FiIt er schaltung F ;|
getaktet. If

Claims (11)

  1. ···· f t * t
    - 13 - VPA 82 P H 03 DE
    Patentansprüche
    M.j Schaltungsanordnung zur elektronischen Sprachsynthese, wobei Sprachelemente durch signifikante Parameter dargestellt werden und einzelne Sprachelemente zu längeren Sprachsegmenten zusammengesetzt werden können, wobei ein Anregungssignal zur Darstellung stimmhafter bzw. stimmloser Laute durch einen Ton- bzw. Rauschgenerator unter Verwendung mindestens eines Teils der signifikanten Parameter erzeugt unl einer Filterschaltung zugeführt wird und wobei die filterausgangsseitigen elektrischen Signale zur akustischen Wiedergabe der gewünschten Sprachelemente und -Segmente aufbereitet werden, dadurch gekennzeichnet, daß die Filterschaltung aus Einzelfiltern besteht, von denen jeweils nur diejenigen Einzelfilter, deren Filterkoeffizienten die restlichen signifikanten Parameter der tatsächlich sequentiell gewünschten Sprachelemente darstellen, sequentiell angesteuert werden.
  2. 2. Schaltungsanordnung nach Anspruch 1, dadurch gekenn- ■ zeichnet, daß in Analogtechnik aufgebaute Einzelfilter vorgesehen sind, die mit einem zeitdiskreten Analog-Anregungssignal beaufschlagbar sind.
  3. 3. Schaltungsanordnung nach Anspruch .1, dadurch gekennzeichnet, daß in Digitaltechnik aufgebaute Einzelfilter vorgesehen sind, die mit einem zeitdiskreten Digital-Anregungssignal beaufschlagbar sind und daß daa gewonnene Sprachsignal zur sprachlichen Wiedergabe digital/analoggewandelt wird.
  4. 4. Schaltungsanordnung nach Anspruch 2 oder 3, gekennzeichnet durch wahlfreie Ansteuerung der Einzelfilter durch einzelfilterindividuelle Adressierung.
  5. 5. Schaltungsanordnung nach Anspruch 2 oder 3, dadurch gekennzeichnet, daß die Einzelfilter in Filtersätzen zur Darstellung längerer Sprachsegmente angeordnet sind,
    I ti Il · » · B
    Il I t If
    I » Il I · t t
    f · · ·
    B · · ·
    I · · ·
    82 P 1 J I M8755
    ! ι ' ι * * i ·' * I · · - 14 - VPA h 0 3DE
    wobei eine wahlfreie Ansteuerung der Filtersätze durch filtersatzindividuelle Adressierung erfolgt.
  6. 6. Schaltungsanordnung nach Anspruch 5, dadurch gekennzeichnet, daß die Einzelfilter in einer Matrix angeordnet sind, in der jeweils die Einzelfilter einer Mätrixzeile parallel mit dem jeweiligen Anregungssignal beaufschlagt werden und die Einzelfilterausgänge jeweils einer Matrixzeile sequentiell mit dem Matrixausgang verbindbar sind.
  7. 7. Schaltungsanordnung nach Anspruch 5 oder 6, dadurch gekennzeichnet, daß pro Filtersalz eine Speichereinheit vorgesehen ist, in der Parameter des Anregungssignals zur Darstellung eines Sprachsegments abgespeichert sind.
  8. 8. Schaltungsanordnung nach einem der Ansprüche 4 bis 7, dadurch gekennzeichnet, daß die Einzelfilter als sogenannte Linear-Predictive-Filter ausgebildet sind.
  9. 9. Schaltungsanordnung nach einem der Ansprüche 4 bis 7» dadurch gekennzeichnet, daß die Einzelfilter als Formantfilter mit festen Formantmittenfrequenz- und -bandbreitenkoeffizienten zur Erzeugung von Sprache durch die Wiedergabe mindestens der drei tiefsten Formanten ausgebildet sind.
  10. 10. Schaltungsanordnung nach einem der Ansprüche 4 bis 9, dadurch gekennzeichnet, daß die Einzelfilter in sogenannter CCD-Technik realisiert sind.
  11. 11. Schaltungsanordnung nach einem der Ansprüche 4 bis 10, dadurchgekennzeichnet, daß die Einzelfilter als Transversalfilter ausgebildet sind.
DE3218755A 1982-05-18 1982-05-18 Schaltungsanordnung zur elektronischen sprachsynthese Withdrawn DE3218755A1 (de)

Priority Applications (6)

Application Number Priority Date Filing Date Title
DE3218755A DE3218755A1 (de) 1982-05-18 1982-05-18 Schaltungsanordnung zur elektronischen sprachsynthese
US06/491,581 US4694496A (en) 1982-05-18 1983-05-04 Circuit for electronic speech synthesis
JP58081841A JPS58205200A (ja) 1982-05-18 1983-05-12 電子音声合成回路装置
EP83104873A EP0094681B1 (de) 1982-05-18 1983-05-17 Schaltungsanordnung zur elektronischen Sprachsynthese
DE8383104873T DE3370707D1 (en) 1982-05-18 1983-05-17 Arrangement for electronic speech synthesis
AT83104873T ATE26354T1 (de) 1982-05-18 1983-05-17 Schaltungsanordnung zur elektronischen sprachsynthese.

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE3218755A DE3218755A1 (de) 1982-05-18 1982-05-18 Schaltungsanordnung zur elektronischen sprachsynthese

Publications (1)

Publication Number Publication Date
DE3218755A1 true DE3218755A1 (de) 1983-11-24

Family

ID=6163962

Family Applications (2)

Application Number Title Priority Date Filing Date
DE3218755A Withdrawn DE3218755A1 (de) 1982-05-18 1982-05-18 Schaltungsanordnung zur elektronischen sprachsynthese
DE8383104873T Expired DE3370707D1 (en) 1982-05-18 1983-05-17 Arrangement for electronic speech synthesis

Family Applications After (1)

Application Number Title Priority Date Filing Date
DE8383104873T Expired DE3370707D1 (en) 1982-05-18 1983-05-17 Arrangement for electronic speech synthesis

Country Status (5)

Country Link
US (1) US4694496A (de)
EP (1) EP0094681B1 (de)
JP (1) JPS58205200A (de)
AT (1) ATE26354T1 (de)
DE (2) DE3218755A1 (de)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19860133A1 (de) * 1998-12-17 2001-07-12 Cortologic Ag Verfahren und Vorrichtung zur Sprachkompression

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3888777T2 (de) * 1987-10-06 1994-07-14 Toshiba Kawasaki Kk Verfahren und Einrichtung zur Spracherkennung.

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US2060321A (en) * 1936-02-18 1936-11-10 Jr Elmer E Johnson Safety razor
US2121142A (en) * 1937-04-07 1938-06-21 Bell Telephone Labor Inc System for the artificial production of vocal or other sounds
US2194298A (en) * 1937-12-23 1940-03-19 Bell Telephone Labor Inc System for the artificial production of vocal or other sounds
US2881257A (en) * 1956-08-16 1959-04-07 Bell Telephone Labor Inc Spectrum synthesizer
US3624301A (en) * 1970-04-15 1971-11-30 Magnavox Co Speech synthesizer utilizing stored phonemes
US3836717A (en) * 1971-03-01 1974-09-17 Scitronix Corp Speech synthesizer responsive to a digital command input
NL7306902A (de) * 1972-05-26 1973-11-28
NL7902238A (nl) * 1978-04-27 1979-10-30 Kawai Musical Instr Mfg Co Inrichting voor het opwekken van een vocaal geluids- signaal in een elektronisch muziekinstrument.
JPS56140400A (en) * 1980-04-03 1981-11-02 Tokyo Shibaura Electric Co Signal synthesizing circuit
US4454609A (en) * 1981-10-05 1984-06-12 Signatron, Inc. Speech intelligibility enhancement
US4475228A (en) * 1981-11-27 1984-10-02 Bally Manufacturing Corporation Programmable sound circuit for electronic games

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19860133A1 (de) * 1998-12-17 2001-07-12 Cortologic Ag Verfahren und Vorrichtung zur Sprachkompression
DE19860133C2 (de) * 1998-12-17 2001-11-22 Cortologic Ag Verfahren und Vorrichtung zur Sprachkompression

Also Published As

Publication number Publication date
JPS58205200A (ja) 1983-11-30
ATE26354T1 (de) 1987-04-15
US4694496A (en) 1987-09-15
EP0094681B1 (de) 1987-04-01
EP0094681A1 (de) 1983-11-23
DE3370707D1 (en) 1987-05-07

Similar Documents

Publication Publication Date Title
DE3041423C1 (de) Verfahren und Vorrichtung zur Verarbeitung eines Sprachsignals
DE2934489C2 (de)
DE69816221T2 (de) Sprachschnellheitsveränderungsverfahren und vorrichtung
DE2945414C2 (de) Sprachsignal-Voraussageprozessor und Verfahren zur Verarbeitung eines Sprachleistungssignals
EP0069398B1 (de) Verfahren zur Prüfung von Analog-Digital-Wandlern und/oder von Digital-Analog-Wandlern oder von nachrichtentechnischen Übertragungsabschnitten, die solche Wandler enthalten oder mit ihnen in Reihe geschaltet sind, insbesondere zur Prüfung von Codecs für PCM-Geräte, sowie Vorrichtung zur Durchführung des Verfahrens
DE2115258A1 (de) Sprachsynthese durch Verkettung von in Formant Form codierten Wortern
DE2229149A1 (de) Verfahren zur Übertragung von Sprache
DE2524497B2 (de) Verfahren und Schaltungsanordnung zur Sprachsynthese
DE2920298A1 (de) Binaere interpolatorschaltung fuer ein elektronisches musikinstrument
DE9006717U1 (de) Anrufbeantworter für die digitale Aufzeichnung und Wiedergabe von Sprachsignalen
DE2622423B2 (de) Elektrische Anordnung zur Übertragung oder Speicherung eines Sprachoder Tonsignals in kodierter Form
DE3019823C2 (de)
DE3006339C2 (de) Sprachsyntesizer
DE2906519C2 (de) Verfahren zur Analog-Digitalwandlung
DE69233622T2 (de) Vorrichtung zur Erzeugung von Ansagen
DE3246712C2 (de)
EP0094681B1 (de) Schaltungsanordnung zur elektronischen Sprachsynthese
DE3101590C2 (de) Anordnung zum Erzeugen eines Sprachsignals
DE2649540A1 (de) Verfahren und anordnung zur sprachsynthese
DE3037276C2 (de) Tonsynthesizer
DE2826570C2 (de)
DE2051589A1 (de) Anordnung zur Synthese eines Signals
DE2657430A1 (de) Einrichtung zum synthetisieren der menschlichen sprache
DE3232835C2 (de)
DE4426534C2 (de) Verfahren zur Steuerung der Signalaufzeichnung für einen digitalen Anfrufbeantworter

Legal Events

Date Code Title Description
8130 Withdrawal