DE3049393A1 - Sprachsynthesizer - Google Patents
SprachsynthesizerInfo
- Publication number
- DE3049393A1 DE3049393A1 DE19803049393 DE3049393A DE3049393A1 DE 3049393 A1 DE3049393 A1 DE 3049393A1 DE 19803049393 DE19803049393 DE 19803049393 DE 3049393 A DE3049393 A DE 3049393A DE 3049393 A1 DE3049393 A1 DE 3049393A1
- Authority
- DE
- Germany
- Prior art keywords
- memory
- data
- speech
- speech synthesizer
- müller
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Ceased
Links
- 230000015654 memory Effects 0.000 claims description 59
- 230000015572 biosynthetic process Effects 0.000 claims description 10
- 238000003786 synthesis reaction Methods 0.000 claims description 10
- 239000004065 semiconductor Substances 0.000 claims description 8
- 238000000034 method Methods 0.000 claims description 5
- 230000008569 process Effects 0.000 claims description 5
- 239000012634 fragment Substances 0.000 claims description 4
- 230000004048 modification Effects 0.000 claims 1
- 238000012986 modification Methods 0.000 claims 1
- 239000000872 buffer Substances 0.000 description 15
- 238000012545 processing Methods 0.000 description 7
- 238000005070 sampling Methods 0.000 description 6
- 238000011161 development Methods 0.000 description 4
- 230000018109 developmental process Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 239000013078 crystal Substances 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 230000000712 assembly Effects 0.000 description 1
- 238000000429 assembly Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 230000036962 time dependent Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
- G10L13/04—Details of speech synthesis systems, e.g. synthesiser structure or memory management
- G10L13/047—Architecture of speech synthesisers
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Electrophonic Musical Instruments (AREA)
- Mobile Radio Communication Systems (AREA)
Description
TER MEER · MÜLLER · STEINMEISTER '...'.. "..' "S.harp 1542-GER-K
BESCHREIBUNG
Die Erfindung liegt auf dem Gebiet der Sprach-Synthesizer
und bezieht sich insbesondere auf eine Halbleitereinrichtung zur Erzeugung von Information in Form synthetischer
Sprache.
Frühere und heutige Entwicklungsbemühungen auf dem Gebiet
der synthetischen Spracherzeugung unterscheiden sich deutlich voneinander: Während es früher um die geeignetste
Hardware für die synthetische Erzeugung menschlicher Sprache ging, steht heute die Entwicklung von für
die Sprachsynthese geeigneten neuartigen Programmen als Software für die Steuerung von Sprach-Synthesizern im
Vordergrund.
In den letzten Jahren erfolgte die Erzeugung synthetischer Sprache hauptsächlich nach einem Hardware-Konzept mit
sog. "Harten Blöcken A, B und CÜ Der Block A enthält
einen Speicher zur Speicherung einer Anzahl von Folgen der Synthese sowie einen Befehlsdekodierer. Der Block B
enthält eine Gruppe von Adreßregistern, eine Gruppe von Zählern zum Zählen der Anzahl von Daten wie der Grundzählwerte
stimmhafter und stimmloser Laute und Register zur zeitweiligen Speicherung von Phonem- und Amplitudendaten.
Der Block C enthält Vervielfacher zur Durchführung von Multiplikationen an den Phonemdaten und den
Amplitudendaten. Wenn die Sprachsynthese unter Verwendung
einer derartigen zeitbezogenen Hardware-Grundstruktur erfolgt, sollte die Gruppe der Zähler verschiedene Arten von
logisch geschalteten Flip-Flops wie z.B. solche mit zusätzlichen Inkrement- und Dekrementfunktionen enthalten. Eine
Zufalls-Logik, die Random-Knüpfungen
1300 38/0970
TER MEER · MÜLLER · STEINMEISTER * ** Sharp 1542-GEr-K
zwischen logischen Bausteinen wie Toren, Flip-Flops und Zählern enthält, hat den Nachteil, daß die Fläche
für diese Bausteine begrenzt, aber der Raumbedarf für
die Verschaltung relativ groß ist, so daß alle diese Elemente kaum auf einem wirtschaftlich vertretbaren
Platzangebot untergebracht werden können, auf keinen Fall innerhalb eines einzigen LSI-Halbleiterchip. Eine
Vergrößerung der Chipabmessungen würde außerdem zu einer exponentiellen Kostenerhöhung führen.
Versuche der Erfinder dieses Problem zu lösen führten zu der Erkenntnis, daß der erwähnte Block A in
dem herkömmlichen Sprach-Synthesizer durch einen Festspeicher oder ROM (Read Only Memory) und der Block
B, dem die Funktionen des Adressierens, Zählens und' zeitlichen Speicherns der Phonemdaten zufallen, durch
einen Lese- und Schreibspeicher (RAM) ersetzt werden könnten. Ferner haben sie herausgefunden, daß die Vervielfacher
in dem Block C ersetzbar sind, wenn die Multiplikationsergebnisse in einen Teil eines Lautdatenspeichers
ROM als Speichertabelle eingegeben werden. Diese Erkenntnis bringt als Vorteile eine höhere
Flächeneffektivität der Bauteile, höhere Integrationsdichte und eine höhere Elementenanzahl pro Flächeneinheit
mit sich.
Da die Datenverarbeitungsgeschwindigkeit bei der Sprachsynthese von der Abtastfrequenz abhängig ist, ergibt sich,
wenn eine Real-Time-Verarbeitung angestrebt wird, das Problem, wie die Verarbeitung der Abtastdaten innerhalb
eines Abtastintervalls zu schaffen ist, z.B. innerhalb von 125 oder 62,5 με bei einer Abtastfrequenz von 8 bzw.
16 kHz. Die innerhalb von 62,5 us zu bewältigende Daten-
130038/0970
TER MEER -MÜLLER ■ STEIMMEISTt-It"
Shäf-p 1542-GER-K
länge beträgt nicht weniger als 8 Schritte, in deren.
Verlauf eine Folge von Verarbeitungsoperationen an den Abtastdaten zu erfolgen hat. Die Erfinder suchten ein
neues Verfahren, mit dem sie die Verarbeitungsgeschwindigkeit auch bei niedriger Operations-(Abtast-) Frequenz
wesentlich erhöhen konnten, und sie fanden eine sehr wirkungsvolle Lösung in der Determination der Wortlänge
eines als Block B funktionierenden ROM, oder mit anderen Worten: Durch Wahl einer beträchtlich längeren
Wortlänge beim ROM gegenüber derjenigen beim Daten-ROM (z.B. 18 Bits Länge gegenüber 8 Bits, 4 K-Bytes beim
letzteren) kann die Verarbeitungsgeschwindigkeit wesentlich angehoben werden. Innerhalb einer Wortlänge von 18
Bits können etwa 500 Operationsschritte durchgeführt
werden. Von den 18 Bits der Ein-Wortlänge des ROM sind
5 Anweisungs-Bits, 5 RAM-Adreß-Bits und die restlichen 8 Bits Operanden- und Nächstadressen-Bits. Diese Anordnung
ermöglicht die gleichzeitige Durchführung mehrerer Operationen und erlaubt einen Hochgeschwindigkeitszugriff
in Abhängigkeit vom Ausgang des Steuer-ROM. Grundsätzlich sollten zum Zwecke einer Erhöhung der Verarbeitungsgeschwindigkeit
eines LSI-Chip der EIN-Widerstand seiner Elemente so niedrig wie möglich und die Versorgungsspannungen
zur Beschleunigung der Ladungsverschiebung möglichst hoch sein.
Da die Erfüllung dieser Forderungen unvermeidbar zu stark
erweiterten Chip-Abmessungen und einer bedeutenden Verschlechterung der Ausbeute führen muß, liegt der Erfindung
die Aufgabe zugrunde, einen neuartigen Sprach-Synthesizer zu finden, der bei geringem Platzbedarf zu guten Ergebnisse
führt.
130038/0970
TER meer ■ möller . STEJMMEISTER
** 'Sharp 1542-GER-K
Die erfindungsgemäße Lösung der gestellten Aufgabe ist kurzgefaßt im Patentanspruch 1 angegeben.
Vorteilhafte Weiterbildungen des Erfindungsgedankens
sind in Unteransprüchen enthalten.
Die wesentlichen Elemente des erfindungsgemäßen Sprach-Synthesizers
können ohne Schwierigkeit als monolithische Halbleiterschaltung ausgebildet bzw, in einem einzigen
LSI-Halbleiterchip untergebracht werden. Die erfindungsgemäße
Anordnung zeichnet sich dadurch aus, daß sie sämtliche für die Verarbeitung von zu erfassenden Daten
erforderliche Schritte mittels eines sehr leistungsfähigen Speicherkonzepts mit einer wesentlich erhöhten Verarbeitungsgeschwindigkeit
durchführen kann, weil darin ein Steuerspeicher (Steuer-ROM) mit einer größeren Einzelwortlänge
arbeitet als ein Datenspeicher (Daten-ROM).
Zur hörbaren Wiedergabe synthetischer Sprache genüg.t es, die erfindungsgemäße LSI-Chip-Halbleiteranordnung einfach
mit einem externen Verstärker zu verbinden. Ein sonst bei Impulsbreitenmodulation erforderlicher Digital/Analogwandler
ist überflüssig.
Als Weiterbildung des Erfindungsgedankens kann der Datenspeicher (Daten-ROM), wenn eine große Anzahl von Worten
zu verarbeiten ist, durch Anschluß eines externen Speichers erweitert werden. Es können dann z.B. allgemein gebräuchliehe
Wörter im Datenspeicher und SpezialWörter für" den jeweiligen Verwendungszweck des Gerätes in dem extern angeschlossenen
Erweiterungsspeicher gespeichert sein. Ein Steuerspeicher steht so wie er ist auch dem Erweiterungsspeicher zur Verfügung.
130038/0970
TER MEER · MÜLLER · STEINMEISTER
.. Sharp 1542-GER-K
Der erfindungsgemäß in seinen wesentlichen Elementen zu einem einzigen LSI-Chip zusammengefaßte Sprach-Synthesizer
gibt unter bestimmten Bedingungen hörbare Laute ab, welche zuvor in ihm gespeicherten Worten
entsprechen. Unter der Kontrolle eines Mikroprozessors
ist er ferner in der Lage, z.B. die Ergebnisse von Berechnungen oder Zeitmessungen akustisch wiederzugeben.
10
Nachstehend wird ein die Merkmale der Erfindung aufweisendes Ausführungsbeispiel unter Bezugnahme auf
eine Zeichnung näher erläutert. Es zeigen:
20
Fig. 1 ein Blockschaltbild zur Erläuterung des Prinzips eines erfindungsgemäßen
Sprach-Synthesizers,
Fig. 2 und 3 schematische Blockschaltbilder zu einem Ausführungsbeispiel der Erfindung,
Fig. 4 ein Blockschaltbild mit den in einem
Chip untergebrachten Elementen zur Erzeugung synthetischer Sprache, und
Fig. 5 und 6 ein Blockschaltbild und eine zeitabhängige Signaldarstellung zu einem in
Fig. 4 enthaltenen Zähler.
25 30
Die in Fig. 1 schematisch dargestellte Sprachsynthesizer-Steuereinheit
VC ist in einem einzigen LSI-Halbleiter-Chip
enthalten, der mehrere äußere Anschlüsse hat. Über Anschlüsse X. und XQ ist ein eingebauter Taktgenerator
von VC zwecks Erregung mit einem Quarzoszillator oder Widerstand verbunden. Port 1 dient zur Eingabe von Seriendaten
(z.B.8 Bit-Daten). Die Daten gehen an einen Anschluß
S1n und werden bei einer Datenlänge von 8 Bits achtmal ein-
130038/0970
TER MEER ■ MÜLLER · STEINMEISTER Sharp 1542-GER-K
gespeist. In den Nachbaranschluß 0Q gehen Datentaktimpulse,
damit die Bit-Daten mit vorgesehener Zeitabstimmung eingeführt werden.
Port 2 ist ein Mehrzweckeingang für 8 Bit-Daten oder Steuersignale aus einem externen LSI (typisch CPU) ο.dgl.
Port 3 ist ein 8-Bit-Mehrzweckausgang für die Abgabe von 8-Bit-Daten und Steuersignalen an die externe LSI-Einrichtung
(CPU) ο.dgl. Ein mit einem anderen Bus BO. kombinierter Adreß-Bus AO. bildet einen 16-Bit-Bus für
Adreßdaten zu einem externen Erweiterungsspeicher.
Der 8-Bit-Datenbus EO1 dient in üblicher Weise als Eingang-
und Ausgangs-Datenverbindung mit Erweiterungsspeichern (ROM und RAM). Bekanntlich ist ein ROM ein Lese-Speicher
und ein RAM ein Lese- und Schreib-Speicher.
über einen Tonausgang DO. werden 6-Bit-Digitalausgänge
und 2-Bit-PWM-Impulsausgänge (PWM=Impulsbreitenmodulation)
abgegeben, d.h. die Sprachsynthesizer-Steuereinheit VC gibt digitale Toninformation mittels Impulsbreitenmodulation
aus, und die aus dem Ausgang DO. kommenden Ausgangssignale werden über Tiefpaßfilter in Analog-Toninformation
umgesetzt. Es gibt ferner einen Digital/Analogwandler D/A, einen Verstärker AMP und einen Lautsprecher
SP.Die erwähnten impulsbreitenmodulierten PWM-Ausgangssignale haben eine Zusatzlänge von 2 Bit, welche entgegengesetzt
gepolte Signale bilden, so daß die Polarität der Ausgangssignale ohne Phasenumkehr seitens eines externen
Tonverstärkers wählbar ist. Es sei bemerkt, daß der D/A-Wandler für die impulsbreitenmodulierten Ausgangssignale
nicht erforderlich ist.
130038/0970
TER MEER . MÜLLER · STEINMEISTER Sh'arp 1542-GER-K
Als Alternative wandelt der Digital/Analogwandler D/A die 6-Bit-Digitalsignale (ohne die 2-Bit-PWM-Signale)
in entsprechende Analogsignale als Tonausgänge um. Wenn, wie in diesem Fall, sowohl die Digitalsignale
als auch die impulsbreitenmodulierten Signale in der Steuereinheit verfügbar sind, können externe
Zusatzschaltungen, Teile und Tonqualität dem Verwendungszweck des Sprach-Synthesizers gemäß optimal ausgenutzt
werden.
Nachstehend wird das in Fig. 2 bis 4 dargestellte Ausführungsbeispiel
der Erfindung näher erläutert. Eine an sich bekannte Ein/Ausgabeeinheit I/O enthält eine Tastatur
und eine Anzeige wie eine Flüssigkristallanzeige. Beispielsweise geheen von CO. - CO. des Ausgangs CO. kommende
Taktsignale und Tasteneingangssignale über eine Matrix kombiniert zu einem Eingang Nn.. Die Anzeige wird durch
eine Signalkombination aus CO1 - CO. und CO^ - C0„ so
aktiviert, daß bei Betätigung einer bestimmten Taste eine oder mehrere Leuchteinheiten der Anzeige aufleuchten. Diese
Funktion ist bei relativ kleinen Geräten nützlich, wo lediglich
vorgewählte Wörter in synthetische Sprache umzusetzen sind.
In Fig. 3 ist der erfindungsgemäße Sprach-Synthesizer an
einen Mikroprozessor MPU angeschlossen, dessen Anschlüsse K1 - K4 mit der Tastatur KEY verbunden sind, dessen Ausgangsanschluß
0. die Taktsignale der Tastatur KEY und die Segmentansteuersignale an die Anzeige DISP und dessen
Ausgangsanschluß H. ein gemeinsames Signal an die Anzeige DISP abgibt. Die beschriebenen Baugruppen MPU, KEY und DISP
können einen elektronischen Rechner mit allen zugehörigen Funktionen bilden, welcher in Verbindung mit dem erfindungs
130038/0970
TER MEER · MÜLLER ■ STEINMEISTER
Sharp 1542-GER-K
gemäß ausgebildeten Sprach-Synthesizer die eingegebenen Tastensignale oder seine Rechenresultate in synthetischer
Sprache hörbar ausgibt.
über einen Anschluß R2 gibt der Mikroprozessor MPU eine
Aktivierspannung an die Sprachsynthesizer-Steuereinheit VC, den Digital/Analogwandler D/A und den Verstärker AMP
ab, und liefert dann Tondaten, die Über die Steuereinheit VC in Form synthetischer Sprache auszugeben sind. Wenn
beispielsweise die Anweisung "Multipliziere" (x) hörbar auszugeber, ist, liefert der Mikroprozessor MPU einen entsprechenden
Code an die Steuereinheit VC. Die Daten aus dem Anschluß R. des Mikroprozessors MPU gehen nacheinander
zum Eingang N_ „ von N der Steuereinheit VC, und
damit diese Datenübertragung in der richtigen zeitlichen Abstimmung erfolgt, geht ein Taktsignal BUSY von einem
Anschluß R3 des Mikroprozessors in einen Anschluß NTN4
der Steuereinheit VC, welche ihrerseits aus ihrem Ausgangsanschluß
COq ein Bestätigungssignal ACK in einen Anschluß des Mikroprozessors liefert. Durch den Austausch
der BUSY- und ACK-Signale läuft die Datenübertragung in bekannter Weise ab.
Mit Einschaltung der Sprachsynthesizer-Steuereinheit VC befindet sie sich im Bereitschaftszustand für CO« von Ausgang
CO. und zur Annahme des Mikroprozessorsignals BUSY an ihrem Eingangsanschluß Ν-Ν8 von N1n-, wo der Anstieg
auf den logischen Zustand "1" erfolgt. Wenn VC bei einem BUSY-Signal von "1" an NIN8 die Daten erhält, gehen COg
und das ACK-Signal in den logischen Zustand "0" über.
Dagegen reduziert VC boi Zugang des BUSY-Signals "O" den
Pegel des ACK-Signals auf "1" und zeigt damit seine Bereitschaft
zur Aufnahme der nächsten Daten an. Mit Zugang des
130038/0970
TER MEER - MÖLLER · STEINMEIS"! F-R' "" 'Sharp 1542-GER-K
ACK-Signals von "V erhöht der Mikroprozessor MPU den Pegel des BUSY-Signals auf "1" und liefert an
den VC-Anschluß NT.1Q die zweiten Bit-Daten. Unter
INo
wiederholter Durchführung der erläuterton Vorgänge werden nacheinander alle 8-Bit-Wortcodes in die Steuereinheit
VC übertragen, wo sie in einem gewünschten Abschnitt des RAM gespeichert werden, der Steuerspeicher
in Abhängigkeit von in dem Tondatenspeicher gespeicherten Informationen Anweisungen ausführt und auf
diese Weise gemäß Fig. 4 diese aufeinanderfolgenden Codes in synthetische Sprache umgesetzt werden.
Die gem. Fig. 4 in einem einzigen LSI-Halbleiterchip
zusammengefaßte Sprachsynthesizer-Steuereinheit VC umfaßt einen Steuerspeicher (Steuer-ROM), welcher eine
Serio von in Abhängigkeit verschiedener Steuersignale wie z.B. des BUSY-Signals abhängigen Anweisungen und
eine Serie von Anweisungen für ein I/O-Interface enthält,
einen Speicher für freien.Zugriff RAM 2, welcher
als zeitweiliger Speicher oder Zähler zum Speichern oder Zählen der extern eingegebenen Wortcodes und Adreßinformatlon
in Verbindung mit dem Tondatenspeicher für die Sprachsynthese verwendet wird, und einen Tondatenspoicher
(Daten-ROM), in welchem zuvor abgespeicherte synthetische Lautdaten (Phonem-Daten) für synthetische Sprache abgespeichert
sind. Je nach Art und Umfang der zuvor im Lautdatenspeicher abgespeicherten Wörter kann der Sprach-Synthesizer
für die verschiedensten Zwecke eingesetzt werden, und zur Erhöhung des Vokabulars kann die Länge
bzw. der Umfang des Lautdatenspeichers,erweitert werden.
Ein Programmzähler spezifiziert einen bestimmten Programmschritt des Steuerspeichers 1, und ein Register SP speichert
zeitweilig die Inhalte des Programmzählers P. Ein
130038/0970
• * m «
TER MEER · MÜLLER · STEINMEISTER Sharp 1542-GER-K
- 12 -
Befehlsdekodierer 4 dekodiert den Ausgang des Steuerspeichers 1, und eine Rechen- und Logik-Einheit ALU 5
führt Rechen- und logische Operationen an Signalen des Speichers 1, eines Akkumulators 6 und des RAM 2 durch.
Der Akkumulator 6 speichert zeitweilig die von den einzelnen Speichern, der Einheit 5 oder einer äußeren Quelle
kommenden Steuersignale und Daten und setzt oder rücksetzt als Ergebnis seiner Operationen ein Flag 7 (Cu. Z)
An die erwähnten Adreßbusse AO, und BO. sind zwei die Adreßdaten bezüglich des Lautdatenspeichers 3 für eine
Weile haltende Adreßpuffer 8 und 9 (PA,PB) angeschlossen.
Nach im Steuerspeicher 1 enthaltenen Aweisungen hält ein Ausgangspuffer 10 Signale eine Weile/ die über den Ausgang
CO. abzugeben sind, und ein Eingangspuffer 11 hält für
eine Weile Signale oder Daten, die über den Eingang N_Ni
ankommen. Extern zugeführte Steuersignale und Daten gehen in einen Eingangspuffer 12. Mit jedem über 0g zugeführten
Signal nimmt der Eingangspuffer 12 bei S zugeführte Daten auf und schiebt die Inhalte in einen Puffer S, und
zwar S-mal, um alle 8-Bit-Daten in den Puffer S zu bringen. Eine Zählergruppe 13 enthält Ausgangspuffer zum zeitweiligen
Halten von Lautdaten, einen setzbaren Zähler und PWM-(Impulsbreitenmodulation)Ausgangszähler,
die nachstehend in Verbindung mit Fig. 5 und 6 näher erläutert werden.
In einen Ausgangspuffer 130 gehende Lautdaten werden dem Ausgang DO. und einem vorsetzbaren Zähler 131 zugeführt,
von denen letzterer bei Aufnahme des Ausgangs eines Frequenz· teilers 15 abwärtszählt und bei Erreichen des Zählwertes
"Null" ein Ausgangssignal an einen PW-Puffer 133 (PW=Impulsbreitenmodulation) abgibt. Synchron mit einem 1 MHz-Signal
des Teilers 15 werden die in den Zähler 131 kommenden
Lautdaten erniedrigt. Bei Erkennung von "Null" liefert ein
130038/0970
TER MEER . MÜLLER · STEINMEISTER Sharp 1542-GER-K
Nulldetektor 132 dem PW-Ausgangspuffer 133 ein Ausgangssignal.
Die in Fig. 6 dargestellte Form der Impulsbreitenmodulation-Ausgänge werden trotz festgelegter
Abtastfrequenz (16kHz) in jedem Intervall bezüglich der Länge von "1" oder "0" moduliert. Diese
Signale werden einfach über ein Tiefpaßfilter gegeben und so in Analogsignale umgesetzt. Ein Bezugssignalgenerator
14 mit eingebautem Quarzoszillator liefert ein Bezugssignal als Taktsignal an die Zähler 13 und
die Verknüpfungsstelle zwischen den Teilern 15 und 16. Ferner liefert ein Systemtaktgenerator 17 Systemtaktimpulse
φ* und φ~· Ein 4-Bit-Speicher X speichert die
4-Bit-Inhalte des Adreßpuffers 8 (PA) des Lautdatenspeichers
3 auf halbfeste Weise, um in unten beschriebener Weise die Adressierung des Lautdatenspeichers zu
beschleunigen. Ein Daten-Bus DB1 dient als gemeinsamer Datenweg zwischen den einzelnen Puffern, RAM 2, ALU 5
und dem Lautdatenspeicher 3. Ein zweiter Daten-Bus DB_
dient der Datenübertragung zwischen dem Akkumulator 6, RAM 2 und ALU 5. Der mit DB. verbundene Anschluß EO.
dient der beiderseitigen Datenübertragung von und zum externen Speicher.
Beim betriebsmäßigen Ablauf wertet der Steuerspeicher (Steuer-ROM) Startadressen, zu denen die oben erwähnten
Wortcodes eine bestimmte Beziehung haben, nach den in den RAM 2 gespeisten Wortcodes aus und stellt den Adreßpuf
feritPA und PB eine entsprechende Adreßinformation zu.
Die durch diese Adreßpuffer PA, PB adressierten Inhalte des Lautdatenspeichers, d.h. die Wortstartadressen befinden
sich in einem gewünschten Abschnitt von RAM. Diese Startadresse ist die Anfangsadresse jeder beliebigen Sprach-
130038/0970
TER MEER . MÜLLER ■ STEINMEISTER " -Sharp 1542-GER-K
synthese-Folge, und diese Folge wir# erfaßt und in
ähnlicher Weise dem RAM zugeführt. Anschließend werden gemäß dieser erfaßten Synthese-Folge eine bestimmte
Anzahl von Fragmenten der Grundlautinformation kombiniert und so abgewandelt, daß als Ergebnis quantilisierte
Lautsignale wiedergegeben und mit der Abtastfrequenz
an einen Lautausgangspuffer 18 abgegeben werden
.
Wie erwähnt ist die Wortlänge (pro Schritt) des Steuer-Speichers 1 18 Bits läng und enthält 100 Operationsschritte,
während die Wortlänge des Lautdatenspeichers 3 8 Bits lang ist (pro Schritt) und einige 1000 Schritte (Byte) enthält.
Dieses besondere Kennzeichen (bezüglich der Bit-Länge und/ oder Schritte) ermöglicht die Sprachsynthese mit erhöhter
Geschwindigkeit.
Je größer die Bit-Länge in jedem der Schritte des Steuerspeichers 1 (Steuer-ROM) ist, um so mehr Prozesse können
in jedem der Schritte durchgeführt werden. Auf diese Weise können beliebig viele Operationen ohne Erhöhung der
Systemtaktfrequenz in einem gegebenen Zeitraum ausgeführt
werden. Beim Lautdatenspeicher 3 erübrigt sich eine Erhöhung der Bit-Länge bei jedem Schritt. Mit anderen Worten:
Die Bit-Länge jedes Schrittes ist ausreichend bemessen, um die oben erwähnten Startadressen, Sprachsynthese-Folgen und
Grundlautinformationen darin unterzubringen. Folglich kann der Lautdatenspeicher 3 die gleiche Bit-Länge wie der erweiterte
Allzweckspeicher haben. Daraus ergibt sich der Vorteil, daß die Adressierung und der Bezug der Daten aus
dem Lautdatenspeicher 3 und einem äußeren oder Hilfs-Lautdatenspeicher
in gleicher Weise erfolgen kann.
130 038/0970 ORIGINAL
TER MEER · MÜLLER ■ STEINMEISTER Srtrar^ "1 542-GER-K
Der äußere Zusatzspeicher muß nicht ein ROM sein, es kann auch ein mit extern zugeführten Lautdaten
gefüllter und durch eine Batterie gestützter RAM benutzt werden. Durch geeignete Auswahl zugesetzter
Lautdaten kann jede gewünschte Art synthetischer Sprache mit Erfolg wiedergegeben werden.
130038/0970
Claims (6)
1.) Spiiach-Synthesizer,
dadurch gekennzeichnet, daß
ein erster Speicher (1) zur Speicherung einer Anzahl von Informationsfragmenten für die Erzeugung synthetischer
Sprache und ein zweiter Speicher (3) zur Speicherung von Steuerbefehlen, die für die Erzeugung
synthetischer Sprache aus den in dem ersten Speicher enthaltenen Informationsfragmenten erforderlich sind,
in einem einzigen integrierten Halbleiterchip (VC) enthalten sind.
130038/0970
meer - Müller · Steinmeister ** .:..:.. "-«sharp 1542-GER-K
2. Sprach-Synthesizer nach Anspruch 1,
dadurch gekennzeichnet, daß der erste Speicher (1) einen äußeren Anschluß für eine Erweiterung
seiner Speicherkapazität hat.
3. Sprach-Synthesizer nach Anspruch 1,
dadurch gekennzeichnet, daß der erste Speicher (1) für eine längere Einzelwortlänge als der zweite
Speicher (3) eingerichtet ist.
4. Sprach-Synthesizer nach Anspruch 1,
dadurch gekennzeichnet, daß der erste Speicher ein adressierbarer Steuerspeicher (1) ist, in dem eine
Anzahl von aufeinanderfolgend wiederzugebenden Fragmenten von Lautinformation als feste Programmanweisungen
gespeichert sind.
5. Sprach-Synthesizer nach Anspruch 1 oder 4,
dadurch gekennzeichnet, daß der zweite Speicher ein adressierbarer Datenspeicher (3) ist, in dem auf festgelegte
Art Lautdaten wie Phoneminformationen (Laute) oder Lautgruppen-Informationen als Grundlage der
Sprachsynthese und ferner Befehlsdaten, die für Abwandlungsoperationen wie Abläufe in bezug auf Datenauswahl,
auf gewählte Zeitabstände und/oder eine Anzahl von Wiederholungen erforderlich sind, gespeichert sind.
6. Sprach-Synthesizer nach Anspruch 4 oder 5,
dadurch gekennzeichnet, daß der adressierbare Steuerspeicher (1) und der adressierbare Datenspeicher (3) mit
einem adressierbaren Prozeßspeicher (z.B.MPU) operativ verbunden sind, um für die Sprachsynthese notwendige
zeitlich begrenzte Speicher- und Rechenoperationen durchzuführen.
130038/0970
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP17085779A JPS56102899A (en) | 1979-12-27 | 1979-12-27 | Voice synthesis control device |
Publications (1)
Publication Number | Publication Date |
---|---|
DE3049393A1 true DE3049393A1 (de) | 1981-09-17 |
Family
ID=15912598
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE19803049393 Ceased DE3049393A1 (de) | 1979-12-27 | 1980-12-29 | Sprachsynthesizer |
Country Status (3)
Country | Link |
---|---|
US (1) | US4627093A (de) |
JP (1) | JPS56102899A (de) |
DE (1) | DE3049393A1 (de) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE3239171A1 (de) * | 1981-10-22 | 1983-05-11 | Sharp K.K., Osaka | Integrierte einchip-schaltung fuer elektronische geraete mit tongeneratoreinrichtungen |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS587694A (ja) * | 1981-07-08 | 1983-01-17 | 東北エプソン株式会社 | 1チツプ音発生集積回路 |
US4792899A (en) * | 1987-01-02 | 1988-12-20 | Motorola, Inc. | Microprocessor support integrated circuit |
DE4329012A1 (de) * | 1993-08-28 | 1995-03-02 | Sel Alcatel Ag | Verfahren und Vorrichtung zur Fehlerprüfung und zur Fehlerkorrektur in Speicherbausteinen |
US5850628A (en) * | 1997-01-30 | 1998-12-15 | Hasbro, Inc. | Speech and sound synthesizers with connected memories and outputs |
US7027568B1 (en) | 1997-10-10 | 2006-04-11 | Verizon Services Corp. | Personal message service with enhanced text to speech synthesis |
US20030101058A1 (en) * | 2001-11-26 | 2003-05-29 | Kenneth Liou | Voice barcode scan device |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE2808577C3 (de) * | 1977-02-28 | 1982-02-18 | Sharp K.K., Osaka | Elektronischer Rechner |
-
1979
- 1979-12-27 JP JP17085779A patent/JPS56102899A/ja active Pending
-
1980
- 1980-12-29 US US06/220,918 patent/US4627093A/en not_active Expired - Lifetime
- 1980-12-29 DE DE19803049393 patent/DE3049393A1/de not_active Ceased
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE3239171A1 (de) * | 1981-10-22 | 1983-05-11 | Sharp K.K., Osaka | Integrierte einchip-schaltung fuer elektronische geraete mit tongeneratoreinrichtungen |
Also Published As
Publication number | Publication date |
---|---|
JPS56102899A (en) | 1981-08-17 |
US4627093A (en) | 1986-12-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE3801380C2 (de) | ||
DE68921161T2 (de) | Programmierbares digitales Filter. | |
DE1965480C3 (de) | Gerat zur Umwandlung eines in graphischen Zeichen gedruckten Textes in gesprochene Worte | |
DE2753707A1 (de) | Einrichtung zur erkennung des auftretens eines kommandowortes aus einer eingangssprache | |
DE3228756A1 (de) | Verfahren und vorrichtung zur zeitabhaengigen komprimierung und synthese von stimmlosen hoerbaren signalen | |
DE3108004A1 (de) | "elektronisches geraet mit sprachsynthesizer" | |
DE2954377C2 (de) | ||
DE3049393A1 (de) | Sprachsynthesizer | |
DE2105449A1 (de) | Musikinstrument | |
DE3024009C2 (de) | Digitales Filter | |
DE3150074C2 (de) | Schaltung zum Erzeugen von Musiktönen | |
DE2826570C2 (de) | ||
DE3037276A1 (de) | Tonsynthesizer | |
DE3239027A1 (de) | Integrierte sprachgeneratorschaltung | |
DE3609056C2 (de) | ||
DE2253746A1 (de) | Modul-signalprozessrechner | |
DE2854601A1 (de) | Ton-synthesizer und verfahren zur ton-aufbereitung | |
DE69425126T2 (de) | Digitale Signalverarbeitungsschaltung | |
DE2335818C3 (de) | Elektrische Anordnung zur automatischen Erzeugung von gesprochenen Sätzen | |
DE3017517C2 (de) | ||
DE2448908C3 (de) | Elektrisches Verfahren und Schaltungsanordnung zur Spracherkennung | |
DE3406540C1 (de) | Verfahren und Anordnung fuer die Sprachsynthese | |
DE60000111T2 (de) | Multiplikationsschaltung für gewöhnliche und Galois-Multiplikationen | |
DE2834751C2 (de) | ||
EP0094681B1 (de) | Schaltungsanordnung zur elektronischen Sprachsynthese |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
OP8 | Request for examination as to paragraph 44 patent law | ||
8131 | Rejection |