DE3049393A1 - Sprachsynthesizer - Google Patents

Sprachsynthesizer

Info

Publication number
DE3049393A1
DE3049393A1 DE19803049393 DE3049393A DE3049393A1 DE 3049393 A1 DE3049393 A1 DE 3049393A1 DE 19803049393 DE19803049393 DE 19803049393 DE 3049393 A DE3049393 A DE 3049393A DE 3049393 A1 DE3049393 A1 DE 3049393A1
Authority
DE
Germany
Prior art keywords
memory
data
speech
speech synthesizer
müller
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
DE19803049393
Other languages
English (en)
Inventor
Shintaro Ikoma Nara Hashimoto
Hideo Kashihara Nara Yoshida
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Publication of DE3049393A1 publication Critical patent/DE3049393A1/de
Ceased legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • G10L13/04Details of speech synthesis systems, e.g. synthesiser structure or memory management
    • G10L13/047Architecture of speech synthesisers

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Electrophonic Musical Instruments (AREA)

Description

TER MEER · MÜLLER · STEINMEISTER '...'.. "..' "S.harp 1542-GER-K
BESCHREIBUNG
Die Erfindung liegt auf dem Gebiet der Sprach-Synthesizer und bezieht sich insbesondere auf eine Halbleitereinrichtung zur Erzeugung von Information in Form synthetischer Sprache.
Frühere und heutige Entwicklungsbemühungen auf dem Gebiet der synthetischen Spracherzeugung unterscheiden sich deutlich voneinander: Während es früher um die geeignetste Hardware für die synthetische Erzeugung menschlicher Sprache ging, steht heute die Entwicklung von für die Sprachsynthese geeigneten neuartigen Programmen als Software für die Steuerung von Sprach-Synthesizern im Vordergrund.
In den letzten Jahren erfolgte die Erzeugung synthetischer Sprache hauptsächlich nach einem Hardware-Konzept mit sog. "Harten Blöcken A, B und CÜ Der Block A enthält einen Speicher zur Speicherung einer Anzahl von Folgen der Synthese sowie einen Befehlsdekodierer. Der Block B enthält eine Gruppe von Adreßregistern, eine Gruppe von Zählern zum Zählen der Anzahl von Daten wie der Grundzählwerte stimmhafter und stimmloser Laute und Register zur zeitweiligen Speicherung von Phonem- und Amplitudendaten. Der Block C enthält Vervielfacher zur Durchführung von Multiplikationen an den Phonemdaten und den Amplitudendaten. Wenn die Sprachsynthese unter Verwendung einer derartigen zeitbezogenen Hardware-Grundstruktur erfolgt, sollte die Gruppe der Zähler verschiedene Arten von logisch geschalteten Flip-Flops wie z.B. solche mit zusätzlichen Inkrement- und Dekrementfunktionen enthalten. Eine Zufalls-Logik, die Random-Knüpfungen
1300 38/0970
TER MEER · MÜLLER · STEINMEISTER * ** Sharp 1542-GEr-K
zwischen logischen Bausteinen wie Toren, Flip-Flops und Zählern enthält, hat den Nachteil, daß die Fläche für diese Bausteine begrenzt, aber der Raumbedarf für die Verschaltung relativ groß ist, so daß alle diese Elemente kaum auf einem wirtschaftlich vertretbaren Platzangebot untergebracht werden können, auf keinen Fall innerhalb eines einzigen LSI-Halbleiterchip. Eine Vergrößerung der Chipabmessungen würde außerdem zu einer exponentiellen Kostenerhöhung führen.
Versuche der Erfinder dieses Problem zu lösen führten zu der Erkenntnis, daß der erwähnte Block A in dem herkömmlichen Sprach-Synthesizer durch einen Festspeicher oder ROM (Read Only Memory) und der Block B, dem die Funktionen des Adressierens, Zählens und' zeitlichen Speicherns der Phonemdaten zufallen, durch einen Lese- und Schreibspeicher (RAM) ersetzt werden könnten. Ferner haben sie herausgefunden, daß die Vervielfacher in dem Block C ersetzbar sind, wenn die Multiplikationsergebnisse in einen Teil eines Lautdatenspeichers ROM als Speichertabelle eingegeben werden. Diese Erkenntnis bringt als Vorteile eine höhere Flächeneffektivität der Bauteile, höhere Integrationsdichte und eine höhere Elementenanzahl pro Flächeneinheit mit sich.
Da die Datenverarbeitungsgeschwindigkeit bei der Sprachsynthese von der Abtastfrequenz abhängig ist, ergibt sich, wenn eine Real-Time-Verarbeitung angestrebt wird, das Problem, wie die Verarbeitung der Abtastdaten innerhalb eines Abtastintervalls zu schaffen ist, z.B. innerhalb von 125 oder 62,5 με bei einer Abtastfrequenz von 8 bzw. 16 kHz. Die innerhalb von 62,5 us zu bewältigende Daten-
130038/0970
TER MEER -MÜLLER ■ STEIMMEISTt-It" Shäf-p 1542-GER-K
länge beträgt nicht weniger als 8 Schritte, in deren. Verlauf eine Folge von Verarbeitungsoperationen an den Abtastdaten zu erfolgen hat. Die Erfinder suchten ein neues Verfahren, mit dem sie die Verarbeitungsgeschwindigkeit auch bei niedriger Operations-(Abtast-) Frequenz wesentlich erhöhen konnten, und sie fanden eine sehr wirkungsvolle Lösung in der Determination der Wortlänge eines als Block B funktionierenden ROM, oder mit anderen Worten: Durch Wahl einer beträchtlich längeren Wortlänge beim ROM gegenüber derjenigen beim Daten-ROM (z.B. 18 Bits Länge gegenüber 8 Bits, 4 K-Bytes beim letzteren) kann die Verarbeitungsgeschwindigkeit wesentlich angehoben werden. Innerhalb einer Wortlänge von 18 Bits können etwa 500 Operationsschritte durchgeführt
werden. Von den 18 Bits der Ein-Wortlänge des ROM sind 5 Anweisungs-Bits, 5 RAM-Adreß-Bits und die restlichen 8 Bits Operanden- und Nächstadressen-Bits. Diese Anordnung ermöglicht die gleichzeitige Durchführung mehrerer Operationen und erlaubt einen Hochgeschwindigkeitszugriff in Abhängigkeit vom Ausgang des Steuer-ROM. Grundsätzlich sollten zum Zwecke einer Erhöhung der Verarbeitungsgeschwindigkeit eines LSI-Chip der EIN-Widerstand seiner Elemente so niedrig wie möglich und die Versorgungsspannungen zur Beschleunigung der Ladungsverschiebung möglichst hoch sein.
Da die Erfüllung dieser Forderungen unvermeidbar zu stark erweiterten Chip-Abmessungen und einer bedeutenden Verschlechterung der Ausbeute führen muß, liegt der Erfindung die Aufgabe zugrunde, einen neuartigen Sprach-Synthesizer zu finden, der bei geringem Platzbedarf zu guten Ergebnisse führt.
130038/0970
TER meer ■ möller . STEJMMEISTER ** 'Sharp 1542-GER-K
Die erfindungsgemäße Lösung der gestellten Aufgabe ist kurzgefaßt im Patentanspruch 1 angegeben.
Vorteilhafte Weiterbildungen des Erfindungsgedankens sind in Unteransprüchen enthalten.
Die wesentlichen Elemente des erfindungsgemäßen Sprach-Synthesizers können ohne Schwierigkeit als monolithische Halbleiterschaltung ausgebildet bzw, in einem einzigen LSI-Halbleiterchip untergebracht werden. Die erfindungsgemäße Anordnung zeichnet sich dadurch aus, daß sie sämtliche für die Verarbeitung von zu erfassenden Daten erforderliche Schritte mittels eines sehr leistungsfähigen Speicherkonzepts mit einer wesentlich erhöhten Verarbeitungsgeschwindigkeit durchführen kann, weil darin ein Steuerspeicher (Steuer-ROM) mit einer größeren Einzelwortlänge arbeitet als ein Datenspeicher (Daten-ROM).
Zur hörbaren Wiedergabe synthetischer Sprache genüg.t es, die erfindungsgemäße LSI-Chip-Halbleiteranordnung einfach mit einem externen Verstärker zu verbinden. Ein sonst bei Impulsbreitenmodulation erforderlicher Digital/Analogwandler ist überflüssig.
Als Weiterbildung des Erfindungsgedankens kann der Datenspeicher (Daten-ROM), wenn eine große Anzahl von Worten zu verarbeiten ist, durch Anschluß eines externen Speichers erweitert werden. Es können dann z.B. allgemein gebräuchliehe Wörter im Datenspeicher und SpezialWörter für" den jeweiligen Verwendungszweck des Gerätes in dem extern angeschlossenen Erweiterungsspeicher gespeichert sein. Ein Steuerspeicher steht so wie er ist auch dem Erweiterungsspeicher zur Verfügung.
130038/0970
TER MEER · MÜLLER · STEINMEISTER
.. Sharp 1542-GER-K
Der erfindungsgemäß in seinen wesentlichen Elementen zu einem einzigen LSI-Chip zusammengefaßte Sprach-Synthesizer gibt unter bestimmten Bedingungen hörbare Laute ab, welche zuvor in ihm gespeicherten Worten entsprechen. Unter der Kontrolle eines Mikroprozessors ist er ferner in der Lage, z.B. die Ergebnisse von Berechnungen oder Zeitmessungen akustisch wiederzugeben.
10
Nachstehend wird ein die Merkmale der Erfindung aufweisendes Ausführungsbeispiel unter Bezugnahme auf eine Zeichnung näher erläutert. Es zeigen:
20
Fig. 1 ein Blockschaltbild zur Erläuterung des Prinzips eines erfindungsgemäßen Sprach-Synthesizers,
Fig. 2 und 3 schematische Blockschaltbilder zu einem Ausführungsbeispiel der Erfindung,
Fig. 4 ein Blockschaltbild mit den in einem
Chip untergebrachten Elementen zur Erzeugung synthetischer Sprache, und
Fig. 5 und 6 ein Blockschaltbild und eine zeitabhängige Signaldarstellung zu einem in Fig. 4 enthaltenen Zähler.
25 30
Die in Fig. 1 schematisch dargestellte Sprachsynthesizer-Steuereinheit VC ist in einem einzigen LSI-Halbleiter-Chip enthalten, der mehrere äußere Anschlüsse hat. Über Anschlüsse X. und XQ ist ein eingebauter Taktgenerator von VC zwecks Erregung mit einem Quarzoszillator oder Widerstand verbunden. Port 1 dient zur Eingabe von Seriendaten (z.B.8 Bit-Daten). Die Daten gehen an einen Anschluß S1n und werden bei einer Datenlänge von 8 Bits achtmal ein-
130038/0970
TER MEER ■ MÜLLER · STEINMEISTER Sharp 1542-GER-K
gespeist. In den Nachbaranschluß 0Q gehen Datentaktimpulse, damit die Bit-Daten mit vorgesehener Zeitabstimmung eingeführt werden.
Port 2 ist ein Mehrzweckeingang für 8 Bit-Daten oder Steuersignale aus einem externen LSI (typisch CPU) ο.dgl. Port 3 ist ein 8-Bit-Mehrzweckausgang für die Abgabe von 8-Bit-Daten und Steuersignalen an die externe LSI-Einrichtung (CPU) ο.dgl. Ein mit einem anderen Bus BO. kombinierter Adreß-Bus AO. bildet einen 16-Bit-Bus für Adreßdaten zu einem externen Erweiterungsspeicher.
Der 8-Bit-Datenbus EO1 dient in üblicher Weise als Eingang- und Ausgangs-Datenverbindung mit Erweiterungsspeichern (ROM und RAM). Bekanntlich ist ein ROM ein Lese-Speicher und ein RAM ein Lese- und Schreib-Speicher.
über einen Tonausgang DO. werden 6-Bit-Digitalausgänge und 2-Bit-PWM-Impulsausgänge (PWM=Impulsbreitenmodulation) abgegeben, d.h. die Sprachsynthesizer-Steuereinheit VC gibt digitale Toninformation mittels Impulsbreitenmodulation aus, und die aus dem Ausgang DO. kommenden Ausgangssignale werden über Tiefpaßfilter in Analog-Toninformation umgesetzt. Es gibt ferner einen Digital/Analogwandler D/A, einen Verstärker AMP und einen Lautsprecher SP.Die erwähnten impulsbreitenmodulierten PWM-Ausgangssignale haben eine Zusatzlänge von 2 Bit, welche entgegengesetzt gepolte Signale bilden, so daß die Polarität der Ausgangssignale ohne Phasenumkehr seitens eines externen Tonverstärkers wählbar ist. Es sei bemerkt, daß der D/A-Wandler für die impulsbreitenmodulierten Ausgangssignale nicht erforderlich ist.
130038/0970
TER MEER . MÜLLER · STEINMEISTER Sh'arp 1542-GER-K
Als Alternative wandelt der Digital/Analogwandler D/A die 6-Bit-Digitalsignale (ohne die 2-Bit-PWM-Signale) in entsprechende Analogsignale als Tonausgänge um. Wenn, wie in diesem Fall, sowohl die Digitalsignale als auch die impulsbreitenmodulierten Signale in der Steuereinheit verfügbar sind, können externe Zusatzschaltungen, Teile und Tonqualität dem Verwendungszweck des Sprach-Synthesizers gemäß optimal ausgenutzt werden.
Nachstehend wird das in Fig. 2 bis 4 dargestellte Ausführungsbeispiel der Erfindung näher erläutert. Eine an sich bekannte Ein/Ausgabeeinheit I/O enthält eine Tastatur und eine Anzeige wie eine Flüssigkristallanzeige. Beispielsweise geheen von CO. - CO. des Ausgangs CO. kommende Taktsignale und Tasteneingangssignale über eine Matrix kombiniert zu einem Eingang Nn.. Die Anzeige wird durch eine Signalkombination aus CO1 - CO. und CO^ - C0„ so aktiviert, daß bei Betätigung einer bestimmten Taste eine oder mehrere Leuchteinheiten der Anzeige aufleuchten. Diese Funktion ist bei relativ kleinen Geräten nützlich, wo lediglich vorgewählte Wörter in synthetische Sprache umzusetzen sind.
In Fig. 3 ist der erfindungsgemäße Sprach-Synthesizer an einen Mikroprozessor MPU angeschlossen, dessen Anschlüsse K1 - K4 mit der Tastatur KEY verbunden sind, dessen Ausgangsanschluß 0. die Taktsignale der Tastatur KEY und die Segmentansteuersignale an die Anzeige DISP und dessen Ausgangsanschluß H. ein gemeinsames Signal an die Anzeige DISP abgibt. Die beschriebenen Baugruppen MPU, KEY und DISP können einen elektronischen Rechner mit allen zugehörigen Funktionen bilden, welcher in Verbindung mit dem erfindungs
130038/0970
TER MEER · MÜLLER ■ STEINMEISTER
Sharp 1542-GER-K
gemäß ausgebildeten Sprach-Synthesizer die eingegebenen Tastensignale oder seine Rechenresultate in synthetischer Sprache hörbar ausgibt.
über einen Anschluß R2 gibt der Mikroprozessor MPU eine Aktivierspannung an die Sprachsynthesizer-Steuereinheit VC, den Digital/Analogwandler D/A und den Verstärker AMP ab, und liefert dann Tondaten, die Über die Steuereinheit VC in Form synthetischer Sprache auszugeben sind. Wenn beispielsweise die Anweisung "Multipliziere" (x) hörbar auszugeber, ist, liefert der Mikroprozessor MPU einen entsprechenden Code an die Steuereinheit VC. Die Daten aus dem Anschluß R. des Mikroprozessors MPU gehen nacheinander zum Eingang N_ „ von N der Steuereinheit VC, und damit diese Datenübertragung in der richtigen zeitlichen Abstimmung erfolgt, geht ein Taktsignal BUSY von einem Anschluß R3 des Mikroprozessors in einen Anschluß NTN4 der Steuereinheit VC, welche ihrerseits aus ihrem Ausgangsanschluß COq ein Bestätigungssignal ACK in einen Anschluß des Mikroprozessors liefert. Durch den Austausch der BUSY- und ACK-Signale läuft die Datenübertragung in bekannter Weise ab.
Mit Einschaltung der Sprachsynthesizer-Steuereinheit VC befindet sie sich im Bereitschaftszustand für CO« von Ausgang CO. und zur Annahme des Mikroprozessorsignals BUSY an ihrem Eingangsanschluß Ν-Ν8 von N1n-, wo der Anstieg auf den logischen Zustand "1" erfolgt. Wenn VC bei einem BUSY-Signal von "1" an NIN8 die Daten erhält, gehen COg und das ACK-Signal in den logischen Zustand "0" über. Dagegen reduziert VC boi Zugang des BUSY-Signals "O" den Pegel des ACK-Signals auf "1" und zeigt damit seine Bereitschaft zur Aufnahme der nächsten Daten an. Mit Zugang des
130038/0970
TER MEER - MÖLLER · STEINMEIS"! F-R' "" 'Sharp 1542-GER-K
ACK-Signals von "V erhöht der Mikroprozessor MPU den Pegel des BUSY-Signals auf "1" und liefert an den VC-Anschluß NT.1Q die zweiten Bit-Daten. Unter
INo
wiederholter Durchführung der erläuterton Vorgänge werden nacheinander alle 8-Bit-Wortcodes in die Steuereinheit VC übertragen, wo sie in einem gewünschten Abschnitt des RAM gespeichert werden, der Steuerspeicher in Abhängigkeit von in dem Tondatenspeicher gespeicherten Informationen Anweisungen ausführt und auf diese Weise gemäß Fig. 4 diese aufeinanderfolgenden Codes in synthetische Sprache umgesetzt werden.
Die gem. Fig. 4 in einem einzigen LSI-Halbleiterchip zusammengefaßte Sprachsynthesizer-Steuereinheit VC umfaßt einen Steuerspeicher (Steuer-ROM), welcher eine Serio von in Abhängigkeit verschiedener Steuersignale wie z.B. des BUSY-Signals abhängigen Anweisungen und eine Serie von Anweisungen für ein I/O-Interface enthält, einen Speicher für freien.Zugriff RAM 2, welcher als zeitweiliger Speicher oder Zähler zum Speichern oder Zählen der extern eingegebenen Wortcodes und Adreßinformatlon in Verbindung mit dem Tondatenspeicher für die Sprachsynthese verwendet wird, und einen Tondatenspoicher (Daten-ROM), in welchem zuvor abgespeicherte synthetische Lautdaten (Phonem-Daten) für synthetische Sprache abgespeichert sind. Je nach Art und Umfang der zuvor im Lautdatenspeicher abgespeicherten Wörter kann der Sprach-Synthesizer für die verschiedensten Zwecke eingesetzt werden, und zur Erhöhung des Vokabulars kann die Länge bzw. der Umfang des Lautdatenspeichers,erweitert werden.
Ein Programmzähler spezifiziert einen bestimmten Programmschritt des Steuerspeichers 1, und ein Register SP speichert zeitweilig die Inhalte des Programmzählers P. Ein
130038/0970
• * m «
TER MEER · MÜLLER · STEINMEISTER Sharp 1542-GER-K
- 12 -
Befehlsdekodierer 4 dekodiert den Ausgang des Steuerspeichers 1, und eine Rechen- und Logik-Einheit ALU 5 führt Rechen- und logische Operationen an Signalen des Speichers 1, eines Akkumulators 6 und des RAM 2 durch. Der Akkumulator 6 speichert zeitweilig die von den einzelnen Speichern, der Einheit 5 oder einer äußeren Quelle kommenden Steuersignale und Daten und setzt oder rücksetzt als Ergebnis seiner Operationen ein Flag 7 (Cu. Z) An die erwähnten Adreßbusse AO, und BO. sind zwei die Adreßdaten bezüglich des Lautdatenspeichers 3 für eine Weile haltende Adreßpuffer 8 und 9 (PA,PB) angeschlossen. Nach im Steuerspeicher 1 enthaltenen Aweisungen hält ein Ausgangspuffer 10 Signale eine Weile/ die über den Ausgang CO. abzugeben sind, und ein Eingangspuffer 11 hält für eine Weile Signale oder Daten, die über den Eingang N_Ni ankommen. Extern zugeführte Steuersignale und Daten gehen in einen Eingangspuffer 12. Mit jedem über 0g zugeführten Signal nimmt der Eingangspuffer 12 bei S zugeführte Daten auf und schiebt die Inhalte in einen Puffer S, und zwar S-mal, um alle 8-Bit-Daten in den Puffer S zu bringen. Eine Zählergruppe 13 enthält Ausgangspuffer zum zeitweiligen Halten von Lautdaten, einen setzbaren Zähler und PWM-(Impulsbreitenmodulation)Ausgangszähler, die nachstehend in Verbindung mit Fig. 5 und 6 näher erläutert werden.
In einen Ausgangspuffer 130 gehende Lautdaten werden dem Ausgang DO. und einem vorsetzbaren Zähler 131 zugeführt, von denen letzterer bei Aufnahme des Ausgangs eines Frequenz· teilers 15 abwärtszählt und bei Erreichen des Zählwertes "Null" ein Ausgangssignal an einen PW-Puffer 133 (PW=Impulsbreitenmodulation) abgibt. Synchron mit einem 1 MHz-Signal des Teilers 15 werden die in den Zähler 131 kommenden Lautdaten erniedrigt. Bei Erkennung von "Null" liefert ein
130038/0970
TER MEER . MÜLLER · STEINMEISTER Sharp 1542-GER-K
Nulldetektor 132 dem PW-Ausgangspuffer 133 ein Ausgangssignal. Die in Fig. 6 dargestellte Form der Impulsbreitenmodulation-Ausgänge werden trotz festgelegter Abtastfrequenz (16kHz) in jedem Intervall bezüglich der Länge von "1" oder "0" moduliert. Diese Signale werden einfach über ein Tiefpaßfilter gegeben und so in Analogsignale umgesetzt. Ein Bezugssignalgenerator 14 mit eingebautem Quarzoszillator liefert ein Bezugssignal als Taktsignal an die Zähler 13 und die Verknüpfungsstelle zwischen den Teilern 15 und 16. Ferner liefert ein Systemtaktgenerator 17 Systemtaktimpulse φ* und φ~· Ein 4-Bit-Speicher X speichert die 4-Bit-Inhalte des Adreßpuffers 8 (PA) des Lautdatenspeichers 3 auf halbfeste Weise, um in unten beschriebener Weise die Adressierung des Lautdatenspeichers zu beschleunigen. Ein Daten-Bus DB1 dient als gemeinsamer Datenweg zwischen den einzelnen Puffern, RAM 2, ALU 5 und dem Lautdatenspeicher 3. Ein zweiter Daten-Bus DB_ dient der Datenübertragung zwischen dem Akkumulator 6, RAM 2 und ALU 5. Der mit DB. verbundene Anschluß EO. dient der beiderseitigen Datenübertragung von und zum externen Speicher.
Beim betriebsmäßigen Ablauf wertet der Steuerspeicher (Steuer-ROM) Startadressen, zu denen die oben erwähnten Wortcodes eine bestimmte Beziehung haben, nach den in den RAM 2 gespeisten Wortcodes aus und stellt den Adreßpuf feritPA und PB eine entsprechende Adreßinformation zu. Die durch diese Adreßpuffer PA, PB adressierten Inhalte des Lautdatenspeichers, d.h. die Wortstartadressen befinden sich in einem gewünschten Abschnitt von RAM. Diese Startadresse ist die Anfangsadresse jeder beliebigen Sprach-
130038/0970
TER MEER . MÜLLER ■ STEINMEISTER " -Sharp 1542-GER-K
synthese-Folge, und diese Folge wir# erfaßt und in ähnlicher Weise dem RAM zugeführt. Anschließend werden gemäß dieser erfaßten Synthese-Folge eine bestimmte Anzahl von Fragmenten der Grundlautinformation kombiniert und so abgewandelt, daß als Ergebnis quantilisierte Lautsignale wiedergegeben und mit der Abtastfrequenz an einen Lautausgangspuffer 18 abgegeben werden .
Wie erwähnt ist die Wortlänge (pro Schritt) des Steuer-Speichers 1 18 Bits läng und enthält 100 Operationsschritte, während die Wortlänge des Lautdatenspeichers 3 8 Bits lang ist (pro Schritt) und einige 1000 Schritte (Byte) enthält. Dieses besondere Kennzeichen (bezüglich der Bit-Länge und/ oder Schritte) ermöglicht die Sprachsynthese mit erhöhter Geschwindigkeit.
Je größer die Bit-Länge in jedem der Schritte des Steuerspeichers 1 (Steuer-ROM) ist, um so mehr Prozesse können in jedem der Schritte durchgeführt werden. Auf diese Weise können beliebig viele Operationen ohne Erhöhung der Systemtaktfrequenz in einem gegebenen Zeitraum ausgeführt werden. Beim Lautdatenspeicher 3 erübrigt sich eine Erhöhung der Bit-Länge bei jedem Schritt. Mit anderen Worten: Die Bit-Länge jedes Schrittes ist ausreichend bemessen, um die oben erwähnten Startadressen, Sprachsynthese-Folgen und Grundlautinformationen darin unterzubringen. Folglich kann der Lautdatenspeicher 3 die gleiche Bit-Länge wie der erweiterte Allzweckspeicher haben. Daraus ergibt sich der Vorteil, daß die Adressierung und der Bezug der Daten aus dem Lautdatenspeicher 3 und einem äußeren oder Hilfs-Lautdatenspeicher in gleicher Weise erfolgen kann.
130 038/0970 ORIGINAL
TER MEER · MÜLLER ■ STEINMEISTER Srtrar^ "1 542-GER-K
Der äußere Zusatzspeicher muß nicht ein ROM sein, es kann auch ein mit extern zugeführten Lautdaten gefüllter und durch eine Batterie gestützter RAM benutzt werden. Durch geeignete Auswahl zugesetzter Lautdaten kann jede gewünschte Art synthetischer Sprache mit Erfolg wiedergegeben werden.
130038/0970

Claims (6)

TER MEER - MÜLLER - STEINMEISTER Beim EuropSlachen Patentamt zugelassene Vertreter Prof. Representatives before the European Patent Office - Mandalalree agrees pres !'Office ouropeen des brevets Dipl.-Chem. Dr. N. ter Meer Dipl.-Ing. H. Steinmeister Dipl.-Ing. F. E. Müller .... Triftetrasse 4, S.ekerwall?, D-8000 MÜNCHEN 22 D-4800 BIELEFELD 1 Case: 1542-GER-K MÜ/Gdt/Tß/kü 29. Dezember 1980 SHARP KABUSHIKI KAISHA 22-22 Nagaike-cho, Abeno-ku , Osaka 545 / Japan Sprachsynthesizer Priorität: 27. Dezember 1979, Japan, No. 54-170857/1979 PATENTANSPRÜCHE
1.) Spiiach-Synthesizer,
dadurch gekennzeichnet, daß ein erster Speicher (1) zur Speicherung einer Anzahl von Informationsfragmenten für die Erzeugung synthetischer Sprache und ein zweiter Speicher (3) zur Speicherung von Steuerbefehlen, die für die Erzeugung synthetischer Sprache aus den in dem ersten Speicher enthaltenen Informationsfragmenten erforderlich sind, in einem einzigen integrierten Halbleiterchip (VC) enthalten sind.
130038/0970
meer - Müller · Steinmeister ** .:..:.. "-«sharp 1542-GER-K
2. Sprach-Synthesizer nach Anspruch 1,
dadurch gekennzeichnet, daß der erste Speicher (1) einen äußeren Anschluß für eine Erweiterung seiner Speicherkapazität hat.
3. Sprach-Synthesizer nach Anspruch 1,
dadurch gekennzeichnet, daß der erste Speicher (1) für eine längere Einzelwortlänge als der zweite Speicher (3) eingerichtet ist.
4. Sprach-Synthesizer nach Anspruch 1,
dadurch gekennzeichnet, daß der erste Speicher ein adressierbarer Steuerspeicher (1) ist, in dem eine Anzahl von aufeinanderfolgend wiederzugebenden Fragmenten von Lautinformation als feste Programmanweisungen gespeichert sind.
5. Sprach-Synthesizer nach Anspruch 1 oder 4, dadurch gekennzeichnet, daß der zweite Speicher ein adressierbarer Datenspeicher (3) ist, in dem auf festgelegte Art Lautdaten wie Phoneminformationen (Laute) oder Lautgruppen-Informationen als Grundlage der Sprachsynthese und ferner Befehlsdaten, die für Abwandlungsoperationen wie Abläufe in bezug auf Datenauswahl, auf gewählte Zeitabstände und/oder eine Anzahl von Wiederholungen erforderlich sind, gespeichert sind.
6. Sprach-Synthesizer nach Anspruch 4 oder 5,
dadurch gekennzeichnet, daß der adressierbare Steuerspeicher (1) und der adressierbare Datenspeicher (3) mit einem adressierbaren Prozeßspeicher (z.B.MPU) operativ verbunden sind, um für die Sprachsynthese notwendige zeitlich begrenzte Speicher- und Rechenoperationen durchzuführen.
130038/0970
DE19803049393 1979-12-27 1980-12-29 Sprachsynthesizer Ceased DE3049393A1 (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP17085779A JPS56102899A (en) 1979-12-27 1979-12-27 Voice synthesis control device

Publications (1)

Publication Number Publication Date
DE3049393A1 true DE3049393A1 (de) 1981-09-17

Family

ID=15912598

Family Applications (1)

Application Number Title Priority Date Filing Date
DE19803049393 Ceased DE3049393A1 (de) 1979-12-27 1980-12-29 Sprachsynthesizer

Country Status (3)

Country Link
US (1) US4627093A (de)
JP (1) JPS56102899A (de)
DE (1) DE3049393A1 (de)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3239171A1 (de) * 1981-10-22 1983-05-11 Sharp K.K., Osaka Integrierte einchip-schaltung fuer elektronische geraete mit tongeneratoreinrichtungen

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS587694A (ja) * 1981-07-08 1983-01-17 東北エプソン株式会社 1チツプ音発生集積回路
US4792899A (en) * 1987-01-02 1988-12-20 Motorola, Inc. Microprocessor support integrated circuit
DE4329012A1 (de) * 1993-08-28 1995-03-02 Sel Alcatel Ag Verfahren und Vorrichtung zur Fehlerprüfung und zur Fehlerkorrektur in Speicherbausteinen
US5850628A (en) * 1997-01-30 1998-12-15 Hasbro, Inc. Speech and sound synthesizers with connected memories and outputs
US7027568B1 (en) 1997-10-10 2006-04-11 Verizon Services Corp. Personal message service with enhanced text to speech synthesis
US20030101058A1 (en) * 2001-11-26 2003-05-29 Kenneth Liou Voice barcode scan device

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4179584A (en) * 1977-02-28 1979-12-18 Sharp Kabushiki Kaisha Synthetic-speech calculators

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3239171A1 (de) * 1981-10-22 1983-05-11 Sharp K.K., Osaka Integrierte einchip-schaltung fuer elektronische geraete mit tongeneratoreinrichtungen

Also Published As

Publication number Publication date
US4627093A (en) 1986-12-02
JPS56102899A (en) 1981-08-17

Similar Documents

Publication Publication Date Title
DE3801380C2 (de)
DE1965480C3 (de) Gerat zur Umwandlung eines in graphischen Zeichen gedruckten Textes in gesprochene Worte
DE3228756A1 (de) Verfahren und vorrichtung zur zeitabhaengigen komprimierung und synthese von stimmlosen hoerbaren signalen
DE3108004A1 (de) "elektronisches geraet mit sprachsynthesizer"
DE2954377C2 (de)
DE3049393A1 (de) Sprachsynthesizer
DE2105449A1 (de) Musikinstrument
DE3024009C2 (de) Digitales Filter
DE3150074C2 (de) Schaltung zum Erzeugen von Musiktönen
DE2854601C2 (de) Verfahren zur Tonaufbereitung und Ton-Synthesator zu seiner Durchführung
DE3633461A1 (de) Taktsignalgebervorrichtung
DE3037276A1 (de) Tonsynthesizer
DE3239027A1 (de) Integrierte sprachgeneratorschaltung
DE3609056C2 (de)
DE2253746A1 (de) Modul-signalprozessrechner
DE2335818C3 (de) Elektrische Anordnung zur automatischen Erzeugung von gesprochenen Sätzen
DE3017517C2 (de)
DE2826570A1 (de) Digitales filter sowie anordnung und verfahren zur sprachsynthese unter verwendung eines solchen filters
DE2657430A1 (de) Einrichtung zum synthetisieren der menschlichen sprache
DE2448908C3 (de) Elektrisches Verfahren und Schaltungsanordnung zur Spracherkennung
DE3406540C1 (de) Verfahren und Anordnung fuer die Sprachsynthese
DE2209548C3 (de) Elektrische Sprachsynthetisatorschaltung
DE2629740A1 (de) Verfahren zur ermittlung der groessten aehnlichkeit und der verschiebezeit bis zum auftreten der groessten aehnlichkeit zwischen in zwei parallelgeschaltete schieberegister ueber eingabemittel eingeschriebene datenwoerter sowie eine einrichtung zur durchfuehrung des verfahrens
DE2208709C3 (de) Elektrischer Signalgenerator für die Sprachsynthese
EP0043532B1 (de) Digitale Halbleiterschaltung für eine elektronische Orgel

Legal Events

Date Code Title Description
OP8 Request for examination as to paragraph 44 patent law
8131 Rejection