DE3049393A1

DE3049393A1 - Sprachsynthesizer

Info

Publication number: DE3049393A1
Application number: DE19803049393
Authority: DE
Inventors: Shintaro Ikoma Nara Hashimoto; Hideo Kashihara Nara Yoshida
Original assignee: Sharp Corp
Current assignee: Sharp Corp
Priority date: 1979-12-27
Filing date: 1980-12-29
Publication date: 1981-09-17
Also published as: JPS56102899A; US4627093A

Description

TER MEER · MÜLLER · STEINMEISTER '...'.. "..' "S.harp 1542-GER-K

BESCHREIBUNG

Die Erfindung liegt auf dem Gebiet der Sprach-Synthesizer und bezieht sich insbesondere auf eine Halbleitereinrichtung zur Erzeugung von Information in Form synthetischer Sprache.

Frühere und heutige Entwicklungsbemühungen auf dem Gebiet der synthetischen Spracherzeugung unterscheiden sich deutlich voneinander: Während es früher um die geeignetste Hardware für die synthetische Erzeugung menschlicher Sprache ging, steht heute die Entwicklung von für die Sprachsynthese geeigneten neuartigen Programmen als Software für die Steuerung von Sprach-Synthesizern im Vordergrund.

In den letzten Jahren erfolgte die Erzeugung synthetischer Sprache hauptsächlich nach einem Hardware-Konzept mit sog. "Harten Blöcken A, B und CÜ Der Block A enthält einen Speicher zur Speicherung einer Anzahl von Folgen der Synthese sowie einen Befehlsdekodierer. Der Block B enthält eine Gruppe von Adreßregistern, eine Gruppe von Zählern zum Zählen der Anzahl von Daten wie der Grundzählwerte stimmhafter und stimmloser Laute und Register zur zeitweiligen Speicherung von Phonem- und Amplitudendaten. Der Block C enthält Vervielfacher zur Durchführung von Multiplikationen an den Phonemdaten und den Amplitudendaten. Wenn die Sprachsynthese unter Verwendung einer derartigen zeitbezogenen Hardware-Grundstruktur erfolgt, sollte die Gruppe der Zähler verschiedene Arten von logisch geschalteten Flip-Flops wie z.B. solche mit zusätzlichen Inkrement- und Dekrementfunktionen enthalten. Eine Zufalls-Logik, die Random-Knüpfungen

1300 38/0970

TER MEER · MÜLLER · STEINMEISTER * ** Sharp 1542-GEr-K

zwischen logischen Bausteinen wie Toren, Flip-Flops und Zählern enthält, hat den Nachteil, daß die Fläche für diese Bausteine begrenzt, aber der Raumbedarf für die Verschaltung relativ groß ist, so daß alle diese Elemente kaum auf einem wirtschaftlich vertretbaren Platzangebot untergebracht werden können, auf keinen Fall innerhalb eines einzigen LSI-Halbleiterchip. Eine Vergrößerung der Chipabmessungen würde außerdem zu einer exponentiellen Kostenerhöhung führen.

Versuche der Erfinder dieses Problem zu lösen führten zu der Erkenntnis, daß der erwähnte Block A in dem herkömmlichen Sprach-Synthesizer durch einen Festspeicher oder ROM (Read Only Memory) und der Block B, dem die Funktionen des Adressierens, Zählens und' zeitlichen Speicherns der Phonemdaten zufallen, durch einen Lese- und Schreibspeicher (RAM) ersetzt werden könnten. Ferner haben sie herausgefunden, daß die Vervielfacher in dem Block C ersetzbar sind, wenn die Multiplikationsergebnisse in einen Teil eines Lautdatenspeichers ROM als Speichertabelle eingegeben werden. Diese Erkenntnis bringt als Vorteile eine höhere Flächeneffektivität der Bauteile, höhere Integrationsdichte und eine höhere Elementenanzahl pro Flächeneinheit mit sich.

Da die Datenverarbeitungsgeschwindigkeit bei der Sprachsynthese von der Abtastfrequenz abhängig ist, ergibt sich, wenn eine Real-Time-Verarbeitung angestrebt wird, das Problem, wie die Verarbeitung der Abtastdaten innerhalb eines Abtastintervalls zu schaffen ist, z.B. innerhalb von 125 oder 62,5 με bei einer Abtastfrequenz von 8 bzw. 16 kHz. Die innerhalb von 62,5 us zu bewältigende Daten-

130038/0970

TER MEER -MÜLLER ■ STEIMMEISTt-It" Shäf-p 1542-GER-K

länge beträgt nicht weniger als 8 Schritte, in deren. Verlauf eine Folge von Verarbeitungsoperationen an den Abtastdaten zu erfolgen hat. Die Erfinder suchten ein neues Verfahren, mit dem sie die Verarbeitungsgeschwindigkeit auch bei niedriger Operations-(Abtast-) Frequenz wesentlich erhöhen konnten, und sie fanden eine sehr wirkungsvolle Lösung in der Determination der Wortlänge eines als Block B funktionierenden ROM, oder mit anderen Worten: Durch Wahl einer beträchtlich längeren Wortlänge beim ROM gegenüber derjenigen beim Daten-ROM (z.B. 18 Bits Länge gegenüber 8 Bits, 4 K-Bytes beim letzteren) kann die Verarbeitungsgeschwindigkeit wesentlich angehoben werden. Innerhalb einer Wortlänge von 18 Bits können etwa 500 Operationsschritte durchgeführt

werden. Von den 18 Bits der Ein-Wortlänge des ROM sind 5 Anweisungs-Bits, 5 RAM-Adreß-Bits und die restlichen 8 Bits Operanden- und Nächstadressen-Bits. Diese Anordnung ermöglicht die gleichzeitige Durchführung mehrerer Operationen und erlaubt einen Hochgeschwindigkeitszugriff in Abhängigkeit vom Ausgang des Steuer-ROM. Grundsätzlich sollten zum Zwecke einer Erhöhung der Verarbeitungsgeschwindigkeit eines LSI-Chip der EIN-Widerstand seiner Elemente so niedrig wie möglich und die Versorgungsspannungen zur Beschleunigung der Ladungsverschiebung möglichst hoch sein.

Da die Erfüllung dieser Forderungen unvermeidbar zu stark erweiterten Chip-Abmessungen und einer bedeutenden Verschlechterung der Ausbeute führen muß, liegt der Erfindung die Aufgabe zugrunde, einen neuartigen Sprach-Synthesizer zu finden, der bei geringem Platzbedarf zu guten Ergebnisse führt.

130038/0970

TER meer ■ möller . STEJMMEISTER ** 'Sharp 1542-GER-K

Die erfindungsgemäße Lösung der gestellten Aufgabe ist kurzgefaßt im Patentanspruch 1 angegeben.

Vorteilhafte Weiterbildungen des Erfindungsgedankens sind in Unteransprüchen enthalten.

Die wesentlichen Elemente des erfindungsgemäßen Sprach-Synthesizers können ohne Schwierigkeit als monolithische Halbleiterschaltung ausgebildet bzw, in einem einzigen LSI-Halbleiterchip untergebracht werden. Die erfindungsgemäße Anordnung zeichnet sich dadurch aus, daß sie sämtliche für die Verarbeitung von zu erfassenden Daten erforderliche Schritte mittels eines sehr leistungsfähigen Speicherkonzepts mit einer wesentlich erhöhten Verarbeitungsgeschwindigkeit durchführen kann, weil darin ein Steuerspeicher (Steuer-ROM) mit einer größeren Einzelwortlänge arbeitet als ein Datenspeicher (Daten-ROM).

Zur hörbaren Wiedergabe synthetischer Sprache genüg.t es, die erfindungsgemäße LSI-Chip-Halbleiteranordnung einfach mit einem externen Verstärker zu verbinden. Ein sonst bei Impulsbreitenmodulation erforderlicher Digital/Analogwandler ist überflüssig.

Als Weiterbildung des Erfindungsgedankens kann der Datenspeicher (Daten-ROM), wenn eine große Anzahl von Worten zu verarbeiten ist, durch Anschluß eines externen Speichers erweitert werden. Es können dann z.B. allgemein gebräuchliehe Wörter im Datenspeicher und SpezialWörter für" den jeweiligen Verwendungszweck des Gerätes in dem extern angeschlossenen Erweiterungsspeicher gespeichert sein. Ein Steuerspeicher steht so wie er ist auch dem Erweiterungsspeicher zur Verfügung.

130038/0970

TER MEER · MÜLLER · STEINMEISTER

.. Sharp 1542-GER-K

Der erfindungsgemäß in seinen wesentlichen Elementen zu einem einzigen LSI-Chip zusammengefaßte Sprach-Synthesizer gibt unter bestimmten Bedingungen hörbare Laute ab, welche zuvor in ihm gespeicherten Worten entsprechen. Unter der Kontrolle eines Mikroprozessors ist er ferner in der Lage, z.B. die Ergebnisse von Berechnungen oder Zeitmessungen akustisch wiederzugeben.

10

Nachstehend wird ein die Merkmale der Erfindung aufweisendes Ausführungsbeispiel unter Bezugnahme auf eine Zeichnung näher erläutert. Es zeigen:

20

Fig. 1 ein Blockschaltbild zur Erläuterung des Prinzips eines erfindungsgemäßen Sprach-Synthesizers,

Fig. 2 und 3 schematische Blockschaltbilder zu einem Ausführungsbeispiel der Erfindung,

Fig. 4 ein Blockschaltbild mit den in einem

Chip untergebrachten Elementen zur Erzeugung synthetischer Sprache, und

Fig. 5 und 6 ein Blockschaltbild und eine zeitabhängige Signaldarstellung zu einem in Fig. 4 enthaltenen Zähler.

25 30

Die in Fig. 1 schematisch dargestellte Sprachsynthesizer-Steuereinheit VC ist in einem einzigen LSI-Halbleiter-Chip enthalten, der mehrere äußere Anschlüsse hat. Über Anschlüsse X. und X_Q ist ein eingebauter Taktgenerator von VC zwecks Erregung mit einem Quarzoszillator oder Widerstand verbunden. Port 1 dient zur Eingabe von Seriendaten (z.B.8 Bit-Daten). Die Daten gehen an einen Anschluß S_1n und werden bei einer Datenlänge von 8 Bits achtmal ein-

130038/0970

TER MEER ■ MÜLLER · STEINMEISTER Sharp 1542-GER-K

gespeist. In den Nachbaranschluß 0_Q gehen Datentaktimpulse, damit die Bit-Daten mit vorgesehener Zeitabstimmung eingeführt werden.

Port 2 ist ein Mehrzweckeingang für 8 Bit-Daten oder Steuersignale aus einem externen LSI (typisch CPU) ο.dgl. Port 3 ist ein 8-Bit-Mehrzweckausgang für die Abgabe von 8-Bit-Daten und Steuersignalen an die externe LSI-Einrichtung (CPU) ο.dgl. Ein mit einem anderen Bus BO. kombinierter Adreß-Bus AO. bildet einen 16-Bit-Bus für Adreßdaten zu einem externen Erweiterungsspeicher.

Der 8-Bit-Datenbus EO₁ dient in üblicher Weise als Eingang- und Ausgangs-Datenverbindung mit Erweiterungsspeichern (ROM und RAM). Bekanntlich ist ein ROM ein Lese-Speicher und ein RAM ein Lese- und Schreib-Speicher.

über einen Tonausgang DO. werden 6-Bit-Digitalausgänge und 2-Bit-PWM-Impulsausgänge (PWM=Impulsbreitenmodulation) abgegeben, d.h. die Sprachsynthesizer-Steuereinheit VC gibt digitale Toninformation mittels Impulsbreitenmodulation aus, und die aus dem Ausgang DO. kommenden Ausgangssignale werden über Tiefpaßfilter in Analog-Toninformation umgesetzt. Es gibt ferner einen Digital/Analogwandler D/A, einen Verstärker AMP und einen Lautsprecher SP.Die erwähnten impulsbreitenmodulierten PWM-Ausgangssignale haben eine Zusatzlänge von 2 Bit, welche entgegengesetzt gepolte Signale bilden, so daß die Polarität der Ausgangssignale ohne Phasenumkehr seitens eines externen Tonverstärkers wählbar ist. Es sei bemerkt, daß der D/A-Wandler für die impulsbreitenmodulierten Ausgangssignale nicht erforderlich ist.

130038/0970

TER MEER . MÜLLER · STEINMEISTER Sh'arp 1542-GER-K

Als Alternative wandelt der Digital/Analogwandler D/A die 6-Bit-Digitalsignale (ohne die 2-Bit-PWM-Signale) in entsprechende Analogsignale als Tonausgänge um. Wenn, wie in diesem Fall, sowohl die Digitalsignale als auch die impulsbreitenmodulierten Signale in der Steuereinheit verfügbar sind, können externe Zusatzschaltungen, Teile und Tonqualität dem Verwendungszweck des Sprach-Synthesizers gemäß optimal ausgenutzt werden.

Nachstehend wird das in Fig. 2 bis 4 dargestellte Ausführungsbeispiel der Erfindung näher erläutert. Eine an sich bekannte Ein/Ausgabeeinheit I/O enthält eine Tastatur und eine Anzeige wie eine Flüssigkristallanzeige. Beispielsweise geheen von CO. - CO. des Ausgangs CO. kommende Taktsignale und Tasteneingangssignale über eine Matrix kombiniert zu einem Eingang N_n.. Die Anzeige wird durch eine Signalkombination aus CO₁ - CO. und CO^ - C0„ so aktiviert, daß bei Betätigung einer bestimmten Taste eine oder mehrere Leuchteinheiten der Anzeige aufleuchten. Diese Funktion ist bei relativ kleinen Geräten nützlich, wo lediglich vorgewählte Wörter in synthetische Sprache umzusetzen sind.

In Fig. 3 ist der erfindungsgemäße Sprach-Synthesizer an einen Mikroprozessor MPU angeschlossen, dessen Anschlüsse K₁ - K₄ mit der Tastatur KEY verbunden sind, dessen Ausgangsanschluß 0. die Taktsignale der Tastatur KEY und die Segmentansteuersignale an die Anzeige DISP und dessen Ausgangsanschluß H. ein gemeinsames Signal an die Anzeige DISP abgibt. Die beschriebenen Baugruppen MPU, KEY und DISP können einen elektronischen Rechner mit allen zugehörigen Funktionen bilden, welcher in Verbindung mit dem erfindungs

130038/0970

TER MEER · MÜLLER ■ STEINMEISTER

Sharp 1542-GER-K

gemäß ausgebildeten Sprach-Synthesizer die eingegebenen Tastensignale oder seine Rechenresultate in synthetischer Sprache hörbar ausgibt.

über einen Anschluß R₂ gibt der Mikroprozessor MPU eine Aktivierspannung an die Sprachsynthesizer-Steuereinheit VC, den Digital/Analogwandler D/A und den Verstärker AMP ab, und liefert dann Tondaten, die Über die Steuereinheit VC in Form synthetischer Sprache auszugeben sind. Wenn beispielsweise die Anweisung "Multipliziere" (x) hörbar auszugeber, ist, liefert der Mikroprozessor MPU einen entsprechenden Code an die Steuereinheit VC. Die Daten aus dem Anschluß R. des Mikroprozessors MPU gehen nacheinander zum Eingang N_ „ von N der Steuereinheit VC, und damit diese Datenübertragung in der richtigen zeitlichen Abstimmung erfolgt, geht ein Taktsignal BUSY von einem Anschluß R₃ des Mikroprozessors in einen Anschluß N_TN4 der Steuereinheit VC, welche ihrerseits aus ihrem Ausgangsanschluß COq ein Bestätigungssignal ACK in einen Anschluß des Mikroprozessors liefert. Durch den Austausch der BUSY- und ACK-Signale läuft die Datenübertragung in bekannter Weise ab.

Mit Einschaltung der Sprachsynthesizer-Steuereinheit VC befindet sie sich im Bereitschaftszustand für CO« von Ausgang CO. und zur Annahme des Mikroprozessorsignals BUSY an ihrem Eingangsanschluß Ν-_Ν8 von N_1n-, wo der Anstieg auf den logischen Zustand "1" erfolgt. Wenn VC bei einem BUSY-Signal von "1" an N_IN8 die Daten erhält, gehen COg und das ACK-Signal in den logischen Zustand "0" über. Dagegen reduziert VC boi Zugang des BUSY-Signals "O" den Pegel des ACK-Signals auf "1" und zeigt damit seine Bereitschaft zur Aufnahme der nächsten Daten an. Mit Zugang des

130038/0970

TER MEER - MÖLLER · STEINMEIS"! F-R' "" 'Sharp 1542-GER-K

ACK-Signals von "V erhöht der Mikroprozessor MPU den Pegel des BUSY-Signals auf "1" und liefert an den VC-Anschluß N_T._1Q die zweiten Bit-Daten. Unter

INo

wiederholter Durchführung der erläuterton Vorgänge werden nacheinander alle 8-Bit-Wortcodes in die Steuereinheit VC übertragen, wo sie in einem gewünschten Abschnitt des RAM gespeichert werden, der Steuerspeicher in Abhängigkeit von in dem Tondatenspeicher gespeicherten Informationen Anweisungen ausführt und auf diese Weise gemäß Fig. 4 diese aufeinanderfolgenden Codes in synthetische Sprache umgesetzt werden.

Die gem. Fig. 4 in einem einzigen LSI-Halbleiterchip zusammengefaßte Sprachsynthesizer-Steuereinheit VC umfaßt einen Steuerspeicher (Steuer-ROM), welcher eine Serio von in Abhängigkeit verschiedener Steuersignale wie z.B. des BUSY-Signals abhängigen Anweisungen und eine Serie von Anweisungen für ein I/O-Interface enthält, einen Speicher für freien.Zugriff RAM 2, welcher als zeitweiliger Speicher oder Zähler zum Speichern oder Zählen der extern eingegebenen Wortcodes und Adreßinformatlon in Verbindung mit dem Tondatenspeicher für die Sprachsynthese verwendet wird, und einen Tondatenspoicher (Daten-ROM), in welchem zuvor abgespeicherte synthetische Lautdaten (Phonem-Daten) für synthetische Sprache abgespeichert sind. Je nach Art und Umfang der zuvor im Lautdatenspeicher abgespeicherten Wörter kann der Sprach-Synthesizer für die verschiedensten Zwecke eingesetzt werden, und zur Erhöhung des Vokabulars kann die Länge bzw. der Umfang des Lautdatenspeichers,erweitert werden.

Ein Programmzähler spezifiziert einen bestimmten Programmschritt des Steuerspeichers 1, und ein Register SP speichert zeitweilig die Inhalte des Programmzählers P. Ein

130038/0970

• * m «

TER MEER · MÜLLER · STEINMEISTER Sharp 1542-GER-K

- 12 -

Befehlsdekodierer 4 dekodiert den Ausgang des Steuerspeichers 1, und eine Rechen- und Logik-Einheit ALU 5 führt Rechen- und logische Operationen an Signalen des Speichers 1, eines Akkumulators 6 und des RAM 2 durch. Der Akkumulator 6 speichert zeitweilig die von den einzelnen Speichern, der Einheit 5 oder einer äußeren Quelle kommenden Steuersignale und Daten und setzt oder rücksetzt als Ergebnis seiner Operationen ein Flag 7 (Cu. Z) An die erwähnten Adreßbusse AO, und BO. sind zwei die Adreßdaten bezüglich des Lautdatenspeichers 3 für eine Weile haltende Adreßpuffer 8 und 9 (PA,PB) angeschlossen. Nach im Steuerspeicher 1 enthaltenen Aweisungen hält ein Ausgangspuffer 10 Signale eine Weile/ die über den Ausgang CO. abzugeben sind, und ein Eingangspuffer 11 hält für eine Weile Signale oder Daten, die über den Eingang N__Ni ankommen. Extern zugeführte Steuersignale und Daten gehen in einen Eingangspuffer 12. Mit jedem über 0_g zugeführten Signal nimmt der Eingangspuffer 12 bei S zugeführte Daten auf und schiebt die Inhalte in einen Puffer S, und zwar S-mal, um alle 8-Bit-Daten in den Puffer S zu bringen. Eine Zählergruppe 13 enthält Ausgangspuffer zum zeitweiligen Halten von Lautdaten, einen setzbaren Zähler und PWM-(Impulsbreitenmodulation)Ausgangszähler, die nachstehend in Verbindung mit Fig. 5 und 6 näher erläutert werden.

In einen Ausgangspuffer 130 gehende Lautdaten werden dem Ausgang DO. und einem vorsetzbaren Zähler 131 zugeführt, von denen letzterer bei Aufnahme des Ausgangs eines Frequenz· teilers 15 abwärtszählt und bei Erreichen des Zählwertes "Null" ein Ausgangssignal an einen PW-Puffer 133 (PW=Impulsbreitenmodulation) abgibt. Synchron mit einem 1 MHz-Signal des Teilers 15 werden die in den Zähler 131 kommenden Lautdaten erniedrigt. Bei Erkennung von "Null" liefert ein

130038/0970

TER MEER . MÜLLER · STEINMEISTER Sharp 1542-GER-K

Nulldetektor 132 dem PW-Ausgangspuffer 133 ein Ausgangssignal. Die in Fig. 6 dargestellte Form der Impulsbreitenmodulation-Ausgänge werden trotz festgelegter Abtastfrequenz (16kHz) in jedem Intervall bezüglich der Länge von "1" oder "0" moduliert. Diese Signale werden einfach über ein Tiefpaßfilter gegeben und so in Analogsignale umgesetzt. Ein Bezugssignalgenerator 14 mit eingebautem Quarzoszillator liefert ein Bezugssignal als Taktsignal an die Zähler 13 und die Verknüpfungsstelle zwischen den Teilern 15 und 16. Ferner liefert ein Systemtaktgenerator 17 Systemtaktimpulse φ* und φ~· Ein 4-Bit-Speicher X speichert die 4-Bit-Inhalte des Adreßpuffers 8 (PA) des Lautdatenspeichers 3 auf halbfeste Weise, um in unten beschriebener Weise die Adressierung des Lautdatenspeichers zu beschleunigen. Ein Daten-Bus DB₁ dient als gemeinsamer Datenweg zwischen den einzelnen Puffern, RAM 2, ALU 5 und dem Lautdatenspeicher 3. Ein zweiter Daten-Bus DB_ dient der Datenübertragung zwischen dem Akkumulator 6, RAM 2 und ALU 5. Der mit DB. verbundene Anschluß EO. dient der beiderseitigen Datenübertragung von und zum externen Speicher.

Beim betriebsmäßigen Ablauf wertet der Steuerspeicher (Steuer-ROM) Startadressen, zu denen die oben erwähnten Wortcodes eine bestimmte Beziehung haben, nach den in den RAM 2 gespeisten Wortcodes aus und stellt den Adreßpuf feritPA und PB eine entsprechende Adreßinformation zu. Die durch diese Adreßpuffer PA, PB adressierten Inhalte des Lautdatenspeichers, d.h. die Wortstartadressen befinden sich in einem gewünschten Abschnitt von RAM. Diese Startadresse ist die Anfangsadresse jeder beliebigen Sprach-

130038/0970

TER MEER . MÜLLER ■ STEINMEISTER " -Sharp 1542-GER-K

synthese-Folge, und diese Folge wir# erfaßt und in ähnlicher Weise dem RAM zugeführt. Anschließend werden gemäß dieser erfaßten Synthese-Folge eine bestimmte Anzahl von Fragmenten der Grundlautinformation kombiniert und so abgewandelt, daß als Ergebnis quantilisierte Lautsignale wiedergegeben und mit der Abtastfrequenz an einen Lautausgangspuffer 18 abgegeben werden .

Wie erwähnt ist die Wortlänge (pro Schritt) des Steuer-Speichers 1 18 Bits läng und enthält 100 Operationsschritte, während die Wortlänge des Lautdatenspeichers 3 8 Bits lang ist (pro Schritt) und einige 1000 Schritte (Byte) enthält. Dieses besondere Kennzeichen (bezüglich der Bit-Länge und/ oder Schritte) ermöglicht die Sprachsynthese mit erhöhter Geschwindigkeit.

Je größer die Bit-Länge in jedem der Schritte des Steuerspeichers 1 (Steuer-ROM) ist, um so mehr Prozesse können in jedem der Schritte durchgeführt werden. Auf diese Weise können beliebig viele Operationen ohne Erhöhung der Systemtaktfrequenz in einem gegebenen Zeitraum ausgeführt werden. Beim Lautdatenspeicher 3 erübrigt sich eine Erhöhung der Bit-Länge bei jedem Schritt. Mit anderen Worten: Die Bit-Länge jedes Schrittes ist ausreichend bemessen, um die oben erwähnten Startadressen, Sprachsynthese-Folgen und Grundlautinformationen darin unterzubringen. Folglich kann der Lautdatenspeicher 3 die gleiche Bit-Länge wie der erweiterte Allzweckspeicher haben. Daraus ergibt sich der Vorteil, daß die Adressierung und der Bezug der Daten aus dem Lautdatenspeicher 3 und einem äußeren oder Hilfs-Lautdatenspeicher in gleicher Weise erfolgen kann.

130 038/0970 ORIGINAL

TER MEER · MÜLLER ■ STEINMEISTER Srtrar^ "1 542-GER-K

Der äußere Zusatzspeicher muß nicht ein ROM sein, es kann auch ein mit extern zugeführten Lautdaten gefüllter und durch eine Batterie gestützter RAM benutzt werden. Durch geeignete Auswahl zugesetzter Lautdaten kann jede gewünschte Art synthetischer Sprache mit Erfolg wiedergegeben werden.

130038/0970

Claims

TER MEER - MÜLLER - STEINMEISTER Beim EuropSlachen Patentamt zugelassene Vertreter Prof. Representatives before the European Patent Office - Mandalalree agrees pres !'Office ouropeen des brevets Dipl.-Chem. Dr. N. ter Meer Dipl.-Ing. H. Steinmeister Dipl.-Ing. F. E. Müller .... Triftetrasse 4, S.ekerwall?, D-8000 MÜNCHEN 22 D-4800 BIELEFELD 1 Case: 1542-GER-K MÜ/Gdt/Tß/kü 29. Dezember 1980 SHARP KABUSHIKI KAISHA 22-22 Nagaike-cho, Abeno-ku , Osaka 545 / Japan Sprachsynthesizer Priorität: 27. Dezember 1979, Japan, No. 54-170857/1979 PATENTANSPRÜCHE

1.) Spiiach-Synthesizer,

dadurch gekennzeichnet, daß ein erster Speicher (1) zur Speicherung einer Anzahl von Informationsfragmenten für die Erzeugung synthetischer Sprache und ein zweiter Speicher (3) zur Speicherung von Steuerbefehlen, die für die Erzeugung synthetischer Sprache aus den in dem ersten Speicher enthaltenen Informationsfragmenten erforderlich sind, in einem einzigen integrierten Halbleiterchip (VC) enthalten sind.

130038/0970

meer - Müller · Steinmeister ** .:..:.. "-«sharp 1542-GER-K

2. Sprach-Synthesizer nach Anspruch 1,

dadurch gekennzeichnet, daß der erste Speicher (1) einen äußeren Anschluß für eine Erweiterung seiner Speicherkapazität hat.

3. Sprach-Synthesizer nach Anspruch 1,

dadurch gekennzeichnet, daß der erste Speicher (1) für eine längere Einzelwortlänge als der zweite Speicher (3) eingerichtet ist.

4. Sprach-Synthesizer nach Anspruch 1,

dadurch gekennzeichnet, daß der erste Speicher ein adressierbarer Steuerspeicher (1) ist, in dem eine Anzahl von aufeinanderfolgend wiederzugebenden Fragmenten von Lautinformation als feste Programmanweisungen gespeichert sind.

5. Sprach-Synthesizer nach Anspruch 1 oder 4, dadurch gekennzeichnet, daß der zweite Speicher ein adressierbarer Datenspeicher (3) ist, in dem auf festgelegte Art Lautdaten wie Phoneminformationen (Laute) oder Lautgruppen-Informationen als Grundlage der Sprachsynthese und ferner Befehlsdaten, die für Abwandlungsoperationen wie Abläufe in bezug auf Datenauswahl, auf gewählte Zeitabstände und/oder eine Anzahl von Wiederholungen erforderlich sind, gespeichert sind.

6. Sprach-Synthesizer nach Anspruch 4 oder 5,

dadurch gekennzeichnet, daß der adressierbare Steuerspeicher (1) und der adressierbare Datenspeicher (3) mit einem adressierbaren Prozeßspeicher (z.B.MPU) operativ verbunden sind, um für die Sprachsynthese notwendige zeitlich begrenzte Speicher- und Rechenoperationen durchzuführen.

130038/0970