DE3912714A1 - Elektronische sprachausgabe-vorrichtung - Google Patents

Elektronische sprachausgabe-vorrichtung

Info

Publication number
DE3912714A1
DE3912714A1 DE3912714A DE3912714A DE3912714A1 DE 3912714 A1 DE3912714 A1 DE 3912714A1 DE 3912714 A DE3912714 A DE 3912714A DE 3912714 A DE3912714 A DE 3912714A DE 3912714 A1 DE3912714 A1 DE 3912714A1
Authority
DE
Germany
Prior art keywords
output
word
block
memory
announcement
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
DE3912714A
Other languages
English (en)
Inventor
Yumi Sakamoto
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Seiko Epson Corp
Original Assignee
Seiko Epson Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Seiko Epson Corp filed Critical Seiko Epson Corp
Publication of DE3912714A1 publication Critical patent/DE3912714A1/de
Ceased legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/06Elementary speech units used in speech synthesisers; Concatenation rules
    • G10L13/07Concatenation rules

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Electric Clocks (AREA)

Description

Die Erfindung betrifft eine elektronische Sprachausgabe- Vorrichtung, die geeignet ist, Zahlen in Sprachform auszu­ geben und insbesondere die Audio-Übersetzung in solch einer Vorrichtung.
Bei herkömmlichen elektronischen Sprachausgabe-Vorrichtun­ gen werden jeweils Blöcke von Sprachdaten von gesonderten Sprachdatenspeichern gespeichert und ausgegeben. Als Bei­ spiel einer herkömmlichen elektronischen Sprachausgabe-Vor­ richtung sei hier die japanische Gebrauchsmusterveröffent­ lichung Nr. 4239/88 erwähnt, die ein System für die Zeitan­ sage in japanischer Sprache in einer elektronischen Uhr be­ schreibt. Dieses System hat zwei "ju" (zehn) Codes, um die Zahlen der Zehnerstellen auszugeben, von denen es entweder den einen oder den anderen Code, abhängig von der Zahl der Zehnerstelle, verwendet. Für die Zahlen 20 bis 50 wird der­ selbe "ju" Code für alle Blöcke gemeinsam verwendet, wäh­ rend für die Stunden- und Minutenzahlen ausnahmslos spe­ zielle Codes verwendet werden.
Allerdings wird für die Bereitstellung verschiedener Sprachcodes für die Stunden- und Minutenzahlen eine be­ trächtliche Speicherkapazität benötigt, die einen großen Chip bedingt und zu einem teuren IC Entwurf führt. Zusätz­ lich müssen die Sprachdaten komprimiert werden, damit sie in einem Speicher beschränkter Kapazität gespeichert werden können. Da der Umfang der Sprachdaten und die Tonqualität eng miteinander verbunden sind, führt dieses Erfordernis unvermeidlich zu einer Verschlechterung der Tonqualität bis hin zur kommerziellen Unverwertbarkeit. Dies trifft beson­ ders auf die deutsche und die spanische Sprache zu. Wegen ihrer linguistischen Natur wird für diese Sprachen eine große Menge an Daten benötigt, damit sie als Medium für die elektronische Sprachausgabe verwendet werden können. Das System der japanischen Gebrauchsmusterveröffentlichung Nr. 4 239/88, bei dem eine gemeinsame Nutzung gespeicherter Da­ ten nur für Ausgaben derselben Zehnerstelle stattfindet, ist in Kleinuhrgröße nicht gut realisierbar.
Wenn eine Zeitansage in Deutsch ausgeführt werden soll, werden jeweils für die Stunden- und die Minutenzahlen ge­ trennte Aufbereitungs-Wörterbücher vorgesehen. Die benö­ tigte Datenmenge entspricht dann ungefähr 48 Wörtern und 50 Sekunden, auch wenn die Wortteile "-zig" und "-zehn" einmal gespeichert und für verschiedene Wortkombinationen gemein­ schaftlich verwendet werden, wie das japanische "ju" in der japanischen Gebrauchsmusterveröffentlichung Nr. 4 239/88. Geht man von diesen Daten mit einer Bitrate von 6 Kbit/s aus, so benötigt man eine Speicherkapazität von nahezu 300 Kbit.
Dies ist auch der Grund, warum Anwender, die nur 170 Kbit zur Verfügung hatten, gezwungen waren, sich entweder mit einer schlechteren Tonqualität abzufinden oder die Kom­ merzialisierung des Systems aufzugeben.
Aufgabe der Erfindung ist es, eine elektronische Sprachaus­ gabe-Vorrichtung zu schaffen, bei der Sprachdaten wirkungs­ voller gemeinschaftlich genutzt werden und dadurch die Größe und die Kosten der Vorrichtung verringert werden. Außerdem soll eine in Tonqualität und Natürlichkeit hoch­ entwickelte Ansage verwirklicht werden, die auch solche Wörter ausgeben kann, die relativ lang sind und daher viel Zeit benötigen.
Diese Aufgabe wird erfindungsgemäß durch eine elektronische Sprachausgabe-Vorrichtung gemäß den Merkmalen des Patentan­ spruchs gelöst.
Ein Ausführungsbeispiel der Erfindung wird nachfolgend an­ hand der Zeichnungen näher erläutert. Es zeigen:
Fig. 1 ein Blockdiagramm, das eine elektronische Sprachausgabevorrichtung gemäß der Erfindung zeigt,
Fig. 2 ein Hardware-Blockdiagramm einer elek­ tronischen Zeitansageuhr, die ein Ausfüh­ rungsbeispiel der elektronischen Sprach­ ausgabevorrichtung gemäß der Erfindung darstellt,
Fig. 3 ein Flußdiagramm, das den Ablauf der Zeitansage in deutscher Sprache zeigt,
Fig. 4 und 5 den Aufbau des Sprachdatenspeichers zur Ausgabe von zweistelligen Zahlen bzw. die Ausführung einer Zeitansage in Deutsch,
Fig. 6 ein Flußdiagramm, das den Ablauf der Zeitansage in englischer Sprache zeigt,
Fig. 7 und 8 den Aufbau des Sprachdatenspeichers zur Ausgabe von zweistelligen Zahlen bzw. die Ausführung einer Zeitansage in Englisch,
Fig. 9 ein Flußdiagramm, das ein Ausgabebeispiel zeigt, in dem eine Summe in Sprachform in Deutsch ausgegeben wird,
Fig. 10 und 11 den Aufbau des Sprachdaten­ speichers zur Ausgabe von zweistelligen Zahlen bzw. zur Durchführung der vier Grundrechenarten in Spanisch, und
Fig. 12 bis 14 Flußdiagramme, die den Ablauf der Ausgabe der Rechenschritte der vier Grundrechenarten in Spanisch zeigen.
Es ist bekannt, daß, anders als im Japanischen, bei der Zeitansage für die Stunden und die Minuten in vielen Spra­ chen in den meisten Fällen die gleichen Wörter verwendet werden. Während die Zahl "4", zum Beispiel, im Japanischen als "yo" für die Stundenansage und als "yon" für die Minu­ tenansage ausgesprochen wird (verschiedene Aussprachen der­ selben Zahlen), werden im Englischen, Deutschen und Spani­ schen "four", "vier" bzw. "cuatro" immer gleich ausgespro­ chen. Allerdings ändert sich der Tonfall bei diesen Zahlen im Englischen, Deutschen und Spanischen, je nachdem, ob sie vor oder nach einem anderen Wort stehen. Dies sei am Bei­ spiel der deutschen "vier" erläutert.
Angenommen, die Zeit "4 : 04" (vier Uhr vier) soll angesagt werden. In diesem Fall ist der Tonfall bei der ersten "vier" ansteigend, da ein weiteres Wort folgt, nämlich "Uhr". Diese "vier" mit ansteigendem Tonfall sei als "vier­ 1" bezeichnet. Andererseits ist der Tonfall bei der letzten "vier" für die Minutenansage abfallend. Die "vier" mit ab­ fallendem Tonfall sei als "vier-2" bezeichnet. Als nächstes soll die Zeitansage "4 : 24" (vier Uhr vierundzwanzig) be­ trachtet werden. Für die Stundenansage wird die oben ge­ nannte "vier-1" benutzt, da hier das Wort "Uhr" folgt. An­ ders als im oben beschriebenen Fall wird aber für die Minu­ tenansage nicht "vier-2" verwendet, deren Tonfall abfallend ist, sondern "vier-1", also mit ansteigendem Tonfall, da hier der Wortteil "-undzwanzig" folgt.
Genau genommen sollte es einen gewissen Unterschied zwi­ schen der "vier-1" für die Stundenansage einerseits und für die Minutenansage andererseits geben, da sie im ersteren Fall keinem Wort folgt, während sie im letzteren Fall hin­ ter einem anderen Wort steht. Da bei einer Zeitansage in einer Uhr die Deutlichkeit der Ansage wichtig ist, muß die­ ser Unterschied aber nicht notwendigerweise berücksichtigt werden. Bei der deutschen Sprache ist der Deutlichkeitsgrad ziemlich niedrig, wenn die zehnerstellenzahl der Minutenan­ sage 2 oder mehr ist, verglichen zu 1 oder 0. Versuche ha­ ben gezeigt, daß die Deutlichkeit verbessert werden kann, wenn eine tonlose Zeitspanne von einigen zehn bis einigen hundert ms Dauer nach der Ansage von "Uhr" vorgesehen wird und die Ausgabe eines Worts mit einem stark betonten An­ fang, wie er bei der Stundenansage verwendet wird, folgt, was überdies den Ton natürlicher werden läßt. Demgemäß wird in diesem Fall "vier-1" als "4" verwendet, die von "-und­ zwanzig" gefolgt wird.
Ebenso kann das Wort "zwanzig" sowohl für die Stundenansage als auch für die Minutenansage verwendet werden. Beispiels­ weise sei der Fall betrachtet, daß die Uhrzeit 20 : 20 (zwan­ zig Uhr zwanzig) ausgegeben werden soll. Das Wort "zwanzig" besteht aus den zwei Wortsilben "zwan" und "zig", von denen die letztere auch für das "zig" in "vierzig", "fünfzig", etc benutzt werden kann. Bei der Ausgabe der Stundenansage wird zuerst "zwan" ausgegeben und dann die Endung "zig", deren Tonfall ansteigt, da sie von "Uhr" gefolgt wird. Die­ ses "zig" sei als "zig-1" bezeichnet. Andererseits wird bei der Ausgabe der Minutenansage dasselbe "zwan" verwendet wie auch für die Stundenansage, damit ein hoher Deutlichkeits­ grad gewährleistet ist. Der nachfolgend ausgegebenen Wort­ endung "zig" folgt kein Wort, so daß in diesem Fall "zig­ 2", dessen Tonfall abfallend ist, verwendet wird. Dies gilt auch für die Zahlen 13 bis 19, zum Beispiel bei einer Zeit­ ansage "18 : 18" (achtzehn Uhr achtzehn).
Wie oben beschrieben, können demgemäß "vier-1" und "zwan" im Gemeinschaftsspeicher für die Stunden und Minuten ge­ speichert werden, die Endung "zig" im Wortendungs-Speicher, und "Uhr" in einem Meldungsspeicher. Ein Stellenauswähl- Sprachspezifizierungs-Speicher wählt die Zahlen, die für die anzusagende Zeit benötigt werden, sowie den jeweiligen Speicher und die Sprachdaten, mit denen die Zeitansage ge­ macht werden soll. Dadurch ist es möglich, Sprachdaten in hohem Ausmaß gemeinsam zu verwenden, somit eine Zeitansage mit guter Tonqualität und mehr Natürlichkeit zu verwirkli­ chen und gleichzeitig einen Speicher mit einer kleineren Kapazität zu verwenden.
Zur Erläuterung eines Ausführungsbeispiels der Erfindung sei im folgenden zunächst auf Fig. 2 Bezug genommen. Das in Fig. 2 dargestellte Ausführungsbeispiel enthält einen Microcomputer 200, eine Sprachsyntheseschaltung 201, einen Verstärker 212, einen Lautsprecher 213 und einen Schalter 206. Der Microcomputer 200 enthält einen Oszillator 202, einen Frequenzteiler 203, eine Steuerschaltung 204, eine Eingangsschaltung 205, eine Ausgangsschaltung 209, ein ROM 207 und ein RAM 208. Der Schalter 206 dient bei diesem Aus­ führungsbeispiel dazu, eine Zeitanzeige auszulösen. Wenn der Schalter 206 eingeschaltet wird, erfolgt nach Maßgabe von im ROM 207 des Microcomputers 200 gespeicherten Proze­ duren eine Datenspezifizierung zur Sprachausgabe für die Sprachsyntheseschaltung 201. Die Sprachsyntheseschaltung 201, die in Form eines IC ausgebildet sein kann, enthält einen Sprachdatenspeicher 210, einen Digital-Analog-Umset­ zer 214, eine Eingangs/Ausgangsschaltung, etc. Die Sprach­ syntheseschaltung führt unter der Steuerung durch den Microcomputer 200 eine Sprachsynthese aus und liefert das Ergebnis an den Lautsprecher 213.
Unter Bezugnahme auf das Flußdiagramm von Fig. 3 soll nach­ folgende die Arbeitsweise des Microcomputers 200 bei der Ausgabe der im ROM 207 gespeicherten Sprachdaten beschrie­ ben werden. Dies erfolgt am Beispiel einer Zeitansage in deutscher Sprache.
Die Fig. 4 und 5 zeigen den Aufbau des Sprachdatenspeichers 210 für eine Zeitansage in Deutsch. Der Speicher 210 ist in Tabellen D 1 bis D 6 unterteilt. Die Daten der Tabellen D 1 und D 2 werden gemeinschaftlich sowohl für die Stunden- als auch die Minutenansage verwendet. Die Daten der Tabelle D 3 werden ausschließlich bei der Minutenansage benutzt. Die Wörter in den Tabellen D 4 und D 5 werden als Endungen der Wörter der Tabelle D 2 ausgegeben. Die Wörter "zig-1" und "zig-2" bzw. "zehn-1" und "zehn-2" stellen jeweils die gleichen Wörter mit unterschiedlicher Betonung dar. "zig-1" und "zehn-1" werden für die Stundenansage benutzt, während "zig-2" und "zehn-2" bei der Minutenansage ausgegeben werden.
Das Flußdiagramm von Fig. 3 zeigt, wie eine Zeitansage in Deutsch im 24-Stunden-System unter Verwendung der Daten ge­ mäß Fig. 3 bis 5 erfolgt. Die Sprachausgabe-Vorrichtung be­ ginnt zu arbeiten, wenn der Schalter 206 eingeschaltet und ein hier als H-Wert bezeichnetes Potential an die Eingangs­ schaltung 205 angelegt wird.
Als erstes erfolgt im Schritt 300 die Entscheidung, ob die Stundenzahl im Bereich von 0 bis 12 liegt. Ist dies der Fall, dann erfolgt eine Wortspezifikation mit dem Ziel, das der Stundenzahl entsprechende Wort von der Tabelle D 1 des Sprachdatenspeichers 210 auszugeben. Ist die Zeit bei­ spielsweise 4 Uhr, wird im Schritt 301 das Wort VIER in Ta­ belle D 1 spezifiziert und ausgegeben. Liegt die Stundenzahl im Bereich von 13 bis 19, ergibt also die Entscheidung in Schritt 300 NEIN und die darauffolgende Entscheidung im Schritt 302 JA, dann erfolgt eine Wortspezifikation mit dem Ziel, das der Stundenzahl entsprechende Wort von der Ta­ belle D 2 des Sprachdatenspeichers 210 auszugeben. Ist es beispielsweise 13 Uhr, wird im Schritt 303 das Wort "drei-" spezifiziert und ausgegeben. Nachfolgend wird das Wort "zehn" ausgegeben. Dieses Wort stellt die Endung für alle den Zahlen 13 bis 19 entsprechenden Wörter dar. Da es sich um die Stundenansage handelt, wird im Schritt 304 "zehn-1" spezifiziert und ausgegeben. Wenn die Stundenzahl 20 be­ trägt, die Entscheidung im Schritt 302 also NEIN und die darauffolgende im Schritt 305 JA lautet, wird im Schritt 306 der entsprechende Wortbestandteil "zwan" von Tabelle 2 ausgewählt und ausgegeben. Nachfolgend wird im Schritt 307 die Endung "zig" ausgegeben. Da im Moment die Stundenan­ zeige betrachtet wird, wird "zig-1" spezifiziert und ausge­ geben. Ergibt die Entscheidung im Schritt 305 NEIN, dann liegt die Stundenzahl im Bereich von 21 bis 23. In diesem Fall wird im Schritt 308 zunächst die Einerstelle aus der Tabelle D 1 ausgelesen. Dann folgt im Schritt 309 das Wort "und". Die Zehnerstelle, nämlich zwei, wird im Schritt 310 entsprechend Tabelle D 2 als "zwan" ausgegeben. Danach wird im Schritt 311 die Endung "zig" spezifiziert und ausgege­ ben. Da es sich um die Stundenansage handelt, wird das "zig" als "zig-1" ausgegeben. Anschließend wird im Schritt 312 das Wort "Uhr", das dem japanischen "ji" entspricht, ausgegeben, und die Prozedur geht weiter zur Minutenansage.
Beträgt die Minutenzahl 0, dann ist nichts auszugeben, so daß der Ablauf im Schritt 313 beendet wird. Liegt die Minu­ tenzahl dagegen im Bereich von 1 bis 12, dann ergibt die Entscheidung im Schritt 314 JA. Im Schritt 315 wird dann das die Minutenzahl darstellende Wort in der ausschließlich für die Minutenansage vorgesehenen Tabelle D 3 spezifiziert und ausgegeben. Ergibt hingegen die Entscheidung im Schritt 314 NEIN und diejenige im darauffolgenden Schritt 316 JA, liegt also die Minutenzahl im Bereich von 13 bis 19, dann wird im Schritt 317 die Tabelle D 2 benutzt, die gemein­ schaftlich sowohl für die Stundenansage als auch für die Minutenansage vorgesehen ist. Im Schritt 317 wird zunächst die Einerstelle ausgegeben und dann im Schritt 318 von der Endung "zehn" gefolgt. Da es sich jetzt um die Minutenan­ sage handelt, wird "zehn-2" mit der für die Minutenansage zutreffenden Betonung spezifiziert und ausgegeben.
Ergibt die Entscheidung im Schritt 316 NEIN, wird im Schritt 319 geprüft, ob die Einerstelle der Minutenzahl 0 ist. Wenn dies der Fall ist, handelt es sich bei der Minu­ tenzahl um 20, 30, 40 oder 50. Dann wird die für Stunden und Minuten gemeinsam vorhandene Tabelle D 2 verwendet. Im Schritt 320 wird in dieser Tabelle das die Zehnerstelle der Minutenzahl repräsentierende Wort spezifiziert und ausgege­ ben. Nach Prüfung im Schritt 321, ob die Minutenzahl 30 be­ trägt oder nicht, wird im Schritt 322 bzw. 323 "ßig" oder "zig" ausgegeben. Da es sich hier um die Minutenausgabe handelt, wird "ßig-2" bzw. "zig-2" spezifiziert und ausge­ geben.
Ergibt die Entscheidung im Schritt 319 NEIN, dann ist die Minutenzahl eine der Zahlen 21 bis 29, 31 bis 39, 41 bis 49 und 51 bis 59. Anders als beim Schritt 315 ist dann die Be­ tonung des die Einerstelle repräsentierenden Worts, das zu­ erst ausgegeben wird, ähnlich derjenigen, wie sie bei der Stundenansage verwendet wird. Deshalb wird hier im Schritt 324 von Tabelle D 1, die auch für die Stundenzahlen benutzt wird, Gebrauch gemacht. Das der Einerstelle der Minutenzahl entsprechende Wort wird in Tabelle D 1 spezifiziert und aus­ gegeben. Im Schritt 325 wird dann das Wort "und" ausgege­ ben. Ihm folgt das Wort, das der Zehnerstelle der Minuten­ zahl entspricht. Dafür wird von der gemeinschaftlich für Stunden und Minuten benutzten Tabelle D 2 Gebrauch gemacht. In den Schritten 327 bis 329 wird dann die Endung für die Minutenzahl in Form von "ßig-2" bzw. "zig-2" ausgegeben.
Anders als im Englischen und Spanischen, wird im Deutschen bei zweistelligen Zahlen zuerst die Einerstelle angegeben. Daraus läßt sich schließen, daß die Ausgabe einstelliger Zahlen drei verschiedene Arten einstelliger Zahlen erfor­ dert, nämlich solche für die Stundenzahlen, solche für die Minutenzahlen 1 bis 9 und solche für die Minutenzahlen 21 bis 29, 31 bis 39, 41 bis 49 und 51 bis 59. Die Betonung der Wörter entsprechend beispielsweise den Minutenzahlen 21 bis 29 ist jedoch den entsprechenden Wörtern der Stunden­ zahlen sehr ähnlich, da ihnen der Zehnerstellenbestandteil folgt. Daher können bei der vorliegenden Erfindung diesel­ ben Sprachdaten verwendet werden, wie auch für die Stunden­ zahlen, was zu einer erheblichen Verbesserung der Speicher­ effizienz führt.
Als nächstes sei die Zeitansage in englischer Sprache be­ trachtet. Es sei wieder angenommen, daß die Zeit "4 : 04" (four o four) ausgegeben werden soll. Das erste "four" der Stundenzahl muß eine Betonung haben, wie sie bei einem Wort angebracht ist, dem ein anderes Wort folgt, in diesem Fall das Wort "o". Das letzte "four" braucht eine Betonung wie ein Wort am Ende eines Satzes. Unterschiedliche Wörter müs­ sen also für das "four" als Stundenzahl einerseits und als Minutenzahl andererseits vorgesehen werden.
Als nächstes sei der Fall betrachtet, daß die Zeit "13 : 13" (thirteen thirteen) ausgegeben werden soll. Das erste "thirteen", also dasjenige, das die Stunde bezeichnet, braucht einen ansteigenden Tonfall, da ihm die Minutenzahl folgt, während das letztere, also das der Minutenzahl, eine abfallende Betonung benötigt, da es die Ansage abschließt. Für die beiden "thirteen" sollten also unterschiedliche Wörter verwendet werden. Wie bei der deutschen Sprache, ha­ ben Experimente jedoch ergeben, daß eine Pause von einigen ms Dauer zur Verbesserung der Klarheit beiträgt. Derselbe Ton kann dann für die Komponente "thir-" verwendet werden, während der Betonungsunterschied ausschließlich in der Endung "teen" zum Ausdruck kommt. Als nächstes soll der Fall betrachtet werden, daß die zeit "21 : 21" (twenty-one twenty-one) ausgegeben werden soll. In diesem Fall kann aus gleichen Gründen wie oben derselbe Ton für die Komponente "twen-" verwendet werden. Der große Unterschied bei der Be­ tonung der Stundenzahl einerseits und der Minutenzahl ande­ rerseits macht es indes unmöglich, denselben Ton für die Komponente "ty" zu verwenden, obwohl in beiden Fällen das "ty" von einem Wort gefolgt wird.
Die Fig. 7 und 8 zeigen den Aufbau des Sprachdatenspeichers 210 für den Fall einer Zeitansage in Englisch. Der Speicher ist in sechs Blöcke, nämlich die Tabellen E 1 bis E 6 unter­ teilt. Von diesen Tabellen stellt die Tabelle E 1 einen Speicherblock ausschließlich für Stundenzahlen, die Tabelle E 3 einen Speicherblock ausschließlich für Minutenzahlen, und die Tabelle E 2 einen Speicherblock sowohl für Stunden­ zahlen als auch für Minutenzahlen dar. Die Tabellen E 4 und E 5 sind Speicherblöcke zur Speicherung von Wörtern, die als Endungen für die Wörter in Tabelle E 2 verwendet werden. Die Wörter "teen-1" und "teen-2", "ty-11" und "ty-21" bzw. "ty­ 12" und "ty-22" sind jeweils dieselben Wörter mit unter­ schiedlicher Betonung. "teen-1", "ty-11" und "ty-12" der Tabelle E 4 werden für die Ausgabe von Stundenzahlen, "teen­ 2", "ty-21" und "ty-22" der Tabelle E 5 für die Ausgabe von Minutenzahlen verwendet. "ty-11" und "ty-21" werden be­ nutzt, wenn die Minutenzahl bzw. Minuten-Einerstelle 0 ist, das heißt wenn die Zahl 20, 30, 40 oder 50 ausgegeben wer­ den soll. "ty-12" und "ty-22" werden verwendet, wenn die Minutenzahl im Bereich von 1 bis 9 liegt. Das Flußdiagramm von Fig. 6 zeigt den Prozeß zur Ausgabe der Sprachdaten der Fig. 7 und 8.
Nach dem Start wird zunächst im Schritt 600 geprüft, ob die Stundenzahl im Bereich von 1 bis 12 liegt. Ist dies der Fall, erfolgt eine Wortspezifikation mit dem Ziel, das der Zahl entsprechende Wort von der Tabelle E 1 auszugeben. Ist die Zeit beispielsweise 3 Uhr (three o′clock), wird im Schritt 601 das Wort THREE von der Tabelle E 1 ausgegeben. Ergibt die Entscheidung im Schritt 600 NEIN und die darauf­ folgende Entscheidung im Schritt 602 JA, liegt also die Stundenzahl im Bereich von 13 bis 19, dann wird im Schritt 603 das der Stundenzahl entsprechende Wort von der Tabelle E 2 im Sprachdatenspeicher 210 ausgegeben. Im Fall von "14 o′clock" wird beispielsweise das Wort "Four-" ausgegeben. Anschließend wird im Schritt 604 der Wortbestandteil "teen′" der die Endung für die Wörter der Zahlen 13 bis 19 darstellt, ausgegeben. Da es sich im betrachteten Fall um eine Stundenzahl handelt, wird im Schritt 604 "teen-1" aus­ gewählt. Ergibt die Entscheidung im Schritt 602 NEIN und die folgende Entscheidung im Schritt 605 JA, beträgt also die Stundenzahl zwanzig, dann wird im Schritt 606 der Wort­ bestandteil "Twen" von Tabelle E 2 ausgegeben. Ihm folgt im Schritt 607 die Endung "ty-11" für die Stundenzahl zwanzig. Ergibt die Entscheidung im Schritt 605 NEIN, dann liegt die Stundenzahl im Bereich von 21 bis 24. In diesem Fall wird im Schritt 608 der Wortbestandteil "Twen-" von Tabelle E 2 ausgegeben. Ihm folgt im Schritt 609 die Endung "ty-12" für die Stundenzahlen 21 bis 24. Danach wird im Schritt 610 von der Tabelle E 1 das Wort für die Einerstelle der Stundenzahl ausgegeben.
Im Schritt 611 wird dann entschieden, ob die Minutenzahl 0 ist und gegebenenfalls die Ausgabe beendet. Andernfalls er­ folgt nun die Ausgabe der Minutenzahl. Wenn diese im Be­ reich von 1 bis 9 liegt, die Entscheidung im Schritt 612 also JA ergibt, wird im Schritt 613 das Wort "o" ausgege­ ben, bevor im Schritt 614 das der Minutenzahl entsprechende Wort von der Tabelle E 3 ausgegeben wird. Wenn im Schritt 615 festgestellt wird, daß die Minutenzahl im Bereich von 10 bis 12 liegt, wird im Schritt 616 das der Minutenzahl entsprechende Wort von der Tabelle E 3 ausgegeben. Ist die Minutenzahl dagegen im Bereich von 13 bis 19, ergibt also die Entscheidung im Schritt 617 JA, dann wird das der Minu­ tenzahl entsprechende Wort im Schritt 618 aus der für Stun­ den und Minuten gemeinsam verwendeten Tabelle E 2 ausgegeben und dann im Schritt 619 die Endung "teen-2" für die Minu­ tenzahl angehängt. Ergibt die Entscheidung im Schritt 620, daß die Minutenzahl 20, 30, 40 oder 50 beträgt, wird im Schritt 621 das der Minutenzahl entsprechende Wort aus der Tabelle E 2 ausgegeben. Danach wird im Schritt 622 die Endung "ty-21" für die Zahlen 20, 30, 40 und 50 ausgegeben.
Ist das Ergebnis der Entscheidung im Schritt 620 NEIN, dann muß die Minutenzahl im Bereich von 21 bis 29, 31 bis 39, 41 bis 49 oder 51 bis 59 liegen. In diesem Fall wird das der Zehnerstelle entsprechende Wort aus der Tabelle E 2 ausgege­ ben. Danach wird die Endung "ty-22" im Schritt 624 ausgege­ ben, die einen anderen Tonfall als am Ende einer Ansage aufweist. Das der Einerstelle der Minutenzahl entsprechende Wort wird dann im Schritt 625 von der ausschließlich für die Minutenzahlen vorgesehenen Tabelle E 3 ausgegeben. Ob­ wohl beim beschriebenen Beispiel "ty-11" und "ty-12" bzw. "ty-21" und "ty-22" als unterschiedliche Wörter behandelt wurden, könnte man stattdessen auch ein einziges Wort speichern und für alle Fälle gemeinsam benutzen.
Ein Ausführungsbeispiel der Erfindung wurde voranstehend unter Anwendung auf die Zeitansage in Deutsch und Englisch beschrieben. Die Erfindung ist aber nicht auf eine solche Anwendung beschränkt. Vielmehr kann sie beispielsweise auch zur Ansage der zu zahlenden Summe bei einer Registrierkasse oder ähnlichem verwendet werden. Als Beispiel soll der Fall einer Sprachausgabe von Summen in Deutsch betrachtet wer­ den. Es sei angenommen, daß die Summe 23,54 DM (Dreiund­ zwanzig Mark vierundfünfzig) laut gelesen werden soll. Das Flußdiagramm von Fig. 9 verdeutlicht den Ablauf. Die ver­ wendeten Sprachdatenspeicher sind die in Fig. 4 und 5 ge­ zeigten, das heißt dieselben, die auch für die Zeitansage verwendet werden. In diesem Fall wird der Markbetrag in gleicher Weise wie die Stundenzahl und der Pfennigbetrag in gleicher Weise wie die Minutenzahl behandelt. Die Sprach­ ausgabe des Markbetrags ist wie folgt: Zuerst wird das Wort "DREI" von der Tabelle D 1 ausgelesen und ausgegeben (Schritt 900). Dann wird das Wort "und" ausgegeben (Schritt 901). Danach wird von Tabelle D 2 "zwan" ausgegeben (Schritt 902), dem die Endung "zig-1" mit ansteigendem Tonfall folgt (Schritt 903). Schließlich wird das Wort "Mark" ausgegeben (Schritt 904). Dann beginnt die Ausgabe des Pfennigbetrags. Als nächstes wird das Wort "VIER" von Tabelle D 1 ausgegeben (Schritt 905) und dann das Wort "und" (Schritt 906). Dann wird das Wort "fünf" von der Tabelle D 2 ausgegeben (Schritt 907), dem die Endung "zig-2" mit abfallendem Tonfall folgt (Schritt 908). Das Wort "Pfennig" braucht nicht ausgegeben zu werden.
Die Erfindung kann auch dafür eingesetzt werden, die von einem Computer ausgeführten Rechenschritte laut vorzulesen. Ein Beispiel in spanischer Sprache sei dafür im folgenden angegeben. Die Fig. 10 und 11 zeigen ein Wörterbuch spani­ scher Wörter, die für die vier Grundrechenarten verwendet werden, wenn die bei den Rechnungen verwendeten Zahlen na­ türliche Zahlen mit zwei Stellen oder weniger sind oder 0 betragen. Die Flußdiagramme der Fig. 12, 13 und 14 illu­ strieren den Ablauf der Sprachausgabe der vier Grundrechen­ arten im Spanischen unter Verwendung dieses Wörterbuchs. Es sei angenommen, die Operation: N 1+N 2=N 3 solle ausgege­ ben werden. N 1 und N 2 sind Zahlen eines Hauptblocks, wäh­ rend N 3 eine Zahl des letzten Blocks ist. Von den in Fig. 10 gezeigten Tabellen stellen die Tabelle Es 1 einen Daten­ speicher für den Hauptblock, die Tabelle Es 4 einen Daten­ speicher für den letzten Block und die Tabellen Es 2 und Es 3 gemeinsam verwendete Datenspeicher für alle Blöcke dar. Die in Fig. 11 gezeigten Tabellen Es 5, Es 6 und Es 7 sind Worten­ dungsspeicher. Das Flußdiagramm von Fig. 12 verdeutlicht den Prozeß der Sprachausgabe von Rechenoperationen.
Da der Block N 1 als erster ausgegeben wird, erfolgt im Schritt 1200 die Ausgabe eines Hauptblocks nach Maßgabe der Ziffern der Zahl N 1. Wenn es sich bei dem als nächstes aus­ zugebenden Operator um etwas anderes als "=" handelt, die Entscheidung im Schritt 1201 also NEIN ergibt, wird nach Maßgabe des auszugebenden Operators eines der Wörter "mas", "menos", "por" oder "entre" ausgegeben (Schritte 1204, 1205, 1205, 1207, 1208, 1209 und 1210). Als nächstes wird im Schritt 1200 ein Hauptblock zur Ausgabe von N 2 ausgege­ ben. Danach folgt die Ausgabe von "igual a" (Schritt 1202) , gefolgt von der Ausgabe des letzten Blocks (Schritt 1203). Das Flußdiagramm von Fig. 13 verdeutlicht die Abläufe im Schritt 1200 von Fig. 12. Wenn die Zahl des Hauptblocks im Bereich von 1 bis 10 liegt, wird das entsprechende Wort von der Tabelle Es 1 ausgegeben (Schritte 1300 und 1301). Wenn die Zahl im Bereich von 11 bis 15 liegt, wird ein entspre­ chendes Wort von der Tabelle Es 2 ausgegeben, gefolgt von einer Hauptblockendung "ce-1" (Schritte 1302 bis 1304). Wenn die Einerstelle der Zahl 0 ist, die Zahl also 20, 30, 40, 50, 60, 70, 80 oder 90 beträgt, dann wird das der Zeh­ nerstelle der Zahl entsprechende Wort von der Tabelle Es 2 ausgegeben. Ihm folgt die Ausgabe einer Hauptblockendung "ta-1" (Schritte 1305 bis 1307). Wenn sowohl die Zehner­ stelle als auch die Einerstelle der Zahl im Bereich von 1 bis 9 liegt, wie bei 21 bis 29 oder 31 bis 39, wird der der Zehnerstelle der Zahl entsprechende Wortbestandteil aus der Tabelle Es 3 ausgegeben und von einer Hauptblockendung "ta y-1" gefolgt. Der der Einerstelle der Zahl entsprechende Wortbestandteil wird dann von der Tabelle Es 1 ausgegeben (Schritte 1308 bis 1310).
Das Flußdiagramm von Fig. 14 verdeutlicht den Ablauf des Schritts 1203 in Fig. 12. Wenn die Zahl des letzten Blocks im Bereich von 1 bis 10 liegt, wird das zugehörige Wort von der Tabelle Es 4 ausgegeben (Schritte 1400 und 1401). Liegt die Zahl im Bereich von 11 bis 15, wird das entsprechende Wort von der Tabelle Es 2 ausgegeben und von einer Endung "ce-1" für den letzten Block gefolgt (Schritte 1402 bis 1404). Wenn die Einerstelle der Zahl 0 ist, die Zahl also 20, 30, 40, 50, 60, 70, 80 oder 90 beträgt, wird der der Zehnerstelle der Zahl entsprechende Wortbestandteil von der Tabelle Es 2 ausgegeben und von einer Endung "ta-2" für den letzten Block gefolgt (Schritte 1405 bis 1407). Wenn sowohl die Zehnerstelle als auch die Einerstelle der Zahl im Be­ reich von 1 bis 9 liegt wie bei 21 bis 29 oder 31 bis 39, wird der der Zehnerstelle entsprechende Wortbestandteil von der Tabelle Es 3 ausgegeben. Ihm folgt eine Endung "ta y-2" für den letzten Block. Das Wort für die Einerstelle der Zahl wird danach von der Tabelle Es 4 ausgegeben (Schritte 1408 bis 1410).
Im Fall der spanischen Sprache muß insbesondere das fol­ gende Problem berücksichtigt werden: Bei der Zahl 31 zum Beispiel, die "treinta y uno" gesprochen wird, sind das "ta" in "treinta" und das "y" eng verbunden. Außerdem soll­ ten für das "treinta" von 30 und das von 31 verschiedene Töne verwendet werden. Daher kann man davon ausgehen, daß das "ta" und "y" immer miteinander verbunden sind. Indem man also zwei grammatikalisch unabhängige Wörter als ein einziges Wort betrachtet, können sie von einem Microcompu­ ter oder ähnlichem als ein Wort anstelle von zwei Wörtern behandelt werden, wodurch der Prozeß vereinfacht wird.
Wie oben beschrieben, enthält eine elektronische Sprachaus­ gabe-Vorrichtung gemäß der Erfindung einen gemeinsam ver­ wendeten Speicher für alle Blöcke (Gemeinschaftsspeicher), einen Wortendungsspeicher und einen nur für einen einzelnen Block verwendeten Speicher (Einzelblockspeicher). Bei der Sprachausgabe einer Zahl entscheidet die Vorrichtung, ob eine jeweilige Ausgabe ein Hauptblock oder ein letzter Block ist, und spezifiziert die Speicherstelle, von der das der auszugebenden Zahl entsprechende Wort ausgewählt wird, abhängig von dem jeweiligen Blocktyp. Demzufolge können Sprachdaten effizient kodiert werden, was die Realisierung einer Audio-Wiedergabe mit besserer Tonqualität ermöglicht. Dies ist von besonderem Vorteil bei kleinen elektronischen Geräten, etwa bei Taschen- oder Armbanduhren mit Zeitan­ sage. Wegen der geringen Abmessungen dieser Geräte gibt es eine Grenze bezüglich Anzahl und Größe von ICs, die in einem solchen Gerät untergebracht werden können, was wie­ derum die Speichergröße begrenzt. Kompaktheit der Sprachda­ ten ist deshalb notwendige Voraussetzung für eine solche Vorrichtung. Da andererseits Klarheit und Tonqualität nicht vernachlässigt werden dürfen, können die Sprachdaten nicht beliebig kompakt gespeichert werden. Dies ist der Grund da­ für, daß es bisher unmöglich war, eine Audio-Uhr für lange Wörter oder ein großes Vokabular auf den Markt zu bringen, bei der die Sprache in einfacher Form wie bei herkömmlichen Audio-Uhren kodiert war. Die vorliegende Erfindung besei­ tigt dieses Problem, indem solche Wortabschnitte herausge­ sucht werden, die unter Berücksichtigung des Tons in einer Anzahl verschiedener Wörter auftreten. Solche Wortab­ schnitte werden erfindungsgemäß nur einmal gespeichert, um dann für verschiedene Wortkombinationen zur Verfügung zu stehen. Andere Wörter oder Töne, die sich nicht in dieser Weise mehrfach ausnutzen lassen, werden jeweils individuell kodiert und gesondert genutzt. Die trägt zu einer erhebli­ chen Verbesserung der Speichereffizienz bei und erlaubt es, eine elektronische Sprachausgabe-Vorrichtung zu schaffen und kommerziell zu verwerten, bei der das obige Problem nicht mehr auftritt, sondern bei der Ansage eine zufrieden­ stellende Tonqualität und Klarheit erreicht wird. Für die oben beschriebene Zeitansage in Deutsch beträgt die erfor­ derliche Sprachdatenmenge beispielsweise nur etwa 30 s, während eine Sprachdatenmenge von 50 bis 60 s erforderlich wäre, würde man die Stundenzahlen und die Minutenzahlen ge­ sondert speichern. Die Größe des ICs für eine elektronische Sprachausgabe-Vorrichtung gemäß der Erfindung kann demzu­ folge geringer sein, wodurch der Preis für das IC-Chip niedriger wird und in der Folge eine Uhr mit Audio-Zeitan­ sage billiger wird.

Claims (1)

  1. Elektronische Sprachausgabe-Vorrichtung mit einer Speichergruppe (3) zur Speicherung von Sprachdaten zur Aus­ gabe von Zahlen in Sprachform, wobei eine Zahlenfolge in eine Anzahl von Blöcken mit einem oder mehreren Haupt­ blöcken und einem letzten Block unterteilt ist, wie die Stunden und Minuten der Uhrzeit, die Sprachausgabe der Zahlen blockweise erfolgt, und die Blöcke, die ausgegeben werden sollen, durch Verbindungswörter miteinander verbun­ den werden, umfassend einen Gemeinschaftsspeicher (4) zum Speichern der Sprachdaten von Hauptblöcken und vom letzten Block, einen Wortendungs-Speicher (5) zum Speichern der Wortendungs-Sprachdaten der Wörter mit zwei oder mehr ver­ schiedenen Betonungsmustern für die Hauptblöcke und den letzten Block, einen Einzelblockspeicher (6) zum Speichern der Sprachdaten von Hauptblöcken oder vom letzten Block, eine Blockauswahl-Einrichtung (2), die bei der Sprachausga­ be den auszugebenden Block abhängig von Blocktyp und der auszugebenden Zahl aus dem Gemeinschaftsspeicher (4), dem Wortendungs-Speicher (5) oder dem Einzelblockspeicher (6) auswählt.
DE3912714A 1988-05-10 1989-04-18 Elektronische sprachausgabe-vorrichtung Ceased DE3912714A1 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP11301288 1988-05-10
JP63323067A JP3010630B2 (ja) 1988-05-10 1988-12-21 音声出力電子機器

Publications (1)

Publication Number Publication Date
DE3912714A1 true DE3912714A1 (de) 1989-11-23

Family

ID=26452041

Family Applications (1)

Application Number Title Priority Date Filing Date
DE3912714A Ceased DE3912714A1 (de) 1988-05-10 1989-04-18 Elektronische sprachausgabe-vorrichtung

Country Status (4)

Country Link
US (1) US5027409A (de)
JP (1) JP3010630B2 (de)
DE (1) DE3912714A1 (de)
GB (1) GB2218602A (de)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19518504A1 (de) * 1994-10-26 1996-05-02 United Microelectronics Corp Dynamisch programmierbare Ansage-Einrichtung

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2609752B2 (ja) * 1990-10-09 1997-05-14 三菱電機株式会社 音声/音声帯域内データ識別装置
US5649059A (en) * 1991-05-22 1997-07-15 Tendler Cellular, Inc. Alpha-numeric verbal scroll technique for use in an emergency location system
US5617478A (en) * 1994-04-11 1997-04-01 Matsushita Electric Industrial Co., Ltd. Sound reproduction system and a sound reproduction method
US7305243B1 (en) 1996-02-28 2007-12-04 Tendler Cellular, Inc. Location based information system
US6519463B2 (en) 1996-02-28 2003-02-11 Tendler Cellular, Inc. Location based service request system
US20030101045A1 (en) * 2001-11-29 2003-05-29 Peter Moffatt Method and apparatus for playing recordings of spoken alphanumeric characters
US20160179060A1 (en) * 2014-12-19 2016-06-23 Thony Chukwuemezie Anyiam Anyiams Voice Thermoa Watch
GB2559766A (en) * 2017-02-17 2018-08-22 Pastel Dreams Method and system for defining text content for speech segmentation

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE2525025B2 (de) * 1975-06-05 1980-05-14 Telefonbau Und Normalzeit Gmbh, 6000 Frankfurt Schaltungsanordnung zur Ausgabe akustischer Auskünfte
JPS634239Y2 (de) * 1984-03-22 1988-02-02

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3641496A (en) * 1969-06-23 1972-02-08 Phonplex Corp Electronic voice annunciating system having binary data converted into audio representations
US4214125A (en) * 1977-01-21 1980-07-22 Forrest S. Mozer Method and apparatus for speech synthesizing
JPS54127359A (en) * 1978-03-25 1979-10-03 Sharp Corp Voice watch
JPS5574600A (en) * 1978-11-30 1980-06-05 Sharp Kk Speech annunciation control system
JPH0833744B2 (ja) * 1986-01-09 1996-03-29 株式会社東芝 音声合成装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE2525025B2 (de) * 1975-06-05 1980-05-14 Telefonbau Und Normalzeit Gmbh, 6000 Frankfurt Schaltungsanordnung zur Ausgabe akustischer Auskünfte
JPS634239Y2 (de) * 1984-03-22 1988-02-02

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19518504A1 (de) * 1994-10-26 1996-05-02 United Microelectronics Corp Dynamisch programmierbare Ansage-Einrichtung
DE19518504C2 (de) * 1994-10-26 1998-08-20 United Microelectronics Corp Dynamisch programmierbare Ansage-Einrichtung

Also Published As

Publication number Publication date
GB8910603D0 (en) 1989-06-21
US5027409A (en) 1991-06-25
JPH0250196A (ja) 1990-02-20
GB2218602A (en) 1989-11-15
JP3010630B2 (ja) 2000-02-21

Similar Documents

Publication Publication Date Title
DE60035001T2 (de) Sprachsynthese mit Prosodie-Mustern
EP1184839B1 (de) Graphem-Phonem-Konvertierung
DE3317325C2 (de)
DE3127825C2 (de)
DE3431255C2 (de)
DE2804721C3 (de) Elektronischer Rechner mit einer Einrichtung zur synthetischen Erzeugung von Sprache
DE2808577C3 (de) Elektronischer Rechner
DE2226290A1 (de) Verfahren und einrichtung zur anzeige mehrerer unterschiedlicher informationsabschnitte
DE2247728A1 (de) Vorrichtung zum pressen und dehnen von signalen
DE2854837A1 (de) Uebersetzungsvorrichtung
DE3823724A1 (de) Sprachcodierungs- und sprachsynthesesystem
DE3003385C2 (de) Hüllkurvenschaltung für ein elektronisches Musikinstrument
DE1547032A1 (de) Einrichtung zum Identifizieren einer Person
DE69917960T2 (de) Phonembasierte Sprachsynthese
DE2946856C2 (de) Wortspeichergerät
DE4225200A1 (de) Elektronisches woerterbuch
DE3912714A1 (de) Elektronische sprachausgabe-vorrichtung
DE2911854C2 (de) Elektronische Uhr mit akustischer Zeitansage
DE2736752A1 (de) Programmierbares speichersystem fuer ein elektronisches musikinstrument
DE2954377C2 (de)
DE69837428T2 (de) Speichermedium mit elektronischer Schaltung und mit diesem Speichermedium augestatteter Sprachsynthesizer
DE69233622T2 (de) Vorrichtung zur Erzeugung von Ansagen
DE3041970A1 (de) Elektronisches geraet mit datenausgabe in syntheisierter sprache
DE2744321A1 (de) Bildschirmgeraet
DE3327874C2 (de)

Legal Events

Date Code Title Description
8110 Request for examination paragraph 44
8131 Rejection