DE1965480A1 - Geraet fuer kuenstliche Erzeugung von Worten durch Umwandlung eines in Buchstaben gedruckten Textes in Aussprache - Google Patents

Geraet fuer kuenstliche Erzeugung von Worten durch Umwandlung eines in Buchstaben gedruckten Textes in Aussprache

Info

Publication number
DE1965480A1
DE1965480A1 DE19691965480 DE1965480A DE1965480A1 DE 1965480 A1 DE1965480 A1 DE 1965480A1 DE 19691965480 DE19691965480 DE 19691965480 DE 1965480 A DE1965480 A DE 1965480A DE 1965480 A1 DE1965480 A1 DE 1965480A1
Authority
DE
Germany
Prior art keywords
phoneme
coded
word
phonemes
words
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
DE19691965480
Other languages
English (en)
Other versions
DE1965480C3 (de
DE1965480B2 (de
Inventor
?
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ENCE NATIONALE DE VALORISATION
Original Assignee
ENCE NATIONALE DE VALORISATION
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ENCE NATIONALE DE VALORISATION filed Critical ENCE NATIONALE DE VALORISATION
Publication of DE1965480A1 publication Critical patent/DE1965480A1/de
Publication of DE1965480B2 publication Critical patent/DE1965480B2/de
Application granted granted Critical
Publication of DE1965480C3 publication Critical patent/DE1965480C3/de
Expired legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/06Elementary speech units used in speech synthesisers; Concatenation rules
    • G10L13/07Concatenation rules

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Machine Translation (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Document Processing Apparatus (AREA)
  • Electrically Operated Instructional Devices (AREA)

Description

Gerät für künstlich· Erzeugung Ton Torten durch Umwandlung eines in Buchstaben gedruckten Textee in Ausspräche
»alle LBIPP, 6, Boulevard d'Indochine, Paris (Seine), Mich&Le OJLSTELLEIiGO, 11, Hue de Median, Paris (Seine, Jean-Sylvain LIBIiED, 4-4,Rue Sarrette, Paris (Seine), Jacques QUINIO, 9, Hue Maryse Bastii, Polesy (Xvelinea), Jean SAPAIiY, S9 Avenue Treaiet, Paris (Seine), Daniel TSIIi, 5, Hue du Docteur Me ti vet, Oreteil (Val-de-Jtarne)
- Trankreioh «
grangöaisohe Priorität ; Patentantrag Hr* PoV. 182*925 vom 31* Dezember 1968*
Die vorliegende Erfindung betrifft ein Gerät für künstliche Erzeugung von Worten*
Die Erfahrungen haben den Erfindern gezeigt, daß die in einem Stiamsignal enthaltene Energie hauptsächlich auf zwei verschiedene Typen von Angaben verteilt war J
009335/1322
- Sine akustische oder musikalische Mitteilung. Beim An* hdren eines und desselben, von verschiedenen Personen ausgesprochenen Wortes unterscheidet man wärme, klangfarbige, dumpfe, scharfe Stimmen usw. Dies bringt, soweit es die eigentliche Mitteilung angeht, keine Aufklärung über die Mitteilung an sich, außer in einigen seltenes, besonderen fällen, wo der Sinn des Satzes sich mit dem "Son", mit welchem er gesagt wird, ändern kann« So kann der Sats «"Versuche näherzukommen" ebenso gut bedeuteas "Mach eine Anstrengung, um näher au kommen", wie aber a&eh s "Ich rate Dir dringend, nicht näher «u kommen". Der Son ist Funktion der Verändere!* der StimmhShe und des Ifythmus der Worte· Von diesem deeiohtspunkte aus ist es notwendig, die Satsache au betonen, daß die"HBhea der Stimme zwei gans verschiedene Aspekte hat s
HtJk* des Spektrums der harmonisehen linien Ausgehend von den Stimmbändern« Die Erfahrung zeigt, daß dieser Empfang nichts zu tun hat mit der etwaigen Zählung der örundfretuenz des Wortes, und der beste Beweis dafür ist. daß man diese wegschneiden kann* ohne die empfangene Höhe eines Spektrums harmonä&eher linien su Indem·
Höhe der Pormgeber· Bin Bandgeräusch ruft eine lspfindong von So*he hervor9 die um so mehr verschwommen ist, als das Ban4 breiter ist ξ aber die Variationen 4er ^h® eines GtevMsah.·^ ' ; bandes sind im Gegensatz dasu klar vernehmbar. . -■ ■
Sie Musikalität einer Stimme wird dur@h Sas Spektrum äer Liniaa. bestimmt, aber die semantische Mitteilung wird ©ffen» ■ sichtlich nicht durch das Spektrum der IdmeK.
- !Eine semantische MitteilungG Dl® zeigt, daß man sich mit einem elesl:
-.- 009826/1322
- 5 - 1961480
begnügen kann, ohne die Verständlichkeit der Worte zu zerstören. Alle» was 4000 /Bz Versteigt, ist miclit sotwendig und kann infolgedessen als Redundanz angesehen wenden· Man folgert daraus, daß das Wesentliche der seaanti.HoIien Mit teilung unter dieser Frequsiia -gelegen ist,/"was das Problem sehr begrenst und vereinfacht.
Andererseits bestätigt maa» daß die VerstäRdliehkeit bei geflüsterten Worten total ist, was durch Befialtion nicht das Spektrum der Linien umfaßt9 da man die Stimmbänder ab- schaltet, um diese hervorzubringen· Meee einfache!feststellung zeigt, daß die flüstergefilterte Stiaaae über 4000 Hs die Gesamtheit der semsattisehen lütteilung enthält»
Bin Tort muß als ein Pregrsam der Bewegungoa des phonetischen Apparates betrachtet «erden.- Biesen* _ Ürograisa· ses Program findet aiei 4at@gmL- i» des flstarter Stäsmea unter; M<sm Äsfefct
Bijiss® - ■ @-1ί<§13>1>- sieh als
VDS=£7<a@!teoi"k VJOS1A^s, :Sgs& isst g
®qSLe SissQ© BiM ist■■±ä-".Äö3?"Iiaf ims
©mß lamm ©selaaesäj* iai ots i
2@BQQ ia QiMQ^ !©itfsfoiP'®!3^03· istj, üöissi üö
^ä Ii©g5?eif©s Meist-a2,a©& eim© mSas-felsck© ^©sa- identi"·
• " ii:iiii/iigi"... ■-■".
BAD OftißiNAl,
-*- 1985480
fizieren« Jede repräsentative Globalforto eines Wortes kann in Elementen verbindbarer Ifoxm zerlegt werden· Jedes dieser 7ormeleMente entspricht nicht einem Phänomen, sondern der Bewegung der laut einrichtung zwischen zwei benachbarten Phonomenen· Ein Wort ist also nicht phonetisch in Phoneme, sondern in phonetische Elemente zerlegbar, welche Vereinig«· ungen^ftn zwei Phonemen sind, und welche man, in Anbetracht ihres unteilbaren Charakters in der Polger Phonatome nennen wird*
So let das Wort IAHIS nicht die Summe von vier Έ9 L9 S, I , sondern die Verkettung von drei Phoaatom©& PA - AE «- BI oder von vier Phonatomen PA ·» AR — BI "·» II wenn sich- das Wort PAUS allein oder am Ende eines % l©te ■'.'_-- -
i© ©s©lög©2i. I>0EiSg2^i®ai© der PSLoaaiioseg -wotoh ö,i©
afegalsitet WQ^äQB.$ w&Xmh® im
9 ©s füs5 ti©
ia
^i. digätalisisstf,. wiQ zssm fias
p taasl in €©£
seas.© ^sspgtisfilieMisiO - sa gspclfo
&ÜS/1I2
τ ■ 5 . -
T985480
, SO r BO 9 SO 9 10 ,BI # SI , BI , II f BI * EA , AR., BI und die Figur 2<| veranschaulicht das Wort PABIS4
In einer ähnlichen l©ra
»stellen die figuren I14, bis 117 die analogen Sonagraaai der Phonatoae der russischen Sprache SJ 9 JS 9 B S 9 S/ dar und veranschaulicht die figur 2a &ae Wort ΪΒΧ 5 -> die figuren 1-« ^is 1«^ veransehaulichen die analogen Senagraaoae der Phcnatoae der italienischen Sprache IA „ AP , ■ Ä 9: ASL 9 BO j ÖL· 9y0 und stellt die figur 24 die Worte ΙΑ PABOIiI dar*
- die figuren I52 bis "Ug veranschaulichen die analogen Sonagraaa© der Ihonatope der japanischen Sprache EO 9 OI f SO f OB , BA. und die figur 2g stellt das Wort KOBOSA dar i
- die figuren 1«. bis'i^' veranschaulichen die analogen Sonagrawae der Shonatome der B&m&LBQhen Sprache WS 9 ΠΕ , HS 9 EI 9 I^ und die figur 2g stellt das fort OEDSS dar f
- die figuren 1*« ^8 ^43 veranschaulichen die analogen Sonagrame der englischen Sprache AU 9 UD 9 DU , W y JU t UD , DU und die figur 2™ stellt die Worte How do you do dar.
In der franaSsisehen Sprache nimmt man die Ostens v<^n achtund&wansis bis dreiSig tönernen an. Man hält in der vorliegenden Spesifikation die Zahl von achtundzwanzig fest, deren Liste die folgende ist :
E
B
I ,M S
an Z
D on OU
0 U in
£ T g hart
1 feucht oh
B B
009831/1322
f
BAD OWGINAL
Es ist möglich^ diese Phone»« auf Zeile und Kolonne zu verteilen und einem Phone» der Zeile und einen Phonem der Kolonne ©in £honatoHt entsprechen au lassen» das auf dem Kreusungspunkt dieser Linie und dieser Kolonne liegt. Derart kann ein Phonatom durch zwei Adressen aa fünf binär· Ohiff ren definiert werden, deren erste die Ansprache des ersten $hentme&s in der Linie und die zweite die Ansprache dee zweiten Phentaems in der Kolonne ist»
Die figur 3 veraasehauliehi; die Phoneme unter der fo*B einer Matrize· Harn hat anreden Kreuzungspsakt der Mat rise entsprechend zwei Phonemen die frequenz der Begegnung in fS© den dureii diese zwei Phoneme gebildeten Phonatomea gesehrieben·
Im Beispiel beträgt die fzeguea* des Phonatomes PA In einest klassischem:?ransösisoheat f exte 7 ßo ·
Die benutete Maschine f nicht die der analogen Sonagrame des Sypes der figuren I^ bis t^9 sonders, der digitalisiertea Seaagraaaep die sieh dar&oe ableiten 9 liegt hier Tor· Die analoge» Sosagraame werden durch aufgereihte phot@elek~ trisch© Zelleng vor denen sie 7@rbeisieh®m9 abgelesen^ wobei die Achse der Zeiten der Senagr^aie die Achse des Yorbeislehene ist« Das Sonagrea» rti.cirfc durch ZwB&Qhm entsprechend einer Zeit Tor, die sswischem t wa& 3 ma geregelt werden kaim* Ie. jeder erreichtem SStelltmg wird das duroh iede Zelle auf^ Signal in eine Sins oder in etna !$11 verwandelt*
je nachdea9 ob es hSher oder niedriger ala ©ine gewlese Bexmgsschwelle liegt«
Digitali4ierte Sonagraa»« von Ifeoaatomen C#e wird mir Ab« kürsiing VJ?n. digitalisiert en
Q ο 9 % % S /13 21
1,985480
die Hguren 4, 5 uz&d 6
Sie digitalisiertest So&oggassm fransösiechen Worten DIX^ &©ϊ\. JPipe? 4 eatsgr@cb,en den. HtTIT „ das heißt d©m
— U3>
£±e Scmagranaee der
, das heißt Ali - TJU — UB
der y das heißt dea
EA *· JkS « SE w KB; w S «=> B."-·"<·" .-S.
Im. dem Pigas'ea 4».-5 Äf tetjeias f©Ige
HOW
S 4p 5 nsl 6. ärfe_©
iä©
nloc S2.Q" iie
ο las
Ms sfel
196548£)
- die Figur 7 veranschaulicht unter der ?oxm eines Diagrammes Blöcke der sprechenden Maschine gemäfi der Erfindung I
- die ügur 8 veranschaulicht das in, der Maschine eingegriffene Wortsusanaaenfassungsgerät, Icophon genannt·
unter Bezugnahme auf die Figur 7 gesehen, setzt sich die Maschine aus einer Kette zusammen, welche ein peripherisehes Gerät, das eine Schreibmaschine 1 ist, umfaßt, sowie einen Buchetaben - phonetischen Umwandler 2, einen Kreislauf der zu zweien die aus dem Umformer 2 ausgehenden Phoneme gruppiert, wobei als erstes ihonem einer gegebenen Gruppe das letzte Phonem der unmittelbar Torhergehenden Gruppe wieder aufgenommen wird, und ein Anredegerät 4f das gestattet von zwei Eao» neuen einer Gruppe die Ansprache des gebildeten Phonatomes, das durch diese Gruppe zustande kommt, abzuleiten· Diese Ansprechmatrise ist einem Speicherwerk 5 beigesellt, in das die digitalisierten lEhonatome ins Gedächtnis gegeben Sie swa&sig Wort© von vierundvierzig GMffern binärer" welche t±@ Htasat ob© &arst©llenf werden in Seihe im 5 abgeXsses. naad ia parallel© Wort® "in- dem ^eii.©nparöl@l@a
B©r- ikwaaäler β ist ait einem
i©@5iL@a gea®aa1j9 verbunden· 3Jiee©s I@©p&©S- seXT&sü; ls*& Mit eiasH Sautspreciisr 8 -verbunden» - " .-"■-.
la- weaentli©&ea (Hg« 8)- Y±e&m.fl<~'
t& BGhwiMgmmBeTTm&m- 7©1 Ms WaΛϋ al©-=- - -
tervaXl awiseSj^i-. aufeinander folgend®» nicnt geaas .-gleich 100 Hz gewählt, um eisen.
309335/1322
der Komponenten xu vexeeiden·
Jeder Oscillator wird durch einen unbestimmten Generator» beiiehungeweiae 71 «j bis 71 jj» geleitet, der auf die Schwing« ungsfrequenz des Sohwingungssrregers wirkt. Diese Maßnahme sielt darauf ab, der geflüsterten Stimme, die aus dem Gerät kommt, eine Flüssigkeit und eine Natürlichkeit sugeben, welche die Mono tie vermeiden, ,
Jeder Schwingungserreger wird durch einen Kreislauf für Auslösung und Anhalten, beziehungsweise 721 bis 72^-# gesteuert, wobei durch die Verbindungen 73j bis 73,j die binären ■} ■ . ■ ■ " .
Ohiffem der aus dem Umwandler 6 austretenden Worte vom vier-
undYiersig binären öhiffem empfangen werden« Dieser Kreis» lauf der Auslösung regelt die Dauer des Betriebes eines jeden Schwingungserreger». Indem T die Zeit genannt wird, welche dieAbleeungen von *wei aufeinander folgenden parallelen Worten und T1 die Betriebsdauer der Schwingungserreger» hat man schon gesehen» daß r swischen 1 und 8 fausendstelsekünden variiert j was T* anbetrifft, sqo kann dies zwischen 0,24 τ und geregelt werden·
Zn dem ^edäohtnisspeicherwerk 5 ist jedfem Worte eines Phonatoswe ein Wort dt β Auftrages sugesellt» das drei Instruktionen enthält s eine Instruktion der Kadens der Anwendung der Wort· auf das Icophon (Instruktion t")» eine Instruktieii der Sohwlngungsdauer % und eine Instruktion der Schwingung A.ulJ« auf T1 besügliohen Worte *** A wetdea *» «"»!·«· sPan^^8 in den digitalanalogen Umwandler 10 und 11 in analoge Spannung umgewandelt und wirken jeweils auf die Steuerungen der
BAD OWGINAL
00983571322
Dauer d.0T Kreisläufe 12* bis 72.. und auf die Steuerungen der Amplitude der Sohwimlungserreger 7O1 bis 70^,·
Der Hythws* des Austrittes der Shonatome aus den Speicher 5 let ein veränderlicher Bgrfchmns» der Ton der Jjoklisierumg der Zhonatome la Speicher 5 abhängt. Der Srthmm· 1/ des Zuganges der Worte la Icophon hängt Ton den, den Worten des Shonatones assoziierten Worten der Steuerung ab· Xe ist alto notwendigf «wischen die Kreis· 5 und 6 einen Pufferspeicher 9 in Anordnung sa bringen.
Der Umwandler 2 bildet einen buchstäblichen und orthographierten Sezt in eine folge τοη siionetleenea Symbolen omr welche die in der Torhergehenden Tabelle gegebenem Symbol« sind»
Jedes buchstäblich gesteuerte Wort wie die swisehen swei weiesen Stellen oder swisehen einer weissen Stelle und einem Interpunktionszeichen oder auch zwischen zwei Inter-* punktionezeichen ©inbegriffene folge wird Buchstabe fur Buchstaben oder allgemeiner Charakter für Charakter in einem eedächtnisspeicherwerk 20t zur Einführung gebracht, τοη dem aus er in ein Ablesungsregister 20g übertragen werden kamm· Ein Dauerspeloher 203 enthält in kodierter form eine Tabelle aller Worte der Sprache» im welcher die Maschine funkf tlonmiert, wobei eine übertriebene Aussprache gegenüber den · gewuhnlichen Segeln für die Aussprach® zur Anwendung gebracht wird» Das im 201 zur Registrierung kommende Wort und die T@rschiedenen Worte der Tabelle 203 sind aufeinanderfolgend ausgezogen und in das Register 204 übertragen worden·
O0983S/1322
Der Vergleich zwischen den auszusprechendem Worte und den Worten der Tabelle ist Buchstabe für BuchstabeE. von links aus, trie bei der Weise des Aufauchens in einem Wörterbuche vorgenommen worden* Zu diesem Zwecke werden das Törgleichswerfc 205, ein Ansprechregieter 206, das der Tabelle der Ausnahmen 20? beigestellt ist, und ein Wähler 2ÖS durch ein S&gn&l auf dem Draht 207 eingeführt, welches einem nicht dargestelltem Prograamergerät entspringt^ Bas erste Wort der Imsnahmentafel wird auf das Hegister 2<H übertragen and das aussusprechende Wort wird in das Register 202 übertragen* Ber ZäM.e3P 208 wendet bei diesem erstem Ausgang eis. Signal an, das die uferen 209^ und 2«910ÖffÄei!, (in der $at ist Jede 3Hir 2Og1 oder 21Q1 von einer Gruppe von ÜHiren gebiliet, welche in fier Zahl gleich, ist der Zahl der bialiren QÜffeiÄ, .die in- äs* Äsetos aur Barstelluag eiaes O&arafets^s v©EW©aÄ#t wig€)o 'Bi©" ersten luchzwei Im 2O2.i2aÄ 2Ö4 ©iBg©sohM,©%®a©s"-W©s^@' vi&s&&&
g , ©© ist Ώ^ύ^ν^^^Μ^^^ teS ©a fia°
wie laölsjtetem'SÄ-lea
l öl®
t©r SSliiSi1 eis.
Draht 212, das das Anspracheregister 206 um einen Schritt vorrücken läßt, und der Vergleich des auszusprechenden Wortes , zunächst mit dem zweiten, dann dem dritten uew· Wort der Ausnahmentabelle wird fortgesetzt·
Wenn ein auszusprechendes Wort mit einem Wort der Tabelle der Ausnhahmen gleich gefunden worden ist, wird die 2Hir 213 geöffnet und ein Signal wird über den Draht 214 ausgesandt· Das in 201 eingeschriebene Wort wird gelöscht.
Der Tabelle der Ausnahmen ist ein Speicherwerk 215 beigeordnet, welches die phonetischen Gleichwertigkeiten der Worte mit übertriebener Aussprache enthält· Wenn ein Wort von 203 auf das Register 204 übertragen wird, so wird gleichzeitig der phonetische Gleichwert dieses Wortes auf das Register 216 übertragen· Das Signal, das über den Draht 214 geht, ruft die Übertragung des Kodes der Phoneme hervor, die den phonetischen Gegenwert des auszusprechenden Wortes darstellen, dies zum Kreis der figur 7 hin·
Wenn das Anspracheregister 206 bei seiner letzten Ansprache ist und ein Signal für die Hichtidentität über den Draht
212 gehend erscheint, werden die Euren 217 und 218 geöffnet und das auszusprechende Wort geht vom Speicherwerk 201 zum Gedächtnisspeicher' 221 über, welch letzterer ein Begister mit Verschiebung ist« Jeder Buchstabe des auszusprechenden Wortes wird sequentiell auf einen Kreislauf der Erfassung der Phoneme 222 mit Hilfe eines Ableseregisters 223 übertragen· Dieser Kreis der Erfassung umfaSt soviel Kombinatioasdetektoren wie es Buchetabenkombinationen gibt, welche Phoneme darstellen, die nicht einem Buchstaben allein entsprechen,
009835/1322
zum Bei e pi el IF, OV9 EE, QU .·····
Wenn beispielsweise das Wort *ΈΉ.0ΕΜ&" in das Register mit Verschiebung 221 eingeführt wird, so wird erst der Buchstabe P in den Bpfassungskreis 222 übertragen, sodann in dessen Folge der Buchstabe H. Ss besteht in dem Kreis 222 ein Detektor der Kombination IH9 und das Signal des Ausganges aus diesem detektor ist das Phonem 1· Das Phonem Ϊ (oder,genauer gesagt, seine kombinierte Kodierung) wird an Stelle der Kombination IH in dem Register mit Verschiebung 221 mit Hilfe eines Wiedereinsohreibungsregisters 224 eingesetzt. Kreisläufe der Erfassung von besonderen Kombinationen sind in der Technik wohl bekannt und brauchen also im Einzelnen in der vorliegenden Spezifikation nioht beschrieben werden· Die Buchstaben, welche in Kombination mit derjenigen, die ihnen unmittelbar vorausgeht, oder derjenigen, die ihnen unmittelbar folgt, nicht durch den Kreis 222 erfaßte Paare bilden, werden ohne Veränderung in das Register 221 wiedereingeschrieben·
Im Vorausgegangenen ist unterstellt worden, daß die Oszillatoren 7O1 bis 70.. Schwingungsfrequenzen mit regelmäßigen Abständen hätten. Man kann diese Schwingungsfrequenzen in einer unregelmäßigen Axt verteilen, zum Beispiel so wie die Frequenzen der Vocoderfilter mit spektralen Kanälen·
009835/1322

Claims (1)

  1. Patentansprüche
    1*yGerät für künstliche Erzeugung τοη Worten durch Umwandlung eine β in Buchstabencharaktern gedruckten Textes durch Aussprache mit Mitteln zur Umwandlung der Zeichen de· besagten Sextee in binäre kodierte Zeichen mit einem Speicherwerk kodierter Phoneme, Mitteln für sequentiellen Vergleich eines jeden der kodierten Charaktere mit de* genannten kodierten Phonemen und zur Auswahl des diesem Phonem gleichwertigen Zeichens aus dem Speicherwerk der kodierten Phonem·, mit Mitteln für sequentiellen Vergleich einer Gruppe Ton aufeinander folgenden folgenden kodierten Zeichen mit den gemannte kodierten Phonemen und zur Auswahl des dieser Zeichengruppe gleichwertigen Phonemes aus dem Speicher der kodierten Phoneme, wenn der Vergleich dieserselben Gruppe, ausgenommen ihren letzten Buchstaben zu dem kodierten Phonemen, keine Wahl eines kodierten Phonemes ergeben hat, mit Mitteln zur Verwendung der nachfolgenden gewählten Phoneme zu Phonempaaren, wobei das letzte Phonem eines Phonempaares das erste Phonem des folgenden Phonempaares ist, dadureh gekennzeichnet, daß einem Speicherwerk von Sonagrammen kodierter Phonemenpaar·«bestehend aus der Begistrierung ▼on den Phonemenpaaren, die mit geflüsterter Stimm· in den Zeit-Prequenz-Plan zugesprochen werden, worin die Amplitude eines Punktes des genannten Zeit-Prequenz-Planee selektlT f repräsentiert wird durch eine Bins und eine lull entsprechend den Werten der Amplitude in besagtem Punkte mit Bezug auf einen gegebenen Bezugswert, wobei das Phonemempaar kodiert
    009835/1322
    let in einer Mehrheit von & - bit binären Worten, deren bits die Halft· der Amplitude in a Punkten mit regelmäßigem Abetande voneinander länge zu der Achse der Frequenz des Bonagrama«» darstellen, mit Mitteln stm Herausziehen aus dem belaf tem Speicher der Phonemenpaare, die kodiert sind, welche dem Phonemenpaaren entsprechen, die beim Ausbringen mit den genannten Aasoziationsmitteln durch eine Mehrheit τοη η 8ahwinfungserregern, die besondere Abstände im Sprachband haben, erhalten werden, durch mittel τοη aufeinander folgenden Kontrollen der genannten Schwingungserreger, jeweils duroh die bits der genannten, abgezogenen, kodierten Phonemenpaarworte, durch Mittel zur 'Stimmwiedergabe und durch Mittel für die Verbindung der genannten Mittel zur Stimmreproduktion mit Auabringsignalen der genannten Schwingungeerreger.
    2· Gerät für künstliche Erzeugung τοη Worten durch Umwandlung eines in Buchetabenoharakteren gedruckten Textes durch Aussprache nach Anspruch 1, dadurch, gekennzeichnet, d a ß in diesem jedes Phonemenpaarwort assoziiert ist mit einem ersten Hilfawort, das Zeitintervalle zwischen der Eontrolle de* Sehwingungserreger&durch das genannte Phonemenpaarwort und das auf aufeinander folgende Phonemenpaarwort gibt, und das Gerät Mittel zum Ablesen des gemannten ersten Hilfswortes und Sperrmittel der genannten Phonemenpaarworte zu den genannten Schwingungserregern besitzt, welche duroh die besagten Ablesemittel kontrolliert werden«
    009835Π322
    — ID —
    3· Gerät für künstliche Erzeugung von Worten durch Umwandlung eiaes in Buchstabencharakteren gedruckten Textee durch Aussprache nach Anspruch 1, dadurch; gekenaze ich· η β t, d a ß in diesem jedes fhonemenpaarwort assoziiert ist mit einem zweiten Hilfswort, das die Dauer des Wirkens der Schwingungserreger gibt, wenn diese digital vom Phonmenpaarwort kontrolliert werden, und daß das Gerät für die Ablesung des genannten zweiten Hilfswortes Mittel, sowie auch Mittel für Anlaufen und Anhalten der durch die besagten Mittel kontrollierten Schwingungserreger besitzt·
    4· Gerät für künstliche Erzeugung von Worten durch Umwandlung eines in Buchstabencharakteren gedruckten Textes durch Aussprache nach Anspruch 1, dadurch, gekennzeichnet, d a ß in diesem die Schwingungserreger unbestimmt variierte Frequenzen in Bezug auf die hierzu entsprechende Bandweitenfrequenz haben·
    009835/1322
DE1965480A 1968-12-31 1969-12-30 Gerat zur Umwandlung eines in graphischen Zeichen gedruckten Textes in gesprochene Worte Expired DE1965480C3 (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
FR182925 1968-12-31

Publications (3)

Publication Number Publication Date
DE1965480A1 true DE1965480A1 (de) 1970-08-20
DE1965480B2 DE1965480B2 (de) 1973-05-17
DE1965480C3 DE1965480C3 (de) 1973-11-29

Family

ID=8659829

Family Applications (1)

Application Number Title Priority Date Filing Date
DE1965480A Expired DE1965480C3 (de) 1968-12-31 1969-12-30 Gerat zur Umwandlung eines in graphischen Zeichen gedruckten Textes in gesprochene Worte

Country Status (8)

Country Link
US (1) US3632887A (de)
CH (1) CH513482A (de)
DE (1) DE1965480C3 (de)
FR (1) FR1602936A (de)
GB (1) GB1257850A (de)
NL (1) NL170673C (de)
SE (1) SE346637B (de)
SU (1) SU401062A3 (de)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4000565A (en) * 1975-05-05 1977-01-04 International Business Machines Corporation Digital audio output device
US4398059A (en) * 1981-03-05 1983-08-09 Texas Instruments Incorporated Speech producing system
US4685135A (en) * 1981-03-05 1987-08-04 Texas Instruments Incorporated Text-to-speech synthesis system
NL8200726A (nl) * 1982-02-24 1983-09-16 Philips Nv Inrichting voor het genereren van de auditieve informatie van een verzameling karakters.
US4731847A (en) * 1982-04-26 1988-03-15 Texas Instruments Incorporated Electronic apparatus for simulating singing of song
US4527274A (en) * 1983-09-26 1985-07-02 Gaynor Ronald E Voice synthesizer
US4695962A (en) * 1983-11-03 1987-09-22 Texas Instruments Incorporated Speaking apparatus having differing speech modes for word and phrase synthesis
US4692941A (en) * 1984-04-10 1987-09-08 First Byte Real-time text-to-speech conversion system
US5197052A (en) * 1988-03-10 1993-03-23 Grundig E.M.V. Personal computer dictation system with voice anad text stored on the same storage medium
US5325462A (en) * 1992-08-03 1994-06-28 International Business Machines Corporation System and method for speech synthesis employing improved formant composition
US5446791A (en) * 1993-03-17 1995-08-29 Jag Design International Limited Sound synthesizer system operable by optical data cards
SE516521C2 (sv) * 1993-11-25 2002-01-22 Telia Ab Anordning och förfarande vid talsyntes
WO1995030193A1 (en) * 1994-04-28 1995-11-09 Motorola Inc. A method and apparatus for converting text into audible signals using a neural network
US5950162A (en) * 1996-10-30 1999-09-07 Motorola, Inc. Method, device and system for generating segment durations in a text-to-speech system
US6639512B1 (en) 1998-07-15 2003-10-28 Kyu-Woong Lee Environmental warning system
US6230135B1 (en) 1999-02-02 2001-05-08 Shannon A. Ramsay Tactile communication apparatus and method
US6178402B1 (en) 1999-04-29 2001-01-23 Motorola, Inc. Method, apparatus and system for generating acoustic parameters in a text-to-speech system using a neural network
US7805307B2 (en) 2003-09-30 2010-09-28 Sharp Laboratories Of America, Inc. Text to speech conversion system
KR100658869B1 (ko) * 2005-12-21 2006-12-15 엘지전자 주식회사 음악생성장치 및 그 운용방법
US7977560B2 (en) * 2008-12-29 2011-07-12 International Business Machines Corporation Automated generation of a song for process learning

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US2771509A (en) * 1953-05-25 1956-11-20 Bell Telephone Labor Inc Synthesis of speech from code signals
US3234332A (en) * 1961-12-01 1966-02-08 Rca Corp Acoustic apparatus and method for analyzing speech
US3102165A (en) * 1961-12-21 1963-08-27 Ibm Speech synthesis system
US3344239A (en) * 1962-08-06 1967-09-26 Data translating system having a fast scan address section
US3280257A (en) * 1962-12-31 1966-10-18 Itt Method of and apparatus for character recognition
US3319002A (en) * 1963-05-24 1967-05-09 Clerk Joseph L De Electronic formant speech synthesizer
US3492646A (en) * 1965-04-26 1970-01-27 Ibm Cross correlation and decision making apparatus

Also Published As

Publication number Publication date
US3632887A (en) 1972-01-04
DE1965480C3 (de) 1973-11-29
SU401062A3 (de) 1973-10-01
CH513482A (fr) 1971-09-30
SE346637B (de) 1972-07-10
GB1257850A (de) 1971-12-22
DE1965480B2 (de) 1973-05-17
NL170673B (nl) 1982-07-01
FR1602936A (de) 1971-02-22
NL170673C (nl) 1982-12-01
NL6919639A (de) 1970-07-02

Similar Documents

Publication Publication Date Title
DE1965480A1 (de) Geraet fuer kuenstliche Erzeugung von Worten durch Umwandlung eines in Buchstaben gedruckten Textes in Aussprache
DE69909716T2 (de) Formant Sprachsynthetisierer unter Verwendung von Verkettung von Halbsilben mit unabhängiger Überblendung im Filterkoeffizienten- und Quellenbereich
DE68919637T2 (de) Verfahren und Einrichtung zur Sprachsynthese durch Überdeckung und Summierung von Wellenformen.
DE69718284T2 (de) Sprachsynthesesystem und Wellenform-Datenbank mit verringerter Redundanz
DE69031165T2 (de) System und methode zur text-sprache-umsetzung mit hilfe von kontextabhängigen vokalallophonen
DE60112512T2 (de) Kodierung von Ausdruck in Sprachsynthese
DE2551632C2 (de) Verfahren zum Zusammensetzen von Sprachnachrichten
DE60035001T2 (de) Sprachsynthese mit Prosodie-Mustern
DE2740520A1 (de) Verfahren und anordnung zur synthese von sprache
DE2212472A1 (de) Verfahren und Anordnung zur Sprachsynthese gedruckter Nachrichtentexte
DE2736082A1 (de) Elektronisches geraet zur phonetischen synthetisierung menschlicher sprache (sprach-synthesizer)
EP1105867B1 (de) Verfahren und vorrichtungen zur koartikulationsgerechten konkatenation von audiosegmenten
DE19920501A1 (de) Wiedergabeverfahren für sprachgesteuerte Systeme mit textbasierter Sprachsynthese
DE2519483A1 (de) Verfahren und anordnung zur sprachsynthese
DE69233622T2 (de) Vorrichtung zur Erzeugung von Ansagen
DE10022586A1 (de) Verfahren zum Erzeugen einer Sprachdatenbank für einen Zielwortschatz zum Trainieren eines Spracherkennungssystems
DE1811040C3 (de) Anordnung zum Synthetisieren von Sprachsignalen
EP0058130B1 (de) Verfahren zur Synthese von Sprache mit unbegrenztem Wortschatz und Schaltungsanordnung zur Durchführung des Verfahrens
DE4111781A1 (de) Computersystem zur spracherkennung
DE3513243C2 (de)
DE3232835C2 (de)
DE2854601A1 (de) Ton-synthesizer und verfahren zur ton-aufbereitung
DE2363590A1 (de) Spracherkennungssystem mit merkmalsfolgekodierung
DE19837661C2 (de) Verfahren und Vorrichtung zur koartikulationsgerechten Konkatenation von Audiosegmenten
AT311077B (de) Einrichtung zur Synthetisierung von Audio-Informationen

Legal Events

Date Code Title Description
C3 Grant after two publication steps (3rd publication)
E77 Valid patent as to the heymanns-index 1977