DE10042942C2 - Verfahren zur Sprachsynthese - Google Patents

Verfahren zur Sprachsynthese

Info

Publication number
DE10042942C2
DE10042942C2 DE10042942A DE10042942A DE10042942C2 DE 10042942 C2 DE10042942 C2 DE 10042942C2 DE 10042942 A DE10042942 A DE 10042942A DE 10042942 A DE10042942 A DE 10042942A DE 10042942 C2 DE10042942 C2 DE 10042942C2
Authority
DE
Germany
Prior art keywords
word
found
partial
database
phonetic transcription
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
DE10042942A
Other languages
English (en)
Other versions
DE10042942A1 (de
Inventor
Horst-Udo Hain
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Siemens AG
Original Assignee
Siemens AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Siemens AG filed Critical Siemens AG
Priority to DE10042942A priority Critical patent/DE10042942C2/de
Priority to EP01113053A priority patent/EP1184838B1/de
Priority to DE50107259T priority patent/DE50107259D1/de
Priority to ES01113053T priority patent/ES2244523T3/es
Priority to US09/942,736 priority patent/US7333932B2/en
Publication of DE10042942A1 publication Critical patent/DE10042942A1/de
Application granted granted Critical
Publication of DE10042942C2 publication Critical patent/DE10042942C2/de
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/08Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination

Description

Die Erfindung betrifft ein Verfahren, eine Anordnung und ein Computerprogrammprodukt zur Sprachsynthese mittels Graphem- Phonem-Umsetzung.
Sprachverarbeitungsverfahren sind beispielsweise aus US 6 029 135, US 5 732 388, DE 196 36 739 C1 und DE 197 19 381 C1 bekannt. In nicht gesprochener Form gespeicherter Text lässt sich über eine Sprachsynthese als Sprache ausgeben. Dazu wer­ den in der Regel die einzelnen Wörter des Textes in einer Da­ tenbank gesucht, die die phonetischen Transkriptionen zahl­ reicher Wörter enthält. Die phonetischen Transkriptionen der in der Datenbank gefundenen Wörter werden zusammengesetzt und können als Sprache ausgegeben werden.
Da aber keine Datenbank vollständig ist, was in der Regel zur Reduktion der Datenbankgröße durchaus beabsichtigt ist, kommt es immer wieder vor, dass ein Text Wörter enthält, die in der Datenbank nicht gefunden werden. Diese Wörter werden dann mit einer Out-of-Vocabulary-Behandlung (OOV-Behandlung) phone­ tisch transkribiert. Eine solche Behandlung ist etwa aus DE 694 20 955 T2 bekannt. Dabei wird jedes Wort jeweils aus den einzelnen Buchstaben oder Wortteilen des Wortes zugeordneten Phonemen zusammengesetzt. Solche OOV-Behandlungen sind aller­ dings relativ rechenintensiv und führen in aller Regel zu schlechteren Ergebnissen als die phonetische Transkription ganzer Wörter aufgrund von Datenbankeinträgen.
Weiterhin ist es bekannt, die phonetische Transkription eines gegebenen Wortes aus den phonetischen Transkriptionen seiner Teilwörter zusammenzusetzen, wenn das gegebene Wort aus­ schließlich aus diesen Teilwörtern besteht.
Davon ausgehend liegt der Erfindung die Aufgabe zugrunde, Sprachsynthese dahingehend zu verbessern, dass in größerem Umfang auf in einer Datenbank angegebene phonetische Transkriptionen von Wörtern zurückgegriffen werden kann und nur noch in geringerem Maße OOV-Behandlungen verwendet werden müssen.
Diese Aufgabe wird durch ein Verfahren und eine Anordnung mit den Merkmalen der unabhängi­ gen Patentansprüche gelöst.
Durch das Verfahren oder die Anordnung ist es möglich, auch dann für ein gegebenes Wort auf die phonetischen Transkriptionen seiner Teilwörter zurückzu­ greifen, wenn sich das gegebene Wort nicht vollständig aus in der Datenbank enthaltenen Teilwörtern zusammensetzen lässt. Der wesentliche Gedanke ist dabei, dass erstmals eine hybride Vorgehensweise zum Einsatz kommt, bei der für dasselbe gege­ bene Wort sowohl die phonetische Transkription vollständiger Teilwörter, als auch eine OOV-Behandlung zum Einsatz kommt.
In einer bevorzugten Weiterbildung erfolgt die OOV-Behandlung zur phonetischen Transkription des weiteren Bestandteils in Abhängigkeit der phonetischen Transkription des gefundenen Teilwortes. Hierdurch lässt sich die Qualität der Sprachsyn­ these für den weiteren Bestandteil gegenüber einer entspre­ chenden reinen OOV-Behandlung des gesamten Wortes deutlich steigern. Dies liegt zum einen daran, dass die phonetische Transkription des gefundenen Teilwortes sehr viel sicherer ist als es eine phonetische Transkription dieses Teilwortes durch einen OOV-Behandlung wäre. Dadurch kann bei der OOV- Behandlung des weiteren Bestandteils von einem sicheren pho­ netischen Kontext ausgegangen werden, was die OOV-Behandlung mit sehr viel größerer Wahrscheinlichkeit zum richtigen Er­ gebnis kommen lässt. Zum anderen ist die phonetische Transkription des gefundenen Teilwortes sehr viel länger als die üblicherweise bei einer OOV-Behandlung verwendeten Phone­ me. Deshalb ist der phonetische Kontext nicht nur sicherer, sondern auch länger, so dass die OOV-Behandlung für den weiteren Bestandteil aufgrund einer größeren Menge relevanter Informationen durchgeführt werden kann. Dieser Vorteil muss für die beanspruchte bevorzugte Weiterbildung allerdings nicht unbedingt ausgenutzt werden. Unter bestimmten Bedingun­ gen kann es auch sinnvoll sein, wenn für die OOV-Behandlung zur phonetischen Transkription des weiteren Bestandteils in Abhängigkeit der phonetischen Transkription des gefundenen Teilwortes lediglich der Teil des Teilwortes berücksichtigt wird, der dem weiteren Bestandteil unmittelbar benachbart ist.
Besonders vorteilhaft wird das Verfahren, wenn es nicht nach dem Auffinden eines ersten Teilwortes abgebrochen wird, son­ dern wenn noch weitere Teilwörter im gegebenen Wort gesucht werden. So wird ein möglichst großer Abschnitt des gegebenen Wortes aus Teilwörtern zusammengesetzt, für die in der Daten­ bank zuverlässige Informationen vorliegen, und lediglich der verbleibende, meist kleine weitere Bestandteil des Wortes muss einer OOV-Behandlung unterzogen werden.
Steht dieser verbleibende weitere Bestandteil zwischen zwei gefundenen Teilwörtern so wird die OOV-Behandlung vorzugswei­ se in Abhängigkeit beider gefundener Teilbereiche vorgenom­ men. Dann ist nämlich sowohl der linke als auch der rechte phonetische Kontext des weiteren Bestandteils sicher vorgege­ ben, weshalb sich die OOV-Behandlung mit exzellenten Ergeb­ nissen durchführen lässt.
Die Suche nach Teilwörtern in der Datenbank lässt sich durch verschiedene Maßnahmen optimieren. So sollte zum Beispiel nur nach Teilwörtern gesucht werden, die eine vorgegebene Min­ destlänge aufweisen. Als Mindestlänge hat sich in der Praxis eine Länge von 5 Buchstaben herausgestellt, wobei bei anderen Rahmenbedingungen, zum Beispiel für eine andere Sprache, auch Mindestlängen von 3, 4 oder 6 Buchstaben sinnvoll sein kön­ nen.
Weiterhin wird das Suchergebnis verbessert, wenn die Suche für einen Wortteil des gegebenen Wortes nicht sofort nach dem Auffinden des ersten passenden Teilwortes abgebrochen wird, sondern noch nach anderen möglichen Teilwörtern gesucht wird. Dies kann zum Beispiel erfolgen, indem der Wortteil um weite­ re Buchstaben ergänzt wird. In der Regel ergibt sich bei die­ ser Vorgehensweise das beste Ergebnis, wenn von mehreren ge­ fundenen Teilwörtern dasjenige ausgewählt wird, das am längs­ ten ist. Es kann allerdings auch ein kürzeres Teilwort ausge­ wählt werden, wenn dieses kürzere Teilwort in Verbindung mit einem in der Datenbank gefundenen und im gegebenen Wort ent­ haltenen längeren Teilwort einen größeren Teil des gegebenen Wortes darstellt, als das gefundene längere Teilwort für sich alleine, wenn dieses nicht mit dem gefundenen zweiten Teil­ wort kombiniert werden kann.
Die OOV-Behandlung zur phonetischen Transkription des weite­ ren Bestandteils kann mittels eines neuronalen Netzes erfol­ gen.
Alternativ oder ergänzend kann für die OOV-Behandlung zur phonetischen Transkription des weiteren Bestandteils eine re­ gelbasiertes Verfahren oder ein DTW-Verfahren zum Einsatz kommen. Ein solches Verfahren ist zum Beispiel in Rüdiger Hoffmann "Signalanalyse und -erkennung", Springer Verlag, Berlin, 1998, beschrieben.
Die OOV-Behandlung kann allerdings auch mittels einer zweiten Datenbank erfolgen, die die phonetischen Transkription von bei zusammengesetzten Wörtern üblicherweise verwendeten Füll­ partikeln enthält. Im Deutschen sind dies insbesondere Dativ- und Genitivendungen, die bei zusammengesetzten Wörtern an das jeweils vorne stehende Wort angehängt werden.
Das erfindungsgemäße Verfahren läßt sich auch als ein Computerprogrammprodukt zur Sprachsynthese mittels einer Graphem-Phonem-Umsetzung realisieren, bei dem beim Ablauf auf zumindest einer Prozessoreinheit für ein gegebenes Wort in einer Datenbank, die phonetische Transkriptionen von Wörtern enthält, nach Teilwörtern des ge­ gebenen Wortes gesucht wird, mindestens ein Teilwort des ge­ gebenen Wortes in der Datenbank gefunden wird, für das gefun­ dene Teilwort eine in der Datenbank verzeichnete phonetische Transkription gewählt wird, das gegebene Wort neben dem ge­ fundenen Teilwort mindestens einen weiteren Bestandteil auf­ weist, der nicht in der Datenbank verzeichnet ist, dieser weitere Bestandteil mittels einer OOV-Behandlung phonetisch transkribiert wird und die phonetische Transkription des ge­ fundenen Teilwortes und die phonetische Transkription des weiteren Bestandteils zusammengesetzt wird.
Weitere Merkmale und Vorteile der Erfindung erge­ ben sich aus der Beschreibung eines Ausführungsbeispiels an­ hand der Zeichnung; dabei zeigt
Fig. 1 eine schematische Darstellung des Ablaufs des Verfah­ rens und
Fig. 2 eine schematische Darstellung eines zwischen zwei Teilwörtern stehenden weiteren Bestandteils eines ge­ gebenen Wortes.
Das Verfahren soll am Beispiel des gegebenen deutschen Wortes "Trainingslager" erläutert werden. Es sollen nur Teilwörter mit einer Mindestlänge von fünf Buchstaben gesucht werden. Im Schritt S1 gemäß Fig. 1 wird für das gegebene Wort in einer Datenbank, die phonetische Transkriptionen von Wörtern ent­ hält, nach Teilwörtern des gegebenen Wortes gesucht. Da die Mindestlänge auf fünf Buchstaben gesetzt ist, wird mit der Suche nach dem Wort "Train" angefangen. In einer deutschspra­ chigen Datenbank wird dieses Wort nicht gefunden. Enthält die Datenbank auch englischsprachige Wörter, so ist bereits jetzt das erste Teilwort des gegebenen Wortes gefunden. Vorzugswei­ se wird aber nicht nur im ersten, sondern auch im zweiten Fall weitergesucht. Dies geschieht durch die Suche nach dem Wort "Traini". Diese Buchstabenkombination wird in der Daten­ bank nicht gefunden. Das Gleiche gilt für die danach gesuchte Buchstabenkombination "Trainin".
Dagegen wird die nächste Buchstabenkombination "Training" in der Datenbank gefunden. Trotzdem wird auch in diesem Fall vorzugsweise weitergesucht, nämlich nach der Buchstabenkombi­ nation "Trainings" und den in entsprechender Fortsetzung die­ ses Suchschrittes gebildeten längeren Buchstabenkombinationen des gegebenen Wortes. Unter der Voraussetzung, dass das gege­ bene Wort "Trainingslager" in seiner Gesamtheit nicht in der Datenbank gefunden wird, werden keine weiteren Teilwörter in der Datenbank gefunden.
Für den Fall einer englisch- und deutschsprachigen Datenbank wird aus den beiden gefundenen Teilwörtern "Train" und "Trai­ ning" das längere Teilwort "Training" ausgewählt. Dieser Aus­ wahlschritt entfällt im Beispielfall für eine rein deutsch­ sprachige Datenbank.
Im Schritt S3 wird für das gefundene Teilwort "Training" die in der Datenbank verzeichnete phonetische Transkription ge­ wählt.
Gemäß dem Schritt S4 wird festgestellt, dass das gegebene Wort "Trainingslager" neben dem gefundenen Teilwort "Trai­ ning" einen weiteren Bestandteil "slager" aufweist, der nicht in der Datenbank verzeichnet ist.
Dieser weitere Bestandteil "slager" wird dann im Schritt S5 mittels einer OOV-Behandlung phonetisch transkribiert. Diese OOV-Behandlung basiert vorzugsweise auf einer Umsetzung der einzelnen Grapheme des weiteren Bestandteils "slager" in Pho­ neme mittels eines neuronalen Netzes. Die Phoneme werden durch das neuronale Netz so ausgewählt und zusammengesetzt, dass sich für den weiteren Bestandteil für sich genommen eine möglichst gute Sprachsynthese ergibt.
Für ein noch besseres Sprachsyntheseergebnis erfolgt die OOV- Behandlung zur phonetischen Transkription des weiteren Be­ standteils "slager" in Abhängigkeit der aus der Datenbank ge­ wählten phonetischen Transkription des gefundenen Teilwortes "Training". Das gefundene Teilwort "Training" bzw. seine pho­ netische Transkription gibt im gewählten Beispiel den linken phonetischen Kontext des weiteren Bestandteils "slager" si­ cher vor. Das für die OOV-Behandlung des weiteren Bestand­ teils "slager" verwendete neuronale Netz kann deshalb von ei­ nem sicheren Ergebnis der dem weiteren Bestandteil vorausge­ gangenen Silben des gegebenen Wortes ausgehen und ein entsprechend sicheres Ergebnis für die phonetische Transkription des weiteren Bestandteils liefern.
Im letzten Schritt S6 des Verfahrens zur Sprachsynthese wird schließlich die phonetische Transkription des gefundenen Teilwortes "Training" und die phonetische Transkription des weiteren Bestandteils "slager" zusammengesetzt.
Das Sprachsyntheseergebnis lässt sich weiter verbessern, wenn nicht nur vom Anfang des gegebenen Wortes beginnend Teilwör­ ter gesucht werden, sondern die Suche auch von anderen Berei­ chen des gegebenen Wortes aus gestartet wird. Ist für das Teilwort eine bestimmte Mindestlänge i vorgegeben, so emp­ fiehlt sich der Beginn der weiteren Suche beim i + ersten Buch­ staben. Im gegebenen Beispiel wird dann für i = 5 die weitere Suche mit der Buchstabenfolge "ingsl" gestartet, die ihrer­ seits wiederum die gegebene Mindestlänge aufweist. Diese Buchstabenfolge würde in der Datenbank nicht gefunden. Das gleiche gilt für die danach gesuchten Buchstabenfolgen "ings­ la", "ingslag" usw.
Da bei dieser weiteren Suche keinerlei Teilwort gefunden wird, wird die darauffolgende Suche nicht beim Buchstaben 2.i + 1 gestartet, sondern schon bei i + 2. Allerdings führt auch die Suchsequenz "ngsla", "ngslag" usw. zu keinem Ergebnis. Nach dem Durchführen weiterer entsprechender Suchen wird al­ lerdings in der letzten Suche das weitere Teilwort "lager" gefunden. Dieses weitere gefundene Teilwort "lager" entstammt nicht dem Wortteil des Wortes "Trainingslager", für den das erste Teilwort "Training" gefunden wurde. Deshalb muss im Beispiel keine Auswahl zwischen den beiden Teilwörtern ge­ troffen werden.
Vielmehr verbleibt als weiterer Bestandteil des gegebenen Wortes "Trainingslager" nurmehr der Buchstabe "s". Dieser einzelne Buchstabe "s" lässt sich sehr leicht mittels einer OOV-Behandlung phonetischen transkribieren. Hierbei kommt noch erleichternd hinzu, dass gemäß Fig. 2 für das Zentrum 2 "s" sowohl der linke Kontext 1 "Training" als auch der rechte Kontext 3 "lager" bekannt ist.
Statt der OOV-Behandlung durch ein neuronales Netz, wie sie oben beschrieben wurde, kann in diesem Fall die OOV- Behandlung auch durch eine Suche in einer weiteren Datenbank erfolgen, in der die phonetischen Transkriptionen von bei zu­ sammengesetzten Wörtern üblicherweise verwendeten Füllparti­ keln enthalten sind. Das Genitivs des vorliegenden Beispiels ist ein solcher üblicherweise verwendeter Füllpartikel. Es würde deshalb in der zweiten Datenbank gefunden und die zuge­ hörige phonetische Transkription gewählt werden.
Alternativ lassen sich für die OOV-Behandlung aber auch re­ gelbasierte Verfahren und DTW-Verfahren einsetzen. In jedem Fall sind bessere phonetische Transkriptionen des weiteren Bestandteils zu erwarten, wenn bei der OOV-Behandlung zur phonetischen Transkription des weiteren Bestandteils die pho­ netische Transkription mehrerer oder aller gefundenen Teil­ wörter berücksichtigt wird. Dies ist natürlich insbesondere der Fall, wenn der weitere Bestandteil im Wort zwischen zwei gefundenen Teilwörtern angeordnet ist.
In einem letzten Schritt wird dann schließlich die phoneti­ sche Transkription des gefundenen Teilworts "Training", die phonetische Transkription des weiteren gefundenen Teilwortes "lager" und die phonetische Transkription des weiteren Be­ standteils "s" zur Sprachsynthese zusammengesetzt.
Die erfindungsgemäße Anordnung lässt sich in Form eines Com­ putersystems realisieren, das programmiert wird, ein entspre­ chendes Verfahren auszuführen.

Claims (10)

1. Verfahren zur Sprachsynthese mittels einer Graphem-Phonem- Umsetzung, bei dem
für ein gegebenes Wort in einer Datenbank, die phonetische Transkriptionen von Wörtern enthält, nach Teilwörtern des ge­ gebenen Wortes gesucht wird,
mindestens ein Teilwort des gegebenen Wortes in der Daten­ bank gefunden wird,
für das gefundene Teilwort eine in der Datenbank verzeich­ nete phonetische Transkription gewählt wird,
das gegebene Wort neben dem gefundenen Teilwort mindestens einen weiteren Bestandteil aufweist, der nicht in der Daten­ bank verzeichnet ist,
dieser weitere Bestandteil mittels einer OOV-Behandlung phonetisch transkribiert wird und
die phonetische Transkription des gefundenen Teilwortes und die phonetische Transkription des weiteren Bestandteils zu­ sammengesetzt wird.
2. Verfahren zur Sprachsynthese nach Anspruch 1, bei dem die OOV-Behandlung zur phonetischen Transkription des wei­ teren Bestandteils in Abhängigkeit der phonetischen Transkription des gefundenen Teilwortes erfolgt.
3. Verfahren zur Sprachsynthese nach Anspruch 1 oder 2, bei dem
für das gefundene Wort in der Datenbank nach weiteren Teil­ wörtern des Wortes gesucht wird,
mindestens ein weiteres Teilwort des gegebenen Wortes in der Datenbank gefunden wird,
für dieses gefundene weitere Teilwort eine in der Datenbank verzeichnete phonetische Transkription gewählt wird und
die phonetische Transkription des gefundenen Teilworts, die phonetische Transkription des weiteren gefundenen Teilworts und die phonetische Transkription des weiteren Bestandteils zusammengesetzt wird.
4. Verfahren zur Sprachsynthese nach Anspruch 3, bei dem
der weitere Bestandteil im gegebenen Wort zwischen dem ge­ fundenen Teilwort und dem gefundenen weiteren Teilwort ange­ ordnet ist und
die OOV-Behandlung zur phonetischen Transkription des wei­ teren Bestandteils in Abhängigkeit der phonetischen Transkription des gefundenen Teilwortes und der phonetischen Transkription des gefundenen weiteren Teilworts erfolgt.
5. Verfahren zur Sprachsynthese nach zumindest einem der vor­ stehenden Ansprüchen, bei dem nur nach Teilwörtern gesucht wird, die mindestens eine vor­ gegebene Mindestlänge aufweisen.
6. Verfahren zur Sprachsynthese nach zumindest einem der vor­ stehenden Ansprüche, bei dem wenn für denselben Wortteil des gegebenen Wortteiles mehre­ re Teilwörter gefunden werden, von diesem das längste Teil­ wort ausgewählt wird.
7. Verfahren zur Sprachsynthese nach zumindest einem der vor­ stehenden Ansprüche, bei dem die OOV-Behandlung zur phonetischen Transkription des wei­ teren Bestandteils mittels eines neuronalen Netzes erfolgt.
8. Verfahren zur Sprachsynthese nach zumindest einem der vor­ stehenden Ansprüche, bei dem die OOV-Behandlung zur phonetischen Transkription des wei­ teren Bestandteils mittels eines regelbasierten Verfahrens erfolgt.
9. Verfahren zur Sprachsynthese nach zumindest einem der vor­ stehenden Ansprüche, bei dem die OOV-Behandlung zur phonetischen Transkription des wei­ teren Bestandteils mittels einer zweiten Datenbank erfolgt, die die phonetischen Transkription von bei zusammengesetzten Wörtern üblicherweise verwendeten Füllpartikeln enthält.
10. Anordnung zur Sprachsynthese mittels einer Graphem- Phonem-Umsetzung, die so ausgebildet ist,
dass für ein gegebenes Wort in einer Datenbank, die phone­ tische Transkriptionen von Wörtern enthält, Teilwörter des gegebenen Wortes suchbar sind,
mindestens ein Teilwort des gegebenen Wortes in der Daten­ bank auffindbar ist,
dass für das gefundene Teilwort eine in der Datenbank ver­ zeichnete phonetische Transkription auswählbar ist,
wobei das gegebene Wort neben dem gefundenen Teilwort min­ destens einen weiteren Bestandteil aufweist, der nicht in der Datenbank verzeichnet ist,
dass dieser weitere Bestandteil mittels einer OOV- Behandlung phonetisch transkribierbar ist und
die phonetische Transkription des gefundenen Teilwortes und die phonetische Transkription des weiteren Bestandteils zu­ sammensetzbar ist.
DE10042942A 2000-08-31 2000-08-31 Verfahren zur Sprachsynthese Expired - Fee Related DE10042942C2 (de)

Priority Applications (5)

Application Number Priority Date Filing Date Title
DE10042942A DE10042942C2 (de) 2000-08-31 2000-08-31 Verfahren zur Sprachsynthese
EP01113053A EP1184838B1 (de) 2000-08-31 2001-05-28 Phonetische Übersetzung für die Sprachsynthese
DE50107259T DE50107259D1 (de) 2000-08-31 2001-05-28 Phonetische Übersetzung für die Sprachsynthese
ES01113053T ES2244523T3 (es) 2000-08-31 2001-05-28 Traduccion fonetica para la sintesis de voz.
US09/942,736 US7333932B2 (en) 2000-08-31 2001-08-31 Method for speech synthesis

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE10042942A DE10042942C2 (de) 2000-08-31 2000-08-31 Verfahren zur Sprachsynthese

Publications (2)

Publication Number Publication Date
DE10042942A1 DE10042942A1 (de) 2002-03-28
DE10042942C2 true DE10042942C2 (de) 2003-05-08

Family

ID=7654521

Family Applications (2)

Application Number Title Priority Date Filing Date
DE10042942A Expired - Fee Related DE10042942C2 (de) 2000-08-31 2000-08-31 Verfahren zur Sprachsynthese
DE50107259T Expired - Lifetime DE50107259D1 (de) 2000-08-31 2001-05-28 Phonetische Übersetzung für die Sprachsynthese

Family Applications After (1)

Application Number Title Priority Date Filing Date
DE50107259T Expired - Lifetime DE50107259D1 (de) 2000-08-31 2001-05-28 Phonetische Übersetzung für die Sprachsynthese

Country Status (4)

Country Link
US (1) US7333932B2 (de)
EP (1) EP1184838B1 (de)
DE (2) DE10042942C2 (de)
ES (1) ES2244523T3 (de)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4072718B2 (ja) * 2002-11-21 2008-04-09 ソニー株式会社 音声処理装置および方法、記録媒体並びにプログラム
TWI233589B (en) * 2004-03-05 2005-06-01 Ind Tech Res Inst Method for text-to-pronunciation conversion capable of increasing the accuracy by re-scoring graphemes likely to be tagged erroneously
US7869999B2 (en) * 2004-08-11 2011-01-11 Nuance Communications, Inc. Systems and methods for selecting from multiple phonectic transcriptions for text-to-speech synthesis
TWI340330B (en) * 2005-11-14 2011-04-11 Ind Tech Res Inst Method for text-to-pronunciation conversion
DE102011118059A1 (de) 2011-11-09 2013-05-16 Elektrobit Automotive Gmbh Technik zur Ausgabe eines akustischen Signals mittels eines Navigationssystems
CN105206259A (zh) * 2015-11-03 2015-12-30 常州工学院 一种语音转换方法
CN110619866A (zh) * 2018-06-19 2019-12-27 普天信息技术有限公司 语音合成方法及装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19636739C1 (de) * 1996-09-10 1997-07-03 Siemens Ag Verfahren zur Mehrsprachenverwendung eines hidden Markov Lautmodelles in einem Spracherkennungssystem
DE19719381C1 (de) * 1997-05-07 1998-01-22 Siemens Ag Verfahren zur Spracherkennung durch einen Rechner
US5732388A (en) * 1995-01-10 1998-03-24 Siemens Aktiengesellschaft Feature extraction method for a speech signal
US6029135A (en) * 1994-11-14 2000-02-22 Siemens Aktiengesellschaft Hypertext navigation system controlled by spoken words
DE69420955T2 (de) * 1993-03-26 2000-07-13 British Telecomm Umwandlung von text in signalformen

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5283833A (en) * 1991-09-19 1994-02-01 At&T Bell Laboratories Method and apparatus for speech processing using morphology and rhyming
US5651095A (en) * 1993-10-04 1997-07-22 British Telecommunications Public Limited Company Speech synthesis using word parser with knowledge base having dictionary of morphemes with binding properties and combining rules to identify input word class
US5913194A (en) * 1997-07-14 1999-06-15 Motorola, Inc. Method, device and system for using statistical information to reduce computation and memory requirements of a neural network based speech synthesis system
US6108627A (en) * 1997-10-31 2000-08-22 Nortel Networks Corporation Automatic transcription tool
US6076060A (en) * 1998-05-01 2000-06-13 Compaq Computer Corporation Computer method and apparatus for translating text to sound
US6188984B1 (en) * 1998-11-17 2001-02-13 Fonix Corporation Method and system for syllable parsing
US6208968B1 (en) * 1998-12-16 2001-03-27 Compaq Computer Corporation Computer method and apparatus for text-to-speech synthesizer dictionary reduction
DE10042944C2 (de) * 2000-08-31 2003-03-13 Siemens Ag Graphem-Phonem-Konvertierung

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE69420955T2 (de) * 1993-03-26 2000-07-13 British Telecomm Umwandlung von text in signalformen
US6029135A (en) * 1994-11-14 2000-02-22 Siemens Aktiengesellschaft Hypertext navigation system controlled by spoken words
US5732388A (en) * 1995-01-10 1998-03-24 Siemens Aktiengesellschaft Feature extraction method for a speech signal
DE19636739C1 (de) * 1996-09-10 1997-07-03 Siemens Ag Verfahren zur Mehrsprachenverwendung eines hidden Markov Lautmodelles in einem Spracherkennungssystem
DE19719381C1 (de) * 1997-05-07 1998-01-22 Siemens Ag Verfahren zur Spracherkennung durch einen Rechner

Also Published As

Publication number Publication date
ES2244523T3 (es) 2005-12-16
DE10042942A1 (de) 2002-03-28
EP1184838A2 (de) 2002-03-06
US7333932B2 (en) 2008-02-19
EP1184838A3 (de) 2003-02-05
US20020026313A1 (en) 2002-02-28
DE50107259D1 (de) 2005-10-06
EP1184838B1 (de) 2005-08-31

Similar Documents

Publication Publication Date Title
EP0797185B1 (de) Verfahren und Vorrichtung zur Spracherkennung
DE60035001T2 (de) Sprachsynthese mit Prosodie-Mustern
DE69725802T2 (de) Vorfilterung mittels lexikalischer Bäumen für die Spracherkennung
EP1184839B1 (de) Graphem-Phonem-Konvertierung
DE60020660T2 (de) Kontextabhängige akustische Modelle für die Spracherkennung mit Eigenstimmenanpassung
DE60126564T2 (de) Verfahren und Anordnung zur Sprachsysnthese
DE60124559T2 (de) Einrichtung und verfahren zur spracherkennung
EP1611568B1 (de) Dreistufige einzelworterkennung
DE102008017993A1 (de) Sprachsuchvorrichtung
DE60313706T2 (de) Spracherkennungs- und -antwortsystem, Spracherkennungs- und -antwortprogramm und zugehöriges Aufzeichnungsmedium
WO2003060877A1 (de) Betriebsverfahren eines automatischen spracherkenners zur sprecherunabhängigen spracherkennung von worten aus verschiedenen sprachen und automatischer spracherkenner
EP1071075A2 (de) Verfahren zur Eingabe von Daten in ein System
DE19944608A1 (de) Erkennung einer in buchstabierter Form vorliegenden Sprachäußerungseingabe
WO2006111230A1 (de) Verfahren zur gezielten ermittlung eines vollständigen eingabedatensatzes in einem sprachdialogsystem
EP1134726A1 (de) Verfahren zur Erkennung von Sprachäusserungen nicht-muttersprachlicher Sprecher in einem Sprachverarbeitungssystem
DE10042942C2 (de) Verfahren zur Sprachsynthese
EP1282897B1 (de) Verfahren zum erzeugen einer sprachdatenbank für einen zielwortschatz zum trainieren eines spracherkennungssystems
EP0813734B1 (de) Verfahren zur erkennung mindestens eines definierten, durch hidden-markov-modelle modellierten musters in einem zeitvarianten messignal, welches von mindestens einem störsignal überlagert wird
DE60219030T2 (de) Verfahren zur mehrsprachigen Spracherkennung
EP2006835B1 (de) Verfahren zur Ermittlung einer Hypothesenliste aus einem Vokabular eines Spracherkennungssystems
WO2002046956A2 (de) Verfahren und vorrichtung zur automatischen auskunfterleitung mittels einer suchmaschine
WO1999005681A1 (de) Verfahren zum abspeichern von suchmerkmalen einer bildsequenz und zugriff auf eine bildfolge in der bildsequenz
EP0834859B1 (de) Verfahren zum Bestimmen eines akustischen Modells für ein Wort
DE102006006305A1 (de) Verfahren zur Aufbereitung von Informationen für ein Sprachdialogsystem
EP1078354B1 (de) Verfahren und anordnung zur bestimmung spektraler sprachcharakteristika in einer gesprochenen äusserung

Legal Events

Date Code Title Description
OP8 Request for examination as to paragraph 44 patent law
8304 Grant after examination procedure
8364 No opposition during term of opposition
R119 Application deemed withdrawn, or ip right lapsed, due to non-payment of renewal fee
R119 Application deemed withdrawn, or ip right lapsed, due to non-payment of renewal fee

Effective date: 20150303