DE10042942C2 - Verfahren zur Sprachsynthese - Google Patents
Verfahren zur SprachsyntheseInfo
- Publication number
- DE10042942C2 DE10042942C2 DE10042942A DE10042942A DE10042942C2 DE 10042942 C2 DE10042942 C2 DE 10042942C2 DE 10042942 A DE10042942 A DE 10042942A DE 10042942 A DE10042942 A DE 10042942A DE 10042942 C2 DE10042942 C2 DE 10042942C2
- Authority
- DE
- Germany
- Prior art keywords
- word
- found
- partial
- database
- phonetic transcription
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/08—Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
Description
Die Erfindung betrifft ein Verfahren, eine Anordnung und ein
Computerprogrammprodukt zur Sprachsynthese mittels Graphem-
Phonem-Umsetzung.
Sprachverarbeitungsverfahren sind beispielsweise aus US 6 029 135,
US 5 732 388, DE 196 36 739 C1 und DE 197 19 381 C1
bekannt. In nicht gesprochener Form gespeicherter Text lässt
sich über eine Sprachsynthese als Sprache ausgeben. Dazu wer
den in der Regel die einzelnen Wörter des Textes in einer Da
tenbank gesucht, die die phonetischen Transkriptionen zahl
reicher Wörter enthält. Die phonetischen Transkriptionen der
in der Datenbank gefundenen Wörter werden zusammengesetzt und
können als Sprache ausgegeben werden.
Da aber keine Datenbank vollständig ist, was in der Regel zur
Reduktion der Datenbankgröße durchaus beabsichtigt ist, kommt
es immer wieder vor, dass ein Text Wörter enthält, die in der
Datenbank nicht gefunden werden. Diese Wörter werden dann mit
einer Out-of-Vocabulary-Behandlung (OOV-Behandlung) phone
tisch transkribiert. Eine solche Behandlung ist etwa aus DE 694 20 955 T2
bekannt. Dabei wird jedes Wort jeweils aus den
einzelnen Buchstaben oder Wortteilen des Wortes zugeordneten
Phonemen zusammengesetzt. Solche OOV-Behandlungen sind aller
dings relativ rechenintensiv und führen in aller Regel zu
schlechteren Ergebnissen als die phonetische Transkription
ganzer Wörter aufgrund von Datenbankeinträgen.
Weiterhin ist es bekannt, die phonetische Transkription eines
gegebenen Wortes aus den phonetischen Transkriptionen seiner
Teilwörter zusammenzusetzen, wenn das gegebene Wort aus
schließlich aus diesen Teilwörtern besteht.
Davon ausgehend liegt der Erfindung die Aufgabe zugrunde,
Sprachsynthese dahingehend zu verbessern, dass in größerem
Umfang auf in einer Datenbank angegebene phonetische
Transkriptionen von Wörtern zurückgegriffen werden kann und
nur noch in geringerem Maße OOV-Behandlungen verwendet werden
müssen.
Diese Aufgabe wird durch ein Verfahren und eine Anordnung
mit den Merkmalen der unabhängi
gen Patentansprüche gelöst.
Durch das Verfahren oder die Anordnung
ist es möglich, auch dann für ein gegebenes Wort auf
die phonetischen Transkriptionen seiner Teilwörter zurückzu
greifen, wenn sich das gegebene Wort nicht vollständig aus in
der Datenbank enthaltenen Teilwörtern zusammensetzen lässt.
Der wesentliche Gedanke ist dabei, dass erstmals eine hybride
Vorgehensweise zum Einsatz kommt, bei der für dasselbe gege
bene Wort sowohl die phonetische Transkription vollständiger
Teilwörter, als auch eine OOV-Behandlung zum Einsatz kommt.
In einer bevorzugten Weiterbildung erfolgt die OOV-Behandlung
zur phonetischen Transkription des weiteren Bestandteils in
Abhängigkeit der phonetischen Transkription des gefundenen
Teilwortes. Hierdurch lässt sich die Qualität der Sprachsyn
these für den weiteren Bestandteil gegenüber einer entspre
chenden reinen OOV-Behandlung des gesamten Wortes deutlich
steigern. Dies liegt zum einen daran, dass die phonetische
Transkription des gefundenen Teilwortes sehr viel sicherer
ist als es eine phonetische Transkription dieses Teilwortes
durch einen OOV-Behandlung wäre. Dadurch kann bei der OOV-
Behandlung des weiteren Bestandteils von einem sicheren pho
netischen Kontext ausgegangen werden, was die OOV-Behandlung
mit sehr viel größerer Wahrscheinlichkeit zum richtigen Er
gebnis kommen lässt. Zum anderen ist die phonetische
Transkription des gefundenen Teilwortes sehr viel länger als
die üblicherweise bei einer OOV-Behandlung verwendeten Phone
me. Deshalb ist der phonetische Kontext nicht nur sicherer,
sondern auch länger, so dass die OOV-Behandlung für den weiteren
Bestandteil aufgrund einer größeren Menge relevanter
Informationen durchgeführt werden kann. Dieser Vorteil muss
für die beanspruchte bevorzugte Weiterbildung allerdings
nicht unbedingt ausgenutzt werden. Unter bestimmten Bedingun
gen kann es auch sinnvoll sein, wenn für die OOV-Behandlung
zur phonetischen Transkription des weiteren Bestandteils in
Abhängigkeit der phonetischen Transkription des gefundenen
Teilwortes lediglich der Teil des Teilwortes berücksichtigt
wird, der dem weiteren Bestandteil unmittelbar benachbart
ist.
Besonders vorteilhaft wird das Verfahren, wenn es nicht nach
dem Auffinden eines ersten Teilwortes abgebrochen wird, son
dern wenn noch weitere Teilwörter im gegebenen Wort gesucht
werden. So wird ein möglichst großer Abschnitt des gegebenen
Wortes aus Teilwörtern zusammengesetzt, für die in der Daten
bank zuverlässige Informationen vorliegen, und lediglich der
verbleibende, meist kleine weitere Bestandteil des Wortes
muss einer OOV-Behandlung unterzogen werden.
Steht dieser verbleibende weitere Bestandteil zwischen zwei
gefundenen Teilwörtern so wird die OOV-Behandlung vorzugswei
se in Abhängigkeit beider gefundener Teilbereiche vorgenom
men. Dann ist nämlich sowohl der linke als auch der rechte
phonetische Kontext des weiteren Bestandteils sicher vorgege
ben, weshalb sich die OOV-Behandlung mit exzellenten Ergeb
nissen durchführen lässt.
Die Suche nach Teilwörtern in der Datenbank lässt sich durch
verschiedene Maßnahmen optimieren. So sollte zum Beispiel nur
nach Teilwörtern gesucht werden, die eine vorgegebene Min
destlänge aufweisen. Als Mindestlänge hat sich in der Praxis
eine Länge von 5 Buchstaben herausgestellt, wobei bei anderen
Rahmenbedingungen, zum Beispiel für eine andere Sprache, auch
Mindestlängen von 3, 4 oder 6 Buchstaben sinnvoll sein kön
nen.
Weiterhin wird das Suchergebnis verbessert, wenn die Suche
für einen Wortteil des gegebenen Wortes nicht sofort nach dem
Auffinden des ersten passenden Teilwortes abgebrochen wird,
sondern noch nach anderen möglichen Teilwörtern gesucht wird.
Dies kann zum Beispiel erfolgen, indem der Wortteil um weite
re Buchstaben ergänzt wird. In der Regel ergibt sich bei die
ser Vorgehensweise das beste Ergebnis, wenn von mehreren ge
fundenen Teilwörtern dasjenige ausgewählt wird, das am längs
ten ist. Es kann allerdings auch ein kürzeres Teilwort ausge
wählt werden, wenn dieses kürzere Teilwort in Verbindung mit
einem in der Datenbank gefundenen und im gegebenen Wort ent
haltenen längeren Teilwort einen größeren Teil des gegebenen
Wortes darstellt, als das gefundene längere Teilwort für sich
alleine, wenn dieses nicht mit dem gefundenen zweiten Teil
wort kombiniert werden kann.
Die OOV-Behandlung zur phonetischen Transkription des weite
ren Bestandteils kann mittels eines neuronalen Netzes erfol
gen.
Alternativ oder ergänzend kann für die OOV-Behandlung zur
phonetischen Transkription des weiteren Bestandteils eine re
gelbasiertes Verfahren oder ein DTW-Verfahren zum Einsatz
kommen. Ein solches Verfahren ist zum Beispiel in Rüdiger
Hoffmann "Signalanalyse und -erkennung", Springer Verlag,
Berlin, 1998, beschrieben.
Die OOV-Behandlung kann allerdings auch mittels einer zweiten
Datenbank erfolgen, die die phonetischen Transkription von
bei zusammengesetzten Wörtern üblicherweise verwendeten Füll
partikeln enthält. Im Deutschen sind dies insbesondere Dativ-
und Genitivendungen, die bei zusammengesetzten Wörtern an das
jeweils vorne stehende Wort angehängt werden.
Das erfindungsgemäße Verfahren läßt sich auch als ein Computerprogrammprodukt
zur Sprachsynthese mittels einer Graphem-Phonem-Umsetzung realisieren,
bei dem beim Ablauf auf zumindest einer Prozessoreinheit für
ein gegebenes Wort in einer Datenbank, die phonetische
Transkriptionen von Wörtern enthält, nach Teilwörtern des ge
gebenen Wortes gesucht wird, mindestens ein Teilwort des ge
gebenen Wortes in der Datenbank gefunden wird, für das gefun
dene Teilwort eine in der Datenbank verzeichnete phonetische
Transkription gewählt wird, das gegebene Wort neben dem ge
fundenen Teilwort mindestens einen weiteren Bestandteil auf
weist, der nicht in der Datenbank verzeichnet ist, dieser
weitere Bestandteil mittels einer OOV-Behandlung phonetisch
transkribiert wird und die phonetische Transkription des ge
fundenen Teilwortes und die phonetische Transkription des
weiteren Bestandteils zusammengesetzt wird.
Weitere Merkmale und Vorteile der Erfindung erge
ben sich aus der Beschreibung eines Ausführungsbeispiels an
hand der Zeichnung; dabei zeigt
Fig. 1 eine schematische Darstellung des Ablaufs des Verfah
rens und
Fig. 2 eine schematische Darstellung eines zwischen zwei
Teilwörtern stehenden weiteren Bestandteils eines ge
gebenen Wortes.
Das Verfahren soll am Beispiel des gegebenen deutschen Wortes
"Trainingslager" erläutert werden. Es sollen nur Teilwörter
mit einer Mindestlänge von fünf Buchstaben gesucht werden. Im
Schritt S1 gemäß Fig. 1 wird für das gegebene Wort in einer
Datenbank, die phonetische Transkriptionen von Wörtern ent
hält, nach Teilwörtern des gegebenen Wortes gesucht. Da die
Mindestlänge auf fünf Buchstaben gesetzt ist, wird mit der
Suche nach dem Wort "Train" angefangen. In einer deutschspra
chigen Datenbank wird dieses Wort nicht gefunden. Enthält die
Datenbank auch englischsprachige Wörter, so ist bereits jetzt
das erste Teilwort des gegebenen Wortes gefunden. Vorzugswei
se wird aber nicht nur im ersten, sondern auch im zweiten
Fall weitergesucht. Dies geschieht durch die Suche nach dem
Wort "Traini". Diese Buchstabenkombination wird in der Daten
bank nicht gefunden. Das Gleiche gilt für die danach gesuchte
Buchstabenkombination "Trainin".
Dagegen wird die nächste Buchstabenkombination "Training" in
der Datenbank gefunden. Trotzdem wird auch in diesem Fall
vorzugsweise weitergesucht, nämlich nach der Buchstabenkombi
nation "Trainings" und den in entsprechender Fortsetzung die
ses Suchschrittes gebildeten längeren Buchstabenkombinationen
des gegebenen Wortes. Unter der Voraussetzung, dass das gege
bene Wort "Trainingslager" in seiner Gesamtheit nicht in der
Datenbank gefunden wird, werden keine weiteren Teilwörter in
der Datenbank gefunden.
Für den Fall einer englisch- und deutschsprachigen Datenbank
wird aus den beiden gefundenen Teilwörtern "Train" und "Trai
ning" das längere Teilwort "Training" ausgewählt. Dieser Aus
wahlschritt entfällt im Beispielfall für eine rein deutsch
sprachige Datenbank.
Im Schritt S3 wird für das gefundene Teilwort "Training" die
in der Datenbank verzeichnete phonetische Transkription ge
wählt.
Gemäß dem Schritt S4 wird festgestellt, dass das gegebene
Wort "Trainingslager" neben dem gefundenen Teilwort "Trai
ning" einen weiteren Bestandteil "slager" aufweist, der nicht
in der Datenbank verzeichnet ist.
Dieser weitere Bestandteil "slager" wird dann im Schritt S5
mittels einer OOV-Behandlung phonetisch transkribiert. Diese
OOV-Behandlung basiert vorzugsweise auf einer Umsetzung der
einzelnen Grapheme des weiteren Bestandteils "slager" in Pho
neme mittels eines neuronalen Netzes. Die Phoneme werden
durch das neuronale Netz so ausgewählt und zusammengesetzt,
dass sich für den weiteren Bestandteil für sich genommen eine
möglichst gute Sprachsynthese ergibt.
Für ein noch besseres Sprachsyntheseergebnis erfolgt die OOV-
Behandlung zur phonetischen Transkription des weiteren Be
standteils "slager" in Abhängigkeit der aus der Datenbank ge
wählten phonetischen Transkription des gefundenen Teilwortes
"Training". Das gefundene Teilwort "Training" bzw. seine pho
netische Transkription gibt im gewählten Beispiel den linken
phonetischen Kontext des weiteren Bestandteils "slager" si
cher vor. Das für die OOV-Behandlung des weiteren Bestand
teils "slager" verwendete neuronale Netz kann deshalb von ei
nem sicheren Ergebnis der dem weiteren Bestandteil vorausge
gangenen Silben des gegebenen Wortes ausgehen und ein entsprechend
sicheres Ergebnis für die phonetische Transkription
des weiteren Bestandteils liefern.
Im letzten Schritt S6 des Verfahrens zur Sprachsynthese wird
schließlich die phonetische Transkription des gefundenen
Teilwortes "Training" und die phonetische Transkription des
weiteren Bestandteils "slager" zusammengesetzt.
Das Sprachsyntheseergebnis lässt sich weiter verbessern, wenn
nicht nur vom Anfang des gegebenen Wortes beginnend Teilwör
ter gesucht werden, sondern die Suche auch von anderen Berei
chen des gegebenen Wortes aus gestartet wird. Ist für das
Teilwort eine bestimmte Mindestlänge i vorgegeben, so emp
fiehlt sich der Beginn der weiteren Suche beim i + ersten Buch
staben. Im gegebenen Beispiel wird dann für i = 5 die weitere
Suche mit der Buchstabenfolge "ingsl" gestartet, die ihrer
seits wiederum die gegebene Mindestlänge aufweist. Diese
Buchstabenfolge würde in der Datenbank nicht gefunden. Das
gleiche gilt für die danach gesuchten Buchstabenfolgen "ings
la", "ingslag" usw.
Da bei dieser weiteren Suche keinerlei Teilwort gefunden
wird, wird die darauffolgende Suche nicht beim Buchstaben
2.i + 1 gestartet, sondern schon bei i + 2. Allerdings führt auch
die Suchsequenz "ngsla", "ngslag" usw. zu keinem Ergebnis.
Nach dem Durchführen weiterer entsprechender Suchen wird al
lerdings in der letzten Suche das weitere Teilwort "lager"
gefunden. Dieses weitere gefundene Teilwort "lager" entstammt
nicht dem Wortteil des Wortes "Trainingslager", für den das
erste Teilwort "Training" gefunden wurde. Deshalb muss im
Beispiel keine Auswahl zwischen den beiden Teilwörtern ge
troffen werden.
Vielmehr verbleibt als weiterer Bestandteil des gegebenen
Wortes "Trainingslager" nurmehr der Buchstabe "s". Dieser
einzelne Buchstabe "s" lässt sich sehr leicht mittels einer
OOV-Behandlung phonetischen transkribieren. Hierbei kommt
noch erleichternd hinzu, dass gemäß Fig. 2 für das Zentrum 2
"s" sowohl der linke Kontext 1 "Training" als auch der rechte
Kontext 3 "lager" bekannt ist.
Statt der OOV-Behandlung durch ein neuronales Netz, wie sie
oben beschrieben wurde, kann in diesem Fall die OOV-
Behandlung auch durch eine Suche in einer weiteren Datenbank
erfolgen, in der die phonetischen Transkriptionen von bei zu
sammengesetzten Wörtern üblicherweise verwendeten Füllparti
keln enthalten sind. Das Genitivs des vorliegenden Beispiels
ist ein solcher üblicherweise verwendeter Füllpartikel. Es
würde deshalb in der zweiten Datenbank gefunden und die zuge
hörige phonetische Transkription gewählt werden.
Alternativ lassen sich für die OOV-Behandlung aber auch re
gelbasierte Verfahren und DTW-Verfahren einsetzen. In jedem
Fall sind bessere phonetische Transkriptionen des weiteren
Bestandteils zu erwarten, wenn bei der OOV-Behandlung zur
phonetischen Transkription des weiteren Bestandteils die pho
netische Transkription mehrerer oder aller gefundenen Teil
wörter berücksichtigt wird. Dies ist natürlich insbesondere
der Fall, wenn der weitere Bestandteil im Wort zwischen zwei
gefundenen Teilwörtern angeordnet ist.
In einem letzten Schritt wird dann schließlich die phoneti
sche Transkription des gefundenen Teilworts "Training", die
phonetische Transkription des weiteren gefundenen Teilwortes
"lager" und die phonetische Transkription des weiteren Be
standteils "s" zur Sprachsynthese zusammengesetzt.
Die erfindungsgemäße Anordnung lässt sich in Form eines Com
putersystems realisieren, das programmiert wird, ein entspre
chendes Verfahren auszuführen.
Claims (10)
1. Verfahren zur Sprachsynthese mittels einer Graphem-Phonem-
Umsetzung, bei dem
für ein gegebenes Wort in einer Datenbank, die phonetische Transkriptionen von Wörtern enthält, nach Teilwörtern des ge gebenen Wortes gesucht wird,
mindestens ein Teilwort des gegebenen Wortes in der Daten bank gefunden wird,
für das gefundene Teilwort eine in der Datenbank verzeich nete phonetische Transkription gewählt wird,
das gegebene Wort neben dem gefundenen Teilwort mindestens einen weiteren Bestandteil aufweist, der nicht in der Daten bank verzeichnet ist,
dieser weitere Bestandteil mittels einer OOV-Behandlung phonetisch transkribiert wird und
die phonetische Transkription des gefundenen Teilwortes und die phonetische Transkription des weiteren Bestandteils zu sammengesetzt wird.
für ein gegebenes Wort in einer Datenbank, die phonetische Transkriptionen von Wörtern enthält, nach Teilwörtern des ge gebenen Wortes gesucht wird,
mindestens ein Teilwort des gegebenen Wortes in der Daten bank gefunden wird,
für das gefundene Teilwort eine in der Datenbank verzeich nete phonetische Transkription gewählt wird,
das gegebene Wort neben dem gefundenen Teilwort mindestens einen weiteren Bestandteil aufweist, der nicht in der Daten bank verzeichnet ist,
dieser weitere Bestandteil mittels einer OOV-Behandlung phonetisch transkribiert wird und
die phonetische Transkription des gefundenen Teilwortes und die phonetische Transkription des weiteren Bestandteils zu sammengesetzt wird.
2. Verfahren zur Sprachsynthese nach Anspruch 1, bei dem
die OOV-Behandlung zur phonetischen Transkription des wei
teren Bestandteils in Abhängigkeit der phonetischen
Transkription des gefundenen Teilwortes erfolgt.
3. Verfahren zur Sprachsynthese nach Anspruch 1 oder 2, bei
dem
für das gefundene Wort in der Datenbank nach weiteren Teil wörtern des Wortes gesucht wird,
mindestens ein weiteres Teilwort des gegebenen Wortes in der Datenbank gefunden wird,
für dieses gefundene weitere Teilwort eine in der Datenbank verzeichnete phonetische Transkription gewählt wird und
die phonetische Transkription des gefundenen Teilworts, die phonetische Transkription des weiteren gefundenen Teilworts und die phonetische Transkription des weiteren Bestandteils zusammengesetzt wird.
für das gefundene Wort in der Datenbank nach weiteren Teil wörtern des Wortes gesucht wird,
mindestens ein weiteres Teilwort des gegebenen Wortes in der Datenbank gefunden wird,
für dieses gefundene weitere Teilwort eine in der Datenbank verzeichnete phonetische Transkription gewählt wird und
die phonetische Transkription des gefundenen Teilworts, die phonetische Transkription des weiteren gefundenen Teilworts und die phonetische Transkription des weiteren Bestandteils zusammengesetzt wird.
4. Verfahren zur Sprachsynthese nach Anspruch 3, bei dem
der weitere Bestandteil im gegebenen Wort zwischen dem ge fundenen Teilwort und dem gefundenen weiteren Teilwort ange ordnet ist und
die OOV-Behandlung zur phonetischen Transkription des wei teren Bestandteils in Abhängigkeit der phonetischen Transkription des gefundenen Teilwortes und der phonetischen Transkription des gefundenen weiteren Teilworts erfolgt.
der weitere Bestandteil im gegebenen Wort zwischen dem ge fundenen Teilwort und dem gefundenen weiteren Teilwort ange ordnet ist und
die OOV-Behandlung zur phonetischen Transkription des wei teren Bestandteils in Abhängigkeit der phonetischen Transkription des gefundenen Teilwortes und der phonetischen Transkription des gefundenen weiteren Teilworts erfolgt.
5. Verfahren zur Sprachsynthese nach zumindest einem der vor
stehenden Ansprüchen, bei dem
nur nach Teilwörtern gesucht wird, die mindestens eine vor
gegebene Mindestlänge aufweisen.
6. Verfahren zur Sprachsynthese nach zumindest einem der vor
stehenden Ansprüche, bei dem
wenn für denselben Wortteil des gegebenen Wortteiles mehre
re Teilwörter gefunden werden, von diesem das längste Teil
wort ausgewählt wird.
7. Verfahren zur Sprachsynthese nach zumindest einem der vor
stehenden Ansprüche, bei dem
die OOV-Behandlung zur phonetischen Transkription des wei
teren Bestandteils mittels eines neuronalen Netzes erfolgt.
8. Verfahren zur Sprachsynthese nach zumindest einem der vor
stehenden Ansprüche, bei dem
die OOV-Behandlung zur phonetischen Transkription des wei
teren Bestandteils mittels eines regelbasierten Verfahrens
erfolgt.
9. Verfahren zur Sprachsynthese nach zumindest einem der vor
stehenden Ansprüche, bei dem
die OOV-Behandlung zur phonetischen Transkription des wei
teren Bestandteils mittels einer zweiten Datenbank erfolgt,
die die phonetischen Transkription von bei zusammengesetzten
Wörtern üblicherweise verwendeten Füllpartikeln enthält.
10. Anordnung zur Sprachsynthese mittels einer Graphem-
Phonem-Umsetzung, die so ausgebildet ist,
dass für ein gegebenes Wort in einer Datenbank, die phone tische Transkriptionen von Wörtern enthält, Teilwörter des gegebenen Wortes suchbar sind,
mindestens ein Teilwort des gegebenen Wortes in der Daten bank auffindbar ist,
dass für das gefundene Teilwort eine in der Datenbank ver zeichnete phonetische Transkription auswählbar ist,
wobei das gegebene Wort neben dem gefundenen Teilwort min destens einen weiteren Bestandteil aufweist, der nicht in der Datenbank verzeichnet ist,
dass dieser weitere Bestandteil mittels einer OOV- Behandlung phonetisch transkribierbar ist und
die phonetische Transkription des gefundenen Teilwortes und die phonetische Transkription des weiteren Bestandteils zu sammensetzbar ist.
dass für ein gegebenes Wort in einer Datenbank, die phone tische Transkriptionen von Wörtern enthält, Teilwörter des gegebenen Wortes suchbar sind,
mindestens ein Teilwort des gegebenen Wortes in der Daten bank auffindbar ist,
dass für das gefundene Teilwort eine in der Datenbank ver zeichnete phonetische Transkription auswählbar ist,
wobei das gegebene Wort neben dem gefundenen Teilwort min destens einen weiteren Bestandteil aufweist, der nicht in der Datenbank verzeichnet ist,
dass dieser weitere Bestandteil mittels einer OOV- Behandlung phonetisch transkribierbar ist und
die phonetische Transkription des gefundenen Teilwortes und die phonetische Transkription des weiteren Bestandteils zu sammensetzbar ist.
Priority Applications (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE10042942A DE10042942C2 (de) | 2000-08-31 | 2000-08-31 | Verfahren zur Sprachsynthese |
EP01113053A EP1184838B1 (de) | 2000-08-31 | 2001-05-28 | Phonetische Übersetzung für die Sprachsynthese |
DE50107259T DE50107259D1 (de) | 2000-08-31 | 2001-05-28 | Phonetische Übersetzung für die Sprachsynthese |
ES01113053T ES2244523T3 (es) | 2000-08-31 | 2001-05-28 | Traduccion fonetica para la sintesis de voz. |
US09/942,736 US7333932B2 (en) | 2000-08-31 | 2001-08-31 | Method for speech synthesis |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE10042942A DE10042942C2 (de) | 2000-08-31 | 2000-08-31 | Verfahren zur Sprachsynthese |
Publications (2)
Publication Number | Publication Date |
---|---|
DE10042942A1 DE10042942A1 (de) | 2002-03-28 |
DE10042942C2 true DE10042942C2 (de) | 2003-05-08 |
Family
ID=7654521
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE10042942A Expired - Fee Related DE10042942C2 (de) | 2000-08-31 | 2000-08-31 | Verfahren zur Sprachsynthese |
DE50107259T Expired - Lifetime DE50107259D1 (de) | 2000-08-31 | 2001-05-28 | Phonetische Übersetzung für die Sprachsynthese |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE50107259T Expired - Lifetime DE50107259D1 (de) | 2000-08-31 | 2001-05-28 | Phonetische Übersetzung für die Sprachsynthese |
Country Status (4)
Country | Link |
---|---|
US (1) | US7333932B2 (de) |
EP (1) | EP1184838B1 (de) |
DE (2) | DE10042942C2 (de) |
ES (1) | ES2244523T3 (de) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4072718B2 (ja) * | 2002-11-21 | 2008-04-09 | ソニー株式会社 | 音声処理装置および方法、記録媒体並びにプログラム |
TWI233589B (en) * | 2004-03-05 | 2005-06-01 | Ind Tech Res Inst | Method for text-to-pronunciation conversion capable of increasing the accuracy by re-scoring graphemes likely to be tagged erroneously |
US7869999B2 (en) * | 2004-08-11 | 2011-01-11 | Nuance Communications, Inc. | Systems and methods for selecting from multiple phonectic transcriptions for text-to-speech synthesis |
TWI340330B (en) * | 2005-11-14 | 2011-04-11 | Ind Tech Res Inst | Method for text-to-pronunciation conversion |
DE102011118059A1 (de) | 2011-11-09 | 2013-05-16 | Elektrobit Automotive Gmbh | Technik zur Ausgabe eines akustischen Signals mittels eines Navigationssystems |
CN105206259A (zh) * | 2015-11-03 | 2015-12-30 | 常州工学院 | 一种语音转换方法 |
CN110619866A (zh) * | 2018-06-19 | 2019-12-27 | 普天信息技术有限公司 | 语音合成方法及装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE19636739C1 (de) * | 1996-09-10 | 1997-07-03 | Siemens Ag | Verfahren zur Mehrsprachenverwendung eines hidden Markov Lautmodelles in einem Spracherkennungssystem |
DE19719381C1 (de) * | 1997-05-07 | 1998-01-22 | Siemens Ag | Verfahren zur Spracherkennung durch einen Rechner |
US5732388A (en) * | 1995-01-10 | 1998-03-24 | Siemens Aktiengesellschaft | Feature extraction method for a speech signal |
US6029135A (en) * | 1994-11-14 | 2000-02-22 | Siemens Aktiengesellschaft | Hypertext navigation system controlled by spoken words |
DE69420955T2 (de) * | 1993-03-26 | 2000-07-13 | British Telecomm | Umwandlung von text in signalformen |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5283833A (en) * | 1991-09-19 | 1994-02-01 | At&T Bell Laboratories | Method and apparatus for speech processing using morphology and rhyming |
US5651095A (en) * | 1993-10-04 | 1997-07-22 | British Telecommunications Public Limited Company | Speech synthesis using word parser with knowledge base having dictionary of morphemes with binding properties and combining rules to identify input word class |
US5913194A (en) * | 1997-07-14 | 1999-06-15 | Motorola, Inc. | Method, device and system for using statistical information to reduce computation and memory requirements of a neural network based speech synthesis system |
US6108627A (en) * | 1997-10-31 | 2000-08-22 | Nortel Networks Corporation | Automatic transcription tool |
US6076060A (en) * | 1998-05-01 | 2000-06-13 | Compaq Computer Corporation | Computer method and apparatus for translating text to sound |
US6188984B1 (en) * | 1998-11-17 | 2001-02-13 | Fonix Corporation | Method and system for syllable parsing |
US6208968B1 (en) * | 1998-12-16 | 2001-03-27 | Compaq Computer Corporation | Computer method and apparatus for text-to-speech synthesizer dictionary reduction |
DE10042944C2 (de) * | 2000-08-31 | 2003-03-13 | Siemens Ag | Graphem-Phonem-Konvertierung |
-
2000
- 2000-08-31 DE DE10042942A patent/DE10042942C2/de not_active Expired - Fee Related
-
2001
- 2001-05-28 DE DE50107259T patent/DE50107259D1/de not_active Expired - Lifetime
- 2001-05-28 ES ES01113053T patent/ES2244523T3/es not_active Expired - Lifetime
- 2001-05-28 EP EP01113053A patent/EP1184838B1/de not_active Expired - Lifetime
- 2001-08-31 US US09/942,736 patent/US7333932B2/en not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE69420955T2 (de) * | 1993-03-26 | 2000-07-13 | British Telecomm | Umwandlung von text in signalformen |
US6029135A (en) * | 1994-11-14 | 2000-02-22 | Siemens Aktiengesellschaft | Hypertext navigation system controlled by spoken words |
US5732388A (en) * | 1995-01-10 | 1998-03-24 | Siemens Aktiengesellschaft | Feature extraction method for a speech signal |
DE19636739C1 (de) * | 1996-09-10 | 1997-07-03 | Siemens Ag | Verfahren zur Mehrsprachenverwendung eines hidden Markov Lautmodelles in einem Spracherkennungssystem |
DE19719381C1 (de) * | 1997-05-07 | 1998-01-22 | Siemens Ag | Verfahren zur Spracherkennung durch einen Rechner |
Also Published As
Publication number | Publication date |
---|---|
ES2244523T3 (es) | 2005-12-16 |
DE10042942A1 (de) | 2002-03-28 |
EP1184838A2 (de) | 2002-03-06 |
US7333932B2 (en) | 2008-02-19 |
EP1184838A3 (de) | 2003-02-05 |
US20020026313A1 (en) | 2002-02-28 |
DE50107259D1 (de) | 2005-10-06 |
EP1184838B1 (de) | 2005-08-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP0797185B1 (de) | Verfahren und Vorrichtung zur Spracherkennung | |
DE60035001T2 (de) | Sprachsynthese mit Prosodie-Mustern | |
DE69725802T2 (de) | Vorfilterung mittels lexikalischer Bäumen für die Spracherkennung | |
EP1184839B1 (de) | Graphem-Phonem-Konvertierung | |
DE60020660T2 (de) | Kontextabhängige akustische Modelle für die Spracherkennung mit Eigenstimmenanpassung | |
DE60126564T2 (de) | Verfahren und Anordnung zur Sprachsysnthese | |
DE60124559T2 (de) | Einrichtung und verfahren zur spracherkennung | |
EP1611568B1 (de) | Dreistufige einzelworterkennung | |
DE102008017993A1 (de) | Sprachsuchvorrichtung | |
DE60313706T2 (de) | Spracherkennungs- und -antwortsystem, Spracherkennungs- und -antwortprogramm und zugehöriges Aufzeichnungsmedium | |
WO2003060877A1 (de) | Betriebsverfahren eines automatischen spracherkenners zur sprecherunabhängigen spracherkennung von worten aus verschiedenen sprachen und automatischer spracherkenner | |
EP1071075A2 (de) | Verfahren zur Eingabe von Daten in ein System | |
DE19944608A1 (de) | Erkennung einer in buchstabierter Form vorliegenden Sprachäußerungseingabe | |
WO2006111230A1 (de) | Verfahren zur gezielten ermittlung eines vollständigen eingabedatensatzes in einem sprachdialogsystem | |
EP1134726A1 (de) | Verfahren zur Erkennung von Sprachäusserungen nicht-muttersprachlicher Sprecher in einem Sprachverarbeitungssystem | |
DE10042942C2 (de) | Verfahren zur Sprachsynthese | |
EP1282897B1 (de) | Verfahren zum erzeugen einer sprachdatenbank für einen zielwortschatz zum trainieren eines spracherkennungssystems | |
EP0813734B1 (de) | Verfahren zur erkennung mindestens eines definierten, durch hidden-markov-modelle modellierten musters in einem zeitvarianten messignal, welches von mindestens einem störsignal überlagert wird | |
DE60219030T2 (de) | Verfahren zur mehrsprachigen Spracherkennung | |
EP2006835B1 (de) | Verfahren zur Ermittlung einer Hypothesenliste aus einem Vokabular eines Spracherkennungssystems | |
WO2002046956A2 (de) | Verfahren und vorrichtung zur automatischen auskunfterleitung mittels einer suchmaschine | |
WO1999005681A1 (de) | Verfahren zum abspeichern von suchmerkmalen einer bildsequenz und zugriff auf eine bildfolge in der bildsequenz | |
EP0834859B1 (de) | Verfahren zum Bestimmen eines akustischen Modells für ein Wort | |
DE102006006305A1 (de) | Verfahren zur Aufbereitung von Informationen für ein Sprachdialogsystem | |
EP1078354B1 (de) | Verfahren und anordnung zur bestimmung spektraler sprachcharakteristika in einer gesprochenen äusserung |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
OP8 | Request for examination as to paragraph 44 patent law | ||
8304 | Grant after examination procedure | ||
8364 | No opposition during term of opposition | ||
R119 | Application deemed withdrawn, or ip right lapsed, due to non-payment of renewal fee | ||
R119 | Application deemed withdrawn, or ip right lapsed, due to non-payment of renewal fee |
Effective date: 20150303 |