EP1184838A2

EP1184838A2 - Phonetic transcription for speech synthesis

Info

Publication number: EP1184838A2
Application number: EP01113053A
Authority: EP
Inventors: Horst-Udo Hain
Original assignee: Siemens AG
Current assignee: Siemens AG
Priority date: 2000-08-31
Filing date: 2001-05-28
Publication date: 2002-03-06
Anticipated expiration: 2021-05-28
Also published as: DE10042942A1; US7333932B2; US20020026313A1; EP1184838B1; ES2244523T3; EP1184838A3; DE10042942C2; DE50107259D1

Abstract

Die Erfindung betrifft ein Verfahren, eine Anordnung und ein Computerprogrammprodukt zur Sprachsynthese mittels einer Graphem-Phonem-Umsetzung. Dabei wird für ein gegebenes Wort in einer Datenbank, die phonetische Transkriptionen von Wörtern enthält, nach Teilwörtern des gegebenen Wortes gesucht. Wird mindestens ein Teilwort des gegebenen Wortes in der Datenbank gefunden, so wird für das gefundene Teilwort eine in der Datenbank verzeichnete phonetische Transkription gewählt. Das gegebene Wort weist neben dem gefundenen Teilwort mindestens einen weiteren Bestandteil auf, der nicht in der Datenbank verzeichnet ist. Dieser weitere Bestandteil wird mittels einer OOV-Behandlung phonetisch transkribiert wird und die phonetische Transkription des gefundenen Teilwortes und die phonetische Transkription des weiteren Bestandteils wird zusammengesetzt.The invention relates to a method, an arrangement and a computer program product for speech synthesis by means of a grapheme-phoneme conversion. For a given word, a database containing phonetic transcriptions of words is searched for partial words of the given word. If at least one partial word of the given word is found in the database, a phonetic transcription recorded in the database is selected for the partial word found. In addition to the partial word found, the given word has at least one further component that is not recorded in the database. This additional component is transcribed phonetically using OOV treatment, and the phonetic transcription of the partial word found and the phonetic transcription of the additional component are put together.

Description

Die Erfindung betrifft ein Verfahren, eine Anordnung und ein Computerprogrammprodukt zur Sprachsynthese mittels Graphem-Phonem-Umsetzung.The invention relates to a method, an arrangement and a Computer program product for speech synthesis using grapheme-phoneme conversion.

Sprachverarbeitungsverfahren sind beispielsweise aus US 6 029 135, US 5 732 388, DE 19636739 C1 und DE 19719381 C1 bekannt. In nicht gesprochener Form gespeicherter Text lässt sich über eine Sprachsynthese als Sprache ausgeben. Dazu werden in der Regel die einzelnen Wörter des Textes in einer Datenbank gesucht, die die phonetischen Transkriptionen zahlreicher Wörter enthält. Die phonetischen Transkriptionen der in der Datenbank gefundenen Wörter werden zusammengesetzt und können als Sprache ausgegeben werden.Language processing methods are, for example, from US 6 029 135, US 5 732 388, DE 19636739 C1 and DE 19719381 C1 known. Text saved in non-spoken form pretend to be speech through a speech synthesis. To do this usually the individual words of the text in a database searched that the phonetic transcriptions numerous Contains words. The phonetic transcriptions of the Words found in the database are put together and can be output as language.

Da aber keine Datenbank vollständig ist, was in der Regel zur Reduktion der Datenbankgröße durchaus beabsichtigt ist, kommt es immer wieder vor, dass ein Text Wörter enthält, die in der Datenbank nicht gefunden werden. Diese Wörter werden dann mit einer Out-of-Vocabulary-Behandlung (OOV-Behandlung) phonetisch transkribiert. Dabei wird jedes Wort jeweils aus den einzelnen Buchstaben des Wortes zugeordneten Phonemen zusammengesetzt. Solche OOV-Behandlungen sind allerdings relativ rechenintensiv und führen in aller Regel zu schlechteren Ergebnissen als die phonetische Transkription ganzer Wörter aufgrund von Datenbankeinträgen.But since no database is complete, which is usually the reason Reduction in database size is well intentioned it always happens that a text contains words that are in the Database could not be found. These words are then with Out-of-vocabulary treatment (OOV treatment) phonetically transcribed. Each word is made up of the phonemes assigned to individual letters of the word. However, such OOV treatments are relative computationally intensive and generally lead to poorer results than the phonetic transcription of whole words based on database entries.

Weiterhin ist es bekannt, die phonetische Transkription eines gegebenen Wortes aus den phonetischen Transkriptionen seiner Teilwörter zusammenzusetzen, wenn das gegebene Wort ausschließlich aus diesen Teilwörtern besteht.Furthermore, it is known the phonetic transcription of a given word from the phonetic transcriptions of his Put together subwords if the given word exclusively consists of these subwords.

Davon ausgehend liegt der Erfindung die Aufgabe zugrunde, Sprachsynthese dahingehend zu verbessern, dass in größerem Umfang auf in einer Datenbank angegebene phonetische Transkriptionen von Wörtern zurückgegriffen werden kann und nur noch in geringerem Maße OOV-Behandlungen verwendet werden müssen.Proceeding from this, the object of the invention is To improve speech synthesis in that larger Extent of phonetic values given in a database Transcriptions of words can be used and OOV treatments are only used to a lesser extent have to.

Diese Aufgabe wird durch ein Verfahren, eine Anordnung und ein Computerprogrammprodukt mit den Merkmalen der unabhängigen Patentansprüche gelöst.This task is accomplished through a process, an arrangement and a computer program product with the features of independent Claims resolved.

Durch das Verfahren, die Anordnung oder das Computerprogrammprodukt ist es möglich, auch dann für ein gegebenes Wort auf die phonetischen Transkriptionen seiner Teilwörter zurückzugreifen, wenn sich das gegebene Wort nicht vollständig aus in der Datenbank enthaltenen Teilwörtern zusammensetzen lässt. Der wesentliche Gedanke ist dabei, dass erstmals eine hybride Vorgehensweise zum Einsatz kommt, bei der für dasselbe gegebene Wort sowohl die phonetische Transkription vollständiger Teilwörter, als auch eine OOV-Behandlung zum Einsatz kommt.By the process, the arrangement or the computer program product it is possible even for a given word access the phonetic transcriptions of its partial words, if the given word is not completely in can put together subwords contained in the database. The main idea is that for the first time a hybrid Approach is used in the given for the same Word both the phonetic transcription more complete Partial words, as well as an OOV treatment is used.

In einer bevorzugten Weiterbildung erfolgt die OOV-Behandlung zur phonetischen Transkription des weiteren Bestandteils in Abhängigkeit der phonetischen Transkription des gefundenen Teilwortes. Hierdurch lässt sich die Qualität der Sprachsynthese für den weiteren Bestandteil gegenüber einer entsprechenden reinen OOV-Behandlung des gesamten Wortes deutlich steigern. Dies liegt zum einen daran, dass die phonetische Transkription des gefundenen Teilwortes sehr viel sicherer ist als es eine phonetische Transkription dieses Teilwortes durch einen OOV-Behandlung wäre. Dadurch kann bei der OOV-Behandlung des weiteren Bestandteils von einem sicheren phonetischen Kontext ausgegangen werden, was die OOV-Behandlung mit sehr viel größerer Wahrscheinlichkeit zum richtigen Ergebnis kommen lässt. Zum anderen ist die phonetische Transkription des gefundenen Teilwortes sehr viel länger als die üblicherweise bei einer OOV-Behandlung verwendeten Phoneme. Deshalb ist der phonetische Kontext nicht nur sicherer, sondern auch länger, so dass die OOV-Behandlung für den weiteren Bestandteil aufgrund einer größeren Menge relevanter Informationen durchgeführt werden kann. Dieser Vorteil muss für die beanspruchte bevorzugte Weiterbildung allerdings nicht unbedingt ausgenutzt werden. Unter bestimmten Bedingungen kann es auch sinnvoll sein, wenn für die OOV-Behandlung zur phonetischen Transkription des weiteren Bestandteils in Abhängigkeit der phonetischen Transkription des gefundenen Teilwortes lediglich der Teil des Teilwortes berücksichtigt wird, der dem weiteren Bestandteil unmittelbar benachbart ist.In a preferred development, the OOV treatment takes place for the phonetic transcription of the further component in Dependence of the phonetic transcription of the found Partword. This allows the quality of the speech synthesis for the further component versus a corresponding one pure OOV treatment of the entire word clearly increase. On the one hand, this is because the phonetic Transcription of the partial word found is much safer is as a phonetic transcription of this subword would be through an OOV treatment. This can help with OOV treatment further part of a safe phonetic Context is what the OOV treatment much more likely to get the right result lets come. The other is the phonetic Transcription of the subword found much longer than the phonemes commonly used in OOV treatment. So the phonetic context is not only safer, but also longer, so the OOV treatment for the further Component more relevant due to a larger amount Information can be done. This advantage must for the preferred further training claimed not necessarily be exploited. Under certain circumstances it may also be useful if for OOV treatment for the phonetic transcription of the further component in Dependence of the phonetic transcription of the found Partial word only takes into account the part of the partial word that is immediately adjacent to the other component is.

Besonders vorteilhaft wird das Verfahren, wenn es nicht nach dem Auffinden eines ersten Teilwortes abgebrochen wird, sondern wenn noch weitere Teilwörter im gegebenen Wort gesucht werden. So wird ein möglichst großer Abschnitt des gegebenen Wortes aus Teilwörtern zusammengesetzt, für die in der Datenbank zuverlässige Informationen vorliegen, und lediglich der verbleibende, meist kleine weitere Bestandteil des Wortes muss einer OOV-Behandlung unterzogen werden.The method is particularly advantageous if it does not follow is aborted when a first partial word is found, but if additional subwords in the given word are searched become. In this way, the largest possible section of the given Word composed of partial words for those in the database reliable information is available, and only the remaining, mostly small further part of the word must undergo OOV treatment.

Steht dieser verbleibende weitere Bestandteil zwischen zwei gefundenen Teilwörtern so wird die OOV-Behandlung vorzugsweise in Abhängigkeit beider gefundener Teilbereiche vorgenommen. Dann ist nämlich sowohl der linke als auch der rechte phonetische Kontext des weiteren Bestandteils sicher vorgegeben, weshalb sich die OOV-Behandlung mit exzellenten Ergebnissen durchführen lässt.This remaining further component stands between two partial words found, OOV treatment is preferred depending on the two sub-areas found. Then both the left and the right one phonetic context of the other component which is why the OOV treatment with excellent results can be carried out.

Die Suche nach Teilwörtern in der Datenbank lässt sich durch verschiedene Maßnahmen optimieren. So sollte zum Beispiel nur nach Teilwörtern gesucht werden, die eine vorgegebene Mindestlänge aufweisen. Als Mindestlänge hat sich in der Praxis eine Länge von 5 Buchstaben herausgestellt, wobei bei anderen Rahmenbedingungen, zum Beispiel für eine andere Sprache, auch Mindestlängen von 3, 4 oder 6 Buchstaben sinnvoll sein können. The search for partial words in the database can be started optimize various measures. For example, only partial words are searched which have a predetermined minimum length exhibit. The minimum length has been in practice highlighted a length of 5 letters, with others Framework conditions, for example for a different language, too Minimum lengths of 3, 4 or 6 letters can be useful.

Weiterhin wird das Suchergebnis verbessert, wenn die Suche für einen Wortteil des gegebenen Wortes nicht sofort nach dem Auffinden des ersten passenden Teilwortes abgebrochen wird, sondern noch nach anderen möglichen Teilwörtern gesucht wird. Dies kann zum Beispiel erfolgen, indem der Wortteil um weitere Buchstaben ergänzt wird. In der Regel ergibt sich bei dieser Vorgehensweise das beste Ergebnis, wenn von mehreren gefundenen Teilwörtern dasjenige ausgewählt wird, das am längsten ist. Es kann allerdings auch ein kürzeres Teilwort ausgewählt werden, wenn dieses kürzere Teilwort in Verbindung mit einem in der Datenbank gefundenen und im gegebenen Wort enthaltenen längeren Teilwort einen größeren Teil des gegebenen Wortes darstellt, als das gefundene längere Teilwort für sich alleine, wenn dieses nicht mit dem gefundenen zweiten Teilwort kombiniert werden kann.Furthermore, the search result is improved when the search for a part of a given word not immediately after Finding the first matching partial word is canceled, but is still looking for other possible partial words. This can be done, for example, by adding the word part by more Letters is added. This usually results in this Do the best result if found by several Subwords that the longest is selected is. However, a shorter subword can also be selected if this shorter subword in conjunction with one found in the database and contained in the given word longer subword a larger part of the given Represents the longer partial word found for itself alone if this does not match the second subword found can be combined.

Die OOV-Behandlung zur phonetischen Transkription des weiteren Bestandteils kann mittels eines neuronalen Netzes erfolgen.The OOV treatment for phonetic transcription further Part of it can be done using a neural network.

Alternativ oder ergänzend kann für die OOV-Behandlung zur phonetischen Transkription des weiteren Bestandteils eine regelbasiertes Verfahren oder ein DTW-Verfahren zum Einsatz kommen. Ein solches Verfahren ist zum Beispiel in Rüdiger Hoffmann "Signalanalyse und -erkennung", Springer Verlag, Berlin, 1998, beschrieben.Alternatively or in addition, for OOV treatment phonetic transcription of the further component a rule-based Procedure or a DTW procedure used come. One such method is in Rüdiger, for example Hoffmann "Signal Analysis and Detection", Springer Verlag, Berlin, 1998.

Die OOV-Behandlung kann allerdings auch mittels einer zweiten Datenbank erfolgen, die die phonetischen Transkription von bei zusammengesetzten Wörtern üblicherweise verwendeten Füllpartikeln enthält. Im Deutschen sind dies insbesondere Dativ-und Genitivendungen, die bei zusammengesetzten Wörtern an das jeweils vorne stehende Wort angehängt werden. However, the OOV treatment can also be carried out using a second one Database that contain the phonetic transcription of filler particles commonly used in compound words contains. In German, these are especially dative and Genitive endings that appear in compound words on the word in front are appended.

Weitere wesentliche Merkmale und Vorteile der Erfindung ergeben sich aus der Beschreibung eines Ausführungsbeispiels anhand der Zeichnung; dabei zeigt

Figur 1: eine schematische Darstellung des Ablaufs des Verfahrens und
Figur 2: eine schematische Darstellung eines zwischen zwei Teilwörtern stehenden weiteren Bestandteils eines gegebenen Wortes.

Further essential features and advantages of the invention result from the description of an embodiment with reference to the drawing; shows

Figure 1: a schematic representation of the course of the method and
Figure 2: is a schematic representation of a further component of a given word between two partial words.

Das Verfahren soll am Beispiel des gegebenen deutschen Wortes "Trainingslager" erläutert werden. Es sollen nur Teilwörter mit einer Mindestlänge von fünf Buchstaben gesucht werden. Im Schritt S1 gemäß Figur 1 wird für das gegebene Wort in einer Datenbank, die phonetische Transkriptionen von Wörtern enthält, nach Teilwörtern des gegebenen Wortes gesucht. Da die Mindestlänge auf fünf Buchstaben gesetzt ist, wird mit der Suche nach dem Wort "Train" angefangen. In einer deutschsprachigen Datenbank wird dieses Wort nicht gefunden. Enthält die Datenbank auch englischsprachige Wörter, so ist bereits jetzt das erste Teilwort des gegebenen Wortes gefunden. Vorzugsweise wird aber nicht nur im ersten, sondern auch im zweiten Fall weitergesucht. Dies geschieht durch die Suche nach dem Wort "Traini". Diese Buchstabenkombination wird in der Datenbank nicht gefunden. Das Gleiche gilt für die danach gesuchte Buchstabenkombination "Trainin".The procedure should be based on the example of the given German word "Training camp" are explained. Only partial words should be used with a minimum length of five letters. in the Step S1 according to FIG. 1 is for the given word in one Database containing phonetic transcriptions of words searched for partial words of the given word. Since the The minimum length is set to five letters Searched for the word "Train". In a German language Database cannot find this word. Contains the Database also contains English words, so it is already now found the first subword of the given word. Preferably but not only in the first, but also in the second Case searched further. This is done by looking for the Word "traini". This letter combination is in the database not found. The same applies to the one you are looking for Letter combination "Trainin".

Dagegen wird die nächste Buchstabenkombination "Training" in der Datenbank gefunden. Trotzdem wird auch in diesem Fall vorzugsweise weitergesucht, nämlich nach der Buchstabenkombination "Trainings" und den in entsprechender Fortsetzung dieses Suchschrittes gebildeten längeren Buchstabenkombinationen des gegebenen Wortes. Unter der Voraussetzung, dass das gegebene Wort "Trainingslager" in seiner Gesamtheit nicht in der Datenbank gefunden wird, werden keine weiteren Teilwörter in der Datenbank gefunden. In contrast, the next letter combination "Training" in found the database. Nevertheless, even in this case preferably searched further, namely for the letter combination "Trainings" and the corresponding continuation of this Search step formed longer letter combinations of the given word. Provided that the given Word "training camp" in its entirety not in the Database is found, no further partial words are found in found the database.

Für den Fall einer englisch- und deutschsprachigen Datenbank wird aus den beiden gefundenen Teilwörtern "Train" und "Training" das längere Teilwort "Training" ausgewählt. Dieser Auswahlschritt entfällt im Beispielfall für eine rein deutschsprachige Datenbank.In the case of an English and German language database is made up of the two sub-words "Train" and "Training" the longer sub-word "training" selected. This selection step does not apply in the example case for a purely German-speaking Database.

Im Schritt S3 wird für das gefundene Teilwort "Training" die in der Datenbank verzeichnete phonetische Transkription gewählt.In step S3 the "Training" subword is found selected phonetic transcription recorded in the database.

Gemäß dem Schritt S4 wird festgestellt, dass das gegebene Wort "Trainingslager" neben dem gefundenen Teilwort "Training" einen weiteren Bestandteil "slager" aufweist, der nicht in der Datenbank verzeichnet ist.According to step S4, it is determined that the given one Word "training camp" next to the found subword "training" has another component "slager" that is not is recorded in the database.

Dieser weitere Bestandteil "slager" wird dann im Schritt S5 mittels einer OOV-Behandlung phonetisch transkribiert. Diese OOV-Behandlung basiert vorzugsweise auf einer Umsetzung der einzelnen Grapheme des weiteren Bestandteils "slager" in Phoneme mittels eines neuronalen Netzes. Die Phoneme werden durch das neuronale Netz so ausgewählt und zusammengesetzt, dass sich für den weiteren Bestandteil für sich genommen eine möglichst gute Sprachsynthese ergibt.This further component "slager" is then in step S5 transcribed phonetically using OOV treatment. This OOV treatment is preferably based on an implementation of the individual graphemes of the further component "slager" in phonemes by means of a neural network. The phonemes will be selected and composed by the neural network so that in itself for the further component one results in the best possible speech synthesis.

Für ein noch besseres Sprachsyntheseergebnis erfolgt die OOV-Behandlung zur phonetischen Transkription des weiteren Bestandteils "slager" in Abhängigkeit der aus der Datenbank gewählten phonetischen Transkription des gefundenen Teilwortes "Training". Das gefundene Teilwort "Training" bzw. seine phonetische Transkription gibt im gewählten Beispiel den linken phonetischen Kontext des weiteren Bestandteils "slager" sicher vor. Das für die OOV-Behandlung des weiteren Bestandteils "slager" verwendete neuronale Netz kann deshalb von einem sicheren Ergebnis der dem weiteren Bestandteil vorausgegangenen Silben des gegebenen Wortes ausgehen und ein entsprechend sicheres Ergebnis für die phonetische Transkription des weiteren Bestandteils liefern.OOV treatment takes place for an even better speech synthesis result for the phonetic transcription of the further component "slager" depending on the one selected from the database phonetic transcription of the partial word found "Training". The found subword "training" or its phonetic In the selected example, transcription gives the left one phonetic context of the further component "slager" for sure in front. That for the OOV treatment of the other component The "neural network" used by slager can therefore be used by one certain result of the previous component Syllables of the given word run out and one accordingly reliable result for phonetic transcription deliver the further component.

Im letzten Schritt S6 des Verfahrens zur Sprachsynthese wird schließlich die phonetische Transkription des gefundenen Teilwortes "Training" und die phonetische Transkription des weiteren Bestandteils "slager" zusammengesetzt.In the last step S6 of the method for speech synthesis finally the phonetic transcription of what was found Partial word "training" and the phonetic transcription of the another constituent "slager" composed.

Das Sprachsyntheseergebnis lässt sich weiter verbessern, wenn nicht nur vom Anfang des gegebenen Wortes beginnend Teilwörter gesucht werden, sondern die Suche auch von anderen Bereichen des gegebenen Wortes aus gestartet wird. Ist für das Teilwort eine bestimmte Mindestlänge i vorgegeben, so empfiehlt sich der Beginn der weiteren Suche beim i+ersten Buchstaben. Im gegebenen Beispiel wird dann für i=5 die weitere Suche mit der Buchstabenfolge "ingsl" gestartet, die ihrerseits wiederum die gegebene Mindestlänge aufweist. Diese Buchstabenfolge würde in der Datenbank nicht gefunden. Das gleiche gilt für die danach gesuchten Buchstabenfolgen "ingsla", "ingslag" usw.The speech synthesis result can be further improved if not just partial words starting from the beginning of the given word be searched, but also the search of other areas from the given word. Is for that Sub-word given a certain minimum length i, it is recommended the beginning of the further search begins with the i + first letter. In the given example the further one becomes for i = 5 Search started with the letter "ingsl", which in turn again has the given minimum length. This Letters would not be found in the database. The the same applies to the letters "ingsla" searched for, "ingslag" etc.

Da bei dieser weiteren Suche keinerlei Teilwort gefunden wird, wird die darauffolgende Suche nicht beim Buchstaben 2*i+1 gestartet, sondern schon bei i+2. Allerdings führt auch die Suchsequenz "ngsla", "ngslag" usw. zu keinem Ergebnis. Nach dem Durchführen weiterer entsprechender Suchen wird allerdings in der letzten Suche das weitere Teilwort "lager" gefunden. Dieses weitere gefundene Teilwort "lager" entstammt nicht dem Wortteil des Wortes "Trainingslager", für den das erste Teilwort "Training" gefunden wurde. Deshalb muss im Beispiel keine Auswahl zwischen den beiden Teilwörtern getroffen werden.Since no subword was found in this further search the subsequent search will not be by letter 2 * i + 1 started, but already at i + 2. However, leads too the search sequence "ngsla", "ngslag" etc. to no result. After performing other appropriate searches, however in the last search the further sub-word "lager" found. This subword "camp" was found not the part of the word "training camp" for which that first sub-word "training" was found. Therefore in Example no selection made between the two sub-words become.

Vielmehr verbleibt als weiterer Bestandteil des gegebenen Wortes "Trainingslager" nurmehr der Buchstabe "s". Dieser einzelne Buchstabe "s" lässt sich sehr leicht mittels einer OOV-Behandlung phonetischen transkribieren. Hierbei kommt noch erleichternd hinzu, dass gemäß Figur 2 für das Zentrum 2 "s" sowohl der linke Kontext 1 "Training" als auch der rechte Kontext 3 "lager" bekannt ist.Rather, there remains as a further component of the given Word "training camp" only the letter "s". This single letter "s" can be very easily by means of a Transcribe OOV treatment phonetic. Here comes to make it even easier that, according to FIG "s" both the left context 1 "Training" and the right one Context 3 "camp" is known.

Statt der OOV-Behandlung durch ein neuronales Netz, wie sie oben beschrieben wurde, kann in diesem Fall die OOV-Behandlung auch durch eine Suche in einer weiteren Datenbank erfolgen, in der die phonetischen Transkriptionen von bei zusammengesetzten Wörtern üblicherweise verwendeten Füllpartikeln enthalten sind. Das Genitiv-s des vorliegenden Beispiels ist ein solcher üblicherweise verwendeter Füllpartikel. Es würde deshalb in der zweiten Datenbank gefunden und die zugehörige phonetische Transkription gewählt werden.Instead of OOV treatment through a neural network like her In this case, OOV treatment can be described also by searching another database take place in which the phonetic transcriptions of compound Words commonly used filler particles are included. The genitive-s of the present example is such a commonly used filler. It would therefore be found in the second database and the associated one phonetic transcription can be chosen.

Alternativ lassen sich für die OOV-Behandlung aber auch regelbasierte Verfahren und DTW-Verfahren einsetzen. In jedem Fall sind bessere phonetische Transkriptionen des weiteren Bestandteils zu erwarten, wenn bei der OOV-Behandlung zur phonetischen Transkription des weiteren Bestandteils die phonetische Transkription mehrerer oder aller gefundenen Teilwörter berücksichtigt wird. Dies ist natürlich insbesondere der Fall, wenn der weitere Bestandteil im Wort zwischen zwei gefundenen Teilwörtern angeordnet ist.Alternatively, rule-based treatment can also be used for OOV treatment Use procedures and DTW procedures. In each The case is better phonetic transcriptions of the further Component to be expected if the OOV treatment for phonetic transcription of the further component the phonetic Transcription of several or all of the partial words found is taken into account. Of course this is special the case when the further component in the word between two found subwords is arranged.

In einem letzten Schritt wird dann schließlich die phonetische Transkription des gefundenen Teilworts "Training", die phonetische Transkription des weiteren gefundenen Teilwortes "lager" und die phonetische Transkription des weiteren Bestandteils "s" zur Sprachsynthese zusammengesetzt.In a final step, the phonetic is finally Transcription of the found subword "Training", the phonetic transcription of the further partial word found "Lager" and the phonetic transcription of the other component "s" composed for speech synthesis.

Die erfindungsgemäße Anordnung lässt sich in Form eines Computersystems realisieren, das programmiert wird, ein entsprechendes Verfahren auszuführen.The arrangement according to the invention can be in the form of a computer system realize that is programmed, a corresponding Execute procedure.

Claims

Method for speech synthesis using a grapheme-phoneme conversion, in which

for a given word in a database containing phonetic transcriptions of words, partial words of the given word are searched,

at least one partial word of the given word is found in the database,

a phonetic transcription recorded in the database is selected for the partial word found,

the given word has at least one further component in addition to the partial word found that is not recorded in the database,

this additional component is transcribed phonetically using OOV treatment and

the phonetic transcription of the partial word found and the phonetic transcription of the further component are put together.

A method of speech synthesis according to claim 1, wherein

the OOV treatment for the phonetic transcription of the further component takes place depending on the phonetic transcription of the partial word found.

A method of speech synthesis according to claim 1 or 2, wherein

for the word found, the database is searched for further partial words of the word,

at least one further partial word of the given word is found in the database,

for this further subword found, a phonetic transcription recorded in the database is selected and

the phonetic transcription of the partial word found, the phonetic transcription of the further partial word found and the phonetic transcription of the further component are put together.

A method of speech synthesis according to claim 3, wherein

the further component in the given word is arranged between the found subword and the found further subword and

the OOV treatment for the phonetic transcription of the further component takes place depending on the phonetic transcription of the partial word found and the phonetic transcription of the further partial word found.

A method of speech synthesis according to at least one of the preceding claims, in which

only partial words are searched that have at least a predetermined minimum length.

if several partial words are found for the same word part of the given word part, the longest partial word is selected from this.

the OOV treatment for phonetic transcription of the further component takes place by means of a neural network.

the OOV treatment for the phonetic transcription of the further component takes place by means of a rule-based method.

the OOV treatment for the phonetic transcription of the further constituent is carried out by means of a second database which contains the phonetic transcription of filler particles usually used in compound words.

Arrangement for speech synthesis using a grapheme-phoneme conversion, which is designed

that partial words of the given word are searchable for a given word in a database which contains phonetic transcriptions of words,

at least one partial word of the given word can be found in the database,

that a phonetic transcription recorded in the database can be selected for the partial word found,

where the given word has at least one further component in addition to the found subword which is not recorded in the database,

that this additional component can be transcribed phonetically using OOV treatment and

the phonetic transcription of the partial word found and the phonetic transcription of the further component can be put together.

Computer program product for speech synthesis by means of a grapheme-phoneme conversion, in which at least one processor unit runs

at least one partial word of the given word is found in the database,

this additional component is transcribed phonetically using OOV treatment and