WO2003071520A1 - Parameter-controlled voice synthesis - Google Patents
Parameter-controlled voice synthesis Download PDFInfo
- Publication number
- WO2003071520A1 WO2003071520A1 PCT/DE2003/000049 DE0300049W WO03071520A1 WO 2003071520 A1 WO2003071520 A1 WO 2003071520A1 DE 0300049 W DE0300049 W DE 0300049W WO 03071520 A1 WO03071520 A1 WO 03071520A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- voice
- message
- text file
- implemented
- text
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
- G10L13/033—Voice editing, e.g. manipulating the voice of the synthesiser
Definitions
- the present invention relates to a method for automatically converting a message created by a sender as a text file into a voice message which can be output by a recipient via a voice output device, in particular a loudspeaker, a conversion program implemented on a computer having a voice generator (“voice”) for generating the
- voice voice generator
- the invention also relates to a system for implementing the method.
- SMS Short Message System
- a terminal for example a cell phone or a computer
- This message is then integrated into the network by one Computer converted to a voice message (Text to Speach) using a voice, so the recipient no longer has to read the SMS message as is known, but is addressed directly and personally by the synthetic voice with the corresponding content of the message , who have names like "Dagmar” or "Detlef", who present the message to the addressee.
- a disadvantage of the methods used hitherto is that the conversion uses only the voice which is usually only available and the voice message has only the characteristic coloration assigned to the voice.
- the available synthetic voices simulate the human voice quite well in terms of emphasis, but they lack it
- the object of the invention is now to provide a method which can be implemented with simple and inexpensive means and which is individual Variation of the expression also possible within a message. It is also an object of the invention to provide a system for implementing the method.
- the essential basic idea of the invention is to give the sender of a text message the possibility of influencing the conversion of the message with regard to desired nuances in the emphasis when presenting the message content by identifying the text file.
- one or more control commands are assigned to the text file, which are recognized as such by the computer and then associated with the sender's wish to give his voice message a special characteristic.
- the sender assigns the text file to at least one control command which is recognized by the conversion program, the program modifying the characteristic of the voice speaking the voice message, in particular with regard to its tone color and / or its melody, in accordance with the control command.
- the assignment can be done by prefixing, appending or inserting the control command into the text file, which usually has a header and subsequent data.
- the control command can in particular be a specific component of the text file, in particular a sentence, a text sequence, a word or a
- the obvious advantage is that the meaning of the content can be modified via a changing characteristic and that the message gets a certain undertone. It is thus possible to utter a sad message in a correspondingly quiet and overcast manner, or to give the voice a sarcastic undertone in the case of "good" news.
- the pronunciation and, in particular, the gender of the voice can be adapted to the circumstances.
- the advantage for example, that the medium of SMS, which was formerly attractive for young people, is given a further appeal by the flexibility.
- the sender can use the invention to convey exactly what he actually wants to express. According to the invention, a synthetic reading voice is given another human touch.
- the variability within a message can be achieved either by using different available voices, the choice between the individual voices being made on the basis of the control commands.
- a control character “$” can mean that the female voice “Dagmar” is used, while “ ⁇ $” means that the text should be read by "Detlef".
- a variation can, however, also be achieved by varying the characteristics of the only available "neutral” voice by changing the accessible setting parameters, such as timbre, pitch, emphasis, voice stretching or volume.
- the character “$” a feminine and the character "c?” a male touch of the "neutral” voice.
- the control commands are advantageously implemented at those points in the text file where a change in the characteristic is desired. In this way, multiple voices can be used within one message, which can lead to an attractive and unique way of expression.
- an advantageous area of application of the invention is the short message system (SMS).
- SMS short message system
- the voice message is then sent as text via the SMS and, after conversion, is output via the loudspeaker of a telephone or a computer.
- a similar field of application is offered by e-mails that are sent over the Internet and are output after the conversion via the loudspeaker of a telephone or a computer.
- the new service brings a new game excitement and increased pleasure for the users.
- the invention provides a new feature for natural communication between man and machine. So each sender can get his own sound design.
- a linguistic model can be implemented in an advanced form of configuration using implemented control commands and thus help the voice to a higher degree of naturalness.
- a control command according to the invention can be assigned to each syllable or each letter.
- the invention is advantageously implemented with a system that has a computer implemented in a communication network on which a program for speech synthesis is implemented.
- This so-called “voice” converts a message as a text file into a spoken text and sends the message over a voice line to a terminal also implemented in the network.
- the spoken text is output via a loudspeaker of the terminal.
- a module is implemented in the program, that recognizes a control command implemented in the text file, the module recognizing the characteristics of the voice speaking the voice message, modified in particular with regard to their timbre or melody, in accordance with the control command.
Abstract
The invention relates to a method for automatically converting a message, which is created as a text file by a sender, into a voice message that can be output to an addressee via a voice output device, particularly a loudspeaker. According to the invention, a conversion program that is implemented on a computer controls a speech generator ( voice ) for creating the voice message on the basis of the text file, whereby at least one control command is assigned to the text file by the sender. This control command is recognized by the conversion program, and the program, according to the control command, modifies the characteristics of the voice that gives the voice message, particularly with regard to the timbre and/or melody thereof.
Description
Parametergesteuerte SprachsyntheseParameter-controlled speech synthesis
Die vorliegende Erfindung betrifft ein Verfahren zur automatischen Konvertierung einer von einem Absender als Textdatei erstellte Nachricht in eine über eine Sprachausgabeeinrichtung, insbesondere einen Lautsprecher, bei einem Adressaten ausgebbare Sprachnachricht, wobei ein auf einem Computer realisiertes Konvertierungsprogramm einen Sprachgenerator („Stimme") zur Erzeugung der Sprachnachricht mit der Textdatei ansteuert. Die Erfindung betrifft gleichfalls ein System zur Umsetzung des Verfahrens.The present invention relates to a method for automatically converting a message created by a sender as a text file into a voice message which can be output by a recipient via a voice output device, in particular a loudspeaker, a conversion program implemented on a computer having a voice generator (“voice”) for generating the The invention also relates to a system for implementing the method.
Derartige Verfahren zur Sprachsynthese sind bekannt und auch schon realisiert. So ist es möglich, eine Nachricht mittels des „Short Message Systems" (SMS) von einem Endgerät, beispielsweise einem Mobiltelephon oder einem Computer, als Textdatei an ein anderes Endgerät vermittels eines Telekommunikationsnetzes zu versenden. Diese Nachricht wird dann von einem in das Netz eingebundenen Computer unter Nutzung einer Stimme zu einer Sprachnachricht (Text to Speach) konvertiert. Der Empfänger muß somit nicht mehr wie bekannt die SMS-Nachricht lesen, sondern wird direkt und persönlich von der synthetischen Stimme mit dem entsprechenden Inhalt der Nachricht angesprochen. Dabei sind verschiedene Stimmen, die Namen wie „Dagmar" oder „Detlef" haben, bekannt, die dem Adressaten die Nachricht präsentieren.Such methods for speech synthesis are known and have already been implemented. It is thus possible to send a message using the “Short Message System” (SMS) from a terminal, for example a cell phone or a computer, as a text file to another terminal by means of a telecommunications network. This message is then integrated into the network by one Computer converted to a voice message (Text to Speach) using a voice, so the recipient no longer has to read the SMS message as is known, but is addressed directly and personally by the synthetic voice with the corresponding content of the message , who have names like "Dagmar" or "Detlef", who present the message to the addressee.
Nachteil an den bislang eingesetzten Verfahren ist, daß sich die Konvertierung lediglich der meist nur einen zur Verfügung stehenden Stimme bedient und die Sprachnachricht nur die der Stimme zugewiesene charakteristische Färbung aufweist. Zwar simulieren die verfügbaren synthetischen Stimmen die menschliche Stimme bezüglich der Betonung schon recht gut, allerdings fehlt ihnen dieA disadvantage of the methods used hitherto is that the conversion uses only the voice which is usually only available and the voice message has only the characteristic coloration assigned to the voice. The available synthetic voices simulate the human voice quite well in terms of emphasis, but they lack it
Fähigkeit zu einer den Inhalt individuell pointierenden Modulation der Betonung völlig. Mitunter kann zwar zwischen mehreren Stimmen, beispielsweise unter verschiedenen Sprachen ausgewählt werden, doch ist eine Variation des Ausdrucks innerhalb einer Nachricht nicht möglich.Ability to modulate the emphasis individually to the point. Sometimes it is possible to choose between several voices, for example under different languages, but it is not possible to vary the expression within a message.
Aufgabe der Erfindung ist es nunmehr, ein Verfahren zu schaffen, das sich mit einfachen und kostengünstigen Mitteln umsetzen läßt und das eine individuelle
Variation des Ausdrucks auch innerhalb einer Nachricht ermöglicht. Zudem ist es Aufgabe der Erfindung, ein System zur Umsetzung des Verfahrens zu schaffen.The object of the invention is now to provide a method which can be implemented with simple and inexpensive means and which is individual Variation of the expression also possible within a message. It is also an object of the invention to provide a system for implementing the method.
Diese Aufgaben werden durch ein Verfahren nach Anspruch 1 und ein System nach Anspruch 9 gelöst.These objects are achieved by a method according to claim 1 and a system according to claim 9.
Der wesentliche Grundgedanke der Erfindung liegt darin, dem Absender einer Textnachricht die Möglichkeit zu geben, durch Kennzeichnung der Textdatei die Konvertierung der Nachricht hinsichtlich gewünschter Nuancen in der Betonung beim Vortrag des Nachrichteninhalts zu beeinflussen. Dazu werden der Textdatei ein oder mehrere Steuerbefehle zugeordnet, die vom Computer als solche erkannt und dann mit dem Wunsch des Absenders, seiner Sprachnachricht eine spezielle Charakteristik zu verleihen, in Verbindung gebracht werden. Der Textdatei wird erdindungsgemäß vom Absender mindestens ein Steuerbefehl zugeordnet, der vom Konvertierungsprogramm erkannt wird, wobei das Programm entsprechend dem Steuerbefehl die Charakteristik der die Sprachnachricht sprechenden Stimme, insbesondere bezüglich ihrer Klangfarbe und/oder ihrer Melodie, modifiziert. Das Zuordnen kann dabei durch ein Vorabstellen, ein Anhängen oder ein Einfügen des Steuerbefehles in die meist einen Header und nachfolgende Daten aufweisenden Textdatei geschehen.The essential basic idea of the invention is to give the sender of a text message the possibility of influencing the conversion of the message with regard to desired nuances in the emphasis when presenting the message content by identifying the text file. For this purpose, one or more control commands are assigned to the text file, which are recognized as such by the computer and then associated with the sender's wish to give his voice message a special characteristic. According to the invention, the sender assigns the text file to at least one control command which is recognized by the conversion program, the program modifying the characteristic of the voice speaking the voice message, in particular with regard to its tone color and / or its melody, in accordance with the control command. The assignment can be done by prefixing, appending or inserting the control command into the text file, which usually has a header and subsequent data.
Der Steuerbefehl kann insbesondere einem bestimmten Bestandteil der Textdatei, insbesondere einem Satz, einer Textsequenz, einem Wort oder einemThe control command can in particular be a specific component of the text file, in particular a sentence, a text sequence, a word or a
Buchstaben, zugeordnet werden. Unter Zugrundelegung eines linguistischen Modelies kann so eine individuelle und vor allem „menschliche" Betonung der Nachricht erreicht werden. Als Steuerbefehl kann dabei eines oder mehrere einzelne Steuerzeichen („Short cuts") oder eine vollständige Programmanweisung verwendet werden. Entsprechend dem oder der Steuerbefehlen wird dann die synthetische Stimme, beispielsweise bezüglich ihrer Klangfarbe, modifiziert. So kann ein Satz mit Steuerzeichen, wie „Ich freue mich auf die Schule ©" bedeuten, daß die Stimme einen ehrlich erfreuten und keinen sarkastischem Unterton hat. Innerhalb einer Nachricht werden beispielsweise „Emoticons" oder „Ironiezeichen" eingesetzt, die nach Art eines Sound Design in die Schriftsprache Gefühle implementieren.
Die Möglichkeit, die Charakteristik der synthetischen Stimme unabhängig vom Inhalt der Sprachnachricht zu verändern, hat einige Vorteile. Der offensichtliche Vorteil liegt darin, daß die Bedeutung des Inhalts über eine wechselnde Charakteristik modifiziert werden kann und daß die Nachricht einen bestimmten Unterton bekommt. So ist es möglich, eine traurige Nachricht entsprechend leise und bedeckt zu äußern oder der Stimme bei „guten" Nachrichten einen sarkastischen Unterton zu geben. Außerdem können die Aussprache und insbesondere das Geschlecht der Stimme den Umständen angepaßt werden. Aus diesen Möglichkeiten ergibt sich der besondere Vorteil, daß beispielsweise das ehedem für Jugendliche attraktive Medium des SMS durch die Flexibilität einen weiteren Reiz bekommt. Der Absender kann letztendlich mit der Erfindung genau das vermitteln, was er tatsächlich ausdrücken will. Erfindungsgemäß wird einer synthetischen Vorlesestimme ein weiterer menschlicher Zug verliehen.Letters. Using a linguistic model as a basis, an individual and above all "human" emphasis on the message can be achieved. One or more individual control characters ("short cuts") or a complete program instruction can be used as the control command. The synthetic voice is then modified in accordance with the control command or commands, for example with regard to its timbre. For example, a sentence with control characters such as "I'm looking forward to school ©" can mean that the voice has an honest delight and no sarcastic undertone. For example, "emoticons" or "irony signs" are used in a message, which sound like a sound Implement design in the written feelings. The ability to change the characteristics of the synthetic voice regardless of the content of the voice message has several advantages. The obvious advantage is that the meaning of the content can be modified via a changing characteristic and that the message gets a certain undertone. It is thus possible to utter a sad message in a correspondingly quiet and overcast manner, or to give the voice a sarcastic undertone in the case of "good" news. In addition, the pronunciation and, in particular, the gender of the voice can be adapted to the circumstances The advantage, for example, that the medium of SMS, which was formerly attractive for young people, is given a further appeal by the flexibility. In the end, the sender can use the invention to convey exactly what he actually wants to express. According to the invention, a synthetic reading voice is given another human touch.
Die Variabilität innerhalb einer Nachricht kann entweder dadurch erreicht werden, daß auf unterschiedliche zur Verfügung stehende Stimmen zurückgegriffen wird, wobei die Auswahl zwischen den einzelnen Stimmen anhand der Steuerbefehle getroffen wird. So kann ein Steuerzeichen „$" bedeuten, daß auf die vorhanden weibliche Stimme „Dagmar" zurückgegriffen wird, während „<$" bedeutet, der Text soll von „Detlef" verlesen werden. Eine Variation kann jedoch auch dadurch erreicht werden, daß die einzig zur Verfügung stehende „Neutral"-Stimme in ihrer Charakteristik durch Veränderung der zugänglichen Einstellparameter, wie Klangfarbe, Stimmlage, Betonung, Stimmdehnung oder Lautstärke, variiert wird. So kann das Zeichen „$" einen weiblichen und das Zeichen „c?" einen männlichen Touch der „Neutral"-Stimme hervorrufen. Vorteilhafter Weise werden die Steuerbefehle an den Stellen innerhalb der Textdatei implementiert, wo eine Änderung der Charakteristik gewünscht wird. So können mehrere Stimmlagen innerhalb einer Nachricht benutzt werden, was zu einer attraktiven und einzigartigen Ausdrucksweise führen kann.The variability within a message can be achieved either by using different available voices, the choice between the individual voices being made on the basis of the control commands. A control character "$" can mean that the female voice "Dagmar" is used, while "<$" means that the text should be read by "Detlef". A variation can, however, also be achieved by varying the characteristics of the only available "neutral" voice by changing the accessible setting parameters, such as timbre, pitch, emphasis, voice stretching or volume. Thus, the character "$" a feminine and the character "c?" a male touch of the "neutral" voice. The control commands are advantageously implemented at those points in the text file where a change in the characteristic is desired. In this way, multiple voices can be used within one message, which can lead to an attractive and unique way of expression.
Um die Handhabung und die Benutzung der Steuerzeichen komfortabel zu gestalten, ist es vorteilhaft, sogenannte „sprechende" Symbole, beispielsweise Smilies oder „Short cuts", zu verwenden, die an sich für den Computer keine weitere Bedeutung haben, aber deren Charakter sich dem Nutzer leicht erschließt.
So können Smilies (©) mit verschiedenem Gesichtsausdruck für den Unterton in der Stimme oder beispielsweise ein „©" für einen besonders lustvollen Ausdruck und ein „ ef" für eine Grabesstimme verwendet werden. Eine Anzahl solcher sprechender Steuerzeichen können beispielsweise in der Menuefunktion des Telephons, von dem die Nachricht abgesendet wird, angeboten werden. Beim Vorlesen der Nachricht wird die Stimmung und der gewünschte Unterton des Absenders wiedergegeben. Emotionen werden bei der Sprachsynthese (Text-To- Speach) berücksichtigt und so die Stimmung des Absenders weitergegeben.In order to make the handling and use of the control characters comfortable, it is advantageous to use so-called "speaking" symbols, for example smilies or "short cuts", which in themselves have no further meaning for the computer, but whose character is different to the user easily accessible. Smilies (©) with different facial expressions can be used for the undertone in the voice or, for example, an "©" for a particularly lustful expression and an "ef" for a grave voice. A number of such speaking control characters can be offered, for example, in the menu function of the telephone from which the message is being sent. When the message is read out, the mood and the desired undertone of the sender are reproduced. Emotions are taken into account in speech synthesis (text-to-speach) and the mood of the sender is thus passed on.
Wie schon dargelegt ist ein vorteilhaftes Einsatzgebiet der Erfindung das Short Message System (SMS). Die Sprachnachricht wird dann als Text über das SMS verschickt und nach der Konvertierung über den Lautsprecher eines Telephons oder eines Computers ausgegeben wird. Ein ähnliches Anwendungsfeld bieten die E-Mails, die über das Internet verschickt und nach der Konvertierung über den Lautsprecher eines Telephons oder eines Computers ausgegeben werden. Der neue Service bringt einen neuen Spielreitz und gesteigertes Vergnügen für die Nutzer. Die Erfindung stellt ein neues Leistungsmerkmal für eine natürliche Kommunikation zwischen Mensch und Maschine bereit. So kann sich jeder Absender ein eigenes Sound-Design zulegen. Wie dargelegt, läßt sich in einer fortgeschrittenen Form der Ausgestaltung anhand implementierter Steuerbefehle ein linguistisches Modell realisieren und so der Stimme zu einem höheren Grad an natürlichkeit verhelfen. Letztendlich kann jeder Silbe oder jedem Buchstaben ein erfindungsgemäßer Steuerbefehl zugeordnet werden.As already explained, an advantageous area of application of the invention is the short message system (SMS). The voice message is then sent as text via the SMS and, after conversion, is output via the loudspeaker of a telephone or a computer. A similar field of application is offered by e-mails that are sent over the Internet and are output after the conversion via the loudspeaker of a telephone or a computer. The new service brings a new game excitement and increased pleasure for the users. The invention provides a new feature for natural communication between man and machine. So each sender can get his own sound design. As explained, a linguistic model can be implemented in an advanced form of configuration using implemented control commands and thus help the voice to a higher degree of naturalness. Ultimately, a control command according to the invention can be assigned to each syllable or each letter.
Die Erfindung wird vorteilhafter wiese mit einem System umgesetzt, das einen in ein Kommunikationsnetz implementierten Computer aufweist, auf dem ein Programm zur Sprachsynthese realisiert ist. Diese sogenannte „Stimme" konvertiert eine als Textdatei vorliegende Nachricht in einen gesprochenen Text und verschickt die Nachricht über eine Sprachleitung zu einem ebenfalls in das Netz implementiertes Endgerät. Über einen Lautsprecher des Endgerätes wird der gesprochene Textes ausgegeben. Innerhalb des Programmes ist ein Modul realisiert, das einen in der Textdatei implementierten Steuerbefehl erkennt, wobei das Modul die Charakteristik der die Sprachnachricht sprechenden Stimme,
insbesondere bezüglich ihrer Klangfarbe oder Melodie, entsprechend des Steuerbefehles modifiziert.
The invention is advantageously implemented with a system that has a computer implemented in a communication network on which a program for speech synthesis is implemented. This so-called “voice” converts a message as a text file into a spoken text and sends the message over a voice line to a terminal also implemented in the network. The spoken text is output via a loudspeaker of the terminal. A module is implemented in the program, that recognizes a control command implemented in the text file, the module recognizing the characteristics of the voice speaking the voice message, modified in particular with regard to their timbre or melody, in accordance with the control command.
Claims
1. Verfahren zur automatischen Konvertierung einer von einem Absender als Textdatei erstellte Nachricht in eine über eine Sprachausgabeeinrichtung, insbesondere einen Lautsprecher, bei einem Adressaten ausgebbare Sprachnachricht, wobei ein auf einem Computer realisiertes Konvertierungsprogramm einen Sprachgenerator („Stimme") zur Erzeugung der Sprachnachricht mit der Textdatei ansteuert, dadurch gekennzeichnet daß der Textdatei vom Absender mindestens ein Steuerbefehl zugeordnet wird, der vom Konvertierungsprogramm erkannt wird, wobei das Programm entsprechend dem Steuerbefehl die Charakteristik der die Sprachnachricht sprechenden Stimme, insbesondere bezüglich ihrer Klangfarbe und/oder ihrer Melodie, modifiziert.1. A method for automatically converting a message created by a sender as a text file into a voice message that can be output by an addressee via a voice output device, in particular a loudspeaker, a conversion program implemented on a computer having a voice generator (“voice”) for generating the voice message with the Text file controls, characterized in that the sender assigns at least one control command to the text file, which is recognized by the conversion program, the program modifying the characteristic of the voice speaking the voice message, in particular with regard to its tone color and / or its melody, in accordance with the control command.
2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß der Steuerbefehl einem bestimmten Bestandteil der Textdatei, insbesondere einem Satz, einer Textsequenz, einem Wort oder einem Buchstaben, zugeordnet wird .2. The method according to claim 1, characterized in that the control command is assigned to a specific component of the text file, in particular a sentence, a text sequence, a word or a letter.
3. Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, daß als Steuerbefehl ein einzelnes Steuerzeichen oder eine Programmanweisung verwendet wird.3. The method according to claim 1 or 2, characterized in that a single control character or a program instruction is used as a control command.
4. Verfahren nach einem der vorherigen Ansprüche, dadurch gekennzeichnet, daß der oder die4. The method according to any one of the preceding claims, characterized in that the or
Steuerbefehle an den Stellen in die Textdatei implementiert werden, wo eine Änderung der Charakteristik gewünscht wird.Control commands are implemented in the places in the text file where a change in the characteristic is desired.
5. Verfahren nach einem der vorherigen Ansprüche, dadurch gekennzeichnet, daß zur Variation der Charakteristik auf unterschiedliche zur Verfügung stehende Stimmen zurückgegriffen wird, wobei die Auswahl anhand der Steuerbefehle getroffen wird. 5. The method according to any one of the preceding claims, characterized in that different available voices are used to vary the characteristic, the selection being made on the basis of the control commands.
6. Verfahren nach einem der vorherigen Ansprüche, dadurch gekennzeichnet, daß auf eine zur Verfügung stehende Stimme zurückgegriffen wird und deren Charakteristik anhand zugänglicher Einstellparameter, wie Klangfarbe, Stimmlage, Betonung, Stimmdehnung oder Lautstärke, variiert wird.6. The method according to any one of the preceding claims, characterized in that an available voice is used and the characteristics thereof are varied on the basis of accessible setting parameters such as timbre, pitch, emphasis, voice stretching or volume.
7. Verfahren nach einem der vorherigen Ansprüche, dadurch gekennzeichnet, daß in einer Sprachnachricht Stimmen unterschiedlicher Sprache verwendet werden.7. The method according to any one of the preceding claims, characterized in that voices of different languages are used in a voice message.
8. Verfahren nach einem der vorherigen Ansprüche, dadurch gekennzeichnet, daß die Sprachnachricht als8. The method according to any one of the preceding claims, characterized in that the voice message as
Text über das Short Message System (SMS) verschickt und nach der Konvertierung über die Sprachausgabeeinrichtung eines Telephons oder eines Computers ausgegeben wird.Text is sent via the Short Message System (SMS) and is output after conversion via the voice output device of a telephone or a computer.
9. Verfahren nach einem der vorherigen Ansprüche, dadurch gekennzeichnet, daß die Sprachnachricht als9. The method according to any one of the preceding claims, characterized in that the voice message as
E-mail über das Internet verschickt und nach der Konvertierung über die Sprachausgabeeinrichtung eines Telephons oder eines Computers ausgegeben wird.E-mail is sent over the Internet and, after conversion, is output via the voice output device of a telephone or a computer.
10. Verfahren nach einem der vorherigen Ansprüche, dadurch gekennzeichnet, daß als Steuerbefehle10. The method according to any one of the preceding claims, characterized in that as control commands
„sprechende" Symbole, beispielsweise „Smilies" oder „short cuts", verwendet werden, die an sich für den Inhalt keine weitere Bedeutung haben."Speaking" symbols, for example "smilies" or "short cuts", are used, which in themselves have no further meaning for the content.
11. System zur Umsetzung des Verfahrens nach einem der vorherigen Ansprüche aufweisend einen Computer, der in ein11. System for implementing the method according to any one of the preceding claims comprising a computer that in a
Telekommunikations-netz implementiert ist und auf dem ein Programm zur Sprachsynthese („Stimme") realisiert ist, das eine als Textdatei vorliegende Nachricht in einen gesprochenen Text konvertiert und über eine Sprachleitung zu einem ebenfalls in das Netz implementierten Endgerät verschickt, das eine Sprachausgabeeinrichtung zur Ausgabe des gesprochenen Textes aufweist, gekennzeichnet durch ein Modul, das dem Programm zugeordnet ist und das ein in der Textdatei implementiertes Steuerzeichen erkennt, wobei das Modul die Charakteristik der die Sprachnachricht sprechenden Stimme, insbesondere bezüglich ihrer Klangfarbe und ihrer Melodie, entsprechend des Steuerzeichens modifiziert. Telecommunications network is implemented and on which a program for voice synthesis ("voice") is implemented, which converts a message as a text file into spoken text and sends it over a voice line to a terminal device also implemented in the network, which has a voice output device for output of the spoken text, characterized by a module that is assigned to the program and that is implemented in the text file Recognizes control characters, the module modifying the characteristics of the voice speaking the voice message, in particular with regard to their timbre and melody, in accordance with the control character.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE2002107875 DE10207875A1 (en) | 2002-02-19 | 2002-02-19 | Parameter-controlled, expressive speech synthesis from text, modifies voice tonal color and melody, in accordance with control commands |
DE10207875.0 | 2002-02-19 |
Publications (1)
Publication Number | Publication Date |
---|---|
WO2003071520A1 true WO2003071520A1 (en) | 2003-08-28 |
Family
ID=27635279
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PCT/DE2003/000049 WO2003071520A1 (en) | 2002-02-19 | 2003-01-10 | Parameter-controlled voice synthesis |
Country Status (2)
Country | Link |
---|---|
DE (1) | DE10207875A1 (en) |
WO (1) | WO2003071520A1 (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1528483A1 (en) * | 2003-10-30 | 2005-05-04 | Nec Corporation | Device and method for displaying a text message together with information on emotional content of the message |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE102004012208A1 (en) | 2004-03-12 | 2005-09-29 | Siemens Ag | Individualization of speech output by adapting a synthesis voice to a target voice |
US8249873B2 (en) | 2005-08-12 | 2012-08-21 | Avaya Inc. | Tonal correction of speech |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08247779A (en) * | 1995-03-09 | 1996-09-27 | Honda Motor Co Ltd | Voice outputting apparatus |
EP0901000A2 (en) * | 1997-07-31 | 1999-03-10 | Toyota Jidosha Kabushiki Kaisha | Message processing system and method for processing messages |
WO2000023982A1 (en) * | 1998-10-16 | 2000-04-27 | Volkswagen Aktiengesellschaft | Method and device for information and/or messages by means of speech |
EP1168297A1 (en) * | 2000-06-30 | 2002-01-02 | Nokia Mobile Phones Ltd. | Speech synthesis |
WO2002049003A1 (en) * | 2000-12-14 | 2002-06-20 | Siemens Aktiengesellschaft | Method and system for converting text to speech |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US49594A (en) * | 1865-08-22 | Improvement in rotary engines | ||
GB2291571A (en) * | 1994-07-19 | 1996-01-24 | Ibm | Text to speech system; acoustic processor requests linguistic processor output |
US5905972A (en) * | 1996-09-30 | 1999-05-18 | Microsoft Corporation | Prosodic databases holding fundamental frequency templates for use in speech synthesis |
US6081780A (en) * | 1998-04-28 | 2000-06-27 | International Business Machines Corporation | TTS and prosody based authoring system |
DE19841683A1 (en) * | 1998-09-11 | 2000-05-11 | Hans Kull | Device and method for digital speech processing |
DE19939947C2 (en) * | 1999-08-23 | 2002-01-24 | Data Software Ag G | Digital speech synthesis process with intonation simulation |
DE10018134A1 (en) * | 2000-04-12 | 2001-10-18 | Siemens Ag | Determining prosodic markings for text-to-speech systems - using neural network to determine prosodic markings based on linguistic categories such as number, verb, verb particle, pronoun, preposition etc. |
-
2002
- 2002-02-19 DE DE2002107875 patent/DE10207875A1/en not_active Withdrawn
-
2003
- 2003-01-10 WO PCT/DE2003/000049 patent/WO2003071520A1/en not_active Application Discontinuation
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08247779A (en) * | 1995-03-09 | 1996-09-27 | Honda Motor Co Ltd | Voice outputting apparatus |
EP0901000A2 (en) * | 1997-07-31 | 1999-03-10 | Toyota Jidosha Kabushiki Kaisha | Message processing system and method for processing messages |
WO2000023982A1 (en) * | 1998-10-16 | 2000-04-27 | Volkswagen Aktiengesellschaft | Method and device for information and/or messages by means of speech |
EP1168297A1 (en) * | 2000-06-30 | 2002-01-02 | Nokia Mobile Phones Ltd. | Speech synthesis |
WO2002049003A1 (en) * | 2000-12-14 | 2002-06-20 | Siemens Aktiengesellschaft | Method and system for converting text to speech |
Non-Patent Citations (1)
Title |
---|
PATENT ABSTRACTS OF JAPAN vol. 1997, no. 01 31 January 1997 (1997-01-31) * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1528483A1 (en) * | 2003-10-30 | 2005-05-04 | Nec Corporation | Device and method for displaying a text message together with information on emotional content of the message |
US7570814B2 (en) | 2003-10-30 | 2009-08-04 | Nec Corporation | Data processing device, data processing method, and electronic device |
Also Published As
Publication number | Publication date |
---|---|
DE10207875A1 (en) | 2003-08-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE69821673T2 (en) | Method and apparatus for editing synthetic voice messages, and storage means with the method | |
EP1336955B1 (en) | Method for natural speech synthesis in a computer-based dialogue system | |
Oktapiani et al. | Women’s language features found in female character’s utterances in the Devil Wears Prada movie | |
Kohler | Communicative Functions and Linguistic Forms in Speech Interaction: Volume 156 | |
DE69933614T2 (en) | SYSTEM FOR DISTRIBUTING, TRANSMITTING AND RECEIVING NEWS AND METHOD FOR DISTRIBUTING MESSAGES | |
CN111414733B (en) | Data processing method and device and electronic equipment | |
WO2003071520A1 (en) | Parameter-controlled voice synthesis | |
Leistra-Jones | Hans von Bülow and the Confessionalization of Kunstreligion | |
EP0058130B1 (en) | Method for speech synthesizing with unlimited vocabulary, and arrangement for realizing the same | |
DE69910412T2 (en) | VOICE CONTROLLED NAVIGATION FOR AN ELECTRONIC POST READER | |
EP1110203A1 (en) | Device and method for digital voice processing | |
Häusl | ‘So I prayed to the God of heaven’(Neh 2: 4): Praying and Prayers in the Books of Ezra and Nehemiah | |
Landy | In Defense of Jakobson | |
JP2001242881A (en) | Method of voice syhthesis and apparatus thereof | |
Perrin et al. | Progression analysis: tracing journalistic language awareness | |
AU2021105875A4 (en) | Nethra Jyothi | |
DE10048069A1 (en) | Electronic text transmission device | |
Wersényi | Evaluation of auditory representations for selected applications of a graphical user interface | |
Shenishen | RESHAPING THE WORLD: THE BREATHING PICTURES IN THE POETRY OF CUMMINGS AND MAYAKOVSKY | |
Hoegaerts | Fairness and fluency: the political audibility of ‘newcomers’ in Victorian debating clubs and public meetings, 1870–1910 | |
Moe | Breathing, Parsing, Praying | |
EP1194921B1 (en) | Method and device for speech processing | |
Holmstrom et al. | 1. The History of North American English | |
Chairunissa et al. | LANGUAGE FUNCTIONS IN@ onlyjiungs TWITTER ACCOUNT | |
DE10024491C2 (en) | Electronic device and method for voice output of the source of an email |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
AK | Designated states |
Kind code of ref document: A1 Designated state(s): JP US |
|
AL | Designated countries for regional patents |
Kind code of ref document: A1 Designated state(s): AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HU IE IT LU MC NL PT SE SI SK TR |
|
DFPE | Request for preliminary examination filed prior to expiration of 19th month from priority date (pct application filed before 20040101) | ||
121 | Ep: the epo has been informed by wipo that ep was designated in this application | ||
122 | Ep: pct application non-entry in european phase | ||
NENP | Non-entry into the national phase |
Ref country code: JP |
|
WWW | Wipo information: withdrawn in national office |
Country of ref document: JP |