Beschreibung
Verfahren zur Wiedergabe von gesendeten Textnachrichten
Die vorliegende Erfindung betrifft ein Verfahren zur Wiedergabe von gesendeten Textnachrichten, bei dem der empfangene Text über eine Sprachsynthese in ein akustisches Signal umgewandelt wird.
Um die Benutzerfreundlichkeit von mobilen Geräten, wie beispielsweise Mobiltelefonen oder PDAs (Personal Digital Assistant) zu erhöhen, werden Sprachsynthesemethoden eingesetzt, um Text in Sprache umzusetzen. Man spricht in diesem Zusammenhang vom sogenannten Text-to-Speech (TTS) . Damit besteht für den Benutzer eines mobilen Geräts die Möglichkeit, sich eine empfangene Textnachricht, beispielsweise eine SMS (Short Message) oder eine E-Mail vorlesen zu lassen. Neben der Benutzerfreundlichkeit erhöht dies auch in vielen Fällen die Sicherheit, beispielsweise wenn während des Autofahrens eine Textnachricht empfangen wird und der Benutzer die Textnachricht vorgelesen bekommt, anstelle sie selbst lesen zu müssen.
Für die Sprachsynthese wird derzeit ein Sprachsynthesizer eingesetzt, der auf verschiedenen Verfahren basieren kann:
1. Formant- oder Regelsynthese
Bei diesem Verfahren wird eine Wellenform durch Filterung in Sprachsignale umgewandelt. Dabei werden viele Regeln benötigt, um bestimmte Laute in unterschiedlichen Kontext realisieren zu können. Diese Regeln werden in Parameter des Verfahrens umgesetzt, wodurch sich dann beispielsweise Intonation und Lautdauer leicht steuern lassen. Somit kann dadurch relativ einfach ein sehr variationsreiche Sprache generiert werden. Der Nachteil dieses Verfahrens liegt allerdings im künstlichen Klang der Stimme.
2. Konkatenationssynthese
Die meisten derzeit eingesetzten Sprachsynthesizer verwen- den dieses Verfahren. Dabei werden sprachliche Äußerungen aufgenommen, aus denen Teile ausgeschnitten und zu neuen Äußerungen zusammengesetzt werden. Die Größe dieser Teile kann von vollständigen Phrasen und Wörtern bis hin zu Einheiten reichen, welche kleiner als Laute sind, die soge- nannten Mikrosegmente. Mit diesen Mikrosegmenten kann man dann jeden beliebigen Text einer Sprache vorlesen lassen.
Ein grundsätzliches Problem dieses Verfahrens liegt darin, dass die aufgenommenen Sprachbausteine nicht so leicht in Dauer und Tönhöhe verändert werden können. Die technischen Verfahren, welche das ermöglichen, gehen immer mit einer Qualitätseinbuße bei der Sprachqualität einher und können zudem zu einer unnatürlichen Stimme führen. Der Vorteil dieses Verfahrens ist jedoch die menschliche Qualität der Stimme, die es ermöglicht, individuelle Sprecher wiederzuerkennen.
3. Artikulatorische Synthese
Bei diesem neuartigen Verfahren werden die Bewegungen der beim Sprechen verwendeten Organe modellhaft nachgebildet und basierend auf deren Positionierung erfolgt eine Berechnung der Resonanzeigenschaften im Rachen-, Mund- und Nasenraum. Auf Grund der hohen Rechenintensität wird die- ses Verfahren derzeit nur zu Forschungszwecken eingesetzt.
Bei der Formant- oder Regelsynthese sowie der Konkatenationssynthese lassen sich durch Filter und Parameter für Tonhöhe die Lautstärke und Sprechgeschwindigkeit einstellen. Bei der Konkatenationssynthese besteht zudem auch die Möglichkeit, mehrere Stimmen nachzubilden, etwa eine männliche oder eine weibliche Stimme. Allerdings werden für jede dieser Stimmen
unterschiedliche Mikrosegmente benötigt, wodurch es also nur mit sehr hohem Aufwand möglich ist, völlig neue Stimmen nachzubilden. Die artikulatorische Sprachsynthese ist derzeit noch nicht ausgereift, um mit einem geringen Parametersatz einen beliebigen Sprecher nachzubilden.
Somit ergibt sich als gemeinsamer Nachteil der beschriebenen Sprachsynthesemethoden, dass sie entweder akustisch unbefriedigende Resultate liefern oder eine zu hohe Rechenkomplexität aufweisen.
Ausgehend von diesem Stand der Technik ist es Aufgabe der vorliegenden Erfindung, eine Möglichkeit zum Umsetzen von Text in Sprache zu schaffen, welcher vom Klang her befriedi- gende Ergebnisse liefert und zudem keine hohe Rechenkomplexität erfordert.
Diese Aufgabe wird durch den unabhängigen Anspruch gelöst, Weiterbildungen finden sich in den abhängigen Ansprüchen.
Kern der Erfindung ist es, dass bei der Wiedergabe von Textnachrichten als akustisches Signal bei der Sprachsynthese zumindest ein Parameter senderspezifisch belegt wird. Dies hat den Vorteil, dass auch mit einem nicht komplexen Sprachsyn- theseverfahren breite akustische Möglichkeiten erschließbar sind.
Die Erfindung wird im Folgenden anhand von Beispielen näher erläutert. Ein beispielhaftes Verfahren gemäß der Erfindung unter der Verwendung von Funkgeräten, beispielsweise Mobil- funkendgeräten, läuft in folgenden Schritten ab:
1. Ermittlung der Parameter für die Sprachsynthese
Diese Ermittlung kann im Sendegerät oder im Endgerät er- folgen. Erfolgt sie im Sendegerät, so werden
2. optional die Sprachparameter an das Empfängergerät übertragen.
Um eine Stimme nachzubilden, muss die Ermittlung der Sprach- syntheseparameter in Sendergerät erfolgen. Besteht der
Sprachsyntheseparameter oder bestehen die Sprachsyntheseparameter jedoch nur aus Geschlecht der Person, Sprechgeschwindigkeit und Intonation, so können diese Sprachsyntheseparameter von der Sendeperson entweder im Sendegerät direkt einge- geben werden, beispielsweise durch Erstellen eines sogenannten Profils, welches dann für alle gesendeten Textnachrichten Gültigkeit besitzt. Auch im Empfängergerät können die vorgenannten Sprachsyntheseparameter wie Geschlechterperson, Sprechgeschwindigkeit und Intonation eingegeben werden, bei- spielsweise durch Abspeichern eines Profils beim Adressbucheintrag. Weiterhin können sie im Empfängergerät automatisch ermittelt werden, beispielsweise anhand des Namenseintrags, der einem weiblichen Namen auch eine weibliche Stimme zuordnet. Damit ist dann der optionale Schritt 2, nämlich Übertra- gung der Sprachsyntheseparameter, nicht mehr erforderlich.
Wie oben ausgeführt, werden die Sprachsyntheseparameter, sofern sie nicht im Sendergerät ermittelt werden, beim Senden der Textnachricht beigefügt. Dies kann beispielsweise über Codes erfolgen. Im Folgenden werden beispielsweise für SMS- Nachrichten verwendbare Codes aufgeführt, die teilweise optional und teilweise als erforderlich vorgesehen sein können:
a) Nachrichtentypindikator ("Message Type Indicator" ) : Dieser Parameter beschreibt den Nachrichtentyp und kann beispielsweise durch 2 Bits dargestellt werden. Angabe des Nachrichtentyps kann als erforderlich vorgesehen sein.
b) Ein "Reject-Duplicates-Indikator", der angibt, ob das Ser- vice Center (SC) einen sogenannten "SMS-Submit" akzeptieren soll, wenn eine Kurznachricht (SM: "Short Message") noch im Service Center vorliegt, welche die gleiche Nach-
richtenreferenz (MR: "Message Reference") und die gleiche Empfängeradresse (DA: "Destination Address") aufweist, wie eine vorher eingereichte Kurznachricht desselben Senders (OA: "Original Address") . Unter "SMS-Submit" versteht man die Freigabe einer SMS zum Senden, das heißt, die SMS wird zumindest vom Sendegerät an das Service Center übermittelt. Auch dieser Indikator kann als erforderlich vorgesehen sein und beispielsweise durch 1 Bit dargestellt werden.
c) Gültigkeitsdauerformatindikator ("Validity Period Format Indicator"): Dieser Parameter zeigt an, ob ein Gültigkeitsdauerfeld (VP: "Validity Period") vorhanden ist. Auch er kann als erforderlich vorgesehen sein und beispielswei- se durch 2 Bits dargestellt werden.
d) "Reply-Path-Indikator" : Dieser Parameter zeigt an, ob eine Anfrage nach einem Reply-Path erfolgte. Unter Reply-Path versteht man den Pfad für eine Antwort.
e) Benutzerdaten-Header-Indikator: Dieser Parameter zeigt an, ob das Benutzerdatenfeld einen Header oder Vorspann enthält. Dieser Parameter kann als lediglich optional vorgesehen sein und durch 1 Bit dargestellt werden.
f) Statusreportindikator: Dieser Parameter zeigt an, ob die Mobilstation einen Statusreport anfordert. Auch dieser Parameter kann als lediglich optional vorgesehen sein und durch 1 Bit dargestellt werden.
g) Nachrichtenreferenzindikator: Dieser Parameter identifiziert das SMS-Submit. Er kann als erforderlich vorgesehen sein und beispielsweise durch eine Integer - Zahl dargestellt werden.
h) Zieladresse ("Destination Address"): Dieser Parameter gibt die Adresse des Empfängergeräts an und kann als erforder-
lieh vorgesehen sein und beispielsweise durch 2 bis 12 Ok- tette dargestellt sein.
I) Protokollidentifikationsindikator : Dieser Parameter lden- tifiziert das Protokoll der darüber liegenden Schicht, sofern vorhanden. Er kann erforderlich sein und beispielsweise durch ein Oktett dargestellt sein.
j ) Datencodierungsschemaindikator: Dieser Parameter ldentifi- ziert das Codierungsschema innerhalb der Benutzerdaten und kann beispielsweise erforderlich sein und durch ein Oktett dargestellt sein.
k) Gultigkeitspeπodemdikator : Dieser Parameter ldentifi- ziert den Zeitpunkt, ab dem die Nachricht nicht langer gültig ist. Zur Parameter kann lediglich optional vorgesehen sein und beispielsweise durch 1 oder 7 Oktetts dargestellt sein.
1) Benutzerdatenlange: Dieser Parameter zeigt die Lange des Benutzerdatenfelds an, welches folgt und kann beispielsweise erforderlich sein und durch eine Integer-Zahl dargestellt werden.
m) Benutzerdatenindikator: Dieser Parameter kann optional vorgesehen sein und von dem digitalen Kommandosignal (DCS: "Digital Command Signal") abhangen.
Wird der Benutzerdaten-Header-Indikator mit dem Wert 1 be- legt, so besteht das Benutzerdatenfeld aus einem Header und der codierten Textnachricht. Der Header des Benutzerdatenfeldes enthalt eine Reihe frei verfugbarer Bits, welche für zukunftige Dienste vorgesehen sind, und welche daher mit den ermittelten Sprachparametern belegt werden können.
Damit die übertragenen Parameter auch geräteunabhängig eingesetzt werden können, kann die Einfuhrung standardisierter
Sprachsyntheseparameter erforderlich sein. Das Verfahren selbst bedarf jedoch keiner Standardisierung.
Damit ist das Verfahren in verschiedenen Kommunikationsnetzen einsetzbar, insbesondere in Mobilfunkkommunikationsnetzen. Entsprechende Geräte zum Durchführen des Verfahrens sind beispielsweise Terminals in derartigen Kommunikationsnetzen, mittels denen Textnachrichten übermittelbar sind.