DE60209420T2

DE60209420T2 - System und Verfahren zum Umwandeln von von einem Mobilgerät vorbereiteten Textnachrichten in Sprachnachrichten

Info

Publication number: DE60209420T2
Application number: DE60209420T
Authority: DE
Inventors: Robert Van Kommer; Andreas Marx; Felix Baessler
Original assignee: Swisscom AG
Current assignee: Swisscom AG
Priority date: 2002-10-14
Filing date: 2002-10-14
Publication date: 2006-09-28
Anticipated expiration: 2022-10-15
Also published as: ATE319267T1; EP1411736B1; DE60209420D1; EP1411736A1

Description

Technisches Gebiet
Die vorliegende Erfindung bezieht sich auf Verfahren und Systeme, um das Format von Meldungen, die von einem mobilen Gerät, wie ein Mobiltelefon oder Persönlicher Digitaler Assistent (PDA), gesendet wurden, mit einem Kommunikationsinterface zu konvertieren.
Stand der Technik
Es wurden verschiedene Kommunikationsprotokolle entwickelt, welche bei verschiedenen Geräten verwendet werden, um verschiedene Kommunikationsbedürfnisse zu erfüllen. Viele Mobilfunksysteme unterstützen zum Beispiel ein oder mehrere Text- und Datenmeldungsprotokolle, um Text- und/oder Datenmeldungen zwischen mobilen Geräten zu senden und zu empfangen. In GSM Netzwerken werden sehr oft SMS (Short Message System) und in neuster Zeit USSD (Unstructured Supplementary Service Data), EMS (Enhanced Messaging Service) und MMS (Multimedia Messaging Service) gebraucht, um Daten- und Textmeldungen auszutauschen.
Text- und Datenmeldungen können jedoch nur zu Empfangsgeräten ausgeliefert werden, die dasselbe Protokoll unterstützen und die fähig sind, diese wiederzugeben. Daraus folgt, dass verschiedene Typen von mobilen Geräten, mobilen Computern und PDAs Meldungen vorbereiten und senden können, die nur von einem Teil von Geräten, die in demselben Netzwerk verwendet werden, empfangen und wiedergegeben werden können. Die meisten Festnetztelefonsysteme, so wie POTS (Plain Old Telephony System), ISDN (Integrated Services Digital Network) oder VoIP (Voice over IP) Systeme können die sehr weit verbreiteten Meldungen wie SMS, USSD oder MMS nicht übermitteln und wiedergeben. Die Verwendung von diesen populären Kommunikationssystemen ist darum hauptsächlich auf eine Kommunikation zwischen mobilen Geräten beschränkt. Selbst in einem mobilen Telekommunikationssystem können Roamingbeschränkungen die Fähigkeiten eines mobilen Abonnenten beschränken, um Textmeldungen zu einem Abonnenten in einem anderen Netzwerk zu senden, weil beispielsweise nicht alle mobilen Geräte EMS oder MMS Meldungen unterstützen. Zusätzlich ist es in vielen Situationen nicht gewünscht oder sogar gefährlich Text- und Datenmeldungen auf dem Display eines tragbaren Geräts zu lesen – zum Beispiel für Autofahrer.
Verschiedene Verfahren wurden bereits vorgeschlagen, um Textmeldungen, die mit einem mobilen Gerät in einem mobilen Netzwerk vorbereitet wurden, in Meldungen eines anderen, breiter akzeptierten Typen umzuwandeln. Es ist beispielsweise bereits bekannt, SMS-Meldungen in E-Mail Meldungen, die eine E-mail-Adresse ausgeliefert werden, oder in Faxmeldungen, die an ein Faxgerät ausgeliefert werden, umzuwandeln.
Eine Vielfalt von so genannten SMS-zu-Sprache-Systemen wurde ebenfalls entwickelt, um SMS Textmeldungen in Sprachmeldungen umzuwandeln, die unter anderem an Blinde ausgeliefert werden. Viele existierende Systeme sehen jedoch vor, dass der Empfänger ein spezielles Gerät verwendet, welches die Umwandlung vornehmen kann, was den Gebrauch von SMS nur zu einer sehr kleinen Anzahl von zusätzlichen Empfängern ausweitet. Zusätzlich werden die Meldungen gewöhnlich mit einer neutralen Stimme gelesen und sind daher sehr unpersönlich.
WO-A1-02/076120 beschreibt ein System und ein Verfahren, um eine Audiomeldung zu einem Empfänger zu übertragen, wobei die Audiomeldung aus einem Umwandlungsprozess resultiert. Mittel, um Daten einzugeben, werden durch einen Sender verwendet, um eine textbasierte Meldung einzugeben, entweder in freier Form oder durch die Verwendung einer Vorlage, welche zu Verarbeitungsmitteln geschickt und in eine Audiomeldung umgewandelt wird, welche in einer Sprache, die dem Empfänger bekannt ist, mit oder ohne Soundeffekten gesprochen werden kann. Die Meldung wird dann über ein Kommunikationsnetzwerk zu einem Kommunikationsgerät eines Empfängers gesendet, um von dem Empfänger gehört zu werden. Die Struktur der Datenvorlage kann von den Verarbeitungsmitteln zu den Mittel, um die Daten einzugeben, oder zu dem Kommunikationsgerät eines Empfängers heruntergeladen werden.
US-A1-2002/0128025 offenbart ein Verfahren, um eine SMS Meldung in einem mobilen Kommunikationssystem weiterzuleiten. Ein anrufendes mobiles Terminal beantragt die Übertragung von einer SMS-Meldung an ein MC (Meldungscenter) und das MC bestimmt, dass eine Weiterleitungsfunktion für ein angerufenes mobiles Terminal gesetzt wird. Wenn dieses gesetzt wird, überträgt die SMS Meldungen zu einem mobilen Zielterminal.
Zusammenfassung der Erfindung
Es ist daher ein Ziel der Erfindung, ein verbessertes Verfahren und System zu schaffen, um Textmeldungen, die mit einem mobilen Gerät vorbereitet wurden, in einem mobilen Netzwerk in Sprachmeldungen umzuwandeln, insbesondere ein Verfahren und ein System, das die Nachteile der Verfahren und Systeme des Standes der Technik vermeidet.
Es ist ein anderes Ziel der Erfindung, ein Verfahren und System zu schaffen, um Textmeldungen, die mit einem mobilen Gerät vorbereitet wurden, in einem mobilen Netzwerk in Sprachmeldungen umzuwandeln, welche von einer grösseren Anzahl von Empfangsterminals empfangen werden können.
Es ist ein anderes Ziel der Erfindung, ein Verfahren und System zu schaffen, um Textmeldungen in Sprachmeldungen umzuwandeln, wobei die gesprochene Sprachmeldung durch den Absender personalisiert werden können.
In Übereinstimmung mit einem Ausführungsbeispiel der vorliegenden Erfindung werden diese Ziele mit einem System, um Textmeldungen, die mit einem mobilen Gerät vorbereitet wurden, in einem mobilen Netzwerk in Sprachmeldungen umzuwandeln, gemäss dem Oberbegriff des Anspruchs 1 gelöst, welches dadurch gekennzeichnet ist, dass mindestens einige der besagten Tags als Parameter verwendet werden, um einen oder eine Vielzahl von Auslieferungskanälen unter verschiedenen Auslieferungskanälen zu wählen, um die besagte Sprachmeldung zu dem Empfänger auszuliefern, die verfügbaren verschiedenen Auslieferungskanäle umfassen mindestens einen von Telefon, MMS, E-Mail oder Spontanmeldung mit einer eingebetteten Audiodatei, Speicherung einer Sprachmeldung in einer Webseite, VoIP und SOAP.
Die Ziele werden auch durch ein Verfahren gemäss der Oberbegriff des Anspruchs 23 und durch ein mobiles Gerät gemäss dem Oberbegriff des Anspruchs 25 gelöst, welche dadurch gekennzeichnet sind, dass mindestens einige der besagten Tags als Parameter verwendet werden, um einen oder eine Vielzahl von Auslieferungskanälen unter verschiedenen Auslieferungskanälen zu wählen, um die besagte Sprachmeldung zu dem Empfänger auszuliefern, die verfügbaren verschiedenen Auslieferungskanäle umfassen mindestens einen von Telefon, MMS, E-Mail oder Spontanmeldung mit einer eingebetteten Audiodatei, Speicherung einer Sprachmeldung in einer Webseite, VoIP und SOAP.
In verschiedenen Ausführungsformen können Tags in die Textmeldungen eingebettet werden, um verschiedene Parameter der Text-in-Sprache-Konvertierung zu definieren und um zu definieren, wie die konvertierten Meldungen ausgeliefert werden sollen.
Obwohl das Verfahren der Erfindung auch bei Meldungen angewendet werden kann, welche gespeichert und mit einer zeitlichen Verzögerung übermittelt werden, hat es den Vorteil, dass es perfekt mit synchronen oder quasisynchronen Meldungen wie SMS, EMS, MMS oder USSD durchführbar ist, welche in der Infrastruktur des Netzwerkes ohne merkbaren Zeitverzug in eine Sprachmeldung umgewandelt werden können.
Die Erfindung verwendet vorzugsweise einen geeigneten Server in der Infrastruktur des Netzwerkes, um den Text in Sprache umzuwandeln und um die konvertierte Sprachmeldung weiterzuleiten. Dies hat den Vorteil, dass keine Modifikationen an den bestehenden Meldungsverarbeitungssystemen wie SMSC (Short Message Service Center) oder an den Terminalgeräten der Empfänger nötig sind.
Kurze Beschreibung der Figuren
Die Erfindung wird besser verständlich mit der Hilfe der Beschreibung eines speziellen Ausführungsbeispiels, welche durch die Figuren illustriert werden, in welchen
1 die allgemeine Struktur eines Telekommunikationssystems illustriert, welches ein Text-in-Sprache-Konvertierungssystem gemäss der Erfindung enthält.
2 eine Textmeldung illustriert, welche Tags enthält, welche als Parameter für die Text-in-Sprache-Konvertierung verwendet werden können.
Wege zur Ausführung der Erfindung
Bezug nehmend auf 1 enthält das Telekommunikationssystem mindestens ein mobiles Netzwerk 2, an welches eine Vielzahl von Abonnenten, die ein mobiles Gerät 1 verwenden, angeschlossen sind. Mindestens einige Geräte 1 enthalten Mittel, um Text- und/oder Datenmeldungen zu anderen mobilen Geräten in demselben mobilen Netzwerk 2 zu senden oder in einem mobilen Netzwerk, welches durch ein Roamingagreement mit diesem Netzwerk 2 verbunden ist. Im Zusammenhang von GSM, GPRS, HSCSD oder Edge mobilen Netzwerken enthält die Text- und/oder Datenmeldung, welche gesendet werden kann, SMS (Short Message System), USSD (Unstructured supplementary Service data), MMS (Multimedia Messaging Service), EMS (Enhanced Message Service) und mit einigen Beschränkungen E-Mailmeldungen.
Das mobile Netzwerk 2 enthält ein Meldungsverarbeitungssystem 3 in der Infrastruktur des Netzwerkes, um Text- und/oder Datenmeldungen, die von dem mobilen Abonnenten 1 gesendet wurden, zu verarbeiten. Verschiedene Systeme können in demselben Netzwerk vorgesehen werden, um verschiedene Typen von Meldungen, die von den mobilen Abonnenten gesendet werden, zu verarbeiten. Das mobile Netzwerk 2 kann beispielsweise eine oder mehrere Kurmeldungszentralen (SMSC) enthalten, um SMS, MMS und/oder EMS zu verarbeiten, einen USSD-Handler, um USSD zu verarbeiten, und ein oder mehrere SMTP-Server, um ausgehende E-Mails zu verarbeiten. Das Meldungsverarbeitungssystem 3 ist ein Standardteil der Infrastruktur des mobilen Netzwerkes 2 und wird vorzugsweise zentral durch einen Operator des Netzwerkes 2 betrieben, so dass alle Daten- und/oder Textmeldungen 20, die von Abonnenten des Netzwerkes 2 gesendet werden, vorzugsweise zu diesem Meldungsverarbeitungssystem weitergeleitet werden. In einem Ausführungsbeispiel umfasst das Meldungsverarbeitungssystem 3 einen WEB- oder WAP-Server, der Webformulare, die von den Abonnenten ausgefüllt und gesendet werden, verarbeitet.
Das Telekommunikationssystem der Erfindung enthält weiter ein Modul 4, um Textmeldungen 20, die durch das Meldungsverarbeitungssystem 3 weitergeleitet werden, in Sprachmeldungen umzuwandeln. Gemäss verschiedenen Ausführungsformen kann es möglich sein, alle Meldungen, die durch das System 3 empfangen werden, an das Modul 4 weiterzuleiten und/oder nur Meldungen, die für registrierte Empfänger in einer vordefinierten Liste gedacht sind, und/oder nur Meldungen, die zu einer speziellen Servicetelefonnummer gesendet werden, und/oder nur Meldungen, die einen speziellen Tag, Kopfzeile, Adresse oder Servicecode enthalten.
Das Modul 4 enthält vorzugsweise ein Text-in-Sprache-Umwandlungssystem 5, um den Textinhalt der empfangenen Meldung in eine synthetisierte Sprachmeldung umzuwandeln. Das Text-in-Sprache-Umwandlungssystem 5 kann um einen konventionellen Sprachsynthesizer herum angeordnet werden.
Das Modul 4 umfasst weiter einen Taginterpreter, um Tags (Labels), die in die empfangene Textmeldung 20 eingebettet sind, zu interpretieren. Diese Tags sind dazu da, um Parameter der Text-in-Sprache-Umwandlung und der Meldungsauslieferung zu erhalten, wie später noch beschrieben wird. Diese Tags sind vorzugsweise lesbare Zeichenketten, die auf einer normalen Tastatur eingegeben oder durch einen geeigneten Editor generiert werden können. Der Taginterpreter kann ein Standard XML (eXtended Markup Language), zum Beispiel (Virtual Human Markup Language) Taginterpreter, wie er durch VHL seit dem 13. März 2001 als Arbeitskopien auf http://www.interface.computing.edu.au/documents/VHML verfügbar ist, oder einen anderen Medienschlüsselinterpreter enthalten.
Eine Datenbank 8 mit persönlichen Einstellungen enthält persönliche Profile der Sender und/oder der Empfänger 10 der übermittelten Meldungen. Diese Profile von jedem Benutzer können folgende Parameter enthalten:

– Bevorzugte Parameter für die Text-in-Sprache-Umwandlung, welche beispielsweise Vorlagen, etc. enthalten;
– Bevorzugte Auslieferungsparameter;
– Andere Benutzereinstellungen, wie zum Beispiel Verrechnungsparameter und -koordinaten, öffentlicher kryptographischer Schlüssel, und so weiter;
– Audio und/oder Bilddateien, welche in die Meldung integriert werden, wenn der korrespondierende Tag in der Meldung vorhanden ist, enthaltend Midi-Dateien, Musikstücke, vordefinierte Audiomeldungen, etc.
– etc.

Ein WEB-, WAP-, SMS/MMS-, IVR-(Interactive Voice Response) und/oder E-Mailinterface (nicht dargestellt) ist vorzugsweise vorgesehen, um Benutzern zu erlauben, ihr Profil in der Datenbank 8 zu ändern. Dieser Zugang ist vorzugsweise mit einer gesicherten Verbindung wie zum Beispiel HTTPS, SSL (Secure Socket Layer), TLS (Transport Layer Security); WTLS (Wireless Transport Layer Security) gesichert.
Einige Felder der Datenbank in dem Benutzerprofil können auch von vorher gesendeten oder empfangenen und mit einem Tag versehenen Meldungen erneuert werden. In einem bevorzugten Ausführungsbeispiel hält das Benutzerprofil die letzten Parameter, die in vorher gesendeten Meldungen eingebettet sind, fest. Diese Datenbank 8 kann auch Profile von Benutzergruppen enthalten, zum Beispiel, um einige Parameter, die allen Angestellten einer Firma oder allen Mitgliedern einer Familie gemeinsam sind, zu definieren.
Einige Prioritätsregeln müssen definiert werden, um das Verhalten des Text-in-Sprache-Umwandlungssystems zu spezifizieren, wenn die Parameter, die in eine empfangene Meldung eingebettet sind, nicht gleich oder sogar nicht konsistent mit Parametern des Sender- und/oder Empfängerprofils in der Datenbank 8 mit den persönlichen Einstellungen sind. In einem bevorzugten Ausführungsbeispiel werden diese Prioritätsregeln in dem Profil von jedem Empfänger 10 gespeichert und können zum Beispiel das folgende Verhalten von jedem Parameter definieren:

– Immer die Tags, die in die Meldung eingebettet sind, zu verwenden, oder wenn keine Tags in der Meldung definiert sind, die Parameter zu verwenden, die in dem Profil des Senders enthalten sind.
– Verwendung der Tags eingebettet in der Meldung oder definiert in dem Profil des Senders, nur wenn der Empfänger keine anderen Werte für dieselben Parameter in seinem Profil definiert hat.
– Immer die Tags eingebettet in der Meldung und/oder definiert durch den Sender zu ignorieren und die bevorzugten Werte, die der Empfänger in seinen Profil definiert hat, oder, wenn keine anderen Präferenzen definiert wurden, Defaultwerte zu verwenden.

Defaultprioritätsregeln können definiert werden, wenn der Empfänger 10 keine spezielleren Regeln für einen Parameter definiert hat oder wenn der Empfänger 10 nicht in das System eingeschrieben ist.
Ein Meldungsauslieferungssystem 6 ist in dem Modul 4 vorgesehen, um die umgewandelte Sprachmeldung, die durch das Text-in-Sprache-Umwandlungssystem 5 synthetisiert wurde, auszuliefern. In einem Ausführungsbeispiel enthält das Meldungsauslieferungssystem 6 einfach ein Modul zum Aufbau einer Sprachverbindung, um den Empfänger 10, der in der empfangenen Textmeldung 20 angegeben ist, anzurufen und, wenn der Anruf aufgebaut wurde, dem Empfänger 10 die konvertierte Sprachmeldung vorzusprechen. Die Parameter, die in die Meldung eingebettet sind, und/oder in der Datenbank 8 können definieren, wie viele Versuche gemacht werden müssen, wenn der Anrufaufbau fehlschlägt und ob der Sender informiert werden muss, wenn alle Versuche fehlgeschlagen sind.
Gemäss der Erfindung wählt das Meldungsauslieferungssystem 6 unter verschiedenen Auslieferungskanälen 9, um die synthetisierte Sprachmeldung zu dem Empfänger 10 auszuliefern. Mögliche Auslieferungskanäle 9, die ausgewählt werden können, enthalten:

– Sprachverbindung über POTS (Plain Old Telephony System), ISDN (Integrated Serivces Digital Network) oder Mobilfunknetz. In diesem Fall wird der Empfänger automatisch angerufen und die Sprachmeldung wird zu ihm ausgeliefert.
– Sprachverbindung über ein paketorientiertes Netzwerk, wie eine VoIP-Sitzung.
– MMS Meldung, welche die Sprachmeldung in einem Audioteil enthält und möglicherweise die Textmeldung in einem Textteil.
– Speichern der synthetisierten Sprachmeldung in einem Sprachmailserver, in welchem sie durch einen Telefonanruf, eine Websitzung, eine E-Mail abgerufen werden kann.
– Speichern der Meldung auf einer Webseite und Informieren des Empfängers durch einen anderen Kanal, wie zum Beispiel durch SMS, USSD, MMS, EMS, Telfon, E-Mail, etc. Die Information gibt den Namen des Senders, Zeit, Datum und Internetadresse (URL) der Seite an, von welcher die Meldung geholt werden kann.
– E-Mail, welche eine eingebettete Audiodatei enthält
– Sofortnachricht, welche eine eingebettete Audiodatei enthält
– SOAP: In diesem Fall werden die Meldungen zu einem Webservice ausgeliefert.
– Mehrfachkanal: gleichzeitiges oder nacheinander folgendes Ausliefern über verschiedene Kanäle.
– etc.

Die synthetisierte Sprachmeldung wird dann über den Kommunikationskanal 9 zu dem Empfänger 10, der in der Meldung von dem Sender angegeben wurde, ausgeliefert.
2 illustriert ein Beispiel einer Textmeldung 20, welches durch einen Sender, der ein mobiles Gerät 1 verwendet, gesendet und durch das Modul 4 konvertiert werden kann. Im Allgemeinen enthält die Textmeldung 20 einen oder mehrere Kopfteile 200 und ein Text- oder Datenteil 201. Der Kopfteil 200 zeigt zum Beispiel den Typ der Meldung, das Sendedatum, die Adresse des Senders und des Empfängers, usw. an. Das Format des Kopfteils hängt von dem Typ der Meldung, die von dem Sender gesendet wird, ab und wird nicht detaillierter beschrieben. Der Textteil 201 enthält eine fixe oder unbegrenzte Anzahl von Positionen für alphanumerische Zeichen, in welchen der Sender Text in freier Form eingeben kann. In einem Fall von SMS-Meldungen enthält der Textteil 201 bis zu 160 Zeichen, welche frei von dem Benutzer auf der Tastatur des mobilen Geräts 1 eingegeben werden.
Gemäss der Erfindung enthält der Textteil 201 der Meldung 20 einen oder mehrere Tags, die in die Meldung eingefügt sind, und welche durch das Taginterpretationssystem 7 interpretiert werden, um Parameter der Text-in-Sprache-Umwandlung und der Meldungsauslieferung zu definieren. In dem illustrierten Beispiel enthält die Textmeldung 20 einen ersten Tag:
<Sprachgeschlecht = "female" Kategorie = "adult">
um die Stimme zu definieren, welche durch den Sprachsyntheziser verwendet wird und einen zweiten Tag:
<Auslieferungskanal = "phone">
welcher anzeigt, dass alle konvertierten Sprachmeldungen dem Empfänger 10 über einen Telefonanruf gespielt werden sollen.
Diese Tags werden durch das Taginterpretationssystem 7 in der Infrastruktur des mobilen Netzwerkes 2 oder möglicherweise in dem Terminal des Empfängers 10 interpretiert und werden als Parameter für das Text-in-Sprache-Umwandlungsmodul 5 und für das Meldungsauslieferungsmodul 6 verwendet.
Weil die Tags, welche in die Textmeldung 20 eingegeben werden können, schwierig für viele Benutzer zu lernen sind, verwendet das mobile Gerät 1 (Terminal) der Erfindung vorzugsweise eine Softwareanwendung, um diese Tags automatisch in einen Text eingeben. Diese Softwareanwendung kann einen Standard XML oder VHML Editor umfassen. In den Fall eines mobilen Telefongerätes kann die Softwareanwendung JAVA Applets in der SIM Karte oder in dem mobilen Gerät 1 umfassen oder irgendein anderes Stück von Software, welches von dem Betriebssystem der SIM-Karte oder des mobilen Geräts 1 laufen gelassen wird. In dem Fall eines mit dem Internet verbundenen Terminals kann die Anwendung auf einem Webserver laufen, welches Webformulare bereithält, die von dem Benutzer durch die Auswahl von Optionen und Parameter ausgefüllt werden und welche automatisch durch die Anwendung in korrespondierende Tags übersetzt werden.
Wir werden nun als ein Beispiel eine nicht einschränkende Liste von Tags beschreiben, die in die Textmeldungen 20 eingebettet werden können und durch ein Taginterpretationssystem 7 interpretiert werden:
Sprachumwandlungstags

– Auswahl von einer vordefinierten Sprachmeldungsvorlage, welche einen Satz von Merkmalen für die Text-in-Sprache-Umwandlung definieren kann. Eine vordefinierte Vorlage kann zum Beispiel definieren, dass eine Sprachmeldung mit einem vorgegebenen Jingle startet und mit einer vorgegebenen Stimme über einer vorgegebenen Hintergrundsmusik weitergeht. Verschiedene Vorlagen sind vorzugsweise verfügbar und Benutzer können vorzugsweise neue Vorlagen definieren und existierende Vorlagen editieren.
– Auswahl unter einer Liste von möglichen Stimmen für die Text-in-Sprache-Umwandlung. Diese Liste kann Stimmen von berühmten Persönlichkeiten und/oder der eigenen Stimme des Senders der Meldung enthalten, welcher seine Stimme während einer Einschreibesitzung aufnehmen kann.
– Übersetzung von Text in eine andere Sprache.
– Hinzufügen von Musik, zum Beispiel ein Eingangsjingle oder Hintergrundmusik.
– Hinzufügen von einem Musikcode, zum Beispiel in Midiformat.
– Audioverarbeitung: Hall, Echo, Zusammenfügen, Filtern, Verzerrung, etc.
– Hinzufügen von einem Bild oder einem Logo zu einer E-Mail oder MMS-Meldung. Das Bild kann typische Emotionen repräsentieren. Vordefinierte Bilder können in die Datenbank 8 geladen werden.
– Hinzufügen von „Emotionstags", um typische Merkmale von Emotionen zu der synthetisierten Stimme zu übermitteln. Die Merkmale des Satzrhythmus' können durch ein sich wiederholendes neuronales Netzwerk von einer Datenbank von Stimmenextrakten, die typische Emotionen wie zum Beispiel Wut, Freunde, Trauer, Angst, Ekel, Überraschung, Langeweile wiedergeben, gelernt werden.
– Hinzufügen von Tags für den Satzrhythmus, welche die Tonhöhe, das Tempo und das Hinzufügen von Schweigen in die synthetisierte Sprache definieren.
– Hinzufügen von Tags, die die Art der Auslieferung des Stimmenstils definieren: laut, flüstern, langsam, schnell, neutral, etc.
– etc.

Auslieferungstags

– Auswahl von einem Auslieferungskanal 9: Telefone, MMS, E-Mail, Speicherung einer Sprachmeldung, etc.
– Senden der Meldung zu einer vorher eingegebenen Liste von Empfängern, etc.
– Speicherungsweiterleitung: diese Auslieferungsmodus erlaubt es, die synthetisierte Meldung auf einem Server zu speichern, um zu ihr durch einen weiteren Kanal oder zu einem späteren Zeitpunkt zuzuhören.
– Meldungsinformationsmodus: dies erlaubt es, eine Information über einen Auslieferungskanal zu senden, während die Meldung gleichzeitig über einen anderen Kanal gesendet wird oder auf einem Webserver oder Sprachmailsystem zur späteren Abholung gespeichert wird.
– Empfangsbescheinigung: Die Auslieferung der Meldung enthält eine zwangsweise Empfangsbescheinigung vom dem Empfänger.
– Datum und Zeit der Auslieferung
– Mehrfachempfängeremissionsmodus: (zum Beispiel sequentiell bestellt, sequentiell regellos angeordnet, gleichzeitig, empfangen abgebrochen, etc.) Wenn zum Beispiel eine sequentiell bestellter und empfangen abgebrochen Auslieferungsmodus definiert wird, startet die Auslieferung der synthetisierten Sprachmeldung mit dem ersten in der Liste und wird abgebrochen, wenn der erste Empfänger in der Liste die Meldung akzeptiert.
– Auslieferung, die durch einen äusseren Event ausgelöst wird, zum Beispiel ein Wechsel auf einer Webseite, eine SOAP-Meldung, etc.
– Auslieferungspräferenzen von ausgetauschten Medien: diese Einstellung erlaubt es dem Sender, eine Meldung von einem speziellen Typen zu senden, zum Beispiel SMS, welche zu einem anderen Typ, zum Beispiel MMS, gesendet wird. Ein Auftrag von Typpräferenzen kann definiert werden: ein Sender kann zum Beispiel wählen, seine gesprochene Stimme als MMS auszuliefern, wenn verfügbar, anderenfalls durch E-Mail, falls verfügbar, andernfalls durch Telefon, wobei verschiedene Adressen für jeden Auslieferungstypen vergeben werden können.
– Verschlüsselung: die Meldung kann verschlüsselt werden, zum Beispiel mit einem öffentlichen Schlüssel des Empfängers, der in der Datenbank 8 verfügbar ist, so dass nur der beabsichtigte Empfänger 10 ihr zuhören kann.
– Sicherheitszugriff: der Sender kann vom dem Empfänger verlangen, dass er sich selbst gegenüber dem Meldungsauslieferungsdienst identifiziert, um Zugang zu der Meldung zu haben. Verschiedene Identifikationsmodi können mit verschiedenen Tags angefordert werden, zum Beispiel durch den Gebrauch eines Passworts, eines PIN Codes, von biometrischen Parametern und/oder einer Chipkarte.
– Anruf über ein vorhergesagtes Anrufsystem, d.h. ein Telefonkontrollsystem, das automatisch eine Liste von Telefonnummern nacheinander anruft und die Nichtantwortungen, Besetztsignale, Anrufbeantworter und unverbundenen Nummern aussortiert.

Wir werden nun ein Beispiel von dem Gebrauch des Systems der Erfindung beschreiben.
Ein Benutzer A des Systems der Erfindung hat einen speziellen Account auf dem Modul 4 über eine Einschreibsitzung erzeugt. Er hat auch über die Webseite oder über sein Telefon eine Anzahl von Sätzen aufgenommen, die es dem System erlauben werden, eine Kopie von der Stimme des Benutzers A zu machen. Die Stimme korrespondiert mit einem speziellen Tag, das in Meldungen, zum Beispiel in SMS Meldungen, eingefügt werden kann.
Benutzer A möchte Benutzer B eine Postkarte für seinen Geburtstag senden. Benutzer B ist in den Ferien und hat keinen Computer mitgenommen, so dass er keine elektronischen Karten empfangen kann. Es ist auch dazu zu spät, eine Papierkarte zu senden. Benutzer A entscheidet sich, eine akustische Postkarte zusenden.
Dazu wählt der Benutzer A eine geeignete Postkarte aus, zum Beispiel durch Surfen im Internet und durch Besuch der Webseite einer Galerie von akustischen Postkarten. Er geht in die Kategorie mit Gratulationskarten und darin die Kategorie mit Geburtstagskarten. Darin sind 12 verschiedene Geburtstagskarten verfügbar. Benutzer A sieht die Bilder und die Beschreibungen der akustischen Karten and und hört sich drei von ihnen an. Er wählt eine mit einer speziellen Version vom „Happy Birthday"-Lied als musikalischen Hintergrund. Benutzer A kann auch sehen, dass dieser File eine Grösse 68 Kilobyte besitzt und eine Länger von 24 Sekunden an Sound.
In dem nun erscheinenden Webformblatt füllt der Benutzer A seinen persönlichen Textteil 201 und die Adresse des Empfängers 10 aus. Er schreibt folgendes in das Textfeld:
„Hallo B, dies ist A. Ich wollte Dir persönlich zum Geburtstag gratulieren und ich wünsche Dir das Beste an Deinem Geburtstag! Herzlichen Glückwunsch! Man sieht sich. A."
Der Benutzer A füllt dann das erste Adressfeld mit der Telefonnummer des Benutzers B aus und das zweite Adressfeld mit der E-Mailadresse des Benutzers B. Er kennt die Postadresse von dem Hotel des Benutzers B nicht und möchte weder eine Meldung zu seiner geschäftlichen Telefonnummer senden noch zu seiner privaten Telefonnummer. Schlussendlich sendet A die akustische Karte mit einem einfachen Klick.
Die Textmeldung 20, die über das Internet gesendet wird, wird über das Meldungverarbeitungssystem 3 – in diesem Fall ein Webserver mit einem Webformblatt – zu dem Modul 4 übermittelt. Das Modul zur Umwandlung von Text in Sprache stellt eine Sprachmeldung her, die mit dem Textteil 201, der durch den Benutzer A eingegeben wurde, korrespondiert. Da der Benutzer A keine spezielle Sprache oder Emotion für die Umwandlung ausgewählt hat, verwendet das Modul zur Umwandlung von Text in Sprache die eigene Stimme des Benutzers A, welche in der Datenbank 8 während der Einschreibsitzung aufgenommen wurde, und fügt eine neutrale Emotion hinzu. Das Text-in-Sprache-Konvertierungssystem 5 fügt auch den ausgewählten zugrunde liegenden Hintergrundsound, der mit der ausgewählten Vorlage übereinstimmt, ein und führt die Audioverarbeitungsoperationen durch, welche durch das Absender- oder Empfängerprofil in der Datenbank 8 ausgewählt worden sind.
Das Text-in-Sprache-Konvertierungssystem 5 erstellt zwei Audiofiles mit der Sprachmeldung: einen als Telefonsprachsoundfile für den Telefonanruf und einen zweiten als wav-File, der an eine E-Mail angehängt und auf einer Webseite gespeichert werden kann. Schlussendlich etabliert das Meldungsauslieferungssystem 6 eine Anrufverbindung mit dem Mobiltelefon des Benutzers B und spielt ihm möglicherweise eine Sprachnotiz vor, welche ein Prompt für ein Passwort enthält (wenn benötigt), und die URL, die besucht werden kann (wenn geeignet). Wenn der Benutzer B die akustische Postkarte akzeptiert und das korrekte Passwort eingibt, liefert das Meldungsauslieferungssystem 6 die synthetisierte Sprachmeldung aus. Gleichzeitig sendet es eine E-Mail zu der E-Mailadresse des Benutzers B, welche den synthetisierten wav-File als Anhang und den Text und/oder das Bild in dem Inhalt der E-Mail enthält. Das Meldungsauslieferungssystem 6 sendet vorzugsweise mit dem eingegebenen Text eine SMS Mitteilung zu dem Mobiltelefon von Benutzer B.
Benutzer B beendet den Telefonanruf durch eine Option in einem Sprachmenu oder durch Auflegen. Er kann auch die Möglichkeit haben, durch die Auswahl von einer anderen Option in einem Sprachmenu direkt mit dem Benutzer A verbunden zu werden. Später kann er sich in seinen Mailaccount einloggen und wieder die angehängte Sprachmeldung des Benutzers A anhören. Er kann auch die Nummer, die in der empfangenen SMS angegeben ist, anrufen und das übermittelte Passwort sprechen, um mit dem Modul 4 verbunden zu werden und die Sprachmeldung noch einmal anzuhören oder um zu einer speziellen Webseite zu gehen, um die heruntergeladene Meldung zu empfangen.

1: Mobiles Gerät
2: Mobiles Netzwerk
20: Textmeldung
200: Kopfteil der Textmeldung 20
201: Text oder Datenteil der Textmeldung 20
3: Meldungverarbeitungssystem
4: Module
5: Text-in-Sprache-Konvertierungssystem
6: Meldungsauslieferungssystem
7: Taginterpretationssystem
8: Datenbank persönlicher Einstellungen
9: Auslieferungskanal
10: Empfänger

Claims

System, um Textmeldungen (20) empfangen von einem mobilen Gerät (1) in einem mobilen Netzwerk (2) in Sprachmeldungen umzuwandeln, enthaltend: Ein Text-in-Sprache-Konvertierungssystem (5), um den Textinhalt der besagten Textmeldung (20) in eine Sprachmeldung umzuwandeln, ein Meldungsauslieferungssystem (6), um die besagte Meldung an eine Adresse, die durch die besagte Textmeldung (20) spezifiziert wird, weiterzuleiten, mit einem Taginterpretationssystem (7), um Tags, die in den besagten Textmeldungen (20) enthalten sind, zu interpretieren, in dem mindestens einige der besagten Tags als Parameter für die Text-in-Sprache-Konvertierung verwendet werden, dadurch gekennzeichnet, dass mindestens einige der besagten Tags als Parameter verwendet werden, um einen oder eine Vielzahl von Auslieferungskanälen (9) unter verschiedenen Auslieferungskanälen (9) zu wählen, um die besagte Sprachmeldung zu dem Empfänger (10) auszuliefern, die verfügbaren verschiedenen Auslieferungskanäle (9) umfassen mindestens einen von Telefon, MMS, E-Mail oder Spontanmeldung mit einer eingebetteten Audiodatei, Speicherung einer Sprachmeldung in einer Webseite, VoIP und SOAP.
Das System gemäss Anspruch 1, welches in der Infrastruktur eines mobilen Telefonnetzwerkes vorhanden ist, um Textmeldungen (20) zu empfangen, die von dem durch das Textmeldungsverarbeitungssystem (3) des besagten mobilen Netzwerkes (2) ausgeliefert werden.
Das System gemäss Anspruch 1 oder 2, in der besagte Textmeldungen (20) SMS, EMS, oder MMS enthalten.
Das System gemäss einem der Ansprüche 1 bis 3, in dem alle Textmeldungen (20), welche besagte Tags enthalten, zu dem Taginterpretationssystem (7) weitergeleitet werden.
Das System gemäss einem der Ansprüche 1 bis 4, in welchem das besagte Taginterpretationssystem (7) zu einer Adresse oder einer Servicetelefonenummer korrespondiert, zu welcher alle Meldungen mit dieser Adresse oder dieser Telefonnummer gesendet werden.
Das System gemäss einem der Ansprüche 1 bis 5, in welchem alle Textmeldungen (20), welche an Empfänger (10) gerichtet sind, die in einer vordefinierten Liste angegeben sind, zu dem Taginterpretationssystem (7) weitergeleitet werden.
Das System gemäss einem der Ansprüche 1 bis 6, weiter umfassend ein Computerübersetzungssystem, in welchem System mindestens einige der besagten Tags verwendet werden, um eine Computerübersetzung der besagten Textmeldung (20) zu starten.
Das System gemäss einem der Ansprüche 1 bis 7, in welchem mindestens einige der besagten Tags verwendet werden, um Musikinhalt zu der besagten Sprachmeldung hinzuzufügen.
Das System gemäss einem der Ansprüche 1 bis 8, weiter umfassend eine Datenbank (8), in welcher die Sprache des Senders aufgenommen werden kann, im welchem System mindestens einige der Tags verwendet werden können, um den Gebrauch der Sprache des Senders in dem Text-in-Sprache-Konvertierungssystem (5) anzugeben.
Das System gemäss einem der Ansprüche 1 bis 9, in welchem mindestens einige der Tags verwendet werden, um Audioeffekte zu der besagten Sprachmeldung hinzuzufügen.
Das System gemäss einem der Ansprüche 1 bis 10, in welchem mindestens einige der besagten Tags verwendet werden, um eine Emotion zu spezifizieren, die zu der besagten Sprachmeldung durch das besagte Text-in-Sprache-Konvertierungssystem (5) gesendet wird.
Das System gemäss einem der Ansprüche 1 bis 11, weiter umfassend ein Sprachmeldungsauslieferungssystem (6), in welchem System mindestens einige der zu interpretierenden Tags als Parameter für das Sprachmeldungsauslieferungssystem (6) verwendet werden.
Das System gemäss Anspruch 12, in welchem mindestens einige der besagten Tags als Parameter verwendet werden, um die Auslieferungszeit der besagten Sprachmeldung anzugeben.
Das System gemäss einem der Ansprüche 12 bis 13, in welchem mindestens einige der besagten Tags als Parameter verwendet werden, um die Anzahl von Wiederholungsversuchen für das Senden der besagten Sprachmeldung anzugeben.
Das System gemäss einem der Ansprüche 13 oder 14, in welchen mindestens einige der besagten Tags als Parameter verwendet werden, um eine Liste von Empfängern der besagten Sprachmeldung anzugeben.
Das System gemäss einem der Ansprüche 12 bis 15, in welchem mindestens einige der Tags verwendet werden, um eine Empfangsbescheinigung von dem Empfänger (10) zu erfragen.
Das System gemäss einem der Ansprüche 1 bis 16, weiter umfassend automatische Anrufeinrichtungen, um den Empfänger (10) der besagten Meldung anzurufen und ihm die Sprachmeldung vorzuspielen.
Das System gemäss einem der Ansprüche 1 bis 17, weiter umfassend Mittel zum Senden von E-Mail und/oder MMS und/oder EMS, um eine E-Mail und/oder MMS und/oder EMS-Meldung zu dem Empfänger (10) zu senden, besagte Sprachmeldung ist in der besagten E-Mail, und/oder MMS und/oder EMS eingebettet.
Das System gemäss einem der Ansprüche 1 bis 18, weiter umfassend Sprachmeldungsaufnahmemittel, um die Sprachnachricht in einem Webserver und/oder in einem Sprachmailaufnahmesystem aufzunehmen.
Das System gemäss einem der Ansprüche 1 bis 19, weiter umfassend eine Datenbank (8) mit Präferenzen, um präferierte Parameter des besagten Senders für die Text-in-Sprache-Konvertierung und/oder für die Meldungsauslieferung zu speichern.
Das System Das System gemäss einem der Ansprüche 1 bis 20, weiter umfassend eine Datenbank (8) mit Präferenzen, um präferierte Parameter des Empfängers (10) für die Text-in-Sprache-Konvertierung und/oder für die Meldungsauslieferung zu speichern.
Das System gemäss einem der Ansprüche 20 oder 21, weiter umfassend ein Webinterface, um besagte Datenbank (8) mit Präferenzen zu modifizieren.
Verfahren, um Textmeldungen (20), die durch ein mobiles Gerät (1) in einem mobilen Netzwerk (2) vorbereitet worden sind, in Sprachmeldungen umzuwandeln, enthaltend: Vorbereiten einer Text oder Datenmeldung (20) mit dem besagten mobilen Gerät (1), Senden der besagten Text oder Datenmeldung (20) zu einem Server, Interpretationstags, die in der besagten Textmeldung (20) eingebettet sind, Umwandeln in dem besagten Server des Textinhalts der besagten Sprachmeldung (20) in eine Sprachmeldung, Weiterleiten der besagten Sprachmeldung zu einem Empfänger (10), in dem mindestens einige der besagten Tags als Parameter für die Text-in-Sprache-Konvertierung verwendet werden, dadurch gekennzeichnet, dass mindestens einige der besagten Tags als Parameter verwendet werden, um einen oder eine Vielzahl von Auslieferungskanälen (9) unter verschiedenen Auslieferungskanälen zu (9) wählen, um die besagte Sprachmeldung zu auszuliefern, die verfügbaren verschiedenen Auslieferungskanäle (9) umfassen mindestens einen von Telefon, MMS, E-Mail oder Spontanmeldung mit einer eingebetteten Audiodatei, Speicherung einer Sprachmeldung in einer Webseite, VoIP und SOAP.
Das Verfahren gemäss Anspruch 23, in welchem mindestens in welcher mindestens einige der besagten Tags verwendet werden, um die Auslieferung der besagten Sprachmeldung zu dem besagten Empfänger (10) zu parametrisieren.
Mobiles Gerät (1), umfassend: einen Editor, um die Auswahl eines Benutzers in Tags umzuwandeln und um diese Tags in Textmeldungen einzubetten, ein System zum Senden von Textmeldungen (20), um besagte Textmeldungen über ein mobiles Netzwerk (2) zu senden, in dem mindestens einige der besagten Tags als Parameter für die Text-in-Sprache-Konvertierung verwendet werden, dadurch gekennzeichnet, dass mindestens einige der besagten Tags als Parameter verwendet werden, um einen oder eine Vielzahl von Auslieferungskanälen (9) unter verschiedenen Auslieferungskanälen zu (9) wählen, um die besagte Sprachmeldung zu dem Empfänger (10) auszuliefern, die verfügbaren verschiedenen Auslieferungskanäle (9) umfassen mindestens einen von Telefon, MMS, E-Mail oder Spontanmeldung mit einer eingebetteten Audiodatei, Speicherung einer Sprachmeldung in einer Webseite, VoIP und SOAP.