-
Technisches
Gebiet
-
Die
vorliegende Erfindung bezieht sich auf Verfahren und Systeme, um
das Format von Meldungen, die von einem mobilen Gerät, wie ein
Mobiltelefon oder Persönlicher
Digitaler Assistent (PDA), gesendet wurden, mit einem Kommunikationsinterface zu
konvertieren.
-
Stand der
Technik
-
Es
wurden verschiedene Kommunikationsprotokolle entwickelt, welche
bei verschiedenen Geräten
verwendet werden, um verschiedene Kommunikationsbedürfnisse
zu erfüllen.
Viele Mobilfunksysteme unterstützen
zum Beispiel ein oder mehrere Text- und Datenmeldungsprotokolle,
um Text- und/oder Datenmeldungen zwischen mobilen Geräten zu senden
und zu empfangen. In GSM Netzwerken werden sehr oft SMS (Short Message
System) und in neuster Zeit USSD (Unstructured Supplementary Service
Data), EMS (Enhanced Messaging Service) und MMS (Multimedia Messaging
Service) gebraucht, um Daten- und Textmeldungen auszutauschen.
-
Text-
und Datenmeldungen können
jedoch nur zu Empfangsgeräten
ausgeliefert werden, die dasselbe Protokoll unterstützen und
die fähig
sind, diese wiederzugeben. Daraus folgt, dass verschiedene Typen
von mobilen Geräten,
mobilen Computern und PDAs Meldungen vorbereiten und senden können, die
nur von einem Teil von Geräten,
die in demselben Netzwerk verwendet werden, empfangen und wiedergegeben
werden können.
Die meisten Festnetztelefonsysteme, so wie POTS (Plain Old Telephony
System), ISDN (Integrated Services Digital Network) oder VoIP (Voice
over IP) Systeme können die
sehr weit verbreiteten Meldungen wie SMS, USSD oder MMS nicht übermitteln
und wiedergeben. Die Verwendung von diesen populären Kommunikationssystemen
ist darum hauptsächlich
auf eine Kommunikation zwischen mobilen Geräten beschränkt. Selbst in einem mobilen
Telekommunikationssystem können
Roamingbeschränkungen
die Fähigkeiten
eines mobilen Abonnenten beschränken, um
Textmeldungen zu einem Abonnenten in einem anderen Netzwerk zu senden, weil
beispielsweise nicht alle mobilen Geräte EMS oder MMS Meldungen unterstützen. Zusätzlich ist
es in vielen Situationen nicht gewünscht oder sogar gefährlich Text-
und Datenmeldungen auf dem Display eines tragbaren Geräts zu lesen – zum Beispiel
für Autofahrer.
-
Verschiedene
Verfahren wurden bereits vorgeschlagen, um Textmeldungen, die mit
einem mobilen Gerät
in einem mobilen Netzwerk vorbereitet wurden, in Meldungen eines
anderen, breiter akzeptierten Typen umzuwandeln. Es ist beispielsweise
bereits bekannt, SMS-Meldungen in E-Mail Meldungen, die eine E-mail-Adresse
ausgeliefert werden, oder in Faxmeldungen, die an ein Faxgerät ausgeliefert
werden, umzuwandeln.
-
Eine
Vielfalt von so genannten SMS-zu-Sprache-Systemen wurde ebenfalls
entwickelt, um SMS Textmeldungen in Sprachmeldungen umzuwandeln,
die unter anderem an Blinde ausgeliefert werden. Viele existierende
Systeme sehen jedoch vor, dass der Empfänger ein spezielles Gerät verwendet,
welches die Umwandlung vornehmen kann, was den Gebrauch von SMS
nur zu einer sehr kleinen Anzahl von zusätzlichen Empfängern ausweitet.
Zusätzlich
werden die Meldungen gewöhnlich mit
einer neutralen Stimme gelesen und sind daher sehr unpersönlich.
-
WO-A1-02/076120
beschreibt ein System und ein Verfahren, um eine Audiomeldung zu
einem Empfänger
zu übertragen,
wobei die Audiomeldung aus einem Umwandlungsprozess resultiert.
Mittel, um Daten einzugeben, werden durch einen Sender verwendet,
um eine textbasierte Meldung einzugeben, entweder in freier Form
oder durch die Verwendung einer Vorlage, welche zu Verarbeitungsmitteln geschickt
und in eine Audiomeldung umgewandelt wird, welche in einer Sprache,
die dem Empfänger bekannt
ist, mit oder ohne Soundeffekten gesprochen werden kann. Die Meldung
wird dann über
ein Kommunikationsnetzwerk zu einem Kommunikationsgerät eines
Empfängers
gesendet, um von dem Empfänger
gehört
zu werden. Die Struktur der Datenvorlage kann von den Verarbeitungsmitteln
zu den Mittel, um die Daten einzugeben, oder zu dem Kommunikationsgerät eines
Empfängers
heruntergeladen werden.
-
US-A1-2002/0128025
offenbart ein Verfahren, um eine SMS Meldung in einem mobilen Kommunikationssystem
weiterzuleiten. Ein anrufendes mobiles Terminal beantragt die Übertragung
von einer SMS-Meldung an ein MC (Meldungscenter) und das MC bestimmt,
dass eine Weiterleitungsfunktion für ein angerufenes mobiles Terminal
gesetzt wird. Wenn dieses gesetzt wird, überträgt die SMS Meldungen zu einem
mobilen Zielterminal.
-
Zusammenfassung
der Erfindung
-
Es
ist daher ein Ziel der Erfindung, ein verbessertes Verfahren und
System zu schaffen, um Textmeldungen, die mit einem mobilen Gerät vorbereitet
wurden, in einem mobilen Netzwerk in Sprachmeldungen umzuwandeln,
insbesondere ein Verfahren und ein System, das die Nachteile der
Verfahren und Systeme des Standes der Technik vermeidet.
-
Es
ist ein anderes Ziel der Erfindung, ein Verfahren und System zu
schaffen, um Textmeldungen, die mit einem mobilen Gerät vorbereitet
wurden, in einem mobilen Netzwerk in Sprachmeldungen umzuwandeln,
welche von einer grösseren
Anzahl von Empfangsterminals empfangen werden können.
-
Es
ist ein anderes Ziel der Erfindung, ein Verfahren und System zu
schaffen, um Textmeldungen in Sprachmeldungen umzuwandeln, wobei
die gesprochene Sprachmeldung durch den Absender personalisiert
werden können.
-
In Übereinstimmung
mit einem Ausführungsbeispiel
der vorliegenden Erfindung werden diese Ziele mit einem System,
um Textmeldungen, die mit einem mobilen Gerät vorbereitet wurden, in einem mobilen
Netzwerk in Sprachmeldungen umzuwandeln, gemäss dem Oberbegriff des Anspruchs
1 gelöst,
welches dadurch gekennzeichnet ist, dass mindestens einige der besagten
Tags als Parameter verwendet werden, um einen oder eine Vielzahl
von Auslieferungskanälen
unter verschiedenen Auslieferungskanälen zu wählen, um die besagte Sprachmeldung
zu dem Empfänger
auszuliefern, die verfügbaren
verschiedenen Auslieferungskanäle
umfassen mindestens einen von Telefon, MMS, E-Mail oder Spontanmeldung
mit einer eingebetteten Audiodatei, Speicherung einer Sprachmeldung
in einer Webseite, VoIP und SOAP.
-
Die
Ziele werden auch durch ein Verfahren gemäss der Oberbegriff des Anspruchs
23 und durch ein mobiles Gerät
gemäss
dem Oberbegriff des Anspruchs 25 gelöst, welche dadurch gekennzeichnet sind,
dass mindestens einige der besagten Tags als Parameter verwendet
werden, um einen oder eine Vielzahl von Auslieferungskanälen unter
verschiedenen Auslieferungskanälen
zu wählen,
um die besagte Sprachmeldung zu dem Empfänger auszuliefern, die verfügbaren verschiedenen
Auslieferungskanäle umfassen
mindestens einen von Telefon, MMS, E-Mail oder Spontanmeldung mit
einer eingebetteten Audiodatei, Speicherung einer Sprachmeldung
in einer Webseite, VoIP und SOAP.
-
In
verschiedenen Ausführungsformen
können
Tags in die Textmeldungen eingebettet werden, um verschiedene Parameter
der Text-in-Sprache-Konvertierung
zu definieren und um zu definieren, wie die konvertierten Meldungen
ausgeliefert werden sollen.
-
Obwohl
das Verfahren der Erfindung auch bei Meldungen angewendet werden
kann, welche gespeichert und mit einer zeitlichen Verzögerung übermittelt
werden, hat es den Vorteil, dass es perfekt mit synchronen oder
quasisynchronen Meldungen wie SMS, EMS, MMS oder USSD durchführbar ist,
welche in der Infrastruktur des Netzwerkes ohne merkbaren Zeitverzug
in eine Sprachmeldung umgewandelt werden können.
-
Die
Erfindung verwendet vorzugsweise einen geeigneten Server in der
Infrastruktur des Netzwerkes, um den Text in Sprache umzuwandeln
und um die konvertierte Sprachmeldung weiterzuleiten. Dies hat den
Vorteil, dass keine Modifikationen an den bestehenden Meldungsverarbeitungssystemen wie
SMSC (Short Message Service Center) oder an den Terminalgeräten der
Empfänger
nötig sind.
-
Kurze Beschreibung
der Figuren
-
Die
Erfindung wird besser verständlich
mit der Hilfe der Beschreibung eines speziellen Ausführungsbeispiels,
welche durch die Figuren illustriert werden, in welchen
-
1 die
allgemeine Struktur eines Telekommunikationssystems illustriert,
welches ein Text-in-Sprache-Konvertierungssystem gemäss der Erfindung
enthält.
-
2 eine
Textmeldung illustriert, welche Tags enthält, welche als Parameter für die Text-in-Sprache-Konvertierung
verwendet werden können.
-
Wege zur Ausführung der
Erfindung
-
Bezug
nehmend auf 1 enthält das Telekommunikationssystem
mindestens ein mobiles Netzwerk 2, an welches eine Vielzahl
von Abonnenten, die ein mobiles Gerät 1 verwenden, angeschlossen
sind. Mindestens einige Geräte 1 enthalten
Mittel, um Text- und/oder Datenmeldungen zu anderen mobilen Geräten in demselben
mobilen Netzwerk 2 zu senden oder in einem mobilen Netzwerk,
welches durch ein Roamingagreement mit diesem Netzwerk 2 verbunden
ist. Im Zusammenhang von GSM, GPRS, HSCSD oder Edge mobilen Netzwerken
enthält
die Text- und/oder Datenmeldung, welche gesendet werden kann, SMS
(Short Message System), USSD (Unstructured supplementary Service
data), MMS (Multimedia Messaging Service), EMS (Enhanced Message
Service) und mit einigen Beschränkungen E-Mailmeldungen.
-
Das
mobile Netzwerk 2 enthält
ein Meldungsverarbeitungssystem 3 in der Infrastruktur
des Netzwerkes, um Text- und/oder Datenmeldungen, die von dem mobilen
Abonnenten 1 gesendet wurden, zu verarbeiten. Verschiedene
Systeme können in
demselben Netzwerk vorgesehen werden, um verschiedene Typen von
Meldungen, die von den mobilen Abonnenten gesendet werden, zu verarbeiten. Das
mobile Netzwerk 2 kann beispielsweise eine oder mehrere
Kurmeldungszentralen (SMSC) enthalten, um SMS, MMS und/oder EMS
zu verarbeiten, einen USSD-Handler, um USSD zu verarbeiten, und ein
oder mehrere SMTP-Server, um ausgehende E-Mails zu verarbeiten.
Das Meldungsverarbeitungssystem 3 ist ein Standardteil
der Infrastruktur des mobilen Netzwerkes 2 und wird vorzugsweise
zentral durch einen Operator des Netzwerkes 2 betrieben,
so dass alle Daten- und/oder Textmeldungen 20, die von Abonnenten
des Netzwerkes 2 gesendet werden, vorzugsweise zu diesem
Meldungsverarbeitungssystem weitergeleitet werden. In einem Ausführungsbeispiel
umfasst das Meldungsverarbeitungssystem 3 einen WEB- oder
WAP-Server, der Webformulare, die von den Abonnenten ausgefüllt und
gesendet werden, verarbeitet.
-
Das
Telekommunikationssystem der Erfindung enthält weiter ein Modul 4,
um Textmeldungen 20, die durch das Meldungsverarbeitungssystem 3 weitergeleitet
werden, in Sprachmeldungen umzuwandeln. Gemäss verschiedenen Ausführungsformen
kann es möglich
sein, alle Meldungen, die durch das System 3 empfangen
werden, an das Modul 4 weiterzuleiten und/oder nur Meldungen,
die für
registrierte Empfänger
in einer vordefinierten Liste gedacht sind, und/oder nur Meldungen,
die zu einer speziellen Servicetelefonnummer gesendet werden, und/oder
nur Meldungen, die einen speziellen Tag, Kopfzeile, Adresse oder
Servicecode enthalten.
-
Das
Modul 4 enthält
vorzugsweise ein Text-in-Sprache-Umwandlungssystem 5,
um den Textinhalt der empfangenen Meldung in eine synthetisierte
Sprachmeldung umzuwandeln. Das Text-in-Sprache-Umwandlungssystem 5 kann um
einen konventionellen Sprachsynthesizer herum angeordnet werden.
-
Das
Modul 4 umfasst weiter einen Taginterpreter, um Tags (Labels),
die in die empfangene Textmeldung 20 eingebettet sind,
zu interpretieren. Diese Tags sind dazu da, um Parameter der Text-in-Sprache-Umwandlung
und der Meldungsauslieferung zu erhalten, wie später noch beschrieben wird.
Diese Tags sind vorzugsweise lesbare Zeichenketten, die auf einer
normalen Tastatur eingegeben oder durch einen geeigneten Editor
generiert werden können. Der
Taginterpreter kann ein Standard XML (eXtended Markup Language),
zum Beispiel (Virtual Human Markup Language) Taginterpreter, wie
er durch VHL seit dem 13. März
2001 als Arbeitskopien auf http://www.interface.computing.edu.au/documents/VHML
verfügbar
ist, oder einen anderen Medienschlüsselinterpreter enthalten.
-
Eine
Datenbank 8 mit persönlichen
Einstellungen enthält
persönliche
Profile der Sender und/oder der Empfänger 10 der übermittelten
Meldungen. Diese Profile von jedem Benutzer können folgende Parameter enthalten:
- – Bevorzugte
Parameter für
die Text-in-Sprache-Umwandlung, welche beispielsweise Vorlagen,
etc. enthalten;
- – Bevorzugte
Auslieferungsparameter;
- – Andere
Benutzereinstellungen, wie zum Beispiel Verrechnungsparameter und
-koordinaten, öffentlicher
kryptographischer Schlüssel,
und so weiter;
- – Audio
und/oder Bilddateien, welche in die Meldung integriert werden, wenn
der korrespondierende Tag in der Meldung vorhanden ist, enthaltend
Midi-Dateien, Musikstücke, vordefinierte
Audiomeldungen, etc.
- – etc.
-
Ein
WEB-, WAP-, SMS/MMS-, IVR-(Interactive Voice Response) und/oder
E-Mailinterface (nicht dargestellt) ist vorzugsweise vorgesehen,
um Benutzern zu erlauben, ihr Profil in der Datenbank 8 zu ändern. Dieser
Zugang ist vorzugsweise mit einer gesicherten Verbindung wie zum
Beispiel HTTPS, SSL (Secure Socket Layer), TLS (Transport Layer
Security); WTLS (Wireless Transport Layer Security) gesichert.
-
Einige
Felder der Datenbank in dem Benutzerprofil können auch von vorher gesendeten
oder empfangenen und mit einem Tag versehenen Meldungen erneuert
werden. In einem bevorzugten Ausführungsbeispiel hält das Benutzerprofil
die letzten Parameter, die in vorher gesendeten Meldungen eingebettet
sind, fest. Diese Datenbank 8 kann auch Profile von Benutzergruppen
enthalten, zum Beispiel, um einige Parameter, die allen Angestellten
einer Firma oder allen Mitgliedern einer Familie gemeinsam sind,
zu definieren.
-
Einige
Prioritätsregeln
müssen
definiert werden, um das Verhalten des Text-in-Sprache-Umwandlungssystems
zu spezifizieren, wenn die Parameter, die in eine empfangene Meldung
eingebettet sind, nicht gleich oder sogar nicht konsistent mit Parametern
des Sender- und/oder Empfängerprofils
in der Datenbank 8 mit den persönlichen Einstellungen sind.
In einem bevorzugten Ausführungsbeispiel
werden diese Prioritätsregeln
in dem Profil von jedem Empfänger 10 gespeichert
und können
zum Beispiel das folgende Verhalten von jedem Parameter definieren:
- – Immer
die Tags, die in die Meldung eingebettet sind, zu verwenden, oder
wenn keine Tags in der Meldung definiert sind, die Parameter zu
verwenden, die in dem Profil des Senders enthalten sind.
- – Verwendung
der Tags eingebettet in der Meldung oder definiert in dem Profil
des Senders, nur wenn der Empfänger
keine anderen Werte für
dieselben Parameter in seinem Profil definiert hat.
- – Immer
die Tags eingebettet in der Meldung und/oder definiert durch den
Sender zu ignorieren und die bevorzugten Werte, die der Empfänger in seinen
Profil definiert hat, oder, wenn keine anderen Präferenzen
definiert wurden, Defaultwerte zu verwenden.
-
Defaultprioritätsregeln
können
definiert werden, wenn der Empfänger 10 keine
spezielleren Regeln für
einen Parameter definiert hat oder wenn der Empfänger 10 nicht in das
System eingeschrieben ist.
-
Ein
Meldungsauslieferungssystem 6 ist in dem Modul 4 vorgesehen,
um die umgewandelte Sprachmeldung, die durch das Text-in-Sprache-Umwandlungssystem 5 synthetisiert
wurde, auszuliefern. In einem Ausführungsbeispiel enthält das Meldungsauslieferungssystem 6 einfach
ein Modul zum Aufbau einer Sprachverbindung, um den Empfänger 10,
der in der empfangenen Textmeldung 20 angegeben ist, anzurufen
und, wenn der Anruf aufgebaut wurde, dem Empfänger 10 die konvertierte
Sprachmeldung vorzusprechen. Die Parameter, die in die Meldung eingebettet
sind, und/oder in der Datenbank 8 können definieren, wie viele
Versuche gemacht werden müssen,
wenn der Anrufaufbau fehlschlägt und
ob der Sender informiert werden muss, wenn alle Versuche fehlgeschlagen
sind.
-
Gemäss der Erfindung
wählt das
Meldungsauslieferungssystem 6 unter verschiedenen Auslieferungskanälen 9,
um die synthetisierte Sprachmeldung zu dem Empfänger 10 auszuliefern.
Mögliche Auslieferungskanäle 9,
die ausgewählt
werden können,
enthalten:
- – Sprachverbindung über POTS
(Plain Old Telephony System), ISDN (Integrated Serivces Digital Network)
oder Mobilfunknetz. In diesem Fall wird der Empfänger automatisch angerufen
und die Sprachmeldung wird zu ihm ausgeliefert.
- – Sprachverbindung über ein
paketorientiertes Netzwerk, wie eine VoIP-Sitzung.
- – MMS
Meldung, welche die Sprachmeldung in einem Audioteil enthält und möglicherweise
die Textmeldung in einem Textteil.
- – Speichern
der synthetisierten Sprachmeldung in einem Sprachmailserver, in
welchem sie durch einen Telefonanruf, eine Websitzung, eine E-Mail abgerufen
werden kann.
- – Speichern
der Meldung auf einer Webseite und Informieren des Empfängers durch
einen anderen Kanal, wie zum Beispiel durch SMS, USSD, MMS, EMS,
Telfon, E-Mail, etc. Die Information gibt den Namen des Senders,
Zeit, Datum und Internetadresse (URL) der Seite an, von welcher
die Meldung geholt werden kann.
- – E-Mail,
welche eine eingebettete Audiodatei enthält
- – Sofortnachricht,
welche eine eingebettete Audiodatei enthält
- – SOAP:
In diesem Fall werden die Meldungen zu einem Webservice ausgeliefert.
- – Mehrfachkanal:
gleichzeitiges oder nacheinander folgendes Ausliefern über verschiedene
Kanäle.
- – etc.
-
Die
synthetisierte Sprachmeldung wird dann über den Kommunikationskanal 9 zu
dem Empfänger 10,
der in der Meldung von dem Sender angegeben wurde, ausgeliefert.
-
2 illustriert
ein Beispiel einer Textmeldung 20, welches durch einen
Sender, der ein mobiles Gerät 1 verwendet,
gesendet und durch das Modul 4 konvertiert werden kann.
Im Allgemeinen enthält
die Textmeldung 20 einen oder mehrere Kopfteile 200 und
ein Text- oder Datenteil 201. Der Kopfteil 200 zeigt
zum Beispiel den Typ der Meldung, das Sendedatum, die Adresse des
Senders und des Empfängers,
usw. an. Das Format des Kopfteils hängt von dem Typ der Meldung,
die von dem Sender gesendet wird, ab und wird nicht detaillierter
beschrieben. Der Textteil 201 enthält eine fixe oder unbegrenzte
Anzahl von Positionen für
alphanumerische Zeichen, in welchen der Sender Text in freier Form
eingeben kann. In einem Fall von SMS-Meldungen enthält der Textteil 201 bis
zu 160 Zeichen, welche frei von dem Benutzer auf der Tastatur des
mobilen Geräts 1 eingegeben
werden.
-
Gemäss der Erfindung
enthält
der Textteil 201 der Meldung 20 einen oder mehrere
Tags, die in die Meldung eingefügt
sind, und welche durch das Taginterpretationssystem 7 interpretiert
werden, um Parameter der Text-in-Sprache-Umwandlung
und der Meldungsauslieferung zu definieren. In dem illustrierten
Beispiel enthält
die Textmeldung 20 einen ersten Tag:
<Sprachgeschlecht
= "female" Kategorie = "adult">
um die Stimme zu definieren, welche
durch den Sprachsyntheziser verwendet wird und einen zweiten Tag:
<Auslieferungskanal
= "phone">
welcher anzeigt, dass alle konvertierten
Sprachmeldungen dem Empfänger 10 über einen
Telefonanruf gespielt werden sollen.
-
Diese
Tags werden durch das Taginterpretationssystem 7 in der
Infrastruktur des mobilen Netzwerkes 2 oder möglicherweise
in dem Terminal des Empfängers 10 interpretiert
und werden als Parameter für
das Text-in-Sprache-Umwandlungsmodul 5 und
für das
Meldungsauslieferungsmodul 6 verwendet.
-
Weil
die Tags, welche in die Textmeldung 20 eingegeben werden
können,
schwierig für
viele Benutzer zu lernen sind, verwendet das mobile Gerät 1 (Terminal)
der Erfindung vorzugsweise eine Softwareanwendung, um diese Tags
automatisch in einen Text eingeben. Diese Softwareanwendung kann einen
Standard XML oder VHML Editor umfassen. In den Fall eines mobilen
Telefongerätes
kann die Softwareanwendung JAVA Applets in der SIM Karte oder in
dem mobilen Gerät 1 umfassen
oder irgendein anderes Stück
von Software, welches von dem Betriebssystem der SIM-Karte oder
des mobilen Geräts 1 laufen
gelassen wird. In dem Fall eines mit dem Internet verbundenen Terminals
kann die Anwendung auf einem Webserver laufen, welches Webformulare bereithält, die
von dem Benutzer durch die Auswahl von Optionen und Parameter ausgefüllt werden
und welche automatisch durch die Anwendung in korrespondierende
Tags übersetzt
werden.
-
Wir
werden nun als ein Beispiel eine nicht einschränkende Liste von Tags beschreiben,
die in die Textmeldungen 20 eingebettet werden können und
durch ein Taginterpretationssystem 7 interpretiert werden:
-
Sprachumwandlungstags
-
- – Auswahl
von einer vordefinierten Sprachmeldungsvorlage, welche einen Satz
von Merkmalen für
die Text-in-Sprache-Umwandlung definieren kann. Eine vordefinierte
Vorlage kann zum Beispiel definieren, dass eine Sprachmeldung mit
einem vorgegebenen Jingle startet und mit einer vorgegebenen Stimme über einer
vorgegebenen Hintergrundsmusik weitergeht. Verschiedene Vorlagen
sind vorzugsweise verfügbar
und Benutzer können
vorzugsweise neue Vorlagen definieren und existierende Vorlagen
editieren.
- – Auswahl
unter einer Liste von möglichen
Stimmen für
die Text-in-Sprache-Umwandlung.
Diese Liste kann Stimmen von berühmten
Persönlichkeiten
und/oder der eigenen Stimme des Senders der Meldung enthalten, welcher
seine Stimme während
einer Einschreibesitzung aufnehmen kann.
- – Übersetzung
von Text in eine andere Sprache.
- – Hinzufügen von
Musik, zum Beispiel ein Eingangsjingle oder Hintergrundmusik.
- – Hinzufügen von
einem Musikcode, zum Beispiel in Midiformat.
- – Audioverarbeitung:
Hall, Echo, Zusammenfügen,
Filtern, Verzerrung, etc.
- – Hinzufügen von
einem Bild oder einem Logo zu einer E-Mail oder MMS-Meldung. Das
Bild kann typische Emotionen repräsentieren. Vordefinierte Bilder
können
in die Datenbank 8 geladen werden.
- – Hinzufügen von „Emotionstags", um typische Merkmale
von Emotionen zu der synthetisierten Stimme zu übermitteln. Die Merkmale des
Satzrhythmus' können durch
ein sich wiederholendes neuronales Netzwerk von einer Datenbank
von Stimmenextrakten, die typische Emotionen wie zum Beispiel Wut,
Freunde, Trauer, Angst, Ekel, Überraschung,
Langeweile wiedergeben, gelernt werden.
- – Hinzufügen von
Tags für
den Satzrhythmus, welche die Tonhöhe, das Tempo und das Hinzufügen von
Schweigen in die synthetisierte Sprache definieren.
- – Hinzufügen von
Tags, die die Art der Auslieferung des Stimmenstils definieren:
laut, flüstern, langsam,
schnell, neutral, etc.
- – etc.
-
Auslieferungstags
-
- – Auswahl
von einem Auslieferungskanal 9: Telefone, MMS, E-Mail,
Speicherung einer Sprachmeldung, etc.
- – Senden
der Meldung zu einer vorher eingegebenen Liste von Empfängern, etc.
- – Speicherungsweiterleitung:
diese Auslieferungsmodus erlaubt es, die synthetisierte Meldung
auf einem Server zu speichern, um zu ihr durch einen weiteren Kanal
oder zu einem späteren
Zeitpunkt zuzuhören.
- – Meldungsinformationsmodus:
dies erlaubt es, eine Information über einen Auslieferungskanal zu
senden, während
die Meldung gleichzeitig über einen
anderen Kanal gesendet wird oder auf einem Webserver oder Sprachmailsystem
zur späteren
Abholung gespeichert wird.
- – Empfangsbescheinigung:
Die Auslieferung der Meldung enthält eine zwangsweise Empfangsbescheinigung
vom dem Empfänger.
- – Datum
und Zeit der Auslieferung
- – Mehrfachempfängeremissionsmodus:
(zum Beispiel sequentiell bestellt, sequentiell regellos angeordnet,
gleichzeitig, empfangen abgebrochen, etc.) Wenn zum Beispiel eine
sequentiell bestellter und empfangen abgebrochen Auslieferungsmodus
definiert wird, startet die Auslieferung der synthetisierten Sprachmeldung
mit dem ersten in der Liste und wird abgebrochen, wenn der erste Empfänger in
der Liste die Meldung akzeptiert.
- – Auslieferung,
die durch einen äusseren
Event ausgelöst
wird, zum Beispiel ein Wechsel auf einer Webseite, eine SOAP-Meldung,
etc.
- – Auslieferungspräferenzen
von ausgetauschten Medien: diese Einstellung erlaubt es dem Sender, eine
Meldung von einem speziellen Typen zu senden, zum Beispiel SMS,
welche zu einem anderen Typ, zum Beispiel MMS, gesendet wird. Ein
Auftrag von Typpräferenzen
kann definiert werden: ein Sender kann zum Beispiel wählen, seine
gesprochene Stimme als MMS auszuliefern, wenn verfügbar, anderenfalls
durch E-Mail, falls verfügbar,
andernfalls durch Telefon, wobei verschiedene Adressen für jeden
Auslieferungstypen vergeben werden können.
- – Verschlüsselung:
die Meldung kann verschlüsselt
werden, zum Beispiel mit einem öffentlichen Schlüssel des
Empfängers,
der in der Datenbank 8 verfügbar ist, so dass nur der beabsichtigte Empfänger 10 ihr
zuhören
kann.
- – Sicherheitszugriff:
der Sender kann vom dem Empfänger
verlangen, dass er sich selbst gegenüber dem Meldungsauslieferungsdienst
identifiziert, um Zugang zu der Meldung zu haben. Verschiedene Identifikationsmodi
können
mit verschiedenen Tags angefordert werden, zum Beispiel durch den
Gebrauch eines Passworts, eines PIN Codes, von biometrischen Parametern und/oder
einer Chipkarte.
- – Anruf über ein
vorhergesagtes Anrufsystem, d.h. ein Telefonkontrollsystem, das
automatisch eine Liste von Telefonnummern nacheinander anruft und
die Nichtantwortungen, Besetztsignale, Anrufbeantworter und unverbundenen
Nummern aussortiert.
-
Wir
werden nun ein Beispiel von dem Gebrauch des Systems der Erfindung
beschreiben.
-
Ein
Benutzer A des Systems der Erfindung hat einen speziellen Account
auf dem Modul 4 über eine
Einschreibsitzung erzeugt. Er hat auch über die Webseite oder über sein
Telefon eine Anzahl von Sätzen
aufgenommen, die es dem System erlauben werden, eine Kopie von der
Stimme des Benutzers A zu machen. Die Stimme korrespondiert mit
einem speziellen Tag, das in Meldungen, zum Beispiel in SMS Meldungen,
eingefügt
werden kann.
-
Benutzer
A möchte
Benutzer B eine Postkarte für
seinen Geburtstag senden. Benutzer B ist in den Ferien und hat keinen
Computer mitgenommen, so dass er keine elektronischen Karten empfangen kann.
Es ist auch dazu zu spät,
eine Papierkarte zu senden. Benutzer A entscheidet sich, eine akustische
Postkarte zusenden.
-
Dazu
wählt der
Benutzer A eine geeignete Postkarte aus, zum Beispiel durch Surfen
im Internet und durch Besuch der Webseite einer Galerie von akustischen
Postkarten. Er geht in die Kategorie mit Gratulationskarten und
darin die Kategorie mit Geburtstagskarten. Darin sind 12 verschiedene
Geburtstagskarten verfügbar.
Benutzer A sieht die Bilder und die Beschreibungen der akustischen
Karten and und hört
sich drei von ihnen an. Er wählt
eine mit einer speziellen Version vom „Happy Birthday"-Lied als musikalischen
Hintergrund. Benutzer A kann auch sehen, dass dieser File eine Grösse 68 Kilobyte besitzt
und eine Länger
von 24 Sekunden an Sound.
-
In
dem nun erscheinenden Webformblatt füllt der Benutzer A seinen persönlichen
Textteil 201 und die Adresse des Empfängers 10 aus. Er schreibt
folgendes in das Textfeld:
„Hallo B, dies ist A. Ich
wollte Dir persönlich
zum Geburtstag gratulieren und ich wünsche Dir das Beste an Deinem
Geburtstag! Herzlichen Glückwunsch! Man
sieht sich. A."
-
Der
Benutzer A füllt
dann das erste Adressfeld mit der Telefonnummer des Benutzers B
aus und das zweite Adressfeld mit der E-Mailadresse des Benutzers
B. Er kennt die Postadresse von dem Hotel des Benutzers B nicht
und möchte
weder eine Meldung zu seiner geschäftlichen Telefonnummer senden
noch zu seiner privaten Telefonnummer. Schlussendlich sendet A die
akustische Karte mit einem einfachen Klick.
-
Die
Textmeldung 20, die über
das Internet gesendet wird, wird über das Meldungverarbeitungssystem 3 – in diesem
Fall ein Webserver mit einem Webformblatt – zu dem Modul 4 übermittelt.
Das Modul zur Umwandlung von Text in Sprache stellt eine Sprachmeldung
her, die mit dem Textteil 201, der durch den Benutzer A
eingegeben wurde, korrespondiert. Da der Benutzer A keine spezielle
Sprache oder Emotion für
die Umwandlung ausgewählt
hat, verwendet das Modul zur Umwandlung von Text in Sprache die
eigene Stimme des Benutzers A, welche in der Datenbank 8 während der
Einschreibsitzung aufgenommen wurde, und fügt eine neutrale Emotion hinzu.
Das Text-in-Sprache-Konvertierungssystem 5 fügt auch
den ausgewählten
zugrunde liegenden Hintergrundsound, der mit der ausgewählten Vorlage übereinstimmt,
ein und führt
die Audioverarbeitungsoperationen durch, welche durch das Absender-
oder Empfängerprofil
in der Datenbank 8 ausgewählt worden sind.
-
Das
Text-in-Sprache-Konvertierungssystem 5 erstellt zwei Audiofiles
mit der Sprachmeldung: einen als Telefonsprachsoundfile für den Telefonanruf und einen
zweiten als wav-File, der an eine E-Mail angehängt und auf einer Webseite
gespeichert werden kann. Schlussendlich etabliert das Meldungsauslieferungssystem 6 eine
Anrufverbindung mit dem Mobiltelefon des Benutzers B und spielt
ihm möglicherweise
eine Sprachnotiz vor, welche ein Prompt für ein Passwort enthält (wenn
benötigt),
und die URL, die besucht werden kann (wenn geeignet). Wenn der Benutzer
B die akustische Postkarte akzeptiert und das korrekte Passwort
eingibt, liefert das Meldungsauslieferungssystem 6 die
synthetisierte Sprachmeldung aus. Gleichzeitig sendet es eine E-Mail
zu der E-Mailadresse
des Benutzers B, welche den synthetisierten wav-File als Anhang
und den Text und/oder das Bild in dem Inhalt der E-Mail enthält. Das
Meldungsauslieferungssystem 6 sendet vorzugsweise mit dem
eingegebenen Text eine SMS Mitteilung zu dem Mobiltelefon von Benutzer
B.
-
Benutzer
B beendet den Telefonanruf durch eine Option in einem Sprachmenu
oder durch Auflegen. Er kann auch die Möglichkeit haben, durch die Auswahl
von einer anderen Option in einem Sprachmenu direkt mit dem Benutzer
A verbunden zu werden. Später
kann er sich in seinen Mailaccount einloggen und wieder die angehängte Sprachmeldung des
Benutzers A anhören.
Er kann auch die Nummer, die in der empfangenen SMS angegeben ist,
anrufen und das übermittelte
Passwort sprechen, um mit dem Modul 4 verbunden zu werden
und die Sprachmeldung noch einmal anzuhören oder um zu einer speziellen
Webseite zu gehen, um die heruntergeladene Meldung zu empfangen.
-
- 1
- Mobiles
Gerät
- 2
- Mobiles
Netzwerk
- 20
- Textmeldung
- 200
- Kopfteil
der Textmeldung 20
- 201
- Text
oder Datenteil der Textmeldung 20
- 3
- Meldungverarbeitungssystem
- 4
- Module
- 5
- Text-in-Sprache-Konvertierungssystem
- 6
- Meldungsauslieferungssystem
- 7
- Taginterpretationssystem
- 8
- Datenbank
persönlicher
Einstellungen
- 9
- Auslieferungskanal
- 10
- Empfänger