DE60033122T2 - Benutzeroberfläche zur Text-zu-Sprache-Umsetzung - Google Patents

Benutzeroberfläche zur Text-zu-Sprache-Umsetzung Download PDF

Info

Publication number
DE60033122T2
DE60033122T2 DE60033122T DE60033122T DE60033122T2 DE 60033122 T2 DE60033122 T2 DE 60033122T2 DE 60033122 T DE60033122 T DE 60033122T DE 60033122 T DE60033122 T DE 60033122T DE 60033122 T2 DE60033122 T2 DE 60033122T2
Authority
DE
Germany
Prior art keywords
electronic device
portable electronic
highlighting
text
highlighted text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE60033122T
Other languages
English (en)
Other versions
DE60033122D1 (de
Inventor
Mika Kivimaki
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Conversant Wireless Licensing SARL
Original Assignee
Nokia Oyj
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nokia Oyj filed Critical Nokia Oyj
Publication of DE60033122D1 publication Critical patent/DE60033122D1/de
Application granted granted Critical
Publication of DE60033122T2 publication Critical patent/DE60033122T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • G10L13/04Details of speech synthesis systems, e.g. synthesiser structure or memory management
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72403User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
    • H04M1/7243User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Multimedia (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Telephone Function (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Document Processing Apparatus (AREA)

Description

  • Die vorliegende Erfindung betrifft eine Benutzerschnittstelle für eine Vorrichtung, welche eine Text/Sprache-Umwandlungssynthese ermöglicht.
  • Die Synthese der menschlichen Sprache unter Verwendung elektronischer Vorrichtungen ist eine gut entwickelte und veröffentlichte Technologie, und es sind verschiedene kommerzielle Produkte erhältlich. Typische Sprachsyntheseprogramme wandeln geschriebene Eingaben in Sprachausgaben um, indem sie automatisch eine künstliche Sprache erzeugen, die Sprachsynthese wird deswegen häufig als „Text/Sprache"-Umwandlung („Text-to-Speech", TTS) bezeichnet.
  • Es gibt verschiedene Probleme bei der Sprachsynthese, welche bislang noch nicht in zufriedenstellender Weise gelöst worden sind. Ein Problem ist die Schwierigkeit des Verstehens der künstlichen Sprache durch einen Benutzer. Dieses Problem kann sich in mobilen elektronischen Vorrichtungen wie Mobiltelefonen oder Personenrufempfängern verschlimmern, welche begrenzte Verarbeitungsressourcen aufweisen können.
  • WO 97/37344 offenbart ein Endgerät, welches die Funktion aufweist, einen Text anzuzeigen, und eine Funktion, ihn laut vorzulesen, und welches automatisch von einer Hervorhebungsmarke an vorliest, die einer Position am nächsten ist, auf welche der Benutzer gezeigt hat. Ferner offenbart EP-1 116 217 ein Text/Sprache-Umwandlungssystem, welches gemäß Art. 54 Abs. 3 EPÜ relevant ist, wobei ein Benutzer basierend auf Markierungen in dem Text zwischen Sätzen, Absätzen oder Abschnitten navigieren kann.
  • Es wäre wünschenswert, den Grad des Verständnisses der Sprachausgabe aus solchen Sprachsynthesesystemen für einen Benutzer zu verbessern.
  • Gemäß einer Erscheinungsform der vorliegenden Erfindung wird eine tragbare elektronische Vorrichtung bereitgestellt, welche einen Sprachsynthesizer umfasst, der einen Lautsprecher aufweist, der dafür eingerichtet ist, eine Eingabe in Abhängigkeit von einem hervorgehobenen Text in eine Audio-Ausgabe umzuwandeln, welche einen Menschen verkörpert, der den hervorgehobenen Text mündlich wiedergibt; eine Benutzereingabevorrichtung zur Eingabe von Befehlen, um rückwärts oder vorwärts durch hervorgehobenen Text zwischen Positionen, die durch Hervorhebungskennzeichen des hervorgehobenen Textes definiert sind, zu einem gewünschten Hervorhebungskennzeichen zu navigieren; und eine Steuereinheit, welche dafür eingerichtet ist, die Navigation zu dem gewünschten Hervorhebungskennzeichen zu regeln und den Sprachsynthesizer in Reaktion auf eingegebene Navigationsbefehle mit einer Eingabe zu versehen, die einem Abschnitt des hervorgehobenen Textes entspricht, welcher an dem gewünschten Hervorhebungskennzeichen beginnt.
  • Eine solche tragbare elektronische Vorrichtung stellt für den Benutzer ein Mittel zum Navigieren durch den Text bereit, wodurch gewünschte Abschnitte dafür ausgewählt werden, durch den Sprachsynthesizer akustisch ausgegeben zu werden. Ferner werden die Textabschnitte logisch aufgeteilt, da die Navigation zwischen Hervorhebungskennzeichen stattfindet, was dem Benutzer ermöglicht, einzelne Wörter einfacher in den Zusammenhang zu bringen. Somit wird die Verständlichkeit der Audio-Ausgabe durch den Benutzer verbessert.
  • Bei den Hervorhebungskennzeichen kann es sich um in dem Text bereitgestellte Hervorhebungsmarkierungen und/oder um andere Markierungen handeln. Die elektronische Vorrichtung kann Hervorhebungskennzeichen benutzen, welche den Beginn von Sätzen kennzeichnen, wie z.B. einen Punkt, ein Ausrufungszeichen, ein Fragezeichen, einen Großbuchstaben, aufeinander folgende Leerstellen. Alternativ kann es sich bei den Hervorhebungskennzeichen um Markierungen wie z.B. ein Komma, einen Doppelpunkt, ein Semikolon oder einen Gedankenstrich handeln, welche ebenfalls benutzt werden, um Wörter in einem Text in logische Einheiten zu trennen. Ebenso kann der eingegebene Text spezielle Buchstaben für diesen Zweck enthalten. Der Ersteller des Textes kann zum Beispiel spezielle Buchstaben benutzen, um Wörter zu markieren, welche schwierig sein können und daher wiederholt werden müssen, wenn er Verständnisprobleme vorhersieht.
  • Die tragbare elektronische Vorrichtung kann eine Anzeigevorrichtung zum Darstellen eines Textabschnitts umfassen, welchen der Benutzer heranziehen kann, um sein Verständnis der Audio-Ausgabe abzusichern.
  • Die tragbare elektronische Vorrichtung kann so eingerichtet sein, dass sie rückwärts durch den Text navigiert und dadurch eine Funktion zur Wiederholung eines Abschnitts des Textes bereitstellt. Die tragbare elektronische Vorrichtung kann auf einen Befehl „Wiederholen" oder „Zurück", welcher durch einen Benutzer eingegeben wird, reagieren, indem die Steuereinheit rückwärts zu einer Position navigiert, welche durch ein vorgegebenes Hervorhebungskennzeichen definiert wird, um den Abschnitt des hervorgehobenen Textes von dieser Position an zu wiederholen.
  • Bei dem vorgegebenen Hervorhebungskennzeichen kann es sich um das erste auf dem Weg zurück folgende Hervorhebungskennzeichen oder alternativ um ein zweites oder weiteres auf dem Weg zurück folgendes Hervorhebungskennzeichen handeln. Die Navigation hängt jedoch vorzugsweise davon ab, wie schnell nach der Audio-Ausgabe, welche dem ersten auf dem Weg zurück folgenden Hervorhebungskennzeichen entspricht, der Wiederholungsbefehl gegeben wird. Gemäß einer solchen Ausführungsform kann die tragbare elektronische Vorrichtung dies basierend auf der Länge des hervorgehobenen Textes und/oder der Länge der Zeit für die akustische Wiedergabe des hervorgehobenen Textes zwischen der aktuellen Position und der Position, welche durch das erste auf dem Weg zurück folgende Hervorhebungskennzeichen definiert ist, ermitteln. Wenn die Länge unter einem Schwellenwert liegt (zum Beispiel fünf Wörter oder zwei Sekunden), ist die Steuereinheit dafür eingerichtet, rückwärts zu einer Position zu navigieren, welche durch ein zweites auf dem Weg zurück folgendes Hervorhebungskennzeichen definiert ist.
  • Der Sprachsynthesizer kann den hervorgehobenen Text langsamer als in einer Standardgeschwindigkeit wiederholen. Dies bietet den Vorteil, dass die Verständlichkeit der wiederholten synthetisierten Sprache weiter verbessert wird. Wenn die tragbare elektronische Vorrichtung eine Anzeigevorrichtung umfasst, kann die Standardgeschwindigkeit diejenige der Anzeige des hervorgehobenen Textes auf der Anzeigevorrichtung sein. Alternativ kann die Standardgeschwindigkeit die normale Geschwindigkeit der Ausgabe durch den Sprachsynthesizer sein.
  • Alternativ oder zusätzlich zur Rückwärtsnavigation kann die tragbare elektronische Vorrichtung so eingerichtet sein, dass sie vorwärts durch den Text navigiert. Auf diese Weise kann sie vorwärts über einen Abschnitt des Textes hinweg springen. Die tragbare elektronische Vorrichtung reagiert auf einen Befehl „Weiter" oder „Überspringen", welcher durch einen Benutzer eingegeben wird, indem die Steuereinheit vorwärts zu einer Position navigiert, welche durch ein vorgegebenes Hervorhebungskennzeichen definiert wird, um den Abschnitt des Textes zwischen der aktuellen Position und dieser Position zu überspringen. Mit anderen Worten springt sie, um eine Audio-Ausgabe von der Position an bereitzustellen, welche durch dieses vorgegebene Hervorhebungskennzeichen definiert wird.
  • Bei dem vorgegebenen Hervorhebungskennzeichen kann es sich um das erste Hervorhebungskennzeichen in Vorwärtsrichtung oder alternativ um ein zweites oder weiteres Hervorhebungskennzeichen in Vorwärtsrichtung handeln. Vorzugsweise hängt die Navigation jedoch davon ab, wie bald die Audio-Ausgabe, welche dem nächsten Hervorhebungskennzeichen entspricht, ohne den „Überspringen"-Befehl durchgeführt würde. Gemäß einer solchen Ausführungsform kann die tragbare elektronische Vorrichtung dies basierend auf der Länge des hervorgehobenen Textes und/oder der Länge der Zeit für die akustische Wiedergabe des hervorgehobenen Textes zwischen der aktuellen Position und der Position, welche durch das erste in Vorwärtsrichtung folgende Hervorhebungskennzeichen definiert ist, ermitteln. Wenn die Länge unter einem Schwellenwert liegt, ist die Steuereinheit dafür eingerichtet, vorwärts zu einer Position zu navigieren, welche durch ein zweites in Vorwärtsrichtung folgendes Hervorhebungskennzeichen definiert ist.
  • Es gibt eine Anzahl von Wegen, wie ein Benutzer seine Befehle eingeben kann. In einer Ausführungsform kann der Benutzer die Befehle über eine Benutzereingabe eingeben, welche ein Tastenmittel umfasst. Bei dem Tastenmittel kann es sich um eine dafür vorgesehene Befehlsvorrichtung handeln. Wenn die Vorrichtung eine Vorwärts- und Rückwärtsnavigation ermöglicht, dann kann sie getrennte dafür vorgesehene Navigationsbefehlsvorrichtungen umfassen, also eine für die Vorwärtsnavigation und eine für die Rückwärtsnavigation.
  • Die Steuerungsmittel können die Anzahl der Betätigungen der Vorrichtung ermitteln und die Position des Hervorhebungskennzeichens ermitteln, welches zu dieser Anzahl von Betätigungen gehört. Zum Beispiel kann das zweifache Drücken der dafür vorgesehenen Taste, die zu einem Rückwärtsnavigationsbefehl gehört, bewirken, dass die Vorrichtung zu einer Position des Hervorhebungskennzeichen um zwei zurück navigiert.
  • Alternativ kann die Position des Hervorhebungskennzeichens durch die Länge der Zeit bestimmt werden, wie lange die dafür vorgesehene Taste gedrückt wird.
  • Alternativ können die Tastenmittel eine Multifunktionstaste umfassen. Eine Funktion dieser Taste ist die Auswahl eines Navigationsbefehls. Der Navigationsbefehl selbst kann von dem Benutzer, der ihn eingibt, oder über einen Auswahlpunkt eines Menüs bereitgestellt werden. In jedem Fall wird die Multifunktionstaste benutzt, um den Navigationsbefehl auszuwählen.
  • Statt des Tastenmittels oder zusätzlich zu diesem kann die Benutzereingabevorrichtung eine Spracherkennungsvorrichtung umfassen. Eine solche Spracherkennungsvorrichtung stellt die Navigationsbefehle typischerweise mittels eines Sprachbefehls bereit.
  • Bei der tragbaren elektronischen Vorrichtung kann es sich um einen Belegleser, eine tragbare Kommunikationsvorrichtung, eine Hand-Kommunikationsvorrichtung oder Ähnliches handeln.
  • Die tragbare elektronische Vorrichtung kann ferner Mittel zur Befestigung in einem Fahrzeug umfassen.
  • Diese tragbaren elektronischen Vorrichtungen können in einem Automobil bereitgestellt werden. Wenn dies zutrifft, und wenn die tragbare elektronische Vorrichtung Tastenmittel umfasst, werden diese vorzugsweise auf dem Lenkrad des Automobils bereitgestellt.
  • Gemäß noch einer anderen Erscheinungsform der vorliegenden Erfindung wird ein Verfahren zum Navigieren durch hervorgehobenen Text zu einer gewünschten Position für die Audio-Ausgabe durch einen Sprachsynthesizer bereitgestellt, welcher ein Teil einer tragbaren elektronischen Vorrichtung ist, wobei das Verfahren das Erkennen von Befehlen umfasst, welche von einem Benutzer eingegeben werden, um rückwärts oder vorwärts durch den hervorgehobenen Text zwischen Positionen, die durch Hervorhebungskennzeichen des hervorgehobenen Textes definiert sind, zu einem gewünschten Hervorhebungskennzeichen zu navigieren; das Steuern der Navigation zu dem gewünschten Hervorhebungskennzeichen; und das Versorgen des Sprachsynthesizers mit einer Eingabe, welche einem Abschnitt des hervorgehobenen Textes entspricht, beginnend bei dem gewünschten Hervorhebungskennzeichen.
  • In einer Ausführungsform umfasst das Verfahren ferner das Ermitteln einer gewünschten Startposition in dem hervorgehobenen Text aus einer Auswahl, welche durch Hervorhebungskennzeichen definiert ist, aus einer Befehlseingabe durch einen Benutzer; das Bewegen zu der gewünschten Startposition des hervorgehobenen Textes; das Ausgeben des sprachsynthetisierten hervorgehobenen Textes von dieser Position an.
  • Gemäß noch einer anderen Erscheinungsform der vorliegenden Erfindung wird ein in einer tragbaren elektronischen Vorrichtung gespeichertes Computerprogramm zum Navigieren durch hervorgehobenen Text zu einer gewünschten Position für die Audio-Ausgabe durch einen Sprachsynthesizer bereitgestellt, welcher ein Teil einer tragbaren elektronischen Vorrichtung ist, wobei das Computerprogramm einen Code umfasst, welcher dafür geeignet ist, die folgenden Schritte durchzuführen, wenn er in einer Datenverarbeitungsvorrichtung ausgeführt wird: Erkennen einer Befehlseingabe durch einen Benutzer, um zwischen Positionen, die durch Hervorhebungskennzeichen des hervorgehobenen Textes definiert sind, zu einem gewünschten Hervorhebungskennzeichen rückwärts oder vorwärts durch den hervorgehobenen Text zu navigieren; Steuern der Navigation zu dem gewünschten Hervorhebungskennzeichen; und Versorgen des Sprachsynthesizers mit einer Eingabe, welche einem Abschnitt des hervorgehobenen Textes entspricht, beginnend bei dem gewünschten Hervorhebungskennzeichen.
  • Es werden nun beispielhaft Ausführungsformen der vorliegenden Erfindung unter Bezugnahme auf die begleitenden Zeichnungen beschrieben, von denen:
  • 1 eine elektronische Vorrichtung mit einer Benutzerschnittstelle veranschaulicht, welche eine Eingabevorrichtung und Lautsprecher aufweist;
  • 2 eine schematische Darstellung der Komponenten der in 1 dargestellten elektronischen Vorrichtung ist;
  • 3 ein Mobiltelefon gemäß einer Ausführungsform der vorliegenden Erfindung ist;
  • 4 eine schematische Darstellung der Komponenten des in 3 dargestellten Mobiltelefons ist;
  • 5a und 5b die Auswahl von Navigationsbefehlen gemäß einer Ausführungsform der vorliegenden Erfindung veranschaulichen;
  • 6 die Navigation durch Text und die darauf folgende Ausgabe ausgewählter Abschnitte des Textes veranschaulicht;
  • 7 verschiedene Verfahren der Eingabe eines „Wiederholen"-Befehls veranschaulicht;
  • 8 ein Verfahren des Wiederholens eines Textes gemäß einer bevorzugten Ausführungsform der Erfindung veranschaulicht; und
  • 9a und 9b beispielhafte Datenbänke zur Steuerung der Navigation veranschaulichen.
  • 1 veranschaulicht eine elektronische Vorrichtung 2. Die elektronische Vorrichtung weist eine Eingabevorrichtung 4 und eine Ausgabevorrichtung 6 auf. Die Eingabevorrichtung umfasst ein Mikrofon 3 zum Empfang einer Audio-Ausgabe und eine taktile Eingabevorrichtung 5. Bei der Ausgabe 6 handelt es sich um einen Lautsprecher 6, welcher benutzt wird, um die synthetisierte Sprache einem Benutzer zu übermitteln.
  • Die Eingabeeinheit kann Befehle vom Benutzer empfangen, welcher die Auswahl der synthetisierten Sprache steuert, die durch den Lautsprecher 6 ausgegeben werden soll. Dies kann entweder mittels einer taktilen Eingabe und/oder eines Sprachbefehls durchgeführt werden. Zum Beispiel kann der Benutzer, der einen Teil der Sprachausgabe durch den Lautsprecher 6 nicht gehört hat, der Einheit 2 den Befehl erteilen, diesen Teil zu wiederholen, wodurch das Verständnis des Benutzers verbessert wird. Die taktile Eingabevorrichtung 5 kann auch benutzt werden, um einen Text einzugeben, welcher durch den Lautsprecher 6 als synthetisierte Sprache verbreitet werden kann.
  • Bei der elektronischen Vorrichtung kann es sich um irgendeine Vorrichtung handeln, welche eine Audio-Schnittstelle erfordert. Es kann sich um einen Computer handeln (z.B. einen Personal Computer, PC), einen persönlichen digitalen Assistenten (PDA), eine Funkkommunikationsvorrichtung, wie z.B. ein Mobiltelefon, z.B. ein Autotelefon oder ein Handtelefon, ein Computersystem, einen Belegleser, wie z.B. eine Web-Suchmaschine, ein Text-Fernsehgerät, ein Fax, eine Dokumenten-Suchmaschine zum Lesen von Büchern, Emails oder anderen Dokumenten dieser Art.
  • Obwohl die Eingabevorrichtung 4 und der Lautsprecher 6 in 1 so dargestellt sind, dass sie in einer einzelnen Einheit integriert sind, können sie auch getrennt sein, dasselbe gilt für das Mikrofon 3 und die Texteingabevorrichtung 5 der Eingabevorrichtung 4.
  • 2 ist eine schematische Darstellung der elektronischen Vorrichtung 2. Die Vorrichtung 2 weist außer der Eingabevorrichtung 4 und dem Lautsprecher 6 einen Prozessor 12 auf, welcher in Reaktion auf Benutzereingabebefehle 26 den Lautsprecher steuert und auf einen Speicher 10 zugreift. Der Speicher 10 speichert Textdaten 24, welche durch eine Eingabe 4 zugeführt werden. Der Prozessor 12 ist als zwei funktionelle Blöcke dargestellt – eine Steuereinheit 14 und eine Text/Sprache-Umwandlungsmaschine 16. Die Steuereinheit 14 und die Text/Sprache-Umwandlungsmaschine 16 können als Software realisiert werden, welche auf dem Prozessor 12 abläuft.
  • Die Text/Sprache-Umwandlungsmaschine 16 steuert den Lautsprecher 6. Sie empfängt die Texteingabe 18 von der Steuereinheit und wandelt die Texteingabe in eine künstliche Sprachausgabe 22 um, welche durch den Lautsprecher 6 in Schallwellen überführt wird. Bei der Sprachausgabe kann es sich zum Beispiel um eine bestimmte Anzahl von Wörtern zu einer Zeit, einen Ausdruck zu einer Zeit oder einen Satz zu einer Zeit handeln.
  • Die Steuereinheit 14 liest den Speicher 10 aus und steuert die Text/Sprache-Umwandlungsmaschine 16. Die Steuereinheit, die aus dem Speicher Textdaten ausgelesen hat, stellt diese als Eingabe 18 in die Text/Sprache-Umwandlungsmaschine 16 bereit.
  • Der Speicher 10 speichert Textdaten, welche von der Steuereinheit 14 ausgelesen werden. Die Steuereinheit 14 verwendet die Textdaten, um die Eingabe 18 in die Text/Sprache-Umwandlungsmaschine 16 zu erzeugen. Die Textdaten werden im Speicher 10 durch die Eingabevorrichtung 30 gespeichert. Die Eingabevorrichtung weist in diesem Beispiel ein Mikrofon 3, ein Tastenmittel 5 (z.B. eine Taste, einen Berührungsbildschirm, einen Joystick usw.) oder einen Funk-Transceiver zum Empfangen von Textdaten in Form von SMS-Mitteilungen oder Emails auf.
  • Die Steuereinheit 14 navigiert in Reaktion auf die vom Benutzer über die Eingabe 4 empfangenen Befehle 26 ebenfalls durch die Textdaten, so dass der Lautsprecher die gewünschte Sprache ausgibt. Es kann zum Beispiel vorwärts navigiert werden, um Text zu überspringen, oder rückwärts, um Text zu wiederholen. Die Navigation wird derart durchgeführt, dass der Text durch den Lautsprecher 16 in logischen Einheiten verbreitet wird. Dies wird erreicht, indem die Steuereinheit den Text, den sie aus dem Speicher 10 erhält, lexikalisch untergliedert. Das lexikalische Untergliedern beinhaltet die Verwendung von Hervorhebungskennzeichen innerhalb des Textes, um Abschnitte des Textes in logische Einheiten zu trennen. Beispiele für Hervorhebungskennzeichen sind jene, welche ein Ende des Satzes anzeigen, wie z.B. ein Punkt, ein Ausrufungszeichen, ein Fragezeichen, ein Großbuchstabe, aufeinander folgende Leerstellen, ein Komma und andere Kennzeichen, welche eine logische Pause innerhalb des Satzes anzeigen, wie z.B. das Komma, ein Doppelpunkt, ein Semikolon oder ein Gedankenstrich. Alternativ kann ein Hervorhebungskennzeichen verwendet werden, welches ein Ende einer Gruppe einer vorgegebenen Anzahl von Wörtern anzeigt. Der Abschnitt des Textes zwischen den Kennzeichen wird einer zur Zeit zu der TTS-Maschine 16 gesendet. Die Steuereinheit erhält die Datenbank aufrecht, um eine Steuerung der Navigation zu ermöglichen. Beispiele sind in 9a und 9b der begleitenden Zeichnungen dargestellt.
  • In 9a untergliedert die Steuereinheit den Text zu Gruppen von fünf Wörtern. Dies ist zum Beispiel nützlich, wo der Text nur sehr wenige oder keine Satzzeichen enthält. In diesem Fall gruppiert die Steuereinheit die Wörter, indem sie Leerstellen innerhalb des Textes erkennt und diese zählt. Dies kann zum Beispiel ausgeführt werden, indem nach dem ASCII-Code für eine Leerstelle gesucht wird. Die Datenbank weist einen Eintrag für jedes der 18 Wörter in dem Ausdruck auf. Jeder Eintrag weist zwei Felder auf. In das erste Feld 91 wird die Zählung der Leerstellen aufgenommen, die von 1 bis 5 anwächst. In das zweite Feld 92 wird aufgenommen, zu welcher Textgruppe der Worteintrag gehört, basierend auf der Zählung im ersten Feld 91, wobei beide ein Textgruppenkennzeichen speichern, welches für jede Gruppe von fünf Wörtern unterschiedlich ist. In 9a sind vier unterschiedliche Textgruppen dargestellt, welche die Gruppenkennzeichen 1, 2, 3 und 4 aufweisen. Die Gruppe 1 umfasst die Wörter „Hallo Fred, Vielen Dank für". Die Gruppe 2 umfasst die Wörter „deine Nachricht, ich freue mich". Die Gruppe 3 umfasst die Wörter „darauf, dich um 2 am". Die Gruppe 4 umfasst die Wörter „Donnerstag zu sehen".
  • Im Betrieb leitet die Steuereinheit 14 die Gruppe 1 zur TTS 16 weiter, als nächstes die Gruppe 2, dann die Gruppe 3 und schließlich die Gruppe 4. Während dieser Zeit verfolgt die Steuereinheit 14, welche Gruppe erfolgreich als künstliche Sprache ausgegeben worden ist. Sie kann dies tun, indem sie die Anzahl der Gruppenkennzeichen speichert, die an die TTS 18 weitergeleitet wurden. Wenn die Steuereinheit den Befehl des Benutzers empfängt, dann navigiert die Steuereinheit durch den Text zu einer gewünschten Position und leitet die zugehörige Textgruppe zur TTS-Maschine 16 weiter. Wenn die TTS-Maschine zum Beispiel eine künstliche Sprache ausgibt, die zur Gruppe 3 gehört, und der Benutzer den „Zurück"-Befehl eingibt, dann bewirkt das Steuersignal 26, dass die Steuereinheit durch den Text zurück zum Beginn der letzten Identifizierungsgruppe navigiert, die ausgegeben (oder zur TTS weitergeleitet) werden soll, und diese Gruppe zur Umwandlung und Ausgabe durch den Lautsprecher 6 erneut zur TTS-Maschine 16 sendet. Unter der Annahme, dass aktuell die Gruppe 3 ausgegeben wird, navigiert die Steuereinheit 14 dann zum Beispiel in Reaktion auf ein „Zurück"-Steuersignal 26 aus der Eingabe 4 zurück durch den Text zum Beginn der Gruppe 3 zu dem Wort „darauf" und leitet die Textgruppe 3 zur Ausgabe durch den Lautsprecher 6 als künstliche Sprache erneut zur TTS-Maschine 16 weiter. Unter der Annahme, dass keine weiteren Befehle vom Benutzer empfangen werden, leitet dann die Steuereinheit 14 planmäßig die Textgruppe 4 zur TTS-Maschine weiter, sobald der Text der Gruppe 3 ausgegeben wurde. Die Steuereinheit 14 kann so eingerichtet sein, dass sie sich in Reaktion auf einen „Zurück"-Befehl zwei Gruppen zurück bewegt. Dies kann zum Beispiel dann der Fall sein, wenn ein Befehl empfangen wird, wenn der Beginn einer Textgruppe ausgegeben wird, zum Beispiel wenn das erste und zweite Wort einer Gruppe ausgegeben wird. Wenn also zum Beispiel das Wort „darauf" der Gruppe 3 ausgegeben wird, wenn die Steuereinheit den „Zurück"-Befehl 26 empfängt, dann kann die Steuereinheit zurück zum Beginn der Gruppe 2 navigieren und diese Gruppe zur Ausgabe zur TTS weiterleiten.
  • Alternativ kann der wiederholte Text durch die Zeitdauer, seitdem die letzte Gruppe zur TTS-Maschine gesendet wurde, bis zum Empfang des „Zurück"-Befehls ermittelt werden, oder durch eine spezielle Benutzereingabe, z.B. dadurch, dass zwei Signale innerhalb einer vorgegebenen Zeitperiode empfangen werden. Diese Alternativen werden unten noch weiter erklärt.
  • In ähnlicher Weise navigiert die Steuereinheit 14, wenn ein „Weiter"-Befehl empfangen wird, durch den Text und leitet die nächste Gruppe zur Sprachausgabe durch den Lautsprecher 6 zur TTS-Maschine weiter. Wenn zum Beispiel aktuell die Gruppe 2 als künstliche Sprache ausgegeben wird und der Benutzer einen „Weiter"-Befehl eingibt, dann bewirkt das Steuersignal 26, dass die Steuereinheit vorwärts durch den Text zum Beginn der nächsten Gruppe navigiert, die ausgegeben werden soll, namentlich Gruppe 3, und diese Gruppe zur Umwandlung in künstliche Sprache zur Ausgabe durch den Lautsprecher 6 zur TTS-Maschine sendet. Dadurch wird der Rest des Textes der Gruppe 2, der noch nicht durch den Lautsprecher ausgegeben worden ist, übersprungen. Alternativ kann die Steuereinheit, wenn das Ende der Gruppe 2 ausgegeben wird (zum Beispiel die Wörter „freue" oder „mich"), wenn ein „Weiter"-Befehl empfangen wird, dann die dritte Gruppe überspringen und die vierte Gruppe zur Umwandlung in Sprache zur Ausgabe durch den Lautsprecher 6 zur TTS-Maschine weiterleiten.
  • 3 veranschaulicht einen Funk-Handapparat gemäß einer Ausführungsform der vorliegenden Erfindung. Der Handapparat, welcher allgemein mit 30 beziffert ist, umfasst die Benutzerschnittstelle, welche ein Tastenfeld 32, eine Anzeigevorrichtung 33, einen Ein-/Aus-Schalter 34, einen Lautsprecher 35 und ein Mikrofon 36 aufweist. Der Handapparat 30 gemäß dieser Ausführungsform ist für die Kommunikation über ein Funktelekommunikationsnetz, z.B. ein Zellularnetz, geeignet. Ein Handapparat könnte jedoch alternativ auch für ein schnurloses Telefon ausgestaltet sein. Das Tastenfeld 32 weist eine erste Gruppe von Tasten 37 auf, bei welchen es sich um alphanumerische Tasten handelt und mittels welcher der Benutzer Daten eingeben kann. Zum Beispiel kann der Benutzer unter Benutzung dieser Tasten 37 eine Telefonnummer eingeben, eine Textmitteilung (z.B. SMS) schreiben, einen (zu einer Telefonnummer gehörigen) Namen schreiben usw. Jede der 12 alphanumerischen Tasten ist jeweils mit einer Figur „0" bis „9" oder „#" oder „*" versehen. Im Alpha-Modus sind jeder Taste ein oder mehrere Buchstaben und spezielle Zeichen zugeordnet, welche bei der Texterstellung verwendet werden. Das Tastenfeld 32 umfasst außerdem zwei Dialogtasten 38a und 39a, zwei Anruftasten 39 und eine Navigationstaste 31.
  • Die beiden Dialogtasten 38 weisen eine Funktionalität auf, welche dem entspricht, was von einer Anzahl von Handapparaten, wie z.B. dem Nokia 2110TM, dem Nokia 6110TM und dem Nokia 8110TM, bekannt ist. Die Funktionalität der Dialogtaste hängt vom Status des Handapparates und der Navigation im Menü zum Beispiel unter Verwendung der Navigationstaste ab. Die aktuelle Funktionalität der Dialogtaste 38a und 38b ist in eigenen Feldern dafür auf der Anzeigevorrichtung 33 direkt über den Tasten 38 dargestellt.
  • Die beiden Anruftasten 39 können benutzt werden, um einen Anruf oder eine Konferenzverbindung aufzubauen, einen Anruf zu beenden oder einen eingehenden Anruf zurückzuweisen.
  • Die Navigationstaste 31 ist in dieser Ausführungsform eine Taste zum Blättern im Menü nach oben und unten. Es können jedoch auch andere Tasten statt dieser Navigationstaste und/oder den Dialogtasten verwendet werden, wie z.B. eine Rollvorrichtung oder Ähnliches.
  • 4 ist ein Blockdiagramm eines Teils des Handapparates der 3, welches das Verständnis der vorliegenden Erfindung erleichtert. Wie es in einem Funk-Handapparat üblich ist, umfasst er ein Sprach-Schaltungssystem in der Form von Benutzerschnittstellen-Vorrichtungen (Mikrofon 36 und Lautsprecher 35), einen Audio-Teil 44, einen Transceiver 49 und eine Steuereinheit 48. Das Mikrofon 36 wandelt Sprach-Audiosignale in entsprechende Analogsignale um, welche wiederum durch einen (nicht dargestellten) A/D-Wandler von analog in digital umgewandelt werden. Der Audio-Teil 44 codiert dann das Signal und leitet das codierte Signal unter Steuerung der Steuereinheit 48 zur Ausgabe an das Kommunikationsnetz zum Transceiver 49 weiter.
  • In der umgekehrten Situation wird ein codiertes Sprachsignal, welches von einem Transceiver 49 empfangen wird, wieder unter Steuerung der Steuereinheit 48 durch den Audio-Teil decodiert. Diesmal wird das decodierte digitale Signal durch einen (nicht dargestellten) D/A-Wandler in ein analoges umgewandelt und durch den Lautsprecher 35 ausgegeben.
  • Die Steuereinheit 48 bildet auch eine Schnittstelle mit Peripherieeinheiten, wie z.B. dem Speicher 47, welcher einen RAM-Speicher 47a und einen Flash-ROM-Speicher 47b aufweist, einer SIM-Karte 46, einer Anzeigevorrichtung 33 und einem Tastenfeld 32 (ebenso wie Daten, Stromversorgung usw.).
  • In dieser Ausführungsform umfasst der Audio-Teil 44 auch eine TTS-Maschine, welche zusammen mit der Steuereinheit 48 einen Prozessor bildet, wie in der Ausführungsform der 1. In der Vorrichtung 30 wird die Text-Sprachsynthese in sehr ähnlicher Weise gehandhabt, wie sie in Verbindung mit den entsprechenden Teilen in 2 beschrieben wurde.
  • Der Text kann durch den Benutzer über die Tastatur 32 und/oder das Mikrofon 36 oder über den Empfang aus dem Kommunikationsnetz durch den Transceiver 49 eingegeben werden. Die empfangenen Textdaten werden im Speicher (RAM 47a) gespeichert. Die Steuereinheit liest den Speicher aus und steuert die TTS-Maschine dementsprechend. Die Steuereinheit navigiert auch in Reaktion auf Befehle, die sie vom Benutzer über eines oder mehrere aus dem Mikrofon 36, der Tastatur 36 und den Navigations- und Auswahltasten 45 empfängt, derart durch den Text, dass der Lautsprecher 35 die gewünschte Sprache in logischen Einheiten ausgibt.
  • In dieser Ausführungsform stellt der Handapparat den Text auch auf der Anzeigevorrichtung 33 dar, ebenso wie er Text oder Sprache ausgibt. Demnach ist der Prozessor dafür verantwortlich, den Treiber der Anzeigevorrichtung so zu steuern, dass er die Anzeigevorrichtung dazu führt, den richtigen Text anzuzeigen. Wenn sie den Speicher 47a ausliest und die TTS-Maschine steuert, steuert die Steuereinheit 14 auch die Anzeigevorrichtung. Nachdem sie die Textdaten aus dem Speicher ausgelesen hat, stellt die Steuereinheit sie in dieser Ausführungsform als Eingabe in die TTS-Maschine bereit und steuert den Treiber der Anzeigevorrichtung dahin, dass die in den Steuersignalen 431 verwendeten Textdaten angezeigt werden. Der angezeigte Text entspricht dem Text, welcher durch die TTS-Maschine umgewandelt wurde. Dies ist auch der Fall, wenn ein Navigationsbefehl vom Benutzer empfangen wird. Die für die Steuerung der Navigation verwendete Datenbank wird allgemein für den Zweck der Textausgabe verwendet, und wenn ein Text in der Anzeigevorrichtung gewünscht ist, wird die Datenbank gleichzeitig mit der Steuerung der TTS-Maschine auch bei der Steuerung der Anzeigevorrichtung verwendet. Mit anderen Worten wird zum Beispiel in der Datenbank der 9a, wenn die Steuereinheit eine Textgruppe zur TTS-Maschine sendet, diese Textgruppe zur Darstellung auf der Anzeigevorrichtung auch zum Treiber der Anzeigevorrichtung gesendet.
  • Ein Handapparat wie derjenige in 3 weist im Allgemeinen einen Bereich von Menüfunktionen auf. Das Nokia 6110 kann zum Beispiel die folgenden Menüfunktionen aufweisen:
    • 1. Mitteilungen
    • 2. Anrufregister
    • 3. Profile
    • 4. Einstellungen
    • 5. Rufumleitung
    • 6. Spiele
    • 7. Taschenrechner
    • 8. Kalender
  • Um auf die Menüs zuzugreifen, kann der Benutzer unter Verwendung der Navigations- und Auswahltaste 45 oder unter Verwendung geeigneter vordefinierten Kurzzugangstasten durch die Funktionen blättern. Im Allgemeinen ermöglicht die linke Dialogtaste 38a dem Benutzer, durch Untermenüs zu navigieren und Optionen auszuwählen, während die rechte Dialogtaste 38b dem Benutzer ermöglicht, in der Menühierarchie zurück nach oben zu gelangen. Die Navigationstaste 31 kann benutzt werden, um vor der Auswahl unter Verwendung der linken Dialogtaste 38a in einem bestimmten Menü/Untermenü durch die Optionsliste zu navigieren.
  • Das Mitteilungsmenü kann Funktionen aufweisen, welche sich auf Textmitteilungen (wie z.B. SMS), Sprachmitteilungen, Fax- und Datenverbindungen sowie auf Dienstbefehle aus den Mitteilungen des Netzinformationsdienstes beziehen. Eine typische Funktionsliste kann die folgende sein:
    • 1-1 Eingangsordner
    • 1-2 Ausgangsordner
    • 1-3 Mitteilungen schreiben
    • 1-4 Mitteilungs-Einstellungen
    • 1-5 Informationsdienst
    • 1-6 Fax- oder Datenverbindung
    • 1-7 Dienstbefehl-Editor
  • In der vorliegenden Erfindung weist der Handapparat eine Einstellung für Text-Sprachsynthese auf. Diese Einstellung kann vordefiniert sein, oder es kann sich um ein Profil handeln, welches vom Benutzer ausgewählt werden kann. Wenn die Einstellung „Ein" lautet, dann kann die Mitteilungsfunktion des Eingangsordners für den Benutzer die Optionen umfassen, eine empfangene Textmitteilung abzuhören usw. 5a veranschaulicht, wie ein Benutzer eine Mitteilung auswählen kann, die im Eingangsordner der Mitteilungen gespeichert ist, und diese abhören kann, während 5b veranschaulicht, wie durch die Mitteilung navigiert wird.
  • In dieser Ausführungsform werden die Menüauswahlpunkte einer zur Zeit angezeigt. Das Mitteilungsmenü ist der erste Auswahlpunkt und wird auf der Anzeigevorrichtung dargestellt (Phase 501). Der Benutzer kann diesen Auswahlpunkt auswählen, indem er die linke Dialogtaste 38a drückt, die zu der angezeigten „Auswahl"-Funktion gehört. Alternativ kann der Benutzer, wenn dieser Auswahlpunkt nicht gewünscht wird, die rechte Dialogtaste benutzen, um zurück zum Hauptmenü zu gelangen, oder die Navigationstaste, um zu einem anderen auszuwählenden Auswahlpunkt zu blättern, z.B. Anrufeinstellungen.
  • Wenn der Auswahlpunkt „Mitteilungen" ausgewählt wird, wird der erste Auswahlpunkt im ersten Untermenü angezeigt, namentlich Eingangsordner (Phase 502). Wenn der Benutzer diesen Auswahlpunkt auswählt, indem er die linke Dialogtaste 38a drückt, werden in dieser Ausführungsform die letzten drei Textmitteilungen angezeigt, wobei die letzte empfangene Mitteilung in einer Liste von Auswahlpunkten zuerst dargestellt wird (Phase 503). Diese letzte empfangene Mitteilung ist der Standard-Auswahlpunkt, welcher ausgewählt wird, wenn die linke Dialogtaste 38a gedrückt wird. Dieser Standard-Auswahlpunkt kann angezeigt werden, indem er auf der Anzeigevorrichtung hervorgehoben wird. Wenn der Benutzer wünscht, eine der anderen Mitteilungen zu lesen, kann er unter Verwendung der Navigationstaste zu diesen navigieren. wenn einmal eine Mitteilung ausgewählt worden ist, hat der Benutzer die Wahl, die ausgewählte Mitteilung abzuhören oder zu lesen. (Beim Auswahlpunkt „Abhören" kann es sich in Abhängigkeit von der Konfiguration des Handapparates um das bloße Abhören oder um Abhören und Lesen handeln. „Abhören" ist der Standard-Auswahlpunkt. Dieser kann durch Drücken der linken Dialogtaste 38a oder der Alpha-Taste „1" ausgewählt werden. Alternativ kann in einer bevorzugten Ausführungsform der Auswahlpunkt „Abhören" nach einer bestimmten Zeitdauer, zum Beispiel zwei Sekunden, ohne eine Benutzereingabe automatisch ausgewählt werden. In der Ausführungsform der 5a ist der Handapparat so konfiguriert, dass er die ausgewählte Mitteilung abspielt und anzeigt, wenn der Auswahlpunkt „Abhören" ausgewählt wird (Phase 505).
  • In Abhängigkeit vom Status des Handapparates ist in Bezug auf die ausgewählte Mitteilung eine Anzahl weiterer Auswahlpunkte verfügbar.
  • Wenn wie in Phase 504 der Auswahlpunkt „Abhören" ausgewählt wird, dann sind die verfügbaren Auswahlpunkte während des Abspielens der Mitteilung die Auswahlpunkte „Vorwärts"- und „Rückwärts-Navigation", wie in Bezug auf 5b weiter beschrieben. Wenn das Abspielen der Mitteilung einmal ohne weitere Benutzereingabe für eine vorgegebene Zeitdauer beendet ist, verändern sich die Auswahlpunkte in herkömmliche Textmitteilungs-Auswahlpunkte, wie z.B. Löschen, Beantworten, Bearbeiten, Verwenden der Nummer, Weiterleiten, Drucken über IR, Einzelheiten usw. (Phase 506).
  • Wenn der Auswahlpunkt „Lesen" ausgewählt wird, dann sind dieselben Auswahlpunkte verfügbar, unabhängig davon, ob die gesamte Mitteilung auf der Anzeigevorrichtung für den Benutzer zum Lesen dargestellt wird.
  • 5b veranschaulicht nun den Empfang einer eingehenden Mitteilung (statt auf eine zuvor empfangene zuzugreifen, wie in Phase 503 der 5a).
  • Wenn über den Transceiver 49 eine Mitteilung aus dem Kommunikationsnetz empfangen wird, sendet die Steuereinheit ein Steuersignal an den Treiber der Anzeigevorrichtung, dass die Anzeigevorrichtung einen Menüauswahlpunkt darstellt, wie in Phase 507 dargestellt. Wenn der Benutzer wünscht, auf eine Mitteilung zuzugreifen, während der Handapparat sich in diesem Status befindet, dann wird die linke Dialogtaste 38a gedrückt. Durch Drücken der rechten Dialogtaste andererseits wird dieses Menü verlassen, und die gespeicherten Mitteilungen können später über die in 5a dargestellten Phasen angesehen/abgehört werden.
  • In der Ausführungsform der 5b erhält man Zugriff auf die empfangene Mitteilung, wenn die linke Dialogtaste gedrückt wird. Der Benutzer hat dann die Wahl, die Mitteilung abzuhören oder zu lesen (Phase 508). In dieser speziellen Ausführungsform ist der Handapparat so konfiguriert, dass er die Mitteilung nur abspielt, wenn der Auswahlpunkt „Abhören" ausgewählt wird (durch Drücken der linken Dialogtaste oder der alphanumerischen Taste „1"), und danach werden die verfügbaren Navigationsmöglichkeiten auf der Anzeigevorrichtung dargestellt (Phase 509). Die in dieser Ausführungsform verfügbaren Navigationsmöglichkeiten sind die Auswahlpunkte „Zurück" und „Weiter", wobei der Auswahlpunkt „Zurück" der Standard ist. Der Auswahlpunkt „Zurück" kann ausgewählt werden, indem die Dialogtaste oder die alphanumerische Taste „1" gedrückt wird, oder alternativ automatisch, wenn für eine vorgegebene Zeitdauer keine Benutzereingabe vorgenommen wurde. Der Auswahlpunkt „Weiter" andererseits kann ausgewählt werden, indem unter Verwendung der Navigationstaste einmal nach unten geblättert wird und dann unter Verwendung der linken Dialogtaste 38a oder schneller durch Drücken der alphanumerischen Taste „2" gewählt wird. Wenn einer der Auswahlpunkte ausgewählt wird, dann wird in dieser Ausführungsform eine Auswahl von Zurück/Weiter-Schritten angeboten (Phase 510).
  • In diesem Fall sind die Sprünge 1, 2 oder 3 verfügbar, und der gewünschte Sprung kann unter Verwendung der richtigen alphanumerischen Taste oder der Dialogtaste ausgewählt werden, geeignetenfalls nach der Dialogtaste. Der Sprung um eine Position zurück oder nach vorn ist der Standard und kann automatisch ausgewählt werden, wenn der Benutzer innerhalb einer vorgegebenen Zeitdauer keine Eingabe vornimmt. Die Zahlen 1 bis 3 stehen für die Anzahl von Sprüngen zwischen Hervorhebungskennzeichen in der gewählten Richtung, wie es zum Beispiel oben in Bezug auf die 9a und 9b beschrieben ist.
  • Wie oben erwähnt handelt es sich in der Ausführungsform der 5b bei dem Auswahlpunkt „Abhören" um das bloße Abhören, und somit werden, wenn einmal der Auswahlpunkt „Abhören" ausgewählt ist (Phase 508), die Auswahlmöglichkeiten „Zurück" und „Weiter" auf der Anzeigevorrichtung dargestellt (Phase 509). Im Gegensatz dazu handelt es sich in der Ausführungsform der 5a bei dem Auswahlpunkt „Abhören" um das Abhören und Lesen (Abspielen und Anzeigen), und somit wird, wenn einmal der Auswahlpunkt „Abhören" ausgewählt ist (Phase 508), die Mitteilung auf der Anzeigevorrichtung dargestellt (Phase 505).
  • In der Situation der 5a können, wenn der Benutzer den Auswahlpunkt „Abhören" auswählt, unter Verwendung der linken Dialogtaste 38a, um auf der Anzeigevorrichtung Navigationsmöglichkeiten anzuzeigen, „Auswahlpunkte" ausgewählt werden (wie in Phase 509 der Ausführungsform der 5b). In ähnlicher Weise kann eine Auswahl aus diesen Auswahlpunkten in derselben Weise wie für die Navigationsmöglichkeit der Ausführungsform der 5b (Phase 509) und für die Anzahl der Schritte, 1, 2 oder 3, wie in Phase 510 vorgenommen werden.
  • Alternativ können, wenn die Mitteilung abgespielt wird, Kurzzugangstasten oder die alphanumerischen Tasten 1 und 2 gedrückt werden, um automatisch die gewünschte Navigationsmöglichkeit auszuwählen. Wenn einmal eine Navigationsmöglichkeit ausgewählt ist, wird die Auswahl der Anzahl der „Zurück/Weiter"-Schritte wie in Phase 510 der Ausführungsform der 5b für den Benutzer dargestellt.
  • 6 veranschaulicht die Navigation durch den Text und die darauf folgende Ausgabe von ausgewählten Abschnitten des Textes. Gemäß dieser Ausführungsform ermittelt die Steuereinheit 48, ob der Benutzer die Möglichkeit des Abhörens der Mitteilungen ausgewählt hat (Schritt 601). Wenn dies der Fall ist, liest die Steuereinheit 48 die Textdaten aus dem Speicher 47 aus und steuert die TTS-Maschine dahin, die gespeicherte Mitteilung über den Lautsprecher 35 abzuspielen (Schritt 602). Während die Mitteilung abgespielt wird, überprüft die Steuereinheit, ob irgendwelche Eingabebefehle vom Benutzer vorliegen (Schritt 604). Wenn kein Befehl erkannt wird, dann fährt die Steuereinheit damit fort, die Mitteilung zur TTS-Maschine weiterzuleiten, bis das Ende der Mitteilung erreicht ist (Schritt 603), dann wird das Abspielen beendet. Wenn andererseits die Steuereinheit die Eingabe eines Befehls erkennt, ermittelt sie die Art des Befehls. In dieser Ausführungsform erkennt die Steuereinheit zuerst, ob es sich bei dem Befehl um einen „Zurück"-Befehl handelt. Wenn ja, dann ermittelt die Steuereinheit die Position, zu welcher sie sich zurückbewegen muss (Schritt 606), bewegt sich zu dieser Position (Schritt 607), und die TTS-Maschine spielt die Mitteilung von dieser Position an ab (Schritt 608). Zum Beispiel identifiziert die Steuereinheit ein Hervorhebungskennzeichen, liest die Mitteilung, die im Speicher gespeichert ist, von diesem Kennzeichen an aus und leitet diesen Teil der Mitteilung zum erneuten Abspielen zum Eingang der TTS-Maschine weiter.
  • Wenn es sich bei dem Befehl nicht um einen „Zurück"-Befehl handelt, dann ermittelt die Steuereinheit, ob es sich bei dem Befehl um einen „Weiter"-Befehl handelt (Schritt 609). Wenn ja, dann ermittelt die Steuereinheit die Position, zu welcher sie sich nach vorn bewegen muss (Schritt 610), bewegt sich zu dieser Position (Schritt 607), und die TTS-Maschine spielt die Mitteilung von dieser Position an ab (Schritt 608). Zum Beispiel identifiziert die Steuereinheit das Hervorhebungskennzeichen, springt zu dem Teil der Mitteilung im Speicher von diesem Hervorhebungskennzeichen an und leitet ihn zur Sprachausgabe zum Eingang der TTS-Maschine weiter.
  • 7 veranschaulicht verschiedene Verfahren der Eingabe eines Wiederholungsbefehls. Die Steuereinheit 48 ermittelt, ob der Benutzer die Möglichkeit des Abhörens der Mitteilungen ausgewählt hat (Schritt 701). Wenn dies der Fall ist, liest die Steuereinheit 48 die Textdaten aus dem Speicher 47 aus und steuert die TTS-Maschine dahin, die gespeicherte Mitteilung über den Lautsprecher 35 abzuspielen (Schritt 702). Während die Mitteilung abgespielt wird, überprüft die Steuereinheit, ob ein „Zurück"-Eingabebefehl vom Benutzer empfangen wurde (Schritt 704). Wenn kein Befehl erkannt wird, dann fährt die Steuereinheit damit fort, die Mitteilung zur TTS- Maschine weiterzuleiten, bis das Ende der Mitteilung erreicht ist (Schritt 703). Dann wird das Abspielen beendet.
  • Wenn andererseits die Steuereinheit einen „Zurück"-Eingabebefehl erkennt, fährt sie damit fort, den Punkt zu ermitteln, von welchem aus die Mitteilung wiederholt werden soll. Im Ablaufdiagramm der 7 sind vier Alternativen dargestellt. Diese sind in diesem Ablaufdiagramm als Kette von Schritten dargestellt, man wird jedoch erkennen, dass ein Handapparat möglicherweise auch nur irgendeinen oder irgendeine Kombination dieser verwirklicht.
  • Erstens ermittelt die Steuereinheit, ob eine dafür vorgesehene Taste gedrückt wird (Schritt 705). Wenn ja, fährt sie damit fort, zu ermitteln, wie viele Tastendrücke (N) der Benutzer vorgenommen hat (Schritt 706), und ermittelt die Position des N-ten Hervorhebungskennzeichens auf dem Weg zurück. Wenn der Benutzer die vorgesehene Taste zum Beispiel zweimal drückt, dann ermittelt die Steuereinheit die Position des zweiten Hervorhebungskennzeichens auf dem Weg zurück von der aktuellen Position aus.
  • Zweitens ermittelt die Steuereinheit, ob eine Funktionstaste gedrückt wird, welche einem Eingabebefehl entspricht. Wenn ja, dann ermittelt sie, wie viele Rückwärtsschritte ausgewählt wurden (S) (Schritt 711), und ermittelt die Position des S-ten Hervorhebungskennzeichens auf dem Weg zurück (Schritt 712). Zum Beispiel kann die Steuereinheit die Auswahl einer bestimmten Anzahl von Schritten (S) unter Verwendung der Navigationstaste 31 und der linken Dialogtaste 38 identifizieren, wie es oben in Bezug auf Phase 510 der 5(c) beschrieben ist.
  • Drittens kann die Steuereinheit ermitteln, ob nach der Eingabe eines „Zurück"-Befehls eine alphanumerische Taste gedrückt wird (Schritt 720), und wenn dies der Fall ist, ermittelt sie die Ziffer (D), die zu dem Tastendruck gehört (Schritt 721), und ermittelt die Position des D-ten Hervorhebungskennzeichens auf dem Weg zurück (722).
  • Zum Beispiel kann die Steuereinheit das Drücken der alphanumerischen Taste „1" erkennen und auf dieser Basis die Position des letzten Hervorhebungskennzeichens ermitteln.
  • Viertens kann die Steuereinheit ermitteln, ob ein Sprachbefehl eingegeben wird (Schritt 730), und wenn dies der Fall ist, ermittelt die Steuereinheit, wie viele Rückwärtsschritte (R) angefordert wurden (731), und ermittelt somit die Position des R-ten Hervorhebungskennzeichens auf dem Weg zurück. Dies kann unter Anwendung einer herkömmlichen Spracherkennungstechnologie erreicht werden.
  • Wenn die gewünschte Position einmal ermittelt worden ist, bewegt sich die Steuereinheit zurück zu dieser Position (Schritt 708), und die TTS-Maschine spielt die Mitteilung von dieser Position aus ab (Schritt 709).
  • 8 veranschaulicht ein Verfahren der Wiederholung von Text gemäß einer bevorzugten Ausführungsform der vorliegenden Erfindung.
  • Die Steuereinheit 48 ermittelt, ob der Benutzer die Möglichkeit des Abhörens der Mitteilungen ausgewählt hat (Schritt 801). Wenn dies der Fall ist, liest die Steuereinheit 48 die Textdaten aus dem Speicher 47 aus und steuert die TTS-Maschine dahin, die gespeicherte Mitteilung abzuspielen (Schritt 802). Während die Mitteilung abgespielt wird, überprüft die Steuereinheit, ob ein „Zurück"-Befehl vom Benutzer empfangen wurde (Schritt 804). Wenn kein Befehl erkannt wird, dann fährt die Steuereinheit damit fort, die Mitteilung zur TTS-Maschine weiterzuleiten, bis das Ende der Mitteilung erreicht ist (Schritt 803). Dann wird das Abspielen beendet.
  • Wenn andererseits die Steuereinheit einen „Zurück"-Eingabebefehl erkennt, fährt sie damit fort, zu ermitteln, ob eine dafür vorgesehene Taste gedrückt wird (Schritt 805). Die Steuereinheit ist so eingerichtet, dass sie das Abspielen von einem früheren Hervorhebungskennzeichen an steuert, wenn das erste Kennzeichen auf dem Weg zurück von der Position zur Zeit des „Zurück"-Befehls sich in der Nähe dieser Position befindet und der Benutzer den weiteren „Zurück"-Befehl innerhalb eines bestimmten Zeitrahmens vom ersten Befehl an eingibt. Dies wird dadurch erreicht, dass die Steuereinheit in Reaktion auf das Erkennen des Drückens der dafür vorgesehenen Taste (Schritt 804) die Zeitdauer zwischen der aktuellen Position und der Position des vorigen Hervorhebungskennzeichens vergleicht (Schritt 805) und dann überprüft, ob die Taste innerhalb einer bestimmten Zeitdauer (z.B. zwei Sekunden nach dem vorigen Tastendruck) erneut gedrückt wird (Schritt 809). Wenn dies der Fall ist, dann bewegt sich die Steuereinheit zur Position des zweiten Hervorhebungskennzeichens auf dem Weg von der aktuellen Position aus zurück (Schritt 810). Alternativ bewegt sich die Steuereinheit, wenn entweder die Zeitdauer zwischen der aktuellen Position und der Position des vorigen Hervorhebungskennzeichens nicht unter dem Schwellenwert liegt (Schritt 806) oder die Taste innerhalb der vorgegebenen Zeitdauer vom ersten Tastendruck an nicht erneut gedrückt wird (Schritt 810), zur Position des vorigen Hervorhebungskennzeichens von der aktuellen Position aus. In beiden Fällen liest die Steuereinheit die Mitteilung vom richtigen Hervorhebungskennzeichen aus aus dem Speicher aus und leitet die Mitteilung von diesem Punkt aus zur Ausgabe zum Eingang der TTS-Maschine weiter (Schritt 808).
  • In Betracht der vorstehenden Beschreibung ist es für den Fachmann ersichtlich, dass innerhalb des Umfangs der Erfindung verschiedene Modifikationen vorgenommen werden können. Zum Beispiel ist die Erfindung, obwohl die Beispiele eine Mobilkommunikationsumgebung zeigen, gleichermaßen auf andere Umgebungen anwendbar. Kurz ausgedrückt kann die Erfindung auf jeden Text/Sprache-Umwandlungsdienst angewendet werden. Ein solcher Fall ist die Anwendung der Erfindung, die auf einem Telco-Service-Server abläuft, der an ein öffentliches Fernsprechwählnetz (PSTN) angeschlossen ist, und auf den unter Verwendung eines Telefons, z.B. eines Mobiltelefons, zugegriffen wird. Die Sprachsynthese könnte dann unter Verwendung von DTMF-Tönen gesteuert werden.

Claims (33)

  1. Tragbare elektronische Vorrichtung, welche das Folgende umfasst: einen Sprachsynthesizer, welcher einen Lautsprecher aufweist, der dafür eingerichtet ist, eine Eingabe in Abhängigkeit von einem hervorgehobenen Text in eine Audio-Ausgabe umzuwandeln, welche einen Menschen verkörpert, der den hervorgehobenen Text mündlich wiedergibt; eine Benutzereingabevorrichtung zur Eingabe von Befehlen, um rückwärts oder vorwärts durch den hervorgehobenen Text zwischen Positionen, die durch Hervorhebungskennzeichen des hervorgehobenen Textes definiert sind, zu einem gewünschten Hervorhebungskennzeichen zu navigieren; und eine Steuereinheit, welche dafür eingerichtet ist, die Navigation zu dem gewünschten Hervorhebungskennzeichen zu regeln und den Sprachsynthesizer in Reaktion auf eingegebene Navigationsbefehle mit einer Eingabe zu versehen, die einem Abschnitt des hervorgehobenen Textes entspricht, welcher an dem gewünschten Hervorhebungskennzeichen beginnt.
  2. Tragbare elektronische Vorrichtung nach Anspruch 1, welche ferner eine Anzeigevorrichtung zur Anzeige des hervorgehobenen Textes umfasst.
  3. Tragbare elektronische Vorrichtung nach Anspruch 1, wobei die Steuereinheit dafür eingerichtet ist, in Reaktion auf eine Eingabe in die Benutzereingabevorrichtung rückwärts zu einer Position zu navigieren, die durch ein vorgegebenes Hervorhebungskennzeichen definiert ist.
  4. Tragbare elektronische Vorrichtung nach Anspruch 3, wobei die Steuereinheit dafür eingerichtet ist, rückwärts zu einer Position zu navigieren, die durch das erste auf dem Weg zurück folgende Hervorhebungskennzeichen definiert ist.
  5. Tragbare elektronische Vorrichtung nach Anspruch 3, wobei die Steuereinheit dafür eingerichtet ist, rückwärts zu einer Position zu navigieren, die durch das zweite auf dem Weg zurück folgende Hervorhebungskennzeichen definiert ist.
  6. Tragbare elektronische Vorrichtung nach einem der Ansprüche 3 bis 5, ferner umfassend Mittel zur Ermittlung der Länge des hervorgehobenen Textes und/oder der Länge der Zeit für die akustische Wiedergabe des hervorgehobenen Textes zwischen der aktuellen Position und der Position, welche durch das erste auf dem Weg zurück folgende Hervorhebungskennzeichen definiert ist, und, wenn die Länge unter einem Schwellenwert liegt, ist die Steuereinheit dafür eingerichtet, rückwärts zu einer Position zu navigieren, welche durch ein zweites auf dem Weg zurück folgendes Hervorhebungskennzeichen definiert ist.
  7. Tragbare elektronische Vorrichtung nach einem der Ansprüche 1 bis 6, wobei die Steuereinheit den Sprachsynthesizer so steuert, dass er eine Audio-Ausgabe des hervorgehobenen Textes zwischen der aktuellen Position und der Position, die durch das vorgegebene Hervorhebungskennzeichen definiert ist, mit einer langsameren Geschwindigkeit als einer Standardgeschwindigkeit liefert.
  8. Tragbare elektronische Vorrichtung nach Anspruch 7, wenn dieser von Anspruch 2 abhängt, wobei die Standardgeschwindigkeit jene der Anzeige des hervorgehobenen Textes auf der Anzeigevorrichtung ist.
  9. Tragbare elektronische Vorrichtung nach Anspruch 7, wobei Die Standardgeschwindigkeit die Standardgeschwindigkeit der Audio-Ausgabe des hervorgehobenen Textes durch den Sprachsynthesizer ist.
  10. Tragbare elektronische Vorrichtung nach Anspruch 1, wobei die Steuereinheit dafür eingerichtet ist, in Reaktion auf eine Eingabe in die Benutzereingabevorrichtung vorwärts zu einer Position zu navigieren, die durch ein vorgegebenes Hervorhebungskennzeichen definiert ist.
  11. Tragbare elektronische Vorrichtung nach Anspruch 10, wobei die Steuereinheit dafür eingerichtet ist, vorwärts zu einer Position zu navigieren, die durch das erste in Vorwärtsrichtung folgende Hervorhebungskennzeichen definiert ist.
  12. Tragbare elektronische Vorrichtung nach Anspruch 10, wobei die Steuereinheit dafür eingerichtet ist, vorwärts zu einer Position zu navigieren, die durch das zweite in Vorwärtsrichtung folgende Hervorhebungskennzeichen definiert ist.
  13. Tragbare elektronische Vorrichtung nach einem der Ansprüche 10 bis 12, ferner umfassend Mittel zur Ermittlung der Länge des hervorgehobenen Textes und/oder der Länge der Zeit für die akustische Wiedergabe des hervorgehobenen Textes zwischen der aktuellen Position und der Position, welche durch das erste in Vorwärtsrichtung folgende Hervorhebungskennzeichen definiert ist, und, wenn die Länge unter einem Schwellenwert liegt, ist die Steuereinheit dafür eingerichtet, vorwärts zu einer Position zu navigieren, welche durch ein zweites in Vorwärtsrichtung folgendes Hervorhebungskennzeichen definiert ist.
  14. Tragbare elektronische Vorrichtung nach einem der vorhergehenden Ansprüche, welche dafür eingerichtet ist, in Reaktion auf einen ersten Befehl vorwärts durch den hervorgehobenen Text zu navigieren und in Reaktion auf einen zweiten Befehl rückwärts durch den hervorgehobenen Text zu navigieren.
  15. Tragbare elektronische Vorrichtung nach einem der vorhergehenden Ansprüche, wobei die Benutzereingabevorrichtung Tastenmittel umfasst.
  16. Tragbare elektronische Vorrichtung nach Anspruch 15, wobei das Tastenmittel eine speziell dafür vorgesehene Navigations-Befehlstaste ist.
  17. Tragbare elektronische Vorrichtung nach Anspruch 16, wobei das Steuermittel dafür eingerichtet ist, die Anzahl der Tastenbetätigungen zu ermitteln und die Position des Hervorhebungskennzeichens zu ermitteln, die zu dieser Anzahl an Tastendrücken gehört.
  18. Tragbare elektronische Vorrichtung nach Anspruch 15, wobei das Tastenmittel eine Multifunktionstaste umfasst und die Steuereinheit die Funktion der Multifunktionstaste steuert.
  19. Tragbare elektronische Vorrichtung nach Anspruch 18, wobei eine Funktion der Multifunktionstaste die Auswahl eines Navigationsbefehls ist.
  20. Tragbare elektronische Vorrichtung nach Anspruch 19, wobei das Steuermittel dafür eingerichtet ist, die Position des Hervorhebungskennzeichens zu ermitteln, welche zu dem Navigationsbefehl gehört, der von der Multifunktionstaste ausgewählt wurde.
  21. Tragbare elektronische Vorrichtung nach Anspruch 19 oder 20, welche dafür eingerichtet ist, dem Benutzer ein Auswahlmenü für Navigationsbefehle bereitzustellen, und dass der Benutzer unter Verwendung der Multifunktionstaste aus dem Menü auswählt.
  22. Tragbare elektronische Vorrichtung nach Anspruch 19 oder 20, welche dafür eingerichtet ist, dass der Benutzer den Navigationsbefehl über die Benutzereingabevorrichtung eingibt.
  23. Tragbare elektronische Vorrichtung nach einem der vorhergehenden Ansprüche, wobei die Benutzereingabevorrichtung eine Spracherkennungsvorrichtung umfasst.
  24. Tragbare elektronische Vorrichtung nach Anspruch 19 oder 20, welche dafür eingerichtet ist, dass der Benutzer den Navigationsbefehl durch einen mündlichen Befehl eingibt.
  25. Tragbare elektronische Vorrichtung nach einem der Ansprüche 18 bis 24, wobei es sich bei dem Befehl um eine Zahl handelt und das Steuermittel dafür eingerichtet ist, die Position des Hervorhebungskennzeichens zu ermitteln, das zu dieser Zahl gehört.
  26. Tragbare elektronische Vorrichtung nach einem der vorhergehenden Ansprüche, wobei die Hervorhebungskennzeichen eines oder mehrere sind, ausgewählt aus Hervorhebungsmarkierungen, Großbuchstaben, Leerstellen, einem Kennsatz aus einer Wortgruppe.
  27. Tragbare elektronische Vorrichtung nach einem der vorhergehenden Ansprüche, wobei die tragbare elektronische Vorrichtung ein Belegleser oder eine tragbare und/oder Hand-Kommunikationsvorrichtung ist.
  28. Tragbare elektronische Vorrichtung nach einem der vorhergehenden Ansprüche, wobei die tragbare elektronische Vorrichtung in einem Automobil angeordnet ist.
  29. Tragbare elektronische Vorrichtung nach Anspruch 28, wobei die Benutzereingabevorrichtung Tastenmittel auf dem Lenkrad umfasst.
  30. Verfahren zum Navigieren durch einen hervorgehobenen Text zu einer gewünschten Position für die Audio-Ausgabe durch einen Sprachsynthesizer, welcher ein Teil einer tragbaren elektronischen Vorrichtung ist, wobei das Verfahren das Folgende umfasst: Erkennen von Befehlen, welche von einem Benutzer eingegeben werden, um vorwärts oder rückwärts durch den hervorgehobenen Text zwischen Positionen, die durch Hervorhebungskennzeichen des hervorgehobenen Textes definiert sind, zu einem gewünschten Hervorhebungskennzeichen zu navigieren; Steuern der Navigation zu dem gewünschten Hervorhebungskennzeichen; und Versorgen des Sprachsynthesizers mit einer Eingabe, welche einem Abschnitt des hervorgehobenen Textes entspricht, beginnend bei dem gewünschten Hervorhebungskennzeichen.
  31. Verfahren gemäß Anspruch 30, wobei das Verfahren ferner das Folgende umfasst: Ermitteln einer gewünschten Startposition in dem hervorgehobenen Text aus einer Auswahl, welche durch Hervorhebungskennzeichen definiert ist, aus einer Befehlseingabe durch einen Benutzer; Bewegen zu der gewünschten Startposition des hervorgehobenen Textes; Ausgeben des sprachsynthetisierten hervorgehobenen Textes von dieser Position an.
  32. In einer tragbaren elektronischen Vorrichtung gespeichertes Computerprogramm zum Navigieren durch hervorgehobenen Text zu einer gewünschten Position für die Audio-Ausgabe durch einen Sprachsynthesizer, welcher ein Teil einer tragbaren elektronischen Vorrichtung ist, wobei das Computerprogramm einen Code umfasst, welcher dafür geeignet ist, die folgenden Schritte durchzuführen, wenn er in einer Datenverarbeitungsvorrichtung ausgeführt wird: Erkennen einer Befehlseingabe durch einen Benutzer, um zwischen Positionen, die durch Hervorhebungskennzeichen des hervorgehobenen Textes definiert sind, zu einem gewünschten Hervorhebungskennzeichen rückwärts oder vorwärts durch den hervorgehobenen Text zu navigieren; Steuern der Navigation zu dem gewünschten Hervorhebungskennzeichen; und Versorgen des Sprachsynthesizers mit einer Eingabe, welche einem Abschnitt des hervorgehobenen Textes entspricht, beginnend bei dem gewünschten Hervorhebungskennzeichen.
  33. Computerprogramm nach Anspruch 32, welches ferner einen Code umfasst, welcher geeignet ist, die folgenden Schritte durchzuführen, wenn er in der Datenverarbeitungsvorrichtung ausgeführt wird: Ermitteln einer gewünschten Startposition in dem hervorgehobenen Text aus einer Auswahl, welche durch Hervorhebungskennzeichen definiert ist, aus einer Befehlseingabe durch einen Benutzer; Bewegen zu der gewünschten Startposition des hervorgehobenen Textes; Ausgeben des sprachsynthetisierten hervorgehobenen Textes von dieser Position an.
DE60033122T 1999-12-30 2000-12-08 Benutzeroberfläche zur Text-zu-Sprache-Umsetzung Expired - Lifetime DE60033122T2 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
GB9930745 1999-12-30
GB9930745A GB2357943B (en) 1999-12-30 1999-12-30 User interface for text to speech conversion

Publications (2)

Publication Number Publication Date
DE60033122D1 DE60033122D1 (de) 2007-03-15
DE60033122T2 true DE60033122T2 (de) 2007-10-11

Family

ID=10867116

Family Applications (1)

Application Number Title Priority Date Filing Date
DE60033122T Expired - Lifetime DE60033122T2 (de) 1999-12-30 2000-12-08 Benutzeroberfläche zur Text-zu-Sprache-Umsetzung

Country Status (4)

Country Link
US (1) US6708152B2 (de)
EP (1) EP1113416B1 (de)
DE (1) DE60033122T2 (de)
GB (1) GB2357943B (de)

Families Citing this family (61)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6931255B2 (en) * 1998-04-29 2005-08-16 Telefonaktiebolaget L M Ericsson (Publ) Mobile terminal with a text-to-speech converter
JP2001358602A (ja) 2000-06-14 2001-12-26 Nec Corp 文字情報受信装置
JP2002140194A (ja) * 2000-10-31 2002-05-17 Toshiba Corp 情報処理方法および情報処理装置およびエージェントシステム
US6978239B2 (en) * 2000-12-04 2005-12-20 Microsoft Corporation Method and apparatus for speech synthesis without prosody modification
US7263488B2 (en) * 2000-12-04 2007-08-28 Microsoft Corporation Method and apparatus for identifying prosodic word boundaries
US7194411B2 (en) * 2001-02-26 2007-03-20 Benjamin Slotznick Method of displaying web pages to enable user access to text information that the user has difficulty reading
US7000189B2 (en) * 2001-03-08 2006-02-14 International Business Mahcines Corporation Dynamic data generation suitable for talking browser
US7035794B2 (en) * 2001-03-30 2006-04-25 Intel Corporation Compressing and using a concatenative speech database in text-to-speech systems
JP3891839B2 (ja) * 2001-12-28 2007-03-14 富士通株式会社 再発信機能付き通信機、およびプログラム
KR20030078191A (ko) * 2002-03-28 2003-10-08 황성연 휴대용 음성출력 장치
US20040203637A1 (en) * 2002-04-30 2004-10-14 Uday Dodla Method and apparatus for remotely accessing three-party calling functions
US20040203613A1 (en) * 2002-06-07 2004-10-14 Nokia Corporation Mobile terminal
GB2389761B (en) * 2002-06-13 2006-04-26 Seiko Epson Corp A semiconductor chip for use in a mobile telephone
EP1431958B1 (de) * 2002-12-16 2018-07-18 Sony Mobile Communications Inc. Gerät enthaltend oder anschliessbar zu einer Vorrichtung zur Erzeugung von Sprachsignalen, und Computerprogramm dafür
US7496498B2 (en) * 2003-03-24 2009-02-24 Microsoft Corporation Front-end architecture for a multi-lingual text-to-speech system
US8229086B2 (en) * 2003-04-01 2012-07-24 Silent Communication Ltd Apparatus, system and method for providing silently selectable audible communication
KR101166930B1 (ko) * 2003-04-22 2012-07-23 스핀복스 리미티드 무선 정보 장치에 음성 메일을 제공하는 방법
US7882434B2 (en) * 2003-06-27 2011-02-01 Benjamin Slotznick User prompting when potentially mistaken actions occur during user interaction with content on a display screen
US20050125236A1 (en) * 2003-12-08 2005-06-09 International Business Machines Corporation Automatic capture of intonation cues in audio segments for speech applications
JP2005250584A (ja) * 2004-03-01 2005-09-15 Sharp Corp 入力装置
US11011153B2 (en) 2004-03-01 2021-05-18 Blackberry Limited Communications system providing automatic text-to-speech conversion features and related methods
US7650170B2 (en) 2004-03-01 2010-01-19 Research In Motion Limited Communications system providing automatic text-to-speech conversion features and related methods
US8538386B2 (en) 2004-03-01 2013-09-17 Blackberry Limited Communications system providing text-to-speech message conversion features using audio filter parameters and related methods
ATE457593T1 (de) * 2004-03-01 2010-02-15 Research In Motion Ltd Mobiles kommunikationsendgerät mit text-zu-sprach umsetzung
US9131062B2 (en) * 2004-06-29 2015-09-08 Kyocera Corporation Mobile terminal device
US20060106618A1 (en) * 2004-10-29 2006-05-18 Microsoft Corporation System and method for converting text to speech
FR2884023B1 (fr) * 2005-03-31 2011-04-22 Erocca Dispositif pour la communication par des personnes handicapees de la parole et/ou de l'ouie
US20060241945A1 (en) * 2005-04-25 2006-10-26 Morales Anthony E Control of settings using a command rotor
JP4805633B2 (ja) * 2005-08-22 2011-11-02 任天堂株式会社 ゲーム用操作装置
US20070078655A1 (en) * 2005-09-30 2007-04-05 Rockwell Automation Technologies, Inc. Report generation system with speech output
US7697827B2 (en) 2005-10-17 2010-04-13 Konicek Jeffrey C User-friendlier interfaces for a camera
US20070211071A1 (en) * 2005-12-20 2007-09-13 Benjamin Slotznick Method and apparatus for interacting with a visually displayed document on a screen reader
GB0601988D0 (en) * 2006-02-01 2006-03-15 Univ Dundee Speech generation
KR100746830B1 (ko) * 2006-05-26 2007-08-07 엘지전자 주식회사 메시지 관리방법 및 이동통신단말기
KR100699050B1 (ko) 2006-06-30 2007-03-28 삼성전자주식회사 문자정보를 음성정보로 출력하는 이동통신 단말기 및 그방법
US9087507B2 (en) * 2006-09-15 2015-07-21 Yahoo! Inc. Aural skimming and scrolling
US20080085696A1 (en) * 2006-10-10 2008-04-10 Salahshour Chad S Emergency communication system utilizing available radio frequencies and telephone lines
JP4973664B2 (ja) * 2006-11-24 2012-07-11 富士通株式会社 文書読上げ装置、文書読上げ装置を制御する制御方法及び文書読上げ装置を制御する制御プログラム
US8494490B2 (en) 2009-05-11 2013-07-23 Silent Communicatin Ltd. Method, circuit, system and application for providing messaging services
US8229409B2 (en) 2007-02-22 2012-07-24 Silent Communication Ltd. System and method for telephone communication
US8713542B2 (en) * 2007-02-27 2014-04-29 Nuance Communications, Inc. Pausing a VoiceXML dialog of a multimodal application
US20090012793A1 (en) * 2007-07-03 2009-01-08 Dao Quyen C Text-to-speech assist for portable communication devices
US20090037170A1 (en) * 2007-07-31 2009-02-05 Willis Joe Williams Method and apparatus for voice communication using abbreviated text messages
US10255609B2 (en) 2008-02-21 2019-04-09 Micronotes, Inc. Interactive marketing system
US20090240567A1 (en) * 2008-02-21 2009-09-24 Micronotes, Llc Interactive marketing system
US8121842B2 (en) 2008-12-12 2012-02-21 Microsoft Corporation Audio output of a document from mobile device
US8280434B2 (en) * 2009-02-27 2012-10-02 Research In Motion Limited Mobile wireless communications device for hearing and/or speech impaired user
US20100332224A1 (en) * 2009-06-30 2010-12-30 Nokia Corporation Method and apparatus for converting text to audio and tactile output
WO2011011225A1 (en) * 2009-07-24 2011-01-27 Dynavox Systems, Llc Methods for enhancing the communication rate of a speech generation device
US20110054880A1 (en) * 2009-09-02 2011-03-03 Apple Inc. External Content Transformation
KR101617461B1 (ko) * 2009-11-17 2016-05-02 엘지전자 주식회사 이동 통신 단말기에서의 티티에스 음성 데이터 출력 방법 및 이를 적용한 이동 통신 단말기
US20110307250A1 (en) * 2010-06-10 2011-12-15 Gm Global Technology Operations, Inc. Modular Speech Recognition Architecture
CN102314874A (zh) * 2010-06-29 2012-01-11 鸿富锦精密工业(深圳)有限公司 文本到语音转换系统与方法
US11170757B2 (en) * 2016-09-30 2021-11-09 T-Mobile Usa, Inc. Systems and methods for improved call handling
JP6907788B2 (ja) * 2017-07-28 2021-07-21 富士フイルムビジネスイノベーション株式会社 情報処理装置及びプログラム
US11093554B2 (en) 2017-09-15 2021-08-17 Kohler Co. Feedback for water consuming appliance
US10887125B2 (en) 2017-09-15 2021-01-05 Kohler Co. Bathroom speaker
US10448762B2 (en) 2017-09-15 2019-10-22 Kohler Co. Mirror
US11314215B2 (en) 2017-09-15 2022-04-26 Kohler Co. Apparatus controlling bathroom appliance lighting based on user identity
US11099540B2 (en) 2017-09-15 2021-08-24 Kohler Co. User identity in household appliances
CN108564953B (zh) * 2018-04-20 2020-11-17 科大讯飞股份有限公司 一种语音识别文本的标点处理方法及装置

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4831654A (en) * 1985-09-09 1989-05-16 Wang Laboratories, Inc. Apparatus for making and editing dictionary entries in a text to speech conversion system
US5500919A (en) * 1992-11-18 1996-03-19 Canon Information Systems, Inc. Graphics user interface for controlling text-to-speech conversion
DE69327774T2 (de) * 1992-11-18 2000-06-21 Canon Information Syst Inc Prozessor zur Umwandlung von Daten in Sprache und Ablaufsteuerung hierzu
CA2119397C (en) * 1993-03-19 2007-10-02 Kim E.A. Silverman Improved automated voice synthesis employing enhanced prosodic treatment of text, spelling of text and rate of annunciation
US6442523B1 (en) * 1994-07-22 2002-08-27 Steven H. Siegel Method for the auditory navigation of text
WO1997037344A1 (fr) * 1996-03-29 1997-10-09 Hitachi, Ltd. Terminal possedant une fonction de synthese vocale et systeme dispensant des donnees caracteres utilisant ce terminal
US5850629A (en) * 1996-09-09 1998-12-15 Matsushita Electric Industrial Co., Ltd. User interface controller for text-to-speech synthesizer
US6108629A (en) * 1997-04-25 2000-08-22 At&T Corp. Method and apparatus for voice interaction over a network using an information flow controller
US20020002458A1 (en) * 1997-10-22 2002-01-03 David E. Owen System and method for representing complex information auditorially
US6353661B1 (en) * 1997-12-18 2002-03-05 Bailey, Iii John Edson Network and communication access systems
US6356819B1 (en) * 1998-04-20 2002-03-12 Trimble Navigation Limited Safety system for guidance control system
US6246983B1 (en) * 1998-08-05 2001-06-12 Matsushita Electric Corporation Of America Text-to-speech e-mail reader with multi-modal reply processor
ATE247325T1 (de) * 1998-09-30 2003-08-15 Lernout & Hauspie Speechprod Sprachgesteuerte navigation für einen elektronischen post leser
US6085161A (en) * 1998-10-21 2000-07-04 Sonicon, Inc. System and method for auditorially representing pages of HTML data
US6462732B2 (en) * 1999-07-28 2002-10-08 Michael Mehr Hand un-inhibiting cursor control device

Also Published As

Publication number Publication date
EP1113416B1 (de) 2007-01-24
DE60033122D1 (de) 2007-03-15
GB2357943A (en) 2001-07-04
GB2357943B (en) 2004-12-08
US6708152B2 (en) 2004-03-16
EP1113416A3 (de) 2001-08-16
US20010014860A1 (en) 2001-08-16
GB9930745D0 (en) 2000-02-16
EP1113416A2 (de) 2001-07-04

Similar Documents

Publication Publication Date Title
DE60033122T2 (de) Benutzeroberfläche zur Text-zu-Sprache-Umsetzung
DE602004012071T2 (de) Multimedia- und textnachrichten mit sprache-zu-text-hilfe
EP1603291B1 (de) Informationsübertragungssystem und -verfahren
DE4436175B4 (de) Vorrichtung zum Fernzugreifen auf einen Computer ausgehend von einem Telefonhandapparat
US5884256A (en) Networked stenographic system with real-time speech to text conversion for down-line display and annotation
DE60031552T2 (de) Vorrichtung und verfahren zur intuitiven navigation auf eine tastatur mit tonrückführung für ein schnurloses kommunikationsgerät
US7715882B2 (en) Mobile terminal apparatus, character input method and character input program
DE112014006409T5 (de) Fahrzeugsteuervorrichtung und Fahrzeugsteuerverfahren
US20070239446A1 (en) Down-line Transcription System Using Automatic Tracking And Revenue Collection
DE10338512A1 (de) Unterstützungsverfahren für Sprachdialoge zur Bedienung von Kraftfahrzeugfunktionen
US20040176139A1 (en) Method and wireless communication device using voice recognition for entering text characters
DE102012210986B4 (de) System mit einer Mobilkommunikationsvorrichtung und einem Fahrzeugstereosystem und Verfahren zum Betrieb des Systems
DE10327943B4 (de) Unterschiedliche Zahlenleseweisen zulassendes Spracherkennungssystem
US20070094280A1 (en) Mobile communication terminal
DE102004021454A1 (de) Verfahren und Vorrichtung für einen akustischen Zugang zu einem Anwendungsrechner
WO1997037344A1 (fr) Terminal possedant une fonction de synthese vocale et systeme dispensant des donnees caracteres utilisant ce terminal
DE69910412T2 (de) Sprachgesteuerte navigation für einen elektronischen post leser
US6931263B1 (en) Voice activated text strings for electronic devices
JPH08180022A (ja) 情報記憶変換装置
EP1359566A1 (de) Verfahren und Anordnung zur sprachbasierten Nutzung von Speichersystemen sowie ein entsprechendes Computerprogramm und ein entsprechendes computerlesbares Speichermedium
DE3545447A1 (de) System zur integration eines personalcomputers oder eines aehnlichen rechners in ein fahrzeug zur benutzung als fahrbares buero
US20050119888A1 (en) Information processing apparatus and method, and program
EP1692610A2 (de) Verfahren und einrichtung zum transcribieren eines audiosignals
CN1749932A (zh) 移动通信终端机的常用句子输入方法
EP1882351B1 (de) Betrieb eines in einem telekommunikationsnetz nutzbaren endqerätes

Legal Events

Date Code Title Description
8364 No opposition during term of opposition
R082 Change of representative

Ref document number: 1113416

Country of ref document: EP

Representative=s name: COHAUSZ & FLORACK PATENT- UND RECHTSANWAELTE PARTN

R081 Change of applicant/patentee

Ref document number: 1113416

Country of ref document: EP

Owner name: CORE WIRELESS LICENSING S.A.R.L., LU

Free format text: FORMER OWNER: NOKIA CORP., ESPOO, FI

Effective date: 20120215

R082 Change of representative

Ref document number: 1113416

Country of ref document: EP

Representative=s name: TBK, 80336 MUENCHEN, DE

R082 Change of representative

Ref document number: 1113416

Country of ref document: EP

Representative=s name: TBK, 80336 MUENCHEN, DE