DE60033122T2 - Benutzeroberfläche zur Text-zu-Sprache-Umsetzung - Google Patents
Benutzeroberfläche zur Text-zu-Sprache-Umsetzung Download PDFInfo
- Publication number
- DE60033122T2 DE60033122T2 DE60033122T DE60033122T DE60033122T2 DE 60033122 T2 DE60033122 T2 DE 60033122T2 DE 60033122 T DE60033122 T DE 60033122T DE 60033122 T DE60033122 T DE 60033122T DE 60033122 T2 DE60033122 T2 DE 60033122T2
- Authority
- DE
- Germany
- Prior art keywords
- electronic device
- portable electronic
- highlighting
- text
- highlighted text
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000006243 chemical reaction Methods 0.000 title description 13
- 238000000034 method Methods 0.000 claims description 11
- 230000004044 response Effects 0.000 claims description 11
- 238000004891 communication Methods 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims description 5
- 230000001419 dependent effect Effects 0.000 claims 1
- 230000015572 biosynthetic process Effects 0.000 description 10
- 230000006870 function Effects 0.000 description 10
- 238000003786 synthesis reaction Methods 0.000 description 10
- 210000001072 colon Anatomy 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000005096 rolling process Methods 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
- G10L13/04—Details of speech synthesis systems, e.g. synthesiser structure or memory management
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/72—Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
- H04M1/724—User interfaces specially adapted for cordless or mobile telephones
- H04M1/72403—User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
- H04M1/7243—User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages
Landscapes
- Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Multimedia (AREA)
- Business, Economics & Management (AREA)
- General Business, Economics & Management (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Telephone Function (AREA)
- Mobile Radio Communication Systems (AREA)
- Document Processing Apparatus (AREA)
Description
- Die vorliegende Erfindung betrifft eine Benutzerschnittstelle für eine Vorrichtung, welche eine Text/Sprache-Umwandlungssynthese ermöglicht.
- Die Synthese der menschlichen Sprache unter Verwendung elektronischer Vorrichtungen ist eine gut entwickelte und veröffentlichte Technologie, und es sind verschiedene kommerzielle Produkte erhältlich. Typische Sprachsyntheseprogramme wandeln geschriebene Eingaben in Sprachausgaben um, indem sie automatisch eine künstliche Sprache erzeugen, die Sprachsynthese wird deswegen häufig als „Text/Sprache"-Umwandlung („Text-to-Speech", TTS) bezeichnet.
- Es gibt verschiedene Probleme bei der Sprachsynthese, welche bislang noch nicht in zufriedenstellender Weise gelöst worden sind. Ein Problem ist die Schwierigkeit des Verstehens der künstlichen Sprache durch einen Benutzer. Dieses Problem kann sich in mobilen elektronischen Vorrichtungen wie Mobiltelefonen oder Personenrufempfängern verschlimmern, welche begrenzte Verarbeitungsressourcen aufweisen können.
- WO 97/37344 offenbart ein Endgerät, welches die Funktion aufweist, einen Text anzuzeigen, und eine Funktion, ihn laut vorzulesen, und welches automatisch von einer Hervorhebungsmarke an vorliest, die einer Position am nächsten ist, auf welche der Benutzer gezeigt hat. Ferner offenbart EP-1 116 217 ein Text/Sprache-Umwandlungssystem, welches gemäß Art. 54 Abs. 3 EPÜ relevant ist, wobei ein Benutzer basierend auf Markierungen in dem Text zwischen Sätzen, Absätzen oder Abschnitten navigieren kann.
- Es wäre wünschenswert, den Grad des Verständnisses der Sprachausgabe aus solchen Sprachsynthesesystemen für einen Benutzer zu verbessern.
- Gemäß einer Erscheinungsform der vorliegenden Erfindung wird eine tragbare elektronische Vorrichtung bereitgestellt, welche einen Sprachsynthesizer umfasst, der einen Lautsprecher aufweist, der dafür eingerichtet ist, eine Eingabe in Abhängigkeit von einem hervorgehobenen Text in eine Audio-Ausgabe umzuwandeln, welche einen Menschen verkörpert, der den hervorgehobenen Text mündlich wiedergibt; eine Benutzereingabevorrichtung zur Eingabe von Befehlen, um rückwärts oder vorwärts durch hervorgehobenen Text zwischen Positionen, die durch Hervorhebungskennzeichen des hervorgehobenen Textes definiert sind, zu einem gewünschten Hervorhebungskennzeichen zu navigieren; und eine Steuereinheit, welche dafür eingerichtet ist, die Navigation zu dem gewünschten Hervorhebungskennzeichen zu regeln und den Sprachsynthesizer in Reaktion auf eingegebene Navigationsbefehle mit einer Eingabe zu versehen, die einem Abschnitt des hervorgehobenen Textes entspricht, welcher an dem gewünschten Hervorhebungskennzeichen beginnt.
- Eine solche tragbare elektronische Vorrichtung stellt für den Benutzer ein Mittel zum Navigieren durch den Text bereit, wodurch gewünschte Abschnitte dafür ausgewählt werden, durch den Sprachsynthesizer akustisch ausgegeben zu werden. Ferner werden die Textabschnitte logisch aufgeteilt, da die Navigation zwischen Hervorhebungskennzeichen stattfindet, was dem Benutzer ermöglicht, einzelne Wörter einfacher in den Zusammenhang zu bringen. Somit wird die Verständlichkeit der Audio-Ausgabe durch den Benutzer verbessert.
- Bei den Hervorhebungskennzeichen kann es sich um in dem Text bereitgestellte Hervorhebungsmarkierungen und/oder um andere Markierungen handeln. Die elektronische Vorrichtung kann Hervorhebungskennzeichen benutzen, welche den Beginn von Sätzen kennzeichnen, wie z.B. einen Punkt, ein Ausrufungszeichen, ein Fragezeichen, einen Großbuchstaben, aufeinander folgende Leerstellen. Alternativ kann es sich bei den Hervorhebungskennzeichen um Markierungen wie z.B. ein Komma, einen Doppelpunkt, ein Semikolon oder einen Gedankenstrich handeln, welche ebenfalls benutzt werden, um Wörter in einem Text in logische Einheiten zu trennen. Ebenso kann der eingegebene Text spezielle Buchstaben für diesen Zweck enthalten. Der Ersteller des Textes kann zum Beispiel spezielle Buchstaben benutzen, um Wörter zu markieren, welche schwierig sein können und daher wiederholt werden müssen, wenn er Verständnisprobleme vorhersieht.
- Die tragbare elektronische Vorrichtung kann eine Anzeigevorrichtung zum Darstellen eines Textabschnitts umfassen, welchen der Benutzer heranziehen kann, um sein Verständnis der Audio-Ausgabe abzusichern.
- Die tragbare elektronische Vorrichtung kann so eingerichtet sein, dass sie rückwärts durch den Text navigiert und dadurch eine Funktion zur Wiederholung eines Abschnitts des Textes bereitstellt. Die tragbare elektronische Vorrichtung kann auf einen Befehl „Wiederholen" oder „Zurück", welcher durch einen Benutzer eingegeben wird, reagieren, indem die Steuereinheit rückwärts zu einer Position navigiert, welche durch ein vorgegebenes Hervorhebungskennzeichen definiert wird, um den Abschnitt des hervorgehobenen Textes von dieser Position an zu wiederholen.
- Bei dem vorgegebenen Hervorhebungskennzeichen kann es sich um das erste auf dem Weg zurück folgende Hervorhebungskennzeichen oder alternativ um ein zweites oder weiteres auf dem Weg zurück folgendes Hervorhebungskennzeichen handeln. Die Navigation hängt jedoch vorzugsweise davon ab, wie schnell nach der Audio-Ausgabe, welche dem ersten auf dem Weg zurück folgenden Hervorhebungskennzeichen entspricht, der Wiederholungsbefehl gegeben wird. Gemäß einer solchen Ausführungsform kann die tragbare elektronische Vorrichtung dies basierend auf der Länge des hervorgehobenen Textes und/oder der Länge der Zeit für die akustische Wiedergabe des hervorgehobenen Textes zwischen der aktuellen Position und der Position, welche durch das erste auf dem Weg zurück folgende Hervorhebungskennzeichen definiert ist, ermitteln. Wenn die Länge unter einem Schwellenwert liegt (zum Beispiel fünf Wörter oder zwei Sekunden), ist die Steuereinheit dafür eingerichtet, rückwärts zu einer Position zu navigieren, welche durch ein zweites auf dem Weg zurück folgendes Hervorhebungskennzeichen definiert ist.
- Der Sprachsynthesizer kann den hervorgehobenen Text langsamer als in einer Standardgeschwindigkeit wiederholen. Dies bietet den Vorteil, dass die Verständlichkeit der wiederholten synthetisierten Sprache weiter verbessert wird. Wenn die tragbare elektronische Vorrichtung eine Anzeigevorrichtung umfasst, kann die Standardgeschwindigkeit diejenige der Anzeige des hervorgehobenen Textes auf der Anzeigevorrichtung sein. Alternativ kann die Standardgeschwindigkeit die normale Geschwindigkeit der Ausgabe durch den Sprachsynthesizer sein.
- Alternativ oder zusätzlich zur Rückwärtsnavigation kann die tragbare elektronische Vorrichtung so eingerichtet sein, dass sie vorwärts durch den Text navigiert. Auf diese Weise kann sie vorwärts über einen Abschnitt des Textes hinweg springen. Die tragbare elektronische Vorrichtung reagiert auf einen Befehl „Weiter" oder „Überspringen", welcher durch einen Benutzer eingegeben wird, indem die Steuereinheit vorwärts zu einer Position navigiert, welche durch ein vorgegebenes Hervorhebungskennzeichen definiert wird, um den Abschnitt des Textes zwischen der aktuellen Position und dieser Position zu überspringen. Mit anderen Worten springt sie, um eine Audio-Ausgabe von der Position an bereitzustellen, welche durch dieses vorgegebene Hervorhebungskennzeichen definiert wird.
- Bei dem vorgegebenen Hervorhebungskennzeichen kann es sich um das erste Hervorhebungskennzeichen in Vorwärtsrichtung oder alternativ um ein zweites oder weiteres Hervorhebungskennzeichen in Vorwärtsrichtung handeln. Vorzugsweise hängt die Navigation jedoch davon ab, wie bald die Audio-Ausgabe, welche dem nächsten Hervorhebungskennzeichen entspricht, ohne den „Überspringen"-Befehl durchgeführt würde. Gemäß einer solchen Ausführungsform kann die tragbare elektronische Vorrichtung dies basierend auf der Länge des hervorgehobenen Textes und/oder der Länge der Zeit für die akustische Wiedergabe des hervorgehobenen Textes zwischen der aktuellen Position und der Position, welche durch das erste in Vorwärtsrichtung folgende Hervorhebungskennzeichen definiert ist, ermitteln. Wenn die Länge unter einem Schwellenwert liegt, ist die Steuereinheit dafür eingerichtet, vorwärts zu einer Position zu navigieren, welche durch ein zweites in Vorwärtsrichtung folgendes Hervorhebungskennzeichen definiert ist.
- Es gibt eine Anzahl von Wegen, wie ein Benutzer seine Befehle eingeben kann. In einer Ausführungsform kann der Benutzer die Befehle über eine Benutzereingabe eingeben, welche ein Tastenmittel umfasst. Bei dem Tastenmittel kann es sich um eine dafür vorgesehene Befehlsvorrichtung handeln. Wenn die Vorrichtung eine Vorwärts- und Rückwärtsnavigation ermöglicht, dann kann sie getrennte dafür vorgesehene Navigationsbefehlsvorrichtungen umfassen, also eine für die Vorwärtsnavigation und eine für die Rückwärtsnavigation.
- Die Steuerungsmittel können die Anzahl der Betätigungen der Vorrichtung ermitteln und die Position des Hervorhebungskennzeichens ermitteln, welches zu dieser Anzahl von Betätigungen gehört. Zum Beispiel kann das zweifache Drücken der dafür vorgesehenen Taste, die zu einem Rückwärtsnavigationsbefehl gehört, bewirken, dass die Vorrichtung zu einer Position des Hervorhebungskennzeichen um zwei zurück navigiert.
- Alternativ kann die Position des Hervorhebungskennzeichens durch die Länge der Zeit bestimmt werden, wie lange die dafür vorgesehene Taste gedrückt wird.
- Alternativ können die Tastenmittel eine Multifunktionstaste umfassen. Eine Funktion dieser Taste ist die Auswahl eines Navigationsbefehls. Der Navigationsbefehl selbst kann von dem Benutzer, der ihn eingibt, oder über einen Auswahlpunkt eines Menüs bereitgestellt werden. In jedem Fall wird die Multifunktionstaste benutzt, um den Navigationsbefehl auszuwählen.
- Statt des Tastenmittels oder zusätzlich zu diesem kann die Benutzereingabevorrichtung eine Spracherkennungsvorrichtung umfassen. Eine solche Spracherkennungsvorrichtung stellt die Navigationsbefehle typischerweise mittels eines Sprachbefehls bereit.
- Bei der tragbaren elektronischen Vorrichtung kann es sich um einen Belegleser, eine tragbare Kommunikationsvorrichtung, eine Hand-Kommunikationsvorrichtung oder Ähnliches handeln.
- Die tragbare elektronische Vorrichtung kann ferner Mittel zur Befestigung in einem Fahrzeug umfassen.
- Diese tragbaren elektronischen Vorrichtungen können in einem Automobil bereitgestellt werden. Wenn dies zutrifft, und wenn die tragbare elektronische Vorrichtung Tastenmittel umfasst, werden diese vorzugsweise auf dem Lenkrad des Automobils bereitgestellt.
- Gemäß noch einer anderen Erscheinungsform der vorliegenden Erfindung wird ein Verfahren zum Navigieren durch hervorgehobenen Text zu einer gewünschten Position für die Audio-Ausgabe durch einen Sprachsynthesizer bereitgestellt, welcher ein Teil einer tragbaren elektronischen Vorrichtung ist, wobei das Verfahren das Erkennen von Befehlen umfasst, welche von einem Benutzer eingegeben werden, um rückwärts oder vorwärts durch den hervorgehobenen Text zwischen Positionen, die durch Hervorhebungskennzeichen des hervorgehobenen Textes definiert sind, zu einem gewünschten Hervorhebungskennzeichen zu navigieren; das Steuern der Navigation zu dem gewünschten Hervorhebungskennzeichen; und das Versorgen des Sprachsynthesizers mit einer Eingabe, welche einem Abschnitt des hervorgehobenen Textes entspricht, beginnend bei dem gewünschten Hervorhebungskennzeichen.
- In einer Ausführungsform umfasst das Verfahren ferner das Ermitteln einer gewünschten Startposition in dem hervorgehobenen Text aus einer Auswahl, welche durch Hervorhebungskennzeichen definiert ist, aus einer Befehlseingabe durch einen Benutzer; das Bewegen zu der gewünschten Startposition des hervorgehobenen Textes; das Ausgeben des sprachsynthetisierten hervorgehobenen Textes von dieser Position an.
- Gemäß noch einer anderen Erscheinungsform der vorliegenden Erfindung wird ein in einer tragbaren elektronischen Vorrichtung gespeichertes Computerprogramm zum Navigieren durch hervorgehobenen Text zu einer gewünschten Position für die Audio-Ausgabe durch einen Sprachsynthesizer bereitgestellt, welcher ein Teil einer tragbaren elektronischen Vorrichtung ist, wobei das Computerprogramm einen Code umfasst, welcher dafür geeignet ist, die folgenden Schritte durchzuführen, wenn er in einer Datenverarbeitungsvorrichtung ausgeführt wird: Erkennen einer Befehlseingabe durch einen Benutzer, um zwischen Positionen, die durch Hervorhebungskennzeichen des hervorgehobenen Textes definiert sind, zu einem gewünschten Hervorhebungskennzeichen rückwärts oder vorwärts durch den hervorgehobenen Text zu navigieren; Steuern der Navigation zu dem gewünschten Hervorhebungskennzeichen; und Versorgen des Sprachsynthesizers mit einer Eingabe, welche einem Abschnitt des hervorgehobenen Textes entspricht, beginnend bei dem gewünschten Hervorhebungskennzeichen.
- Es werden nun beispielhaft Ausführungsformen der vorliegenden Erfindung unter Bezugnahme auf die begleitenden Zeichnungen beschrieben, von denen:
-
1 eine elektronische Vorrichtung mit einer Benutzerschnittstelle veranschaulicht, welche eine Eingabevorrichtung und Lautsprecher aufweist; -
2 eine schematische Darstellung der Komponenten der in1 dargestellten elektronischen Vorrichtung ist; -
3 ein Mobiltelefon gemäß einer Ausführungsform der vorliegenden Erfindung ist; -
4 eine schematische Darstellung der Komponenten des in3 dargestellten Mobiltelefons ist; -
5a und5b die Auswahl von Navigationsbefehlen gemäß einer Ausführungsform der vorliegenden Erfindung veranschaulichen; -
6 die Navigation durch Text und die darauf folgende Ausgabe ausgewählter Abschnitte des Textes veranschaulicht; -
7 verschiedene Verfahren der Eingabe eines „Wiederholen"-Befehls veranschaulicht; -
8 ein Verfahren des Wiederholens eines Textes gemäß einer bevorzugten Ausführungsform der Erfindung veranschaulicht; und -
9a und9b beispielhafte Datenbänke zur Steuerung der Navigation veranschaulichen. -
1 veranschaulicht eine elektronische Vorrichtung2 . Die elektronische Vorrichtung weist eine Eingabevorrichtung4 und eine Ausgabevorrichtung6 auf. Die Eingabevorrichtung umfasst ein Mikrofon3 zum Empfang einer Audio-Ausgabe und eine taktile Eingabevorrichtung5 . Bei der Ausgabe6 handelt es sich um einen Lautsprecher6 , welcher benutzt wird, um die synthetisierte Sprache einem Benutzer zu übermitteln. - Die Eingabeeinheit kann Befehle vom Benutzer empfangen, welcher die Auswahl der synthetisierten Sprache steuert, die durch den Lautsprecher
6 ausgegeben werden soll. Dies kann entweder mittels einer taktilen Eingabe und/oder eines Sprachbefehls durchgeführt werden. Zum Beispiel kann der Benutzer, der einen Teil der Sprachausgabe durch den Lautsprecher6 nicht gehört hat, der Einheit2 den Befehl erteilen, diesen Teil zu wiederholen, wodurch das Verständnis des Benutzers verbessert wird. Die taktile Eingabevorrichtung5 kann auch benutzt werden, um einen Text einzugeben, welcher durch den Lautsprecher6 als synthetisierte Sprache verbreitet werden kann. - Bei der elektronischen Vorrichtung kann es sich um irgendeine Vorrichtung handeln, welche eine Audio-Schnittstelle erfordert. Es kann sich um einen Computer handeln (z.B. einen Personal Computer, PC), einen persönlichen digitalen Assistenten (PDA), eine Funkkommunikationsvorrichtung, wie z.B. ein Mobiltelefon, z.B. ein Autotelefon oder ein Handtelefon, ein Computersystem, einen Belegleser, wie z.B. eine Web-Suchmaschine, ein Text-Fernsehgerät, ein Fax, eine Dokumenten-Suchmaschine zum Lesen von Büchern, Emails oder anderen Dokumenten dieser Art.
- Obwohl die Eingabevorrichtung
4 und der Lautsprecher6 in1 so dargestellt sind, dass sie in einer einzelnen Einheit integriert sind, können sie auch getrennt sein, dasselbe gilt für das Mikrofon3 und die Texteingabevorrichtung5 der Eingabevorrichtung4 . -
2 ist eine schematische Darstellung der elektronischen Vorrichtung2 . Die Vorrichtung2 weist außer der Eingabevorrichtung4 und dem Lautsprecher6 einen Prozessor12 auf, welcher in Reaktion auf Benutzereingabebefehle26 den Lautsprecher steuert und auf einen Speicher10 zugreift. Der Speicher10 speichert Textdaten24 , welche durch eine Eingabe4 zugeführt werden. Der Prozessor12 ist als zwei funktionelle Blöcke dargestellt – eine Steuereinheit14 und eine Text/Sprache-Umwandlungsmaschine16 . Die Steuereinheit14 und die Text/Sprache-Umwandlungsmaschine16 können als Software realisiert werden, welche auf dem Prozessor12 abläuft. - Die Text/Sprache-Umwandlungsmaschine
16 steuert den Lautsprecher6 . Sie empfängt die Texteingabe18 von der Steuereinheit und wandelt die Texteingabe in eine künstliche Sprachausgabe22 um, welche durch den Lautsprecher6 in Schallwellen überführt wird. Bei der Sprachausgabe kann es sich zum Beispiel um eine bestimmte Anzahl von Wörtern zu einer Zeit, einen Ausdruck zu einer Zeit oder einen Satz zu einer Zeit handeln. - Die Steuereinheit
14 liest den Speicher10 aus und steuert die Text/Sprache-Umwandlungsmaschine16 . Die Steuereinheit, die aus dem Speicher Textdaten ausgelesen hat, stellt diese als Eingabe18 in die Text/Sprache-Umwandlungsmaschine16 bereit. - Der Speicher
10 speichert Textdaten, welche von der Steuereinheit14 ausgelesen werden. Die Steuereinheit14 verwendet die Textdaten, um die Eingabe18 in die Text/Sprache-Umwandlungsmaschine16 zu erzeugen. Die Textdaten werden im Speicher10 durch die Eingabevorrichtung30 gespeichert. Die Eingabevorrichtung weist in diesem Beispiel ein Mikrofon3 , ein Tastenmittel5 (z.B. eine Taste, einen Berührungsbildschirm, einen Joystick usw.) oder einen Funk-Transceiver zum Empfangen von Textdaten in Form von SMS-Mitteilungen oder Emails auf. - Die Steuereinheit
14 navigiert in Reaktion auf die vom Benutzer über die Eingabe4 empfangenen Befehle26 ebenfalls durch die Textdaten, so dass der Lautsprecher die gewünschte Sprache ausgibt. Es kann zum Beispiel vorwärts navigiert werden, um Text zu überspringen, oder rückwärts, um Text zu wiederholen. Die Navigation wird derart durchgeführt, dass der Text durch den Lautsprecher16 in logischen Einheiten verbreitet wird. Dies wird erreicht, indem die Steuereinheit den Text, den sie aus dem Speicher10 erhält, lexikalisch untergliedert. Das lexikalische Untergliedern beinhaltet die Verwendung von Hervorhebungskennzeichen innerhalb des Textes, um Abschnitte des Textes in logische Einheiten zu trennen. Beispiele für Hervorhebungskennzeichen sind jene, welche ein Ende des Satzes anzeigen, wie z.B. ein Punkt, ein Ausrufungszeichen, ein Fragezeichen, ein Großbuchstabe, aufeinander folgende Leerstellen, ein Komma und andere Kennzeichen, welche eine logische Pause innerhalb des Satzes anzeigen, wie z.B. das Komma, ein Doppelpunkt, ein Semikolon oder ein Gedankenstrich. Alternativ kann ein Hervorhebungskennzeichen verwendet werden, welches ein Ende einer Gruppe einer vorgegebenen Anzahl von Wörtern anzeigt. Der Abschnitt des Textes zwischen den Kennzeichen wird einer zur Zeit zu der TTS-Maschine16 gesendet. Die Steuereinheit erhält die Datenbank aufrecht, um eine Steuerung der Navigation zu ermöglichen. Beispiele sind in9a und9b der begleitenden Zeichnungen dargestellt. - In
9a untergliedert die Steuereinheit den Text zu Gruppen von fünf Wörtern. Dies ist zum Beispiel nützlich, wo der Text nur sehr wenige oder keine Satzzeichen enthält. In diesem Fall gruppiert die Steuereinheit die Wörter, indem sie Leerstellen innerhalb des Textes erkennt und diese zählt. Dies kann zum Beispiel ausgeführt werden, indem nach dem ASCII-Code für eine Leerstelle gesucht wird. Die Datenbank weist einen Eintrag für jedes der 18 Wörter in dem Ausdruck auf. Jeder Eintrag weist zwei Felder auf. In das erste Feld91 wird die Zählung der Leerstellen aufgenommen, die von 1 bis 5 anwächst. In das zweite Feld92 wird aufgenommen, zu welcher Textgruppe der Worteintrag gehört, basierend auf der Zählung im ersten Feld91 , wobei beide ein Textgruppenkennzeichen speichern, welches für jede Gruppe von fünf Wörtern unterschiedlich ist. In9a sind vier unterschiedliche Textgruppen dargestellt, welche die Gruppenkennzeichen 1, 2, 3 und 4 aufweisen. Die Gruppe 1 umfasst die Wörter „Hallo Fred, Vielen Dank für". Die Gruppe 2 umfasst die Wörter „deine Nachricht, ich freue mich". Die Gruppe 3 umfasst die Wörter „darauf, dich um 2 am". Die Gruppe 4 umfasst die Wörter „Donnerstag zu sehen". - Im Betrieb leitet die Steuereinheit
14 die Gruppe 1 zur TTS16 weiter, als nächstes die Gruppe 2, dann die Gruppe 3 und schließlich die Gruppe 4. Während dieser Zeit verfolgt die Steuereinheit14 , welche Gruppe erfolgreich als künstliche Sprache ausgegeben worden ist. Sie kann dies tun, indem sie die Anzahl der Gruppenkennzeichen speichert, die an die TTS18 weitergeleitet wurden. Wenn die Steuereinheit den Befehl des Benutzers empfängt, dann navigiert die Steuereinheit durch den Text zu einer gewünschten Position und leitet die zugehörige Textgruppe zur TTS-Maschine16 weiter. Wenn die TTS-Maschine zum Beispiel eine künstliche Sprache ausgibt, die zur Gruppe 3 gehört, und der Benutzer den „Zurück"-Befehl eingibt, dann bewirkt das Steuersignal26 , dass die Steuereinheit durch den Text zurück zum Beginn der letzten Identifizierungsgruppe navigiert, die ausgegeben (oder zur TTS weitergeleitet) werden soll, und diese Gruppe zur Umwandlung und Ausgabe durch den Lautsprecher6 erneut zur TTS-Maschine16 sendet. Unter der Annahme, dass aktuell die Gruppe 3 ausgegeben wird, navigiert die Steuereinheit14 dann zum Beispiel in Reaktion auf ein „Zurück"-Steuersignal26 aus der Eingabe4 zurück durch den Text zum Beginn der Gruppe 3 zu dem Wort „darauf" und leitet die Textgruppe3 zur Ausgabe durch den Lautsprecher6 als künstliche Sprache erneut zur TTS-Maschine16 weiter. Unter der Annahme, dass keine weiteren Befehle vom Benutzer empfangen werden, leitet dann die Steuereinheit14 planmäßig die Textgruppe4 zur TTS-Maschine weiter, sobald der Text der Gruppe 3 ausgegeben wurde. Die Steuereinheit14 kann so eingerichtet sein, dass sie sich in Reaktion auf einen „Zurück"-Befehl zwei Gruppen zurück bewegt. Dies kann zum Beispiel dann der Fall sein, wenn ein Befehl empfangen wird, wenn der Beginn einer Textgruppe ausgegeben wird, zum Beispiel wenn das erste und zweite Wort einer Gruppe ausgegeben wird. Wenn also zum Beispiel das Wort „darauf" der Gruppe 3 ausgegeben wird, wenn die Steuereinheit den „Zurück"-Befehl26 empfängt, dann kann die Steuereinheit zurück zum Beginn der Gruppe 2 navigieren und diese Gruppe zur Ausgabe zur TTS weiterleiten. - Alternativ kann der wiederholte Text durch die Zeitdauer, seitdem die letzte Gruppe zur TTS-Maschine gesendet wurde, bis zum Empfang des „Zurück"-Befehls ermittelt werden, oder durch eine spezielle Benutzereingabe, z.B. dadurch, dass zwei Signale innerhalb einer vorgegebenen Zeitperiode empfangen werden. Diese Alternativen werden unten noch weiter erklärt.
- In ähnlicher Weise navigiert die Steuereinheit
14 , wenn ein „Weiter"-Befehl empfangen wird, durch den Text und leitet die nächste Gruppe zur Sprachausgabe durch den Lautsprecher6 zur TTS-Maschine weiter. Wenn zum Beispiel aktuell die Gruppe 2 als künstliche Sprache ausgegeben wird und der Benutzer einen „Weiter"-Befehl eingibt, dann bewirkt das Steuersignal26 , dass die Steuereinheit vorwärts durch den Text zum Beginn der nächsten Gruppe navigiert, die ausgegeben werden soll, namentlich Gruppe 3, und diese Gruppe zur Umwandlung in künstliche Sprache zur Ausgabe durch den Lautsprecher6 zur TTS-Maschine sendet. Dadurch wird der Rest des Textes der Gruppe 2, der noch nicht durch den Lautsprecher ausgegeben worden ist, übersprungen. Alternativ kann die Steuereinheit, wenn das Ende der Gruppe 2 ausgegeben wird (zum Beispiel die Wörter „freue" oder „mich"), wenn ein „Weiter"-Befehl empfangen wird, dann die dritte Gruppe überspringen und die vierte Gruppe zur Umwandlung in Sprache zur Ausgabe durch den Lautsprecher6 zur TTS-Maschine weiterleiten. -
3 veranschaulicht einen Funk-Handapparat gemäß einer Ausführungsform der vorliegenden Erfindung. Der Handapparat, welcher allgemein mit 30 beziffert ist, umfasst die Benutzerschnittstelle, welche ein Tastenfeld32 , eine Anzeigevorrichtung33 , einen Ein-/Aus-Schalter34 , einen Lautsprecher35 und ein Mikrofon36 aufweist. Der Handapparat30 gemäß dieser Ausführungsform ist für die Kommunikation über ein Funktelekommunikationsnetz, z.B. ein Zellularnetz, geeignet. Ein Handapparat könnte jedoch alternativ auch für ein schnurloses Telefon ausgestaltet sein. Das Tastenfeld32 weist eine erste Gruppe von Tasten37 auf, bei welchen es sich um alphanumerische Tasten handelt und mittels welcher der Benutzer Daten eingeben kann. Zum Beispiel kann der Benutzer unter Benutzung dieser Tasten37 eine Telefonnummer eingeben, eine Textmitteilung (z.B. SMS) schreiben, einen (zu einer Telefonnummer gehörigen) Namen schreiben usw. Jede der 12 alphanumerischen Tasten ist jeweils mit einer Figur „0" bis „9" oder „#" oder „*" versehen. Im Alpha-Modus sind jeder Taste ein oder mehrere Buchstaben und spezielle Zeichen zugeordnet, welche bei der Texterstellung verwendet werden. Das Tastenfeld32 umfasst außerdem zwei Dialogtasten38a und39a , zwei Anruftasten39 und eine Navigationstaste31 . - Die beiden Dialogtasten
38 weisen eine Funktionalität auf, welche dem entspricht, was von einer Anzahl von Handapparaten, wie z.B. dem Nokia 2110TM, dem Nokia 6110TM und dem Nokia 8110TM, bekannt ist. Die Funktionalität der Dialogtaste hängt vom Status des Handapparates und der Navigation im Menü zum Beispiel unter Verwendung der Navigationstaste ab. Die aktuelle Funktionalität der Dialogtaste38a und38b ist in eigenen Feldern dafür auf der Anzeigevorrichtung33 direkt über den Tasten38 dargestellt. - Die beiden Anruftasten
39 können benutzt werden, um einen Anruf oder eine Konferenzverbindung aufzubauen, einen Anruf zu beenden oder einen eingehenden Anruf zurückzuweisen. - Die Navigationstaste
31 ist in dieser Ausführungsform eine Taste zum Blättern im Menü nach oben und unten. Es können jedoch auch andere Tasten statt dieser Navigationstaste und/oder den Dialogtasten verwendet werden, wie z.B. eine Rollvorrichtung oder Ähnliches. -
4 ist ein Blockdiagramm eines Teils des Handapparates der3 , welches das Verständnis der vorliegenden Erfindung erleichtert. Wie es in einem Funk-Handapparat üblich ist, umfasst er ein Sprach-Schaltungssystem in der Form von Benutzerschnittstellen-Vorrichtungen (Mikrofon36 und Lautsprecher35 ), einen Audio-Teil44 , einen Transceiver49 und eine Steuereinheit48 . Das Mikrofon36 wandelt Sprach-Audiosignale in entsprechende Analogsignale um, welche wiederum durch einen (nicht dargestellten) A/D-Wandler von analog in digital umgewandelt werden. Der Audio-Teil44 codiert dann das Signal und leitet das codierte Signal unter Steuerung der Steuereinheit48 zur Ausgabe an das Kommunikationsnetz zum Transceiver49 weiter. - In der umgekehrten Situation wird ein codiertes Sprachsignal, welches von einem Transceiver
49 empfangen wird, wieder unter Steuerung der Steuereinheit48 durch den Audio-Teil decodiert. Diesmal wird das decodierte digitale Signal durch einen (nicht dargestellten) D/A-Wandler in ein analoges umgewandelt und durch den Lautsprecher35 ausgegeben. - Die Steuereinheit
48 bildet auch eine Schnittstelle mit Peripherieeinheiten, wie z.B. dem Speicher47 , welcher einen RAM-Speicher47a und einen Flash-ROM-Speicher47b aufweist, einer SIM-Karte46 , einer Anzeigevorrichtung33 und einem Tastenfeld32 (ebenso wie Daten, Stromversorgung usw.). - In dieser Ausführungsform umfasst der Audio-Teil
44 auch eine TTS-Maschine, welche zusammen mit der Steuereinheit48 einen Prozessor bildet, wie in der Ausführungsform der1 . In der Vorrichtung30 wird die Text-Sprachsynthese in sehr ähnlicher Weise gehandhabt, wie sie in Verbindung mit den entsprechenden Teilen in2 beschrieben wurde. - Der Text kann durch den Benutzer über die Tastatur
32 und/oder das Mikrofon36 oder über den Empfang aus dem Kommunikationsnetz durch den Transceiver49 eingegeben werden. Die empfangenen Textdaten werden im Speicher (RAM47a ) gespeichert. Die Steuereinheit liest den Speicher aus und steuert die TTS-Maschine dementsprechend. Die Steuereinheit navigiert auch in Reaktion auf Befehle, die sie vom Benutzer über eines oder mehrere aus dem Mikrofon36 , der Tastatur36 und den Navigations- und Auswahltasten45 empfängt, derart durch den Text, dass der Lautsprecher35 die gewünschte Sprache in logischen Einheiten ausgibt. - In dieser Ausführungsform stellt der Handapparat den Text auch auf der Anzeigevorrichtung
33 dar, ebenso wie er Text oder Sprache ausgibt. Demnach ist der Prozessor dafür verantwortlich, den Treiber der Anzeigevorrichtung so zu steuern, dass er die Anzeigevorrichtung dazu führt, den richtigen Text anzuzeigen. Wenn sie den Speicher47a ausliest und die TTS-Maschine steuert, steuert die Steuereinheit14 auch die Anzeigevorrichtung. Nachdem sie die Textdaten aus dem Speicher ausgelesen hat, stellt die Steuereinheit sie in dieser Ausführungsform als Eingabe in die TTS-Maschine bereit und steuert den Treiber der Anzeigevorrichtung dahin, dass die in den Steuersignalen431 verwendeten Textdaten angezeigt werden. Der angezeigte Text entspricht dem Text, welcher durch die TTS-Maschine umgewandelt wurde. Dies ist auch der Fall, wenn ein Navigationsbefehl vom Benutzer empfangen wird. Die für die Steuerung der Navigation verwendete Datenbank wird allgemein für den Zweck der Textausgabe verwendet, und wenn ein Text in der Anzeigevorrichtung gewünscht ist, wird die Datenbank gleichzeitig mit der Steuerung der TTS-Maschine auch bei der Steuerung der Anzeigevorrichtung verwendet. Mit anderen Worten wird zum Beispiel in der Datenbank der9a , wenn die Steuereinheit eine Textgruppe zur TTS-Maschine sendet, diese Textgruppe zur Darstellung auf der Anzeigevorrichtung auch zum Treiber der Anzeigevorrichtung gesendet. - Ein Handapparat wie derjenige in
3 weist im Allgemeinen einen Bereich von Menüfunktionen auf. Das Nokia 6110 kann zum Beispiel die folgenden Menüfunktionen aufweisen: - 1. Mitteilungen
- 2. Anrufregister
- 3. Profile
- 4. Einstellungen
- 5. Rufumleitung
- 6. Spiele
- 7. Taschenrechner
- 8. Kalender
- Um auf die Menüs zuzugreifen, kann der Benutzer unter Verwendung der Navigations- und Auswahltaste
45 oder unter Verwendung geeigneter vordefinierten Kurzzugangstasten durch die Funktionen blättern. Im Allgemeinen ermöglicht die linke Dialogtaste38a dem Benutzer, durch Untermenüs zu navigieren und Optionen auszuwählen, während die rechte Dialogtaste38b dem Benutzer ermöglicht, in der Menühierarchie zurück nach oben zu gelangen. Die Navigationstaste31 kann benutzt werden, um vor der Auswahl unter Verwendung der linken Dialogtaste38a in einem bestimmten Menü/Untermenü durch die Optionsliste zu navigieren. - Das Mitteilungsmenü kann Funktionen aufweisen, welche sich auf Textmitteilungen (wie z.B. SMS), Sprachmitteilungen, Fax- und Datenverbindungen sowie auf Dienstbefehle aus den Mitteilungen des Netzinformationsdienstes beziehen. Eine typische Funktionsliste kann die folgende sein:
- 1-1 Eingangsordner
- 1-2 Ausgangsordner
- 1-3 Mitteilungen schreiben
- 1-4 Mitteilungs-Einstellungen
- 1-5 Informationsdienst
- 1-6 Fax- oder Datenverbindung
- 1-7 Dienstbefehl-Editor
- In der vorliegenden Erfindung weist der Handapparat eine Einstellung für Text-Sprachsynthese auf. Diese Einstellung kann vordefiniert sein, oder es kann sich um ein Profil handeln, welches vom Benutzer ausgewählt werden kann. Wenn die Einstellung „Ein" lautet, dann kann die Mitteilungsfunktion des Eingangsordners für den Benutzer die Optionen umfassen, eine empfangene Textmitteilung abzuhören usw.
5a veranschaulicht, wie ein Benutzer eine Mitteilung auswählen kann, die im Eingangsordner der Mitteilungen gespeichert ist, und diese abhören kann, während5b veranschaulicht, wie durch die Mitteilung navigiert wird. - In dieser Ausführungsform werden die Menüauswahlpunkte einer zur Zeit angezeigt. Das Mitteilungsmenü ist der erste Auswahlpunkt und wird auf der Anzeigevorrichtung dargestellt (Phase
501 ). Der Benutzer kann diesen Auswahlpunkt auswählen, indem er die linke Dialogtaste38a drückt, die zu der angezeigten „Auswahl"-Funktion gehört. Alternativ kann der Benutzer, wenn dieser Auswahlpunkt nicht gewünscht wird, die rechte Dialogtaste benutzen, um zurück zum Hauptmenü zu gelangen, oder die Navigationstaste, um zu einem anderen auszuwählenden Auswahlpunkt zu blättern, z.B. Anrufeinstellungen. - Wenn der Auswahlpunkt „Mitteilungen" ausgewählt wird, wird der erste Auswahlpunkt im ersten Untermenü angezeigt, namentlich Eingangsordner (Phase
502 ). Wenn der Benutzer diesen Auswahlpunkt auswählt, indem er die linke Dialogtaste38a drückt, werden in dieser Ausführungsform die letzten drei Textmitteilungen angezeigt, wobei die letzte empfangene Mitteilung in einer Liste von Auswahlpunkten zuerst dargestellt wird (Phase503 ). Diese letzte empfangene Mitteilung ist der Standard-Auswahlpunkt, welcher ausgewählt wird, wenn die linke Dialogtaste38a gedrückt wird. Dieser Standard-Auswahlpunkt kann angezeigt werden, indem er auf der Anzeigevorrichtung hervorgehoben wird. Wenn der Benutzer wünscht, eine der anderen Mitteilungen zu lesen, kann er unter Verwendung der Navigationstaste zu diesen navigieren. wenn einmal eine Mitteilung ausgewählt worden ist, hat der Benutzer die Wahl, die ausgewählte Mitteilung abzuhören oder zu lesen. (Beim Auswahlpunkt „Abhören" kann es sich in Abhängigkeit von der Konfiguration des Handapparates um das bloße Abhören oder um Abhören und Lesen handeln. „Abhören" ist der Standard-Auswahlpunkt. Dieser kann durch Drücken der linken Dialogtaste38a oder der Alpha-Taste „1" ausgewählt werden. Alternativ kann in einer bevorzugten Ausführungsform der Auswahlpunkt „Abhören" nach einer bestimmten Zeitdauer, zum Beispiel zwei Sekunden, ohne eine Benutzereingabe automatisch ausgewählt werden. In der Ausführungsform der5a ist der Handapparat so konfiguriert, dass er die ausgewählte Mitteilung abspielt und anzeigt, wenn der Auswahlpunkt „Abhören" ausgewählt wird (Phase505 ). - In Abhängigkeit vom Status des Handapparates ist in Bezug auf die ausgewählte Mitteilung eine Anzahl weiterer Auswahlpunkte verfügbar.
- Wenn wie in Phase
504 der Auswahlpunkt „Abhören" ausgewählt wird, dann sind die verfügbaren Auswahlpunkte während des Abspielens der Mitteilung die Auswahlpunkte „Vorwärts"- und „Rückwärts-Navigation", wie in Bezug auf5b weiter beschrieben. Wenn das Abspielen der Mitteilung einmal ohne weitere Benutzereingabe für eine vorgegebene Zeitdauer beendet ist, verändern sich die Auswahlpunkte in herkömmliche Textmitteilungs-Auswahlpunkte, wie z.B. Löschen, Beantworten, Bearbeiten, Verwenden der Nummer, Weiterleiten, Drucken über IR, Einzelheiten usw. (Phase506 ). - Wenn der Auswahlpunkt „Lesen" ausgewählt wird, dann sind dieselben Auswahlpunkte verfügbar, unabhängig davon, ob die gesamte Mitteilung auf der Anzeigevorrichtung für den Benutzer zum Lesen dargestellt wird.
-
5b veranschaulicht nun den Empfang einer eingehenden Mitteilung (statt auf eine zuvor empfangene zuzugreifen, wie in Phase503 der5a ). - Wenn über den Transceiver
49 eine Mitteilung aus dem Kommunikationsnetz empfangen wird, sendet die Steuereinheit ein Steuersignal an den Treiber der Anzeigevorrichtung, dass die Anzeigevorrichtung einen Menüauswahlpunkt darstellt, wie in Phase507 dargestellt. Wenn der Benutzer wünscht, auf eine Mitteilung zuzugreifen, während der Handapparat sich in diesem Status befindet, dann wird die linke Dialogtaste38a gedrückt. Durch Drücken der rechten Dialogtaste andererseits wird dieses Menü verlassen, und die gespeicherten Mitteilungen können später über die in5a dargestellten Phasen angesehen/abgehört werden. - In der Ausführungsform der
5b erhält man Zugriff auf die empfangene Mitteilung, wenn die linke Dialogtaste gedrückt wird. Der Benutzer hat dann die Wahl, die Mitteilung abzuhören oder zu lesen (Phase508 ). In dieser speziellen Ausführungsform ist der Handapparat so konfiguriert, dass er die Mitteilung nur abspielt, wenn der Auswahlpunkt „Abhören" ausgewählt wird (durch Drücken der linken Dialogtaste oder der alphanumerischen Taste „1"), und danach werden die verfügbaren Navigationsmöglichkeiten auf der Anzeigevorrichtung dargestellt (Phase509 ). Die in dieser Ausführungsform verfügbaren Navigationsmöglichkeiten sind die Auswahlpunkte „Zurück" und „Weiter", wobei der Auswahlpunkt „Zurück" der Standard ist. Der Auswahlpunkt „Zurück" kann ausgewählt werden, indem die Dialogtaste oder die alphanumerische Taste „1" gedrückt wird, oder alternativ automatisch, wenn für eine vorgegebene Zeitdauer keine Benutzereingabe vorgenommen wurde. Der Auswahlpunkt „Weiter" andererseits kann ausgewählt werden, indem unter Verwendung der Navigationstaste einmal nach unten geblättert wird und dann unter Verwendung der linken Dialogtaste38a oder schneller durch Drücken der alphanumerischen Taste „2" gewählt wird. Wenn einer der Auswahlpunkte ausgewählt wird, dann wird in dieser Ausführungsform eine Auswahl von Zurück/Weiter-Schritten angeboten (Phase510 ). - In diesem Fall sind die Sprünge 1, 2 oder 3 verfügbar, und der gewünschte Sprung kann unter Verwendung der richtigen alphanumerischen Taste oder der Dialogtaste ausgewählt werden, geeignetenfalls nach der Dialogtaste. Der Sprung um eine Position zurück oder nach vorn ist der Standard und kann automatisch ausgewählt werden, wenn der Benutzer innerhalb einer vorgegebenen Zeitdauer keine Eingabe vornimmt. Die Zahlen 1 bis 3 stehen für die Anzahl von Sprüngen zwischen Hervorhebungskennzeichen in der gewählten Richtung, wie es zum Beispiel oben in Bezug auf die
9a und9b beschrieben ist. - Wie oben erwähnt handelt es sich in der Ausführungsform der
5b bei dem Auswahlpunkt „Abhören" um das bloße Abhören, und somit werden, wenn einmal der Auswahlpunkt „Abhören" ausgewählt ist (Phase508 ), die Auswahlmöglichkeiten „Zurück" und „Weiter" auf der Anzeigevorrichtung dargestellt (Phase509 ). Im Gegensatz dazu handelt es sich in der Ausführungsform der5a bei dem Auswahlpunkt „Abhören" um das Abhören und Lesen (Abspielen und Anzeigen), und somit wird, wenn einmal der Auswahlpunkt „Abhören" ausgewählt ist (Phase508 ), die Mitteilung auf der Anzeigevorrichtung dargestellt (Phase505 ). - In der Situation der
5a können, wenn der Benutzer den Auswahlpunkt „Abhören" auswählt, unter Verwendung der linken Dialogtaste38a , um auf der Anzeigevorrichtung Navigationsmöglichkeiten anzuzeigen, „Auswahlpunkte" ausgewählt werden (wie in Phase509 der Ausführungsform der5b ). In ähnlicher Weise kann eine Auswahl aus diesen Auswahlpunkten in derselben Weise wie für die Navigationsmöglichkeit der Ausführungsform der5b (Phase509 ) und für die Anzahl der Schritte, 1, 2 oder 3, wie in Phase510 vorgenommen werden. - Alternativ können, wenn die Mitteilung abgespielt wird, Kurzzugangstasten oder die alphanumerischen Tasten 1 und 2 gedrückt werden, um automatisch die gewünschte Navigationsmöglichkeit auszuwählen. Wenn einmal eine Navigationsmöglichkeit ausgewählt ist, wird die Auswahl der Anzahl der „Zurück/Weiter"-Schritte wie in Phase
510 der Ausführungsform der5b für den Benutzer dargestellt. -
6 veranschaulicht die Navigation durch den Text und die darauf folgende Ausgabe von ausgewählten Abschnitten des Textes. Gemäß dieser Ausführungsform ermittelt die Steuereinheit48 , ob der Benutzer die Möglichkeit des Abhörens der Mitteilungen ausgewählt hat (Schritt601 ). Wenn dies der Fall ist, liest die Steuereinheit48 die Textdaten aus dem Speicher47 aus und steuert die TTS-Maschine dahin, die gespeicherte Mitteilung über den Lautsprecher35 abzuspielen (Schritt602 ). Während die Mitteilung abgespielt wird, überprüft die Steuereinheit, ob irgendwelche Eingabebefehle vom Benutzer vorliegen (Schritt604 ). Wenn kein Befehl erkannt wird, dann fährt die Steuereinheit damit fort, die Mitteilung zur TTS-Maschine weiterzuleiten, bis das Ende der Mitteilung erreicht ist (Schritt603 ), dann wird das Abspielen beendet. Wenn andererseits die Steuereinheit die Eingabe eines Befehls erkennt, ermittelt sie die Art des Befehls. In dieser Ausführungsform erkennt die Steuereinheit zuerst, ob es sich bei dem Befehl um einen „Zurück"-Befehl handelt. Wenn ja, dann ermittelt die Steuereinheit die Position, zu welcher sie sich zurückbewegen muss (Schritt606 ), bewegt sich zu dieser Position (Schritt607 ), und die TTS-Maschine spielt die Mitteilung von dieser Position an ab (Schritt608 ). Zum Beispiel identifiziert die Steuereinheit ein Hervorhebungskennzeichen, liest die Mitteilung, die im Speicher gespeichert ist, von diesem Kennzeichen an aus und leitet diesen Teil der Mitteilung zum erneuten Abspielen zum Eingang der TTS-Maschine weiter. - Wenn es sich bei dem Befehl nicht um einen „Zurück"-Befehl handelt, dann ermittelt die Steuereinheit, ob es sich bei dem Befehl um einen „Weiter"-Befehl handelt (Schritt
609 ). Wenn ja, dann ermittelt die Steuereinheit die Position, zu welcher sie sich nach vorn bewegen muss (Schritt610 ), bewegt sich zu dieser Position (Schritt607 ), und die TTS-Maschine spielt die Mitteilung von dieser Position an ab (Schritt608 ). Zum Beispiel identifiziert die Steuereinheit das Hervorhebungskennzeichen, springt zu dem Teil der Mitteilung im Speicher von diesem Hervorhebungskennzeichen an und leitet ihn zur Sprachausgabe zum Eingang der TTS-Maschine weiter. -
7 veranschaulicht verschiedene Verfahren der Eingabe eines Wiederholungsbefehls. Die Steuereinheit48 ermittelt, ob der Benutzer die Möglichkeit des Abhörens der Mitteilungen ausgewählt hat (Schritt701 ). Wenn dies der Fall ist, liest die Steuereinheit48 die Textdaten aus dem Speicher47 aus und steuert die TTS-Maschine dahin, die gespeicherte Mitteilung über den Lautsprecher35 abzuspielen (Schritt702 ). Während die Mitteilung abgespielt wird, überprüft die Steuereinheit, ob ein „Zurück"-Eingabebefehl vom Benutzer empfangen wurde (Schritt704 ). Wenn kein Befehl erkannt wird, dann fährt die Steuereinheit damit fort, die Mitteilung zur TTS- Maschine weiterzuleiten, bis das Ende der Mitteilung erreicht ist (Schritt703 ). Dann wird das Abspielen beendet. - Wenn andererseits die Steuereinheit einen „Zurück"-Eingabebefehl erkennt, fährt sie damit fort, den Punkt zu ermitteln, von welchem aus die Mitteilung wiederholt werden soll. Im Ablaufdiagramm der
7 sind vier Alternativen dargestellt. Diese sind in diesem Ablaufdiagramm als Kette von Schritten dargestellt, man wird jedoch erkennen, dass ein Handapparat möglicherweise auch nur irgendeinen oder irgendeine Kombination dieser verwirklicht. - Erstens ermittelt die Steuereinheit, ob eine dafür vorgesehene Taste gedrückt wird (Schritt
705 ). Wenn ja, fährt sie damit fort, zu ermitteln, wie viele Tastendrücke (N) der Benutzer vorgenommen hat (Schritt706 ), und ermittelt die Position des N-ten Hervorhebungskennzeichens auf dem Weg zurück. Wenn der Benutzer die vorgesehene Taste zum Beispiel zweimal drückt, dann ermittelt die Steuereinheit die Position des zweiten Hervorhebungskennzeichens auf dem Weg zurück von der aktuellen Position aus. - Zweitens ermittelt die Steuereinheit, ob eine Funktionstaste gedrückt wird, welche einem Eingabebefehl entspricht. Wenn ja, dann ermittelt sie, wie viele Rückwärtsschritte ausgewählt wurden (S) (Schritt
711 ), und ermittelt die Position des S-ten Hervorhebungskennzeichens auf dem Weg zurück (Schritt712 ). Zum Beispiel kann die Steuereinheit die Auswahl einer bestimmten Anzahl von Schritten (S) unter Verwendung der Navigationstaste31 und der linken Dialogtaste38 identifizieren, wie es oben in Bezug auf Phase510 der5(c) beschrieben ist. - Drittens kann die Steuereinheit ermitteln, ob nach der Eingabe eines „Zurück"-Befehls eine alphanumerische Taste gedrückt wird (Schritt
720 ), und wenn dies der Fall ist, ermittelt sie die Ziffer (D), die zu dem Tastendruck gehört (Schritt721 ), und ermittelt die Position des D-ten Hervorhebungskennzeichens auf dem Weg zurück (722 ). - Zum Beispiel kann die Steuereinheit das Drücken der alphanumerischen Taste „1" erkennen und auf dieser Basis die Position des letzten Hervorhebungskennzeichens ermitteln.
- Viertens kann die Steuereinheit ermitteln, ob ein Sprachbefehl eingegeben wird (Schritt
730 ), und wenn dies der Fall ist, ermittelt die Steuereinheit, wie viele Rückwärtsschritte (R) angefordert wurden (731 ), und ermittelt somit die Position des R-ten Hervorhebungskennzeichens auf dem Weg zurück. Dies kann unter Anwendung einer herkömmlichen Spracherkennungstechnologie erreicht werden. - Wenn die gewünschte Position einmal ermittelt worden ist, bewegt sich die Steuereinheit zurück zu dieser Position (Schritt
708 ), und die TTS-Maschine spielt die Mitteilung von dieser Position aus ab (Schritt709 ). -
8 veranschaulicht ein Verfahren der Wiederholung von Text gemäß einer bevorzugten Ausführungsform der vorliegenden Erfindung. - Die Steuereinheit
48 ermittelt, ob der Benutzer die Möglichkeit des Abhörens der Mitteilungen ausgewählt hat (Schritt801 ). Wenn dies der Fall ist, liest die Steuereinheit48 die Textdaten aus dem Speicher47 aus und steuert die TTS-Maschine dahin, die gespeicherte Mitteilung abzuspielen (Schritt802 ). Während die Mitteilung abgespielt wird, überprüft die Steuereinheit, ob ein „Zurück"-Befehl vom Benutzer empfangen wurde (Schritt804 ). Wenn kein Befehl erkannt wird, dann fährt die Steuereinheit damit fort, die Mitteilung zur TTS-Maschine weiterzuleiten, bis das Ende der Mitteilung erreicht ist (Schritt803 ). Dann wird das Abspielen beendet. - Wenn andererseits die Steuereinheit einen „Zurück"-Eingabebefehl erkennt, fährt sie damit fort, zu ermitteln, ob eine dafür vorgesehene Taste gedrückt wird (Schritt
805 ). Die Steuereinheit ist so eingerichtet, dass sie das Abspielen von einem früheren Hervorhebungskennzeichen an steuert, wenn das erste Kennzeichen auf dem Weg zurück von der Position zur Zeit des „Zurück"-Befehls sich in der Nähe dieser Position befindet und der Benutzer den weiteren „Zurück"-Befehl innerhalb eines bestimmten Zeitrahmens vom ersten Befehl an eingibt. Dies wird dadurch erreicht, dass die Steuereinheit in Reaktion auf das Erkennen des Drückens der dafür vorgesehenen Taste (Schritt804 ) die Zeitdauer zwischen der aktuellen Position und der Position des vorigen Hervorhebungskennzeichens vergleicht (Schritt805 ) und dann überprüft, ob die Taste innerhalb einer bestimmten Zeitdauer (z.B. zwei Sekunden nach dem vorigen Tastendruck) erneut gedrückt wird (Schritt809 ). Wenn dies der Fall ist, dann bewegt sich die Steuereinheit zur Position des zweiten Hervorhebungskennzeichens auf dem Weg von der aktuellen Position aus zurück (Schritt810 ). Alternativ bewegt sich die Steuereinheit, wenn entweder die Zeitdauer zwischen der aktuellen Position und der Position des vorigen Hervorhebungskennzeichens nicht unter dem Schwellenwert liegt (Schritt806 ) oder die Taste innerhalb der vorgegebenen Zeitdauer vom ersten Tastendruck an nicht erneut gedrückt wird (Schritt810 ), zur Position des vorigen Hervorhebungskennzeichens von der aktuellen Position aus. In beiden Fällen liest die Steuereinheit die Mitteilung vom richtigen Hervorhebungskennzeichen aus aus dem Speicher aus und leitet die Mitteilung von diesem Punkt aus zur Ausgabe zum Eingang der TTS-Maschine weiter (Schritt808 ). - In Betracht der vorstehenden Beschreibung ist es für den Fachmann ersichtlich, dass innerhalb des Umfangs der Erfindung verschiedene Modifikationen vorgenommen werden können. Zum Beispiel ist die Erfindung, obwohl die Beispiele eine Mobilkommunikationsumgebung zeigen, gleichermaßen auf andere Umgebungen anwendbar. Kurz ausgedrückt kann die Erfindung auf jeden Text/Sprache-Umwandlungsdienst angewendet werden. Ein solcher Fall ist die Anwendung der Erfindung, die auf einem Telco-Service-Server abläuft, der an ein öffentliches Fernsprechwählnetz (PSTN) angeschlossen ist, und auf den unter Verwendung eines Telefons, z.B. eines Mobiltelefons, zugegriffen wird. Die Sprachsynthese könnte dann unter Verwendung von DTMF-Tönen gesteuert werden.
Claims (33)
- Tragbare elektronische Vorrichtung, welche das Folgende umfasst: einen Sprachsynthesizer, welcher einen Lautsprecher aufweist, der dafür eingerichtet ist, eine Eingabe in Abhängigkeit von einem hervorgehobenen Text in eine Audio-Ausgabe umzuwandeln, welche einen Menschen verkörpert, der den hervorgehobenen Text mündlich wiedergibt; eine Benutzereingabevorrichtung zur Eingabe von Befehlen, um rückwärts oder vorwärts durch den hervorgehobenen Text zwischen Positionen, die durch Hervorhebungskennzeichen des hervorgehobenen Textes definiert sind, zu einem gewünschten Hervorhebungskennzeichen zu navigieren; und eine Steuereinheit, welche dafür eingerichtet ist, die Navigation zu dem gewünschten Hervorhebungskennzeichen zu regeln und den Sprachsynthesizer in Reaktion auf eingegebene Navigationsbefehle mit einer Eingabe zu versehen, die einem Abschnitt des hervorgehobenen Textes entspricht, welcher an dem gewünschten Hervorhebungskennzeichen beginnt.
- Tragbare elektronische Vorrichtung nach Anspruch 1, welche ferner eine Anzeigevorrichtung zur Anzeige des hervorgehobenen Textes umfasst.
- Tragbare elektronische Vorrichtung nach Anspruch 1, wobei die Steuereinheit dafür eingerichtet ist, in Reaktion auf eine Eingabe in die Benutzereingabevorrichtung rückwärts zu einer Position zu navigieren, die durch ein vorgegebenes Hervorhebungskennzeichen definiert ist.
- Tragbare elektronische Vorrichtung nach Anspruch 3, wobei die Steuereinheit dafür eingerichtet ist, rückwärts zu einer Position zu navigieren, die durch das erste auf dem Weg zurück folgende Hervorhebungskennzeichen definiert ist.
- Tragbare elektronische Vorrichtung nach Anspruch 3, wobei die Steuereinheit dafür eingerichtet ist, rückwärts zu einer Position zu navigieren, die durch das zweite auf dem Weg zurück folgende Hervorhebungskennzeichen definiert ist.
- Tragbare elektronische Vorrichtung nach einem der Ansprüche 3 bis 5, ferner umfassend Mittel zur Ermittlung der Länge des hervorgehobenen Textes und/oder der Länge der Zeit für die akustische Wiedergabe des hervorgehobenen Textes zwischen der aktuellen Position und der Position, welche durch das erste auf dem Weg zurück folgende Hervorhebungskennzeichen definiert ist, und, wenn die Länge unter einem Schwellenwert liegt, ist die Steuereinheit dafür eingerichtet, rückwärts zu einer Position zu navigieren, welche durch ein zweites auf dem Weg zurück folgendes Hervorhebungskennzeichen definiert ist.
- Tragbare elektronische Vorrichtung nach einem der Ansprüche 1 bis 6, wobei die Steuereinheit den Sprachsynthesizer so steuert, dass er eine Audio-Ausgabe des hervorgehobenen Textes zwischen der aktuellen Position und der Position, die durch das vorgegebene Hervorhebungskennzeichen definiert ist, mit einer langsameren Geschwindigkeit als einer Standardgeschwindigkeit liefert.
- Tragbare elektronische Vorrichtung nach Anspruch 7, wenn dieser von Anspruch 2 abhängt, wobei die Standardgeschwindigkeit jene der Anzeige des hervorgehobenen Textes auf der Anzeigevorrichtung ist.
- Tragbare elektronische Vorrichtung nach Anspruch 7, wobei Die Standardgeschwindigkeit die Standardgeschwindigkeit der Audio-Ausgabe des hervorgehobenen Textes durch den Sprachsynthesizer ist.
- Tragbare elektronische Vorrichtung nach Anspruch 1, wobei die Steuereinheit dafür eingerichtet ist, in Reaktion auf eine Eingabe in die Benutzereingabevorrichtung vorwärts zu einer Position zu navigieren, die durch ein vorgegebenes Hervorhebungskennzeichen definiert ist.
- Tragbare elektronische Vorrichtung nach Anspruch 10, wobei die Steuereinheit dafür eingerichtet ist, vorwärts zu einer Position zu navigieren, die durch das erste in Vorwärtsrichtung folgende Hervorhebungskennzeichen definiert ist.
- Tragbare elektronische Vorrichtung nach Anspruch 10, wobei die Steuereinheit dafür eingerichtet ist, vorwärts zu einer Position zu navigieren, die durch das zweite in Vorwärtsrichtung folgende Hervorhebungskennzeichen definiert ist.
- Tragbare elektronische Vorrichtung nach einem der Ansprüche 10 bis 12, ferner umfassend Mittel zur Ermittlung der Länge des hervorgehobenen Textes und/oder der Länge der Zeit für die akustische Wiedergabe des hervorgehobenen Textes zwischen der aktuellen Position und der Position, welche durch das erste in Vorwärtsrichtung folgende Hervorhebungskennzeichen definiert ist, und, wenn die Länge unter einem Schwellenwert liegt, ist die Steuereinheit dafür eingerichtet, vorwärts zu einer Position zu navigieren, welche durch ein zweites in Vorwärtsrichtung folgendes Hervorhebungskennzeichen definiert ist.
- Tragbare elektronische Vorrichtung nach einem der vorhergehenden Ansprüche, welche dafür eingerichtet ist, in Reaktion auf einen ersten Befehl vorwärts durch den hervorgehobenen Text zu navigieren und in Reaktion auf einen zweiten Befehl rückwärts durch den hervorgehobenen Text zu navigieren.
- Tragbare elektronische Vorrichtung nach einem der vorhergehenden Ansprüche, wobei die Benutzereingabevorrichtung Tastenmittel umfasst.
- Tragbare elektronische Vorrichtung nach Anspruch 15, wobei das Tastenmittel eine speziell dafür vorgesehene Navigations-Befehlstaste ist.
- Tragbare elektronische Vorrichtung nach Anspruch 16, wobei das Steuermittel dafür eingerichtet ist, die Anzahl der Tastenbetätigungen zu ermitteln und die Position des Hervorhebungskennzeichens zu ermitteln, die zu dieser Anzahl an Tastendrücken gehört.
- Tragbare elektronische Vorrichtung nach Anspruch 15, wobei das Tastenmittel eine Multifunktionstaste umfasst und die Steuereinheit die Funktion der Multifunktionstaste steuert.
- Tragbare elektronische Vorrichtung nach Anspruch 18, wobei eine Funktion der Multifunktionstaste die Auswahl eines Navigationsbefehls ist.
- Tragbare elektronische Vorrichtung nach Anspruch 19, wobei das Steuermittel dafür eingerichtet ist, die Position des Hervorhebungskennzeichens zu ermitteln, welche zu dem Navigationsbefehl gehört, der von der Multifunktionstaste ausgewählt wurde.
- Tragbare elektronische Vorrichtung nach Anspruch 19 oder 20, welche dafür eingerichtet ist, dem Benutzer ein Auswahlmenü für Navigationsbefehle bereitzustellen, und dass der Benutzer unter Verwendung der Multifunktionstaste aus dem Menü auswählt.
- Tragbare elektronische Vorrichtung nach Anspruch 19 oder 20, welche dafür eingerichtet ist, dass der Benutzer den Navigationsbefehl über die Benutzereingabevorrichtung eingibt.
- Tragbare elektronische Vorrichtung nach einem der vorhergehenden Ansprüche, wobei die Benutzereingabevorrichtung eine Spracherkennungsvorrichtung umfasst.
- Tragbare elektronische Vorrichtung nach Anspruch 19 oder 20, welche dafür eingerichtet ist, dass der Benutzer den Navigationsbefehl durch einen mündlichen Befehl eingibt.
- Tragbare elektronische Vorrichtung nach einem der Ansprüche 18 bis 24, wobei es sich bei dem Befehl um eine Zahl handelt und das Steuermittel dafür eingerichtet ist, die Position des Hervorhebungskennzeichens zu ermitteln, das zu dieser Zahl gehört.
- Tragbare elektronische Vorrichtung nach einem der vorhergehenden Ansprüche, wobei die Hervorhebungskennzeichen eines oder mehrere sind, ausgewählt aus Hervorhebungsmarkierungen, Großbuchstaben, Leerstellen, einem Kennsatz aus einer Wortgruppe.
- Tragbare elektronische Vorrichtung nach einem der vorhergehenden Ansprüche, wobei die tragbare elektronische Vorrichtung ein Belegleser oder eine tragbare und/oder Hand-Kommunikationsvorrichtung ist.
- Tragbare elektronische Vorrichtung nach einem der vorhergehenden Ansprüche, wobei die tragbare elektronische Vorrichtung in einem Automobil angeordnet ist.
- Tragbare elektronische Vorrichtung nach Anspruch 28, wobei die Benutzereingabevorrichtung Tastenmittel auf dem Lenkrad umfasst.
- Verfahren zum Navigieren durch einen hervorgehobenen Text zu einer gewünschten Position für die Audio-Ausgabe durch einen Sprachsynthesizer, welcher ein Teil einer tragbaren elektronischen Vorrichtung ist, wobei das Verfahren das Folgende umfasst: Erkennen von Befehlen, welche von einem Benutzer eingegeben werden, um vorwärts oder rückwärts durch den hervorgehobenen Text zwischen Positionen, die durch Hervorhebungskennzeichen des hervorgehobenen Textes definiert sind, zu einem gewünschten Hervorhebungskennzeichen zu navigieren; Steuern der Navigation zu dem gewünschten Hervorhebungskennzeichen; und Versorgen des Sprachsynthesizers mit einer Eingabe, welche einem Abschnitt des hervorgehobenen Textes entspricht, beginnend bei dem gewünschten Hervorhebungskennzeichen.
- Verfahren gemäß Anspruch 30, wobei das Verfahren ferner das Folgende umfasst: Ermitteln einer gewünschten Startposition in dem hervorgehobenen Text aus einer Auswahl, welche durch Hervorhebungskennzeichen definiert ist, aus einer Befehlseingabe durch einen Benutzer; Bewegen zu der gewünschten Startposition des hervorgehobenen Textes; Ausgeben des sprachsynthetisierten hervorgehobenen Textes von dieser Position an.
- In einer tragbaren elektronischen Vorrichtung gespeichertes Computerprogramm zum Navigieren durch hervorgehobenen Text zu einer gewünschten Position für die Audio-Ausgabe durch einen Sprachsynthesizer, welcher ein Teil einer tragbaren elektronischen Vorrichtung ist, wobei das Computerprogramm einen Code umfasst, welcher dafür geeignet ist, die folgenden Schritte durchzuführen, wenn er in einer Datenverarbeitungsvorrichtung ausgeführt wird: Erkennen einer Befehlseingabe durch einen Benutzer, um zwischen Positionen, die durch Hervorhebungskennzeichen des hervorgehobenen Textes definiert sind, zu einem gewünschten Hervorhebungskennzeichen rückwärts oder vorwärts durch den hervorgehobenen Text zu navigieren; Steuern der Navigation zu dem gewünschten Hervorhebungskennzeichen; und Versorgen des Sprachsynthesizers mit einer Eingabe, welche einem Abschnitt des hervorgehobenen Textes entspricht, beginnend bei dem gewünschten Hervorhebungskennzeichen.
- Computerprogramm nach Anspruch 32, welches ferner einen Code umfasst, welcher geeignet ist, die folgenden Schritte durchzuführen, wenn er in der Datenverarbeitungsvorrichtung ausgeführt wird: Ermitteln einer gewünschten Startposition in dem hervorgehobenen Text aus einer Auswahl, welche durch Hervorhebungskennzeichen definiert ist, aus einer Befehlseingabe durch einen Benutzer; Bewegen zu der gewünschten Startposition des hervorgehobenen Textes; Ausgeben des sprachsynthetisierten hervorgehobenen Textes von dieser Position an.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
GB9930745 | 1999-12-30 | ||
GB9930745A GB2357943B (en) | 1999-12-30 | 1999-12-30 | User interface for text to speech conversion |
Publications (2)
Publication Number | Publication Date |
---|---|
DE60033122D1 DE60033122D1 (de) | 2007-03-15 |
DE60033122T2 true DE60033122T2 (de) | 2007-10-11 |
Family
ID=10867116
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE60033122T Expired - Lifetime DE60033122T2 (de) | 1999-12-30 | 2000-12-08 | Benutzeroberfläche zur Text-zu-Sprache-Umsetzung |
Country Status (4)
Country | Link |
---|---|
US (1) | US6708152B2 (de) |
EP (1) | EP1113416B1 (de) |
DE (1) | DE60033122T2 (de) |
GB (1) | GB2357943B (de) |
Families Citing this family (61)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6931255B2 (en) * | 1998-04-29 | 2005-08-16 | Telefonaktiebolaget L M Ericsson (Publ) | Mobile terminal with a text-to-speech converter |
JP2001358602A (ja) | 2000-06-14 | 2001-12-26 | Nec Corp | 文字情報受信装置 |
JP2002140194A (ja) * | 2000-10-31 | 2002-05-17 | Toshiba Corp | 情報処理方法および情報処理装置およびエージェントシステム |
US6978239B2 (en) * | 2000-12-04 | 2005-12-20 | Microsoft Corporation | Method and apparatus for speech synthesis without prosody modification |
US7263488B2 (en) * | 2000-12-04 | 2007-08-28 | Microsoft Corporation | Method and apparatus for identifying prosodic word boundaries |
US7194411B2 (en) * | 2001-02-26 | 2007-03-20 | Benjamin Slotznick | Method of displaying web pages to enable user access to text information that the user has difficulty reading |
US7000189B2 (en) * | 2001-03-08 | 2006-02-14 | International Business Mahcines Corporation | Dynamic data generation suitable for talking browser |
US7035794B2 (en) * | 2001-03-30 | 2006-04-25 | Intel Corporation | Compressing and using a concatenative speech database in text-to-speech systems |
JP3891839B2 (ja) * | 2001-12-28 | 2007-03-14 | 富士通株式会社 | 再発信機能付き通信機、およびプログラム |
KR20030078191A (ko) * | 2002-03-28 | 2003-10-08 | 황성연 | 휴대용 음성출력 장치 |
US20040203637A1 (en) * | 2002-04-30 | 2004-10-14 | Uday Dodla | Method and apparatus for remotely accessing three-party calling functions |
US20040203613A1 (en) * | 2002-06-07 | 2004-10-14 | Nokia Corporation | Mobile terminal |
GB2389761B (en) * | 2002-06-13 | 2006-04-26 | Seiko Epson Corp | A semiconductor chip for use in a mobile telephone |
EP1431958B1 (de) * | 2002-12-16 | 2018-07-18 | Sony Mobile Communications Inc. | Gerät enthaltend oder anschliessbar zu einer Vorrichtung zur Erzeugung von Sprachsignalen, und Computerprogramm dafür |
US7496498B2 (en) * | 2003-03-24 | 2009-02-24 | Microsoft Corporation | Front-end architecture for a multi-lingual text-to-speech system |
US8229086B2 (en) * | 2003-04-01 | 2012-07-24 | Silent Communication Ltd | Apparatus, system and method for providing silently selectable audible communication |
KR101166930B1 (ko) * | 2003-04-22 | 2012-07-23 | 스핀복스 리미티드 | 무선 정보 장치에 음성 메일을 제공하는 방법 |
US7882434B2 (en) * | 2003-06-27 | 2011-02-01 | Benjamin Slotznick | User prompting when potentially mistaken actions occur during user interaction with content on a display screen |
US20050125236A1 (en) * | 2003-12-08 | 2005-06-09 | International Business Machines Corporation | Automatic capture of intonation cues in audio segments for speech applications |
JP2005250584A (ja) * | 2004-03-01 | 2005-09-15 | Sharp Corp | 入力装置 |
US11011153B2 (en) | 2004-03-01 | 2021-05-18 | Blackberry Limited | Communications system providing automatic text-to-speech conversion features and related methods |
US7650170B2 (en) | 2004-03-01 | 2010-01-19 | Research In Motion Limited | Communications system providing automatic text-to-speech conversion features and related methods |
US8538386B2 (en) | 2004-03-01 | 2013-09-17 | Blackberry Limited | Communications system providing text-to-speech message conversion features using audio filter parameters and related methods |
ATE457593T1 (de) * | 2004-03-01 | 2010-02-15 | Research In Motion Ltd | Mobiles kommunikationsendgerät mit text-zu-sprach umsetzung |
US9131062B2 (en) * | 2004-06-29 | 2015-09-08 | Kyocera Corporation | Mobile terminal device |
US20060106618A1 (en) * | 2004-10-29 | 2006-05-18 | Microsoft Corporation | System and method for converting text to speech |
FR2884023B1 (fr) * | 2005-03-31 | 2011-04-22 | Erocca | Dispositif pour la communication par des personnes handicapees de la parole et/ou de l'ouie |
US20060241945A1 (en) * | 2005-04-25 | 2006-10-26 | Morales Anthony E | Control of settings using a command rotor |
JP4805633B2 (ja) * | 2005-08-22 | 2011-11-02 | 任天堂株式会社 | ゲーム用操作装置 |
US20070078655A1 (en) * | 2005-09-30 | 2007-04-05 | Rockwell Automation Technologies, Inc. | Report generation system with speech output |
US7697827B2 (en) | 2005-10-17 | 2010-04-13 | Konicek Jeffrey C | User-friendlier interfaces for a camera |
US20070211071A1 (en) * | 2005-12-20 | 2007-09-13 | Benjamin Slotznick | Method and apparatus for interacting with a visually displayed document on a screen reader |
GB0601988D0 (en) * | 2006-02-01 | 2006-03-15 | Univ Dundee | Speech generation |
KR100746830B1 (ko) * | 2006-05-26 | 2007-08-07 | 엘지전자 주식회사 | 메시지 관리방법 및 이동통신단말기 |
KR100699050B1 (ko) | 2006-06-30 | 2007-03-28 | 삼성전자주식회사 | 문자정보를 음성정보로 출력하는 이동통신 단말기 및 그방법 |
US9087507B2 (en) * | 2006-09-15 | 2015-07-21 | Yahoo! Inc. | Aural skimming and scrolling |
US20080085696A1 (en) * | 2006-10-10 | 2008-04-10 | Salahshour Chad S | Emergency communication system utilizing available radio frequencies and telephone lines |
JP4973664B2 (ja) * | 2006-11-24 | 2012-07-11 | 富士通株式会社 | 文書読上げ装置、文書読上げ装置を制御する制御方法及び文書読上げ装置を制御する制御プログラム |
US8494490B2 (en) | 2009-05-11 | 2013-07-23 | Silent Communicatin Ltd. | Method, circuit, system and application for providing messaging services |
US8229409B2 (en) | 2007-02-22 | 2012-07-24 | Silent Communication Ltd. | System and method for telephone communication |
US8713542B2 (en) * | 2007-02-27 | 2014-04-29 | Nuance Communications, Inc. | Pausing a VoiceXML dialog of a multimodal application |
US20090012793A1 (en) * | 2007-07-03 | 2009-01-08 | Dao Quyen C | Text-to-speech assist for portable communication devices |
US20090037170A1 (en) * | 2007-07-31 | 2009-02-05 | Willis Joe Williams | Method and apparatus for voice communication using abbreviated text messages |
US10255609B2 (en) | 2008-02-21 | 2019-04-09 | Micronotes, Inc. | Interactive marketing system |
US20090240567A1 (en) * | 2008-02-21 | 2009-09-24 | Micronotes, Llc | Interactive marketing system |
US8121842B2 (en) | 2008-12-12 | 2012-02-21 | Microsoft Corporation | Audio output of a document from mobile device |
US8280434B2 (en) * | 2009-02-27 | 2012-10-02 | Research In Motion Limited | Mobile wireless communications device for hearing and/or speech impaired user |
US20100332224A1 (en) * | 2009-06-30 | 2010-12-30 | Nokia Corporation | Method and apparatus for converting text to audio and tactile output |
WO2011011225A1 (en) * | 2009-07-24 | 2011-01-27 | Dynavox Systems, Llc | Methods for enhancing the communication rate of a speech generation device |
US20110054880A1 (en) * | 2009-09-02 | 2011-03-03 | Apple Inc. | External Content Transformation |
KR101617461B1 (ko) * | 2009-11-17 | 2016-05-02 | 엘지전자 주식회사 | 이동 통신 단말기에서의 티티에스 음성 데이터 출력 방법 및 이를 적용한 이동 통신 단말기 |
US20110307250A1 (en) * | 2010-06-10 | 2011-12-15 | Gm Global Technology Operations, Inc. | Modular Speech Recognition Architecture |
CN102314874A (zh) * | 2010-06-29 | 2012-01-11 | 鸿富锦精密工业(深圳)有限公司 | 文本到语音转换系统与方法 |
US11170757B2 (en) * | 2016-09-30 | 2021-11-09 | T-Mobile Usa, Inc. | Systems and methods for improved call handling |
JP6907788B2 (ja) * | 2017-07-28 | 2021-07-21 | 富士フイルムビジネスイノベーション株式会社 | 情報処理装置及びプログラム |
US11093554B2 (en) | 2017-09-15 | 2021-08-17 | Kohler Co. | Feedback for water consuming appliance |
US10887125B2 (en) | 2017-09-15 | 2021-01-05 | Kohler Co. | Bathroom speaker |
US10448762B2 (en) | 2017-09-15 | 2019-10-22 | Kohler Co. | Mirror |
US11314215B2 (en) | 2017-09-15 | 2022-04-26 | Kohler Co. | Apparatus controlling bathroom appliance lighting based on user identity |
US11099540B2 (en) | 2017-09-15 | 2021-08-24 | Kohler Co. | User identity in household appliances |
CN108564953B (zh) * | 2018-04-20 | 2020-11-17 | 科大讯飞股份有限公司 | 一种语音识别文本的标点处理方法及装置 |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4831654A (en) * | 1985-09-09 | 1989-05-16 | Wang Laboratories, Inc. | Apparatus for making and editing dictionary entries in a text to speech conversion system |
US5500919A (en) * | 1992-11-18 | 1996-03-19 | Canon Information Systems, Inc. | Graphics user interface for controlling text-to-speech conversion |
DE69327774T2 (de) * | 1992-11-18 | 2000-06-21 | Canon Information Syst Inc | Prozessor zur Umwandlung von Daten in Sprache und Ablaufsteuerung hierzu |
CA2119397C (en) * | 1993-03-19 | 2007-10-02 | Kim E.A. Silverman | Improved automated voice synthesis employing enhanced prosodic treatment of text, spelling of text and rate of annunciation |
US6442523B1 (en) * | 1994-07-22 | 2002-08-27 | Steven H. Siegel | Method for the auditory navigation of text |
WO1997037344A1 (fr) * | 1996-03-29 | 1997-10-09 | Hitachi, Ltd. | Terminal possedant une fonction de synthese vocale et systeme dispensant des donnees caracteres utilisant ce terminal |
US5850629A (en) * | 1996-09-09 | 1998-12-15 | Matsushita Electric Industrial Co., Ltd. | User interface controller for text-to-speech synthesizer |
US6108629A (en) * | 1997-04-25 | 2000-08-22 | At&T Corp. | Method and apparatus for voice interaction over a network using an information flow controller |
US20020002458A1 (en) * | 1997-10-22 | 2002-01-03 | David E. Owen | System and method for representing complex information auditorially |
US6353661B1 (en) * | 1997-12-18 | 2002-03-05 | Bailey, Iii John Edson | Network and communication access systems |
US6356819B1 (en) * | 1998-04-20 | 2002-03-12 | Trimble Navigation Limited | Safety system for guidance control system |
US6246983B1 (en) * | 1998-08-05 | 2001-06-12 | Matsushita Electric Corporation Of America | Text-to-speech e-mail reader with multi-modal reply processor |
ATE247325T1 (de) * | 1998-09-30 | 2003-08-15 | Lernout & Hauspie Speechprod | Sprachgesteuerte navigation für einen elektronischen post leser |
US6085161A (en) * | 1998-10-21 | 2000-07-04 | Sonicon, Inc. | System and method for auditorially representing pages of HTML data |
US6462732B2 (en) * | 1999-07-28 | 2002-10-08 | Michael Mehr | Hand un-inhibiting cursor control device |
-
1999
- 1999-12-30 GB GB9930745A patent/GB2357943B/en not_active Expired - Lifetime
-
2000
- 2000-12-08 EP EP00310999A patent/EP1113416B1/de not_active Expired - Lifetime
- 2000-12-08 DE DE60033122T patent/DE60033122T2/de not_active Expired - Lifetime
- 2000-12-20 US US09/739,792 patent/US6708152B2/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
EP1113416B1 (de) | 2007-01-24 |
DE60033122D1 (de) | 2007-03-15 |
GB2357943A (en) | 2001-07-04 |
GB2357943B (en) | 2004-12-08 |
US6708152B2 (en) | 2004-03-16 |
EP1113416A3 (de) | 2001-08-16 |
US20010014860A1 (en) | 2001-08-16 |
GB9930745D0 (en) | 2000-02-16 |
EP1113416A2 (de) | 2001-07-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE60033122T2 (de) | Benutzeroberfläche zur Text-zu-Sprache-Umsetzung | |
DE602004012071T2 (de) | Multimedia- und textnachrichten mit sprache-zu-text-hilfe | |
EP1603291B1 (de) | Informationsübertragungssystem und -verfahren | |
DE4436175B4 (de) | Vorrichtung zum Fernzugreifen auf einen Computer ausgehend von einem Telefonhandapparat | |
US5884256A (en) | Networked stenographic system with real-time speech to text conversion for down-line display and annotation | |
DE60031552T2 (de) | Vorrichtung und verfahren zur intuitiven navigation auf eine tastatur mit tonrückführung für ein schnurloses kommunikationsgerät | |
US7715882B2 (en) | Mobile terminal apparatus, character input method and character input program | |
DE112014006409T5 (de) | Fahrzeugsteuervorrichtung und Fahrzeugsteuerverfahren | |
US20070239446A1 (en) | Down-line Transcription System Using Automatic Tracking And Revenue Collection | |
DE10338512A1 (de) | Unterstützungsverfahren für Sprachdialoge zur Bedienung von Kraftfahrzeugfunktionen | |
US20040176139A1 (en) | Method and wireless communication device using voice recognition for entering text characters | |
DE102012210986B4 (de) | System mit einer Mobilkommunikationsvorrichtung und einem Fahrzeugstereosystem und Verfahren zum Betrieb des Systems | |
DE10327943B4 (de) | Unterschiedliche Zahlenleseweisen zulassendes Spracherkennungssystem | |
US20070094280A1 (en) | Mobile communication terminal | |
DE102004021454A1 (de) | Verfahren und Vorrichtung für einen akustischen Zugang zu einem Anwendungsrechner | |
WO1997037344A1 (fr) | Terminal possedant une fonction de synthese vocale et systeme dispensant des donnees caracteres utilisant ce terminal | |
DE69910412T2 (de) | Sprachgesteuerte navigation für einen elektronischen post leser | |
US6931263B1 (en) | Voice activated text strings for electronic devices | |
JPH08180022A (ja) | 情報記憶変換装置 | |
EP1359566A1 (de) | Verfahren und Anordnung zur sprachbasierten Nutzung von Speichersystemen sowie ein entsprechendes Computerprogramm und ein entsprechendes computerlesbares Speichermedium | |
DE3545447A1 (de) | System zur integration eines personalcomputers oder eines aehnlichen rechners in ein fahrzeug zur benutzung als fahrbares buero | |
US20050119888A1 (en) | Information processing apparatus and method, and program | |
EP1692610A2 (de) | Verfahren und einrichtung zum transcribieren eines audiosignals | |
CN1749932A (zh) | 移动通信终端机的常用句子输入方法 | |
EP1882351B1 (de) | Betrieb eines in einem telekommunikationsnetz nutzbaren endqerätes |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
8364 | No opposition during term of opposition | ||
R082 | Change of representative |
Ref document number: 1113416 Country of ref document: EP Representative=s name: COHAUSZ & FLORACK PATENT- UND RECHTSANWAELTE PARTN |
|
R081 | Change of applicant/patentee |
Ref document number: 1113416 Country of ref document: EP Owner name: CORE WIRELESS LICENSING S.A.R.L., LU Free format text: FORMER OWNER: NOKIA CORP., ESPOO, FI Effective date: 20120215 |
|
R082 | Change of representative |
Ref document number: 1113416 Country of ref document: EP Representative=s name: TBK, 80336 MUENCHEN, DE |
|
R082 | Change of representative |
Ref document number: 1113416 Country of ref document: EP Representative=s name: TBK, 80336 MUENCHEN, DE |