DE60314929T2 - Informationsverarbeitungsgerät und Verfahren mit Sprachsynthesefunktion - Google Patents

Informationsverarbeitungsgerät und Verfahren mit Sprachsynthesefunktion Download PDF

Info

Publication number
DE60314929T2
DE60314929T2 DE60314929T DE60314929T DE60314929T2 DE 60314929 T2 DE60314929 T2 DE 60314929T2 DE 60314929 T DE60314929 T DE 60314929T DE 60314929 T DE60314929 T DE 60314929T DE 60314929 T2 DE60314929 T2 DE 60314929T2
Authority
DE
Germany
Prior art keywords
instruction
speech
read
speech synthesis
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE60314929T
Other languages
English (en)
Other versions
DE60314929D1 (de
Inventor
Masayuki Ohta-ku Yamada
Katsuhiko Ohta-Ku Kawasaki
Toshiaki Ohta-Ku Fukada
Yasuo Ohta-ku Okutani
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from JP2002039033A external-priority patent/JP3884970B2/ja
Priority claimed from JP2002124368A external-priority patent/JP2003316565A/ja
Application filed by Canon Inc filed Critical Canon Inc
Application granted granted Critical
Publication of DE60314929D1 publication Critical patent/DE60314929D1/de
Publication of DE60314929T2 publication Critical patent/DE60314929T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Document Processing Apparatus (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

  • GEBIET DER ERFINDUNG
  • Die Erfindung bezieht sich auf ein Informationsverarbeitungsgerät und -verfahren mit einer Sprachsynthesefunktion.
  • STAND DER TECHNIK DER ERFINDUNG
  • Heutzutage ist ein tragbares Informationsendgerät, wie beispielsweise das in 20 Gezeigte, käuflich verfügbar, und es werden verschiedenste Informationsprozesse unter Verwendung dieses Informationsendgeräts ausgeführt. Dieses tragbare Informationsendgerät umfasst beispielsweise eine Kommunikationseinheit, eine Speichereinheit, eine Sprachausgabeeinheit, und eine Sprachsyntheseeinheit, welche die folgenden Funktionen "Wiedergabe aufgezeichneter Audiodaten", "Lesen eines gespeicherten Dokuments", und "Lesen neu angekommener Informationen", und dergleichen ausführen.
  • 1) Funktion "Wiedergabe aufgezeichneter Audiodaten"
  • Audiodaten, wie beispielsweise Musik, ein Sprachlernmaterial, und dergleichen, welche über die Kommunikationseinheit herunter geladen werden, werden in der Speichereinheit gespeichert und werden zu einem beliebigen Zeitpunkt und an einem beliebigen Ort wiedergegeben.
  • 2) Funktion "Lesen eines gespeicherten Dokuments"
  • In einer Datenspeichereinheit gespeicherte Textdaten, wie beispielsweise ein Roman oder dergleichen, werden unter Verwendung von Sprachsynthese (Text-zu-Sprache-Wandlung) laut gelesen, um Informationen überall zu durchlaufen.
  • 3) Funktion "Lesen neu angekommener Informationen"
  • Es wird eine Verbindung zum Internet oder dergleichen unter Verwendung der Kommunikationseinheit aufgebaut, um Echtzeitinformationen (Textdaten), wie beispielsweise Post- bzw. Mailmitteilungen, Nachrichtenartikel, und dergleichen zu akquirieren. Zudem werden die erlangten Informationen unter Verwendung von Sprachsynthese (Text-zu-Sprache-Wandlung) laut gelesen.
  • Ferner sind die folgenden Funktionen verfügbar, welche die Funktionen "Wiedergabe aufgezeichneter Audiodaten", "Lesen eines gespeicherten Dokuments", und "Lesen neu angekommener Informationen" verbinden.
  • 4) Funktion "Dokumentlesen unter Verwendung von aufgezeichneten Audiodaten als BGM"
  • Ein gespeichertes Dokument oder neu angekommene Informationen (Textdaten) werden unter Verwendung von Sprachsynthese (Text-zu-Sprache-Wandlung) laut gelesen, während aufgezeichnete Audiodaten wiedergegeben werden.
  • 5) Funktion "Unterbrechungsmittelung bei neu angekommenen Informationen"
  • Bei Ankommen bzw. Ankunft einer Mailmitteilung oder eines neu angekommenen Nachrichtenartikels wird sie/er unter Verwendung von Sprachsynthese (Text-zu-Sprache-Wandlung) laut gelesen. Da Sprache Verwendung findet, stört sie kaum andere Arbeiten. Außerdem kann synthetische Sprache beispielsweise wiedergegebener Musik überlagert werden.
  • Jedoch leidet das zuvor erwähnte herkömmliche Verfahren an den folgenden zwei Problemen.
  • Das erste Problem ist eine Zunahme der Anzahl von Bedienknöpfen.
  • Der Benutzer kann während der Ausführung der Funktionen "Wiedergabe aufgezeichneter Audiodaten", "Lesen eines gespeicherten Dokuments", und "Lesen neu angekommener Informationen", Bedienungen bzw. Arbeitsvorgänge "Wiedergabe", "Stopp", "Vorspulen", und "Rückspulen" vornehmen. Jedoch werden Bedienknöpfe, wie beispielsweise "Wiedergabe", "Stopp", "Vorspulen", und "Rückspulen" und dergleichen unabhängig für diejenigen Funktionen der Funktionen "Wiedergabe aufgezeichneter Audiodaten", "Lesen eines gespeicherten Dokuments", und "Lesen neu angekommener Informationen" zur Verfügung gestellt, die Anzahl von Komponenten nimmt zu, und derartige Knöpfe nehmen einen großen Raum bzw. Platz ein. Als ein Ergebnis nimmt die Größe des gesamten Informationsendgeräts zu, und die Herstellungskosten steigen.
  • Das zweite Problem ist wie folgt. Das heißt, wenn eine "Vorspul"-Vorgang oder "Rückspul-Vorgang wie bei einer Wiedergabe von aufgezeichneten Audiodaten ausgeführt wird, während Text unter Verwendung von Sprachsynthese (Text-zu-Sprache-Wandlung) laut gelesen wird, kann der Benutzer die unter Verwendung von Sprachsynthese (Text-zu-Sprache-Wandlung) laut gelesenen Inhalte während dem "Vorspul"-Vorgang oder "Rückspul"-Vorgang nicht aufnehmen, was in einer dürftigen Verbraucherfreundlichkeit resultiert.
  • Außerdem nehmen digitale Dokumente, die durch Wandeln der Inhalte von gedruckten Büchern in digitale Daten erlangt werden, Jahr für Jahr zu. Mit zunehmenden digitalen Dokumenten sind eine Vorrichtung zum Durchlaufen solcher Daten, wie beispielsweise ein Buch (so genannte E-Buchvorrichtung), und ein Text-zu-Sprache-Lesegerät oder -Softwareprogramm, das ein digitales Dokument unter Verwendung von Sprachsynthese laut liest, käuflich verfügbar. Ein gegebenes Text-zu-Sprache-Lesegerät oder -Softwareprogramm hat eine Lesezeichenfunktion, welche die vorhergehende Leseendposition speichert, und eine Lesen neu startet, während sie einen gegebenen Betrag von der Position (Lesezeichenposition) von Text beim Stoppen eines Lesens zurückgeht. Diese Funktion erlaubt es dem Benutzer, eine Assoziation mit den zuvor gelesenen Sätzen ins Gedächtnis zu rufen, und hilft ihm oder ihr, die Inhalte von Sätzen zu verstehen.
  • Jedoch verwendet das herkömmliche Text-zu-Sprache-Lesegerät oder die -Software einen konstanten Rückgehbetrag bzw. Rücksprungbetrag von der Lesestartposition beim Neustarten eines Lesens. Aus diesem Grund kann eine derartige Funktion, wenn dieser Rückgehbetrag zu kurz ist, dem Benutzer nicht helfen, die Inhalte von aktuellen Sätzen zu verstehen. Andererseits kann der Benutzer, wenn der Rückgehbetrag zu lang ist, die zuvor gelesenen Sätze ins Gedächtnis rufen, jedoch sind sie oft redundant. Das heißt, da ein konstanter Rückgehbetrag verwendet wird, hilft es dem Benutzer kaum, die Inhalte von tatsächlichen Sätzen zu verstehen.
  • US 6246672 offenbart ein interaktives Radio- bzw. Funksystem, welches Teilnehmern bzw. Beziehern auf ihre Anfrage hin digitalisierten audiobasierten Inhalt liefert. Das System umfasst persönliche Funkserver und eine Vielzahl von Endgeräten. Hochkomprimierter sprachbasierter Informationeninhalt ist auf Datennetzwerkservern gespeichert. Die persönlichen Funkserver speichern vielzählige Teilnehmerprofile mit Themen von individuellem Interesse. Ein Benutzer kann das System durch Ausgabe von Sprachkommandos steuern. Derartige Funktionen umfassen handfreies bzw. freihändiges Einstellen bzw. Abstimmen zu herkömmlichen Radiostationen, Ändern eines Audiowiedergabepegels und Schalten zwischen Benutzerfunktionen.
  • Gemäß einem Aspekt der vorliegenden Erfindung wird ein Informationsverarbeitungsgerät nach Anspruch 1 zur Verfügung gestellt.
  • Gemäß einem weiteren Aspekt der vorliegenden Erfindung wird ein Informationsverarbeitungsverfahren nach Anspruch 11 zur Verfügung gestellt.
  • Gemäß weiteren Aspekten der vorliegenden Erfindung werden ein Programm zum Veranlassen eines Computers, ein Verfahren auszuführen, nach Anspruch 12 und ein computerlesbares Speichermedium, welches ein Programm speichert, nach Anspruch 13 zur Verfügung gestellt.
  • Andere Merkmale und Vorteile der vorliegenden Erfindung werden aus der folgenden Beschreibung in Verbindung mit der beiliegenden Zeichnung ersichtlich, in welcher gleiche Bezugszeichen die selben oder ähnliche Teile durch alle ihre Figuren bezeichnen.
  • KURZE BESCHREIBUNG DER ZEICHNUNG
  • Die beiliegende Zeichnung, welche in die Beschreibung aufgenommen ist und einen Teil von ihr bildet, veranschaulicht Ausführungsbeispiele der Erfindung und dient zusammen mit der Beschreibung dazu, das Prinzip der Erfindung zu erläutern.
  • 1 ist ein Blockschaltbild, das die Hardwareanordnung eines Informationsendgeräts gemäß dem ersten Ausführungsbeispiel der vorliegenden Erfindung zeigt;
  • 2 ist ein Flussdiagramm zur Erläuterung eines gesamten Ereignisvorgangs bzw. -prozesses gemäß dem ersten Ausführungsbeispiel der vorliegenden Erfindung;
  • 3 ist ein Flussdiagramm zur Erläuterung eines bei Drücken bzw. Betätigen eines Wiedergabeknopfes ausgeführten Prozesses;
  • 4 ist ein Flussdiagramm zur Erläuterung eines bei Drücken bzw. Betätigen eines Stoppknopfes ausgeführten Prozesses;
  • 5 ist ein Flussdiagramm zur Erläuterung eines bei Drücken bzw. Betätigen eines Pausenknopfes ausgeführten Prozesses;
  • 6 ist ein Flussdiagramm zur Erläuterung eines bei Drücken bzw. Betätigen eines Vorspulknopfes ausgeführten Prozesses;
  • 7 ist ein Flussdiagramm zur Erläuterung eines bei Lösen bzw. Loslassen des Vorspulknopfes ausgeführten Prozesses;
  • 8 ist ein Flussdiagramm zur Erläuterung eines bei Drücken bzw. Betätigen eines Rückspulknopfes ausgeführten Prozesses;
  • 9 ist ein Flussdiagramm zur Erläuterung eines bei Lösen des Rückspulknopfes ausgeführten Prozesses;
  • 10 ist ein Flussdiagramm zur Erläuterung eines bei Ankommen neuer Informationen ausgeführten Prozesses;
  • 11 ist ein Flussdiagramm zur Erläuterung eines bei Empfang einer Anweisung zur Text-zu-Sprache-Wandlung von gespeicherten Informationen ausgeführten Prozesses;
  • 12 ist ein Flussdiagramm zur Erläuterung eines bei Empfang einer Sprachsyntheseanweisung ausgeführten Prozesses;
  • 13 ist ein Flussdiagramm zur Erläuterung eines bei Empfang einer Anweisung, aufgezeichnetes Audio wiederzugeben, ausgeführten Prozesses;
  • 14 ist ein Flussdiagramm zur Erläuterung eines Zeitgebeereignisprozesses;
  • 15A ist ein Flussdiagramm zur Erläuterung eines Sprachsynthesestartprozesses;
  • 15B ist ein Flussdiagramm zur Erläuterung eines Sprachsynthesestoppprozesses;
  • 15C ist ein Flussdiagramm zur Erläuterung eines Sprachsynthesepausenprozesses;
  • 15D ist ein Flussdiagramm zur Erläuterung eines Sprachsyntheseneustartprozesses;
  • 16A ist ein Flussdiagramm zur Erläuterung eines Startprozesses einer Wiedergabe von aufgezeichneten Audiodaten;
  • 16B ist ein Flussdiagramm zur Erläuterung eines Stoppprozesses einer Wiedergabe von aufgezeichneten Audiodaten;
  • 16C ist ein Flussdiagramm zur Erläuterung eines Pausenprozesses einer Wiedergabe von aufgezeichneten Audiodaten;
  • 16D ist ein Flussdiagramm zur Erläuterung eines Neustartprozesses einer Wiedergabe von aufgezeichneten Audiodaten;
  • 17 ist eine Ansicht zur Erläuterung eines Beispiels einer Neuankunftsmeldungsmitteilung bzw. Mitteilung einer neu angekommenen Meldung;
  • 18A und 18B sind Ansichten zur Erläuterung eines Bilds einer ersten Wortliste;
  • 19A und 19B sind Ansichten zur Erläuterung eines Bilds einer Zusammenfassung;
  • 20 zeigt eine äußere Erscheinung des Informationsendgeräts gemäß dem ersten Ausführungsbeispiel der vorliegenden Erfindung;
  • 21 ist ein Blockschaltbild, das den Hardwareaufbau eines Informationsendgeräts gemäß dem zweiten Ausführungsbeispiel der vorliegenden Erfindung zeigt;
  • 22 ist ein Flussdiagramm zur Erläuterung eines gesamten Ereignisvorgangs bzw. -prozesses gemäß dem zweiten Ausführungsbeispiel der vorliegenden Erfindung;
  • 23 ist ein Flussdiagramm zur Erläuterung eines Vorgangs bzw. Prozesses, der ausgeführt wird, wenn ein Wählwinkel geändert worden ist;
  • 24 ist ein Flussdiagramm zur Erläuterung eines Vorgangs bzw. Prozesses, der bei Empfang einer Sprachsyntheseanforderung ausgeführt wird;
  • 25 ist eine Tabelle zur Erläuterung einer Entsprechung zwischen dem Wählwinkel und einem Leseübersprungzählwert;
  • 26 ist eine Ansicht zur Erläuterung eines Beispiels von synchronen Punkten;
  • 27 zeigt eine äußere Erscheinung des Informationsendgeräts gemäß dem zweiten Ausführungsbeispiel der vorliegenden Erfindung;
  • 28A und 28B sind Ansichten zur Erläuterung eines Bilds einer Liste erster Wörter bei Ausführung eines Vorspulvorgangs bzw. -prozesses;
  • 29A und 29B sind Ansichten, die ein Beispiel einer Zusammenfassung bei Ausführung eines Rückspulvorgangs bzw. -prozesses zeigen;
  • 30 ist ein Blockschaltbild, das den Hardwareaufbau eines Personalcomputers zeigt, welcher ein Text-zu-Sprache-Lesegerät bei dem dritten Ausführungsbeispiel ausführt;
  • 31 ist ein Schaubild, das die Modulkonfiguration eines Text-zu-Sprache-Leseprogramms bei dem dritten Ausführungsbeispiel zeigt;
  • 32 ist ein Flussdiagramm, das einen Text-zu-Sprache-Lesevorgang bzw. -prozess des Text-zu-Sprache-Lesegeräts bei dem dritten Ausführungsbeispiel zeigt;
  • 33 ist ein Flussdiagramm, das einen Text-zu-Sprache-Lesestoppvorgang bzw. -prozess während eines Lesens des Text-zu-Sprache-Lesegeräts bei dem dritten Ausführungsbeispiel zeigt; und
  • 34 ist eine Ansicht zur Erläuterung eines Verfahrens eines Suchens nach einem Leseneustartpunkt bei dem dritten Ausführungsbeispiel
  • BESCHREIBUNG DER BEVORZUGTEN AUSFÜHRUNGSBEISPIELE
  • <Erstes Ausführungsbeispiel>
  • [Aufbau eines Informationsgeräts: 1, 20]
  • 1 ist ein Blockschaltbild, das den Hardwareaufbau eines tragbaren Informationsendgeräts H1000 bei dem ersten Ausführungsbeispiel zeigt. 20 zeigt das äußere Erscheinungsbild des Informationsendgeräts H1000.
  • Das Bezugszeichen H1 bezeichnet eine zentrale Verarbeitungseinheit, welche Vorgänge bzw. Prozesse, wie beispielsweise numerische Operationen, eine Steuerung, und dergleichen, ausführt und arithmetische Operationen gemäß einem Steuerprogramm vornimmt, das die Verarbeitungssequenz der vorliegenden Erfindung beschreibt. Wie es später beschrieben wird, kann durch Ausführen dieses Programms ein Audiodatenwiedergabeprozess bzw. -vorgang und ein Text-zu-Sprache-Syntheseprozess bzw. -vorgang selektiv ausgeführt werden. Das Bezugszeichen H2 bezeichnet eine Ausgabeeinheit, welche dem Benutzer Informationen präsentiert. Die Ausgabeeinheit H2 umfasst eine Audioausgabeeinheit H201, wie beispielsweise einen Lautsprecher, einen Kopfhörer, oder dergleichen, und eine Bildschirmanzeigeeinheit H202, wie beispielsweise eine Flüssigkristallanzeige oder dergleichen.
  • Das Bezugszeichen H3 bezeichnet eine Eingabeeinheit, bei welcher der Benutzer eine Betriebsanweisung an das Informationsendgerät H1000 ausgibt oder Informationen eingibt. Die Eingabeeinheit H3 umfasst eine Wiedergabeschaltfläche bzw. einen Wiedergabeknopf H301, eine Stoppschaltfläche bzw. einen Stoppknopf H302, eine Pausenschaltfläche bzw. einen Pausenknopf H303, eine Vorspulschaltfläche bzw. einen Vorspulknopf H304, eine Rückspulschaltfläche bzw. einen Rückspulknopf H305, und eine Mehrzweckeingabeeinheit, wie beispielsweise ein Berührungsfeld H306 oder dergleichen.
  • Das Bezugszeichen H4 bezeichnet eine Datenkommunikationseinheit, wie beispielsweise eine LAN-Karte, eine PHS-Karte, oder dergleichen, welche zum Erlangen bzw. Akquirieren von Daten, wie beispielsweise neu angekommenen Mailmitteilungen Verwendung findet. Das Bezugszeichen H5 bezeichnet eine Speichereinheit, wie beispielsweise eine Festplatte, einen nichtflüchtigen Speicher, oder dergleichen, welcher aufgezeichnete Daten (Audiodaten) und gespeicherte Informationen hält. Das Bezugszeichen H6 bezeichnet eine Nur-Lese-Speichereinheit, welche das Steuerprogramm speichert, das den Ablauf bzw. die Sequenz der vorliegenden Erfindung angibt, und permanente Daten, wie beispielsweise eine Sprachsynthesewörterbuch und dergleichen.
  • Das Bezugszeichen H7 bezeichnet eine Speichereinheit, wie beispielsweise ein RAM oder dergleichen, welche Informationen zeitweise hält. Die Speichereinheit H7 hält zeitweise Daten, verschiedenste Kennungen (Flags), und dergleichen. Das Bezugszeichen 1-18 bezeichnet eine Intervallzeitgebereinheit, welche nach einer vorbestimmten Zeitdauer, nachdem der Zeitgeber gestartet ist, zum Erzeugen eines Unterbrechungssignals für die zentrale Verarbeitungseinheit H1 dient. Die zentrale Verarbeitungseinheit H1 bis zu der Zeitgebereinheit H8, die zuvor erwähnt sind, sind über einen Bus verbunden.
  • [Übersicht über Ereignisvorgang bzw. -prozess: 2]
  • Nachfolgend wird der Ereignisvorgang bei dem zuvor erwähnten Informationsendgerät H1000 unter Verwendung der in 2 bis 16D gezeigten Flussdiagramme beschrieben. Es sei erwähnt, dass die nachfolgend zu beschreibenden Vorgänge durch die zentrale Verarbeitungseinheit H1 unter Verwendung der Speichereinheit H7 (RAM oder dergleichen) ausgeführt werden, welche Informationen auf der Grundlage eines ereignisgesteuerten Steuerprogramms speichert, das in der Nur-Lese-Speichereinheit H6 oder dergleichen gespeichert ist. Ein Eingabevorgang von der Eingabeeinheit H3, eine Datenanforderung von er Ausgabeeinheit H2, und ein Unterbrechungssignal, wie beispielsweise ein Zeitgeberunterbrechungssignal oder dergleichen werden als Anweisungen verarbeitet, die den Start von jeweiligen Ereignissen bei dem Steuerprogramm angeben.
  • Unter Bezugnahme auf 2 wird ein neues Ereignis bei einem Ereignisakquisitionsschritt S1 erlangt bzw. akquiriert.
  • Bei einem Wiedergabeknopfbetätigungsprüfschritt S2 wird es geprüft, ob das bei dem Ereignisakquisitionsschritt S1 akquirierte Ereignis "Betätigung bzw. Drücken von Wiedergabeknopf" ist. Ist das akquirierte Ereignis "Betätigung bzw. Drücken von Wiedergabeknopf", setzt sich der Fluss mit Schritt S101 fort, der in 3 gezeigt ist; andernfalls setzt sich der Fluss mit dem Stoppknopfbetätigungsprüfschritt S3 fort.
  • Bei dem Stoppknopfbetätigungsprüfschritt S3 wird es geprüft, ob das bei dem Ereignisakquisitionsschritt S1 akquirierte Ereignis "Betätigung bzw. Drücken von Stoppknopf" ist. Ist das akquirierte Ereignis "Betätigung bzw. Drücken von Stoppknopf", setzt sich der Fluss mit Schritt S201 fort, der in 4 gezeigt ist; andernfalls setzt sich der Fluss mit dem Pausenknopfbetätigungsprüfschritt S4 fort.
  • Bei dem Pausenknopfbetätigungsprüfschritt S4 wird es geprüft, ob das bei dem Ereignisakquisitionsschritt S1 akquirierte Ereignis "Betätigung bzw. Drücken von Pausenknopf" ist. Ist das akquirierte Ereignis "Betätigung bzw. Drücken von Pausenknopf", setzt sich der Fluss mit Schritt S301 fort, der in 5 gezeigt ist; andernfalls setzt sich der Fluss mit dem Vorspulknopfbetätigungsprüfschritt S5 fort.
  • Bei dem Vorspulknopfbetätigungsprüfschritt S5 wird es geprüft, ob das bei dem Ereignisakquisitionsschritt S1 akquirierte Ereignis "Betätigung bzw. Drücken von Vorspulknopf" ist. Ist das akquirierte Ereignis "Betätigung bzw. Drücken von Vorspulknopf", setzt sich der Fluss mit Schritt S401 fort, der in 6 gezeigt ist; andernfalls setzt sich der Fluss mit dem Vorspulknopflösesprüfschritt S6 fort.
  • Bei dem Vorspulknopflöseprüfschritt S6 wird es geprüft, ob das bei dem Ereignisakquisitionsschritt S1 akquirierte Ereignis "Lösen von Vorspulknopf (Betätigung zum Lösen des betätigten Knopfs)" ist. Ist das akquirierte Ereignis "Lösen von Vorspulknopf", setzt sich der Fluss mit Schritt S501 fort, der in 7 gezeigt ist; andernfalls setzt sich der Fluss mit dem Rückspulknopfbetätigungsprüfschritt S7 fort.
  • Bei dem Rückspulknopfbetätigungsprüfschritt S7 wird es geprüft, ob das bei dem Ereignisakquisitionsschritt S1 akquirierte Ereignis "Betätigung bzw. Drücken von Rückspulknopf" ist. Ist das akquirierte Ereignis "Betätigung bzw. Drücken von Rückspulknopf", setzt sich der Fluss mit Schritt S601 fort, der in 8 gezeigt ist; andernfalls setzt sich der Fluss mit dem Rückspulknopflösesprüfschritt S8 fort.
  • Bei dem Rückspulknopflöseprüfschritt S8 wird es geprüft, ob das bei dem Ereignisakquisitionsschritt S1 akquirierte Ereignis "Lösen von Rückspulknopf" ist. Ist das akquirierte Ereignis "Lösen von Rückspulknopf", setzt sich der Fluss mit Schritt S701 fort, der in 9 gezeigt ist; andernfalls setzt sich der Fluss mit dem Neue-Informationen-Ankunft-Prüfschritt S9 fort.
  • Bei dem Neue-Informationen-Ankunft-Prüfschritt S9 wird es geprüft, ob das bei dem Ereignisakquisitionsschritt S1 akquirierte Ereignis Ankunft von "Neuen Informationen" angibt. Gibt das akquirierte Ereignis Ankunft von "Neuen Informationen" an, setzt sich der Fluss mit Schritt S801 fort, der in 10 gezeigt ist; andernfalls setzt sich der Fluss mit dem gespeicherte-Informationen-Leseanweisung-Prüfschritt S10 fort.
  • Bei dem gespeicherte-Informationen-Leseanweisung-Prüfschritt S10 wird es geprüft, ob das bei dem Ereignisakquisitionsschritt S1 akquirierte Ereignis "gespeicherte-Informationen-Leseanweisung des Benutzers" ist. Ist das akquirierte Ereignis "gespeicherte-Informationen-Leseanweisung des Benutzers", setzt sich der Fluss mit Schritt S901 fort, der in 11 gezeigt ist; andernfalls setzt sich der Fluss mit dem Sprachsynthesedatenanforderung-Prüfschritt S11 fort.
  • Bei dem Sprachsynthesedatenanforderung-Prüfschritt S11 wird es geprüft, ob das bei dem Ereignisakquisitionsschritt S1 akquirierte Ereignis „Datenanforderung von Ausgabevorrichtung von synthetischer Sprache" ist. Ist das akquirierte Ereignis "Datenanforderung von Ausgabevorrichtung synthetischer Sprache", setzt sich der Fluss mit Schritt S1001 fort, der in 12 gezeigt ist; andernfalls setzt sich der Fluss mit dem aufgezeichnetes-Audio-Wiedergabe-Datenanforderung-Prüfschritt S12 fort.
  • Bei dem aufgezeichnetes-Audio-Wiedergabe-Datenanforderung-Prüfschritt S12 wird es geprüft, ob das bei dem Ereignisakquisitionsschritt S1 akquirierte Ereignis "Datenanforderung von aufgezeichnete-Audiodaten-Ausgabevorrichtung" ist. Ist das akquirierte Ereignis "Datenanforderung von aufgezeichnete-Audiodaten-Ausgabevorrichtung", setzt sich der Fluss mit Schritt S1101 fort, der in 13 gezeigt ist; andernfalls setzt sich der Fluss mit dem Zeitgeberereignis-Prüfschritt S13 fort.
  • Bei dem Zeitgeberereignisprüfschritt S13 wird es geprüft, ob das bei dem Ereignisakquisitionsschritt S1 akquirierte Ereignis eine Mitteilung ist, welche von der Zeitgebereinheit H8 gesendet ist und ein Verstreichen bzw. Ablauf einer vorbestimmten Zeitdauer angibt, nachdem der Zeitgeber gestartet ist. Ist das akquirierte Ereignis die Mitteilung von der Zeitgebereinheit H8, setzt sich der Fluss mit Schritt S1201 fort, der in 14 gezeigt ist; andernfalls kehrt der Fluss zu dem Ereignisakquisitionsschritt S1 zurück.
  • [Vorgang bzw. Prozess "Betätigung bzw. Drücken von Wiedergabeknopf": 3]
  • Die Vorgänge der zuvor erwähnten Ereignisse werden nachfolgend ausführlich beschrieben. Zuerst wird der Vorgang bzw. Prozess "Betätigung bzw. Drücken von Wiedergabeknopf" unter Verwendung von 3 erläutert.
  • [Lesezeiger]
  • Bei dem Lesezeigersetupprüfschritt (Wiedergabeschritt) S101 wird es geprüft, ob ein "Lesezeiger" gesetzt ist. Ist der "Lesezeiger" gesetzt, setzt sich der Fluss mit dem Sprachsynthesepausenkennungslösch(wiedergabe)schritt S106 fort; andernfalls setzt sich der Fluss mit dem bevorzugter-Lesesatz-Vorhandensein-Prüf(wiedergabe)schritt S102 fort. Es sei erwähnt, dass der "Lesezeiger" ein Feld ist, das die Lesestartposition unter Verwendung von Sprachsynthese in der Mitte eines bevorzugten Lesesatzes (Textdaten) hält, die in 18A als Beispiel dargestellt sind, und er wird ungültig gemacht oder er wird mit der Position des "Lesezeigers" als ein Wert gesetzt.
  • Bei dem bevorzugter-Lesesatz-Vorhandensein-Prüf(wiedergabe)schritt S102 wird es geprüft, ob ein "bevorzugter Lesesatz vorhanden ist." Ist der "bevorzugte Lesesatz vorhanden", setzt sich der Fluss mit dem bevorzugter-Lesesatz-Anfangszeiger-Setzschritt S108 fort; andernfalls setzt er sich mit dem gespeicherter-Lesesatz-Vorhandensein-Prüfschritt S103 fort.
  • Bei dem gespeicherter-Lesesatz-Vorhandensein-Prüfschritt S103 wird es geprüft, ob ein "gespeicherter Lesesatz vorhanden ist." Ist der "gespeicherte Lesesatz vorhanden", setzt sich der Fluss mit dem gespeicherter-Lesesatz-Anfangszeiger-Setzschritt S109 fort; andernfalls setzt sich der Fluss mit dem Wiedergabezeigersetup-Prüf(wiedergabe)schritt S104 fort.
  • [Wiedergabezeiger]
  • Bei dem Wiedergabezeigersetup-Prüf(wiedergabe)schritt S104 wird es geprüft, ob ein "Wiedergabezeiger gesetzt ist". Wenn der "Wiedergabezeiger gesetzt ist", setzt sich der Fluss mit dem Wiedergabepausenkennungs-Lösch(wiedergabe)schritt S111 fort; andernfalls setzt sich der Fluss mit dem aufgezeichnete-Audiodaten-Vorhandensein-Prüfschritt S105 fort. Es sei erwähnt, dass der "Wiedergabezeiger" ein Feld ist, das die nächste Wiedergabeposition hält, und der ungültig gemacht wird oder mit der Position des "Wiedergabezeigers" in aufgezeichneten Audiodaten als ein Wert gesetzt wird.
  • Bei dem aufgezeichnete-Audiodaten-Vorhandensein-Prüfschritt S105 wird es geprüft, ob "aufgezeichnete Audiodaten vorhanden sind". Wenn die "aufgezeichneten Audiodaten vorhanden sind", setzt sich der Fluss mit dem aufgezeichnete-Audiodaten-Wiedergabe-Anfangszeigersetzschritt S113 fort; andernfalls kehrt der Fluss zu dem Ereignisakquisitionsschritt S1 in 2 zurück.
  • Bei dem Sprachsynthesepausenkennungslöschs(wiedergabe)schritt S106 wird eine Sprachsynthesepausenkennung gelöscht. Die Sprachsynthesepausenkennung gibt an, ob die Sprachsynthese eine Pause macht, und sie nimmt einen "wahr"-Wert an, wenn sie gesetzt ist; sie nimmt einen "falsch"-Wert an, wenn sie gelöscht ist.
  • Bei dem Sprachsyntheseneustart(wiedergabe)schritt S107 wird eine bei Schritt S304 in 5 eine Pause machende Sprachsynthese neu gestartet, und der Fluss kehrt dann zu dem Ereignisakquisitionsschritt S1 in 2 zurück. Vorgänge bei Routinen "Sprachsynthesestart", "Sprachsynthesestopp", "Sprachsynthesepause", und "Sprachsyntheseneustart" werden später unter Verwendung von 15A bis 15D beschrieben.
  • Bei dem bevorzugter-Lesesatz-Anfangszeiger-Setzschritt S108 wird der Lesezeiger bei dem Kopf eines bevorzugten Lesesatzes gesetzt, und der Fluss springt zu dem Sprachsynthesestartschritt S110.
  • Bei dem gespeicherter-Lesesatz-Anfangszeiger-Setzschritt S109 wird der Lesezeiger bei dem Kopf eines gespeicherten Lesesatzes gesetzt, und der Fluss setzt sich mit dem Sprachsynthesestartschritt S110 fort.
  • Nachdem der Lesezeiger bei dem bevorzugter-Lesesatz-Anfangszeiger-Setzschritt S108 oder dem gespeicherter-Lesesatz-Anfangszeiger-Setzschritt S109 gesetzt ist, wird die Sprachsynthese bei dem Sprachsynthesestartschritt S110 gestartet, und der Fluss kehrt dann zu dem Ereignisakquisitionsschritt S1 in 2 zurück.
  • Bei dem Wiedergabepausenkennungslösch(wiedergabe)schritt S111 wird eine Wiedergabepausenkennung gelöscht. Die Wiedergabepausenkennung gibt an, ob eine Wiedergabe aufgezeichneter Audiodaten pausiert.
  • Bei dem aufgezeichnete-Audiodaten-Wiedergabeneustart(wiedergabe)schritt S112 wird eine Wiedergabe von aufgezeichneten Audiodaten, die bei Schritt S308 pausierte, neu gestartet, und der Fluss kehrt dann zu dem Ereignisakquisitionsschritt S1 zurück. Prozesse bzw. Vorgänge bei Routinen "Wiedergabestart von aufgezeichneten Audiodaten", "Wiedergabestopp von aufgezeichneten Audiodaten", "Wiedergabepause von aufgezeichneten Audiodaten", und "Wiedergabeneustart von aufgezeichneten Audiodaten" werden später unter Verwendung von 16A bis 16D beschrieben.
  • Bei dem aufgezeichnete-Audiodaten-Wiedergabeanfangszeiger-Setzschritt S113 wird der Wiedergabezeiger bei dem Kopf von aufgezeichneten Audiodaten gesetzt, und der Fluss setzt sich mit dem aufgezeichnete-Audiodaten-Wiedergabestartschritt S114 fort. Bei dem aufgezeichnete-Audiodaten-Wiedergabestartschritt S114 wird eine Wiedergabe von aufgezeichneten Audiodaten gestartet, und der Fluss kehrt dann zu dem Ereignisakquisitionsschritt S1 in 2 zurück.
  • [Prozess "Betätigung bzw. Drücken von Stoppknopf": 4]
  • Nachfolgend wird der Prozess "Betätigung bzw. Drücken von Stoppknopf" unter Verwendung von 4 beschrieben.
  • Bei dem Lesezeigersetupprüf(stopp)schritt S201 wird es geprüft, ob der "Lesezeiger" gesetzt ist. Ist der "Lesezeiger" gesetzt, setzt sich der Fluss mit dem Sprachsynthesepausenkennungslösch(stopp)schritt S203 fort; andernfalls setzt sich der Fluss mit dem Wiedergabezeigersetupprüf(stopp)schritt S202 fort.
  • Bei dem Wiedergabezeigersetupprüf(stopp)schritt S202 wird es geprüft, ob der "Wiedergabezeiger" gesetzt ist. Ist der "Wiedergabezeiger" gesetzt, setzt sich der Fluss mit dem Wiedergabepausenkennungslösch(stopp)schritt S206 fort; andernfalls kehrt der Fluss dann zu dem Ereignisakquisitionsschritt S1 zurück.
  • Bei dem Sprachsynthesepausenkennungslösch(stopp)schritt S203 wird eine Sprachsynthesepausenkennung gelöscht. Bei dem Lesezeigerlösch(stopp)schritt S204 wird der Lesezeiger gelöscht (inaktiv gesetzt). Bei dem Sprachsynthesestoppschritt S205 wird eine Sprachsynthese gestoppt, und der Fluss kehrt zu dem Ereignisakquisitionsschritt S1 in 2 zurück.
  • Bei dem Wiedergabepausenkennungslösch(stopp)schritt S206 wird die Wiedergabepausenkennung gelöscht. Bei dem Wiedergabezeigerlösch(stopp)schritt S207 wird der Wiedergabezeiger gelöscht (inaktiv gesetzt). Bei dem aufgezeichnete-Audiodaten-Wiedergabestoppschritt S208 wird die Wiedergabe von aufgezeichneten Audiodaten gestoppt, und der Fluss kehrt dann zu dem Ereignisakquisitionsschritt S1 in 2 zurück.
  • [Prozess "Betätigung bzw. Drücken von Pausenknopf": 5]
  • Nachfolgend wird der Prozess "Betätigung bzw. Drücken von Pausenknopf" unter Verwendung von 5 beschrieben.
  • Bei dem Lesezeigersetupprüf(pausen)schritt S301 wird es geprüft, ob der "Lesezeiger" gesetzt ist. Ist der "Lesezeiger" gesetzt, setzt sich der Fluss mit dem Sprachsynthesepausenkennungssetupprüfschritt S302 fort; andernfalls springt der Fluss zu dem Wiedergabezeigersetupprüf(pausen)schritt S305.
  • Bei dem Sprachsynthesepausenkennungssetupprüfschritt S302 wird es geprüft, ob die Sprachsynthesepausenkennung gesetzt ist, das heißt, ob die Sprachsynthese pausiert. Ist die Sprachsynthesepausenkennung gesetzt, setzt sich der Fluss mit dem Lesezeigersetupprüf(wiedergabe)schritt S101 in 3 fort; andernfalls setzt sich der Fluss mit dem Sprachsynthesepausenkennungssetzschritt S303 fort.
  • Bei dem Sprachsynthesepausenkennungssetzschritt S303 wird die Sprachsynthesepausenkennung gesetzt (mit einem "wahr"-Wert gesetzt). Bei dem Sprachsynthesepausenschritt S304 pausiert die Sprachsynthese, und der Fluss kehrt dann zu dem Ereignisakquisitionsschritt S1 in 2 zurück.
  • Bei dem Wiedergabezeigersetupprüf(pausen)schritt S305 wird es geprüft, ob der "Wiedergabezeiger" gesetzt ist. Ist der "Wiedergabezeiger" gesetzt, setzt sich der Fluss mit dem Wiedergabepausenkennungssetupprüfschritt S306 fort; andernfalls kehrt der Fluss zu dem Ereignisakquisitionsschritt S1 in 2 zurück.
  • Bei dem Wiedergabepausenkennungssetupprüfschritt S306 wird es geprüft, ob eine "Wiedergabepausenkennung" gesetzt ist, das heißt, ob die Wiedergabe von aufgezeichneten Audiodaten pausiert. Ist die "Wiedergabepausenkennung" gesetzt, setzt sich der Fluss mit dem Lesezeigersetupprüf(wiedergabe)schritt S101 in 3 fort; andernfalls setzt sich der Fluss mit dem Wiedergabepausenkennungssetzschritt S307 fort.
  • Bei dem Wiedergabepausenkennungssetzschritt S307 wird die Wiedergabepausenkennung gesetzt (mit einem "wahr"-Wert gesetzt). Bei dem aufgezeichnete-Audiodaten-Wiedergabepausenschritt S308 pausiert die Wiedergabe von aufgezeichneten Audiodaten, und der Fluss kehrt dann zu dem Ereignisakquisitionsschritt S1 in 2 zurück.
  • [Prozess "Betätigung bzw. Drücken von Vorspulknopf": 6]
  • Nachfolgend wird der Prozess "Betätigung bzw. Drücken von Vorspulknopf" unter Verwendung von 6 beschrieben.
  • Bei dem Lesezeigersetupprüf(vorspul)schritt S401 wird es geprüft, ob der "Lesezeiger" gesetzt ist. Ist der "Lesezeiger" gesetzt, setzt sich der Fluss mit dem Vorspullesezeitgeberbetriebsartsetzschritt S402 fort; andernfalls springt der Fluss zu dem Wiedergabezeigersetupprüf(vorspul)schritt S405.
  • Bei dem Vorspullesezeitgeberbetriebsartsetzschritt S402 wird eine Zeitgeberbetriebsart als "Vorspullesen" gesetzt, und der Fluss setzt sich mit dem Vorspulereignismaskensetzschritt S403 fort. Die Zeitgeberbetriebsart gibt den Zweck einer Verwendung des Zeitgebers an.
  • Bei dem Vorspulereignismaskensetzschritt S403 wird eine Ereignismaske für einen Vorspulprozess gesetzt, um ein bei dem Ereignisakquisitionsschritt S1 zu akquirierendes Ereignis nur auf "Lösen von Vorspulknopf", "Sprachsynthesedatenanforderung", "aufgezeichnete-Audiowiedergabedaten-Anforderung", und "Zeitgeberereignis" zu begrenzen
  • Bei dem Zeitgeberstart(vorspul)schritt S404 wird der Zeitgeber gestartet, so dass ein Zeitgeberereignis nach Ablauf einer vorbestimmten Zeitdauer auftritt. Der Fluss kehrt dann zu dem Ereignisakquisitionsschritt S1 in 2 zurück.
  • Bei dem Wiedergabezeigersetupprüf(vorspul)schritt S405 wird es geprüft, ob der Wiedergabezeiger gesetzt ist. Ist der Wiedergabezeiger gesetzt, setzt sich der Fluss mit dem Vorspulwiedergabezeitgeberbetriebsartsetzschritt S406 fort; andernfalls kehrt der Fluss zu dem Ereignisakquisitionsschritt S1 in 2 zurück.
  • Bei dem Vorspulwiedergabezeitgeberbetriebsartsetzschritt S406 wird die Zeitgeberbetriebsart als "Vorspulwiedergabe" gesetzt, und der Fluss setzt sich mit dem Vorspulereignismaskensetzschritt S403 fort.
  • [Prozess "Lösen von Vorspulknopf": 7]
  • Nachfolgend wird der Prozess "Lösen von Vorspulknopf" unter Verwendung von 7 beschrieben.
  • Bei dem Ereignismaskenlösch(vorspul)schritt S501 wird die Ereignismaske gelöscht, so dass es zulässig ist, bei dem anschließenden Ereignisakquisitionsschritt S1 alle Ereignisse zu akquirieren.
  • Bei dem Zeitgeberbetriebsartrücksetz-/Zeitgeberstopp(vorspul)schritt S502 wird die Zeitgeberbetriebsart zurückgesetzt, und dann wird der Zeitgeber gestoppt.
  • Bei dem Lesezeigersetupprüf(vorspullöse)schritt S503 wird es geprüft, ob der "Lesezeiger" gesetzt ist. Ist der "Lesezeiger" gesetzt, setzt sich der Fluss mit dem Lesebetriebsartprüf(vorspul)schritt S504 fort; andernfalls setzt sich der Fluss mit dem Wiedergabezeigersetupprüf(vorspullöse)schritt S511 fort.
  • Bei dem Lesebetriebsartprüf(vorspul)schritt S504 wird es geprüft, ob eine Lesebetriebsart "Vorspulen" ist. Ist die Lesebetriebsart "Vorspulen", setzt sich der Fluss mit dem Lesebetriebsartrücksetz(vorspul)schritt S505 fort; andernfalls springt der Fluss zu dem Sprachsynthesestopp(vorspul)schritt S508.
  • Bei dem Lesebetriebsartrücksetz(vorspul)schritt S505 wird die Lesebetriebsart zurückgesetzt. Bei dem Lesezeigerwiederherstell(vorspul)schritt S506 wird der Lesezeiger, der in eine bei Schritt S1207 in 14 erzeugte Zusammenfassung gesetzt ist, an eine entsprechende Position in einem Quelldokument gesetzt.
  • Bei dem Zusammenfassungswegwerfschritt bzw. Zusammenfassungsaussonderschritt S507 wird die Zusammenfassung weggeworfen bzw. ausgesondert, und der Fluss kehrt dann zu dem Ereignisakquisitionsschritt S1 in 2 zurück.
  • Bei dem Sprachsynthesestopp(vorspul)schritt S508 wird die Sprachsynthese gestoppt. Bei dem Lesezeigervorwärtsübersprungschritt S509 wird der Lesezeiger zu dem Kopf eines Satzes bewegt, der dem Satz am nächsten ist, welcher gegenwärtig laut gelesen wird. Bei dem Sprachsynthesestart(vorspul)schritt S510 wird eine Sprachsynthese gestartet, und der Fluss kehrt dann zu dem Ereignisakquisitionsschritt S1 in 2 zurück.
  • Andererseits wird es bei dem Wiedergabezeigersetupprüf(vorspullöse)schritt S511 geprüft, ob der "Wiedergabezeiger" gesetzt ist. Ist der "Wiedergabezeiger" gesetzt, setzt sich der Fluss mit dem aufgezeichnetes-Audio-Wiedergabebetriebsart-Prüf(vorspul)schritt S512 fort; andernfalls kehrt der Fluss zu dem Ereignisakquisitionsschritt S1 in 2 zurück.
  • Bei dem aufgezeichnetes-Audio-Wiedergabebetriebsart-Prüf(vorspul)schritt S512 wird es geprüft, ob eine Wiedergabebetriebsart von aufgezeichnetem Audio "Vorspulen" ist. Ist die Wiedergabebetriebsart von aufgezeichnetem Audio "Vorspulen", setzt sich der Fluss mit dem aufgezeichnetes-Audio-Wiedergabebetriebsart-Rücksetz(vorspul)schritt S513 fort; andernfalls springt der Fluss zu dem aufgezeichnete-Audiodaten-Wiedergabestopp(vorspul) schritt S514.
  • Bei dem aufgezeichnetes-Audio-Wiedergabebetriebsart-Rücksetz(vorspul)schritt S513 wird die Wiedergabebetriebsart von aufgezeichnetem Audio zurückgesetzt, und der Fluss kehrt dann zu dem zu dem Ereignisakquisitionsschritt S1 in 2 zurück. Bei dem aufgezeichnete-Audiodaten-Wiedergabestopp(vorspul)schritt S514 wird eine Wiedergabe von aufgezeichneten Audiodaten gestoppt. Bei dem Wiedergabezeigervorwärtsübersprungschritt S515 wird der Wiedergabezeiger um einen Index weiter gesetzt. Wenn die aufgezeichneten Audiodaten beispielsweise Musikdaten sind, bewegt sich der Wiedergabezeiger zu dem Kopf bzw. Anfang des nächsten Lieds.
  • Bei dem aufgezeichnete-Audiodaten-Wiedergabestart(vorspul)schritt S516 wird eine Wiedergabe von aufgezeichneten Audiodaten gestartet, und der Fluss kehrt dann zu dem Ereignisakquisitionsschritt S1 in 2 zurück.
  • [Prozess "Betätigung bzw. Drücken von Rückspulknopf": 8]
  • Nachfolgend wird der Prozess "Betätigung bzw. Drücken von Rückspulknopf" unter Verwendung von 8 beschrieben.
  • Bei dem Lesezeigersetupprüf(rückspul)schritt S601 wird es geprüft, ob der "Lesezeiger" gesetzt ist. Ist der "Lesezeiger" gesetzt, setzt sich der Fluss mit dem Rückspullesezeitgeberbetriebsartsetzschritt S602 fort; andernfalls setzt sich der Fluss mit dem Wiedergabezeigersetupprüf(rückspul)schritt S605 fort.
  • Bei dem Rückspullesezeitgeberbetriebsartsetzschritt S602 wird die Zeitgeberbetriebsart als "Rückspullesen" gesetzt, und der Fluss setzt sich dann mit dem Rückspulereignismaskensetzschritt S603 fort.
  • Bei dem Rückspulereignismaskensetzschritt S603 wird eine Ereignismaske für einen Rückspulprozess gesetzt, um ein bei dem Ereignisakquisitionsschritt S1 in 2 zu akquirierendes Ereignis nur auf "Lösen von Rückspulknopf", "Sprachsynthesedatenanforderung", "aufgezeichnetes-Audio-Wiedergabedatenanforderung", und "Zeitgeberereignis" zu begrenzen
  • Bei dem Zeitgeberstart(rückspul)schritt S604 wird der Zeitgeber gestartet, so dass ein Zeitgeberereignis nach Ablauf einer vorbestimmten Zeitdauer auftritt. Der Fluss kehrt dann zu dem Ereignisakquisitionsschritt S1 in 2 zurück.
  • Bei dem Wiedergabezeigersetupprüf(rückspul)schritt S605 wird es geprüft, ob der "Wiedergabezeiger" gesetzt ist. Ist der "Wiedergabezeiger" gesetzt, setzt sich der Fluss mit dem Rückspulwiedergabe-Zeitgeberbetriebsart-Setzschritt S606 fort; andernfalls kehrt der Fluss zu dem Ereignisakquisitionsschritt S1 in 2 zurück.
  • Bei dem Rückspulwiedergabe-Zeitgeberbetriebsart-Setzschritt S606 wird die Zeitgeberbetriebsart als "Rückspulwiedergabe" gesetzt, und der Fluss setzt sich mit dem Rückspulereignismaskensetzschritt S603 fort.
  • [Prozess "Lösen von Rückspulknopf": 9]
  • Nachfolgend wird der Prozess "Lösen von Rückspulknopf" unter Verwendung von 9 beschrieben.
  • Bei dem Ereignismaskenlösch(rückspul)schritt S701 wird die Ereignismaske gelöscht, so dass es zulässig ist, bei dem anschließenden Ereignisakquisitionsschritt S1 alle Ereignisse zu akquirieren.
  • Bei dem Zeitgeberbetriebsartrücksetz-/Zeitgeberstopp(rückspul)schritt S702 wird die Zeitgeberbetriebsart zurückgesetzt, und dann wird der Zeitgeber gestoppt.
  • Bei dem Lesezeigersetupprüf(rückspullöse)schritt S703 wird es geprüft, ob der "Lesezeiger" gesetzt ist. Ist der "Lesezeiger" gesetzt, setzt sich der Fluss mit dem Lesebetriebsartprüf(rückspul)schritt S704 fort; andernfalls setzt sich der Fluss mit dem Wiedergabezeigersetupprüf(rückspullöse)schritt S711 fort.
  • Bei dem Lesebetriebsartprüf(rückspul)schritt S704 wird es geprüft, ob eine Lesebetriebsart "Rückspulen" ist. Ist die Lesebetriebsart "Rückspulen", setzt sich der Fluss mit dem Lesebetriebsartrücksetz(rückspul)schritt S705 fort; andernfalls springt der Fluss zu dem Sprachsynthesestopp(rückspul)schritt S708.
  • Bei dem Lesebetriebsartrücksetz(rückspul)schritt S705 wird die Lesebetriebsart zurückgesetzt. Bei dem Lesezeigerwiederherstell(rückspul)schritt S706 wird der Lesezeiger, der in eine bei Schritt S1204 in 14 erzeugte Liste erster Wörter gesetzt ist, an eine entsprechende Position in einem Quelldokument gesetzt (unter Verwendung von bei Schritt S1205 erzeugten Informationen).
  • Bei dem Liste-erster-Wörter-Wegwerfschritt bzw. Liste-erster-Wörter-Aussonderschritt S707 wird die Liste eines ersten Worts weggeworfen bzw. ausgesondert, und der Fluss kehrt dann zu dem Ereignisakquisitionsschritt S1 in 2 zurück.
  • Bei dem Sprachsynthesestopp(rückspul)schritt S708 wird die Sprachsynthese gestoppt. Bei dem Lesezeigerrückwärtsübersprungschritt S709 wird der Lesezeiger zu dem Kopf bzw. Anfang eines Satzes bewegt, der vor dem Satz ist, welcher gegenwärtig laut gelesen wird.
  • Bei dem Sprachsynthesestart(rückspul)schritt S710 wird eine Sprachsynthese gestartet, und der Fluss kehrt dann zu dem Ereignisakquisitionsschritt S1 in 2 zurück.
  • Bei dem Wiedergabezeigersetupprüf(rückspullöse)schritt S711 wird es geprüft, ob der "Wiedergabezeiger" gesetzt ist. Ist der "Wiedergabezeiger" gesetzt, setzt sich der Fluss mit dem aufgezeichnetes-Audio-Wiedergabebetriebsart-Prüf(rückspul)schritt S712 fort; andernfalls kehrt der Fluss zu dem Ereignisakquisitionsschritt S1 in 2 zurück.
  • Bei dem aufgezeichnetes-Audio-Wiedergabebetriebsart-Prüf(rückspul)schritt S712 wird es geprüft, ob eine Wiedergabebetriebsart von aufgezeichnetem Audio "Rückspulen" ist. Ist die Wiedergabebetriebsart von aufgezeichnetem Audio "Rückspulen", setzt sich der Fluss mit dem aufgezeichnetes-Audio-Wiedergabebetriebsart-Rücksetz(rückspul)schritt S713 fort; andernfalls springt der Fluss zu dem aufgezeichnete-Audiodaten-Wiedergabestopp(rückspul)schritt S714.
  • Bei dem aufgezeichnetes-Audio-Wiedergabebetriebsart-Rücksetz(rückspul)schritt S713 wird die Wiedergabebetriebsart von aufgezeichnetem Audio zurückgesetzt, und der Fluss kehrt dann zu dem zu dem Ereignisakquisitionsschritt S1 in 2 zurück.
  • Bei dem aufgezeichnete-Audiodaten-Wiedergabestopp(rückspul)schritt S714 wird eine Wiedergabe von aufgezeichneten Audiodaten gestoppt. Bei dem Wiedergabezeigerrückwärtsübersprungschritt S715 wird der Wiedergabezeiger um einen Index zurückgesetzt. Wenn die aufgezeichneten Audiodaten beispielsweise Musikdaten sind und der Wiedergabezeiger um keinen Index überlappt, bewegt sich der Wiedergabezeiger zu dem Kopf bzw. Anfang des gegenwärtigen Lieds.
  • Bei dem aufgezeichnete-Audiodaten-Wiedergabestart(rückspul)schritt S716 wird eine Wiedergabe von aufgezeichneten Audiodaten gestartet, und der Fluss kehrt dann zu dem Ereignisakquisitionsschritt S1 in 2 zurück.
  • [Prozess "Ankunft von neuen Informationen": 10]
  • Nachfolgend wird der Prozess "Ankunft von neuen Informationen" unter Verwendung von 10 beschrieben.
  • Bei dem bevorzugter-Lesesatz-Vorhandenseinprüf(neuankunfts)schritt S801 wird es geprüft, ob ein vorrangiger bzw. bevorzugter Lesesatz vorhanden ist. Ist der bevorzugte Lesesatz vorhanden, setzt sich der Fluss zu dem Neuankunftslesesatzhinzufügeschritt S807 fort; andernfalls setzt sich der Fluss mit dem Neuankunftsmitteilungsmeldungskopierschritt S802 fort.
  • Bei dem Neuankunftsmitteilungsmeldungskopierschritt S802 wird eine neu angekommene Mitteilungsmeldung bzw. Mitteilungsnachricht zu dem Kopf bzw. Anfang des bevorzugten Lesesatzes kopiert. 17 zeigt ein Beispiel der neu angekommenen Mitteilungsmeldung bzw. Mitteilungsnachricht.
  • Bei dem Neuankunftlesesatzkopierschritt S803 wird der neue Lesesatz zu einer Position hinter der neu angekommenen Mitteilungsmeldung in dem bevorzugten Lesesatz kopiert.
  • Bei dem Lesezeigersetupprüf(Neuankunfts)schritt S804 wird es geprüft, ob der Lesezeiger gesetzt ist. Ist der Lesezeiger gesetzt, setzt sich der Fluss mit dem Lesezeigerbackuperzeugungs(neuankunfts)schritt S805 fort; andernfalls setzt sich der Fluss mit Schritt S101 fort.
  • Bei dem Lesezeigerbackuperzeugungs(neuankunfts)schritt S805 wird der gegenwärtige Wert des Lesezeigers als zusätzliche Informationen für den bevorzugten Lesesatz gehalten.
  • Bei den Neuankunftslesezeigersetzschritt S806 wird der Lesezeiger an den Kopf bzw. den Anfang des bevorzugten Lesesatzes gesetzt, und der Fluss kehrt zu dem Ereignisakquisitionsschritt S1 zurück.
  • Bei dem Neuankunftslesesatzhinzufügeschritt S807 wird ein neu angekommener Lesesatz zu dem Ende des bevorzugten Lesesatzes hinzugefügt, und der Fluss kehrt dann zu dem Ereignisakquisitionsschritt S1 in 2 zurück.
  • [Prozess "Leseanweisung für gespeicherte Informationen": 11]
  • Der Prozess "Leseanweisung für gespeicherte Informationen" wird nachfolgend unter Verwendung von 11 beschrieben.
  • Bei dem Lesezeigersetupprüf(gespeicherte-Informationen-Lesen)schritt S901 wird es geprüft, ob der "Lesezeiger" gesetzt ist. Ist der "Lesezeiger gesetzt", setzt sich der Fluss mit dem Lesen-läuft-Warnunganzeigeschritt S905 fort; andernfalls setzt sich der Fluss mit dem gespeicherter-Lesesatz-Kopierschritt S902 fort.
  • Bei dem gespeicherter-Lesesatz-Kopierschritt S902 werden bei dem gespeicherte-Informationen-Leseanweisungsprüfschritt S10 angewiesene Informationen von in der externen Speichereinheit H5 gespeicherten Informationen in einen gespeicherten Lesesatz kopiert.
  • Bei dem bevorzugter-Lesesatz-Vorhandenseinprüf(gespeicherte-Informationen-Lese)schritt S903 wird es geprüft, ob ein "bevorzugter Lesesatz vorhanden ist". Wenn der "bevorzugte Lesesatz vorhanden ist", setzt sich der Fluss mit dem Lesezeigerbackupsetzschritt S904 fort; andernfalls kehrt der Fluss zu dem Ereignisakquisitionsschritt S1 zurück.
  • Bei dem Leseziegrebackupsetzschritt S904 wird der Anfang des gespeicherten Lesesatzes als zusätzliche Informationen für den bevorzugten Lesesatz gesetzt, und der Fluss kehrt dann zu dem Ereignisakquisitionsschritt S1 in 2 zurück.
  • Bei dem Lesen-läuft-Warnunganzeigeschritt S905 wird eine Warnung ausgegeben, die anzeigt dass ein Lesen nun läuft bzw. stattfindet, und der Fluss kehrt dann zu dem Ereignisakquisitionsschritt S1 in 2 zurück.
  • [Prozess: "Sprachsynthesanforderungsanweisung": 12]
  • Nachfolgend wird der Prozess "Sprachsyntheseanforderungsanweisung" unter Verwendung von 12 beschrieben.
  • Bei dem synthetische-Sprachdaten-Vorhandenseinprüfschritt S1001 wird es geprüft, ob bereits "Wellenformdaten" vorhanden sind, die von Text in eine Sprachwellenform umgewandelt worden sind. Sind die "Wellenformdaten" vorhanden, springt der Fluss zu einem synthetische-Daten-Kopierschritt S1007; andernfalls setzt sich der Fluss mit einem Lesezeigersetupprüf(Sprachausgabe)schritt S1002 fort.
  • Bei dem Lesezeigersetupprüf(Sprachausgabe)schritt S1002 wird es geprüft, ob der "Lesezeiger" gesetzt ist. Wenn der "Lesezeiger gesetzt ist", setzt sich der Fluss mit dem Dokumentdatenendeprüfschritt S1003 fort; andernfalls kehrt der Fluss zu dem Ereignisakquisitionsschritt S1 in 2 zurück.
  • Bei dem Dokumentdatenendeprüfschritt S1003 wird es geprüft, ob der "Lesezeiger das Ende von Dokumentdaten erreicht hat". Wenn der "Lesezeiger das Ende der Dokumentdaten erreicht hat, setzt sich der Fluss mit dem Lesezeigerbackupvorhandenseinprüfschritt S1008 fort; andernfalls setzt sich der Fluss mit dem Dokumentdatenextraktionsschritt S1004 fort.
  • Bei dem Dokumentdatenextraktionsschritt S1004 werden Daten mit einer gegebenen Größe (für beispielsweise einen Satz) aus Dokumentdaten extrahiert. Bei dem synthetische-Sprachdaten-Erzeugungsschritt S1005 werden die extrahierten Daten einem Sprachsyntheseprozess unterzogen, um synthetische Sprachdaten zu erlangen.
  • Bei dem Lesezeigerbewegungsschritt S1006 wird der Lesezeiger um die Größe von bei dem Dokumentdatenextraktionsschritt S1004 extrahierten Daten bewegt, und der Fluss setzt sich mit dem synthetische-Sprachdaten-Kopierschritt S1007 fort.
  • Bei dem synthetische-Sprachdaten-Kopierschritt S1007 werden Daten einer gegebenen Größe (die Puffergröße einer Ausgabevorrichtung synthetischer Sprache) aus den synthetischen Sprachdaten zu der Ausgabevorrichtung synthetischer Sprache ausgegeben, und der Fluss kehrt dann zu dem Ereignisakquisitionsschritt S1 zurück.
  • Bei dem Lesezeigerbackupvorhandenseinprüfschritt S1008 wird es geprüft, ob ein "Backup des Lesezeigers vorhanden ist" als zusätzliche Informationen von Dokumentdaten. Wenn das "Backup des Lesezeigers vorhanden ist", setzt sich der Fluss mit dem Lesezeigerbackupwiederherstellschritt S1009 fort; andernfalls springt der Fluss zu dem Lesezeigerlöschschritt S1010.
  • Bei dem Lesezeigerbackupwiederherstellschritt S1009 wird das an die Dokumentdaten angehängte Backup des Lesezeigers als ein Lesezeiger gesetzt, und der Fluss setzt sich mit dem Dokumentdatenendeprüfschritt S1003 fort.
  • Bei dem Lesezeigerlöschschritt S1010 wird der Lesezeiger gelöscht (inaktiv gesetzt). Dann kehrt der Fluss zu dem Ereignisakquisitionsschritt S1 zurück.
  • [Prozess "Wiedergabeanforderungsanweisung von aufgezeichnetem Audio": 13]
  • Nachfolgend wird der Prozess "Wiedergabeanforderungsanweisung von aufgezeichnetem Audio" unter Verwendung von 13 beschrieben.
  • Bei dem Wiedergabezeigersetupprüf(aufgezeichnetes-Audio-Wiedergabe)schritt S1101 wird es geprüft, ob der "Wiedergabezeiger gesetzt ist". Wenn der "Wiedergabezeiger gesetzt ist", setzt sich der Fluss mit dem "aufgezeichnetes-Audio-Wiedergabebetriebsart-Prüf(Rückspulen 2)schritt S1102 fort; andernfalls kehrt der Fluss zu dem Ereignisakquisitionsschritt S1 zurück.
  • Bei dem aufgezeichnetes-Audio-Wiedergabebetriebsartq-Prüf(Rückspulen 2)schritt S1102 wird es geprüft, ob eine Wiedergabebetriebsart von aufgezeichnetem Audio "Rückspulen" ist. Ist die Wiedergabebetriebsart von aufgezeichnetem Audio "Rückspulen", setzt sich der Fluss mit dem Wiedergabezeigeranfangsprüfschritt S1109 fort; andernfalls setzt sich der Fluss mit dem Wiedergabezeigerendeprüfschritt S1103 fort.
  • Bei dem Wiedergabezeigerendeprüfschritt S1103 wird es geprüft, ob der "Wiedergabezeiger das Ende (Letzte) von aufgezeichneten Audiodaten erreicht hat". Wenn der "Wiedergabezeiger das Ende (Letzte) von aufgezeichneten Audiodaten erreicht hat", setzt sich der Fluss mit dem Wiedergabezeigerlöschschritt S1104 fort; andernfalls springt der Fluss zu dem aufgezeichnete-Audiodaten-Kopierschritt S1105.
  • Bei dem Wiedergabezeigerlöschschritt S1104 wird der Wiedergabezeiger gelöscht und der Fluss kehrt dann zu dem Ereignisakquisitionsschritt S1 zurück.
  • Bei dem aufgezeichnete-Audiodaten-Kopierschritt S1105 werden Daten einer gegebenen Größe (die Puffergröße einer Ausgabevorrichtung aufgezeichneter Audiodaten) aus den aufgezeichneten Audiodaten zu der Ausgabevorrichtung aufgezeichneter Audiodaten ausgegeben, und der Fluss setzt sich mit dem aufgezeichnetes-Audio-Wiedergabebetriebsart-Prüf(Vorspulen 2)schritt S1106 fort.
  • Bei dem aufgezeichnetes-Audio-Wiedergabebetriebsart-Prüf(Vorspulen 2)schritt S1106 wird es geprüft, ob die "Wiedergabebetriebsart von aufgezeichnetem Audio Vorspulen" ist. Ist die "Wiedergabebetriebsart von aufgezeichnetem Audio Vorspulen", setzt sich der Fluss mit dem Wiedergabezeigervorspulbewegungsschritt S1107 fort; andernfalls springt der Fluss zu dem Wiedergabezeigerbewegungsschritt S1108.
  • Bei dem Wiedergabezeigervorspulbewegungsschritt S1107 wird der Wiedergabezeiger um eine Größe weitergesetzt, die größer als eine Ausgabe bei dem aufgezeichnete-Audiodaten-Kopierschritt S1105 ist (beispielsweise das zehnfache der vorbestimmten Größe), und der Fluss kehrt dann zu dem Ereignisakquisitionsschritt S1 in 2 zurück.
  • Bei dem Wiedergabezeigerbewegungsschritt S1108 wird der Wiedergabezeiger um die Größe weitergesetzt, die bei dem aufgezeichnete-Audiodaten-Kopierschritt S1105 ausgegeben ist, und der Fluss kehrt dann zu dem Ereignisakquisitionsschritt S1 in 2 zurück.
  • Bei dem Wiedergabezeigeranfangsprüfschritt S1109 wird es geprüft, ob der "Wiedergabezeiger den Anfang von aufgezeichneten Audiodaten angibt". Wenn der "Wiedergabezeiger den Anfang von aufgezeichneten Audiodaten angibt", kehrt der Fluss zu dem Ereignisakquisitionsschritt S1 zurück; andernfalls setzt sich der Fluss mit dem aufgezeichnete-Audiodaten-umgekehrte-Reihenfolge-Kopierschritt S1110 fort.
  • Bei dem aufgezeichnete-Audiodaten-umgekehrte-Reihenfolge-Kopierschritt S1110 werden, wie bei dem aufgezeichnete-Audiodaten-Kopierschritt S1105, Daten mit der gegebenen Größe (die Puffergröße der Ausgabevorrichtung aufgezeichneter Audiodaten) an die Ausgabevorrichtung aufgezeichneter Audiodaten ausgegeben. In diesem Fall werden die Daten in der umgekehrten Reihenfolge ausgegeben.
  • Bei dem Wiedergabezeigerrückspulbewegungsschritt S1111 wird der Wiedergabezeiger in einer Richtung entgegengesetzt zu der bei dem Wiedergabeprozess bewegt, und der Fluss kehrt dann zu dem Ereignisakquisitionsschritt S1 in 2 zurück.
  • [Prozess "Zeitgeberereignis": 14]
  • Nachfolgend wird der Prozess "Zeitgeberereignis" unter Verwendung von 14 beschrieben.
  • Bei dem Zeitgeberstoppschritt S1201 wird der Zeitgeber gestoppt.
  • Bei dem Zeitgeberbetriebsartprüf(vorspullesen)schritt S1202 wird es geprüft, ob die Zeitgeberbetriebsart "Vorspullesen" ist. Ist die Zeitgeberbetriebsart "Vorspullesen", setzt sich der Fluss mit dem Zusammenfassungserzeugungsschritt S1207 fort; andernfalls setzt sich der Fluss mit dem Zeitgeberbetriebsartprüf(rückspullesen)schritt S1203 fort.
  • Bei dem Zeitgeberbetriebsartprüf(rückspullesen)schritt S1203 wird es geprüft, ob die Zeitgeberbetriebsart "Rückspullesen" ist. Ist die Zeitgeberbetriebsart "Rückspullesen", setzt sich der Fluss mit dem Liste-erster-Wörter-Erzeugungsschritt S1204 fort; andernfalls setzt sich der Fluss mit dem Zeitgeberbetriebsart-Prüf(vorspulwiedergabe)schritt S1210 fort.
  • Bei dem Liste-erster-Wörter-Erzeugungsschritt S1204 wird eine Liste von Wörtern an dem Anfang von jeweiligen Sätzen erzeugt, welche von dem Anfang des durch den Lesezeiger angegebenen Dokuments bis zu der Position des Lesezeigers vorhanden sind. 18A und 18B zeigen ein Beispiel der Liste erster Wörter. 18A gibt ein Quelldokument an, und 18B gibt ein Bild der erzeugten Liste erster Wörter an. Es sei erwähnt, dass die Position des Lesezeigers derart gesetzt wird, dass sich der Lesezeiger an dem Ende des gelesenen Dokuments befindet. Wird ein Dokument laut gelesen, bewegt sich die Position des Lesezeigers in Synchronisation mit dem Leseprozess.
  • Bei dem Rückspullesezeigerbackuperzeugungsschritt S1205 werden entsprechende Punkte erzeugt, zu denen der Lesezeiger beim Wiederherstellen von der Rückspulbetriebsart zu bewegen ist. In 18A und 18B sind Pfeile, welche die Liste erster Wörter und das Quelldokument verbinden, die entsprechenden Punkte.
  • Bei dem Rückspullesebetriebsartsetzschritt S1206 wird die Lesebetriebsart als "Rückspulen" gesetzt, und der Fluss kehrt dann zu dem Ereignisakquisitionsschritt S1 in 2 zurück.
  • Bei dem Zusammenfassungserzeugungsschritt S1207 wird von der durch den Lesezeiger angegebenen Position zu dem Ende eines Dokuments eine Zusammenfassung erzeugt. 19A und 19B zeigen ein Beispiel der Zusammenfassung. 19A gibt ein Quelldokument an, und 19B gibt ein Bild der erzeugten Zusammenfassung an. Es sei erwähnt, dass die Position des Lesezeigers derart gesetzt wird, dass sich der Lesezeiger an dem Ende des gelesenen Dokuments befindet (das heißt an dem Anfang eines ungelesenen Teils). Wird ein Dokument laut gelesen, bewegt sich die Position des Lesezeigers in Synchronisation mit dem Leseprozess.
  • Bei dem Vorspullesezeigerbackuperzeugungsschritt S1208 werden entsprechende Punkte erzeugt, zu denen der Lesezeiger beim Wiederherstellen von der Vorspulbetriebsart zu bewegen ist. In 19A und 19B sind Pfeile, welche die Zusammenfassung und das Quelldokument verbinden, die entsprechenden Punkte. Jedoch veranschaulichen 19A und 19B zur Vereinfachung nicht alle entsprechenden Punkte.
  • Bei dem Vorspullesebetriebsartsetzschritt S1209 wird die Lesebetriebsart als "Vorspulen" gesetzt, und der Fluss kehrt dann zu dem Ereignisakquisitionsschritt S1 in 2 zurück.
  • Bei dem Zeitgeberbetriebsart-Prüf(vorspulwiedergabe)schritt S1210 wird es geprüft, ob die Zeitgebebetriebsart "Vorspulwiedergabe" ist. Ist die Zeitgeberbetriebsart "Vorspulwiedergabe" setzt sich der Fluss mit dem Vorspul-aufgezeichnetes-Audio-Wiedergabebetriebsart-Setzschritt S1211 fort; andernfalls springt der Fluss zu dem Rückspul-aufgezeichnetes-Audio-Wiedergabebetriebsart-Setzschritt S1212.
  • Bei dem Vorspul-aufgezeichnetes-Audio-Wiedergabebetriebsart-Setzschritt S1211 wird die Wiedergabebetriebsart von aufgezeichnetem Audio als "Vorspulen" gesetzt, und der Fluss kehrt zu dem Ereignisakquisitionsschritt S1 zurück.
  • Bei dem Rückspul-aufgezeichnetes-Audio-Wiedergabebetriebsart-Setzschritt S1212 wird die Wiedergabebetriebsart von aufgezeichnetem Audio als "Rückspulen" gesetzt, und der Fluss kehrt zu dem Ereignisakquisitionsschritt S1 in 2 zurück.
  • [Jeweilige Prozesse von "Sprachsynthese": 15A bis 15D]
  • Nachfolgend werden jeweilige Prozesse einer "Sprachsynthese" unter Verwendung von 15A bis 15D beschrieben.
  • 15A bis 15D zeigen jeweils die Prozesse bei den Routinen "Sprachsynthesestart", "Sprachsynthesestopp", "Sprachsynthesepause", und "Sprachsyntheseneustart".
  • Bei dem synthetische-Sprache-Ausgabevorrichtung-Setzschritt S1301 wird der Anfangs- bzw. Initialisierungssetupprozess (beispielsweise ein Setup einer Testrate bzw. Probenraten bzw. Abtastrate und dergleichen) einer Ausgabevorrichtung synthetischer Sprache ausgeführt.
  • Bei dem synthetische-Sprache-Ausgabevorrichtung-Startschritt S1302 wird die Ausgabevorrichtung synthetischer Sprache heraufgestartet, um einen Ausgabebetrieb synthetischer Sprache zu starten.
  • Bei einem synthetische-Sprachdaten-Löschschritt S1303 werden synthetische Sprachdaten gelöscht, welche bei dem synthetische-Sprachdaten-Erzeugungsschritt S1005 erzeugt und gehalten werden.
  • Bei dem synthetische-Sprache-Ausgabevorrichtung-Stoppschritt S1304 wird die Ausgabevorrichtung synthetischer Sprache gestoppt.
  • Bei dem synthetische-Sprache-Ausgabevorrichtung-Pausenschritt S1305 wird die Ausgabevorrichtung synthetischer Sprache in eine Pause gesetzt bzw. sie pausiert.
  • Bei dem synthetische-Sprache-Ausgabevorrichtung-Neustartschritt S1306 wird der Betrieb der bei dem synthetische-Sprache-Ausgabevorrichtung-Pausenschritt S1305 pausierenden Ausgabevorrichtung synthetischer Sprache neu gestartet.
  • [Jeweilige Prozesse von "Wiedergabe aufgezeichneter Audiodaten": 16A bis 16D]
  • Nachfolgend werden jeweilige Prozesse von "Wiedergabe aufgezeichneter Audiodaten" unter Verwendung von 16A bis 16D beschrieben. 16A bis 16D zeigen jeweils die Prozesse bei den Routinen "Wiedergabestart aufgezeichneter Audiodaten", "Wiedergabestopp aufgezeichneter Audiodaten", "Wiedergabepause aufgezeichneter Audiodaten", und "Wiedergabeneustart aufgezeichneter Audiodaten".
  • Bei dem aufgezeichnete-Audiodaten-Ausgabevorrichtung-Setzschritt S1401 wird der Anfangs- bzw. Initialisierungssetupprozess (beispielsweise ein Setup einer Testrate bzw. Probenraten bzw. Abtastrate und dergleichen) einer Ausgabevorrichtung aufgezeichneter Audiodaten ausgeführt.
  • Bei dem aufgezeichete-Audiodaten-Ausgabevorrichtung-Startschritt S1402 wird die Ausgabevorrichtung synthetischer Sprache heraufgestartet, um einen Ausgabebetrieb aufgezeichneter Audiodaten zu starten.
  • Bei dem aufgezeichnete-Audiodaten-Ausgabevorrichtung-Stoppschritt S1403 wird die Ausgabevorrichtung aufgezeichneter Audiodaten gestoppt.
  • Bei dem aufgezeichnete-Audiodaten-Ausgabevorrichtung-Pausenschritt S1404 wird die Ausgabevorrichtung aufgezeichneter Audiodaten in eine Pause gesetzt bzw. sie pausiert.
  • Bei dem aufgezeichnete-Audiodaten-Ausgabevorrichtung-Neustartschritt S1405 wird der Betrieb der bei dem aufgezeichnete-Audiodaten-Ausgabevorrichtung-Pausenschritt S1305 pausierenden Ausgabevorrichtung aufgezeichneter Audiodaten neu gestartet.
  • Es sei erwähnt, dass das zuvor beschriebene erste Ausführungsbeispiel ein Beispiel ist. Beispielsweise besteht die Liste erster Wörter bei dem Liste-erster-Wörter-Erzeugungsschritt S1204 aus einem Wort an dem Anfang jeden Satzes. Jedoch ist die vorliegende Erfindung nicht auf ein Wort an dem Anfang eines Satzes beschränkt, sondern es können eine Vielzahl von durch den Benutzer gesetzten Wörtern Verwendung finden.
  • Das Beispiel der Zusammenfassung bei dem Zusammenfassungserzeugungsschritt S1207 wird durch Extrahieren von Hauptteilen von jeweiligen Sätzen erzeugt. Jedoch muss die Zusammenfassung nicht immer für jeweilige Sätze erzeugt werden, und es können alle Sätze mit geringen Informationen ausgelassen werden.
  • Anstelle des Zusammenfassungserzeugungsschritts S1207 kann bei der Vorspulbetriebsart eine Liste erster Wörter erzeugt werden, wie in 28A und 28B gezeigt, und Wörter von "nachfolgend" an dem Kopf bzw. Anfang der erzeugten Liste erster Wörter bis "H4 bezeichnet" können wiederum aus dem Kopf bzw. Anfang ausgelesen werden.
  • Wird bei der Rückspulbetriebsart eine Zusammenfassung verwendet, kann eine in 29A und 29B als Beispiel dargestellte Zusammenfassung Verwendung finden.
  • Zudem kann eine eine Auslassung anzeigende Audioausgabe, wie beispielsweise ein Piepton, unter Verwendung von Sprachsynthese der Textdaten in Entsprechung mit Teilen ausgegeben werden, die nicht laut gelesen werden.
  • Darüber hinaus werden der Liste-erster-Wörter-Erzeugungsschritt S1204 und der Zusammenfassungserzeugungsschritt S1207 ausgeführt, nachdem das Freigabe- bzw. Löseereignis des Vorspul/Rückspulknopfes akquiriert ist, jedoch können diese Schritte nach dem neu-angekommener-Lesesatz-Kopierschritt S803, dem neu-angekommener-Lesesatz-Hinzufügeschritt S807, und dem gespeicherter-Lesesatz-Kopierschritt S902 ausgeführt werden. Auf diese Weise kann die Ansprechzeit vom Lösen des Vorspul/Rückspulknopfs verkürzt werden.
  • <Zweites Ausführungsbeispiel>
  • [Hardwareaufbau: 21, 27]
  • 21 ist ein Blockschaltbild, das den Hardwareaufbau eines tragbaren Informationsendgeräts H1200 bei dem zweiten Ausführungsbeispiel zeigt. 7 zeigt eine äußere Erscheinung des Informationsendgeräts H1200.
  • Das Bezugszeichen H11 bezeichnet eine zentrale Verarbeitungseinheit, welche Vorgänge bzw. Prozesse, wie beispielsweise numerische Operationen, eine Steuerung, und dergleichen ausführt und arithmetische Operationen gemäß einem Steuerprogramm vornimmt, das die Verarbeitungssequenz der vorliegenden Erfindung beschreibt. Das Bezugszeichen H12 bezeichnet eine Ausgabeeinheit, welche dem Benutzer Informationen präsentiert. Die Ausgabeeinheit H12 umfasst eine Audioausgabeeinheit H1201, wie beispielsweise einen Lautsprecher, einen Kopfhörer, oder dergleichen, und eine Bildschirmanzeigeeinheit H1202, wie beispielsweise eine Flüssigkristallanzeige oder dergleichen.
  • Das Bezugszeichen H13 bezeichnet eine Eingabeeinheit, bei welcher der Benutzer eine Betriebsanweisung zu dem Informationsendgerät H1200 ausgibt oder Informationen eingibt. Das Bezugszeichen H14 bezeichnet eine Datenkommunikationseinheit, wie beispielsweise eine LAN-Karte, eine PHS-Karte, oder dergleichen, welche zum Erlangen bzw. Akquirieren von Daten, wie beispielsweise neu angekommene Mailmitteilungen Verwendung findet. Das Bezugszeichen H15 bezeichnet eine Speichereinheit, wie beispielsweise eine Festplatte, einen nichtflüchtigen Speicher, oder dergleichen, welcher aufgezeichnete Audiodaten und gespeicherte Informationen hält.
  • Das Bezugszeichen H16 bezeichnet eine Nur-Lese-Speichereinheit, welche das Steuerprogramm, das den Ablauf der vorliegenden Erfindung angibt, und permanente Daten speichert, wie beispielsweise eine Sprachsynthesewörterbuch und dergleichen. Das Bezugszeichen H17 bezeichnet eine Speichereinheit, wie beispielsweise ein RAM oder dergleichen, welche Informationen zeitweise hält. Die Speichereinheit H17 hält zeitweise Daten, verschiedenste Kennungen (Flags), und dergleichen.
  • Das Bezugszeichen H18 bezeichnet eine Winkelerfassungseinheit, welche einen Wert entsprechend einem Winkel ausgibt und den Betriebsbetrag einer Wähleinheit H19 erfasst. Das Bezugszeichen H19 bezeichnet eine durch den Benutzer bedienbare Wähleinheit, welche mit der Winkelerfassungseinheit H18 verbunden ist. Die zentrale Verarbeitungseinheit H1 bis zu der Winkelerfassungseinheit H18 sind über einen Bus verbunden.
  • Es sollte hervorgehoben werden, dass die Prinzipien der vorliegenden Erfindung nicht auf eine Wähleinheit beschränkt ist, auch wenn das in 21 und 27 veranschaulichte Informationsendgerät eine Wähleinheit als eine Eingabevorrichtung verwendet. Die vorliegende Erfindung ist eher in gleicher Weise auf eine andere Eingabevorrichtung, wie beispielsweise eine Gleiteinstellvorrichtung anwendbar. Daher ist die folgende Diskussion anhand einer Erläuterung und nicht als Beschränkung zur Verfügung gestellt.
  • [Übersicht über Ereignisprozess bzw. -vorgang: 22]
  • Nachfolgend wird der Ereignisprozess bei dem zuvor genannten Informationsendgerät H1200 des zweiten Ausführungsbeispiels unter Verwendung der in 22 bis 24 gezeigten Flussdiagramme beschrieben. Es sei erwähnt, dass die nachfolgend zu beschreibenden Prozesse bzw. Vorgänge durch die zentrale Verarbeitungseinheit H11 unter Verwendung der Speichereinheit H17 (RAM oder dergleichen) ausgeführt werden, die Informationen auf der Grundlage eines in der Nur-Lese-Speichereinheit H16 oder dergleichen gespeicherten ereignisgesteuerten Steuerprogramms zeitweise speichert. Ein Eingabevorgang von der Eingabeeinheit H13, eine Datenanforderung von der Ausgabeeinheit H12, und ein Unterbrechungssignal, wie beispielsweise ein Zeitgeberunterbrechungssignal oder dergleichen werden als Anweisungen verarbeitet, welche den Start bzw. Beginn von jeweiligen Ereignissen bei dem Steuerprogramm anzeigen.
  • Bezug nehmend auf 22 sind jeweilige Variable bei einem Variabelanfangssetzschritt S1501 als Anfangswerte gesetzt.
  • Bei dem Sprachsynthesevorrichtungsstart/pauseschritt S1502 wird eine Sprachsynthesevorrichtung in eine Pause gesetzt bzw. sie pausiert.
  • Bei dem Ereignisakquisitionsschritt S1503 wird ein neues Ereignis akquiriert.
  • Bei einem Wählwinkeländerungsprüfschritt S1504 wird es geprüft, ob das bei dem Ereignisakquisitionsschritt S1503 akquirierte Ereignis als Reaktion auf eine "Änderung bei Wählwinkel" erzeugt ist. Ist das akquirierte Ereignis als Reaktion auf eine "Änderung bei Wählwinkel" erzeugt, setzt sich der Fluss mit Schritt S1601 fort; andernfalls setzt sich der Fluss mit dem Sprachsynthesedatenanforderungsprüfschritt S1505 fort.
  • Bei dem Sprachsynthesedatenanforderungsprüfschritt S1505 wird es geprüft, ob das bei dem Ereignisakquisitionsschritt S1503 akquirierte Ereignis eine "Datenanforderung von einer Ausgabevorrichtung synthetischer Sprache" ist. Ist das akquirierte Ereignis die "Datenanforderung von einer Ausgabevorrichtung synthetischer Sprache", setzt sich der Fluss mit Schritt S1701 fort; andernfalls kehrt der Fluss zu dem Ereignisakquisitionsschritt S1503 fort.
  • [Prozess bzw. vorgang "Wählwinkeländerung": 23]
  • Nachfolgend werden die zuvor erwähnten Ereignisse ausführlich beschrieben.
  • Zuerst wird der Prozess bzw. Vorgang "Wählwinkeländerung" unter Verwendung von 23 beschrieben.
  • Bei dem Prüfschritt S1601 eines neuen Wählwinkels wird es geprüft, ob ein neuer Wählwinkel "0" ist. Ist der neue Wählwinkel "0", setzt sich der Fluss mit dem synthetische-Sprache-Ausgabevorrichtung-Pausenschritt S1605 fort; andernfalls setzt sich der Fluss mit dem Wählwinkelvariableprüfschritt S1602 fort.
  • Bei dem Wählwinkelvariableprüfschritt S1602 wird es geprüft, ob der in der Wählwinkelvariable gehaltene vorhergehende Wählwinkel "0" ist. Ist der der in einer Wählwinkelvariable gehaltene vorhergehende Wählwinkel "0", setzt sich der Fluss mit dem synthetische-Sprache-Ausgabevorrichtung-Neustartschritt S1606 fort; andernfalls setzt sich der Fluss mit dem Wählwinkelvariable-Aktualisierungsschritt S1603 fort.
  • Bei dem Wählwinkelvariable-Aktualisierungsschritt S1603 wird ein neuer Wählwinkel in der Wählwinkelvariable ersetzt.
  • Bei dem Leseübersprungzählwert-Setzschritt S1604 wird ein Leseübersprungzählwert gemäß dem Wert des Wählwinkels gesetzt. Der Leseübersprungzählwert wird derart gesetzt, dass der absolute Wert des Übersprungzählwerts mit zunehmendem absoluten Wert des Wählwerts zunimmt, und der Wählwinkel und der Übersprungzählwert das selbe Vorzeichen haben. 25 zeigt ein Beispiel einer Entsprechungstabelle zwischen dem Wählwinkel (Einheitswinkel = θ) und dem Übersprungzählwert. Nachdem der Übersprungzählwert gesetzt ist, kehrt der Fluss zu dem Ereignisakquisitionsschritt S1503 zurück.
  • Bei dem synthetische-Sprache-Ausgabevorrichtung-Pausenschritt S1605 wird die Ausgabevorrichtung synthetischer Sprache in eine Pause gesetzt, und der Fluss kehrt zu dem Ereignisakquisitionsschritt S1503 zurück.
  • Bei dem synthetische-Sprache-Ausgabevorrichtung-Neustartschritt S1606 wird die bei dem synthetische-Sprache-Ausgabevorrichtung-Pausenschritt S1605 in Pause gesetzte Ausgabevorrichtung synthetischer Sprache neu gestartet, und der Fluss kehrt zu dem Wählwinkelvariable-Aktualisierungsschritt S1603 zurück.
  • [Prozess bzw. Vorgang "Sprachsyntheseanweisung": 24]
  • Nachfolgend wird der Prozess bzw. Vorgang "Sprachsyntheseanweisung" unter Verwendung von 24 beschrieben.
  • Bei dem synthetische-Sprachdatenende-Prüfschritt S1701 wird es geprüft, ob ein "Wortzähler gleich der Anzahl von Wörtern" ist. Ist der "Wortzähler gleich der Anzahl von Wörtern", setzt sich der Fluss mit dem Dokumentdatenextraktionsschritt S1709 fort; andernfalls setzt sich der Fluss mit dem Wählwinkelabsolutwertprüfschritt S1702 fort. Die Anzahl von Wörtern ist diejenige, die in einem Satz enthalten ist, welcher bei dem zuvor ausgeführten synthetische-Sprachdaten-Erzeugungschritt S1710 zu verarbeiten war, und wenn der Wortzähler gleich der Anzahl von Wörtern ist, zeigt es an, dass bei Schritt S1710 erlangte synthetische Sprachdaten ausgegeben worden sind.
  • Bei dem Wählwinkelabsolutwertprüfschritt S1702 wird es geprüft, ob der absolute Wert des in der Wählwinkelvariable gehaltenen Wählwinkels größer als "1" ist. Ist der absolute Wert des Wählwinkels größer als "1", setzt sich der Fluss mit dem Leseaufgabensatzaktualisierungsschritt S1717 fort; andernfalls setzt sich der Fluss mit dem Lesezeigerprüfschritt S1703 fort.
  • Bei dem Lesezigerprüfschritt S1703 wird es geprüft, ob ein "Lesezeiger gleich einem Leseaufgabensatz ist". Ist der "Lesezeiger gleich einem Leseaufgabensatz", setzt sich der Fluss mit einem Wortzählerprüfschritt S1704 fort; andernfalls springt der Fluss zu einem Sprachsynthesevorrichtungsstoppschritt S1705.
  • Bei dem Wortzählerprüfschritt S1704 wird es geprüft, ob der Wortzähler einen Wert von "0" hat. Hat der Wortzähler einen Wert von "0" setzt sich der Fluss mit einem Leseaufgabensatzaktualisierungsschritt S1717 fort; andernfalls setzt sich der Fluss mit dem Sprachsynthesevorrichtungstoppschritt S1705 fort.
  • Bei dem Sprachsynthesevorrichtungstoppschritt S1705 wird die Sprachsynthesevorrichtung gestoppt. Bei einem Pieptonausgabeschritt S1706 wird ein Piepton ausgegeben. Bei dem Sprachsynthesevorrichtungstart(2)schritt S1707 wird die Sprachsynthesevorrichtung gestartet.
  • Bei dem Wortzähleraktualisierungsschritt S1708 wird zu dem Wortzähler "1" hinzuaddiert, und der Fluss kehrt zu dem Ereignisakquisitionsschritt S1503 zurück.
  • Bei dem Dokumentdatenextraktionsschritt S1709 werden Daten für einen Satz aus einem Leseaufgabendokument extrahiert, um den Lesezeiger als die Anfangsposition zu haben.
  • Bei dem synthetische-Sprachdaten-Erzeugungsschritt S1710 wird der bei dem Dokumentdatenextraktionsschritt S1709 extrahierte Satz einer Sprachsynthese unterzogen, um synthetische Sprachdaten zu erlangen.
  • Bei einem Wortzählwertberechnungsschritt S1711 wird die Anzahl von Wörtern berechnet, die in einem bei dem Dokumentdatenextraktionsschritt S1709 extrahierten Satz enthalten ist.
  • Bei dem Synchronpunkterzeugungsschritt S1712 wird die Entsprechung zwischen den bei dem synthetische-Sprachdaten-Erzeugungsschritt S1710 erzeugten synthetischen Sprachdaten und den Wörtern erlangt, die in dem bei dem Dokumentdatenextraktionsschritt S1709 extrahierten Satz enthalten sind, und sie wird als Synchronpunkte bzw. synchrone Punkte gehalten. 26 zeigt ein Beispiel von synchronen Punkten.
  • Bei dem Wortzählerrücksetzschritt S1713 wird der Wortzähler auf "0" zurückgesetzt.
  • Bei einem Wählwinkelvorzeichenprüfschritt S1714 wird es geprüft, ob der in der Wählwinkelvariable gehaltene Wählwinkel ein "positives" Vorzeichen hat. Ist der Wählwinkel "positiv", setzt sich der Fluss mit dem Lesezeigerheraufsetzschritt S1715 fort; anderenfalls springt der Fluss zu dem Lesezeigerherabsetzschritt S1716.
  • Bei dem Lesezeigerheraufsetzschritt S1715 wird der Lesezeiger um "1" heraufgesetzt, und der Fluss kehrt zu dem Wählwinkelabsolutwertprüfschritt S1702 zurück.
  • Bei dem Lesezeigerherabsetzschritt S1716 wird der Lesezeiger um "1" herabgesetzt, und der Fluss kehrt zu dem Wählwinkelabsolutwertprüfschritt S1702 zurück.
  • Bei dem Leseaufgabesatzaktualisierungsschritt S1717 wird ein Leseaufgabensatz derart gesetzt, dass er die Summe des Lesezeigers und des Übersprungzählwerts bei dem Leseübersprungzählwertsetzschritt S1604 ist.
  • Bei dem synthetische-Sprachdaten-Kopierschritt S1718 werden Daten für ein Wort der bei dem synthetische-Sprachdaten-Erzeugungsschritt S1710 erzeugten Sprachdaten in einen Puffer der Sprachsynthesevorrichtung kopiert. Der Kopierbereich entspricht einem Wort von dem synchronen Punkt, der dem gegenwärtigen Wortzähler entspricht. Nachdem die Daten kopiert sind, setzt sich der Fluss mit dem Wortzähleraktualisierungsschritt S1708 fort.
  • Es sei erwähnt, dass das zuvor erwähnte zweite Ausführungsbeispiel ein Beispiel ist. Beispielsweise hält bei dem Leseübersprungzählwertsetzschritt S1604 der Leseübersprungzählwert eine gegebene Anzahl von Sätzen gemäß dem Wert der Wählwinkelvariable. Alternativ können, wenn der Wählwinkel groß ist, zu lesende Sätze bis zu dem nächsten Absatz übersprungen werden. Ein derartiger Vorgang kann ausgeführt werden, indem die Anzahl von Sätzen von dem Lesezähler zu dem ersten Satz des nächsten Absatzes gezählt wird. Ist der Wählwinkel klein, kann eins oder eine Vielzahl von Wörtern übersprungen werden.
  • Bei dem zweiten Ausführungsbeispiel ist die Anzahl von während dem Vorspul/Rückspulvorgang erzeugten Pieptönen dieselbe wie die Anzahl von übersprungenen Wörtern, jedoch müssen sie nicht immer einander gleich sein. Bei dem zweiten Ausführungsbeispiel wird der Vorspul/Rückspulvorgang unter Verwendung einer einzigen Pieptonfarbe ausgedrückt. Alternativ können unterschiedliche Pieptonfarben oder -Signale gemäß der Typ von Vorspulen/Rückspulen oder dem Wählwinkel erzeugt werden.
  • Zudem kann der Vorspulvorgang, der eine bei dem ersten Ausführungsbeispiel verwendete Zusammenfassung verwendet, auf das zweite Ausführungsbeispiel angewendet werden. In diesem Fall kann das Kompressionsverhältnis einer Zusammenfassung in Entsprechung zu dem bei dem Leseübersprungzählwertsetzschritt S1604 gesetzten Übersprungzählwert gesetzt werden.
  • <Drittes Ausführungsbeispiel>
  • Wie zuvor beschrieben, hilft es dem Benutzer wenig, da das herkömmliche Text-zu-Sprache-Lesegerät oder -Software eine konstante Rückgabemenge des Lesestartposition beim Neustarten eines Lesens verwendet, den Inhalt von tatsächlichen Sätzen zu verstehen.
  • Damit es bewerkstelligt wird, dass der Benutzer einen Zusammenhang bzw. eine Assoziation mit dem zuvor gelesenen Satz erhält, um sich beim Neustarten eines Lesens zu erinnern, ist die Rückgabemenge der Lesestartposition beim Neustarten eines Lesens ein wichtiger Punkt. Ist die Zeit zwischen dem vorhergehenden Leseendzeitpunkt und dem Leseneustartzeitpunkt sehr klein (beispielsweise mehrere Minuten), kann die Rückgabemenge der Lesestartposition klein sein, da der Benutzer das Meiste von zuvor gelesenen Inhalten im Gedächtnis behält. Jedoch vergisst der Benutzer mit länger werdender Zeit zwischen dem vorhergehenden Leseendzeitpunkt und dem Leseneustartzeitpunkt mehr zuvor gelesene Inhalte, und es wird für den Benutzer schwieriger, die zuvor gelesenen Inhalte beim Neustarten eines Lesens zu erinnern. In diesem Fall hilft eine größere Rückgabemenge der Leseneustartposition einem Verstehen des Benutzers. Das heißt, es sollte eine optimale Rückgabemenge der Leseneustartposition, welche bewirkt, dass sich der Benutzer an die zuvor gelesenen Inhalte erinnert, in Entsprechung mit mit dem Benutzer in Zusammenhang stehenden Umständen eingestellt werden Daher schlagen die Erfinder vor, dass die Rückgabemenge der Leseneustartposition beim Neustarten eines Lesens, nachdem es gestoppt ist, gemäß der Zeitdauer zwischen dem Lesestopp und den Neustartzeitpunkten eingestellt wird.
  • Nachfolgend wird das dritte Ausführungsbeispiel der vorliegenden Erfindung unter Bezugnahme auf die beiliegenden Zeichnungen ausführlich beschrieben.
  • Ein Text-zu-Sprache-Lesegerät bei diesem Ausführungsbeispiel kann durch einen Mehrzweckpersonalcomputer ausgeführt werden. 30 ist ein Blockschaltbild, das den Hardwareaufbau eines Personalcomputers zeigt, welcher ein Text-zu-Sprache-Lesegerät dieses Ausführungsbeispiels ausführt. Dieses Ausführungsbeispiel wird einen Fall erläutern, bei welchem ein eine CPU verwendender Mehrzweckpersonalcomputer als ein Text-zu-Sprache-Lesegerät Verwendung findet, jedoch kann die vorliegende Erfindung eine spezifische bzw. besonders zugeschnittene Hardwarelogik ohne Verwendung irgendeiner CPU verwenden.
  • Unter Bezugnahme auf 30 bezeichnet das Bezugszeichen 101 einen Steuerspeicher (ROM), welcher ein Bootprogramm, verschiedenste Steuerparameter, und dergleichen speichert; 102, bezeichnet eine zentrale Verarbeitungseinheit (CPU), welche das gesamte Text-zu-Sprache-Lesegerät steuert; und 103, einen Speicher (RAM), der als eine Hauptspeichervorrichtung dient.
  • Das Bezugszeichen 104 bezeichnet eine externe Speichervorrichtung (beispielsweise Festplatte), bei welcher zusätzlich zu einem Betriebssystem (OS) ein Text-zu-Sprache-Leseprogramm gemäß der vorliegenden Erfindung, welches Text unter Verwendung von Sprachsynthese laut liest, und Lesetext installiert sind, wie in 30 gezeigt. Der Lesetext kann Text sein, welcher unter Verwendung einer (nicht abgebildeten) anderen Anwendung oder einer extern über das Internet oder dergleichen geladenen Anwendung erzeugt wird.
  • Das Bezugszeichen 105 bezeichnet einen Digital/Analogwandler (D/A-Wandler), welcher mit einem Lautsprecher 105a verbunden ist. Das Bezugszeichen 106 bezeichnet eine Eingabeeinheit, welche zur Eingabe von Informationen unter Verwendung einer Tastatur 106a als eine Benutzerschnittstelle verwendet wird; und 107 bezeichnet eine Anzeigeeinheit, welche Informationen unter Verwendung einer Anzeigeeinrichtung 107a als eine andere Benutzerschnittstelle anzeigt.
  • 31 ist ein Schaubild, das die Modulkonfiguration des Text-zu-Sprache-Leseprogramms bei diesem Ausführungsbeispiel zeigt.
  • Ein Stoppzeitberechnungsmodul 201 berechnet eine Zeit, die seit dem vorhergehenden Lesestoppzeitpunkt bis zu dem gegenwärtigen Zeitpunkt verstrichen ist. Ein Stoppzeithaltemodul 202 hält eine Lesestoppzeit in dem RAM 103. Ein Stoppzeitdauerhaltemodul 203 hält eine Stoppzeitdauer von der vorhergehenden Lesestoppzeit bis ein Lesen neu gestartet wird in dem RAM 103. Ein Neustartpositionsuchmodul 204 erlangt die Neustartposition in dem Text. Ein Lesezeichenpositionhaltemodul 205 hält Positionsinformationen von Text bei der Zeit eines Lesestopps als eine Lesezeichenposition in dem RAM 103. Ein Lesepositionhaltemodul 206 hält Lesstartpositionsinformationen in dem RAM 103. Ein Satzextraktionsmodul 207 extrahiert einen Satz aus Text. Ein Texthaltemodul 208 lädt und hält in der externen Speichereinheit 104 gespeicherten Lesetext in dem RAM 103. Ein Ein-Satz-Haltemodul 209 hält den durch das Satzextraktionsmodul 207 extrahierten Satz in dem RAM 103. Ein Sprachsynthesemodul 210 wandelt den durch das Satzhaltemodul 209 gehaltenen Satz in Sprache. Ein Steuermodul 211 überwacht eine Lesestart/stoppanweisung des Benutzers auf der Grundlage von beispielsweise einer Eingabe an der Tastatur 106a.
  • 32 ist ein Flussdiagramm, das den Text-zu-Sprache-Leseprozess bzw. -vorgang des Text-zu-Sprache-Lesegeräts bei diesem Ausführungsbeispiel zeigt. Ein Programm entsprechend diesem Flussdiagramm ist in dem in der externen Speichervorrichtung 104 installierten Text-zu-Sprache-Lesprogramm enthalten, wird in das RAM 103 geladen, und wird durch die CPU 102 ausgeführt.
  • Bei Schritt S3201 wird es auf der Grundlage des Überwachungsergebnisses der Lesestart/stoppanweisung des Benutzers durch das Steuermodul 211 geprüft, ob eine Lesestartanweisung erfasst ist. Ist die Lesestartanweisung erfasst, setzt sich der Fluss mit Schritt S3202 fort; andernfalls kehrt der Fluss zu Schritt S3201 zurück.
  • Bei Schritt S3202 berechnet das Stoppzeitdauerberechnungsmodul 201 eine Stoppzeitdauer auf der Grundlage der vorangehenden Lesestoppzeit, die durch das Stoppzeithaltemodul 201 gehalten wird, und der derzeitigen Zeit. Das Stoppzeitdauerhaltemodul 201 hält die berechnete Stoppzeitdauer in dem RAM 103.
  • Bei Schritt S3203 werden die durch das Stoppzeitdauerhaltemodul 203 gehaltene Stoppzeitdauer (das heißt, die bei Schritt S3202 berechnete Stoppzeitdauer, die durch das Lesezeichenpositionhaltemodul 205 gehaltene Lesezeichenposition im Text eingegeben, und durch das Texthaltemodul 208 gehaltener Text eingegeben, um die Leseneustartposition zu bestimmen. Das heißt, eine Position, welche eine der Stoppzeitdauer entsprechende Dauer von der Lesezeichenposition zurückgibt, wird als die Leseneustartposition bestimmt. In diesem Fall wird ein Satz als eine Einheit der Rückgabemenge bzw. -betrag verwendet, und eine Position, welche die Anzahl von Sätzen proportional zu der Dauer der Stoppzeitdauer von der Lesezeichenposition zurückgibt, wird als die Leseneustartposition bestimmt.
  • Ist die Stoppzeitdauer beispielsweise kürzer als eine Stunde, kann die Rückgabemenge als ein Satz gesetzt werden; wenn die Stoppzeitdauer in den Bereich von einer Stunde (einschließlich) bis zu zwei Stunden (ausschließlich) fällt, zwei Sätze; wenn die Stoppzeitdauer in den Bereich von zwei Stunden (einschließlich) bis zu drei Stunden (ausschließlich) fällt, drei Sätze, ... In diesem Fall kann eine obere Grenze gesetzt werden. Ist die Stoppzeitdauer beispielsweise gleich oder länger als 50 Stunden, wird die Rückgabemenge einheitlich auf 50 Sätze gesetzt.
  • Als ein einfaches Verfahren des Zählens der Anzahl von Sätzen, ist ein Verfahren des Zählens der Anzahl von Dauern verfügbar, während Text von der Lesezeichenposition zurückgezogen wird. Außerdem kann als die Neustartposition ein Zeichen gesetzt werden, das der Dauer am nächsten ist, die um die Anzahl von Sätzen zurückgeht. 34 zeigt ein Beispiel des Suchprozesses bzw. -vorgangs der Neustartposition, wenn die Anzahl von Sätzen, die zurückzugehen ist, 2 ist. Wie in 34 gezeigt, ist der Text, wenn sich die Lesezeichenposition in der Mitte eines Satzes "Das kann ein Grund sein, warum es mir hier in Kalifornien besser geht." befindet, von dieser Lesezeichenposition zurückgezogen, bis die Anzahl eines Auftretens von "." 2 wird. In diesem Fall wird der erste erfasste "." aus dem Zählen ausgelassen. Daher ist die Lesestartposition in diesem Fall die Anfangsposition eines Satzes "Aber mir geht es hier in Kalifornien viel besser als in Japan." Auf diese Weise kann ein Satz als eine Einheit einer Rückgabemenge bzw. Rückgabebetrags Verwendung finden, jedoch ist dies nur ein Beispiel. Anstelle von Sätzen kann die Anzahl von Paragraphen bzw. Absätzen als eine Einheit Verwendung finden. In diesem Fall kann als ein Verfahren des Zählens der Anzahl von Absätzen, eine Position, bei welcher eine Dauer, ein Rückgabecode, und ein Leerzeichen (oder Tabulatorzeichen) auftritt, wiederum als ein Absatz bestimmt werden.
  • Das Lesepositionhaltemodul 206 hält die bei Schritt S3202 bestimmte Leseneustartposition in dem RAM 103.
  • Bei Schritt S3204 extrahiert das Satzextraktionsmodul 207 einen Satz aus durch das Texthaltemodul 208 gehaltenem Lesetext, um die durch das Lesepositionhaltemodul 206 gehaltene Leseposition als einen Startpunkt zu haben. Der extrahierte Satz wird durch das Ein-Satz-Haltemodul 209 gehalten. Danach wird die nächste Extraktionsposition durch das Lesepositionhaltemodul 206 gehalten.
  • Bei Schritt S3205 führt das Sprachsynthesemodul 210 eine Sprachsynthese des durch das Ein-Satz-Haltemodul 209 gehaltenen Satzes aus, um den Satz laut zu lesen. Bei Schritt S3206 wird es geprüft, ob noch zu lesende Sätze übrig sind. Sind noch derartige Sätze übrig, kehrt der Fluss zu Schritt S3204 zurück, um den zuvor erwähnten Prozess bzw. Vorgang zu wiederholen. Sind keine zu lesenden Sätze übrig, endet dieser Prozess bzw. Vorgang.
  • Bei einem Text-zu-Sprache-Lesen unter Verwendung synthetischer Sprache bei Schritt S3205 können verschiedene Lesegeschwindigkeiten oder Lesestimmen (männliche Stimme/weibliche Stimme) beim Lesen von Sätzen vor oder nach der Lesezeichenposition Verwendung finden.
  • 33 ist ein Flussdiagram, das den Text-zu-Sprache-Lesestoppvorgang während eines Lesens der Text-zu-Sprache-Lesevorrichtung dieses Ausführungsbeispiels zeigt. Ein diesem Flussdiagramm entsprechendes Programm ist in dem in der externen Speichervorrichtung 104 installierten Text-zu-Sprache-Leseprogramm enthalten, es wird in das RAM 103 geladen, und es wird durch die CPU 102 ausgeführt.
  • Bei Schritt 3301 überwacht das Steuermodul 211 eine Lesestoppanweisung des Benutzers während einem Lesen auf der Grundlage einer Eingabe an beispielsweise der Tastatur 106a. Bei Erfassung der Lesestoppanweisung setzt sich der Fluss mit dem Schritt S3302 fort; andernfalls kehrt der Fluss zu dem Schritt S3301 zurück.
  • Bei dem Schritt S3302 wird der Sprachsynthesevorgang bzw. -prozess des Sprachsynthesemoduls 210 gestoppt. Bei dem Schritt S3303 hält das Stoppzeithaltemodul 202 die gegenwärtige bzw. derzeitige Zeit als eine Stoppzeit in dem RAM 103. Zudem hält das Lesezeichenpositionhaltemodul 205 bei Schritt S3304 die Textposition zu der Zeit eines Stopps eines Lesens in dem RAM 103, wodurch der Prozess beendet wird.
  • Wie zuvor beschrieben, wird gemäß dem dritten Ausführungsbeispiel die Rückgabemenge bzw. der Rückgabebetrag der Leseneustartposition beim Neustarten eines Lesens, nachdem es gestoppt ist, gemäß der Zeitdauer zwischen dem Lesestopp- und Neustartzeitpunkt eingestellt. Auf diese Weise kann die Neustartposition beim Neustarten eines Lesens, nachdem es gestoppt ist, auf eine optimale Position eingestellt werden, welche dem Benutzer eine Assoziation mit den zuvor gelesenen Sätzen in das Gedächtnis bringt.
  • <Andere Ausführungsbeispiele>
  • Bei dem zuvor erwähnten Ausführungsbeispiel ist der Lesetext Englisch. Die vorliegende Erfindung ist jedoch nicht auf eine derartige spezifische Sprache beschränkt, sondern sie kann auf andere Sprachen, wie beispielsweise Japanisch, Französisch, und dergleichen angewendet werden. In derartigen Fällen werden eine Interpunktionszeichenerkennungseinrichtung entsprechend den jeweiligen Sprachen, wie beispielsweise Japanisch, Französisch, und dergleichen vorbereitet.
  • Bei dem vorliegenden Ausführungsbeispiel kann zusätzlich ein Zusammenfassungserzeugungsmodul als ein Modul des Text-zu-Sprache-Leseprogramms hinzugefügt werden, und wenn Text laut gelesen wird, während Text von der Lesezeichenposition beim Neustarten eines Lesens zurückgezogen wird, kann eine Zusammenfassung laut gelesen werden. In diesem Fall kann die Länge der Zusammenfassung gemäß der Stoppzeitdauer eingestellt werden.
  • Der Einstellungsvorgang bzw. -prozess der Rückgabemenge der Leseneustartposition bei dem dritten Ausführungsbeispiel kann auf die Sprachsynthesefunktion des Informationsendgeräts bei dem zuvor erwähnten ersten und zweiten Ausführungsbeispiel angewendet werden.
  • Die Text-zu-Sprache-Vorrichtung bei dem vorangehenden Ausführungsbeispiel wird unter Verwendung eines Personalcomputers ausgeführt. Jedoch ist die vorliegende Erfindung nicht darauf beschränkt, und der zuvor erwähnte Vorgang bzw. Prozess kann durch Zusammenarbeit unter den Modulen des Text-zu-Sprache-Leseprogramms ausgeführt werden, die auf eine Vielzahl von Computern und Verarbeitungsvorrichtungen verteilt sind, welche wiederum über ein Netzwerk verbunden sind.
  • Alternativ kann die vorliegende Erfindung entweder auf ein System, das durch eine Vielzahl von Geräten (wie beispielsweise einen Hostcomputer, ein Schnittstellengerät, einen Leser, einen Drucker, und dergleichen) gebildet ist, oder eine Vorrichtung angewendet werden, die aus einer einzigen Anlage (beispielsweise einer Kopiermaschine, einem Faxgerät, oder dergleichen) gebildet ist.
  • Es sei erwähnt, dass die vorliegende Erfindung einen Fall umfasst, bei welchem die Erfindung durch direktes oder von der Ferne Zuführen eines Programms oder von Software, welche die Funktionen der zuvor erwähnten Ausführungsbeispiele ausführt, zu einem System oder einer Vorrichtung erzielt wird, und Auslesen und Ausführen des zugeführten Programmcodes durch einen Computer des Systems oder der Vorrichtung.
  • Daher führt der Programmcode selbst, der in einem Computer zum Ausführen der funktionellen Vorgänge bzw. Prozesse der vorliegenden Erfindung unter Verwendung des Computers installiert ist, die vorliegende Erfindung aus.
  • Das heißt, der Geltungsbereich der vorliegenden Erfindung umfasst das Computerprogramm selbst zum Ausführen des funktionellen Prozesse der vorliegenden Erfindung; dieser Geltungsbereich wird nur durch die beigefügten Ansprüche beschränkt.
  • In diesem Fall ist die Programmform nicht besonders beschränkt, und es können ein Objektcode, ein durch einen Interpreter auszuführendes Programm, einem Betriebssystem (OS) zuzuführende Skriptdaten, und dergleichen, verwendet werden, so lange sie die Programmfunktion haben.
  • Als ein Speichermedium zum Zuführen des Programms können beispielsweise eine flexible Disk, eine Festplatte, eine optische Disk (CD-ROM, CD-R, CD-RW, DVD, und dergleichen), eine magnetooptische Disk, ein Magnetband, eine Speicherkarte, und dergleichen Verwendung finden.
  • Als ein anderes Programmzuführverfahren kann das Programm der vorliegenden Erfindung durch Dateiübertragung über das Internet akquiriert werden.
  • Außerdem kann ein Speichermedium, wie beispielsweise eine CD-ROM oder dergleichen, welche das verschlüsselte Programm der vorliegenden Erfindung speichert, an den Benutzer ausgeliefert werden, es kann dem Benutzer, der eine vorbestimmte Bedingung erfüllt hat, erlaubt werden, über das Internet Schlüsselinformationen zu erlangen, welche das Programm entschlüsseln, und das verschlüsselte Programm kann unter Verwendung der auf einen Computer zu installierenden Schlüsselinformationen ausgeführt werden, wodurch die vorliegende Erfindung ausgeführt wird.
  • Die Funktionen der zuvor erwähnten Ausführungsbeispiele können nicht nur durch Ausführen des ausgelesenen Programmcodes durch den Computer ausgeführt werden, sondern auch durch einige oder alle tatsächlichen Verarbeitungsbetriebe, die durch ein auf dem Computer laufendes Betriebssystem (OS) ausgeführt werden, auf der Grundlage einer Anweisung dieses Programms.
  • Zudem können die Funktionen der zuvor erwähnten Ausführungsbeispiele durch einige oder alle von tatsächlichen Prozessen ausgeführt werden, die durch die CPU oder dergleichen ausgeführt werden, die in einer Funktionserweiterungskarte oder einer Funktionserweiterungseinheit angeordnet ist, welche in den Computer eingefügt oder mit ihm verbunden ist, nachdem das aus dem Aufzeichnungsmedium ausgelesene Programm in einen Speicher der Erweiterungskarte oder -einheit geschrieben ist.
  • Die vorliegende Erfindung ist nicht auf die vorangehenden Ausführungsbeispiele beschränkt und es können verschiedenste Änderungen und Modifikationen innerhalb des Geltungsbereichs der vorliegenden Erfindung vorgenommen werden. Daher, um der Öffentlichkeit des Geltungsbereich der vorliegenden Erfindung nahe zu bringen, sind die folgenden Ansprüche gemacht.

Claims (11)

  1. Informationsverarbeitungsgerät, mit einer Wiedergabeeinrichtung (H201) zum Wiedergeben von Audiodaten, einer Sprachsyntheseeinrichtung (H6) zum Wandeln von Textdaten in synthetische Sprache, und zum Ausgeben der synthetischen Sprache, einer Anweisungserfassungseinrichtung zur Erfassung einer Benutzeranweisung, einer Erfassungseinrichtung zur Erfassung von Betriebszuständen der Wiedergabeeinrichtung (H201) und der Sprachsyntheseeinrichtung (H6), einer Anweisungszuführeinrichtung zum Zuführen der Benutzeranweisung zu einer der Wiedergabeeinrichtung (H201) und der Sprachsyntheseeinrichtung (H6) gemäß den Betriebszuständen, wobei die Anweisungszuführeinrichtung dahingehend ausgestaltet ist, dass sie die Anweisung der Sprachsyntheseeinrichtung (H6) zuführt, wenn die Sprachsyntheseeinrichtung (H6) aktiv ist, und die Anweisungszuführeinrichtung dahingehend ausgestaltet ist, dass sie die Anweisung der Wiedergabeeinrichtung (H201) zuführt, wenn die Sprachsyntheseeinrichtung (H6) inaktiv ist und die Wiedergabeeinrichtung (H201) aktiv ist, und einer Steuereinrichtung (H1) zur Steuerung der Wiedergabeeinrichtung (H201) oder der Sprachsyntheseeinrichtung (H6), die die Benutzeranweisung empfangen hat, um einen Prozess auf der Grundlage der Benutzeranweisung auszuführen.
  2. Gerät nach Anspruch 1, wobei die Benutzeranweisung eine Anweisung einer Vorspul-, Rückspul-, Stopp-, und Pausenanweisung ist.
  3. Gerät nach Anspruch 2, wobei, wenn die Benutzeranweisung eine Vorspulanweisung ist und die Anweisungszuführeinrichtung die Anweisung der Sprachsyntheseeinrichtung (H6) zuführt, die Steuereinrichtung (H1) die Sprachsyntheseeinrichtung (H6) steuert, um abstrakte Daten zu erzeugen, indem sie vorbestimmte Teildaten aus jeweiligen Sätzen von zu lesenden Textdaten extrahiert, und um die abstrakten Daten als synthetische Sprache auszugeben.
  4. Gerät nach Anspruch 2, wobei, wenn die Benutzeranweisung eine Vorspulanweisung ist und die Anweisungszuführeinrichtung die Anweisung der Sprachsyntheseeinrichtung (H6) zuführt, die Steuereinrichtung (H1) die Sprachsyntheseeinrichtung (H6) steuert, um die ersten Wörter von jeweiligen Sätzen von zu lesenden Textdaten zu extrahieren, und um die extrahierten Wörter der Reihe nach als synthetische Sprache auszugeben.
  5. Gerät nach Anspruch 2, wobei, wenn die Benutzeranweisung eine Rückspulanweisung ist und die Anweisungszuführeinrichtung die Anweisung der Sprachsyntheseeinrichtung (H6) zuführt, die Steuereinrichtung (H1) die Sprachsyntheseeinrichtung (H6) steuert, um die ersten Wörter von jeweiligen Sätzen von zu lesenden Textdaten zu extrahieren, und um die extrahierten Wörter in einer entgegen gesetzten Reihenfolge zu einer Anordnung von Sätzen der Textdaten als synthetische Sprache auszugeben.
  6. Gerät nach Anspruch 1, wobei, wenn die Benutzeranweisung eine Wiedergabeanweisung ist, die Anweisungszuführeinrichtung erfasst, ob ein eine Lesestartposition angebender Lesezeiger in den Textdaten gesetzt ist oder nicht, und wenn der Lesezeiger erfasst wird, führt die Anweisungszuführeinrichtung die Benutzeranweisung der Sprachsyntheseeinrichtung (1-16) zu, um eine Sprachsynthese der Textdaten von der Position des Lesezeigers zu starten.
  7. Gerät nach Anspruch 1, wobei, wenn die Benutzeranweisung eine Wiedergabeanweisung ist, die Anweisungszuführeinrichtung erfasst, ob ein eine Wiedergabestartposition angebender Wiedergabezeiger in aufgezeichneten Audiodaten gesetzt ist oder nicht, und wenn der Wiedergabezeiger erfasst wird, führt die Anweisungszuführeinrichtung die Benutzeranweisung der Wiedergabeeinrichtung (H201) zu, um eine Wiedergabe der aufgezeichneten Audiodaten von der Position des Wiedergabezeigers zu starten.
  8. Gerät nach Anspruch 1, wobei die Steuereinrichtung (H1) die Sprachsyntheseeinrichtung (H6) steuert, um einen vorbestimmten Ton in Entsprechung zu Daten, der Textdaten, auszugeben, welche keiner Sprachsynthese der Sprachsyntheseeinrichtung (H6) unterzogen werden und ausgelassen werden.
  9. Informationsverarbeitungsverfahren, mit einem Wiedergabeschritt (S112; S114) zum Wiedergeben von Audiodaten, einem Sprachsyntheseschritt (S107; S110) zum Wandeln von Textdaten in synthetische Sprache, und zum Ausgeben der synthetischen Sprache, einem Anweisungserfassungsschritt zum Erfassen einer Benutzeranweisung, einem Erfassungsschritt zum Erfassen von Betriebszuständen des Wiedergabeschritts (S112; S114) und des Sprachsyntheseschritts (S107; S110), einem Anweisungszuführschritt zum Zuführen der Benutzeranweisung zu dem Sprachsyntheseschritt (S107; S110), wenn der Sprachsyntheseschritt (S107; S110) aktiv ist, und zu dem Wiedergabeschritt (S112; S114), wenn die Sprachsyntheseeinrichtung (H6) inaktiv ist und der Wiedergabeschritt (S112; S114) aktiv ist, und einem Steuerschritt zum Steuern des Wiedergabeschritts (S112; S114) oder des Sprachsyntheseschritts (S107; S110), der die Benutzeranweisung empfangen hat, um einen Prozess auf der Grundlage der Benutzeranweisung auszuführen.
  10. Programm zum Veranlassen, dass ein Computer ausführt einen Wiedergabeschritt (S112; S114) zum Wiedergeben von Audiodaten, einen Sprachsyntheseschritt (S107; S110) zum Wandeln von Textdaten in synthetische Sprache, und zum Ausgeben der synthetischen Sprache, einen Anweisungserfassungsschritt zum Erfassen einer Benutzeranweisung, einen Erfassungsschritt zum Erfassen von Betriebszuständen des Wiedergabeschritts (S112; S114) und des Sprachsyntheseschritts (S107; S110), einen Anweisungszuführschritt zum Zuführen der Benutzeranweisung zu dem Sprachsyntheseschritt (S107; S110), wenn der Sprachsyntheseschritt (S107; S110) aktiv ist, und zu dem Wiedergabeschritt (S112; S114), wenn die Sprachsyntheseeinrichtung (H6) inaktiv ist und der Wiedergabeschritt (S112; S114) aktiv ist, und einen Steuerschritt zum Steuern des Wiedergabeschritts (S112; S114) oder des Sprachsyntheseschritts (S107; S110), der die Benutzeranweisung empfangen hat, um einen Prozess auf der Grundlage der Benutzeranweisung auszuführen.
  11. Computerlesbares Speichermedium, welches ein Programm zum Veranlassen speichert, dass ein Computer ausführt einen Wiedergabeschritt (S112; S114) zum Wiedergeben von Audiodaten, einen Sprachsyntheseschritt (S107; S110) zum Wandeln von Textdaten in synthetische Sprache, und zum Ausgeben der synthetischen Sprache, einen Anweisungserfassungsschritt zum Erfassen einer Benutzeranweisung, einen Erfassungsschritt zum Erfassen von Betriebszuständen des Wiedergabeschritts (S112; S114) und des Sprachsyntheseschritts (S107; S110), einen Anweisungszuführschritt zum Zuführen der Benutzeranweisung zu dem Sprachsyntheseschritt (S107; S110), wenn der Sprachsyntheseschritt (S107; S110) aktiv ist, und zu dem Wiedergabeschritt (S112; S114), wenn die Sprachsyntheseeinrichtung (H6) inaktiv ist und der Wiedergabeschritt (S112; S114) aktiv ist, und einen Steuerschritt zum Steuern des Wiedergabeschritts (S112; S114) oder des Sprachsyntheseschritts (S107; S110), der die Benutzeranweisung empfangen hat, um einen Prozess auf der Grundlage der Benutzeranweisung auszuführen.
DE60314929T 2002-02-15 2003-02-11 Informationsverarbeitungsgerät und Verfahren mit Sprachsynthesefunktion Expired - Lifetime DE60314929T2 (de)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2002039033 2002-02-15
JP2002039033A JP3884970B2 (ja) 2002-02-15 2002-02-15 情報処理装置および情報処理方法
JP2002124368A JP2003316565A (ja) 2002-04-25 2002-04-25 読み上げ装置およびその制御方法ならびにプログラム
JP2002124368 2002-04-25

Publications (2)

Publication Number Publication Date
DE60314929D1 DE60314929D1 (de) 2007-08-30
DE60314929T2 true DE60314929T2 (de) 2008-04-03

Family

ID=27736530

Family Applications (1)

Application Number Title Priority Date Filing Date
DE60314929T Expired - Lifetime DE60314929T2 (de) 2002-02-15 2003-02-11 Informationsverarbeitungsgerät und Verfahren mit Sprachsynthesefunktion

Country Status (4)

Country Link
US (1) US20030158735A1 (de)
EP (1) EP1341155B1 (de)
CN (2) CN101025917A (de)
DE (1) DE60314929T2 (de)

Families Citing this family (143)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8645137B2 (en) 2000-03-16 2014-02-04 Apple Inc. Fast, language-independent method for user authentication by voice
US8374879B2 (en) * 2002-02-04 2013-02-12 Microsoft Corporation Systems and methods for managing interactions from multiple speech-enabled applications
JP2003295882A (ja) 2002-04-02 2003-10-15 Canon Inc 音声合成用テキスト構造、音声合成方法、音声合成装置及びそのコンピュータ・プログラム
US7299182B2 (en) * 2002-05-09 2007-11-20 Thomson Licensing Text-to-speech (TTS) for hand-held devices
JP4280505B2 (ja) 2003-01-20 2009-06-17 キヤノン株式会社 情報処理装置及び情報処理方法
US8244828B2 (en) * 2003-08-28 2012-08-14 International Business Machines Corporation Digital guide system
JP4587160B2 (ja) * 2004-03-26 2010-11-24 キヤノン株式会社 信号処理装置および方法
JP2006155269A (ja) * 2004-11-30 2006-06-15 Fuji Xerox Co Ltd 音声ガイドシステムおよびその音声ガイド方法
US20080177548A1 (en) * 2005-05-31 2008-07-24 Canon Kabushiki Kaisha Speech Synthesis Method and Apparatus
US8677377B2 (en) 2005-09-08 2014-03-18 Apple Inc. Method and apparatus for building an intelligent automated assistant
CN100487788C (zh) * 2005-10-21 2009-05-13 华为技术有限公司 一种实现文语转换功能的方法
JP4759374B2 (ja) * 2005-11-22 2011-08-31 キヤノン株式会社 情報処理装置、情報処理方法、プログラム、記憶媒体
US20070124148A1 (en) * 2005-11-28 2007-05-31 Canon Kabushiki Kaisha Speech processing apparatus and speech processing method
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US8977255B2 (en) 2007-04-03 2015-03-10 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
US9330720B2 (en) 2008-01-03 2016-05-03 Apple Inc. Methods and apparatus for altering audio output signals
US8996376B2 (en) 2008-04-05 2015-03-31 Apple Inc. Intelligent text-to-speech conversion
US10496753B2 (en) 2010-01-18 2019-12-03 Apple Inc. Automatically adapting user interfaces for hands-free interaction
JP5816085B2 (ja) 2008-07-04 2015-11-17 ブックトラック ホールディングス リミテッド サウンドトラックを作成してプレイする方法及びシステム
US20100030549A1 (en) 2008-07-31 2010-02-04 Lee Michael M Mobile device having human language translation capability with positional feedback
US20100042702A1 (en) * 2008-08-13 2010-02-18 Hanses Philip C Bookmarks for Flexible Integrated Access to Published Material
US8352268B2 (en) 2008-09-29 2013-01-08 Apple Inc. Systems and methods for selective rate of speech and speech preferences for text to speech synthesis
US8712776B2 (en) 2008-09-29 2014-04-29 Apple Inc. Systems and methods for selective text to speech synthesis
US9959870B2 (en) 2008-12-11 2018-05-01 Apple Inc. Speech recognition involving a mobile device
US8380507B2 (en) 2009-03-09 2013-02-19 Apple Inc. Systems and methods for determining the language to use for speech generated by a text to speech engine
US9858925B2 (en) 2009-06-05 2018-01-02 Apple Inc. Using context information to facilitate processing of commands in a virtual assistant
US10241644B2 (en) 2011-06-03 2019-03-26 Apple Inc. Actionable reminder entries
US10706373B2 (en) 2011-06-03 2020-07-07 Apple Inc. Performing actions associated with task items that represent tasks to perform
US10241752B2 (en) 2011-09-30 2019-03-26 Apple Inc. Interface for a virtual digital assistant
US9431006B2 (en) 2009-07-02 2016-08-30 Apple Inc. Methods and apparatuses for automatic speech recognition
US10679605B2 (en) 2010-01-18 2020-06-09 Apple Inc. Hands-free list-reading by intelligent automated assistant
US10553209B2 (en) 2010-01-18 2020-02-04 Apple Inc. Systems and methods for hands-free notification summaries
US10705794B2 (en) 2010-01-18 2020-07-07 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US10276170B2 (en) 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
US8682667B2 (en) 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
JP5587119B2 (ja) * 2010-09-30 2014-09-10 キヤノン株式会社 文字入力装置、その制御方法、及びプログラム
US10762293B2 (en) 2010-12-22 2020-09-01 Apple Inc. Using parts-of-speech tagging and named entity recognition for spelling correction
US9262612B2 (en) 2011-03-21 2016-02-16 Apple Inc. Device access using voice authentication
US10057736B2 (en) 2011-06-03 2018-08-21 Apple Inc. Active transport based notifications
US8994660B2 (en) 2011-08-29 2015-03-31 Apple Inc. Text correction processing
US10134385B2 (en) 2012-03-02 2018-11-20 Apple Inc. Systems and methods for name pronunciation
US9483461B2 (en) 2012-03-06 2016-11-01 Apple Inc. Handling speech synthesis of content for multiple languages
US9159313B2 (en) * 2012-04-03 2015-10-13 Sony Corporation Playback control apparatus, playback control method, and medium for playing a program including segments generated using speech synthesis and segments not generated using speech synthesis
CN103383844B (zh) * 2012-05-04 2019-01-01 上海果壳电子有限公司 语音合成方法及系统
US9280610B2 (en) 2012-05-14 2016-03-08 Apple Inc. Crowd sourcing information to fulfill user requests
US9721563B2 (en) 2012-06-08 2017-08-01 Apple Inc. Name recognition system
US9495129B2 (en) 2012-06-29 2016-11-15 Apple Inc. Device, method, and user interface for voice-activated navigation and browsing of a document
US9576574B2 (en) 2012-09-10 2017-02-21 Apple Inc. Context-sensitive handling of interruptions by intelligent digital assistant
US9547647B2 (en) 2012-09-19 2017-01-17 Apple Inc. Voice-based media searching
US9087508B1 (en) * 2012-10-18 2015-07-21 Audible, Inc. Presenting representative content portions during content navigation
KR20150104615A (ko) 2013-02-07 2015-09-15 애플 인크. 디지털 어시스턴트를 위한 음성 트리거
US9368114B2 (en) 2013-03-14 2016-06-14 Apple Inc. Context-sensitive handling of interruptions
CN105027197B (zh) 2013-03-15 2018-12-14 苹果公司 训练至少部分语音命令系统
WO2014144579A1 (en) 2013-03-15 2014-09-18 Apple Inc. System and method for updating an adaptive speech recognition model
WO2014197334A2 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
US9582608B2 (en) 2013-06-07 2017-02-28 Apple Inc. Unified ranking with entropy-weighted information for phrase-based semantic auto-completion
WO2014197336A1 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for detecting errors in interactions with a voice-based digital assistant
WO2014197335A1 (en) 2013-06-08 2014-12-11 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
EP3008641A1 (de) 2013-06-09 2016-04-20 Apple Inc. Vorrichtung, verfahren und grafische benutzeroberfläche für gesprächspersistenz über zwei oder mehrere instanzen eines digitaler assistenten
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
AU2014278595B2 (en) 2013-06-13 2017-04-06 Apple Inc. System and method for emergency calls initiated by voice command
CN105453026A (zh) 2013-08-06 2016-03-30 苹果公司 基于来自远程设备的活动自动激活智能响应
US9798509B2 (en) 2014-03-04 2017-10-24 Gracenote Digital Ventures, Llc Use of an anticipated travel duration as a basis to generate a playlist
US9431002B2 (en) * 2014-03-04 2016-08-30 Tribune Digital Ventures, Llc Real time popularity based audible content aquisition
US9454342B2 (en) 2014-03-04 2016-09-27 Tribune Digital Ventures, Llc Generating a playlist based on a data generation attribute
US9620105B2 (en) 2014-05-15 2017-04-11 Apple Inc. Analyzing audio input for efficient speech and music recognition
US10592095B2 (en) 2014-05-23 2020-03-17 Apple Inc. Instantaneous speaking of content on touch devices
US9502031B2 (en) 2014-05-27 2016-11-22 Apple Inc. Method for supporting dynamic grammars in WFST-based ASR
TWI566107B (zh) 2014-05-30 2017-01-11 蘋果公司 用於處理多部分語音命令之方法、非暫時性電腦可讀儲存媒體及電子裝置
US10289433B2 (en) 2014-05-30 2019-05-14 Apple Inc. Domain specific language for encoding assistant dialog
US9785630B2 (en) 2014-05-30 2017-10-10 Apple Inc. Text prediction using combined word N-gram and unigram language models
US9633004B2 (en) 2014-05-30 2017-04-25 Apple Inc. Better resolution when referencing to concepts
US9760559B2 (en) 2014-05-30 2017-09-12 Apple Inc. Predictive text input
US10170123B2 (en) 2014-05-30 2019-01-01 Apple Inc. Intelligent assistant for home automation
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US9430463B2 (en) 2014-05-30 2016-08-30 Apple Inc. Exemplar-based natural language processing
US9842101B2 (en) 2014-05-30 2017-12-12 Apple Inc. Predictive conversion of language input
US9734193B2 (en) 2014-05-30 2017-08-15 Apple Inc. Determining domain salience ranking from ambiguous words in natural speech
US10078631B2 (en) 2014-05-30 2018-09-18 Apple Inc. Entropy-guided text prediction using combined word and character n-gram language models
US10659851B2 (en) 2014-06-30 2020-05-19 Apple Inc. Real-time digital assistant knowledge updates
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US10446141B2 (en) 2014-08-28 2019-10-15 Apple Inc. Automatic speech recognition based on user feedback
US9818400B2 (en) 2014-09-11 2017-11-14 Apple Inc. Method and apparatus for discovering trending terms in speech requests
US10789041B2 (en) 2014-09-12 2020-09-29 Apple Inc. Dynamic thresholds for always listening speech trigger
US9606986B2 (en) 2014-09-29 2017-03-28 Apple Inc. Integrated word N-gram and class M-gram language models
US9646609B2 (en) 2014-09-30 2017-05-09 Apple Inc. Caching apparatus for serving phonetic pronunciations
US9668121B2 (en) 2014-09-30 2017-05-30 Apple Inc. Social reminders
US10074360B2 (en) 2014-09-30 2018-09-11 Apple Inc. Providing an indication of the suitability of speech recognition
US9886432B2 (en) 2014-09-30 2018-02-06 Apple Inc. Parsimonious handling of word inflection via categorical stem + suffix N-gram language models
US10127911B2 (en) 2014-09-30 2018-11-13 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US10552013B2 (en) 2014-12-02 2020-02-04 Apple Inc. Data detection
US9711141B2 (en) 2014-12-09 2017-07-18 Apple Inc. Disambiguating heteronyms in speech synthesis
US9865280B2 (en) 2015-03-06 2018-01-09 Apple Inc. Structured dictation using intelligent automated assistants
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US9721566B2 (en) 2015-03-08 2017-08-01 Apple Inc. Competing devices responding to voice triggers
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US9899019B2 (en) 2015-03-18 2018-02-20 Apple Inc. Systems and methods for structured stem and suffix language models
WO2016157642A1 (ja) * 2015-03-27 2016-10-06 ソニー株式会社 情報処理装置、情報処理方法、およびプログラム
US9842105B2 (en) 2015-04-16 2017-12-12 Apple Inc. Parsimonious continuous-space phrase representations for natural language processing
US10083688B2 (en) 2015-05-27 2018-09-25 Apple Inc. Device voice control for selecting a displayed affordance
US10127220B2 (en) 2015-06-04 2018-11-13 Apple Inc. Language identification from short strings
US9578173B2 (en) 2015-06-05 2017-02-21 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US10101822B2 (en) 2015-06-05 2018-10-16 Apple Inc. Language input correction
US10255907B2 (en) 2015-06-07 2019-04-09 Apple Inc. Automatic accent detection using acoustic models
US10186254B2 (en) 2015-06-07 2019-01-22 Apple Inc. Context-based endpoint detection
US11025565B2 (en) 2015-06-07 2021-06-01 Apple Inc. Personalized prediction of responses for instant messaging
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US9697820B2 (en) 2015-09-24 2017-07-04 Apple Inc. Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks
US11010550B2 (en) 2015-09-29 2021-05-18 Apple Inc. Unified language modeling framework for word prediction, auto-completion and auto-correction
US10366158B2 (en) 2015-09-29 2019-07-30 Apple Inc. Efficient word encoding for recurrent neural network language models
US11587559B2 (en) 2015-09-30 2023-02-21 Apple Inc. Intelligent device identification
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
US10261964B2 (en) 2016-01-04 2019-04-16 Gracenote, Inc. Generating and distributing playlists with music and stories having related moods
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
DK179588B1 (en) 2016-06-09 2019-02-22 Apple Inc. INTELLIGENT AUTOMATED ASSISTANT IN A HOME ENVIRONMENT
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US10490187B2 (en) 2016-06-10 2019-11-26 Apple Inc. Digital assistant providing automated status report
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
DK179343B1 (en) 2016-06-11 2018-05-14 Apple Inc Intelligent task discovery
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
DK179049B1 (en) 2016-06-11 2017-09-18 Apple Inc Data driven natural language event detection and classification
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
US10419508B1 (en) 2016-12-21 2019-09-17 Gracenote Digital Ventures, Llc Saving media for in-automobile playout
US10019225B1 (en) 2016-12-21 2018-07-10 Gracenote Digital Ventures, Llc Audio streaming based on in-automobile detection
US10565980B1 (en) 2016-12-21 2020-02-18 Gracenote Digital Ventures, Llc Audio streaming of text-based articles from newsfeeds
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
DK201770439A1 (en) 2017-05-11 2018-12-13 Apple Inc. Offline personal assistant
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
DK201770431A1 (en) 2017-05-15 2018-12-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
DK201770432A1 (en) 2017-05-15 2018-12-21 Apple Inc. Hierarchical belief states for digital assistants
DK179560B1 (en) 2017-05-16 2019-02-18 Apple Inc. FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES
CN111149373B (zh) * 2017-09-27 2021-12-07 大北欧听力公司 用于评估语音接触的听力设备及相关方法

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3836555A1 (de) * 1988-10-27 1990-05-10 Bayerische Motoren Werke Ag Multifunktions-bedieneinrichtung
US5091931A (en) * 1989-10-27 1992-02-25 At&T Bell Laboratories Facsimile-to-speech system
JP3453405B2 (ja) * 1993-07-19 2003-10-06 マツダ株式会社 多重伝送装置
JP3323633B2 (ja) * 1994-02-28 2002-09-09 キヤノン株式会社 留守番電話装置
US6029195A (en) * 1994-11-29 2000-02-22 Herz; Frederick S. M. System for customized electronic identification of desirable objects
CN2246840Y (zh) * 1995-02-11 1997-02-05 张小宁 一种与录/放音机配合使用的语音复读器
JPH0963253A (ja) * 1995-08-23 1997-03-07 Sony Corp ディスク装置
GB9606739D0 (en) * 1996-03-29 1996-06-05 British Telecomm Telecommunications apparatus and method
US5850629A (en) * 1996-09-09 1998-12-15 Matsushita Electric Industrial Co., Ltd. User interface controller for text-to-speech synthesizer
US6243372B1 (en) * 1996-11-14 2001-06-05 Omnipoint Corporation Methods and apparatus for synchronization in a wireless network
US6017219A (en) * 1997-06-18 2000-01-25 International Business Machines Corporation System and method for interactive reading and language instruction
US5986200A (en) * 1997-12-15 1999-11-16 Lucent Technologies Inc. Solid state interactive music playback device
GB9806085D0 (en) * 1998-03-23 1998-05-20 Xerox Corp Text summarisation using light syntactic parsing
US6246672B1 (en) * 1998-04-28 2001-06-12 International Business Machines Corp. Singlecast interactive radio system
CA2300873A1 (en) * 1998-06-12 1999-12-16 Edward L. Elliott Remote video assist recorder box
JP2000148175A (ja) * 1998-09-10 2000-05-26 Ricoh Co Ltd テキスト音声変換装置
DE60020504T2 (de) * 1999-07-08 2006-05-04 Koninklijke Philips Electronics N.V. Anpassung eines spracherkenners an korrigierte texte
JP3759353B2 (ja) * 1999-11-16 2006-03-22 株式会社ディーアンドエムホールディングス ディジタル・オーディオ・ディスク・レコーダ
US6694297B2 (en) * 2000-03-30 2004-02-17 Fujitsu Limited Text information read-out device and music/voice reproduction device incorporating the same
US6933928B1 (en) * 2000-07-18 2005-08-23 Scott E. Lilienthal Electronic book player with audio synchronization

Also Published As

Publication number Publication date
EP1341155B1 (de) 2007-07-18
EP1341155A3 (de) 2005-06-15
CN1303581C (zh) 2007-03-07
EP1341155A2 (de) 2003-09-03
CN101025917A (zh) 2007-08-29
DE60314929D1 (de) 2007-08-30
US20030158735A1 (en) 2003-08-21
CN1438626A (zh) 2003-08-27

Similar Documents

Publication Publication Date Title
DE60314929T2 (de) Informationsverarbeitungsgerät und Verfahren mit Sprachsynthesefunktion
US5875427A (en) Voice-generating/document making apparatus voice-generating/document making method and computer-readable medium for storing therein a program having a computer execute voice-generating/document making sequence
Freitas et al. Speech technologies for blind and low vision persons
CN101529500B (zh) 内容概括系统、内容概括的方法
DE69839068T2 (de) System und Verfahren zur automatischen Verarbeitung von Anruf und Datenübertragung
KR100828884B1 (ko) 데이터베이스 주석 및 검색
US5526407A (en) Method and apparatus for managing information
CN105159870B (zh) 一种精准完成连续自然语音文本化的处理系统及方法
JP4466564B2 (ja) 文書作成閲覧装置、文書作成閲覧ロボットおよび文書作成閲覧プログラム
CN101185115B (zh) 语音编辑装置及方法和语音识别装置及方法
CN109036372B (zh) 一种语音播报方法、装置及系统
JP2005341015A (ja) 議事録作成支援機能を有するテレビ会議システム
CN112188266A (zh) 视频生成方法、装置及电子设备
JP4589910B2 (ja) 会話記録ブログ化装置
CN109801648A (zh) 消息弹窗语音编辑方法、装置、计算机设备及存储介质
JP2000214764A (ja) 手話メ―ル装置
CN110428811A (zh) 一种数据处理方法、装置及电子设备
JP4140745B2 (ja) 字幕へのタイミング情報付与方法
EP1073036B1 (de) Analyse von heruntergeladenen Dokumenten für einen Browser mit Sprachsynthese-Fähigkeit
CN114911448A (zh) 数据处理方法、装置、设备以及介质
JPH0998140A (ja) 自動放送装置
US7353175B2 (en) Apparatus, method, and program for speech synthesis with capability of providing word meaning immediately upon request by a user
JP2000270263A (ja) 自動字幕番組制作システム
Eklund A comparative study of disfluencies in four Swedish travel dialogue corpora
JP3884970B2 (ja) 情報処理装置および情報処理方法

Legal Events

Date Code Title Description
8364 No opposition during term of opposition