JP4785381B2 - ハンドヘルド装置用音声合成(tts) - Google Patents

ハンドヘルド装置用音声合成(tts) Download PDF

Info

Publication number
JP4785381B2
JP4785381B2 JP2004504225A JP2004504225A JP4785381B2 JP 4785381 B2 JP4785381 B2 JP 4785381B2 JP 2004504225 A JP2004504225 A JP 2004504225A JP 2004504225 A JP2004504225 A JP 2004504225A JP 4785381 B2 JP4785381 B2 JP 4785381B2
Authority
JP
Japan
Prior art keywords
ebook
text
handheld device
speech
tts
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2004504225A
Other languages
English (en)
Other versions
JP2005524879A (ja
Inventor
シエ,ジアンレイ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Thomson Licensing SAS
Original Assignee
Thomson Licensing SAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thomson Licensing SAS filed Critical Thomson Licensing SAS
Publication of JP2005524879A publication Critical patent/JP2005524879A/ja
Application granted granted Critical
Publication of JP4785381B2 publication Critical patent/JP4785381B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/08Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • G10L13/04Details of speech synthesis systems, e.g. synthesiser structure or memory management

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Electrically Operated Instructional Devices (AREA)
  • Telephone Function (AREA)
  • Electric Clocks (AREA)

Description

本発明は、一般的に、ハンドヘルド装置に関し、特に、ハンドヘルド装置用音声合成(TTS)に関する。
(「イーブック(Ebook)」とも呼ばれる)電子ブックは、従来の印刷本(又は、例えば、雑誌、新聞、など、のような別の印刷物)の電子版で、パーソナル・コンピュータを用いるか、イーブック・リーダを用いて読むことが可能であるもの、である。PC又はハンドヘルド型コンピュータと違って、イーブック・リーダは従来の紙の本に匹敵する読書体験を提供する一方、メモ取り、高速ナビゲーション、及びキー・ワード検索用の強力な電子機能を付加するものである。しかしながら、そのような動作は、それらがPC、ハンドヘルド・コンピュータ、又はイーブック・リーダ上で行われるか否かにかかわらず、一般に、ユーザがテキストをディスプレイから読み取ることを要する。したがって、イーブックの利用は一般に、ユーザが自らの視覚的注意をディスプレイ上に集中させてイーブックのテキスト・コンテンツ(例えば、本、雑誌、新聞など)を読み取ることを要する。
したがって、例えば、イーブックのようなハンドヘルド装置で、ユーザが、ディスプレイを見ることなく、コンテンツを吸収することを可能にするもの、を有すること、は、望ましく、高い効果を有するものである。
上記課題、更には先行技術の別の関連課題は、本発明で、音声合成(TTS)機能を有するハンドヘルド装置であるもの、によって解決される。
本発明の特徴によれば、イーブックが備えられる。該イーブックはメモリ装置、音声合成(TTS)モジュール、及び少なくとも1つのスピーカを有する。メモリ装置はファイルを記憶する。該ファイルはテキストを有する。TTSモジュールはテキストに相当する音声を合成する。少なくとも1つのスピーカは音声を出力する。
本発明の別の特徴によれば、イーブックを用いる方法を備える。少なくとも1つのファイルをイーブックに記憶する。少なくとも1つのファイルはテキストを有する。テキストに相当する音声は合成されて、イーブックから出力される。
本発明のこれら及び別の特徴、構成及び効果は好適実施例の以下の詳細説明から明らかになるものであり、該詳細説明は添付図面に関して検討されるものとする。
本発明は音声合成(TTS)機能を有するハンドヘルド装置及び音声合成(TTS)機能を有するハンドヘルド装置を用いる方法に関する。本発明は、電子ブック(イーブック)、携帯情報端末(PDA)などを有するが、それらに限定されるものでない、如何なる種類のハンドヘルド装置にも関することが分かる。しかしながら、本発明を説明する目的で、以下の説明をイーブックについて備える。
本発明はハードウェア、ソフトウェア、ファームウェア、特殊用途向プロセッサ、又はそれらの組み合わせの種々の形態で実施し得るものとする。好ましくは、本発明はハードウェアとソフトウェアとの組み合わせとして実施される。更に、ソフトウェアは好ましくは、プログラム記憶装置上に具体的に実施されたアプリケーション・プログラムとして実施される。アプリケーション・プログラムは如何なる適切なアーキテクチャを有するマシンにもアップロードし得るものであり、該マシンによって実行し得るものである。好ましくは、マシンは1つ又複数の中央処理装置(CPU)、ランダム・アクセス・メモリ(RAM)、及び入出力(I/O)インタフェースのようなハードウェアを有するコンピュータ・プラットフォーム上で実施される。コンピュータ・プラットフォームは更に、オペレーティング・システム及びマイクロ命令コードを有する。本明細書及び特許請求の範囲記載の種々の処理及び機能は、マイクロ命令コードの一部か、アプリケーション・プログラムの一部か(それらの組み合わせか)の何れかで、オペレーティング・システムを介して実行されるもの、であり得る。更に、種々の別の端末装置を別のデータ記憶装置及び印刷装置のようなコンピュータ・プラットフォームに接続し得る。
添付図面において表す構成システム部分及び方法工程の一部は好ましくはソフトウェアで実施し得るので、システム部分(又は処理工程)間の実際の接続は本発明がプログラム化される方法によってかわってくることがあり得る。本明細書及び特許請求の範囲の開示内容によって、当業者は本発明のこれら及び同様な実施又は構成を企図することができるものである。
図1は、本発明の例示的実施例によって、本発明を適用し得るコンピュータ・システム100を示すブロック図である。コンピュータ処理システム100は動作するよう、システム・バス104を介して別の構成部分に結合された少なくとも1つのプロセッサ(CPU)102を有する。読み取り専用メモリ(ROM)106、ランダム・アクセス・メモリ(RAM)108、表示アダプタ110、I/Oアダプタ112、及びユーザ・インタフェース・アダプタ114が動作するよう、システム・バス104に結合される。
表示装置116は動作するよう、システム・バス104に表示アダプタ110によって結合される。ディスク記憶装置(例えば、磁気又は光ディスク記憶装置)118は動作するようシステム・バス104にI/Oアダプタ112によって結合される。
マウス120及びキーボード122は動作するようシステム・バス104にユーザ・インタフェース・アダプタ114によって結合される。マウス120及びキーボード122はシステム100に情報を入力し、該システム100から情報を出力する。
コンピュータ・システム100は更に、音声合成(TTS)モジュール194及びスピーカ196を有する。
図2は、本発明の例示的実施例による、イーブック200、を示すブロック図である。イーブック200はバス201によって相互接続される以下:少なくとも1つ以上のメモリ装置(以下「メモリ装置」230);少なくとも1つのプロセッサ(以下「プロセッサ」240);ユーザ入力装置250(例えば、キーボード、キーパッド、並びに/又はリモコン);ディスプレイ260;音声合成(TTS)モジュール270;及びスピーカ290;の構成要素を有する。本明細書及び特許請求の範囲記載の本発明の開示内容によって、当業者は、コンピュータ・システム100及びイーブック200のこれら及び種々の別の構成で、各々図1及び2に表すもの、を、本発明の趣旨及び範囲を維持しながら、企図するものである。本明細書及び特許請求の範囲の原文において用いる「Ebook」の語はスタンドアロン型イーブック装置(例えば、イーブック200)又はコンピュータ・システム(例えば、コンピュータ・システム100)が有するイーブックを表すものとする。
図3は本発明の例示的実施例による、音声合成(TTS)機能を有するイーブックを用いる方法を示す流れ図である。
1つ又は複数のファイル(以下「ファイル」)はイーブックに入力される(工程310)。該ファイルは、少なくとも、テキストを有する。該ファイルは、メモリ装置(例えば、フロッピ・ディスク、コンパクト・ディスク、フラッシュ・メモリ、など)を介して備えられる、インターネットからダウンロードされる、などとなり得るものである。該ファイルはイーブック・アプリケーション・ファイル、電子メール・ファイル、ウェブ・ページ、ワード・プロセッサ文書などであり得る。該ファイルは更に、イーブックに記憶される(工程320)。
選択的に、工程325で、イーブックのユーザに、テキストがディスプレイ上に表示される視覚専用モード、TTSモジュールによって合成され、スピーカによって出力されるオーディオ専用モード、及びテキストがディスプレイ上で表示され、同時に、TTSモジュールによる合成とスピーカによる出力とが行われる視覚・オーディオ複合モードのうちから選択するよう、選択肢が備えられる(260、270)。
1つ又は複数のコマンドがイーブックによって受信される(工程330)。好ましくは、コマンドはファイルの再生に相当する。コマンドは例えば:ファイルが有するテキストに相当する音声を可聴テキストが再生されるように合成し始めるコマンド;合成を終了させるコマンド;音声合成の開始時間及び/又は終了時間を予め設定するコマンド;音声合成に用いる声を選定/変更するコマンド;合成音声の速度を選定/変更するコマンド;ファイルを通したナビゲーションに相当する(例えば、1つ又は複数のページ、節、章などを飛ばす)コマンド;を有し得る。
異なる声の選定に関しては、例えば、男性の声、女性の声、青年の声、又は、更に、変に聞こえる声(例えば、チップマンク)、のような各種の多くの声を、音声の合成に用い得る。更に、異なる声を単一のファイルの単一の再生に用い得る。特定の声の選定はユーザの選好、異なるアプリケーションのパラメータ/状況に基づいて行われるもの、及び/又は任意ベースで行われるものであり得る。
更に、工程330で受信されるコマンドの一部はテキスト・ファイルの再生に相当しないことがあるものである。例えば、別の機能で、例えば、日次リマインダ・スケジュール付カレンダ機能、のようなもの、がイーブックと一体化された場合、カレンダ機能(又は別の機能)に関する情報をイーブックによって受信し得る。
上記コマンドに応じて更に、TTS機能を有するイーブックの動作が制御される(工程340)。工程340はテキストに相当する音声を合成する工程及び/又はテキストを表示する工程を有し得る(工程340a)。工程340は、工程330で受信される如何なる種類のコマンドで、テキストに相当する音声を合成する機能及び/又はテキストを表示する機能、更には、別の機能で、イーブックに一体化し得るもの、をサポートするコマンドを有するもの、にも応じる工程を有し得ることが分かる。
図4は、本発明の例示的実施例によって、イーブックを聞こえるストーリーテラーとして、用いる方法を示す流れ図である。好ましくは、図4の方法は子供が寝る前の時間近くに子供に向けてストーリーを再生するのに用いられる。しかしながら、図4の方法は子供のみならず大人にも用い得るものであり、昼夜どの時間でも用い得るものである。
イーブック上のファイルを再生する開始時間及び終了時間を規定する第1及び第2の入力が受信される(工程410)。再生する実際のファイルを規定する第3の入力が受信される(工程420)。再生用の声を規定する第4の入力が受信される(工程430)。工程420及び430は任意にイーブックによって、単に第1入力及び第2入力を受信することによって、行い得るものである。代替として、入力の全て(又は全てに達しない何らかの組み合わせ)はユーザによって備えられ得る。
再生は所定開始時間に開始され、該再生は、ファイルに相当する音声が、テキスト・ファイルが聞こえるように再生されるような、合成を有する。選択的に、ファイルが有するテキストの表示は合成音声の出力と同時に行われ得る。任意又は既定の時間が経過した後ではあるが、所定終了時間前に、再生音量及び/又は音声速度が低減される(工程450)。工程450は、音量及び/又は音声速度を徐々に一定の大きさ毎、低減するよう所定又は任意の回数、反復し得る。再生音量及び/又は音声速度を低減させることはリスナを眠くさせることを意図するものである。再生は所定終了時間に終結される(工程460)。
図5は本発明の例示的実施例によって、イーブックを目覚ましアラームとして用いる方法を示す流れ図である。
イーブック上のファイルを再生する開始時間を規定する第1入力が受信される(工程510)。再生する実際のファイルを規定する第2の入力が受信される(工程520)。再生する音声を規定する第3の入力が受信される(工程530)。工程520及び530は、単に第1入力を受信することによって、イーブックによって任意に行い得る。代替として、入力の全て(又は全てに達しない何らかの組み合わせ)をユーザによって備え得る。
再生は所定開始時間に開始され、該再生は、テキスト・ファイルに相当する音声の、テキスト・ファイルが聞こえるように再生されるような、合成を有する(工程540)。選択的に、ファイルが有するテキストの表示は合成音声の出力と同時に行い得る。任意又は既定の時間が経過した後、再生音量及び/又は音声速度は増加される(工程550)。工程550は、停止再生入力が受信されるまで、所定又は任意の間隔で再生音量及び/又は音声速度を一定量増加させるよう、反復し得る。該再生は停止再生入力が受信された場合に終結される(工程560)。
したがって、本発明は効果的に、イーブックの利用を、読書が便利でないか望ましくない場合のアプリケーションについて、可能にする。例えば、本発明は、運転中の読書、子供に向けてストーリーを聞こえるように朗読すること、日次スケジュール・リマインダなどに用い得る。本明細書及び特許請求の範囲の開示内容によって、当業者は、これら及び種々の別のシナリオで、該シナリオにおいて本発明を効果的に、本発明の趣旨及び範囲を維持する一方で、利用し得るもの、を企図するものである。
例示的実施例は、添付図面を参照して本明細書及び特許請求の範囲において記載したが、本発明は厳密にこれらの実施例に限定されるものでなく、種々の別の変更及び修正をそれら実施例において当業者によって、本発明の範囲又は趣旨から逸脱することなく、反映し得るものとする。そのような変更及び修正は全て、本特許請求の範囲規定の本発明の範囲内に有することを意図するものである。
本発明の例示的実施例による、本発明を適用し得るコンピュータ・システム100を示すブロック図である。 本発明の例示的実施例による、イーブック200を示すブロック図である。 本発明の例示的実施例による、音声合成(TTS)機能を有するイーブックを用いる方法を示す流れ図である。 本発明の例示的実施例による、イーブックを聞こえるストーリーテラーとして用いる方法を示す流れ図である。 本発明の例示的実施例による、イーブックを目覚ましアラームとして用いる方法を示す流れ図である。

Claims (19)

  1. イーブックであって、更に:
    ファイルを格納するメモリ装置であって、前記ファイルがテキストを含むメモリ装置;
    前記テキストに対応する音声を合成する音声合成(TTS)モジュール;
    前記音声を出力する少なくとも1つのスピーカ;及び
    プロセッサ;
    を有し、該イーブックが、寝る前のストーリーテラーとして、該TTSモジュールが、該音声が該TTSモジュールから出力される速度を、経時的に低減するように使用されることを特徴とするイーブック。
  2. 請求項1記載のイーブックであって:
    該TTSモジュールが該音声を合成するのに複数の声のうちの任意の1つの声の間を、任意ベース、ユーザ規定の選択肢、及び該ファイルのうちの現行のもののパラメータ、のうちの少なくとも1つに基づいて、切り替える機能を有することを特徴とするイーブック。
  3. 請求項2記載のイーブックであって:
    該複数の声が、男性の声、女性の声、青年の声、及び意図的に変に聞こえる声のうちの少なくとも1つを有することを特徴とするイーブック。
  4. 請求項1記載のイーブックであって、該TTSモジュールが既定開始時間及び既定終了時間のうちの少なくとも1つによって該音声を合成する機能を有することを特徴とするイーブック。
  5. 請求項1記載のイーブックであって、該イーブックが該寝る前のストーリー・リーダとしての動作を、既定の開始時間又は、開始入力の受信、に基づいて、開始することを特徴とするイーブック。
  6. 請求項1記載のイーブックであって、該イーブックが該寝る前のストーリー・リーダとしての動作を、既定の終了時間又は、終了入力の受信、に基づいて、終結することを特徴
    とするイーブック。
  7. イーブックを使用する方法であって、
    前記イーブックにおいて少なくとも1つのファイルを格納する工程であって、前記少なくとも1つのファイルがテキストを含む工程;
    前記テキストに対応する音声を合成する工程;及び
    前記音声を出力する工程を含み、
    該イーブックが寝る前のストーリーテラーとして、該合成する工程は、該音声が出力される速度を、経時的に低減するように使用されることを特徴とする方法。
  8. 請求項7記載の方法であって、更に:
    該音声を合成するのに複数の声のうちの任意の1つの間で、任意ベース、ユーザ規定選択肢、及び該ファイルの現行のもののパラメータのうちの少なくとも1つに基づいて、切り替える工程;
    を有することを特徴とする方法。
  9. 請求項8記載の方法であって:
    該複数の声が、男性の声、女性の声、青年の声、及び意図的に変に聞こえる声のうちの少なくとも1つを有することを特徴とする方法。
  10. 請求項7記載の方法であって、該合成する工程が、既定開始時間及び既定終了時間のうちの少なくとも1つによって行われることを特徴とする方法。
  11. 請求項7記載の方法であって、該イーブックが該寝る前のリーダとしての動作を、既定の開始時間、又は開始入力の受信に基づいて、開始することを特徴とする方法。
  12. 請求項7記載の方法であって、該イーブックが該寝る前のリーダとしての動作を、既定の終了時間、又は終了入力の受信、に基づいて、終了することを特徴とする方法。
  13. ハンドヘルド装置であって:
    ファイルを記憶するメモリ装置;
    を有し、該ファイルがテキストを有し;
    更に、該テキストに相当する音声を合成する音声合成(TTS)モジュール;
    音声を出力する少なくとも1つのスピーカ;及び
    プロセッサを備え、
    前記ハンドヘルド装置は、前記TTSモジュールから前記音声が出力される速度を前記TTSモジュールが経時的に低減するように、寝る前のストーリーテラーとして使用されることを特徴とするハンドヘルド装置。
  14. 請求項13記載のハンドヘルド装置であって、更に:
    該テキストを表示するディスプレイ;
    を有し、かつ、選択肢が、該ハンドヘルド装置のユーザに:
    該テキストが該ディスプレイ上に表示される視覚専用モード;
    該テキストが該TTSモジュールによって合成され、該スピーカによって出力される、オーディオ専用モード;及び
    該テキストが該ディスプレイ上で表示され、かつ、同時に、該TTSモジュールによる合成と該スピーカによる出力が行われる視覚・オーディオ複合モード;
    のうちから選定するよう、備えられることを特徴とするハンドヘルド装置。
  15. 請求項13記載のハンドヘルド装置であって:
    該TTSモジュールが該音声を合成するのに複数の声のうちの任意の1つの声の間を、任意ベース、ユーザ規定の選択肢、及び該ファイルのうちの現行のもののパラメータ、のうちの少なくとも1つに基づいて、切り替える機能を有することを特徴とするハンドヘルド装置。
  16. 請求項13記載のハンドヘルド装置であって、該TTSモジュールが、該音声が該TTSモジュールから出力される速度を、任意ベース、ユーザ規定の選択肢、及び該ファイルのうちの現行のもののパラメータ、のうちの少なくとも1つに基づいて、調節することを特徴とするハンドヘルド装置。
  17. 請求項13記載のハンドヘルド装置であって、前記ハンドヘルド装置はカレンダ機能を有し;
    該TTSモジュールが、日次リマインダ・スケジュールに相当する情報を有するよう該音声を合成することを特徴とするハンドヘルド装置。
  18. 請求項1記載のイーブックであって、
    前記スピーカから出力される音声の音量を前記プロセッサが経時的に低減させるように、前記寝る前のストーリーテラーとして前記イーブックが使用されることを特徴とするイーブック。
  19. 請求項7記載の方法であって、
    前記方法が前記音声の音量を経時的に低減させる工程を更に含むように前記寝る前のストーリーテラーとして前記イーブックが使用されることを特徴とする方法。
JP2004504225A 2002-05-09 2003-05-07 ハンドヘルド装置用音声合成(tts) Expired - Fee Related JP4785381B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US10/142,406 US7299182B2 (en) 2002-05-09 2002-05-09 Text-to-speech (TTS) for hand-held devices
US10/142,406 2002-05-09
PCT/US2003/014301 WO2003096323A1 (en) 2002-05-09 2003-05-07 Text-to-speech (tts) for hand-held devices

Publications (2)

Publication Number Publication Date
JP2005524879A JP2005524879A (ja) 2005-08-18
JP4785381B2 true JP4785381B2 (ja) 2011-10-05

Family

ID=29399891

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004504225A Expired - Fee Related JP4785381B2 (ja) 2002-05-09 2003-05-07 ハンドヘルド装置用音声合成(tts)

Country Status (9)

Country Link
US (1) US7299182B2 (ja)
EP (1) EP1504444B1 (ja)
JP (1) JP4785381B2 (ja)
KR (1) KR101022710B1 (ja)
CN (1) CN100351897C (ja)
AU (1) AU2003241378A1 (ja)
DE (1) DE60321162D1 (ja)
MX (1) MXPA04011118A (ja)
WO (1) WO2003096323A1 (ja)

Families Citing this family (53)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004205605A (ja) * 2002-12-24 2004-07-22 Yamaha Corp 音声および楽曲再生装置およびシーケンスデータフォーマット
JP2004227468A (ja) * 2003-01-27 2004-08-12 Canon Inc 情報提供装置、情報提供方法
KR100556873B1 (ko) * 2003-07-25 2006-03-03 엘지전자 주식회사 이동 통신 단말기의 스케줄 브리핑 방법
US20060241945A1 (en) * 2005-04-25 2006-10-26 Morales Anthony E Control of settings using a command rotor
KR100724868B1 (ko) * 2005-09-07 2007-06-04 삼성전자주식회사 다수의 합성기를 제어하여 다양한 음성 합성 기능을제공하는 음성 합성 방법 및 그 시스템
JP4810343B2 (ja) * 2006-07-20 2011-11-09 キヤノン株式会社 音声処理装置およびその制御方法
US9170120B2 (en) * 2007-03-22 2015-10-27 Panasonic Automotive Systems Company Of America, Division Of Panasonic Corporation Of North America Vehicle navigation playback method
US8528040B2 (en) 2007-10-02 2013-09-03 At&T Intellectual Property I, L.P. Aural indication of remote control commands
KR20090047159A (ko) * 2007-11-07 2009-05-12 삼성전자주식회사 오디오-북 재생 방법 및 장치
FR2930066A1 (fr) * 2008-04-15 2009-10-16 Radoslav Iliev Ionov Procede et dispositif appele "tabooks" de diffusion de messages a long terme
US20090303175A1 (en) * 2008-06-05 2009-12-10 Nokia Corporation Haptic user interface
US20090313020A1 (en) * 2008-06-12 2009-12-17 Nokia Corporation Text-to-speech user interface control
US20100003654A1 (en) * 2008-07-03 2010-01-07 Thompson Engineering Co. Prayer box
KR101053875B1 (ko) * 2008-07-14 2011-08-03 삼성전자주식회사 휴대 단말기와 동기화된 로봇의 이벤트 실행 방법 및 그시스템
US8990087B1 (en) * 2008-09-30 2015-03-24 Amazon Technologies, Inc. Providing text to speech from digital content on an electronic device
US8498867B2 (en) * 2009-01-15 2013-07-30 K-Nfb Reading Technology, Inc. Systems and methods for selection and use of multiple characters for document narration
JP2010191356A (ja) * 2009-02-20 2010-09-02 Takeshi Ito 書籍音声情報提供システム
US20100225809A1 (en) * 2009-03-09 2010-09-09 Sony Corporation And Sony Electronics Inc. Electronic book with enhanced features
US8935656B2 (en) * 2009-09-09 2015-01-13 International Business Machines Corporation Communicating information in computing systems
JP5482042B2 (ja) * 2009-09-10 2014-04-23 富士通株式会社 合成音声テキスト入力装置及びプログラム
US20110205849A1 (en) * 2010-02-23 2011-08-25 Sony Corporation, A Japanese Corporation Digital calendar device and methods
US8103554B2 (en) * 2010-02-24 2012-01-24 GM Global Technology Operations LLC Method and system for playing an electronic book using an electronics system in a vehicle
US8392186B2 (en) 2010-05-18 2013-03-05 K-Nfb Reading Technology, Inc. Audio synchronization for document narration with user-selected playback
TW201142686A (en) * 2010-05-21 2011-12-01 Delta Electronics Inc Electronic apparatus having multi-mode interactive operation method
US20110313762A1 (en) * 2010-06-20 2011-12-22 International Business Machines Corporation Speech output with confidence indication
KR20110138882A (ko) * 2010-06-22 2011-12-28 삼성전자주식회사 Tv 장치 및 그의 제어 방법
US9122656B2 (en) 2010-06-28 2015-09-01 Randall Lee THREEWITS Interactive blocking for performing arts scripts
US9870134B2 (en) 2010-06-28 2018-01-16 Randall Lee THREEWITS Interactive blocking and management for performing arts productions
US10642463B2 (en) 2010-06-28 2020-05-05 Randall Lee THREEWITS Interactive management system for performing arts productions
US8888494B2 (en) 2010-06-28 2014-11-18 Randall Lee THREEWITS Interactive environment for performing arts scripts
JP5587119B2 (ja) * 2010-09-30 2014-09-10 キヤノン株式会社 文字入力装置、その制御方法、及びプログラム
CN101968805A (zh) * 2010-10-22 2011-02-09 厦门雅迅网络股份有限公司 一种提供资讯的系统和方法
CN101986369A (zh) * 2010-11-02 2011-03-16 中兴通讯股份有限公司 一种电纸书及其文档处理方法
US9424107B1 (en) 2011-03-14 2016-08-23 Amazon Technologies, Inc. Content enhancement techniques
US9268734B1 (en) * 2011-03-14 2016-02-23 Amazon Technologies, Inc. Selecting content-enhancement applications
US9477637B1 (en) 2011-03-14 2016-10-25 Amazon Technologies, Inc. Integrating content-item corrections
CN103020082B (zh) * 2011-09-23 2016-10-05 北京北大方正电子有限公司 一种阅读处理系统和方法、服务器、终端设备
US9620122B2 (en) * 2011-12-08 2017-04-11 Lenovo (Singapore) Pte. Ltd Hybrid speech recognition
US20130151955A1 (en) * 2011-12-09 2013-06-13 Mechell Williams Physical effects for electronic books
CN102495970B (zh) * 2011-12-20 2016-06-01 山西大学 会议主持系统及其实现方法
CN104035550B (zh) * 2013-03-07 2017-12-22 腾讯科技(深圳)有限公司 信息提供模式切换方法及装置
US20150112465A1 (en) * 2013-10-22 2015-04-23 Joseph Michael Quinn Method and Apparatus for On-Demand Conversion and Delivery of Selected Electronic Content to a Designated Mobile Device for Audio Consumption
US20150278737A1 (en) * 2013-12-30 2015-10-01 Google Inc. Automatic Calendar Event Generation with Structured Data from Free-Form Speech
CN104966084A (zh) * 2015-07-07 2015-10-07 北京奥美达科技有限公司 一种基于ocr和tts的低视力阅读助视系统
KR20170124068A (ko) 2016-05-01 2017-11-09 (주)이노프레소 복합 휴먼 인터페이스가 구비된 전자기기
CN109683722B (zh) 2016-06-23 2022-03-11 株式会社音乐派索 具有多功能人机接口的电子设备
US10607606B2 (en) 2017-06-19 2020-03-31 Lenovo (Singapore) Pte. Ltd. Systems and methods for execution of digital assistant
CN107369462B (zh) * 2017-07-21 2020-06-26 阿里巴巴(中国)有限公司 电子书语音播放方法、装置及终端设备
CN107808007A (zh) * 2017-11-16 2018-03-16 百度在线网络技术(北京)有限公司 信息处理方法和装置
US11443646B2 (en) 2017-12-22 2022-09-13 Fathom Technologies, LLC E-Reader interface system with audio and highlighting synchronization for digital books
US10671251B2 (en) 2017-12-22 2020-06-02 Arbordale Publishing, LLC Interactive eReader interface generation based on synchronization of textual and audial descriptors
CN112995736A (zh) * 2021-04-22 2021-06-18 南京亿铭科技有限公司 语音字幕合成方法、装置、计算机设备及存储介质
CN114363691A (zh) * 2021-04-22 2022-04-15 南京亿铭科技有限公司 语音字幕合成方法、装置、计算机设备及存储介质

Family Cites Families (47)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5615380A (en) * 1969-11-24 1997-03-25 Hyatt; Gilbert P. Integrated circuit computer system having a keyboard input and a sound output
JPS5664683A (en) * 1979-10-31 1981-06-01 Rhythm Watch Co Ltd Electronic time piece having alarm
JPS5694291A (en) * 1979-12-28 1981-07-30 Rhythm Watch Co Ltd Alarm announcing circuit of watch
CA1163812A (en) * 1980-02-15 1984-03-20 Shintaro Hashimoto Speech synthesizer timepiece with alarm function
JPS5742099A (en) * 1980-08-27 1982-03-09 Sharp Kk Voice informing device
JPS62222299A (ja) * 1986-03-24 1987-09-30 シャープ株式会社 音声報知装置
US4985697A (en) * 1987-07-06 1991-01-15 Learning Insights, Ltd. Electronic book educational publishing method using buried reference materials and alternate learning levels
US5041086A (en) * 1987-12-04 1991-08-20 Pacesetter Infusion, Ltd. Clinical configuration of multimode medication infusion system
DE3814353A1 (de) 1988-04-28 1989-11-09 Thomson Brandt Gmbh Elektrischer wecker
FR2692070B1 (fr) * 1992-06-05 1996-10-25 Thomson Csf Procede et dispositif de synthese vocale a vitesse variable.
US5386493A (en) * 1992-09-25 1995-01-31 Apple Computer, Inc. Apparatus and method for playing back audio at faster or slower rates without pitch distortion
US8073695B1 (en) 1992-12-09 2011-12-06 Adrea, LLC Electronic book with voice emulation features
JP3958355B2 (ja) * 1992-12-09 2007-08-15 セドナ・パテント・サービシズ・エルエルシー ケーブルテレビ配送システムのためのネットワーク・コントローラ
US5611018A (en) * 1993-09-18 1997-03-11 Sanyo Electric Co., Ltd. System for controlling voice speed of an input signal
US6243071B1 (en) * 1993-11-03 2001-06-05 Apple Computer, Inc. Tool set for navigating through an electronic book
JP3433532B2 (ja) * 1994-09-30 2003-08-04 日本ビクター株式会社 電子ブック装置
US5694521A (en) * 1995-01-11 1997-12-02 Rockwell International Corporation Variable speed playback system
US5771273A (en) * 1996-02-05 1998-06-23 Bell Atlantic Network Services, Inc. Network accessed personal secretary
US6279017B1 (en) * 1996-08-07 2001-08-21 Randall C. Walker Method and apparatus for displaying text based upon attributes found within the text
US5812977A (en) * 1996-08-13 1998-09-22 Applied Voice Recognition L.P. Voice control computer interface enabling implementation of common subroutines
US5850629A (en) * 1996-09-09 1998-12-15 Matsushita Electric Industrial Co., Ltd. User interface controller for text-to-speech synthesizer
US6009398A (en) * 1997-04-18 1999-12-28 U S West, Inc. Calendar system with direct and telephony networked voice control interface
IL120856A0 (en) * 1997-05-19 1997-09-30 Creator Ltd Controllable toy system operative in conjunction with a household audio entertainment player
EP1062564A4 (en) * 1998-03-20 2002-08-28 Nuvomedia Inc ELECTRONIC BOOK SYSTEM
JP2000099308A (ja) * 1998-09-28 2000-04-07 Wako Denshi Kk 電子ブックプレーヤ
US6324511B1 (en) * 1998-10-01 2001-11-27 Mindmaker, Inc. Method of and apparatus for multi-modal information presentation to computer users with dyslexia, reading disabilities or visual impairment
US6182041B1 (en) * 1998-10-13 2001-01-30 Nortel Networks Limited Text-to-speech based reminder system
US6236622B1 (en) * 1999-05-01 2001-05-22 Verilux, Inc. Lamp and alarm clock with gradually increasing light or sounds
US7110945B2 (en) * 1999-07-16 2006-09-19 Dreamations Llc Interactive book
CN1300018A (zh) * 1999-10-05 2001-06-20 株式会社东芝 书籍朗读电子机器,编辑系统,存储媒体,及信息提供系统
US6310833B1 (en) * 1999-11-30 2001-10-30 Salton, Inc. Interactive voice recognition digital clock
JP2001282281A (ja) * 2000-03-28 2001-10-12 Toshiba Corp 記憶媒体、配信方法及び音声出力装置
US6694297B2 (en) * 2000-03-30 2004-02-17 Fujitsu Limited Text information read-out device and music/voice reproduction device incorporating the same
JP2001343989A (ja) * 2000-03-31 2001-12-14 Tsukuba Seiko Co Ltd 朗読装置
US6633741B1 (en) * 2000-07-19 2003-10-14 John G. Posa Recap, summary, and auxiliary information generation for electronic books
US6876969B2 (en) * 2000-08-25 2005-04-05 Fujitsu Limited Document read-out apparatus and method and storage medium
JP2002149560A (ja) * 2000-08-28 2002-05-24 Sharp Corp 電子メール装置及び電子メールシステム
US7194071B2 (en) * 2000-12-28 2007-03-20 Intel Corporation Enhanced media gateway control protocol
US20020099552A1 (en) * 2001-01-25 2002-07-25 Darryl Rubin Annotating electronic information with audio clips
US7107533B2 (en) * 2001-04-09 2006-09-12 International Business Machines Corporation Electronic book with multimode I/O
JP2002334086A (ja) * 2001-05-10 2002-11-22 Sony Corp 情報処理装置および情報処理方法、記録媒体、並びにプログラム
US7020663B2 (en) * 2001-05-30 2006-03-28 George M. Hay System and method for the delivery of electronic books
JP4680429B2 (ja) * 2001-06-26 2011-05-11 Okiセミコンダクタ株式会社 テキスト音声変換装置における高速読上げ制御方法
US6838994B2 (en) * 2001-10-26 2005-01-04 Koninklijke Philips Electronics N.V. Adaptive alarm system
US20030158735A1 (en) * 2002-02-15 2003-08-21 Canon Kabushiki Kaisha Information processing apparatus and method with speech synthesis function
US20030200095A1 (en) * 2002-04-23 2003-10-23 Wu Shen Yu Method for presenting text information with speech utilizing information processing apparatus
US7109848B2 (en) * 2003-11-17 2006-09-19 Nokia Corporation Applications and methods for providing a reminder or an alert to a digital media capture device

Also Published As

Publication number Publication date
AU2003241378A1 (en) 2003-11-11
JP2005524879A (ja) 2005-08-18
DE60321162D1 (de) 2008-07-03
EP1504444A1 (en) 2005-02-09
KR101022710B1 (ko) 2011-03-22
US7299182B2 (en) 2007-11-20
EP1504444A4 (en) 2005-05-18
WO2003096323A1 (en) 2003-11-20
CN100351897C (zh) 2007-11-28
MXPA04011118A (es) 2005-02-14
CN1653517A (zh) 2005-08-10
US20030212559A1 (en) 2003-11-13
KR20040104721A (ko) 2004-12-10
EP1504444B1 (en) 2008-05-21

Similar Documents

Publication Publication Date Title
JP4785381B2 (ja) ハンドヘルド装置用音声合成(tts)
US20030200858A1 (en) Mixing MP3 audio and T T P for enhanced E-book application
JP5896606B2 (ja) トーキングeブック
US9361299B2 (en) RSS content administration for rendering RSS content on a digital audio player
US20090254826A1 (en) Portable Communications Device
US20080082576A1 (en) Audio Menus Describing Media Contents of Media Players
US20090132242A1 (en) Portable audio recording and playback system
WO1999060474A1 (fr) Dispositif de lecture a haute voix, procede de commande de lecture a haute voix et support d'enregistrement
KR20090047159A (ko) 오디오-북 재생 방법 및 장치
KR20150088564A (ko) 음성인식에 기반한 애니메이션 재생이 가능한 전자책 단말기 및 그 방법
JP2005321706A (ja) 電子書籍の再生方法及びその装置
JPS63231493A (ja) 音声規則合成装置を用いた文章読み上げ方法
JP3838193B2 (ja) 文章読み上げ装置、同装置のためのプログラム及び記録媒体
TW201235869A (en) User model creation
JP2007256815A (ja) 音声再生装置、音声再生方法、音声再生プログラム
JP2005182168A (ja) コンテンツ処理装置、コンテンツ処理方法、コンテンツ処理プログラム、および記録媒体
JP2007127994A (ja) 音声合成方法及び音声合成装置並びにプログラム
JP2007128506A (ja) ドキュメント読み上げ装置、読み上げ制御方法及び記録媒体
JP2000099308A (ja) 電子ブックプレーヤ
JP2003167502A (ja) 携帯型の語学学習装置
JP2001296942A (ja) パソコンの出力制御方法
JPH06138974A (ja) メディア情報出力装置
JPH07152740A (ja) 文章読み上げ装置
JPH03276193A (ja) テキスト・音声変換装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060502

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090908

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20091204

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20091211

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100216

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20101116

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110315

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20110328

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110628

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110712

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140722

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees