JP5941264B2 - 情報処理装置、情報処理方法 - Google Patents

情報処理装置、情報処理方法 Download PDF

Info

Publication number
JP5941264B2
JP5941264B2 JP2011240661A JP2011240661A JP5941264B2 JP 5941264 B2 JP5941264 B2 JP 5941264B2 JP 2011240661 A JP2011240661 A JP 2011240661A JP 2011240661 A JP2011240661 A JP 2011240661A JP 5941264 B2 JP5941264 B2 JP 5941264B2
Authority
JP
Japan
Prior art keywords
page
character
information processing
processing apparatus
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2011240661A
Other languages
English (en)
Other versions
JP2013097627A5 (ja
JP2013097627A (ja
Inventor
友範 田中
友範 田中
奥谷 泰夫
泰夫 奥谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2011240661A priority Critical patent/JP5941264B2/ja
Priority to US13/648,857 priority patent/US9141334B2/en
Publication of JP2013097627A publication Critical patent/JP2013097627A/ja
Publication of JP2013097627A5 publication Critical patent/JP2013097627A5/ja
Application granted granted Critical
Publication of JP5941264B2 publication Critical patent/JP5941264B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/165Management of the audio stream, e.g. setting of volume, audio stream path

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • User Interface Of Digital Computer (AREA)

Description

本発明は、電子書籍の表示及び音声出力を行う為の技術に関するものである。
従来から、ページ情報を有する電子書籍コンテンツを音声出力させる技術が知られている。また、電子書籍コンテンツをページ遷移させると、予め決められた位置(例えば、ページの先頭の文章)から音声出力を行う技術がある(特許文献1)。
特開平5―313565号公報
しかしながら、ページ遷移後のページに応じて、ユーザの所望する音声出力位置は異なる。本発明は、このような問題に鑑みてなされたものであり、ページ遷移後の音声出力再開位置を、ユーザの意図に合わせて自動で特定する為の技術を提供することを目的とする。
本発明の目的を達成するために、例えば、本発明の情報処理装置は、電子書籍を構成する各ページのうちページ指定指示によって指定されたページを表示する表示手段と、
音声出力指示が入力されると、該入力の時点で前記表示手段が表示しているページを対象ページとし、該対象ページ中の各文字に対応する音声を、該文字の並び順に従って順次出力する音声出力手段と、
前記音声出力手段が前記対象ページにおいて音声出力を開始する先頭文字を、前記対象ページ中の文字に基づいて決定し、前記音声出力手段に、前記先頭文字以降の文字に対応する音声を、前記並び順に従って順次出力させる制御手段と
前記音声出力手段が前記対象ページについて音声を出力している期間内でページ指定指示が入力されるたびに、該入力されたページ指定指示によって指定されたページが前記表示手段で表示された連続時間を計時する計時手段と
を備え
前記制御手段は、
前記計時手段が計時した連続時間が規定時間以上となったページが、前記音声出力手段が最後に音声出力の対象としていた前記対象ページである場合、前記期間内で最初にページ指定指示が入力された時点で前記音声出力手段が音声を出力していた文字を最後文字とし、前記音声出力手段に、前記並び順において該最後文字の次の文字の付近に位置する文字以降の各文字に対応する音声を、前記並び順に従って順次出力させる
ことを特徴とする。
本発明の構成によれば、ページ遷移後のページに応じて、音声出力再開位置を、ユーザの意図に合わせて自動で特定することが可能となる。
情報処理装置の外観例を示す図。 情報処理装置101の機能構成例を示すブロック図。 コンピュータのハードウェア構成例を示すブロック図。 情報処理装置101が行う処理のフローチャート。 情報処理装置101が行う処理のフローチャート。 情報処理装置101が行う処理のフローチャート。 情報処理装置101が行う処理のフローチャート。 ステップS2206における処理のフローチャート。 ステップS2206における処理のフローチャート。 ステップS2206における処理のフローチャート。 ステップS2205における処理のフローチャート。 ステップS2205における処理のフローチャート。 ステップS2206における処理のフローチャート。 ステップS1302における処理のフローチャート。 情報処理装置2300の動作のフローチャート。 タッチパネル画面102の表示例を示す図。 音声出力位置記憶部208に登録される音声出力位置の構成例を示す図。 時間特定部204が管理する情報の構成例を示す図。 時間特定部204が管理する情報の構成例を示す図。 ステップS2401における処理のフローチャート。 ステップS2401における処理のフローチャート。 情報処理装置101が行う処理のフローチャート。 情報処理装置2300の外観例を示す図。 情報処理装置101が行う処理のフローチャート。 タッチパネル画面102の表示例を示す図。 タッチパネル画面102の表示例を示す図。 ステップS2401における処理のフローチャート。 タッチパネル画面102の表示例を示す図。 情報処理装置2300の機能構成例を示すブロック図。
以下、添付図面を参照し、本発明の好適な実施形態について説明する。なお、以下説明する実施形態は、本発明を具体的に実施した場合の一例を示すもので、特許請求の範囲に記載の構成の具体的な実施例の1つである。
[第1の実施形態]
先ず、本実施形態に係る情報処理装置の外観例について、図1を用いて説明する。図1に示した情報処理装置101には、タッチパネル画面102、スピーカ103、音声出力ボタン104が備わっている。なお、情報処理装置101の外観は、図1に示した外観に限るものではなく、様々な外観が適用可能であり、例えば、タッチパネル画面102、スピーカ103、音声出力ボタン104のそれぞれの配置は、図1に示した配置に限るものではない。また、ボタンやスピーカなどはその用途に応じて適宜増減させても良い。
タッチパネル画面102は、画像や文字などを表示するための表示画面として機能すると共に、ユーザの指などの指示具によるタッチ操作を検出する、いわゆるタッチパネルとしても機能する。
また、ユーザは、自身の指などでもって音声出力ボタン104を押下することで、音声出力指示を情報処理装置101に入力することができる。情報処理装置101はこの音声出力指示を検知すると、スピーカ103から音声(例えば、22.05KHzでサンプリングされたPCM方式のWAVEデータに基づく音声)を出力する。
本実施形態では、電子書籍のデータ(電子書籍コンテンツ、電子テキストコンテンツ)、該電子書籍を朗読した音声波形のデータ(音声波形データ)、は、予め情報処理装置101内にダウンロードされているものとする。しかし、これに限るものではなく、これらのデータを外部の装置に格納しておき、必要に応じて適宜ダウンロードするようにしても良い。
本実施形態における電子書籍は、W3CのXMLに準拠したマークアップ言語であるSMIL (Synchronized Multimedia Integration Language)により記述されているものとする。電子書籍中の各ページにおける各文字と、音声波形データにおいて該文字を発声している音声波形の位置(音声出力位置)と、は関連づけられている(同期がとられている)。即ち、音声波形データにおいて、電子書籍における任意のページ中の任意の文字の音声波形のデータは、一意に特定することができるようになっている。また、例えば、SMILの記述情報から、ページ番号、行数、行の先頭(後端)からの文字数等の情報も取得できるものとする。また、ページ番号、行数、行の先頭(後端)からの文字数等の情報を、SMILの記述情報と照会することにより、音声波形データ上の音声出力位置および音声出力位置が属する文章を特定できるものとする。SMILの技術については公知なのでこれに係る説明は省略する。
次に、本実施形態に係る情報処理装置101の機能構成例について、図2のブロック図を用いて説明する。なお、図2に示した構成は一例であり、下記の各部のうちいくつかを統合しても良いし、以下に説明する各処理を実現可能な構成であれば、如何なる構成を採用しても良い。
入力部201は、タッチパネル画面102に対するタッチ操作を検出したり、音声出力ボタン104の押下を検出したりする。例えば、入力部201は、タッチパネル画面102に対する右方向(左方向)へのユーザのフリック操作を特定する。ページ記憶部210は、過去に音声出力を行ったページの番号を記憶する。
ページ遷移部207は、入力部201が検出したフリック操作に基づき、タッチパネル画面102に表示するページ(遷移先のページ)の特定を行う。例えば、入力部201が右方向のフリック操作(ページ指定指示)を検知すると、現在タッチパネル画面102に表示しているページの次のページ(ページ指定指示により指定されたページ)をタッチパネル画面102への表示対象として特定する。例えば、現在タッチパネル画面102に5ページ目のページが表示されており、入力部201が右方向のフリック操作を検知したとすると、ページ遷移部207は、6ページ目のページをタッチパネル画面102への表示対象として特定する。また例えば、入力部201が左方向のフリック操作を検知すると、現在タッチパネル画面102に表示しているページの前のページをタッチパネル画面102への表示対象として特定する。例えば、現在タッチパネル画面102に5ページ目のページが表示されており、入力部201が左方向のフリック操作を検知したとすると、ページ遷移部207は、4ページ目のページをタッチパネル画面102への表示対象として特定する。そしてページ遷移部207は、上記の電子書籍コンテンツの各ページのうち特定したページの映像信号を表示部202に供給する。
表示部202は、ページ遷移部207から供給された映像信号に基づく映像(即ちページの画面)の信号を、該タッチパネル画面102に対して供給するものである。本実施形態では、電子書籍における各ページのうち、ページ遷移部207によって特定されたページの映像信号をタッチパネル画面102に供給する。
時間特定部(計時部)204は、入力部201がフリック操作を検知したことに応じてタイマを0にリセットして計時を開始するものである。そして、時間特定部204は、タイマの値が規定値に達した時点でタッチパネル画面102に表示されているページを、遷移後ページとして特定する。ページ判断部209は、最後に音声出力を行ったページの番号と、遷移後ページの番号と、を比較する。
音声出力位置制御部205は、音声出力ボタン104が押下されたときに、ページ中のどの文字から音声出力を行うのか(どの音声出力位置から音声出力を行うのか)を、ページ判断部209による比較結果等に応じて決定する。
音声出力位置記憶部208は、SMILの記述情報と照会し、最後に音声を出力した文字である最後文字を特定する為の情報(ページ番号、行数、行の先頭からの文字数の情報)を音声出力位置として記憶する。例えば、5ページにある3行目の2文字目に音声出力位置においては、ページ番号が5、行数が3、行の先頭からの文字数が2となる。
音声出力部203は、音声出力位置制御部205が決定した音声出力位置からの音声波形データに基づく音声信号を、スピーカ103に供給する。
次に、本実施形態に係る情報処理装置101が行う音声出力処理について、同処理のフローチャートを示す図4を用いて説明する。なお、以下の説明では、タッチパネル画面102には、電子書籍コンテンツにおいてN(N≧1)ページ目のページ(ページNと呼称する)が表示されており、且つこのNページ目のページについてはまだ音声出力を行っていないものとする。そしてこの状態においてユーザが音声出力ボタン104を押下すると、ステップS401以降の処理が開始されることになる。
ステップS401において、入力部201が音声出力ボタン104の押下を検知すると、音声出力位置制御部205は、音声出力開始位置をページNの先頭文字の位置とする。これにより音声出力部203は、ページNの先頭文字以降の各文字について、該文字の音声波形データから音声信号を生成してスピーカ103に供給する。即ち本ステップでは、音声出力ボタン104の押下により音声出力指示が入力されると、該入力の時点でタッチパネル画面102が表示しているページNを音声出力ページとし、該音声出力ページ中の各文字に対応する音声を該文字の並び順に従って順次出力する。ステップS402では、ページ記憶部210は、音声出力中のページの番号であるNを記憶する。
ステップS403で音声出力位置記憶部208は、ページNにおいて、最後に音声を出力した文字である最後文字を特定する為の情報を記憶する。即ち、本ステップでは、音声出力ページにおいて音声出力部203が最後に音声を出力した文字である最後文字を特定するための情報をメモリ(音声出力位置記憶部208)内で管理する。
そして、入力部201が左若しくは右のフリック操作(ページNとは異なるページをタッチパネル画面102の表示対象として指定する操作入力)を検知した場合には、処理はステップS404を介してステップS405に進む。なお、本実施形態ではページ遷移部207は、ページNの最後の文字について音声出力が行われたことを検知すると、ページ(N+1)をタッチパネル画面102への表示対象として特定するので、この場合はステップS404を介してステップS405に進む。
処理がステップS405に進んだ場合、図4では示していないが、ページ遷移部207は、入力部201が右方向のフリック操作を検知すると、ページ(N+1)をタッチパネル画面102への表示対象(ページの遷移先)として特定する。一方、ページ遷移部207は、入力部201が左方向のフリック操作を検知すると、ページ(N−1)をタッチパネル画面102への表示対象(ページの遷移先)として特定する。そしてページ遷移部207は、上記の電子書籍コンテンツの各ページのうち特定したページの映像信号を表示部202に供給する。
一方、入力部201が左若しくは右のフリック操作を検知していない場合は、処理はステップS404を介してステップS401に戻り、次の文字について以降の処理を行う。
このように、入力部201がフリック操作を検知しない限りは、ページN中の各文字を順次、音声出力する。そして、ステップS401で音声出力を行う音声出力位置が1文字進むたびに、最後文字もこれに従って1文字進むことになる。
N=5の場合に、最初のステップS403で音声出力位置記憶部208に登録される情報の構成例を図17(a)に示す。上記のとおり、ページ5についてはまだ音声出力は行っていないので、音声出力位置記憶部208には、ページ番号「5」、ページ5の先頭文字の位置(行数「1」、行の先頭の文字からの文字数「1」)、が音声出力位置として登録される。そしてその後、音声出力位置が進み、ページ5において4行目の先頭から4文字目の文字について音声出力を行うと、最後文字の位置は「ページ5、4行目、先頭から4文字目)となる。然るに、音声出力位置記憶部208中の音声出力位置は、図17(b)に示す如く、ページ番号「5」、行数「4」、行の先頭の文字からの文字数「4」、に更新される。
タッチパネル画面102におけるページNの表示例を図16に示す。このとき、音声出力部203が、この音声出力位置記憶部208内の情報をSMILの記述情報と照会し、「今年の電子書籍コンテンツの増加率は目覚ましいものがありました」の先頭から音声波形データを音声出力することになる。
ステップS405では、音声出力部203は、音声出力を停止する。そしてステップS406では、時間特定部204は、タイマの値Z(ページ滞在時間Z:単位はmsec)を0にリセットしてから計時を開始する。計時は、ページの遷移開始と共に開始しても良いし、次のページへの遷移が完了してから開始しても良い。
ステップS407では、時間特定部204は、タイマの値Zが規定値に達したか否かを判断する。この判断の結果、タイマの値Zが規定値(例えば、2000msecとする)に達した場合には、処理はステップS411に進み、規定値に達していない場合は、処理はステップS408に進む。ステップS408〜S410の処理はそれぞれ、ステップS404〜S406と同じである。
ステップS408に処理が進んだ時点で、入力部201が左若しくは右のフリック操作を検知した場合、若しくはページ遷移部207が、遷移先のページにおける最後の文字について音声出力が行われたことを検知した場合は、処理はステップS409に進む。処理がステップS409に進んだ場合でも、ページ遷移部207は、タッチパネル画面102への表示対象ページを特定し、特定したページの映像信号を表示部202に供給する。
ステップS409では、音声出力部203は、音声出力を停止する。ただし、この時点で音声出力が停止されている場合は、この処理は実行されない。
そしてステップS410では、時間特定部204は、タイマの値Z(ページ滞在時間Z:単位はmsec)を0にリセットしてから計時を開始する。そして処理はステップS408に進む。
ステップS408に処理が進んだ時点で、入力部201が何れのフリック操作も検知していない場合、若しくはページ遷移部207が、遷移先のページにおける最後の文字について音声出力が行われたことを検知していない場合、処理はステップS407に進む。
ステップS411では、時間特定部204は、処理がステップS411に進んだ時点でタッチパネル画面102に表示されているページ(この時点でページ遷移部207が特定しているページ)を遷移後ページとして特定する。すなわち、上記のように、音声出力ページ中の各文字に対応する音声の出力中にページ指定指示が入力されると、音声の出力を停止し、該入力されたページ指定指示によって指定されたページがタッチパネル画面102で表示される連続時間を計時する。また、該停止後にページ指定指示が入力されると、該ページ指定指示によって指定されたページがタッチパネル画面102で表示される連続時間を計時する。そして、この計時した連続時間が規定時間以上となったページが上記の遷移後ページとなる。
そして時間特定部204は、この遷移後ページのページ番号を変数Iに代入する。また、時間特定部204は、図18に例示するように、タッチパネル画面102に表示されたページごとに、該ページの表示期間中に計時したタイマの値Zを管理している。
ステップS412では、ページ判断部209は、I=Nであるか否かを判断する。この判断の結果、I=Nである場合、即ち、遷移後ページがページNである場合、処理はステップS413に進む。一方、I≠Nである場合は、処理はステップS414に進む。
ステップS413では、音声出力位置制御部205は、音声出力位置記憶部208に格納されている音声出力位置を参照して、ページNにおける最後文字(の位置)を特定する。そして音声出力部203は、ページN中の文字の並び順において最後文字の次の文字以降に並んでいる文字の音声波形データに基づく音声信号を、スピーカ103に供給する。
例えば、タッチパネル画面102に図16に示すページが表示されており、音声出力位置記憶部208に図17(b)に示した音声出力位置が格納されているとする。この場合、ステップS413では、「来年以降も、電子書籍コンテンツはますます増えていくと予想されます。」の文章の「電子書籍…」から音声出力を行う。なお、ステップS404でページ遷移部207が、ページNの最後の文字について音声出力が行われたことを検知すると、音声出力部203は、ページN中の先頭文字以降に並んでいる文字の音声波形データに基づく音声信号を、スピーカ103に供給する。
一方、ステップS414では、ページ判断部209は、I>Nであるか否かを判断する。この判断の結果、I>N、即ち、遷移後ページがページNよりもページ番号が大きい後続ページであるとする。この場合、処理はステップS415に進む。一方、I≦Nの場合は、処理はステップS416に進む。
ステップS415では、音声出力位置制御部205は、音声出力開始位置をページIの先頭文字の位置とする。これにより音声出力部203は、ページIの先頭文字以降の各文字について、該文字の音声波形データから音声信号を生成してスピーカ103に供給する。
一方、ステップS416では、時間特定部204は、タイマの値Zが規定値(例えば、6000msecとする)に達しているか否かを判断する。この判断の結果、達している場合は、本処理は終了し、達していない場合は、処理はステップS408に進む。
即ち、ステップS401からステップS416の処理により、遷移後ページに応じて音声出力開始位置を自動で特定することが可能となる。ページ遷移後、音声出力させていた元のページに戻ってきた場合は、ページ遷移を開始した時の音声出力位置が音声出力再開位置となる。ページ遷移後、音声出力させていた元のページよりも後ろにページ遷移した場合は、ページの先頭から音声出力させる。ページ遷移後、音声出力させていた元のページよりも前にページ遷移した場合は、音声出力が停止される。
なお、図4に示した処理の代わりに、図5に示した処理の如く、ステップS405における処理をステップS411の直前に行うようにしても良い。また、図4に示した処理の代わりに、図6に示した処理の如く、ステップS402,S403の処理を、ステップS404の直後に行うようにしても良い。図6の処理では、ページ番号と音声出力位置の記憶は、ページ遷移確定後の1回になり、処理コストを削減することが可能となる。
また、図4に示した処理の代わりに、図7に示した処理の如く、ステップS402,S403の処理をステップS404の直後に行い、ステップS405における処理をステップS411の直前に行うようにしても良い。図7の処理では、ページ番号と音声出力位置の記憶は、ページ遷移確定後の1回になり、処理コストを削減することが可能となる。
このように、本実施形態の変形例はいくつか考えることができるが、これらの変形例は、以下の構成を満たしている。即ち、音声出力ページについて音声を出力している期間内でページ指定指示が入力されるたびに、該入力されたページ指定指示によって指定されたページがタッチパネル画面102で表示された連続時間を計時する。そして、この計時した連続時間が規定時間以上となったページが音声出力ページである場合、この期間内で最初にページ指定指示が入力された時点で音声を出力していた文字を最後文字とする。そして、該最後文字の次の文字以降の各文字に対応する音声を、該文字の並び順に従って順次出力する。
なお、上記で説明した音声出力処理、即ち、ページ遷移後、音声出力させていた元のページよりも前にページ遷移した場合、音声出力が停止される本実施形態を、第1の音声出力モードとする。
本実施形態では、タッチ操作によりページ遷移を行っているが、ボタン押下等によりページ遷移を行ってもよい。また、音声出力ボタン104の押下を認識するとページの先頭の文章から音声出力を開始しているが、タッチ操作等でページ上の任意の位置を指定して、指定された文章から音声出力を開始させてもよい。また、電子書籍コンテンツを朗読した音声波形データを音声出力しているが、電子書籍コンテンツを音声合成の技術により音声出力してもよい。
ただし、音声合成の技術を用いる場合、ステップS413において、音声出力位置制御部205は、最後文字の次の付近の文字以降に並んでいる文字の音声波形データに基づく音声信号を、スピーカ103に供給する。例えば、「来年以降も、電子書籍コンテンツはますます増えていくと予想されます。」の文章の「電」が最後文字になったとする。音声合成技術を用いた場合、「ししょせき」と読み上げられずに、「こしょせき」のように誤った読みになる場合がある。よって、最後文字の付近の文字にある、文章の先頭や文章中の区切りの良い文字から、音声合成により音声出力される。例えば、文章の先頭の「来年・・・」、もしくは、文章中の「電子・・・」や「ますます・・・」から音声出力される。音声合成技術については、公知なのでここでは省略する。
[第2の実施形態]
第1の実施形態では上記の通り、ページ遷移後、音声出力させていた元のページよりも前にページ遷移した場合は、音声出力が停止される第1の音声出力モードについて説明した。第2の実施形態においては、元のページの音声出力位置における文章に関連した文章を音声出力させる第2の音声出力モードについて説明する。
なお、本実施形態でも、第1の実施形態で使用した情報処理装置101を使用するものとする。以下では、第1の実施形態と異なる点について説明し、特に触れない限りは、第1の実施形態を適宜用いることとする。
本実施形態に係る情報処理装置101が行う音声出力処理について、同処理のフローチャートを示す図24を用いて説明する。なお、以下の説明では、タッチパネル画面102には、電子書籍コンテンツにおいてN(N≧1)ページ目のページ(ページNと呼称する)が表示されており、且つこのNページ目のページについてはまだ音声出力を行っていないものとする。そしてこの状態においてユーザが音声出力ボタン104を押下すると、ステップS401以降の処理が開始されることになる。図24に示したフローチャートは、ステップS414でI≦Nと判断された場合に、処理がステップS2401に進み、ステップS2401の後、処理がステップS416に進む点が図4と異なる。
ステップS2401では、音声出力位置制御部205は、音声出力位置記憶部208に格納されている音声出力位置における文字が属する文章と関連する文章を特定する。そして音声出力部203は、この特定された文章を構成する各文字の音声波形データに基づく音声信号をスピーカ103に対して供給する。
元のページよりも前にページ遷移した場合は、元のページの文章の意味などの確認の場合が多い。従って、元のページの音声出力位置に関連した文章を音声出力させることで、ユーザが所望する音声出力位置から音声出力することが可能となる。
ステップS2401における処理の詳細について、図20のフローチャートを用いて説明する。ステップS2001では、音声出力位置制御部205は、SMILの記述情報と照合することにより、音声出力位置記憶部208に格納されている音声出力位置から、最後文字が属する文章を特定する。例えば、図16より、「来年以降も、電子書籍コンテンツはますます増えていくと予想されます。」の文章が特定される。
ステップS2002では、音声出力位置制御部205は、ステップS2001で特定した文章中の名詞を特定する。名詞の特定には、形態素解析といった周知の技術を用いる。この形態素解析については周知の技術であるため、これについての説明は省略する。「来年以降も、電子書籍コンテンツはますます増えていくと予想されます。」の文章からは、「来年以降」と「電子書籍コンテンツ」が特定される。
ステップS2003では、音声出力位置制御部205は、遷移後ページ内(先ページ内)に、ステップS2002で特定した名詞が含まれているか否かを判断する。この判断においても、上記の形態素解析を用いる。この判断の結果、含まれている場合は、処理はステップS2004に進み、含まれていない場合は、処理はステップS2005に進む。
ステップS2005では、音声出力位置制御部205は、音声出力開始位置をページIの先頭文字の位置とする。これにより音声出力部203は、ページIの先頭文字以降の各文字について、該文字の音声波形データから音声信号を生成してスピーカ103に供給する。 ステップS2004では、音声出力位置制御部205は、音声出力開始位置を、ページIにおいて、ステップS2002で特定した名詞を含む文章の先頭文字の位置とする。これにより音声出力部203は、この文章の先頭文字以降の各文字について、該文字の音声波形データから音声信号を生成してスピーカ103に供給する。
例えば、タッチパネル画面102に図25に示す画面が遷移後ページとして表示されているとする。この場合、「電子書籍コンテンツ」が「各企業、電子書籍コンテンツにも力を入れ始めています。」の文章に含まれている。然るにこの場合、「電子書籍コンテンツ」が含まれている文章「各企業、電子書籍コンテンツにも力を入れ始めています。」の先頭文字から順に音声出力される。
なお、ステップS2401では、図20のフローチャートの処理の代わりに、図21のフローチャートの処理を行うようにしても良い。図21において図20と同じ処理ステップには同じステップ番号を付しており、その説明は省略する。
ステップS2103では、音声出力位置制御部205は、遷移後ページ内の段落のタイトル(タイトル文章)に、ステップS2002で特定した名詞が含まれているか否かを判断する。この判断においても、上記の形態素解析を用いる。この判断の結果、含まれている場合は、処理はステップS2104に進み、含まれていない場合は、処理はステップS2005に進む。
例えば、タッチパネル画面102に図26に示す画面が表示されている場合、タイトル「今後の電子書籍コンテンツ」に「電子書籍コンテンツ」が含まれている。この場合は、ステップS2104の処理を行う。タイトルの情報は、SMILの記述情報から取得できる。
ステップS2104では、音声出力位置制御部205は、音声出力開始位置を、ページIにおいて、ステップS2002で特定した名詞を含むタイトルの先頭文字の位置とする。これにより音声出力部203は、このタイトルの先頭文字以降の各文字について、該文字の音声波形データから音声信号を生成してスピーカ103に供給する。図26の場合は、段落のタイトルである「今後の電子書籍コンテンツ」の先頭から音声出力される。
また、ステップS2401では、図27のフローチャートの処理を行うようにしても良い。図27において図20と同じ処理ステップには同じステップ番号を付しており、その説明は省略する。
ステップS270では、音声出力位置制御部205は、遷移後ページに強調文章(特定の種別の文章の一例)が含まれているか否かを判断する。この判断の結果、含まれている場合は、処理はステップS2701に進み、含まれていない場合は、処理はステップS2005に進む。例えば、タッチパネル画面102に図28に示す画面が表示されている場合、同画面中の文章には強調文章である「1章の重要ポイント」が含まれている。この場合は、ステップS2701の処理を行う。強調文章の情報は、SMILの記述情報から取得できる。
ステップS2701では、音声出力位置制御部205は、音声出力開始位置を、ページIにおいて、強調文章の先頭文字の位置とする。これにより音声出力部203は、この強調文章の先頭文字以降の各文字について、該文字の音声波形データから音声信号を生成してスピーカ103に供給する。
[第3の実施形態]
第3の実施形態においては、ページ遷移後のページに加えて、ページ遷移時間に応じて音声出力開始位置を制御する第3の音声出力モードについて説明する。なお、本実施形態でも、第1の実施形態で使用した情報処理装置101を使用するものとする。以下では、第1の実施形態と異なる点について説明し、特に触れない限りは、第1の実施形態を適宜用いることとする。
本実施形態に係る情報処理装置101が行う音声出力処理について、同処理のフローチャートを示す図22を用いて説明する。なお、以下の説明では、タッチパネル画面102には、電子書籍コンテンツにおいてN(N≧1)ページ目のページ(ページNと呼称する)が表示されており、且つこのNページ目のページについてはまだ音声出力を行っていないものとする。そしてこの状態においてユーザが音声出力ボタン104を押下すると、ステップS401以降の処理が開始されることになる。図22において、図4,24と同じ処理ステップには同じステップ番号を付しており、その説明は省略する。また、本実施形態では、時間特定部204は、図19に例示するように、タッチパネル画面102に表示されたページごとに、該ページの表示期間中に計時したタイマの値Zを管理している。
ステップS2201では、ページ遷移部207は、ページの遷移回数を示す変数Yを1に初期化する。ステップS2202では、時間特定部204は、ページ遷移の時間(単位はmsec)を計時するためのタイマの値Xを0に初期化してから計時を開始する。ステップS2203では、ページ遷移部207は、変数Yの値を1つインクリメントする。
即ち、音声出力ページについて音声を出力している期間内で最初にページ指定指示の入力を検知したタイミングから、計時した連続時間が規定時間以上となったタイミングまでのタイミング間でページ指定指示が入力された回数を変数Yの値としてカウントする。また、ページNの表示中に入力部201がフリック操作を検知してからの経過時間をタイマの値Xとして計時する。
ステップS2204では、ページ遷移部207は、ページ遷移の時間を計時するためのタイマによる計時を停止し、該タイマの値Xを取得する。例えば、X=5800msecとする。
ステップS2205では、ページ遷移部207は、変数Yの値を用いて、所定時間Sを求める。変数Yの値を用いて所定時間Sを求める方法には様々な方法が考えられるが、以下にいくつかの方法を説明する。
ステップS2206では、音声出力位置制御部205は、タイマの値Xに応じて、ページIにおける音声出力開始位置を決定する。これにより音声出力部203は、ページIにおいてこの決定した音声出力開始位置における文字以降の各文字について、該文字の音声波形データから音声信号を生成してスピーカ103に供給する。
次に、上記のステップS2205において行う処理の一例について、図11のフローチャートを用いて説明する。ステップS1101では、ページ遷移部207は、変数Yの値が規定値以上であるか否かを判断する。この判断の結果、規定値以上であれば、処理はステップS1102に進み、規定値よりも小さい場合は、処理はステップS1103に進む。
ステップS1102では、ページ遷移部207は、所定時間Sとして予め定められた値B(例えば、8000msecとする)を設定する。ステップS1103では、ページ遷移部207は、所定時間Sとして予め定められた値C(<B)(例えば、3000msecとする)を設定する。
また、ステップS2205において行う処理の一例について、図12のフローチャートを用いて説明する。ステップS1201では、ページ遷移部207は、変数Yの値に任意の係数Kを乗じた結果を所定時間Sに設定する。即ち、変数Yの値が大きいほど所定時間Sが大きくなるように、この所定時間Sを求める。
次に、上記のステップS2206における処理の詳細について、同処理のフローチャートを示す図8を用いて説明する。
ステップS801では、音声出力位置制御部205は、タイマの値Xが所定時間S(第1の閾値)以下であるか否かを判断する。この判断の結果、タイマの値Xが所定時間S以下である場合は、処理はステップS802に進み、タイマの値Xが所定時間Sよりも大きい場合は、処理はステップS804に進む。
ステップS802では、音声出力位置制御部205は、音声出力位置記憶部208に格納されている音声出力位置を参照して、ページNにおける最後文字(の位置)を特定する。そしてステップS803では音声出力部203は、ページN中の文字の並び順において最後文字の次の文字以降に並んでいる文字の音声波形データに基づく音声信号を、スピーカ103に供給する。
一方、ステップS804では、音声出力位置制御部205は、タイマの値Xが第2の閾値であるT(T>Sを満たし、例えば、T=2×S)以下であるか否か(即ち、S<X≦Tであるか否か)を判断する。この判断の結果、S<X≦Tであれば、処理はステップS805に進み、X>Tである場合は、処理はステップS806に進む。
ステップS805では、音声出力位置制御部205は、音声出力位置記憶部208に格納されている音声出力位置を参照して、ページNにおける最後文字(の位置)を特定する。そして音声出力位置制御部205は、ページNにおいてこの最後文字が属する段落の先頭の文章を特定する。そしてステップS803では音声出力部203は、ページNにおいてこの特定した文章中の文字の並び順において先頭文字以降に並んでいる文字の音声波形データに基づく音声信号を、スピーカ103に供給する。
ステップS806では音声出力位置制御部205は、ページNにおける先頭文字を特定する。そしてステップS803では音声出力部203は、ページNにおける先頭文字以降に並んでいる文字の音声波形データに基づく音声信号を、スピーカ103に供給する。
即ち、多少の確認等で、短時間でページを戻した場合は、ページ遷移開始時に中断された音声出力を再開させることが可能となる。また、他のページを熟読してページを戻した場合等のように、長時間でページを戻した場合は、再度ページの先頭から音声出力を再開させることが可能となる。また、いくらかの確認で一定時間経過しページを戻した場合は、ページ遷移開始時に中断された音声出力を段落の先頭から再開させることが可能となる。
なお、上記のステップS2206では、図9に示すフローチャートに従った処理を行うようにしても良い。ステップS901では、音声出力位置制御部205は、タイマの値Xが所定時間S以下であるか否かを判断する。この判断の結果、タイマの値Xが所定時間S以下である場合は、処理はステップS902に進み、タイマの値Xが所定時間Sよりも大きい場合は、処理はステップS904に進む。
ステップS902では、音声出力位置制御部205は、音声出力位置記憶部208に格納されている音声出力位置を参照して、ページNにおける最後文字(の位置)を特定する。そしてステップS903では音声出力部203は、ページN中の文字の並び順において最後文字の次の文字以降に並んでいる文字の音声波形データに基づく音声信号を、スピーカ103に供給する。
一方、ステップS904では、音声出力位置制御部205は、ページNにおける先頭文字を特定する。そしてステップS903では音声出力部203は、ページNにおける先頭文字以降に並んでいる文字の音声波形データに基づく音声信号を、スピーカ103に供給する。
即ち、多少の確認等で、短時間でページを戻した場合は、ページ遷移開始時に中断された音声出力を再開させることが可能となる。また、他のページを熟読してページを戻した場合等のように、長時間でページを戻した場合は、再度ページの先頭から音声出力を再開させることが可能となる。
また、上記のステップS2206では、図10に示すフローチャートに従った処理を行うようにしても良い。ステップS1001では、音声出力位置制御部205は、タイマの値Xが所定時間S以下であるか否かを判断する。この判断の結果、タイマの値Xが所定時間S以下である場合は、処理はステップS1002に進み、タイマの値Xが所定時間Sよりも大きい場合は、処理はステップS1004に進む。
ステップS1002では、音声出力位置制御部205は、音声出力位置記憶部208に格納されている音声出力位置を参照して、ページNにおける最後文字(の位置)を特定する。そして音声出力位置制御部205は、ページNにおいてこの最後文字が属する段落の先頭の文章を特定する。そしてステップS1003では音声出力部203は、ページNにおいてこの特定した文章中の文字の並び順において先頭文字以降に並んでいる文字の音声波形データに基づく音声信号を、スピーカ103に供給する。
一方、ステップS1004では、音声出力位置制御部205は、ページNにおける先頭文字を特定する。そしてステップS1003では音声出力部203は、ページNにおける先頭文字以降に並んでいる文字の音声波形データに基づく音声信号を、スピーカ103に供給する。
即ち、他のページを熟読してページを戻した場合等のように、長時間でページを戻した場合は、再度ページの先頭から音声出力を再開させることが可能となる。また、いくらかの確認で一定時間経過しページを戻した場合は、ページ遷移開始時に中断された音声出力を段落の先頭から再開させることが可能となる。
また、上記のステップS2206では、図13に示すフローチャートに従った処理を行うようにしても良い。
ステップS1301では、音声出力位置制御部205は、タイマの値Xが所定時間S以下であるか否かを判断する。この判断の結果、タイマの値Xが所定時間S以下である場合は、処理はステップS1302に進み、タイマの値Xが所定時間Sよりも大きい場合は、処理はステップS1306に進む。
ステップS1302では、音声出力位置制御部205は、音声出力位置記憶部208に格納されている音声出力位置が、該音声出力位置が属する文章の前半に位置しているのか否かを判断する。この判断の結果、前半に位置している場合には、処理はステップS1303に進み、後半に位置している場合には、処理はステップS1305に進む。ステップS1302における処理の詳細については、図14を用いて後述する。
ステップS1303では、音声出力位置制御部205は、音声出力位置記憶部208に格納されている音声出力位置が属する文章を特定する。そしてステップS1304では音声出力部203は、ページNにおいてこの特定した文章中の文字の並び順において先頭文字以降に並んでいる文字の音声波形データに基づく音声信号を、スピーカ103に供給する。
ステップS1305では、音声出力位置制御部205は、音声出力位置記憶部208に格納されている音声出力位置が属する文章の次の文章を特定する。そしてステップS1304では音声出力部203は、ページNにおいてこの特定した文章中の文字の並び順において先頭文字以降に並んでいる文字の音声波形データに基づく音声信号を、スピーカ103に供給する。
ステップS1306では、音声出力位置制御部205は、ページNにおける先頭文字を特定する。そしてステップS1304では音声出力部203は、ページNにおける先頭文字以降に並んでいる文字の音声波形データに基づく音声信号を、スピーカ103に供給する。
即ち、短時間でページを戻し、ページ遷移開始時の音声出力位置が文章の前半であった場合は、その文章の先頭から音声出力を再開させることが可能となる。また、ページ遷移開始時の音声出力位置が文章の後半であった場合は、その文章の次の文章から音声出力を再開させることが可能となる。
次に、上記のステップS1302における処理について、図14のフローチャートを用いて説明する。
ステップS1401では、音声出力位置制御部205は、音声出力位置記憶部208に格納されている音声出力位置が属する文章を特定する。
ステップS1402では、音声出力位置制御部205は、ステップS1401で特定した文章の先頭文字から音声出力位置までの文字数Xを計数する。ステップS1403では、音声出力位置制御部205は、ステップS1401で特定した文章の文末文字から音声出力位置までの文字数Yを計数する。
ステップS1404では、音声出力位置制御部205は、X>Yであるか否かを判断する。この判断の結果、X>Yであれば、処理はステップS140に進み、X≦Yであれば、処理はステップS140に進む。
ステップS1405では、音声出力位置制御部205は、音声出力位置は前半に位置していると判断し、ステップS1406では、音声出力位置制御部205は、音声出力位置は後半に位置していると判断する。
[第4の実施形態]
第1〜3の実施形態ではそれぞれ、第1〜第3の音声出力モードについて説明した。本実施形態では、第1〜第3の音声出力モードを切り替えて使用する。本実施形態に係る情報処理装置2300の外観例を図23に示す。図23において図1に示した構成要件と同じ構成要件については同じ参照番号を付しており、その説明は省略する。
ボタン2301〜2303はそれぞれ、第1の音声出力モード、第2の音声出力モード、第3の音声出力モード、を指定するために押下するボタンである。なお、第1〜3の音声出力モードを指定するための方法はこれに限るものではない。例えば、1つのボタンを押下するごとにモードを切り替えるようにしても良いし、タッチパネル画面102にそれぞれのモードを指定するためのボタン画像を表示するようにしても良い。
本実施形態に係る情報処理装置2300の機能構成例について、図29のブロック図を用いて説明する。なお、図29において、図2に示した構成要件と同じ構成要件については同じ参照番号を付しており、その説明は省略する。
入力部201は、音声出力ボタン104やタッチパネル画面102からの操作入力だけでなく、ボタン2301〜2303の押下も検知する。モード切替部2901は、ボタン2301〜2303のうち押下されたボタンに応じたモードを設定する。即ち、モード切替部2901は、入力部201がボタン2301が押下されたことを検知すると、第1の音声出力モードを設定する。また、モード切替部2901は、入力部201がボタン2302が押下されたことを検知すると、第2の音声出力モードを設定する。また、モード切替部2901は、入力部201がボタン2303が押下されたことを検知すると、第3の音声出力モードを設定する。
本実施形態に係る情報処理装置2300の動作について、図15のフローチャートを用いて説明する。
ステップS1501では、入力部201は、ボタン2301〜2303の何れが押下されたのかを検知し、モード切替部2901は、入力部201が押下されたと判断したボタンに応じたモードを設定する。
この設定したモードが第1の音声出力モードであれば、処理はステップS1502を介してステップS1503に進む。ステップS1503では、第1の実施形態で説明した各処理を実行する。
また、この設定したモードが第2の音声出力モードであれば、処理はステップS1502、S1504を介してステップS1505に進む。ステップS1505では、第2の実施形態で説明した各処理を実行する。
また、この設定したモードが第3の音声出力モードであれば、処理はステップS1502、S1504を介してステップS1506に進む。ステップS1506では、第3の実施形態で説明した各処理を実行する。
なお、以上説明した第1〜4の実施形態は、適宜組み合わせて使用することも可能である。なお、組み合わせの際には、適宜構成を省いても良いし、適宜構成を付け加えても良い。
[第5の実施形態]
,29に示した各部は何れもハードウェアで構成しても良いが、例えば、音声出力位置記憶部208をメモリで構成し、それ以外の各部をソフトウェア(コンピュータプログラム)で構成しても良い。このような場合に、情報処理装置101,2300に適用可能なコンピュータのハードウェア構成例について、図3のブロック図を用いて説明する。
CPU301は、RAM302やROM303に格納されているコンピュータプログラムやデータを用いて、コンピュータ全体の動作制御を行うと共に、情報処理装置101、2300が行うものとして上述した各処理を実行する。
RAM302は、HDD(ハードディスクドライブ)等の外部メモリ308からロードされたコンピュータプログラムやデータを一時的に記憶するためのエリアや、CPU301が各種の処理を実行する際に用いるワークエリアを有する。即ち、RAM302は、各種のエリアを適宜提供することができる。ROM303には、コンピュータの設定データやブートプログラムなどが格納されている。
入力部304は、上記の音声出力ボタン104や、ボタン2301〜2303、タッチパネル画面102におけるタッチセンサに相当し、上記の通り、各種の指示をCPU301に対して入力することができる。表示部305は、上記のタッチパネル画面102に相当する。音声出力部306は、上記のスピーカ103に相当する。
外部メモリ308には、OS(オペレーティングシステム)や、上記の各実施形態で説明した各種の処理をCPU301に実行させるためのコンピュータプログラムやデータが保存されている。このコンピュータプログラムは、図,29において音声出力位置記憶部208を除く各部に相当するコンピュータプログラムを含む。また、このデータは、電子書籍コンテンツのデータや、上記の処理で既知のものとして説明したデータを含む。
外部メモリ308に保存されているコンピュータプログラムやデータは、CPU301による制御に従って適宜RAM302にロードされ、CPU301による処理対象となる。上記の各部は共通のバス307に接続されている。なお、上記の音声出力位置記憶部208は、外部メモリ308やRAM302に相当する。
なお、図,29に示した機能構成を有する情報処理装置は、図3に示した構成を有する1台のコンピュータで実装しても良いが、複数台の装置によってこの情報処理装置を構成するようにしても良い。
なお、図,29に示した各部を全部ハードウェア/ソフトウェアで構成せずに、一部をハードウェア/ソフトウェアで構成するようにしても良い。この場合であっても、このソフトウェアはメモリに格納し、このソフトウェアは、CPU301により実行される。
(その他の実施例)
また、本発明は、以下の処理を実行することによっても実現される。即ち、上述した実施形態の機能を実現するソフトウェア(プログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(またはCPUやMPU等)がプログラムを読み出して実行する処理である。

Claims (14)

  1. 電子書籍を構成する各ページのうちページ指定指示によって指定されたページを表示する表示手段と、
    音声出力指示が入力されると、該入力の時点で前記表示手段が表示しているページを対象ページとし、該対象ページ中の各文字に対応する音声を、該文字の並び順に従って順次出力する音声出力手段と、
    前記音声出力手段が前記対象ページにおいて音声出力を開始する先頭文字を、前記対象ページ中の文字に基づいて決定し、前記音声出力手段に、前記先頭文字以降の文字に対応する音声を、前記並び順に従って順次出力させる制御手段と
    前記音声出力手段が前記対象ページについて音声を出力している期間内でページ指定指示が入力されるたびに、該入力されたページ指定指示によって指定されたページが前記表示手段で表示された連続時間を計時する計時手段と
    を備え
    前記制御手段は、
    前記計時手段が計時した連続時間が規定時間以上となったページが、前記音声出力手段が最後に音声出力の対象としていた前記対象ページである場合、前記期間内で最初にページ指定指示が入力された時点で前記音声出力手段が音声を出力していた文字を最後文字とし、前記音声出力手段に、前記並び順において該最後文字の次の文字の付近に位置する文字以降の各文字に対応する音声を、前記並び順に従って順次出力させる
    ことを特徴とする情報処理装置。
  2. 前記制御手段は、前記連続時間が規定時間以上となったページが、前記対象ページよりもページ番号が大きい後続ページである場合、前記音声出力手段に、前記後続ページにおける先頭文字以降の各文字に対応する音声を、該文字の並び順に従って順次出力させることを特徴とする請求項に記載の情報処理装置。
  3. 前記制御手段は、前記連続時間が規定時間以上となったページが、前記対象ページよりもページ番号が小さい先ページである場合、前記対象ページ中の最後文字を含む文章から名詞を特定し、該特定した名詞を含む文章を該先ページから特定し、前記音声出力手段に、該特定した文章における先頭文字以降の各文字に対応する音声を、該文字の並び順に従って順次出力させることを特徴とする請求項又はに記載の情報処理装置。
  4. 前記制御手段は、前記連続時間が規定時間以上となったページが、前記対象ページよりもページ番号が小さい先ページである場合、前記対象ページ中の最後文字を含む文章から名詞を特定し、該特定した名詞を含むタイトルを該先ページから特定し、前記音声出力手段に、該特定したタイトルにおける先頭文字以降の各文字に対応する音声を、該文字の並び順に従って順次出力させることを特徴とする請求項又はに記載の情報処理装置。
  5. 前記制御手段は、前記連続時間が規定時間以上となったページが、前記対象ページよりもページ番号が小さい先ページである場合、前記音声出力手段に、該先ページ内の特定の種別の文章の先頭文字以降の各文字に対応する音声を、該文字の並び順に従って順次出力させることを特徴とする請求項又はに記載の情報処理装置。
  6. 前記制御手段は更に、
    前記期間内で最初にページ指定指示が入力されたことを検知したタイミングから、前記連続時間が規定時間以上となったタイミングまでのタイミング間の長さを求め、
    前記連続時間が規定時間以上となったページが前記対象ページであり、且つ前記長さが第1の閾値よりも短い場合は、前記音声出力手段に、前記対象ページ中の最後文字の次の文字以降の各文字に対応する音声を、該文字の並び順に従って順次出力させ、
    前記連続時間が規定時間以上となったページが前記対象ページであり、且つ前記長さが前記第1の閾値よりも長い場合は、前記音声出力手段に、前記対象ページにおける先頭文字以降の各文字に対応する音声を、該文字の並び順に従って順次出力させる、若しくは前記音声出力手段に、前記対象ページにおいて最後文字を含む段落の文章における先頭文字以降の各文字に対応する音声を、該文字の並び順に従って順次出力させる
    ことを特徴とする請求項乃至の何れか1項に記載の情報処理装置。
  7. 更に、前記タイミング間でページ指定指示が入力された回数を用いて前記第1の閾値を設定する手段を備えることを特徴とする請求項に記載の情報処理装置。
  8. 情報処理装置が行う情報処理方法であって、
    前記情報処理装置の表示手段が、電子書籍を構成する各ページのうちページ指定指示によって指定されたページを表示する表示工程と、
    前記情報処理装置の音声出力手段が、音声出力指示が入力されると、該入力の時点で前記表示工程で表示しているページを対象ページとし、該対象ページ中の各文字に対応する音声を、該文字の並び順に従って順次出力する音声出力工程と、
    前記情報処理装置の制御手段が、前記音声出力工程で前記対象ページにおいて音声出力を開始する先頭文字を、前記対象ページ中の文字に基づいて決定し、前記音声出力工程で、前記先頭文字以降の文字に対応する音声を、前記並び順に従って順次出力させる制御工程と
    前記情報処理装置の計時手段が、前記音声出力工程で前記対象ページについて音声を出力している期間内でページ指定指示が入力されるたびに、該入力されたページ指定指示によって指定されたページが前記表示工程で表示された連続時間を計時する計時工程と
    を備え
    前記制御工程では、
    前記計時工程で計時した連続時間が規定時間以上となったページが、前記音声出力工程で最後に音声出力の対象としていた前記対象ページである場合、前記期間内で最初にページ指定指示が入力された時点で前記音声出力工程で音声を出力していた文字を最後文字とし、前記音声出力工程で、前記並び順において該最後文字の次の文字の付近に位置する文字以降の各文字に対応する音声を、前記並び順に従って順次出力させる
    ことを特徴とする情報処理方法。
  9. コンピュータを、請求項1乃至の何れか1項に記載の情報処理装置の各手段として機能させるためのコンピュータプログラム。
  10. コンピュータを、請求項1乃至7の何れか1項に記載の情報処理装置の各手段として機能させるためのコンピュータプログラム、を格納した、コンピュータ読み取り可能な記憶媒体。
  11. 表示画面に表示させた文字列に対応する音声を出力する情報処理装置であって、
    複数ページからなるドキュメントにおいて指定されたページを前記表示画面に表示させる表示制御手段と、
    前記表示画面に表示されているページ中の各文字に対応する音声を、該文字の並び順に従って順次出力する音声出力手段と、
    前記表示画面に表示させるページを変更する指示の入力を検知する検知手段と
    を備え、
    前記音声出力手段は、
    前記表示画面に表示されている表示ページについて音声を出力している期間中に前記検知手段が複数の指示を検知した結果、前記表示画面に前記表示ページが表示された場合、前記複数の指示のうち最初の指示を検知した時点で前記音声出力手段によって出力されていた文字付近から音声出力を再開する
    ことを特徴とする情報処理装置。
  12. 表示画面に表示させた文字列に対応する音声を出力する情報処理装置が行う情報処理方法であって、
    前記情報処理装置の表示制御手段が、複数ページからなるドキュメントにおいて指定されたページを前記表示画面に表示させる表示制御工程と、
    前記情報処理装置の音声出力手段が、前記表示画面に表示されているページ中の各文字に対応する音声を、該文字の並び順に従って順次出力する音声出力工程と、
    前記情報処理装置の検知手段が、前記表示画面に表示させるページを変更する指示の入力を検知する検知工程と
    を備え、
    前記音声出力工程では、
    前記表示画面に表示されている表示ページについて音声を出力している期間中に前記検知工程で複数の指示を検知した結果、前記表示画面に前記表示ページが表示された場合、前記複数の指示のうち最初の指示を検知した時点で前記音声出力工程で出力されていた文字付近から音声出力を再開する
    ことを特徴とする情報処理方法。
  13. コンピュータを、請求項11に記載の情報処理装置の各手段として機能させるためのコンピュータプログラム。
  14. コンピュータを請求項11に記載の情報処理装置の各手段として機能させるためのコンピュータプログラム、を格納したコンピュータ読み取り可能な記憶媒体。
JP2011240661A 2011-11-01 2011-11-01 情報処理装置、情報処理方法 Expired - Fee Related JP5941264B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2011240661A JP5941264B2 (ja) 2011-11-01 2011-11-01 情報処理装置、情報処理方法
US13/648,857 US9141334B2 (en) 2011-11-01 2012-10-10 Information processing for outputting voice

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011240661A JP5941264B2 (ja) 2011-11-01 2011-11-01 情報処理装置、情報処理方法

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2016101935A Division JP6100423B2 (ja) 2016-05-20 2016-05-20 情報処理装置、情報処理方法

Publications (3)

Publication Number Publication Date
JP2013097627A JP2013097627A (ja) 2013-05-20
JP2013097627A5 JP2013097627A5 (ja) 2014-12-18
JP5941264B2 true JP5941264B2 (ja) 2016-06-29

Family

ID=48173292

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011240661A Expired - Fee Related JP5941264B2 (ja) 2011-11-01 2011-11-01 情報処理装置、情報処理方法

Country Status (2)

Country Link
US (1) US9141334B2 (ja)
JP (1) JP5941264B2 (ja)

Family Cites Families (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6292025A (ja) * 1985-10-18 1987-04-27 Canon Inc 電子機器
JPH05313565A (ja) 1992-05-06 1993-11-26 Sharp Corp 音声読書機
JPH05314732A (ja) * 1992-05-11 1993-11-26 Casio Comput Co Ltd 携帯型表示装置
US8073695B1 (en) * 1992-12-09 2011-12-06 Adrea, LLC Electronic book with voice emulation features
US5631883A (en) * 1992-12-22 1997-05-20 Li; Yi-Yang Combination of book with audio device
JP3433532B2 (ja) * 1994-09-30 2003-08-04 日本ビクター株式会社 電子ブック装置
JPH0973461A (ja) * 1995-09-06 1997-03-18 Shinano Kenshi Co Ltd 音声による文章情報再生装置
WO1999022314A1 (fr) * 1997-10-29 1999-05-06 Sharp Kabushiki Kaisha Dispositif de commande d'affichage et dispositif de reproduction d'affichage pour livres electroniques
US7107533B2 (en) * 2001-04-09 2006-09-12 International Business Machines Corporation Electronic book with multimode I/O
US7020663B2 (en) * 2001-05-30 2006-03-28 George M. Hay System and method for the delivery of electronic books
US20030033147A1 (en) * 2001-06-08 2003-02-13 Recording For The Blind & Dyslexic Incorporated Method and apparatus for coordinating text and audio events in a digital talking book
US7158936B2 (en) * 2001-11-01 2007-01-02 Comverse, Inc. Method and system for providing a voice application bookmark
JP2003316565A (ja) * 2002-04-25 2003-11-07 Canon Inc 読み上げ装置およびその制御方法ならびにプログラム
US7224934B2 (en) * 2002-03-05 2007-05-29 Jeffrey D Mullen Talking book employing photoelectronics for autonomous page recognition
JP3841011B2 (ja) * 2002-04-12 2006-11-01 ブラザー工業株式会社 文章読み上げ装置、文章読み上げ方法、及びプログラム
JP2005189906A (ja) * 2003-12-24 2005-07-14 Fuji Photo Film Co Ltd 電子ブック
JP2006053739A (ja) * 2004-08-11 2006-02-23 Alpine Electronics Inc 電子書籍読み上げ装置
US9319720B2 (en) * 2005-12-13 2016-04-19 Audio Pod Inc. System and method for rendering digital content using time offsets
US20070280438A1 (en) * 2006-05-17 2007-12-06 Recording For The Blind & Dyslexic, Incorporated Method and apparatus for converting a daisy format file into a digital streaming media file
US7861186B2 (en) * 2006-05-17 2010-12-28 Palo Alto Research Center Incorporated Systems and methods for navigating page-oriented information assets
JP5062669B2 (ja) * 2007-06-26 2012-10-31 京セラ株式会社 電子機器及びその制御方法
US8477095B2 (en) * 2007-10-05 2013-07-02 Leapfrog Enterprises, Inc. Audio book for pen-based computer
JP5816085B2 (ja) * 2008-07-04 2015-11-17 ブックトラック ホールディングス リミテッド サウンドトラックを作成してプレイする方法及びシステム
US20100042702A1 (en) * 2008-08-13 2010-02-18 Hanses Philip C Bookmarks for Flexible Integrated Access to Published Material
US20100225809A1 (en) * 2009-03-09 2010-09-09 Sony Corporation And Sony Electronics Inc. Electronic book with enhanced features
GB2475221B (en) * 2009-09-04 2013-08-21 Hm Technology Internat Ltd A book
US20120001923A1 (en) * 2010-07-03 2012-01-05 Sara Weinzimmer Sound-enhanced ebook with sound events triggered by reader progress
US9678572B2 (en) * 2010-10-01 2017-06-13 Samsung Electronics Co., Ltd. Apparatus and method for turning e-book pages in portable terminal
GB2490866A (en) * 2011-05-09 2012-11-21 Nds Ltd Method for secondary content distribution
US10672399B2 (en) * 2011-06-03 2020-06-02 Apple Inc. Switching between text data and audio data based on a mapping

Also Published As

Publication number Publication date
US9141334B2 (en) 2015-09-22
JP2013097627A (ja) 2013-05-20
US20130110514A1 (en) 2013-05-02

Similar Documents

Publication Publication Date Title
KR101393816B1 (ko) 음성 입력의 프로세싱
JP5963584B2 (ja) 電子機器及びその制御方法
KR101032634B1 (ko) 미디어 파일 재생 방법 및 장치
CN104239392A (zh) 与显示内容关联地记录音频
KR20190000882A (ko) 동영상을 처리하는 컴퓨팅 장치, 방법 및 컴퓨터 프로그램
CN110265067B (zh) 录制热门片段方法、装置、电子设备及可读介质
WO2017076304A1 (zh) 音频数据处理方法和装置
JP6417104B2 (ja) テキスト編集装置、テキスト編集方法、及びプログラム
EP2073540A1 (en) Image processing program, image processing device and image processing method
US20180005618A1 (en) Information processing method, terminal device and computer storage medium
WO2017121304A1 (zh) 音频数据处理方法和终端
JP6100423B2 (ja) 情報処理装置、情報処理方法
JP5941264B2 (ja) 情報処理装置、情報処理方法
JP5145613B2 (ja) コンテンツ情報表示装置およびそのプログラム
JP6039990B2 (ja) 情報処理装置及びその制御方法
US9817633B2 (en) Information processing apparatus and information processing method
JP2021090118A5 (ja)
JP2008160697A (ja) データ登録装置
JP5304912B2 (ja) 画像記録装置及びプログラム
JP2013228624A (ja) 音声処理装置、音声処理方法
KR101301279B1 (ko) 멀티미디어 파일 재생장치와 멀티미디어 파일 처리 방법
WO2012153709A1 (ja) 再生装置、再生方法及び再生プログラム
JP2015095027A (ja) コンテンツ再生装置、コンテンツ再生方法、および、コンテンツ再生プログラム
JP2013174880A (ja) 情報出力装置、情報を出力する方法、およびプログラム
JP5023829B2 (ja) 画像記録装置及びプログラム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20141104

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20141104

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150831

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150924

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20151124

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160422

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160520

R151 Written notification of patent or utility model registration

Ref document number: 5941264

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

LAPS Cancellation because of no payment of annual fees