JP2016192211A

JP2016192211A - 情報処理装置、情報処理方法

Info

Publication number: JP2016192211A
Application number: JP2016101935A
Authority: JP
Inventors: 友範田中; Tomonori Tanaka; 奥谷　泰夫; Yasuo Okuya; 泰夫奥谷
Original assignee: Canon Inc
Current assignee: Canon Inc
Priority date: 2016-05-20
Filing date: 2016-05-20
Publication date: 2016-11-10
Anticipated expiration: 2031-11-01
Also published as: JP6100423B2

Abstract

【課題】ページ遷移後の音声出力再開位置を、ユーザの意図に合わせて自動で特定する為の技術を提供すること。
【解決手段】電子書籍を構成する各ページのうちページ指定指示によって指定されたページを表示する。音声出力指示が入力されると、該入力の時点で表示しているページを音声出力ページとし、該音声出力ページ中の各文字に対応する音声を、該文字の並び順に従って順次出力する。音声出力を開始する先頭文字を、音声出力ページ中の文字に基づいて決定し、先頭文字以降の文字に対応する音声を、並び順に従って順次出力させる。
【選択図】図２

Description

本発明は、電子書籍の表示及び音声出力を行う為の技術に関するものである。

従来から、ページ情報を有する電子書籍コンテンツを音声出力させる技術が知られている。また、電子書籍コンテンツをページ遷移させると、予め決められた位置（例えば、ページの先頭の文章）から音声出力を行う技術がある（特許文献１）。

特開平５―３１３５６５号公報

しかしながら、ページ遷移後のページに応じて、ユーザの所望する音声出力位置は異なる。本発明は、このような問題に鑑みてなされたものであり、ページ遷移後の音声出力再開位置を、ユーザの意図に合わせて自動で特定する為の技術を提供することを目的とする。

本発明の目的を達成するために、例えば、本発明の情報処理装置は、電子書籍を構成する各ページのうちページ指定指示によって指定されたページを表示する表示手段と、音声出力指示が入力されると、該入力の時点で前記表示手段が表示しているページを音声出力ページとし、該音声出力ページ中の各文字に対応する音声を、該文字の並び順に従って順次出力する音声出力手段と、前記音声出力手段が音声出力を開始する先頭文字を、前記音声出力ページ中の文字に基づいて決定し、前記音声出力手段に、前記先頭文字以降の文字に対応する音声を、前記並び順に従って順次出力させる制御手段とを備えることを特徴とする。

本発明の構成によれば、ページ遷移後のページに応じて、音声出力再開位置を、ユーザの意図に合わせて自動で特定することが可能となる。

情報処理装置の外観例を示す図。情報処理装置１０１の機能構成例を示すブロック図。コンピュータのハードウェア構成例を示すブロック図。情報処理装置１０１が行う処理のフローチャート。情報処理装置１０１が行う処理のフローチャート。情報処理装置１０１が行う処理のフローチャート。情報処理装置１０１が行う処理のフローチャート。ステップＳ２２０６における処理のフローチャート。ステップＳ２２０６における処理のフローチャート。ステップＳ２２０６における処理のフローチャート。ステップＳ２２０５における処理のフローチャート。ステップＳ２２０５における処理のフローチャート。ステップＳ２２０６における処理のフローチャート。ステップＳ１３０２における処理のフローチャート。情報処理装置２３００の動作のフローチャート。タッチパネル画面１０２の表示例を示す図。音声出力位置記憶部２０８に登録される音声出力位置の構成例を示す図。時間特定部２０４が管理する情報の構成例を示す図。時間特定部２０４が管理する情報の構成例を示す図。ステップＳ２４０１における処理のフローチャート。ステップＳ２４０１における処理のフローチャート。情報処理装置１０１が行う処理のフローチャート。情報処理装置２３００の外観例を示す図。情報処理装置１０１が行う処理のフローチャート。タッチパネル画面１０２の表示例を示す図。タッチパネル画面１０２の表示例を示す図。ステップＳ２４０１における処理のフローチャート。タッチパネル画面１０２の表示例を示す図。情報処理装置２３００の機能構成例を示すブロック図。

以下、添付図面を参照し、本発明の好適な実施形態について説明する。なお、以下説明する実施形態は、本発明を具体的に実施した場合の一例を示すもので、特許請求の範囲に記載の構成の具体的な実施例の１つである。

［第１の実施形態］
先ず、本実施形態に係る情報処理装置の外観例について、図１を用いて説明する。図１に示した情報処理装置１０１には、タッチパネル画面１０２、スピーカ１０３、音声出力ボタン１０４が備わっている。なお、情報処理装置１０１の外観は、図１に示した外観に限るものではなく、様々な外観が適用可能であり、例えば、タッチパネル画面１０２、スピーカ１０３、音声出力ボタン１０４のそれぞれの配置は、図１に示した配置に限るものではない。また、ボタンやスピーカなどはその用途に応じて適宜増減させても良い。

タッチパネル画面１０２は、画像や文字などを表示するための表示画面として機能すると共に、ユーザの指などの指示具によるタッチ操作を検出する、いわゆるタッチパネルとしても機能する。

また、ユーザは、自身の指などでもって音声出力ボタン１０４を押下することで、音声出力指示を情報処理装置１０１に入力することができる。情報処理装置１０１はこの音声出力指示を検知すると、スピーカ１０３から音声（例えば、２２．０５ＫＨｚでサンプリングされたＰＣＭ方式のＷＡＶＥデータに基づく音声）を出力する。

本実施形態では、電子書籍のデータ（電子書籍コンテンツ、電子テキストコンテンツ）、該電子書籍を朗読した音声波形のデータ（音声波形データ）、は、予め情報処理装置１０１内にダウンロードされているものとする。しかし、これに限るものではなく、これらのデータを外部の装置に格納しておき、必要に応じて適宜ダウンロードするようにしても良い。

本実施形態における電子書籍は、W3CのXMLに準拠したマークアップ言語であるSMIL (Synchronized Multimedia Integration Language)により記述されているものとする。電子書籍中の各ページにおける各文字と、音声波形データにおいて該文字を発声している音声波形の位置（音声出力位置）と、は関連づけられている（同期がとられている）。即ち、音声波形データにおいて、電子書籍における任意のページ中の任意の文字の音声波形のデータは、一意に特定することができるようになっている。また、例えば、ＳＭＩＬの記述情報から、ページ番号、行数、行の先頭（後端）からの文字数等の情報も取得できるものとする。また、ページ番号、行数、行の先頭（後端）からの文字数等の情報を、ＳＭＩＬの記述情報と照会することにより、音声波形データ上の音声出力位置および音声出力位置が属する文章を特定できるものとする。ＳＭＩＬの技術については公知なのでこれに係る説明は省略する。

次に、本実施形態に係る情報処理装置１０１の機能構成例について、図２のブロック図を用いて説明する。なお、図２に示した構成は一例であり、下記の各部のうちいくつかを統合しても良いし、以下に説明する各処理を実現可能な構成であれば、如何なる構成を採用しても良い。

入力部２０１は、タッチパネル画面１０２に対するタッチ操作を検出したり、音声出力ボタン１０４の押下を検出したりする。例えば、入力部２０１は、タッチパネル画面１０２に対する右方向（左方向）へのユーザのフリック操作を特定する。ページ記憶部２１０は、過去に音声出力を行ったページの番号を記憶する。

ページ遷移部２０７は、入力部２０１が検出したフリック操作に基づき、タッチパネル画面１０２に表示するページ（遷移先のページ）の特定を行う。例えば、入力部２０１が右方向のフリック操作（ページ指定指示）を検知すると、現在タッチパネル画面１０２に表示しているページの次のページ（ページ指定指示により指定されたページ）をタッチパネル画面１０２への表示対象として特定する。例えば、現在タッチパネル画面１０２に５ページ目のページが表示されており、入力部２０１が右方向のフリック操作を検知したとすると、ページ遷移部２０７は、６ページ目のページをタッチパネル画面１０２への表示対象として特定する。また例えば、入力部２０１が左方向のフリック操作を検知すると、現在タッチパネル画面１０２に表示しているページの前のページをタッチパネル画面１０２への表示対象として特定する。例えば、現在タッチパネル画面１０２に５ページ目のページが表示されており、入力部２０１が左方向のフリック操作を検知したとすると、ページ遷移部２０７は、４ページ目のページをタッチパネル画面１０２への表示対象として特定する。そしてページ遷移部２０７は、上記の電子書籍コンテンツの各ページのうち特定したページの映像信号を表示部２０２に供給する。

表示部２０２は、ページ遷移部２０７から供給された映像信号に基づく映像（即ちページの画面）の信号を、該タッチパネル画面１０２に対して供給するものである。本実施形態では、電子書籍における各ページのうち、ページ遷移部２０７によって特定されたページの映像信号をタッチパネル画面１０２に供給する。

時間特定部（計時部）２０４は、入力部２０１がフリック操作を検知したことに応じてタイマを０にリセットして計時を開始するものである。そして、時間特定部２０４は、タイマの値が規定値に達した時点でタッチパネル画面１０２に表示されているページを、遷移後ページとして特定する。ページ判断部２０９は、最後に音声出力を行ったページの番号と、遷移後ページの番号と、を比較する。

音声出力位置制御部２０５は、音声出力ボタン１０４が押下されたときに、ページ中のどの文字から音声出力を行うのか（どの音声出力位置から音声出力を行うのか）を、ページ判断部２０９による比較結果等に応じて決定する。

音声出力位置記憶部２０８は、SMILの記述情報と照会し、最後に音声を出力した文字である最後文字を特定する為の情報（ページ番号、行数、行の先頭からの文字数の情報）を音声出力位置として記憶する。例えば、５ページにある３行目の２文字目に音声出力位置においては、ページ番号が５、行数が３、行の先頭からの文字数が２となる。

音声出力部２０３は、音声出力位置制御部２０５が決定した音声出力位置からの音声波形データに基づく音声信号を、スピーカ１０３に供給する。

次に、本実施形態に係る情報処理装置１０１が行う音声出力処理について、同処理のフローチャートを示す図４を用いて説明する。なお、以下の説明では、タッチパネル画面１０２には、電子書籍コンテンツにおいてＮ（Ｎ≧１）ページ目のページ（ページＮと呼称する）が表示されており、且つこのＮページ目のページについてはまだ音声出力を行っていないものとする。そしてこの状態においてユーザが音声出力ボタン１０４を押下すると、ステップＳ４０１以降の処理が開始されることになる。

ステップＳ４０１において、入力部２０１が音声出力ボタン１０４の押下を検知すると、音声出力位置制御部２０５は、音声出力開始位置をページＮの先頭文字の位置とする。これにより音声出力部２０３は、ページＮの先頭文字以降の各文字について、該文字の音声波形データから音声信号を生成してスピーカ１０３に供給する。即ち本ステップでは、音声出力ボタン１０４の押下により音声出力指示が入力されると、該入力の時点でタッチパネル画面１０２が表示しているページＮを音声出力ページとし、該音声出力ページ中の各文字に対応する音声を該文字の並び順に従って順次出力する。ステップＳ４０２では、ページ記憶部２１０は、音声出力中のページの番号であるＮを記憶する。

ステップＳ４０３で音声出力位置記憶部２０８は、ページＮにおいて、最後に音声を出力した文字である最後文字を特定する為の情報を記憶する。即ち、本ステップでは、音声出力ページにおいて音声出力部２０３が最後に音声を出力した文字である最後文字を特定するための情報をメモリ（音声出力位置記憶部２０８）内で管理する。

そして、入力部２０１が左若しくは右のフリック操作（ページＮとは異なるページをタッチパネル画面１０２の表示対象として指定する操作入力）を検知した場合には、処理はステップＳ４０４を介してステップＳ４０５に進む。なお、本実施形態ではページ遷移部２０７は、ページＮの最後の文字について音声出力が行われたことを検知すると、ページ（Ｎ＋１）をタッチパネル画面１０２への表示対象として特定するので、この場合はステップＳ４０４を介してステップＳ４０５に進む。

処理がステップＳ４０５に進んだ場合、図４では示していないが、ページ遷移部２０７は、入力部２０１が右方向のフリック操作を検知すると、ページ（Ｎ＋１）をタッチパネル画面１０２への表示対象（ページの遷移先）として特定する。一方、ページ遷移部２０７は、入力部２０１が左方向のフリック操作を検知すると、ページ（Ｎ−１）をタッチパネル画面１０２への表示対象（ページの遷移先）として特定する。そしてページ遷移部２０７は、上記の電子書籍コンテンツの各ページのうち特定したページの映像信号を表示部２０２に供給する。

一方、入力部２０１が左若しくは右のフリック操作を検知していない場合は、処理はステップＳ４０４を介してステップＳ４０１に戻り、次の文字について以降の処理を行う。

このように、入力部２０１がフリック操作を検知しない限りは、ページＮ中の各文字を順次、音声出力する。そして、ステップＳ４０１で音声出力を行う音声出力位置が１文字進むたびに、最後文字もこれに従って１文字進むことになる。

Ｎ＝５の場合に、最初のステップＳ４０３で音声出力位置記憶部２０８に登録される情報の構成例を図１７（ａ）に示す。上記のとおり、ページ５についてはまだ音声出力は行っていないので、音声出力位置記憶部２０８には、ページ番号「５」、ページ５の先頭文字の位置（行数「１」、行の先頭の文字からの文字数「１」）、が音声出力位置として登録される。そしてその後、音声出力位置が進み、ページ５において４行目の先頭から４文字目の文字について音声出力を行うと、最後文字の位置は「ページ５、４行目、先頭から４文字目）となる。然るに、音声出力位置記憶部２０８中の音声出力位置は、図１７（ｂ）に示す如く、ページ番号「５」、行数「４」、行の先頭の文字からの文字数「４」、に更新される。

タッチパネル画面１０２におけるページＮの表示例を図１６に示す。このとき、音声出力部２０３が、この音声出力位置記憶部２０８内の情報をＳＭＩLの記述情報と照会し、「今年の電子書籍コンテンツの増加率は目覚ましいものがありました」の先頭から音声波形データを音声出力することになる。

ステップＳ４０５では、音声出力部２０３は、音声出力を停止する。そしてステップＳ４０６では、時間特定部２０４は、タイマの値Ｚ（ページ滞在時間Ｚ：単位はmsec）を０にリセットしてから計時を開始する。計時は、ページの遷移開始と共に開始しても良いし、次のページへの遷移が完了してから開始しても良い。

ステップＳ４０７では、時間特定部２０４は、タイマの値Ｚが規定値に達したか否かを判断する。この判断の結果、タイマの値Ｚが規定値（例えば、２０００msecとする）に達した場合には、処理はステップＳ４１１に進み、規定値に達していない場合は、処理はステップＳ４０８に進む。ステップＳ４０８〜Ｓ４１０の処理はそれぞれ、ステップＳ４０４〜Ｓ４０６と同じである。

ステップＳ４０８に処理が進んだ時点で、入力部２０１が左若しくは右のフリック操作を検知した場合、若しくはページ遷移部２０７が、遷移先のページにおける最後の文字について音声出力が行われたことを検知した場合は、処理はステップＳ４０９に進む。処理がステップＳ４０９に進んだ場合でも、ページ遷移部２０７は、タッチパネル画面１０２への表示対象ページを特定し、特定したページの映像信号を表示部２０２に供給する。

ステップＳ４０９では、音声出力部２０３は、音声出力を停止する。ただし、この時点で音声出力が停止されている場合は、この処理は実行されない。

そしてステップＳ４１０では、時間特定部２０４は、タイマの値Ｚ（ページ滞在時間Ｚ：単位はmsec）を０にリセットしてから計時を開始する。そして処理はステップＳ４０８に進む。

ステップＳ４０８に処理が進んだ時点で、入力部２０１が何れのフリック操作も検知していない場合、若しくはページ遷移部２０７が、遷移先のページにおける最後の文字について音声出力が行われたことを検知していない場合、処理はステップＳ４０７に進む。

ステップＳ４１１では、時間特定部２０４は、処理がステップＳ４１１に進んだ時点でタッチパネル画面１０２に表示されているページ（この時点でページ遷移部２０７が特定しているページ）を遷移後ページとして特定する。すなわち、上記のように、音声出力ページ中の各文字に対応する音声の出力中にページ指定指示が入力されると、音声の出力を停止し、該入力されたページ指定指示によって指定されたページがタッチパネル画面１０２で表示される連続時間を計時する。また、該停止後にページ指定指示が入力されると、該ページ指定指示によって指定されたページがタッチパネル画面１０２で表示される連続時間を計時する。そして、この計時した連続時間が規定時間以上となったページが上記の遷移後ページとなる。

そして時間特定部２０４は、この遷移後ページのページ番号を変数Ｉに代入する。また、時間特定部２０４は、図１８に例示するように、タッチパネル画面１０２に表示されたページごとに、該ページの表示期間中に計時したタイマの値Ｚを管理している。

ステップＳ４１２では、ページ判断部２０９は、Ｉ＝Ｎであるか否かを判断する。この判断の結果、Ｉ＝Ｎである場合、即ち、遷移後ページがページＮである場合、処理はステップＳ４１３に進む。一方、Ｉ≠Ｎである場合は、処理はステップＳ４１４に進む。

ステップＳ４１３では、音声出力位置制御部２０５は、音声出力位置記憶部２０８に格納されている音声出力位置を参照して、ページＮにおける最後文字（の位置）を特定する。そして音声出力部２０３は、ページＮ中の文字の並び順において最後文字の次の文字以降に並んでいる文字の音声波形データに基づく音声信号を、スピーカ１０３に供給する。

例えば、タッチパネル画面１０２に図１６に示すページが表示されており、音声出力位置記憶部２０８に図１７（ｂ）に示した音声出力位置が格納されているとする。この場合、ステップＳ４１３では、「来年以降も、電子書籍コンテンツはますます増えていくと予想されます。」の文章の「電子書籍…」から音声出力を行う。なお、ステップＳ４０４でページ遷移部２０７が、ページＮの最後の文字について音声出力が行われたことを検知すると、音声出力部２０３は、ページＮ中の先頭文字以降に並んでいる文字の音声波形データに基づく音声信号を、スピーカ１０３に供給する。

一方、ステップＳ４１４では、ページ判断部２０９は、Ｉ＞Ｎであるか否かを判断する。この判断の結果、Ｉ＞Ｎ、即ち、遷移後ページがページＮよりもページ番号が大きい後続ページであるとする。この場合、処理はステップＳ４１５に進む。一方、Ｉ≦Ｎの場合は、処理はステップＳ４１６に進む。

ステップＳ４１５では、音声出力位置制御部２０５は、音声出力開始位置をページＩの先頭文字の位置とする。これにより音声出力部２０３は、ページＩの先頭文字以降の各文字について、該文字の音声波形データから音声信号を生成してスピーカ１０３に供給する。

一方、ステップＳ４１６では、時間特定部２０４は、タイマの値Ｚが規定値（例えば、６０００msecとする）に達しているか否かを判断する。この判断の結果、達している場合は、本処理は終了し、達していない場合は、処理はステップＳ４０８に進む。

即ち、ステップＳ４０１からステップＳ４１６の処理により、遷移後ページに応じて音声出力開始位置を自動で特定することが可能となる。ページ遷移後、音声出力させていた元のページに戻ってきた場合は、ページ遷移を開始した時の音声出力位置が音声出力再開位置となる。ページ遷移後、音声出力させていた元のページよりも後ろにページ遷移した場合は、ページの先頭から音声出力させる。ページ遷移後、音声出力させていた元のページよりも前にページ遷移した場合は、音声出力が停止される。

なお、図４に示した処理の代わりに、図５に示した処理の如く、ステップＳ４０５における処理をステップＳ４１１の直前に行うようにしても良い。また、図４に示した処理の代わりに、図６に示した処理の如く、ステップＳ４０２，Ｓ４０３の処理を、ステップＳ４０４の直後に行うようにしても良い。図６の処理では、ページ番号と音声出力位置の記憶は、ページ遷移確定後の１回になり、処理コストを削減することが可能となる。

また、図４に示した処理の代わりに、図７に示した処理の如く、ステップＳ４０２，Ｓ４０３の処理をステップＳ４０４の直後に行い、ステップＳ４０５における処理をステップＳ４１１の直前に行うようにしても良い。図７の処理では、ページ番号と音声出力位置の記憶は、ページ遷移確定後の１回になり、処理コストを削減することが可能となる。

このように、本実施形態の変形例はいくつか考えることができるが、これらの変形例は、以下の構成を満たしている。即ち、音声出力ページについて音声を出力している期間内でページ指定指示が入力されるたびに、該入力されたページ指定指示によって指定されたページがタッチパネル画面１０２で表示された連続時間を計時する。そして、この計時した連続時間が規定時間以上となったページが音声出力ページである場合、この期間内で最初にページ指定指示が入力された時点で音声を出力していた文字を最後文字とする。そして、該最後文字の次の文字以降の各文字に対応する音声を、該文字の並び順に従って順次出力する。

なお、上記で説明した音声出力処理、即ち、ページ遷移後、音声出力させていた元のページよりも前にページ遷移した場合、音声出力が停止される本実施形態を、第１の音声出力モードとする。

本実施形態では、タッチ操作によりページ遷移を行っているが、ボタン押下等によりページ遷移を行ってもよい。また、音声出力ボタン１０４の押下を認識するとページの先頭の文章から音声出力を開始しているが、タッチ操作等でページ上の任意の位置を指定して、指定された文章から音声出力を開始させてもよい。また、電子書籍コンテンツを朗読した音声波形データを音声出力しているが、電子書籍コンテンツを音声合成の技術により音声出力してもよい。

ただし、音声合成の技術を用いる場合、ステップＳ４１３において、音声出力位置制御部２０５は、最後文字の次の付近の文字以降に並んでいる文字の音声波形データに基づく音声信号を、スピーカ１０３に供給する。例えば、「来年以降も、電子書籍コンテンツはますます増えていくと予想されます。」の文章の「電」が最後文字になったとする。音声合成技術を用いた場合、「ししょせき」と読み上げられずに、「こしょせき」のように誤った読みになる場合がある。よって、最後文字の付近の文字にある、文章の先頭や文章中の区切りの良い文字から、音声合成により音声出力される。例えば、文章の先頭の「来年・・・」、もしくは、文章中の「電子・・・」や「ますます・・・」から音声出力される。音声合成技術については、公知なのでここでは省略する。

［第２の実施形態］
第１の実施形態では上記の通り、ページ遷移後、音声出力させていた元のページよりも前にページ遷移した場合は、音声出力が停止される第１の音声出力モードについて説明した。第２の実施形態においては、元のページの音声出力位置における文章に関連した文章を音声出力させる第２の音声出力モードについて説明する。

なお、本実施形態でも、第１の実施形態で使用した情報処理装置１０１を使用するものとする。以下では、第１の実施形態と異なる点について説明し、特に触れない限りは、第１の実施形態を適宜用いることとする。

本実施形態に係る情報処理装置１０１が行う音声出力処理について、同処理のフローチャートを示す図２４を用いて説明する。なお、以下の説明では、タッチパネル画面１０２には、電子書籍コンテンツにおいてＮ（Ｎ≧１）ページ目のページ（ページＮと呼称する）が表示されており、且つこのＮページ目のページについてはまだ音声出力を行っていないものとする。そしてこの状態においてユーザが音声出力ボタン１０４を押下すると、ステップＳ４０１以降の処理が開始されることになる。図２４に示したフローチャートは、ステップＳ４１４でＩ≦Ｎと判断された場合に、処理がステップＳ２４０１に進み、ステップＳ２４０１の後、処理がステップＳ４１６に進む点が図４と異なる。

ステップＳ２４０１では、音声出力位置制御部２０５は、音声出力位置記憶部２０８に格納されている音声出力位置における文字が属する文章と関連する文章を特定する。そして音声出力部２０３は、この特定された文章を構成する各文字の音声波形データに基づく音声信号をスピーカ１０３に対して供給する。

元のページよりも前にページ遷移した場合は、元のページの文章の意味などの確認の場合が多い。従って、元のページの音声出力位置に関連した文章を音声出力させることで、ユーザが所望する音声出力位置から音声出力することが可能となる。

ステップＳ２４０１における処理の詳細について、図２０のフローチャートを用いて説明する。ステップＳ２００１では、音声出力位置制御部２０５は、ＳＭＩＬの記述情報と照合することにより、音声出力位置記憶部２０８に格納されている音声出力位置から、最後文字が属する文章を特定する。例えば、図１６より、「来年以降も、電子書籍コンテンツはますます増えていくと予想されます。」の文章が特定される。

ステップＳ２００２では、音声出力位置制御部２０５は、ステップＳ２００１で特定した文章中の名詞を特定する。名詞の特定には、形態素解析といった周知の技術を用いる。この形態素解析については周知の技術であるため、これについての説明は省略する。「来年以降も、電子書籍コンテンツはますます増えていくと予想されます。」の文章からは、「来年以降」と「電子書籍コンテンツ」が特定される。

ステップＳ２００３では、音声出力位置制御部２０５は、遷移後ページ内（先ページ内）に、ステップＳ２００２で特定した名詞が含まれているか否かを判断する。この判断においても、上記の形態素解析を用いる。この判断の結果、含まれている場合は、処理はステップＳ２００４に進み、含まれていない場合は、処理はステップＳ２００５に進む。

ステップＳ２００５では、音声出力位置制御部２０５は、音声出力開始位置をページＩの先頭文字の位置とする。これにより音声出力部２０３は、ページＩの先頭文字以降の各文字について、該文字の音声波形データから音声信号を生成してスピーカ１０３に供給する。ステップＳ２００４では、音声出力位置制御部２０５は、音声出力開始位置を、ページＩにおいて、ステップＳ２００２で特定した名詞を含む文章の先頭文字の位置とする。これにより音声出力部２０３は、この文章の先頭文字以降の各文字について、該文字の音声波形データから音声信号を生成してスピーカ１０３に供給する。

例えば、タッチパネル画面１０２に図２５に示す画面が遷移後ページとして表示されているとする。この場合、「電子書籍コンテンツ」が「各企業、電子書籍コンテンツにも力を入れ始めています。」の文章に含まれている。然るにこの場合、「電子書籍コンテンツ」が含まれている文章「各企業、電子書籍コンテンツにも力を入れ始めています。」の先頭文字から順に音声出力される。

なお、ステップＳ２４０１では、図２０のフローチャートの処理の代わりに、図２１のフローチャートの処理を行うようにしても良い。図２１において図２０と同じ処理ステップには同じステップ番号を付しており、その説明は省略する。

ステップＳ２１０３では、音声出力位置制御部２０５は、遷移後ページ内の段落のタイトル（タイトル文章）に、ステップＳ２００２で特定した名詞が含まれているか否かを判断する。この判断においても、上記の形態素解析を用いる。この判断の結果、含まれている場合は、処理はステップＳ２１０４に進み、含まれていない場合は、処理はステップＳ２００５に進む。

例えば、タッチパネル画面１０２に図２６に示す画面が表示されている場合、タイトル「今後の電子書籍コンテンツ」に「電子書籍コンテンツ」が含まれている。この場合は、ステップＳ２１０４の処理を行う。タイトルの情報は、SMILの記述情報から取得できる。

ステップＳ２１０４では、音声出力位置制御部２０５は、音声出力開始位置を、ページＩにおいて、ステップＳ２００２で特定した名詞を含むタイトルの先頭文字の位置とする。これにより音声出力部２０３は、このタイトルの先頭文字以降の各文字について、該文字の音声波形データから音声信号を生成してスピーカ１０３に供給する。図２６の場合は、段落のタイトルである「今後の電子書籍コンテンツ」の先頭から音声出力される。

また、ステップＳ２４０１では、図２７のフローチャートの処理を行うようにしても良い。図２７において図２０と同じ処理ステップには同じステップ番号を付しており、その説明は省略する。

ステップＳ２７０１では、音声出力位置制御部２０５は、遷移後ページに強調文章（特定の種別の文章の一例）が含まれているか否かを判断する。この判断の結果、含まれている場合は、処理はステップＳ２７０１に進み、含まれていない場合は、処理はステップＳ２００５に進む。例えば、タッチパネル画面１０２に図２８に示す画面が表示されている場合、同画面中の文章には強調文章である「１章の重要ポイント」が含まれている。この場合は、ステップＳ２７０１の処理を行う。強調文章の情報は、SMILの記述情報から取得できる。

ステップＳ２７０１では、音声出力位置制御部２０５は、音声出力開始位置を、ページＩにおいて、強調文章の先頭文字の位置とする。これにより音声出力部２０３は、この強調文章の先頭文字以降の各文字について、該文字の音声波形データから音声信号を生成してスピーカ１０３に供給する。

［第３の実施形態］
第３の実施形態においては、ページ遷移後のページに加えて、ページ遷移時間に応じて音声出力開始位置を制御する第３の音声出力モードについて説明する。なお、本実施形態でも、第１の実施形態で使用した情報処理装置１０１を使用するものとする。以下では、第１の実施形態と異なる点について説明し、特に触れない限りは、第１の実施形態を適宜用いることとする。

本実施形態に係る情報処理装置１０１が行う音声出力処理について、同処理のフローチャートを示す図２２を用いて説明する。なお、以下の説明では、タッチパネル画面１０２には、電子書籍コンテンツにおいてＮ（Ｎ≧１）ページ目のページ（ページＮと呼称する）が表示されており、且つこのＮページ目のページについてはまだ音声出力を行っていないものとする。そしてこの状態においてユーザが音声出力ボタン１０４を押下すると、ステップＳ４０１以降の処理が開始されることになる。図２２において、図４，２４と同じ処理ステップには同じステップ番号を付しており、その説明は省略する。また、本実施形態では、時間特定部２０４は、図１９に例示するように、タッチパネル画面１０２に表示されたページごとに、該ページの表示期間中に計時したタイマの値Ｚを管理している。

ステップＳ２２０１では、ページ遷移部２０７は、ページの遷移回数を示す変数Ｙを１に初期化する。ステップＳ２２０２では、時間特定部２０４は、ページ遷移の時間（単位はmsec）を計時するためのタイマの値Ｘを０に初期化してから計時を開始する。ステップＳ２２０３では、ページ遷移部２０７は、変数Ｙの値を１つインクリメントする。

即ち、音声出力ページについて音声を出力している期間内で最初にページ指定指示の入力を検知したタイミングから、計時した連続時間が規定時間以上となったタイミングまでのタイミング間でページ指定指示が入力された回数を変数Ｙの値としてカウントする。また、ページＮの表示中に入力部２０１がフリック操作を検知してからの経過時間をタイマの値Ｘとして計時する。

ステップＳ２２０４では、ページ遷移部２０７は、ページ遷移の時間を計時するためのタイマによる計時を停止し、該タイマの値Ｘを取得する。例えば、Ｘ＝5800msecとする。

ステップＳ２２０５では、ページ遷移部２０７は、変数Ｙの値を用いて、所定時間Ｓを求める。変数Ｙの値を用いて所定時間Ｓを求める方法には様々な方法が考えられるが、以下にいくつかの方法を説明する。

ステップＳ２２０６では、音声出力位置制御部２０５は、タイマの値Ｘに応じて、ページＩにおける音声出力開始位置を決定する。これにより音声出力部２０３は、ページＩにおいてこの決定した音声出力開始位置における文字以降の各文字について、該文字の音声波形データから音声信号を生成してスピーカ１０３に供給する。

次に、上記のステップＳ２２０５において行う処理の一例について、図１１のフローチャートを用いて説明する。ステップＳ１１０１では、ページ遷移部２０７は、変数Ｙの値が規定値以上であるか否かを判断する。この判断の結果、規定値以上であれば、処理はステップＳ１１０２に進み、規定値よりも小さい場合は、処理はステップＳ１１０３に進む。

ステップＳ１１０２では、ページ遷移部２０７は、所定時間Ｓとして予め定められた値Ｂ（例えば、８０００msecとする）を設定する。ステップＳ１１０３では、ページ遷移部２０７は、所定時間Ｓとして予め定められた値Ｃ（＜Ｂ）（例えば、３０００msecとする）を設定する。

また、ステップＳ２２０５において行う処理の一例について、図１２のフローチャートを用いて説明する。ステップＳ１２０１では、ページ遷移部２０７は、変数Ｙの値に任意の係数Ｋを乗じた結果を所定時間Ｓに設定する。即ち、変数Ｙの値が大きいほど所定時間Ｓが大きくなるように、この所定時間Ｓを求める。

次に、上記のステップＳ２２０６における処理の詳細について、同処理のフローチャートを示す図８を用いて説明する。

ステップＳ８０１では、音声出力位置制御部２０５は、タイマの値Ｘが所定時間Ｓ（第１の閾値）以下であるか否かを判断する。この判断の結果、タイマの値Ｘが所定時間Ｓ以下である場合は、処理はステップＳ８０２に進み、タイマの値Ｘが所定時間Ｓよりも大きい場合は、処理はステップＳ８０４に進む。

ステップＳ８０２では、音声出力位置制御部２０５は、音声出力位置記憶部２０８に格納されている音声出力位置を参照して、ページＮにおける最後文字（の位置）を特定する。そしてステップＳ８０３では音声出力部２０３は、ページＮ中の文字の並び順において最後文字の次の文字以降に並んでいる文字の音声波形データに基づく音声信号を、スピーカ１０３に供給する。

一方、ステップＳ８０４では、音声出力位置制御部２０５は、タイマの値Ｘが第２の閾値であるＴ（Ｔ＞Ｓを満たし、例えば、Ｔ＝２×Ｓ）以下であるか否か（即ち、Ｓ＜Ｘ≦Ｔであるか否か）を判断する。この判断の結果、Ｓ＜Ｘ≦Ｔであれば、処理はステップＳ８０５に進み、Ｘ＞Ｔである場合は、処理はステップＳ８０６に進む。

ステップＳ８０５では、音声出力位置制御部２０５は、音声出力位置記憶部２０８に格納されている音声出力位置を参照して、ページＮにおける最後文字（の位置）を特定する。そして音声出力位置制御部２０５は、ページＮにおいてこの最後文字が属する段落の先頭の文章を特定する。そしてステップＳ８０３では音声出力部２０３は、ページＮにおいてこの特定した文章中の文字の並び順において先頭文字以降に並んでいる文字の音声波形データに基づく音声信号を、スピーカ１０３に供給する。

ステップＳ８０６では音声出力位置制御部２０５は、ページＮにおける先頭文字を特定する。そしてステップＳ８０３では音声出力部２０３は、ページＮにおける先頭文字以降に並んでいる文字の音声波形データに基づく音声信号を、スピーカ１０３に供給する。

即ち、多少の確認等で、短時間でページを戻した場合は、ページ遷移開始時に中断された音声出力を再開させることが可能となる。また、他のページを熟読してページを戻した場合等のように、長時間でページを戻した場合は、再度ページの先頭から音声出力を再開させることが可能となる。また、いくらかの確認で一定時間経過しページを戻した場合は、ページ遷移開始時に中断された音声出力を段落の先頭から再開させることが可能となる。

なお、上記のステップＳ２２０６では、図９に示すフローチャートに従った処理を行うようにしても良い。ステップＳ９０１では、音声出力位置制御部２０５は、タイマの値Ｘが所定時間Ｓ以下であるか否かを判断する。この判断の結果、タイマの値Ｘが所定時間Ｓ以下である場合は、処理はステップＳ９０２に進み、タイマの値Ｘが所定時間Ｓよりも大きい場合は、処理はステップＳ９０４に進む。

ステップＳ９０２では、音声出力位置制御部２０５は、音声出力位置記憶部２０８に格納されている音声出力位置を参照して、ページＮにおける最後文字（の位置）を特定する。そしてステップＳ９０３では音声出力部２０３は、ページＮ中の文字の並び順において最後文字の次の文字以降に並んでいる文字の音声波形データに基づく音声信号を、スピーカ１０３に供給する。

一方、ステップＳ９０４では、音声出力位置制御部２０５は、ページＮにおける先頭文字を特定する。そしてステップＳ９０３では音声出力部２０３は、ページＮにおける先頭文字以降に並んでいる文字の音声波形データに基づく音声信号を、スピーカ１０３に供給する。

即ち、多少の確認等で、短時間でページを戻した場合は、ページ遷移開始時に中断された音声出力を再開させることが可能となる。また、他のページを熟読してページを戻した場合等のように、長時間でページを戻した場合は、再度ページの先頭から音声出力を再開させることが可能となる。

また、上記のステップＳ２２０６では、図１０に示すフローチャートに従った処理を行うようにしても良い。ステップＳ１００１では、音声出力位置制御部２０５は、タイマの値Ｘが所定時間Ｓ以下であるか否かを判断する。この判断の結果、タイマの値Ｘが所定時間Ｓ以下である場合は、処理はステップＳ１００２に進み、タイマの値Ｘが所定時間Ｓよりも大きい場合は、処理はステップＳ１００４に進む。

ステップＳ１００２では、音声出力位置制御部２０５は、音声出力位置記憶部２０８に格納されている音声出力位置を参照して、ページＮにおける最後文字（の位置）を特定する。そして音声出力位置制御部２０５は、ページＮにおいてこの最後文字が属する段落の先頭の文章を特定する。そしてステップＳ１００３では音声出力部２０３は、ページＮにおいてこの特定した文章中の文字の並び順において先頭文字以降に並んでいる文字の音声波形データに基づく音声信号を、スピーカ１０３に供給する。

一方、ステップＳ１００４では、音声出力位置制御部２０５は、ページＮにおける先頭文字を特定する。そしてステップＳ１００３では音声出力部２０３は、ページＮにおける先頭文字以降に並んでいる文字の音声波形データに基づく音声信号を、スピーカ１０３に供給する。

即ち、他のページを熟読してページを戻した場合等のように、長時間でページを戻した場合は、再度ページの先頭から音声出力を再開させることが可能となる。また、いくらかの確認で一定時間経過しページを戻した場合は、ページ遷移開始時に中断された音声出力を段落の先頭から再開させることが可能となる。

また、上記のステップＳ２２０６では、図１３に示すフローチャートに従った処理を行うようにしても良い。

ステップＳ１３０１では、音声出力位置制御部２０５は、タイマの値Ｘが所定時間Ｓ以下であるか否かを判断する。この判断の結果、タイマの値Ｘが所定時間Ｓ以下である場合は、処理はステップＳ１３０２に進み、タイマの値Ｘが所定時間Ｓよりも大きい場合は、処理はステップＳ１３０６に進む。

ステップＳ１３０２では、音声出力位置制御部２０５は、音声出力位置記憶部２０８に格納されている音声出力位置を参照して、ページＮにおける最後文字（の位置）が、該最後文字が属する文章の前半に位置しているのか否かを判断する。この判断の結果、前半に位置している場合には、処理はステップＳ１３０３に進み、後半に位置している場合には、処理はステップＳ１３０５に進む。ステップＳ１３０２における処理の詳細については、図１４を用いて後述する。

ステップＳ１３０３では、音声出力位置制御部２０５は、音声出力位置記憶部２０８に格納されている音声出力位置を参照して、ページＮにおける最後文字（の位置）を特定する。そして音声出力位置制御部２０５は、ページＮにおいてこの最後文字が属する文章を特定する。そしてステップＳ１３０４では音声出力部２０３は、ページＮにおいてこの特定した文章中の文字の並び順において先頭文字以降に並んでいる文字の音声波形データに基づく音声信号を、スピーカ１０３に供給する。

ステップＳ１３０５では、音声出力位置制御部２０５は、音声出力位置記憶部２０８に格納されている音声出力位置を参照して、ページＮにおける最後文字（の位置）を特定する。そして音声出力位置制御部２０５は、ページＮにおいてこの最後文字が属する文章の次の文章を特定する。そしてステップＳ１３０４では音声出力部２０３は、ページＮにおいてこの特定した文章中の文字の並び順において先頭文字以降に並んでいる文字の音声波形データに基づく音声信号を、スピーカ１０３に供給する。

ステップＳ１３０６では、音声出力位置制御部２０５は、ページＮにおける先頭文字を特定する。そしてステップＳ１３０４では音声出力部２０３は、ページＮにおける先頭文字以降に並んでいる文字の音声波形データに基づく音声信号を、スピーカ１０３に供給する。

即ち、短時間でページを戻し、ページ遷移開始時の音声出力位置が文章の前半であった場合は、その文章の先頭から音声出力を再開させることが可能となる。また、ページ遷移開始時の音声出力位置が文章の後半であった場合は、その文章の次の文章から音声出力を再開させることが可能となる。

次に、上記のステップＳ１３０２における処理について、図１４のフローチャートを用いて説明する。

ステップＳ１４０１では、音声出力位置制御部２０５は、音声出力位置記憶部２０８に格納されている音声出力位置を参照し、ページＮにおける最後文字（の位置）が属する文章を特定する。

ステップＳ１４０２では、音声出力位置制御部２０５は、ステップＳ１４０１で特定した文章の先頭文字から、ページＮにおける最後文字までの文字数Ｘを計数する。ステップＳ１４０３では、音声出力位置制御部２０５は、ステップＳ１４０１で特定した文章の文末文字から、ページＮにおける最後文字までの文字数Ｙを計数する。

ステップＳ１４０４では、音声出力位置制御部２０５は、Ｘ＞Ｙであるか否かを判断する。この判断の結果、Ｘ＞Ｙであれば、処理はステップＳ１４０５に進み、Ｘ≦Ｙであれば、処理はステップＳ１４０６に進む。

ステップＳ１４０５では、音声出力位置制御部２０５は、最後文字は前半に位置していると判断し、ステップＳ１４０６では、音声出力位置制御部２０５は、最後文字は後半に位置していると判断する。

［第４の実施形態］
第１〜３の実施形態ではそれぞれ、第１〜第３の音声出力モードについて説明した。本実施形態では、第１〜第３の音声出力モードを切り替えて使用する。本実施形態に係る情報処理装置２３００の外観例を図２３に示す。図２３において図１に示した構成要件と同じ構成要件については同じ参照番号を付しており、その説明は省略する。

ボタン２３０１〜２３０３はそれぞれ、第１の音声出力モード、第２の音声出力モード、第３の音声出力モード、を指定するために押下するボタンである。なお、第１〜３の音声出力モードを指定するための方法はこれに限るものではない。例えば、１つのボタンを押下するごとにモードを切り替えるようにしても良いし、タッチパネル画面１０２にそれぞれのモードを指定するためのボタン画像を表示するようにしても良い。

本実施形態に係る情報処理装置２３００の機能構成例について、図２９のブロック図を用いて説明する。なお、図２９において、図２に示した構成要件と同じ構成要件については同じ参照番号を付しており、その説明は省略する。

入力部２０１は、音声出力ボタン１０４やタッチパネル画面１０２からの操作入力だけでなく、ボタン２３０１〜２３０３の押下も検知する。モード切替部２９０１は、ボタン２３０１〜２３０３のうち押下されたボタンに応じたモードを設定する。即ち、モード切替部２９０１は、入力部２０１がボタン２３０１が押下されたことを検知すると、第１の音声出力モードを設定する。また、モード切替部２９０１は、入力部２０１がボタン２３０２が押下されたことを検知すると、第２の音声出力モードを設定する。また、モード切替部２９０１は、入力部２０１がボタン２３０３が押下されたことを検知すると、第３の音声出力モードを設定する。

本実施形態に係る情報処理装置２３００の動作について、図１５のフローチャートを用いて説明する。

ステップＳ１５０１では、入力部２０１は、ボタン２３０１〜２３０３の何れが押下されたのかを検知し、モード切替部２９０１は、入力部２０１が押下されたと判断したボタンに応じたモードを設定する。

この設定したモードが第１の音声出力モードであれば、処理はステップＳ１５０２を介してステップＳ１５０３に進む。ステップＳ１５０３では、第１の実施形態で説明した各処理を実行する。

また、この設定したモードが第２の音声出力モードであれば、処理はステップＳ１５０２、Ｓ１５０４を介してステップＳ１５０５に進む。ステップＳ１５０５では、第２の実施形態で説明した各処理を実行する。

また、この設定したモードが第３の音声出力モードであれば、処理はステップＳ１５０２、Ｓ１５０４を介してステップＳ１５０６に進む。ステップＳ１５０６では、第３の実施形態で説明した各処理を実行する。

なお、以上説明した第１〜４の実施形態は、適宜組み合わせて使用することも可能である。なお、組み合わせの際には、適宜構成を省いても良いし、適宜構成を付け加えても良い。

［第５の実施形態］
図１，２９に示した各部は何れもハードウェアで構成しても良いが、例えば、音声出力位置記憶部２０８をメモリで構成し、それ以外の各部をソフトウェア（コンピュータプログラム）で構成しても良い。このような場合に、情報処理装置１０１，２３００に適用可能なコンピュータのハードウェア構成例について、図３のブロック図を用いて説明する。

ＣＰＵ３０１は、ＲＡＭ３０２やＲＯＭ３０３に格納されているコンピュータプログラムやデータを用いて、コンピュータ全体の動作制御を行うと共に、情報処理装置１０１、２３００が行うものとして上述した各処理を実行する。

ＲＡＭ３０２は、ＨＤＤ（ハードディスクドライブ）等の外部メモリ３０８からロードされたコンピュータプログラムやデータを一時的に記憶するためのエリアや、ＣＰＵ３０１が各種の処理を実行する際に用いるワークエリアを有する。即ち、ＲＡＭ３０２は、各種のエリアを適宜提供することができる。ＲＯＭ３０３には、コンピュータの設定データやブートプログラムなどが格納されている。

入力部３０４は、上記の音声出力ボタン１０４や、ボタン２３０１〜２３０３、タッチパネル画面１０２におけるタッチセンサに相当し、上記の通り、各種の指示をＣＰＵ３０１に対して入力することができる。表示部３０５は、上記のタッチパネル画面１０２に相当する。音声出力部３０６は、上記のスピーカ１０３に相当する。

外部メモリ３０８には、ＯＳ（オペレーティングシステム）や、上記の各実施形態で説明した各種の処理をＣＰＵ３０１に実行させるためのコンピュータプログラムやデータが保存されている。このコンピュータプログラムは、図１，２９において音声出力位置記憶部２０８を除く各部に相当するコンピュータプログラムを含む。また、このデータは、電子書籍コンテンツのデータや、上記の処理で既知のものとして説明したデータを含む。

外部メモリ３０８に保存されているコンピュータプログラムやデータは、ＣＰＵ３０１による制御に従って適宜ＲＡＭ３０２にロードされ、ＣＰＵ３０１による処理対象となる。上記の各部は共通のバス３０７に接続されている。なお、上記の音声出力位置記憶部２０８は、外部メモリ３０８やＲＡＭ３０２に相当する。

なお、図１，２９に示した機能構成を有する情報処理装置は、図３に示した構成を有する１台のコンピュータで実装しても良いが、複数台の装置によってこの情報処理装置を構成するようにしても良い。

なお、図１，２９に示した各部を全部ハードウェア／ソフトウェアで構成せずに、一部をハードウェア／ソフトウェアで構成するようにしても良い。この場合であっても、このソフトウェアはメモリに格納し、このソフトウェアは、ＣＰＵ３０１により実行される。

（その他の実施例）
また、本発明は、以下の処理を実行することによっても実現される。即ち、上述した実施形態の機能を実現するソフトウェア（プログラム）を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ（またはＣＰＵやＭＰＵ等）がプログラムを読み出して実行する処理である。

２０１：入力部２１０：ページ記憶部２０７：ページ遷移部２０２：表示部２０４：時間特定部２０９：ページ判断部２０５：音声出力位置制御部２０３：音声出力部２０８：音声出力位置記憶部

本発明の目的を達成するために、例えば、本発明の情報処理装置は、表示画面に表示させた文字列に対応する音声を出力する情報処理装置であって、
複数ページからなるドキュメントにおいて指定されたページを前記表示画面に表示させる表示制御手段と、
前記表示画面に表示されているページ中の各文字に対応する音声を、該文字の並び順に従って順次出力する音声出力手段と、
前記音声出力手段によって最後に音声を出力した文字を特定するための情報を保持する保持手段と、
前記表示画面に表示させるページを変更する指示の入力を検知する検知手段と
を備え、
（ａ）前記表示画面に表示されている注目ページについて音声を出力中に前記検知手段が前記指示の入力を検知したことに応じて、前記音声出力手段は前記注目ページについての音声の出力を停止し、
（ｂ）前記停止中に前記検知手段が前記指示の入力を検知したことに応じて前記表示制御手段が前記表示画面に表示したページが前記注目ページである場合、前記音声出力手段は、前記保持手段が保持している前記注目ページについて最後に音声が出力された文字を特定するための情報に基づき、前記注目ページについて最後に音声が出力された文字の近傍の文字から音声の出力を再開する
ことを特徴とする。

本発明の構成によれば、表示されているページの音声出力が開始された後で画面遷移が生じ、出力される音声が表示されているページの文字に対応しなくなる場合には速やかに音声読み上げを中断し、かつ、遷移後のページに応じて、ユーザの明示的な指示がなくとも音声出力を再開する文字の位置を特定することが可能となる。

Claims

電子書籍を構成する各ページのうちページ指定指示によって指定されたページを表示する表示手段と、
音声出力指示が入力されると、該入力の時点で前記表示手段が表示しているページを音声出力ページとし、該音声出力ページ中の各文字に対応する音声を、該文字の並び順に従って順次出力する音声出力手段と、
前記音声出力手段が音声出力を開始する先頭文字を、前記音声出力ページ中の文字に基づいて決定し、前記音声出力手段に、前記先頭文字以降の文字に対応する音声を、前記並び順に従って順次出力させる制御手段と
を備えることを特徴とする情報処理装置。
更に、
前記音声出力手段が前記音声出力ページについて音声を出力している期間内でページ指定指示が入力されるたびに、該入力されたページ指定指示によって指定されたページが前記表示手段で表示された連続時間を計時する計時手段を備え、
前記制御手段は、
前記計時手段が計時した連続時間が規定時間以上となったページが前記音声出力ページである場合、前記期間内で最初にページ指定指示が入力された時点で前記音声出力手段が音声を出力していた文字を最後文字とし、前記音声出力手段に、前記並び順において該最後文字の次の文字の付近に位置する文字以降の各文字に対応する音声を、前記並び順に従って順次出力させる
ことを特徴とする請求項１に記載の情報処理装置。
前記制御手段は、前記連続時間が規定時間以上となったページが、前記音声出力ページよりもページ番号が大きい後続ページである場合、前記音声出力手段に、前記後続ページにおける先頭文字以降の各文字に対応する音声を、該文字の並び順に従って順次出力させることを特徴とする請求項２に記載の情報処理装置。
前記制御手段は、前記連続時間が規定時間以上となったページが、前記音声出力ページよりもページ番号が小さい先ページである場合、前記音声出力ページ中の最後文字を含む文章から名詞を特定し、該特定した名詞を含む文章を該先ページから特定し、前記音声出力手段に、該特定した文章における先頭文字以降の各文字に対応する音声を、該文字の並び順に従って順次出力させることを特徴とする請求項２又は３に記載の情報処理装置。
前記制御手段は、前記連続時間が規定時間以上となったページが、前記音声出力ページよりもページ番号が小さい先ページである場合、前記音声出力ページ中の最後文字を含む文章から名詞を特定し、該特定した名詞を含むタイトルを該先ページから特定し、前記音声出力手段に、該特定したタイトルにおける先頭文字以降の各文字に対応する音声を、該文字の並び順に従って順次出力させることを特徴とする請求項２又は３に記載の情報処理装置。
前記制御手段は、前記連続時間が規定時間以上となったページが、前記音声出力ページよりもページ番号が小さい先ページである場合、前記音声出力手段に、該先ページ内の特定の種別の文章の先頭文字以降の各文字に対応する音声を、該文字の並び順に従って順次出力させることを特徴とする請求項２又は３に記載の情報処理装置。
前記制御手段は更に、
前記期間内で最初にページ指定指示が入力されたことを検知したタイミングから、前記連続時間が規定時間以上となったタイミングまでのタイミング間の長さを求め、
前記連続時間が規定時間以上となったページが前記音声出力ページであり、且つ前記長さが第１の閾値よりも短い場合は、前記音声出力手段に、前記音声出力ページ中の最後文字の次の文字以降の各文字に対応する音声を、該文字の並び順に従って順次出力させ、
前記連続時間が規定時間以上となったページが前記音声出力ページであり、且つ前記長さが前記第１の閾値よりも長い場合は、前記音声出力手段に、前記音声出力ページにおける先頭文字以降の各文字に対応する音声を、該文字の並び順に従って順次出力させる、若しくは前記音声出力手段に、前記音声出力ページにおいて最後文字を含む段落の文章における先頭文字以降の各文字に対応する音声を、該文字の並び順に従って順次出力させる
ことを特徴とする請求項２乃至６の何れか１項に記載の情報処理装置。
更に、前記タイミング間でページ指定指示が入力された回数を用いて前記第１の閾値を設定する手段を備えることを特徴とする請求項７に記載の情報処理装置。
情報処理装置が行う情報処理方法であって、
前記情報処理装置の表示手段が、電子書籍を構成する各ページのうちページ指定指示によって指定されたページを表示する表示工程と、
前記情報処理装置の音声出力手段が、音声出力指示が入力されると、該入力の時点で前記表示工程で表示しているページを音声出力ページとし、該音声出力ページ中の各文字に対応する音声を、該文字の並び順に従って順次出力する音声出力工程と、
前記情報処理装置の制御手段が、前記音声出力工程で音声出力を開始する先頭文字を、前記音声出力ページ中の文字に基づいて決定し、前記音声出力工程で、前記先頭文字以降の文字に対応する音声を、前記並び順に従って順次出力させる制御工程と
を備えることを特徴とする情報処理方法。
更に、
前記情報処理装置の計時手段が、前記音声出力工程で前記音声出力ページについて音声を出力している期間内でページ指定指示が入力されるたびに、該入力されたページ指定指示によって指定されたページが前記表示工程で表示された連続時間を計時する計時工程を備え、
前記制御工程では、
前記計時工程で計時した連続時間が規定時間以上となったページが前記音声出力ページである場合、前記期間内で最初にページ指定指示が入力された時点で前記音声出力工程で音声を出力していた文字を最後文字とし、前記音声出力工程で、前記並び順において該最後文字の次の文字の付近に位置する文字以降の各文字に対応する音声を、前記並び順に従って順次出力させる
ことを特徴とする請求項９に記載の情報処理方法。
コンピュータを、請求項１乃至８の何れか１項に記載の情報処理装置の各手段として機能させるためのコンピュータプログラム。