JP2016192211A - 情報処理装置、情報処理方法 - Google Patents
情報処理装置、情報処理方法 Download PDFInfo
- Publication number
- JP2016192211A JP2016192211A JP2016101935A JP2016101935A JP2016192211A JP 2016192211 A JP2016192211 A JP 2016192211A JP 2016101935 A JP2016101935 A JP 2016101935A JP 2016101935 A JP2016101935 A JP 2016101935A JP 2016192211 A JP2016192211 A JP 2016192211A
- Authority
- JP
- Japan
- Prior art keywords
- page
- character
- output
- voice
- voice output
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
【課題】 ページ遷移後の音声出力再開位置を、ユーザの意図に合わせて自動で特定する為の技術を提供すること。
【解決手段】 電子書籍を構成する各ページのうちページ指定指示によって指定されたページを表示する。音声出力指示が入力されると、該入力の時点で表示しているページを音声出力ページとし、該音声出力ページ中の各文字に対応する音声を、該文字の並び順に従って順次出力する。音声出力を開始する先頭文字を、音声出力ページ中の文字に基づいて決定し、先頭文字以降の文字に対応する音声を、並び順に従って順次出力させる。
【選択図】図2
【解決手段】 電子書籍を構成する各ページのうちページ指定指示によって指定されたページを表示する。音声出力指示が入力されると、該入力の時点で表示しているページを音声出力ページとし、該音声出力ページ中の各文字に対応する音声を、該文字の並び順に従って順次出力する。音声出力を開始する先頭文字を、音声出力ページ中の文字に基づいて決定し、先頭文字以降の文字に対応する音声を、並び順に従って順次出力させる。
【選択図】図2
Description
本発明は、電子書籍の表示及び音声出力を行う為の技術に関するものである。
従来から、ページ情報を有する電子書籍コンテンツを音声出力させる技術が知られている。また、電子書籍コンテンツをページ遷移させると、予め決められた位置(例えば、ページの先頭の文章)から音声出力を行う技術がある(特許文献1)。
しかしながら、ページ遷移後のページに応じて、ユーザの所望する音声出力位置は異なる。本発明は、このような問題に鑑みてなされたものであり、ページ遷移後の音声出力再開位置を、ユーザの意図に合わせて自動で特定する為の技術を提供することを目的とする。
本発明の目的を達成するために、例えば、本発明の情報処理装置は、電子書籍を構成する各ページのうちページ指定指示によって指定されたページを表示する表示手段と、音声出力指示が入力されると、該入力の時点で前記表示手段が表示しているページを音声出力ページとし、該音声出力ページ中の各文字に対応する音声を、該文字の並び順に従って順次出力する音声出力手段と、前記音声出力手段が音声出力を開始する先頭文字を、前記音声出力ページ中の文字に基づいて決定し、前記音声出力手段に、前記先頭文字以降の文字に対応する音声を、前記並び順に従って順次出力させる制御手段とを備えることを特徴とする。
本発明の構成によれば、ページ遷移後のページに応じて、音声出力再開位置を、ユーザの意図に合わせて自動で特定することが可能となる。
以下、添付図面を参照し、本発明の好適な実施形態について説明する。なお、以下説明する実施形態は、本発明を具体的に実施した場合の一例を示すもので、特許請求の範囲に記載の構成の具体的な実施例の1つである。
[第1の実施形態]
先ず、本実施形態に係る情報処理装置の外観例について、図1を用いて説明する。図1に示した情報処理装置101には、タッチパネル画面102、スピーカ103、音声出力ボタン104が備わっている。なお、情報処理装置101の外観は、図1に示した外観に限るものではなく、様々な外観が適用可能であり、例えば、タッチパネル画面102、スピーカ103、音声出力ボタン104のそれぞれの配置は、図1に示した配置に限るものではない。また、ボタンやスピーカなどはその用途に応じて適宜増減させても良い。
先ず、本実施形態に係る情報処理装置の外観例について、図1を用いて説明する。図1に示した情報処理装置101には、タッチパネル画面102、スピーカ103、音声出力ボタン104が備わっている。なお、情報処理装置101の外観は、図1に示した外観に限るものではなく、様々な外観が適用可能であり、例えば、タッチパネル画面102、スピーカ103、音声出力ボタン104のそれぞれの配置は、図1に示した配置に限るものではない。また、ボタンやスピーカなどはその用途に応じて適宜増減させても良い。
タッチパネル画面102は、画像や文字などを表示するための表示画面として機能すると共に、ユーザの指などの指示具によるタッチ操作を検出する、いわゆるタッチパネルとしても機能する。
また、ユーザは、自身の指などでもって音声出力ボタン104を押下することで、音声出力指示を情報処理装置101に入力することができる。情報処理装置101はこの音声出力指示を検知すると、スピーカ103から音声(例えば、22.05KHzでサンプリングされたPCM方式のWAVEデータに基づく音声)を出力する。
本実施形態では、電子書籍のデータ(電子書籍コンテンツ、電子テキストコンテンツ)、該電子書籍を朗読した音声波形のデータ(音声波形データ)、は、予め情報処理装置101内にダウンロードされているものとする。しかし、これに限るものではなく、これらのデータを外部の装置に格納しておき、必要に応じて適宜ダウンロードするようにしても良い。
本実施形態における電子書籍は、W3CのXMLに準拠したマークアップ言語であるSMIL (Synchronized Multimedia Integration Language)により記述されているものとする。電子書籍中の各ページにおける各文字と、音声波形データにおいて該文字を発声している音声波形の位置(音声出力位置)と、は関連づけられている(同期がとられている)。即ち、音声波形データにおいて、電子書籍における任意のページ中の任意の文字の音声波形のデータは、一意に特定することができるようになっている。また、例えば、SMILの記述情報から、ページ番号、行数、行の先頭(後端)からの文字数等の情報も取得できるものとする。また、ページ番号、行数、行の先頭(後端)からの文字数等の情報を、SMILの記述情報と照会することにより、音声波形データ上の音声出力位置および音声出力位置が属する文章を特定できるものとする。SMILの技術については公知なのでこれに係る説明は省略する。
次に、本実施形態に係る情報処理装置101の機能構成例について、図2のブロック図を用いて説明する。なお、図2に示した構成は一例であり、下記の各部のうちいくつかを統合しても良いし、以下に説明する各処理を実現可能な構成であれば、如何なる構成を採用しても良い。
入力部201は、タッチパネル画面102に対するタッチ操作を検出したり、音声出力ボタン104の押下を検出したりする。例えば、入力部201は、タッチパネル画面102に対する右方向(左方向)へのユーザのフリック操作を特定する。ページ記憶部210は、過去に音声出力を行ったページの番号を記憶する。
ページ遷移部207は、入力部201が検出したフリック操作に基づき、タッチパネル画面102に表示するページ(遷移先のページ)の特定を行う。例えば、入力部201が右方向のフリック操作(ページ指定指示)を検知すると、現在タッチパネル画面102に表示しているページの次のページ(ページ指定指示により指定されたページ)をタッチパネル画面102への表示対象として特定する。例えば、現在タッチパネル画面102に5ページ目のページが表示されており、入力部201が右方向のフリック操作を検知したとすると、ページ遷移部207は、6ページ目のページをタッチパネル画面102への表示対象として特定する。また例えば、入力部201が左方向のフリック操作を検知すると、現在タッチパネル画面102に表示しているページの前のページをタッチパネル画面102への表示対象として特定する。例えば、現在タッチパネル画面102に5ページ目のページが表示されており、入力部201が左方向のフリック操作を検知したとすると、ページ遷移部207は、4ページ目のページをタッチパネル画面102への表示対象として特定する。そしてページ遷移部207は、上記の電子書籍コンテンツの各ページのうち特定したページの映像信号を表示部202に供給する。
表示部202は、ページ遷移部207から供給された映像信号に基づく映像(即ちページの画面)の信号を、該タッチパネル画面102に対して供給するものである。本実施形態では、電子書籍における各ページのうち、ページ遷移部207によって特定されたページの映像信号をタッチパネル画面102に供給する。
時間特定部(計時部)204は、入力部201がフリック操作を検知したことに応じてタイマを0にリセットして計時を開始するものである。そして、時間特定部204は、タイマの値が規定値に達した時点でタッチパネル画面102に表示されているページを、遷移後ページとして特定する。ページ判断部209は、最後に音声出力を行ったページの番号と、遷移後ページの番号と、を比較する。
音声出力位置制御部205は、音声出力ボタン104が押下されたときに、ページ中のどの文字から音声出力を行うのか(どの音声出力位置から音声出力を行うのか)を、ページ判断部209による比較結果等に応じて決定する。
音声出力位置記憶部208は、SMILの記述情報と照会し、最後に音声を出力した文字である最後文字を特定する為の情報(ページ番号、行数、行の先頭からの文字数の情報)を音声出力位置として記憶する。例えば、5ページにある3行目の2文字目に音声出力位置においては、ページ番号が5、行数が3、行の先頭からの文字数が2となる。
音声出力部203は、音声出力位置制御部205が決定した音声出力位置からの音声波形データに基づく音声信号を、スピーカ103に供給する。
次に、本実施形態に係る情報処理装置101が行う音声出力処理について、同処理のフローチャートを示す図4を用いて説明する。なお、以下の説明では、タッチパネル画面102には、電子書籍コンテンツにおいてN(N≧1)ページ目のページ(ページNと呼称する)が表示されており、且つこのNページ目のページについてはまだ音声出力を行っていないものとする。そしてこの状態においてユーザが音声出力ボタン104を押下すると、ステップS401以降の処理が開始されることになる。
ステップS401において、入力部201が音声出力ボタン104の押下を検知すると、音声出力位置制御部205は、音声出力開始位置をページNの先頭文字の位置とする。これにより音声出力部203は、ページNの先頭文字以降の各文字について、該文字の音声波形データから音声信号を生成してスピーカ103に供給する。即ち本ステップでは、音声出力ボタン104の押下により音声出力指示が入力されると、該入力の時点でタッチパネル画面102が表示しているページNを音声出力ページとし、該音声出力ページ中の各文字に対応する音声を該文字の並び順に従って順次出力する。ステップS402では、ページ記憶部210は、音声出力中のページの番号であるNを記憶する。
ステップS403で音声出力位置記憶部208は、ページNにおいて、最後に音声を出力した文字である最後文字を特定する為の情報を記憶する。即ち、本ステップでは、音声出力ページにおいて音声出力部203が最後に音声を出力した文字である最後文字を特定するための情報をメモリ(音声出力位置記憶部208)内で管理する。
そして、入力部201が左若しくは右のフリック操作(ページNとは異なるページをタッチパネル画面102の表示対象として指定する操作入力)を検知した場合には、処理はステップS404を介してステップS405に進む。なお、本実施形態ではページ遷移部207は、ページNの最後の文字について音声出力が行われたことを検知すると、ページ(N+1)をタッチパネル画面102への表示対象として特定するので、この場合はステップS404を介してステップS405に進む。
処理がステップS405に進んだ場合、図4では示していないが、ページ遷移部207は、入力部201が右方向のフリック操作を検知すると、ページ(N+1)をタッチパネル画面102への表示対象(ページの遷移先)として特定する。一方、ページ遷移部207は、入力部201が左方向のフリック操作を検知すると、ページ(N−1)をタッチパネル画面102への表示対象(ページの遷移先)として特定する。そしてページ遷移部207は、上記の電子書籍コンテンツの各ページのうち特定したページの映像信号を表示部202に供給する。
一方、入力部201が左若しくは右のフリック操作を検知していない場合は、処理はステップS404を介してステップS401に戻り、次の文字について以降の処理を行う。
このように、入力部201がフリック操作を検知しない限りは、ページN中の各文字を順次、音声出力する。そして、ステップS401で音声出力を行う音声出力位置が1文字進むたびに、最後文字もこれに従って1文字進むことになる。
N=5の場合に、最初のステップS403で音声出力位置記憶部208に登録される情報の構成例を図17(a)に示す。上記のとおり、ページ5についてはまだ音声出力は行っていないので、音声出力位置記憶部208には、ページ番号「5」、ページ5の先頭文字の位置(行数「1」、行の先頭の文字からの文字数「1」)、が音声出力位置として登録される。そしてその後、音声出力位置が進み、ページ5において4行目の先頭から4文字目の文字について音声出力を行うと、最後文字の位置は「ページ5、4行目、先頭から4文字目)となる。然るに、音声出力位置記憶部208中の音声出力位置は、図17(b)に示す如く、ページ番号「5」、行数「4」、行の先頭の文字からの文字数「4」、に更新される。
タッチパネル画面102におけるページNの表示例を図16に示す。このとき、音声出力部203が、この音声出力位置記憶部208内の情報をSMILの記述情報と照会し、「今年の電子書籍コンテンツの増加率は目覚ましいものがありました」の先頭から音声波形データを音声出力することになる。
ステップS405では、音声出力部203は、音声出力を停止する。そしてステップS406では、時間特定部204は、タイマの値Z(ページ滞在時間Z:単位はmsec)を0にリセットしてから計時を開始する。計時は、ページの遷移開始と共に開始しても良いし、次のページへの遷移が完了してから開始しても良い。
ステップS407では、時間特定部204は、タイマの値Zが規定値に達したか否かを判断する。この判断の結果、タイマの値Zが規定値(例えば、2000msecとする)に達した場合には、処理はステップS411に進み、規定値に達していない場合は、処理はステップS408に進む。ステップS408〜S410の処理はそれぞれ、ステップS404〜S406と同じである。
ステップS408に処理が進んだ時点で、入力部201が左若しくは右のフリック操作を検知した場合、若しくはページ遷移部207が、遷移先のページにおける最後の文字について音声出力が行われたことを検知した場合は、処理はステップS409に進む。処理がステップS409に進んだ場合でも、ページ遷移部207は、タッチパネル画面102への表示対象ページを特定し、特定したページの映像信号を表示部202に供給する。
ステップS409では、音声出力部203は、音声出力を停止する。ただし、この時点で音声出力が停止されている場合は、この処理は実行されない。
そしてステップS410では、時間特定部204は、タイマの値Z(ページ滞在時間Z:単位はmsec)を0にリセットしてから計時を開始する。そして処理はステップS408に進む。
ステップS408に処理が進んだ時点で、入力部201が何れのフリック操作も検知していない場合、若しくはページ遷移部207が、遷移先のページにおける最後の文字について音声出力が行われたことを検知していない場合、処理はステップS407に進む。
ステップS411では、時間特定部204は、処理がステップS411に進んだ時点でタッチパネル画面102に表示されているページ(この時点でページ遷移部207が特定しているページ)を遷移後ページとして特定する。すなわち、上記のように、音声出力ページ中の各文字に対応する音声の出力中にページ指定指示が入力されると、音声の出力を停止し、該入力されたページ指定指示によって指定されたページがタッチパネル画面102で表示される連続時間を計時する。また、該停止後にページ指定指示が入力されると、該ページ指定指示によって指定されたページがタッチパネル画面102で表示される連続時間を計時する。そして、この計時した連続時間が規定時間以上となったページが上記の遷移後ページとなる。
そして時間特定部204は、この遷移後ページのページ番号を変数Iに代入する。また、時間特定部204は、図18に例示するように、タッチパネル画面102に表示されたページごとに、該ページの表示期間中に計時したタイマの値Zを管理している。
ステップS412では、ページ判断部209は、I=Nであるか否かを判断する。この判断の結果、I=Nである場合、即ち、遷移後ページがページNである場合、処理はステップS413に進む。一方、I≠Nである場合は、処理はステップS414に進む。
ステップS413では、音声出力位置制御部205は、音声出力位置記憶部208に格納されている音声出力位置を参照して、ページNにおける最後文字(の位置)を特定する。そして音声出力部203は、ページN中の文字の並び順において最後文字の次の文字以降に並んでいる文字の音声波形データに基づく音声信号を、スピーカ103に供給する。
例えば、タッチパネル画面102に図16に示すページが表示されており、音声出力位置記憶部208に図17(b)に示した音声出力位置が格納されているとする。この場合、ステップS413では、「来年以降も、電子書籍コンテンツはますます増えていくと予想されます。」の文章の「電子書籍…」から音声出力を行う。なお、ステップS404でページ遷移部207が、ページNの最後の文字について音声出力が行われたことを検知すると、音声出力部203は、ページN中の先頭文字以降に並んでいる文字の音声波形データに基づく音声信号を、スピーカ103に供給する。
一方、ステップS414では、ページ判断部209は、I>Nであるか否かを判断する。この判断の結果、I>N、即ち、遷移後ページがページNよりもページ番号が大きい後続ページであるとする。この場合、処理はステップS415に進む。一方、I≦Nの場合は、処理はステップS416に進む。
ステップS415では、音声出力位置制御部205は、音声出力開始位置をページIの先頭文字の位置とする。これにより音声出力部203は、ページIの先頭文字以降の各文字について、該文字の音声波形データから音声信号を生成してスピーカ103に供給する。
一方、ステップS416では、時間特定部204は、タイマの値Zが規定値(例えば、6000msecとする)に達しているか否かを判断する。この判断の結果、達している場合は、本処理は終了し、達していない場合は、処理はステップS408に進む。
即ち、ステップS401からステップS416の処理により、遷移後ページに応じて音声出力開始位置を自動で特定することが可能となる。ページ遷移後、音声出力させていた元のページに戻ってきた場合は、ページ遷移を開始した時の音声出力位置が音声出力再開位置となる。ページ遷移後、音声出力させていた元のページよりも後ろにページ遷移した場合は、ページの先頭から音声出力させる。ページ遷移後、音声出力させていた元のページよりも前にページ遷移した場合は、音声出力が停止される。
なお、図4に示した処理の代わりに、図5に示した処理の如く、ステップS405における処理をステップS411の直前に行うようにしても良い。また、図4に示した処理の代わりに、図6に示した処理の如く、ステップS402,S403の処理を、ステップS404の直後に行うようにしても良い。図6の処理では、ページ番号と音声出力位置の記憶は、ページ遷移確定後の1回になり、処理コストを削減することが可能となる。
また、図4に示した処理の代わりに、図7に示した処理の如く、ステップS402,S403の処理をステップS404の直後に行い、ステップS405における処理をステップS411の直前に行うようにしても良い。図7の処理では、ページ番号と音声出力位置の記憶は、ページ遷移確定後の1回になり、処理コストを削減することが可能となる。
このように、本実施形態の変形例はいくつか考えることができるが、これらの変形例は、以下の構成を満たしている。即ち、音声出力ページについて音声を出力している期間内でページ指定指示が入力されるたびに、該入力されたページ指定指示によって指定されたページがタッチパネル画面102で表示された連続時間を計時する。そして、この計時した連続時間が規定時間以上となったページが音声出力ページである場合、この期間内で最初にページ指定指示が入力された時点で音声を出力していた文字を最後文字とする。そして、該最後文字の次の文字以降の各文字に対応する音声を、該文字の並び順に従って順次出力する。
なお、上記で説明した音声出力処理、即ち、ページ遷移後、音声出力させていた元のページよりも前にページ遷移した場合、音声出力が停止される本実施形態を、第1の音声出力モードとする。
本実施形態では、タッチ操作によりページ遷移を行っているが、ボタン押下等によりページ遷移を行ってもよい。また、音声出力ボタン104の押下を認識するとページの先頭の文章から音声出力を開始しているが、タッチ操作等でページ上の任意の位置を指定して、指定された文章から音声出力を開始させてもよい。また、電子書籍コンテンツを朗読した音声波形データを音声出力しているが、電子書籍コンテンツを音声合成の技術により音声出力してもよい。
ただし、音声合成の技術を用いる場合、ステップS413において、音声出力位置制御部205は、最後文字の次の付近の文字以降に並んでいる文字の音声波形データに基づく音声信号を、スピーカ103に供給する。例えば、「来年以降も、電子書籍コンテンツはますます増えていくと予想されます。」の文章の「電」が最後文字になったとする。音声合成技術を用いた場合、「ししょせき」と読み上げられずに、「こしょせき」のように誤った読みになる場合がある。よって、最後文字の付近の文字にある、文章の先頭や文章中の区切りの良い文字から、音声合成により音声出力される。例えば、文章の先頭の「来年・・・」、もしくは、文章中の「電子・・・」や「ますます・・・」から音声出力される。音声合成技術については、公知なのでここでは省略する。
[第2の実施形態]
第1の実施形態では上記の通り、ページ遷移後、音声出力させていた元のページよりも前にページ遷移した場合は、音声出力が停止される第1の音声出力モードについて説明した。第2の実施形態においては、元のページの音声出力位置における文章に関連した文章を音声出力させる第2の音声出力モードについて説明する。
第1の実施形態では上記の通り、ページ遷移後、音声出力させていた元のページよりも前にページ遷移した場合は、音声出力が停止される第1の音声出力モードについて説明した。第2の実施形態においては、元のページの音声出力位置における文章に関連した文章を音声出力させる第2の音声出力モードについて説明する。
なお、本実施形態でも、第1の実施形態で使用した情報処理装置101を使用するものとする。以下では、第1の実施形態と異なる点について説明し、特に触れない限りは、第1の実施形態を適宜用いることとする。
本実施形態に係る情報処理装置101が行う音声出力処理について、同処理のフローチャートを示す図24を用いて説明する。なお、以下の説明では、タッチパネル画面102には、電子書籍コンテンツにおいてN(N≧1)ページ目のページ(ページNと呼称する)が表示されており、且つこのNページ目のページについてはまだ音声出力を行っていないものとする。そしてこの状態においてユーザが音声出力ボタン104を押下すると、ステップS401以降の処理が開始されることになる。図24に示したフローチャートは、ステップS414でI≦Nと判断された場合に、処理がステップS2401に進み、ステップS2401の後、処理がステップS416に進む点が図4と異なる。
ステップS2401では、音声出力位置制御部205は、音声出力位置記憶部208に格納されている音声出力位置における文字が属する文章と関連する文章を特定する。そして音声出力部203は、この特定された文章を構成する各文字の音声波形データに基づく音声信号をスピーカ103に対して供給する。
元のページよりも前にページ遷移した場合は、元のページの文章の意味などの確認の場合が多い。従って、元のページの音声出力位置に関連した文章を音声出力させることで、ユーザが所望する音声出力位置から音声出力することが可能となる。
ステップS2401における処理の詳細について、図20のフローチャートを用いて説明する。ステップS2001では、音声出力位置制御部205は、SMILの記述情報と照合することにより、音声出力位置記憶部208に格納されている音声出力位置から、最後文字が属する文章を特定する。例えば、図16より、「来年以降も、電子書籍コンテンツはますます増えていくと予想されます。」の文章が特定される。
ステップS2002では、音声出力位置制御部205は、ステップS2001で特定した文章中の名詞を特定する。名詞の特定には、形態素解析といった周知の技術を用いる。この形態素解析については周知の技術であるため、これについての説明は省略する。「来年以降も、電子書籍コンテンツはますます増えていくと予想されます。」の文章からは、「来年以降」と「電子書籍コンテンツ」が特定される。
ステップS2003では、音声出力位置制御部205は、遷移後ページ内(先ページ内)に、ステップS2002で特定した名詞が含まれているか否かを判断する。この判断においても、上記の形態素解析を用いる。この判断の結果、含まれている場合は、処理はステップS2004に進み、含まれていない場合は、処理はステップS2005に進む。
ステップS2005では、音声出力位置制御部205は、音声出力開始位置をページIの先頭文字の位置とする。これにより音声出力部203は、ページIの先頭文字以降の各文字について、該文字の音声波形データから音声信号を生成してスピーカ103に供給する。 ステップS2004では、音声出力位置制御部205は、音声出力開始位置を、ページIにおいて、ステップS2002で特定した名詞を含む文章の先頭文字の位置とする。これにより音声出力部203は、この文章の先頭文字以降の各文字について、該文字の音声波形データから音声信号を生成してスピーカ103に供給する。
例えば、タッチパネル画面102に図25に示す画面が遷移後ページとして表示されているとする。この場合、「電子書籍コンテンツ」が「各企業、電子書籍コンテンツにも力を入れ始めています。」の文章に含まれている。然るにこの場合、「電子書籍コンテンツ」が含まれている文章「各企業、電子書籍コンテンツにも力を入れ始めています。」の先頭文字から順に音声出力される。
なお、ステップS2401では、図20のフローチャートの処理の代わりに、図21のフローチャートの処理を行うようにしても良い。図21において図20と同じ処理ステップには同じステップ番号を付しており、その説明は省略する。
ステップS2103では、音声出力位置制御部205は、遷移後ページ内の段落のタイトル(タイトル文章)に、ステップS2002で特定した名詞が含まれているか否かを判断する。この判断においても、上記の形態素解析を用いる。この判断の結果、含まれている場合は、処理はステップS2104に進み、含まれていない場合は、処理はステップS2005に進む。
例えば、タッチパネル画面102に図26に示す画面が表示されている場合、タイトル「今後の電子書籍コンテンツ」に「電子書籍コンテンツ」が含まれている。この場合は、ステップS2104の処理を行う。タイトルの情報は、SMILの記述情報から取得できる。
ステップS2104では、音声出力位置制御部205は、音声出力開始位置を、ページIにおいて、ステップS2002で特定した名詞を含むタイトルの先頭文字の位置とする。これにより音声出力部203は、このタイトルの先頭文字以降の各文字について、該文字の音声波形データから音声信号を生成してスピーカ103に供給する。図26の場合は、段落のタイトルである「今後の電子書籍コンテンツ」の先頭から音声出力される。
また、ステップS2401では、図27のフローチャートの処理を行うようにしても良い。図27において図20と同じ処理ステップには同じステップ番号を付しており、その説明は省略する。
ステップS2701では、音声出力位置制御部205は、遷移後ページに強調文章(特定の種別の文章の一例)が含まれているか否かを判断する。この判断の結果、含まれている場合は、処理はステップS2701に進み、含まれていない場合は、処理はステップS2005に進む。例えば、タッチパネル画面102に図28に示す画面が表示されている場合、同画面中の文章には強調文章である「1章の重要ポイント」が含まれている。この場合は、ステップS2701の処理を行う。強調文章の情報は、SMILの記述情報から取得できる。
ステップS2701では、音声出力位置制御部205は、音声出力開始位置を、ページIにおいて、強調文章の先頭文字の位置とする。これにより音声出力部203は、この強調文章の先頭文字以降の各文字について、該文字の音声波形データから音声信号を生成してスピーカ103に供給する。
[第3の実施形態]
第3の実施形態においては、ページ遷移後のページに加えて、ページ遷移時間に応じて音声出力開始位置を制御する第3の音声出力モードについて説明する。なお、本実施形態でも、第1の実施形態で使用した情報処理装置101を使用するものとする。以下では、第1の実施形態と異なる点について説明し、特に触れない限りは、第1の実施形態を適宜用いることとする。
第3の実施形態においては、ページ遷移後のページに加えて、ページ遷移時間に応じて音声出力開始位置を制御する第3の音声出力モードについて説明する。なお、本実施形態でも、第1の実施形態で使用した情報処理装置101を使用するものとする。以下では、第1の実施形態と異なる点について説明し、特に触れない限りは、第1の実施形態を適宜用いることとする。
本実施形態に係る情報処理装置101が行う音声出力処理について、同処理のフローチャートを示す図22を用いて説明する。なお、以下の説明では、タッチパネル画面102には、電子書籍コンテンツにおいてN(N≧1)ページ目のページ(ページNと呼称する)が表示されており、且つこのNページ目のページについてはまだ音声出力を行っていないものとする。そしてこの状態においてユーザが音声出力ボタン104を押下すると、ステップS401以降の処理が開始されることになる。図22において、図4,24と同じ処理ステップには同じステップ番号を付しており、その説明は省略する。また、本実施形態では、時間特定部204は、図19に例示するように、タッチパネル画面102に表示されたページごとに、該ページの表示期間中に計時したタイマの値Zを管理している。
ステップS2201では、ページ遷移部207は、ページの遷移回数を示す変数Yを1に初期化する。ステップS2202では、時間特定部204は、ページ遷移の時間(単位はmsec)を計時するためのタイマの値Xを0に初期化してから計時を開始する。ステップS2203では、ページ遷移部207は、変数Yの値を1つインクリメントする。
即ち、音声出力ページについて音声を出力している期間内で最初にページ指定指示の入力を検知したタイミングから、計時した連続時間が規定時間以上となったタイミングまでのタイミング間でページ指定指示が入力された回数を変数Yの値としてカウントする。また、ページNの表示中に入力部201がフリック操作を検知してからの経過時間をタイマの値Xとして計時する。
ステップS2204では、ページ遷移部207は、ページ遷移の時間を計時するためのタイマによる計時を停止し、該タイマの値Xを取得する。例えば、X=5800msecとする。
ステップS2205では、ページ遷移部207は、変数Yの値を用いて、所定時間Sを求める。変数Yの値を用いて所定時間Sを求める方法には様々な方法が考えられるが、以下にいくつかの方法を説明する。
ステップS2206では、音声出力位置制御部205は、タイマの値Xに応じて、ページIにおける音声出力開始位置を決定する。これにより音声出力部203は、ページIにおいてこの決定した音声出力開始位置における文字以降の各文字について、該文字の音声波形データから音声信号を生成してスピーカ103に供給する。
次に、上記のステップS2205において行う処理の一例について、図11のフローチャートを用いて説明する。ステップS1101では、ページ遷移部207は、変数Yの値が規定値以上であるか否かを判断する。この判断の結果、規定値以上であれば、処理はステップS1102に進み、規定値よりも小さい場合は、処理はステップS1103に進む。
ステップS1102では、ページ遷移部207は、所定時間Sとして予め定められた値B(例えば、8000msecとする)を設定する。ステップS1103では、ページ遷移部207は、所定時間Sとして予め定められた値C(<B)(例えば、3000msecとする)を設定する。
また、ステップS2205において行う処理の一例について、図12のフローチャートを用いて説明する。ステップS1201では、ページ遷移部207は、変数Yの値に任意の係数Kを乗じた結果を所定時間Sに設定する。即ち、変数Yの値が大きいほど所定時間Sが大きくなるように、この所定時間Sを求める。
次に、上記のステップS2206における処理の詳細について、同処理のフローチャートを示す図8を用いて説明する。
ステップS801では、音声出力位置制御部205は、タイマの値Xが所定時間S(第1の閾値)以下であるか否かを判断する。この判断の結果、タイマの値Xが所定時間S以下である場合は、処理はステップS802に進み、タイマの値Xが所定時間Sよりも大きい場合は、処理はステップS804に進む。
ステップS802では、音声出力位置制御部205は、音声出力位置記憶部208に格納されている音声出力位置を参照して、ページNにおける最後文字(の位置)を特定する。そしてステップS803では音声出力部203は、ページN中の文字の並び順において最後文字の次の文字以降に並んでいる文字の音声波形データに基づく音声信号を、スピーカ103に供給する。
一方、ステップS804では、音声出力位置制御部205は、タイマの値Xが第2の閾値であるT(T>Sを満たし、例えば、T=2×S)以下であるか否か(即ち、S<X≦Tであるか否か)を判断する。この判断の結果、S<X≦Tであれば、処理はステップS805に進み、X>Tである場合は、処理はステップS806に進む。
ステップS805では、音声出力位置制御部205は、音声出力位置記憶部208に格納されている音声出力位置を参照して、ページNにおける最後文字(の位置)を特定する。そして音声出力位置制御部205は、ページNにおいてこの最後文字が属する段落の先頭の文章を特定する。そしてステップS803では音声出力部203は、ページNにおいてこの特定した文章中の文字の並び順において先頭文字以降に並んでいる文字の音声波形データに基づく音声信号を、スピーカ103に供給する。
ステップS806では音声出力位置制御部205は、ページNにおける先頭文字を特定する。そしてステップS803では音声出力部203は、ページNにおける先頭文字以降に並んでいる文字の音声波形データに基づく音声信号を、スピーカ103に供給する。
即ち、多少の確認等で、短時間でページを戻した場合は、ページ遷移開始時に中断された音声出力を再開させることが可能となる。また、他のページを熟読してページを戻した場合等のように、長時間でページを戻した場合は、再度ページの先頭から音声出力を再開させることが可能となる。また、いくらかの確認で一定時間経過しページを戻した場合は、ページ遷移開始時に中断された音声出力を段落の先頭から再開させることが可能となる。
なお、上記のステップS2206では、図9に示すフローチャートに従った処理を行うようにしても良い。ステップS901では、音声出力位置制御部205は、タイマの値Xが所定時間S以下であるか否かを判断する。この判断の結果、タイマの値Xが所定時間S以下である場合は、処理はステップS902に進み、タイマの値Xが所定時間Sよりも大きい場合は、処理はステップS904に進む。
ステップS902では、音声出力位置制御部205は、音声出力位置記憶部208に格納されている音声出力位置を参照して、ページNにおける最後文字(の位置)を特定する。そしてステップS903では音声出力部203は、ページN中の文字の並び順において最後文字の次の文字以降に並んでいる文字の音声波形データに基づく音声信号を、スピーカ103に供給する。
一方、ステップS904では、音声出力位置制御部205は、ページNにおける先頭文字を特定する。そしてステップS903では音声出力部203は、ページNにおける先頭文字以降に並んでいる文字の音声波形データに基づく音声信号を、スピーカ103に供給する。
即ち、多少の確認等で、短時間でページを戻した場合は、ページ遷移開始時に中断された音声出力を再開させることが可能となる。また、他のページを熟読してページを戻した場合等のように、長時間でページを戻した場合は、再度ページの先頭から音声出力を再開させることが可能となる。
また、上記のステップS2206では、図10に示すフローチャートに従った処理を行うようにしても良い。ステップS1001では、音声出力位置制御部205は、タイマの値Xが所定時間S以下であるか否かを判断する。この判断の結果、タイマの値Xが所定時間S以下である場合は、処理はステップS1002に進み、タイマの値Xが所定時間Sよりも大きい場合は、処理はステップS1004に進む。
ステップS1002では、音声出力位置制御部205は、音声出力位置記憶部208に格納されている音声出力位置を参照して、ページNにおける最後文字(の位置)を特定する。そして音声出力位置制御部205は、ページNにおいてこの最後文字が属する段落の先頭の文章を特定する。そしてステップS1003では音声出力部203は、ページNにおいてこの特定した文章中の文字の並び順において先頭文字以降に並んでいる文字の音声波形データに基づく音声信号を、スピーカ103に供給する。
一方、ステップS1004では、音声出力位置制御部205は、ページNにおける先頭文字を特定する。そしてステップS1003では音声出力部203は、ページNにおける先頭文字以降に並んでいる文字の音声波形データに基づく音声信号を、スピーカ103に供給する。
即ち、他のページを熟読してページを戻した場合等のように、長時間でページを戻した場合は、再度ページの先頭から音声出力を再開させることが可能となる。また、いくらかの確認で一定時間経過しページを戻した場合は、ページ遷移開始時に中断された音声出力を段落の先頭から再開させることが可能となる。
また、上記のステップS2206では、図13に示すフローチャートに従った処理を行うようにしても良い。
ステップS1301では、音声出力位置制御部205は、タイマの値Xが所定時間S以下であるか否かを判断する。この判断の結果、タイマの値Xが所定時間S以下である場合は、処理はステップS1302に進み、タイマの値Xが所定時間Sよりも大きい場合は、処理はステップS1306に進む。
ステップS1302では、音声出力位置制御部205は、音声出力位置記憶部208に格納されている音声出力位置を参照して、ページNにおける最後文字(の位置)が、該最後文字が属する文章の前半に位置しているのか否かを判断する。この判断の結果、前半に位置している場合には、処理はステップS1303に進み、後半に位置している場合には、処理はステップS1305に進む。ステップS1302における処理の詳細については、図14を用いて後述する。
ステップS1303では、音声出力位置制御部205は、音声出力位置記憶部208に格納されている音声出力位置を参照して、ページNにおける最後文字(の位置)を特定する。そして音声出力位置制御部205は、ページNにおいてこの最後文字が属する文章を特定する。そしてステップS1304では音声出力部203は、ページNにおいてこの特定した文章中の文字の並び順において先頭文字以降に並んでいる文字の音声波形データに基づく音声信号を、スピーカ103に供給する。
ステップS1305では、音声出力位置制御部205は、音声出力位置記憶部208に格納されている音声出力位置を参照して、ページNにおける最後文字(の位置)を特定する。そして音声出力位置制御部205は、ページNにおいてこの最後文字が属する文章の次の文章を特定する。そしてステップS1304では音声出力部203は、ページNにおいてこの特定した文章中の文字の並び順において先頭文字以降に並んでいる文字の音声波形データに基づく音声信号を、スピーカ103に供給する。
ステップS1306では、音声出力位置制御部205は、ページNにおける先頭文字を特定する。そしてステップS1304では音声出力部203は、ページNにおける先頭文字以降に並んでいる文字の音声波形データに基づく音声信号を、スピーカ103に供給する。
即ち、短時間でページを戻し、ページ遷移開始時の音声出力位置が文章の前半であった場合は、その文章の先頭から音声出力を再開させることが可能となる。また、ページ遷移開始時の音声出力位置が文章の後半であった場合は、その文章の次の文章から音声出力を再開させることが可能となる。
次に、上記のステップS1302における処理について、図14のフローチャートを用いて説明する。
ステップS1401では、音声出力位置制御部205は、音声出力位置記憶部208に格納されている音声出力位置を参照し、ページNにおける最後文字(の位置)が属する文章を特定する。
ステップS1402では、音声出力位置制御部205は、ステップS1401で特定した文章の先頭文字から、ページNにおける最後文字までの文字数Xを計数する。ステップS1403では、音声出力位置制御部205は、ステップS1401で特定した文章の文末文字から、ページNにおける最後文字までの文字数Yを計数する。
ステップS1404では、音声出力位置制御部205は、X>Yであるか否かを判断する。この判断の結果、X>Yであれば、処理はステップS1405に進み、X≦Yであれば、処理はステップS1406に進む。
ステップS1405では、音声出力位置制御部205は、最後文字は前半に位置していると判断し、ステップS1406では、音声出力位置制御部205は、最後文字は後半に位置していると判断する。
[第4の実施形態]
第1〜3の実施形態ではそれぞれ、第1〜第3の音声出力モードについて説明した。本実施形態では、第1〜第3の音声出力モードを切り替えて使用する。本実施形態に係る情報処理装置2300の外観例を図23に示す。図23において図1に示した構成要件と同じ構成要件については同じ参照番号を付しており、その説明は省略する。
第1〜3の実施形態ではそれぞれ、第1〜第3の音声出力モードについて説明した。本実施形態では、第1〜第3の音声出力モードを切り替えて使用する。本実施形態に係る情報処理装置2300の外観例を図23に示す。図23において図1に示した構成要件と同じ構成要件については同じ参照番号を付しており、その説明は省略する。
ボタン2301〜2303はそれぞれ、第1の音声出力モード、第2の音声出力モード、第3の音声出力モード、を指定するために押下するボタンである。なお、第1〜3の音声出力モードを指定するための方法はこれに限るものではない。例えば、1つのボタンを押下するごとにモードを切り替えるようにしても良いし、タッチパネル画面102にそれぞれのモードを指定するためのボタン画像を表示するようにしても良い。
本実施形態に係る情報処理装置2300の機能構成例について、図29のブロック図を用いて説明する。なお、図29において、図2に示した構成要件と同じ構成要件については同じ参照番号を付しており、その説明は省略する。
入力部201は、音声出力ボタン104やタッチパネル画面102からの操作入力だけでなく、ボタン2301〜2303の押下も検知する。モード切替部2901は、ボタン2301〜2303のうち押下されたボタンに応じたモードを設定する。即ち、モード切替部2901は、入力部201がボタン2301が押下されたことを検知すると、第1の音声出力モードを設定する。また、モード切替部2901は、入力部201がボタン2302が押下されたことを検知すると、第2の音声出力モードを設定する。また、モード切替部2901は、入力部201がボタン2303が押下されたことを検知すると、第3の音声出力モードを設定する。
本実施形態に係る情報処理装置2300の動作について、図15のフローチャートを用いて説明する。
ステップS1501では、入力部201は、ボタン2301〜2303の何れが押下されたのかを検知し、モード切替部2901は、入力部201が押下されたと判断したボタンに応じたモードを設定する。
この設定したモードが第1の音声出力モードであれば、処理はステップS1502を介してステップS1503に進む。ステップS1503では、第1の実施形態で説明した各処理を実行する。
また、この設定したモードが第2の音声出力モードであれば、処理はステップS1502、S1504を介してステップS1505に進む。ステップS1505では、第2の実施形態で説明した各処理を実行する。
また、この設定したモードが第3の音声出力モードであれば、処理はステップS1502、S1504を介してステップS1506に進む。ステップS1506では、第3の実施形態で説明した各処理を実行する。
なお、以上説明した第1〜4の実施形態は、適宜組み合わせて使用することも可能である。なお、組み合わせの際には、適宜構成を省いても良いし、適宜構成を付け加えても良い。
[第5の実施形態]
図1,29に示した各部は何れもハードウェアで構成しても良いが、例えば、音声出力位置記憶部208をメモリで構成し、それ以外の各部をソフトウェア(コンピュータプログラム)で構成しても良い。このような場合に、情報処理装置101,2300に適用可能なコンピュータのハードウェア構成例について、図3のブロック図を用いて説明する。
図1,29に示した各部は何れもハードウェアで構成しても良いが、例えば、音声出力位置記憶部208をメモリで構成し、それ以外の各部をソフトウェア(コンピュータプログラム)で構成しても良い。このような場合に、情報処理装置101,2300に適用可能なコンピュータのハードウェア構成例について、図3のブロック図を用いて説明する。
CPU301は、RAM302やROM303に格納されているコンピュータプログラムやデータを用いて、コンピュータ全体の動作制御を行うと共に、情報処理装置101、2300が行うものとして上述した各処理を実行する。
RAM302は、HDD(ハードディスクドライブ)等の外部メモリ308からロードされたコンピュータプログラムやデータを一時的に記憶するためのエリアや、CPU301が各種の処理を実行する際に用いるワークエリアを有する。即ち、RAM302は、各種のエリアを適宜提供することができる。ROM303には、コンピュータの設定データやブートプログラムなどが格納されている。
入力部304は、上記の音声出力ボタン104や、ボタン2301〜2303、タッチパネル画面102におけるタッチセンサに相当し、上記の通り、各種の指示をCPU301に対して入力することができる。表示部305は、上記のタッチパネル画面102に相当する。音声出力部306は、上記のスピーカ103に相当する。
外部メモリ308には、OS(オペレーティングシステム)や、上記の各実施形態で説明した各種の処理をCPU301に実行させるためのコンピュータプログラムやデータが保存されている。このコンピュータプログラムは、図1,29において音声出力位置記憶部208を除く各部に相当するコンピュータプログラムを含む。また、このデータは、電子書籍コンテンツのデータや、上記の処理で既知のものとして説明したデータを含む。
外部メモリ308に保存されているコンピュータプログラムやデータは、CPU301による制御に従って適宜RAM302にロードされ、CPU301による処理対象となる。上記の各部は共通のバス307に接続されている。なお、上記の音声出力位置記憶部208は、外部メモリ308やRAM302に相当する。
なお、図1,29に示した機能構成を有する情報処理装置は、図3に示した構成を有する1台のコンピュータで実装しても良いが、複数台の装置によってこの情報処理装置を構成するようにしても良い。
なお、図1,29に示した各部を全部ハードウェア/ソフトウェアで構成せずに、一部をハードウェア/ソフトウェアで構成するようにしても良い。この場合であっても、このソフトウェアはメモリに格納し、このソフトウェアは、CPU301により実行される。
(その他の実施例)
また、本発明は、以下の処理を実行することによっても実現される。即ち、上述した実施形態の機能を実現するソフトウェア(プログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(またはCPUやMPU等)がプログラムを読み出して実行する処理である。
また、本発明は、以下の処理を実行することによっても実現される。即ち、上述した実施形態の機能を実現するソフトウェア(プログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(またはCPUやMPU等)がプログラムを読み出して実行する処理である。
201:入力部 210:ページ記憶部 207:ページ遷移部 202:表示部 204:時間特定部 209:ページ判断部 205:音声出力位置制御部 203:音声出力部 208:音声出力位置記憶部
本発明の目的を達成するために、例えば、本発明の情報処理装置は、表示画面に表示させた文字列に対応する音声を出力する情報処理装置であって、
複数ページからなるドキュメントにおいて指定されたページを前記表示画面に表示させる表示制御手段と、
前記表示画面に表示されているページ中の各文字に対応する音声を、該文字の並び順に従って順次出力する音声出力手段と、
前記音声出力手段によって最後に音声を出力した文字を特定するための情報を保持する保持手段と、
前記表示画面に表示させるページを変更する指示の入力を検知する検知手段と
を備え、
(a) 前記表示画面に表示されている注目ページについて音声を出力中に前記検知手段が前記指示の入力を検知したことに応じて、前記音声出力手段は前記注目ページについての音声の出力を停止し、
(b) 前記停止中に前記検知手段が前記指示の入力を検知したことに応じて前記表示制御手段が前記表示画面に表示したページが前記注目ページである場合、前記音声出力手段は、前記保持手段が保持している前記注目ページについて最後に音声が出力された文字を特定するための情報に基づき、前記注目ページについて最後に音声が出力された文字の近傍の文字から音声の出力を再開する
ことを特徴とする。
複数ページからなるドキュメントにおいて指定されたページを前記表示画面に表示させる表示制御手段と、
前記表示画面に表示されているページ中の各文字に対応する音声を、該文字の並び順に従って順次出力する音声出力手段と、
前記音声出力手段によって最後に音声を出力した文字を特定するための情報を保持する保持手段と、
前記表示画面に表示させるページを変更する指示の入力を検知する検知手段と
を備え、
(a) 前記表示画面に表示されている注目ページについて音声を出力中に前記検知手段が前記指示の入力を検知したことに応じて、前記音声出力手段は前記注目ページについての音声の出力を停止し、
(b) 前記停止中に前記検知手段が前記指示の入力を検知したことに応じて前記表示制御手段が前記表示画面に表示したページが前記注目ページである場合、前記音声出力手段は、前記保持手段が保持している前記注目ページについて最後に音声が出力された文字を特定するための情報に基づき、前記注目ページについて最後に音声が出力された文字の近傍の文字から音声の出力を再開する
ことを特徴とする。
本発明の構成によれば、表示されているページの音声出力が開始された後で画面遷移が生じ、出力される音声が表示されているページの文字に対応しなくなる場合には速やかに音声読み上げを中断し、かつ、遷移後のページに応じて、ユーザの明示的な指示がなくとも音声出力を再開する文字の位置を特定することが可能となる。
Claims (11)
- 電子書籍を構成する各ページのうちページ指定指示によって指定されたページを表示する表示手段と、
音声出力指示が入力されると、該入力の時点で前記表示手段が表示しているページを音声出力ページとし、該音声出力ページ中の各文字に対応する音声を、該文字の並び順に従って順次出力する音声出力手段と、
前記音声出力手段が音声出力を開始する先頭文字を、前記音声出力ページ中の文字に基づいて決定し、前記音声出力手段に、前記先頭文字以降の文字に対応する音声を、前記並び順に従って順次出力させる制御手段と
を備えることを特徴とする情報処理装置。 - 更に、
前記音声出力手段が前記音声出力ページについて音声を出力している期間内でページ指定指示が入力されるたびに、該入力されたページ指定指示によって指定されたページが前記表示手段で表示された連続時間を計時する計時手段を備え、
前記制御手段は、
前記計時手段が計時した連続時間が規定時間以上となったページが前記音声出力ページである場合、前記期間内で最初にページ指定指示が入力された時点で前記音声出力手段が音声を出力していた文字を最後文字とし、前記音声出力手段に、前記並び順において該最後文字の次の文字の付近に位置する文字以降の各文字に対応する音声を、前記並び順に従って順次出力させる
ことを特徴とする請求項1に記載の情報処理装置。 - 前記制御手段は、前記連続時間が規定時間以上となったページが、前記音声出力ページよりもページ番号が大きい後続ページである場合、前記音声出力手段に、前記後続ページにおける先頭文字以降の各文字に対応する音声を、該文字の並び順に従って順次出力させることを特徴とする請求項2に記載の情報処理装置。
- 前記制御手段は、前記連続時間が規定時間以上となったページが、前記音声出力ページよりもページ番号が小さい先ページである場合、前記音声出力ページ中の最後文字を含む文章から名詞を特定し、該特定した名詞を含む文章を該先ページから特定し、前記音声出力手段に、該特定した文章における先頭文字以降の各文字に対応する音声を、該文字の並び順に従って順次出力させることを特徴とする請求項2又は3に記載の情報処理装置。
- 前記制御手段は、前記連続時間が規定時間以上となったページが、前記音声出力ページよりもページ番号が小さい先ページである場合、前記音声出力ページ中の最後文字を含む文章から名詞を特定し、該特定した名詞を含むタイトルを該先ページから特定し、前記音声出力手段に、該特定したタイトルにおける先頭文字以降の各文字に対応する音声を、該文字の並び順に従って順次出力させることを特徴とする請求項2又は3に記載の情報処理装置。
- 前記制御手段は、前記連続時間が規定時間以上となったページが、前記音声出力ページよりもページ番号が小さい先ページである場合、前記音声出力手段に、該先ページ内の特定の種別の文章の先頭文字以降の各文字に対応する音声を、該文字の並び順に従って順次出力させることを特徴とする請求項2又は3に記載の情報処理装置。
- 前記制御手段は更に、
前記期間内で最初にページ指定指示が入力されたことを検知したタイミングから、前記連続時間が規定時間以上となったタイミングまでのタイミング間の長さを求め、
前記連続時間が規定時間以上となったページが前記音声出力ページであり、且つ前記長さが第1の閾値よりも短い場合は、前記音声出力手段に、前記音声出力ページ中の最後文字の次の文字以降の各文字に対応する音声を、該文字の並び順に従って順次出力させ、
前記連続時間が規定時間以上となったページが前記音声出力ページであり、且つ前記長さが前記第1の閾値よりも長い場合は、前記音声出力手段に、前記音声出力ページにおける先頭文字以降の各文字に対応する音声を、該文字の並び順に従って順次出力させる、若しくは前記音声出力手段に、前記音声出力ページにおいて最後文字を含む段落の文章における先頭文字以降の各文字に対応する音声を、該文字の並び順に従って順次出力させる
ことを特徴とする請求項2乃至6の何れか1項に記載の情報処理装置。 - 更に、前記タイミング間でページ指定指示が入力された回数を用いて前記第1の閾値を設定する手段を備えることを特徴とする請求項7に記載の情報処理装置。
- 情報処理装置が行う情報処理方法であって、
前記情報処理装置の表示手段が、電子書籍を構成する各ページのうちページ指定指示によって指定されたページを表示する表示工程と、
前記情報処理装置の音声出力手段が、音声出力指示が入力されると、該入力の時点で前記表示工程で表示しているページを音声出力ページとし、該音声出力ページ中の各文字に対応する音声を、該文字の並び順に従って順次出力する音声出力工程と、
前記情報処理装置の制御手段が、前記音声出力工程で音声出力を開始する先頭文字を、前記音声出力ページ中の文字に基づいて決定し、前記音声出力工程で、前記先頭文字以降の文字に対応する音声を、前記並び順に従って順次出力させる制御工程と
を備えることを特徴とする情報処理方法。 - 更に、
前記情報処理装置の計時手段が、前記音声出力工程で前記音声出力ページについて音声を出力している期間内でページ指定指示が入力されるたびに、該入力されたページ指定指示によって指定されたページが前記表示工程で表示された連続時間を計時する計時工程を備え、
前記制御工程では、
前記計時工程で計時した連続時間が規定時間以上となったページが前記音声出力ページである場合、前記期間内で最初にページ指定指示が入力された時点で前記音声出力工程で音声を出力していた文字を最後文字とし、前記音声出力工程で、前記並び順において該最後文字の次の文字の付近に位置する文字以降の各文字に対応する音声を、前記並び順に従って順次出力させる
ことを特徴とする請求項9に記載の情報処理方法。 - コンピュータを、請求項1乃至8の何れか1項に記載の情報処理装置の各手段として機能させるためのコンピュータプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016101935A JP6100423B2 (ja) | 2016-05-20 | 2016-05-20 | 情報処理装置、情報処理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016101935A JP6100423B2 (ja) | 2016-05-20 | 2016-05-20 | 情報処理装置、情報処理方法 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011240661A Division JP5941264B2 (ja) | 2011-11-01 | 2011-11-01 | 情報処理装置、情報処理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016192211A true JP2016192211A (ja) | 2016-11-10 |
JP6100423B2 JP6100423B2 (ja) | 2017-03-22 |
Family
ID=57246935
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016101935A Active JP6100423B2 (ja) | 2016-05-20 | 2016-05-20 | 情報処理装置、情報処理方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6100423B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2023043552A (ja) * | 2021-09-16 | 2023-03-29 | 三和書籍有限会社 | 電子書籍読上装置及び電子書籍読上プログラム |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6292025A (ja) * | 1985-10-18 | 1987-04-27 | Canon Inc | 電子機器 |
JPH05314732A (ja) * | 1992-05-11 | 1993-11-26 | Casio Comput Co Ltd | 携帯型表示装置 |
JPH08101697A (ja) * | 1994-09-30 | 1996-04-16 | Victor Co Of Japan Ltd | 電子ブック装置 |
JP2003302991A (ja) * | 2002-04-12 | 2003-10-24 | Brother Ind Ltd | 文章読み上げ装置、文章読み上げ方法、及びプログラム |
JP2003316565A (ja) * | 2002-04-25 | 2003-11-07 | Canon Inc | 読み上げ装置およびその制御方法ならびにプログラム |
JP2005189906A (ja) * | 2003-12-24 | 2005-07-14 | Fuji Photo Film Co Ltd | 電子ブック |
JP2009009217A (ja) * | 2007-06-26 | 2009-01-15 | Kyocera Corp | 電子機器及びその制御方法 |
JP2011028457A (ja) * | 2009-07-23 | 2011-02-10 | Seiko Instruments Inc | ブックマーク登録装置、ブックマーク登録方法、ブックマーク登録プログラム、及びテキスト音声再生装置 |
-
2016
- 2016-05-20 JP JP2016101935A patent/JP6100423B2/ja active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6292025A (ja) * | 1985-10-18 | 1987-04-27 | Canon Inc | 電子機器 |
JPH05314732A (ja) * | 1992-05-11 | 1993-11-26 | Casio Comput Co Ltd | 携帯型表示装置 |
JPH08101697A (ja) * | 1994-09-30 | 1996-04-16 | Victor Co Of Japan Ltd | 電子ブック装置 |
JP2003302991A (ja) * | 2002-04-12 | 2003-10-24 | Brother Ind Ltd | 文章読み上げ装置、文章読み上げ方法、及びプログラム |
JP2003316565A (ja) * | 2002-04-25 | 2003-11-07 | Canon Inc | 読み上げ装置およびその制御方法ならびにプログラム |
JP2005189906A (ja) * | 2003-12-24 | 2005-07-14 | Fuji Photo Film Co Ltd | 電子ブック |
JP2009009217A (ja) * | 2007-06-26 | 2009-01-15 | Kyocera Corp | 電子機器及びその制御方法 |
JP2011028457A (ja) * | 2009-07-23 | 2011-02-10 | Seiko Instruments Inc | ブックマーク登録装置、ブックマーク登録方法、ブックマーク登録プログラム、及びテキスト音声再生装置 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2023043552A (ja) * | 2021-09-16 | 2023-03-29 | 三和書籍有限会社 | 電子書籍読上装置及び電子書籍読上プログラム |
Also Published As
Publication number | Publication date |
---|---|
JP6100423B2 (ja) | 2017-03-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101393816B1 (ko) | 음성 입력의 프로세싱 | |
JP5963584B2 (ja) | 電子機器及びその制御方法 | |
US8310582B2 (en) | Digital image processing apparatus and method for displaying a plurality of images | |
CN104239392A (zh) | 与显示内容关联地记录音频 | |
CN110265067B (zh) | 录制热门片段方法、装置、电子设备及可读介质 | |
TW200921447A (en) | Synchronizing slide show events with audio | |
KR20190000882A (ko) | 동영상을 처리하는 컴퓨팅 장치, 방법 및 컴퓨터 프로그램 | |
JP6417104B2 (ja) | テキスト編集装置、テキスト編集方法、及びプログラム | |
WO2017076304A1 (zh) | 音频数据处理方法和装置 | |
JP6100423B2 (ja) | 情報処理装置、情報処理方法 | |
JPH11202857A (ja) | 楽譜表示装置及び方法並びに記憶媒体 | |
US20210064327A1 (en) | Audio highlighter | |
JP5941264B2 (ja) | 情報処理装置、情報処理方法 | |
WO2022142750A1 (zh) | 基于教程的多媒体资源编辑方法, 装置, 设备及存储介质 | |
GB2525841A (en) | Image modification | |
US20160275967A1 (en) | Presentation support apparatus and method | |
JP5145613B2 (ja) | コンテンツ情報表示装置およびそのプログラム | |
JP6039990B2 (ja) | 情報処理装置及びその制御方法 | |
US9817633B2 (en) | Information processing apparatus and information processing method | |
JP2008160697A (ja) | データ登録装置 | |
RU2805241C1 (ru) | Способ, устройство, оборудование для озвучивания видео и носитель информации | |
JP2019102852A (ja) | 情報処理装置、及びその制御方法、プログラム | |
JP2013228624A (ja) | 音声処理装置、音声処理方法 | |
JP2015095027A (ja) | コンテンツ再生装置、コンテンツ再生方法、および、コンテンツ再生プログラム | |
JP6536233B2 (ja) | 出力制御装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170123 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170222 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6100423 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |