JP7215033B2 - 情報処理装置およびプログラム - Google Patents

情報処理装置およびプログラム Download PDF

Info

Publication number
JP7215033B2
JP7215033B2 JP2018173844A JP2018173844A JP7215033B2 JP 7215033 B2 JP7215033 B2 JP 7215033B2 JP 2018173844 A JP2018173844 A JP 2018173844A JP 2018173844 A JP2018173844 A JP 2018173844A JP 7215033 B2 JP7215033 B2 JP 7215033B2
Authority
JP
Japan
Prior art keywords
page
time
voice output
information processing
display
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018173844A
Other languages
English (en)
Other versions
JP2020046842A (ja
Inventor
陵平 山田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP2018173844A priority Critical patent/JP7215033B2/ja
Publication of JP2020046842A publication Critical patent/JP2020046842A/ja
Application granted granted Critical
Publication of JP7215033B2 publication Critical patent/JP7215033B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • User Interface Of Digital Computer (AREA)

Description

本発明は、情報処理装置およびプログラムに関する。
下記非特許文献1には、プレゼンテーション用アプリケーションソフトウェアによって表示される各頁のノート欄(コメント欄)に各種のコマンドを入力することにより、タブレット型コンピュータあるいはタブレット型の表示兼入力装置を搭載したロボット(例えばpepper(登録商標))に、当該コマンドに応じた音声を出力したり、動作を行わせたりすることができるロボット制御用アプリケーションソフトウェアが開示されている。
フューブライト・コミュニケーションズ株式会社、"ロボットピッチ いつものパワーポイントでPepperプレゼン"、[online]、[平成30年7月9日検索]、インターネット<URL:http://fubright.co.jp/pepper-robo-apps/robo-pitch/>
本発明の目的は、複数の頁が連続して切り替わるよう表示されるとともに、それぞれの頁に対して頁表示時間と当該頁表示時に音声出力する文章とを設定可能な電子ファイルにおいて、当該文章の音声出力中に頁表示が切り替わってしまう可能性のある頁を利用者に対して通知可能な情報処理装置を提供することである。
請求項1に係る本発明は、複数の頁が連続的に切り替わるように表示される電子ファイルのそれぞれの頁に対応付けられた非表示のコメント欄に記述されたコマンドから当該頁の表示時間を抽出して受け付ける第1受付手段と、
前記電子ファイルのそれぞれの頁の前記コメント欄に記述された前記コマンドから当該頁の表示時に音声出力する文章を抽出して受け付ける第2受付手段と、
前記第2受付手段により受け付けられた文章から推測される音声出力時間が前記第1受付手段により受け付けられた当該頁の表示時間よりも長い場合に、その旨を通知する通知手段と、を備える情報処理装置である。
請求項2に係る本発明は、前記推測される音声出力時間は、前記電子ファイルのそれぞれの頁の前記コメント欄に記述された、音声出力の対象となる文章と、音声出力時間に影響を与えるコマンドとから推測される請求項1記載の情報処理装置である。
請求項に係る本発明は、前記通知手段が、前記音声出力時間が前記頁の表示時間よりも長くなる頁を通知する請求項1または2記載の情報処理装置である。
請求項に係る本発明は、前記通知手段が、前記音声出力時間が前記頁の表示時間よりも長くなる頁毎に前記頁の表示時間あるいは音声出力時間のいずれかを調整可能な状態で通知する請求項記載の情報処理装置である。
請求項に係る本発明は、利用者により任意の頁の表示時間を調整することが選択された場合に、当該頁の表示時間を調整する調整手段を備える請求項記載の情報処理装置である。
請求項に係る本発明は、前記調整手段が、前記頁の表示時間を、少なくとも当該頁に設定された文章から推測される音声出力時間に再設定する請求項記載の情報処理装置である。
請求項に係る本発明は、前記通知手段は、前記頁の調整後の表示時間を通知する請求項または記載の情報処理装置である。
請求項に係る本発明は、利用者により任意の頁の音声出力時間を調整することが選択された場合に、当該頁の音声出力時間を調整する調整手段を備える請求項記載の情報処理装置である。
請求項に係る本発明は、前記調整手段は、前記頁に設定された文章の内容を変更する請求項記載の情報処理装置である。
請求項10に係る本発明は、前記調整手段は、前記頁に設定された文章から音声合成される音声の速度を調整する請求項記載の情報処理装置である。
請求項11に係る本発明は、前記頁に設定された文章から推測される音声出力時間を動的に調整可能な状態で表示するよう制御する表示制御手段を備える請求項から10いずれかに記載の情報処理装置である。
請求項12に係る本発明は、前記表示制御手段は、前記頁に設定された表示時間を表示するよう制御する請求項11記載の情報処理装置である。
請求項13に係る本発明は、設定された音声出力時間で前記頁に設定された文章を音声合成して再生する再生手段を備える請求項11または12記載の情報処理装置である。
請求項14に係る本発明は、情報処理装置を構成するコンピュータに、
複数の頁が連続的に切り替わるように表示される電子ファイルのそれぞれの頁に対応付けられた非表示のコメント欄に記述されたコマンドから当該頁の表示時間を抽出して受け付ける処理と、
前記電子ファイルのそれぞれの頁の前記コメント欄に記述された前記コマンドから当該頁の表示時に音声出力する文章を抽出して受け付ける処理と、
受け付けられた文章から推測される音声出力時間が当該頁の表示時間よりも長い場合に
、その旨を通知する処理と、を実行させるプログラムである。
請求項1および2に係る本発明によれば、複数の頁が連続して切り替わるよう表示されるとともに、それぞれの頁に対応付けられた非表示のコメント欄に記述することにより頁表示時間と当該頁表示時に音声出力する文章とを設定可能な電子ファイルにおいて、当該文章の音声出力中に頁表示が切り替わってしまう可能性のある頁を利用者に対して通知可能な情報処理装置を提供できる。
請求項に係る本発明によれば、頁に設定された文章の音声出力中に頁表示が切り替わってしまう問題が電子ファイル中のどの頁に存在するかを通知することができる。
請求項に係る本発明によれば、頁に設定された文章の音声出力中に頁表示が切り替わってしまう可能性のある頁毎に、頁表示時間と音声出力時間のいずれかを選択して変更することが可能となる。
請求項に係る本発明によれば、頁に設定された文章の音声出力時間を変更することなく当該頁の頁表示時間を調整できる。
請求項に係る本発明によれば、当該頁の音声出力が終了した時点で頁表示が切り替わるように設定することができる。
請求項に係る本発明によれば、頁表示時間が再設定された場合に、再設定後の頁表示時間を利用者に通知することができる。
請求項に係る本発明によれば、頁に設定された頁表示時間を変更することなく当該頁に設定された文章の音声出力を調整できる。
請求項に係る本発明によれば、音声出力時間に合わせて文章を短縮できる。
請求項10に係る本発明によれば、頁に設定された文章の内容を変更することなく音声出力時間を調整することができる。
請求項11に係る本発明によれば、利用者が頁の音声出力時間を、視認しながら任意に調節できる。
請求項12に係る本発明によれば、利用者が頁表示時間を視認しながら当該頁の音声出力時間を動的に調整できる。
請求項13に係る本発明によれば、頁に設定された文章を、設定された内容および音声出力時間で視聴することができる。
請求項14に係る本発明によれば、情報処理装置を構成するコンピュータに、複数の頁が連続して切り替わるよう表示されるとともに、それぞれの頁に対応付けられた非表示のコメント欄に記述することにより頁表示時間と当該頁表示時に音声出力する文章とを設定可能な電子ファイルの、当該文章の音声出力中に頁表示が切り替わってしまう可能性のある頁を利用者に対して通知する処理を実行させることができる。
本発明の一実施形態における情報処理装置20のハードウェア構成を示す図である。 本発明の一実施形態における電子ファイルに含まれるある一頁とその頁のコメント欄の内容を示す。 本発明の一実施形態における電子ファイルに含まれる、音声出力時間が頁表示時間を超過している場合の一頁とその頁のコメント欄の内容を示す。 図1の情報処理装置20の機能ブロックを示す図である。 本発明の一実施形態における情報処理装置20における処理の流れを示すフローチャートである。 音声出力時間が当該頁の頁表示時間よりも長いと判断された当該頁の情報を通知する確認ポップアップウィンドウ500の一例を示す図である。 音声出力対象の文章から音声合成される音声の速度を調整する場合に表示される話速変更ウィンドウ600の一例を示す図である。 電子ファイルのすべて頁について不整合の有無があるか否かを先に判断する場合の処理を示すフローチャートである。 音声出力時間が当該頁の頁表示時間よりも長いと判断された当該頁の情報をサムネイル表示で通知する確認ポップアップウィンドウ800の一例を示す図である。 音声出力時間を変更するための変更確認ポップアップウィンドウ900の一例を示す図である。
《情報処理装置についての説明》
本発明の一実施形態における情報処理装置20について、図1を参照して説明する。なお、図1は、本実施形態における情報処理装置20のハードウェア構成を示す図である。情報処理装置20は、例えばデスクトップ型コンピュータであるが、本発明はこれに限定されず、下記に説明する構成を有するものであれば、ノート型コンピュータであってもよいし、他の端末装置であってもよい。
図1に示すように、情報処理装置20は、制御用マイクロプロセッサ201、メモリ202、記憶装置203、通信インタフェース204、ディスプレイ205、入力インタフェース206、スピーカ207を有し、それぞれ制御用バス208に接続される。
制御用マイクロプロセッサ201は、記憶装置203に記憶された制御プログラムに基づいて、情報処理装置20の各部の動作を制御する。
メモリ202には、電子ファイルのそれぞれの頁のコメント欄150から取得された各頁の表示時間の情報、コメント欄150から取得された音声出力の対象となる文章のデータ、各頁の音声出力時間の情報、音声合成された音声データなどが一時的に記憶される。
記憶装置203は、ハードディスク(HDD)やソリッド・ステート・ドライブ(SDD)によって構成され、情報処理装置20の各部を制御するための制御プログラムが格納される。また、記憶装置203には、本実施形態における処理の対象となる電子ファイルが保存される。電子ファイルの詳細については後述する。
通信インタフェース204は、この情報処理装置20がネットワーク(図示せず)を介して他のサーバ(図示せず)と通信を行うための通信制御を行う。
ディスプレイ205は、この情報処理装置20と一体または別体の液晶ディスプレイで構成され、後述する表示制御部によって処理された情報が表示される。
入力インタフェース206は、キーボードやマウスなどで構成され、情報処理装置20を操作する利用者が指示を入力するための入力手段である。
スピーカ207は、後述する再生部によって出力される音声信号を音声に変換して再生する。
《電子ファイルについての説明》
ここで、上述の記憶装置203に記憶される、本実施形態において処理の対象となる電子ファイルについて説明する。本実施形態の電子ファイルは画像や文章をそれぞれ含む複数の頁で構成される。そして、この電子ファイルは、本実施形態の情報処理装置にインストールされたプレゼンテーション用アプリケーションソフトウェア(以下、「プレゼンソフト」という)によって開いた場合、表示装置に電子ファイルの複数の頁が連続的に切り替わるように表示されるものである。
また、電子ファイルに含まれるそれぞれの頁には、実際に表示される頁とは別にコメント欄が設けられており、電子ファイルの作成者あるいは編集者がこのコメント欄に文章やコマンドを自由に入力して保存することができる。プレゼンソフトは、このコメント欄に入力されたコマンドに応じて音声合成実行させ、音声を出力させることができる。
例えば、図2は、電子ファイルに含まれる、ある一頁とその頁に対応付けられたコメント欄の内容を示している。この頁は、電子ファイルのそれぞれの頁をプレゼンソフトで連続的に表示した場合に画面上に実際に表示される表示用画像100と、画面上には表示されないコメント欄150で構成される。なお、プレゼンソフトによってコメント欄150が表示用画像100とともに画面上に表示されるようにしてもよい。表示用画像100には、「油から上げるタイミング」といったプレゼンテーション用文章110とプレゼンテーション用画像120が含まれる。一方、コメント欄150には、「♯page(26)#」、「♯point(8、16、blue)#」、「#time(2)#」、「チキンカツを油から上げるタイミング」といったコマンドが記載されている。
コマンド「♯page(26)#」は、電子ファイルをプレゼンソフトによって読み込んだ場合の、当該頁の表示時間を表しており、頁表示開始から26秒後に次の頁に表示を切り替えることを意味している。コマンド「♯point(8、16、blue)#」は、頁表示開始後8秒目から16秒目まで画面上に青色のポインタを表示することを意味している。また、コマンド「#time(2)#」は2秒間待機することを意味している。つまり、当該コマンドの後に記載されている音声出力対象の文章の音声出力、あるいは当該コマンドの後に記載されている他のコマンドの実行を2秒間待機する。さらに、「チキンカツを油から上げるタイミング」は、音声出力させる出力対象となる文章である。
図2に示す頁の場合、音声出力対象の文章、および他の音声出力時間に影響を与えるコマンドから推測される音声出力の時間の合計が26秒であったとする。この場合、頁表示時間は26秒であるから、当該頁の音声出力の時間が頁表示時間を超過するという不整合は存在せず、当該頁の表示と音声の出力に関して問題は生じない。
一方、図3に示す頁の場合、図2で説明した頁と、コマンド「♯page(5)#」の部分だけが相違しており、他の部分は同一である。この場合、この頁は、頁表示開始から5秒後に次の頁に表示が切り替えられることになる。一方、音声出力対象の文章、および他の音声出力時間に影響を与えるコマンドから推測される音声出力の時間の合計は、図2の場合と同じ26秒間であったとする。その場合、音声出力の時間が頁表示時間を超過しており、音声出力が終わらないうちに次の頁に表示が切り替わってしまうという問題が生じることになる。
次に、図4を参照して、本実施形態における情報処理装置20の機能について説明する。図4は、図1の情報処理装置20の機能ブロックを示す図である。図4に示すように、情報処理装置20は、記憶装置203に記憶された制御プログラムを制御用マイクロプロセッサ201において実行することにより、頁表示時間取得部211、テキスト取込部212、音声出力時間推定部213、判断部214、通知部215、表示制御部216、調整部217、音声合成部218、再生部219の各機能を発揮するものとして構成される。
頁表示時間取得部211は、電子ファイルを構成するそれぞれの頁のコメント欄150から当該頁の表示時間の指定を受け付ける。具体的には、頁表示時間取得部211は、コメント欄150中の頁表示時間を指定するコマンド「#page(**)#」(**は数字)の有無を判定し、当該コマンドが存在する場合には、そのコマンドに含まれている数値を抽出し、頁表示時間として第何頁目であるかを示す頁の情報とともにメモリ202に一時的に記憶する。なお、頁表示時間とは、電子ファイル内のある一頁の、表示開始から、次の頁を表示するまでの表示時間のことである。例えば、図2に示すように頁表示時間を指定するコマンドが「#page(26)#」である場合には、当該頁の頁表示時間は26秒であり、図3に示すように頁表示時間を指定するコマンドが「#page(5)#」である場合には、当該頁の頁表示時間は5秒である。
テキスト取込部212は、電子ファイルを構成するそれぞれの頁のコメント欄150から当該頁の表示時に音声出力する文章の指定を受け付ける。具体的には、テキスト取込部212は、コメント欄150中に含まれる音声出力の対象となる文章が存在する場合に、当該音声出力の対象となる文章を抽出し、メモリ202に一時的に記憶する。例えば、図2、3で説明した頁の場合には、テキスト取込部212は、コメント欄150に含まれる文章「チキンカツを油から上げるタイミング。」、「調理用温度計で内部温度が50℃から80℃であることを確認してください。」、「図のように油の表面に完全に浮いた状態になったら取り出してください。」を、音声出力対象となる文章として抽出し、メモリ202に記憶する。
音声出力時間推定部213は、電子ファイルを構成するそれぞれの頁のコメント欄150から抽出された当該頁の表示時に音声出力の対象となる文章、および他の音声出力時間に影響を与えるコマンド、例えば音声出力開始時間を指定するコマンド、音声出力を一時的に待機する時間を指定するコマンドから、当該頁に設定された文章を音声出力するために必要となる時間を推測し、メモリ202に一時的に記憶する。なお、音声出力時間とは、ある頁の表示時に音声出力の対象となる文章、および他の音声出力時間に影響を与えるコマンドから推測される、当該頁に設定された文章を音声出力するために必要となる時間のことである。
具体的には、音声出力の対象となる文章の文字数から算出される時間と、音声出力時間に影響を与えるコマンドから算出される音声を出力していない待機時間の合計を、当該頁の表示時の音声出力時間とする。図2、3で説明した頁の場合、音声出力時間推定部213は、コメント欄150に設定された文章の文字数から、文章のみを再生した場合に、例えば20秒必要であると推定する。さらに、音声出力時間推定部213は、コメント欄150に待機時間を指定するコマンド「#time(2)#」が3つあることから、文章の再生以外に6秒間の待機時間が必要であると判断する。したがって、音声出力時間推定部213は、図2、3の頁の場合、音声出力時間として「26秒」が必要であると推測する。
なお、音声出力時間推定部213は、音声出力の対象となる文章の文字数から時間を算出する以外にも、音声合成部218によって実際に音声合成を行い、その結果に基づく時間と、音声を出力していない待機時間の合計を、当該頁の表示時の音声出力時間としてもよい。
判断部214は、電子ファイルを構成する頁毎に、メモリ202に記憶された頁表示時間と音声出力時間を比較し、音声出力時間が頁表示時間内に収まるか否かを判断する。例えば図2に示す頁の場合、頁表示時間と音声出力時間はともに26秒間であるから、音声出力時間は頁表示時間内に収まっていると判断する。一方、図3に示す頁の場合、頁表示時間は5秒間であるのに対して音声出力時間は26秒間であるから、音声出力時間が頁表示時間を超過していると判断する。
通知部215は、判断部214によってある頁の音声出力時間が当該頁の表示時間よりも長くなると判断された場合に、その旨を通知する。具体的には、通知部215は、音声出力時間が当該頁の表示時間よりも長い頁の情報を通知する通知画像を生成するよう表示制御部216に指示する。なお、通知部215は、反対に、音声出力時間が当該頁の表示時間内に収まる頁の情報を通知するように表示制御部216に指示してもよい。
表示制御部216は、ディスプレイ205に表示するための画像を生成する。
調整部217は、利用者の指示に応じ、電子ファイルの任意の頁の表示時間と音声出力時間のいずれかあるいはそれらの両方を調整する。具体的には、利用者が入力インタフェース206を操作してある頁の表示時間の調整を指示した場合に、調整部217は、当該頁の表示時間を、少なくとも当該頁に設定された文章から推測される音声出力時間に再設定する。例えば、調整部217は、電子ファイルのコメント欄150に含まれるコマンド「#page(**)#」に含まれる数値を、当該頁の表示時に音声出力の対象となる文章、および他の音声出力時間に影響を与えるコマンド、例えば「#time(**)#」といったコマンドから推測される音声出力の時間に設定する。
調整部217は、さらに、利用者によって任意の頁の音声出力時間を調整することが選択された場合に、当該頁の音声出力時間を調整する。具体的には、利用者が入力インタフェース206を操作して頁の音声出力時間の調整を指示した場合に、調整部217は、当該頁のコメント欄150に設定された文章の内容を変更する。あるいは、調整部217は、当該頁のコメント欄150に設定された文章から音声合成される音声の速度を調整する。
音声合成部218は、電子ファイルのコメント欄150からテキスト取込部212によって抽出された文章に基づいて音声を合成し、音声データをメモリ202に一時的に記憶する。
再生部219は、音声合成部218によって生成された音声データをスピーカ207に出力する。
《処理ついての説明》
次に、図5~図7を参照し、本実施形態の情報処理装置20における処理を説明する。なお、図5は、本実施形態における情報処理装置20における処理の流れを示すフローチャートである。
図5のステップS401において、判断部214は、処理開始頁を設定する。通常は、電子ファイルの第1頁目を処理開始頁とする。つまり処理頁番号n=1としてメモリ202に記憶する。ステップS402において、頁表示時間取得部211は、電子ファイルの第n頁目のコメント欄150から当該頁の表示時間を抽出し、メモリ202に一時的に記憶する。
ステップS403において、テキスト取込部212は、電子ファイルの第n頁目のコメント欄150中に含まれる音声出力の対象となる文章を抽出し、メモリ202に一時的に記憶する。
ステップS404において、音声出力時間推定部213は、電子ファイルの第n頁目のコメント欄150から抽出された、当該頁の表示時に音声出力の対象となる文章、および他の音声出力時間に影響を与えるコマンドから、当該頁に設定された文章を音声出力するために必要となる時間を推測し、メモリ202に一時的に記憶する。
ステップS405において、判断部214は、上記ステップS402において抽出された電子ファイルの第n頁目の頁表示時間と上記ステップS404において推測された音声出力時間とを比較する。判断部214により、当該頁の音声出力時間が頁表示時間を超過すると判断された場合(例えば、図3において説明した頁のように、音声出力時間(26秒間)が頁表示時間(5秒間)を超過しているような場合)には、ステップS406に進み、当該頁の音声出力時間が頁表示時間以内であると判断された場合(例えば、図2において説明した頁のように、音声出力時間(26秒間)が頁表示時間(26秒間)以内の場合)には、ステップS410に進む。
ステップS406において、通知部215は、音声出力時間が当該頁の頁表示時間よりも長いと判断された当該第n頁目の情報を通知する通知画像を生成するよう表示制御部216に指示し、表示制御部216は、図6に示すような確認ポップアップウィンドウ500を生成し、ディスプレイ205に表示する。なお、図6は、音声出力時間が当該頁の頁表示時間よりも長いと判断された当該頁の情報を通知する確認ポップアップウィンドウ500の一例を示す図である。確認ポップアップウィンドウ500は、「第n(nは頁番号)頁目は音声出力時間が頁表示時間を超えています。」という通知メッセージ510、「頁表示時間を変更:頁表示時間を音声出力時間に合わせます。5秒⇒26秒」、「音声出力時間を変更:話速を変更して、音声出力時間を短くします。」といった説明文520、「頁表示時間を変更」、「音声出力時間を変更」、「キャンセル」といった選択ボタン530により構成される。
ステップS407において、調整部217は、利用者が上記ステップS406において表示された確認ポップアップウィンドウ500の選択ボタン530のうち、どれを選択したかを判断する。利用者が「頁表示時間を変更」ボタンを選択した場合には、ステップS408に進み、「音声出力時間を変更」ボタンを選択した場合には、ステップS409に進み、「キャンセル」ボタンを選択した場合にはステップS410に進む。
ステップS408において、調整部217は、当該頁の頁表示時間を、少なくともステップS404において推測された当該頁の音声出力時間に再設定する。具体的には、電子ファイルの当該頁のコメント欄150の頁表示時間を指定するコマンドに含まれている数値を、上記推測された音声出力時間の数値に修正する。そして、通知部215は、当該変更された当該頁の頁表示時間を通知するよう表示制御部216に指示し、表示制御部216は当該指示に基づいて当該頁の再設定後の頁表示時間をディスプレイ205に表示する。処理はその後ステップS410に進む。
ステップS409において、調整部217は、当該頁の音声出力時間を変更する。具体的には、電子ファイルの当該頁のコメント欄150に含まれる音声出力対象の文章の内容を変更するか、あるいは当該音声出力対象の文章から音声合成される音声の速度を調整する。
音声出力対象の文章の内容を変更する場合、調整部217は、電子ファイルの当該頁のコメント欄150に含まれる音声出力対象の文章の内容を自動で短くしてもよいし、利用者に対して文章の再入力ウィンドウをディスプレイ205に表示させるよう表示制御部216に指示し、利用者の手動入力により内容を短くしてもよい。
音声出力対象の文章から音声合成される音声の速度を調整する場合、調整部217は、図7に示すような話速変更ウィンドウ600を生成してディスプレイ205に表示するよう表示制御部216に指示する。なお、図7は、音声出力対象の文章から音声合成される音声の速度を調整する場合に表示される話速変更ウィンドウ600の一例を示す図である。図7の話速変更ウィンドウ600は、「話速を変更します。(n/32頁)」といった通知メッセージ610、試聴ボタン620、話速変更スライド630、音声出力時間入力欄640、頁表示時間表示欄650、「変更する」、「キャンセル」といった選択ボタン660により構成される。
通知メッセージ610には、話速を変更する対象の頁が電子ファイルの何頁目に該当するのかを示す頁番号が含まれており、図7の場合には「n/32頁」の表示がこれに相当する。試聴ボタン620は、利用者が指定した話速、あるいは音声出力時間で当該頁の音声出力対象の文章を音声合成して再生するためのものであり、利用者が試聴ボタン620を選択すると、音声合成部218は、電子ファイルの当該頁のコメント欄150から抽出された音声出力対象の文章、および設定された話速、あるいは設定された音声出力時間に基づいて音声合成し、再生部219によってスピーカ207から出力する。なお、話速とは、音声合成によって合成される音声の速さのことである。
話速変更スライダ630は、音声出力対象の文章を音声合成する際の話速、あるいは当該文章を音声合成して出力する際の音声出力時間を動的に調整可能な状態で表示するためのものである。利用者は話速変更スライダ630のスライダを「遅い」と「速い」の間で自由に移動させることができる。このスライダを「遅い」に側に移動させると、調整部217は、音声出力対象の文章がよりゆっくり再生されるような話速に設定し、反対に「速い」側に移動させると、より速く再生されるような話速に設定する。なお、スライダは話速「遅い」と「速い」の間で連続的に自由に移動させることできるが、幾つかの目盛りを設け、その目盛りに沿って段階的に移動できるようにしてもよい。また、話速変更スライダ630を、音声出力時間を変更するためのスライダとして使用しても同様の結果が得られるが、この場合、スライダは音声出力時間「長い」と「短い」の間で自由に、あるいは段階的に移動可能とされる。
利用者は、上述の話速変更スライダ630のスライダを移動させることによって音声出力対象の文章の話速や音声出力時間を変更できるが、音声出力時間入力欄640に変更後の音声出力時間を直接入力することによっても、話速や音声出力時間を変更できる。利用者は、頁表示時間表示欄に表示された、当該頁に設定されている頁表示時間を参照しながら適当な値、例えば頁表示時間の数値よりも小さな数値を、入力インタフェース206を操作して入力する。このとき、入力された数値に合わせて話速変更スライダ630が自動的に移動するようにしてもよい。また、利用者が話速変更スライダ630を移動させることによって話速を変更した場合には、変更後の話速で音声出力対象の文章が音声出力された場合の音声出力時間が音声出力時間推定部213により計算され、音声出力時間入力欄640に表示されるようにしてもよい。
利用者が選択ボタン660のうち「変更する」ボタンを選択した場合、調整部217は、上記話速変更ウィンドウ600において変更された話速、音声出力時間で当該音声出力対象の文章を出力するように設定し、ステップS410に進む。一方、選択ボタン660のうち「キャンセル」ボタンを選択した場合、調整部217は話速、音声出力時間に対する設定変更を加えず、ステップS410に進む。
ステップS410において、判断部214は、電子ファイルに含まれるすべての頁についての処理を終了したか否かを判断し、すべての頁についての処理が終了している場合には処理を終了する。まだすべての頁についての処理が終了していないと判断された場合には、ステップS411に進み、処理対象を次の頁に設定し(つまり処理対象の頁番号をn=n+1とし)、ステップS402の処理に戻り、すべての頁について、音声出力時間が頁表示時間よりも長くなる不整合が生じていないか確認し、不整合が存在する頁については利用者の指示により頁表示時間と音声出力時間のいずれかあるいは両方を調整し、処理を終了する。
なお、上記の例では、電子ファイルの一頁毎に、逐次音声出力時間が頁表示時間よりも長くなる不整合が生じていないか判断し、不整合が存在する頁についてはその都度利用者に対して頁表示時間と音声出力時間のいずれかを調整可能であることを通知した。しかしながら、本発明は、上記の例に限定されず、電子ファイルのすべての頁について、それぞれの頁の音声出力対象の文章から推測される音声出力時間が当該頁の頁表示時間がよりも長くなる不整合が生じていないかを先に判断し、その後、どの頁に不整合が存在するかが利用者にわかるように一覧表示するようにしてもよい。
図8は、電子ファイルのすべて頁について不整合の有無があるか否かを先に判断する場合の処理を示すフローチャートである。図8のステップS701からステップS705までの処理は、図5において説明したステップS401からステップS405までの処理と実質的に同一であるので、重複する部分の説明を省略し、以下の説明においては、ステップS705以降の処理について説明する。
ステップS705において、判断部214により、第n頁の音声出力時間が頁表示時間を超えると判断された場合(例えば、図3において説明した頁のように、音声出力時間(26秒間)が頁表示時間(5秒間)を超過しているような場合)には、ステップS706に進み、当該第n頁の音声出力時間が頁表示時間以内であると判断された場合(例えば、図2において説明した頁のように、音声出力時間(26秒間)が頁表示時間(26秒間)以内の場合)には、ステップS707に進む。
ステップS706において、判断部214は、音声出力時間が当該頁の頁表示時間がよりも長くなる不整合の存在する頁の情報をメモリ202に記憶する。
ステップS707において、判断部214は、電子ファイルに含まれるすべての頁について、音声出力時間と頁表示時間との長さを比較する処理を終了したか否かを判断し、すべての頁についての処理が終了している場合にはステップS709に進み、まだ比較処理を行っていない頁がある場合にはステップS708に進む。
ステップS708において、判断部214は、処理対象を次の頁に設定し(つまり処理対象の頁番号をn=n+1とし)、ステップS702に戻り、すべての頁について音声出力時間が頁表示時間内に収まっているか、あるいは音声出力時間が頁表示時間を超過する不整合が存在しているかを判断する。
すべての頁について、音声出力時間が頁表示時間内に収まっているか、あるいは音声出力時間が頁表示時間を超過する不整合が存在しているかを判断し終えると、ステップS709において、通知部215は、メモリ202に記憶された、音声出力時間が当該頁の頁表示時間よりも長いと判断された当該頁の情報に基づいて、音声出力時間が当該頁の頁表示時間よりも長い不整合が存在する頁を、他の頁と異なる表示態様で通知する通知画像を生成するよう表示制御部216に指示する。表示制御部216はその指示に基づいて、図9に示すような確認ポップアップウィンドウ800を生成してディスプレイ205に表示する。
図9は、音声出力時間が当該頁の頁表示時間よりも長いと判断された当該頁の情報をサムネイル表示で通知する確認ポップアップウィンドウ800の一例を示す図である。確認ポップアップウィンドウ800は、「音声出力時間が頁表示時間を超えている頁を確認してください。」といった確認メッセージ810、図2で説明した、電子ファイルに含まれるそれぞれの頁の表示用画像100がサムネイル画像として一覧表示された頁一覧表示欄820、「頁表示時間を変更」、「音声出力時間を変更」、「終了」といった選択ボタン830により構成される。
頁一覧表示欄820は電子ファイルに含まれるそれぞれの頁の表示用画像100がサムネイル表示されており、図9では、3頁分の表示用画像に相当するサムネイル画像821~823が表示されている。頁一覧表示欄820下部には左右方向にスクロールバー824が設けられており、つまみ825を移動させると、それに応じて頁一覧表示欄820にサムネイル表示される頁が移動しつつ遷移する。さらに、頁一覧表示欄820では、音声出力時間が頁表示時間を超えている頁とそうでない頁とが利用者に識別可能なように表示される。具体的には音声出力時間が頁表示時間を超えている頁のサムネイル画像の上に赤丸826を表示する。利用者はこの赤丸826の有無により、その頁の音声出力時間が頁表示時間を超えているか否かを把握する。なお、どの頁の音声出力時間が頁表示時間を超えているかを表示する方法は赤丸表示だけに限定されず、他の方法、例えば、該当する頁を他の頁よりも大きく表示したり、該当する頁がその他の頁よりも鮮明に表示されたりするような方法であってもよい。
さらに、図9においては、頁一覧表示欄820に表示されている複数のサムネイル画像821~823のうち、変更対象として選択されているサムネイル画像が強調表示されている。図8のステップS710において、判断部214は、利用者により図9の確認ポップアップウィンドウ800の選択ボタン830のうち、「終了」ボタンが選択されたか否かを判断する。判断部214が、「終了」ボタンが選択されたと判断した場合、すべての処理を終了する旨を表示し、処理を終了する。
「終了」ボタンが選択されていないと判断された場合、ステップS711に進み、判断部214は、利用者が選択ボタン830のうち、「頁表示時間を変更」ボタンと「音声出力時間を変更」のどちらを選択したかを判断する。利用者が「頁表示時間を変更」ボタンを選択したと判断された場合は、ステップS712に進み、「音声出力時間を変更」ボタンを選択したと判断された場合は、ステップS713に進む。
ステップS712において、調整部217は、確認ポップアップウィンドウ800の表示時に変更対象として選択されているサムネイル画像に対応する頁について、図10に示すような変更確認ポップアップウィンドウ900を生成してディスプレイ205に表示するよう表示制御部216に指示する。
図10は、音声出力時間を変更するための変更確認ポップアップウィンドウ900の一例を示す図である。変更確認ポップアップウィンドウ900は、「第n(nは頁番号)頁目は音声出力時間が頁表示時間を超えています。」という通知メッセージ910、「頁表示時間を音声出力時間に合わせます。5秒⇒26秒。よろしいですか?」といった確認メッセージ920、および「頁表示時間を変更」、「キャンセル」といった選択ボタン930により構成される。
図10の変更確認ポップアップウィンドウ900の選択ボタン930のうち、利用者が「頁表示時間を変更する」ボタンを選択した場合、調整部217は、当該頁の頁表示時間を、少なくともステップS704において推測された当該頁の音声出力時間に再設定する。具体的には、電子ファイルの当該頁のコメント欄150の頁表示時間を指定するコマンドに含まれている数値を、上記ステップS704において推測された音声出力時間の数値に修正する。そして、通知部215は、当該変更された当該頁の頁表示時間を通知するよう表示制御部216に指示し、表示制御部216は当該指示に基づいて当該頁の再設定後の頁表示時間をディスプレイ205に表示し、ステップS709に戻る。なお、ステップS709に戻った際に、当該変更後の頁表示時間が当該頁の音声出力時間以上となっているため、赤丸826を消去し、当該頁に音声出力時間が頁表示時間を超過する不整合は存在しないことを利用者が認識できるようにする。
図10の変更確認ポップアップウィンドウ900の選択ボタン930のうち、利用者が「キャンセル」ボタンを選択した場合、頁表示時間に対する変更は行わず、ステップS709に戻る。
図9の選択ボタン830のうち、利用者が「音声出力時間を変更」ボタンを選択した場合、ステップS713において、調整部217は、図7に示したのと同様の話速変更ウィンドウ600を生成してディスプレイ205に表示するよう表示制御部216に指示する。図7の話速変更ウィンドウ600については既に説明したので詳細な説明を省略するが、話速を変更する対象の頁が電子ファイルの何頁目に該当するかを示す通知メッセージ610、および当該頁に設定されている音声出力対象の音声出力時間を動的に調整可能とする話速変更スライダ630、音声出力時間を直接入力指定可能な音声出力時間入力欄640などを含む。
利用者が話速変更スライダ630を動かすことによって、あるいは音声出力時間入力欄640に数値を直接入力することによって音声出力時間を調整し、選択ボタン660のうち、「変更する」ボタンを選択すると、調整部217は、この話速変更ウィンドウ600において変更された話速、音声出力時間で当該音声出力対象の文章を音声出力するように設定し、ステップS709に戻る。なお、ステップS709に戻った際に、当該変更後の音声出力時間が当該頁の頁表示時間以内となっているため、赤丸826を消去し、当該頁に音声出力時間が頁表示時間を超過する不整合は存在しないことを利用者が認識できるようにする。
図7の話速変更ウィンドウ600の選択ボタン660のうち、利用者が「キャンセル」ボタンを選択した場合、頁表示時間に対する変更は行わず、ステップS709に戻る。
なお、上述の実施形態においては、電子ファイルは情報処理装置20に記憶されており、情報処理装置20において、電子ファイル内の各頁の音声出力時間が頁表示時間を超過する不整合があるか否かを判断していた。しかしながら本発明は、上記の例に限定されず、例えば、当該電子ファイルはロボットに記憶され、ロボットに有線、あるいは無線で接続された情報処理装置において、上述の処理を行うようにしてもよい。
20 情報処理装置
100 表示用画像
110 プレゼンテーション用文章
120 プレゼンテーション用画像
150 コメント欄
201 制御用マイクロプロセッサ
202 メモリ
203 記憶装置
204 通信インタフェース
205 ディスプレイ
206 入力インタフェース
207 スピーカ
208 制御用バス
211 頁表示時間取得部
212 テキスト取込部
213 音声出力時間推定部
214 判断部
215 通知部
216 表示制御部
217 調整部
218 音声合成部
219 再生部

Claims (14)

  1. 複数の頁が連続的に切り替わるように表示される電子ファイルのそれぞれの頁に対応付けられた非表示のコメント欄に記述されたコマンドから当該頁の表示時間を抽出して受け付ける第1受付手段と、
    前記電子ファイルのそれぞれの頁の前記コメント欄に記述された前記コマンドから当該頁の表示時に音声出力する文章を抽出して受け付ける第2受付手段と、
    前記第2受付手段により受け付けられた文章から推測される音声出力時間が前記第1受付手段により受け付けられた当該頁の表示時間よりも長い場合に、その旨を通知する通知手段と、を備える情報処理装置。
  2. 前記推測される音声出力時間は、前記電子ファイルのそれぞれの頁の前記コメント欄に記述された、音声出力の対象となる文章と、音声出力時間に影響を与えるコマンドとから推測される請求項1記載の情報処理装置。
  3. 前記通知手段は、前記音声出力時間が前記頁の表示時間よりも長くなる頁を通知する請求項1または2記載の情報処理装置。
  4. 前記通知手段は、前記音声出力時間が前記頁の表示時間よりも長くなる頁毎に前記頁の表示時間あるいは音声出力時間のいずれかを調整可能な状態で通知する請求項記載の情報処理装置。
  5. 利用者により任意の頁の表示時間を調整することが選択された場合に、当該頁の表示時間を調整する調整手段を備える請求項記載の情報処理装置。
  6. 前記調整手段は、前記頁の表示時間を、少なくとも当該頁に設定された文章から推測される音声出力時間に再設定する請求項記載の情報処理装置。
  7. 前記通知手段は、前記頁の調整後の表示時間を通知する請求項または記載の情報処理装置。
  8. 利用者により任意の頁の音声出力時間を調整することが選択された場合に、当該頁の音声出力時間を調整する調整手段を備える請求項記載の情報処理装置。
  9. 前記調整手段は、前記頁に設定された文章の内容を変更する請求項記載の情報処理装置。
  10. 前記調整手段は、前記頁に設定された文章から音声合成される音声の速度を調整する請求項記載の情報処理装置。
  11. 前記頁に設定された文章から推測される音声出力時間を動的に調整可能な状態で表示するよう制御する表示制御手段を備える請求項から10いずれかに記載の情報処理装置。
  12. 前記表示制御手段は、前記頁に設定された表示時間を表示するよう制御する請求項11記載の情報処理装置。
  13. 設定された音声出力時間で前記頁に設定された文章を音声合成して再生する再生手段を備える請求項11または12記載の情報処理装置。
  14. 情報処理装置を構成するコンピュータに、
    複数の頁が連続的に切り替わるように表示される電子ファイルのそれぞれの頁に対応付けられた非表示のコメント欄に記述されたコマンドから当該頁の表示時間を抽出して受け付ける処理と、
    前記電子ファイルのそれぞれの頁の前記コメント欄に記述された前記コマンドから当該頁の表示時に音声出力する文章を抽出して受け付ける処理と、
    受け付けられた文章から推測される音声出力時間が当該頁の表示時間よりも長い場合に、その旨を通知する処理と、を実行させるプログラム。
JP2018173844A 2018-09-18 2018-09-18 情報処理装置およびプログラム Active JP7215033B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018173844A JP7215033B2 (ja) 2018-09-18 2018-09-18 情報処理装置およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018173844A JP7215033B2 (ja) 2018-09-18 2018-09-18 情報処理装置およびプログラム

Publications (2)

Publication Number Publication Date
JP2020046842A JP2020046842A (ja) 2020-03-26
JP7215033B2 true JP7215033B2 (ja) 2023-01-31

Family

ID=69901497

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018173844A Active JP7215033B2 (ja) 2018-09-18 2018-09-18 情報処理装置およびプログラム

Country Status (1)

Country Link
JP (1) JP7215033B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7048141B1 (ja) * 2022-01-05 2022-04-05 株式会社Airobo プログラム、ファイル生成方法、情報処理装置、及び情報処理システム
JP7307295B1 (ja) * 2023-05-01 2023-07-11 那雄 友永 コンテンツ提供システム、コンテンツ提供方法、及びコンテンツ提供プログラム

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001005476A (ja) 1999-06-22 2001-01-12 Matsushita Electric Ind Co Ltd プレゼンテーション装置
JP2011059412A (ja) 2009-09-10 2011-03-24 Fujitsu Ltd 合成音声テキスト入力装置及びプログラム
JP2016045969A (ja) 2015-09-18 2016-04-04 富士ゼロックス株式会社 表示制御装置、端末装置及びプログラム
US20160284341A1 (en) 2015-03-27 2016-09-29 Takahiro Hirakawa Computer-implemented method, device and system for converting text data into speech data
JP2018078402A (ja) 2016-11-08 2018-05-17 株式会社シフトワン コンテンツ制作装置、及び音声付コンテンツ制作システム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001005476A (ja) 1999-06-22 2001-01-12 Matsushita Electric Ind Co Ltd プレゼンテーション装置
JP2011059412A (ja) 2009-09-10 2011-03-24 Fujitsu Ltd 合成音声テキスト入力装置及びプログラム
US20160284341A1 (en) 2015-03-27 2016-09-29 Takahiro Hirakawa Computer-implemented method, device and system for converting text data into speech data
JP2016045969A (ja) 2015-09-18 2016-04-04 富士ゼロックス株式会社 表示制御装置、端末装置及びプログラム
JP2018078402A (ja) 2016-11-08 2018-05-17 株式会社シフトワン コンテンツ制作装置、及び音声付コンテンツ制作システム

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
プレゼン型コンテンツ作成ソフトSTORM Xe(クロスィ),ロゴスウェア株式会社,<検索日:2022年12月9日> <URL: https://suite.logosware.com/storm-maker/>
リアルナレーターズ3(RealNarrators3),株式会社スカイフィッシュ,<検索日:2022年12月9日> <URL: https://www.skyfish.co.jp/service/realnarrators3.html>

Also Published As

Publication number Publication date
JP2020046842A (ja) 2020-03-26

Similar Documents

Publication Publication Date Title
US9111582B2 (en) Methods and systems for previewing content with a dynamic tag cloud
US8154549B2 (en) Data display apparatus, data display method and data display program
US8977980B2 (en) Display scrolling method, display apparatus, and recording medium having display program recorded thereon
WO2022143924A1 (zh) 视频生成方法、装置、电子设备和存储介质
US20080235205A1 (en) Database Search Results User Interface
KR20070045274A (ko) 미디어 플레이리스트와 브라우징 이력을 통합하는 방법 및시스템
JP7215033B2 (ja) 情報処理装置およびプログラム
US20210274106A1 (en) Video processing method, apparatus, and device and storage medium
US20180014074A1 (en) Method and Apparatus for Playing a Multimedia File From a Re-Positioned Playing Point
US8717286B2 (en) Information processing apparatus, processing method thereof, and computer-readable storage medium
KR20090003533A (ko) 사용자 손수 저작물의 생성과 운용을 위한 방법 및 시스템
JP6765558B1 (ja) コンテンツ配信装置、コンテンツ配信方法、コンテンツ配信システム、および、コンテンツ配信プログラム
US20150199171A1 (en) Handwritten document processing apparatus and method
KR102353797B1 (ko) 영상 컨텐츠에 대한 합성음 실시간 생성에 기반한 컨텐츠 편집 지원 방법 및 시스템
JP2018180519A (ja) 音声認識誤り修正支援装置およびそのプログラム
US11128927B2 (en) Content providing server, content providing terminal, and content providing method
JP2021061519A (ja) 情報処理装置およびプログラム
CN110727411A (zh) 一种音频信号的处理方法、装置、存储介质以及终端
GB2525841A (en) Image modification
US10885943B1 (en) Multimedia authoring apparatus with synchronized motion and voice feature and method for the same
KR102488623B1 (ko) 영상 컨텐츠에 대한 합성음 실시간 생성에 기반한 컨텐츠 편집 지원 방법 및 시스템
JP2020057072A (ja) 編集プログラム、編集方法および編集装置
CN112424853A (zh) 以对文本文档的音频回放进行补充的视觉内容为特点的文本到语音界面
US20240170024A1 (en) Information processing apparatus, information processing method, and non-transitory computer-readable storage medium
US9817633B2 (en) Information processing apparatus and information processing method

Legal Events

Date Code Title Description
RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20201102

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210906

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220629

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220726

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220914

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20221220

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230102

R150 Certificate of patent or registration of utility model

Ref document number: 7215033

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150