JP5243365B2 - コンテンツ生成装置,コンテンツ生成方法およびコンテンツ生成プログラム - Google Patents

コンテンツ生成装置,コンテンツ生成方法およびコンテンツ生成プログラム Download PDF

Info

Publication number
JP5243365B2
JP5243365B2 JP2009185434A JP2009185434A JP5243365B2 JP 5243365 B2 JP5243365 B2 JP 5243365B2 JP 2009185434 A JP2009185434 A JP 2009185434A JP 2009185434 A JP2009185434 A JP 2009185434A JP 5243365 B2 JP5243365 B2 JP 5243365B2
Authority
JP
Japan
Prior art keywords
topic
image
video
area
lecturer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2009185434A
Other languages
English (en)
Other versions
JP2011040921A (ja
Inventor
聡 嶌田
明 小島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2009185434A priority Critical patent/JP5243365B2/ja
Publication of JP2011040921A publication Critical patent/JP2011040921A/ja
Application granted granted Critical
Publication of JP5243365B2 publication Critical patent/JP5243365B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Television Signal Processing For Recording (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は,ラーニングシステムにおいて教材となるコンテンツを,講師が板書やプロジェクタを用いて講演を行っている様子をカメラで撮影したビデオから自動生成するコンテンツ生成装置や方法に関する。
講演の様子を撮影した講演ビデオから学習に適したコンテンツを生成するためには,講演ビデオからトピック区間を自動検出して,興味ある映像シーンを効率的に閲覧できるようにすることや,重要な情報を少ないデータ量で提示することが重要である。
講演ビデオからのトピック分割を実現する従来技術として,講演用の特定のソフトウェアで講演を行うことを前提として,パソコン(PC)でスライド操作を行うイベントを特別なソフトウェアで検出し,スライド操作に基づいて講演映像をトピックに分割する方法(非特許文献1参照),講師に各種センサを装着し,講師の動作や発話状態などから講義状態を判別することで,詳細にトピック分割する方法(非特許文献2参照)がある。
また,重要な情報を少ないデータ量で提示するコンテンツを自動生成する方法として,黒板全体が撮影できるように複数のカメラを設置し,それらのカメラ映像を統合することで黒板映像を合成するとともに,講師の領域を抽出して講師映像を生成し,黒板映像の文字や図形をベクトル化することでデータ圧縮して,圧縮した黒板映像と講師映像を同期再生する方法がある(非特許文献3参照)。
山本大介,増田智樹,大平茂輝,長尾確,「映像アノテーションを獲得・管理する講義コンテンツ共有システム」,情報処理学会第70回全国大会,2008. 丸谷宜史,杉本吉隆,角所考,美濃導彦,「講師行動の統計的性質に基づいた講義撮影のための講義状況の認識」,電子情報通信学会論文誌 Vol.J90-D,No.10 ,pp.2775-2786,2007. 米川輝,立花綱治,相田達也,若原裕範,岩月正見,「通常教室における講義のデジタルコンテンツ自動作成システムの試作」,メディア教育研究Vol. 1,No. 2 ,pp.83-90,2005.
非特許文献1に記載の従来技術は,講演を行う環境が限定されていること,非特許文献2に記載の従来技術は,特別なセンサを用いていることから適用範囲が限定されることが問題である。また,非特許文献3に記載の従来技術は,黒板ではなくプロジェクタなどを用いて予め用意した資料を講師が提示しながら講演するようなケースに適用することが困難である。
本発明は,これらの問題を解決し,特定の講演方法に限定したり,特別な映像撮影システムやセンサなどを用いたりすることなく,一般的なプロジェクタや黒板などがある環境で講演を行っている様子をカメラ1台で撮影して得られる講演ビデオの画像情報と音声から,重要な情報を少ないデータ量で提示するとともに,利用者が閲覧したいトピックに応じて効率的にアクセスできるコンテンツを自動生成する方法を提供することを目的とする。
本発明では,上記目的を達成するために,1台のカメラで撮影した講演ビデオの画像情報と音声から重要な情報を自動抽出し,それらを効率的に統合してコンテンツを生成する。例えば,講義ビデオから学習教材を作成するような場合,その講義ビデオからスクリーン領域と講師領域とを切り出して,2つを合成して教材映像とする(図3参照)。講義のトピック区間は,スクリーンの切り替わりや講師の移動などで決める。そのトピック区間を映像再生時のインデクスとして提示し,図4で示すようにトピック区間を選択できるようにしておく。音声処理からは,発話連続区間をサブトピック区間として抽出し,サブトピック区間に対してコメントを入力できるようにする。
詳しくは,本発明は,講師が板書またはプロジェクタを用いて講演を行っている様子を1台のカメラで撮影した講演ビデオのみからコンテンツを自動生成するコンテンツ生成装置であって,前記講演ビデオからプロジェクタで投影されたスクリーン領域の画像と,講師が撮像されている講師領域の画像とをそれぞれ抽出する画像領域抽出手段と,前記スクリーン領域の画像と前記講師領域の画像とを重畳して1つの公開用講演ビデオを合成する映像編集手段と,前記スクリーン領域または前記講師領域の画像情報から,利用者が選択する映像再生開始位置を定めるトピック開始点を検出するトピック開始点検出手段と,前記公開用講演ビデオにおける,トピック開始点から次のトピックの開始点までのトピック区間のフレーム画像から,トピック区間の内容を表すトピック画像を検出または生成するトピック画像生成手段と,前記映像編集手段,前記トピック開始点検出手段および前記トピック画像生成手段が出力する情報を統合し,前記公開用講演ビデオを再生表示するときに,トピック区間のリストと各トピックのトピック画像を提示し,利用者が選択したトピックに該当する映像を再生できるようにコンテンツを生成するコンテンツ生成手段とを備えることを特徴とする。
さらに,上記発明において,前記画像領域抽出手段は,前記講演ビデオにおける講師が板書を行っている場合には,書き込んでいる黒板領域を含む領域を講師領域として検出することを特徴とする。
また,上記発明において,前記映像編集手段は,前記スクリーン領域の画像と前記講師
領域の画像とを重畳して1つの公開用講演ビデオを合成するときに,スクリーン領域の画像情報における背景エリアを特定し,背景エリアのスペースと前記講師領域の大きさに基づいてスクリーン領域の画像に講師領域の画像を重畳する位置を動的に決定することを特徴とする。
また,上記発明において,前記講演ビデオに含む音声データから,講師が連続して発話した区間の開始時刻をサブトピック開始点として検出するサブトピック区間検出手段と,前記公開用講演ビデオを再生表示するときに,前記サブトピック開始点と対応付けられた講師発話コメントを提示し,利用者が選択した講師発話コメントに該当するサブトピック開始点からの公開用講演ビデオの再生制御,または,前記講師発話コメントに対して入力された返信コメントを登録する手段とを,さらに備えることを特徴とする。
上記のように本発明によれば,講演ビデオの画像情報と音声から重要な情報を自動抽出し,それらを効率的に統合してコンテンツを生成する手段を有するので,特定の講演方法に限定したり,特別な映像撮影システムやセンサなどを用いたりすることなく,一般的なプロジェクタや黒板などがある環境で講演を行っている様子をカメラ1 台で撮影して得られる講演ビデオの画像情報と音声から,重要な情報を少ないデータ量で提示するとともに,利用者が閲覧したいトピックに対応した映像シーンを再生するので講演映像を効率的に視聴できるコンテンツを自動生成することができる。さらに,講師の発話区間に対応してコメントの登録ができるので,講師の発話内容に基づいた意見交換を容易に行うことができるようになる。
本発明の一実施例における装置の構成例を示す図である。 本発明の実施例に係るコンテンツ生成処理フローチャートである。 本発明の実施例での入力映像と処理過程映像の例を示す図である。 本発明の実施例でのコンテンツ生成の例を示す図である。 本発明の実施例でのコンテンツ生成の他の例を示す図である。
以下,本発明の実施の形態を図面を用いて説明する。図1は,本発明の一実施例における装置の構成例を示す図である。コンテンツ生成装置10は,映像取得部11,画像領域抽出部12,映像編集部13,トピック開始点検出部14,講師連続発話区間検出部15,トピック画像生成部16,コンテンツ生成部17,コンテンツ再生制御部18,コメント処理部19を備える。これらは,CPUやメモリ等のハードウェアと,ソフトウェアプログラム等によって実現される。また,コンテンツ生成装置10は,レジスタやメモリや外部記憶装置などの記憶装置で構成される領域映像記憶部21,公開用講演ビデオ記憶部22,トピック区間記憶部23,サブトピック区間記憶部24,トピック画像記憶部25,コメント記憶部26を備える。なお,コンテンツ再生制御部18,コメント処理部19,コメント記憶部26は,コンテンツ生成装置10とは別の装置として構成することもできる。
映像取得部11は,講師が板書やプロジェクトを用いて講演を行っている様子をカメラで撮影した講演ビデオを取得し,取得した講演ビデオを画像領域抽出部12と講師連続発話区間検出部15にそれぞれ出力する。
画像領域抽出部12は,映像取得部11より受け取った講演ビデオから,プロジェクタで投影されたスクリーン領域と講師領域とをそれぞれ抽出し,抽出した各領域の画像を映像編集部13とトピック開始点検出部14にそれぞれ出力するため,領域映像記憶部21に格納する。
スクリーン領域抽出の実施例として,プロジェクタ用のスクリーンには視認性を向上させるために枠をつけることが多いので,画像から直線検出を行い,矩形の候補を求め,予め設定しておいた大きさの許容範囲内の矩形をスクリーン領域とする方法が有効である。講師が用意した資料を液晶モニタなどで表示する場合にも一般的には矩形に基づいてスクリーン領域を検出することができる。さらに,斜め方向から講演ビデオを撮影した場合にはスクリーン領域の画像が歪んでいるので,検出したスクリーンの矩形で向かい合う辺が平行になるようにスクリーン領域にアフィン変換を行う処理を追加すれば見やすい映像を提供することが可能となる。
また,講師領域の抽出は,顔領域の検出や背景画像との差分などで実現できる。さらに,講師が板書を行っている場合には,黒板領域を含む領域を講師領域として検出するようにしておけば,公開用講演ビデオを視聴したときに黒板に記載している内容が分かるようになる。板書を行っているかどうかの判別は,講師のシルエットの形状変化や手に対応する肌色領域の動きベクトルなどを特徴量として,学習アルゴリズムにより動作認識を行う方法などで実現できる。
映像編集部13は,画像領域抽出部12から受け取ったスクリーン領域と講師領域の同じ時刻の画像を重畳して1つの公開用講演ビデオを合成する。その合成したビデオをトピック画像生成部16とコンテンツ生成部17へ引き渡すため,公開用講演ビデオ記憶部22に格納する。スクリーン領域と講師領域の合成は,予め設定しておいた位置関係になるように配置する方法や,スクリーン領域の画像情報における背景エリアを特定し,背景エリアのスペースと前記講師領域の大きさに基づいてスクリーン領域に講師領域を重畳する位置を動的に決定する方法が有効である。
トピック開始点検出部14は,画像領域抽出部12から受け取ったスクリーン領域または講師領域の画像情報からトピック開始点を検出し,検出したトピック開始点をトピック画像生成部16とコンテンツ生成部17に引き渡すため,トピック区間記憶部23に格納する。
トピック開始点の検出は,スライドを切り替えたところをトピックの開始点として,スクリーン領域の画像内容が時間的に変化した点を検出することで実現できる。ここで,同一スライドの提示時間が設定値より短い場合には,トピック開始点として検出しないことや,同一のスライドの情報を一度に提示しないで,最初は一部のみを提示しておいて,順次追加する形態で提示された場合には,順次追加された時点をサブトピック開始点として検出し,スライド全体が変化した点をトピック開始点として検出する方法,スクリーン領域の画像内容が時間的に変化した時刻の近傍での講師の発話開始点をトピック開始点とする方法などを導入すればより精度よく検出できる。さらに,講師の立つ位置が変化したところをトピック開始点として講師領域の位置が変化したところを検出する方法や,講師の動きが大きい時間帯と小さい時間帯との分岐をトピック開始点として,講師領域内の画像特徴点の動きベクトルの大きさによりトピック開始点を検出する方法なども有効である。なお,トピックを階層的に扱う場合には,下位のサブトピックを講師連続発話区間検出部15で検出するサブトピックと同様に管理すればよい。
講師連続発話区間検出部15は,映像取得部11から講演ビデオを受け取ると,講師が時間的に連続して発声している区間を検出し,連続して発話した区間の開始時刻をサブトピック開始点として,サブトピック区間の情報をサブトピック区間記憶部24に格納し,コンテンツ生成部17に出力する。
トピック画像生成部16は,映像編集部13から公開用講演ビデオ記憶部22に格納された公開用講演ビデオを受け取り,トピック開始点検出部14からトピック区間記憶部23に格納されたトピック区間を受け取ると,トピック区間の内容をよく表す画像をトピック画像として検出し,各トピック区間から検出したトピック画像をトピック画像記憶部25に格納してコンテンツ生成部17に出力する。トピック画像は,映像編集部13から受け取った公開用講演ビデオのトピック開始点におけるフレーム画像とする方法や,正面顔を検出してトピック区間内で講師が正面を向いているときのフレーム画像とする方法が有効である。また,従来技術として,映像シーンの代表画像を選択もしくは生成する各種の方法が知られているので,そのような従来技術を用いて,トピック区間の代表画像を選択・生成し,それをトピック画像としてもよい。
コンテンツ生成部17は,映像編集部13から公開用講演ビデオ記憶部22に格納された公開用講演ビデオを受け取り,トピック開始点検出部14からトピック区間記憶部23に格納されたトピック区間を受け取り,トピック画像生成部16からトピック画像記憶部25に格納されたトピック画像を受け取り,講師連続発話区間検出部15からサブトピック区間記憶部24に格納されたサブトピック区間をそれぞれ受け取ると,これらの情報を統合してコンテンツを生成する。
コンテンツ再生制御部18は,コンテンツ生成部17によって生成されたコンテンツを利用者装置に再生出力する。特に,コンテンツ再生制御部18は,公開用講演ビデオのコンテンツを再生表示するときに,トピック区間のリストと各トピックのトピック画像を提示し,利用者が選択したトピックに該当する映像を再生する制御を行う。
さらに,コンテンツ再生制御部18は,コメント処理部19によって管理されている講師発話のコメントおよび利用者からのコメントに対する返信などの利用者装置への表示を,公開用講演ビデオの再生表示とともに行う。コメント記憶部26には,講師の発話区間であるサブトピックに対応する講師発話コメント(サブトピックタイトル)が自動登録され,また,利用者からのコメントに対する返信情報もコメント処理部19によって登録される。
すなわち,コンテンツ再生制御部18は,公開用講演ビデオを再生表示するときに,サブトピック開始点と対応付けた講師発話というコメントを利用者装置に出力して提示し,利用者が講師発話コメントを選択すると,該当するサブトピック開始点からの公開用講演ビデオを再生する制御を行う。また,利用者が利用者装置の画面において講師発話コメントに返信コメントを書き込むと,その入力情報がコメント処理部19へ送られ,コメント記憶部26に記憶される。このコメント処理部19の機能は,例えば従来技術として知られている掲示板機能によって実現することができる。
図2は,本発明の実施例に係るコンテンツ生成処理フローチャートである。図3は,本発明の実施例での入力映像と処理過程映像の例を示す図である。以下,図2に従って,講演ビデオの例を基に各部の動作について説明する。
まず,ステップS1では,映像取得部11が,講演ビデオの映像を読み取る。ステップS2では,画像領域抽出部12が,映像取得部11により取得した映像からスクリーン領域を抽出する。図3(a)は,ハイビジョンカメラで撮影した講演ビデオの例を示している。この講演ビデオの映像から画像領域抽出部12がスクリーン領域を抽出した例を,図3(b)に示す。ここでは,画像領域抽出部12が講演ビデオからスクリーン領域を切り出した後,向かい合う辺が平行になるように,アフィン変換を用いて補正している。講演映像をハイビジョンカメラで高解像度に撮影しておけば,切り出したスクリーン領域の図形や文字情報を読み取ることができる。
ステップS3では,画像領域抽出部12が講演ビデオの映像から講師領域を抽出する。図3(a)の講演映像から講師領域を抽出した例を,図3(c)に示す。このような講師領域の抽出は,例えば顔領域の検出や背景画像との差分などで実現できる。
ステップS4では,映像編集部13により公開用講演ビデオを生成する。スクリーン領域の左下に固定のサイズで講師領域を重畳するよう設定した場合の生成例を,図3(d)に示す。また,講師領域のいずれかの辺がスクリーン領域の辺と重なり,かつ,講師領域がスクリーン領域の背景からはみ出ないように講師領域の大きさと位置をずらしたときに,講師領域が最大となるように動的に生成した場合の例を,図3(e)に示す。
また,公開用講演ビデオの第3の例を図3(f)に示す。同図では,スクリーン領域の横に講師領域を配置するとともに,現在再生表示しているシーンの位置づけがわかるように,映像全体の中での再生時刻の割合を棒グラフで“timeline”として提示したり,再生されているスライドが全体の何番目であるかを示したり(同図では全スライド10枚の中の4枚目を示す),同一スライドが提示されている区間の中で,現在の再生時刻の割合を棒グラフで示したり,前後のスライドの内容を表すトピック画像を示したりしている。
ステップS5では,トピック開始点検出部14が,スクリーン領域の画像内容が時間的に変化した点,講師の発話開始点,講師の動きが大きく変化した点などからトピック開始点を検出する。
ステップS6では,トピック画像生成部16が,映像編集部13から受け取った公開用講演ビデオと,トピック開始点検出部14から受け取ったトピック区間とから,トピック区間の内容をよく表す画像をトピック画像として検出する。
ステップS7では,講師連続発話区間検出部15が,講師が時間的に連続して発話した区間の開始時刻をサブトピック開始点として検出する。
ステップS8では,コンテンツ生成部17がコンテンツを生成する。コンテンツ生成の第1の例を図4に示す。この第1の例は,コンテンツ再生制御部18によって公開用講演ビデオを再生表示するときに,トピック区間のリストと各トピックのトピック画像を提示し,利用者が選択したトピック区間をランダムに再生開始できるようにWebコンテンツを生成した例である。
図4の例において,30は公開用講演ビデオを再生する公開用講演映像再生画面である。このビデオ再生画面の下にトピック区間を現すトピック区間提示バー31を提示する。このトピック区間提示バー31上で,あるトピック区間にマウスオーバーすると該当のトピック画像32が提示される。また,トピック区間提示バー31上のトピック区間をマウスでクリックすると該当のトピックの開始点の公開用講演ビデオが,公開用講演映像再生画面30に頭出し再生される。このようなコンテンツを利用する視聴者は,重要なスライド情報を目視で確認したり,講師の表情を見たり,トピック画像32で講演内容を概観しながら見たいシーンを選択したりすることが容易に行える。
また,コンテンツ生成の第2の例として,映像シーンに掲示板機能を連携させ,映像にコメントを登録できるようにした場合のコンテンツ生成例を図5に示す。同図では,講師の発話区間であるサブトピックに対応するコメントを講師発話コメントとして自動登録し,右側の画面に示すように,講師発話コメントを表すサブトピックのタイトル40の一覧を表示する。
この講師発話コメントは,講師が話した内容を示すものではなく,単に講師連続発話区間検出部15により検出した何番目のサブトピックかを示すようなものでよい。図5の例では,サブトピックのタイトル40として「speaker topic2」というタイトルを自動付与しており,次のサブトピックには,「speaker topic3」というタイトルを付与することになる。
さらに進んだタイトルの付与方法として,講師連続発話区間検出部15において入力音声の周波数分析を行うことなどにより,サブトピック区間において講師が発話しているのか,受講者が発話しているのかの話者の識別を行い,話者の識別結果により,「講師トピックn」(n:シーケンス番号),「受講者トピックm」(m:シーケンス番号)などのタイトルを自動付与して登録する方法を用いてもよい。この場合の話者識別では,必ずしも特定の話者を認識する必要はなく,一番多く発話するのが講師であることが明らかであるので,全体の発話回数や発話の長さから,単に各サブトピックごとに講師の発話か講師以外の発話かを区別できるような周波数分析による識別で十分である。
図5に示す画面において,利用者がサブトピックのタイトル40をクリックして講師発話コメントを選択すると,コンテンツ再生制御部18は,該当するサブトピック開始点から公開用講演ビデオを公開用講演映像再生画面30に頭出し再生する。このとき,利用者はコメントへの返信機能を用い,返信記入欄41に意見・質問等を書き込むことにより,講師発話コメントに返信することもできる構成になっている。このようなコンテンツを利用する視聴者は,講師の発話区間単位で講演ビデオを視聴したり,掲示板機能を用いて講師の発話内容に基づいた意見交換を行ったりすることが容易となる。
なお,講師発話コメントに対して掲示板機能を用いて意見を書き込み,意見交換を行うための技術は,Web技術などの一般に知られている既知の技術を用いて実現することができるので,ここでのさらに詳しい説明は省略する。
以上のコンテンツ生成の処理は,コンピュータとソフトウェアプログラムとによって実現することができ,そのプログラムをコンピュータ読み取り可能な記録媒体に記録することも,ネットワークを通して提供することも可能である。
10 コンテンツ生成装置
11 映像取得部
12 画像領域抽出部
13 映像編集部
14 トピック開始点検出部
15 講師連続発話区間検出部
16 トピック画像生成部
17 コンテンツ生成部
18 コンテンツ再生制御部
19 コメント処理部
21 領域映像記憶部
22 公開用講演ビデオ記憶部
23 トピック区間記憶部
24 サブトピック区間記憶部
25 トピック画像記憶部
26 コメント記憶部

Claims (8)

  1. 講師が板書またはプロジェクタを用いて講演を行っている様子を1台のカメラで撮影した講演ビデオのみからコンテンツを自動生成するコンテンツ生成装置であって,
    前記講演ビデオからプロジェクタで投影されたスクリーン領域の画像と,講師が撮像されている講師領域の画像とをそれぞれ抽出する画像領域抽出手段と,
    前記スクリーン領域の画像と前記講師領域の画像とを重畳して1つの公開用講演ビデオを合成する映像編集手段と,
    前記スクリーン領域または前記講師領域の画像情報から,利用者が選択する映像再生開始位置を定めるトピック開始点を検出するトピック開始点検出手段と,
    前記公開用講演ビデオにおける,トピック開始点から次のトピックの開始点までのトピック区間のフレーム画像から,トピック区間の内容を表すトピック画像を検出または生成するトピック画像生成手段と,
    前記映像編集手段,前記トピック開始点検出手段および前記トピック画像生成手段が出力する情報を統合し,前記公開用講演ビデオを再生表示するときに,トピック区間のリストと各トピックのトピック画像を提示し,利用者が選択したトピックに該当する映像を再生できるようにコンテンツを生成するコンテンツ生成手段とを備える
    ことを特徴とするコンテンツ生成装置。
  2. 前記画像領域抽出手段は,
    さらに,スクリーン領域の画像と講師領域の画像とを,元の講演ビデオの画像より少ない画素数で抽出する
    ことを特徴とする請求項1に記載のコンテンツ生成装置。
  3. 前記画像領域抽出手段は,
    さらに,検出したスクリーン領域の矩形で向かい合う辺が平行になるようにスクリーン領域の画像にアフィン変換を行う
    ことを特徴とする請求項1または請求項2に記載のコンテンツ生成装置。
  4. 前記画像領域抽出手段は,
    前記講演ビデオにおける講師が板書を行っている場合には,書き込んでいる黒板領域を含む領域を講師領域として検出する
    ことを特徴とする請求項1から請求項3までのいずれか1項に記載のコンテンツ生成装置。
  5. 前記映像編集手段は,
    前記スクリーン領域の画像と前記講師領域の画像とを重畳して1つの公開用講演ビデオを合成するときに,スクリーン領域の画像情報における背景エリアを特定し,背景エリアのスペースと前記講師領域の大きさに基づいてスクリーン領域の画像に講師領域の画像を重畳する位置を動的に決定する
    ことを特徴とする請求項1から請求項4までのいずれか1項に記載のコンテンツ生成装置。
  6. 前記講演ビデオに含む音声データから,講師が連続して発話した区間の開始時刻をサブトピック開始点として検出するサブトピック区間検出手段と,
    前記公開用講演ビデオを再生表示するときに,前記サブトピック開始点と対応付けられた講師発話コメントを提示し,利用者が選択した講師発話コメントに該当するサブトピック開始点からの公開用講演ビデオの再生制御,または,前記講師発話コメントに対して入力された返信コメントを登録する手段とを,さらに備える
    ことを特徴とする請求項1から請求項5までのいずれか1項に記載のコンテンツ生成装置。
  7. 講師が板書またはプロジェクタを用いて講演を行っている様子を1台のカメラで撮影した講演ビデオのみから,コンテンツ生成装置がコンテンツを自動生成するコンテンツ生成方法であって,
    前記講演ビデオからプロジェクタで投影されたスクリーン領域の画像と,講師が撮像されている講師領域の画像とをそれぞれ抽出する画像領域抽出ステップと,
    前記スクリーン領域の画像と前記講師領域の画像とを重畳して1つの公開用講演ビデオを合成する映像編集ステップと,
    前記スクリーン領域または前記講師領域の画像情報から,利用者が選択する映像再生開始位置を定めるトピック開始点を検出するトピック開始点検出ステップと,
    前記公開用講演ビデオにおける,トピック開始点から次のトピックの開始点までのトピック区間のフレーム画像から,トピック区間の内容を表すトピック画像を検出または生成するトピック画像生成ステップと,
    前記映像編集ステップ,前記トピック開始点検出ステップおよび前記トピック画像生成ステップにより出力される情報を統合し,前記公開用講演ビデオを再生表示するときに,トピック区間のリストと各トピックのトピック画像を提示し,利用者が選択したトピックに該当する映像を再生できるようにコンテンツを生成するコンテンツ生成ステップとを有する
    ことを特徴とするコンテンツ生成方法。
  8. コンピュータを,請求項1から請求項までのいずれか1項に記載のコンテンツ生成装置が備える各手段として機能させるためのコンテンツ生成プログラム。
JP2009185434A 2009-08-10 2009-08-10 コンテンツ生成装置,コンテンツ生成方法およびコンテンツ生成プログラム Active JP5243365B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009185434A JP5243365B2 (ja) 2009-08-10 2009-08-10 コンテンツ生成装置,コンテンツ生成方法およびコンテンツ生成プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009185434A JP5243365B2 (ja) 2009-08-10 2009-08-10 コンテンツ生成装置,コンテンツ生成方法およびコンテンツ生成プログラム

Publications (2)

Publication Number Publication Date
JP2011040921A JP2011040921A (ja) 2011-02-24
JP5243365B2 true JP5243365B2 (ja) 2013-07-24

Family

ID=43768254

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009185434A Active JP5243365B2 (ja) 2009-08-10 2009-08-10 コンテンツ生成装置,コンテンツ生成方法およびコンテンツ生成プログラム

Country Status (1)

Country Link
JP (1) JP5243365B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015133782A1 (ko) * 2014-03-03 2015-09-11 삼성전자 주식회사 컨텐츠 분석 방법 및 디바이스
KR101554574B1 (ko) 2014-02-06 2015-10-05 김하준 투명 칠판을 이용한 강의 동영상의 녹화 시스템 및 방법

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012213063A (ja) * 2011-03-31 2012-11-01 Nec Corp 画像処理装置、画像処理システム、画像処理方法、及び画像処理プログラム
JP5633823B2 (ja) * 2012-02-06 2014-12-03 日本電信電話株式会社 チャプタ代表画像生成装置およびその動作方法
US10427055B2 (en) * 2014-04-07 2019-10-01 Sony Interactive Entertainment Inc. Game video distribution device, game video distribution method, and game video distribution program
JP6772782B2 (ja) * 2016-11-24 2020-10-21 株式会社リコー 情報処理装置、情報処理システム、および情報処理プログラム
JP2019201310A (ja) * 2018-05-16 2019-11-21 Tateito株式会社 映像編集装置
KR102293234B1 (ko) * 2020-09-24 2021-08-25 월드버텍 주식회사 인공지능 기술을 활용한 화상교육 시스템 및 학습 지원 방법
CN113784077B (zh) * 2021-09-24 2023-03-21 联想(北京)有限公司 一种信息处理方法、装置和电子设备

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07222052A (ja) * 1994-02-08 1995-08-18 Nippon Telegr & Teleph Corp <Ntt> 撮像画像からの資料領域分離方法及び遠隔プレゼンテーション方法
JP4253446B2 (ja) * 2001-06-13 2009-04-15 株式会社リコー プレゼンテーション用記録再生装置
JP2004185424A (ja) * 2002-12-04 2004-07-02 Fuji Xerox Co Ltd プレゼンテーション記録装置
JP2005197878A (ja) * 2004-01-05 2005-07-21 Nippon Telegr & Teleph Corp <Ntt> カット点設定方法とその装置並びにプログラム、及び映像情報蓄積方法とその装置並びにプログラム
JP2006074514A (ja) * 2004-09-02 2006-03-16 Hiroshima Univ 映像編集装置、映像再生装置、ファイルデータベース、ファイル配信サーバ、映像編集方法、映像編集プログラム、映像再生方法、映像再生プログラム、およびコンピュータ読み取り可能な記録媒体
JP4649640B2 (ja) * 2004-11-18 2011-03-16 学校法人慶應義塾 画像処理方法、画像処理装置、及びコンテンツ作成システム
JP2006162692A (ja) * 2004-12-02 2006-06-22 Hosei Univ 講義コンテンツ自動作成システム
JP4959534B2 (ja) * 2007-12-12 2012-06-27 日本電信電話株式会社 映像アノテーション付与・表示方法及び装置及びプログラム及びコンピュータ読取可能な記録媒体

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101554574B1 (ko) 2014-02-06 2015-10-05 김하준 투명 칠판을 이용한 강의 동영상의 녹화 시스템 및 방법
WO2015133782A1 (ko) * 2014-03-03 2015-09-11 삼성전자 주식회사 컨텐츠 분석 방법 및 디바이스
US10014008B2 (en) 2014-03-03 2018-07-03 Samsung Electronics Co., Ltd. Contents analysis method and device

Also Published As

Publication number Publication date
JP2011040921A (ja) 2011-02-24

Similar Documents

Publication Publication Date Title
JP5243365B2 (ja) コンテンツ生成装置,コンテンツ生成方法およびコンテンツ生成プログラム
US11849196B2 (en) Automatic data extraction and conversion of video/images/sound information from a slide presentation into an editable notetaking resource with optional overlay of the presenter
CN106331732B (zh) 生成、展现全景内容的方法及装置
US20210056251A1 (en) Automatic Data Extraction and Conversion of Video/Images/Sound Information from a Board-Presented Lecture into an Editable Notetaking Resource
TWI253860B (en) Method for generating a slide show of an image
US9164590B2 (en) System and method for automated capture and compaction of instructional performances
Reyna The potential of 360-degree videos for teaching, learning and research
Brotherton et al. Automated capture, integration, and visualization of multiple media streams
JP2011082958A (ja) ビデオ検索システムおよびそのためのコンピュータプログラム
JP2005352933A (ja) 表示装置、システムおよび表示方法
CN117252966B (zh) 动态漫画生成方法及装置、存储介质及电子设备
JP2001209361A (ja) マルチメディア表示装置
KR20210055301A (ko) 리뷰 제작 시스템
JP2013146511A (ja) 人体の動作の変移を記録、解析し、表示する電子機器
JP2005167822A (ja) 情報再生装置及び情報再生方法
US10714146B2 (en) Recording device, recording method, reproducing device, reproducing method, and recording/reproducing device
JP3351463B2 (ja) マルチアイ電子化手話学習装置
JP2012118859A (ja) 会議録システム及びプログラム
JP2004185424A (ja) プレゼンテーション記録装置
JP2004282186A (ja) 連続データへのユーザデータ関連付け装置
CN109862311B (zh) 视频内容的实时制作方法
JP2023167630A (ja) 画像処理装置、画像処理方法
JP2016019138A (ja) 画像処理装置、方法及びプログラム
Dmytrenko et al. Technological features of video content creation and editing for students specialty «Construction and civil engineering»
TW201516717A (zh) 影像播放之系統及其方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20111018

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20121012

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20121030

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121212

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130402

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130404

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160412

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 5243365

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350