JP5633823B2 - チャプタ代表画像生成装置およびその動作方法 - Google Patents

チャプタ代表画像生成装置およびその動作方法 Download PDF

Info

Publication number
JP5633823B2
JP5633823B2 JP2012022946A JP2012022946A JP5633823B2 JP 5633823 B2 JP5633823 B2 JP 5633823B2 JP 2012022946 A JP2012022946 A JP 2012022946A JP 2012022946 A JP2012022946 A JP 2012022946A JP 5633823 B2 JP5633823 B2 JP 5633823B2
Authority
JP
Japan
Prior art keywords
image
chapter
background image
background
video file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2012022946A
Other languages
English (en)
Other versions
JP2013162341A (ja
Inventor
聡 嶌田
聡 嶌田
東野 豪
豪 東野
啓樹 靜谷
啓樹 靜谷
美徳 早川
美徳 早川
大 三石
大 三石
文子 今野
文子 今野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tohoku University NUC
Nippon Telegraph and Telephone Corp
Original Assignee
Tohoku University NUC
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tohoku University NUC, Nippon Telegraph and Telephone Corp filed Critical Tohoku University NUC
Priority to JP2012022946A priority Critical patent/JP5633823B2/ja
Publication of JP2013162341A publication Critical patent/JP2013162341A/ja
Application granted granted Critical
Publication of JP5633823B2 publication Critical patent/JP5633823B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Television Signal Processing For Recording (AREA)
  • Image Analysis (AREA)

Description

本発明は、データサイズが小さく且つチャプタの内容を把握できるチャプタの代表画像を生成するチャプタ代表画像生成装置およびその動作方法に関するものである。
近年にあっては、講義の様子を撮影した映像をチャプタに分割した場合、チャプタの代表画像を生成することがある。
非特許文献1の方法では、チャプタ内のフレーム画像を扱いやすく縮小し、これを代表画像とし、提示する。
非特許文献2の方法では、パーソナルコンピュータでのプレゼンテーションによる講義を対象とし、プレゼンテーションのスライドを更新したときに、チャプタ分割を行い、チャプタ内のフレーム画像からスクリーンエリアを切り出し、これを代表画像とする。
谷口行信, 外村佳伸, 浜田洋,映像ショット切換え検出法とその映像アクセスインタフェースへの応用, 電子情報通信学会論文誌,Vol.J79-D2,No.4,pp.538-546,1996. ティモテ,嶌田聡,小島明,Automatic and easy creation of learning friendly conferences videos,電子情報通信学会技術報告,IE2009-65, pp. 37-42,2009.
例えば、講義の映像において、板書の開始や板書の文字や図形を消すタイミングでチャプタを分割することがある。その場合のチャプタの代表画像を従来技術で生成すると、以下の問題が発生する。
非特許文献1の方法では、フレーム画像を縮小した代表画像を生成するが、縮小した代表画像によっては、黒板の大まかな変化や講師の位置変化を把握できるが、板書の文字や図形は読み取れないので、講義の内容を容易に把握することができない。
非特許文献2の方法では、スクリーンエリアとして、黒板などの領域を指定することになる。横長の大きい黒板で講義を行う場合には、板書の文字や図形が読み取れるように、黒板全体をハイビジョンカメラで撮影する方法が有効である。
しかし、このように撮影された映像のデータサイズは大きく、その一部の黒板の領域、つまり、代表画像であっても、やはりデータサイズは大きい。よって、代表画像は扱いにくいものとなってしまい、縮小しても、今度は文字や図形が読めなくなる。
本発明は、上記の課題に鑑みてなされたものであり、その目的とするところは、データサイズが小さく且つチャプタの内容を把握できるチャプタの代表画像を生成するチャプタ代表画像生成装置およびその動作方法を提供することにある。
上記の課題を解決するために、第1の本発明は、映像ファイルを構成するチャプタを代表する代表画像を生成するチャプタ代表画像生成装置であって、前記映像ファイルに映った場所で線が書かれ始める開始時から始まり線が消去される終了時で終わるチャプタを当該映像ファイルから検出するチャプタ検出部と、前記映像ファイルの前記開始時に再生されるフレーム画像を用いて当該フレーム画像に映った場所の背景を示す開始時背景画像を生成する開始時背景画像生成部と、前記映像ファイルの前記終了時に再生されるフレーム画像を用いて当該フレーム画像に映った場所の背景を示す終了時背景画像を生成する終了時背景画像生成部と、前記開始時背景画像および前記終了時背景画像の差分の領域を示す差分領域画像を生成する差分検出処理部と、前記終了時背景画像から前記差分領域画像により示される領域を含む部分画像を抜き出し、当該部分画像を含む代表画像を生成する代表画像生成部とを備え、前記差分検出処理部は、前記開始時背景画像を2値化し2値化画像を構成する各画素について、当該画素を中心にし且つ予め1以上の文字が入るように定められた大きさと形状を有する矩形を定義し、当該矩形を予め定められた複数のブロックに分割し、当該ブロック内の画素の濃度の勾配の方向を求め、当該方向のヒストグラムを求め、当該ヒストグラムに対応する特徴ベクトルを求め、前記終了時背景画像を2値化し2値化画像を構成する各画素について、当該画素を中心にし且つ前記大きさと前記形状を有する矩形を定義し、当該矩形を前記複数のブロックの数と同数のブロックに分割し、当該ブロック内の画素の濃度の勾配の方向を求め、当該方向のヒストグラムを求め、当該ヒストグラムに対応する特徴ベクトルを求め、前記開始時背景画像と前記終了時背景画像の同じ位置での画素から求めた各特徴ベクトルの距離を求め、当該各距離を比較し、比較の結果に基づいて、当該位置での差異の有無を判定することを特徴とする。
第2の本発明は、映像ファイルを構成するチャプタを代表する代表画像を生成するチャプタ代表画像生成装置の動作方法であって、前記チャプタ代表画像生成装置のチャプタ検出部が、前記映像ファイルに映った場所で線が書かれ始める開始時から始まり線が消去される終了時で終わるチャプタを当該映像ファイルから検出し、前記チャプタ代表画像生成装置の開始時背景画像生成部が、前記映像ファイルの前記開始時に再生されるフレーム画像を用いて当該フレーム画像に映った場所の背景を示す開始時背景画像を生成し、前記チャプタ代表画像生成装置の終了時背景画像生成部が、前記映像ファイルの前記終了時に再生されるフレーム画像を用いて当該フレーム画像に映った場所の背景を示す終了時背景画像を生成し、前記チャプタ代表画像生成装置の差分検出処理部が、前記開始時背景画像および前記終了時背景画像の差分の領域を示す差分領域画像を生成し、前記チャプタ代表画像生成装置の代表画像生成部が、前記終了時背景画像から前記差分領域画像により示される領域を含む部分画像を抜き出し、当該部分画像を含む代表画像を生成し、前記差分検出処理部は、前記開始時背景画像を2値化し2値化画像を構成する各画素について、当該画素を中心にし且つ予め1以上の文字が入るように定められた大きさと形状を有する矩形を定義し、当該矩形を予め定められた複数のブロックに分割し、当該ブロック内の画素の濃度の勾配の方向を求め、当該方向のヒストグラムを求め、当該ヒストグラムに対応する特徴ベクトルを求め、前記終了時背景画像を2値化し2値化画像を構成する各画素について、当該画素を中心にし且つ前記大きさと前記形状を有する矩形を定義し、当該矩形を前記複数のブロックの数と同数のブロックに分割し、当該ブロック内の画素の濃度の勾配の方向を求め、当該方向のヒストグラムを求め、当該ヒストグラムに対応する特徴ベクトルを求め、前記開始時背景画像と前記終了時背景画像の同じ位置での画素から求めた各特徴ベクトルの距離を求め、当該各距離を比較し、比較の結果に基づいて、当該位置での差異の有無を判定することを特徴とする。
本発明によれば、データサイズが小さく且つチャプタの内容を把握できるチャプタの代表画像を生成することができる。
本実施の形態に係るチャプタ代表画像生成装置の構成を示す機能ブロック図である。 チャプタ代表画像生成装置の動作方法を示すフローチャートである。 開始時背景画像の生成の様子の一例を示す図である。 図4(a)は、開始時背景2値化画像の一例であり、図4(b)は、終了時背景2値化画像の一例である。 差分検出処理部15による処理の説明に用いるための図であり、図5(a)は、矩形Saを定義した開始時背景2値化画像の一例であり、図5(b)は、矩形Sbを定義した終了時背景2値化画像の一例である。
以下、本発明の実施の形態について図面を参照して説明する。
図1は、本実施の形態に係るチャプタ代表画像生成装置の構成を示す機能ブロック図である。図2は、チャプタ代表画像生成装置の動作方法を示すフローチャートである。
図1において、チャプタ代表画像生成装置1は、映像ファイルを構成するチャプタを代表する代表画像を生成する装置である。ここでは、映像ファイルに映っている場所は、例えば教室であり、チャプタは、映像ファイルにおける以下の部分である。つまり、チャプタは、ここでは、例えば講師により黒板に線、つまり文字や図形が書かれ始める講義の開始時から、線が消去、つまり黒板消しで文字などが消去される講義の終了時まで部分である。
チャプタ代表画像生成装置1は、図示しない記憶装置などから映像ファイルを読み取る映像取得部11と、映像ファイルに映った場所で線が書かれ始める開始時から始まり線が消去される終了時で終わるチャプタを映像ファイルから検出するチャプタ検出部12と、映像ファイルにおけるチャプタの開始時に再生されるフレーム画像を用いて当該フレーム画像に映った場所の背景を示す開始時背景画像を生成する開始時背景画像生成部13と、映像ファイルにおけるチャプタの終了時に再生されるフレーム画像を用いて当該フレーム画像に映った場所の背景を示す終了時背景画像を生成する終了時背景画像生成部14と、開始時背景画像および終了時背景画像の差分の領域を示す差分領域画像を生成する差分検出処理部15と、終了時背景画像から差分領域画像により示される領域を含む部分画像を抜き出し、部分画像を含む代表画像を生成する代表画像生成部16とを備える。
映像取得部11は、図示しない記憶装置などから映像ファイルを読み取り、映像ファイルをチャプタ検出部12に出力する。
チャプタ検出部12は、映像ファイルに映った場所で線が書かれ始める開始時から始まり線が消去される終了時で終わるチャプタを映像ファイルから検出する(図2:ステップ101)。
チャプタ検出部12は、例えば、映像ファイルにおけるチャプタの位置を示すインデクスを映像ファイルに設定し、この映像ファイルを開始時背景画像生成部13および終了時背景画像生成部14に出力する(ステップ101)。
チャプタ検出部12は、例えば、以下の方法でチャプタを検出する。
(1)板書された文字図形量の変動から検出する方法
チャプタ検出部12は、まず、映像ファイルから一定間隔でフレーム画像をサンプリングし、n番目のフレーム画像F(n)とn−1番目のフレーム画像F(n−1)の差分の2値化処理により、フレーム画像F(n)における講師の領域(講師領域)を求め、これを各フレーム画像について行う。
次に、チャプタ検出部12は、フレーム画像F(n)から講師領域を消去した講師消去画像G(n)を求めるために、フレーム画像F(n)の講師領域以外の画素を講師消去画像G(n)に転写し、フレーム画像F(n)の講師領域に対応する、フレーム画像F(n−1)について生成ずみの講師消去画像G(n−1)の画素を、講師消去画像G(n)に転写する処理を行う。
次に、チャプタ検出部12は、講師消去画像G(n)と講師消去画像G(n−1))の差分を2値化した文字差分画像を求め、フレーム画像F(n−1)について生成ずみの文字差分画像と当該求めた文字差分画像とで変化のあった文字領域を検出する。
最後に、チャプタ検出部12は、検出した文字領域の文字画素数を文字変化量(文字図形量の変動)として求め、文字変化量に基づいて、映像ファイルに映った場所で線が書かれ始める講義の開始時および線が消去される講義の終了時を検出する。つまり、チャプタ検出部12は、こうして、チャプタを検出する。
(2)映像中の講師の手の領域や、文字図形を消す道具の領域を求め、手の位置や消す道具の位置から検出する方法
チャプタ検出部12は、フレーム画像中の肌色エリアを検出し、複数の肌色エリアの位置関係から、手と頭部の領域を求め、手と頭部の領域の位置から、板書を行っているか否かを判定する。これにより、チャプタ検出部12は、板書を行っている時間帯、つまり、チャプタを検出する。
または、チャプタ検出部12は、黒板などのボードの下にある消す道具が移動したかを検出することで文字図形を消す動作を行ったかを判別する。これにより、チャプタ検出部12は、特にチャプタの終了時を検出する。
(3)板書するときの音から検出する方法
黒板にチョークで板書するときには特有の突発音が連続する。チャプタ検出部12は、その音の特徴を学習しておき、講師に装着したマイクで録音したデータから、板書を開始した時刻、板書を終了した時刻を検出する。つまり、チャプタ検出部12は、チャプタを検出する。
図1に戻り、開始時背景画像生成部13は、映像ファイルからフレーム画像を再生順でサンプリングし、サンプリングしたフレーム画像とインデクスを用いて、チャプタ開始時のフレーム画像に映った場所の背景を示す開始時背景画像を生成する。開始時背景画像生成部13は、各チャプタについて生成した開始時背景画像を差分検出処理部15に出力する(図2のステップ102)。
開始時背景画像生成部13は、例えば、以下のように開始時背景画像を生成する。
開始時背景画像生成部13は、まず、映像ファイルから一定間隔でフレーム画像をサンプリングする。
開始時背景画像生成部13は、例えば、最初にサンプリングしたフレーム画像から、該当のインデクスにより示される、チャプタ開始時のフレーム画像までの各フレーム画像(以下、フレーム画像F(n)という)について、サンプリングの順で、以下の処理を行う。
図3に示すように、開始時背景画像生成部13は、フレーム画像F(n)から線を消去し、つまり、消去後の画像(図の線消去画像M(n))を生成する。
線消去画像の生成(線の消去)は、例えば、モルフォロジーによる平滑化処理により実現できる。例えば、黒板に板書されている場合は、フレーム画像に最小値フィルタを施した後、最大値フィルタを実行すると、線消去画像となる。文字などをホワイトボードに黒いペンで書いた場合には、最大値フィルタを施した後に最小値フィルタを実行すればよい。
また、開始時背景画像生成部13は、フレーム画像F(n)に映った場所の前景の領域(例えば、講師の領域)を示す前景領域画像(図の前景領域画像TCH(n))を生成する。
開始時背景画像生成部13は、チャプタ検出部12と同様に、例えば、線消去画像M(n)から、予め黒板等の位置として設定された位置の色を検出し、線消去画像M(n)から、その色以外の色の領域を検出し、その領域を示す前景領域画像TCH(n)を生成する。なお、黒板等の位置の色は、予め検出し、記憶しておいてもよい。
次に、開始時背景画像生成部13は、フレーム画像F(n)から、前景領域画像TCH(n)により示される領域以外に該当する領域(フレーム画像背景領域という)を抜き出す。
次に、開始時背景画像生成部13は、フレーム画像F(n)が最初にサンプリングされたフレーム画像なら、以下の処理を行う。
つまり、開始時背景画像生成部13は、フレーム画像背景領域を含み、かつ、前景領域画像TCH(n)に該当する領域には文字等がない画像(背景画像という)を生成する。 次に、開始時背景画像生成部13は、背景画像を、例えば、背景画像記憶部(図示せず)に記憶させる。
一方、開始時背景画像生成部13は、フレーム画像F(n)が最初にサンプリングされたフレーム画像でないなら、以下の処理を行う。
つまり、開始時背景画像生成部13は、フレーム画像F(n)の1つ前にサンプリングされたフレーム画像を用いて生成された背景画像(図の背景画像C(n−1))を背景画像記憶部(図示せず)から読み出す。
次に、開始時背景画像生成部13は、背景画像C(n−1)から、前景領域画像TCH(n)により示される領域に該当する領域(背景画像前景領域という)を抜き出す。
次に、開始時背景画像生成部13は、フレーム画像背景領域および背景画像前景領域とからなる背景画像(図の背景画像C(n))を生成する。
次に、開始時背景画像生成部13は、最後に生成した背景画像、つまり、チャプタ開始時のフレーム画像がフレーム画像F(n)である場合の背景画像を開始時背景画像として、差分検出処理部15に出力する。
図1に戻り、終了時背景画像生成部14は、映像ファイルからインデクスに基づき、各チャプタ終了時のフレーム画像やその他の必要なフレーム画像をサンプリングし、サンプリングしたフレーム画像を用いて、チャプタ終了時のフレーム画像に映った場所の背景を示す終了時背景画像を生成する。終了時背景画像生成部14は、各チャプタについて生成した終了時背景画像を差分検出処理部15に出力する(図2のステップ103)。
終了時背景画像生成部14は、例えば、図3に示した、開始時背景画像生成部13が開始時背景画像を生成した方法と同様の方法で終了時背景画像を生成する。つまり、終了時背景画像生成部14は、最後に生成した背景画像を終了時背景画像として、差分検出処理部15に出力する。
差分検出処理部15は、各チャプタについて、該当の開始時背景画像および終了時背景画像の差分の領域を示す差分領域画像を生成し、差分領域画像と終了時背景画像を代表画像生成部16に出力する(図2:ステップ104)。
差分検出処理部15は、例えば、以下の方法で差分領域画像を生成する。
差分検出処理部15は、まず、開始時背景画像および終了時背景画像を2値化し、図4(a)に示すような、開始時背景画像による2値化画像(開始時背景2値化画像という)と、図4(a)に示すような、終了時背景画像による2値化画像(終了時背景2値化画像という)とを得る。図4に示すように、開始時背景2値化画像は、黒板の色が除去され、主に開始時における黒板上の文字や図形を示す画像となり、終了時背景2値化画像も、同様に、主に終了時における黒板上の文字や図形を示す画像となる。
次に、差分検出処理部15は、開始時背景2値化画像および終了時背景2値化画像のそれぞれについて以下の処理を行う。
差分検出処理部15は、画像を構成する各画素について、当該画素を中心にし且つ予め1以上の文字が入るように定められた大きさと形状を有する矩形を定義する。
図5(a)に示す矩形Saは、開始時背景2値化画像の右上にある1画素について定義された矩形を例示したものであり、図5(b)に示す矩形Sbは、終了時背景2値化画像の右上にある同じ位置の1画素について定義された矩形を例示したものである。
差分検出処理部15は、次に、矩形を予め定められた複数のブロックに分割する。
図5(a)に示す矩形Saは、縦方向でN個に分割され、横方向でM個に分割され、よって、矩形Saは、N×M個のブロックを有する。
図5(b)に示す矩形Sbは、矩形Saの大きさおよび形状と同じ大きさおよび形状を有している。また、矩形Sbは、縦方向でN個に分割され、横方向でM個に分割される。つまり、矩形Sbは、矩形Saのブロック数と同数のブロックに分割される。矩形Sa、Sbでは、ブロック同士の大きさおよび形状も同一である。
次に、差分検出処理部15は、各画素について、対応するブロック内の画素の濃度の勾配の方向を求め、方向のヒストグラムを求め、ヒストグラムに対応する特徴ベクトルを求める。
例えば、差分検出処理部15は、矩形Sa内のN×M個のブロックのそれぞれにつき、その中での画素の濃度の勾配の方向を求める。方向は、例えば、予め定めた8方向の中から選択される。次に、差分検出処理部15は、方向のヒストグラム(8方向のそれぞれに該当するブロックの数を示すもの)を求め、ヒストグラムに対応する特徴ベクトルを求める。これにより、矩形Saに対応する特徴ベクトル、つまり、矩形Saに対応する特徴ベクトルが求まる。差分検出処理部15は、例えば、矩形Sbに対応する特徴ベクトル、つまり、矩形Sbに対応する特徴ベクトルも同様に求める。
次に、差分検出処理部15は、開始時背景画像と終了時背景画像の同じ位置での画素から求めた各特徴ベクトル(例えば、図5(a)の矩形Saに対応する特徴ベクトルと、図5(b)の矩形Sbに対応する特徴ベクトル)の距離を求め、各距離を比較し、比較の結果に基づいて、当該位置での差異の有無を判定する。
次に、差分検出処理部15は、差異があると判定された画素のみからなる領域を示す差分領域画像を生成する。
図1に戻り、代表画像生成部16は、各チャプタについて、該当の終了時背景画像および差分領域画像を用い、例えば、終了時背景画像において差分領域画像を含むように矩形領域を設定し、終了時背景画像から矩形領域に対応する部分画像を抜き出し、部分画像を当該チャプタの代表画像として出力する(図2のステップ105)。これにより、一連の処理が終わる。
また、差分検出処理部15において、開始時背景2値化画像と終了時背景2値化画像との差分領域を求めた場合、終了時背景2値化画像に文字などがあって開始時背景2値化画像にはない領域が差分領域である場合と、開始時背景2値化画像に文字などがあって終了時背景2値化画像にはない領域が差分領域である場合とがあるので、これら2種類の差分領域のうち、どちらか一方の領域を実際の差分領域とし、代表画像生成部16は、終了時背景2値化画像から差分領域を含む矩形領域に対応する部分画像を抜き出す、または、開始時背景2値化画像から差分領域を含む矩形領域に対応する部分画像を抜き出し、これをチャプタの代表画像として出力する方法も有効である。
矩形領域の大きさは、例えば、予め代表画像の大きさに設定しておけばよい。
また、差分領域画像が大きすぎる、または、小さすぎる場合は、大きさに応じて、予め矩形領域を拡大または縮小し、拡大または縮小後の矩形領域に差分領域画像が内接するようにして部分画像を抜き出し、抜き出した部分画像を縮小または拡大し、代表画像の大きさになるようにすればよい。
以上説明したように、本実施の形態によれば、映像ファイルを構成するチャプタを代表する代表画像を生成するチャプタ代表画像生成装置であって、映像ファイルに映った場所で線が書かれ始める開始時から始まり線が消去される終了時で終わるチャプタを当該映像ファイルから検出するチャプタ検出部12と、映像ファイルの前記開始時に再生されるフレーム画像を用いて当該フレーム画像に映った場所の背景を示す開始時背景画像を生成する開始時背景画像生成部13と、映像ファイルの前記終了時に再生されるフレーム画像を用いて当該フレーム画像に映った場所の背景を示す終了時背景画像を生成する終了時背景画像生成部14と、開始時背景画像および終了時背景画像の差分の領域を示す差分領域画像を生成する差分検出処理部15と、終了時背景画像から差分領域画像により示される領域を含む部分画像を抜き出し、部分画像を含む代表画像を生成する代表画像生成部16とを備えるので、データサイズが小さく且つチャプタの内容を把握できるチャプタの代表画像を生成することができる。
また、差分検出処理部15は、開始時背景画像を2値化し2値化画像を構成する各画素について、当該画素を中心にし且つ予め1以上の文字が入るように定められた大きさと形状を有する矩形を定義し、当該矩形を予め定められた複数のブロックに分割し、当該ブロック内の画素の濃度の勾配の方向を求め、当該方向のヒストグラムを求め、当該ヒストグラムに対応する特徴ベクトルを求める。
また、差分検出処理部15は、終了時背景画像を2値化し2値化画像を構成する各画素について、当該画素を中心にし且つ同じ大きさと同じ形状を有する矩形を定義し、当該矩形を同数のブロックに分割し、当該ブロック内の画素の濃度の勾配の方向を求め、当該方向のヒストグラムを求め、当該ヒストグラムに対応する特徴ベクトルを求める。
また、差分検出処理部15は、開始時背景画像と終了時背景画像の同じ位置での画素から求めた各特徴ベクトルの距離を求め、当該各距離を比較し、比較の結果に基づいて、当該位置での差異の有無を判定する。
よって、差分検出処理部15は、この判定結果に基づいて差分領域画像を生成することができる。
なお、チャプタ代表画像生成装置1としてコンピュータを機能させるためのコンピュータプログラムは、半導体メモリ、磁気ディスク、光ディスク、光磁気ディスク、磁気テープなどのコンピュータ読み取り可能な記録媒体に記録でき、また、インターネットなどの通信網を介して伝送させて、広く流通させることができる。
1 チャプタ代表画像生成装置
11 映像取得部
12 チャプタ検出部
13 開始時背景画像生成部
14 終了時背景画像生成部
15 差分検出処理部
16 代表画像生成部

Claims (3)

  1. 映像ファイルを構成するチャプタを代表する代表画像を生成するチャプタ代表画像生成装置であって、
    前記映像ファイルに映った場所で線が書かれ始める開始時から始まり線が消去される終了時で終わるチャプタを当該映像ファイルから検出するチャプタ検出部と、
    前記映像ファイルの前記開始時に再生されるフレーム画像を用いて当該フレーム画像に映った場所の背景を示す開始時背景画像を生成する開始時背景画像生成部と、
    前記映像ファイルの前記終了時に再生されるフレーム画像を用いて当該フレーム画像に映った場所の背景を示す終了時背景画像を生成する終了時背景画像生成部と、
    前記開始時背景画像および前記終了時背景画像の差分の領域を示す差分領域画像を生成する差分検出処理部と、
    前記終了時背景画像から前記差分領域画像により示される領域を含む部分画像を抜き出し、当該部分画像を含む代表画像を生成する代表画像生成部と
    を備え
    前記差分検出処理部は、
    前記開始時背景画像を2値化し2値化画像を構成する各画素について、当該画素を中心にし且つ予め1以上の文字が入るように定められた大きさと形状を有する矩形を定義し、当該矩形を予め定められた複数のブロックに分割し、当該ブロック内の画素の濃度の勾配の方向を求め、当該方向のヒストグラムを求め、当該ヒストグラムに対応する特徴ベクトルを求め、
    前記終了時背景画像を2値化し2値化画像を構成する各画素について、当該画素を中心にし且つ前記大きさと前記形状を有する矩形を定義し、当該矩形を前記複数のブロックの数と同数のブロックに分割し、当該ブロック内の画素の濃度の勾配の方向を求め、当該方向のヒストグラムを求め、当該ヒストグラムに対応する特徴ベクトルを求め、
    前記開始時背景画像と前記終了時背景画像の同じ位置での画素から求めた各特徴ベクトルの距離を求め、当該各距離を比較し、比較の結果に基づいて、当該位置での差異の有無を判定す
    ことを特徴とするチャプタ代表画像生成装置。
  2. 映像ファイルを構成するチャプタを代表する代表画像を生成するチャプタ代表画像生成装置の動作方法であって、
    前記チャプタ代表画像生成装置のチャプタ検出部が、前記映像ファイルに映った場所で線が書かれ始める開始時から始まり線が消去される終了時で終わるチャプタを当該映像ファイルから検出し、
    前記チャプタ代表画像生成装置の開始時背景画像生成部が、前記映像ファイルの前記開始時に再生されるフレーム画像を用いて当該フレーム画像に映った場所の背景を示す開始時背景画像を生成し、
    前記チャプタ代表画像生成装置の終了時背景画像生成部が、前記映像ファイルの前記終了時に再生されるフレーム画像を用いて当該フレーム画像に映った場所の背景を示す終了時背景画像を生成し、
    前記チャプタ代表画像生成装置の差分検出処理部が、前記開始時背景画像および前記終了時背景画像の差分の領域を示す差分領域画像を生成し、
    前記チャプタ代表画像生成装置の代表画像生成部が、前記終了時背景画像から前記差分領域画像により示される領域を含む部分画像を抜き出し、当該部分画像を含む代表画像を生成し、
    前記差分検出処理部は、
    前記開始時背景画像を2値化し2値化画像を構成する各画素について、当該画素を中心にし且つ予め1以上の文字が入るように定められた大きさと形状を有する矩形を定義し、当該矩形を予め定められた複数のブロックに分割し、当該ブロック内の画素の濃度の勾配の方向を求め、当該方向のヒストグラムを求め、当該ヒストグラムに対応する特徴ベクトルを求め、
    前記終了時背景画像を2値化し2値化画像を構成する各画素について、当該画素を中心にし且つ前記大きさと前記形状を有する矩形を定義し、当該矩形を前記複数のブロックの数と同数のブロックに分割し、当該ブロック内の画素の濃度の勾配の方向を求め、当該方向のヒストグラムを求め、当該ヒストグラムに対応する特徴ベクトルを求め、
    前記開始時背景画像と前記終了時背景画像の同じ位置での画素から求めた各特徴ベクトルの距離を求め、当該各距離を比較し、比較の結果に基づいて、当該位置での差異の有無を判定する
    ことを特徴とするチャプタ代表画像生成装置の動作方法。
  3. 請求項1記載のチャプタ代表画像生成装置としてコンピュータを機能させるためのコンピュータプログラム。
JP2012022946A 2012-02-06 2012-02-06 チャプタ代表画像生成装置およびその動作方法 Active JP5633823B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012022946A JP5633823B2 (ja) 2012-02-06 2012-02-06 チャプタ代表画像生成装置およびその動作方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012022946A JP5633823B2 (ja) 2012-02-06 2012-02-06 チャプタ代表画像生成装置およびその動作方法

Publications (2)

Publication Number Publication Date
JP2013162341A JP2013162341A (ja) 2013-08-19
JP5633823B2 true JP5633823B2 (ja) 2014-12-03

Family

ID=49174253

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012022946A Active JP5633823B2 (ja) 2012-02-06 2012-02-06 チャプタ代表画像生成装置およびその動作方法

Country Status (1)

Country Link
JP (1) JP5633823B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5565737B2 (ja) * 2012-02-06 2014-08-06 日本電信電話株式会社 映像イベント検出装置およびその動作方法
JP6602009B2 (ja) * 2014-12-16 2019-11-06 キヤノン株式会社 画像処理装置、画像処理方法、及びプログラム

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7260257B2 (en) * 2002-06-19 2007-08-21 Microsoft Corp. System and method for whiteboard and audio capture
JP4492124B2 (ja) * 2004-01-05 2010-06-30 富士ゼロックス株式会社 書込解析装置、方法、およびプログラム
JP2006162692A (ja) * 2004-12-02 2006-06-22 Hosei Univ 講義コンテンツ自動作成システム
JP5031291B2 (ja) * 2006-07-26 2012-09-19 株式会社日立ソリューションズ ダイジェスト作成装置、ダイジェスト作成方法、およびプログラム
JP5243365B2 (ja) * 2009-08-10 2013-07-24 日本電信電話株式会社 コンテンツ生成装置,コンテンツ生成方法およびコンテンツ生成プログラム

Also Published As

Publication number Publication date
JP2013162341A (ja) 2013-08-19

Similar Documents

Publication Publication Date Title
TWI253860B (en) Method for generating a slide show of an image
US9881215B2 (en) Apparatus and method for identifying a still image contained in moving image contents
CN106686452B (zh) 一种动态图片的生成方法及装置
EP3276483B1 (en) Background archiving and presentation method
CN105340014B (zh) 用于视频编辑的触摸优化设计
US8761582B2 (en) Video editing device and video editing system
KR102340196B1 (ko) 동영상 처리 장치 및 방법
US20110305439A1 (en) Device and method for automatically recreating a content preserving and compression efficient lecture video
CN105184838A (zh) 一种图片处理方法及终端
US11348254B2 (en) Visual search method, computer device, and storage medium
JP5633823B2 (ja) チャプタ代表画像生成装置およびその動作方法
CN114117120A (zh) 基于内容分析的视频文件智能索引生成系统及方法
CN111914682B (zh) 一种包含演示文稿的教学视频分割方法、装置及设备
US9886650B2 (en) Method and device for determining similarity between sequences
CN111709324A (zh) 一种基于时空一致性的新闻视频拆条方法
Selvaperumal et al. Haar wavelet transform based text extraction from complex videos
JP4540358B2 (ja) ポインタ位置特定プログラムおよびポインタ位置特定方法
US9224305B2 (en) Information processing apparatus, information processing method, and non-transitory computer readable medium storing information processing program
JP5565737B2 (ja) 映像イベント検出装置およびその動作方法
Ram et al. Video Analysis and Repackaging for Distance Education
US20200294552A1 (en) Recording device, recording method, reproducing device, reproducing method, and recording/reproducing device
WO2021230158A1 (ja) 画像処理装置、画像処理方法、及びプログラム
Maji et al. Content extraction from video lectures for low power display
Su et al. Robust handwriting extraction from lecture video
JP2024022847A (ja) 情報処理装置、情報処理方法およびプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130925

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20130925

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140630

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140722

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140904

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140930

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20141002

R150 Certificate of patent or registration of utility model

Ref document number: 5633823

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250