JP2006166105A - イベント検出方法及び装置及びプログラム - Google Patents

イベント検出方法及び装置及びプログラム Download PDF

Info

Publication number
JP2006166105A
JP2006166105A JP2004355505A JP2004355505A JP2006166105A JP 2006166105 A JP2006166105 A JP 2006166105A JP 2004355505 A JP2004355505 A JP 2004355505A JP 2004355505 A JP2004355505 A JP 2004355505A JP 2006166105 A JP2006166105 A JP 2006166105A
Authority
JP
Japan
Prior art keywords
video
event
feature
clustering
event detection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2004355505A
Other languages
English (en)
Other versions
JP4214990B2 (ja
Inventor
Dan Mikami
弾 三上
Seiichi Konya
精一 紺谷
Masashi Morimoto
正志 森本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2004355505A priority Critical patent/JP4214990B2/ja
Publication of JP2006166105A publication Critical patent/JP2006166105A/ja
Application granted granted Critical
Publication of JP4214990B2 publication Critical patent/JP4214990B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Television Signal Processing For Recording (AREA)
  • Image Analysis (AREA)

Abstract

【課題】 映像から撮影環境の影響を受けずに、イベントを高精度に検出する。
【解決手段】 本発明は、映像記憶手段から映像を読み込み、読み込まれた映像中の音響の特徴を検出し、音響の特徴に基づいて、イベント候補の検出を行い、イベント候補の映像区間から映像特徴を抽出し、映像特徴に基づいて、映像候補のクラスタリングを行い、クラスタリングの結果に基づいて、正解クラスタを選択し、該クラスタに対応するイベントを記憶手段に格納する。
【選択図】 図1

Description

本発明は、直線パターン識別方法及び装置及びプログラムに係り、特に、映像中から特定のイベントを検出するためのイベント検出方法及び装置及びプログラムに関する。
映像中からイベントを検出することにより、一覧性を向上させるといった研究は古くから行われている。例えば、野球映像中から投球のイベントを検出することにより、要約を行う方法がある(例えば、特許文献1参照)。
特開2003−52003号公報
しかしながら、上記従来の方法では、映像中の緑色領域の検出や、褐色領域の検出を行って、投手が投球するときの構図を検出することによって、投球イベントの特定を行っている。すなわち、テンプレートマッチングによる検出である。
しかし、内野には芝のないグランドもあれば、マウンドの砂の色が赤褐色のグランドから一般的な砂の色まで様々である。さらにそれは、デイゲームであったり、ナイトゲームであったりして映り方は様々に変化してしまう。さらに、カメラが設置される位置は球場及び放送局によって、変化してしまい、全ての球場、試合時刻、放送局において利用可能なテンプレートを用意するのは非常に難しい。
本発明は、上記の点に鑑みなされたもので、映像から撮影環境の影響を受けずに、イベントを高精度に検出することが可能なイベント検出方法及び装置及びプログラムを提供することを目的とする。
図1は、本発明の原理を説明するための図である。
本発明(請求項1)は、映像中から特定のイベントを検出するイベント検出方法において、
映像記憶手段から映像を読み込む映像読み込みステップ(ステップ1)と、
読み込まれた映像中の音響の特徴を検出する音響特徴検出ステップ(ステップ2)と、
音響の特徴が検出された映像区間に基づいて、イベント候補の検出を行うイベント候補検出ステップ(ステップ3)と、
イベント候補の映像区間における映像特徴を抽出する映像特徴抽出ステップ(ステップ4)と、
映像特徴に基づいて、映像候補のクラスタリングを行うクラスタリングステップ(ステップ5)と、
クラスタリングの結果に基づいて、正解クラスタを選択し、記憶手段に格納する正解クラスタ選択ステップ(ステップ6)と、を行う。
また、本発明(請求項2)は、正解クラスタ選択ステップ(ステップ6)の後に、
クラスタリングの結果からテンプレート画像を取得するテンプレート画像取得ステップと、
テンプレート画像により映像記憶手段の映像全体を再検索するイベント再検索ステップと、を更に行う。
また、本発明(請求項3)は、音響特徴検出ステップ(ステップ2)において、
音響パワー推移に突発音の特徴がある部分を音響の特徴として抽出する。
また、本発明(請求項4)は、映像特徴抽出ステップ(ステップ4)において、
映像特徴として、イベント候補の区間における画像のRGB値を用いる。
また、本発明(請求項5)は、映像特徴抽出ステップ(ステップ4)において、
映像特徴として、エッジ画像の方向成分を用いる。
また、本発明(請求項6)は、映像特徴抽出ステップ(ステップ4)において、
映像特徴として、動き特徴を用いる。
図2は、本発明の原理構成図である。
本発明(請求項7)は、映像中から特定のイベントを検出するイベント検出装置であって、
映像を記憶する映像記憶手段110と、
映像記憶手段110から映像を読み込む映像読み込み手段と、
読み込まれた映像中の音響の特徴を検出する音響特徴検出手段2と、
音響の特徴が検出された映像区間に基づいて、イベント候補の検出を行うイベント候補検出手段3と、
イベント候補の映像区間における映像特徴を抽出する映像特徴抽出手段4と、
映像特徴に基づいて、映像候補のクラスタリングを行うクラスタリング手段5と、
クラスタリングの結果に基づいて、正解クラスタを選択し、記憶手段120に格納する正解クラスタ選択手段6と、を有する。
また、本発明(請求項8)は、クラスタリングの結果からテンプレート画像を取得するテンプレート画像取得手段と、
テンプレート画像により映像記憶手段110の映像全体を再検索するイベント再検索手段と、を更に有する。
また、本発明(請求項9)は、音響特徴検出手段2において、
音響パワー推移に突発音の特徴がある部分を音響の特徴として抽出する。
また、本発明(請求項10)は、映像特徴抽出手段4において、
映像特徴として、イベント候補の区間における画像のRGB値を用いる。
また、本発明(請求項11)は、映像特徴抽出手段4において、
映像特徴として、エッジ画像の方向成分を用いる。
また、本発明(請求項12)は、映像特徴抽出手段4において、
映像特徴として、動き特徴を用いる。
本発明(請求項13)は、映像中から特定のイベントを検出するイベント検出プログラムであって、
請求項1乃至6記載のイベント検出方法を実現するための方法をコンピュータに実行させるプログラムである。
上記のように、本発明によれば、スポーツ映像(例えば、野球)と打撃や捕球の映像シーンとのマッチングを行う処理において、先に音響からシーン抽出処理を行い、次に、抽出した映像シーンのクラスタリング処理を行うことにより、従来の技術と比べて、高い精度で打撃や捕球の映像シーンとのマッチングが可能となる。このため、撮影環境に影響を受けずにイベントを高精度に検出することが可能となる。
以下、図面と共に本発明の実施の形態を説明する。
本発明では、イベント検出装置において、まず、経験的知識として、映像に比べて撮影角度などによる変化が少ない音響情報を用いた検出を行い、その後映像特徴を用いてイベントを絞り込む処理を行う。
図3は、本発明の一実施の形態におけるイベント検出装置の構成を示す。
同図に示すイベント検出装置は、読み込み部1、音響特徴抽出部2、イベント候補検出部3、映像特徴抽出部4、クラスタリング部5、正解クラスタ選択部6、テンプレート作成部7、テンプレート利用再検索部8、映像記憶部110及びイベント記憶部120から構成される。
読み込み部1は、映像記憶部110から映像を読み込み、音響特徴抽出部2に出力する。
音響特徴抽出部2は、読み込まれた映像の音響の特徴を抽出し、イベント候補検出部3に出力する。
イベント候補検出部3は、音響の特徴からイベント候補の検出を行い、映像特徴抽出部4に出力する。
映像特徴抽出部4は、イベント候補となった区間から、映像の特徴を抽出し、正解候補クラスタリング部5に出力する。
正解候補クラスタリング部5は、映像の特徴量に基づいてイベント候補のクラスタリングを行い、正解クラスタ選択部6に出力する。
正解クラスタ選択部6は、クラスタリング結果から正解クラスタを選択し、テンプレート作成部7に出力する。
テンプレート作成部7は、クラスタリング結果からテンプレート画像を取得する。
テンプレート利用再検索部8は、テンプレート画像により映像全体を再検索し、その結果をイベント記憶部120に格納する。
映像記憶部110は、ディスク装置等の記憶媒体であり、映像を蓄積する。
イベント記憶部120は、ディスク装置等の記憶媒体であり、テンプレート利用再検索部8から出力されたクラスタのイベントを記録する。
図4は、本発明の一実施の形態におけるイベント検出装置の動作のフローチャートである。
ステップ101) 読み込み部1において、映像記憶部110から映像を読み込む。
ステップ102) 音響特徴抽出部2において、読み込まれた映像の音響信号のパワーを計算し、当該パワーの推移に基づいて音響の特徴を抽出する。音響の特徴を抽出する方法としては、パワーの推移に突発音の特徴がある部分を検出する方法がある。
ステップ103) イベント候補検出部3は、音響特徴抽出部2により抽出された音響の特徴に基づいてイベント候補の検出を行う。具体的には、抽出された音響の特徴が含まれる映像の区間を検出する。
ステップ104) 映像特徴抽出部4は、イベント候補検出部3において検出された映像の区間から任意の方法により映像の特徴量を求める。
ステップ105) 正解候補クラスタリング部5は、映像特徴抽出部4で求められた特徴量に基づいて映像のクラスタリングを行う。クラスタリングの方法としては、映像特徴量を用いた教師なしクラスタリングを行う方法がある。
ステップ106) 正解クラスタ選択部6は、クラスタリングの結果に基づいて、正解クラスタを選択する。
ステップ107) テンプレート作成部7は、クラスタリングの結果からテンプレート画像を取得する。
ステップ108) テンプレート利用再検索部8は、テンプレート画像を用いて映像記憶部110を再検索し、その結果をイベント記憶部120に格納する。
なお、ステップ107とステップ108の処理は、必須でなく、映像特徴量として再検出に利用できる程度に出現する特徴(例えば、MHI:Motion History Image)を検出できた場合に、ステップ107においてテンプレートを生成し、ステップ108において当該テンプレートを用いて再検索することにより、良い結果を得ることができる。
以下、図面と共に本発明の実施例を説明する。
本実施例では、野球映像から音響解析によって投球後に発生する打球音、あるいは捕球音の候補を取得し、投球イベントの候補を求め、その投球イベントの各候補に対する動画像区間から動き特徴によるクラスタリングを行い、映像中から投球イベントを取得する例を説明する。
図5は、本発明の一実施例のイベント検出装置の構成を示す。
同図に示すイベント検出装置は、映像読み込み部10、突発音区間検出部20、突発音区間取得部40、突発音区間映像クラスタリング部50、テンプレート作成部70、テンプレート画像利用再建策部80、映像記憶部110、打捕球イベント記憶部120から構成される。
映像読み込み部10は、映像記憶部110から映像を読み込み、突発音区間検出部20に出力する。
突発音区間検出部20は、読み込まれた映像中から突発音響を含む部分を検出し、突発音区間映像取得部40に出力する。このとき、後述する音響解析により突発音を検出し、投球シーンの候補を取得する。
突発音区間映像取得部40は、検出された突発音区間について、その突発区間映像を取得し、突発音区間映像クラスタリング部50に出力する。
突発音区間映像クラスタリング部50は、突発音区間映像をクラスタリングすることにより、イベントを選択する。
テンプレート作成部70は、クラスタリング結果から、テンプレート画像を取得する。
テンプレート利用再検索部80は、テンプレート画像を用いて再検索し、その結果を打捕球イベント記憶部120に格納する。
図6は、本発明の一実施例のイベント検出処理のフローチャートである。
ステップ201) 映像読み込み部10は、映像記憶部110から映像を読み込む。
ステップ202) 突発音区間検出部20は、読み込まれた映像中から突発音響を含む部分を音響解析により検出する。
ステップ203) 突発区間映像取得部40において、ステップ202で検出された突発音区間に対応する映像を取得する。
ステップ204) 突発音区間映像クラスタリング部50において、ステップ203で取得した突発音区間映像をクラスタリングし、クラスタリング結果に基づいて、イベントを選択する。
ステップ205) テンプレート作成部70において、ステップ204で得られたクラスタリング結果からテンプレート画像を取得する。
ステップ206) テンプレート利用再検索部80において、テンプレート画像を用いて、映像記憶部110を再検索し、その結果を打捕球イベント記憶部120に格納する。
以下、上記の動作を詳細に説明する。
まず、上記のステップ202の突発音検出動作について説明する。
図7は、本発明の一実施例の突発音の検出のフローチャートである。
ステップ301) 突発音区間検出部20は、読み込まれた映像の音響信号のパワーを計算する。
ステップ302) パワーの推移に突発音の特徴がある部分を検出する。
次に、図7のステップ301について詳細に説明する。
図8は、本発明の一実施例の音響信号のパワーの計算方法のフローチャートである。
ステップ401) 突発音区間検出部20において、i=0と初期化する。
ステップ402) j=iからj=i+WindowSize(ウィンドウサイズ)の音響信号data[j]に対して窓関数をかける。窓関数としては、Hamming 窓やHanning窓、矩形窓などが有名である。ここでは、どのような窓関数を使っても特に構わない。
ステップ403) \sum_{j=i^{i+WindowSize}data[i]で、iからWindowSize幅の音響信号に対してパワーを計算し、p(i)に代入する。
ステップ404) iにWindowSlide(ウィンドウスライド量)を加算する。
ステップ405) i+WindowSlideがDataMaxよりも小さいかどうかを判断する。小さければ、ステップ402に移行し、そうでなければ処理を終了する。
次に、図7のステップ302の突発性検出処理について詳細に説明する。
図9は、本発明の一実施例の突発性検出処理のフローチャートである。
ステップ501) i=0と初期化する。
ステップ502) flag=0と初期化する。
ステップ503) 現在のflagにnew_flagを代入してから、new_flag=F(p(i),flag)を計算する。F(p(i),flag)は、ステップ301で求めたパワーと、現在のflagとから決定する関数である。new_flagの求め方を図10に示す。
ステップ504) new_flagが1であれば、ステップ505へ移行し、そうでなければステップ506に移行する。
ステップ505) 時刻stにiを代入する。
ステップ506) flag=3のときに、new_flagが1か0の場合には、ステップ507に移行し、それ以外の場合はステップ510に移行する。
ステップ507) tにi−stを代入する。
ステップ508) th4<t<th5を満たせばステップ509に移行し、そうでなければステップ510に移行する。
ステップ509) 時刻stを突発音区間の先頭として保存する。
ステップ510) i+WindowSlideを加えてステップ503に移行し、そうでなければステップ処理を終了する。
ステップ511) iにWindowSlideを加えてステップ503に移行する。
図10は、new_flagを求める関数を表した表である。突発音として検出されるのは網掛け部分であり、th1>p(i)かつflag=3の場合、new_flag=1となり、th3>p(i)>th1かつ、flag=3の場合は、new_flag=0となることを表している。
次に、ステップ204の突発音区間映像クラスタリング部50におけるサムネイル画像のクラスタリング処理について説明する。
図11は、本発明の一実施例のサムネイル画像のクラスタリングのフローチャートである。
ステップ701) 突発音区間映像から特徴を抽出する。
ステップ702) 突発音区間映像を特徴量を用いて教師なしクラスタリングを行う。
ステップ703) 要素数の多いNクラスタを打捕球クラスタとし、図12に示す打捕球イベント記憶部80に保存する。
次に、上記のステップ701の映像特徴の抽出処理について説明する。
図13は、本発明の一実施例のサムネイルの画像特徴量検出処理のフローチャート(その1)である。同図に示す処理は、画像を小さなブロックに区切ったときの画素値の平均値を用いて特徴量を検出するものである。
ステップ801) x=0、y=0と初期化する。
ステップ802) 左上が(x,y)、右下が(x+block_size, y+block_size)の矩形領域に関して、RGB(Red,Green,Blue)各々について、画素値の平均を求め、v[x/block_size][y/block_size]に代入する。
ステップ803) x+block_size<width-block_sizeであれば、ステップ804へ移行し、そうでなければステップ805に移行する。
ステップ804) xにblock_sizeを加えてステップ802へ移行する。
ステップ805) xに0を代入する。
ステップ806) y+block_size<height-block_sizeであれば、ステップ807へ移行し、そうでなければ処理を終了する。
ステップ805) xに0を代入する。
ステップ806) y+block_size<height-block_sizeであれば、ステップ807へ移行し、そうでなければ処理を終了する。
ステップ807) yにblock_sizeを加えて、ステップ802へ移行する。
上記の方法は、vを特徴量として用いるものである。
次に、上記のステップ701の別の実施方法について説明する。
図14は、本発明の一実施例のサムネイルの画像特徴量検出処理のフローチャート(その2)である。同図に示す処理は、エッジ画像の方向成分を用いて映像の特徴量を検出するものである。
ステップ1001) x=0、y=0と初期化する。
ステップ1002) 左上が(x,y)、右下が(x+block_size,y+block_size)の矩形領域に関して、RGB各々について、画素値のx方向差分を求め、d_x[x/block_size][y/block_size]に代入する。
ステップ1003) 左上が(x,y)、右下が(x+block_size, y+block_size)の木液領域に関して、RGB各々について、画素値のy方向差分を求め、d_y[x/block_size][y/block_size]に代入する。
ステップ1004) x+block_size<width-block_sizeであれば、ステップ1006へ移行する。そうでなければステップ805に移行する。
ステップ1005) xにblock_sizeを加えてステップ1002へ移行する。
ステップ1006) xに0を代入する。
ステップ1007) y+block_size<height-block_sizeであれば、ステップ807へ移行し、そうでなければ処理を終了する。
ステップ1008) yにblock_sizeを加えてステップ1002へ移行する。
上記の手法では、d_x及びd_yを特徴量として用いている。
上記のv,d_x及びd_yの全てを用いて画像特徴量の検出を行ってもよい。
さらに、ステップ701の別の方法として動き特徴を利用してもよい。その場合には、例えば、K. Fujii and K. Arakawa, “Video editing based on motion recognition using temporal templates,” Proc, ACM User Interface Software Technology (UIST) 2003, pp. 71-72,2003を利用することが可能である。なお、動き特徴を用いる場合には、図4のステップ104とステップ105の間に、ステップ104で取得した映像特徴をテンプレートとして用いて、映像記憶部110に格納されている映像全体を再検索する処理が必要となる。
次に、本実施例を実施した際の評価実験について説明する。
実験に用いたコンテンツは、メジャーリーグ放送映像(以降、放送映像)、及び自ら撮影したキャッチボール映像(以降、個人撮影映像)である。
放送映像は3種類、個人撮影映像は2種類のコンテンツについて実験を行った。全てのコンテンツとも44.1kHzのmpeg映像である。以降、音を用いた打捕球音検出の結果、それらをクラスタリングすることにより作成したテンプレートMHI(Motion History Image)の例、テンプレートMHIを用いて映像から投球シーン検出を行った結果について説明する。
まず、音による投球シーン検出を、テレビ放送コンテンツ及び家庭用テレビカメラで撮影したキャッチボール映像において実験した。その結果を表1に示す。
Figure 2006166105
音による投球シーン検出は球場、撮影環境により、その精度が大幅に変化してしまう。放送映像に関しては、人が聞いて打球音捕球音を何とか聞き取ることができる音響レベルのコンテンツである。そのため、再現率が低めの値になっている。
また、個人撮影のキャッチボールに関しては会話をしながらのキャッチボールであり、会話以外に大きな突発性雑音は含まれていない。検出漏れは、投球ミスにより捕球音が含まれないものであり、再現率の低さはキャッチャーからの返球の検出によるものが多い。
この適合率・再現率では、放送映像に関しては想定どおり適合率が50%を超えているため問題ないが、個人撮影映像に関しては50%を下回ってしまい、クラスタリング時に、投球イベントのクラスタの要素数が、他のクラスタの要素数を下回ってしまう可能性がある。
このクラスタリングでは、再現率が低すぎると、音検出による投球イベント検出の制度がよくない場合に問題が発生してしまう可能性があるが、一方で適合率を常に100%に保つ必要がある。さらに、実装上の問題として、初期クラスタ要素数nは、Ο(n2)で計算量を増大させる。これらの状況を考え、以降の実験では、n=3を用いることとした。
打捕球音により検出した投球イベント候補うち、クラスタリングによって得られたた投球イベントクラスタを用いてテンプレートを作成する。
個人撮影映像に関しては、適合率が約30%と低いため、投球イベント以外のクラスタの要素数が最も多くなってしまう危険性があった。しかし、実際には音による投球イベント検出での投球イベント候補のうち投球イベント以外に関しては、その時刻での動きが様々であり、大きな一つのクラスタにまとまることはなく、経験的に、個人撮影映像においても十分な制度でテンプレートMHIの作成が可能である。
テンプレートMHIとのマッチングによる投球シーン検出の結果を表2に示す。
Figure 2006166105
また、テンプレートMHIとの距離の時間による推移のグラフを図15に示す。表2から分かるとおり、再現率が95.8%、適合率が85.0%と、音による検出に比べて四度よく検出ができていることがわかる。さらに、適合率について、誤検出の全てがリプレーの投球シーンであった。リプレーはスロー再生しているため理想的には検出しないことが望ましいため不正解としているが、当然ながら非常に困難である。リプレーも正解とするならば、適合率は100%であり、適合率・再現率ともに高精度であることがわかる。
また、図15に示すテンプレートMHIと個人撮影映像との距離の時間変化において、距離が小さくなっている部分は全て投球イベントであった。これから分かるとおり、投球イベントとそのほかのイベントに関して十分に分離可能であり、テンプレートが適切なものであることも見て取れる。これから野球映像インデキシングとして極めて有用であることがわかる。
なお、図3、図5に示すイベント検出装置の一部もしくは全部の機能をコンピュータのプログラムで構成し、そのプログラムをコンピュータを用いて実行し、本発明を実現することができること、あるいは、図4、図6〜図9、図11、図13、図14のフローチャートや本文記載の説明文で示した処理の手順をコンピュータのプログラムで構成し、そのプログラムをコンピュータに実行させることができることはいうまでもなく、コンピュータでその機能を実現するためのプログラム、あるいは、コンピュータにその処理の手順を実行させるためのプログラムを、そのコンピュータが読み取り可能な記憶媒体、例えば、HDD,MO,ROM,メモリカード,CD,DVD,リムーバブルディスクなどに記録して、保存したり、配布したりすることが可能である。
上記のプログラムは、インターネットや電子メールなど、ネットワークを通して提供することも可能である。
以上、本発明の代表的な実施の形態及び実施例を説明したが、本発明は上記の実施の形態及び実施例に限定されることなく、特許請求の範囲内において、種々変更・応用が可能である。
本発明は、映像からイベントを検出する技術に適用可能である。
本発明の原理説明図である。 本発明の原理構成図である。 本発明の一実施の形態におけるイベント検出装置の構成図である。 本発明の一実施の形態におけるイベント検出装置の動作のフローチャートである。 本発明の一実施例のイベント検出装置の構成図である。 本発明の一実施例のイベント検出処理のフローチャートである。 本発明の一実施例の突発音の検出のフローチャートである。 本発明の一実施例の音響信号のパワーの計算方法のフローチャートである。 本発明の一実施例の突発性検出処理のフローチャートである。 本発明の一実施例のnew_flagの求め方F(p(i),flag)の例である。 本発明の一実施例のサムネイル画像のクラスタリング処理のフローチャートである。 本発明の一実施例の打捕球イベント記憶部の例である。 本発明の一実施例のサムネイルの画像特徴量検出処理のフローチャート(その1)である。 本発明の一実施例のサムネイルの画像特徴量検出処理のフローチャート(その2)である。 テンプレートMHIとの距離を示す図である。
符号の説明
1 読み込み手段、読み込み部
2 音響特徴抽出手段、音響特徴抽出部
3 イベント候補検出手段、イベント候補検出部
4 映像特徴抽出手段、映像特徴抽出部
5 クラスタリング手段、クラスタリング部
6 正解クラスタ選択手段、正解クラスタ選択部
7 テンプレート作成部
8 テンプレート利用再検索部
10 映像読み込み部
20 突発音区間検出部
40 突発音区間映像取得部
50 突発音区間映像クラスタリング部
70 テンプレート作成部
80 テンプレート利用再検索部
110 映像記憶手段、映像記憶部
120 イベント記憶手段、イベント記憶部、打捕球イベント記憶部

Claims (13)

  1. 映像中から特定のイベントを検出するイベント検出方法において、
    映像記憶手段から映像を読み込む映像読み込みステップと、
    読み込まれた前記映像中の音響の特徴を検出する音響特徴検出ステップと、
    前記音響の特徴が検出された映像区間に基づいて、イベント候補の検出を行うイベント候補検出ステップと、
    前記イベント候補の映像区間における映像特徴を抽出する映像特徴抽出ステップと、
    前記映像特徴に基づいて、映像候補のクラスタリングを行うクラスタリングステップと、
    前記クラスタリングの結果に基づいて、正解クラスタを選択し、記憶手段に格納する正解クラスタ選択ステップと、
    を行うことを特徴とするイベント検出方法。
  2. 前記正解クラスタ選択ステップの後に、
    前記クラスタリングの結果からテンプレート画像を取得するテンプレート画像取得ステップと、
    前記テンプレート画像により前記映像記憶手段の映像全体を再検索するイベント再検索ステップと、
    を更に行う請求項1記載のイベント検出方法。
  3. 前記音響特徴検出ステップにおいて、
    音響パワー推移に突発音の特徴がある部分を前記音響の特徴として抽出する請求項1記載のイベント検出方法。
  4. 前記映像特徴抽出ステップにおいて、
    前記映像特徴として、前記イベント候補の区間における画像のRGB値を用いる請求項1記載のイベント検出方法。
  5. 前記映像特徴抽出ステップにおいて、
    前記映像特徴として、エッジ画像の方向成分を用いる請求項4記載のイベント検出方法。
  6. 前記映像特徴抽出ステップにおいて、
    前記映像特徴として、動き特徴を用いる請求項4記載のイベント検出方法。
  7. 映像中から特定のイベントを検出するイベント検出装置であって、
    映像を記憶する映像記憶手段と、
    前記映像記憶手段から映像を読み込む映像読み込み手段と、
    読み込まれた前記映像中の音響の特徴を検出する音響特徴検出手段と、
    前記音響の特徴が検出された映像区間に基づいて、イベント候補の検出を行うイベント候補検出手段と、
    前記イベント候補の映像区間における映像特徴を抽出する映像特徴抽出手段と、
    前記映像特徴に基づいて、映像候補のクラスタリングを行うクラスタリング手段と、
    前記クラスタリングの結果に基づいて、正解クラスタを選択し、記憶手段に格納する正解クラスタ選択手段と、
    を有することを特徴とするイベント検出装置。
  8. 前記クラスタリングの結果からテンプレート画像を取得するテンプレート画像取得手段と、
    前記テンプレート画像により前記映像記憶手段の映像全体を再検索するイベント再検索手段と、
    を更に有する請求項7記載のイベント検出装置。
  9. 前記音響特徴検出手段は、
    音響パワー推移に突発音の特徴がある部分を前記音響の特徴として抽出する請求項7記載のイベント検出装置。
  10. 前記映像特徴抽出手段は、
    前記映像特徴として、前記イベント候補の区間における画像のRGB値を用いる請求項7記載のイベント検出装置。
  11. 前記映像特徴抽出手段は、
    前記映像特徴として、エッジ画像の方向成分を用いる請求項10記載のイベント検出装置。
  12. 前記映像特徴抽出手段は、
    前記映像特徴として、動き特徴を用いる請求項10記載のイベント検出装置。
  13. 映像中から特定のイベントを検出するイベント検出プログラムであって、
    前記請求項1乃至6記載のイベント検出方法を実現するための方法をコンピュータに実行させることを特徴とするイベント検出プログラム。
JP2004355505A 2004-12-08 2004-12-08 イベント検出方法及び装置及びプログラム Expired - Fee Related JP4214990B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004355505A JP4214990B2 (ja) 2004-12-08 2004-12-08 イベント検出方法及び装置及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004355505A JP4214990B2 (ja) 2004-12-08 2004-12-08 イベント検出方法及び装置及びプログラム

Publications (2)

Publication Number Publication Date
JP2006166105A true JP2006166105A (ja) 2006-06-22
JP4214990B2 JP4214990B2 (ja) 2009-01-28

Family

ID=36667596

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004355505A Expired - Fee Related JP4214990B2 (ja) 2004-12-08 2004-12-08 イベント検出方法及び装置及びプログラム

Country Status (1)

Country Link
JP (1) JP4214990B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009055445A (ja) * 2007-08-28 2009-03-12 Toshiba Corp 映像検索システム及び映像検索装置
JP2009055446A (ja) * 2007-08-28 2009-03-12 Toshiba Corp 映像検索システム及び映像検索装置
JP2012022622A (ja) * 2010-07-16 2012-02-02 Nippon Hoso Kyokai <Nhk> テンプレート画像生成装置およびテンプレート画像生成プログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009055445A (ja) * 2007-08-28 2009-03-12 Toshiba Corp 映像検索システム及び映像検索装置
JP2009055446A (ja) * 2007-08-28 2009-03-12 Toshiba Corp 映像検索システム及び映像検索装置
JP2012022622A (ja) * 2010-07-16 2012-02-02 Nippon Hoso Kyokai <Nhk> テンプレート画像生成装置およびテンプレート画像生成プログラム

Also Published As

Publication number Publication date
JP4214990B2 (ja) 2009-01-28

Similar Documents

Publication Publication Date Title
Li et al. Multisports: A multi-person video dataset of spatio-temporally localized sports actions
Zhu et al. Trajectory based event tactics analysis in broadcast sports video
Hanjalic Adaptive extraction of highlights from a sport video based on excitement modeling
CN107707931B (zh) 根据视频数据生成解释数据、数据合成方法及装置、电子设备
Yu et al. Trajectory-based ball detection and tracking in broadcast soccer video
Halvorsen et al. Bagadus: an integrated system for arena sports analytics: a soccer case study
US8195038B2 (en) Brief and high-interest video summary generation
JP5355422B2 (ja) ビデオの索引付けとビデオシノプシスのための、方法およびシステム
CN110381366B (zh) 赛事自动化报道方法、系统、服务器及存储介质
Zhu et al. Player action recognition in broadcast tennis video with applications to semantic analysis of sports game
US20030063798A1 (en) Summarization of football video content
Li et al. Automatic detection and analysis of player action in moving background sports video sequences
TW200536389A (en) Intelligent key-frame extraction from a video
US8897603B2 (en) Image processing apparatus that selects a plurality of video frames and creates an image based on a plurality of images extracted and selected from the frames
JP2008048279A (ja) 映像再生装置、方法およびプログラム
RU2609071C2 (ru) Навигация по видеопоследовательности через местоположение объекта
JP2007200249A (ja) 映像検索方法及び装置及びプログラム及びコンピュータ読み取り可能な記録媒体
CN109460724B (zh) 基于对象检测的停球事件的分离方法和系统
JP2019101892A (ja) オブジェクト追跡装置及びそのプログラム
Truong et al. Improved fade and dissolve detection for reliable video segmentation
Midhu et al. Highlight generation of cricket match using deep learning
JP4214990B2 (ja) イベント検出方法及び装置及びプログラム
CN112287771A (zh) 用于检测视频事件的方法、装置、服务器和介质
KR101701632B1 (ko) 판정 방법 및 장치
Tong et al. A unified framework for semantic shot representation of sports video

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070124

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080729

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080912

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20081014

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20081027

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111114

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111114

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121114

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121114

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131114

Year of fee payment: 5

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees