JP2005269015A - 複数のアルゴリズムを利用する動画像抽出装置 - Google Patents
複数のアルゴリズムを利用する動画像抽出装置 Download PDFInfo
- Publication number
- JP2005269015A JP2005269015A JP2004076112A JP2004076112A JP2005269015A JP 2005269015 A JP2005269015 A JP 2005269015A JP 2004076112 A JP2004076112 A JP 2004076112A JP 2004076112 A JP2004076112 A JP 2004076112A JP 2005269015 A JP2005269015 A JP 2005269015A
- Authority
- JP
- Japan
- Prior art keywords
- moving image
- algorithm
- scene
- motion vector
- algorithms
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Television Signal Processing For Recording (AREA)
Abstract
【課題】従来公知のブロック分割領域の動きベクトル分布による類似動画像抽出アルゴリズムの問題点を克服して、再現率及び適合率を向上させ得る新たな動画像抽出アルゴリズムを提供すること。
【解決手段】動画像データから特定シーンを抽出する動画像抽出装置において、複数のアルゴリズムの相互連携の下で抽出を行うことにより、再現率および適合率を高める。例えば、動画像蓄積装置と基準画像蓄積装置に蓄積されたデータから動きベクトルを計算し、類似シーンを抽出する第1のアルゴリズムと、テロップの表示等を識別してシーンの発生を知らせる第2のアルゴリズムを設け、両者の一致により動画像データに蓄積されている動画像データから基準画像の類似シーンを抽出する。
【選択図】図2
【解決手段】動画像データから特定シーンを抽出する動画像抽出装置において、複数のアルゴリズムの相互連携の下で抽出を行うことにより、再現率および適合率を高める。例えば、動画像蓄積装置と基準画像蓄積装置に蓄積されたデータから動きベクトルを計算し、類似シーンを抽出する第1のアルゴリズムと、テロップの表示等を識別してシーンの発生を知らせる第2のアルゴリズムを設け、両者の一致により動画像データに蓄積されている動画像データから基準画像の類似シーンを抽出する。
【選択図】図2
Description
本発明は、テレビ放送番組蓄積装置等の映像システムにおいて、大量の映像データの中から、特定のシーンを抽出する動画像抽出装置に係わる。
多チャンネル時代の到来により、膨大な映像データがテレビ放送され、また、ブロードバンドインターネットの普及により、様々な映像コンテンツが配信されるようになった。これにより長時間のテレビ放送番組全体を記録するようなテレビ画像蓄積装置が開発された。このため、後で自分の見たいシーンを探し出すのに非常に時間がかかるようになった。
このため、デジタル画像蓄積方式において用いられるMPEG2の動きベクトルを利用して動画像のシーンを分割し、そのシーンが検索を希望しているシーンであるかどうかを比較する方式が公知である。最近の半導体技術および大容量デジタルデータの蓄積技術の進歩で、このような画像の探索が可能になった。
通常のテレビ映像(NTSC方式)は1画面は約720画素×480ライン、30フレーム/秒で構成される。この映像をそのまま記憶すれば膨大なデータ量となるため、映像蓄積装置では、通常は圧縮符号化技術が適用される。圧縮符号化技術として現在はMPEG2などの技術が用いられている。
圧縮符号化技術の原理を簡単に説明すれば、テレビ映像の連続する前後のフレームは極めて類似性が高いので、前後のフレームで差分を取れば、動きのある部分のみが抽出される。更に抽出された画素に着目して、その画素の位置が前フレームと現フレームにおいてどのように動いたか、動きの大きさと方向(動きベクトル)を取り出す処理を行い、この動きベクトルの大きさだけ、現フレームを補正した後前フレームとの差分をとれば、より差分量は少なくなり、効率的な圧縮が可能になる。
この動きベクトルの大きさだけ現フレームを補正する操作を「動き補償」といっているが、この動きベクトルの計算を1画素単位で行うと計算量が膨大になるため、実際は16×16画素のブロックを単位として行われる。このブロックについての動きベクトルを利用して映像シーンを分割し、特定シーンを検出する装置が提案されている(例えば特許文献1「特定シーン抽出装置」参照)。
特許文献1によれば、1画面あたり720×480画素を16×16画素を単位とするブロックに分割すると、45×30ブロック、合計1350ブロックになる。しかしながら、1350の動きブロックの情報はなお膨大で、処理には不便であるので、特許文献1では9乃至25ブロック程度に低減することが提案されている。そのような大きいブロックを統合化ブロック、統合化ブロック中の動きベクトルを統合化動きベクトルと呼ぶ。
図8により特許文献1の動きベクトルによる動画像抽出装置の構成を説明する。図8において、動画像蓄積回路1に蓄積された動画像データを再生し、動きベクトル計算回路2でMPEG2の動きベクトルを計算し、動きベクトル計算回路2の出力はシーン分割回路3に入力される。シーン分割回路3では動きベクトルが急激に変化する時点を検出し、その時点を境にシーンが切り替わったと解釈して前後のシーンを分割する。シーン分割回路3の出力は動きベクトル統合化回路4に入力され、例えば、画面全体を3×3の9個の領域(ブロック)に分割し、夫々の領域内の統合化動きベクトルを計算する。この出力は統合化動きベクトル蓄積回路5に蓄積される。
動画像抽出の際の比較対象となる基準画像は、基準画像蓄積回路6に蓄積され、動きベクトル計算回路7で動画像データと同様に動きベクトルが計算され、検索キー生成回路8で比較対象としての統合化動きベクトルを生成し、蓄積する。比較演算回路9は統合化動きベクトル蓄積回路5の出力と検索キー生成回路9の出力を比較し、波形が一致すれば、検索対象のデータと判別し、その画像データを出力画像蓄積回路13に蓄積する。この動画像抽出装置は、各ブロックの多数のフレームを平均して統合化しているため画像の特徴が平準化され、誤りのシーンを抽出したり、所望のシーンを検出できずに、再現率及び適合率を向上させるのが難しい場合がある。
上記の再現率および適合率は、例えば野球の投球シーンを抽出するアルゴリズムでは次のように定義される。
再現率=(正確に投球シーンを判定した数)/(実際の投球シーン数)
適合率=(正確に投球シーンを判定した数)/(検索で判定された投球シーン数)
再現率=(正確に投球シーンを判定した数)/(実際の投球シーン数)
適合率=(正確に投球シーンを判定した数)/(検索で判定された投球シーン数)
あらゆる現象において、映像の動きの情報を統計的に解析すれば、映像の動き量の変化や特徴を得ることが可能である。しかし、従来のブロック分割領域の動きベクトル分布を用いる類似動画像抽出アルゴリズムの問題点は、「シーン」の各ブロックの多数フレームを平均化して統合するため、画面特徴が平均化され、標準偏差も大きくなり、誤りのシーンを抽出しやすいことである。
本発明が解決しようとする課題は、従来公知のブロック分割領域の動きベクトル分布による類似動画像抽出アルゴリズムの上記の問題点を克服して、再現率及び適合率を向上させ得る新たな動画像抽出アルゴリズムを提供することである。
上記の課題は、動きベクトルによりシーン抽出を行うアルゴリズムに、一つまたは複数の補助アルゴリズムを組み合わせ、それらの相互連携の下に動画像抽出操作を行うことにより解決される。
本発明に係る動画像抽出装置では、時間的経過とともに異なったアルゴリズムを組み合わせ適用して目的のシーンを抽出する。すなわち、補助アルゴリズムとしての各種の類似動画像抽出アルゴリズムをシーンの性質に合わせて予め用意しておき、これらにAND、OR、又はIFの論理を適用して組み合わせ連携させる。
本発明に係る動画像抽出装置抽出装置により、誤りのシーンを抽出する割合が減少し、再現率および適合率が向上する。
本発明の実施形態として、以下の(1)〜(5)を挙げることができる。
(1)動きベクトルにより動画像を抽出するアルゴリズムをアルゴリズムAとして、それに付随する現象を検出するアルゴリズムを選び、これをアルゴリズムBとする。アルゴリズムAによる抽出結果に、さらにアルゴリズムBを適用して動画像を抽出すれば、アルゴリズムAだけで抽出する場合に比較して格段に再現率および適合率を高めることができる。
(1)動きベクトルにより動画像を抽出するアルゴリズムをアルゴリズムAとして、それに付随する現象を検出するアルゴリズムを選び、これをアルゴリズムBとする。アルゴリズムAによる抽出結果に、さらにアルゴリズムBを適用して動画像を抽出すれば、アルゴリズムAだけで抽出する場合に比較して格段に再現率および適合率を高めることができる。
(2)コンテンツに特徴あるシーンまたは特徴のあるカメラワークによるコンテンツの動きの変化が引き続いて起こる場合は、複数のアルゴリズムを連携させることにより再現率および適合率を向上させることができる。例えば野球コンテンツでは、ホームランを打った時、スタンドにボールが入るシーンと打者がダイヤモンドを周回するシーンは組み合わせになる。サッカーのゴールシーンでは、ゴールにボールが入るシーンと、観衆が喜び合うシーンは組み合わせになることが多い。それぞれのシーンを抽出するアルゴリズムを作成し、ANDおよびORの論理でこれらのアルゴリズムを連携させれば、そのシーンの再現率および適合率を向上させることができる。
(3)野球の投球シーンではテロップで投球スピードを表示することが多い。また投球シーンが終了するとスコアが変わり、これもテロップ画面で表示される。これらを識別して投球シーンの画像を抽出すれば、高い再現率および適合率で投球シーンを抽出できる。
(4)音声または音響データを利用する方法を挙げることができる。音声または音響データを利用する方法では、動画像記憶装置から再生された動画像の音声または音響データを音響信号識別回路で分析し、抽出すべき動画像に関連した音響データや、会場の歓声あるいはアナウンスの音声があるかどうかを比較演算回路で照合し、抽出すべき現象が起こっているかどうかを照合する。もしこのような音響データが示されない時は、画像データの照合結果が肯定的であっても、該当する現象は起きていないものと判断する。
(5)カメラワークから動画像の全体的な動きを捉え、特定シーンを抽出することが可能である。例えば、野球の動画像ではホームランを打った時のカメラワークは、他のシーンとは異なる動きをする。このカメラの動きを記録し、このパターンを捉えるアルゴリズムにより、ホームランのシーンを抽出することができる。
図1は本発明の第1の実施例を示すブロック図である。これは、図8に示された公知の装置にアルゴリズムB計算回路14を加えて、動画像蓄積回路1の出力及び基準画像蓄積回路6の出力から、動きベクトルによる動画像抽出のアルゴリズムAとは異なる別のアルゴリズムBにより動画像の抽出を行い、比較演算回路12によりアルゴリズムAとアルゴリズムBのANDを取り、それを出力画像蓄積回路13に蓄積するものである。
上記におけるアルゴリズムBはアルゴリズムAを補強するアルゴリズムであって、所望の動画像に付随して現れる現象を検出する。これは画面に現れる付随的な表示でも、画像とともに現れる音声や音響、撮影時のカメラワークなどであっても良く、それらの組み合わせも含まれる。上記のアルゴリズムAとアルゴリズムBが同時に成立することで特定シーンと判定し、その画像を出力する。
図2は幾つかのアルゴリズムの論理の組み合わせにより、単一のアルゴリズムによる動画像抽出を補強する一例である。ここでは図1におけるA×Bの拡張として4つのアルゴリズムを考え、先行のシーンで論理式(A×B)+Cで動画像の抽出を行う。更に後続のシーンでアルゴリズムDが成立するか確認し、これらのすべての条件が満足されたなら所望の動画像が抽出されたものとする。
ここでアルゴリズムAとアルゴリズムBはANDの関係で、(A×B)とCはORで関係づけられている。そして(A×B)とCのいずれかが成立したならば、アルゴリズムDを適用しようとする。つまり(A×B+C)×Dの条件である。このように幾つかのアルゴリズムを適宜に組み合わせて動画像を検出すれば、再現率及び適合率を向上させることができる。
この例では、アルゴリズムDは他のアルゴリズムより判別時点が遅れている。例えばサッカーのゴールシーンを抽出する場合、アルゴリズムAは攻撃側選手のシュートシーン、アルゴリズムBはゴールキーパーの動作を示し、アルゴリズムCは審判のゴールインの判定シーンである、更にこれに遅れた後続のシーンで観衆が歓声を上げている動画像がアルゴリズムDで抽出される。このように4つのシーンの抽出を(A×B+C)×Dで判断することにより、より確実にゴールシーンの再現率および適合率を向上させることが可能になる。
図3ないし図6は本発明の第2の実施例の説明図である。図3は補助アルゴリズムとして映像画面に現れるテロップを利用する抽出装置の構成図である。基準画像蓄積回路6により再生された基準画像データを使用し、テロップ条件設定回路10は、後述するテロップ条件設定アルゴリズムに従ってテロップ条件を設定する。テロップ抽出回路11において、動画像蓄積回路1により再生された動画像データをこのテロップ条件と照合して、動画像にテロップが表示されていることを示す信号を得る。
比較演算回路12は、比較演算回路9よりのアルゴリズムAの出力信号と、テロップ抽出回路11からのアルゴリズムBの照合信号を受け、この両方のアルゴリズムで条件が満足されていることを確認して類似動画像が抽出される。 投球シーンの例では、投手の投球シーンを検出した動画像データに、球速表示のテロップがあれば、比較演算回路12で両方のアルゴリズムを確認し、その動画像を投球シーンのものとして出力画像蓄積回路13に記録する。
図4はこの過程を示すフローチャートであり、アルゴリズムAとアルゴリズムBのANDを取って類似画像の出力が得られるので、アルゴリズムAのみの場合に比較して、要求されるシーンの抽出がより高い再現率および適合率で実行できる。
図5、図6は本発明のテロップ抽出のアルゴリズムの説明図である。テロップを判別するにはフレームにおける真白および真黒のピクセルの数が抽出条件を満足し、かつ、この判定条件が、あるフレーム数以上継続することを確認する必要がある。即ち、テロップの抽出条件は下記のようにまとめられる。
抽出条件1:テロップが存在するフレームとそのブロックを指定し、そのピクセルの色表示で真白、真黒を表示するピクセル数を数え、その数が統計的に決めたしきい値を超えること。真白のピクセルがa以上、真黒のピクセルがb以上あること。
抽出条件2:テロップを検出したフレーム数が連続してcフレーム以上あること。
抽出条件3:抽出条件1と抽出条件2がともに満足されること(ANDの関係)。
抽出条件2:テロップを検出したフレーム数が連続してcフレーム以上あること。
抽出条件3:抽出条件1と抽出条件2がともに満足されること(ANDの関係)。
この動作を図により説明すると、図5のブロック表は動画像のあるフレームの表示画面を5×5の25に分割したものであり、先ず、どのブロックにテロップが表示されるかを基準画像についてチェックする。例えば、E2ブロックを指定して約10フレーム以上の映像でテロップの抽出条件を検証する。真白のピクセルの数がa(=10)以上、真黒のピクセル数がb(=120)以上に達すればそのフレームは球速表示のテロップであると判定される。(抽出条件1)
c(=10)フレーム以上連続して上記の条件を満足すれば、テロップフレームと判別される。このa、b、cの値およびテロップの位置はテロップの種類により異なるので、基準映像データで確認して、しきい値およびテロップの位置を設定する。図6のフローチャートはこのアルゴリズムを図示したものである。このように、第1のアルゴリズムと第2のアルゴリズムの両方を照合することにより、要求されている現象の発生を、より確実に検出することができる。
図7は本発明の第3の実施例の構成を示すブロック図である。図7は動画像データに同時に記録されている音声データを取り出して、観衆の歓声をレベルで識別してホームランのような事象が生じたことを判定する場合を示す。動画像蓄積回路1に蓄積された、動画像データを再生し、その音声データを音響信号識別回路15に入力する。ここで音声の信号レベルを時間を追って識別し、映像データよりホームランのシーンが抽出されている時に、この音響信号識別回路で平常より高い信号レベルの歓声が検知された場合は、その出力を比較演算回路12へ送る。このような歓声は、ホームランのシーンより遅れて発生するので、比較演算回路9の映像信号により動画像を抽出するアルゴリズムAの信号は、比較演算回路12より、一旦前シーン蓄積回路16に蓄積し、1シーン遅れて到着する音響信号識別回路15よりの信号と同期を取る。
本発明により、放送番組蓄積装置等における動画像の抽出が高い再現率および適合率で実現できる。本発明は、放送送出側の番組制作にあたり、撮影済みの画像データを効率的に管理できるほか、受信者側でも放送された番組を録画して保存した場合、必要により画像データを検索し、再生して鑑賞することができる。
1 動画像蓄積回路
2 動きベクトル計算回路
3 シーン分割回路
4 動きベクトル統合化回路
5 統合化動きベクトル蓄積回路
6 基準画像蓄積回路
7 動きベクトル計算回路
8 検索キー生成回路
9 比較演算回路
10 テロップ条件設定回路
11 テロップ抽出回路
12 比較演算回路
13 出力画像蓄積回路
14 アルゴリズムB計算回路
15 音響信号識別回路
16 前シーン蓄積回路
2 動きベクトル計算回路
3 シーン分割回路
4 動きベクトル統合化回路
5 統合化動きベクトル蓄積回路
6 基準画像蓄積回路
7 動きベクトル計算回路
8 検索キー生成回路
9 比較演算回路
10 テロップ条件設定回路
11 テロップ抽出回路
12 比較演算回路
13 出力画像蓄積回路
14 アルゴリズムB計算回路
15 音響信号識別回路
16 前シーン蓄積回路
Claims (3)
- 動きベクトルによりシーン抽出を行うアルゴリズムに、一つまたは複数の補助アルゴリズムを組み合わせ、それらの相互連携により、再現率および適合率を高めた動画像抽出装置。
- 前記補助アルゴリズムの一つが、テロップの画像を利用してシーン検出を行うアルゴリズムである、請求項1記載の動画像抽出装置。
- 前記補助アルゴリズムの一つが、動画像に伴う音声または音響を利用してシーン検出を行うアルゴリズムである、請求項1記載の動画像抽出装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004076112A JP2005269015A (ja) | 2004-03-17 | 2004-03-17 | 複数のアルゴリズムを利用する動画像抽出装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004076112A JP2005269015A (ja) | 2004-03-17 | 2004-03-17 | 複数のアルゴリズムを利用する動画像抽出装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2005269015A true JP2005269015A (ja) | 2005-09-29 |
Family
ID=35093118
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004076112A Pending JP2005269015A (ja) | 2004-03-17 | 2004-03-17 | 複数のアルゴリズムを利用する動画像抽出装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2005269015A (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010252013A (ja) * | 2009-04-15 | 2010-11-04 | Nippon Hoso Kyokai <Nhk> | 映像検索装置及び映像検索プログラム |
KR20160025474A (ko) * | 2014-08-27 | 2016-03-08 | 후지쯔 가부시끼가이샤 | 판정 방법 및 장치 |
WO2016067553A1 (ja) * | 2014-10-30 | 2016-05-06 | パナソニックIpマネジメント株式会社 | プレー区間抽出方法、プレー区間抽出装置 |
CN111510713A (zh) * | 2020-04-24 | 2020-08-07 | 广州视源电子科技股份有限公司 | 一种板卡测试方法、装置、终端及系统 |
-
2004
- 2004-03-17 JP JP2004076112A patent/JP2005269015A/ja active Pending
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010252013A (ja) * | 2009-04-15 | 2010-11-04 | Nippon Hoso Kyokai <Nhk> | 映像検索装置及び映像検索プログラム |
KR20160025474A (ko) * | 2014-08-27 | 2016-03-08 | 후지쯔 가부시끼가이샤 | 판정 방법 및 장치 |
JP2016048852A (ja) * | 2014-08-27 | 2016-04-07 | 富士通株式会社 | 判定プログラム、方法、及び装置 |
KR101701632B1 (ko) * | 2014-08-27 | 2017-02-01 | 후지쯔 가부시끼가이샤 | 판정 방법 및 장치 |
US10200764B2 (en) | 2014-08-27 | 2019-02-05 | Fujitsu Limited | Determination method and device |
WO2016067553A1 (ja) * | 2014-10-30 | 2016-05-06 | パナソニックIpマネジメント株式会社 | プレー区間抽出方法、プレー区間抽出装置 |
JPWO2016067553A1 (ja) * | 2014-10-30 | 2017-08-17 | パナソニックIpマネジメント株式会社 | プレー区間抽出方法、プレー区間抽出装置 |
CN111510713A (zh) * | 2020-04-24 | 2020-08-07 | 广州视源电子科技股份有限公司 | 一种板卡测试方法、装置、终端及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Kobla et al. | Identifying sports videos using replay, text, and camera motion features | |
JP4559935B2 (ja) | 画像記憶装置及び方法 | |
US8014566B2 (en) | Image processing apparatus | |
US7916171B2 (en) | Classification apparatus for sport videos and method thereof | |
US7483624B2 (en) | System and method for indexing a video sequence | |
JP4577774B2 (ja) | スポーツ映像の分類装置およびログ生成装置 | |
US20160261929A1 (en) | Broadcast receiving apparatus and method and controller for providing summary content service | |
JP2004128550A (ja) | 動画像データのシーン分類装置 | |
KR20030026529A (ko) | 키프레임 기반 비디오 요약 시스템 | |
US20070201764A1 (en) | Apparatus and method for detecting key caption from moving picture to provide customized broadcast service | |
US11386548B2 (en) | Method, apparatus and computer program product for storing images of a scene | |
US8363726B2 (en) | Electronic apparatus, motion vector detecting method, and program therefor | |
JP2005269015A (ja) | 複数のアルゴリズムを利用する動画像抽出装置 | |
JP4999015B2 (ja) | 動画像データの分類装置 | |
JP2859345B2 (ja) | シーン変化検出方法 | |
JP2003143546A (ja) | フットボールビデオ処理方法 | |
JP2009044423A (ja) | シーン検出システム及びシーン検出方法 | |
JP5070179B2 (ja) | シーン類似判定装置、そのプログラム及びサマリ映像生成システム | |
JP3609236B2 (ja) | 映像テロップ検出方法および装置 | |
JP2011101161A (ja) | 撮像装置、その制御方法、再生装置およびプログラム | |
JP4396914B2 (ja) | 動画像データの分類装置 | |
Hirzallah | A Fast Method to Spot a Video Sequence within a Live Stream. | |
EP3716096A1 (en) | A method, apparatus and computer program product for identifying new images of a scene | |
JP3906854B2 (ja) | 動画像の特徴場面検出方法及び装置 | |
JP4662169B2 (ja) | プログラム、検出方法、及び検出装置 |