JP2004118718A - シーン変化点検出方法および装置並びにプログラム - Google Patents
シーン変化点検出方法および装置並びにプログラム Download PDFInfo
- Publication number
- JP2004118718A JP2004118718A JP2002283897A JP2002283897A JP2004118718A JP 2004118718 A JP2004118718 A JP 2004118718A JP 2002283897 A JP2002283897 A JP 2002283897A JP 2002283897 A JP2002283897 A JP 2002283897A JP 2004118718 A JP2004118718 A JP 2004118718A
- Authority
- JP
- Japan
- Prior art keywords
- scene change
- frn
- change point
- frame
- frames
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Landscapes
- Image Processing (AREA)
- Image Analysis (AREA)
Abstract
【課題】明るさは変化するが時間軸上の変化はない等、所望とするシーンチェンジタイプに応じてシーン変化点を検出する。
【解決手段】サンプリング手段1により、動画像データM0からフレームFrN,FrN+1をサンプリングし、特徴量抽出手段2により、各フレームから輝度情報および色情報からなる特徴量を抽出する。抽出された特徴量のうち、輝度情報からは明るさが変化するフレーム間をシーン変化点候補として検出し、色情報からは時間軸上において図柄が変化するフレーム間をシーン変化点候補として検出し、これらのシーン変化点候補の検出結果に基づいて、明るさは変化するが、時間軸上の変化はないシーン変化点のように、所望とするシーンチェンジタイプに応じたシーン変化点を検出する。
【選択図】 図1
【解決手段】サンプリング手段1により、動画像データM0からフレームFrN,FrN+1をサンプリングし、特徴量抽出手段2により、各フレームから輝度情報および色情報からなる特徴量を抽出する。抽出された特徴量のうち、輝度情報からは明るさが変化するフレーム間をシーン変化点候補として検出し、色情報からは時間軸上において図柄が変化するフレーム間をシーン変化点候補として検出し、これらのシーン変化点候補の検出結果に基づいて、明るさは変化するが、時間軸上の変化はないシーン変化点のように、所望とするシーンチェンジタイプに応じたシーン変化点を検出する。
【選択図】 図1
Description
【0001】
【発明の属する技術分野】
本発明は、動画像におけるシーンの変化点を検出するシーン変化点検出方法および装置並びにシーン変化点検出方法をコンピュータに実行させるためのプログラムに関するものである。
【0002】
【従来の技術】
CPUの高速化やメモリの大容量化により、静止画像よりも容量が大きい動画像を簡易に扱うことが可能となってきている。このような動画像を扱う際には、動画像に含まれるシーンの変わり目を表すシーン変化点を検出することにより、動画像に含まれる見たいシーンを検索することが容易となる。このようなシーン変化点を検出するために、動画像中の連続する2枚のフレームの間において、図柄が変化することによりフレームが不連続となる場合に、そのフレーム間を動画像のシーン変化点と判定する方法が提案されている(例えば特許文献1参照)。
【0003】
しかしながら、上記特許文献1に記載された方法は、ストロボ発光や機器の障害により瞬間的に画像が乱れた場合であっても、それもシーン変化点として検出してしまうため、1つのシーンの中に瞬間的な画像の乱れが含まれると、同一シーンであるにも関わらず、シーンが分断されてしまうという問題がある。
【0004】
このため、フレームに含まれるカラーヒストグラムを含む特徴量を算出し、対象とするフレームとその直前のフレームとの特徴量との相関を表す第1の相関係数と、それ以前のフレームとの特徴量との相関を表す第2の相関係数とを算出し、第1および第2の相関係数の双方が許容範囲を超えた場合に、対象とするフレームをシーン変化点として検出する方法が提案されている(特許文献2参照)。この方法によれば、1つのシーンの中に瞬間的な画像の乱れが含まれていても、真のシーン変化点を検出することが可能となる。
【0005】
【特許文献1】
特開平4−111181号公報
【0006】
【特許文献2】
特開平8−227462号公報
【0007】
【発明が解決しようとする課題】
しかしながら、シーン変化点はフレームを時間軸上に並べた場合に図柄が変化することによりフレームが不連続となる点のみならず、図柄は変わらないものの明るさが変化する点や、図柄は変わらないもののフレームに含まれる被写体が大きく移動する点等種々のタイプ(以下シーンチェンジタイプとする)があるため、上記特許文献2に記載された方法では所望とするシーンチェンジタイプに応じたシーン変化点の検出には対応することができない。
【0008】
本発明は上記事情に鑑みなされたものであり、所望とするシーンチェンジタイプに応じてシーン変化点を検出することを目的とする。
【0009】
【課題を解決するための手段】
本発明によるシーン変化点検出方法は、連続する複数のフレームからなる動画像からシーンの変わり目を表すシーン変化点を検出するシーン変化点検出方法において、
各フレームおよび該各フレームに前後する1または複数のフレームから、シーンチェンジタイプに応じたシーン変化の特徴を表す複数の特徴量を抽出し、
該複数の特徴量に基づいて所望とするシーンチェンジタイプに応じたシーン変化点を検出することを特徴とするものである。
【0010】
「各フレームに前後する1または複数のフレーム」とは、対象となるフレームの直前または直後における1以上のフレームのことをいう。
【0011】
「シーン変化の特徴を表す特徴量」とは、シーンの変わり目においてシーンチェンジタイプに応じて特異な変化が現れるパラメータであり、具体的にはフレーム間の輝度のヒストグラムの差分値の総和、輝度のメディアン値の差分値、輝度の平均値の差分値、輝度の標準偏差の差分値、色のヒストグラムの差分値の総和、色のメディアン値の差分値、色の平均値の差分値、色の標準偏差の差分値、これらの差分値を正規化した値、フレーム間の色の相関値、およびフレーム間の動ベクトル等を用いることができる。
【0012】
「シーンチェンジタイプ」としては、例えばシーンの図柄が全く異なることにより、動画像の時間軸上においてシーンの内容が不連続となる点(以下、時間軸上の不連続な点とする)、撮影方向が大きく変更されたり被写体が大きく移動する等によりシーンの動きが大きい点(以下動きが大きい点とする)および明るさの変化が大きい点等が挙げられる。
【0013】
「所望とするシーンチェンジタイプ」としては、シーンチェンジタイプの組み合わせとして表されるシーンチェンジタイプを意味し、具体的には時間軸上の変化はないが明るさが変化するというタイプ、時間軸上の変化はないが動きが大きいタイプ等が挙げられる。
【0014】
本発明によるシーン変化点検出装置は、連続する複数のフレームからなる動画像からシーンの変わり目を表すシーン変化点を検出するシーン変化点検出装置において、
各フレームおよび該各フレームに前後する1または複数のフレームから、シーンチェンジタイプに応じたシーン変化の特徴を表す複数の特徴量を抽出する特徴量抽出手段と、
該複数の特徴量に基づいて所望とするシーンチェンジタイプに応じたシーン変化点を検出する変化点検出手段とを備えたことを特徴とするものである。
【0015】
なお、本発明によるシーン変化点検出方法をコンピュータに実行させるためのプログラムとして提供してもよい。
【0016】
【発明の効果】
本発明によれば、各フレームおよび各フレームに前後する1または複数のフレームからシーンチェンジタイプに応じた複数の特徴量が抽出され、抽出された複数の特徴量に基づいて、所望とするシーンチェンジタイプに応じたシーン変化点が検出される。このため、所望とするシーンチェンジタイプに応じて特徴量を適切に選択することにより、所望とするシーンチェンジタイプに応じたシーン変化点を適切に検出することができる。
【0017】
【発明の実施の形態】
以下図面を参照して本発明の実施形態について説明する。図1は本発明の第1の実施形態によるシーン変化点検出装置の構成を示す概略ブロック図である。図1に示すように、本実施形態によるシーン変化点検出装置は、入力された動画像データM0から複数のフレームをサンプリングするサンプリング手段1と、処理の対象となるフレームFrNおよびフレームFrNの直後のフレームFrN+1のそれぞれから複数の特徴量を抽出する特徴量抽出手段2と、特徴量抽出手段2に基づいて抽出された複数の特徴量に基づいて、所望とするシーンチェンジタイプに応じたシーン変化点を検出する変化点検出手段3とを備える。
【0018】
サンプリング手段1は、動画像データM0から複数のフレームをサンプリングする。ここで、動画像データM0はカラーの動画像を表すものであり、各フレームはY,Cb,Crの輝度色差成分からなるものとする。
【0019】
特徴量抽出手段2は、処理の対象となるフレームFrN,FrN+1のそれぞれからシーンチェンジタイプに応じたシーン変化点を検出可能な特徴量を抽出する。
【0020】
ここで、シーンチェンジタイプと特徴量との関係について説明する。図2はシーンチェンジタイプと特徴量との関係の例を表すテーブルである。図2に示すように、動画像のシーンチェンジタイプとしては、例えば図柄が全く異なることにより動画像の時間軸上においてシーンが不連続となる「(1)時間軸の不連続点」、撮影方向が大きく変更されたり被写体が大きく移動する等によりシーンの動きが大きい「(2)動きが大きい点」および「(3)明るさが変化する点」が挙げられる。ここで、フレームFrN,FrN+1間における色画素の差分は上記(1)および(2)は検出しやすいが(3)は検出しにくい。また、フレームFrN,FrN+1間における色ヒストグラムの差分は上記(1)は検出しやすいが(2)および(3)は検出しにくい。さらに、フレームFrN,FrN+1間における輝度平均値の差分は、上記(1)および(3)は検出しやすいが(2)は検出しにくいという特徴がある。
【0021】
このため、本実施形態においては、シーンチェンジタイプに応じた複数の特徴量をフレームFrNおよびフレームFrN+1から抽出し、変化点検出手段3において、抽出された特徴量に基づいて、後述するようにシーンチェンジタイプに応じたシーン変化点を検出するようにしたものである。
【0022】
ここで、第1の実施形態においては、明るさの変化は検出するが、時間軸上の変化を検出しないようにすることにより、明るさが変化するが時間軸上の変化はない変化点をシーン変化点と見なすシーンチェンジタイプを、所望とするシーンチェンジタイプとする。
【0023】
このため、第1の実施形態における特徴量抽出手段2は、フレームFrN,FrN+1の輝度情報および色情報を特徴量として抽出する。まず、輝度情報の抽出について説明する。輝度情報としては、フレームFrN,FrN+1の輝度成分のヒストグラムの差分値の総和、フレーム全体についてのメディアン値の差分値、平均値の差分値および標準偏差の差分値等を用いることができるが、第1の実施形態においては輝度成分のフレーム全体についての平均値の差分値の絶対値を輝度情報として用いるものとする。
【0024】
ここで、フレームFrN,FrN+1についての輝度成分の平均値をそれぞれYn,Yn+1とすると、平均値Yn,Yn+1は、フレームFrN,FrN+1の各画素についての輝度成分のフレームFrN,FrN+1の全画素についての総和を、全画素数により除した値として算出することができる。そして特徴量抽出手段2は、フレームFrNの輝度成分の平均値YnおよびフレームFrN+1の輝度成分の平均値Yn+1の差分値の絶対値|Yn−Yn+1|を輝度情報として算出する。なお、輝度成分の差分は明るさの変化を検出しやすい特徴量である。ここで、ノイズを除去するために、平均値Yn,Yn+1を求める前にフレームFrN,FrN+1の全画素にローパスフィルタによるフィルタリング処理を施してもよい。
【0025】
次いで、色情報の算出について説明する。色情報としては、フレームFrN,FrN+1の色差成分のヒストグラムの差分値の総和、フレーム全体についてのメディアン値の差分値、平均値の差分値および標準偏差の差分値等を用いることができるが、第1の実施形態においては色差成分のヒストグラムの差分値の絶対値を色情報として用いるものとする。
【0026】
具体的には、図3に示すようにフレームFrNの色差成分Cb,Crについての3次元ヒストグラムHn(Cb,Cr)およびフレームFrN+1の色差成分Cb,Crについての3次元ヒストグラムHn+1(Cb,Cr)を作成し、ヒストグラムHn(Cb,Cr)とヒストグラムHn+1(Cb,Cr)との差分値の絶対値|Hn(Cb,Cr)−Hn+1(Cb,Cr)|の全ての色差成分Cb,Crについての総和を下記の式(1)により算出し、これを色情報とする。なお、色差成分のヒストグラムの差分値は時間軸の不連続を検出しやすい特徴量である。なお、特徴量の変化を滑らかにするために、差分値の絶対値を求める前に、ヒストグラムHn(Cb,Cr)およびヒストグラムHn+1(Cb,Cr)にローパスフィルタによるフィルタリング処理を施してもよい。
【数1】
【0027】
変化点検出手段3は、特徴量抽出手段2において抽出された特徴量に基づいて、まず、シーン変化点候補を検出する。まず、輝度情報に基づくシーン変化点候補の検出について説明する。輝度情報に基づくシーン変化点候補の検出は、輝度情報すなわちフレームFrN,FrN+1の輝度成分の平均値Yn,Yn+1の差分値の絶対値|Yn−Yn+1|を予め定められたしきい値Th1と比較し、|Yn−Yn+1|>Th1の場合には、フレームFrNとフレームFrN+1との間をシーン変化点候補として検出する。なお、|Yn−Yn+1|≦Th1の場合にはフレームFrNとフレームFrN+1との間を連続点(すなわちシーン変化のない点)として検出する。なお、輝度情報に基づいて明るさが変化する点をシーン変化点候補として検出することができ、この検出結果をAns1とする。
【0028】
一方、色情報に基づくシーン変化点候補の検出は、上記式(1)により算出された総和を予め定められたしきい値Th2と比較し、総和>Th2の場合には、フレームFrNとフレームFrN+1との間をシーン変化点候補として検出する。なお、総和≦Th2の場合にはフレームFrNとフレームFrN+1との間を連続点として検出する。なお、色情報に基づいて時間軸の不連続点をシーン変化点候補として検出することができ、この検出結果をAns2とする。
【0029】
そして、変化点検出手段3は、検出されたシーン変化点候補から、所望とするシーンチェンジタイプに応じたシーン変化点を検出する。第1の実施形態においては、明るさが変化するが時間軸上の変化がない変化点をシーン変化点とするシーンチェンジタイプを所望とするシーンチェンジタイプとしている。このため、変化点検出手段3は、「Ans1がシーン変化点候補であり、かつAns2がシーン連続点である」場合に、処理中のフレームFrN,FrN+1の間を、所望とするシーンチェンジタイプに応じたシーン変化点として検出する。
【0030】
以上の処理を全てのフレーム間において行うことにより、動画像データM0における所望とするシーンチェンジタイプに応じたシーン変化点を検出することができる。
【0031】
次いで、第1の実施形態の動作について説明する。図4は第1の実施形態において行われる処理を示すフローチャートである。まず、サンプリングするフレームが初期値に設定され(ステップS1)、サンプリング手段1により動画像データM0がサンプリングされて2つのフレームFrN,FrN+1が取得される(ステップS2)。そして、特徴量抽出手段2によりフレームFrN,FrN+1から輝度情報および色情報が特徴量として抽出される(ステップS3)。
【0032】
そして、変化点検出手段3により、特徴量抽出手段2により抽出された特徴量に基づいて、シーン変化点候補が検出される(ステップS4)。さらに、シーン変化点候補の検出結果に基づいて、現在処理中のフレームFrN,FrN+1の間が所望とするシーンチェンジタイプに応じたシーン変化点であるか否かが判定される(ステップS5)。そして、ステップS5が肯定されると、現在処理中のフレームFrN,FrN+1の間が所望とするシーンチェンジタイプに応じたシーン変化点として検出される(ステップS6)。一方、ステップS5が否定されると現在処理中のフレームFrN,FrN+1の間が連続点として検出される(ステップS7)。
【0033】
続いて、動画像データM0の全フレームについて処理が終了したか否かが判定され(ステップS8)、ステップS8が肯定されると処理を終了する。ステップS8が否定されると、次のフレームに処理対象が変更され(ステップS9)、ステップS2に戻り、ステップS2以降の処理が繰り返される。
【0034】
このように、本実施形態においては、シーンチェンジタイプに応じた複数の特徴量を抽出し、抽出された複数の特徴量に基づいて、複数のシーン変化点候補を検出し、これら複数のシーン変化点候補から所望とするシーンチェンジタイプに応じたシーン変化点を検出するようにしたため、所望とするシーンチェンジタイプに応じて特徴量を適切に選択することにより、所望とするシーンチェンジタイプに応じたシーン変化点を検出することができる。
【0035】
なお、上記第1の実施形態においては、フレームFrN,FrN+1の2つのフレームを用いてシーン変化点を検出しているが、フレーム間のより緩やかな変化を検出する場合、フレームFrNおよびこれと2フレーム離れたフレームFrN+2の2つのフレームを用いてシーンの変化点を検出すればよい。また、フレームFrN,FrN+1,FrN+2の3つのフレームを用いて、第1の実施形態と同様のシーン変化点および緩やかな変化となるシーン変化点の双方を検出してもよい。この場合、フレームFrN,FrN+1を用いて検出されたシーン変化点またはフレームFrN,FrN+2を用いて検出されたシーン変化点のいずれか一方を、対象とする動画像データM0のシーン変化点として検出してもよい。
【0036】
次いで、本発明の第2の実施形態について説明する。上記第1の実施形態においては、明るさが変化するが時間軸上の変化がない変化点をシーン変化点とするシーンチェンジタイプを所望とするシーンチェンジタイプとし、この所望とするシーンチェンジタイプのシーン変化点を、フレームFrN,FrN+1の輝度情報および色情報を用いて検出しているが、第2の実施形態においては、輝度情報および色情報を正規化し、正規化した輝度情報および色情報を特徴量として抽出し、正規化した輝度情報および色情報に基づいてシーン変化点を検出するようにしたものである。
【0037】
ここで、正規化された輝度情報(Ystとする)は、フレームFrN,FrN+1の明るさの変化量を表すものであり、下記の式(2)により算出される。
【数2】
但し、YMax:輝度成分が取り得る最大値(8ビットの場合255)。なお、第1の実施形態と同様に、フレームFrN,FrN+1にローパスフィルタによるフィルタリング処理を施してもよい。
【0038】
【0039】
また、正規化された色情報(Cstとする)は、フレームFrN,FrN+1の色の変化量を表すものであり、下記の式(3)により算出される。
【数3】
但し、CMax:色差成分が取り得る最大値(8ビットの場合255)。なお、第1の実施形態と同様に、ヒストグラムHn(Cb,Cr)およびヒストグラムHn+1(Cb,Cr)にローパスフィルタによるフィルタリング処理を施してもよい。
【0040】
【0041】
そして、変化点検出手段3は、正規化された輝度情報Ystおよび正規化された色情報Cstの差分値Yst−Cstを算出し、Yst−Cst>Th3(予め定められたしきい値)の場合、すなわち色情報の変化量よりも輝度情報の変化量が大きく、その差がしきい値Th3より大きい場合に、処理中のフレームFrN,FrN+1の間を、明るさが変化するが時間軸上の変化がない変化点をシーン変化点とする所望とするシーンチェンジタイプに応じたシーン変化点として検出する。
【0042】
このように、正規化した輝度情報および正規化した色情報を用いることによっても、所望とするシーンチェンジタイプに応じたシーン変化点を検出することができる。
【0043】
次いで、本発明の第3の実施形態について説明する。上記第1の実施形態においては、明るさが変化するが時間軸上の変化がない変化点をシーン変化点とするシーンチェンジタイプを所望とするシーンチェンジタイプとしているが、第3の実施形態においては、さらにシーンが明るすぎたり暗すぎた場合にはシーン変化点としないという条件をシーンチェンジタイプに加えて、これを所望とするシーンチェンジタイプとしたものである。
【0044】
このため、第3の実施形態においては、変化点検出手段3において、「Ans1がシーン変化点候補であり、かつAns2がシーン連続点」であり、さらに「輝度情報Yn>Th4または輝度情報Yn<Th5」の場合に、処理中のフレームFrN,FrN+1の間を、所望とするシーンチェンジタイプに応じたシーン変化点として検出するようにしたものである。ここで、しきい値Th4は、フレームFrN内の平均輝度の下限を定めたものであり、しきい値Th5は、フレームFrN内の平均輝度の上限を定めたものである。
【0045】
このように、第1の実施形態の変化点検出手段3における「Ans1がシーン変化点候補であり、かつAns2がシーン連続点である」の判定に加えて、「輝度情報Yn>Th4または輝度情報Yn<Th5」の判定を加えることにより、所望とするシーンチェンジタイプを、明るさが変化するが時間軸上の変化がなく、さらにシーンが明るすぎたり暗すぎないシーンチェンジタイプとした場合にも、シーン変化点を検出することができる。
【0046】
次いで、本発明の第4の実施形態について説明する。上記第1の実施形態においては、明るさが変化するが時間軸上の変化がない変化点をシーン変化点とするシーンチェンジタイプを所望とするシーンチェンジタイプとしているが、第4の実施形態においては、動きが大きいが時間軸上の変化がない変化点をシーン変化点とするシーンチェンジタイプを、所望とするシーンチェンジタイプとしたものである。
【0047】
このため、第4の実施形態においては、特徴量抽出手段2により、色情報およびフレームFrN,FrN+1の色の相関値を特徴量として抽出する。色情報は、上記第1の実施形態と同様に上記式(1)により算出された色差成分Cb,Crについての3次元ヒストグラムHn(Cb,Cr),Hn+1(Cb,Cr)の各画素についての総和とする。
【0048】
色の相関値は、下記の式(4)により抽出する。
【数4】
但し、Cbn,Crn:フレームFrNの色差成分
Cbn+1,Crn+1:フレームFrN+1の色差成分
(x,y):フレームFrN,FrN+1の画素の座標値
【0049】
ここで、色の相関値Cbrは動きが大きい点を検出しやすい特徴量である。なお、色の相関値Cbrを求める前に、色差成分Cbn,Crnおよび色差成分Cbn+1,Crn+1にローパスフィルタによるフィルタリング処理を施してもよい。
【0050】
第4の実施形態においては、変化点検出手段3は、第1の実施形態と同様に上記式(1)により算出された総和>Th2(予め定められたしきい値)の場合には、フレームFrNとフレームFrN+1との間をシーン変化点候補として検出し、総和≦Th2の場合にはフレームFrNとフレームFrN+1との間を連続点として検出する。この検出結果をAns2とする。
【0051】
また、変化点検出手段3は、色の相関値Cbrを予め定められたしきい値Th6と比較し、Cbr>Th6の場合には、フレームFrNとフレームFrN+1との間をシーン変化点候補として検出する。なお、Cbr≦Th6の場合にはフレームFrNとフレームFrN+1との間を連続点として検出する。なお、色の相関値Cbrに基づいて動きが大きい点をシーン変化点候補として検出することができ、この検出結果をAns3とする。
【0052】
そして、変化点検出手段3は、検出されたシーン変化点候補から、所望とするシーンチェンジタイプに応じたシーン変化点を検出する。第4の実施形態においては、動きが大きいが時間軸上の変化がない変化点をシーン変化点とするシーンチェンジタイプを所望とするシーンチェンジタイプとしている。このため、「Ans2がシーン連続点であり、かつAns3がシーン変化点候補である」場合に、処理中のフレームFrN,FrN+1の間を、所望とするシーンチェンジタイプに応じたシーン変化点として検出する。
【0053】
以上の処理を全てのフレーム間において行うことにより、動画像データM0における所望とするシーンチェンジタイプに応じたシーン変化点を検出することができる。
【0054】
次いで、本発明の第5の実施形態について説明する。上記第4の実施形態においては、動きが大きいが時間軸上の変化がない変化点をシーン変化点とするシーンチェンジタイプを所望とするシーンチェンジタイプとし、この所望とするシーンチェンジタイプのシーン変化点を、フレームFrN,FrN+1の色情報および色の相関値を用いて検出しているが、第5の実施形態においては、色情報およびフレームFrN,FrN+1の動ベクトルのヒストグラムに基づいて算出された標準偏差を特徴量として、シーン変化点を検出するようにしたものである。
【0055】
このため、第5の実施形態においては、特徴量抽出手段2は、色情報およびフレームFrN,FrN+1の動ベクトルのヒストグラムに基づいて算出された標準偏差を特徴量として抽出する。色情報は、上記第1の実施形態と同様に色差成分Cb,Crのヒストグラムを用いて上記式(1)により算出された総和とする。
【0056】
標準偏差を求めるための動ベクトルは以下のようにして求める。まず、フレームFrNを例えば8×8画素の複数の小領域に分割し、フレームFrNの各小領域をフレームFrN+1上において平行移動し、各領小域とフレームFrN+1上における対応する小領域との相関値を算出する。具体的には、小領域内における画素値の差の累積和の逆数を相関値として算出する。そして、相関値が最も高く、すなわち小領域内における画素値の差の累積和が最も小さくなったときの小領域の移動方向および移動量を、動ベクトルMV1として算出する。
【0057】
例えば、図5に示すように、フレームFrNにおける小領域A1について、フレームFrN+1における小領域A1′との相関値が最も高い場合には、小領域A1をフレームFrN+1に投影して得られる小領域A1″を小領域A1′へ移動させるために必要な移動量および移動方向を動ベクトルMV1として算出する。
【0058】
そして、動ベクトルMV1の大きさ|MV1|を横軸に、頻度を縦軸にプロットして動ベクトルMV1のヒストグラムHnVを作成する。さらに、このヒストグラムHnVにおいて、頻度がしきい値Th7を越えるピークを求める。例えばヒストグラムHnVが図6に示すように2つのピークP1,P2を有する場合において、ヒストグラムのピークP1,P2をしきい値Th7と比較すると、2つのピークP1,P2のうち、ピークP1がしきい値Th7を越えている。続いて、しきい値Th7を越えたピークP1における動ベクトルMV1の大きさ|MV1|の標準偏差σnを算出し、これを特徴量として抽出する。ここで、算出された標準偏差σnに基づいて、動きが大きい点をシーン変化点候補として検出することができる。
【0059】
そして、変化点検出手段3において、第1の実施形態と同様に上記式(1)により算出された総和>Th2(予め定められたしきい値)の場合には、フレームFrNとフレームFrN+1との間をシーン変化点候補として検出し、総和≦Th2の場合にはフレームFrNとフレームFrN+1との間を連続点として検出する。この検出結果をAns2とする。
【0060】
また、変化点検出手段3は、標準偏差σnを予め定められたしきい値Th8と比較する。ここで、動ベクトルMV1の標準偏差σnがしきい値Th8より大きい場合には、フレームFrN,FrN+1に含まれる被写体またはシーン全体が大きく移動しているとみなすことができる。このため、変化点検出手段3は、σn<Th8の場合には、フレームFrNとフレームFrN+1との間をシーン変化点候補として検出する。なお、σn≧Th8の場合にはフレームFrNとフレームFrN+1との間を連続点として検出する。なお、標準偏差σnに基づいて動きが大きい点をシーン変化点候補として検出することができ、この検出結果をAns4とする。また、標準偏差σnによる比較は行わず、ヒストグラムHnVとしきい値Th7との比較によりAns4を求めてもよい。
【0061】
そして、変化点検出手段3は、検出されたシーン変化点候補から、所望とするシーンチェンジタイプに応じたシーン変化点を検出する。第5の実施形態においては、動きが大きいが時間軸上の変化がない変化点をシーン変化点とするシーンチェンジタイプを所望とするシーンチェンジタイプとしている。このため、「Ans2がシーン連続点であり、かつAns4がシーン変化点候補である」場合に、処理中のフレームFrN,FrN+1の間を、所望とするシーンチェンジタイプに応じたシーン変化点として検出する。
【0062】
以上の処理を全てのフレーム間において行うことにより、動画像データM0における所望とするシーンチェンジタイプに応じたシーン変化点を検出することができる。
【0063】
次いで、本発明の第6の実施形態について説明する。上記第1の実施形態においては、特徴量をしきい値Th1,Th2と比較することにより、シーン変化点候補を検出しているが、第6の実施形態においては、特徴量と比較するしきい値Th1,Th2を複数のフレームFrN〜FrN+t0に基づいて算出するようにした点が第1の実施形態と異なる。
【0064】
具体的には、まず、複数のフレームFrN〜FrN+t0をサンプリングし、全てのフレームFrN〜FrN+t0と、各フレームFrN〜FrN+t0の直後のフレームとから特徴量を算出する。ここで、第1の実施形態においては、特徴量として、隣接するフレーム間の輝度成分の差分値の絶対値を輝度情報として、色ヒストグラムの差分値の絶対値の総和を色情報として算出しているため、複数のフレームFrN〜FrN+t0からはt0−1個の輝度情報および色情報が特徴量として抽出される。
【0065】
そして、第6の実施形態においては、算出されたt0−1個の輝度情報および色情報の平均値および分散値を算出し、算出された平均値および分散値に基づいて、しきい値Th1,Th2を算出するようにしたものである。
【0066】
ここで、輝度情報について、算出された平均値をYave、分散値をYsdとすると、しきい値Th1は下記の式(5)により算出される。
Th1=a0・Yave+a1・Ysd (5)
但し、a0,a1は予め設定したパラメータ
【0067】
また、色情報について算出された平均値をCave、分散値をYsdとすると、しきい値Th2は下記の式(6)により算出される。
【0068】
Th2=a2・Cave+a3・Csd (6)
但し、a2,a3は予め設定したパラメータ
【0069】
そして、算出したしきい値を用いて、上記第1の実施形態と同様に全てのフレームについてシーン変化点の検出を行うことにより、所望とするシーンチェンジタイプに応じたシーン変化点を検出することができる。
【0070】
ここで、第6の実施形態においては、明るさが大きく変動するシーンが続いたり、明るさの変動が小さいシーンが続いた場合には、シーンに応じてシーン変化点検出のためのしきい値の大きさも変動する。このため、シーンの明るさ等の変動量に応じて適切にシーン変化点を検出することができる。
【0071】
なお、複数のフレームFrN〜FrN+T0から抽出した複数の特徴量に基づくしきい値の算出は第1の実施形態のみならず、第2から第5の実施形態にも同様に適用することができる。
【0072】
なお、上記実施形態においては、フレームFrN,FrN+1の輝度情報および色情報として、輝度色差成分を用いているが、輝度色差成分から例えばCIE1976Labのようなフレームの輝度情報および色情報を表す成分を求め、求めた輝度情報および色情報を表す成分から特徴量を求め、求められた特徴量に基づいてシーン変化点を検出してもよい。
【0073】
また、上記実施形態においては、フレームFrNとこれの直後のフレームFrN+1とに基づいてシーン変化点を検出しているが、フレームFrNとこれの直前のフレームFrN−1とに基づいてシーン変化点を検出してもよい。
【図面の簡単な説明】
【図1】本発明の第1の実施形態によるシーン変化点検出装置の構成を示す概略ブロック図
【図2】シーンチェンジタイプと特徴量との関係の例を表すテーブル
【図3】色差成分の3次元ヒストグラムを示す図
【図4】第1の実施形態において行われる処理を示すフローチャート
【図5】動ベクトルの算出を説明するための図
【図6】動ベクトルのヒストグラムを用いたシーン変化点候補の検出を説明するための図
【符号の説明】
1 サンプリング手段
2 特徴量抽出手段
3 変化点検出手段
【発明の属する技術分野】
本発明は、動画像におけるシーンの変化点を検出するシーン変化点検出方法および装置並びにシーン変化点検出方法をコンピュータに実行させるためのプログラムに関するものである。
【0002】
【従来の技術】
CPUの高速化やメモリの大容量化により、静止画像よりも容量が大きい動画像を簡易に扱うことが可能となってきている。このような動画像を扱う際には、動画像に含まれるシーンの変わり目を表すシーン変化点を検出することにより、動画像に含まれる見たいシーンを検索することが容易となる。このようなシーン変化点を検出するために、動画像中の連続する2枚のフレームの間において、図柄が変化することによりフレームが不連続となる場合に、そのフレーム間を動画像のシーン変化点と判定する方法が提案されている(例えば特許文献1参照)。
【0003】
しかしながら、上記特許文献1に記載された方法は、ストロボ発光や機器の障害により瞬間的に画像が乱れた場合であっても、それもシーン変化点として検出してしまうため、1つのシーンの中に瞬間的な画像の乱れが含まれると、同一シーンであるにも関わらず、シーンが分断されてしまうという問題がある。
【0004】
このため、フレームに含まれるカラーヒストグラムを含む特徴量を算出し、対象とするフレームとその直前のフレームとの特徴量との相関を表す第1の相関係数と、それ以前のフレームとの特徴量との相関を表す第2の相関係数とを算出し、第1および第2の相関係数の双方が許容範囲を超えた場合に、対象とするフレームをシーン変化点として検出する方法が提案されている(特許文献2参照)。この方法によれば、1つのシーンの中に瞬間的な画像の乱れが含まれていても、真のシーン変化点を検出することが可能となる。
【0005】
【特許文献1】
特開平4−111181号公報
【0006】
【特許文献2】
特開平8−227462号公報
【0007】
【発明が解決しようとする課題】
しかしながら、シーン変化点はフレームを時間軸上に並べた場合に図柄が変化することによりフレームが不連続となる点のみならず、図柄は変わらないものの明るさが変化する点や、図柄は変わらないもののフレームに含まれる被写体が大きく移動する点等種々のタイプ(以下シーンチェンジタイプとする)があるため、上記特許文献2に記載された方法では所望とするシーンチェンジタイプに応じたシーン変化点の検出には対応することができない。
【0008】
本発明は上記事情に鑑みなされたものであり、所望とするシーンチェンジタイプに応じてシーン変化点を検出することを目的とする。
【0009】
【課題を解決するための手段】
本発明によるシーン変化点検出方法は、連続する複数のフレームからなる動画像からシーンの変わり目を表すシーン変化点を検出するシーン変化点検出方法において、
各フレームおよび該各フレームに前後する1または複数のフレームから、シーンチェンジタイプに応じたシーン変化の特徴を表す複数の特徴量を抽出し、
該複数の特徴量に基づいて所望とするシーンチェンジタイプに応じたシーン変化点を検出することを特徴とするものである。
【0010】
「各フレームに前後する1または複数のフレーム」とは、対象となるフレームの直前または直後における1以上のフレームのことをいう。
【0011】
「シーン変化の特徴を表す特徴量」とは、シーンの変わり目においてシーンチェンジタイプに応じて特異な変化が現れるパラメータであり、具体的にはフレーム間の輝度のヒストグラムの差分値の総和、輝度のメディアン値の差分値、輝度の平均値の差分値、輝度の標準偏差の差分値、色のヒストグラムの差分値の総和、色のメディアン値の差分値、色の平均値の差分値、色の標準偏差の差分値、これらの差分値を正規化した値、フレーム間の色の相関値、およびフレーム間の動ベクトル等を用いることができる。
【0012】
「シーンチェンジタイプ」としては、例えばシーンの図柄が全く異なることにより、動画像の時間軸上においてシーンの内容が不連続となる点(以下、時間軸上の不連続な点とする)、撮影方向が大きく変更されたり被写体が大きく移動する等によりシーンの動きが大きい点(以下動きが大きい点とする)および明るさの変化が大きい点等が挙げられる。
【0013】
「所望とするシーンチェンジタイプ」としては、シーンチェンジタイプの組み合わせとして表されるシーンチェンジタイプを意味し、具体的には時間軸上の変化はないが明るさが変化するというタイプ、時間軸上の変化はないが動きが大きいタイプ等が挙げられる。
【0014】
本発明によるシーン変化点検出装置は、連続する複数のフレームからなる動画像からシーンの変わり目を表すシーン変化点を検出するシーン変化点検出装置において、
各フレームおよび該各フレームに前後する1または複数のフレームから、シーンチェンジタイプに応じたシーン変化の特徴を表す複数の特徴量を抽出する特徴量抽出手段と、
該複数の特徴量に基づいて所望とするシーンチェンジタイプに応じたシーン変化点を検出する変化点検出手段とを備えたことを特徴とするものである。
【0015】
なお、本発明によるシーン変化点検出方法をコンピュータに実行させるためのプログラムとして提供してもよい。
【0016】
【発明の効果】
本発明によれば、各フレームおよび各フレームに前後する1または複数のフレームからシーンチェンジタイプに応じた複数の特徴量が抽出され、抽出された複数の特徴量に基づいて、所望とするシーンチェンジタイプに応じたシーン変化点が検出される。このため、所望とするシーンチェンジタイプに応じて特徴量を適切に選択することにより、所望とするシーンチェンジタイプに応じたシーン変化点を適切に検出することができる。
【0017】
【発明の実施の形態】
以下図面を参照して本発明の実施形態について説明する。図1は本発明の第1の実施形態によるシーン変化点検出装置の構成を示す概略ブロック図である。図1に示すように、本実施形態によるシーン変化点検出装置は、入力された動画像データM0から複数のフレームをサンプリングするサンプリング手段1と、処理の対象となるフレームFrNおよびフレームFrNの直後のフレームFrN+1のそれぞれから複数の特徴量を抽出する特徴量抽出手段2と、特徴量抽出手段2に基づいて抽出された複数の特徴量に基づいて、所望とするシーンチェンジタイプに応じたシーン変化点を検出する変化点検出手段3とを備える。
【0018】
サンプリング手段1は、動画像データM0から複数のフレームをサンプリングする。ここで、動画像データM0はカラーの動画像を表すものであり、各フレームはY,Cb,Crの輝度色差成分からなるものとする。
【0019】
特徴量抽出手段2は、処理の対象となるフレームFrN,FrN+1のそれぞれからシーンチェンジタイプに応じたシーン変化点を検出可能な特徴量を抽出する。
【0020】
ここで、シーンチェンジタイプと特徴量との関係について説明する。図2はシーンチェンジタイプと特徴量との関係の例を表すテーブルである。図2に示すように、動画像のシーンチェンジタイプとしては、例えば図柄が全く異なることにより動画像の時間軸上においてシーンが不連続となる「(1)時間軸の不連続点」、撮影方向が大きく変更されたり被写体が大きく移動する等によりシーンの動きが大きい「(2)動きが大きい点」および「(3)明るさが変化する点」が挙げられる。ここで、フレームFrN,FrN+1間における色画素の差分は上記(1)および(2)は検出しやすいが(3)は検出しにくい。また、フレームFrN,FrN+1間における色ヒストグラムの差分は上記(1)は検出しやすいが(2)および(3)は検出しにくい。さらに、フレームFrN,FrN+1間における輝度平均値の差分は、上記(1)および(3)は検出しやすいが(2)は検出しにくいという特徴がある。
【0021】
このため、本実施形態においては、シーンチェンジタイプに応じた複数の特徴量をフレームFrNおよびフレームFrN+1から抽出し、変化点検出手段3において、抽出された特徴量に基づいて、後述するようにシーンチェンジタイプに応じたシーン変化点を検出するようにしたものである。
【0022】
ここで、第1の実施形態においては、明るさの変化は検出するが、時間軸上の変化を検出しないようにすることにより、明るさが変化するが時間軸上の変化はない変化点をシーン変化点と見なすシーンチェンジタイプを、所望とするシーンチェンジタイプとする。
【0023】
このため、第1の実施形態における特徴量抽出手段2は、フレームFrN,FrN+1の輝度情報および色情報を特徴量として抽出する。まず、輝度情報の抽出について説明する。輝度情報としては、フレームFrN,FrN+1の輝度成分のヒストグラムの差分値の総和、フレーム全体についてのメディアン値の差分値、平均値の差分値および標準偏差の差分値等を用いることができるが、第1の実施形態においては輝度成分のフレーム全体についての平均値の差分値の絶対値を輝度情報として用いるものとする。
【0024】
ここで、フレームFrN,FrN+1についての輝度成分の平均値をそれぞれYn,Yn+1とすると、平均値Yn,Yn+1は、フレームFrN,FrN+1の各画素についての輝度成分のフレームFrN,FrN+1の全画素についての総和を、全画素数により除した値として算出することができる。そして特徴量抽出手段2は、フレームFrNの輝度成分の平均値YnおよびフレームFrN+1の輝度成分の平均値Yn+1の差分値の絶対値|Yn−Yn+1|を輝度情報として算出する。なお、輝度成分の差分は明るさの変化を検出しやすい特徴量である。ここで、ノイズを除去するために、平均値Yn,Yn+1を求める前にフレームFrN,FrN+1の全画素にローパスフィルタによるフィルタリング処理を施してもよい。
【0025】
次いで、色情報の算出について説明する。色情報としては、フレームFrN,FrN+1の色差成分のヒストグラムの差分値の総和、フレーム全体についてのメディアン値の差分値、平均値の差分値および標準偏差の差分値等を用いることができるが、第1の実施形態においては色差成分のヒストグラムの差分値の絶対値を色情報として用いるものとする。
【0026】
具体的には、図3に示すようにフレームFrNの色差成分Cb,Crについての3次元ヒストグラムHn(Cb,Cr)およびフレームFrN+1の色差成分Cb,Crについての3次元ヒストグラムHn+1(Cb,Cr)を作成し、ヒストグラムHn(Cb,Cr)とヒストグラムHn+1(Cb,Cr)との差分値の絶対値|Hn(Cb,Cr)−Hn+1(Cb,Cr)|の全ての色差成分Cb,Crについての総和を下記の式(1)により算出し、これを色情報とする。なお、色差成分のヒストグラムの差分値は時間軸の不連続を検出しやすい特徴量である。なお、特徴量の変化を滑らかにするために、差分値の絶対値を求める前に、ヒストグラムHn(Cb,Cr)およびヒストグラムHn+1(Cb,Cr)にローパスフィルタによるフィルタリング処理を施してもよい。
【数1】
【0027】
変化点検出手段3は、特徴量抽出手段2において抽出された特徴量に基づいて、まず、シーン変化点候補を検出する。まず、輝度情報に基づくシーン変化点候補の検出について説明する。輝度情報に基づくシーン変化点候補の検出は、輝度情報すなわちフレームFrN,FrN+1の輝度成分の平均値Yn,Yn+1の差分値の絶対値|Yn−Yn+1|を予め定められたしきい値Th1と比較し、|Yn−Yn+1|>Th1の場合には、フレームFrNとフレームFrN+1との間をシーン変化点候補として検出する。なお、|Yn−Yn+1|≦Th1の場合にはフレームFrNとフレームFrN+1との間を連続点(すなわちシーン変化のない点)として検出する。なお、輝度情報に基づいて明るさが変化する点をシーン変化点候補として検出することができ、この検出結果をAns1とする。
【0028】
一方、色情報に基づくシーン変化点候補の検出は、上記式(1)により算出された総和を予め定められたしきい値Th2と比較し、総和>Th2の場合には、フレームFrNとフレームFrN+1との間をシーン変化点候補として検出する。なお、総和≦Th2の場合にはフレームFrNとフレームFrN+1との間を連続点として検出する。なお、色情報に基づいて時間軸の不連続点をシーン変化点候補として検出することができ、この検出結果をAns2とする。
【0029】
そして、変化点検出手段3は、検出されたシーン変化点候補から、所望とするシーンチェンジタイプに応じたシーン変化点を検出する。第1の実施形態においては、明るさが変化するが時間軸上の変化がない変化点をシーン変化点とするシーンチェンジタイプを所望とするシーンチェンジタイプとしている。このため、変化点検出手段3は、「Ans1がシーン変化点候補であり、かつAns2がシーン連続点である」場合に、処理中のフレームFrN,FrN+1の間を、所望とするシーンチェンジタイプに応じたシーン変化点として検出する。
【0030】
以上の処理を全てのフレーム間において行うことにより、動画像データM0における所望とするシーンチェンジタイプに応じたシーン変化点を検出することができる。
【0031】
次いで、第1の実施形態の動作について説明する。図4は第1の実施形態において行われる処理を示すフローチャートである。まず、サンプリングするフレームが初期値に設定され(ステップS1)、サンプリング手段1により動画像データM0がサンプリングされて2つのフレームFrN,FrN+1が取得される(ステップS2)。そして、特徴量抽出手段2によりフレームFrN,FrN+1から輝度情報および色情報が特徴量として抽出される(ステップS3)。
【0032】
そして、変化点検出手段3により、特徴量抽出手段2により抽出された特徴量に基づいて、シーン変化点候補が検出される(ステップS4)。さらに、シーン変化点候補の検出結果に基づいて、現在処理中のフレームFrN,FrN+1の間が所望とするシーンチェンジタイプに応じたシーン変化点であるか否かが判定される(ステップS5)。そして、ステップS5が肯定されると、現在処理中のフレームFrN,FrN+1の間が所望とするシーンチェンジタイプに応じたシーン変化点として検出される(ステップS6)。一方、ステップS5が否定されると現在処理中のフレームFrN,FrN+1の間が連続点として検出される(ステップS7)。
【0033】
続いて、動画像データM0の全フレームについて処理が終了したか否かが判定され(ステップS8)、ステップS8が肯定されると処理を終了する。ステップS8が否定されると、次のフレームに処理対象が変更され(ステップS9)、ステップS2に戻り、ステップS2以降の処理が繰り返される。
【0034】
このように、本実施形態においては、シーンチェンジタイプに応じた複数の特徴量を抽出し、抽出された複数の特徴量に基づいて、複数のシーン変化点候補を検出し、これら複数のシーン変化点候補から所望とするシーンチェンジタイプに応じたシーン変化点を検出するようにしたため、所望とするシーンチェンジタイプに応じて特徴量を適切に選択することにより、所望とするシーンチェンジタイプに応じたシーン変化点を検出することができる。
【0035】
なお、上記第1の実施形態においては、フレームFrN,FrN+1の2つのフレームを用いてシーン変化点を検出しているが、フレーム間のより緩やかな変化を検出する場合、フレームFrNおよびこれと2フレーム離れたフレームFrN+2の2つのフレームを用いてシーンの変化点を検出すればよい。また、フレームFrN,FrN+1,FrN+2の3つのフレームを用いて、第1の実施形態と同様のシーン変化点および緩やかな変化となるシーン変化点の双方を検出してもよい。この場合、フレームFrN,FrN+1を用いて検出されたシーン変化点またはフレームFrN,FrN+2を用いて検出されたシーン変化点のいずれか一方を、対象とする動画像データM0のシーン変化点として検出してもよい。
【0036】
次いで、本発明の第2の実施形態について説明する。上記第1の実施形態においては、明るさが変化するが時間軸上の変化がない変化点をシーン変化点とするシーンチェンジタイプを所望とするシーンチェンジタイプとし、この所望とするシーンチェンジタイプのシーン変化点を、フレームFrN,FrN+1の輝度情報および色情報を用いて検出しているが、第2の実施形態においては、輝度情報および色情報を正規化し、正規化した輝度情報および色情報を特徴量として抽出し、正規化した輝度情報および色情報に基づいてシーン変化点を検出するようにしたものである。
【0037】
ここで、正規化された輝度情報(Ystとする)は、フレームFrN,FrN+1の明るさの変化量を表すものであり、下記の式(2)により算出される。
【数2】
但し、YMax:輝度成分が取り得る最大値(8ビットの場合255)。なお、第1の実施形態と同様に、フレームFrN,FrN+1にローパスフィルタによるフィルタリング処理を施してもよい。
【0038】
【0039】
また、正規化された色情報(Cstとする)は、フレームFrN,FrN+1の色の変化量を表すものであり、下記の式(3)により算出される。
【数3】
但し、CMax:色差成分が取り得る最大値(8ビットの場合255)。なお、第1の実施形態と同様に、ヒストグラムHn(Cb,Cr)およびヒストグラムHn+1(Cb,Cr)にローパスフィルタによるフィルタリング処理を施してもよい。
【0040】
【0041】
そして、変化点検出手段3は、正規化された輝度情報Ystおよび正規化された色情報Cstの差分値Yst−Cstを算出し、Yst−Cst>Th3(予め定められたしきい値)の場合、すなわち色情報の変化量よりも輝度情報の変化量が大きく、その差がしきい値Th3より大きい場合に、処理中のフレームFrN,FrN+1の間を、明るさが変化するが時間軸上の変化がない変化点をシーン変化点とする所望とするシーンチェンジタイプに応じたシーン変化点として検出する。
【0042】
このように、正規化した輝度情報および正規化した色情報を用いることによっても、所望とするシーンチェンジタイプに応じたシーン変化点を検出することができる。
【0043】
次いで、本発明の第3の実施形態について説明する。上記第1の実施形態においては、明るさが変化するが時間軸上の変化がない変化点をシーン変化点とするシーンチェンジタイプを所望とするシーンチェンジタイプとしているが、第3の実施形態においては、さらにシーンが明るすぎたり暗すぎた場合にはシーン変化点としないという条件をシーンチェンジタイプに加えて、これを所望とするシーンチェンジタイプとしたものである。
【0044】
このため、第3の実施形態においては、変化点検出手段3において、「Ans1がシーン変化点候補であり、かつAns2がシーン連続点」であり、さらに「輝度情報Yn>Th4または輝度情報Yn<Th5」の場合に、処理中のフレームFrN,FrN+1の間を、所望とするシーンチェンジタイプに応じたシーン変化点として検出するようにしたものである。ここで、しきい値Th4は、フレームFrN内の平均輝度の下限を定めたものであり、しきい値Th5は、フレームFrN内の平均輝度の上限を定めたものである。
【0045】
このように、第1の実施形態の変化点検出手段3における「Ans1がシーン変化点候補であり、かつAns2がシーン連続点である」の判定に加えて、「輝度情報Yn>Th4または輝度情報Yn<Th5」の判定を加えることにより、所望とするシーンチェンジタイプを、明るさが変化するが時間軸上の変化がなく、さらにシーンが明るすぎたり暗すぎないシーンチェンジタイプとした場合にも、シーン変化点を検出することができる。
【0046】
次いで、本発明の第4の実施形態について説明する。上記第1の実施形態においては、明るさが変化するが時間軸上の変化がない変化点をシーン変化点とするシーンチェンジタイプを所望とするシーンチェンジタイプとしているが、第4の実施形態においては、動きが大きいが時間軸上の変化がない変化点をシーン変化点とするシーンチェンジタイプを、所望とするシーンチェンジタイプとしたものである。
【0047】
このため、第4の実施形態においては、特徴量抽出手段2により、色情報およびフレームFrN,FrN+1の色の相関値を特徴量として抽出する。色情報は、上記第1の実施形態と同様に上記式(1)により算出された色差成分Cb,Crについての3次元ヒストグラムHn(Cb,Cr),Hn+1(Cb,Cr)の各画素についての総和とする。
【0048】
色の相関値は、下記の式(4)により抽出する。
【数4】
但し、Cbn,Crn:フレームFrNの色差成分
Cbn+1,Crn+1:フレームFrN+1の色差成分
(x,y):フレームFrN,FrN+1の画素の座標値
【0049】
ここで、色の相関値Cbrは動きが大きい点を検出しやすい特徴量である。なお、色の相関値Cbrを求める前に、色差成分Cbn,Crnおよび色差成分Cbn+1,Crn+1にローパスフィルタによるフィルタリング処理を施してもよい。
【0050】
第4の実施形態においては、変化点検出手段3は、第1の実施形態と同様に上記式(1)により算出された総和>Th2(予め定められたしきい値)の場合には、フレームFrNとフレームFrN+1との間をシーン変化点候補として検出し、総和≦Th2の場合にはフレームFrNとフレームFrN+1との間を連続点として検出する。この検出結果をAns2とする。
【0051】
また、変化点検出手段3は、色の相関値Cbrを予め定められたしきい値Th6と比較し、Cbr>Th6の場合には、フレームFrNとフレームFrN+1との間をシーン変化点候補として検出する。なお、Cbr≦Th6の場合にはフレームFrNとフレームFrN+1との間を連続点として検出する。なお、色の相関値Cbrに基づいて動きが大きい点をシーン変化点候補として検出することができ、この検出結果をAns3とする。
【0052】
そして、変化点検出手段3は、検出されたシーン変化点候補から、所望とするシーンチェンジタイプに応じたシーン変化点を検出する。第4の実施形態においては、動きが大きいが時間軸上の変化がない変化点をシーン変化点とするシーンチェンジタイプを所望とするシーンチェンジタイプとしている。このため、「Ans2がシーン連続点であり、かつAns3がシーン変化点候補である」場合に、処理中のフレームFrN,FrN+1の間を、所望とするシーンチェンジタイプに応じたシーン変化点として検出する。
【0053】
以上の処理を全てのフレーム間において行うことにより、動画像データM0における所望とするシーンチェンジタイプに応じたシーン変化点を検出することができる。
【0054】
次いで、本発明の第5の実施形態について説明する。上記第4の実施形態においては、動きが大きいが時間軸上の変化がない変化点をシーン変化点とするシーンチェンジタイプを所望とするシーンチェンジタイプとし、この所望とするシーンチェンジタイプのシーン変化点を、フレームFrN,FrN+1の色情報および色の相関値を用いて検出しているが、第5の実施形態においては、色情報およびフレームFrN,FrN+1の動ベクトルのヒストグラムに基づいて算出された標準偏差を特徴量として、シーン変化点を検出するようにしたものである。
【0055】
このため、第5の実施形態においては、特徴量抽出手段2は、色情報およびフレームFrN,FrN+1の動ベクトルのヒストグラムに基づいて算出された標準偏差を特徴量として抽出する。色情報は、上記第1の実施形態と同様に色差成分Cb,Crのヒストグラムを用いて上記式(1)により算出された総和とする。
【0056】
標準偏差を求めるための動ベクトルは以下のようにして求める。まず、フレームFrNを例えば8×8画素の複数の小領域に分割し、フレームFrNの各小領域をフレームFrN+1上において平行移動し、各領小域とフレームFrN+1上における対応する小領域との相関値を算出する。具体的には、小領域内における画素値の差の累積和の逆数を相関値として算出する。そして、相関値が最も高く、すなわち小領域内における画素値の差の累積和が最も小さくなったときの小領域の移動方向および移動量を、動ベクトルMV1として算出する。
【0057】
例えば、図5に示すように、フレームFrNにおける小領域A1について、フレームFrN+1における小領域A1′との相関値が最も高い場合には、小領域A1をフレームFrN+1に投影して得られる小領域A1″を小領域A1′へ移動させるために必要な移動量および移動方向を動ベクトルMV1として算出する。
【0058】
そして、動ベクトルMV1の大きさ|MV1|を横軸に、頻度を縦軸にプロットして動ベクトルMV1のヒストグラムHnVを作成する。さらに、このヒストグラムHnVにおいて、頻度がしきい値Th7を越えるピークを求める。例えばヒストグラムHnVが図6に示すように2つのピークP1,P2を有する場合において、ヒストグラムのピークP1,P2をしきい値Th7と比較すると、2つのピークP1,P2のうち、ピークP1がしきい値Th7を越えている。続いて、しきい値Th7を越えたピークP1における動ベクトルMV1の大きさ|MV1|の標準偏差σnを算出し、これを特徴量として抽出する。ここで、算出された標準偏差σnに基づいて、動きが大きい点をシーン変化点候補として検出することができる。
【0059】
そして、変化点検出手段3において、第1の実施形態と同様に上記式(1)により算出された総和>Th2(予め定められたしきい値)の場合には、フレームFrNとフレームFrN+1との間をシーン変化点候補として検出し、総和≦Th2の場合にはフレームFrNとフレームFrN+1との間を連続点として検出する。この検出結果をAns2とする。
【0060】
また、変化点検出手段3は、標準偏差σnを予め定められたしきい値Th8と比較する。ここで、動ベクトルMV1の標準偏差σnがしきい値Th8より大きい場合には、フレームFrN,FrN+1に含まれる被写体またはシーン全体が大きく移動しているとみなすことができる。このため、変化点検出手段3は、σn<Th8の場合には、フレームFrNとフレームFrN+1との間をシーン変化点候補として検出する。なお、σn≧Th8の場合にはフレームFrNとフレームFrN+1との間を連続点として検出する。なお、標準偏差σnに基づいて動きが大きい点をシーン変化点候補として検出することができ、この検出結果をAns4とする。また、標準偏差σnによる比較は行わず、ヒストグラムHnVとしきい値Th7との比較によりAns4を求めてもよい。
【0061】
そして、変化点検出手段3は、検出されたシーン変化点候補から、所望とするシーンチェンジタイプに応じたシーン変化点を検出する。第5の実施形態においては、動きが大きいが時間軸上の変化がない変化点をシーン変化点とするシーンチェンジタイプを所望とするシーンチェンジタイプとしている。このため、「Ans2がシーン連続点であり、かつAns4がシーン変化点候補である」場合に、処理中のフレームFrN,FrN+1の間を、所望とするシーンチェンジタイプに応じたシーン変化点として検出する。
【0062】
以上の処理を全てのフレーム間において行うことにより、動画像データM0における所望とするシーンチェンジタイプに応じたシーン変化点を検出することができる。
【0063】
次いで、本発明の第6の実施形態について説明する。上記第1の実施形態においては、特徴量をしきい値Th1,Th2と比較することにより、シーン変化点候補を検出しているが、第6の実施形態においては、特徴量と比較するしきい値Th1,Th2を複数のフレームFrN〜FrN+t0に基づいて算出するようにした点が第1の実施形態と異なる。
【0064】
具体的には、まず、複数のフレームFrN〜FrN+t0をサンプリングし、全てのフレームFrN〜FrN+t0と、各フレームFrN〜FrN+t0の直後のフレームとから特徴量を算出する。ここで、第1の実施形態においては、特徴量として、隣接するフレーム間の輝度成分の差分値の絶対値を輝度情報として、色ヒストグラムの差分値の絶対値の総和を色情報として算出しているため、複数のフレームFrN〜FrN+t0からはt0−1個の輝度情報および色情報が特徴量として抽出される。
【0065】
そして、第6の実施形態においては、算出されたt0−1個の輝度情報および色情報の平均値および分散値を算出し、算出された平均値および分散値に基づいて、しきい値Th1,Th2を算出するようにしたものである。
【0066】
ここで、輝度情報について、算出された平均値をYave、分散値をYsdとすると、しきい値Th1は下記の式(5)により算出される。
Th1=a0・Yave+a1・Ysd (5)
但し、a0,a1は予め設定したパラメータ
【0067】
また、色情報について算出された平均値をCave、分散値をYsdとすると、しきい値Th2は下記の式(6)により算出される。
【0068】
Th2=a2・Cave+a3・Csd (6)
但し、a2,a3は予め設定したパラメータ
【0069】
そして、算出したしきい値を用いて、上記第1の実施形態と同様に全てのフレームについてシーン変化点の検出を行うことにより、所望とするシーンチェンジタイプに応じたシーン変化点を検出することができる。
【0070】
ここで、第6の実施形態においては、明るさが大きく変動するシーンが続いたり、明るさの変動が小さいシーンが続いた場合には、シーンに応じてシーン変化点検出のためのしきい値の大きさも変動する。このため、シーンの明るさ等の変動量に応じて適切にシーン変化点を検出することができる。
【0071】
なお、複数のフレームFrN〜FrN+T0から抽出した複数の特徴量に基づくしきい値の算出は第1の実施形態のみならず、第2から第5の実施形態にも同様に適用することができる。
【0072】
なお、上記実施形態においては、フレームFrN,FrN+1の輝度情報および色情報として、輝度色差成分を用いているが、輝度色差成分から例えばCIE1976Labのようなフレームの輝度情報および色情報を表す成分を求め、求めた輝度情報および色情報を表す成分から特徴量を求め、求められた特徴量に基づいてシーン変化点を検出してもよい。
【0073】
また、上記実施形態においては、フレームFrNとこれの直後のフレームFrN+1とに基づいてシーン変化点を検出しているが、フレームFrNとこれの直前のフレームFrN−1とに基づいてシーン変化点を検出してもよい。
【図面の簡単な説明】
【図1】本発明の第1の実施形態によるシーン変化点検出装置の構成を示す概略ブロック図
【図2】シーンチェンジタイプと特徴量との関係の例を表すテーブル
【図3】色差成分の3次元ヒストグラムを示す図
【図4】第1の実施形態において行われる処理を示すフローチャート
【図5】動ベクトルの算出を説明するための図
【図6】動ベクトルのヒストグラムを用いたシーン変化点候補の検出を説明するための図
【符号の説明】
1 サンプリング手段
2 特徴量抽出手段
3 変化点検出手段
Claims (3)
- 連続する複数のフレームからなる動画像からシーンの変わり目を表すシーン変化点を検出するシーン変化点検出方法において、
各フレームおよび該各フレームに前後する1または複数のフレームから、シーンチェンジタイプに応じたシーン変化の特徴を表す複数の特徴量を抽出し、
該複数の特徴量に基づいて所望とするシーンチェンジタイプに応じたシーン変化点を検出することを特徴とするシーン変化点検出方法。 - 連続する複数のフレームからなる動画像からシーンの変わり目を表すシーン変化点を検出するシーン変化点検出装置において、
各フレームおよび該各フレームに前後する1または複数のフレームから、シーンチェンジタイプに応じたシーン変化の特徴を表す複数の特徴量を抽出する特徴量抽出手段と、
該複数の特徴量に基づいて所望とするシーンチェンジタイプに応じたシーン変化点を検出する変化点検出手段とを備えたことを特徴とするシーン変化点検出装置。 - 連続する複数のフレームからなる動画像からシーンの変わり目を表すシーン変化点を検出するシーン変化点検出方法をコンピュータに実行させるためのプログラムにおいて、
各フレームおよび該各フレームに前後する1または複数のフレームから、シーンチェンジタイプに応じたシーン変化の特徴を表す複数の特徴量を抽出する手順と、
該複数の特徴量に基づいて所望とするシーンチェンジタイプに応じたシーン変化点を検出する手順とを有するプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002283897A JP2004118718A (ja) | 2002-09-27 | 2002-09-27 | シーン変化点検出方法および装置並びにプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002283897A JP2004118718A (ja) | 2002-09-27 | 2002-09-27 | シーン変化点検出方法および装置並びにプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004118718A true JP2004118718A (ja) | 2004-04-15 |
Family
ID=32277632
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002283897A Withdrawn JP2004118718A (ja) | 2002-09-27 | 2002-09-27 | シーン変化点検出方法および装置並びにプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2004118718A (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006301675A (ja) * | 2005-04-15 | 2006-11-02 | Noritsu Koki Co Ltd | 画像処理装置及び画像処理方法 |
JP2007089186A (ja) * | 2005-09-22 | 2007-04-05 | Lg Electronics Inc | 動画撮影機能付き移動通信端末機及びその動作方法 |
JP2009253646A (ja) * | 2008-04-04 | 2009-10-29 | Canon Inc | 画像処理装置、画像処理方法 |
KR102369151B1 (ko) * | 2021-10-05 | 2022-03-02 | 아이픽셀 주식회사 | 동작 인식을 위한 메타 데이터 생성 시스템 및 생성 방법 |
-
2002
- 2002-09-27 JP JP2002283897A patent/JP2004118718A/ja not_active Withdrawn
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006301675A (ja) * | 2005-04-15 | 2006-11-02 | Noritsu Koki Co Ltd | 画像処理装置及び画像処理方法 |
JP2007089186A (ja) * | 2005-09-22 | 2007-04-05 | Lg Electronics Inc | 動画撮影機能付き移動通信端末機及びその動作方法 |
JP2009253646A (ja) * | 2008-04-04 | 2009-10-29 | Canon Inc | 画像処理装置、画像処理方法 |
KR102369151B1 (ko) * | 2021-10-05 | 2022-03-02 | 아이픽셀 주식회사 | 동작 인식을 위한 메타 데이터 생성 시스템 및 생성 방법 |
WO2023058809A1 (ko) * | 2021-10-05 | 2023-04-13 | 아이픽셀 주식회사 | 동작 인식을 위한 메타 데이터 생성 시스템 및 생성 방법 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8923612B2 (en) | Image processing apparatus and method, and program | |
US10521885B2 (en) | Image processing device and image processing method | |
JP5389903B2 (ja) | 最適映像選択 | |
US8254630B2 (en) | Subject extracting method and device by eliminating a background region using binary masks | |
WO2020029518A1 (zh) | 一种监控视频处理方法、装置及计算机可读介质 | |
EP1600889A1 (en) | Apparatus and method for extracting character(s) from image | |
CN110610150B (zh) | 一种目标运动物体的跟踪方法、装置、计算设备和介质 | |
CN114418957A (zh) | 基于机器人视觉的全局和局部二值模式图像裂缝分割方法 | |
JPH0944670A (ja) | 特定画像領域抽出方法及び特定画像領域抽出装置 | |
CN111062293B (zh) | 一种基于深度学习的无人机森林火焰识别方法 | |
KR101051459B1 (ko) | 영상의 에지를 추출하는 장치 및 방법 | |
JP4373840B2 (ja) | 動物体追跡方法、動物体追跡プログラムおよびその記録媒体、ならびに、動物体追跡装置 | |
CN108563979B (zh) | 一种基于航拍农田图像判别水稻稻瘟病病情的方法 | |
CN107944403B (zh) | 一种图像中的行人属性检测方法及装置 | |
JP2004310475A (ja) | 画像処理装置、画像処理を行う携帯電話、および画像処理プログラム | |
Guo et al. | Image saliency detection based on local and regional features | |
Fuh et al. | Mcpa: A fast single image haze removal method based on the minimum channel and patchless approach | |
KR101146417B1 (ko) | 무인 감시 로봇에서 중요 얼굴 추적 장치 및 방법 | |
JPH07249128A (ja) | 車両用画像処理装置 | |
WO2024016632A1 (zh) | 亮点定位方法、亮点定位装置、电子设备及存储介质 | |
JP2004118718A (ja) | シーン変化点検出方法および装置並びにプログラム | |
CN114693543B (zh) | 图像降噪方法及装置、图像处理芯片、图像采集设备 | |
CN113066077B (zh) | 火焰检测方法及装置 | |
JP2009258770A (ja) | 画像処理方法、画像処理装置、画像処理プログラム、撮像装置 | |
JP2001209808A (ja) | 物体抽出システムと方法並びに物体抽出用プログラムを記憶した記憶媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Withdrawal of application because of no request for examination |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20060110 |