JP4768649B2 - カメラワーク検出方法,装置,プログラムおよびその記録媒体 - Google Patents

カメラワーク検出方法,装置,プログラムおよびその記録媒体 Download PDF

Info

Publication number
JP4768649B2
JP4768649B2 JP2007059331A JP2007059331A JP4768649B2 JP 4768649 B2 JP4768649 B2 JP 4768649B2 JP 2007059331 A JP2007059331 A JP 2007059331A JP 2007059331 A JP2007059331 A JP 2007059331A JP 4768649 B2 JP4768649 B2 JP 4768649B2
Authority
JP
Japan
Prior art keywords
frame
correlation
camera work
block
spatial
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2007059331A
Other languages
English (en)
Other versions
JP2008225591A (ja
Inventor
幸浩 坂東
和也 早瀬
誠之 高村
一人 上倉
由幸 八島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2007059331A priority Critical patent/JP4768649B2/ja
Publication of JP2008225591A publication Critical patent/JP2008225591A/ja
Application granted granted Critical
Publication of JP4768649B2 publication Critical patent/JP4768649B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Image Analysis (AREA)

Description

本発明は,高能率画像信号符号化方法などに用いるためのカメラワーク検出方法に関し,特にカメラワークが発生した動画像フレームにおいて各フレームにおける時間軸方向の変化を検出する方法に関する。
時間軸方向の大きな変化(高速なカメラパン・チルト,シーンチェンジ等)が発生したフレームにおいて,そのフレームの画質に対する感度は極端に低下する。これは,時間マスキング効果として知られる視覚特性である。そこで,時間軸方向の大きな変化が発生したフレームに対しては,符号量を削減しても主観画質の低下は検知されにくいため,積極的に符号量を低減するアプローチは有効である。この場合,各フレームにおける時間軸方向の大きな変化を検出することが重要となる。
従来,カメラワークに起因するフレーム内の大局的な動きの検出に関しては,グローバル動き補償,あるいは,スプライト符号化においてグローバルモーションの推定が検討されてきた[特許文献1参照]。
グローバルモーションとは,カメラワークに起因して発生するフレーム全体に共通した変移量を指す。従来手法では,ブロック単位で推定した変移量(ローカルモーション)に基づき,グローバルモーションが推定される。グローバル動き補償,スプライト符号化においては,グローバルモーションの向き,および,大きさが共に重要となるため,フレーム内のすべてのローカルモーションを統合して,グローバルモーションを推定するアプローチがとられる。このため,フレーム内のすべてのローカルモーションを考慮する必要がある。
特開平9−182081号公報
時間軸方向の大きな変化が発生したフレームを検出することを目的とする場合,変移量の大きさのみが問題であり,その方向は必ずしも必要ではない。このため,前述の従来法のように,フレーム内のすべてのローカルモーションを考慮する手法は,不必要な情報を得ることに計算量を割くことになる。計算量と符号化効率はトレードオフの関係にあるため,限られた計算機資源の環境下では,計算量の浪費は符号化効率の低下に繋がる。
また,従来法では,ブロック単位で推定した動きベクトルと真の動き量との乖離に関しては,考慮されていない。このため,求まるグローバルモーションが真のカメラワークから乖離する可能性がある。推定されたグローバルモーションが真の動き量よりも大きく見積もられた場合,前述のグローバルモーションに基づく符号量削減のアプローチでは,致命的な画質劣化の原因となる。
そこで,本発明では,フレーム内の特定の位置のローカルモーションに基づくグローバルモーションの大きさの検出法を確立することを目的とする。さらに,特定の位置のブロックに関して,空間方向の相関と時間方向の相関との大小比較を通して,ローカルモーションの信頼度を間接的に評価し,信頼度の低いローカルモーションにより,グローバルモーションの推定結果が乱されることを回避することを目的とする。
本発明は,上記課題を解決するため,カメラワークが発生したフレームにおける,次フレームにおいてフレーム内に存在せず,次フレーム内の画素との対応付けが不可能な領域(非連結領域と呼ぶ)において,直前フレームとの対応付けが不可能なため,時間方向の相関が著しく低下し,一方,空間方向の相関は,直前フレームとの対応付けの可否とは無関係であることに着目して,次のようにカメラワークを検出する。
例えば,フレーム内の右端の領域において,時間方向の相関が空間方向の相関よりも小さくなる場合に,当該フレームは,右方向のパンを含むフレームであると判別する。以下では,右方向のパンを含むフレームの判別を例に説明するが,左方向のパン,上方向のチルト,下方向のチルトの判別も同様に行うことができる。なお,これらの4方向の判別を同時に行う実施も,あらかじめ定められた特定の方向だけの判別を行う実施も可能である。
さらに,次のように直前のフレームだけではなく,直後のフレームについても時間的相関と空間的相関の比較を行うことにより,判別の精度を向上させることができる。すなわち,本発明による他の方法では,右方向のパンを含むフレームにおいては,フレーム内の右端の領域において,直前のフレームとの時間方向の相関が空間方向の相関よりも小さく,かつ,参照・被参照フレームの関係を時間軸上で反転した場合には,時間方向の相関が空間方向の相関よりも大きくなる場合に,右方向のパンを含むフレームであると判別する。
さらに,上端および下端の領域において,時間方向の相関が空間方向の相関よりも大きくなる場合に,右方向のパンを含むフレームであることを判別条件として加えることにより,判別の精度を上げることもできる。
上記発明において,空間方向の相関と時間方向の相関との大小比較を行う際,フレーム内を所定の大きさのブロックに分割し,外縁の領域に含まれるブロックごとに,動き補償によるフレーム間予測誤差と当該フレームにおけるイントラ予測に基づくフレーム内予測誤差の大小を比較し,フレーム内予測誤差がフレーム間予測誤差より小さいブロックの数または割合が所定の閾値より大きい場合に,時間方向の相関が空間方向の相関よりも小さいと判定する。
以上のように,フレーム内予測とフレーム間予測の予測誤差の大小関係により,フレームの外縁ブロックを分類し,カメラワークの判定に用いる。
また,上記発明において,前記外縁の領域のフレーム端からの幅を,段階的に徐々に広げながら,上記カメラワークの検出処理を繰り返し,前記時間方向の相関と前記空間方向の相関との大小関係が反転したときの外縁の領域の幅から,カメラワークの大きさを検出することもできる。
本発明によって,各フレームにおける時間軸方向の大きな変化(高速なカメラパン・チルト,シーンチェンジ等)を検出することが可能となる。これによって,時間軸方向の大きな変化が発生したフレームにおいて,時間マスキング効果を利用して符号量削減を図る動画像符号化において,フレーム単位の適応的な符号量割り当てが可能になり,このことは,効率的な符号量の削減に繋がる。また,本発明により,時間軸方向の大きな変化を含むフレームの検出に必要となる計算量の浪費を回避することが可能となる。計算量と符号化効率はトレードオフの関係にあるため,同検出処理で節約した計算量を他の処理に利用することで,限られた計算機資源の環境下でも,符号化効率の向上が図られる。
以下,本発明の基本的な概念と実施の形態を,図面を用いて説明する。
〔非連結領域〕
カメラのズーム,パン,チルトといったカメラワークを含む映像の場合,フレーム境界に近い領域の中には,次フレームではフレーム内に存在しないものもある。例えば,右方向のカメラパンを含む映像の場合,フレーム右端の外縁領域の一部は,直前フレームには存在しない。このように,直前フレーム内に存在せず,直前フレーム内の画素と当該フレーム内の画素との対応付けが不可能な領域を非連結領域と呼ぶ。
右方向のパンのカメラワークによる非連結領域の例を,図1に示す。図1(B)のフレームにおける網掛け部分が非連結領域を示す。こうした非連結領域では,図1(A)の直前フレームとの対応付けが不可能なため,時間方向の相関が著しく低下する。
一方,空間方向の相関は,直前フレームとの対応付けの可否とは無関係であり,非連結領域であることが原因で低下することはない。本発明では,この性質に着目して,大局的な動きを検出する。
〔フレーム内予測・フレーム間予測判定〕
フレーム内を一定サイズの矩形領域(以下,ブロックと呼ぶ)に分割する。このブロックのサイズN×Nは,外部から与えられるものとする。フレームの外縁に位置するブロック(以下,外縁ブロックと呼ぶ)に注目する。
例えば,図2に示すようにフレーム内をブロック分割した場合,外縁ブロックは,網掛け部分に当たる。ここでは,まず,図2に示すような外縁ブロックの配置を行った場合のカメラワークの判定方法について述べる。なお,抽出したい動き量に応じて,適応的に外縁ブロックの配置を変更し,詳しくは後述するように,カメラワークの大きさを検出することも可能である。
フレーム内の外縁ブロックに対して,イントラ予測(後述)における予測誤差と,前方インター予測(後述)における予測誤差との大小判定を行う。この判定の結果,イントラ予測における予測誤差の方が,前方インター予測における予測誤差よりも小くなったブロックは,非前方インターブロックと呼ぶカテゴリに分類し,それ以外は,前方インターブロックと呼ぶカテゴリに分類する。
次に,イントラ予測(後述)における予測誤差と,後方インター予測(後述)における予測誤差との大小判定を行う。この判定の結果,イントラ予測における予測誤差の方が,後方インター予測における予測誤差よりも小くなったブロックは,非後方インターブロックと呼ぶカテゴリに分類し,それ以外は,後方インターブロックと呼ぶカテゴリに分類する。
イントラ予測は,同一フレーム内の画素値を参照する予測方法であり,例えば,H.264で定義される予測方法がある。H.264では,輝度成分の4×4画素の場合には9種類,輝度成分の16×16画素の場合には4種類の予測方法が用意されている。これら13種類の予測方法の中から,予測誤差を最小化する方法を選択し,そのときの予測誤差を,イントラ予測における予測誤差とする。なお,H.264の規定では,予測に用いる参照画素値は復号画素値を用いることになっているが,ここでは,該当する位置にある原画素値を用いる。なお,これ以外の予測方法を用いることも可能である。
一方,前方インター予測の方法は,ブロックベースの動き補償予測を用いる。この方法では,符号化対象フレームft (p)(p∈{(x,y)|0≦x≦X−1,0≦y≦Y−1})(画面サイズX×Y)内のブロック毎に,次のようなフレーム間予測が行われる。
t ′(p)=ft-1 (p−vi ), p∈Bi
ここで,Bi は第i番目のブロックであり,vi は次式を満たす動きベクトルである。
Figure 0004768649
ここで,arg(添字v) min(添字v∈Ri )は,次に続く関数を最小化するvを返す。すなわち,探索範囲Ri において,ブロックBi 内での予測誤差を最小化するvが動きベクトルvi として選ばれる。このとき,動きベクトルvi に対応する予測誤差をインター予測における予測誤差とする。このように,前方インター予測は,時間軸上で直前に位置する過去のフレームを参照フレームとして用いる。これに対し,時間軸上で直後に位置する未来のフレームを参照フレームとして用いた予測方式が,後方インター予測である。
図3および図4に従って,本発明の概要を簡単に説明する。図3は,右方向のパンの検出を説明する図であり,図4は,上方向のチルトの検出を説明する図である。
例えば図3に示すように,右方向へのパンのカメラワークが発生したフレームにおいては,直前フレームとの関係では,当該フレームの右端の領域が非連結領域となり,ここで非前方インターブロックの個数が多くなる。一方,フレームの左端の領域では,非前方インターブロックの個数は比較的少ない。また,直後のフレームとの関係では,当該フレームの左端の領域が非連結領域となり,ここで非後方インターブロックの個数が多くなる。一方,フレームの右端の領域では,非後方インターブロックの個数は比較的少ない。さらに,右方向のパンでは,上端および下端の外縁の領域においては,前方インターブロックの数が多くなる。したがって,このような外縁ブロックの分類を行い,それをカメラワークの検出に用いれば,従来方法によって求めたグローバルモーションが,真のカメラワークから乖離する可能性があるという問題を解決することができる。
左方向のパンも,図3の左右を逆転させて同様に判定することにより,検出することができる。また,図4に示すように,上方向のチルトも外縁ブロックの分類を用いて検出することができ,同様に下方向のチルトも検出することができる。以下,これらの判定条件について,さらに詳しく説明する。
〔外縁ブロックに着目したカメラワークの判定(その1)〕
非連結領域となる外縁ブロックは,時間方向の相関が低いため,直前フレームを参照する場合には,非前方インターブロックに分類される可能性が高く,直後フレームを参照する場合には,非後方インターブロックに分類される可能性が高い。そこで,外縁ブロックにおける非前方インターブロック,非後方インターブロックの個数(または割合)に基づき,時間方向の相関と空間方向の相関のいずれが強いかを判別する。以下に述べる条件を組み合わせて,各カメラワークの判定条件とする。なお,ここで,フレームのサイズをX×Yとし,ブロックサイズをN×Nとし,さらに,NがX,Yの約数であるようにとるとする。
以下の閾値パラメータ(αr ,αl ,βt ,βb ,γt ,γb ,γr ,γl )は,100以下の正値をとるものとし,具体的な値は,外部から与えられるものとする。これらは,例えば符号化対象画像と統計的性質の近いテスト画像に対する予備実験を通して決定することができる。パラメータの値を大きな値に設定すれば,同パラメータを用いる条件の判定基準が厳しくなり,該当するブロックの数は減少する。
条件(1−f):右端の外縁ブロック(Y/N個)のうち,αr %以上が非前方インターブロックとなる
条件(1−b):右端の外縁ブロック(Y/N個)のうち,αr %以上が非後方インターブロックとなる
条件(2−f):左端の外縁ブロック(Y/N個)のうち,αl %以上が非前方インターブロックとなる
条件(2−b):左端の外縁ブロック(Y/N個)のうち,αl %以上が非後方インターブロックとなる
条件(3−f):上端の外縁ブロック(X/N個)のうち,βt %以上が非前方インターブロックとなる
条件(3−b):上端の外縁ブロック(X/N個)のうち,βt %以上が非後方インターブロックとなる
条件(4−f):下端の外縁ブロック(X/N個)のうち,βb %以上が非前方インターブロックとなる
条件(4−b):下端の外縁ブロック(X/N個)のうち,βb %以上が非後方インターブロックとなる
以下,右方向のパン,左方向のパン,上方向のチルト,下方向のチルトの判定条件を示す。
右方向のパンの判定条件:
・条件(1−f)を満たす
・条件(1−b)を満たさない
・条件(2−f)を満たさない
・条件(2−b)を満たす
・上端の外縁ブロックがγt %以上,前方インターブロックとなる
・下端の外縁ブロックがγb %以上,前方インターブロックとなる
これは,以下の理由による。右端の外縁ブロックが直前フレームに対して非連結領域である場合には,条件(1−f)を満たす可能性が高く,一方,直後フレームに対して,連結領域である場合には,条件(1−b)を満たさない可能性が高い。
すなわち,条件(1−f)を満たし,かつ,条件(1−b)を満たさない場合には,フレームの右端の画像は,過去のフレーム中には含まれておらず,未来のフレームにおいて含まれている可能性が高いと推測できる。左端の外縁ブロックが直前フレームに対して連結領域である場合,条件(2−f)を満たさない可能性が高く,一方,直後フレームに対して非連結領域である場合,条件(2−b)を満たす可能性が高い。すなわち,条件(2−b)を満たし,かつ,条件(2−f)を満たさない場合には,フレームの左端の画像は,過去のフレームにおいて含まれており,未来のフレーム中には含まれてない可能性が高いと推測できる。さらに,残る2条件を満たすことは,右左端以外の外縁ブロックにおいても,一定の動きが発生している可能性が高いと推測できる。こうした状況は,フレームの右端に過去フレーム中には存在しなかった画像がフレームインする右方向のパンのカメラワークと符合するため,上記条件を右方向のパンのカメラワークの発生条件とする。
同様に考えて,各カメラワークの判定条件を以下のように設定する。
左方向のパンの判定条件:
・条件(2−f)を満たす
・条件(2−b)を満たさない
・条件(1−f)を満たさない
・条件(1−b)を満たす
・上端の外縁ブロックがγt %以上,前方インターブロックとなる
・下端の外縁ブロックがγb %以上,前方インターブロックとなる
上方向のチルトの判定条件:
・条件(3−f)を満たす
・条件(3−b)を満たさない
・条件(4−f)を満たさない
・条件(4−b)を満たす
・右端の外縁ブロックがγr %以上,前方インターブロックとなる
・左端の外縁ブロックがγl %以上,前方インターブロックとなる
下方向のチルトの判定条件:
・条件(4−f)を満たす
・条件(4−b)を満たさない
・条件(3−f)を満たさない
・条件(3−b)を満たす
・右端の外縁ブロックがγr %以上,前方インターブロックとなる
・左端の外縁ブロックがγl %以上,前方インターブロックとなる
各カメラワークの判定条件を,以上のとおりとする。
〔外縁ブロックに着目したカメラワークの判定(その2)〕
前述の外縁ブロックに着目したカメラワークの判定(その1)に対して,さらに演算量を削減する方式を以下に示す。演算量削減のため,外縁ブロックにおける非前方インターブロックの個数に基づき,時間方向の相関と空間方向の相関のいずれが強いかを判別する。以下の条件を組み合わせて,各カメラワークの判定条件とする。
条件(1−f):右端の外縁ブロック(Y/N個)のうち,αr %以上が非前方インターブロックとなる
条件(2−f):左端の外縁ブロック(Y/N個)のうち,αl %以上が非前方インターブロックとなる
条件(3−f):上端の外縁ブロック(X/N個)のうち,βt %以上が非前方インターブロックとなる
条件(4−f):下端の外縁ブロック(X/N個)のうち,βb %以上が非前方インターブロックとなる
以下,右方向のパン,左方向のパン,上方向のチルト,下方向のチルトの判定条件を示す。
右方向のパンの判定条件:
・条件(1−f)を満たす
・条件(2−f)を満たさない
・上端の外縁ブロックがγt %以上,前方インターブロックとなる
・下端の外縁ブロックがγb %以上,前方インターブロックとなる
左方向のパンの判定条件:
・条件(2−f)を満たす
・条件(1−f)を満たさない
・上端の外縁ブロックがγt %以上,前方インターブロックとなる
・下端の外縁ブロックがγb %以上,前方インターブロックとなる
上方向のチルトの判定条件:
・条件(3−f)を満たす
・条件(4−f)を満たさない
・右端の外縁ブロックがγr %以上,前方インターブロックとなる
・左端の外縁ブロックがγl %以上,前方インターブロックとなる
下方向のチルトの判定条件:
・条件(4−f)を満たす
・条件(3−f)を満たさない
・右端の外縁ブロックがγr %以上,前方インターブロックとなる
・左端の外縁ブロックがγl %以上,前方インターブロックとなる
〔カメラワークの大きさの検出方法〕
カメラワークの大きさを検出する方法について,以下説明する。本処理の入力は,ブロックの辺長N[画素]および抽出するカメラワークの大きさP[画素](カメラワークを表す動きベクトルのノルム)とする。抽出するカメラワークの大きさP[画素]は,P=(k+a)N(kは正の整数)とする。ここで,aは,0<a≦1の範囲で予め設定されるパラメータである。
前述の〔外縁ブロックに着目したカメラワークの判定(その1)〕あるいは〔外縁ブロックに着目したカメラワークの判定(その2)〕で説明した判定条件に従い,4方向のカメラワークに対する判定処理を行う。このとき,いずれかの方向のカメラワークが検出された場合,その大きさを同定するための処理を追加する。例えば,大きさP=(2+a)N[画素]以上の左方向のカメラパンを含むフレームを検出する場合,図5における濃い網掛けのブロックに対して,判定処理が追加される。
以下では,〔外縁ブロックに着目したカメラワークの判定(その1)〕を用いる場合と,〔外縁ブロックに着目したカメラワークの判定(その2)〕を用いる場合とに分けて,具体的な処理を示す。
<外縁ブロックに着目したカメラワークの判定(その1)を用いる場合>
なお,以下で示す右方向のパン,左方向のパン,上方向のチルト,および下方向のチルトの判定条件は,いずれも前述した条件を指す。
(i) 右方向に,P=(k+a)N[画素]以上のパンが発生していると判断する判定条件:
前述の右方向のパンの判定条件を満たし,かつ,フレーム右端の外縁ブロックの左側に隣接する垂直方向に[Y/N]−2個,水平方向にk−1個からなる([Y/N]−2)×(k−1)個のブロックに対して,以下を満足する。なお,ここで[・]はガウス記号であり,[x]は実数xを超えない最大の整数を表す。
・条件(1−f)を満たす
・条件(1−b)を満たさない
・条件(2−f)を満たさない
・条件(2−b)を満たす
(ii) 左方向に,P=(k+a)N[画素]以上のパンが発生していると判断する判定条件:
前述の左方向のパンの判定条件を満たし,かつ,フレーム左端の外縁ブロックの右側に隣接する垂直方向に[Y/N]−2個,水平方向にk−1個からなる([Y/N]−2)×(k−1)個のブロックに対して,以下を満足する。
・条件(2−f)を満たす
・条件(2−b)を満たさない
・条件(1−f)を満たさない
・条件(1−b)を満たす
(iii) 上方向に,P=(k+a)N[画素]以上のチルトが発生していると判断する判定条件:
前述の上方向のチルトの判定条件を満たし,かつ,フレーム上端の外縁ブロックの下側に隣接する垂直方向にk−1個,水平方向に[X/N]−2個からなる(k−1)×([X/N]−2)個のブロックに対して,以下を満足する。
・条件(3−f)を満たす
・条件(3−b)を満たさない
・条件(4−f)を満たさない
・条件(4−b)を満たす
(iv) 下方向に,P=(k+a)N[画素]以上のチルトが発生していると判断する判定条件:
前述の下方向のチルトの判定条件を満たし,かつ,フレーム下端の外縁ブロックの上側に隣接する垂直方向にk−1個,水平方向に[X/N]−2個からなる(k−1)×([X/N]−2)個のブロックに対して,以下を満足する。
・条件(4−f)を満たす
・条件(4−b)を満たさない
・条件(3−f)を満たさない
・条件(3−b)を満たす
<外縁ブロックに着目したカメラワークの判定(その2)を用いる場合>
なお,以下で示す右方向のパン,左方向のパン,上方向のチルト,および下方向のチルトの判定条件は,いずれも前述した外縁ブロックに着目したカメラワークの判定(その2)で示した条件を指す。
(i) 右方向に,P=(k+a)N[画素]以上のパンが発生していると判断する判定条件:
前述の右方向のパンの判定条件を満たし,かつ,フレーム右端の外縁ブロックの左側に隣接する垂直方向に[Y/N]個,水平方向にk−1個からなる[Y/N]×(k−1)個のブロックに対して,以下を満足する。なお,ここで[・]はガウス記号であり,[x]は実数xを超えない最大の整数を表す。
・条件(1−f)を満たす
・条件(2−f)を満たさない
(ii) 左方向に,P=(k+a)N[画素]以上のパンが発生していると判断する判定条件:
前述の左方向のパンの判定条件を満たし,かつ,フレーム左端の外縁ブロックの右側に隣接する垂直方向に[Y/N]個,水平方向にk−1個からなる[Y/N]×(k−1)個のブロックに対して,以下を満足する。
・条件(2−f)を満たす
・条件(1−f)を満たさない
(iii) 上方向に,P=(k+a)N[画素]以上のチルトが発生していると判断する判定条件:
前述の上方向のチルトの判定条件を満たし,かつ,フレーム上端の外縁ブロックの下側に隣接する垂直方向にk−1個,水平方向に[X/N]個からなる(k−1)×[X/N]個のブロックに対して,以下を満足する。
・条件(3−f)を満たす
・条件(4−f)を満たさない
(iv)下方向に,P=(k+a)N[画素]以上のチルトが発生していると判断する判定条件:
前述の下方向のチルトの判定条件を満たし,かつ,フレーム下端の外縁ブロックの上側に隣接する垂直方向にk−1個,水平方向に[X/N]個からなる(k−1)×[X/N]個のブロックに対して,以下を満足する。
・条件(4−f)を満たす
・条件(3−f)を満たさない
なお,上記の前方インターブロック,および非前方インターブロックの判定は,フレームの外側に位置するブロックの列(またはブロックの行)から順に行うこととする。あるブロックの列(またはブロックの行)において,条件を満たさない場合には,それ以降のブロックの列(またはブロックの行)における判定は省略する。
また,上下方向のチルトと左右方向のパンとを同時に満たす場合,斜め方向のカメラワークと判断する。例えば,左方向にP=kN[画素]以上のパンが発生していると判定され,かつ,上方向にP=mN[画素]以上のパンが発生していると判定された場合,左斜め上方向に,(k2 +m2 1/2 ×N[画素]以上のカメラワークが発生していると判断する。これらは,前述の〔外縁ブロックに着目したカメラワークの判定(その1)〕あるいは〔外縁ブロックに着目したカメラワークの判定(その2)〕のいずれを用いる場合も,同様である。
[フローチャート]
本発明の処理の実施形態について,図6を参照して説明する。
・ステップS1:外縁ブロックに対して,モードの判定処理を行う。本処理の詳細については図7を用いて後述する。
・ステップS2:右端,左端,上端,下端の各外縁ブロックに対して,時間方向の相関の強度を測定する。本処理の詳細については図8,図9を用いて後述する。
・ステップS3:当該フレームにおいて右方向のパンのカメラワークが含まれているか否かの判定を行う。本処理の詳細については図10を用いて後述する。
・ステップS4:ステップS3における判定結果を入力とし,判定結果が真値の場合,ステップS5に進み,パンの方向を表すフラグを2にセットする。一方,判定結果が偽値の場合,ステップS6の処理に移る。
・ステップS6:当該フレームにおいて左方向のパンのカメラワークが含まれているか否かの判定を行う。本処理の詳細については図11を用いて後述する。
・ステップS7:ステップS6における判定結果を入力とし,判定結果が真値の場合,ステップS9に進み,パンの方向を表すフラグを1にセットする。一方,判定結果が偽値の場合,ステップS8に進み,パンの方向を表すフラグを0にセットする。
・ステップS10:当該フレームにおいて上方向のチルトのカメラワークが含まれているか否かの判定を行う。本処理の詳細については図12を用いて後述する。
・ステップS11:ステップS10における判定結果を入力とし,判定結果が真値の場合,ステップS12に進み,チルトの方向を表すフラグを2にセットする。一方,判定結果が偽値の場合,ステップS13の処理に移る。
・ステップS13:当該フレームにおいて下方向のチルトのカメラワークが含まれているか否かの判定を行う。本処理の詳細については図13を用いて後述する。
・ステップS14:ステップS13における判定結果を入力とし,判定結果が真値の場合,ステップS16に進み,チルトの方向を表すフラグを1にセットする。一方,判定結果が偽値の場合,ステップS15に進み,チルトの方向を表すフラグを0にセットする。
・ステップS17:パンの方向フラグ,チルトの方向フラグを入力とし,パンの方向フラグが0でない,または,チルトの方向フラグが0でないといういずれかの条件を満たせば,カメラワークが含まれると判定し,そうでなければ,カメラワークが含まれないと判定する。
・ステップS18:すべてのフレームについて処理を終えたかどうかを判定し,判定結果が真値の場合,処理を終了する。偽値の場合,ステップS19へ進む。
・ステップS19:処理対象を次フレームとし,ステップS1へ戻って同様に処理を繰り返す。
<ステップS1の処理の流れ(その1)>
図7は,図6のステップS1における詳細な処理の流れを示している。以下,図7を用いて,ステップS1における外縁ブロックに対して行うモードの判定処理の詳細を説明する。
・ステップS101:当該フレームを読み込み,フレームバッファに格納する。
・ステップS102:当該フレームに対して,前方フレーム間予測を行う場合の参照フレーム(前方予測参照フレーム)を読み込み,フレームバッファに格納する。
・ステップS103:当該フレームを読み込み,当該フレーム中の当該ブロックに対して,フレーム内予測を行い,同ブロックにおける予測誤差をレジスタに書き出す。フレーム内予測の方法としては,例えば,H.264で規定される方法がある。
・ステップS104:当該フレーム,前方予測参照フレームを入力として読み込み,当該フレーム中の当該ブロックに対して,動き補償によるフレーム間予測を行い,同ブロックにおける予測誤差をレジスタに書き出す。動き補償によるフレーム間予測の方法としては,例えば,H.264で規定される方法がある。
・ステップS105:ステップS103およびステップS104で算出したフレーム内予測誤差およびフレーム間予測誤差を入力とし,両者を比較する処理を行い,フレーム内予測誤差がフレーム間予測誤差よりも小さい場合には,ステップS106の処理に移る。そうでなければ,ステップS107の処理に移る。
・ステップS106:当該ブロックのモードを非前方インターブロックとして,当該ブロックの位置情報と共に,このモード情報を書き出し,ステップS113へ進む。
・ステップS107:当該ブロックのモードを前方インターブロックとして,当該ブロックの位置情報と共に,このモード情報を書き出し,ステップS113へ進む。
・ステップS108:当該フレームに対して,後方フレーム間予測を行う場合の参照フレーム(後方予測参照フレーム)を読み込み,フレームバッファに格納する。
・ステップS109:当該フレーム,後方予測参照フレームを読み込み,当該フレーム中の当該ブロックに対して,動き補償によるフレーム間予測を行い,同ブロックにおける予測残差和を書き出す。動き補償によるフレーム間予測の方法としては,例えば,H.264の方法がある。
・ステップS110:ステップS103およびステップS109で算出したフレーム内予測誤差およびフレーム間予測誤差を入力とし,両者を比較する処理を行い,フレーム内予測誤差がフレーム間予測誤差よりも小さい場合には,ステップS111の処理に移る。そうでなければ,ステップS112の処理に移る。
・ステップS111:当該ブロックのモードを非後方インターブロックとして,当該ブロックの位置情報と共に,このモード情報を書き出し,ステップS113へ進む。
・ステップS112:当該ブロックのモードを後方インターブロックとして,当該ブロックの位置情報と共に,このモード情報を書き出し,ステップS113へ進む。
・ステップS113:すべての外縁ブロックについて処理を終えたかどうかを判定し,判定結果が真値の場合には処理を終了し,呼出し元へ戻る。偽値の場合,ステップS114へ進む。
・ステップS114:処理対象を次の外縁ブロックとし,ステップS103,S104,S109以降の処理を同様に繰り返す。
<ステップS1の処理の流れ(その2)>
図6のステップS1の処理としては,図7に示す処理方法の他に,図21に示すように,演算量をさらに削減した方法を用いることも可能である。図21に示す処理は,図7から,一部処理を省略した構成になっており,各処理については,図7で説明した処理と同様であるので,これ以上の詳しい説明を省略する。
<ステップS2の処理の流れ(その1)>
図8および図9は,図6のステップS2における詳細な処理の流れを示している。以下,図8を用いて,ステップS2における外縁ブロックに対して時間方向の相関の強度を測定する処理の詳細を説明する。なお,図9については,図8と同様であるので,個々の処理ステップに関する詳しい説明は省略する。
・ステップS201:図7で出力される右端の外縁ブロックに対するモード識別処理の結果を入力とし,非前方インターブロックに分類されたブロックの個数をカウントする処理を行い,このカウントされた頻度値をレジスタに書き出す。また,図7で出力される右端の外縁ブロックに対するモード識別処理の結果を入力とし,非後方インターブロックに分類されたブロックの個数をカウントする処理を行い,このカウントされた頻度値をレジスタに書き出す。
・ステップS202:所定の閾値,およびステップS201で出力した非前方インターブロックの頻度値を入力とし,右端の外縁ブロックに対して,非前方インターブロックの占める割合を算出し,同割合と閾値の大小比較を行う。同割合が閾値以上であれば,右端の外縁ブロックに対する前方弱時間相関フラグを1に設定する。そうでなければ,前方弱時間相関フラグを0に設定する。
・ステップS203:所定の閾値,およびステップS201で出力した非後方インターブロックの頻度値を入力とし,右端の外縁ブロックに対して,非後方インターブロックの占める割合を算出し,同割合と閾値の大小比較を行う。同割合が閾値以上であれば,右端の外縁ブロックに対する後方弱時間相関フラグを1に設定する。そうでなければ,後方弱時間相関フラグを0に設定する。
・ステップS204:図7で出力される上端の外縁ブロックに対するモード識別処理の結果を入力とし,前方インターブロックに分類されたブロックの個数をカウントする処理を行い,このカウントされた頻度値をレジスタに書き出す。同様に,後方インターブロックに分類されたブロックの個数をカウントする処理を行い,このカウントされた頻度値をレジスタに書き出す。
・ステップS205:図7で出力される下端の外縁ブロックに対するモード識別処理の結果を入力とし,前方インターブロックに分類されたブロックの個数をカウントする処理を行い,このカウントされた頻度値をレジスタに書き出す。同様に,後方インターブロックに分類されたブロックの個数をカウントする処理を行い,このカウントされた頻度値をレジスタに書き出す。
・ステップS206:所定の閾値,およびステップS204,S205で出力した頻度値を入力とし,上端の外縁ブロックに対して,前方インターブロックの占める割合,および後方インターブロックの占める割合を算出し,これら2つの割合に対して,各々,閾値との大小比較を行う。これらの2つの割合のいずれかが,閾値以上であれば,上端の外縁ブロックに対する動領域フラグを1に設定する。そうでなければ,動領域フラグを0に設定する。
・ステップS207:所定の閾値,およびステップS204,S205で出力した頻度値を入力とし,下端の外縁ブロックに対して,前方インターブロックの占める割合,および後方インターブロックの占める割合を算出し,これら2つの割合に対して,各々,閾値との大小比較を行う。これらの2つの割合のいずれかが,閾値以上であれば,下端の外縁ブロックに対する動領域フラグを1に設定する。そうでなければ,動領域フラグを0に設定する。
・ステップS211−S217:ステップS201−S207と同様である。
<ステップS2の処理の流れ(その2)>
図6のステップS2の処理としては,図8および図9に示す処理方法の他に,図22および図23に示すように,演算量をさらに削減した方法を用いることも可能である。図22および図23に示す処理は,図8および図9から,一部処理を省略した構成になっており,各処理については,図8で説明した処理と同様であるので,これ以上の詳しい説明を省略する。
<ステップS3の処理の流れ(その1)>
図10は,図6のステップS3における詳細な処理の流れを示している。以下,図10を用いて,ステップS3における右方向のパンの判定処理の詳細を説明する。
・ステップS301:図8で出力した右端の外縁ブロックに対する前方弱時間相関フラグを入力として読み込み,レジスタに書き出す。
・ステップS302:ステップS301で読み込んだ右端の外縁ブロックに対する前方弱時間相関フラグを入力として,1か否かの判定処理を行い,1である場合,ステップS303の処理に移り,そうでなければ,ステップS314の処理に移る。
・ステップS303:図8で出力した右端の外縁ブロックに対する後方弱時間相関フラグを入力として読み込み,レジスタに書き出す。
・ステップS304:ステップS303で読み込んだ右端の外縁ブロックに対する後方弱時間相関フラグを入力として,同フラグが零値か否かの判定処理を行い,零値の場合,ステップS305の処理に移り,そうでなければ,ステップS314の処理に移る。
・ステップS305:図8で出力した左端の外縁ブロックに対する前方弱時間相関フラグを入力として読み込み,レジスタに書き出す。
・ステップS306:ステップS305で読み込んだ左端の外縁ブロックに対する前方弱時間相関フラグを入力として,同フラグが零値か否かの判定処理を行い,零値の場合,ステップS307の処理に移り,そうでなければ,ステップS314の処理に移る。
・ステップS307:図8で出力した左端の外縁ブロックに対する後方弱時間相関フラグを入力として読み込み,レジスタに書き出す。
・ステップS308:ステップS307で読み込んだ左端の外縁ブロックに対する後方弱時間相関フラグを入力として,同フラグが1か否かの判定処理を行い,同フラグが1である場合,ステップS309の処理に移り,そうでなければ,ステップS314の処理に移る。
・ステップS309:図8で出力した上端の外縁ブロックに対する動領域フラグを入力として読み込み,レジスタに書き出す。
・ステップS310:ステップS309で読み込んだ上端の外縁ブロックに対する動領域フラグを入力として,同フラグが1か否かの判定処理を行い,同フラグが1である場合,ステップS311の処理に移り,そうでなければ,ステップS314の処理に移る。
・ステップS311:図8で出力した下端の外縁ブロックに対する動領域フラグを入力として読み込み,レジスタに書き出す。
・ステップS312:ステップS311で読み込んだ下端の外縁ブロックに対する動領域フラグを入力として,同フラグが1か否かの判定処理を行い,同フラグが1である場合,ステップS313の処理に移り,そうでなければ,ステップS314の処理に移る。
・ステップS313:当該フレームに,右方向のパンが含まれると判定する。
・ステップS314:当該フレームに,右方向のパンが含まれないと判定する。
図11,図12,図13については,図10と同様であり,それぞれ左方向のパンの判定処理,上方向のチルトの判定処理,下方向のチルトの判定処理を示している。
<ステップS3の処理の流れ(その2)>
図6のステップS3の処理としては,図10に示す処理方法の他に,図24に示すように,演算量をさらに削減した方法を用いることも可能である。図24に示す処理は,図10から,一部処理を省略した構成になっており,各処理については,図10で説明した処理と同様であるので,これ以上の詳しい説明を省略する。
図25,図26,図27についても,図24と同様である。
[装置図]
本発明の実施形態の装置図を,図14に示す。以下,図14を参照してカメラワーク検出装置の各部について説明する。
・外縁ブロック判定部101:外縁ブロックに対して,モードの判定処理を行い,判定結果をブロックタイプ記憶部102に書き出す。本処理部の詳細については,図15を用いて後述する。
・右端外縁ブロック選択部103:ブロックタイプ記憶部102から読み出すブロックタイプを入力とし,右端の外縁ブロックのブロックタイプを抽出する。
・右端外縁ブロックフラグ設定部104:右端の外縁ブロックに対して,時間方向の相関の強度を測定し,同強度を表すフラグを右端外縁ブロックフラグ記憶部105に書き出す。本処理部の詳細については,図16を用いて後述する。
・左端外縁ブロック選択部106:ブロックタイプ記憶部102から読み出すブロックタイプを入力とし,左端の外縁ブロックのブロックタイプを抽出する。
・左端外縁ブロックフラグ設定部107:左端の外縁ブロックに対して,時間方向の相関の強度を測定し,同強度を表すフラグを左端外縁ブロックフラグ記憶部108に書き出す。本処理部の詳細については,図16を用いて後述する。
・上端外縁ブロック選択部109:ブロックタイプ記憶部102から読み出すブロックタイプを入力とし,上端の外縁ブロックのブロックタイプを抽出する。
・上端外縁ブロックフラグ設定部110:上端の外縁ブロックに対して,時間方向の相関の強度を測定し,同強度を表すフラグを上端外縁ブロックフラグ記憶部111に書き出す。本処理部の詳細については,図16を用いて後述する。
・下端外縁ブロック選択部112:ブロックタイプ記憶部102から読み出すブロックタイプを入力とし,下端の外縁ブロックのブロックタイプを抽出する。
・下端外縁ブロックフラグ設定部113:下端の外縁ブロックに対して,時間方向の相関の強度を測定し,同強度を表すフラグを下端外縁ブロックフラグ記憶部114に書き出す。本処理部の詳細については,図16を用いて後述する。
・カメラワーク判定部120:カメラワークを判定するために,以下の右方向パン判定部121,左方向パン判定部122,上方向チルト判定部123,下方向チルト判定部124を備える。
・右方向パン判定部121:当該フレームにおいて右方向のパンのカメラワークが含まれているか否かの判定を行う。ここで行う判定処理の詳細については,図17を用いて後述する。
・左方向パン判定部122:当該フレームにおいて左方向のパンのカメラワークが含まれているか否かの判定を行う。ここで行う判定処理の詳細については,図18を用いて後述する。
・上方向チルト判定部123:当該フレームにおいて上方向のチルトのカメラワークが含まれているか否かの判定を行う。ここで行う判定処理の詳細については,図19を用いて後述する。
・下方向チルト判定部124:当該フレームにおいて下方向のチルトのカメラワークが含まれているか否かの判定を行う。ここで行う判定処理の詳細については,図20を用いて後述する。
<外縁ブロック判定部101の構成図>
外縁ブロック判定部101の構成図を,図15に示す。
・前方予測参照フレーム記憶部201:当該フレームに対して,前方フレーム間予測を行う場合の参照フレーム(前方予測参照フレーム)を格納する。
・当該フレーム記憶部202:当該フレームを格納する。
・後方予測参照フレーム記憶部203:当該フレームに対して,後方フレーム間予測を行う場合の参照フレーム(後方予測参照フレーム)を読み込み,フレームバッファに格納する。
・フレーム内予測誤差算出部204:当該フレーム記憶部202から読み出した当該フレームを入力として,当該フレーム中の当該ブロックに対して,フレーム内予測を行い,同ブロックにおける予測残差和をフレーム内予測誤差記憶部205に書き出す。フレーム内予測の方法としては,例えば,H.264で規定された方法がある。
・フレーム間予測誤差算出部206:当該フレーム記憶部202から読み出した当該フレーム,前方予測参照フレーム記憶部201から読み出した前方予測参照フレームを入力として,当該フレーム中の当該ブロックに対して,動き補償によるフレーム間予測を行い,同ブロックにおける予測残差和をフレーム間予測誤差記憶部207に書き出す。動き補償によるフレーム間予測の方法としては,例えば,H.264で規定された方法がある。
・フレーム間予測誤差算出部208:当該フレーム記憶部202から読み出した当該フレーム,後方予測参照フレーム記憶部203から読み出した後方予測参照フレームを入力として,当該フレーム中の当該ブロックに対して,動き補償によるフレーム間予測を行い,同ブロックにおける予測残差和をフレーム間予測誤差記憶部209に書き出す。動き補償によるフレーム間予測の方法としては,例えば,H.264で規定された方法がある。
・予測誤差比較部210:フレーム内予測誤差記憶部205およびフレーム間予測誤差記憶部207から読み出したフレーム内予測誤差およびフレーム間予測誤差を入力とし,両者を比較する処理を行い,比較結果をブロックタイプ出力部211へ渡す。
・ブロックタイプ出力部211:予測誤差比較部210にて出力されたフレーム内予測誤差とフレーム間予測誤差の比較結果を入力として読み込み,フレーム内予測誤差がフレーム間予測誤差よりも小さい場合には,非前方インターブロックとして,当該ブロックの位置情報と共に,このモード情報をブロックタイプ記憶部214に書き出す。そうでなければ,前方インターブロックとして,当該ブロックの位置情報と共に,このモード情報をブロックタイプ記憶部214に書き出す。
・予測誤差比較部212:フレーム内予測誤差記憶部205およびフレーム間予測誤差記憶部209から読み出したフレーム内予測誤差およびフレーム間予測誤差を入力とし,両者を比較する処理を行い,比較結果をブロックタイプ出力部213へ渡す。
・ブロックタイプ出力部213:予測誤差比較部212にて出力されたフレーム内予測誤差とフレーム間予測誤差の比較結果を入力として読み込み,フレーム内予測誤差がフレーム間予測誤差よりも小さい場合には,非後方インターブロックとして,当該ブロックの位置情報と共に,このモード情報をブロックタイプ記憶部214に書き出す。そうでなければ,後方インターブロックとして,当該ブロックの位置情報と共に,このモード情報をブロックタイプ記憶部214に書き出す。
・最終ブロック判定部215:以上の処理をすべての外縁ブロックについて行う。
外縁ブロック判定部101の装置構成としては,図28に示すように,装置構成の演算量をさらに削減した構成も可能である。図28に示す装置構成は,図15に示す装置構成の一部を省略した構成になっており,各処理部については,図15と同様である。
<右端外縁ブロックフラグ設定部104,左端外縁ブロックフラグ設定部107,上端外縁ブロックフラグ設定部110,下端外縁ブロックフラグ設定部113の構成図>
右端外縁ブロックフラグ設定部104,左端外縁ブロックフラグ設定部107,上端外縁ブロックフラグ設定部110,下端外縁ブロックフラグ設定部113の詳細構成について,図16を用いて説明する。
・外縁ブロック位置指定部300:カメラパラメータの検出対象とする外縁ブロックの指定位置を入力として,同指定位置を外縁ブロック位置指定記憶部304,310に書き出す。さらに,入力された指定位置に対してインターブロック判定の対象位置を313に書き出す。ここで外縁ブロックの位置とは,右端,左端,上端,下端のいずれかである。
・ブロックタイプ記憶部301:外縁ブロックのブロックタイプを格納する。
・非前方インターブロックカウント部302:ブロックタイプ記憶部301から読み出した外縁ブロックに対するブロックタイプを入力とし,非前方インターブロックに分類されたブロックの個数を外縁ブロックの位置毎にカウントする処理を行い,このカウントされた頻度値を外縁ブロックの位置毎にカウンター記憶部303に書き出す。ここで外縁ブロックの位置とは,右端,左端,上端,下端のいずれかである。
・非前方インターブロック割合判定部305:閾値記憶部307から読み出した閾値,および外縁ブロック位置指定記憶部304にて指定された位置の外縁ブロック(指定位置の外縁ブロック)に対する非前方インターブロックに分類されたブロックの頻度値をカウンター記憶部303から読み出して入力とし,指定位置の外縁ブロックに対して,非前方インターブロックの占める割合を算出し,同割合と閾値の大小比較を行う。同割合が閾値以上であれば,外縁ブロックに対する前方弱時間相関フラグを1に設定し,そうでなければ,同フラグを0に設定し,同フラグの値を前方弱時間相関フラグ記憶部306に書き出す。
・非後方インターブロックカウント部308:ブロックタイプ記憶部301から読み出した外縁ブロックに対するブロックタイプを入力とし,非後方インターブロックに分類されたブロックの個数を外縁ブロックの位置毎にカウントする処理を行い,このカウントされた頻度値を外縁ブロックの位置毎にカウンター記憶部309に書き出す。ここで外縁ブロックの位置とは,右端,左端,上端,下端のいずれかである。
・非後方インターブロック割合判定部311:閾値記憶部313から読み出した閾値,および外縁ブロック位置指定記憶部310にて指定された位置の外縁ブロック(指定位置の外縁ブロック)に対する非後方インターブロックに分類されたブロックの頻度値を,カウンター記憶部309から読み出して入力とし,指定位置の外縁ブロックに対して,非後方インターブロックの占める割合を算出し,同割合と閾値の大小比較を行う。同割合が閾値以上であれば,外縁ブロックに対する後方弱時間相関フラグを1に設定し,そうでなければ,同フラグを0に設定し,同フラグの値を後方弱時間相関フラグ記憶部312に書き出す。
・前方インターブロック割合判定部315:閾値記憶部317から読み出した閾値,および外縁ブロック位置指定記憶部314にて指定された位置の外縁ブロック(指定位置の外縁ブロック)に対する前方インターブロックあるいは,後方インターブロックに分類されたブロックの頻度値を,カウンター記憶部303および309から読み出して入力とし,指定位置の外縁ブロックに対して,前方インターブロックの占める割合,および後方インターブロックの占める割合を算出し,各々の割合と閾値の大小比較を行う。前方インターブロックの占める割合が閾値以上,または,後方インターブロックの占める割合が閾値以上であれば,外縁ブロックに対する動領域フラグを1に設定し,そうでなければ,同フラグを0に設定し,同フラグの値を動領域フラグ記憶部316に書き出す。
以上の右端外縁ブロックフラグ設定部104,左端外縁ブロックフラグ設定部107,上端外縁ブロックフラグ設定部110,下端外縁ブロックフラグ設定部113の装置構成としては,図29に示す演算量をさらに削減した構成も可能である。図29に示す装置構成は,図16に示す装置構成から一部を省略した構成になっており,各処理部については,図16と同様である。
<右方向パン判定部121の構成図>
右方向パン判定部121の構成図を,図17に示す。以下,図17を用いて右方向パン判定部121の詳細構成について説明する。
・右側外縁ブロック前方弱時間相関フラグ記憶部401:図14の右端外縁ブロックフラグ記憶部105から読み出した右端の外縁ブロックに対する前方弱時間相関フラグを格納する。
・右側外縁ブロック前方弱時間相関フラグ非零値判定部402:右側外縁ブロック前方弱時間相関フラグ記憶部401から読み込んだ右端の外縁ブロックに対する前方弱時間相関フラグを入力として,同フラグが1か否かの判定処理を行い,同フラグが1の場合,右側外縁ブロック後方弱時間相関フラグ記憶部403の処理に移り,そうでなければ,右方向パンフラグ設定部413の処理に移る。
・右側外縁ブロック後方弱時間相関フラグ記憶部403:図14の右端外縁ブロックフラグ記憶部105から読み出した右端の外縁ブロックに対する後方弱時間相関フラグを格納する。
・右側外縁ブロック後方弱時間相関フラグ零値判定部404:右側外縁ブロック後方弱時間相関フラグ記憶部403から読み込んだ右端の外縁ブロックに対する後方弱時間相関フラグを入力として,同フラグが零値か否かの判定処理を行い,同フラグが零値の場合,左側外縁ブロック前方弱時間相関フラグ記憶部405の処理に移り,そうでなければ,右方向パンフラグ設定部413の処理に移る。
・左側外縁ブロック前方弱時間相関フラグ記憶部405:図14の左側外縁ブロックフラグ記憶部108から読み出した左端の外縁ブロックに対する前方弱時間相関フラグを格納する。
・左側外縁ブロック前方弱時間相関フラグ零値判定部406:左側外縁ブロック前方弱時間相関フラグ記憶部405から読み込んだ左端の外縁ブロックに対する前方弱時間相関フラグを入力として,同フラグが零値か否かの判定処理を行い,同フラグが零値の場合,左側外縁ブロック後方弱時間相関フラグ記憶部407の処理に移り,そうでなければ,右方向パンフラグ設定部413の処理に移る。
・左側外縁ブロック後方弱時間相関フラグ記憶部407:図14の左端外縁ブロックフラグ記憶部108から読み出した左端の外縁ブロックに対する後方弱時間相関フラグを格納する。
・左側外縁ブロック後方弱時間相関フラグ非零値判定部408:左側外縁ブロック後方弱時間相関フラグ記憶部407から読み込んだ左端の外縁ブロックに対する後方弱時間相関フラグを入力として,同フラグが1か否かの判定処理を行い,同フラグが1の場合,上側外縁ブロック動領域フラグ記憶部409の処理に移り,そうでなければ,右方向パンフラグ設定部413の処理に移る。
・上側外縁ブロック動領域フラグ記憶部409:図14の上端外縁ブロックフラグ記憶部111から読み出した上端の外縁ブロックに対する動領域フラグを格納する。
・上側外縁ブロック動領域フラグ非零値判定部410:上側外縁ブロック動領域フラグ記憶部409から読み込んだ上端の外縁ブロックに対する動領域フラグを入力として,同フラグが1か否かの判定処理を行い,同フラグが1の場合,下側外縁ブロック動領域フラグ記憶部411の処理に移り,そうでなければ,右方向パンフラグ設定部413の処理に移る。
・下側外縁ブロック動領域フラグ記憶部411:図14の下端外縁ブロックフラグ記憶部114から読み出した下端の外縁ブロックに対する動領域フラグを格納する。
・下側外縁ブロック動領域フラグ非零値判定部412:下側外縁ブロック動領域フラグ記憶部411から読み込んだ下端の外縁ブロックに対する動領域フラグを入力として,同フラグが1か否かの判定処理を行い,同フラグが1の場合,右方向パンフラグ設定部414の処理に移り,そうでなければ,右方向パンフラグ設定部413の処理に移る。
・右方向パンフラグ設定部414:当該フレームに,右方向のパンが含まれると判定し,その結果を右方向パンフラグ記憶部415に設定する。
・右方向パンフラグ設定部413:当該フレームに,右方向のパンが含まれないと判定し,その結果を右方向パンフラグ記憶部415に設定する。
<左方向パン判定部122の構成図>
左方向パン判定部122の構成図を,図18に示す。図18の左方向パン判定部122による処理内容は,図17の右方向パン判定部121による処理内容とほぼ同様である。
<上方向チルト判定部123の構成図>
上方向チルト判定部123の構成図を,図19に示す。図19の上方向チルト判定部123による処理内容は,図17の右方向パン判定部121による処理内容とほぼ同様である。
<下方向チルト判定部124の構成図>
下方向チルト判定部124の構成図を,図20に示す。図20の下方向チルト判定部124による処理内容は,図17の右方向パン判定部121による処理内容とほぼ同様である。
右方向パン判定部121の装置構成としては,図30に示す演算量をさらに削減した構成も可能である。図30に示す装置構成は,図17に示す装置構成から一部を省略した構成になっており,各処理部については,図17と同様である。
また,図31,図32,図33に示す装置構成ついては,図30に示すものとほぼ同様であるので,説明の繰り返しを省略する。
以上説明したカメラワークの検出の処理は,コンピュータとソフトウェアプログラムとによっても実現することができ,そのプログラムをコンピュータ読み取り可能な記録媒体に記録して提供することも,ネットワークを通して提供することも可能である。
非連結領域を説明する図である。 フレーム内のブロック分割と外縁ブロックを説明する図である。 本発明の概要(右方向のパンの検出)を説明する図である。 本発明の概要(上方向のチルトの検出)を説明する図である。 外縁ブロックの動的設定によるカメラワークの大きさの検出を説明する図である。 実施例の処理フローチャートである。 図6に示すステップS1の詳細な処理フローチャートである。 図6に示すステップS2の詳細な処理フローチャートである。 図6に示すステップS2の詳細な処理フローチャートである。 図6に示すステップS3の詳細な処理フローチャートである。 図6に示すステップS6の詳細な処理フローチャートである。 図6に示すステップS10の詳細な処理フローチャートである。 図6に示すステップS13の詳細な処理フローチャートである。 実施例の装置構成図である。 図14に示す外縁ブロック判定部の詳細な構成図である。 図14に示す右端外縁ブロックフラグ設定部の詳細な構成図である。 図14に示す右方向パン判定部の詳細な構成図である。 図14に示す左方向パン判定部の詳細な構成図である。 図14に示す上方向チルト判定部の詳細な構成図である。 図14に示す下方向チルト判定部の詳細な構成図である。 図6に示すステップS1の詳細な他の処理フローチャートである。 図6に示すステップS2の詳細な他の処理フローチャートである。 図6に示すステップS2の詳細な他の処理フローチャートである。 図6に示すステップS3の詳細な他の処理フローチャートである。 図6に示すステップS6の詳細な他の処理フローチャートである。 図6に示すステップS10の詳細な他の処理フローチャートである。 図6に示すステップS13の詳細な他の処理フローチャートである。 図14に示す外縁ブロック判定部の詳細な他の構成図である。 図14に示す右端外縁ブロックフラグ設定部の詳細な他の構成図である。 図14に示す右方向パン判定部の詳細な他の構成図である。 図14に示す左方向パン判定部の詳細な他の構成図である。 図14に示す上方向チルト判定部の詳細な他の構成図である。 図14に示す下方向チルト判定部の詳細な他の構成図である。
符号の説明
101 外縁ブロック判定部
102 ブロックタイプ記憶部
103 右端外縁ブロック選択部
104 右端外縁ブロックフラグ設定部
105 右端外縁ブロックフラグ記憶部
106 左端外縁ブロック選択部
107 左端外縁ブロックフラグ設定部
108 左端外縁ブロックフラグ記憶部
109 上端外縁ブロック選択部
110 上端外縁ブロックフラグ設定部
111 上端外縁ブロックフラグ記憶部
112 下端外縁ブロック選択部
113 下端外縁ブロックフラグ設定部
114 下端外縁ブロックフラグ記憶部
120 カメラワーク判定部
121 右方向パン判定部
122 左方向パン判定部
123 上方向チルト判定部
124 下方向チルト判定部

Claims (8)

  1. 動画像フレームにおいて発生したカメラワークを検出するカメラワーク検出方法において,
    フレーム内を所定の大きさのブロックに分割し,フレーム内の右端,左端,上端もしくは下端のフレーム外縁にある領域に含まれるブロックごとに,直前のフレームとの動き補償によるフレーム間予測誤差と当該フレームにおけるイントラ予測に基づくフレーム内予測誤差を算出し,前記フレーム内予測誤差が前記フレーム間予測誤差より小さいブロックの数または割合が所定の閾値より大きいかどうかにより,時間方向の相関が空間方向の相関よりも小さいかどうかを判定する相関判定過程と,
    前記フレーム内の右端の領域における前記時間方向の相関が前記空間方向の相関より小さくなる場合に,当該フレームは,右方向のパンを含むフレームであると判別し,
    または,前記フレーム内の左端の領域における前記時間方向の相関が前記空間方向の相関より小さくなる場合に,当該フレームは,左方向のパンを含むフレームであると判別し,
    または,前記フレーム内の上端の領域における前記時間方向の相関が前記空間方向の相関より小さくなる場合に,当該フレームは,上方向のチルトを含むフレームであると判別し,
    または,前記フレーム内の下端の領域における前記時間方向の相関が前記空間方向の相関より小さくなる場合に,当該フレームは,下方向のチルトを含むフレームであると判別するカメラワーク判定過程とを有する
    ことを特徴とするカメラワーク検出方法。
  2. 動画像フレームにおいて発生したカメラワークを検出するカメラワーク検出方法において,
    フレーム内を所定の大きさのブロックに分割し,フレーム内の右端,左端,上端もしくは下端のフレーム外縁にある領域に含まれるブロックごとに,直前のフレームとの動き補償による第1のフレーム間予測誤差と,直後のフレームとの動き補償による第2のフレーム間予測誤差と,当該フレームにおけるイントラ予測に基づくフレーム内予測誤差を算出し,前記フレーム内予測誤差が前記第1のフレーム間予測誤差より小さいブロックの数または割合が所定の閾値より大きいかどうかにより,直前のフレームとの時間方向の相関が空間方向の相関よりも小さいかどうかを判定し,前記フレーム内予測誤差が前記第2のフレーム間予測誤差より小さいブロックの数または割合が所定の閾値より大きいかどうかにより,直後のフレームとの時間方向の相関が空間方向の相関よりも小さいかどうかを判定する相関判定過程と,
    前記フレーム内の右端の領域における,前記直前のフレームとの時間方向の相関が前記空間方向の相関より小さく,かつ,前記直後のフレームとの時間方向の相関が前記空間方向の相関より大きくなる場合に,当該フレームは,右方向のパンを含むフレームであると判別し,
    または,前記フレーム内の左端の領域における,前記直前のフレームとの時間方向の相関が前記空間方向の相関より小さく,かつ,前記直後のフレームとの時間方向の相関が前記空間方向の相関より大きくなる場合に,当該フレームは,左方向のパンを含むフレームであると判別し,
    または,前記フレーム内の上端の領域における,前記直前のフレームとの時間方向の相関が前記空間方向の相関より小さく,かつ,前記直後のフレームとの時間方向の相関が前記空間方向の相関より大きくなる場合に,当該フレームは,上方向のチルトを含むフレームであると判別し,
    または,前記フレーム内の下端の領域における,前記直前のフレームとの時間方向の相関が前記空間方向の相関より小さく,かつ,前記直後のフレームとの時間方向の相関が前記空間方向の相関より大きくなる場合に,当該フレームは,下方向のチルトを含むフレームであると判別するカメラワーク判定過程とを有する
    ことを特徴とするカメラワーク検出方法。
  3. 請求項1または請求項2記載のカメラワーク検出方法において,
    前記カメラワーク判定過程では,前記右方向のパンまたは前記左方向のパンを含むフレームであると判別する場合に,前記上端および下端の領域において,前記時間方向の相関が前記空間方向の相関よりも大きくなることをさらに条件とし,該条件を満たすときだけパンを含むフレームであると判別し,
    前記上方向のチルトまたは前記下方向のチルトを含むフレームであると判別する場合に,前記左端および右端の領域において,前記時間方向の相関が前記空間方向の相関よりも大きくなることをさらに条件とし,該条件を満たすときだけチルトを含むフレームであると判別する
    ことを特徴とするカメラワーク検出方法。
  4. 請求項1から請求項までのいずれか1項に記載のカメラワーク検出方法において,
    前記カメラワーク判定過程においてカメラワークが検出された場合に,前記フレーム内の外縁の領域をカメラワークの方向に沿って段階的に拡張しながら前記相関判定過程と前記カメラワーク判定過程とを繰り返し,前記カメラワーク判定過程による判定結果に従って,カメラワークの大きさを検出する
    ことを特徴とするカメラワーク検出方法。
  5. 動画像フレームにおいて発生したカメラワークを検出するカメラワーク検出装置において,
    フレーム内を所定の大きさのブロックに分割し,フレーム内の右端,左端,上端もしくは下端のフレーム外縁にある領域に含まれるブロックごとに,直前のフレームとの動き補償によるフレーム間予測誤差と当該フレームにおけるイントラ予測に基づくフレーム内予測誤差を算出し,前記フレーム内予測誤差が前記フレーム間予測誤差より小さいブロックの数または割合が所定の閾値より大きいかどうかにより,時間方向の相関が空間方向の相関よりも小さいかどうかを判定する相関判定手段と,
    前記フレーム内の右端の領域における前記時間方向の相関が前記空間方向の相関より小さくなる場合に,当該フレームは,右方向のパンを含むフレームであると判別し,
    または,前記フレーム内の左端の領域における前記時間方向の相関が前記空間方向の相関より小さくなる場合に,当該フレームは,左方向のパンを含むフレームであると判別し,
    または,前記フレーム内の上端の領域における前記時間方向の相関が前記空間方向の相関より小さくなる場合に,当該フレームは,上方向のチルトを含むフレームであると判別し,
    または,前記フレーム内の下端の領域における前記時間方向の相関が前記空間方向の相関より小さくなる場合に,当該フレームは,下方向のチルトを含むフレームであると判別するカメラワーク判定手段とを備える
    ことを特徴とするカメラワーク検出装置。
  6. 動画像フレームにおいて発生したカメラワークを検出するカメラワーク検出装置において,
    フレーム内を所定の大きさのブロックに分割し,フレーム内の右端,左端,上端もしくは下端のフレーム外縁にある領域に含まれるブロックごとに,直前のフレームとの動き補償による第1のフレーム間予測誤差と,直後のフレームとの動き補償による第2のフレーム間予測誤差と,当該フレームにおけるイントラ予測に基づくフレーム内予測誤差を算出し,前記フレーム内予測誤差が前記第1のフレーム間予測誤差より小さいブロックの数または割合が所定の閾値より大きいかどうかにより,直前のフレームとの時間方向の相関が空間方向の相関よりも小さいかどうかを判定し,前記フレーム内予測誤差が前記第2のフレーム間予測誤差より小さいブロックの数または割合が所定の閾値より大きいかどうかにより,直後のフレームとの時間方向の相関が空間方向の相関よりも小さいかどうかを判定する相関判定手段と,
    前記フレーム内の右端の領域における,前記直前のフレームとの時間方向の相関が前記空間方向の相関より小さく,かつ,前記直後のフレームとの時間方向の相関が前記空間方向の相関より大きくなる場合に,当該フレームは,右方向のパンを含むフレームであると判別し,
    または,前記フレーム内の左端の領域における,前記直前のフレームとの時間方向の相関が前記空間方向の相関より小さく,かつ,前記直後のフレームとの時間方向の相関が前記空間方向の相関より大きくなる場合に,当該フレームは,左方向のパンを含むフレームであると判別し,
    または,前記フレーム内の上端の領域における,前記直前のフレームとの時間方向の相関が前記空間方向の相関より小さく,かつ,前記直後のフレームとの時間方向の相関が前記空間方向の相関より大きくなる場合に,当該フレームは,上方向のチルトを含むフレームであると判別し,
    または,前記フレーム内の下端の領域における,前記直前のフレームとの時間方向の相関が前記空間方向の相関より小さく,かつ,前記直後のフレームとの時間方向の相関が前記空間方向の相関より大きくなる場合に,当該フレームは,下方向のチルトを含むフレームであると判別するカメラワーク判定手段とを備える
    ことを特徴とするカメラワーク検出装置。
  7. 請求項1から請求項までのいずれか1項に記載のカメラワーク検出方法を,コンピュータに実行させるためのカメラワーク検出プログラム。
  8. 請求項1から請求項までのいずれか1項に記載のカメラワーク検出方法を,コンピュータに実行させるためのカメラワーク検出プログラムを記録したコンピュータ読み取り可能な記録媒体。
JP2007059331A 2007-03-09 2007-03-09 カメラワーク検出方法,装置,プログラムおよびその記録媒体 Expired - Fee Related JP4768649B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007059331A JP4768649B2 (ja) 2007-03-09 2007-03-09 カメラワーク検出方法,装置,プログラムおよびその記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007059331A JP4768649B2 (ja) 2007-03-09 2007-03-09 カメラワーク検出方法,装置,プログラムおよびその記録媒体

Publications (2)

Publication Number Publication Date
JP2008225591A JP2008225591A (ja) 2008-09-25
JP4768649B2 true JP4768649B2 (ja) 2011-09-07

Family

ID=39844180

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007059331A Expired - Fee Related JP4768649B2 (ja) 2007-03-09 2007-03-09 カメラワーク検出方法,装置,プログラムおよびその記録媒体

Country Status (1)

Country Link
JP (1) JP4768649B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104657997B (zh) * 2015-02-28 2018-01-09 北京格灵深瞳信息技术有限公司 一种镜头移位检测方法及装置

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0223789A (ja) * 1988-07-13 1990-01-25 Matsushita Electric Ind Co Ltd パンニング検出方法及びその装置
JPH0223788A (ja) * 1988-07-13 1990-01-25 Matsushita Electric Ind Co Ltd パンニング検出方法及びその装置
JPH02206986A (ja) * 1989-02-07 1990-08-16 Matsushita Electric Ind Co Ltd 動きベクトル検出方法
KR0151410B1 (ko) * 1992-07-03 1998-10-15 강진구 영상신호의 운동벡터 검출방법
JPH06133298A (ja) * 1992-10-14 1994-05-13 Canon Inc 動きベクトル検出装置
KR100204478B1 (ko) * 1996-05-09 1999-06-15 배순훈 전역 움직임에 의한 빈 공간 보상 방법 및 그 장치
JP4280353B2 (ja) * 1999-03-19 2009-06-17 キヤノン株式会社 符号化装置、画像処理装置、符号化方法、及び記録媒体
JP2005175891A (ja) * 2003-12-11 2005-06-30 Canon Inc 記録装置
JP2007259197A (ja) * 2006-03-24 2007-10-04 Matsushita Electric Ind Co Ltd 手ぶれ補正付き動画復号再生装置および方法

Also Published As

Publication number Publication date
JP2008225591A (ja) 2008-09-25

Similar Documents

Publication Publication Date Title
US8199252B2 (en) Image-processing method and device
US8244054B2 (en) Method, apparatus and integrated circuit capable of reducing image ringing noise
KR101761928B1 (ko) 블록 기반 압축 이미지 내의 블러 측정
JP5478047B2 (ja) 映像データ圧縮前処理方法およびこれを用いた映像データ圧縮方法と映像データ圧縮システム
JP2012520025A (ja) ビデオデータの動きベクトルを処理するためのシステムおよび方法
EP2321768B1 (en) Blockiness and fidelity in watermarking
JP2007067469A (ja) フレーム内予測符号化制御方法、フレーム内予測符号化制御装置、フレーム内予測符号化制御プログラムおよびそのプログラムを記録した記録媒体
US8594199B2 (en) Apparatus and method for motion vector filtering based on local image segmentation and lattice maps
US20140254938A1 (en) Methods and apparatus for an artifact detection scheme based on image content
JP2010232734A (ja) 画像符号化装置及び画像符号化方法
US8611423B2 (en) Determination of optimal frame types in video encoding
WO2007129591A1 (ja) 遮蔽物映像識別装置及び方法
JP4768649B2 (ja) カメラワーク検出方法,装置,プログラムおよびその記録媒体
CN109769120B (zh) 基于视频内容跳过编码模式判决方法、装置、设备及介质
CN105992012B (zh) 一种错误隐藏的方法和装置
US9563960B2 (en) Method for detecting foreground
US8396125B2 (en) Picture coding apparatus and picture coding method
JP2005237002A (ja) 動画像のカット点検出方法
JP4430690B2 (ja) 動き探索装置、動き探索方法、動き探索プログラムおよびそのプログラムを記録したコンピュータ読み取り可能な記録媒体
TWI470578B (zh) 計算用於待插補影像區塊之目標移動向量的影像處理方法及其相關裝置
JP4398390B2 (ja) フェード検出装置
JP4261603B2 (ja) 動画像のカット点検出装置
JP2005122571A (ja) 画像処理装置、画像処理方法、プログラム及び記憶媒体
JP2005203939A (ja) 動画像復号化装置ならびに動画像の欠損画素補間方法および動画像の参照位置捜索方法
Bartels et al. Occlusion classifiers for picture rate conversion

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090115

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20100331

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110323

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110329

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110530

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110614

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110616

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140624

Year of fee payment: 3

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees