JP4873765B2 - 映像信号処理装置及び映像信号処理方法 - Google Patents

映像信号処理装置及び映像信号処理方法 Download PDF

Info

Publication number
JP4873765B2
JP4873765B2 JP2010182554A JP2010182554A JP4873765B2 JP 4873765 B2 JP4873765 B2 JP 4873765B2 JP 2010182554 A JP2010182554 A JP 2010182554A JP 2010182554 A JP2010182554 A JP 2010182554A JP 4873765 B2 JP4873765 B2 JP 4873765B2
Authority
JP
Japan
Prior art keywords
vector
motion
scroll
component
peak
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2010182554A
Other languages
English (en)
Other versions
JP2011130409A (ja
Inventor
卓士 木村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2010182554A priority Critical patent/JP4873765B2/ja
Priority to US12/946,339 priority patent/US8787462B2/en
Publication of JP2011130409A publication Critical patent/JP2011130409A/ja
Application granted granted Critical
Publication of JP4873765B2 publication Critical patent/JP4873765B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/01Conversion of standards, e.g. involving analogue television standards or digital television standards processed at pixel level
    • H04N7/0117Conversion of standards, e.g. involving analogue television standards or digital television standards processed at pixel level involving conversion of the spatial resolution of the incoming video signal
    • H04N7/012Conversion between an interlaced and a progressive signal
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • H04N19/139Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/587Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal sub-sampling or interpolation, e.g. decimation or subsequent interpolation of pictures in a video sequence
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/01Conversion of standards, e.g. involving analogue television standards or digital television standards processed at pixel level
    • H04N7/0127Conversion of standards, e.g. involving analogue television standards or digital television standards processed at pixel level by changing the field or frame frequency of the incoming video signal, e.g. frame rate converter
    • H04N7/0132Conversion of standards, e.g. involving analogue television standards or digital television standards processed at pixel level by changing the field or frame frequency of the incoming video signal, e.g. frame rate converter the field or frame frequency of the incoming video signal being multiplied by a positive integer, e.g. for flicker reduction

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Graphics (AREA)
  • Television Systems (AREA)
  • Image Analysis (AREA)

Description

本発明は、中間フレームの画像を生成し、映像信号のフレームレートを変換する映像信号処理装置及び制御方法に関するものである。
フレームレート変換技術として、入力映像信号の連続する2フレームの画像から画像の動きを予測し、その動きベクトルに基づいて2フレームの間の中間画像を生成し、映像信号のフレーム数を増やす手法がある。このフレームレート変換において、例えば画像内に複数の動きや回転運動があったり、繰り返しパターンが含まれたりなど正しい動きの予測が難しい場合には、補間画像に破綻が生じてしまうことがある。しかし、画面全体が同じような動きをしている場合には、補間画像に破綻が生じにくいため、そのようなシーンを検出して一様に補間すると、視覚的効果の高いフレームレート変換が実現できる。
従来、画像がパン・チルト状態であるかを検出し、パン・チルト状態である場合に画像の動き量を求め、その動き量に基づいて補間画像を生成する方法があった(特許文献1参照)。また、検出した動きベクトルの出現頻度を示すヒストグラム情報から検出ベクトルが集中しているか否かを検出し、集中している場合に動きベクトルを用いた補間をする方法があった(特許文献2参照)。
特開2006−304266号公報 特開2008−236098号公報
しかしながら、特許文献1では、検出された動きベクトルの信頼性が高い検出領域の数と、その領域の中で複数の動きが存在する領域の数を基にパン・チルトを検出する。そのため、信頼性が高い検出領域が一定以下の画像パターンではパン・チルトの検出漏れが生じる。一方、信頼度が高い領域以外に複数の動きがあった場合に誤ってパン・チルトが検出されてしまう。
また、特許文献2では、検出された動きベクトルの各ベクトルの出現頻度を表すヒストグラム情報を元に、画面中に支配的な動きがあるか否かを判定し、画面全体のスクロールを検出する方式である。そのため、動きベクトルの検出が難しい領域を多く含む画像では、ヒストグラムの頻度が十分に高くならず、スクロールを検出できない場合がある。また、各ベクトルの出現頻度を示すヒストグラムから検出する場合、ヒストグラムのカテゴリ数が膨大となり、ヒストグラムの生成と分析が容易ではない。
本発明は、画像内に動きベクトルの検出が難しい領域が含まれる場合でも映像のスクロール(パン・チルト)シーンを精度よく検出し、補間画像を生成できる技術を提供することを目的とする。
上述した課題を解決するために、本発明に係る映像信号処理装置は、第1のフレーム画像と第2のフレーム画像を比較して、フレーム画像をブロック状に分割した複数のブロックそれぞれについて動きベクトルを検出する動きベクトル検出手段と、検出された動きベ
クトルから、フレーム画像全体の一様な動きを示すスクロールベクトルを検出するスクロールベクトル検出手段と、前記第1のフレーム画像におけるそれぞれのブロックについて、当該ブロックを第2のフレーム画像内でスクロールベクトルだけ移動した領域とのブロックマッチングの相関値と、当該ブロックを第2のフレーム画像内で当該ブロックの動きベクトルだけ移動した領域とのブロックマッチングの相関値との差を算出し、当該算出結果に基づいて、スクロールベクトルを用いたフレーム補間が可能か否かを判定する判定手段と、を有することを特徴とする。
本発明によれば、画像内に動きベクトルの検出が難しい領域が含まれる場合においてもスクロール(パン・チルト)シーンの検出精度を向上でき、補間画像を生成することができる。
フレームレート変換装置の概略構成を示すブロック図 ブロック分割およびブロックマッチングのサーチ範囲の例を説明する図 差分絶対値和の分布の例を説明する図 動きベクトル成分のヒストグラムの例を示す図 スクロールベクトルの検出条件を説明する図 ブロックマッチングで得られる相関値の分布 動きベクトルに基づいた補間の例を説明する図 フレームレート変換処理のフローチャート
図1は、本発明によるフレームレート変換装置(映像信号処理装置)の一実施形態を示すブロック構成図である。フレームレート変換装置は、ブロックバッファ10、ブロックバッファ11、差分絶対値和計算部12、動きベクトル検出部13、ヒストグラム生成部14、スクロールベクトル検出部15、ベクトル相関評価部16、スクロール判定部17、動きベクトル選択部18、補間画像生成部19で構成される。本映像信号処理装置は入力されたフレーム0画像とフレーム1画像を比較して動きベクトルを予測し、その動きベクトルに基づきフレーム0とフレーム1の中間の補間フレーム画像を生成し出力する。
[ブロックバッファ]
ブロックバッファ10は、フレーム0の画像からベクトル検出単位として特定領域をブロック状に切り出した画像データを出力する。以降、この画像データをブロックデータ0と呼ぶ。図2(A)は、128ドット×96ドットのフレーム画像を32ドット×32ドットの12個の矩形ブロックに分割した例を示した図である。もちろんフレーム画像およびブロックの大きさはこの例に限られず、任意の大きさであって良い。ブロックバッファ10から出力されるブロックデータ0(BD0)は、フレーム0の画像データFD0、ブロックの番号(n、m)、水平座標iと垂直座標jを用いて式(1)のように表せる。
Figure 0004873765
ブロックバッファ11は、フレーム1の画像からブロックデータ0と同一形状の領域のデータを切り出しブロックデータ1として出力する。ブロックデータ1は、ブロックデータ0の座標をシフトした座標から切り出され、順次出力される。例えば、検出する動きベ
クトルの大きさの範囲が水平±24ドット、垂直±15ドットの場合、水平方向に±24ドット、垂直方向に±15ドットシフトした座標からブロックデータ1が切り出され、順次出力される。ブロックデータ1(BD1)は、フレーム1の画像データFD1、ブロックの番号(n、m)、水平座標i、垂直座標j、水平方向のシフト量isと、垂直方向のシフト量jsを用いて次の式(2)のように表せる。
Figure 0004873765
図2(B)はブロックデータ0画像とブロックデータ1画像の範囲の関係を示している。
[差分絶対値和計算部]
差分絶対値和計算部12は、入力されたブロックデータ0とブロックデータ1から、対応するドット毎に差分の絶対値を計算し、ブロック内の全合計を計算する。差分絶対値和SAD(is,js)は以下の式(3)で表される。
Figure 0004873765
ここで、シフト量(is,js)は動きベクトルを表すパラメータに対応する。差分絶対値和SAD(is,js)は、第1フレーム画像(FD0)におけるそれぞれのブロック(BD0)について、このブロックを第2フレーム画像(FD1)内でシフト量(is,js)だけ移動した領域(BD1)との相関値を示す。差分絶対値和が小さいほど、ブロックマッチングの相関が高いことになる。図3に、シフト量(is,js)に対する差分絶対値和の分布図の例を示す。なお、差分絶対値和はブロックマッチングの相関の一例であり、差分二乗和などの評価関数によってブロックマッチングの相関を求めても良い。図3の差分絶対値和の値としては、例えば最小値が0で、最大値が32×32×256となる。
なお、第1のフレーム画像内のブロックと、このブロックを第2のフレーム画像内においてベクトル量(Vx,Vy)だけ移動した領域とのブロックマッチングの相関(値)のことを、以下単に、「ベクトル(Vx,Vy)の相関(値)」と表現する。例えば、「動きベクトルの相関」「スクロールベクトルの相関」という表現を用いる。
[動きベクトル検出部]
動きベクトル検出部13は、差分絶対値和が最小となるシフト量(is,js)を動きベクトル(Vmx、Vmy)として検出する。動きベクトル検出部13は、複数のブロックそれぞれについて動きベクトルを検出する。
[ヒストグラム生成部]
ヒストグラム生成部14は、1フレーム内で検出された各ブロックの動きベクトル情報から、動きベクトルの水平成分のヒストグラムと垂直成分のヒストグラムを生成する。図4(A)(B)にヒストグラムの具体例を示す。
[スクロールベクトル検出部]
スクロールベクトル検出部15では、ヒストグラム生成部14で得られたヒストグラムの分布から、スクロールベクトル(Vscx、Vscy)を特定する。ここで、スクロールベクトルとは、入力されたフレーム画像全体の一様な動きを意味する。例えば、カメラを水平方向にパン操作しながら撮影されたり、垂直方向にチルト操作しながら撮影された映像等から、スクロールベクトルが検出されることを想定している。なお、画像の動きは動きベクトルの検出点と一致するとは限らない。そこで、スクロールベクトル検出のために用いる頻度として、以下の値を利用することが好ましい。すなわち、まず、動き0と動き±1を除いた動きの中で最も高い頻度の動きをHxv、その頻度をHxとする。そして、動きHxv+1と動きHxv−1のうち頻度が大きい方の頻度を頻度Hxに加算して、これを動きHxvの頻度として用いる。以下、この加算後の頻度を、動き頻度Hx1と表す。例えば青空などの特徴点の少ない平坦な画像領域は、仮にカメラを横方向にパン(スクロール)しながら撮影したとしても動き0の頻度が最も高くなることがある。このような場合でもスクロールベクトルを検出できるようにするために、動き0とそれに隣接する動き±1を検出対象から除外する。また、動きベクトルのヒストグラムのピークが十分に高くない場合は、最も高い頻度の動きHxvと、その隣りの動きHxv+1又はHxv−1の頻度を加算した方が好ましい。ただし、必ずしもこのような加算処理を行う必要はなく、動きベクトルのヒストグラムから得られる頻度をそのまま用いてもよい。
図4(C)に示すヒストグラムは、画面全体に特徴点がある静止画をスクロールした場合などに取得されるヒストグラムの例である。このような理想的な状況では、頻度分布の最大頻度のピークから容易にスクロールベクトルを推定することができる。したがって、スクロールベクトルの水平成分Vscxは、基本的に、水平成分のヒストグラムにおいて最も頻度の高い動きとすれば良い。
しかしながら、例えば青空のような特徴点が少ない平坦な画像領域では、スクロールシーンであっても動きを検出できないため、動き無しや誤った動きがスクロールベクトルとして検出されてしまう。そのような画像では、図4(D)に示すヒストグラムのように、パン・チルトによる動きベクトルにあたる頻度のピークが小さくなり、同時に動き0にピークが出現する。さらに、画像にノイズが含まれていると、本来の動きとは無関係な動きベクトルも検出されるため、パン・チルトによる動きベクトルにあたる頻度のピークが小さくなる。そのため、最大ピークのみを用いてスクロールベクトルを推定すると、誤検出が生じるおそれがある。そこで、動き0の頻度Hx0が最も高い場合に、2番目に高い頻度の動きHxvの頻度Hx1が十分大きければ(第1の閾値より大きければ)動きHxvをスクロールベクトルの水平成分Vscxとして検出することが好ましい。なお、第1の閾値は実験等をおこなって決定すればよいが、概ね33%以上(50%以下)の値とすることが好ましい。
(基準1a)Hx0>Hx1≧閾値1のとき、Hxvがスクロールベクトルの水平成分
また、上記のように動き0の頻度が高く検出されることを考慮すると、水平方向に動きがないスクロールシーンでは、動き0の頻度が最も高くなり、かつ、2番目に頻度の高い動きの頻度が十分に小さくなる。したがって、動き0の頻度が最も高いときに、2番目に高い頻度が第2の閾値以下であれば(ここで、第2の閾値<第1の閾値)、動き0をスクロールベクトルの水平成分Vscxとして検出することが好ましい。なお、第2の閾値は実験等を行って決定すればよいが、概ね第1の閾値よりも10ポイント(%)以上小さい値とすることが好ましい。
(基準2)Hx0>Hx1かつ閾値2≧Hx1のとき、動き0がスクロールベクトルの水平成分
なお、動きHxvが最大の頻度のとき、すなわち、ピークを取る成分が動き0以外の場合には、その他の条件を設けずにこの動きをスクロールベクトルの水平成分として検出し
ても良い。しかしながら、スクロールシーンではスクロールベクトルが支配的な動きをとるので、スクロールベクトルを検出するための条件として、動きの頻度が所定値以上であるという条件を課すことも好ましい。
(基準1b)Hx1≧Hx0かつHx1≧閾値1’のとき、Hxvがスクロールベクトルの水平成分
ここで、閾値1=閾値1’とすることで、(基準1a)と(基準1b)は以下の(基準1)にまとめられ、判定が簡易なものとなる。もちろん閾値1≠閾値1’でもかまわない。
(基準1)Hx1≧閾値1のとき、Hxvがスクロールベクトルの水平成分
また、動き0の頻度Hx0が最も高く、動きHxvの頻度Hx1が第2の閾値以下のときに、さらに、頻度Hx0が第3の閾値(第3の閾値>第2の閾値)以上であるという条件を課すことが好ましい。
(基準2’)Hx0≧閾値3>閾値2≧Hx1のとき、動き0がスクロールベクトルの水平成分
また、動き0がピークを取り、2番目のピークが第1の閾値以上であるが、動き0が十分に大きい場合は必ずしも2番目のピークがスクロールを表しているとは限らない。そこで、基準1をさらに改良して、次の基準1’を採用しても良い。なお、第4の閾値は第1の閾値よりも大きい値である。
(基準1’)Hx1≧閾値1かつHx0≦閾値4のとき、Hxvがスクロールベクトルの水平成分
ただし、この基準1’は必ずしも必要ではなく、基準1でも十分な効果が得られる。
以下、スクロールベクトルの水平成分Vscxの検出方法の一具体例を説明する。図5(A)はスクロールベクトルの水平成分Vscxの検出条件の例を示す図である。頻度Hx1が例えば全度数の40%以上でかつ、動き0の頻度Hx0が例えば全度数の55%以下のとき、動きHxvをスクロールベクトルの水平成分Vscxとする。上記の条件を満たさず、頻度Hx1が例えば全度数の15%以下でかつ、頻度Hx0が例えば全度数の25%以上のとき、動き0をスクロールベクトルの水平成分Vscxとする。上記条件以外の場合は、スクロールベクトルの水平成分は検出不能とする。
「Hx1≧40% かつ Hx0≦55%」の条件は上記の(基準1’)に相当する。第1の閾値を40%、第4の閾値を55%としている。ただし、(基準1’)の代わりに(基準1)を採用して「Hx1≧40%」のみの条件とすることも好ましい。
「Hx1≦15% かつ Hx0≧25%」の条件は上記の(基準2’)に相当する。第2の閾値を15%、第3の閾値を25%としている。ただし、(基準2’)の代わりに(基準2)を採用して「Hx0>15%≧Hx1」という条件とすることも好ましい。
スクロールベクトルの垂直成分についても、水平成分と同様の基準によって検出する。図5(B)にスクロールベクトルの垂直成分の検出条件の例を示す。ここでHy1は水平成分の場合と同様に、調整後の動きHyvの頻度を表す。すわなち、動き0と動き±1をのぞいた垂直方向の動きの中で最も高い頻度の動きをHyv、その頻度をHyとし、動きHyv+1と動きHyv−1のうち頻度の大きい方を頻度Hyに加算した動きがHy1である。なお、ここではスクロールベクトルの水平成分と垂直成分について、同一の基準(閾値)を採用しているが、必ずしも閾値を同じにする必要はない。水平成分および垂直成分の取りうる値の範囲に応じて、閾値を変えることも好ましい。
スクロールベクトルの水平成分Vscxと垂直成分Vscyの両方が検出されたとき、スクロールベクトル検出部15からスクロールベクトルが検出されたこと示すスクロールフラグとスクロールベクトル(Vscx、Vscy)が出力される。一方、水平成分Vscxまたは垂直成分Vscyのいずれかが検出されなかった場合には、スクロールベクトルは検出されない。
本実施例では、上記のような判断基準に基づいて、動きありのピークと動き無しのピークからスクロールベクトルを検出する。そのため、画像に動きベクトルが検出できない領域やノイズが含まれていても精度良くスクロールベクトルを検出可能である。なお、本実施例では、上記の判断基準の具体例として4つの閾値を用いる方法(図5A,B)を採用している。この方法には判断式が簡易なものでありながら十分な精度が得られるという利点があるが、判断基準の趣旨を逸脱しない範囲内で種々の条件式を採用して良い。
[ベクトル相関評価部]
ベクトル相関評価部16では、ブロック毎に順次、スクロールベクトル(Vscx、Vscy)の相関値SAD(Vscx、Vscy)と、そのブロックの動きベクトルの相関値SAD(Vmx、Vmy)の差を算出する。その差が定められた所定値(例えば、1024〜10240の間の所定値)以内のときスクロールベクトルで補間可能なブロックと判定し、補間可能フラグを出力する。
例えば青空などの特徴点の少ない平坦な画像領域でのブロックマッチングで得られる相関値の分布の例を図6(A)に示す。また、図6(A)の3次元の相関値分布を2次元に変換した図を図6(B)に示す。特徴点の少ない平坦な画像領域では、いずれの動きに対しても相関値が同程度となり、例えばノイズなどの影響でたまたま相関値が最大となった位置の動きが動きベクトルとして検出される。しかし、スクロールベクトルの相関値SAD(Vscx、Vscy)と動きベクトルの相関値SAD(Vmx、Vmy)との差は小さくなるので、スクロールベクトルで補間可能なブロックと判定することができる。なおここでは、フレーム画像からスクロールベクトルが検出されることを前提としている。すなわち、画像中のある領域については図6(A)に示したような相関値の分布となるが、他のいくつかの領域については図3に示したような相関値の分布となることを前提としている。
また、縞模様などの繰り返しパターンを含む画像領域でのブロックマッチングで得られる相関値の分布の例を図6(C)に示す。また、図6(C)の3次元の相関値分布を2次元に変換した図を図6(D)に示す。繰り返しパターンを含む画像領域では、相関値の高い動きが周期的に現れるため、本来の動きとは異なる動きに対する相関値が最大となる場合があり、誤った動きベクトルが検出されやすい。しかし、この場合も、スクロールベクトルの相関値SAD(Vscx、Vscy)と動きベクトルの相関値SAD(Vmx、Vmy)との差は小さくなるので、スクロールベクトルで補間可能なブロックと判定することができる。なおここでは、フレーム画像からスクロールベクトルが検出されることを前提としている。すなわち、画像中のある領域については図6(C)に示したような相関値の分布となるが、他のいくつかの領域については図3に示したような相関値の分布となることを前提としている。
[スクロール判定部]
スクロール判定部17では、ベクトル相関評価部16からブロック毎に順次出力される補間可能フラグの数を1フレームの画像全体に対しカウントする。ブロック総数に対するカウント値の割合が所定の割合(例えば、90〜95%の間の所定値)以上であり、かつ、スクロールベクトル検出部15からスクロールフラグが出力されている場合に、入力された映像はスクロールシーンであると判定する。
[動きベクトル選択部]
動きベクトル選択部18では、スクロール判定部17でスクロールシーンと判定された場合に、スクロールベクトル検出部15で検出されたスクロールベクトル(Vscx、Vscy)を補間ベクトル(Vx、Vy)として出力する。スクロール判定部17でスクロールシーンと判定されていない場合には、動きベクトル検出部13で検出された動きベクトル(Vmx、Vmy)を補間ベクトル(Vx、Vy)として出力する。
[補間画像生成部]
補間画像生成部19は、動きベクトル選択部18から入力される補間ベクトル(Vx、Vy)に基づいてフレーム0画像とフレーム1画像からそれらの中間の補間画像を生成し出力する。補間画像の生成は、例えば図7に示す様に、補間ベクトルを(Vx、Vy)とした場合、補間画素に対してフレーム0の(−Vx/2、―Vy/2)相対位置の画素とフレーム1の(Vx/2、Vy/2)相対位置の画素の平均値を算出することで生成される。このように、スクロールシーン(スクロールベクトルを用いた補間が可能と判断される場合)ではスクロールベクトルを補間ベクトルとして補間画像が生成される。一方、スクロールシーンではない場合(スクロールベクトルを用いた補間が不可能と判断される場合)では、動きベクトルを補間ベクトルとして補間画像が生成される。
<処理フロー>
次に図8のフローチャートを参照して、図1の機能構成を有する映像信号処理装置の映像信号処理について説明する。
ステップS1において差分絶対値和計算部12は、ブロックマッチングにより差分絶対値和(相関値)を算出する。1つのブロック画像0に対して、図2(B)に示される範囲内のブロック画像1との間の差分絶対値和が算出される。ステップS2において動きベクトル検出部13は、差分絶対値和が最小(相関が最も大きい)となる動きを動きベクトルとして検出する。
ステップS3においてヒストグラム生成部14は、検出された動きベクトルの水平成分、垂直成分おのおののヒストグラムを生成する。ステップS4においてスクロールベクトル検出部は、図5に示す判断基準に従って、ヒストグラムからスクロールベクトルを検出する。
ステップS5においてベクトル相関評価部16は、ブロックマッチングで得られたスクロールベクトルの相関値と動きベクトルの相関値の差が閾値以下であった場合に、スクロールベクトルにより補間可能なブロックと判定する。ステップS6においてスクロール判定部17は、ベクトル相関評価部16で補間可能と判定されたブロックの割合が所定割合以上だった場合にスクロールシーンである判定する。ステップS7において補間画像生成部19は、スクロールシーンと検出された場合には、スクロールベクトルに基づく補間をし(ステップS8)、スクロールシーンではないと検出された場合には、検出された動きベクトルに基づいた補間をする(ステップS9)。
<本実施形態の作用・効果>
本実施形態によれば、映像全体の一様な動きを示すスクロールベクトルを検出した後に、スクロールベクトルのブロックマッチングの相関値と、動きベクトルのブロックマッチングの相関値との差から、スクロールシーンであるか検証している。誤ったスクロールベクトルが検出された場合であっても、この検証により検出されたスクロールベクトルを用いた補間画像生成が可能(妥当)であるか否かを判断でき、誤検出されたスクロールベクトルによる補間画像が生成されることを防止できる。
また、動きベクトルの水平成分および垂直成分各々のヒストグラムに基づいて、スクロールベクトルの検出を行っている。ベクトル自体のヒストグラムを利用する場合、カテゴリ数が膨大となり、ヒストグラムの生成や分析が容易ではない。本実施形態では成分ごとのヒストグラムを求めているので、ヒストグラムの生成および分析が容易であるという利点がある。
さらに、単純にピークを取る成分をスクロールベクトルとして検出するわけではなく、動き0がピークの場合には、2番目のピークが十分に大きければこの2番目のピークを取る動きをスクロールベクトルとして検出している。また、動き0がピークであり、かつ、2番目のピークが十分に小さいときに、動き0をスクロールベクトルとして検出している。このような基準を採用することで、特徴が少ない平坦な画像領域や動きベクトルの検出が難しい画像領域を含む画像においても、精度良くスクロールベクトルを検出することができる。さらに、本実施形態においては上記の判断基準を4つの閾値を利用した2つの条件式により実現しているので、処理が簡便であるという利点もある。
<変形例>
スクロール判定部によって、スクロールベクトルによる補間画像生成が妥当であるかの検証を行っているので、本実施形態で述べたような基準に従わずに、単にピークをとる成分をスクロールベクトルの成分と検出してもよい。誤った動きがスクロールベクトルとして検出されても、スクロール判定部による検証によってスクロールベクトルではないと判定されて、動きベクトルによるフレーム補間が行われるためである。もっとも、本実施形態のように精度良くスクロールベクトルを検出すればスクロールベクトルによる一様な補間を適用できる機会が増えるため効果的である。
上記の説明で用いた判定基準は例示にすぎず、本発明の趣旨を逸脱しない範囲内で適宜変更が可能である。判定基準のポイントの一つは、動き0が実際以上に多く検出されることを考慮している点である。すなわち、動き0がピークであっても第2のピークをスクロールベクトルとして検出する場合があるということである。判定基準のもう一つのポイントは、支配的な動きをスクロールベクトルとして検出する点である。上記の説明では頻度に下限値を設けているが、ピークの頻度と2番目のピークの頻度の差が所定値以上であるという条件としてもかまわない。
10・・・ブロックバッファ0, 11・・・ブロックバッファ1
12・・・差分絶対値和計算部, 13・・・動きベクトル検出部
14・・・ヒストグラム生成部, 15・・・スクロールベクトル検出部
16・・・ベクトル相関評価部, 17・・・スクロール判定部
18・・・動きベクトル選択部, 19・・・補間画像生成部

Claims (9)

  1. 第1のフレーム画像と第2のフレーム画像を比較して、フレーム画像をブロック状に分割した複数のブロックそれぞれについて動きベクトルを検出する動きベクトル検出手段と、
    検出された動きベクトルから、フレーム画像全体の一様な動きを示すスクロールベクトルを検出するスクロールベクトル検出手段と、
    前記第1のフレーム画像におけるそれぞれのブロックについて、当該ブロックを第2のフレーム画像内でスクロールベクトルだけ移動した領域とのブロックマッチングの相関値と、当該ブロックを第2のフレーム画像内で当該ブロックの動きベクトルだけ移動した領域とのブロックマッチングの相関値との差を算出し、当該算出結果に基づいて、スクロールベクトルを用いたフレーム補間が可能か否かを判定する判定手段と、
    を有する映像信号処理装置。
  2. 前記判定手段は、前記相関値の差が所定値以内であるブロックの数が所定の割合以上ある場合に、スクロールベクトルを用いたフレーム補間が可能であると判定することを特徴とする請求項1に記載の映像信号処理装置。
  3. 前記スクロールベクトル検出手段は、検出された動きベクトルのヒストグラムを生成し、生成されたヒストグラムにおけるピークから、フレーム画像全体の一様な動きを示すスクロールベクトルを検出することを特徴とする請求項1または請求項2に記載の映像信号処理装置。
  4. 前記スクロールベクトル検出手段は、検出された動きベクトルの水平成分のヒストグラムと垂直成分のヒストグラムとを生成し、生成された水平成分のヒストグラムにおけるピークと、生成された垂直成分のヒストグラムにおけるピークとを特定し、特定したそれらのピークから、フレーム画像全体の一様な動きを示すスクロールベクトルを検出することを特徴とする請求項3に記載の映像信号処理装置。
  5. 前記スクロールベクトル検出手段は、
    前記水平成分または垂直成分のヒストグラムにおいてピークを取る成分が動き0以外であれば、ピークを取る成分をスクロールベクトルの水平成分または垂直成分として検出し、
    前記水平成分または垂直成分のヒストグラムにおいてピークを取る成分が動き0であるときは、2番目のピークを取る成分の頻度が第1の閾値以上であれば2番目のピークの成分をスクロールベクトルの水平成分または垂直成分として検出し、2番目のピークを取る成分の頻度が第1の閾値よりも小さい第2の閾値以下であれば動き0をスクロールベクトルの水平成分または垂直成分として検出し、
    上記の条件以外の場合は、スクロールベクトルを検出しない
    ことを特徴とする請求項4に記載の映像信号処理装置。
  6. 前記スクロールベクトル検出手段は、
    前記水平成分または垂直成分のヒストグラムにおいてピークを取る成分が動き0以外の場合に、ピークを取る成分の頻度が第1の閾値より小さければスクロールベクトルの水平成分または垂直成分として検出せず、
    前記水平成分または垂直成分のヒストグラムにおいてピークを取る成分が動き0であって、2番目のピークを取る成分の頻度が第2の閾値以下の場合に、動き0の成分の頻度が第3の閾値より小さければスクロールベクトルの水平成分または垂直成分として検出せず、
    前記水平成分または垂直成分のヒストグラムにおいてピークをとる成分が動き0であっ
    て、2番目のピークをとる成分が第1の閾値以上である場合に、動き0の成分の頻度が第4の閾値より大きければスクロールベクトルの水平成分または垂直成分として検出せず、
    前記第3の閾値は、第2の閾値よりも大きく
    前記第4の閾値は、第1の閾値よりも大きい
    ことを特徴とする請求項5に記載の映像信号処理装置。
  7. 前記スクロールベクトル検出手段がスクロールベクトルを検出しない場合は、前記判定手段はスクロールベクトルによるフレーム補間が不可能であると判定することを特徴とする請求項1〜6のいずれか1項に記載の映像信号処理装置。
  8. 前記判定手段によってスクロールベクトルを用いたフレーム補間が可能であると判定された場合は、スクロールベクトルを用いて補間フレームを生成するフレーム補間手段をさらに有することを特徴とする請求項1〜7のいずれか1項に記載の映像信号処理装置。
  9. 第1のフレーム画像と第2のフレーム画像の補間フレームを生成する映像信号処理装置における映像信号処理方法であって、
    前記第1のフレーム画像と前記第2のフレーム画像を比較して、フレーム画像をブロック状に分割した複数のブロックそれぞれについて動きベクトルを検出する動きベクトル検出ステップと、
    検出された動きベクトルから、フレーム画像全体の一様な動きを示すスクロールベクトルを検出するスクロールベクトル検出ステップと、
    前記第1のフレーム画像におけるそれぞれのブロックについて、当該ブロックを第2のフレーム画像内でスクロールベクトルだけ移動した領域とのブロックマッチングの相関値と、当該ブロックを第2のフレーム画像内で当該ブロックの動きベクトルだけ移動した領域とのブロックマッチングの相関値との差を算出し、当該算出結果に基づいて、スクロールベクトルを用いたフレーム補間が可能か否かを判定する判定ステップと、
    を含むことを特徴とする映像信号処理方法。
JP2010182554A 2009-11-20 2010-08-17 映像信号処理装置及び映像信号処理方法 Expired - Fee Related JP4873765B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2010182554A JP4873765B2 (ja) 2009-11-20 2010-08-17 映像信号処理装置及び映像信号処理方法
US12/946,339 US8787462B2 (en) 2009-11-20 2010-11-15 Video signal processing apparatus and video signal processing method

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2009265335 2009-11-20
JP2009265335 2009-11-20
JP2010182554A JP4873765B2 (ja) 2009-11-20 2010-08-17 映像信号処理装置及び映像信号処理方法

Publications (2)

Publication Number Publication Date
JP2011130409A JP2011130409A (ja) 2011-06-30
JP4873765B2 true JP4873765B2 (ja) 2012-02-08

Family

ID=44062063

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010182554A Expired - Fee Related JP4873765B2 (ja) 2009-11-20 2010-08-17 映像信号処理装置及び映像信号処理方法

Country Status (2)

Country Link
US (1) US8787462B2 (ja)
JP (1) JP4873765B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI501649B (zh) * 2011-05-31 2015-09-21 Jvc Kenwood Corp 影像訊號處理裝置及方法
CN102811332B (zh) * 2011-05-31 2015-04-15 Jvc建伍株式会社 影像信号处理装置以及方法
JP5887764B2 (ja) * 2011-08-29 2016-03-16 株式会社Jvcケンウッド 動き補償フレーム生成装置及び方法
JP7032532B2 (ja) * 2018-07-10 2022-03-08 オリンパス株式会社 撮像装置、画像補正方法および画像補正プログラム
US10735763B2 (en) * 2018-07-27 2020-08-04 Tencent America LLC Method and apparatus for motion vector prediction using spatial and temporal combination

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100930043B1 (ko) * 2002-11-23 2009-12-08 삼성전자주식회사 스크롤링 텍스트나 그래픽 데이터를 검출할 수 있는움직임 추정장치 및 방법
US7880769B2 (en) * 2004-02-13 2011-02-01 Qualcomm Incorporated Adaptive image stabilization
JP4489033B2 (ja) * 2005-03-25 2010-06-23 三洋電機株式会社 フレームレート変換装置、パン・チルト判定装置および映像装置
KR20070063304A (ko) * 2005-12-14 2007-06-19 삼성전자주식회사 움직임 추정장치 및 움직임 추정방법
JP4513819B2 (ja) * 2007-03-19 2010-07-28 株式会社日立製作所 映像変換装置、映像表示装置、映像変換方法
JP4659793B2 (ja) * 2007-08-07 2011-03-30 キヤノン株式会社 画像処理装置及び画像処理方法

Also Published As

Publication number Publication date
JP2011130409A (ja) 2011-06-30
US20110122951A1 (en) 2011-05-26
US8787462B2 (en) 2014-07-22

Similar Documents

Publication Publication Date Title
KR101861722B1 (ko) 비디오 데이터를 처리하는 방법과 이미지 처리 회로
JP4398925B2 (ja) 補間フレーム生成方法、補間フレーム生成装置および補間フレーム生成プログラム
US7936950B2 (en) Apparatus for creating interpolation frame
KR100814424B1 (ko) 폐색영역 검출장치 및 검출방법
JP4873765B2 (ja) 映像信号処理装置及び映像信号処理方法
EP2509307A1 (en) Image processing device and image processing method
JP5887764B2 (ja) 動き補償フレーム生成装置及び方法
US8817869B2 (en) Image processing device and method, and image display device and method
JP2010147538A (ja) 画像処理装置および方法、並びにプログラム
JP4804238B2 (ja) 動きベクトル検出装置
JP2009077309A (ja) 動き予測装置および動き予測方法
JP2013122624A (ja) 車両火災検出装置
JP2015507736A (ja) ターゲットサイズを見積もるためのシステム及び方法
JP5737072B2 (ja) 動き補償フレーム生成装置及び方法
KR101740124B1 (ko) 프레임 율 변환 장치 및 그 방법
JP5059855B2 (ja) 大域的動き推定方法
JP2006215655A (ja) 動きベクトル検出方法、動きベクトル検出装置、動きベクトル検出プログラム及びプログラム記録媒体
JP2006215657A (ja) 動きベクトル検出方法、動きベクトル検出装置、動きベクトル検出プログラム及びプログラム記録媒体
JP2007018269A (ja) 映像中の動き確率計算方法、映像中の動き確率マップ計算方法、変化検出方法、及びプログラム
JP5441555B2 (ja) 映像信号処理装置及び映像信号処理方法
KR101574205B1 (ko) 프레임 율 변환을 위한 움직임 정보 추정 방법 및 그 장치
JP2010252068A (ja) 動き検出方法および装置
JP5887763B2 (ja) 動き補償フレーム生成装置及び方法
KR101740125B1 (ko) 프레임 율 변환 영상의 홀 보간 장치 및 그 방법
JP2008079007A (ja) 画像処理装置

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20111012

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111025

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111121

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141202

Year of fee payment: 3

R151 Written notification of patent or utility model registration

Ref document number: 4873765

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141202

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees