JP2012034225A - 動きベクトル検出装置及び動きベクトル検出方法、コンピュータプログラム - Google Patents

動きベクトル検出装置及び動きベクトル検出方法、コンピュータプログラム Download PDF

Info

Publication number
JP2012034225A
JP2012034225A JP2010172726A JP2010172726A JP2012034225A JP 2012034225 A JP2012034225 A JP 2012034225A JP 2010172726 A JP2010172726 A JP 2010172726A JP 2010172726 A JP2010172726 A JP 2010172726A JP 2012034225 A JP2012034225 A JP 2012034225A
Authority
JP
Japan
Prior art keywords
motion vector
motion
image
macroblock
reduced image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2010172726A
Other languages
English (en)
Inventor
Daisuke Sakamoto
大輔 坂本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2010172726A priority Critical patent/JP2012034225A/ja
Priority to US13/187,983 priority patent/US8929449B2/en
Publication of JP2012034225A publication Critical patent/JP2012034225A/ja
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/24Systems for the transmission of television signals using pulse code modulation
    • H04N7/52Systems for transmission of a pulse code modulated video signal with one or more other pulse code modulated signals, e.g. an audio signal or a synchronizing signal
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • H04N19/139Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/16Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter for a given display mode, e.g. for interlaced or progressive display mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/533Motion estimation using multistep search, e.g. 2D-log search or one-at-a-time search [OTS]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/59Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial sub-sampling or interpolation, e.g. alteration of picture size or resolution

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【課題】インタレース映像信号の符号化時に映像の動きが小さい場合でも動きベクトルを誤検出せず、映像の劣化が少ない動き補償符号化技術を提供する。
【解決手段】動き予測符号化のための参照画像を格納するメモリと、第1の動きベクトルを検出する動きベクトル探索手段とを備える動きベクトル検出装置であって、フィールド画像をI/P変換を行ってフレーム画像に変換する変換手段と、縮小画像を生成する縮小画像生成手段と、フレームメモリが格納する縮小画像のうち、符号化対象のマクロブロックの縮小画像と参照用の縮小画像とに基づいて、第2の動きベクトルを検出するプレ動きベクトル探索手段とをさらに備え、動きベクトル探索手段は、符号化対象のマクロブロックの縮小画像について検出された第2の動きベクトルを利用して、第1の動きベクトルを検出するための探索範囲を決定する。
【選択図】図1

Description

本発明は、動きベクトル検出装置及び動きベクトル検出方法、コンピュータプログラムに関する。
近年、音声信号、映像信号など所謂マルチメディアに関連する情報のデジタル化が急速に普及しており、これに対応して映像信号の圧縮符号化復号化技術が注目されている。圧縮符号化及び復号化技術により、映像信号の格納に必要な記憶容量や伝送に必要な帯域を減少させることができるため、マルチメディア産業には極めて重要な技術である。
これらの圧縮符号化復号化技術は、多くの映像信号が有する自己相関性の高さ(すなわち、冗長性)を利用して情報量/データ量を圧縮している。映像信号が有する冗長性には、時間冗長性及び空間冗長性があり、時間冗長性は、ブロック単位の動き検出及び動き補償を用いて低減することができ、一方、空間冗長性は、離散コサイン変換(DCT)を用いて低減させることができる。
圧縮符号化復号化技術として知られるMPEG方式などではこれらの手法により映像信号の冗長性を低減させ、経時的に変わるビデオフレーム/フィールドのデータ圧縮効果を向上させる。時間冗長性を低減させるためのブロック単位の動き推定とは、連続して入力する参照フレーム/フィールド(過去のフレーム/フィールド)と現在フレーム/フィールドとの間で最も近似するブロックを探し出す作業である。ここで、対応するブロックの移動方向、移動量を表すベクトルを動きベクトルという。従って、動き検出とは動きベクトルの検出と同義である。このような動きベクトルの検出は、ビデオ信号をm画素×nライン(m、nは整数)による動きベクトルの検出単位(すなわちマクロブロックである)にブロック化し、ブロック毎に動きベクトルを検出するようになされている。動きベクトル検出では、特許文献1に開示のブロックマッチング法等を用いることができる。
特開2004-229150号公報
インタレース方式の映像信号を符号化する際、フィールド間で動き検出を行っている。その際、動きの小さい斜め線をエッジとしてもつ物体の動きベクトル検出を行った場合、正確に動きを捉えることができず画質に劣化が生じる。
その理由を、図2に示す静止映像の斜め線を参照して説明する。図2(a)のようにプログレッシブ方式の映像信号を符号化する際には、映像をフレームとして扱うため、時間方向の絵柄が同一になり、同一座標に斜め線が存在するので、動きベクトルを「0」と正しく検出できる。一方、インタレース方式の映像信号を符号化する際には、映像をフィールドとして扱う。映像をフィールドで扱った場合、図2(b)のように偶数フィールドと奇数フィールドとで絵柄が異なるため同一座標に斜め線が存在しなくなってしまう。そのため、動きベクトルが「0」にならず検出誤差が発生する。その結果、符号化した映像を再生した際に引きつりなどの映像劣化が起きてしまう。
そこで、本発明は、インタレース映像信号の符号化時に映像の動きが小さい場合でも動きベクトルを誤検出せず、映像の劣化が少ない動き補償符号化技術を提供することを目的とする。
上記課題を解決するための本発明は、
動き予測符号化のための参照画像を格納するメモリと、
フィールド画像を分割して得られた複数のマクロブロックのうち、符号化対象のマクロブロックと前記メモリが格納する前記参照画像との比較に基づき、第1の動きベクトルを検出する動きベクトル探索手段とを備える動きベクトル検出装置であって、
前記フィールド画像をインタレース/プログレッシブ変換を行ってフレーム画像に変換する変換手段と、
前記フレーム画像を縮小して、縮小画像を生成する縮小画像生成手段と、
前記縮小画像を保存するフレームメモリと、
前記フレームメモリが格納する縮小画像のうち、前記符号化対象のマクロブロックの縮小画像と参照用の縮小画像とに基づいて、第2の動きベクトルを検出するプレ動きベクトル探索手段と
をさらに備え、
前記動きベクトル探索手段は、前記符号化対象のマクロブロックの縮小画像について検出された前記第2の動きベクトルを利用して、前記第1の動きベクトルを検出するための探索範囲を決定することを特徴とする。
本発明によれば、インタレース映像信号の符号化時に映像の動きが小さい場合でも動きベクトルを誤検出せず、映像の劣化が少ない動き補償符号化技術を提供することができる。
実施形態1に係る動き補償符号化装置の構成例を示すブロック図。 インタレース映像信号の符号化時の問題点を説明するための図。 インタレース/プログレッシブ変換の一方式を説明するための図。 実施形態2に係る動き補償符号化装置の構成例を示すブロック図。 実施形態1に係る動きベクトル検出処理のフローチャート。
以下、図面を参照して本発明をその好適な実施形態に基づき詳細に説明する。
[実施形態1]
以下に図1及び図5を参照しながら、本発明にかかる動きベクトル検出装置を含む補償符号化装置の好適な一実施形態について詳細に説明する。図1は本発明に係る動き補償符号化装置のブロック図であり、図5は、本実施形態に係る動きベクトル検出の処理の一例を示すフローチャートである。
本実施形態の特徴は、フィールド画像における符号化対象のマクロブロックについて動き補償を行うための動きベクトル(第1の動きベクトル)の誤検出を減らすための技術にある。具体的には、フィールド画像をフレーム画像に変換した後縮小画像を生成し、当該縮小画像についてプレ動きベクトル(第2の動きベクトル)を検出し、当該第2の動きベクトルを第1の動きベクトルの探索のために利用する。
図1に示す各構成部を利用して、本実施形態における処理について具体的に説明する。図1の動き補償符号化装置100において、各ブロックは専用ロジック回路やメモリを用いてハードウェア的に構成されてもよい。或いは、メモリに記憶されている処理プログラムをCPUが実行することにより、ソフトウェア的に構成されてもよい。また、図5のフローチャートは、例えば、該当する機能ブロックとして機能するCPUが対応するプログラム(ROM等に格納)を実行することにより実現できる。
S501では、インタレース/プログレッシブ変換部101は、インタレース映像信号をプログレッシブ映像信号に変換した上で、縮小画像生成部102に送信する。
インタレース/プログレッシブ変換の一例を図3を用いて説明する。なお、プログレッシブ映像信号を生成する方法は特に問わない。図3は連続する2つのフィールド画像(インタレース映像信号)から同じ座標位置を1画素分の幅で抜き出したものである。このとき、現フィールドの補間対象の画素(補間点)301を中心に抜き出すようにする。インタレース/プログレッシブ変換時にはまず現フィールドの補間点301の上下の値と、現フィールドの補間点301と同位置の、現フィールドの直前に位置する前フィールドの値の3値を用いて補間画素で動きの有無を判定する。なお図2のように現フィールドの補間点301の上下の値をb,c、現フィールドの補間点301と同位置の前フィールドの値をaとする。これらの値を用いて次の式1を用いてフィールド間差分値fddを算出する。
fdd = |a−(b+c)/2| ・・・(式1)
fddが大きいほど現フィールドと前フィールドとの差が大きいため、動きがあったものと判定する。一方、fddが小さいほど現フィールドと前フィールドとの差が小さいため、静止していると判定する。例えばfddと、所定値(閾値TH1)とを比較して、fdd>TH1の場合には、「動きあり」と判定し、fdd≦TH1の場合には「静止」と判定することができる。
動き判定で「静止」であった場合、補間点は前フィールドの値から変化していないと考えられるので、前フィールドの値(図2の”a”)をそのまま代入する。この補間処理方法のことを「フィールド間補間」と呼ぶ。一方、動き判定で「動きあり」と判定された場合は前フィールドの値とは関係の無いものとなっている。したがって、現フィールドの上下の画素値の平均値(図2の(b+c)/2)を補間値とする。この補間処理方法のことを「フィールド内補間」と呼ぶ。
次にS502で縮小画像生成部102は、インタレース/プログレッシブ変換部101を縮小した画像を生成する。縮小画像を生成する方法は、例えば縦1/2、横1/4縮小する場合は縦2画素、横4画素の画素値の平均値を用いるなどの方法が挙げられるが特に方法は問わない。なお、本実施形態では縦1/2、横1/4縮小した場合を例に挙げて説明する。
次にプレ動きベクトル探索用参照フレームメモリ103は、縮小画像生成部102から表示順にプログレッシブ映像の縮小画像を保存し、符号化順序に従い符号化対象ブロックをプレ動きベクトル探索部104に順次送信する。また、プログレッシブ映像の縮小画像をプレ動きベクトルを探索するための参照用の縮小画像として保存し、プレ動きベクトル探索部104に順次送信する。なお、プレ動きベクトル探索はプログレッシブ映像の縮小画で行うため符号化対象ブロックの大きさをそれに合わせた大きさに調整して行う。
本実施形態の場合、プログレッシブ化し縦1/2、横1/4縮小しているので縦方向に2倍にした上で縦1/2、横1/4縮小したブロック、すなわち横方向に1/4したブロックを用いて行う。例えばMPEG2の符号化対象ブロックのサイズは16×16のため、プレ動きベクトル探索は4×16のブロックを用いて行う。
プレ動きベクトル探索部104は、S503にてプレ動きベクトルの探索を行う。ここでは、プレ動きベクトル探索用参照フレームメモリ103からの符号化対象マクロブロックと、プレ動きベクトル探索用参照フレームメモリ103からの参照画像との相関が強い位置に基づいてベクトル検出を行う。
最大相関度を有する動きベクトルを推定するためには、後述のMSE(Mean Square Error) (式2)、MAE(Mean Absolute Error)(式3)、あるいはMAD(Mean Absolute Difference) などの評価関数を用いて次のように求められる。
Figure 2012034225
Figure 2012034225
ここで、Srefは参照画像、Scur,kは現在のフレームでk番目のマクロブロックを示す。(i,j)は現在フレームのk番目のマクロブロックに対する参照画像の空間的な位置をそれぞれ示している。
ただし、X及びYをサーチウィンドウの水平及び垂直画素数とすると、x=g×u、y=h×vであり、g、hは、0≦x≦X、1≦g≦X、0≦y≦Y、1≦h≦Yを満たす自然数である。また、U、Vは、X−g≦U≦X、Y−h≦V≦Yを満たす。
この評価関数は画素の差に基づいたものであり、最も小さいMAE値やMSE値を有する場合を現在のマクロブロックにおけるプレ動きベクトルとして選定する。なお、プレ動きベクトル探索はプログレッシブ映像の縮小画を用いて行うため、インタレース映像と画像サイズを合わせる必要がある。本実施形態では検出したプレ動きベクトルを横方向に4倍する。続いて決定したプレ動きベクトルを動きベクトル探索部105及びフィルタ後参照フレームメモリ118に送信する。
動きベクトル探索部105はS504にて動きベクトルの探索を行う。ここでは、プレ動きベクトル探索部104からのプレ動きベクトルを利用して、符号化対象マクロブロックとフィルタ後参照フレームメモリ118からの参照画像との相関が強くなる位置に基づいてベクトル探索を行う。具体的には、動きベクトル探索を行う参照画像の領域をプレ動きベクトルに基づいて絞り込んでもよいし、プレ動きベクトル分だけずらした参照画像をフィルタ後参照フレームメモリ118から取得してもよい。或いは、その両方を実施して、プレ動きベクトル分だけずらした参照画像を取得した上で、探索領域を参照画像内で更に絞り込んでもよい。
最大相関度を有する動きベクトルを推定するためには、プレ動きベクトルと同様、前述のMSEあるいはMADなどの評価関数を用いる。最も小さいMAE値やMSE値を有する場合を現在のマクロブロックにおける動きベクトルとして選定する。なお、動き探索はインタレース映像をそのまま用いて行うのでプレ動きベクトル探索のようにブロックのサイズの調整、動きベクトルの大きさの調整をする必要は無い。
続いて決定した動きベクトルを動き補償部106とエントロピー符号化部112に情報を送出する。また、同時に動き情報の生成に使った参照画像の識別情報もまた、動き補償部106とエントロピー符号化部112に送出する。
以上のように、インタレース/プログレッシブ変換部101、縮小画像生成部102、プレ動きベクトル探索用参照フレームメモリ103、プレ動きベクトル探索部104により、第2の動きベクトルであるプレ動きベクトルを検出する。そして、当該プレ動きベクトルを利用して、動きベクトル探索部105、フィルタ後参照フレームメモリ118により、第1の動きベクトルである動きベクトルを検出することが出来る。これらの構成により、本実施形態における動きベクトル検出装置を構成することができる。
イントラ予測部107はフィルタ前参照フレームメモリ116の復元画像データを所定のブロック単位に分割し、各ブロック内の復元画像データを、前記ブロックの周辺画素値から予測する。前記予測値を予測画像情報として算出し、スイッチ108に送られる。スイッチ108では図示しないコントローラによって、予測方法に応じて、スイッチを切り替える。イントラ予測符号化方式の場合、スイッチは108aに接続され、予測画像情報はイントラ予測方式による算出方法で得られたデータが送出される。
動き補償部106では、前記参照フレーム識別情報に応じた参照画像の復元画像をフィルタ後参照フレームメモリ118から呼出し、前記復元画像データと前記動きベクトルから、現行画像の予測画像情報を生成する。このように、インター予測符号化では、現行画像とは別のフレームを参照して、予測画像情報を作り出すところが、イントラ予測符号化とは異なる。
生成されたインター方式の予測画像情報は、スイッチ108で108bに接続され、予測画像情報はインター予測方式による算出方法で得られたデータが送出される。減算器109は符号化対象ブロックからスイッチ108から送信されてくる予測画像ブロックを減算し、画像残差データを出力する。直交変換部110では減算器109から出力された画像残差データを直交変換処理して、変換係数を量子化部111に送信する。
量子化部111は直交変換部110からの変換係数を所定の量子化パラメータを用いて量子化し、エントロピー符号化部112および逆量子化部113に送信する。エントロピー符号化部112は量子化部111で量子化された変換係数を入力し、CAVLC、CABACなどのエントロピー符号化を施して、符号化データとして出力する。
続いて、量子化部111で量子化された変換係数を用いて参照画像を生成する方法について述べる。逆量子化部113は量子化部111から送信されてくる量子化された変換係数を逆量子化する。逆直交変換部114は逆量子化部113で逆量子化された変換係数を逆直交変換し、復号残差データを生成し加算器115に送信する。加算器115は復号残差データと後述する予測画像データとを加算し参照画像を生成し、フィルタ前参照フレームメモリ116に保存する。また、ループフィルタ117に送信される。但し、この時点の復元画像データは予測情報の誤差や前記量子化処理における量子化誤差によって、入力画像データよりも僅かに劣化している画像となっている。
ループフィルタ117では、ブロック境界に隣接する画素データに対して所定のフィルタ処理を施し、ブロック境界のデータの不連続性を抑圧する。先に述べたように、復元される画像データは入力画像よりも劣化した画像となっており、特に各処理において所定のブロック単位で処理される画像データは、ブロック境界でデータの不連続性が生じやすくブロック歪として画像認識されてしまう。そこで、ブロック歪を低減させるためにデブロッキングフィルタを用いる。境界処理された前記復元画像データはフィルタ後参照フレームメモリ118に保存される。
以上のようにインタレース映像を符号化する場合においても階層動きベクトル探索の上層での動きベクトル探索時にはプログレッシブ映像を用いることで動きが少ない映像であっても動きベクトルの誤検出を減らすことができる。
[実施形態2]
次に図4のブロック図を参照しながら、本発明にかかる動きベクトル検出装置のもう一つの実施形態について詳細に説明する。図4に示す実施形態2に係る動き補償符号化装置100の動きベクトル検出装置は、実施形態1とほぼ同じ構造を有するが、符号化対象マクロブロック動き判定部119およびプレ動きベクトル保存部120を有する点が異なる。また、インタレース/プログレッシブ変換部101の動き判定結果を符号化対象マクロブロック動き判定部119に送信し、符号化対象マクロブロックの動き判定結果に応じて、プレ動きベクトル探索部104の動きベクトル探索方法を切り換えている点が異なる。
なお、インタレース/プログレッシブ変換部101、プレ動きベクトル探索部104、符号化対象マクロブロック動き判定部119及びプレ動きベクトル保存部120以外の構成の動作については実施形態1と同様のため説明を省く。インタレース/プログレッシブ変換部101は実施形態1で使用した式1を用いてインタレース/プログレッシブ変換対象画素の動き判定を行い、判定結果を符号化対象マクロブロック動き判定部119に送信する。符号化対象マクロブロック動き判定部119はインタレース/プログレッシブ変換部101からの動き判定結果を受け、符号化対象マクロブロックの動き判定を行い、判定結果をプレ動きベクトル探索部104に送信する。
以下、符号化対象マクロブロックの動き判定方法について説明する。符号化対象マクロブロック動き判定部119はインタレース/プログレッシブ変換部101からの動き判定結果を受け、符号化対象マクロブロックの画素のうち動きがあったと判定された画素の数をカウントする。カウント数をMVcntとし後述する式4−1及び式4−2を用いて符号化対象ブロックが動いているかどうか判定する。
MVcnt≧TH2 ・・・(式4ー1)
MVcnt<TH2 ・・・(式4ー2)
ここでTH2は所定の閾値である。式4−1の場合は動きがあった画素数が多いと判定されているため、符号化対象マクロブロックに動きがあったものとする。一方、式4−2の場合は動きがあった画素の数が少ないと判定されているため、符号化対象マクロブロックに動きが無かったものとする。
プレ動きベクトル探索部104は符号化対象マクロブロック動き判定部119から送信されてくる符号化対象マクロブロックの動き判定結果に応じて、探索位置を切り替えて動きベクトル探索を行う。符号化対象マクロブロックに動きが無いと判定された場合、符号化対象マクロブロックの位置に基づいて探索範囲を決定し、プレ動きベクトル探索用参照フレームメモリ103に参照画像を要求する。そして、得られた参照画像を用いて、符号化対象マクロブロックの周辺で動き探索を行う。
一方、動きがあると判定された場合、符号化対象マクロブロックの位置と、周辺のマクロブロックで得られたプレ動きベクトル(「予測動きベクトル」という)とに基づいて探索範囲を決定する。そして、プレ動きベクトル探索用参照フレームメモリ103に参照画像を要求する。ここで周辺のマクロブロックには、例えば、既にプレ動きベクトルの検出が終わったマクロブロックであって、符号化対象マクロブロックに隣接するマクロブロックが含まれる。対象となる周辺マクロブロックが複数ある場合には、複数のプレ動きベクトルを合成して得られた結果を予測動きベクトルとしてもよい。このようにして、プレ動きベクトル探索部104は、予測動きベクトル分だけ探索位置をずらした位置で動き探索を行う。そして実施形態1と同様にMSE、MAEあるいはMADを求め、最も小さいMAE値やMSE値を有する場合を現在のマクロブロックにおけるプレ動きベクトルに選定する。
なお、プレ動きベクトル探索はプログレッシブ映像の縮小画を用いて行うため、インタレース映像と画像サイズを合わせる必要がある。本実施形態では検出したプレ動きベクトルを横方向に4倍する。続いて決定したプレ動きベクトルを動きベクトル探索部105及びフィルタ後参照フレームメモリ118に送信する。また、プレ動きベクトル探索部内のプレ動きベクトル保存部120に送信する。以降の符号化処理は実施形態1と同様のため説明を省く。
なお、本実施形態では動きがあると期待される位置を周辺のマクロブロックで求めたプレ動きベクトルを利用して特定しているが、他の方法を用いてもよい。例えば、参照画像に対する符号化対象画像の空間的な位置の差(即ち、フィールド間のずれ量)を示すグローバルベクトル探索部を、符号化対象マクロブロック動き判定部119とプレ動きベクトル保存部120の代わりに設けてもよい。グローバルベクトル探索部はグローバルベクトルを検出し、プレ動きベクトル探索部104に出力する。プレ動きベクトル探索部104はグローバルベクトル分だけ符号化対象マクロブロックからずらした位置でプレ動きベクトルを探索しても良い。
グローバルベクトルの検出にあたっては動きベクトル同様MSE(Mean Square Error)、MAE(Mean Absolute Error)、あるいはMAD(Mean Absolute Differ ence)などの評価関数を用いることができる。MSE、MAEを用いた評価関数の一例を式5及び式6に示す。
Figure 2012034225
Figure 2012034225
ここで、Scur(m、n)は現在のフレームでの(m、n)番目の画素値、Sref(m、n)は参照画像での(m、n)番目の画素値を示す。(i,j)は参照画像に対する現在のフレームの空間的な位置をそれぞれ示している。
ただし、M、Nを1フレームの水平及び垂直画素数とすると、m=k×q、n=l×rであり、k、lは、0≦m≦M、1≦k≦M、0≦n≦N、1≦l≦Nを満たす自然数である。また、Q、Rは、M−k≦Q≦M、N−l≦R≦Nを満たす。
以上のように本実施形態では、符号化対象ブロックの動きが無い時には符号化対象マクロブロック周辺でプレ動きベクトル探索を行い、動きがある場合には動きがあると期待される位置でプレ動きベクトル探索を行う。これにより、動きベクトルの誤検出を減らすことができる。
(その他の実施例)
また、本発明は、以下の処理を実行することによっても実現される。即ち、上述した実施形態の機能を実現するソフトウェア(プログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(またはCPUやMPU等)がプログラムを読み出して実行する処理である。

Claims (8)

  1. 動き予測符号化のための参照画像を格納するメモリと、
    フィールド画像を分割して得られた複数のマクロブロックのうち、符号化対象のマクロブロックと前記メモリが格納する前記参照画像との比較に基づき、第1の動きベクトルを検出する動きベクトル探索手段とを備える動きベクトル検出装置であって、
    前記フィールド画像をインタレース/プログレッシブ変換を行ってフレーム画像に変換する変換手段と、
    前記フレーム画像を縮小して、縮小画像を生成する縮小画像生成手段と、
    前記縮小画像を保存するフレームメモリと、
    前記フレームメモリが格納する縮小画像のうち、前記符号化対象のマクロブロックの縮小画像と参照用の縮小画像とに基づいて、第2の動きベクトルを検出するプレ動きベクトル探索手段と
    をさらに備え、
    前記動きベクトル探索手段は、前記符号化対象のマクロブロックの縮小画像について検出された前記第2の動きベクトルを利用して、前記第1の動きベクトルを検出するための探索範囲を決定することを特徴とする動きベクトル検出装置。
  2. 前記動きベクトル探索手段は、前記第2の動きベクトルに基づいて、前記参照画像において前記比較を行う範囲を絞り込むことにより、前記探索範囲を決定することを特徴とする請求項1に記載の動きベクトル検出装置。
  3. 前記動きベクトル探索手段は、前記第2の動きベクトルに基づいて前記メモリから取得する参照画像の範囲を特定することで、前記探索範囲を決定することを特徴とする請求項1または2に記載の動きベクトル検出装置。
  4. 前記変換手段は、変換対象のフィールド画像と、該フィールド画像の直前に位置する他のフィールド画像とを用いた補間処理により前記変換を行い、
    前記補間処理では、前記変換対象のフィールド画像における補間対象の画素を挟む画素の画素値の平均値と、前記補間対象の画素の位置に対応する前記他のフィールドの画素の画素値との差分に基づいて、該補間対象の画素の動きの有無を判定して補間方法を決定し、
    前記差分が所定値を超える場合には、動きが有ると判定して、前記平均値により前記補間対象の画素の補間を行い、
    前記差分が所定値を超えない場合には、動きが無いと判定して、前記他のフィールドにおける画素の画素値により前記補間対象の画素の補間を行う
    ことを特徴とする請求項1乃至3のいずれか1項に記載の動きベクトル検出装置。
  5. 前記プレ動きベクトル探索手段が検出した第2の動きベクトルを保存するベクトル保存手段と、
    前記符号化対象のマクロブロックの動きを判定する動き判定手段と
    をさらに備え、
    前記動き判定手段は、前記符号化対象のマクロブロックについて行われた前記補間処理における該マクロブロックに含まれる前記補間対象の画素の前記動きの有無の判定結果に基づいて、
    動きが有ると判定された前記補間対象の画素の数が閾値を超える場合に、該符号化対象のマクロブロックは動きが有ると判定し、
    動きが有ると判定された前記補間対象の画素の数が閾値を超えない場合に、該符号化対象のマクロブロックは動きが無いと判定し、
    前記動きが有ると判定された符号化対象のマクロブロックについて、前記プレ動きベクトル探索手段は、前記ベクトル保存手段が保存する第2の動きベクトルのうち、前記符号化対象のマクロブロックに隣接するマクロブロックについて検出された第2の動きベクトルを用いて前記参照用の縮小画像を決定し、
    前記動きが無いと判定された符号化対象のマクロブロックについて、前記プレ動きベクトル探索手段は、前記符号化対象のマクロブロックの位置に基づき前記参照用の縮小画像を決定する
    ことを特徴とする請求項4に記載の動きベクトル検出装置。
  6. 変換対象のフィールド画像と、該フィールド画像の直前に位置する他のフィールド画像との間の画素値の差分に基づきグローバルベクトルを検出する検出手段をさらに備え、
    前記プレ動きベクトル探索手段は、前記グローバルベクトルを用いて前記参照用の縮小画像を決定することを特徴とする請求項1乃至3のいずれか1項に記載の動きベクトル検出装置。
  7. コンピュータを、請求項1乃至6のいずれか1項に記載の動きベクトル検出装置の各手段として機能させるためのプログラム。
  8. 動き予測符号化のための参照画像を格納するメモリと、
    フィールド画像を分割して得られた複数のマクロブロックのうち、符号化対象のマクロブロックと前記メモリが格納する前記参照画像との比較に基づき、第1の動きベクトルを検出する動きベクトル探索手段とを備える動きベクトル検出装置における動きベクトル検出方法であって、
    変換手段が、前記フィールド画像をインタレース/プログレッシブ変換を行ってフレーム画像に変換する変換工程と、
    縮小画像生成手段が、前記フレーム画像を縮小して、縮小画像を生成する縮小画像生成工程と、
    前記縮小画像をフレームメモリに保存する工程と、
    プレ動きベクトル探索手段が、前記フレームメモリが格納する縮小画像のうち、前記符号化対象のマクロブロックの縮小画像と参照用の縮小画像とに基づいて、第2の動きベクトルを検出するプレ動きベクトル探索工程と、
    前記動きベクトル探索手段が、前記符号化対象のマクロブロックの縮小画像について検出された前記第2の動きベクトルを利用して、前記第1の動きベクトルを検出するための探索範囲を決定する工程と
    を備えることを特徴とする方法。
JP2010172726A 2010-07-30 2010-07-30 動きベクトル検出装置及び動きベクトル検出方法、コンピュータプログラム Withdrawn JP2012034225A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2010172726A JP2012034225A (ja) 2010-07-30 2010-07-30 動きベクトル検出装置及び動きベクトル検出方法、コンピュータプログラム
US13/187,983 US8929449B2 (en) 2010-07-30 2011-07-21 Motion vector detection apparatus, motion vector detection method, and computer-readable storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010172726A JP2012034225A (ja) 2010-07-30 2010-07-30 動きベクトル検出装置及び動きベクトル検出方法、コンピュータプログラム

Publications (1)

Publication Number Publication Date
JP2012034225A true JP2012034225A (ja) 2012-02-16

Family

ID=45526693

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010172726A Withdrawn JP2012034225A (ja) 2010-07-30 2010-07-30 動きベクトル検出装置及び動きベクトル検出方法、コンピュータプログラム

Country Status (2)

Country Link
US (1) US8929449B2 (ja)
JP (1) JP2012034225A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111292354A (zh) * 2020-01-22 2020-06-16 维沃移动通信有限公司 误检测抑制方法及电子设备

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI463878B (zh) 2009-02-19 2014-12-01 Sony Corp Image processing apparatus and method
US9413675B2 (en) * 2012-07-25 2016-08-09 Nec Corporation Data transmission apparatus, data division apparatus and data division method
JP2014093602A (ja) * 2012-11-01 2014-05-19 Toshiba Corp 画像処理装置、画像処理方法、画像処理プログラム、および立体画像表示装置
GB201513610D0 (en) * 2015-07-31 2015-09-16 Forbidden Technologies Plc Compressor
WO2018056181A1 (ja) * 2016-09-26 2018-03-29 ソニー株式会社 符号化装置、符号化方法、復号化装置、復号化方法、送信装置および受信装置
CN109996081B (zh) * 2017-12-31 2023-09-12 华为技术有限公司 图像预测方法、装置以及编解码器
CN117579827A (zh) * 2018-01-09 2024-02-20 夏普株式会社 运动矢量推导装置、运动图像解码装置以及运动图像编码装置
US11665365B2 (en) * 2018-09-14 2023-05-30 Google Llc Motion prediction coding with coframe motion vectors
CN113706573B (zh) * 2020-05-08 2024-06-11 杭州海康威视数字技术股份有限公司 一种运动物体的检测方法、装置及存储介质

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7551673B1 (en) * 1999-05-13 2009-06-23 Stmicroelectronics Asia Pacific Pte Ltd. Adaptive motion estimator
JP4228705B2 (ja) 2003-01-27 2009-02-25 日本電気株式会社 動きベクトル探索方法および装置
JP4891103B2 (ja) * 2007-01-25 2012-03-07 キヤノン株式会社 動き量検出装置及びそれを利用した画像処理装置、並びにそれらの制御方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111292354A (zh) * 2020-01-22 2020-06-16 维沃移动通信有限公司 误检测抑制方法及电子设备

Also Published As

Publication number Publication date
US8929449B2 (en) 2015-01-06
US20120027095A1 (en) 2012-02-02

Similar Documents

Publication Publication Date Title
JP2012034225A (ja) 動きベクトル検出装置及び動きベクトル検出方法、コンピュータプログラム
KR100803611B1 (ko) 영상의 부호화, 복호화 방법 및 장치
US20150010243A1 (en) Method for encoding/decoding high-resolution image and device for performing same
US20130089265A1 (en) Method for encoding/decoding high-resolution image and device for performing same
JP5488612B2 (ja) 動画像符号化装置および動画像復号装置
JP4504230B2 (ja) 動画像処理装置、動画像処理方法、及び動画像処理プログラム
JPH11112973A (ja) 映像信号変換装置及び映像信号変換方法
JP2013524740A (ja) ビデオ符号化におけるレート制御
US20140233645A1 (en) Moving image encoding apparatus, method of controlling the same, and program
US9445089B2 (en) Video encoding device, video encoding method and video encoding program
US9654775B2 (en) Video encoder with weighted prediction and methods for use therewith
WO2003056838A1 (en) Moving picture compression/coding apparatus and motion vector detection method
WO2011070730A1 (ja) 映像符号化装置および映像復号装置
JP5639444B2 (ja) 動きベクトル生成装置、動きベクトル生成方法及びコンピュータプログラム
JPH0662389A (ja) 映像信号符号化装置
US20150208082A1 (en) Video encoder with reference picture prediction and methods for use therewith
JP5832263B2 (ja) 画像符号化装置及び画像符号化方法
JP5407974B2 (ja) 動画像符号化装置及び動きベクトル検出方法
JP5598199B2 (ja) 動画像符号化装置
JP6313614B2 (ja) 動画像符号化装置及びその制御方法
JP5701018B2 (ja) 画像復号装置
JP2012124851A (ja) 動き補償符号化装置、動き補償符号化方法、及びプログラム
JP2004072732A (ja) 符号化装置、コンピュータ読取可能なプログラム、符号化方法。
JP2009153227A (ja) 画像処理装置およびそれを用いた撮像装置
Zong-Ping et al. Motion vector context-based adaptive 3-D recursive search block matching motion estimation

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20131001