JPH0993585A - 動きベクトル検出装置及び動きベクトル検出方法 - Google Patents

動きベクトル検出装置及び動きベクトル検出方法

Info

Publication number
JPH0993585A
JPH0993585A JP24496195A JP24496195A JPH0993585A JP H0993585 A JPH0993585 A JP H0993585A JP 24496195 A JP24496195 A JP 24496195A JP 24496195 A JP24496195 A JP 24496195A JP H0993585 A JPH0993585 A JP H0993585A
Authority
JP
Japan
Prior art keywords
motion vector
region
pixel
edge
area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP24496195A
Other languages
English (en)
Inventor
Yoshitaka Furukubo
良隆 古久保
Atsushi Murayama
淳 村山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP24496195A priority Critical patent/JPH0993585A/ja
Publication of JPH0993585A publication Critical patent/JPH0993585A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】 【課題】 画像中の動きベクトルを求める画素の周辺に
動きが異なる領域が存在する場合にも、正確な動きベク
トルを求めることができる。 【解決手段】 エッジ領域検出部3で検出した現フレー
ムのエッジ領域を、エッジ画素分割部4でエッジ画素毎
に分割し、動きベクトル検出部10で、上記各エッジ画
素に対して設定される、異なる大きさ及び形状の複数の
窓領域の最小誤差を持つ画素をそれぞれ検出し、上記複
数の窓領域の最小誤差を持つ各画素と上記エッジ画素と
の間の動きベクトルにより上記エッジ画素の最適な窓領
域を検出して、動きベクトルマップ作成部5で、各エッ
ジ画素の最適な窓領域による動きベクトルを用いてエッ
ジ領域全体の動きベクトルを求める。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、物体又は領域の動
きベクトルを検出する動きベクトル検出装置及び動きベ
クトル検出方法に関する。
【0002】
【従来の技術】従来、画像信号の高能率符号化は、画像
信号の持つ相関の高さを利用して冗長性を削減する方法
であり、画像信号の伝送や記録の際に必要不可欠なもの
である。この画像信号の高能率符号化方法として、予測
符号化のような画像を画素単位に扱う符号化方法や、離
散コサイン変換(Discrete Cosine Transform:以下、
DCTという)に代表される直交変換符号化やウェーブ
レット変換のようなサブバンド符号化等が存在する。
【0003】予測符号化の代表的な手法としては、フレ
ーム内DPCM(Differential Pulse Code Modulatio
n)等がある。このフレーム内DPCMは、原画素と復
号化した近傍画素の差分を量子化して符号化する方法で
ある。
【0004】このような予測符号化方法は、必要な圧縮
率が1/2〜1/4程度と、それほど高くない場合には
有効であるが、それ以上の高圧縮率の場合には適さな
い。一方、直交変換符号化やサブバンド符号化は、圧縮
率が1/10以上と高い場合に用いられており、現在は
DCTを用いた手法が一般的に多く用いられている。こ
れは、DCTが高速アルゴリズムを有し、ハード化が容
易である等の理由によるものであり、JPEGやMPE
G等の画像符号化方式の国際標準にも採用されている。
【0005】DCTを用いた画像符号化方式は、画像信
号の低周波成分の電力がきわめて大きいという特徴を利
用し、DCTによって求められた画像信号の周波数成分
を量子化する際に低周波成分の量子化ステップサイズは
小さく、高周波成分のステップサイズは大きくすること
によって、全体として情報量を圧縮する手法である。
【0006】しかし、量子化を行うことによってブロッ
ク歪み及びモスキート雑音が生じてしまうという問題点
があり、特にマクロブロックを単位とした処理であるこ
とに起因するブロック歪みは、符号化速度が低い場合に
顕著になる。このため、超低ビットレートの画像符号化
を行うためには新たな高能率符号化方法が必要である。
【0007】そこで、超低ビットレートでの伝送や記録
を目的とした画像符号化方式として、人間の視覚特性が
物体の輪郭線に特に敏感であるということを考慮し、原
画像中の輪郭線部分を重点的に保存することにより低ビ
ットレートでも視覚的に優れた復元性を実現しようとす
る手法が提案されている。
【0008】このような原画像中の輪郭線部分を重点的
に保存する画像符号化方法においては、静止画像中の物
体の輪郭線いわゆるエッジ領域をいかに効率良く抽出
し、符号化するかが重要となる。さらに、動画像符号化
処理において符号化効率を上げるための手段として、静
止画像から抽出されたエッジ領域の動き補償処理が必要
となる。このエッジ領域の動き補償とは、隣接するフレ
ーム内のエッジ領域間の対応関係を調べ、対応付けがな
されたエッジに関しては前フレームのエッジ領域に対す
る動きベクトルと変形パラメータとを送り、対応が付か
なかったエッジに関してのみ新たに位置情報などの符号
化を行うものである。従って、隣接するフレーム間でエ
ッジの対応付けを行うことが必要となるが、このとき、
各エッジ領域の動きベクトルが必要となる。
【0009】ここで、従来の各フレームの輪郭線を対応
付けるための各エッジ領域の動きベクトルを求める方法
について説明する。
【0010】図8には、従来のエッジ領域の動きベクト
ル検出装置の概略的な構成を示す。
【0011】図8に示す動きベクトル検出装置におい
て、現フレームバッファ41及び次フレームバッファ4
2に格納される、入力信号として連続する2つのフレー
ム画像信号BD0、BD1を用いる。
【0012】まず、処理対象である現フレーム信号BD
0を現フレームバッファ41からエッジ領域検出部43
に送る。このエッジ領域検出部43の概略的な構成を図
9に示し、現フレーム画像からエッジ領域を抽出する処
理手順を説明する。
【0013】図9において、現フレーム信号BD0から
成る原画像の画素信号CD0は、差分フィルタであるソ
ーベル(Sobel)フィルタを用いたエッジ強度算出部6
1、62に入力される。このとき、エッジ強度算出部6
1では、図10Bに示すタップ係数のソーベルフィルタ
が用いられ、エッジ強度算出62では、図10Aに示す
タップ係数のソーベルフィルタが用いられる。これによ
り、エッジ強度算出部61では水平方向のエッジ強度を
示すエッジ強度信号CD1が得られ、エッジ強度算出部
62では垂直方向のエッジ強度を示すエッジ強度信号C
2が得られる。
【0014】このエッジ強度信号CD1は乗算器63で
自乗されて水平方向のエッジ強度信号電力CD4が出力
され、また、エッジ強度信号CD2は乗算器64で自乗
されて垂直方向のエッジ強度信号電力CD5が出力され
る。
【0015】この水平方向のエッジ強度信号電力CD4
と垂直方向のエッジ強度信号電力CD5とは加算器65
で加算され、注目画素のエッジ強度を示す信号CD7
得る。
【0016】ここで、物体の輪郭や物体間の境界線等の
エッジ領域と、テクスチャ領域内のエッジ領域の特性と
の違いを考慮に入れた場合には、エッジ領域とテクスチ
ャ領域とを分離するための特徴量として、画素値(階調
値)の局所的な変化特性と大局的な変化特性とを示す指
標値を用いる手法が有効である。この画素値の局所的な
変化特性を表す特徴量としては、エッジ領域か否かを判
定する際に重要な特徴量である注目画素のエッジ強度が
ある。また、画素値の大局的な変化特性を表す特徴量と
しては、注目画素周辺の空間周波数分布をあげることが
できる。このエッジ領域検出部43では、画素値の大局
的な変化特性を示す特徴量として空間周波数を示す特徴
量を用いる。
【0017】このため、フィルタリング処理部66にお
いて、原画像の画素信号CD0の、ハイパスフィルタ
(HPF:High Pass Filter)、ローパスフィルタ(L
PF:Low Pass Filter)、又はバンドパスフィルタ
(BPF:Band Pass Filter)を介した出力値をそれぞ
れ算出する。フィルタリング処理部66において用いる
HPFの例としては、例えば図10に示す3×3のタッ
プ数のソーベルフィルタ等があるが、この他に、5×
5、7×7等のタップ数のHPFや、タップ係数が異な
るフィルタも適用することができる。
【0018】また、大局的な変化特性を表す特徴量とし
て、局所的な変化特性を表す特徴量である空間周波数の
特徴量の一定領域内における平均値などを用いる。そこ
で、このような大局的な変化特性を示す特徴量を求める
際に必要な局所的特徴量を得るためのマスク領域を、注
目領域周辺に設定する。このマスク領域の種類として、
図11に示す窓領域WA3、WA4が考えられる。
【0019】図11に示すマスク領域である窓領域WA
3、WA4は、注目画素CPが持つエッジ強度の法線方向
にある、注目画素CPを境界とする注目画素CPの両側
の1次元の領域であり、一方の1次元のマスク領域を窓
領域WA3、他方の1次元のマスク領域を窓領域WA4
する。これは、エッジ領域EA3を境界として大きく変
わる画素値の変化を、エッジ領域EA3の両側の特徴量
の関係から得ようとするものである。
【0020】以上のような各種の特徴量を用いたエッジ
領域抽出のための閾値決定の処理は、図9のフィルタリ
ング処理部66、マスク領域設定回路67、及び閾値決
定回路68を用いる。
【0021】まず、原画像の画素信号CD0がフィルタ
リング処理部66に入力されて得られる出力信号CD3
を、マスク領域設定回路67に入力する。このマスク領
域設定回路67ではマスク領域を設定し、この設定され
たマスク領域内から求められる特徴量CD6を算出す
る。そして、閾値決定回路68において、特徴量CD6
及び加算器65からのエッジ強度を示す信号CD7をパ
ラメータとする閾値関数Fに応じて閾値信号CD8を求
める。
【0022】尚、閾値関数Fは、テクスチャ領域とエッ
ジ領域とを分離するために最適と思われる閾値を取れる
ようにシミュレーションによって決定されるものであ
る。
【0023】閾値決定回路68において用いられる閾値
関数としては、例えば図12に示すように、注目画素の
エッジ強度Eと、2つのマスク領域内の平均値M1、M2
との関係を示す閾値関数F1が用いられる。この閾値関
数F1は、以下の(1)式で示される。
【0024】 {M1−(aE−b)}{M2−(aE−b)}=c ・・・(1) (a、b、cは定数) この(1)式に示すマスク領域内の平均値M1、M2の値
により、以下の(2)式に示す閾値Tとなるエッジ強度
Eが得られる。
【0025】T=F1(M1・M2) ・・・(2) 閾値が決定された後、エッジ強度を示す信号CD7と閾
値決定回路68から出力される閾値信号CD8とを比較
器69に入力する。例えば、比較器69からの出力信号
CD9は、注目領域がテクスチャ領域であるときには
0、エッジ領域であるときには1として出力される。こ
れにより、注目画素がテクスチャ領域であるのか、ある
いはエッジ領域であるのかを判断する。
【0026】従って、比較器69からの出力信号CD9
を各画素の画素値として得られる画像は、エッジ領域抽
出によって抽出されたエッジ領域であり、このエッジ領
域から成る画像をエッジ画像と呼ぶこととする。
【0027】尚、図9のエッジ領域信号CD9は、図8
に示されるエッジ領域検出部43から出力されるエッジ
領域信号BD2に相当する。
【0028】このエッジ領域信号BD2はエッジ画素分
割部44に入力されて、個々のエッジ画素毎に分割さ
れ、個々のエッジ画素信号BD3となる。個々のエッジ
画素信号BD3は、各エッジ画素毎の動きベクトルを求
める動きベクトル検出部50に入力される。
【0029】ここで、動きベクトル検出部50の動作説
明に用いるための個々のエッジ画素信号BD3の具体的
な例を図13に示す。
【0030】図13では、2次元の画像信号中に含まれ
る1つのエッジ領域信号BD2を黒い画素D1〜D24で示
し、これら複数の黒い画素で示す領域をエッジ領域EA
1とする。また、このエッジ領域EA1に隣接する2つの
領域AR11、AR12を斜線で示している。領域AR
11は、次フレームにおいて矢印で示す右下方向に移動す
る領域であり、領域AR12は、次フレームにおいて矢印
で示す上方向に移動する領域である。尚、個々のエッジ
画素信号BD3は、図13において個々の画素D1〜D24
で示される。
【0031】また、画素D6を中心に設定される、縦7
画素、横7画素の太い点線内の7×7の矩形領域を探索
領域SA1とし、エッジ領域EA1の周辺に設定される、
縦5画素、横5画素の太い点線内の5×5の矩形領域を
エッジ近傍の窓領域WA1とする。探索領域SA1は、ブ
ロックマッチングの際に予測エッジ領域の中心画素が移
動する範囲を示すものである。また、エッジ近傍の窓領
域WA1は、ブロックマッチングの際の誤差評価に用い
られ、エッジ画素信号BD3を図8の窓領域設定回路5
1に入力して求める。
【0032】窓領域設定回路51においては、エッジ近
傍の窓領域の設定処理を行う。具体的には、窓領域設定
回路51に入力されたエッジ画素から一定の距離内に存
在する画素を探索領域とし、その探索領域SA1内の各
画素を順に注目画素として、この注目画素の周辺領域を
エッジ近傍の窓領域の画素とする。
【0033】このようにして設定された窓領域信号BD
4と、現フレーム信号BD0及び次フレーム信号BD1
を差分値算出回路52に入力する。
【0034】この差分値算出回路52では、窓領域信号
BD4に示される窓領域の各画素において、現フレーム
の画素値と次フレームの画素値との差分の自乗値を求
め、窓領域全体の合計を誤差信号BD5として出力す
る。この誤差信号BD5は、最小誤差検出回路53に入
力され、最小誤差を持つ画素位置を検出する。
【0035】ここで、図14に、現フレームのエッジ画
素のエッジ領域EA1と次フレームの黒色で示すエッジ
画素のエッジ領域EA1´との位置関係を具体的に示
す。
【0036】図14の画素D6において、最小誤差を持
つ窓領域が画素D6´に見つかった場合には、現フレー
ムの画素D6と最小誤差の画素D6´との位置関係を比較
し、移動量として(水平方向,垂直方向)=(2,1)
が求められる。この移動量がエッジ領域EA1の動きベ
クトル信号BD6として、最小誤差検出回路53から出
力される。
【0037】このように、個々のエッジ領域毎に求めら
れた動きベクトル信号BD6は、エッジ画素信号BD3
共に動きベクトルマップ作成部45に入力される。この
動きベクトルマップ作成部45では、個々の画素が持つ
動きベクトルを集計し、フレーム中に存在する全エッジ
領域の動きベクトル信号BD7を作成する。
【0038】このように、超低ビットレートにおける画
像信号符号化を行う際に、原画像の輪郭線を重点的に保
存する符号化方法を用い、この符号化方法を動画像符号
化に適用する場合には、各静止画像中に含まれる輪郭
線、即ちエッジ領域を全てチェーンコーディング等で符
号化すると、情報量が膨大となり、符号化効率が低下し
てしまうので、連続するフレーム内の輪郭線を対応付け
る。対応が付いた輪郭線に対しては、初期値となるフレ
ーム内の輪郭線位置情報のみを送り、以後のフレームで
は移動・変形パラメータ等の形状の差分情報のみを符号
化する。これにより、情報量を削減することができる。
【0039】この場合には、各フレーム中の輪郭線の対
応付けを行う際に、各輪郭線の動きベクトルを求める必
要がある。また、この各輪郭線の動きベクトルを、輪郭
線内部の各エッジ画素の動きベクトルを基に求める場合
には、各画素毎のできるだけ正確な動きベクトルを求め
る必要がある。
【0040】
【発明が解決しようとする課題】ところで、上述のよう
なエッジ領域毎の動きベクトル検出方法においては、ブ
ロックマッチングの際に注目エッジ画素周辺の一定範囲
を窓領域とするとき、対象とするエッジ領域が複数の領
域にまたがっている場合には、誤った動きベクトルを検
出するという問題が生じる。これは、注目エッジ画素の
複数の周辺領域がそれぞれ異なる方向に移動していた場
合に、注目エッジ画素において設定した窓領域内に異な
る動きベクトルを持つ領域が入り、互いに影響し合うこ
とにより、正しい誤差曲面が得られなくなるためであ
る。
【0041】例えば、図13示されるエッジ領域の内の
画素D16において動きベクトル検出を行う際に、画素D
6において示されている5×5の窓領域WA1を設定して
動きベクトル検出を行うとする。このとき、画素D
16は、領域AR11内の画素であるため、求める動きベク
トルとしては、領域AR11の動きを示すことが望まれ
る。しかし、この場合には、窓領域WA1内には領域A
11の画素のみでなく、領域AR12の画素も含まれてし
まう。この結果、領域AR12の画素の動きに影響され、
領域AR11の動きとは異なった動きベクトルが生じてし
まう。
【0042】即ち、エッジ領域検出処理によって求めら
れるエッジ領域は、動きの方向が異なる領域間にまたが
るときがあり、個々のエッジ画素毎に一定の大きさの窓
領域を用いたブロックマッチングを行う動きベクトル検
出方法で、領域の境界に近いエッジ画素の動きベクトル
を求める場合には、設定する窓領域内に複数の画素値情
報が入り、誤った動きベクトルが検出されてしまう場合
がある。
【0043】そこで、本発明は上述の実情に鑑み、画像
中の動きベクトルを求める画素の周辺に動きが異なる領
域が存在する場合にも、正確な動きベクトルを求めるこ
とができる動きベクトル検出装置を提供するものであ
る。
【0044】
【課題を解決するための手段】本発明に係る動きベクト
ル検出装置及び動きベクトル検出方法は、現フレームの
物体又は領域の動きベクトル検出対象となる注目画素に
対して、切換選択可能な複数の動きベクトル検出モード
の内の上記注目画素の周辺領域の特徴に適応した動きベ
クトル検出モードを用いて動きベクトルを検出し、この
動きベクトル及び画素情報を用いて、上記物体又は領域
毎の動きベクトルを求める。
【0045】
【発明の実施の形態】以下、本発明の実施の形態につい
て、図面を参照しながら説明する。
【0046】図1には、本発明に係る動きベクトル検出
方法を用いる動きベクトル検出装置の実施の形態の概略
的な構成を示す。
【0047】この動きベクトル検出装置は、現フレーム
の物体又は領域の動きベクトル検出対象となる注目画素
に対して、切換選択可能な複数の動きベクトル検出モー
ドの内の上記注目画素の周辺領域の特徴に適応した動き
ベクトル検出モードを用いて動きベクトルを検出する動
きベクトル検出手段であるエッジ領域検出部3、エッジ
画素分割部4、及び動きベクトル検出部10と、上記動
きベクトル検出部10からの動きベクトル及び上記エッ
ジ画素分割部4からの画素情報を用いて、上記物体又は
領域毎の動きベクトルを求める動きベクトルマップ作成
手段である動きベクトルマップ作成部5とを有して成
る。
【0048】具体的には、エッジ領域検出部3及びエッ
ジ画素分割部4で、物体の輪郭線を表すエッジ領域を検
出してエッジ画素毎に分割し、上記動きベクトル検出部
10では、上記注目画素に対して、異なる大きさ及び形
状の複数の窓領域をそれぞれ設定し、所定の探索領域内
で、上記複数の窓領域内の各画素について、上記現フレ
ームと上記現フレームの次のフレームとの差分の自乗値
を算出した後に、上記複数の窓領域について最小誤差を
持つ画素をそれぞれ検出し、上記複数の窓領域の最小誤
差を持つ各画素と上記注目画素との間の動きベクトルに
より最適な窓領域を検出して、この最適な窓領域による
動きベクトルを出力する動きベクトル検出モードを用い
る。
【0049】このとき、上記注目画素の周辺領域に類似
の動きベクトルを持つ領域が存在するときには、上記類
似の動きベクトルを持つ領域を含む大きな窓領域を用
い、上記注目画素の周辺領域に異なる動きベクトルを持
つ領域が隣接するときには、上記異なる動きベクトルを
持つ領域よりも近い類似の動きベクトルを持つ領域内の
小さな窓領域を用いる。
【0050】また、上記動きベクトル検出部10では、
上記注目画素からの距離に基づいた重み付けを行う。
【0051】次に、この動きベクトル検出装置の動作に
ついて、以下に詳細に説明する。
【0052】尚、この実施の形態においては、動きベク
トル検出装置が超低ビットレートにおける画像信号符号
化のための動き補償処理部に用いられるものとし、2つ
の物体間にまたがる輪郭線をエッジ領域とし、このエッ
ジ領域における動きベクトルの抽出を行う場合の動作に
ついて述べる。
【0053】まず、物体の輪郭線の保存に重点を置いた
超低ビットレート画像符号化の代表的な手法として、3
CC(3 Component Coding)がある。この3CCとは、
原画像をエッジ部分、輝度情報、及びテクスチャ画像情
報に分割し符号化を行うものである。
【0054】ここで、3CCによるエンコード処理回路
の概略的な構成を図2に示し、また、3CCによるデコ
ード処理回路の概略的な構成を図3に示す。
【0055】図2の3CCによるエンコード処理回路で
は、入力画像信号DD0をローカル光生成/符号化部2
1及びエッジ情報検出/符号化部22に入力する。この
ローカル光生成/符号化部21では、入力画像信号DD
0から画像の大局的な輝度情報を示すローカル光(Local
Luminance)成分を求めて符号化し、出力信号DD1
得る。また、エッジ情報検出/符号化部22では、画像
の輪郭線部分を抽出して符号化し、出力信号DD2を得
る。この出力信号DD1はローカル光信号であり、出力
信号DD2はエッジ情報信号である。
【0056】上記出力信号DD1及び出力信号DD2は、
エッジ情報デコード部23に送られてエッジ画像を再構
成する処理によりエッジ画像信号DD3を得る。このエ
ッジ画像信号DD3と上記入力画像信号DD0との差分を
差分回路24で求め、テクスチャ画像信号DD4を得
る。
【0057】このテクスチャ画像信号DD4は、テクス
チャ画像情報符号化部25に送られて、エントロピー符
号化処理によって符号化され、テクスチャ画像情報信号
DD5が出力される。
【0058】このように、入力画像信号DD0は、最終
的には、符号化されたローカル光信号、符号化されたエ
ッジ情報信号、及び符号化されたテクスチャ画像情報信
号に変換される。
【0059】一方、図3の3CCによるデコード処理回
路では、符号化されたローカル光信号ED1は、デコー
ド処理部31に入力されてデコード処理され、信号ED
4が出力される。
【0060】また、符号化されたエッジ情報信号ED2
は、エッジ情報デコード部32に入力される。このエッ
ジ情報デコード部32には、上記信号ED4も入力され
ている。このエッジ情報デコード部32では、信号ED
4とエッジ情報信号ED2とを用いてデコード処理を行う
ことにより、エッジ再構成画像信号ED5を得る。
【0061】また、符号化されたテクスチャ画像情報信
号ED3は、テクスチャ画像情報デコード部33に入力
されてデコード処理され、テクスチャ画像信号ED6
得る。
【0062】上記得られたエッジ再構成画像信号ED5
及びテクスチャ画像信号ED6を加算回路34において
加算することにより、再構成された画像信号ED7を得
る。
【0063】上述のような3CCによるエンコード処理
及びデコード処理では、物体の輪郭線の保存に重点をお
いて画像の符号化を行っており、同一の情報量でより多
くの輪郭線情報を保存することが再構成された画像の画
質向上となる。このように、3CCを動画像に適用した
場合には、連続するフレームにおいて同一の物体又は領
域に属する輪郭線が、多少の変形や移動を伴いながら存
在することとなる。
【0064】そこで、連続する各フレーム内のエッジの
内、同一の物体上の同一の箇所に存在する輪郭線を対応
付けることにより、対応付けができた輪郭線の情報は、
第1フレームにおける位置情報のみを符号化し、以後の
連続するフレーム内でのエッジ情報は、前フレームの対
応するエッジからの移動量や変形パラメータで表すこと
により、情報量の削減が見込まれる。このときの移動量
や変形パラメータは、エッジ領域中の動きベクトルから
求められる。
【0065】そこで、エッジ領域内の動きベクトルを検
出することが必要になる。このとき、画像中の各画素ま
たはエッジ領域中の各画素において動きベクトルを求め
る際に、注目画素が存在する周囲の状況に合わせて、複
数の動きベクトル検出モードを適応的に使い分ける。
【0066】その際に用いる動きベクトル検出モード
は、領域の形状や大きさに合わせて異なる窓領域の形状
や大きさを適応的に変化させるブロックマッチング法で
ある。
【0067】具体的には、最適なサイズの窓領域を用い
たブロックマッチング法を用いており、注目画素周辺に
動きの異なる領域が存在しない場合には大きな窓領域を
用い、注目画素周辺に他の動きの異なる領域が隣接して
いる場合には、この異なる領域を含まないような小さい
窓領域を用いるものである。
【0068】図1の動きベクトル検出装置において、現
フレームバッファ1及び次フレームバッファ2に格納さ
れる、入力信号として連続する2つのフレーム画像信号
AD0、AD1を用いる。
【0069】まず、処理対象である現フレーム信号AD
0を現フレームバッファ1からエッジ領域検出部3に送
る。
【0070】このエッジ領域検出部3でエッジ抽出処理
により得られたエッジ領域信号AD2は、エッジ画素分
割部4に入力され、個々のエッジ画素毎に分割されて個
々のエッジ画素信号AD3となる。個々のエッジ画素信
号AD3は、各エッジ画素毎の動きベクトルを求める動
きベクトル検出回路10に入力される。
【0071】ここで、動きベクトル検出回路10におけ
る処理動作を、図13に示されるエッジ領域EA1を用
いて具体的に説明する。
【0072】各エッジ画素毎の動きベクトルを求める際
には、注目画素を中心として異なる範囲の窓領域を設定
し、それぞれの窓領域を用いてブロックマッチングを行
う。この際、説明を簡略化するために、探索領域の大き
さは一定とする。
【0073】この動きベクトル検出回路10では、異な
るサイズの矩形の窓領域でブロックマッチングを行う。
まず、エッジ画素信号AD3が、それぞれ異なるサイズ
の矩形の窓領域を設定する窓領域設定回路111、1
2、113、・・・にそれぞれ入力される。窓領域設定
回路111、112、113、・・・では、注目画素周辺
にそれぞれ3×3、5×5、7×7、・・・の窓領域を
設定する窓領域信号AD41、AD42、AD43、・・・が
それぞれ生成される。これらの窓領域信号AD41、AD
42、AD43、・・・は、現フレーム信号AD0及び次フ
レーム信号AD1と共に、差分値算出回路121、1
2、123、・・・にそれぞれ入力される。
【0074】差分値算出回路121、122、123、・
・・では、窓領域信号AD41、AD4 2、AD43、・・・
に示される窓領域内画素の各画素において、現フレーム
の画素と次フレームの画素値との差分の自乗値をそれぞ
れ求め、エッジ近傍窓領域全体の合計を誤差信号A
51、AD52、AD53、・・・としてそれぞれ出力す
る。但し、誤差信号AD51、AD52、AD53、・・・
は、図13の探索領域SA1の各画素に対して求めるも
のとする。
【0075】これらの誤差信号AD51、AD52、A
53、・・・は、最小誤差検出回路131、132、13
3、・・・にそれぞれ入力され、最小誤差を持つ画素位
置を検出する。最小誤差を持つエッジ画素の位置と注目
画素との移動量が、そのエッジ画素の動きベクトル信号
AD61、AD62、AD63、・・・となる。
【0076】異なるサイズの窓領域を用いて求められた
動きベクトル信号AD61、AD62、AD63、・・・は、
最適窓領域検出回路14に入力され、注目画素において
最も有効な窓領域のサイズから得られた動きベクトルを
選択する。
【0077】ここで、最適窓領域検出回路14における
最適窓領域の決定方法を、図4及び図5を用いて具体的
に説明する。
【0078】ある注目画素における検出された動きベク
トルを窓領域のサイズ順に列挙した場合に、窓領域のサ
イズが変わることによる動きベクトルの変化特性として
は、大きく分けて2つの場合が考えられる。その代表的
な例を、図4A及び図5Aに示す。この図4A及び図5
Aの縦軸は動きベクトルを1次元に射影したときの値を
示し、横軸は窓領域の大きさを示す。
【0079】まず、図4Aに示す変化特性では、小さい
窓領域を用いた場合、即ち窓領域SW1の範囲では極小
解に陥りやすいため、得られる動きベクトルが安定しな
いが、一定のサイズ以上になった場合、即ち窓領域MW
1の範囲では、領域BS11の範囲で正確な動きベクトル
が得られるようになる。しかし、さらに大きな窓領域を
用いた場合、即ち窓領域LW1の範囲では異なった動き
ベクトルを持つ近傍の領域が窓領域内に入ってしまうた
め、再び正確な動きベクトルが求められなくなる。
【0080】そこで、最適窓領域検出回路14では、窓
領域MW1の範囲を選択するために、図4Aに示された
動きベクトル列に対し、(1,−1)のHPFを用いて
差分値を求める。
【0081】この差分値の変化を窓領域の大きさ順に列
挙したものを図4Bに示す。
【0082】図4Bの小さい窓領域SW1を用いた場合
には動きベクトルが安定しないため、差分値が連続して
大きな値を示すが、それ以上の大きさの窓領域MW1
用いた場合には、差分値が小さくなる。その後、さらに
大きな窓領域LW1を用いた場合には、この窓領域LW1
の範囲と上記窓領域MW1との境界で、再び大きな差分
が得られる。そこで、窓領域の大きい場合から差分値を
求め、最初の極大点と次の極大点の間にある領域BS12
の範囲の窓領域のサイズを最適サイズとみなす。
【0083】次に、図5Aに示す変化特性のように、小
さい窓領域SW2を用いた場合の極小解により動きベク
トルが安定しない範囲と、一定のサイズ以上の窓領域M
2を用いた場合の正確な動きベクトルが得られる範囲
しか存在しない場合には、動きベクトルの差分値を求め
ると、図5Bのように小さい窓領域SW2の範囲におい
てのみ差分値が大きくなる。このような場合は、注目画
素の近傍に動きの異なる領域が存在しないと考えられる
ため、図5Bの窓領域MW2の範囲のように窓領域を大
きくとることができる。よって、図5Bの差分値が大き
な値を示す窓領域SW2より大きな窓領域MW2を最適サ
イズと見なす。このときの領域BS22の範囲が最適サイ
ズを示す。
【0084】このような可変ブロックサイズのブロック
マッチングを図13に示すエッジ領域EA1に対して用
いた場合に、画素D5、画素D16、画素D21において選
択された窓領域のサイズを図6に示す。
【0085】図6の画素D5のような動きの異なる領域
の境界部分から遠いエッジ画素においては、7×7のサ
イズの大きな窓領域WA5を用いるが、境界に近づくに
つれて窓領域は小さくなり、画素D21では5×5の中程
度のサイズの窓領域WA16を用い、画素D16では3×3
の最小のサイズの窓領域WA16を選択していることが分
かる。
【0086】これにより、画素D5のように動きの異な
る領域が近傍にない場合は、大きな窓領域を用いること
により、大局的で正確な動きベクトルを求めることがで
き、動きの異なる領域の境界に近づくにつれ、異なる動
きの領域を含まない小さな窓領域を用いることにより、
局所的ではあるが、ほぼ正確な動きベクトルを求めるこ
とができる。
【0087】上述の処理を最適窓領域検出回路14で行
うことにより、最適な窓領域サイズを用いて得られた動
きベクトル信号AD7を得ることができる。この動きベ
クトル信号AD7は、エッジ画素信号AD3と共に、動き
ベクトルマップ作成部5に入力され、エッジ領域毎にま
とめられた動きベクトル信号AD8が出力される。
【0088】エッジ領域毎の動きベクトル信号AD
8は、動きベクトル調整部6に入力されて、類似する動
きベクトルを持つ領域いわゆるセグメント毎に分割され
ることにより、各々のセグメント毎の代表ベクトル信号
AD9が出力される。
【0089】このように、可変ブロックサイズの動きベ
クトル検出を行うことにより、動きの異なる領域が近傍
にない場合は、大きな窓領域を用いて大局的で正確な動
きベクトルを求めることができ、動きの異なる領域の境
界に近づくにつれ、動きの異なる領域を含まない小さな
窓領域を用いて、局所的ではあるがほぼ正確な動きベク
トルを求めることができる。
【0090】また、ブロックマッチングを用いて動きベ
クトル検出を行う際に、窓領域の大きさや形状を変化さ
せても、極小解の影響により正確な動きベクトルが求め
られない場合には、誤差曲面への注目画素からの距離を
考慮に入れた重み付け処理を用いることが考えられる。
【0091】ここで、誤差曲面への重み付け係数の具体
的な例を図7に示す。
【0092】この図7に示す重み付け係数を、ブロック
マッチングの際に探索領域SAの画素毎に得られる誤差
値に対して掛け合わせる。これにより、極小解による動
きベクトルのばらつきを押さえることができる。従っ
て、動きベクトル調整部6において類似する動きベクト
ルを持つセグメント毎に分割したり、各々のセグメント
毎の代表ベクトル信号AD9を求めたりする際に、不適
当な分割箇所や代表ベクトルの誤差を減らすことができ
る。
【0093】
【発明の効果】以上の説明からも明かなように、本発明
に係る動きベクトル検出装置及び動きベクトル検出方法
は、現フレームの物体又は領域を検出して、この物体又
は領域を画素毎に分割し、上記物体又は領域の動きベク
トル検出対象となる注目画素に対して、切換選択可能な
複数の動きベクトル検出モードの内の上記注目画素の周
辺領域の特徴に適応した動きベクトル検出モードを用い
て動きベクトルを検出し、この動きベクトル及び画素情
報を用いて、上記物体又は領域毎の動きベクトルを求め
ることにより、異なる動きベクトルを持つ領域が近傍に
存在する場合においても、可変ブロックサイズの動きベ
クトル検出方法を用いるので、動きの異なる領域が近傍
にない場合には、大きな窓領域を用いることにより大局
的で正確な動きベクトルを求めることができ、また、動
きの異なる領域の境界に近づくにつれ、動きの異なる領
域を含まない小さな窓領域を用いることにより、局所的
ではあるが、ほぼ正確な動きベクトルを求めることがで
きる。これにより、連続するフレーム内のエッジ領域の
対応付けの際に、対応付けが成功するエッジ領域の割合
が増し、符号化効率を高めることができる。
【図面の簡単な説明】
【図1】本発明に係る動きベクトル検出装置の実施の形
態の概略的な構成図である。
【図2】3CCのエンコード処理回路の概略的な構成図
である。
【図3】3CCのデコード処理回路の概略的な構成図で
ある。
【図4】第1の画素単位の可変ブロックサイズのブロッ
クマッチングを説明するための図である。
【図5】第2の画素単位の可変ブロックサイズのブロッ
クマッチングを説明するための図である。
【図6】エッジ領域と可変ブロックサイズブロックマッ
チングとによる窓領域を示す図である。
【図7】誤差局面に対する重み付け係数を示す図であ
る。
【図8】従来の動きベクトル検出装置の実施の形態の概
略的な構成図である。
【図9】エッジ領域検出部の概略的な構成図である。
【図10】ソーベルフィルタのタップ係数を示す図であ
る。
【図11】1次元のマスク領域を示す図である。
【図12】閾値関数を示す図である。
【図13】エッジ領域及び周辺領域を示す図である。
【図14】現フレーム及び次フレームの各エッジ領域の
位置を示す図である。
【符号の説明】
1 現フレームバッファ 2 次フレームバッファ 3 エッジ領域検出部 4 エッジ画素分割部 5 動きベクトルマップ作成部 6 動きベクトル調整部 10 動きベクトル検出部 111、112、113 窓領域設定回路 121、122、123 差分値算出回路 131、132、133 最小誤差検出回路 14 最適窓領域検出回路

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】 現フレームの物体又は領域の動きベクト
    ル検出対象となる注目画素に対して、切換選択可能な複
    数の動きベクトル検出モードの内の上記注目画素の周辺
    領域の特徴に適応した動きベクトル検出モードを用いて
    動きベクトルを検出する動きベクトル検出手段と、 上記動きベクトル検出手段からの動きベクトル及び画素
    情報を用いて、上記物体又は領域毎の動きベクトルを求
    める動きベクトルマップ作成手段とを有して成ることを
    特徴とする動きベクトル検出装置。
  2. 【請求項2】 上記動きベクトル検出手段では、上記物
    体の輪郭線を表すエッジ領域を検出してエッジ画素毎に
    分割することを特徴とする請求項1記載の動きベクトル
    検出装置。
  3. 【請求項3】 上記動きベクトル検出手段では、上記注
    目画素に対して、異なる大きさ及び形状の複数の窓領域
    をそれぞれ設定し、所定の探索領域内で、上記複数の窓
    領域内の各画素について、上記現フレームと上記現フレ
    ームの次のフレームとの差分の自乗値を算出した後に、
    上記複数の窓領域について最小誤差を持つ画素をそれぞ
    れ検出し、上記複数の窓領域の最小誤差を持つ各画素と
    上記注目画素との間の動きベクトルにより最適な窓領域
    を検出して、この最適な窓領域による動きベクトルを出
    力する動きベクトル検出モードを用いることを特徴とす
    る請求項2記載の動きベクトル検出装置。
  4. 【請求項4】 上記動きベクトル検出手段では、上記注
    目画素の周辺領域に類似の動きベクトルを持つ領域が存
    在するときには、上記類似の動きベクトルを持つ領域を
    含む大きな窓領域を用い、上記注目画素の周辺領域に異
    なる動きベクトルを持つ領域が隣接するときには、上記
    異なる動きベクトルを持つ領域よりも近い類似の動きベ
    クトルを持つ領域内の小さな窓領域を用いることを特徴
    とする請求項3記載の動きベクトル検出装置。
  5. 【請求項5】 上記動きベクトル検出手段では、上記注
    目画素からの距離に基づいた重み付けを行うことを特徴
    とする請求項2記載の動きベクトル検出装置。
  6. 【請求項6】 現フレームの物体又は領域の動きベクト
    ル検出対象となる注目画素に対して、切換選択可能な複
    数の動きベクトル検出モードの内の上記注目画素の周辺
    領域の特徴に適応した動きベクトル検出モードを用いて
    動きベクトルを検出する動きベクトル検出工程と、 上記動きベクトル及び画素情報を用いて、上記物体又は
    領域毎の動きベクトルを求める動きベクトルマップ作成
    工程とから成ることを特徴とする動きベクトル検出方
    法。
  7. 【請求項7】 上記動きベクトル検出工程では、上記物
    体の輪郭線を表すエッジ領域を検出してエッジ画素毎に
    分割することを特徴とする請求項6記載の動きベクトル
    検出方法。
  8. 【請求項8】 上記動きベクトル検出工程では、上記注
    目画素に対して、異なる大きさ及び形状の複数の窓領域
    をそれぞれ設定し、所定の探索領域内で、上記複数の窓
    領域内の各画素について、上記現フレームと上記現フレ
    ームの次のフレームとの差分の自乗値を算出した後に、
    上記複数の窓領域について最小誤差を持つ画素をそれぞ
    れ検出し、上記複数の窓領域の最小誤差を持つ各画素と
    上記注目画素との間の動きベクトルにより最適な窓領域
    を検出して、この最適な窓領域による動きベクトルを出
    力する動きベクトル検出モードを用いることを特徴とす
    る請求項7記載の動きベクトル検出方法。
  9. 【請求項9】 上記動きベクトル検出工程では、上記注
    目画素の周辺領域に類似の動きベクトルを持つ領域が存
    在するときには、上記類似の動きベクトルを持つ領域を
    含む大きな窓領域を用い、上記注目画素の周辺領域に異
    なる動きベクトルを持つ領域が隣接するときには、上記
    異なる動きベクトルを持つ領域よりも近い類似の動きベ
    クトルを持つ領域内の小さな窓領域を用いることを特徴
    とする請求項8記載の動きベクトル検出方法。
  10. 【請求項10】 上記動きベクトル検出工程では、上記
    注目画素からの距離に基づいた重み付けを行うことを特
    徴とする請求項7記載の動きベクトル検出方法。
JP24496195A 1995-09-22 1995-09-22 動きベクトル検出装置及び動きベクトル検出方法 Pending JPH0993585A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP24496195A JPH0993585A (ja) 1995-09-22 1995-09-22 動きベクトル検出装置及び動きベクトル検出方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP24496195A JPH0993585A (ja) 1995-09-22 1995-09-22 動きベクトル検出装置及び動きベクトル検出方法

Publications (1)

Publication Number Publication Date
JPH0993585A true JPH0993585A (ja) 1997-04-04

Family

ID=17126535

Family Applications (1)

Application Number Title Priority Date Filing Date
JP24496195A Pending JPH0993585A (ja) 1995-09-22 1995-09-22 動きベクトル検出装置及び動きベクトル検出方法

Country Status (1)

Country Link
JP (1) JPH0993585A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1255241A1 (en) * 2001-04-24 2002-11-06 Nec Corporation Image display method in transmissive-type liquid crystal display device and transmissive-type liquid crystal display device
JP2010081634A (ja) * 2002-12-20 2010-04-08 Lsi Corp 並列補間及びサーチ・ハードウェアを備えた運動評価エンジン
US8482619B2 (en) 2005-12-26 2013-07-09 Nikon Corporation Image processing method, image processing program, image processing device, and imaging device for image stabilization

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1255241A1 (en) * 2001-04-24 2002-11-06 Nec Corporation Image display method in transmissive-type liquid crystal display device and transmissive-type liquid crystal display device
US7173599B2 (en) 2001-04-24 2007-02-06 Nec Lcd Technologies Ltd. Image display method in transmissive-type liquid crystal display device and transmissive-type liquid crystal display device
JP2010081634A (ja) * 2002-12-20 2010-04-08 Lsi Corp 並列補間及びサーチ・ハードウェアを備えた運動評価エンジン
US8482619B2 (en) 2005-12-26 2013-07-09 Nikon Corporation Image processing method, image processing program, image processing device, and imaging device for image stabilization

Similar Documents

Publication Publication Date Title
JP5124562B2 (ja) テクスチャレベルに基づく量子化調整
US6226050B1 (en) Signal adaptive filtering method for reducing ringing noise and signal adaptive filter
JP5039777B2 (ja) Dcシフトアーチファクトに対する量子化調整
KR100578682B1 (ko) 가변 블록 크기를 이용한 계층적 움직임 추정 장치 및방법
US6983079B2 (en) Reducing blocking and ringing artifacts in low-bit-rate coding
KR101437195B1 (ko) 코딩된 화상 및 영상에서 블록 아티팩트 검출
EP0740473A2 (en) Apparatus for encoding a video signal using feature point based motion estimation
US20070237237A1 (en) Gradient slope detection for video compression
CN111988611B (zh) 量化偏移信息的确定方法、图像编码方法、装置及电子设备
KR20010033797A (ko) 스케일 가능한 계층적 움직임 추정을 실행하는 장치 및방법
US20070237221A1 (en) Adjusting quantization to preserve non-zero AC coefficients
KR100308016B1 (ko) 압축 부호화된 영상에 나타나는 블럭현상 및 링현상 제거방법및 영상 복호화기
JPH08186714A (ja) 画像データのノイズ除去方法及びその装置
WO2002093935A1 (en) Image processing apparatus
JP2003018599A (ja) 画像符号化装置および方法
US11928843B2 (en) Signal processing apparatus and signal processing method
US8340404B2 (en) Image processing device and method, learning device and method, program, and recording medium
Fracastoro et al. Predictive graph construction for image compression
JP3081412B2 (ja) 画像信号復号器
JPH0993585A (ja) 動きベクトル検出装置及び動きベクトル検出方法
JP3736291B2 (ja) 画像信号復号化装置および方法
KR100203695B1 (ko) 물체 기반 부호화에 있어서의 텍스쳐 분류를 위한 전처리 장치
JPH11298898A (ja) ブロック歪低減回路
JPH0993584A (ja) 動きベクトル検出装置及び動きベクトル検出方法
JPH0448310B2 (ja)

Legal Events

Date Code Title Description
A02 Decision of refusal

Effective date: 20040330

Free format text: JAPANESE INTERMEDIATE CODE: A02