JP2000512827A - 像間動き評価方法 - Google Patents

像間動き評価方法

Info

Publication number
JP2000512827A
JP2000512827A JP10529373A JP52937398A JP2000512827A JP 2000512827 A JP2000512827 A JP 2000512827A JP 10529373 A JP10529373 A JP 10529373A JP 52937398 A JP52937398 A JP 52937398A JP 2000512827 A JP2000512827 A JP 2000512827A
Authority
JP
Japan
Prior art keywords
motion
image
region
function
minimizing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10529373A
Other languages
English (en)
Inventor
ジャナン シルヴィ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Philips Electronics NV filed Critical Philips Electronics NV
Publication of JP2000512827A publication Critical patent/JP2000512827A/ja
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/14Picture signal circuitry for video frequency region
    • H04N5/144Movement detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Image Analysis (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

(57)【要約】 本発明は、ラベルで識別される1個の領域Riからなる一連の分割像もしくは分割像部分を形成する像相互間の動きの評価方法および評価装置に関するものである。この評価方法は、各領域Riの動きパラメータを初期化する過程、動き評価を施す像の中間処理過程、および、領域Riの全画素に対しベクトル(Dx,Dy)の形で動きパラメータを最小的に決定する反復精練過程からなっている。この精練過程は、関連関数の最小化により各物体の予測誤差を最小化する処理を含め、最も代表的な点を選択し、その他の点は門外漢として排除し得るようにする。用途:超低ビットレート符号化、多媒体用途。

Description

【発明の詳細な説明】 像間動き評価方法 本発明は、各領域Ri毎に、先行像P(t−1)に対する現下像P(t)の動 きを表す情報Mi(t)を供給するために、現下像の各領域毎に行なうつぎの動 作: (1)分割前の像P(t−1),P(t)および分割後の像S(t−1),S (t)と先行過程において先行像P(t−1)につき評価した動き情報Mi(t −1)との関係としてP(t)の各領域の動きパラメータを初期化する第1過程 、 (2)動き評価が行なわれる像群の中間処理の第2過程、および、当該領域の 各座標点(x,y)につきL( )が輝度その他のビデオ信号を指し、Dx,D yが当該領域の動きの型に関連した次数の多項式である場合にL(x,y,t) =L(x−Dx,y−Dy,t−1)となるようにして、各領域Riの全画素に つき、ベクトル(Dx,Dy)の形で動きパラメータの最終決定をする第3過程 、 (3)最終的に動き情報を得るための、少なくとも所定の基準の関数としての 反復過程の終端までの中間処理の第2過程および精練の第3過程の反復 を含み、ラベルで識別されるI個の領域Riからなる分割像もしくは分割像部分 の系列P(t−n),P(t−n+1),・・・,P(t−2),P(t−1) ,P(t)・・・を形成して系列S(t−n),S(t−n+1),・・・,S (t−2),S(t−1),S(t)・・・の形で利用し得る像相互間の動きを 評価する方法に関するものである。 本発明は、また、上記方法を実行するための装置に関するものである。 本発明は、超低ビットレートの分野および低ビットレートから毎秒約1メガビ ットまでの分野においてビデオ信号を符号化するのに好適である。かかるビット レートの領域は、屡々多媒体用途と呼ばれる消費者用途に顕著に対応する。 欧州特許出願公報EP077115には、主たる特性が下文に再現するような 方法および装置が記載されている。その再現の前に、本記載を通して使用する記 号をまず示しておく。ここで考慮する像群は、P(t−n),P(t−n+1) , ・・・,P(t−2),P(t−1),P(t)等と表示する概略像の原系列の 一部をなす。焦点は、主として、現下の像P(t)および先行現像(すなわち、 動き評価の後に行なう符号化処理の特性に従って先に符号化した像)P(t−1 )に向けられる。実際には、時点tで両者間の動き評価が行なわれる2画像(P (t−1)およびP(t)は、いまのところは輝度信号とするが、色彩が多くの 特定情報を含んでいる場合には輝度と色度との組合わせとすることもでき、ある いは、信号の情報を再現する他の任意の原像に変換することもできる。像P(t −2),P(t−1),P(t)等の一つの任意の点(x,y)の輝度の値はL (x,y,t−2),L(x,y,t−1),L(x,y,t)等と表す。像群 を分割する動作に関して、(部分像とも呼ぶ)一連のラベル像は、原像の系列に 対応するものであり、一方、分割像群は、s(t−2),S(t−1),S(t )等と呼び、原概略像P(t−2),P(t−1),P(t)等に対応するもの であって、最終的には、動き評価方法を実行するに必要な前分析から生ずる一連 のある種の像を形成する。図1は、i=0〜6とした7個の領域Riに像を分割 する例を示したものである。 先行像P(t−1)に対する現下像P(t)の動きに関する情報は、像P(t )の領域Riに関する基準Mi(t)のもとに構成される。この基準Mi(t)は 、保留された動きの種類(すなわち、その動きを表す多項式の順序もしくは次数 )で構成されるデータおよび対応するパラメータ(すなわち、多項式の係数の値 )を含んでいる。例えば、図2に示すように、DxおよびDyが動きパラメータ を係数とした多項式をなすP(t−1)からP(t)への変位ベクトル(Dx, Dy)は、像P(t)の領域Riの点(x,y)における像P(t−1)と像P (t)との間で決まる動きの種類に対応する。これは、L(x,y,t)=L( x−Dx,y−Dy,T1)と書くことができる。この多項式の次数(0,1, もしくは2)およびかかる次数を決める係数(2乃至12のパラメータ)は、つ ぎのように、目下の動きの種類によって決まる。 (a)像に平行な平面における像に平行な平坦面の変換を規定するには2個の パラメータで足りる。 Dx=a1 Dy=a2 (b)ズームやパンなどの動きについては、像の面に平行な平坦面の変換の動 きを模するには、その平坦面が任意の方向をもち、あるいは、像の面に平行なそ の平坦面が任意の変換運動を行なう場合には、4個のパラメータが必要である。 Dx=a1+a2x+a3y Dy=a4−a3x+a2y (c)関連変換については、上記(b)に示したような変換運動、もしくは、 像の面に垂直の軸の周りの平坦面の回転運動を模するには6個のパラメータが必 要である。 Dx=a1+a2x+a3y Dy=a4−a5x+a6y (d)二次元運動については、弯曲面の任意の回転および変換を模するには1 2個のパラメータが必要である。 Dx=a1+a2x+a3y+a42+a5xy+a62 Dy=a7+a8x+a9y+a102+a11xy+a122 かかる多項式モデルは、物体の動きを満足に表すことを示し得るので採用された ものである。しかしながら、かかる多項式モデルは、物体の実際の三次元運動の 厳密な記述としては説明し得ない。その目的に対しては、物体が硬く、事実では ないが形状が既知である、という確信をもつことが必要である。問題のモデルは 、したがって、単に、像平面における物体の投影の変形を表したものに過ぎない (例えば、2個のパラメータの場合には、問題の物体が硬く、像平面に平行な表 面を有しているものとして、このモデルは像平面における変換を効果的に表す) 。かかる運動モデルの詳細な表現は、例えばJ.L.デューグレイ.H.サンソ ン共著の論文「像系列における2Dおよび3D運動モデル識別の差分方法」像通 信誌、7巻1号、1995年3月、105〜127頁に与えられている。 像における点の座標は、本説明を通じ、像のみに関する全体的記号について表 現するか、像の所定領域に関する局部的記号について表現するかに応じて大文字 (X,Y)もしくは小文字(x,y)で表される。 その場合に、動き評価の目標は、分割像S(t)、先行像P(t−1)に対応 した先行蓄積像R(t−1)および動き評価の期間中に得た情報Mi(t)にそ れぞれ基づいて、現下像P(t)の概略を構成する予測像R(t)を順次に蓄積 する可能性をもたらすことにあることを想起するのも有用である。かかる予測像 R(t)の決定は、予測誤差のみ、すなわち、P(t)とR(t)との差のみを 符号化する次の可能性を取り分けもたらす。 先に引用した文献に記載の方法は、図3を参照して詳細に説明することができ る。図3には、動きパラメータを初期化する第1段階(INIT)10、前処理 の第2段階(PPRO)20および動きパラメータを精錬する第3段階(REF T)30を順次に備えてあり、各段階は現下像の各領域について行なわれる。 動きパラメータを初期化する第1段階10は、考察中の像P(t)の各領域Ri に対する動きパラメータ値をもって動き評価の過程を開始する目的を有してお り、そのパラメータ値は、直面する処理過程を通じ、動きパラメータの変化は小 さいと想定し得るようにするために、パラメータの最終真値になるべく近いもの とする。そのうえに、所定の評価品質を得るために必要な実施時間は、求める真 値により近いパラメータ値によって評価過程を開始すれば、平均してより短くな り、評価自体の実施時間に対し、第1初期化段階に付加する実施時間は無視し得 るものとなる。後述するように反復して行なわれる処理動作の過程で、初期値が 求める真値から離れ過ぎているほど生ずる機会が多いような、局所的最小値への 収斂が生じ得ることは避けるべきである。 この第1段階は、(A),(B)および(C)と呼び、像P(t)の各領域Ri 毎に行なうつぎの3副段階からなっている。 (A)入力端で始めに利用し得る情報をできるだけ引出し、可能な動きの仮説 を引き出すために新たな情報をできるだけ集める。 (B)(後述する)動きの仮説のそれぞれに対し、先行像P(t−1)に対す る既知のデータに基づき、現下像P(t)における当該領域を予測して、対応す る予測誤差を計算する。 (C)(特定の動きの仮説を同時に有効とする)最小予測誤差を発生させるパ ラメータ値を動きパラメータの初期値として選択する。 初期化(INIT)段階10の第1副段階(A)は、つぎのような初期データ の探索からなっている。 (a)原先行像P(t−1)および原現行像P(t) (b)ラベルS(t−1)およびS(t)の像 (c)データMi(t)、すなわち、動きが零の場合を含み、先行周期の期間 に(すなわち、像P(t−2)に基づき)像P(t−1)に至る動きを知り得る ようにする動き情報(動きの種類および対応するパラメータの値) (d)P(t−1)とP(t)との間の(上述した)BMA技術の実施から生 ずるデータ、すなわち、P(t)の各画素に対して、一般にほぼ1画素分(ある いは恐らくほぼ半画素分)だけ決まる変位ベクトル 像P(t)の各領域Riについては、系統的説述の相補性および単純性を利用 可能情報の見地から考慮して、先行像に対するつぎの4通りの動きの仮説を順次 にこの場合の考慮に入れて来た。 (1)領域Riの動きは零である。 (2)先行分割像S(t−1)に既存の考慮中のラベルiおよび領域の動きは 、像平面に平行な変換に過ぎず、したがって、分割像S(t−1)とS(t)と におけるラベルiの重心の座標、ついで、変位ベクトルが得られるかかる座標間 の差を計算すれば十分である。 (3)考察中のラベルiは先行分割像S(t−1)に既に存在しており、jは 分割像S(t−1)におけるiの近傍の各ラベルを表し、データMi(t−1) とMj(t−1)とはiに組合わせた局部記号で表され、分割像S(t−1)内 のiの近傍のラベルj全部が探索され、ついで、対応するデータMj(t)(動 きの種類および局部記号に変換された対応するパラメータの値)が読み出され、 さらに、ラベルiとその近傍のラベル群との間の最良の動きが選ばれる。 (4)考察中の動きは、領域毎のBMA技術の適用から生ずる変位ベクトル( 考察中の領域iに含まれる個数の半分以上のブロック群について計算される変位 のみ)の分野における最良の近似に対応するものであり、その適用は、可変寸法 を有するブロック群の一連の変換動きの評価と、より複雑なモデルにより、回帰 技術の助けを借りて、引き続きベクトルの分野の近似を決定するための軽減とか らなっている(一組の値から多項式を適応させるこの方法は、例えば、概略像の 符号化のために、M.ギルゲ、T.エルゲルハルト、R.メーラン共著の論文「 任意形状像片の一般化した正規変換に基づく符号化」信号処理・画像通信誌、第 1巻、第2号、1989年10月、153〜180頁に記載された多項式近似方 法に似ているが、この例に限るものではない)。 初期化INITのための段階10の第2副段階(B)は、先行像P(t−1) に基づき、副段階(A)で行なわれた動きの仮説を考慮して、現下像P(t)の 対応する領域を予測することと、ついで、その都度、領域に対する予測誤差を計 算することからなっている。つぎの予測原理が用いられ、P(t−1),S(t )およびMi(t)が既知であれば、現下像P(t)の予測輝度は画素の座標( X,Y)で決まる。予測の詳細説明は、下文の精練を処理する部分で動きパラメ ータの最終評価について行なわれよう。 最後に、初期化INITのための段階10の第3副段階(C)は、領域におい て計算した予測誤差の比較と、最小予測誤差が対応する動きのその領域の初期動 きとしての留保とからなっている。この過程は各領域について繰り返され、第1 の初期化段階10は、このようにして現下像P(t)の全領域について動きパラ メータを調整し終えたときに終了する。領域Riにつきこのようにして決まった 第2の中間処理段階20は、第3の最終段階の終端で得られる最終動きパラメ ータの評価を容易にする目的を有している。これは可能性に過ぎないが、この目 的を達成するための本質的な処理動作は、理論的理想値(すなわち第1次関数) に近づけるように、すなわち、評価過程の収斂を得るために論理が必要とする数 学的仮説を証明するように輝度信号を修正することである。この処理動作は、例 えば、(S(t−1),S(t),Mi(t)は修正されていない)平面の4方 向における等方性ガウス・フィルタの使用によるP(t−1)およびP(t)の 濾波からなっている。このフィルタの選択は、像の輝度信号を簡単化し、局部最 小をできるだけ避けることにより収斂を容易にするのに有用な輪郭の円滑化と像 の輪郭の十分な局部化の維持との間の極めて良好な妥協を確実にする(評価する 動きの精細度を十分にするために像の十分な詳細を保持するのが望ましい)。濾 波した像群は、記号P’(t−1)およびP’(t)によって図3に表されてい る。段階20で実現されるこの前処理動作の後に利用し得る動きパラメータの組 動きパラメータを精練する反復性の第3段階30は、当該領域に対する動きパ ラメータの最終評価を行なう目的を有している。この段階で行なわれる反復性過 程は、所定の判定基準で、例えば予め定めた反復回数に到達したときに(先行動 き評価を許す動き補償中に十分な品質に到達したとき、あるいは、新たな反復に よる改善が無視し得る程度になったときの反復の停止など他の判定基準、さらに は、複数基準の組合わせも提案される)、所定の判定基準で終了する。 現下像P(t)の各領域についてベクトル(Dx,Dy)を探索して、その領 域の各点につき、DxおよびDyが当該領域に対する動きの種類に関連した次数 の多項式である場合にL(x,y,t)=L(x−Dx,y−Dy,t−1)と なるようにすることを想起すべきである。左右両辺の項L( )間の同等性は、 動き評価の品質に応じ、多かれ少なかれ近似的に実現し得るに過ぎない。かかる 近似をできるだけ満足なものにするために、使用する判定基準は、最小二次誤差 を判定するためのものにする。すなわち、当該領域Riの画素群の座標に対応す る値をとる全てのxおよびyにつき、つぎの式(1)で表す当該領域の画素群に おける予測誤差の自乗値の和を最小にする。 Σ(L(x,y,t)−L(x−Dx,y−Dy,t−1))2 (1) この式(1)は、つぎの式(2)のように短縮した形で表される(DFD=変位 フレーム差)。 Σx,y(DFD(x,y,Dx,Dy))2 (2) dxおよびdyがそれぞれDxoおよびDyoに対して極めて小さいときにDx= (Dxo+dx)およびDy=(Dyo+dy)とするガウス−ニュートン方法に より、(式(2)による)かかる数学的最小化処理が顕著に行なわれることが知 られている。一次展開により、つぎの式(3)が得られる。 最小化すべき式(1)は、したがって、つぎの式(4)のようになる。 この式(4)において、n個の未知量を用いたn個の等式の組となる動きパラメ ータに対するこの式の最小値を特徴づけるために、dxおよびdyの係数にそれ ぞれに対する導関数を零に等しくして消去する。 かかる等式の組の解答は、最小の二次誤差に到達する動きパラメータの変形で ある。この解答は、つぎの式(5)のように、マトリックス形式で表される。 [A].[x]=[B] (5) ベクトルxは、探求したパラメータ群を表し、マトリックスの各項は、現下像の 画素群の座標、(先行像における)画素群の座標位置に対して水平および垂直の 勾配並びに現下像および先行像におけるかかる座標位置での輝度値によって決ま る。分割像S(t)の各領域Riに対し、反復の都度、マトリックスAとBとは 構成されなければならず、マトリックスAは反復されなければならず、このよう にして得られた反復マトリックスはベクトル解答Xを得るためにマトリックスB を乗算されなければならず、したがって、(領域Riに対する)動き情報は、そ のベクトル解答xの各成分をこの動き情報の先行式に加算することにより更新す ることができる。 マトリックスAを構成するには、現行像における座標点の先行位置に対応する 先行像における座標点について輝度値が計算されなければならず、現下像におけ るかかる前述点の動きおよび位置は既知であり、それは下記の予測動作であるが 、同様の点における水平勾配および垂直勾配が計算されなければならない。かか る計算は、局部記号で表した(すなわち、その領域に関連したパラメータの値に ついて行なわなければならない。各領域については、2組のパラメータ、すなわ ち、 蓄積される。精練段階30の始点では、かかる2組の動きは、処理済みパラメー は、反復して精練され、各反復の終端毎に、検討中の領域に対するつぎの動き、 その領域に対応する局部記号に再変換される、分割像S(t)におけるiの近傍 (t)に置換される。最後に、このようにして保有された動きは、近隣領域に向 かって伝搬を起こすことができ、かかる近隣領域に対しては、その動きに基づく 最小予測誤差の探索が取り戻され、かかる探索は、最小の予測誤差に効果的に到 達する場合などに選ばれる。精練段階の出力端では、分割像S(t)の各領域i について判定された動き情報が中間処理段階20の入力端に向かって送出される つぎに、マトリックスAの構成に必要な予測動作を説明する。座標(X,Y) の画素について、予測により、L(X,Y,t)で表す、この座標位置での時点 tにおける予測輝度値のS(t),P(t−1)およびM(t)に基づく判定が 可能となる。像の各点で行なわれるこの予測動作は、つぎの2段階からなってい る。 (a)時点(t−1)におけるこの画素の非整数座標の計算: −座標位置(X,Y)におけるラベルS(t)の像の読取りによる、その画素 が属する領域のラベルiの探索; −その画素について、そのラベルに対するMi(t)の読取りによる動き情報 (動きの種類およびパラメータの値)の選択; −座標の関数としての画素の変位(Dx,Dy)、動きの種類およびその領域 のパラメータ群の値の計算(例えば、6個のパラメータが存在する関連運動の場 合に、動きパラメータを全体記号によって表したときには(Dx,Dy)=(a1 +a2X+a3Y,a4+a5X+a6Y)が得られ、動きパラメータをその領域に おける局部記号によって表したときには(dx,dy)=(a1+a2X+a3y ,a4+a5x+a6y)が得られ、したがって、この変位は、その画素に対して 、時点(t−1)における座標(X−Dx,Y−Dy)を引き出す可能性をもた らす(かかる座標が像の外に存在する場合には、その像に組合わされ た最も近い点の座標を取り上げるが、パラメータが存在しないので見出した座標 は必ずしも整数値ではなく、したがって、その時点における輝度を引き出すのに 補間を行なわなければならない); (b)先行像P(t−1)における輝度および座標の計算: 輝度は、現在の場合、画素の16分の1の精度で長さ5を有する両立方の単一 方向フィルタを用いて補間される(その補間は、平均値を保持した2輝度値を得 るように、像のエッジにおける画素群の場合に像のエッジにおける反映と呼ぶ運 算により、同じフィルタを用いて水平方向と垂直方向とに補間を行なう)。 勾配の計算に対しては、輝度に対するのと同様に、その値を補間する必要があ る。かかる処理の予測中に用いた補間との一貫性を確保するために、使用するフ ィルタは、輝度用に用いたものから、画素の32分の1の精度で長さ5のものを 取り出す。補間技術は、水平方向と垂直方向との濾波処理から生じる値をそれぞ れ独立して用いる(輝度用と同じ反映処理が行なわれる)以外は、輝度用と同じ である。 理論上、マトリックスAは、領域の全点における各項の和の助けによって構成 しなければならない。いくつかの点は、誤差要素(小物体もしくは寄生運動との 係合、露出帯との係合など)になることがある。座標点選択の簡単な制限は、実 際に評価される動きがS(x,y,t)=S(x−Dx,y−Dy,t−1)と なる座標点(x,y)のみを保留することである。この制限は、分割が像の内容 によく密着している程効果的である。 一旦マトリックスAが構成されると、そのマトリックスAが特異であるか否か が験される。これが特異でない場合には、ハウスホルダ方法と呼ばれる方法によ る転換が行なわれる。これが特異である場合には、その動きは精練されず、動き t)の領域iの近傍領域Jに対応する情報Mj(t)との両方を用いて予測され 、領域iにおける局部記号で表される。その領域における予測誤差は、その都度 には、その良好な動きが無変化のままにされる。しからざる場合には、最小予測 t)で表される。上述したように、留め置かれた動きの伝搬の制御は可能である 。領域Riに隣接する各領域Rjについては、それぞれの領域における予測誤差が かかる評価計画により、初期化段階は、見出すべき動きから離れ過ぎないよう にその評価を開始させるために利用し得る情報を全部使用し得るようにし、一方 、前処理段階は、(収斂に局部最小を避けさせて、順次の濾波処理により像ピラ ミッドを構築し、強く濾波した一対の像間に最初の評価が生ずるようにするため に)輝度信号を単純化し、精練段階は、さらに詳細に作用する。 本発明の目的は、所定系列のビデオ物体の多項式動きパラメータの評価に対し 、より頑健な方法を用いる動き評価方法を提案することにある。 この目的のために、本発明は、この説明の前文に記載した動き評価方法に関す るものであり、さらには、rPが各物体の画素毎の予測誤差であり、予測誤差が 原値と予測値との差と定義され、動き評価が、輝度の時間的変化は照度の局部変 化を考慮せずに動きのみによる、との仮定に基づく場合に、公式最小ΣPρ(rP )による、目標関数と呼ばれる関連関数ρ(x)の最小化によって、動きを評価 する各物体に対する予測誤差を最小化する動作を第3の精練過程に含めることを 特徴とするものである。 本発明の他の目的は、この評価方法を実行するための装置を提案することにあ る。 この目的のために、本発明は、ラベルで識別されるI個の領域Riからなる分 割像もしくは分割像部分の系列P(t−n),P(t−n+1),・・・,P( t−2),P(t−1),P(t)・・・を形成して系列S(t−n),S(t −n+1),・・・,S(t−2),S(t−1),S(t)・・・の形で利用 し得る像相互間の動きを評価する装置において、領域Ri毎に、動きパラメータ で定義される動きベクトルの形で、先行像P(t−1)に対する現下像P(t) の動きを表す情報Mi(t)を供給するために、つぎの3段階、すなわち、動き の仮説を選択して、各領域毎に、その領域の像の画素群における予測誤差の自乗 値の和が最小となる動きを選ぶことにより、現下の像の各領域の動きパラメータ を初期化する第1段階、中間処理の第2段階、および、各領域に組合わせたベク トル(Dx,Dy)の概略決定により動きパラメータを精練する第3段階を順次 に備え、第2および第3の各段階を、反復処理により、その処理の終端まで所定 基準の関数としてループ状に設けるとともに、rPが各物体の各画素pに対する 予測誤差である場合に、公式最小ΣPρ(rP)による、目標関数と呼ばれる関連 関数ρ(x)の最小化によって、動きを評価する各物体に対する予測誤差を最小 化する手段を精練段階に設けた像間動き評価方法に関連している。 本発明のかかる面は、つぎの図面を参照して以下に説明する実施例から明らか になろう。 −図1は、原像の前解析から生じた分割(分割自体の原理は、形状の如何を問 わず、本発明に含まない)による分割像の例を示す線図である。 −図2は、連続した2像P(t−1)とP(t)との間の動きを模式的に示す 線図である。 −図3は、先に引用した文献EP0771115に記載の評価過程の各段階を 示すブロック線図である。 −図4は、いわゆるIRLS方法による反復パラメータ評価を説明するブロッ ク線図である。 −図5は、本発明による評価過程の各段階を示すブロック線図である。 −図6は、本発明の場合に用いる目標関数ρ(x)の例を示すグラフである。 −図7は、前記目標関数に組合わせる影響関数の例を示すグラフである。 −図8は、本発明方法を実行するために提供する動き評価装置の構成例を示す ブロック線図である。 本発明によれば、動きパラメータのより良好な評価のために、差分評価過程に いわゆるM評価子を導入することが提案される。事実、動きパラメータ評価の問 題点は予測誤差の関数の最小化として書くことができ、その関数ρは目標関数と 呼ばれ、その最小化は、r(p)を目標物の画素pにおける予測誤差として、つ ぎの式(6)の関係によって書き表される。 したがって、M評価は、対称の有限正値であって、x=0で独特の最小値を有す る目標関数ρ(x)を用いることにより、予測誤差の和の最小化の問題点を解決 することになる。頑健な評価子として表されるためには、関数ρ(x)は、(通 常門外漢と呼ばれる)大きい予測誤差の各点が収斂経過に及ぼす影響が減少する ように選ぶべきである。所定の予測誤差値の画素群にρ(x)が及ぼす選択の種 類は、ρ(x)の影響関数によって特徴づけられる。連続した場合には、影響関 数Ψ(x)はρ(x)の導関数となる。上述した最小化の関数における大きい予 測誤差の点の影響を減少させるためには、Ψ(x)は、xが無限大に向かう場合 に零に向かわなければならない。 多数の頑健なM評価子は、文献では、種々の分野で、門外漢の影響を減少させ る能力の故に用いられて来ている。最も単純な場合には、ρ(x)が微分可能で はなく、門外・門内の判定は、誤差の所定閾値との比較に基づき、2値となる。 より精密な解析は、より綿密なM評価子により、関数の尖鋭度、すなわち、門外 漢に対するM評価子の許容度を、その統計的な特性を変えずに制御し得るように する尺度係数を用いることによって得られる。あらゆる場合に、前述の最小化関 係に対応する最小化の問題は、直接の解答をもっていない。しかしながら、いわ ゆる反復再荷重最小自乗方法(IRLS)は、M評価を等価の荷重最小自乗問題 に変換することにより、M評価の解答を可能にする。実際に、動きパラメータに 関して最小化関係を微分することと、その後にさらに若干操作することにより、 この問題は、つぎの式(7)と等価であることを示すことができ、 minΣp1/2wpr2p (7) ここに、wpは、画素pの荷重であり、つぎの式(8)となる。 wp=1/rpdρ(rp)/drp (8) したがって、古典的な最小化の方法(勾配方法、ニュートン方法、ガウス−ニュ ートン方法など)を適用することができる(最後のガウス−ニュートン方法は、 実際に、性能と複雑さとの間で行なわれる良好な交換取引きに極めて屡々用いら れる)。このようにして適用したIRLS方法は、急速に収斂することが判る。 IRLS方法を用いた反復パラメータ評価を要約して図4に示すが、ここに、 Ai及びAi+1は、i番目および(i+1)番目の反復における動きパラメー タの評価を表し、dAは、その評価の計算精度を表す。 しかしながら、M評価子は、収斂過程の初期化に極めて敏感であることが知ら れている。過程の始端において画素が門外漢であるか否かを予め決定する方法は 存在しない。いくつかの評価環境では、動きおよび門外漢の極めて信頼のおける 初期化を確実にするに十分な先行情報が存在することがある。ついで、他の場合 に直面するに十分と判った解法は、尺度係数を用いることであり、したがって、 評価は、門外漢に対して高い許容度で始まり、動き評価が厳密になるにつれて累 進的に選択を強化する。かかる尺度係数の監視は、結果の質に対して極めて重要 であり、その値は、評価の始端で大きく、終端値まで整然と減少すべきである。 M評価子と、このようにIRLSとを用いた場合の全体評価の枠組みは、図5の ように表される。 動き評価の目的に対して、門内・外の選別を行なうのに予測誤差のみに頼るの は最善ではない。事実、大きい予測誤差の若干の点は、例えば少数派の動きを受 ける副領域に属しているので、確実に収斂を害することになる。しかし、若干の 他の点は、収斂に対して極めて有用な情報を含んでいる。動き評価に対し、像中 で最も興味のある情報は、動きの小さい誤差が大きい予測誤差を導入する勾配の きつい区域に位置している(平坦な区域は動きの大雑把な観念を与え得るに過ぎ ない)。門内・外の選別が予測誤差のみに頼っている場合には、興味のある点が 、門外漢として排除され、収斂過程には最早何ら貢献し得ない。M評価子は、均 一勾配の配当によってのみ物体の問題を完全に処理するのであるから、その機構 は、門外漢の選別を動き評価の問題点に適応させるように設定されている。動き モデルの制限により収斂過程を妨害する真の門外漢は、大きい予測誤差を導入は するが有用な情報をもたらす画素群からは弁別されるであろう。各画素の影響は 、(σを尺度係数として)その荷重W(p,ρ,σ)によって判定されるのであ るから、その荷重関数は、勾配情報を考慮するように修正される。正規化した初 期荷重関数Wn(p,ρ,σ)と正規化した像勾配gn(p)との線形組合わせW ’として荷重関数を定義し直すことが提案される。(図7に組合わされた影響関 数Ψ(x,ρ)により)図6に表されているようなロレンツM評価子の場合には 、これは、例えば、つぎの式(9)のようになる。 W'(p,ρ,σ)=Wn(p,ρ,σ)+α(1-Wn(p,ρ,σ))・gn(p) (9) ここに、Wn(p,ρ,σ)はつぎの式(10)のとおりであり、αは、門外漢 弁別過程における勾配および予測誤差にそれぞれ与えられる重要性を制御するも のである。 先に文献EP0771115に示されているように、本発明方法は、図8に示 した動き評価装置840で実行することもでき、この動き評価装置840は、現 下像の各領域の動きパラメータを初期化するための第1段階841を備えて、動 きの仮説を選択するとともに、各領域につき、その領域の画素群における予測誤 差の自乗値の和が最小となる動きを選択することにより、第1初期化段階10を 実施し、第2段階20を実行するための第2中間距離段階842を後続させると ともに、動きパラメータを精練するための第3段階843を後続させて、各領域 に組合わせたベクトル(Dx,Dy)の概略判定により第3段階を実行する。か かる第2段階842および第3段階843は、所定基準の関数としてこの過程が 完了するまで、反復過程によってループ状に設けられている(この場合、中間処 理動作は、この反復過程の収斂の促進を意図した等方性ガウス濾波動作を含んで いる)。かかる動き評価装置の特に重要な使い方が欧州特許出願第079955 0号公報に記載されているような分割像符号化のための方式中に見出されること も示すことができる。

Claims (1)

  1. 【特許請求の範囲】 1. 各領域Ri毎に、先行像P(t−1)に対する現下像P(t)の動きを表す 情報Mi(t)を供給するために、現下像の各領域毎に行なうつぎの動作: (1)分割前の像P(t−1),P(t)および分割後の像S(t−1), S(t)と先行過程において先行像P(t−1)につき評価した動き情報Mi (t−1)との関係としてP(t)の各領域の動きパラメータを初期化する第 1過程、 (2)動き評価が行なわれる像群の中間処理の第2過程、および、当該領域 の各座標点(x,y)につぎL( )が輝度その他のビデオ信号を指し、Dx ,Dyが当該領域の動きの型に関連した次数の多項式である場合にL(x,y ,t)=L(x−Dx,y−Dy,t−1)となるようにして、各領域Riの 全画素につき、ベクトル(Dx,Dy)の形で動きパラメータの最終決定をす る第3過程、 (3)最終的に動き情報を得るための、少なくとも所定の基準の関数として の反復過程の終端までの中間処理の第2過程および精練の第3過程の反復 を含み、ラベルで識別されるI個の領域Riからなる分割像もしくは分割像部 分の系列P(t−n),P(t−n+1),・・・,P(t−2),P(t− 1),P(t)・・・を形成して系列S(t−n),S(t−n+1), ・,S(t−2),S(t−1),S(t)・・・の形で利用し得る像相互間 の動きを評価する方法において、 rPが各物体の画素毎の予測誤差であり、予測誤差が原値と予測値との差と 定義され、動き評価が、輝度の時間的変化は照度の局部変化を考慮せずに動き のみによる、との仮定に基づく場合に、公式最小ΣPρ(rP)による、目標 関数と呼ばれる関連関数ρ(x)の最小化によって、動きを評価する各物体に 対する予測誤差を最小化する動作を第3の精練過程に含めることを特徴とする 像間動き評価方法。 2. 対称の、有限正値であって、x=0で唯一の最小値となるいわゆる影響関数 を目標関数ρ(x)とする請求項1記載の像間動き評価方法。 3. 目標関数がρ(x)=x2で与えられる請求項2記載の像間動き評価方法。 4. 大きい予測誤差の点、すなわち、門外漢に対する許容度に相当する関数尖鋭 度を制御する尺度係数をσとして、目標関数が で与えられる請求項2記載の像間動き評価方法。 5. WP=(1/rP)dρ(rP)/drPで与えられる画素Pの荷重をWP としたときに、第2公式最小ΣP(wPP 2)/2によって最小化動作が行 なわれる請求項1乃至4のいずれかに記載の像間動き評価方法。 6. ラベルで識別されるI個の領域Riからなる分割像もしくは分割像部分の系 列P(t−n),P(t−n+1),・・・,P(t−2),P(t−1), P(t)・・・を形成して系列S(t−n),S(t−n+1),・・・,S (t−2),S(t−1),S(t)・・・の形で利用し得る像相互間の動き を評価する装置において、領域Ri毎に、動きパラメータで定義される動きべ クトルの形で、先行像P(t−1)に対する現下像P(t)の動きを表す情報 Mi(t)を供給するために、つぎの3段階、すなわち、動きの仮説を選択し て、各領域毎に、その領域の像の画素群における予測誤差の自乗値の和が最小 となる動きを選ぶことにより、現下の像の各領域の動きパラメータを初期化す る第1段階、中間処理の第2段階、および、各領域に組合わせたベクトル(D x,Dy)の概略決定により動きパラメータを精練する第3段階を順次に備え 、第2および第3の各段階を、反復処理により、その処理の終端まで所定基準 の関数としてループ状に設けるとともに、rPが各物体の各画素pに対する予 測誤差である場合に、公式最小ΣPρ(rP)による、目標関数と呼ばれる関 連関数ρ(x)の最小化によって、動きを評価する各物体に対する予測誤差を 最小化する手段を精練段階に設けた像間動き評価方法。 7. WP=(1/rP)dρ(rP)/drPで与えられる画素pの荷重をWP としたときに、第2公式最小ΣP(wPP 2)/2によって最小化動作が行 なわれる請求項6記載の像間動き評価方法。
JP10529373A 1997-04-25 1998-03-23 像間動き評価方法 Pending JP2000512827A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP97400944.1 1997-04-25
EP97400944 1997-04-25
PCT/IB1998/000424 WO1998049830A2 (en) 1997-04-25 1998-03-23 Method of estimation of motion between images

Publications (1)

Publication Number Publication Date
JP2000512827A true JP2000512827A (ja) 2000-09-26

Family

ID=8229746

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10529373A Pending JP2000512827A (ja) 1997-04-25 1998-03-23 像間動き評価方法

Country Status (4)

Country Link
US (1) US6088397A (ja)
EP (1) EP0914738A2 (ja)
JP (1) JP2000512827A (ja)
WO (1) WO1998049830A2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6633611B2 (en) * 1997-04-24 2003-10-14 Mitsubishi Denki Kabushiki Kaisha Method and apparatus for region-based moving image encoding and decoding
KR100441509B1 (ko) * 2002-02-25 2004-07-23 삼성전자주식회사 주사포맷변환장치 및 방법
US7916940B2 (en) * 2004-01-31 2011-03-29 Hewlett-Packard Development Company Processing of mosaic digital images
KR20110094987A (ko) * 2010-02-18 2011-08-24 삼성전자주식회사 잠재적 불량의 정량적 평가에 기초한 제품 선별 방법
GB201007351D0 (en) * 2010-04-30 2010-06-16 Imagination Tech Ltd Varying temporal interpolation in a motion compensated frame interpolation system

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5594504A (en) * 1994-07-06 1997-01-14 Lucent Technologies Inc. Predictive video coding using a motion vector updating routine
KR0171120B1 (ko) * 1995-04-29 1999-03-20 배순훈 특징점 기반 움직임 보상을 이용한 비디오 신호 부호화에서의 움직임 영역 설정방법 및 장치
EP0799550B1 (en) * 1995-10-25 2000-08-09 Koninklijke Philips Electronics N.V. Segmented picture coding method and system, and corresponding decoding method and system
EP0771115A1 (fr) * 1995-10-25 1997-05-02 Koninklijke Philips Electronics N.V. Procédé et dispositif d'estimation de mouvement de régions entre images et système de codage d'images segmentées pour leur mise en oeuvre
EP0857392B1 (en) * 1995-10-25 2004-08-11 Sarnoff Corporation Overlapping block zerotree wavelet image coder
US5929940A (en) * 1995-10-25 1999-07-27 U.S. Philips Corporation Method and device for estimating motion between images, system for encoding segmented images

Also Published As

Publication number Publication date
EP0914738A2 (en) 1999-05-12
US6088397A (en) 2000-07-11
WO1998049830A3 (en) 1999-02-04
WO1998049830A2 (en) 1998-11-05

Similar Documents

Publication Publication Date Title
US5557684A (en) System for encoding image data into multiple layers representing regions of coherent motion and associated motion parameters
CN100539693C (zh) 快速运动估计方法
JP2978406B2 (ja) 局所異常の排除による動きベクトルフィールド生成装置およびその方法
US20060193535A1 (en) Image matching method and image interpolation method using the same
JPH04501648A (ja) 画像列の動作を予測しかつ階層的コード化を行う方法及び装置
JPH10285602A (ja) 映像データをエンコードするための動的なスプライト
KR101217627B1 (ko) 블록 기반의 움직임 추정 방법 및 장치
JPH03501541A (ja) 動画像フレーム内の動き予測方法および装置
JPH08265781A (ja) 動きベクトル特定方法及び装置
EP2330817A1 (en) Video signal converting system
WO2010026838A1 (ja) フレームレート変換装置、並びに、その対応点推定装置、対応点推定方法及び対応点推定プログラム
US20060098886A1 (en) Efficient predictive image parameter estimation
CN104202603A (zh) 一种应用于视频帧速率上转换的运动向量场生成方法
JP2005506626A (ja) 動き推定ユニット及び方法並びにかような動き推定ユニットを備えた画像処理装置
Wang et al. Evaluation of mesh-based motion estimation in H. 263-like coders
JP5014987B2 (ja) ビデオモード検出による動き補償
Hu et al. Deep inter prediction with error-corrected auto-regressive network for video coding
JP2000512827A (ja) 像間動き評価方法
KR100590145B1 (ko) 화상 처리 장치, 화상 처리 방법, 및 이를 제공하는 매체
US10432962B1 (en) Accuracy and local smoothness of motion vector fields using motion-model fitting
JP4931884B2 (ja) フレームレート変換装置、フレームレート変換方法及びフレームレート変換プログラム
JP3700230B2 (ja) 動画像符号化における動き補償方法
JP2007067551A (ja) 動きベクトル推定方法,動きベクトル推定装置,動きベクトル推定プログラムおよび動きベクトル推定プログラム記録媒体
JP5081109B2 (ja) 映像信号変換システム
JP2980810B2 (ja) 動きベクトル探索方法と装置