JP4052588B2 - 動き予測情報検出装置 - Google Patents

動き予測情報検出装置 Download PDF

Info

Publication number
JP4052588B2
JP4052588B2 JP2004017302A JP2004017302A JP4052588B2 JP 4052588 B2 JP4052588 B2 JP 4052588B2 JP 2004017302 A JP2004017302 A JP 2004017302A JP 2004017302 A JP2004017302 A JP 2004017302A JP 4052588 B2 JP4052588 B2 JP 4052588B2
Authority
JP
Japan
Prior art keywords
prediction information
motion prediction
global
correction value
global motion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2004017302A
Other languages
English (en)
Other versions
JP2005210613A (ja
Inventor
晴久 加藤
康之 中島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Original Assignee
KDDI Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KDDI Corp filed Critical KDDI Corp
Priority to JP2004017302A priority Critical patent/JP4052588B2/ja
Publication of JP2005210613A publication Critical patent/JP2005210613A/ja
Application granted granted Critical
Publication of JP4052588B2 publication Critical patent/JP4052588B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Description

本発明は、動き予測情報検出装置に関し、特に、局所的動き予測情報から大域的動き予測情報を推定する動き予測情報検出装置に関する。
連続して入力される動画像信号を符号化する符号化方式のひとつとして、フレーム間予測符号化方式がある。フレーム間予測符号化方式では、時間的相関の予測効率が高められた動き補償を行うために動き予測情報が用いられる。
動き補償には、処理対象画像における個々の小領域(画素ブロック)が並進することを仮定した局所的動き補償方式が広く利用されている。局所的動き補償方式で用いる局所的動き予測情報は、処理対象画像内の着目する画素ブロック(マクロブロック)と参照画像内における該画素ブロックに類似する類似画素ブロックとの相対位置を示すベクトルである。
これとは異なる動き補償方式も知られている。これは大域的動き補償方式と称されるもので、フレーム画像全体の動きを予測し、数個のパラメータを含む大域的動き予測情報を用いて動きを補償するものである。大域的動き補償方式では、数個のパラメータで画像の並進、拡大・縮小、回転、せん断などを含め、様々な動きを表現することができる。
さらに、局所的動き予測情報から大域的動き予測情報を推定する提案もなされている。局所的動き予測情報から、例えばその重み付け平均で大域的な並進成分を推定することにより大域的動き予測の計算量を減らすことができる。特許文献1には、大域的動き予測情報として並進成分以外に拡大・縮小をモデル化した動きベクトル予測符号化方法が記載されている。また、特許文献2には、動きベクトルの二乗平均値の偏差および大域的動きの周期性をもとに大域的動き予測情報を決定する動画像符号化装置が記載されている。
特開平11− 88888号公報 特開平11−266459号公報
局所的動き補償方式では、処理対象画像内の着目する画素ブロックと参照画像内における該画素ブロックに類似する類似画素ブロックとの相対位置を示すベクトルを局所的動き予測情報として用いるため、小領域が細かくなるほど局所的動き予測情報が増大し、処理負担が増大するという課題がある。
また、局所的動き補償方式では小領域が並進することを前提としているため、画像の拡大・縮小、回転、せん断などの動きを表現することができず、従って、そのような画像の動きに対して予測効率を高めることができないという課題もある。
大域的動き補償方式では数個のパラメータで動きを表現できるため、大域的動き予測情報の符号量を小さく抑えることができる。しかしながら、一般に大域的動きを正確に予測することは非常に困難であり、計算量も膨大になるという課題がある。
局所的動き予測情報から、例えばその重み付け平均で大域的な並進成分を推定することにより大域的動き予測の計算量を減らすことができるが、この方法では推定し得る画像の動きが限定されるという課題を抱える。
特許文献1に記載された動きベクトル予測符号化方法では、画像の並進成分以外に拡大・縮小に対応できるが、回転、せん断などには対応できない。しかも、これでは、大域的動き予測情報の利用方法について主眼が置かれ、その検出方法については言及されていない。
特許文献2に記載された動画像符号化装置でも、画像の並進以外の動きが考慮されておらず、画像の拡大や縮小、回転、せん断などの様々な動きを推定することができない。
本発明の目的は、上記課題を解決し、局所的動き予測情報から、大域的な並進成分だけでなく任意の大域的動きを高精度に推定し得る動き予測情報検出装置を提供することにある。
上記課題を解決するため、本発明は、処理対象画像における局所的動き予測情報から大域的動き予測情報を推定する動き予測情報検出装置において、局所的動き予測情報から大域的動き予測情報の初期値を推定し、推定された大域的動き予測情報を出力する初期値推定手段と、推定された大域的動き予測情報を入力とし、該大域的動き予測情報の補正値を大域的写像変換関数を用いて導出する補正値取得手段と、前記補正値取得手段で導出された補正値で大域的動き予測情報を補正し、推定された大域的動き予測情報とする補正手段とを備え、前記補正値取得手段は、大域的動き予測情報を補正する補正値を導出するための導関数行列および導関数ベクトルを求める導関数行列算出手段および導関数ベクトル算出手段と、前記導関数行列と前記導関数ベクトルとを用いた導出式から大域的動き予測情報の補正値を算出する補正値算出手段とを備え、前記導関数行列算出手段は、導関数行列の各要素において要素の行番号と列番号を参照して、該行番号の大域的動き予測情報の成分で個々の大域的写像変換関数を偏微分して、反復処理中の大域的動き予測情報の近似値を適用した関数と、該列番号の大域的動き予測情報の成分で個々の大域的写像変換関数を偏微分して、反復処理中の大域的動き予測情報の近似値を適用した関数とを乗算し、全ての大域的写像変換関数ごとに加算した関数に、局所的動き情報を持った個々の座標情報を代入した数値を全て合計した数値で、各要素を構成する導関数行列を算出し、前記導関数ベクトル算出手段は、導関数ベクトルの各要素において要素番号を参照して、該要素番号の大域的動き予測情報の成分で個々の大域的写像変換関数を偏微分して、反復処理中の大域的動き予測情報の近似値を適用した関数と、局所的動き情報を適用した座標情報と大域的動き予測情報を適用した座標情報との差分値を乗算し、全ての大域的写像変換関数ごとに加算した関数に、局所的動き情報を持った個々の座標情報を代入した数値を全て合計した数値で、各要素を構成する導関数ベクトルを算出し、前記補正値算出手段は、前記導関数行列の逆行列と前記導関数ベクトルを乗算して補正値を算出することを基本的な特徴としている。
本発明によれば、複数の局所的動き予測情報から、大域的動き予測の写像方式に依存せず、任意の写像変換関数に対して最適なパラメータからなる大域的動き予測情報を正確を高精度に推定することができる。また、大域的動き予測情報の推定に際し、計算処理に工夫を施すことにより計算量を大幅に削減し、処理負担を軽減することができる。
以下、図面を参照して本発明を説明する。まず、本発明の原理について説明する。フレーム画像を構成する画素を走査順に並べたとき、i番目の画素の座標とそれに付随する局所的動き予測情報をそれぞれ(x,y)および(u,v)(i=1,2,・・・,n)で表すと、動き補償された後の座標(x',y')は、式(1)で表される。
x'=x+u
y'=y+v (1)
図1は、座標(x,y)および(x',y')、局所的動き予測情報(u,v)の具体例であり、同図(a)はカメラのズームなどによる画像拡大時であり、同図(b)はカメラ回転などによる画像回転時である。図(a),(b)において矢印で示されている動き予測情報(u,v)はマクロブロック(16×16画素)ごとに異なる。
一方、j=1,2,・・・,mをパラメータ、大局的動き予測情報をgとし、これにより変換された座標を(x",y")とすると、座標(x,y)は写像変換関数fおよびhにより式(2)で写像変換される。
x"=f(x,y,g)
y"=h(x,y,g) (2)
局所的動き予測情報から大域的動き予測情報を推定することは、座標x'と座標x"との間に式(3)の関係があり、座標y'と座標y"との間に式(4)の関係があるとき、式(5)を成立させる大域的動き予測情報g,g,・・・,gを求めることである。
x+u=f(x,y,g,g,・・・,g)
x+u=f(x,y,g,g,・・・,g)
・・・
x+u=f(x,y,g,g,・・・,g) (3)

y+v=h(x,y,g,g,・・・,g)
y+v=h(x,y,g,g,・・・,g)
・・・
y+v=h(x,y,g,g,・・・,g) (4)

x+u=f(x,y,g,g,・・・,g)
y+v=h(x,y,g,g,・・・,g) (5)
そこで、局所的動き予測と大域的動き予測の誤差のx成分、y成分をそれぞれp、qとすると、p、qは式(6)で表され、各成分の2乗誤差の総和eは式(7)で求められる。この総和eが最小となるg,g,・・・,gを求めれば、それが最適な大域的動き予測情報となる。
p=f(x,y,g,g,・・・,g)−(x+u)
q=h(x,y,g,g,・・・,g)−(y+v) (6)
Figure 0004052588
一般に、式(5)は未知の大域的動き予測情報gに対して非線形であるから、式(5)をテイラー(Taylor)展開により線形化する。はじめに、大域的動き予測情報gの近似値g を何らかの方法で予め推定し、これを大域的動き予測情報gの初期値とする。大域的動き予測情報gの初期値は、例えば局所的動き予測情報u,vの重み付き平均値や中央値を写像の並進成分とすることなどで推定できる。
ここで、最小二乗法によって求められる大域的動き予測情報gの最適値をg とし、近似値g に加えるべき未知の補正値をΔgとすると、式(8)が成り立つ。
g =g +Δg (j=1,2,・・・,m) (8)
Δgが微小な値として式(5)の右辺を近似値g の周りでテイラー展開して1次項まで求めると、式(9)が得られる。
Figure 0004052588
ここで、係数
Figure 0004052588
および係数
Figure 0004052588
は、f(x,y,g,g,・・・,g)およびh(x,y,g,g,・・・,g)を大域的動き予測情報gでそれぞれ偏微分し、g,g,・・・,gの値として近似値g ,g ,・・・,g を用いて計算したものである。これを、式(10)のようにf 、h と略記すると、式(5)は、式(11)となる。
Figure 0004052588
Figure 0004052588
ここで、x =f(x,y,g ,g ,・・・,g )、y =h(x,y,g ,g ,・・・,g )と定義すると、式(6)の局所的動き予測と大域的動き予測の誤差のx成分、y成分p、qは、式(12)で近似できる。
Figure 0004052588
このとき、未知量は、大域的動き予測情報の補正値Δgと推定誤差(p,q)である。一方、既知量は、局所的動き予測情報(u,v)および座標(x,y)、大域的動き予測の近似値を適用した座標(x ,y )と写像変換関数の偏微分に近似値を代入したf 、h である。式(12)は式(13)および式(14)に書き直すことができる。
(f Δg+f Δg+・・・+f Δg+x )−(x+u)=p
(f Δg+f Δg+・・・+f Δg+x )−(x+u)=p
・・・
(f Δg+f Δg+・・・+f Δg+x )−(x+u)=p (13)

(h Δg+h Δg+・・・+h Δg+y )−(y+v)=q
(h Δg+h Δg+・・・+h Δg+y )−(y+v)=q
・・・
(h Δg+h Δg+・・・+h Δg+y )−(y+v)=q (14)
式(13)および式(14)式を分かりやすく表現するため、行列の形式に書き換える。そのために、既知量の集合を列ベクトルとして式(15)で表す。なお、以下ではベクトルを〈 〉付き小文字で表し、行列を〈 〉付き大文字で表す。
Figure 0004052588
また、大域的動き予測情報gの近似値から求められたx =f(x,y,g ,g ,・・・,g )およびy =h(x,y,g ,g ,・・・,g )を要素とするベクトルを式(16)で表し、〈x〉−(〈x〉+〈u〉)=〈s〉、〈y〉−(〈y〉+〈v〉)=〈r〉とする。
Figure 0004052588
一方、未知の集合を式(17)で表し、未知量の最適値を求めるために近似値に加える補正値を式(18)で表す。
Figure 0004052588
〈Δg〉=〈g〉−〈g〉 (18)
ここで、式(6)をベクトルで表現すれば式(19)式となり、式(18)により〈g〉=〈g〉+〈Δg〉であるから式(20)が得られる。
〈p〉=f(〈x〉,〈y〉,〈g〉)−(〈x〉+〈u〉)
〈q〉=h(〈x〉,〈y〉,〈g〉)−(〈y〉+〈v〉) (19)

〈p〉=f(〈x〉,〈y〉,〈g〉+〈Δg〉)−(〈x〉+〈u〉)
〈q〉=h(〈x〉,〈y〉,〈g〉+〈Δg〉)−(〈y〉+〈v〉) (20)
〈Δg〉は最終的に求めたい未知の補正値であるが、一般に〈g〉の近似がよければ微小な値であるため、〈g〉の周りでテイラー展開して1次項まで求めると、近似値〈g〉による誤差は式(21)となる。ただし、〈A〉,〈B〉は、行列であり、その要素はそれぞれ式(22)で構成される。
〈p〉=f(〈x〉,〈y〉,〈g〉)+〈A〉〈Δg〉−(〈x〉+〈u〉)
〈q〉=h(〈x〉,〈y〉,〈g〉)+〈B〉〈Δg〉−(〈y〉+〈v〉) (21)
Figure 0004052588
f(〈x〉,〈y〉,〈g0〉)=〈x0〉、h(〈x〉,〈y〉,〈g0〉)=〈y0〉、〈s〉=〈x0〉−(〈x〉+〈u〉)、〈r〉=〈y0〉−(〈y〉+〈v〉)の関係を用いて式(21)を書き直すと式(23)が得られる。

〈p〉=〈A〉〈Δg〉+〈x0〉−(〈x〉+〈u〉)
=〈A〉〈Δg〉+〈s〉
〈q〉=〈B〉〈Δg〉+〈y0〉−(〈y〉+〈v〉)
=〈B〉〈Δg〉+〈r〉 (23)

2乗誤差eは、式(23)式を用いて式(24)式で表される。なお、上付tは転置を表す。

e=〈p〉t〈p〉+〈q〉t〈q〉
=(〈A〉〈Δg〉+〈s〉)t(〈A〉〈Δg〉+〈s〉)+(〈B〉〈Δg〉+〈r〉)t(〈B〉〈Δg〉+〈r〉)
=(〈s〉t+〈Δg〉t〈A〉t)(〈A〉〈Δg〉+〈s〉)+(〈r〉t+〈Δg〉t〈B〉t)(〈B〉〈Δg〉+〈r〉)
=〈Δg〉t〈A〉t〈A〉〈Δg〉+〈Δg〉t〈A〉t〈s〉+〈s〉t〈A〉〈Δg〉+〈s〉t〈s〉+〈Δg〉t〈B〉t〈B〉〈Δg〉+〈Δg〉t〈B〉t〈r〉+〈r〉t〈B〉〈Δg〉+〈r〉t〈r〉 (24)

〈Δg〉,〈s〉,〈r〉はベクトルであるから、〈Δg〉t〈A〉t〈s〉=〈s〉t〈A〉〈Δg〉、〈Δg〉t〈B〉t〈r〉=〈r〉t〈B〉〈Δg〉が成り立つ。また、式(25)、式(26)で定義される行列〈N〉とベクトル〈m〉を用いると、式(27)が得られる。行列〈N〉は、大域的写像変換関数を大域的動き予測情報の各成分でそれぞれ偏微分した複数の導関数を2つずつ掛け合わせた関数に、大域的動き予測情報および複数の処置対象画素データの座標を適用して得られた値の総和を要素とする導関数行列である。
より詳細には、導関数行列〈N〉の各要素n(i,j)は、大域的写像変換関数fおよびhを用いると、次式で表される。
n(i,j)=sum(f′i*f′j+h′i*h′j)
ここで、f′i,f′jはそれぞれ、大域的写像関数fを大域的動き予測情報gのi番目,j番目の成分gi,gjで偏微分して、反復処理中の近似値〈g〉を適用した関数に、局所的動き情報を持った個々の座標情報(x,y)を代入した数値になり、また、h′i,h′jはそれぞれ、大域的写像関数fを大域的動き予測情報gのi番目,j番目の成分gi,gjで偏微分して、反復処理中の近似値〈g〉を適用した関数に、局所的動き情報を持った個々の座標情報(x,y)を代入した数値になる。
よって、導関数行列の各要素は、導関数行列の各要素において要素の行番号と列番号を参照して、該行番号の大域的動き予測情報の成分で個々の大域的写像変換関数を偏微分して、反復処理中の大域的動き予測情報の近似値を適用した関数と、該列番号の大域的動き予測情報の成分で個々の大域的写像変換関数を偏微分して、反復処理中の大域的動き予測情報の近似値を適用した関数とを乗算し、全ての大域的写像変換関数ごとに加算した関数に、局所的動き情報を持った個々の座標情報を代入した数値を全て合計した数値で構成される。
また、導関数ベクトル〈m〉の各要素m(i)は、大域的写像変換関数fおよびhを用いると、次式で表される。
m(i)=sum(f′i*s+h′i*r)
ここで、s,rはそれぞれ、個々の座標情報(x,y)に対して、それぞれ大域的写像関数f,hに反復処理中の近似値〈g〉を適用した関数で補償した座標情報(f(x,y,g),h(x,y,g))と局所的動き情報(u,v)で補償した座標情報(x+u,y+v)との差分になる。
よって、導関数ベクトルの各要素は、導関数ベクトルの各要素において要素番号を参照して、該要素番号の大域的動き予測情報の成分で個々の大域的写像変換関数を偏微分して、反復処理中の大域的動き予測情報の近似値を適用した関数と、局所的動き情報を適用した座標情報と大域的動き予測情報を適用した座標情報との差分値を乗算し、全ての大域的写像変換関数ごとに加算した関数に、局所的動き情報を持った個々の座標情報を代入した数値を全て合計した数値で構成される。

〈N〉=(〈A〉t〈A〉+〈B〉t〈B〉) (25)

〈m〉=(〈A〉t〈s〉+〈B〉t〈r〉) (26)

〈p〉t〈p〉+〈q〉t〈q〉=〈Δg〉t〈N〉〈Δg〉+2〈Δg〉t〈m〉+〈s〉t〈s〉+〈r〉t〈r〉 (27)

2乗誤差e=〈p〉t〈p〉+〈q〉t〈q〉を最小化するには、式(28)のように、〈Δg〉の全ての要素について微分が零に等しくならなくてはならない。
Figure 0004052588
なお、式(28)は極値を取るための条件でしかないが、これにより2乗誤差eが最小になることは以下のように証明できる。
別の解〈Δg'〉が誤差〈p'〉,〈q'〉を与えるとすると、
〈p'〉=〈A〉〈Δg'〉+〈s〉
〈q'〉=〈B〉〈Δg'〉+〈r〉
故に、
〈p'〉=〈p〉+〈A〉(〈Δg'〉−〈Δg〉)
〈q'〉=〈q〉+〈B〉(〈Δg'〉−〈Δg〉)
e=〈p'〉〈p〉+〈q'〉〈q〉={〈p〉+(〈Δg'〉−〈Δg〉)〈A〉}{〈p〉+〈A〉(〈Δg'〉−〈Δg〉)}+{〈q〉+(〈Δg'〉−〈Δg〉)〈B〉}{〈q〉+〈B〉(〈Δg'〉−〈Δg〉)}
=〈p〉〈p〉+(〈Δg'〉−〈Δg〉)〈A〉〈A〉(〈Δg'〉−〈Δg〉)+〈q〉〈q〉+(〈Δg'〉−〈Δg〉)〈B〉〈B〉(〈Δg'〉−〈Δg〉)
=〈p〉〈p〉+(〈p'〉−〈p〉)(〈p'〉−〈p〉)+〈q〉〈q〉+(〈q'〉−〈q〉)(〈q'〉−〈q〉)
なお、計算途中で〈A〉〈p〉+〈B〉〈q〉=0を用いた。上式の右辺第2項および第4項は常に零または正値であるから、〈p〉〈p〉+〈q〉〈q〉が最小の値をとるのは〈p'〉=〈p〉、かつ〈q'〉=〈q〉以外にない。
〈N〉は対称行列であるので行列の微分公式を用いると、式(28)より式(29)、式(30)が得られる。
Figure 0004052588
Figure 0004052588
故に、式(28)は〈Δg〉〈N〉+〈m〉=0となり、この転置をとると式(31)が得られる。

〈N〉〈Δg〉+〈m〉=0 (31)
係数行列〈N〉は、m行m列の正方かつ対称行列である。〈N〉が正則であれば逆行列が存在して、補正値〈Δg〉は式(32)で求められる。すなわち、行列〈N〉の逆行列とベクトル〈m〉を乗算することで補正値〈Δg〉を求めることができる。

〈Δg〉=−〈N〉-1〈m〉=−(〈A〉〈A〉+〈B〉〈B〉)-1(〈A〉〈s〉+〈B〉〈r〉) (32)
よって、大域的動き予測情報の最適値〈Δg〉は、式(33)で求められる。また、〈g〉+〈Δg〉を新たな近似値として処理を反復することで〈g〉の精度を向上させることができる。この場合、2乗誤差eが予め定めた閾値を下回るまで処理を繰り返すか、または所定の回数だけ処理を繰り返すことで最終的な大域的動き予測情報の最適値〈g〉を得るようにすることができる。

〈g〉=〈g〉+〈Δg〉 (33)
このとき、2乗誤差eを最小にする推定誤差値〈p〉および〈q〉は、式(34)により求められる。

〈p〉=〈A〉〈g〉+〈s〉=〈s〉−〈A〉(〈A〉〈A〉+〈B〉〈B〉)-1(〈A〉〈s〉+〈B〉〈r〉)
〈q〉=〈B〉〈g〉+〈r〉=〈r〉−〈B〉(〈A〉〈A〉+〈B〉〈B〉)-1(〈A〉〈s〉+〈B〉〈r〉) (34)
次に、図面を参照して本発明の実施形態について説明する。図2は、上記原理による本発明に係る動き予測情報検出装置における処理手順を示すフロー図である。本例の処理を実行する手段は、ソフトウエアあるいはハードウエアで構成することができる。以下では、各ステップがそれを実行する手段であるとして説明する。
本実施形態の動き予測情報検出装置は、初期値推定手段1、補正値取得手段2、補正手段3および精度評価手段4を備える。補正値取得手段2は、導関数行列算出手段2−1と導関数ベクトル算出手段2−2と補正ベクトル算出手段2−3を備える。
なお、初期値推定手段1、補正値取得手段2および補正手段3で処理する大域的動き予測情報の要素数、すなわちパラメータ数、および適用される大域的写像変換関数は任意であり、限定されない。
まず、初期値推定手段1は、処理対象画像から局所的動き予測情報を取得し、複数の局所的動き予測情報の中央値や周囲の局所的動き予測情報との類似性を重みとした重み付け平均値、あるいは処理対象画素データのアクティビティを重みとした重み付き平均値などを算出して大域的動き予測情報の並進成分の近似値と推定し、第1回目の反復処理の大域的予測情報の初期値〈g〉とする。このときに用いる局所的動き予測情報は、フレーム画面全体あるいはその一部についてのものにすることができる。
補正値取得手段2の導関数行列算出手段2−1は、適用する大域的写像変換関数の導関数を2つ組み合わせた積に、大域的動き予測の推定値および大域的動き予測情報を推定するのに用いる局所的動き予測情報を持つ対象画素データの座標を代入し、それぞれの総和を要素とした導関数行列〈N〉を求める。
補正値取得手段2の導関数ベクトル算出手段2−2は、局所的動き予測情報による参照位置と大域的動き予測情報の推定値による参照位置との差分に大域的変換写像関数の導関数を乗じて処理対象座標を代入し、それぞれの総和を要素とした導関数ベクトル〈m〉を求める。
補正値取得手段2の補正ベクトル算出手段2−3は、導関数行列〈N〉の逆行列と導関数ベクトル〈m〉の行列積から補正値〈g〉を求める。あるいは、導関数行列〈N〉のコレスキー(Cholesky)分解から下三角行列と導関数ベクトル〈m〉の後退代入によって補正値〈Δg〉を求める。
補正手段3は、大域的動き予測情報の推定値〈g〉と補正値〈Δg〉を加算して新たな大域的動き予測情報の推定値〈g〉を求める。
精度評価手段4は、新たな大域的動き予測情報の推定値〈g〉による参照座標と局所的動き予測情報による参照座標の2乗誤差を算出して反復処理の必要性を評価する。補正値〈Δg〉のノルムでもって2乗誤差の評価基準に代えることもできる。
精度評価手段4による評価基準が十分小であれば処理を終了し、大域的動き予測情報の推定値〈g〉を最終的な大域的動き予測情報とする。また、評価基準が十分小でなければ補正された大域的動き予測情報の推定値〈g〉を新たな推定値〈g〉として、補正値取得手段2からの処理を繰り返す。ただし、大域的動き予測情報の推定値に対する補正値の収束生が悪い場合を勘案して、反復処理の終了判断には予め反復回数の上限を設定してこれを超えないようにしておくのが好ましい。
次に、大域的写像変換関数に射影変換を適用した本発明の具体例を説明する。まず、m=8とした写像変換関数fおよびhを式(35)、式(36)式で与える。

x"=f(x,y,g)=(gx+gy+g) /(gx+g+1 ) (35)

y"=h(x,y,g)=(gx+gy+g) /(gx+g+1 ) (36)
このとき、写像変換関数fを大域的動き予測情報gで偏微分したf は、式(37)で与えられる。一方、写像変換関数hを大域的動き予測情報gで偏微分したh は、式(38)で与えられる。
Figure 0004052588
Figure 0004052588
よって、行列〈N〉は、式(39)で与えられる。ただし、式(39)の[ ]はガウス(Gauss)の和の記号で、式(40)で表され、偏微分された写像変換関数f に個々の座標(x,y)を代入して和を計算した項になる。
Figure 0004052588
Figure 0004052588
一方、ベクトル〈m〉は、式(41)で与えられる。
Figure 0004052588
入力されたフレームにおける個々の座標(x,y)、その座標が持つ局所的動き予測情報(u,v)および大域的動き予測情報を推定した近似値から導いた座標(x ,y )、写像変換関数fおよびhをそれぞれ大域的動き予測情報gで偏微分したf およびh から行列〈N〉およびベクトル〈m〉を求めることができる。
大域的動き予測情報の補正値の組〈Δg〉は、−〈N〉-1〈m〉を計算することで得ることができる。このとき、〈N〉は対称行列であるので、逆行列〈N〉-1を計算する必要はなく、コレスキー分解によって〈N〉を下三角行列と上三角行列に分解し、〈m〉に下三角行列の後退代入および上三角行列の後退代入を段階的に行えばよい。
下三角行列〈L〉は〈N〉=〈L〉〈L〉で計算でき、〈N〉〈Δg〉+〈m〉=0より、〈L〉(〈L〉〈Δg〉)=−〈m〉と変形することができるので、後退代入によってまず〈L〉〈Δg〉を求め、続けて〈Δg〉を求めることができる。
また、〈g〉+〈Δg〉を新たな近似値〈g〉として〈m〉が所定の許容値以下になるまで、あるいは反復回数が所定の回数を超えるまで処理を反復することで精度を向上させることができる。
次に、大域的写像変換関数にアフィン(Affine)変換を適用した本発明の別の具体例を説明する。まず、m=6としたアフィン変換関数fおよびhを式(42)、式(43)で与える。

x"=f(x,y,g)=gx+gy+g (42)

y"=h(x,y,g)=gx+gy+g (43)
このとき、写像変換関数fを大域的動き予測情報gで偏微分したf は、式(44)で与えられる。一方、写像変換関数hを大域的動き予測情報gで偏微分したh は、式(45)で与えられる。
Figure 0004052588
Figure 0004052588
よって、行列〈N〉は、式(46)で与えられる。ただし、[ ]はガウスの和の記号を表す。
Figure 0004052588
一方、ベクトル〈m〉は、式(47)で与えられる。
Figure 0004052588
アフィン変換は、先の具体例の射影変換と異なり、変換後の座標x",y"が未知のパラメータをひとつも共有していないので、式(31)は式(48)と書ける。なお、式(48)の〈N11〉,〈N22〉,〈m〉,〈m〉は式(49)で定義される。このように大域的動き予測情報の補正値の導出式をより小さな式の組み合わせに分割できるので、解の計算が容易になる。また、〈N11〉,〈N22〉は定数行列であるので予め計算しておくことができる。
Figure 0004052588
Figure 0004052588
式(48)から式(50)が得られ、未知数gが6個から3個に減った小さな導出式を計算すればよいので解の計算が容易になる。
Figure 0004052588
さらに写像変換関数fおよびhは2次以上の高次偏微分項が存在しないので、行列〈N〉は大域的動き予測情報gに依存しない定数行列となる。〈N11〉,〈N22〉は下記(51)式で表され、簡略化される。ただし[ ]は、ガウスの和の記号を示す。
Figure 0004052588
一般に反復計算による精度向上に際しては反復ごとに行列〈N〉とベクトル〈m〉を更新する必要があるが、アフィン変換の場合は行列〈N〉を再計算して更新する必要がないので計算量を大幅に削減できる。このとき、行列〈N〉は座標(x,y)にのみ依存する行列となり、nとnをそれぞれマクロブロックの横の個数と縦の個数とすると、〈N11〉,〈N12〉は下記(52)式で求められる。
Figure 0004052588
ただし、局所的動き予測情報の数nはn=nnとし、ひとつのマクロブロックに対してひとつの座標をサンプルとする。サンプルの座標(x,y)はマクロブロックの中心座標とする。これによって、行列〈N〉の算出に際しn要素の和を計算する必要もない。また、コレスキー分解も予め計算しておくことが可能である。もし局所的動き予測情報を持たない座標があったとしても、該当する座標が及ぼす影響を式(52)から引くことで対応できる。
大域的写像変換関数にアフィン変換を適用する場合には、写像変換関数fおよびhは線形であるのでテイラー展開による近似が必要ない。さらに、写像変換関数fおよびhは大域的動き予測情報gに対して1次式であるから高次偏微分項が存在しない。よって、式(31)は初期値〈g〉に対する補正値〈Δg〉を決定するための近似式ではなく、最適値〈g〉そのものを決定する式となる。したがって、この場合には初期値〈g〉を更新しての反復処理を省略して式(53)により代数的に最適値〈g〉を得ることができる。
Figure 0004052588
また、大域的動き予測情報gからアフィン変換の動きを直感的に理解するためにパラメータを変更して表現させることもできる。アフィン変換は並進成分(m,m)、回転角度θ、せん断率d、拡大縮小率(s,s)の6変数によって式(54)で表され、大域的動き予測情報gとの対応は式(55)で表されるので、式(56)が導出される。
Figure 0004052588
Figure 0004052588
θ=tan−1(−g/g)
s=g/cosθ
s=gsinθ+gcosθ
d=(gcosθ−gsinθ)/s
m=g
m=g (56)
本発明によれば、複数の局所的動き予測情報から、大域的動き予測の写像方式に依存せず、任意の写像変換関数に対して最適なパラメータからなる大域的動き予測情報を高精度で推定することができる。大域的動き予測情報は、MPEG-4においてGlobal Motion Vector(GMV)としてそのまま利用することができ、また、MPEG-7においては写像パラメータ記述子またはカメラパラメータ記述子などに利用することができ、コンテンツの内容理解の一助として利用することもできる。
局所的動き予測情報の具体例を示す図である。 本発明に係る動き予測情報検出装置における処理手順を示すフロー図である。
符号の説明
1・・・初期値推定手段、2・・・補正値取得手段、2−1・・・導関数行列算出手段、2−2・・・導関数ベクトル算出手段、2−3・・・補正ベクトル算出手段、3・・・補正手段、4・・・精度評価手段

Claims (16)

  1. 処理対象画像における局所的動き予測情報から大域的動き予測情報を推定する動き予測情報検出装置において、
    局所的動き予測情報から大域的動き予測情報の初期値を推定し、推定された大域的動き予測情報を出力する初期値推定手段と、
    推定された大域的動き予測情報を入力とし、該大域的動き予測情報の補正値を大域的写像変換関数を用いて導出する補正値取得手段と、
    前記補正値取得手段で導出された補正値で大域的動き予測情報を補正し、推定された大域的動き予測情報とする補正手段とを備え
    前記補正値取得手段は、大域的動き予測情報を補正する補正値を導出するための導関数行列および導関数ベクトルを求める導関数行列算出手段および導関数ベクトル算出手段と、前記導関数行列と前記導関数ベクトルとを用いた導出式から大域的動き予測情報の補正値を算出する補正値算出手段とを備え、
    前記導関数行列算出手段は、導関数行列の各要素において要素の行番号と列番号を参照して、該行番号の大域的動き予測情報の成分で個々の大域的写像変換関数を偏微分して、反復処理中の大域的動き予測情報の近似値を適用した関数と、該列番号の大域的動き予測情報の成分で個々の大域的写像変換関数を偏微分して、反復処理中の大域的動き予測情報の近似値を適用した関数とを乗算し、全ての大域的写像変換関数ごとに加算した関数に、局所的動き情報を持った個々の座標情報を代入した数値を全て合計した数値で、各要素を構成する導関数行列を算出し、
    前記導関数ベクトル算出手段は、導関数ベクトルの各要素において要素番号を参照して、該要素番号の大域的動き予測情報の成分で個々の大域的写像変換関数を偏微分して、反復処理中の大域的動き予測情報の近似値を適用した関数と、局所的動き情報を適用した座標情報と大域的動き予測情報を適用した座標情報との差分値を乗算し、全ての大域的写像変換関数ごとに加算した関数に、局所的動き情報を持った個々の座標情報を代入した数値を全て合計した数値で、各要素を構成する導関数ベクトルを算出し、
    前記補正値算出手段は、前記導関数行列の逆行列と前記導関数ベクトルを乗算して補正値を算出することを特徴とする動き予測情報検出装置。
  2. 前記初期値推定手段は、前記局所的動き予測情報の全てまたはその一部から大域的動き予測情報の初期値を推定することを特徴とする請求項1に記載の動き予測情報検出装置。
  3. 前記初期値推定手段と前記補正値取得手段と前記補正手段は、大域的動き予測情報の要素数および大域的変換写像関数に対応する構成を有することを特徴とする請求項1に記載の動き予測情報検出装置。
  4. 前記初期値推定手段は、複数の局所的動き予測情報から大域的動き予測情報における並進成分を推定する並進成分推定手段を備えたことを特徴とする請求項1に記載の動き予測情報検出装置。
  5. 前記並進成分推定手段は、複数の局所的動き予測情報の中央値あるいは周囲の局所的動き予測情報との類似性を重みとした重み付き平均値あるいは処理対象画素データのアクティビティを重みとした重み付き平均値で並進成分を推定することを特徴とする請求項4に記載の動き予測情報検出装置。
  6. 前記補正値算出手段が大域的動き予測情報の補正値を算出するために用いる導出式は、小さな導出式の組合せからなることを特徴とする請求項に記載の動き予測情報検出装置。
  7. 前記補正値算出手段が大域的動き予測情報の補正値を算出するために用いる導出式における定数行列の部分は、予め計算されていることを特徴とする請求項に記載の動き予測情報検出装置。
  8. 前記補正値算出手段は、大域的動き予測情報の補正値を算出するために用いる導出式から補正値を算出するに際し、反復して再計算する部分についてはそれ以前の計算結果を利用することを特徴とする請求項に記載の動き予測情報検出装置。
  9. 前記補正値算出手段が大域的動き予測情報の補正値を算出するために用いる導出式において、小さな導出式に用いられる導関数行列の各要素は、座標情報の積和演算、さらには等差数列の公式を用いて簡略化されていることを特徴とする請求項に記載の動き予測情報検出装置。
  10. 前記補正値算出手段は、前記導関数行列を下三角形行列および上三角形行列に分解し、前記導関数ベクトルに一方の下三角形行列との後退代入および他方の上三角形行列との後退代入を段階的に行うことによって上記導関数行列の逆行列算出処理を省略して補正値を算出することを特徴とする請求項に記載の動き予測情報検出装置。
  11. 前記補正手段は、大域的予測情報に補正値を加算して大域的予測情報の精度を向上させる更新手段を備えたことを特徴とする請求項1に記載の動き予測情報検出装置。
  12. 前記補正手段は、補正値により補正した大域的予測情報を他の大域的予測情報形式で表現する手段を備えたことを特徴とする請求項11に記載の動き予測情報検出装置。
  13. 前記補正手段で補正された大域的動き予測情報の精度を評価し、補正された大域的動き予測情報を前記補正値取得手段に入力して処理を反復するか否かを判断する精度評価手段を備えたことを特徴とする請求項1に記載の動き予測情報検出装置。
  14. 前記精度評価手段は、局所的予測情報に対する大域的予測情報の精度の評価基準に基づいて、反復計算により大域的予測情報の精度を向上させる必要性を判断する判断手段を備えたことを特徴とする請求項13に記載の動き予測情報検出装置。
  15. 前記精度評価手段は、局所的予測情報に対する大域的予測情報の精度の評価基準として前記補正値から2乗誤差を算出する算出手段を備えたことを特徴とする請求項14に記載の動き予測情報検出装置。
  16. 前記精度評価手段は、局所的予測情報に対する大域的予測情報の精度の評価基準として前記補正値が所定閾値以下になったか否かをを用いることを特徴とする請求項14に記載の動き予測情報検出装置。
JP2004017302A 2004-01-26 2004-01-26 動き予測情報検出装置 Expired - Fee Related JP4052588B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004017302A JP4052588B2 (ja) 2004-01-26 2004-01-26 動き予測情報検出装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004017302A JP4052588B2 (ja) 2004-01-26 2004-01-26 動き予測情報検出装置

Publications (2)

Publication Number Publication Date
JP2005210613A JP2005210613A (ja) 2005-08-04
JP4052588B2 true JP4052588B2 (ja) 2008-02-27

Family

ID=34902179

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004017302A Expired - Fee Related JP4052588B2 (ja) 2004-01-26 2004-01-26 動き予測情報検出装置

Country Status (1)

Country Link
JP (1) JP4052588B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108880557A (zh) * 2018-05-25 2018-11-23 宿州学院 基于压缩感知的稀疏度自适应变步长匹配追踪方法

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4743601B2 (ja) * 2005-09-21 2011-08-10 Kddi株式会社 動画像処理装置
JP5319867B2 (ja) * 2005-09-28 2013-10-16 Kddi株式会社 情報端末装置
JP5045320B2 (ja) * 2007-09-05 2012-10-10 ソニー株式会社 画像処理装置、および画像処理方法、並びにコンピュータ・プログラム
JP4964937B2 (ja) * 2009-10-06 2012-07-04 株式会社ナナオ 動きベクトル検出装置、フレーム補間処理装置およびそれらの方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108880557A (zh) * 2018-05-25 2018-11-23 宿州学院 基于压缩感知的稀疏度自适应变步长匹配追踪方法

Also Published As

Publication number Publication date
JP2005210613A (ja) 2005-08-04

Similar Documents

Publication Publication Date Title
US8306121B2 (en) Method and apparatus for super-resolution of images
US7440619B2 (en) Image matching method and image interpolation method using the same
EP1978737A2 (en) Frame interpolation apparatus and method
JP2009509408A (ja) 適応的な動き検索範囲
US9177386B2 (en) Image processing apparatus, image processing method, and program
JP2013021635A (ja) 画像処理装置、画像処理方法、プログラム、及び記録媒体
JPH1125277A (ja) 画像間対応検出方法およびその装置
Gong Bernstein filter: A new solver for mean curvature regularized models
US6526095B1 (en) Inter-frame predicted image synthesizing method
JP4052588B2 (ja) 動き予測情報検出装置
US8442118B2 (en) Calculating transformation parameters for image processing
EP2424243B1 (en) Motion estimation using integral projection
JP5467346B2 (ja) 動き推定方法、動き推定装置、及び動き推定プログラム
CN109313795B (zh) 用于超分辨率处理的方法和设备
TW201306593A (zh) 動畫像編碼裝置、動畫像解碼裝置、動畫像編碼方法、動畫像解碼方法、動畫像編碼程式及動畫像解碼程式
CN111986136A (zh) 一种基于泊松概率模型的模糊图像序列融合复原方法
Hardt-Stremayr et al. Towards fully dense direct filter-based monocular visual-inertial odometry
Aravkin et al. Dual smoothing and value function techniques for variational matrix decomposition
TWI559750B (zh) 圖元區塊之寫碼方法和裝置及其重建方法和串流解碼裝置
Shukla et al. Unsteady camera zoom stabilization using slope estimation over interest warping vectors
Young et al. Rate-distortion optimized optical flow estimation
Fiquet et al. Learning to represent and predict evolving visual signals via polar straightening
Fiquet et al. Polar prediction of natural videos
JP4824712B2 (ja) 動き推定精度推定方法、動き推定精度推定装置、動き推定精度推定プログラムおよびそのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2017224169A (ja) 距離画像解像度変換装置、距離画像解像度変換方法及びコンピュータプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050831

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20070815

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070905

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071102

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20071128

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20071130

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101214

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4052588

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131214

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees