JP3591483B2 - 画像復号化方法及び画像復号化装置 - Google Patents
画像復号化方法及び画像復号化装置 Download PDFInfo
- Publication number
- JP3591483B2 JP3591483B2 JP2001136821A JP2001136821A JP3591483B2 JP 3591483 B2 JP3591483 B2 JP 3591483B2 JP 2001136821 A JP2001136821 A JP 2001136821A JP 2001136821 A JP2001136821 A JP 2001136821A JP 3591483 B2 JP3591483 B2 JP 3591483B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- motion
- motion vector
- current frame
- predicted image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
【産業上の利用分野】
本発明は、同一パッチ内のすべての画素が共通の動きベクトルを持つ制約がなく、かつ画素の動きベクトルの水平・垂直成分が隣接画素間距離の整数倍以外の値を取り得る動き補償を行なう画像符号化装置、およびこの符号化装置が出力した符号を受信し復号化する画像復号化装置に関するものである。
【0002】
【従来の技術】
動画像の高能率符号化において、時間的に近接するフレーム間の類似性を活用する動き補償は情報圧縮に大きな効果を示すことが知られている。動き補償の処理を数式を用いて表現すると以下のようになる。符号化しようとしているフレーム(現フレーム)の予測画像をP(x, y)、参照画像(Pと時間的に近接しており、既に符号化が終了しているフレームの復号画像)をR(x, y)とする。また、xとyは整数であるとして、PとRでは座標値が整数である点に画素が存在すると仮定する。このとき、PとRの関係は、
【0003】
【数1】
【0004】
で表される。ただし、画像はn個の小領域(パッチ)に分割されるとして、Piは画像のi番目のパッチに含まれる画素を表している。また、変換関数fi(x, y)とgi(x, y)は現フレームの画像と参照画像との間の空間的な対応を表現している。ここで、Pi内の画素(x, y)の動きベクトルは、(x−fi(x, y), y−gi(x, y))で表すことができる。現在の動画像符号化方式の国際標準のH.261、MPEG1、MPEG2などでは、fi(x, y)とgi(x, y)がxとyに関係のない定数であるブロックマッチングとよばれる方式が採用されている。しかし、これらの標準符号化方式より高い情報圧縮率を達成するには、より高度な動き補償方式を採用することが要求される。このような新しい動き補償方式として、fi(x, y)とgi(x, y)が定数ではなく、同一パッチ内の画素が異なる動きベクトルを持つことを許容する動き補償方式が最近提案されている。これらの方式における変換関数としては、アフィン変換
【0005】
【数2】
【0006】
を用いた例(中屋他、「3角形パッチに基づく動き補償の基礎検討」、電子情報通信学会技術報告、IE90−106、平2−03)や、共1次変換
【0007】
【数3】
【0008】
を用いた例( G. J. Sullivan and R. L. Baker, &#34Motion compensation for video compression using control grid interpolation&#34, Proc. ICASSP ’91 , M9.1, pp.2713−2716, 1991−05)、透視変換
【0009】
【数4】
【0010】
を用いた例(V.Seferdis and M.Ghanbari, &#34General approach to
block−matching motion estimation’’, Optical Engineering, vol. 32, no. 7, pp. 1464−1474, 1993−07)などがすでに報告されている。ここでaij、bij、cijはパッチごとに推定される動きパラメータである。変換関数の値が整数でない場合には、座標値が整数ではなく、参照画像において実際には画素が存在しない点の輝度値を求めることが必要となる。この場合の処理としては、周辺4画素を用いた共1次内挿が使われることが多い。この内挿方式を数式で記述すると、0≦p, q<1として、R(x+p, y+q)は、
【0011】
【数5】
【0012】
で表される。
【0013】
動き情報の伝送の際には、画像符号化装置は何らかの形で変換関数の動きパラメータが特定できる情報を受信側に伝送すればよい。例えば、変換関数にアフィン変換を用い、パッチの形状が3角形であるとする。この場合は、6個の動きパラメータを直接伝送しても、パッチの3個の頂点の動きベクトルを伝送しても、受信側で6個の動きパラメータai1〜ai6を再生することができる。
【0014】
変換関数が定数ではない動き補償方式の特徴は、画素ごとに動きベクトルを求める際に数学的な演算が必要となることである。この動きベクトルの計算(変換関数の計算)のときに、もし送信側と受信側で演算精度に差があると、符号化装置と復号化装置で得られる予測画像が異なるものとなる(ミスマッチが発生する)恐れがある。この予測画像におけるミスマッチは受信側で蓄積する性質を持っているため、フレームごとの誤差はわずかであっても、やがては再生画像の画質に深刻な影響を及ぼす恐れがある。この問題は、ブロック内のすべての画素が同じ動きベクトルに従い、かつその動きベクトルがそのまま動き情報として符号化・伝送されるブロックマッチングにはないものである。
【0015】
この問題への対策に関して、変換関数にアフィン変換(数2)、内挿方式として共1次内挿(数5)を用いた場合を例に挙げて説明する。問題解決の一つの方法として、数2および数5の演算精度を十分に高くすることにより、数5の演算結果の誤差が輝度値の量子化ステップサイズより十分に小さくなるようにする方法が考えられる。この対策を採用した場合について考える。まず、数5の演算精度は十分に高いと仮定する。このとき、例えばR(0, 0)=R(0, 1)=0、R(1, 0)=R(1, 1)=255として、さらに0<x<1、0<y<1とすれば(以後、これを「最悪の条件」とよぶ)、fi(x, y)における大きさ1/255以上の誤差は、必ず輝度値の量子化値の誤差につながることになる(輝度値の量子化ステップサイズは1と仮定した)。したがって、ミスマッチを防ぐためには数2の演算誤差が1/255よりも十分に小さくなるように符号化装置と復号化装置を作成しなければならない。しかし、演算精度を上げることは、一般に数値の内部表現の桁数を増やすことにつながり、演算処理をより複雑にすることになる。動き補償処理において数2および数5はきわめて多くの回数計算されるため、この演算を複雑にすることは、全体の処理量に深刻な影響を及ぼしてしまう。
【0016】
【発明が解決しようとする課題】
同一パッチに所属するすべての画素が共通の動きベクトルを持つ制約がなく、かつ画素の動きベクトルの水平・垂直成分が隣接画素間距離の整数倍以外の値を取り得る動き補償方式において、変換関数の計算に要求される演算精度を下げ、かつ変換関数の演算精度に起因する予測画像のミスマッチの発生を防ぐ手法を提供する。
【0017】
【課題を解決するための手段】
予測画像の合成の際に使われる各画素の動きベクトルの水平、垂直成分が、それぞれ隣接画素間距離の1/d1、1/d2(d1、d2は正の整数)の整数倍の値のみをとるように規定することによって、上記の目的は達成される。
【0018】
【作用】
「課題を解決する手段」で述べた動きベクトルに関する規定を採用すれば、「従来の技術」で述べた最悪の条件を与えた場合に必ず輝度値の量子化値の誤差につながる変換関数fi(x, y)の誤差の大きさは1/d1となる。例えばd1=4とすれば、「従来の技術」で述べた対策と比較してfi(x, y)の演算精度を6ビット下げた場合でも、最悪の条件のもとで予測画像のミスマッチを起こす危険性をほぼ同じレベルに保つことができる。
【0019】
【実施例】
上と同様に変換関数にアフィン変換を用いた場合を例に挙げて、数2の演算方式の実施例を示す。なお、ここでは簡単のため、d1=d2=d(dは正の整数)であると仮定する。また、パッチは3角形であると仮定し、パッチの3個の頂点の動きベクトルが動き情報として伝送されるとする。
【0020】
以下では、図1に示す例を用いて説明する。参照画像101におけるパッチ102が現フレーム106のパッチ107に移動・変形したと推定されたとする(格子点103、104、105がそれぞれ格子点108、109、110に対応している)。このとき、パッチ102の頂点103、104、105の座標をそれぞれ(x1’, y1’)、(x2’, y2’)、(x3’, y3’)、パッチ107の頂点108、109、110の座標をそれぞれ(x1, y1)、(x2, y2)、(x3, y3)であるとすると(座標値はすべて負でない整数とする)、このパッチにおける数2の動きパラメータaijは、
【0021】
【数6】
【0022】
で表される。ここで、割り算の演算を行わずに、aijを分母と分子が整数であるaij=aij’/Diという形のままにしておく。すると、数2の演算結果は、すべてfi(x, y)=fi’(x, y)/Diとgi(x, y)=gi’(x, y)/Diのような整数を分母と分子とする分数の形式で表すことができる。ここで、「//」を整数同士の除算(演算結果の小数成分を切り捨てる除算)と定義し、ki=Di//2として、
【0023】
【数7】
【0024】
とする。Fi(x, y)とGi(x, y)は、fi(x, y)とgi(x, y)を最も近い1/dの整数倍の値に丸め込む関数である。数1においてfi(x, y)とgi(x, y)の代わりにFi(x, y)とGi(x, y)を用いることにより、各画素の動きベクトルの水平・垂直成分が、隣接画素間距離の1/dの整数倍の値のみをとるように制限することができる。また、送信側、受信側で共にFi(x, y)とGi(x,y)を使えば、比較的精度の低い演算で、変換関数の誤差に起因する予測画像のミスマッチを防ぐことが可能となる。
【0025】
図2にd=4である場合にFi(x, y)とGi(x, y)を計算する処理の流れを示す。まず、変形前後のパッチの頂点の座標が201で与えられると、202と204で関数fi’(x, y)とgi’(x, y)を定義し、203で定数Diを求め、205で定数kiを求める。これらの関数と定数を用いて、パッチ内の画素ごとに座標(x, y)からFi(x, y)とGi(x, y)の値を計算する。(x, y)が2進整数表現で与えられると、まず206で積和演算を行うことによってfi’(x, y)とgi’(x, y)の値を求め、この結果を207で2ビット左にシフトすることによって4(=d)倍する。この結果に対して208でkiを加え、さらに209でDiで割る(演算結果の小数成分は切り捨てる)ことによって、4Fi(x,y)と4Gi(x, y)の値を得る。この整数の4Fi(x, y)と4Gi(x, y)に対して、210で下から2桁目と3桁目の間に小数点を置くことによって、Fi(x, y)とGi(x, y)の値を得ることができる(これは、4で割る演算を行ったことと同じ意味を持つ)。
【0026】
dの値は、符号化方式の固定パラメータとして規定しても、可変として画像データを伝送する前に送信側と受信側で取り決めても良い。送信側と受信側が交信を行ってdを取り決める場合の手続きの例を図3に示す。送信側301は、まず通信303において画像符号化装置のハードウエアの制約から、許容できるdの上限が4であることを受信側302に告げる。次に受信側は、画像復号化装置の制約から、dの上限が2であることを通信304で告げる。この結果、送信側は最適なdの値が2であると判断し、以後伝送する画像データはd=2として符号化されたものとなることを通信305で勧告する。そしてこの直後に送信側は通信306で画像データを送信する。一般にdの値が大きい程、装置のハードウェアは複雑になる。したがって、送信側は送信・受信側で低い方のdの上限の値を採用するのが適当であると考えられる。この方式を実現するためには、画像符号化・復号化装置は、自身の上限以下のdに対応できる機能を持たなければならない。
【0027】
dの値としては、乗除算の行ないやすさを考慮して、2のべき乗が良いと考えられる。dの値が大きいほど予測誤差は小さくなるが、予測画像の合成処理は複雑になる。予測特性を考えると、dの値は2以上であることが望ましい。予測特性と処理の複雑さのバランスを考慮すると、具体的なdの値として2、4、8が適当である。
【0028】
なお、以下の変形も本発明に含まれることは明らかである。
【0029】
(1)輝度値の内挿方式として、本明細書では共1次内挿をとりあげたが、これ以外の関数を用いても良い。関数が複雑になれば、演算を簡略化することの効果は大きくなる。
【0030】
(2)変換関数の種類として、本明細書ではアフィン変換を中心にとりあげたが、これ以外の変換関数を用いても良い。変換関数の演算精度に応じてその演算結果が変化する可能性のある限り、本発明は有効である。
【0031】
(3)パッチの形状は、画素の集合を特定するものであれば良く、特に本明細書でとりあげた3角形でなくても良い。
【0032】
(4)空間変換に基づく動き補償において、本明細書でとりあげた例のように伝送される動き情報がパッチの頂点の動きベクトルでなくても良い。動き情報はパッチごとの変換関数を特定するものでありさえすれば良く、例えば数2の動きパラメータaijをそのまま伝送しても良い。このように動きパラメータをそのまま伝送する場合には、本発明を適用することにより、変換関数の演算精度に起因する予測画像のミスマッチを防ぎながら伝送される動きパラメータの精度を下げる(桁数を減らす)ことが可能となる。dの値が小さければ小さいほど動きパラメータの桁数を少なくするができ、この結果として伝送情報量を少なくすることができる。
【0033】
(5)実施例では、d1とd2の値が等しい場合を例示したが、両者が異なっていても良い。
【0034】
(6)本明細書では、現フレームのパッチ構造を固定して参照画像のパッチを変形させる方式に関して説明したが、逆に参照画像のパッチ構造を固定して現フレームのパッチを変形させる方式であっても良い。
【0035】
(7)本明細書では、1個の予測画像を合成するために用いる参照画像の数は1個として説明したが、複数の参照画像を用いる方式であっても良い。
【0036】
【発明の効果】
本発明により、同一パッチに所属するすべての画素が共通の動きベクトルを持つ制約がなく、かつ画素の動きベクトルの水平・垂直成分が隣接画素間距離の整数倍以外の値を取り得る動き補償方式において、予測画像のミスマッチの発生を防ぎながら変換関数の演算精度を下げることができる。また、画像データの伝送の前に送信側と受信側でd1およびd2の値を決める方式では、送信側と受信側の装置の性能に応じて再生画像の最適な画質を決定することができる。
【図面の簡単な説明】
【図1】空間変換に基づく動き補償におけるパッチの移動・変形の例を示した図である。
【図2】動きベクトルの水平・垂直成分を1/4の整数倍に制限したとき(d=4のとき)の変換関数の演算方法の例を示した図である。
【図3】画素の動きベクトルの最小単位である1/dの値を、画像データの通信の前に送信側と受信側の交信によって取り決める方式の例を示した図である。
【符号の説明】
101…動き推定後の参照画像における1個のパッチ、102、107…パッチ、103〜105、108〜110…パッチの頂点、106…現フレームの原画像のすべてのパッチ、201…パッチの頂点の座標値、202〜210…演算手続き、301…送信側の画像符号化装置、302…受信側の画像復号化装置、303〜306…通信手続き。
Claims (10)
- 空間変換に基づく動き補償を用いて現フレームの予測画像の動き情報を推定し、
前記予測画像の各画素の動きベクトルの水平・垂直成分を隣接画素間距離の1/d(dは正の整数)の整数倍に制限して前記動き情報から求めるときの精度dを決定する画像符号化方法によって符号化された符号化画像情報を復号化する画像復号化方法において、
前記空間変換に基づく動き補償によって求められた現フレームの予測画像の動き情報を受けとり、
前記現フレームの予測画像に含まれる各画素の動きベクトルの水平・垂直成分を隣接画素間距離の前記1/dの整数倍に制限して前記動き情報から求めることを特徴とする画像復号化方法。 - 請求項1に記載の画像復号化方法において、前記dの値は、2のw乗(wは正の整数)であることを特徴とする画像復号化方法。
- 請求項1あるいは2に記載の画像復号化方法において、前記動き情報は、前記予測画像のパッチ頂点の動きベクトルであることを特徴とする画像復号化方法。
- 同一パッチ内の画素が異なる動きベクトルを持つことを許容する動き補償を用いて現フレームの予測画像の動き情報を推定し、
前記予測画像の各画素の動きベクトルの水平・垂直成分を隣接画素間距離の1/d(dは正の整数)の整数倍に制限して前記動き情報から求めるときの精度dを決定する画像符号化方法によって符号化された符号化画像情報を復号化する画像復号化方法において、
前記動き補償によって求められた現フレームの予測画像のパッチ頂点の動きベクトルを受けとり、
前記現フレームの予測画像に含まれる各画素の動きベクトルの水平・垂直成分を隣接画素間距離の前記1/dの整数倍に制限して前記パッチ頂点の動きベクトルから求めることを特徴とする画像復号化方法。 - 請求項4に記載の画像復号化方法において、前記dの値は、2のw乗(wは正の整数)であることを特徴とする画像復号化方法。
- 空間変換に基づく動き補償を用いて現フレームの予測画像の動き情報を推定し、
前記予測画像の各画素の動きベクトルの水平・垂直成分を隣接画素間距離の1/d(dは正の整数)の整数倍に制限して前記動き情報から求めるときの精度dを決定する画像符号化方法によって符号化された符号化画像情報を復号化する画像復号化装置において、
前記空間変換に基づく動き補償によって求められた現フレームの予測画像の動き情報を受けとる手段と、
前記現フレームの予測画像に含まれる各画素の動きベクトルの水平・垂直成分を隣接画素間距離の前記1/dの整数倍に制限して前記動き情報から求める手段を有することを特徴とする画像復号化装置。 - 請求項6に記載の画像復号化装置において、前記dの値は、2のw乗(wは正の整数)であることを特徴とする画像復号化装置。
- 請求項6あるいは7に記載の画像復号化装置において、前記動き情報は、前記予測画像のパッチ頂点の動きベクトルであることを特徴とする画像復号化装置。
- 同一パッチ内の画素が異なる動きベクトルを持つことを許容する動き補償を用いて現フレームの予測画像の動き情報を推定し、
前記予測画像の各画素の動きベクトルの水平・垂直成分を隣接画素間距離の1/d(dは正の整数)の整数倍に制限して前記動き情報から求めるときの精度dを決定する画像符号化方法によって符号化された符号化画像情報を復号化する画像復号化装置において、
前記動き補償によって求められた現フレームの予測画像のパッチ頂点の動きベクトルを受けとる手段と、
前記現フレームの予測画像に含まれる各画素の動きベクトルの水平・垂直成分を隣接画素間距離の前記1/dの整数倍に制限して前記パッチ頂点の動きベクトルから求める手段を特徴とする画像復号化装置。 - 請求項9に記載の画像復号化装置において、前記dの値は、2のw乗(wは正の整数)であることを特徴とする画像復号化装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001136821A JP3591483B2 (ja) | 2001-05-08 | 2001-05-08 | 画像復号化方法及び画像復号化装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001136821A JP3591483B2 (ja) | 2001-05-08 | 2001-05-08 | 画像復号化方法及び画像復号化装置 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP19397094A Division JP3218874B2 (ja) | 1994-08-18 | 1994-08-18 | 画像符号化装置及び画像符号化方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2001320714A JP2001320714A (ja) | 2001-11-16 |
JP3591483B2 true JP3591483B2 (ja) | 2004-11-17 |
Family
ID=18984020
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001136821A Expired - Lifetime JP3591483B2 (ja) | 2001-05-08 | 2001-05-08 | 画像復号化方法及び画像復号化装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3591483B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010246150A (ja) * | 2010-07-12 | 2010-10-28 | Hitachi Ltd | 画像復号化方法及び画像符号復号装置 |
-
2001
- 2001-05-08 JP JP2001136821A patent/JP3591483B2/ja not_active Expired - Lifetime
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010246150A (ja) * | 2010-07-12 | 2010-10-28 | Hitachi Ltd | 画像復号化方法及び画像符号復号装置 |
JP4609602B2 (ja) * | 2010-07-12 | 2011-01-12 | 株式会社日立製作所 | 画像復号化方法及び画像符号復号装置 |
Also Published As
Publication number | Publication date |
---|---|
JP2001320714A (ja) | 2001-11-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8155199B2 (en) | Video coding method and apparatus for calculating motion vectors of the vertices of a patch of an image and transmitting information of horizontal and vertical components of the motion vectors | |
JP3183155B2 (ja) | 画像復号化装置、及び、画像復号化方法 | |
US20090168889A1 (en) | Inter-frame predicted image synthesizing method | |
JPH08265780A (ja) | ビデオ信号符号化/復号化装置及び方法 | |
JP3218874B2 (ja) | 画像符号化装置及び画像符号化方法 | |
JP3591483B2 (ja) | 画像復号化方法及び画像復号化装置 | |
JP3509610B2 (ja) | 画像符号化方法及び画像符号化装置 | |
JP3921441B2 (ja) | 画像符号化・復号化方法及び画像符号復号装置 | |
JP3414304B2 (ja) | 画像復号化方法及び復号化装置 | |
JP4052341B2 (ja) | 画像復号化方法及び画像復号化装置 | |
JP4591495B2 (ja) | 画像符号化方法および画像符号化装置 | |
JP4609602B2 (ja) | 画像復号化方法及び画像符号復号装置 | |
JP3864977B2 (ja) | 画像符号化方法及び画像符号化装置 | |
JP3777998B2 (ja) | グローバル動き補償方法 | |
JP3183277B2 (ja) | 画像符号化装置、及び、画像符号化方法 | |
JPH11346367A (ja) | 画像符号化および復号化方法 | |
JP2001136537A (ja) | 画像符号化および復号化方法 | |
JP2001145115A (ja) | 画像符号化および復号化方法 | |
JPH10285598A (ja) | 画像符号化/復号化装置 | |
JP2001352548A (ja) | 画像符号化装置及び画像符号化方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040323 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040524 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20040803 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20040816 |
|
FPAY | Renewal fee payment (prs date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080903 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (prs date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080903 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (prs date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090903 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (prs date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090903 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (prs date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100903 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (prs date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100903 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (prs date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110903 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (prs date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120903 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (prs date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130903 Year of fee payment: 9 |
|
EXPY | Cancellation because of completion of term |