JP2003204557A - 画像符号化・復号化方法及び画像符号復号装置 - Google Patents
画像符号化・復号化方法及び画像符号復号装置Info
- Publication number
- JP2003204557A JP2003204557A JP2002346762A JP2002346762A JP2003204557A JP 2003204557 A JP2003204557 A JP 2003204557A JP 2002346762 A JP2002346762 A JP 2002346762A JP 2002346762 A JP2002346762 A JP 2002346762A JP 2003204557 A JP2003204557 A JP 2003204557A
- Authority
- JP
- Japan
- Prior art keywords
- image
- motion vector
- motion
- patch
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Abstract
動きベクトルを持つ制約がなく、かつ画素の動きベクト
ルの水平・垂直成分が隣接画素間距離の整数倍以外の値
を取り得る動き補償方式に関し、動きベクトルの演算精
度の差に起因する予測画像のミスマッチを、演算を複雑
にせずに防ぐ方法を提供する。 【解決手段】 予測画像の合成に使われる各画素の動き
ベクトルの水平、垂直成分が、それぞれ隣接画素間距離
の1/d1、1/d2(d1、d2は正の整数)の整数倍の
値のみをとるように規定する。 【効果】 簡単な演算で動きベクトルの演算精度の差に
起因する予測画像のミスマッチを防ぐことが可能とな
り、処理の簡略化につながる。
Description
べての画素が共通の動きベクトルを持つ制約がなく、か
つ画素の動きベクトルの水平・垂直成分が隣接画素間距
離の整数倍以外の値を取り得る動き補償を行なう画像符
号化装置、およびこの符号化装置が出力した符号を受信
し復号化する画像復号化装置に関するものである。
に近接するフレーム間の類似性を活用する動き補償は情
報圧縮に大きな効果を示すことが知られている。動き補
償の処理を数式を用いて表現すると以下のようになる。
符号化しようとしているフレーム(現フレーム)の予測
画像をP(x, y)、参照画像(Pと時間的に近接してお
り、既に符号化が終了しているフレームの復号画像)を
R(x, y)とする。また、xとyは整数であるとして、
PとRでは座標値が整数である点に画素が存在すると仮
定する。このとき、PとRの関係は、
(パッチ)に分割されるとして、Piは画像のi番目の
パッチに含まれる画素を表している。また、変換関数f
i(x,y)とgi(x, y)は現フレームの画像と参照画像
との間の空間的な対応を表現している。ここで、Pi内
の画素(x, y)の動きベクトルは、(x−fi(x, y),
y−gi(x, y))で表すことができる。現在の動画像符
号化方式の国際標準のH.261、MPEG1、MPE
G2などでは、fi(x, y)とgi(x, y)がxとyに関
係のない定数であるブロックマッチングとよばれる方式
が採用されている。しかし、これらの標準符号化方式よ
り高い情報圧縮率を達成するには、より高度な動き補償
方式を採用することが要求される。このような新しい動
き補償方式として、fi(x, y)とgi(x, y)が定数で
はなく、同一パッチ内の画素が異なる動きベクトルを持
つことを許容する動き補償方式が最近提案されている。
これらの方式における変換関数としては、アフィン変換
づく動き補償の基礎検討」、電子情報通信学会技術報
告、IE90-106、平2-03)や、共1次変換
Baker, “Motion compensation for video compressio
n using control grid interpolation“, Proc. ICASSP
'91 ,M9.1, pp.2713-2716, 1991-05)、透視変換
“General approach to block-matching motion esti
mation”, Optical Engineering, vol.32, no.7, pp.14
64-1474, 1993-07)などがすでに報告されている。ここ
でaij、bij、cijはパッチごとに推定される動きパラ
メータである。変換関数の値が整数でない場合には、座
標値が整数ではなく、参照画像において実際には画素が
存在しない点の輝度値を求めることが必要となる。この
場合の処理としては、周辺4画素を用いた共1次内挿が
使われることが多い。この内挿方式を数式で記述する
と、0≦p, q<1として、R(x+p, y+q)は、
は何らかの形で変換関数の動きパラメータが特定できる
情報を受信側に伝送すればよい。例えば、変換関数にア
フィン変換を用い、パッチの形状が3角形であるとす
る。この場合は、6個の動きパラメータを直接伝送して
も、パッチの3個の頂点の動きベクトルを伝送しても、
受信側で6個の動きパラメータai1〜ai6を再生するこ
とができる。
徴は、画素ごとに動きベクトルを求める際に数学的な演
算が必要となることである。この動きベクトルの計算
(変換関数の計算)のときに、もし送信側と受信側で演
算精度に差があると、符号化装置と復号化装置で得られ
る予測画像が異なるものとなる(ミスマッチが発生す
る)恐れがある。この予測画像におけるミスマッチは受
信側で蓄積する性質を持っているため、フレームごとの
誤差はわずかであっても、やがては再生画像の画質に深
刻な影響を及ぼす恐れがある。この問題は、ブロック内
のすべての画素が同じ動きベクトルに従い、かつその動
きベクトルがそのまま動き情報として符号化・伝送され
るブロックマッチングにはないものである。
フィン変換(数2)、内挿方式として共1次内挿(数
5)を用いた場合を例に挙げて説明する。問題解決の一
つの方法として、数2および数5の演算精度を十分に高
くすることにより、数5の演算結果の誤差が輝度値の量
子化ステップサイズより十分に小さくなるようにする方
法が考えられる。この対策を採用した場合について考え
る。まず、数5の演算精度は十分に高いと仮定する。こ
のとき、例えばR(0, 0)=R(0, 1)=0、R(1,
0)=R(1, 1)=255として、さらに0<x<1、
0<y<1とすれば(以後、これを「最悪の条件」とよ
ぶ)、fi(x, y)における大きさ1/255以上の誤
差は、必ず輝度値の量子化値の誤差につながることにな
る(輝度値の量子化ステップサイズは1と仮定した)。
したがって、ミスマッチを防ぐためには数2の演算誤差
が1/255よりも十分に小さくなるように符号化装置
と復号化装置を作成しなければならない。しかし、演算
精度を上げることは、一般に数値の内部表現の桁数を増
やすことにつながり、演算処理をより複雑にすることに
なる。動き補償処理において数2および数5はきわめて
多くの回数計算されるため、この演算を複雑にすること
は、全体の処理量に深刻な影響を及ぼしてしまう。
すべての画素が共通の動きベクトルを持つ制約がなく、
かつ画素の動きベクトルの水平・垂直成分が隣接画素間
距離の整数倍以外の値を取り得る動き補償方式におい
て、変換関数の計算に要求される演算精度を下げ、かつ
変換関数の演算精度に起因する予測画像のミスマッチの
発生を防ぐ手法を提供する。
われる各画素の動きベクトルの水平、垂直成分が、それ
ぞれ隣接画素間距離の1/d1、1/d2(d1、d2は正
の整数)の整数倍の値のみをとるように規定することに
よって、上記の目的は達成される。
トルに関する規定を採用すれば、「従来の技術」で述べ
た最悪の条件を与えた場合に必ず輝度値の量子化値の誤
差につながる変換関数fi(x, y)の誤差の大きさは1
/d1となる。例えばd1=4とすれば、「従来の技術」
で述べた対策と比較してfi(x, y)の演算精度を6ビ
ット下げた場合でも、最悪の条件のもとで予測画像のミ
スマッチを起こす危険性をほぼ同じレベルに保つことが
できる。
換を用いた場合を例に挙げて、数2の演算方式の実施例
を示す。なお、ここでは簡単のため、d1=d2=d(d
は正の整数)であると仮定する。また、パッチは3角形
であると仮定し、パッチの3個の頂点の動きベクトルが
動き情報として伝送されるとする。
る。参照画像101におけるパッチ102が現フレーム
106のパッチ107に移動・変形したと推定されたと
する(格子点103、104、105がそれぞれ格子点
108、109、110に対応している)。このとき、
パッチ102の頂点103、104、105の座標をそ
れぞれ(x1', y1')、(x2', y2')、(x3', y3')、パ
ッチ107の頂点108、109、110の座標をそれ
ぞれ(x1, y1)、(x2, y2)、(x3, y3)であるとする
と(座標値はすべて負でない整数とする)、このパッチ
における数2の動きパラメータaijは、
ずに、aijを分母と分子が整数であるaij=aij'/Di
という形のままにしておく。すると、数2の演算結果
は、すべてfi(x, y)=fi'(x, y)/Diとgi(x,
y)=gi'(x, y)/Diのような整数を分母と分子とす
る分数の形式で表すことができる。ここで、「//」を整
数同士の除算(演算結果の小数成分を切り捨てる除算)
と定義し、ki=Di//2として、
i(x, y)とgi(x, y)を最も近い1/dの整数倍の値
に丸め込む関数である。数1においてfi(x, y)とgi
(x,y)の代わりにFi(x, y)とGi(x, y)を用いる
ことにより、各画素の動きベクトルの水平・垂直成分
が、隣接画素間距離の1/dの整数倍の値のみをとるよ
うに制限することができる。また、送信側、受信側で共
にFi(x, y)とGi(x,y)を使えば、比較的精度の低
い演算で、変換関数の誤差に起因する予測画像のミスマ
ッチを防ぐことが可能となる。
Gi(x, y)を計算する処理の流れを示す。まず、変形
前後のパッチの頂点の座標が201で与えられると、2
02と204で関数fi'(x, y)とgi'(x, y)を定義
し、203で定数Diを求め、205で定数kiを求め
る。これらの関数と定数を用いて、パッチ内の画素ごと
に座標(x, y)からFi(x, y)とGi(x, y)の値を計
算する。(x, y)が2進整数表現で与えられると、まず
206で積和演算を行うことによってfi'(x,y)とg
i'(x, y)の値を求め、この結果を207で2ビット左
にシフトすることによって4(=d)倍する。この結果
に対して208でkiを加え、さらに209でDiで割る
(演算結果の小数成分は切り捨てる)ことによって、4
Fi(x,y)と4Gi(x, y)の値を得る。この整数の4
Fi(x, y)と4Gi(x, y)に対して、210で下から
2桁目と3桁目の間に小数点を置くことによって、Fi
(x, y)とGi(x, y)の値を得ることができる(これ
は、4で割る演算を行ったことと同じ意味を持つ)。
して規定しても、可変として画像データを伝送する前に
送信側と受信側で取り決めても良い。送信側と受信側が
交信を行ってdを取り決める場合の手続きの例を図3に
示す。送信側301は、まず通信303において画像符
号化装置のハードウエアの制約から、許容できるdの上
限が4であることを受信側302に告げる。次に受信側
は、画像復号化装置の制約から、dの上限が2であるこ
とを通信304で告げる。この結果、送信側は最適なd
の値が2であると判断し、以後伝送する画像データはd
=2として符号化されたものとなることを通信305で
勧告する。そしてこの直後に送信側は通信306で画像
データを送信する。一般にdの値が大きい程、装置のハ
ードウェアは複雑になる。したがって、送信側は送信・
受信側で低い方のdの上限の値を採用するのが適当であ
ると考えられる。この方式を実現するためには、画像符
号化・復号化装置は、自身の上限以下のdに対応できる
機能を持たなければならない。
考慮して、2のべき乗が良いと考えられる。dの値が大
きいほど予測誤差は小さくなるが、予測画像の合成処理
は複雑になる。予測特性を考えると、dの値は2以上で
あることが望ましい。予測特性と処理の複雑さのバラン
スを考慮すると、具体的なdの値として2、4、8が適
当である。
は明らかである。
では共1次内挿をとりあげたが、これ以外の関数を用い
ても良い。関数が複雑になれば、演算を簡略化すること
の効果は大きくなる。
はアフィン変換を中心にとりあげたが、これ以外の変換
関数を用いても良い。変換関数の演算精度に応じてその
演算結果が変化する可能性のある限り、本発明は有効で
ある。
するものであれば良く、特に本明細書でとりあげた3角
形でなくても良い。
て、本明細書でとりあげた例のように伝送される動き情
報がパッチの頂点の動きベクトルでなくても良い。動き
情報はパッチごとの変換関数を特定するものでありさえ
すれば良く、例えば数2の動きパラメータaijをそのま
ま伝送しても良い。このように動きパラメータをそのま
ま伝送する場合には、本発明を適用することにより、変
換関数の演算精度に起因する予測画像のミスマッチを防
ぎながら伝送される動きパラメータの精度を下げる(桁
数を減らす)ことが可能となる。dの値が小さければ小
さいほど動きパラメータの桁数を少なくするができ、こ
の結果として伝送情報量を少なくすることができる。
場合を例示したが、両者が異なっていても良い。
構造を固定して参照画像のパッチを変形させる方式に関
して説明したが、逆に参照画像のパッチ構造を固定して
現フレームのパッチを変形させる方式であっても良い。
成するために用いる参照画像の数は1個として説明した
が、複数の参照画像を用いる方式であっても良い。
べての画素が共通の動きベクトルを持つ制約がなく、か
つ画素の動きベクトルの水平・垂直成分が隣接画素間距
離の整数倍以外の値を取り得る動き補償方式において、
予測画像のミスマッチの発生を防ぎながら変換関数の演
算精度を下げることができる。また、画像データの伝送
の前に送信側と受信側でd1およびd2の値を決める方式
では、送信側と受信側の装置の性能に応じて再生画像の
最適な画質を決定することができる。
動・変形の例を示した図である。
倍に制限したとき(d=4のとき)の変換関数の演算方
法の例を示した図である。
値を、画像データの通信の前に送信側と受信側の交信に
よって取り決める方式の例を示した図である。
102、107…パッチ、103〜105、108〜1
10…パッチの頂点、106…現フレームの原画像のす
べてのパッチ、201…パッチの頂点の座標値、202
〜210…演算手続き、301…送信側の画像符号化装
置、302…受信側の画像復号化装置、303〜306
…通信手続き。
Claims (10)
- 【請求項1】参照画像と現フレームの原画像との間で空
間変換に基づく動き補償を行い現フレームの予測画像の
動き情報を推定し、前記予測画像の各画素の動きベクト
ルの水平・垂直成分を隣接画素間距離の1/dの整数倍
に制限して前記動き情報から求めるときの前記dを決定
し、前記動き情報及び前記dの値を特定する情報を伝送
し、前記伝送された動き情報、及び前記dの値を特定す
る情報を受けとり、前記現フレームの予測画像に含まれ
る各画素の動きベクトルの水平・垂直成分を隣接画素間
距離の1/dの整数倍に制限して前記動き情報から求め
ることを特徴とする画像符号化・復号化方法。 - 【請求項2】請求項1に記載の画像符号化・復号化方法
において、前記dの値は、2のw乗(wは正の整数)で
あることを特徴とする画像符号化・復号化方法。 - 【請求項3】請求項1あるいは2に記載の画像符号化・
復号化方法において、前記動き情報は、前記予測画像の
パッチ頂点の動きベクトルであることを特徴とする画像
符号化・復号化方法。 - 【請求項4】同一パッチ内の画素が異なる動きベクトル
を持つことを許容する動き補償を行う画像符号化・復号
化方法であって、参照フレームと現フレームの原画像と
の間で前記動き補償を行い、現フレームの予測画像のパ
ッチ頂点の動きベクトルを推定し、前記予測画像の各画
素の動きベクトルの水平・垂直成分を隣接画素間距離の
1/dの整数倍に制限して前記パッチ頂点の動きベクト
ルから求めるときの前記dを決定し、前記パッチ頂点の
動きベクトル及び前記dの値を特定する情報を伝送し、
前記パッチ頂点の動きベクトル及び前記dの値を特定す
る情報を受けとり、前記パッチ内の各画素の動きベクト
ルの水平・垂直成分を隣接画素間距離の1/dの整数倍
に制限して前記パッチ頂点の動きベクトルから求めるこ
とを特徴とする画像符号化・復号化方法。 - 【請求項5】請求項4に記載の画像符号化・復号化方法
において、前記dの値は、2のw乗(wは正の整数)で
あることを特徴とする画像符号化・復号化方法。 - 【請求項6】画像符号化及び復号化装置を備える画像符
号復号化装置であって、前記画像符号化装置は、参照画
像と現フレームの原画像との間で空間変換に基づく動き
補償を行い現フレームの予測画像の動き情報を推定する
手段と、前記予測画像の各画素の動きベクトルの水平・
垂直成分を隣接画素間距離の1/dの整数倍に制限して
前記動き情報から求めるときの前記dを決定する手段
と、前記動き情報及び前記dの値を特定する情報を伝送
する手段とを有し前記復号化装置は、前記伝送された動
き情報、及び前記dの値を特定する情報を受けとる手段
と、前記現フレームの予測画像に含まれる各画素の動き
ベクトルの水平・垂直成分を隣接画素間距離の1/dの
整数倍に制限して前記動き情報から求める手段とを有す
ることを特徴とする画像符号復号化装置。 - 【請求項7】請求項6に記載の画像符号復号化装置にお
いて、前記dの値は、2のw乗(wは正の整数)である
ことを特徴とする画像符号復号化装置。 - 【請求項8】請求項6あるいは7に記載の画像符号復号
化装置において、前記動き情報は、前記予測画像のパッ
チ頂点の動きベクトルであることを特徴とする画像符号
復号化装置。 - 【請求項9】同一パッチ内の画素が異なる動きベクトル
を持つことを許容する動き補償を用いる画像符号復号化
装置であって、画像符号化及び復号化装置を備え、前記
画像符号化装置は、参照フレームと現フレームの原画像
との間で前記動き補償を行い、現フレームの予測画像の
パッチ頂点の動きベクトルを推定する手段と、前記予測
画像の各画素の動きベクトルの水平・垂直成分を隣接画
素間距離の1/dの整数倍に制限して前記パッチ頂点の
動きベクトルから求めるときの前記dを決定する手段
と、前記パッチ頂点の動きベクトル及び前記dの値を特
定する情報を伝送する手段とを有し、前記復号化装置
は、前記パッチ頂点の動きベクトル及びdの値を特定す
る情報を受けとる手段と、前記パッチ内の各画素の動き
ベクトルの水平・垂直成分を隣接画素間距離の1/dの
整数倍に制限して前記パッチ頂点の動きベクトルから求
める手段とを有することを特徴とする画像符号復号化装
置。 - 【請求項10】請求項4に記載の画像符号復号化装置に
おいて、前記dの値は、2のw乗(wは正の整数)であ
ることを特徴とする画像符号復号化装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002346762A JP3921441B2 (ja) | 2002-11-29 | 2002-11-29 | 画像符号化・復号化方法及び画像符号復号装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002346762A JP3921441B2 (ja) | 2002-11-29 | 2002-11-29 | 画像符号化・復号化方法及び画像符号復号装置 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP05224499A Division JP3414304B2 (ja) | 1999-03-01 | 1999-03-01 | 画像復号化方法及び復号化装置 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005085160A Division JP3864977B2 (ja) | 2005-03-24 | 2005-03-24 | 画像符号化方法及び画像符号化装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2003204557A true JP2003204557A (ja) | 2003-07-18 |
JP3921441B2 JP3921441B2 (ja) | 2007-05-30 |
Family
ID=27655876
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002346762A Expired - Lifetime JP3921441B2 (ja) | 2002-11-29 | 2002-11-29 | 画像符号化・復号化方法及び画像符号復号装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3921441B2 (ja) |
-
2002
- 2002-11-29 JP JP2002346762A patent/JP3921441B2/ja not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JP3921441B2 (ja) | 2007-05-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8160146B2 (en) | Video coding method and apparatus for calculating motion vectors of the vertices of a patch of an image and transmitting information of horizontal and vertical components of the motion vectors | |
US20090168889A1 (en) | Inter-frame predicted image synthesizing method | |
JPH09252470A (ja) | 画像符号化および復号化方法 | |
US7006571B1 (en) | Method of synthesizing interframe predicted image, and image coding and decoding method and device therefore | |
JP3218874B2 (ja) | 画像符号化装置及び画像符号化方法 | |
JP3509610B2 (ja) | 画像符号化方法及び画像符号化装置 | |
JP3414304B2 (ja) | 画像復号化方法及び復号化装置 | |
JP3591483B2 (ja) | 画像復号化方法及び画像復号化装置 | |
JP2003204557A (ja) | 画像符号化・復号化方法及び画像符号復号装置 | |
JP4591495B2 (ja) | 画像符号化方法および画像符号化装置 | |
JP3864977B2 (ja) | 画像符号化方法及び画像符号化装置 | |
JP4052341B2 (ja) | 画像復号化方法及び画像復号化装置 | |
JP4609602B2 (ja) | 画像復号化方法及び画像符号復号装置 | |
JP3634878B2 (ja) | 画像符号化装置 | |
JP2001352549A (ja) | 画像符号化および復号化方法 | |
JPH11346367A (ja) | 画像符号化および復号化方法 | |
JPH11266461A (ja) | 画像符号化装置 | |
JP2001145115A (ja) | 画像符号化および復号化方法 | |
JPH10285598A (ja) | 画像符号化/復号化装置 | |
JP2001136537A (ja) | 画像符号化および復号化方法 | |
JP2001352548A (ja) | 画像符号化装置及び画像符号化方法 | |
JPH0846972A (ja) | 画像符号化装置及び画像復号装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20050208 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20050324 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A132 Effective date: 20050419 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20050823 |
|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20060427 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20070219 |
|
FPAY | Renewal fee payment (prs date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100223 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (prs date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110223 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (prs date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110223 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (prs date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120223 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (prs date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120223 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (prs date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130223 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (prs date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130223 Year of fee payment: 6 |
|
EXPY | Cancellation because of completion of term |