JP3218874B2 - Image encoding apparatus and image encoding method - Google Patents

Image encoding apparatus and image encoding method

Info

Publication number
JP3218874B2
JP3218874B2 JP19397094A JP19397094A JP3218874B2 JP 3218874 B2 JP3218874 B2 JP 3218874B2 JP 19397094 A JP19397094 A JP 19397094A JP 19397094 A JP19397094 A JP 19397094A JP 3218874 B2 JP3218874 B2 JP 3218874B2
Authority
JP
Japan
Prior art keywords
image
motion
motion vector
patch
accuracy
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP19397094A
Other languages
Japanese (ja)
Other versions
JPH0865675A (en
Inventor
雄一郎 中屋
淳一 木村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority to JP19397094A priority Critical patent/JP3218874B2/en
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to US08/516,218 priority patent/US5684538A/en
Publication of JPH0865675A publication Critical patent/JPH0865675A/en
Priority to US08/903,199 priority patent/US5963259A/en
Priority to US09/364,255 priority patent/US6134271A/en
Priority to US09/626,788 priority patent/US6285713B1/en
Priority to US09/863,428 priority patent/US6516033B2/en
Application granted granted Critical
Publication of JP3218874B2 publication Critical patent/JP3218874B2/en
Priority to US09/994,728 priority patent/US6542548B2/en
Priority to US10/342,273 priority patent/US6928117B2/en
Priority to US11/155,570 priority patent/US7133454B2/en
Priority to US11/518,177 priority patent/US7684487B2/en
Priority to US11/976,228 priority patent/US8155199B2/en
Priority to US11/976,229 priority patent/US8135070B2/en
Priority to US11/976,227 priority patent/US7680188B2/en
Priority to US11/976,230 priority patent/US8160146B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【産業上の利用分野】本発明は、同一パッチ内のすべて
の画素が共通の動きベクトルを持つ制約がなく、かつ画
素の動きベクトルの水平・垂直成分が隣接画素間距離の
整数倍以外の値を取り得る動き補償を行なう画像符号化
装置、およびこの符号化装置が出力した符号を受信し復
号化する画像復号化装置に関するものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an image processing system in which all pixels in the same patch are not restricted to having a common motion vector, and the horizontal and vertical components of the motion vector of the pixel are values other than an integer multiple of the distance between adjacent pixels. The present invention relates to an image encoding device that performs motion compensation that can take the following formula, and an image decoding device that receives and decodes a code output by the encoding device.

【0002】[0002]

【従来の技術】動画像の高能率符号化において、時間的
に近接するフレーム間の類似性を活用する動き補償は情
報圧縮に大きな効果を示すことが知られている。動き補
償の処理を数式を用いて表現すると以下のようになる。
符号化しようとしているフレーム(現フレーム)の予測
画像をP(x, y)、参照画像(Pと時間的に近接してお
り、既に符号化が終了しているフレームの復号画像)を
R(x, y)とする。また、xとyは整数であるとして、
PとRでは座標値が整数である点に画素が存在すると仮
定する。このとき、PとRの関係は、
2. Description of the Related Art It is known that, in high-efficiency coding of moving images, motion compensation utilizing similarity between temporally adjacent frames has a great effect on information compression. The motion compensation process is expressed as follows using mathematical expressions.
The predicted image of the frame to be coded (current frame) is denoted by P (x, y), and the reference image (decoded image of a frame that is temporally close to P and has already been coded) is denoted by R ( x, y). Also, assuming that x and y are integers,
In P and R, it is assumed that a pixel exists at a point where the coordinate value is an integer. At this time, the relationship between P and R is

【0003】[0003]

【数1】 (Equation 1)

【0004】で表される。ただし、画像はn個の小領域
(パッチ)に分割されるとして、Piは画像のi番目の
パッチに含まれる画素を表している。また、変換関数f
i(x,y)とgi(x, y)は現フレームの画像と参照画像
との間の空間的な対応を表現している。ここで、Pi内
の画素(x, y)の動きベクトルは、(x−fi(x, y),
y−gi(x, y))で表すことができる。現在の動画像符
号化方式の国際標準のH.261、MPEG1、MPE
G2などでは、fi(x, y)とgi(x, y)がxとyに関
係のない定数であるブロックマッチングとよばれる方式
が採用されている。しかし、これらの標準符号化方式よ
り高い情報圧縮率を達成するには、より高度な動き補償
方式を採用することが要求される。このような新しい動
き補償方式として、fi(x, y)とgi(x, y)が定数で
はなく、同一パッチ内の画素が異なる動きベクトルを持
つことを許容する動き補償方式が最近提案されている。
これらの方式における変換関数としては、アフィン変換
[0004] Here, assuming that the image is divided into n small areas (patches), Pi represents the pixels included in the i-th patch of the image. Also, the conversion function f
i (x, y) and gi (x, y) represent the spatial correspondence between the image of the current frame and the reference image. Here, the motion vector of the pixel (x, y) in Pi is (x-fi (x, y),
y-gi (x, y)). The international standard H.264 of the current video coding system is used. 261, MPEG1, MPE
In G2 and the like, a method called block matching in which fi (x, y) and gi (x, y) are constants irrelevant to x and y is adopted. However, in order to achieve a higher information compression rate than these standard encoding methods, it is necessary to employ a more advanced motion compensation method. As such a new motion compensation scheme, a motion compensation scheme that allows pixels in the same patch to have different motion vectors, where fi (x, y) and gi (x, y) are not constants, has recently been proposed. I have.
The transformation function in these methods is affine transformation

【0005】[0005]

【数2】 (Equation 2)

【0006】を用いた例(中屋他、「3角形パッチに基
づく動き補償の基礎検討」、電子情報通信学会技術報
告、IE90-106、平2-03)や、共1次変換
[Nakaya et al., "Basic Study on Motion Compensation Based on Triangular Patches", IEICE Technical Report, IE90-106, Hei 2-03), bilinear transformation

【0007】[0007]

【数3】 (Equation 3)

【0008】を用いた例( G. J. Sullivan and R. L.
Baker, "Motion compensation for video compression
using control grid interpolation", Proc. ICASSP '
91 , M9.1, pp.2713-2716, 1991-05)、透視変換
[0008] Example using GJ Sullivan and RL
Baker, "Motion compensation for video compression
using control grid interpolation ", Proc. ICASSP ''
91, M9.1, pp.2713-2716, 1991-05), perspective transformation

【0009】[0009]

【数4】 (Equation 4)

【0010】を用いた例(V.Seferdis and M.Ghanbari,
"General approach to block-matching motion estim
ation'', Optical Engineering, vol. 32, no. 7, pp.
1464-1474, 1993-07)などがすでに報告されている。こ
こでaij、bij、cijはパッチごとに推定される動きパ
ラメータである。変換関数の値が整数でない場合には、
座標値が整数ではなく、参照画像において実際には画素
が存在しない点の輝度値を求めることが必要となる。こ
の場合の処理としては、周辺4画素を用いた共1次内挿
が使われることが多い。この内挿方式を数式で記述する
と、0≦p, q<1として、R(x+p, y+q)は、
(V. Seferdis and M. Ghanbari,
"General approach to block-matching motion estim
ation '', Optical Engineering, vol. 32, no.7, pp.
1464-1474, 1993-07) have already been reported. Here, aij, bij, and cij are motion parameters estimated for each patch. If the value of the conversion function is not an integer,
It is necessary to find a luminance value at a point where the coordinate value is not an integer and no pixel actually exists in the reference image. In this case, bilinear interpolation using four neighboring pixels is often used as the processing. If this interpolation method is described by a mathematical expression, R (x + p, y + q) is expressed as 0 ≦ p, q <1.

【0011】[0011]

【数5】 (Equation 5)

【0012】で表される。## EQU1 ##

【0013】動き情報の伝送の際には、画像符号化装置
は何らかの形で変換関数の動きパラメータが特定できる
情報を受信側に伝送すればよい。例えば、変換関数にア
フィン変換を用い、パッチの形状が3角形であるとす
る。この場合は、6個の動きパラメータを直接伝送して
も、パッチの3個の頂点の動きベクトルを伝送しても、
受信側で6個の動きパラメータai1〜ai6を再生するこ
とができる。
When transmitting the motion information, the image coding apparatus only needs to transmit to the receiving side information that can specify the motion parameter of the transform function in some form. For example, it is assumed that an affine transformation is used as a transformation function and the shape of the patch is a triangle. In this case, whether the six motion parameters are directly transmitted or the motion vectors of the three vertices of the patch are transmitted,
On the receiving side, six motion parameters ai1 to ai6 can be reproduced.

【0014】変換関数が定数ではない動き補償方式の特
徴は、画素ごとに動きベクトルを求める際に数学的な演
算が必要となることである。この動きベクトルの計算
(変換関数の計算)のときに、もし送信側と受信側で演
算精度に差があると、符号化装置と復号化装置で得られ
る予測画像が異なるものとなる(ミスマッチが発生す
る)恐れがある。この予測画像におけるミスマッチは受
信側で蓄積する性質を持っているため、フレームごとの
誤差はわずかであっても、やがては再生画像の画質に深
刻な影響を及ぼす恐れがある。この問題は、ブロック内
のすべての画素が同じ動きベクトルに従い、かつその動
きベクトルがそのまま動き情報として符号化・伝送され
るブロックマッチングにはないものである。
A feature of the motion compensation system in which the conversion function is not a constant is that a mathematical operation is required when obtaining a motion vector for each pixel. In the calculation of the motion vector (calculation of the conversion function), if there is a difference in the calculation accuracy between the transmitting side and the receiving side, the predicted images obtained by the encoding device and the decoding device will be different (mismatches will occur). May occur). Since the mismatch in the predicted image has a property of being accumulated on the receiving side, even a small error per frame may seriously affect the image quality of the reproduced image. This problem does not exist in block matching in which all pixels in a block follow the same motion vector, and that motion vector is encoded and transmitted as motion information as it is.

【0015】この問題への対策に関して、変換関数にア
フィン変換(数2)、内挿方式として共1次内挿(数
5)を用いた場合を例に挙げて説明する。問題解決の一
つの方法として、数2および数5の演算精度を十分に高
くすることにより、数5の演算結果の誤差が輝度値の量
子化ステップサイズより十分に小さくなるようにする方
法が考えられる。この対策を採用した場合について考え
る。まず、数5の演算精度は十分に高いと仮定する。こ
のとき、例えばR(0, 0)=R(0, 1)=0、R(1,
0)=R(1, 1)=255として、さらに0<x<1、
0<y<1とすれば(以後、これを「最悪の条件」とよ
ぶ)、fi(x, y)における大きさ1/255以上の誤
差は、必ず輝度値の量子化値の誤差につながることにな
る(輝度値の量子化ステップサイズは1と仮定した)。
したがって、ミスマッチを防ぐためには数2の演算誤差
が1/255よりも十分に小さくなるように符号化装置
と復号化装置を作成しなければならない。しかし、演算
精度を上げることは、一般に数値の内部表現の桁数を増
やすことにつながり、演算処理をより複雑にすることに
なる。動き補償処理において数2および数5はきわめて
多くの回数計算されるため、この演算を複雑にすること
は、全体の処理量に深刻な影響を及ぼしてしまう。
A description will be given of a countermeasure against this problem by taking as an example a case where an affine transformation (Equation 2) is used as a transformation function and bilinear interpolation (Equation 5) is used as an interpolation method. As one method of solving the problem, a method is conceivable in which the error of the operation result of Expression 5 is sufficiently smaller than the quantization step size of the luminance value by sufficiently increasing the operation accuracy of Expression 2 and Expression 5. Can be Consider the case where this measure is adopted. First, it is assumed that the calculation accuracy of Equation 5 is sufficiently high. At this time, for example, R (0, 0) = R (0, 1) = 0, R (1,
0) = R (1,1) = 255, and 0 <x <1;
If 0 <y <1, (hereinafter referred to as “worst condition”), an error with a magnitude of 1/255 or more in fi (x, y) always leads to an error in the quantization value of the luminance value. (The quantization step size of the luminance value is assumed to be 1).
Therefore, in order to prevent a mismatch, it is necessary to create an encoding device and a decoding device such that the operation error of Equation 2 is sufficiently smaller than 1/255. However, increasing the calculation accuracy generally leads to an increase in the number of digits in the internal representation of a numerical value, which further complicates the calculation process. Since Equations 2 and 5 are calculated extremely many times in the motion compensation processing, complicating this operation has a serious effect on the overall processing amount.

【0016】[0016]

【発明が解決しようとする課題】同一パッチに所属する
すべての画素が共通の動きベクトルを持つ制約がなく、
かつ画素の動きベクトルの水平・垂直成分が隣接画素間
距離の整数倍以外の値を取り得る動き補償方式におい
て、変換関数の計算に要求される演算精度を下げ、かつ
変換関数の演算精度に起因する予測画像のミスマッチの
発生を防ぐ手法を提供する。
There is no restriction that all pixels belonging to the same patch have a common motion vector.
In addition, in the motion compensation method in which the horizontal and vertical components of the pixel motion vector can take values other than an integer multiple of the distance between adjacent pixels, the calculation accuracy required for calculating the conversion function is reduced, and the calculation accuracy of the conversion function is reduced. And a method for preventing occurrence of mismatch of predicted images.

【0017】[0017]

【課題を解決するための手段】予測画像の合成の際に使
われる各画素の動きベクトルの水平、垂直成分が、それ
ぞれ隣接画素間距離の1/d1、1/d2(d1、d2は正
の整数)の整数倍の値のみをとるように規定することに
よって、上記の目的は達成される。
The horizontal and vertical components of the motion vector of each pixel used in synthesizing a predicted image are 1 / d1 and 1 / d2 of the distance between adjacent pixels (where d1 and d2 are positive). The above-mentioned object is achieved by specifying that only values that are integral multiples of (integer) are taken.

【0018】[0018]

【作用】「課題を解決する手段」で述べた動きベクトル
に関する規定を採用すれば、「従来の技術」で述べた最
悪の条件を与えた場合に必ず輝度値の量子化値の誤差に
つながる変換関数fi(x, y)の誤差の大きさは1/d1
となる。例えばd1=4とすれば、「従来の技術」で述
べた対策と比較してfi(x, y)の演算精度を6ビット
下げた場合でも、最悪の条件のもとで予測画像のミスマ
ッチを起こす危険性をほぼ同じレベルに保つことができ
る。
By adopting the rules relating to the motion vector described in "Means for Solving the Problem", if the worst condition described in "Prior Art" is given, a conversion that always leads to an error in the quantization value of the luminance value. The magnitude of the error of the function fi (x, y) is 1 / d1
Becomes For example, if d1 = 4, even if the calculation accuracy of fi (x, y) is reduced by 6 bits compared to the countermeasure described in the "prior art", the mismatch of the prediction image under the worst condition is reduced. The dangers that occur can be kept at almost the same level.

【0019】[0019]

【実施例】上と同様に変換関数にアフィン変換を用いた
場合を例に挙げて、数2の演算方式の実施例を示す。な
お、ここでは簡単のため、d1=d2=d(dは正の整
数)であると仮定する。また、パッチは3角形であると
仮定し、パッチの3個の頂点の動きベクトルが動き情報
として伝送されるとする。
EXAMPLE An example of the operation method of Equation 2 will be described with reference to an example in which an affine transformation is used as a transformation function in the same manner as described above. For simplicity, it is assumed that d1 = d2 = d (d is a positive integer). Also, it is assumed that the patch is a triangle, and the motion vectors of the three vertices of the patch are transmitted as motion information.

【0020】以下では、図1に示す例を用いて説明す
る。参照画像101におけるパッチ102が現フレーム
106のパッチ107に移動・変形したと推定されたと
する(格子点103、104、105がそれぞれ格子点
108、109、110に対応している)。このとき、
パッチ102の頂点103、104、105の座標をそ
れぞれ(x1', y1')、(x2', y2')、(x3', y3')、パ
ッチ107の頂点108、109、110の座標をそれ
ぞれ(x1, y1)、(x2, y2)、(x3, y3)であるとする
と(座標値はすべて負でない整数とする)、このパッチ
における数2の動きパラメータaijは、
Hereinafter, description will be made using the example shown in FIG. It is assumed that the patch 102 in the reference image 101 has been moved and deformed to the patch 107 in the current frame 106 (grid points 103, 104, and 105 correspond to grid points 108, 109, and 110, respectively). At this time,
The coordinates of the vertices 103, 104, and 105 of the patch 102 are respectively (x1 ', y1'), (x2 ', y2'), (x3 ', y3'), and the coordinates of the vertices 108, 109, and 110 of the patch 107, respectively. Assuming that (x1, y1), (x2, y2), and (x3, y3) (coordinate values are all non-negative integers), the motion parameter aij of Equation 2 in this patch is

【0021】[0021]

【数6】 (Equation 6)

【0022】で表される。ここで、割り算の演算を行わ
ずに、aijを分母と分子が整数であるaij=aij'/Di
という形のままにしておく。すると、数2の演算結果
は、すべてfi(x, y)=fi'(x, y)/Diとgi(x,
y)=gi'(x, y)/Diのような整数を分母と分子とす
る分数の形式で表すことができる。ここで、「//」を整
数同士の除算(演算結果の小数成分を切り捨てる除算)
と定義し、ki=Di//2として、
## EQU2 ## Here, without performing the division operation, aij is defined as aij = aij '/ Di where the denominator and the numerator are integers.
In the form. Then, the calculation results of Expression 2 are all fi (x, y) = fi '(x, y) / Di and gi (x,
y) = gi '(x, y) / Di can be expressed in the form of a fraction with an integer as a denominator and a numerator. Here, "//" is divided by integers (division in which the decimal component of the operation result is truncated)
And ki = Di // 2,

【0023】[0023]

【数7】 (Equation 7)

【0024】とする。Fi(x, y)とGi(x, y)は、f
i(x, y)とgi(x, y)を最も近い1/dの整数倍の値
に丸め込む関数である。数1においてfi(x, y)とgi
(x,y)の代わりにFi(x, y)とGi(x, y)を用いる
ことにより、各画素の動きベクトルの水平・垂直成分
が、隣接画素間距離の1/dの整数倍の値のみをとるよ
うに制限することができる。また、送信側、受信側で共
にFi(x, y)とGi(x,y)を使えば、比較的精度の低
い演算で、変換関数の誤差に起因する予測画像のミスマ
ッチを防ぐことが可能となる。
It is assumed that Fi (x, y) and Gi (x, y) are f
This function rounds i (x, y) and gi (x, y) to the nearest integer multiple of 1 / d. In equation (1), fi (x, y) and gi
By using Fi (x, y) and Gi (x, y) instead of (x, y), the horizontal / vertical components of the motion vector of each pixel can be obtained by multiplying 1 / d of the distance between adjacent pixels by an integer. It can be restricted to take only values. In addition, if Fi (x, y) and Gi (x, y) are used on both the transmitting side and the receiving side, it is possible to prevent a mismatch of a predicted image caused by an error in a conversion function with a relatively low-precision operation. Becomes

【0025】図2にd=4である場合にFi(x, y)と
Gi(x, y)を計算する処理の流れを示す。まず、変形
前後のパッチの頂点の座標が201で与えられると、2
02と204で関数fi'(x, y)とgi'(x, y)を定義
し、203で定数Diを求め、205で定数kiを求め
る。これらの関数と定数を用いて、パッチ内の画素ごと
に座標(x, y)からFi(x, y)とGi(x, y)の値を計
算する。(x, y)が2進整数表現で与えられると、まず
206で積和演算を行うことによってfi'(x,y)とg
i'(x, y)の値を求め、この結果を207で2ビット左
にシフトすることによって4(=d)倍する。この結果
に対して208でkiを加え、さらに209でDiで割る
(演算結果の小数成分は切り捨てる)ことによって、4
Fi(x,y)と4Gi(x, y)の値を得る。この整数の4
Fi(x, y)と4Gi(x, y)に対して、210で下から
2桁目と3桁目の間に小数点を置くことによって、Fi
(x, y)とGi(x, y)の値を得ることができる(これ
は、4で割る演算を行ったことと同じ意味を持つ)。
FIG. 2 shows the flow of processing for calculating Fi (x, y) and Gi (x, y) when d = 4. First, when the coordinates of the vertices of the patch before and after the deformation are given by 201, 2
Functions fi '(x, y) and gi' (x, y) are defined by 02 and 204, a constant Di is obtained by 203, and a constant ki is obtained by 205. Using these functions and constants, the values of Fi (x, y) and Gi (x, y) are calculated from the coordinates (x, y) for each pixel in the patch. When (x, y) is given by a binary integer representation, first, a product-sum operation is performed at 206 to obtain fi ′ (x, y) and g
The value of i ′ (x, y) is obtained, and the result is shifted by 2 bits to the left by 207 to multiply by 4 (= d). By adding ki to the result at 208 and dividing it by Di at 209 (decimal components of the operation result are discarded), 4
Obtain the values of Fi (x, y) and 4Gi (x, y). This integer 4
For Fi (x, y) and 4Gi (x, y), by placing a decimal point between the second and third digits from the bottom at 210, Fi
The value of (x, y) and Gi (x, y) can be obtained (this has the same meaning as performing the operation of dividing by 4).

【0026】dの値は、符号化方式の固定パラメータと
して規定しても、可変として画像データを伝送する前に
送信側と受信側で取り決めても良い。送信側と受信側が
交信を行ってdを取り決める場合の手続きの例を図3に
示す。送信側301は、まず通信303において画像符
号化装置のハードウエアの制約から、許容できるdの上
限が4であることを受信側302に告げる。次に受信側
は、画像復号化装置の制約から、dの上限が2であるこ
とを通信304で告げる。この結果、送信側は最適なd
の値が2であると判断し、以後伝送する画像データはd
=2として符号化されたものとなることを通信305で
勧告する。そしてこの直後に送信側は通信306で画像
データを送信する。一般にdの値が大きい程、装置のハ
ードウェアは複雑になる。したがって、送信側は送信・
受信側で低い方のdの上限の値を採用するのが適当であ
ると考えられる。この方式を実現するためには、画像符
号化・復号化装置は、自身の上限以下のdに対応できる
機能を持たなければならない。
The value of d may be defined as a fixed parameter of the encoding system, or may be made variable between the transmitting side and the receiving side before transmitting the image data. FIG. 3 shows an example of a procedure when the transmitting side and the receiving side communicate with each other to determine d. First, the transmitting side 301 informs the receiving side 302 that the upper limit of the allowable d is 4 in communication 303 due to hardware restrictions of the image encoding apparatus. Next, the receiving side informs the communication 304 that the upper limit of d is 2 due to restrictions of the image decoding device. As a result, the transmitting side obtains the optimal d
Is determined to be 2, and the image data transmitted thereafter is d
= 2 is recommended by the communication 305. Immediately after this, the transmitting side transmits the image data through the communication 306. In general, the larger the value of d, the more complicated the hardware of the device. Therefore, the sending side
It is considered appropriate to adopt the lower value of the upper limit of d on the receiving side. In order to realize this method, the image encoding / decoding device must have a function capable of coping with d equal to or less than its own upper limit.

【0027】dの値としては、乗除算の行ないやすさを
考慮して、2のべき乗が良いと考えられる。dの値が大
きいほど予測誤差は小さくなるが、予測画像の合成処理
は複雑になる。予測特性を考えると、dの値は2以上で
あることが望ましい。予測特性と処理の複雑さのバラン
スを考慮すると、具体的なdの値として2、4、8が適
当である。
The value of d is considered to be a power of 2 in consideration of ease of multiplication and division. The prediction error decreases as the value of d increases, but the process of synthesizing the predicted image becomes complicated. Considering the prediction characteristics, it is desirable that the value of d is 2 or more. Considering the balance between the prediction characteristics and the complexity of the processing, 2, 4, and 8 are appropriate as specific values of d.

【0028】なお、以下の変形も本発明に含まれること
は明らかである。
It is apparent that the following modifications are also included in the present invention.

【0029】(1)輝度値の内挿方式として、本明細書
では共1次内挿をとりあげたが、これ以外の関数を用い
ても良い。関数が複雑になれば、演算を簡略化すること
の効果は大きくなる。
(1) As the interpolation method of the luminance value, in this specification, the primary interpolation is taken, but a function other than this may be used. The more complicated the function, the greater the effect of simplifying the operation.

【0030】(2)変換関数の種類として、本明細書で
はアフィン変換を中心にとりあげたが、これ以外の変換
関数を用いても良い。変換関数の演算精度に応じてその
演算結果が変化する可能性のある限り、本発明は有効で
ある。
(2) Although the affine transformation is mainly described in this specification as a type of the transformation function, other transformation functions may be used. The present invention is effective as long as there is a possibility that the operation result may change according to the operation accuracy of the conversion function.

【0031】(3)パッチの形状は、画素の集合を特定
するものであれば良く、特に本明細書でとりあげた3角
形でなくても良い。
(3) The shape of the patch may be any shape as long as it specifies a set of pixels, and need not be a triangle in particular in the present specification.

【0032】(4)空間変換に基づく動き補償におい
て、本明細書でとりあげた例のように伝送される動き情
報がパッチの頂点の動きベクトルでなくても良い。動き
情報はパッチごとの変換関数を特定するものでありさえ
すれば良く、例えば数2の動きパラメータaijをそのま
ま伝送しても良い。このように動きパラメータをそのま
ま伝送する場合には、本発明を適用することにより、変
換関数の演算精度に起因する予測画像のミスマッチを防
ぎながら伝送される動きパラメータの精度を下げる(桁
数を減らす)ことが可能となる。dの値が小さければ小
さいほど動きパラメータの桁数を少なくするができ、こ
の結果として伝送情報量を少なくすることができる。
(4) In the motion compensation based on the spatial transformation, the motion information transmitted as in the example described in this specification may not be the motion vector of the vertex of the patch. The motion information only needs to specify a conversion function for each patch, and for example, the motion parameter aij of Expression 2 may be transmitted as it is. In the case where the motion parameters are transmitted as they are, by applying the present invention, the accuracy of the transmitted motion parameters is reduced while preventing the mismatch of the predicted image caused by the calculation accuracy of the conversion function (the number of digits is reduced). ) Is possible. As the value of d is smaller, the number of digits of the motion parameter can be reduced, and as a result, the amount of transmission information can be reduced.

【0033】(5)実施例では、d1とd2の値が等しい
場合を例示したが、両者が異なっていても良い。
(5) In the embodiment, the case where the values of d1 and d2 are equal is illustrated, but both may be different.

【0034】(6)本明細書では、現フレームのパッチ
構造を固定して参照画像のパッチを変形させる方式に関
して説明したが、逆に参照画像のパッチ構造を固定して
現フレームのパッチを変形させる方式であっても良い。
(6) In this specification, the method of modifying the patch of the reference image by fixing the patch structure of the current frame has been described. Conversely, the patch of the current frame is modified by fixing the patch structure of the reference image. May be used.

【0035】(7)本明細書では、1個の予測画像を合
成するために用いる参照画像の数は1個として説明した
が、複数の参照画像を用いる方式であっても良い。
(7) In this specification, the number of reference images used for synthesizing one prediction image has been described as one. However, a method using a plurality of reference images may be used.

【0036】[0036]

【発明の効果】本発明により、同一パッチに所属するす
べての画素が共通の動きベクトルを持つ制約がなく、か
つ画素の動きベクトルの水平・垂直成分が隣接画素間距
離の整数倍以外の値を取り得る動き補償方式において、
予測画像のミスマッチの発生を防ぎながら変換関数の演
算精度を下げることができる。また、画像データの伝送
の前に送信側と受信側でd1およびd2の値を決める方式
では、送信側と受信側の装置の性能に応じて再生画像の
最適な画質を決定することができる。
According to the present invention, there is no restriction that all the pixels belonging to the same patch have a common motion vector, and the horizontal and vertical components of the motion vector of the pixel have a value other than an integral multiple of the distance between adjacent pixels. In the possible motion compensation method,
The calculation accuracy of the conversion function can be reduced while preventing the occurrence of a mismatch in the predicted image. Further, in the method in which the values of d1 and d2 are determined on the transmission side and the reception side before the transmission of the image data, the optimum image quality of the reproduced image can be determined according to the performance of the devices on the transmission side and the reception side.

【図面の簡単な説明】[Brief description of the drawings]

【図1】空間変換に基づく動き補償におけるパッチの移
動・変形の例を示した図である。
FIG. 1 is a diagram illustrating an example of movement and deformation of a patch in motion compensation based on spatial transformation.

【図2】動きベクトルの水平・垂直成分を1/4の整数
倍に制限したとき(d=4のとき)の変換関数の演算方
法の例を示した図である。
FIG. 2 is a diagram illustrating an example of a method of calculating a conversion function when horizontal and vertical components of a motion vector are limited to an integral multiple of 1/4 (when d = 4).

【図3】画素の動きベクトルの最小単位である1/dの
値を、画像データの通信の前に送信側と受信側の交信に
よって取り決める方式の例を示した図である。
FIG. 3 is a diagram showing an example of a system in which a value of 1 / d, which is a minimum unit of a motion vector of a pixel, is determined by communication between a transmission side and a reception side before communication of image data.

【符号の説明】[Explanation of symbols]

101…動き推定後の参照画像における1個のパッチ、
102、107…パッチ、103〜105、108〜1
10…パッチの頂点、106…現フレームの原画像のす
べてのパッチ、201…パッチの頂点の座標値、202
〜210…演算手続き、301…送信側の画像符号化装
置、302…受信側の画像復号化装置、303〜306
…通信手続き。
101: one patch in the reference image after motion estimation
102, 107 ... patch, 103-105, 108-1
10: vertex of patch; 106: all patches of the original image of the current frame; 201: coordinate value of vertex of patch; 202
To 210: calculation procedure, 301: image encoding device on the transmission side, 302: image decoding device on the reception side, 303 to 306
... communication procedures.

フロントページの続き (56)参考文献 特開 平5−49023(JP,A) 特開 平5−130581(JP,A) 特表 平6−500212(JP,A) 米国特許4937666(US,A) 中屋雄一郎、原島博、「3角形パッチ による動き補償の基礎検討」、電子情報 通信学会技術報告、IE−106 p.9 −16 1990年3月発行 Michael Gilge ”A HIGH QUALITY VIDEO PHONE CODER USING HIERACHICAL MOTION ESTIMATION AND ST RUCTURE CODING OF THE PREDICTION ERR OR”SPIE Vol.1001 Vis ual Communications and Image Process ing ’88 (58)調査した分野(Int.Cl.7,DB名) H04N 7/24 - 7/68 H03M 7/36 Continuation of the front page (56) References JP-A-5-49023 (JP, A) JP-A-5-130581 (JP, A) JP-A-6-500212 (JP, A) US Patent 4,937,666 (US, A) Yuichiro Nakaya and Hiroshi Harashima, "Basic Study on Motion Compensation Using Triangular Patches", IEICE Technical Report, IE-106 p. 9-16 Issued in March 1990 Michael Gilge "A HIGH QUALITY VIDEO PHONE CODER USING HIERACHICAL MOTION ESTIMATION AND ST RUCTION CODING OF THE PREDICTION VOL. 1001 Visual Communications and Image Processing '88 (58) Fields surveyed (Int. Cl. 7 , DB name) H04N 7/ 24-7/68 H03M 7/36

Claims (10)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】 空間変換に基づく動き補償を行う画像符号
化方法において、 参照画像と現フレームの原画像との間で空間変換に基づ
く動き補償を行い現フレームの予測画像の動き情報を推
定し、 前記予測画像の各画素の動きベクトルの水平・垂直成分
を隣接画素間距離の1/d(dは2以上の正の整数)の
整数倍に制限して前記動き情報から求めるときの精度d
を決定し、 前記動き情報及び前記精度dを示す情報を伝送すること
を特徴とする画像符号化方法。
1. An image coding method for performing motion compensation based on a spatial transform, comprising : performing motion compensation based on a spatial transform between a reference image and an original image of a current frame to estimate motion information of a predicted image of the current frame. The accuracy d when the horizontal and vertical components of the motion vector of each pixel of the predicted image are limited to an integer multiple of 1 / d (d is a positive integer of 2 or more) of the distance between adjacent pixels and are obtained from the motion information.
And transmitting the motion information and the information indicating the accuracy d.
【請求項2】 請求項1に記載の画像符号化方法におい
て、前記精度dの値は、2のw乗(wは正の整数)であ
ることを特徴とする画像符号化方法。
2. The image coding method according to claim 1, wherein the value of the precision d is 2 to the power of w (w is a positive integer).
【請求項3】 請求項1あるいは2に記載の画像符号化方
法において、前記動き情報は、前記予測画像のパッチ頂
点の動きベクトルであることを特徴とする画像符号化方
法。
3. The image coding method according to claim 1, wherein the motion information is a motion vector of a patch vertex of the predicted image.
【請求項4】 同一パッチ内の画素が異なる動きベクトル
を持つことを許容する動き補償を行う画像符号化方法に
おいて、 参照画像と現フレームの原画像との間で前記動き補償を
行い、現フレームの予測画像のパッチ頂点の動きベクト
ルを推定し、 前記予測画像の各画素の動きベクトルの水平・垂直成分
を隣接画素間距離の1/d(dは2以上の正の整数)の
整数倍に制限して前記動きベクトルから求めるときの精
度dを決定し、 前記パッチ頂点の動きベクトル及び前記精度dを示す情
報を伝送することを特徴とする画像符号化方法。
4. An image coding method for performing motion compensation which allows pixels in the same patch to have different motion vectors, wherein said motion compensation is performed between a reference image and an original image of a current frame. Estimate the motion vector of the patch vertex of the predicted image of the above, and make the horizontal and vertical components of the motion vector of each pixel of the predicted image an integer multiple of 1 / d (d is a positive integer of 2 or more) of the distance between adjacent pixels. An image coding method, comprising: determining an accuracy d when obtaining from the motion vector by limiting the motion vector; and transmitting a motion vector of the patch vertex and information indicating the accuracy d.
【請求項5】 請求項4に記載の符号化方法において、前
記精度dの値は、2のw乗(wは正の整数)であること
を特徴とする符号化方法。
5. The encoding method according to claim 4, wherein the value of the precision d is 2 to the power of w (w is a positive integer).
【請求項6】 空間変換に基づく動き補償を行う画像符号
化装置において、 参照画像と現フレームの原画像との間で空間変換に基づ
く動き補償を行い現フレームの予測画像の動き情報を推
定する手段と、 前記予測画像の各画素の動きベクトルの水平・垂直成分
を隣接画素間距離の1/d(dは2以上の正の整数)の
整数倍に制限して前記動き情報から求めるときの精度d
を決定し、前記動き情報及び前記精度dを示す情報を伝
送する手段を有することを特徴とする画像符号化装置。
6. An image coding apparatus for performing motion compensation based on spatial transformation, wherein motion compensation based on spatial transformation is performed between a reference image and an original image of the current frame to estimate motion information of a predicted image of the current frame. Means for limiting the horizontal and vertical components of the motion vector of each pixel of the predicted image to an integral multiple of 1 / d (d is a positive integer of 2 or more) of the distance between adjacent pixels, and obtaining the motion vector from the motion information. Accuracy d
And a means for transmitting the motion information and the information indicating the accuracy d.
【請求項7】 請求項6に記載の画像符号化装置におい
て、前記精度dの値は、2のw乗(wは正の整数)であ
ることを特徴とする画像符号装置。
7. The image encoding apparatus according to claim 6, the value of the accuracy d is image coding apparatus characterized by (is w a positive integer) 2 w th power is.
【請求項8】 請求項6あるいは7に記載の画像符号化装
置において、前記動き情報は、前記予測画像のパッチ頂
点の動きベクトルであることを特徴とする画像符号化装
置。
8. An image encoding apparatus according to claim 6, wherein said motion information is a motion vector of a patch vertex of said predicted image.
【請求項9】 同一パッチ内の画素が異なる動きベクトル
を持つことを許容する動き補償を行う画像符号化装置に
おいて、 参照画像と現フレームの原画像との間で前記動き補償を
行い、現フレームの予測画像のパッチ頂点の動きベクト
ルを推定する手段と、 前記予測画像の各画素の動きベクトルの水平・垂直成分
を隣接画素間距離の1/d(dは2以上の正の整数)の
整数倍に制限して前記動きベクトルから求めるときの精
度dを決定し、前記パッチ頂点の動きベクトル及び前記
精度dを示す情報を伝送する手段を有することを特徴と
する画像符号化装置。
9. An image coding apparatus for performing motion compensation that allows pixels in the same patch to have different motion vectors, wherein the motion compensation is performed between a reference image and an original image of a current frame. Means for estimating the motion vector of the patch vertex of the predicted image of the above, and the horizontal and vertical components of the motion vector of each pixel of the predicted image are expressed by an integer of 1 / d (d is a positive integer of 2 or more) of the distance between adjacent pixels. An image coding apparatus, comprising: means for determining the precision d when obtaining from the motion vector with limiting to twice, and transmitting a motion vector of the patch vertex and information indicating the precision d.
【請求項10】 請求項9に記載の符号化装置において、
前記精度dの値は、2のw乗(wは正の整数)であるこ
とを特徴とする符号化装置。
10. The encoding device according to claim 9, wherein
The encoding apparatus according to claim 1, wherein the value of the precision d is 2 to the power of w (w is a positive integer).
JP19397094A 1994-08-18 1994-08-18 Image encoding apparatus and image encoding method Expired - Lifetime JP3218874B2 (en)

Priority Applications (14)

Application Number Priority Date Filing Date Title
JP19397094A JP3218874B2 (en) 1994-08-18 1994-08-18 Image encoding apparatus and image encoding method
US08/516,218 US5684538A (en) 1994-08-18 1995-08-17 System and method for performing video coding/decoding using motion compensation
US08/903,199 US5963259A (en) 1994-08-18 1997-07-15 Video coding/decoding system and video coder and video decoder used for the same system
US09/364,255 US6134271A (en) 1994-08-18 1999-07-30 Video coding/decoding system and video coder and video decoder used for the same system
US09/626,788 US6285713B1 (en) 1994-08-18 2000-07-26 Video coding/decoding system and video coder and video decoder used for the same system
US09/863,428 US6516033B2 (en) 1994-08-18 2001-05-24 Video coding method and apparatus for calculating motion vectors of the vertices of a portion of an image and outputting information of horizontal and vertical components of the motion vectors
US09/994,728 US6542548B2 (en) 1994-08-18 2001-11-28 Video coding method and apparatus for calculating motion vectors of the vertices of a patch of an image and transmitting information of horizontal and vertical components of the motion vectors
US10/342,273 US6928117B2 (en) 1994-08-18 2003-01-15 Video coding method and apparatus for calculating motion vectors of the vertices of a patch of an image and transmitting information of horizontal and vertical components of the motion vectors
US11/155,570 US7133454B2 (en) 1994-08-18 2005-06-20 Video coding method and apparatus for calculating motion vectors of the vertices of a patch of an image and transmitting information of horizontal and vertical components of the motion vectors
US11/518,177 US7684487B2 (en) 1994-08-18 2006-09-11 Video coding method and apparatus for calculating motion vectors of the vertices of a patch of an image and transmitting information of horizontal and vertical components of the motion vectors
US11/976,230 US8160146B2 (en) 1994-08-18 2007-10-23 Video coding method and apparatus for calculating motion vectors of the vertices of a patch of an image and transmitting information of horizontal and vertical components of the motion vectors
US11/976,228 US8155199B2 (en) 1994-08-18 2007-10-23 Video coding method and apparatus for calculating motion vectors of the vertices of a patch of an image and transmitting information of horizontal and vertical components of the motion vectors
US11/976,229 US8135070B2 (en) 1994-08-18 2007-10-23 Video coding method and apparatus for calculating motion vectors of the vertices of a patch of an image and transmitting information of horizontal and vertical components of the motion vectors
US11/976,227 US7680188B2 (en) 1994-08-18 2007-10-23 Video coding method and apparatus for calculating motion vectors of the vertices of a patch of an image and transmitting information of horizontal and vertical components of the motion vectors

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP19397094A JP3218874B2 (en) 1994-08-18 1994-08-18 Image encoding apparatus and image encoding method

Related Child Applications (3)

Application Number Title Priority Date Filing Date
JP05224599A Division JP3509610B2 (en) 1999-03-01 1999-03-01 Image encoding method and image encoding device
JP05224499A Division JP3414304B2 (en) 1999-03-01 1999-03-01 Image decoding method and decoding device
JP2001136821A Division JP3591483B2 (en) 2001-05-08 2001-05-08 Image decoding method and image decoding device

Publications (2)

Publication Number Publication Date
JPH0865675A JPH0865675A (en) 1996-03-08
JP3218874B2 true JP3218874B2 (en) 2001-10-15

Family

ID=16316807

Family Applications (1)

Application Number Title Priority Date Filing Date
JP19397094A Expired - Lifetime JP3218874B2 (en) 1994-08-18 1994-08-18 Image encoding apparatus and image encoding method

Country Status (1)

Country Link
JP (1) JP3218874B2 (en)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3183155B2 (en) * 1996-03-18 2001-07-03 株式会社日立製作所 Image decoding apparatus and image decoding method
JP3159713B2 (en) * 1997-03-14 2001-04-23 クセルト―セントロ・ステユデイ・エ・ラボラトリ・テレコミニカチオーニ・エツセ・ピー・アー Motion estimation circuit in digitized video sequence encoder
US7006571B1 (en) 1997-06-03 2006-02-28 Hitachi, Ltd. Method of synthesizing interframe predicted image, and image coding and decoding method and device therefore
JP2007312425A (en) * 2007-07-30 2007-11-29 Nippon Telegr & Teleph Corp <Ntt> Image encoding method, image decoding method, image encoding apparatus, image decoding apparatus, image encoding program, image decoding program and recording medium with the programs recorded thereon
JP4915317B2 (en) * 2007-09-05 2012-04-11 ソニー株式会社 Image processing apparatus, image processing method, and computer program

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Michael Gilge "A HIGH QUALITY VIDEOPHONE CODER USING HIERACHICAL MOTION ESTIMATION AND STRUCTURE CODING OF THE PREDICTION ERROR"SPIE Vol.1001 Visual Communications and Image Processing ’88
中屋雄一郎、原島博、「3角形パッチによる動き補償の基礎検討」、電子情報通信学会技術報告、IE−106 p.9−16 1990年3月発行

Also Published As

Publication number Publication date
JPH0865675A (en) 1996-03-08

Similar Documents

Publication Publication Date Title
US6928117B2 (en) Video coding method and apparatus for calculating motion vectors of the vertices of a patch of an image and transmitting information of horizontal and vertical components of the motion vectors
US7519117B2 (en) Inter-frame predicted image synthesizing method
JP3218874B2 (en) Image encoding apparatus and image encoding method
JP3509610B2 (en) Image encoding method and image encoding device
JP3591483B2 (en) Image decoding method and image decoding device
JP3414304B2 (en) Image decoding method and decoding device
JP3921441B2 (en) Image encoding / decoding method and image encoding / decoding apparatus
JP4591495B2 (en) Image encoding method and image encoding apparatus
JP4052341B2 (en) Image decoding method and image decoding apparatus
JP3864977B2 (en) Image encoding method and image encoding apparatus
JP4609602B2 (en) Image decoding method and image code decoding apparatus
JPH0865676A (en) Image dncoding device
JPH10285598A (en) Image coder/decoder
JP2001136537A (en) Method for encoding and decoding image
JP2001145115A (en) Method for encoding and decoding image

Legal Events

Date Code Title Description
FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070810

Year of fee payment: 6

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080810

Year of fee payment: 7

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080810

Year of fee payment: 7

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090810

Year of fee payment: 8

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100810

Year of fee payment: 9

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100810

Year of fee payment: 9

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110810

Year of fee payment: 10

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120810

Year of fee payment: 11

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130810

Year of fee payment: 12

EXPY Cancellation because of completion of term