JPH08116542A - Image coder, image decoder and motion vector detector - Google Patents

Image coder, image decoder and motion vector detector

Info

Publication number
JPH08116542A
JPH08116542A JP25340094A JP25340094A JPH08116542A JP H08116542 A JPH08116542 A JP H08116542A JP 25340094 A JP25340094 A JP 25340094A JP 25340094 A JP25340094 A JP 25340094A JP H08116542 A JPH08116542 A JP H08116542A
Authority
JP
Japan
Prior art keywords
image
error
luminance
transparency
brightness
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP25340094A
Other languages
Japanese (ja)
Other versions
JP3120664B2 (en
Inventor
Minoru Eito
稔 栄藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP25340094A priority Critical patent/JP3120664B2/en
Priority to EP95116511A priority patent/EP0708563B1/en
Priority to KR1019950036818A priority patent/KR100365555B1/en
Priority to US08/545,539 priority patent/US5768438A/en
Priority to DE69533870T priority patent/DE69533870T2/en
Publication of JPH08116542A publication Critical patent/JPH08116542A/en
Priority to US09/596,366 priority patent/USRE37668E1/en
Application granted granted Critical
Publication of JP3120664B2 publication Critical patent/JP3120664B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • G06T9/20Contour coding, e.g. using detection of edges

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Television Systems (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

PURPOSE: To encode/decode an image representing luminance and transparency being components of hierarchical images separated in the relation of the depth in the line of light directions. CONSTITUTION: This coder is provided with a modification analyzer 201 that takes correlation between a luminance plane and an α plane representing a transparency and extracts a modification parameter expressed by affine transformation and movement of a block and with a modification compositing unit 202 producing a predicted image from the result of decoding of a preceding frame and the result of the modification analyzer 201. Then a predicted image consists of the luminance plane and the α plane and a difference of them is subject to error coding and an outputted bit stream consists of an affine transformation parameter, a block movement parameter, a luminance plane error code and an α plane error code.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は画像の符号化やフレーム
周波数変換などフォーマット変換に使用する動きベクト
ル検出装置と画像を少ない符号化量で伝送記録する画像
符号化装置および画像復号化装置に関するものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a motion vector detecting device used for format conversion such as image coding and frame frequency conversion, and an image coding device and an image decoding device for transmitting and recording an image with a small coding amount. Is.

【0002】[0002]

【従来の技術】ワンとエイデルソン(J.Wang a
nd E.Adelson)により動画像の伝送記録を
効率的に行なうことを目的として動画像を図23に示す
ように階層画像に分解して符号化する方式が提案されて
いる。
2. Description of the Related Art One and Adelson (J. Wang a
nd E. Adelson) has proposed a method of decomposing a moving image into hierarchical images and encoding the moving image as shown in FIG. 23 for the purpose of efficiently transmitting and recording the moving image.

【0003】この方式が開示されている文献「レイヤー
ド レプレゼンテーション フォーイメージ セクエン
ス コーディング」(J.Wang and E.Ad
elson:”Layered Representa
tion for Image Sequence C
oding”,Proc.IEEE Int.Con
f.Acoustic Speech Signal
Processing’93,pp.V221−V22
4,1993)および文献「レイヤード レプレゼンテ
ーション フォー モーション アナライシス」(J.
Wang and E.Adelson:”Layer
ed Representationfor Moti
on Analysis”, Proc.Comput
erVision and Pattern Reco
gnition,pp.361−366,1993)に
よると以下の(1)〜(3)の画像処理を行う。 (1)動画像中から同じ動きパラメータ(従来例ではア
フィン変換パラメータ)で記述される領域を抽出する。 (2)同じ動き領域を重ねて階層画像を生成する。各階
層画像は重ねられた領域の占有を示す画素毎の透過度と
輝度で表現される。 (3)階層画像間の視線方向の上下関係を調べて順序付
ける。
A document disclosing this method, "Layered representation for image sequence coding" (J. Wang and E. Ad.
elson: "Layered Representa
tion for Image Sequence C
oding ”, Proc. IEEE Int. Con
f. Acoustic Speech Signal
Processing '93, pp. V221-V22
4, 1993) and the document "Layered representation for motion analysis" (J.
Wang and E. Adelson: "Layer
ed Representation for Moti
on Analysis ”, Proc. Comput
erVision and Pattern Reco
gnition, pp. 361-366, 1993), the following image processing (1) to (3) is performed. (1) An area described by the same motion parameter (affine transformation parameter in the conventional example) is extracted from the moving image. (2) The same motion area is overlapped to generate a hierarchical image. Each hierarchical image is represented by the transparency and brightness of each pixel, which indicates the occupation of the overlapped areas. (3) The vertical relationship between the hierarchical images in the line-of-sight direction is examined and ordered.

【0004】ここでアフィン変換パラメータとは、画像
中の水平垂直位置を(x,y)、動きベクトルの水平垂
直成分を(u,v)とするとき、式1に示すa0〜a5
係数を意味する。
[0004] Here the affine transformation parameters, the horizontal and vertical position in the image (x, y), when the horizontal and vertical components of the motion vector and (u, v), of a 0 ~a 5 shown in Equation 1 Means a coefficient.

【0005】[0005]

【数1】 [Equation 1]

【0006】カメラから十分な距離にある剛体投影像の
動きは、アフィン変換パラメータで近似できることが知
られている。彼らはこれを利用し、1フレームで構成さ
れる数種類の階層画像をアフィン変換により変形させな
がら、数十〜数百フレームの動画像を合成している。こ
の動画像を伝送記録するに必要な情報は、各階層画像に
ついて変形の元となる画像(以後テンプレートと呼ぶ)
とアフィン変換パラメータ、各階層画像の上下関係だけ
であるから、非常に高い符号化効率で動画像の記録伝送
が行なえることになる。なお、テンプレートは画像合成
のために、領域の占有を示す画素毎の透過度と輝度で表
現される。
It is known that the movement of a rigid projection image at a sufficient distance from the camera can be approximated by an affine transformation parameter. Utilizing this, they combine several tens to several hundreds of frames of moving images while deforming several types of hierarchical images composed of one frame by affine transformation. The information necessary for transmitting and recording this moving image is the image that is the source of deformation for each hierarchical image (hereinafter referred to as template).
Since only the affine transformation parameter and the hierarchical relationship between the hierarchical images are used, the moving image can be recorded and transmitted with extremely high coding efficiency. It should be noted that the template is represented by the transparency and the brightness of each pixel indicating the occupation of the area for image synthesis.

【0007】[0007]

【発明が解決しようとする課題】ワンとエイデルソンの
動画像表現では投影像がアフィン変換で記述できる剛体
の動きのみを扱っている。したがって、彼らの動画像表
現は投影像の動きがアフィン変換で記述できない場合に
対処できない。例えば図23に示す人物が非剛体の動き
を行なう場合、カメラ物体間距離が小さく透視変換の非
線形項が無視できない場合には適用できない。また投影
像の動きをアフィン変換パラメータとして求める彼らの
手法は、以下の2段階の処理から構成されている。
In the motion image representation of Wang and Adelson, only the motion of a rigid body whose projected image can be described by affine transformation is dealt with. Therefore, their moving image representation cannot deal with the case where the movement of the projected image cannot be described by the affine transformation. For example, when the person shown in FIG. 23 makes a non-rigid body motion, it cannot be applied when the distance between camera objects is small and the nonlinear term of perspective transformation cannot be ignored. Further, their method of obtaining the movement of the projected image as an affine transformation parameter is composed of the following two-stage processing.

【0008】1.輝度の時間変化が空間輝度勾配と動き
ベクトルの内積で近似できるという輝度の時空間勾配の
関係式に基づく方法(B. Lucas and T.
Kanade:”An Iterative Imag
e Registration Technique
with Anaplication to Ster
eo Vision”,Proc.Image Und
erstanding Workshop,pp.12
1−130,April 1981)で、画面上の各位
置において局所的な動きベクトルを求める。
1. A method based on the relational expression of the spatiotemporal gradient of the luminance that the temporal change of the luminance can be approximated by the inner product of the spatial luminance gradient and the motion vector (B. Lucas and T. et al.
Kanade: "An Iterative Image
e Registration Technique
with Application to Ster
eo Vision ”, Proc. Image Und
erstanding Workshop, pp. 12
1-130, April 1981), a local motion vector is obtained at each position on the screen.

【0009】2.得られた動きベクトルをクラスタリン
グしてアフィン変換パラメータを求める。
2. The obtained motion vectors are clustered to obtain affine transformation parameters.

【0010】しかし、以上の手法では、動画像に輝度の
時空間勾配の関係式が成り立たないような大きな動きが
ある場合は適用できない。さらに、得られた動きベクト
ルからアフィン変換パラメータを推定する2段階の方法
では、パラメータ推定の基となった動きベクトルが誤っ
ている場合には、大きな推定誤差を生む。輝度変化のな
い領域あるいは輝度変化があっても一方向のみの輝度変
化で構成される領域では、動きベクトルは不定となる。
前記2段階の推定手法では、これら不確実な領域の動き
ベクトルに対する特別な処理が必要となる。以上まとめ
ると、以下の課題1、2が解決されていない。
However, the above method cannot be applied to the case where there is a large motion in the moving image in which the relational expression of the spatiotemporal gradient of the brightness does not hold. Furthermore, the two-step method of estimating the affine transformation parameter from the obtained motion vector causes a large estimation error if the motion vector that is the basis of the parameter estimation is incorrect. The motion vector is indefinite in a region where there is no change in brightness or a region where there is a change in brightness even if there is a change in brightness.
The two-step estimation method requires special processing for motion vectors in these uncertain regions. In summary, the following problems 1 and 2 have not been solved.

【0011】課題1:不規則な変形をもつ輝度と透過度
の画像(テンプレート)の効率的な符号化 課題2:アフィン変換パラーメータの頑健な推定 本発明は上記課題を解決するもので、視線方向の前後関
係で分離された階層画像を構成する輝度と透過度の画像
を高能率で符号化、復号化するための画像符号化装置、
画像復号化装置および動きベクトル検出装置を提供する
ことを目的とする。
Problem 1: Efficient encoding of an image (template) of luminance and transparency having irregular deformation Problem 2: Robust estimation of affine transformation parameters The present invention is to solve the above problems and to solve the above problems. An image encoding device for highly efficiently encoding and decoding images of luminance and transparency that form a hierarchical image separated in the context of
An object is to provide an image decoding device and a motion vector detecting device.

【0012】[0012]

【課題を解決するための手段】前記課題1を解決する第
1の発明の画像符号化装置は、物体の輝度と透過度から
構成される画像の系列を入力として、輝度と透過度から
構成される参照画像から部分領域間の対応により符号化
対象画像の輝度と透過度の画像を予測する予測手段と、
前記予測手段における部分領域間の対応を予測符号とし
て符号化する予測符号化手段と、前記予測画像と前記符
号化対象画像との輝度と透過度の差分を誤差画像として
求める誤差演算手段と、前記誤差画像を誤差画像符号と
して符号化する誤差符号化手段を有し、画像系列を前記
参照画像に対する誤差画像符号、予測符号として伝送記
録する構成である。
An image coding apparatus according to a first invention for solving the above-mentioned problem 1 is constituted by luminance and transparency by inputting a series of images constituted by luminance and transparency of an object. Predicting means for predicting the image of the luminance and the transparency of the encoding target image by the correspondence between the partial areas from the reference image,
Predictive encoding means for encoding the correspondence between the partial regions in the predicting means as a predictive code; error calculating means for obtaining a difference in luminance and transparency between the predicted image and the image to be encoded as an error image; An error coding means for coding an error image as an error image code is provided, and an image sequence is transmitted and recorded as an error image code and a prediction code for the reference image.

【0013】前記課題1を解決する第2の発明の画像復
号化装置は、第1の画像符号化装置と同じ参照画像を保
持し、予測符号より部分領域間の対応を復号化する予測
符号復号化手段と、前記部分領域間の対応より、参照画
像から予測画像を生成する予測画像生成手段と、誤差画
像符号より誤差画像を復号化する誤差画像復号化手段
と、前記予測画像と前記誤差画像を加算して輝度と透過
度からなる画像を得る加算手段とを有し、前記予測画像
生成手段あるいは前記加算手段の出力として輝度と透過
度から構成される画像を復号化する構成である。
An image decoding apparatus of a second invention for solving the above-mentioned problem 1 holds the same reference image as that of the first image coding apparatus, and decodes a predictive code for decoding the correspondence between partial regions from the predictive code. Conversion means, prediction image generation means for generating a prediction image from a reference image based on the correspondence between the partial areas, error image decoding means for decoding an error image by an error image code, the prediction image and the error image Is added to obtain an image composed of brightness and transparency, and an image composed of brightness and transparency is decoded as an output of the predicted image generation means or the addition means.

【0014】前記課題1を解決する第3の発明の画像符
号化装置は、物体の輝度と透過度から構成される画像を
入力として、領域を透明領域と不透明領域の2つに分類
し、不透明領域については物体の輝度を、透明領域につ
いては輝度の値域外の所定の値をとるよう輝度と透過度
の情報が重畳された輝度画像を生成する重畳手段を有
し、前記輝度と透過度の情報が重畳された輝度画像を符
号化する構成である。
The image coding apparatus of the third invention for solving the above-mentioned problem 1 classifies an area into two areas, a transparent area and an opaque area, using an image composed of the brightness and the transparency of an object as an input, and opaque. The area has the brightness of the object, and the transparent area has a superimposing means for generating a brightness image on which the brightness and transparency information is superimposed so as to take a predetermined value outside the brightness range. This is a configuration for encoding a luminance image on which information is superimposed.

【0015】前記課題1を解決する第4の発明の画像復
号化装置は、輝度値が値域外の値である場合は透明領
域、値域内の場合は輝度値として画像を透過度画像と輝
度画像とに分離する分離手段を有し、輝度と透過度の画
像を復号化する構成である。
An image decoding apparatus according to a fourth aspect of the present invention for solving the above-mentioned problem 1 is a transparent area when the brightness value is out of the range, and a transparency image and a brightness image when the brightness value is within the range. It is configured such that it has a separating means for separating into and, and decodes an image of luminance and transparency.

【0016】前記課題1を解決する第5の発明の画像符
号化装置は、原画像が輝度に加えて視線軸上の前後関係
と領域の透過度より階層的に表現される時、この階層化
された複数の画像を入力として、各階層画像毎に輝度と
透過度を階層画像符号として符号化する階層画像符号化
手段と、階層画像符号化手段の結果から復号された前記
階層画像を求める階層画像画像復号化手段と、前記復号
された複数の階層画像をその前後関係、輝度、透過度に
より合成する合成手段と、前記原画像と前記合成画像と
の誤差画像を求め、これを符号化する誤差画像符号化手
段を有し、前記原画像を、複数の階層画像符号と原画像
との誤差符号によって伝送記録する構成である。
In the image coding apparatus of the fifth invention for solving the above-mentioned problem 1, when the original image is expressed hierarchically by the front-and-rear relationship on the line-of-sight axis and the transparency of the region in addition to the luminance, this hierarchical structure is used. Layered image encoding means for encoding the luminance and the transparency as a layered image code for each layered image, and a layer for obtaining the layered image decoded from the result of the layered image encoding means. Image image decoding means, synthesizing means for synthesizing the plurality of decoded hierarchical images according to their context, luminance, and transparency, and an error image between the original image and the synthesized image is obtained and encoded. An error image encoding means is provided, and the original image is transmitted and recorded by an error code between a plurality of hierarchical image codes and the original image.

【0017】前記課題1を解決する第6の発明の画像復
号化装置は、複数の階層画像符号から輝度、透過度、視
線軸上の前後関係からなる階層画像を復号化する階層画
像復号化手段と、前記階層画像により合成画像を生成す
る合成手段と、誤差符号より誤差画像を復号化する誤差
画像復号化手段を有し、前記合成画像に誤差画像を加え
ることにより画像を復号化する構成である。
An image decoding apparatus according to a sixth aspect of the present invention for solving the above-mentioned problem 1 is a hierarchical image decoding means for decoding a hierarchical image consisting of a luminance, a transparency and a front-rear relationship on a line-of-sight axis from a plurality of hierarchical image codes. And a composition means for generating a composite image from the hierarchical image, and an error image decoding means for decoding an error image from an error code, wherein the image is decoded by adding the error image to the composite image. is there.

【0018】前記課題1を解決する第7の発明の画像符
号化装置は、複数の参照画像を予め伝送記録する参照画
像符号化手段と、入力画像と前記複数の参照画像との間
で輝度が対応する位置の偏位すなわち変形を画面上の位
置を変数とする多項式関数として近似し、近似誤差を求
める画像間対応近似手段と、近似誤差の小さな参照画像
を前記複数の参照画像の中から求め、選ばれた参照画像
の識別子と多項式関数の係数を出力する最小歪み参照画
像選択手段を有し、前記参照画像符号化手段により複数
の参照画像を符号化するとともに、入力画像系列を少な
くとも前記選ばれた参照画像に対する識別子と前記多項
式関数の係数として伝送記録する構成である。
The image coding apparatus of the seventh invention for solving the above-mentioned problem 1 has a reference image coding means for transmitting and recording a plurality of reference images in advance, and a luminance between the input image and the plurality of reference images. Approximate the deviation or deformation of the corresponding position as a polynomial function with the position on the screen as a variable, and obtain the approximation error between images and the reference image with a small approximation error from the plurality of reference images. A reference image selecting unit for outputting a selected reference image identifier and a coefficient of a polynomial function, the reference image encoding unit encoding a plurality of reference images, and selecting at least the input image sequence. It is configured to be transmitted and recorded as an identifier for the generated reference image and a coefficient of the polynomial function.

【0019】前記課題1を解決する第8の発明の画像復
号化装置は、複数の参照画像を予め再構成しておく参照
画像復号化手段と、前記複数の参照画像から入力に含ま
れる参照画像に対する識別子に対応する参照画像を選択
する参照画像選択手段と、画像の変形を画面上の位置を
変数とする多項式関数を入力に含まれる多項式関数の係
数を基に決定し、前記多項式関数により前記選択された
参照画像変形する参照画像変形手段を有し、前記参照画
像変形手段により変形された参照画像を用いて画像を復
号化する構成である。
An image decoding apparatus of an eighth invention for solving the above-mentioned problem 1 is a reference image decoding means for reconstructing a plurality of reference images in advance, and a reference image included in an input from the plurality of reference images. Reference image selecting means for selecting a reference image corresponding to the identifier for, and a deformation of the image is determined based on the coefficient of the polynomial function included in the input, the polynomial function having the position on the screen as a variable, The configuration is such that the selected reference image has a reference image transforming unit that transforms the image, and the image is decoded using the reference image transformed by the reference image transforming unit.

【0020】前記課題2を解決する第9の発明の動きベ
クトル検出装置は、物体の輝度と透過度から構成される
複数の画像を入力として、透過度を所定の値の加算乗算
と必要に応じてしきい値処理を行ない値域を変換し、変
換した値を輝度に加算して輝度と透過度の情報が重畳さ
れた輝度画像を生成する重畳手段と、輝度の相関により
2つの画像の部分領域の対応を得る画像分析手段を有
し、前記重畳手段によって、輝度と透過度から構成され
る画像を、輝度だけで構成される画像に変換し、変換さ
れた複数の画像間で前記画像分析手段を用いて部分領域
の対応を得る構成である。
A motion vector detecting device of a ninth invention for solving the above-mentioned problem 2 is to input a plurality of images composed of the brightness and the transparency of an object, and add the multiplication of the transparency to a predetermined value and, if necessary, Threshold value processing is performed to convert the value range, and the converted value is added to the luminance to generate a luminance image in which the information of the luminance and the transparency is superimposed, and a partial area of the two images by the correlation of the luminance. The image analysis means for obtaining the correspondence between the plurality of images is converted by the superimposing means into an image composed of only the brightness and the transparency, and the image analysis means is provided between the converted plurality of images. Is used to obtain the correspondence of the partial areas.

【0021】前記課題2を解決する第10の発明の動き
ベクトル検出装置は、画面上の任意の位置の動きベクト
ルをその位置を変数とする多項式関数として表現する装
置であって、画像を分割して得られる複数の部分領域に
ついて、異なる2つの画像の部分領域の対応を誤差とし
て演算し、最小誤差となる前記部分領域間の偏位とその
近傍の誤差値を求める誤差演算手段と、前記最小誤差と
なる偏位とその近傍の誤差値から偏位を変数とする2次
の誤差関数を求める誤差関数演算手段と、前記2次誤差
関数の総和あるいは部分和を、多項式関数の係数を変数
として表現し、この総和あるいは部分和の最小化を係数
について行なう最適化手段を有し、異なる画像間の動き
ベクトルを多項式関数の係数として出力する構成であ
る。
A motion vector detecting device of a tenth invention for solving the above-mentioned problem 2 is a device for expressing a motion vector at an arbitrary position on the screen as a polynomial function having the position as a variable, and dividing an image. For a plurality of partial areas obtained as a result, the correspondence between the partial areas of two different images is calculated as an error, and the error calculating means for calculating the deviation between the partial areas having the minimum error and the error value in the vicinity thereof; An error function calculating means for obtaining a quadratic error function having a deviation as a variable from a deviation which becomes an error and an error value in the vicinity thereof, and a total sum or a partial sum of the quadratic error function using a coefficient of a polynomial function as a variable. The configuration is such that there is an optimizing means for expressing and minimizing the total sum or partial sum for the coefficient, and the motion vector between different images is output as the coefficient of the polynomial function.

【0022】[0022]

【作用】第1の発明の画像符号化装置は、予測手段によ
って参照画像(すなわちテンプレート)と符号化対象画
像の部分領域の対応をとることにより、参照画像から符
号化対象画像の輝度と透過度を予測し、予測画像を生成
する。部分領域の対応は予測信号として予測符号化手段
により出力される。誤差演算手段により予測画像と符号
化対象画像との輝度と透過度の差分を求め誤差符号化手
段により符号化する。
In the image coding apparatus according to the first aspect of the present invention, the predicting means associates the reference image (that is, the template) with the partial region of the image to be coded to thereby obtain the luminance and the transparency of the image to be coded from the reference image. Is predicted and a predicted image is generated. Correspondence of the partial areas is output as a prediction signal by the predictive coding means. The difference between the brightness and the transparency of the predicted image and the image to be encoded is obtained by the error calculating means and encoded by the error encoding means.

【0023】第2の発明の画像復号化装置は、第1の発
明の画像符号化装置と同じ参照画像を保持し、予測符号
復号化手段と予測画像生成手段とにより予測符号から部
分領域間の対応を復号して参照画像から予測画像を生成
する。一方、誤差画像復号化手段により誤差画像符号か
ら誤差画像を復号化する。そして、加算手段が予測画像
と誤差画像を加算して輝度と透過度からなる画像を得
る。
The image decoding apparatus according to the second invention holds the same reference image as that of the image coding apparatus according to the first invention, and the predictive code decoding means and the predictive image generating means are provided between the predictive code and the partial area. A prediction image is generated from the reference image by decoding the correspondence. On the other hand, the error image decoding means decodes the error image from the error image code. Then, the adding means adds the predicted image and the error image to obtain an image composed of brightness and transparency.

【0024】以上の二発明では、符号化側では予測画像
と符号化対象画像との輝度と透過度の差分を求め符号化
する。一方復号化側では透過度と輝度の差分が復号され
る。これによって、不規則なテンプレートの変形を許し
た階層画像の符号化が行なえる。
In the above two inventions, on the encoding side, the difference between the brightness and the transparency of the predicted image and the image to be encoded is calculated and encoded. On the other hand, on the decoding side, the difference between the transparency and the brightness is decoded. As a result, it is possible to encode a hierarchical image that allows irregular template deformation.

【0025】第3の発明の画像符号化装置では、物体の
輝度と透過度から構成される画像を入力として、重畳手
段が領域を透明領域と不透明領域の2つに分類し、不透
明領域については物体の輝度を、透明領域については輝
度の値域外の所定の値をとるよう輝度と透過度の情報が
重畳された輝度画像を生成したのち、これを符号化す
る。
In the image coding apparatus of the third invention, the superimposing means classifies the area into two areas, a transparent area and an opaque area, with the image composed of the brightness and the transparency of the object as an input, and regarding the opaque area, A luminance image in which luminance and transparency information is superimposed so that the luminance of an object takes a predetermined value outside the luminance range for a transparent region is generated and then encoded.

【0026】第4の発明の画像復号化装置は、復号化さ
れた画像から分離手段が輝度値が値域外の所定の値であ
る場合は透明領域、値域内の場合は輝度値として画像を
透過度画像と輝度画像に分離する。以上の二発明では、
テンプレートを構成する輝度と透過度の2つの情報を一
つの輝度画像に変換することにより、この輝度画像の変
化としてテンプレートの変形を扱うことができる。
In the image decoding apparatus of the fourth invention, the separating means from the decoded image transmits the image as a transparent area when the luminance value is a predetermined value outside the range, and transmits the image as the luminance value when inside the range. Degree image and luminance image are separated. In the above two inventions,
By converting the two pieces of information of the brightness and the transparency which form the template into one brightness image, the deformation of the template can be treated as the change of the brightness image.

【0027】第5の発明の画像符号化装置では、原画像
は輝度に加えて視線軸上の前後関係と領域の透過度によ
り階層的に表現されている。画像符号化装置はこの階層
化された複数の画像を入力として、階層画像毎に階層画
像符号化手段により、輝度と透過度を階層画像符号とし
て符号化する。一方で、階層画像画像復号化手段により
階層画像符号化手段の結果から復号された前記階層画像
を求め、合成手段により復号された複数の階層画像をそ
の前後関係、輝度、透過度から合成する。これにより、
復号化装置での階層画像の合成結果を推定することにな
る。そして、誤差画像符号化手段が原画像と推定された
合成画像との誤差画像を求め、これを符号化する。
In the image coding apparatus of the fifth aspect of the invention, the original image is hierarchically represented by the front-rear relationship on the line-of-sight axis and the transparency of the area in addition to the luminance. The image encoding device receives the plurality of layered images and encodes the luminance and the transparency as a layer image code by the layer image encoding means for each layer image. On the other hand, the layered image decoding means obtains the layered image decoded from the result of the layered image encoding means, and a plurality of layered images decoded by the synthesizing means are synthesized based on their context, brightness, and transparency. This allows
The result of synthesizing the hierarchical images in the decoding device will be estimated. Then, the error image encoding means obtains an error image between the original image and the estimated composite image, and encodes this.

【0028】第6の発明の画像復号化装置は、階層画像
復号化手段により複数の階層画像符号から輝度、透過
度、視線軸上の前後関係からなる階層画像を復号し、合
成手段により階層画像から合成画像を生成する。そし
て、誤差画像復号化手段は誤差符号から誤差画像を復号
化する。最後に合成画像に誤差画像を加えることにより
画像が復元される。以上の二発明は、テンプレートが不
規則に変形する場合でも、階層画像の合成を最終結果と
はせずに予測画像とし、この予測画像と原画像との差分
を伝送記録することにより画像を大きな視覚劣化なく伝
送記録することができる。
In the image decoding apparatus of the sixth aspect of the invention, the hierarchical image decoding means decodes the hierarchical image consisting of the luminance, the transparency, and the front-rear relationship on the line-of-sight axis from the plurality of hierarchical image codes, and the synthesizing means decodes the hierarchical image. Generate a composite image from. Then, the error image decoding means decodes the error image from the error code. Finally, the image is restored by adding the error image to the composite image. In the above two inventions, even if the template is deformed irregularly, the composite of the hierarchical images is not used as the final result, but the predicted image is used, and the difference between the predicted image and the original image is transmitted and recorded, so that the image is enlarged. It can be transmitted and recorded without visual deterioration.

【0029】第7の発明では、参照画像符号化手段によ
りテンプレートが予め伝送記録される。入力画像と複数
のテンプレートとの間の対応が画像間対応近似手段によ
り、画面上の位置を変数とする多項式関数として近似さ
れる。最小歪み参照画像選択手段は、この複数のテンプ
レートの中で近似誤差の小さな参照画像を時間順序に関
係なく前記複数の参照画像の中から求め、選ばれた参照
画像の識別子と多項式関数の係数を出力する。複数のテ
ンプレートを用意することにより、前記多項式関数で近
似される度合が向上する。
In the seventh invention, the template is transmitted and recorded in advance by the reference image coding means. The correspondence between the input image and the plurality of templates is approximated by the inter-image correspondence approximating means as a polynomial function having the position on the screen as a variable. The minimum distortion reference image selection means obtains a reference image with a small approximation error from the plurality of reference images in the plurality of templates regardless of the time order, and selects the identifier of the selected reference image and the coefficient of the polynomial function. Output. Providing a plurality of templates improves the degree of approximation with the polynomial function.

【0030】第8の発明の画像復号化装置は、複数のテ
ンプレートは参照画像復号化手段により予め再構成され
る。参照画像選択手段は入力されたテンプレートの識別
子に対応するテンプレートを選び出し、これを参照画像
変形手段は、入力された多項式関数の係数を基に画像を
変形させる。符号化装置側で、入力画像に対して前記多
項式関数によるテンプレートの変形結果が類似している
ことが保証されているため少ない符号化量で画像を復号
化することができる。
In the image decoding apparatus of the eighth invention, the plurality of templates are reconstructed in advance by the reference image decoding means. The reference image selection means selects a template corresponding to the inputted template identifier, and the reference image transformation means transforms the image based on the inputted coefficient of the polynomial function. On the side of the encoding device, since it is guaranteed that the deformation result of the template by the polynomial function is similar to the input image, the image can be decoded with a small encoding amount.

【0031】第9の発明の物体の輝度と透過度から構成
される複数の画像を入力とする動きベクトル検出装置
は、重畳手段により、透過度を所定の値の加算乗算と必
要に応じてしきい値処理を行ない値域を変換し、変換し
た値を輝度に加算して輝度と透過度の情報が重畳された
輝度画像を生成する。そして、画像分析手段は輝度の相
関により2つの画像の部分領域の対応を得る。これによ
り、輝度だけでなく透過度の相関を利用した動きベクト
ル検出を行なうことができる。
In the motion vector detecting device of the ninth invention, which inputs a plurality of images composed of the brightness and the transparency of the object, the superimposing means calculates the transparency by adding and multiplying the transparency by a predetermined value. Threshold processing is performed to convert the value range, and the converted value is added to the brightness to generate a brightness image in which brightness and transparency information is superimposed. Then, the image analysis means obtains the correspondence between the partial areas of the two images by the correlation of the brightness. This makes it possible to detect a motion vector using not only the luminance but also the correlation of the transmittance.

【0032】第10の発明の画面上の任意の位置の動き
ベクトルをその位置を変数とする多項式関数として表現
する動きベクトル検出装置は、誤差演算手段は画像を分
割して得られる複数の部分領域について、異なる2つの
画像の部分領域の対応を誤差として演算し、最小誤差と
なる前記部分領域間の偏位とその近傍の誤差値を求め
る。誤差関数演算手段は前記最小誤差となる偏位とその
近傍の誤差値から偏位を変数とする2次の誤差関数を求
める。そして、最適化手段は前記2次誤差関数の総和あ
るいは部分和を、前記多項式関数の係数を変数として表
現し、この総和あるいは部分和の最小化を係数について
行なう。本発明では、動きベクトルからではなく、偏位
を変数とする2次の誤差関数から、これの総和または部
分和を最小化するよう位置を変数とする多項式関数(ア
フィン変換はその一例)の係数を定めることができる。
In the motion vector detecting apparatus of the tenth aspect of the present invention which represents a motion vector at an arbitrary position on the screen as a polynomial function having the position as a variable, the error calculating means has a plurality of partial regions obtained by dividing an image. With respect to, the correspondence between the partial areas of two different images is calculated as an error, and the deviation between the partial areas having the minimum error and the error value in the vicinity thereof are obtained. The error function calculating means obtains a quadratic error function having the deviation as a variable from the deviation having the minimum error and the error value in the vicinity thereof. The optimizing means expresses the sum or partial sum of the quadratic error function by using the coefficient of the polynomial function as a variable, and minimizes the sum or partial sum of the coefficients. In the present invention, the coefficient of a polynomial function having a position as a variable (an affine transformation is an example thereof) so as to minimize the total sum or partial sum of the quadratic error function having a deviation as a variable, not from a motion vector. Can be determined.

【0033】[0033]

【実施例】本発明の各実施例では、装置の動作を容易に
理解するために、画像は縦横288×352画素で構成
され、階層は一般性を失うことなく、2つで背景と前景
のみからなるものとする。また動きベクトル検出のため
の相関演算を行なうブロックは縦16画素、横16画素
で構成されているとする。
In each of the embodiments of the present invention, in order to easily understand the operation of the apparatus, the image is composed of 288 pixels by 352 pixels in the horizontal and vertical directions, and the hierarchy does not lose generality. Shall consist of Further, it is assumed that the block for performing the correlation calculation for detecting the motion vector is composed of 16 pixels in the vertical direction and 16 pixels in the horizontal direction.

【0034】以下、本発明の実施例を図面を用いて説明
する。本発明(請求項1,2,9,10)の第1の実施例を図1
〜図12を用いて説明する。ここで、図2は第1の発明
の構成例、図3は第2の発明の構成例、図4は第9の発
明の構成例、図5は第10の発明の構成例を示す図であ
る。図1は画像符号化装置と画像復号化装置の動作を説
明する階層符号化システムの構成図である。階層画像は
輝度と透過度の二つのフレームで構成されている。これ
を各々輝度プレーン、αプレーンと呼ぶことにする。階
層画像合成器107では、式2で表現される合成を行な
う。
Embodiments of the present invention will be described below with reference to the drawings. The first embodiment of the present invention (claims 1, 2, 9, 10) is shown in FIG.
~ It demonstrates using FIG. Here, FIG. 2 is a structural example of the first invention, FIG. 3 is a structural example of the second invention, FIG. 4 is a structural example of the ninth invention, and FIG. 5 is a structural example of the tenth invention. is there. FIG. 1 is a block diagram of a hierarchical coding system for explaining the operations of the image coding apparatus and the image decoding apparatus. The hierarchical image is composed of two frames of brightness and transparency. These are called a luminance plane and an α plane, respectively. The hierarchical image synthesizer 107 performs the synthesis represented by Expression 2.

【0035】[0035]

【数2】 [Equation 2]

【0036】式2において(x,y)は水平垂直位置で
あり、gf、gbは各々前景背景の輝度値[0,255]
を、αは前景の透過度[0,1]を表している。gは合
成された輝度値である。本実施例では簡単のため階層は
2つとしているために、背景の透過度は全て1で構成さ
れる。階層画像符号化器101、102は、前景、背景
の輝度プレーンとαプレーンの各動画像を符号化し、マ
ルチプレクサ103によって多重されたビットストリー
ムは復号化装置に送出される。復号化装置では、デマル
チプレクサ104により各階層画像のデータが分離さ
れ、階層画像復号化器105、106で階層画像が再構
成される。再構成された階層画像は階層画像合成器10
7で合成される。以下、この符号化システムを順に説明
していく。
In equation 2, (x, y) is the horizontal and vertical position, and g f and g b are the brightness values [0, 255] of the foreground and background, respectively.
, Α represents the transparency [0, 1] of the foreground. g is the synthesized luminance value. In this embodiment, since there are two layers for simplification, the transparency of the background is all 1's. The hierarchical image encoders 101 and 102 encode the respective moving images of the foreground and background luminance planes and the α plane, and the bit stream multiplexed by the multiplexer 103 is sent to the decoding device. In the decoding device, the data of each hierarchical image is separated by the demultiplexer 104, and the hierarchical images are reconstructed by the hierarchical image decoders 105 and 106. The reconstructed hierarchical image is the hierarchical image synthesizer 10
It is synthesized in 7. Hereinafter, this encoding system will be described in order.

【0037】図2は、図1における本発明(請求項1)
の一実施例における階層画像符号化器101、102の
構成図である。図2において、201は変形分析器、2
02は変形合成器、203、204は差分器、205は
予測符号符号化器、206は輝度プレーン誤差符号化
器、207はαプレーン誤差符号化器、208は輝度プ
レーン誤差復号化器、209はαプレーン誤差復号化
器、210はマルチプレクサ、211、212は加算
器、213、214はフレーム遅延器である。以上によ
うに構成された階層画像符号化器の動作を以下に説明す
る。
FIG. 2 shows the present invention (claim 1) in FIG.
FIG. 3 is a configuration diagram of hierarchical image encoders 101 and 102 in one embodiment. In FIG. 2, 201 is a deformation analyzer, 2
Reference numeral 02 is a modified combiner, 203 and 204 are differentiators, 205 is a predictive code encoder, 206 is a luminance plane error encoder, 207 is an α plane error encoder, 208 is a luminance plane error decoder, and 209 is α plane error decoder, 210 is a multiplexer, 211, 212 are adders, 213, 214 are frame delays. The operation of the hierarchical image encoder configured as above will be described below.

【0038】まず、変形分析器201では現在入力され
ている輝度プレーンとαプレーンの各位置に対して前フ
レームの復号結果である輝度プレーンとαプレーンのど
の位置が対応するかを求める。この位置の対応情報は後
述のアフィン変換パラメータとブロック並行移動成分と
して予測符号符号化器205で符号化される。変形合成
器202はこの対応情報を受け、前フレームの復号化結
果である輝度プレーンとαプレーンを変形させ、差分器
203、204で差分信号とする。輝度プレーンに限っ
てみれば、これは一般にCCITT勧告H.261に記
載されている画像符号化装置などで、「動き補償」と呼
ばれている処理に相当する。ここでは16×16画素の
ブロックで誤差絶対値和(SADと略す)最小となるブ
ロック移動だけでなく画面全体のアフィン変換を組み合
わせた動き補償を行なっている点が異なる。これを図6
を用いて説明する。
First, the deformation analyzer 201 determines which position of the luminance plane and α plane, which is the decoding result of the previous frame, corresponds to each position of the luminance plane and α plane currently input. Correspondence information of this position is encoded by the predictive code encoder 205 as an affine transformation parameter and a block parallel movement component described later. The transformation / combiner 202 receives this correspondence information, transforms the luminance plane and the α plane that are the decoding results of the previous frame, and makes the difference signals in the difference units 203 and 204. As far as the luminance plane is concerned, this is generally CCITT Recommendation H.264. The image coding apparatus described in H.261 corresponds to a process called “motion compensation”. The difference here is that not only block movement that minimizes the sum of error absolute values (abbreviated as SAD) in a block of 16 × 16 pixels but also motion compensation that combines affine transformation of the entire screen is performed. This is shown in FIG.
Will be explained.

【0039】図6は図2の変形合成器202の構成を示
しており、図中601は輝度画像メモリ、602はα画
像メモリ、603はデマルチプレクサ、604、605
はアフィン変換部、606、607はアフィン変換画像
メモリ、608、609は画像ブロック変形部である。
対応情報(変形パラメータ)はアフィン変換パラメータ
(式1参照)と縦横18×22個に分割されたブロック
についてその平行移動成分(図12参照)で構成されて
いる。動き補償のステップは以下に示す通りである。
FIG. 6 shows the configuration of the modification synthesizer 202 of FIG. 2, in which 601 is a luminance image memory, 602 is an α image memory, 603 is a demultiplexer, and 604 and 605.
Are affine transformation units, 606 and 607 are affine transformation image memories, and 608 and 609 are image block transformation units.
The correspondence information (deformation parameter) is composed of an affine transformation parameter (see Expression 1) and a parallel movement component (see FIG. 12) of a block divided into 18 × 22 vertical and horizontal blocks. The steps of motion compensation are as follows.

【0040】1.輝度画像メモリ601、α画像メモリ
602に各々輝度プレーン、αプレーンの画素値が取り
込まれる。同時にデマルチプレクサ603によりアフィ
ン変換パラメータとブロック並行移動成分が分離され
る。
1. Pixel values of the luminance plane and the α plane are loaded into the luminance image memory 601 and the α image memory 602, respectively. At the same time, the demultiplexer 603 separates the affine transformation parameter and the block translation component.

【0041】2.アフィン変換パラメータにより式1に
示されている移動量(u,v)について画像がアフィン
変換部604、605によりシフトされる。結果はアフ
ィン変換画像メモリ606、607に記憶される。
2. The image is shifted by the affine transformation units 604 and 605 with respect to the movement amount (u, v) shown in Expression 1 by the affine transformation parameter. The result is stored in the affine transformed image memories 606 and 607.

【0042】3.アフィン変換画像メモリ606、60
7に記憶された画像がさらに画像ブロック変形部60
8、609により縦横18×22個に分割されたブロッ
クについてその平行移動を16×16画素の大きさのブ
ロック単位で行なう。
3. Affine transformed image memory 606, 60
The image stored in FIG.
The parallel movement is performed for each of the blocks vertically and horizontally divided into 18 × 22 blocks by 8 and 609 in units of blocks each having a size of 16 × 16 pixels.

【0043】これを行なうために図2の変形分析器20
1はアフィン変換パラメータとブロック移動成分の抽出
を行なわなければならない。図4は図2の変形分析器2
01の構成図である。これを用いて変形分析器201の
動作を説明する。尚、図4に示す変形分析器201の構
成は本発明(請求項9)の動きベクトル検出装置の構成
例となっている。
To do this, the deformation analyzer 20 of FIG.
1 must extract affine transformation parameters and block movement components. FIG. 4 shows the deformation analyzer 2 of FIG.
It is a block diagram of 01. The operation of the deformation analyzer 201 will be described using this. The configuration of the deformation analyzer 201 shown in FIG. 4 is an example of the configuration of the motion vector detecting device of the present invention (claim 9).

【0044】図4において、401、402は輝度画像
メモリ、403、404はα画像メモリ、405、40
6は輝度・α重畳部、407はアフィン変換部、408
はアフィン変換係数演算部、409はアフィン変換画像
メモリ、410はブロック相関演算部、411はマルチ
プレクサである。図4に示す変形分析器201では、輝
度画像メモリ401、α画像メモリ403が参照画像と
して前フレームの結果をバッファリングしている。輝度
画像メモリ402、α画像メモリ404は符号化対象画
像である現在の入力フレームの画像を保持している。輝
度・α重畳部405、406は式3に示す処理を行な
い、一つの輝度画像を生成する。式3において、画素の
水平垂直位置(x,y)についてh(x,y)は合成さ
れた輝度画像、gは輝度プレーンの輝度値[0,25
5]、αはαプレーンの値[0,1]である。
In FIG. 4, 401 and 402 are luminance image memories, 403 and 404 are α image memories, and 405 and 40.
6 is a luminance / α superimposing unit, 407 is an affine transformation unit, 408
Is an affine transformation coefficient calculation unit, 409 is an affine transformation image memory, 410 is a block correlation calculation unit, and 411 is a multiplexer. In the modification analyzer 201 shown in FIG. 4, the luminance image memory 401 and the α image memory 403 buffer the results of the previous frame as reference images. The luminance image memory 402 and the α image memory 404 hold the image of the current input frame which is the encoding target image. The luminance / α superimposing units 405 and 406 perform the processing shown in Expression 3 to generate one luminance image. In Equation 3, for the horizontal and vertical position (x, y) of the pixel, h (x, y) is the combined luminance image, and g is the luminance value of the luminance plane [0, 25].
5] and α are values of the α plane [0, 1].

【0045】[0045]

【数3】 (Equation 3)

【0046】式3ではαの値により不透明領域では輝度
値を透明領域では適当な負値(−100)を重畳してい
る。これにより透過度の情報が重畳された輝度画像が生
成される。これを図示すると図11になる。また、この
ようなしきい値処理ではなく、実験的に定めた重畳係数
γを乗して式4のように重畳を行なっても良い。
In Expression 3, the brightness value is superimposed in the opaque area and the appropriate negative value (-100) is superimposed in the transparent area according to the value of α. As a result, a luminance image on which transparency information is superimposed is generated. This is shown in FIG. Further, instead of such threshold processing, the experimentally determined superposition coefficient γ may be multiplied to perform superposition as shown in Expression 4.

【0047】[0047]

【数4】 [Equation 4]

【0048】本実施例では、後に述べる他の実施例で輝
度・α重畳部を他の目的にも使用するため、式3に定め
る動作を行なうものとする。このようにして輝度とα値
が重畳された画像について式5、式6に定める相関演算
を行なう。
In this embodiment, since the luminance / α superimposing section is used for other purposes in another embodiment described later, the operation defined by the equation 3 is performed. In this way, the correlation calculation defined in Equations 5 and 6 is performed on the image in which the luminance and the α value are superimposed.

【0049】[0049]

【数5】 (Equation 5)

【0050】[0050]

【数6】 (Equation 6)

【0051】式5において、ht-1は前フレーム(図
4、参照画像)の重畳画素値、htは現フレーム(図
4、対象画像)の重畳画素値を表す。Rは16×16画
素の領域を表し、(u,v)は図12に示すように対応
するブロック領域への偏位である。式6によればSAD
の最も小さな偏位が動きベクトルとして求められる。ブ
ロック相関部410はアフィン変換された参照重畳画像
と対象重畳画像についてこの演算を行なう。なお、ブロ
ック相関部410にα画像メモリ404の出力が入力さ
れているのは、対象画像のαプレーンが全て透明である
領域については動きベクトルは不定となることから計算
を省略するためである。ブロック相関部410は18×
22ブロックについて最小となった偏位(p,q)を動
きベクトルとして出力する。アフィン変換部407、ア
フィン変換画像メモリ409は既に図6で説明した同名
のブロックと同じ動作を行なう。
In Equation 5, h t-1 represents the superimposed pixel value of the previous frame (FIG. 4, reference image) and h t represents the superimposed pixel value of the current frame (FIG. 4, target image). R represents an area of 16 × 16 pixels, and (u, v) is the deviation to the corresponding block area as shown in FIG. According to Equation 6, SAD
The smallest deviation of is obtained as the motion vector. The block correlator 410 performs this calculation on the affine transformed reference superimposed image and the target superimposed image. Note that the output of the α image memory 404 is input to the block correlating unit 410 because the calculation is omitted because the motion vector is undefined in the region where the α plane of the target image is all transparent. The block correlator 410 is 18 ×
The minimum deviation (p, q) for 22 blocks is output as a motion vector. The affine transformation unit 407 and the affine transformation image memory 409 perform the same operation as that of the block having the same name already described in FIG.

【0052】次にアフィン変換係数演算部408の説明
を行なう。図5はアフィン変換係数演算部408の構成
図であり、本発明(請求項10)の動きベクトル検出装
置の構成例となっている。図5において、501はブロ
ック相関演算部、502はSAD局面近似部、503は
誤差関数パラメータ格納メモリ、504はアフィン変換
パラメータ演算部である。ブロック相関演算部501の
動作は図4のブロック相関部410とほぼ同じである。
異なる点は、ブロック相関演算部501は18×22ブ
ロックについて最小となった偏位(p,q)に加えて、
その位置のSAD最小値と8近傍のSAD値を出力する
ことである。これを式7に示す。式7においてtは行列
の転置を表す。
Next, the affine transformation coefficient calculation unit 408 will be described. FIG. 5 is a configuration diagram of the affine transformation coefficient calculation unit 408, which is an example of the configuration of the motion vector detection device of the present invention (claim 10). In FIG. 5, 501 is a block correlation calculation unit, 502 is an SAD phase approximation unit, 503 is an error function parameter storage memory, and 504 is an affine transformation parameter calculation unit. The operation of the block correlation calculation unit 501 is almost the same as that of the block correlation unit 410 in FIG.
The difference is that in addition to the minimum deviation (p, q) for the 18 × 22 block, the block correlation calculation unit 501
The SAD minimum value at that position and the SAD values near 8 are output. This is shown in Equation 7. In Expression 7, t represents the transpose of the matrix.

【0053】[0053]

【数7】 (Equation 7)

【0054】これを受けてSAD局面近似部502は式
8〜式13の演算を行なう。演算結果は誤差関数パラメ
ータ格納メモリ503に格納される。式8〜式13の演
算は、SAD値を偏位(u,v)の関数と考えて、最小
偏位(p,q)近傍で2次のテーラー展開をおこなって
いることに相当する。縦横18×22のブロックの位置
をi、jと表現すると、透明である領域を除いて、各々
の2次誤差関数は式14で表現することができる。
In response to this, the SAD phase approximating unit 502 performs the operations of Expressions 8 to 13. The calculation result is stored in the error function parameter storage memory 503. The calculations of Expressions 8 to 13 are equivalent to performing the second-order Taylor expansion near the minimum deviation (p, q), considering the SAD value as a function of the deviation (u, v). When the positions of the blocks of 18 × 22 in the vertical and horizontal directions are expressed as i and j, each quadratic error function can be expressed by Expression 14, except for the transparent region.

【0055】[0055]

【数8】 (Equation 8)

【0056】[0056]

【数9】 [Equation 9]

【0057】[0057]

【数10】 [Equation 10]

【0058】[0058]

【数11】 [Equation 11]

【0059】[0059]

【数12】 (Equation 12)

【0060】[0060]

【数13】 (Equation 13)

【0061】[0061]

【数14】 [Equation 14]

【0062】ここで、式15、式16に示すようにアフ
ィン変換パラメータにより各ブロックの動きベクトルは
記述されるから、変分原理により各SAD誤差関数の総
和を最小とする必要条件として式17に示すように、ア
フィン変換パラメータaの偏微分が零ベクトルとならな
くてはならないオイラー式が導き出せる。これは式18
の行列で表現できる。アフィンパラメータ演算部504
はこのために式19(6×6行列)、式20(6×1行
列)をまず求め、そして式21により、アフィン変換パ
ラメータを演算する。
Here, since the motion vector of each block is described by the affine transformation parameters as shown in equations 15 and 16, equation 17 is used as a necessary condition for minimizing the total sum of the SAD error functions according to the variation principle. As shown, it is possible to derive the Euler equation in which the partial differential of the affine transformation parameter a must be a zero vector. This is Equation 18
Can be expressed as a matrix. Affine parameter calculator 504
For this purpose, Equation 19 (6 × 6 matrix) and Equation 20 (6 × 1 matrix) are first obtained, and then the affine transformation parameter is calculated by Equation 21.

【0063】なお、式19、式20において、(xj
i)はブロックi、jの中心位置である。
In equations 19 and 20, (x j ,
y i ) is the center position of blocks i and j.

【0064】[0064]

【数15】 (Equation 15)

【0065】[0065]

【数16】 [Equation 16]

【0066】[0066]

【数17】 [Equation 17]

【0067】[0067]

【数18】 (Equation 18)

【0068】[0068]

【数19】 [Formula 19]

【0069】[0069]

【数20】 (Equation 20)

【0070】[0070]

【数21】 [Equation 21]

【0071】以上のように構成された変形分析器201
(図4)では輝度とαを重畳した画像で相関演算を行な
うことにより、両方の情報から動きベクトルを求めるこ
とができる。式3で定めた透明領域の負値(−100)
の絶対値を大きくすれば、より不透明領域の輪郭の情報
が強調された動きベクトルを得ることができる。特に前
記領域内部に動き推定に有効なエッジ、模様などの手が
かりが存在しない時、有効である。図5に示したアフィ
ン変換係数演算部408は局所的な相関演算からではな
く2次の関数近似を行なうことによりアフィン変換パラ
メータを求めている。局所的な相関演算では、単調な輪
郭周辺で動きベクトルは輪郭接線方向に自由度をもつ場
合が多い。この場合、従来例に示した2段階のアフィン
変換パラメータ推定では大きな推定誤差が予想される
が、本実施例に示した手法では自由度を2次関数で表現
し、総合的に2次関数の総和の最小化を計ることから、
より安定にパラメータ推定できることが期待される。
The deformation analyzer 201 configured as described above.
In (FIG. 4), a motion vector can be obtained from both pieces of information by performing a correlation operation on an image in which luminance and α are superimposed. Negative value of transparent area defined by Equation 3 (-100)
If the absolute value of is increased, a motion vector in which the contour information of the opaque region is emphasized can be obtained. This is particularly effective when there are no cues such as edges and patterns effective for motion estimation inside the region. The affine transformation coefficient calculation unit 408 shown in FIG. 5 obtains the affine transformation parameter by performing a quadratic function approximation instead of performing a local correlation calculation. In the local correlation calculation, the motion vector often has a degree of freedom in the tangent direction of the contour around the monotonous contour. In this case, a large estimation error is expected in the two-step affine transformation parameter estimation shown in the conventional example, but in the method shown in this embodiment, the degrees of freedom are expressed by a quadratic function, and the quadratic function of From the minimization of summation,
It is expected that the parameters can be estimated more stably.

【0072】またSAD相関の偏位を変数とした2次の
関数近似は式17に代表されるオイラー式が未定パラメ
ータについて線形式となるため容易に未定パラメータを
導出することができる利点がある。これはより一般の多
項式を用いた場合にも共通して言えることである。例え
ば、式22、式23に示した動きベクトルの式は透視変
換の下で平面物体の投影像から生じる動きベクトルを表
現することができる。
Further, the quadratic function approximation using the deviation of the SAD correlation as a variable has an advantage that the undetermined parameter can be easily derived because the Euler equation represented by the equation 17 has a linear form with respect to the undetermined parameter. This can be said in common when a more general polynomial is used. For example, the motion vector formulas shown in Formulas 22 and 23 can represent the motion vector generated from the projected image of the planar object under perspective transformation.

【0073】[0073]

【数22】 [Equation 22]

【0074】[0074]

【数23】 (Equation 23)

【0075】この場合もアフィン変換と同様に式24の
オイラー式を計算し、式19〜式21と同様の手続きで
容易にパラメータを推定することができる。
Also in this case, the Euler equation of Equation 24 is calculated similarly to the affine transformation, and the parameters can be easily estimated by the procedure similar to Equations 19 to 21.

【0076】[0076]

【数24】 [Equation 24]

【0077】以上図2に示した階層画像符号化器10
1、102の変形分析器201、変形合成器202の説
明を行なった。同時に本発明(請求項9,10)の動きベク
トル検出装置の構成例を示した。以後、図2の残された
ブロックの説明を行なっていく。
The hierarchical image encoder 10 shown in FIG. 2 has been described above.
The deformation analyzer 201 and the deformation synthesizer 202 of Nos. 1 and 102 have been described. At the same time, a configuration example of the motion vector detecting device of the present invention (claims 9 and 10) is shown. Hereinafter, the remaining blocks of FIG. 2 will be described.

【0078】差分器203、204により輝度データ、
透過度データの差分が各々輝度プレーン誤差符号化器2
06、αプレーン誤差符号化器207に送られ各々独立
に符号化される。各符号化器は図7、図8に示す構成と
なっている。図7は輝度プレーン誤差符号化器の構成図
で、701はDCT演算部、702は量子化部1、70
3は可変長符号化部1である。
Luminance data by the subtracters 203 and 204,
The difference of the transparency data is the luminance plane error encoder 2
06, sent to the α-plane error encoder 207 and encoded independently. Each encoder has the configuration shown in FIGS. 7 and 8. FIG. 7 is a block diagram of the luminance plane error encoder. 701 is a DCT operation unit, 702 is a quantization unit 1, 70.
Reference numeral 3 is a variable length coding unit 1.

【0079】図8は、αプレーン誤差符号化器の構成図
で、801はハール変換演算部、802は量子化部2、
803は可変長符号化部2である。DCT演算部701
は8×8画素のブロックで離散コサイン変換を行ない、
変換されたDCT係数は量子化部702で量子化され、
可変長符号化部703でコサイン変換係数をスキャン
し、零係数長と量子化係数の組合せで2次元ハフマン符
号化される。この処理はCCITT勧告H.261に開
示されている技術とほぼ同じであるので詳しい説明は省
略する。
FIG. 8 is a block diagram of the α-plane error encoder, in which 801 is a Haar transform operation unit, 802 is a quantization unit 2, and
Reference numeral 803 is the variable length coding unit 2. DCT calculation unit 701
Performs a discrete cosine transform on a block of 8 × 8 pixels,
The transformed DCT coefficient is quantized by the quantizer 702,
The variable length coding unit 703 scans the cosine transform coefficient and performs two-dimensional Huffman coding with a combination of the zero coefficient length and the quantized coefficient. This process is based on CCITT Recommendation H.264. Since it is almost the same as the technology disclosed in H.261, detailed description will be omitted.

【0080】αプレーン誤差符号化器207では離散コ
サイン変換の代わりに8×8画素のブロックでハール変
換を用いている。ここでハール変換は8×1の列ベクト
ルを式25の右から乗する1次元ハール変換を8×8の
画素ブロックに対して縦横に行なうことにより実現され
る。
The α-plane error encoder 207 uses Haar transform on a block of 8 × 8 pixels instead of discrete cosine transform. Here, the Haar transform is realized by vertically and horizontally performing a one-dimensional Haar transform in which an 8 × 1 column vector is multiplied from the right of Expression 25 on an 8 × 8 pixel block.

【0081】[0081]

【数25】 (Equation 25)

【0082】離散コサイン変換ではなくハール変換を用
いたために量子化テーブルとハフマンテーブルが若干変
更されている点が輝度プレーン符号化器206と異な
る。しかし、基本的な動作は同じであるので詳細な説明
は省略する。図2に説明を戻す。
The luminance plane encoder 206 differs from the luminance plane encoder 206 in that the quantization table and the Huffman table are slightly changed because the Haar transform is used instead of the discrete cosine transform. However, since the basic operation is the same, detailed description will be omitted. Returning to FIG.

【0083】今まで説明した輝度プレーン誤差符号化器
206とαプレーン誤差符号化器207の出力は、マル
チプレクサ210で多重化されて出力される。一方、次
のフレームの予測画像を生成するために前述の出力は輝
度プレーン誤差復号化器208とαプレーン誤差復号化
器209に入力される。各復号化器は図9、図10に示
す構成となっている。
The outputs of the luminance plane error encoder 206 and the α plane error encoder 207 described so far are multiplexed by the multiplexer 210 and output. On the other hand, the above-mentioned output is input to the luminance plane error decoder 208 and the α plane error decoder 209 in order to generate the predicted image of the next frame. Each decoder has the configuration shown in FIGS. 9 and 10.

【0084】図9は輝度プレーン誤差復号化器の構成図
で、901は可変長復号化部、902は逆量子化部、9
03は逆DCT演算部である。図10はαプレーン誤差
復号化器の構成図で、1001は可変長復号化部、10
02は逆量子化部、1003は逆ハール変換演算部であ
る。可変長復号化部901で零係数長と量子化係数の組
合せをハフマン復号しコサイン変換係数に戻す、そし
て、逆量子化部902で量子化インデックスから代表値
に置き換え、最後に逆DCT演算部903により8×8
画素ブロックの画像が再現される。この処理は輝度プレ
ーン誤差符号化器206と同様にCCITT勧告H.2
61に開示されている技術とほぼ同じであるので詳しい
説明は省略する。
FIG. 9 is a block diagram of a luminance plane error decoder. 901 is a variable length decoding unit, 902 is an inverse quantization unit, and 9
Reference numeral 03 is an inverse DCT calculation unit. FIG. 10 is a block diagram of an α-plane error decoder, in which 1001 is a variable length decoding unit,
Reference numeral 02 is an inverse quantization unit, and 1003 is an inverse Haar transform calculation unit. The variable length decoding unit 901 Huffman-decodes the combination of the zero coefficient length and the quantized coefficient to restore the cosine transform coefficient, and the inverse quantization unit 902 replaces the quantization index with the representative value, and finally, the inverse DCT operation unit 903. By 8 × 8
The image of the pixel block is reproduced. This processing is similar to that of the luminance plane error encoder 206, and CCITT Recommendation H.264. Two
Since it is almost the same as the technique disclosed in No. 61, detailed description will be omitted.

【0085】図10の逆ハール変換演算部906は8×
8のハール係数に対して縦横に8×1の列ベクトルを取
り出し、式26に示すマトリクスを左から乗じることに
より実現される。可変長復号化部1001、逆量子化部
1002の動作は、αプレーン誤差符号化器207に対
応して、輝度プレーン復号化器209の当該ブロックと
はテーブルの内容が異なるだけであるので詳細な説明は
省略する。
The inverse Haar transform calculation unit 906 of FIG.
It is realized by taking out a column vector of 8 × 1 vertically and horizontally with respect to the Haar coefficient of 8 and multiplying the matrix shown in Expression 26 from the left. The operations of the variable length decoding unit 1001 and the dequantization unit 1002 correspond to the α plane error encoder 207, and only the contents of the table are different from those of the block of the luminance plane decoder 209. The description is omitted.

【0086】[0086]

【数26】 (Equation 26)

【0087】次に図1の階層符号化システムを構成する
階層画像復号化器105、106を図3を用いて説明す
る。図3は本発明(請求項2)の画像復号化装置の構成
例に相当する階層画像復号化器105、106の構成図
である。
Next, the hierarchical image decoders 105 and 106 constituting the hierarchical coding system of FIG. 1 will be described with reference to FIG. FIG. 3 is a configuration diagram of hierarchical image decoders 105 and 106 corresponding to an example of the configuration of the image decoding device of the present invention (claim 2).

【0088】図3において、301はデマルチプレク
サ、302は輝度プレーン誤差復号化器、303はαプ
レーン誤差復号化器、304は予測符号復号化器、30
5は変形合成器、306、307は加算器、308、3
09はフレーム遅延器である。デマルチプレクサ301
の入力には、輝度誤差、α誤差、アフィン変換パラメー
タと縦横18×22個に分割されたブロックについての
移動ベクトルから構成される変形パラメータが多重され
ている。これらは分離されて各々輝度プレーン誤差復号
化器302、αプレーン誤差復号化器303、予測符号
復号化器304に出力される。
In FIG. 3, 301 is a demultiplexer, 302 is a luminance plane error decoder, 303 is an α plane error decoder, 304 is a predictive code decoder, and 30.
5 is a modification synthesizer, 306 and 307 are adders, 308 and 3
Reference numeral 09 is a frame delay device. Demultiplexer 301
In the input of, a deformation parameter composed of a luminance error, an α error, an affine transformation parameter, and a movement vector for a block divided into 18 × 22 vertical and horizontal blocks is multiplexed. These are separated and output to the luminance plane error decoder 302, the α plane error decoder 303, and the prediction code decoder 304, respectively.

【0089】ここで輝度プレーン誤差復号化器302、
αプレーン誤差復号器303、変形合成器305は各々
図2の輝度プレーン復号化器208、αプレーン復号化
器209、変形合成器202と全く同じ動作を行なう。
以上、図1の階層符号化を構成する階層符号化器10
1、102、階層復号化器105、106の構成が各々
図2、図3から成っているとした第1の実施例を説明し
た。本実施例ではテンプレートは逐次フレーム間符号化
として更新されていく点に特徴がある。テンプレートの
中で透過度の差分は多値の波形情報としてこれを変換符
号化とした。αプレーンを独立に符号化することによ
り、後述の第2の実施例とは異なり、曇りガラスなどの
半透明の物体の動画像を扱うことができる。画像を階層
化しているため、前景または背景がアフィン変換パラメ
ータのみで記述できる場合が増える。
Here, the luminance plane error decoder 302,
The α-plane error decoder 303 and the modified combiner 305 perform exactly the same operations as the luminance plane decoder 208, the α-plane decoder 209, and the modified combiner 202 of FIG. 2, respectively.
As described above, the hierarchical encoder 10 that constitutes the hierarchical encoding of FIG.
The first embodiment has been described in which the configurations of the first and second hierarchical decoders 105 and 106 are composed of FIGS. 2 and 3, respectively. The present embodiment is characterized in that the template is updated as sequential interframe coding. In the template, the difference in transparency is multi-valued waveform information, and this is converted and encoded. By independently encoding the α plane, a moving image of a semitransparent object such as frosted glass can be handled, unlike the second embodiment described later. Since the images are hierarchized, there are more cases where the foreground or background can be described only by the affine transformation parameters.

【0090】この場合、アフィン変換パラメータのみ伝
送しブロック移動成分、他の輝度誤差画像、αプレーン
誤差画像を符号化する必要がないため符号化効率が大き
く向上する。また物体が変形してアフィン変換パラメー
タで記述できない場合は、ブロック移動成分、他の輝度
誤差画像、αプレーン誤差画像でテンプレートが更新さ
れるために大きな画質劣化が生じない。
In this case, it is not necessary to transmit only the affine transformation parameter and encode the block moving component, other luminance error image, and α plane error image, so that the encoding efficiency is greatly improved. Further, when the object is deformed and cannot be described by the affine transformation parameter, the template is updated with the block movement component, another luminance error image, and the α plane error image, so that a large image quality deterioration does not occur.

【0091】ところでアフィンパラメータ演算部504
で行なった式19〜式21の演算は画像全体で行なう必
要はない。推定されているアフィン変換パラメータから
式14を用いて誤差値の大きなブロックを除外して推定
することにより、18×22個のに分割されたブロック
集合全体ではなく多数のブロックの動きに対して整合性
のとれたアフィン変換パラメータを推定することができ
る。これにより、テンプレート修正のためのブロック移
動成分、他の輝度誤差画像、αプレーン誤差画像の符号
化を局所的にすることも可能になる。また本実施例で
は、ブロック相関の計算をSADとしたが2乗誤差和
(SSD)、相関係数などの他の評価尺度を用いること
も可能である。
By the way, the affine parameter calculation unit 504
It is not necessary to perform the calculation of Equations 19 to 21 performed in step 1) for the entire image. Estimating the estimated affine transformation parameters by excluding the block having a large error value using Equation 14 enables matching to the motion of a large number of blocks instead of the entire block set divided into 18 × 22 blocks. Efficient affine transformation parameters can be estimated. This makes it possible to locally encode the block movement component for template correction, another luminance error image, and the α plane error image. Further, in the present embodiment, the block correlation calculation is SAD, but other evaluation measures such as sum of squared errors (SSD) and correlation coefficient can be used.

【0092】次に本発明(請求項3、4)の第2の実施
例を、以下に図1、図11、図13、図14、図15、
図16、図17を用いて説明する。第2の実施例におい
ても、階層画像符号化システムの構成は図1と同じであ
る。図1における階層画像符号化器101、102は本
実施例では、図13の構成をとる。また階層画像復号化
器105、106の構成は図14の構成をとることが第
1の実施例と異なる。ここで、図13は第3の発明の構
成例、図14は第4の発明の構成例に相当する。
Next, a second embodiment of the present invention (claims 3 and 4) will be described below with reference to FIGS. 1, 11, 13, 14, and 15.
This will be described with reference to FIGS. Also in the second embodiment, the configuration of the hierarchical image coding system is the same as that in FIG. The hierarchical image encoders 101 and 102 in FIG. 1 have the configuration of FIG. 13 in this embodiment. Also, the configuration of the hierarchical image decoders 105 and 106 differs from that of the first embodiment in that the configuration of FIG. 14 is adopted. Here, FIG. 13 corresponds to a configuration example of the third invention, and FIG. 14 corresponds to a configuration example of the fourth invention.

【0093】図13において、1301は変形分析器、
1302は変形合成器、1303は輝度・α分離部、1
304は輝度・α重畳部、1305はフレーム遅延器、
1306は差分器、1307は加算器、1308は輝度
・α重畳誤差符号化器、1309は予測符号符号化器、
1310は輝度・α重畳誤差符号化器、1311はマル
チプレクサである。図13の構成は図2に示した階層符
号化器の構成と基本的に同じである。
In FIG. 13, 1301 is a deformation analyzer.
1302 is a deformation synthesizer, 1303 is a luminance / α separation unit, 1
304 is a luminance / α superimposing unit, 1305 is a frame delay unit,
1306 is a difference unit, 1307 is an adder, 1308 is a luminance / α superimposition error encoder, 1309 is a predictive code encoder,
Reference numeral 1310 is a luminance / α superposition error encoder, and 1311 is a multiplexer. The configuration of FIG. 13 is basically the same as the configuration of the hierarchical encoder shown in FIG.

【0094】図13を構成する各ブロックの中で、変形
分析器1301、フレーム遅延器1305、差分器13
06、加算器1307、予測符号化器1309の動作は
図2の同名称ブロックと全く同じ動作を行なう。第1の
実施例では、輝度プレーンとαプレーンを個別に符号化
したが、本実施例では輝度・α重畳部1304におい
て、図11に示すようにαの値により不透明領域では輝
度値を透明領域では適当な負値(−10)を重畳してい
る。これを式27に示す。
Of the blocks constituting FIG. 13, the deformation analyzer 1301, the frame delay unit 1305, and the difference unit 13 are included.
The operations of 06, adder 1307, and predictive encoder 1309 are exactly the same as those of the block having the same name in FIG. In the first embodiment, the luminance plane and the α plane are encoded separately, but in the present embodiment, the luminance / α superimposing unit 1304 uses the value of α as shown in FIG. Then, an appropriate negative value (-10) is superimposed. This is shown in Equation 27.

【0095】[0095]

【数27】 [Equation 27]

【0096】これにより透過度の情報が重畳された輝度
画像が生成される。輝度・α分離部1303では、逆に
式28、式29により重畳された輝度情報から輝度とα
が分離される。
As a result, a luminance image on which transparency information is superimposed is generated. On the contrary, the brightness / α separation unit 1303 calculates the brightness and α from the brightness information superimposed by Expressions 28 and 29.
Are separated.

【0097】[0097]

【数28】 [Equation 28]

【0098】[0098]

【数29】 [Equation 29]

【0099】式27における定数−10は符号化/復号
化に伴う量子化誤差によっても式28、式29で輝度・
α分離が行なえるよう考慮して設定した値である。変形
合成器1302の動作は図2における変形合成器202
と扱う画像が輝度・α重畳画像である点を除き、ほぼ同
じである。その構成を図15に示す。
The constant -10 in the equation 27 is the luminance in the equation 28 and the equation 29 due to the quantization error caused by the encoding / decoding.
It is a value set in consideration of α separation. The operation of the modification synthesizer 1302 is the modification synthesizer 202 in FIG.
The image is almost the same except that the image treated as is a luminance / α-superimposed image. The structure is shown in FIG.

【0100】図15は変形合成器1302、1405の
構成図であって、1501は輝度・αメモリ、1502
はデマルチプレクサ、1503はアフィン変換部、15
04はアフィン変換画像メモリ、1505は画像ブロッ
ク変形部である。変形合成器1302は、アフィン変換
パラメータと縦横18×22個に分割されたブロックに
ついてその平行移動成分で構成された対応情報(変形パ
ラメータ)を入力として動作する。輝度・αメモリ15
01は輝度・α重畳画像をバッファリングすためのメモ
リである。図15の他のブロックの動作は、図6の同名
称ブロックと同じなので省略する。
FIG. 15 is a block diagram of the modification synthesizers 1302 and 1405, in which 1501 is a luminance / α memory and 1502.
Is a demultiplexer, 1503 is an affine transformation unit, 15
Reference numeral 04 is an affine transformed image memory, and 1505 is an image block transformation unit. The transformation combiner 1302 operates by inputting the affine transformation parameter and the correspondence information (transformation parameter) formed by the parallel movement component of the block divided into 18 × 22 vertical and horizontal blocks. Brightness / α memory 15
Reference numeral 01 is a memory for buffering the brightness / α superposed image. The operation of the other blocks in FIG. 15 is the same as that of the block having the same name in FIG.

【0101】次に図13における輝度・α重畳誤差符号
化器1308の説明を以下に行なう。図16は輝度・α
重畳誤差符号化器1308の構成図で1601は領域境
界判定部、1602、1609はスイッチ、1603は
DCT演算部、1604は量子化部、1605は可変長
符号化部、1606はハール変換演算部、1607は量
子化部、1608は可変長符号化部、1610はマルチ
プレクサである。領域境界判定部1601は(表1)に
示す制御と切替え情報ビットの出力を行なう。
Next, the luminance / α superposition error encoder 1308 in FIG. 13 will be described below. Fig. 16 shows brightness / α
In the configuration diagram of the superposition error encoder 1308, 1601 is a region boundary determination unit, 1602 and 1609 are switches, 1603 is a DCT operation unit, 1604 is a quantization unit, 1605 is a variable length encoding unit, 1606 is a Haar transform operation unit, Reference numeral 1607 is a quantizer, 1608 is a variable length encoder, and 1610 is a multiplexer. Region boundary determining section 1601 outputs the control and switching information bits shown in (Table 1).

【0102】[0102]

【表1】 [Table 1]

【0103】8×8のブロック内の全てαの値が1とな
る物体内領域では図7で説明した輝度プレーン誤差符号
化器206の動作を行ない、8×8のブロック内で少な
くとも1つのαの値が0となる輪郭領域では図8で説明
したαプレーン誤差符号化器207の動作を行なう。
The luminance plane error encoder 206 described with reference to FIG. 7 is operated in the intra-object region where the value of all α in the 8 × 8 block is 1, and at least one α in the 8 × 8 block is operated. In the contour area where the value of is 0, the operation of the α-plane error encoder 207 described in FIG. 8 is performed.

【0104】図16と図7、図8で同名称のブロックの
動作は同じである。図16における量子化部1607と
可変長符号化部1608は輝度を重畳されている輪郭周
辺の多値パターンを符号化するために、量子化部80
2、可変長符号化部803とは量子化テーブルとハフマ
ンテーブルが若干変更されている点が異なる。以上の構
成によりマルチプレクサ1610より変換符号と切替え
情報ビットが多重されて出力される。
The operations of the blocks having the same names are the same in FIGS. 16 and 7 and 8. The quantizing unit 1607 and the variable length coding unit 1608 in FIG. 16 use the quantizing unit 80 in order to code the multivalued pattern around the contour on which the luminance is superimposed.
2. It differs from the variable length coding unit 803 in that the quantization table and the Huffman table are slightly changed. With the above configuration, the conversion code and the switching information bit are multiplexed and output from the multiplexer 1610.

【0105】一般に輝度情報に対しては、DCTがハー
ル変換に比べて符号化効率で優れているが、急峻なエッ
ジを含む領域ではモスキートノイズと呼ばれる波紋が生
じる。これは輪郭周辺のα値の再現には好ましくない。
そこで、輪郭周辺部では、上記モスキートノイズが発生
しないハール変換を用いた。
Generally, for luminance information, DCT is superior in coding efficiency to Haar transform, but a ripple called mosquito noise is generated in a region including a steep edge. This is not preferable for reproducing the α value around the contour.
Therefore, the Haar transform that does not generate the mosquito noise is used around the contour.

【0106】次に前記した輝度・α重畳誤差符号化器1
308に対応した輝度・α誤差復号化器1310、14
02の構成を図17を用いて説明する。図17は輝度・
α重畳誤差復号化器1310、1402の構成図であっ
て1701はデマルチプレクサ、1702は切替え制御
部、1703、1710はスイッチ、1704は可変長
復号化部、1705は逆量子化部、1706は逆DCT
演算部、1707は可変長復号化部、1708は逆量子
化部、1709は逆ハール変換演算部である。切替え制
御部1702はデマルチプレクサ1701により分離さ
れた切替え情報ビットにより(表1)に対応してスイッ
チ1803、1710をビットが1であれば逆DCT演
算部1706が選択されるように、0であれば逆ハール
変換1709が選択されるように制御する。図17、図
9、図10に示した同名称ブロックの動作は同じであ
る。
Next, the above-mentioned luminance / α superposition error encoder 1
Luminance / α error decoders 1310, 14 corresponding to 308
The configuration of No. 02 will be described with reference to FIG. Figure 17 shows the brightness
It is a block diagram of alpha superposition error decoder 1310, 1402, 1701 is a demultiplexer, 1702 is a switching control part, 1703, 1710 is a switch, 1704 is a variable length decoding part, 1705 is a dequantization part, 1706 is an inverse. DCT
An arithmetic unit, 1707 is a variable length decoding unit, 1708 is an inverse quantization unit, and 1709 is an inverse Haar transform arithmetic unit. The switching control unit 1702 sets the switches 1803 and 1710 corresponding to (Table 1) by the switching information bits separated by the demultiplexer 1701 to 0 so that the inverse DCT operation unit 1706 is selected if the bit is 1. For example, the inverse Haar transform 1709 is controlled to be selected. The operations of the blocks having the same names shown in FIGS. 17, 9, and 10 are the same.

【0107】図17における可変長復号化部1707と
逆量子化部1708とは各々図16における量子化部1
607と可変長符号化部1608とに対応した逆処理を
行なう。
The variable length decoding unit 1707 and the dequantization unit 1708 in FIG. 17 are respectively the quantization unit 1 in FIG.
Inverse processing corresponding to 607 and the variable length coding unit 1608 is performed.

【0108】次に図14を用いて図1における階層画像
復号化器105、106の構成を説明する。図14にお
いて、1401はデマルチプレクサ、1402は輝度・
α重畳誤差復号化器、1403は予測符号復号化器、1
404は加算器、1405は変形合成器、1406はフ
レーム遅延器、1407は輝度α分離部である。デマル
チプレクサ1401は図13の構成からなる階層画像符
号化器101、102の出力を受けて、変形パラメータ
と輝度・α誤差画像のビット系列を分離する。分離され
たデータは各々輝度・α重畳誤差復号化器1402と予
測符号復号化器1403へ出力される。予測符号復号化
器1403ではアフィン変換パラメータと縦横18×2
2のブロックの動きベクトルを出力する。他のブロック
の動作は図13で述べた同名のブロックと同じである。
Next, the structure of the hierarchical image decoders 105 and 106 in FIG. 1 will be described with reference to FIG. In FIG. 14, reference numeral 1401 denotes a demultiplexer, 1402 denotes luminance,
α convolutional error decoder, 1403 is a predictive code decoder, 1
Reference numeral 404 is an adder, 1405 is a modification combiner, 1406 is a frame delay unit, and 1407 is a luminance α separation unit. The demultiplexer 1401 receives the outputs of the hierarchical image encoders 101 and 102 configured as shown in FIG. 13, and separates the transformation parameter and the bit sequence of the luminance / α error image. The separated data are output to the luminance / α superposition error decoder 1402 and the prediction code decoder 1403, respectively. The predictive code decoder 1403 uses the affine transformation parameters and the vertical and horizontal 18 × 2.
The motion vector of the second block is output. The operation of the other blocks is the same as the block of the same name described in FIG.

【0109】以上第2の実施例を説明した。第2の実施
例では、第1の実施例とは異なり、αプレーンの情報は
[0,1]の多値から2値へ縮退する。その代わり、α
プレーンの情報を輝度プレーンに重畳することにより、
テンプレートの変形を輝度情報の差分として扱うことを
可能にしている。本実施例では、式27に示すように透
明領域の輝度値を−10としたが、不透明領域の輝度が
255に近い場合、物体の輪郭には輝度の大きな不連続
が生じ、符号量が増えることが予想される。この場合、
輝度・α重畳部1304の動作を適応的に式27または
式30とし、更に輝度・α分離部1303、1407の
動作を式31と32に変更する拡張も容易である。
The second embodiment has been described above. In the second embodiment, unlike the first embodiment, the information of the α plane is degenerated from multi-valued [0, 1] to binary. Instead, α
By superimposing the plane information on the luminance plane,
It is possible to treat the deformation of the template as the difference of the luminance information. In the present embodiment, the brightness value of the transparent area is set to −10 as shown in Expression 27, but when the brightness of the opaque area is close to 255, a large discontinuity of the brightness occurs in the contour of the object and the code amount increases. It is expected that. in this case,
It is also easy to expand the operation of the brightness / α superimposing unit 1304 adaptively to Expression 27 or Expression 30, and further change the operation of the brightness / α separating units 1303 and 1407 to Expressions 31 and 32.

【0110】[0110]

【数30】 [Equation 30]

【0111】[0111]

【数31】 [Equation 31]

【0112】[0112]

【数32】 [Equation 32]

【0113】また、本実施例で扱う輝度をベクトルに拡
張して、αプレーン情報の輝度プレーンへの重畳をベク
トル空間で行なうことも考えられる。例えば、3原色ま
たは輝度と色差信号で構成される3次元色ベクトルcを
考えてみる。この色ベクトルの平均c ̄と分散Σを計算
し、式33に示すように分散Σで正規化されたc−c ̄
の2次形式の値域Thを計算する。
It is also conceivable to extend the luminance handled in this embodiment into a vector and superimpose the α plane information on the luminance plane in the vector space. For example, consider a three-dimensional color vector c composed of three primary colors or luminance and a color difference signal. The average c- and variance Σ of this color vector are calculated, and cc-normalized by the variance Σ as shown in Expression 33.
The value range Th of the quadratic form of is calculated.

【0114】[0114]

【数33】 [Expression 33]

【0115】一つのテンプレートについて式33のTh
を求め、分散、平均ベクトル、値域Thのデータを付随
させておくと、式34のように2次形式の値が閾値より
大きくなる任意のベクトルeを用いてαプレーンの情報
を重畳することができる。
Th of Expression 33 for one template
And the data of the variance, the average vector, and the range Th are attached, it is possible to superimpose the information of the α plane by using an arbitrary vector e in which the value of the quadratic form is larger than the threshold value as in Expression 34. it can.

【0116】[0116]

【数34】 (Equation 34)

【0117】この分離は式35、式36で行なえる。This separation can be performed by the equations 35 and 36.

【0118】[0118]

【数35】 [Equation 35]

【0119】[0119]

【数36】 [Equation 36]

【0120】これによれば、分離された輝度画像で物体
輪郭の近くで生じるステップエッジの強さを軽減するこ
とができる。
According to this, it is possible to reduce the strength of the step edge generated near the object contour in the separated luminance image.

【0121】次に本発明(請求項5、6)の第3の実施
例を、以下に図18、図19を用いて説明する。図18
は本発明(請求項5)の構成例に相当する画像符号化装
置の構成図で、1801は前景メモリ、1802は背景
メモリ、1803は前景分離器、1804、1805は
階層画像符号化器、1806はマルチプレクサ、180
7はデマルチプレクサ、1808、1809は階層画像
復号化器、1810は階層画像合成器、1811は予測
画像メモリ、1812は差分器、1813は輝度プレー
ン誤差符号化器、1814はマルチプレクサである。
Next, a third embodiment of the present invention (claims 5 and 6) will be described below with reference to FIGS. FIG.
Is a block diagram of an image encoding apparatus corresponding to the configuration example of the present invention (claim 5), in which 1801 is a foreground memory, 1802 is a background memory, 1803 is a foreground separator, 1804 and 1805 are hierarchical image encoders, 1806. Is a multiplexer, 180
Reference numeral 7 is a demultiplexer, 1808 and 1809 are hierarchical image decoders, 1810 is a hierarchical image synthesizer, 1811 is a predictive image memory, 1812 is a differentiator, 1813 is a luminance plane error encoder, and 1814 is a multiplexer.

【0122】図19は本発明(請求項6)の構成例に相
当する画像復号化装置の構成図で、1911、1912
はデマルチプレクサ、1913、1914は階層画像復
号化器、1915は階層画像合成器、1916は予測画
像メモリ、1917は輝度プレーン誤差復号化器、19
18は加算器である。以上のブロック中、階層画像符号
化器1804、1805、マルチプレクサ1806、デ
マルチプレクサ1807、1912、階層画像復号化器
1808、1809、1913、1914、階層画像合
成器1810、1915には第1あるいは第2の実施例
における図1の同名ブロックを用いる。また輝度プレー
ン誤差符号化器1813には図2の輝度プレーン誤差符
号化器207、輝度プレーン誤差復号化器1917には
図2の輝度プレーン誤差復号化器208を用いる。
FIG. 19 is a block diagram of an image decoding apparatus corresponding to the configuration example of the present invention (claim 6).
Is a demultiplexer, 1913 and 1914 are hierarchical image decoders, 1915 is a hierarchical image synthesizer, 1916 is a predictive image memory, 1917 is a luminance plane error decoder, 19
18 is an adder. Among the above blocks, the hierarchical image encoders 1804 and 1805, the multiplexer 1806, the demultiplexers 1807 and 1912, the hierarchical image decoders 1808, 1809, 1913 and 1914, and the hierarchical image synthesizers 1810 and 1915 are either the first or the second. 1 in the embodiment of FIG. The luminance plane error encoder 1813 uses the luminance plane error encoder 207 of FIG. 2, and the luminance plane error decoder 1917 uses the luminance plane error decoder 208 of FIG.

【0123】以上の様に構成された画像符号化装置と画
像復号化構成装置では、背景画像を背景画像を予め撮影
しておき背景画像メモリ1802に蓄えておく。前景分
離器1803では式37によりα値を決定することによ
り前景を分離する。
In the image coding device and the image decoding device configured as described above, the background image is captured in advance and stored in the background image memory 1802. The foreground separator 1803 separates the foreground by determining the α value according to Expression 37.

【0124】[0124]

【数37】 (37)

【0125】式37において、gはカメラ入力の輝度
値、gbは背景メモリの輝度値、Tは実験的に定めるし
きい値[0,1]である。結果は前景メモリ1801に
入力される。この後、階層画像は各々第1の実施例ある
いは第2の実施例で述べた処理を経て処理結果は予測画
像メモリ1811に出力される。
In Equation 37, g is the luminance value of the camera input, g b is the luminance value of the background memory, and T is the threshold value [0, 1] experimentally determined. The result is input to the foreground memory 1801. After that, the hierarchical image is subjected to the processing described in the first embodiment or the second embodiment, and the processing result is output to the prediction image memory 1811.

【0126】今までに述べた2つの実施例では、これを
再構成された画像の出力としていたが、本実施例では、
さらに予測画像メモリ1811の出力と原画像との差分
を差分器1812より求めてこれを誤差符号化し符号結
果をマルチプレクサ1814より多重して出力する。こ
の出力の復号はデマルチプレクサ1911を経て一方は
デマルチプレクサ1912に送られ第1及び第2の従来
例と同じ処理を経る。他方は輝度プレーン誤差復号化器
1917を経て加算器1918へ送られる。加算器19
18では階層画像合成器1915より再合成された予測
画像と前述の誤差画像が加算され画像データが出力され
る。本実施例では、前景分離が成功し、前景の物体がア
フィン変換パラメータで記述できる動きを行なった場
合、第1および第2の実施例と同じく高い符号化効率を
得ることができる。加えて階層画像の合成結果の誤差符
号化を行なうことにより、前景分離の結果に誤りが含ま
れている場合やテンプレートの更新が符号化量の制限な
どにより、不良であった場合でも、視覚劣化の少ないな
い画像の伝送記録が行える。
In the two embodiments described so far, this is used as the output of the reconstructed image, but in this embodiment,
Further, the difference between the output of the predictive image memory 1811 and the original image is obtained by the differentiator 1812, this is subjected to error coding, and the coded result is multiplexed and outputted from the multiplexer 1814. Decoding of this output is sent to the demultiplexer 1912 via the demultiplexer 1911, and the same processing as the first and second conventional examples is performed. The other is sent to the adder 1918 via the luminance plane error decoder 1917. Adder 19
In 18, the predicted image re-synthesized by the hierarchical image synthesizer 1915 and the above-mentioned error image are added and the image data is output. In the present embodiment, when the foreground separation succeeds and the object in the foreground makes a motion that can be described by the affine transformation parameter, it is possible to obtain the same high coding efficiency as in the first and second embodiments. In addition, by performing error coding on the synthesis result of the hierarchical image, even if the result of the foreground separation contains an error or the template update is defective due to the limitation of the coding amount, the visual deterioration is caused. It is possible to perform transmission recording of images with few images.

【0127】次に本発明(請求項7、8)の第4の実施
例を、以下に図20、図21、図22および図1、図
5、図13、図14を用いて説明する。第2の実施例と
同じく本実施例でも階層画像は輝度と透過度が重畳され
た形式で保持されている(式27参照)。本実施例では
予め第2の実施例に用いた図13および図14記載の階
層画像符号化器と階層画像復号化器を用いて複数テンプ
レートの伝送記録を行なう。
Next, a fourth embodiment of the present invention (claims 7 and 8) will be described below with reference to FIGS. 20, 21, 22 and 1, 5, 13, 14. In this embodiment as well as in the second embodiment, the hierarchical image is held in a format in which the brightness and the transparency are superimposed (see Expression 27). In the present embodiment, the transmission and recording of a plurality of templates is performed using the hierarchical image encoder and the hierarchical image decoder described in FIGS. 13 and 14 used in the second embodiment in advance.

【0128】図22は多重テンプレートによる階層画像
符号化の概念図である。図22中テンプレートAおよび
テンプレートBと示した画像は第2の実施例における階
層画像符号化器と階層画像復号化器を直接接続すること
により得られている。テンプレートは数フレームまたは
数十フレームに一つ選ばれて伝送される。その結果、テ
ンプレートの符号化はテンプレート間の相関を利用した
「テンプレート間符号化」として実現されることにな
り、効率の良いテンプレート伝送が行なえる。
FIG. 22 is a conceptual diagram of hierarchical image coding using multiple templates. The images shown as template A and template B in FIG. 22 are obtained by directly connecting the hierarchical image encoder and the hierarchical image decoder in the second embodiment. One template is selected from several frames or several tens of frames and transmitted. As a result, the template encoding is realized as "inter-template encoding" utilizing the correlation between templates, and efficient template transmission can be performed.

【0129】図20は本発明(請求項7)の一実施例の
画像符号化装置の構成図で、2001はアフィン変換係
数演算部、2002は輝度・α分離部、2003はテン
プレート格納メモリ、2004はアフィン距離最短テン
プレート決定部、2005は予測符号符号化器、200
6はマルチプレクサである。
FIG. 20 is a block diagram of an image coding apparatus according to an embodiment of the present invention (claim 7). 2001 is an affine transform coefficient operation unit, 2002 is a luminance / α separation unit, 2003 is a template storage memory, and 2004 is a template storage memory. Is an affine distance shortest template determination unit, 2005 is a predictive code encoder, 200
6 is a multiplexer.

【0130】図21は本発明(請求項8)の一実施例の
画像復号化装置の構成図で、2101はデマルチプレク
サ、2102は予測符号符号化器、2103はテンプレ
ート読み出し回路、2104は格納メモリ、2105は
アフィン変換部、2106は輝度・α重畳部である。前
景、背景のテンプレート伝送後、図20に示した階層画
像符号化器は図1の階層画像符号化器101、102と
して、図21に示した階層画像復号化器は図1の階層画
像復号化器105、106として用いられる。
FIG. 21 is a block diagram of an image decoding apparatus according to an embodiment of the present invention (claim 8). 2101 is a demultiplexer, 2102 is a predictive code encoder, 2103 is a template reading circuit, 2104 is a storage memory. Reference numeral 2105 is an affine transformation unit, and 2106 is a luminance / α superimposing unit. After transmitting the templates of the foreground and the background, the hierarchical image encoder shown in FIG. 20 is the hierarchical image encoders 101 and 102 of FIG. 1, and the hierarchical image decoder shown in FIG. 21 is the hierarchical image decoder of FIG. It is used as a container 105, 106.

【0131】伝送済みのテンプレートは各々符号化側と
復号化側でテンプレートメモリ2003、2104に同
じ識別子を付して記憶される。アフィン変換係数演算部
2001は、図5で説明したアフィン変換係数演算部4
08の動作に加えて、得られたアフィン変換係数から式
15により各ブロックの偏位を計算し、各ブロックの偏
位を式14に代入し各ブロックの誤差和を求め近似誤差
としてアフィン距離最短テンプレート決定部2004へ
出力する。アフィン距離最短テンプレート決定部200
4は得られた近似誤差の中から最小のテンプレートを選
択し、その識別子とともに変形パラメータを出力する。
The transmitted template is stored in the template memories 2003 and 2104 with the same identifier on the encoding side and the decoding side, respectively. The affine transformation coefficient calculation unit 2001 is the affine transformation coefficient calculation unit 4 described with reference to FIG.
In addition to the operation of 08, the deviation of each block is calculated from Expression 15 using the obtained affine transformation coefficient, the deviation of each block is substituted into Expression 14, and the error sum of each block is calculated to obtain the shortest affine distance as an approximation error. It is output to the template determination unit 2004. Affine distance shortest template determination unit 200
4 selects the smallest template from the obtained approximation errors, and outputs the deformation parameter together with its identifier.

【0132】予測符号符号化器はアフィン変換パラメー
タを符号化する。マルチプレクサ2006では符号化さ
れたアフィン変換パラメータとテンプレートの識別子を
多重し階層画像符号化器の出力ビットストリームを生成
する。復号側では入力ビットストリームはデマルチプレ
クサ2101により分離され、予測符号復号化器210
2ではアフィン変換パラメータが復号される。テンプレ
ート読み出し回路2103は入力されたテンプレート識
別子に対応するテンプレートを読み出しアフィン変換部
2105へ出力する。アフィン変換部2105の処理は
図4におけるアフィン変換部407と同じである。また
輝度・α分離部2002、2106の動作は図13、図
14における輝度・α分離部1303、1407の動作
と同じである。
The predictive code encoder encodes the affine transformation parameters. The multiplexer 2006 multiplexes the encoded affine transformation parameter and the template identifier to generate an output bitstream of the hierarchical image encoder. On the decoding side, the input bit stream is separated by the demultiplexer 2101 and the predictive code decoder 210
At 2, the affine transformation parameters are decoded. The template reading circuit 2103 reads the template corresponding to the input template identifier and outputs it to the affine transformation unit 2105. The processing of the affine transformation unit 2105 is the same as that of the affine transformation unit 407 in FIG. The operations of the brightness / α separation units 2002 and 2106 are the same as the operations of the brightness / α separation units 1303 and 1407 in FIGS. 13 and 14.

【0133】以上の処理に従うと、図22に示すよう
に、アフィン変換で近似できるテンプレートを基に画像
を伝送することができることから、非常に少ない符号量
で画像を伝送することができる。特に、使用するテンプ
レートは時間の順序に依存せず選べることから高い効率
が期待できる。また従来例のように単一のテンプレート
から画像を合成するのではなく、複数のテンプレートを
選択的に使用することから、画像が不規則な変形をもつ
場合にも対応できる。なお、ここで用いた変換はアフィ
ン変換に限定せずとも、式22に示す平面物体の変形な
ど、一般の多項式による変形記述を利用することができ
る。またテンプレートの扱いは第2の実施例に準じた
が、これを第1の実施例で用いたテンプレートに変更し
ても良い。
According to the above processing, as shown in FIG. 22, since the image can be transmitted based on the template that can be approximated by the affine transformation, the image can be transmitted with a very small code amount. In particular, high efficiency can be expected because the template to be used can be selected without depending on the order of time. Further, instead of synthesizing an image from a single template as in the conventional example, a plurality of templates are selectively used, so that it is possible to deal with the case where the image has irregular deformation. Note that the transformation used here is not limited to the affine transformation, but general polynomial transformation description such as the transformation of the planar object shown in Expression 22 can be used. Although the template is handled according to the second embodiment, it may be changed to the template used in the first embodiment.

【0134】[0134]

【発明の効果】第1の発明の画像符号化装置および第2
の発明の画像復号化装置によれば、物体の輝度と透過度
から構成される参照画像(テンプレート)の変形をテン
プレート間の対応による予測と予測結果に対する差分と
して扱うことができる。
The image encoding device of the first invention and the second invention
According to the image decoding apparatus of the present invention, the deformation of the reference image (template) composed of the brightness and the transparency of the object can be treated as the prediction by the correspondence between the templates and the difference between the prediction results.

【0135】第3の発明の画像符号化装置および第4の
発明の画像復号化装置によれば、物体の輝度と透過度を
重畳して輝度画像として扱うことにより従来の高能率符
号化技術を適用することができ、効率良くテンプレート
の変形を扱うことができる。
According to the image coding apparatus of the third invention and the image decoding apparatus of the fourth invention, the conventional high-efficiency coding technique is realized by superposing the brightness and the transparency of the object and treating them as a brightness image. It can be applied, and template deformation can be handled efficiently.

【0136】第5の発明の画像符号化装置および第6の
発明の画像復号化装置によれば、階層画像の合成を最終
結果とはせずに予測画像とし、この予測画像と原画像と
の差分を伝送記録することにより前景・背景分離処理に
に誤りがあっても画像を大きな視覚劣化なく伝送記録す
ることができる。
According to the image coding apparatus of the fifth aspect of the invention and the image decoding apparatus of the sixth aspect of the invention, the synthesis of the hierarchical images is not the final result but the predicted image, and the predicted image and the original image are combined. By transmitting and recording the difference, even if there is an error in the foreground / background separation processing, the image can be transmitted and recorded without significant visual deterioration.

【0137】第7の発明の画像符号化装置および第8の
発明の画像復号化装置によれば、複数テンプレートを予
め伝送し、入力画像に対する最小歪みテンプレートを時
間順序に関係なく逐次選択し、選択されたテンプレート
の変形により画像系列を再現することから非常に高い効
率で画像を伝送することができる。
According to the image coding apparatus of the seventh invention and the image decoding apparatus of the eighth invention, a plurality of templates are transmitted in advance, and the minimum distortion template for the input image is sequentially selected and selected regardless of the time order. Since the image sequence is reproduced by the modification of the created template, the image can be transmitted with extremely high efficiency.

【0138】第9の発明の動きベクトル検出装置は、輝
度と透過度から構成される画像の対応問題を輝度と透過
度の情報が重畳された輝度画像の対応問題として扱うこ
とができる。これにより、輝度と透過度の両方を考慮し
た対応結果すなわち動きベクトルを得ることができる。
The motion vector detecting device of the ninth invention can treat the correspondence problem of the image composed of the luminance and the transparency as the correspondence problem of the luminance image in which the information of the luminance and the transparency is superimposed. As a result, it is possible to obtain the correspondence result, that is, the motion vector, in which both the brightness and the transparency are taken into consideration.

【0139】また、第10の発明の動きベクトル検出装
置は、画像間の対応を位置を変数とした多項式近似する
時、一度動きベクトルを求めてから2段階に多項式近似
するのではなく、部分領域対応の誤差関数から直接求め
ることができ、雑音に頑健な動きベクトル推定が行なえ
る。
The motion vector detecting apparatus of the tenth aspect of the invention does not perform the polynomial approximation in two steps after once obtaining the motion vector when performing the polynomial approximation in which the correspondence between the images is the position variable. It can be obtained directly from the corresponding error function, and motion vector estimation robust to noise can be performed.

【0140】物体投影像を前後関係で分離し個別に符号
化する階層符号化は、領域の異なる動きや隠蔽されてい
た領域が出現するなどにより発生する符号量を減らすこ
とができ、高い効率の符号化特性が期待される。近年、
クロマキーで生成した階層画像やコンピュータグラフィ
ックスが画像の合成に多用されることから階層符号化の
産業的価値は高い。以上に述べた発明によれば、階層画
像符号化に必要な、不規則な変形をもつ輝度と透過度の
画像の効率的な符号化とこれに関連したる動きベクトル
の頑健な推定を行なうことができ、その効果は大きい。
Hierarchical coding, in which the projected image of the object is separated according to the context and individually coded, can reduce the amount of code generated due to the movement of different regions, the appearance of concealed regions, etc., and high efficiency. Coding properties are expected. recent years,
Hierarchical coding has a high industrial value because hierarchical images and computer graphics generated by chromakey are frequently used for image synthesis. According to the invention described above, efficient coding of luminance and transparency images having irregular deformations and robust estimation of motion vectors related thereto necessary for hierarchical image coding are performed. Can be done and its effect is great.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の一実施例における階層符号化システム
の構成図
FIG. 1 is a configuration diagram of a hierarchical coding system according to an embodiment of the present invention.

【図2】第1の実施例における階層画像符号化器の構成
FIG. 2 is a configuration diagram of a hierarchical image encoder according to the first embodiment.

【図3】第1の実施例における階層画像復号化器の構成
FIG. 3 is a configuration diagram of a hierarchical image decoder in the first embodiment.

【図4】本実施例の変形分析器の構成図FIG. 4 is a configuration diagram of a deformation analyzer according to the present embodiment.

【図5】本実施例のアフィン変換係数演算部の構成図FIG. 5 is a configuration diagram of an affine transform coefficient calculation unit according to the present embodiment.

【図6】本実施例の変形合成器の構成図FIG. 6 is a configuration diagram of a modified combiner of the present embodiment.

【図7】本実施例の輝度プレーン誤差符号化器の構成図FIG. 7 is a configuration diagram of a luminance plane error encoder according to the present embodiment.

【図8】本実施例のαプレーン誤差符号化器の構成図FIG. 8 is a configuration diagram of an α-plane error encoder according to the present embodiment.

【図9】本実施例の輝度プレーン誤差復号化器の構成図FIG. 9 is a configuration diagram of a luminance plane error decoder according to the present embodiment.

【図10】本実施例のαプレーン誤差復号化器の構成図FIG. 10 is a configuration diagram of an α-plane error decoder according to the present embodiment.

【図11】本実施例の輝度・α重畳部の動作を示す図FIG. 11 is a diagram showing the operation of the brightness / α superimposing unit of the present embodiment.

【図12】本実施例のブロック相関図FIG. 12 is a block correlation diagram of this embodiment.

【図13】本発明の第2の実施例における階層画像符号
化器の構成図
FIG. 13 is a configuration diagram of a hierarchical image encoder according to the second embodiment of the present invention.

【図14】第2の実施例における階層画像復号化器の構
成図
FIG. 14 is a configuration diagram of a hierarchical image decoder in the second embodiment.

【図15】本実施例の変形合成器の構成図FIG. 15 is a block diagram of a modified synthesizer of this embodiment.

【図16】本実施例の輝度・α重畳誤差符号化器の構成
FIG. 16 is a configuration diagram of a luminance / α superposition error encoder according to the present embodiment.

【図17】本実施例の輝度・α重畳誤差復号化器の構成
FIG. 17 is a block diagram of a luminance / α superposition error decoder according to the present embodiment.

【図18】第3の実施例における画像符号化装置の構成
FIG. 18 is a configuration diagram of an image encoding device according to a third embodiment.

【図19】第3の実施例における画像復号化装置の構成
FIG. 19 is a configuration diagram of an image decoding apparatus according to a third embodiment.

【図20】第4の実施例における階層画像符号化器の構
成図
FIG. 20 is a configuration diagram of a hierarchical image encoder according to the fourth embodiment.

【図21】第4の実施例における階層画像復号化器の構
成図
FIG. 21 is a configuration diagram of a hierarchical image decoder in the fourth embodiment.

【図22】本実施例の多重テンプレートによる階層画像
符号化の概念図
FIG. 22 is a conceptual diagram of hierarchical image coding by the multiple template according to the present embodiment.

【図23】従来の階層画像符号化の概念図FIG. 23 is a conceptual diagram of conventional hierarchical image coding.

【符号の説明】[Explanation of symbols]

101、102 階層画像符号化器 103 マルチプレクサ 104 デマルチプレクサ 105、106 階層画像復号化器 107 階層画像合成器 201 変形分析器 202 変形合成器 203、204 差分器 205 予測符号符号化器 206 輝度プレーン誤差符号化器 207 αプレーン誤差符号化器 208 輝度プレーン誤差復号化器 209 αプレーン誤差復号化器 210 マルチプレクサ 211、212 加算器 213、214 フレーム遅延器 301 デマルチプレクサ 302 輝度プレーン誤差復号化器 303 αプレーン誤差復号化器 304 予測符号復号化器 305 変形合成器 306、307 加算器 308、309 フレーム遅延器 401、402 輝度画像メモリ 403、404 α画像メモリ 405、406 輝度・α重畳部 407 アフィン変換部 408 アフィン変換係数演算部 409 アフィン変換画像メモリ 410 ブロック相関演算部 411 マルチプレクサ 501 ブロック相関演算部 502 SAD局面近似部 503 誤差関数パラメータ格納メモリ 504 アフィン変換パラメータ演算部 601 輝度画像メモリ 602 α画像メモリ 603 デマルチプレクサ 604、605 アフィン変換部 606、607 アフィン変換画像メモリ 608、609 画像ブロック変形部 701 DCT演算部 702 量子化部 703 可変長符号化部 801 ハール変換演算部 802 量子化部 803 可変長符号化部 901 可変長復号化部 902 逆量子化部 903 逆DCT演算部 1001 可変長復号化部 1002 逆量子化部 1003 逆ハール変換演算部 1301 変形分析器 1302 変形合成器 1303 輝度・α分離部 1304 輝度・α重畳部 1305 フレーム遅延器 1306 差分器 1307 加算器 1308 輝度・α重畳誤差符号化器 1309 予測符号符号化器 1310 輝度・α重畳誤差符号化器 1311 マルチプレクサ 1401 デマルチプレクサ 1402 輝度・α重畳誤差復号化器 1403 予測符号復号化器 1404 加算器 1405 変形合成器 1406 フレーム遅延器 1407 輝度α分離部 1501 輝度・αメモリ 1502 デマルチプレクサ 1503 アフィン変換部 1504 アフィン変換画像メモリ 1505 画像ブロック変形部 1601 領域境界判定部 1602、1609 スイッチ 1603 DCT演算部 1604 量子化部 1605 可変長符号化部 1606 ハール変換演算部 1607 量子化部 1608 可変長符号化部 1610 マルチプレクサ 1701 デマルチプレクサ 1702 切替え制御部 1703、1710 スイッチ 1704 可変長復号化部 1705 逆量子化部 1706 逆DCT演算部 1707 可変長復号化部 1708 逆量子化部 1709 逆ハール変換演算部 1801 前景メモリ 1802 背景メモリ 1803 前景分離器 1804、1805 階層画像符号化器 1806 マルチプレクサ 1807 デマルチプレクサ 1808、1809 階層画像復号化器 1810 階層画像合成器 1811 予測画像メモリ 1812 差分器 1813 輝度プレーン誤差符号化器 1814 マルチプレクサ 1911、1912 デマルチプレクサ 1913、1914 階層画像復号化器 1915 階層画像合成器 1916 予測画像メモリ 1917 輝度プレーン誤差復号化器 1918 加算器 2001 アフィン変換係数演算部 2002 輝度・α分離部 2003 テンプレート格納メモリ 2004 アフィン距離最短テンプレート決定部 2005 予測符号符号化器 2006 マルチプレクサ 2101 デマルチプレクサ 2102 予測符号符号化器 2103 テンプレート読み出し回路 2104 格納メモリ 2105 アフィン変換部 2106 輝度・α重畳部 101, 102 Hierarchical image encoder 103 Multiplexer 104 Demultiplexer 105, 106 Hierarchical image decoder 107 Hierarchical image synthesizer 201 Deformation analyzer 202 Deformation synthesizer 203, 204 Difference device 205 Predictive code encoder 206 Luminance plane error code 207 α plane error coder 208 luminance plane error decoder 209 α plane error decoder 210 multiplexers 211, 212 adders 213, 214 frame delay unit 301 demultiplexer 302 luminance plane error decoder 303 α plane error Decoder 304 Predictive code decoder 305 Deformation synthesizer 306, 307 Adder 308, 309 Frame delay device 401, 402 Luminance image memory 403, 404 α image memory 405, 406 Luminance / α superimposing unit 407 Fin transform unit 408 Affine transform coefficient computing unit 409 Affine transform image memory 410 Block correlation computing unit 411 Multiplexer 501 Block correlation computing unit 502 SAD phase approximation unit 503 Error function parameter storage memory 504 Affine transformation parameter computing unit 601 Luminance image memory 602 α image Memory 603 Demultiplexer 604, 605 Affine transformation unit 606, 607 Affine transformation image memory 608, 609 Image block transformation unit 701 DCT calculation unit 702 Quantization unit 703 Variable length coding unit 801 Haar transformation calculation unit 802 Quantization unit 803 Variable length Encoding unit 901 Variable length decoding unit 902 Inverse quantization unit 903 Inverse DCT operation unit 1001 Variable length decoding unit 1002 Inverse quantization unit 1003 Inverse Haar transform operation unit 1301 Modification analyzer 1302 Modified combiner 1303 Luminance / α separation unit 1304 Luminance / α superposition unit 1305 Frame delay unit 1306 Difference unit 1307 Adder 1308 Luminance / α superposition error encoder 1309 Prediction code encoder 1310 Luminance / α superposition error encoder 1311 multiplexer 1401 demultiplexer 1402 luminance / α superimposition error decoder 1403 prediction code decoder 1404 adder 1405 modified combiner 1406 frame delayer 1407 luminance α separation unit 1501 luminance / α memory 1502 demultiplexer 1503 affine transformation unit 1504 affine Transformed image memory 1505 Image block transformation unit 1601 Region boundary determination unit 1602, 1609 Switch 1603 DCT calculation unit 1604 Quantization unit 1605 Variable length coding unit 1606 Haar transform calculation unit 1 07 Quantizer 1608 Variable length encoder 1610 Multiplexer 1701 Demultiplexer 1702 Switching controller 1703, 1710 Switch 1704 Variable length decoder 1705 Inverse quantizer 1706 Inverse DCT calculator 1707 Variable length decoder 1708 Inverse quantizer 1709 Inverse Haar transform calculation unit 1801 Foreground memory 1802 Background memory 1803 Foreground separator 1804, 1805 Hierarchical image encoder 1806 Multiplexer 1807 Demultiplexer 1808, 1809 Hierarchical image decoder 1810 Hierarchical image combiner 1811 Predictive image memory 1812 Difference device 1813 Luminance plane error encoder 1814 Multiplexer 1911, 1912 Demultiplexer 1913, 1914 Hierarchical image decoder 1915 Hierarchical image synthesizer 191 6 Prediction image memory 1917 Luminance plane error decoder 1918 Adder 2001 Affine transform coefficient calculation unit 2002 Luminance / α separation unit 2003 Template storage memory 2004 Affine distance shortest template determination unit 2005 Prediction code encoder 2006 Multiplexer 2101 Demultiplexer 2102 Prediction Code encoder 2103 Template reading circuit 2104 Storage memory 2105 Affine transformation unit 2106 Luminance / α superposition unit

Claims (10)

【特許請求の範囲】[Claims] 【請求項1】物体の輝度と透過度から構成される画像の
系列を入力として、輝度と透過度から構成される参照画
像から部分領域間の対応により符号化対象画像の輝度と
透過度の画像を予測する予測手段と、前記予測手段にお
ける部分領域間の対応を予測符号として符号化する予測
符号化手段と、前記予測画像と前記符号化対象画像との
輝度と透過度の差分を誤差画像として求める誤差演算手
段と、前記誤差画像を誤差画像符号として符号化する誤
差符号化手段とを有し、画像系列を前記参照画像に対す
る誤差画像符号、予測符号として伝送記録することを特
徴とする画像符号化装置。
1. An image of brightness and transparency of an image to be coded by inputting a sequence of images composed of brightness and transparency of an object, and from a reference image composed of brightness and transparency to a correspondence between partial regions. Predicting means, a predictive coding means for coding the correspondence between the partial areas in the predicting means as a predictive code, and a difference in brightness and transparency between the predicted image and the image to be coded as an error image. An image code having an error calculating means for obtaining and an error coding means for coding the error image as an error image code, and transmitting and recording an image sequence as an error image code and a prediction code for the reference image. Device.
【請求項2】請求項1記載の画像符号化装置と同じ参照
画像を保持し、前記画像符号化装置の出力を復号するた
めの装置であって、予測符号より部分領域間の対応を復
号化する予測符号復号化手段と、前記部分領域間の対応
より、参照画像から予測画像を生成する予測画像生成手
段と、誤差画像符号より誤差画像を復号化する誤差画像
復号化手段と、前記予測画像と前記誤差画像を加算して
輝度と透過度からなる画像を得る加算手段とを有し、前
記予測画像生成手段あるいは前記加算手段の出力として
輝度と透過度から構成される画像を復号化することを特
徴とする画像復号化装置。
2. A device for holding the same reference image as the image coding device according to claim 1, and decoding the output of the image coding device, wherein the correspondence between partial regions is decoded by a predictive code. Predictive code decoding means, a predicted image generation means for generating a predicted image from a reference image based on the correspondence between the partial areas, an error image decoding means for decoding an error image from an error image code, and the predicted image And an addition means for adding the error image to obtain an image composed of brightness and transparency, and decoding an image composed of brightness and transparency as an output of the prediction image generation means or the addition means. An image decoding device characterized by:
【請求項3】物体の輝度と透過度から構成される画像を
入力として、領域を透明領域と不透明領域の2つに分類
し、不透明領域については物体の輝度を、透明領域につ
いては輝度の値域外の所定の値をとるよう輝度と透過度
の情報が重畳された輝度画像を生成する重畳手段を有
し、前記輝度と透過度の情報が重畳された輝度画像を符
号化することを特徴とする画像符号化装置。
3. An image which is composed of the brightness and the transparency of an object is input and the area is classified into two areas, a transparent area and an opaque area. The brightness of the object is determined for the opaque area and the brightness value is determined for the transparent area. A luminance image in which luminance and transparency information is superimposed so as to take a predetermined value outside the range, and a luminance image in which the luminance and transparency information is superimposed is encoded. Image encoding device.
【請求項4】請求項3記載の画像符号化装置の出力を復
号するための装置であって、輝度値が値域外の値である
場合は透明領域、値域内の場合は輝度値として画像を透
過度画像と輝度画像に分離する分離手段を有し、輝度と
透過度の画像を復号化することを特徴とする画像復号化
装置。
4. An apparatus for decoding the output of the image coding apparatus according to claim 3, wherein the image is used as a transparent area when the brightness value is out of the range and as a brightness value when the brightness value is within the range. An image decoding apparatus having a separating unit for separating a transparency image and a brightness image, and decoding the brightness and transparency images.
【請求項5】原画像が輝度に加えて視線軸上の前後関係
と領域の透過度より階層的に表現されるとき、この階層
化された複数の画像を入力として、各階層画像毎に輝度
と透過度とを階層画像符号として符号化する階層画像符
号化手段と、前記階層画像符号化手段の結果から復号さ
れた前記階層画像を求める階層画像画像復号化手段と、
前記復号された複数の階層画像をその前後関係、輝度お
よび透過度により合成する合成手段と、前記原画像と前
記合成画像との誤差画像を求め、これを符号化する誤差
画像符号化手段を有し、前記原画像を複数の階層画像符
号と原画像との誤差符号によって伝送記録することを特
徴とする画像符号化装置。
5. When the original image is hierarchically expressed by the front-and-rear relationship on the line-of-sight axis and the transparency of the region in addition to the luminance, the plurality of hierarchized images are input and the luminance is calculated for each hierarchical image. A hierarchical image coding means for coding the transparency and the transparency as a hierarchical image code, and a hierarchical image image decoding means for obtaining the hierarchical image decoded from the result of the hierarchical image coding means,
There are provided a synthesizing unit for synthesizing the plurality of decoded hierarchical images according to their context, luminance and transparency, and an error image coding unit for obtaining an error image between the original image and the synthesized image and encoding the error image. An image coding apparatus is characterized in that the original image is transmitted and recorded by an error code between a plurality of hierarchical image codes and the original image.
【請求項6】請求項5記載の画像符号化装置の出力を復
号するための装置であって、複数の階層画像符号から輝
度、透過度、視線軸上の前後関係からなる階層画像を復
号化する階層画像復号化手段と、前記階層画像により合
成画像を生成する合成手段と、誤差符号より誤差画像を
復号化する誤差画像復号化手段を有し、前記合成画像に
誤差画像を加えることにより画像を復号化することを特
徴とする画像復号化装置。
6. A device for decoding the output of the image coding device according to claim 5, wherein a hierarchical image consisting of luminance, transparency, and a front-back relationship on a line-of-sight axis is decoded from a plurality of hierarchical image codes. An image by adding an error image to the synthetic image, and a hierarchical image decoding unit for generating a synthetic image from the hierarchical image, and an error image decoding unit for decoding an error image from an error code. An image decoding apparatus, which is characterized by decoding.
【請求項7】複数の参照画像を予め伝送記録する参照画
像符号化手段と、入力画像と前記複数の参照画像との間
で輝度が対応する位置の偏位すなわち変形を画面上の位
置を変数とする多項式関数として近似し、近似誤差を求
める画像間対応近似手段と、近似誤差の小さな参照画像
を前記複数の参照画像の中から求め、選ばれた参照画像
の識別子と多項式関数の係数を出力する最小歪み参照画
像選択手段とを有し、前記参照画像符号化手段により複
数の参照画像を符号化するとともに、入力画像系列を少
なくとも前記選ばれた参照画像に対する識別子と前記多
項式関数の係数として伝送記録することを特徴とする画
像符号化装置。
7. A reference image coding means for transmitting and recording a plurality of reference images in advance, and a deviation or deformation of a position where luminance is corresponding between the input image and the plurality of reference images is variable as a position on the screen. And a reference image with a small approximation error is obtained from the plurality of reference images, and the identifier of the selected reference image and the coefficient of the polynomial function are output. Minimum distortion reference image selecting means for encoding a plurality of reference images by the reference image encoding means, and transmitting an input image sequence as at least an identifier for the selected reference image and a coefficient of the polynomial function. An image encoding device for recording.
【請求項8】請求項7記載の画像符号化装置の出力を復
号するための装置であって、複数の参照画像を予め再構
成しておく参照画像復号化手段と、前記複数の参照画像
から入力に含まれる参照画像に対する識別子に対応する
参照画像を選択する参照画像選択手段と、画像の変形を
画面上の位置を変数とする多項式関数を入力に含まれる
多項式関数の係数を基に決定し、前記多項式関数により
前記選択された参照画像変形する参照画像変形手段とを
有し、前記参照画像変形手段により変形された参照画像
を用いて画像を復号化することを特徴とする画像復号化
装置。
8. An apparatus for decoding the output of the image encoding apparatus according to claim 7, comprising: reference image decoding means for reconstructing a plurality of reference images in advance; and a plurality of the reference images. Reference image selection means for selecting a reference image corresponding to the identifier for the reference image included in the input, and a polynomial function whose image position is a variable for image deformation is determined based on the coefficient of the polynomial function included in the input. An image decoding apparatus comprising: a reference image deforming unit that deforms the selected reference image by the polynomial function, and decodes an image using the reference image deformed by the reference image deforming unit. .
【請求項9】物体の輝度と透過度から構成される複数の
画像を入力として、透過度を所定の値の加算乗算と必要
に応じてしきい値処理を行ない値域を変換し、変換した
値を輝度に加算して輝度と透過度の情報が重畳された輝
度画像を生成する重畳手段と、輝度の相関により2つの
画像の部分領域の対応を得る画像分析手段とを有し、前
記重畳手段により、輝度と透過度から構成される画像
を、輝度だけで構成される画像に変換し、変換された複
数の画像間で前記画像分析手段を用いて部分領域の対応
を得ることを特徴とする動きベクトル検出装置。
9. A plurality of images composed of the brightness and the transparency of an object are input, and the transparency is subjected to addition and multiplication of predetermined values, threshold processing is performed as necessary, and a range is converted, and the converted value is obtained. Is added to the luminance to generate a luminance image in which the information on the luminance and the transparency is superimposed, and image analysis means for obtaining the correspondence between the partial areas of the two images by the correlation of the luminance, and the superimposing means. According to the above, an image composed of brightness and transparency is converted into an image composed of brightness only, and correspondence between partial areas is obtained between the converted plurality of images by using the image analysis means. Motion vector detection device.
【請求項10】画面上の任意の位置の動きベクトルをそ
の位置を変数とする多項式関数として表現する装置であ
って、画像を分割して得られる複数の部分領域につい
て、異なる2つの画像の部分領域の対応を誤差として演
算し、最小誤差となる前記部分領域間の偏位とその近傍
の誤差値を求める誤差演算手段と、前記最小誤差となる
偏位とその近傍の誤差値から偏位を変数とする2次の誤
差関数を求める誤差関数演算手段と、前記2次誤差関数
の総和あるいは部分和を、多項式関数の係数を変数とし
て表現し、この総和あるいは部分和の最小化を係数につ
いて行なう最適化手段を有し、異なる画像間の動きベク
トルを多項式関数の係数として出力することを特徴とす
る動きベクトル検出装置。
10. A device for expressing a motion vector at an arbitrary position on a screen as a polynomial function having the position as a variable, wherein a plurality of partial regions obtained by dividing an image are different two image parts. An error calculating means that calculates the correspondence between regions as an error and obtains the deviation between the partial regions having the minimum error and the error value in the vicinity thereof, and the deviation from the deviation having the minimum error and the error value in the vicinity thereof. An error function calculating means for obtaining a quadratic error function as a variable and the sum or partial sum of the quadratic error function are expressed by using the coefficient of the polynomial function as a variable, and the sum or the partial sum is minimized for the coefficient. A motion vector detecting device having an optimizing means and outputting a motion vector between different images as a coefficient of a polynomial function.
JP25340094A 1994-10-19 1994-10-19 Image encoding device, image decoding device Expired - Fee Related JP3120664B2 (en)

Priority Applications (6)

Application Number Priority Date Filing Date Title
JP25340094A JP3120664B2 (en) 1994-10-19 1994-10-19 Image encoding device, image decoding device
EP95116511A EP0708563B1 (en) 1994-10-19 1995-10-19 Image decoding device
KR1019950036818A KR100365555B1 (en) 1994-10-19 1995-10-19 Image encoding / decoding device
US08/545,539 US5768438A (en) 1994-10-19 1995-10-19 Image encoding/decoding device
DE69533870T DE69533870T2 (en) 1994-10-19 1995-10-19 Device for image decoding
US09/596,366 USRE37668E1 (en) 1994-10-19 2000-06-16 Image encoding/decoding device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP25340094A JP3120664B2 (en) 1994-10-19 1994-10-19 Image encoding device, image decoding device

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2000117087A Division JP2000324501A (en) 2000-01-01 2000-04-18 Image encoding device, image decoded, and moving vector detecting device

Publications (2)

Publication Number Publication Date
JPH08116542A true JPH08116542A (en) 1996-05-07
JP3120664B2 JP3120664B2 (en) 2000-12-25

Family

ID=17250857

Family Applications (1)

Application Number Title Priority Date Filing Date
JP25340094A Expired - Fee Related JP3120664B2 (en) 1994-10-19 1994-10-19 Image encoding device, image decoding device

Country Status (1)

Country Link
JP (1) JP3120664B2 (en)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1997029595A1 (en) * 1996-02-07 1997-08-14 Sharp Kabushiki Kaisha Moving image encoding and decoding device
WO1997044956A1 (en) * 1996-05-17 1997-11-27 Matsushita Electric Industrial Co., Ltd. Picture encoder, picture decoder, picture encoding method, picture decoding method, picture encoding program recording medium, and picture decoding program recording medium
WO1998008343A1 (en) * 1996-08-21 1998-02-26 Sharp Kabushiki Kaisha Moving picture encoder and moving picture decoder
WO1998019462A1 (en) * 1996-10-31 1998-05-07 Kabushiki Kaisha Toshiba Image encoder and image decoder
US6487320B2 (en) 1997-01-24 2002-11-26 Matsushita Electric Industrial Co., Ltd. Methods, apparatuses and program recording media for image coding and image decoding
EP1394744A2 (en) * 2002-08-15 2004-03-03 Sony Corporation Image processing device, computer program product and image processing method
KR100488422B1 (en) * 1996-09-24 2005-09-02 주식회사 팬택앤큐리텔 Grayscale-shaped information encoding / decoding device and method
CN100366090C (en) * 1999-08-09 2008-01-30 索尼公司 Transmitting device and transmitting method, receiving device and receiving method, transmitting/receiving device and transmitting/receiving method, recorded medium and signal
JP2013048465A (en) * 2006-06-27 2013-03-07 Marvell World Trade Ltd Systems and methods for motion compensated picture rate converter

Cited By (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6148030A (en) * 1996-02-07 2000-11-14 Sharp Kabushiki Kaisha Motion picture coding and decoding apparatus
US6678326B2 (en) 1996-02-07 2004-01-13 Sharp Kabushiki Kaisha Motion picture coding and decoding apparatus
WO1997029595A1 (en) * 1996-02-07 1997-08-14 Sharp Kabushiki Kaisha Moving image encoding and decoding device
US6466622B2 (en) 1996-02-07 2002-10-15 Sharp Kabushiki Kaisha Motion picture coding and decoding apparatus
US6324215B1 (en) 1996-02-07 2001-11-27 Sharp :Kabushiki Kaisha Motion picture coding and decoding apparatus
US6560372B1 (en) 1996-05-17 2003-05-06 Matsushita Electric Industrial Co., Ltd. Decoding apparatus based on pixel value motion vectors and shape signal motion vectors
US6661928B2 (en) 1996-05-17 2003-12-09 Matsushita Electric Industrial Co., Ltd. Image encoding apparatus, image decoding apparatus, image encoding method, image decoding method, image encoding program recording medium and image decoding program recording medium
US6188796B1 (en) 1996-05-17 2001-02-13 Matsushita Electric Industrial Co., Ltd. Picture encoder, picture decoder, picture encoding method, picture decoding method, picture encoding program recording medium, and picture decoding program recording medium
WO1997044956A1 (en) * 1996-05-17 1997-11-27 Matsushita Electric Industrial Co., Ltd. Picture encoder, picture decoder, picture encoding method, picture decoding method, picture encoding program recording medium, and picture decoding program recording medium
US6597814B2 (en) 1996-05-17 2003-07-22 Matsushita Electric Industrial Co., Ltd. Image coding for transmitting information of shape, pixel value, and coding modes
US6445826B1 (en) 1996-05-17 2002-09-03 Matsushita Electric Industrial Co., Ltd. Decoping apparatus for shape and pixel value signal
US6516095B1 (en) 1996-05-17 2003-02-04 Matsushita Electric Industrial Co., Ltd. Decoding apparatus for shape signal
WO1998008343A1 (en) * 1996-08-21 1998-02-26 Sharp Kabushiki Kaisha Moving picture encoder and moving picture decoder
US6693960B2 (en) 1996-08-21 2004-02-17 Sharp Kabushiki Kaisha Moving picture encoder and moving picture decoder
KR100488422B1 (en) * 1996-09-24 2005-09-02 주식회사 팬택앤큐리텔 Grayscale-shaped information encoding / decoding device and method
US7308031B2 (en) 1996-10-31 2007-12-11 Kabushiki Kaisha Toshiba Video encoding apparatus and video decoding apparatus
WO1998019462A1 (en) * 1996-10-31 1998-05-07 Kabushiki Kaisha Toshiba Image encoder and image decoder
US6754269B1 (en) 1996-10-31 2004-06-22 Kabushiki Kaisha Toshiba Video encoding apparatus and video decoding apparatus
US7215709B2 (en) 1996-10-31 2007-05-08 Kabushiki Kaisha Toshiba Video encoding apparatus and video decoding apparatus
AU713780B2 (en) * 1996-10-31 1999-12-09 Kabushiki Kaisha Toshiba Video encoding apparatus and video decoding apparatus
US6122318A (en) * 1996-10-31 2000-09-19 Kabushiki Kaisha Toshiba Video encoding apparatus and video decoding apparatus
US6292514B1 (en) 1996-10-31 2001-09-18 Kabushiki Kaisha Toshiba Video encoding apparatus and video decoding apparatus
US6539123B2 (en) 1997-01-24 2003-03-25 Matsushita Electric Industrial Co., Ltd. Methods, apparatuses and program recording media for image coding and image decoding
US6567560B2 (en) 1997-01-24 2003-05-20 Matsushita Electric Industrial Co., Ltd. Methods, apparatuses and program recording media for image coding and image decoding
US6487320B2 (en) 1997-01-24 2002-11-26 Matsushita Electric Industrial Co., Ltd. Methods, apparatuses and program recording media for image coding and image decoding
CN100366090C (en) * 1999-08-09 2008-01-30 索尼公司 Transmitting device and transmitting method, receiving device and receiving method, transmitting/receiving device and transmitting/receiving method, recorded medium and signal
EP1394744A2 (en) * 2002-08-15 2004-03-03 Sony Corporation Image processing device, computer program product and image processing method
EP1394744A3 (en) * 2002-08-15 2007-07-18 Sony Corporation Method and apparatus for processing image data and semiconductor storage device
US7522748B2 (en) 2002-08-15 2009-04-21 Sony Corporation Method and apparatus for processing image data and semiconductor storage device
JP2013048465A (en) * 2006-06-27 2013-03-07 Marvell World Trade Ltd Systems and methods for motion compensated picture rate converter

Also Published As

Publication number Publication date
JP3120664B2 (en) 2000-12-25

Similar Documents

Publication Publication Date Title
KR100365555B1 (en) Image encoding / decoding device
JP4326743B2 (en) Transcoding method and transcoder for transcoding predictive-encoded object-based image signal to predictive-encoded block-based image signal
US7643690B2 (en) Image decoding and encoding apparatus, method and computer readable storage medium
US6879724B2 (en) Video coding and video decoding apparatus
AU713780B2 (en) Video encoding apparatus and video decoding apparatus
JP4966669B2 (en) Data compression using matching tracking
US6330364B1 (en) Video coding and video decoding apparatus
WO2000001155A1 (en) Method and apparatus for scalable shape coding
JP3120664B2 (en) Image encoding device, image decoding device
US6259738B1 (en) Video encoding apparatus and video decoding apparatus
JPH09326024A (en) Picture coding and decoding method and its device
JP2000324501A (en) Image encoding device, image decoded, and moving vector detecting device
Alatan et al. Estimation of depth fields suitable for video compression based on 3-D structure and motion of objects
US6754268B1 (en) Video coding and video decoding apparatus
JP3334384B2 (en) Picture prediction coding method
JP3944564B2 (en) Video encoding device
JPH10150665A (en) Method for generating predictive image, and method and device for image encoding
Cho et al. Object-based very low bit-rate coding using motion parameter estimation based on multiple frame prediction
JPH0937240A (en) Moving image coder and moving image decoder
JPH0965341A (en) Moving image coding, decoding method and device

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081020

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091020

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091020

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101020

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111020

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121020

Year of fee payment: 12

LAPS Cancellation because of no payment of annual fees