JP2001128173A - Object encoding device - Google Patents

Object encoding device

Info

Publication number
JP2001128173A
JP2001128173A JP30655399A JP30655399A JP2001128173A JP 2001128173 A JP2001128173 A JP 2001128173A JP 30655399 A JP30655399 A JP 30655399A JP 30655399 A JP30655399 A JP 30655399A JP 2001128173 A JP2001128173 A JP 2001128173A
Authority
JP
Japan
Prior art keywords
block
object image
encoding
image
background
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP30655399A
Other languages
Japanese (ja)
Inventor
Hiroya Nakamura
博哉 中村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Victor Company of Japan Ltd
Original Assignee
Victor Company of Japan Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Victor Company of Japan Ltd filed Critical Victor Company of Japan Ltd
Priority to JP30655399A priority Critical patent/JP2001128173A/en
Publication of JP2001128173A publication Critical patent/JP2001128173A/en
Pending legal-status Critical Current

Links

Abstract

PROBLEM TO BE SOLVED: To provide an object encoding device which can reduce the quantity of codes at the spot (block) of a background object which is concealed by an object having an arbitrary shape at when encoding the background object. SOLUTION: A VOP inside/outside discriminating means 30 discriminates the block of the background object corresponding to the position of the block (namely, block B) which is discriminated as a block in the VOP of an object picture having an arbitrary shape as the block which is completely concealed by the object picture having the arbitrary shape. Then the device does not encode the DCT factor of the picture element corresponding to the block of the background object picture which is discriminated to be completely concealed by the object picture having the arbitrary shape.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、オブジェクト符号
化方式を用いたオブジェクト符号化装置に関するもので
ある。そして、本発明は特に、背景オブジェクトを符号
化する際、任意形状オブジェクトに隠蔽される背景オブ
ジェクトの個所(ブロック)の符号量を削減できるオブ
ジェクト符号化装置を提供することを目的とする。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an object encoding device using an object encoding method. It is another object of the present invention to provide an object encoding apparatus that can reduce the amount of code at the location (block) of a background object hidden by an arbitrary-shaped object when encoding a background object.

【0002】[0002]

【従来の技術】画像符号化において、異なる動画像シー
ケンス(オブジェクト画像)を重畳するオブジェクト符
号化方式があり、MPEG-4などでもこの技術が用いられて
いる。オブジェクト符号化方式は背景となる矩形オブジ
ェクト画像や前景となる任意形状オブジェクト画像(例
えばクロマキー技術によって切り出された人物画像や物
体画像など)などを重畳して新たなシーケンスを作成す
る手法である。各オブジェクトの組み合わせを代えるこ
とで様々なシーケンスを作成することができるという特
徴がある。
2. Description of the Related Art In image coding, there is an object coding system in which different moving image sequences (object images) are superimposed, and this technology is also used in MPEG-4 and the like. The object coding method is a method of creating a new sequence by superimposing a rectangular object image serving as a background or an arbitrary-shaped object image serving as a foreground (for example, a person image or an object image cut out by a chroma key technique). There is a feature that various sequences can be created by changing the combination of each object.

【0003】図5に従来手法によるオブジェクト符号化
装置のブロック図を示す。図5の画素値信号符号化部52
は各オブジェクト画像(背景となる矩形オブジェクト画
像と物体画像となる任意形状オブジェクト画像)の輝度
や色差を表す画素値信号を符号化する部分である。ま
た、形状信号符号化部53は任意形状オブジェクト画像
(物体画像)の形状を表す形状信号を符号化する部分で
ある。形状信号は、各画素について、物体内部に含まれ
るか物体外部であるかを示す識別データである。物体内
部/外部の識別は1ビットで表現できるため、形状信号
は輝度信号の各画素に1対1に対応する2値信号として規
定される。さらに、透過度信号符号化部54は任意形状オ
ブジェクト画像の透過度を表す透過度信号を符号化する
部分である。透過度信号はアルファデータとも呼ばれて
いる。透過度信号は0が透明、255が不透明を意味する0
から255の8ビットで表現し、輝度信号の各画素と1対1
に対応する値を有している。記録・伝送多重化部55は各
符号化部で符号化されたデータをストリームとする多重
化を行う。これらがオブジェクト画像の符号化装置を構
成する。
FIG. 5 shows a block diagram of a conventional object coding apparatus. The pixel value signal encoding unit 52 of FIG.
Is a portion for encoding a pixel value signal representing the luminance and color difference of each object image (a rectangular object image serving as a background and an arbitrary-shaped object image serving as an object image). The shape signal encoding unit 53 encodes a shape signal representing the shape of the arbitrarily-shaped object image (object image). The shape signal is identification data indicating whether each pixel is included inside the object or outside the object. Since the discrimination between the inside and the outside of the object can be expressed by one bit, the shape signal is defined as a binary signal corresponding to each pixel of the luminance signal on a one-to-one basis. Further, the transparency signal encoding unit 54 encodes a transparency signal representing the transparency of the arbitrarily shaped object image. The transparency signal is also called alpha data. 0 means transparent, 255 means opaque 0
From 255 to 8 bits, one-to-one with each pixel of the luminance signal
Has a value corresponding to. The recording / transmission multiplexing unit 55 multiplexes the data encoded by each encoding unit into a stream. These constitute an object image encoding device.

【0004】背景の画素値をYb、物体の画素値をYf、物
体の透過度をGfとすると、復号時、物体を背景と合成し
た画素の画素値Ycは Yc=(255−Gf)×Yb+Gf×Yf と定義される。なお、透過度信号の符号化が省略された
場合は、形状信号の値をそのまま透過度信号の値とす
る。
If the pixel value of the background is Yb, the pixel value of the object is Yf, and the transparency of the object is Gf, the pixel value Yc of the pixel obtained by combining the object with the background is Yc = (255−Gf) × Yb + Gf during decoding. × Yf. When the encoding of the transmittance signal is omitted, the value of the shape signal is used as it is as the value of the transmittance signal.

【0005】形状信号符号化部53は任意形状オブジェク
トの形状信号を符号化する際、ブロックが完全にVOP(Vi
deo Object Plane)外(物体の外部)、ブロックが完全
にVOP内(物体内部)、ブロックがVOP境界上の3種類に
分類する。図7に示す例では、Aはブロックが完全にVO
P外、Bはブロックが完全にVOP内、CはブロックがVOP
境界線上と分類された例である。このVOP内外情報は任
意形状オブジェクトの画素値信号を復号化する際にも用
いる。
When the shape signal encoding unit 53 encodes a shape signal of an arbitrary shape object, the block is completely VOP (ViP).
deo Object Plane) outside (the outside of the object), block is completely inside the VOP (inside the object), and block is classified into three types on the VOP boundary. In the example shown in FIG. 7, A indicates that the block is completely VO
Outside P, B is completely VOP in block, C is block in VOP
It is an example classified as being on a boundary line. The VOP inside / outside information is also used when decoding a pixel value signal of an arbitrary-shaped object.

【0006】また、図6に従来手法(MPEG)による画素
値信号符号化部52のブロック図を示す。まず、画面内
(イントラ)符号化について説明する。入力した画素値
信号を基本処理単位であるマクロブロックに分割する。
1マクロブロックは4:2:0の画像フォーマットの場
合、6つのブロックから構成される。各ブロックに対し
離散コサイン変換(DCT)手段63でDCTを行ってから量子
化手段64で量子化する。量子化する際の量子化幅は符号
量制御手段65により決定する。さらに、量子化されたDC
T係数と量子化幅を可変長符号化手段66により符号化す
る。
FIG. 6 shows a block diagram of a pixel value signal encoding unit 52 using the conventional method (MPEG). First, intra-frame (intra) coding will be described. The input pixel value signal is divided into macro blocks, which are basic processing units.
One macroblock is composed of six blocks in the case of the 4: 2: 0 image format. Each block is subjected to DCT by a discrete cosine transform (DCT) unit 63 and then quantized by a quantization unit 64. The quantization width at the time of quantization is determined by the code amount control means 65. In addition, the quantized DC
The T coefficient and the quantization width are encoded by the variable length encoding means 66.

【0007】一方、画面間(インター)符号化は、符号
化の対象となるマクロブロックを含む画像に対して、時
間的に隣接する別の画像の中から、ブロックマッチング
をはじめとする動きベクトル検出方法で、動きベクトル
検出手段61により、対象マクロブロックに対して誤差の
最も小さい予測マクロブロックを検出する。誤差の最も
小さい予測マクロブロックへの動きを示す信号が動きベ
クトルである。予測マクロブロックを生成するために参
照する画像を参照画像と呼ぶ。検出された動きベクトル
に基づき、参照画像を動き補償して動き補償手段62によ
り、最適な予測マクロブロックを取得する。次に対象と
なるマクロブロックと対応する予測マクロブロックとの
差分を求め、この差分信号に対して離散コサイン変換
(DCT)手段63によりDCTを施し、DCT変換係数を量子化
手段64により量子化する。量子化後のDCT係数を動きベ
クトルや量子化幅とともに可変長符号化手段66により可
変長符号化する。
[0007] On the other hand, inter-picture coding uses motion vector detection such as block matching from another picture temporally adjacent to a picture containing a macroblock to be coded. By the method, the motion vector detecting means 61 detects a predicted macroblock having the smallest error with respect to the current macroblock. The signal indicating the motion to the predicted macroblock with the smallest error is the motion vector. An image referred to for generating a predicted macroblock is called a reference image. Based on the detected motion vector, the reference image is motion-compensated, and the motion compensation unit 62 obtains an optimal predicted macroblock. Next, the difference between the target macroblock and the corresponding predicted macroblock is determined, DCT is applied to the difference signal by the discrete cosine transform (DCT) means 63, and the DCT transform coefficient is quantized by the quantization means 64. . The quantized DCT coefficients are variable-length coded by the variable-length coding means 66 together with the motion vector and the quantization width.

【0008】ブロックをすべてイントラ符号化する画像
をI-VOP、画像の表示順で前にあるVOPからのみ予測する
画像をP-VOP、画像の表示順で前にある画像と後ろにあ
る画像の両方から予測する画像をB-VOPと呼ぶ。I-VOP及
びP-VOPは符号化順で後ろの画像の符号化のための参照
画像となる場合がある。そのため量子化されたDCT係数
を逆量子化手段67により逆量子化し、逆DCT手段68によ
り逆DCTする。イントラ符号化した場合は、この復号画
像をメモリ69に貯え、後ろの画像の符号化のための参照
画像とする。インター符号化した場合は動き補償画像と
加算することにより復号画像を作成し、メモリに貯え
る。
[0008] An image in which all blocks are intra-coded is an I-VOP, an image predicted only from a VOP that precedes it in the display order of the image is a P-VOP, and an image that precedes and follows the image in the display order of the image is displayed. An image predicted from both is called a B-VOP. The I-VOP and the P-VOP may be reference images for encoding the subsequent image in the encoding order. Therefore, the quantized DCT coefficient is inversely quantized by the inverse quantization means 67, and inverse DCT is performed by the inverse DCT means 68. When intra-coded, the decoded image is stored in the memory 69, and is used as a reference image for coding the subsequent image. In the case of inter-coding, a decoded image is created by adding the motion-compensated image and stored in a memory.

【0009】[0009]

【発明が解決しようとする課題】従来のオブジェクト符
号化装置では、任意形状オブジェクトの有無、形状、大
きさに関わらず、背景オブジェクトをすべて符号化する
ため、背景オブジェクト内の任意形状オブジェクトに隠
蔽された部分(表示画面上見えない部分)もすべて符号
化される。よって、任意形状オブジェクトが存在するシ
ーケンスで、必要としないデータ(即ち背景オブジェク
ト内の任意形状オブジェクトに隠蔽された部分)まで符
号化することになり、情報量が大きくなるという問題が
あった。本発明は、背景オブジェクトを符号化する際、
任意形状オブジェクトの情報を基に、任意形状オブジェ
クトに隠蔽される背景オブジェクトの個所(ブロック)
の符号量を削減できるオブジェクト符号化装置を提供す
ることを目的とする。
In a conventional object encoding apparatus, all background objects are encoded regardless of the presence, absence, shape, and size of an arbitrary shape object, so that the object is hidden by the arbitrary shape object in the background object. All the parts (the parts that cannot be seen on the display screen) are also encoded. Therefore, in a sequence in which an arbitrary-shaped object exists, even unnecessary data (that is, a portion hidden by the arbitrary-shaped object in the background object) is encoded, and there is a problem that the information amount increases. When encoding a background object, the present invention
The location (block) of the background object hidden by the arbitrary shape object based on the information of the arbitrary shape object
It is an object of the present invention to provide an object encoding device capable of reducing the amount of code of the object.

【0010】[0010]

【課題を解決するための手段】そこで上記課題を解決す
るために本発明は、任意形状オブジェクト画像と背景オ
ブジェクト画像との少なくとも2つ以上のオブジェクト
情報をDCT(離散コサイン変換)を用いて符号化する
オブジェクト符号化装置において、任意形状オブジェク
ト画像のVOP(Video Object Plane)内のブロックと判
定されたブロックの位置に相当する背景オブジェクト画
像のブロックを、任意形状オブジェクト画像により完全
に隠蔽されるブロックであると判断し、この任意形状オ
ブジェクト画像により完全に隠蔽されるブロックである
と判断された背景オブジェクト画像のブロックのDCT
係数を符号化しない、または、そのブロックにおけるD
CT係数内のDC係数を符号化しAC係数を符号化しな
い、または、そのブロックの量子化幅を通常より大きく
する手段を設けたことを特徴とするオブジェクト符号化
装置、を提供するものである。
In order to solve the above-mentioned problems, the present invention encodes at least two pieces of object information of an arbitrary-shaped object image and a background object image using DCT (Discrete Cosine Transform). In the object encoding apparatus, a block of a background object image corresponding to a position of a block determined to be a block in a VOP (Video Object Plane) of an arbitrarily shaped object image is a block completely hidden by the arbitrarily shaped object image. DCT of the block of the background object image determined to be present and determined to be a block completely hidden by this arbitrary shape object image
Do not encode the coefficients or D in the block
An object encoding apparatus is provided which encodes a DC coefficient in a CT coefficient and does not encode an AC coefficient, or includes means for increasing a quantization width of a block than usual.

【0011】[0011]

【発明の実施の形態】以下、本発明のオブジェクト符号
化装置の好ましい実施の形態について図面を参照しなが
ら詳細に説明する。図1はオブジェクト符号化装置の第
1実施例の構成を示すブロック図、図2は第1実施例内
の画素値信号符号化部11の構成を示すブロック図であ
る。従来例とは、図1において形状信号が画素値信号符
号化部11に入力されている点と、図2において画素値信
号符号化部にVOP内外判定手段30が加わっている点が大
きく異なる。画素値信号符号化部11以外の構成・動作は
ほぼ従来と同様であるので、ここでは画素値信号符号化
部11を中心に説明する。(なお。画素値信号符号化部11
を構成するDCT手段23とVOP内外判定手段30以外のブロッ
ク21〜29の動作は図6に示すブロック61〜69と同様であ
るので、その説明もここでは省略する。)
DESCRIPTION OF THE PREFERRED EMBODIMENTS Preferred embodiments of the object encoding apparatus according to the present invention will be described below in detail with reference to the drawings. FIG. 1 is a block diagram illustrating a configuration of a first embodiment of an object encoding device, and FIG. 2 is a block diagram illustrating a configuration of a pixel value signal encoding unit 11 in the first embodiment. The difference from the conventional example is that the shape signal is input to the pixel value signal encoding unit 11 in FIG. 1 and that the VOP inside / outside determination unit 30 is added to the pixel value signal encoding unit in FIG. Since the configuration and operation other than the pixel value signal encoding unit 11 are almost the same as those of the related art, the description will be focused on the pixel value signal encoding unit 11 here. (Note that the pixel value signal encoding unit 11
The operations of the blocks 21 to 29 other than the DCT means 23 and the VOP inside / outside determination means 30 are the same as those of the blocks 61 to 69 shown in FIG. 6, and the description thereof is omitted here. )

【0012】まず、矩形(背景)オブジェクト画像を符
号化する際、任意形状オブジェクトの形状信号に基づき
VOP内外判定手段30により、任意形状オブジェクトのブ
ロックが完全にVOP(Video Object Plane)外(物体の外
部)、ブロックが完全にVOP内(物体内部)、ブロック
がVOP境界上の3種類に分類・判定する。図7のAはブロ
ックが完全にVOP外、Bはブロックが完全にVOP内、Cはブ
ロックがVOP境界線上と分類された例である。ブロックA
及びブロックCの場合、その位置に相当する背景オブジ
ェクトの画素は復号した際、表示装置によって表示され
る。しかし、ブロックBに相当する背景オブジェクトの
画素は表示されない。背景の画素値をYb、物体の画素値
をYf、物体の透過度をGfとすると、復号時、物体を背景
と合成した画素の画素値Ycは Yc=(255−Gf)×Yb+Gf×Yf であり、ブロックBの場合、Gfが255となるため、 Yc=Yf と等価となる。ブロックBの復号時、背景の画素値Ybは
不要である。
First, when encoding a rectangular (background) object image, a rectangular (background) object image is encoded based on the shape signal of the arbitrary-shaped object.
The VOP inside / outside determination means 30 classifies the blocks of the arbitrary shape object into three types completely outside the VOP (Video Object Plane) (outside the object), the block completely inside the VOP (inside the object), and the block on the VOP boundary. judge. FIG. 7A illustrates an example in which a block is classified as completely outside the VOP, B illustrates an example in which the block is completely within the VOP, and C illustrates an example in which the block is classified as being on the VOP boundary line. Block A
And in the case of block C, the pixel of the background object corresponding to that position is displayed by the display device when decoded. However, the pixels of the background object corresponding to block B are not displayed. Assuming that the pixel value of the background is Yb, the pixel value of the object is Yf, and the transmittance of the object is Gf, the pixel value Yc of the pixel obtained by combining the object with the background is Yc = (255−Gf) × Yb + Gf × Yf at the time of decoding. In the case of block B, Gf is 255, which is equivalent to Yc = Yf. When decoding the block B, the background pixel value Yb is unnecessary.

【0013】そこで、背景オブジェクト画像を符号化す
る時に、VOP内外判定手段30において、任意形状オブジ
ェクト画像のVOP内のブロックと判定されたブロック
(即ちブロックB)の位置に相当する背景オブジェクト
画像のブロックを、任意形状オブジェクト画像により完
全に隠蔽されるブロックであると判断する。そして、こ
の任意形状オブジェクト画像により完全に隠蔽されるブ
ロックであると判断された背景オブジェクト画像のブロ
ックに相当する画素はDCT係数を符号化しない。即ち、D
CT手段23でDCT処理を行わない。または、そのブロック
に相当する画素におけるDCT係数内のDC係数を符号化しA
C係数を符号化しないようにする。これにより、背景オ
ブジェクトを符号化する際、任意形状オブジェクトの情
報を基に、任意形状オブジェクトに隠蔽される背景オブ
ジェクトのブロックの符号量を削減できる。なお、VOP
内外判定手段30のVOP内外判定結果に代わりに、形状信
号符号化部12で得られたVOP内外判定結果を座標変換し
たものを用いてもよい。
Therefore, when the background object image is encoded, the VOP inside / outside determination means 30 determines the block of the background object image corresponding to the position of the block (ie, block B) determined to be the block in the VOP of the arbitrarily shaped object image. Is a block completely hidden by the arbitrary-shaped object image. Then, pixels corresponding to blocks of the background object image determined to be blocks completely hidden by the arbitrary-shaped object image do not encode DCT coefficients. That is, D
The DCT processing is not performed by the CT means 23. Alternatively, the DC coefficient in the DCT coefficient of the pixel corresponding to the block is encoded and A
Do not encode C coefficients. Thereby, when encoding the background object, the code amount of the background object block hidden by the arbitrary shape object can be reduced based on the information of the arbitrary shape object. In addition, VOP
Instead of the VOP inside / outside determination result of the inside / outside determination means 30, a result of coordinate conversion of the VOP inside / outside determination result obtained by the shape signal encoding unit 12 may be used.

【0014】次に、第2実施例の画素値信号符号化部の
構成を図3に示す。第1実施例とは、図3においてVOP
内外判定手段40で判定された情報が符号量制御手段35に
入力されている点が異なる。VOP内外判定手段40及び符
号量制御手段35以外のブロックは従来と同様である。
Next, FIG. 3 shows the configuration of a pixel value signal encoding unit according to a second embodiment. The first embodiment corresponds to the VOP in FIG.
The difference is that the information determined by the inside / outside determination means 40 is input to the code amount control means 35. The blocks other than the VOP inside / outside determination means 40 and the code amount control means 35 are the same as the conventional ones.

【0015】背景オブジェクト画像を符号化する際、VO
P内外判定手段40により、第1実施例と同様にVOP内外判
定結果を行う。そして、任意形状オブジェクト画像によ
り完全に隠蔽されるブロックであると判断された背景オ
ブジェクト画像のブロックに相当する画素に対しては、
符号量制御手段35において他のブロックの画素に比べて
量子化幅を大きくする。これにより、背景オブジェクト
を符号化する際、任意形状オブジェクトの情報を基に、
任意形状オブジェクトに隠蔽される背景オブジェクトの
ブロックの符号量を削減できる。
When encoding a background object image, VO
The P inside / outside determination means 40 performs the VOP inside / outside determination result as in the first embodiment. Then, for a pixel corresponding to a block of the background object image determined to be a block completely hidden by the arbitrary-shaped object image,
In the code amount control means 35, the quantization width is increased as compared with the pixels in other blocks. Thereby, when encoding the background object, based on the information of the arbitrary shape object,
It is possible to reduce the code amount of the background object block hidden by the arbitrary-shaped object.

【0016】次に、第3実施例の画素値信号符号化部の
構成を図4に示す。第1、第2実施例とは、参照画像判
定手段51が加わっている点が異なる。参照画像判定手段
51により、現在符号化している背景オブジェクト画像の
フレームが符号化順で後の画像の動き補償参照画像とな
るかどうかを判定する。図8は符号化順で後の画像の動
き補償参照画像となるかどうか表示順で示す図である。
白色のVOPは後の画像の動き補償参照画像となり、灰色
のVOPは後の画像の動き補償参照画像として用いない。
すべてI-VOPで符号化する場合、及び、B-VOPの場合は後
の画像の動き補償参照画像とならない。しかし、I-VO
P、P-VOP、B-VOPが混在する場合のI-VOP、P-VOPは表示
順の画像のタイプにより、後の画像の参照画像となる場
合と、ならない場合がある。表示順で直後の画像がP-VO
PまたはB-VOPの場合、参照画像となることがあり、さら
に、直前の画像がB-VOPの場合も参照画像となる。
Next, FIG. 4 shows the configuration of a pixel value signal encoding unit according to a third embodiment. The difference from the first and second embodiments is that a reference image determining means 51 is added. Reference image determination means
According to 51, it is determined whether or not the frame of the background object image that is currently being encoded becomes a motion compensation reference image of a subsequent image in the encoding order. FIG. 8 is a diagram showing, in display order, whether or not to become a motion compensation reference image of a subsequent image in encoding order.
The white VOP serves as a motion-compensated reference image for the subsequent image, and the gray VOP is not used as a motion-compensated reference image for the subsequent image.
In the case of encoding all using the I-VOP, and in the case of the B-VOP, it does not become the motion compensation reference image of the subsequent image. But I-VO
When P, P-VOP, and B-VOP are mixed, the I-VOP and P-VOP may or may not be a reference image of a subsequent image depending on the type of image in the display order. The image immediately after in the display order is P-VO
In the case of P or B-VOP, it may be a reference image, and when the immediately preceding image is a B-VOP, it is also a reference image.

【0017】符号化順で後の画像の参照画像となる背景
オブジェクト画像のフレームの場合、そのフレームにお
ける、VOP内外判定手段50でブロックBと判定された(任
意形状オブジェクト画像により完全に隠蔽されと判断さ
れた)ブロックでも、後の画像の動き補償の際、このブ
ロックが参照される可能性があるので、ブロックA、Cと
同等に通常の符号化を行う。
In the case of a frame of a background object image serving as a reference image of a later image in the coding order, the frame is determined to be block B by the VOP inside / outside determination means 50 (when the frame is completely concealed by an arbitrary shape object image). Even in the case of the (determined) block, since there is a possibility that this block will be referred to at the time of motion compensation of the subsequent image, ordinary coding is performed in the same manner as blocks A and C.

【0018】動き補償参照画像とならない背景オブジェ
クト画像のフレームにおける、ブロックBと判定された
ブロックの画素については、符号量制御手段45において
他のブロックの画素に比べて量子化幅を大きくする。こ
れにより、背景オブジェクトを符号化する際、任意形状
オブジェクトの情報を基に、任意形状オブジェクトに隠
蔽される背景オブジェクトのブロックの符号量を削減で
きる。以下、実施例2と同様の処理を行う。なお、量子
化幅を大きくするブロックの画素について、量子化幅を
大きくする代わりに、その画素はDCT係数を符号化しな
い、または、DCT係数内のDC係数を符号化しAC係数を符
号化しないようにしてもよい。
For the pixels of the block determined to be block B in the frame of the background object image that is not the motion compensation reference image, the code amount control means 45 increases the quantization width as compared with the pixels of the other blocks. Thereby, when encoding the background object, the code amount of the background object block hidden by the arbitrary shape object can be reduced based on the information of the arbitrary shape object. Hereinafter, the same processing as in the second embodiment is performed. Note that, instead of increasing the quantization width, the pixel of the block whose quantization width is to be increased does not encode the DCT coefficient, or encodes the DC coefficient in the DCT coefficient and does not encode the AC coefficient. It may be.

【0019】ここで、任意形状オブジェクト画像符号化
時のブロック境界と背景オブジェクト画像符号化時のブ
ロック境界とが一致しない場合も多い。そこで、他の実
施例として、任意形状オブジェクト画像符号化時のブロ
ック境界と背景オブジェクト画像符号化時のブロック境
界とを一致させる手段と、任意形状オブジェクト画像の
VOP内のブロックと判定されたブロックの位置の背景オ
ブジェクト画像のブロックを、任意形状オブジェクト画
像により完全に隠蔽されるブロックであると判断し、こ
の任意形状オブジェクト画像により完全に隠蔽されるブ
ロックであると判断された背景オブジェクト画像のブロ
ックのDCT係数を符号化しない、または、そのブロック
におけるDCT係数内のDC係数を符号化しAC係数を符号化
しない、または、そのブロックの量子化幅を通常より大
きくする手段を設けたオブジェクト符号化装置としても
よい。
Here, there are many cases where the block boundaries at the time of encoding an object image of an arbitrary shape do not coincide with the block boundaries at the time of encoding a background object image. Therefore, as another embodiment, means for matching a block boundary at the time of encoding an arbitrary shape object image with a block boundary at the time of encoding a background object image,
The block of the background object image at the position of the block determined to be a block in the VOP is determined to be a block completely hidden by the arbitrary-shaped object image, and is a block completely hidden by this arbitrary-shaped object image. Do not encode the DCT coefficient of the block of the background object image determined to be, or encode the DC coefficient in the DCT coefficient of the block and do not encode the AC coefficient, or set the quantization width of the block larger than normal The object encoding device may be provided with means for performing the above.

【0020】また、実施例1〜3において、任意形状オ
ブジェクトが2つ以上あり、復号側でユーザ指示などで
切り替わるシーケンスの場合、切り替わる画像の大きさ
や形状が異なる場合がある。その場合、切り替わっても
背景オブジェクトの画像が、正常に表示されるように符
号化するため、VOP内外判定手段30(40)で判定する
際、各任意形状オブジェクト毎に判定し、どれか1つの
任意形状オブジェクトでもブロックAまたはブロックCと
判定されたブロックはブロックA、Cとして扱う。全ての
任意形状オブジェクトでブロックBと判定されたブロッ
クのみ符号量を削減を行うブロックBとして扱う。
Further, in the first to third embodiments, when there are two or more arbitrarily-shaped objects and the sequence is switched by a user instruction or the like on the decoding side, the size and shape of the switched image may be different. In this case, since the image of the background object is coded so that the image is normally displayed even after switching, when the VOP inside / outside determination means 30 (40) makes a determination, the determination is made for each arbitrary-shaped object, and any one of the objects is determined. A block determined to be block A or block C is treated as blocks A and C even in an arbitrary-shaped object. Only blocks determined to be block B in all arbitrary shape objects are treated as blocks B for which the code amount is reduced.

【0021】[0021]

【発明の効果】以上の通り、本発明のオブジェクト符号
化装置は、背景オブジェクトの符号化時に、任意形状オ
ブジェクトによって完全に隠蔽されるブロックの符号量
を削減することができ、符号化時のシーケンス全体の符
号量を削減する効果がある。
As described above, the object encoding apparatus according to the present invention can reduce the code amount of a block completely concealed by an arbitrary-shaped object at the time of encoding a background object. This has the effect of reducing the overall code amount.

【図面の簡単な説明】[Brief description of the drawings]

【図1】第1実施例の構成図である。FIG. 1 is a configuration diagram of a first embodiment.

【図2】第1実施例における画素値信号符号化部の構成
図である。
FIG. 2 is a configuration diagram of a pixel value signal encoding unit according to the first embodiment.

【図3】第2実施例における画素値信号符号化部の構成
図である。
FIG. 3 is a configuration diagram of a pixel value signal encoding unit according to a second embodiment.

【図4】第3実施例における画素値信号符号化部の構成
図である。
FIG. 4 is a configuration diagram of a pixel value signal encoding unit according to a third embodiment.

【図5】オブジェクト符号化装置の従来例を示す構成図
である。
FIG. 5 is a configuration diagram showing a conventional example of an object encoding device.

【図6】画素値信号符号化部の従来例を示す構成図であ
る。
FIG. 6 is a configuration diagram illustrating a conventional example of a pixel value signal encoding unit.

【図7】任意形状オブジェクトの画素値信号と形状信号
の例を示す図である。
FIG. 7 is a diagram illustrating an example of a pixel value signal and a shape signal of an arbitrary shape object.

【図8】符号化順で後の画像の動き補償参照画像となる
か否かの説明図である。
FIG. 8 is an explanatory diagram showing whether or not a subsequent image in a coding order will be a motion compensation reference image.

【符号の説明】[Explanation of symbols]

11 画素値信号符号化部 12 形状信号符号化部 13 透過度信号符号化部 14 記録・伝送多重化部 11 pixel value signal encoding unit 12 shape signal encoding unit 13 transmittance signal encoding unit 14 recording / transmission multiplexing unit

Claims (5)

【特許請求の範囲】[Claims] 【請求項1】任意形状オブジェクト画像と背景オブジェ
クト画像との少なくとも2つ以上のオブジェクト情報を
DCT(離散コサイン変換)を用いて符号化するオブジ
ェクト符号化装置において、 任意形状オブジェクト画像のVOP(Video Object Plan
e)内のブロックと判定されたブロックの位置に相当する
背景オブジェクト画像のブロックを、任意形状オブジェ
クト画像により完全に隠蔽されるブロックであると判断
し、この任意形状オブジェクト画像により完全に隠蔽さ
れるブロックであると判断された背景オブジェクト画像
のブロックのDCT係数を符号化しない手段を設けたこ
とを特徴とするオブジェクト符号化装置。
An object encoding apparatus for encoding at least two pieces of object information of an arbitrarily shaped object image and a background object image by using DCT (Discrete Cosine Transform). Plan
The block of the background object image corresponding to the position of the block determined to be the block in e) is determined to be a block completely concealed by the arbitrarily shaped object image, and is completely concealed by the arbitrarily shaped object image. An object coding apparatus, comprising: means for not coding DCT coefficients of a block of a background object image determined to be a block.
【請求項2】任意形状オブジェクト画像と背景オブジェ
クト画像との少なくとも2つ以上のオブジェクト情報を
DCT(離散コサイン変換)を用いて符号化するオブジ
ェクト符号化装置において、 任意形状オブジェクト画像のVOP(Video Object Plan
e)内のブロックと判定されたブロックの位置に相当する
背景オブジェクト画像のブロックを、任意形状オブジェ
クト画像により完全に隠蔽されるブロックであると判断
し、この任意形状オブジェクト画像により完全に隠蔽さ
れるブロックであると判断された背景オブジェクト画像
のブロックにおけるDCT係数内のDC係数を符号化
し、AC係数を符号化しない手段を設けたことを特徴と
するオブジェクト符号化装置。
2. An object encoding apparatus for encoding at least two or more pieces of object information of an arbitrarily-shaped object image and a background object image using DCT (Discrete Cosine Transform). Plan
The block of the background object image corresponding to the position of the block determined to be the block in e) is determined to be a block completely concealed by the arbitrarily shaped object image, and is completely concealed by the arbitrarily shaped object image. An object encoding apparatus, comprising: means for encoding a DC coefficient in a DCT coefficient in a block of a background object image determined to be a block and not encoding an AC coefficient.
【請求項3】任意形状オブジェクト画像と背景オブジェ
クト画像との少なくとも2つ以上のオブジェクト情報を
DCT(離散コサイン変換)を用いて符号化するオブジ
ェクト符号化装置において、 任意形状オブジェクト画像のVOP(Video Object Plan
e)内のブロックと判定されたブロックの位置に相当する
背景オブジェクト画像のブロックを、任意形状オブジェ
クト画像により完全に隠蔽されるブロックであると判断
し、この任意形状オブジェクト画像により完全に隠蔽さ
れるブロックであると判断された背景オブジェクト画像
のブロックの量子化幅を通常より大きくする手段を設け
たことを特徴とするオブジェクト符号化装置。
3. An object encoding apparatus for encoding at least two or more pieces of object information of an arbitrary-shaped object image and a background object image by using DCT (Discrete Cosine Transform). Plan
The block of the background object image corresponding to the position of the block determined to be the block in e) is determined to be a block completely concealed by the arbitrarily shaped object image, and is completely concealed by the arbitrarily shaped object image. An object coding apparatus, comprising: means for increasing a quantization width of a block of a background object image determined to be a block, as compared with a normal range.
【請求項4】任意形状オブジェクト画像と背景オブジェ
クト画像との少なくとも2つ以上のオブジェクト情報を
DCT(離散コサイン変換)を用いて符号化するオブジ
ェクト符号化装置において、 任意形状オブジェクト画像符号化時のブロック境界と背
景オブジェクト画像符号化時のブロック境界とを一致さ
せる手段と、 任意形状オブジェクト画像のVOP(Video Object Plan
e)内のブロックと判定されたブロックの位置の背景オブ
ジェクト画像のブロックを、任意形状オブジェクト画像
により完全に隠蔽されるブロックであると判断し、この
任意形状オブジェクト画像により完全に隠蔽されるブロ
ックであると判断された背景オブジェクト画像のブロッ
クのDCT係数を符号化しない、または、そのブロック
におけるDCT係数内のDC係数を符号化しAC係数を
符号化しない、または、そのブロックの量子化幅を通常
より大きくする手段を設けたことを特徴とするオブジェ
クト符号化装置。
4. An object encoding apparatus for encoding at least two or more pieces of object information of an arbitrary-shaped object image and a background object image by using DCT (Discrete Cosine Transform). Means for matching the boundary with the block boundary at the time of encoding the background object image, and a VOP (Video Object Plan)
e) It is determined that the block of the background object image at the position of the block determined as the block in the block is a block completely hidden by the arbitrarily shaped object image, and a block completely concealed by the arbitrarily shaped object image. Do not encode the DCT coefficients of the block of the background object image determined to be present, or encode the DC coefficients within the DCT coefficients of the block and do not encode the AC coefficients, or set the quantization width of the block to be smaller than normal. An object encoding device, comprising: means for increasing the size.
【請求項5】任意形状オブジェクト画像と背景オブジェ
クト画像との少なくとも2つ以上のオブジェクト情報を
DCT(離散コサイン変換)を用いて符号化するオブジ
ェクト符号化装置において、 背景オブジェクト画像のフレームが符号化順で後に符号
化するフレームの動き補償参照画像となるかどうかを判
別する判別手段と、 任意形状オブジェクト画像により完全に隠蔽される背景
オブジェクト画像のブロックを検出する検出手段と、 前記判別手段の判断結果と前記検出手段の検出結果に基
づき、符号化順で後に符号化するフレームの動き補償参
照画像とならない背景オブジェクト画像のフレームにお
ける、任意形状オブジェクト画像により完全に隠蔽され
るブロックのDCT係数を符号化しない、または、その
ブロックにおけるDCT係数内のDC係数を符号化しA
C係数を符号化しない、または、そのブロックの量子化
幅を通常より大きくする手段とを設けたことを特徴とす
るオブジェクト符号化装置。
5. An object encoding apparatus which encodes at least two or more pieces of object information of an arbitrary-shaped object image and a background object image by using DCT (Discrete Cosine Transform), wherein a frame of the background object image is encoded in an encoding order. Determining means for determining whether or not the frame is a motion-compensated reference image of a frame to be encoded later, detecting means for detecting a block of a background object image completely hidden by an arbitrary-shaped object image, and a determination result of the determining means And encoding a DCT coefficient of a block completely concealed by an arbitrary-shaped object image in a frame of a background object image that is not a motion-compensation reference image of a frame to be encoded later in the encoding order based on the detection result of the detection unit. No, or DCT in the block A encodes the DC coefficient within a few
Means for encoding the C coefficient or increasing a quantization width of the block larger than usual.
JP30655399A 1999-10-28 1999-10-28 Object encoding device Pending JP2001128173A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP30655399A JP2001128173A (en) 1999-10-28 1999-10-28 Object encoding device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP30655399A JP2001128173A (en) 1999-10-28 1999-10-28 Object encoding device

Publications (1)

Publication Number Publication Date
JP2001128173A true JP2001128173A (en) 2001-05-11

Family

ID=17958441

Family Applications (1)

Application Number Title Priority Date Filing Date
JP30655399A Pending JP2001128173A (en) 1999-10-28 1999-10-28 Object encoding device

Country Status (1)

Country Link
JP (1) JP2001128173A (en)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003018591A (en) * 2001-07-03 2003-01-17 Nec Corp Motion picture coding system, motion picture coding method, and program
KR100493702B1 (en) * 2002-10-09 2005-06-02 엘지전자 주식회사 Image communication system and operating method thereof
JP2013042449A (en) * 2011-08-19 2013-02-28 Axell Corp Image compression method, image decompression method, and image processing apparatus
JP2018101875A (en) * 2016-12-20 2018-06-28 株式会社アクセル Image data encoding device
CN108965882A (en) * 2018-06-12 2018-12-07 浙江大华技术股份有限公司 A kind of decoding method and device

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003018591A (en) * 2001-07-03 2003-01-17 Nec Corp Motion picture coding system, motion picture coding method, and program
JP4613453B2 (en) * 2001-07-03 2011-01-19 日本電気株式会社 Moving picture coding system, moving picture coding method and program
KR100493702B1 (en) * 2002-10-09 2005-06-02 엘지전자 주식회사 Image communication system and operating method thereof
JP2013042449A (en) * 2011-08-19 2013-02-28 Axell Corp Image compression method, image decompression method, and image processing apparatus
JP2018101875A (en) * 2016-12-20 2018-06-28 株式会社アクセル Image data encoding device
CN108965882A (en) * 2018-06-12 2018-12-07 浙江大华技术股份有限公司 A kind of decoding method and device
CN108965882B (en) * 2018-06-12 2020-08-14 浙江大华技术股份有限公司 Encoding and decoding method and device

Similar Documents

Publication Publication Date Title
EP1120970B1 (en) Image decoding apparatus with object area decoding means and shape decoding means
US6785331B1 (en) Predictive encoding and decoding methods of video data
JP4828543B2 (en) Video encoding apparatus and video decoding apparatus
KR100312791B1 (en) Data structure for image transmission, image coding method, and image decoding method
JP3570863B2 (en) Moving picture decoding apparatus and moving picture decoding method
JP3778721B2 (en) Video coding method and apparatus
JP2002532029A (en) Efficient macroblock header coding for video compression
JP2004254327A (en) Image coding method and image decoding method
JPH10290463A (en) Method for predictively encoding and decoding moving image, recording medium recording predictive moving image encoding or decoding program and recording medium recording predictive moving image encoding data
KR100215824B1 (en) The frame memory and image data decoding method in mpeg decoder
JP2001128173A (en) Object encoding device
KR20040036948A (en) Video coding and decoding method, and corresponding signal
KR100378795B1 (en) Flexible direct mode coding method for b pictures in moving picture
US6556714B2 (en) Signal processing apparatus and method
JP3599942B2 (en) Moving picture coding method and moving picture coding apparatus
US6922490B2 (en) Image compression of selected regions based on transmission bit rate, motion, and/or region information, and bit selection before compression based on transmission bit rate
KR980007748A (en) Method and apparatus for coding digital video signals
Ostermann Efficient encoding of binary shapes using MPEG-4
JP2000184380A (en) Moving picture compression coder and moving picture compression decoder
KR100504808B1 (en) Method converting rgb color in a motion picture codec
JP2956726B2 (en) Method and apparatus for highly efficient coding of moving images
JPH09182043A (en) Visual telephone having movement tracking function
JP4159436B2 (en) Video encoding apparatus and method
JP2000152249A (en) Image coder
JPH0799645A (en) Motion vector detecting circuit