JPH11136678A - Coding method and coder - Google Patents
Coding method and coderInfo
- Publication number
- JPH11136678A JPH11136678A JP29917497A JP29917497A JPH11136678A JP H11136678 A JPH11136678 A JP H11136678A JP 29917497 A JP29917497 A JP 29917497A JP 29917497 A JP29917497 A JP 29917497A JP H11136678 A JPH11136678 A JP H11136678A
- Authority
- JP
- Japan
- Prior art keywords
- quantization
- quantization scale
- code amount
- quantizer
- scale
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T9/00—Image coding
- G06T9/005—Statistical coding, e.g. Huffman, run length coding
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression Of Band Width Or Redundancy In Fax (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
【0001】[0001]
【発明の属する技術分野】本発明は符号化方法及び符号
化装置に係り、特にカラー静止画像やカラー動画像など
の画像データを符号化して記録媒体に記録する符号化方
法及び符号化装置に関する。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an encoding method and an encoding apparatus, and more particularly, to an encoding method and an encoding apparatus for encoding image data such as a color still image and a color moving image and recording the encoded image data on a recording medium.
【0002】[0002]
【従来の技術】従来の例としてMPEG1動画符号化規
格を用いて説明する。MPEGは1988年、ISO/
IEC JTC1/SC2(国際標準化機構/国際電気
標準化会合同技術委員会1/専門部会2、現在のSC2
9)に設立された動画像符号化標準を検討する組織の名
称(Moving Pictures Experts Group)の略称である。
MPEG1(MPEGフェーズ1)は1.5Mbps程
度の蓄積メディアを対象とした標準で、静止画符号化を
目的としたJPEGと、ISDN(サービス統合ディジ
タル網)のテレビ会議やテレビ電話の低転送レート用の
動画像圧縮を目的としたH.261(CCITT SG
XV、現在のITU−T SG15で標準化)の基本的
な技術を受け継ぎ、蓄積メディア用に新しい技術を導入
したものである。これらは1993年8月、ISO/I
EC 11172として成立している。2. Description of the Related Art A conventional example will be described using the MPEG1 moving picture coding standard. MPEG was established in 1988 by ISO /
IEC JTC1 / SC2 (International Organization for Standardization / International Electrotechnical Commission Technical Committee / Technical Committee 2, current SC2
This is the abbreviation of the name of the organization (Moving Pictures Experts Group) that examines the moving picture coding standard established in 9).
MPEG1 (MPEG Phase 1) is a standard for storage media of about 1.5 Mbps, and is used for JPEG for the purpose of still image coding and for low transfer rates of videoconferencing and videophone of ISDN (Integrated Services Digital Network). For compressing moving images of H.264. 261 (CCITT SG
XV, standardized by the current ITU-T SG15) and introduced a new technology for storage media. These are the August 1993 ISO / I
EC 11172 is established.
【0003】MPEG1は幾つかの技術を組み合わせて
作成されている。図3は従来の符号化装置の一例のブロ
ック図を示す。同図において、入力された画像データ
は、減算器10で動き補償予測器11からの動き補償予
測化した画像データと減算され、時間冗長分が削減され
た差分画像データとされる。この動き補償予測の予測の
方向は、過去、未来、両方からの3モード存在する。ま
た、これらは16画素×16画素のマクロブロックMB
毎に切り換えて使用できる。[0003] MPEG1 is created by combining several technologies. FIG. 3 is a block diagram showing an example of a conventional encoding device. In the figure, the input image data is subtracted by the motion compensated image data from the motion compensated predictor 11 by a subtracter 10 to obtain differential image data in which the time redundancy is reduced. There are three modes of the motion compensation prediction from the past, the future, and both. These are macroblocks MB of 16 pixels × 16 pixels.
It can be used by switching every time.
【0004】予測方向は、入力画像に与えられたピクチ
ャタイプによって決定される。過去からの予測と、予測
をしないでそのMBを独立で符号化する2モード存在す
るのがPピクチャである。また、未来仮の予測、過去か
らの予測、両方からの予測、独立で符号化する4モード
存在するのがBピクチャである。そして、すべてのMB
が独立で符号化するのがIピクチャである。動き補償
は、動き領域をMB毎にパターンマッチングを行ってハ
ーフペル精度で動きベクトルを検出し、動き文だけシフ
トしてから予測する。動きベクトルは水平方向と垂直方
向が存在し、何処からの予測かを示すMC(Motion Com
pensation)モードと共にMBの付加情報として伝送さ
れる。[0004] The prediction direction is determined by the picture type given to the input image. P-pictures have two modes of prediction from the past and independent encoding of the MB without prediction. Also, B-pictures have four modes for provisional prediction, prediction from the past, prediction from both, and independent encoding. And all MB
Is an I picture that is independently encoded. In the motion compensation, a motion vector is detected with half-pel accuracy by performing pattern matching for each MB, and the motion vector is predicted after shifting by a motion sentence. The motion vector has a horizontal direction and a vertical direction, and indicates an MC (Motion Com
(Pensation) mode and transmitted as MB additional information.
【0005】図3の減算器10から出力された差分画像
データは、DCT器12において直交変換が行われる。
DCT(Discrete Cosine Transform)とは、余弦関数
を積分核とした積分変換を有限空間へ離散変換する直交
変換である。MPEGではMBを4分割し、8×8のD
CTブロックに対して、2次元DCTを行う。[0005] The difference image data output from the subtractor 10 in FIG.
DCT (Discrete Cosine Transform) is an orthogonal transform that discretely transforms an integral transform using a cosine function as an integral kernel into a finite space. In MPEG, an MB is divided into four parts, and an 8 × 8 D
Two-dimensional DCT is performed on the CT block.
【0006】一般に、ビデオ信号は低域成分が多く高域
成分が少ないため、DCTを行うと係数が低域に集中す
る。DCTされた画像データ(DCT係数)は、量子化
器13で量子化が行われる。量子化は量子化マトリック
スという8×8の2次元周波数を視覚特性で重み付けし
た値と、その全体をスカラー倍する量子化スケールとい
う値で乗算した値を量子化値として、DCT係数をその
量子化値で除算する。デコーダで逆量子化するときは量
子化値で乗算することにより、元のDCT係数に近似し
ている値を得ることになる。Generally, since a video signal has many low-frequency components and few high-frequency components, when DCT is performed, coefficients concentrate on low frequencies. The quantized image data (DCT coefficients) are quantized by the quantizer 13. In the quantization, a DCT coefficient is quantized using a value obtained by multiplying an 8 × 8 two-dimensional frequency called a quantization matrix by a visual characteristic and a value called a quantization scale for multiplying the whole by a scalar as a quantization value. Divide by value. When inverse quantization is performed by the decoder, a value close to the original DCT coefficient is obtained by multiplying by the quantization value.
【0007】量子化された画像データは逆量子化器14
にて逆量子化され、逆DCT器15にて逆DCTされ、
更に、画像メモリ16に一時蓄えられた後、動き補償予
測器11において、差分画像を計算するためのリファレ
ンスの復号化画像として使用される。[0007] The quantized image data is supplied to an inverse quantizer 14.
Is inversely quantized by the inverse DCT unit 15,
Further, after temporarily stored in the image memory 16, the motion compensation predictor 11 uses it as a reference decoded image for calculating a difference image.
【0008】一方、量子化器13より取り出された量子
化された画像データは、VLC器17で可変長符号化さ
れる。量子化された値のうち直流(DC)成分は予測符
号化のひとつであるDPCM(Differencial Pulse Cod
e Modulation)を使用する。また、交流(AC)成分は
低域から高域にジグザグスキャンを行い、ゼロのラン長
および有効係数値を1つの事象とし、出現確率の高いも
のから符号長の短い符号を割り当てていくハフマン符号
化が行われる。On the other hand, the quantized image data taken out by the quantizer 13 is subjected to variable-length coding by the VLC unit 17. The direct current (DC) component of the quantized value is DPCM (Differential Pulse Code) which is one of predictive coding.
e Modulation). Further, the Huffman code which performs a zigzag scan of an alternating current (AC) component from a low frequency band to a high frequency band, assigns a run length of zero and an effective coefficient value to one event, and assigns a code having a short code length to a code having a high appearance probability. Is performed.
【0009】可変長符号化されたデータは一時バッファ
19に蓄えられ、所定の転送レートで符号化データとし
て出力される。また、その出力されるデータのマクロブ
ロック毎の発生符号量は、符号量制御器18に送信さ
れ、目標符号量に対する発生符号量との差分を量子化器
13にフィードバックして符号量制御される。フィード
バックは量子化スケールに反映され、具体的な符号量制
御の方法は以下の通りである。The variable-length coded data is stored in a temporary buffer 19 and output as coded data at a predetermined transfer rate. The generated code amount of the output data for each macro block is transmitted to the code amount controller 18, and the difference between the generated code amount and the target code amount is fed back to the quantizer 13 to control the code amount. . The feedback is reflected on the quantization scale, and a specific code amount control method is as follows.
【0010】MPEGは可変長符号化を行っているため
に、出力のビットストリームも単位時間当りの発生符号
量は可変である。しかし、多くのアプリケーションでは
固定レート(CBR:Constant Bit Rate)で送信しな
ければならない。そこで、MPEGではこのビットスト
リームに対する拘束条件を規定するための仮想デコーダ
モデルとして、VBV(Video Buffering Verifier)と
称するエンコーダ出力に接続される仮想デコーダモデル
が考案された。[0010] Since the MPEG performs variable length coding, the output bit stream also has a variable generated code amount per unit time. However, many applications require transmission at a fixed rate (CBR: Constant Bit Rate). Therefore, in MPEG, a virtual decoder model called VBV (Video Buffering Verifier) connected to an encoder output has been devised as a virtual decoder model for defining the constraint condition for the bit stream.
【0011】このモデルではエンコーダとVBVは完全
に同期して動作し、各ピクチャの復号化は瞬時にして行
われ、VBVバッファからは同様に瞬時にして記憶デー
タが取り去られるように規定されている。符号化ではこ
のバッファをアンダーフローやオーバーフローせずに制
御すればよい。In this model, the encoder and the VBV operate completely synchronously, and the decoding of each picture is performed instantaneously, and the stored data is similarly instantaneously removed from the VBV buffer. . In encoding, the buffer may be controlled without underflow or overflow.
【0012】これについての詳細はISO−11172
−2,ISO−13818−2,H.262に記述され
ている。発生符号量を増加させるには、量子化スケール
を小さくし、符号量を減少させるには量子化スケールを
大きくする。この原理を用いて、例えばVBVバッファ
の占有率をもとに、量子化スケールをコントロールする
方法が考えられる。The details of this are described in ISO-11172.
-2, ISO-13818-2, H.C. 262. To increase the generated code amount, the quantization scale is reduced, and to reduce the code amount, the quantization scale is increased. Using this principle, a method of controlling the quantization scale based on, for example, the occupancy of the VBV buffer can be considered.
【0013】しかし、量子化スケールを大きくすれば画
質は劣化する、しかも、Pピクチャは一つ前のIピクチ
ャもしくはPピクチャから、Bピクチャは時間的に両側
のIピクチャとPピクチャから予測されている関係上、
Iピクチャが劣化すると、連動して他のピクチャも劣化
する。従って、Iピクチャの画質は最も重要で符号も十
分に配分しなければならない。However, if the quantization scale is increased, the image quality is degraded. In addition, the P picture is predicted from the immediately preceding I or P picture, and the B picture is predicted from the I and P pictures temporally on both sides. Because of the relationship
When the I picture deteriorates, the other pictures also deteriorate in conjunction with it. Therefore, the picture quality of the I picture is the most important, and the codes must be sufficiently distributed.
【0014】一般に、I:P:Bの符号量割り当ては
6:3:2程度を基本とし、動きが少ないシーンになる
と8:2:1などになり、動きが大きくなると4:4:
3などにもなる。これらのピクチャに対する符号量配分
を考慮しながら全体のレートコントロールを実現する方
式例を示す。これはMPEG2の標準化でテストモデル
として使用されていたアルゴリズムである。In general, the code amount allocation of I: P: B is basically about 6: 3: 2, such as 8: 2: 1 for a scene with a small motion, and 4: 4: for a large motion.
3 and so on. An example of a system for realizing the overall rate control while considering the code amount distribution for these pictures will be described. This is an algorithm used as a test model in the standardization of MPEG2.
【0015】(a)ステップ1ステップ1は各ピクチャ
へのビット配分を行うステップで、GOP(Group ofPi
ctures)の各ピクチャに対する割り当て符号量を、GO
P内でまだ符号化していないピクチャに対してある重み
をつけて配分する。すなわち、各ピクチャを符号化する
際に用いる平均量子化スケールと発生符号量との積は、
画面が変化しない限りピクチャタイプ毎に一定値となる
と仮定し、I、P及びBの各ピクチャタイプ毎に、次式
によりパラメータXi、Xp及びXbを更新する。(A) Step 1 Step 1 is a step of allocating bits to each picture.
c), the amount of code allocated to each picture in
A certain weight is assigned to a picture which has not been encoded in P yet. That is, the product of the average quantization scale used when encoding each picture and the generated code amount is
Assuming that the value is constant for each picture type as long as the screen does not change, the parameters Xi, Xp and Xb are updated by the following equation for each of the I, P and B picture types.
【0016】 Xi=Si×Qi Xp=Sp×Qp Xb=Sb×Qb ここで、Xi、Xp及びXbはIピクチャ、Pピクチャ
及びBピクチャのグローバル・コンプレキシティ・メジ
ャー(global complexity measure)と呼ばれるパラメ
ータで、一つ前の同ピクチャタイプの符号化結果(発生
符号量)Si、Sp及びSbと、一つ前の同ピクチャタ
イプの平均量子化スケールQi、Qp及びQbの積で定
義する。Xi = Si × Qi Xp = Sp × Qp Xb = Sb × Qb Here, Xi, Xp and Xb are called a global complexity measure of I picture, P picture and B picture. The parameter is defined as the product of the previous encoding result (the amount of generated code) Si, Sp, and Sb of the same picture type and the average quantization scale Qi, Qp, and Qb of the immediately preceding same picture type.
【0017】また、理想的な画質は、Iピクチャの量子
化スケールを基準とした場合のPピクチャの量子化スケ
ールとの比率Kpが1.0で、かつ、Bピクチャの量子
化スケールとの比率Kbが1.4のとき達成されると仮
定する。以上の仮定により、GOP中のIピクチャ、P
ピクチャ、Bピクチャに対する割り当て符号量Ti、T
p、Tbは次式で示す値とする。The ideal picture quality is that the ratio Kp to the quantization scale of the P picture is 1.0 when the quantization scale of the I picture is used as a reference, and the ratio of the quantization scale to the quantization scale of the B picture is 1.0. Assume that this is achieved when Kb is 1.4. According to the above assumption, the I picture in the GOP, P
Code amount Ti, T assigned to picture and B picture
p and Tb are values shown by the following equations.
【0018】[0018]
【数1】 ここでNp,NbはGOP内のPピクチャやBピクチャ
の未符号化ピクチャ枚数である。(Equation 1) Here, Np and Nb are the numbers of uncoded pictures of P pictures and B pictures in the GOP.
【0019】このようにして求めた割り当て符号量を基
にして、GOP内で符号化が進む毎に、GOP内の未符
号化ピクチャに対して割り当てられる符号量Rは次式に
基づいて更新される。Based on the code amount thus obtained, every time the coding progresses in the GOP, the code amount R assigned to the uncoded picture in the GOP is updated based on the following equation. You.
【0020】R=R−Si,p,b (b)ステップ2 ステップ2ではステップ1で割り当てられた各ピクチャ
の割り当て符号量(Ti,Tp,Tb)と実際の発生符
号量を一致させるため、MB毎に発生符号量を加算しつ
つ、目標符号量から途中での予測目標符号量との差を量
子化スケールにMB単位でフィードバックする。R = R-Si, p, b (b) Step 2 In step 2, in order to make the allocated code amount (Ti, Tp, Tb) of each picture allocated in step 1 coincide with the actual generated code amount, While adding the generated code amount for each MB, the difference between the target code amount and the predicted target code amount in the middle is fed back to the quantization scale in MB units.
【0021】 dji=d0i+Bj-1−(Ti(j−1)/MB_cnt) djp=d0p+Bj-1−(Tp(j−1)/MB_cnt) djb=d0b+Bj-1−(Tb(j−1)/MB_cnt) ここで、d0i,d0p,d0bは各仮想バッファの初
期占有量、Bj-1は各ピクチャの先頭からj−1番目の
MBまでの発生符号量、MB_cntは1ピクチャ内の
MB数である。Dji = d0i + B j−1 − (Ti (j−1) / MB_cnt) djp = d0p + B j−1 − (Tp (j−1) / MB_cnt) djb = d0b + B j−1 − (Tb (j−1) ) / MB_cnt) where d0i, d0p, and d0b are the initial occupancy of each virtual buffer, B j-1 is the amount of generated code from the head of each picture to the j-1st MB, and MB_cnt is the MB in one picture. Is a number.
【0022】次に、j番目のMBに対する量子化スケー
ルQjを次式により求める。Next, a quantization scale Q j for the j-th MB is obtained by the following equation.
【0023】Qj=dj×31/r r=2×bit_rate/picture_rate rはフィードバックの応答速度を決定するパラメータで
ある。Q j = dj × 31 / rr = 2 × bit_rate / picture_rater is a parameter for determining the response speed of feedback.
【0024】[0024]
【発明が解決しようとする課題】従来の符号化方式で
は、量子化スケールは上記のように1から31でコント
ロールされている。これはMPEGの規格において、量
子化スケールが5ビットと規定されているところから、
実際に選べる値が1から31の値の整数値であることに
起因する。In the conventional encoding method, the quantization scale is controlled from 1 to 31 as described above. This is because, in the MPEG standard, the quantization scale is specified as 5 bits.
This is because the value that can be actually selected is an integer value from 1 to 31.
【0025】このため、従来では符号量の制御を非常に
細かくしなければならないようなアプリケーションで
は、この量子化スケールの粗さがそのまま符号量制御精
度につながり、制御能力を低下させる原因になってい
る。また、静止画符号化など、MPEGのイントラ画像
を1枚だけ使用したアプリケーションなどでは、符号量
制御精度と共に、微妙な画質のコントロール精度も低下
させる原因となっている。Therefore, in an application in which the control of the code amount must be made very fine in the past, the coarseness of the quantization scale directly leads to the code amount control accuracy, which causes a reduction in control ability. I have. Further, in applications using only one MPEG intra image, such as still image coding, the control accuracy of delicate image quality as well as the code amount control accuracy is reduced.
【0026】本発明は、以上の点に鑑みなされたもの
で、符号量制御精度を向上し得る符号化方法及び符号化
装置を提供することを目的とする。The present invention has been made in view of the above points, and an object of the present invention is to provide an encoding method and an encoding apparatus capable of improving code amount control accuracy.
【0027】また、本発明の他の目的は、静止画符号化
など、MPEGのイントラ画像を1枚だけ使用したアプ
リケーションなどでも、符号量制御精度とともに、微妙
な画質のコントロール精度を向上し得る符号化方法及び
符号化装置を提供することにある。Another object of the present invention is to provide a code capable of improving the control accuracy of fine image quality as well as the code amount control accuracy even in an application such as still image coding using only one MPEG intra image. It is an object of the present invention to provide an encoding method and an encoding device.
【0028】[0028]
【課題を解決するための手段】上記の目的を達成するた
め、本発明の符号化方法及び符号化装置は、符号化の際
の発生符号量を受け、量子化スケールの所定の値を複数
に細分化した細量子化スケールを、発生符号量と目標符
号量との差分値に応じた値で出力し、その出力細量子化
スケールに対応させた量子化マトリックス及び量子化ス
ケールを量子化器に入力して、これら量子化マトリック
ス及び量子化スケールの積で量子化器の入力データを除
算させて量子化するようにしたものである。In order to achieve the above object, an encoding method and an encoding apparatus according to the present invention receive a generated code amount at the time of encoding and reduce a predetermined value of a quantization scale to a plurality of values. The subdivided fine quantization scale is output as a value corresponding to the difference value between the generated code amount and the target code amount, and the quantization matrix and the quantization scale corresponding to the output fine quantization scale are output to the quantizer. The quantization data is input by dividing the input data of the quantizer by the product of the quantization matrix and the quantization scale.
【0029】この発明では、量子化スケールと量子化マ
トリックスの組合せを用いて使用される細量子化スケー
ルを用いることにより、量子化スケールの値の間を補う
実効量子化幅を得ることができる。According to the present invention, by using the fine quantization scale that is used by using a combination of the quantization scale and the quantization matrix, it is possible to obtain an effective quantization width that compensates between the values of the quantization scale.
【0030】上記の細量子化スケールは、量子化スケー
ルの1の部分の量子化マトリックスを複数に細分化した
量子化スケールであることが、低域成分が多く高域成分
が少ない画像信号の細量子化スケールとして望ましい。The above-mentioned fine quantization scale is a quantization scale obtained by subdividing the quantization matrix of one part of the quantization scale into a plurality of pieces, and it is necessary that the fine quantization scale of the image signal has many low-frequency components and few high-frequency components. Desirable as a quantization scale.
【0031】[0031]
【発明の実施の形態】次に、本発明の実施の形態につい
て説明する。図1は、本発明になる符号化方法及び符号
化装置の一実施の形態のブロック図を示す。同図中、図
3と同一構成部分には同一符号を付し、その説明を省略
する。図1の実施の形態は、細量子化スケール変換器2
2を設けた点に特徴がある。Next, an embodiment of the present invention will be described. FIG. 1 is a block diagram showing an embodiment of an encoding method and an encoding apparatus according to the present invention. 3, the same components as those of FIG. 3 are denoted by the same reference numerals, and the description thereof will be omitted. The embodiment of FIG.
2 is provided.
【0032】図1において、VLC器17により可変長
符号化されたデータは、バッファ19に一時蓄えられ、
所定の転送レートで符号化データとして出力される。ま
た、その出力されるデータのマクロブロック毎の発生符
号量は、符号量制御器21に供給され、ここで目標符号
量に対する発生符号量との差分値が求められ、更にその
差分値を基に後述の細量子化スケールが求められ、その
細量子化スケールが細量子化スケール変換器22に供給
されて、量子化マトリックスと量子化スケールに変換さ
れた後量子化器13にフィードバックされて符号量制御
する。上記の細量子化スケールは従来の量子化スケール
を細分化したものである。In FIG. 1, data which has been subjected to variable length coding by the VLC unit 17 is temporarily stored in a buffer 19,
It is output as encoded data at a predetermined transfer rate. The generated code amount for each macro block of the output data is supplied to a code amount controller 21 where a difference value between the generated code amount and a target code amount is obtained, and further based on the difference value. A fine quantization scale, which will be described later, is obtained, and the fine quantization scale is supplied to the fine quantization scale converter 22, and is converted into a quantization matrix and a quantization scale, and is then fed back to the quantizer 13 to be encoded. Control. The fine quantization scale is a subdivision of the conventional quantization scale.
【0033】図2は上記の細量子化スケールと量子化マ
トリックスと量子化スケールと実効量子化幅の関係の一
例を示す。ここでは量子化値の小さいほうを重点的に細
かく細分化している。細量子化スケールは量子化マトリ
ックスと量子化スケールの組み合わせにおいて実現され
ている。量子化マトリックスとはMPEGに用いられて
いる8画素×8画素の視覚特性で重み付けした値のマト
リックスで、DCT係数をこの量子化マトリックスと量
子化スケールの積で除算し、切り捨て若しくは四捨五入
することで量子化を行う。FIG. 2 shows an example of the relationship between the fine quantization scale, the quantization matrix, the quantization scale, and the effective quantization width. Here, the smaller one of the quantization values is emphasized and finely divided. The fine quantization scale is realized by a combination of a quantization matrix and a quantization scale. The quantization matrix is a matrix of values weighted by the visual characteristics of 8 pixels × 8 pixels used in MPEG, and the DCT coefficient is divided by the product of the quantization matrix and the quantization scale, and is rounded down or rounded. Perform quantization.
【0034】MPEGで規定されている量子化は次式に
より実現される。The quantization defined by MPEG is realized by the following equation.
【0035】[u,v]=8×c[u,v]//(Qsca
le×matrix[u,v]) ここでu,vは量子化マトリックス内の水平方向、垂直
方向のアドレスを示しており、それぞれ0〜7の値をと
る。また、[u,v]は量子化された後の画像データ、
c[u,v]は量子化される前の画像データ、Qsca
leは1から31までのMPEGで規定された値、ma
trix[u,v]は8行8列のMPEGで規定された
量子化マトリックスを示す。[U, v] = 8 × c [u, v] // (Qsca
le × matrix [u, v]) Here, u and v indicate horizontal and vertical addresses in the quantization matrix, and take values from 0 to 7, respectively. [U, v] is image data after quantization,
c [u, v] is the image data before quantization, Qsca
le is a value defined by MPEG from 1 to 31, ma
trix [u, v] indicates a quantization matrix defined by MPEG with 8 rows and 8 columns.
【0036】この実施の形態では量子化マトリックスは
11種類を用いている。これら11種類の量子化マトリ
ックスを表1、表2及び表3に示す。In this embodiment, eleven types of quantization matrices are used. Tables 1, 2 and 3 show these 11 types of quantization matrices.
【0037】[0037]
【表1】 [Table 1]
【0038】[0038]
【表2】 [Table 2]
【0039】[0039]
【表3】 具体的な量子化マトリックスと量子化スケールの組み合
わせと、従来の量子化スケール1の値を1.0とした場
合の、本実施の形態の相対的な実効量子化値を図2に示
す。これを用いて細量子化スケールを用いた符号量制御
のアルゴリズム例を以下に示す。ステップ1は従来と共
通であるので、その説明は省略し、ステップ2のアルゴ
リズムについて、以下説明する。[Table 3] FIG. 2 shows a specific combination of the quantization matrix and the quantization scale and the relative effective quantization value of the present embodiment when the value of the conventional quantization scale 1 is 1.0. An algorithm example of code amount control using the fine quantization scale using this will be described below. Step 1 is the same as the conventional one, so the description thereof is omitted, and the algorithm of step 2 will be described below.
【0040】ステップ2ではステップ1で割り当てられ
た各ピクチャの割り当て符号量(Ti,Tp,Tb)と
実際の発生符号量を一致させるため、MB毎に発生符号
量を加算しつつ、目標符号量から途中での予測目標符号
量との差を量子化スケールにMB単位でフィードバック
する。In step 2, in order to make the allocated code amount (Ti, Tp, Tb) of each picture allocated in step 1 coincide with the actual generated code amount, the target code amount is added while adding the generated code amount for each MB. And the difference from the predicted target code amount in the middle is fed back to the quantization scale in MB units.
【0041】 dji=d0i+Bj-1−(Ti(j−1)/MB_cnt) djp=d0p+Bj-1−(Tp(j−1)/MB_cnt) djb=d0b+Bj-1−(Tb(j−1)/MB_cnt) ここで、d0i,d0p,d0bは各仮想バッファの初
期占有量、Bj-1は各ピクチャの先頭からj−1番目の
MBまでの発生符号量、MB_cntは1ピクチャ内の
MB数である。Dji = d0i + B j−1 − (Ti (j−1) / MB_cnt) djp = d0p + B j−1 − (Tp (j−1) / MB_cnt) djb = d0b + B j−1 − (Tb (j−1) ) / MB_cnt) where d0i, d0p, and d0b are the initial occupancy of each virtual buffer, B j-1 is the amount of generated code from the head of each picture to the j-1st MB, and MB_cnt is the MB in one picture. Is a number.
【0042】次に、j番目のMBに対する細量子化スケ
ールQjを次式により求める。Next, a fine quantization scale Q j for the j-th MB is obtained by the following equation.
【0043】Qj=dj×42/r r=2×bit_rate/picture_rate rはフィードバックの応答速度を決定するパラメータで
ある。Q j = dj × 42 / rr = 2 × bit_rate / picture_rater is a parameter for determining the response speed of feedback.
【0044】このようにして符号量制御器21により得
られた細量子化スケールQjは、細量子化スケール変換
器22に送られる。細量子化スケール変換器22は、図
2と表1、表2及び表3に示した“細量子化スケール”
と“量子化マトリックス、量子化スケール”の対応を付
けて量子化器13に“量子化マトリックス、量子化スケ
ール”を供給する。なお、図2中、量子化マトリックス
の数値は、表1〜表3に示した11種類の量子化マトリ
ックスのうち何番目の種類の量子化マトリックスである
かを示す番号である。The fine quantization scale Q j obtained by the code amount controller 21 is sent to the fine quantization scale converter 22. The fine quantization scale converter 22 is a “fine quantization scale” shown in FIG. 2 and Tables 1, 2, and 3.
And a “quantization matrix, quantization scale”, and supplies the “quantization matrix, quantization scale” to the quantizer 13. In FIG. 2, the numerical values of the quantization matrices are numbers indicating the type of the quantization matrix among the 11 types of quantization matrices shown in Tables 1 to 3.
【0045】量子化器13はDCT器12からのDCT
係数を、この量子化マトリックスと量子化スケールの積
で除算し、切り捨てる、若しくは四捨五入することで量
子化を行う。また量子化マトリックスはVLC器17の
出力のデータと共に図示せぬ多重化装置で、ピクチャヘ
ッダなどと共に多重化されて符号化データとして出力さ
れる。The quantizer 13 is a DCT from the DCT unit 12.
The coefficient is divided by the product of the quantization matrix and the quantization scale, and the quantization is performed by rounding down or rounding. The quantization matrix is multiplexed together with the data output from the VLC unit 17 by a multiplexing device (not shown) together with a picture header or the like, and is output as encoded data.
【0046】この実施の形態によれば、図2に示したよ
うに、量子化スケール1の部分の量子化マトリックス
を、従来1ステップしか存在しなかったのに対して11
ステップに分け、0.125、1.25、2.5などの
整数値以外の実効量子化幅を使用して符号化を可能とし
ている。結果として、従来1〜31のステップしか存在
しない量子化スケールが図2に示すように42ステップ
に拡張されている。According to the present embodiment, as shown in FIG. 2, the quantization matrix of the quantization scale 1 is 11
The coding is made possible by dividing the steps into effective quantization widths other than integer values such as 0.125, 1.25, and 2.5. As a result, the conventional quantization scale having only steps 1 to 31 has been expanded to 42 steps as shown in FIG.
【0047】これらはMPEG規格内で行うことができ
る。例えばMPEG1では、量子化マトリックスは各G
OP毎に変更することが可能である。従って、MPEG
1における動画の場合、本実施の形態を用いて符号量制
御精度を変更する場合には、Iピクチャを使い、シンタ
ックス的にGOP構成をとり、シーケンスヘッダを送信
することで、量子化マトリックスを変更できる。These can be performed within the MPEG standard. For example, in MPEG1, the quantization matrix is
It can be changed for each OP. Therefore, MPEG
In the case of the moving image in No. 1, when the code amount control accuracy is changed using the present embodiment, a quantization matrix is obtained by using an I picture, taking a GOP configuration in a syntax, and transmitting a sequence header. Can be changed.
【0048】また、MPEG2においては毎ピクチャ毎
に変更可能である。従って、MPEG2における動画の
場合、MPEG2で規定されているマトリクス変更を示
すコード(QUANT MATRIX EXTENSION)を毎ピクチャ毎に
送信することで、量子化マトリックスを変更できる。In MPEG2, it can be changed for each picture. Therefore, in the case of a moving image in MPEG2, the quantization matrix can be changed by transmitting a code (QUANT MATRIX EXTENSION) indicating a matrix change specified in MPEG2 for each picture.
【0049】なお、上記の実施の形態では、量子化スケ
ールの1の部分の量子化マトリックスを11種類の量子
化マトリックスに分けているが、本発明はこれに限定さ
れるものではなく複数種類であればよく、また複数種類
の量子化マトリックスに分ける量子化スケールの部分
は、1以外の2〜31の任意の量子化スケールでもよ
い。In the above embodiment, the quantization matrix of one portion of the quantization scale is divided into 11 types of quantization matrices. However, the present invention is not limited to this, and a plurality of types may be used. Any number of quantization scales other than 1 may be used as the quantization scale portion to be divided into a plurality of types of quantization matrices.
【0050】[0050]
【発明の効果】以上説明したように、本発明によれば、
量子化スケールと量子化マトリックスの組合せを用いて
使用される細量子化スケールを用いて、量子化スケール
の値の間を補う実効量子化幅を得て符号量制御を行うよ
うにしたので、MPEGのように量子化スケールが5ビ
ットと規定されていても、実際に選べる値は1から31
の値の整数値の間を選択したと等価な量子化が可能とな
り、符号量制御精度を向上できる。As described above, according to the present invention,
Since a fine quantization scale used by using a combination of a quantization scale and a quantization matrix is used to obtain an effective quantization width that compensates between the values of the quantization scale to control the code amount, MPEG Even if the quantization scale is specified as 5 bits as in
Quantization equivalent to selecting between integer values of the above values is possible, and the code amount control accuracy can be improved.
【0051】また、本発明によれば、静止画符号化な
ど、MPEGのイントラ画像を1枚だけ使用したアプリ
ケーションなどでも、符号量制御精度とともに、微妙な
画質のコントロール精度を向上させることができる。Further, according to the present invention, even in an application using only one MPEG intra image, such as still image coding, the control accuracy of the delicate image quality can be improved as well as the code amount control accuracy.
【図1】本発明の一実施の形態のブロック図である。FIG. 1 is a block diagram of an embodiment of the present invention.
【図2】本発明の一実施の形態の細量子化スケールと量
子化マトリックス、量子化スケール及び実効量子化幅と
の関係を示す図である。FIG. 2 is a diagram illustrating a relationship between a fine quantization scale and a quantization matrix, a quantization scale, and an effective quantization width according to an embodiment of the present invention.
【図3】従来の一例のブロック図である。FIG. 3 is a block diagram of an example of the related art.
12 DCT器 13 量子化器 17 VLC器 19 バッファ 21 符号量制御器 22 細量子化スケール変換器 Reference Signs List 12 DCT unit 13 Quantizer 17 VLC unit 19 Buffer 21 Code amount controller 22 Fine quantization scale converter
Claims (4)
ロックに分割してから直交変換した後、量子化スケール
と量子化マトリックスの積に関連した実効量子化幅を用
いて量子化器により量子化を行い、その量子化されたデ
ータを可変長符号化すると共に、符号化の際の発生符号
量と目標符号量との差分値に基づき生成した前記量子化
スケールを前記量子化器にフィードバックして符号量制
御を行う符号化方法において、 前記符号化の際の発生符号量を受け、前記量子化スケー
ルの所定の値を複数に細分化した細量子化スケールを、
発生符号量と目標符号量との差分値に応じた値で出力
し、その出力細量子化スケールに対応させた前記量子化
マトリックス及び前記量子化スケールを前記量子化器に
入力して、これら量子化マトリックス及び量子化スケー
ルの積で前記量子化器の入力データを除算させて量子化
することを特徴とする符号化方法。After dividing input image data into blocks for each predetermined pixel and performing orthogonal transformation, the quantizer uses an effective quantization width related to a product of a quantization scale and a quantization matrix. And quantized data is subjected to variable-length encoding, and the quantization scale generated based on the difference between the generated code amount and the target code amount during encoding is fed back to the quantizer. In the encoding method of performing the code amount control, receiving the generated code amount at the time of the encoding, a fine quantization scale obtained by subdividing a predetermined value of the quantization scale into a plurality,
The quantizer outputs a value corresponding to a difference value between the generated code amount and the target code amount, and inputs the quantization matrix and the quantization scale corresponding to the output fine quantization scale to the quantizer. Encoding data obtained by dividing input data of the quantizer by a product of a quantization matrix and a quantization scale.
ケールの1の部分の量子化マトリックスを複数に細分化
した量子化スケールであることを特徴とする請求項1記
載の符号化方法。2. The encoding method according to claim 1, wherein the fine quantization scale is a quantization scale obtained by subdividing a quantization matrix of one part of the quantization scale into a plurality.
ロックに分割してから直交変換して直交変換係数を出力
する直交変換係数出力手段と、 前記直交変換係数に対して外部信号に応じた実効量子化
幅で量子化を行う量子化器と、 前記量子化器の出力データを可変長符号化して符号化デ
ータを出力すると共に、符号化の際の発生符号量を出力
する可変長符号化器と、 前記発生符号量を受け、前記量子化スケールの所定の値
を複数に細分化した細量子化スケールを、発生符号量と
目標符号量との差分値に応じた値で出力する符号量制御
器と、 前記符号量制御器から出力された細量子化スケールを受
け、その入力細量子化スケールに対応させた前記量子化
マトリックス及び前記量子化スケールを前記量子化器に
前記外部信号として入力して、これら量子化マトリック
ス及び量子化スケールの積で前記量子化器の入力データ
を除算させて量子化する細量子化スケール変換器とを有
することを特徴とする符号化装置。3. An orthogonal transform coefficient output unit that divides input image data into blocks for each predetermined pixel, and performs orthogonal transform to output orthogonal transform coefficients. A quantizer that performs quantization with an effective quantization width, and variable-length encoding that outputs variable-length encoded output data of the quantizer and outputs encoded data, and outputs a generated code amount at the time of encoding. A code amount for receiving the generated code amount and outputting a fine quantization scale obtained by subdividing the predetermined value of the quantization scale into a plurality of values as a value corresponding to a difference value between the generated code amount and the target code amount. A controller, receives the fine quantization scale output from the code amount controller, and inputs the quantization matrix and the quantization scale corresponding to the input fine quantization scale to the quantizer as the external signal. And this Encoding apparatus characterized by having a Luo quantization matrix and fine quantization scale converter for quantizing by dividing the input data of the quantizer by the product of the quantization scale.
ルの1の部分の量子化マトリックスを複数に細分化した
細量子化スケールを出力することを特徴とする請求項3
記載の符号化装置。4. The code amount controller outputs a fine quantization scale obtained by subdividing a quantization matrix of one portion of the quantization scale into a plurality of pieces.
An encoding device according to claim 1.
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP29917497A JP2900927B2 (en) | 1997-10-30 | 1997-10-30 | Encoding method and encoding device |
TW87117627A TW389019B (en) | 1997-10-30 | 1998-10-23 | Coding method and coder, and recording medium recorded with image coded data |
CN98120499A CN1104814C (en) | 1997-10-30 | 1998-10-28 | Coding method and device, and recording medium for recording image coding data |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP29917497A JP2900927B2 (en) | 1997-10-30 | 1997-10-30 | Encoding method and encoding device |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH11136678A true JPH11136678A (en) | 1999-05-21 |
JP2900927B2 JP2900927B2 (en) | 1999-06-02 |
Family
ID=17869101
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP29917497A Expired - Lifetime JP2900927B2 (en) | 1997-10-30 | 1997-10-30 | Encoding method and encoding device |
Country Status (3)
Country | Link |
---|---|
JP (1) | JP2900927B2 (en) |
CN (1) | CN1104814C (en) |
TW (1) | TW389019B (en) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN100411442C (en) * | 2003-03-24 | 2008-08-13 | 华为技术有限公司 | Dispatching licence transmitting method in radio communication system |
ES2612950T3 (en) | 2006-03-16 | 2017-05-19 | Huawei Technologies Co., Ltd. | A method and a device for quantification in coding-decoding |
ES2725674T3 (en) * | 2012-02-29 | 2019-09-26 | Sony Corp | Device and method of image processing |
-
1997
- 1997-10-30 JP JP29917497A patent/JP2900927B2/en not_active Expired - Lifetime
-
1998
- 1998-10-23 TW TW87117627A patent/TW389019B/en not_active IP Right Cessation
- 1998-10-28 CN CN98120499A patent/CN1104814C/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
CN1216887A (en) | 1999-05-19 |
TW389019B (en) | 2000-05-01 |
JP2900927B2 (en) | 1999-06-02 |
CN1104814C (en) | 2003-04-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100253931B1 (en) | Approximate mpeg decoder with compressed reference frames | |
EP1113672B1 (en) | Quantization matrix for still and moving picture coding | |
US6658157B1 (en) | Method and apparatus for converting image information | |
US5907374A (en) | Method and apparatus for processing a compressed input bitstream representing an information signal | |
EP0562787B1 (en) | Image coding method and apparatus | |
US7391914B2 (en) | Decoding of predicted DC coefficient without division | |
WO1994024822A1 (en) | Method and apparatus for coding image, and image recording medium | |
EP0755610A1 (en) | Method and device for transcoding video signals | |
WO1991014295A1 (en) | Digital image coding using a random scanning of image frames | |
JPH05145773A (en) | Device and method of encoding video picture | |
US7095448B2 (en) | Image processing circuit and method for modifying a pixel value | |
GB2322991A (en) | Motion estimation method for video data compression system | |
KR100238622B1 (en) | A motion video compression system with novel adaptive quantisation | |
US20040234142A1 (en) | Apparatus for constant quality rate control in video compression and target bit allocator thereof | |
KR100227298B1 (en) | Code amount controlling method for coded pictures | |
JPH09322176A (en) | Encoding mode selecting method, moving image encoding device, encoding method, recording method and transmitting method | |
US7113646B2 (en) | Decoding of predicted AC coefficient without division | |
JPH10164577A (en) | Dynamic image encoder | |
US20030174771A1 (en) | Method, apparatus, and program for variable bit rate encoding | |
JP2900927B2 (en) | Encoding method and encoding device | |
JP3626779B2 (en) | Image coding method and apparatus | |
JP3800965B2 (en) | Data rate converter | |
JP3934772B2 (en) | Variable transfer rate encoding method and apparatus | |
US7095785B2 (en) | Determination of prediction direction in MPEG-4 | |
JP4007398B2 (en) | Quantization control apparatus and method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090319 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090319 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100319 Year of fee payment: 11 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110319 Year of fee payment: 12 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120319 Year of fee payment: 13 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120319 Year of fee payment: 13 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120319 Year of fee payment: 13 |
|
R360 | Written notification for declining of transfer of rights |
Free format text: JAPANESE INTERMEDIATE CODE: R360 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120319 Year of fee payment: 13 |
|
R360 | Written notification for declining of transfer of rights |
Free format text: JAPANESE INTERMEDIATE CODE: R360 |
|
R371 | Transfer withdrawn |
Free format text: JAPANESE INTERMEDIATE CODE: R371 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120319 Year of fee payment: 13 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130319 Year of fee payment: 14 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140319 Year of fee payment: 15 |
|
EXPY | Cancellation because of completion of term |