JP2001339720A - Image information conversion apparatus and method for same - Google Patents

Image information conversion apparatus and method for same

Info

Publication number
JP2001339720A
JP2001339720A JP2000155399A JP2000155399A JP2001339720A JP 2001339720 A JP2001339720 A JP 2001339720A JP 2000155399 A JP2000155399 A JP 2000155399A JP 2000155399 A JP2000155399 A JP 2000155399A JP 2001339720 A JP2001339720 A JP 2001339720A
Authority
JP
Japan
Prior art keywords
information
image
frame
compression information
image compression
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2000155399A
Other languages
Japanese (ja)
Inventor
Kazufumi Sato
数史 佐藤
Kuniaki Takahashi
邦明 高橋
Teruhiko Suzuki
輝彦 鈴木
Yoichi Yagasaki
陽一 矢ケ崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2000155399A priority Critical patent/JP2001339720A/en
Publication of JP2001339720A publication Critical patent/JP2001339720A/en
Withdrawn legal-status Critical Current

Links

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

PROBLEM TO BE SOLVED: To correspond to a change of complexity in GOP. SOLUTION: The device of the present invention transcodes MPEG 2 image compression information (bit stream) of interlaced scanning to MPEG 4 image compression information (bit stream) of sequential scanning, wherein average quantization scale calculating unit 25 finds an approximate value of average quantization scale relative to each frame using information quantizer-scale-code contained in slice header within MPEG 2 image compression information (bit stream) that has been taken out by slice header analyzing unit 18, a complexity calculating unit 26 finds an approximate value of complexity relative to each frame using these encoding amount (bit number) assigned to each frame, and MPEG 4 image information encoding unit (I/P-VOP) controls encoding amount of MPEG 4 image compression information (bit stream) using approximated complexity.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、画像情報を変換す
る画像情報変換装置及び方法に関し、詳しくは、離散コ
サイン変換等の直交変換と動き補償によって圧縮された
MPEG等の画像情報(ビットストリーム)を衛星放
送、ケーブルTV、インターネット等のネットワークメ
ディアを介して受信する際に、若しくは光、磁気ディス
クのような記憶メディア上で処理する際に用いられる画
像情報を変換する画像情報変換装置及び方法に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an image information conversion apparatus and method for converting image information, and more particularly, to image information (bit stream) such as MPEG compressed by orthogonal transform such as discrete cosine transform and motion compensation. And a method for converting image information used when receiving an image via a network medium such as satellite broadcasting, cable TV, or the Internet, or when processing the same on a storage medium such as an optical disk or a magnetic disk. .

【0002】[0002]

【従来の技術】近年、画像情報をディジタルとして取り
扱い、効率の高い情報の伝送、蓄積を目的とし、画像情
報特有の冗長性を利用して、離散コサイン変換等の直交
変換と動き補償により圧縮するMPEGなどの画像情報
圧縮方式が提供されている。そして、このような画像情
報圧縮方法に準拠した装置は、放送局などの情報配信、
及び一般家庭における情報受信の双方において普及しつ
つある。
2. Description of the Related Art In recent years, image information is handled as digital data, and for the purpose of transmitting and storing information with high efficiency, compression is performed by orthogonal transform such as discrete cosine transform and motion compensation using redundancy inherent in image information. An image information compression system such as MPEG is provided. Then, an apparatus conforming to such an image information compression method is used for information distribution of a broadcasting station or the like,
It is becoming widespread in both information reception in general households.

【0003】特に、MPEG2(ISO/IEC 13
818−2)は、飛び越し走査画像及び順次走査画像の
双方、並びに標準解像度画像及び高精細画像を網羅す
る、汎用画像符号化方式として定義されている。
In particular, MPEG2 (ISO / IEC 13
818-2) is defined as a general-purpose image encoding method that covers both interlaced scan images and progressive scan images, as well as standard resolution images and high definition images.

【0004】すなわち、MPEG2符号化圧縮方式によ
れば、例えば、720×480画素を持つ標準解像度の
飛び越し走査画像に4〜8Mbpsの符号量(ビットレ
ート)を割り当て、1920×1088画素を持つ高解
像度の飛び越し走査画像に対して18〜22Mbpsの
符号量(ビットレート)を割り当てることにより、高い
圧縮率と良好な画質の実現が可能となる。
That is, according to the MPEG2 encoding and compression system, for example, a code amount (bit rate) of 4 to 8 Mbps is assigned to a standard resolution interlaced scan image having 720 × 480 pixels, and a high resolution having 1920 × 1088 pixels is assigned. By assigning a code amount (bit rate) of 18 to 22 Mbps to the interlaced scan image, a high compression rate and good image quality can be realized.

【0005】このようなことから、MPEG2は、プロ
フェッショナル用途及びコンシューマー用途の広範なア
プリケーションに今後とも用いられるものと予想され
る。しかし、MPEG2は、主として放送用に適合する
高画質符号化を対象としており、例えばMPEG1より
低い符号量(ビットレート)、つまりより高い圧縮率の
符号化方式には対応していなかった。
[0005] For these reasons, it is expected that MPEG2 will be used in a wide range of applications for professional use and consumer use. However, MPEG2 is mainly intended for high-quality coding suitable for broadcasting, and does not support, for example, a coding amount (bit rate) lower than that of MPEG1, that is, a coding method with a higher compression rate.

【0006】一方で、近年の携帯端末の普及により、今
後とも高い圧縮率の符号化方式のニーズは高まると思わ
れ、これに対応して、高い圧縮率を有するMPEG4符
号化方式の標準化が行われている。この画像符号化方式
に関しては、1998年12月にISO/IEC 14
496−2として国際標準の規格が承認された。
[0006] On the other hand, with the spread of portable terminals in recent years, it is expected that the need for an encoding system with a high compression ratio will increase in the future, and in response to this, standardization of the MPEG4 encoding system with a high compression ratio has been carried out. Have been done. Regarding this image coding method, ISO / IEC 14
International standard was approved as 496-2.

【0007】ところで、ディジタル放送用に一度符号化
されたMPEG2画像圧縮情報(ビットストリーム)
を、携帯端末上等で処理するのにより適した、より低い
符号量(ビットレート)の画像圧縮情報(ビットストリ
ーム)に変換したいというニーズがある。
By the way, MPEG2 image compression information (bit stream) once encoded for digital broadcasting
There is a need to convert image compression information (bit stream) having a lower code amount (bit rate), which is more suitable for processing on a mobile terminal or the like.

【0008】かかる目的を達成するために、“Field-to
-Frame Transcoding with Spatialand Temporal Downsa
mpling”(Susie L Wee,John G.Apostolopoulos, and N
ickFeamster, ICIP 99、以下これを文献1と呼ぶ)にお
いて画像情報変換装置(トランスコーダ)が提供されて
いる。
In order to achieve such an object, “Field-to
-Frame Transcoding with Spatialand Temporal Downsa
mpling ”(Susie L Wee, John G. Apostolopoulos, and N
ickFeamster, ICIP 99, hereafter referred to as Document 1).
And an image information conversion device (transcoder) is provided.
I have.

【0009】この文献1において提供された画像情報変
換装置(トランスコーダ)は、図5に示すように、ピク
チャタイプ判別部1と、MPEG2画像情報復号化部
(I/Pピクチャ)2と、間引き部3と、MPEG4画
像情報符号化部(I/P−VOP)4と、動きベクトル
合成部5と、動きベクトル検出部6とから構成されてい
る。
[0009] As shown in FIG. 5, an image information conversion device (transcoder) provided in Document 1 includes a picture type discrimination unit 1, an MPEG2 image information decoding unit (I / P picture) 2, a thinning-out unit. It comprises a unit 3, an MPEG4 image information encoding unit (I / P-VOP) 4, a motion vector synthesizing unit 5, and a motion vector detecting unit 6.

【0010】この画像情報変換装置には、フレーム内で
符号化されたイントラ符号化画像(Iピクチャ;I)、
表示順序で順方向を参照して予測符号化された順方向予
測符号化画像(Pピクチャ;P)及び表示順序で順方向
及び逆方向を参照して予測符号化された双方向予測符号
化画像(Bピクチャ;B)から構成される飛び越し走査
のMPEG2画像圧縮情報(ビットストリーム)が入力
される。
[0010] The image information conversion apparatus includes an intra-coded image (I picture; I) encoded in a frame,
A forward predictive coded image (P picture; P) predictively coded by referring to the forward direction in the display order, and a bidirectional predictive coded image predictively coded by referring to the forward and reverse directions in the display order MPEG-2 image compression information (bit stream) of interlaced scanning composed of (B picture; B) is input.

【0011】このMPEG2画像圧縮情報(ビットスト
リーム)は、ピクチャタイプ判別部1において、I/P
ピクチャに関するものか、Bピクチャに関するものであ
るかを判別され、I/Pピクチャのみ後続のMPEG2
画像情報復号化部(I/Pピクチャ)2に出力され、B
ピクチャは破棄される。
[0011] The MPEG2 image compression information (bit stream) is supplied to an I / P
It is determined whether the picture is related to a picture or a B picture.
Output to the image information decoding unit (I / P picture) 2
The picture is discarded.

【0012】MPEG2画像情報復号化部(I/Pピク
チャ)2における処理は通常のMPEG2画像情報復号
化装置と同様に、MPEG2画像圧縮情報(ビットスト
リーム)を画像信号に復号するものである。
The processing in the MPEG2 image information decoding section (I / P picture) 2 is to decode the MPEG2 image compression information (bit stream) into an image signal, as in a normal MPEG2 image information decoding device.

【0013】MPEG2画像情報復号化部(I/Pピク
チャ)2の出力となる画素値は、間引き部3に入力され
る。間引き部3は、水平方向には1/2の間引き処理を
施し、垂直方向には、第一フィールド若しくは第二フィ
ールドのどちらか一方のデータのみを残し、もう一方を
廃棄する。このような間引きによって、入力となる画像
情報の1/4の大きさを持つ順次走査画像を生成する。
A pixel value output from the MPEG2 image information decoding unit (I / P picture) 2 is input to a thinning unit 3. The thinning section 3 performs a 1/2 thinning process in the horizontal direction, and leaves only one of the data of the first field and the second field in the vertical direction, and discards the other. By such thinning, a progressively scanned image having a size of 4 of the input image information is generated.

【0014】間引き部3によって生成された順次走査画
像はMPEG4画像情報符号化部(I/P−VOP)4
によってフレーム内で符号化されたI−VOP及び表示
順序で順方向を参照して予測符号化されたP−VOPに
符号化され、MPEG4画像圧縮情報(ビットストリー
ム)として出力される。尚、VOPはVideo object Pla
neを意味し、MPEG2におけるフレームに相当するも
のである。
The progressively scanned image generated by the thinning section 3 is converted to an MPEG4 image information encoding section (I / P-VOP) 4
Is encoded into an I-VOP encoded in the frame and a P-VOP predicted and encoded with reference to the forward direction in the display order, and output as MPEG4 image compression information (bit stream). VOP is Video object Pla
ne, which corresponds to a frame in MPEG2.

【0015】その際、入力となるMPEG2画像圧縮情
報(ビットストリーム)中の動きベクトル情報は、動き
ベクトル合成部5において間引き後の画像情報に対する
動きベクトルにマッピングされ、動きベクトル検出部6
においては、動きベクトル合成部5において合成された
動きベクトル値を元に高精度の動きベクトルを検出す
る。
At this time, the motion vector information in the input MPEG2 image compression information (bit stream) is mapped to a motion vector for the decimated image information in the motion vector synthesizing unit 5 and the motion vector detecting unit 6
In, a highly accurate motion vector is detected based on the motion vector value synthesized by the motion vector synthesizing unit 5.

【0016】文献1は、入力となるMPEG2画像圧縮
情報(ビットストリーム)の1/2×1/2の大きさを
持つ順次走査画像のMPEG4画像圧縮情報(ビットス
トリーム)を生成する画像情報変換装置に関して記述し
ている。すなわち、例えば入力となるMPEG2画圧縮
情報(ビットストリーム)がNTSC(National Telev
ision System Committee)の規格に準拠したものであっ
た場合、出力となるMPEG4画像圧縮情報はSIFサ
イズ(352×240画素)ということになる。
Reference 1 discloses an image information conversion apparatus for generating MPEG4 image compression information (bit stream) of a progressively scanned image having a size of 1/2 × 1/2 of the input MPEG 2 image compression information (bit stream). Is described. That is, for example, the input MPEG2 image compression information (bit stream) is transmitted using NTSC (National Telev.
If it complies with the standards of the ISion Committee, the output MPEG4 image compression information has an SIF size (352 × 240 pixels).

【0017】ところで、図5に示した画像情報変換装置
においては、MPEG4画像情報符号化部(I/P−V
OP)4における符号量制御が、出力となるMPEG4
画像圧縮情報(ビットストリーム)における画質を決定
する大きな要因となる。ISO/IEC 14496−
2においては、符号量制御の方式に関しては特に規定さ
れておらず、各ベンダが、アプリケーションに応じて、
演算量及び出力画質の観点から最適と考えられる方式を
用いることが出来る。以下では、代表的な符号量制御方
式として、MPEG2 Test Model 5(IS
O/IEC JTC1/SC29/WG11 N040
0)で述べられている方式について述べる。
In the image information conversion apparatus shown in FIG. 5, an MPEG4 image information encoding unit (I / P-V
OP) 4 is to control the amount of code to output MPEG4
This is a major factor in determining the image quality of the image compression information (bit stream). ISO / IEC 14496-
In No. 2, the code amount control method is not specified, and each vendor has
It is possible to use a method that is considered optimal in terms of the amount of calculation and the output image quality. In the following, MPEG2 Test Model 5 (IS
O / IEC JTC1 / SC29 / WG11 N040
The method described in 0) will be described.

【0018】この符号量制御のフローを図6に示すフロ
ーを用いて説明する。最初のステップS11において、
画像情報符号化部(I/P−VOP)4は、目標符号量
(ターゲットビットレート)、及び、GOP(group o
f pictures)構成を入力変数として、各ピクチャヘのビ
ット配分を行う。ここで、GOPとは、ランダムアクセ
ス可能なピクチャの組である。
The flow of this code amount control will be described with reference to the flow shown in FIG. In the first step S11,
The image information encoding unit (I / P-VOP) 4 includes a target code amount (target bit rate) and a GOP (groove).
f pictures) configuration, and allocates bits to each picture. Here, a GOP is a set of pictures that can be randomly accessed.

【0019】すなわち、ステップS11において、画像
情報符号化部(I/P−VOP)4は、GOP内の各ピ
クチャに対する割り当てビット量を、割り当て対象ピク
チャを含めGOP内でまだ復号化されていないピクチャ
に対して割り当てられるビット量(以下、これをRとす
る)を基に配分する。この配分をGOP内の符号化ピク
チャ順に繰り返す。その際、以下に述べる2つの仮定を
用いて各ピクチャヘの符号量割り当てを行う。
That is, in step S11, the image information encoding unit (I / P-VOP) 4 determines the amount of bits allocated to each picture in the GOP, including the picture to be allocated, of the picture not yet decoded in the GOP. Are allocated based on the amount of bits allocated to (hereinafter referred to as R). This distribution is repeated in the order of the coded pictures in the GOP. At this time, the code amount is assigned to each picture using the following two assumptions.

【0020】まず、第一に、各ピクチャを符号化する際
に用いる平均量子化スケールコードと発生符号量の積
は、画面が変化しない限り、ピクチャタイプ毎に一定値
となると仮定する。そこで、各ピクチャを符号化した
後、各ピクチャタイプ毎に、画面の複雑さを示す変数X
i,Xp,Xb(grobal complelxity measure)を次の式
(1)によって更新する。
First, it is assumed that the product of the average quantization scale code used when encoding each picture and the generated code amount becomes a constant value for each picture type unless the picture changes. Therefore, after encoding each picture, a variable X indicating the complexity of the screen is set for each picture type.
i, X p, updated by X b (grobal complelxity measure) the following equation (1).

【0021】[0021]

【数6】 (Equation 6)

【0022】ここでSi,Sp,Sbはピクチャ符号化時
の発生符号ビット量であり、Qi,Q p,Qbは、ピクチ
ャ符号化時の平均量子化スケールコードである。また、
初期値は、目標符号量(ターゲットビットレート)bi
t_rate[bits/sec]を用いて、式(2)
で示される値とする。
Where Si, Sp, SbIs for picture encoding
Is the amount of generated code bits, and Qi, Q p, QbIs a picture
This is an average quantization scale code at the time of key coding. Also,
The initial value is the target code amount (target bit rate) bi
Using t_rate [bits / sec], equation (2)
The value is indicated by

【0023】[0023]

【数7】 (Equation 7)

【0024】第二に、Iピクチャの量子化スケールコー
ドを基準としたP,Bピクチャの量子化スケールコード
の比率Kp,Kbが式(3)に定めた値となる場合に常に
全体の画質が最適化されると仮定する。
Second, when the ratios K p and K b of the quantized scale codes of the P and B pictures with respect to the quantized scale code of the I picture are equal to the values defined in the equation (3), the whole is always obtained. Assume that the image quality is optimized.

【0025】[0025]

【数8】 (Equation 8)

【0026】すなわち、Bピクチャの量子化スケールコ
ードは、I,Pピクチャの量子化スケールコードの常に
1.4倍としている。これは、BピクチャをI,Pピク
チャに比較して多少粗めに符号化することにより、Bピ
クチャで節約できる符号量をI,Pピクチャに加える
と、I,Pピクチャの画質が改善され、これを参照する
Bピクチャの画質も改善されることを想定している。
That is, the quantization scale code of the B picture is always 1.4 times the quantization scale code of the I and P pictures. This is because the picture quality of the I and P pictures is improved by adding the code amount that can be saved in the B picture to the I and P pictures by coding the B picture somewhat coarsely compared to the I and P pictures. It is assumed that the image quality of the B picture that refers to this is also improved.

【0027】上記2つの仮定より、GOPの各ピクチャ
に対する割り当てビット量(Ti,Tp,Tb)は式
(4)に示す値とする。
Based on the above two assumptions, the bit amount (T i , T p , T b ) allocated to each picture of the GOP is a value shown in equation (4).

【0028】[0028]

【数9】 (Equation 9)

【0029】ここでNp,NbはGOP内でまだ符号化さ
れていないP,Bピクチャの枚数である。
Here, N p and N b are the numbers of P and B pictures which have not been encoded in the GOP.

【0030】このようにして求めた割当符号量を基にし
て、各ピクチャをステップS11,S12に従って符号
化する毎に、GOP内の未符号化ピクチャに対して割り
当てられるビット量Rを式(5)で更新する。
Each time each picture is coded according to steps S11 and S12 based on the allocated code amount obtained in this manner, the bit amount R allocated to the uncoded picture in the GOP is calculated by the equation (5). ) To update.

【0031】[0031]

【数10】 (Equation 10)

【0032】また、GOPの最初のピクチャを符号化す
る際には、式(6)によりRを更新する。
When encoding the first picture of the GOP, R is updated by equation (6).

【0033】[0033]

【数11】 [Equation 11]

【0034】NはGOP内のピクチャ数である。また、
シーケンスの最初でのRの初期値は0とする。
N is the number of pictures in the GOP. Also,
The initial value of R at the beginning of the sequence is 0.

【0035】次に、ステップS12において、画像情報
符号化装置(I/P−VOP)4は、仮想バッファを用
いたレート制御を行う。すなわち、ステップS12にお
いて、画像情報符号化装置(I/P−VOP)4は、ス
テップS11で式(4)により求められた各ピクチャに
対する割当ビット量(Ti,Tp,Tb)と、実際の発生
符号量を一致させるため、各ピクチャ毎に独立に設定し
た3種類の仮想バッファの容量を基に、量子化スケール
コードを、マクロブロック単位のフィードバック制御で
求める。
Next, in step S12, the image information encoding device (I / P-VOP) 4 performs rate control using the virtual buffer. That is, in step S12, the image information encoding device (I / P-VOP) 4 allocates bits (T i , T p , T b ) for each picture obtained by equation (4) in step S11, In order to match the actual generated code amounts, the quantization scale code is obtained by macroblock-based feedback control based on the capacity of three types of virtual buffers independently set for each picture.

【0036】まず、j番目のマクロブロック符号化に先
立ち、仮想バッファの占有量を式(7)によって求め
る。
First, prior to encoding the j-th macroblock, the occupancy of the virtual buffer is determined by equation (7).

【0037】[0037]

【数12】 (Equation 12)

【0038】ここで、d0 i,d0 p,d0 bは各仮想バッフ
ァの初期占有量、Bjはピクチャの先頭からj番目のマ
クロブロックまでの発生ビット量、MB_cntは1ピ
クチャ内のマクロブロック数である。各ピクチャ符号化
終了時の仮想バッファ占有量(dMB_cnt i,dMB_cnt p
MB_cnt b)は、それぞれ同一のピクチャタイプで、次
のピクチャに対する仮想バッファ占有量の初期値
(d0 i,d0 p,d0 b)として用いられる。
Here, d 0 i , d 0 p , and d 0 b are the initial occupancy of each virtual buffer, B j is the amount of generated bits from the head of the picture to the j-th macroblock, and MB_cnt is the number of bits in one picture. This is the number of macro blocks. Virtual buffer occupancy at the end of each picture encoding (d MB_cnt i , d MB_cnt p ,
d MB_cnt b ) is used as an initial value (d 0 i , d 0 p , d 0 b ) of the virtual buffer occupancy for the next picture of the same picture type.

【0039】次に、j番目のマクロブロックに対する量
子化スケールコードを式(8)により計算する。
Next, the quantization scale code for the j-th macroblock is calculated by equation (8).

【0040】[0040]

【数13】 (Equation 13)

【0041】ここで、rはリアクションパラメーターと
呼ばれるフィードバックループの応答を制御する変数で
あり、式(9)により与えられる。
Here, r is a variable called a reaction parameter that controls the response of the feedback loop, and is given by equation (9).

【0042】[0042]

【数14】 [Equation 14]

【0043】尚、符号化開始時における仮想バッファの
初期値は式(10)で与えられる。
The initial value of the virtual buffer at the start of encoding is given by equation (10).

【0044】[0044]

【数15】 (Equation 15)

【0045】最後に、ステップS13において、画像情
報符号化装置(I/P−VOP)4は、視覚特性を考慮
したマクロブロック毎の適応量子化を行う。すなわち、
ステップS13において、画像情報符号化部(I/P−
VOP)4は、ステップS12で求められた量子化スケ
ールコードを、視覚的に劣化の目立ちやすい平坦部でよ
り細かく量子化し、劣化の比較的目立ちにくい絵柄の複
雑な部分で粗く量子化するように、各マクロブロック毎
のアクティビティと呼ばれる変数によって変化させてい
る。
Finally, in step S13, the image information encoding device (I / P-VOP) 4 performs adaptive quantization for each macroblock in consideration of visual characteristics. That is,
In step S13, the image information encoding unit (I / P-
VOP) 4 is to quantize the quantized scale code obtained in step S12 more finely in a flat portion where the deterioration is conspicuous visually and coarsely in a complicated portion of the picture where the deterioration is relatively inconspicuous. , And is changed by a variable called an activity for each macroblock.

【0046】アクティビティは、原画の輝度信号画素値
を用い、フレーム離散コサイン変換モードにおける4個
のブロックと、フィールド離散コサイン変換モードにお
ける4個のブロックとの、合計8ブロックの画素値を用
いて式(11)で与えられる。
The activity is calculated by using the pixel value of the luminance signal of the original picture and the pixel values of a total of 8 blocks of 4 blocks in the frame discrete cosine transform mode and 4 blocks in the field discrete cosine transform mode. Given by (11).

【0047】[0047]

【数16】 (Equation 16)

【0048】ここで、Pkは原画の輝度信号ブロック内
画素値である。式(11)において最小値を採るのは、
マクロブロック内の一部だけでも平坦部分のある場合に
は量子化を細かくするためである。
Here, P k is the pixel value in the luminance signal block of the original image. The minimum value in the equation (11) is
This is because the quantization is made fine when there is a flat portion even in only a part of the macro block.

【0049】更に、式(12)によりその値が0.5〜
2の範囲を取る正規化アクティビティNactjを求め
る。
Further, according to equation (12), the value is 0.5 to
A normalization activity Nact j having a range of 2 is obtained.

【0050】[0050]

【数17】 [Equation 17]

【0051】ここで、avg_actは、直前に符号化
したピクチャでのactjの平均値である。
Here, avg_act is the average value of act j in the picture coded immediately before.

【0052】視覚特性を考慮した量子化スケールコード
mquantjはステップS12で得られた量子化スケ
ールコードQjを基に式(13)で与えられる。
The quantized scale code mquant j taking into account the visual characteristics is given by equation (13) based on the quantized scale code Q j obtained in step S12.

【0053】[0053]

【数18】 (Equation 18)

【0054】MPEG2 Test Model 5にお
いて定められた上記符号量制御方式には以下の制限のあ
ることが知られており、実際の制御を行う場合には、こ
れらの制限に対する対策が必要となる。すなわち、第一
の制限は、第一ステップS11はシーンチェンジに対応
出来ず、また、シーンチェンジ後には第三ステップS1
3で用いる媒介変数avg_actが間違った値となる
ということである。第二の制限は、MPEG2及びMP
EG4において規定されているVBV(VideoBuffer Ve
rifier)の拘束条件を満たす保証がないことである。
It is known that the above-mentioned code amount control method defined in the MPEG2 Test Model 5 has the following restrictions, and when performing actual control, it is necessary to take measures against these restrictions. That is, the first limitation is that the first step S11 cannot respond to a scene change, and the third step S1
This means that the parameter avg_act used in step 3 has an incorrect value. The second limitation is that MPEG2 and MP
VBV (VideoBuffer Ve) specified in EG4
rifier) is not guaranteed.

【0055】ところで、文献”MPEG圧縮効率の理論
解析とその符号量制御への応用”(信学技報、IE−9
5, DSP95−10, 1995年5月、以下これを
文献2と呼ぶ)でも述べられている通り、Test M
odel 5で定められている符号量制御方式は、MP
EG−2画像符号化装置において、必ずしも良好な画質
を与えるものではない。
By the way, the document "Theoretical analysis of MPEG compression efficiency and its application to code amount control" (IEICE Technical Report, IE-9).
5, DSP95-10, May 1995, hereinafter referred to as Reference 2).
The code amount control method defined in model 5 is MP
The EG-2 image encoding device does not always provide good image quality.

【0056】この文献2では、特に、良好な画質を与え
るための、GOP内における各フレーム毎の最適な符号
量配分を与える手法として以下の方式を提案している。
すなわち、NI,NP,NBを、GOP内においてまだ符
号化されていないI,P,Bピクチャの枚数として、こ
れらに割り当てられる符号量をRI,RP,RBとする。
また、式(14)で与えられる固定レート条件の下に、
それぞれにおける量子化ステップサイズをQI,QP,Q
Bとし、mを、量子化ステップサイズと再生誤差分散を
関係付ける次数(すなわち、量子化ステップサイズをm
乗したものの平均値の最小化が再生誤差分散を最低にす
ると仮定する)とする。そして、式(15)を最小にす
ることを考える。
This document 2 proposes the following method as a method for giving an optimal code amount distribution for each frame in a GOP, particularly for giving a good image quality.
That is, let N I , N P , and N B be the numbers of I, P, and B pictures that have not been encoded in the GOP, and let R I , R P , and R B be the code amounts assigned to these.
Also, under the fixed rate condition given by equation (14),
Q I , Q P , Q
B, and m is an order relating the quantization step size and the reproduction error variance (that is, the quantization step size is m
It is assumed that minimizing the average value of the powers will minimize the reproduction error variance). Then, consider minimizing equation (15).

【0057】[0057]

【数19】 [Equation 19]

【0058】[0058]

【数20】 (Equation 20)

【0059】尚、それぞれのフレームにおける平均量子
化スケールQ、及び符号量Rは、Test Model
5でも用いられる媒体変数である各フレームのコンプレ
キシティXと、式(16)のように関係づけられる。
The average quantization scale Q and the code amount R in each frame are represented by Test Model.
5 is related to the complexity X of each frame, which is also a medium variable used in Expression 5, as shown in Expression (16).

【0060】[0060]

【数21】 (Equation 21)

【0061】式(16)の関係も考慮しつつ、式(1
4)の拘束条件の元に式(15)を最小にするRI
P,RBを、ラグランジェの未定乗数法を用いて算出す
ると、最適なRI,RP,RBとして以下の式のような値
が求められる。
The formula (1) is also taken into consideration while considering the relationship of the formula (16).
R I , which minimizes equation (15) under the constraint of 4)
When R P and R B are calculated using the Lagrange's undetermined multiplier method, the following values are obtained as optimal R I , R P and R B.

【0062】[0062]

【数22】 (Equation 22)

【0063】α=1として、式(17)と、MPEG2
Test Model 5で定められた符号量制御方式
における式(4)との関係は以下の通りであると言え
る。すなわち、式(17)は、符号量制御の媒介変数で
あるKp,Kbを、各フレームのコンプレキシティXI
P,XBに応じて、式(18)のように適応的に算出し
ていることに他ならない。
When α = 1, equation (17) and MPEG2
It can be said that the relationship with Expression (4) in the code amount control method defined in Test Model 5 is as follows. That is, equation (17) uses the parameters K p and K b that are the code amount control parameters as the complexity X I ,
X P, according to X B, nothing but that they are adaptively calculated as in Equation (18).

【0064】[0064]

【数23】 (Equation 23)

【0065】文献2では、1/(1+m)の値として、
0.6〜1.2程度に設定することで良好な画質が得ら
れることが示されている。
In Reference 2, as the value of 1 / (1 + m),
It is shown that good image quality can be obtained by setting the value to about 0.6 to 1.2.

【0066】[0066]

【発明が解決しようとする課題】しかしながら、図5に
示した画像情報変換装置内で、MPEG4画像情報符号
化装置(I/P−VOP)4において、MPEG2 T
est Model 5において定められたのと同様な手
法を用いて符号量制御を行った場合、シーンチェンジ等
に起因する、GOP内でのコンプレキシティの変化に対
応することが不可能である。このため、安定した符号量
制御が困難となり、画質劣化を引き起こすことが考えら
れる。また、この画像情報変換装置においては、演算処
理量が多大であるという問題が有る。
However, in the image information conversion device shown in FIG. 5, the MPEG2 T information is encoded by the MPEG4 image information encoding device (I / P-VOP) 4.
When code amount control is performed using a method similar to that defined in est Model 5, it is impossible to cope with a change in complexity within the GOP due to a scene change or the like. For this reason, stable code amount control becomes difficult, which may cause image quality degradation. In addition, this image information conversion device has a problem that the amount of calculation processing is large.

【0067】本発明は、上述の実情に鑑みて提案される
ものであって、GOP内でのコンプレキシティの変化に
対応することができ、演算処理量を低減するような画像
情報変換装置及び方法を提供することを目的とする。
The present invention has been proposed in view of the above-mentioned circumstances, and is capable of coping with a change in complexity within a GOP, and an image information conversion apparatus and a method for reducing the amount of arithmetic processing. The aim is to provide a method.

【0068】[0068]

【課題を解決するための手段】上述の課題を解決するた
めに、本発明は、第1の圧縮符号化方式で圧縮された飛
び越し走査の入力画像圧縮情報を、第2の圧縮符号化方
式で圧縮された順次走査の出力画像圧縮情報に変換する
ものであって、上記第1の圧縮符号化方式で圧縮された
入力画像圧縮情報の所定位置に含まれる量子化スケール
情報を用いて、この入力画像圧縮情報の各フレームの平
均量子化スケールの近似値を求め、この近似値及び各フ
レームに割り当てられた符号量を用いて上記フレームの
画像に対するコンプレキシティの近似値を求め、上記近
似値に基づいて出力画像圧縮情報の符号化における符号
量を制御するものである。
SUMMARY OF THE INVENTION In order to solve the above-mentioned problems, the present invention provides an interlaced scan input image compression information compressed by a first compression encoding system by a second compression encoding system. The input image compression information is converted into compressed progressively scanned output image compression information. The input image compression information is compressed by using the quantization scale information included in a predetermined position of the input image compression information compressed by the first compression encoding method. The approximate value of the average quantization scale of each frame of the image compression information is obtained, and the approximate value of the complexity of the image of the frame is obtained by using the approximate value and the code amount assigned to each frame. The code amount in the coding of the output image compression information is controlled on the basis of this.

【0069】本発明は、飛び越し走査のMPEG2画像
圧縮情報(ビットストリーム)を入力画像圧縮情報と
し、順次操作のMPEG4画像圧縮情報(ビットストリ
ーム)を出力画像圧縮情報とする。これらMPEG2画
像圧縮情報(ビットストリーム)及びMPEG4画像圧
縮情報は、画素ブロック列すなわちスライスから構成さ
れている。このスライスは、複数の画素から構成される
画素ブロックすなわちマクロブロックから構成されてい
る。
According to the present invention, MPEG2 image compression information (bit stream) of interlaced scanning is used as input image compression information, and MPEG4 image compression information (bit stream) of sequential operation is used as output image compression information. The MPEG2 image compression information (bit stream) and the MPEG4 image compression information are composed of a pixel block sequence, that is, a slice. This slice is composed of a pixel block composed of a plurality of pixels, that is, a macroblock.

【0070】本発明は、MPEG2画像圧縮情報の画像
のタイプを判別するピクチャタイプ判別部、MPEG2
画像圧縮情報の圧縮情報を解析する圧縮情報解析部及び
その構成要素であるスライスヘッダを解析するスライス
ヘッダ解析部、MPEG2画像圧縮情報を復号する画像
圧縮情報復号化部(I/Pピクチャ)、画素を間引く間
引き部、MPEG4画像圧縮情報に符号化するMPEG
4画像情報符号化部(I/P−VOP)、MPEG2画
像圧縮情報の動きベクトルを合成する動きベクトル合成
部、動きベクトルを検出する動きベクトル検出部、圧縮
情報解析部から送られた圧縮情報を格納する情報バッフ
ァ、平均量子化スケールを算出する平均量子化スケール
算出部、平均量子化スケールに基づいてコンプレキシテ
ィを算出するコンプレキシティ算出部を兼ね備える。
The present invention provides a picture type discriminating section for discriminating the type of an image of MPEG2 image compression information.
A compression information analysis unit for analyzing compression information of image compression information, a slice header analysis unit for analyzing a slice header which is a component thereof, an image compression information decoding unit (I / P picture) for decoding MPEG2 image compression information, and a pixel. Thinning unit for thinning, MPEG encoding to MPEG4 image compression information
4 image information coding unit (I / P-VOP), a motion vector synthesizing unit for synthesizing the motion vector of the MPEG2 image compression information, a motion vector detecting unit for detecting the motion vector, and the compression information sent from the compression information analyzing unit. It also has an information buffer for storing, an average quantization scale calculation unit for calculating an average quantization scale, and a complexity calculation unit for calculating complexity based on the average quantization scale.

【0071】そして、本発明は、各スライスヘッダに存
在するquantizer_scale_codeを用いて画面全体の平均量
子化スケールを近似的に算出し、これを用いて算出され
た、入力となるMPEG2画像圧縮情報(ビットストリ
ーム)における各フレームに対するコンプレキシティの
近似値を利用して、より少ない処理量により、各フレー
ムに対する符号量割当が画像に対して最適化された状態
で、順次走査のMPEG4画像圧縮情報(ビットストリ
ーム)を出力する手段を提供するものである。
The present invention uses the quantizer_scale_code present in each slice header to approximately calculate the average quantization scale of the entire screen, and calculates the input MPEG2 image compression information (bit MPEG4 image compression information (bits) of progressive scanning in a state where the code amount allocation for each frame is optimized for the image with a smaller amount of processing using the approximate value of the complexity for each frame in the stream). Stream).

【0072】上記構成のピクチャタイプ判別部において
は、入力となるMPEG2画像圧縮情報(ビットストリ
ーム)内で、I/Pピクチャに関するものだけ残してB
ピクチャに関するものは廃棄し、圧縮情報解析部におい
ては、1GOP分の遅延を実現し、また、入力となるM
PEG2画像圧縮情報(ビットストリーム)内で、各フ
レームに対して割り当てられた符号量(ビット数)を検
出するとともに、圧縮情報解析部内のスライスヘツダ解
析部においては、スライスヘッダ内のquantizer_scale_
codeの値を抽出し、MPEG2画像情報復号化部(I/
Pピクチャ)においては、ピクチャタイプ判別部の出力
となる、I/Pピクチャに関する圧縮情報(ビットスト
リーム)を、水平方向垂直方向ともに、8次の離散コサ
イン係数全てを用いた、若しくはその低域成分のみを用
いた復号処理を行い、間引き装置においては、MPEG
2画像情報復号化部(I/Pピクチャ)の出力である画
像情報の第一フィールド若しくは第二フイールドのみを
取り出して順次走査画像への変換を行うと同時に、所望
の画枠サイズに変換するためのダウンサンプリングを行
い、MPEG4画像情報符号化部(I/P−VOP)に
おいては、間引き装置の出力となる画像情報をMPEG
4符号化方式により符号化し、動きベクトル合成部にお
いては、MPEG2画像情報復号化部(I/Pピクチ
ャ)で検出された、入力となる画像圧縮情報(ビットス
トリーム)内の動きベクトル値を元に、走査変換後の画
像データに対する動きベクトル値にマッピングを行い、
動きベクトル検出部においては、動きベクトル合成部か
ら出力される動きベクトル値を元に、高精度の動きベク
トル検出を行い、情報バッファにおいては、圧縮情報解
析部において抽出された、入力となるMPEG2画像圧
縮情報(ビットストリーム)における、各フレームに割
り当てられた符号量(ビット数)を格納し、平均量子化
スケール算出部においては、スライスヘッダ解析部にお
いて抽出された各スライスに対するquantizer_scale_co
deから、各フレームに対する平均量子化スケールを近似
的に算出し、コンプレキシティ算出部においては、情報
バッファに格納された、入力となる画像圧縮情報(ビッ
トストリーム)における、各フレームに割り当てられた
符号量(ビット数)、及びコンプレキシティ算出部にお
いて近似的に計算された、各フレームに対する平均量子
化スケールから、各フレームに対するコンプレキシティ
を近似的に算出し、MPEG4画像情報符号化部(I/
P−VOP)へ、符号量制御のための媒介変数として伝
送する。
In the picture type discriminating section having the above-described structure, only the I / P picture is left in the input MPEG2 image compression information (bit stream).
Pictures related to pictures are discarded, and the compression information analyzer realizes a delay of one GOP, and outputs M
In the PEG2 image compression information (bit stream), the code amount (bit number) allocated to each frame is detected, and in the slice header analysis unit in the compression information analysis unit, quantizer_scale_ in the slice header is determined.
The value of code is extracted, and the MPEG2 image information decoding unit (I /
(P picture), the compression information (bit stream) relating to the I / P picture, which is output from the picture type discriminating unit, is obtained by using all the 8th-order discrete cosine coefficients in the horizontal and vertical directions, or a low-frequency component thereof. The decoding process using only MPEG-2 is performed.
To extract only the first field or the second field of the image information output from the two-image information decoding unit (I / P picture) and convert it to a sequentially scanned image, and at the same time to convert it to a desired image frame size Is downsampled, and the MPEG4 image information encoding unit (I / P-VOP) converts the image information to be output from the thinning device to MPEG.
In the motion vector synthesizing unit, based on the motion vector value in the input image compression information (bit stream) detected by the MPEG2 image information decoding unit (I / P picture). Perform mapping to the motion vector value for the image data after scan conversion,
The motion vector detecting section performs high-precision motion vector detection based on the motion vector value output from the motion vector synthesizing section. In the information buffer, the input MPEG2 image extracted by the compression information analyzing section. In the compression information (bit stream), the code amount (the number of bits) allocated to each frame is stored. In the average quantization scale calculation unit, the quantizer_scale_co for each slice extracted in the slice header analysis unit is stored.
From the de, the average quantization scale for each frame is approximately calculated, and the complexity calculating unit allocates the average quantization scale to each frame in the input image compression information (bit stream) stored in the information buffer. The complexity for each frame is approximately calculated from the code amount (the number of bits) and the average quantization scale for each frame approximately calculated by the complexity calculation unit, and the MPEG4 image information encoding unit ( I /
(P-VOP) as a parameter for code amount control.

【0073】[0073]

【発明の実施の形態】以下、本発明の実施の形態につい
て、図面を参照して説明する。
Embodiments of the present invention will be described below with reference to the drawings.

【0074】まず、画像情報変換装置(トランスコー
ダ)の一例について、図1を参照して説明する。
First, an example of an image information conversion device (transcoder) will be described with reference to FIG.

【0075】この画像情報変換装置は、ピクチャタイプ
判別部7と、圧縮情報解析部8と、MPEG2画像情報
復号化部(I/Pピクチャ)9と、間引き部10と、M
PEG4画像情報符号化部(I/P−VOP)11と、
動きベクトル合成部12と、動きベクトル検出部13
と、情報バッファ14と、コンプレキシティ算出部15
とから構成される。
The image information conversion apparatus includes a picture type discriminating unit 7, a compression information analyzing unit 8, an MPEG2 image information decoding unit (I / P picture) 9, a thinning unit 10,
A PEG4 image information encoding unit (I / P-VOP) 11;
Motion vector synthesis unit 12 and motion vector detection unit 13
, Information buffer 14 and complexity calculating unit 15
It is composed of

【0076】この画像情報変換装置には、フレーム内で
符号化されたイントラ符号化画像(Iピクチャ;I)、
表示順序で順方向を参照して予測符号化された順方向予
測符号化画像(Pピクチャ;P)及び表示順序で順方向
及び逆方向を参照して予測符号化された双方向予測符号
化画像(Bピクチャ;B)から構成される飛び越し走査
のMPEG2画像圧縮情報(ビットストリーム)が入力
される。
The image information conversion apparatus includes an intra-coded image (I picture; I) encoded in a frame,
A forward predictive coded image (P picture; P) predictively coded by referring to the forward direction in the display order, and a bidirectional predictive coded image predictively coded by referring to the forward and reverse directions in the display order MPEG-2 image compression information (bit stream) of interlaced scanning composed of (B picture; B) is input.

【0077】このMPEG2画像圧縮情報(ビットスト
リーム)は、ピクチャタイプ判別部7において、I/P
ピクチャに関するものか、Bピクチャに関するものであ
るかを判別され、I/Pピクチャのみ後続の圧縮情報解
析部8に出力され、Bピクチャは破棄される。
The MPEG2 image compression information (bit stream) is transmitted to the I / P
It is determined whether it is related to a picture or a B picture, and only the I / P picture is output to the subsequent compression information analyzer 8, and the B picture is discarded.

【0078】圧縮情報解析部8において、MPEG2画
像情報復号化装置(I/Pピクチャ)8における復号処
理に用いられる量子化スケールのフレーム全体に渡る平
均値Q、及び、入力となるMPEG2画像圧縮情報(ビ
ットストリーム)において、当該フレームに割り当てら
れた総符号量(ビット数)Bは、情報バッファ14に格
納される。
In the compression information analysis unit 8, the average value Q over the entire frame of the quantization scale used for the decoding processing in the MPEG2 image information decoding device (I / P picture) 8, and the MPEG2 image compression information to be input In the (bit stream), the total code amount (the number of bits) B allocated to the frame is stored in the information buffer 14.

【0079】MPEG2画像情報復号化部(I/Pピク
チャ)9における処理は通常のMPEG2画像情報復号
化装置と同様に、MPEG2画像圧縮情報(ビットスト
リーム)を画像信号に復号するものである。ここで、B
ピクチャに関するデータはピクチャタイプ判別部7にお
いて廃棄されているので、MPEG2画像情報復号化部
(I/Pピクチャ)1は、I/Pピクチャのみを復号化
出来る機能を有すればよい。
The processing in the MPEG2 image information decoding section (I / P picture) 9 decodes the MPEG2 image compression information (bit stream) into an image signal, similarly to a normal MPEG2 image information decoding device. Where B
Since data relating to pictures is discarded in the picture type discriminating unit 7, the MPEG2 image information decoding unit (I / P picture) 1 only needs to have a function capable of decoding only I / P pictures.

【0080】MPEG2画像情報復号化部(I/Pピク
チャ)9の出力となる画素値は、間引き部10に入力さ
れる。間引き部10は、水平方向には1/2の間引き処
理を施し、垂直方向には、第一フィールド若しくは第二
フィールドのどちらか一方のデータのみを残し、もう一
方を廃棄する。このような間引きによって、入力となる
画像情報の1/4の大きさを持つ順次走査画像を生成す
る。
The pixel value output from the MPEG2 image information decoding unit (I / P picture) 9 is input to the thinning unit 10. The thinning section 10 performs a 1/2 thinning process in the horizontal direction, and leaves only one of the data of the first field and the second field in the vertical direction, and discards the other. By such thinning, a progressively scanned image having a size of 4 of the input image information is generated.

【0081】ところで、間引き部10から出力された画
像をMPEG4画像情報符号化部(I/P−VOP)1
1において16×16画素で構成されるマクロブロック
単位で符号化するためには、水平方向、垂直方向とも
に、その画素数が16の倍数である必要が有る。間引き
部10においては、このための画素の補填若しくは廃棄
を、間引きと同時に行う。
By the way, the image output from the thinning section 10 is converted into an MPEG4 image information encoding section (I / P-VOP) 1
In order to perform encoding in units of macroblocks composed of 16 × 16 pixels in 1, the number of pixels must be a multiple of 16 in both the horizontal and vertical directions. In the thinning section 10, the pixels are supplemented or discarded for this purpose simultaneously with the thinning.

【0082】例えば、入力となるMPEG2画像圧縮情
報(ビットストリーム)がNTSC(National Televis
ion System Committee)の規格に準拠したもの、つまり
720×480画素、30Hzの飛び越し走査画像であ
った場合、間引き後の画枠はSIF(360×240画
素)サイズということになる。この画像に対して、間引
き部3において、例えば水平方向の右端若しくは左端の
8ラインを廃棄して352×240画素とする。
For example, if the input MPEG2 image compression information (bit stream) is NTSC (National Televis)
In the case of an image conforming to the standards of the Ion System Committee, that is, an interlaced scan image of 720 × 480 pixels and 30 Hz, the image frame after thinning out has an SIF (360 × 240 pixels) size. For this image, the thinning unit 3 discards, for example, the eight lines at the right end or the left end in the horizontal direction to obtain 352 × 240 pixels.

【0083】なお、間引き部10における動作の変更を
行うことで、これ以外の画枠、例えば上記の例で、約1
/4×1/4の画枠であるQSIF(176×112画
素)サイズの画像に変換することも可能である。
By changing the operation of the thinning section 10, other image frames, for example, about 1 in the above example, can be used.
It is also possible to convert the image into an image of QSIF (176 × 112 pixels) which is an image frame of ××.

【0084】更に、上述した文献1は、MPEG2画像
情報復号化部(I/Pピクチャ)9における処理とし
て、水平方向、垂直方向それぞれについて、入力となる
MPEG2画像圧縮情報(ビットストリーム)内の、8
次の離散コサイン変換係数すべてを用いた復号処理を行
う画像情報変換装置について述べられているが、図1に
示した装置に関してはその限りではなく、水平方向の
み、或いは水平方向、垂直方向ともに、8次の離散コサ
イン変換係数のうちの低域成分のみを用いた復号処理を
行い、画質劣化を最小限に抑えながら、復号処理に伴う
演算量とビデオメモリ容量を削減することが可能であ
る。
Further, the above-mentioned reference 1 discloses that the processing in the MPEG2 image information decoding unit (I / P picture) 9 includes, in each of the horizontal and vertical directions, the MPEG2 image compression information (bit stream) in the input. 8
An image information conversion apparatus that performs decoding processing using all of the following discrete cosine transform coefficients is described. However, the description is not limited to the apparatus illustrated in FIG. 1. Only the horizontal direction, or both the horizontal and vertical directions, By performing decoding using only low-frequency components of the eighth-order discrete cosine transform coefficients, it is possible to reduce the amount of computation and video memory capacity involved in decoding while minimizing image quality degradation.

【0085】間引き部10によって生成された順次走査
画像はMPEG4画像情報符号化部(I/P−VOP)
11によってフレーム内で符号化されたI−VOP及び
表示順序で順方向を参照して予測符号化されたP−VO
Pに符号化され、MPEG4画像圧縮情報(ビットスト
リーム)として出力される。
The progressive scan image generated by the thinning unit 10 is an MPEG4 image information encoding unit (I / P-VOP)
11 and an I-VOP coded in the frame and a P-VO coded predictively with reference to the forward direction in the display order.
P is encoded and output as MPEG4 image compression information (bit stream).

【0086】尚、VOPはVideo object Planeを意味
し、MPEG2におけるフレームに相当するものであ
る。また、I−VOPはIピクチャに対応するイントラ
符号化VOP、P−VOPはPピクチャに対応する順方
向予測符号化VOP、B−VOPはBピクチャに対応す
る双方向予測符号化VOPである。
VOP means Video Object Plane, which corresponds to a frame in MPEG2. Further, I-VOP is an intra-coded VOP corresponding to an I picture, P-VOP is a forward predictive coded VOP corresponding to a P picture, and B-VOP is a bidirectional predicted coded VOP corresponding to a B picture.

【0087】MPEG4画像情報符号化部(I/P−V
OP)11における符号化の際には、入力となるMPE
G2画像圧縮情報(ビットストリーム)中の動きベクト
ル情報は、動きベクトル合成部12において間引き後の
画像情報に対する動きベクトルにマッピングされ、動き
ベクトル検出部13においては、動きベクトル合成部1
2において合成された動きベクトル値を元に高精度の動
きベクトルを検出する。
The MPEG4 image information encoding unit (I / P-V
OP) 11, the input MPE
The motion vector information in the G2 image compression information (bit stream) is mapped to a motion vector for the decimated image information in the motion vector synthesizing unit 12, and the motion vector synthesizing unit 1 in the motion vector detecting unit 13.
2, a highly accurate motion vector is detected based on the motion vector value synthesized.

【0088】また、MPEG4画像情報符号化部(I/
P−VOP)11は、コンプレキシティ算出部15から
コンプレキシティの近似値が与えられるので、この近似
値に基づいて各VOPに対する目標符号量(ターゲット
ビット)を算出し、この目標符号量(ターゲットビッ
ト)に応じて符号化を行う。
The MPEG4 image information encoding unit (I /
The P-VOP) 11 receives an approximate value of the complexity from the complexity calculating unit 15, and calculates a target code amount (target bit) for each VOP based on the approximate value. Encoding is performed according to the target bit).

【0089】コンプレキシティ算出部15においては、
情報バッファ14に格納されたフレーム毎の情報Q及び
Bから、当該フレームに対するコンプレキシティXを式
(19)により算出する。
In the complexity calculating section 15,
From the information Q and B for each frame stored in the information buffer 14, the complexity X for the frame is calculated by equation (19).

【0090】[0090]

【数24】 (Equation 24)

【0091】式(19)によって算出された、当該フレ
ームに対するコンプレキシティXは、1GOV(group
of VOPs)分バッファリングされた後、MPEG4画像
情報符号化部(I/P−VOP)11に符号量制御のた
めの媒介変数として伝送される。このため、1GOV分
の遅延が必要となる。この遅延は図示しない遅延バッフ
ァを用いて実現される。ここで、GOVとは、ランダム
アクセス可能なVOPの組である。
The complexity X for the frame calculated by the equation (19) is 1 GOV (group
After being buffered for the amount of VOPs), it is transmitted to the MPEG4 image information encoding unit (I / P-VOP) 11 as a parameter for controlling the code amount. Therefore, a delay of 1 GOV is required. This delay is realized using a delay buffer (not shown). Here, GOV is a set of VOPs that can be randomly accessed.

【0092】以下では、式(19)において算出され
た、GOV内の各フレームに対するコンプレキシティX
が、MPEG4画像情報符号化部(I/P−VOP)1
1においてどのように用いられるかについて述べる。
尚、以下では、ピクチャタイプ判別部7がこの画像情報
変換装置内に存在せず、フレームレートの変換を行わな
い場合をも考慮することにする。
In the following, the complexity X for each frame in the GOV calculated in equation (19) will be described.
Is an MPEG4 image information encoding unit (I / P-VOP) 1
1 will be described.
In the following, a case where the picture type determination unit 7 does not exist in the image information conversion apparatus and does not perform the frame rate conversion will be considered.

【0093】式(18)によつて求められたKP,KB
意味するところは、I−VOPに対する理想的な平均量
子化スケールQi_idealに対するP−VOP/B−VO
Pに対する理想的な平均量子化スケールQp_ideal,Q
b_idealの比が、式(20)によって与えられるという
ことである。
The meaning of K P and K B obtained by the equation (18) means that P-VOP / B-VO for the ideal average quantization scale Q i_ideal for I-VOP.
Ideal average quantization scale Q p_ideal , Q for P
That is, the ratio of b_ideal is given by equation (20).

【0094】[0094]

【数25】 (Equation 25)

【0095】MPEG2 Test Model 5にお
いては、式(18)のように適応的にKp,Kbを算出す
ることを行わず、式(3)に示したような固定値を用い
ている。
The MPEG2 Test Model 5 does not adaptively calculate K p and K b as in equation (18), but uses a fixed value as shown in equation (3).

【0096】式(18)及び式(20)から、或るVO
P1と、或るVOP2に対するコンプレキシテイをそれ
ぞれX1,X2とし、理想的な量子化スケールをQ
1_ideal,Q2_idealとすれば、式(21)のようにな
る。
From equations (18) and (20), a certain VO
Let P 1 and the complexity for a certain VOP 2 be X 1 and X 2 respectively, and let the ideal quantization scale be Q
Assuming that 1_ideal and Q 2_ideal , equation (21) is obtained.

【0097】[0097]

【数26】 (Equation 26)

【0098】或いはまた、MPEG2 Test Mod
el 5のように、式(3)に示した固定値を用いたい
場合には、式(21)に代えて、式(22)のようにす
れば良い。
Alternatively, MPEG2 Test Mod
When it is desired to use the fixed value shown in the equation (3) as in el 5, the equation (22) may be used instead of the equation (21).

【0099】[0099]

【数27】 [Equation 27]

【0100】今、GOV内の未符号化されたVOPに対
して割り当てられる総符号量(ビット数)をRとし、R
が、各VOPに対して、R1,R2,…Rnといったよう
に割り当てられる時、当該GOVに対する画質が最適化
されるものとする。ここでRとR1,R2,…Rnの間に
は式(23)のような関係式が成り立つ。
Now, let R be the total code amount (the number of bits) allocated to the uncoded VOP in the GOV.
Are assigned to each VOP as R 1 , R 2 ,... R n , the image quality for the GOV is optimized. Here, a relational expression such as Expression (23) is established between R and R 1 , R 2 ,... R n .

【0101】[0101]

【数28】 [Equation 28]

【0102】或るVOPkに対する平均量子化スケール
k、割当符号量Rk、コンプレキシティXkの間には式
(24)なる関係があることにも注意して、式(23)
を変形すれば式(25)が得られる。
[0102] Some VOP average quantization scale for k Q k, assigned code amount R k, between the complexity X k Note also that there is a relation of equation (24), formula (23)
Equation (25) is obtained by transforming

【0103】[0103]

【数29】 (Equation 29)

【0104】[0104]

【数30】 [Equation 30]

【0105】式(25)において、K(X1,X2)に関
しては、式(21)に示した値を用いても、式(22)
に示した値を用いても良いが、前者の方が、画像に応じ
た、より最適な符号量配分を実現することが可能であ
る。その際、1/(1+m)の値を1.0と設定するこ
とで、指数演算を行うことが不要となり、高速な実行が
可能となる。また、1/(1+m)の値を1.0以外に
設定する場合にも、予めテーブルを持ち、これを参照し
て指数演算を行うことで高速な実行が可能となる。
In equation (25), regarding K (X 1 , X 2 ), even if the value shown in equation (21) is used, equation (22)
May be used, but the former can realize more optimal code amount distribution according to the image. At this time, by setting the value of 1 / (1 + m) to 1.0, it is not necessary to perform an exponential operation, and high-speed execution is possible. Even when the value of 1 / (1 + m) is set to a value other than 1.0, high-speed execution can be performed by holding a table in advance and performing an exponential operation with reference to the table.

【0106】式(25)における各VOPに対するコン
プレキシティXkはMPEG4画像符号化によるもので
あるが、MPEG2画像符号化による各フレームに対す
るコンプレキシティと、MPEG4画像符号化による各
フレームに対するコンプレキシティが等しいと仮定すれ
ば、コンプレキシティ算出部15に格納されたXkを用
いることで、式(25)によって当該VOPに対する目
標符号量を算出することが可能である。
The complexity X k for each VOP in the equation (25) is based on the MPEG4 image coding. The complexity for each frame based on the MPEG2 image coding and the complexity for each frame based on the MPEG4 image coding are shown. Assuming that the cities are equal, it is possible to calculate the target code amount for the VOP by using equation (25) by using X k stored in the complexity calculating unit 15.

【0107】この目標符号量の算出のフローを図2に示
す。最初のステップS21において、圧縮情報解析部8
は、MPEG2画像情報復号化部9における復号処理に
用いられるGOP内の各フレームに対する平均量子化ス
ケールQ,及び割当符号量(ビット数)Bを抽出する。
FIG. 2 shows a flow of calculating the target code amount. In the first step S21, the compression information analysis unit 8
Extracts an average quantization scale Q and an allocated code amount (number of bits) B for each frame in a GOP used for decoding processing in the MPEG2 image information decoding unit 9.

【0108】ステップS22において、コンプレキシテ
ィ算出部15は、平均量子化スケールQ及び割当符号量
(ビット数)Bの積で与えられるコンプレキシティXを
算出する。
In step S22, the complexity calculating section 15 calculates a complexity X given by the product of the average quantization scale Q and the allocated code amount (number of bits) B.

【0109】ステップS23において、MPEG4画像
符号化部(I/P−VOP)11は、コンプレキシティ
Xに応じた目標符号量(ターゲットビット)を算出す
る。
In step S23, the MPEG4 image encoding unit (I / P-VOP) 11 calculates a target code amount (target bit) according to the complexity X.

【0110】MPEG2 Test Model 5で
は、GOP内におけるI,P,Bピクチャに対するコン
プレキシティXi,Xp,Xbは一定であると仮定してい
るが実際にはシーンチェンジをGOP内に含む場合や、
GOP内で背景が著しく変化する場合等ではこの仮定が
成り立たず、安定した符号量制御の妨げとなり、画質劣
化の要因ともなる。図1に示した画像情報変換装置にお
いては、そのような場合にも、入力となるMPEG2画
像圧縮情報(ビットストリーム)における、各フレーム
に対するコンプレキシティに基づいた符号量制御を行う
ため、画質劣化を引き起こすことなく、安定した符号量
制御を行うことが可能である。
In MPEG2 Test Model 5, it is assumed that the complexities X i , X p , and X b for the I, P, and B pictures in the GOP are constant, but a scene change is actually included in the GOP. Or
This assumption does not hold when the background changes significantly in the GOP, hinders stable code amount control, and causes image quality deterioration. In the image information conversion apparatus shown in FIG. 1, even in such a case, the code amount control based on the complexity for each frame in the input MPEG2 image compression information (bit stream) is performed. , It is possible to perform stable code amount control.

【0111】次に、画像情報変換装置の他の例につい
て、図3を参照して説明する。
Next, another example of the image information conversion apparatus will be described with reference to FIG.

【0112】この画像情報変換装置は、ピクチャタイプ
判別部16と、スライスヘッダ解析部18を備える圧縮
情報解析部17と、MPEG2画像情報復号化部(I/
Pピクチャ)19と、間引き部20と、MPEG4画像
情報符号化部(I/P−VOP)21と、動きベクトル
合成部22と、動きベクトル検出部23と、情報バッフ
ァ24と、平均量子化スケール算出部25と、コンプレ
キシティ算出部26とから構成される。
This image information conversion apparatus includes a picture type discrimination section 16, a compression information analysis section 17 having a slice header analysis section 18, and an MPEG2 image information decoding section (I /
P picture) 19, a thinning-out unit 20, an MPEG4 image information encoding unit (I / P-VOP) 21, a motion vector combining unit 22, a motion vector detecting unit 23, an information buffer 24, an average quantization scale It comprises a calculation unit 25 and a complexity calculation unit 26.

【0113】図3において、圧縮情報解析部17、スラ
イスヘッダ解析部18、情報バッファ24、平均量子化
スケール算出部25、コンプレキシティ算出部26にお
ける符号量制御以外の動作については、図1に示した画
像情報変換装置と同様であるため、以下ではこれらによ
る符号量制御の動作を中心に述べることにする。
In FIG. 3, the operations other than the code amount control in the compression information analysis unit 17, slice header analysis unit 18, information buffer 24, average quantization scale calculation unit 25, and complexity calculation unit 26 are shown in FIG. Since the configuration is the same as that of the image information conversion apparatus shown, the operation of controlling the code amount by these will be mainly described below.

【0114】圧縮情報解析部17においては、ピクチャ
タイプ判別部16から入力されたI/Pピクチャのみか
らなるMPEG2画像圧縮情報(ビットストリーム)に
対して、各フレームに対して割り当てられた符号量(ビ
ット数)に関する情報Bが抽出され、この情報が情報バ
ッファ24へと伝送される。同時に、圧縮情報解析部1
7に内在するスライスヘッダ解析部18においては、入
力となるMPEG2画像圧縮情報(ビットストリーム)
において、スライスレイヤーのパーシングを行い、スラ
イスヘッダに含まれる情報であるquantizer_scale_code
を抽出し、これを平均量子化スケール算出部25に伝送
する。
In the compression information analysis unit 17, for the MPEG2 image compression information (bit stream) consisting of only the I / P pictures input from the picture type discrimination unit 16, the code amount (bit stream) allocated to each frame Information B on the number of bits is extracted, and this information is transmitted to the information buffer 24. At the same time, the compression information analyzer 1
7, the slice header analysis unit 18 receives the input MPEG2 image compression information (bit stream).
In the, the slice layer is parsed, and the quantizer_scale_code
Is extracted and transmitted to the average quantization scale calculation unit 25.

【0115】ここで、スライスとは、MPEG2画像圧
縮情報(ビットストリーム)の画像を構成するマクロブ
ロック列であり、quantizer_scale_codeは、スライスに
含まれる最初のマクロブロックの量子化スケールを示す
ものである。
Here, a slice is a macroblock sequence constituting an image of MPEG2 image compression information (bit stream), and quantizer_scale_code indicates a quantization scale of the first macroblock included in the slice.

【0116】MPEG2画像情報復号化部(I/Pピク
チャ)19における処理は通常のMPEG2画像情報復
号化装置と同様に、MPEG2画像圧縮情報(ビットス
トリーム)を画像信号に復号するものである。
The processing in the MPEG2 image information decoding section (I / P picture) 19 is for decoding the MPEG2 image compression information (bit stream) into an image signal, similarly to a normal MPEG2 image information decoding apparatus.

【0117】MPEG2画像情報復号化部(I/Pピク
チャ)19の出力となる画素値は、間引き部20に入力
される。間引き部20は、水平方向には1/2の間引き
処理を施し、垂直方向には、第一フィールド若しくは第
二フィールドのどちらか一方のデータのみを残し、もう
一方を廃棄する。このような間引きによって、入力とな
る画像情報の1/4の大きさを持つ順次走査画像を生成
する。
The pixel value output from the MPEG2 image information decoding section (I / P picture) 19 is input to the thinning section 20. The thinning unit 20 performs 1/2 thinning processing in the horizontal direction, leaves only data of one of the first field and the second field in the vertical direction, and discards the other. By such thinning, a progressively scanned image having a size of 4 of the input image information is generated.

【0118】間引き部20によって生成された順次走査
画像はMPEG4画像情報符号化部(I/P−VOP)
21によってフレーム内で符号化されたI−VOP及び
表示順序で順方向を参照して予測符号化されたP−VO
Pに符号化され、MPEG4画像圧縮情報(ビットスト
リーム)として出力される。
The progressive scan image generated by the thinning section 20 is an MPEG4 image information encoding section (I / P-VOP)
21 and an I-VOP encoded in a frame and a P-VO encoded by prediction with reference to the forward direction in the display order.
P is encoded and output as MPEG4 image compression information (bit stream).

【0119】MPEG4画像情報符号化部(I/P−V
OP)21における符号化の際には、入力となるMPE
G2画像圧縮情報(ビットストリーム)中の動きベクト
ル情報は、動きベクトル合成部22において間引き後の
画像情報に対する動きベクトルにマッピングされ、動き
ベクトル検出部23においては、動きベクトル合成部2
2において合成された動きベクトル値を元に高精度の動
きベクトルを検出する。
The MPEG4 image information encoding unit (I / P-V
OP) 21, the input MPE
The motion vector information in the G2 image compression information (bit stream) is mapped to a motion vector for the decimated image information in the motion vector synthesizing unit 22, and in the motion vector detecting unit 23,
2, a highly accurate motion vector is detected based on the motion vector value synthesized.

【0120】また、MPEG4画像情報符号化部(I/
P−VOP)21は、コンプレキシティ算出部26から
コンプレキシティの近似値が与えられるので、この近似
値に基づいて各VOPに対する目標符号量(ターゲット
ビット)を算出し、この目標符号量(ターゲットビッ
ト)に応じて符号化を行う。
Further, the MPEG4 image information encoding section (I /
The P-VOP) 21 receives an approximate value of the complexity from the complexity calculating unit 26, and calculates a target code amount (target bit) for each VOP based on the approximate value, and calculates the target code amount (target bit amount). Encoding is performed according to the target bit).

【0121】平均量子化スケール算出部25において
は、各スライスに対するquantizer_scale_codeであるq
_slicej、及び各フレームに含まれるスライスの
数Nsli ceより、各フレームに対する平均量子化スケー
ルの近似値Qestiを式(26)により算出する。
In the average quantization scale calculation unit 25, q which is the quantizer_scale_code for each slice
_Slice j, and than the number N sli ce of slices included in each frame, the approximate value Q ESTI average quantizer scale for each frame is calculated by the equation (26).

【0122】[0122]

【数31】 (Equation 31)

【0123】コンプレキシティ算出部26においては、
情報バッファ24に格納されている、各フレームに対し
て割り当てられた符号量(ビット数)に関する情報B、
及び、平均量子化スケール算出部25において、式(2
6)によって算出された、各フレームに対するQesti
用いて、各フレームに対するコンプレキシティの近似値
estiを式(27)により算出する。
In the complexity calculating section 26,
Information B on the code amount (the number of bits) allocated to each frame stored in the information buffer 24;
And, in the average quantization scale calculation unit 25, the expression (2)
Using Q esti for each frame calculated in 6), an approximate value X esti of the complexity for each frame is calculated by equation (27).

【0124】[0124]

【数32】 (Equation 32)

【0125】コンプレキシティ算出部26において、式
(27)によって算出された、1GOV内の各VOPに
対するコンプレキシティXk_estiは、MPEG4画像情
報符号化部(I/P−VOP)21に伝送され、式(2
5)におけるXkとして、各VOPに対する目標符号量
(ターゲットビット)を算出するのに用いられる。図4
に、MPEG4画像情報符号化部(I/P−VOP)1
4における、各VOPに対する目標符号量(ターゲット
ビット)算出の一連のフローを示す。
The complexity calculating section 26 calculates the complexity X k_esti for each VOP in one GOV calculated by the equation (27), and transmits the complexity X k_esti to the MPEG4 image information coding section (I / P-VOP) 21. , Equation (2)
As X k in 5), used to calculate the target code amount (target bit) for each VOP. FIG.
, An MPEG4 image information encoding unit (I / P-VOP) 1
4 shows a series of flows for calculating a target code amount (target bits) for each VOP in FIG.

【0126】最初のステップS31において、圧縮情報
解析部17は、MPEG2画像圧縮情報(ビットストリ
ーム)の構文解析を行う。ステップS32において、情
報バッファ24は、ステップS31の構文解析により明
らかになった各フレームに割り当てられた符号量(ビッ
ト数)Bを格納する。
In the first step S31, the compression information analyzer 17 analyzes the syntax of MPEG2 image compression information (bit stream). In step S32, the information buffer 24 stores the code amount (the number of bits) B assigned to each frame, which is clarified by the syntax analysis in step S31.

【0127】一方、ステップS33において、圧縮情報
解析部17に備えられるスライスヘッダ解析部18は、
MPEG2画像圧縮情報(ビットストリーム)のスライ
スヘッダにあるquantizer_scale_codeを抽出する。ステ
ップS34においては、平均量子化スケール算出部25
は、スライスヘッダ解析部18にて抽出されたquantize
r_scale_codeに基づいて、各フレームに対する平均量子
スケールの近似値Qes tiを算出する。
On the other hand, in step S33, the slice header analysis unit 18 provided in the compression information analysis unit 17
The quantizer_scale_code in the slice header of the MPEG2 image compression information (bit stream) is extracted. In step S34, the average quantization scale calculation unit 25
Is the quantize extracted by the slice header analysis unit 18.
Based on R_scale_code, to calculate the approximate value Q es ti of average quantization scale for each frame.

【0128】ステップS35においては、コンプレキシ
ティ算出部26は、情報バッファ24に格納された符号
量(ビット数)B及び算出した各フレームに対する平均
量子化スケールの近似値Qestiに基づいて、コンプレキ
シティの近似値Xestiを平均量子化スケールの近似値Q
esti及び符号量(ビット数)の近似値Bestiの積Qes ti
×Bestiとして算出する。
In step S35, the complexity calculating section 26 calculates the complexity based on the code amount (number of bits) B stored in the information buffer 24 and the calculated approximate value Q esti of the average quantization scale for each frame. The approximate value X esti of the chisity is converted to the approximate value Q of the average quantization scale.
ESTI and product Q es ti approximation B ESTI code quantity (bit number)
X Calculate as Besti .

【0129】ステップS36においては、MPEG4画
像情報符号化部(I/P−VOP)21は、コンプレキ
シティの近似値Xestiに応じた目標符号量(ターゲット
ビット)を算出する。
In step S36, the MPEG4 image information encoding unit (I / P-VOP) 21 calculates a target code amount (target bit) according to the approximate value X esti of the complexity.

【0130】この画像情報変換装置の他の例は、図1に
示した画像情報変換装置の一例の圧縮画像解析装置8に
おいて各フレームに対する量子化スケールを知るために
行ったマクロブロックレイヤーのためのパーシングの必
要がないので、演算の処理量が低減されている。
[0130] Another example of the image information conversion apparatus is a compressed image analysis apparatus 8 as an example of the image information conversion apparatus shown in FIG. Since there is no need for parsing, the amount of calculation processing is reduced.

【0131】以上、入力としてMPEG2画像圧縮情報
(ビットストリーム)を、出力としてMPEG4画像圧
縮情報(ビットストリーム)を対象としてきたが、入
力、出力ともこれに限らず、例えばMPEG−1やH.
263などの画像圧縮情報(ビットストリーム)でも良
い。
As described above, the MPEG2 image compression information (bit stream) has been used as the input, and the MPEG4 image compression information (bit stream) has been used as the output. However, the input and output are not limited to this.
H.263 or other image compression information (bit stream).

【0132】[0132]

【発明の効果】以上述べてきた様に、本発明は、飛び越
し走査のMPEG2画像圧縮情報(ビットストリーム)
を入力とし、入力となるMPEG2画像圧縮情報(ビッ
トストリーム)内における各フレームにおいて、スライ
スヘッダに含まれる情報であるquantizer_scale_codeを
用いてフレーム全体に対する平均量子化スケールを近似
的に算出し、この平均量子化スケールの近似値を用いて
算出される、入力となるMPEG2画像圧縮情報(ビッ
トストリーム)における各フレームに対するコンプレキ
シティの近似値を利用することで、より少ない処理量で
各VOPに対する符号量割当を画像に対して最適化し、
順次走査のMPEG4画像圧縮情報(ビットストリー
ム)に変換して出力する手段を提供するものである。
As described above, the present invention provides MPEG2 image compression information (bit stream) for interlaced scanning.
Is input, and in each frame in the input MPEG2 image compression information (bit stream), an average quantization scale for the entire frame is approximately calculated using quantizer_scale_code which is information included in a slice header. Code amount allocation for each VOP with a smaller processing amount by using the approximate value of the complexity of each frame in the input MPEG2 image compression information (bit stream) calculated using the approximate value of the quantization scale Is optimized for the image,
It provides a means for converting into progressively scanned MPEG4 image compression information (bit stream) and outputting it.

【図面の簡単な説明】[Brief description of the drawings]

【図1】画像情報処理装置の一例の構成を示すブロック
図である。
FIG. 1 is a block diagram illustrating a configuration of an example of an image information processing apparatus.

【図2】コンプレキシティXを用いて符号量制御を行う
フローチャートである。
FIG. 2 is a flowchart for performing code amount control using a complexity X;

【図3】画像情報処理装置の他の例の構成を示すブロッ
ク図である。
FIG. 3 is a block diagram illustrating a configuration of another example of the image information processing apparatus.

【図4】VOPに対する目標符号量(ターゲットビッ
ト)算出を示すフローチャートである。
FIG. 4 is a flowchart showing calculation of a target code amount (target bit) for a VOP.

【図5】従来の画像情報変換装置の構成を示すブロック
図である。
FIG. 5 is a block diagram showing a configuration of a conventional image information conversion device.

【図6】符号量制御方式の動作原理を示すフローチャー
トである。
FIG. 6 is a flowchart showing the operation principle of the code amount control method.

【符号の説明】[Explanation of symbols]

7 ピクチャタイプ判別部、8 圧縮情報解析部、9
MPEG2画像情報復号化部(I/Pピクチャ)、10
間引き部、11 MPEG4画像情報符号化部(I/
P−VOP)、12 動きベクトル合成部、13 動き
ベクトル検出部
7 picture type discriminator, 8 compression information analyzer, 9
MPEG2 image information decoding unit (I / P picture), 10
Thinning unit, 11 MPEG4 image information encoding unit (I /
P-VOP), 12 motion vector synthesizer, 13 motion vector detector

───────────────────────────────────────────────────── フロントページの続き (72)発明者 鈴木 輝彦 東京都品川区北品川6丁目7番35号 ソニ ー株式会社内 (72)発明者 矢ケ崎 陽一 東京都品川区北品川6丁目7番35号 ソニ ー株式会社内 Fターム(参考) 5C059 KK41 LB05 LB07 MA00 MA03 MA05 MA13 MA23 MB01 MC11 NN01 PP05 PP06 PP07 RC14 RC28 SS10 TA60 TB05 TB18 TC04 TC06 TC10 TC18 TD03 TD16 UA02 UA34 5J064 AA02 BB01 BB13 BC14 BC21 BC25 BD01  ──────────────────────────────────────────────────続 き Continued on the front page (72) Inventor Teruhiko Suzuki 6-7-35 Kita-Shinagawa, Shinagawa-ku, Tokyo Inside Sony Corporation (72) Inventor Yoichi Yagasaki 6-35, Kita-Shinagawa, Shinagawa-ku, Tokyo Sony Corporation F term (reference) 5C059 KK41 LB05 LB07 MA00 MA03 MA05 MA13 MA23 MB01 MC11 NN01 PP05 PP06 PP07 RC14 RC28 SS10 TA60 TB05 TB18 TC04 TC06 TC10 TC18 TD03 TD16 UA02 UA34 5J064 AA02 BB01 BC25

Claims (15)

【特許請求の範囲】[Claims] 【請求項1】 第1の圧縮符号化方式で圧縮された飛び
越し走査の入力画像圧縮情報を、第2の圧縮符号化方式
で圧縮された順次走査の出力画像圧縮情報に変換する画
像情報変換装置において、 上記第1の圧縮符号化方式で圧縮された入力画像圧縮情
報の所定位置に含まれる量子化スケール情報を用いて、
この入力画像圧縮情報の各フレームの平均量子化スケー
ルの近似値を求め、この近似値及び各フレームに割り当
てられた符号量を用いて上記フレームの画像に対するコ
ンプレキシティの近似値を求め、この近似値に基づいて
出力画像圧縮情報の符号化における符号量を制御する符
号量制御手段を有することを特徴とする画像情報変換装
置。
An image information conversion apparatus for converting input image compression information of interlaced scanning compressed by a first compression encoding method into output image compression information of progressive scanning compressed by a second compression encoding method. In the above, using the quantization scale information included in a predetermined position of the input image compression information compressed by the first compression encoding method,
The approximate value of the average quantization scale of each frame of the input image compression information is obtained, and the approximate value of the complexity of the image of the frame is obtained using the approximate value and the code amount allocated to each frame. An image information conversion device comprising code amount control means for controlling a code amount in encoding of output image compression information based on a value.
【請求項2】 上記入力画像圧縮情報を解析して、少な
くとも上記入力画像圧縮情報の各フレームごとに割り当
てられた符号量を抽出する圧縮情報解析手段と、この符
号量を格納すると共に所定期間遅延させる情報バッファ
とを備えることを特徴とする請求項1記載の画像情報変
換装置。
2. A compression information analyzing means for analyzing the input image compression information and extracting at least a code amount allocated to each frame of the input image compression information, and storing the code amount and delaying for a predetermined period. 2. The image information conversion device according to claim 1, further comprising an information buffer for causing the image information to be converted.
【請求項3】 上記入力画像圧縮情報及び上記出力画像
圧縮情報はフレームを構成する画素ブロックを単位とし
て構成されたものであって、上記所定位置は画素ブロッ
ク列のヘッダであり、上記圧縮情報解析手段は上記画素
ブロック列のヘッダを抽出するヘッダ抽出手段を備える
ことを特徴とする請求項2記載の画像情報変換装置。
3. The input image compression information and the output image compression information are configured in units of pixel blocks constituting a frame, the predetermined position is a header of a pixel block sequence, and the compression information analysis is performed. 3. The image information conversion apparatus according to claim 2, wherein said means comprises a header extracting means for extracting a header of said pixel block sequence.
【請求項4】 各画素ブロック列の量子化スケール情報
及びフレームに含まれる画素ブロックの数に基づいて、
各フレームに対する平均量子化スケールの近似値を次の
式により算出することを特徴とする請求項1記載の画像
情報変換装置。 【数1】 ただし、各フレームに対する平均量子化スケールの近似
値をQestiと、第j画素ブロック列の量子化スケールを
q_slicejと、各フレームに含まれる画素ブロックの数を
sliceとする。
4. Based on quantization scale information of each pixel block column and the number of pixel blocks included in a frame,
2. The image information conversion apparatus according to claim 1, wherein an approximate value of the average quantization scale for each frame is calculated by the following equation. (Equation 1) Here, the approximate value of the average quantization scale for each frame is Q esti, and the quantization scale of the j-th pixel block sequence is
Let q_slice j and the number of pixel blocks included in each frame be N slice .
【請求項5】 上記入力画像圧縮情報の各フレームに対
するコンプレキシティの近似値を次の式により算出する
ことを特徴とする請求項4記載の画像情報変換装置。 【数2】 ただし、各フレームに対するコンプレキシティの近似値
をXestiと、各フレームに対する平均量子化スケールの
近似値をQestiと、各フレームに対する割当符号量をB
とする。
5. The image information conversion apparatus according to claim 4, wherein an approximate value of the complexity of each frame of the input image compression information is calculated by the following equation. (Equation 2) Here, the approximate value of the complexity for each frame is X esti , the approximate value of the average quantization scale for each frame is Q esti, and the allocated code amount for each frame is B
And
【請求項6】 上記第1の圧縮符号化方式はMPEG
2、上記第2の圧縮符号化方式はMPEG4であり、上
記出力画像圧縮情報の画像に相当するVOP1,…VO
nで構成されるランダムアクセス可能な単位GOVに
おけるVOP1に対する目標符号量R1を次の式により与
えることを特徴とする請求項5記載の画像情報変換装
置。 【数3】 ただし、上記出力画像圧縮情報のGOVで未符号化され
た画像全体に割り当てられる符号量をRと、VOP1
VOP2,…VOPnに対するコンプレキシティの近似値
をX1_esti,X2_exti,…Xn_estiと、コンプレキシテ
ィXk及びXlを変数とする関数をK(Xk,Xl)とす
る。
6. The first compression encoding method is MPEG.
2. The second compression encoding method is MPEG4, and VOP 1 ,... VO corresponding to the image of the output image compression information
Picture information converting apparatus according to claim 5, wherein the target code amount R 1, characterized in that given by the following expression for VOP 1 in the random accessible unit GOV composed of P n. (Equation 3) Here, the code amount assigned to the entire image that has not been encoded by the GOV of the output image compression information is R, VOP 1 ,
VOP 2, ... complexity of the approximate value X 1_Esti for VOP n, X 2_exti, ... to the X n_esti, the function whose variable is the complexity X k and X l K (X k, X l) and.
【請求項7】 上記関数を次の式により与えることを特
徴とする請求項6記載の画像情報変換装置。 【数4】
7. The image information conversion apparatus according to claim 6, wherein said function is given by the following equation. (Equation 4)
【請求項8】 上記関数の指数1/(1+m)の値を
0.6〜1.2とすることを特徴とする請求項7記載の
画像情報変換装置。
8. The image information conversion device according to claim 7, wherein the value of the exponent 1 / (1 + m) of the function is 0.6 to 1.2.
【請求項9】 上記関数の指数1/(1+m)の値を
1.0とすることを特徴とする請求項7記載の画像情報
変換装置。
9. The image information conversion apparatus according to claim 7, wherein a value of an exponent 1 / (1 + m) of said function is set to 1.0.
【請求項10】 上記関数の演算は、予め準備したテー
ブルを参照して行うことを特徴とする請求項7記載の画
像情報変換装置。
10. The image information conversion apparatus according to claim 7, wherein the operation of the function is performed by referring to a table prepared in advance.
【請求項11】 上記関数を次の式により与えることを
特徴とする請求項6記載の画像情報変換装置。 【数5】 ただし、Kp=1.0,Kb=1.4とする。
11. The image information conversion apparatus according to claim 6, wherein said function is given by the following equation. (Equation 5) Note that Kp = 1.0 and Kb = 1.4.
【請求項12】 上記入力画像圧縮情報を復号化する復
号化手段と、この復号化手段で復号化された画像情報を
間引きによりレート変換するレート変換手段とを備え、
上記レート変換手段はフレーム内で符号化されたイント
ラ符号化画像及び表示順序で順方向を参照して予測符号
化された順方向予測符号化画像を通過させるが表示順序
で順方向及び逆方向を参照して予測符号化された双方向
予測符号化画像を破棄することを特徴とする請求項1記
載の画像情報変換装置。
12. Decoding means for decoding the input image compression information, and rate conversion means for performing a rate conversion by thinning out the image information decoded by the decoding means,
The rate conversion means passes the forward coded image predicted and coded with reference to the forward direction in the intra coded image coded in the frame and the display order in the display order. 2. The image information conversion apparatus according to claim 1, wherein the bidirectionally predicted coded image that has been predictively coded by reference is discarded.
【請求項13】 第1の圧縮符号化方式で圧縮された飛
び越し走査の入力画像圧縮情報を、第2の圧縮符号化方
式で圧縮された順次走査の出力画像圧縮情報に変換する
画像情報変換方法において、 上記第1の圧縮符号化方式で圧縮された入力画像圧縮情
報の所定位置に含まれる量子化スケール情報を用いて、
この入力画像圧縮情報の各フレームの平均量子化スケー
ルの近似値を求めるステップと、 この近似値及び各フレームに割り当てられた符号量を用
いて上記フレームの画像に対するコンプレキシティの近
似値を求めるステップと、 上記近似値に基づいて出力画像圧縮情報の符号化におけ
る符号量を制御するステップとを有することを特徴とす
る画像情報変換方法。
13. An image information conversion method for converting input image compression information of interlaced scanning compressed by a first compression encoding method into output image compression information of progressive scanning compressed by a second compression encoding method. In the above, using the quantization scale information included in a predetermined position of the input image compression information compressed by the first compression encoding method,
Obtaining an approximate value of the average quantization scale of each frame of the input image compression information; and obtaining an approximate value of the complexity of the image of the frame using the approximate value and the code amount allocated to each frame. And controlling a code amount in coding of the output image compression information based on the approximate value.
【請求項14】 上記入力画像圧縮情報を解析して、少
なくとも上記入力画像圧縮情報の各フレームごとに割り
当てられた符号量を抽出するステップと、上記符号量を
上記情報バッファに格納すると共に所定期間遅延させる
ことにより、上記入力画像圧縮情報を遅延させるステッ
プとを有することを特徴とする請求項13記載の画像情
報変換方法。
14. A step of analyzing the input image compression information to extract at least a code amount assigned to each frame of the input image compression information, storing the code amount in the information buffer, and extracting the code amount for a predetermined period. 14. The method according to claim 13, further comprising the step of delaying the input image compression information by delaying.
【請求項15】 上記入力画像圧縮情報及び上記出力画
像圧縮情報はフレームを構成する画素ブロックを単位と
して構成されたものであって、上記所定位置は画素ブロ
ック列のヘッダであり、上記画素ブロック列のヘッダを
抽出するステップを有することを特徴とする請求項14
記載の画像情報変換方法。
15. The input image compression information and the output image compression information are configured in units of pixel blocks constituting a frame, wherein the predetermined position is a header of a pixel block sequence, and the pixel block sequence is 15. The method according to claim 14, further comprising the step of:
The described image information conversion method.
JP2000155399A 2000-05-25 2000-05-25 Image information conversion apparatus and method for same Withdrawn JP2001339720A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000155399A JP2001339720A (en) 2000-05-25 2000-05-25 Image information conversion apparatus and method for same

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000155399A JP2001339720A (en) 2000-05-25 2000-05-25 Image information conversion apparatus and method for same

Publications (1)

Publication Number Publication Date
JP2001339720A true JP2001339720A (en) 2001-12-07

Family

ID=18660348

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000155399A Withdrawn JP2001339720A (en) 2000-05-25 2000-05-25 Image information conversion apparatus and method for same

Country Status (1)

Country Link
JP (1) JP2001339720A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100797396B1 (en) 2005-12-08 2008-01-28 한국전자통신연구원 Method and device for controlling transcoding bit-rate using complexity of macroblock

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100797396B1 (en) 2005-12-08 2008-01-28 한국전자통신연구원 Method and device for controlling transcoding bit-rate using complexity of macroblock

Similar Documents

Publication Publication Date Title
JP4517495B2 (en) Image information conversion apparatus, image information conversion method, encoding apparatus, and encoding method
US11115671B2 (en) System and method for video coding
KR100954609B1 (en) Method and device for indicating quantizer parameters in a video coding system
US5815601A (en) Image encoder and image decoder
MXPA04011439A (en) Video transcoder.
US11166025B2 (en) Encoder, decoder, encoding method, and decoding method
JPH07264580A (en) Method for transmitting video signal and video signal transmitter and receiver
JP2002152759A (en) Image information converter and image information conversion method
JP2001145113A (en) Device and method for image information conversion
EP1575294A1 (en) Method and apparatus for improving the average image refresh rate in a compressed video bitstream
US11457215B2 (en) Encoder, decoder, encoding method, and decoding method
JP2000236547A (en) Image information converter and image information conversion method
JP4517453B2 (en) Image information converting apparatus and method, and encoding apparatus and method
JP4517475B2 (en) Image information converting apparatus and method, and encoding apparatus and method
US6040875A (en) Method to compensate for a fade in a digital video input sequence
JP2002125227A (en) Image information converter and image information converting method
JP4608801B2 (en) Image information conversion apparatus and method
KR100366382B1 (en) Apparatus and method for coding moving picture
JP4517465B2 (en) Image information converting apparatus and method, and encoding apparatus and method
JP2001346214A (en) Image information transform device and method
JP4517468B2 (en) Image information converting apparatus and method, and encoding apparatus and method
JP2001339720A (en) Image information conversion apparatus and method for same
US20070031050A1 (en) Method and apparatus for bit rate control for image encoding
US7012959B2 (en) Picture information conversion method and apparatus
JPH07107464A (en) Picture encoding device and decoding device

Legal Events

Date Code Title Description
A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20070807