JP2002027465A - Image information converting device and method - Google Patents

Image information converting device and method

Info

Publication number
JP2002027465A
JP2002027465A JP2000208932A JP2000208932A JP2002027465A JP 2002027465 A JP2002027465 A JP 2002027465A JP 2000208932 A JP2000208932 A JP 2000208932A JP 2000208932 A JP2000208932 A JP 2000208932A JP 2002027465 A JP2002027465 A JP 2002027465A
Authority
JP
Japan
Prior art keywords
image
information
pseudo
code amount
compression information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2000208932A
Other languages
Japanese (ja)
Other versions
JP4517468B2 (en
Inventor
Kazufumi Sato
数史 佐藤
Takefumi Nagumo
武文 名雲
Kuniaki Takahashi
邦明 高橋
Teruhiko Suzuki
輝彦 鈴木
Yoichi Yagasaki
陽一 矢ケ崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2000208932A priority Critical patent/JP4517468B2/en
Publication of JP2002027465A publication Critical patent/JP2002027465A/en
Application granted granted Critical
Publication of JP4517468B2 publication Critical patent/JP4517468B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

PROBLEM TO BE SOLVED: To suppress fluctuations in a reference quantization scale. SOLUTION: The device for converting MPEG2 image compression information (bit stream) of interlaced scanning to MPEG4 compression information (bit stream) of progressive scanning includes a pseudo slice complexity calculation part 25 for calculating a pseudo slice complexity a VOP complexity calculation part 24 for calculating a VOP complexity, a calculation part 26 for calculating a target code quantity of VOP, and a calculation part 27 for calculating a target code quantity of pseudo slice. An MPEG4 image information encoder (I/P-VOP) 20 controls a code quantity according to the target code quantity at the time of encoding image information into MPEG4 image compression information (bit stream).

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、画像情報を変換す
る画像情報変換装置及び方法に関し、詳しくは、離散コ
サイン変換等の直交変換と動き補償によって圧縮された
MPEG等の画像情報(ビットストリーム)を衛星放
送、ケーブルTV、インターネット等のネットワークメ
ディアを介して受信する際に、若しくは光、磁気ディス
クのような記憶メディア上で処理する際に用いられる画
像情報を変換する画像情報変換装置及び方法に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an image information conversion apparatus and method for converting image information, and more particularly, to image information (bit stream) such as MPEG compressed by orthogonal transform such as discrete cosine transform and motion compensation. And a method for converting image information used when receiving an image via a network medium such as satellite broadcasting, cable TV, or the Internet, or when processing the same on a storage medium such as an optical disk or a magnetic disk. .

【0002】[0002]

【従来の技術】近年、画像情報をディジタルとして取り
扱い、効率の高い情報の伝送、蓄積を目的とし、画像情
報特有の冗長性を利用して、離散コサイン変換等の直交
変換と動き補償により圧縮するMPEGなどの画像情報
圧縮方式が提供されている。そして、このような画像情
報圧縮方法に準拠した装置は、放送局などの情報配信、
及び一般家庭における情報受信の双方において普及しつ
つある。
2. Description of the Related Art In recent years, image information is handled as digital data, and for the purpose of transmitting and storing information with high efficiency, compression is performed by orthogonal transform such as discrete cosine transform and motion compensation using redundancy inherent in image information. An image information compression system such as MPEG is provided. Then, an apparatus conforming to such an image information compression method is used for information distribution of a broadcasting station or the like,
It is becoming widespread in both information reception in general households.

【0003】特に、MPEG2(ISO/IEC 13
818−2)は、飛び越し走査画像及び順次走査画像の
双方、並びに標準解像度画像及び高精細画像を網羅す
る、汎用画像符号化方式として定義されている。
In particular, MPEG2 (ISO / IEC 13
818-2) is defined as a general-purpose image encoding method that covers both interlaced scan images and progressive scan images, as well as standard resolution images and high definition images.

【0004】すなわち、MPEG2符号化圧縮方式によ
れば、例えば、720×480画素を持つ標準解像度の
飛び越し走査画像に4〜8Mbpsの符号量(ビットレ
ート)を割り当て、1920×1088画素を持つ高解
像度の飛び越し走査画像に対して18〜22Mbpsの
符号量(ビットレート)を割り当てることにより、高い
圧縮率と良好な画質の実現が可能となる。
That is, according to the MPEG2 encoding and compression system, for example, a code amount (bit rate) of 4 to 8 Mbps is assigned to a standard resolution interlaced scan image having 720 × 480 pixels, and a high resolution having 1920 × 1088 pixels is assigned. By assigning a code amount (bit rate) of 18 to 22 Mbps to the interlaced scan image, a high compression rate and good image quality can be realized.

【0005】このようなことから、MPEG2は、プロ
フェッショナル用途及びコンシューマー用途の広範なア
プリケーションに今後とも用いられるものと予想され
る。しかし、MPEG2は、主として放送用に適合する
高画質符号化を対象としており、例えばMPEG1より
低い符号量(ビットレート)、つまりより高い圧縮率の
符号化方式には対応していなかった。
[0005] For these reasons, it is expected that MPEG2 will be used in a wide range of applications for professional use and consumer use. However, MPEG2 is mainly intended for high-quality coding suitable for broadcasting, and does not support, for example, a coding amount (bit rate) lower than that of MPEG1, that is, a coding method with a higher compression rate.

【0006】一方で、近年の携帯端末の普及により、今
後とも高い圧縮率の符号化方式のニーズは高まると思わ
れ、これに対応して、高い圧縮率を有するMPEG4符
号化方式の標準化が行われている。この画像符号化方式
に関しては、1998年12月にISO/IEC 14
496−2として国際標準の規格が承認された。
[0006] On the other hand, with the spread of portable terminals in recent years, it is expected that the need for an encoding system with a high compression ratio will increase in the future, and in response to this, standardization of the MPEG4 encoding system with a high compression ratio has been carried out. Have been done. Regarding this image coding method, ISO / IEC 14
International standard was approved as 496-2.

【0007】ところで、ディジタル放送用に一度符号化
されたMPEG2画像圧縮情報(ビットストリーム)
を、携帯端末上等で処理するのにより適した、より低い
符号量(ビットレート)の画像圧縮情報(ビットストリ
ーム)に変換したいというニーズがある。
By the way, MPEG2 image compression information (bit stream) once encoded for digital broadcasting
There is a need to convert image compression information (bit stream) having a lower code amount (bit rate), which is more suitable for processing on a mobile terminal or the like.

【0008】かかる目的を達成するために、“Field-to
-Frame Transcoding with Spatial and Temporal
Downsampling”(Susie L Wee, John G. Aposto
lopoulos, and Nick Feamster, ICIP 99、以下こ
れを文献1と呼ぶ)において画像情報変換装置(トラン
スコーダ)が提供されている。
In order to achieve such an object, “Field-to
-Frame Transcoding with Spatial and Temporal
 Downsampling ”(Susie L Wee, John G. Aposto
lopoulos, and Nick Feamster, ICIP 99, below
This is referred to as Document 1).
Scoder) is provided.

【0009】この文献1において提供された画像情報変
換装置(トランスコーダ)は、図6に示すように、ピク
チャタイプ判別部1と、MPEG2画像情報復号化部
(I/Pピクチャ)2と、間引き部3と、MPEG4画
像情報符号化部(I/P−VOP)4と、動きベクトル
合成部5と、動きベクトル検出部6とから構成されてい
る。
As shown in FIG. 6, an image information conversion device (transcoder) provided in Document 1 includes a picture type discriminating unit 1, an MPEG2 image information decoding unit (I / P picture) 2, and a thinning-out unit. It comprises a unit 3, an MPEG4 image information encoding unit (I / P-VOP) 4, a motion vector synthesizing unit 5, and a motion vector detecting unit 6.

【0010】この画像情報変換装置には、フレーム内で
符号化されたイントラ符号化画像(Iピクチャ;I)、
表示順序で順方向を参照して予測符号化された順方向予
測符号化画像(Pピクチャ;P)及び表示順序で順方向
及び逆方向を参照して予測符号化された双方向予測符号
化画像(Bピクチャ;B)から構成される飛び越し走査
のMPEG2画像圧縮情報(ビットストリーム)が入力
される。
[0010] The image information conversion apparatus includes an intra-coded image (I picture; I) encoded in a frame,
A forward predictive coded image (P picture; P) predictively coded by referring to the forward direction in the display order, and a bidirectional predictive coded image predictively coded by referring to the forward and reverse directions in the display order MPEG-2 image compression information (bit stream) of interlaced scanning composed of (B picture; B) is input.

【0011】このMPEG2画像圧縮情報(ビットスト
リーム)は、ピクチャタイプ判別部1において、I/P
ピクチャに関するものか、Bピクチャに関するものであ
るかを判別され、I/Pピクチャのみ後続のMPEG2
画像情報復号化部(I/Pピクチャ)2に出力され、B
ピクチャは破棄される。
[0011] The MPEG2 image compression information (bit stream) is supplied to an I / P
It is determined whether the picture is related to a picture or a B picture.
Output to the image information decoding unit (I / P picture) 2
The picture is discarded.

【0012】MPEG2画像情報復号化部(I/Pピク
チャ)2における処理は通常のMPEG2画像情報復号
化装置と同様に、MPEG2画像圧縮情報(ビットスト
リーム)を画像信号に復号するものである。
The processing in the MPEG2 image information decoding section (I / P picture) 2 is to decode the MPEG2 image compression information (bit stream) into an image signal, as in a normal MPEG2 image information decoding device.

【0013】MPEG2画像情報復号化部(I/Pピク
チャ)2の出力となる画素値は、間引き部3に入力され
る。間引き部3は、水平方向には1/2の間引き処理を
施し、垂直方向には、第一フィールド若しくは第二フィ
ールドのどちらか一方のデータのみを残し、もう一方を
廃棄する。このような間引きによって、入力となる画像
情報の1/4の大きさを持つ順次走査画像を生成する。
A pixel value output from the MPEG2 image information decoding unit (I / P picture) 2 is input to a thinning unit 3. The thinning section 3 performs a 1/2 thinning process in the horizontal direction, and leaves only one of the data of the first field and the second field in the vertical direction, and discards the other. By such thinning, a progressively scanned image having a size of 4 of the input image information is generated.

【0014】間引き部3によって生成された順次走査画
像はMPEG4画像情報符号化部(I/P−VOP)4
によってフレーム内で符号化されたI−VOP及び表示
順序で順方向を参照して予測符号化されたP−VOPに
符号化され、MPEG4画像圧縮情報(ビットストリー
ム)として出力される。尚、VOPはVideo objectPla
neを意味し、MPEG2におけるフレームに相当するも
のである。
The progressively scanned image generated by the thinning section 3 is converted to an MPEG4 image information encoding section (I / P-VOP) 4
Is encoded into an I-VOP encoded in the frame and a P-VOP predicted and encoded with reference to the forward direction in the display order, and output as MPEG4 image compression information (bit stream). VOP is Video objectPla
ne, which corresponds to a frame in MPEG2.

【0015】その際、入力となるMPEG2画像圧縮情
報(ビットストリーム)中の動きベクトル情報は、動き
ベクトル合成部5において間引き後の画像情報に対する
動きベクトルにマッピングされ、動きベクトル検出部6
においては、動きベクトル合成部5において合成された
動きベクトル値を元に高精度の動きベクトルを検出す
る。
At this time, the motion vector information in the input MPEG2 image compression information (bit stream) is mapped to a motion vector for the decimated image information in the motion vector synthesizing unit 5 and the motion vector detecting unit 6
In, a highly accurate motion vector is detected based on the motion vector value synthesized by the motion vector synthesizing unit 5.

【0016】文献1は、入力となるMPEG2画像圧縮
情報(ビットストリーム)の1/2×1/2の大きさを
持つ順次走査画像のMPEG4画像圧縮情報(ビットス
トリーム)を生成する画像情報変換装置に関して記述し
ている。すなわち、例えば入力となるMPEG2画圧縮
情報(ビットストリーム)がNTSC(National Tele
vision System Committee)の規格に準拠したもので
あった場合、出力となるMPEG4画像圧縮情報はSI
Fサイズ(352×240画素)ということになる。
Reference 1 discloses an image information conversion apparatus for generating MPEG4 image compression information (bit stream) of a progressively scanned image having a size of 1/2 × 1/2 of the input MPEG 2 image compression information (bit stream). Is described. That is, for example, the input MPEG2 image compression information (bit stream) is transmitted by NTSC (National Television).
vision system committee), the output MPEG4 image compression information is SI
It means F size (352 × 240 pixels).

【0017】ところで、図6に示した画像情報変換装置
においては、MPEG4画像情報符号化部(I/P−V
OP)4における符号量制御が、出力となるMPEG4
画像圧縮情報(ビットストリーム)における画質を決定
する大きな要因となる。ISO/IEC 14496−
2においては、符号量制御の方式に関しては特に規定さ
れておらず、各ベンダが、アプリケーションに応じて、
演算量及び出力画質の観点から最適と考えられる方式を
用いることが出来る。以下では、代表的な符号量制御方
式として、MPEG2 Test Model 5(I
SO/IECJTC1/SC29/WG11 N040
0)で述べられている方式について述べる。
In the image information conversion apparatus shown in FIG. 6, an MPEG4 image information encoding unit (I / P-V
OP) 4 is to control the amount of code to output MPEG4
This is a major factor in determining the image quality of the image compression information (bit stream). ISO / IEC 14496-
In No. 2, the code amount control method is not specified, and each vendor has
It is possible to use a method that is considered optimal in terms of the amount of calculation and the output image quality. In the following, a typical code amount control method is MPEG2 Test Model 5 (I
SO / IECJTC1 / SC29 / WG11 N040
The method described in 0) will be described.

【0018】この符号量制御のフローを図7に示すフロ
ーを用いて説明する。最初のステップS11において、
画像情報符号化部(I/P−VOP)4は、目標符号量
(ターゲットビットレート)、及び、GOP(group
of pictures)構成を入力変数として、各ピクチャへの
ビット配分を行う。ここで、GOPとは、ランダムアク
セス可能なピクチャの組である。
The flow of this code amount control will be described with reference to the flow shown in FIG. In the first step S11,
The image information encoding unit (I / P-VOP) 4 includes a target code amount (target bit rate) and a GOP (group).
of pictures) configuration is used as an input variable, and bits are allocated to each picture. Here, a GOP is a set of pictures that can be randomly accessed.

【0019】すなわち、ステップS11において、画像
情報符号化部(I/P−VOP)4は、GOP内の各ピ
クチャに対する割り当てビット量を、割り当て対象ピク
チャを含めGOP内でまだ復号化されていないピクチャ
に対して割り当てられるビット量(以下、これをRとす
る)を基に配分する。この配分をGOP内の符号化ピク
チャ順に繰り返す。その際、以下に述べる2つの仮定を
用いて各ピクチャへの符号量割り当てを行う。
That is, in step S11, the image information encoding unit (I / P-VOP) 4 determines the amount of bits allocated to each picture in the GOP, including the picture to be allocated, of the picture not yet decoded in the GOP. Are allocated based on the amount of bits allocated to (hereinafter referred to as R). This distribution is repeated in the order of the coded pictures in the GOP. At this time, the code amount is assigned to each picture using the following two assumptions.

【0020】まず、第一に、各ピクチャを符号化する際
に用いる平均量子化スケールコードと発生符号量の積
は、画面が変化しない限り、ピクチャタイプ毎に一定値
となると仮定する。そこで、各ピクチャを符号化した
後、各ピクチャタイプ毎に、画面の複雑さを示す変数X
i,Xp,Xb(grobal complelxity measure)を次の
式(1)によって更新する。
First, it is assumed that the product of the average quantization scale code used when encoding each picture and the generated code amount becomes a constant value for each picture type unless the picture changes. Therefore, after encoding each picture, a variable X indicating the complexity of the screen is set for each picture type.
i, X p, updated by X b (grobal complelxity measure) the following equation (1).

【0021】[0021]

【数4】 (Equation 4)

【0022】ここでSi,Sp,Sbはピクチャ符号化時
の発生符号ビット量であり、Qi,Q p,Qbは、ピクチ
ャ符号化時の平均量子化スケールコードである。また、
初期値は、目標符号量(ターゲットビットレート)bi
t_rate[bits/sec]を用いて、式(2)
で示される値とする。
Where Si, Sp, SbIs for picture encoding
Is the amount of generated code bits, and Qi, Q p, QbIs a picture
This is an average quantization scale code at the time of key coding. Also,
The initial value is the target code amount (target bit rate) bi
Using t_rate [bits / sec], equation (2)
The value is indicated by

【0023】[0023]

【数5】 (Equation 5)

【0024】第二に、Iピクチャの量子化スケールコー
ドを基準としたP,Bピクチャの量子化スケールコード
の比率Kp,Kbが式(3)に定めた値となる場合に常に
全体の画質が最適化されると仮定する。
Second, when the ratios K p and K b of the quantized scale codes of the P and B pictures with respect to the quantized scale code of the I picture are equal to the values defined in the equation (3), the whole is always obtained. Assume that the image quality is optimized.

【0025】[0025]

【数6】 (Equation 6)

【0026】すなわち、Bピクチャの量子化スケールコ
ードは、I,Pピクチャの量子化スケールコードの常に
1.4倍としている。これは、BピクチャをI,Pピク
チャに比較して多少粗めに符号化することにより、Bピ
クチャで節約できる符号量をI,Pピクチャに加える
と、I,Pピクチャの画質が改善され、これを参照する
Bピクチャの画質も改善されることを想定している。
That is, the quantization scale code of the B picture is always 1.4 times the quantization scale code of the I and P pictures. This is because the picture quality of the I and P pictures is improved by adding the code amount that can be saved in the B picture to the I and P pictures by coding the B picture somewhat coarsely compared to the I and P pictures. It is assumed that the image quality of the B picture that refers to this is also improved.

【0027】上記2つの仮定より、GOPの各ピクチャ
に対する割り当てビット量(Ti,Tp,Tb)は式
(4)に示す値とする。
Based on the above two assumptions, the bit amount (T i , T p , T b ) allocated to each picture of the GOP is a value shown in equation (4).

【0028】[0028]

【数7】 (Equation 7)

【0029】ここでNp,NbはGOP内でまだ符号化さ
れていないP,Bピクチャの枚数である。
Here, N p and N b are the numbers of P and B pictures which have not been encoded in the GOP.

【0030】このようにして求めた割当符号量を基にし
て、各ピクチャをステップS11,S12に従って符号
化する毎に、GOP内の未符号化ピクチャに対して割り
当てられるビット量Rを式(5)で更新する。
Each time each picture is coded according to steps S11 and S12 based on the allocated code amount obtained in this manner, the bit amount R allocated to the uncoded picture in the GOP is calculated by the equation (5). ) To update.

【0031】[0031]

【数8】 (Equation 8)

【0032】また、GOPの最初のピクチャを符号化す
る際には、式(6)によりRを更新する。
When encoding the first picture of the GOP, R is updated by equation (6).

【0033】[0033]

【数9】 (Equation 9)

【0034】NはGOP内のピクチャ数である。また、
シーケンスの最初でのRの初期値は0とする。
N is the number of pictures in the GOP. Also,
The initial value of R at the beginning of the sequence is 0.

【0035】次に、ステップS12において、画像情報
符号化装置(I/P−VOP)4は、仮想バッファを用
いたレート制御を行う。すなわち、ステップS12にお
いて、画像情報符号化装置(I/P−VOP)4は、ス
テップS11で式(4)により求められた各ピクチャに
対する割当ビット量(Ti,Tp,Tb)と、実際の発生
符号量を一致させるため、各ピクチャ毎に独立に設定し
た3種類の仮想バッファの容量を基に、量子化スケール
コードを、マクロブロック単位のフィードバック制御で
求める。
Next, in step S12, the image information encoding device (I / P-VOP) 4 performs rate control using the virtual buffer. That is, in step S12, the image information encoding device (I / P-VOP) 4 allocates bits (T i , T p , T b ) for each picture obtained by equation (4) in step S11, In order to match the actual generated code amounts, the quantization scale code is obtained by macroblock-based feedback control based on the capacity of three types of virtual buffers independently set for each picture.

【0036】まず、j番目のマクロブロック符号化に先
立ち、仮想バッファの占有量を式(7)によって求め
る。
First, prior to encoding the j-th macroblock, the occupancy of the virtual buffer is determined by equation (7).

【0037】[0037]

【数10】 (Equation 10)

【0038】ここで、d0 i,d0 p,d0 bは各仮想バッフ
ァの初期占有量、Bjはピクチャの先頭からj番目のマ
クロブロックまでの発生ビット量、MB_cntは1ピ
クチャ内のマクロブロック数である。各ピクチャ符号化
終了時の仮想バッファ占有量(dMB_cnt i,dMB_cnt p
MB_cnt b)は、それぞれ同一のピクチャタイプで、次
のピクチャに対する仮想バッファ占有量の初期値
(d0 i,d0 p,d0 b)として用いられる。
Here, d 0 i , d 0 p , and d 0 b are the initial occupancy of each virtual buffer, B j is the amount of generated bits from the head of the picture to the j-th macroblock, and MB_cnt is the number of bits in one picture. This is the number of macro blocks. Virtual buffer occupancy at the end of each picture encoding (d MB_cnt i , d MB_cnt p ,
d MB_cnt b ) is used as an initial value (d 0 i , d 0 p , d 0 b ) of the virtual buffer occupancy for the next picture of the same picture type.

【0039】次に、j番目のマクロブロックに対する量
子化スケールコードを式(8)により計算する。
Next, the quantization scale code for the j-th macroblock is calculated by equation (8).

【0040】[0040]

【数11】 [Equation 11]

【0041】ここで、rはリアクションパラメーターと
呼ばれるフィードバックループの応答を制御する変数で
あり、式(9)により与えられる。
Here, r is a variable called a reaction parameter that controls the response of the feedback loop, and is given by equation (9).

【0042】[0042]

【数12】 (Equation 12)

【0043】尚、符号化開始時における仮想バッファの
初期値は式(10)で与えられる。
The initial value of the virtual buffer at the start of encoding is given by equation (10).

【0044】[0044]

【数13】 (Equation 13)

【0045】最後に、ステップS13において、画像情
報符号化装置(I/P−VOP)4は、視覚特性を考慮
したマクロブロック毎の適応量子化を行う。すなわち、
ステップS13において、画像情報符号化部(I/P−
VOP)4は、ステップS12で求められた量子化スケ
ールコードを、視覚的に劣化の目立ちやすい平坦部でよ
り細かく量子化し、劣化の比較的目立ちにくい絵柄の複
雑な部分で粗く量子化するように、各マクロブロック毎
のアクティビティと呼ばれる変数によって変化させてい
る。
Finally, in step S13, the image information encoding device (I / P-VOP) 4 performs adaptive quantization for each macroblock in consideration of visual characteristics. That is,
In step S13, the image information encoding unit (I / P-
VOP) 4 is to quantize the quantized scale code obtained in step S12 more finely in a flat portion where the deterioration is visually conspicuous, and coarsely quantize the complicated portion of the pattern in which the deterioration is relatively inconspicuous. , And is changed by a variable called an activity for each macroblock.

【0046】アクティビティは、原画の輝度信号画素値
を用い、フレーム離散コサイン変換モードにおける4個
のブロックと、フィールド離散コサイン変換モードにお
ける4個のブロックとの、合計8ブロックの画素値を用
いて式(11)で与えられる。
The activity is calculated by using the pixel value of the luminance signal of the original picture and the pixel values of a total of 8 blocks of 4 blocks in the frame discrete cosine transform mode and 4 blocks in the field discrete cosine transform mode. Given by (11).

【0047】[0047]

【数14】 [Equation 14]

【0048】ここで、Pkは原画の輝度信号ブロック内
画素値である。式(11)において最小値を採るのは、
マクロブロック内の一部だけでも平坦部分のある場合に
は量子化を細かくするためである。
Here, P k is the pixel value in the luminance signal block of the original image. The minimum value in the equation (11) is
This is because the quantization is made fine when there is a flat portion even in only a part of the macro block.

【0049】更に、式(12)によりその値が0.5〜
2の範囲を取る正規化アクティビティNactjを求め
る。
Further, according to equation (12), the value is 0.5 to
A normalization activity Nact j having a range of 2 is obtained.

【0050】[0050]

【数15】 (Equation 15)

【0051】ここで、avg_actは、直前に符号化
したピクチャでのactjの平均値である。
Here, avg_act is the average value of act j in the picture coded immediately before.

【0052】視覚特性を考慮した量子化スケールコード
mquantjはステップS12で得られた量子化スケ
ールコードQjを基に式(13)で与えられる。
The quantized scale code mquant j taking into account the visual characteristics is given by equation (13) based on the quantized scale code Q j obtained in step S12.

【0053】[0053]

【数16】 (Equation 16)

【0054】MPEG2 Test Model 5に
おいて定められた上記符号量制御方式には以下の制限の
あることが知られており、実際の制御を行う場合には、
これらの制限に対する対策が必要となる。すなわち、第
一の制限は、第一ステップS11はシーンチェンジに対
応出来ず、また、シーンチェンジ後には第三ステップS
13で用いる媒介変数avg_actが間違った値とな
るということである。第二の制限は、MPEG2及びM
PEG4において規定されているVBV(Video Buffe
r Verifier)の拘束条件を満たす保証がないことであ
る。
It is known that the above-mentioned code amount control method defined in the MPEG2 Test Model 5 has the following restrictions. When actual control is performed,
Countermeasures against these restrictions are required. That is, the first limitation is that the first step S11 cannot respond to a scene change, and the third step S11 after the scene change.
This means that the parameter avg_act used in step 13 has an incorrect value. The second limitation is that MPEG2 and M
VBV (Video Buffe specified in PEG4)
r Verifier) is not guaranteed.

【0055】ところで、文献”MPEG圧縮効率の理論
解析とその符号量制御への応用”(信学技報、IE−9
5, DSP95−10, 1995年5月、以下これ
を文献2と呼ぶ)でも述べられている通り、Test
Model 5で定められている符号量制御方式は、M
PEG−2画像符号化装置において、必ずしも良好な画
質を与えるものではない。
By the way, the document "Theoretical analysis of MPEG compression efficiency and its application to code amount control" (IEICE Technical Report, IE-9).
5, DSP95-10, May 1995, hereinafter referred to as Reference 2).
The code amount control method defined in Model 5 is M
In a PEG-2 image encoding device, good image quality is not always provided.

【0056】この文献2では、特に、良好な画質を与え
るための、GOP内における各フレーム毎の最適な符号
量配分を与える手法として以下の方式を提案している。
すなわち、NI,NP,NBを、GOP内においてまだ符
号化されていないI,P,Bピクチャの枚数として、こ
れらに割り当てられる符号量をRI,RP,RBとする。
また、式(14)で与えられる固定レート条件の下に、
それぞれにおける量子化ステップサイズをQI,QP,Q
Bとし、mを、量子化ステップサイズと再生誤差分散を
関係付ける次数(すなわち、量子化ステップサイズをm
乗したものの平均値の最小化が再生誤差分散を最低にす
ると仮定する)とする。そして、式(15)を最小にす
ることを考える。
This document 2 proposes the following method as a method for giving an optimal code amount distribution for each frame in a GOP, particularly for giving a good image quality.
That is, let N I , N P , and N B be the numbers of I, P, and B pictures that have not been encoded in the GOP, and let R I , R P , and R B be the code amounts assigned to these.
Also, under the fixed rate condition given by equation (14),
Q I , Q P , Q
B, and m is an order relating the quantization step size and the reproduction error variance (that is, the quantization step size is m
It is assumed that minimizing the average value of the powers will minimize the reproduction error variance). Then, consider minimizing equation (15).

【0057】[0057]

【数17】 [Equation 17]

【0058】[0058]

【数18】 (Equation 18)

【0059】尚、それぞれのフレームにおける平均量子
化スケールQ、及び符号量Rは、Test Model
5でも用いられる媒体変数である各フレームのコンプ
レキシティXと、式(16)のように関係づけられる。
The average quantization scale Q and the code amount R in each frame are represented by Test Model.
5 is related to the complexity X of each frame, which is also a medium variable used in Expression 5, as shown in Expression (16).

【0060】[0060]

【数19】 [Equation 19]

【0061】式(16)の関係も考慮しつつ、式(1
4)の拘束条件の元に式(15)を最小にするRI
P,RBを、ラグランジェの未定乗数法を用いて算出す
ると、最適なRI,RP,RBとして以下の式のような値
が求められる。
The formula (1) is also taken into consideration while considering the relationship of the formula (16).
R I , which minimizes equation (15) under the constraint of 4)
When R P and R B are calculated using the Lagrange's undetermined multiplier method, the following values are obtained as optimal R I , R P and R B.

【0062】[0062]

【数20】 (Equation 20)

【0063】α=1として、式(17)と、MPEG2
Test Model 5で定められた符号量制御方
式における式(4)との関係は以下の通りであると言え
る。すなわち、式(17)は、符号量制御の媒介変数で
あるKp,Kbを、各フレームのコンプレキシティXI
P,XBに応じて、式(18)のように適応的に算出し
ていることに他ならない。
When α = 1, equation (17) and MPEG2
It can be said that the relationship with Expression (4) in the code amount control method defined in Test Model 5 is as follows. That is, equation (17) uses the parameters K p and K b that are the code amount control parameters as the complexity X I ,
X P, according to X B, nothing but that they are adaptively calculated as in Equation (18).

【0064】[0064]

【数21】 (Equation 21)

【0065】文献2では、1/(1+m)の値として、
0.6〜1.2程度に設定することで良好な画質が得ら
れることが示されている。
In Reference 2, as the value of 1 / (1 + m),
It is shown that good image quality can be obtained by setting the value to about 0.6 to 1.2.

【0066】図6に示した画像情報変換装置内で、MP
EG4画像情報符号化装置(I/P−VOP)4におい
て、MPEG2 Test Model 5において定
められたのと同様な手法を用いて符号量制御を行った場
合、シーンチェンジ等に起因する、GOP内でのコンプ
レキシティの変化に対応することが不可能であるため、
安定した符号量制御が困難となり、画質劣化を引き起こ
すことが考えられる。MPEG2画像情報復号化部(I
/Pピクチャ)2において抽出される、入力となるMP
EG2画像圧縮情報(ビットストリーム)内の情報をM
PEG4画像圧縮情報符号化部(I/P−VOP)4に
おいて利用することでこの問題を回避することが可能で
あると期待される。
In the image information conversion apparatus shown in FIG.
When the EG4 image information encoding device (I / P-VOP) 4 controls the code amount by using the same method as defined in the MPEG2 Test Model 5, the GOP in the GOP due to a scene change or the like is generated. It is impossible to respond to changes in the complexity of
It is conceivable that stable code amount control becomes difficult and image quality deteriorates. MPEG2 image information decoding unit (I
/ P picture) 2, which is an input MP extracted in
The information in the EG2 image compression information (bit stream) is represented by M
It is expected that this problem can be avoided by using it in the PEG4 image compression information encoding unit (I / P-VOP) 4.

【0067】かかる問題を解決するため、本願出願人
は、先に図8に示すような画像情報変換装置を提案し
た。
In order to solve such a problem, the present applicant has previously proposed an image information conversion apparatus as shown in FIG.

【0068】この画像情報変換装置は、ピクチャタイプ
判別部7と、圧縮情報解析部8と、MPEG2画像情報
復号化部(I/Pピクチャ)9と、間引き部10と、M
PEG4画像情報符号化部(I/P−VOP)11と、
動きベクトル合成部12と、動きベクトル検出部13
と、情報バッファ14と、コンプレキシティ算出部15
とから構成される。
This image information conversion apparatus includes a picture type discrimination section 7, a compression information analysis section 8, an MPEG2 image information decoding section (I / P picture) 9, a thinning section 10,
A PEG4 image information encoding unit (I / P-VOP) 11;
Motion vector synthesis unit 12 and motion vector detection unit 13
, Information buffer 14 and complexity calculating unit 15
It is composed of

【0069】この画像情報変換装置は、圧縮情報解析部
8、情報バッファ14、コンプレキシティ算出部15及
びMPEG4画像情報符号化部(I/P−VOP)11
における符号量制御以外の動作原理については、図6に
示した画像情報変換装置と同様であるため、以下では、
圧縮情報解析部8、情報バッファ14、コンプレキシテ
ィ算出部15における動作原理及びMPEG4画像情報
符号化部(I/P−VOP)11における符号量制御に
ついて述べることにする。
This image information conversion device includes a compression information analysis unit 8, an information buffer 14, a complexity calculation unit 15, and an MPEG4 image information encoding unit (I / P-VOP) 11.
The operation principle other than the code amount control in is the same as that of the image information conversion apparatus shown in FIG.
The operation principle of the compression information analysis unit 8, the information buffer 14, and the complexity calculation unit 15 and the code amount control of the MPEG4 image information encoding unit (I / P-VOP) 11 will be described.

【0070】圧縮情報解析部8において、復号処理に用
いられた量子化スケールのフレーム全体に渡る平均値
Q、及び、入力となるMPEG2画像圧縮情報(ビット
ストリーム)において、当該フレームに割り当てられた
総符号量(ビット数)Bは、情報バッファ14に格納さ
れる。
In the compression information analysis section 8, the average value Q of the quantization scale used in the decoding process over the entire frame, and the total MPEG2 image compression information (bit stream) assigned to the frame in the input MPEG2 image compression information (bit stream). The code amount (number of bits) B is stored in the information buffer 14.

【0071】コンプレキシティ算出部15においては、
情報バッファ14に格納されたフレーム毎の情報Q及び
Bから、当該フレームに対するコンプレキシティXを式
(19)により算出する。
In the complexity calculating section 15,
From the information Q and B for each frame stored in the information buffer 14, the complexity X for the frame is calculated by equation (19).

【0072】[0072]

【数22】 (Equation 22)

【0073】式(19)によって算出された、当該フレ
ームに対するコンプレキシティXは、1GOV(group
of VOPs)分バッファリングされた後、MPEG4画
像情報符号化部(I/P−VOP)11に符号量制御の
ための媒介変数として伝送される。このため、1GOV
分の遅延が必要となる。この遅延は図示しない遅延バッ
ファを用いて実現される。ここで、GOVとは、ランダ
ムアクセス可能なVOPの組である。
The complexity X for the frame calculated by equation (19) is 1 GOV (group
After being buffered for the amount of VOPs), it is transmitted to the MPEG4 image information encoding unit (I / P-VOP) 11 as a parameter for controlling the code amount. Therefore, 1 GOV
A minute delay is required. This delay is realized using a delay buffer (not shown). Here, GOV is a set of VOPs that can be randomly accessed.

【0074】以下では、式(19)において算出され
た、GOV内の各フレームに対するコンプレキシティX
が、MPEG4画像情報符号化部(I/P−VOP)1
1においてどのように用いられるかについて述べる。
尚、以下では、ピクチャタイプ判別部7がこの画像情報
変換装置内に存在せず、フレームレートの変換を行わな
い場合をも考慮することにする。
In the following, the complexity X for each frame in the GOV calculated in equation (19) will be described.
Is an MPEG4 image information encoding unit (I / P-VOP) 1
1 will be described.
In the following, a case where the picture type determination unit 7 does not exist in the image information conversion apparatus and does not perform the frame rate conversion will be considered.

【0075】式(18)によって求められたKP,KB
意味するところは、I−VOPに対する理想的な平均量
子化スケールQi_idealに対するP−VOP/B−VO
Pに対する理想的な平均量子化スケールQp_ideal,Q
b_idealの比が、式(20)によって与えられるという
ことである。
The meaning of K P and K B obtained by equation (18) means that P-VOP / B-VO for the ideal average quantization scale Q i_ideal for I-VOP.
Ideal average quantization scale Q p_ideal , Q for P
That is, the ratio of b_ideal is given by equation (20).

【0076】[0076]

【数23】 (Equation 23)

【0077】MPEG2 Test Model 5に
おいては、式(18)のように適応的にKp,Kbを算出
することを行わず、式(3)に示したような固定値を用
いている。
The MPEG2 Test Model 5 does not adaptively calculate K p and K b as in the equation (18), but uses a fixed value as shown in the equation (3).

【0078】式(18)及び式(20)から、或るVO
P1と、或るVOP2に対するコンプレキシティをそれ
ぞれX1,X2とし、理想的な量子化スケールをQ
1_ideal,Q2_idealとすれば、式(21)のようにな
る。
From equations (18) and (20), a certain VO
P1 and the complexity for a certain VOP2 are X 1 and X 2 , respectively, and the ideal quantization scale is Q
Assuming that 1_ideal and Q 2_ideal , equation (21) is obtained.

【0079】[0079]

【数24】 (Equation 24)

【0080】或いはまた、MPEG2 Test Mo
del 5のように、式(3)に示した固定値を用いた
い場合には、式(21)に代えて、式(22)のように
すれば良い。
Alternatively, MPEG2 Test Mo
When it is desired to use the fixed value shown in Expression (3) as in del 5, Expression (22) may be used instead of Expression (21).

【0081】[0081]

【数25】 (Equation 25)

【0082】今、GOV内の未符号化されたVOPに対
して割り当てられる総符号量(ビット数)をRとし、R
が、各VOPに対して、R1,R2,…Rnといったよう
に割り当てられる時、当該GOVに対する画質が最適化
されるものとする。ここでRとR1,R2,…Rnの間に
は式(23)のような関係式が成り立つ。
Now, let R be the total code amount (the number of bits) allocated to the uncoded VOPs in the GOV.
Are assigned to each VOP as R 1 , R 2 ,... R n , the image quality for the GOV is optimized. Here, a relational expression such as Expression (23) is established between R and R 1 , R 2 ,... R n .

【0083】[0083]

【数26】 (Equation 26)

【0084】或るVOPkに対する平均量子化スケール
k、割当符号量Rk、コンプレキシティXkの間には式
(24)なる関係があることにも注意して、式(23)
を変形すれば式(25)が得られる。
[0084] Some VOP average quantization scale for k Q k, assigned code amount R k, between the complexity X k Note also that there is a relation of equation (24), formula (23)
Equation (25) is obtained by transforming

【0085】[0085]

【数27】 [Equation 27]

【0086】[0086]

【数28】 [Equation 28]

【0087】式(25)において、K(X1,X2)に関
しては、式(21)に示した値を用いても、式(22)
に示した値を用いても良いが、前者の方が、画像に応じ
た、より最適な符号量配分を実現することが可能であ
る。その際、1/(1+m)の値を1.0と設定するこ
とで、指数演算を行うことが不要となり、高速な実行が
可能となる。また、1/(1+m)の値を1.0以外に
設定する場合にも、予めテーブルを持ち、これを参照し
て指数演算を行うことで高速な実行が可能となる。
In equation (25), regarding K (X 1 , X 2 ), even if the value shown in equation (21) is used, equation (22)
May be used, but the former can realize more optimal code amount distribution according to the image. At this time, by setting the value of 1 / (1 + m) to 1.0, it is not necessary to perform an exponential operation, and high-speed execution is possible. Even when the value of 1 / (1 + m) is set to a value other than 1.0, high-speed execution can be performed by holding a table in advance and performing an exponential operation with reference to the table.

【0088】式(25)における各VOPに対するコン
プレキシティXkはMPEG4画像符号化によるもので
あるが、MPEG2画像符号化による各フレームに対す
るコンプレキシティと、MPEG4画像符号化による各
フレームに対するコンプレキシティが等しいと仮定すれ
ば、コンプレキシティ算出部15に格納されたXkを用
いることで、式(25)によって当該VOPに対する目
標符号量を算出することが可能である。
The complexity X k for each VOP in the equation (25) is based on the MPEG4 image coding. The complexity for each frame based on the MPEG2 image coding and the complexity for each frame based on the MPEG4 image coding are shown. Assuming that the cities are equal, it is possible to calculate the target code amount for the VOP by using equation (25) by using X k stored in the complexity calculating unit 15.

【0089】この目標符号量の算出のフローを図9に示
す。最初のステップS21において、圧縮情報解析部8
は、MPEG2画像情報復号化部9における復号処理に
用いられるGOP内の各フレームに対する平均量子化ス
ケールQ,及び割当符号量(ビット数)Bを抽出する。
FIG. 9 shows a flow of calculating the target code amount. In the first step S21, the compression information analysis unit 8
Extracts an average quantization scale Q and an allocated code amount (number of bits) B for each frame in a GOP used for decoding processing in the MPEG2 image information decoding unit 9.

【0090】ステップS22において、コンプレキシテ
ィ算出部15は、平均量子化スケールQ及び割当符号量
(ビット数)Bの積で与えられるコンプレキシティXを
算出する。
In step S22, the complexity calculating section 15 calculates a complexity X given by a product of the average quantization scale Q and the allocated code amount (number of bits) B.

【0091】ステップS23において、MPEG4画像
符号化部(I/P−VOP)11は、コンプレキシティ
Xに応じた目標符号量(ターゲットビット)を算出す
る。
In step S23, the MPEG4 image encoding unit (I / P-VOP) 11 calculates a target code amount (target bit) according to the complexity X.

【0092】MPEG2 Test Model 5で
は、GOP内におけるI,P,Bピクチャに対するコン
プレキシティXi,Xp,Xbは一定であると仮定してい
るが実際にはシーンチェンジをGOP内に含む場合や、
GOP内で背景が著しく変化する場合等ではこの仮定が
成り立たず、安定した符号量制御の妨げとなり、画質劣
化の要因ともなる。図8に示した画像情報変換装置にお
いては、そのような場合にも、入力となるMPEG2画
像圧縮情報(ビットストリーム)における、各フレーム
に対するコンプレキシティに基づいた符号量制御を行う
ため、画質劣化を引き起こすことなく、安定した符号量
制御を行うことが可能である。
In MPEG2 Test Model 5, it is assumed that the complexities X i , X p , and X b for the I, P, and B pictures in the GOP are constant, but a scene change is actually included in the GOP. Or
This assumption does not hold when the background changes significantly in the GOP, hinders stable code amount control, and causes image quality deterioration. Even in such a case, the image information conversion apparatus shown in FIG. 8 performs code amount control based on the complexity of each frame in the input MPEG2 image compression information (bit stream). , It is possible to perform stable code amount control.

【0093】[0093]

【発明が解決しようとする課題】ところで、図7に示し
た符号量制御方式において、ステップS13における適
応量子化が有効に作用するためには、j番目のマクロブ
ロックに対する量子化スケールコード、つまり式(8)
におけるQJがフレーム全体に渡って均一な値を取るこ
とが望ましい。そこで、CCIR(Comite Consultant
if Internationale des Radio Communications)テ
ストシーケンスの一つである“Flower Gard
en”を、n=15;m=3の条件の元、4Mbpsに
圧縮したMPEG2画像圧縮情報(ビットストリーム)
を、図8に示した画像情報変換装置を用いて、n=5;
m=1のMPEG4画像圧縮情報(ビットストリーム)
に変換する際の、あるVOPに対するQJがどのような
値を取るかを図10に示す。
By the way, in the code amount control method shown in FIG. 7, in order for the adaptive quantization in step S13 to work effectively, the quantization scale code for the j-th macroblock, that is, the expression (8)
It is desirable that the value of Q J at the time T 1 takes a uniform value over the entire frame. Therefore, CCIR (Comite Consultant
if Internationale des Radio Communications) "Flower Gard"
MPEG2 image compression information (bit stream) compressed to 4 Mbps under the condition of n = 15; m = 3
By using the image information conversion device shown in FIG. 8, n = 5;
MPEG4 image compression information of m = 1 (bit stream)
FIG. 10 shows what value Q J for a certain VOP takes when converting to VOP.

【0094】先述の通り、理想的にはQJがVOP全体
に渡って均一な値を取ることが望ましいが、実際には、
式(7)における仮想バッファ占有量(dj i,dj p,d
j b)がマクロブロック毎に変化するため、VOP全体に
渡って均一な値とならない。
As described above, it is ideally desirable that Q J take a uniform value over the entire VOP.
Virtual buffer occupancy of the formula (7) (d j i, d j p, d
Since j b ) changes for each macroblock, it does not become a uniform value over the entire VOP.

【0095】本発明は、上述の実情に鑑みて提案される
ものであって、Qjの変動を抑制して符号量を制御する
ような画像情報変換装置及び方法を提供することを目的
とする。
The present invention has been proposed in view of the above situation, and has as its object to provide an image information conversion apparatus and method for controlling the code amount by suppressing the fluctuation of Q j. .

【0096】[0096]

【課題を解決するための手段】上述の課題を解決するた
めに、本発明は、第1の圧縮符号化方式で圧縮された飛
び越し走査の入力画像圧縮情報を、第2の圧縮符号化方
式で圧縮された順次走査の出力画像圧縮情報に変換する
ものであって、上記入力画像圧縮情報及び上記出力画像
圧縮情報を構成する符号化画像は、それぞれ複数の画素
からなる画素ブロックから構成され、上記出力画像圧縮
情報の符号化画像における画素ブロックからなる疑似画
像ブロック列に対するコンプレキシティ情報に基づい
て、上記疑似画像ブロック列に対する目標符号量を与え
て画像情報を変換するものである。
SUMMARY OF THE INVENTION In order to solve the above-mentioned problems, the present invention provides an interlaced scan input image compression information compressed by a first compression encoding system by a second compression encoding system. The input image compression information and the encoded image constituting the output image compression information are converted into compressed progressively scanned output image compression information, and each of the encoded images constituting the output image compression information is configured by a pixel block including a plurality of pixels. The image information is converted by giving a target code amount for the pseudo image block sequence based on the complexity information for the pseudo image block sequence composed of pixel blocks in the encoded image of the output image compression information.

【0097】本発明は、飛び越し走査のMPEG2画像
圧縮情報(ビットストリーム)を入力画像圧縮情報と
し、順次操作のMPEG4画像圧縮情報(ビットストリ
ーム)を出力画像圧縮情報とする。これらMPEG2画
像圧縮情報(ビットストリーム)及びMPEG4画像圧
縮情報は、複数の画素から構成される画素ブロックすな
わちマクロブロックから構成され、疑似画素ブロック列
すなわち疑似スライスを利用している。
According to the present invention, MPEG2 image compression information (bit stream) of interlaced scanning is used as input image compression information, and MPEG4 image compression information (bit stream) of sequential operation is used as output image compression information. The MPEG2 image compression information (bit stream) and the MPEG4 image compression information are composed of a pixel block composed of a plurality of pixels, that is, a macroblock, and use a pseudo pixel block sequence, that is, a pseudo slice.

【0098】また、MPEG2画像圧縮情報(ビットス
トリーム)及びMPEG4画像圧縮情報(ビットストリ
ーム)は、画像群すなわちGOP(group of picture
s)及びGOV(group of VOPs)からそれぞれ構成さ
れている。そして、画像群であるGOP及びGOVは、
複数の符号化画像すなわちピクチャ(picture)及びV
OP(video object plane)からそれぞれ構成されて
いる。
The MPEG2 image compression information (bit stream) and the MPEG4 image compression information (bit stream) include a group of pictures, that is, a GOP (group of picture).
s) and GOV (group of VOPs). GOP and GOV, which are image groups,
A plurality of coded images, ie, pictures and V
Each is composed of an OP (video object plane).

【0099】すなわち、本発明は、飛び越し走査のMP
EG2画像情報圧縮情報(ビットストリーム)を入力と
し、ピクチャタイプ判別部、圧縮情報解析部、MPEG
2画像情報復号化部(I/Pピクチャ)、間引き部、M
PEG4画像情報符号化部(I/P−VOP)、動きベ
クトル合成部、動きベクトル検出部、情報バッファ、V
OPコンプレキシテイ算出部、擬似スライスコンプレキ
シティ算出部、VOP目標符号量算出部、擬似スライス
目標符号量算出部を兼ね備え、入力となるMPEG2画
像圧縮情報(ビットストリーム)における、各スライス
に対するコンプレキシティ情報を用いて、MPEG4画
像符号化の際に擬似スライス単位の目標符号量(ターゲ
ットビット)を与えることで、符号量制御のステップ2
に伴う参照量子化スケールの変動を最小限に抑え、各マ
クロブロックに対する符号量割当が画像に対して最適化
された状態で、順次走査のMPEG4画像圧縮情報(ビ
ットストリーム)を出力する手段を提供するものであ
る。
That is, the present invention provides an interlaced scanning MP
EG2 image information compression information (bit stream) is input, picture type discrimination unit, compression information analysis unit, MPEG
2 image information decoding unit (I / P picture), thinning unit, M
PEG4 image information encoder (I / P-VOP), motion vector synthesizer, motion vector detector, information buffer, V
An OP complexity calculating unit, a pseudo slice complexity calculating unit, a VOP target code amount calculating unit, and a pseudo slice target code amount calculating unit also serve as a complex for each slice in the input MPEG2 image compression information (bit stream). By using the city information to give a target code amount (target bit) in units of pseudo slices at the time of MPEG4 image coding, step 2 of code amount control is performed.
To provide a means for outputting progressively scanned MPEG4 image compression information (bit stream) in a state where the variation of the reference quantization scale accompanying the above is minimized and the code amount allocation to each macroblock is optimized for the image. Is what you do.

【0100】上記構成において、ピクチャタイプ判別部
は、入力となるMPEG2画像圧縮情報(ビットストリ
ーム)内で、I/Pピクチャに関するものだけ残してB
ピクチャに関するものは廃棄する。圧縮情報解析部は、
1GOP分の遅延を実現すると同時に、入力となるMP
EG2画像圧縮情報(ビットストリーム)内で、各フレ
ームに対して割り当てられた符号量(ビット数)及び各
フレームにおける平均量子化スケール、並びに、各フレ
ームにおいて、後段のMPEG4画像圧縮情報でそれぞ
れの擬似スライスを構成するマクロブロック全体に渡る
平均量子化スケール及び発生符号量(ビット数)を抽出
する。MPEG2画像情報復号化部(I/Pピクチャ)
は、ピクチャタイプ判別部の出力となる、I/Pピクチ
ャに関する圧縮情報(ビットストリーム)を、水平方向
垂直方向ともに、8次の離散コサイン係数全てを用い
た、若しくはその低域成分のみを用いた復号処理を行
う。間引き部は、MPEG2画像情報復号化部(I/P
ピクチャ)の出力である画像情報の第一フィールド若し
くは第二フイールドのみを取り出して順次走査画像への
変換を行うと同時に、所望の画枠サイズに変換するため
のダウンサンプリングを行う。MPEG4画像情報符号
化部(I/P−VOP)は、間引き部の出力となる画像
情報をMPEG4符号化方式により符号化する。動きベ
クトル合成部は、MPEG2画像情報復号化部(I/P
ピクチャ)で検出された、入力となる画像圧縮情報(ビ
ットストリーム)内の動きベクトル値を元に、走査変換
後の画像データに対する動きベクトル値にマッピングを
行う。動きベクトル検出部は、動きベクトル合成部から
出力される動きベクトル値を元に、高精度の動きベクト
ル検出を行う。情報バッファは、圧縮情報解析部におい
て抽出された、入力となるMPEG2画像圧縮情報(ビ
ットストリーム)における各フレームに割り当てられた
符号量(ビット数)及び各フレームに対する平均量子化
スケール、並びに、各フレームにおいて、後段のMPE
G4画像圧縮情報でそれぞれの擬似スライスを構成する
マクロブロック全体に渡る平均量子化スケール及び発生
符号量(ビット数)を格納する。VOPコンプレキシテ
イ算出部は、情報バッファに格納された、入力となるM
PEG2画像圧縮情報(ビットストリーム)における、
各フレームに割り当てられた符号量(ビット数)、及び
各フレームに対する平均量子化スケールから、出力とな
るMPEG4画像圧縮情報(ビットストリーム)におけ
る各VOPに対するコンプレキシティの推定値を算出す
る。擬似スライスコンプレキシティ算出部においては、
情報バッファに格納された、入力となるMPEG2画像
圧縮情報(ビットストリーム)における、各擬似スライ
スに割り当てられた符号量(ビット数)、及び各擬似ス
ライスに対する平均量子化スケールから、出力となるM
PEG4画像圧縮情報(ビットストリーム)における各
擬似スライスに対するコンプレキシティの推定値を算出
する。VOP目標符号量算出部は、VOPコンプレキシ
ティ算出部において算出された、各VOPに対するコン
プレキシティに基づいて、各VOPに対する目標符号量
(ターゲットビット)の算出を行い、擬似スライス目標
符号量算出部においては、VOP目標符号量算出部にお
いて算出された各VOPに対する目標符号量(ターゲッ
トビット)、及び擬似スライスコンプレキシティ算出部
において算出された、各擬似スライスに対するコンプレ
キシティから、各擬似スライスに対する目標符号量(タ
ーゲットビット)を算出し、その情報をMPEG4画像
情報符号化装置(I/P−VOP)に伝送する。
In the above configuration, the picture type discriminating section stores only the data relating to the I / P picture in the input MPEG2 image compression information (bit stream).
Discard the pictures. The compression information analysis unit
A delay of one GOP is realized, and at the same time, the input MP
In the EG2 image compression information (bit stream), the code amount (number of bits) allocated to each frame and the average quantization scale in each frame, and in each frame, each pseudo-code is stored in the subsequent MPEG4 image compression information. The average quantization scale and the generated code amount (the number of bits) over the entire macroblock constituting the slice are extracted. MPEG2 image information decoding unit (I / P picture)
Uses the compression information (bit stream) relating to the I / P picture, which is the output of the picture type discriminator, in the horizontal and vertical directions, using all the 8th-order discrete cosine coefficients, or using only the low-frequency components thereof. Perform decryption processing. The thinning unit is an MPEG2 image information decoding unit (I / P
Only the first field or the second field of the image information, which is the output of the picture, is taken out and converted to a progressively scanned image, and at the same time, downsampling for converting to a desired image frame size is performed. The MPEG4 image information encoding unit (I / P-VOP) encodes image information to be output from the thinning unit according to the MPEG4 encoding method. The motion vector synthesizing unit includes an MPEG2 image information decoding unit (I / P
Based on the motion vector value in the input image compression information (bit stream) detected in the picture, the mapping is performed to the motion vector value for the scan-converted image data. The motion vector detection unit performs highly accurate motion vector detection based on the motion vector value output from the motion vector synthesis unit. The information buffer includes a code amount (the number of bits) allocated to each frame in the input MPEG2 image compression information (bit stream) extracted by the compression information analysis unit, an average quantization scale for each frame, and each frame. In the latter MPE
The G4 image compression information stores the average quantization scale and the generated code amount (the number of bits) over the entire macroblock constituting each pseudo slice. The VOP complexity calculator calculates the input M stored in the information buffer.
In the PEG2 image compression information (bit stream),
From the code amount (number of bits) allocated to each frame and the average quantization scale for each frame, an estimated value of the complexity for each VOP in the output MPEG4 image compression information (bit stream) is calculated. In the pseudo slice complexity calculating section,
From the code amount (number of bits) assigned to each pseudo slice and the average quantization scale for each pseudo slice in the input MPEG2 image compression information (bit stream) stored in the information buffer, the output M
An estimated value of complexity for each pseudo slice in the PEG4 image compression information (bit stream) is calculated. The VOP target code amount calculation unit calculates a target code amount (target bit) for each VOP based on the complexity for each VOP calculated by the VOP complexity calculation unit, and calculates a pseudo slice target code amount. In the unit, each pseudo slice is calculated from the target code amount (target bit) for each VOP calculated by the VOP target code amount calculation unit and the complexity for each pseudo slice calculated by the pseudo slice complexity calculation unit. Is calculated, and the information is transmitted to the MPEG4 image information encoding device (I / P-VOP).

【0101】なお、ピクチャタイプ判別部を持たず、フ
レームレートの変換を行わない装置構成も可能である。
また、VOP目標符号量算出部において、入力となるM
PEG2画像圧縮情報(ビットストリーム)における各
フレームに対するコンプレキシティを用いず、MPEG
2 Test Model 5に定められているのと同
様の方式により各VOPに対する目標符号量を算出する
装置構成も考えられる。
It is to be noted that an apparatus configuration that does not have a picture type discriminating unit and does not perform frame rate conversion is also possible.
Further, in the VOP target code amount calculation unit, the input M
Without using the complexity for each frame in the PEG2 image compression information (bit stream), MPEG
An apparatus configuration for calculating a target code amount for each VOP by a method similar to that specified in 2 Test Model 5 is also conceivable.

【0102】[0102]

【発明の実施の形態】以下、図面を参照し、本発明の実
施例について説明する。
Embodiments of the present invention will be described below with reference to the drawings.

【0103】まず、本発明を適用した第1の実施の形態
の画像情報変換装置について、図1を参照して説明す
る。
First, an image information conversion apparatus according to a first embodiment of the present invention will be described with reference to FIG.

【0104】この画像情報処理装置は、ピクチャタイプ
判別部16と、圧縮情報解析部17と、MPEG2画像
情報復号化部(I/Pピクチャ)18と、間引き部19
と、MPEG4画像情報符号化部(I/P−VOP)2
0と、動きベクトル合成部21と、動きベクトル検出部
22と、情報バッファ23と、VOPコンプレキシティ
算出部24と、擬似スライスコンプレキシティ算出部2
5と、VOP目標符号量算出部26と、擬似スライス目
標符号量算出部27とから構成される。
This image information processing apparatus includes a picture type discriminating section 16, a compression information analyzing section 17, an MPEG2 image information decoding section (I / P picture) 18, and a thinning section 19
And an MPEG4 image information encoding unit (I / P-VOP) 2
0, a motion vector synthesis unit 21, a motion vector detection unit 22, an information buffer 23, a VOP complexity calculation unit 24, and a pseudo slice complexity calculation unit 2.
5, a VOP target code amount calculation unit 26, and a pseudo slice target code amount calculation unit 27.

【0105】この画像情報変換装置には、フレーム内で
符号化されたイントラ符号化画像(Iピクチャ;I)、
表示順序で順方向を参照して予測符号化された順方向予
測符号化画像(Pピクチャ;P)及び表示順序で順方向
及び逆方向を参照して予測符号化された双方向予測符号
化画像(Bピクチャ;B)から構成される飛び越し走査
のMPEG2画像圧縮情報(ビットストリーム)が入力
される。
This image information conversion apparatus includes an intra-coded image (I picture; I) encoded in a frame,
A forward predictive coded image (P picture; P) predictively coded by referring to the forward direction in the display order, and a bidirectional predictive coded image predictively coded by referring to the forward and reverse directions in the display order MPEG-2 image compression information (bit stream) of interlaced scanning composed of (B picture; B) is input.

【0106】このMPEG2画像圧縮情報(ビットスト
リーム)は、ピクチャタイプ判別部16において、I/
Pピクチャに関するものか、Bピクチャに関するもので
あるかを判別され、I/Pピクチャのみ後続の圧縮情報
解析部17に出力され、Bピクチャは破棄される。
The MPEG2 image compression information (bit stream) is supplied to the
It is determined whether it is related to a P picture or a B picture, and only the I / P picture is output to the subsequent compression information analysis unit 17, and the B picture is discarded.

【0107】圧縮情報解析部17において、MPEG2
画像情報復号化装置(I/Pピクチャ)18における復
号処理に用いられる量子化スケールのフレーム全体に渡
る平均値Q、及び、入力となるMPEG2画像圧縮情報
(ビットストリーム)において、当該フレームに割り当
てられた総符号量(ビット数)Bは、情報バッファ23
に格納される。
In the compression information analysis unit 17, MPEG2
In the image information decoding device (I / P picture) 18, the average value Q of the quantization scale used in the decoding process over the entire frame and the MPEG2 image compression information (bit stream) to be input are assigned to the frame. The total code amount (number of bits) B is stored in the information buffer 23.
Is stored in

【0108】MPEG2画像情報復号化部(I/Pピク
チャ)18における処理は通常のMPEG2画像情報復
号化装置と同様に、MPEG2画像圧縮情報(ビットス
トリーム)を画像信号に復号するものである。ここで、
Bピクチャに関するデータはピクチャタイプ判別部16
において廃棄されているので、MPEG2画像情報復号
化部(I/Pピクチャ)18は、I/Pピクチャのみを
復号化出来る機能を有すればよい。
The processing in the MPEG2 image information decoding section (I / P picture) 18 decodes the MPEG2 image compression information (bit stream) into an image signal as in the case of a normal MPEG2 image information decoding device. here,
The data relating to the B picture is stored in the picture type
Therefore, the MPEG2 image information decoding unit (I / P picture) 18 only needs to have a function of decoding only the I / P picture.

【0109】MPEG2画像情報復号化部(I/Pピク
チャ)18の出力となる画素値は、間引き部19に入力
される。間引き部19は、水平方向には1/2の間引き
処理を施し、垂直方向には、第一フィールド若しくは第
二フィールドのどちらか一方のデータのみを残し、もう
一方を廃棄する。このような間引きによって、入力とな
る画像情報の1/4の大きさを持つ順次走査画像を生成
する。
The pixel value output from the MPEG2 image information decoding unit (I / P picture) 18 is input to the thinning unit 19. The thinning section 19 performs 1/2 thinning processing in the horizontal direction, and leaves only data of one of the first field and the second field in the vertical direction, and discards the other. By such thinning, a progressively scanned image having a size of 4 of the input image information is generated.

【0110】ところで、間引き部19から出力された画
像をMPEG4画像情報符号化部(I/P−VOP)2
0において16×16画素で構成されるマクロブロック
単位で符号化するためには、水平方向、垂直方向とも
に、その画素数が16の倍数である必要が有る。間引き
部19においては、このための画素の補填若しくは廃棄
を、間引きと同時に行う。
Incidentally, the image output from the thinning section 19 is converted to an MPEG4 image information encoding section (I / P-VOP) 2.
In order to perform coding in units of macroblocks composed of 16 × 16 pixels at 0, the number of pixels must be a multiple of 16 in both the horizontal and vertical directions. In the thinning section 19, the pixels are supplemented or discarded at the same time as the thinning.

【0111】例えば、入力となるMPEG2画像圧縮情
報(ビットストリーム)がNTSC(National Televi
sion System Committee)の規格に準拠したもの、つ
まり720×480画素、30Hzの飛び越し走査画像
であった場合、間引き後の画枠はSIF(360×24
0画素)サイズということになる。この画像に対して、
間引き部19において、例えば水平方向の右端若しくは
左端の8ラインを廃棄して352×240画素とする。
For example, if the input MPEG2 image compression information (bit stream) is NTSC (National Televi
In the case of an image conforming to the standards of the Vision System Committee, that is, a 720 × 480 pixel, 30 Hz interlaced scan image, the image frame after thinning is SIF (360 × 24
0 pixel) size. For this image,
In the thinning unit 19, for example, the eight lines at the right end or the left end in the horizontal direction are discarded to obtain 352 × 240 pixels.

【0112】なお、間引き部19における動作の変更を
行うことで、これ以外の画枠、例えば上記の例で、約1
/4×1/4の画枠であるQSIF(176×112画
素)サイズの画像に変換することも可能である。
By changing the operation of the thinning section 19, other image frames, for example, about 1 in the above example, can be obtained.
It is also possible to convert the image into an image of QSIF (176 × 112 pixels) which is an image frame of ××.

【0113】更に、上述した文献1は、MPEG2画像
情報復号化部(I/Pピクチャ)18における処理とし
て、水平方向、垂直方向それぞれについて、入力となる
MPEG2画像圧縮情報(ビットストリーム)内の、8
次の離散コサイン変換係数すべてを用いた復号処理を行
う画像情報変換装置について述べられているが、図1に
示した装置に関してはその限りではなく、水平方向の
み、或いは水平方向、垂直方向ともに、8次の離散コサ
イン変換係数のうちの低域成分のみを用いた復号処理を
行い、画質劣化を最小限に抑えながら、復号処理に伴う
演算量とビデオメモリ容量を削減することが可能であ
る。
Further, in the above-mentioned Document 1, as processing in the MPEG2 image information decoding unit (I / P picture) 18, the MPEG2 image compression information (bit stream) to be input in the horizontal direction and the vertical direction is used. 8
An image information conversion apparatus that performs decoding processing using all of the following discrete cosine transform coefficients is described. However, the description is not limited to the apparatus illustrated in FIG. 1. Only the horizontal direction, or both the horizontal and vertical directions, By performing decoding using only low-frequency components of the eighth-order discrete cosine transform coefficients, it is possible to reduce the amount of computation and video memory capacity involved in decoding while minimizing image quality degradation.

【0114】間引き部19によって生成された順次走査
画像はMPEG4画像情報符号化部(I/P−VOP)
20によってフレーム内で符号化されたI−VOP及び
表示順序で順方向を参照して予測符号化されたP−VO
Pに符号化され、MPEG4画像圧縮情報(ビットスト
リーム)として出力される。
The progressive scan image generated by the thinning unit 19 is an MPEG4 image information encoding unit (I / P-VOP)
20 and an I-VOP coded in a frame and a P-VO coded predictively with reference to the forward direction in the display order.
P is encoded and output as MPEG4 image compression information (bit stream).

【0115】尚、VOPはVideo object Planeを意味
し、MPEG2におけるフレームに相当するものであ
る。また、I−VOPはIピクチャに対応するイントラ
符号化VOP、P−VOPはPピクチャに対応する順方
向予測符号化VOP、B−VOPはBピクチャに対応す
る双方向予測符号化VOPである。
Note that VOP means Video Object Plane and corresponds to a frame in MPEG2. Further, I-VOP is an intra-coded VOP corresponding to an I picture, P-VOP is a forward predictive coded VOP corresponding to a P picture, and B-VOP is a bidirectional predicted coded VOP corresponding to a B picture.

【0116】MPEG4画像情報符号化部(I/P−V
OP)20における符号化の際には、入力となるMPE
G2画像圧縮情報(ビットストリーム)中の動きベクト
ル情報は、動きベクトル合成部21において間引き後の
画像情報に対する動きベクトルにマッピングされ、動き
ベクトル検出部22においては、動きベクトル合成部2
1において合成された動きベクトル値を元に高精度の動
きベクトルを検出する。
An MPEG4 image information encoding unit (I / P-V
OP) 20, the input MPE
The motion vector information in the G2 image compression information (bit stream) is mapped to a motion vector for the decimated image information in the motion vector synthesizing section 21, and the motion vector synthesizing section 2 in the motion vector detecting section 22.
A high-precision motion vector is detected based on the motion vector value synthesized in 1.

【0117】ここで、本実施の形態の画像情報変換装置
で用いられる、擬似スライスの概念について述べる。
Here, the concept of a pseudo slice used in the image information conversion apparatus according to the present embodiment will be described.

【0118】MPEG2画像圧縮情報(ビットストリー
ム)には、図2に示すようなスライス層が存在する。す
なわち、スライス層では、画面内で図2のように横長の
帯状の領域を示し、(図2のa,b,c…の領域)画面
を複数のスライスで構成することにより、あるスライス
層でエラーが発生しても、次のスライス層の開始(sl
ice_start_code)からの同期でエラー回
復が可能となる。スライス層は1個以上のマクロブロッ
クから構成され、ラスタスキャンオーダで、左から右、
上から下に並び、その長さや開始位置は自由で、画面毎
に変更可能である。但し、並列処理や効果的なエラー耐
性を目的として、一つのスライスは右方向にのみ伸び、
下方にまで伸びることはない。
The MPEG2 image compression information (bit stream) has a slice layer as shown in FIG. That is, in the slice layer, a horizontally long band-like area is shown in the screen as shown in FIG. 2, and the area (areas a, b, c... In FIG. 2) is composed of a plurality of slices. Even if an error occurs, the start of the next slice layer (sl
Error recovery is possible by synchronization from (ice_start_code). The slice layer is composed of one or more macroblocks, and is in raster scan order, from left to right,
They are arranged from top to bottom, and their length and start position are free and can be changed for each screen. However, for the purpose of parallel processing and effective error tolerance, one slice extends only to the right,
It does not extend down.

【0119】MPEG4画像圧縮情報(ビットストリー
ム)においては、低ビットレートにおける符号化効率を
考慮して、図2に示したようなスライス層は構文上定義
されていないが、本実施の形態においては、MPEG4
画像情報符号化部(I/P−VOP)20における符号
化処理のため、図3に示すような擬似スライスを定義す
る。すなわち、例えば、図1に示した画像情報変換装置
によって、入力となる、飛び越し走査のMPEG2画像
圧縮情報(ビットストリーム)が、1/2×1/2の画
枠を持つ順次走査のMPEG4画像圧縮情報(ビットス
トリーム)に変換される場合を考える。この時、図3の
Aにおける入力となるMPEG2画像圧縮情報(ビット
ストリーム)内の4つのマクロブロックMB0,MB1
MB2m,MB2m+1が、図3のBに示す出力となるMPE
G4画像圧縮情報(ビットストリーム)においては1つ
のマクロブロックMb0に対応することになる。この
時、図3のAにおいてマクロブロックMB0,MB1,…M
4m-1から構成される領域aに対応して、図3のBに示
す出力となるMPEG4画像圧縮情報(ビットストリー
ム)における、マクロブロックMb0,Mb1,…,Mb
m-1から構成されるマクロブロック群aを擬似スライス
0と定義する。疑似スライス1以降に関しても同様であ
る。
In the MPEG4 image compression information (bit stream), the slice layer as shown in FIG. 2 is not defined syntactically in consideration of the coding efficiency at a low bit rate, but in the present embodiment, , MPEG4
For encoding processing in the image information encoding unit (I / P-VOP) 20, a pseudo slice as shown in FIG. 3 is defined. That is, for example, the interlaced MPEG2 image compression information (bit stream), which is an input, is converted by the image information conversion apparatus shown in FIG. 1 into a progressively scanned MPEG4 image compression having a 1/2 × 1/2 picture frame. Consider a case where the information is converted into information (bit stream). At this time, four macroblocks MB 0 , MB 1 ,... In the MPEG2 image compression information (bit stream) to be input in FIG.
MPEs for which MB 2m and MB 2m + 1 are the outputs shown in FIG.
It will correspond to one macroblock Mb 0 in G4 compressed image information (bit stream). At this time, the macro blocks M B0 , M B1 ,.
Corresponding to the region formed a from B 4m-1, in the B MPEG4 image compression information to be output as shown in FIG. 3 (a bit stream), the macro block Mb 0, Mb 1, ..., Mb
A macroblock group a composed of m-1 is defined as a pseudo slice 0. The same applies to pseudo slice 1 and subsequent slices.

【0120】圧縮情報解析部17においては、入力とな
るMPEG2画像圧縮情報(ビットストリーム)内の、
各フレームに対する割当符号量(ビット数)Bk、及び
各フレームにおける平均量子化スケールQkに関する情
報を抽出し、情報バッファ23に格納する。同時に、各
フレームにおいて、出力となるMPEG4画像圧縮情報
(ビットストリーム)において擬似スライス1を構成す
るマクロブロック群に対する割当符号量(ビット数)B
pseudo_slice1,及び平均量子化スケールQpse
udo_slice1を情報バッファ23に格納する。図3のAに
おいて、nを整数として、入力となる画像圧縮情報(ビ
ットストリーム)内のあるマクロブロックMBnに対す
る発生符号量及び量子化スケールをそれぞれBMBn,Q
MBnとすれば、擬似スライス0に対して、次の式(2
6)が成り立つ。
[0120] The compression information analysis unit 17 stores the MPEG2 image compression information (bit stream) as input.
Information on the assigned code amount (number of bits) B k for each frame and information on the average quantization scale Q k in each frame are extracted and stored in the information buffer 23. At the same time, in each frame, in the MPEG4 image compression information (bit stream) to be output, the allocated code amount (number of bits) B for the macroblock group constituting the pseudo slice 1
pseudo_slice1 and average quantization scale Q pse
udo_slice1 is stored in the information buffer 23. In A of FIG. 3, where n is an integer, an input become compressed image information (bit stream) generated code amount for the macroblock MB n with the and the quantization scale of each B MBn, Q
Assuming MBn , the following expression (2)
6) holds.

【0121】[0121]

【数29】 (Equation 29)

【0122】擬似スライス1以降に関しても同様であ
る。但し、mが奇数の場合、例えば入力となる飛び越し
走査のMPEG2画像圧縮情報(ビットストリーム)の
画枠が720×480画素であった場合、その1/2×
1/2は360×240画素ということになるが、後続
のMPEG4画像情報符号化装置(I/P−VOP)2
0においてマクロブロック単位の処理を行うためには、
間引き部19において、例えば画枠に対する右4画素を
破棄して、352×240画素とする必要がある。この
場合には、式(26)に示した値をとしてB
pseudo_slice0,Qpseudo_sl ice0として用いても良い
し、次の式(27)のようにしても良い。
The same applies to pseudo slice 1 and subsequent slices. However, if m is an odd number, for example, if the image frame of the interlaced MPEG2 image compression information (bit stream) to be input is 720 × 480 pixels, 1/2 × thereof
Although 1/2 means 360 × 240 pixels, the following MPEG4 image information encoding device (I / P-VOP) 2
In order to perform processing on a macroblock basis at 0,
In the thinning unit 19, for example, it is necessary to discard the right four pixels with respect to the image frame to make 352 × 240 pixels. In this case, the value shown in equation (26) is used as B
They may be used as pseudo_slice0 and Q pseudo_slice0 , or may be expressed by the following equation (27).

【0123】[0123]

【数30】 [Equation 30]

【0124】VOPコンプレキシティ算出部24におい
ては、情報バッファ23に格納された、入力となるMP
EG2画像圧縮情報(ビットストリーム)内の、各フレ
ームに対する割当符号量(ビット数)Bk及び各フレー
ムにおける平均量子化スケールQkに関する情報から、
各VOPに対するコンプレキシティの推測値Xkを次の
式(28)のように1GOV分算出する。
In the VOP complexity calculating section 24, the input MP stored in the information buffer 23
From the information on the assigned code amount (number of bits) B k for each frame and the average quantization scale Q k for each frame in the EG2 image compression information (bit stream),
The estimated value X k of the complexity for each VOP is calculated for one GOV as in the following equation (28).

【0125】[0125]

【数31】 [Equation 31]

【0126】VOP目標符号量算出部26においては、
VOPコンプレキシテイ算出部24を用いて、式(2
5)により、各VOPに対する目標符号量(ターゲット
ビット)を算出する。以下では、式(25)によつて求
められる各VOPに対する目標符号量(式ではR1)を
vopと表す。
In the VOP target code amount calculating section 26,
Using the VOP complexity calculator 24, the equation (2)
According to 5), the target code amount (target bit) for each VOP is calculated. In the following, the target code amount (R 1 in the formula) for each VOP obtained by the formula (25) is represented as T vop .

【0127】擬似スライスコンプレキシティ算出部25
においては、情報バッファ23に格納された、出力とな
るMPEG4画像圧縮情報(ビットストリーム)におい
て擬似スライス1を構成するマクロブロック群に対する
割当符号量(ビット数)Bps eudo_slice1及び平均量子
化スケールQpseudo_slice1に関する情報から、各擬似
スライスに対するコンプレキシティX
pseudo_slice1を、次の式(29)のように算出する。
Pseudo slice complexity calculating section 25
In (2), the allocated code amount (number of bits) B ps eudo_slice1 and the average quantization scale Q pseudo_slice1 for the macroblock group forming the pseudo slice 1 in the output MPEG4 image compression information (bit stream) stored in the information buffer 23 From the information on the complexity X for each pseudo slice
Pseudo_slice1 is calculated as in the following equation (29).

【0128】[0128]

【数32】 (Equation 32)

【0129】今、当該VOPが、擬似スライス0,擬似
スライス1,…擬似スライスN−1から構成されている
とすれば、疑似スライス目標量算出部27においては、
疑似スライス1に対する目標符号量T
pseudo_slice1が、次の式(30)のように算出され、
MPEG4画像情報符号化部(I/P−VOP)20に
伝送される。
If the VOP is composed of pseudo slice 0, pseudo slice 1,... Pseudo slice N-1, the pseudo slice target amount calculation section 27
Target code amount T for pseudo slice 1
pseudo_slice1 is calculated as in the following equation (30),
It is transmitted to the MPEG4 image information encoding unit (I / P-VOP) 20.

【0130】[0130]

【数33】 [Equation 33]

【0131】I−VOP,P−VOP,B−VOPに対
するTpseudo_slice1をそれぞれTi _pseudo_slice1,T
p_pseudo_slice1,Tb_pseudo_slice1とすれば、MPE
G4画像情報符号化部(I/P−VOP)20におい
て、仮想バッファ(dj i,dj p,dj b)の占有量を、式
(27)に対応して、次の式(31)のように算出す
る。
T pseudo_slice1 for the I-VOP, P-VOP, and B-VOP is defined as T i _pseudo_slice1 , T
If p_pseudo_slice1 and T b_pseudo_slice1 , then MPE
In G4 image information encoding unit (I / P-VOP) 20 , a virtual buffer (d j i, d j p , d j b) the occupancy of, corresponding to formula (27), the following equation (31 ).

【0132】[0132]

【数34】 [Equation 34]

【0133】ここで、d0 i,d0 p,d0 bは、擬似スライ
ス先頭における各仮想バッファの占有量であり、B
pseudo_slice_jは、擬似スライス先頭からj番目のマク
ロブロックでの発生符号量である。P_SLICE_C
NTは1擬似スライスに含まれるマクロブロックの個数
で、各擬似スライス符号化終了時における仮想バッファ
の占有量(dP_SLICE_CNT i,dP_SLICE_CNT p,d
P_SLICE_CNT ib)は、次の擬似スライスに対する仮想バ
ッファの占有量の初期値(d0 i,d0 p,d0 b)として用
いられる。
Here, d 0 i , d 0 p , and d 0 b are the occupation amounts of the respective virtual buffers at the head of the pseudo slice.
pseudo_slice_j is the amount of code generated in the j-th macroblock from the head of the pseudo slice. P_SLICE_C
NT is the number of macroblocks included in one pseudo slice, and the virtual buffer occupancy at the end of each pseudo slice encoding (d P_SLICE_CNT i , d P_SLICE_CNT p , d
P_SLICE_CNT ib ) is used as an initial value (d 0 i , d 0 p , d 0 b ) of the occupation amount of the virtual buffer for the next pseudo slice.

【0134】以上のようなMPEG4画像情報符号化部
(I/P−VOP)20における一連の符号量制御の動
作原理について、図4を参照して説明する。
The operation principle of a series of code amount control in the MPEG4 image information encoding unit (I / P-VOP) 20 will be described with reference to FIG.

【0135】最初のステップS31において、圧縮情報
解析部17は、ピクチャタイプ判別部16を介して入力
されたMPEG2画像圧縮情報(ビットストリーム)の
構文を解析し、各フレームに対する割当符号量(ビット
数)Bk、及び各フレームにおける平均量子化スケール
kに関する情報を抽出し、情報バッファ23に格納す
る。同時に、各フレームにおいて、出力となるMPEG
4画像圧縮情報(ビットストリーム)において疑似スラ
イス1を構成するマクロブロック群に対する割当符号量
(ビット数)Bpseudo_slice1、及び平均量子化スケー
ルQpseudo_slic e1を情報バッファ23に格納する。
In the first step S31, the compression information analysis unit 17 analyzes the syntax of the MPEG2 image compression information (bit stream) input via the picture type discrimination unit 16, and assigns the code amount (number of bits) to each frame. ) Extract information about B k and the average quantization scale Q k in each frame, and store them in the information buffer 23. At the same time, in each frame, the output MPEG
4 stores the assigned code amount for macroblocks constituting the pseudo slice 1 in the image compression information (bit stream) (number of bits) B pseudo_slice1, and an average quantization scale Q pseudo_slic e1 information buffer 23.

【0136】ステップS32において、VOPコンプレ
キシティ算出部24は、情報バッファ23に格納され
た、入力となるMPEG2画像圧縮情報(ビットストリ
ーム)内の、各フレームに対する割当符号量(ビット
数)Bk、及び各フレームにおける平均量子化スケール
kに関する情報から、各VOPに対するコンプレキシ
ティの推測値Xkを1GOV分算出する。
In step S 32, the VOP complexity calculating section 24 allocates the code amount (number of bits) B k for each frame in the input MPEG2 image compression information (bit stream) stored in the information buffer 23. , And information on the average quantization scale Q k in each frame, an estimated value X k of the complexity for each VOP is calculated for one GOV.

【0137】ステップS33において、VOP目標符号
量算出部26は、各VOPに対する目標符号量(ターゲ
ットビット)を算出する。
In step S33, the VOP target code amount calculator 26 calculates a target code amount (target bit) for each VOP.

【0138】ステップS34において、疑似スライスコ
ンプレキシティ算出部25は、情報バッファ23に格納
された、出力となるMPEG4画像圧縮情報(ビットス
トリーム)において疑似スライス1を構成するマクロブ
ロック群に対する割当符号量(ビット数)B
pseudo_slice1、及び平均量子化スケールQ
pseudo_slice1に関する情報から、各疑似スライスに対
するコンプレキシティXpseudo_slice1を算出する。
In step S34, the pseudo slice complexity calculating section 25 allocates the code amount to the macroblock group constituting the pseudo slice 1 in the output MPEG4 image compression information (bit stream) stored in the information buffer 23. (Number of bits) B
pseudo_slice1 and average quantization scale Q
From the information on pseudo_slice1 , the complexity X pseudo_slice1 for each pseudo slice is calculated.

【0139】ステップS35において、疑似スライス目
標符号量算出部27は、各疑似スライスに対応する目標
符号量(ターゲットビット)を算出し、MPEG4画像
情報符号化部(I/P−VOP)20に伝送する。
In step S35, the pseudo slice target code amount calculation unit 27 calculates a target code amount (target bit) corresponding to each pseudo slice, and transmits the target code amount to the MPEG4 image information encoding unit (I / P-VOP) 20. I do.

【0140】ステップS36において、MPEG4画像
情報符号化部(I/P−VOP)20は、仮想バッファ
を用いたレート制御を行う。ステップS37において、
MPEG4画像情報符号化部(I/P−VOP)20
は、視角特性を考慮したマクロブロックごとの適応量子
化を行う。
In step S36, the MPEG4 image information encoding unit (I / P-VOP) 20 performs rate control using a virtual buffer. In step S37,
MPEG4 image information encoding unit (I / P-VOP) 20
Performs adaptive quantization for each macroblock in consideration of viewing angle characteristics.

【0141】次に、本発明を適用した第2の実施の形態
の画像情報変換装置について、図5を参照して説明す
る。
Next, an image information conversion apparatus according to a second embodiment of the present invention will be described with reference to FIG.

【0142】この画像情報装置は、ピクチャタイプ判別
部28と、圧縮情報解析部29と、MPEG2画像情報
復号化部(I/Pピクチャ)30と、間引き部31と、
MPEG4画像情報符号化部(I/P−VOP)32
と、動きベクトル合成部33と、動きベクトル検出部3
4と、情報バッファ35と、擬似スライスコンプレキシ
ティ算出部36と、VOP目標符号量算出部37と、擬
似スライス目標符号量算出部38とから構成される。
This image information apparatus includes a picture type discrimination section 28, a compression information analysis section 29, an MPEG2 image information decoding section (I / P picture) 30, a thinning section 31,
MPEG4 image information encoding unit (I / P-VOP) 32
, A motion vector synthesizing unit 33 and a motion vector detecting unit 3
4, an information buffer 35, a pseudo slice complexity calculating unit 36, a VOP target code amount calculating unit 37, and a pseudo slice target code amount calculating unit 38.

【0143】図1に示した画像情報変換装置と図5に示
した画像情報変換装置における相違点は、図1に示した
画像情報変換装置においては、MPEG4画像情報符号
化部(I/P−VOP)20における、各VOPに対す
る目標符号量(ターゲットビット)を式(25)により
算出するのに対し、図5に示した画像情報変換装置にお
いては、MPEG4画像情報符号化部(I/P−VO
P)32における、各VOPに対する目標符号量(ター
ゲットビット)を式(4)により算出する点にある。す
なわち、図5に示した画像情報変換装置においては、圧
縮情報解析部29において、入力となるMPEG2画像
圧縮情報(ビットストリーム)におけるGOP構造を抽
出してこれを情報バッファ35に格納し、これより、V
OP目標符号量算出部37においては、出力となるMP
EG4画像圧縮情報(ビットストリーム)におけるGO
V構造を決定し、式(4)に基づいて各VOPに対する
目標符号量(ターゲットビット)の算出を行う。
The difference between the image information conversion apparatus shown in FIG. 1 and the image information conversion apparatus shown in FIG. 5 is that the image information conversion apparatus shown in FIG. 1 uses an MPEG4 image information encoding unit (I / P- While the target code amount (target bit) for each VOP in the (VOP) 20 is calculated by Expression (25), the image information conversion apparatus shown in FIG. 5 uses the MPEG4 image information encoding unit (I / P- VO
P) 32 is that the target code amount (target bit) for each VOP is calculated by equation (4). That is, in the image information conversion device shown in FIG. 5, the compression information analysis unit 29 extracts the GOP structure in the input MPEG2 image compression information (bit stream) and stores it in the information buffer 35. , V
In the OP target code amount calculation unit 37, the output MP
GO in EG4 image compression information (bit stream)
The V structure is determined, and the target code amount (target bit) for each VOP is calculated based on equation (4).

【0144】以上、入力としてMPEG2画像圧縮情報
(ビットストリーム)を、出力としてMPEG4画像圧
縮情報(ビットストリーム)を対象としてきたが、入
力、出力ともこれに限らず、例えばMPEG−1やH.
263などの画像圧縮情報(ビツトストリーム)でも良
い。
As described above, the MPEG2 image compression information (bit stream) is used as the input and the MPEG4 image compression information (bit stream) is used as the output. However, the input and output are not limited to this. For example, MPEG-1 or H.264.
263 may be image compression information (bit stream).

【0145】[0145]

【発明の効果】以上述べてきた様に、本発明は、飛び越
し走査のMPEG2画像圧縮情報(ビットストリーム)
を入力とし、入力となるMPEG2画像圧縮情報(ビッ
トストリーム)における、各スライスに対するコンプレ
キシティ情報を用いて、MPEG4画像符号化の際に擬
似スライス単位の目標符号量(ターゲットビット)を与
えることで、符号量制御におけるコンプレキシティを算
出するステップに伴う参照量子化スケールの変動を最小
限に抑え、各マクロブロックに対する符号量割当が画像
に対して最適化された状態で順次走査のMPEG4画像
圧縮情報(ビツトストリーム)に変換して出力する手段
を提供するものである。
As described above, the present invention provides MPEG2 image compression information (bit stream) for interlaced scanning.
, And using the complexity information for each slice in the input MPEG2 image compression information (bit stream) to give a target code amount (target bit) in pseudo slice units at the time of MPEG4 image encoding. MPEG4 image compression of progressive scanning in a state in which the variation of the reference quantization scale accompanying the step of calculating the complexity in the code amount control is minimized, and the code amount allocation for each macroblock is optimized for the image. It provides means for converting the information into a bit stream.

【図面の簡単な説明】[Brief description of the drawings]

【図1】第1の実施の形態の画像情報変換装置の構成を
示すブロック図である。
FIG. 1 is a block diagram illustrating a configuration of an image information conversion device according to a first embodiment.

【図2】MPEG2画像圧縮情報(ビットストリーム)
におけるスライス層の概念を説明する図である。
FIG. 2 MPEG2 image compression information (bit stream)
FIG. 3 is a view for explaining the concept of a slice layer in FIG.

【図3】MPEG4画像圧縮情報(ビットストリーム)
における疑似スライスの概念を示す図である。
FIG. 3 shows MPEG4 image compression information (bit stream).
FIG. 3 is a diagram showing a concept of a pseudo slice in FIG.

【図4】コンプレキシティを用いて符号量制御を行う動
作フローを示す図である。
FIG. 4 is a diagram showing an operation flow for performing code amount control using complexity.

【図5】第2の実施の形態の画像情報変換装置の構成を
示すブロック図である。
FIG. 5 is a block diagram illustrating a configuration of an image information conversion device according to a second embodiment.

【図6】従来の画像情報変換装置の構成を示すブロック
図である。
FIG. 6 is a block diagram illustrating a configuration of a conventional image information conversion device.

【図7】MPEG2 Test Mode1 5(IS
O/IEC JTC1/SC29/WG11 N040
0)で述べられている符号量制御方式の動作原理を示す
フローチャートである。
FIG. 7 shows MPEG2 Test Mode 1 5 (IS
O / IEC JTC1 / SC29 / WG11 N040
3 is a flowchart showing the operation principle of the code amount control method described in (0).

【図8】本願出願人が提案した画像情報変換装置の構成
を示す図である。
FIG. 8 is a diagram showing a configuration of an image information conversion device proposed by the present applicant.

【図9】図8の画像情報変換装置における符号量制御の
動作を示すフローチャートである。
9 is a flowchart illustrating an operation of code amount control in the image information conversion device of FIG. 8;

【図10】CCIRテストシーケンスの一つである“F
lower Garden”を、n=15;m=3の条
件の元、4Mbpsに圧縮したMPEG2画像圧縮情報
(ビットストリーム)を、図8に示した画像情報変換装
置を用いて、n=5;m=1のMPEG4画像圧縮情報
(ビットストリーム)に変換する際の、あるVOPに対
するQjがどのような値を取るかを示した図である。
FIG. 10 shows one of the CCIR test sequences “F
Under the condition that lower Garden "is n = 15; m = 3, the MPEG2 image compression information (bit stream) compressed to 4 Mbps is converted to n = 5; m = 3 using the image information converter shown in FIG. FIG. 3 is a diagram showing what value Q j takes for a certain VOP when converting into one MPEG4 image compression information (bit stream).

【符号の説明】[Explanation of symbols]

16 ピクチャタイプ判別部、17 圧縮情報解析部、
18 MPEG2画像情報復号化部(I/Pピクチ
ャ)、19 間引き部、20 MPEG4画像情報符号
化部(I/P−VOP)、21 動きベクトル合成部、
22 動きベクトル検出部、23 情報バッファ、24
VOPコンプレキシテイ算出部、25 擬似スライス
コンプレキシティ算出部、26 VOP目標符号量算出
部、27 擬似スライス目標符号量算出部
16 picture type discrimination unit, 17 compression information analysis unit,
18 MPEG2 image information decoding unit (I / P picture), 19 decimation unit, 20 MPEG4 image information encoding unit (I / P-VOP), 21 motion vector synthesis unit,
22 motion vector detecting section, 23 information buffer, 24
VOP complexity calculator, 25 pseudo slice complexity calculator, 26 VOP target code amount calculator, 27 pseudo slice target code amount calculator

───────────────────────────────────────────────────── フロントページの続き (72)発明者 高橋 邦明 東京都品川区北品川6丁目7番35号 ソニ ー株式会社内 (72)発明者 鈴木 輝彦 東京都品川区北品川6丁目7番35号 ソニ ー株式会社内 (72)発明者 矢ケ崎 陽一 東京都品川区北品川6丁目7番35号 ソニ ー株式会社内 Fターム(参考) 5C059 LA07 MA00 MA05 MB00 MC11 MC38 PP05 PP06 PP07 SS01 SS11 TA46 TA57 TB03 TB08 TC10 TC38 TD03 UA38 5J064 AA01 BA09 BB03 BB05 BC01 BC14 BC26 BD02 BD03  ──────────────────────────────────────────────────続 き Continuing on the front page (72) Kuniaki Takahashi, 6-7-35 Kita-Shinagawa, Shinagawa-ku, Tokyo Inside Sony Corporation (72) Inventor Teruhiko Suzuki 6-35, Kita-Shinagawa, Shinagawa-ku, Tokyo Inside Sony Corporation (72) Inventor Yoichi Yagasaki 6-7-35 Kita-Shinagawa, Shinagawa-ku, Tokyo F-term inside Sony Corporation (reference) 5C059 LA07 MA00 MA05 MB00 MC11 MC38 PP05 PP06 PP07 SS01 SS11 TA46 TA57 TB03 TB08 TC10 TC38 TD03 UA38 5J064 AA01 BA09 BB03 BB05 BC01 BC14 BC26 BD02 BD03

Claims (14)

【特許請求の範囲】[Claims] 【請求項1】 第1の圧縮符号化方式で圧縮された飛び
越し走査の入力画像圧縮情報を、第2の圧縮符号化方式
で圧縮された順次走査の出力画像圧縮情報に変換する画
像情報変換装置において、 上記入力画像圧縮情報及び上記出力画像圧縮情報を構成
する符号化画像は、それぞれ複数の画素からなる画素ブ
ロックから構成され、 上記出力画像圧縮情報の符号化画像における画素ブロッ
クからなる疑似画像ブロック列に対する目標符号量を算
出する目標符号量算出手段と、 上記目標符号量算出手段で算出した目標符号量を用い、
画像情報を上記出力画像圧縮情報に符号化する符号化手
段とを有することを特徴とする画像情報変換装置。
An image information conversion apparatus for converting input image compression information of interlaced scanning compressed by a first compression encoding method into output image compression information of progressive scanning compressed by a second compression encoding method. In the above, the coded images constituting the input image compression information and the output image compression information each include a pixel block including a plurality of pixels, and a pseudo image block including a pixel block in the coded image of the output image compression information. Using a target code amount calculating means for calculating a target code amount for the column, using the target code amount calculated by the target code amount calculating means,
A coding unit for coding the image information into the output image compression information.
【請求項2】 上記疑似画素ブロック列とは、上記出力
画像圧縮情報の符号化画像における水平方向一列分の画
素ブロック群であることを特徴とする請求項1記載の画
像情報変換装置。
2. The image information conversion apparatus according to claim 1, wherein the pseudo pixel block sequence is a pixel block group for one horizontal line in the encoded image of the output image compression information.
【請求項3】 上記疑似画素ブロック列を構成する画素
ブロックに対応する上記入力画像圧縮情報の符号化画像
における画素ブロック群の平均量子化スケール及び割当
符号量を上記入力画像圧縮情報から抽出する解析手段
と、 この解析手段で検出した平均量子化スケール及び割当符
号量を格納する情報バッファとを有することを特徴とす
る請求項2記載の画像情報変換装置。
3. An analysis for extracting, from the input image compression information, an average quantization scale and an assigned code amount of a pixel block group in an encoded image of the input image compression information corresponding to pixel blocks constituting the pseudo pixel block sequence. 3. The image information conversion apparatus according to claim 2, further comprising: an information buffer configured to store the average quantization scale and the allocated code amount detected by the analysis unit.
【請求項4】 上記解析手段は、上記情報バッファに格
納した平均量子化スケール及び割当符号量を用いて、上
記出力画像圧縮情報及び符号化画像におけるk番目の疑
似画素ブロック列に対するコンプレキシティを次の式に
よって算出することを特徴とする請求項3記載の画像情
報変換装置。 【数1】 ただし、k番目の疑似画素ブロック列に対する平均量子
化スケールをQpseudo _slicekと、割当符号量をB
pseudo_slicekと、コンプレキシティをXpseudo_sli cek
とする。
4. The analysis means calculates the complexity of the output image compression information and the k-th pseudo pixel block sequence in the encoded image by using the average quantization scale and the allocated code amount stored in the information buffer. The image information conversion device according to claim 3, wherein the image information is calculated by the following equation. (Equation 1) Here, the average quantization scale for the k-th pseudo pixel block sequence is Q pseudo _slicek, and the assigned code amount is B
pseudo_slicek and the complexity is X pseudo_sli cek
And
【請求項5】 上記解析手段は、上記出力画像圧縮情報
を構成する符号化画像に対する目標符号量及び各疑似画
素ブロック列に対するコンプレキシティを用いて、上記
出力画像圧縮情報を構成する符号化画像を構成するk番
目の疑似画素ブロック列に対するコンプレキシティを次
の式によって算出することを特徴とする請求項4記載の
画像情報変換装置。 【数2】 ただし、当該符号化画像に対する目標符号量をT
vopと、l番目の疑似画素ブロック列に対するコンプレ
キシティをXpseudo_slicelと、目標符号量をTpseud
o_slicekとする。
5. The coded image forming the output image compression information by using a target code amount for a coded image forming the output image compression information and a complexity for each pseudo pixel block sequence. 5. The image information conversion apparatus according to claim 4, wherein the complexity of the k-th pseudo pixel block sequence forming the following is calculated by the following equation. (Equation 2) Here, the target code amount for the coded image is T
vop , the complexity for the l-th pseudo pixel block sequence is X pseudo_slicel, and the target code amount is T pseud
o_slicek .
【請求項6】 上記入力画像圧縮情報は複数の符号化画
像からなる画像群から構成され、上記解析手段は、上記
入力画像圧縮情報を構成する画像群の構造を解析するこ
とにより、上記出力画像圧縮情報の符号化画像に対する
目標符号量を算出することを特徴とする請求項5記載の
画像情報変換装置。
6. The input image compression information is composed of an image group consisting of a plurality of coded images, and the analysis means analyzes the structure of the image group constituting the input image compression information, thereby obtaining the output image 6. The image information conversion apparatus according to claim 5, wherein a target code amount for the encoded image of the compressed information is calculated.
【請求項7】 上記解析手段は、上記入力画像圧縮情報
を構成する各フレームに対するコンプレキシティを抽出
し、このコンプレキシティを利用して上記出力画像圧縮
情報の符号化画像に対する目標符号量を算出することを
特徴とする請求項5記載の画像情報変換装置。
7. The analyzing means extracts a complexity for each frame constituting the input image compression information, and calculates a target code amount for the encoded image of the output image compression information using the complexity. 6. The image information conversion device according to claim 5, wherein the calculation is performed.
【請求項8】 上記出力画像圧縮情報は、フレーム内で
符号化されたイントラ符号化画像、表示順序で順方向を
参照して符号化された順方向予測符号化画像、表示順序
で順方向及び逆方向を参照して符号化された双方向予測
符号化画像から構成され、上記変換手段は、各種類の符
号化画像を構成するj番目の画素ブロックにおける仮想
バッファの占有量をそれぞれ次の式によって与えること
を特徴とする請求項5記載の画像情報変換装置。 【数3】 ただし、イントラ符号化画像、順方向予測符号化画像、
双方向予測符号化画像に対するl番目の目標符号量T
pseudo_slicelをそれぞれTi_pseudo_slicel,T
p_pseudo_slicel,Tb_pseudo_slicelと、j番目の画素
ブロックに対する仮想バッファの占有量をdj i,dj p
j bと、仮想バッファの占有量の初期値をd0 i,d0 p
0 bとする。また、疑似画素ブロック列の先頭からj番
目のマクロブロックまでに発生した符号量(ビット数)
をBpseudo_slicejと、疑似画素ブロック列を構成する
画素ブロックの個数をP_SLICE_CNTとする。
8. The output image compression information is included in a frame.
Encoded intra-coded image, display in the forward direction
Forward prediction coded image coded by reference, display order
Prediction encoded with reference to the forward and backward directions in
The conversion means comprises a coded image,
Virtual in the j-th pixel block forming the decoded image
Give the buffer occupancy by the following formulas
6. The image information conversion device according to claim 5, wherein: (Equation 3)However, intra coded images, forward prediction coded images,
L-th target code amount T for bidirectional predictive coded images
pseudo_slicelTo Ti_pseudo_slicel, T
p_pseudo_slicel, Tb_pseudo_slicelAnd the j-th pixel
The occupancy of the virtual buffer for the block is dj i, Dj p,
dj bAnd the initial value of the virtual buffer occupancy is d0 i, D0 p,
d0 bAnd Also, j-th from the top of the pseudo pixel block column
Code amount (number of bits) generated up to the first macroblock
To Bpseudo_slicejAnd form a pseudo pixel block column
Let the number of pixel blocks be P_SLICE_CNT.
【請求項9】 上記変換手段は、各疑似画素ブロック列
の処理終了時における上記仮想バッファの占有量を、次
の疑似画素ブロック列に対する上記仮想バッファの占有
量の初期値とすることを特徴とする請求項8記載の画像
情報変換装置。
9. The method according to claim 8, wherein the conversion unit sets the occupation amount of the virtual buffer at the end of processing of each pseudo pixel block sequence as an initial value of the occupation amount of the virtual buffer for the next pseudo pixel block sequence. 9. The image information conversion device according to claim 8, wherein:
【請求項10】 上記入力画像圧縮情報は、フレーム内
で符号化されたイントラ符号化画像、表示順序で順方向
を参照して符号化された順方向予測符号化画像、表示順
序で順方向及び逆方向を参照して符号化された双方向予
測符号化画像から構成され、上記イントラ符号化画像及
び上記順方向予測符号化画像を通過させるが、上記双方
向予測符号化画像を破棄する判別手段を有することを特
徴とする請求項1記載の画像情報変換装置。
10. The input image compression information includes an intra-coded image coded in a frame, a forward prediction coded image coded by referring to a forward direction in a display order, a forward prediction coded image in a display order, Discriminating means which is composed of a bidirectional predictive coded image coded with reference to the backward direction, passes the intra coded image and the forward predictive coded image, but discards the bidirectional predictive coded image The image information conversion device according to claim 1, further comprising:
【請求項11】 上記第1の圧縮符号化方式はMPEG
2であり、上記第2の圧縮符号化方式はMPEG4であ
ることを特徴とする請求項1記載の画像情報変換装置。
11. The first compression encoding method is an MPEG encoding method.
2. The image information conversion apparatus according to claim 1, wherein the second compression encoding method is MPEG4.
【請求項12】 第1の圧縮符号化方式で圧縮された飛
び越し走査の入力画像圧縮情報を、第2の圧縮符号化方
式で圧縮された順次走査の出力画像圧縮情報に変換する
画像情報変換方法において、 上記入力画像圧縮情報及び上記出力画像圧縮情報を構成
する符号化画像は、それぞれ複数の画素からなる画素ブ
ロックから構成され、 上記出力画像圧縮情報の符号化画像における画素ブロッ
クからなる疑似画像ブロック列に対する目標符号量を算
出し、 上記目標符号量を用い、画像情報を上記出力画像圧縮情
報に符号化することを特徴とする画像情報変換方法。
12. An image information conversion method for converting input image compression information of interlaced scanning compressed by a first compression encoding method into output image compression information of progressive scanning compressed by a second compression encoding method. In the above, the coded images constituting the input image compression information and the output image compression information each include a pixel block including a plurality of pixels, and a pseudo image block including a pixel block in the coded image of the output image compression information. An image information conversion method, comprising calculating a target code amount for a column, and encoding image information into the output image compression information using the target code amount.
【請求項13】 上記疑似画素ブロック列とは、上記出
力画像圧縮情報の符号化画像における水平方向一列分の
画素ブロック群であることを特徴とする請求項12記載
の画像情報変換方法。
13. The image information conversion method according to claim 12, wherein the pseudo pixel block sequence is a pixel block group for one column in the horizontal direction in the encoded image of the output image compression information.
【請求項14】 上記疑似画素ブロック列を構成する画
素ブロックに対応する上記入力画像圧縮情報の符号化画
像における画素ブロック群の平均量子化スケール及び割
当符号量を上記入力画像圧縮情報から抽出し、情報バッ
ファに格納することを特徴とする請求項13記載の画像
情報変換方法。
14. Extracting an average quantization scale and an assigned code amount of a pixel block group in an encoded image of the input image compression information corresponding to a pixel block forming the pseudo pixel block sequence from the input image compression information; 14. The image information conversion method according to claim 13, wherein the image information is stored in an information buffer.
JP2000208932A 2000-07-10 2000-07-10 Image information converting apparatus and method, and encoding apparatus and method Expired - Fee Related JP4517468B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000208932A JP4517468B2 (en) 2000-07-10 2000-07-10 Image information converting apparatus and method, and encoding apparatus and method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000208932A JP4517468B2 (en) 2000-07-10 2000-07-10 Image information converting apparatus and method, and encoding apparatus and method

Publications (2)

Publication Number Publication Date
JP2002027465A true JP2002027465A (en) 2002-01-25
JP4517468B2 JP4517468B2 (en) 2010-08-04

Family

ID=18705426

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000208932A Expired - Fee Related JP4517468B2 (en) 2000-07-10 2000-07-10 Image information converting apparatus and method, and encoding apparatus and method

Country Status (1)

Country Link
JP (1) JP4517468B2 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8208562B2 (en) 2007-06-15 2012-06-26 Fujitsu Semiconductor Limited Transcoding device, transcoder, decoder, and transcoding method
CN104221381A (en) * 2012-04-11 2014-12-17 高通股份有限公司 Wavefront parallel processing for video coding

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09512410A (en) * 1995-02-15 1997-12-09 フィリップス エレクトロニクス ネムローゼ フェンノートシャップ Video signal transcoding method and apparatus
JPH11205803A (en) * 1998-01-19 1999-07-30 Sony Corp Encoding device and encoding method therefor

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09512410A (en) * 1995-02-15 1997-12-09 フィリップス エレクトロニクス ネムローゼ フェンノートシャップ Video signal transcoding method and apparatus
JPH11205803A (en) * 1998-01-19 1999-07-30 Sony Corp Encoding device and encoding method therefor

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8208562B2 (en) 2007-06-15 2012-06-26 Fujitsu Semiconductor Limited Transcoding device, transcoder, decoder, and transcoding method
CN104221381A (en) * 2012-04-11 2014-12-17 高通股份有限公司 Wavefront parallel processing for video coding
KR20150003239A (en) * 2012-04-11 2015-01-08 퀄컴 인코포레이티드 Wavefront parallel processing for video coding
JP2015516759A (en) * 2012-04-11 2015-06-11 クゥアルコム・インコーポレイテッドQualcomm Incorporated Wavefront parallel processing for video coding
US9838684B2 (en) 2012-04-11 2017-12-05 Qualcomm Incorporated Wavefront parallel processing for video coding
CN104221381B (en) * 2012-04-11 2018-06-05 高通股份有限公司 For the method, apparatus and computer-readable storage medium of the wavefront parallel processing of video coding
KR102086872B1 (en) * 2012-04-11 2020-03-09 퀄컴 인코포레이티드 Wavefront parallel processing for video coding

Also Published As

Publication number Publication date
JP4517468B2 (en) 2010-08-04

Similar Documents

Publication Publication Date Title
JP4517495B2 (en) Image information conversion apparatus, image information conversion method, encoding apparatus, and encoding method
KR100954609B1 (en) Method and device for indicating quantizer parameters in a video coding system
US5623308A (en) Multiple resolution, multi-stream video system using a single standard coder
US5691768A (en) Multiple resolution, multi-stream video system using a single standard decoder
US5815601A (en) Image encoder and image decoder
US9420279B2 (en) Rate control method for multi-layered video coding, and video encoding apparatus and video signal processing apparatus using the rate control method
EP1725042A1 (en) Fade frame generating for MPEG compressed video data
JP2001145113A (en) Device and method for image information conversion
JP2002152759A (en) Image information converter and image information conversion method
JP2001522174A (en) Digital image processing method and processing apparatus
US6864909B1 (en) System and method for static perceptual coding of macroblocks in a video frame
JP2000236547A (en) Image information converter and image information conversion method
JP4517475B2 (en) Image information converting apparatus and method, and encoding apparatus and method
JP4517453B2 (en) Image information converting apparatus and method, and encoding apparatus and method
US6040875A (en) Method to compensate for a fade in a digital video input sequence
JP2002125227A (en) Image information converter and image information converting method
JP4608801B2 (en) Image information conversion apparatus and method
JP4517468B2 (en) Image information converting apparatus and method, and encoding apparatus and method
JP4517465B2 (en) Image information converting apparatus and method, and encoding apparatus and method
JP2001346214A (en) Image information transform device and method
KR20020066498A (en) Apparatus and method for coding moving picture
JP2001148852A (en) Image information converter and image information conversion method
US7012959B2 (en) Picture information conversion method and apparatus
JP2001339720A (en) Image information conversion apparatus and method for same
JP4505992B2 (en) Image information conversion apparatus and method

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070126

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20081110

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20081202

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090202

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100112

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100218

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100427

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100510

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130528

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees