JP2001128175A - Device and method for converting image information and recording medium - Google Patents
Device and method for converting image information and recording mediumInfo
- Publication number
- JP2001128175A JP2001128175A JP30495099A JP30495099A JP2001128175A JP 2001128175 A JP2001128175 A JP 2001128175A JP 30495099 A JP30495099 A JP 30495099A JP 30495099 A JP30495099 A JP 30495099A JP 2001128175 A JP2001128175 A JP 2001128175A
- Authority
- JP
- Japan
- Prior art keywords
- code amount
- image
- information
- image information
- image compression
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
【0001】[0001]
【発明の属する技術分野】本発明は画像情報変換装置及
び方法、並びに記録媒体に関し、特に、MPEG(Moving
Picture Experts Group)などの様に、離散コサイン
変換等の直交変換によって圧縮された画像圧縮情報(ビ
ットストリーム)を、衛星放送,ケーブルテレビジョ
ン,インターネットなどのネットワークメディアを介し
て伝送する際、あるいは光ディスク,磁気ディスクのよ
うな記億メディア上で処理する際に、更に圧縮してデー
タの符号量を削減する画像情報変換装置及び方法、並び
に記録媒体に関する。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an apparatus and method for converting image information, and a recording medium, and more particularly to an MPEG (Moving) method.
When transmitting image compression information (bit stream) compressed by orthogonal transform such as discrete cosine transform through a network medium such as satellite broadcasting, cable television, or the Internet, such as a Picture Experts Group, or an optical disc The present invention relates to an image information conversion apparatus and method for further compressing and reducing the amount of code of data when processing on a storage medium such as a magnetic disk, and a recording medium.
【0002】[0002]
【従来の技術】近年、画像情報をデジタルデータとして
取り扱い、その際、効率の高い情報の伝送,蓄積を目的
とし、画像情報特有の冗長性を利用して、離散コサイン
変換等の直交変換と動き補償とにより画像情報を圧縮す
るMPEGなどの方式に準拠した装置が、放送局などの情報
配信や一般家庭における情報受信の双方において普及し
つつある。2. Description of the Related Art In recent years, image information is handled as digital data. At that time, the purpose of transmitting and storing information with high efficiency is to utilize orthogonality such as discrete cosine transform and motion by utilizing redundancy inherent in image information. 2. Description of the Related Art Devices that comply with a scheme such as MPEG that compresses image information by compensation are becoming widespread in both information distribution at broadcast stations and information reception in ordinary households.
【0003】特に、MPEG-2(ISO/IEC13818-2)は、汎用画
像符号化方式として定義されており、飛び越し走査画像
及び順次走査画像の双方、並びに標準解像度画像及び高
精細画像を網羅する標準となっており、プロフェッショ
ナル用途及びコンシユーマ用途の広範なアプリケーショ
ンに今後とも用いられるものと予想される。[0003] In particular, MPEG-2 (ISO / IEC13818-2) is defined as a general-purpose image encoding method, and is a standard covering both interlaced scan images and progressive scan images, as well as standard resolution images and high definition images. It is expected to be used in a wide range of professional and consumer applications.
【0004】しかし、MPEG-2圧縮方式等を用いても、良
好な画質を実現するためには、例えば720×480画
素を持つ標準解像度の飛び越し走査画像であれば、4乃
至8Mbps、1920×1080画素を持つ高解像度の飛
び越し走査画像であれば18乃至22Mbps、の符号量
(ビットレート)を画像情報として割り当てる必要があ
る。However, in order to achieve good image quality even if the MPEG-2 compression method is used, for example, a standard resolution interlaced scan image having 720 × 480 pixels is 4 to 8 Mbps and 1920 × 1080. In the case of a high-resolution interlaced scanning image having pixels, it is necessary to allocate a code amount (bit rate) of 18 to 22 Mbps as image information.
【0005】ところが、斯かる膨大な符号量の圧縮画像
を、例えば、衛星放送,ケーブルテレビジョンなどのネ
ットワークメディアとして伝送する際には、伝送経路の
バンド幅に合わせて、画質劣化を最小限に抑えながら更
に画像情報を圧縮する必要が生じる。また、光ディス
ク,磁気ディスクのような記憶メディア上で斯かる膨大
な符号量の圧縮画像を処理する際には、記録メディアの
容量に合わせて、画質劣化を最小限に抑えながら更なる
符号量の削減すなわち画像圧縮を行う必要が生じる。However, when transmitting such a compressed image having an enormous amount of code as network media such as satellite broadcasting and cable television, the deterioration of image quality is minimized in accordance with the bandwidth of the transmission path. It is necessary to further compress the image information while suppressing it. Further, when processing such a compressed image having a huge code amount on a storage medium such as an optical disk or a magnetic disk, the code amount is further reduced while minimizing image quality deterioration according to the capacity of the recording medium. It is necessary to perform reduction, that is, image compression.
【0006】このような符号量削減の必要性は、高解像
度画像のみならず、標準解像度画像(例えば画枠が72
0画素×480画素の30Hzの飛び越し走査画像)
を、上述の様に、ネットワークメディア若しくは記憶メ
ディア上で処理する場合にも生じることが予想される。The necessity of such code amount reduction is not only for high-resolution images but also for standard-resolution images (for example, when the image frame is 72
(30 pixels interlaced scanning image of 0 pixels x 480 pixels)
Is also expected to occur when processing is performed on network media or storage media as described above.
【0007】[0007]
【発明が解決しようとする課題】上述した問題を解決す
る手段として、階層符号化(スケーラビリティ)や画像
情報変換(トランスコーディング)が考えられる。前者
に関連しては、MPEG-2ではSNR(Signal Noise Ratio)ス
ケーラビリティが標準化されており、これによって、高
SNRの画像圧縮情報と低SNRの画像圧縮情報を階層的に符
号化することを可能としている。しかしながら、階層符
号化を行うには、符号化の時点でバンド幅若しくは記憶
容量の拘束条件が既知である必要がある。As means for solving the above-mentioned problems, hierarchical coding (scalability) and image information conversion (transcoding) can be considered. Regarding the former, MPEG-2 has standardized the SNR (Signal Noise Ratio) scalability, which has
It is possible to hierarchically encode SNR image compression information and low SNR image compression information. However, in order to perform hierarchical coding, it is necessary that the constraint condition of the bandwidth or the storage capacity is known at the time of coding.
【0008】ところが、実際のシステムでは、これらの
拘束条件は未知であることが多く、このため、後者の画
像情報変換(トランスコーディング)の方が、実際のシ
ステムに則したより自由度の高い方式であると言える。
そこで、画像劣化を最小限に抑え、伝送経路のバンド幅
等に応じて更なる画像情報の圧縮を可能にする画像情報
変換方法とこの方法を実行する装置の実現が望まれてい
る。However, in an actual system, these constraint conditions are often unknown, so that the latter image information conversion (transcoding) has a higher degree of freedom than the actual system. It can be said that
Therefore, it is desired to realize an image information conversion method and an apparatus for executing the method, which minimize image deterioration and enable further compression of image information according to the bandwidth of a transmission path.
【0009】画像情報変換装置では、基本的に、入力さ
れた画像圧縮情報を復号或いは部分復号し、この復号さ
れた画像情報を更に圧縮し(符号量を削減し)て再び符
号化することになるが、復号部から符号化部への情報
(画素データ)の受け渡しを、空間領域で行うか、また
は周波数領域で行うかの2通りの構成が考えられる。The image information converter basically decodes or partially decodes the input image compression information, further compresses the decoded image information (reduces the code amount), and encodes the decoded image information again. However, there are two possible configurations of passing information (pixel data) from the decoding unit to the encoding unit in the spatial domain or in the frequency domain.
【0010】前者は、演算処理量は大きいが、出力とな
る圧縮情報の復号画像の劣化を最小限に抑えることが可
能で、主として放送用機器等のアプリケーションに用い
られる。一方、後者は、前者に比ベ、若干の画質劣化を
引き起こすものの、より少ない演算処理量での実現が可
能で、主として民生用機器のアプリケーションに用いら
れる。The former has a large amount of arithmetic processing, but can minimize the deterioration of the decoded image of the compressed information to be output, and is mainly used for applications such as broadcasting equipment. On the other hand, the latter causes a slight deterioration in image quality as compared with the former, but can be realized with a smaller amount of processing, and is mainly used for applications in consumer appliances.
【0011】しかし、いずれの構成においても、画像情
報変換装置は、MPEGやMPEG-2などで画像情報を圧縮する
画像情報符号化装置と類似な装置構成になるが、原画像
の画像情報が入力される画像情報符号化装置に対し、画
像情報変換装置は、画像情報符号化装置によって圧縮さ
れた後の画像圧縮情報を入力とするため、画像情報符号
化装置の装置構成をそのまま適用して構成することがで
きない。例えば、画像情報符号化装置では、予めGOP(Gr
oup of Picture)の構造が与えられるが、画像情報変換
装置では、如何なる構造のGOPが入力されてくるのか予
測できず、入力された画像圧縮情報を解析しなければ分
からないという問題がある。However, in any of the configurations, the image information conversion device has a similar configuration to the image information encoding device that compresses image information using MPEG or MPEG-2, but the image information of the original image is input. In contrast to the image information encoding device, the image information conversion device is configured by directly applying the device configuration of the image information encoding device in order to receive the image compression information compressed by the image information encoding device. Can not do it. For example, in an image information encoding device, GOP (Gr.
Although a structure of “up of picture” is given, the image information conversion apparatus cannot predict what type of GOP is input, and has a problem that it cannot be understood unless the input image compression information is analyzed.
【0012】また、画像情報符号化装置では、更なる符
号量の削減を図るために、例えば、文献“Bit-rate con
trol for MPEG encoders”(G.Keesman,I.Shah and R.K
lein-Gunnewiek,Signal Processing Image Communicati
on 6,pp.545-560,1995)により、フレーム符号量を、量
子化幅に依存する離散コサイン変換係数部の符号量と、
量子化幅に依存しないヘッダ部の符号量とに分離して符
号量配分を行う手法が提案されているが、この画像情報
符号化装置の構成をそのまま画像情報変換装置に適用す
ることができないという問題もある。Further, in the image information coding apparatus, for example, the document “Bit-rate con
trol for MPEG encoders ”(G. Keesman, I. Shah and RK
lein-Gunnewiek, Signal Processing Image Communicati
on 6, pp. 545-560, 1995), the frame code amount is calculated by the code amount of the discrete cosine transform coefficient part depending on the quantization width,
There has been proposed a method of allocating the code amount separately to the code amount of the header portion which does not depend on the quantization width. However, the configuration of the image information encoding device cannot be directly applied to the image information conversion device. There are also problems.
【0013】本発明の目的は、入力された画像圧縮情報
のGOPの長さ等の構造が不明であっても画質劣化を最小
限に抑えて更なる符号量の削減を行うことができ、ま
た、伝送経路のバンド幅や記憶容量などに応じて符号量
の削減ができ、更に、演算処理量や回路規模を増大させ
ずに更なる符号量の削減を行うことができる画像情報変
換装置及びその方法、並びに記録媒体を提供することに
ある。[0013] An object of the present invention is to minimize the deterioration of image quality and to further reduce the code amount even if the structure such as the GOP length of the input image compression information is unknown. An image information conversion apparatus capable of reducing the amount of code according to the bandwidth and storage capacity of a transmission path, and further capable of further reducing the amount of code without increasing the amount of computation and the circuit scale; and A method and a recording medium are provided.
【0014】[0014]
【課題を解決するための手段】請求項1に記載の画像情
報変換装置は、直交変換と動き補償によって符号化され
た画像圧縮情報を取り込み、符号量を更に削減してから
出力する画像情報変換装置において、画像圧縮情報のヘ
ッダ部に割り当てられた符号量を検出する検出手段と、
検出手段により検出された、ヘッダ部に割り当てられた
符号量に基づいて、画像圧縮情報の直交変換係数に割り
当てる符号量を演算する第1の演算手段と、第1の演算
手段により演算された、直交変換係数に割り当てる符号
量に基づいて、目標符号量を演算する第2の演算手段
と、第2の演算手段により演算された目標符号量に基づ
いて、画像圧縮情報の再量子化時の符号量を制御する制
御手段とを備えることを特徴とする。An image information conversion apparatus according to claim 1 takes in image compression information encoded by orthogonal transformation and motion compensation, further reduces the code amount, and outputs the image information. In the apparatus, detecting means for detecting the amount of code assigned to the header portion of the image compression information,
A first calculator for calculating a code amount to be assigned to the orthogonal transform coefficient of the image compression information based on the code amount assigned to the header portion detected by the detector, and a first calculator that calculates the code amount. A second calculating means for calculating a target code amount based on the code amount allocated to the orthogonal transform coefficient; and a code for requantizing the image compression information based on the target code amount calculated by the second calculating means. Control means for controlling the amount.
【0015】前記直交変換は、離散コサイン変換とする
ことができる。The orthogonal transform may be a discrete cosine transform.
【0016】前記第2の演算手段は、ヘッダ部に対する
目標符号量をTheaderとし、直交変換係数に対する目標
符号量をTcoefとするとき、画像圧縮情報の各フレーム
に対する目標符号量TをWhen the target code amount for the header portion is T header and the target code amount for the orthogonal transform coefficient is Tcoef , the second arithmetic means sets the target code amount T for each frame of the image compression information to T header.
【数9】 として演算するようにすることができる。(Equation 9) It can be calculated as
【0017】前記第2の演算手段は、検出手段により検
出されたヘッダ部の符号量を、The aderとすることがで
きる。[0017] The second computing means, a code amount of the header portion which is detected by the detection means may be a T he ADER.
【0018】取り込まれた画像圧縮情報の各フレームに
対する平均量子化スケールと、各フレームの直交変換係
数に対して割り当てられている符号量から、各フレーム
に対するコンプレクシティを算出する算出手段をさらに
設け、第2の演算手段は、算出手段により算出されたコ
ンプレクシティに基づいて、目標符号量Tcoefを求める
ようにすることができる。A calculating means for calculating a complexity for each frame from an average quantization scale of the captured image compression information for each frame and a code amount allocated to an orthogonal transform coefficient of each frame; The second calculating means can determine the target code amount T coef based on the complexity calculated by the calculating means.
【0019】前記画像圧縮情報を復号して得た画像情報
中のIピクチャの間隔から擬似的なGOPの構造を決定す
る決定手段とをさらに設けることができる。[0019] The information processing apparatus may further include determining means for determining a pseudo GOP structure from an interval between I pictures in the image information obtained by decoding the image compression information.
【0020】前記第1の演算手段は、Nを擬似的なGOP
内に含まれるフレーム数とし、bit_rateを出力となる画
像圧縮情報の符号量とし、picture_rateを出力となる画
像が毎秒何フレーム表示されるかを表す値とし、擬似的
なGOPの最初のフレームを再符号化する際に、擬似的なG
OP内の未符号化フレームに対する割当符号量Rを、The first computing means calculates N as a pseudo GOP
, The number of frames included in the frame, bit_rate is the code amount of the image compression information to be output, picture_rate is a value indicating how many frames of the output image are displayed per second, and the first frame of the pseudo GOP is reproduced. When encoding, pseudo G
The allocated code amount R for the uncoded frame in the OP is
【数10】 として更新し、入力された画像圧縮情報内で、擬似的な
GOP内に含まれるフレームのへッダに対する符号量の合
計Rheadを(Equation 10) Is updated as a pseudo-code in the input image compression information.
The total code amount R head for the header of the frame included in the GOP is
【数11】 として算出し、擬似的なGOP内の未符号化フレームの直
交変換係数に対する割当符号量Rcoefを、[Equation 11] And the allocated code amount R coef for the orthogonal transform coefficient of the uncoded frame in the pseudo GOP is calculated as
【数12】 として算出するようにすることができる。(Equation 12) It can be calculated as
【0021】前記第1の演算手段は、各フレームが再符
号化された後、そのフレームの発生符号量のうち、直交
変換係数に割り当てられた分をScoefとするとき、割当
符号量Rcoefを、After the respective frames are re-encoded, the first arithmetic means determines the allocated code amount R coef when the amount allocated to the orthogonal transform coefficient is S coef among the generated code amounts of the frame. To
【数13】 として更新するようにすることができる。(Equation 13) Can be updated as
【0022】前記第2の演算手段は、割当符号量Rcoef
を用いて各フレームに対する目標符号量Tcoefを演算す
るようにすることができる。[0022] The second operation means is provided with an allocated code amount R coef.
Is used to calculate the target code amount T coef for each frame.
【0023】前記第2の演算手段は、目標符号量Tcoef
を、画像に応じたパラメータKpとKbの値を用いて演算す
るようにすることができる。[0023] The second calculating means is configured to calculate a target code amount T coef.
Can be calculated using the values of the parameters Kp and Kb according to the image.
【0024】前記第2の演算手段は、パラメータの値
を、入力された画像圧縮情報の各フレームのコンプレク
シティを用いて適応的に演算する。The second calculating means adaptively calculates the value of the parameter using the complexity of each frame of the input image compression information.
【0025】前記第2の演算手段は、各フレームのコン
プレクシティを、入力された画像圧縮情報内の各フレー
ムでの平均量子化スケール、並びにそのフレーム内で直
交変換係数に割り当てられた符号量を用いて演算するよ
うにすることができる。The second calculating means calculates the complexity of each frame by calculating the average quantization scale of each frame in the input image compression information and the code amount allocated to the orthogonal transform coefficient within the frame. The calculation can be performed by using this.
【0026】Xi,Xp,Xbを、夫々擬似的なGOPを
構成するIピクチャ,Pピクチャ,Bピクチャにおける
コンプレクシティとし、1/(1+m)を所定の値とす
るとき、第2の演算手段は、パラメータKp及びKbをWhen Xi, Xp, and Xb are the complexities of the I picture, P picture, and B picture constituting the pseudo GOP, respectively, and 1 / (1 + m) is a predetermined value, the second calculating means , Parameters Kp and Kb
【数14】 [Equation 14]
【数15】 により演算するようにすることができる。(Equation 15) Can be calculated by
【0027】入力された画像圧縮情報のそのフレームに
おける平均量子化スケールコードをQとし、総符号量の
うち直交変換係数に割り当てられた分をScoefとしたと
き、第2の演算手段は、コンプレクシティXをWhen the average quantized scale code in the frame of the input image compression information is Q, and the amount of the total code amount allocated to the orthogonal transform coefficient is S coef , the second calculating means City X
【数16】 により演算するようにすることができる。(Equation 16) Can be calculated by
【0028】前記第2の演算手段は、1/(1+m)の
値を、0.6乃至1.2に設定するようにすることがで
きる。[0028] The second arithmetic means may set the value of 1 / (1 + m) to 0.6 to 1.2.
【0029】前記第2の演算手段は、1/(1+m)の
値を、1.0に設定するようにすることができる。[0029] The second arithmetic means may set the value of 1 / (1 + m) to 1.0.
【0030】前記第2の演算手段は、パラメータKp及
びKbを求める際の指数演算を、予め設定されたテーブ
ルを参照することによって実行するようにすることがで
きる。The second calculating means may execute the exponent calculation for obtaining the parameters Kp and Kb by referring to a preset table.
【0031】前記第2の演算手段は、シーケンスの最初
における仮想バッファ初期値を与えるパラメータKp,
Kbの値として、Kp=1.0,Kb=l.4という値
を用いるようにすることができる。The second operation means includes a parameter Kp, which gives a virtual buffer initial value at the beginning of the sequence.
As values of Kb, Kp = 1.0, Kb = 1. A value of 4 can be used.
【0032】請求項19に記載の画像情報変換方法は、
直交変換と動き補償によって符号化された画像圧縮情報
を取り込み、符号量を更に削減してから出力する画像情
報変換装置の画像情報変換方法において、画像圧縮情報
のヘッダ部に割り当てられた符号量を検出する検出ステ
ップと、検出ステップの処理により検出された、ヘッダ
部に割り当てられた符号量に基づいて、画像圧縮情報の
直交変換係数に割り当てる符号量を演算する第1の演算
ステップと、第1の演算ステップの処理により演算され
た、直交変換係数に割り当てる符号量に基づいて、目標
符号量を演算する第2の演算ステップと、第2の演算ス
テップの処理により演算された目標符号量に基づいて、
画像圧縮情報の再量子化時の符号量を制御する制御ステ
ップとを含むことを特徴とする。The image information conversion method according to claim 19 is
In an image information conversion method of an image information conversion device that takes in image compression information encoded by orthogonal transformation and motion compensation, further reduces the amount of code, and outputs the code amount, the code amount allocated to the header portion of the image compression information is A detecting step of detecting, a first calculating step of calculating a code amount to be assigned to the orthogonal transform coefficient of the image compression information based on the code amount assigned to the header portion detected by the processing of the detecting step; A second calculation step of calculating a target code amount based on the code amount to be assigned to the orthogonal transform coefficient, calculated by the processing of the calculation step, and a target code amount calculated by the processing of the second calculation step. hand,
And a control step of controlling a code amount at the time of requantization of the image compression information.
【0033】請求項20に記載の記録媒体に記録されて
いるプログラムは、直交変換と動き補償によって符号化
された画像圧縮情報を取り込み、符号量を更に削減して
から出力する画像情報変換装置を制御するプログラムに
おいて、画像圧縮情報のヘッダ部に割り当てられた符号
量を検出する検出ステップと、検出ステップの処理によ
り検出された、ヘッダ部に割り当てられた符号量に基づ
いて、画像圧縮情報の直交変換係数に割り当てる符号量
を演算する第1の演算ステップと、第1の演算ステップ
の処理により演算された、直交変換係数に割り当てる符
号量に基づいて、目標符号量を演算する第2の演算ステ
ップと、第2の演算ステップの処理により演算された目
標符号量に基づいて、画像圧縮情報の再量子化時の符号
量を制御する制御ステップとを含むことを特徴とする。According to a twentieth aspect of the present invention, there is provided an image information conversion apparatus which fetches image compression information coded by orthogonal transformation and motion compensation, further reduces the code amount, and outputs the image compression information. In the controlling program, a detection step of detecting a code amount allocated to a header portion of the image compression information, and an orthogonalization of the image compression information based on the code amount allocated to the header portion detected by the processing of the detection step. A first calculation step of calculating a code amount to be assigned to a transform coefficient, and a second calculation step of calculating a target code amount based on the code amount to be assigned to an orthogonal transform coefficient, which is calculated by the processing of the first calculation step Controlling the code amount at the time of requantization of the image compression information based on the target code amount calculated by the processing of the second calculation step Characterized in that it comprises a step.
【0034】請求項1に記載の画像情報変換装置、請求
項19に記載の画像情報変換方法、および請求項20に
記載の記録媒体に記録されているプログラムにおいて
は、ヘッダ部に割り当てられた符号量に基づいて、画像
圧縮情報の直交変換係数に割り当てる符号量が演算され
る。[0034] In the image information conversion device according to the first aspect, the image information conversion method according to the nineteenth aspect, and the program recorded on the recording medium according to the twentieth aspect, the code assigned to the header portion is used. A code amount to be assigned to the orthogonal transform coefficient of the image compression information is calculated based on the amount.
【0035】[0035]
【発明の実施の形態】以下、本発明の一実施の形態につ
いて図面を参照して説明する。DESCRIPTION OF THE PREFERRED EMBODIMENTS One embodiment of the present invention will be described below with reference to the drawings.
【0036】図1は、本発明に係る画像情報変換装置
(トランスコーダ)の構成図である。この実施の形態に
係る画像情報変換装置は、復号部から符号化部への情報
(画素データ)の受け渡しを周波数領域で行うようにな
っており、高ビットレートの画像圧縮情報が入力される
符号バッファ1と、この符号バッファ1の出力に接続さ
れた圧縮情報解析装置2と、圧縮情報解析装置2が解析
した高ビットレートの画像圧縮情報中の量子化値などの
データを格納する情報バッファ3と、圧縮情報解析装置
2を通過した高ビットレートの画像圧縮情報を取り込
み、可変長復号する可変長復号装置4と、可変長復号さ
れた画像データを逆量子化する逆量子化装置5とを備え
る。FIG. 1 is a block diagram of an image information conversion device (transcoder) according to the present invention. The image information conversion apparatus according to this embodiment is configured to transfer information (pixel data) from the decoding unit to the encoding unit in the frequency domain, and to perform encoding of high-bit-rate image compression information. A buffer 1, a compression information analyzer 2 connected to an output of the code buffer 1, and an information buffer 3 for storing data such as a quantized value in high bit rate image compression information analyzed by the compression information analyzer 2. A variable-length decoding device 4 that takes in the high-bit-rate image compression information that has passed through the compression-information analysis device 2 and performs variable-length decoding, and an inverse quantization device 5 that inversely quantizes the variable-length-decoded image data. Prepare.
【0037】更に、この画像情報変換装置は、逆量子化
装置5の出力と、後述する動き補償誤差補正値との差分
をとる加算器6と、この加算器6から出力される高ビッ
トレートの画像情報の符号量を削減する帯域制限装置7
と、帯域制限装置7から出力される画像データを量子化
する量子化装置8と、量子化装置8から出力される画像
データを可変長符号化する可変長符号化装置11と、こ
の可変長符号化装置11から出力される低ビットレート
の画像圧縮情報を取り込み、外部に出力する符号バッフ
ァ10と、符号バッファ10の状態と情報バッファ3の
格納情報とから量子化装置8を制御する符号量制御装置
9とを備えてなる。Further, the image information conversion apparatus includes an adder 6 for calculating a difference between an output of the inverse quantization apparatus 5 and a motion compensation error correction value described later, and a high bit rate output from the adder 6. Band limiting device 7 for reducing the code amount of image information
A quantizing device 8 for quantizing image data output from the band limiting device 7, a variable-length encoding device 11 for variable-length encoding image data output from the quantizing device 8, and a variable-length code Code buffer 10 which takes in the low bit rate image compression information output from the quantization device 11 and outputs it to the outside, and the code amount control which controls the quantization device 8 based on the state of the code buffer 10 and the information stored in the information buffer 3. Device 9.
【0038】図1に示す画像情報変換装置には、上記構
成に加え、動き補償誤差補正装置12が設けられてい
る。この動き補償誤差補正装置12は、量子化装置8の
出力データを取り込み、逆量子化する逆量子化装置13
と、この逆量子化装置13の出力と前記の加算器6の出
力との差分をとる(加算機6の出力の逆極性のデータを
加算する)加算器14と、加算器14の出力を逆離散コ
サイン変換する逆離散コサイン変換装置15と、逆離散
コサイン変換装置15の出力データを格納するビデオメ
モリ16と、ビデオメモリ16の内容に基づき動き補償
予測を行う動き補償予測装置17と、この動き補償予測
装置17の出力を離散コサイン変換して動き誤差補正値
を生成し、加算器6に出力する離散コサイン変換装置1
8とを備える。多少の画質劣化を許しても回路規模をよ
り縮小したいという場合には、この動き補償誤差補正装
置12を省略することも可能である。The image information conversion device shown in FIG. 1 is provided with a motion compensation error correction device 12 in addition to the above configuration. The motion compensation error correction device 12 takes in the output data of the quantization device 8 and performs inverse quantization on the inverse quantization device 13.
And an adder 14 for calculating the difference between the output of the inverse quantizer 13 and the output of the adder 6 (adding data of the opposite polarity of the output of the adder 6), and inverting the output of the adder 14. An inverse discrete cosine transform device 15 for performing discrete cosine transform, a video memory 16 for storing output data of the inverse discrete cosine transform device 15, a motion compensation prediction device 17 for performing motion compensation prediction based on the contents of the video memory 16, Discrete cosine transform device 1 that performs discrete cosine transform on the output of compensation prediction device 17 to generate a motion error correction value, and outputs it to adder 6
8 is provided. If it is desired to further reduce the circuit scale even if some image quality degradation is allowed, the motion compensation error correction device 12 can be omitted.
【0039】以下では、まず、動き補償誤差補正装置1
2を省略した画像情報変換装置の動作原理について述べ
る。In the following, first, the motion compensation error correction device 1
The principle of operation of the image information conversion apparatus in which step 2 is omitted will be described.
【0040】多くの符号量(高いビットレート)を持つ
画像圧縮情報(ビットストリーム)は、まず、符号バッ
ファ1に入力され格納される。この画像圧縮情報は、MP
EG-2で規定されているVBV(Video Buffering Verifier)
の拘束条件を満たすよう符号化されているので、符号バ
ッファ1において、オーバーフローやアンダーフローを
起こすことはない。Image compression information (bit stream) having a large code amount (high bit rate) is first input to the code buffer 1 and stored. This image compression information is
VBV (Video Buffering Verifier) specified by EG-2
Therefore, no overflow or underflow occurs in the code buffer 1.
【0041】符号バッファ1に格納された画像圧縮情報
は、次に、圧縮情報解析装置2に送られる。圧縮情報解
析装置2は、MPEG-2で定められた構文(シンタクス)に
従って、画像圧縮情報中から必要な情報を抽出する。本
実施の形態に係る画像情報変換装置は、この抽出された
情報に従って、以下の再符号化処理を実行する。特に、
後述する様に、符号量制御装置9の動作に必要となるpi
cture_coding_typeや、各マクロブロック毎の量子化値
(量子化スケール:q_scale)等の情報は、情報バッフ
ァ3に格納される。Next, the image compression information stored in the code buffer 1 is sent to the compression information analyzer 2. The compression information analysis device 2 extracts necessary information from the image compression information according to a syntax (syntax) defined by MPEG-2. The image information conversion device according to the present embodiment executes the following re-encoding processing according to the extracted information. In particular,
As described later, pi required for the operation of the code amount control device 9 is
Information such as cture_coding_type and a quantization value (quantization scale: q_scale) for each macroblock is stored in the information buffer 3.
【0042】可変長復号装置4は、まず、インターマク
ロブロックの直流成分に関しては隣のブロックとの差分
値として符号化されているデータを復号し、その他の係
数に関してはラン(連続する0係数の数)とレベル(非
0係数)により符号化されたデータを可変長復号し、量
子化された一次元の離散コサイン変換係数を得る。The variable length decoding device 4 first decodes the data encoded as the difference value from the adjacent block with respect to the DC component of the inter macroblock, and executes the run (with respect to the continuous 0 coefficient) for the other coefficients. ) And the level (non-zero coefficient) is subjected to variable length decoding to obtain quantized one-dimensional discrete cosine transform coefficients.
【0043】可変長復号装置4は、次に、圧縮情報解析
装置2により抽出された画像の走査方式に関する情報を
基に、量子化された離散コサイン変換係数を二次元デー
タとして再配列する。MPEG-2では、2種類の走査方式
(ジグザグスキャン方式とオルタネートスキャン方式)
が定められており、図2にジグザグスキャン方式のスキ
ャン順の一覧を、図3にオルタネートスキャン方式のス
キャン順の一覧を示す。Next, the variable length decoding device 4 rearranges the quantized discrete cosine transform coefficients as two-dimensional data based on the information on the scanning method of the image extracted by the compression information analysis device 2. MPEG-2 has two scanning methods (zigzag scanning method and alternate scanning method).
FIG. 2 shows a list of the scan order of the zigzag scan method, and FIG. 3 shows a list of the scan order of the alternate scan method.
【0044】二次元データに再配列された量子化された
離散コサイン変換係数は、圧縮情報解析装置2によって
抽出された量子化幅および量子化行列に関する情報を基
に、逆量子化装置5において逆量子化が行われる。The quantized discrete cosine transform coefficients rearranged into two-dimensional data are inversely quantized by the inverse quantization device 5 based on the information on the quantization width and the quantization matrix extracted by the compression information analysis device 2. Quantization is performed.
【0045】逆量子化装置5の出力として得られる離散
コサイン変換係数は、帯域制限装置7において、ブロッ
ク毎に、l水平方向高域成分係数の削減が行われる。図
4(A),(B)に、帯域制限装置7における処理の一
例を示す。With respect to the discrete cosine transform coefficient obtained as the output of the inverse quantization device 5, the band limiting device 7 reduces the high-frequency component coefficient in the horizontal direction for each block. 4A and 4B show an example of processing in the band limiting device 7. FIG.
【0046】この図4の例では、輝度信号に関しては、
同図(A)に示すように、8×8個の離散コサイン変換
係数のうち、水平方向低域成分である8×6個の係数の
みの値を保存し、残りを“0”(図4(A)の例では白
丸)と置きかえる。色差信号に関しては、図4(B)に
示すように、8×8個の離散コサイン変換係数のうち、
水平方向低域成分である8×4個の係数のみの値を保存
し、残りを“0”(図4(B)の例では白丸)と置きか
える。In the example of FIG. 4, the luminance signal is
As shown in FIG. 4A, of the 8 × 8 discrete cosine transform coefficients, only the values of 8 × 6 coefficients which are low-frequency components in the horizontal direction are stored, and the remaining values are “0” (FIG. 4). (In the example of (A), a white circle). As for the color difference signal, as shown in FIG. 4B, of the 8 × 8 discrete cosine transform coefficients,
The values of only the 8 × 4 coefficients, which are horizontal low-frequency components, are stored, and the rest are replaced with “0” (open circles in the example of FIG. 4B).
【0047】符号バッファ1に入力された画像圧縮情報
が飛び越し走査画像のものである場合、フレーム離散コ
サイン変換モードの際に、フィールド間の時間差に関す
る情報には離散コサイン変換係数の垂直方向高域成分が
含まれることになり、その制限を行うことは大幅な画質
劣化に繋がるため、垂直方向の帯域制限は行わない。ま
た、この例で示したように、劣化がより人間の目に付き
やすい輝度信号に比ベ、より人間の目に付きにくい色差
信号に対して、より大きく帯域制限を行うことで、画質
劣化を最小限に抑えながら、再量子化の歪みを低減する
ことができる。When the image compression information input to the code buffer 1 is that of an interlaced scan image, in the frame discrete cosine transform mode, information relating to the time difference between fields includes the vertical high-frequency component of the discrete cosine transform coefficient. Is included, and performing the restriction leads to a significant deterioration in the image quality. Therefore, the band restriction in the vertical direction is not performed. In addition, as shown in this example, image quality deterioration is reduced by performing a greater band limitation on a color difference signal that is less noticeable to human eyes than a luminance signal that is more noticeable to human eyes. Requantization distortion can be reduced while minimizing it.
【0048】尚、帯域制限装置7における処理は図4
(A),(B)に示したものに限らない。例えば、
“0”と置き換える代わりに、予め用意した重み係数を
離散コサイン変換係数の水平方向高域成分に乗じること
で同様の効果をもたらすことができる。The processing in the band limiting device 7 is shown in FIG.
It is not limited to those shown in (A) and (B). For example,
A similar effect can be obtained by multiplying the high-frequency component in the horizontal direction of the discrete cosine transform coefficient by a weight coefficient prepared in advance instead of replacing it with “0”.
【0049】帯域制限装置7の出力となる8×8個の離
散コサイン変換係数は、量子化装置8によって量子化が
行われる。その際に用いられる量子化幅は、符号量制御
装置9によって決定される。The 8 × 8 discrete cosine transform coefficients output from the band limiting device 7 are quantized by the quantizing device 8. The quantization width used at that time is determined by the code amount control device 9.
【0050】符号量制御装置9の動作原理について説明
する前に、まず、本実施の形態に係る画像情報変換装置
と比較するため、MPEG-2 Test Mode1 5(ISO/IEC JTC1/S
C29/WG11 N0400)で用いられている手法が適用されるMPE
G-2画像情報符号化装置について説明する。Before explaining the operation principle of the code amount control device 9, first, for comparison with the image information conversion device according to the present embodiment, MPEG-2 Test Mode 15 (ISO / IEC JTC1 / S
MPE to which the method used in C29 / WG11 N0400) is applied
The G-2 image information encoding device will be described.
【0051】MPEG-2画像情報符号化装置では、次の第1
ステップ,第2ステップ,第3ステップによる制御が行
われる。第1ステップでは、GOP(Group of Picture)内
の各ピクチャに対する割当ビット量の配分が行なわれ
る。この配分は、割当て対象ピクチャを含めGOP内でま
だ符号化されていないピクチャに対して割り当てられる
ビット量を基にして行なわれる。In the MPEG-2 image information encoding apparatus, the following first
The control by the step, the second step, and the third step is performed. In the first step, the allocated bit amount is allocated to each picture in a GOP (Group of Picture). This allocation is performed based on the bit amount allocated to a picture that has not been encoded in the GOP including the allocation target picture.
【0052】第2ステップでは、第1ステップで求めら
れた各ピクチャに対する割当てビット量を実際の符号量
と一致させるため、各ピクチャ毎に独立に設定した3種
類の仮想バッファの容量を基に、量子化スケールコード
がマクロブロック単位のフィードバック制御で求められ
る。In the second step, in order to make the amount of bits allocated to each picture obtained in the first step coincide with the actual code amount, based on the capacities of three types of virtual buffers independently set for each picture. A quantized scale code is obtained by feedback control on a macroblock basis.
【0053】第3ステップでは、第2ステップで求めら
れた量子化スケールコードが、視覚的に劣化の目立ちや
すい平坦部でより細かく量子化し、劣化の比較的目立ち
にくい絵柄の複雑な部分でより粗く量子化する様に、各
マクロブロック毎のアクティビティによって変化され
る。実用上用いられているMPEG-2画像情報符号化装置
は、このTest Model 5で定められた方式に準じたアルゴ
リズムによって符号量制御が行われる。In the third step, the quantized scale code obtained in the second step is finely quantized in a flat portion where deterioration is visually conspicuous, and is coarser in a complicated portion of a pattern where deterioration is relatively inconspicuous. As with quantization, it is changed by the activity of each macroblock. In a practically used MPEG-2 image information encoding apparatus, the code amount is controlled by an algorithm according to the method defined in Test Model 5.
【0054】しかしながら、画像情報符号化装置に適用
される上述した手法を、図1に示したような画像情報変
換装置の符号化部にそのまま適用するには、2つの問題
点がある。第1の問題点は、前述の第1ステップに関す
る問題である。すなわち、MPEG-2画像情報符号化装置に
おいては、予めGOP構造が与えられているため、これに
基づいて第1ステップの動作を行うことが可能であるの
に対し、図1に示した画像情報変換装置においては、GO
P構造が予め与えられることはなく、入力された画像圧
縮情報中の1つのGOP分の情報全てを構文(シンタク
ス)解析することで初めてGOP構造が明らかになる。However, there are two problems in applying the above-described method applied to the image information encoding device to the encoding unit of the image information converting device as shown in FIG. 1 as it is. The first problem is related to the above-mentioned first step. That is, in the MPEG-2 image information encoding device, since the GOP structure is given in advance, the operation of the first step can be performed based on the GOP structure, whereas the image information shown in FIG. In the conversion device, GO
The P structure is not given in advance, and the GOP structure becomes clear only by analyzing all the information for one GOP in the input image compression information.
【0055】また、GOPの長さは固定であるとは限ら
ず、実用上用いられているMPEG-2画像情報符号化装置で
は、シーンチェンジを検出し、それに応じて適応的にGO
Pの長さを画像圧縮情報中で制御するというものも存在
するため、斯かる画像情報符号化装置で圧縮された画像
圧縮情報を入力とする画像情報変換装置では、GOPの長
さを固定として扱うことはできない。。Further, the length of a GOP is not always fixed, and a practically used MPEG-2 image information encoding apparatus detects a scene change and adapts a GO according to the scene change.
Since the length of P is controlled in the image compression information, there is an image information conversion device that receives the image compression information compressed by the image information encoding device as an input. Can not handle. .
【0056】第2の問題点は、前述の第3ステップに関
する問題である。すなわち、MPEG-2画像情報符号化装置
においては、アクティビティを、原画の輝度信号画素値
を用いて算出している。しかしながら、図1に示した画
像情報変換装置では、MPEG-2による画像圧縮情報を入力
としており、原画の輝度信号画素値を知ることができな
い。The second problem is related to the above-mentioned third step. That is, in the MPEG-2 image information encoding device, the activity is calculated using the luminance signal pixel value of the original image. However, in the image information conversion apparatus shown in FIG. 1, image compression information based on MPEG-2 is input, and the luminance signal pixel value of the original image cannot be known.
【0057】そこで、本実施の形態に係る画像情報変換
装置では、上述した第1の問題点と第2の問題点を解決
するため、図5に示す手順により動作する。まず、ステ
ップS1で以下のように擬似GOPが決定され、これに基
づいた符号量制御が行なわれる。擬似GOPとは、1つの
Iピクチャおよび複数のPピクチャとBピクチャから構
成される擬似的なGOPである。その長さは可変であり、
入力された画像圧縮情報中で、どのようにIピクチャを
検出するかに依存する。Therefore, the image information conversion apparatus according to the present embodiment operates according to the procedure shown in FIG. 5 in order to solve the above-described first and second problems. First, in step S1, a pseudo GOP is determined as follows, and code amount control is performed based on the pseudo GOP. The pseudo GOP is a pseudo GOP composed of one I picture and a plurality of P pictures and B pictures. Its length is variable,
It depends on how an I picture is detected in the input image compression information.
【0058】図6は、擬似GOPがどの様に決定されるか
を説明する図である。この図6に示すようなpicture_co
ding_typeを格納する環状バッファを、図1の情報バッ
ファ3は持っている。環状バッファは、MPEGで規定され
ている1個のGOPに含むことのできる最大フレーム数と
同じ256個のpicture_coding_typeを格納するだけの
容量を持つ。環状バッファの各要素には、予め初期値が
格納されている。FIG. 6 is a diagram for explaining how a pseudo GOP is determined. Picture_co as shown in FIG.
The information buffer 3 of FIG. 1 has a circular buffer for storing ding_type. The circular buffer has a capacity to store 256 picture_coding_types equal to the maximum number of frames that can be included in one GOP defined by MPEG. Each element of the circular buffer stores an initial value in advance.
【0059】図6において、入力された画像圧縮情報に
含まれる各フレームの情報が、P,B,B,I,B,B
まで処理され、次のPピクチャの処理を行う場合を考え
る。この時、まず、圧縮情報解析装置2(図1)に含ま
れるフィードフォワードバッファによって、数フレーム
分のpicture_coding_typeが先読みされ、環状バッファ
の要素が更新される。フィードフォワードバッファの大
きさは任意であるが、図6の例では6フレームとしてあ
る。In FIG. 6, the information of each frame included in the input image compression information is P, B, B, I, B, B
Up to the next P picture. At this time, first, picture_coding_type for several frames is pre-read by the feedforward buffer included in the compression information analyzer 2 (FIG. 1), and the elements of the circular buffer are updated. The size of the feedforward buffer is arbitrary, but is 6 frames in the example of FIG.
【0060】次に、環状バッファの状態から、圧縮情報
解析装置2により、図6のように、現在のIピクチャを
指すポインタa及び次のIピクチヤ(この例場合、この
Iピクチャは、初期値として設定されたもの)を指すポ
インタbを参照することで、擬似GOPの長さが決定され
る。Next, as shown in FIG. 6, a pointer a pointing to the current I picture and the next I picture (in this case, this I picture is The length of the pseudo GOP is determined by referring to the pointer b indicating the pseudo GOP.
【0061】最後に、フィードフォワードバッファの最
後のフレームを指すポインタdと、既に決定された擬似
GOPの長さから最初のフレームを指すポインタcが決ま
り、図6に示すように、擬似GOPの構成が符号量制御装
置9において決定される(図5のステップS1)。Finally, a pointer d pointing to the last frame of the feedforward buffer and a pseudo
A pointer c indicating the first frame is determined from the length of the GOP, and the configuration of the pseudo GOP is determined in the code amount control device 9 as shown in FIG. 6 (step S1 in FIG. 5).
【0062】このようにして決定された擬似GOPの構成
が、 {B1,B2,P1,B3,B4,I1,B5,B6,…,
PL,BM-1,BM} の様であった場合、擬似GOPの大きさL_pgopは、The structure of the pseudo GOP determined in this way is as follows: {B 1 , B 2 , P 1 , B 3 , B 4 , I 1 , B 5 , B 6 ,.
If P L , B M-1 , B M様, the size of the pseudo GOP L_pgop is
【数17】 で与えられる。この時、符号量制御装置9は、Iピクチ
ャ,Pピクチャ,Bピクチヤの目標符号量(ターゲット
ビット)Ti,Tp,Tbを、夫々、[Equation 17] Given by At this time, the code amount control device 9 sets the target code amounts (target bits) Ti, Tp, and Tb of the I picture, the P picture, and the B picture, respectively.
【数18】 (Equation 18)
【数19】 [Equation 19]
【数20】 で求める(図5のステップS2)。但し、Ωは、夫々、
擬似GOP内において、これから処理が行われるフレーム
を指し、フレームレートをF、出力となる画像圧縮情報
の符号量(ビットレート)をBとし、発生符号量をgene
rated_bitとすると、(数18)乃至(数20)中のR
は、(Equation 20) (Step S2 in FIG. 5). Where Ω is
In the pseudo GOP, it indicates the frame to be processed, the frame rate is F, the code amount (bit rate) of the output image compression information is B, and the generated code amount is gene.
If rated_bit, R in (Equation 18) to (Equation 20)
Is
【数21】 (Equation 21)
【数22】 である。(数22)において、Θは、疑似GOP内におい
て、既に処理が終わったフレームを表す。また、X
(I),X(P)などのX(・)は、各フレームの複雑
さを表すパラメータ(global complexity measure)であ
り、圧縮情報解析装置2で事前解析(プリパーシング)
を行う際に当該フレームの総符号量(ビット数)Sおよ
び平均量子化スケールコードQを予め算出しておき、(Equation 22) It is. In (Equation 22), Θ indicates a frame that has already been processed in the pseudo GOP. Also, X
X (•) such as (I) and X (P) is a parameter (global complexity measure) representing the complexity of each frame, and is pre-analyzed (pre-parsed) by the compression information analyzer 2.
, The total code amount (number of bits) S and the average quantization scale code Q of the frame are calculated in advance,
【数23】 のように求められる。パラメータKp及びKbの値は、
シーケンスの最初における仮想バッファの初期値を与
え、これにより、符号量制御装置9において、目標の符
号量が(数18)乃至(数20)で制御される(図5の
ステップS3)。このパラメータKp,Kbの値は、夫
々、MPEG-2 Test Mode1 5で定められている通り、Iピ
クチヤの量子化スケールコードを基準としたPピクチ
ャ,Bピクチャの量子化スケールコードの比率であり、
Kp=1.0、Kb=1.4の値の時に、常に全体の画
質が最適化されると仮定されている。(Equation 23) Is required. The values of the parameters Kp and Kb are
The initial value of the virtual buffer at the beginning of the sequence is given, whereby the target code amount is controlled by (Expression 18) to (Expression 20) in the code amount control device 9 (Step S3 in FIG. 5). The values of the parameters Kp and Kb are the ratios of the quantized scale codes of the P-picture and the B-picture based on the quantized scale code of the I-picture as defined in MPEG-2 Test Mode 15, respectively.
It is assumed that the overall image quality is always optimized when Kp = 1.0 and Kb = 1.4.
【0063】上述した第2の問題点は、次の様に解決さ
れる。符号バッファ1に入力される画像圧縮情報におけ
る各マクロブロックの量子化スケールQは、符号化時
に、原画の輝度信号画素値を用いて算出されたものであ
る。そこで、まず、圧縮情報解析装置2がプリパーシン
グを行う際、当該フレーム内の各マクロブロックの量子
化スケールQおよび符号量(ビット数)Bを抽出し、情
報バッファ3に格納すると同時に、当該フレーム全体の
Q,Bの平均値E(Q),E(B)、あるいは、その積
の平均値E(QB)を予め算出し、その値も情報バッフ
ァ3に格納する。The second problem described above is solved as follows. The quantization scale Q of each macroblock in the image compression information input to the code buffer 1 is calculated at the time of encoding by using the luminance signal pixel value of the original image. Therefore, when the compression information analysis device 2 performs preparsing, first, the quantization scale Q and the code amount (the number of bits) B of each macroblock in the frame are extracted and stored in the information buffer 3, and The average value E (Q), E (B) of the whole Q and B or the average value E (QB) of the product is calculated in advance, and the value is also stored in the information buffer 3.
【0064】符号量制御装置9は、情報バッファ3に格
納されたQ,Bやその平均値等の情報を基に、以下のい
ずれかの数式によって、正規化アクティビティN_actを
算出する(図5のステップS4)。The code amount control device 9 calculates the normalized activity N_act based on the information such as Q and B stored in the information buffer 3 and the average value thereof by one of the following equations (FIG. 5). Step S4).
【数24】 (Equation 24)
【数25】 (Equation 25)
【数26】 (Equation 26)
【0065】このうち、(数25)と(数26)は等価
処理となる。画質をSNR(Signal Noise Ratio)で評価し
た場合、(数24)の方がより高い画質となるが、主観
的な画質は、(数25)若しくは(数26)で与えられ
るものの方が良い。Of these, (Equation 25) and (Equation 26) are equivalent processing. When the image quality is evaluated by SNR (Signal Noise Ratio), (Equation 24) has higher image quality, but the subjective image quality is better given by (Equation 25) or (Equation 26).
【0066】ところで今、あるマクロブロックに対する
入力画像圧縮情報における量子化値がQlで、符号量制
御装置9にて算出された出力画像圧縮情報に対する量子
化値がQ2になったとする。図1の画像情報変換装置
は、符号量を削減するためのものであるから、Q1>Q2
となった場合には、一度粗く量子化されたマクロブロッ
クが、再量子化された結果、より細かく量子化されたこ
とになる。[0066] Incidentally Now, the quantized values in the input image compression information for a macroblock in Q l, the quantization value for the output image compression information calculated by the code amount control unit 9 becomes Q 2. Since the image information conversion device of FIG. 1 is for reducing the code amount, Q 1 > Q 2
In the case of, the macroblock that has been coarsely quantized once has been requantized, resulting in finer quantization.
【0067】粗く量子化されたことによる歪みは、細か
く再量子化することでは低減されない。また、細かく再
量子化するということは、このマクロブロックに対して
ビットが多く使われることを意味し、これは、他のマク
ロブロックに割り当てるビットの減少を招き、更なる画
質劣化を引き起こす。このため、符号量制御装置9は、
Q1>Q2であるか否かを判定し(図6のステップS
5)、YESである場合、Q2=Q1とする。The distortion due to coarse quantization is not reduced by fine requantization. Further, fine requantization means that more bits are used for this macroblock, which leads to a reduction in the number of bits allocated to other macroblocks and further deterioration of image quality. For this reason, the code amount control device 9
It is determined whether or not Q 1 > Q 2 (step S in FIG. 6).
5) If YES, set Q 2 = Q 1 .
【0068】量子化装置8において量子化が行われた離
散コサイン変換係数は、可変長符号化装置11によって
可変長符号化される。その際、離散コサイン変換係数の
直流成分に関しては、1ブロック前の直流成分係数を予
測値としてその差分を符号化し、その他の成分に関して
は、予め設定された走査方式(図2のジグザグスキャン
方式、若しくは図3のオルタネートスキャン方式)に基
づいて2次元の配列データに並べ替えた後、連続する0
係数の数(ラン)及び非0係数(レベル)のペアを事象
とした可変長符号化が行われる。ブロック内のスキャン
順で、それ以降の係数が全て“0”となった場合、EOB
(End of Block)と呼ばれる符号が出力され、そのブロッ
クに対する可変長符号化を終了される。The discrete cosine transform coefficients quantized by the quantization device 8 are subjected to variable length coding by the variable length coding device 11. At this time, for the DC component of the discrete cosine transform coefficient, the difference is encoded using the DC component coefficient of one block before as a predicted value, and for the other components, a predetermined scanning method (the zigzag scanning method in FIG. Alternatively, after rearranging into two-dimensional array data based on the alternate scan method of FIG.
Variable length coding is performed using a pair of the number of coefficients (run) and a non-zero coefficient (level) as an event. If all subsequent coefficients are “0” in the scan order within the block, EOB
A code called (End of Block) is output, and the variable length coding for the block is terminated.
【0069】今、符号バッファ1に入力される画像圧縮
情報における或るブロックの係数が図7(A)に示すよ
うになっていたとする。この図7で黒丸は非0係数、白
丸は0係数を示す。これに、例えば、図4(A)に示す
ような、離散コサイン変換係数の水平高域成分の削減を
施したとすると、非0係数の分布は図7(B)のように
なる。これを、図2のジグザグスキャンのまま(図2に
そのスキャン順を点線矢印で示す。)再符号化すると、
最後のスキャン順となる非0係数(図7(B)に符号z
で示す。)のスキャン番号は“50”になる。Assume that the coefficient of a certain block in the image compression information input to the code buffer 1 is as shown in FIG. In FIG. 7, black circles indicate non-zero coefficients, and white circles indicate zero coefficients. If the horizontal high-frequency component of the discrete cosine transform coefficients is reduced as shown in FIG. 4A, the distribution of non-zero coefficients is as shown in FIG. 7B. When this is re-encoded as it is in the zigzag scan of FIG. 2 (the scan order is indicated by a dotted arrow in FIG. 2),
The non-zero coefficient in the last scan order (the symbol z in FIG. 7B)
Indicated by ) Is "50".
【0070】そこで、走査変換を行い、図3のオルタネ
ートスキャン(図3にそのスキャン順を点線矢印で示
す。)で改めて符号化することにより、最後の非0係数
zのスキャン番号は“44”になる。これにより、EOB
信号を、ジグザグスキャンの場合より早いスキャン番号
で設定することが可能となり、その分だけ量子化幅とし
てより細かな値を割り当てることができ、再量子化に伴
う量子化歪みを低減することが可能となる。Therefore, the scan conversion is performed, and the scan is performed again by the alternate scan in FIG. 3 (the scan order is indicated by a dotted arrow in FIG. 3), so that the scan number of the last non-zero coefficient z is “44”. become. This allows EOB
Signals can be set with a faster scan number than in the case of zigzag scanning, and a finer value can be assigned as the quantization width accordingly, reducing quantization distortion due to requantization. Becomes
【0071】次に、図1の動き補償誤差補正装置12の
動作原理について説明する。Next, the operation principle of the motion compensation error correction device 12 shown in FIG. 1 will be described.
【0072】まず、動き補償誤差の生じる原因について
述べる。原画像の画素値をOとし、この画素値に対する
入力画像圧縮情報の量子化幅をQ1とし、再符号化後の
出力画像圧縮情報における、この画素値に対する量子化
幅をQ2とする。量子化幅Ql,Q2で復号された時の、
参照画像の画素値を夫々L(Q1),L(Q2)と表すこ
とにする。First, the cause of the motion compensation error will be described. The pixel value of the original image and O, and the quantization width of the input image compression information for the pixel value and Q 1, the output compressed image information after re-encoding, the quantization width for the pixel value and Q 2. When decoded with the quantization widths Q l and Q 2 ,
The pixel values of the reference image are represented as L (Q 1 ) and L (Q 2 ), respectively.
【0073】MPEG-2画像情報符号化装置においては、イ
ンターマクロブロックの画素は、まず、O―L(Q1)
が計算され、この差分値に離散コサイン変換が施されて
符号化される。一方、図1に示した動き補償誤差補正装
置12を省略した画像情報変換装置で符号量の更なる削
減が行われた出力画像圧縮情報をネットワーク等を介し
て受信したMPEG-2画像情報復号装置は、この受信した画
像圧縮情報を復号する際に、画像圧縮情報中の離散コサ
イン変換係数は、O―L(Q2)を離散コサイン変換し
て符号化したものと見なすこととなる。図1の構成にお
ける画像情報変換装置では、一般的に、Ql=Q2は成立
しない。このような現象が、Pピクチャ,Bピクチャで
生じるため、動き補償に伴う誤差が発生する。In the MPEG-2 image information coding apparatus, the pixels of the inter macroblock are first expressed by OL (Q 1 )
Is calculated, and a discrete cosine transform is applied to the difference value to encode the difference value. On the other hand, an MPEG-2 image information decoding device which receives, via a network or the like, output image compression information whose code amount has been further reduced by an image information conversion device in which the motion compensation error correction device 12 shown in FIG. 1 is omitted. When decoding the received compressed image information, the discrete cosine transform coefficient in the compressed image information is regarded as a code obtained by performing discrete cosine transform on OL (Q 2 ). In the image information conversion device having the configuration shown in FIG. 1, generally, Q 1 = Q 2 does not hold. Since such a phenomenon occurs in a P picture and a B picture, an error accompanying motion compensation occurs.
【0074】更に、Pピクチャで生じた画質劣化は、後
続のPピクチャ及びこれを参照とするBピクチャに伝播
し、更なる画質劣化に繋がる。このような原理により、
GOPの後ろに行くに従って動き補償に伴う誤差が蓄積す
るため画質が劣化し、次のGOPの先頭でまた良好な画質
に戻るという現象(ドリフト)が生じることになる。Further, the picture quality deterioration occurring in the P picture is propagated to the succeeding P picture and the B picture which refers to the picture, which leads to further picture quality deterioration. With this principle,
As the position following the GOP accumulates errors due to motion compensation, the image quality deteriorates, and a phenomenon (drift) occurs in which the image quality returns to good at the beginning of the next GOP.
【0075】そこで、動き補償誤差補正装置12を設け
るのであるが、その動作は以下の通りである。量子化装
置8の出力となる量子化された離散コサイン変換係数
は、可変長符号化装置11に伝送されると共に、逆量子
化装置13にも伝送され、ここで、量子化幅と量子化行
列に関する情報を基に逆量子化が施される。逆量子化装
置13の出力となる離散コサイン変換係数と、逆量子化
装置5の出力となる離散コサイン変換係数との差分が加
算器14において算出され、この出力が逆離散コサイン
変換装置15に入カされて逆離散コサイン変換が施され
る。その出力は、動き補償誤差補正情報としてビデオメ
モリ16に格納される。Therefore, the motion compensation error correction device 12 is provided, and its operation is as follows. The quantized discrete cosine transform coefficient output from the quantization device 8 is transmitted to the variable length coding device 11 and also to the inverse quantization device 13, where the quantization width and the quantization matrix are calculated. Inverse quantization is performed based on the information about The difference between the discrete cosine transform coefficient output from the inverse quantizer 13 and the discrete cosine transform coefficient output from the inverse quantizer 5 is calculated in the adder 14, and this output is input to the inverse discrete cosine transform device 15. And subjected to an inverse discrete cosine transform. The output is stored in the video memory 16 as motion compensation error correction information.
【0076】画像情報変換装置に入力された画像圧縮情
報内における動き補償予測モード情報(フィールド動き
補償予測モード或いはフレーム動き補償予測モード、及
び、前方向予測モード、後方向予測モード、或いは、双
方向予測モード)及び、動きベクトル情報(圧縮情報解
析装置2により解析、抽出され、動き補償予測装置17
に供給される)を基に、ビデオメモリ16内の動き補償
誤差情報から動き補償予測装置17において動き補償が
行われ、これによって生成されたデータが空間領域での
誤差補正値となる。この補正値を入力とする離散コサイ
ン変換装置18において離散コサイン変換を施すこと
で、周波数領域での誤差補正値が得られる。The motion compensation prediction mode information (field motion compensation prediction mode or frame motion compensation prediction mode, and forward prediction mode, backward prediction mode, or bidirectional) in the image compression information input to the image information conversion apparatus. Prediction mode) and motion vector information (analyzed and extracted by the compression information analysis device 2)
Is supplied to the motion compensation prediction device 17 based on the motion compensation error information in the video memory 16, and the data generated thereby becomes an error correction value in the spatial domain. By performing discrete cosine transform in the discrete cosine transform device 18 that receives the correction value as an input, an error correction value in the frequency domain can be obtained.
【0077】逆離散コサイン変換装置15及び離散コサ
イン変換装置18では、例えば、文献“A fast computa
tional algorithm for the discrete cosine transfor
m”(IEEE Trans.commun.,vol.25.no.9,pp.1004-1009,19
77)に示されている様な高速アルゴリズムを適用するこ
とが可能である。In the inverse discrete cosine transform device 15 and the discrete cosine transform device 18, for example, a document “A fast computa
tional algorithm for the discrete cosine transfor
m ”(IEEE Trans.commun., vol.25.no.9, pp.1004-1009,19
It is possible to apply a fast algorithm as shown in 77).
【0078】また、逆離散コサイン変換装置15及び離
散コサイン変換装置18において、水平方向の離散コサ
イン変換係数は、帯域制限装置7において高域成分係数
が“0”と置き直されているため、これに対する逆離散
コサイン変換及び離散コサイン変換を省くことで、回路
規模及び演算処理量を削減することが可能である。In the inverse discrete cosine transform device 15 and the discrete cosine transform device 18, the horizontal discrete cosine transform coefficient is replaced with the high-frequency component coefficient “0” in the band limiting device 7. By omitting the inverse discrete cosine transform and the discrete cosine transform for, it is possible to reduce the circuit scale and the amount of arithmetic processing.
【0079】更に、画像における色差信号の劣化は、輝
度信号の劣化に比べ、人間の目には分かり難いという特
色を有しているため、上記の動き補償誤差補正を、輝度
信号のみに適用することで、画質劣化を最小に保ちなが
ら回路規模及び演算処理量を大幅に削減することもでき
る。Further, since the deterioration of the color difference signal in the image has a special characteristic that it is difficult for the human eye to understand the deterioration of the luminance signal, the above-described motion compensation error correction is applied only to the luminance signal. Thus, the circuit scale and the amount of arithmetic processing can be significantly reduced while keeping the image quality deterioration to a minimum.
【0080】また、Pピクチャにおける誤差はBピクチ
ャに伝播するが、Bピクチャにおける誤差はそれ以上伝
播しない。一方、Bピクチャには双方向予測モードを含
み、多大なる演算処理量を要する。そこで、Pピクチャ
にのみ動き補償誤差補正を行うことで、画質劣化を最小
に保ちながら回路規模及び演算処理量を大幅に削減する
こともできる。Bピクチャにおける処理を行わないこと
で、ビデオメモリ16の容量を削減することも可能とな
る。The error in the P picture propagates to the B picture, but the error in the B picture does not propagate any further. On the other hand, a B picture includes a bidirectional prediction mode and requires a large amount of calculation processing. Therefore, by performing the motion compensation error correction only on the P picture, the circuit scale and the amount of arithmetic processing can be significantly reduced while keeping the image quality deterioration to a minimum. By not performing the processing on the B picture, the capacity of the video memory 16 can be reduced.
【0081】更にまた、図1の動き補償誤差補正装置1
2では、誤差補正成分として8×8個の離散コサイン変
換係数の全ての成分を用いているが、特に離散コサイン
変換モードがフレーム離散コサイン変換モードであり、
入力画像圧縮情報の走査方式が飛び越し走査である場合
には、垂直方向高域成分の誤差を無視することは大幅な
画質劣化に繋がるものの、水平方向に関しては、8次の
離散コサイン変換係数のうち、高域4成分(0次乃至7
次の離散コサイン変換係数のうちの4次乃至7次の成
分)を無視することによる画質劣化は殆どない。Further, the motion compensation error correction device 1 of FIG.
In No. 2, all components of 8 × 8 discrete cosine transform coefficients are used as error correction components. In particular, the discrete cosine transform mode is a frame discrete cosine transform mode,
If the scanning method of the input image compression information is interlaced scanning, ignoring the error of the high-frequency component in the vertical direction leads to significant image quality degradation, but in the horizontal direction, among the 8th-order discrete cosine transform coefficients, , High-frequency 4 components (0th to 7th
There is almost no degradation in image quality due to ignoring the fourth to seventh order components of the next discrete cosine transform coefficient.
【0082】この事実を利用して、画質劣化を最小限に
抑えながら、逆離散コサイン変換装置15、離散コサイ
ン変換装置18における演算処理量およびビデオメモリ
16における容量を削減することが可能である。By utilizing this fact, it is possible to reduce the amount of arithmetic processing in the inverse discrete cosine transform unit 15 and the discrete cosine transform unit 18 and the capacity in the video memory 16 while minimizing image quality deterioration.
【0083】即ち、逆離散コサイン変換装置15及び離
散コサイン変換装置18において、垂直方向には通常の
8次の処理(8次の逆離散コサイン変換およ1び1/2
画素精度の動き補償)が施されるが、水平方向に関して
は、8次の離散コサイン変換係数のうち、低域4成分
(0次乃至7次の離散コサイン変換係数のうちの0次乃
至3次の成分)のみを用いた処理が行なわれる。これに
より、ビデオメモリ16の水平方向解像度は1/2とな
り、その容量を削減することが可能となる。但し、この
場合、動き補償予測装置17においては、1/4画素精
度の動き補償処理が必要となる。この処理は、画像圧縮
情報中の動きベクトルの値に応じて、図8に示す様に、
1/4画素単位で線形内挿を行うことで、動き補償誤差
に伴う画質劣化を十分に抑制することが可能である。That is, in the inverse discrete cosine transform unit 15 and the discrete cosine transform unit 18, the normal eighth-order processing (eighth-order inverse discrete cosine transform and 1/2) is performed in the vertical direction.
In the horizontal direction, among the 8th-order discrete cosine transform coefficients, four low-frequency components (0th to 3rd order among 0th to 7th order discrete cosine transform coefficients) are applied. Is performed using only the component (i). As a result, the horizontal resolution of the video memory 16 is halved, and its capacity can be reduced. However, in this case, the motion compensation prediction device 17 needs a motion compensation process with quarter-pixel accuracy. This processing is performed according to the value of the motion vector in the image compression information as shown in FIG.
By performing linear interpolation in units of 1/4 pixel, it is possible to sufficiently suppress image quality deterioration due to a motion compensation error.
【0084】水平方向に対する処理としては、以下の2
つの手法が考えられる。The processing in the horizontal direction is as follows.
There are two approaches.
【0085】第1の手法は、逆離散コサイン変換装置1
5が、8次の離散コサイン変換係数のうち、低域4次係
数のみに対して4次の逆離散コサイン変換を施し、離散
コサイン変換装置18が、ビデオメモリ16から動き補
償によって作られた画素領域での各ブロックの4×8個
のの誤差補正値に対して、水平方向には4次の離散コサ
イン変換を施すことで、4×8個のの周波数領域での誤
差補正値を出力するというものである。The first method is the inverse discrete cosine transform device 1
5 performs a fourth-order inverse discrete cosine transform on only the low-frequency fourth-order coefficient among the eighth-order discrete cosine transform coefficients, and the discrete cosine transform unit 18 calculates a pixel generated by the motion compensation from the video memory 16. Fourth-order discrete cosine transform is performed in the horizontal direction on the 4 × 8 error correction values of each block in the region, thereby outputting 4 × 8 error correction values in the frequency region. That is.
【0086】4次の逆離散コサイン変換及び離散コサイ
ン変換に高速アルゴリズムを用いることで、更なる処理
量の削減が可能となる。図9は、公知のWangのアルゴリ
ズム(文献:Zhong de Wang.,“Fast Algorithms for t
he Discrete W Transform and for the Discrete Fouri
er Transform",IEEE Tr.ASSP-32,No.4,pp.803-816,Aug.
1984)に基づく4次の離散コサイン変換・逆離散コサイ
ン変換処理を示す図である。図9において、データF
(0)乃至F(3)を入力とし、データf(0)乃至f
(3)を出力とすることで、逆離散コサイン変換が実現
され、データf(0)乃至f(3)を入力とし、データ
F(0)乃至F(3)を出力とすることで離散コサイン
変換が実現される。By using a high-speed algorithm for the fourth-order inverse discrete cosine transform and discrete cosine transform, it is possible to further reduce the processing amount. FIG. 9 shows a known Wang algorithm (literature: Zhong de Wang., “Fast Algorithms for t
he Discrete W Transform and for the Discrete Fouri
er Transform ", IEEE Tr. ASSP-32, No. 4, pp. 803-816, Aug.
FIG. 18 is a diagram illustrating a fourth-order discrete cosine transform / inverse discrete cosine transform process based on 1984). In FIG. 9, data F
(0) to F (3) are input and data f (0) to f (3) are input.
By making (3) an output, an inverse discrete cosine transform is realized, and by inputting data f (0) to f (3) and outputting data F (0) to F (3), a discrete cosine transform is obtained. Conversion is realized.
【0087】例えば、データF(0)とF(2)は、加
算器31と加算器34に入力される。加算器31は、デ
ータF(0)とデータF(2)とを加算し、演算器32
に出力する。演算器32は、加算器31の出力(F(0)
+F(2))に、係数1/√2を乗算し、加算器33と加
算器44に出力する。For example, the data F (0) and F (2) are input to the adders 31 and 34. The adder 31 adds the data F (0) and the data F (2),
Output to The arithmetic unit 32 outputs the output of the adder 31 (F (0)
+ F (2)) is multiplied by a coefficient 1 / √2, and output to the adder 33 and the adder 44.
【0088】加算器34は、データF(0)に、データ
F(2)を逆極性で加算(減算)し、演算器35に出力
する。演算器35は、加算器34の出力(F(0)−F
(2))に、係数1/√2を乗算し、加算器36と加算器
39に出力する。The adder 34 adds (subtracts) the data F (2) to the data F (0) with the opposite polarity and outputs the result to the computing unit 35. The arithmetic unit 35 outputs the output of the adder 34 (F (0) -F
(2)) is multiplied by a coefficient 1 / √2, and output to the adder 36 and the adder 39.
【0089】加算器33は、演算器32の出力と、加算
器43の出力とを加算し、データf(0)として出力す
る。The adder 33 adds the output of the arithmetic unit 32 and the output of the adder 43 and outputs the result as data f (0).
【0090】加算器36は、演算器35の出力と、加算
器38の出力とを加算し、データf(1)として出力す
る。The adder 36 adds the output of the arithmetic unit 35 and the output of the adder 38 and outputs the result as data f (1).
【0091】データF(3)は、演算器37と加算器4
1に入力される。演算器37は、データF(3)に、
(数27)に示すような演算を施して、加算器38に出
力する。The data F (3) is supplied to the arithmetic unit 37 and the adder 4
1 is input. The arithmetic unit 37 converts the data F (3) into
The calculation shown in (Equation 27) is performed, and the result is output to the adder 38.
【数27】 [Equation 27]
【0092】演算器40は、データF(1)に対して、
(数28)で示す演算を施して、加算器43に出力する。The arithmetic unit 40 calculates the data F (1)
The calculation represented by (Equation 28) is performed, and the result is output to the adder 43.
【数28】 [Equation 28]
【0093】加算器41は、データF(3)に対して、
データF(1)を逆極性で加算し(減算し)、演算器4
2に出力する。演算器42は、加算器41より入力され
たデータに対して、(数29)で示す演算を施し、加算
器38と加算器43に出力する。The adder 41 calculates the data F (3)
The data F (1) is added (subtracted) with the opposite polarity, and the arithmetic unit 4
Output to 2. The arithmetic unit 42 performs an operation represented by (Equation 29) on the data input from the adder 41, and outputs the data to the adder 38 and the adder 43.
【数29】 (Equation 29)
【0094】加算器38は、演算器37の出力に対し
て、演算器42の出力を逆極性で加算し(減算し)、加
算器36と加算器39に出力する。加算器39は、演算
器35の出力に対して、加算器38の出力を逆極性で加
算し(減算し)、データf(2)として出力する。The adder 38 adds (subtracts) the output of the arithmetic unit 42 to the output of the arithmetic unit 37 with the opposite polarity (subtraction), and outputs the result to the adders 36 and 39. The adder 39 adds (subtracts) the output of the adder 38 to the output of the arithmetic unit 35 with the opposite polarity (subtracts), and outputs the result as data f (2).
【0095】加算器43は、演算器40の出力と、演算
器42の出力を加算し、加算器33と加算器44に出力
する。加算器44は、演算器32の出力に対して、加算
器43の出力を逆極性で加算し(減算し)、データf
(3)として出力する。The adder 43 adds the output of the arithmetic unit 40 and the output of the arithmetic unit 42 and outputs the result to the adders 33 and 44. The adder 44 adds (subtracts) the output of the adder 43 to the output of the arithmetic unit 32 with the opposite polarity (subtraction), and outputs the data f.
Output as (3).
【0096】水平方向に対する処理の第2の手法は、逆
離散コサイン変換装置15が、高域4係数を“0”と置
き換えて、8次の逆離散コサイン変換を施し、間引き処
理若しくは平均処理を行って画素領域の4点の誤差補正
値を出力とし、離散コサイン変換装置18が、動き補償
予測装置17の動き補償によって得られた画素領域の4
点の誤差補正値を、補間処理によって8点にし、これに
離散コサイン変換を施した後、4次までの低域を取り出
すことで、4×8個の周波数領域での誤差補正値を出力
する。逆離散コサイン変換装置15、離散コサイン変換
装置18夫々における処理において、一連の処理と等価
な行列を予め算出しておき、これを、夫々の入力となる
係数に直接施すことで、更なる処理量の削減が可能とな
る。In a second method of processing in the horizontal direction, the inverse discrete cosine transform unit 15 performs an 8th-order inverse discrete cosine transform by replacing the high-frequency 4 coefficients with “0”, and performs a thinning process or an averaging process. Then, the error correction values of the four points in the pixel area are output, and the discrete cosine transform unit 18 outputs the four error correction values of the pixel area obtained by the motion compensation of the motion compensation prediction unit 17.
The error correction value of the point is set to 8 points by interpolation processing, and after performing a discrete cosine transform on this point, the low frequency band up to the fourth order is extracted to output error correction values in 4 × 8 frequency domains. . In the processing by each of the inverse discrete cosine transform device 15 and the discrete cosine transform device 18, a matrix equivalent to a series of processes is calculated in advance, and the matrix is directly applied to each input coefficient, thereby further increasing the processing amount. Can be reduced.
【0097】逆離散コサイン変換装置15が、高域4係
数を“0”と置き換え、8次の逆離散コサイン変換を施
した後の処理が、間引き処理である場合、及び、平均処
理である場合の、一連の処理と等価な行列(個別に順次
乗算する行列A,B,Cを、予めすべて乗算して得た行
列A*B*C)を、夫々iD4_deci,iD4_aveとし、
この夫々の場合において、離散コサイン変換装置18に
おいて施される一連の処理と等価な行列をD4_deci,D
4_aveとする。行列iD4_deci,iD4_aveを、図10
(A),(B)に示す。D4_deci,D4_aveについて
は、When the inverse discrete cosine transform unit 15 replaces the high-frequency four coefficients with “0” and performs the eighth-order inverse discrete cosine transform, the process is a thinning process, and the process is an averaging process. the series of processes equivalent matrix (individually sequentially multiplying matrices a, B, and C, previously all matrix a * B * C where obtained by multiplying) was respectively iD 4 _ deci, and iD 4 _ ave ,
In each case, a matrix equivalent to a series of processes performed in the discrete cosine transform unit 18 is represented by D 4 _ deci , D
4 _ave . The matrices iD 4 _ deci and iD 4 _ave are shown in FIG.
(A) and (B) show. For D 4 _ deci and D 4 _ ave ,
【数30】 [Equation 30]
【数31】 が成立するものとする。ここで、t( )は転置行列を表
す。また、図10において、iD8は、8次の逆離散コ
サイン変換係数を表す。(Equation 31) Is established. Here, t () represents a transposed matrix. In FIG. 10, iD 8 represents an eighth-order inverse discrete cosine transform coefficient.
【0098】更に、一般的に、輝度信号に比べ、色差信
号は、その劣化が人間の目に付き難いことが知られてい
る。そこで、色差信号に関しては、更なる処理量の削減
を行うことも可能である。すなわち、逆離散コサイン変
換装置15および離散コサイン変換装置18において、
上記4×8個の誤差補正信号のうち、色差信号の誤差補
正成分に関しては、図11に示すように、垂直方向の低
域係数のみ(例えぱ4×4個)を補正に用い、残りの高
域係数に関しては“0”と置き換えることで、誤差補正
に伴う演算処理量を更に削減することができる。Further, it is generally known that the deterioration of the color difference signal is less noticeable to human eyes than the luminance signal. Therefore, the processing amount of the color difference signal can be further reduced. That is, in the inverse discrete cosine transform device 15 and the discrete cosine transform device 18,
As for the error correction component of the color difference signal among the 4 × 8 error correction signals, as shown in FIG. 11, only the low frequency coefficients in the vertical direction (for example, ぱ 4 × 4) are used for correction, and the remaining By replacing the high-frequency coefficient with “0”, the amount of arithmetic processing involved in error correction can be further reduced.
【0099】図12乃至図14は、CCIR(Consultative
Committee on InternationalRadio)(現在のITU(I
nternationnal Telecommunication Union)−R)にお
いて、画質評価に使用するように規定された標準画像の
1つであるテストシーケンス“Mobile & Calendar”
を、符号量制御を行わず、量子化幅を一定にして符号化
した場合の符号量(ビット数)と量子化幅(Q_scale)
の関係を示す図である。図12は、Iピクチャにおける
量子化幅を“14”から“112”まで変化させた場合
の、符号量と量子化幅の関係を示した図である。図13
は、参照となるIピクチャの量子化幅を“14”に固定
し、Pピクチャの量子化幅を“14”から“112”ま
で変化させた場合の、符号量と量子化幅の関係を示した
図である。図14は、参照となるPピクチャの量子化幅
を“14”に固定し、Bピクチャの量子化幅を“18”
から“112”まで変化させた場合の、符号量と量子化
幅の関係を示した図である。FIGS. 12 to 14 show CCIR (Consultative).
Committee on InternationalRadio) (Current ITU (I
test sequence “Mobile & Calendar”, which is one of the standard images specified for use in image quality evaluation in the nternationnal Telecommunication Union) -R)
Is the code amount (the number of bits) and the quantization width (Q_scale) when encoding is performed with a fixed quantization width without performing the code amount control.
FIG. FIG. 12 is a diagram illustrating the relationship between the code amount and the quantization width when the quantization width in the I picture is changed from “14” to “112”. FIG.
Shows the relationship between the code amount and the quantization width when the quantization width of the reference I picture is fixed at “14” and the quantization width of the P picture is changed from “14” to “112”. FIG. FIG. 14 shows that the quantization width of the reference P picture is fixed to “14” and the quantization width of the B picture is “18”.
FIG. 10 is a diagram showing a relationship between a code amount and a quantization width when changing from “1” to “112”.
【0100】MPEG-2 Test Model 5と図1に示した画像
情報変換装置において、符号量制御を行う際の各ピクチ
ャを符号化するのに用いる平均量子化スケールコードと
発生符号量の積は、画面が変化しない限りピクチャタイ
プ毎に一定値になるという仮定の元に処理が行われてい
る。In the MPEG-2 Test Model 5 and the image information conversion apparatus shown in FIG. 1, the product of the average quantization scale code and the generated code amount used for coding each picture when performing the code amount control is: The processing is performed on the assumption that the value becomes constant for each picture type unless the screen changes.
【0101】しかしながら、図12乃至図14からも分
かる通り、Iピクチャ,Pピクチャ,Bピクチャの夫々
における発生符号量は、量子化幅に依存する部分(図
中、水平に近い部分)と依存しない部分(図中、垂直に
近い部分)に別れる。前者は、量子化された離散コサイ
ン変換係数に相当する分であり、後者は動きベクトルな
どのヘッダ情報に関する分である。各ピクチャを符号化
するのに用いられる平均量子化スケールコードと、発生
符号量のうち離散コサイン変換係数に割り当てられた符
号量(ビット数)の積は一定となるが、各ピクチャを符
号化するのに用いられる平均量子化スケールコードと発
生符号量の積は必ずしも一定とならない。However, as can be seen from FIGS. 12 to 14, the amount of generated code in each of the I picture, P picture, and B picture does not depend on a portion depending on the quantization width (a portion near the horizontal in the drawings). It is divided into parts (parts near the vertical in the figure). The former relates to a quantized discrete cosine transform coefficient, and the latter relates to header information such as a motion vector. Although the product of the average quantization scale code used to encode each picture and the code amount (number of bits) allocated to the discrete cosine transform coefficient of the generated code amount is constant, each picture is encoded. Is not always constant.
【0102】上述の事実は、量子化幅が十分細かい場合
には、離散コサイン変換係数に割り当てられる符号量
(ビット数)に比ベ、ヘッダ情報に割り当てられる符号
量(ビット数)は無視できる程度であるため、実際に符
号量制御を行う際にはさほど間題とならないことを示す
が、より低い符号量(低ビットレート)で符号化する場
合には、ヘッダ情報に割り当てられる符号量が無視でき
ない程度の割合を占めるまでになることを示す。特に、
Bピクチャにおいては、双方向予測モードを含むため、
絵柄によっては、動きベクトルに割り当てられる符号量
が無視できない程度に増大し、安定した符号量制御を行
う妨げとなり、バッファが破綻する原因になることも予
想される。The above fact indicates that when the quantization width is sufficiently small, the code amount (bit number) assigned to the header information is negligible compared to the code amount (bit number) assigned to the discrete cosine transform coefficient. Therefore, when coding with a lower code amount (low bit rate), the code amount allocated to the header information is ignored. Indicates that the ratio will not be possible. In particular,
Since the B picture includes the bidirectional prediction mode,
For some pictures, the code amount allocated to the motion vector increases to a non-negligible degree, hinders stable code amount control, and may be a cause of buffer failure.
【0103】MPEG-2画像情報符号化装置においては、こ
の問題を解決する手法として、前述した文献“Bit-rate
control for MPEG encoders"(G.Keesman,I.Shahand R.
Klein-Gunnewiek,Signal Processing Image Communicat
ion 6,pp.545-560,1995)で、フレーム符号量を、量子化
幅に依存する離散コサイン変換係数部の符号量と、量子
化幅に依存しないヘッダ部の符号量とに分離して符号量
配分を行う手法が提案されている。In the MPEG-2 image information encoding apparatus, as a method for solving this problem, the above-mentioned document “Bit-rate
control for MPEG encoders "(G. Keesman, I. Shahand R.
Klein-Gunnewiek, Signal Processing Image Communicat
ion 6, pp. 545-560, 1995), the frame code amount is separated into the code amount of the discrete cosine transform coefficient part that depends on the quantization width and the code amount of the header part that does not depend on the quantization width. Techniques for performing code amount distribution have been proposed.
【0104】この提案に係るへッダ部の符号量配分は、
固定量子化器での符号化処理による事前解析から導か
れ、離散コサイン変換係数部での符号量配分は、Test M
ode1 5で述べられている手法と同様、パラメータXに基
づいて行われるが、パラメータXは、離散コサイン変換
係数部の発生符号量と量子化幅の積で計算される。The code amount distribution of the header section according to this proposal is as follows.
Derived from the pre-analysis by the coding process in the fixed quantizer, the code amount distribution in the discrete cosine transform coefficient part is
Similar to the method described in ode15, the calculation is performed based on the parameter X, but the parameter X is calculated by the product of the generated code amount of the discrete cosine transform coefficient unit and the quantization width.
【0105】このMPEG-2画像情報符号化装置に対する符
号量配分の提案は、固定量子化器での符号化処理に要す
る演算処理量と回路規模の増大を招くという問題があ
り、この問題を解決しないと、図1の画像情報変換装置
に適用することが難しい。演算処理量と回路規模の増大
を回避しつつ、符号量配分を適切に行うようにした。The proposal of the code amount distribution for the MPEG-2 image information coding apparatus has a problem that the calculation processing amount and the circuit scale required for the coding process in the fixed quantizer are increased, and this problem is solved. Otherwise, it is difficult to apply to the image information conversion device of FIG. The code amount is appropriately distributed while avoiding an increase in the amount of arithmetic processing and the circuit scale.
【0106】図15は、本発明の画像情報変換装置の構
成図である。この実施の形態では、圧縮情報解析装置2
で解析し、情報バッファ3に格納したデータを利用して
上記の符号量配分を行う構成とすることで、演算処理量
の増大と回路規模の増大を回避している。そのため、図
1の符号量制御装置9に対応する符号量制御装置51の
構成が、図1の実施の形態と異なっている。符号量制御
装置51には、ヘッダ符号量バッファ52と、Complexi
ty算出器53、および目標符号量算出器54が設けられ
ている。その他の符号バッファ1,圧縮情報解析装置
2,可変長復号装置4,逆量子化装置5,加算器6,帯
域制限装置7,量子化装置8,符号バッファ10,可変
長符号化装置11,および動き補償誤差補正装置12の
構成は、図1の実施の形態と同じである。FIG. 15 is a block diagram of the image information conversion apparatus of the present invention. In this embodiment, the compression information analyzer 2
By performing the above-described code amount distribution using the data stored in the information buffer 3, the increase in the amount of arithmetic processing and the increase in the circuit scale are avoided. Therefore, the configuration of the code amount control device 51 corresponding to the code amount control device 9 of FIG. 1 is different from the embodiment of FIG. The code amount control device 51 includes a header code amount buffer 52 and a Complexi
A ty calculator 53 and a target code amount calculator 54 are provided. Other code buffer 1, compression information analysis device 2, variable length decoding device 4, inverse quantization device 5, adder 6, band limiting device 7, quantization device 8, code buffer 10, variable length coding device 11, and The configuration of the motion compensation error correction device 12 is the same as the embodiment of FIG.
【0107】この画像情報変換装置においては、図1の
画像情報変換装置と同様に、圧縮情報解析装置2が画像
圧縮情報(ビットストリーム)の構文解析を行い、以下
の処理に必要な符号化された情報を抽出し、それらの情
報のうち、以下の処理に必要なものを情報バッファ3に
格納する。可変長復号装置4は、圧縮情報解析装置2か
ら抽出される走査方式に関する情報(ジグザグスキャン
若しくはオルタネートスキャン)に応じて、可変長符号
化された離散コサイン変換係数を可変長復号する。In this image information conversion device, similarly to the image information conversion device of FIG. 1, the compression information analysis device 2 analyzes the syntax of the image compression information (bit stream), and encodes the encoded information necessary for the following processing. The information necessary for the following processing is extracted from the extracted information and stored in the information buffer 3. The variable-length decoding device 4 performs variable-length decoding of the variable-length-coded discrete cosine transform coefficients according to the information (zigzag scan or alternate scan) regarding the scanning method extracted from the compression information analysis device 2.
【0108】逆量子化装置5は、圧縮情報解析装置2か
ら抽出される量子化に関する情報(量子化スケール及び
量子化行列)に応じて、離散コサイン変換係数の逆量子
化を行う。帯域制限装置7は、逆量子化装置5の出力と
なる離散コサイン変換係数の高域成分係数を“0”と置
いたり、重み係数を乗じることで、画像の持つ解像度を
落とす。量子化装置8は、出力となる画像圧縮情報(ビ
ットストリーム)の画像情報量(ターゲットビットレー
ト)に応じた量子化幅により、離散コサイン変換係数の
再量子化を行う。可変長符号化装置11は、離散コサイ
ン変換係数の可変長符号化を行う。The inverse quantization device 5 inversely quantizes the discrete cosine transform coefficients according to the information (quantization scale and quantization matrix) relating to the quantization extracted from the compression information analysis device 2. The band limiting device 7 lowers the resolution of the image by setting the high-frequency component coefficient of the discrete cosine transform coefficient output from the inverse quantization device 5 to “0” or multiplying by a weight coefficient. The quantization device 8 re-quantizes the discrete cosine transform coefficients using a quantization width corresponding to the image information amount (target bit rate) of the image compression information (bit stream) to be output. The variable length coding device 11 performs variable length coding of discrete cosine transform coefficients.
【0109】符号量制御装置51は、図1の符号量制御
装置9と同様に、可変長復号化された後の画像圧縮情報
が、符号バッファ10のオーバーフロー若しくはアンダ
ーフローを起こさないように、与えられた目標符号量お
よび情報バッファ3から抽出される量子化幅の制御を行
う。As in the code amount control device 9 shown in FIG. 1, the code amount control device 51 provides the compressed image information after the variable length decoding so that the code buffer 10 does not overflow or underflow. The obtained target code amount and the quantization width extracted from the information buffer 3 are controlled.
【0110】更に、本実施の形態に係る符号量制御装置
51の構成要素であるへッダ符号量バッファ52は、入
力された画像圧縮情報の中で、各フレームに割り当てら
れたヘッダ部に対する符号量に関する情報を格納する。
また、コンプレクシティ(Complexity)算出器53は、
情報バッファ3に格納された入力画像圧縮情報内の各フ
レームの離散コサイン変換係数に対して割り当てられた
符号量及び量子化スケールから各フレームのコンプレク
シティを算出する。Further, a header code amount buffer 52, which is a component of the code amount control device 51 according to the present embodiment, stores a code for a header portion assigned to each frame in the input image compression information. Stores information about the quantity.
Further, the Complexity calculator 53 calculates
The complexity of each frame is calculated from the code amount and the quantization scale assigned to the discrete cosine transform coefficient of each frame in the input image compression information stored in the information buffer 3.
【0111】目標符号量算出器54は、コンプレクシテ
ィ算出器53において算出された各フレームの算出結果
を基に、出力となる画像圧縮情報中の各フレームに最適
な離散コサイン変換係数に対する符号量を算出し、更
に、この符号量に、へッダ符号量バッファ52に格納さ
れた値(ビット数)を合計することで、当該フレームの
目標符号量(ターゲットビット)とする。動き補償誤差
補正装置12は、各マクロブロックの動き補償誤差をビ
デオメモリ16に格納し、この格納された誤差値を、入
力された画像圧縮情報より抽出された動きベクトルと予
測モードに関する情報に応じて取り出し、誤差補正を行
う。The target code amount calculator 54 calculates the code amount for the discrete cosine transform coefficient optimum for each frame in the image compression information to be output, based on the calculation result of each frame calculated by the complexity calculator 53. Calculated, and furthermore, the value (the number of bits) stored in the header code amount buffer 52 is added to this code amount, thereby obtaining a target code amount (target bit) of the frame. The motion compensation error correction device 12 stores the motion compensation error of each macroblock in the video memory 16, and determines the stored error value according to the motion vector extracted from the input image compression information and the information on the prediction mode. Take out and correct the error.
【0112】次に、図16のフローチャートを参照し
て、その動作を説明する。今ここで、Rを、図6に示し
た擬似GOP内の未符号化フレームに対して割り当てられ
る符号量であるとする。MPEG-2 Test Mode1 5で定めら
れているのと同様、擬似GOPの初めに、目標符号量算出
器54は、Rを以下のように算出する(ステップS2
1)。Next, the operation will be described with reference to the flowchart of FIG. Here, it is assumed that R is a code amount allocated to an uncoded frame in the pseudo GOP shown in FIG. At the beginning of the pseudo GOP, the target code amount calculator 54 calculates R as follows in the same manner as defined in MPEG-2 Test Mode 15 (step S2).
1).
【数32】 (Equation 32)
【0113】ここで、Nは擬似GOP内のピクチャ数(フ
レーム数)であり、bit_rateは出力となる画像圧縮情報
の符号量であり、picture_rateは出力となる画像が毎秒
何フレーム表示されるかを表す値である。シーケンスの
最初でのRの初期値は“0”とされる。Here, N is the number of pictures (the number of frames) in the pseudo GOP, bit_rate is the code amount of the output image compression information, and picture_rate is the number of frames of the output image to be displayed per second. Is the value to represent. The initial value of R at the beginning of the sequence is "0".
【0114】次に、目標符号量算出器54は、圧縮情報
解析装置2より検出された、擬似GOP内の各フレームの
ヘッダ部に割り当てられた符号量Theaderを、ヘッダ符
号量バッファ52を介して入力し、その合計Rheadを次
式で求める(ステップS22)。Next, the target code amount calculator 54 outputs, via the header code amount buffer 52, the code amount T header detected by the compression information analyzer 2 and assigned to the header portion of each frame in the pseudo GOP. Then, the total R head is obtained by the following equation (step S22).
【数33】 [Equation 33]
【0115】目標符号量算出器54は、ステップS21
の処理で与えられる符号量Rのうち、離散コサイン変換
係数に割り当てられる符号量Rcoefを、The target code amount calculator 54 determines in step S21
The code amount R coef assigned to the discrete cosine transform coefficient among the code amount R given by the processing of
【数34】 のように算出する(ステップS23)。[Equation 34] (Step S23).
【0116】コンプレクシティ算出器53は、(数2
3)に対応して、当該フレームに対するコンプレクシテ
ィ Xを以下のように計算する(ステップS24)。The complexity calculator 53 calculates (Equation 2)
According to 3), the complexity X for the frame is calculated as follows (step S24).
【数35】 (Equation 35)
【0117】ここで、Qは(数23)と同様、入力され
た画像圧縮情報における平均量子化スケールコードであ
り、また、Scoefは、入力された画像圧縮情報におい
て、当該フレームに実際に割り当てられている総符号量
(ビット数)のうち、離散コサイン変換係数に割り当て
られた分である。Here, Q is the average quantization scale code in the input image compression information, as in (Equation 23), and S coef is the value actually assigned to the frame in the input image compression information. Of the total code amount (the number of bits) assigned to the discrete cosine transform coefficient.
【0118】目標符号量算出器54は、(数35)によ
って計算された各フレームのコンプレクシティを基に、
まず、(数18)乃至(数20)に対応して、以下のよ
うに、目標符号量(ターゲットビット)のうち離散コサ
イン変換係数に割り当てられる分を計算する(ステップ
S25)。The target code amount calculator 54 calculates the target code amount based on the complexity of each frame calculated by (Equation 35).
First, corresponding to (Equation 18) to (Equation 20), the portion of the target code amount (target bit) allocated to the discrete cosine transform coefficient is calculated as follows (step S25).
【数36】 [Equation 36]
【数37】 (37)
【数38】 ここで、Kp=1.0,Kb=1.4とされる。(38) Here, Kp = 1.0 and Kb = 1.4.
【0119】次に、目標符号量算出器54は、へッダ符
号量バッファ52に貯えられた情報Theader、及び(数
36)乃至(数38)によって算出されたTcoefを用い
て、当該フレームに対する目標符号量Tを以下のように
算出し、その値に対応して量子化装置8を制御する(ス
テップS26)。Next, the target code amount calculator 54 uses the information T header stored in the header code amount buffer 52 and T coef calculated by (Equation 36) to ( Equation 38) to obtain the target code amount. The target code amount T for the frame is calculated as follows, and the quantization device 8 is controlled in accordance with the calculated value (step S26).
【数39】 [Equation 39]
【0120】目標符号量算出器54は、符号量Rcoef
を、当該フレームの再符号化が終わり、その発生符号量
のうち、離散コサイン変換係数に割り当てられた分S
coefをgenereted_bit_coefで表すとすると、以下の数式
により更新する(ステップS27)。The target code amount calculator 54 calculates the code amount R coef
Is the amount S of the generated code amount that is assigned to the discrete cosine transform coefficient.
Assuming that coef is represented by genered_bit_coef, it is updated by the following equation (step S27).
【数40】 (Equation 40)
【0121】その後、ステップS28で、処理の終了が
指令されたか否かが判定され、指令されていない場合、
処理はステップS24に戻り、それ以降の処理が繰り返
される。ステップS28で、終了が指令されていると判
定された場合、目標符号量算出器54は処理を終了させ
る。Thereafter, in step S28, it is determined whether or not the end of the process has been instructed.
The process returns to step S24, and the subsequent processes are repeated. If it is determined in step S28 that termination has been instructed, the target code amount calculator 54 terminates the processing.
【0122】ところで、(数36)乃至(数38)で
は、Kp=1.0,Kb=1.4とし、固定された値を
用いているが、文献”MPEG圧縮効率の理論解析とそ
の符号量制御への応用”(甲藤・太田、信学技報、IE−
95,DSP95-10,1995年5月)に述べられている手法を用
い、入力された画像圧縮情報における各フレームのコン
プレクシティに応じ、Kp,Kbを動的に制御すること
で、更なる高画質化を計ることができる。By the way, in (Equation 36) to (Equation 38), Kp = 1.0 and Kb = 1.4, and fixed values are used. Application to volume control ”(Koto and Ota, IEICE Technical Report, IE-
95, DSP95-10, May 1995), and dynamically controlling Kp and Kb in accordance with the complexity of each frame in the input image compression information, thereby increasing the height. Image quality can be measured.
【0123】その手法を用いる場合、目標符号量算出器
54は、Kp及びKbを以下のように算出する。When using that method, the target code amount calculator 54 calculates Kp and Kb as follows.
【数41】 (Equation 41)
【数42】 (Equation 42)
【0124】上記の文献との違いは、コンプレクシティ
Xを算出するのに、(数35)に示した通り、当該フレ
ームに割り当てられた総符号量(ビット数)S(数2
3)ではなく、当該フレームの離散コサイン変換係数に
割り当てられた符号量Scoefを用いる点にある。The difference from the above document is that complexity
To calculate X, as shown in (Equation 35), the total code amount (number of bits) S (Equation 2)
Instead of 3), the code amount Scoef assigned to the discrete cosine transform coefficient of the frame is used.
【0125】(数41)と(数42)中の1/(1+
m)の値に関しては、文献にも述べられている通り、そ
の値を0.6乃至1.2程度に設定することで、各フレ
ームに対する符号量割当を最適なものとすることができ
る。特に、1/(1+m)の値を1.0と設定すると、
(数41)と(数42)の実行に指数演算を必要としな
いため、高速な実行が可能となる。また、1/(1+
m)の値を1.0以外に設定した場合には、予めテーブ
ルを用意し、これを参照し指数演算を行うことによっ
て、(数41)と(数42)の高速な実現が可能とな
る。1 / (1+) in (Equation 41) and (Equation 42)
Regarding the value of m), as described in the literature, by setting the value to about 0.6 to 1.2, the code amount allocation to each frame can be optimized. In particular, if the value of 1 / (1 + m) is set to 1.0,
Since the exponential calculation is not required for executing (Equation 41) and (Equation 42), high-speed execution is possible. Also, 1 / (1+
When the value of m) is set to a value other than 1.0, a table is prepared in advance, and an exponent operation is performed with reference to the table, thereby enabling high-speed realization of (Equation 41) and (Equation 42). .
【0126】次に、目標符号量算出器54は、(数3
6)乃至(数38)に対応して、各フレームの離散コサ
イン変換係数に対する目標符号量Ti,coef,
Tp,coef,Tb,coefを以下のように算出する。Next, the target code amount calculator 54 calculates (Equation 3)
6) to (Equation 38), the target code amount T i , coef , for the discrete cosine transform coefficient of each frame.
T p, coef, T b, is calculated as follows coef.
【数43】 [Equation 43]
【数44】 [Equation 44]
【数45】 [Equation 45]
【0127】但し、パラメータKp,Kbは、符号量制
御装置51において、シーケンスの最初における仮想バ
ッファの初期値を与える際にも必要となる。演算を簡略
化するため、この初期値を与えるためのKp,Kbの値
は、Kp=1.0,Kb=1.4とする。However, the parameters Kp and Kb are also required when the code amount control device 51 gives the initial value of the virtual buffer at the beginning of the sequence. In order to simplify the calculation, the values of Kp and Kb for providing the initial values are Kp = 1.0 and Kb = 1.4.
【0128】以上、MPEG-2方式による画像圧縮情報を上
述した実施の形態に係る画像情報変換装置の入力対象と
したが、MPEG-1や、H.263などのように、直交変換また
は直交変換と動き補償とによって符号化された画像圧縮
情報であれば、本発明の実施の形態に係る画像情報変換
装置と同様の構成で符号量の削減が可能となる。As described above, the image compression information according to the MPEG-2 method is input to the image information conversion apparatus according to the above-described embodiment. However, as in MPEG-1 and H.263, orthogonal transformation or orthogonal transformation is performed. If the image compression information is encoded by using the motion compensation and the motion compensation, the code amount can be reduced with the same configuration as the image information conversion device according to the embodiment of the present invention.
【0129】尚、上述した各実施の形態では、画像情報
変換装置として説明したが、これらの装置構成を、ハー
ドウェアではなく、ソフトウェアだけでも実現できる。
また、復号部から符号化部への情報(画素データ)の受
け渡しを周波数領域で行う実施の形態について説明した
が、空間領域で行う画像情報変換装置にも本発明を適用
することが可能である。In each of the above-described embodiments, the image information conversion device has been described. However, these device configurations can be realized only by software, not hardware.
Also, an embodiment has been described in which information (pixel data) is passed from the decoding unit to the encoding unit in the frequency domain. However, the present invention can be applied to an image information conversion device that performs transmission in the spatial domain. .
【0130】[0130]
【発明の効果】以上の如く、請求項1に記載の画像情報
変換装置、請求項19に記載の画像情報変換方法、およ
び請求項20に記載の記録媒体に記録されているプログ
ラムによれば、ヘッダ部に割り当てられてた符号量に基
づいて、画像圧縮情報の直交変換係数に割り当てる符号
量を演算するようにしたので、演算数量と回路規模の増
大を回避しつつ、適切に符号量を配分することが可能と
なる。As described above, according to the image information conversion apparatus according to claim 1, the image information conversion method according to claim 19, and the program recorded on the recording medium according to claim 20, The code amount allocated to the orthogonal transform coefficient of the image compression information is calculated based on the code amount allocated to the header part, so that the code amount is appropriately distributed while avoiding an increase in the calculation amount and the circuit scale. It is possible to do.
【図1】本発明に係る画像情報変換装置の構成を示すブ
ロック図である。FIG. 1 is a block diagram showing a configuration of an image information conversion device according to the present invention.
【図2】ジグザグスキャン方式のスキャン順を説明する
図である。FIG. 2 is a diagram illustrating a scan order of a zigzag scan method.
【図3】オルタネートスキャン方式のスキャン順を説明
する図である。FIG. 3 is a diagram illustrating a scan order of an alternate scan method.
【図4】図1の帯域制限装置の動作を説明する図であ
る。FIG. 4 is a diagram for explaining the operation of the band limiting device of FIG. 1;
【図5】図1の符号量制御装置における動作手順を示す
フローチャートである。FIG. 5 is a flowchart showing an operation procedure in the code amount control device of FIG. 1;
【図6】図1の符号量制御装置で擬似的なGOPの構造を
決定する処理を説明する図である。FIG. 6 is a diagram illustrating a process of determining a pseudo GOP structure in the code amount control device of FIG. 1;
【図7】図1の可変長符号化装置でスキャン方式の変換
を行う利点を説明する図である。FIG. 7 is a diagram for explaining an advantage of performing a scan method conversion by the variable length coding device of FIG. 1;
【図8】線形内挿により1/4画素精度の補間を行う場
合の動き補償予測装置の動作原理を示す図である。FIG. 8 is a diagram illustrating an operation principle of the motion compensation prediction apparatus when performing interpolation with 1 / pixel accuracy by linear interpolation.
【図9】Wangの高速アルゴリズムに基づく4次の離
散コサイン変換・逆離散コサイン変換処理を行う装置の
構成を示すブロック図である。FIG. 9 is a block diagram illustrating a configuration of an apparatus that performs fourth-order discrete cosine transform / inverse discrete cosine transform processing based on Wang's high-speed algorithm.
【図10】図1の逆離散コサイン変換装置における処理
に等価な行列の算出方法を示す図である。FIG. 10 is a diagram showing a method of calculating a matrix equivalent to processing in the inverse discrete cosine transform device of FIG. 1;
【図11】図1の逆離散コサイン変換装置及び離散コサ
イン変換装置で色差信号に対する更なる符号量の削減方
法を示す図である。11 is a diagram illustrating a method of further reducing the amount of code for a color difference signal in the inverse discrete cosine transform device and the discrete cosine transform device of FIG. 1;
【図12】Iピクチャにおける量子化幅を変化させた場
合の符号量と量子化幅の関係を示す図である。FIG. 12 is a diagram illustrating a relationship between a code amount and a quantization width when the quantization width in an I picture is changed.
【図13】参照となるIピクチャの量子化幅を固定しP
ピクチャの量子化幅を変化させた場合の符号量と量子化
幅の関係を示す図である。FIG. 13 shows a case where the quantization width of a reference I picture is fixed and P
FIG. 4 is a diagram illustrating a relationship between a code amount and a quantization width when a quantization width of a picture is changed.
【図14】参照となるPピクチャの量子化幅を固定しB
ピクチャの量子化幅を変化させた場合の符号量と量子化
幅の関係を示す図である。FIG. 14 shows a case where the quantization width of a reference P picture is fixed and B
FIG. 4 is a diagram illustrating a relationship between a code amount and a quantization width when a quantization width of a picture is changed.
【図15】本発明に係る画像情報変換装置の構成を示す
ブロック図である。FIG. 15 is a block diagram illustrating a configuration of an image information conversion device according to the present invention.
【図16】図15の画像情報変換装置の動作を説明する
フローチャートである。FIG. 16 is a flowchart illustrating an operation of the image information conversion device in FIG. 15;
1 符号バッファ,2 圧縮情報解析装置,3 情報バ
ッファ,4 可変長復号装置,5,13 逆量子化装
置,6,14 加算器,7 帯域制限装置,8量子化装
置,9,51 符号量制御装置,10 符号バッファ,
11 可変長符号化装置,12 動き補償誤差補正装
置,15 逆離散コサイン変換装置,16ビデオメモ
リ,17 動き補償予測装置,18 離散コサイン変換
装置,52ヘッダ符号量バッファ,53 コンプレクシ
ティ算出器,54 目標符号量算出器REFERENCE SIGNS LIST 1 code buffer, 2 compression information analyzer, 3 information buffer, 4 variable length decoder, 5, 13 inverse quantizer, 6, 14 adder, 7 band limiter, 8 quantizer, 9, 51 code amount control Device, 10 code buffers,
Reference Signs List 11 variable length coding device, 12 motion compensation error correction device, 15 inverse discrete cosine transform device, 16 video memory, 17 motion compensation prediction device, 18 discrete cosine transform device, 52 header code amount buffer, 53 complexity calculator, 54 Target code amount calculator
───────────────────────────────────────────────────── フロントページの続き Fターム(参考) 5C059 KK35 MA00 MA01 MA23 MA32 MA33 MC01 MC22 MC24 ME01 NN09 NN28 PP04 RC09 RC28 SS01 SS06 SS11 UA33 5J064 AA02 AA04 BA09 BA16 BC01 BC16 BD02 ──────────────────────────────────────────────────続 き Continued on the front page F term (reference) 5C059 KK35 MA00 MA01 MA23 MA32 MA33 MC01 MC22 MC24 ME01 NN09 NN28 PP04 RC09 RC28 SS01 SS06 SS11 UA33 5J064 AA02 AA04 BA09 BA16 BC01 BC16 BD02
Claims (20)
た画像圧縮情報を取り込み、符号量を更に削減してから
出力する画像情報変換装置において、 前記画像圧縮情報のヘッダ部に割り当てられた符号量を
検出する検出手段と、 前記検出手段により検出された、前記ヘッダ部に割り当
てられた符号量に基づいて、前記画像圧縮情報の前記直
交変換係数に割り当てる符号量を演算する第1の演算手
段と、 前記第1の演算手段により演算された、前記直交変換係
数に割り当てる符号量に基づいて、目標符号量を演算す
る第2の演算手段と、 前記第2の演算手段により演算された前記目標符号量に
基づいて、前記画像圧縮情報の再量子化時の符号量を制
御する制御手段とを備えることを特徴とする画像情報変
換装置。1. An image information conversion device which takes in image compression information encoded by orthogonal transformation and motion compensation, further reduces the amount of code, and outputs the reduced amount of code, wherein the amount of code assigned to a header portion of the image compression information is Detecting means for detecting, based on the code amount allocated to the header portion detected by the detecting means, a first calculating means for calculating a code amount to be allocated to the orthogonal transform coefficient of the image compression information; A second calculator for calculating a target code amount based on a code amount to be assigned to the orthogonal transform coefficient, calculated by the first calculator; and the target code calculated by the second calculator. Control means for controlling a code amount at the time of requantization of the image compression information based on the amount.
ることを特徴とする請求項1に記載の画像情報変換装
置。2. The apparatus according to claim 1, wherein the orthogonal transform is a discrete cosine transform.
対する目標符号量をTheaderとし、前記直交変換係数に
対する目標符号量をTcoefとするとき、前記画像圧縮情
報の各フレームに対する前記目標符号量Tを 【数1】 として演算することを特徴とする請求項1に記載の画像
情報変換装置。3. When the target code amount for the header portion is T header and the target code amount for the orthogonal transform coefficients is T coef , the second calculating means sets the target code amount for each frame of the image compression information. The code amount T is given by The image information conversion device according to claim 1, wherein the calculation is performed as:
より検出された前記ヘッダ部の符号量を、前記Theader
とすることを特徴とする請求項3に記載の画像情報変換
装置。Wherein said second calculating means, a code amount of the header unit detected by said detection means, said T header
The image information conversion device according to claim 3, wherein:
ームに対する平均量子化スケールと、各フレームの前記
直交変換係数に対して割り当てられている符号量から、
各フレームに対するコンプレクシティを算出する算出手
段をさらに備え、 前記第2の演算手段は、前記算出手段により算出された
前記コンプレクシティに基づいて、前記目標符号量T
coefを求めることを特徴とする請求項3に記載の画像情
報変換装置。5. A method according to claim 1, further comprising: calculating an average quantization scale for each frame of the captured image compression information;
Calculating means for calculating the complexity for each frame, wherein the second calculating means calculates the target code amount T based on the complexity calculated by the calculating means.
The image information conversion device according to claim 3, wherein coef is obtained.
報中のIピクチャの間隔から擬似的なGOPの構造を決定
する決定手段をさらに備えることを特徴とする請求項3
に記載の画像情報変換装置。6. The image processing apparatus according to claim 3, further comprising: a determination unit configured to determine a pseudo GOP structure from an interval between I pictures in the image information obtained by decoding the image compression information.
2. The image information conversion device according to claim 1.
eを出力となる画像圧縮情報の符号量とし、picture_rat
eを出力となる画像が毎秒何フレーム表示されるかを表
す値とし、擬似的なGOPの最初のフレームを再符号化す
る際に、擬似的なGOP内の未符号化フレームに対する割
当符号量Rを、 【数2】 として更新し、 入力された前記画像圧縮情報内で、擬似的なGOP内に含
まれるフレームのへッダに対する符号量の合計Rheadを 【数3】 として算出し、 擬似的なGOP内の未符号化フレームの前記直交変換係数
に対する割当符号量Rcoefを、 【数4】 として算出することを特徴とする請求項3に記載の画像
情報変換装置。7. The method according to claim 1, wherein the first calculating unit sets N as the number of frames included in the pseudo GOP,
e is the code amount of the image compression information to be output, and picture_rat
Let e be a value representing how many frames of the output image are displayed per second, and when re-encoding the first frame of the pseudo GOP, the allocated code amount R for the uncoded frame in the pseudo GOP Is given by In the input image compression information, the total R head of the code amount for the header of the frame included in the pseudo GOP is expressed as And the allocated code amount R coef for the orthogonal transform coefficient of the uncoded frame in the pseudo GOP is given by: The image information conversion device according to claim 3, wherein the image information is calculated as:
符号化された後、そのフレームの発生符号量のうち、前
記直交変換係数に割り当てられた分をScoefとすると
き、前記割当符号量Rcoefを、 【数5】 として更新することを特徴とする請求項7に記載の画像
情報変換装置。8. The method according to claim 1, wherein, after each frame is re-encoded, when the amount of generated code of the frame allocated to the orthogonal transform coefficient is S coef , The code amount R coef is given by: The image information conversion apparatus according to claim 7, wherein the image information is updated as:
Rcoefを用いて各フレームに対する前記目標符号量T
coefを演算することを特徴とする請求項8に記載の画像
情報変換装置。9. The method according to claim 6, wherein the second calculating unit uses the allocated code amount R coef to calculate the target code amount T for each frame.
The image information conversion device according to claim 8, wherein coef is calculated.
量Tcoefを、画像に応じたパラメータKpとKbの値を用い
て演算することを特徴とする請求項3に記載の画像情報
変換装置。10. The image information conversion apparatus according to claim 3, wherein said second calculating means calculates said target code amount T coef using values of parameters Kp and Kb according to an image. apparatus.
タの値を、入力された前記画像圧縮情報の各フレームの
コンプレクシティを用いて適応的に演算することを特徴
とする請求項10に記載の画像情報変換装置。11. The apparatus according to claim 10, wherein the second calculating means adaptively calculates the value of the parameter using the complexity of each frame of the input image compression information. Image information conversion device.
前記コンプレクシティを、入力された前記画像圧縮情報
内の各フレームでの平均量子化スケール、並びにそのフ
レーム内で前記直交変換係数に割り当てられた符号量を
用いて演算することを特徴とする請求項11に記載の画
像情報変換装置。12. The second arithmetic means assigns the complexity of each frame to an average quantization scale in each frame in the input image compression information and the orthogonal transform coefficient in the frame. The image information conversion device according to claim 11, wherein the calculation is performed using the obtained code amount.
Pを構成するIピクチャ,Pピクチャ,Bピクチャにお
ける前記コンプレクシティとし、1/(1+m)を所定
の値とするとき、前記第2の演算手段は、前記パラメー
タKp及びKbを 【数6】 【数7】 により演算することを特徴とする請求項11に記載の画
像情報変換装置。13. Xi, Xp, Xb are each represented by a pseudo GO
When the complexity in the I picture, P picture, and B picture constituting P is set and 1 / (1 + m) is a predetermined value, the second calculating means sets the parameters Kp and Kb as follows: (Equation 7) The image information conversion apparatus according to claim 11, wherein the calculation is performed by:
レームにおける平均量子化スケールコードをQとし、総
符号量のうち前記直交変換係数に割り当てられた分をS
coefとしたとき、前記第2の演算手段は、コンプレクシ
ティXを 【数8】 により演算することを特徴とする請求項13に記載の画
像情報変換装置。14. An average quantization scale code in the frame of the input image compression information is Q, and a portion of the total code amount allocated to the orthogonal transform coefficient is S.
When coef is set, the second arithmetic means calculates the complexity X as 14. The image information conversion device according to claim 13, wherein the calculation is performed by:
+m)の値を、0.6乃至1.2に設定することを特徴
とする請求項13に記載の画像情報変換装置。15. The method according to claim 15, wherein the second calculating means is configured to calculate the 1 / (1
The image information conversion apparatus according to claim 13, wherein the value of (+ m) is set to 0.6 to 1.2.
+m)の値を、1.0に設定することを特徴とする請求
項15に記載の画像情報変換装置。16. The method according to claim 16, wherein the second calculating means is configured to calculate the 1 / (1
The image information conversion apparatus according to claim 15, wherein the value of (+ m) is set to 1.0.
タKp及びKbのを求める際の指数演算を、予め設定さ
れたテーブルを参照することによって実行することを特
徴とする請求項13に記載の画像情報変換装置。17. The apparatus according to claim 13, wherein said second calculating means executes an exponential calculation when obtaining said parameters Kp and Kb by referring to a preset table. Image information conversion device.
最初における仮想バッファ初期値を与える前記パラメー
タKp,Kbの値として、Kp=1.0,Kb=l.4
という値を用いることを特徴とする請求項13に記載の
画像情報変換装置。18. The apparatus according to claim 18, wherein said second calculating means sets Kp = 1.0, Kb = 1. 4
The image information conversion apparatus according to claim 13, wherein the value is used.
れた画像圧縮情報を取り込み、符号量を更に削減してか
ら出力する画像情報変換装置の画像情報変換方法におい
て、 前記画像圧縮情報のヘッダ部に割り当てられた符号量を
検出する検出ステップと、 前記検出ステップの処理により検出された、前記ヘッダ
部に割り当てられた符号量に基づいて、前記画像圧縮情
報の前記直交変換係数に割り当てる符号量を演算する第
1の演算ステップと、 前記第1の演算ステップの処理により演算された、前記
直交変換係数に割り当てる符号量に基づいて、目標符号
量を演算する第2の演算ステップと、 前記第2の演算ステップの処理により演算された前記目
標符号量に基づいて、前記画像圧縮情報の再量子化時の
符号量を制御する制御ステップとを含むことを特徴とす
る画像情報変換方法。19. An image information conversion method of an image information conversion device which takes in image compression information encoded by orthogonal transformation and motion compensation, further reduces the amount of code, and outputs the encoded information. A detecting step of detecting the allocated code amount; and calculating a code amount to be allocated to the orthogonal transform coefficient of the image compression information based on the code amount allocated to the header portion detected by the processing of the detecting step. A second calculation step of calculating a target code amount based on a code amount to be assigned to the orthogonal transform coefficient, which is calculated by the processing of the first calculation step; A control step of controlling a code amount at the time of requantization of the image compression information based on the target code amount calculated by the processing of the calculation step. Picture information converting method comprising Mukoto.
れた画像圧縮情報を取り込み、符号量を更に削減してか
ら出力する画像情報変換装置を制御するプログラムにお
いて、 前記画像圧縮情報のヘッダ部に割り当てられた符号量を
検出する検出ステップと、 前記検出ステップの処理により検出された、前記ヘッダ
部に割り当てられた符号量に基づいて、前記画像圧縮情
報の前記直交変換係数に割り当てる符号量を演算する第
1の演算ステップと、 前記第1の演算ステップの処理により演算された、前記
直交変換係数に割り当てる符号量に基づいて、目標符号
量を演算する第2の演算ステップと、 前記第2の演算ステップの処理により演算された前記目
標符号量に基づいて、前記画像圧縮情報の再量子化時の
符号量を制御する制御ステップとを含むことを特徴とす
るコンピュータが読み取り可能なプログラムが記録され
ている記録媒体。20. A program for controlling an image information conversion apparatus which takes in image compression information encoded by orthogonal transformation and motion compensation and further outputs a code amount after reducing the code amount. A detecting step of detecting the obtained code amount, and calculating a code amount to be allocated to the orthogonal transform coefficient of the image compression information based on the code amount allocated to the header portion detected by the processing of the detecting step. A first calculation step, a second calculation step of calculating a target code amount based on the code amount to be assigned to the orthogonal transform coefficient, calculated by the processing of the first calculation step, and the second calculation A control step of controlling a code amount at the time of requantization of the image compression information based on the target code amount calculated by the process of step; Recording medium from which a computer readable program is recorded, which comprises.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP30495099A JP2001128175A (en) | 1999-10-27 | 1999-10-27 | Device and method for converting image information and recording medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP30495099A JP2001128175A (en) | 1999-10-27 | 1999-10-27 | Device and method for converting image information and recording medium |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2001128175A true JP2001128175A (en) | 2001-05-11 |
Family
ID=17939275
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP30495099A Withdrawn JP2001128175A (en) | 1999-10-27 | 1999-10-27 | Device and method for converting image information and recording medium |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2001128175A (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015065517A (en) * | 2013-09-24 | 2015-04-09 | 日本電信電話株式会社 | Video coding parameter calculation device, video coding parameter calculation method, and program |
-
1999
- 1999-10-27 JP JP30495099A patent/JP2001128175A/en not_active Withdrawn
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015065517A (en) * | 2013-09-24 | 2015-04-09 | 日本電信電話株式会社 | Video coding parameter calculation device, video coding parameter calculation method, and program |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6658157B1 (en) | Method and apparatus for converting image information | |
KR100604702B1 (en) | Apparatus for encoding an image sequence and method for generating a quantizer scale to quantize an image signals | |
US7555041B2 (en) | Code quantity control apparatus, code quantity control method and picture information transformation method | |
US6687296B1 (en) | Apparatus and method for transforming picture information | |
KR100850706B1 (en) | Method for adaptive encoding and decoding motion image and apparatus thereof | |
US8311095B2 (en) | Method and apparatus for transcoding between hybrid video codec bitstreams | |
EP1445958A1 (en) | Quantization method and system, for instance for video MPEG applications, and computer program product therefor | |
EP1067798A2 (en) | Apparatus, method and computer program product for transcoding a coded moving picture sequence | |
US20110002554A1 (en) | Digital image compression by residual decimation | |
KR20010021879A (en) | Apparatus and method for macroblock based rate control in a coding system | |
KR20040047977A (en) | Spatial scalable compression | |
US20110002391A1 (en) | Digital image compression by resolution-adaptive macroblock coding | |
JP2003037843A (en) | Picture processor, method therefor, recording medium and program thereof | |
JP2007019995A (en) | Image processing device, method, and program | |
JP2000236547A (en) | Image information converter and image information conversion method | |
US9185420B2 (en) | Moving image coding apparatus and moving image coding method | |
US20130077674A1 (en) | Method and apparatus for encoding moving picture | |
JP2001145102A (en) | Method and device for converting dynamic image compressed and encoded signal and medium with converting program recorded thereon | |
JP4532607B2 (en) | Apparatus and method for selecting a coding mode in a block-based coding system | |
US20080025401A1 (en) | Method for measuring real-time image complexity | |
JP4292659B2 (en) | Image information conversion apparatus and image information conversion method | |
KR102020953B1 (en) | Image Reencoding Method based on Decoding Data of Image of Camera and System thereof | |
US20130195180A1 (en) | Encoding an image using embedded zero block coding along with a discrete cosine transformation | |
JP2001128175A (en) | Device and method for converting image information and recording medium | |
JPH10108197A (en) | Image coder, image coding control method, and medium storing image coding control program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Withdrawal of application because of no request for examination |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20070109 |