JP4295658B2 - Re-encoding device - Google Patents

Re-encoding device Download PDF

Info

Publication number
JP4295658B2
JP4295658B2 JP2004125921A JP2004125921A JP4295658B2 JP 4295658 B2 JP4295658 B2 JP 4295658B2 JP 2004125921 A JP2004125921 A JP 2004125921A JP 2004125921 A JP2004125921 A JP 2004125921A JP 4295658 B2 JP4295658 B2 JP 4295658B2
Authority
JP
Japan
Prior art keywords
encoding
quantization
bit string
data amount
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2004125921A
Other languages
Japanese (ja)
Other versions
JP2005311714A (en
Inventor
秀雄 泉澤
敦司 藤井
基 中原
Original Assignee
株式会社 インターコム
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社 インターコム filed Critical 株式会社 インターコム
Priority to JP2004125921A priority Critical patent/JP4295658B2/en
Publication of JP2005311714A publication Critical patent/JP2005311714A/en
Application granted granted Critical
Publication of JP4295658B2 publication Critical patent/JP4295658B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明は、例えばMPEG(Moving Picture Image Coding Experts Group )方式のような符号化方式で符号化されたデータをさらに再符号化するための技術に関する。   The present invention relates to a technique for further re-encoding data encoded by an encoding method such as MPEG (Moving Picture Image Coding Experts Group).

画像データの圧縮技術としてよく知られているものの1つに、MPEG(Moving Picture Image Coding Experts Group)方式がある。このMPEG方式に関しては様々な改良技術が提案されており、例えば特許文献1には、画像内の動きが多い場合であっても少ない場合であっても効率よく画像データを符号化するための技術が記載されている。   One well known image data compression technique is the Moving Picture Image Coding Experts Group (MPEG) system. Various improved techniques have been proposed for this MPEG system. For example, Patent Document 1 discloses a technique for efficiently encoding image data regardless of whether there is a lot of movement in an image or not. Is described.

ここで、図8は、MPEGに規定された方法で符号化された画像データ(以降、「MPEG符号化された画像データ」、又は単に「符号化データ」という)の構造を表す模式図である。図8に示すように、MPEG符号化された画像データは、シーケンス層、GOP(Group of Pictures)層、ピクチャ層、スライス層、マクロブロック層及びブロック層というように階層的に構成されている。ここで、GOPはMPEGの特徴的な概念であり、Iピクチャ、PピクチャおよびBピクチャという3種類のタイプのピクチャによって構成されている。また、各GOPの先頭部分には、画面フォーマット等を指定するためのシーケンスヘッダ(SH)が設けられている。GOPを構成するピクチャのうち、Iピクチャは、フレーム内符号化によって生成されており、Iピクチャ自身のデータのみで1つの画像に復号することが可能な独立ピクチャである。これに対し、Pピクチャ及びBピクチャは非独立のピクチャであり、それぞれPピクチャ自身或いはBピクチャ自身のデータのみでは再生できない。具体的には、Pピクチャは、フレーム間順方向予測符号化により、前順のIピクチャまたはPピクチャとの差分を符号化したデータであるから、復号の際にはこれらの他のピクチャが必要である。また、Bピクチャは、フレーム間双方向予測符号化により、前順のIピクチャまたはPピクチャとの差分、および後順のIピクチャまたはPピクチャとの差分を符号化したデータであるから、復号の際にはこれらの他のピクチャが必要とされる。   Here, FIG. 8 is a schematic diagram showing the structure of image data (hereinafter referred to as “MPEG-encoded image data” or simply “encoded data”) encoded by a method defined in MPEG. . As shown in FIG. 8, MPEG-encoded image data is hierarchically configured as a sequence layer, a GOP (Group of Pictures) layer, a picture layer, a slice layer, a macroblock layer, and a block layer. Here, GOP is a characteristic concept of MPEG, and is composed of three types of pictures: I picture, P picture, and B picture. In addition, a sequence header (SH) for designating a screen format or the like is provided at the head of each GOP. Among the pictures constituting the GOP, the I picture is an independent picture that is generated by intra-frame coding and can be decoded into one image only by the data of the I picture itself. On the other hand, the P picture and the B picture are non-independent pictures and cannot be reproduced only by the data of the P picture itself or the B picture itself. Specifically, the P picture is data obtained by encoding the difference from the previous I picture or P picture by inter-frame forward predictive encoding, so that these other pictures are necessary for decoding. It is. In addition, the B picture is data obtained by encoding the difference from the forward I picture or P picture and the difference from the backward I picture or P picture by inter-frame bi-directional predictive coding. Sometimes these other pictures are needed.

1つのピクチャは、複数のスライスによって構成されている。このスライスは、開始コードを持つ一連のデータ列の最小単位であり、任意の個数のマクロブロック(MB)によって構成されている。また、スライスの開始コードの後には、このスライスに含まれる原画像データを量子化する際に用いた量子化ステップサイズ(QSC)が記述されている。1つのマクロブロック(MB)は、4つの輝度信号ブロック(Y)と、2つの色差信号ブロック(Cb,Cr)とによって構成されている。これらの各ブロックは8×8の画素からなる。MPEGプレーヤは、上記のようなMPEG符号化された画像データを順次復号することによって、GOP単位で画像を再生することができる。   One picture is composed of a plurality of slices. This slice is a minimum unit of a series of data strings having a start code, and is composed of an arbitrary number of macro blocks (MB). Further, after the start code of the slice, the quantization step size (QSC) used when quantizing the original image data included in the slice is described. One macro block (MB) is composed of four luminance signal blocks (Y) and two color difference signal blocks (Cb, Cr). Each of these blocks consists of 8 × 8 pixels. The MPEG player can reproduce the image in units of GOP by sequentially decoding the MPEG-encoded image data as described above.

ところで、MPEG符号化により圧縮された画像データであっても、そのままではデータサイズが大きすぎて、DVD(Digital Versatile Disk)のような記録媒体に記録したり、ネットワークを介してダウンロードさせたりするには適切ではない、という場合がある。このような場合には、MPEG符号化された画像データを復号して原画像データにいったん戻した後に、さらに高い圧縮率で再符号化してデータ量を小さくする必要がある。   By the way, even image data compressed by MPEG encoding is too large to be recorded on a recording medium such as a DVD (Digital Versatile Disk) or downloaded via a network. May not be appropriate. In such a case, it is necessary to decode the MPEG-encoded image data and return it to the original image data, and then re-encode it at a higher compression rate to reduce the data amount.

このような再符号化を行う場合の処理の流れについて、図9を参照しながら説明する。図9の図中左側においてステップS1〜S5によって示された動作は復号時の動作を表しており、図中右側においてステップS1’〜S5’によって示された動作は符号化時の動作を表している。復号時において、まず、既に符号化されている画像データが記憶媒体から読み出されてビット列として入力されてくると、このビット列がエントロピー符号化された時とは逆のアルゴリズムに従って逆符号化される(ステップS1)。次いで、各ブロックのDCT(Direct Cosine Transform:離散コサイン変換)係数に対し、ビット列に含まれていた量子化ステップサイズ(QSC)が乗算されることで逆量子化処理が行われる(ステップS2)。次に、このビット列の符号化時に動き補償処理がなされた時とは逆のアルゴリズムに従って、逆動き補償処理(逆MC処理)が行われる(ステップS3)。この後、IDCT(Inverse DCT:逆離散コサイン変換)処理が施され(ステップS4)、これによって得られたデータが各ピクチャ(Iピクチャ,Pピクチャ及びBピクチャ)単位にまとめられ、さらに、これらの各ピクチャの順番が並べ替えられて原画像データとして出力される(ステップS5)。   The flow of processing when performing such re-encoding will be described with reference to FIG. The operations indicated by steps S1 to S5 on the left side of FIG. 9 represent operations at the time of decoding, and the operations indicated by steps S1 ′ to S5 ′ on the right side of FIG. 9 represent operations at the time of encoding. Yes. At the time of decoding, when image data that has already been encoded is read from the storage medium and input as a bit string, the bit string is de-encoded according to an algorithm reverse to that when entropy encoding is performed. (Step S1). Next, inverse quantization processing is performed by multiplying the DCT (Direct Cosine Transform) coefficient of each block by the quantization step size (QSC) included in the bit string (step S2). Next, reverse motion compensation processing (inverse MC processing) is performed according to an algorithm reverse to that when motion compensation processing is performed at the time of encoding the bit string (step S3). Thereafter, an IDCT (Inverse DCT: Inverse Discrete Cosine Transform) process is performed (step S4), and the data obtained thereby is collected in units of each picture (I picture, P picture, and B picture). The order of each picture is rearranged and output as original image data (step S5).

次いで、データ量を小さくするための符号化処理に移行する。
事前に、この原画像データを再符号化した後のデータ量が目標値になるような補償係数(例えばビットレートなど)を予測しておく。この予測は経験則を踏まえた計算によってなされるため、予測した補償係数が必ずしも最適であるとは限らないが、ひとまず、この補償係数を用いて原画像データをMPEG符号化する。具体的には、まず、原画像データがピクチャ単位(Iピクチャ,Bピクチャ,Pピクチャ)に分割され、さらに各ピクチャが8×8画素のブロックに分割される(ステップS5’)。次いで、これらのブロックに対しDCT(離散コサイン変換)処理が施され(ステップS4’)、さらに動き補償処理(MC処理)が行われる(ステップS3’)。この後、上記DCT処理により求められた各ブロックのDCT係数が量子化ステップサイズによって除算され、その余りが丸められることによって量子化が施される(ステップS2’)。そして、量子化されたデータがエントロピー符号化される(ステップS1’)。このような処理を経て画像データを再符号化することができるが、前述したように、この再符号化された画像データのデータ量が当初予想していた目標値と同じになるとは限らない。そこで、再符号化後のデータ量が当初の目標値とどの程度の差があるかを特定し、その差をより小さくできるような補償係数を再計算により求める。そして、再計算して得た補償係数を用いて、もう一度ステップS5’→S4’→S3’→S2’→S1’の符号化処理を実行する。このようにすれば、ほぼ目標値と同じサイズの符号化データを得ることができる。
Next, the process proceeds to an encoding process for reducing the data amount.
In advance, a compensation coefficient (for example, a bit rate) is predicted so that the data amount after re-encoding the original image data becomes a target value. Since this prediction is made by calculation based on empirical rules, the predicted compensation coefficient is not necessarily optimal, but for the time being, original image data is MPEG-encoded using this compensation coefficient. Specifically, first, the original image data is divided into picture units (I picture, B picture, P picture), and each picture is further divided into 8 × 8 pixel blocks (step S5 ′). Next, DCT (discrete cosine transform) processing is performed on these blocks (step S4 ′), and further motion compensation processing (MC processing) is performed (step S3 ′). Thereafter, the DCT coefficient of each block obtained by the DCT process is divided by the quantization step size, and the remainder is rounded to perform quantization (step S2 ′). Then, the quantized data is entropy encoded (step S1 ′). Although the image data can be re-encoded through such processing, as described above, the data amount of the re-encoded image data is not always the same as the target value that was initially predicted. Therefore, it is determined how much the data amount after re-encoding is different from the original target value, and a compensation coefficient that can make the difference smaller is obtained by recalculation. Then, using the compensation coefficient obtained by recalculation, the encoding process of steps S5 ′ → S4 ′ → S3 ′ → S2 ′ → S1 ′ is executed again. In this way, encoded data having substantially the same size as the target value can be obtained.

しかし、上述した方法では、符号化データをいったん復号して原画像データを得る必要があるうえに、符号化処理を必要に応じて2回行わなければならないために、相当多くの時間を要してしまうという問題がある。仮に符号化処理が1回で済んだとしても、例えば6ギガビット程度の符号化データを再符号化して3ギガビット程度にまでサイズダウンするような場合には、おおよそ5時間もの処理時間が必要となる。   However, in the above-described method, it is necessary to decode the encoded data once to obtain the original image data, and the encoding process must be performed twice as necessary. There is a problem that it ends up. Even if the encoding process is completed only once, for example, when re-encoding encoded data of about 6 gigabits and reducing the size to about 3 gigabits, a processing time of about 5 hours is required. .

特開2003−179931号公報JP 2003-179931 A

本発明は、このような背景の下でなされたものであり、その目的は、既に符号化されているデータを再符号化するために要する処理時間を従来よりも短縮することにある。   The present invention has been made under such a background, and an object thereof is to shorten the processing time required to re-encode data that has already been encoded.

上述した課題を解決するため、本発明は、量子化を経て符号化されたビット列を、決められた逆符号化アルゴリズムに従って、ゼロ係数の連続個数と非ゼロ係数の係数値との組に変換する逆符号化手段と、前記逆符号化手段によって得られた前記非ゼロ係数の係数値に対し、前記ビット列が量子化されたときに用いられた量子化ステップサイズを乗算することによって、簡易量子化係数を求める簡易逆量子化手段と、前記簡易逆量子化手段によって求められた簡易量子化係数を、前記量子化ステップサイズよりも大きい量子化ステップサイズを用いて量子化する簡易量子化手段と、前記簡易量子化手段によって量子化されて得られた値を非ゼロ係数の係数値とし、前記ゼロ係数の連続個数と当該非ゼロ係数の係数値との組を、前記逆符号化アルゴリズムとは逆の符号化アルゴリズムに従ってビット列に変換して出力する符号化手段と、指定された目標データ量を記憶する目標値記憶手段と、前記符号化手段によって順次出力されてくるビット列の累積データ量に基づいて、前記符号化手段による変換が完了したときの前記ビット列の総データ量が前記目標値記憶手段によって記憶されている目標データ量とほぼ同じになるか否かを判断する判断手段であって、前記逆符号化手段によって前記変換がなされる前の前記ビット列の総データ量に対して、該ビット列のうち該逆符号化手段による前記変換が既に完了したビット列のデータ量が占める割合と、前記目標データ量に対して前記符号化手段によって出力されたビット列の累積データ量が占める割合とを比較し、前者の割合と後者の割合がほぼ同じではない場合には、前記符号化手段による変換が完了したときのビット列の総データ量が目標データ量とほぼ同じにならないと判断する判断手段と、前記判断手段によって前記ビット列の総データ量が前記目標データ量とほぼ同じにならないと判断された場合、前記簡易量子化手段が量子化するために用いている量子化ステップサイズの値を調整する調整手段とを備えた再符号化装置を提供する。 In order to solve the above-described problems, the present invention converts a bit string encoded through quantization into a set of a continuous number of zero coefficients and a coefficient value of a non-zero coefficient according to a predetermined inverse encoding algorithm. Simple quantization by multiplying the coefficient value of the non-zero coefficient obtained by the inverse encoding means and the inverse encoding means by the quantization step size used when the bit string is quantized A simple dequantization means for obtaining a coefficient, a simple quantization means for quantizing the simple quantization coefficient obtained by the simple dequantization means using a quantization step size larger than the quantization step size; A value obtained by quantization by the simple quantization means is used as a coefficient value of a non-zero coefficient, and a set of a continuous number of the zero coefficients and a coefficient value of the non-zero coefficient is set as the inverse encoding algorithm. Encoding means for converting a bit string in accordance with the inverse of the encoding algorithms and Gorizumu, cumulative data of the target value storing means for storing the designated target amount of data, the bit sequence coming sequentially outputted by said coding means Judging means for judging based on the amount whether or not the total data amount of the bit string when the conversion by the encoding means is completed is substantially the same as the target data amount stored by the target value storing means; And the ratio of the data amount of the bit string that has already been converted by the inverse encoding means in the bit string to the total data amount of the bit string before the conversion by the inverse encoding means. The ratio of the accumulated data amount of the bit string output by the encoding means to the target data amount is compared, and the former ratio and the latter When the ratios are not substantially the same, a determination unit that determines that the total data amount of the bit string when the conversion by the encoding unit is completed is not substantially the same as the target data amount, and a total of the bit string by the determination unit Re-encoding comprising adjustment means for adjusting the value of the quantization step size used for quantization by the simple quantization means when it is determined that the data amount is not substantially the same as the target data amount Providing equipment.

次に、本発明を実施するための最良の形態について説明する。
まず、図1の模式図を参照しながら、本実施形態における再符号化方法の概要について説明する。なお、以下の説明においては、MPEG2(Moving Picture Image Coding Experts Group-2)を用いた場合を想定している。図1の図中左側においてステップS11,S12によって示された動作は、MPEG符号化された画像データを簡易的に復号する場合の処理(以下、簡易復号処理という)の内容を表している。一方、図中右側においてステップS11’,S12’によって示された動作は、上記のようにして簡易復号された画像データを符号化する場合の処理(以下、簡易符号化処理という)の内容を表している。
Next, the best mode for carrying out the present invention will be described.
First, the outline of the re-encoding method in the present embodiment will be described with reference to the schematic diagram of FIG. In the following description, it is assumed that MPEG2 (Moving Picture Image Coding Experts Group-2) is used. The operations indicated by steps S11 and S12 on the left side of FIG. 1 represent the contents of processing (hereinafter referred to as simple decoding processing) when MPEG-encoded image data is simply decoded. On the other hand, the operations indicated by steps S11 ′ and S12 ′ on the right side in the figure represent the contents of processing (hereinafter referred to as simple encoding processing) in the case of encoding the image data that has been simply decoded as described above. ing.

簡易復号処理時において、既にMPEG符号化されている画像データが記憶媒体から読み出されてビット列として入力されてくると、MPEG符号化時にこのビット列がエントロピー符号化された時とは逆のアルゴリズムに従って、このビット列を逆符号化する(ステップS11)。具体的には、図2に示すようにして予め決められたVLC(Variable Length Code:可変長コードないし可変長ビット列)テーブルに基づいて、可変長のビット列を各ブロックのDCT(Direct Cosine Transform:離散コサイン変換)係数の「run」と「level」の組に変換する。ここで、「run」とは、値がゼロのDCT係数が連続する個数を意味しており、「level」とは、そのゼロのDCT係数の連続に続く非ゼロのDCT係数のレベル(係数値)を意味している。   In the simple decoding process, when image data that has already been MPEG-encoded is read from the storage medium and input as a bit string, the bit string is entropy-encoded at the time of MPEG encoding according to the reverse algorithm. The bit string is reversely encoded (step S11). Specifically, based on a VLC (Variable Length Code) table determined in advance as shown in FIG. 2, a variable length bit string is converted into a DCT (Direct Cosine Transform) of each block. Cosine transform) transforms into a set of “run” and “level” coefficients. Here, “run” means the number of consecutive zero DCT coefficients, and “level” means the level (coefficient value) of non-zero DCT coefficients following the zero DCT coefficients. ).

次に、これらの「run」と「level」の組のうちの「level」に対して、ステップS11にて入力されたビット列に含まれていた量子化ステップサイズ(以下、元量子化ステップサイズという)を乗算する(ステップS12)。この量子化ステップサイズは、スライスの開始コードの後に記述されている。本実施形態では、このステップS12における乗算処理を「簡易逆量子化」と呼び、この簡易逆量子化によって得られた値を「簡易量子化係数」という。   Next, the quantization step size (hereinafter referred to as the original quantization step size) included in the bit string input in step S11 with respect to “level” of the set of “run” and “level”. ) Is multiplied (step S12). This quantization step size is described after the start code of the slice. In the present embodiment, the multiplication processing in step S12 is referred to as “simple dequantization”, and the value obtained by this simple dequantization is referred to as “simple quantization coefficient”.

以上で簡易復号処理は終了し、続いて簡易符号化処理に移行する。
まず、ステップS12において得られた簡易量子化係数を、元量子化ステップサイズよりも大きい量子化ステップサイズ(以下、新量子化ステップサイズという)で量子化する(ステップS12’)。即ち、簡易量子化係数を新量子化ステップサイズによって除算し、その余りを丸めて整数部分のみを抽出するという処理を行う。この新量子化ステップサイズは、再符号化された後において最初に意図したような目標データ量になるように予め予測されたものである。量子化ステップサイズを大きくするほどデータを圧縮する効果が大きくなるので、この点を踏まえて、計算により或いは予め定められたアルゴリズムに従って新量子化ステップサイズを予測すればよい。このような簡易量子化によって得られた値を新たなDCT係数の「level」とし、この「level」とステップS11において既に得られている元の「run」との組をエントロピー符号化する(ステップS11’)。具体的には、上述したVLCテーブルの内容に基づき、前述した逆符号化とは逆方向の変換アルゴリズムに従って、上記の「run」と「level」の組をそれに対応する可変長ビット列に変換(符号化)すればよい。
The simple decoding process is thus completed, and then the process proceeds to the simple encoding process.
First, the simple quantization coefficient obtained in step S12 is quantized with a quantization step size larger than the original quantization step size (hereinafter referred to as a new quantization step size) (step S12 ′). That is, a process of dividing the simple quantization coefficient by the new quantization step size and rounding the remainder to extract only the integer part is performed. The new quantization step size is predicted in advance so as to have the target data amount as originally intended after re-encoding. Since the effect of compressing data increases as the quantization step size increases, the new quantization step size may be predicted by calculation or according to a predetermined algorithm. A value obtained by such simple quantization is set as a new DCT coefficient “level”, and a set of this “level” and the original “run” already obtained in step S11 is entropy-encoded (step S11). S11 '). Specifically, based on the contents of the VLC table described above, the above-mentioned “run” and “level” pairs are converted into the corresponding variable-length bit strings according to the conversion algorithm in the reverse direction to the above-described reverse encoding (code). )

ただし、このようにして得られた符号化データのデータ量が当初予想していた目標データ量にほぼ同じになるとは限らないため、本実施形態では、ステップS12’→ステップS11’において順次処理を行っている最中に、新量子化ステップサイズを適切な値に調整するようにしている。具体的には、ステップS11’の処理を経て順次出力される符号化データの累積データ量を監視しつつ、簡易符号化処理が全て完了したときに得られる符号化データの総データ量が目標データ量よりも相当大きくなるか又は相当小さくなることが予想されると、目標データ量との差分をより小さくするような新量子化ステップサイズを求め、それを用いてステップS12’の簡易量子化処理を行うようにしている。   However, since the data amount of the encoded data obtained in this way is not necessarily the same as the initially expected target data amount, in this embodiment, the processing is sequentially performed from step S12 ′ to step S11 ′. During the process, the new quantization step size is adjusted to an appropriate value. Specifically, the total data amount of the encoded data obtained when all the simple encoding processes are completed is monitored while monitoring the cumulative data amount of the encoded data sequentially output through the process of step S11 ′. If it is expected to be considerably larger or smaller than the amount, a new quantization step size that makes the difference from the target data amount smaller is obtained, and the simple quantization process in step S12 ′ is used by using it. Like to do.

このように本実施形態では、DCT係数の「run」と「level」の組を得た時点で復号に関連する処理を終了し、次いで、「level」をより大きい新量子化ステップサイズで量子化することによって画像データを符号化する。この再符号化方法によれば、図9を用いて説明したステップS2→S3→S4→S5及びステップS5’→S4’→S3’→S2’の処理が不要となり、再符号化処理に要する時間を格段に短縮することが可能となる。特にステップS3,S4,S5,S5’,S4’,S3’においては、取り扱うべきデータのデータ量が格段に多いので多大な処理時間を要するが、本実施形態に係る再符号化方法によれば、これらの処理を省略することができるので、処理時間の短縮効果は非常に大きい。また、新量子化係数を調整しながら処理を進めるのでほぼ目標通りの再符号化が可能となり、従来のように2回以上符号化処理を繰り返す必要がほとんどない。本願発明者が再符号化に要する処理時間を実験的に求めて比較したところ、従来は6ギガビット程度の符号化データを3ギガビット程度に再符号化する場合に5時間程度を要していたのに対し、本実施形態に係る再符号化方法によれば処理時間を15分程度にまで短縮可能なことが確認された。   As described above, in the present embodiment, the processing related to decoding is terminated when a set of “run” and “level” of DCT coefficients is obtained, and then “level” is quantized with a larger new quantization step size. By doing so, the image data is encoded. According to this re-encoding method, the processing of steps S 2 → S 3 → S 4 → S 5 and steps S 5 ′ → S 4 ′ → S 3 ′ → S 2 ′ described with reference to FIG. 9 becomes unnecessary, and the time required for the re-encoding process Can be significantly shortened. In particular, in steps S3, S4, S5, S5 ′, S4 ′, and S3 ′, the amount of data to be handled is remarkably large, and thus a great amount of processing time is required. However, according to the re-encoding method according to the present embodiment, Since these processes can be omitted, the effect of shortening the processing time is very large. In addition, since the process proceeds while adjusting the new quantization coefficient, re-encoding can be performed almost as intended, and it is almost unnecessary to repeat the encoding process twice or more as in the prior art. The inventor of the present application experimentally obtained and compared the processing time required for re-encoding, and in the past, it took about 5 hours to re-encode encoded data of about 6 gigabits to about 3 gigabits. On the other hand, according to the re-encoding method according to the present embodiment, it has been confirmed that the processing time can be shortened to about 15 minutes.

以下、本実施形態の構成及び動作について詳細に説明する。
図3は、本実施形態に係る再符号化装置100のハードウェア構成を示すブロック図である。この再符号化装置100は一般的なコンピュータ装置と同様に、キーボードやマウス等の、使用者による操作内容に応じた操作信号を出力する操作部11と、液晶ディスプレイやCRT(Cathode Ray Tube)ディスプレイ等の表示部12と、ハードディスク等の大容量の不揮発性記憶部13と、再符号化装置100の全体を制御する制御部14を備えている。制御部14は、CPU(Central Processing Unit)141などの演算装置と、ROM(Read Only Memory)142やRAM(Random Access Memory)143などの各種メモリとを備えている。不揮発性記憶部13には、CPU141が図1に示したような処理を実行するための手順が記述された再符号化プログラムPRGや、MPEG符号化された画像データなどが記憶されている。CPU141は再符号化プログラムPRGを実行することにより、操作部11からの操作信号を受けて使用者の指示を入力したり、各種の情報を表示部12に表示させたり、RAM143や不揮発性記憶部13にアクセスしたり、各種の演算処理を行ったりする。
Hereinafter, the configuration and operation of this embodiment will be described in detail.
FIG. 3 is a block diagram illustrating a hardware configuration of the re-encoding device 100 according to the present embodiment. This re-encoding device 100 is similar to a general computer device, such as an operation unit 11 that outputs an operation signal corresponding to an operation content by a user, such as a keyboard and a mouse, and a liquid crystal display or CRT (Cathode Ray Tube) display And a display unit 12 such as a hard disk, a large-capacity nonvolatile storage unit 13 such as a hard disk, and a control unit 14 that controls the entire re-encoding device 100. The control unit 14 includes an arithmetic device such as a CPU (Central Processing Unit) 141 and various memories such as a ROM (Read Only Memory) 142 and a RAM (Random Access Memory) 143. The non-volatile storage unit 13 stores a re-encoding program PRG in which a procedure for the CPU 141 to execute the processing shown in FIG. 1, MPEG-encoded image data, and the like are stored. By executing the re-encoding program PRG, the CPU 141 receives an operation signal from the operation unit 11, inputs a user instruction, displays various information on the display unit 12, and displays the RAM 143 and the non-volatile storage unit. 13 is accessed and various arithmetic processes are performed.

図4は再符号化装置100の機能構成を表すブロック図である。
CPU141が再符号化プログラムPRGを実行することによって、再符号化装置100は大別して、簡易復号部110と簡易符号化部120という2つの機能を実現する。簡易復号部110は、上述したステップS11,S12を実行するための機能であり、バッファ部111と、逆符号化部112と、分離部113と、簡易逆量子化部114という機能を含んでいる。一方、簡易符号化部120は、上述したステップS11’,S12’を実行するための機能であり、簡易量子化部121と、多重化部122と、符号化部123と、データ量監視部124と、目標値記憶部125という機能を含んでいる。これらの各機能111〜114,121〜125は互いに協働して動作する。
FIG. 4 is a block diagram illustrating a functional configuration of the re-encoding device 100.
When the CPU 141 executes the re-encoding program PRG, the re-encoding device 100 is roughly divided to realize two functions of the simple decoding unit 110 and the simple encoding unit 120. The simple decoding unit 110 is a function for executing steps S11 and S12 described above, and includes functions of a buffer unit 111, an inverse encoding unit 112, a separation unit 113, and a simple inverse quantization unit 114. . On the other hand, the simple encoding unit 120 is a function for executing steps S11 ′ and S12 ′ described above, and includes a simple quantization unit 121, a multiplexing unit 122, an encoding unit 123, and a data amount monitoring unit 124. And the target value storage unit 125 is included. These functions 111 to 114 and 121 to 125 operate in cooperation with each other.

次に、再符号化装置100の動作を説明する。
ユーザが操作部11を用いて目標データ量を入力し、再符号化を行うことを指示する操作を行うと、この操作に応じてCPU141は再符号化プログラムPRGを実行する。まず最初に、CPU141は不揮発性記憶部13に記憶されているデータの中から、再符号化すべき画像データを抽出する。例えばDVD-Video/MPEG2フォーマットに従った画像データは、「IFO」、「BUP」、「VOB」という3種類の拡張子のデータファイルによって構成されている。これらのうち拡張子「VOB」のデータファイルには、ナビゲーションパックと呼ばれる制御データの他、音声データ、字幕データ、画像データが収められており、さらに画像データは、ヘッダ情報やMPEG符号化された画像データ(実データ)及びパディングデータなどによって構成されている。これらの各種データのうち再符号化すべき対象はMPEG符号化された画像データ(実データ)であるから、CPU141は不揮発性記憶部13内の拡張子「VOB」のデータファイルからこのMPEG符号化された画像データ(実データ)を順次読み出し、ビット列として簡易復号部110に供給する。このビット列はRAM143の一部の記憶領域に確保されているバッファ部111に格納される。また、ユーザによって入力された目標データ量は、RAM143の一部の記憶領域に確保されている目標値記憶部125に格納される。
Next, the operation of the re-encoding device 100 will be described.
When the user inputs a target data amount using the operation unit 11 and performs an operation for instructing re-encoding, the CPU 141 executes the re-encoding program PRG in accordance with this operation. First, the CPU 141 extracts image data to be re-encoded from data stored in the nonvolatile storage unit 13. For example, image data according to the DVD-Video / MPEG2 format is composed of data files with three types of extensions “IFO”, “BUP”, and “VOB”. Of these, the data file with the extension “VOB” contains control data called navigation packs, as well as audio data, caption data, and image data. The image data is also encoded with header information and MPEG coding. It consists of image data (actual data) and padding data. Since the object to be re-encoded among these various data is MPEG-encoded image data (actual data), the CPU 141 performs MPEG encoding from the data file with the extension “VOB” in the nonvolatile storage unit 13. The obtained image data (actual data) is sequentially read and supplied to the simple decoding unit 110 as a bit string. This bit string is stored in the buffer unit 111 secured in a partial storage area of the RAM 143. Further, the target data amount input by the user is stored in the target value storage unit 125 secured in a partial storage area of the RAM 143.

次に、逆符号化部112は、バッファ部111に格納されたビット列を順次読み出し、読み出したビット列を、再符号化プログラムPRG内に記述されているVLCテーブルの内容に従って逆符号化する。例えば、図5に示すように、「0100000011101010」というビット列の場合、「01000」が逆符号化されて「0,2」という「run」と「level」の組に分解され、次に続く「0001111」が逆符号化されて「5,−1」という「run」と「level」の組に分解され、さらに次の「01010」が逆符号化されて「2,1」という「run」と「level」の組に分解される。また、ビット列の最後の「10」は、EOB(End of Block)に変換される。逆符号化部112は、このようにして得られたデータを分離部113に供給する。またこのとき、逆符号化部112は、逆符号化して得られたデータから元量子化ステップサイズ(ここでは元量子化ステップサイズを「5」とする)を抽出し、これを簡易逆量子化部114に供給する。元量子化ステップサイズは各スライスの開始コードの直後の領域に記述されているから、逆符号化部112はこの領域から元量子化ステップサイズを読み出して簡易逆量子化部114に供給すればよい。   Next, the inverse encoding unit 112 sequentially reads out the bit strings stored in the buffer unit 111, and inversely encodes the read bit strings in accordance with the contents of the VLC table described in the re-encoding program PRG. For example, as shown in FIG. 5, in the case of a bit string “010000001011101010”, “01000” is reverse-encoded and decomposed into a pair of “run” and “level” of “0, 2”, followed by “0001111” Is de-encoded and decomposed into a set of “run” and “level” of “5, −1”, and the next “01010” is de-encoded to generate “run” and “ It is decomposed into a set of “level”. Also, the last “10” of the bit string is converted to EOB (End of Block). The inverse encoding unit 112 supplies the data obtained in this way to the separation unit 113. At this time, the inverse encoding unit 112 extracts the original quantization step size (here, the original quantization step size is “5”) from the data obtained by the inverse encoding, and performs the simple inverse quantization. Supplied to the unit 114. Since the original quantization step size is described in a region immediately after the start code of each slice, the inverse encoding unit 112 may read the original quantization step size from this region and supply it to the simple inverse quantization unit 114. .

分離部113は、逆符号化部112から供給されてくるデータを、簡易逆量子化及び簡易量子化する必要があるデータと、その必要がないデータとに分離する。
ここで、図6は、ブロックを構成するデータの種類を示す図である。図6に示すように、ブロックは、DDSL(DCT DC Size Luminance),DDSC(DCT DC Size Chrominance),DDD(DCT DC Differential),FDC(First DCT Coefficients),SDC(Subsequence DCT Coefficients),EOB(End of Block)という6種類のデータによって構成されている。このうち、FDC及びSDCは「run」と「level」の組を符号化したビット列であり、EOBはブロック内で以後のDCT係数が全てゼロであることを示すビット列であり、再符号化処理の前後でその内容が変更されるから、簡易逆量子化及び簡易量子化する必要があるデータである。一方、DDSL,DDSC,DDDは、再符号化処理の前後でその内容が変更されないから、簡易逆量子化及び簡易量子化する必要がないデータである。従って、分離部113は、FDC,SDC,EOBを簡易逆量子化及び簡易量子化する必要があるデータと判断し、これを抽出して簡易逆量子化部114に供給する。これとともに、分離部113は、DDSL,DDSC,DDDを簡易逆量子化及び簡易量子化する必要がないデータと判断し、これを分離データとして多重化部122に供給する。
The separation unit 113 separates the data supplied from the inverse encoding unit 112 into data that needs simple inverse quantization and simple quantization and data that does not need to be.
Here, FIG. 6 is a diagram showing the types of data constituting the block. As shown in FIG. 6, the block includes DDSL (DCT DC Size Luminance), DDSC (DCT DC Size Chrominance), DDD (DCT DC Differential), FDC (First DCT Coefficients), SDC (Subsequence DCT Coefficients), EOB (End of Block). Among them, FDC and SDC are bit strings obtained by encoding a set of “run” and “level”, and EOB is a bit string indicating that all subsequent DCT coefficients are zero in the block. Since the contents are changed before and after, the data needs to be subjected to simple inverse quantization and simple quantization. On the other hand, DDSL, DDSC, and DDD are data that do not need to be subjected to simple dequantization and simple quantization because the contents are not changed before and after the re-encoding process. Therefore, the separation unit 113 determines that the FDC, SDC, and EOB are data that needs to be subjected to simple inverse quantization and simple quantization, extracts the data, and supplies the extracted data to the simple inverse quantization unit 114. At the same time, the demultiplexing unit 113 determines that DDSL, DDSC, and DDD need not be subjected to simple dequantization and simple quantization, and supplies this to the multiplexing unit 122 as demultiplexed data.

簡易逆量子化部114は、FDC及びSDCのそれぞれに含まれるDCT係数の「level」に対して、逆符号化部112によって供給されてきた元量子化ステップサイズを乗算することによって簡易量子化係数を求める。例えば図5に示す例では、簡易逆量子化部114は、「0,2」のlevel「2」に元量子化ステップサイズ「5」を乗算して簡易量子化係数「10」を得て、「0,−1」のlevel「−1」に元量子化ステップサイズ「5」を乗算して簡易量子化係数「−5」を得て、「2,1」のlevel「1」に元量子化ステップサイズ「5」を乗算して簡易量子化係数「5」を得る。簡易逆量子化部114はこのようにして得られた簡易量子化係数を簡易符号化部120の簡易量子化部121に供給する。   The simple inverse quantization unit 114 multiplies the “level” of the DCT coefficient included in each of the FDC and SDC by the original quantization step size supplied by the inverse encoding unit 112, thereby simplifying the quantization coefficient. Ask for. For example, in the example illustrated in FIG. 5, the simple inverse quantization unit 114 obtains the simple quantization coefficient “10” by multiplying the level “2” of “0, 2” by the original quantization step size “5”. The level “−1” of “0, −1” is multiplied by the original quantization step size “5” to obtain a simple quantization coefficient “−5”, and the level “1” of “2, 1” is converted into the original quantum. The simplified quantization coefficient “5” is obtained by multiplying the quantization step size “5”. The simple inverse quantization unit 114 supplies the simple quantization coefficient thus obtained to the simple quantization unit 121 of the simple encoding unit 120.

簡易量子化部121は、簡易逆量子化部114から供給されてくる簡易量子化係数を新量子化ステップサイズで量子化する。この新量子化ステップサイズの値は、再符号化する前の符号化データのデータ量と目標データ量と大小関係や、元量子化ステップサイズの大きさなどを根拠に、経験則や計算或いは所定のアルゴリズムなどに基づいて簡易量子化部121が決定すればよい。ここでは、新量子化ステップサイズを「8」とする。例えば図5に示す例では、簡易量子化部121は、簡易量子化係数「10」を新量子化ステップサイズ「8」で除算して余りを丸め、その整数部分を抽出して「1」を得る。同様に簡易量子化部121は簡易量子化係数「−5」を新量子化ステップサイズ「8」で除算し余りを丸めて「0」を得るし、簡易量子化係数「5」を新量子化ステップサイズ「8」で除算し余りを丸めて「0」を得る。   The simple quantization unit 121 quantizes the simple quantization coefficient supplied from the simple inverse quantization unit 114 with the new quantization step size. The value of the new quantization step size is calculated based on empirical rules, calculations, or predetermined values based on the relationship between the amount of encoded data before re-encoding and the target data amount, the size of the original quantization step size, etc. The simple quantization unit 121 may determine based on the above algorithm. Here, the new quantization step size is “8”. For example, in the example illustrated in FIG. 5, the simple quantization unit 121 divides the simple quantization coefficient “10” by the new quantization step size “8”, rounds the remainder, extracts the integer part, and extracts “1”. obtain. Similarly, the simple quantization unit 121 divides the simple quantization coefficient “−5” by the new quantization step size “8” to round the remainder to obtain “0”, and the simple quantization coefficient “5” is newly quantized. Divide by the step size “8” and round the remainder to obtain “0”.

簡易量子化部121は、このようにして得られた値をFDC,SDCにおける非ゼロのDCT係数とし、これをゼロのDCT係数の「run」と組にする。例えば図5に示す例では、簡易量子化部121は、「0,1」、「5,0」及び「2,0」という組と、「EOB」を得る。そして、簡易量子化部121は、上記新量子化ステップサイズ(=8)をスライスの開始コードの後に記述してから、上記のFDC,SDC,EOBを、多重化部122に供給する。多重化部122は、このFDC,SDC,EOBと、分離部113から供給されてきたDDSL,DDSC,DDDを、MPEG2で規定されている順番で組み合わせ、ブロックデータとして符号化部123に供給する。   The simple quantization unit 121 sets the obtained value as a non-zero DCT coefficient in the FDC and SDC, and sets this value together with “run” of the zero DCT coefficient. For example, in the example illustrated in FIG. 5, the simple quantization unit 121 obtains a set of “0, 1”, “5, 0”, and “2, 0” and “EOB”. The simple quantization unit 121 describes the new quantization step size (= 8) after the slice start code, and then supplies the FDC, SDC, and EOB to the multiplexing unit 122. The multiplexing unit 122 combines the FDC, SDC, and EOB and the DDSL, DDSC, and DDD supplied from the separation unit 113 in the order specified by MPEG2, and supplies the combined data to the encoding unit 123 as block data.

次いで、符号化部123は、上記ブロックデータをVLCテーブルに従ってエントロピー符号化する。具体的には、符号化部123は、VLCテーブルを参照して、「run」と「level」の組を、それに対応するビット列(VLC)に変換(符号化)する。即ち、前述した逆符号化とは逆のアルゴリズムに従って符号化することになる。例えば、図5に示すように、「0,1」という「run」と「level」の組はビット列「10」に符号化され、「EOB」はビット列「10」に符号化される。ただし、「5,0」及び「2,0」という「run」と「level」の組は、levelが「0」であるからビット列に符号化されない。以上の処理により、図5に例示した「010000001110101010」という符号化ビット列を、より短いビット列である「1010」に再符号化することができる。符号化部123は、このようにして得られたビット列を出力して不揮発性記憶部13に順次書き込んでいく。このとき、再符号化前の符号化データが前述したようなDVD-Video/MPEG2のデータに含まれていた場合には、再符号化の対象外であったナビゲーションパックや音声データ、字幕データ、画像データ(ヘッダ情報、パディングデータ)と再符号化された画像データとを多重化して不揮発性記憶部13に書き込めばよい。   Next, the encoding unit 123 performs entropy encoding on the block data according to the VLC table. Specifically, the encoding unit 123 refers to the VLC table and converts (encodes) a set of “run” and “level” into a corresponding bit string (VLC). That is, encoding is performed according to an algorithm reverse to the above-described inverse encoding. For example, as shown in FIG. 5, a set of “run” and “level” of “0, 1” is encoded into a bit string “10”, and “EOB” is encoded into a bit string “10”. However, a set of “run” and “level” of “5, 0” and “2, 0” is not encoded into a bit string because the level is “0”. Through the above processing, the encoded bit string “010000001011101010” illustrated in FIG. 5 can be re-encoded to “1010” which is a shorter bit string. The encoding unit 123 outputs the bit strings obtained in this way and sequentially writes them in the nonvolatile storage unit 13. At this time, when the encoded data before re-encoding is included in the DVD-Video / MPEG2 data as described above, the navigation pack, audio data, subtitle data, The image data (header information and padding data) and the re-encoded image data may be multiplexed and written into the nonvolatile storage unit 13.

データ量監視部124は、判断部126と調整部127という2つの機能によって構成されている。判断部126は、符号化部123から出力されて不揮発性記憶部13に書き込まれたビット列の累積データ量を常時監視しており、最終的に得られる符号化データの総データ量が目標値記憶部125に記憶された目標データ量とほぼ同じになるか否かを判断する。具体的な判断手法は以下の通りである。   The data amount monitoring unit 124 is configured by two functions of a determination unit 126 and an adjustment unit 127. The determination unit 126 constantly monitors the accumulated data amount of the bit string output from the encoding unit 123 and written in the nonvolatile storage unit 13, and the total data amount of the finally obtained encoded data is stored as a target value. It is determined whether or not the target data amount stored in the unit 125 is substantially the same. The specific judgment method is as follows.

図7は、再符号化処理中において、再符号化する前の符号化データのデータ量と、再符号化した後の符号化データのデータ量との関係を表した模式図である。図7において、再符号化する前の符号化データの総データ量をA1とし、このA1のうち既に逆符号化済みのデータ量をS1とする。また、目標データ量をA2とし、再符号化して得られた符号化データのデータ量をS2とする。ここで、再符号化処理が目標通りに進行するためには、再符号化前の符号化データのデータ量A1に対して既に再符号化が完了した符号化データのデータ量S1が占める割合(S1/A1)と、目標データ量A2に対して再符号化によって得られた符号化データのデータ量S2が占める割合(S2/A2)とはほぼ同じになるべきである。よって、再符号化処理が目標通りに進行するためには、これらA1,A2,S1,S2の間に、S1/A1=S2/A2という関係式が成り立つべきである。これに対し、再符号化処理が目標通りに進行していない場合には、S1/A1>S2/A2、或いは、S1/A1<S2/A2という状態となる。   FIG. 7 is a schematic diagram showing the relationship between the amount of encoded data before re-encoding and the amount of encoded data after re-encoding during the re-encoding process. In FIG. 7, the total amount of encoded data before re-encoding is A1, and the amount of data that has already been reverse-encoded among the A1 is S1. Further, the target data amount is A2, and the data amount of the encoded data obtained by re-encoding is S2. Here, in order for the re-encoding process to proceed as intended, the ratio of the data amount S1 of encoded data that has already been re-encoded to the data amount A1 of encoded data before re-encoding ( S1 / A1) and the ratio (S2 / A2) of the encoded data amount S2 obtained by re-encoding to the target data amount A2 should be substantially the same. Therefore, in order for the re-encoding process to proceed as intended, the relational expression S1 / A1 = S2 / A2 should be established between A1, A2, S1, and S2. On the other hand, when the re-encoding process does not proceed as intended, the state is S1 / A1> S2 / A2, or S1 / A1 <S2 / A2.

そこで、本実施形態では、再符号化処理が目標通りに進行しているか否かを判定するための判定基準値として、d=S2−(A2×S1/A1)を定義している。判断部126は、この判定基準値dが予め決められた許容範囲内に収まる場合には、再符号化が完了したときの符号化データの総データ量が目標データ量とほぼ同じになると判断する。これはより具体的には、許容範囲を定める閾値(絶対値)をd1としたときに、判定基準値dが−d1≦d≦+d1という条件を満たす場合である。一方、判定基準値dが許容範囲を超えた場合には、再符号化が完了したときの符号化データの総データ量が目標データ量とほぼ同じにはならないと判断する。つまり、判定基準値dが、d<−d1となる場合か、+d1<dとなる場合である。この場合、判断部126は、判定基準値dがd<−d1という状態であるか、又は、+d1<dという状態であるかということを調整部127に通知する。   Therefore, in this embodiment, d = S2− (A2 × S1 / A1) is defined as a determination reference value for determining whether or not the re-encoding process is proceeding as intended. When the determination reference value d falls within a predetermined allowable range, the determination unit 126 determines that the total data amount of the encoded data when the re-encoding is completed is substantially the same as the target data amount. . More specifically, this is a case where the criterion value d satisfies the condition of −d1 ≦ d ≦ + d1 when the threshold value (absolute value) that defines the allowable range is d1. On the other hand, when the determination reference value d exceeds the allowable range, it is determined that the total data amount of the encoded data when the re-encoding is completed is not substantially the same as the target data amount. That is, the criterion value d is when d <−d1 or when + d1 <d. In this case, the determination unit 126 notifies the adjustment unit 127 whether the determination reference value d is in the state of d <−d1 or + d1 <d.

調整部127は、前記判断手段から通知されてくる内容に応じて新量子化ステップサイズの大きさを調整する。例えば判定基準値dが+d1<dを満たすときは、S2/A2がS1/A1よりも相当に大きい場合であるから、再符号化による圧縮効果が期待していたほど現れていないことを意味している。よって、調整部127は、現在用いている新量子化ステップサイズの値を大きくして圧縮率を高くする。例えば、新量子化ステップサイズとして「8」を用いている場合には、その新量子化ステップサイズを1つ大きくして「9」にする。一方、d<−d1となるときは、S2/A2がS1/A1よりも相当に小さい場合であるから、期待以上の圧縮効果が現れていることを意味している。よって、調整部127は、現在用いている新量子化ステップサイズの値を小さくして圧縮率を低減させる。例えば、新量子化ステップサイズとして「8」を用いている場合には、その新量子化ステップサイズを1つ小さくして「7」にする。このように、簡易符号化処理が全て完了したときに得られる符号化データの総データ量が目標データ量よりも相当大きくなる又は相当小さくなることが予想されると、目標データ量との差分をより小さくするような新量子化ステップサイズを求め、それを用いて簡易量子化処理を行うようにしているので、ほぼ目標通りの再符号化が可能となる。   The adjustment unit 127 adjusts the size of the new quantization step size according to the content notified from the determination unit. For example, when the criterion value d satisfies + d1 <d, it means that S2 / A2 is considerably larger than S1 / A1, and therefore, it means that the compression effect by re-encoding does not appear as expected. ing. Therefore, the adjustment unit 127 increases the compression rate by increasing the value of the new quantization step size currently used. For example, when “8” is used as the new quantization step size, the new quantization step size is increased by one to “9”. On the other hand, when d <−d1, since S2 / A2 is considerably smaller than S1 / A1, it means that the compression effect more than expected has appeared. Therefore, the adjustment unit 127 reduces the compression rate by reducing the value of the new quantization step size currently used. For example, when “8” is used as the new quantization step size, the new quantization step size is reduced by one to “7”. In this way, if the total amount of encoded data obtained when all the simple encoding processes are completed is expected to be considerably larger or considerably smaller than the target data amount, the difference from the target data amount is calculated. Since a new quantization step size that is smaller is obtained and simple quantization processing is performed using the step size, re-encoding can be performed almost as intended.

以上説明した実施形態はあくまでも例示であり、種々の変形例がある。
例えば実施形態では、MPEG2によって符号化された画像データについて本発明を適用する例で説明したが、符号化方式はMPEG2に限らず、例えばMPEG1(Moving Picture Image Coding Experts Group-1)であってもよい。また、JPEG(Joint Photographic Coding Experts Group)にも適用可能である。要するに、量子化の後にゼロ係数の連続個数と非ゼロ係数の係数値との組を得て、その組をある符号化アルゴリズムに従ってビット列に変換するような符号化方式であれば、本発明を適用することが可能である。
また、実施形態では、ブロックを構成するDDSL,DDSC,DDD,FDC,SDC,EOBという6種類のデータのうち、FDC,SDC,EOBを簡易逆量子化及び簡易量子化する必要があるデータと判断し、DDSL,DDSC,DDDを簡易逆量子化及び簡易量子化する必要がないデータと判断していた。これと同様の発想に従って、上記のDDSL,DDSC,DDD,FDC,SDC,EOB以外のデータが含まれるデータを再符号化する場合においても、再符号化する必要があるデータとその必要がないデータに分離し、再符号化すべきデータのみを再符号化するようにしてもよい。
また、実施形態では、再符号化プログラムPRGというソフトウェアを用いて再符号化装置を構成していたが、このソフトウェアの一部又は全部をハードウェアとして構成してもよい。例えば図4において実施形態に係る再符号化方法を実施するために必要な機能を列挙したが、これらの機能のうち一部又は全部をソフトウェアに頼らずハードウェアのみで実現するようにしてもよい。
また、実施形態では、簡易量子化部121が新量子化ステップサイズで量子化している最中に、必要に応じて、調整部127がこの新量子化ステップサイズを大きくしたり小さくするなどの調整を行っていた。この新量子化ステップサイズはもともとは元量子化ステップサイズよりも大きい値であったが、調整部127による調整の結果、調整後の新量子化ステップサイズが元量子化ステップサイズよりも小さくなってしまう場合もあり得る。ただし、再符号化してデータ量を小さくするという目的に鑑みると、上記のような特殊な現象は一時的に限定された期間しか発生しないはずであり、それ以外の期間においては、元量子化ステップサイズよりも大きい新量子化ステップサイズを用いて量子化するという事実があることに変わりはない。従って、仮に調整後の新量子化ステップサイズが元量子化ステップサイズよりも一時的に小さくなってしまうような場合を含む実施態様があったとしても、「特許請求の範囲」における「前記簡易逆量子化手段によって求められた簡易量子化係数を、前記量子化ステップサイズよりも大きい量子化ステップサイズを用いて量子化する簡易量子化手段」の範囲に上記実施態様は含まれるものとする。
なお、上述した再符号化プログラムPRGは、磁気テープ、磁気ディスク、フロッピー(登録商標)ディスク、光記録媒体、光磁気記録媒体、CD(Compact Disk)−ROM、DVD、RAMなどの記録媒体に記録した状態で提供し得る。
The embodiment described above is merely an example, and there are various modifications.
For example, in the embodiment, the example in which the present invention is applied to image data encoded by MPEG2 has been described. However, the encoding method is not limited to MPEG2, but may be MPEG1 (Moving Picture Image Coding Experts Group-1), for example. Good. It can also be applied to JPEG (Joint Photographic Coding Experts Group). In short, the present invention is applied to any coding scheme that obtains a set of consecutive zero coefficients and coefficient values of non-zero coefficients after quantization and converts the set into a bit string according to a certain coding algorithm. Is possible.
In the embodiment, it is determined that among the six types of data DDSL, DDSC, DDD, FDC, SDC, and EOB constituting the block, the FDC, SDC, and EOB need to be simply dequantized and simply quantized. However, it has been determined that DDSL, DDSC, and DDD are data that need not be subjected to simple inverse quantization and simple quantization. According to the same idea, even when re-encoding data including data other than DDSL, DDSC, DDD, FDC, SDC, and EOB, data that needs to be re-encoded and data that does not need to be re-encoded And only the data to be re-encoded may be re-encoded.
In the embodiment, the re-encoding device is configured using software called the re-encoding program PRG. However, part or all of the software may be configured as hardware. For example, in FIG. 4, functions necessary for performing the re-encoding method according to the embodiment are listed. However, some or all of these functions may be realized only by hardware without depending on software. .
In the embodiment, while the simple quantization unit 121 is quantizing with the new quantization step size, the adjustment unit 127 adjusts the new quantization step size to be larger or smaller as necessary. Had gone. This new quantization step size was originally larger than the original quantization step size, but as a result of adjustment by the adjustment unit 127, the adjusted new quantization step size becomes smaller than the original quantization step size. It can happen. However, in view of the purpose of reducing the amount of data by re-encoding, the special phenomenon as described above should occur only for a limited period of time, and in other periods, the original quantization step There is still the fact that the quantization is performed using a new quantization step size larger than the size. Therefore, even if there is an embodiment including a case where the new quantization step size after adjustment is temporarily smaller than the original quantization step size, the “inverse reversal” in the “Claims” The above embodiment is included in the range of “simple quantization means for quantizing the simple quantization coefficient obtained by the quantization means using a quantization step size larger than the quantization step size”.
The re-encoding program PRG described above is recorded on a recording medium such as a magnetic tape, a magnetic disk, a floppy (registered trademark) disk, an optical recording medium, a magneto-optical recording medium, a CD (Compact Disk) -ROM, a DVD, or a RAM. Can be provided in the state.

本発明の実施形態における再符号化方法の概要を示す模式図である。It is a schematic diagram which shows the outline | summary of the re-encoding method in embodiment of this invention. 同実施形態で用いるVLCテーブルの内容の一例を示す図である。It is a figure which shows an example of the content of the VLC table used by the embodiment. 同実施形態に係る再符号化装置のハードウェア構成を示すブロック図である。It is a block diagram which shows the hardware constitutions of the re-encoding apparatus which concerns on the same embodiment. 同再符号化装置の機能構成を示すブロック図である。It is a block diagram which shows the function structure of the same re-encoding apparatus. ビット列を再符号化する場合の一例を示す図である。It is a figure which shows an example in the case of re-encoding a bit stream. ブロックを構成するデータの種類を表す図である。It is a figure showing the kind of data which comprises a block. 再符号化処理中において、再符号化する前の符号化データのデータ量と、再符号化した後の符号化データのデータ量との関係を表した模式図である。It is the schematic diagram showing the relationship between the data amount of the encoded data before re-encoding during the re-encoding process, and the data amount of the encoded data after re-encoding. MPEG符号化されたデータの構造を表す図である。It is a figure showing the structure of the data encoded by MPEG. 従来の再符号化方法の概要を示す模式図である。It is a schematic diagram which shows the outline | summary of the conventional re-encoding method.

符号の説明Explanation of symbols

100・・・再符号化装置、110・・・簡易復号部、111・・・バッファ部、112・・・逆符号化部、113・・・分離部、114・・・簡易逆量子化部、120・・・簡易符号化部、121・・・簡易量子化部、122・・・多重化部、123・・・符号化部、124・・・データ量監視部、125・・・・目標値記憶部。 DESCRIPTION OF SYMBOLS 100 ... Re-encoding apparatus, 110 ... Simple decoding part, 111 ... Buffer part, 112 ... Decoding part, 113 ... Separation part, 114 ... Simple dequantization part, 120 ... Simple encoding unit, 121 ... Simple quantization unit, 122 ... Multiplexing unit, 123 ... Encoding unit, 124 ... Data amount monitoring unit, 125 ... Target value Memory part.

Claims (1)

量子化を経て符号化されたビット列を、決められた逆符号化アルゴリズムに従って、ゼロ係数の連続個数と非ゼロ係数の係数値との組に変換する逆符号化手段と、
前記逆符号化手段によって得られた前記非ゼロ係数の係数値に対し、前記ビット列が量子化されたときに用いられた量子化ステップサイズを乗算することによって、簡易量子化係数を求める簡易逆量子化手段と、
前記簡易逆量子化手段によって求められた簡易量子化係数を、前記量子化ステップサイズよりも大きい量子化ステップサイズを用いて量子化する簡易量子化手段と、
前記簡易量子化手段によって量子化されて得られた値を非ゼロ係数の係数値とし、前記ゼロ係数の連続個数と当該非ゼロ係数の係数値との組を、前記逆符号化アルゴリズムとは逆の符号化アルゴリズムに従ってビット列に変換して出力する符号化手段と
指定された目標データ量を記憶する目標値記憶手段と、
前記符号化手段によって順次出力されてくるビット列の累積データ量に基づいて、前記符号化手段による変換が完了したときの前記ビット列の総データ量が前記目標値記憶手段によって記憶されている目標データ量とほぼ同じになるか否かを判断する判断手段であって、前記逆符号化手段によって前記変換がなされる前の前記ビット列の総データ量に対して、該ビット列のうち該逆符号化手段による前記変換が既に完了したビット列のデータ量が占める割合と、前記目標データ量に対して前記符号化手段によって出力されたビット列の累積データ量が占める割合とを比較し、前者の割合と後者の割合がほぼ同じではない場合には、前記符号化手段による変換が完了したときのビット列の総データ量が目標データ量とほぼ同じにならないと判断する判断手段と、
前記判断手段によって前記ビット列の総データ量が前記目標データ量とほぼ同じにならないと判断された場合、前記簡易量子化手段が量子化するために用いている量子化ステップサイズの値を調整する調整手段と
を備えた再符号化装置。
A reverse encoding means for converting a bit string encoded through quantization into a set of a continuous number of zero coefficients and a coefficient value of a non-zero coefficient according to a predetermined reverse encoding algorithm;
A simple inverse quantum for obtaining a simple quantized coefficient by multiplying the coefficient value of the non-zero coefficient obtained by the inverse encoding means by a quantization step size used when the bit string is quantized. And
Simple quantization means for quantizing a simple quantization coefficient obtained by the simple inverse quantization means using a quantization step size larger than the quantization step size;
A value obtained by quantization by the simple quantization means is a coefficient value of a non-zero coefficient, and a set of the number of consecutive zero coefficients and the coefficient value of the non-zero coefficient is opposite to the inverse encoding algorithm. encoding means for converting a bit string in accordance with the coding algorithm,
Target value storage means for storing the specified target data amount;
Based on the cumulative data amount of the bit string output sequentially by the encoding means, the total data amount of the bit string when conversion by the encoding means is completed is stored in the target value storage means. Determination means for determining whether or not the bit string is substantially the same as the total data amount of the bit string before the conversion by the inverse encoding means by the inverse encoding means. The ratio of the data amount of the bit string that has already been converted is compared with the ratio of the cumulative data amount of the bit string output by the encoding means to the target data amount, and the former ratio and the latter ratio Are not substantially the same, it is determined that the total data amount of the bit string when the conversion by the encoding means is completed is not substantially the same as the target data amount. A determination means that,
Adjustment for adjusting the value of the quantization step size used by the simple quantization means for quantization when the determination means determines that the total data amount of the bit string is not substantially the same as the target data amount Means for re-encoding.
JP2004125921A 2004-04-21 2004-04-21 Re-encoding device Expired - Lifetime JP4295658B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004125921A JP4295658B2 (en) 2004-04-21 2004-04-21 Re-encoding device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004125921A JP4295658B2 (en) 2004-04-21 2004-04-21 Re-encoding device

Publications (2)

Publication Number Publication Date
JP2005311714A JP2005311714A (en) 2005-11-04
JP4295658B2 true JP4295658B2 (en) 2009-07-15

Family

ID=35439971

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004125921A Expired - Lifetime JP4295658B2 (en) 2004-04-21 2004-04-21 Re-encoding device

Country Status (1)

Country Link
JP (1) JP4295658B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6191843B2 (en) * 2015-12-17 2017-09-06 株式会社ドワンゴ Image processing system, image processing apparatus, transcoding method, and program

Also Published As

Publication number Publication date
JP2005311714A (en) 2005-11-04

Similar Documents

Publication Publication Date Title
US6301428B1 (en) Compressed video editor with transition buffer matcher
JP2000278692A (en) Compressed data processing method, processor and recording and reproducing system
JP2002199402A (en) System for transcoding discrete cosine transform coded signals, and method related thereto
JP2003284071A (en) Method and apparatus for coding and decoding image considering visual characteristic of human being
JP4791129B2 (en) Image coding apparatus, image coding method, and image editing apparatus
JP4706104B2 (en) Image encoding apparatus and method
EP2129132A2 (en) Encoding/decoding device, encoding/decoding method and storage medium
JP2004343280A (en) Image processing apparatus and method, information processing apparatus, recording medium, and program
KR100969908B1 (en) Edition device and method, and recording medium
US20050163214A1 (en) Image recompressing apparatus and image recompressing method
US20060104350A1 (en) Multimedia encoder
US5694172A (en) Method and apparatus for reproducing picture data
US6271774B1 (en) Picture data processor, picture data decoder and picture data encoder, and methods thereof
JP3395892B2 (en) Video encoding device
US7346108B2 (en) Encoded-data converting apparatus and method for the same
JP4274653B2 (en) Moving picture composition apparatus and moving picture composition method
JPH10174098A (en) Video data compressor and its method
JP4295658B2 (en) Re-encoding device
JP4301237B2 (en) Encoding apparatus and method thereof, recording apparatus and method thereof, and recording medium
JPH10271498A (en) Compression data conversion method, information quantity conversion method for image compression data, and image recorder adopting the method
JP2002199408A (en) Moving image coding method and moving image coder
JPH09294263A (en) Image information compressor
JPH10174106A (en) Video data compressor and its method
JP4416845B2 (en) Encoding apparatus and method thereof, and recording apparatus and method thereof
JP4539028B2 (en) Image processing apparatus, image processing method, recording medium, and program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070214

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090121

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090127

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090323

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090407

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090410

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120417

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4295658

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120417

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150417

Year of fee payment: 6

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term