JP4604757B2 - Image coding apparatus and image coding method - Google Patents
Image coding apparatus and image coding method Download PDFInfo
- Publication number
- JP4604757B2 JP4604757B2 JP2005039602A JP2005039602A JP4604757B2 JP 4604757 B2 JP4604757 B2 JP 4604757B2 JP 2005039602 A JP2005039602 A JP 2005039602A JP 2005039602 A JP2005039602 A JP 2005039602A JP 4604757 B2 JP4604757 B2 JP 4604757B2
- Authority
- JP
- Japan
- Prior art keywords
- quantization scale
- bit rate
- image
- vbr
- encoding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
Description
本発明は、画像データを符号化する画像符号化装置、特に可変ビットレートで動画像データを符号化する画像符号化装置及びその方法に関する。 The present invention relates to an image encoding apparatus that encodes image data, and more particularly to an image encoding apparatus that encodes moving image data at a variable bit rate and a method thereof.
通常、画像符号化装置において、固定符号化レート(CBR:Constant Bit Rate)または可変符号化レート(VBR:Variable Bit Rate)で画像信号を符号化してビットストリームとして出力する。
固定符号化レートで符号化されたビットストリームは、一定のビットレートを有し、目標ビットレートを大きく逸脱することはない。
これに対して、可変符号化レートで符号されたビットストリームは符号化対象となる画像信号の特徴などに応じて変化するから、ビットレートが一定ではない。ただし、この場合においても、規格によって定められた最大ビットレートを越えない範囲内において画像信号に対して圧縮符号化処理が行われる。
Usually, in an image encoding device, an image signal is encoded at a fixed encoding rate (CBR: Constant Bit Rate) or a variable encoding rate (VBR: Variable Bit Rate) and output as a bit stream.
A bit stream encoded at a fixed encoding rate has a constant bit rate and does not deviate significantly from the target bit rate.
On the other hand, since the bit stream encoded at the variable encoding rate changes according to the characteristics of the image signal to be encoded, the bit rate is not constant. However, even in this case, the compression coding process is performed on the image signal within a range not exceeding the maximum bit rate determined by the standard.
ディジタル化した動画像信号を符号化する場合、符号化ビットレート制御が行われる。
符号化ビットレート制御とは、符号化によって発生する符号系列をある一定の時間幅でみたときに所望のビットレートになるよう制御することである。
When a digitized moving image signal is encoded, encoding bit rate control is performed.
The encoding bit rate control is control to achieve a desired bit rate when a code sequence generated by encoding is viewed in a certain time width.
これまで、動画像を高能率で圧縮符号化するための規格が複数提案されている。そのなかで、MPEG2規格が動画像符号化の標準規格として現在、通信、放送及びメディア蓄積など様々な応用分野で注目を集め、実用化されつつある。
その一つの応用例であるDVD(Digital Versatile Disc)は、MPEG2規格に準じて動画像を圧縮符号化したデータを保存する記録媒体として、大容量、低価格かつ取り扱いが簡単なため、今後ますますの普及が期待されている。
To date, a plurality of standards for compressing and encoding moving images with high efficiency have been proposed. Among them, the MPEG2 standard is currently attracting attention in various application fields such as communication, broadcasting, and media storage as a standard for moving picture coding, and is being put into practical use.
One application example is the DVD (Digital Versatile Disc), which is a large-capacity, low-priced and easy-to-use recording medium for storing data that is compression-encoded for moving images according to the MPEG2 standard. Is expected to spread.
MPEG2規格ではビットレートを制御する符号化制御について規定されていない。このため、符号化情報量は規格によって定められた範囲内にあればよい。
通常、DVDのオーサリング(Authoring ,DVDタイトル作成のための編集作業)では可変符号化レートが用いられている。その際の符号化方法は、一回目の処理で符号化処理対象のソース全体の符号化難易度を調べ、二回目の処理で全体の符号化情報量が規格によって定められた範囲内になるように上記調べた符号化難易度に対応した符号量を割り当てて符号化を行うことで可変符号化レートを実現している。このような2回の処理によって、符号化情報量の全体が規格によって定められた範囲内にしつつ、難易度の高い(複雑な)画像信号に対してより多くの符号量が割り当てられ、逆に難易度の低い(複雑でない)画像信号に対して割り当てられる符号量を抑えることによって、全体として画質の均一化を達成できる。
The MPEG2 standard does not specify encoding control for controlling the bit rate. For this reason, the encoded information amount only needs to be within a range defined by the standard.
Usually, a variable encoding rate is used in DVD authoring (authoring, editing work for creating a DVD title). In this case, the encoding method checks the encoding difficulty level of the entire source to be encoded in the first process, and the entire encoded information amount is within the range defined by the standard in the second process. A variable encoding rate is realized by assigning a code amount corresponding to the above-described encoding difficulty level and performing encoding. By such two processes, a larger amount of code is allocated to a highly complicated (complex) image signal while the entire amount of encoded information is within the range defined by the standard. By suppressing the amount of code assigned to an image signal with low difficulty (uncomplicated), uniform image quality can be achieved as a whole.
ところで、ビデオカメラのように撮像装置で得られた動画像信号を実時間で記録媒体に記録する用途においては、連続的に入力される動画像信号を逐次圧縮符号化し、記録媒体に記録する必要がある。このような実時間処理が必要な場合、上述した2段階符号化処理における一回目の処理を行うことができない。すなわち、あらかじめ符号化しようとする画像全体を調べることができないため、通常、たとえば、15フレーム程度を単位とするGOP(Group of Picture)毎に符号量を一定に制御する固定符号化レートで画像の圧縮符号化処理を行う。 By the way, in an application where a moving image signal obtained by an imaging device such as a video camera is recorded on a recording medium in real time, it is necessary to sequentially compress and encode the moving image signal input continuously and record it on the recording medium. There is. When such real-time processing is required, the first processing in the above-described two-stage encoding processing cannot be performed. In other words, since the entire image to be encoded cannot be examined in advance, the image is usually recorded at a fixed encoding rate in which the code amount is controlled to be constant for each GOP (Group of Picture) in units of about 15 frames. Perform compression encoding processing.
図1は、固定符号化レートによって画像信号を符号化した場合の符号化レートを示している。固定符号化レート制御によって画像信号を圧縮符号化した場合、得られた符号列のビットレートが、画像の特徴にかかわらず、ほぼ目標ビットレートに固定されている。この固定符号化レートを実現するために、画像符号化装置の符号化レート制御部では、予め与えられた目標符号化レートに対して、数ブロックからなるマクロブロック単位で量子化スケールを迅速に変化させる。
固定符号化レートによる圧縮符号化処理は、画像の特徴にかかわりなく符号化レートを一定にするため、符号化難易度の低いシーンでは画質がよいが、符号化難易度の高いシーンでは画質が劣化してしまうという不具合が生ずる。このため、画質を一定のレベル以上に維持しながら、圧縮符号化で得られた符号量が規定値以内に収まるよう符号化処理のビットレートを可変に設定することが望まれる。
FIG. 1 shows an encoding rate when an image signal is encoded at a fixed encoding rate. When an image signal is compression-encoded by fixed encoding rate control, the bit rate of the obtained code string is almost fixed to the target bit rate regardless of the characteristics of the image. In order to realize this fixed coding rate, the coding rate control unit of the image coding device quickly changes the quantization scale in units of several macroblocks with respect to a predetermined target coding rate. Let me.
The compression encoding process with a fixed encoding rate keeps the encoding rate constant regardless of the image characteristics, so the image quality is good in scenes with low encoding difficulty, but the image quality deteriorates in scenes with high encoding difficulty. This causes a malfunction. For this reason, it is desirable to variably set the bit rate of the encoding process so that the code amount obtained by compression encoding falls within a specified value while maintaining the image quality at a certain level or higher.
図2は、可変ビットレート制御(可変符号化レート制御)によって得られた符号列のビットレートの一例を示している。可変ビットレート制御では、目標ビットレートに対して、たとえば、GOP単位で量子化(Q)スケールを制御する。たとえば、画像符号化難易度の低いところ(複雑ではない画像部分)ではビットレートが低くなり、画像符号化難易度の高いところ(複雑な画像部分)では、ビットレートが高くなり、画像の符号化難易度に応じてビットレートが時間的に変化することで、再生画像の画質をほぼ一様に保つことができる。
しかし、ビデオカメラなど実時間での画像処理が要求される用途例では、上述したように、画像全体の特徴を事前に調べることができないため、符号化レートの設定は経験的に行われる。実際の撮像装置から得られた画像が時々刻々と変化し、画像符号化難易度も時間的に変化するため、符号化難易度の高い画像部分では、符号化ビットレートがビットストリームの先頭に来るシーケンスヘッダで指定された最大ビットレートを越えてしまうことがある。したがって、単に符号化難易度の変化に対する量子化スケールの応答速度を遅くするだけでは、あらゆる場合に規格に準じたビットストリームを生成することはできない。
さらに、上記可変符号化レート制御を民生用に適用する場合を考えると、ハードウエアの回路規模や、ソフトウエアの演算量の増加の少ない、シンプルなアルゴリズムが求められる。
FIG. 2 shows an example of the bit rate of a code string obtained by variable bit rate control (variable coding rate control). In the variable bit rate control, the quantization (Q) scale is controlled with respect to the target bit rate, for example, in units of GOP. For example, the bit rate is low where the image encoding difficulty is low (uncomplicated image portion), and the bit rate is high where the image encoding difficulty is high (complex image portion). Since the bit rate changes with time according to the degree of difficulty, the quality of the reproduced image can be kept substantially uniform.
However, in an application example that requires real-time image processing, such as a video camera, as described above, since the characteristics of the entire image cannot be examined in advance, the encoding rate is set empirically. Since the image obtained from the actual imaging device changes from moment to moment, and the image encoding difficulty also changes with time, the encoding bit rate comes to the beginning of the bitstream in the image portion where the encoding difficulty is high The maximum bit rate specified in the sequence header may be exceeded. Therefore, it is impossible to generate a bitstream conforming to the standard in all cases simply by reducing the response speed of the quantization scale with respect to the change in the encoding difficulty level.
Further, considering the case where the variable coding rate control is applied to consumer use, a simple algorithm with a small increase in hardware circuit scale and software calculation amount is required.
特許文献1は、上述した不具合を克服し、上記ニーズに対応すべく考案された、実時間処理が要求される用途において可変符号化レート制御での動画像の圧縮符号化処理を実現できる画像符号化装置及びその処理方法を開示している。特許文献1に開示されている技術は、要約すれば、量子化(Q)スケールを制御することにより行なう可変ビットレート(VBR)制御技術である。以下、特許文献1に開示された発明の概要を述べる。
特許文献1によれば、Qスケールを所定の値に固定するいわゆる固定Qスケールによる画像符号化処理が行われる。これによって、符号化難易度の高い画像ではより多くのビットが発生し、逆に符号化難易度の低い画像では発生するビット数が少なくなる。その結果、一連の画像全体で見れば、符号化難易度の低い部分で発生するビット量が抑制され、難易度の高い部分でより多くのビット数が割り当てられるので、画質を均一に保ちながら可変符号化レートを実現できる。
According to
また特許文献1に開示された技術は、画像全体の平均ビットレートが一定の基準になるように、GOP単位、たとえば、15ピクチャ以上の単位で符号化レート制御を行う。GOP毎の目標ビット量を予め設定し、各GOPの発生ビット量が目標ビット量からのずれに応じてQスケールを制御することにより、符号化レートがGOP単位に緩やかに変化し、かつ画像全体のビットレートが目標ビットレートから大きく逸脱しない範囲内に保持される。
The technique disclosed in
さらに特許文献1に開示された技術は、入力画像の符号化レートが符号化システムの最大許容ビットレートを満足するように、通常の画像符号化装置に備えられている第2量子化(Q)スケール設定手段により、あらかじめ定められた最大ビットレートに応じて固定符号化レート制御用Qスケールを設定し、設定された固定符号化レート制御用Qスケールと第1量子化スケール制御手段により求まる可変符号化レート制御用Qスケールとを比較して大きい方を実際の符号化処理に適用することにより、画像符号化処理におけるビットレートを符号化システムの最大許容値以内に保持することを可能にしている。
Furthermore, the technique disclosed in
また特許文献1に開示された可変符号化レート処理では、通常の固定符号化レート制御手段を利用するため、画像符号化装置に適用する際には、ハードウエアの回路規模やソフトウエアの演算量の増加を最小限にとどめることができるという利点がある。
特許文献1に開示されている技術では、規格によって定められた最大ビットレートを超えないために最大ビットレートの制限を行なっている。しかし符号化による画質を考えると、図3に図解したように、符号化難易度が高い画像が続きQスケールが高い状態になっているときに、符号化難易度が低い画像(Qスケールが低い値に収束する画像)が入力された第1遷移領域Z1においてビットレートが低くなり過ぎ符号化による画質の劣化が目立つ。そのため、このような画質劣化を防ぐために最小ビットレートを制限することも必要となる。
他方、目標ビットレートが低い場合など、規格以下であっても図3の第2遷移領域Z2においてビットレートが高くなりすぎると、長期的に見た発生ビット量は目標ビットレートに応じた値に制限を加える必要があるため、発生し過ぎたビット量分を相殺するためその後ビットレートを下げる必要があり、このとき画質劣化が生じる可能性がある。
すなわち最大ビットレートの制限も、規格によるもの以外に目標ビットレートに応じた最大ビットレートを設定し、これを超えないようにする制限が必要である。
In the technique disclosed in
On the other hand, if the bit rate is too high in the second transition region Z2 of FIG. 3 even when the target bit rate is low, the generated bit amount in the long term becomes a value corresponding to the target bit rate. Since it is necessary to add a restriction, it is necessary to lower the bit rate thereafter to offset the excessive bit amount, and image quality may be deteriorated at this time.
In other words, the maximum bit rate must be limited so as not to exceed the maximum bit rate according to the target bit rate other than the standard.
特許文献1ではまた、最大ビットレートを制限するためにCBR(固定ビットレート)でレート制御を行い、得られたQスケールをVBR(可変ビットレート)のQスケールと大小比較し、比較結果を選択することを行なっている。このCBRレート制御はMPEG2規格のTM(Test Model) 5をベースに行っているが、1フレーム毎の目標ビット量を求める元になっているGOPの残りビット量の計算において、GOPの最初に設定される1GOP間の目標発生ビット量は最大ビットレートを元に求められているが、そこから1フレーム毎に引かれる発生ビット量は、目標ビットレートを元に制御される実際に発生したビット量である。
通常、最大ビットレートに比べて目標ビットレートは低いため、GOPの残りビット量は最初に設定される値に比べて引かれる値が小さく、詳細は後述する図10(A)、(B)に実線で示した曲線CV11、CV12のように、GOPの後のピクチャになるにしたがい徐々に過剰になってくる。すなわち、GOPの最初に求められる1フレームの目標ビット量は適切なものであるが、徐々に1フレームの目標ビット量が多くなり、GOPの後半では最大ビットレートでの制限が行なわれにくくなっていく。
最小ビットレートでの制限を加えた場合も同様に、図10(C)に実線で示した曲線CV13のように、MPEG2規格のTM5ベースのCBRレート制御を行なうと、上記と同じ不具合が生じる。
In
Usually, since the target bit rate is lower than the maximum bit rate, the amount of remaining bits of the GOP is smaller than the value initially set. Details are shown in FIGS. 10A and 10B described later. As the curves CV11 and CV12 indicated by the solid lines become pictures after the GOP, they gradually become excessive. That is, the target bit amount of one frame obtained at the beginning of the GOP is appropriate, but the target bit amount of one frame gradually increases, and it becomes difficult to limit the maximum bit rate in the second half of the GOP. Go.
Similarly, when the restriction at the minimum bit rate is applied, the same trouble as described above occurs when the CBR rate control based on the TM2 of the MPEG2 standard is performed as shown by the curve CV13 shown by the solid line in FIG.
最大ビットレートを制限するCBRでレート制御されたQスケールは、通常の符号化状態ではVBRのQスケールに比べて小さい値を取り、符号化に用いられるQスケールとして選択されない。しかしVBRのQスケールを用いて符号化処理を行なった結果、ビットレートが最大ビットレートを越えるようになった時、CBRのQスケールが大きくなり、CBRのQスケールが選択されて最大ビットレートの制限が行なわれる。このとき、通常の状態ではCBRのQスケールは小さくなる一方であり、最小Qスケール値は0に設定されているためQスケールは0に張り付いた状態になっており、最大ビットレートでの制限が必要な場合にQスケールは0から増加を始めるのでVBRのQスケールを超えるまでに時間がかかり、ビットレート制御に遅れが生じる。 The Q scale rate-controlled by the CBR that limits the maximum bit rate takes a smaller value than the VBR Q scale in a normal coding state, and is not selected as a Q scale used for coding. However, as a result of performing the encoding process using the VBR Q scale, when the bit rate exceeds the maximum bit rate, the CBR Q scale increases, the CBR Q scale is selected, and the maximum bit rate Restrictions are made. At this time, in the normal state, the Q scale of the CBR is decreasing, and since the minimum Q scale value is set to 0, the Q scale is stuck to 0, and the maximum bit rate is limited. Since Q scale starts increasing from 0 when it is necessary, it takes time until the VBR Q scale is exceeded, and the bit rate control is delayed.
最小ビットレートの場合はQスケールの大小関係が逆になり、通常はCBRのQスケールが大きな値になり、制限を加えないとQスケールははるかに大きな値になり、最小ビットレートを制限するためにVBRのQスケール以下になるまでの時間がさらに長くなる。この間、ビットレートが低くなりすぎることによる画質劣化も最小ビットレートの制限では問題になる。 In the case of the minimum bit rate, the magnitude relation of the Q scale is reversed. Usually, the Q scale of the CBR becomes a large value, and if the limit is not applied, the Q scale becomes a much larger value to limit the minimum bit rate. Furthermore, the time until the VBR Q scale or less is further increased. During this time, image quality degradation due to the bit rate becoming too low becomes a problem with the minimum bit rate limitation.
本発明は特許文献1における上述した問題を克服して、画像の複雑さ、変化などに依存せず画質の高い符号化を行う、画像符号化装置およびその方法を提供することを目的とする。
SUMMARY OF THE INVENTION An object of the present invention is to provide an image encoding apparatus and method for overcoming the above-described problems in
本発明によれば、符号化対象の画像信号を、外部装置から与えられた、応答速度、複数の目標ビットレート、最大ビットレート、最小ビットレートで、可変ビットレート方式および固定ビットレート方式で符号化する、画像符号化装置であって、
上記符号化対象の画像信号を可変ビットレート方式で符号化するときの上記与えられた上記複数の目標ビットレートを達成するため、第1画像処理単位において上記画像信号の符号化難易度に応じて変化する複数の第1量子化スケールを算出する第1量子化スケール算出手段と、
上記符号化対象の画像信号を固定ビットレート方式で符号化するとき、上記与えられた最大のビットレートを越えないように、上記第1画像処理単位より小さい第2画像処理単位において、第2量子化スケールを算出する第2量子化スケール算出手段と、
上記符号化対象の画像信号を固定ビットレート方式で符号化するとき、上記符号化対象の画像信号に応じて上記与えられた最小のビットレートを下回らないように、上記第1画像処理単位より小さい第3画像処理単位において第3量子化スケールを算出する第3量子化スケール算出手段と、
上記第1量子化スケールと上記第2量子化スケールとを比較して大きいほうの量子化スケールを選択し、該選択した量子化スケールと上記第3量子化スケールとを比較して小さい量子化スケールを選択する量子化スケール選択手段と、
上記量子化スケール選択手段によって選択された上記量子化スケールを用いて、上記符号化対象の画像信号に対して符号化処理を行う符号化手段と
を有し、
上記第1量子化スケールを算出する上記第1量子化スケール算出手段に、上記符号化対象の画像信号を可変ビットレート方式で符号化するときの符号化難易度に応じた上記与えられた複数の目標のビットレートおよび量子化しきい値が設定され、
上記第1量子化スケール算出手段は上記設定された複数の目標のビットレートそれぞれを達成するため、上記第1画像処理単位において複数の第1量子化スケールを算出し、
上記量子化スケール選択手段は、少なくとも、
上記複数の第1量子化スケールのうち第1の量子化スケールと上記量子化しきい値のうち当該第1の量子化スケールに対応する第1の量子化しきい値とを比較して小さいほうを第1の値として選択し、当該選択した第1の値と上記複数の第1量子化スケールのうち第2の量子化スケールとを比較して大きいほうを第2の値として選択し、
上記選択した第2の値と上記第2量子化スケール算出手段で算出した上記第2量子化スケールとを比較して大きいほうを第3の値として選択し、当該選択した第3の値と上記第3量子化スケール算出手段で算出した上記第3量子化スケールとを比較して小さいほうを第4の値として選択する、
ことを行い、
最終的に選択した上記第4の値を上記符号化手段に出力する、
画像符号化装置が提供される。
According to the present invention, an image signal to be encoded is encoded by a variable bit rate method and a fixed bit rate method at a response speed, a plurality of target bit rates, a maximum bit rate, and a minimum bit rate given from an external device. An image encoding device comprising:
To achieve the above given above SL plurality of target bit rate when encoding an image signal of the coding target at a variable bit rate system, according to the coding difficulty of the image signal in the first image processing unit First quantization scale calculation means for calculating a plurality of first quantization scales that change
When the image signal to be encoded is encoded by the fixed bit rate method, the second quantum processing unit is smaller than the first image processing unit so as not to exceed the given maximum bit rate. A second quantization scale calculating means for calculating a quantization scale;
When the image signal to be encoded is encoded by a fixed bit rate method, it is smaller than the first image processing unit so as not to fall below the minimum bit rate given according to the image signal to be encoded. Third quantization scale calculating means for calculating a third quantization scale in a third image processing unit;
A larger quantization scale is selected by comparing the first quantization scale and the second quantization scale, and a smaller quantization scale is compared by comparing the selected quantization scale with the third quantization scale. A quantization scale selection means for selecting
Coding means for performing a coding process on the image signal to be coded using the quantization scale selected by the quantization scale selection means;
To the first quantization scale calculating means for calculating said first quantization scale, the given plurality of was in accordance with the coding difficulty when encoding an image signal of the coding target at a variable bit rate system target bit rate and the amount of Coca threshold is set,
The first quantization scale calculation means calculates a plurality of first quantization scales in the first image processing unit in order to achieve each of the set target bit rates.
The quantization scale selection means is at least:
The smaller one by comparing the first quantization thresholds corresponding to the first quantization scale of the first quantization scale and the quantization thresholds of the plurality of first quantization scale first select a value of 1, select the greater by comparing the second quantization scale of the first value and the plurality of first quantization scale and the selected as the second value,
The greater by comparing the second amount coca scale calculated by the second value and the second quantization scale calculation unit described above selects selected as the third value, the third value obtained by the selected selecting smaller as the fourth value is compared with the third quantization scale calculated in the third quantization scale calculation means,
Doing
Outputting the finally selected fourth value to the encoding means;
An image encoding device is provided.
また本発明によれば、符号化対象の画像信号を、外部装置から与えられた、応答速度、複数の目標ビットレート、最大ビットレート、最小ビットレートで、可変ビットレート方式および固定ビットレート方式で符号化する、画像符号化方法であって、
上記符号化対象の画像信号を可変ビットレート方式で符号化するときの上記与えられた上記複数の目標ビットレートを達成するため、第1画像処理単位において上記画像信号の符号化難易度に応じて変化する複数の第1量子化スケールを算出する第1量子化スケール算出工程と、
上記符号化対象の画像信号を固定ビットレート方式で符号化するとき、上記与えられた最大のビットレートを越えないように、上記第1画像処理単位より小さい第2画像処理単位において、第2量子化スケールを算出する第2量子化スケール算出工程と、
上記符号化対象の画像信号を固定ビットレート方式で符号化するとき、上記符号化対象の画像信号に応じて上記与えられた最小のビットレートを下回らないように、上記第1画像処理単位より小さい第3画像処理単位において第3量子化スケールを算出する第3量子化スケール算出工程と、
上記第1量子化スケールと上記第2量子化スケールとを比較して大きいほうの量子化スケールを選択し、該選択した量子化スケールと上記第3量子化スケールとを比較して小さい量子化スケールを選択する量子化スケール選択工程と、
上記量子化スケール選択工程によって選択された上記量子化スケールを用いて、上記符号化対象の画像信号に対して符号化処理を行う符号化工程と
を有し、
上記第1量子化スケールを算出する上記第1量子化スケール算出工程において、上記符号化対象の画像信号を可変ビットレート方式で符号化するときの符号化難易度に応じた上記与えられた複数の目標のビットレートおよび量子化しきい値が設定され、
上記第1量子化スケール算出工程において上記設定された複数の目標のビットレートそれぞれを達成するため、上記第1画像処理単位において複数の第1量子化スケールを算出し、
上記量子化スケール選択工程において、少なくとも、
上記複数の第1量子化スケールのうち第1の量子化スケールと上記量子化しきい値のうち当該第1の量子化スケールに対応する第1の量子化しきい値とを比較して小さいほうを第1の値として選択し、当該選択した第1の値と上記複数の第1量子化スケールのうち第2の量子化スケールとを比較して大きいほうを第2の値として選択し、
上記選択した第2の値と上記第2量子化スケール算出工程で算出した上記第2量子化スケールとを比較して大きいほうを第3の値として選択し、当該選択した第3の値と上記第3量子化スケール算出工程で算出した上記第3量子化スケールとを比較して小さいほうを第4の値として選択する、
ことを行い、
最終的に選択した上記第4の値を上記符号化工程において用いる、
画像符号化方法が提供される。
Further, according to the present invention, an image signal to be encoded is transmitted from an external device with a response speed, a plurality of target bit rates, a maximum bit rate, a minimum bit rate, a variable bit rate method and a fixed bit rate method. An image encoding method for encoding, comprising:
To achieve the above given above SL plurality of target bit rate when encoding an image signal of the coding target at a variable bit rate system, according to the coding difficulty of the image signal in the first image processing unit A first quantization scale calculating step of calculating a plurality of first quantization scales that change
When the image signal to be encoded is encoded by the fixed bit rate method, the second quantum processing unit is smaller than the first image processing unit so as not to exceed the given maximum bit rate. A second quantization scale calculating step for calculating a quantization scale;
When the image signal to be encoded is encoded by a fixed bit rate method, it is smaller than the first image processing unit so as not to fall below the minimum bit rate given according to the image signal to be encoded. A third quantization scale calculating step of calculating a third quantization scale in a third image processing unit;
A larger quantization scale is selected by comparing the first quantization scale and the second quantization scale, and a smaller quantization scale is compared by comparing the selected quantization scale with the third quantization scale. A quantization scale selection step of selecting
An encoding step of performing an encoding process on the image signal to be encoded using the quantization scale selected by the quantization scale selection step;
Oite to the first quantization scale calculation step of calculating the first quantization scale, given above in accordance with the coding difficulty when encoding an image signal of the coding target at a variable bit rate system bit rate and the amount Coca threshold of the plurality of targets are set,
In order to achieve each of the plurality of target bit rates set in the first quantization scale calculation step, a plurality of first quantization scales are calculated in the first image processing unit,
In the quantization scale selection step, at least,
More smaller than the first quantization thresholds corresponding to the first quantization scale of the first quantization scale and the upper SL amount Coca threshold among the plurality of first quantization scale was selected as the first value, it selects the greater by comparing the second quantization scale of the first value and the plurality of first quantization scale and the selected as the second value,
The greater by comparing the second amount coca scale calculated by the second value and the second quantization scale calculation step of the above selected selected as the third value, the third value obtained by the selected selecting smaller as the fourth value is compared with the third amount Coca scale calculated above Symbol third quantization scale calculation step,
Doing
The finally selected fourth value is used in the encoding step.
An image encoding method is provided.
本発明によれば、画像の複雑さと易しさに適した効果的な符号化を実現できる上に、複雑な画像が継続したのち急激に易しい画像が入力されたとき、逆に、易しい画像が継続したのち急激に複雑な画像が入力されたときでも、その遷移領域において画質の低下を起こさず、効果的な符号化処理を行うことができる。 According to the present invention, it is possible to realize an effective encoding suitable for the complexity and ease of an image, and when an easy image is rapidly input after a complex image continues, the easy image continues. After that, even when a complex image is suddenly input, it is possible to perform an effective encoding process without causing deterioration in image quality in the transition region.
本発明においては、画像および画像の変化に応じて適切な量子化スケールQSCを設定することによって、符号化対象の画像信号の符号化難易度に対応して、平均的に目標ビットレートに近い符号ビットレートで符号化対象の画像信号を符号化でき、さらに規格によって定められた最大ビットレートを越えないことを保証することができる。すなわち、VBRの最大ビットレートと最小ビットレートを制限することにより、符号化難易度の変化点での画質劣化およびビットレートが上がり過ぎたことをキャンセルするためにその後ビットレートを下げることによる画質劣化が抑えられる。
その理由は、実発生ビット量を用いて、たとえば、GOP残りビット量を求めることによりGOPの後ろになるほど最大ビットレートの制限が正しく働かず、GOPの後半で、たとえば、P,Bピクチャの発生ビット量が多くなり、たとえば、MPEG2規格のTM5ステップ1で用いる画面の複雑さを示すパラメータ(global complexity measure)のI,P,Bピクチャ間の比率が崩れ、次のGOPにおいてIピクチャの最大ビットレートを制限するための目標ビット量が小さく抑えられることにより、Iピクチャの画質が劣化するという不具合を防ぐことができる。
さらに、本発明によれば、最小ビットレートを制限するためのQスケールを求める仮想バッファが無制限に増加することがなくなり、符号化難易度が難しい画像から易しい画像に変化した時にQスケールが速やかに下がることが可能となり、この間の画質劣化を防ぐことができる。
In the present invention, by setting an appropriate quantization scale QSC according to an image and a change in the image, a code that is close to the target bit rate on the average according to the encoding difficulty level of the image signal to be encoded It is possible to encode an image signal to be encoded at a bit rate, and to ensure that the maximum bit rate determined by the standard is not exceeded. In other words, by limiting the maximum bit rate and the minimum bit rate of the VBR, image quality degradation at the changing point of the encoding difficulty level and image quality degradation by lowering the bit rate thereafter to cancel that the bit rate is excessively increased Is suppressed.
The reason is that the maximum bit rate limit does not work correctly as the GOP remaining bit amount is obtained by using the actual generated bit amount, for example, and the generation of P and B pictures occurs in the latter half of the GOP. The amount of bits increases, for example, the ratio between I, P, and B pictures of the parameter (global complexity measure) indicating the complexity of the screen used in
Furthermore, according to the present invention, the virtual buffer for obtaining the Q scale for limiting the minimum bit rate is not increased indefinitely, and the Q scale is quickly changed when the coding difficulty is changed to an easy image. The image quality can be lowered, and the deterioration of the image quality during this period can be prevented.
画像符号化装置の基本構成
図4は本発明に係る実施形態の画像符号化装置の全体基本構成を示す図である。
本発明の実施形態の画像符号化装置1は、制御回路10、エンコーダ(符号化装置)20および画像入力装置30を含む。
画像符号化装置1における画像入力装置30の画像入力部としては、たとえば、ビデオカメラなどの撮像装置、または、他の記録媒体から画像信号を再生する画像再生装置などであり、何らかの手段で画像信号を生成し、かつアナログ形式の画像信号をディジタル信号に変換する機能を有するものであればよい。本実施形態において、画像符号化装置1にはディジタル形式の画像信号が入力される。
Basic Configuration of Image Encoding Device FIG. 4 is a diagram showing an overall basic configuration of an image encoding device according to an embodiment of the present invention.
An
The image input unit of the
制御回路10は、画像符号化装置1の外部から入力された制御信号S1に応じて、画像入力装置30およびエンコーダ20にそれぞれ制御信号S12とS13を出力し、画像入力装置30およびエンコーダ20の動作を制御する。
The
画像入力装置30は、たとえば、ビデオカメラなどの撮像装置などから入力されたディジタル画像データS30を符号化対象の画像データとしてエンコーダ20に出力する。画像入力装置30は、入力した画像信号の種類、特徴などに応じて画像情報データS32を生成し、制御回路10に供給する。
制御回路10は、画像情報データS32を入力し、入力画像信号の特徴などに応じてエンコーダ20に圧縮符号化パラメータS12を出力する。なお、圧縮符号化パラメータS12は、目標符号化レート、最大符号化レート、可変ビットレート指示信号など複数のパラメータまたはこれらの信号からなり、これらについて後述する。
For example, the
The
エンコーダ20は、制御回路10からの圧縮符号化パラメータS12に応じて、画像入力装置30から送られてきたディジタル画像データS30を所定の符号化アルゴリズム、たとえば、MPEG2規格に基づく符号化アルゴリズムに基づいて圧縮符号化して、ビットストリームS20を出力する。
エンコーダ20は、可変符号化レートと固定符号化レートとを適宜選択することにより、画像の特徴、画像の変化にあわせて最適な符号化レートを求め、その符号化レート(Qスケール)に基づいて、画像の複雑さ、画像の変化に則して、画像全体の画質の均一化と圧縮効率の向上を図る。
エンコーダ20により画像データが圧縮符号化された結果、ビットストリームS20のデータ量が圧縮符号化前の画像データS30に比べてはるかに低減される。このため、エンコーダ20により圧縮符号化したビットストリームS20を情報伝送、蓄積することによって、伝送路の伝送容量又は画像記録媒体の記憶容量を大幅に低減できる。
The
The
As a result of the image data being compression-encoded by the
エンコーダ(符号化装置)の基本構成
図5は本実施形態におけるエンコーダ20の基本構成を示すブロック図である。
エンコーダ20は、可変符号化ビットレート(VBR)制御回路22a、固定符号化ビットレート(CBR)制御回路23a、量子化(Q)スケール選択回路25a、および、画像圧縮符号化部24を有する。
固定ビットレート制御回路23aは、たとえば、図6に図解したように、最大CBR制御部23Aと最小CBR制御部23Bとを有する。
VBR制御回路22aは、第1画像処理単位、たとえば、複数のピクチャからなるGOP単位で画像符号化を行うための第1量子化スケール(第1Qスケール)を設定する第1量子化スケール設定手段であり、目標ビットレートに対して、第1画像処理単位で画像入力装置30からの符号化対象の入力画像信号(画像データS30)の符号化の難易度に応じて、緩やかに変化する第1量子化スケールQS1を設定する。
CBR制御回路23aは、上記第1画像処理単位、たとえば、GOP単位より短い第2画像処理単位、たとえば、ピクチャまたはマクロ・ブロック(MB)単位で、ビットストリームの先頭のシーケンスヘッダによって指定した最大のビットレートに対して当該最大のビットレートを越えないように迅速に変化する第2および第3量子化スケールQS2、QS3を設定する第2および第3量子化スケール設定手段である。そのため、固定ビットレート制御回路23aは、たとえば、図6を参照して述べるように、最大CBR制御部23Aと最小CBR制御部23Bとを有する。
量子化スケール選択回路25aは、VBR制御回路22aによって設定された第1量子化スケールQS1とCBR制御回路23aによって設定された第2および第3量子化スケールQS2、QS3とを比較し、これらの量子化スケールのうち適切なQスケールを符号化対象の入力画像信号(画像データS30)に対して符号化処理を行うための量子化スケールQSCとして、画像圧縮符号化部24に出力する。
画像圧縮符号化部24は、画像データS30を量子化スケール選択回路25aからの量子化スケールQSCおよび制御回路10からの圧縮符号化パラメータS12に基づいて符号化する。
Basic Configuration of Encoder (Encoding Device) FIG. 5 is a block diagram showing the basic configuration of the
The
The fixed bit
The
The
The quantization
The image
エンコーダの第1実施形態
図6は図5に図解したエンコーダ20の第1実施形態の構成を示すブロック図である。
第1実施形態のエンコーダ20は、VBRバッファ記録部21、VBR制御部22、最大CBR制御部23A、最小CBR制御部23B、画像圧縮符号化部24および量子化スケール比較部25を有する。
図5に図解したVBR制御回路22aがVBR制御部22に対応し、CBR制御回路23aが最大CBR制御部23Aと最小CBR部23Bに対応し、量子化スケール選択回路25aが量子化スケール比較部25に対応し、画像圧縮符号化部24がそのまま画像圧縮符号化部24に対応している。この他、第1実施形態のエンコーダ20は、VBRバッファ記録部21を含む。
First Embodiment of Encoder FIG. 6 is a block diagram showing the configuration of the first embodiment of the
The
The
第1実施形態のエンコーダ20と、特許文献1に記載したエンコーダ(符号化装置)と比較すると、特許文献1におけるCBR制御部23が、第1実施形態のエンコーダ20においては、上記最大CBR制御部23Aおよび最小CBR部23Bに置換されている。
その他、詳細は図9を参照して特許文献1の構成との相違を述べる。
Compared with the
In addition, details will be described with reference to FIG.
画像圧縮符号化部
図7は図6に図解したエンコーダ20内の画像圧縮符号化部24の一構成を示す図である。
画像圧縮符号化部24は、目標ビットレートBRobj、最大ビットレートBRmax、VBR指示信号VBD、および、量子化スケール比較部25から提供される量子化スケールQSCに応じて、画像入力装置30から入力される符号化対象の画像データS30を圧縮符号化し、ビットストリームS20を出力する。
さらに画像圧縮符号化部24は、圧縮符号化により生成したビット量を示す発生ビット量BQTおよび画像符号化種類を示すPCT信号を生成し、図6に図示したように、VBR制御部22、および、最大CBR制御部23A、最小CBR制御部23Bにそれぞれ出力する。
Image Compression Encoding Unit FIG. 7 is a diagram showing a configuration of the image
The image
Further, the image
画像圧縮符号化部24は、加算器(加減算器)201、離散コイサン変換処理部(DCT(Discrete Cosine Transform)処理部)202、量子化部203、可変長符号化部(VLC)204、逆量子化部205、逆DCT部206、加算器207、フレームメモリ208、動き検出部209、動き補償部210、切り換え回路211および符号化制御部212を有する。
The image
画像入力装置30から画像圧縮符号化部24に入力された符号化対象のディジタル画像信号S30は、加算器201において切り換え回路211から入力される以前の再生画像信号との差分が求められ、その差分がDCT部202に出力される。
イントラピクチャ(Iピクチャ)モードの時には、切り換え回路211からは有意な画像が入力されないので(図7では、このモードにおける切り換え回路211からの出力を大地電位の0としている)、加算器201に入力された画像データがそのままDCT部202に出力される。
動き補償予測モードの時には、加算器201には切り換え回路211を経由してその前の再生画像に基づいた動き補償部210からの画像データが入力されるので、その差分を加算器201で求め、求めた差分をDCT部202に入力する。
The digital image signal S30 to be encoded input from the
In the intra picture (I picture) mode, since no significant image is input from the switching circuit 211 (in FIG. 7, the output from the switching
In the motion compensation prediction mode, since the image data from the
DCT部202は、加算器201から入力された画像信号に対して、離散コサイン変換を行い画像データの空間的冗長性を削減する。DCTによって得られた変換係数は、量子化部203に入力される。
量子化部203は、符号化制御部212を介して入力される量子化スケール比較部25からの量子化スケールQSCに従って、DCT部202により得られたDCT変換係数の量子化を行い、量子化DCT変換係数を可変長符号化部204および逆量子化部205に出力する。このように、量子化部203における量子化スケールは量子化スケール比較部25から量子化スケールQSCを入力した符号化制御部212により制御される。
The
The
可変長符号化部204は、量子化部203において量子化されたDCT変換係数を可変長符号化し、符号化ビット列、すなわち、ビットストリームS20を生成し、順次出力する。
The variable
符号化制御部212は、量子化部203の量子化レート(Qスケール)、フレームメモリ208への画像データの記録および切り換え回路211の切り換えなどを制御する。図7に図示のように、符号化制御部212は、たとえば、制御回路10から入力される目標ビットレートBRobj、最大ビットレートBRmax、VBR指示信号VBD、および、量子化スケール比較部25からの量子化スケールQSCに応じて、量子化部203に所定の量子化スケールを設定し、量子化部203における量子化レートを制御する。
量子化部203で量子化されたDCT変換係数は逆量子化部205に入力される。量子化されたDCT変換係数は、逆量子化部205において逆量子化されて量子化部203に入力される前のDCT変換係数に復元され、さらに、逆DCT部206において逆離散コサイン変換(逆DCT)が行われて、DCT部202に入力される前の加算器201の出力画像に逆変換される。
動き補償予測を行うモードの時には、加算器207で、逆DCT部206において逆DCTが行われた画像信号と、切り換え回路211を経由して出力される動き補償部210において動き補償予測により得られた画像信号を加算して加算器201に入力された元の画像信号と同等の画像信号に戻し、フレームメモリ208に記録する。
イントラピクチャモードの時には、加算器207には切り換え回路211を介して動き補償部210における動き補償予測による画像は入力されず、逆DCT部206で逆DCTされた画像信号がそのままフレームメモリ208に記録される。
動き検出部209および動き補償部210において動き補償予測を行う場合には、フレームメモリ208に記録されている画像信号が用いられる。すなわち、フレームメモリ208に記録されている画像信号に基づいて、次の画像ソース信号より動き検出部209において動き検出を行い、動きベクトルを検出する。さらに、その動きベクトルに基づいて、動き補償部210において動き補償予測を行う。この動き補償予測により得られた画像信号を切り換え回路211を介して加算器201に出力し、加算器201において次に入力される画像ソース信号との差分を求める。同様に、動き補償予測を行うモードの時には、切り換え回路211から出力される動き補償予測により得られた画像信号を加算器207に入力して加算器207において加算器201に入力された画像に相当する画像を求める。
The
The DCT transform coefficient quantized by the
In the mode for performing motion compensation prediction, the
In the intra picture mode, the
When motion compensation prediction is performed in the
このように、画像圧縮符号化部24によって、入力されたディジタル画像データS30が符号化され、ビットストリームS20が生成される。
制御回路10から供給されるVBR指示信号VBDが0のとき、ビットストリームS20におけるシーケンスヘッダのビットレートに目標ビットレートBRobjが出力され、VBR指示信号VBDが1のとき、ビットレートに最大ビットレートBRmaxが出力される。
マクロブロック(MB)毎に量子化スケールが設定されると、画像圧縮符号化部24は、これをベースにMPEG2のTM5における符号化レート制御のステップ3に基づいた視覚効果を狙った量子化スケールの変更を行い、これを量子化に用いる。そしてMB毎に発生されるビットストリームS20を出力する。
In this manner, the input digital image data S30 is encoded by the image
When the VBR instruction signal VBD supplied from the
When a quantization scale is set for each macroblock (MB), the image
本実施形態の画像圧縮符号化部24は、量子化スケールによる符号化レート制御がうまくいかず、VBVバッファ部(図示せず)がアンダーフローしそうになるとき、DCT係数を強制的にカットするなどしてこれを防止するなど、通常のMPEG2の画像符号化装置としての一般的な機能も有する。
The image
上述した画像圧縮符号部24によって、上述した2段階の符号化処理を行う方法ではなく、一回だけの符号化処理、すなわち、1パス処理により、可変符号化レートで画像信号の符号化を実現できる。このため、たとえば、ビデオカメラなどの実時間での画像撮像及び記録を行う画像処理装置などにおいて、一度の符号化処理で可変符号化レートによる画像符号化を実現可能となり、異なる特徴を持つ画像信号における画質の均一化を実現可能であり、さらに可変符号化レート制御により、符号化能率の向上を図ることができる。
The above-described image
VBRバッファ記録部
VBRバッファ記録部21は、VBRバッファ値VBRbを保持して、上述した画像圧縮符号化部24における一連の符号化処理におけるトータルの値が目標ビットレートBROBJからの逸脱量を小さくするために設けられている。
符号化処理開始前、VBRバッファ記録部21は、制御回路10から入力されたVBRバッファ初期値BRINIを記憶する。もっとも簡単な初期化方法として、処理開始前に、制御回路10からの初期化制御信号に応じてVBRバッファ記録部21を初期化し、VBRバッファ初期値BRINIを“0”に設定するか、または、予め与えられた値に設定する。
VBRバッファ記録部21は、エンコーダ(符号化装置)20において圧縮符号化を開始したあとVBR制御部22に記録したVBRバッファ初期値BRINIを提供し、また、エンコーダ20における符号化終了時にVBR制御部22からVBRバッファ値VBRbを入力して記録する。VBRバッファ記録部21は次回の符号化処理において、記録したVBRバッファ値VBRbをVBR制御部22に出力する。
VBR buffer recording unit The VBR
Before starting the encoding process, the VBR
The VBR
VBR制御部
VBR制御部22は、制御回路10から入力されたVBR応答速度VBRr、目標ビットレートBRobj、最大ビットレートBRmax、最小ビットレートBRminに応じて、VBRの量子化(Q)スケールVBRq を求めて量子化スケール比較部25に出力する。
VBR制御部22は、目標ビットレートBROBJから求められる1GOPの目標発生ビ
ット量に対し、実際にそのGOPで発生したビット量を比較し、目標ビットレートBROBJよりビット量が発生しすぎていればQスケールを徐々に大きくして発生ビット量を徐々に抑え、逆に目標ビットレートBROBJよりビット量の発生が足りなければQスケールを徐々に小さくして発生するビット量を徐々に増加させる。これにより、Qスケールを余りレスポンスよく変動させないことから符号化難易度に応じた発生ビット量となるVBRレート制御となり、かつ、Qスケールを発生ビット量に応じて徐々に変動させることで、長期的には目標ビットレートBROBJに応じた発生ビット量となる。
VBR制御部22において、内部パラメータとして、VBR量子化スケールVBRqを求めるためのVBRバッファ値VBRb、目標ビットレートBROBJで符号化する場合のGOPにおける残りビット量RBG、VBR量子化スケールVBRqの応答速度を表すVBR応答速度VBRrを保持している。
VBR Control Unit The
In the
VBR制御部22においてVBR量子化スケールVBRqは次式により求める。
VBRq=VBRb/(2n ×VBRr) …(1)
式(1)において、nは演算パラメータであり、用途などに応じて設定され、たとえば、n=9とする。
In the
VBRq = VBRb / (2 n × VBRr) (1)
In equation (1), n is a calculation parameter, which is set according to the application, for example, n = 9.
VBR量子化スケールVBRqが1になると、発生するビット量が急激に増加してVBRレート制御が不安定になるため、式(1)により算出したVBR量子化スケールVBRqが1以下のとき、VBR制御部22においてVBR量子化スケールVBRqを強制的に2に変更するなどの対策を講じる。
さらに、GOPにおけるI/P/Bピクチャの違いに着目して、VBR制御部22は、符号化タイプ(coding type )がBピクチャの場合に式(1)により得られた値に係数、たとえば、1.4をかけた値をVBR量子化スケールVBRqとする。すなわち、Bピクチャの場合、VBR量子化スケールを常にI,PピクチャのVBR量子化スケールの1.4倍に設定される。その理由は、BピクチャをI,Pピクチャに比較して多少粗めに符号化することにより、Bピクチャで節約できる符号化量をI,Pピクチャに符号量に振り分けると、I,PピクチャのS/Nが改善されるとともに、これを参照して生成されるBピクチャのS/Nも改善されることになり、総合的にS/Nの改善を図ることができるからである。
VBR制御部22において、I/P/BピクチャのQスケールが上述したように簡単な方法で決定されるが、上述した例示に限定されず、それぞれのピクチャの符号化難易度を調べてそれに応じたQスケールの差を付けることもできる。
When the VBR quantization scale VBRq becomes 1, the generated bit amount increases rapidly and the VBR rate control becomes unstable. Therefore, when the VBR quantization scale VBRq calculated by the equation (1) is 1 or less, the VBR control The
Further, paying attention to the difference between the I / P / B pictures in the GOP, the
In the
VBR制御部22において、GOPでの残りビット量RBGとしてGOP毎に目標ビット量が設定される。
そして、VBR制御部22において、たとえば、MB(マクロブロック)毎に発生ビット量を受け取ると、ここからその分(GOP毎に目標ビット量)を引く。各GOPの終わりには目標ビット量からの逸脱量がGOPでの残りビット量RBGに残るので、VBR制御部22はこれ(残りビット量RBG)をVBRバッファ値VBRbから引く。この時、VBRバッファ値VBRbが負になるとVBR制御部22はそれを0に設定する。また、VBRバッファ値VBRbがオーバーフローしそうな場合にはVBR制御部22はそれ(VBRバッファ値VBRb)を最大値に固定する。
In the
When the
上述したように、符号化処理開始時のVBRバッファ値VBRbの初期値は、VBRバッファ記録部21からVBR制御部22に入力される。ここで、たとえば、VBRバッファ記録部21から入力されたVBRバッファ値VBRbが0以外の場合、VBR制御部22はその値を使用し、0の場合、以下の式により求た値を用いる。
VBRb=m・VBRr/(BRobj×2k) …(2)
式(2)において、m,kは演算パラメータである。ここで、たとえば、m=2.5×107 であり、k=10である。
As described above, the initial value of the VBR buffer value VBRb at the start of the encoding process is input from the VBR
VBRb = m · VBRr / (BRobj × 2 k ) (2)
In Equation (2), m and k are calculation parameters. Here, for example, m = 2.5 × 10 7 and k = 10.
式(2)における応答速度VBRrは制御回路10により供給される値を使用する。たとえば、応答速度VBRrが200程度の値に設定されるとき数十秒、4000程度の値に設定されるとき数十分の応答速度が得られる。符号化終了時に式(2)により算出されたVBRバッファ値VBRbは、VBRバッファ記録部21に伝送されて記憶される。
A value supplied from the
GOPでの残りビット量RBGには、最初に以下の式で求められる値が設定される。
RBG=BRobj・N/PCR …(3)
式(3)において、NはIピクチャの間隔であり、PCRはピクチャレートである。
For the remaining bit amount RBG in the GOP, a value obtained by the following equation is first set.
RBG = BRobj · N / PCR (3)
In Equation (3), N is the I picture interval, and PCR is the picture rate.
CBR制御部
第1実施の形態のCBR制御部は、最大CBR制御部23Aと最小CBR制御部23Bとを有する。
図8は第1実施の形態の最大CBR制御部23Aと最小CBR制御部23Bの構成と画像圧縮符号化部24、特に、符号化制御部212との関係を示す図である。
最大CBR制御部23Aは、GOP割り当てビット量演算部2311、GOP残りビット量バッファ2312、TM5ステップ1演算部2313、および、TM5ステップ2演算部2314を有する。
最小CBR制御部23Bは、GOP割り当てビット量演算部2321、GOP残りビット量バッファ2322、TM5ステップ1演算部2323、および、TM5ステップ2演算部2324を有する。
最大CBR制御部23Aおよび最小CBR制御部23Bにおいて、本実施形態においては、たとえば、MPEG2についてのTM5のアルゴリズムに基づいてCBRのレート制御を行う。もちろん、本発明の実施の形態の画像符号化装置1では、CBRにおけるレート制御はTM5のアルゴリズムに基づいて行うことに限定されるものではなく、他の制御方式に基づいてレート制御を行ってもよい。ただし、以下、TM5のアルゴリズムに基づいて行う場合について述べる。
CBR Control Unit The CBR control unit according to the first embodiment includes a maximum
FIG. 8 is a diagram illustrating a relationship between the configuration of the maximum
The maximum
The minimum
In the maximum
図9に特許文献1のCBR制御部23の構成例を示す。CBR制御部23は、最大CBR制御部23Aと同様、GOP割り当てビット量演算部2311、GOP残りビット量バッファ2312、TM5ステップ1演算部2313およびTM5ステップ2演算部2314を有する。
本発明の実施の形態のCBR制御部には、特許文献1には記載されていない最小CBR制御部23Bが付加されている。
最大CBR制御部23AとCBR制御部23とは個々の構成部分について類似する構成を持つが、本実施形態と特許文献1に記載の内容とは、画像圧縮符号化部24との関係、および、CBR制御部23内の処理内容は下記に詳述するように異なる。
FIG. 9 shows a configuration example of the
A minimum
The maximum
図9に図解した特許文献1に記載のCBR制御部23は、CBRmaxqを求める際の、あるいは、通常のCBRでQスケールを求める際の、GOP残りビット量の演算処理を行うため、画像圧縮符号化部24から出力されるフレーム毎の発生ビット量をGOP残りビット量から引いていく。
このような最大ビットレートを制限するCBR制御部23によれば、図10(A)〜(C)において太い実線の曲線CV11、CV12、CV13で示したように、GOP残りビット量には最大ビットレートから求められた値が設定される。ここから求められる毎フレームの目標ビット量は通常のCBRに比べて大きな値になるが、その値に応じた符号化処理が行なわれるのではなく、目標ビットレートBROBJに応じたVBRでレート制御された結果となるので、GOP残りビット量は、図10(B)の太線の曲線CV12で示したように変化し、GOPの最後になっても大きな値を取る。これにより、1フレームの目標ビット量はGOPの後になるに従い大きな値となり、これから求められるQスケールは適切なものではなくなる。
これまでに発生したビット量に応じて以降の発生ビット量を調整する必要があるため、実際に発生したビット量をGOP残りビット量から引く必要があるが、VBRの最大ビットレートあるいは最小ビットレートを制限するために求めるCBRのQスケールは、過去の発生ビット量とは関係なく目標値として求めるものなので、このような求め方をしてもなんら問題がない。
この問題は、最小ビットレートを制限するCBRでも同様である。
The
According to the
Since it is necessary to adjust the subsequent generated bit amount according to the bit amount generated so far, it is necessary to subtract the actually generated bit amount from the remaining GOP bit amount, but the maximum bit rate or the minimum bit rate of the VBR Since the Q scale of CBR obtained for limiting the value is obtained as a target value regardless of the amount of generated bits in the past, there is no problem even if such a method is used.
This problem also applies to CBR that limits the minimum bit rate.
理想的には、GOP残りビット量は、図10(B)、(C)の細い点線の曲線CV22、CV23で示したように所定の割合で均一に変化するべきである。
最大CBR制御部23Aと最小CBR制御部23Bとを用いた本実施の形態のGOPのCBR制御方法は、図10(B)、(C)に点線の曲線CV22、CV23で示すように、ビットレートに応じた1GOPの目標ビット量RがGOP残りビット量に設定され、ここから求められる毎フレームの目標ビット量Rにより符号化が制御され、目標ビットレートBROBJに応じたビット量が毎フレーム発生し、毎フレームの目標ビット量がGOP残りビット量から引かれることにより、GOPの最後にはGOP残りビット量がゼロに近い値になる。
最大CBR制御部23Aと最小CBR制御部23Bとを有する本実施形態のCBR制御部によれば、図10(B)、(C)の点線の曲線CV22、CV23のようにGOP残りビット量がほぼ一定の割合で変化するために、フレーム毎にGOP残りビット量から引くビット量は、目標ビットレートBROBJを元に制御される発生ビット量ではなく、最大ビットレートBRmaxあるいは最小ビットレートBRminから求められる1フレーム毎の目標ビット量を引くようにする。
Ideally, the remaining GOP bit amount should change uniformly at a predetermined rate as shown by thin dotted curve lines CV22 and CV23 in FIGS.
The COP control method of the GOP of the present embodiment using the maximum
According to the CBR control unit of the present embodiment having the maximum
本実施形態の最大CBR制御部23Aは、CBRmaxqを求める際のGOP残りビット量の演算処理を行う。すなわち、本実施形態では、特許文献1に記載の図9のCBR制御部23と画像圧縮符号化部24の符号化制御部212との関係のように符号化制御部212から出力されるフレーム毎の発生ビット量ではなく、TM5ステップ1演算部2313から出力される目標ビット量RをGOP残りビット量から引くように変更している。これにより、GOP内のフレーム位置によらず出力されるCBRmaxqは常に適切な値となる。
本実施形態における最小CBR制御部23BにおいてCBRminqを求める際も同様である。
The maximum
The same applies to the determination of CBRminq in the minimum
本実施形態の最大CBR制御部23Aは、制御回路10から入力された最大ビットレートBRmaxに応じて最大CBR量子化スケールCBRmaxqを設定し、設定したCBRmaxqを量子化スケール比較部25に出力する。
本実施形態のGOP割り当てビット量演算部2311は、GOP毎に含まれているピクチャ数とビットレートからGOPに対して割り当てられるビット量を決定する。現在処理されているGOPの前のGOPにおけるビット量の残量ΔR(正または負)は今回の処理分に加えられない。
本実施形態においては、GOP残りビット量Rと、ピクチャタイプ(I/B/P)毎の符号化難易度と、ピクチャタイプ毎の残りピクチャ数から、これから符号化するピクチャに対する目標ビット量が決定される。さらに、GOP残りビット量から符号化するピクチャに対する目標ビット量が引かれて、ビット量の残差ΔRが算出される。
The maximum
The GOP allocated bit
In this embodiment, the target bit amount for a picture to be encoded is determined from the remaining GOP bit amount R, the encoding difficulty level for each picture type (I / B / P), and the number of remaining pictures for each picture type. Is done. Furthermore, the target bit amount for the picture to be encoded is subtracted from the remaining GOP bit amount to calculate a bit amount residual ΔR.
MPEG2規格のTM5のステップ1、2の処理を行う本実施形態のTM5ステップ1演算部2313およびTM5ステップ2演算部2314においては、GOP単位で画像符号化処理が行われる。
マクロブロック(MB)単位の処理では、ピクチャがMB単位で符号化され、MB毎に発生ビット量がピクチャでの目標ビット量を越えそうな場合に、Qスケールが大きく設定され、逆に発生ビット量が目標ビット量を下回りそうな場合にはQスケールが小さく設定される。さらに人間の視覚特性が画面内の平坦な部分では、画質の劣化に敏感なことを考慮して、相対的に平坦な画像部分ではQスケールが小さく設定され、逆に細かい画像部分ではQスケールが大きく設定される。
In the
In processing in units of macroblocks (MB), when a picture is encoded in units of MB and the generated bit amount is likely to exceed the target bit amount in the picture, the Q scale is set large, and conversely the generated bits If the amount is likely to be below the target bit amount, the Q scale is set small. Furthermore, in consideration of the fact that human visual characteristics are sensitive to image quality degradation in flat areas in the screen, the Q scale is set to be small for relatively flat image areas, and conversely, the Q scale is set for fine image areas. It is set large.
MPEG2のTM5においては、GOP毎に次のGOPの目標ビット量Rを決定する。GOPの終わりではそのGOPでの発生するビット量がRから引かれた値になる。これを当該GOPのビット残量としΔRと表記する。そして、このビット残量ΔRは次のGOPの目標ビット量Rに加えられる。
MPEG2のTM5において、GOP毎に次のGOPの目標ビット量Rを決めるが、最大CBR制御部23Aおよび最小CBR制御部23Bにおいては、以下の異なる処理が行われ、次のGOPの目標ビット量Rを決定する。
In TM2 of MPEG2, the target bit amount R of the next GOP is determined for each GOP. At the end of a GOP, the amount of bits generated in that GOP is a value subtracted from R. This is expressed as ΔR as the remaining bit amount of the GOP. This remaining bit amount ΔR is added to the target bit amount R of the next GOP.
In the MPEG2 TM5, the target bit amount R of the next GOP is determined for each GOP. The maximum
(a)TM5ステップ1演算部2313において、制御回路10から与えられるVBR指示信号VBD=0のとき、次式により現在のGOPビット残量ΔRiに応じて、次のGOPの目標ビット量Ri+1を算出する。ここで、iはGOPの番号を示す。
Ri+1=BRobj・N/PCR+ΔRi …(4)
なお式(4)において、NはIピクチャの間隔であり、PCRはピクチャレートである。
(A) In the
Ri + 1 = BRobj.N / PCR + .DELTA.Ri (4)
In equation (4), N is the interval between I pictures, and PCR is the picture rate.
(b)TM5ステップ1演算部2313において、VBR指示信号VBD=1、かつ、直前のGOPのビット残量ΔRiが負のとき(ΔRi<0)、次式により、次のGOPの目標ビット量Ri+1を算出する。
Ri+1=BRmax・N/PCR+ΔRi …(5)
(B) In the
Ri + 1 = BRmax.N / PCR + .DELTA.Ri (5)
(c)TM5ステップ1演算部2313において、VBR指示信号VBD=1、かつ、直前のGOPのビット残量ΔRiが正または0のとき(ΔRi≧0)、次式により、次のGOPの目標ビット量Ri+1を算出する。
Ri+1=BRmax・N/PCR …(6)
(C) In the
Ri + 1 = BRmax · N / PCR (6)
(a)の場合は、図9のCBR制御部23による通常のMPEG2のTM5の処理と同じであり、エンコーダ20において、CBR制御が行われる。目標ビットレートBRobjを大きく逸脱しないように、GOP毎のビット残量ΔRを常に次のGOPの目標ビット量にフィードバックさせ、次のGOPの目標ビット量Ri+1が直前のGOPのビット残量ΔRiに応じて修正される。
(b,c)の場合は、エンコーダ20において、VBR制御が行われ、最大ビットレートBRmax/最小ビットレートBRminを越えないように、GOP毎のビット残量ΔRに応じて次のGOPの目標ビット量が算出される。直前のGOPのビット残量ΔRiが正または0のとき、上述した理由で直前のGOPのビット残量ΔRiがフィードバックせず、次のGOPの目標ビット量Ri+1が式(6)に示すように、最大ビットBRmax/最小ビットレートBRminなどに応じて決定される。
In the case of (a), the processing is the same as the normal MPEG2 TM5 processing by the
In the case of (b, c), VBR control is performed in the
最大CBR制御部23Aおよび最小CBR制御部23Bは、上述したように算出されたGOPの目標ビット量に基づき、最大CBR量子化スケールCBRmaxq、最小CBR量子化スケールCBRminqを求めて、量子化スケール比較部25に供給する。
The maximum
量子化スケール比較部
量子化スケール比較部25は、VBR制御部22から入力されたVBR量子化スケールVBRq、最大CBR制御部23Aから入力された最大CBR量子化スケールCBRmaxq、最小CBR制御部23Bから入力された最小CBR量子化スケールCBRminqに応じてベースとなる量子化スケールQSCを算出し、画像圧縮符号化部24に提供する。
Quantization scale comparison unit The quantization
量子化スケール比較部25においては、図11のフローチャートに示すように、ステップ1(S1)においてVBRq とCBRminqを比較して小さい方を選ぶ。これにより、Qスケールが大き過ぎてビットレートが下がり過ぎないように、Qスケールの最大値が制限される。次に、量子化スケール比較部25は、ステップ2(S2)において、上記比較結果とCBRmaxqを比較して大きい方を選ぶ。これにより、Qスケールが小さ過ぎてビットレートが上がり過ぎないようにQスケールの最小値が制限される。
In the quantization
たとえば、最小ビットレートBRminを制限するCBRのQスケール(CBRminq)は、図12(A)に示すように、通常は大きな値をとるが、最小ビットレートBRminによる制限が必要な場合にVBRのQスケールVBRq を下回る値をとり、VBRq より小さいQスケールであるCBRminqが選択されて画像圧縮符号化部24において符号化に用いられることにより、大きなQスケールによりビットレートが小さくなりすぎることがなく、最小ビットレートの制限が行なわれる。
For example, as shown in FIG. 12A, the CBR Q scale (CBRminq) for limiting the minimum bit rate BRmin normally takes a large value, but when the limitation by the minimum bit rate BRmin is necessary, the QBR Qscale A value less than the scale VBRq and a CBRminq that is a Q scale smaller than VBRq are selected and used for encoding in the image
通常の状態あるいは難しい画像が入力され続けた場合、CBRminqは大きな値をとるが、CBRminqの最大値は、図12(A)、(B)に図解したように、たとえば、MPEGではコードに換算して「31」の上限が設定されているため、「31」を越えることはない。しかし、CBRminqをMPEG2規格のTM5ベースの制御で求める場合、これに対応する仮想バッファの値に(31/リアクションパラメータ)の値を乗じて求め、これがコードに換算して「31」を上回れば「31」にするという計算を行なっている。この仮想バッファの値は、TM5では制限が加えられないため、通常の状態あるいは難しい画像が入力されつづけた場合は、CBRminqは図12(A)に破線で示すように増加し続ける。
この状態で符号化対象の入力画像データの符号化難易度が易しくなっても、仮想バッファの値が十分小さくなり、これから求められるQスケールCBRminqがVBRq を下回るまでに時間がかかり、たとえば、数フレームの期間、画質が劣化した状態が続く。
このような問題に対応するため、図12(B)に図解したように、ある短い期間、たとえば、フレーム毎に、CBRminqがVBRq を上回っていれば、CBRminqをVBRq に近い値に設定しなおす。
When a normal image or a difficult image continues to be input, CBRminq takes a large value. However, the maximum value of CBRminq is converted into a code in MPEG, for example, as illustrated in FIGS. Since the upper limit of “31” is set, “31” is never exceeded. However, when CBRminq is obtained by control based on TM5 of the MPEG2 standard, it is obtained by multiplying the value of the corresponding virtual buffer by the value of (31 / reaction parameter), and if this is converted to a code and exceeds “31”, “ 31 "is calculated. Since the value of the virtual buffer is not limited in TM5, when a normal state or a difficult image is continuously input, CBRminq continues to increase as indicated by a broken line in FIG.
Even if the encoding difficulty of the input image data to be encoded becomes easy in this state, the value of the virtual buffer becomes sufficiently small, and it takes time until the Q scale CBRminq to be calculated below VBRq. During this period, the image quality deteriorates.
In order to deal with such a problem, as illustrated in FIG. 12B, if CBRminq exceeds VBRq for a short period, for example, every frame, CBRminq is reset to a value close to VBRq.
CBRminqをVBRq に近い値に設定する方法としては、たとえば、仮想バッファの値を(VBRq×リアクションパラメータ)/31に書き換える。これにより、図3に示す遷移領域Z1、Z2における画質劣化する期間が、たとえば、数スライス間と短くなり、かつ、その間のQスケールも大きくなりすぎないため画質劣化度合いも小さくなり、難しい画像から易しい画像に切換わった時の画質劣化が抑えられる。
その結果、上述した図3に示した遷移領域Z1、Z2におけるQスケールの変化が図13の図解の曲線のようになり符号化難易度の変化点(遷移領域Z1、Z2)で生じる問題点が解決される。
このように第1実施形態によれば、画像および画像の変化に応じて適切な量子化スケールQSCを設定することによって、入力画像信号の符号化難易度に対応して、平均的に目標ビットレートに近い符号ビットレートで入力画像信号を符号化でき、さらに規格によって定められた最大ビットレートを越えないことを保証することができる。
As a method of setting CBRminq to a value close to VBRq, for example, the value of the virtual buffer is rewritten to (VBRq × reaction parameter) / 31. Accordingly, the period during which the image quality degradation in the transition regions Z1 and Z2 shown in FIG. 3 is shortened to, for example, several slices, and the Q scale between them is not too large. Image quality degradation when switching to an easy image is suppressed.
As a result, the change of the Q scale in the transition regions Z1 and Z2 shown in FIG. 3 described above becomes like the curve shown in FIG. 13, and the problem that occurs at the change point of the encoding difficulty (transition regions Z1 and Z2) is Solved.
As described above, according to the first embodiment, by setting an appropriate quantization scale QSC according to an image and a change in the image, the target bit rate is averaged according to the encoding difficulty level of the input image signal. It is possible to encode the input image signal at a code bit rate close to, and to ensure that the maximum bit rate determined by the standard is not exceeded.
CBRmaxqについても同様であるが、GOP残りビット量バッファ2322として用いる仮想バッファはunsigned型の引数が用いられることが多く、負の値になるときはゼロに抑えられるので、CBRminqに比べて効果は小さい場合が多く、またすぐにQスケールが大きな値にならないことにより、すなわち、ある短い期間符号化された画質が良くなり過ぎることにより問題になることはないと思われるが、CBRmaxqについてもCBRminqと同様にある短い期間で値を設定し直してもよい。
The same applies to CBRmaxq, but the virtual buffer used as the GOP remaining
画像符号化装置の全体処理
図14は第1実施形態の画像符号化装置全体の動作を示すフローチャートである。
以下、それぞれのパラメータの具体的な数値例を用いて、第1実施形態の画像符号化装置1の動作を説明する。
Overall Processing of Image Encoding Device FIG. 14 is a flowchart showing the overall operation of the image encoding device according to the first embodiment.
Hereinafter, the operation of the
ステップ11において、制御回路10が符号化処理開始した後、まず、VBR制御部22が与えられたパラメータに応じて式(2)でVBRバッファ値VBRbの初期値を求める。
ここで、たとえば、BRobj=4Mbps、最大ビットレートBRmax=8Mbps、VBR応答速度VBRr=300とし、さらに、式(2)におけるm=2.5×107 であり、k=10とすると、式(2)により、VBRバッファ値VBRbは、(2.5×107×300/(4×106×210))=1920000となる。
In
Here, for example, BRobj = 4 Mbps, maximum bit rate BRmax = 8 Mbps, VBR response speed VBRr = 300, m = 2.5 × 10 7 in equation (2), and k = 10, 2), the VBR buffer value VBRb becomes (2.5 × 10 7 × 300 / (4 × 10 6 × 2 10 )) = 1920000.
ステップ12において、VBR制御部22がGOPの目標ビット量を、式(3)に基づいて求める。
なお式(3)において、GOPを15ピクチャ単位とするとN=15となる。たとえば、NTSC方式のテレビジョン画像信号を符号化処理するとき、各フレームは、29.97Hzで更新するので、この場合のピクチャレートPCRは29.97となる。このため、式(3)により、GOPの目標ビット量は、(4×106×15/29.97)=2002002となる。
In
In Equation (3), N = 15 when GOP is in units of 15 pictures. For example, when an NTSC television image signal is encoded, each frame is updated at 29.97 Hz. In this case, the picture rate PCR is 29.97. For this reason, the target bit amount of the GOP is (4 × 10 6 × 15 / 29.97) = 2002002 according to Equation (3).
ステップ13において、制御回路10がCBRの目標ビット量を求める。
たとえば、最大ビットレートBRmax、GOPのピクチャ数N及びピクチャレートPCRに応じて、CBRの目標ビット量は、(8×106×15/29.97)=4004004となる。
In
For example, the target bit amount of CBR is (8 × 10 6 × 15 / 29.97) = 4004004 according to the maximum bit rate BRmax, the number N of GOP pictures, and the picture rate PCR.
ステップ14において、ステップ11で求めたVBRバッファ値VBRbに基づき、VBR制御部22が式(1)でVBR量子化スケールVBRqを求めて、量子化スケール比較部25に出力する。
式(1)においてn=9とすると、VBR量子化スケールVBRqは、(1920000/(29×300))=12.5となる。なお、量子化スケールは整数値が要求されるので、ここで、たとえば、VBR量子化スケールVBRq=13と設定される。
ピクチャ符号化タイプが1または2、すなわち、IまたはPピクチャのとき、可変量子化スケールVBRq=13に設定され、ピクチャ符号化タイプが3、すなわち、Bピクチャのとき、可変量子化スケールは、式(1)により算出された量子化スケールを1.4倍にした値に設定される。すなわち、Bピクチャの場合、VBRq=18に設定される。
In step 14, based on the VBR buffer value VBRb obtained in
When n = 9 in the formula (1), the VBR quantization scale VBRq is (1920000 / (2 9 × 300)) = 12.5. Since the quantization scale is required to be an integer value, for example, VBR quantization scale VBRq = 13 is set here.
When the picture coding type is 1 or 2, ie, an I or P picture, the variable quantization scale VBRq = 13 is set. When the picture coding type is 3, ie, a B picture, the variable quantization scale is The quantization scale calculated in (1) is set to a value obtained by multiplying by 1.4. That is, in the case of a B picture, VBRq = 18 is set.
ステップ15において、最大CBR制御部23Aが最大ビットレートBRmaxに応じて最大CBR量子化スケールCBRmaxqを求め、最小CBR制御部23Bが最小ビットレートBRmin に応じて最小CBR量子化スケールCBRminqを求めて、量子化スケール比較部25に出力する。
In step 15, the maximum
ステップ16において、量子化スケール比較部25が、図11を参照して述べた量子化スケール判定処理を行う。すなわち、VBR量子化スケールVBRqと最小CBR量子化スケールCBRminqとが比較され、小さい方が選択され、さらに、選択結果と最大CBR量子化スケールCBRmaxqとが比較され、大きいほうが選択されて、量子化スケールQSCとして画像圧縮符号化部24の符号化制御部212に出力される。
In
ステップ17において、画像圧縮符号化部24は、量子化スケール比較部25により提供された量子化スケールで、1MB(1マクロブロック)単位で入力画像信号に対して符号化処理を行う。
In step 17, the image
ステップ18において、最大CBR制御部23Aおよび最小CBR制御部23Bにおいて、目標ビット量が設定されたGOP目標ビット量から減算される。
In step 18, the maximum
ステップ19において、制御回路10は、1GOPの全ての画像信号に対する符号化処理が終わるまでステップ15からS18の処理が繰り返して行うように制御する。
1GOPの符号化処理が終了したあと、ステップ20において、1GOPにおけるビット残量RBGが取り出される。
ステップ21において、ビット残量RBGに応じて、VBR制御部22においてVBRバッファ値が更新される。
In step 19, the
After the 1 GOP encoding process is completed, the remaining bit amount RBG in 1 GOP is extracted in
In
ステップ22において、最大CBR制御部23A、最小CBR制御部23Bは、発生ビット量に応じて、GOPのビット残量ΔRを算出し、当該ビット残量に応じて、式(6)に基づき最大CBR制御部23A、最小CBR制御部23BにおけるGOPの目標ビット量を更新する。
上述したように、直前のGOPのビット残量ΔRが正または0のとき、式(6)に基づき、次のGOPの目標ビット量が算出される。
In
As described above, when the bit remaining amount ΔR of the previous GOP is positive or 0, the target bit amount of the next GOP is calculated based on the equation (6).
ステップ23において、制御回路10により画像符号化処理が終了するか否かの判断が行われ、符号化処理が継続する場合にステップ14の処理に戻り、次のGOPにおける符号化処理が行われる。
In
このように、画像符号化装置1においては、ステップS14からS23までの各処理が繰り返して行われるので、符号化対象のディジタル画像データS30についてGOP毎に符号化処理が行われる。
As described above, in the
上述した処理は、GOP単位に限定されることなく、他の画像処理単位、たとえば、ピクチャ単位で符号化処理を行うことも可能である。
また、符号化処理におけるそれぞれのステップは、別の順序でも実現可能であり、さらに、必要に応じて、他の処理ステップを追加することもできる。たとえば、処理開始直後の数ピクチャまたは数GOPにおいて、まず最大CBR制御部23A、最小CBR制御部23Bにより目標ビットレートBRobjに応じて設定された固定符号化レートで入力画像信号を符号化処理し、これらのピクチャまたはGOPにおける処理結果に応じて、符号化処理のパラメータを設定し、その後可変符号化レートによる符号化処理に移行することも可能である。
The above-described processing is not limited to GOP units, and encoding processing can be performed in other image processing units, for example, picture units.
In addition, each step in the encoding process can be realized in a different order, and other processing steps can be added as necessary. For example, in several pictures or several GOPs immediately after the start of processing, the input image signal is first encoded at a fixed encoding rate set according to the target bit rate BRobj by the maximum
符号化対象の入力画像信号の符号化難易度が変化した場合の画像符号化処理について説明する。
まず、符号化処理開始後しばらくの間の入力画像は、ステップ12において算出した量子化レート13と18を用いて符号化処理を行う場合、最大ビットレートBRmax以下のビット量となる程度の符号化難易度を有するものとする。
符号化処理において、最大CBR制御部23Aにおいて、たとえば、MB(マクロブロック)毎の発生ビット量が集計され、ピクチャ毎に目標ビット量Rから集計された発生ビット量を減算して、ビット残量ΔRが算出される。なお、いくつかのブロックで共通して用いるのであれば、別のブロックで集計し、集計した結果をもらってもよい。
そして、最大CBR制御部23A、最小CBR制御部23Bにより、目標ビット量を引くことにより求められたビット残量ΔRが0に近づくようにCBR量子化スケールが求められる。
CBR量子化スケールが下げられた結果、量子化スケール比較部25において図11の判断処理に従って決定された量子化スケールQSCが画像圧縮符号化部24の符号化制御部212に提供されるので、次のGOP量子化処理の終わりで、たとえば、大きなビット残量ΔRが残されることもある。
An image encoding process when the encoding difficulty level of the input image signal to be encoded is changed will be described.
First, when the input image for a while after the start of the encoding process is encoded using the
In the encoding process, for example, the maximum
Then, the maximum
As a result of the CBR quantization scale being lowered, the quantization scale QSC determined by the quantization
本実施形態では、当該ビット残量ΔRが正であるため、ビット残量によるフィードバック処理をせず、式(6)に示すように、最大ビットレートBRmaxに基づき次のGOPの目標ビット量Rが求められる。
一方、VBR制御部22において、MB毎に発生するビット量が式(3)に基づいて算出されたGOPのビット残量RBGより引かれる。これに応じて、次のGOPにおけるVBR量子化スケールVBRqは式(2)により求められる。このように、GOP毎にVBR量子化スケールは変化していき、発生ビット量が目標ビット量から大きい逸脱することが防止できる。
In this embodiment, since the bit remaining amount ΔR is positive, feedback processing based on the remaining amount of bits is not performed, and the target bit amount R of the next GOP is based on the maximum bit rate BRmax as shown in Expression (6). Desired.
On the other hand, in the
以上で求めたVBR量子化スケールでは、最大ビットレートBRmaxを越えてしまうような符号化難易度の高い画像データが入力されたとする。この場合、最大CBR制御部23Aの最大量子化スケールCBRmax qは1ピクチャの間にどんどん大きくなり、VBR量子化スケールVBRqを越えるので、量子化スケール比較部25において、図11に図解した処理によって、大きいほうのVBRqが選択されて、量子化スケールQSCとして画像圧縮符号化部24に提供される。
It is assumed that image data with a high degree of difficulty of encoding that exceeds the maximum bit rate BRmax is input with the VBR quantization scale obtained above. In this case, the maximum quantization scale CBRmax q of the maximum
上述したように、一度の符号化処理で可変ビットレートで入力画像を符号化処理する場合、急激に画像の符号化難易度が上がったときに最大ビットレートを越えない保証をしなければならない。
難しい画像から易しい画像に急激に変化した場合も、最小ビットレートを下回らないことが望ましい。
本実施の形態においては、画像符号化装置に通常備えているCBR制御部を、最大CBR制御部23A、最小CBR制御部23Bに流用することによって、画像符号化装置の構成を大きく変えることなくVBRレート制御を実現可能となる。
さらに、本実施形態のように最大CBR制御部23A、最小CBR制御部23Bを使用しない場合には、VBVバッファがアンダーフローしそうになるので、画像圧縮符号化部24によるDCT係数のカットが行われると、画質の劣化を生ずるので、本実施形態によればこれを改善できることが期待される。
As described above, when an input image is encoded at a variable bit rate by a single encoding process, it must be ensured that the maximum bit rate is not exceeded when the difficulty of encoding the image suddenly increases.
It is desirable that the bit rate does not fall below the minimum bit rate even when there is a sudden change from a difficult image to an easy image.
In the present embodiment, the CBR control unit normally provided in the image encoding device is diverted to the maximum
Further, when the maximum
符号化終了時にVBRバッファ値VBRbはVBRバッファ記録部21に出力され、VBRバッファ記録部21により保持される。そして、次の符号化開始時にはこの保持された値がVBRバッファ値VBRbの初期値となるので、VBRバッファ値VBRbは、前回の符号化処理の終了時の値となる。
At the end of encoding, the VBR buffer value VBRb is output to the VBR
図13は、本実施形態の画像符号化装置1における画像符号化処理の量子化スケールを示す図である。複雑な画像が入力された場合、符号化ビットレートが所定の画像符号化規格によって定められた最大ビットレートを越えそうなとき、最大CBR制御部23AにおけるCBR制御が機能しはじめ、符号化レートが最大ビットレートを越えないように制御される。
易しい画像の場合は最小CBR制御部23BのCBR制御機能による。
FIG. 13 is a diagram illustrating a quantization scale of image encoding processing in the
In the case of an easy image, it depends on the CBR control function of the minimum
このような制御によって本発明の実施の形態の画像符号化装置1では、規格によって定められた最大符号化レートを守りつつ、画像の符号化難易度に応じて、かつ、画像の複雑さの急激な変化があっても、ビットレートを適切に制御することによって、画質をほぼ均一に保つことができる。
With such control, the
本発明の第1施形態の画像符号化装置1の特徴を纏めると下記になる。
(1)本発明の第1実施形態の画像符号化装置1は特に、Qスケールを操作することにより行なうVBRレート制御において、最大CBR制御部23Aと最小CBR制御部23Bとでビットレートの最大値と最小値の制限を加えることを特徴としている。ビットレートの最大値と最小値の制限は、固定ビットレート(CBR)方式でレート制御を行い、それぞれのQスケールを求め、量子化スケール比較部25でVBRのQスケールと大小比較を行なうことで適切な1つを選択し、選択した量子化スケールQSCを画像圧縮符号化部24における符号化に用いる。
(2)CBR方式でレート制御を行なう際に、たとえば、MPEG2規格のTM5のステップ1などで一般的に用いられるGOP内の未符号化ピクチャに対して割り当てられるビット量Rに対して、更新計算で引かれる1ピクチャ毎のビット量は、通常のCBR方式で用いられる実際に発生したビット量ではなく、符号化前に計算されたターゲットビット量である。
(3)CBR方式でレート制御を行なう際に、そのQスケールを短い周期でVBRのQスケールに近い値に設定し直すことにより、ビットレートの最大値あるいは最小値の制限が必要になった場合に、CBR方式のQスケールがすみやかに選択されるようにしている。
The characteristics of the
(1) In the
(2) When rate control is performed in the CBR system, for example, update calculation is performed on the bit amount R allocated to an uncoded picture in a GOP generally used in
(3) When rate control is performed using the CBR method, the maximum or minimum bit rate must be limited by resetting the Q scale to a value close to the VBR Q scale in a short cycle. In addition, the Q scale of the CBR method is selected promptly.
以上述べたように、本発明の第1実施形態によれば、最大ビットレートの制限について、下記の効果を奏する。
(1)VBR方式の最大ビットレートと最小ビットレートを制限することにより、符号化難易度の変化点での画質劣化およびビットレートが上がり過ぎたことをキャンセルするためにその後ビットレートを下げることによる画質劣化が抑えられる。
(2)実発生ビット量を用いてGOP残りビット量を求めることによりGOPの後ろになるほど最大ビットレートの制限が正しく働かず、GOPの後半でP,Bピクチャの発生ビット量が多くなり、TM5ステップ1で用いる画面の複雑さを示すパラメータ(global complexity measure)のI,P,Bピクチャ間の比率が崩れ、次のGOPにおいてIピクチャの最大ビットレートを制限するための目標ビット量が小さく抑えられることによりIピクチャの画質が劣化する問題を防ぐことができる。
また本発明の第1実施の形態によれば、最小ビットレートの制限について、逆に同様の効果を奏する。
(3)最小ビットレートを制限するためのQスケールを求める仮想バッファが無制限に増加することがなくなり、符号化難易度が難しい画像から易しい画像に変化した時にQスケールが速やかに下がることが可能となり、この間の画質劣化を防ぐことができる。
As described above, according to the first embodiment of the present invention, the following effects can be achieved with respect to the limitation on the maximum bit rate.
(1) By limiting the maximum bit rate and the minimum bit rate of the VBR method, the image quality deterioration at the change point of the encoding difficulty level and the bit rate is subsequently lowered in order to cancel the excessive bit rate. Image quality degradation can be suppressed.
(2) By determining the remaining amount of GOP using the actual amount of generated bits, the maximum bit rate restriction does not work correctly as the GOP becomes behind, and the amount of generated bits of P and B pictures increases in the latter half of the GOP. The ratio between the I, P, and B pictures of the parameter (global complexity measure) indicating the complexity of the screen used in
Also, according to the first embodiment of the present invention, the same effect can be obtained on the limitation of the minimum bit rate.
(3) The virtual buffer for obtaining the Q scale for limiting the minimum bit rate is not increased indefinitely, and the Q scale can be quickly lowered when the coding difficulty level changes to an easy picture. , Image quality deterioration during this period can be prevented.
以上説明したように、本発明の第1実施形態の画像符号化装置及びその方法によれば、一度の符号化処理により可変符号化レートによる画像信号の圧縮符号化処理を実現できる。
さらに、一般的な符号化処理回路を活用することにより、回路構成を大きく変更することなく、実時間での符号化処理が要求される用途において可変符号化レート処理を実現できるという利点がある。
As described above, according to the image coding apparatus and method of the first embodiment of the present invention, it is possible to realize compression coding processing of an image signal at a variable coding rate by a single coding processing.
Furthermore, by utilizing a general encoding processing circuit, there is an advantage that variable encoding rate processing can be realized in applications that require real-time encoding processing without greatly changing the circuit configuration.
第2実施の形態
図15〜図18を参照して、本発明の第2実施の形態の画像符号化装置および画像符号化方法について述べる。
図15に図解したエンコーダ20Aは、第1VBRバッファ記録部21−1、第1VBR制御部22−1、第2VBRバッファ記録部21−2、第2VBR制御部22−2、最大CBR制御部23A、最小CBR制御部23B、画像圧縮符号化部24、第1量子化(Q)スケール比較部25Aおよび第2量子化(Q)スケール比較部25Bを有する。
本発明の第2実施の形態の画像符号化装置におけるエンコーダ20Aと図6に図解した第1実施の形態のエンコーダ20、および、第2実施の形態の制御回路10Aと第1実施の形態の制御回路10との相違を下記に述べる。
Second Embodiment With reference to FIGS. 15 to 18, an image coding apparatus and an image coding method according to a second embodiment of the present invention will be described.
The
The
(1)エンコーダ20A
本発明の第1実施の形態も第2実施の形態も、図5に図解した可変符号化ビットレート(VBR)制御回路22aとしては基本的には同じであるが、図6を参照して述べた第1実施の形態におけるVBRバッファ記録部21およびVBR制御部22を、第2実施の形態においては、図15に図解のように、第1VBRバッファ記録部21−1および第1VBR制御部22−1、および、第2VBRバッファ記録部21−2および第2VBR制御部22−2に2系統並列に設けた。
(2)制御回路10A
図15に図解した制御回路10Aは、第1VBR制御部22−1に第1目標ビットレートBRobj 1と第1VBR応答速度VBRr1を印加し、第1VBRバッファ記録部21−1に第1VBRバッファ初期値BRINI 1を印加する。同様に、制御回路10Aは、第2VBR制御部22−2に第2目標ビットレートBRobj 2と第2VBR応答速度VBRr2を印加し、第2VBRバッファ記録部21−2に第2VBRバッファ初期値BRINI2を印加する。
(3)第1VBR制御部22−1および第2VBR制御部22−2からそれぞれ、第1および第2可変ビットレート(VBR)量子化スケールVBRq 1、VBRq 2が出力される。
(4)図5に図解した量子化スケール選択回路25aとして、図6を参照して述べた第1実施の形態においては量子化(Q)スケール比較部25としていたが、第2実施の形態においては、図6を参照して述べた量子化(Q)スケール比較部25に相当する第1量子化(Q)スケール比較部25Aに加えて、第2量子化(Q)スケール比較部25Bを設けている。第1および第2量子化(Q)スケール比較部25A、25Bの処理内容を、図16のフローチャートに示す。第2量子化(Q)スケール比較部25Bは、第1VBR制御部22−1から出力される第1可変ビットレート量子化スケールVBRq 1と、第2VBR制御部22−2から出力される第2可変ビットレート量子化スケールVBRq 2とを、量子化しきい値Qthを参照して、最終的な可変ビットレート量子化スケールVBRq を選択する。第1量子化(Q)スケール比較部25Aは、図11に図解した量子化(Q)スケール比較部25の処理と同じ量子化スケールQSCの選択処理を行う。
(1)
The first embodiment and the second embodiment of the present invention are basically the same as the variable coding bit rate (VBR)
(2)
The
(3) First and second variable bit rate (VBR) quantization scales
(4) The quantization
第2実施の形態の画像符号化装置におけるその他の構成、動作は、第1実施の形態と同様である。参考までに記載する。
(1)画像符号化装置
本発明の第2実施の形態の画像符号化装置の構成は、図4に図解にした画像符号化装置と同じである。本発明の第2実施形態の画像符号化装置1は、図4に図解した制御回路10に代えて上述した制御回路10A、図4に図解したエンコーダ20に代えて上述したエンコーダ20Aおよび画像入力装置30を含む。画像入力装置30は同じである。なお、制御回路10A、エンコーダ20Aの基本構成とその動作は、第1実施の形態として述べた制御回路10およびエンコーダ20と同じである。
Other configurations and operations of the image coding apparatus according to the second embodiment are the same as those of the first embodiment. It is described for reference.
(1) Image Encoding Device The configuration of the image encoding device according to the second embodiment of the present invention is the same as that of the image encoding device illustrated in FIG. The
(2)エンコーダ
本発明の第2実施の形態のエンコーダ20Aの基本構成も、図5に図解したエンコーダ20と同じである。エンコーダ20Aは、可変符号化ビットレート(VBR)制御回路22a、固定符号化ビットレート(CBR)制御回路23a、量子化(Q)スケール選択回路25a、および、画像圧縮符号化部24を有する。
(2) Encoder The basic configuration of the
CBR制御回路23aは、第2実施の形態においても第1実施の形態と同様、第1画像処理単位、たとえば、GOP単位より短い第2画像処理単位、たとえば、ピクチャまたはマクロ・ブロック(MB)単位で、ビットストリームの先頭のシーケンスヘッダによって指定した最大のビットレートに対して当該最大のビットレートを越えないように迅速に変化する第2および第3量子化スケールQS2、QS3を設定する第2および第3量子化スケール設定手段である。
そのため、固定ビットレート制御回路23aは、図15に図解したように、最大固定ビットレート(CBR)制御部23Aと最小CBR制御部23Bとを有する。図15に図解したCBR制御回路23aの構成は、図6を参照して述べた第1実施の形態におけるCBR制御回路23aと同じである。最大CBR制御部23Aおよび最小CBR制御部23Bの構成と、画像圧縮符号化部24との関係も図8を参照して述べたものと同様である。
Similarly to the first embodiment, the
Therefore, the fixed bit
第2実施の形態においては、可変符号化ビットレート(VBR)制御回路22aは、第1VBR制御部22−1および第1VBRバッファ記録部21−1、ならびに、第2VBR制御部22−2および第2VBRバッファ記録部21−2とで2系統並列動作するように構成されている。
第1VBR制御部22−1および第2VBR制御部22−2の基本動作は、第1実施の形態のVBR制御部22と同様である。すなわち、第1VBR制御部22−1および第2VBR制御部22−2は、第1画像処理単位、たとえば、複数のピクチャからなるGOP単位で画像符号化を行うための第1量子化スケール(第1Qスケール)として第1可変ビットレート量子化スケールVBRq 1と第2可変ビットレート量子化スケールVBRq 2とを設定する第1量子化スケール設定手段であり、第1目標ビットレートBRobj 1と第2目標ビットレートBRobj 2に対して、第1画像処理単位で画像入力装置30からの符号化対象の入力画像信号(画像データS30)の符号化の難易度に応じて、図16にフローチャートを示した方法で、第1量子化スケールQS1(可変ビットレート量子化スケールVBRq )を設定する。
In the second embodiment, the variable coding bit rate (VBR)
The basic operations of the first VBR control unit 22-1 and the second VBR control unit 22-2 are the same as those of the
量子化スケール選択回路25aは、第2実施の形態においても第1実施の形態と同様、と図5のVBR制御回路22aによって設定された第1量子化スケールQS1とCBR制御回路23aによって設定された第2および第3量子化スケールQS2、QS3とを比較し、これらの量子化スケールのうち適切なQスケールを符号化対象の入力画像信号(画像データS30)に対して符号化処理を行うための量子化スケールQSCとして、画像圧縮符号化部24に出力する。
In the second embodiment, the quantization
画像圧縮符号化部24は、第2実施の形態においても第1実施の形態と同様、図7に図解した構成を持ち、符号化対象の画像データS30を、第1量子化(Q)スケール比較部25Aおよび第2量子化(Q)スケール比較部25Bからなる量子化スケール選択回路25aからの量子化スケールQSCおよび制御回路10Aからの圧縮符号化パラメータS12に基づいて符号化する。
画像圧縮符号化部24は、目標ビットレートBRobj、最大ビットレートBRmax、VBR指示信号VBD、および、第1量子化(Q)スケール比較部25Aから提供される量子化スケールQSCに応じて、画像入力装置30から入力される符号化対象の画像データS30を圧縮符号化し、ビットストリームS20を出力する。
さらに画像圧縮符号化部24は、圧縮符号化により生成したビット量を示す発生ビット量BQTおよび画像符号化種類を示すPCT信号を生成し、図15に図解したように、VBR制御部22、および、最大CBR制御部23A、最小CBR制御部23Bにそれぞれ出力する。
画像圧縮符号化部24は、図7に図解した構成を有し、その動作は第1実施の形態と同じである。第2実施の形態においても、画像圧縮符号部24によって、一回だけの符号化処理、すなわち、1パス処理により、可変符号化レートで画像信号の符号化を実現できる。
Similarly to the first embodiment, the image
In accordance with the target bit rate BR obj , the maximum bit rate BR max , the VBR instruction signal VBD, and the quantization scale QSC provided from the first quantization (Q)
Further, the image
The image
VBRバッファ記録部
第1VBRバッファ記録部21−1および第2VBRバッファ記録部21−2の動作は、第1実施の形態のVBRバッファ記録部21と同様である。
第1VBRバッファ記録部21−1および第2VBRバッファ記録部21−2も、第1実施の形態のVBRバッファ記録部21と同様、それぞれ、第1VBR制御部22−1および第2VBR制御部22−2から出力される第1VBRバッファ値VBRb1および第2VBRバッファ値VBRb2を保持して、上述した画像圧縮符号化部24における一連の符号化処理におけるトータルの値が、それぞれ、第1目標ビットレートBRobj 1および第2目標ビットレートBRobj 2からの逸脱量を小さくするために設けられている。
符号化処理開始前、第1VBRバッファ記録部21−1および第2VBRバッファ記録部21−2は、制御回路10Aから入力された第1VBRバッファ初期値BRINI 1および第2VBRバッファ初期値BRINI 2を記憶する。もっとも簡単な初期化方法として、処理開始前に、制御回路10Aからの初期化制御信号に応じて第1VBRバッファ記録部21−1と第2VBRバッファ記録部21−2とを初期化し、第1VBRバッファ初期値BRINI 1と第2VBRバッファ初期値BRINI 2とを“0”に設定するか、または、予め与えられた値に設定する。
第1VBRバッファ記録部21−1および第2VBRバッファ記録部21−2は、エンコーダ20Aにおいて圧縮符号化を開始したあと第1VBR制御部22−1および第2VBR制御部22−2に記録した第1VBRバッファ初期値BRINI 1および第2VBRバッファ初期値BRINI 2を提供し、また、エンコーダ20Aにおける符号化終了時に第1VBR制御部22−1および第2VBR制御部22−2から第1VBRバッファ値VBRb1および第2VBRバッファ値VBRb2を入力して記録する。第1VBRバッファ記録部21−1および第2VBRバッファ記録部21−2は次回の符号化処理において、記録した第1VBRバッファ値VBRb1および第2VBRバッファ値VBRb2を第1VBR制御部22−1および第2VBR制御部22−2に出力する。
VBR Buffer Recording Unit The operations of the first VBR buffer recording unit 21-1 and the second VBR buffer recording unit 21-2 are the same as those of the VBR
Similarly to the VBR
Before starting the encoding process, the first VBR buffer recording unit 21-1 and the second VBR buffer recording unit 21-2 store the first VBR buffer
The first VBR buffer recording unit 21-1 and the second VBR buffer recording unit 21-2 are the first VBR buffer recorded in the first VBR control unit 22-1 and the second VBR control unit 22-2 after the
VBR制御部
第1VBR制御部22−1および第2VBR制御部22−2の動作は、第1実施の形態のVBR制御部22と同様である。
以下、第1VBR制御部22−1について述べる。第2VBR制御部22−2も、第1目標ビットレートBRobj 1を第2目標ビットレートBRobj 2、第1VBRバッファ値VBRb1を第2VBRバッファ値VBRb2、第1VBR量子化スケールVBRq 1を第2VBR量子化スケールVBRq 2に置き換えるだけで、基本的には、第1VBR制御部22−1の処理と同様である。
VBR Control Unit The operations of the first VBR control unit 22-1 and the second VBR control unit 22-2 are the same as those of the
Hereinafter, the first VBR control unit 22-1 will be described. The second VBR control unit 22-2 also sets the first target
第1VBR制御部22−1は、制御回路10Aから入力された第1VBR応答速度VBRr1、第1目標ビットレートBRobj 1、最大ビットレートBRmax、最小ビットレートBRminに応じて第1可変ビットレート(VBR)量子化スケールVBRq 1を求めて第2量子化(Q)スケール比較部25Bに出力する。第1VBR制御部22−1は、第1目標ビットレートBRobj 1から求められる1GOPの目標発生ビット量に対し、実際にそのGOPで発生したビット量を比較し、第1目標ビットレートBRobj 1よりビット量が発生しすぎていればQスケールを徐々に大きくして発生ビット量を徐々に抑え、逆に第1目標ビットレートBRobj 1よりビット量の発生が足りなければQスケールを徐々に小さくして発生するビット量を徐々に増加させる。これにより、Qスケールを余りレスポンスよく変動させないことから符号化難易度に応じた発生ビット量となるVBRレート制御となり、かつ、Qスケールを発生ビット量に応じて徐々に変動させることで、長期的には目標ビットレートBROBJに応じた発生ビット量となる。
第1VBR制御部22−1において、内部パラメータとして、第1VBR量子化スケールVBRq 1を求めるための第1VBRバッファ値VBRb1、第1目標ビットレートBRobj 1で符号化する場合のGOPにおける第1残りビット量RBG1、第1VBR量子化スケールVBRq 1の応答速度を表す第1VBR応答速度VBRr1を保持している。
The first VBR control unit 22-1 includes the first variable bit rate according to the first VBR response speed VBRr1, the first target
In the first VBR control unit 22-1, as the internal parameters, the first remaining in the GOP when encoding with the first VBR buffer value VBRb1 for obtaining the first VBR
第1VBR制御部22−1において第1VBR量子化スケールVBRq 1は式(1)と同様に、下記式(1a)を用いて求める。
VBRq1=VBRb1/(2n ×VBRr1) …(1a)
In the first VBR control unit 22-1, the first VBR
VBRq1 = VBRb1 / (2 n × VBRr1) (1a)
第1VBR量子化スケールVBRq 1が1になると、発生するビット量が急激に増加してVBRレート制御が不安定になるため、式(1a)により算出した第1VBR量子化スケールVBRq 1が1以下のとき、第1VBR制御部22−1において第1VBR量子化スケールVBRq 1を強制的に2に変更するなどの対策を講じる。
GOPにおけるI/P/Bピクチャの違いに着目して、第1VBR制御部22−1は、符号化タイプがBピクチャの場合に式(1a)により得られた値に係数、たとえば、1.4をかけた値を第1VBR量子化スケールVBRq 1とする。すなわち、Bピクチャの場合の第1VBR量子化スケールVBRq 1を常にI,Pピクチャの第1VBR量子化スケールVBRq 1の1.4倍に設定される。その理由は、第1実施の形態においても述べたように、BピクチャをI,Pピクチャに比較して多少粗めに符号化することにより、Bピクチャで節約できる符号化量をI,Pピクチャに符号量に振り分けると、I,PピクチャのS/Nが改善されるとともに、これを参照して生成されるBピクチャのS/Nも改善されることになり、総合的にS/Nの改善を図ることができるからである。
第1VBRバッファ記録部21−1において、I/P/BピクチャのQスケールが上述したように簡単な方法で決定されるが、上述した例示に限定されず、それぞれのピクチャの符号化難易度を調べてそれに応じたQスケールの差を付けることもできる。
When the 1VBR
Paying attention to the difference between I / P / B pictures in GOP, the first VBR control unit 22-1 uses a coefficient, for example, 1.4, in the value obtained by equation (1a) when the encoding type is B picture. A value obtained by multiplying is set as the first VBR
In the first VBR buffer recording unit 21-1, the Q scale of the I / P / B picture is determined by a simple method as described above. However, the first VBR buffer recording unit 21-1 is not limited to the above example, and the encoding difficulty level of each picture is determined. It is also possible to add a difference in Q scale according to the examination.
第1VBRバッファ記録部21−1において、GOPでの残りビット量RBGとしてGOP毎に目標ビット量が設定される。そして、第1VBRバッファ記録部21−1において、たとえば、MB(マクロブロック)毎に発生ビット量を受け取ると、ここからその分(GOP毎に目標ビット量)を引く。各GOPの終わりには目標ビット量からの逸脱量がGOPでの残りビット量RBGに残るので、第1VBRバッファ記録部21−1はこれ(残りビット量RBG)を第1VBRバッファ値VBRb1から引く。この時、第1VBRバッファ値VBRb1が負になると第1VBR制御部22−1は第1VBRバッファ値VBRb1を0に設定する。また、第1VBRバッファ値VBRb1がオーバーフローしそうな場合には第1VBR制御部22−1は第1VBRバッファ値VBRb1を最大値に固定する。 In the first VBR buffer recording unit 21-1, a target bit amount is set for each GOP as the remaining bit amount RBG in the GOP. In the first VBR buffer recording unit 21-1, for example, when the generated bit amount is received for each MB (macroblock), the corresponding amount (target bit amount for each GOP) is subtracted therefrom. Since the deviation from the target bit amount remains in the remaining bit amount RBG in the GOP at the end of each GOP, the first VBR buffer recording unit 21-1 subtracts this (remaining bit amount RBG) from the first VBR buffer value VBRb1. At this time, when the first VBR buffer value VBRb1 becomes negative, the first VBR control unit 22-1 sets the first VBR buffer value VBRb1 to zero. When the first VBR buffer value VBRb1 is likely to overflow, the first VBR control unit 22-1 fixes the first VBR buffer value VBRb1 to the maximum value.
符号化処理開始時の第1VBRバッファ値VBRb1の初期値は、第1VBRバッファ記録部21−1から第1VBR制御部22−1に入力される。たとえば、第1VBRバッファ記録部21−1から入力された第1VBRバッファ値VBRb1が0以外の場合、第1VBR制御部22−1はその値を使用し、0の場合、式(2)と同様の下記の式(2a)により求めた値を用いる。
VBRb1=m・VBRr1/(BRobj1×2k) …(2a)
The initial value of the first VBR buffer value VBRb1 at the start of the encoding process is input from the first VBR buffer recording unit 21-1 to the first VBR control unit 22-1. For example, when the first VBR buffer value VBRb1 input from the first VBR buffer recording unit 21-1 is other than 0, the first VBR control unit 22-1 uses the value. When the first VBR buffer value VBRb1 is 0, the same as the equation (2) The value obtained by the following equation (2a) is used.
VBRb1 = m · VBRr1 / (
式(2a)における第1VBR応答速度VBRr1は制御回路10Aにより供給される値を使用する。たとえば、第1VBR応答速度VBRr1が200程度の値に設定されるとき数十秒、4000程度の値に設定されるとき数十分の応答速度が得られる。符号化終了時に式(2a)により算出された第1VBRバッファ値VBRb1は、第1VBRバッファ記録部21−1に伝送されて記憶される。
The first VBR response speed VBRr1 in the equation (2a) uses a value supplied by the
GOPでの第1残りビット量RBG1には、最初に式(3)と同様の下記式(3a)で求められる値が設定される。
RBG1=BRobj1・N/PCR …(3a)
In the first remaining bit amount RBG1 in the GOP, a value obtained by the following equation (3a) similar to the equation (3) is first set.
RBG1 =
第2VBR制御部22−2も第1VBR制御部22−1と同様な動作(処理)を、第1VBR制御部22−1と並列に行う。
第2VBR制御部22−2によっても、Qスケールを余りレスポンスよく変動させないことから符号化難易度に応じた発生ビット量となるVBRレート制御となり、かつ、Qスケールを発生ビット量に応じて徐々に変動させることで、長期的には第2目標ビットレートBRobj 2に応じた発生ビット量となる。
The second VBR control unit 22-2 also performs the same operation (processing) as the first VBR control unit 22-1 in parallel with the first VBR control unit 22-1.
Also by the second VBR control unit 22-2, since the Q scale does not fluctuate so much in response, the VBR rate control is performed with the generated bit amount corresponding to the encoding difficulty level, and the Q scale is gradually changed according to the generated bit amount. By changing the amount, the generated bit amount according to the second target bit rate BR obj 2 is obtained in the long term.
CBR制御部
第2実施の形態のCBR制御部は、最大CBR制御部23Aと最小CBR制御部23Bとを有し、図8を参照した述べた第1実施の形態と同じである。
最大CBR制御部23Aおよび最小CBR制御部23Bにおいて、第2実施の形態においても第1実施の形態と同様、たとえば、MPEG2についてのTM5のアルゴリズムに基づいてCBRのレート制御を行う。
第2実施の形態の最大CBR制御部23Aおよび最小CBR制御部23Bによって、図10(B)、(C)に点線の曲線CV22、CV23で示すように、ビットレートに応じた1GOPの目標ビット量RがGOP残りビット量に設定され、ここから求められる毎フレームの目標ビット量Rにより符号化が制御され、目標ビットレートBROBJに応じたビット量が毎フレーム発生し、毎フレームの目標ビット量がGOP残りビット量から引かれることにより、GOPの最後にはGOP残りビット量がゼロに近い値になる。
CBR Control Unit The CBR control unit of the second embodiment includes a maximum
In the maximum
The target bit amount of 1 GOP corresponding to the bit rate by the maximum
第2実施の形態においても第1実施の形態と同様、最大CBR制御部23Aは、制御回路10Aから入力された最大ビットレートBRmaxに応じて最大CBR量子化スケールCBRmaxqを設定し、設定したCBRmaxqを第1量子化(Q)スケール比較部25Aに出力する。
第2実施の形態においても、式(4)〜(6)に相当する演算のもとで処理が行われる。
最大CBR制御部23Aおよび最小CBR制御部23Bは、上述したように算出されたGOPの目標ビット量に基づき、最大CBR量子化スケールCBRmaxq、最小CBR量子化スケールCBRminqを求めて、第1量子化(Q)スケール比較部25Aに供給する。
Also in the second embodiment, similarly to the first embodiment, the maximum
Also in the second embodiment, processing is performed under calculations corresponding to the equations (4) to (6).
The maximum
量子化スケール比較部
第2実施の形態における第1量子化(Q)スケール比較部25Aと第2量子化(Q)スケール比較部25Bとの処理を図16にフローチャートで示した。
なお、制御回路10Aから第1VBR制御部22−1と第2VBR制御部22−2に設定した第1目標ビットレートBRobj 1と第2目標ビットレートBRobj 2とは、第2目標ビットレートBRobj 2が第1目標ビットレートBRobj 1より大きいとしている(BRobj 2>BRobj 1)。
第2量子化(Q)スケール比較部25Bにおいて、第1VBR量子化スケールVBRq
1と量子化しきい値Qthとの大小比較を行い、小さいほうを選択する(ステップ11)。ついで、第2量子化(Q)スケール比較部25Bは選択されたものと第2VBR量子化スケールVBRq 2とを比較して大きいほうをVBR量子化スケールVBRq として第1量子化(Q)スケール比較部25Aに出力する。
以上のように、VBR量子化スケールVBRq が決定されると、第1量子化(Q)スケール比較部25Aは、図11を参照して述べたと同様に、ステップ1においてVBR量子化スケールVBRq と最小CBR制御部23Bから入力された最小CBR量子化スケールCBRminqとを比較して小さいほうを選択し、ステップ2において、選択した量子化スケールと最大CBR制御部23Aから入力された最大CBR量子化スケールCBRmaxqとを比較して大きいほうを選択して、選択したスケールを量子化スケールQSCとして算出し、画像圧縮符号化部24に提供する。
Quantization Scale Comparison Unit The processing of the first quantization (Q)
The first target
In the second quantization (Q)
1 and the quantization threshold value Q th are compared, and the smaller one is selected (step 11). Next, the second quantization (Q)
As described above, when the VBR quantization scale VBR q is determined, the first quantization (Q)
上記第1Qスケール比較部25Aにおける処理は、図11のフローチャートを参照して述べたものと同じである。ステップ1においてVBRq とCBRminqを比較して小さい方を選ぶことによりQスケールが大き過ぎてビットレートが下がり過ぎないように、Qスケールの最大値が制限される。次に、ステップ2において、上記比較結果とCBRmaxqを比較して大きい方を選で、Qスケールが小さ過ぎてビットレートが上がり過ぎないようにQスケールの最小値が制限される。第1Qスケール比較部25Aのその他の処理などは第1実施の形態において述べたものと同様である。
The processing in the first Q
第2Qスケール比較部25Bにおいて、第1VBR量子化スケールVBRq 1と第2VBR量子化スケールVBRq 2とからVBR量子化スケールVBRq を選択する意味を述べる。
制御回路10Aは、たとえば、図18(B)に例示したように、低いビットレートBRを第1目標ビットレートBRobj 1として第1VBR制御部22−1に設定し、高いビットレートBRを第2目標ビットレートBRobj 2として第2VBR制御部22−2に設定する。
The meaning of selecting the VBR quantization scale VBR q from the first VBR
For example, as illustrated in FIG. 18B, the
図17は、第1領域Z11は符号化対象の画像データS30として易しい画像が入力され、第3領域Z13は難しい画像が入力され、第5領域は易しい画像が入力され、第1領域と第3領域との間に易しい画像が難しい画像に遷移する第1遷移領域Z12、第3領域と第5領域との間に難しいが易しい画像に遷移する第4遷移領域Z14が存在する場合を示す。
曲線VBRq 1は第1VBR量子化スケールVBRq 1で符号化対象の画像データS30を符号化した場合を想定した量子化スケールQ(BR)、曲線VBRq 2は第2VBR量子化スケールVBRq で符号化した場合を想定した量子化スケールQ(BR)、Qthは固定の量子化しきい値Qthで符号化したときの量子化スケールQ(BR)を示す。実線のVBRq は、第1量子化(Q)スケール比較部25Aおよび第2量子化(Q)スケール比較部25Bによって選択された量子化スケールQSCによる符号化処理を想定した場合の量子化スケールQ(BR)を示す。
In FIG. 17, in the first area Z11, an easy image is input as the image data S30 to be encoded, a difficult image is input in the third area Z13, an easy image is input in the fifth area, and the first area and the third area A case where a first transition region Z12 in which an easy image transitions to a difficult image exists between the regions and a fourth transition region Z14 in which a transition to a difficult but easy image exists between the third region and the fifth region is shown.
A
第1領域Z11においては、易しい画像であるので、第1目標ビットレートBRobj 1(なお、BRobj 2>BRobj 1)に基づいてビットレート制御され、第1VBR量子化スケールVBRq 1が量子化しきい値Qthより小さく、第2Qスケール比較部25Bにおいて第1VBR量子化スケールVBRq 1が選択されて、画像圧縮符号化部24においてVBRq 1に基づいて、低いビットレートBR(高いQスケール)で符号化処理が行われる。
画像が難しくなっていき、第1遷移時点TP1に到達すると、VBRq 1が量子化しきい値Qthより大きくなり、Qスケール比較部25BにおいてQthが選択されて、画像圧縮符号化部24においてQthに基づいて固定のビットレートBR(固定のQスケール)で符号化処理が行われる。
第2遷移時点TP2を越えた第3領域Z13においては、難しい画像であるので、第2目標ビットレートBRobj 2に基づいてビットレート制御され、第2VBR量子化スケールVBRq 2が量子化しきい値Qthより大きく、かつ、第1VBR量子化スケールVBRq 1より小さく、第2Qスケール比較部25BにおいてVBRq 2が選択されて、画像圧縮符号化部24においてVBRq 2に基づいて、より高いビットレートBR(より低いQスケール)で符号化処理が行われる。
第3遷移時点TP3を越えて画像が易しくなっていく第4遷移時点Z14においては、VBRq 2が量子化しきい値Qthより小さくなり、Qスケール比較部25BにおいてQthが選択されて、画像圧縮符号化部24においてQthに基づいて固定のビットレートBR(固定のQスケール)で符号化処理が行われる。
さらに第4遷移時点TP4を越えて画像が一層易しくなっていく第5遷移時点Z15においては、第1領域Z11における処理と同様、VBRq 1がQthより小さくなり、Qスケール比較部25BにおいてVBRq 1が選択されて、画像圧縮符号化部24においてVBRq 1に基づいて、低いビットレートBR(高いQスケール)で符号化処理が行われる。
Since the first region Z11 is an easy image, the bit rate is controlled based on the first target bit rate BR obj 1 (BR obj 2> BR obj 1), and the first VBR
When the image becomes difficult and reaches the first transition time TP1,
In the third region Z13 beyond the second transition time point TP2, since the image is difficult, the bit rate is controlled based on the second target bit rate BR obj 2 and the second VBR quantization scale VBR q 2 is set to the quantization threshold value. Qth is larger than Q th and smaller than the first VBR
At the fourth transition time Z14 when the image becomes easier beyond the third transition time TP3, VBR q 2 becomes smaller than the quantization threshold Q th , and Q th is selected by the Q
Further in the fifth transition point Z15 the image beyond the fourth transition point TP4 is getting more easy, as in the process in the first region Z11,
図18(A)は第1実施の形態による例示的な画像の複雑さとビットレートBRの変化を示した図であり、図18(B)は上記第2実施の形態による例示的な画像の複雑さとビットレートBRの変化を示した図である。
第1実施の形態においては目標ビットレートBRobjが1つであり、図18(A)に例示したビットレートBRは、画像の符号化の難易度に関わらず、同じビットレートBRに収束している。
第2実施の形態においては、第1目標ビットレートBRobj 1と第2目標ビットレートBRobj 2とを設けており、図18(B)に例示したビットレートBRは、(1)符号化が易しい画像ではビットレートBRが低くなり、たとえば、符号化データを記録媒体に記録することを想定すると、記録媒体への記録時間を、高いビットレートのみに比較して、長くできるという利点がある。他方、難しい画像ではビットレートが高くなり、低いビットレートのみに比較して画質の劣化を抑えることができる。
このように、第2実施の形態によれば、第1実施の形態の特徴および効果(利点)に加えて、画像の符号化の難易度に応じて、符号化データの量を削減(に基づく、たとえば、記録時間の延長)でき、または、所定の符号化画質に維持することができるという効果を奏することができる。
FIG. 18A is a diagram showing the complexity of the exemplary image and the change in the bit rate BR according to the first embodiment, and FIG. 18B is the complexity of the exemplary image according to the second embodiment. And a change in the bit rate BR.
In the first embodiment, there is one target bit rate BR obj , and the bit rate BR illustrated in FIG. 18A converges to the same bit rate BR regardless of the difficulty of image encoding. Yes.
In the second embodiment, a first target
Thus, according to the second embodiment, in addition to the features and effects (advantages) of the first embodiment, the amount of encoded data is reduced (based on the degree of difficulty of image encoding) For example, the recording time can be extended), or a predetermined encoded image quality can be maintained.
第2実施の形態の変形態様
目標ビットレートBRobjの種類は上述した2つに限らない。
たとえば、図19に例示したように、可変符号化ビットレート(VBR)制御回路22aをn個並列に配設することができる。すなわち、第1VBRバッファ記録部21−1と第1VBR制御部22−1、第2VBRバッファ記録部21−2と第2VBR制御部22−2、・・・、第nVBRバッファ記録部21−nと第nVBR制御部22−nを設ける。制御回路10Bは、第1VBRバッファ記録部21−1〜第nVBRバッファ記録部21−nに、第1VBRバッファ初期値BRINI 1〜第nVBRバッファ初期値BRINI nを設定し、第1VBR制御部22−1〜第nVBR制御部22−nに、第1目標ビットレートBRobj 1〜第n標ビットレートBRobj n、第1VBR応答速度VBRr1〜第nVBR応答速度VBRrn、および、BRmax とBRmin を設定する。
第1VBRバッファ記録部21−1と第1VBR制御部22−1との間〜第nVBRバッファ記録部21−nと第nVBR制御部22−nとの間にはそれぞれ第1VBRバッファ値VBRb1〜第nVBRバッファ値VBRbnが授受される。
もちろん、制御回路10Bからは、符号化画像の難易度に応じて適切に設定された、第1目標ビットレートBRobj 1〜第n標ビットレートBRobj nが第1VBR制御部22−1〜第nVBR制御部22−nに設定される。その結果、第1VBR制御部22−1〜第nVBR制御部22−nからは第1VBR量子化スケールVBRq 1〜第nVBR量子化スケールVBRq nが、第2Qスケール比較部25Cに出力される。
Modified Embodiment of Second Embodiment The types of target bit rate BR obj are not limited to the two described above.
For example, as illustrated in FIG. 19, n variable coding bit rate (VBR)
Between the first VBR buffer recording unit 21-1 and the first VBR control unit 22-1, and between the nth VBR buffer recording unit 21-n and the nVBR control unit 22-n, the first VBR buffer value VBRb1 to the nth VBR, respectively. Buffer value VBRbn is exchanged.
Of course, the control circuit 10B, which is appropriately set according to the degree of difficulty in encoding image, a first target
図20は第2Qスケール比較部25Cの処理の概要を示すフローチャートである。
第2Qスケール比較部25Cは、複数の量子化しきい値Qth1〜Qthn-1を参照して、図16を参照して述べたQスケール比較部25Bと同様の比較判断処理を行う。それにより、可変ビットレートとして適切な量子化スケールVBRq が選択される。
第1Qスケール比較部25Aは、図11および図16に図解した方法と同様の比較判断処理を行う。
本実施の形態によるビットレートは、図18(B)において、目標ビットレートBRobjを複数設けた場合になる。
FIG. 20 is a flowchart showing an outline of processing of the second Q scale comparison unit 25C.
The 2Q scale comparing unit 25C refers to the plurality of
The first Q
The bit rate according to the present embodiment is a case where a plurality of target bit rates BR obj are provided in FIG.
1…画像符号化装置
10…制御回路、20…エンコーダ(符号化装置)、30…画像入力装置
20…エンコーダ(符号化装置)
21…VBRバッファ記録部
22…VBR制御部
23A …最大CBR制御部
2311…GOP割り当てビット量演算部
2312…GOP残りビット量バッファ
2313…TM5ステップ1演算部
2314…TM5ステップ2演算部
23B …最小CBR制御部
2321…GOP割り当てビット量演算部
2322…GOP残りビット量バッファ
2323…TM5ステップ1演算部
2324…TM5ステップ2演算部
24…圧縮符号化部
212 …符号化制御部
25…量子化スケール比較部
25A …第1Qスケール比較部
25B,25C …第2Qスケール比較部
1. Image encoding device
10 ... Control circuit, 20 ... Encoder (encoding device), 30 ... Image input device
20 ... Encoder (encoding device)
21 ... VBR buffer recording section
22 ... VBR controller
23A: Maximum CBR controller
2311 ... GOP allocation bit amount calculation unit
2312 ... GOP remaining bit amount buffer
2313 ...
2314 ... TM5 Step 2 operation unit
23B ... Minimum CBR control unit
2321 ... GOP allocated bit amount calculation unit
2322 ... GOP remaining bit amount buffer
2323 ...
2324 ... TM5 Step 2 operation unit
24: Compression encoding unit
212 ... Coding control unit
25 ... Quantization scale comparator
25A 1st Q scale comparison part
25B, 25C ... 2nd Q scale comparison part
Claims (4)
上記符号化対象の画像信号を可変ビットレート方式で符号化するときの上記与えられた上記複数の目標ビットレートを達成するため、第1画像処理単位において上記画像信号の符号化難易度に応じて変化する複数の第1量子化スケールを算出する第1量子化スケール算出手段と、
上記符号化対象の画像信号を固定ビットレート方式で符号化するとき、上記与えられた最大のビットレートを越えないように、上記第1画像処理単位より小さい第2画像処理単位において、第2量子化スケールを算出する第2量子化スケール算出手段と、
上記符号化対象の画像信号を固定ビットレート方式で符号化するとき、上記符号化対象の画像信号に応じて上記与えられた最小のビットレートを下回らないように、上記第1画像処理単位より小さい第3画像処理単位において第3量子化スケールを算出する第3量子化スケール算出手段と、
上記第1量子化スケールと上記第2量子化スケールとを比較して大きいほうの量子化スケールを選択し、該選択した量子化スケールと上記第3量子化スケールとを比較して小さい量子化スケールを選択する量子化スケール選択手段と、
上記量子化スケール選択手段によって選択された上記量子化スケールを用いて、上記符号化対象の画像信号に対して符号化処理を行う符号化手段と
を有し、
上記第1量子化スケールを算出する上記第1量子化スケール算出手段に、上記符号化対象の画像信号を可変ビットレート方式で符号化するときの符号化難易度に応じた上記与えられた複数の目標のビットレートおよび量子化しきい値が設定され、
上記第1量子化スケール算出手段は上記設定された複数の目標のビットレートそれぞれを達成するため、上記第1画像処理単位において複数の第1量子化スケールを算出し、
上記量子化スケール選択手段は、少なくとも、
上記複数の第1量子化スケールのうち第1の量子化スケールと上記量子化しきい値のうち当該第1の量子化スケールに対応する第1の量子化しきい値とを比較して小さいほうを第1の値として選択し、当該選択した第1の値と上記複数の第1量子化スケールのうち第2の量子化スケールとを比較して大きいほうを第2の値として選択し、
上記選択した第2の値と上記第2量子化スケール算出手段で算出した上記第2量子化スケールとを比較して大きいほうを第3の値として選択し、当該選択した第3の値と上記第3量子化スケール算出手段で算出した上記第3量子化スケールとを比較して小さいほうを第4の値として選択する、
ことを行い、
最終的に選択した上記第4の値を上記符号化手段に出力する、
画像符号化装置。 Image coding that encodes an image signal to be encoded by a response bit rate, a plurality of target bit rates, a maximum bit rate, and a minimum bit rate, which are given from an external device, using a variable bit rate method and a constant bit rate method. A device,
To achieve the above given above SL plurality of target bit rate when encoding an image signal of the coding target at a variable bit rate system, according to the coding difficulty of the image signal in the first image processing unit First quantization scale calculation means for calculating a plurality of first quantization scales that change
When the image signal to be encoded is encoded by the fixed bit rate method, the second quantum processing unit is smaller than the first image processing unit so as not to exceed the given maximum bit rate. A second quantization scale calculating means for calculating a quantization scale;
When the image signal to be encoded is encoded by a fixed bit rate method, it is smaller than the first image processing unit so as not to fall below the minimum bit rate given according to the image signal to be encoded. Third quantization scale calculating means for calculating a third quantization scale in a third image processing unit;
A larger quantization scale is selected by comparing the first quantization scale and the second quantization scale, and a smaller quantization scale is compared by comparing the selected quantization scale with the third quantization scale. A quantization scale selection means for selecting
Coding means for performing a coding process on the image signal to be coded using the quantization scale selected by the quantization scale selection means;
To the first quantization scale calculating means for calculating said first quantization scale, the given plurality of was in accordance with the coding difficulty when encoding an image signal of the coding target at a variable bit rate system target bit rate and the amount of Coca threshold is set,
The first quantization scale calculation means calculates a plurality of first quantization scales in the first image processing unit in order to achieve each of the set target bit rates.
The quantization scale selection means is at least:
The smaller one by comparing the first quantization thresholds corresponding to the first quantization scale of the first quantization scale and the quantization thresholds of the plurality of first quantization scale first select a value of 1, select the greater by comparing the second quantization scale of the first value and the plurality of first quantization scale and the selected as the second value,
The greater by comparing the second amount coca scale calculated by the second value and the second quantization scale calculation unit described above selects selected as the third value, the third value obtained by the selected selecting smaller as the fourth value is compared with the third quantization scale calculated in the third quantization scale calculation means,
Doing
Outputting the finally selected fourth value to the encoding means;
Image encoding device.
請求項1に記載の画像符号化装置。 The encoding means encodes an input image signal based on the MPEG2 standard using the fourth value finally selected by the quantization scale selection means.
The image encoding device according to claim 1.
上記符号化対象の画像信号を可変ビットレート方式で符号化するときの上記与えられた上記複数の目標ビットレートを達成するため、第1画像処理単位において上記画像信号の符号化難易度に応じて変化する複数の第1量子化スケールを算出する第1量子化スケール算出工程と、
上記符号化対象の画像信号を固定ビットレート方式で符号化するとき、上記与えられた最大のビットレートを越えないように、上記第1画像処理単位より小さい第2画像処理単位において、第2量子化スケールを算出する第2量子化スケール算出工程と、
上記符号化対象の画像信号を固定ビットレート方式で符号化するとき、上記符号化対象の画像信号に応じて上記与えられた最小のビットレートを下回らないように、上記第1画像処理単位より小さい第3画像処理単位において第3量子化スケールを算出する第3量子化スケール算出工程と、
上記第1量子化スケールと上記第2量子化スケールとを比較して大きいほうの量子化スケールを選択し、該選択した量子化スケールと上記第3量子化スケールとを比較して小さい量子化スケールを選択する量子化スケール選択工程と、
上記量子化スケール選択工程によって選択された上記量子化スケールを用いて、上記符号化対象の画像信号に対して符号化処理を行う符号化工程と
を有し、
上記第1量子化スケールを算出する上記第1量子化スケール算出工程において、上記符号化対象の画像信号を可変ビットレート方式で符号化するときの符号化難易度に応じた上記与えられた複数の目標のビットレートおよび量子化しきい値が設定され、
上記第1量子化スケール算出工程において上記設定された複数の目標のビットレートそれぞれを達成するため、上記第1画像処理単位において複数の第1量子化スケールを算出し、
上記量子化スケール選択工程において、少なくとも、
上記複数の第1量子化スケールのうち第1の量子化スケールと上記量子化しきい値のうち当該第1の量子化スケールに対応する第1の量子化しきい値とを比較して小さいほうを第1の値として選択し、当該選択した第1の値と上記複数の第1量子化スケールのうち第2の量子化スケールとを比較して大きいほうを第2の値として選択し、
上記選択した第2の値と上記第2量子化スケール算出工程で算出した上記第2量子化スケールとを比較して大きいほうを第3の値として選択し、当該選択した第3の値と上記第3量子化スケール算出工程で算出した上記第3量子化スケールとを比較して小さいほうを第4の値として選択する、
ことを行い、
最終的に選択した上記第4の値を上記符号化工程において用いる、
画像符号化方法。 Image coding that encodes an image signal to be encoded by a response bit rate, a plurality of target bit rates, a maximum bit rate, and a minimum bit rate, which are given from an external device, using a variable bit rate method and a constant bit rate method. A method,
To achieve the above given above SL plurality of target bit rate when encoding an image signal of the coding target at a variable bit rate system, according to the coding difficulty of the image signal in the first image processing unit A first quantization scale calculating step of calculating a plurality of first quantization scales that change
When the image signal to be encoded is encoded by the fixed bit rate method, the second quantum processing unit is smaller than the first image processing unit so as not to exceed the given maximum bit rate. A second quantization scale calculating step for calculating a quantization scale;
When the image signal to be encoded is encoded by a fixed bit rate method, it is smaller than the first image processing unit so as not to fall below the minimum bit rate given according to the image signal to be encoded. A third quantization scale calculating step of calculating a third quantization scale in a third image processing unit;
A larger quantization scale is selected by comparing the first quantization scale and the second quantization scale, and a smaller quantization scale is compared by comparing the selected quantization scale with the third quantization scale. A quantization scale selection step of selecting
An encoding step of performing an encoding process on the image signal to be encoded using the quantization scale selected by the quantization scale selection step;
Oite to the first quantization scale calculation step of calculating the first quantization scale, given above in accordance with the coding difficulty when encoding an image signal of the coding target at a variable bit rate system bit rate and the amount Coca threshold of the plurality of targets are set,
In order to achieve each of the plurality of target bit rates set in the first quantization scale calculation step, a plurality of first quantization scales are calculated in the first image processing unit,
In the quantization scale selection step, at least,
More smaller than the first quantization thresholds corresponding to the first quantization scale of the first quantization scale and the upper SL amount Coca threshold among the plurality of first quantization scale was selected as the first value, it selects the greater by comparing the second quantization scale of the first value and the plurality of first quantization scale and the selected as the second value,
The greater by comparing the second amount coca scale calculated by the second value and the second quantization scale calculation step of the above selected selected as the third value, the third value obtained by the selected selecting smaller as the fourth value is compared with the third amount Coca scale calculated above Symbol third quantization scale calculation step,
Doing
The finally selected fourth value is used in the encoding step.
Image coding method.
請求項3に記載の画像符号化方法。 In the encoding step, the input image signal is encoded based on the MPEG2 standard using the fourth value finally selected in the quantization scale selection step.
The image encoding method according to claim 3.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005039602A JP4604757B2 (en) | 2004-10-29 | 2005-02-16 | Image coding apparatus and image coding method |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004316414 | 2004-10-29 | ||
JP2005039602A JP4604757B2 (en) | 2004-10-29 | 2005-02-16 | Image coding apparatus and image coding method |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006157853A JP2006157853A (en) | 2006-06-15 |
JP4604757B2 true JP4604757B2 (en) | 2011-01-05 |
Family
ID=36635530
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005039602A Expired - Fee Related JP4604757B2 (en) | 2004-10-29 | 2005-02-16 | Image coding apparatus and image coding method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4604757B2 (en) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000287210A (en) * | 1999-03-31 | 2000-10-13 | Nec Ic Microcomput Syst Ltd | Method and unit for compressing image |
WO2000065842A1 (en) * | 1999-04-23 | 2000-11-02 | Sony Corporation | Image encoder and its method |
-
2005
- 2005-02-16 JP JP2005039602A patent/JP4604757B2/en not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000287210A (en) * | 1999-03-31 | 2000-10-13 | Nec Ic Microcomput Syst Ltd | Method and unit for compressing image |
WO2000065842A1 (en) * | 1999-04-23 | 2000-11-02 | Sony Corporation | Image encoder and its method |
Also Published As
Publication number | Publication date |
---|---|
JP2006157853A (en) | 2006-06-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100343352B1 (en) | Two-pass encoding method of digital motion video sequences for constant-or variable bit rate | |
JP4256574B2 (en) | Image signal encoding method and image signal encoding apparatus | |
EP1372113B1 (en) | Variable bit rate video encoding method and device | |
JP4706104B2 (en) | Image encoding apparatus and method | |
US8345744B2 (en) | Image compression system with coding quantity control | |
US6823008B2 (en) | Video bitrate control method and device for digital video recording | |
US8948242B2 (en) | Encoding device and method and multimedia apparatus including the encoding device | |
WO2000018137A1 (en) | Frame-level rate control for video compression | |
KR100790149B1 (en) | Rate control of scene-changed video encoder | |
JP3907875B2 (en) | Coding rate control device and information coding device | |
JP3259702B2 (en) | Moving picture variable bit rate coding apparatus and method | |
JP4362795B2 (en) | Video encoding apparatus and method | |
JP2004328150A (en) | Moving picture coding apparatus and method | |
JP4604757B2 (en) | Image coding apparatus and image coding method | |
JP3889552B2 (en) | Code amount allocation apparatus and method | |
JP2007116655A (en) | Moving picture coding apparatus | |
JP2009017127A (en) | Coding device and coding method | |
JP3918208B2 (en) | Video data compression apparatus and method | |
JP4079530B2 (en) | Video coding method and apparatus with variable bit rate | |
JP3852442B2 (en) | Data encoding method and apparatus | |
JP2007053788A (en) | Video data compression apparatus and method thereof | |
US20050207501A1 (en) | Method of and system for video bit allocation for scene cuts and scene changes | |
JP2007104558A (en) | Image processing apparatus | |
JP4293112B2 (en) | Image coding apparatus and method | |
EP1944980A2 (en) | Bit rate control algorithm |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070731 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20090424 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090507 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090706 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20091208 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100201 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100706 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100812 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100907 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100920 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131015 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |