JP2005176169A - Video coding method and apparatus - Google Patents
Video coding method and apparatus Download PDFInfo
- Publication number
- JP2005176169A JP2005176169A JP2003416086A JP2003416086A JP2005176169A JP 2005176169 A JP2005176169 A JP 2005176169A JP 2003416086 A JP2003416086 A JP 2003416086A JP 2003416086 A JP2003416086 A JP 2003416086A JP 2005176169 A JP2005176169 A JP 2005176169A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- unit
- quantization
- transform
- video
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
本発明は、映像信号の高能率符号化等に用いる映像の符号化に関する。 The present invention relates to video encoding used for high-efficiency encoding of video signals.
映像信号のディジタル化に伴い、映像信号を高能率符号化して記録または伝送する技術が重要となってきている(例えば、特許文献1参照)。この高能率符号化技術のひとつに、映像信号をブロック化して直交変換し、高域成分をより大きな量子化幅で量子化する等の方法でデータ量を削減する直交変換符号化がある。さらに、ブロックを直交変換した時の周波数成分の振幅の違いを用いて各ブロックの量子化幅に重み付けを行うことで、ブロックノイズが発生しても視覚的に目立たない複雑な絵柄、つまり大振幅の周波数成分を含むブロックを積極的に量子化する技術がある。これにより、ブロックノイズが目立つ平坦な絵柄のブロックを保護できる。 With the digitization of video signals, a technique for recording or transmitting video signals with high-efficiency encoding has become important (see, for example, Patent Document 1). As one of the high-efficiency encoding techniques, there is orthogonal transform coding that reduces the amount of data by a method such as blocking a video signal and performing orthogonal transform, and quantizing a high frequency component with a larger quantization width. In addition, by weighting the quantization width of each block using the difference in amplitude of frequency components when orthogonally transforming the block, a complex picture that is not visually noticeable even when block noise occurs, that is, a large amplitude There is a technique for positively quantizing a block including a frequency component. Thereby, the block of the flat pattern where block noise is conspicuous can be protected.
図4は、従来の映像符号化装置400の構成を示すブロック図である。映像符号化装置400は、ブロック毎に量子化幅に重み付けし直交変換符号化を行う。映像符号化装置400は、入力端子401と、直交変換部402と、最大値検出部403と、分類部404と、初期量子化部405と、量子化選択部406と、量子化部407と、符号化部408と、出力端子409とを備えている。
FIG. 4 is a block diagram showing a configuration of a conventional
以下、各構成要素の動作を説明する。直交変換部402は入力端子401から入力される映像信号を直交変換し、周波数成分を示すmビット長の変換係数を出力する。最大値検出部403は、この変換係数の絶対値振幅の最大値Amを検出する。分類部404は、所定の閾値で区切った複数の領域のうち、最大値Amがどの領域に属するかを判断してクラス分け(分類)を行う。例えば、3個の閾値A0、A1、A2(A0<A1<A2)を設定した場合、最大値は、下記の表1
に示す4つのクラス0〜3のいずれかに属する。
Hereinafter, the operation of each component will be described. The
Belongs to one of the four classes 0 to 3.
閾値A2を(m−1)ビットで表すことができる値に設定することで、Am<A2を満たすブロックに属する変換係数は、すべて(m−1)ビットで表すことができる。よって、mビットの最上位ビットをスライス、すなわち切り捨てて(m−1)ビットのビット長に変換する。また、クラス3に分類されたブロックは、大振幅の周波数成分を含む、ブロックノイズの目立ちにくい映像であるため、他のクラスよりも大きな量子化幅で量子化を行っても視覚上の影響は少ない。そこで、前もってmビットから(m−1)ビットに量子化することができる。図5は、変換係数を所定数のビットに制限する様子を示す図である。図5の例では、変換係数が1ビットの符号ビット(図中の記号s)と9ビットのデータ部(図中の数値を記載した部分)で構成された場合を示す。なお、上述の「最上位ビット」とは、9ビットのデータ部の最上位ビットを表す。初期量子化部405(図4)は、変換係数から、クラス3の場合には符号ビットとデータ部の上位8ビットを選択し、それ以外のクラス(クラス0、クラス1およびクラス2)の場合には符号ビットとデータ部の下位8ビットを選択することで、変換係数を所定ビット長に制限する。
By setting the threshold value A2 to a value that can be represented by (m−1) bits, all transform coefficients belonging to a block satisfying Am <A2 can be represented by (m−1) bits. Therefore, the most significant bit of m bits is sliced, that is, truncated, and converted to a bit length of (m−1) bits. In addition, blocks classified as
再び図4を参照して、量子化選択部406は、符号化後のデータが所定の値以下となるような量子化幅を決定する。このとき、分類部404の出力するクラス分け情報に従って、下記の表2に示すように、クラスによって選択する量子化幅にオフセットを持たせる。周波数成分の振幅の大きなブロックほど大きな量子化幅で量子化を行うためである。
Referring to FIG. 4 again,
表2の数値は、量子化部407で量子化を行う際の除数を示す。クラス3のブロックは、すでに初期量子化部405において量子化がなされている。よって、初期量子化部405と量子化部407を合わせた全体の量子化幅は、下記の表3に示すように、クラス3の除数がさらに大きくなる。
The numerical values in Table 2 indicate divisors when the
ここで、例えばクラス0のブロックとクラス1のブロックの符号後の総データ量を所定量以下する場合、クラス1のブロックはクラス0のブロックに対して2倍の除数で割られるため、周波数成分の振幅の大きいクラス1のブロックに割り当てるデータ量を抑制し、周波数成分の振幅の小さいクラス0のブロックに割り当てるデータ量を保護できる。 Here, for example, when the total amount of data after coding of a class 0 block and a class 1 block is equal to or less than a predetermined amount, the class 1 block is divided by a divisor twice as large as the class 0 block. The amount of data allocated to a class 1 block having a large amplitude can be suppressed, and the amount of data allocated to a class 0 block having a small frequency component amplitude can be protected.
量子化部407は量子化選択部406が決定した量子化幅で(m−1)ビットに制限された変換係数を量子化する。量子化部407からの出力は、符号化部408で符号語に変換され出力端子409より出力される。
The
このようにクラス分けにより変換係数を(m−1)ビットに制限することで、量子化選択部406、量子化部407及び符号化部408のビット精度が(m−1)ビットに対応しておけばよくなり、回路の規模を小さくできる。また、周波数成分の振幅の小さいブロックに関しては余分な量子化が行われず、演算の精度を落とすことなく(m−1)ビットの回路資源で符号化することが可能となる。
しかしながら、従来の映像符号化装置400は、有効ビット数の異なる複数の入力映像信号を同時に取り扱うことができない。その結果、類似の機能を有する回路を二重に持ち、符号化されたデータを切り換える必要がある。これでは、回路規模および消費電力の増加を招く可能性がある。
However, the conventional
一方で、回路規模を小さくするために単に回路を共有化してしまうと、各ブロックの量子化幅に不適切な重み付けがなされるおそれがある。具体的には、時間的に前後する参照映像と入力映像の差分を取った信号は、元の画像が平坦な画像であれば、ブロックを直交変換した時の周波数成分の振幅が大きくなる。しかし、周波数成分の振幅が大きいブロックにおいてブロックノイズが発生しても、そのブロックは視覚的に目立たない絵柄とは言えない。 On the other hand, if the circuit is simply shared in order to reduce the circuit scale, the quantization width of each block may be inappropriately weighted. Specifically, the signal obtained by taking the difference between the reference video and the input video that are temporally different from each other has a large amplitude of the frequency component when the block is orthogonally transformed if the original image is a flat image. However, even if block noise occurs in a block having a large frequency component amplitude, the block cannot be said to be a visually inconspicuous picture.
本発明の目的は、回路規模を増加させることなく、有効ビット数の異なる信号を扱うことのできる映像符号化を実現することである。また別の目的は、視覚的にブロックノイズの目立ちにくい映像符号化を実現しつつ、回路を共有化することである。 An object of the present invention is to realize video coding capable of handling signals having different effective bit numbers without increasing the circuit scale. Another object is to share a circuit while realizing video coding in which block noise is hardly noticeable visually.
本発明による映像符号化方法は、有効ビット長の異なる複数の信号が多重化された映像信号を受け取るステップと、受け取った前記映像信号から前記複数の信号の各々を取り出して直交変換し、各々の変換係数を出力するステップと、所定の閾値に基づいて、前記変換係数を分類するステップと、分類された前記変換係数ごとに、前記変換係数のビット長を所定のビット長に変換してビット長を制限するステップと、前記所定のビット長に変換された変換係数を量子化するステップと、量子化された前記変換係数を符号化するステップとを含み、これにより上記目的が達成される。 A video encoding method according to the present invention includes a step of receiving a video signal in which a plurality of signals having different effective bit lengths are multiplexed, taking out each of the plurality of signals from the received video signal, and performing orthogonal transform, A step of outputting a transform coefficient; a step of classifying the transform coefficient based on a predetermined threshold; and a bit length by converting the bit length of the transform coefficient into a predetermined bit length for each of the classified transform coefficients , The step of quantizing the transform coefficient converted to the predetermined bit length, and the step of encoding the quantized transform coefficient, thereby achieving the above object.
前記変換するステップは、前記変換係数のビット長を所定の量子化幅で量子化して所定のビット長に変換するステップであってもよい。
前記分類するステップは、所定の閾値と、前記変換係数の絶対値の最大値とに基づいて行われてもよい。
前記所定の閾値は、有効ビット長の異なる前記複数の信号ごとに設けられ、前記所定の量子化幅は、有効ビット長の異なる前記複数の信号ごとに異なっていてもよい。
The step of converting may be a step of quantizing the bit length of the conversion coefficient with a predetermined quantization width and converting it to a predetermined bit length.
The classifying step may be performed based on a predetermined threshold and a maximum absolute value of the conversion coefficient.
The predetermined threshold may be provided for each of the plurality of signals having different effective bit lengths, and the predetermined quantization width may be different for each of the plurality of signals having different effective bit lengths.
前記分類するステップは、前記第1の信号の変換係数に対しては、該変換係数の全てを対象として分類を行い、前記第2の信号の変換係数に対しては、該変換係数のうち、DC値を含まないAC値の変換係数を対象として分類を行うステップであってもよい。
複数の信号が多重化された前記映像信号は、時間的に前後する参照映像と入力映像との差分をとった第1の信号と、入力映像を表す第2の信号とを含み、前記変換するステップは、前記第1の信号に対しては、前記変換係数の分類毎の量子化幅を略一致させ、前記第2の信号に対しては、絶対値の最大値が大きい前記変換係数の分類ほど量子化幅を大きくしてもよい。
The classifying step classifies the conversion coefficients of the first signal with respect to all the conversion coefficients, and the conversion coefficients of the second signal include: It may be a step of performing classification for AC value conversion coefficients that do not include DC values.
The video signal in which a plurality of signals are multiplexed includes a first signal that takes a difference between a reference video that is temporally mixed and an input video, and a second signal that represents the input video, and is converted. The step substantially matches the quantization width for each classification of the transform coefficient for the first signal, and classifies the transform coefficient having a large absolute value for the second signal. The quantization width may be increased.
前記量子化するステップは、前記第1の信号の変換係数に対しては、該変換係数の全てを対象として量子化を行い、前記第2の信号の変換係数に対しては、該変換係数のうち、DC値を含まないAC値の変換係数を対象として量子化を行うステップであってもよい。 The quantization step performs quantization for all the transform coefficients of the first signal, and transforms the transform coefficient of the second signal with respect to the transform coefficient of the second signal. Of these steps, quantization may be performed on a conversion coefficient of an AC value that does not include a DC value.
本発明による映像符号化装置は、有効ビット長の異なる複数の信号が多重化された映像信号を受け取る入力端子と、入力端子において受け取った前記映像信号から、前記複数の信号の各々を取り出して直交変換し、各々の変換係数を出力する直交変換部と、所定の閾値に基づいて、直交変換部から出力された前記変換係数を分類する分類部と、分類部により分類された前記変換係数ごとに、前記変換係数のビット長を所定のビット長に変換してビット長を制限する初期量子化部と、初期量子化部によって前記所定のビット長に変換された変換係数を量子化する量子化部と、量子化部により量子化された前記変換係数を符号化する符号化部とを含み、これにより上記目的が達成される。 The video encoding apparatus according to the present invention includes an input terminal for receiving a video signal in which a plurality of signals having different effective bit lengths are multiplexed, and taking out each of the plurality of signals from the video signal received at the input terminal. For each of the transform coefficients classified by the classifying unit, the classifying unit that classifies the transform coefficients output from the orthogonal transform unit based on a predetermined threshold, and the orthogonal transform unit that converts and outputs each transform coefficient An initial quantization unit that converts the bit length of the transform coefficient to a predetermined bit length to limit the bit length, and a quantization unit that quantizes the transform coefficient converted to the predetermined bit length by the initial quantization unit And an encoding unit that encodes the transform coefficient quantized by the quantization unit, thereby achieving the above object.
初期量子化部は、前記変換係数のビット長を所定の量子化幅で量子化して所定のビット長に変換してもよい。
直交変換部から出力された前記変換係数の絶対値の最大値を検出する最大値検出部をさらに備え、分類部は、所定の閾値と、最大値検出部により検出された前記変換係数の絶対値の最大値とに基づいて前記変換係数を分類してもよい。
The initial quantization unit may quantize the bit length of the transform coefficient with a predetermined quantization width and convert it to a predetermined bit length.
A maximum value detecting unit that detects a maximum value of the absolute value of the transform coefficient output from the orthogonal transform unit; the classifying unit includes a predetermined threshold and the absolute value of the transform coefficient detected by the maximum value detecting unit; The conversion coefficient may be classified based on the maximum value of.
前記所定の閾値は、有効ビット長の異なる前記複数の信号ごとに設けられ、前記所定の量子化幅は、有効ビット長の異なる前記複数の信号ごとに異なっていてもよい。
前記分類部は、前記第1の信号の変換係数に対して、該変換係数の全てを対象として分類を行う第1分類部と、前記第2の信号の変換係数に対して、該変換係数のうち、DC値を含まないAC値の変換係数を対象として分類を行う第2分類部とを有していてもよい。
The predetermined threshold may be provided for each of the plurality of signals having different effective bit lengths, and the predetermined quantization width may be different for each of the plurality of signals having different effective bit lengths.
The classification unit includes: a first classification unit that performs classification on all of the conversion coefficients of the first signal; and a conversion coefficient of the conversion coefficient of the second signal. Of these, a second classification unit that performs classification on an AC value conversion coefficient that does not include a DC value may be included.
複数の信号が多重化された前記映像信号は、時間的に前後する参照映像と入力映像との差分をとった第1の信号と、入力映像を表す第2の信号とを含み、初期量子化部は、前記第1の信号に対しては、前記変換係数の分類毎の量子化幅を略一致させ、前記第2の信号に対しては、絶対値の最大値が大きい前記変換係数の分類ほど量子化幅を大きくしてもよい。 The video signal in which a plurality of signals are multiplexed includes a first signal that takes a difference between a reference video that is temporally mixed and an input video, and a second signal that represents the input video, and an initial quantization The unit substantially matches the quantization width for each classification of the transform coefficient for the first signal, and classifies the transform coefficient having a large absolute value for the second signal. The quantization width may be increased.
量子化部は、前記第1の信号の変換係数に対して、該変換係数の全てを対象として量子化を行い、前記第2の信号の変換係数に対して、該変換係数のうち、DC値を含まないAC値の変換係数を対象として量子化を行ってもよい。 The quantization unit quantizes all the transform coefficients for the transform coefficient of the first signal, and the DC value of the transform coefficients for the transform coefficient of the second signal. Quantization may be performed on a conversion coefficient of an AC value that does not include the.
本発明によれば、有効ビット長の違う映像信号に対して別々の分類部を設け、変換係数のビット長を所定ビット長に制限した。これにより、その後の処理は当該所定のビット長に収まり、回路等を共有化することができる。すなわち、回路規模および消費電力を増加させることなく有効ビット長の違う映像信号の処理を行うことができ、非常に実用的である。 According to the present invention, separate classification units are provided for video signals having different effective bit lengths, and the bit length of the transform coefficient is limited to a predetermined bit length. As a result, the subsequent processing falls within the predetermined bit length, and the circuit and the like can be shared. That is, video signals having different effective bit lengths can be processed without increasing the circuit scale and power consumption, which is very practical.
また、本発明によれば、参照映像と入力映像の差分を取った信号に対して、クラス情報をビット長制限のみに用いるため、初期量子化部および量子化部で行う量子化の総量子化幅がほぼ同一するように量子化部の量子化幅に重み付けを行うことができる。これにより、入力信号の特性に合った量子化を選択することにより画質劣化を抑制することができ、またそれ以降の処理回路等の共有化を図ることができる。よって、回路規模および消費電力の増加が少ない処理が実現できる。 In addition, according to the present invention, since the class information is used only for bit length restriction on the signal obtained by taking the difference between the reference video and the input video, the total quantization of the quantization performed by the initial quantization unit and the quantization unit The quantization width of the quantization unit can be weighted so that the widths are almost the same. As a result, image quality degradation can be suppressed by selecting a quantization that matches the characteristics of the input signal, and the subsequent processing circuits and the like can be shared. Therefore, it is possible to realize processing with little increase in circuit scale and power consumption.
また、本発明によれば、差分を取った信号の場合にDC値を含んだ変換係数について絶対値の最大値を求めてクラス分けを行い符号化を行う。これにより、DC値に使用するデータ量を削減して全体として効率的な符号化を行うことができ、画質を向上できる。 Further, according to the present invention, in the case of a signal having a difference, the maximum value of the absolute value is obtained for the transform coefficient including the DC value, classification is performed, and encoding is performed. As a result, the amount of data used for the DC value can be reduced and efficient overall coding can be performed, and the image quality can be improved.
以下、図面を参照して、本発明の実施の形態を説明する。
(実施の形態1)
図1は、実施の形態1における映像符号化装置100の構成を示すブロック図
である。映像符号化装置100は、入力端子101と、直交変換部102と、最大値検出部103と、第1分類部104と、初期量子化部105と、量子化選択部106と、量子化部107と、符号化部108と、出力端子109と、第2分類部110と、スイッチ111とを備えている。
Embodiments of the present invention will be described below with reference to the drawings.
(Embodiment 1)
FIG. 1 is a block diagram showing a configuration of
以下、映像符号化装置100の各構成要素の動作を説明する。本実施の形態では、有効ビット数の違う信号毎に異なる分類を行い、入力信号とクラス情報から初期量子化を行い変換係数のビット長を所定のビット長に制限する制御を行う。なお、以下では説明を簡単にするため、入力端子101から入力される信号は、有効ビット長が1ビットだけ異なる2種類の信号を多重した映像信号とする。
Hereinafter, the operation of each component of the
直交変換部102は、入力端子101から入力される映像信号を直交変換する。より具体的には、映像信号をなす、多重化された2種類の信号のそれぞれを取り出して直交変換する。そして、それぞれに対応する、周波数成分を示す有効ビット長がmビットおよび(m+1)ビットの変換係数を出力する。最大値検出部103は、この変換係数の絶対値振幅の最大値Amを検出する。第1分類部104は、下記表4に示す3個の閾値A0、A1、A2(A0<A1<A2)を設定する。また第2分類部110は、表5に示す新たな3個の閾値B0、B1、B2(B0<B1<B2)を設定する。
The
第1分類部104および第2分類部110のそれぞれは、所定の閾値で区切った複数の範囲のうち、最大値Amがどの領域に属するかを判断してクラス分け(分類)を行う。すなわち、第1分類部104および第2分類部110によって、2種類のクラス分けが行われる。スイッチ111は、有効ビット長がmビットの場合は第1分類部104の出力を選択し、有効ビット長が(m+1)ビットの場合は第2分類部110の出力を選択して、クラス情報を出力する。
Each of the
実施の形態1では、有効ビット長がmビットのブロックについては、閾値A2を(m−1)ビットで表すことができる値に設定する。クラス3のブロックに対しては(m−1)ビットへの量子化処理を行う。また、クラス3以外のクラス(クラス0、クラス1およびクラス2)のブロックには、初期量子化部105において上位ビットのスライス処理を実施する。これにより、量子化部107への入力を(m−1)ビットに制限できる。
In the first embodiment, for a block having an effective bit length of m bits, the threshold value A2 is set to a value that can be represented by (m−1) bits. For
また、有効ビット長が(m+1)ビットのブロックについては、閾値B1を(m−1)ビットで表すことができる値に設定し、閾値B2をmビットで表すことができる値に設定する。そして、クラス3のブロックに対しては2ビット分の量子化処理を行う。ここでいう2ビット分の量子化処理とは、クラス3のブロックを4(=22)で除算することを表す。また、クラス2のブロックに対しては1ビット分の量子化処理と最上位ビットのスライス処理を行う。1ビット分の量子化処理とは、クラス2のブロックを2(=21)で除算することを表す。クラス2および3以外のクラス(クラス0およびクラス1)には、初期量子化部105において、上位2ビットのスライス処理を行う。これにより、量子化部107への入力を(m−1)ビットに制限、すなわち、変換することができる。
For a block having an effective bit length of (m + 1) bits, the threshold value B1 is set to a value that can be expressed by (m−1) bits, and the threshold value B2 is set to a value that can be expressed by m bits. Then, a 2-bit quantization process is performed on the
図2は、変換係数を所定数のビットに制限する様子を示す図である。図2の例では、変換係数は、1ビットの符号ビット(図中の記号s)と、10ビットのデータ部(図中の数値を記載した部分)とから構成されている。10ビットのデータ部の数値0〜9は、第0ビット〜第9ビットを表す。初期量子化部105(図1)は、この変換係数から、クラス3の場合には符号ビットとデータ部の上位8ビット(第2〜第9ビット)を選択する。クラス2の場合には符号ビットとデータ部の最上位と最下位を除く8ビット(第1〜第8ビット)を選択する。そして、それ以外のクラス(クラス0およびクラス1)については符号ビットとデータ部の下位8ビット(第0〜第7ビット)を選択する。これにより、変換係数を簡単に所定ビット長に変換して、制限できる。
FIG. 2 is a diagram illustrating how the transform coefficient is limited to a predetermined number of bits. In the example of FIG. 2, the transform coefficient is composed of a 1-bit code bit (symbol s in the figure) and a 10-bit data part (a part in which numerical values are shown in the figure). Numerical values 0 to 9 of the 10-bit data portion represent the 0th to 9th bits. In the case of
このように、実施の形態1では、入力信号のビット長の違いに応じて、第1分類部104および第2分類部110を切り換え、初期量子化部105の出力を所定ビット長(ここでは(m−1)ビット)に制限した。これにより、それ以降の処理(量子化選択部106、量子化部107および符号化部108の処理)は、従来利用されてきた構成要素を用いて、(m−1)ビットのビット精度で実行することができる。具体的に説明すると、量子化選択部406は、符号化後のデータが所定の値以下となるような量子化幅を決定する。このとき、スイッチ111を介して得られたクラス分け情報に従って、下記の表6に示すように、クラスによって選択する量子化幅にオフセットを持たせる。周波数成分の振幅の大きなブロックほど大きな量子化幅で量子化を行うためである。
Thus, in the first embodiment, the
表6の数値は、量子化部107で量子化を行う際の除数を示す。クラス3のブロックは、すでに初期量子化部105において量子化がなされている。よって、初期量子化部105と量子化部107を合わせた全体の量子化幅は、下記の表7に示すように、クラス3の除数がさらに大きくなる。
The numerical values in Table 6 indicate divisors when the
ここで、例えばクラス0のブロックとクラス1のブロックの符号後の総データ量を所定量以下する場合、クラス1のブロックはクラス0のブロックに対して2倍の除数で割られるため、周波数成分の振幅の大きいクラス1のブロックに割り当てるデータ量を抑制し、周波数成分の振幅の小さいクラス0のブロックに割り当てるデータ量を保護できる。
量子化部107は量子化選択部106が決定した量子化幅で(m−1)ビットに制限された変換係数を量子化する。量子化部107からの出力は、符号化部108で符号語に変換され出力端子109より出力される。
Here, for example, when the total amount of data after coding of a class 0 block and a class 1 block is equal to or less than a predetermined amount, the class 1 block is divided by a divisor twice as large as the class 0 block. The amount of data allocated to a class 1 block having a large amplitude can be suppressed, and the amount of data allocated to a class 0 block having a small frequency component amplitude can be protected.
The
以上説明したように、ビット長の異なる映像信号が入力される場合でも、複数の分類部を設けて選択的に使用し、初期量子化部105の量子化処理のステップを変更する。これにより、量子化部107の入力信号を所定ビット長に制限することができ、回路の規模を増加させることなく、また周波数成分の振幅の小さいブロックに対する精度を落とすことなく符号化することができる。
As described above, even when video signals having different bit lengths are input, a plurality of classification units are provided and selectively used, and the quantization processing step of the
なお、ここでは第2分類部110の閾値を第1分類部104の閾値と同数の3個としたが、4個以上または、2個といった異なる個数としてもよい。また、閾値A2と閾値B1とを等しい値に設定することで、第1分類部104と第2分類部110の処理を共有化できる。
Here, the threshold value of the
(実施の形態2)
実施の形態2では、映像信号が、時間的に前後する参照映像および入力映像の差分を取った信号と、入力映像の信号とを含む場合に、差分を取らなかった信号の場合には変換係数の振幅幅が大きいクラスほど量子化幅を大きくし、差分を取った信号の場合にはクラス毎の量子化幅を略一致させビット長の制限のみに用いる。また、差分を取った信号の場合にDC値を含んだ変換係数について絶対値の
最大値を求め、量子化を行うことで効率的な符号化を行う。
(Embodiment 2)
In the second embodiment, when the video signal includes a signal obtained by taking a difference between the reference video and the input video that are temporally different from each other and an input video signal, the conversion coefficient is obtained in the case of a signal that has not taken the difference. For a class with a larger amplitude width, the quantization width is increased, and in the case of a signal having a difference, the quantization width for each class is made substantially coincident and used only for limiting the bit length. Further, in the case of a signal having a difference, efficient encoding is performed by obtaining the maximum absolute value of the transform coefficient including the DC value and performing quantization.
図3は、実施の形態2における映像符号化装置300の構成を示すブロック図である。映像符号化装置300は、入力端子301と、直交変換部302と、最大値検出部303と、第1分類部304と、初期量子化部305と、量子化選択部306と、量子化部307と、符号化部308と、出力端子309と、第2分類部310と、スイッチ111と、重み付け部312であると、を備えている。
FIG. 3 is a block diagram showing a configuration of
以下、映像符号化装置300の各構成要素の動作を説明する。
入力端子301には、処理信号が入力される。処理信号とは、入力映像に対して、時間的に前後する適切な参照映像が存在する場合には、参照映像と入力映像との差分を取った信号(以下、差分信号と呼ぶ)をいい、また、適切な参照映像が見つからず差分が取られなかった場合には、入力映像そのもの(以下、イントラ信号と呼ぶ)をいう。処理信号が差分信号の場合、参照映像と入力映像の差分を取ることで有効ビット長が1ビットだけ増加しているものとする。
Hereinafter, the operation of each component of the
A processing signal is input to the
直交変換部302は、入力端子301から入力される処理信号を直交変換して変換係数を出力する。より具体的には、処理信号がイントラ信号の場合には、周波数成分を示す有効ビット長がmビットの変換係数を出力する。処理信号が差分信号の場合には、周波数成分を示す有効ビット長が(m+1)ビットの変換係数を出力する。
The
最大値検出部303は、直交変換部302から出力された変換係数の絶対値振幅の最大値Amを検出する。このとき、処理を行っているブロックが差分信号の場合は、DC値も小さな値を取るため、可変長符号の対象としてDC値を含んだ全変換係数を対象として最大値の検出を行う。ここで、DC値とは、変換係数の中で低周波成分を表す0次の係数をいい、直流値を表す。これに対し、イントラ信号の場合は、DC値を除いた変換係数、すなわちAC値を対象とする。AC値とは、変換係数の中で、比較的高周波成分を表す1次以上の係数をいい、交流値を表す。検出された変換係数の絶対値振幅の最大値Amは、クラス分けを行う際の条件に入れられる。第1分類部304は、上述の表4に示す3個の閾値A0,A1、A2(A0<A1<A2)を設定する。また第2分類部310は、下記の表8に示す新たな2個の閾値C0、C1(C0<C1)を設定する。
The maximum
第1分類部304および第2分類部310のそれぞれは、所定の閾値で区切った複数の領域のうち、最大値Amがどの領域に属するかを判断してクラス分け(分類)を行う。スイッチ311は、処理を行っているブロックがイントラ信号の場合には第1分類部304の出力を選択し、ブロックが差分信号の場合は第2分類部310の出力を選択して、クラス情報を出力する。
Each of the
入力信号がイントラ信号のブロックについては、閾値A2を(m−1)ビットで表すことができる値に設定する。クラス3のブロックに対しては(m−1)ビットへの量子化処理を行う。また、クラス3以外のクラス(クラス0、クラス1およびクラス2)のブロックには、初期量子化部305において上位ビットのスライス処理を実施する。これにより、量子化部307への入力を(m−1)ビットに制限できる。
For a block in which the input signal is an intra signal, the threshold A2 is set to a value that can be represented by (m−1) bits. For
また、入力される信号が差分信号のブロックについては、閾値C0を(m−1)ビットで表すことができる値に設定し、閾値C1をmビットで表すことができる
値に設定する。そして初期量子化部305は、以下の処理を行う。すなわち、クラス2のブロックに対しては2ビット分の量子化処理を行う。クラス1のブロックに対しては1ビット分の量子化処理と最上位ビットのスライス処理を行う。クラス0に対しては上位2ビットのスライス処理を行う。これにより、量子化部307への入力を(m−1)ビットに制限できる。
For a block in which the input signal is a differential signal, the threshold value C0 is set to a value that can be represented by (m−1) bits, and the threshold value C1 is set to a value that can be represented by m bits. Then, the
入力信号が差分信号のブロックについては、大きな振幅の周波数成分を含むブロックノイズの目立ちにくいという特徴があるため、表6に示す各クラスに、オフセットを持った量子化幅を割り当てて量子化を行うことができる。これに対し、入力信号が差分信号のブロックについては、重み付け部112を設ける。そして重み付け部112では、初期量子化部305で行ったビット長を制限するための量子化を相殺するように、表9に示す量子化幅を設定する。
A block having a differential signal as an input signal has a feature that block noise including a frequency component having a large amplitude is not conspicuous. Therefore, quantization is performed by assigning a quantization width having an offset to each class shown in Table 6. be able to. On the other hand, a weighting unit 112 is provided for a block whose input signal is a differential signal. The weighting unit 112 sets the quantization width shown in Table 9 so as to cancel the quantization for limiting the bit length performed by the
このような重み付け部112を設ける理由は、大きな振幅の周波数成分を含むブロックであっても、差分を取る以前の処理信号が、ブロックノイズが発生すると目立ちやすい絵柄である平坦な画像を表す場合があるからである。これにより、初期量子化部305と量子化部307で行う量子化の総量子化幅は表10に示す値となり、各クラスの総量子化幅をほぼ一致させることができる。
The reason for providing such a weighting unit 112 is that, even in a block including a frequency component having a large amplitude, a processed signal before taking a difference may represent a flat image that is a conspicuous pattern when block noise occurs. Because there is. Thereby, the total quantization width of the quantization performed by the
以上のように、実施の形態2では、入力信号が差分信号である場合に、複数の分類部を設けて選択的に使用し、量子化選択部306の量子化幅を切り換える重み付け部312を設けた。これにより、量子化部307の入力信号を所定ビット長に制限することができ、かつ入力信号の種類に適した量子化を行うことができる。
As described above, in the second embodiment, when the input signal is a differential signal, a
なお、ここでは簡単のためにブロック内を一種類の量子化幅で割る場合について説明したが、直交変換後の変換係数の高域成分をより大きな量子化幅で量子化する重み付けを行った場合に適応することもできる。また、初期量子化部305の前にスイッチ311を設けたが、初期量子化までの処理を別の回路を利用して行い、その後にスイッチを設けてもよい。さらに、最大値検出部303においてDC値を対象とする処理に関しては、イントラ信号と差分信号の双方でDC値を含まない変換係数内の最大値を検出し、差分信号の場合にその出力とDC値との大小比較を行う比較部を設けてもよい。
In addition, here, for the sake of simplicity, the case where the inside of a block is divided by one kind of quantization width has been described, but when weighting is performed to quantize the high frequency component of the transform coefficient after orthogonal transformation with a larger quantization width Can also be adapted. In addition, although the
101 入力端子
102 直交変換部
103 最大値検出部
104 第1分類部
105 初期量子化部
106 量子化選択部
107 量子化部
108 符号化部
109 出力端子
110 第2分類部
111 スイッチ
DESCRIPTION OF
Claims (14)
受け取った前記映像信号から前記複数の信号の各々を取り出して直交変換し、各々の変換係数を出力するステップと、
所定の閾値に基づいて、前記変換係数を分類するステップと、
分類された前記変換係数ごとに、前記変換係数のビット長を所定のビット長に変換してビット長を制限するステップと、
前記所定のビット長に変換された変換係数を量子化するステップと、
量子化された前記変換係数を符号化するステップと
を含む、映像符号化方法。 Receiving a video signal in which a plurality of signals having different effective bit lengths are multiplexed;
Extracting each of the plurality of signals from the received video signal, performing orthogonal transform, and outputting each transform coefficient;
Classifying the transform coefficients based on a predetermined threshold;
For each of the classified transform coefficients, converting the bit length of the transform coefficient to a predetermined bit length to limit the bit length;
Quantizing the transform coefficient transformed to the predetermined bit length;
And a method of encoding the quantized transform coefficient.
前記変換するステップは、前記第1の信号に対しては、前記変換係数の分類毎
の量子化幅を略一致させ、前記第2の信号に対しては、絶対値の最大値が大きい前記変換係数の分類ほど量子化幅を大きくする、請求項5に記載の映像符号化方法。 The video signal in which a plurality of signals are multiplexed includes a first signal that takes a difference between a reference video that is temporally mixed and an input video, and a second signal that represents the input video,
The transforming step substantially matches the quantization width for each classification of the transform coefficients for the first signal, and the transform with a large absolute value for the second signal. The video encoding method according to claim 5, wherein the quantization width is increased as the coefficients are classified.
入力端子において受け取った前記映像信号から、前記複数の信号の各々を取り出して直交変換し、各々の変換係数を出力する直交変換部と、
所定の閾値に基づいて、直交変換部から出力された前記変換係数を分類する分類部と、
分類部により分類された前記変換係数ごとに、前記変換係数のビット長を所定のビット長に変換してビット長を制限する初期量子化部と、
初期量子化部によって前記所定のビット長に変換された変換係数を量子化する量子化部と、
量子化部により量子化された前記変換係数を符号化する符号化部と
を含む、映像符号化装置。 An input terminal for receiving a video signal in which a plurality of signals having different effective bit lengths are multiplexed;
From the video signal received at the input terminal, each of the plurality of signals is extracted and orthogonally transformed, and an orthogonal transformation unit that outputs each transformation coefficient;
A classifying unit that classifies the transform coefficient output from the orthogonal transform unit based on a predetermined threshold;
For each transform coefficient classified by the classification unit, an initial quantization unit that converts the bit length of the transform coefficient to a predetermined bit length and limits the bit length;
A quantization unit that quantizes the transform coefficient converted to the predetermined bit length by the initial quantization unit;
And a coding unit that codes the transform coefficient quantized by the quantization unit.
分類部は、所定の閾値と、最大値検出部により検出された前記変換係数の絶対値の最大値とに基づいて前記変換係数を分類する、請求項9に記載の映像符号化装置。 A maximum value detecting unit for detecting a maximum value of the absolute value of the converting unit output from the orthogonal transforming unit;
The video encoding device according to claim 9, wherein the classification unit classifies the transform coefficients based on a predetermined threshold and a maximum absolute value of the transform coefficients detected by the maximum value detection unit.
初期量子化部は、前記第1の信号に対しては、前記変換係数の分類毎の量子化幅を略一致させ、前記第2の信号に対しては、絶対値の最大値が大きい前記変換係数の分類ほど量子化幅を大きくする、請求項12に記載の映像符号化装置。 The video signal in which a plurality of signals are multiplexed includes a first signal that takes a difference between a reference video that is temporally mixed and an input video, and a second signal that represents the input video,
The initial quantization unit substantially matches the quantization width for each classification of the transform coefficients with respect to the first signal, and the transform with a large maximum absolute value for the second signal. The video encoding device according to claim 12, wherein the quantization width is increased as the coefficients are classified.
The quantization unit quantizes all the transform coefficients for the transform coefficient of the first signal, and the DC value of the transform coefficients for the transform coefficient of the second signal. The video encoding apparatus according to claim 12, wherein quantization is performed on a conversion coefficient of an AC value that does not include an image.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003416086A JP2005176169A (en) | 2003-12-15 | 2003-12-15 | Video coding method and apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003416086A JP2005176169A (en) | 2003-12-15 | 2003-12-15 | Video coding method and apparatus |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2005176169A true JP2005176169A (en) | 2005-06-30 |
Family
ID=34735380
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003416086A Pending JP2005176169A (en) | 2003-12-15 | 2003-12-15 | Video coding method and apparatus |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2005176169A (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101375668B1 (en) | 2008-03-17 | 2014-03-18 | 삼성전자주식회사 | Method and apparatus for encoding transformed coefficients and method and apparatus for decoding transformed coefficients |
JP2020088467A (en) * | 2018-11-19 | 2020-06-04 | 株式会社リコー | Encoding device, decoding device, encoding method, decoding method, encoding program, and decoding program |
-
2003
- 2003-12-15 JP JP2003416086A patent/JP2005176169A/en active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101375668B1 (en) | 2008-03-17 | 2014-03-18 | 삼성전자주식회사 | Method and apparatus for encoding transformed coefficients and method and apparatus for decoding transformed coefficients |
JP2020088467A (en) * | 2018-11-19 | 2020-06-04 | 株式会社リコー | Encoding device, decoding device, encoding method, decoding method, encoding program, and decoding program |
JP7259280B2 (en) | 2018-11-19 | 2023-04-18 | 株式会社リコー | Encoding device, encoding method and encoding program |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5343032B2 (en) | Entropy coding to adapt coding between level mode and run length / level mode | |
US7689048B2 (en) | Image encoding apparatus, method, and computer-readable storage medium for encoding a pixel value | |
TWI694712B (en) | Method and apparatus for range derivation in context adaptive binary arithmetic coding | |
CA2452175A1 (en) | Variable length coding method and variable length decoding method | |
JPH06237180A (en) | Method and device for data compression and method and device for data expansion | |
US20110150352A1 (en) | Variable length coding for clustered transform coefficients in video compression | |
EP1946246A2 (en) | Extended amplitude coding for clustered transform coefficients | |
JP2008118307A (en) | Coder, and its control method | |
JP2008510349A (en) | System and method for compressing mixed graphic and video sources | |
US20150264355A1 (en) | Method And Apparatus For Efficient Information Coding | |
US6898322B2 (en) | Coding method, coding apparatus, decoding method and decoding apparatus using subsampling | |
Kuroki et al. | Adaptive arithmetic coding for image prediction errors | |
JP2005176169A (en) | Video coding method and apparatus | |
US6912070B1 (en) | Sub-optimal variable length coding | |
KR101541869B1 (en) | Method for encoding and decoding using variable length coding and system thereof | |
JP4415651B2 (en) | Image encoding apparatus and image decoding apparatus | |
JP2006005478A (en) | Image encoder and image decoder | |
JP4743884B2 (en) | Image coding apparatus and control method thereof | |
JP3232160B2 (en) | Encoding device and method | |
JP2009206907A (en) | Image compression apparatus and image decompression apparatus | |
JP4095454B2 (en) | Data decoding apparatus and data decoding method | |
JP2003333339A (en) | Image encoding apparatus and image encoding method | |
JP5230375B2 (en) | Image coding apparatus and image coding method | |
JP3862590B2 (en) | Image processing apparatus and method, computer program, and computer-readable storage medium | |
Langdon et al. | Characterizing prediction error distributions for lossless image compression |