JP2012080213A - Moving image encoding apparatus, moving image decoding apparatus, moving image encoding method and moving image decoding method - Google Patents
Moving image encoding apparatus, moving image decoding apparatus, moving image encoding method and moving image decoding method Download PDFInfo
- Publication number
- JP2012080213A JP2012080213A JP2010221495A JP2010221495A JP2012080213A JP 2012080213 A JP2012080213 A JP 2012080213A JP 2010221495 A JP2010221495 A JP 2010221495A JP 2010221495 A JP2010221495 A JP 2010221495A JP 2012080213 A JP2012080213 A JP 2012080213A
- Authority
- JP
- Japan
- Prior art keywords
- block
- encoding
- division
- prediction
- coding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
Description
この発明は、動画像を高効率で符号化を行う動画像符号化装置及び動画像符号化方法と、高効率で符号化されている動画像を復号する動画像復号装置及び動画像復号方法とに関するものである。 The present invention relates to a moving image encoding apparatus and moving image encoding method for encoding a moving image with high efficiency, a moving image decoding apparatus and a moving image decoding method for decoding a moving image encoded with high efficiency, and It is about.
例えば、MPEG(Moving Picture Experts Group)や「ITU−T H.26x」などの国際標準映像符号化方式では、映像信号の各フレームをマクロブロックと呼ばれる正方ブロックに均等分割し、マクロブロックの単位で、フレーム内・フレーム間予測処理、予測差分信号に対する直交変換処理(例えば、DCT等)、量子化処理を実施して、エントロピー符号化を行うことによって、最終的な圧縮データとしてビットストリームを得ている。
国際標準方式であるAVC/H.264(ISO/IEC 14496−10|ITU−T H.264)までの方式では、マクロブロックは、輝度信号上で16画素×16ラインのブロックサイズが採用されていたが、このサイズを拡張して、予測対象ブロックや変換ブロックのサイズを適応化させることにより、符号化性能が大きく改善されることが報告されている(以下、非特許文献1,2を参照)。
For example, in an international standard video coding system such as MPEG (Moving Picture Experts Group) or “ITU-T H.26x”, each frame of a video signal is equally divided into square blocks called macroblocks. By performing entropy coding by performing intra-frame / inter-frame prediction processing, orthogonal transform processing (for example, DCT) for the prediction difference signal, and quantization processing, a bit stream is obtained as final compressed data Yes.
AVC / H. Is an international standard system. In the system up to H.264 (ISO / IEC 14496-10 | ITU-T H.264), the macroblock has a block size of 16 pixels × 16 lines on the luminance signal. It has been reported that the encoding performance is greatly improved by adapting the sizes of the prediction target block and the transform block (refer to
従来のマクロブロックサイズの拡張方式では、マクロブロック内を更に分割して、分割ブロック毎に、動きベクトルの検出を行う構成や、直交変換のサイズを適応化させる構成を開示しているが、フレーム内符号化・フレーム間符号化の選択など、符号化モード情報を付与する単位は、図16の四分木分割を用いている。
図16において、「第0階層」と記されている輝度成分で(M0,M0)(右上肩の数字は階層レベルを示している)のサイズを有する符号化ブロックがマクロブロックであり、そのマクロブロックを出発点として、四分木構造で、別途定める所定の深さまで階層的に分割を行うことによって符号化ブロック分割状態を得ている。
四分木分割を行うため、常に、(Mn+1,Mn+1)=(Mn/2,Mn/2)が成立する。
In the conventional macroblock size expansion method, a configuration in which a macroblock is further divided and motion vectors are detected for each divided block, or a configuration in which the orthogonal transform size is adapted is disclosed. The unit for giving the coding mode information such as the selection of the inner coding or the inter-frame coding uses the quadtree division of FIG.
In FIG. 16, a coded block having a size of (M 0 , M 0 ) (the number on the upper right shoulder indicates a layer level) with a luminance component described as “0th layer” is a macroblock, With the macroblock as a starting point, the coded block division state is obtained by performing a hierarchical division to a predetermined depth determined separately in a quadtree structure.
Since quadtree partitioning is performed, (M n + 1 , M n + 1 ) = (M n / 2, M n / 2) always holds.
四分木分割は、分割状態を少ない情報量で表現する目的には適しているが、逆に分割状態が階層的な四分木構造に限定され、そこから逸脱する分割状態を表現することができないという課題を有している。
この分割状態の表現の自由度は、下記の2つの理由により、符号化効率に著しい影響を与える。
Quadtree partitioning is suitable for the purpose of expressing the partitioning state with a small amount of information, but conversely, the partitioning state is limited to a hierarchical quadtree structure and can express a partitioning state that deviates from it. It has a problem that it cannot be done.
The degree of freedom in expressing the divided state has a significant influence on the coding efficiency for the following two reasons.
理由1:分割は、一般的に、最適な予測の方法が異なり、最適な予測パラメータを変更する必要がある場合に発生する。
動きの異なる領域は、分割を行って、それぞれに最適な動きベクトルを求めることによって全体の予測効率を高めることができる。
一方、映像信号では、一般的に、この動きの異なる領域の境界が常に四分木分割の境界に存在することは保証されない。
したがって、分割を四分木分割の境界に制約するようにすると、分割された領域の中のいくつかは、最適な動き予測を行えない可能性がある。
Reason 1: In general, the division occurs when the optimum prediction method is different and the optimum prediction parameter needs to be changed.
By dividing the regions with different motions and obtaining the optimal motion vector for each, it is possible to improve the overall prediction efficiency.
On the other hand, in the video signal, it is generally not guaranteed that the boundary between the regions having different motions is always present at the boundary of the quadtree division.
Therefore, if the division is restricted to the boundary of the quadtree division, there is a possibility that some of the divided areas cannot perform the optimal motion prediction.
理由2:直交変換のブロックサイズを大きく取ることができると、適切な量子化・エントロピー符号化との組み合わせにより、符号化効率を高められることが知られている。
直交変換は、画像信号の電力が低周波領域に集中することを利用して符号化効率を高める手法であるため、ブロック単位で動き予測を行って、予測差分信号を直交変換する場合、変換の結果、不要な高周波成分が発生しないように、動き予測ブロックをまたがって直交変換ブロックを定めることを回避するのが通例である(動き予測ブロックの境界では、一般的に画素変化が不連続となるため、不要な高周波成分が含まれてしまう)。
この考え方を適用すると、直交変換ブロックサイズが動き予測ブロックのサイズに制約を受けてしまって、大きな変換ブロックサイズを適用する機会が制限されてしまうことになる。
Reason 2: It is known that if the block size of the orthogonal transform can be increased, the encoding efficiency can be improved by a combination with appropriate quantization and entropy encoding.
Orthogonal transformation is a technique that improves the coding efficiency by utilizing the power of the image signal concentrated in the low frequency region. Therefore, when motion prediction is performed on a block basis and the prediction difference signal is orthogonally transformed, As a result, it is customary to avoid defining orthogonal transform blocks across motion prediction blocks so that unnecessary high-frequency components do not occur (pixel changes are generally discontinuous at the motion prediction block boundaries). Therefore, unnecessary high-frequency components are included).
When this concept is applied, the orthogonal transform block size is restricted by the size of the motion prediction block, and the opportunity to apply a large transform block size is limited.
従来の動画像符号化装置は以上のように構成されているので、四分木分割を用いれば、分割状態を少ない情報量で表現することができる。しかし、分割状態が階層的な四分木構造に限定されてしまうため、そこから逸脱する分割状態を表現することができない課題があった。
また、四分木分割を用いれば、階層を深くしていくほど、自由度の高いブロック分割状態を記述することができる。しかし、分割状態を表現するには、多くの符号量が必要であり、符号量が増加してしまう課題があった。
Since the conventional moving image coding apparatus is configured as described above, if the quadtree partitioning is used, the partition state can be expressed with a small amount of information. However, since the division state is limited to a hierarchical quadtree structure, there is a problem that it is not possible to express a division state that deviates therefrom.
Further, if quadtree partitioning is used, a block partition state with a higher degree of freedom can be described as the hierarchy is deepened. However, a large amount of code is required to express the division state, and there is a problem that the amount of code increases.
この発明は上記のような課題を解決するためになされたもので、複雑なブロックの分割を実現することができると同時に、少ない符号量で自由度が高い分割状態を表現することができる動画像符号化装置及び動画像符号化方法を得ることを目的とする。
また、この発明は、ビットストリームから少ない符号量で自由度が高い分割状態を表現している情報を復号して、映像信号を再生することができる動画像復号装置及び動画像復号方法を得ることを目的とする。
The present invention has been made to solve the above-described problems, and is capable of realizing complex block division and at the same time expressing a division state having a high degree of freedom with a small code amount. It is an object to obtain an encoding device and a moving image encoding method.
The present invention also provides a moving picture decoding apparatus and a moving picture decoding method capable of decoding information expressing a divided state having a high degree of freedom from a bit stream and reproducing a video signal. With the goal.
この発明に係る動画像符号化装置は、符号化制御手段が、初期ブロックを分割して符号化ブロックを生成する際、四分木分割の分割パターン及び四分木分割では表現できない分割パターンが混在している複数の分割パターンの中から、最も効率がよい分割パターンを選択し、その分割パターンにしたがって符号化ブロックを生成するようにしたものである。 In the moving picture coding apparatus according to the present invention, when the coding control unit divides the initial block and generates the coded block, a mixed pattern of the quadtree partitioning and a split pattern that cannot be expressed by the quadtree partitioning are mixed. The most efficient division pattern is selected from the plurality of division patterns, and an encoded block is generated according to the division pattern.
この発明によれば、符号化制御手段が、初期ブロックを分割して符号化ブロックを生成する際、四分木分割の分割パターン及び四分木分割では表現できない分割パターンが混在している複数の分割パターンの中から、最も効率がよい分割パターンを選択し、その分割パターンにしたがって符号化ブロックを生成するように構成したので、複雑なブロックの分割を実現することができると同時に、少ない符号量で自由度が高い分割状態を表現することができる効果がある。 According to the present invention, when the encoding control means divides the initial block to generate the encoded block, a plurality of divided patterns of quadtree division and division patterns that cannot be expressed by quadtree division are mixed. Since the most efficient division pattern is selected from the division patterns and the encoded block is generated according to the division pattern, it is possible to realize the division of a complicated block and at the same time, the code amount is small. Thus, it is possible to express a divided state with a high degree of freedom.
実施の形態1.
この実施の形態1では、映像の各フレーム画像を入力し、符号化済みの近傍画素からのイントラ予測処理または近接フレーム間で動き補償予測処理を実施することで予測画像を生成し、その予測画像とフレーム画像の差分画像である予測差分信号に対して、直交変換・量子化による圧縮処理を施した後に、可変長符号化を行ってビットストリームを生成する動画像符号化装置と、その動画像符号化装置から出力されるビットストリームを復号する動画像復号装置について説明する。
In the first embodiment, each frame image of a video is input, a prediction image is generated by performing intra prediction processing from an encoded neighboring pixel or motion compensation prediction processing between adjacent frames, and the prediction image A video encoding device that generates a bitstream by performing variable-length coding after compression processing by orthogonal transformation and quantization is performed on a prediction differential signal that is a difference image between a frame image and the video A moving picture decoding apparatus for decoding a bitstream output from an encoding apparatus will be described.
この実施の形態1の動画像符号化装置は、映像信号の空間・時間方向の局所的な変化に適応して、映像信号を多様なサイズの領域に分割してフレーム内・フレーム間適応符号化を行うことを特徴としている。
一般的に映像信号は、空間・時間的に信号の複雑さが局所的に変化する特性を有している。空間的に見ると、ある特定の映像フレーム上では、空や壁などのような比較的広い画像領域中で均一な信号特性を持つ絵柄もあれば、人物や細かいテクスチャを持った絵画など小さい画像領域内で複雑なテクスチャパターンを持つ絵柄も混在することがある。
時間的に見ても、空や壁は局所的に時間方向の絵柄の変化が小さいが、動く人物や物体はその輪郭が時間的に剛体・非剛体の運動をするため、時間的な変化が大きい。
The moving picture coding apparatus according to the first embodiment adapts to local changes in the spatial and temporal directions of a video signal, divides the video signal into regions of various sizes, and performs intraframe / interframe adaptive coding. It is characterized by performing.
In general, a video signal has a characteristic that the complexity of the signal changes locally in space and time. When viewed spatially, on a particular video frame, there are patterns with uniform signal characteristics in a relatively large image area such as the sky and walls, and small images such as people and paintings with fine textures. A pattern having a complicated texture pattern may be mixed in the region.
Even when viewed temporally, the sky and the wall have small changes in the pattern in the time direction locally, but the moving person or object has a rigid or non-rigid motion in time, so the temporal change does not occur. large.
符号化処理は、時間・空間的な予測によって信号電力やエントロピーの小さい予測差分信号を生成することで、全体の符号量を削減するが、予測のためのパラメータをできるだけ大きな画像信号領域に均一に適用できれば、当該パラメータの符号量を小さくすることができる。
一方、時間的・空間的に変化の大きい画像信号パターンに対して、同一の予測パラメータを適用すると、予測の誤りが増えるため、予測差分信号の符号量を削減することができない。
そこで、時間的・空間的に変化の大きい画像信号パターンに対しては、予測対象の領域を小さくして、予測のためのパラメータのデータ量を増やしても予測差分信号の電力・エントロピーを低減するほうが望ましい。
このような映像信号の一般的な性質に適応した符号化を行うため、この実施の形態1の動画像符号化装置では、所定の最大ブロックサイズから階層的に映像信号の領域を分割して、分割領域毎に予測処理や、予測差分の符号化処理を実施するようにしている。
The encoding process reduces the overall code amount by generating a prediction difference signal with small signal power and entropy by temporal and spatial prediction, but the parameters for prediction are made uniform in as large an image signal region as possible. If applicable, the code amount of the parameter can be reduced.
On the other hand, if the same prediction parameter is applied to an image signal pattern having a large temporal and spatial change, the number of prediction differential signals cannot be reduced because prediction errors increase.
Therefore, for image signal patterns with large temporal and spatial changes, the prediction target signal power / entropy is reduced even if the prediction target area is reduced and the amount of parameter data for prediction is increased. Is preferable.
In order to perform coding adapted to the general properties of such a video signal, the moving picture coding apparatus of the first embodiment divides the video signal area hierarchically from a predetermined maximum block size, Prediction processing and prediction difference encoding processing are performed for each divided region.
この実施の形態1の動画像符号化装置が処理対象とする映像信号は、輝度信号と2つの色差信号からなるYUV信号や、ディジタル撮像素子から出力されるRGB信号等の任意の色空間のカラー映像信号のほか、モノクロ画像信号や赤外線画像信号など、映像フレームが水平・垂直2次元のディジタルサンプル(画素)列から構成される任意の映像信号である。
各画素の諧調は8ビットでもよいし、10ビット、12ビットなどの諧調であってもよい。
ただし、以下の説明においては、特に断らない限り、入力される映像信号がYUV信号であるものとする。また、2つの色差成分U,Vが輝度成分Yに対して、サブサンプルされた4:2:0フォーマットの信号であるものとする。
なお、映像の各フレームに対応する処理データ単位を「ピクチャ」と称し、この実施の形態1では、「ピクチャ」は順次走査(プログレッシブスキャン)された映像フレームの信号として説明を行う。ただし、映像信号がインタレース信号である場合、「ピクチャ」は映像フレームを構成する単位であるフィールド画像信号であってもよい。
The video signal to be processed by the moving image coding apparatus according to the first embodiment is a color in an arbitrary color space such as a YUV signal composed of a luminance signal and two color difference signals, or an RGB signal output from a digital image sensor. In addition to the video signal, the video frame is an arbitrary video signal such as a monochrome image signal or an infrared image signal, in which the video frame is composed of a horizontal and vertical two-dimensional digital sample (pixel) sequence.
The gradation of each pixel may be 8 bits, or may be gradation such as 10 bits or 12 bits.
However, in the following description, it is assumed that the input video signal is a YUV signal unless otherwise specified. In addition, it is assumed that the two color difference components U and V are subsampled 4: 2: 0 format signals with respect to the luminance component Y.
The processing data unit corresponding to each frame of the video is referred to as “picture”. In the first embodiment, “picture” is described as a signal of a video frame that has been sequentially scanned (progressive scan). However, when the video signal is an interlace signal, the “picture” may be a field image signal which is a unit constituting a video frame.
図1は、この発明の実施の形態1による動画像符号化装置を示す構成図である。
図1において、符号化制御部1はイントラ予測処理(フレーム内予測処理)又は動き補償予測処理(フレーム間予測処理)が実施される際の処理単位となる符号化ブロックの最大サイズ(初期ブロックのサイズ)を決定するとともに、最大サイズの符号化ブロックが階層的に分割される際の上限の階層数を決定する処理を実施する。
また、符号化制御部1は利用可能な1以上の符号化モード(1以上のイントラ符号化モード、1以上のインター符号化モード)の中から、階層的に分割される各々の符号化ブロックに適する符号化モードを選択する処理を実施する。
また、符号化制御部1は各々の符号化ブロック毎に、差分画像が圧縮される際に用いられる量子化パラメータ及び変換ブロックサイズを決定するとともに、予測処理が実施される際に用いられるイントラ予測パラメータ又はインター予測パラメータを決定し、その量子化パラメータ及び変換ブロックサイズを含む予測差分符号化パラメータを変換・量子化部7、逆量子化・逆変換部8及び可変長符号化部13に出力し、そのイントラ予測パラメータをイントラ予測部4及び可変長符号化部13に出力し、そのインター予測パラメータを動き補償予測部5及び可変長符号化部13に出力する処理を実施する。
また、符号化制御部1は最大サイズの符号化ブロックの分割状態を示す最大符号化ブロック分割状態記述情報を可変長符号化部13に出力する処理を実施する。
なお、符号化制御部1は符号化制御手段を構成している。
FIG. 1 is a block diagram showing a moving picture coding apparatus according to
In FIG. 1, the
In addition, the
In addition, the
In addition, the
The
ブロック分割部2は入力画像を示す映像信号を入力すると、その映像信号が示す入力画像を符号化制御部1により決定された最大サイズの符号化ブロックに分割するとともに、符号化制御部1により決定された上限の階層数に至るまで、その符号化ブロックを階層的に分割する処理を実施する。なお、ブロック分割部2はブロック分割手段を構成している。
When the video signal indicating the input image is input, the
切替スイッチ3は符号化制御部1により選択された符号化モードがイントラ符号化モードであれば、ブロック分割部2により分割された符号化ブロックをイントラ予測部4に出力し、符号化制御部1により選択された符号化モードがインター符号化モードであれば、ブロック分割部2により分割された符号化ブロックを動き補償予測部5に出力する処理を実施する。
イントラ予測部4は切替スイッチ3からブロック分割部2により分割された符号化ブロックを受けると、フレーム内の符号化済みの画像信号を用いて、符号化制御部1から出力されたイントラ予測パラメータに基づいて、その符号化ブロックに対するフレーム内予測処理を実施することで予測画像を生成する処理を実施する。
If the coding mode selected by the
When the
動き補償予測部5はブロック分割部2により分割された符号化ブロックに適する符号化モードとして、符号化制御部1によりインター符号化モードが選択された場合、動き補償予測フレームメモリ12により格納されている1フレーム以上の参照画像を用いて、符号化制御部1から出力されたインター予測パラメータに基づいて、その符号化ブロックに対する動き補償予測処理を実施することで予測画像を生成する処理を実施する。
なお、切替スイッチ3、イントラ予測部4及び動き補償予測部5から予測画像生成手段が構成されている。
When the inter coding mode is selected by the
The changeover switch 3, the
減算部6はブロック分割部2により分割された符号化ブロックから、イントラ予測部4又は動き補償予測部5により生成された予測画像を減算することで、差分画像(=符号化ブロック−予測画像)を生成する処理を実施する。なお、減算部6は差分画像生成手段を構成している。
変換・量子化部7は符号化制御部1から出力された予測差分符号化パラメータに含まれている変換ブロックサイズ単位で、減算部6により生成された差分画像の変換処理(例えば、DCT(離散コサイン変換)や、予め特定の学習系列に対して基底設計がなされているKL変換等の直交変換処理)を実施するとともに、その予測差分符号化パラメータに含まれている量子化パラメータを用いて、その差分画像の変換係数を量子化することで、量子化後の変換係数を差分画像の圧縮データとして出力する処理を実施する。なお、変換・量子化部7は画像圧縮手段を構成している。
The subtracting
The transform /
逆量子化・逆変換部8は符号化制御部1から出力された予測差分符号化パラメータに含まれている量子化パラメータを用いて、変換・量子化部7から出力された圧縮データを逆量子化し、その予測差分符号化パラメータに含まれている変換ブロックサイズ単位で、逆量子化の圧縮データの逆変換処理(例えば、逆DCT(逆離散コサイン変換)や、逆KL変換等の逆変換処理)を実施することで、逆変換処理後の圧縮データを局所復号予測差分信号として出力する処理を実施する。
The inverse quantization /
加算部9は逆量子化・逆変換部8から出力された局所復号予測差分信号とイントラ予測部4又は動き補償予測部5により生成された予測画像を示す予測信号を加算することで、局所復号画像を示す局所復号画像信号を生成する処理を実施する。
イントラ予測用メモリ10はイントラ予測部4により次回のイントラ予測処理で用いられる画像として、加算部9により生成された局所復号画像信号が示す局所復号画像を格納するRAMなどの記録媒体である。
The adding
The intra prediction memory 10 is a recording medium such as a RAM that stores a local decoded image indicated by the local decoded image signal generated by the adding
ループフィルタ部11は加算器9により生成された局所復号画像信号に含まれている符号化歪みを補償し、符号化歪み補償後の局所復号画像信号が示す局所復号画像を参照画像として動き補償予測フレームメモリ12に出力する処理を実施する。
動き補償予測フレームメモリ12は動き補償予測部5により次回の動き補償予測処理で用いられる参照画像として、ループフィルタ部11によるフィルタリング処理後の局所復号画像を格納するRAMなどの記録媒体である。
The loop filter unit 11 compensates for the coding distortion included in the locally decoded image signal generated by the
The motion compensated
可変長符号化部13は変換・量子化部7から出力された圧縮データと、符号化制御部1から出力された符号化モード、予測差分符号化パラメータ及び最大符号化ブロック分割状態記述情報(最大サイズの符号化ブロックの分割状態を示す情報)と、イントラ予測部4から出力されたイントラ予測パラメータ又は動き補償予測部5から出力されたインター予測パラメータとを可変長符号化して、その圧縮データ、符号化モード、予測差分符号化パラメータ、最大符号化ブロック分割状態記述情報、イントラ予測パラメータ/インター予測パラメータの符号化データが多重化されているビットストリームを生成する処理を実施する。なお、可変長符号化部13は可変長符号化手段を構成している。
The variable
図2はこの発明の実施の形態1による動画像復号装置を示す構成図である。
図2において、可変長復号部51はビットストリームに多重化されている符号化データから最大サイズの符号化ブロックの分割状態を示す最大符号化ブロック分割状態記述情報を可変長復号して、最大サイズの符号化ブロックが階層的に分割されて生成されている符号化ブロックを特定し、そのビットストリームに多重化されている符号化データから上記符号化ブロックに係る圧縮データ、符号化モード、予測差分符号化パラメータ、イントラ予測パラメータ/インター予測パラメータを可変長復号して、その圧縮データ及び予測差分符号化パラメータを逆量子化・逆変換部55に出力するとともに、その符号化モード及びイントラ予測パラメータ/インター予測パラメータを切替スイッチ52に出力する処理を実施する。
なお、可変長復号部51は可変長復号手段を構成している。
2 is a block diagram showing a moving picture decoding apparatus according to
In FIG. 2, the variable
The variable
切替スイッチ52は可変長復号部51から出力された符号化ブロックに係る符号化モードがイントラ符号化モードである場合、可変長復号部51から出力されたイントラ予測パラメータをイントラ予測部53に出力し、その符号化モードがインター符号化モードである場合、可変長復号部51から出力されたインター予測パラメータを動き補償予測部54に出力する処理を実施する。
The
イントラ予測部53はフレーム内の復号済みの画像信号を用いて、切替スイッチ52から出力されたイントラ予測パラメータに基づいて、符号化ブロックに対するフレーム内予測処理を実施することで予測画像を生成する処理を実施する。
The
動き補償予測部54は動き補償予測フレームメモリ59により格納されている1フレーム以上の参照画像を用いて、切替スイッチ52から出力されたインター予測パラメータに基づいて、符号化ブロックに対する動き補償予測処理を実施することで予測画像を生成する処理を実施する。
なお、切替スイッチ52、イントラ予測部53及び動き補償予測部54から予測画像生成手段が構成されている。
The motion
The
逆量子化・逆変換部55は可変長復号部51から出力された予測差分符号化パラメータに含まれている量子化パラメータを用いて、可変長復号部51から出力された符号化ブロックに係る圧縮データを逆量子化し、その予測差分符号化パラメータに含まれている変換ブロックサイズ単位で、逆量子化の圧縮データの逆変換処理(例えば、逆DCT(逆離散コサイン変換)や、逆KL変換等の逆変換処理)を実施することで、逆変換処理後の圧縮データを復号予測差分信号(圧縮前の差分画像を示す信号)として出力する処理を実施する。なお、逆量子化・逆変換部55は差分画像生成手段を構成している。
The inverse quantization /
加算部56は逆量子化・逆変換部55から出力された復号予測差分信号とイントラ予測部53又は動き補償予測部54により生成された予測画像を示す予測信号を加算することで、復号画像を示す復号画像信号を生成する処理を実施する。なお、加算部56は復号画像生成手段を構成している。
イントラ予測用メモリ57はイントラ予測部53により次回のイントラ予測処理で用いられる画像として、加算部56により生成された復号画像信号が示す復号画像を格納するRAMなどの記録媒体である。
The
The
ループフィルタ部58は加算器56により生成された復号画像信号に含まれている符号化歪みを補償し、符号化歪み補償後の復号画像信号が示す復号画像を参照画像として動き補償予測フレームメモリ59に出力する処理を実施する。
動き補償予測フレームメモリ59は動き補償予測部54により次回の動き補償予測処理で用いられる参照画像として、ループフィルタ部58によるフィルタリング処理後の復号画像を格納するRAMなどの記録媒体である。
The
The motion compensated
図1では、動画像符号化装置の構成要素である符号化制御部1、ブロック分割部2、切替スイッチ3、イントラ予測部4、動き補償予測部5、減算部6、変換・量子化部7、逆量子化・逆変換部8、加算部9、ループフィルタ部11及び可変長符号化部13のそれぞれが専用のハードウェア(例えば、CPUを実装している半導体集積回路、あるいは、ワンチップマイコンなど)で構成されているものを想定しているが、動画像符号化装置がコンピュータで構成される場合、符号化制御部1、ブロック分割部2、切替スイッチ3、イントラ予測部4、動き補償予測部5、減算部6、変換・量子化部7、逆量子化・逆変換部8、加算部9、ループフィルタ部11及び可変長符号化部13の処理内容を記述しているプログラムを当該コンピュータのメモリに格納し、当該コンピュータのCPUが当該メモリに格納されているプログラムを実行するようにしてもよい。
図3はこの発明の実施の形態1による動画像符号化装置の処理内容を示すフローチャートである。
In FIG. 1, a
FIG. 3 is a flowchart showing the processing contents of the moving picture coding apparatus according to
図2では、動画像復号装置の構成要素である可変長復号部51、切替スイッチ52、イントラ予測部53、動き補償予測部54、逆量子化・逆変換部55、加算部56及びループフィルタ部58のそれぞれが専用のハードウェア(例えば、CPUを実装している半導体集積回路、あるいは、ワンチップマイコンなど)で構成されているものを想定しているが、動画像復号装置がコンピュータで構成される場合、可変長復号部51、切替スイッチ52、イントラ予測部53、動き補償予測部54、逆量子化・逆変換部55、加算部56及びループフィルタ部58の処理内容を記述しているプログラムを当該コンピュータのメモリに格納し、当該コンピュータのCPUが当該メモリに格納されているプログラムを実行するようにしてもよい。
図5はこの発明の実施の形態1による動画像復号装置の処理内容を示すフローチャートである。
In FIG. 2, a variable
FIG. 5 is a flowchart showing the processing contents of the moving picture decoding apparatus according to
次に動作について説明する。
最初に、図1の動画像符号化装置の処理内容を説明する。
まず、符号化制御部1は、イントラ予測処理(フレーム内予測処理)又は動き補償予測処理(フレーム間予測処理)が実施される際の処理単位となる符号化ブロックの最大サイズを決定するとともに、最大サイズの符号化ブロックが階層的に分割される際の上限の階層数を決定する(図3のステップST1)。
Next, the operation will be described.
First, the processing contents of the moving picture encoding apparatus in FIG. 1 will be described.
First, the
符号化ブロックの最大サイズの決め方として、例えば、全てのピクチャに対して、入力画像の解像度に応じたサイズに決定する方法が考えられる。
また、入力画像の局所的な動きの複雑さの違いをパラメータとして定量化しておき、動きの激しいピクチャでは最大サイズを小さな値に決定し、動きが少ないピクチャでは最大サイズを大きな値に決定する方法などが考えられる。
上限の階層数については、例えば、入力画像の動きが激しい程、階層数を深くして、より細かい動きが検出できるように設定し、入力画像の動きが少なければ、階層数を抑えるように設定する方法が考えられる。
As a method of determining the maximum size of the encoded block, for example, a method of determining a size corresponding to the resolution of the input image for all the pictures can be considered.
In addition, the difference in complexity of local motion of the input image is quantified as a parameter, and the maximum size is determined to be a small value for pictures with intense motion, and the maximum size is determined to be a large value for pictures with little motion. And so on.
The upper limit of the number of hierarchies is set so that, for example, the more the input image moves, the deeper the number of hierarchies, so that finer motion can be detected. A way to do this is conceivable.
また、符号化制御部1は、利用可能な1以上の符号化モード(M種類のイントラ符号化モード、N種類のインター符号化モード)の中から、階層的に分割される各々の符号化ブロックに適する符号化モードを選択する(ステップST2)。
符号化制御部1は、符号化モードを選択する際、利用可能な全ての符号化モードないし、そのサブセットの中から、各々の符号化ブロックに対して最も符号化効率がよい符号化モードを選択するが、符号化制御部1による符号化モードの選択方法の詳細は後述する。
In addition, the
When selecting a coding mode, the
また、符号化制御部1は、各々の符号化ブロック毎に、差分画像が圧縮される際に用いられる量子化パラメータ及び変換ブロックサイズを決定するとともに、予測処理が実施される際に用いられるイントラ予測パラメータ又はインター予測パラメータを決定する。
また、符号化制御部1は、最大サイズの符号化ブロックの分割状態を示す最大符号化ブロック分割状態記述情報(詳細は後述する)を生成する。
符号化制御部1は、その量子化パラメータ及び変換ブロックサイズを含む予測差分符号化パラメータを変換・量子化部7、逆量子化・逆変換部8及び可変長符号化部13に出力し、その最大符号化ブロック分割状態記述情報を可変長符号化部13に出力する。
In addition, the
Also, the
The
ブロック分割部2は、入力画像を示す映像信号を入力すると、その映像信号が示す入力画像を符号化制御部1により決定された最大サイズの符号化ブロックに分割するとともに、符号化制御部1により決定された上限の階層数に至るまで、その符号化ブロックを階層的に分割する。
ここで、図7は最大サイズの符号化ブロックが階層的に複数の符号化ブロックに分割される様子を示す説明図である。
図7の例では、n=0のときの最大符号化ブロックは、第0階層の符号化ブロックB0であり、輝度成分で(L0,M0)のサイズを有している。
また、図7の例では、最大符号化ブロックB0を出発点(=第0階層)として、8つの分割パターンへの分割をサポートすることを特徴としている。
図7では、各パターンに対して、SP1〜SP8という識別番号が付与されている。後述する符号化制御部1による符号化モードの選択処理において、パターン識別番号が、最大符号化ブロック分割状態記述情報の一部として可変長符号化部13に出力される。
When a video signal indicating an input image is input, the
Here, FIG. 7 is an explanatory diagram showing a state in which a maximum-size encoded block is hierarchically divided into a plurality of encoded blocks.
In the example of FIG. 7, the maximum coding block when n = 0 is the coding block B 0 of the 0th layer, and has a size of (L 0 , M 0 ) as a luminance component.
Further, the example of FIG. 7 is characterized in that the division into eight division patterns is supported with the maximum coding block B 0 as the starting point (= 0th layer).
In FIG. 7, identification numbers SP1 to SP8 are assigned to the patterns. In a coding mode selection process by the
SP1は従来例に示している四分木構造のパターンである。
その他のパターンは、四分木構造では表現できない符号化ブロックの定義を可能とするものであり、各パターンの実線で囲まれるブロックが符号化ブロックである。点線で示した非正方領域の扱いは後述する。
SP2は最大符号化ブロックの水平の中心部、SP3は最大符号化ブロックの垂直の中心部で、(Ln+1,Mn+1)=(Ln/2,Mn/2)が成立するサイズの符号化ブロックを割り当てるパターンである。
SP4は、SP2やSP3でも表現できない符号化ブロックの定義を可能とするものである。これらの分割パターンは、動きのアクティビティや予測差分信号電力が、最大符号化ブロックの中心部に集まるようなケースで効果を奏する。
SP5〜SP8は、最大符号化ブロック内の上下左右いずれかのエリアに特化して、四分木分割よりも効果的な符号化ブロックの定義を行うことを可能とするものである。
SP1 is a quadtree structure pattern shown in the conventional example.
Other patterns make it possible to define coding blocks that cannot be represented by a quadtree structure, and the blocks surrounded by the solid lines of each pattern are coding blocks. The handling of the non-square area indicated by the dotted line will be described later.
SP2 is a horizontal center portion of the maximum coding block, SP3 is a vertical center portion of the maximum coding block, and a code having a size satisfying (L n + 1 , M n + 1 ) = (L n / 2, M n / 2) This is a pattern for assigning generalized blocks.
SP4 enables the definition of a coding block that cannot be expressed by SP2 or SP3. These division patterns are effective in a case where motion activity and prediction differential signal power are concentrated at the center of the maximum coding block.
SP5 to SP8 make it possible to define a coding block that is more effective than quadtree partitioning by specializing in one of the top, bottom, left, and right areas in the maximum coding block.
符号化ブロックを(Ln+1,Mn+1)=(Ln/2,Mn/2)のサイズに限定することにより、四分木構造のSP1と同様に、直交変換の処理単位を2のべき乗を一辺とする正方ブロックに限定しつつ、各階層で最大の変換ブロックサイズを確保できるとともに、分割のパターン数を限定することができる。
これらの選択可能な分割パターン数を増加させることによって、符号化ブロックの割り当ての最適性を高めることができる一方、動画像符号化装置側で最適なパターンを選ぶための処理負荷が増大する。
図7のような限定された分割パターンの定義を用いることにより、符号化性能と符号化処理負荷のバランスに優れた符号化を行うことができる。
By limiting the encoding block to the size of (L n + 1 , M n + 1 ) = (L n / 2, M n / 2), the orthogonal transform processing unit is raised to a power of 2 as in the case of the quadtree SP1. The maximum transform block size can be ensured in each layer while limiting to square blocks with one side as a side, and the number of division patterns can be limited.
By increasing the number of selectable division patterns, it is possible to improve the optimality of encoding block allocation, while increasing the processing load for selecting an optimal pattern on the moving image encoding device side.
By using the definition of the limited division pattern as shown in FIG. 7, it is possible to perform encoding with a good balance between encoding performance and encoding processing load.
なお、動画像符号化装置の構成の複雑化や処理負荷の増大を伴うが、符号化効率の向上を優先して、符号化ブロックサイズのバリエーションを長方形形状まで増やして、図7より多くの分割パターンを表現するように構成してもよい。
その場合、最大の変換ブロックサイズについては、符号化ブロックを四分木構造のSP1による符号化ブロックと共有可能な最大変換ブロックサイズの倍数で構成するようにすれば、直交変換の処理単位を2のべき乗を一辺とする正方ブロックに統一して変換・量子化処理に係る装置の複雑化を抑えることができる。
もちろん、装置構成の複雑化を前提とするが、長方形の任意の符号化ブロックに対応するサイズの変換ブロックサイズを新たに定義して対応するように構成してもよい。
Although the configuration of the moving image coding apparatus is complicated and the processing load is increased, the coding block size variation is increased to a rectangular shape in order to prioritize the improvement of coding efficiency, and more divisions than in FIG. You may comprise so that a pattern may be expressed.
In this case, with regard to the maximum transform block size, if the encoded block is configured with a multiple of the maximum transform block size that can be shared with the quadrature-structured SP1 encoded block, the orthogonal transform processing unit is 2 Therefore, it is possible to reduce the complexity of the apparatus related to the transformation / quantization processing by unifying the square block having a power of one side.
Of course, although it is premised that the device configuration is complicated, a transform block size having a size corresponding to an arbitrary rectangular encoding block may be newly defined and supported.
このような分割パターンを用いて、別途定める分割階層数まで分割を行うことによって符号化ブロックBnを得る。図7のパターンを用いる場合、深さnにおいては、符号化ブロックBnはサイズ(Ln,Mn)の画像領域である。
ただし、LnとMnは同じであってもよいし異なっていてもよいが、図7の例ではLn=Mnのケースを示している。
以降、符号化ブロックBnのサイズは、符号化ブロックBnの輝度成分におけるサイズ(Ln,Mn)と定義し、常に(Ln+1,Mn+1)=(Ln/2,Mn/2)が成立するように構成する。
ただし、RGB信号などのように、全ての色成分が同一サンプル数を有するカラー映像信号(4:4:4フォーマット)では、全ての色成分のサイズが(Ln,Mn)になるが、4:2:0フォーマットを扱う場合、対応する色差成分の符号化ブロックのサイズは(Ln/2,Mn/2)である。
以降、第n階層の符号化ブロックをBnとして、符号化ブロックBnで選択しうる符号化モードをm(Bn)と記載する。
Using such a division pattern, a coded block Bn is obtained by dividing up to the number of division hierarchies determined separately. When the pattern of FIG. 7 is used, at the depth n, the coding block B n is an image area of size (L n , M n ).
However, L n and M n may be the same or different, but the example of FIG. 7 shows a case of L n = M n .
Later, the size of the encoded block B n is the size (L n, M n) in the luminance component of the encoded block B n is defined as always (L n + 1, M n + 1) = (L n / 2, M n / 2) is established.
However, in a color video signal (4: 4: 4 format) in which all color components have the same number of samples, such as RGB signals, the size of all color components is (L n , M n ). When the 4: 2: 0 format is handled, the size of the corresponding color difference component coding block is (L n / 2, M n / 2).
Hereinafter, a coding mode that can be selected by the coding block B n is described as m (B n ), where B n is the coding block of the nth layer.
複数の色成分からなるカラー映像信号の場合、符号化モードm(Bn)は、各色成分ごとに、それぞれ個別のモードを用いるように構成されてもよいが、以降、特に断らない限り、YUV信号、4:2:0フォーマットの符号化ブロックの輝度成分に対する符号化モードのことを指すものとして説明を行う。
符号化モードm(Bn)には、1つないし複数のイントラ符号化モード(総称して「INTRA」)、1つないし複数のインター符号化モード(総称して「INTER」)があり、符号化制御部1は、上述したように、当該ピクチャで利用可能な全ての符号化モードないしは、そのサブセットの中から、符号化ブロックBnに対して最も符号化効率がよい符号化モードを選択する。
In the case of a color video signal composed of a plurality of color components, the encoding mode m (B n ) may be configured to use an individual mode for each color component, but hereinafter, unless otherwise specified, YUV The description will be made on the assumption that it indicates the coding mode for the luminance component of the coding block of the signal 4: 2: 0 format.
The coding mode m (B n ) includes one or more intra coding modes (collectively “INTRA”), one or more inter coding modes (collectively “INTER”), As described above, the
符号化制御部1は、符号化対象となっているピクチャ(カレントピクチャ)の各最大符号化ブロックに対して、図7に示す分割パターンを階層的に選択して、符号化ブロックBnを特定する。
図8は最大符号化ブロックの分割状態の例を示している。
図8の例では、第1階層のレベルで図7の分割パターンのSP2が選択され、第3階層のレベルで図7の分割パターンのSP3が選択されているケースを示している。
図8(a)の点線で囲まれている領域は、符号化ブロックBnとして定義される領域であり、網がけ部分は符号化ブロックBn内で予測処理の単位になるパーティションの分布を示している。
図8(b)は階層分割後のパーティションに符号化モードm(Bn)が割り当てられる状況を4分木グラフで示している。
図8(b)において、□で囲まれている白抜きのノードが、符号化モードm(Bn)が割り当てられたノード(符号化ブロックBn)を示しおり、□で囲まれている黒塗りのノードが、符号化ブロックとは別に後述する方法で符号化される非正方領域を示している。
The
FIG. 8 shows an example of the division state of the maximum coding block.
The example of FIG. 8 shows a case where the division pattern SP2 of FIG. 7 is selected at the level of the first hierarchy, and the division pattern SP3 of FIG. 7 is selected at the level of the third hierarchy.
A region surrounded by a dotted line in FIG. 8A is a region defined as a coding block Bn , and a shaded portion indicates a distribution of partitions that are units of prediction processing in the coding block Bn . ing.
FIG. 8B shows a situation in which the encoding mode m (B n ) is assigned to the partition after hierarchical division in a quadtree graph.
In FIG. 8B, white nodes surrounded by □ indicate nodes (encoded blocks B n ) to which the encoding mode m (B n ) is assigned, and black nodes surrounded by □. A filled node indicates a non-square area that is encoded by a method described later separately from the encoded block.
符号化ブロックBnは、更に1つないし複数の予測処理単位(パーティション)に分割される。
以降、符号化ブロックBnに属するパーティションをPi n(i: 第n階層におけるパーティション番号)と表記する。
符号化ブロックBnに属するパーティションPi nの分割がどのようになされているかは符号化モードm(Bn)の中に情報として含まれる。
パーティションPi nは、すべて符号化モードm(Bn)に従って予測処理が行われるが、パーティションPi n毎に、個別の予測パラメータを選択することができる。
The coding block Bn is further divided into one or more prediction processing units (partitions).
Hereinafter, the partition belonging to the coding block B n is denoted as P i n (i: the partition number in the nth layer).
How the partition P i n belonging to the coding block B n is divided is included as information in the coding mode m (B n ).
All partitions P i n are subjected to prediction processing according to the coding mode m (B n ), but individual prediction parameters can be selected for each partition P i n .
切替スイッチ3は、符号化制御部1が各々の符号化ブロックBnのパーティションPi nに対して最適な符号化モードm(Bn)を選択すると、その符号化モードm(Bn)がイントラ符号化モードであれば(ステップST3)、ブロック分割部2により分割された符号化ブロックBnのパーティションPi nをイントラ予測部4に出力する。
一方、その符号化モードm(Bn)がインター符号化モードであれば(ステップST3)、ブロック分割部2により分割された符号化ブロックBnのパーティションPi nを動き補償予測部5に出力する。
Changeover switch 3, the
On the other hand, if the coding mode m (B n ) is the inter coding mode (step ST 3), the partition P i n of the coding block B n divided by the
イントラ予測部4は、切替スイッチ3から符号化ブロックBnのパーティションPi nを受けると、フレーム内の符号化済みの画像信号を用いて、符号化制御部1から出力されたイントラ予測パラメータに基づいて、その符号化ブロックBnのパーティションPi nに対するフレーム内予測処理を実施することで、イントラ予測画像Pi nを生成する(ステップST4)。
イントラ予測画像Pi nの生成に用いられたイントラ予測パラメータは、例えば、イントラ予測処理が、AVC/H.264規格(ISO/IEC 14496−10)に定められるような方向性を有する適応空間予測を行う場合、各パーティション毎に選択される予測モード情報などの情報を含み、動画像復号装置側でも全く同じイントラ予測画像を生成できるようにするために、後述する可変長符号化部13がイントラ予測パラメータの符号化データをビットストリームに多重化する。
なお、イントラ予測処理は、AVC/H.264規格に定められるアルゴリズムに限定されないが、イントラ予測パラメータとしては、動画像符号化装置と動画像復号装置において、全く同じイントラ予測画像を生成するために必要な情報を含む必要がある。
When the
Intra prediction parameters used to generate the intra prediction image P i n, for example, the intra prediction process, AVC / H. When performing adaptive spatial prediction having directionality as defined in the H.264 standard (ISO / IEC 14496-10), it includes information such as prediction mode information selected for each partition, and is exactly the same on the video decoding device side. In order to be able to generate an intra-predicted image, a variable-
The intra prediction process is performed using AVC / H. Although not limited to the algorithm defined in the H.264 standard, the intra prediction parameter needs to include information necessary for generating exactly the same intra predicted image in the moving image encoding device and the moving image decoding device.
動き補償予測部5は、切替スイッチ3から符号化ブロックBnのパーティションPi nを受けると、動き補償予測フレームメモリ12により格納されている1フレーム以上の参照画像を用いて、符号化制御部1から出力されたインター予測パラメータに基づいて、その符号化ブロックBnのパーティションPi nに対する動き補償予測処理を実施することでインター予測画像Pi nを生成する(ステップST5)。
なお、動き補償予測処理を実施することで予測画像を生成する技術は公知の技術であるため詳細な説明を省略するが、インター予測画像Pi nの生成に用いられたインター予測パラメータには、下記の情報等を含んでいる必要があり、動画像復号装置側でも全く同じイントラ予測画像を生成できるようにするために、後述する可変長符号化部13がインター予測パラメータの符号化データをビットストリームに多重化する。
When the motion
Incidentally, a technique for generating a prediction image by performing motion compensation prediction process and a detailed description thereof will be omitted because it is a known technique, the inter prediction parameters used for generating the inter prediction image P i n is It is necessary to include the following information, etc., and in order to be able to generate exactly the same intra-predicted image on the video decoding device side, the variable-
(1)符号化ブロックBn内のパーティション分割を記述するモード情報
(2)各パーティションの動きベクトル
(3)動き補償予測フレームメモリ12内に複数の参照画像を含む構成の場合、いずれの参照画像を用いて予測処理を行うかを示す参照画像指示インデックス情報
(4)複数の動きベクトル予測値候補がある場合、いずれの動きベクトル予測値を選択して使用するかを示すインデックス情報
(5)複数の動き補償内挿フィルタがある場合、いずれのフィルタを選択して使用するかを示すインデックス情報
(6)当該パーティションの動きベクトルが複数の画素精度(例えば、半画素、1/4画素、1/8画素など)を示すことが可能な場合、いずれの画素精度を使用するかを示す選択情報
(1) Mode information describing partition division in coding block Bn (2) Motion vector of each partition (3) Any reference image in the case of a configuration including a plurality of reference images in the motion compensated
減算部6は、イントラ予測部4又は動き補償予測部5が予測画像(イントラ予測画像Pi n、インター予測画像Pi n)を生成すると、ブロック分割部2により分割された符号化ブロックBnのパーティションPi nから、イントラ予測部4又は動き補償予測部5により生成された予測画像(イントラ予測画像Pi n、インター予測画像Pi n)を減算することで差分画像を生成し、その差分画像を示す予測差分信号ei nを変換・量子化部7に出力する(ステップST6)。
When the
変換・量子化部7は、減算部6から差分画像を示す予測差分信号ei nを受けると、符号化制御部1から出力された予測差分符号化パラメータに含まれている変換ブロックサイズ単位で、その差分画像の変換処理(例えば、DCT(離散コサイン変換)や、予め特定の学習系列に対して基底設計がなされているKL変換等の直交変換処理)を実施するとともに、その予測差分符号化パラメータに含まれている量子化パラメータを用いて、その差分画像の変換係数を量子化することで、量子化後の変換係数を差分画像の圧縮データとして逆量子化・逆変換部8及び可変長符号化部13に出力する(ステップST7)。
Transform and
逆量子化・逆変換部8は、変換・量子化部7から差分画像の圧縮データを受けると、符号化制御部1から出力された予測差分符号化パラメータに含まれている量子化パラメータを用いて、その差分画像の圧縮データを逆量子化し、その予測差分符号化パラメータに含まれている変換ブロックサイズ単位で、逆量子化の圧縮データの逆変換処理(例えば、逆DCT(逆離散コサイン変換)や、逆KL変換等の逆変換処理)を実施することで、逆変換処理後の圧縮データを局所復号予測差分信号ei nハット(電子出願の関係上、アルファベット文字に付いた「^」をハットと表記する)として加算部9に出力する(ステップST8)。
When the inverse quantization /
なお、予測差分符号化パラメータは、符号化ブロックBnの領域毎に、その内部の予測差分信号ei nの符号化に用いる量子化パラメータと変換ブロックサイズの情報を含んでいるが、予測差分符号化パラメータは、上述したように、符号化制御部1により符号化モードm(Bn)が選択される際に決定される。
量子化パラメータは、最大符号化ブロックの単位で一つ割り当て、それらを分割した符号化ブロック単位で共通に使用する形式でもよいし、各符号化ブロック毎に最大符号化ブロックの値からの差分値として表現するようにしてもよい。
変換ブロックサイズは、符号化ブロックBnを起点として、最大符号化ブロックの分割と同様に、四分木分割の表現がされていてもよいし、いくつかの選択可能な変換ブロックサイズがインデックス情報として表現された形式でもよい。
変換・量子化部7及び逆量子化・逆変換部8は、この変換ブロックサイズの情報に基づいて、変換・量子化処理のブロックサイズを特定して処理を行う。この変換ブロックサイズの情報は、符号化ブロックBnではなく、符号化ブロックBnを分割するパーティションPi nを単位として決定するように構成されていてもよい。
Note that the prediction difference encoding parameter includes information on the quantization parameter and transform block size used for encoding the internal prediction difference signal e i n for each region of the encoding block B n. As described above, the encoding parameter is determined when the encoding mode m (B n ) is selected by the
The quantization parameter may be assigned in the unit of the maximum coding block, and may be used in common in the unit of the coding block obtained by dividing them, or the difference value from the value of the maximum coding block for each coding block May be expressed as:
The transform block size may be expressed by quadtree partitioning starting from the coding block Bn as in the case of partitioning the maximum coding block, and some selectable transform block sizes are index information. The format expressed as may be used.
The transform /
加算部9は、逆量子化・逆変換部8から局所復号予測差分信号ei nハットを受けると、その局所復号予測差分信号ei nハットと、イントラ予測部4又は動き補償予測部5により生成された予測画像(イントラ予測画像Pi n、インター予測画像Pi n)を示す予測信号を加算することで、局所復号パーティション画像Pi nハットないしはその集まりとしての局所復号符号化ブロック画像である局所復号画像を生成する(ステップST9)。
加算部9は、局所復号画像を生成すると、その局所復号画像を示す局所復号画像信号をイントラ予測用メモリ10に格納するとともに、その局所復号画像信号をループフィルタ部11に出力する。
When the
When generating the locally decoded image, the adding
ステップST3〜ST9の処理は、階層的に分割された全ての符号化ブロックBnに対する処理が完了するまで繰り返し実施され、全ての符号化ブロックBnに対する処理が完了するとステップST12の処理に移行する(ステップST10,ST11)。 Processing in step ST3~ST9 is repeated until processing of all the coding blocks B n which are hierarchically split is completed, the process proceeds when the processing of all the coding blocks B n completion process in step ST12 (Steps ST10 and ST11).
可変長符号化部13は、変換・量子化部7から出力された圧縮データと、符号化制御部1から出力された符号化モード、予測差分符号化パラメータ及び最大符号化ブロック分割状態記述情報と、イントラ予測部4から出力されたイントラ予測パラメータ又は動き補償予測部5から出力されたインター予測パラメータとをエントロピー符号化する。
可変長符号化部13は、エントロピー符号化の符号化結果である圧縮データ、符号化モード、予測差分符号化パラメータ、最大符号化ブロック分割状態記述情報、イントラ予測パラメータ/インター予測パラメータの符号化データを多重化してビットストリームを生成する(ステップST12)。
The variable
The variable-
図7のSP2〜SP8の点線で示される(Ln/4,Mn/4)ないし(Ln/2,Mn/2)の非正方領域は、以下の(1)〜(3)のように符号化される。
(1)これらの領域については、符号化ブロックとしての再分割は実施しない。即ち、SP1が選択された場合のみ、さらなる再分割を実施できるものとする。
(2)各領域は、それぞれ個別にイントラ・インター予測を行う。
(3)予測差分信号に対する変換・量子化は、領域内を(Ln/4,Mn/4)のブロックサイズに分割して実行する。
It is no (L n / 4, M n / 4) indicated by a dotted line in SP2~
(1) For these areas, subdivision as coding blocks is not performed. That is, it is assumed that further subdivision can be performed only when SP1 is selected.
(2) Each region performs intra / inter prediction individually.
(3) Transformation / quantization for the prediction difference signal is performed by dividing the region into block sizes of (L n / 4, M n / 4).
また、SP2〜SP8の分割パターンを選択する場合は、選択された符号化ブロック領域に符号化すべき情報が集中していることが考えられるので、符号化ブロック以外の図7のSP2〜SP8の点線で示される(Ln/2,Mn/4)ないし(Ln/4,Mn/2)の非正方領域に対しては、予測差分信号の符号化をスキップするモードを設けてもよい。 Further, when selecting the division pattern of SP2 to SP8, it is considered that the information to be encoded is concentrated in the selected encoding block area, and therefore, the dotted lines of SP2 to SP8 in FIG. 7 other than the encoding block. (L n / 2, M n / 4) to (L n / 4, M n / 2) non-square regions indicated by (1) may be provided with a mode for skipping encoding of the prediction difference signal. .
ループフィルタ部11は、加算器9から局所復号画像信号を受けると、その局所復号画像信号に含まれている符号化歪みを補償し、符号化歪み補償後の局所復号画像信号が示す局所復号画像を参照画像として動き補償予測フレームメモリ12に格納する(ステップST13)。
ループフィルタ部11によるフィルタリング処理は、加算器9から出力される局所復号画像信号の最大符号化ブロックあるいは個々の符号化ブロック単位で行ってもよいし、1画面分のマクロブロックに相当する局所復号画像信号が出力された後に1画面分まとめて行ってもよい。
When receiving the locally decoded image signal from the
The filtering process by the loop filter unit 11 may be performed in units of the maximum coding block or individual coding block of the locally decoded image signal output from the
以下、符号化制御部1による符号化モードの選択処理を具体的に説明する。
図4は符号化制御部1による符号化モードの選択処理を示すフローチャートである。
符号化制御部1は、符号化モードを選択する際、カレントピクチャの予測処理に用いる参照画像が動き補償予測フレームメモリ12に格納されているか否かを確認する(ステップST21)。
一般的に、動画像信号は時間方向の冗長度が大きく、局所的に見れば、参照画像とカレントピクチャとの間に絵柄・動きなどについて類似した性質を有することがある。
この実施の形態1では、このことを利用して、カレントピクチャの予測処理に用いる参照画像が動き補償予測フレームメモリ12に格納されていれば、その参照画像が符号化された際に用いられた最大符号化ブロックの分割状態を、カレントピクチャの最大符号化ブロックの分割状態を決定する際の初期状態として用いるか、用いないかを選択できるようにしている。
Hereinafter, the encoding mode selection processing by the
FIG. 4 is a flowchart showing a coding mode selection process by the
When the
In general, a moving image signal has a large degree of redundancy in the time direction, and when viewed locally, a moving image signal may have similar properties between a reference image and a current picture with respect to the pattern and movement.
In the first embodiment, if the reference picture used for the prediction process of the current picture is stored in the motion compensated
図9は最大符号化ブロックの分割状態を決定する際の処理内容を示す説明図である。
図9の例では、カレントピクチャの符号化対象となる最大符号化ブロックをA、時間的に最近傍となる参照画像において、最大符号化ブロックAと同じ空間位置にある最大符号化ブロックをBとしている。
符号化制御部1は、上述したように、符号化モードを選択する際、カレントピクチャの予測処理に用いる参照画像が動き補償予測フレームメモリ12に格納されているか否かを確認する。
符号化制御部1は、カレントピクチャの予測処理に用いる参照画像が動き補償予測フレームメモリ12に格納されている場合、「参照符号化ブロック」を特定する(ステップST22)。
図9の例では、最大符号化ブロックBを「参照符号化ブロック」として特定する。
FIG. 9 is an explanatory diagram showing the processing contents when determining the division state of the maximum coding block.
In the example of FIG. 9, the maximum encoding block to be encoded of the current picture is A, and the maximum encoding block in the same spatial position as the maximum encoding block A in the reference image that is closest in time is B. Yes.
As described above, the
When the reference picture used for the prediction process of the current picture is stored in the motion compensated
In the example of FIG. 9, the maximum coding block B is specified as a “reference coding block”.
次に、符号化制御部1は、参照符号化ブロックBが符号化された際に用いられた分割状態を、最大符号化ブロックAの分割状態を決定する際の初期状態として用いるか否かを決定する(ステップST23)。
この決定方法としては、例えば、最大符号化ブロックAと参照符号化ブロックBの間の絵柄の類似度を表す評価値を計算し、その評価値が所定の閾値以上の類似度である場合に限り、参照符号化ブロックBの分割状態を、最大符号化ブロックAの分割状態を決定する際の初期状態として用いる決定を行う方法が考えられる。
また、参照符号化ブロックBの分割状態に基づいて、最大符号化ブロックAの予測符号化が実施された場合のレート歪コストと、参照符号化ブロックBの分割状態に依存せずに、最大符号化ブロックAの最適な分割状態を決定し、その分割状態に基づいて最大符号化ブロックAの予測符号化が実施された場合のレート歪コストとを比較し、レート歪コストが小さい方を選択する方法が考えられる。
Next, the
As this determination method, for example, an evaluation value representing the similarity of the pattern between the maximum coding block A and the reference coding block B is calculated, and only when the evaluation value is a similarity equal to or higher than a predetermined threshold. A method of determining to use the division state of the reference coding block B as the initial state when determining the division state of the maximum coding block A is conceivable.
In addition, based on the division state of the reference coding block B, the maximum code without depending on the rate distortion cost when the predictive coding of the maximum coding block A is performed and the division state of the reference coding block B. The optimal division state of the coded block A is determined, and the rate distortion cost when the predictive coding of the maximum coding block A is performed based on the division state is compared, and the one with the smaller rate distortion cost is selected. A method is conceivable.
いずれの決定方法を用いる場合でも、符号化制御部1が参照符号化ブロックBの分割状態を利用することができれば、最大符号化ブロックAの分割状態を示す情報の符号量を削減して、効率的に符号化を行うことが可能になる。
この決定は、動画像復号装置でも行う必要があるため、参照符号化ブロックBの分割状態を最大符号化ブロックAの分割状態を決定する際の初期状態として用いるか否かを示す分割初期状態指示情報を最大符号化ブロック分割状態記述情報の一部に含めてビットストリームに多重化する。
Regardless of which determination method is used, if the
Since this determination also needs to be performed by the video decoding device, a division initial state instruction indicating whether or not to use the division state of the reference coding block B as the initial state when determining the division state of the maximum coding block A Information is included in a part of maximum coding block division state description information and multiplexed into a bit stream.
分割初期状態指示情報が「参照符号化ブロックBの分割状態を初期状態とする」ことを示す場合は(ステップST24)、参照符号化ブロックBの分割状態を起点として得られる最終的な分割状態(最大符号化ブロック分割状態記述情報)と、各符号化ブロックBnに対する符号化モードm(Bn)、イントラ予測パラメータ/インター予測パラメータ、予測差分符号化パラメータを決定する(ステップST25)。
このとき、最終的な分割状態は、参照符号化ブロックBの分割状態からの差分情報として伝送する。このような分割状態記述情報を「インター分割状態記述情報」と称する。
When the division initial state instruction information indicates that “the division state of the reference coding block B is set to the initial state” (step ST24), the final division state (starting from the division state of the reference coding block B) ( Maximum coding block division state description information), coding mode m (B n ), intra prediction parameter / inter prediction parameter, and prediction differential coding parameter for each coding block B n are determined (step ST25).
At this time, the final division state is transmitted as difference information from the division state of the reference coding block B. Such division state description information is referred to as “inter division state description information”.
図10はインター分割状態記述情報の一例を示す説明図である。
図10の例では、「四分木分割が実行されている状況」は“1”、「四分木分割が実行されていない状況」は“0”で表れている。
図10の例における参照符号化ブロックBの分割状態を確認すると、第0階層は分割実行“1”であることを表し、第1階層は左上、右上、左下、右下の順序(ジグザグスキャン順)で各符号化ブロックを見ていくと、最初の3つは分割不実行“0”で、右下が分割実行“1”であることを表し、第2階層はすべての符号化ブロックで分割不実行“0”であることを表している。
3階層以上は分割できないことを前提とすると、第0階層は“1”、第1階層は“0001”、第2階層は“0000”である。
同様に、カレントの最大符号化ブロックにおける分割状態については、階層順、ジグザグスキャン順に見ると、第0階層は“1”、第1階層は“0001”、第2階層は“1000”である。
FIG. 10 is an explanatory diagram showing an example of inter division state description information.
In the example of FIG. 10, “situation where quadtree partitioning is being executed” is represented by “1”, and “situation where quadtree partitioning is not being performed” is represented by “0”.
When the division state of the reference encoding block B in the example of FIG. 10 is confirmed, the 0th layer indicates that the division execution is “1”, and the 1st layer is the order of upper left, upper right, lower left, lower right (zigzag scan order ) If you look at each coding block, the first three indicate that the division is not executed “0”, the lower right is the division execution “1”, and the second layer is divided by all the coding blocks This indicates that it is non-execution “0”.
Assuming that three or more layers cannot be divided, the 0th layer is “1”, the 1st layer is “0001”, and the 2nd layer is “0000”.
Similarly, regarding the division state in the current maximum coding block, when viewed in hierarchical order and zigzag scan order, the 0th hierarchy is “1”, the 1st hierarchy is “0001”, and the 2nd hierarchy is “1000”.
参照符号化ブロックBを起点とすることが分かっている場合、第0階層と第1階層は差分がないので、記述情報は不要であり、第2階層についてのみ、差分“1000”−“0000”=“1000”によって、カレント最大符号化ブロックの分割状態を記述することができる。
よく知られているように、分割状態が参照符号化ブロックBの状態に類似している場合は、各階層の差分がゼロ近辺に偏りを生じることや、時間・空間近傍の周辺符号化ブロックの分割状態も加味して適切な条件付発生確率によって適応エントロピー符号化を行うことで、さらに符号量を削減することができる。
When it is known that the reference encoded block B is the starting point, there is no difference between the 0th layer and the 1st layer, so no description information is necessary, and the difference “1000” − “0000” only for the 2nd layer. = “1000” can describe the division state of the current maximum coding block.
As is well known, when the division state is similar to the state of the reference coding block B, the difference of each layer may be biased near zero, or the neighboring coding blocks near the time / space Code amount can be further reduced by performing adaptive entropy coding with an appropriate conditional occurrence probability in consideration of the division state.
あるいは、カレント最大符号化ブロックの分割状態を、参照符号化ブロックBの分割状態からの差分として表現できるパターンを予め定めておき、各パターンについてインデックスを付与して、選択したパターンのインデックスのみを伝送したり、選択パターンからの差分を符号化するように構成してもよい。
ここで、図11はカレント最大符号化ブロックの分割パターンが参照符号化ブロックの状態と大きく異なる状態を示す説明図である。
このような場合、図10のように階層毎に差分を積み上げると、多くの符号を必要とする。
Alternatively, a pattern that can express the division state of the current maximum coding block as a difference from the division state of the reference coding block B is determined in advance, an index is assigned to each pattern, and only the index of the selected pattern is transmitted. Or a difference from the selected pattern may be encoded.
Here, FIG. 11 is an explanatory diagram showing a state where the division pattern of the current maximum coding block is significantly different from the state of the reference coding block.
In such a case, if a difference is accumulated for every hierarchy like FIG. 10, many codes | symbols are required.
そこで、参照符号化ブロックBの分割状態毎に、中間的に選択可能な類似パターンを限定的に定めておき、ここからカレント最大符号化ブロックの分割状態に最も近いパターンを選んで、当該パターンからの差分を符号化するように構成する。
選ばれた中間類似パターンは、インデックスを割り振っておき、そのインデックス情報をインター分割状態記述情報の一部として符号化するようにする(中間類似パターン自体で差分が表現される場合は当該インデックス情報のみを符号化する)。
これにより、参照符号化ブロックBの分割状態と、カレント最大符号化ブロックの分割状態とが広範に異なっていても、効率よく差分を表現できるケースが増え、インター分割状態記述情報の符号化効率を高めることができる。
図12に示すように、カレント最大符号化ブロックの分割状態、参照符号化ブロックの分割状態のいずれも四分木分割で表現される場合でも、この考え方が適用できることは言うまでもない。
Therefore, for each division state of the reference coding block B, a similar pattern that can be selected in an intermediate manner is limited, and a pattern closest to the division state of the current maximum coding block is selected from the pattern. The difference is encoded.
An index is assigned to the selected intermediate similar pattern, and the index information is encoded as a part of the inter-partition state description information (if the intermediate similar pattern itself represents a difference, only the index information is encoded) Is encoded).
As a result, even if the division state of the reference coding block B and the division state of the current maximum coding block are widely different, the number of cases where the difference can be efficiently expressed increases, and the coding efficiency of the inter division state description information is increased. Can be increased.
As shown in FIG. 12, it goes without saying that this idea can be applied even when both the division state of the current maximum coding block and the division state of the reference coding block are expressed by quadtree division.
分割初期状態指示情報が「カレントの最大符号化ブロックで分割状態を決定する」ことを示す場合は(ステップST24)、図3で説明した手順と同様に、参照符号化ブロックBに依存することなく、カレントの最大符号化ブロックに対する分割状態を示す最大符号化ブロック分割状態記述情報、各符号化ブロックBnに対する符号化モードm(Bn)、イントラ予測パラメータ/インター予測パラメータ、予測差分符号化パラメータを決定する(ステップST26)。
このときの分割状態記述情報を「イントラ分割状態記述情報」と称し、インター分割状態記述情報と区別する。
When the division initial state instruction information indicates that “the division state is determined by the current maximum coding block” (step ST24), the procedure does not depend on the reference coding block B as in the procedure described in FIG. , Maximum coding block division state description information indicating a division state for the current maximum coding block, coding mode m (B n ) for each coding block B n , intra prediction parameter / inter prediction parameter, prediction differential coding parameter Is determined (step ST26).
The division state description information at this time is referred to as “intra division state description information” and is distinguished from the inter division state description information.
なお、分割初期状態指示情報が「参照符号化ブロックの分割状態を初期状態とする」ことを示す場合、カレントの最大符号化ブロックの分割状態を参照符号化ブロックの分割状態と同一にするように構成してもよい。
これにより、インター分割状態記述情報は一切符号化する必要がない。
さらに、分割された各符号化ブロックBnで用いる符号化モードm(Bn)も参照符号化ブロックで用いられた情報と同じものを用いるように構成してもよい。この場合、符号化モードm(Bn)についてもビットストリームに多重化する必要がなくなる。
参照画像が存在しない場合は、参照符号化ブロックを定めることができないため、常にイントラ分割状態記述情報を求めて符号化する。
When the division initial state instruction information indicates that “the division state of the reference coding block is set to the initial state”, the division state of the current maximum coding block is set to be the same as the division state of the reference coding block. It may be configured.
Thereby, it is not necessary to encode the inter division state description information at all.
Furthermore, the coding mode m (B n ) used in each divided coding block B n may be configured to use the same information as that used in the reference coding block. In this case, it is not necessary to multiplex the encoding mode m (B n ) into the bit stream.
When there is no reference image, a reference encoding block cannot be determined, so that intra division state description information is always obtained and encoded.
図13及び図14は可変長符号化部13により生成されるビットストリーム(特にスライスレベルのデータ)を示す説明図である。
図13の例では、スライス符号化データがスライスヘッダと、それに続くスライス内の個数分の最大符号化ブロックの符号化データから構成されている様子を示している。
各々の最大符号化ブロックの符号化データは、最大符号化ブロック分割状態記述情報を含み、最大符号化ブロック分割状態記述情報は、分割初期状態指示情報と分割状態記述情報から構成されている。
FIG. 13 and FIG. 14 are explanatory diagrams showing bit streams (especially slice level data) generated by the variable
The example of FIG. 13 shows a state in which the slice encoded data is composed of the slice header and the encoded data of the maximum number of encoded blocks corresponding to the number in the subsequent slice.
The encoded data of each maximum encoded block includes maximum encoded block division state description information, and the maximum encoded block division state description information includes divided initial state instruction information and division state description information.
図示していないが、最大符号化ブロックの符号化データには、このほか、各符号化ブロックBn毎の符号化モードm(Bn)、イントラ予測パラメータ/インター予測パラメータ、予測差分符号化パラメータ、圧縮データ(量子化済み変換係数)を含んでいる。
最大符号化ブロック分割状態記述情報の形式(a)は、イントラ分割状態記述情報を伝送するか、インター分割状態記述情報を伝送するかを選択する形式を示している。
形式(b)は、参照符号化ブロックの状態をそのままカレント最大符号化ブロックの分割状態として用いるようにしてインター分割状態記述情報を一切伝送しないことにするか、イントラ分割状態記述情報を伝送するかを選択する形式を示している。
Although not shown, the encoded data of the maximum encoding block includes, in addition to this, an encoding mode m (B n ) for each encoding block B n , an intra prediction parameter / inter prediction parameter, and a prediction differential encoding parameter. , Including compressed data (quantized transform coefficients).
The format (a) of maximum coding block division state description information indicates a format for selecting whether intra division state description information or inter division state description information is transmitted.
In the format (b), whether the state of the reference coding block is used as it is as the division state of the current maximum coding block and no inter division state description information is transmitted or intra division state description information is transmitted. The format to select is shown.
図14の例では、スライスヘッダに分割初期状態指示情報多重化フラグを含め、このフラグの値に基づいて、各最大符号化ブロックの単位で分割初期状態指示情報を多重するか否かを指定する構成を示している。
映像信号は非定常であるため、状況によっては分割状態に関してピクチャ間の時間相関が非常に低いケースも考えられる(例えば、ランダムな動きが画面全体を支配している場合など)。
そのような場合は、最大符号化ブロックの単位で分割初期状態指示情報を多重して適応的に初期値を決めるよりも、分割初期状態指示情報自体の符号量がオーバヘッドとなってしまう可能性もある。
そこで、スライス等の上位レベルで分割初期状態指示情報を使用するか否かを選択できる仕組みを備える。
これにより、分割初期状態指示情報による参照符号化ブロックの分割状態の参照が有効であるスライスのみ、分割初期状態指示情報を活用した効率的な分割状態の符号化が可能となる。
なお、分割初期状態指示情報多重化フラグはピクチャやシーケンス、GOP(Group Of Pictures)などの単位で定義されるヘッダ情報領域に多重するように構成してもよい。
In the example of FIG. 14, the division initial state indication information multiplexing flag is included in the slice header, and whether or not the division initial state indication information is multiplexed in units of each maximum coding block is specified based on the value of this flag. The configuration is shown.
Since the video signal is non-stationary, there may be a case where the temporal correlation between pictures is very low with respect to the division state (for example, when random motion dominates the entire screen).
In such a case, there is a possibility that the code amount of the divided initial state instruction information itself becomes overhead rather than multiplexing the divided initial state instruction information in units of the maximum coding block and adaptively determining the initial value. is there.
Therefore, a mechanism is provided that can select whether or not to use the divided initial state instruction information at a higher level such as a slice.
As a result, efficient division state encoding using the division initial state indication information can be performed only for slices in which the reference of the division state of the reference coding block by the division initial state indication information is valid.
The division initial state instruction information multiplexing flag may be configured to be multiplexed in a header information area defined in units of pictures, sequences, GOP (Group Of Pictures), and the like.
次に、図2の動画像復号装置の処理内容を説明する。
可変長復号部51は、図1の画像符号化装置から出力されたビットストリームを入力すると、そのビットストリームに対する可変長復号処理を実施して、1枚以上のピクチャから構成されるシーケンス単位あるいはピクチャ単位にピクチャサイズ(水平画素数・垂直ライン数)を規定する情報を復号する(図5のステップST31)。
可変長復号部51は、図1の符号化制御部1と同様の手順で、イントラ予測処理(フレーム内予測処理)又は動き補償予測処理(フレーム間予測処理)が実施される際の処理単位となる符号化ブロックの最大サイズを決定するとともに、最大サイズの符号化ブロック(最大符号化ブロック)が階層的に分割される際の上限の階層数を決定する(ステップST32)。
Next, processing contents of the moving picture decoding apparatus in FIG. 2 will be described.
When the variable
The variable
例えば、動画像符号化装置において、符号化ブロックの最大サイズが、入力画像の解像度に応じて決定されている場合、先に復号しているピクチャサイズに基づいて符号化ブロックの最大サイズを決定する。符号化ブロックの最大サイズ及び上限の階層数を示す情報がビットストリームに多重化されている場合には、そのビットストリームから復号した情報を参照する。
また、可変長復号部51は、最大符号化ブロック単位に、最大符号化ブロック分割状態記述情報に含まれている分割初期状態指示情報に基づいて、最大符号化ブロックの分割状態を復号する。
For example, in the video encoding apparatus, when the maximum size of the encoded block is determined according to the resolution of the input image, the maximum size of the encoded block is determined based on the previously decoded picture size. . When information indicating the maximum size of the encoded block and the upper limit number of layers is multiplexed in the bit stream, the information decoded from the bit stream is referred to.
Further, the variable
以下、最大符号化ブロックの分割状態の復号手順を具体的に説明する。
図6は可変長復号部51による最大符号化ブロックの分割状態の復号手順を示すフローチャートである。
まず、可変長復号部51は、カレントピクチャの復号に際して、カレントピクチャの予測処理に用いる参照画像が動き補償予測フレームメモリ59に格納されているか否かを確認する(ステップST51)。
可変長復号部51は、カレントピクチャの予測処理に用いる参照画像が動き補償予測フレームメモリ59に格納されている場合、図9に示すように、時間的に最近傍の参照画像に含まれ、カレントピクチャの復号対象の最大符号化ブロックと空間的に同じ位置に存在する最大符号化ブロックを参照符号化ブロックに設定する(ステップST52)。
Hereinafter, the decoding procedure of the division state of the maximum coding block will be specifically described.
FIG. 6 is a flowchart showing the decoding procedure of the division state of the maximum coding block by the variable
First, when decoding the current picture, the variable
When the reference picture used for the prediction process of the current picture is stored in the motion compensated
可変長復号部51は、参照符号化ブロックを設定すると、その参照符号化ブロックの最大符号化ブロック分割状態記述情報に含まれている分割初期状態指示情報を復号し(ステップST53)、その分割初期状態指示情報に基づいて、カレント最大符号化ブロックの分割状態を復号する際に、その参照符号化ブロックの分割状態を使用するのか、使用しないのかを判定する(ステップST54)。
即ち、カレント最大符号化ブロックの分割状態を復号する際に、イントラ分割状態記述情報を用いるのか、インター分割状態記述情報を用いるのかを判定する。
When the reference coding block is set, the variable
That is, it is determined whether intra division state description information or inter division state description information is used when decoding the division state of the current maximum coding block.
可変長復号部51は、分割初期状態指示情報が「イントラ分割状態記述情報を用いて分割状態を復号する」ことを示す場合、その分割初期状態指示情報に続いて多重化されているイントラ分割状態記述情報を復号し、そのイントラ分割状態記述情報を参照して、カレント最大符号化ブロックの分割状態を決定する(ステップST55)。
一方、分割初期状態指示情報が「インター分割状態記述情報を用いて分割状態を復号する」ことを示す場合、その分割初期状態指示情報に続いて多重化されているインター分割状態記述情報(参照符号化ブロックの分割状態からの差分情報)を復号し、そのインター分割状態記述情報を参照して、カレント最大符号化ブロックの分割状態を決定する(ステップST56)。
The variable
On the other hand, when the division initial state instruction information indicates “decoding the division state using the inter division state description information”, the inter division state description information (reference code) multiplexed subsequent to the division initial state instruction information (Difference information from the division state of the coded block) is decoded, and the division state of the current maximum coding block is determined with reference to the inter division state description information (step ST56).
インター分割状態記述情報の符号化形式としては、例えば、動画像符号化装置の処理内容の説明でも述べたように、下記の(1)(2)のような形式があり、動画像符号化装置で選択された符号化形式に対応して、可変長復号部51が復号処理を行うように構成している。
(1)分割階層毎の差分情報を適応エントロピー符号化する
(2)カレント最大符号化ブロックの分割状態を、参照符号化ブロックの分割状態からの差分として表現できるパターンとして予め定めておき、各パターンにインデックスを付与して選択したパターンのインデックスのみ、ないし選択したパターンからの差分情報を適応エントロピー符号化する
動画像符号化装置の処理内容の説明でも述べたように、分割初期状態指示情報に「参照符号化ブロックの分割状態そのものを用いる」というセマンティクスを持たせることにより、ビットストリームからインター分割状態記述情報の復号を行わないように構成することもできる。
As the encoding format of the inter-division state description information, for example, as described in the description of the processing content of the moving image encoding device, there are the following formats (1) and (2). The variable
(1) Adaptive entropy coding of difference information for each division layer (2) The division state of the current maximum coding block is determined in advance as a pattern that can be expressed as a difference from the division state of the reference coding block. As described in the description of the processing content of the moving picture coding apparatus that adaptively entropy-encodes only the index of the selected pattern or the difference information from the selected pattern by adding an index to the divided initial state instruction information, By providing the semantics of “using the reference coding block division state itself”, it is also possible to prevent the inter division state description information from being decoded from the bitstream.
なお、図14の構成のビットストリームを入力する場合は、最大符号化ブロックレベルの復号に先立ち、スライスヘッダから分割初期状態指示情報多重化フラグを復号し、その分割初期状態指示情報多重化フラグが「分割初期状態指示情報を多重する」ことを示していれば、図6の手順で最大符号化ブロックの分割状態の復号を行うようにする。
一方、分割初期状態指示情報多重化フラグが「分割初期状態指示情報を多重しない」ことを示していれば、常にイントラ分割状態記述情報に基づいて、最大符号化ブロックの分割状態の復号を行うようにする。
分割初期状態指示情報多重化フラグがシーケンスレベルヘッダやGOPレベルヘッダ、ピクチャレベルヘッダに挿入されるように構成されたビットストリームであれば、当該ヘッダから復号を行い、それ以下に含まれる全ての最大符号化ブロックに対して、分割初期状態指示情報多重化フラグに基づく分割状態の復号処理を行うようにする。
When the bit stream having the configuration shown in FIG. 14 is input, the division initial state instruction information multiplexing flag is decoded from the slice header prior to decoding at the maximum coding block level, and the division initial state instruction information multiplexing flag is set. If it indicates that “the division initial state instruction information is multiplexed”, the division state of the maximum coding block is decoded by the procedure of FIG.
On the other hand, if the division initial state instruction information multiplexing flag indicates that “the division initial state instruction information is not multiplexed”, the division state of the maximum coding block is always decoded based on the intra division state description information. To.
If the division initial state instruction information multiplexing flag is a bit stream configured to be inserted into the sequence level header, GOP level header, or picture level header, decoding is performed from the header, and all the maximum contained below The coding state is subjected to the division state decoding process based on the division initial state instruction information multiplexing flag.
可変長復号部51は、最大符号化ブロックの分割状態を復号すると、その分割状態に基づいて、階層的に分割されている各々の符号化ブロックBnを特定する(図5のステップST33)。
可変長復号部51は、各々の符号化ブロックBnを特定すると、その符号化ブロックBnの符号化モードm(Bn)を復号し、その符号化モードm(Bn)に含まれているパーティションPi nの情報に基づいて、符号化ブロックBnをさらに1つないし複数の予測処理単位であるパーティションPi nに分割する。
次に、可変長復号部51は、パーティションPi n毎に、圧縮データ、符号化モード、予測差分符号化パラメータ、イントラ予測パラメータ/インター予測パラメータを復号する(ステップST34)。
When the variable
When the variable
Next, the variable
即ち、符号化ブロックBnに割り当てられた符号化モードm(Bn)がイントラ符号化モードである場合、符号化ブロックBnに属しているパーティションPi n毎にイントラ予測パラメータを復号する。
イントラ予測パラメータの復号は、図1の動画像符号化装置と同じ手順で、周辺の復号済みパーティションのイントラ予測パラメータに基づいて、復号対象であるパーティションPi nのイントラ予測パラメータの予測値を算出し、その予測値を用いて復号する。
符号化ブロックBnに割り当てられた符号化モードm(Bn)がインター符号化モードである場合、符号化ブロックBnに属しているパーティションPi n毎にインター予測パラメータを復号する。
予測処理単位となるパーティションは、さらに予測差分符号化パラメータに含まれる変換ブロックサイズ情報に基づき、変換処理単位となる1つないし複数のパーティションに分割され、変換処理単位となるパーティション毎に圧縮データ(変換・量子化後の変換係数)を復号する。
That is, when the coding mode m (B n ) assigned to the coding block B n is the intra coding mode, the intra prediction parameter is decoded for each partition P i n belonging to the coding block B n .
Decoding the intra prediction parameters, by the same procedure as the moving image encoding device of FIG. 1, on the basis of the intra prediction parameters near the decoded partition, calculates a predicted value of intra prediction parameters partitions P i n is decoded Then, decoding is performed using the predicted value.
When the coding mode m (B n ) assigned to the coding block B n is the inter coding mode, the inter prediction parameter is decoded for each partition P i n belonging to the coding block B n .
The partition serving as the prediction processing unit is further divided into one or a plurality of partitions serving as the transform processing unit based on the transform block size information included in the prediction differential encoding parameter, and compressed data ( (Transform coefficient after transform / quantization) is decoded.
切替スイッチ52は、可変長復号部51から符号化ブロックBnに属しているパーティションPi nの符号化モードm(Bn)がイントラ符号化モードである場合(ステップST35)、可変長復号部51から出力されたイントラ予測パラメータをイントラ予測部53に出力する。
一方、パーティションPi nの符号化モードm(Bn)がインター符号化モードである場合(ステップST35)、可変長復号部51から出力されたインター予測パラメータを動き補償予測部54に出力する。
When the coding mode m (B n ) of the partition P i n belonging to the coding block B n is the intra coding mode from the variable
On the other hand, when the coding mode m (B n ) of the partition P i n is the inter coding mode (step ST35), the inter prediction parameter output from the variable
イントラ予測部53は、切替スイッチ52からイントラ予測パラメータを受けると、図1のイントラ予測部4と同様に、フレーム内の復号済みの画像信号を用いて、そのイントラ予測パラメータに基づいて、符号化ブロックBnのパーティションPi nに対するフレーム内予測処理を実施することでイントラ予測画像Pi nを生成する(ステップST36)。
動き補償予測部54は、切替スイッチ52からインター予測パラメータを受けると、動き補償予測フレームメモリ59により格納されている1フレーム以上の参照画像を用いて、そのインター予測パラメータに基づいて、符号化ブロックBnのパーティションPi nに対する動き補償予測処理を実施することでインター予測画像Pi nを生成する(ステップST37)。
When receiving the intra prediction parameter from the
When the motion
逆量子化・逆変換部55は、可変長復号部51から出力された予測差分符号化パラメータに含まれている量子化パラメータを用いて、可変長復号部51から出力された符号化ブロックに係る圧縮データを逆量子化し、その予測差分符号化パラメータに含まれている変換ブロックサイズ単位で、逆量子化の圧縮データの逆変換処理(例えば、逆DCT(逆離散コサイン変換)や、逆KL変換等の逆変換処理)を実施することで、逆変換処理後の圧縮データを復号予測差分信号(圧縮前の差分画像を示す信号)として加算部56に出力する(ステップST38)。
なお、予測差分符号化パラメータに含まれている量子化パラメータは、ビットストリームに多重化されている符号化データから符号化ブロックBnの単位で復元し、変換ブロックサイズの情報は、符号化ブロックBnを起点として、最大符号化ブロックの分割と同様に、四分木分割で表現された分割情報の形式や、選択可能な変換ブロックサイズをインデックス情報として表現された形式などで、ビットストリームから抽出して復元する。
変換ブロックサイズの情報は、符号化ブロックBnではなく、符号化ブロックBnに属しているパーティションPi nを単位として決定するように構成されていてもよい。
The inverse quantization /
Note that the quantization parameter included in the prediction differential encoding parameter is restored in units of the encoding block B n from the encoded data multiplexed in the bit stream, and information on the transform block size is the encoding block. Starting from B n , in the same way as the division of the maximum coding block, the division information format expressed by quadtree division, the format of selectable transform block sizes expressed as index information, etc. Extract and restore.
Information transform block size, the coding block B n no may be configured to determine the partition P i n that belong to coded blocks B n units.
加算部56は、逆量子化・逆変換部55から復号予測差分信号を受けると、その復号予測差分信号とイントラ予測部53又は動き補償予測部54により生成された予測画像を示す予測信号を加算することで復号画像を生成して、その復号画像を示す復号画像信号をイントラ予測用メモリ57に格納するとともに、その復号画像信号をループフィルタ部58に出力する(ステップST39)。
When the
ステップST33〜ST39の処理は、階層的に分割された全ての符号化ブロックBnに対する処理が完了するまで繰り返し実施される(ステップST40)。
ループフィルタ部58は、加算器56から復号画像信号を受けると、その復号画像信号に含まれている符号化歪みを補償し、符号化歪み補償後の復号画像信号が示す復号画像を参照画像として動き補償予測フレームメモリ59に格納する(ステップST41)。
ループフィルタ部58によるフィルタリング処理は、加算器56から出力される復号画像信号の最大符号化ブロックあるいは個々の符号化ブロック単位で行ってもよいし、1画面分のマクロブロックに相当する復号画像信号が出力された後に1画面分まとめて行ってもよい。
The processes of steps ST33 to ST39 are repeatedly performed until the processes for all the coding blocks Bn divided hierarchically are completed (step ST40).
When receiving the decoded image signal from the
The filtering process by the
以上で明らかなように、この実施の形態1によれば、符号化制御部1が、最大符号化ブロックを分割して符号化ブロックを生成する際、四分木分割の分割パターン及び四分木分割では表現できない分割パターンが混在している複数の分割パターンの中から、最も効率がよい分割パターンを選択し、その分割パターンにしたがって符号化ブロックを生成するように構成したので、複雑なブロックの分割を実現することができると同時に、少ない符号量で自由度が高い分割状態を表現することができる動画像符号化装置が得られる効果を奏する。
As is apparent from the above, according to the first embodiment, when the
また、この実施の形態1によれば、可変長復号部51が、ビットストリームに多重化されている符号化データから最大符号化ブロックの分割状態を示す情報を可変長復号して、最大符号化ブロックが階層的に分割されて生成されている符号化ブロックを特定し、ビットストリームに多重化されている符号化データから上記符号化ブロックに係る圧縮データ、符号化モード、イントラ予測パラメータ又はインター予測パラメータを可変長復号するように構成したので、ビットストリームから少ない符号量で自由度が高い分割状態を表現している情報を復号して、映像信号を再生することができる動画像復号装置が得られる効果を奏する。
Further, according to the first embodiment, the variable
なお、この実施の形態1では、参照符号化ブロックを「時間的に最近傍の参照画像において、カレント最大符号化ブロックと空間的に同じ位置にある最大符号化ブロック」としているが、例えば、「時間的に最近傍の参照画像上で、カレント最大符号化ブロックを代表する動き量分だけシフトさせた位置の最大符号化ブロック」を参照符号化ブロックとするように構成してもよい。
カレント最大符号化ブロックを代表する動き量は、例えば、カレント最大符号化ブロックの領域に対して求められる動きベクトル予測値を最大符号化ブロックのグリッド位置に調整した動き量などを利用することができる。
また、動きベクトル予測値は、既に符号化されている周辺符号化ブロックの動きベクトルから算出することができるので、別途ビットストリームに多重化して伝送する必要がない。
このようにカレント最大符号化ブロックの領域で想定される動きを加味して分割状態を参照することにより、より分割状態に関する相関が高い領域を参照符号化ブロックとして用いることができる。
In the first embodiment, the reference coding block is “the largest coding block spatially located at the same position as the current largest coding block in the temporally nearest reference image”. It may be configured such that the “maximum encoded block at a position shifted by the amount of motion representing the current maximum encoded block on the reference image closest in time” becomes the reference encoded block.
As the motion amount representing the current maximum coding block, for example, a motion amount obtained by adjusting the motion vector prediction value obtained for the current maximum coding block region to the grid position of the maximum coding block can be used. .
Also, since the motion vector prediction value can be calculated from the motion vectors of the peripheral coding blocks that have already been encoded, there is no need to separately multiplex and transmit them.
Thus, by referring to the division state in consideration of the motion assumed in the region of the current maximum coding block, a region having a higher correlation regarding the division state can be used as the reference coding block.
また、参照符号化ブロックを「時間的に最近傍の参照画像において、カレント最大符号化ブロックと空間的に同じ位置にある最大符号化ブロック」とするか、「カレント最大符号化ブロックの領域に対して求められる動きベクトル予測値を最大符号化ブロックのグリッド位置に調整した動き量でシフトした位置の参照画像上の最大符号化ブロック」とするかを、スライス、ピクチャ、GOP、シーケンスなどのレベルで選択させるようにしてもよい。 In addition, the reference encoding block is set to “the maximum encoding block that is spatially the same position as the current maximum encoding block in the temporally nearest reference image” or “to the region of the current maximum encoding block. The motion vector prediction value obtained in this way is set to the maximum encoded block on the reference image at a position shifted by the amount of motion adjusted to the grid position of the maximum encoded block ”at the level of slice, picture, GOP, sequence, etc. You may make it select.
また、この実施の形態1では、参照符号化ブロックを最大符号化ブロック毎に定めるようにしているが、例えば、スライス、ピクチャ、GOP、シーケンスなどより上位のレベルでテンプレートとなる参照分割状態を定め、各最大符号化ブロックの分割状態は、当該参照分割状態からの差分情報を伝送することで符号化を行うような構成も可能である。
例えば、映像のシーン毎に特徴的な被写体・動きが固定化されているような場合は、時間・空間的に比較的広い範囲で予測・符号化の分割状態が一様化される可能性がある。
このような場合は、局所的に参照符号化ブロックを定める代わりに、大域的な参照符号化ブロック領域を定める方が、伝送すべき分割初期状態指示情報を少なくすることができ、符号化効率を高めることができる。
テンプレートとなる参照分割状態は、例えば、シーンチェンジの先頭ピクチャにおける分割状態を用いるなどの構成をとることができる。
In the first embodiment, the reference encoding block is determined for each maximum encoding block. For example, a reference division state that becomes a template is determined at a higher level than a slice, a picture, a GOP, a sequence, or the like. The division state of each maximum coding block may be configured to perform encoding by transmitting difference information from the reference division state.
For example, when a characteristic subject / motion is fixed for each video scene, there is a possibility that the prediction / coding division state is made uniform in a relatively wide range in time and space. is there.
In such a case, instead of determining the reference coding block locally, it is possible to reduce the division initial state instruction information to be transmitted, and to determine the coding efficiency, by defining the global reference coding block region. Can be increased.
For example, the reference division state serving as the template may be configured to use the division state in the first picture of the scene change.
また、この実施の形態1では、各々の最大符号化ブロックを分割の階層に依存せずに図7の分割パターンを用いて、階層分割を行う構成を説明したが、四分木以外の分割パターンを用いることにより、四分木分割で十分な分割の最適性が得られるケースでは余分なパターン表現の符号が必要となるため、図7の分割パターンを用いるか、あるいは、図16に示す従来例のような四分木分割のみを用いるかを適応的に選択する構成にしてもよい。
例えば、分割の階層nが深くなって、符号化ブロックBn自体のサイズが小さくなってくると、符号化ブロックBn内の信号特性に局所的なばらつきがなくなってくるため、SP2〜SP8のような特殊な分割パターンを用いる効果が薄れることが考えられる。
このような場合、分割階層nないし符号化ブロックBn自体のサイズに応じて、SP2〜SP8のパターンを使用するか、使用しないかを選択するように構成することで、余分な分割状態記述情報を符号化する必要がなくなる効果が得られる。
このような選択的な分割パターンの記述を行うか否かを、シーケンス、GOP、ピクチャ、スライスなどのレベルでON/OFFする識別情報をビットストリームに多重化するように構成してもよい。
In the first embodiment, the configuration in which each maximum coding block is subjected to hierarchical division using the division pattern of FIG. 7 without depending on the division hierarchy has been described. However, the division pattern other than the quadtree is used. In the case where sufficient optimality of division can be obtained by quadtree division, an extra pattern expression code is required. Therefore, the division pattern of FIG. 7 is used, or the conventional example shown in FIG. Alternatively, it may be configured to adaptively select whether to use only quadtree partitioning.
For example, deeper hierarchy n of division, the size of the encoded block B n itself becomes smaller, to come no longer localized variation in signal characteristics of the coded block B n, the SP2~SP8 It is conceivable that the effect of using such a special division pattern is diminished.
In such a case, it is possible to select whether to use the pattern of SP2 to SP8 according to the size of the division hierarchy n or the coding block Bn itself, thereby making it possible to select extra division state description information. It is possible to obtain an effect that it is not necessary to encode.
Whether or not to describe such a selective division pattern may be configured such that identification information that is turned ON / OFF at the level of sequence, GOP, picture, slice, or the like is multiplexed into a bitstream.
また、この実施の形態1では、図7に示すように、Ln=Mnのケースを示しているが、例えば、図15に示すように、最大符号化ブロックサイズをLn=kMnとする場合にも適用することができる。
この際、第0階層では、(Ln+1,Mn+1)=(Ln,Mn)となる符号化ブロックへの分割のみを行うこととして、以降の分割は、図7と同様の分割を行うように構成する。
このような構成により、例えば、M0=16とすることにより、MPEG−2(ISO/IEC 13818−2)やMPEG−4 AVC/H.264(ISO/IEC 14496−10)のような16×16画素からなるマクロブロックを横に連結する構成の最大符号化ブロックを定義することができ、既存方式との互換性を維持した動画像符号化装置を構成し易いという効果がある。
ここでは、Ln=kMnのケースを示しているが、kLn=Mnのように、縦に連結したものであっても同様の考えで分割が可能であることは言うまでもない。
Further, in the first embodiment, as shown in FIG. 7, the case of L n = M n is shown, but for example, as shown in FIG. 15, the maximum coding block size is set to L n = kM n . It can also be applied to.
At this time, in the 0th layer, it is assumed that only the division into the encoded blocks in which (L n + 1 , M n + 1 ) = (L n , M n ) is performed, and the subsequent division is performed in the same manner as in FIG. Configure as follows.
With such a configuration, for example, by setting M 0 = 16, MPEG-2 (ISO / IEC 13818-2) and MPEG-4 AVC / H. H.264 (ISO / IEC 14496-10) can be defined as a maximum coding block having a configuration in which macroblocks composed of 16 × 16 pixels are horizontally connected, and a moving picture code maintaining compatibility with existing systems There is an effect that it is easy to configure the control device.
Here, the case of L n = kM n is shown, but it is needless to say that even if they are vertically connected as in kL n = M n , division is possible with the same idea.
なお、本願発明はその発明の範囲内において、実施の形態の任意の構成要素の変形、もしくは実施の形態の任意の構成要素の省略が可能である。
例えば、この実施の形態1では、符号化制御部1が、イントラ予測処理(フレーム内予測処理)又は動き補償予測処理(フレーム間予測処理)が実施される際の処理単位となる符号化ブロックの最大サイズ(初期ブロックのサイズ)を決定するとともに、最大サイズの符号化ブロックが階層的に分割される際の上限の階層数を決定する処理を実施するとしているが、初期ブロックのサイズや最大サイズの符号化ブロックが階層的に分割される際の上限の階層数は、符号化制御部1で決定するのでなく、別途外部から与えられる情報に基づいて動作するように動画像符号化装置を構成してもよい。
同様に、可変長復号部51が、図1の符号化制御部1と同様の手順で、イントラ予測処理(フレーム内予測処理)又は動き補償予測処理(フレーム間予測処理)が実施される際の処理単位となる符号化ブロックの最大サイズを決定するとともに、最大サイズの符号化ブロック(最大符号化ブロック)が階層的に分割される際の上限の階層数を決定するとしているが、初期ブロックのサイズや最大サイズの符号化ブロックが階層的に分割される際の上限の階層数は、可変長復号部51で決定するのでなく、対応する動画像符号化装置との取り決めを別の手段で行っておき、一意に定まる情報に基づいて動作するように動画像復号装置を構成してもよい。
In the present invention, any constituent element of the embodiment can be modified or any constituent element of the embodiment can be omitted within the scope of the invention.
For example, in the first embodiment, the
Similarly, when the variable
なお、任意のピクチャへのランダムアクセスが可能となるよう、入力映像信号のすべてのピクチャをイントラ符号化する場合には、イントラ分割状態記述情報のみを用いるように動画像符号化装置・動画像復号装置を構成したり、イントラ分割状態記述情報のみを用いることを識別する情報を多重したビットストリームの構成を扱うように動画像符号化装置・動画像復号装置を構成してもよい。 In addition, when all the pictures of the input video signal are intra-coded so that random access to any picture is possible, the moving picture coding apparatus / moving picture decoding uses only the intra division state description information. The video encoding device and the video decoding device may be configured to handle a configuration of a bitstream in which information identifying that the device is configured or only intra-partition state description information is used is multiplexed.
1 符号化制御部(符号化制御手段)、2 ブロック分割部(ブロック分割手段)、3 切替スイッチ(予測画像生成手段)、4 イントラ予測部(予測画像生成手段)、5 動き補償予測部(予測画像生成手段)、6 減算部(差分画像生成手段)、7 変換・量子化部(画像圧縮手段)、8 逆量子化・逆変換部、9 加算部、10 イントラ予測用メモリ、11 ループフィルタ部、12 動き補償予測フレームメモリ、13 可変長符号化部(可変長符号化手段)、51 可変長復号部(可変長復号手段)、52 切替スイッチ(予測画像生成手段)、53 イントラ予測部(予測画像生成手段)、54 動き補償予測部(予測画像生成手段)、55 逆量子化・逆変換部(差分画像生成手段)、56 加算部(復号画像生成手段)、57 イントラ予測用メモリ、58 ループフィルタ部、59 動き補償予測フレームメモリ。
DESCRIPTION OF
Claims (5)
利用可能な1以上の符号化モードの中から、階層的に分割されて生成される各々の符号化ブロックの符号化方法を定める符号化モードを選択する符号化制御手段と、入力画像を所定のサイズの初期ブロックに分割するとともに、該初期ブロックを階層的に分割して符号化ブロックを生成するブロック分割手段と、上記ブロック分割手段により生成された符号化ブロックに対して、上記符号化制御手段により決定された符号化モードに対応する予測処理を実施することで予測画像を生成する予測画像生成手段と、上記ブロック分割手段により生成された符号化ブロックと上記予測画像生成手段により生成された予測画像との差分画像を生成する差分画像生成手段と、上記差分画像生成手段により生成された差分画像を圧縮し、上記差分画像の圧縮データを出力する画像圧縮手段と、上記画像圧縮手段から出力された圧縮データ及び上記符号化制御手段により選択された符号化モードを可変長符号化するとともに、上記初期ブロックの分割状態を示す情報を可変長符号化し、上記圧縮データ、上記符号化モード及び上記初期ブロックの分割状態を示す情報の符号化データが多重化されているビットストリームを生成する可変長符号化手段とを備え、
上記符号化制御手段は、上記初期ブロックを分割して符号化ブロックを生成する際、四分木分割の分割パターン及び上記四分木分割では表現できない分割パターンが混在している複数の分割パターンの中から、所定の判定基準に基づき分割パターンを選択し、上記分割パターンにしたがって符号化ブロックを生成することを特徴とする動画像符号化装置。 In a moving picture coding apparatus that divides an input image into predetermined initial blocks and performs coding in units of coding blocks obtained by dividing the initial block.
Coding control means for selecting a coding mode that defines a coding method for each coding block generated by being divided hierarchically from among one or more available coding modes; A block dividing unit that divides the initial block into sizes and generates an encoded block by dividing the initial block hierarchically, and the encoding control unit for the encoded block generated by the block dividing unit A prediction image generation unit that generates a prediction image by performing a prediction process corresponding to the encoding mode determined by the above, a coding block generated by the block division unit, and a prediction generated by the prediction image generation unit A difference image generating means for generating a difference image with the image, and the difference image generated by the difference image generating means is compressed, Image compression means for outputting data, the compressed data output from the image compression means and the encoding mode selected by the encoding control means are variable length encoded and information indicating the division state of the initial block Variable length encoding means, and a variable length encoding means for generating a bit stream in which encoded data of information indicating the compressed data, the encoding mode, and the division state of the initial block is multiplexed, and
When the encoding control unit generates an encoded block by dividing the initial block, a plurality of divided patterns in which a divided pattern of quadtree division and a divided pattern that cannot be expressed by the quadtree division are mixed are included. A moving picture encoding apparatus, wherein a division pattern is selected based on a predetermined determination criterion, and an encoded block is generated according to the division pattern.
上記符号化制御処理ステップでは、上記初期ブロックを分割して符号化ブロックを生成する際、四分木分割の分割パターン及び上記四分木分割では表現できない分割パターンが混在している複数の分割パターンの中から、所定の判定基準に基づき分割パターンを選択し、上記分割パターンにしたがって符号化ブロックを生成することを特徴とする動画像符号化方法。 Each of the encoding control means is generated by being divided hierarchically from one or more available encoding modes for each encoded block obtained by hierarchically dividing an initial block of a predetermined size. An encoding control processing step for selecting an encoding mode for determining an encoding method of the encoding block, and a block dividing means for dividing the input image into initial blocks of a predetermined size and hierarchically dividing the initial block A block division processing step for generating an encoded block, and a prediction image generating unit sets the encoding mode determined in the encoding control processing step to the encoding block generated in the block division processing step. A prediction image generation processing step for generating a prediction image by executing a corresponding prediction processing, and a difference image generation means include the block division processing step. A difference image generation processing step for generating a difference image between the encoded block generated in the step and a prediction image generated in the prediction image generation processing step, and an image compression means generated in the difference image generation processing step. The image compression processing step for compressing the difference image and outputting the compressed data of the difference image, and the variable-length encoding means are selected in the compressed data output in the image compression processing step and the encoding control processing step. The encoding mode is variable-length encoded, the information indicating the division state of the initial block is variable-length encoded, and the compressed data, the encoding mode, and the encoded data of the information indicating the division state of the initial block are multiplexed. A variable-length encoding processing step for generating an encoded bitstream,
In the encoding control processing step, when the encoded block is generated by dividing the initial block, a plurality of division patterns in which a division pattern of quadtree division and a division pattern that cannot be expressed by the quadtree division are mixed A moving picture coding method comprising: selecting a division pattern based on a predetermined determination criterion and generating a coding block according to the division pattern.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010221495A JP2012080213A (en) | 2010-09-30 | 2010-09-30 | Moving image encoding apparatus, moving image decoding apparatus, moving image encoding method and moving image decoding method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010221495A JP2012080213A (en) | 2010-09-30 | 2010-09-30 | Moving image encoding apparatus, moving image decoding apparatus, moving image encoding method and moving image decoding method |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2012080213A true JP2012080213A (en) | 2012-04-19 |
Family
ID=46239989
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010221495A Pending JP2012080213A (en) | 2010-09-30 | 2010-09-30 | Moving image encoding apparatus, moving image decoding apparatus, moving image encoding method and moving image decoding method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2012080213A (en) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014120575A1 (en) * | 2013-01-30 | 2014-08-07 | Intel Corporation | Content adaptive entropy coding of partitions data for next generation video |
WO2015190839A1 (en) * | 2014-06-11 | 2015-12-17 | 엘지전자(주) | Method and device for encodng and decoding video signal by using embedded block partitioning |
WO2015194922A1 (en) * | 2014-06-20 | 2015-12-23 | 삼성전자 주식회사 | Method and apparatus for encoding video, and method and apparatus for decoding video |
WO2018092869A1 (en) * | 2016-11-21 | 2018-05-24 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | Coding device, decoding device, coding method, and decoding method |
WO2018092870A1 (en) * | 2016-11-21 | 2018-05-24 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | Coding device, decoding device, coding method, and decoding method |
US10652536B2 (en) | 2016-11-21 | 2020-05-12 | Panasonic Intellectual Property Corporation Of America | Encoder, decoder, encoding method, and decoding method |
CN114363548A (en) * | 2022-01-10 | 2022-04-15 | 浙江齐安信息科技有限公司 | Method and system for recording screen video of electronic equipment |
JP7369273B2 (en) | 2019-07-26 | 2023-10-25 | 北京字節跳動網絡技術有限公司 | Determining picture splitting mode based on block size |
-
2010
- 2010-09-30 JP JP2010221495A patent/JP2012080213A/en active Pending
Cited By (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9794568B2 (en) | 2013-01-30 | 2017-10-17 | Intel Corporation | Content adaptive entropy coding of coded/not-coded data for next generation video |
US20150319441A1 (en) * | 2013-01-30 | 2015-11-05 | Intel Corporation | Content adaptive entropy coding of partitions data for next generation video |
WO2014120575A1 (en) * | 2013-01-30 | 2014-08-07 | Intel Corporation | Content adaptive entropy coding of partitions data for next generation video |
US9794569B2 (en) | 2013-01-30 | 2017-10-17 | Intel Corporation | Content adaptive partitioning for prediction and coding for next generation video |
JP2016506187A (en) * | 2013-01-30 | 2016-02-25 | インテル コーポレイション | Content adaptive entropy coding of partition data for next generation video |
CN105453570A (en) * | 2013-01-30 | 2016-03-30 | 英特尔公司 | Content adaptive entropy coding of partitions data for next generation video |
US9609330B2 (en) | 2013-01-30 | 2017-03-28 | Intel Corporation | Content adaptive entropy coding of modes and reference types data for next generation video |
US9686551B2 (en) | 2013-01-30 | 2017-06-20 | Intel Corporation | Content adaptive entropy coding of partitions data for next generation video |
US9762911B2 (en) | 2013-01-30 | 2017-09-12 | Intel Corporation | Content adaptive prediction and entropy coding of motion vectors for next generation video |
US10009610B2 (en) | 2013-01-30 | 2018-06-26 | Intel Corporation | Content adaptive prediction and entropy coding of motion vectors for next generation video |
US9787990B2 (en) | 2013-01-30 | 2017-10-10 | Intel Corporation | Content adaptive parametric transforms for coding for next generation video |
WO2015190839A1 (en) * | 2014-06-11 | 2015-12-17 | 엘지전자(주) | Method and device for encodng and decoding video signal by using embedded block partitioning |
WO2015194922A1 (en) * | 2014-06-20 | 2015-12-23 | 삼성전자 주식회사 | Method and apparatus for encoding video, and method and apparatus for decoding video |
US11889078B2 (en) | 2016-11-21 | 2024-01-30 | Panasonic Intellectual Property Corporation Of America | Encoder, decoder, encoding method, and decoding method |
WO2018092870A1 (en) * | 2016-11-21 | 2018-05-24 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | Coding device, decoding device, coding method, and decoding method |
WO2018092869A1 (en) * | 2016-11-21 | 2018-05-24 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | Coding device, decoding device, coding method, and decoding method |
US10652536B2 (en) | 2016-11-21 | 2020-05-12 | Panasonic Intellectual Property Corporation Of America | Encoder, decoder, encoding method, and decoding method |
US11350091B2 (en) | 2016-11-21 | 2022-05-31 | Panasonic Intellectual Property Corporation Of America | Encoder, decoder, encoding method, and decoding method |
US11399176B2 (en) | 2016-11-21 | 2022-07-26 | Panasonic Intellectual Property Corporation Of America | Encoder, decoder, encoding method, and decoding method |
US11736693B2 (en) | 2016-11-21 | 2023-08-22 | Panasonic Intellectual Property Corporation Of America | Encoder, decoder, encoding method, and decoding method |
JP7369273B2 (en) | 2019-07-26 | 2023-10-25 | 北京字節跳動網絡技術有限公司 | Determining picture splitting mode based on block size |
CN114363548B (en) * | 2022-01-10 | 2024-01-30 | 浙江齐安信息科技有限公司 | Screen video recording method and system for electronic equipment |
CN114363548A (en) * | 2022-01-10 | 2022-04-15 | 浙江齐安信息科技有限公司 | Method and system for recording screen video of electronic equipment |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6463521B2 (en) | Image encoding device, image encoding method, image decoding device, and image decoding method | |
JP6615287B2 (en) | Image decoding device | |
KR101829594B1 (en) | Dynamic image decoding device, dynamic image decoding method, dynamic image encoding device, dynamic image encoding method, and recoding medium | |
JP7012809B2 (en) | Image coding device, moving image decoding device, moving image coding data and recording medium | |
WO2013108684A1 (en) | Video image decoding device, video image and coding device, video image decoding method and video image coding method | |
JP2012080213A (en) | Moving image encoding apparatus, moving image decoding apparatus, moving image encoding method and moving image decoding method | |
JP2012186763A (en) | Video encoding device, video decoding device, video encoding method, and video decoding method | |
US20150271502A1 (en) | Video encoding device, video decoding device, video encoding method, and video decoding method | |
JP2012080212A (en) | Moving image encoding apparatus, moving image decoding apparatus, moving image encoding method and moving image decoding method | |
JP2013098711A (en) | Video encoding device, video decoding device, video encoding method, and video decoding method |