JP2008219360A - Predictive encoding device - Google Patents
Predictive encoding device Download PDFInfo
- Publication number
- JP2008219360A JP2008219360A JP2007052807A JP2007052807A JP2008219360A JP 2008219360 A JP2008219360 A JP 2008219360A JP 2007052807 A JP2007052807 A JP 2007052807A JP 2007052807 A JP2007052807 A JP 2007052807A JP 2008219360 A JP2008219360 A JP 2008219360A
- Authority
- JP
- Japan
- Prior art keywords
- image
- prediction
- unit
- frequency conversion
- frequency
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
Description
本発明は、予測符号化装置に関する。 The present invention relates to a predictive coding apparatus.
近年、動画像圧縮技術の一つである予測符号化を行うことを目的として、種々の予測符号化装置が開発され、その代表的なものとして例えばH.264/AVCエンコーダが開発されている。しかし、かかる予測符号化装置では、最適な予測モードを判定する際に、アダマール変換などの直交変換を施した絶対値誤差和を求めた方が、予測性能が向上できるが、直交変換を施して予測モード判定を行うのには、必要とされる処理量が多く、高速処理を行うことが困難であるという問題があった。 In recent years, various predictive coding apparatuses have been developed for the purpose of performing predictive coding, which is one of the moving picture compression techniques, and for example, an H.264 / AVC encoder has been developed as a representative example. However, in such a predictive coding apparatus, when determining an optimal prediction mode, it is possible to improve the prediction performance by obtaining an absolute value error sum obtained by performing orthogonal transformation such as Hadamard transform, but performing orthogonal transformation. The prediction mode determination has a problem that a large amount of processing is required and it is difficult to perform high-speed processing.
以下、予測符号化装置に関する文献名を記載する。
本発明は、動画像圧縮処理を高速に行うことができる予測符号化装置を提供することを目的とする。 An object of the present invention is to provide a predictive coding apparatus capable of performing moving image compression processing at high speed.
本発明の一態様による予測符号化装置は、
異なる複数の予測モードの中から選択された前記予測モードに基づいて、参照画像から予測画像を作成する予測画像作成部と、
原画像に対して第1の周波数変換を行うことにより、第1の周波数変換パターンを有する前記原画像を生成する原画像変換部と、
前記予測画像に対して前記第1の周波数変換を行うことにより、前記第1の周波数変換パターンを有する前記予測画像を生成する予測画像変換部と、
前記第1の周波数変換パターンを有する前記原画像と、前記第1の周波数変換パターンを有する前記予測画像との差分を算出することにより、前記第1の周波数変換パターンを有する残差画像を生成する第1の残差画像変換部と、
前記第1の周波数変換パターンを有する前記残差画像に基づいて、前記複数の予測モードの中から、符号量が小さくなる前記予測モードを判定するモード判定部と、
前記原画像と前記予測画像の残差画像に対して第2の周波数変換を行うことにより、第2の周波数変換パターンを有する前記残差画像を生成する第2の残差画像変換部と、
前記第2の周波数変換パターンを有する前記残差画像に対して画質調整を行う画質調整部と、
前記画質調整が行われた、前記第2の周波数変換パターンを有する前記残差画像に対して、前記第2の周波数変換の逆変換を行うことにより、実空間の前記残差画像を生成する残差画像逆変換部と、
前記残差画像と前記予測画像とを用いて前記参照画像を作成し、前記予測画像作成部に出力する参照画像作成部と
を備える。
A predictive coding apparatus according to an aspect of the present invention includes:
A prediction image creating unit that creates a prediction image from a reference image based on the prediction mode selected from a plurality of different prediction modes;
An original image conversion unit for generating the original image having the first frequency conversion pattern by performing a first frequency conversion on the original image;
A prediction image conversion unit that generates the prediction image having the first frequency conversion pattern by performing the first frequency conversion on the prediction image;
A residual image having the first frequency conversion pattern is generated by calculating a difference between the original image having the first frequency conversion pattern and the predicted image having the first frequency conversion pattern. A first residual image conversion unit;
Based on the residual image having the first frequency conversion pattern, a mode determination unit that determines the prediction mode in which the code amount is small from the plurality of prediction modes;
A second residual image conversion unit that generates the residual image having a second frequency conversion pattern by performing a second frequency conversion on the residual image of the original image and the predicted image;
An image quality adjustment unit that performs image quality adjustment on the residual image having the second frequency conversion pattern;
The residual image for generating the residual image in the real space is obtained by performing inverse transformation of the second frequency transformation on the residual image having the second frequency transformation pattern that has undergone the image quality adjustment. A difference image inverse transform unit;
A reference image creating unit that creates the reference image using the residual image and the predicted image and outputs the reference image to the predicted image creating unit;
本発明の予測符号化装置によれば、動画像圧縮処理を高速に行うことができる。 According to the predictive coding apparatus of the present invention, moving picture compression processing can be performed at high speed.
以下、本発明の実施の形態について図面を参照して説明する。 Embodiments of the present invention will be described below with reference to the drawings.
図1に、本発明の実施の形態による予測符号化装置10の構成を示す。予測画像作成部140は、参照画像作成部150から出力される参照画像と、モード選択部80から出力される予測モードとに基づいて、周辺画素を用いて予測を行う画面内予測符号化を実行することにより、予測画像を作成し、これを予測画像アダマール変換部90、残差画像作成部100及び参照画像作成部150に出力する。
FIG. 1 shows the configuration of a
原画像変換部としての原画像アダマール変換部50は、原画像に対して例えば2次元アダマール変換(第1の周波数変換)を行い、このアダマール変換された原画像(第1の周波数変換パターンを有する原画像)を残差画像アダマール変換部60に出力する。例えば、4x4要素の任意の行列Xと、アダマール変換行列Tとが、次式
予測画像変換部としての予測画像アダマール変換部90は、予測画像に対して、例えば0、1または2次元アダマール変換(第1の周波数変換)を行い、このアダマール変換された予測画像(第1の周波数変換パターンを有する予測画像)を残差画像アダマール変換部60に出力する。なお、アダマール変換の次元は、予測画像の性質、すなわち予測画像の実質的な次元数に応じて使い分ける。例えば予測画像が、図2(a)のように0次元的であれば0次元アダマール変換、図2(b)のように1次元的であれば1次元アダマール変換、図2(c)のように2次元的であれば2次元アダマール変換を使うといった具合である。
The predicted image Hadamard
なお、第1の周波数変換としては、アダマール変換ではなく、他の種々の第1の直交変換を用いても良い。 Note that, as the first frequency transform, various other first orthogonal transforms may be used instead of the Hadamard transform.
第1の残差画像変換部としての残差画像アダマール変換部60は、アダマール変換された原画像と、アダマール変換された予測画像との差分を算出することにより、残差画像のアダマール変換パターン(第1の周波数パターンを有する残差画像)を導出し、これをSATD計算部70に出力する。
The residual image Hadamard
SATD(Sum of Absolute Transformed Difference)計算部70は、アダマール変換されたデータの各要素の絶対値の総和を計算する。この総和、すなわちSATDが小さければ予測符号化によって発生する符号量が小さくなると予想されるため、予測モードの判定の指標として用いられる。
A SATD (Sum of Absolute Transformed Difference)
モード選択部80は、SATDに基づいて、異なる複数の予測モードの中から、符号量が小さくなる最適な予測モードを選択し、これを予測画像作成部140に出力する。なお、SATD計算部70及びモード選択部80は、モード判定部40を形成する。
The
残差画像作成部100は、原画像と予測画像との残差を計算し、得られた残差画像を残差画像DCT部110に出力する。
The residual
残差画像DCT部110は、この残差画像に対して、例えばDCT(Discrete Cosine Transform)(第2の周波数変換)を行い、このDCTされた残差画像(第2の周波数変換パターンを有する残差画像)を画質調整部120に出力する。例えば、4x4要素の任意の行列Xと、DCT変換行列Cとが、次式、
なお、第2の周波数変換としては、DCTではなく、第1の直交変換とは異なる変換行列を用いた他の種々の第2の直交変換を用いても良い。また、残差画像作成部100及び残差画像DCT部110は、第2の残差画像変換部を形成する。
As the second frequency transform, various other second orthogonal transforms using a transform matrix different from the first orthogonal transform may be used instead of DCT. The residual
画質調整部120は、周波数空間のパターンに変換された残差画像の画質および符号データ量を調整する。残差画像逆変換部としての残差画像IDCT部130は、IDCT(Inverse Discrete Csine Transform)によって、画質調整された周波数空間のパターンを実空間の残差画像に逆変換する。参照画像作成部150は、実空間に逆変換された残差画像と、最適な予測モードによる予測画像とを用いて、参照画像を作成し、これを予測画像作成部140に出力する。
The image
このように本実施の形態によれば、異なる複数の予測モードに基づいて、最適モード判定を行うときに、原画像に対する変換処理と予測画像の変換処理とを別々に行うことにより、最適モード判定の処理量の削減を実現することができる。 As described above, according to the present embodiment, when optimal mode determination is performed based on a plurality of different prediction modes, optimal mode determination is performed by separately performing conversion processing for an original image and conversion processing for a predicted image. The amount of processing can be reduced.
ここで図3に、本実施の形態の比較例として、予測符号化装置200の構成を示す。なお、図1に示された要素と同一のものには同一の符号を付して説明を省略する。この比較例の予測符号化蔵置200の場合、残差画像作成部100は、原画像と予測画像の残差を計算し、得られた残差画像を残差画像アダマール変換部210に出力する。残差画像アダマール変換部210は、残差画像に対して2次元アダマール変換を行う。
Here, FIG. 3 shows a configuration of a
この比較例の予測符号化蔵置200では、予測モードの選択のために2次元アダマール変換を複数回行うことになり、その結果、処理量が多く、高速処理を行うことが困難であった。
In the
このように比較例の場合には、予測モードごとに残差画像を作成して2次元アダマール変換を行っていたのに対し、本実施の形態の場合には、原画像のアダマール変換と予測画像のアダマール変換とを別々に行っている。これにより、残差画像アダマール変換パターンを算出するための計算量を削減できる。 As described above, in the case of the comparative example, a residual image is created for each prediction mode and the two-dimensional Hadamard transform is performed. In the present embodiment, the Hadamard transform of the original image and the predicted image are performed. The Hadamard transform is performed separately. Thereby, the calculation amount for calculating the residual image Hadamard transform pattern can be reduced.
すなわち、予測画像が0次元的あるいは1次元的なものであれば、アダマール変換もそれぞれ0次元、1次元のものに置き換えることができるため処理量を削減できるわけである。ここで0次元的な予測画像と言っているのは、例えばH.264/AVCにおけるDC予測画像、1次元的な予測画像と言っているのは垂直予測画像、あるいは水平予測画像のことである。参考のためH.264/AVCにおける画面内予測モードの一例を図4に示す。 That is, if the predicted image is 0-dimensional or 1-dimensional, the Hadamard transform can be replaced with 0-dimensional and 1-dimensional images, respectively, and the processing amount can be reduced. Here, for example, a zero-dimensional prediction image means a DC prediction image in H.264 / AVC, and a one-dimensional prediction image means a vertical prediction image or a horizontal prediction image. . For reference, an example of the intra prediction mode in H.264 / AVC is shown in FIG.
この図4(a)〜(c)のうち、図4(a)はイントラ4×4垂直予測モードを示し、図4(b)はイントラ4×4水平予測モードを示し、図4(c)はイントラ4×4DC予測モードを示す。このように予測モードは、0次元又は1次元に周波数変換可能な予測モードである。 4A to 4C, FIG. 4A shows the intra 4 × 4 vertical prediction mode, FIG. 4B shows the intra 4 × 4 horizontal prediction mode, and FIG. 4C. Indicates an intra 4 × 4 DC prediction mode. As described above, the prediction mode is a prediction mode that can be frequency-converted to the zero dimension or the one dimension.
なお、上述の実施の形態は一例であって、本発明を限定するものではない。例えば、予測モードは、3つではなく、少なくとも2つの予測モードの中から選択されるものであれば良い。 The above-described embodiment is an example and does not limit the present invention. For example, the prediction mode may be selected from at least two prediction modes instead of three.
10 予測符号化装置
50 原画像アダマール変換部
60 残差画像アダマール変換部
70 SATD計算部
80 モード選択部
90 予測画像アダマール変換部
100 残差画像作成部
110 残差画像DCT部
120 画質調整部
130 残差画像IDCT部
140 予測画像作成部
150 参照画像作成部
10
Claims (5)
原画像に対して第1の周波数変換を行うことにより、第1の周波数変換パターンを有する前記原画像を生成する原画像変換部と、
前記予測画像に対して前記第1の周波数変換を行うことにより、前記第1の周波数変換パターンを有する前記予測画像を生成する予測画像変換部と、
前記第1の周波数変換パターンを有する前記原画像と、前記第1の周波数変換パターンを有する前記予測画像との差分を算出することにより、前記第1の周波数変換パターンを有する残差画像を生成する第1の残差画像変換部と、
前記第1の周波数変換パターンを有する前記残差画像に基づいて、前記複数の予測モードの中から、符号量が小さくなる前記予測モードを判定するモード判定部と、
前記原画像と前記予測画像の残差画像に対して第2の周波数変換を行うことにより、第2の周波数変換パターンを有する前記残差画像を生成する第2の残差画像変換部と、
前記第2の周波数変換パターンを有する前記残差画像に対して画質調整を行う画質調整部と、
前記画質調整が行われた、前記第2の周波数変換パターンを有する前記残差画像に対して、前記第2の周波数変換の逆変換を行うことにより、実空間の前記残差画像を生成する残差画像逆変換部と、
前記残差画像と前記予測画像とを用いて前記参照画像を作成し、前記予測画像作成部に出力する参照画像作成部と
を備えることを特徴とする予測符号化装置。 A prediction image creating unit that creates a prediction image from a reference image based on the prediction mode selected from a plurality of different prediction modes;
An original image conversion unit for generating the original image having the first frequency conversion pattern by performing a first frequency conversion on the original image;
A prediction image conversion unit that generates the prediction image having the first frequency conversion pattern by performing the first frequency conversion on the prediction image;
A residual image having the first frequency conversion pattern is generated by calculating a difference between the original image having the first frequency conversion pattern and the predicted image having the first frequency conversion pattern. A first residual image conversion unit;
Based on the residual image having the first frequency conversion pattern, a mode determination unit that determines the prediction mode in which the code amount is small from the plurality of prediction modes;
A second residual image conversion unit that generates the residual image having a second frequency conversion pattern by performing a second frequency conversion on the residual image of the original image and the predicted image;
An image quality adjustment unit that performs image quality adjustment on the residual image having the second frequency conversion pattern;
The residual image for generating the residual image in the real space is obtained by performing inverse transformation of the second frequency transformation on the residual image having the second frequency transformation pattern that has undergone the image quality adjustment. A difference image inverse transform unit;
A predictive coding apparatus comprising: a reference image creating unit that creates the reference image using the residual image and the predicted image and outputs the reference image to the predicted image creating unit.
前記第2の周波数変換は、前記第1の直交変換とは異なる変換行列を用いた第2の直交変換である
ことを特徴とする請求項1に記載の予測符号化装置。 The first frequency transform is a first orthogonal transform;
The predictive coding apparatus according to claim 1, wherein the second frequency transform is a second orthogonal transform using a transform matrix different from the first orthogonal transform.
前記第2の周波数変換は、DCTである
ことを特徴とする請求項1に記載の予測符号化装置。 The first frequency transform is a Hadamard transform;
The predictive coding apparatus according to claim 1, wherein the second frequency transform is DCT.
ことを特徴とする請求項1に記載の予測符号化装置。 The prediction encoding apparatus according to claim 1, wherein the prediction mode is a prediction mode capable of frequency conversion to 0 dimension or 1 dimension.
ことを特徴とする請求項1に記載の予測符号化装置。 The prediction encoding apparatus according to claim 1, wherein the prediction mode is any one of a vertical prediction mode, a horizontal prediction mode, and a DC prediction mode.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007052807A JP2008219360A (en) | 2007-03-02 | 2007-03-02 | Predictive encoding device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007052807A JP2008219360A (en) | 2007-03-02 | 2007-03-02 | Predictive encoding device |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2008219360A true JP2008219360A (en) | 2008-09-18 |
Family
ID=39838889
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007052807A Pending JP2008219360A (en) | 2007-03-02 | 2007-03-02 | Predictive encoding device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2008219360A (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010124054A (en) * | 2008-11-17 | 2010-06-03 | Hitachi Kokusai Electric Inc | Method and apparatus for encoding motion picture |
-
2007
- 2007-03-02 JP JP2007052807A patent/JP2008219360A/en active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010124054A (en) * | 2008-11-17 | 2010-06-03 | Hitachi Kokusai Electric Inc | Method and apparatus for encoding motion picture |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2022087158A (en) | Intra-prediction method and encoder and decoder using same | |
RU2628154C1 (en) | Video decoding method | |
JP2024012476A (en) | Method, device, medium, and program for video decoding | |
KR101473278B1 (en) | Image prediction encoding device, image prediction decoding device, image prediction encoding method, image prediction decoding method, image prediction encoding program, and image prediction decoding program | |
JP2016042732A (en) | Image encoding device, image decoding device, image encoding method, image decoding method, and bitstream | |
JP2009094828A (en) | Device and method for encoding image, and device and method for decoding image | |
KR20170108367A (en) | Method and apparatus for processing a video signal based on intra prediction | |
KR20140064972A (en) | Method, device, and program for encoding and decoding image | |
JP4937224B2 (en) | Image encoding device | |
WO2010067529A1 (en) | Moving picture decoding method and device, and moving picture encoding method and device | |
CN113615187A (en) | Method and apparatus for improved implicit transform selection | |
WO2012035640A1 (en) | Moving picture encoding method and moving picture decoding method | |
JP5908619B2 (en) | Moving picture coding apparatus and moving picture decoding apparatus | |
KR20150133825A (en) | Video-encoding device, video-encoding method, and program | |
JP2007013298A (en) | Image coding apparatus | |
JP2014075652A (en) | Image encoder, and image encoding method | |
KR101512643B1 (en) | 2 Video encoding apparatus and Apparatus and Method of 2 dimensional ordering transform for image signal and Recording Medium therefor | |
JP5526277B2 (en) | Moving picture decoding apparatus, method and program | |
JPWO2016194380A1 (en) | Moving picture coding apparatus, moving picture coding method, and recording medium storing moving picture coding program | |
JP5432359B2 (en) | Moving picture coding apparatus, method and program | |
JP2009049969A (en) | Device and method of coding moving image and device and method of decoding moving image | |
JP6528635B2 (en) | Moving picture coding apparatus, moving picture coding method, and computer program for moving picture coding | |
JP2008219360A (en) | Predictive encoding device | |
JP4971817B2 (en) | Image encoding device | |
JP5432412B1 (en) | Moving picture coding apparatus and moving picture decoding apparatus |