JP2013074528A - Image processing device and image processing method - Google Patents
Image processing device and image processing method Download PDFInfo
- Publication number
- JP2013074528A JP2013074528A JP2011213065A JP2011213065A JP2013074528A JP 2013074528 A JP2013074528 A JP 2013074528A JP 2011213065 A JP2011213065 A JP 2011213065A JP 2011213065 A JP2011213065 A JP 2011213065A JP 2013074528 A JP2013074528 A JP 2013074528A
- Authority
- JP
- Japan
- Prior art keywords
- unit
- information
- encoding
- threshold
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/90—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
- H04N19/91—Entropy coding, e.g. variable length coding [VLC] or arithmetic coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
この技術は、画像処理装置と画像処理方法に関する。詳しくは、画像の符号化処理や復号処理を効率よく行えるようにする。 This technique relates to an image processing apparatus and an image processing method. Specifically, the image encoding process and the decoding process can be efficiently performed.
従来、H.264/AVC(Advanced Video Coding)の画像符号化方式では、エントロピー符号化としてCABAC(Context-based Adaptive Binary Arithmetic Coding)や、CAVLC(Context-based Adaptive Variable Length Coding)が定義されている。このうち、CABACは、コンテキスト(Context)に応じて適応的に符号化を行う2値の算術符号化方式である。 Conventionally, H.M. In the H.264 / AVC (Advanced Video Coding) image coding system, CABAC (Context-based Adaptive Binary Arithmetic Coding) and CAVLC (Context-based Adaptive Variable Length Coding) are defined as entropy coding. Among these, CABAC is a binary arithmetic coding system that performs adaptive coding according to a context.
算術符号化方式は、1シンボル毎に発生確率に応じて数値区間を分割する処理を繰り返し、分割後の数値区間の発生確率の2進表現により符号化データを生成する。また、算術符号化方式は、シンボル発生確率テーブルを符号化処理毎に順次更新する必要がある。なお、算術復号では、算術符号化と逆の処理が行われる。 The arithmetic coding method repeats the process of dividing a numerical section according to the occurrence probability for each symbol, and generates encoded data by a binary expression of the occurrence probability of the divided numerical section. In addition, the arithmetic coding method needs to sequentially update the symbol occurrence probability table for each coding process. In arithmetic decoding, processing reverse to that of arithmetic coding is performed.
また、H.264/AVC(Advanced Video Coding)に続く次世代の画像符号化方式として、HEVC(High Efficiency Video Coding)の標準化が進められている。HEVCが使用する基本的な符号化技術は、H.264/AVCと同様である。しかし、エントロピー符号化の手法では、H.264/AVCのエントロピー符号化におけるCAVLCおよびCABACとは異なる手法が提案されている(下記非特許文献1参照)。
H. As a next-generation image coding method following H.264 / AVC (Advanced Video Coding), standardization of HEVC (High Efficiency Video Coding) is in progress. The basic encoding technique used by HEVC is H.264. It is the same as H.264 / AVC. However, in the entropy coding method, H.264 is used. A method different from CAVLC and CABAC in H.264 / AVC entropy coding has been proposed (see Non-Patent
ところで、CABACではコンテキスト(Context)を参照して符号化を行う符号化部分と、コンテキストを参照しないで符号化を行う符号化部分が混在している。コンテキストを参照する符号化部分は、コンテキストを参照することから処理が煩雑である。また、コンテキストを参照する符号化部分とコンテキストを参照しない符号化部分の混在によってさらに処理が煩雑となり、符号化処理や復号処理を効率よく行うことが困難となるおそれがある。 By the way, in CABAC, a coding part that performs coding with reference to a context (Context) and a coding part that performs coding without referring to the context are mixed. The encoding part that refers to the context is complicated in processing because it refers to the context. Further, the process becomes more complicated due to the mixing of the encoded part that refers to the context and the encoded part that does not refer to the context, and it may be difficult to efficiently perform the encoding process and the decoding process.
本技術は、このような状況に鑑みてなされたものであり、CABACの符号化処理や復号処理を効率よく行うことができる画像処理装置と画像処理方法を提供することを目的とする。 The present technology has been made in view of such a situation, and an object thereof is to provide an image processing apparatus and an image processing method capable of efficiently performing CABAC encoding processing and decoding processing.
この技術の第1の側面は、量子化後の変換係数の絶対値と閾値「m」を比較して前記絶対値が前記閾値「m」より大きい場合に閾値を「m=m+1」として比較を行い、閾値が「m=1」から所定値となるまでの比較結果を示す第1の情報と、前記絶対値の前記所定値に対する超過分に応じた第2の情報と、前記変換係数の符号を示す第3の情報をそれぞれシンタックス要素として、第1の情報,第2の情報,第3の情報の順に符号化した符号化データに対して、算術復号処理を行う算術復号処理部と、前記算術復号処理部で算術復号処理を行うことにより得られた二値化データの多値化を行い、符号化前の前記変換係数を生成する多値化部とを備える画像処理装置にある。 The first aspect of this technique is to compare the absolute value of the quantized transform coefficient with a threshold value “m” and compare the threshold value as “m = m + 1” when the absolute value is greater than the threshold value “m”. First information indicating a comparison result until the threshold value reaches a predetermined value from “m = 1”, second information according to an excess of the absolute value with respect to the predetermined value, and a sign of the conversion coefficient An arithmetic decoding processing unit that performs arithmetic decoding processing on encoded data that is encoded in the order of the first information, the second information, and the third information, with each of the third information indicating An image processing apparatus includes a multi-value quantization unit that multi-values binarized data obtained by performing arithmetic decoding processing in the arithmetic decoding processing unit and generates the transform coefficient before encoding.
この技術においては、量子化後の例えばサブブロック単位の変換係数の絶対値と閾値「m」を比較して絶対値が閾値「m」より大きい場合に閾値を「m=m+1」として比較を行い、閾値が「m=1」から所定値例えば「m=2」となるまでの比較結果を示す第1の情報と、絶対値の前記所定値に対する超過分に応じた第2の情報と、変換係数の符号を示す第3の情報をそれぞれシンタックス要素として、第1の情報,第2の情報,第3の情報の順に符号化した符号化データに対して、算術復号処理が算術復号処理部で行われる。なお、サブブロック単位とは、直交変換の単位であるトランスフォームユニット(TU:transform_unit)を所定数の係数毎例えば16係数毎に分割したブロックの単位である。 In this technique, for example, the absolute value of a transform coefficient in units of sub-blocks after quantization is compared with a threshold value “m”, and if the absolute value is larger than the threshold value “m”, the threshold value is set to “m = m + 1”. First information indicating a comparison result from the threshold value “m = 1” to a predetermined value, for example, “m = 2”, second information corresponding to an excess of the absolute value with respect to the predetermined value, and conversion Arithmetic decoding processing is performed on the encoded data obtained by encoding the first information, the second information, and the third information in the order of the third information indicating the sign of the coefficient as a syntax element. Done in The sub-block unit is a block unit obtained by dividing a transform unit (TU: transform_unit), which is a unit of orthogonal transformation, for each predetermined number of coefficients, for example, 16 coefficients.
算術復号処理では、確率状態および優勢確率シンボルを表すコンテキストを参照するモードで第1の情報の復号処理が行われて、コンテキストを参照しないモードで第2の情報および第3の情報の復号処理が行われる。また、算術復号処理を行うことにより得られた二値化データの多値化が行われて、符号化前の変換係数が生成される。 In the arithmetic decoding process, the decoding process of the first information is performed in the mode that refers to the context representing the probability state and the dominant probability symbol, and the decoding process of the second information and the third information is performed in the mode that does not refer to the context. Done. Also, the binarized data obtained by performing the arithmetic decoding process is multi-valued, and transform coefficients before encoding are generated.
この技術の第2の側面は、量子化後の変換係数の絶対値と閾値「m」を比較して前記絶対値が前記閾値「m」より大きい場合に閾値を「m=m+1」として比較を行い、閾値が「m=1」から所定値となるまでの比較結果を示す第1の情報と、前記絶対値の前記所定値に対する超過分に応じた第2の情報と、前記変換係数の符号を示す第3の情報をそれぞれシンタックス要素として、第1の情報,第2の情報,第3の情報の順に符号化した符号化データについて、算術復号処理を行う工程と、前記算術復号処理を行うことにより得られた二値化データの多値化を行い、符号化前の前記変換係数を生成する工程とを含む画像処理方法にある。 In the second aspect of this technique, the absolute value of the transform coefficient after quantization is compared with the threshold “m”, and when the absolute value is greater than the threshold “m”, the threshold is set to “m = m + 1”. First information indicating a comparison result until the threshold value reaches a predetermined value from “m = 1”, second information according to an excess of the absolute value with respect to the predetermined value, and a sign of the conversion coefficient And performing the arithmetic decoding process on the encoded data encoded in the order of the first information, the second information, and the third information, using the third information indicating Performing the multi-value conversion of the binarized data obtained by performing the processing, and generating the transform coefficient before encoding.
この技術の第3の側面は、量子化後の変換係数の絶対値と閾値「m」を比較して前記絶対値が前記閾値「m」より大きい場合に閾値を「m=m+1」として比較を行い、閾値が「m=1」から所定値となるまでの比較結果を示す第1の情報と、前記絶対値の前記所定値に対する超過分に応じた第2の情報と、前記変換係数の符号を示す第3の情報をそれぞれシンタックス要素として、第1の情報,第2の情報,第3の情報の順に二値化する二値化部と、前記二値化部で得られた二値化データの算術符号化処理を行い、符号化データを生成する算術符号化処理部とを備える画像処理装置にある。 The third aspect of this technique compares the absolute value of the quantized transform coefficient with a threshold “m” and compares the threshold value with “m = m + 1” when the absolute value is greater than the threshold “m”. First information indicating a comparison result until the threshold value reaches a predetermined value from “m = 1”, second information according to an excess of the absolute value with respect to the predetermined value, and a sign of the conversion coefficient The binarization unit that binarizes in order of the first information, the second information, and the third information, with the third information indicating each as a syntax element, and the binary obtained by the binarization unit An image processing apparatus includes an arithmetic encoding processing unit that performs arithmetic encoding processing of encoded data and generates encoded data.
この技術においては、量子化後の例えばサブブロック単位の変換係数の絶対値と閾値「m」を比較して絶対値が閾値「m」より大きい場合に閾値を「m=m+1」として比較を行い、閾値が「m=1」から所定値例えば「m=2」となるまでの比較結果を示す第1の情報と、絶対値の前記所定値に対する超過分に応じた第2の情報と、変換係数の符号を示す第3の情報をそれぞれシンタックス要素として、第1の情報,第2の情報,第3の情報の順に二値化される。この二値化データに対して、算術符号化処理が算術符号化処理部で行われて符号化データの生成が行われる。算術符号化処理では、確率状態および優勢確率シンボルを表すコンテキストを参照するモードで第1の情報の符号化処理が行われて、コンテキストを参照しないモードで第2の情報および第3の情報の符号化処理が行われる。 In this technique, for example, the absolute value of a transform coefficient in units of sub-blocks after quantization is compared with a threshold value “m”, and if the absolute value is larger than the threshold value “m”, the threshold value is set to “m = m + 1”. First information indicating a comparison result from the threshold value “m = 1” to a predetermined value, for example, “m = 2”, second information corresponding to an excess of the absolute value with respect to the predetermined value, and conversion The third information indicating the sign of the coefficient is used as a syntax element, and binarized in the order of the first information, the second information, and the third information. An arithmetic encoding process is performed on the binarized data by an arithmetic encoding processing unit to generate encoded data. In the arithmetic encoding process, the first information is encoded in a mode that refers to a context that represents a probability state and a dominant probability symbol, and the second information and the third information are encoded in a mode that does not refer to the context. Processing is performed.
この技術の第4の側面は、量子化後の変換係数の絶対値と閾値「m」を比較して前記絶対値が前記閾値「m」より大きい場合に閾値を「m=m+1」として比較を行い、閾値が「m=1」から所定値となるまでの比較結果を示す第1の情報と、前記絶対値における前記所定値に対する超過分に応じた第2の情報と、前記変換係数の符号を示す第3の情報をそれぞれシンタックス要素として、第1の情報,第2の情報,第3の情報の順に二値化する工程と、前記二値化により得られた二値化データの算術符号化処理を行い、符号化データを生成する工程とを含む画像処理方法にある。 The fourth aspect of this technique is to compare the absolute value of the quantized transform coefficient with a threshold value “m” and compare the threshold value as “m = m + 1” when the absolute value is greater than the threshold value “m”. First information indicating a comparison result until the threshold value reaches a predetermined value from “m = 1”, second information according to an excess of the absolute value with respect to the predetermined value, and a sign of the conversion coefficient Each of the third information indicating a syntax element, and a binarization process in the order of the first information, the second information, and the third information, and arithmetic of the binarized data obtained by the binarization An image processing method including a step of performing an encoding process and generating encoded data.
この技術によれば、量子化後の変換係数の絶対値と閾値「m」を比較して絶対値が閾値「m」より大きい場合に閾値を「m=m+1」として比較を行い、閾値が「m=1」から所定値となるまでの比較結果を示す第1の情報と、絶対値における所定値に対する超過分に応じた第2の情報と、変換係数の符号を示す第3の情報をそれぞれシンタックス要素として、第1の情報,第2の情報,第3の情報の順に符号化した符号化データの生成や復号が行われる。このようなシンタックス要素の順とすることで、復号時に変換係数を順に確定できる。また、情報の符号化処理や復号処理をまとめて行うことが可能となる。したがって、CABACの符号化処理や復号処理を効率よく行うことができる。 According to this technique, the absolute value of the transform coefficient after quantization and the threshold “m” are compared, and when the absolute value is larger than the threshold “m”, the threshold is set to “m = m + 1”. First information indicating a comparison result from “m = 1” to a predetermined value, second information corresponding to an excess of the absolute value with respect to the predetermined value, and third information indicating the sign of the transform coefficient, respectively As syntax elements, generation and decoding of encoded data encoded in the order of the first information, the second information, and the third information are performed. By setting the order of such syntax elements, transform coefficients can be determined in order at the time of decoding. Also, it is possible to perform information encoding processing and decoding processing together. Therefore, CABAC encoding processing and decoding processing can be performed efficiently.
以下、本技術を実施するための形態について説明する。なお、説明は以下の順序で行う。
1.画像符号化装置の構成
2.画像符号化装置の動作
3.CABAC符号化部の構成
4.CABAC符号化部の動作
4−1.CABAC符号化復号処理について
4−2.CABAC符号化処理動作
4.可逆符号化部の動作
5.画像復号装置の構成
6.画像復号装置の動作
7.CABAC復号部の構成
8.CABAC復号部の動作
9.ソフトウェア処理の場合
10.電子機器に適用した場合
Hereinafter, embodiments for carrying out the present technology will be described. The description will be given in the following order.
1. 1. Configuration of
<1.画像符号化装置の構成>
図1は、画像符号化装置の構成を例示している。画像符号化装置10は、アナログ/ディジタル変換部(A/D変換部)11、画面並べ替えバッファ12、演算部13、直交変換部14、量子化部15、可逆符号化部16、蓄積バッファ17、レート制御部18を備えている。さらに、画像符号化装置10は、逆量子化部21、逆直交変換部22、演算部23、デブロッキングフィルタ24、フレームメモリ25、イントラ予測部31、動き予測・補償部32、予測画像・最適モード選択部33を備えている。
<1. Configuration of Image Encoding Device>
FIG. 1 illustrates the configuration of an image encoding device. The
A/D変換部11は、アナログの画像信号をディジタルの画像データに変換して画面並べ替えバッファ12に出力する。画面並べ替えバッファ12は、A/D変換部11から出力された画像データに対してフレームの並べ替えを行う。画面並べ替えバッファ12は、符号化処理に係るGOP(Group of Pictures)構造に応じてフレームの並べ替えを行い、並べ替え後の画像データを演算部13とレート制御部18およびイントラ予測部31と動き予測・補償部32に出力する。
The A /
演算部13には、画面並べ替えバッファ12から出力された画像データと、後述する予測画像・最適モード選択部33で選択された予測画像データが供給される。演算部13は、画面並べ替えバッファ12から出力された入力画像の画像データと予測画像・最適モード選択部33から供給された予測画像の画像データとの差分である差分画像の画像データ(予測誤差データ)を算出して、直交変換部14に出力する。
The
直交変換部14は、演算部13から出力された予測誤差データに対して、離散コサイン変換(DCT;Discrete Cosine Transform)、カルーネン・レーベ変換等の直交変換処理を行う。直交変換部14は、直交変換処理を行うことにより得られた変換係数データを量子化部15に出力する。
The
量子化部15には、直交変換部14から出力された変換係数データと、後述するレート制御部18から量子化パラメータ(量子化スケール)が供給されている。量子化部15は変換係数データの量子化を行い、量子化データを可逆符号化部16と逆量子化部21に出力する。また、量子化部15は、レート制御部18で設定された量子化パラメータに応じて量子化データのビットレートを変化させる。
The
可逆符号化部16には、量子化部15から変換係数の量子化データ、イントラ予測部31から予測モード情報や動き予測・補償部32から予測モード情報と動きベクトル情報等が供給される。また、予測画像・最適モード選択部33から最適モードがイントラ予測であるかインター予測であるかを示す情報が供給される。なお、予測モード情報には、イントラ予測またはインター予測に応じて、予測モードやブロックサイズ情報等が含まれる。
The
可逆符号化部16は、変換係数の量子化データに対して例えばCAVLCまたはCABAC等により可逆符号化処理を行い、符号化ストリームを生成して蓄積バッファ17に出力する。また、可逆符号化部16は、最適モードがイントラ予測である場合、イントラ予測部31から供給された予測モード情報の可逆符号化を行う。また、可逆符号化部16は、最適モードがインター予測である場合、動き予測・補償部32から供給された予測モード情報や動きベクトル情報等の可逆符号化を行う。さらに、可逆符号化部16は、量子化パラメータに関する情報の可逆符号化を行う。
The
蓄積バッファ17は、可逆符号化部16からの符号化ストリームを蓄積する。また、蓄積バッファ17は、蓄積した符号化ストリームを伝送路に応じた伝送速度で出力する。
The
レート制御部18は、蓄積バッファ17の空き容量の監視を行い、空き容量が少なくなっている場合には量子化データのビットレートが低下し、空き容量が十分大きい場合には量子化データのビットレートが高くなるように量子化パラメータを設定する。レート制御部18は、設定した量子化パラメータを量子化部15に出力する。
The
逆量子化部21は、量子化部15から供給された量子化データの逆量子化処理を行う。逆量子化部21は、逆量子化処理を行うことで得られた変換係数データを逆直交変換部22に出力する。
The
逆直交変換部22は、逆量子化部21から供給された変換係数データの逆直交変換処理を行い、得られたデータを演算部23に出力する。
The inverse
演算部23は、逆直交変換部22から供給されたデータと予測画像・最適モード選択部33から供給された予測画像データを加算してローカルデコード画像の画像データを生成して、デブロッキングフィルタ24とイントラ予測部31に出力する。なお、演算部23で生成されたローカルデコード画像は、イントラ予測またはインター予測において参照画像として用いられる。
The
デブロッキングフィルタ24は、画像の符号化時に生じるブロック歪みを減少させるためのフィルタ処理を行う。デブロッキングフィルタ24は、演算部23から供給された画像データからブロック歪みを除去するフィルタ処理を行い、フィルタ処理後の画像データをフレームメモリ25に記憶させる。
The
イントラ予測部31は、画面並べ替えバッファ12から供給された符号化対象画像の入力画像データと演算部23から供給された画像データ(参照画像データ)を用いて、候補となるイントラ予測モードで予測を行い、最適イントラ予測モードを決定する。イントラ予測部31は、例えば各イントラ予測モードでコスト関数値を算出して、算出したコスト関数値に基づき符号化効率が最良となるイントラ予測モードを最適イントラ予測モードとする。イントラ予測部31は、最適イントラ予測モードで生成された予測画像データと最適イントラ予測モードでのコスト関数値を予測画像・最適モード選択部33に出力する。さらに、イントラ予測部31は、最適イントラ予測モードを示す予測モード情報を可逆符号化部16に出力する。
The
動き予測・補償部32は、画面並べ替えバッファ12から供給された符号化対象画像の入力画像データとフレームメモリ25から読み出した参照画像データを用いて、候補となるインター予測モードで予測を行い、最適インター予測モードを決定する。動き予測・補償部32は、例えば各インター予測モードでコスト関数値を算出して、算出したコスト関数値に基づき符号化効率が最良となるインター予測モードを最適インター予測モードとする。動き予測・補償部32は、最適インター予測モードで生成された予測画像データと最適インター予測モードでのコスト関数値を予測画像・最適モード選択部33に出力する。さらに、動き予測・補償部32は、最適インター予測モードに関する予測モード情報と動きベクトル情報を可逆符号化部16に出力する。
The motion prediction /
予測画像・最適モード選択部33は、イントラ予測部31から供給されたコスト関数値と動き予測・補償部32から供給されたコスト関数値を比較して、コスト関数値が少ない方を、符号化効率が最良となる最適モードとして選択する。また、予測画像・最適モード選択部33は、最適モードで生成した予測画像データを演算部13と演算部23に出力する。さらに、予測画像・最適モード選択部33は、最適モードがイントラ予測モードであるかインター予測モードであるかを示す情報を可逆符号化部16に出力する。なお、予測画像・最適モード選択部33は、スライス単位でイントラ予測またはインター予測の切り替えを行う。
The predicted image / optimum
<2.画像符号化装置の動作>
次に、画像符号化装置の動作について、図2に示すフローチャートを用いて説明する。ステップST11において、A/D変換部11は入力された画像信号をA/D変換する。
<2. Operation of Image Encoding Device>
Next, the operation of the image coding apparatus will be described using the flowchart shown in FIG. In step ST11, the A /
ステップST12において画面並べ替えバッファ12は、画像並べ替えを行う。画面並べ替えバッファ12は、A/D変換部11より供給された画像データを記憶し、各ピクチャの表示する順番から符号化する順番への並べ替えを行う。
In step ST12, the
ステップST13において演算部13は、予測誤差データの生成を行う。演算部13は、ステップST12で並べ替えられた入力画像の画像データと予測画像・最適モード選択部33で選択された予測画像の画像データとの差分を算出して、差分画像の画像データすなわち予測誤差データを生成する。予測誤差データは、元の画像データに比べてデータ量が小さい。したがって、画像をそのまま符号化する場合に比べて、データ量を符号化することができる。
In step ST13, the
ステップST14において直交変換部14は、直交変換処理を行う。直交変換部14は、演算部13から供給された予測誤差データを直交変換する。具体的には、予測誤差データに対して離散コサイン変換、カルーネン・レーベ変換等の直交変換が行われ、変換係数データを出力する。
In step ST14, the
ステップST15において量子化部15は、量子化処理を行う。量子化部15は、変換係数データを量子化する。量子化に際しては、後述するステップST25の処理で説明されるように、レート制御が行われる。
In step ST15, the
ステップST16において逆量子化部21は、逆量子化処理を行う。逆量子化部21は、量子化部15により量子化された変換係数データを量子化部15の特性に対応する特性で逆量子化する。
In step ST16, the
ステップST17において逆直交変換部22は、逆直交変換処理を行う。逆直交変換部22は、逆量子化部21により逆量子化された変換係数データを直交変換部14の特性に対応する特性で逆直交変換する。
In step ST17, the inverse
ステップST18において演算部23は、参照画像データの生成を行う。演算部23は、予測画像・最適モード選択部33から供給された予測画像データと、この予測画像と対応する位置の逆直交変換後のデータを加算して、ローカルデコード画像の画像データ(参照画像データ)を生成する。
In step ST18, the
ステップST19においてデブロッキングフィルタ24は、デブロッキングフィルタ処理を行う。デブロッキングフィルタ24は、演算部23より出力された復号画像データをフィルタリングしてブロック歪みを除去する。
In step ST19, the
ステップST20においてフレームメモリ25は、復号画像データを記憶する。フレームメモリ25は、デブロッキングフィルタでフィルタリングが行われた復号画像データを記憶する。
In step ST20, the
ステップST21においてイントラ予測部31と動き予測・補償部32は、それぞれ予測処理を行う。すなわち、イントラ予測部31は、イントラ予測モードのイントラ予測処理を行い、動き予測・補償部32は、インター予測モードの動き予測・補償処理を行う。予測処理により、候補となる予測モードでの予測処理がそれぞれ行われ、候補となる予測モードでのコスト関数値がそれぞれ算出される。そして、算出されたコスト関数値に基づいて、最適イントラ予測モードと最適インター予測モードが選択され、選択された予測モードで生成された予測画像とそのコスト関数および予測モード情報が予測画像・最適モード選択部33に供給される。
In step ST21, the
ステップST22において予測画像・最適モード選択部33は、予測画像データの選択を行う。予測画像・最適モード選択部33は、イントラ予測部31および動き予測・補償部32より出力された各コスト関数値に基づいて、符号化効率が最良となる最適モードを決定する。また、予測画像・最適モード選択部33は、決定した最適モードの予測画像データを、演算部13と演算部23に出力する。この予測画像データが、上述したように、ステップST13,ST18の演算に利用される。
In step ST22, the predicted image / optimum
ステップST23において可逆符号化部16は、可逆符号化処理を行う。可逆符号化部16は、量子化部15より出力された変換係数の量子化データを可逆符号化する。すなわち、量子化データに対してCAVLCまたはCABAC等の可逆符号化が行われて、データ符号化される。また、可逆符号化部16は、ステップST25で選択された予測画像データに対応する予測モード情報等の可逆符号化を行い、量子化データを可逆符号化して生成された符号化ストリームに、予測モード情報等の可逆符号化データが含められる。
In step ST23, the
ステップST24において蓄積バッファ17は、蓄積処理を行う。蓄積バッファ17は、可逆符号化部16から出力される符号化ストリームを蓄積する。この蓄積バッファ17に蓄積された符号化ストリームは、適宜読み出されて伝送路を介して復号側に伝送される。
In step ST24, the
ステップST25においてレート制御部18は、レート制御を行う。レート制御部18は、蓄積バッファ17で符号化ストリームを蓄積する場合、オーバーフローまたはアンダーフローが蓄積バッファ17で発生しないように、量子化パラメータQPを設定して量子化部15に出力することで量子化動作のレートを制御する。
In step ST25, the
<3.CABAC符号化部の構成>
図3は、可逆符号化部16においてCABACの処理を行うCABAC符号化部の構成を例示している。CABAC符号化部160は、二値化部161,コンテキスト算出部162,算術符号化処理部163を備えている。
<3. Configuration of CABAC Encoding Unit>
FIG. 3 illustrates the configuration of a CABAC encoding unit that performs CABAC processing in the
二値化部161は、量子化された変換係数や動きベクトル情報および予測モード情報等のデータに対して二値化処理を行い、規格によって定められたシンタックスの二値化データを生成して算術符号化処理部163に出力する。 The binarization unit 161 performs binarization processing on the quantized transform coefficient, motion vector information, prediction mode information, and other data, and generates binarized data having a syntax defined by the standard. The result is output to the arithmetic coding processing unit 163.
コンテキスト算出部162は、シンタックスに基づきコンテキストインデックスを生成する。コンテキストインデックスとは、コンテキストを選択するための情報であり、コンテキストでは、発生確率が高い優勢シンボルとその優勢シンボルの発生確率に関する情報が示される。 The context calculation unit 162 generates a context index based on the syntax. The context index is information for selecting a context, and in the context, information on a dominant symbol having a high occurrence probability and the occurrence probability of the dominant symbol is indicated.
コンテキスト算出部162は、コンテキストインデックスに対応したコンテキストを選択して算術符号化処理部163に出力する。また、コンテキスト算出部162は、算術符号化処理部163の算術符号化結果に基づき発生確率の更新を行う。 The context calculation unit 162 selects a context corresponding to the context index and outputs the selected context to the arithmetic coding processing unit 163. In addition, the context calculation unit 162 updates the occurrence probability based on the arithmetic coding result of the arithmetic coding processing unit 163.
算術符号化処理部163は、二値化データとコンテキストに基づき、発生確率に応じて数値区間を分割する処理を繰り返し、分割後の数値区間の発生確率の2進表現により、算術符号化結果である符号化データを生成して蓄積バッファ17に出力する。
The arithmetic coding processing unit 163 repeats the process of dividing the numerical interval according to the occurrence probability based on the binarized data and the context, and uses the binary expression of the occurrence probability of the divided numerical interval as a result of the arithmetic coding. Some encoded data is generated and output to the
また、算術符号化処理部163は、算術符号化処理において、エンコード・デシジョン(EncodeDecision)処理と、エンコード・バイパス(EncodeBypass)処理が設けられている。なお、算術符号化処理では、エンコード・ターミネイト(EncodeTerminate)処理が設けられているが、説明は省略する。エンコード・デシジョン処理は、確率状態および優勢確率シンボルを表すコンテキストを参照する符号化モードである。エンコード・バイパス処理は、コンテキストを参照しない符号化モードである。算術符号化処理部163は、シンタックスに応じて符号化モードを選択して符号化を行う。 The arithmetic encoding processing unit 163 is provided with an encoding decision process and an encoding bypass process in the arithmetic encoding process. In the arithmetic coding process, an encode / terminate process is provided, but a description thereof is omitted. Encode decision processing is an encoding mode that references contexts that represent probability states and dominant probability symbols. The encoding bypass process is an encoding mode that does not refer to a context. The arithmetic coding processing unit 163 performs coding by selecting a coding mode according to the syntax.
<4.CABAC符号化部の動作>
<4−1.CABAC符号化復号処理について>
CABAC符号化部160は、符号化するシンボルをbinと呼ばれる中間形式に変換するbinarizationを行った後に算術符号化処理を行い符号化データを得る。例えば、CABAC符号化部160は、変換係数の量子化データ(以下単に変換係数情報という)の絶対値と閾値「m」を比較する。ここで、絶対値が閾値「m」より大きい場合に閾値「m=m+1」とした比較を行い、閾値が「m=1」から所定値となるまでの比較を行う。このようにして得られる比較結果を示す第1の情報と、絶対値における所定値に対する超過分を示す第2の情報と、前記変換係数の符号を示す第3の情報をそれぞれシンタックス要素とする。このシンタックス要素の二値化データを生成して算術符号化処理を行い、符号化データを生成する。
<4. Operation of CABAC Encoding Unit>
<4-1. About CABAC encoding / decoding processing>
The CABAC encoding unit 160 obtains encoded data by performing arithmetic encoding processing after performing binarization for converting a symbol to be encoded into an intermediate format called bin. For example, the CABAC encoding unit 160 compares the absolute value of the quantized data of the transform coefficient (hereinafter simply referred to as transform coefficient information) with the threshold “m”. Here, when the absolute value is larger than the threshold value “m”, the comparison is performed with the threshold value “m = m + 1”, and the comparison is performed from “m = 1” to the predetermined value. The first information indicating the comparison result thus obtained, the second information indicating the excess of the absolute value with respect to the predetermined value, and the third information indicating the sign of the transform coefficient are used as syntax elements, respectively. . Binarized data of this syntax element is generated and arithmetic coding processing is performed to generate encoded data.
変換係数情報のCABAC符号化において、HEVC(High Efficiency Video Coding)では、直交変換の単位であるトランスフォームユニット(TU:transform_unit)を所定数の係数毎例えば16係数毎のサブブロックに分割して、サブブロック単位で変換係数の符号化が行われる。 In CABAC encoding of transform coefficient information, in HEVC (High Efficiency Video Coding), a transform unit (TU: transform_unit), which is a unit of orthogonal transform, is divided into sub-blocks for every predetermined number of coefficients, for example, every 16 coefficients, The transform coefficient is encoded on a sub-block basis.
また、HEVCにおける変換係数のCABAC符号化では、所定値を「m=2」として、シンタックス要素としてsignificant_coeff_flag,coeff_abs_level_greater1_flag、coeff_abs_level_greater2_flag、coeff_abs_level_minus3、coeff_sign_flag等を設けることが検討されている。 Further, in CABAC encoding of transform coefficients in HEVC, it is considered that a predetermined value is “m = 2” and that the syntax elements include significant_coeff_flag, coeff_abs_level_greater1_flag, coeff_abs_level_greater2_flag, coeff_abs_level_minus3, coeff_sign_flag, and the like.
significant_coeff_flagは、変換係数が「0」であるか否かを示すフラグのシンタックス要素である。significant_coeff_flagは、変換係数が「0」の場合にsignificant_coeff_flag=0、変換係数が「0」でない場合にsignificant_coeff_flag=1となる。 significant_coeff_flag is a syntax element of a flag indicating whether or not the conversion coefficient is “0”. significant_coeff_flag is significant_coeff_flag = 0 when the conversion coefficient is “0”, and significant_coeff_flag = 1 when the conversion coefficient is not “0”.
coeff_abs_level_greater1_flagは、変換係数の絶対値が閾値「1」よりも大きいか否かを示すフラグのシンタックス要素である。coeff_abs_level_greater1_flagは、変換係数が「1」よりも大きい場合にcoeff_abs_level_greater1_flag=1、変換係数が「1」以下である場合にcoeff_abs_level_greater1_flag=0となる。 coeff_abs_level_greater1_flag is a syntax element of a flag indicating whether or not the absolute value of the transform coefficient is larger than the threshold “1”. coeff_abs_level_greater1_flag is coeff_abs_level_greater1_flag = 1 when the conversion coefficient is larger than “1”, and coeff_abs_level_greater1_flag = 0 when the conversion coefficient is “1” or less.
coeff_abs_level_greater2_flagは、変換係数の絶対値が閾値「2」よりも大きいか否かを示すフラグのシンタックス要素である。coeff_abs_level_greater2_flagは、変換係数が「2」よりも大きい場合にcoeff_abs_level_greater2_flag=1、変換係数が「2」以下である場合にcoeff_abs_level_greater2_flag=0となる。 coeff_abs_level_greater2_flag is a syntax element of a flag indicating whether or not the absolute value of the transform coefficient is larger than the threshold “2”. coeff_abs_level_greater2_flag is coeff_abs_level_greater2_flag = 1 when the conversion coefficient is larger than “2”, and coeff_abs_level_greater2_flag = 0 when the conversion coefficient is “2” or less.
coeff_abs_level_minus3は、変換係数の絶対値から「3」を引いた値を示すシンタックス要素であり、絶対値における所定値に対する超過分に応じた情報である。変換係数の絶対値は、coeff_abs_level_greater2_flagが「1」の場合には閾値「2」よりも大きい値、すなわち「3」以上の整数値である。したがって、変換係数の絶対値から「3」を引いた値をシンタックス要素とする。coeff_abs_level_minus3は、例えば指数ゴロム(Exponential Golomb)符号化においてゴロムライス(Golomb-Rice)符号を用いた方式で二値化が行われる。 coeff_abs_level_minus3 is a syntax element indicating a value obtained by subtracting “3” from the absolute value of the transform coefficient, and is information according to an excess of the absolute value with respect to a predetermined value. When the coeff_abs_level_greater2_flag is “1”, the absolute value of the conversion coefficient is a value larger than the threshold “2”, that is, an integer value of “3” or more. Therefore, a value obtained by subtracting “3” from the absolute value of the conversion coefficient is used as a syntax element. The coeff_abs_level_minus3 is binarized by a method using a Golomb-Rice code, for example, in exponential Golomb coding.
coeff_sign_flagは、変換係数の符号を示すシンタックス要素である。coeff_sign_flagは、変換係数が正の値である場合にcoeff_sign_flag=0、変換係数が負の値である場合にcoeff_sign_flag=1となる。 coeff_sign_flag is a syntax element indicating the sign of the transform coefficient. coeff_sign_flag is coeff_sign_flag = 0 when the conversion coefficient is a positive value, and coeff_sign_flag = 1 when the conversion coefficient is a negative value.
significant_coeff_flagとcoeff_abs_level_greater1_flagとcoeff_abs_level_greater2_flagは、エンコード・デシジョン処理が行われる。また、coeff_abs_level_minus3とcoeff_sign_flagは、エンコード・バイパス処理が行われる。エンコード・バイパス処理では、発生確率を「0.5」に固定することで、符号演算を簡略化した処理である。 Significant_coeff_flag, coeff_abs_level_greater1_flag, and coeff_abs_level_greater2_flag are subjected to encoding / decision processing. Further, coeff_abs_level_minus3 and coeff_sign_flag are subjected to encoding / bypass processing. The encoding bypass process is a process that simplifies the sign operation by fixing the occurrence probability to “0.5”.
なお、説明は省略するがCABACのシンタックスでは他のシンタックス要素も設けられている。 Although explanation is omitted, other syntax elements are provided in the CABAC syntax.
図4は、符号化ストリームにおけるCABACのシンタックス要素の順序を示している。なお、図4において、「b0」はcoeff_abs_level_greater1_flagの符号化データであることを示している。また、「b1」はcoeff_abs_level_greater2_flagの符号化データ、「Lm3」はcoeff_abs_level_minus3の符号化データ、「s」はcoeff_sign_flagの符号化データであることを示している。なお、図示せずも、significant_coeff_flagの符号化データは、coeff_abs_level_greater1_flagの符号化データの前に設けられている。 FIG. 4 shows the order of CABAC syntax elements in the encoded stream. In FIG. 4, “b0” indicates encoded data of coeff_abs_level_greater1_flag. Further, “b1” indicates encoded data of coeff_abs_level_greater2_flag, “Lm3” indicates encoded data of coeff_abs_level_minus3, and “s” indicates encoded data of coeff_sign_flag. Although not shown, the encoded data of significant_coeff_flag is provided before the encoded data of coeff_abs_level_greater1_flag.
HEVCのテストモデルであるHM3.0では、CABACのシンタックス要素の順序が図4の(A)に示す順序とされている。HM3.0の場合、エンコード・デシジョン処理が行われているシンタックス要素と、エンコード・バイパス処理が行われるシンタックス要素が混在している。 In HM3.0 which is a test model of HEVC, the order of CABAC syntax elements is the order shown in FIG. In the case of HM3.0, a syntax element on which encoding / decision processing is performed and a syntax element on which encoding / bypass processing is performed are mixed.
エンコード・デシジョン処理を行う場合、算術符号化結果に基づき発生確率の更新を行う必要があるため処理が煩雑である。また、エンコード・バイパス処理では、発生確率が「0.5」に固定されていることから、処理が簡単であり例えば1クロックサイクルで複数のデータの符号化処理や復号処理が可能である。したがって、エンコード・デシジョン処理が行われているシンタックス要素と、エンコード・バイパス処理が行われるシンタックス要素が混在していると、符号化処理や復号処理の効率化や高速化を図ることができない。このため、「"Parallel Context Processing of Coefficient Level"Joint Collaborative Team on Video Coding (JCT-VC)of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11 6th Meeting: Torino, IT, 14-22 July, 2011 (JCTVC−F130)」では、図4の(B)に示すように、エンコード・デシジョン処理が行われるシンタックス要素と、エンコード・バイパス処理が行われるシンタックス要素を分離することが提案されている。 When performing the encoding / decision process, it is necessary to update the probability of occurrence based on the arithmetic encoding result, and the process is complicated. In addition, since the occurrence probability is fixed to “0.5” in the encoding / bypass processing, the processing is simple and, for example, a plurality of data encoding processing and decoding processing can be performed in one clock cycle. Therefore, if a syntax element for which encoding / decision processing is performed and a syntax element for performing encoding / bypass processing are mixed, the efficiency and speed of the encoding / decoding processing cannot be improved. . For this reason, "" Parallel Context Processing of Coefficient Level "Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO / IEC JTC1 / SC29 / WG11 6th Meeting: Torino, IT, 14-22 July, In 2011 (JCTVC-F130), as shown in FIG. 4B, it is proposed to separate a syntax element that is subjected to encoding / decision processing from a syntax element that is subjected to encoding / bypass processing. Yes.
ところで、図4の(B)に示す順序の符号化ストリームを復号する場合、例えば、coeff_abs_level_minus3のシンタックス要素の復号では、復号によって得られたbinを1ビットずつ符号の切れ目に該当するか判定される。したがって、エンコード・バイパス処理が行われているシンタックス要素を連続して処理することができない。このため、HEVCのテストモデルであるHM4.0では、図4の(C)に示すように、coeff_sign_flagのシンタックス要素をまとめて、その後coeff_abs_level_minus3のシンタックス要素をまとめることが提案されている。このような順序とすれば、coeff_sign_flagの個数は、先行するsignificant_coeff_flagにより判明するので、符号の切れ目の判定を行うことなくcoeff_sign_flagを連続して復号することが可能となる。 Incidentally, when decoding the encoded stream in the order shown in FIG. 4B, for example, in the decoding of the syntax element of coeff_abs_level_minus3, it is determined whether the bin obtained by decoding corresponds to a code break bit by bit. The Therefore, it is not possible to continuously process syntax elements for which encoding bypass processing has been performed. For this reason, in HM4.0 which is a test model of HEVC, as shown in (C) of FIG. 4, it is proposed that the syntax elements of coeff_sign_flag are put together, and then the syntax elements of coeff_abs_level_minus3 are put together. In such an order, the number of coeff_sign_flags can be determined from the preceding significant_coeff_flag, so that it is possible to continuously decode coeff_sign_flag without determining code breaks.
これらの順序に対して、本技術では、図4の(D)に示すように、coeff_abs_level_greater1_flagの符号化データの次にcoeff_abs_level_greater2_flagの符号化データの順とする。その後、coeff_abs_level_minus3の符号化データ、次にcoeff_sign_flagの符号化データの順とすることで、図4の(A)〜(C)に比べてさらなる効率化および高速化をはかる。 With respect to these orders, in the present technology, as shown in FIG. 4D, the encoded data of coeff_abs_level_greater1_flag is followed by the encoded data of coeff_abs_level_greater2_flag. Thereafter, the encoded data of coeff_abs_level_minus3 and then the encoded data of coeff_sign_flag are arranged in this order, thereby further improving efficiency and speed compared to (A) to (C) of FIG.
図5は、HM4.0の二値化処理動作を例示している。図5の(A)は、変換係数の値を例示している。図5の(B)はcoeff_abs_level_greater1_flagを示している。coeff_abs_level_greater1_flagは、変換係数の絶対値が閾値「1」より大きい場合にcoeff_abs_level_greater1_flag=1、「1」以下である場合にcoeff_abs_level_greater1_flag=0とされている。 FIG. 5 illustrates the binarization processing operation of HM4.0. FIG. 5A illustrates the value of the conversion coefficient. FIG. 5B shows coeff_abs_level_greater1_flag. coeff_abs_level_greater1_flag is set to coeff_abs_level_greater1_flag = 1 when the absolute value of the transform coefficient is larger than the threshold “1”, and coeff_abs_level_greater1_flag = 0 when the absolute value of the conversion coefficient is equal to or smaller than “1”.
図5の(C)は、coeff_abs_level_greater2_flagを示している。coeff_abs_level_greater2_flagは、coeff_abs_level_greater1_flag=1である変換係数について、絶対値が閾値「2」よりも大きい場合にcoeff_abs_level_greater2_flag=1、「2」以下である場合にcoeff_abs_level_greater2_flag=0とされている。 FIG. 5C illustrates coeff_abs_level_greater2_flag. coeff_abs_level_greater2_flag is set to coeff_abs_level_greater2_flag = 0 when the absolute value of coeff_abs_level_greater1_flag = 1 is coeff_abs_level_greater2_flag = 1 when the absolute value is larger than the threshold “2” and equal to or less than “2”.
図5の(D)は、coeff_sign_flagを示している。coeff_sign_flagは、変換係数が正の値である場合にcoeff_sign_flag=0、負の値である場合にcoeff_sign_flag=1とされている。 (D) of FIG. 5 has shown coeff_sign_flag. coeff_sign_flag is set to coeff_sign_flag = 0 when the conversion coefficient is a positive value, and coeff_sign_flag = 1 when the conversion coefficient is a negative value.
図5の(E)は、coeff_abs_level_minus3を示している。coeff_abs_level_minus3は、coeff_abs_level_greater2_flag=1である変換係数について、絶対値から「3」を減算した値とされている。 FIG. 5E shows coeff_abs_level_minus3. coeff_abs_level_minus3 is a value obtained by subtracting “3” from the absolute value for the transform coefficient with coeff_abs_level_greater2_flag = 1.
図6は、本技術の二値化処理動作を例示している。図6の(A)は、変換係数の値を例示している。図6の(B)はcoeff_abs_level_greater1_flagを示している。coeff_abs_level_greater1_flagは、変換係数の絶対値が閾値「1」より大きい場合にcoeff_abs_level_greater1_flag=1、「1」以下である場合にcoeff_abs_level_greater1_flag=0とされている。 FIG. 6 illustrates the binarization processing operation of the present technology. FIG. 6A illustrates the value of the conversion coefficient. FIG. 6B shows coeff_abs_level_greater1_flag. coeff_abs_level_greater1_flag is set to coeff_abs_level_greater1_flag = 1 when the absolute value of the transform coefficient is larger than the threshold “1”, and coeff_abs_level_greater1_flag = 0 when the absolute value of the conversion coefficient is equal to or smaller than “1”.
図6の(C)は、coeff_abs_level_greater2_flagを示している。coeff_abs_level_greater2_flagは、coeff_abs_level_greater1_flag=1である変換係数について、絶対値が閾値「2」よりも大きい場合にcoeff_abs_level_greater2_flag=1、「2」以下である場合にcoeff_abs_level_greater1_flag=0とされている。 (C) of FIG. 6 has shown coeff_abs_level_greater2_flag. The coeff_abs_level_greater2_flag is set to coeff_abs_level_greater1_flag = 0 when the absolute value is greater than the threshold “2” and coeff_abs_level_greater2_flag = 1 when the absolute value is greater than the threshold “2”.
図6の(D)は、coeff_sign_flagを示している。coeff_sign_flagは、変換係数が正の値である場合にcoeff_sign_flag=0、負の値である場合にcoeff_sign_flag=1とされている。 (D) of FIG. 6 has shown coeff_sign_flag. coeff_sign_flag is set to coeff_sign_flag = 0 when the conversion coefficient is a positive value, and coeff_sign_flag = 1 when the conversion coefficient is a negative value.
図6の(E)は、coeff_abs_level_minus3を示している。coeff_abs_level_minus3は、coeff_abs_level_greater2_flag=1である変換係数について、絶対値から3を減算した値とされている。 (E) of FIG. 6 has shown coeff_abs_level_minus3. coeff_abs_level_minus3 is a value obtained by subtracting 3 from the absolute value for the transform coefficient with coeff_abs_level_greater2_flag = 1.
図7は、HM4.0と本技術の復号動作を比較した図である。図7の(A)は、図5に示す二値化処理動作で示された符号化ストリームを例示している。また、図7の(B)は、図7の(A)に示す符号化ストリームの復号結果を示している。図7の(A)に示す順序では、サブブロック1においてcoeff_abs_level_greater1_flagを復号し、次にcoeff_abs_level_greater2_flagを復号する。この時点では変換係数が確定していない。次にcoeff_sign_flagを復号すると、±1と±2の変換係数が確定する。すなわち図5の場合、2個目の変換係数である「2」から10個目の変換係数である「1」までが確定する。しかし、coeff_abs_level_minus3の復号が終わらないと1個目の変換係数「6」が確定しない。また、1個目の変換係数が確定していないことから、正しい順序で復号後の変換係数を出力するためには、変換係数「6」が確定される前に確定している変換係数「2,−1,1・・・1」を例えばバッファに記憶する。また、記憶している変換係数を変換係数「6」の後に正しい順序で出力する必要がある。
FIG. 7 is a diagram comparing the decoding operation of HM4.0 and the present technology. FIG. 7A illustrates the encoded stream shown in the binarization processing operation shown in FIG. Moreover, (B) of FIG. 7 has shown the decoding result of the encoding stream shown to (A) of FIG. In the order shown in FIG. 7A, coeff_abs_level_greater1_flag is decoded in
このように、確定している変換係数をバッファ等に一時記憶することから、バッファ等の容量が少ないと、サブブロック1の伝送が終わり、バッファ等で空きが生じるまでサブブロック2の復号を進めることができない。したがって、復号処理の効率が落ちることになる。なお、図7の(B)では、coeff_abs_level_greater1_flagの復号とcoeff_sign_flagの復号との間に待ち時間を設けて、サブブロック1の伝送の終了時にcoeff_sign_flagの復号が完了して、確定した変換係数をバッファに記憶する場合を例示している。
In this way, since the determined transform coefficient is temporarily stored in the buffer or the like, if the capacity of the buffer or the like is small, the transmission of the
図7の(C)は、図6に示す二値化処理動作で示された符号化ストリームを例示している。また、図7の(D)は、図7の(C)に示す符号化ストリームの復号結果を示している。図7の(C)に示す順序では、サブブロック1においてcoeff_abs_level_greater1_flagを復号し、次にcoeff_abs_level_greater2_flagを復号する。この時点では変換係数が確定していない。その後、coeff_abs_level_minus3を復号すると、各変換係数の絶対値が確定する。次にcoeff_sign_flagを復号すると、各変換係数が出力順に確定することになり、他の変換係数の確定を待つことなく変換係数を図7の(D)に示すように正しい順序で順次出力することができる。
FIG. 7C illustrates an encoded stream indicated by the binarization processing operation shown in FIG. Moreover, (D) of FIG. 7 has shown the decoding result of the encoding stream shown to (C) of FIG. In the order shown in FIG. 7C, coeff_abs_level_greater1_flag is decoded in
このように、符号化ストリームを図7の(C)に示す順序とすれば、図7の(B)に示すように、バッファが空くまで次のサブブロックの復号を待つ必要がない。また、エンコード・デシジョン処理が行われているシンタックス要素と、エンコード・バイパス処理が行われるシンタックス要素が分離されており、coeff_sign_flagは連結しているので、効率よく高速に処理を行うことができる。 In this way, if the encoded streams are in the order shown in FIG. 7C, it is not necessary to wait for decoding of the next sub-block until the buffer becomes free as shown in FIG. 7B. In addition, the syntax element for which encoding / decision processing is performed and the syntax element for which encoding bypass processing is performed are separated, and coeff_sign_flag is connected, so that processing can be performed efficiently and at high speed. .
さらに、coeff_sign_flagを高速処理するために1サイクルで複数個を復号する処理系では、変換係数の出力インタフェースを並列化すれば、変換係数が確定した場合に直ちに出力することができ、サブブロックを連続して復号することが可能となる。 Furthermore, in a processing system that decodes a plurality of coeff_sign_flags in a single cycle in order to process coeff_sign_flag in parallel, if the transform coefficient output interface is parallelized, it can be output immediately when the transform coefficient is determined, and the sub-blocks are continuously connected And can be decrypted.
<4−2.CABAC符号化処理動作>
次に、図4の(D)および図7の(C)に示すように、coeff_abs_level_greater1_flag、coeff_abs_level_greater2_flag、coeff_abs_level_minus3、coeff_sign_flagの順である符号化データを生成するCABAC符号化部160の動作について説明する。
<4-2. CABAC encoding processing operation>
Next, as illustrated in (D) of FIG. 4 and (C) of FIG. 7, an operation of the CABAC encoding unit 160 that generates encoded data in the order of coeff_abs_level_greater1_flag, coeff_abs_level_greater2_flag, coeff_abs_level_minus3, and coeff_sign_flag will be described.
図8は、CABAC符号化部160における符号化処理動作を示すフローチャートである。ステップST31でCABAC符号化部160は、係数個数分のcoeff_abs_level_greater1_flagを符号化する。CABAC符号化部160は、サブブロック内の各変換係数の絶対値と閾値「1」を比較して、比較結果を示すcoeff_abs_level_greater1_flagの算術符号化を行ってステップST32に進む。 FIG. 8 is a flowchart showing the encoding processing operation in the CABAC encoding unit 160. In step ST31, the CABAC encoding unit 160 encodes coeff_abs_level_greater1_flag for the number of coefficients. The CABAC encoding unit 160 compares the absolute value of each transform coefficient in the sub-block with the threshold “1”, performs arithmetic encoding of coeff_abs_level_greater1_flag indicating the comparison result, and proceeds to step ST32.
ステップST32でCABAC符号化部160は、coeff_abs_level_greater1_flag=1である個数分のcoeff_abs_level_greater2_flagを符号化する。CABAC符号化部160は、coeff_abs_level_greater1_flag=1である変換係数の絶対値と閾値「2」を比較して、比較結果を示すcoeff_abs_level_greater2_flagの算術符号化を行ってステップST33に進む。 In step ST32, the CABAC encoding unit 160 encodes coeff_abs_level_greater2_flag for the number of coeff_abs_level_greater1_flag = 1. The CABAC encoding unit 160 compares the absolute value of the transform coefficient with coeff_abs_level_greater1_flag = 1 and the threshold “2”, performs arithmetic encoding of coeff_abs_level_greater2_flag indicating the comparison result, and proceeds to step ST33.
ステップST33でCABAC符号化部160は、coeff_abs_level_greater2_flag=1である変換係数であるか判別する。CABAC符号化部160は、変換係数がcoeff_abs_level_greater2_flag=1である場合にステップST34に進み、coeff_abs_level_greater2_flag=1でない場合にステップST35に進む。 In step ST33, the CABAC encoding unit 160 determines whether the transform coefficient is coeff_abs_level_greater2_flag = 1. The CABAC encoding unit 160 proceeds to step ST34 when the transform coefficient is coeff_abs_level_greater2_flag = 1, and proceeds to step ST35 when the coeff_abs_level_greater2_flag = 1 is not satisfied.
ステップST34でCABAC符号化部160は、coeff_abs_level_minus3を符号化する。CABAC符号化部160は、coeff_abs_level_greater2_flag=1である場合、変換係数の絶対値は「2」よりも大きい。したがって、CABAC符号化部160は、変換係数の絶対値から「3」を減算した値であるcoeff_abs_level_minus3を符号化する。CABAC符号化部160は、coeff_abs_level_minus3のエンコード・バイパス処理を行ってステップST35に進む。 In step ST34, the CABAC encoding unit 160 encodes coeff_abs_level_minus3. The CABAC encoding unit 160, when coeff_abs_level_greater2_flag = 1, has an absolute value of the transform coefficient larger than “2”. Therefore, the CABAC encoding unit 160 encodes coeff_abs_level_minus3, which is a value obtained by subtracting “3” from the absolute value of the transform coefficient. The CABAC encoding part 160 performs the encoding bypass process of coeff_abs_level_minus3, and progresses to step ST35.
ステップST35でCABAC符号化部160は、サブブロック分の符号化が終了したか判別する。CABAC符号化部160は、サブブロック内の変換係数の符号化が終了していない場合にステップST33に戻り、サブブロック内の変換係数の符号化が終了した場合にステップST36に進む。 In step ST35, the CABAC encoding unit 160 determines whether or not the encoding for the sub-block has been completed. The CABAC encoding unit 160 returns to step ST33 when the encoding of the transform coefficient in the subblock is not completed, and proceeds to step ST36 when the encoding of the transform coefficient in the subblock is completed.
ステップST36でCABAC符号化部160は、係数個数分のcoeff_sign_flagを符号化する。CABAC符号化部160は、変換係数が正の値である場合にcoeff_sign_flag=0、負の値である場合にcoeff_sign_flag=1として、係数個数分のcoeff_sign_flagのエンコード・バイパス処理を行う。 In step ST36, the CABAC encoding unit 160 encodes coeff_sign_flag for the number of coefficients. The CABAC encoding unit 160 performs coeff_sign_flag encoding / bypass processing for the number of coefficients with coeff_sign_flag = 0 when the transform coefficient is a positive value and coeff_sign_flag = 1 when the transform coefficient is a negative value.
さらに、CABAC符号化部160は、ステップST31からステップST36の処理をサブブロック単位で繰り返し行うことで、図4の(D)に示すデータ順の符号化データを生成する。 Furthermore, the CABAC encoding unit 160 generates encoded data in the data order shown in FIG. 4D by repeatedly performing the processing from step ST31 to step ST36 in units of sub-blocks.
図9は、CABACのシンタックスを例示している。なお、各行の左端の数字は説明のために付した行番号である。符号化データは、第18行から第37行に示すように、シンタックス要素がcoeff_abs_level_greater1_flag、coeff_abs_level_greater2_flag、coeff_abs_level_minus3、coeff_sign_flagの順とされている。 FIG. 9 illustrates the CABAC syntax. Note that the number at the left end of each line is a line number given for explanation. As shown in the 18th to 37th lines, the encoded data has syntax elements in the order of coeff_abs_level_greater1_flag, coeff_abs_level_greater2_flag, coeff_abs_level_minus3, and coeff_sign_flag.
このように、CABAC符号化部160は、シンタックス要素をcoeff_abs_level_greater1_flag、coeff_abs_level_greater2_flag、coeff_abs_level_minus3、coeff_sign_flagの順とした符号化データを生成する。すなわち、CABAC符号化部160は、復号時における処理の効率化および高速化が可能となるように符号化データを生成できる。 As described above, the CABAC encoding unit 160 generates encoded data in which the syntax elements are in the order of coeff_abs_level_greater1_flag, coeff_abs_level_greater2_flag, coeff_abs_level_minus3, and coeff_sign_flag. That is, the CABAC encoding unit 160 can generate encoded data so that the processing efficiency and speed can be increased during decoding.
<5.画像復号装置の構成>
次に、画像符号化装置から出力される符号化ストリームの復号処理を行う画像復号装置について説明する。入力画像を符号化して生成された符号化ストリームは、所定の伝送路や記録媒体等を介して画像復号装置に供給されて復号される。
<5. Configuration of Image Decoding Device>
Next, an image decoding apparatus that performs decoding processing of an encoded stream output from the image encoding apparatus will be described. An encoded stream generated by encoding an input image is supplied to an image decoding device via a predetermined transmission path, a recording medium, and the like and decoded.
図10は、符号化ストリームの復号を行う画像復号装置の構成を例示している。画像復号装置50は、蓄積バッファ51、可逆復号部52、逆量子化部53、逆直交変換部54、演算部55、デブロッキングフィルタ56、画面並べ替えバッファ57、ディジタル/アナログ変換部(D/A変換部)58を備えている。また、画像復号装置50は、フレームメモリ61、イントラ予測部71、動き補償部72、セレクタ73を備えている。
FIG. 10 illustrates the configuration of an image decoding apparatus that decodes an encoded stream. The
蓄積バッファ51は、伝送されてきた符号化ストリームを蓄積する。可逆復号部52は、蓄積バッファ51より供給された符号化ストリームを、図3に示すCABAC符号化部160の符号化方式に対応する方式で復号する。 The accumulation buffer 51 accumulates the transmitted encoded stream. The lossless decoding unit 52 decodes the encoded stream supplied from the accumulation buffer 51 by a method corresponding to the encoding method of the CABAC encoding unit 160 shown in FIG.
可逆復号部52は、符号化ストリームの可逆復号を行い、種々の情報を取得する。例えば、可逆復号部52は、符号化ストリームを復号して得られた変換係数の量子化データを逆量子化部53に出力する。また、可逆復号部52は、符号化ストリームを復号して得られた予測モード情報をイントラ予測部71に出力する。さらに、可逆復号部52は、符号化ストリームを復号して得られた予測モード情報や動きベクトル情報を動き補償部72に出力する。
The lossless decoding unit 52 performs lossless decoding of the encoded stream and obtains various information. For example, the lossless decoding unit 52 outputs the quantized data of the transform coefficient obtained by decoding the encoded stream to the inverse quantization unit 53. Further, the lossless decoding unit 52 outputs prediction mode information obtained by decoding the encoded stream to the intra prediction unit 71. Further, the lossless decoding unit 52 outputs prediction mode information and motion vector information obtained by decoding the encoded stream to the
逆量子化部53は、図1に示す量子化部15の量子化方式に対応する方式で、可逆復号部52から供給された量子化データの逆量子化を行う。逆直交変換部54は、図1に示す直交変換部14の直交変換方式に対応する方式で逆量子化部53の出力を逆直交変換して演算部55に出力する。
The inverse quantization unit 53 performs inverse quantization on the quantized data supplied from the lossless decoding unit 52 in a method corresponding to the quantization method of the
演算部55は、逆直交変換後のデータとセレクタ73から供給される予測画像データを加算してデコード画像の画像データを生成してデブロッキングフィルタ56とイントラ予測部71に出力する。
The computing unit 55 adds the data after inverse orthogonal transformation and the predicted image data supplied from the selector 73 to generate decoded image data, and outputs the decoded image data to the
デブロッキングフィルタ56は、画像の符号化時に生じるブロック歪みを減少させるためのフィルタ処理を行う。デブロッキングフィルタ56は、演算部55から供給された画像データからブロック歪みを除去するフィルタ処理を行い、フィルタ処理後の画像データを画面並べ替えバッファ57とフレームメモリ61に出力する。
The
画面並べ替えバッファ57は、画像の並べ替えを行う。すなわち、図1に示す画面並べ替えバッファ12により符号化の順番のために並べ替えられたフレームの順番が、元の表示の順番に並べ替えられて、D/A変換部58に出力される。
The
D/A変換部58は、画面並べ替えバッファ57から供給された画像データをD/A変換し、図示せぬディスプレイに出力することでデコード画像を表示させる。
The D / A conversion unit 58 performs D / A conversion on the image data supplied from the
イントラ予測部71は、可逆復号部52から供給された予測モード情報と演算部55から供給された復号画像データに基づいて予測画像データの生成を行い、生成した予測画像データをセレクタ73に出力する。 The intra prediction unit 71 generates predicted image data based on the prediction mode information supplied from the lossless decoding unit 52 and the decoded image data supplied from the calculation unit 55, and outputs the generated predicted image data to the selector 73. .
動き補償部72は、可逆復号部52から供給された予測モード情報と動きベクトル情報に基づきフレームメモリ61から読み出した画像データを用いて動き補償を行い、予測画像データを生成する。動き補償部72は、生成した予測画像データをセレクタ73に出力する。
The
セレクタ73は、可逆復号部52から供給された予測モード情報に基づき、イントラ予測である場合はイントラ予測部71、インター予測である場合は動き補償部72を選択する。セレクタ73は、選択されたイントラ予測部71または動き補償部72で生成された予測画像データを演算部55に出力する。
Based on the prediction mode information supplied from the lossless decoding unit 52, the selector 73 selects the intra prediction unit 71 for intra prediction and the
<6.画像復号装置の動作>
次に、図11のフローチャートを参照して、画像復号装置50の動作について説明する。ステップST51で蓄積バッファ51は、供給された符号化ストリームを蓄積する。ステップST52で可逆復号部52は、可逆復号処理を行う。可逆復号部52は、蓄積バッファ51から供給される符号化ストリームを、図1に示す可逆符号化部16に対応する方式で復号する。可逆復号部52は、符号化ストリームを復号することで得られた変換係数の量子化データを逆量子化部53に出力する。また、可逆復号部52は、符号化ストリームを復号して得られた予測モード情報をイントラ予測部71に出力する。さらに、可逆復号部52は、符号化ストリームを復号して得られた予測モード情報や動きベクトル情報を動き補償部72に出力する。
<6. Operation of Image Decoding Device>
Next, the operation of the
ステップST53において逆量子化部53は、逆量子化処理を行う。逆量子化部53は、可逆復号部52により復号された量子化データを、図1に示す量子化部15の特性に対応する特性で逆量子化する。
In step ST53, the inverse quantization unit 53 performs an inverse quantization process. The inverse quantization unit 53 inversely quantizes the quantized data decoded by the lossless decoding unit 52 with characteristics corresponding to the characteristics of the
ステップST54において逆直交変換部54は、逆直交変換処理を行う。逆直交変換部54は、逆量子化部53により逆量子化された変換係数データを、図1に示す直交変換部14の特性に対応する特性で逆直交変換する。
In step ST54, the inverse
ステップST55において演算部55は、復号画像データの生成を行う。演算部55は、逆直交変換処理を行うことにより得られたデータと、後述するステップST59で選択された予測画像データを加算して復号画像データを生成する。これにより元の画像が復号される。 In step ST55, the calculation unit 55 generates decoded image data. The computing unit 55 adds the data obtained by performing the inverse orthogonal transform process and the predicted image data selected in step ST59 described later to generate decoded image data. As a result, the original image is decoded.
ステップST56においてデブロッキングフィルタ56は、デブロッキングフィルタ処理を行う。デブロッキングフィルタ56は、演算部55より出力された復号画像データをフィルタリングしてブロック歪みを除去する。
In step ST56, the
ステップST57においてフレームメモリ61は、データを記憶する。フレームメモリ61は、デブロッキングフィルタでフィルタリングが行われた復号画像データを記憶する。
In step ST57, the
ステップST58においてイントラ予測部71と動き補償部72は、予測画像データの生成を行う。イントラ予測部71と動き補償部72は、可逆復号部52から供給される予測モード情報に対応してそれぞれ予測画像データの生成を行う。
In step ST58, the intra prediction unit 71 and the
すなわち、可逆復号部52からイントラ予測の予測モード情報が供給された場合、イントラ予測部71は、予測モード情報に基づいて予測画像データを生成する。また、可逆復号部52からインター予測の予測モード情報が供給された場合、動き補償部72は、予測モード情報と動きベクトル情報に基づき動き補償を行い、予測画像データを生成する。
That is, when prediction mode information for intra prediction is supplied from the lossless decoding unit 52, the intra prediction unit 71 generates predicted image data based on the prediction mode information. When inter prediction mode information is supplied from the lossless decoding unit 52, the
ステップST59において、セレクタ73は予測画像データの選択を行う。セレクタ73は、イントラ予測部71から供給された予測画像データと動き補償部72から供給された予測画像データの選択を行い、選択した予測画像データを演算部55に供給して、ステップST55において逆直交変換部54の出力と加算させる。
In step ST59, the selector 73 selects predicted image data. The selector 73 selects the prediction image data supplied from the intra prediction unit 71 and the prediction image data supplied from the
ステップST60において画面並べ替えバッファ57は、画像並べ替えを行う。すなわち画面並べ替えバッファ57は、図1に示す画像符号化装置10の画面並べ替えバッファ12により符号化のために並べ替えられたフレームの順序が、元の表示の順序に並べ替えられる。
In step ST60, the
ステップST61において、D/A変換部58は、画面並べ替えバッファ57からの画像データをD/A変換する。この画像が図示せぬディスプレイに出力され、画像が表示される。
In step ST61, the D / A converter 58 D / A converts the image data from the
<7.CABAC復号部の構成>
図12は、可逆復号部52においてCABAC復号処理を行うCABAC復号部の構成を例示している。CABAC復号部520は、蓄積バッファ51から符号化データを受け取り、二値化データに復号した後に多値化データに変換する。CABAC復号部520は、コンテキスト算出部521と算術復号処理部522および多値化部523を備えている。
<7. Configuration of CABAC Decoding Unit>
FIG. 12 illustrates the configuration of a CABAC decoding unit that performs CABAC decoding processing in the lossless decoding unit 52. The
コンテキスト算出部521は、復号するシンタックスに基づきコンテキストインデックスを生成する。また、コンテキスト算出部521は、コンテキストインデックスに対応したコンテキストを選択して算術復号処理部522に出力する。また、コンテキスト算出部521は、算術復号処理部522で得られた算術復号結果に基づき発生確率の更新を行う。
The
算術復号処理部522は、蓄積バッファ51から入力された符号化データとコンテキストに基づき、算術符号化処理部163に対して逆の処理を行い二値化データを生成する。また、算術復号処理部522は、コンテキストを参照する復号モードであるデコード・デシジョン(DecodeDecision)処理と、コンテキストを参照しない復号モードであるデコード・バイパス(DecodeBypass)処理が設けられている。なお、復号モードとしては、デコード・ターミネイト(DecodeTerminate)処理が設けられているが、説明は省略する。算術復号処理部522は、シンタックスに応じて復号モードを選択して符号化データの復号を行う。例えば、算術復号処理部522は、1つ係数の符号化データを復号する際、エンコード・デシジョン処理が行われたシンタックス要素については、コンテキスト算出部521から供給されたコンテキストに基づいて復号処理を行う。また、エンコード・バイパス処理が行われたシンタックス要素については、デコード・バイパス処理を行う。算術復号処理部522は、算術復号結果である二値化データを多値化部523に出力する。また、算術復号処理部522は、算術復号結果をコンテキスト算出部521に出力する。
The arithmetic decoding processing unit 522 performs reverse processing on the arithmetic coding processing unit 163 based on the encoded data and context input from the accumulation buffer 51 to generate binary data. The arithmetic decoding processing unit 522 is provided with a decoding decision (DecodeDecision) process that is a decoding mode that refers to a context, and a decoding bypass (DecodeBypass) process that is a decoding mode that does not refer to a context. Note that, as a decoding mode, a decode termination process is provided, but a description thereof is omitted. The arithmetic decoding processor 522 selects a decoding mode according to the syntax and decodes the encoded data. For example, when decoding the encoded data of one coefficient, the arithmetic decoding processing unit 522 performs a decoding process based on the context supplied from the
多値化部523は、CABAC符号化部160の二値化部161に対応した処理を行い、算術復号処理部522から供給された二値化データを二値化が行われる前の量子化データに戻して逆量子化部53に出力する。また、可逆復号処理を行うことにより得られた予測モード情報等をイントラ予測部71や動き補償部72に出力する。
The multi-value quantization unit 523 performs processing corresponding to the binarization unit 161 of the CABAC encoding unit 160, and the quantized data before binarization of the binarized data supplied from the arithmetic decoding processing unit 522 is performed. And output to the inverse quantization unit 53. In addition, prediction mode information and the like obtained by performing the lossless decoding process are output to the intra prediction unit 71 and the
<8.CABAC復号部の動作>
図13は可逆復号部におけるCABAC復号部の動作を示すフローチャートである。ステップST71でCABAC復号部520は、係数個数分のcoeff_abs_level_greater1_flagを復号する。CABAC復号部520は、デコード・デシジョン処理を行い、係数個数分のcoeff_abs_level_greater1_flagを生成してステップST72に進む。
<8. Operation of CABAC decoding unit>
FIG. 13 is a flowchart showing the operation of the CABAC decoding unit in the lossless decoding unit. In step ST71, the
ステップST72でCABAC復号部520は、coeff_abs_level_greater1_flag=1である個数分のcoeff_abs_level_greater2_flagを復号する。CABAC復号部520は、デコード・デシジョン処理を行い、coeff_abs_level_greater1_flag=1である個数分のcoeff_abs_level_greater1_flagを生成してステップST73に進む。
In step ST72, the
ステップST73でCABAC復号部520は、coeff_abs_level_greater2_flag=1の変換係数の復号であるか判別する。CABAC復号部520は、coeff_abs_level_greater2_flag=1である場合にステップST74に進み、coeff_abs_level_greater2_flag=1でない場合にステップST76に進む。
In step ST <b> 73, the
ステップST74でCABAC復号部520は、1ビット復号を行う。CABAC復号部520は、1ビットのデコード・バイパス処理を行ってステップST75に進む。
In step ST74, the
ステップST75でCABAC復号部520は、coeff_abs_level_minus3の復号が終了したか判別する。CABAC復号部520は、coeff_abs_level_minus3の復号結果が得られていない場合にステップST74に戻り、coeff_abs_level_minus3の復号結果が得られた場合にステップST76に進む。
In step ST75, the
ステップST76でCABAC復号部520は、サブブロック分の復号が終了したか判別する。CABAC復号部520は、サブブロック分の復号処理結果が得られていない場合にステップST73に戻り、サブブロック分の復号処理結果が得られた場合にステップST77に進む。
In step ST76, the
ステップST77でCABAC復号部520は、係数個数分のcoeff_sign_flagを復号する。CABAC復号部520は、デコード・バイパス処理を行って係数個数分のcoeff_sign_flagを復号する。
In step ST77, the
さらに、CABAC復号部520は、ステップST71からステップST77の処理をサブブロック単位で繰り返し行うことで、図4の(D)に示すデータ順の符号化データを正しく復号する。
Further,
また、CABAC復号部520は、coeff_sign_flagを復号する毎に正しい順序で変換係数が順次確定されるので、既に確定されている変換係数を正しい順序で出力するためバッファに格納する必要がないことから復号処理を効率よく行うことができる。また、coeff_sign_flagをまとめて処理することで高速に復号処理を行うことができる。
In addition, since the transform coefficients are sequentially determined in the correct order every time coeff_sign_flag is decoded, the
<9.ソフトウェア処理の場合>
明細書中において説明した一連の処理はハードウェア、またはソフトウェア、または両者の複合構成によって実行することが可能である。ソフトウェアによる処理を実行する場合は、処理シーケンスを記録したプログラムを、専用のハードウェアに組み込まれたコンピュータ内のメモリにインストールして実行させる。または、各種処理が実行可能な汎用コンピュータにプログラムをインストールして実行させることも可能である。
<9. For software processing>
The series of processes described in the specification can be executed by hardware, software, or a combined configuration of both. When processing by software is executed, a program in which a processing sequence is recorded is installed and executed in a memory in a computer incorporated in dedicated hardware. Alternatively, the program can be installed and executed on a general-purpose computer capable of executing various processes.
例えば、プログラムは記録媒体としてのハードディスクやROM(Read Only Memory)に予め記録しておくことができる。または、プログラムはフレキシブルディスク、CD−ROM(Compact Disc Read Only Memory),MO(Magneto optical)ディスク,DVD(Digital Versatile Disc)、磁気ディスク、半導体メモリなどのリムーバブル記録媒体に、一時的または永続的に格納(記録)しておくことができる。このようなリムーバブル記録媒体は、いわゆるパッケージソフトウェアとして提供することができる。 For example, the program can be recorded in advance on a hard disk or ROM (Read Only Memory) as a recording medium. Alternatively, the program is temporarily or permanently stored on a removable recording medium such as a flexible disk, a CD-ROM (Compact Disc Read Only Memory), an MO (Magneto optical) disk, a DVD (Digital Versatile Disc), a magnetic disk, or a semiconductor memory. It can be stored (recorded). Such a removable recording medium can be provided as so-called package software.
なお、プログラムは、上述したようなリムーバブル記録媒体からコンピュータにインストールする他、ダウンロードサイトから、コンピュータに無線転送したり、LAN(Local Area Network)、インターネットといったネットワークを介して、コンピュータに有線で転送する。コンピュータでは、そのようにして転送されてくるプログラムを受信し、内蔵するハードディスク等の記録媒体にインストールすることができる。 The program is installed on the computer from the removable recording medium as described above, or is wirelessly transferred from the download site to the computer, or is wired to the computer via a network such as a LAN (Local Area Network) or the Internet. . The computer can receive the program transferred in this way and install it on a recording medium such as a built-in hard disk.
プログラムを記述するステップは、記載された順序に沿って時系列的に行われる処理はもちろん、必ずしも時系列的に処理されなくとも、並列的あるいは個別に実行される処理をも含むものである。 The step of describing the program includes not only the processing that is performed in time series in the order described, but also the processing that is not necessarily performed in time series but is executed in parallel or individually.
<10.電子機器に適用した場合>
また、上述した画像符号化装置10や画像復号装置50は、任意の電子機器に適用することができる。以下にその例について説明する。
<10. When applied to electronic devices>
Further, the
図14は、本技術を適用したテレビジョン装置の概略構成を例示している。テレビジョン装置90は、アンテナ901、チューナ902、デマルチプレクサ903、デコーダ904、映像信号処理部905、表示部906、音声信号処理部907、スピーカ908、外部インタフェース部909を有している。さらに、テレビジョン装置90は、制御部910、ユーザインタフェース部911等を有している。
FIG. 14 illustrates a schematic configuration of a television apparatus to which the present technology is applied. The
チューナ902は、アンテナ901で受信された放送波信号から所望のチャンネルを選局して復調を行い、得られた符号化ビットストリームをデマルチプレクサ903に出力する。
The
デマルチプレクサ903は、符号化ビットストリームから視聴対象である番組の映像や音声のパケットを抽出して、抽出したパケットのデータをデコーダ904に出力する。また、デマルチプレクサ903は、EPG(Electronic Program Guide)等のデータのパケットを制御部910に供給する。なお、スクランブルが行われている場合、デマルチプレクサ等でスクランブルの解除を行う。
The
デコーダ904は、パケットの復号処理を行い、復号処理化によって生成された映像データを映像信号処理部905、音声データを音声信号処理部907に出力する。
The
映像信号処理部905は、映像データに対して、ノイズ除去やユーザ設定に応じた映像処理等を行う。映像信号処理部905は、表示部906に表示させる番組の映像データや、ネットワークを介して供給されるアプリケーションに基づく処理による画像データなどを生成する。また、映像信号処理部905は、項目の選択などのメニュー画面等を表示するための映像データを生成し、それを番組の映像データに重畳する。映像信号処理部905は、このようにして生成した映像データに基づいて駆動信号を生成して表示部906を駆動する。
The video
表示部906は、映像信号処理部905からの駆動信号に基づき表示デバイス(例えば液晶表示素子等)を駆動して、番組の映像などを表示させる。
The
音声信号処理部907は、音声データに対してノイズ除去などの所定の処理を施し、処理後の音声データのD/A変換処理や増幅処理を行い、スピーカ908に供給することで音声出力を行う。
The audio
外部インタフェース部909は、外部機器やネットワークと接続するためのインタフェースであり、映像データや音声データ等のデータ送受信を行う。
The
制御部910にはユーザインタフェース部911が接続されている。ユーザインタフェース部911は、操作スイッチやリモートコントロール信号受信部等で構成されており、ユーザ操作に応じた操作信号を制御部910に供給する。
A
制御部910は、CPU(Central Processing Unit)やメモリ等を用いて構成されている。メモリは、CPUにより実行されるプログラムやCPUが処理を行う上で必要な各種のデータ、EPGデータ、ネットワークを介して取得されたデータ等を記憶する。メモリに記憶されているプログラムは、テレビジョン装置90の起動時などの所定のタイミングでCPUにより読み出されて実行される。CPUは、プログラムを実行することで、テレビジョン装置90がユーザ操作に応じた動作となるように各部を制御する。
The control unit 910 is configured using a CPU (Central Processing Unit), a memory, and the like. The memory stores a program executed by the CPU, various data necessary for the CPU to perform processing, EPG data, data acquired via a network, and the like. The program stored in the memory is read and executed by the CPU at a predetermined timing such as when the
なお、テレビジョン装置90では、チューナ902、デマルチプレクサ903、映像信号処理部905、音声信号処理部907、外部インタフェース部909等と制御部910を接続するためバス912が設けられている。
Note that the
このように構成されたテレビジョン装置では、デコーダ904に本技術の画像処理装置(画像処理方法)の機能が設けられる。このため、放送局側で本技術の画像処理装置の機能を用いることにより、テレビジョン装置で符号化ストリームの復号を効率よく行うことができる。
In the television device configured as described above, the
図15は、本技術を適用した携帯電話機の概略構成を例示している。携帯電話機92は、通信部922、音声コーデック923、カメラ部926、画像処理部927、多重分離部928、記録再生部929、表示部930、制御部931を有している。これらは、バス933を介して互いに接続されている。また、通信部922にはアンテナ921が接続されており、音声コーデック923には、スピーカ924とマイクロホン925が接続されている。さらに制御部931には、操作部932が接続されている。
FIG. 15 illustrates a schematic configuration of a mobile phone to which the present technology is applied. The
携帯電話機92は、音声通話モードやデータ通信モード等の各種モードで、音声信号の送受信、電子メールや画像データの送受信、画像撮影、またはデータ記録等の各種動作を行う。
The
音声通話モードにおいて、マイクロホン925で生成された音声信号は、音声コーデック923で音声データへの変換やデータ圧縮が行われて通信部922に供給される。通信部922は、音声データの変調処理や周波数変換処理等を行い、送信信号を生成する。また、通信部922は、送信信号をアンテナ921に供給して図示しない基地局へ送信する。また、通信部922は、アンテナ921で受信した受信信号の増幅や周波数変換処理および復調処理等を行い、得られた音声データを音声コーデック923に供給する。音声コーデック923は、音声データのデータ伸張やアナログ音声信号への変換を行いスピーカ924に出力する。
In the voice call mode, the voice signal generated by the
また、データ通信モードにおいて、メール送信を行う場合、制御部931は、操作部932の操作によって入力された文字データを受け付けて、入力された文字を表示部930に表示する。また、制御部931は、操作部932におけるユーザ指示等に基づいてメールデータを生成して通信部922に供給する。通信部922は、メールデータの変調処理や周波数変換処理等を行い、得られた送信信号をアンテナ921から送信する。また、通信部922は、アンテナ921で受信した受信信号の増幅や周波数変換処理および復調処理等を行い、メールデータを復元する。このメールデータを、表示部930に供給して、メール内容の表示を行う。
In addition, when mail transmission is performed in the data communication mode, the control unit 931 accepts character data input by operating the operation unit 932 and displays the input characters on the display unit 930. In addition, the control unit 931 generates mail data based on a user instruction or the like in the operation unit 932 and supplies the mail data to the
なお、携帯電話機92は、受信したメールデータを、記録再生部929で記憶媒体に記憶させることも可能である。記憶媒体は、書き換え可能な任意の記憶媒体である。例えば、記憶媒体は、RAMや内蔵型フラッシュメモリ等の半導体メモリ、ハードディスク、磁気ディスク、光磁気ディスク、光ディスク、USBメモリ、またはメモリカード等のリムーバブルメディアである。
Note that the
データ通信モードにおいて画像データを送信する場合、カメラ部926で生成された画像データを、画像処理部927に供給する。画像処理部927は、画像データの符号化処理を行い、符号化データを生成する。
When transmitting image data in the data communication mode, the image data generated by the
多重分離部928は、画像処理部927で生成された符号化データと、音声コーデック923から供給された音声データを所定の方式で多重化して通信部922に供給する。通信部922は、多重化データの変調処理や周波数変換処理等を行い、得られた送信信号をアンテナ921から送信する。また、通信部922は、アンテナ921で受信した受信信号の増幅や周波数変換処理および復調処理等を行い、多重化データを復元する。この多重化データを多重分離部928に供給する。多重分離部928は、多重化データの分離を行い、符号化データを画像処理部927、音声データを音声コーデック923に供給する。画像処理部927は、符号化データの復号処理を行い、画像データを生成する。この画像データを表示部930に供給して、受信した画像の表示を行う。音声コーデック923は、音声データをアナログ音声信号に変換してスピーカ924に供給して、受信した音声を出力する。
The
このように構成された携帯電話装置では、画像処理部927に本技術の画像処理装置(画像処理方法)の機能が設けられる。したがって、画像データの通信を行う際に、復号を効率よく行うことができるように通信データを生成できる。また、通信データの復号処理を効率よく行うことができる。
In the mobile phone device configured as described above, the
図16は、本技術を適用した記録再生装置の概略構成を例示している。記録再生装置94は、例えば受信した放送番組のオーディオデータとビデオデータを、記録媒体に記録して、その記録されたデータをユーザの指示に応じたタイミングでユーザに提供する。また、記録再生装置94は、例えば他の装置からオーディオデータやビデオデータを取得し、それらを記録媒体に記録させることもできる。さらに、記録再生装置94は、記録媒体に記録されているオーディオデータやビデオデータを復号して出力することで、モニタ装置等において画像表示や音声出力を行うことができるようにする。 FIG. 16 illustrates a schematic configuration of a recording / reproducing apparatus to which the present technology is applied. The recording / reproducing apparatus 94 records, for example, audio data and video data of a received broadcast program on a recording medium, and provides the recorded data to the user at a timing according to a user instruction. The recording / reproducing device 94 can also acquire audio data and video data from another device, for example, and record them on a recording medium. Furthermore, the recording / reproducing device 94 decodes and outputs the audio data and video data recorded on the recording medium, thereby enabling image display and audio output on the monitor device or the like.
記録再生装置94は、チューナ941、外部インタフェース部942、エンコーダ943、HDD(Hard Disk Drive)部944、ディスクドライブ945、セレクタ946、デコーダ947、OSD(On-Screen Display)部948、制御部949、ユーザインタフェース部950を有している。
The recording / reproducing apparatus 94 includes a
チューナ941は、図示しないアンテナで受信された放送信号から所望のチャンネルを選局する。チューナ941は、所望のチャンネルの受信信号を復調して得られた符号化ビットストリームをセレクタ946に出力する。
The
外部インタフェース部942は、IEEE1394インタフェース、ネットワークインタフェース部、USBインタフェース、フラッシュメモリインタフェース等の少なくとも何れかで構成されている。外部インタフェース部942は、外部機器やネットワーク、メモリカード等と接続するためのインタフェースであり、記録する映像データや音声データ等のデータ受信を行う。
The
エンコーダ943は、外部インタフェース部942から供給された映像データや音声データが符号化されていないとき所定の方式で符号化を行い、符号化ビットストリームをセレクタ946に出力する。
The
HDD部944は、映像や音声等のコンテンツデータ、各種プログラムやその他のデータ等を内蔵のハードディスクに記録し、また再生時等にそれらを当該ハードディスクから読み出す。 The HDD unit 944 records content data such as video and audio, various programs, and other data on a built-in hard disk, and reads them from the hard disk at the time of reproduction or the like.
ディスクドライブ945は、装着されている光ディスクに対する信号の記録および再生を行う。光ディスク、例えばDVDディスク(DVD−Video、DVD−RAM、DVD−R、DVD−RW、DVD+R、DVD+RW等)やBlu−ray(登録商標)ディスク等である。
The
セレクタ946は、映像や音声の記録時には、チューナ941またはエンコーダ943からの何れかの符号化ビットストリームを選択して、HDD部944やディスクドライブ945の何れかに供給する。また、セレクタ946は、映像や音声の再生時に、HDD部944またはディスクドライブ945から出力された符号化ビットストリームをデコーダ947に供給する。
The
デコーダ947は、符号化ビットストリームの復号化処理を行う。デコーダ947は、復号処理化を行うことにより生成された映像データをOSD部948に供給する。また、デコーダ947は、復号処理化を行うことにより生成された音声データを出力する。OSD部948は、項目の選択などのメニュー画面等を表示するための映像データを生成し、それをデコーダ947から出力された映像データに重畳して出力する。
The
制御部949には、ユーザインタフェース部950が接続されている。ユーザインタフェース部950は、操作スイッチやリモートコントロール信号受信部等で構成されており、ユーザ操作に応じた操作信号を制御部949に供給する。
A
制御部949は、CPUやメモリ等を用いて構成されている。メモリは、CPUにより実行されるプログラムやCPUが処理を行う上で必要な各種のデータを記憶する。メモリに記憶されているプログラムは、記録再生装置94の起動時などの所定のタイミングでCPUにより読み出されて実行される。CPUは、プログラムを実行することで、記録再生装置94がユーザ操作に応じた動作となるように各部を制御する。
The
このように構成された記録再生装置では、エンコーダ943とデコーダ947に本技術の画像処理装置(画像処理方法)の機能が設けられて、映像の記録再生を高速に行うことができる。
In the recording / reproducing apparatus configured as described above, the function of the image processing apparatus (image processing method) of the present technology is provided in the
図17は、本技術を適用した撮像装置の概略構成を例示している。撮像装置96は、被写体を撮像し、被写体の画像を表示部に表示させたり、それを画像データとして、記録媒体に記録する。
FIG. 17 illustrates a schematic configuration of an imaging apparatus to which the present technology is applied. The
撮像装置96は、光学ブロック961、撮像部962、カメラ信号処理部963、画像データ処理部964、表示部965、外部インタフェース部966、メモリ部967、メディアドライブ968、OSD部969、制御部970を有している。また、制御部970には、ユーザインタフェース部971が接続されている。さらに、画像データ処理部964や外部インタフェース部966、メモリ部967、メディアドライブ968、OSD部969、制御部970等は、バス972を介して接続されている。
The
光学ブロック961は、フォーカスレンズや絞り機構等を用いて構成されている。光学ブロック961は、被写体の光学像を撮像部962の撮像面に結像させる。撮像部962は、CCDまたはCMOSイメージセンサを用いて構成されており、光電変換によって光学像に応じた電気信号を生成してカメラ信号処理部963に供給する。 The optical block 961 is configured using a focus lens, a diaphragm mechanism, and the like. The optical block 961 forms an optical image of the subject on the imaging surface of the imaging unit 962. The imaging unit 962 is configured using a CCD or CMOS image sensor, generates an electrical signal corresponding to the optical image by photoelectric conversion, and supplies the electrical signal to the camera signal processing unit 963.
カメラ信号処理部963は、撮像部962から供給された電気信号に対してニー補正やガンマ補正、色補正等の種々のカメラ信号処理を行う。カメラ信号処理部963は、カメラ信号処理後の画像データを画像データ処理部964に供給する。
The camera signal processing unit 963 performs various camera signal processes such as knee correction, gamma correction, and color correction on the electrical signal supplied from the imaging unit 962. The camera signal processing unit 963 supplies the image data after the camera signal processing to the image
画像データ処理部964は、カメラ信号処理部963から供給された画像データの符号化処理を行う。画像データ処理部964は、符号化処理を行うことにより生成された符号化データを外部インタフェース部966やメディアドライブ968に供給する。また、画像データ処理部964は、外部インタフェース部966やメディアドライブ968から供給された符号化データの復号化処理を行う。画像データ処理部964は、復号化処理を行うことにより生成された画像データを表示部965に供給する。また、画像データ処理部964は、カメラ信号処理部963から供給された画像データを表示部965に供給する処理や、OSD部969から取得した表示用データを、画像データに重畳させて表示部965に供給する。OSD部969は、記号、文字、または図形からなるメニュー画面やアイコンなどの表示用データを生成して画像データ処理部964に出力する。
The image
外部インタフェース部966は、例えば、USB入出力端子などで構成され、画像の印刷を行う場合に、プリンタと接続される。また、外部インタフェース部966には、必要に応じてドライブが接続され、磁気ディスク、光ディスク等のリムーバブルメディアが適宜装着され、それらから読み出されたコンピュータプログラムが、必要に応じて、インストールされる。さらに、外部インタフェース部966は、LANやインターネット等の所定のネットワークに接続されるネットワークインタフェースを有する。制御部970は、例えば、ユーザインタフェース部971からの指示にしたがって、メモリ部967から符号化データを読み出し、それを外部インタフェース部966から、ネットワークを介して接続される他の装置に供給させることができる。また、制御部970は、ネットワークを介して他の装置から供給される符号化データや画像データを、外部インタフェース部966を介して取得し、それを画像データ処理部964に供給したりすることができる。
The external interface unit 966 includes, for example, a USB input / output terminal, and is connected to a printer when printing an image. In addition, a drive is connected to the external interface unit 966 as necessary, a removable medium such as a magnetic disk or an optical disk is appropriately mounted, and a computer program read from them is installed as necessary. Furthermore, the external interface unit 966 has a network interface connected to a predetermined network such as a LAN or the Internet. For example, the
メディアドライブ968で駆動される記録メディアとしては、例えば、磁気ディスク、光磁気ディスク、光ディスク、または半導体メモリ等の、読み書き可能な任意のリムーバブルメディアが用いられる。また、記録メディアは、リムーバブルメディアとしての種類も任意であり、テープデバイスであってもよいし、ディスクであってもよいし、メモリカードであってもよい。もちろん、非接触ICカード等であってもよい。 As a recording medium driven by the media drive 968, any readable / writable removable medium such as a magnetic disk, a magneto-optical disk, an optical disk, or a semiconductor memory is used. The recording medium may be any type of removable medium, and may be a tape device, a disk, or a memory card. Of course, a non-contact IC card or the like may be used.
また、メディアドライブ968と記録メディアを一体化し、例えば、内蔵型ハードディスクドライブやSSD(Solid State Drive)等のように、非可搬性の記憶媒体により構成されるようにしてもよい。 Further, the media drive 968 and the recording medium may be integrated and configured by a non-portable storage medium such as a built-in hard disk drive or an SSD (Solid State Drive).
制御部970は、CPUやメモリ等を用いて構成されている。メモリは、CPUにより実行されるプログラムやCPUが処理を行う上で必要な各種のデータ等を記憶する。メモリに記憶されているプログラムは、撮像装置96の起動時などの所定のタイミングでCPUにより読み出されて実行される。CPUは、プログラムを実行することで、撮像装置96がユーザ操作に応じた動作となるように各部を制御する。
The
このように構成された撮像装置では、画像データ処理部964に本技術の画像処理装置(画像処理方法)の機能が設けられる。したがって、撮像画像をメモリ部967や記録メディア等に記録する場合や記録されている撮像画像を再生する際に、効率よく記録再生を行うことができる。
In the imaging apparatus configured as described above, the image
また、本技術は上述した技術の実施の形態に限定して解釈されるべきではない。この技術の実施の形態は、例示という形態で本技術を開示しており、本技術の要旨を逸脱しない範囲で当業者が実施の形態の修正や代用をなし得ることは自明である。すなわち、本技術の要旨を判断するためには、特許請求の範囲を参酌すべきである。 Further, the present technology should not be construed as being limited to the embodiments of the technology described above. The embodiments of this technology disclose the present technology in the form of examples, and it is obvious that those skilled in the art can make modifications and substitutions of the embodiments without departing from the gist of the present technology. That is, in order to determine the gist of the present technology, the claims should be taken into consideration.
なお、本技術の画像処理装置は以下のような構成も取ることができる。
(1) 量子化後の変換係数の絶対値と閾値「m」を比較して前記絶対値が前記閾値「m」より大きい場合に閾値を「m=m+1」として比較を行い、閾値が「m=1」から所定値となるまでの比較結果を示す第1の情報と、前記絶対値の前記所定値に対する超過分に応じた第2の情報と、前記変換係数の符号を示す第3の情報をそれぞれシンタックス要素として、第1の情報,第2の情報,第3の情報の順に符号化した符号化データに対して、算術復号処理を行う算術復号処理部と、
前記算術復号処理部で算術復号処理を行うことにより得られた二値化データの多値化を行い、符号化前の前記変換係数を生成する多値化部と
を備える画像処理装置。
(2) 前記算術復号処理部は、確率状態および優勢確率シンボルを表すコンテキストを参照するモードで前記第1の情報の復号処理を行い、前記コンテキストを参照しないモードで前記第2の情報および第3の情報の復号処理を行う(1)に記載の画像処理装置。
(3) 前記符号化データは、前記所定数を「m=2」として生成されたデータである(1)また(2)に記載の画像処理装置。
(4) 前記符号化データは、サブブロック単位で前記変換係数を符号化したデータである(1)乃至(3)の何れかに記載の画像処理装置。
(5) 量子化後の変換係数の絶対値と閾値「m」を比較して前記絶対値が前記閾値「m」より大きい場合に閾値を「m=m+1」として比較を行い、閾値が「m=1」から所定値となるまでの比較結果を示す第1の情報と、前記絶対値の前記所定値に対する超過分に応じた第2の情報と、前記変換係数の符号を示す第3の情報をそれぞれシンタックス要素として、第1の情報,第2の情報,第3の情報の順に二値化する二値化部と、
前記二値化部で得られた二値化データの算術符号化処理を行い、符号化データを生成する算術符号化処理部と
を備える画像処理装置。
(6) 前記算術符号化処理部は、確率状態および優勢確率シンボルを表すコンテキストを参照するモードで前記第1の情報の符号化処理を行い、前記コンテキストを参照しないモードで前記第2の情報および第3の情報の符号化処理を行う(5)に記載の画像処理装置。
(7) 前記二値化部は、前記所定数を「m=2」として前記二値化データを生成する(5)または(6)に記載の画像処理装置。
(8) 前記二値化部と前記算術符号化処理部は、サブブロック単位で前記変換係数の二値化と符号化処理を行う(5)乃至(7)の何れかに記載の画像処理装置。
Note that the image processing apparatus of the present technology may also have the following configuration.
(1) The absolute value of the transform coefficient after quantization is compared with the threshold “m”, and when the absolute value is greater than the threshold “m”, the threshold is set to “m = m + 1”. = 1 ”to a predetermined value, first information indicating a comparison result, second information corresponding to an excess of the absolute value with respect to the predetermined value, and third information indicating a sign of the conversion coefficient Each of which is a syntax element, an arithmetic decoding processing unit that performs arithmetic decoding processing on encoded data encoded in the order of the first information, the second information, and the third information;
An image processing apparatus comprising: a multi-value quantization unit that multi-values binarized data obtained by performing arithmetic decoding processing in the arithmetic decoding processing unit and generates the transform coefficient before encoding.
(2) The arithmetic decoding processing unit performs the decoding process of the first information in a mode that refers to a context representing a probability state and a dominant probability symbol, and performs the second information and the third in a mode that does not refer to the context. (1) The image processing apparatus according to (1).
(3) The encoded data is the image processing apparatus according to (1) or (2), wherein the encoded data is data generated with the predetermined number being “m = 2”.
(4) The image processing device according to any one of (1) to (3), wherein the encoded data is data obtained by encoding the transform coefficient in subblock units.
(5) The quantized transform coefficient absolute value is compared with the threshold “m”, and when the absolute value is greater than the threshold “m”, the threshold is set to “m = m + 1”. = 1 ”to a predetermined value, first information indicating a comparison result, second information corresponding to an excess of the absolute value with respect to the predetermined value, and third information indicating a sign of the conversion coefficient Each of which is a syntax element, and a binarization unit that binarizes the first information, the second information, and the third information in order,
An image processing apparatus comprising: an arithmetic encoding processing unit that performs arithmetic encoding processing of binarized data obtained by the binarizing unit and generates encoded data.
(6) The arithmetic coding processing unit performs coding processing of the first information in a mode that refers to a context representing a probability state and a dominant probability symbol, and performs the second information and a mode that does not refer to the context. The image processing device according to (5), wherein the third information is encoded.
(7) The image processing apparatus according to (5) or (6), wherein the binarization unit generates the binarized data by setting the predetermined number to “m = 2”.
(8) The image processing device according to any one of (5) to (7), wherein the binarization unit and the arithmetic coding processing unit perform binarization and coding processing of the transform coefficient in units of sub-blocks. .
本技術の画像処理装置と画像処理方法では、量子化後の変換係数の絶対値と閾値「m」を比較して絶対値が閾値「m」より大きい場合に閾値を「m=m+1」として比較を行い、閾値が「m=1」から所定値となるまでの比較結果を示す第1の情報と、絶対値における所定値に対する超過分に応じた第2の情報と、変換係数の符号を示す第3の情報をそれぞれシンタックス要素として、第1の情報,第2の情報,第3の情報の順に符号化した符号化データの生成や復号が行われる。このようなシンタックス要素の順とすることで、復号時に変換係数を順に確定できる。また、情報の符号化処理や復号処理をまとめて行うことが可能となる。したがって、CABACの符号化処理や復号処理を効率よく行うことができる。また、本技術は、ブロック単位で符号化を行うことにより得られた符号化ストリームを、衛星放送、ケーブルTV、インターネット、携帯電話などのネットワークメディアを介して送受信する電子機器や、光ディスク、磁気ディスク、フラッシュメモリのような記憶メディアを用いて画像の記録再生を行う電子機器に適している。 In the image processing apparatus and the image processing method of the present technology, the absolute value of the transform coefficient after quantization and the threshold “m” are compared, and when the absolute value is larger than the threshold “m”, the threshold is set to “m = m + 1”. The first information indicating the comparison result until the threshold value reaches the predetermined value from “m = 1”, the second information according to the absolute value exceeding the predetermined value, and the sign of the transform coefficient Using the third information as a syntax element, generation and decoding of encoded data encoded in the order of the first information, the second information, and the third information are performed. By setting the order of such syntax elements, transform coefficients can be determined in order at the time of decoding. Also, it is possible to perform information encoding processing and decoding processing together. Therefore, CABAC encoding processing and decoding processing can be performed efficiently. In addition, the present technology provides an electronic device, an optical disc, a magnetic disc, and the like that transmits / receives an encoded stream obtained by performing encoding in block units via network media such as satellite broadcasting, cable TV, the Internet, and a mobile phone. It is suitable for an electronic device that records and reproduces an image using a storage medium such as a flash memory.
10・・・画像符号化装置、11・・・A/D変換部、12,57・・・画面並べ替えバッファ、13,23,55・・・演算部、14・・・直交変換部、15・・・量子化部、16・・・可逆符号化部、17・・・蓄積バッファ、18・・・レート制御部、21,53・・・逆量子化部、22,54・・・逆直交変換部、24,56・・・デブロッキングフィルタ、25,61・・・フレームメモリ、31・・・イントラ予測部、32・・・動き予測・補償部、33・・・予測画像・最適モード選択部、50・・・画像復号装置、51・・・蓄積バッファ、52・・・可逆復号部、53・・・逆量子化部、58・・・D/A変換部、71・・・イントラ予測部、72・・・動き補償部、73,946・・・セレクタ、90・・・テレビジョン装置、92・・・携帯電話機、94・・・記録再生装置、96・・・撮像装置、160・・・CABAC符号化部、161・・・二値化部、162,521・・・コンテキスト算出部、163・・・算術符号化処理部、520・・・CABAC復号部、522・・・算術復号処理部、523・・・多値化部、901,921・・・アンテナ、902・・・チューナ、903・・・デマルチプレクサ、904,947・・・デコーダ、905・・・映像信号処理部、906,930,965・・・表示部、907・・・音声信号処理部、908,924・・・スピーカ、909,942,966・・・外部インタフェース部、910,931,949,970・・・制御部、911,950,971・・・ユーザインタフェース部、912,933,972・・・バス、922・・・通信部、923・・・音声コーデック、925・・・マイクロホン、926・・・カメラ部、927・・・画像処理部、928・・・多重分離部、929・・・記録再生部、932・・・操作部、941・・・チューナ、943・・・エンコーダ、944・・・HDD部、945・・・ディスクドライブ、948,969・・・OSD部、961・・・光学ブロック、962・・・撮像部、963・・・カメラ信号処理部、964・・・画像データ処理部、967・・・メモリ部、968・・・メディアドライブ
DESCRIPTION OF
図6の(D)は、coeff_abs_level_minus3を示している。coeff_abs_level_minus3は、coeff_abs_level_greater2_flag=1である変換係数について、絶対値から3を減算した値とされている。(D) of FIG. 6 has shown coeff_abs_level_minus3. coeff_abs_level_minus3 is a value obtained by subtracting 3 from the absolute value for the transform coefficient with coeff_abs_level_greater2_flag = 1.
図6の(E)は、coeff_sign_flagを示している。coeff_sign_flagは、変換係数が正の値である場合にcoeff_sign_flag=0、負の値である場合にcoeff_sign_flag=1とされている。(E) of FIG. 6 has shown coeff_sign_flag. coeff_sign_flag is set to coeff_sign_flag = 0 when the conversion coefficient is a positive value, and coeff_sign_flag = 1 when the conversion coefficient is a negative value.
Claims (10)
前記算術復号処理部で算術復号処理を行うことにより得られた二値化データの多値化を行い、符号化前の前記変換係数を生成する多値化部と
を備える画像処理装置。 When the absolute value of the transform coefficient after quantization is compared with the threshold “m” and the absolute value is larger than the threshold “m”, the comparison is performed with “m = m + 1” as the threshold, and the threshold is “m = 1”. First information indicating the comparison result from the first to the predetermined value, second information corresponding to the excess of the absolute value with respect to the predetermined value, and third information indicating the sign of the transform coefficient As a tax element, an arithmetic decoding processing unit that performs arithmetic decoding processing on encoded data encoded in the order of the first information, the second information, and the third information;
An image processing apparatus comprising: a multi-value quantization unit that multi-values binarized data obtained by performing arithmetic decoding processing in the arithmetic decoding processing unit and generates the transform coefficient before encoding.
請求項1記載の画像処理装置。 The arithmetic decoding processing unit performs the decoding process of the first information in a mode referring to a context representing a probability state and a dominant probability symbol, and the second information and the third information in a mode not referring to the context. The image processing apparatus according to claim 1, wherein decoding processing is performed.
請求項1記載の画像処理装置。 The image processing apparatus according to claim 1, wherein the encoded data is data generated with the predetermined number being “m = 2”.
請求項1記載の画像処理装置。 The image processing apparatus according to claim 1, wherein the encoded data is data obtained by encoding the transform coefficient in subblock units.
前記算術復号処理を行うことにより得られた二値化データの多値化を行い、符号化前の前記変換係数を生成する工程と
を含む画像処理方法。 When the absolute value of the transform coefficient after quantization is compared with the threshold “m” and the absolute value is larger than the threshold “m”, the comparison is performed with “m = m + 1” as the threshold, and the threshold is “m = 1”. First information indicating the comparison result from the first to the predetermined value, second information corresponding to the excess of the absolute value with respect to the predetermined value, and third information indicating the sign of the transform coefficient Performing an arithmetic decoding process on the encoded data encoded in the order of the first information, the second information, and the third information as a tax element;
An image processing method including: performing binarization of the binarized data obtained by performing the arithmetic decoding process, and generating the transform coefficient before encoding.
前記二値化部で得られた二値化データの算術符号化処理を行い符号化データを生成する算術符号化処理部と
を備える画像処理装置。 When the absolute value of the transform coefficient after quantization is compared with the threshold “m” and the absolute value is larger than the threshold “m”, the comparison is performed with “m = m + 1” as the threshold, and the threshold is “m = 1”. First information indicating the comparison result from the first to the predetermined value, second information corresponding to the excess of the absolute value with respect to the predetermined value, and third information indicating the sign of the transform coefficient As a tax element, a binarization unit that binarizes first information, second information, and third information in this order;
An image processing apparatus comprising: an arithmetic encoding processing unit that performs arithmetic encoding processing of binary data obtained by the binarizing unit and generates encoded data.
請求項6記載の画像処理装置。 The arithmetic coding processing unit performs the coding process of the first information in a mode that refers to a context representing a probability state and a dominant probability symbol, and performs the second information and the third information in a mode that does not refer to the context. The image processing apparatus according to claim 6, wherein the information encoding process is performed.
請求項6記載の画像処理装置。 The image processing apparatus according to claim 6, wherein the binarization unit generates the binarized data with the predetermined number being “m = 2”.
請求項6記載の画像処理装置。 The image processing apparatus according to claim 6, wherein the binarization unit and the arithmetic coding processing unit perform binarization and coding processing of the transform coefficient in units of sub blocks.
前記二値化により得られた二値化データの算術符号化処理を行い符号化データを生成する工程と
を含む画像処理方法。 When the absolute value of the transform coefficient after quantization is compared with the threshold “m” and the absolute value is larger than the threshold “m”, the comparison is performed with “m = m + 1” as the threshold, and the threshold is “m = 1”. First information indicating the comparison result from the first to the predetermined value, second information corresponding to the excess of the absolute value with respect to the predetermined value, and third information indicating the sign of the transform coefficient As a tax element, binarizing in the order of the first information, the second information, and the third information;
An image processing method including a step of performing arithmetic encoding processing of binary data obtained by the binarization to generate encoded data.
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011213065A JP2013074528A (en) | 2011-09-28 | 2011-09-28 | Image processing device and image processing method |
PCT/JP2012/068944 WO2013046895A1 (en) | 2011-09-28 | 2012-07-26 | Image processing device and image processing method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011213065A JP2013074528A (en) | 2011-09-28 | 2011-09-28 | Image processing device and image processing method |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2013074528A true JP2013074528A (en) | 2013-04-22 |
Family
ID=47994949
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011213065A Withdrawn JP2013074528A (en) | 2011-09-28 | 2011-09-28 | Image processing device and image processing method |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP2013074528A (en) |
WO (1) | WO2013046895A1 (en) |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
PT1487113E (en) * | 2002-05-02 | 2006-12-29 | Fraunhofer Ges Forschung | Coding and decoding of transformation coefficients in image or video coders |
-
2011
- 2011-09-28 JP JP2011213065A patent/JP2013074528A/en not_active Withdrawn
-
2012
- 2012-07-26 WO PCT/JP2012/068944 patent/WO2013046895A1/en active Application Filing
Also Published As
Publication number | Publication date |
---|---|
WO2013046895A1 (en) | 2013-04-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11196995B2 (en) | Image processing device and image processing method | |
US11381846B2 (en) | Image processing device and image processing method | |
JPWO2011145601A1 (en) | Image processing apparatus and image processing method | |
JP6527263B2 (en) | IMAGE PROCESSING APPARATUS, IMAGE PROCESSING METHOD, PROGRAM, AND RECORDING MEDIUM | |
JP2014207536A (en) | Image processing device and method | |
JPWO2019003676A1 (en) | Image processing apparatus, image processing method, and program | |
WO2013047325A1 (en) | Image processing device and method | |
JP4742018B2 (en) | Image coding apparatus and image coding method | |
WO2012067005A1 (en) | Image processing device and image processing method | |
JP5387520B2 (en) | Information processing apparatus and information processing method | |
TW201330638A (en) | Image processing device and method | |
WO2013046895A1 (en) | Image processing device and image processing method | |
WO2012160879A1 (en) | Image encoding device, image decoding device, and method therefor | |
WO2013027472A1 (en) | Image processing device and image processing method | |
JP2008141530A (en) | Image coder and image coding method | |
JPWO2009075107A1 (en) | Image encoding apparatus, encoding rate conversion apparatus, video / audio stream recording apparatus, network distribution system, coefficient conversion apparatus, integrated circuit, and image encoding method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Withdrawal of application because of no request for examination |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20141202 |