JP7484923B2 - 画像処理装置および方法 - Google Patents
画像処理装置および方法 Download PDFInfo
- Publication number
- JP7484923B2 JP7484923B2 JP2021544047A JP2021544047A JP7484923B2 JP 7484923 B2 JP7484923 B2 JP 7484923B2 JP 2021544047 A JP2021544047 A JP 2021544047A JP 2021544047 A JP2021544047 A JP 2021544047A JP 7484923 B2 JP7484923 B2 JP 7484923B2
- Authority
- JP
- Japan
- Prior art keywords
- unit
- bin
- image processing
- decoding
- control information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012545 processing Methods 0.000 title claims description 208
- 238000000034 method Methods 0.000 title description 137
- 230000009466 transformation Effects 0.000 claims description 94
- 238000013139 quantization Methods 0.000 claims description 72
- 238000006243 chemical reaction Methods 0.000 claims description 66
- 238000003672 processing method Methods 0.000 claims description 8
- 230000008569 process Effects 0.000 description 105
- 238000005516 engineering process Methods 0.000 description 61
- 230000015654 memory Effects 0.000 description 42
- 239000000872 buffer Substances 0.000 description 38
- 238000004364 calculation method Methods 0.000 description 29
- 238000009825 accumulation Methods 0.000 description 13
- 230000003044 adaptive effect Effects 0.000 description 12
- 238000009795 derivation Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 12
- 238000003860 storage Methods 0.000 description 7
- 238000001914 filtration Methods 0.000 description 6
- 230000008707 rearrangement Effects 0.000 description 6
- 230000005540 biological transmission Effects 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 241000209094 Oryza Species 0.000 description 3
- 235000007164 Oryza sativa Nutrition 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 235000009566 rice Nutrition 0.000 description 3
- VBRBNWWNRIMAII-WYMLVPIESA-N 3-[(e)-5-(4-ethylphenoxy)-3-methylpent-3-enyl]-2,2-dimethyloxirane Chemical compound C1=CC(CC)=CC=C1OC\C=C(/C)CCC1C(C)(C)O1 VBRBNWWNRIMAII-WYMLVPIESA-N 0.000 description 2
- 241000023320 Luma <angiosperm> Species 0.000 description 2
- 230000002146 bilateral effect Effects 0.000 description 2
- 238000005056 compaction Methods 0.000 description 2
- 230000010365 information processing Effects 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- OSWPMRLSEDHDFF-UHFFFAOYSA-N methyl salicylate Chemical compound COC(=O)C1=CC=CC=C1O OSWPMRLSEDHDFF-UHFFFAOYSA-N 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000009304 pastoral farming Methods 0.000 description 2
- 238000000638 solvent extraction Methods 0.000 description 2
- 239000012536 storage buffer Substances 0.000 description 2
- 230000003796 beauty Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000010267 cellular communication Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000011045 prefiltration Methods 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/13—Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/90—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
- H04N19/91—Entropy coding, e.g. variable length coding [VLC] or arithmetic coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/124—Quantisation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/18—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/42—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
- H04N19/423—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation characterised by memory arrangements
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/46—Embedding additional information in the video signal during the compression process
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/80—Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
- H04N19/82—Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation involving filtering within a prediction loop
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
本開示は、画像処理装置および方法に関し、特に、符号化処理・復号処理の負荷の増大を抑制することができるようにした画像処理装置および方法に関する。
従来、動画像の予測残差を導出し、係数変換し、量子化して符号化する符号化方法が提案された(例えば、非特許文献1)。非特許文献1に記載のVVC WD6では、プライマリ変換後の変換係数に対して、低域セカンダリ変換(LFST(Low Frequency Secondary Transform))を行い、さらにエナジーコンパクションを改善する符号化ツールがある。この低域セカンダリ変換に関するモード情報として、ST識別子st_idx(lfnst_idxとも称する)がある。
このST識別子lfnst_idxを符号化する場合、まず、このST識別子lfnst_idxを2値化し、得られたビン列(bins)の各binIdxに対応するコンテキスト変数ctxを参照して、算術符号化を行う。例えば、このビン列のbinIdx=0のビンに対しては、ツリータイプtreTypeとMTS識別子mts_idxに応じてコンテキスト変数ctxが割り当てられる。
Benjamin Bross, Jianle Chen, Shan Liu, "Versatile Video Coding (Draft 6)", JVET-O2001-vE, m49908, Joint Video Experts Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11 15th Meeting: Gothenburg, SE, 3-12 July 2019
しかしながら、LFSNTはtu_mts_idx==0 (DCT2xDCT2)のときにしか適用されないため、"tu_mts_idx == 0"の条件は常に真となる。そのため、"tu_mts_idx==0"の分岐は冗長であり、これにより、符号化処理・復号処理の負荷が増大するおそれがあった。
本開示は、このような状況に鑑みてなされたものであり、符号化処理・復号処理の負荷の増大を抑制することができるようにするものである。
本技術の一側面の画像処理装置は、セカンダリ変換に関する制御情報であるセカンダリ変換制御情報のビン列の1ビン目に対して固定のコンテキスト変数を設定し、設定した固定のコンテキスト変数を参照して、前記セカンダリ変換制御情報の各ビンを算術符号化する符号化部を備える画像処理装置である。
本技術の一側面の画像処理方法は、セカンダリ変換に関する制御情報であるセカンダリ変換制御情報のビン列の1ビン目に対して固定のコンテキスト変数を設定し、設定した固定のコンテキスト変数を参照して、前記セカンダリ変換制御情報の各ビンを算術符号化する画像処理方法である。
本技術の他の側面の画像処理装置は、セカンダリ変換に関する制御情報であるセカンダリ変換制御情報のビン列の1ビン目に対して設定された固定のコンテキスト変数を参照して算術復号する復号部を備える画像処理装置である。
本技術の他の側面の画像処理方法は、セカンダリ変換に関する制御情報であるセカンダリ変換制御情報のビン列の1ビン目に対して設定された固定のコンテキスト変数を参照して算術復号する画像処理方法である。
本技術の一側面の画像処理装置および方法においては、セカンダリ変換に関する制御情報であるセカンダリ変換制御情報のビン列の1ビン目に対して固定のコンテキスト変数を設定し、設定した固定のコンテキスト変数が参照されて、そのセカンダリ変換制御情報の各ビンが算術符号化される。
本技術の他の側面の画像処理装置および方法においては、セカンダリ変換に関する制御情報であるセカンダリ変換制御情報のビン列の1ビン目に対して設定された固定のコンテキスト変数が参照されて算術復号される。
以下、本開示を実施するための形態(以下実施の形態とする)について説明する。なお、説明は以下の順序で行う。
1.ST識別子の符号化
2.第1の実施の形態(符号化装置)
3.第2の実施の形態(復号装置)
4.第3の実施の形態(画像復号装置)
5.第4の実施の形態(画像符号化装置)
6.付記
1.ST識別子の符号化
2.第1の実施の形態(符号化装置)
3.第2の実施の形態(復号装置)
4.第3の実施の形態(画像復号装置)
5.第4の実施の形態(画像符号化装置)
6.付記
<1.ST識別子の符号化>
<技術内容・技術用語をサポートする文献等>
本技術で開示される範囲は、実施の形態に記載されている内容だけではなく、出願当時において公知となっている以下の非特許文献等に記載されている内容や以下の非特許文献において参照されている他の文献の内容等も含まれる。
<技術内容・技術用語をサポートする文献等>
本技術で開示される範囲は、実施の形態に記載されている内容だけではなく、出願当時において公知となっている以下の非特許文献等に記載されている内容や以下の非特許文献において参照されている他の文献の内容等も含まれる。
非特許文献1:(上述)
非特許文献2:Jianle Chen, Yan Ye, Seung Hwan Kim, "Algorithm description for Versatile Video Coding and Test Model 6 (VTM 6)", JVET-O2002-v2, m49914, Joint Video Experts Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11 15th Meeting: Gothenburg, SE, 3-12 July 2019
非特許文献3:Recommendation ITU-T H.264 (04/2017) "Advanced video coding for generic audiovisual services", April 2017
非特許文献4:Recommendation ITU-T H.265 (02/18) "High efficiency video coding", february 2018
非特許文献2:Jianle Chen, Yan Ye, Seung Hwan Kim, "Algorithm description for Versatile Video Coding and Test Model 6 (VTM 6)", JVET-O2002-v2, m49914, Joint Video Experts Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11 15th Meeting: Gothenburg, SE, 3-12 July 2019
非特許文献3:Recommendation ITU-T H.264 (04/2017) "Advanced video coding for generic audiovisual services", April 2017
非特許文献4:Recommendation ITU-T H.265 (02/18) "High efficiency video coding", february 2018
つまり、上述の非特許文献に記載されている内容もサポート要件を判断する際の根拠となる。例えば、上述の非特許文献に記載されているQuad-Tree Block Structure、QTBT(Quad Tree Plus Binary Tree) Block Structureが実施例において直接的な記載がない場合でも、本技術の開示範囲内であり、請求の範囲のサポート要件を満たすものとする。また、例えば、パース(Parsing)、シンタックス(Syntax)、セマンティクス(Semantics)等の技術用語についても同様に、実施例において直接的な記載がない場合でも、本技術の開示範囲内であり、請求の範囲のサポート要件を満たすものとする。
また、本明細書において、画像(ピクチャ)の部分領域や処理単位として説明に用いる「ブロック」(処理部を示すブロックではない)は、特に言及しない限り、ピクチャ内の任意の部分領域を示し、その大きさ、形状、および特性等は限定されない。例えば、「ブロック」には、上述の非特許文献に記載されているTB(Transform Block)、TU(Transform Unit)、PB(Prediction Block)、PU(Prediction Unit)、SCU(Smallest Coding Unit)、CU(Coding Unit)、LCU(Largest Coding Unit)、CTB(Coding Tree Block)、CTU(Coding Tree Unit)、サブブロック、マクロブロック、タイル、またはスライス等、任意の部分領域(処理単位)が含まれるものとする。
また、このようなブロックのサイズを指定するに当たって、直接的にブロックサイズを指定するだけでなく、間接的にブロックサイズを指定するようにしてもよい。例えばサイズを識別する識別情報を用いてブロックサイズを指定するようにしてもよい。また、例えば、基準となるブロック(例えばLCUやSCU等)のサイズとの比または差分によってブロックサイズを指定するようにしてもよい。例えば、シンタックス要素等としてブロックサイズを指定する情報を伝送する場合に、その情報として、上述のような間接的にサイズを指定する情報を用いるようにしてもよい。このようにすることにより、その情報の情報量を低減させることができ、符号化効率を向上させることができる場合もある。また、このブロックサイズの指定には、ブロックサイズの範囲の指定(例えば、許容されるブロックサイズの範囲の指定等)も含む。
また、本明細書において、符号化とは、画像をビットストリームに変換する全体の処理だけではなく、一部の処理も含む。例えば、予測処理、直交変換、量子化、算術符号化等を包括した処理を含むだけではなく、量子化と算術符号化とを総称した処理、予測処理と量子化と算術符号化とを包括した処理、などを含む。同様に、復号とは、ビットストリームを画像に変換する全体の処理だけではなく、一部の処理も含む。例えば、逆算術復号、逆量子化、逆直交変換、予測処理等を包括した処理を含むだけではなく、逆算術復号と逆量子化とを包括した処理、逆算術復号と逆量子化と予測処理とを包括した処理、などを含む。
<ST識別子>
非特許文献1に記載のVVC WD6では、プライマリ変換後の変換係数に対して、低域セカンダリ変換(LFST(Low Frequency Secondary Transform))を行い、さらにエナジーコンパクションを改善する符号化ツールがある。この低域セカンダリ変換に関するモード情報(セカンダリ変換に関する制御情報)として、セカンダリ変換のタイプを示すST識別子st_idx(lfnst_idxとも称する)がある。このST識別子の符号化は以下の手順で行われる。
非特許文献1に記載のVVC WD6では、プライマリ変換後の変換係数に対して、低域セカンダリ変換(LFST(Low Frequency Secondary Transform))を行い、さらにエナジーコンパクションを改善する符号化ツールがある。この低域セカンダリ変換に関するモード情報(セカンダリ変換に関する制御情報)として、セカンダリ変換のタイプを示すST識別子st_idx(lfnst_idxとも称する)がある。このST識別子の符号化は以下の手順で行われる。
まず、ST識別子lfnst_idxを2値化してビン列binsを得る。ST識別子lfnst_idxは、図1のAの表のような値をとり、各値が同表に示されるような変換タイプを示す。また、このようなST識別子lfnst_idxの2値化により、同表のようなビン列(binarization)が得られる。
なお、このST識別子lfnst_idxの2値化は、トランケート・ユーナリ符号(TU(Truncated Unary))により2値化してビン列binsを得る。なお、このTU符号は、図1のBに示される表のように、ライスパラメータcRiceParam=0としたトランケート・ライス符号(TR(Truncated Rice))と等価である。
次に、得られたビン列binsの各binIdxに対応するコンテキスト変数ctxを参照して、算術符号化を行う。コンテキスト変数ctxを識別するインデックスをctxInc(or ctxIdx)とも称する。
具体的には、ビン列のbinIdx=0のビンに対して、図1のCに示される表のように、ツリータイプtreTypeとMTS識別子mts_idxに応じてコンテキスト変数ctxを割り当てる。この表の例では、binIdx=0に対応するctxIncは、ctxInc= (mts_idx == 0 && treeType != SINGLE_TREE) の値で導出される。また、ビン列binsのbinIdx=1に対しては、バイパス符号化が適用される。
なお、ST識別子lfnst_idxのビン列binsの各binは変換タイプに対応するフラグとして解釈することもできる。その場合、binIdx=0のビンの値は、セカンダリ変換の可否を示すフラグ(0: Yes, 1: No)に対応し、binIdx=1のビンの値は、第1のセカンダリ変換か否かを示すフラグ(0: Yes, 1: No)に対応する。
復号の際は、上述のように設定されたコンテキスト変数ctxを参照して、各ビンが算術復号される。そして、ビン列が多値化されて、ST識別子lfnst_idxが得られる。
しかしながら、LFSNTはtu_mts_idx==0 (DCT2xDCT2)のときにしか適用されないため、図1のCに示される表において、"tu_mts_idx == 0"の条件は常に真となる。そのため、"tu_mts_idx==0"の分岐は冗長であり、これにより、符号化処理・復号処理の負荷が増大するおそれがあった。実装コストを抑えるためには、符号化効率を維持しつつ、コンテキスト変数の削減や、コンテキス変数の導出を簡略化することが求められる。
<固定のコンテキストの割り当て>
そこで、セカンダリ変換に関する制御情報であるセカンダリ変換制御情報のビン列の1ビン目に対して固定のコンテキスト変数を設定する。
そこで、セカンダリ変換に関する制御情報であるセカンダリ変換制御情報のビン列の1ビン目に対して固定のコンテキスト変数を設定する。
例えば、画像処理(特に、画像の符号化)において、セカンダリ変換に関する制御情報であるセカンダリ変換制御情報のビン列の1ビン目に対して固定のコンテキスト変数を設定し、その設定した固定のコンテキスト変数を参照して、セカンダリ変換制御情報の各ビンを算術符号化する。
例えば、画像処理装置(特に、画像を符号化する画像符号化装置)において、セカンダリ変換に関する制御情報であるセカンダリ変換制御情報のビン列の1ビン目に対して固定のコンテキスト変数を設定し、その設定した固定のコンテキスト変数を参照して、セカンダリ変換制御情報の各ビンを算術符号化する符号化部を備えるようにする。
このようにすることにより、符号化効率を維持しつつ、ST識別子のコンテキスト変数の導出を簡略化することができる。また、符号化効率を維持しつつ、ST識別子のコンテキスト変数を保持するメモリサイズを削減することができる。つまり、符号化処理の負荷の増大を抑制することができる。
また、例えば、画像処理(画像の符号化データの復号)において、セカンダリ変換に関する制御情報であるセカンダリ変換制御情報のビン列の1ビン目に対して設定された固定のコンテキスト変数を参照して算術復号する。
例えば、画像処理装置(特に、画像の符号化データを復号する画像復号装置)において、セカンダリ変換に関する制御情報であるセカンダリ変換制御情報のビン列の1ビン目に対して設定された固定のコンテキスト変数を参照して算術復号する復号部を備えるようにする。
このようにすることにより、符号化効率を維持しつつ、ST識別子のコンテキスト変数の導出を簡略化することができる。また、符号化効率を維持しつつ、ST識別子のコンテキスト変数を保持するメモリサイズを削減することができる。つまり、復号処理の負荷の増大を抑制することができる。
例えば、図2のAに示される表の上から2番目の段(方法1)のように、ビン列のbinIdx=0のビン(1ビン目)に対して、固定のコンテキスト変数ctxとして「0」を割り当ててもよい。つまり、ST識別子のビン列の1ビン目に対してコンテキスト変数ctxとして「0」を設定し、その値を参照して算術符号化を行ってもよい。換言するに、ST識別子のビン列の1ビン目に対してコンテキスト変数ctxとして設定された「0」を参照して算術復号を行ってもよい。このようにすることにより、ST識別子のビン列の1ビン目におけるコンテキスト変数の導出において、treeType(およびtu_mts_idx==0)によるコンテキスト変数の選択に関する分岐処理を省略することができる。これにより、符号化処理・復号処理の負荷の増大を抑制することができる。また、図2のBに示される表のように、VTMの場合に比べて、方法1の方が、コンテキスト数を削減することができる。したがって、ST識別子のコンテキスト変数を保持するメモリサイズを削減することができる。
また、図2のAに示される表の(方法1)のように、ビン列のbinIdx=1のビン(2ビン目)に対して、バイパスフラグを割り当ててもよい。つまり、ST識別子のビン列の1ビン目に対してバイパスフラグ(bypass)を設定し、そのバイパスフラグに基づいて算術符号化を行ってもよい。換言するに、ST識別子のビン列の1ビン目に対して設定されたバイパスフラグに基づいて算術復号を行ってもよい。
また、例えば、図2のAに示される表の上から3番目の段(方法2)のように、ビン列のbinIdx=0のビン(1ビン目)とbinIdx=1のビン(2ビン目)とに対して、共通のコンテキスト変数ctxを割り当ててもよい。図2のAに示される表の場合、ビン列のbinIdx=0のビン(1ビン目)とbinIdx=1のビン(2ビン目)との両方に対して、「0」が割り当てられる。つまり、ST識別子のビン列の1ビン目と2ビン目に対して共通のコンテキスト変数ctx(例えば、「0」)を設定し、その値を参照して各ビンの算術符号化を行ってもよい。換言するに、ST識別子のビン列の1ビン目と2ビン目に対して設定された共通のコンテキスト変数ctx(例えば、「0」)を参照して各ビンの算術復号を行ってもよい。このようにすることにより、図2のBに示される表のように、方法1の場合に比べて、方法2の方が、コンテキスト数を維持しつつバイパス符号化ビン数を削減することができる。したがって、ST識別子の符号量を削減することができる。
<2.第1の実施の形態>
<符号化装置>
<1.ST識別子の符号化>において説明した本技術は、任意の装置において適用することができる。以下において本技術の適用例について説明する。図3は、本技術を適用した画像処理装置の一態様である符号化装置の構成の一例を示すブロック図である。図3に示される符号化装置100は、ST識別子lfnst_idxを符号化する装置である。符号化装置100は、例えば、CABAC(Context-based Adaptive Binary Arithmetic Code)を適用して符号化を行う。
<符号化装置>
<1.ST識別子の符号化>において説明した本技術は、任意の装置において適用することができる。以下において本技術の適用例について説明する。図3は、本技術を適用した画像処理装置の一態様である符号化装置の構成の一例を示すブロック図である。図3に示される符号化装置100は、ST識別子lfnst_idxを符号化する装置である。符号化装置100は、例えば、CABAC(Context-based Adaptive Binary Arithmetic Code)を適用して符号化を行う。
なお、図3においては、処理部やデータの流れ等の主なものを示しており、図3に示されるものが全てとは限らない。つまり、符号化装置100において、図3においてブロックとして示されていない処理部が存在したり、図3において矢印等として示されていない処理やデータの流れが存在したりしてもよい。
図3に示されるように、符号化装置100は、2値化部121、選択部122、コンテキストモデル123、算術符号化部124、算術符号化部125、および選択部126を有する。
2値化部121は、符号化装置100に供給されるシンタックスエレメント値を取得し、そのシンタックスエレメント毎に定義された方法で2値化し、2値化ビット列を生成する。2値化部121は、その2値化ビット列を選択部122に供給する。
選択部122は、2値化部121から供給された2値化ビット列とフラグ情報isBypassを取得する。選択部122は、そのisBypassの値に基づいて、2値化ビット列の供給先を選択する。例えば、isBypass=0の場合、選択部122は、通常モードと判定し、2値化ビット列をコンテキストモデル123に供給する。また、isBypass=1の場合、選択部122は、バイパス(bypass)モードと判定し、2値化ビット列を算術符号化部125に供給する。
コンテキストモデル123は、符号化対象および周囲の状況に応じて、適用するコンテキストモデルを動的に切り替える。例えば、コンテキストモデル123は、コンテキスト変数ctxを保持し、選択部122から2値化ビット列を取得すると、シンタックスエレメント毎に定義されたbin列の各ビン位置(binIdx)に対応するコンテキスト変数ctxを読み出す。コンテキストモデル123は、2値化ビット列と読みだしたコンテキスト変数ctxを算術符号化部124に供給する。
算術符号化部124は、コンテキストモデル123から供給される2値化ビット列およびコンテキスト変数ctxを取得すると、そのコンテキスト変数ctxの確率状態を参照し、2値化ビット列のbinIdxにあるビンの値を、CABACの通常モードにより算術符号化する(コンテキスト符号化を行う)。算術符号化部124は、そのコンテキスト符号化により生成した符号化データを選択部126に供給する。また、算術符号化部124は、コンテキスト符号化処理後のコンテキスト変数ctxをコンテキストモデル123に供給し、保持させる。
算術符号化部125は、選択部122から供給される2値化ビット列を、CABACのバイパスモードにより算術符号化する(バイパス符号化を行う)。算術符号化部125は、そのバイパス符号化により生成した符号化データを選択部126に供給する。
選択部126は、フラグ情報isBypassを取得し、そのisBypassの値に基づいて、出力する符号化データを選択する。例えば、isBypass=0の場合、選択部126は、通常モードと判定し、算術符号化部124から供給される符号化データを取得し、CABAC102(符号化装置100)の外部に出力する。また、isBypass=1の場合、選択部126は、バイパス(bypass)モードと判定し、算術符号化部125から供給される符号化データを取得し、符号化装置100の外部に出力する。
なお、これらの処理部(2値化部121乃至選択部126)は、任意の構成を有する。例えば、各処理部が、上述の処理を実現する論理回路により構成されるようにしてもよい。また、各処理部が、例えばCPU(Central Processing Unit)、ROM(Read Only Memory)、RAM(Random Access Memory)等を有し、それらを用いてプログラムを実行することにより、上述の処理を実現するようにしてもよい。もちろん、各処理部が、その両方の構成を有し、上述の処理の一部を論理回路により実現し、他を、プログラムを実行することにより実現するようにしてもよい。各処理部の構成は互いに独立していてもよく、例えば、一部の処理部が上述の処理の一部を論理回路により実現し、他の一部の処理部がプログラムを実行することにより上述の処理を実現し、さらに他の処理部が論理回路とプログラムの実行の両方により上述の処理を実現するようにしてもよい。
このような符号化装置100において、<1.ST識別子の符号化>において説明した本技術を適用する。すなわち、2値化部121は、セカンダリ変換制御情報(ST識別子lfnst_idx)を2値化し、ビン列を生成する。選択部122は、そのビン列の1ビン目に対して固定のコンテキスト変数ctx(例えば「0」)を設定する。算術符号化部124は、その固定のコンテキスト変数ctx(例えば「0」)を参照し、CABACの通常モードにより算術符号化する。
このようにすることにより、符号化装置100は、符号化効率を維持しつつ、ST識別子のコンテキスト変数の導出を簡略化することができる。また、符号化装置100は、符号化効率を維持しつつ、ST識別子のコンテキスト変数を保持するメモリサイズを削減することができる。つまり、符号化装置100は、符号化処理の負荷の増大を抑制することができる。
その際、選択部122は、そのビン列の2ビン目に対してバイパスフラグを設定してもよい(方法1)。その場合、算術符号化部125は、その2ビン目を、CABACのバイパスモードにより算術符号化する。
また、選択部122は、そのビン列の2ビン目に対して1ビン目と共通のコンテキスト変数ctx(例えば「0」)を設定してもよい(方法2)。その場合、算術符号化部124は、その固定のコンテキスト変数ctx(例えば「0」)を参照し、CABACの通常モードにより算術符号化する。
<符号化処理の流れ>
次に、この符号化装置100により実行される符号化処理の流れの例を、図4のフローチャートを参照して説明する。
次に、この符号化装置100により実行される符号化処理の流れの例を、図4のフローチャートを参照して説明する。
符号化処理が開始されると、符号化装置100の2値化部121は、ステップS101において、処理対象のシンタックスエレメント値(syncVal)を入力する。
ステップS102において、2値化部121は、シンタックスエレメント毎に定義された2値化処理を行い、シンタックスエレメント値(syncVal)のビン列(synBins)を導出する。
ステップS103において、選択部122は、シンタックスエレメント毎に定義されたbin列の各ビン位置(binIdx)に対応するコンテキスト変数ctxと、bypassモードであるか否かを示すフラグisBypassとを読み出す。
ステップS104において、選択部122は、bypassモードであるか否かを判定する。isBypass=0であり、通常モードであると判定された場合、処理はステップS105に進む。
ステップS105において、算術符号化部124は、コンテキスト符号化を行う。つまり、算術符号化部124は、コンテキスト変数ctxの確率状態を参照してbin列(synBins)のビン位置(binIdx)にあるビンの値をCABACの通常モードにより符号化する。ステップS105の処理が終了すると、処理はステップS107に進む。
また、ステップS104においてisBypass=1であり、バイパスモードであると判定された場合、処理はステップS106に進む。
ステップS106において、算術符号化部125は、バイパス符号化を行う。つまり、算術符号化部125は、CABACのバイパスモードによりbin列(synBins)のビン位置(binIdx)にあるビンの値を符号化する。ステップS106の処理が終了すると、処理はステップS107に進む。
ステップS107において、選択部126は、所定のブレーク条件Aを満たすか否かを判定する。ブレーク条件Aは、binIdx=0からbinIdx=k(現在のbinIdxの位置k)までのビン列の値や、シンタックスエレメント毎の2値化方法に基づいて定義される。
ブレーク条件Aを満たさないと判定された場合処理はステップS103に戻り、次のビン位置(binIdx)に対して、それ以降の処理が実行される。つまり、ビン位置(binIdx)毎にステップS103乃至ステップS107の処理が実行される。
そして、ステップS107において、ブレーク条件Aを満たすと判定された場合、CABAC処理が終了する。
このような符号化処理において、<1.ST識別子の符号化>において説明した本技術を適用する。すなわち、2値化部121は、ステップS102において、セカンダリ変換制御情報(ST識別子lfnst_idx)を2値化し、ビン列を生成する。選択部122は、ステップS103において、そのビン列の1ビン目に対して固定のコンテキスト変数ctx(例えば「0」)を設定する。算術符号化部124は、ステップS105において、その固定のコンテキスト変数ctx(例えば「0」)を参照し、CABACの通常モードにより算術符号化する。
このようにすることにより、符号化装置100は、符号化効率を維持しつつ、ST識別子のコンテキスト変数の導出を簡略化することができる。また、符号化装置100は、符号化効率を維持しつつ、ST識別子のコンテキスト変数を保持するメモリサイズを削減することができる。つまり、符号化装置100は、符号化処理の負荷の増大を抑制することができる。
また、ステップS103において、選択部122は、そのビン列の2ビン目に対してバイパスフラグを設定してもよい(方法1)。その場合、算術符号化部125は、ステップS106において、その2ビン目を、CABACのバイパスモードにより算術符号化する。
また、ステップS103において、選択部122は、そのビン列の2ビン目に対して1ビン目と共通のコンテキスト変数ctx(例えば「0」)を設定してもよい(方法2)。その場合、算術符号化部124は、ステップS105において、その固定のコンテキスト変数ctx(例えば「0」)を参照し、CABACの通常モードにより算術符号化する。
<3.第2の実施の形態>
<復号装置>
図5は、本技術を適用した画像処理装置の一態様である復号装置の構成の一例を示すブロック図である。図5に示される復号装置200は、ST識別子lfnst_idxの符号化データを復号する装置である。復号装置200は、符号化装置100の符号化方式に対応する復号方式(例えばCABAC)を適用して復号を行う。例えば、復号装置200は、符号化装置100により生成されたST識別子lfnst_idxの符号化データを復号する。
<復号装置>
図5は、本技術を適用した画像処理装置の一態様である復号装置の構成の一例を示すブロック図である。図5に示される復号装置200は、ST識別子lfnst_idxの符号化データを復号する装置である。復号装置200は、符号化装置100の符号化方式に対応する復号方式(例えばCABAC)を適用して復号を行う。例えば、復号装置200は、符号化装置100により生成されたST識別子lfnst_idxの符号化データを復号する。
なお、図5においては、処理部やデータの流れ等の主なものを示しており、図5に示されるものが全てとは限らない。つまり、復号装置200において、図5においてブロックとして示されていない処理部が存在したり、図5において矢印等として示されていない処理やデータの流れが存在したりしてもよい。
図5に示されるように、復号装置200は、選択部221、コンテキストモデル222、算術復号部223、算術復号部224、選択部225、および多値化部226を有する。
選択部221は、復号装置200に入力される符号化データとフラグ情報isBypassを取得する。選択部221は、そのisBypassの値に基づいて、符号化データの供給先を選択する。例えば、isBypass=0の場合、選択部221は、通常モードと判定し、符号化データをコンテキストモデル222に供給する。また、isBypass=1の場合、選択部221は、バイパス(bypass)モードと判定し、2値化ビット列を算術復号部224に供給する。
コンテキストモデル222は、復号対象および周囲の状況に応じて、適用するコンテキストモデルを動的に切り替える。例えば、コンテキストモデル222は、コンテキスト変数ctxを保持し、選択部221から符号化データを取得すると、シンタックスエレメント毎に定義されたbin列の各ビン位置(binIdx)に対応するコンテキスト変数ctxを読み出す。コンテキストモデル222は、符号化データと読みだしたコンテキスト変数ctxを算術復号部223に供給する。
算術復号部223は、コンテキストモデル222から供給される符号化データおよびコンテキスト変数ctxを取得すると、そのコンテキスト変数ctxの確率状態を参照し、2値化ビット列のbinIdxにあるビンの値を、CABACの通常モードにより算術復号する(コンテキスト復号を行う)。算術復号部223は、そのコンテキスト復号により生成した2値化ビット列を選択部225に供給する。また、算術復号部223は、コンテキスト復号処理後のコンテキスト変数ctxをコンテキストモデル222に供給し、保持させる。
算術復号部224は、選択部221から供給される符号化データを、CABACのバイパスモードにより算術復号する(バイパス復号を行う)。算術復号部224は、そのバイパス復号により生成した2値化ビット列を選択部225に供給する。
選択部225は、フラグ情報isBypassを取得し、そのisBypassの値に基づいて、多値化部226に供給する2値化ビット列を選択する。例えば、isBypass=0の場合、選択部225は、通常モードと判定し、算術復号部223から供給される2値化ビット列を取得し、多値化部226に供給する。また、isBypass=1の場合、選択部225は、バイパス(bypass)モードと判定し、算術復号部224から供給される2値化ビット列を取得し、多値化部226に供給する。
多値化部226は、選択部225から供給される2値化ビット列を取得し、シンタックスエレメント毎に定義された方法で多値化し、シンタックスエレメント値を生成する。多値化部226は、そのシンタックスエレメント値を復号装置200の外部に出力する。
なお、これらの処理部(選択部221乃至多値化部226)は、任意の構成を有する。例えば、各処理部が、上述の処理を実現する論理回路により構成されるようにしてもよい。また、各処理部が、例えばCPU、ROM、RAM等を有し、それらを用いてプログラムを実行することにより、上述の処理を実現するようにしてもよい。もちろん、各処理部が、その両方の構成を有し、上述の処理の一部を論理回路により実現し、他を、プログラムを実行することにより実現するようにしてもよい。各処理部の構成は互いに独立していてもよく、例えば、一部の処理部が上述の処理の一部を論理回路により実現し、他の一部の処理部がプログラムを実行することにより上述の処理を実現し、さらに他の処理部が論理回路とプログラムの実行の両方により上述の処理を実現するようにしてもよい。
このような復号装置200において、<1.ST識別子の符号化>において説明した本技術を適用する。すなわち、算術復号部223は、セカンダリ変換制御情報(ST識別子lfnst_idx)のビン列の1ビン目に対して設定された固定のコンテキスト変数ctx(例えば「0」)を参照し、CABACの通常モードにより算術復号する。
このようにすることにより、復号装置200は、符号化効率を維持しつつ、ST識別子のコンテキスト変数の導出を簡略化することができる。また、復号装置200は、符号化効率を維持しつつ、ST識別子のコンテキスト変数を保持するメモリサイズを削減することができる。つまり、復号装置200は、復号処理の負荷の増大を抑制することができる。
その際、算術復号部224は、そのビン列の2ビン目に対して設定されたバイパスフラグに基づいて、その2ビン目をCABACのバイパスモードにより算術復号してもよい。
また、算術復号部223は、そのビン列の2ビン目に対して設定された1ビン目と共通のコンテキスト変数ctx(例えば「0」)を参照し、CABACの通常モードにより算術復号してもよい。
<復号処理の流れ>
次に、この復号装置200により実行される復号処理の流れの例を、図6のフローチャートを参照して説明する。
次に、この復号装置200により実行される復号処理の流れの例を、図6のフローチャートを参照して説明する。
復号処理が開始されると、復号装置200の選択部221は、ステップS201において、シンタックスエレメント毎に定義されたbin列の各ビン位置(binIdx)に対応するコンテキスト変数ctxと、bypassモードであるか否かを示すフラグisBypassとを読み出す。
ステップS202において、選択部221は、bypassモードであるか否かを判定する。isBypass=0であり、通常モードであると判定された場合、処理はステップS203に進む。
ステップS203において、算術復号部223は、コンテキスト復号を行う。つまり、算術復号部223は、コンテキスト変数ctxの確率状態を参照して符号化データをCABACの通常モードにより復号し、bin列(synBins)のビン位置(binIdx)にあるビンの値を生成する。ステップS203の処理が終了すると処理はステップS205に進む。
また、ステップS202においてisBypass=1であり、バイパスモードであると判定された場合、処理はステップS204に進む。
ステップS204において、算術復号部224は、バイパス復号を行う。つまり、算術復号部224は、CABACのバイパスモードにより符号化データを復号し、bin列(synBins)のビン位置(binIdx)にあるビンの値を生成する。ステップS204の処理が終了すると、処理はステップS205に進む。
ステップS205において、選択部225は、所定のブレーク条件Aを満たすか否かを判定する。ブレーク条件Aは、binIdx=0からbinIdx=k(現在のbinIdxの位置k)までのビン列の値や、シンタックスエレメント毎の2値化方法に基づいて定義される。
ブレーク条件Aを満たさないと判定された場合、処理はステップS201に戻り、次のビン位置(binIdx)の値を生成するための、それ以降の処理が実行される。つまり、ビン位置(binIdx)毎にステップS201乃至ステップS205の処理が実行される。
そして、ステップS205において、ブレーク条件Aを満たすと判定された場合、処理はステップS206に進む。
ステップS206において、多値化部226は、シンタックスエレメント毎に定義された多値化処理により、ビン列(synBins)からシンタックスエレメント値(syncVal)を導出する。
ステップS207において、多値化部226は、導出したシンタックスエレメント値(syncVal)を復号装置200の外部に出力する。
このような復号処理において、<1.ST識別子の符号化>において説明した本技術を適用する。すなわち、算術復号部223は、ステップS203において、セカンダリ変換制御情報(ST識別子lfnst_idx)のビン列の1ビン目に対して設定された固定のコンテキスト変数ctx(例えば「0」)を参照し、CABACの通常モードにより算術復号する。
このようにすることにより、復号装置200は、符号化効率を維持しつつ、ST識別子のコンテキスト変数の導出を簡略化することができる。また、復号装置200は、符号化効率を維持しつつ、ST識別子のコンテキスト変数を保持するメモリサイズを削減することができる。つまり、復号装置200は、復号処理の負荷の増大を抑制することができる。
また、算術復号部224は、ステップS204において、そのビン列の2ビン目に対して設定されたバイパスフラグに基づいて、その2ビン目をCABACのバイパスモードにより算術復号してもよい(方法1)。
また、算術復号部223は、ステップS203において、そのビン列の2ビン目に対して設定された1ビン目と共通のコンテキスト変数ctx(例えば「0」)を参照し、CABACの通常モードにより算術復号してもよい(方法2)。
<4.第3の実施の形態>
<画像符号化装置>
図7は、本技術を適用した画像処理装置の一態様である画像符号化装置の構成の一例を示すブロック図である。図7に示される画像符号化装置300は、動画像の画像データを符号化する装置である。例えば、画像符号化装置300は、上述の非特許文献のいずれかに記載の符号化方式で動画像の画像データを符号化することができる。
<画像符号化装置>
図7は、本技術を適用した画像処理装置の一態様である画像符号化装置の構成の一例を示すブロック図である。図7に示される画像符号化装置300は、動画像の画像データを符号化する装置である。例えば、画像符号化装置300は、上述の非特許文献のいずれかに記載の符号化方式で動画像の画像データを符号化することができる。
なお、図7においては、処理部(ブロック)やデータの流れ等の主なものを示しており、図7に示されるものが全てとは限らない。つまり、画像符号化装置300において、図7においてブロックとして示されていない処理部が存在したり、図7において矢印等として示されていない処理やデータの流れが存在したりしてもよい。
図7に示されるように画像符号化装置300は、制御部301、並べ替えバッファ311、演算部312、直交変換部313、量子化部314、符号化部315、蓄積バッファ316、逆量子化部317、逆直交変換部318、演算部319、インループフィルタ部320、フレームメモリ321、予測部322、およびレート制御部323を有する。
<制御部>
制御部301は、外部、または予め指定された処理単位のブロックサイズに基づいて、並べ替えバッファ311により保持されている動画像データを処理単位のブロック(CU, PU, 変換ブロックなど)へ分割する。また、制御部301は、各ブロックへ供給する符号化パラメータ(ヘッダ情報Hinfo、予測モード情報Pinfo、変換情報Tinfo、フィルタ情報Finfo等)を、例えば、RDO(Rate-Distortion Optimization)に基づいて、決定する。
制御部301は、外部、または予め指定された処理単位のブロックサイズに基づいて、並べ替えバッファ311により保持されている動画像データを処理単位のブロック(CU, PU, 変換ブロックなど)へ分割する。また、制御部301は、各ブロックへ供給する符号化パラメータ(ヘッダ情報Hinfo、予測モード情報Pinfo、変換情報Tinfo、フィルタ情報Finfo等)を、例えば、RDO(Rate-Distortion Optimization)に基づいて、決定する。
これらの符号化パラメータの詳細については後述する。制御部301は、以上のような符号化パラメータを決定すると、それを各ブロックへ供給する。具体的には、以下の通りである。
ヘッダ情報Hinfoは、各ブロックに供給される。
予測モード情報Pinfoは、符号化部315と予測部322とに供給される。
変換情報Tinfoは、符号化部315、直交変換部313、量子化部314、逆量子化部317、および逆直交変換部318に供給される。
フィルタ情報Finfoは、インループフィルタ部320に供給される。
予測モード情報Pinfoは、符号化部315と予測部322とに供給される。
変換情報Tinfoは、符号化部315、直交変換部313、量子化部314、逆量子化部317、および逆直交変換部318に供給される。
フィルタ情報Finfoは、インループフィルタ部320に供給される。
<並べ替えバッファ>
画像符号化装置300には、動画像データの各フィールド(入力画像)がその再生順(表示順)に入力される。並べ替えバッファ311は、各入力画像をその再生順(表示順)に取得し、保持(記憶)する。並べ替えバッファ311は、制御部301の制御に基づいて、その入力画像を符号化順(復号順)に並べ替えたり、処理単位のブロックに分割したりする。並べ替えバッファ311は、処理後の各入力画像を演算部312に供給する。また、並べ替えバッファ311は、その各入力画像(元画像)を、予測部322やインループフィルタ部320にも供給する。
画像符号化装置300には、動画像データの各フィールド(入力画像)がその再生順(表示順)に入力される。並べ替えバッファ311は、各入力画像をその再生順(表示順)に取得し、保持(記憶)する。並べ替えバッファ311は、制御部301の制御に基づいて、その入力画像を符号化順(復号順)に並べ替えたり、処理単位のブロックに分割したりする。並べ替えバッファ311は、処理後の各入力画像を演算部312に供給する。また、並べ替えバッファ311は、その各入力画像(元画像)を、予測部322やインループフィルタ部320にも供給する。
<演算部>
演算部312は、処理単位のブロックに対応する画像I、および予測部322より供給される予測画像Pを入力とし、画像Iから予測画像Pを以下の式に示されるように減算して、予測残差Dを導出し、それを直交変換部313に供給する。
演算部312は、処理単位のブロックに対応する画像I、および予測部322より供給される予測画像Pを入力とし、画像Iから予測画像Pを以下の式に示されるように減算して、予測残差Dを導出し、それを直交変換部313に供給する。
D = I - P
<直交変換部>
直交変換部313は、演算部312から供給される予測残差Dと、制御部301から供給される変換情報Tinfoとを入力とし、その変換情報Tinfoに基づいて、予測残差Dに対して直交変換を行い、変換係数Coeffを導出する。例えば、直交変換部313は、予測残差Dに対してプライマリ変換を行ってプライマリ変換係数を生成し、ST識別子に基づいて、そのプライマリ変換係数に対してセカンダリ変換を行い、セカンダリ変換係数を生成する。直交変換部313は、その得られたセカンダリ変換係数を変換係数Coeffとして量子化部314に供給する。
直交変換部313は、演算部312から供給される予測残差Dと、制御部301から供給される変換情報Tinfoとを入力とし、その変換情報Tinfoに基づいて、予測残差Dに対して直交変換を行い、変換係数Coeffを導出する。例えば、直交変換部313は、予測残差Dに対してプライマリ変換を行ってプライマリ変換係数を生成し、ST識別子に基づいて、そのプライマリ変換係数に対してセカンダリ変換を行い、セカンダリ変換係数を生成する。直交変換部313は、その得られたセカンダリ変換係数を変換係数Coeffとして量子化部314に供給する。
<量子化部>
量子化部314は、直交変換部313から供給される変換係数Coeffと、制御部301から供給される変換情報Tinfoとを入力とし、その変換情報Tinfoに基づいて、変換係数Coeffをスケーリング(量子化)する。なお、この量子化のレートは、レート制御部323により制御される。量子化部314は、このような量子化により得られた量子化後の変換係数、すなわち量子化変換係数レベルlevelを、符号化部315および逆量子化部317に供給する。
量子化部314は、直交変換部313から供給される変換係数Coeffと、制御部301から供給される変換情報Tinfoとを入力とし、その変換情報Tinfoに基づいて、変換係数Coeffをスケーリング(量子化)する。なお、この量子化のレートは、レート制御部323により制御される。量子化部314は、このような量子化により得られた量子化後の変換係数、すなわち量子化変換係数レベルlevelを、符号化部315および逆量子化部317に供給する。
<符号化部>
符号化部315は、量子化部314から供給された量子化変換係数レベルlevelと、制御部301から供給される各種符号化パラメータ(ヘッダ情報Hinfo、予測モード情報Pinfo、変換情報Tinfo、フィルタ情報Finfoなど)と、インループフィルタ部320から供給されるフィルタ係数等のフィルタに関する情報と、予測部322から供給される最適な予測モードに関する情報とを入力とする。符号化部315は、量子化変換係数レベルlevelを可変長符号化(例えば、算術符号化)し、ビット列(符号化データ)を生成する。
符号化部315は、量子化部314から供給された量子化変換係数レベルlevelと、制御部301から供給される各種符号化パラメータ(ヘッダ情報Hinfo、予測モード情報Pinfo、変換情報Tinfo、フィルタ情報Finfoなど)と、インループフィルタ部320から供給されるフィルタ係数等のフィルタに関する情報と、予測部322から供給される最適な予測モードに関する情報とを入力とする。符号化部315は、量子化変換係数レベルlevelを可変長符号化(例えば、算術符号化)し、ビット列(符号化データ)を生成する。
また、符号化部315は、その量子化変換係数レベルlevelから残差情報Rinfoを導出し、残差情報Rinfoを符号化し、ビット列を生成する。
さらに、符号化部315は、インループフィルタ部320から供給されるフィルタに関する情報をフィルタ情報Finfoに含め、予測部322から供給される最適な予測モードに関する情報を予測モード情報Pinfoに含める。そして、符号化部315は、上述した各種符号化パラメータ(ヘッダ情報Hinfo、予測モード情報Pinfo、変換情報Tinfo、フィルタ情報Finfoなど)を符号化し、ビット列を生成する。
また、符号化部315は、以上のように生成された各種情報のビット列を多重化し、符号化データを生成する。符号化部315は、その符号化データを蓄積バッファ316に供給する。
<蓄積バッファ>
蓄積バッファ316は、符号化部315において得られた符号化データを、一時的に保持する。蓄積バッファ316は、所定のタイミングにおいて、保持している符号化データを、例えばビットストリーム等として画像符号化装置300の外部に出力する。例えば、この符号化データは、任意の記録媒体、任意の伝送媒体、任意の情報処理装置等を介して復号側に伝送される。すなわち、蓄積バッファ316は、符号化データ(ビットストリーム)を伝送する伝送部でもある。
蓄積バッファ316は、符号化部315において得られた符号化データを、一時的に保持する。蓄積バッファ316は、所定のタイミングにおいて、保持している符号化データを、例えばビットストリーム等として画像符号化装置300の外部に出力する。例えば、この符号化データは、任意の記録媒体、任意の伝送媒体、任意の情報処理装置等を介して復号側に伝送される。すなわち、蓄積バッファ316は、符号化データ(ビットストリーム)を伝送する伝送部でもある。
<逆量子化部>
逆量子化部317は、逆量子化に関する処理を行う。例えば、逆量子化部317は、量子化部314から供給される量子化変換係数レベルlevelと、制御部301から供給される変換情報Tinfoとを入力とし、その変換情報Tinfoに基づいて、量子化変換係数レベルlevelの値をスケーリング(逆量子化)する。なお、この逆量子化は、量子化部314において行われる量子化の逆処理である。逆量子化部317は、このような逆量子化により得られた変換係数Coeff_IQを、逆直交変換部318に供給する。
逆量子化部317は、逆量子化に関する処理を行う。例えば、逆量子化部317は、量子化部314から供給される量子化変換係数レベルlevelと、制御部301から供給される変換情報Tinfoとを入力とし、その変換情報Tinfoに基づいて、量子化変換係数レベルlevelの値をスケーリング(逆量子化)する。なお、この逆量子化は、量子化部314において行われる量子化の逆処理である。逆量子化部317は、このような逆量子化により得られた変換係数Coeff_IQを、逆直交変換部318に供給する。
<逆直交変換部>
逆直交変換部318は、逆直交変換に関する処理を行う。例えば、逆直交変換部318は、逆量子化部317から供給される変換係数Coeff_IQと、制御部301から供給される変換情報Tinfoとを入力とし、その変換情報Tinfoに基づいて、変換係数Coeff_IQに対して逆直交変換を行い、予測残差D'を導出する。なお、この逆直交変換は、直交変換部313において行われる直交変換の逆処理である。つまり、逆直交変換部318は、逆直交変換のタイプ(変換係数)を適応的に選択する適応逆直交変換(AMT)を行うことができる。
逆直交変換部318は、逆直交変換に関する処理を行う。例えば、逆直交変換部318は、逆量子化部317から供給される変換係数Coeff_IQと、制御部301から供給される変換情報Tinfoとを入力とし、その変換情報Tinfoに基づいて、変換係数Coeff_IQに対して逆直交変換を行い、予測残差D'を導出する。なお、この逆直交変換は、直交変換部313において行われる直交変換の逆処理である。つまり、逆直交変換部318は、逆直交変換のタイプ(変換係数)を適応的に選択する適応逆直交変換(AMT)を行うことができる。
逆直交変換部318は、このような逆直交変換により得られた予測残差D'を演算部319に供給する。なお、逆直交変換部318は、復号側の逆直交変換部(後述する)と同様であるので、逆直交変換部318については、復号側について行う説明(後述する)を適用することができる。
<演算部>
演算部319は、逆直交変換部318から供給される予測残差D'と、予測部322から供給される予測画像Pとを入力とする。演算部319は、その予測残差D'と、その予測残差D'に対応する予測画像Pとを加算し、局所復号画像Rlocalを導出する。演算部319は、導出した局所復号画像Rlocalをインループフィルタ部320およびフレームメモリ321に供給する。
演算部319は、逆直交変換部318から供給される予測残差D'と、予測部322から供給される予測画像Pとを入力とする。演算部319は、その予測残差D'と、その予測残差D'に対応する予測画像Pとを加算し、局所復号画像Rlocalを導出する。演算部319は、導出した局所復号画像Rlocalをインループフィルタ部320およびフレームメモリ321に供給する。
<インループフィルタ部>
インループフィルタ部320は、インループフィルタ処理に関する処理を行う。例えば、インループフィルタ部320は、演算部319から供給される局所復号画像Rlocalと、制御部301から供給されるフィルタ情報Finfoと、並べ替えバッファ311から供給される入力画像(元画像)とを入力とする。なお、インループフィルタ部320に入力される情報は任意であり、これらの情報以外の情報が入力されてもよい。例えば、必要に応じて、予測モード、動き情報、符号量目標値、量子化パラメータQP、ピクチャタイプ、ブロック(CU、CTU等)の情報等がインループフィルタ部320に入力されるようにしてもよい。
インループフィルタ部320は、インループフィルタ処理に関する処理を行う。例えば、インループフィルタ部320は、演算部319から供給される局所復号画像Rlocalと、制御部301から供給されるフィルタ情報Finfoと、並べ替えバッファ311から供給される入力画像(元画像)とを入力とする。なお、インループフィルタ部320に入力される情報は任意であり、これらの情報以外の情報が入力されてもよい。例えば、必要に応じて、予測モード、動き情報、符号量目標値、量子化パラメータQP、ピクチャタイプ、ブロック(CU、CTU等)の情報等がインループフィルタ部320に入力されるようにしてもよい。
インループフィルタ部320は、そのフィルタ情報Finfoに基づいて、局所復号画像Rlocalに対して適宜フィルタ処理を行う。インループフィルタ部320は、必要に応じて入力画像(元画像)や、その他の入力情報もそのフィルタ処理に用いる。
例えば、インループフィルタ部320は、非特許文献11に記載のように、バイラテラルフィルタ、デブロッキングフィルタ(DBF(DeBlocking Filter))、適応オフセットフィルタ(SAO(Sample Adaptive Offset))、および適応ループフィルタ(ALF(Adaptive Loop Filter))の4つのインループフィルタをこの順に適用する。なお、どのフィルタを適用するか、どの順で適用するかは任意であり、適宜選択可能である。
もちろん、インループフィルタ部320が行うフィルタ処理は任意であり、上述の例に限定されない。例えば、インループフィルタ部320がウィーナーフィルタ等を適用するようにしてもよい。
インループフィルタ部320は、フィルタ処理された局所復号画像Rlocalをフレームメモリ321に供給する。なお、例えばフィルタ係数等のフィルタに関する情報を復号側に伝送する場合、インループフィルタ部320は、そのフィルタに関する情報を符号化部315に供給する。
<フレームメモリ>
フレームメモリ321は、画像に関するデータの記憶に関する処理を行う。例えば、フレームメモリ321は、演算部319から供給される局所復号画像Rlocalや、インループフィルタ部320から供給されるフィルタ処理された局所復号画像Rlocalを入力とし、それを保持(記憶)する。また、フレームメモリ321は、その局所復号画像Rlocalを用いてピクチャ単位毎の復号画像Rを再構築し、保持する(フレームメモリ321内のバッファへ格納する)。フレームメモリ321は、予測部322の要求に応じて、その復号画像R(またはその一部)を予測部322に供給する。
フレームメモリ321は、画像に関するデータの記憶に関する処理を行う。例えば、フレームメモリ321は、演算部319から供給される局所復号画像Rlocalや、インループフィルタ部320から供給されるフィルタ処理された局所復号画像Rlocalを入力とし、それを保持(記憶)する。また、フレームメモリ321は、その局所復号画像Rlocalを用いてピクチャ単位毎の復号画像Rを再構築し、保持する(フレームメモリ321内のバッファへ格納する)。フレームメモリ321は、予測部322の要求に応じて、その復号画像R(またはその一部)を予測部322に供給する。
<予測部>
予測部322は、予測画像の生成に関する処理を行う。例えば、予測部322は、制御部301から供給される予測モード情報Pinfoと、並べ替えバッファ311から供給される入力画像(元画像)と、フレームメモリ321から読み出す復号画像R(またはその一部)を入力とする。予測部322は、予測モード情報Pinfoや入力画像(元画像)を用い、インター予測やイントラ予測等の予測処理を行い、復号画像Rを参照画像として参照して予測を行い、その予測結果に基づいて動き補償処理を行い、予測画像Pを生成する。予測部322は、生成した予測画像Pを演算部312および演算部319に供給する。また、予測部322は、以上の処理により選択した予測モード、すなわち最適な予測モードに関する情報を、必要に応じて符号化部315に供給する。
予測部322は、予測画像の生成に関する処理を行う。例えば、予測部322は、制御部301から供給される予測モード情報Pinfoと、並べ替えバッファ311から供給される入力画像(元画像)と、フレームメモリ321から読み出す復号画像R(またはその一部)を入力とする。予測部322は、予測モード情報Pinfoや入力画像(元画像)を用い、インター予測やイントラ予測等の予測処理を行い、復号画像Rを参照画像として参照して予測を行い、その予測結果に基づいて動き補償処理を行い、予測画像Pを生成する。予測部322は、生成した予測画像Pを演算部312および演算部319に供給する。また、予測部322は、以上の処理により選択した予測モード、すなわち最適な予測モードに関する情報を、必要に応じて符号化部315に供給する。
<レート制御部>
レート制御部323は、レート制御に関する処理を行う。例えば、レート制御部323は、蓄積バッファ316に蓄積された符号化データの符号量に基づいて、オーバフローあるいはアンダーフローが発生しないように、量子化部314の量子化動作のレートを制御する。
レート制御部323は、レート制御に関する処理を行う。例えば、レート制御部323は、蓄積バッファ316に蓄積された符号化データの符号量に基づいて、オーバフローあるいはアンダーフローが発生しないように、量子化部314の量子化動作のレートを制御する。
なお、これらの処理部(制御部301、並べ替えバッファ311乃至レート制御部323)は、任意の構成を有する。例えば、各処理部が、上述の処理を実現する論理回路により構成されるようにしてもよい。また、各処理部が、例えばCPU、ROM、RAM等を有し、それらを用いてプログラムを実行することにより、上述の処理を実現するようにしてもよい。もちろん、各処理部が、その両方の構成を有し、上述の処理の一部を論理回路により実現し、他を、プログラムを実行することにより実現するようにしてもよい。各処理部の構成は互いに独立していてもよく、例えば、一部の処理部が上述の処理の一部を論理回路により実現し、他の一部の処理部がプログラムを実行することにより上述の処理を実現し、さらに他の処理部が論理回路とプログラムの実行の両方により上述の処理を実現するようにしてもよい。
以上のような構成の画像符号化装置300において、符号化部315に<1.ST識別子の符号化>において説明した本技術を適用することができる。つまり、符号化部315が図3に示される符号化装置100と同様の構成を有し、同様の処理を行うようにする。
このようにすることにより、画像符号化装置300は、符号化効率を維持しつつ、ST識別子のコンテキスト変数の導出を簡略化することができる。また、画像符号化装置300は、符号化効率を維持しつつ、ST識別子のコンテキスト変数を保持するメモリサイズを削減することができる。つまり、画像符号化装置300は、符号化処理の負荷の増大を抑制することができる。
<画像符号化処理の流れ>
次に、以上のような構成の画像符号化装置300により実行される画像符号化処理の流れの例を、図8のフローチャートを参照して説明する。
次に、以上のような構成の画像符号化装置300により実行される画像符号化処理の流れの例を、図8のフローチャートを参照して説明する。
画像符号化処理が開始されると、ステップS301において、並べ替えバッファ311は、制御部301に制御されて、入力された動画像データのフレームの順を表示順から符号化順に並べ替える。
ステップS302において、制御部301は、並べ替えバッファ311が保持する入力画像に対して、処理単位を設定する(ブロック分割を行う)。
ステップS303において、制御部301は、並べ替えバッファ311が保持する入力画像についての符号化パラメータを決定(設定)する。
ステップS304において、予測部322は、予測処理を行い、最適な予測モードの予測画像等を生成する。例えば、この予測処理において、予測部322は、イントラ予測を行って最適なイントラ予測モードの予測画像等を生成し、インター予測を行って最適なインター予測モードの予測画像等を生成し、それらの中から、コスト関数値等に基づいて最適な予測モードを選択する。
ステップS305において、演算部312は、入力画像と、ステップS304の予測処理により選択された最適なモードの予測画像との差分を演算する。つまり、演算部312は、入力画像と予測画像との予測残差Dを生成する。このようにして求められた予測残差Dは、元の画像データに比べてデータ量が低減される。したがって、画像をそのまま符号化する場合に比べて、データ量を圧縮することができる。
ステップS306において、直交変換部313は、ステップS305の処理により生成された予測残差Dに対する直交変換処理を行い、変換係数Coeffを導出する。
ステップS307において、量子化部314は、制御部301により算出された量子化パラメータを用いる等して、ステップS306の処理により得られた変換係数Coeffを量子化し、量子化変換係数レベルlevelを導出する。
ステップS308において、逆量子化部317は、ステップS307の処理により生成された量子化変換係数レベルlevelを、そのステップS307の量子化の特性に対応する特性で逆量子化し、変換係数Coeff_IQを導出する。
ステップS309において、逆直交変換部318は、ステップS308の処理により得られた変換係数Coeff_IQを、ステップS306の直交変換処理に対応する方法で逆直交変換し、予測残差D'を導出する。なお、この逆直交変換処理は、復号側において行われる逆直交変換処理(後述する)と同様であるので、このステップS309の逆直交変換処理については、復号側について行う説明(後述する)を適用することができる。
ステップS310において、演算部319は、ステップS309の処理により導出された予測残差D'に、ステップS304の予測処理により得られた予測画像を加算することにより、局所的に復号された復号画像を生成する。
ステップS311において、インループフィルタ部320は、ステップS310の処理により導出された、局所的に復号された復号画像に対して、インループフィルタ処理を行う。
ステップS312において、フレームメモリ321は、ステップS310の処理により導出された、局所的に復号された復号画像や、ステップS311においてフィルタ処理された、局所的に復号された復号画像を記憶する。
ステップS313において、符号化部315は、ステップS307の処理により得られた量子化変換係数レベルlevelを符号化する。例えば、符号化部315は、画像に関する情報である量子化変換係数レベルlevelを、算術符号化等により符号化し、符号化データを生成する。また、このとき、符号化部315は、各種符号化パラメータ(ヘッダ情報Hinfo、予測モード情報Pinfo、変換情報Tinfo)を符号化する。さらに、符号化部315は、量子化変換係数レベルlevelから残差情報RInfoを導出し、その残差情報RInfoを符号化する。
ステップS314において、蓄積バッファ316は、このようにして得られた符号化データを蓄積し、例えばビットストリームとして、それを画像符号化装置300の外部に出力する。このビットストリームは、例えば、伝送路や記録媒体を介して復号側に伝送される。また、レート制御部323は、必要に応じてレート制御を行う。
ステップS314の処理が終了すると、画像符号化処理が終了する。
以上のような流れの画像符号化処理において、ステップS313の符号化処理に本技術を適用する。つまり、このステップS313において、図4と同様の流れの符号化処理が行われるようにする。つまり、符号化部315が、<1.ST識別子の符号化>において説明した本技術を適用した符号化処理を行うようにする。
このようにすることにより、画像符号化装置300は、符号化効率を維持しつつ、ST識別子のコンテキスト変数の導出を簡略化することができる。また、画像符号化装置300は、符号化効率を維持しつつ、ST識別子のコンテキスト変数を保持するメモリサイズを削減することができる。つまり、画像符号化装置300は、符号化処理の負荷の増大を抑制することができる。
<5.第4の実施の形態>
<画像復号装置>
図9は、本技術を適用した画像処理装置の一態様である画像復号装置の構成の一例を示すブロック図である。図9に示される画像復号装置400は、動画像の符号化データを符号化する装置である。例えば、画像復号装置400は、上述の非特許文献のいずれかに記載の復号方式で符号化データを復号することができる。例えば、画像復号装置400は、上述の画像符号化装置300により生成された符号化データ(ビットストリーム)を復号する。
<画像復号装置>
図9は、本技術を適用した画像処理装置の一態様である画像復号装置の構成の一例を示すブロック図である。図9に示される画像復号装置400は、動画像の符号化データを符号化する装置である。例えば、画像復号装置400は、上述の非特許文献のいずれかに記載の復号方式で符号化データを復号することができる。例えば、画像復号装置400は、上述の画像符号化装置300により生成された符号化データ(ビットストリーム)を復号する。
なお、図9においては、処理部(ブロック)やデータの流れ等の主なものを示しており、図9に示されるものが全てとは限らない。つまり、画像復号装置400において、図9においてブロックとして示されていない処理部が存在したり、図9において矢印等として示されていない処理やデータの流れが存在したりしてもよい。
図9において、画像復号装置400は、蓄積バッファ411、復号部412、逆量子化部413、逆直交変換部414、演算部415、インループフィルタ部416、並べ替えバッファ417、フレームメモリ418、および予測部419を備えている。なお、予測部419は、不図示のイントラ予測部、およびインター予測部を備えている。画像復号装置400は、符号化データ(ビットストリーム)を復号することによって、動画像データを生成するための装置である。
<蓄積バッファ>
蓄積バッファ411は、画像復号装置400に入力されたビットストリームを取得し、保持(記憶)する。蓄積バッファ411は、所定のタイミングにおいて、または、所定の条件が整う等した場合、蓄積しているビットストリームを復号部412に供給する。
蓄積バッファ411は、画像復号装置400に入力されたビットストリームを取得し、保持(記憶)する。蓄積バッファ411は、所定のタイミングにおいて、または、所定の条件が整う等した場合、蓄積しているビットストリームを復号部412に供給する。
<復号部>
復号部412は、画像の復号に関する処理を行う。例えば、復号部412は、蓄積バッファ411から供給されるビットストリームを入力とし、シンタックステーブルの定義に沿って、そのビット列から、各シンタックス要素のシンタックス値を可変長復号し、パラメータを導出する。
復号部412は、画像の復号に関する処理を行う。例えば、復号部412は、蓄積バッファ411から供給されるビットストリームを入力とし、シンタックステーブルの定義に沿って、そのビット列から、各シンタックス要素のシンタックス値を可変長復号し、パラメータを導出する。
シンタックス要素およびシンタックス要素のシンタックス値から導出されるパラメータには、例えば、ヘッダ情報Hinfo、予測モード情報Pinfo、変換情報Tinfo、残差情報Rinfo、フィルタ情報Finfoなどの情報が含まれる。つまり、復号部412は、ビットストリームから、これらの情報をパースする(解析して取得する)。これらの情報について以下に説明する。
<ヘッダ情報Hinfo>
ヘッダ情報Hinfoは、例えば、VPS(Video Parameter Set)/SPS(Sequence Parameter Set)/PPS(Picture Parameter Set)/SH(スライスヘッダ)などのヘッダ情報を含む。ヘッダ情報Hinfoには、例えば、画像サイズ(横幅PicWidth、縦幅PicHeight)、ビット深度(輝度bitDepthY, 色差bitDepthC)、色差アレイタイプChromaArrayType、CUサイズの最大値MaxCUSize/最小値MinCUSize、4分木分割(Quad-tree分割ともいう)の最大深度MaxQTDepth/最小深度MinQTDepth、2分木分割(Binary-tree分割)の最大深度MaxBTDepth/最小深度MinBTDepth、変換スキップブロックの最大値MaxTSSize(最大変換スキップブロックサイズともいう)、各符号化ツールのオンオフフラグ(有効フラグともいう)などを規定する情報が含まれる。
ヘッダ情報Hinfoは、例えば、VPS(Video Parameter Set)/SPS(Sequence Parameter Set)/PPS(Picture Parameter Set)/SH(スライスヘッダ)などのヘッダ情報を含む。ヘッダ情報Hinfoには、例えば、画像サイズ(横幅PicWidth、縦幅PicHeight)、ビット深度(輝度bitDepthY, 色差bitDepthC)、色差アレイタイプChromaArrayType、CUサイズの最大値MaxCUSize/最小値MinCUSize、4分木分割(Quad-tree分割ともいう)の最大深度MaxQTDepth/最小深度MinQTDepth、2分木分割(Binary-tree分割)の最大深度MaxBTDepth/最小深度MinBTDepth、変換スキップブロックの最大値MaxTSSize(最大変換スキップブロックサイズともいう)、各符号化ツールのオンオフフラグ(有効フラグともいう)などを規定する情報が含まれる。
例えば、ヘッダ情報Hinfoに含まれる符号化ツールのオンオフフラグとしては、以下に示す変換、量子化処理に関わるオンオフフラグがある。なお、符号化ツールのオンオフフラグは、該符号化ツールに関わるシンタックスが符号化データ中に存在するか否かを示すフラグとも解釈することができる。また、オンオフフラグの値が1(真)の場合、該符号化ツールが使用可能であることを示し、オンオフフラグの値が0(偽)の場合、該符号化ツールが使用不可であることを示す。なお、フラグ値の解釈は逆であってもよい。
コンポーネント間予測有効フラグ(ccp_enabled_flag):コンポーネント間予測(CCP(Cross-Component Prediction),CC予測とも称する)が使用可能であるか否かを示すフラグ情報である。例えば、このフラグ情報が「1」(真)の場合、使用可能であることが示され、「0」(偽)の場合、使用不可であることが示される。
なお、このCCPは、コンポーネント間線形予測(CCLMまたはCCLMP)とも称する。
<予測モード情報Pinfo>
予測モード情報Pinfoには、例えば、処理対象PB(予測ブロック)のサイズ情報PBSize(予測ブロックサイズ)、イントラ予測モード情報IPinfo、動き予測情報MVinfo等の情報が含まれる。
予測モード情報Pinfoには、例えば、処理対象PB(予測ブロック)のサイズ情報PBSize(予測ブロックサイズ)、イントラ予測モード情報IPinfo、動き予測情報MVinfo等の情報が含まれる。
イントラ予測モード情報IPinfoには、例えば、JCTVC-W1005, 7.3.8.5 Coding Unit syntax中のprev_intra_luma_pred_flag, mpm_idx, rem_intra_pred_mode、およびそのシンタックスから導出される輝度イントラ予測モードIntraPredModeY等が含まれる。
また、イントラ予測モード情報IPinfoには、例えば、コンポーネント間予測フラグ(ccp_flag(cclmp_flag))、多クラス線形予測モードフラグ(mclm_flag)、色差サンプル位置タイプ識別子(chroma_sample_loc_type_idx)、色差MPM識別子(chroma_mpm_idx)、および、これらのシンタックスから導出される輝度イントラ予測モード(IntraPredModeC)等が含まれる。
コンポーネント間予測フラグ(ccp_flag(cclmp_flag))は、コンポーネント間線形予測を適用するか否かを示すフラグ情報である。例えば、ccp_flag==1のとき、コンポーネント間予測を適用することを示し、ccp_flag==0のとき、コンポーネント間予測を適用しないことを示す。
多クラス線形予測モードフラグ(mclm_flag)は、線形予測のモードに関する情報(線形予測モード情報)である。より具体的には、多クラス線形予測モードフラグ(mclm_flag)は、多クラス線形予測モードにするか否かを示すフラグ情報である。例えば、「0」の場合、1クラスモード(単一クラスモード)(例えばCCLMP)であることを示し、「1」の場合、2クラスモード(多クラスモード)(例えばMCLMP)であることを示す。
色差サンプル位置タイプ識別子(chroma_sample_loc_type_idx)は、色差コンポーネントの画素位置のタイプ(色差サンプル位置タイプとも称する)を識別する識別子である。例えば色フォーマットに関する情報である色差アレイタイプ(ChromaArrayType)が420形式を示す場合、色差サンプル位置タイプ識別子は、以下の式のような割り当て方となる。
chroma_sample_loc_type_idx == 0:Type2
chroma_sample_loc_type_idx == 1:Type3
chroma_sample_loc_type_idx == 2:Type0
chroma_sample_loc_type_idx == 3:Type1
chroma_sample_loc_type_idx == 1:Type3
chroma_sample_loc_type_idx == 2:Type0
chroma_sample_loc_type_idx == 3:Type1
なお、この色差サンプル位置タイプ識別子(chroma_sample_loc_type_idx)は、色差コンポーネントの画素位置に関する情報(chroma_sample_loc_info())として(に格納されて)伝送される。
色差MPM識別子(chroma_mpm_idx)は、色差イントラ予測モード候補リスト(intraPredModeCandListC)の中のどの予測モード候補を色差イントラ予測モードとして指定するかを表す識別子である。
動き予測情報MVinfoには、例えば、merge_idx, merge_flag, inter_pred_idc, ref_idx_LX, mvp_lX_flag, X={0,1}, mvd等の情報が含まれる(例えば、JCTVC-W1005, 7.3.8.6 Prediction Unit Syntaxを参照)。
もちろん、予測モード情報Pinfoに含まれる情報は任意であり、これらの情報以外の情報が含まれるようにしてもよい。
<変換情報Tinfo>
変換情報Tinfoには、例えば、以下の情報が含まれる。もちろん、変換情報Tinfoに含まれる情報は任意であり、これらの情報以外の情報が含まれるようにしてもよい。
変換情報Tinfoには、例えば、以下の情報が含まれる。もちろん、変換情報Tinfoに含まれる情報は任意であり、これらの情報以外の情報が含まれるようにしてもよい。
処理対象変換ブロックの横幅サイズTBWSizeおよび縦幅TBHSize(または、2を底とする各TBWSize、TBHSizeの対数値log2TBWSize、log2TBHSizeであってもよい)。
変換スキップフラグ(ts_flag):(逆)プライマリ変換および(逆)セカンダリ変換をスキップか否かを示すフラグである。
スキャン識別子(scanIdx)
量子化パラメータ(qp)
量子化マトリックス(scaling_matrix(例えば、JCTVC-W1005, 7.3.4 Scaling list data syntax))
変換スキップフラグ(ts_flag):(逆)プライマリ変換および(逆)セカンダリ変換をスキップか否かを示すフラグである。
スキャン識別子(scanIdx)
量子化パラメータ(qp)
量子化マトリックス(scaling_matrix(例えば、JCTVC-W1005, 7.3.4 Scaling list data syntax))
<残差情報Rinfo>
残差情報Rinfo(例えば、JCTVC-W1005の7.3.8.11 Residual Coding syntaxを参照)には、例えば以下のシンタックスが含まれる。
残差情報Rinfo(例えば、JCTVC-W1005の7.3.8.11 Residual Coding syntaxを参照)には、例えば以下のシンタックスが含まれる。
cbf(coded_block_flag):残差データ有無フラグ
last_sig_coeff_x_pos:ラスト非ゼロ係数X座標
last_sig_coeff_y_pos:ラスト非ゼロ係数Y座標
coded_sub_block_flag:サブブロック非ゼロ係数有無フラグ
sig_coeff_flag:非ゼロ係数有無フラグ
gr1_flag:非ゼロ係数のレベルが1より大きいかを示すフラグ(GR1フラグとも呼ぶ)
gr2_flag:非ゼロ係数のレベルが2より大きいかを示すフラグ(GR2フラグとも呼ぶ)
sign_flag:非ゼロ係数の正負を示す符号(サイン符号とも呼ぶ)
coeff_abs_level_remaining:非ゼロ係数の残余レベル(非ゼロ係数残余レベルとも呼ぶ)
など。
last_sig_coeff_x_pos:ラスト非ゼロ係数X座標
last_sig_coeff_y_pos:ラスト非ゼロ係数Y座標
coded_sub_block_flag:サブブロック非ゼロ係数有無フラグ
sig_coeff_flag:非ゼロ係数有無フラグ
gr1_flag:非ゼロ係数のレベルが1より大きいかを示すフラグ(GR1フラグとも呼ぶ)
gr2_flag:非ゼロ係数のレベルが2より大きいかを示すフラグ(GR2フラグとも呼ぶ)
sign_flag:非ゼロ係数の正負を示す符号(サイン符号とも呼ぶ)
coeff_abs_level_remaining:非ゼロ係数の残余レベル(非ゼロ係数残余レベルとも呼ぶ)
など。
もちろん、残差情報Rinfoに含まれる情報は任意であり、これらの情報以外の情報が含まれるようにしてもよい。
<フィルタ情報Finfo>
フィルタ情報Finfoには、例えば、以下に示す各フィルタ処理に関する制御情報が含まれる。
フィルタ情報Finfoには、例えば、以下に示す各フィルタ処理に関する制御情報が含まれる。
デブロッキングフィルタ(DBF)に関する制御情報
画素適応オフセット(SAO)に関する制御情報
適応ループフィルタ(ALF)に関する制御情報
その他の線形・非線形フィルタに関する制御情報
画素適応オフセット(SAO)に関する制御情報
適応ループフィルタ(ALF)に関する制御情報
その他の線形・非線形フィルタに関する制御情報
より具体的には、例えば、各フィルタを適用するピクチャや、ピクチャ内の領域を指定する情報や、CU単位のフィルタOn/Off制御情報、スライス、タイルの境界に関するフィルタOn/Off制御情報などが含まれる。もちろん、フィルタ情報Finfoに含まれる情報は任意であり、これらの情報以外の情報が含まれるようにしてもよい。
復号部412の説明に戻る。復号部412は、残差情報Rinfoを参照して、各変換ブロック内の各係数位置の量子化変換係数レベルlevelを導出する。復号部412は、その量子化変換係数レベルlevelを、逆量子化部413に供給する。
また、復号部412は、パースしたヘッダ情報Hinfo、予測モード情報Pinfo、量子化変換係数レベルlevel、変換情報Tinfo、フィルタ情報Finfoを各ブロックへ供給する。具体的には以下の通りである。
ヘッダ情報Hinfoは、逆量子化部413、逆直交変換部414、予測部419、インループフィルタ部416に供給される。
予測モード情報Pinfoは、逆量子化部413および予測部419に供給される。
変換情報Tinfoは、逆量子化部413および逆直交変換部414に供給される。
フィルタ情報Finfoは、インループフィルタ部416に供給される。
予測モード情報Pinfoは、逆量子化部413および予測部419に供給される。
変換情報Tinfoは、逆量子化部413および逆直交変換部414に供給される。
フィルタ情報Finfoは、インループフィルタ部416に供給される。
もちろん、上述の例は一例であり、この例に限定されない。例えば、各符号化パラメータが任意の処理部に供給されるようにしてもよい。また、その他の情報が、任意の処理部に供給されるようにしてもよい。
<逆量子化部>
逆量子化部413は、少なくとも、逆量子化に関する処理を行うために必要な構成を有する。例えば、逆量子化部413は、復号部412から供給される変換情報Tinfoおよび量子化変換係数レベルlevelを入力とし、その変換情報Tinfoに基づいて、量子化変換係数レベルlevelの値をスケーリング(逆量子化)し、逆量子化後の変換係数Coeff_IQを導出する。
逆量子化部413は、少なくとも、逆量子化に関する処理を行うために必要な構成を有する。例えば、逆量子化部413は、復号部412から供給される変換情報Tinfoおよび量子化変換係数レベルlevelを入力とし、その変換情報Tinfoに基づいて、量子化変換係数レベルlevelの値をスケーリング(逆量子化)し、逆量子化後の変換係数Coeff_IQを導出する。
なお、この逆量子化は、量子化部314による量子化の逆処理として行われる。また、この逆量子化は、逆量子化部317による逆量子化と同様の処理である。つまり、逆量子化部317は、逆量子化部413と同様の処理(逆量子化)を行う。
逆量子化部413は、導出した変換係数Coeff_IQを逆直交変換部414に供給する。
<逆直交変換部>
逆直交変換部414は、逆直交変換に関する処理を行う。例えば、逆直交変換部414は、逆量子化部413から供給される変換係数Coeff_IQ、および、復号部412から供給される変換情報Tinfoを入力とし、その変換情報Tinfoに基づいて、変換係数Coeff_IQに対して逆直交変換処理を行い、予測残差D'を導出する。例えば、逆直交変換部414は、ST識別子に基づいて、変換係数Coeff_IQに対して逆セカンダリ変換を行ってプライマリ変換係数を生成し、そのプライマリ変換係数に対してプライマリ変換を行い、予測残差D'を生成する。
逆直交変換部414は、逆直交変換に関する処理を行う。例えば、逆直交変換部414は、逆量子化部413から供給される変換係数Coeff_IQ、および、復号部412から供給される変換情報Tinfoを入力とし、その変換情報Tinfoに基づいて、変換係数Coeff_IQに対して逆直交変換処理を行い、予測残差D'を導出する。例えば、逆直交変換部414は、ST識別子に基づいて、変換係数Coeff_IQに対して逆セカンダリ変換を行ってプライマリ変換係数を生成し、そのプライマリ変換係数に対してプライマリ変換を行い、予測残差D'を生成する。
なお、この逆直交変換は、直交変換部313による直交変換の逆処理として行われる。また、この逆直交変換は、逆直交変換部318による逆直交変換と同様の処理である。つまり、逆直交変換部318は、逆直交変換部414と同様の処理(逆直交変換)を行う。
逆直交変換部414は、導出した予測残差D'を演算部415に供給する。
<演算部>
演算部415は、画像に関する情報の加算に関する処理を行う。例えば、演算部415は、逆直交変換部414から供給される予測残差D'と、予測部419から供給される予測画像Pとを入力とする。演算部415は、以下の式に示されるように、予測残差D'とその予測残差D'に対応する予測画像P(予測信号)とを加算し、局所復号画像Rlocalを導出する。
演算部415は、画像に関する情報の加算に関する処理を行う。例えば、演算部415は、逆直交変換部414から供給される予測残差D'と、予測部419から供給される予測画像Pとを入力とする。演算部415は、以下の式に示されるように、予測残差D'とその予測残差D'に対応する予測画像P(予測信号)とを加算し、局所復号画像Rlocalを導出する。
Rlocal = D' + P
演算部415は、導出した局所復号画像Rlocalを、インループフィルタ部416およびフレームメモリ418に供給する。
<インループフィルタ部>
インループフィルタ部416は、インループフィルタ処理に関する処理を行う。例えば、インループフィルタ部416は、演算部415から供給される局所復号画像Rlocalと、復号部412から供給されるフィルタ情報Finfoとを入力とする。なお、インループフィルタ部416に入力される情報は任意であり、これらの情報以外の情報が入力されてもよい。
インループフィルタ部416は、インループフィルタ処理に関する処理を行う。例えば、インループフィルタ部416は、演算部415から供給される局所復号画像Rlocalと、復号部412から供給されるフィルタ情報Finfoとを入力とする。なお、インループフィルタ部416に入力される情報は任意であり、これらの情報以外の情報が入力されてもよい。
インループフィルタ部416は、そのフィルタ情報Finfoに基づいて、局所復号画像Rlocalに対して適宜フィルタ処理を行う。
例えば、インループフィルタ部416は、非特許文献11に記載のように、バイラテラルフィルタ、デブロッキングフィルタ(DBF(DeBlocking Filter))、適応オフセットフィルタ(SAO(Sample Adaptive Offset))、および適応ループフィルタ(ALF(Adaptive Loop Filter))の4つのインループフィルタをこの順に適用する。なお、どのフィルタを適用するか、どの順で適用するかは任意であり、適宜選択可能である。
インループフィルタ部416は、符号化側(例えば画像符号化装置300のインループフィルタ部320)により行われたフィルタ処理に対応するフィルタ処理を行う。もちろん、インループフィルタ部416が行うフィルタ処理は任意であり、上述の例に限定されない。例えば、インループフィルタ部416がウィーナーフィルタ等を適用するようにしてもよい。
インループフィルタ部416は、フィルタ処理された局所復号画像Rlocalを並べ替えバッファ417およびフレームメモリ418に供給する。
<並べ替えバッファ>
並べ替えバッファ417は、インループフィルタ部416から供給された局所復号画像Rlocalを入力とし、それを保持(記憶)する。並べ替えバッファ417は、その局所復号画像Rlocalを用いてピクチャ単位毎の復号画像Rを再構築し、保持する(バッファ内に格納する)。並べ替えバッファ417は、得られた復号画像Rを、復号順から再生順に並べ替える。並べ替えバッファ417は、並べ替えた復号画像R群を動画像データとして画像復号装置400の外部に出力する。
並べ替えバッファ417は、インループフィルタ部416から供給された局所復号画像Rlocalを入力とし、それを保持(記憶)する。並べ替えバッファ417は、その局所復号画像Rlocalを用いてピクチャ単位毎の復号画像Rを再構築し、保持する(バッファ内に格納する)。並べ替えバッファ417は、得られた復号画像Rを、復号順から再生順に並べ替える。並べ替えバッファ417は、並べ替えた復号画像R群を動画像データとして画像復号装置400の外部に出力する。
<フレームメモリ>
フレームメモリ418は、画像に関するデータの記憶に関する処理を行う。例えば、フレームメモリ418は、演算部415より供給される局所復号画像Rlocalを入力とし、ピクチャ単位毎の復号画像Rを再構築して、フレームメモリ418内のバッファへ格納する。
フレームメモリ418は、画像に関するデータの記憶に関する処理を行う。例えば、フレームメモリ418は、演算部415より供給される局所復号画像Rlocalを入力とし、ピクチャ単位毎の復号画像Rを再構築して、フレームメモリ418内のバッファへ格納する。
また、フレームメモリ418は、インループフィルタ部416から供給される、インループフィルタ処理された局所復号画像Rlocalを入力とし、ピクチャ単位毎の復号画像Rを再構築して、フレームメモリ418内のバッファへ格納する。フレームメモリ418は、適宜、その記憶している復号画像R(またはその一部)を参照画像として予測部419に供給する。
なお、フレームメモリ418が、復号画像の生成に係るヘッダ情報Hinfo、予測モード情報Pinfo、変換情報Tinfo、フィルタ情報Finfoなどを記憶するようにしても良い。
<予測部>
予測部419は、予測画像の生成に関する処理を行う。例えば、予測部419は、復号部412から供給される予測モード情報Pinfoを入力とし、その予測モード情報Pinfoによって指定される予測方法により予測を行い、予測画像Pを導出する。その導出の際、予測部419は、その予測モード情報Pinfoによって指定される、フレームメモリ418に格納されたフィルタ前またはフィルタ後の復号画像R(またはその一部)を、参照画像として利用する。予測部419は、導出した予測画像Pを、演算部415に供給する。
予測部419は、予測画像の生成に関する処理を行う。例えば、予測部419は、復号部412から供給される予測モード情報Pinfoを入力とし、その予測モード情報Pinfoによって指定される予測方法により予測を行い、予測画像Pを導出する。その導出の際、予測部419は、その予測モード情報Pinfoによって指定される、フレームメモリ418に格納されたフィルタ前またはフィルタ後の復号画像R(またはその一部)を、参照画像として利用する。予測部419は、導出した予測画像Pを、演算部415に供給する。
なお、これらの処理部(蓄積バッファ411乃至予測部419)は、任意の構成を有する。例えば、各処理部が、上述の処理を実現する論理回路により構成されるようにしてもよい。また、各処理部が、例えばCPU、ROM、RAM等を有し、それらを用いてプログラムを実行することにより、上述の処理を実現するようにしてもよい。もちろん、各処理部が、その両方の構成を有し、上述の処理の一部を論理回路により実現し、他を、プログラムを実行することにより実現するようにしてもよい。各処理部の構成は互いに独立していてもよく、例えば、一部の処理部が上述の処理の一部を論理回路により実現し、他の一部の処理部がプログラムを実行することにより上述の処理を実現し、さらに他の処理部が論理回路とプログラムの実行の両方により上述の処理を実現するようにしてもよい。
以上のような構成の画像復号装置400において、復号部412に<1.ST識別子の符号化>において説明した本技術を適用することができる。つまり、復号部412が図5に示される復号装置200と同様の構成を有し、同様の処理を行うようにする。
このようにすることにより、画像復号装置400は、符号化効率を維持しつつ、ST識別子のコンテキスト変数の導出を簡略化することができる。また、画像復号装置400は、符号化効率を維持しつつ、ST識別子のコンテキスト変数を保持するメモリサイズを削減することができる。つまり、画像復号装置400は、復号処理の負荷の増大を抑制することができる。
<画像符号化処理の流れ>
次に、以上のような構成の画像復号装置400により実行される画像復号処理の流れの例を、図10のフローチャートを参照して説明する。
次に、以上のような構成の画像復号装置400により実行される画像復号処理の流れの例を、図10のフローチャートを参照して説明する。
画像復号処理が開始されると、蓄積バッファ411は、ステップS401において、画像復号装置400の外部から供給される符号化データ(ビットストリーム)を取得して保持する(蓄積する)。
ステップS402において、復号部412は、その符号化データ(ビットストリーム)を復号し、量子化変換係数レベルlevelを得る。また、復号部412は、この復号により、符号化データ(ビットストリーム)から各種符号化パラメータをパースする(解析して取得する)。
ステップS403において、逆量子化部413は、ステップS402の処理により得られた量子化変換係数レベルlevelに対して、符号化側で行われた量子化の逆処理である逆量子化を行い、変換係数Coeff_IQを得る。
ステップS404において、逆直交変換部414は、ステップS403において得られた変換係数Coeff_IQに対して、符号化側で行われた直交変換処理の逆処理である逆直交変換処理を行い、予測残差D'を得る。
ステップS405において、予測部419は、ステップS402においてパースされた情報に基づいて、符号化側より指定される予測方法で予測処理を実行し、フレームメモリ418に記憶されている参照画像を参照する等して、予測画像Pを生成する。
ステップS406において、演算部415は、ステップS404において得られた予測残差D'と、ステップS405において得られた予測画像Pとを加算し、局所復号画像Rlocalを導出する。
ステップS407において、インループフィルタ部416は、ステップS406の処理により得られた局所復号画像Rlocalに対して、インループフィルタ処理を行う。
ステップS408において、並べ替えバッファ417は、ステップS407の処理により得られたフィルタ処理された局所復号画像Rlocalを用いて復号画像Rを導出し、その復号画像R群の順序を復号順から再生順に並べ替える。再生順に並べ替えられた復号画像R群は、動画像として画像復号装置400の外部に出力される。
また、ステップS409において、フレームメモリ418は、ステップS406の処理により得られた局所復号画像Rlocal、および、ステップS407の処理により得られたフィルタ処理後の局所復号画像Rlocalの内、少なくとも一方を記憶する。
ステップS409の処理が終了すると、画像復号処理が終了する。
以上のような流れの画像復号処理において、ステップS402の復号処理に本技術を適用する。つまり、このステップS402において、図6と同様の流れの復号処理が行われるようにする。つまり、復号部412が、<1.ST識別子の符号化>において説明した本技術を適用した復号処理を行うようにする。
このようにすることにより、画像復号装置400は、符号化効率を維持しつつ、ST識別子のコンテキスト変数の導出を簡略化することができる。また、画像復号装置400は、符号化効率を維持しつつ、ST識別子のコンテキスト変数を保持するメモリサイズを削減することができる。つまり、画像復号装置400は、復号処理の負荷の増大を抑制することができる。
<6.付記>
<コンピュータ>
上述した一連の処理は、ハードウエアにより実行させることもできるし、ソフトウエアにより実行させることもできる。一連の処理をソフトウエアにより実行する場合には、そのソフトウエアを構成するプログラムが、コンピュータにインストールされる。ここでコンピュータには、専用のハードウエアに組み込まれているコンピュータや、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータ等が含まれる。
<コンピュータ>
上述した一連の処理は、ハードウエアにより実行させることもできるし、ソフトウエアにより実行させることもできる。一連の処理をソフトウエアにより実行する場合には、そのソフトウエアを構成するプログラムが、コンピュータにインストールされる。ここでコンピュータには、専用のハードウエアに組み込まれているコンピュータや、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータ等が含まれる。
図11は、上述した一連の処理をプログラムにより実行するコンピュータのハードウエアの構成例を示すブロック図である。
図11に示されるコンピュータ800において、CPU(Central Processing Unit)801、ROM(Read Only Memory)802、RAM(Random Access Memory)803は、バス804を介して相互に接続されている。
バス804にはまた、入出力インタフェース810も接続されている。入出力インタフェース810には、入力部811、出力部812、記憶部813、通信部814、およびドライブ815が接続されている。
入力部811は、例えば、キーボード、マウス、マイクロホン、タッチパネル、入力端子などよりなる。出力部812は、例えば、ディスプレイ、スピーカ、出力端子などよりなる。記憶部813は、例えば、ハードディスク、RAMディスク、不揮発性のメモリなどよりなる。通信部814は、例えば、ネットワークインタフェースよりなる。ドライブ815は、磁気ディスク、光ディスク、光磁気ディスク、または半導体メモリなどのリムーバブルメディア821を駆動する。
以上のように構成されるコンピュータでは、CPU801が、例えば、記憶部813に記憶されているプログラムを、入出力インタフェース810およびバス804を介して、RAM803にロードして実行することにより、上述した一連の処理が行われる。RAM803にはまた、CPU801が各種の処理を実行する上において必要なデータなども適宜記憶される。
コンピュータが実行するプログラムは、例えば、パッケージメディア等としてのリムーバブルメディア821に記録して適用することができる。その場合、プログラムは、リムーバブルメディア821をドライブ815に装着することにより、入出力インタフェース810を介して、記憶部813にインストールすることができる。
また、このプログラムは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の伝送媒体を介して提供することもできる。その場合、プログラムは、通信部814で受信し、記憶部813にインストールすることができる。
その他、このプログラムは、ROM802や記憶部813に、あらかじめインストールしておくこともできる。
<本技術の適用対象>
本技術は、任意の画像符号化・復号方式に適用することができる。つまり、上述した本技術と矛盾しない限り、変換(逆変換)、量子化(逆量子化)、符号化(復号)、予測等、画像符号化・復号に関する各種処理の仕様は任意であり、上述した例に限定されない。また、上述した本技術と矛盾しない限り、これらの処理の内の一部を省略してもよい。
本技術は、任意の画像符号化・復号方式に適用することができる。つまり、上述した本技術と矛盾しない限り、変換(逆変換)、量子化(逆量子化)、符号化(復号)、予測等、画像符号化・復号に関する各種処理の仕様は任意であり、上述した例に限定されない。また、上述した本技術と矛盾しない限り、これらの処理の内の一部を省略してもよい。
また本技術は、複数の視点(ビュー(view))の画像を含む多視点画像の符号化・復号を行う多視点画像符号化・復号システムに適用することができる。その場合、各視点(ビュー(view))の符号化・復号において、本技術を適用するようにすればよい。
さらに本技術は、所定のパラメータについてスケーラビリティ(scalability)機能を有するように複数レイヤ化(階層化)された階層画像の符号化・復号を行う階層画像符号化(スケーラブル符号化)・復号システムに適用することができる。その場合、各階層(レイヤ)の符号化・復号において、本技術を適用するようにすればよい。
また、以上においては、本技術の適用例として、符号化装置100、復号装置200、画像符号化装置300、および画像復号装置400について説明したが、本技術は、任意の構成に適用することができる。
例えば、本技術は、衛星放送、ケーブルTVなどの有線放送、インターネット上での配信、およびセルラー通信による端末への配信などにおける送信機や受信機(例えばテレビジョン受像機や携帯電話機)、または、光ディスク、磁気ディスクおよびフラッシュメモリなどの媒体に画像を記録したり、これら記憶媒体から画像を再生したりする装置(例えばハードディスクレコーダやカメラ)などの、様々な電子機器に応用され得る。
また、例えば、本技術は、システムLSI(Large Scale Integration)等としてのプロセッサ(例えばビデオプロセッサ)、複数のプロセッサ等を用いるモジュール(例えばビデオモジュール)、複数のモジュール等を用いるユニット(例えばビデオユニット)、または、ユニットにさらにその他の機能を付加したセット(例えばビデオセット)等、装置の一部の構成として実施することもできる。
また、例えば、本技術は、複数の装置により構成されるネットワークシステムにも適用することもできる。例えば、本技術を、ネットワークを介して複数の装置で分担、共同して処理するクラウドコンピューティングとして実施するようにしてもよい。例えば、コンピュータ、AV(Audio Visual)機器、携帯型情報処理端末、IoT(Internet of Things)デバイス等の任意の端末に対して、画像(動画像)に関するサービスを提供するクラウドサービスにおいて本技術を実施するようにしてもよい。
なお、本明細書において、システムとは、複数の構成要素(装置、モジュール(部品)等)の集合を意味し、全ての構成要素が同一筐体中にあるか否かは問わない。したがって、別個の筐体に収納され、ネットワークを介して接続されている複数の装置、および、1つの筐体の中に複数のモジュールが収納されている1つの装置は、いずれも、システムである。
<本技術を適用可能な分野・用途>
本技術を適用したシステム、装置、処理部等は、例えば、交通、医療、防犯、農業、畜産業、鉱業、美容、工場、家電、気象、自然監視等、任意の分野に利用することができる。また、その用途も任意である。
本技術を適用したシステム、装置、処理部等は、例えば、交通、医療、防犯、農業、畜産業、鉱業、美容、工場、家電、気象、自然監視等、任意の分野に利用することができる。また、その用途も任意である。
例えば、本技術は、観賞用コンテンツ等の提供の用に供されるシステムやデバイスに適用することができる。また、例えば、本技術は、交通状況の監理や自動運転制御等、交通の用に供されるシステムやデバイスにも適用することができる。さらに、例えば、本技術は、セキュリティの用に供されるシステムやデバイスにも適用することができる。また、例えば、本技術は、機械等の自動制御の用に供されるシステムやデバイスに適用することができる。さらに、例えば、本技術は、農業や畜産業の用に供されるシステムやデバイスにも適用することができる。また、本技術は、例えば火山、森林、海洋等の自然の状態や野生生物等を監視するシステムやデバイスにも適用することができる。さらに、例えば、本技術は、スポーツの用に供されるシステムやデバイスにも適用することができる。
<その他>
なお、本明細書において「フラグ」とは、複数の状態を識別するための情報であり、真(1)または偽(0)の2状態を識別する際に用いる情報だけでなく、3以上の状態を識別することが可能な情報も含まれる。したがって、この「フラグ」が取り得る値は、例えば1/0の2値であってもよいし、3値以上であってもよい。すなわち、この「フラグ」を構成するbit数は任意であり、1bitでも複数bitでもよい。また、識別情報(フラグも含む)は、その識別情報をビットストリームに含める形だけでなく、ある基準となる情報に対する識別情報の差分情報をビットストリームに含める形も想定されるため、本明細書においては、「フラグ」や「識別情報」は、その情報だけではなく、基準となる情報に対する差分情報も包含する。
なお、本明細書において「フラグ」とは、複数の状態を識別するための情報であり、真(1)または偽(0)の2状態を識別する際に用いる情報だけでなく、3以上の状態を識別することが可能な情報も含まれる。したがって、この「フラグ」が取り得る値は、例えば1/0の2値であってもよいし、3値以上であってもよい。すなわち、この「フラグ」を構成するbit数は任意であり、1bitでも複数bitでもよい。また、識別情報(フラグも含む)は、その識別情報をビットストリームに含める形だけでなく、ある基準となる情報に対する識別情報の差分情報をビットストリームに含める形も想定されるため、本明細書においては、「フラグ」や「識別情報」は、その情報だけではなく、基準となる情報に対する差分情報も包含する。
また、符号化データ(ビットストリーム)に関する各種情報(メタデータ等)は、符号化データに関連づけられていれば、どのような形態で伝送または記録されるようにしてもよい。ここで、「関連付ける」という用語は、例えば、一方のデータを処理する際に他方のデータを利用し得る(リンクさせ得る)ようにすることを意味する。つまり、互いに関連付けられたデータは、1つのデータとしてまとめられてもよいし、それぞれ個別のデータとしてもよい。例えば、符号化データ(画像)に関連付けられた情報は、その符号化データ(画像)とは別の伝送路上で伝送されるようにしてもよい。また、例えば、符号化データ(画像)に関連付けられた情報は、その符号化データ(画像)とは別の記録媒体(または同一の記録媒体の別の記録エリア)に記録されるようにしてもよい。なお、この「関連付け」は、データ全体でなく、データの一部であってもよい。例えば、画像とその画像に対応する情報とが、複数フレーム、1フレーム、またはフレーム内の一部分などの任意の単位で互いに関連付けられるようにしてもよい。
なお、本明細書において、「合成する」、「多重化する」、「付加する」、「一体化する」、「含める」、「格納する」、「入れ込む」、「差し込む」、「挿入する」等の用語は、例えば符号化データとメタデータとを1つのデータにまとめるといった、複数の物を1つにまとめることを意味し、上述の「関連付ける」の1つの方法を意味する。
また、本技術の実施の形態は、上述した実施の形態に限定されるものではなく、本技術の要旨を逸脱しない範囲において種々の変更が可能である。
例えば、1つの装置(または処理部)として説明した構成を分割し、複数の装置(または処理部)として構成するようにしてもよい。逆に、以上において複数の装置(または処理部)として説明した構成をまとめて1つの装置(または処理部)として構成されるようにしてもよい。また、各装置(または各処理部)の構成に上述した以外の構成を付加するようにしてももちろんよい。さらに、システム全体としての構成や動作が実質的に同じであれば、ある装置(または処理部)の構成の一部を他の装置(または他の処理部)の構成に含めるようにしてもよい。
また、例えば、上述したプログラムは、任意の装置において実行されるようにしてもよい。その場合、その装置が、必要な機能(機能ブロック等)を有し、必要な情報を得ることができるようにすればよい。
また、例えば、1つのフローチャートの各ステップを、1つの装置が実行するようにしてもよいし、複数の装置が分担して実行するようにしてもよい。さらに、1つのステップに複数の処理が含まれる場合、その複数の処理を、1つの装置が実行するようにしてもよいし、複数の装置が分担して実行するようにしてもよい。換言するに、1つのステップに含まれる複数の処理を、複数のステップの処理として実行することもできる。逆に、複数のステップとして説明した処理を1つのステップとしてまとめて実行することもできる。
また、例えば、コンピュータが実行するプログラムは、プログラムを記述するステップの処理が、本明細書で説明する順序に沿って時系列に実行されるようにしても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで個別に実行されるようにしても良い。つまり、矛盾が生じない限り、各ステップの処理が上述した順序と異なる順序で実行されるようにしてもよい。さらに、このプログラムを記述するステップの処理が、他のプログラムの処理と並列に実行されるようにしても良いし、他のプログラムの処理と組み合わせて実行されるようにしても良い。
また、例えば、本技術に関する複数の技術は、矛盾が生じない限り、それぞれ独立に単体で実施することができる。もちろん、任意の複数の本技術を併用して実施することもできる。例えば、いずれかの実施の形態において説明した本技術の一部または全部を、他の実施の形態において説明した本技術の一部または全部と組み合わせて実施することもできる。また、上述した任意の本技術の一部または全部を、上述していない他の技術と併用して実施することもできる。
なお、本技術は以下のような構成も取ることができる。
(1) セカンダリ変換に関する制御情報であるセカンダリ変換制御情報のビン列の1ビン目に対して固定のコンテキスト変数を設定し、設定した固定のコンテキスト変数を参照して、前記セカンダリ変換制御情報の各ビンを算術符号化する符号化部
を備える画像処理装置。
(2) 前記固定のコンテキスト変数は「0」である
(1)に記載の画像処理装置。
(3) 前記符号化部は、さらに、前記ビン列の2ビン目に対してバイパスフラグを設定する
(1)に記載の画像処理装置。
(4) 前記符号化部は、さらに、前記ビン列の2ビン目に対して前記1ビン目と共通のコンテキスト変数を設定する
(1)に記載の画像処理装置。
(5) 前記共通のコンテキストは「0」である
(4)に記載の画像処理装置。
(6) 前記セカンダリ変換制御情報は、前記セカンダリ変換のタイプを示すであるセカンダリ変換識別子を含む
(1)に記載の画像処理装置。
(7) 前記符号化部は、前記セカンダリ変換制御情報を2値化して前記ビン列を生成し、生成した前記ビン列の1ビン目に対して前記固定のコンテキスト変数を設定する
(1)に記載の画像処理装置。
(8) 前記セカンダリ変換制御情報に対応する変換ブロックのプライマリ変換係数に対して前記セカンダリ変換を行ってセカンダリ変換係数を生成する係数変換部をさらに備える
(1)に記載の画像処理装置。
(9) 前記係数変換部により生成された前記セカンダリ変換係数を量子化して量子化係数を生成する量子化部をさらに備える
(8)に記載の画像処理装置。
(10) セカンダリ変換に関する制御情報であるセカンダリ変換制御情報のビン列の1ビン目に対して固定のコンテキスト変数を設定し、設定した固定のコンテキスト変数を参照して、前記セカンダリ変換制御情報の各ビンを算術符号化する
画像処理方法。
(1) セカンダリ変換に関する制御情報であるセカンダリ変換制御情報のビン列の1ビン目に対して固定のコンテキスト変数を設定し、設定した固定のコンテキスト変数を参照して、前記セカンダリ変換制御情報の各ビンを算術符号化する符号化部
を備える画像処理装置。
(2) 前記固定のコンテキスト変数は「0」である
(1)に記載の画像処理装置。
(3) 前記符号化部は、さらに、前記ビン列の2ビン目に対してバイパスフラグを設定する
(1)に記載の画像処理装置。
(4) 前記符号化部は、さらに、前記ビン列の2ビン目に対して前記1ビン目と共通のコンテキスト変数を設定する
(1)に記載の画像処理装置。
(5) 前記共通のコンテキストは「0」である
(4)に記載の画像処理装置。
(6) 前記セカンダリ変換制御情報は、前記セカンダリ変換のタイプを示すであるセカンダリ変換識別子を含む
(1)に記載の画像処理装置。
(7) 前記符号化部は、前記セカンダリ変換制御情報を2値化して前記ビン列を生成し、生成した前記ビン列の1ビン目に対して前記固定のコンテキスト変数を設定する
(1)に記載の画像処理装置。
(8) 前記セカンダリ変換制御情報に対応する変換ブロックのプライマリ変換係数に対して前記セカンダリ変換を行ってセカンダリ変換係数を生成する係数変換部をさらに備える
(1)に記載の画像処理装置。
(9) 前記係数変換部により生成された前記セカンダリ変換係数を量子化して量子化係数を生成する量子化部をさらに備える
(8)に記載の画像処理装置。
(10) セカンダリ変換に関する制御情報であるセカンダリ変換制御情報のビン列の1ビン目に対して固定のコンテキスト変数を設定し、設定した固定のコンテキスト変数を参照して、前記セカンダリ変換制御情報の各ビンを算術符号化する
画像処理方法。
(11) セカンダリ変換に関する制御情報であるセカンダリ変換制御情報のビン列の1ビン目に対して設定された固定のコンテキスト変数を参照して算術復号する復号部
を備える画像処理装置。
(12) 前記固定のコンテキスト変数は「0」である
(11)に記載の画像処理装置。
(13) 前記復号部は、さらに、前記ビン列の2ビン目に対して設定されたバイパスフラグに基づいて算術復号する
(11)に記載の画像処理装置。
(14) 前記復号部は、さらに、前記ビン列の2ビン目に対して設定された前記1ビン目と共通のコンテキスト変数を参照して算術復号する
(11)に記載の画像処理装置。
(15) 前記共通のコンテキストは「0」である
(14)に記載の画像処理装置。
(16) 前記セカンダリ変換制御情報は、前記セカンダリ変換のタイプを示すであるセカンダリ変換識別子を含む
(11)に記載の画像処理装置。
(17) 前記復号部は、算術復号して得られた前記ビン列を多値化して前記セカンダリ変換制御情報を生成する
(11)に記載の画像処理装置。
(18) 前記セカンダリ変換制御情報に対応する変換ブロックのセカンダリ変換係数に対して逆セカンダリ変換を行ってプライマリ変換係数を生成する逆係数変換部をさらに備える
(11)に記載の画像処理装置。
(19) 量子化係数を逆量子化して前記セカンダリ変換係数を生成する逆量子化部をさらに備え、
前記逆係数変換部は、前記逆量子化部により生成された前記セカンダリ変換係数に対して前記逆セカンダリ変換を行って前記プライマリ変換係数を生成する
(18)に記載の画像処理装置。
(20) セカンダリ変換に関する制御情報であるセカンダリ変換制御情報のビン列の1ビン目に対して設定された固定のコンテキスト変数を参照して算術復号する
画像処理方法。
を備える画像処理装置。
(12) 前記固定のコンテキスト変数は「0」である
(11)に記載の画像処理装置。
(13) 前記復号部は、さらに、前記ビン列の2ビン目に対して設定されたバイパスフラグに基づいて算術復号する
(11)に記載の画像処理装置。
(14) 前記復号部は、さらに、前記ビン列の2ビン目に対して設定された前記1ビン目と共通のコンテキスト変数を参照して算術復号する
(11)に記載の画像処理装置。
(15) 前記共通のコンテキストは「0」である
(14)に記載の画像処理装置。
(16) 前記セカンダリ変換制御情報は、前記セカンダリ変換のタイプを示すであるセカンダリ変換識別子を含む
(11)に記載の画像処理装置。
(17) 前記復号部は、算術復号して得られた前記ビン列を多値化して前記セカンダリ変換制御情報を生成する
(11)に記載の画像処理装置。
(18) 前記セカンダリ変換制御情報に対応する変換ブロックのセカンダリ変換係数に対して逆セカンダリ変換を行ってプライマリ変換係数を生成する逆係数変換部をさらに備える
(11)に記載の画像処理装置。
(19) 量子化係数を逆量子化して前記セカンダリ変換係数を生成する逆量子化部をさらに備え、
前記逆係数変換部は、前記逆量子化部により生成された前記セカンダリ変換係数に対して前記逆セカンダリ変換を行って前記プライマリ変換係数を生成する
(18)に記載の画像処理装置。
(20) セカンダリ変換に関する制御情報であるセカンダリ変換制御情報のビン列の1ビン目に対して設定された固定のコンテキスト変数を参照して算術復号する
画像処理方法。
100 符号化装置, 121 2値化部, 122 選択部, 123 コンテキストモデル, 124 算術符号化部, 125 算術符号化部, 126 選択部, 200 復号装置, 221 選択部, 222 コンテキストモデル, 223 算術復号部, 224 算術復号部, 225 選択部, 226 多値化部, 300 画像復号装置, 315 符号化部, 400 画像符号化装置, 412 復号部
Claims (20)
- セカンダリ変換に関する制御情報であるセカンダリ変換制御情報のビン列の1ビン目に対して固定のコンテキスト変数を設定し、設定した固定のコンテキスト変数を参照して、前記セカンダリ変換制御情報の各ビンを算術符号化する符号化部
を備える画像処理装置。 - 前記固定のコンテキスト変数は「0」である
請求項1に記載の画像処理装置。 - 前記符号化部は、さらに、前記ビン列の2ビン目に対してバイパスフラグを設定する
請求項1に記載の画像処理装置。 - 前記符号化部は、さらに、前記ビン列の2ビン目に対して前記1ビン目と共通のコンテキスト変数を設定する
請求項1に記載の画像処理装置。 - 前記共通のコンテキストは「0」である
請求項4に記載の画像処理装置。 - 前記セカンダリ変換制御情報は、前記セカンダリ変換のタイプを示すであるセカンダリ変換識別子を含む
請求項1に記載の画像処理装置。 - 前記符号化部は、前記セカンダリ変換制御情報を2値化して前記ビン列を生成し、生成した前記ビン列の1ビン目に対して前記固定のコンテキスト変数を設定する
請求項1に記載の画像処理装置。 - 前記セカンダリ変換制御情報に対応する変換ブロックのプライマリ変換係数に対して前記セカンダリ変換を行ってセカンダリ変換係数を生成する係数変換部をさらに備える
請求項1に記載の画像処理装置。 - 前記係数変換部により生成された前記セカンダリ変換係数を量子化して量子化係数を生成する量子化部をさらに備える
請求項8に記載の画像処理装置。 - セカンダリ変換に関する制御情報であるセカンダリ変換制御情報のビン列の1ビン目に対して固定のコンテキスト変数を設定し、設定した固定のコンテキスト変数を参照して、前記セカンダリ変換制御情報の各ビンを算術符号化する
画像処理方法。 - セカンダリ変換に関する制御情報であるセカンダリ変換制御情報のビン列の1ビン目に対して設定された固定のコンテキスト変数を参照して算術復号する復号部
を備える画像処理装置。 - 前記固定のコンテキスト変数は「0」である
請求項11に記載の画像処理装置。 - 前記復号部は、さらに、前記ビン列の2ビン目に対して設定されたバイパスフラグに基づいて算術復号する
請求項11に記載の画像処理装置。 - 前記復号部は、さらに、前記ビン列の2ビン目に対して設定された前記1ビン目と共通のコンテキスト変数を参照して算術復号する
請求項11に記載の画像処理装置。 - 前記共通のコンテキストは「0」である
請求項14に記載の画像処理装置。 - 前記セカンダリ変換制御情報は、前記セカンダリ変換のタイプを示すであるセカンダリ変換識別子を含む
請求項11に記載の画像処理装置。 - 前記復号部は、算術復号して得られた前記ビン列を多値化して前記セカンダリ変換制御情報を生成する
請求項11に記載の画像処理装置。 - 前記セカンダリ変換制御情報に対応する変換ブロックのセカンダリ変換係数に対して逆セカンダリ変換を行ってプライマリ変換係数を生成する逆係数変換部をさらに備える
請求項11に記載の画像処理装置。 - 量子化係数を逆量子化して前記セカンダリ変換係数を生成する逆量子化部をさらに備え、
前記逆係数変換部は、前記逆量子化部により生成された前記セカンダリ変換係数に対して前記逆セカンダリ変換を行って前記プライマリ変換係数を生成する
請求項18に記載の画像処理装置。 - セカンダリ変換に関する制御情報であるセカンダリ変換制御情報のビン列の1ビン目に対して設定された固定のコンテキスト変数を参照して算術復号する
画像処理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2024074323A JP2024092011A (ja) | 2019-09-06 | 2024-05-01 | 画像処理装置および方法 |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201962896785P | 2019-09-06 | 2019-09-06 | |
US62/896,785 | 2019-09-06 | ||
PCT/JP2020/033572 WO2021045187A1 (ja) | 2019-09-06 | 2020-09-04 | 画像処理装置および方法 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2024074323A Division JP2024092011A (ja) | 2019-09-06 | 2024-05-01 | 画像処理装置および方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2021045187A1 JPWO2021045187A1 (ja) | 2021-03-11 |
JP7484923B2 true JP7484923B2 (ja) | 2024-05-16 |
Family
ID=74853259
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021544047A Active JP7484923B2 (ja) | 2019-09-06 | 2020-09-04 | 画像処理装置および方法 |
JP2024074323A Pending JP2024092011A (ja) | 2019-09-06 | 2024-05-01 | 画像処理装置および方法 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2024074323A Pending JP2024092011A (ja) | 2019-09-06 | 2024-05-01 | 画像処理装置および方法 |
Country Status (9)
Country | Link |
---|---|
US (1) | US20220286681A1 (ja) |
EP (1) | EP4013055A4 (ja) |
JP (2) | JP7484923B2 (ja) |
KR (1) | KR20220053560A (ja) |
CN (1) | CN114342397A (ja) |
AU (1) | AU2020341932A1 (ja) |
MX (1) | MX2022002177A (ja) |
TW (1) | TW202121898A (ja) |
WO (1) | WO2021045187A1 (ja) |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPWO2013065702A1 (ja) * | 2011-11-04 | 2015-04-02 | シャープ株式会社 | 算術復号装置、画像復号装置、算術符号化装置、画像符号化装置、および、算術復号方法 |
US9729884B2 (en) * | 2012-01-18 | 2017-08-08 | Lg Electronics Inc. | Method and device for entropy coding/decoding |
WO2014050676A1 (ja) * | 2012-09-28 | 2014-04-03 | ソニー株式会社 | 画像処理装置および方法 |
US9425822B2 (en) * | 2014-08-05 | 2016-08-23 | Broadcom Corporation | Simplified range and context update for multimedia context-adaptive binary arithmetic coding design |
WO2016203881A1 (ja) * | 2015-06-18 | 2016-12-22 | シャープ株式会社 | 算術復号装置及び算術符号化装置 |
CN108141594B (zh) * | 2015-10-13 | 2021-02-26 | 三星电子株式会社 | 用于对图像进行编码或解码的方法和设备 |
CN109076222B9 (zh) * | 2016-05-13 | 2021-10-15 | 索尼公司 | 图像处理装置和方法 |
EP3522533A4 (en) * | 2016-09-30 | 2019-09-11 | Sony Corporation | IMAGE PROCESSING APPARATUS AND METHOD |
CN111713104B (zh) * | 2018-02-14 | 2022-04-26 | 索尼公司 | 图像处理装置和方法 |
US11677984B2 (en) * | 2019-08-20 | 2023-06-13 | Qualcomm Incorporated | Low-frequency non-separable transform (LFNST) signaling |
-
2020
- 2020-09-04 CN CN202080060661.7A patent/CN114342397A/zh active Pending
- 2020-09-04 JP JP2021544047A patent/JP7484923B2/ja active Active
- 2020-09-04 US US17/632,508 patent/US20220286681A1/en active Pending
- 2020-09-04 EP EP20861874.4A patent/EP4013055A4/en active Pending
- 2020-09-04 AU AU2020341932A patent/AU2020341932A1/en active Pending
- 2020-09-04 TW TW109130425A patent/TW202121898A/zh unknown
- 2020-09-04 KR KR1020227005158A patent/KR20220053560A/ko unknown
- 2020-09-04 MX MX2022002177A patent/MX2022002177A/es unknown
- 2020-09-04 WO PCT/JP2020/033572 patent/WO2021045187A1/ja unknown
-
2024
- 2024-05-01 JP JP2024074323A patent/JP2024092011A/ja active Pending
Non-Patent Citations (4)
Title |
---|
Alican Nalci et al.,Non-CE6: An Improved Context Modeling for LFNST,Joint Video Experts Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11,JVET-O0373-v1,15th Meeting: Gothenburg, SE,2019年07月,pp.1-3 |
Benjamin Bross, Jianle Chen and Shan Liu,Versatile Video Coding (Draft 6),Joint Video Experts Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11,JVET-O2001 (version 14),15th Meeting: Gothenburg, SE,2019年07月,pp.384-388 |
Takeshi Tsukuba et al.,Non-CE6: Context modeling for LFNST index coding,Joint Video Experts Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11,JVET-P0271-v1,16th Meeting: Geneva, CH,2019年09月,pp.1-5 |
Takeshi Tsukuba et al.,Non-CE6: Context modeling for MTS index coding,Joint Video Experts Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11,JVET-O0354-v2,15th Meeting: Gothenburg, SE,2019年07月,pp.1-4 |
Also Published As
Publication number | Publication date |
---|---|
KR20220053560A (ko) | 2022-04-29 |
US20220286681A1 (en) | 2022-09-08 |
WO2021045187A1 (ja) | 2021-03-11 |
JP2024092011A (ja) | 2024-07-05 |
MX2022002177A (es) | 2022-03-22 |
TW202121898A (zh) | 2021-06-01 |
JPWO2021045187A1 (ja) | 2021-03-11 |
AU2020341932A1 (en) | 2022-03-24 |
EP4013055A4 (en) | 2022-09-07 |
CN114342397A (zh) | 2022-04-12 |
EP4013055A1 (en) | 2022-06-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7517350B2 (ja) | 画像処理装置および方法 | |
WO2021039650A1 (ja) | 画像処理装置および方法 | |
JP2024105675A (ja) | 画像処理装置および方法 | |
US20240236323A1 (en) | Image processing device and method | |
JP7559917B2 (ja) | 画像処理装置および方法 | |
JP2022016726A (ja) | 画像処理装置および方法 | |
US20230179779A1 (en) | Image processing device and method | |
JP2022002352A (ja) | 画像処理装置および方法 | |
WO2021117500A1 (ja) | 画像処理装置、ビットストリーム生成方法、係数データ生成方法、および量子化係数生成方法 | |
JP7484923B2 (ja) | 画像処理装置および方法 | |
JP7517348B2 (ja) | 画像処理装置および方法 | |
US20240275970A1 (en) | Image processing device and method | |
TWI858185B (zh) | 影像處理裝置及方法 | |
US20240163437A1 (en) | Image processing device and method | |
WO2020129636A1 (ja) | 画像符号化装置、画像符号化方法、画像復号装置、および画像復号方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230720 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240402 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240415 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7484923 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |