JP2023118765A - 変換スキップフラグを利用した映像コーディング方法及び装置 - Google Patents
変換スキップフラグを利用した映像コーディング方法及び装置 Download PDFInfo
- Publication number
- JP2023118765A JP2023118765A JP2023100459A JP2023100459A JP2023118765A JP 2023118765 A JP2023118765 A JP 2023118765A JP 2023100459 A JP2023100459 A JP 2023100459A JP 2023100459 A JP2023100459 A JP 2023100459A JP 2023118765 A JP2023118765 A JP 2023118765A
- Authority
- JP
- Japan
- Prior art keywords
- transform
- information
- size
- skip
- mts
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 138
- 238000006243 chemical reaction Methods 0.000 claims description 33
- 239000000523 sample Substances 0.000 description 32
- 238000013139 quantization Methods 0.000 description 30
- 230000009466 transformation Effects 0.000 description 29
- 238000001914 filtration Methods 0.000 description 27
- 230000008569 process Effects 0.000 description 24
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 description 17
- 238000012545 processing Methods 0.000 description 16
- 238000010586 diagram Methods 0.000 description 14
- 239000013598 vector Substances 0.000 description 14
- 239000011449 brick Substances 0.000 description 13
- 230000011664 signaling Effects 0.000 description 13
- 241000023320 Luma <angiosperm> Species 0.000 description 12
- OSWPMRLSEDHDFF-UHFFFAOYSA-N methyl salicylate Chemical compound COC(=O)C1=CC=CC=C1O OSWPMRLSEDHDFF-UHFFFAOYSA-N 0.000 description 12
- 238000007906 compression Methods 0.000 description 6
- 230000006835 compression Effects 0.000 description 6
- 230000003044 adaptive effect Effects 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 5
- 238000004891 communication Methods 0.000 description 5
- 238000003491 array Methods 0.000 description 4
- 230000007717 exclusion Effects 0.000 description 4
- 230000014509 gene expression Effects 0.000 description 4
- 238000000638 solvent extraction Methods 0.000 description 4
- 241000209094 Oryza Species 0.000 description 3
- 235000007164 Oryza sativa Nutrition 0.000 description 3
- 238000005056 compaction Methods 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 3
- 230000009977 dual effect Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 235000009566 rice Nutrition 0.000 description 3
- 230000006978 adaptation Effects 0.000 description 2
- 230000002146 bilateral effect Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 239000013074 reference sample Substances 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 238000011426 transformation method Methods 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 238000004590 computer program Methods 0.000 description 1
- 238000013144 data compression Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000003709 image segmentation Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000010454 slate Substances 0.000 description 1
- 239000004984 smart glass Substances 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/507—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction using conditional replenishment
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/12—Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/132—Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/157—Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Discrete Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Compression Of Band Width Or Redundancy In Fax (AREA)
Abstract
【課題】映像コーディングシステムにおいて、変換スキップフラグを利用した映像コーディング方法及び装置に関する。【解決手段】ビットストリームから予測モード情報及びレジデュアル関連情報を取得するステップと、前記予測モード情報に基づいて予測を実行して現在ブロックの予測サンプルを導出するステップと、前記レジデュアル関連情報に基づいて前記現在ブロックのレジデュアルサンプルを導出するステップと、前記予測サンプル及び前記レジデュアルサンプルに基づいて前記現在ブロックの復元サンプルを生成するステップと、を含み、前記現在ブロックのサイズ及び最大変換スキップサイズに基づいて、前記レジデュアル関連情報は、変換スキップフラグを含み、前記変換スキップフラグは、前記現在ブロックに変換スキップが適用されたかどうかを示し、前記最大変換スキップサイズに対する情報は、前記ビットストリームから取得されることを特徴とする。【選択図】図15
Description
本文書は、映像コーディング技術に関し、より詳しくは、映像コーディングシステムにおいて、変換スキップフラグを利用した映像コーディング方法及び装置に関する。
最近、HD(High Definition)映像及びUHD(Ultra High Definition)映像のような高解像度、高品質の映像に対する需要が多様な分野で増加している。映像データが高解像度、高品質になるほど既存の映像データに比べて相対的に送信される情報量またはビット量が増加するため、既存の有線/無線広帯域回線のような媒体を利用して映像データを送信し、または既存の格納媒体を利用して映像データを格納する場合、送信費用と格納費用が増加される。
それによって、高解像度、高品質映像の情報を効果的に送信または格納し、再生するために高効率の映像圧縮技術が要求される。
本文書の技術的課題は、映像コーディング効率を向上させる方法及び装置を提供することにある。
本文書の他の技術的課題は、レジデュアルコーディングの効率を向上させる方法及び装置を提供することにある。
本文書の他の技術的課題は、変換スキップの適用可否によってレジデュアルコーディングの効率を向上させる方法及び装置を提供することにある。
本文書の他の技術的課題は、最大変換スキップサイズを可変的に設定することでレジデュアルコーディングの効率を向上させる方法及び装置を提供することにある。
本文書の実施例によると、デコーディング装置により実行される映像デコーディング方法が提供される。前記方法は、ビットストリームから予測モード情報及びレジデュアル関連情報を取得するステップ、前記予測モード情報に基づいて予測を実行して現在ブロックの予測サンプルを導出するステップ、前記レジデュアル関連情報に基づいて前記現在ブロックのレジデュアルサンプルを導出するステップ、及び前記予測サンプル及び前記レジデュアルサンプルに基づいて前記現在ブロックの復元サンプルを生成するステップを含み、前記現在ブロックのサイズ及び最大変換スキップサイズに基づいて、前記レジデュアル関連情報が変換スキップフラグを含み、前記変換スキップフラグは、前記現在ブロックに変換スキップが適用されたかどうかを示し、前記最大変換スキップサイズに対する情報は、前記ビットストリームから取得されることを特徴とする。
本文書の他の実施例によると、映像デコーディングを実行するデコーディング装置が提供される。前記デコーディング装置は、ビットストリームから予測モード情報及びレジデュアル関連情報を取得するエントロピーデコーディング部、前記予測モード情報に基づいて予測を実行して現在ブロックの予測サンプルを導出する予測部、前記レジデュアル関連情報に基づいて前記現在ブロックのレジデュアルサンプルを導出するレジデュアル処理部、及び前記予測サンプル及び前記レジデュアルサンプルに基づいて前記現在ブロックの復元サンプルを生成する加算部を含み、前記現在ブロックのサイズ及び最大変換スキップサイズに基づいて、前記レジデュアル関連情報が変換スキップフラグを含み、前記変換スキップフラグは、前記現在ブロックに変換スキップが適用されたかどうかを示し、前記最大変換スキップサイズに対する情報は、前記ビットストリームから取得されることを特徴とする。
本文書の他の実施例によると、エンコーディング装置により実行されるビデオエンコーディング方法を提供する。前記方法は、現在ブロックに対して予測を実行して予測サンプルを導出するステップ、前記現在ブロックに対するレジデュアルサンプルを導出するステップ、及び前記予測に対する予測モード情報及び前記レジデュアルサンプルに対するレジデュアル関連情報を含む映像情報をエンコーディングするステップを含み、前記現在ブロックのサイズ及び最大変換スキップサイズに基づいて、前記レジデュアル関連情報が変換スキップフラグを含み、前記変換スキップフラグは、前記現在ブロックに変換スキップが適用されたかどうかを示し、前記映像情報は、前記最大変換スキップサイズに対する情報を含むことを特徴とする。
本文書の他の実施例によると、ビデオエンコーディング装置を提供する。前記エンコーディング装置は、現在ブロックに対して予測を実行して予測サンプルを導出する予測部、前記現在ブロックに対するレジデュアルサンプルを導出するレジデュアル処理部、及び前記予測に対する予測モード情報及び前記レジデュアルサンプルに対するレジデュアル関連情報を含む映像情報をエンコーディングするエントロピーエンコーディング部を含み、前記現在ブロックのサイズ及び最大変換スキップサイズに基づいて、前記レジデュアル関連情報が変換スキップフラグを含み、前記変換スキップフラグは、前記現在ブロックに変換スキップが適用されたかどうかを示し、前記映像情報は、前記最大変換スキップサイズに対する情報を含むことを特徴とする。
本文書の他の実施例によると、コンピュータ読み取り可能なデジタル格納媒体を提供する。前記コンピュータ読み取り可能なデジタル格納媒体は、前記デコーディング方法を実行するように引き起こす映像情報が格納されることを特徴とする。
本文書の他の実施例によると、コンピュータ読み取り可能なデジタル格納媒体を提供する。前記コンピュータ読み取り可能なデジタル格納媒体は、前記エンコーディング方法により生成された映像情報が格納されることを特徴とする。
本文書によると、全般的な映像/ビデオ圧縮効率を向上させることができる。
本文書によると、変換スキップ可否フラグを利用してレジデュアルコーディングの効率を向上させることができる。
本文書によると、最大変換スキップサイズを可変的に設定することでレジデュアルコーディングの効率を向上させることができる。
本文書によると、一般的な変換ドメインのレジデュアル信号と特性が異なるピクセルドメインで表現されたレジデュアル信号を効率的に送信することによってコーディング効率を向上させることができる。
本文書は、様々な変更を加えることができ、様々な実施形態を有することができるため、特定の実施形態を図面に例示し、詳細に説明しようとする。しかしながら、これは、本開示を特定の実施形態に限定しようとすることではない。本明細書において常用する用語は、単に特定の実施形態を説明するために用いられるものであって、本開示の技術的な思想を限定しようとする意図はない。単数の表現は、文脈上、明白に異なる意味をもたない限り複数の表現を含む。本明細書において、「含む」または「有する」などの用語は明細書上に記載した特徴、数字、ステップ、動作、構成要素、部品またはこれらを組み合わせたものが存在することを指定するものであって、1つまたはそれ以上の他の特徴や数字、ステップ、動作、構成要素、部品、またはこれを組み合わせたものなどの存在または付加の可能性を予め排除しないものとして理解しなければならない。
一方、本文書において説明される図面上の各構成は、相異なる特徴的な機能に対する説明の便宜のために独立的に示されたものであって、各構成が互いに別個のハードウェアまたは別個のソフトウェアで実現されるということを意味するものではない。例えば、各構成のうち2つ以上の構成が結合されて1つの構成をなすこともでき、1つの構成を複数の構成に分けることもできる。各構成が統合及び/または分離された実施例も本発明の本質から外れない限り、本発明の権利範囲に含まれる。
以下、添付の図面を参照して、本文書の好ましい実施形態をより詳細に説明する。以下、図面上の同一の構成要素に対しては同一の参照符号を使用し、同一の構成要素に対して重複する説明は省略する。
図1は、本文書を適用されることができるビデオ/映像コーディングシステムの例の概略を示す。
図1に示すように、ビデオ/映像コーディングシステムは、第1装置(ソースデバイス)及び第2装置(受信デバイス)を含む。ソースデバイスは、エンコーディングされたビデオ(video)/映像(image)情報またはデータをファイルまたはストリーミングの形態でデジタル格納媒体またはネットワークを介して受信デバイスに伝達することができる。
前記ソースデバイスは、ビデオソース、エンコーディング装置、送信部を含む。前記受信デバイスは、受信部、デコーディング装置及びレンダラーを含む。前記エンコーディング装置はビデオ/映像エンコーディング装置と呼ばれてもよく、前記デコーディング装置はビデオ/映像デコーディング装置と呼ばれてもよい。送信部はエンコーディング装置に含まれてもよい。受信部はデコーディング装置に含まれてもよい。レンダラーはディスプレイ部を含んでもよく、ディスプレイ部は別個のデバイスまたは外部コンポーネントで構成されてもよい。
ビデオソースは、ビデオ/映像のキャプチャ、合成または生成過程などによりビデオ/映像を取得する。ビデオソースは、ビデオ/映像キャプチャデバイス及び/またはビデオ/映像生成デバイスを含んでもよい。ビデオ/映像キャプチャデバイスは、例えば、1つ以上のカメラ、以前にキャプチャされたビデオ/映像を含むビデオ/映像アーカイブなどを含む。ビデオ/映像生成デバイスは、例えば、コンピュータ、タブレット及びスマートフォンなどを含み、(電子的に)ビデオ/映像を生成することができる。例えば、コンピュータなどにより仮想のビデオ/映像が生成され、この場合、関連データが生成される過程がビデオ/映像キャプチャ過程に代わることもある。
エンコーディング装置は、入力ビデオ/映像をエンコーディングする。エンコーディング装置は、圧縮及びコーディング効率のために予測、変換、量子化など一連の手順を行う。エンコーディングされたデータ(エンコーディングされたビデオ/映像情報)は、ビットストリーム(bitstream)の形態で出力される。
送信部は、ビットストリーム形態で出力されたエンコーディングされたビデオ/映像情報またはデータをファイルまたはストリーミング形態でデジタル格納媒体またはネットワークを介して受信デバイスの受信部に伝達する。デジタル格納媒体は、USB、SD、CD、DVD、ブルーレイ、HDD、SSDなど多様な格納媒体を含む。送信部は、予め定められたファイルフォーマットを介してメディアファイルを生成するためのエレメントを含んでもよく、放送/通信ネットワークを介する送信のためのエレメントを含んでもよい。受信部は、前記ビットストリームを受信/抽出してデコーディング装置に伝達する。
デコーディング装置は、エンコーディング装置の動作に対応する逆量子化、逆変換、予測などの一連の手順を行ってビデオ/映像をデコーディングする。
レンダラーは、デコーディングされたビデオ/映像をレンダリングする。レンダリングされたビデオ/映像はディスプレイ部を介して表示される。
この文書は、ビデオ/映像コーディングに関する。例えば、この文書に開示された方法/実施形態は、VVC(versatile video coding)標準、EVC(essential video coding)標準、AV1(AOMedia Video 1)標準、AVS2(2nd generation of audio video coding standard)または次世代ビデオ/映像コーディング標準(例えば、H.267またはH.268など)に開示される方法に適用されることができる。
この文書においては、ビデオ/映像コーディングに対する様々な実施形態を提示し、他の言及がない限り、前記実施形態は互いに組み合わせて行われることもできる。
この文書において、ビデオ(video)は、時間の流れによる一連の映像(image)の集合を意味することができる。ピクチャ(picture)は、一般的に特定の時間帯の1つの映像を示す単位を意味し、スライス(slice)/タイル(tile)は、コーディングにおいてピクチャの一部を構成する単位である。スライス/タイルは、1つ以上のCTU(coding tree unit)を含んでもよい。1つのピクチャは、1つ以上のスライス/タイルで構成される。1つのピクチャは、1つ以上のタイルグループで構成される。1つのタイルグループは、1つ以上のタイルを含む。ブリックは、ピクチャ内のタイル内のCTU行の四角領域を示す(a brick may represent a rectangular region of CTU rows within a tile in a picture)。タイルは、多数のブリックでパーティショニングされ、各ブリックは、前記タイル内の1つ以上のCTU行で構成される(A tile may be partitioned into multiple bricks, each of which consisting of one or more CTU rows within the tile)。多数のブリックでパーティショニングされていないタイルは、ブリックとも呼ばれる(A tile that is not partitioned into multiple bricks may be also referred to as a brick)。ブリックスキャンは、ピクチャをパーティショニングするCTUの特定の順次的(シーケンシャル)なオーダリングを示してもよく、前記CTUは、ブリック内でCTUラスタースキャンで整列されてもよく、タイル内のブリックは前記タイルの前記ブリックのラスタースキャンで連続的に整列されてもよく、そして、ピクチャ内のタイルは前記ピクチャの前記タイルのラスタースキャンで連続的に整列されてもよい(A brick scan is a specific sequential ordering of CTUs partitioning a picture in which the CTUs are ordered consecutively in CTU raster scan in a brick, bricks within a tile are ordered consecutively in a raster scan of the bricks of the tile, and tiles in a picture are ordered consecutively in a raster scan of the tiles of the picture)。タイルは、特定タイル列及び特定タイル列内のCTUの四角領域である(A tile is a rectangular region of CTUs within a particular tile column and a particular tile row in a picture)。前記タイル列はCTUの四角領域であり、前記四角領域は前記ピクチャの高さと同一の高さを有し、幅はピクチャパラメータセット内のシンタックス要素により明示される(The tile column is a rectangular region of CTUs having a height equal to the height of the picture and a width specified by syntax elements in the pictute parameter set)。前記タイル行はCTUの四角領域であり、前記四角領域はピクチャパラメータセット内のシンタックス要素により明示される幅を有し、高さは前記ピクチャの高さと同一である(The tile row is a rectangular region of CTUs having a height specified by syntax elements in the picture parameter set and a width equal to the width of the picture)。タイルスキャンは、ピクチャをパーティショニングするCTUの特定の順次的オーダリングを示し、前記CTUは、タイル内のCTUラスタースキャンで連続的に整列され、ピクチャ内のタイルは前記ピクチャの前記タイルのラスタースキャンで連続的に整列される(A tile scan is a specific sequential ordering of CTUs partitioning a picture in which the CTUs are ordered consecutively in CTU raster scan in a tile whereas tiles in a picture are ordered consecutively in a raster scan of the tiles of the picture)。スライスは、ピクチャの整数個のブリックを含み、前記整数個のブリックは1つのNALユニットに含まれる(A slice includes an integer number of bricks of a picture that may be exclusively contained in a single NAL unit)。スライスは、多数の完全なタイルで構成され、または、1つのタイルの完全なブリックの連続的なシーケンスである(A slice may consists of either a number of complete tiles or only a consecutive sequence of complete bricks of one tile)。この文書において、タイルグループとスライスは混用されてもよい。例えば、本文書においては、タイルグループ/タイルグループヘッダはスライス/スライスヘッダと呼ばれてもよい。
ピクセル(pixel)またはペル(pel)は、1つのピクチャ(または、映像)を構成する最小の単位を意味する。また、ピクセルに対応する用語として「サンプル(sample)」が使用されてもよい。サンプルは、一般的にピクセルまたはピクセルの値を示すことができ、ルマ(luma)成分のピクセル/ピクセル値のみを示すこともでき、クロマ(chroma)成分のピクセル/ピクセル値のみを示すこともできる。
ユニット(unit)は、映像処理の基本単位を示す。ユニットは、ピクチャの特定領域及び当該領域に対する情報の少なくとも1つを含んでもよい。1つのユニットは1つのルマブロック及び2つのクロマ(例えば、cb、cr)ブロックを含む。ユニットは、場合によってはブロック(block)または領域(area)などの用語と混在して使用されてもよい。一般的な場合、M×Nブロックは、M個の列とN個の行からなるサンプル(または、サンプルアレイ)または変換係数(transform coefficient)の集合(または、アレイ)を含む。
この文書において「/」と「、」は「及び/または」と解釈される。例えば、「A/B」は「A及び/またはB」と解釈され、「A、B」は「A及び/またはB」と解釈される。追加的に、「A/B/C」は「A、B及び/またはCのいずれか1つ」を意味する。また、「A、B、C」も「A、B及び/またはCのいずれか1つ」を意味する(In this document, the term “/” and “,” should be interpreted to indicate “and/or.” For instance, the expression “A/B” may mean “A and/or B.” Further, “A, B” may mean “A and/or B.” Further, “A/B/C” may mean “at least one of A, B, and/or C.” Also, “A/B/C” may mean “at least one of A, B, and/or C.”)。
追加的に、本文書において、「または」は「及び/または」と解釈される。例えば、「AまたはB」は、1)「A」のみを意味し、または2)「B」のみを意味し、または3)「A及びB」を意味することができる。言い換えると、本文書の「または」は「追加的にまたは代替的に(additionally or alternatively)」を意味することができる。(Further, in the document, the term “or” should be interpreted to indicate “and/or.” For instance, the expression “A or B” may comprise 1) only A, 2) only B, and/or 3) both A and B. In other words, the term “or” in this document should be interpreted to indicate “additionally or alternatively.”)
図2は、本文書が適用されることができるビデオ/映像エンコーディング装置の構成の概略を説明する図である。以下、ビデオエンコーディング装置は、映像エンコーディング装置を含むことができる。
図2を参照すると、エンコーディング装置200は、映像分割部(image partitioner)210、予測部(predictor)220、レジデュアル処理部(residual processor)230、エントロピーエンコーディング部(entropy encoder)240、加算部(adder)250、フィルタリング部(filter)260、及びメモリ(memory)270を含んで構成されることができる。予測部220は、インター予測部221及びイントラ予測部222を含むことができる。レジデュアル処理部230は、変換部(transformer)232、量子化部(quantizer)233、逆量子化部(dequantizer)234、逆変換部(inverse transformer)235を含むことができる。レジデュアル処理部230は、減算部(subtractor)231をさらに含むことができる。加算部250は、復元部(reconstructor)または復元ブロック生成部(recontructged block generator)とも呼ばれる。前述した映像分割部210、予測部220、レジデュアル処理部230、エントロピーエンコーディング部240、加算部250、及びフィルタリング部260は、実施例によって一つ以上のハードウェアコンポーネント(例えば、エンコーダチップセットまたはプロセッサ)により構成されることができる。また、メモリ270は、DPB(decoded picture buffer)を含むことができ、デジタル格納媒体により構成されることもできる。前記ハードウェアコンポーネントは、メモリ270を内部/外部コンポーネントとしてさらに含むこともできる。
映像分割部210は、エンコーディング装置200に入力された入力映像(または、ピクチャ、フレーム)を一つ以上の処理ユニット(processing unit)に分割できる。一例として、前記処理ユニットは、コーディングユニット(coding unit、CU)とも呼ばれる。この場合、コーディングユニットは、コーディングツリーユニット(coding tree unit、CTU)または最大コーディングユニット(largest coding unit、LCU)からQTBTTT(Quad-tree binary-tree ternary-tree)構造によって再帰的に(recursively)分割されることができる。例えば、一つのコーディングユニットは、クアッドツリー構造、バイナリツリー構造、及び/またはターナリィ構造に基づいて下位(deeper)デプスの複数のコーディングユニットに分割されることができる。この場合、例えば、クアッドツリー構造が先に適用され、バイナリツリー構造及び/またはターナリィ構造が後に適用されることができる。または、バイナリツリー構造が先に適用されることもできる。それ以上分割されない最終コーディングユニットに基づいて本文書によるコーディング手順が実行されることができる。この場合、映像特性によるコーディング効率などに基づいて、最大コーディングユニットが最終コーディングユニットとして使われることができ、または、必要によって、コーディングユニットは、再帰的に(recursively)一層下位デプスのコーディングユニットに分割されて最適のサイズのコーディングユニットが最終コーディングユニットとして使われることができる。ここで、コーディング手順は、後述する予測、変換、及び復元などの手順を含むことができる。他の例として、前記処理ユニットは、予測ユニット(PU:Prediction Unit)または変換ユニット(TU:Transform Unit)をさらに含むことができる。この場合、前記予測ユニット及び前記変換ユニットは、各々、前述した最終コーディングユニットから分割またはパーティショニングされることができる。前記予測ユニットは、サンプル予測の単位であり、前記変換ユニットは、変換係数を誘導する単位及び/または変換係数からレジデュアル信号(residual signal)を誘導する単位である。
ユニットは、場合によって、ブロック(block)または領域(area)などの用語と混在して使われることができる。一般的な場合、M×Nブロックは、M個の列とN個の行で構成されたサンプルまたは変換係数(transform coefficient)の集合を示すことができる。サンプルは、一般的にピクセルまたはピクセルの値を示すことができ、輝度(luma)成分のピクセル/ピクセル値のみを示すこともでき、彩度(chroma)成分のピクセル/ピクセル値のみを示すこともできる。サンプルは、一つのピクチャ(または、映像)をピクセル(pixel)またはペル(pel)に対応する用語として使われることができる。
エンコーディング装置200は、入力映像信号(原本ブロック、原本サンプルアレイ)からインター予測部221またはイントラ予測部222から出力された予測信号(予測されたブロック、予測サンプルアレイ)を減算してレジデュアル信号(residual signal、残余ブロック、残余サンプルアレイ)を生成することができ、生成されたレジデュアル信号は、変換部232に送信される。この場合、図示されたように、エンコーダ200内で入力映像信号(原本ブロック、原本サンプルアレイ)から予測信号(予測ブロック、予測サンプルアレイ)を減算するユニットは、減算部231とも呼ばれる。予測部は、処理対象ブロック(以下、現在ブロックという)に対する予測を実行し、前記現在ブロックに対する予測サンプルを含む予測されたブロック(predicted block)を生成することができる。予測部は、現在ブロックまたはCU単位でイントラ予測が適用されるかまたはインター予測が適用されるかを決定することができる。予測部は、各予測モードに対する説明で後述するように、予測モード情報など、予測に対する多様な情報を生成してエントロピーエンコーディング部240に伝達できる。予測に対する情報は、エントロピーエンコーディング部240でエンコーディングされてビットストリーム形態で出力されることができる。
イントラ予測部222は、現在ピクチャ内のサンプルを参照して現在ブロックを予測することができる。前記参照されるサンプルは、予測モードによって前記現在ブロックの隣(neighbor)に位置することもでき、または離れて位置することもできる。イントラ予測における予測モードは、複数の非方向性モードと複数の方向性モードを含むことができる。非方向性モードは、例えば、DCモード及びプラナーモード(Planarモード)を含むことができる。方向性モードは、予測方向の細かい程度によって、例えば、33個の方向性予測モードまたは65個の方向性予測モードを含むことができる。ただし、これは例示に過ぎず、設定によってそれ以上またはそれ以下の個数の方向性予測モードが使われることができる。イントラ予測部222は、隣接ブロックに適用された予測モードを利用し、現在ブロックに適用される予測モードを決定することもできる。
インター予測部221は、参照ピクチャ上で動きベクトルにより特定される参照ブロック(参照サンプルアレイ)に基づいて、現在ブロックに対する予測されたブロックを誘導することができる。このとき、インター予測モードで送信される動き情報の量を減らすために、隣接ブロックと現在ブロックとの間の動き情報の相関性に基づいて、動き情報をブロック、サブブロックまたはサンプル単位で予測できる。前記動き情報は、動きベクトル及び参照ピクチャインデックスを含むことができる。前記動き情報は、インター予測方向(L0予測、L1予測、Bi予測等)の情報をさらに含むことができる。インター予測の場合、隣接ブロックは、現在ピクチャ内に存在する空間的隣接ブロック(spatial neighboring block)と参照ピクチャに存在する時間的隣接ブロック(temporal neighboring block)を含むことができる。前記参照ブロックを含む参照ピクチャと前記時間的隣接ブロックを含む参照ピクチャは、同じであってもよく、異なってもよい。前記時間的隣接ブロックは、同一位置参照ブロック(collocated reference block)、同一位置CU(colCU)などの名称で呼ばれることもでき、前記時間的隣接ブロックを含む参照ピクチャは、同一位置ピクチャ(collocated picture、colPic)とも呼ばれる。例えば、インター予測部221は、隣接ブロックに基づいて動き情報候補リストを構成し、前記現在ブロックの動きベクトル及び/または参照ピクチャインデックスを導出するためにどのような候補が使われるかを指示する情報を生成することができる。多様な予測モードに基づいてインター予測が実行されることができ、例えば、スキップモードとマージモードの場合、インター予測部221は、隣接ブロックの動き情報を現在ブロックの動き情報として利用できる。スキップモードの場合、マージモードとは違ってレジデュアル信号が送信されない。動き情報予測(motion vector prediction、MVP)モードの場合、隣接ブロックの動きベクトルを動きベクトル予測子(motion vector predictor)として利用し、動きベクトル差分(motion vector difference)をシグナリングすることで現在ブロックの動きベクトルを指示することができる。
予測部220は、後述する多様な予測方法に基づいて予測信号を生成することができる。例えば、予測部は、一つのブロックに対する予測のためにイントラ予測またはインター予測を適用することができるだけでなく、イントラ予測とインター予測を同時に適用できる。これはcombined inter and intra prediction(CIIP)とも呼ばれる。また、予測部は、ブロックに対する予測のためにイントラブロックコピー(intra block copy、IBC)予測モードに基づくこともでき、またはパレットモード(palette mode)に基づくこともできる。前記IBC予測モードまたはパレットモードは、例えば、SCC(screen content coding)などのようにゲームなどのコンテンツ映像/動画コーディングのために使われることができる。IBCは、基本的に現在ピクチャ内で予測を実行するが、現在ピクチャ内で参照ブロックを導出するという点でインター予測と類似するように実行されることができる。即ち、IBCは、本文書で説明されるインター予測技法のうち少なくとも一つを利用することができる。パレットモードは、イントラコーディングまたはイントラ予測の一例と見ることができる。パレットモードが適用される場合、パレットテーブル及びパレットインデックスに対する情報に基づいてピクチャ内のサンプル値をシグナリングすることができる。
前記予測部(インター予測部221及び/または前記イントラ予測部222を含む)を介して生成された予測信号は、復元信号を生成するために利用され、またはレジデュアル信号を生成するために利用されることができる。変換部232は、レジデュアル信号に変換技法を適用して変換係数(transform coefficients)を生成することができる。例えば、変換技法は、DCT(Discrete Cosine Transform)、DST(Discrete Sine Transform)、KLT(Karhunen-Loeve Transform)、GBT(Graph-Based Transform)、またはCNT(Conditionally Non-linear Transform)のうち少なくとも一つを含むことができる。ここで、GBTは、ピクセル間の関係情報をグラフで表現するとき、このグラフから得られた変換を意味する。CNTは、以前に復元された全てのピクセル(all previously reconstructed pixel)を利用して予測信号を生成し、それに基づいて取得される変換を意味する。また、変換過程は、正四角形の同じ大きさを有するピクセルブロックに適用されることもでき、正四角形でない可変の大きさのブロックにも適用されることができる。
量子化部233は、変換係数を量子化してエントロピーエンコーディング部240に送信され、エントロピーエンコーディング部240は、量子化された信号(量子化された変換係数に対する情報)をエンコーディングしてビットストリームで出力できる。前記量子化された変換係数に対する情報は、レジデュアル情報とも呼ばれる。量子化部233は、係数スキャン順序(scan order)に基づいてブロック形態の量子化された変換係数を1次元ベクトル形態で再整列でき、前記1次元ベクトル形態の量子化された変換係数に基づいて前記量子化された変換係数に対する情報を生成することもできる。エントロピーエンコーディング部240は、例えば、指数ゴロム(exponential Golomb)、CAVLC(context-adaptive variable length coding)、CABAC(context-adaptive binary arithmetic coding)などのような多様なエンコーディング方法を実行することができる。エントロピーエンコーディング部240は、量子化された変換係数の他にビデオ/イメージ復元に必要な情報(例えば、シンタックス要素(syntax elements)の値等)を共にまたは別途にエンコーディングすることもできる。エンコーディングされた情報(例えば、エンコーディングされたビデオ/映像情報)は、ビットストリーム形態でNAL(network abstraction layer)ユニット単位で送信または格納されることができる。前記ビデオ/映像情報は、アダプテーションパラメータセット(APS)、ピクチャパラメータセット(PPS)、シーケンスパラメータセット(SPS)またはビデオパラメータセット(VPS)等、多様なパラメータセットに対する情報をさらに含むことができる。また、前記ビデオ/映像情報は、一般制限情報(general constraint information)をさらに含むことができる。本文書において、エンコーディング装置からデコーディング装置に伝達/シグナリングされる情報及び/またはシンタックス要素は、ビデオ/映像情報に含まれることができる。前記ビデオ/映像情報は、前述したエンコーディング手順を介してエンコーディングされて前記ビットストリームに含まれることができる。前記ビットストリームは、ネットワークを介して送信されることができ、またはデジタル格納媒体に格納されることができる。ここで、ネットワークは、放送網及び/または通信網などを含むことができ、デジタル格納媒体は、USB、SD、CD、DVD、ブルーレイ、HDD、SSDなど、多様な格納媒体を含むことができる。エントロピーエンコーディング部240から出力された信号は、送信する送信部(図示せず)及び/または格納する格納部(図示せず)がエンコーディング装置200の内部/外部エレメントとして構成されることができ、または送信部は、エントロピーエンコーディング部240に含まれることもできる。
量子化部233から出力された量子化された変換係数は、予測信号を生成するために利用されることができる。例えば、量子化された変換係数に逆量子化部234及び逆変換部235を介して逆量子化及び逆変換を適用することによって、レジデュアル信号(レジデュアルブロックまたはレジデュアルサンプル)を復元することができる。加算部155は、復元されたレジデュアル信号をインター予測部221またはイントラ予測部222から出力された予測信号に加算することによって復元(reconstructed)信号(復元ピクチャ、復元ブロック、復元サンプルアレイ)を生成することができる。スキップモードが適用された場合のように処理対象ブロックに対するレジデュアルがない場合、予測されたブロックが復元ブロックとして使われることができる。加算部250は、復元部または復元ブロック生成部とも呼ばれる。生成された復元信号は、現在ピクチャ内の次の処理対象ブロックのイントラ予測のために使われることができ、後述するようにフィルタリングを経て次のピクチャのインター予測のために使われることもできる。
一方、ピクチャエンコーディング及び/または復元過程でLMCS(luma mapping with chroma scaling)が適用されることもできる。
フィルタリング部260は、復元信号にフィルタリングを適用して主観的/客観的画質を向上させることができる。例えば、フィルタリング部260は、復元ピクチャに多様なフィルタリング方法を適用して修正された(modified)復元ピクチャを生成することができ、前記修正された復元ピクチャをメモリ270、具体的には、メモリ270のDPBに格納することができる。前記多様なフィルタリング方法は、例えば、デブロッキングフィルタリング、サンプル適応的オフセット(sample adaptive offset)、適応的ループフィルタ(adaptive loop filter)、双方向フィルタ(bilateral filter)などを含むことができる。フィルタリング部260は、各フィルタリング方法に対する説明で後述するように、フィルタリングに対する多様な情報を生成してエントロピーエンコーディング部240に伝達できる。フィルタリングに対する情報は、エントロピーエンコーディング部240でエンコーディングされてビットストリーム形態で出力されることができる。
メモリ270に送信された修正された復元ピクチャは、インター予測部221で参照ピクチャとして使われることができる。エンコーディング装置は、これを介してインター予測が適用される場合、エンコーディング装置100とデコーディング装置での予測ミスマッチを避けることができ、符号化効率も向上させることができる。
メモリ270DPBは、修正された復元ピクチャをインター予測部221での参照ピクチャとして使用するために格納することができる。メモリ270は、現在ピクチャ内の動き情報が導出された(または、エンコーディングされた)ブロックの動き情報及び/または既に復元されたピクチャ内のブロックの動き情報を格納することができる。前記格納された動き情報は、空間的隣接ブロックの動き情報または時間的隣接ブロックの動き情報として活用するためにインター予測部221に伝達できる。メモリ270は、現在ピクチャ内の復元されたブロックの復元サンプルを格納することができ、イントラ予測部222に伝達できる。
図3は、本文書が適用されることができるビデオ/映像デコーディング装置の構成の概略を説明する図である。
図3を参照すると、デコーディング装置300は、エントロピーデコーディング部(entropy decoder)310、レジデュアル処理部(residual processor)320、予測部(predictor)330、加算部(adder)340、フィルタリング部(filter)350、及びメモリ(memoery)360を含んで構成されることができる。予測部330は、インター予測部331及びイントラ予測部332を含むことができる。レジデュアル処理部320は、逆量子化部(dequantizer)321及び逆変換部(inverse transformer)321を含むことができる。前述したエントロピーデコーディング部310、レジデュアル処理部320、予測部330、加算部340、及びフィルタリング部350は、実施例によって一つのハードウェアコンポーネント(例えば、デコーダチップセットまたはプロセッサ)により構成されることができる。また、メモリ360は、DPB(decoded picture buffer)を含むことができ、デジタル格納媒体により構成されることもできる。前記ハードウェアコンポーネントは、メモリ360を内部/外部コンポーネントとしてさらに含むこともできる。
ビデオ/映像情報を含むビットストリームが入力されると、デコーディング装置300は、図2のエンコーディング装置でビデオ/映像情報が処理されたプロセスに対応して映像を復元することができる。例えば、デコーディング装置300は、前記ビットストリームから取得したブロック分割関連情報に基づいてユニット/ブロックを導出することができる。デコーディング装置300は、エンコーディング装置で適用された処理ユニットを利用してデコーディングを実行することができる。したがって、デコーディングの処理ユニットは、例えば、コーディングユニットであり、コーディングユニットは、コーディングツリーユニットまたは最大コーディングユニットからクアッドツリー構造、バイナリツリー構造及び/またはターナリィツリー構造によって分割されることができる。コーディングユニットから一つ以上の変換ユニットが導出されることができる。そして、デコーディング装置300を介してデコーディング及び出力された復元映像信号は、再生装置を介して再生されることができる。
デコーディング装置300は、図2のエンコーディング装置から出力された信号をビットストリーム形態で受信することができ、受信された信号は、エントロピーデコーディング部310を介してデコーディングされることができる。例えば、エントロピーデコーディング部310は、前記ビットストリームをパーシングして映像復元(または、ピクチャ復元)に必要な情報(例えば、ビデオ/映像情報)を導出することができる。前記ビデオ/映像情報は、アダプテーションパラメータセット(APS)、ピクチャパラメータセット(PPS)、シーケンスパラメータセット(SPS)またはビデオパラメータセット(VPS)等、多様なパラメータセットに対する情報をさらに含むことができる。また、前記ビデオ/映像情報は、一般制限情報(general constraint information)をさらに含むことができる。デコーディング装置は、前記パラメータセットに対する情報及び/または前記一般制限情報にも基づいてピクチャをデコーディングすることができる。本文書で後述されるシグナリング/受信される情報及び/またはシンタックス要素は、前記デコーディング手順を介してデコーディングされて前記ビットストリームから取得されることができる。例えば、エントロピーデコーディング部310は、指数ゴロム符号化、CAVLCまたはCABACなどのコーディング方法に基づいてビットストリーム内の情報をデコーディングし、映像復元に必要なシンタックスエレメントの値、レジデュアルに対する変換係数の量子化された値を出力することができる。より詳しくは、CABACエントロピーデコーディング方法は、ビットストリームで各シンタックス要素に該当するビンを受信し、デコーディング対象シンタックス要素情報と隣接及びデコーディング対象ブロックのデコーディング情報または以前のステップでデコーディングされたシンボル/ビンの情報を利用してコンテキスト(context)モデルを決定し、決定されたコンテキストモデルによってビン(bin)の発生確率を予測してビンの算術デコーディング(arithmetic decoding)を実行することで各シンタックス要素の値に該当するシンボルを生成することができる。このとき、CABACエントロピーデコーディング方法は、コンテキストモデル決定後、次のシンボル/ビンのコンテキストモデルのためにデコーディングされたシンボル/ビンの情報を利用してコンテキストモデルをアップデートすることができる。エントロピーデコーディング部310でデコーディングされた情報のうち予測に対する情報は、予測部(インター予測部332及びイントラ予測部331)に提供され、エントロピーデコーディング部310でエントロピーデコーディングが実行されたレジデュアル値、即ち、量子化された変換係数及び関連パラメータ情報は、レジデュアル処理部320に入力されることができる。レジデュアル処理部320は、レジデュアル信号(レジデュアルブロック、レジデュアルサンプル、レジデュアルサンプルアレイ)を導出することができる。また、エントロピーデコーディング部310でデコーディングされた情報のうちフィルタリングに対する情報は、フィルタリング部350に提供されることができる。一方、エンコーディング装置から出力された信号を受信する受信部(図示せず)がデコーディング装置300の内部/外部エレメントとしてさらに構成されることができ、または、受信部は、エントロピーデコーディング部310の構成要素である。一方、本文書によるデコーディング装置は、ビデオ/映像/ピクチャデコーディング装置とも呼ばれ、前記デコーディング装置は、情報デコーダ(ビデオ/映像/ピクチャ情報デコーダ)及びサンプルデコーダ(ビデオ/映像/ピクチャサンプルデコーダ)に区分することもできる。前記情報デコーダは、前記エントロピーデコーディング部310を含むことができ、前記サンプルデコーダは、前記逆量子化部321、逆変換部322、加算部340、フィルタリング部350、メモリ360、インター予測部332、及びイントラ予測部331のうち少なくとも一つを含むことができる。
逆量子化部321では量子化された変換係数を逆量子化して変換係数を出力することができる。逆量子化部321は、量子化された変換係数を2次元のブロック形態で再整列できる。この場合、前記再整列は、エンコーディング装置で実行された係数スキャン順序に基づいて再整列を実行することができる。逆量子化部321は、量子化パラメータ(例えば、量子化ステップサイズ情報)を利用して量子化された変換係数に対する逆量子化を実行し、変換係数(transform coefficient)を取得することができる。
逆変換部322では変換係数を逆変換してレジデュアル信号(レジデュアルブロック、レジデュアルサンプルアレイ)を取得するようになる。
予測部は、現在ブロックに対する予測を実行し、前記現在ブロックに対する予測サンプルを含む予測されたブロック(predicted block)を生成することができる。予測部は、エントロピーデコーディング部310から出力された前記予測に対する情報に基づいて前記現在ブロックにイントラ予測が適用されるか、またはインター予測が適用されるかを決定することができ、具体的なイントラ/インター予測モードを決定することができる。
予測部320は、後述する多様な予測方法に基づいて予測信号を生成することができる。例えば、予測部は、一つのブロックに対する予測のためにイントラ予測またはインター予測を適用することができるだけでなく、イントラ予測とインター予測を同時に適用できる。これはcombined inter and intra prediction(CIIP)とも呼ばれる。また、予測部は、ブロックに対する予測のためにイントラブロックコピー(intra block copy、IBC)予測モードに基づくこともできまたはパレットモード(palette mode)に基づくこともできる。前記IBC予測モードまたはパレットモードは、例えば、SCC(screen content coding)などのようにゲームなどのコンテンツ映像/動画コーディングのために使われることができる。IBCは、基本的に現在ピクチャ内で予測を実行するが、現在ピクチャ内で参照ブロックを導出するという点でインター予測と類似するように実行されることができる。即ち、IBCは、本文書で説明されるインター予測技法のうち少なくとも一つを利用することができる。パレットモードは、イントラコーディングまたはイントラ予測の一例と見ることができる。パレットモードが適用される場合、パレットテーブル及びパレットインデックスに対する情報が前記ビデオ/映像情報に含まれてシグナリングされることができる。
イントラ予測部331は、現在ピクチャ内のサンプルを参照して現在ブロックを予測することができる。前記参照されるサンプルは、予測モードによって前記現在ブロックの隣(neighbor)に位置することもでき、または離れて位置することもできる。イントラ予測における予測モードは、複数の非方向性モードと複数の方向性モードを含むことができる。イントラ予測部331は、隣接ブロックに適用された予測モードを利用し、現在ブロックに適用される予測モードを決定することもできる。
インター予測部332は、参照ピクチャ上で動きベクトルにより特定される参照ブロック(参照サンプルアレイ)に基づいて、現在ブロックに対する予測されたブロックを誘導することができる。このとき、インター予測モードで送信される動き情報の量を減らすために、隣接ブロックと現在ブロックとの間の動き情報の相関性に基づいて動き情報をブロック、サブブロックまたはサンプル単位で予測できる。前記動き情報は、動きベクトル及び参照ピクチャインデックスを含むことができる。前記動き情報は、インター予測方向(L0予測、L1予測、Bi予測等)の情報をさらに含むことができる。インター予測の場合、隣接ブロックは、現在ピクチャ内に存在する空間的隣接ブロック(spatial neighboring block)と参照ピクチャに存在する時間的隣接ブロック(temporal neighboring block)を含むことができる。例えば、インター予測部332は、隣接ブロックに基づいて動き情報候補リストを構成し、受信した候補選択情報に基づいて前記現在ブロックの動きベクトル及び/または参照ピクチャインデックスを導出することができる。多様な予測モードに基づいてインター予測が実行されることができ、前記予測に対する情報は、前記現在ブロックに対するインター予測のモードを指示する情報を含むことができる。
加算部340は、取得されたレジデュアル信号を予測部(インター予測部332及び/またはイントラ予測部331を含む)から出力された予測信号(予測されたブロック、予測サンプルアレイ)に加算することによって復元信号(復元ピクチャ、復元ブロック、復元サンプルアレイ)を生成することができる。スキップモードが適用された場合のように処理対象ブロックに対するレジデュアルがない場合、予測されたブロックが復元ブロックとして使われることができる。
加算部340は、復元部または復元ブロック生成部とも呼ばれる。生成された復元信号は、現在ピクチャ内の次の処理対象ブロックのイントラ予測のために使われることができ、後述するようにフィルタリングを経て出力されることもでき、または次のピクチャのインター予測のために使われることもできる。
一方、ピクチャデコーディング過程でLMCS(luma mapping with chroma scaling)が適用されることもできる。
フィルタリング部350は、復元信号にフィルタリングを適用して主観的/客観的画質を向上させることができる。例えば、フィルタリング部350は、復元ピクチャに多様なフィルタリング方法を適用して修正された(modified)復元ピクチャを生成することができ、前記修正された復元ピクチャをメモリ360、具体的に、メモリ360のDPBに送信できる。前記多様なフィルタリング方法は、例えば、デブロッキングフィルタリング、サンプル適応的オフセット(sample adaptive offset)、適応的ループフィルタ(adaptive loop filter)、双方向フィルタ(bilateral filter)などを含むことができる。
メモリ360のDPBに格納された(修正された)復元ピクチャは、インター予測部332で参照ピクチャとして使われることができる。メモリ360は、現在ピクチャ内の動き情報が導出された(または、デコーディングされた)ブロックの動き情報及び/または既に復元されたピクチャ内のブロックの動き情報を格納することができる。前記格納された動き情報は、空間的隣接ブロックの動き情報または時間的隣接ブロックの動き情報として活用するためにインター予測部260に伝達できる。メモリ360は、現在ピクチャ内の復元されたブロックの復元サンプルを格納することができ、イントラ予測部331に伝達できる。
本明細書において、エンコーディング装置200のフィルタリング部260、インター予測部221、及びイントラ予測部222で説明された実施例は、各々、デコーディング装置300のフィルタリング部350、インター予測部332、及びイントラ予測部331にも同様にまたは対応するように適用されることができる。
前述したように、ビデオコーディングを実行するにあたって、圧縮効率を向上させるために予測を実行する。それによって、コーディング対象ブロックである現在ブロックに対する予測サンプルを含む予測されたブロックを生成することができる。ここで、前記予測されたブロックは、空間ドメイン(または、ピクセルドメイン)での予測サンプルを含む。前記予測されたブロックは、エンコーディング装置及びデコーディング装置で同じく導出され、前記エンコーディング装置は、原本ブロックの原本サンプル値自体でない前記原本ブロックと前記予測されたブロックとの間のレジデュアルに対する情報(レジデュアル情報)をデコーディング装置にシグナリングすることで映像コーディング効率を向上させることができる。デコーディング装置は、前記レジデュアル情報に基づいてレジデュアルサンプルを含むレジデュアルブロックを導出し、前記レジデュアルブロックと前記予測されたブロックを加算して復元サンプルを含む復元ブロックを生成することができ、復元ブロックを含む復元ピクチャを生成することができる。
前記レジデュアル情報は、変換及び量子化手順を介して生成されることができる。例えば、エンコーディング装置は、前記原本ブロックと前記予測されたブロックとの間のレジデュアルブロックを導出し、前記レジデュアルブロックに含まれているレジデュアルサンプル(レジデュアルサンプルアレイ)に変換手順を実行して変換係数を導出し、前記変換係数に量子化手順を実行して量子化された変換係数を導出することで関連したレジデュアル情報を(ビットストリームを介して)デコーディング装置にシグナリングできる。ここで、前記レジデュアル情報は、前記量子化された変換係数の値情報、位置情報、変換技法、変換カーネル、量子化パラメータなどの情報を含むことができる。デコーディング装置は、前記レジデュアル情報に基づいて逆量子化/逆変換手順を実行してレジデュアルサンプル(または、レジデュアルブロック)を導出することができる。デコーディング装置は、予測されたブロックと前記レジデュアルブロックに基づいて復元ピクチャを生成することができる。また、エンコーディング装置は、以後ピクチャのインター予測のための参照のために量子化された変換係数を逆量子化/逆変換してレジデュアルブロックを導出し、これに基づいて復元ピクチャを生成することができる。
本文書では、図2の前記エンコーディング装置の変換部、量子化部、逆量子化部または逆変換部に対して、または図3の前記デコーディング装置の逆量子化部または逆変換部に対して詳細に説明する。ここで、前記エンコーディング装置は、エントロピーエンコーディングを介して変換及び量子化された情報からビットストリームを導出することができ、前記デコーディング装置は、エントロピーデコーディングを介してビットストリームから変換及び量子化された情報を導出することができる。以下では逆量子化部及び逆変換部に対して説明し、変換部及び量子化部は、前記逆量子化部及び逆変換部と同じ動作を逆に実行することができる。また、逆量子化部及び逆変換部は、逆量子化及び逆変換部で示すこともでき、変換部及び量子化部は、変換及び量子化部で示すこともできる。
また、本文書において、MTS(Multiple Transform Selection)は、少なくとも2個以上の変換タイプを利用して変換を実行する方法を意味することができる。これはAMT(Adaptive Mutliple Transform)またはEMT(Explicit Multiple Transform)で表現されることもでき、同様に、mts_idxもAMT_idx、EMT_idx、AMT_TU_idxEMT_TU_idx、変換インデックスまたは変換組み合わせインデックスなどのように表現されることができ、本文書は、このような表現に限定されるものではない。
図4は、逆量子化及び逆変換部の一例を示す。
図4を参照すると、逆量子化及び逆変換部400は、逆量子化部410、2次逆変換部(inverse secondary transform unit)420、及び1次逆変換部(inverse primary transformu nit)430を含むことができる。
前記逆量子化部410では量子化ステップサイズ情報を利用してエントロピーデコーディングされた信号(または、量子化された変換係数)に対して逆量子化を実行して変換係数(transform coefficient)を取得することができ、前記2次逆変換部420では前記変換係数に対して2次逆変換を実行することができる。また、1次逆変換部430は、2次逆変換された信号またはブロック(または、変換係数)に対して1次逆変換を実行することができ、1次逆変換を介してデコーディングされたレジデュアル信号が取得されることができる。ここで、2次逆変換は、2次変換(secondary transform)の逆変換を示すことができ、1次逆変換は、1次変換(primary transform)の逆変換を示すことができる。
本文書では、予測モード、ブロック大きさまたはブロック形状(block shape)のうち少なくとも一つにより区分される変換設定グループ(transform configuration group)別に変換組み合わせ(transform combination)を構成することができ、前記1次逆変換部430は、本文書により構成された変換組み合わせに基づいて逆変換を実行することができる。また、本文書で後述する実施例が適用されることができる。
図5は、2次逆変換部及び1次逆変換部の一例を示す。
図5を参照して逆変換過程を具体的に見ると、逆変換過程は、2次逆変換適用可否決定部(または、2次逆変換の適用可否を決定する要素)510及び2次逆変換決定部(または、2次逆変換を決定する要素)520、2次逆変換部530及び1次逆変換部540が利用されることができる。ここで、図4の2次逆変換部420は、図5の2次逆変換部530と同じであり、図5の2次逆変換適用可否決定部510、2次逆変換決定部520、及び2次逆変換部530のうち少なくとも一つを含むこともできるが、表現によって変わることができるため、これに限定されるものではない。また、図4の1次逆変換部430は、図5の1次逆変換部540と同じであるが、表現によって変わることができるため、これに限定されるものではない。
2次逆変換適用可否決定部510は、2次逆変換の適用可否を決定することができる。例えば、2次逆変換は、NSSTまたはRSTである。一例として、2次逆変換適用可否決定部510は、エンコーディング装置から受信した2次変換フラグに基づいて2次逆変換の適用可否を決定することができる。他の一例として、2次逆変換適用可否決定部510は、レジデュアルブロックの変換係数に基づいて2次逆変換の適用可否を決定することもできる。
2次逆変換決定部520は、2次逆変換を決定することができる。このとき、2次逆変換決定部520は、イントラ予測モードによって指定されたNSST(または、RST)変換セット(set)に基づいて現在ブロックに適用される2次逆変換を決定することができる。
また、一例として、1次変換決定方法に依存して2次変換決定方法が決定されることができる。イントラ予測モードによって、1次変換と2次変換の多様な組み合わせが決定されることができる。
また、一例として、2次逆変換決定部520は、現在ブロックの大きさに基づいて2次逆変換が適用される領域を決定することもできる。
2次逆変換部530は、決定された2次逆変換を利用して逆量子化されたレジデュアルブロックに対して2次逆変換を実行することができる。
1次逆変換部540は、2次逆変換されたレジデュアルブロックに対して1次逆変換を実行することができる。1次変換(primary transform)は、コア変換(core transform)とも呼ばれる。一例として、1次逆変換部540は、前述したMTSを利用して1次変換を実行することができる。また、一例として、1次逆変換部540は、現在ブロックにMTSが適用されるかどうかを決定することができる。
一例として、現在ブロックにMTSが適用される場合(または、tu_mts_flagシンタックス要素の値が1である場合)、1次逆変換部540は、現在ブロックのイントラ予測モードに基づいてMTS候補を構成することができる。また、1次逆変換部540は、構成されたMTS候補のうち、特定MTSを指示するmts_idxシンタックス要素を利用して現在ブロックに適用される1次変換を決定することができる。
図6は、変換関連パラメータに基づく逆変換方法の一例である。
図6を参照すると、一実施例は、sps_mts_intra_enabled_flagシンタックス要素またはsps_mts_inter_enabled_flagシンタックス要素を取得することができる(S600)。ここで、sps_mts_intra_enabled_flagシンタックス要素は、tu_mts_flagシンタックス要素がイントラコーディングユニットのレジデュアルコーディングシンタックスに含まれるかに対する情報を示すことができる。例えば、sps_mts_intra_enabled_flagシンタックス要素の値が0である場合、tu_mts_flagシンタックス要素がイントラコーディングユニットのレジデュアルコーディングシンタックスに含まれない。または、sps_mts_intra_enabled_flagシンタックス要素の値が1である場合、tu_mts_flagシンタックス要素がイントラコーディングユニットのレジデュアルコーディングシンタックスに含まれる。
また、sps_mts_inter_enabled_flagシンタックス要素は、tu_mts_flagシンタックス要素がインターコーディングユニットのレジデュアルコーディングシンタックスに含まれるかに対する情報を示すことができる。例えば、sps_mts_inter_enabled_flagシンタックス要素の値が0である場合、tu_mts_flagシンタックス要素がインターコーディングユニットのレジデュアルコーディングシンタックスに含まれない。または、sps_mts_inter_enabled_flagシンタックス要素の値が1である場合、tu_mts_flagシンタックス要素がインターコーディングユニットのレジデュアルコーディングシンタックスに含まれる。
ここで、前記tu_mts_flagシンタックス要素は、多変換選択(MTS:Multiple Transform Selection)がルマ変換ブロックのレジデュアルサンプルに適用されるかどうかを示すことができる。
一実施例は、sps_mts_intra_enabled_flagシンタックス要素またはsps_mts_inter_enabled_flagシンタックス要素に基づいてtu_mts_flagシンタックス要素を取得することができる(S610)。例えば、sps_mts_intra_enabled_flagシンタックス要素またはsps_mts_inter_enabled_flagシンタックス要素の値が1である場合、一実施例は、tu_mts_flagシンタックス要素を取得することができる。例えば、tu_mts_flagシンタックス要素の値が0である場合、MTSがルマ変換ブロックのレジデュアルサンプルに適用されない。または、tu_mts_flagシンタックス要素の値が1である場合、MTSがルマ変換ブロックのレジデュアルサンプルに適用される。
一実施例は、tu_mts_flagシンタックス要素に基づいてmts_idxシンタックス要素を取得することができる(S620)。ここで、mts_idxシンタックス要素は、どのような変換カーネル(transform kernel)が現在(ルマ)変換ブロックの水平及び/または垂直方向によるルマレジデュアルサンプルに適用されるかに対する情報を示すことができる。例えば、tu_mts_flagシンタックス要素の値が1である場合、一実施例は、mts_idxシンタックス要素を取得する。または、tu_mts_flagシンタックス要素の値が0である場合、一実施例は、mts_idxシンタックス要素を取得しない。
一実施例は、mts_idxシンタックス要素に対応される変換カーネルを誘導することができる(S630)。または、一実施例は、mts_idxシンタックス要素に基づいて変換カーネルを導出することができる。
一方、他の一実施例として、前記tu_mts_flagシンタックス要素及び/または前記mts_idxシンタックス要素に対して本文書の実施例のうち少なくとも一つが適用されることもできる。
例えば、tu_mts_flagシンタックス要素は、sps_mts_intra_enabled_flagシンタックス要素またはsps_mts_inter_enabled_flagシンタックス要素に基づいてレジデュアルコーディングシンタックスに含まれることができ、mts_idxシンタックス要素は、tu_mts_flagシンタックス要素に基づいて変換ユニットシンタックスに含まれることができる。
または、例えば、前記sps_mts_intra_enabled_flagシンタックス要素は、sps_explicit_mts_intra_enabled_flagシンタックス要素で示すことができ、sps_mts_inter_enabled_flagシンタックス要素は、sps_explicit_mts_inter_enabled_flagシンタックス要素で示すことができる。または、前記tu_mts_flagシンタックス要素は省略されることができ、前記mts_idxシンタックス要素が前記sps_explicit_mts_intra_enabled_flagシンタックス要素またはsps_explicit_mts_inter_enabled_flagシンタックス要素に基づいてコーディングユニットシンタックスに含まれることもできる。
例えば、前記mts_idxシンタックス要素に対応される変換カーネルは、水平変換及び垂直変換に区分されて定義されることができる。または、前記mts_idxシンタックス要素に基づいて決定される変換カーネルを水平変換及び垂直変換が区分されることができる。一方、前記水平変換及び垂直変換は、互いに異なる変換カーネルが適用されることができるが、同じ変換カーネルが適用されることもできるため、これに限定されるものではない。
例えば、mts_idxシンタックス要素に基づいて決定される水平変換及び垂直変換に適用される変換カーネルに対する情報は、表1または表2の通りである。
一実施例は、前記変換カーネルに基づいて逆変換を実行することができる(S640)。本文書において、逆変換は、変換で示すことができ、変換の逆を示すこともできる。
図7は、具体的な逆変換方法の一例である。
図7を参照すると、一実施例は、変換大きさ(nTbS)を確認することができる(S710)。例えば、前記変換大きさ(nTbS)は、スケールされた(scaled)変換係数の水平サンプル大きさを示す変数である。
一実施例は、変換カーネルタイプ(trType)を確認することができる(S720)。例えば、前記変換カーネルタイプ(trType)は、変換カーネルのタイプを示す変数であり、本文書の多様な実施例が適用されることができる。例えば、変換カーネルタイプは、図6で説明したtrTypeHorまたはtrTypeVerを示すこともできる。
一実施例は、変換大きさ(nTbS)または変換カーネルタイプ(trType)のうち少なくとも一つに基づいて変換行列の掛け算を実行することができる(S730)。例えば、変換カーネルタイプ(trType)に基づいて特定演算が適用されることができる。または、例えば、変換大きさ(nTbS)及び変換カーネルタイプ(trType)に基づいて既に決定された変換行列が適用されることもできる。
一実施例は、前記変換行列の掛け算に基づいて変換サンプルを導出することができる(S740)。
エンコーディング装置/デコーディング装置は、前述した逆変換過程を実行することができ、エンコーディング装置は、前述した逆変換過程の逆である変換過程も実行することができる。
図8は、一実施例に係るCABACエンコーディングシステムのブロック図を示し、単一シンタックス要素をコーディングするためのCABAC(context-adaptive binary arithmetic coding)のブロック図を示す。
CABACのエンコーディング過程は、まず、入力信号が二進値でないシンタックス要素(syntax)である場合、二進化を介して入力信号を二進値に変換する。入力信号が既に二進値である場合、二進化を経ずにバイパス、即ち、コーディングエンジンに入力されることができる。ここで、二進値を構成する各々の二進数0または1をビン(bin)ということができる。例えば、二進化された後の二進ストリングが110である場合、1、1、0の各々を一つのビンという。一つのシンタックス要素に対する前記ビンは、該当シンタックス要素の値を示すことができる。
二進化されたビンは、正規(regular)コーディングエンジンまたはバイパスコーディングエンジンに入力されることができる。
正規コーディングエンジンは、該当ビンに対して確率値を反映するコンテキストモデルを割り当て、割り当てられたコンテキストモデルに基づいて該当ビンをコーディングすることができる。正規コーディングエンジンでは各ビンに対するコーディングを実行した後に該当ビンに対する確率モデルを更新することができる。このようにコーディングされるビンをコンテキストコーディングされたビン(context-coded bin)ということができる。
バイパスコーディングエンジンは、入力されたビンに対して確率を推定する手順とコーディング後に該当ビンに適用した確率モデルを更新する手順を省略する。コンテキストを割り当てる代わりに、均一な確率分布を適用して入力されるビンをコーディングすることでコーディング速度を向上させる。このようにコーディングされるビンをバイパスビン(bypass bin)という。
エントロピーエンコーディングは、正規コーディングエンジンを介してコーディングを実行するか、またはバイパスコーディングエンジンを介してコーディングを実行するかを決定し、コーディング経路をスイッチングすることができる。エントロピーデコーディングは、エントロピーエンコーディングと同じ過程を逆順に実行する。
一方、一実施例において、(量子化された)変換係数は、transform_skip_flag、last_sig_coeff_x_prefix、last_sig_coeff_y_prefix、last_sig_coeff_x_suffix、last_sig_coeff_y_suffix、coded_sub_block_flag、sig_coeff_flag、abs_level_gt1_flag、par_level_flag、abs_level_gt3_flag、abs_remainder、dec_abs_level、coeff_sign_flag及び/またはmts_idxなどのシンタックス要素(syntax elements)に基づいて符号化及び/または復号化されることができる。
例えば、レジデュアル関連情報またはレジデュアル関連情報に含まれているシンタックス要素は、表3乃至表5のように示すことができる。または、レジデュアル関連情報に含まれているレジデュアルコーディング情報またはレジデュアルコーディングシンタックスに含まれているシンタックス要素は、表3乃至表5のように示すことができる。表3乃至表5は、一つのシンタックスを連続して示すことができる。
例えば、レジデュアル関連情報は、レジデュアルコーディング情報(または、レジデュアルコーディングシンタックスに含まれているシンタックス要素)または変換ユニット情報(または、変換ユニットシンタックスに含まれているシンタックス要素)を含むことができ、レジデュアルコーディング情報は、表6乃至表9のように示すことができ、変換ユニット情報は、表10または表11のように示すことができる。表6乃至表9は、一つのシンタックスを連続して示すことができる。
前記シンタックス要素transform_skip_flagは、関連したブロック(associated block)に変換が省略されるかどうかを示す。前記関連したブロックは、CB(coding block)またはTB(Transform block)である。変換(及び量子化)及びレジデュアルコーディング手順に対して、CBとTBは混用されることができる。例えば、CBに対してレジデュアルサンプルが導出され、前記レジデュアルサンプルに対する変換及び量子化を介して(量子化された)変換係数が導出されることができることは、前述の通りであり、レジデュアルコーディング手順を介して前記(量子化された)変換係数の位置、大きさ、符号などを効率的に示す情報(例えば、シンタックス要素)が生成されてシグナリングされることができる。量子化された変換係数は、簡単に変換係数とも呼ばれる。一般的にCBが最大TBより大きくない場合、CBのサイズは、TBのサイズと同じであり、この場合、変換(及び量子化)及びレジデュアルコーディングされる対象ブロックは、CBまたはTBとも呼ばれる。一方、CBが最大TBより大きい場合、変換(及び量子化)及びレジデュアルコーディングされる対象ブロックは、TBとも呼ばれる。以下、レジデュアルコーディングに関連したシンタックス要素が変換ブロック(TB)単位でシグナリングされると説明するが、これは例示に過ぎず、前記TBは、コーディングブロック(CB)と混用されることができることは、前述の通りである。
前記表3乃至表5において、前記シンタックス要素transform_skip_flagは、レジデュアルコーディングシンタックスでシグナリングされると示したが、これは例示に過ぎず、前記シンタックス要素transform_skip_flagは、前記表10または表11のように変換ユニットシンタックスでシグナリングされることもできる。前記レジデュアルコーディングシンタックス及び前記変換ユニットシンタックスは、前記レジデュアル(関連)情報と総称できる。例えば、前記シンタックス要素transform_skip_flagは、ルマ成分(ルマ成分ブロック)に対してのみシグナリングされることができる(表10参照)。具体的に、例えば、前記輝度成分ブロックに0でない有効係数が存在する場合、前記レジデュアル関連情報は、前記輝度成分ブロックに対する前記変換スキップフラグ(transform_skip_flag)を含むことができる。この場合、前記レジデュアル関連情報は、前記色差成分ブロックに対する前記変換スキップフラグを含まない。即ち、前記レジデュアル関連情報は、前記輝度成分ブロックに対する前記変換スキップフラグを含み、前記色差成分ブロックに対する前記変換スキップフラグを含まない。即ち、この場合、前記色差成分ブロックに対する前記変換スキップフラグは、明示的にシグナリングされずに、前記色差成分ブロックに対する前記変換スキップフラグの値は、0に導出/推論(infer)されることができる。
または、他の例として、前記シンタックス要素transform_skip_flagは、輝度成分(輝度成分ブロック)及び色差成分(色差成分ブロック)に対して各々シグナリングされることもできる(表11参照)。
また、前記表3乃至表5または表6乃至表9を参照すると、一実施例において、シンタックス要素last_sig_coeff_x_prefix、last_sig_coeff_y_prefix、last_sig_coeff_x_suffix、及びlast_sig_coeff_y_suffixに基づいて変換ブロック内の最後の0でない変換係数の(x、y)位置情報をコーディングすることができる。より具体的に、シンタックス要素last_sig_coeff_x_prefixは、変換ブロック内のスキャン順序(scanning order)での最後の(last)有効係数(significant coefficient)の列位置(column position)のプレフィックス(prefix)を示し、last_sig_coeff_y_prefixは、前記変換ブロック内の前記スキャン順序(scanning order)での最後の(last)有効係数(significant coefficient)の行位置(row position)のプレフィックス(prefix)を示し、シンタックス要素last_sig_coeff_x_suffixは、前記変換ブロック内の前記スキャン順序(scanning order)での最後の(last)有効係数(significant coefficient)の列位置(column position)のサフィックス(suffix)を示し、シンタックス要素last_sig_coeff_y_suffixは、前記変換ブロック内の前記スキャン順序(scanning order)での最後の(last)有効係数(significant coefficient)の行位置(row position)のサフィックス(suffix)を示す。ここで、有効係数は、前記0でない係数を示すことができる。前記スキャン順序は、右上向対角スキャン順序である。または、前記スキャン順序は、水平スキャン順序、または垂直スキャン順序である。前記スキャン順序は、対象ブロック(CB、またはTBを含むCB)にイントラ/インター予測が適用されるかどうか及び/または具体的なイントラ/インター予測モードに基づいて決定されることができる。
その次に、変換ブロックを4×4サブブロック(sub-block)に分割した後、各4×4サブブロック毎に1ビットのシンタックス要素coded_sub_block_flagを使用して現在サブブロック内に0でない係数が存在するかどうかを示すことができる。前記サブブロックは、CG(Coefficient Group)と混在して使われることができる。
シンタックス要素coded_sub_block_flagの値が0である場合、それ以上送信する情報がないため、現在サブブロックに対するコーディング過程を終了することができる。それに対して、シンタックス要素coded_sub_block_flagの値が1である場合、シンタックス要素sig_coeff_flagに対するコーディング過程を実行し続けることができる。最後の0でない係数を含むサブブロックは、シンタックス要素coded_sub_block_flagに対するコーディングが不必要であり、変換ブロックのDC情報を含んでいるサブブロックは、0でない係数を含む確率が高いため、シンタックス要素coded_sub_block_flagは、コーディングされずにその値が1であると仮定されることができる。
もし、シンタックス要素coded_sub_block_flagの値が1であるため、現在サブブロック内に0でない係数が存在すると判断される場合、逆にスキャンされた順序によって二進値を有するシンタックス要素sig_coeff_flagをコーディングすることができる。スキャン順序によって、各々の係数に対して1ビットシンタックス要素sig_coeff_flagをコーディングすることができる。もし、現在スキャン位置で変換係数の値が0でない場合、シンタックス要素sig_coeff_flagの値は、1になることができる。ここで、最後の0でない係数を含んでいるサブブロックの場合、最後の0でない係数に対してはシンタックス要素sig_coeff_flagをコーディングする必要がないため、前記サブブロックに対するコーディング過程が省略されることができる。シンタックス要素sig_coeff_flagが1である場合にのみレベル情報コーディングが実行されることができ、レベル情報コーディング過程には4個のシンタックス要素を使用することができる。より具体的に、各シンタックス要素sig_coeff_flag[xC][yC]は、現在TB内の各変換係数位置(xC、yC)での該当変換係数のレベル(値)が0でないか(non-zero)どうかを示すことができる。一実施例において、前記シンタックス要素sig_coeff_flagは、量子化された変換係数が0でない有効係数かどうかを示す有効係数フラグの一例示に該当できる。
シンタックス要素sig_coeff_flagに対するコーディング以後の残ったレベル値は、以下の数式1の通りである。即ち、コーディングすべきレベル値を示すシンタックス要素remAbsLevelは、以下の数式1の通りである。ここで、coeffは、実際の変換係数値を意味することができる。
シンタックス要素abs_level_gt1_flagは、該当スキャニング位置(n)でのremAbsLevel′は、1より大きいかどうかを示すことができる。abs_level_gt1_flagの値が0である場合、該当位置の係数の絶対値は1である。abs_level_gt1_flagの値が1である場合、以後コーディングすべきレベル値remAbsLevelは、以下の数式2の通りである。
シンタックス要素par_level_flagを介して以下の数式3のように、数式2に記載されたremAbsLevelのleast significant coefficient(LSB)値をコーディングすることができる。ここで、シンタックス要素par_level_flag[n]は、スキャニング位置nでの変換係数レベル(値)のパリティ(parity)を示すことができる。シンタックス要素par_level_flagコーディング後にコーディングすべき変換係数レベル値remAbsLevelを以下の数式4のようにアップデートできる。
シンタックス要素abs_level_gt3_flagは、該当スキャニング位置(n)でのremAbsLevel′は3より大きいかどうかを示すことができる。シンタックス要素abs_level_gt3_flagが1である場合にのみシンタックス要素abs_remainderのコーディングが実行されることができる。実際の変換係数値であるcoeffと各シンタックス要素(syntax)の関係を整理すると、以下の数式5の通りであり、以下の表12は、数式5と関連した例を示すことができる。最後に、各係数の符号は、1ビットシンボルであるシンタックス要素coeff_sign_flagを利用してコーディングされることができる。|coeff|は、変換係数レベル(値)を示すことができ、変換係数に対するAbsLevelと表示されることもできる。
一実施例において、前記par_level_flagは、前記量子化された変換係数に対する変換係数レベルのパリティに対するパリティレベルフラグの一例を示し、前記abs_level_gt1_flagは、変換係数レベルまたはコーディングすべきレベル(値)が第1の閾値より大きいかどうかに対する第1の変換係数レベルフラグの一例を示し、前記abs_level_gt3_flagは、変換係数レベルまたはコーディングすべきレベル(値)が第2の閾値より大きいかどうかに対する第2の変換係数レベルフラグの一例を示すことができる。
図9は、4×4ブロック内の変換係数の例を示す。
図9の4×4ブロックは、量子化された係数の一例を示すことができる。図9に示すブロックは、4×4変換ブロックであり、または8×8、16×16、32×32、64×64変換ブロックの4×4サブブロックである。図9の4×4ブロックは、輝度ブロックまたは色差ブロックを示すことができる。図9の逆対角線スキャンされる係数に対するコーディング結果は、例えば、表13の通りである。表13においてscan_posは、逆対角線スキャンによる係数の位置を示すことができる。scan_pos15は、4×4ブロックで最初にスキャンされる、即ち、右側下段コーナーの係数を示すことができ、scan_pos0は最後にスキャンされる、即ち、左側上段コーナーの係数を示すことができる。一方、一実施例において、前記scan_posは、スキャン位置とも呼ばれる。例えば、前記scan_pos0は、スキャン位置0とも呼ばれる。
一方、CABACは、高い性能を提供するが、処理量(throughput、スループット)性能がよくないという短所を有する。これはCABACの正規コーディングエンジンのためである。正規コーディングは、以前にビンのコーディングを介してアップデートされた確率状態と範囲を使用するため、高いデータ依存性を見せ、確率区間を読み取って現在状態を判断するときに多くの時間を必要とする。これはコンテキストコーディングされたビン(context-coded bin)の数を制限することによってCABACの処理量問題を解決することができる。したがって、表3乃至表5または表6乃至表9のようにシンタックス要素sig_coeff_flag、abs_level_gt1_flag、par_level_flagを表現するために使われたビンの和がサブブロックの大きさによって、4×4サブブロックの場合は28、2×2サブブロックの場合は6(remBinsPass1)に制限されることができ、シンタックス要素abs_level_gt3_flagのコンテキストコーディングされたビンの数が4×4サブブロックである場合は4、2×2サブブロックである場合は2(remBinsPass2)に制限されることができる。コンテキスト要素をコーディングするときに制限されたコンテキストコーディングされたビンを全て使用する場合、残りの係数は、CABACを使用せずに二進化してbypassコーディングを実行することができる。
一方、本文書の一実施例は、統合変換タイプシグナリング(unified transform type signaling)方法を提案することができる。
例えば、MTS適用可否に対する情報は、tu_mts_flagシンタックス要素で示すことができ、適用される変換カーネルに対する情報は、mts_idxシンタックス要素で示すことができる。また、tu_mts_flagシンタックス要素は、変換ユニットシンタックスに含まれることができ、mts_idxシンタックス要素は、レジデュアルコーディングシンタックスに含まれることができ、例えば、表14及び表15のように示すことができる。
ただし、本文書の一実施例は、統合変換タイプシグナリングであって、一つの情報のみでMTS適用可否に対する情報及び適用される変換カーネルに対する情報を示すことができる。例えば、前記一つの情報は、統合変換タイプに対する情報で示すこともでき、tu_mts_idxシンタックス要素で示すこともできる。この場合、前記tu_mts_flagシンタックス要素及び前記mts_idxシンタックス要素は、省略されることができる。tu_mts_idxシンタックス要素は、変換ユニットシンタックスに含まれることができ、例えば、表16のように示すことができる。
MTSフラグ(または、tu_mts_flagシンタックス要素)をパーシングした後、TS(Transform Skip)フラグ(または、tranform_skip_flagシンタックス要素)の次にMTSインデックス(または、mts_idxシンタックス要素)のために2個のビン(bin)を有する固定長コーディング(fixed length coding)が実行される代わりに、本文書の一実施例によってTU(Truncated Unary)二進化(binarization)を利用する新しいジョイント(joint)シンタックス要素であるtu_mts_idxシンタックス要素が利用されることができる。1番ビンはTS、第2のMTS、及び次の全てのMTSインデックスを示すことができる。
例えば、tu_mts_idxシンタックス要素のセマンティックス及び二進化は、表17または表18のように示すことができる。
例えば、コンテキストモデルの個数は変更されることができないし、tu_mts_idxシンタックス要素の各ビン(bin)のためのコンテキストインデックス増分(context index increment)であるctxIncの割当は、表19のように示すことができる。
一方、本文書の一実施例は、変換スキップのためのレジデュアルコーディング方法を提案することができる。
例えば、量子化された予測レジデュアル(空間ドメイン)を示す変換スキップレベルの統計及び信号特性にレジデュアルコーディングを適応させるために、下記の項目が修正されることができる。
(1)最後の有効スキャニングポジションが無い(no last significant scanning position):レジデュアル信号が予測以後の空間的レジデュアルを反映し、変換によるエネルギー圧縮(energy compaction)がTS(Transform Skip)に対して実行されないため、変換ブロックの右下側(bottom-right)コーナーでトレーリングゼロ(trailing zero)または有効でない(insignificant)レベルのための高い確率がそれ以上提供されない。したがって、最後の有効スキャニングポジションシグナリングは、省略されることができる。その代わりに、処理される1番目のサブブロックは、変換ブロック内で最も右下側のサブブロックである。
(2)サブブロックCBFs:最後の有効スキャニングポジションシグナリングの不在によってTSのためのcoded_sub_block_flagシンタックス要素を有するサブブロックCBFシグナリングは、下記のように修正されることができる。
-量子化によって、前述した有効でないシーケンスは、依然として変換ブロック内で局部的に(locally)発生できる。したがって、最後の有効スキャニングポジションは、前述したように除去されることができ、coded_sub_block_flagシンタックス要素は、全てのサブブロックに対してコーディングされることができる。
-DC周波数位置をカバーするサブブロック(左上段サブブロック)に対するcoded_sub_block_flagシンタックス要素は、特別なケースで示すことができる。例えば、該当サブブロックに対するcoded_sub_block_flagシンタックス要素は、シグナリングされないし、常に1に推論されることができる。最後の有効スキャニングポジションが他のサブブロックに位置する場合、DCサブブロック(DC周波数位置をカバーするサブブロック)の外に少なくとも一つの有効レベルがあることを意味することができる。結果的に、DCサブブロックは、該当サブブロックに対するcoded_sub_block_flagシンタックス要素の値が1であると推論されるが、0/有効でないレベルのみを含むことができる。TSに最後のスキャニングポジション情報がない場合、各サブブロックに対するcoded_sub_block_flagシンタックス要素がシグナリングされることができる。これは他の全てのcoded_sub_block_flagシンタックス要素の値が既に0である場合を除いて、DCサブブロックに対するcoded_sub_block_flagシンタックス要素が含まれることができる。この場合、DCサブブロックに対するcoded_sub_block_flagシンタックス要素の値が1に推論されることができる(inferDcSbCbf=1)。このDCサブブロックには少なくとも一つの有効レベルがあるべきであるため、DCサブブロック内の他の全てのsig_coeff_flagシンタックス要素の値が0である代わりに、1番目のポジション(0、0)に対するsig_coeff_flagシンタックス要素がシグナリングされないし、sig_coeff_flagシンタックス要素の値は、1に導出されることができる(inferSbDcSigCoeffFlag=1)。
-coded_sub_block_flagシンタックス要素に対するコンテキストモデリングが変更されることができる。コンテキストモデルインデックスは、現在サブブロックの代わりに、右側のcoded_sub_block_flagシンタックス要素及び下側のcoded_sub_block_flagシンタックス要素の和、並びに二つの論理和(logical disjunction)に計算されることができる。
(3)sig_coeff_flagシンタックス要素のコンテキストモデリング:sig_coeff_flagシンタックス要素のコンテキストモデリングのローカルテンプレートは、現在のスキャニングポジションの右隣(NB0)及び下隣(NB1)を含むように修正されることができる。コンテキストモデルオフセットは、有効な隣接ポジションsig_coeff_flag[NB0]+sig_coeff_flag[NB1]の個数である。したがって、現在の変換ブロック内の対角線(diagonal)dによって他のコンテキストセット(set)の選択が除去されることができる。これはsig_coeff_flagシンタックス要素をコーディングするための3個のコンテキストモデル及び単一(single)コンテキストモデルセットを引き起こすことができる。
(4)abs_level_gt1_flagシンタックス要素及びpar_level_flagシンタックス要素のコンテキストモデリング:abs_level_gt1_flagシンタックス要素及びpar_level_flagシンタックス要素には単一(single)コンテキストモデルが使われることができる。
(5)abs_remainderシンタックス要素のコーディング:変換スキップレジデュアル絶対レベルの経験的分布(empirical distribution)は、一般的に依然としてラプラシアン(laplacian)または幾何分布(geometricl distribution)に適するが、変換係数の絶対レベルより大きいインステーショナリティ(instationarity)が存在できる。特に、連続的な実現(realization)のウィンドウ内の分散(variance)は、レジデュアル絶対レベルに対してより高い。それによって、abs_remainderシンタックス要素の二進化及びコンテキストモデリングは、下記のように修正されることができる。
-二進化に一層高いカットオフ(cutoff)値を利用すること、即ち、sig_coeff_flagシンタックス要素、abs_level_gt1_flagシンタックス要素、par_level_flagシンタックス要素、及びabs_level_gt3_flagシンタックス要素に使用したコーディングからabs_remainderシンタックス要素に対するライスコード(rice code)への転換点(transition point)及び各ビンポジションに対する専用コンテキストモデルは、より一層高い圧縮効率を引き起こすことができる。カットオフを増加させることは、例えば、カットオフに到達する時までabs_level_gt5_flagシンタックス要素及びabs_level_gt7_flagシンタックス要素などを導入することのように、“Xより大きい”フラグを引き起こすことができる。カットオフ自体は、5に固定されることができる(numGtFlags=5)。
-ライスパラメータ(rice parameter)導出のためのテンプレートが修正されることができる。即ち、現在のスキャニングポジションの左隣及び下側の隣のみがsig_coeff_flagシンタックス要素のコンテキストモデリングのためのローカルテンプレートに類似するように考慮されることができる。
(6)coeff_sign_flagシンタックス要素のコンテキストモデリング:符号のシーケンス内のインステーショナリティ(instationarity)及び予測レジデュアルがよくバイアス(bias)される事実によって、グローバル経験的分布(empirical distribution)がほぼ均一に分布した場合も、符号は、コンテキストモデルを利用してコーディングされることができる。単一の専用コンテキストモデルは、符号のコーディングに使われることができ、符号は、全てのコンテキストコーディングされたビンを共に維持するためにsig_coeff_flagシンタックス要素以後にパーシングされることができる。
(7)コンテキストコーディングされたビンの減少(reduction):1番目のスキャニングパス、即ち、sig_coeff_flagシンタックス要素、abs_level_gt1_flagシンタックス要素、及びpar_level_flagシンタックス要素の送信(transmission)は、変更されない。ただし、サンプル当たりコンテキストコーディングされたビン(CCB:Context Coded Bin)の最大個数に対する限界(limit)は、除去されることができ、異なるように処理されることができる。CCBの減少は、CCB>kが有効でない(CCB<k as invalid)とモードを指定して保証されることができる。ここで、kは、正の整数である。例えば、正規レベルコーディングモードに対するkは、2であるが、これに限定されるものではない。このような限界は、量子化空間の減少に対応されることができる。
例えば、変換スキップレジデュアルコーディングシンタックスは、表20のように示すことができる。
図10は、本文書の一例に係る残差信号復号化部を示す。
一方、前記表3乃至表5または表6乃至表8を参照して説明したように、残差信号、特に、レジデュアル信号をコーディングする前に該当ブロックの変換適用可否を伝達することができる。変換ドメインでの残差信号間の相関性を表現することによってデータの圧縮(compaction)が行われ、これをデコーディング装置に伝達し、もし、残差信号間の相関性が足りない場合、データ圧縮が十分に発生しない。このような場合、複雑な計算過程を含む変換過程を省略し、ピクセルドメイン(空間ドメイン)の残差信号をデコーディング装置に伝達できる。
変換を経ないピクセルドメインの残差信号は、一般的な変換ドメインの残差信号と特性(残差信号の分布図、各残差信号の絶対値レベル(absolute level))が異なるため、以下では本文書の一実施例によってこのような信号をデコーディング装置に効率的に伝達するための残差信号コーディング方法を提案する。
図10に示すように、残差信号復号化部1000には該当変換ブロックに変換が適用されるかどうかを示す変換適用可否フラグとビットストリーム(または、コーディングされた二進化コードに対する情報)が入力されることができ、(復号化された)残差信号が出力されることができる。
変換適用可否フラグは、変換可否フラグ、変換スキップ可否フラグまたはシンタックス要素transform_skip_flagにより示すことができる。コーディングされた二進化コードは、二進化過程を経て残差信号復号化部1000に入力されることもできる。
残差信号復号化部1000は、デコーディング装置のエントロピーデコーディング部に含まれることができる。また、図10において、前記変換適用可否フラグは、説明の便宜のために、ビットストリームと区分したが、前記ビットストリームに含まれることができる。または、前記ビットストリームは、前記変換適用可否フラグだけでなく、変換係数に対する情報(変換が適用される場合、シンタックス要素transform_skip_flag=0)または残差サンプル(の値)に対する情報(変換が適用されない場合、transform_skip_flag=1)を含むことができる。前記変換係数に対する情報は、例えば、前記表3乃至表5または表6乃至表9に示す情報(または、シンタックス要素)を含むことができる。
変換スキップ可否フラグは、変換ブロック単位で送信されることができ、例えば、表3乃至表5では変換スキップ可否フラグを特定のブロック大きさに限定するが(変換ブロックの大きさが4×4以下である時のみtransform_skip_flagをパーシングする条件が含まれる)、一実施例では変換スキップ可否フラグのパーシング可否を決定するブロックの大きさを多様に構成できる。log2TbWidth及びlog2TbHeightの大きさは、変数wNとhNに決定されることができ、wN及びhNは、例えば、数式6で示す以下のうち一つの値を有することができる。
例えば、数式6による値を有するwN及びhNが適用されることができるシンタックス要素は、表21のように示すことができる。
例えば、wN及びhNは、各々、5の値を有することができ、この場合、幅が32以下であり、高さが32以下のブロックに対して前記変換スキップ可否フラグがシグナリングされることができる。または、wN及びhNは、各々、6の値を有することができ、この場合、幅が64以下であり、高さが64以下のブロックに対して前記変換スキップ可否フラグがシグナリングされることができる。例えば、wN及びhNは、数式6のように2、3、4、5または6の値を有することができ、互いに同じ値を有することもでき、互いに異なる値を有することもできる。また、wN及びhNの値に基づいて変換スキップ可否フラグがシグナリングされることができるブロックの幅及び高さが決定されることができる。
前述されたように、変換スキップ可否フラグによって、残差信号をデコーディングする方法が決定されることができる。提案する方法を介して、互いに統計的特性が異なる信号を効率的に処理することによってエントロピー復号化過程での複雑度を削減してコーディング効率を向上させることができる。
図11は、本文書の一例に係る変換スキップフラグパーシング決定部を示す。
一方、前記表3乃至表5または表6乃至表9を参照して説明したように、一実施例は、残差信号をコーディングする前に該当ブロックの変換適用可否を伝達できる。変換ドメインでの残差信号間の相関性を表現することによってデータの圧縮(compaction)が行われ、これをデコーダに伝達し、もし、残差信号間の相関性が足りない場合、データ圧縮が十分に発生しない。このような場合、複雑な計算過程を含む変換過程を省略してピクセルドメイン(空間ドメイン)の残差信号をデコーダに伝達できる。変換を経ないピクセルドメインの残差信号は、一般的な変換ドメインの残差信号と特性(残差信号の分布図、各残差信号のabsolute levelなど)が異なるため、このような信号をデコーダに効率的に伝達するための残差信号符号化方法を提案する。
変換スキップ可否フラグは、変換ブロック単位で送信されることができ、例えば、変換スキップ可否フラグのシグナリングを特定のブロック大きさに限定するが(変換ブロックの大きさが4×4以下である時のみtransform_skip_flagをパーシングする条件が含まれる)、一実施例では変換スキップ可否フラグのパーシング可否を決定する条件をブロックの幅または高さに対する情報でないブロック内のピクセルまたはサンプルの個数に定義することができる。即ち、変換スキップ可否フラグ(例えば、シンタックス要素transform_skip_flag)をパーシングするために使用する条件のうちlog2TbWidth及びlog2TbHeightの掛け算を利用すると定義することができる。または、変換スキップ可否フラグは、ブロックの幅(例えば、log2TbWidth)及び高さ(例えば、log2TbHeight)の掛け算に基づいてパーシングされることができる。または、変換スキップ可否フラグは、ブロックの幅(例えば、log2TbWidth)及び高さ(例えば、log2TbHeight)を掛けた値によってパーシング可否が決定されることができる。例えば、log2TbWidth及びlog2TbHeightは、数式7で示す以下のうち一つの値を有することができる。
一実施例によると、ブロック内のサンプルの個数に基づいて変換スキップ可否フラグのパーシング可否を決定する場合、ブロックの幅及び高さに基づいて前記パーシング可否を決定することより多様な形状のブロックを(変換スキップ可否フラグをパーシングしない)変換除外ブロックに含ませることができる。
例えば、log2TbWidth及びlog2TbHeightが全て2に定義された場合、2×4、4×2、及び4×4のブロックのみが変換除外ブロックに含まれることができるが、サンプル個数に制御する場合、ブロック内にサンプルの個数が16個以下であるブロックが変換除外ブロックに含まれるため、前記2×4、4×2、及び4×4のブロックだけでなく、2×8及び8×2大きさのブロックも変換除外ブロックに含ませることができる。
前記変換スキップ可否フラグによって残差信号をデコーディングする方法が決定されることができ、前述した実施例によって互いに統計的特性が異なる信号を効率的に処理することによってエントロピーデコーディング過程での複雑度を削減してコーディング効率を向上させることができる。
例えば、図11に示すように、変換スキップフラグパーシング決定部1100にはハイレベルシンタックス内の変換スキップ許容可否に対する情報、ブロック大きさ情報、及びMTS(Multiple Transform Selection)適用可否に対する情報が入力されることができ、変換スキップフラグが出力されることができる。または、変換スキップフラグパーシング決定部にはハイレベルシンタックス内の変換スキップ許容可否に対する情報及びブロック大きさ情報が入力されることができ、これに基づいて変換スキップフラグが出力されることもできる。即ち、前記変換スキップフラグは、前記ハイレベルシンタックス内の変換スキップ許容可否に対する情報によって変換スキップが許容される場合、前記ブロック大きさ情報に基づいて出力(または、パーシング)されることができる。前述した情報は、ビットストリームまたはシンタックスに含まれることができる。変換スキップフラグパーシング決定部1100は、デコーディング装置のエントロピーデコーディング部に含まれることができる。例えば、前述した情報に基づいて変換スキップフラグが決定される方法は、下記の通りである。
図12は、本文書の一実施例に係る変換スキップ可否フラグをコーディングする方法を説明するための流れ図である。
前述した実施例を図12を参照して再び説明すると、下記の通りである。
まず、ハイレベルシンタックス(high level syntax)内の変換スキップが許容(enable)されるかが判断されることができる(S1200)。例えば、前記ハイレベルシンタックス内の変換スキップ許容可否に対する情報(例えば、transform_skip_enabled_flagシンタックス要素)に基づいて前記ハイレベルシンタックス内の変換スキップが許容されるかが判断されることができる。例えば、前記変換スキップ許容可否に対する情報(例えば、transform_skip_enabled_flagシンタックス要素)は、SPS(sequence parameter set)でシグナリングされることができる。または、前記変換スキップ許容可否に対する情報は、SPSシンタックスに含まれてシグナリングされることができる。または、前記変換スキップ許容可否に対する情報は、PPS(picture parameter set)でまたはPPSシンタックスに含まれてシグナリングされることもできるが、これに限定されるものではない。ここで、前記ハイレベルシンタックス内の変換スキップが許容されるとは、該当ハイレベルシンタックスを参照するスライス/ブロックに変換スキップが許容されることを示すことができる。前記変換スキップが許容されるブロックに実質的に変換スキップが適用されるかどうかは、前述した変換スキップフラグに基づいて決定されることができる。
例えば、前記ハイレベルシンタックス内の変換スキップが許容される場合、シンタックス内にcu_mts_flagシンタックス要素の値が0であるかが判断されることができる(S1210)。例えば、MTS(Multiple Transform Selection)許容可否に対する情報に基づいて前記cu_mts_flagシンタックス要素の値が0であるかが判断されることができる。または、前記MTS許容可否に対する情報は、sps_mts_enabled_flagシンタックス要素に基づいて判断されることができる。
例えば、前記cu_mts_flagシンタックス要素の値が0である場合、log2TbWidth及びlog2TbHeightの掛け算が閾値(threshold)以下であるかが判断されることができる(S1220)。または、現在ブロックの幅の底が2であるログ値及び前記現在ブロックの高さの底が2であるログ値を掛けた値が前記閾値より小さいかが判断されることができる。または、現在ブロックの幅及び高さを掛けた値が閾値より小さいかが判断されることができる。例えば、前記ブロック大きさ情報に基づいてlog2TbWidth及びlog2TbHeightの掛け算が閾値(threshold)以下であるかが判断されることができる。前記ブロック大きさ情報は、前記現在ブロックの幅及び高さに対する情報を含むことができる。または、前記ブロック大きさ情報は、前記現在ブロックの幅及び高さの底が2であるログ値に対する情報を含むことができる。
例えば、前記log2TbWidth及びlog2TbHeightの掛け算が閾値以下である場合、変換スキップ可否フラグ(または、transform_skip_flagシンタックス要素)の値は、1に決定されることができる(S1230)。または、1の値を有する変換スキップ可否フラグがパーシングされることができる。または、例えば、設定または条件によって前記log2TbWidth及びlog2TbHeightの掛け算が閾値以下である場合、変換スキップ可否フラグ(または、transform_skip_flagシンタックス要素)の値は、0に決定されることができる。または、0の値を有する変換スキップ可否フラグがパーシングされることができる。または、変換スキップ可否フラグがパーシングされないこともある。即ち、前記決定される変換スキップ可否フラグの値は、一例に過ぎず、設定または条件によって変わることができる。即ち、前記変換スキップ可否フラグは、前記log2TbWidth及びlog2TbHeightの掛け算が閾値以下である場合、現在ブロックに変換スキップが適用されるという情報を示すことができる。または、前記変換スキップ可否フラグに基づいて、現在ブロックは、変換除外ブロックに含まれることができ、変換が適用されない。
例えば、前記ハイレベルシンタックス内の変換スキップが許容されない場合、前記cu_mts_flagシンタックス要素の値が0でない場合、または前記log2TbWidth及びlog2TbHeightの掛け算が閾値より大きい場合、変換スキップ可否フラグ(または、transform_skip_flagシンタックス要素)の値は、0に決定されることができる(S1240)。または、0の値を有する変換スキップ可否フラグがパーシングされることができる。または、変換スキップ可否フラグがパーシングされないこともある。または、例えば、設定または条件によって前記ハイレベルシンタックス内の変換スキップが許容されない場合、前記cu_mts_flagシンタックス要素の値が0でない場合、前記log2TbWidth及びlog2TbHeightの掛け算が閾値より大きい場合、変換スキップ可否フラグ(または、transform_skip_flagシンタックス要素)の値は、1に決定されることができる。または、1の値を有する変換スキップ可否フラグがパーシングされることができる。即ち、前記決定される変換スキップ可否フラグの値は、一例に過ぎず、設定または条件によって変わることができる。即ち、前記変換スキップ可否フラグは、ハイレベルシンタックス内の変換スキップが許容されない場合、前記cu_mts_flagシンタックス要素の値が0でない場合、前記log2TbWidth及びlog2TbHeightの掛け算が閾値より大きい場合、現在ブロックに変換スキップが適用されないという情報を示すことができる。または、前記変換スキップ可否フラグに基づいて、現在ブロックは、変換除外ブロックに含まれなく、変換が適用されることができる。
または、例えば、cu_mts_flagシンタックス要素は、MTStu_mts_flagシンタックス要素またはmts_flag要素で示すこともでき、sps_mts_enabled_flagシンタックス要素に基づいて、sps_mts_intra_enabled_flagシンタックス要素(または、sps_explicit_mts_intra_enabled_flagシンタックス要素)またはsps_mts_inter_enabled_flagシンタックス要素(または、sps_explicit_mts_inter_enabled_flagシンタックス要素)が(SPSシンタックスに含まれて)シグナリングされることができる。
一方、本文書の他の実施例では、変換可否情報を含む変換カーネルインデックス(transform kernel index)使用時、変換スキップ大きさの定義方法を提案する。
変換(または、変換コーディング)を実行しないブロックは、一般的な変換が実行されたブロックとレジデュアル(residual)データの特性が異なるため、変換が実行されないブロックのための効率的な残余データコーディング方法が要求されることができる。変換実行可否を示す変換可否フラグは、変換ブロック(transform block)または変換ユニット(transform unit)単位で送信されることができ、本文書では変換ブロックの大きさを限定しない。例えば、変換可否フラグが1である場合、本文書で提案するレジデュアル(データ)コーディング(例えば、表20と変換スキップのためのレジデュアルコーディング)が実行されることができ、変換可否フラグが0である場合、表3乃至表5または表6乃至表9のようなレジデュアルコーディングが実行されることができる。例えば、変換可否フラグは、レジデュアルコーディングシンタックスまたは変換ユニットシンタックスに含まれるtransform_skip_flagシンタックス要素を含むことができる。また、前記transform_skip_flagシンタックス要素は、値が1である場合、本文書の一実施例で提案する(変換スキップのための)レジデュアルコーディング方法が実行されることができる。
または、例えば、前記transform_skip_flagシンタックス要素の値が1である場合、if(!transform_skip_flag)条件によって変換スキップレジデュアルコーディング(residual_ts_coding)シンタックスに基づいて、変換が実行されないレジデュアルコーディングが実行されることもできる。または、前記transform_skip_flagシンタックス要素は、値が0である場合、if(!transform_skip_flag)条件によってレジデュアルコーディング(residual_coding)シンタックスに基づいて、変換が実行されるレジデュアルコーディングが実行されることができる。
または、例えば、coded_sub_block_flagシンタックス要素以下でcoeff_sign_flagシンタックス要素を除外したレジデュアルコーディングは、前記本文書の一実施例で提案する(変換スキップのための)レジデュアルコーディング方法の一部または全部に従うことができる。
または、例えば、本文書の一実施例で提案する統合変換タイプシグナリング(unified transform type signaling)方法が実行されることができ、このとき、tu_mts_idxシンタックス要素の値が1である場合(または、tu_mts_idxシンタックス要素が対象ブロックに変換が適用されないという情報を示す場合)、前記本文書の一実施例で提案する(変換スキップのための)レジデュアルコーディング方法が実行されることができる。または、tu_mts_idxシンタックス要素の値が0である場合(または、tu_mts_idxシンタックス要素の値が1でない値である場合)、表3乃至表5または表6乃至表9のようなレジデュアルコーディングまたはレジデュアルコーディング(residual_coding)シンタックスに基づいて、変換が実行されるレジデュアルコーディングが実行されることができる。この場合、本文書の一実施例で提案する統合変換タイプシグナリング(unified transform type signaling)方法と共に説明したように、表3乃至表5で変換可否フラグ(または、transform_skip_flagシンタックス要素)及び/または変換インデックス(または、mts_idxシンタックス要素)は、省略されることができる。
または、例えば、値が0であるtu_mts_idxシンタックス要素が対象ブロックに変換が適用されないこと(または、変換スキップ)を示すと仮定すると、tu_mts_idxシンタックス要素の値が0である場合、前記本文書の一実施例で提案する(変換スキップのための)レジデュアルコーディング方法が実行されることができる。または、tu_mts_idxシンタックス要素の値が0でない場合、表3乃至表5または表6乃至表9のように、レジデュアルコーディング(residual_coding)シンタックスに基づいて、変換が実行されるレジデュアルコーディングが実行されることができる。この場合、変換可否フラグ(または、transform_skip_flagシンタックス要素)及び/または変換インデックス(または、mts_idxシンタックス要素)は、省略されることができる。この場合、“tu_mts_idx==1?”判断手順または条件は、“tu_mts_idx==0?”判断手順または条件に代替されることができる。
本文書の一実施例で提案する統合変換タイプシグナリング(unified transform type signaling)方法と共に説明したように、変換可否フラグ(または、transform_skip_flagシンタックス要素)または変換インデックス(または、mts_idxシンタックス要素)に対する二進化は、例えば、表17または表18のようにMTS&TS enabled、MTS enabled及びTS enabledである場合、各々、異なるように定義されることができる。または、変換スキップが定義される大きさ(または、変換スキップが可能な大きさ)は、mts_enabledの値が0であるかまたは1であるかによって異なるように定義されることもできる。または、変換スキップが可能な大きさは、MTS enabled(または、MTSが許容されるかに対する情報)に基づいて定義されることもできる。例えば、MTS enabledは、MTSが許容されるかに対する情報を示すことができ、sps_mts_enabled_flagシンタックス要素に基づいて導出されることができる。例えば、MTS enabledの値が1であることは、sps_mts_enabled_flagシンタックス要素の値が1であることを示すことができる。または、MTS enabledの値が1であることは、MTSが許容されるという情報を示すこともできる。または、MTS enabledの値が0であることは、sps_mts_enabled_flagシンタックス要素の値が0であることを示すことができる。または、MTS enabledの値が0であることは、MTSが許容されないという情報を示すことができる。
例えば、MTS enabledの値が1である場合、変換スキップの大きさ(または、変換スキップが可能なブロックの大きさ)は、許容されたMTSに従属的である。例えば、MTSの大きさが32以下で許容される場合(または、ブロック大きさが32以下である場合にのみMTSが許容される場合)、変換スキップは、これと同じく、大きさが32以下であるブロックに対して常に定義されることができる。
または、例えば、MTS enabledの値が1である場合、エンコーディング装置及びデコーディング装置は、あらかじめ約束されたまたは既に設定された最大の大きさを使用することができる。また、前記最大の大きさによってTS enabledが定義されることができる。例えば、エンコーディング装置及びデコーディング装置は、一辺の長さが8以下のブロックに対して変換スキップを使用するように定義することができる。この場合、ブロックの一辺の長さが8より大きいブロックに対してはTS enabledの値が0に定義されることによって前記表17または表18の二進化テーブルを有効に適用できる。または、ブロックの一辺の最大長でない最大サンプルの個数を利用して変換スキップブロック(または、変換スキップが可能な)の最大の大きさ情報を示すこともできる。
または、例えば、MTS enabledの値が1である場合、MTSの大きさ(または、MTSが許容されるブロックの大きさ)とは別途に変換スキップ(または、変換スキップが可能なブロック)の最大の大きさが定義されることができる。この場合、MTSの大きさ(または、MTSが許容されるブロックの大きさ)を定義するために変換スキップ(または、変換スキップが可能なブロック)の大きさに対する情報がシグナリングされることができる。または、エンコーディング装置からデコーディング装置に送信されることができる。例えば、MTSの大きさが32以下で許容される場合(または、ブロック大きさが32以下である場合にのみMTSが許容される場合)、MTSの大きさ(または、MTSが許容されるブロックの大きさ)に従うかどうかに対するフラグをシグナリングすることができ、MTSの最大の大きさ(または、MTSが許容されるブロックの最大の大きさ)に従わない場合、変換スキップ(または、変換スキップが可能なブロック)の最大の大きさを16まで許容するようにする情報をシグナリングすることができる。この場合、ブロック一辺の長さが16以上である場合、TS enabledの値が0に定義されることで、前記表17または表18の二進化テーブルを有効に適用できる。または、ブロックの一辺の最大の大きさでない最大サンプルの個数を利用して変換スキップブロック(または、変換スキップが可能な)の最大の大きさ情報を示すこともできる。
または、例えば、MTS enabledの値が0である場合、エンコーディング装置及びデコーディング装置は、あらかじめ約束されたまたは既に設定された最大の大きさを使用することができる。例えば、MTS enabledの値が0であり、且つTS enabledの値が1である場合、エンコーディング装置及びデコーディング装置は、一辺の長さが8以下のブロックに対して変換スキップを使用するように定義することができる。または、ブロックの一辺の最大の大きさでない最大サンプルの個数を利用して変換スキップブロック(または、変換スキップが可能な)の最大の大きさ情報を示すこともできる。
または、例えば、MTS enabledの値が0である場合、変換スキップ(または、変換スキップが可能なブロック)の最大の大きさ情報を送信することができる。例えば、変換スキップ(または、変換スキップが可能なブロック)の最大の大きさを16まで許容するようにする情報をハイレベルシンタックス(high level syntax)でシグナリングできる。この場合、ブロックの一辺の長さが16以上である場合、TS enabledの値が0に定義されることによって前記表17または表18の二進化テーブルを有効に適用できる。または、ブロックの一辺の最大の大きさでない最大サンプルの個数を利用して変換スキップブロック(または、変換スキップが可能な)の最大の大きさ情報を示すこともできる。
例えば、前記tu_mts_idxシンタックス要素は、前述したCABACに基づいてエンコーディング/デコーディングされることができる。この場合、前記tu_mts_idxシンタックス要素のビンストリング(bin string)は、例えば、前記表17または表18で示すようなビンを含むことができる。前記tu_mts_idxシンタックス要素のビンストリングのビンのうち少なくとも一つは、コンテキスト情報(または、コンテキストモデル)に基づいてコーディング(または、正規コーディング)されることができる。
前記正規コーディングされるビンの各々に対するコンテキストモデルを示すコンテキストインデックスは、コンテキストインデックス増分及びコンテキストインデックスオフセットに基づいて導出されることができる。または、例えば、コンテキストインデックスはctxIdxで示すことができ、コンテキストインデックス増分(context index increment)はctxIncで示すことができ、コンテキストインデックスオフセット(context index offset)はctxIdxOffsetで示すことができる。また、ctxIdxは、ctxInc及びctxIdxOffsetの和に導出されることができる。例えば、前記ctxIncは、前記表19で示すように、各ビン別に異なるように導出されることができる。前記ctxIdxOffsetは、前記ctxIdxの最小値(the lowest value)を示すことができる。または、例えば、前記表19で示すように、cqtDepth(coded quad-tree depth)に基づいてコンテキストインデックスが決定されることができる。または、例えば、ブロックの大きさ、ブロックの幅-高さの比率、ブロックのイントラまたはインター予測可否、隣接の変換スキップ可否などによって、コンテキストインデックスが決定されることができる。
例えば、ブロックの大きさが8×8より小さい場合、インデックス0番のコンテキストモデルを使用することができ、8×8より大きいまたは同じである場合、インデックス1番のコンテキストモデルを使用することができる。
または、例えば、ブロックの幅-高さの比率が1である場合、インデックス0番のコンテキストモデルを使用することができ、ブロックの幅がブロックの高さより大きい場合、インデックス1番のコンテキストモデルを使用することができ、ブロックの高さがブロックの幅より大きい場合、インデックス2番のコンテキストモデルを使用することができる。この場合、例えば、ブロックの幅及び高さに基づいて決定されるコンテキストインデックスは、以下の表22の通りである。
または、例えば、現在ブロックの予測モードがイントラモードである場合、インデックス0番のコンテキストモデルを使用することができ、インターモードである場合、インデックス1番のコンテキストモデルを使用することができる。
例えば、前記tu_mts_idxシンタックス要素は、前述したように決定されたインデックスによるコンテキストモデルを利用してコーディングされることができる。コンテキストモデル及びモデルの個数は、確率及び分布に基づいて多様に定義されるできるため、本文書では特定コンテキストモデル及びコンテキストモデルの個数に限定されない。
例えば、前記インデックスは、コンテキストインデックスを示すことができ、インデックス0番は、ctxIdx値が0であることを示すことができ、インデックス1番は、ctxIdx値が1であることを示すことができる。
例えば、前記ctxIdxの最小値は、前記ctxIdxの初期値(initValue)で示すことができ、前記ctxIdxの初期値は、コンテキストテーブルに基づいて決定されることができる。または、前記ctxIdxの初期値は、前記コンテキストテーブル及び初期タイプ(initType)を利用して決定されることができる。前記初期タイプは、あらかじめ決定されることができる。または、前記初期タイプは、関連情報がシグナリングされて決定されることもできる。例えば、前記初期タイプは、初期タイプ情報(例えば、cabac_init_flagシンタックス要素またはcabac_init_idxシンタックス要素)によってシグナリングされることができる。
即ち、前記tu_mts_idxシンタックス要素のビンストリングのビンは、各ビンに対するコンテキストモデルに基づいてコンテキストベースでコーディング(または、正規コーディング)されることができる。この場合、前記コンテキストモデルは、前記ctxInc及びctxIdxOffsetの和に導出されることができる。また、前記ctxIncは、各ビン別に異なるように決定されることができる。
例えば、エンコーディング装置は、前記tu_mts_idxシンタックス要素の値を導出し、二進化手順を介して前記値に対応する二進化ビンを導出することができ、前記ビンの各々に対するコンテキストモデルを導出して前記ビンをエンコーディングすることができる。この場合、前記コンテキストモデルに基づく算術コーディング(arithmetic coding)によって前記ビンの長さと同一または短い長さのビット列(bitstring)が出力されることができる。
例えば、デコーディング装置は、前記tu_mts_idxシンタックス要素に対する二進化手順を介して候補ビンストリングを導出し、ビットストリームから前記tu_mts_idxシンタックス要素に対するビットを順次にパーシングし、前記tu_mts_idxシンタックス要素に対するビンをデコーディングすることができる。この場合、デコーディング装置は、前記ビンの各々に対するコンテキストモデルを導出して前記ビンをデコーディングすることができる。前記デコーディングされたビンは、前記候補ビンストリングのうち一つに対応するかが判断されることができる。前記デコーディングされたビンが前記候補ビンストリングのうち一つに対応される場合、デコーディング装置は、前記対応されるビンストリングが示す値を前記tu_mts_idxシンタックス要素の値に導出することができる。前記デコーディングされたビンが前記候補ビンストリングのうち一つに対応されない場合、デコーディング装置は、ビットを追加的にパーシングして前述した手順を繰り返しすることができる。
前述したように、本文書の一実施例は、tu_mts_idxシンタックス要素をコーディングすることにあたって、ブロックの大きさ、ブロックの幅-高さの比率、ブロックのイントラまたはインター予測可否または隣接の変換スキップ可否などのうち少なくとも一つに基づいてctxInc及び/またはctxIdxを異なるように決定でき、この場合、追加的な情報のシグナリング無しで同じビンインデックス(binIdx)のビンに対して他のコンテキストモデルを適応的に適用できる。
例えば、現在ピクチャ内の第1のブロックに対するi番目のビンに対しては、第1のコンテキスト情報を導出し、前記現在ピクチャ内の第2のブロックに対する同じi番目のビンに対しては、第2のコンテキスト情報を導出することができる。ここで、iは、ビンインデックスに対応されることができ、例えば、前記表19または表22で示すように0乃至4のうち一つの値を示すことができる。例えば、前記コンテキスト情報は、コンテキストインデックスまたはコンテキストモデルに対する情報を含むことができる。
一方、例えば、本文書の前述した実施例による情報のうち少なくとも一部は、表23乃至表27のようにハイレベル(high-level)シンタックスに含まれることができる。または、ハイレベルシンタックスに含まれてシグナリングされることができる。または、前述した実施例による情報のうち少なくとも一部は、SPS(sequence parameter set)シンタックスに含まれることができる。または、SPSシンタックスに含まれてシグナリングされることができる。例えば、表23乃至表27は、一つのシンタックスを連続して示すことができ、シンタックスに含まれているシンタックス要素は、順次に、シグナリング、構成またはパーシングされることができる。
例えば、表23乃至表27のようにSPSシンタックスに含まれているシンタックス要素が示す情報または前記シンタックス要素のセマンティックスは、表28乃至表35のように示すことができる。
一方、例えば、本文書の前述した実施例による情報のうち少なくとも一部は、表36または表37乃至表39のようにハイレベル(high-level)シンタックスに含まれることができる。または、ハイレベルシンタックスに含まれてシグナリングされることができる。または、前述した実施例による情報のうち少なくとも一部は、PPS(picuture parameter set)シンタックスに含まれることができる。または、PPSシンタックスに含まれてシグナリングされることができる。例えば、表37乃至表39は、一つのシンタックスを連続して示すことができ、シンタックスに含まれているシンタックス要素は、順次に、シグナリング、構成またはパーシングされることができる。
例えば、表36または表37乃至表39のようにPPSシンタックスに含まれているシンタックス要素が示す情報または前記シンタックス要素のセマンティックスは、表40乃至表42のように示すことができる。
一方、例えば、本文書の前述した実施例による情報のうち少なくとも一部は、表43乃至表47のようにコーディングユニット(coding unit)シンタックスに含まれることができる。または、コーディングユニットシンタックスに含まれてシグナリングされることができる。例えば、表43乃至表47は、一つのシンタックスを連続して示すことができ、シンタックスに含まれているシンタックス要素は、順次に、シグナリング、構成またはパーシングされることができる。
例えば、表43乃至表47のようにコーディングユニットシンタックスに含まれているシンタックス要素が示す情報または前記シンタックス要素のセマンティックスは、表48乃至表51のように示すことができる。
一方、例えば、本文書の前述した実施例による情報のうち少なくとも一部は、表52または表53乃至表54のように変換ユニット(transform unit)シンタックスに含まれることができる。または、変換ユニットシンタックスに含まれてシグナリングされることができる。例えば、表53乃至表54は、一つのシンタックスを連続して示すことができ、シンタックスに含まれているシンタックス要素は、順次に、シグナリング、構成またはパーシングされることができる。
例えば、表52または表53乃至表54のように変換ユニットシンタックスに含まれているシンタックス要素が示す情報または前記シンタックス要素のセマンティックスは、表55のように示すことができる。
一方、例えば、本文書の前述した実施例による情報のうち少なくとも一部は、前述した表6乃至表9または表56乃至表59のように、レジデュアルコーディング(residual coding)シンタックスに含まれることができる。または、変換ユニットシンタックスに含まれてシグナリングされることができる。例えば、表6乃至表9または表56乃至表59は、一つのシンタックスを連続して示すことができ、シンタックスに含まれているシンタックス要素は、順次に、シグナリング、構成またはパーシングされることができる。
例えば、前述した表6乃至表9または表56乃至表59のように、レジデュアルコーディングシンタックスに含まれているシンタックス要素が示す情報または前記シンタックス要素のセマンティックスは、表6乃至表9と共に前述したように示すことができる。
一方、例えば、本文書の一実施例は、前述したシンタックスまたはシンタックス要素のうち少なくとも一部に基づいてスケーリングまたは変換手順を実行することができる。例えば、一実施例は、表60のように現在(変換)ブロックのサンプルに対するレジデュアルサンプル(または、レジデュアルサンプルアレイ)を導出することができる。
一方、または、例えば、本文書の一実施例は、前述したシンタックスまたはシンタックス要素のうち少なくとも一部に基づいて変換係数に対する変換手順を実行することができる。例えば、一実施例は、表61のように(スケールされた)変換係数に対する情報に基づいてレジデュアルサンプル(または、レジデュアルサンプルアレイ)を導出することができる。
一方、例えば、本文書の一実施例は、前述したシンタックスまたはシンタックス要素のうち少なくとも一部に対して表62乃至表63のような二進化が利用されることができる。または、一実施例は、表62乃至表63のような二進化を利用して前述したシンタックス要素のうち少なくとも一部をエンコーディング/デコーディングすることができる。
一方、例えば、本文書の一実施例は、前述したシンタックスまたはシンタックス要素のうち少なくとも一部に対して表64乃至表65のようにコンテキストインデックス(ctxIdx)を導出するために(または、示すために)コンテキストインデックス増分(ctxInc)を割り当てることができる。
図13及び図14は、本文書の実施例によるビデオ/映像エンコーディング方法及び関連コンポーネントの一例の概略を示す。
図13に開示された方法は、図2に開示されたエンコーディング装置により実行されることができる。具体的に、例えば、図13のS1300は、図14で前記エンコーディング装置の予測部220により実行されることができ、図13のS1310は、図14で前記エンコーディング装置のレジデュアル処理部230により実行されることができ、図13のS1320は、図14で前記エンコーディング装置のエントロピーエンコーディング部240により実行されることができる。図13に開示された方法は、本文書で前述した実施例を含むことができる。
図13を参照すると、エンコーディング装置は、現在ブロックに対して予測を実行して予測サンプルを導出することができる(S1300)。例えば、エンコーディング装置は、前記現在ブロックに対して予測を実行して予測サンプルを導出することができ、予測を実行した予測モードに対する情報を導出することができる。例えば、予測モードは、イントラ予測モードまたはインター予測モードである。例えば、エンコーディング装置は、前記予測モードがイントラ予測モードである場合、現在ブロック隣接のサンプルに基づいて前記予測サンプルを導出することができる。または、エンコーディング装置は、前記予測モードがインター予測モードである場合、現在ブロックの参照ピクチャ内の参照サンプルに基づいて前記予測サンプルを導出することができる。
エンコーディング装置は、前記現在ブロックに対するレジデュアルサンプルを導出することができる(S1310)。例えば、エンコーディング装置は、前記現在ブロックに対する原本サンプルと予測サンプル(または、予測されたブロック)に基づいて前記現在ブロックに対するレジデュアルサンプル(または、レジデュアルブロック)を導出することができる。ここで、レジデュアルサンプルは、レジデュアルサンプルアレイと示すこともできる。または、例えば、図13に示していないが、エンコーディング装置は、前記予測サンプル及び前記レジデュアルサンプルに基づいて前記現在ブロックの復元サンプルを生成することができる。例えば、エンコーディング装置は、前記予測サンプル(または、予測されたブロック)にレジデュアルサンプル(または、レジデュアルブロック)を加算して復元サンプル(または、復元ブロック)を生成することもできる。
エンコーディング装置は、前記予測に対する予測モード情報及び前記レジデュアルサンプルに対するレジデュアル関連情報を含む映像情報をエンコーディングすることができる(S1320)。
例えば、エンコーディング装置は、前記予測モードに基づいて予測モード情報を生成することができ、前記映像情報は前記予測モード情報を含むことができる。即ち、前記現在ブロックがイントラ予測モードを介して予測を実行した場合、予測モード情報は、イントラ予測モードに対する情報を含むことができ、前記現在ブロックがインター予測モードを介して予測を実行した場合、予測モード情報は、インター予測モードに対する情報を含むことができる。
例えば、エンコーディング装置は、前記レジデュアルサンプル(または、レジデュアルサンプルアレイ)に対する情報を含むレジデュアル関連情報を生成することができ、前記映像情報は、レジデュアル関連情報を含むことができる。レジデュアルサンプルに対する情報またはレジデュアル関連情報は、前記レジデュアルサンプルに対する変換係数に対する情報を含むことができる。
例えば、レジデュアル関連情報は、レジデュアルコーディング情報(または、レジデュアルコーディングシンタックス)を含むことができる。または、レジデュアル関連情報は、変換ユニット情報(または、変換ユニットシンタックス)を含むことができる。または、レジデュアル関連情報は、レジデュアルコーディング情報及び変換ユニット情報を含むこともできる。
例えば、前記現在ブロックのサイズ及び最大変換スキップサイズに基づいて、前記レジデュアル関連情報が前記変換スキップフラグを含むことができる。または、前記現在ブロックのサイズ及び最大変換スキップサイズに基づいて、前記レジデュアル関連情報が変換スキップフラグを含むかどうかが決定されることができる。例えば、前記変換スキップフラグは、前記現在ブロックに変換スキップが適用されるかどうかを示すことができる。または、前記変換スキップフラグは、transform_skip_flagシンタックス要素で示すこともできる。例えば、前記transform_skip_flagシンタックス要素の値が0である場合、前記現在ブロックに変換スキップが適用され、1である場合、前記現在ブロックに変換スキップが適用されない。または、設定によって、前記transform_skip_flagシンタックス要素の値が1である場合、前記現在ブロックに変換スキップが適用され、0である場合、前記現在ブロックに変換スキップが適用されない。
例えば、前記現在ブロックのサイズは、前記現在ブロックの幅及び/または前記現在ブロックの高さを示すことができる。前記最大変換スキップサイズは、変換スキップ(TS:Transform Skip)が許容されるブロックの最大の大きさを示すことができる。または、前記最大変換スキップサイズは、MaxTsSizeで示すこともできる。例えば、前記現在ブロックの幅または前記現在ブロックの高さが前記最大変換スキップサイズ以下である場合、前記レジデュアル関連情報が前記変換スキップフラグを含むことができる。
例えば、前記映像情報は、前記最大変換スキップサイズに対する情報を含むことができる。または、前記最大変換スキップサイズに対する情報は、前記映像情報に含まれて(エントロピー)エンコーディングされることができる。例えば、前記最大変換サイズは、前記最大変換スキップサイズに対する情報に基づいて示すことができる。例えば、前記最大変換スキップサイズに対する情報は、ハイレベル(high-level)シンタックスに含まれることができ、前記ハイレベルシンタックスは、映像情報に含まれて(エントロピー)エンコーディングされることができる。例えば、ハイレベルシンタックスは、NAL(Network Abstraction Layer)ユニットシンタックス、SPS(Sequence Parameter Set)シンタックス、PPS(Picture Parameter Set)シンタックスまたはスライスヘッダ(slice header)シンタックスである。
または、例えば、前記最大変換スキップサイズに対する情報は、SPSに含まれることができ、前記最大変換サイズは、前記SPSに含まれている前記最大変換スキップサイズに対する情報に基づいて示すことができる。または、例えば、前記最大変換スキップサイズに対する情報は、PPSに含まれることができ、前記最大変換サイズは、前記PPSに含まれている前記最大変換スキップサイズに対する情報に基づいて示すことができる。ここで、SPSまたはPPSは、SPSシンタックスまたはPPSシンタックスを示すことができ、他のシンタックスもシンタックスという用語を省略して使われることができる。
例えば、前記最大変換スキップサイズに対する情報は、ログ値に-2した値に対する情報を含むことができ、前記ログ値は、前記最大変換スキップサイズに対する底が2であるログ値である。即ち、前記最大変換スキップサイズに対する情報は、前記最大変換スキップサイズの底が2であるログ値に-2した値に対する情報を示すことができる。または、例えば、前記最大変換スキップサイズに対する情報は、前記最大変換スキップサイズの(底が2である)ログ値に対する情報を含むこともできる。
例えば、前記最大変換スキップサイズに対する情報は、log2_transform_skip_max_size_minus2シンタックス要素を含むことができる。または、前記最大変換スキップサイズに対する情報は、log2_transform_skip_max_size_minus2シンタックス要素を示すことができる。例えば、前記log2_transform_skip_max_size_minus2シンタックス要素は、ハイレベルシンタックス、SPSシンタックスまたはPPSシンタックスに含まれることができる。
例えば、表41を参照すると、前記最大変換スキップサイズは、MaxTsSize=1<<(log2_transform_skip_max_size_minus2+2)に基づいて示すことができる。ここで、前記MaxTsSizeは、前記最大変換スキップサイズを示すことができ、前記log2_transform_skip_max_size_minus2は、前記log2_transform_skip_max_size_minus2シンタックス要素の値を示すことができる。また、前記<<は、算術シフト演算子を示すことができる。即ち、前記log2_transform_skip_max_size_minus2シンタックス要素は、MaxTsSize=1<<(log2_transform_skip_max_size_minus2+2)を利用してMaxTsSizeを示すことができる。または、MaxTsSizeによるlog2_transform_skip_max_size_minus2シンタックス要素の値を示すことができる。または、MaxTsSizeに対応するlog2_transform_skip_max_size_minus2シンタックス要素の値を示すことができる。例えば、前記log2_transform_skip_max_size_minus2シンタックス要素の値は、0乃至3の候補値のうち一つに示されるが、これに限定されるものではない。または、前記log2_transform_skip_max_size_minus2シンタックス要素の値は、0、1、2または3で示すことができるが、これに限定されるものではない。
また、例えば、前記最大変換スキップサイズは、4、8、16または32を含む候補サイズのうち一つに導出される。前記最大変換スキップサイズは、前記log2_transform_skip_max_size_minus2シンタックス要素の値に基づいて示すことができる。または、前記最大変換スキップサイズは、前記log2_transform_skip_max_size_minus2シンタックス要素の値に基づいて4、8、16または32を含む候補サイズのうち一つに導出される。例えば、前記log2_transform_skip_max_size_minus2シンタックス要素の値が0である場合、前記最大変換スキップサイズは、前述した1<<(log2_transform_skip_max_size_minus2+2)に基づいて4で示すことができる。または、前記log2_transform_skip_max_size_minus2シンタックス要素の値が1である場合、前記最大変換スキップサイズは、前述した1<<(log2_transform_skip_max_size_minus2+2)に基づいて8で示すことができる。または、前記log2_transform_skip_max_size_minus2シンタックス要素の値が2である場合、前記最大変換スキップサイズは、前述した1<<(log2_transform_skip_max_size_minus2+2)に基づいて16で示すことができる。または、前記log2_transform_skip_max_size_minus2シンタックス要素の値が3である場合、前記最大変換スキップサイズは、前述した1<<(log2_transform_skip_max_size_minus2+2)に基づいて32で示すことができる。
例えば、最大変換スキップサイズがNであるということは、幅及び高さが全てN以下のサイズを示すことができる。または、最大変換スキップサイズがNであるということは、幅及び高さのうち大きい値がN以下のサイズを示すことができる。または、最大変換スキップサイズがNであるということは、正方形ブロックの場合、一辺の長さがN以下のサイズを示すことができる。
または、例えば、前記最大変換スキップサイズに対する情報は、変換スキップが許容されるかに対する情報に基づいてハイレベルシンタックス、SPSシンタックスまたはPPSシンタックスに含まれることもできる。例えば、前記変換スキップが許容されるかに対する情報が、変換スキップが許容される情報を示す場合、前記最大変換スキップサイズに対する情報は、ハイレベルシンタックス、SPSシンタックスまたはPPSシンタックスに含まれる。または、前記変換スキップが許容されるかに対する情報が、変換スキップが許容されないという情報を示す場合、前記最大変換スキップサイズに対する情報は、ハイレベルシンタックス、SPSシンタックスまたはPPSシンタックスに含まれない。
または、例えば、前記最大変換スキップサイズは、MTS(Multiple Tranform Selection)が許容されるかに対する情報に基づいて示すこともできる。または、MTSが許容されるかに対する情報及びTSが許容されるかに対する情報に基づいて前記最大変換スキップサイズを示すことができる。
例えば、前記ハイレベルシンタックスは、MTS(Multiple Tranform Selection)が許容されるかに対する情報またはTSが許容されるかに対する情報を含むことができる。または、MTSが許容されるかに対する情報または前記TSが許容されるかに対する情報は、SPSシンタックスまたはPPSシンタックスに含まれることができる。
例えば、前記MTSが許容されるかに対する情報は、sps_mts_enabled_flagシンタックス要素で示すことができる。または、前記MTSが許容されるかに対する情報は、sps_mts_intra_enabled_flagシンタックス要素またはsps_mts_inter_enabled_flagシンタックス要素を含むことができる。例えば、前記sps_mts_intra_enabled_flagシンタックス要素またはsps_mts_inter_enabled_flagシンタックス要素は、前記sps_mts_enabled_flagシンタックス要素に基づいて前記SPSシンタックスに含まれることができる。前記sps_mts_intra_enabled_flagシンタックス要素は、sps_explicit_mts_intra_enabled_flagシンタックス要素で示すことができ、前記sps_mts_inter_enabled_flagシンタックス要素は、sps_explicit_mts_inter_enabled_flagシンタックス要素で示すことができる。例えば、前記MTSが許容されるかに対する情報は、MTS enabled情報で示すこともできる。
例えば、前記MTSが許容されるかに対する情報が、前記MTSが許容されるという情報を示す場合、MTS enabled=1または前記sps_mts_enabled_flagシンタックス要素の値が1であると示すことができる。または、前記sps_mts_enabled_flagシンタックス要素の値が1であり、sps_explicit_mts_intra_enabled_flagシンタックス要素またはsps_explicit_mts_inter_enabled_flagシンタックス要素の値が1であると示すことができる。または、前記MTSが許容されるかに対する情報が、前記MTSが許容されないという情報を示す場合、MTS enabled=0または前記sps_mts_enabled_flagシンタックス要素の値が0であると示すことができる。または、前記sps_mts_enabled_flagシンタックス要素の値が1であり、sps_explicit_mts_intra_enabled_flagシンタックス要素またはsps_explicit_mts_inter_enabled_flagシンタックス要素の値が0であると示すことができる。例えば、設定によって、前記値は、前記値に対応する情報を逆に示すこともできる。
例えば、前記TSが許容されるかに対する情報は、TS enabled情報またはsps_transform_skip_enabled_flagシンタックス要素で示すことができる。例えば、前記TSが許容されるかに対する情報は、TS enabled情報で示すこともできる。
例えば、前記TSが許容されるかに対する情報が、前記TSが許容されるという情報を示す場合、TS enabled=1または前記sps_transform_skip_enabled_flagシンタックス要素の値が1であると示すことができる。または、前記TSが許容されるかに対する情報が、前記TSが許容されないという情報を示す場合、TS enabled=0または前記sps_transform_skip_enabled_flagシンタックス要素の値が0であると示すことができる。例えば、設定によって、前記値は、前記値に対応する情報を逆に示すこともできる。
例えば、前記最大変換スキップサイズは、前記ハイレベルシンタックスに基づいて8、16及び32を含む候補サイズのうち一つに導出される。例えば、候補サイズは、4をさらに含むことができる。または、例えば、前記変換スキップサイズは、MTSが許容されるかに対する情報に基づいて導出されることができる。または、例えば、前記最大変換スキップサイズは、MTSが許容されるかに対する情報に基づいて8、16または32を含む候補サイズのうち一つに導出される。または、前記変換スキップサイズは、前記ハイレベルシンタックスに含まれている前記MTSが許容されるかに対する情報に基づいて導出される。または、例えば、前記変換スキップサイズに対する情報が前記ハイレベルシンタックスに含まれることができ、前記変換スキップサイズは、前記変換スキップサイズに対する情報に基づいて示すことができる。ここで、前記変換スキップサイズに対する情報は、前記変換スキップサイズを導出することができる情報であって、前記MTSが許容されるかに対する情報を含むこともできる。
例えば、前記MTSが許容されるという情報を示す前記MTSが許容されるかに対する情報に基づいて、前記最大変換スキップサイズは、前記MTSのサイズに基づいて決定されることができる。即ち、前記MTSが許容されるかに対する情報が、前記MTSが許容されるという情報を示す場合、前記最大変換スキップサイズは、前記MTSのサイズに基づいて決定されることができる。即ち、前記最大変換スキップサイズは、前記MTSに従属的である。前記MTSのサイズは、MTSが許容されるブロックの最大サイズを示すことができる。例えば、前記MTSのサイズが32以下である場合、変換スキップも32以下のサイズのブロックに対して許容されることができる。
または、例えば、前記MTSが許容されるという情報を示す前記MTSが許容されるかに対する情報に基づいて、前記最大変換スキップサイズは、既に設定されたサイズに決定されることができる。即ち、前記MTSが許容されるかに対する情報が、前記MTSが許容されるという情報を示す場合、前記最大変換スキップサイズは、既に設定されたサイズに決定されることができる。例えば、既に設定されたサイズが8である場合、前記最大変換スキップサイズは、前記既に設定されたサイズ8に決定されることができる。
または、例えば、前記MTSが許容されるという情報を示す前記MTSが許容されるかに対する情報に基づいて、前記ハイレベルシンタックスは、前記最大変換スキップサイズに対する情報を含むことができ、前記最大変換スキップサイズは、前記最大変換スキップサイズに対する情報に基づいて示すことができる。即ち、前記MTSが許容されるかに対する情報が、前記MTSが許容されるという情報を示す場合、前記ハイレベルシンタックスは、前記最大変換スキップサイズに対する情報を別途に含むことができ、前記最大変換スキップサイズは、前記最大変換スキップサイズに対する情報に基づいて示すことができる。または、例えば、前記MTSが許容されるかに対する情報が、前記MTSが許容されるという情報を示す場合、前記ハイレベルシンタックスは、前記最大変換スキップサイズが前記MTSのサイズに基づいて導出される情報を含むことができる。前記最大変換スキップサイズが前記MTSのサイズに基づいて導出される情報が、前記最大変換スキップサイズが前記MTSのサイズに基づいて導出される情報を示す場合、前記ハイレベルシンタックスは、前記最大変換スキップサイズに対する情報を含むことができる。前記最大変換スキップサイズに対する情報は、SPSシンタックスまたはPPSシンタックスに含まれることができる。例えば、ハイレベルシンタックスに含まれている前記最大変換スキップサイズに対する情報が32に対する情報を示す場合、前記最大変換スキップサイズは、前記最大変換スキップサイズに対する情報に基づいて32で示すことができる。または、最大変換スキップサイズを32に決定した場合、前記ハイレベルシンタックスに含まれている前記最大変換スキップサイズに対する情報を32に対する情報で示すことができる。
または、例えば、前記MTSが許容されないという情報を示す前記MTSが許容されるかに対する情報に基づいて、前記最大変換スキップサイズは、既に設定されたサイズに決定されることができる。即ち、前記MTSが許容されるかに対する情報が、前記MTSが許容されないという情報を示す場合、前記最大変換スキップサイズは、既に設定されたサイズに決定されることができる。例えば、既に設定されたサイズが8である場合、前記最大変換スキップサイズは、前記既に設定されたサイズ8に決定されることができる。
または、例えば、前記MTSが許容されないという情報を示す前記MTSが許容されるかに対する情報に基づいて、前記ハイレベルシンタックスは、前記最大変換スキップサイズに対する情報を含むことができ、前記最大変換スキップサイズは、前記最大変換スキップサイズに対する情報に基づいて示すことができる。即ち、前記MTSが許容されるかに対する情報が、前記MTSが許容されないという情報を示す場合、前記ハイレベルシンタックスは、前記最大変換スキップサイズに対する情報を別途に含むことができ、前記最大変換スキップサイズは、前記最大変換スキップサイズに対する情報に基づいて示すことができる。前記最大変換スキップサイズに対する情報は、SPSシンタックスまたはPPSシンタックスに含まれることができる。例えば、ハイレベルシンタックスに含まれている前記最大変換スキップサイズに対する情報が32に対する情報を示す場合、前記最大変換スキップサイズは、前記最大変換スキップサイズに対する情報に基づいて32で示すことができる。または、最大変換スキップサイズを32に決定した場合、前記ハイレベルシンタックスに含まれている前記最大変換スキップサイズに対する情報を32に対する情報で示すことができる。
例えば、前記レジデュアル関連情報は、前記現在ブロックに適用する変換タイプに対するMTSインデックス情報を含むことができる。例えば、MTSインデックス情報は、tu_mts_idxシンタックス要素またはmts_idxシンタックス要素で示すことができる。例えば、MTSインデックス情報は、変換ユニットシンタックスまたはコーディングユニットシンタックスに含まれることができる。例えば、MTSインデックス情報は、前記現在ブロックに適用する変換タイプまたは変換スキップに対する情報を示すことができる。または、前記MTSインデックス情報は、前記MTSが許容されるかに対する情報及び/または前記変換スキップが許容されるかに対する情報に基づいて前記現在ブロックに適用する変換タイプまたは変換スキップに対する情報を示すことができる。
例えば、前記MTSインデックス情報が示す情報は、前記MTSインデックス情報に対するビンストリングのビンに基づいて示すことができる。または、前記MTSインデックス情報が示す情報は、前記ビンのコンテキストインデックスの値に基づいて示すことができる。または、前記MTSインデックス情報が示す情報は、前記ビンストリングの1番目のビンのコンテキストインデックス値に基づいて示すことができる。例えば、コンテキストインデックス(ctxIdx)は、コンテキストインデックス増分(ctxInc)及びコンテキストインデックスオフセット(ctxIdxOffset)に基づいて示すことができる。
例えば、前記MTSインデックス情報に対する1番目のビンのコンテキストインデックスの値は、前記MTSが許容されるかに対する情報、前記変換スキップが許容されるかに対する情報、及び前記現在ブロックのサイズに基づいて示すことができる。例えば、前記MTSインデックス情報に対する1番目のビンのコンテキストインデックスの値は、表19または表22に基づいて示すことができる。
例えば、前記MTSが許容されるという情報を示す前記MTSが許容されるかに対する情報及び前記変換スキップが許容されるという情報を示す前記変換スキップが許容されるかに対する情報に基づいて、前記コンテキストインデックスの値は、前記現在ブロックの幅及び前記現在ブロックの高さを比較して示すことができる。即ち、前記MTSが許容されるかに対する情報が、前記MTSが許容されるという情報を示し、且つ前記TSが許容されるかに対する情報が、前記TSが許容されるという情報を示す場合、前記現在ブロックの幅及び前記現在ブロックの高さを比較して示すことができる。または、前記現在ブロックの幅及び前記現在ブロックの高さが同じ場合、前記コンテキストインデックスの値は、0で示すことができる。または、前記現在ブロックの幅が前記現在ブロックの高さより大きい場合、前記コンテキストインデックスの値は、1で示すことができ、前記現在ブロックの幅が前記現在ブロックの高さより小さい場合、前記コンテキストインデックスの値は、2で示すことができる。
または、例えば、前記MTSが許容されるという情報を示す前記MTSが許容されるかに対する情報及びcqtDepth(coded quad-tree depth)に基づいて、前記コンテキストインデックスの値を示すことができる。即ち、前記MTSが許容されるかに対する情報が、前記MTSが許容されるという情報を示す場合、cqtDepthに基づいて前記コンテキストインデックスの値を示すことができる。例えば、前記コンテキストインデックスの値は、前記cqtDepthの値に1を加算した値で示すことができ、1、2、3、4、5または6で示すことができる。
または、例えば、前記変換スキップが許容されるという情報を示す前記変換スキップが許容されるかに対する情報に基づいて、前記コンテキストインデックスの値は、前記現在ブロックの幅及び前記現在ブロックの高さを比較して示すことができる。即ち、前記TSが許容されるかに対する情報が、前記TSが許容されるという情報を示す場合、前記現在ブロックの幅及び前記現在ブロックの高さを比較して示すことができる。または、前記現在ブロックの幅及び前記現在ブロックの高さが同じ場合、前記コンテキストインデックスの値は、0で示すことができる。または、前記現在ブロックの幅が前記現在ブロックの高さより大きい場合、前記コンテキストインデックスの値は、1で示すことができ、前記現在ブロックの幅が前記現在ブロックの高さより小さい場合、前記コンテキストインデックスの値は、2で示すことができる。
または、例えば、前記コンテキストインデックスの値は、ブロックの大きさ、ブロックの幅-高さ比率、ブロックのイントラまたはインター予測可否、隣接の変換スキップ可否などのうち少なくとも一つに基づいて、ctxInc及び/またはctxIdxを示すことができる。または、ブロックの大きさ、ブロックの幅-高さ比率、ブロックのイントラまたはインター予測可否、隣接の変換スキップ可否などのうち少なくとも一つに基づくコンテキストモデルを定義することができ、これに基づいてコンテキストインデックスの値を示すことができる。例えば、現在ブロックに対する変換タイプまたは変換スキップに対する情報は、前記コンテキストインデックスまたはコンテキストモデルに基づいて取得されることができる。
例えば、レジデュアル関連情報は、前述したように前記変換スキップフラグを含んでもよいし、含まなくてもよい。例えば、前記レジデュアル関連情報が前記変換スキップフラグを含む場合、前記現在ブロックのレジデュアルサンプルは、変換無しで導出されることを示すことができ、前記現在ブロックに対するレジデュアル信号(または、レジデュアルに対する情報)は、変換無しでピクセルドメイン(空間ドメイン)上でシグナリングされることができる。または、前記レジデュアル関連情報が前記変換スキップフラグを含まない場合、前記現在ブロックのレジデュアルサンプルは、変換が実行されて導出されることを示すことができ、前記現在ブロックに対するレジデュアル信号(または、レジデュアルに対する情報)は、変換が実行されて変換ドメイン上でシグナリングされることができる。
エンコーディング装置は、前述した情報(または、シンタックス要素)の全部または一部を含む映像情報をエンコーディングしてビットストリームを生成することができる。または、ビットストリーム形態で出力できる。また、前記ビットストリームは、ネットワークまたは格納媒体を介してデコーディング装置に送信されることができる。または、前記ビットストリームは、コンピュータ読み取り可能な格納媒体に格納されることができる。例えば、ビットストリームは、映像情報またはビデオ情報で示すこともできる。
図15及び図16は、本文書の実施例によるビデオ/映像デコーディング方法及び関連コンポーネントの一例の概略を示す。
図15及び図16は、本文書の実施例によるビデオ/映像デコーディング方法及び関連コンポーネントの一例の概略を示す。図15に開示された方法は、図3に開示されたデコーディング装置により実行されることができる。具体的に、例えば、図15のS1500は、図16で前記デコーディング装置のエントロピーデコーディング部310により実行されることができ、図15のS1510は、図16で前記デコーディング装置の予測部330により実行されることができ、図15のS1520は、図16で前記デコーディング装置のレジデュアル処理部320により実行されることができ、図15のS1530は、図16で前記デコーディング装置の加算部340により実行されることができる。図15に開示された方法は、本文書で前述した実施例を含むことができる。
図15を参照すると、デコーディング装置は、ビットストリームから予測モード情報及びレジデュアル関連情報を取得することができる(S1500)。または、デコーディング装置は、ビットストリームを(エントロピー)デコーディングして予測モード情報またはレジデュアル関連情報を取得することができる。
例えば、予測モード情報は、現在ブロックの予測モードに対する情報を含むことができる。または、予測モード情報は、イントラ予測モードまたはインター予測モードに対する情報を含むことができる。
例えば、レジデュアル関連情報は、レジデュアルコーディング情報(または、レジデュアルコーディングシンタックス)を含むことができる。または、レジデュアル関連情報は、変換ユニット情報(または、変換ユニットシンタックス)を含むことができる。または、レジデュアル関連情報は、レジデュアルコーディング情報及び変換ユニット情報を含むこともできる。
例えば、前記現在ブロックのサイズ及び最大変換スキップサイズに基づいて、前記レジデュアル関連情報が前記変換スキップフラグを含むことができる。または、前記現在ブロックのサイズ及び最大変換スキップサイズに基づいて、前記レジデュアル関連情報が変換スキップフラグを含むかどうかが決定されることができる。例えば、前記変換スキップフラグは、前記現在ブロックに変換スキップが適用されるかどうかを示すことができる。または、前記変換スキップフラグは、transform_skip_flagシンタックス要素で示すことができる。例えば、前記transform_skip_flagシンタックス要素の値が0である場合、前記現在ブロックに変換スキップが適用され、1である場合、前記現在ブロックに変換スキップが適用されない。または、設定によって、前記transform_skip_flagシンタックス要素の値が1である場合、前記現在ブロックに変換スキップが適用されることができ、0である場合、前記現在ブロックに変換スキップが適用されない。
例えば、前記現在ブロックのサイズは、前記現在ブロックの幅及び/または前記現在ブロックの高さを示すことができる。前記最大変換スキップサイズは、変換スキップ(TS:Transform Skip)が許容されるブロックの最大の大きさを示すことができる。または、前記最大変換スキップサイズは、MaxTsSizeで示すこともできる。例えば、前記現在ブロックの幅または前記現在ブロックの高さが前記最大変換スキップサイズ以下である場合、前記レジデュアル関連情報が前記変換スキップフラグを含むことができる。
例えば、前記最大変換スキップサイズに対する情報は、前記ビットストリームから取得されることができる。または、前記最大変換スキップサイズに対する情報は、前記ビットストリームを(エントロピー)デコーディングして取得されることができる。例えば、前記最大変換サイズは、前記最大変換スキップサイズに対する情報に基づいて導出されることができる。例えば、前記最大変換スキップサイズに対する情報は、ハイレベル(high-level)シンタックスに含まれることができ、前記ハイレベルシンタックスは、前記ビットストリームから取得されることができる。または、前記ハイレベルシンタックスは、前記ビットストリームを(エントロピー)デコーディングして取得されることができる。例えば、ハイレベルシンタックスは、NAL(Network Abstraction Layer)ユニットシンタックス、SPS(Sequence Parameter Set)シンタックス、PPS(Picture Parameter Set)シンタックスまたはスライスヘッダ(slice header)シンタックスである。
または、例えば、前記最大変換スキップサイズに対する情報は、SPSに含まれることができ、前記最大変換サイズは、前記SPSに含まれている前記最大変換スキップサイズに対する情報に基づいて導出されることができる。または、例えば、前記最大変換スキップサイズに対する情報は、PPSに含まれることができ、前記最大変換サイズは、前記PPSに含まれている前記最大変換スキップサイズに対する情報に基づいて導出されることができる。ここで、SPSまたはPPSは、SPSシンタックスまたはPPSシンタックスを示すことができ、他のシンタックスもシンタックスという用語を省略して使われることができる。
例えば、前記最大変換スキップサイズに対する情報は、ログ値に-2した値に対する情報を含むことができ、前記ログ値は、前記最大変換スキップサイズに対する底が2であるログ値である。即ち、前記最大変換スキップサイズに対する情報は、前記最大変換スキップサイズの底が2であるログ値に-2した値に対する情報を示すことができる。または、例えば、前記最大変換スキップサイズに対する情報は、前記最大変換スキップサイズの(底が2である)ログ値に対する情報を含むこともできる。
例えば、前記最大変換スキップサイズに対する情報は、log2_transform_skip_max_size_minus2シンタックス要素を含むことができる。または、前記最大変換スキップサイズに対する情報は、log2_transform_skip_max_size_minus2シンタックス要素を示すことができる。例えば、前記log2_transform_skip_max_size_minus2シンタックス要素は、ハイレベルシンタックス、SPSシンタックスまたはPPSシンタックスに含まれることができる。
例えば、表41を参照すると、前記最大変換スキップサイズは、MaxTsSize=1<<(log2_transform_skip_max_size_minus2+2)に基づいて導出されることができる。ここで、前記MaxTsSizeは、前記最大変換スキップサイズを示すことができ、前記log2_transform_skip_max_size_minus2は、前記log2_transform_skip_max_size_minus2シンタックス要素の値を示すことができる。また、前記<<は、算術シフト演算子を示すことができる。例えば、前記log2_transform_skip_max_size_minus2シンタックス要素の値は、0乃至3の候補値のうち一つに示されるが、これに限定されるものではない。または、前記log2_transform_skip_max_size_minus2シンタックス要素の値は、0、1、2または3に導出されることができるが、これに限定されるものではない。
また、例えば、前記最大変換スキップサイズは、4、8、16または32を含む候補サイズのうち一つに導出される。前記最大変換スキップサイズは、前記log2_transform_skip_max_size_minus2シンタックス要素の値に基づいて導出されることができる。または、前記最大変換スキップサイズは、前記log2_transform_skip_max_size_minus2シンタックス要素の値に基づいて4、8、16または32を含む候補サイズのうち一つに導出される。例えば、前記log2_transform_skip_max_size_minus2シンタックス要素の値が0である場合、前記最大変換スキップサイズは、前述した1<<(log2_transform_skip_max_size_minus2+2)に基づいて4に導出されることができる。または、前記log2_transform_skip_max_size_minus2シンタックス要素の値が1である場合、前記最大変換スキップサイズは、前述した1<<(log2_transform_skip_max_size_minus2+2)に基づいて8に導出されることができる。または、前記log2_transform_skip_max_size_minus2シンタックス要素の値が2である場合、前記最大変換スキップサイズは、前述した1<<(log2_transform_skip_max_size_minus2+2)に基づいて16に導出されることができる。または、前記log2_transform_skip_max_size_minus2シンタックス要素の値が3である場合、前記最大変換スキップサイズは、前述した1<<(log2_transform_skip_max_size_minus2+2)に基づいて32に導出されることができる。
例えば、最大変換スキップサイズがNであるということは、幅及び高さが全てN以下のサイズを示すことができる。または、最大変換スキップサイズがNであるということは、幅及び高さのうち大きい値がN以下のサイズを示すことができる。または、最大変換スキップサイズがNであるということは、正方形ブロックの場合、一辺の長さがN以下のサイズを示すことができる。
または、例えば、前記最大変換スキップサイズに対する情報は、変換スキップが許容されるかに対する情報に基づいて、ハイレベルシンタックス、SPSシンタックスまたはPPSシンタックスに含まれることができる。例えば、前記変換スキップが許容されるかに対する情報が、変換スキップが許容される情報を示す場合、前記最大変換スキップサイズに対する情報は、ハイレベルシンタックス、SPSシンタックスまたはPPSシンタックスに含まれる。または、前記変換スキップが許容されるかに対する情報が、変換スキップが許容されないという情報を示す場合、前記最大変換スキップサイズに対する情報は、ハイレベルシンタックス、SPSシンタックスまたはPPSシンタックスに含まれない。
または、例えば、前記最大変換スキップサイズは、MTS(Multiple Tranform Selection)が許容されるかに対する情報に基づいて導出されることもできる。または、MTSが許容されるかに対する情報及びTSが許容されるかに対する情報に基づいて、前記最大変換スキップサイズが導出されることができる。
例えば、前記ハイレベルシンタックスは、MTS(Multiple Tranform Selection)が許容されるかに対する情報またはTSが許容されるかに対する情報を含むことができる。または、MTSが許容されるかに対する情報または前記TSが許容されるかに対する情報は、SPSシンタックスまたはPPSシンタックスに含まれることができる。
例えば、前記MTSが許容されるかに対する情報は、sps_mts_enabled_flagシンタックス要素で示すことができる。または、前記MTSが許容されるかに対する情報は、sps_mts_intra_enabled_flagシンタックス要素またはsps_mts_inter_enabled_flagシンタックス要素を含むことができる。例えば、前記sps_mts_intra_enabled_flagシンタックス要素またはsps_mts_inter_enabled_flagシンタックス要素は、前記sps_mts_enabled_flagシンタックス要素に基づいて前記SPSシンタックスに含まれることができる。前記sps_mts_intra_enabled_flagシンタックス要素は、sps_explicit_mts_intra_enabled_flagシンタックス要素で示すことができ、前記sps_mts_inter_enabled_flagシンタックス要素は、sps_explicit_mts_inter_enabled_flagシンタックス要素で示すことができる。例えば、前記MTSが許容されるかに対する情報は、MTS enabled情報で示すことができる。
例えば、前記MTSが許容されるかに対する情報が、前記MTSが許容されるという情報を示す場合、MTS enabled=1または前記sps_mts_enabled_flagシンタックス要素の値が1であると示すことができる。または、前記sps_mts_enabled_flagシンタックス要素の値が1であり、sps_explicit_mts_intra_enabled_flagシンタックス要素またはsps_explicit_mts_inter_enabled_flagシンタックス要素の値が1であると示すことができる。または、前記MTSが許容されるかに対する情報が、前記MTSが許容されないという情報を示す場合、MTS enabled=0または前記sps_mts_enabled_flagシンタックス要素の値が0であると示すことができる。または、前記sps_mts_enabled_flagシンタックス要素の値が1であり、sps_explicit_mts_intra_enabled_flagシンタックス要素またはsps_explicit_mts_inter_enabled_flagシンタックス要素の値が0であると示すことができる。例えば、設定によって、前記値は、前記値に対応する情報を逆に示すこともできる。
例えば、前記TSが許容されるかに対する情報は、TS enabled情報またはsps_transform_skip_enabled_flagシンタックス要素で示すことができる。例えば、前記TSが許容されるかに対する情報は、TS enabled情報で示すことができる。
例えば、前記TSが許容されるかに対する情報が、前記TSが許容されるという情報を示す場合、TS enabled=1または前記sps_transform_skip_enabled_flagシンタックス要素の値が1であると示すことができる。または、前記TSが許容されるかに対する情報が、前記TSが許容されないという情報を示す場合、TS enabled=0または前記sps_transform_skip_enabled_flagシンタックス要素の値が0であると示すことができる。例えば、設定によって、前記値は、前記値に対応する情報を逆に示すこともできる。
例えば、前記MTSが許容されるという情報を示す前記MTSが許容されるかに対する情報に基づいて、前記最大変換スキップサイズは、前記MTSのサイズに基づいて導出されることができる。即ち、前記MTSが許容されるかに対する情報が、前記MTSが許容されるという情報を示す場合、前記最大変換スキップサイズは、前記MTSのサイズに基づいて導出されることができる。即ち、前記最大変換スキップサイズは、前記MTSに従属的である。前記MTSのサイズは、MTSが許容されるブロックの最大サイズを示すことができる。例えば、前記MTSのサイズが32以下である場合、変換スキップも32以下のサイズのブロックに対して許容されることができる。
または、例えば、前記MTSが許容されるという情報を示す前記MTSが許容されるかに対する情報に基づいて、前記最大変換スキップサイズは、既に設定されたサイズに導出されることができる。即ち、前記MTSが許容されるかに対する情報が、前記MTSが許容されるという情報を示す場合、前記最大変換スキップサイズは、既に設定されたサイズに導出されることができる。例えば、既に設定されたサイズが8である場合、前記最大変換スキップサイズは、前記既に設定されたサイズ8に導出されることができる。
または、例えば、前記MTSが許容されるという情報を示す前記MTSが許容されるかに対する情報に基づいて、前記ハイレベルシンタックスは、前記最大変換スキップサイズに対する情報を含むことができ、前記最大変換スキップサイズは、前記最大変換スキップサイズに対する情報に基づいて導出されることができる。即ち、前記MTSが許容されるかに対する情報が、前記MTSが許容されるという情報を示す場合、前記ハイレベルシンタックスは、前記最大変換スキップサイズに対する情報を別途に含むことができ、前記最大変換スキップサイズは、前記最大変換スキップサイズに対する情報に基づいて導出されることができる。または、例えば、前記MTSが許容されるかに対する情報が、前記MTSが許容されるという情報を示す場合、前記ハイレベルシンタックスは、前記最大変換スキップサイズが前記MTSのサイズに基づいて導出されるかに対する情報を含むことができる。前記最大変換スキップサイズが前記MTSのサイズに基づいて導出されるかに対する情報が、前記最大変換スキップサイズが前記MTSのサイズに基づいて導出されるという情報を示す場合、前記ハイレベルシンタックスは、前記最大変換スキップサイズに対する情報を含むことができる。前記最大変換スキップサイズに対する情報は、SPSシンタックスまたはPPSシンタックスに含まれることができる。例えば、ハイレベルシンタックスに含まれている前記最大変換スキップサイズに対する情報が32を示す場合、前記最大変換スキップサイズは、前記最大変換スキップサイズに対する情報に基づいて32に導出されることができる。
または、例えば、前記MTSが許容されないという情報を示す前記MTSが許容されるかに対する情報に基づいて、前記最大変換スキップサイズは、既に設定されたサイズに導出されることができる。即ち、前記MTSが許容されるかに対する情報が、前記MTSが許容されないという情報を示す場合、前記最大変換スキップサイズは、既に設定されたサイズに導出されることができる。例えば、既に設定されたサイズが8である場合、前記最大変換スキップサイズは、前記既に設定されたサイズ8に導出されることができる。
または、例えば、前記MTSが許容されないという情報を示す前記MTSが許容されるかに対する情報に基づいて、前記ハイレベルシンタックスは、前記最大変換スキップサイズに対する情報を含むことができ、前記最大変換スキップサイズは、前記最大変換スキップサイズに対する情報に基づいて導出されることができる。即ち、前記MTSが許容されるかに対する情報が、前記MTSが許容されないという情報を示す場合、前記ハイレベルシンタックスは、前記最大変換スキップサイズに対する情報を別途に含むことができ、前記最大変換スキップサイズは、前記最大変換スキップサイズに対する情報に基づいて導出されることができる。前記最大変換スキップサイズに対する情報は、SPSシンタックスまたはPPSシンタックスに含まれることができる。例えば、ハイレベルシンタックスに含まれている前記最大変換スキップサイズに対する情報が32を示す場合、前記最大変換スキップサイズは、前記最大変換スキップサイズに対する情報に基づいて32に導出されることができる。
例えば、前記レジデュアル関連情報は、前記現在ブロックに適用する変換タイプに対するMTSインデックス情報を含むことができる。例えば、MTSインデックス情報は、tu_mts_idxシンタックス要素またはmts_idxシンタックス要素で示すことができる。例えば、MTSインデックス情報は、変換ユニットシンタックスまたはコーディングユニットシンタックスに含まれることができる。例えば、MTSインデックス情報は、前記現在ブロックに適用する変換タイプまたは変換スキップに対する情報を示すことができる。または、前記MTSインデックス情報は、前記MTSが許容されるかに対する情報及び/または前記変換スキップが許容されるかに対する情報に基づいて前記現在ブロックに適用する変換タイプまたは変換スキップに対する情報を示すことができる。
例えば、前記MTSインデックス情報が示す情報は、前記MTSインデックス情報に対するビンストリングのビンに基づいて導出されることができる。または、前記MTSインデックス情報が示す情報は、前記ビンのコンテキストインデックスの値に基づいて導出されることができる。または、前記MTSインデックス情報が示す情報は、前記ビンストリングの1番目のビンのコンテキストインデックス値に基づいて導出されることができる。例えば、コンテキストインデックス(ctxIdx)は、コンテキストインデックス増分(ctxInc)及びコンテキストインデックスオフセット(ctxIdxOffset)に基づいて導出されることができる。
例えば、前記MTSインデックス情報に対する1番目のビンのコンテキストインデックスの値は、前記MTSが許容されるかに対する情報、前記変換スキップが許容されるかに対する情報、及び前記現在ブロックのサイズに基づいて導出されることができる。例えば、前記MTSインデックス情報に対する1番目のビンのコンテキストインデックスの値は、表19または表22に基づいて導出されることができる。
例えば、前記MTSが許容されるという情報を示す前記MTSが許容されるかに対する情報及び前記変換スキップが許容されるという情報を示す前記変換スキップが許容されるかに対する情報に基づいて、前記コンテキストインデックスの値は、前記現在ブロックの幅及び前記現在ブロックの高さを比較して導出されることができる。即ち、前記MTSが許容されるかに対する情報が、前記MTSが許容されるという情報を示し、前記TSが許容されるかに対する情報が、前記TSが許容されるという情報を示す場合、前記現在ブロックの幅及び前記現在ブロックの高さを比較して導出されることができる。または、前記現在ブロックの幅及び前記現在ブロックの高さが同じ場合、前記コンテキストインデックスの値は、0に導出されることができる。または、前記現在ブロックの幅が前記現在ブロックの高さより大きい場合、前記コンテキストインデックスの値は、1に導出されることができ、前記現在ブロックの幅が前記現在ブロックの高さより小さい場合、前記コンテキストインデックスの値は、2に導出されることができる。
または、例えば、前記MTSが許容されるという情報を示す前記MTSが許容されるかに対する情報及びcqtDepth(coded quad-tree depth)に基づいて、前記コンテキストインデックスの値が導出されることができる。即ち、前記MTSが許容されるかに対する情報が、前記MTSが許容されるという情報を示す場合、cqtDepthに基づいて前記コンテキストインデックスの値が導出されることができる。例えば、前記コンテキストインデックスの値は、前記cqtDepthの値に1を加算した値に導出されることができ、1、2、3、4、5または6に導出されることができる。
または、例えば、前記変換スキップが許容されるという情報を示す前記変換スキップが許容されるかに対する情報に基づいて、前記コンテキストインデックスの値は、前記現在ブロックの幅及び前記現在ブロックの高さを比較して導出されることができる。即ち、前記TSが許容されるかに対する情報が、前記TSが許容されるという情報を示す場合、前記現在ブロックの幅及び前記現在ブロックの高さを比較して導出されることができる。または、前記現在ブロックの幅及び前記現在ブロックの高さが同じ場合、前記コンテキストインデックスの値は、0に導出されることができる。または、前記現在ブロックの幅が前記現在ブロックの高さより大きい場合、前記コンテキストインデックスの値は、1に導出されることができ、前記現在ブロックの幅が前記現在ブロックの高さより小さい場合、前記コンテキストインデックスの値は、2に導出されることができる。
または、例えば、前記コンテキストインデックスの値は、ブロックの大きさ、ブロックの幅-高さ比率、ブロックのイントラまたはインター予測可否、隣接の変換スキップ可否などのうち少なくとも一つに基づいてctxInc及び/またはctxIdxを決定することができる。または、ブロックの大きさ、ブロックの幅-高さ比率、ブロックのイントラまたはインター予測可否、隣接の変換スキップ可否などのうち少なくとも一つに基づくコンテキストモデルを定義することができ、これに基づいてコンテキストインデックスの値を導出することができる。例えば、現在ブロックに対する変換タイプまたは変換スキップに対する情報は、前記コンテキストインデックスまたはコンテキストモデルに基づいて取得されることができる。
デコーディング装置は、前記予測モード情報に基づいて予測を実行して現在ブロックの予測サンプルを導出することができる(S1510)。例えば、デコーディング装置は、前記予測モード情報に基づいて前記現在ブロックの予測モードを導出することができる。例えば、前記予測モード情報は、イントラ予測モードに対する情報またはインター予測モードに対する情報を含むことができ、これに基づいて現在ブロックの予測モードをイントラ予測モードまたはインター予測モードに導出することができる。
例えば、デコーディング装置は、前記予測モードに基づいて前記現在ブロックの予測サンプルを導出することができる。例えば、デコーディング装置は、前記予測モードがイントラ予測モードである場合、現在ブロック隣接のサンプルに基づいて前記予測サンプルを導出することができる。または、デコーディング装置は、前記予測モードがインター予測モードである場合、現在ブロックの参照ピクチャ内の参照サンプルに基づいて前記予測サンプルを導出することができる。
デコーディング装置は、前記レジデュアル関連情報に基づいて前記現在ブロックのレジデュアルサンプルを導出することができる(S1520)。例えば、前記レジデュアル関連情報は、前記レジデュアルサンプルに対する変換係数に対する情報を含むことができる。または、前記レジデュアル関連情報は、前記変換スキップフラグを含むこともできる。
例えば、前記レジデュアル関連情報が前記変換スキップフラグを含む場合、前記現在ブロックに対するレジデュアル信号(または、レジデュアルに対する情報)は、変換無しでピクセルドメイン(空間ドメイン)上でシグナリングされることができる。または、前記レジデュアル関連情報が前記変換スキップフラグを含まない場合、前記現在ブロックに対するレジデュアル信号(または、レジデュアルに対する情報)は、変換が実行されて変換ドメイン上でシグナリングされることができる。例えば、デコーディング装置は、前記変換無しでまたは変換が実行されてシグナリングされたレジデュアル信号に基づいてレジデュアルサンプルを導出することができる。
デコーディング装置は、前記予測サンプル及び前記レジデュアルサンプルに基づいて前記現在ブロックの復元サンプルを生成することができる(S1530)。または、デコーディング装置は、前記復元サンプルに基づいて復元ブロックまたは復元ピクチャを導出することができる。以後、デコーディング装置は、必要によって、主観的/客観的画質を向上させるためにデブロッキングフィルタリング及び/またはSAO手順のようなインループフィルタリング手順を前記復元ピクチャに適用できることは、前述の通りである。
デコーディング装置は、ビットストリームをデコーディングして前述した情報(または、シンタックス要素)の全部または一部を含む映像情報を取得することができる。また、前記ビットストリームは、コンピュータ読み取り可能なデジタル格納媒体に格納されることができ、前述したデコーディング方法が実行されるように引き起こすことができる。例えば、ビットストリームは、映像情報またはビデオ情報で示すこともできる。
前述した実施例において、方法は、一連のステップまたはブロックで流れ図に基づいて説明されているが、本文書は、ステップの順序に限定されるものではなく、あるステップは、前述と異なるステップと、異なる順序にまたは同時に発生できる。また、当業者であれば、流れ図に示すステップが排他的でなく、他のステップが含まれ、または流れ図の一つまたはそれ以上のステップが本文書の範囲に影響を及ぼさずに削除可能であることを理解することができる。
前述した本文書による方法は、ソフトウェア形態で実現されることができ、本文書によるエンコーディング装置及び/またはデコーディング装置は、例えば、TV、コンピュータ、スマートフォン、セットトップボックス、ディスプレイ装置などの映像処理を実行する装置に含まれることができる。
本文書で実施例がソフトウェアで実現されるとき、前述した方法は、前述した機能を遂行するモジュール(過程、機能など)で実現されることができる。モジュールは、メモリに格納され、プロセッサにより実行されることができる。メモリは、プロセッサの内部または外部にあり、よく知られた多様な手段によりプロセッサと連結されることができる。プロセッサは、ASIC(application-specific integrated circuit)、他のチップセット、論理回路及び/またはデータ処理装置を含むことができる。メモリは、ROM(read-only memory)、RAM(random access memory)、フラッシュメモリ、メモリカード、格納媒体及び/または他の格納装置を含むことができる。
図17は、コンテンツストリーミングシステム構造の概略を示す。
即ち、本文書で説明した実施例は、プロセッサ、マイクロプロセッサ、コントローラまたはチップ上で実現されて実行されることができる。例えば、各図面で示す機能ユニットは、コンピュータ、プロセッサ、マイクロプロセッサ、コントローラまたはチップ上で実現されて実行されることができる。
また、本文書が適用されるデコーディング装置及びエンコーディング装置は、マルチメディア放送送受信装置、モバイル通信端末、ホームシネマビデオ装置、デジタルシネマビデオ装置、監視用カメラ、ビデオ対話装置、ビデオ通信のようなリアルタイム通信装置、モバイルストリーミング装置、格納媒体、カムコーダ、注文型ビデオ(VoD)サービス提供装置、OTTビデオ(Over the top video)装置、インターネットストリーミングサービス提供装置、3次元(3D)ビデオ装置、映像電話ビデオ装置、及び医療用ビデオ装置などに含まれることができ、ビデオ信号またはデータ信号を処理するために使われることができる。例えば、OTTビデオ(Over the top video)装置として、ゲームコンソール、ブルーレイプレーヤー、インターネット接続TV、ホームシアターシステム、スマートフォン、タブレットPC、DVR(Digital Video Recorder)などを含むことができる。
また、本文書が適用される処理方法は、コンピュータで実行されるプログラムの形態で生成されることができ、コンピュータが読み取り可能な記録媒体に格納されることができる。また、本文書によるデータ構造を有するマルチメディアデータもコンピュータが読み取り可能な記録媒体に格納されることができる。前記コンピュータが読み取り可能な記録媒体は、コンピュータで読み取ることができるデータが格納される全ての種類の格納装置及び分散格納装置を含む。前記コンピュータが読み取り可能な記録媒体は、例えば、ブルーレイディスク(BD)、汎用直列バス(USB)、ROM、PROM、EPROM、EEPROM、RAM、CD-ROM、磁気テープ、フロッピーディスク、及び光学的データ格納装置を含むことができる。また、前記コンピュータが読み取り可能な記録媒体は、搬送波(例えば、インターネットを介した送信)の形態で実現されたメディアを含む。また、エンコーディング方法で生成されたビットストリームが、コンピュータが読み取り可能な記録媒体に格納され、または有線/無線通信ネットワークを介して送信されることができる。また、本文書の実施例は、プログラムコードによるコンピュータプログラム製品で実現されることができ、前記プログラムコードは、本文書の実施例によりコンピュータで実行されることができる。前記プログラムコードは、コンピュータにより読み取り可能なキャリア上に格納されることができる。
また、本文書が適用されるコンテンツストリーミングシステムは、大いに、エンコーディングサーバ、ストリーミングサーバ、ウェブサーバ、メディア格納所、ユーザ装置、及びマルチメディア入力装置を含むことができる。
前記エンコーディングサーバは、スマートフォン、カメラ、カムコーダなどのようなマルチメディア入力装置から入力されたコンテンツをデジタルデータで圧縮してビットストリームを生成し、これを前記ストリーミングサーバに送信する役割をする。他の例として、スマートフォン、カメラ、カムコーダなどのようなマルチメディア入力装置がビットストリームを直接生成する場合、前記エンコーディングサーバは、省略されることができる。前記ビットストリームは、本文書が適用されるエンコーディング方法またはビットストリーム生成方法により生成されることができ、前記ストリーミングサーバは、前記ビットストリームを送信または受信する過程で一時的に前記ビットストリームを格納することができる。
前記ストリーミングサーバは、ウェブサーバを介したユーザ要求に基づいてマルチメディアデータをユーザ装置に送信し、前記ウェブサーバは、ユーザにどのようなサービスがあるかを知らせる媒体の役割をする。ユーザが前記ウェブサーバに所望のサービスを要求すると、前記ウェブサーバは、これをストリーミングサーバに伝達し、前記ストリーミングサーバは、ユーザにマルチメディアデータを送信する。このとき、前記コンテンツストリーミングシステムは、別途の制御サーバを含むことができ、この場合、前記制御サーバは、前記コンテンツストリーミングシステム内の各装置間の命令/応答を制御する役割をする。
前記ストリーミングサーバは、メディア格納所及び/またはエンコーディングサーバからコンテンツを受信することができる。例えば、前記エンコーディングサーバからコンテンツを受信するようになる場合、前記コンテンツをリアルタイムで受信することができる。この場合、円滑なストリーミングサービスを提供するために、前記ストリーミングサーバは、前記ビットストリームを一定時間の間に格納することができる。
前記ユーザ装置の例として、携帯電話、スマートフォン(smartphone)、ノートブックコンピュータ(laptop computer)、デジタル放送用端末機、PDA(personal digital assistants)、PMP(portable multimedia player)、ナビゲーション、スレートPC(slate PC)、タブレットPC(tablet PC)、ウルトラブック(s)、ウェアラブルデバイス(wearable device、例えば、ウォッチ型端末機(smartwatch)、グラス型端末機(smart glass)、HMD(head mounted display))、デジタルTV、デスクトップコンピュータ、デジタルサイネージなどがある。前記コンテンツストリーミングシステム内の各サーバは、分散サーバで運営されることができ、この場合、各サーバで受信するデータは、分散処理されることができる。
Claims (13)
- デコーディング装置により実行される映像デコーディング方法において、
ビットストリームから予測モード情報及びレジデュアル関連情報を取得するステップと、
前記予測モード情報に基づいて予測を実行して現在ブロックの予測サンプルを導出するステップと、
前記レジデュアル関連情報に基づいて前記現在ブロックのレジデュアルサンプルを導出するステップと、
前記予測サンプル及び前記レジデュアルサンプルに基づいて前記現在ブロックの復元サンプルを生成するステップと、を含み、
前記現在ブロックのサイズ及び最大変換スキップサイズに基づいて、前記レジデュアル関連情報は、変換スキップフラグを含み、
前記変換スキップフラグは、前記現在ブロックに変換スキップが適用されたかどうかを示し、
前記最大変換スキップサイズに対する情報は、前記ビットストリームから取得されることを特徴とする、映像デコーディング方法。 - 前記最大変換スキップサイズは、4、8、16または32を含む候補サイズのうち一つに導出されることを特徴とする、請求項1に記載の映像デコーディング方法。
- 前記最大変換スキップサイズに対する情報は、log2_transform_skip_max_size_minus2シンタックス要素を含むことを特徴とする、請求項1に記載の映像デコーディング方法。
- 前記最大変換スキップサイズは、数式
MaxTsSize = 1 << (log2_transform_skip_max_size_minus2 + 2)
に基づいて導出され、
前記MaxTsSizeは、前記最大変換スキップサイズを示し、
前記log2_transform_skip_max_size_minus2は、前記log2_transform_skip_max_size_minus2シンタックス要素の値を示すことを特徴とする、請求項3に記載の映像デコーディング方法。 - 前記log2_transform_skip_max_size_minus2シンタックス要素の値は、0乃至3の候補値のうち一つに示されることを特徴とする、請求項4に記載の映像デコーディング方法。
- 前記最大変換スキップサイズに対する情報は、ハイレベルシンタックスに含まれることを特徴とする、請求項1に記載の映像デコーディング方法。
- エンコーディング装置により実行される映像エンコーディング方法において、
現在ブロックに対して予測を実行して予測サンプルを導出するステップと、
前記現在ブロックに対するレジデュアルサンプルを導出するステップと、
前記予測に対する予測モード情報及び前記レジデュアルサンプルに対するレジデュアル関連情報を含む映像情報をエンコーディングするステップと、を含み、
前記現在ブロックのサイズ及び最大変換スキップサイズに基づいて、前記レジデュアル関連情報は、変換スキップフラグを含み、
前記変換スキップフラグは、前記現在ブロックに変換スキップが適用されたかどうかを示し、
前記映像情報は、前記最大変換スキップサイズに対する情報を含むことを特徴とする、映像エンコーディング方法。 - 前記最大変換スキップサイズは、4、8、16または32を含む候補サイズのうち一つに導出されることを特徴とする、請求項7に記載の映像エンコーディング方法。
- 前記最大変換スキップサイズに対する情報は、log2_transform_skip_max_size_minus2シンタックス要素を含むことを特徴とする、請求項7に記載の映像エンコーディング方法。
- 前記最大変換スキップサイズは、数式
MaxTsSize = 1 << (log2_transform_skip_max_size_minus2 + 2)
に基づいて導出され、
前記MaxTsSizeは、前記最大変換スキップサイズを示し、前記log2_transform_skip_max_size_minus2は、前記log2_transform_skip_max_size_minus2シンタックス要素の値を示すことを特徴とする、請求項9に記載の映像エンコーディング方法。 - 前記log2_transform_skip_max_size_minus2シンタックス要素の値は、0乃至3の候補値のうち一つに示されることを特徴とする、請求項10に記載の映像エンコーディング方法。
- 前記最大変換スキップサイズに対する情報は、ハイレベルシンタックスに含まれることを特徴とする、請求項7に記載の映像エンコーディング方法。
- コンピュータ読み取り可能なデジタル格納媒体において、前記コンピュータ読み取り可能なデジタル格納媒体は、請求項1のデコーディング方法を実行するように引き起こす映像情報が格納されることを特徴とする、コンピュータ読み取り可能なデジタル格納媒体。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201962792423P | 2019-01-15 | 2019-01-15 | |
US62/792,423 | 2019-01-15 | ||
JP2020524564A JP2021513755A (ja) | 2019-01-15 | 2020-01-15 | 変換スキップフラグを利用した映像コーディング方法及び装置 |
PCT/KR2020/000757 WO2020149648A1 (ko) | 2019-01-15 | 2020-01-15 | 변환 스킵 플래그를 이용한 영상 코딩 방법 및 장치 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020524564A Division JP2021513755A (ja) | 2019-01-15 | 2020-01-15 | 変換スキップフラグを利用した映像コーディング方法及び装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2023118765A true JP2023118765A (ja) | 2023-08-25 |
JP2023118765A5 JP2023118765A5 (ja) | 2023-11-28 |
Family
ID=71094257
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020524564A Pending JP2021513755A (ja) | 2019-01-15 | 2020-01-15 | 変換スキップフラグを利用した映像コーディング方法及び装置 |
JP2023100459A Pending JP2023118765A (ja) | 2019-01-15 | 2023-06-20 | 変換スキップフラグを利用した映像コーディング方法及び装置 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020524564A Pending JP2021513755A (ja) | 2019-01-15 | 2020-01-15 | 変換スキップフラグを利用した映像コーディング方法及び装置 |
Country Status (8)
Country | Link |
---|---|
US (4) | US10917637B2 (ja) |
EP (1) | EP3703376A4 (ja) |
JP (2) | JP2021513755A (ja) |
KR (3) | KR102610233B1 (ja) |
CN (1) | CN111699694B (ja) |
BR (3) | BR122021012448B1 (ja) |
MX (1) | MX2021008449A (ja) |
WO (1) | WO2020149648A1 (ja) |
Families Citing this family (101)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020057530A1 (en) | 2018-09-18 | 2020-03-26 | Huawei Technologies Co., Ltd. | Coding method, device, system |
CN118524231A (zh) * | 2018-09-18 | 2024-08-20 | 华为技术有限公司 | 视频编码器、视频解码器及对应方法 |
US11218694B2 (en) * | 2018-09-24 | 2022-01-04 | Qualcomm Incorporated | Adaptive multiple transform coding |
TWI822863B (zh) * | 2018-09-27 | 2023-11-21 | 美商Vid衡器股份有限公司 | 360度視訊寫碼樣本導出 |
WO2020084476A1 (en) | 2018-10-22 | 2020-04-30 | Beijing Bytedance Network Technology Co., Ltd. | Sub-block based prediction |
CN111083491B (zh) | 2018-10-22 | 2024-09-20 | 北京字节跳动网络技术有限公司 | 细化运动矢量的利用 |
EP3861728A4 (en) * | 2018-11-06 | 2022-04-06 | Beijing Bytedance Network Technology Co., Ltd. | COMPLEXITY REDUCTION IN A DERIVATION OF PARAMETERS FOR AN INTRA PREDICTION |
WO2020098644A1 (en) | 2018-11-12 | 2020-05-22 | Beijing Bytedance Network Technology Co., Ltd. | Bandwidth control methods for inter prediction |
US11178396B2 (en) | 2018-11-14 | 2021-11-16 | Tencent America LLC | Constrained intra prediction and unified most probable mode list generation |
CN117319644A (zh) | 2018-11-20 | 2023-12-29 | 北京字节跳动网络技术有限公司 | 基于部分位置的差计算 |
CN113170171B (zh) * | 2018-11-20 | 2024-04-12 | 北京字节跳动网络技术有限公司 | 组合帧间帧内预测模式的预测细化 |
CN113170122B (zh) | 2018-12-01 | 2023-06-27 | 北京字节跳动网络技术有限公司 | 帧内预测的参数推导 |
CA3121671C (en) | 2018-12-07 | 2024-06-18 | Beijing Bytedance Network Technology Co., Ltd. | Context-based intra prediction |
KR20210093891A (ko) * | 2018-12-18 | 2021-07-28 | 엘지전자 주식회사 | 이차 변환에 기반한 영상 코딩 방법 및 그 장치 |
JP2021513755A (ja) | 2019-01-15 | 2021-05-27 | エルジー エレクトロニクス インコーポレイティド | 変換スキップフラグを利用した映像コーディング方法及び装置 |
US11025936B2 (en) * | 2019-01-25 | 2021-06-01 | Tencent America LLC | Method and apparatus for video coding |
US11523136B2 (en) * | 2019-01-28 | 2022-12-06 | Hfi Innovation Inc. | Methods and apparatuses for coding transform blocks |
US10958904B2 (en) * | 2019-02-01 | 2021-03-23 | Tencent America LLC | Method and apparatus for video coding |
EP3700205A1 (en) * | 2019-02-19 | 2020-08-26 | Nokia Technologies Oy | Quantization parameter derivation for cross-channel residual encoding and decoding |
AU2020226565C1 (en) | 2019-02-22 | 2024-01-11 | Beijing Bytedance Network Technology Co., Ltd. | Neighbouring sample selection for intra prediction |
CA3128769C (en) | 2019-02-24 | 2023-01-24 | Beijing Bytedance Network Technology Co., Ltd. | Parameter derivation for intra prediction |
KR20210113367A (ko) * | 2019-03-05 | 2021-09-15 | 후아웨이 테크놀러지 컴퍼니 리미티드 | 인트라 서브-파티션 코딩 모드를 위한 방법 및 장치 |
WO2020177755A1 (en) | 2019-03-06 | 2020-09-10 | Beijing Bytedance Network Technology Co., Ltd. | Usage of converted uni-prediction candidate |
CN113365052B (zh) * | 2019-03-09 | 2022-03-25 | 杭州海康威视数字技术股份有限公司 | 进行编码和解码的方法、解码端、编码端和系统 |
US11202100B2 (en) * | 2019-03-11 | 2021-12-14 | Qualcomm Incorporated | Coefficient coding for transform skip mode |
KR20210128497A (ko) * | 2019-03-11 | 2021-10-26 | 인터디지털 브이씨 홀딩스 인코포레이티드 | 비디오 인코딩 및 디코딩을 위한 엔트로피 코딩 |
US11128876B2 (en) * | 2019-03-12 | 2021-09-21 | Qualcomm Incorporated | Joint coefficient coding of transform skip and BDPCM mode for 4:4:4 color formats |
WO2020185027A1 (ko) * | 2019-03-13 | 2020-09-17 | 현대자동차주식회사 | 데이터 블록에 변환 생략 모드를 효율적으로 적용하기 위한 방법 및 장치 |
CN117880494A (zh) | 2019-03-24 | 2024-04-12 | 北京字节跳动网络技术有限公司 | 用于帧内预测的参数推导的条件 |
KR102610709B1 (ko) | 2019-04-02 | 2023-12-05 | 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 | 디코더 측 움직임 벡터 유도 |
WO2020218793A1 (ko) | 2019-04-20 | 2020-10-29 | 엘지전자 주식회사 | Bdpcm에 기반한 영상 코딩 방법 및 그 장치 |
CN113906753B (zh) | 2019-04-24 | 2023-12-01 | 字节跳动有限公司 | 编解码视频的量化残差差分脉冲编解码调制表示的约束 |
CN113796069B (zh) | 2019-05-01 | 2024-03-08 | 字节跳动有限公司 | 使用量化残差差分脉冲编解码调制编解码的帧内编解码视频 |
EP3949387A4 (en) * | 2019-05-02 | 2022-05-18 | ByteDance Inc. | SIGNALING IN A TRANSFORM JUMP MODE |
CN113785306B (zh) | 2019-05-02 | 2024-06-14 | 字节跳动有限公司 | 基于编解码树结构类型的编解码模式 |
CN117221544A (zh) | 2019-05-19 | 2023-12-12 | 字节跳动有限公司 | 数字视频中的变换旁路编解码残差块 |
WO2020235961A1 (ko) * | 2019-05-22 | 2020-11-26 | 엘지전자 주식회사 | 영상 디코딩 방법 및 그 장치 |
CN113994666A (zh) | 2019-06-06 | 2022-01-28 | 北京字节跳动网络技术有限公司 | 隐式选择变换候选 |
WO2020244662A1 (en) * | 2019-06-06 | 2020-12-10 | Beijing Bytedance Network Technology Co., Ltd. | Simplified transform coding tools |
CN114208175B (zh) * | 2019-06-11 | 2023-06-13 | Lg电子株式会社 | 基于色度量化参数数据的图像解码方法及其设备 |
US11863787B2 (en) * | 2019-06-19 | 2024-01-02 | Qualcomm Incorporated | Maximum allowed block size for BDPCM mode |
EP4376415A3 (en) * | 2019-06-19 | 2024-07-10 | LG Electronics Inc. | Coding of information about transform kernel set |
CN113411605B (zh) * | 2019-06-21 | 2022-05-31 | 杭州海康威视数字技术股份有限公司 | 一种编解码方法、装置及其设备 |
US11212530B2 (en) | 2019-06-24 | 2021-12-28 | Tencent America LLC | Method for slice, tile and brick signaling |
WO2020262992A1 (ko) * | 2019-06-25 | 2020-12-30 | 한국전자통신연구원 | 영상 부호화/복호화 방법 및 장치 |
US11259016B2 (en) * | 2019-06-30 | 2022-02-22 | Tencent America LLC | Method and apparatus for video coding |
US11616962B2 (en) * | 2019-07-15 | 2023-03-28 | Tencent America LLC | Method and apparatus for video coding |
US11095916B2 (en) * | 2019-07-23 | 2021-08-17 | Qualcomm Incorporated | Wraparound motion compensation in video coding |
WO2021023261A1 (en) | 2019-08-06 | 2021-02-11 | Beijing Bytedance Network Technology Co., Ltd. | Size restriction based on color format |
US11677984B2 (en) * | 2019-08-20 | 2023-06-13 | Qualcomm Incorporated | Low-frequency non-separable transform (LFNST) signaling |
CN114287135A (zh) | 2019-08-23 | 2022-04-05 | 北京字节跳动网络技术有限公司 | 参考图片重采样中的剪切 |
US11909991B2 (en) * | 2019-08-30 | 2024-02-20 | Tencent America LLC | Restrictions on picture width and height |
WO2021040907A1 (en) * | 2019-08-30 | 2021-03-04 | Alibaba Group Holding Limited | Method and system for signaling chroma quantization parameter table |
JP7381722B2 (ja) | 2019-09-02 | 2023-11-15 | 北京字節跳動網絡技術有限公司 | カラーフォーマットに基づいたコーディングモード決定 |
US11736720B2 (en) * | 2019-09-03 | 2023-08-22 | Tencent America LLC | Motion vector refinement methods for video encoding |
US11395014B2 (en) * | 2019-09-18 | 2022-07-19 | Qualcomm Incorporated | Transform unit design for video coding |
CN114450963A (zh) * | 2019-09-18 | 2022-05-06 | 松下电器(美国)知识产权公司 | 用于视频编码的系统和方法 |
CN117615155A (zh) * | 2019-09-19 | 2024-02-27 | 北京字节跳动网络技术有限公司 | 视频编解码中的参考样点位置推导 |
KR20210034534A (ko) * | 2019-09-20 | 2021-03-30 | 한국전자통신연구원 | 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장한 기록 매체 |
CN118055248A (zh) | 2019-09-21 | 2024-05-17 | 北京字节跳动网络技术有限公司 | 处理视频数据的方法、装置以及计算机可读记录介质 |
CN114731413A (zh) * | 2019-09-24 | 2022-07-08 | 寰发股份有限公司 | 具有最小cu大小约束的分离的编解码树编解码的方法和装置 |
US11589044B2 (en) * | 2019-10-14 | 2023-02-21 | Hfi Innovation Inc. | Video encoding and decoding with ternary-tree block partitioning |
WO2021078177A1 (en) * | 2019-10-23 | 2021-04-29 | Beijing Bytedance Network Technology Co., Ltd. | Signaling for reference picture resampling |
JP7395727B2 (ja) | 2019-10-23 | 2023-12-11 | 北京字節跳動網絡技術有限公司 | ビデオ・データを処理する方法、装置及び記憶方法 |
WO2021083377A1 (en) * | 2019-11-01 | 2021-05-06 | Beijing Bytedance Network Technology Co., Ltd. | Block size restrictions for cross-component video coding |
TWI774124B (zh) * | 2019-11-15 | 2022-08-11 | 寰發股份有限公司 | 用於編解碼360度虛擬實境視訊序列的方法和裝置 |
US11483549B2 (en) | 2019-11-21 | 2022-10-25 | Hfi Innovation Inc. | Methods and apparatuses for transform skip mode information signaling |
WO2021100863A1 (en) * | 2019-11-22 | 2021-05-27 | Sharp Kabushiki Kaisha | Systems and methods for signaling tiles and slices in video coding |
US11375182B2 (en) * | 2019-12-17 | 2022-06-28 | Hfi Innovation Inc. | Method and apparatus of constrained layer-wise video coding |
US11477450B2 (en) * | 2019-12-20 | 2022-10-18 | Zte (Uk) Limited | Indication of video slice height in video subpictures |
US11589037B2 (en) * | 2019-12-20 | 2023-02-21 | Qualcomm Incorporated | Motion compensation using size of reference picture |
JP7544331B2 (ja) * | 2019-12-23 | 2024-09-03 | テンセント・アメリカ・エルエルシー | ビデオ符号化/復号のための方法および装置 |
US11457229B2 (en) * | 2019-12-23 | 2022-09-27 | Qualcomm Incorporated | LFNST signaling for chroma based on chroma transform skip |
JP7444998B2 (ja) * | 2019-12-31 | 2024-03-06 | エルジー エレクトロニクス インコーポレイティド | リーフノードの再設定された予測モードタイプに基づいて予測を行う画像符号化/復号化方法、装置、及びビットストリームを伝送する方法 |
WO2021159962A1 (en) * | 2020-02-11 | 2021-08-19 | Huawei Technologies Co., Ltd. | An encoder, a decoder and corresponding methods for subpicture signalling in sequence parameter set |
US11412253B2 (en) * | 2020-02-24 | 2022-08-09 | Alibaba Group Holding Limited | Methods for combining decoder side motion vector refinement with wrap-around motion compensation |
JP7395005B2 (ja) | 2020-02-24 | 2023-12-08 | バイトダンス インコーポレイテッド | サブピクチャの高さの導出 |
CN115398912A (zh) | 2020-02-29 | 2022-11-25 | 抖音视界有限公司 | 自适应参数集的语法元素的约束 |
WO2021178501A1 (en) * | 2020-03-03 | 2021-09-10 | Bytedance Inc. | Controlling a scaling process using slice header signaling |
CN113395524B (zh) * | 2020-03-11 | 2023-04-28 | 腾讯美国有限责任公司 | 视频解码方法、装置和电子设备 |
EP4304174A3 (en) | 2020-03-11 | 2024-03-20 | Beijing Bytedance Network Technology Co., Ltd. | Adaptive loop filtering |
US11146806B2 (en) * | 2020-03-11 | 2021-10-12 | Tencent America LLC | Coding unit level transform size restriction for adaptive color transform |
JP7446046B2 (ja) * | 2020-03-27 | 2024-03-08 | 三星電子株式会社 | 映像の復号化方法及び装置 |
US11582491B2 (en) * | 2020-03-27 | 2023-02-14 | Qualcomm Incorporated | Low-frequency non-separable transform processing in video coding |
CN117939155A (zh) * | 2020-04-10 | 2024-04-26 | 抖音视界有限公司 | 视频编解码中的变换跳过块的最小允许量化 |
WO2021236059A1 (en) * | 2020-05-19 | 2021-11-25 | Google Llc | Dynamic parameter selection for quality-normalized video transcoding |
CN115804092A (zh) | 2020-05-22 | 2023-03-14 | 抖音视界有限公司 | 通用约束标志的信令 |
WO2021244419A1 (en) | 2020-05-31 | 2021-12-09 | Beijing Bytedance Network Technology Co., Ltd. | Constraint signaling using general constraint information syntax element |
US11659207B2 (en) * | 2020-06-08 | 2023-05-23 | Qualcomm Incorporated | General constraints of syntax elements for video coding |
US11818384B2 (en) * | 2020-09-24 | 2023-11-14 | Ofinno, Llc | Affine intra block copy refinement |
US11924471B2 (en) * | 2020-11-12 | 2024-03-05 | Qualcomm Incorporated | Context-based transform index signaling in video coding |
CN115633172A (zh) * | 2020-12-06 | 2023-01-20 | 浙江大华技术股份有限公司 | 基于ibc模式编码方法、电子设备及存储介质 |
US11838551B2 (en) * | 2020-12-30 | 2023-12-05 | Ofinno, Llc | Adaptive block level bit-depth prediction |
JP2024502109A (ja) * | 2021-01-04 | 2024-01-17 | ベイジン・ダジア・インターネット・インフォメーション・テクノロジー・カンパニー,リミテッド | ビデオコーディング用の残差および係数のコーディング |
US12034949B2 (en) * | 2021-01-14 | 2024-07-09 | Samsung Electronics Co., Ltd. | Video decoding apparatus and video decoding method |
WO2022224888A1 (ja) * | 2021-04-21 | 2022-10-27 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 三次元データ符号化方法、三次元データ復号方法、三次元データ符号化装置、及び三次元データ復号装置 |
CA3223503A1 (en) * | 2021-06-28 | 2023-01-05 | Hong-Jheng Jhu | Residual and coefficients coding for video coding |
US12108056B2 (en) * | 2022-01-18 | 2024-10-01 | Tencent Americal Llc | Signalling of EOB for one dimensional transform skip |
US20230328244A1 (en) * | 2022-04-12 | 2023-10-12 | Qualcomm Incorporated | Flexible activation of multiple transform selection for inter-coding in video coding |
WO2024083197A1 (en) * | 2022-10-20 | 2024-04-25 | Douyin Vision Co., Ltd. | Method, apparatus, and medium for video processing |
CN116527944A (zh) * | 2023-04-11 | 2023-08-01 | 百果园技术(新加坡)有限公司 | 样点自适应补偿方法、装置、设备、存储介质以及产品 |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5578574A (en) * | 1978-12-09 | 1980-06-13 | Victor Co Of Japan Ltd | Manufacture of insulated-gate field-effect transistor |
JPS6143866U (ja) | 1984-08-28 | 1986-03-22 | ゼオン化成株式会社 | 二重プランタ− |
KR101830352B1 (ko) * | 2011-11-09 | 2018-02-21 | 에스케이 텔레콤주식회사 | 스킵모드를 이용한 동영상 부호화 및 복호화 방법 및 장치 |
JP5886446B2 (ja) | 2012-01-20 | 2016-03-16 | エレクトロニクス アンド テレコミュニケーションズ リサーチ インスチチュートElectronics And Telecommunications Research Institute | 量子化行列の符号化方法及び復号化方法、並びにそれを利用する装置 |
CN104380734B (zh) * | 2012-06-07 | 2017-09-15 | 寰发股份有限公司 | 编码以及解码视频数据的方法和装置 |
CN108712652A (zh) * | 2012-06-29 | 2018-10-26 | 韩国电子通信研究院 | 视频编码方法和计算机可读介质 |
TWI627857B (zh) * | 2012-06-29 | 2018-06-21 | Sony Corp | Image processing device and method |
US9451256B2 (en) * | 2012-07-20 | 2016-09-20 | Qualcomm Incorporated | Reusing parameter sets for video coding |
KR101462637B1 (ko) * | 2013-02-28 | 2014-11-21 | 성균관대학교산학협력단 | 영상 부호화/복호화 방법 및 장치 |
US9247255B2 (en) * | 2013-02-28 | 2016-01-26 | Research & Business Foundation Sungkyunkwan University | Method and apparatus for image encoding/decoding |
BR112015026899B1 (pt) * | 2013-04-23 | 2023-03-28 | Qualcomm Incorporated | Reposicionamento dos blocos residuais de previsão na codificação de vídeo |
KR101709775B1 (ko) * | 2013-07-23 | 2017-02-23 | 인텔렉추얼디스커버리 주식회사 | 영상 부호화/복호화 방법 및 장치 |
AU2013228045A1 (en) * | 2013-09-13 | 2015-04-02 | Canon Kabushiki Kaisha | Method, apparatus and system for encoding and decoding video data |
WO2015045736A1 (ja) | 2013-09-30 | 2015-04-02 | 日本放送協会 | 画像符号化装置、画像復号装置及びそれらのプログラム |
RU2020129092A (ru) * | 2016-05-13 | 2020-10-05 | Сони Корпорейшн | Устройство и способ обработки изображения |
WO2018101288A1 (ja) * | 2016-12-01 | 2018-06-07 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 符号化装置、符号化方法、復号装置および復号方法 |
WO2018123322A1 (ja) * | 2016-12-29 | 2018-07-05 | 株式会社 村田製作所 | 負極活物質、負極、電池、電池パック、電子機器、電動車両、蓄電装置および電力システム |
CA3142941C (en) * | 2017-01-03 | 2024-06-18 | Lg Electronics Inc. | Image processing method and apparatus therefor |
JP2021513755A (ja) | 2019-01-15 | 2021-05-27 | エルジー エレクトロニクス インコーポレイティド | 変換スキップフラグを利用した映像コーディング方法及び装置 |
-
2020
- 2020-01-15 JP JP2020524564A patent/JP2021513755A/ja active Pending
- 2020-01-15 BR BR122021012448-5A patent/BR122021012448B1/pt active IP Right Grant
- 2020-01-15 BR BR122021012456-6A patent/BR122021012456B1/pt active IP Right Grant
- 2020-01-15 KR KR1020227012010A patent/KR102610233B1/ko active IP Right Grant
- 2020-01-15 CN CN202080000781.8A patent/CN111699694B/zh active Active
- 2020-01-15 WO PCT/KR2020/000757 patent/WO2020149648A1/ko active Application Filing
- 2020-01-15 KR KR1020207013326A patent/KR102392701B1/ko active IP Right Grant
- 2020-01-15 EP EP20719552.0A patent/EP3703376A4/en not_active Withdrawn
- 2020-01-15 MX MX2021008449A patent/MX2021008449A/es unknown
- 2020-01-15 BR BR112021012366-0A patent/BR112021012366B1/pt active IP Right Grant
- 2020-01-15 KR KR1020237041499A patent/KR20240000610A/ko active Search and Examination
- 2020-04-20 US US16/852,735 patent/US10917637B2/en active Active
- 2020-12-30 US US17/138,494 patent/US11297310B2/en active Active
-
2022
- 2022-02-10 US US17/669,044 patent/US11695917B2/en active Active
-
2023
- 2023-05-15 US US18/197,441 patent/US11979552B2/en active Active
- 2023-06-20 JP JP2023100459A patent/JP2023118765A/ja active Pending
Also Published As
Publication number | Publication date |
---|---|
BR112021012366B1 (pt) | 2022-03-22 |
US20230370580A1 (en) | 2023-11-16 |
KR20200090766A (ko) | 2020-07-29 |
US11979552B2 (en) | 2024-05-07 |
CN111699694B (zh) | 2022-07-08 |
US20200260070A1 (en) | 2020-08-13 |
EP3703376A1 (en) | 2020-09-02 |
BR122021012456B1 (pt) | 2022-03-22 |
US11695917B2 (en) | 2023-07-04 |
BR122021012456A2 (pt) | 2021-09-14 |
KR102610233B1 (ko) | 2023-12-05 |
US20210120231A1 (en) | 2021-04-22 |
KR20240000610A (ko) | 2024-01-02 |
US20220174269A1 (en) | 2022-06-02 |
KR20220048060A (ko) | 2022-04-19 |
BR112021012366A2 (pt) | 2021-08-31 |
EP3703376A4 (en) | 2020-09-02 |
JP2021513755A (ja) | 2021-05-27 |
BR122021012448B1 (pt) | 2022-03-22 |
BR122021012448A2 (pt) | 2021-09-14 |
WO2020149648A1 (ko) | 2020-07-23 |
US10917637B2 (en) | 2021-02-09 |
CN111699694A (zh) | 2020-09-22 |
MX2021008449A (es) | 2021-11-03 |
US11297310B2 (en) | 2022-04-05 |
KR102392701B1 (ko) | 2022-04-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102392701B1 (ko) | 변환 스킵 플래그를 이용한 영상 코딩 방법 및 장치 | |
US11849120B2 (en) | Image decoding method using context-coded sign flag in image coding system and apparatus therefor | |
US12028526B2 (en) | Image decoding method and device using residual information in image coding system | |
US11240533B2 (en) | Video decoding method using residual information in video coding system, and apparatus thereof | |
US12081785B2 (en) | Video decoding method using residual information in video coding system, and apparatus thereof | |
US11647202B2 (en) | Image decoding method using residual information in image coding system, and device for same | |
JP7303335B2 (ja) | 変換カーネルセットに関する情報に対するコーディング | |
JP2023112079A (ja) | 画像コーディングシステムにおいて変換カーネルセットに関する情報に対するコンテキストコーディング | |
KR20220161382A (ko) | 변환에 기반한 영상 코딩 방법 및 그 장치 | |
JP2022546440A (ja) | 画像コーディングシステムで単純化されたレジデュアルデータコーディングを用いる画像デコード方法及びその装置 | |
US20210321135A1 (en) | Image coding method and apparatus using transform skip flag | |
KR20240144451A (ko) | 영상 코딩 시스템에서 레지듀얼 정보를 사용하는 영상 디코딩 방법 및 그 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230710 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231117 |