JPWO2018123313A1 - 映像符号化方法、映像復号方法、映像符号化装置、映像復号装置及びプログラム - Google Patents
映像符号化方法、映像復号方法、映像符号化装置、映像復号装置及びプログラム Download PDFInfo
- Publication number
- JPWO2018123313A1 JPWO2018123313A1 JP2018558886A JP2018558886A JPWO2018123313A1 JP WO2018123313 A1 JPWO2018123313 A1 JP WO2018123313A1 JP 2018558886 A JP2018558886 A JP 2018558886A JP 2018558886 A JP2018558886 A JP 2018558886A JP WO2018123313 A1 JPWO2018123313 A1 JP WO2018123313A1
- Authority
- JP
- Japan
- Prior art keywords
- flag
- binary tree
- entropy
- quadtree
- division
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/119—Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/13—Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/157—Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/46—Embedding additional information in the video signal during the compression process
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/90—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
- H04N19/91—Entropy coding, e.g. variable length coding [VLC] or arithmetic coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/90—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
- H04N19/96—Tree coding, e.g. quad-tree coding
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
映像符号化装置10は、四分木構造に基づいてブロックを分割するかしないかを示すフラグをエントロピー符号化する四分木分割フラグ符号化部11と、四分木終端ノードのスキップフラグをエントロピー符号化するスキップフラグ符号化部12と、四分木終端ノードのブロックを二分木構造に基づいて分割するかしないかを示すフラグ及び分割方向を示す水平/垂直分割方向フラグをエントロピー符号化する二分木情報符号化部13と、二分木構造に基づく分割の最小サイズを示す情報をビットストリームに多重化するサイズ多重化部14とを備え、二分木情報符号化部13は、最小サイズと等しいサイズのノードがさらに二分木構造に基づいて分割されるときには、ノードにおける水平/垂直分割方向フラグをエントロピー符号化しない。
Description
本発明は、四分木と二分木とに基づくブロック分割構造を用いる映像像符号化技術に関する。
非特許文献1に記載された映像符号化方式では、ディジタル化された映像の各フレームは符号化ツリーユニット(CTU: Coding Tree Unit )に分割され、ラスタスキャン順に各CTU が符号化される。
各CTU は、四分木(QT: Quad-Tree )構造で、符号化ユニット(CU: Coding Unit )に分割されて符号化される。各CUは、予測ユニット(PU: Prediction Unit )に分割されて予測符号化される。なお、予測符号化には、イントラ予測とフレーム間予測とがある。
各CUの予測誤差は、四分木構造で、変換ユニット(TU: Transform Unit)に分割されて周波数変換に基づいて変換符号化される。
最も大きなサイズのCUを最大CU(LCU: Largest Coding Unit)、最も小さなサイズのCUを最小CU(SCU: Smallest Coding Unit )と呼ぶ。なお、LCU サイズとCTU サイズとは同一である。
次に、イントラ予測及びフレーム間予測、並びに、CTU 、CU、PU及びTUのシグナリングを説明する。
イントラ予測は、符号化対象フレームと表示時刻が同一の再構築画像から予測画像を生成する予測である。非特許文献1では、図9に示す33種類の角度イントラ予測が定義されている。角度イントラ予測は、符号化対象ブロック周辺の再構築画素を33種類の方向のいずれかに外挿して、イントラ予測信号を生成する。加えて、非特許文献1では、33種類の角度イントラ予測に加えて、符号化対象ブロック周辺の再構築画素を平均するDCイントラ予測、及び、符号化対象ブロック周辺の再構築画素を線形補間するPlanarイントラ予測が定義されている。以下、イントラ予測に基づいて符号化されたCUをイントラCUと呼ぶ。
フレーム間予測は、符号化対象フレームと表示時刻が異なる再構築画像(参照ピクチャ)から予測画像を生成する予測である。以下、フレーム間予測をインター予測とも呼ぶ。図10は、フレーム間予測の例を示す説明図である。動きベクトルMV=(mvx, mvy)は、符号化対象ブロックに対する参照ピクチャの再構築画像ブロックの平行移動量を示す。インター予測は、参照ピクチャの再構築画像ブロックに基づいて(必要であれば画素補間を用いて)、インター予測信号を生成する。以下、フレーム間予測に基づいて符号化されたCUをインターCUと呼ぶ。
イントラCUのみで符号化されたフレームはIフレーム(又は、Iピクチャ)と呼ばれる。イントラCUだけでなくインターCUも含めて符号化されたフレームはPフレーム(又は、Pピクチャ)と呼ばれる。ブロックのインター予測に1枚の参照ピクチャだけでなく、さらに同時に2枚の参照ピクチャを用いるインターCUを含めて符号化されたフレームはBフレーム(又は、Bピクチャ)と呼ばれる。
スキップモードは、対象のCUが、後述するPU分割形状の2N×2Nの形状に基づくフレーム予測で予測符号化され、かつ、後述する変換量子化値が存在しないことを示す。各CUがスキップモードであるか否かは、非特許文献1に記載されているskip_flag シンタクスによってシグナリングされる。
スキップモードではない各CUがイントラCU/インターCUのいずれであるかは、非特許文献1に記載されているpred_mode_flagシンタクスによってシグナリングされる。
図11は、フレームの空間解像度がCIF (CIF: Common Intermediate Format )、CTU サイズが64の場合のフレームt のCTU 分割例、及び、フレームt に含まれる第8のCTU (CTU8)のCU分割例を示す説明図である。
図12は、CTU8のCU分割例に対応する四分木構造を示す説明図である。各CTU の四分木構造、すなわち、CU分割形状は、非特許文献1に記載されているcu_split_flag シンタクスによってシグナリングされる。
図13は、CUのPU分割形状を示す説明図である。イントラCUの場合、正方形のPU分割を選択できる。インターCUの場合、正方形に加えて長方形のPU分割も選択できる。各CUのPU分割形状は、非特許文献1に記載されているpart_mode シンタクスによってシグナリングされる。
図14は、CUのTU分割例を示す説明図である。上段には、2N×2N PU 分割形状のイントラCUのTU分割例が示されている。イントラCUの場合、四分木の根(Root)はPUに配置され、各PUの予測誤差が四分木構造で表現される。下段には、2N×N PU分割形状のインターCUのTU分割例が示されている。インターCUの場合、四分木の根(Root) はCUに配置され、該CUの予測誤差が四分木構造で表現される。上述した予測誤差の四分木構造、すなわち、各CUのTU分割形状は、非特許文献1に記載されるsplit_tu_flag シンタクスによってシグナリングされる。
以上で、イントラ予測及びフレーム間予測、並びに、CTU 、CU、PU及びTUのシグナリングの説明を終了する。
次に、図15のブロック図を参照して、ディジタル化された映像の各フレームの各CUを入力画像としてビットストリームを出力する、一般的な映像符号化装置の構成と動作を説明する。
図15に示す映像符号化装置は、変換/量子化器101、エントロピー符号化器102、逆量子化/逆変換器103、バッファ104、予測器105、及び多重化器106を備える。
予測器105は、CTU 毎に、符号化コストを最小とするCU分割形状を決定するcu_split_flag シンタクス値を決定する。
続いて、予測器105は、CU毎に、符号化コストを最小とする、イントラ予測/インター予測を決定するpred_mode_flagシンタクス値、PU分割形状を決定するpart_mode シンタクス値、TU分割形状を決定するsplit_tu_flag シンタクス値、イントラ予測方向、及び、動きベクトルを決定する。
さらに、予測器105は、スキップモードを決定するskip_flag シンタクス値を決定する。
具体的には、対象CUについて、決定されたpred_mode_flagがインター予測を示し、決定されたpart_modeが2Nx2Nを示し、かつ、後述する変換量子化値が存在しないとき、skip_flag を1にする(つまり、スキップモードとする。)。その他のとき、skip_flag を0にする(つまり、スキップモードとしない。)。
そして、予測器105は、決定したcu_split_flag シンタクス値、pred_mode_flagシンタクス値、part_mode シンタクス値、split_tu_flag シンタクス値、イントラ予測方向、及び、動きベクトルなどに基づいて、各CUの入力画像信号に対する予測信号を生成する。予測信号は、上述したイントラ予測又はフレーム間予測に基づいて生成される。
変換/量子化器101は、予測器105が決定したTU分割形状に基づいて、入力画像信号から予測信号を減じた予測誤差画像を周波数変換する。
さらに、変換/量子化器101は、周波数変換した予測誤差画像(周波数変換係数)を量子化する。以下、量子化された周波数変換係数を変換量子化値と呼ぶ。
エントロピー符号化器102は、予測器105が決定したcu_split_flag シンタクス値、skip_flag シンタクス値、pred_mode_flagシンタクス値、part_mode シンタクス値、split_tu_flag シンタクス値、イントラ予測方向の差分情報、及び動きベクトルの差分情報(以下、それらの予測に関連した情報を予測パラメータともいう。)、並びに、変換量子化値をエントロピー符号化する。
逆量子化/逆変換器103は、変換量子化値を逆量子化する。さらに、逆量子化/逆変換器103は、逆量子化した周波数変換係数を逆周波数変換する。逆周波数変換された再構築予測誤差画像は、予測信号が加えられて、バッファ104に供給される。バッファ104は、再構築画像を格納する。
多重化器106は、エントロピー符号化器102から供給されるエントロピー符号化データをビットストリームとして多重化出力する。
上述した動作によって、一般的な映像符号化装置はビットストリームを生成する。
次に、図16を参照して、ビットストリームを入力として復号された映像フレームを出力する、一般的な映像復号装置の構成と動作を説明する。
図16に示された映像復号装置は、多重化解除器201、エントロピー復号器202、逆量子化/逆変換器203、予測器204、バッファ205を備える。
多重化解除器201は、入力されるビットストリームを多重化解除して、エントロピー符号化された映像ビットストリームを抽出する。
エントロピー復号器202は、映像ビットストリームをエントロピー復号する。エントロピー復号器202は、予測パラメータ及び変換量子化値をエントロピー復号し、逆量子化/逆変換器203及び予測器204に供給する。
逆量子化/逆変換器203は、変換量子化値を逆量子化する。さらに、逆量子化/逆変換器203は、逆量子化した周波数変換係数を逆周波数変換する。
逆周波数変換後、予測器204は、エントロピー復号した予測パラメータに基づいて、バッファ205に格納された再構築画像を用いて予測信号を生成する。
予測信号生成後、逆量子化/逆変換器203で逆周波数変換された再構築予測誤差画像は、予測器204から供給される予測信号が加えられて、再構築画像としてバッファ205に供給される。
そして、バッファ205に格納された再構築画像がデコード画像(デコード映像)として出力される。
上述した動作に基づいて、一般的な映像復号装置はデコード画像を生成する。
非特許文献2は、上述した非特許文献1に記載された方式の拡張方式であるQuadTree plus Binary Tree (QTBT)と呼ばれる、四分木と二分木(BT: Binary-Tree )に基づいたブロック分割構造を用いる映像像符号化技術を開示している。
QTBT構造では、四分木構造に基づいて、符号化ツリーユニット(CTU )が正方形の符号化ユニット(CU)に再帰的に分割される。さらに、二分木構造に基づいて、予測処理や変換処理のために、再帰的に分割された各CUが長方形又は正方形のブロックに再帰的に分割される。QTBT構造では、part_mode シンタクスは利用されない。
図17は、非特許文献2に記載されたQTBT構造を示す説明図である。図17(a)は、CTU のブロック分割例を示し、図17(b)は、その木構造を示す。図17において、実線は四分木構造に基づく分割を示し、破線は二分木構造に基づく分割を示す。二分木構造に基づく分割では、長方形のブロックも許容されるので、分割方向(分割線が延びる方向)を示す情報が必要である。図17(b)において、0は、横方向(水平方向)に分割されることを示す。1は、縦方向(垂直方向)に分割されることを示す。QTBT構造は、長方形の分割形状をより柔軟に表現できるため、非特許文献1に記載されたブロック分割構造に基づく映像方式の圧縮効率を高めることができる。
High Efficiency Video Coding (HEVC) text specification draft 10 (for FDIS & Last Call) of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11 12th Meeting: Geneva, CH, 14-23 January 2013
Jicheng An, et al., "Quadtree plus binary tree structure integration with JEM tools", JVET-B0023, Joint Video Exploration Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11 2nd Meeting: San Diego, USA, 20-26 February 2016
図18は、QTBT構造に基づくCTU のブロック分割とその木構造の一例を示す説明図である。
まず、図18において使用されるcu_split_flag 、bt_split_flag 、及びbt_split_vertical_flagの定義を説明する。
cu_split_flag は、四分木構造に基づいて分割されるかされないかを示す。cu_split_flag が0のとき、四分木構造に基づいて分割されない(つまり、ブロックは四分木終端ノードのブロックとなる。)。cu_split_flag が1のとき、四分木構造に基づいて分割される。
bt_split_flag は、二分木構造に基づいて分割されるかされないかを示す。bt_split_flag が0のとき、二分木構造に基づいて分割されない(つまり、ブロックは二分木終端ノードのブロックとなる。)とする。bt_split_flag が1のとき、二分木構造に基づいて分割されるとする。
bt_split_vertical_flagは、bt_split_flag が1のときに存在する。bt_split_vertical_flagは、分割方向を示す。bt_split_vertical_flagが0のとき、水平方向に分割されるとする。bt_split_vertical_flagが1のとき、垂直方向に分割されるとする。
図18(a)には、ブロック分割の一例が示されている。図18(b)には、図18(a)に示す分割に対応するシンタクス要素及びQTBT構造が示されている。
図18(a)に示す例では、64×64(64画素×64画素)のブロックは四分木構造に基づいて32×32の4ブロックに分割されるので、QT 0-level(depth 0 )において、cu_split_flag の値は、分割することを示す値(この例では、1)である。
QT 1-level(depth 1 )では、右下の32×32のブロックが垂直方向に2分割される。その32×32のブロックについて、cu_split_flag の値は分割しないことを示す値(この例では、0)であるが、BT 1-level(depth 1 )のbt_split_flag の値は、分割することを示す値(この例では、1)である。また、bt_split_vertical_flagの値は垂直方向を示す値(この例では、1)である。なお、他の3つの32×32のブロックについて、二分木構造に関連するbt_split_flag の値は、分割しないことを示す値(この例では、0)である。
BT 2-level(depth 2 )では、右下の32×32のブロックに含まれる左側の16×32のブロックについては、それ以上分割されないので、bt_split_flag の値は、分割しないことを示す値(この例では、0)である。
右側の16×32のブロックについては、さらに分割されるので、bt_split_flag の値は、分割することを示す値(この例では、1)である。また、bt_split_vertical_flagの値は垂直方向を示す値(この例では、1)である。
BT 3-level(depth 3 )では、右下の16×32のブロックに含まれる左側の8 ×32のブロックは分割されないので、bt_split_flag の値は、分割しないことを示す値(この例では、0)である。右下の16×32のブロックに含まれる右側の8 ×32のブロックは分割されるので、bt_split_flag の値は、分割することを示す値(この例では、1)である。また、bt_split_vertical_flagの値は水平方向を示す値(この例では、0)である。
右下の8 ×32のブロックに含まれる上側の8 ×16のブロックも下側の8 ×16のブロックも分割されないので、それぞれのブロックについて、bt_split_flag の値は、分割しないことを示す値(この例では、0)である。
上述したQTBT構造を使用するとき、四分木構造に基づくブロックの分割/非分割情報(以下、四分木分割フラグと呼ぶ。)に加えて、二分木に基づいたブロックの分割/非分割情報(以下、二分木分割フラグと呼ぶ。)及び水平/垂直分割方向情報(以下、二分木分割方向フラグと呼ぶ。)の伝送が必要である。
上記の二分木分割フラグ及び二分木分割方向フラグはブロック毎に伝送されるので、特にビットレートが低い条件下において、無視できないレベルのビット数の増加をもたらす。
従って、それらのフラグ情報によるオーバヘッド符号量の発生によって圧縮効率が低下する。また、それらのフラグ情報のエントロピー符号化/復号処理量が増加する。
QTBT構造を使用する場合、ブロックの最小サイズを設定することができる。なお、最小サイズは、横幅の最小値と高さの最小値との双方を含む概念である。最小サイズが「N」に設定されたとき、ブロックの横幅(横方向の画素数)がNに達したら、そのブロックをさらに縦方向に分割することはできない。分割すると、横幅がN/2になってしまうからである。また、ブロックの高さ(縦方向の画素数)がNに達したら、そのブロックをさらに横方向に分割することはできない。分割すると、高さがN/2になってしまうからである。
つまり、横幅と高さとのうちの一方が最小サイズであるブロックが二分木分割に基づいて分割される場合には、分割の方向は一義的に定まる。しかし、図18(b)に例示された方式では、そのような場合であっても、本来不要である(換言すれば、冗長な)bt_split_vertical_flagが伝送される。
本発明は、四分木と二分木とに基づくブロック分割構造を用いる映像像符号化処理及び映像復号処理において、圧縮性能を改善し、エントロピー符号化処理量及びエントロピー復号処理量を削減することを目的とする。
本発明による映像符号化方法は、四分木と二分木とに基づくブロック分割構造を用いる映像符号化方法であって、四分木構造に基づいてブロックを分割するかしないかを示すフラグをエントロピー符号化するステップと、四分木終端ノードのスキップフラグをエントロピー符号化するステップと、四分木終端ノードのブロックを二分木構造に基づいて分割するかしないかを示すフラグ及び分割方向を示す水平/垂直分割方向フラグをエントロピー符号化するステップと、二分木構造に基づく分割の最小サイズを示す情報をビットストリームに多重化するステップとを含み、最小サイズと等しいサイズのノードがさらに二分木構造に基づいて分割されるときには、ノードにおける水平/垂直分割方向フラグをエントロピー符号化しないことを特徴とする。
本発明による映像復号方法は、四分木と二分木とに基づくブロック分割構造を用いる映像復号方法であって、四分木終端ノードのスキップフラグをエントロピー復号するステップと、四分木終端ノードのブロックを二分木構造に基づいて分割するかしないかを示すフラグ及び分割方向を示す水平/垂直分割方向フラグをエントロピー復号するステップと、二分木構造に基づく分割の最小サイズを示す情報をビットストリームから抽出するステップとを含み、最小サイズと等しいサイズのノードがさらに二分木構造に基づいて分割されるときには、ノードにおける水平/垂直分割方向フラグをエントロピー復号しないことを特徴とする。
本発明による映像符号化装置は、四分木と二分木とに基づくブロック分割構造を用いる映像符号化装置であって、四分木構造に基づいてブロックを分割するかしないかを示すフラグをエントロピー符号化する四分木分割フラグ符号化手段と、四分木終端ノードのスキップフラグをエントロピー符号化するスキップフラグ符号化手段と、四分木終端ノードのブロックを二分木構造に基づいて分割するかしないかを示すフラグ及び分割方向を示す水平/垂直分割方向フラグをエントロピー符号化する二分木情報符号化手段と、二分木構造に基づく分割の最小サイズを示す情報をビットストリームに多重化するサイズ多重化手段とを備え、二分木情報符号化手段は、最小サイズと等しいサイズのノードがさらに二分木構造に基づいて分割されるときには、ノードにおける水平/垂直分割方向フラグをエントロピー符号化しないことを特徴とする。
本発明による映像復号装置は、四分木と二分木とに基づくブロック分割構造を用いる映像復号装置であって、四分木終端ノードのスキップフラグをエントロピー復号するスキップフラグ復号手段と、四分木終端ノードのブロックを二分木構造に基づいて分割するかしないかを示すフラグ及び分割方向を示す水平/垂直分割方向フラグをエントロピー復号する二分木情報復号手段と、二分木構造に基づく分割の最小サイズを示す情報をビットストリームから抽出するサイズ抽出手段とを備え、二分木情報復号手段は、最小サイズと等しいサイズのノードがさらに二分木構造に基づいて分割されるときには、ノードにおける水平/垂直分割方向フラグをエントロピー復号しないことを特徴とする。
本発明による映像符号化プログラムは、四分木と二分木とに基づくブロック分割構造を用いる映像符号化方法を実施するための映像符号化プログラムであって、コンピュータに、四分木構造に基づいてブロックを分割するかしないかを示すフラグをエントロピー符号化する処理と、四分木終端ノードのスキップフラグをエントロピー符号化する処理と、四分木終端ノードのブロックを二分木構造に基づいて分割するかしないかを示すフラグ及び分割方向を示す水平/垂直分割方向フラグをエントロピー符号化する処理と、二分木構造に基づく分割の最小サイズを示す情報をビットストリームに多重化する処理とを実行させ、最小サイズと等しいサイズのノードがさらに二分木構造に基づいて分割されるときには、ノードにおける水平/垂直分割方向フラグをエントロピー符号化させないことを特徴とする。
本発明による映像復号プログラムは、四分木と二分木とに基づくブロック分割構造を用いる映像復号方法を実施するための映像復号プログラムであって、コンピュータに、四分木終端ノードのスキップフラグをエントロピー復号する処理と、四分木終端ノードのブロックを二分木構造に基づいて分割するかしないかを示すフラグ及び分割方向を示す水平/垂直分割方向フラグをエントロピー復号する処理と、二分木構造に基づく分割の最小サイズを示す情報をビットストリームから抽出する処理とを実行させ、最小サイズと等しいサイズのノードがさらに二分木構造に基づいて分割されるときには、ノードにおける水平/垂直分割方向フラグをエントロピー復号させないことを特徴とする。
本発明によれば、圧縮性能が改善され、エントロピー符号化処理量及びエントロピー復号処理量が削減される。
実施形態1.
図1は、映像符号化装置の実施形態(第1の実施形態)を示すブロック図である。図1に示す映像符号化装置は、変換/量子化器101、エントロピー符号化器102、逆量子化/逆変換器103、バッファ104、予測器105、多重化器106、及びエントロピー符号化制御器107を備える。
図1は、映像符号化装置の実施形態(第1の実施形態)を示すブロック図である。図1に示す映像符号化装置は、変換/量子化器101、エントロピー符号化器102、逆量子化/逆変換器103、バッファ104、予測器105、多重化器106、及びエントロピー符号化制御器107を備える。
本実施形態で使用されるcu_split_flag 、bt_split_flag 、及びbt_split_vertical_flagの定義は既に説明されたとおりであるが、映像復号側では、bt_split_flag が存在しない場合、bt_split_flag は暗黙的に0と解釈される。また、本実施形態では、bt_split_flag が1であっても、bt_split_vertical_flagが存在しないことがある。
予測器105は、CTU 毎に、符号化コストを最小とする、QTBT分割形状を決定するcu_split_flag 、bt_split_flag 、及びbt_split_vertical_flagを決定する。
以下、四分木構造又は二分木構造に基づいて分割されたブロックをサブブロックということがある。
次に、予測器105は、決定したcu_split_flag 、bt_split_flag 、及びbt_split_vertical_flagに基づいてQTBT分割されたサブブロック毎に、符号化コストを最小とする、イントラ予測/インター予測を決定するpred_mode_flag、TU分割形状を決定するsplit_tu_flag 、イントラ予測方向、及び動きベクトルを決定する。
次いで、予測器105は、スキップモードを決定するskip_flag を決定する。具体的には、処理対象のサブブロックについて、決定されたpred_mode_flagがインター予測を示し、変換量子化値が存在しないとき、skip_flag を1にする(つまり、スキップモードとする。)。その他のとき、skip_flag を0にする(つまり、スキップモードとしない。)。
そして、予測器105は、決定したcu_split_flag シンタクス値、bt_split_flag シンタクス値、bt_split_vertical_flagシンタクス値、skip_flag シンタクス値、pred_mode_flagシンタクス値、split_tu_flag シンタクス値、イントラ予測方向、及び動きベクトルに基づいて、各サブブロックの入力画像信号に対する予測信号を生成する。予測信号は、上述したイントラ予測又はフレーム間予測に基づいて生成される。
変換/量子化器101は、予測器105が決定したTU分割形状に基づいて、入力画像信号から予測信号を減じた予測誤差画像を周波数変換する。さらに、変換/量子化器101は、周波数変換した予測誤差画像(周波数変換係数)を量子化して変換量子化値を生成する。
エントロピー符号化制御器107は、予測器105からエントロピー符号化器102に供給される、二分木構造に基づくサブブロック毎のサイズを監視して、bt_split_vertical_flagをエントロピー符号化するか否かを判断する。
具体的には、処理対象のサブブロックの横幅又は高さが最小サイズに等しい場合、当該ブロックがさらに分割されるとき、エントロピー符号化制御器107は、エントロピー符号化器102に、bt_split_vertical_flagのエントロピー符号化処理をスキップさせる。以下、最小サイズを、minBTsize と表現する。最小サイズは、任意に設定されうるが、本実施形態では、一例として、最小サイズを「8」とする。また、処理対象のサブブロックの横幅をcurPartW、高さをcurPartHと表現する。
エントロピー符号化器102は、予測器105が決定したcu_split_flag シンタクス値、bt_split_flag シンタクス値、bt_split_vertical_flagシンタクス値、skip_flag シンタクス値、pred_mode_flagシンタクス値、split_tu_flag シンタクス値、イントラ予測方向の差分情報、動きベクトルの差分情報、及び、変換量子化値をエントロピー符号化する。
ただし、エントロピー符号化器102は、bt_split_vertical_flagについて、エントロピー符号化制御器107がエントロピー符号化をスキップすることに決定したとき、エントロピー符号化をスキップする。
上記のような制御によって、冗長なbt_split_vertical_flagのシグナリングが防止される。
逆量子化/逆変換器103は、変換量子化値を逆量子化する。さらに、逆量子化/逆変換器103は、逆量子化した周波数変換係数を逆周波数変換する。逆周波数変換された再構築予測誤差画像は、予測信号が加えられて、バッファ104に供給される。バッファ104は、再構築画像を格納する。
多重化器106は、エントロピー符号化器102から供給されるエントロピー符号化データをビットストリームとして多重化出力する。なお、多重化器106は、二分木構造に基づく分割の最小サイズを示すminBTsize もビットストリームに多重化する。
上述した動作によって、本実施形態の映像符号化装置はビットストリームを生成する。
次に、図2のフローチャートを参照して、bt_split_flag 、bt_split_vertical_flag、及びskip_flag に対する、本実施形態の特徴部であるエントロピー符号化制御器107及びエントロピー符号化器102の動作をより詳しく説明する。
ステップS101では、エントロピー符号化制御器107は、cu_split_flag が0か否かを判断する。cu_split_flag が0である場合、ステップS102に進む。cu_split_flag が1の場合、次の四分木サブブロック(四分木構造に基づく分割後のブロック)の処理に進む。
ステップS102では、エントロピー符号化器102は、bt_split_flag をエントロピー符号化する。ステップS103では、エントロピー符号化制御器107は、bt_split_flag が0か否かを判断する。bt_split_flag 0の場合、処理を終了する。なお、エントロピー符号化器102は、処理を終了する前に、skip_flag をエントロピー符号化する。bt_split_flag が1の場合、ステップS104に進む。
ステップS104では、エントロピー符号化制御器107は、curPartW又はcurPartHがminBTsize と等しいか否か判定する。curPartWとcurPartHとのうちのいずれかがminBTsize と等しいとき、次の二分木サブブロック(二分木構造に基づく分割後のブロック)の処理に進む。なお、次の二分木サブブロックの処理は、ステップS102以降の処理である。curPartWとcurPartHとのいずれもがminBTsize と等しくないとき、ステップS105に進む。
ステップS105では、エントロピー符号化器102は、bt_split_vertical_flagをエントロピー符号化する。そして、次の二分木サブブロックの処理に進む。
ステップS103〜S105の処理によって、エントロピー符号化制御器107は、処理対象のサブブロックのbt_split_flag が1(つまり、処理対象のブロックがさらに二分木構図に基づいて分割される。)、かつ、curPartWとcurPartHとのうちのいずれかがminBTsize と等しいとき、bt_split_vertical_flagのエントロピー符号化処理がスキップされる。
次に、本実施形態の具体例を説明する。図3は、第1の実施形態におけるQTBT構造を示す説明図である。
図3(a)には、ブロック分割の一例が示されている。図3(b)には、図3(a)に示す分割に対応するシンタクス要素及びQTBT構造が示されている。
図3(a)に示す例では、64×64(64画素×64画素)のブロックは四分木構造に基づいて32×32の4ブロック(サブブロック)に分割されるので、QT 0-level(depth 0 )において、cu_split_flag の値は、分割することを示す値(本実施形態では、1)である。
QT 1-level(depth 1 )では、右下の32×32のブロックが垂直方向に2分割される。その32×32のブロックについて、cu_split_flag の値は分割しないことを示す値(本実施形態では、0)であるが、BT 1-level(depth 1 )のbt_split_flag の値は、分割することを示す値(本実施形態では、1)である。また、bt_split_vertical_flagの値は垂直方向を示す値(本実施形態では、1)である。
BT 2-level(depth 2 )では、右下の32×32のブロックに含まれる左側の16×32のブロックについては、それ以上分割されないので、bt_split_flag の値は、分割しないことを示す値(本実施形態では、0)である。
右側の16×32のブロックについては、さらに分割されるので、bt_split_flag の値は、分割することを示す値(本実施形態では、1)である。また、bt_split_vertical_flagの値は垂直方向を示す値(本実施形態では、1)である。なお、横幅(curPartW)である16も高さ(curPartH)である32も、minBTsize に達していない。
BT 3-level(depth 3 )では、右下の16×32のブロックに含まれる左側の8×32のブロックについては、それ以上分割されないので、bt_split_flag の値は、分割しないことを示す値(本実施形態では、0)である。
右側の8 ×32のブロック(図3(a)において、太線で囲まれたブロック)はさらに分割されるので、bt_split_flag の値は、分割することを示す値(本実施形態では、1)である。しかし、curPartWはminBTsize (=8)に等しいので、bt_split_vertical_flagはエントロピー符号化されず、伝送されない。
BT 4-level(depth 4 )では、右下の8 ×32のブロックに含まれる上側の8 ×16のブロックも下側の8 ×16のブロックも分割されないので、それぞれのブロックについて、bt_split_flag の値は、分割しないことを示す値(この例では、0)である。
図3(a)に示す例では、太線で囲まれた8 ×32のブロックはさらに二分木構造に基づいて水平方向に分割されるので、図18(b)に示された方式では、値が0のbt_split_vertical_flagがエントロピー符号化され、ビットストリームに含められた。しかし、太線で囲まれた8 ×32のブロックについては、curPartWはminBTsize に等しいので、そのブロックの分割方向は、一義的に水平方向に定まる。
よって、bt_split_vertical_flagのシンタクス値が伝送されなくても、映像復号装置は、curPartWがminBTsize に等しい8 ×32のブロックに関する情報(具体的には、bt_split_flag )を受信するだけで、8 ×32のブロック分割方向を認識できる。従って、本実施形態では、所定の条件(具体的には、処理対象のブロックのbt_split_flag が1、かつ、curPartWとcurPartHとのうちのいずれかがminBTsize と等しい。)が成立すると、映像符号化装置は、bt_split_vertical_flagのシンタクス値をエントロピー符号化しない。
すなわち、上述したエントロピー符号化制御器107及びエントロピー符号化器102を利用した本実施形態の映像符号化装置によれば、冗長な二分木分割方向フラグの伝送が防止されて、圧縮性能が改善される。また、冗長な二分木分割方向フラグのエントロピー符号化処理量が削減されて、処理の複雑さが低減する。
なお、ステップS103,S104の処理による条件は、処理対象のブロックがさらに二分木構造に基づいて分割されるとき、分割後のブロックのサイズがminBTsize 未満になるという条件である。よって、定式的に、
min(curPartW, curPartH)/(1+bt_split_flag) < minBTsize
と表現することもできる。ここで、min(a,b)は、a とb とのうち小さい方の値を返す関数である。
min(curPartW, curPartH)/(1+bt_split_flag) < minBTsize
と表現することもできる。ここで、min(a,b)は、a とb とのうち小さい方の値を返す関数である。
第2の実施形態.
図4は、映像復号装置の実施形態(第2の実施形態)を示すブロック図である。図4に示す映像復号装置は、多重化解除器201、エントロピー復号器202、逆量子化/逆変換器203、予測器204、バッファ205、及び、エントロピー復号制御器206を備える。
図4は、映像復号装置の実施形態(第2の実施形態)を示すブロック図である。図4に示す映像復号装置は、多重化解除器201、エントロピー復号器202、逆量子化/逆変換器203、予測器204、バッファ205、及び、エントロピー復号制御器206を備える。
多重化解除器201は、入力されるビットストリームを多重化解除して、エントロピー符号化データを抽出する。なお、多重化解除器201は、ビットストリームから、minBTsize も抽出する。
エントロピー復号器202は、エントロピー符号化データをエントロピー復号する。エントロピー復号器202は、エントロピー復号した変換量子化値を逆量子化/逆変換器203に供給し、さらに、cu_split_flag 、bt_split_flag 、bt_split_vertical_flag、skip_flag 、pred_mode_flag、split_tu_flag 、イントラ予測方向、及び、動きベクトルを供給する。
ただし、本実施形態のエントロピー復号器202は、bt_split_vertical_flagについて、上記の映像符号化装置における所定の条件と同じ条件が成立すると、エントロピー復号処理をスキップする。
逆量子化/逆変換器203は、量子化ステップ幅で、変換量子化値を逆量子化する。さらに、逆量子化/逆変換器203は、逆量子化した周波数変換係数を逆周波数変換する。
予測器204は、cu_split_flag 、bt_split_flag 、bt_split_vertical_flag、skip_flag 、pred_mode_flag、split_tu_flag 、イントラ予測方向、及び、動きベクトルに基づいて、各サブブロックの予測信号を生成する。予測信号は、上述したイントラ予測又はフレーム間予測に基づいて生成される。
逆量子化/逆変換器203で逆周波数変換された再構築予測誤差画像は、予測器204から供給される予測信号が加えられて、再構築ピクチャとしてバッファ205に供給される。そして、バッファ205に格納された再構築ピクチャがデコード画像として出力される。
上述した動作に基づいて、本実施形態の映像復号装置はデコード画像を生成する。
次に、図5のフローチャートを参照して、bt_split_flag 、及びbt_split_vertical_flagに対する、本実施形態の特徴部であるエントロピー復号制御器206及びエントロピー復号器202の動作をより詳しく説明する。
ステップS201では、エントロピー復号制御器206は、エントロピー復号されたcu_split_flag が0か否かを判断する。cu_split_flag が0の場合、ステップS202に進む。cu_split_flag が1の場合、次の四分木サブブロックの処理に進む。
ステップS202では、エントロピー復号器202は、bt_split_flag をエントロピー復号する。続いて、エントロピー復号制御器206は、ステップS203で、エントロピー復号されたbt_split_flag が0か否かを判断する。bt_split_flag が0の場合、処理を終了する。なお、エントロピー復号器202は、処理を終了する前に、skip_flag をエントロピー復号する。bt_split_flag が1の場合、ステップS204に進む。
ステップS204では、エントロピー復号制御器206は、curPartW又はcurPartHがminBTsize と等しいか否か判定する。curPartWとcurPartHとのうちのいずれかがminBTsize と等しいとき、ステップS206に進む。すなわち、エントロピー復号制御器206は、エントロピー復号器202に、bt_split_vertical_flagのエントロピー復号処理をスキップさせる。curPartWとcurPartHとのいずれもがminBTsize と等しくないとき、ステップS205に進む。
ステップS205では、エントロピー復号器202は、処理対象のサブブロックのbt_split_vertical_flagをエントロピー復号する。そして、次の二分木サブブロック(二分木構造に基づく分割後のブロック)の処理に進む。なお、次の二分木サブブロックの処理は、ステップS202以降の処理である。
ステップS206〜S208において、エントロピー復号制御器206は、エントロピー復号処理がスキップされたbt_split_vertical_flagの値を導出する。
具体的には、ステップS206で、エントロピー復号制御器206は、min(curPartW)/(1+bt_split_flag) < minBTsizeであるか否かを判定する。min(curPartW)/(1+bt_split_flag) < minBTsizeであるときには、ステップS207で、エントロピー復号制御器206は、bt_split_vertical_flagの値を0(水平方向に分割されることを示す。)にする。min(curPartW)/(1+bt_split_flag) ≧ minBTsize であるときには、ステップS208で、エントロピー復号制御器206は、bt_split_vertical_flagの値を1(垂直方向に分割されることを示す。)にする。そして、次の二分木サブブロック(二分木構造に基づく分割後のブロック)の処理に進む。
なお、min(curPartW)/(1+bt_split_flag) < minBTsizeは、処理対象のサブブロックがさらに二分木構造に基づいて分割されるとき、分割後のサブブロックの横幅がminBTSize 未満となるかを示す条件である。よって、エントロピー復号制御器206は、ステップS206で、min(curPartH)/(1+bt_split_flag) < minBTsizeという条件を用いて、min(curPartH)/(1+bt_split_flag) < minBTsizeであるときには、bt_split_vertical_flagの値を1(垂直方向に分割されることを示す。)にし、min(curPartH)/(1+bt_split_flag) ≧ minBTsize であるときには、bt_split_vertical_flagの値を0(水平方向に分割されることを示す。)に設定してもよい。
次に、本実施形態の発明の効果を説明する。上述したエントロピー復号制御器206とエントロピー復号器202を利用した本実施形態の映像復号装置によれば、冗長な二分木分割方向フラグのエントロピー復号が防止され、処理の複雑さが低減する。
冗長性を排除する利点は以下の通りである。
すなわち、映像符号化と映像復号における冗長なbt_split_vertical_flagのエントロピー符号化処理及びエントロピー復号処理の削減効果と、パラメータ値の組合せエラー防止による映像符号化と映像復号間の相互運用性向上である。
なお、上記の第1の実施形態及び第2の実施形態では、minBTsize は、最小の横幅と最小の高さとの双方を意味しているとしたが、最小の横幅と最小の高さとは別個に設定されてもよい。その場合には、図2に示されたステップS104の処理及び図5に示されたステップS204の処理において、curPartWが最小の横幅と比較されるとともに、curPartHが最小の高さと比較される。
上記の各実施形態を、ハードウェアで構成することも可能であるが、コンピュータプログラムにより実現することも可能である。
図6に示す情報処理システムは、プロセッサ1001、プログラムメモリ1002、映像データを格納するための記憶媒体1003及びビットストリームを格納するための記憶媒体1004を備えている。記憶媒体1003と記憶媒体1004とは、別個の記憶媒体であってもよいし、同一の記憶媒体からなる記憶領域であってもよい。記憶媒体として、ハードディスク等の磁気記憶媒体を用いることができる。
図6に示された情報処理システムにおいて、プログラムメモリ1002には、図1及び図4に示された各ブロック(バッファのブロックを除く)の機能を実現するためのプログラムが格納される。そして、プロセッサ1001は、プログラムメモリ1002に格納されているプログラムに従って処理を実行することによって、上記の実施形態の映像符号化装置及び映像復号装置の機能を実現する。
図7は、映像符号化装置の主要部を示すブロック図である。図7に示すように、映像符号化装置10は、四分木構造に基づいてブロックを分割するかしないかを示すフラグ(例えば、cu_split_flag )をエントロピー符号化する四分木分割フラグ符号化部11(実施形態では、エントロピー符号化器102で実現される。)と、四分木終端ノードのスキップフラグをエントロピー符号化するスキップフラグ符号化部12(実施形態では、エントロピー符号化器102で実現される。)と、四分木終端ノードのブロックを二分木構造に基づいて分割するかしないかを示すフラグ(例えば、bt_split_flag )及び分割方向を示す水平/垂直分割方向フラグ(例えば、bt_split_vertical_flag)をエントロピー符号化する二分木情報符号化部13(実施形態では、エントロピー符号化器102で実現される。)と、二分木構造に基づく分割の最小サイズを示す情報(例えば、minBTsize )をビットストリームに多重化するサイズ多重化部14(実施形態では、多重化器106で実現される。)とを備え、二分木情報符号化部13は、最小サイズと等しいサイズのノードがさらに二分木構造に基づいて分割されるときには、ノードにおける水平/垂直分割方向フラグをエントロピー符号化しない。
図8は、映像復号装置の主要部を示すブロック図である。図8に示すように、映像復号装置20は、四分木終端ノードのスキップフラグをエントロピー復号するスキップフラグ復号部21(実施形態では、エントロピー復号器202で実現される。)と、四分木終端ノードのブロックを二分木構造に基づいて分割するかしないかを示すフラグ(例えば、bt_split_flag )及び分割方向を示す水平/垂直分割方向フラグ(例えば、bt_split_vertical_flag)をエントロピー復号する二分木情報復号部22(実施形態では、エントロピー復号器202で実現される。)と、二分木構造に基づく分割の最小サイズを示す情報(例えば、minBTsize )をビットストリームから抽出するサイズ抽出部23(実施形態では、多重化解除器201で実現される。)とを備え、二分木情報復号部22は、最小サイズと等しいサイズのノードがさらに二分木構造に基づいて分割されるときには、ノードにおける水平/垂直分割方向フラグをエントロピー復号しない。
映像復号装置20は、エントロピー復号されない水平/垂直分割方向フラグの値として、最小サイズを満たす値を設定するサイズ設定部(実施形態では、エントロピー復号制御器206で実現される。)を備えていてもよい。なお、最小サイズを満たす値は、最小サイズよりも小さいサブブロックに分割されない(具体的には、横幅及び高さともに最小値よりも小さくならない。)ことを特定可能な値である。
以上、実施形態および実施例を参照して本願発明を説明したが、本願発明は上記実施形態および実施例に限定されるものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。
この出願は、2016年12月26日に出願された日本特許出願2016−251290を基礎とする優先権を主張し、その開示の全てをここに取り込む。
10 映像符号化装置
11 四分木分割フラグ符号化部
12 スキップフラグ符号化部
13 二分木情報符号化部
14 サイズ多重化部
20 映像復号装置
21 スキップフラグ復号部
22 二分木情報復号部
23 サイズ抽出部
101 変換/量子化器
102 エントロピー符号化器
103 逆量子化/逆変換器
104 バッファ
105 予測器
106 多重化器
107 エントロピー符号化制御器
201 多重化解除器
202 エントロピー復号器
203 逆量子化/逆変換器
204 予測器
205 バッファ
206 エントロピー復号制御器
1001 プロセッサ
1002 プログラムメモリ
1003 記憶媒体
1004 記憶媒体
11 四分木分割フラグ符号化部
12 スキップフラグ符号化部
13 二分木情報符号化部
14 サイズ多重化部
20 映像復号装置
21 スキップフラグ復号部
22 二分木情報復号部
23 サイズ抽出部
101 変換/量子化器
102 エントロピー符号化器
103 逆量子化/逆変換器
104 バッファ
105 予測器
106 多重化器
107 エントロピー符号化制御器
201 多重化解除器
202 エントロピー復号器
203 逆量子化/逆変換器
204 予測器
205 バッファ
206 エントロピー復号制御器
1001 プロセッサ
1002 プログラムメモリ
1003 記憶媒体
1004 記憶媒体
Claims (9)
- 四分木と二分木とに基づくブロック分割構造を用いる映像符号化方法であって、
四分木構造に基づいてブロックを分割するかしないかを示すフラグをエントロピー符号化するステップと、
四分木終端ノードのスキップフラグをエントロピー符号化するステップと、
前記四分木終端ノードのブロックを二分木構造に基づいて分割するかしないかを示すフラグ及び分割方向を示す水平/垂直分割方向フラグをエントロピー符号化するステップと、
前記二分木構造に基づく分割の最小サイズを示す情報をビットストリームに多重化するステップとを含み、
前記最小サイズと等しいサイズのノードがさらに前記二分木構造に基づいて分割されるときには、前記ノードにおける水平/垂直分割方向フラグをエントロピー符号化しない
ことを特徴とする映像符号化方法。 - 四分木と二分木とに基づくブロック分割構造を用いる映像復号方法であって、
四分木終端ノードのスキップフラグをエントロピー復号するステップと、
前記四分木終端ノードのブロックを二分木構造に基づいて分割するかしないかを示すフラグ及び分割方向を示す水平/垂直分割方向フラグをエントロピー復号するステップと、
前記二分木構造に基づく分割の最小サイズを示す情報をビットストリームから抽出するステップとを含み、
前記最小サイズと等しいサイズのノードがさらに前記二分木構造に基づいて分割されるときには、前記ノードにおける水平/垂直分割方向フラグをエントロピー復号しない
ことを特徴とする映像復号方法。 - エントロピー復号されない水平/垂直分割方向フラグの値として、前記最小サイズを満たす値を設定する
請求項2記載の映像復号方法。 - 四分木と二分木とに基づくブロック分割構造を用いる映像符号化装置であって、
四分木構造に基づいてブロックを分割するかしないかを示すフラグをエントロピー符号化する四分木分割フラグ符号化手段と、
四分木終端ノードのスキップフラグをエントロピー符号化するスキップフラグ符号化手段と、
前記四分木終端ノードのブロックを二分木構造に基づいて分割するかしないかを示すフラグ及び分割方向を示す水平/垂直分割方向フラグをエントロピー符号化する二分木情報符号化手段と、
前記二分木構造に基づく分割の最小サイズを示す情報をビットストリームに多重化するサイズ多重化手段とを備え、
前記二分木情報符号化手段は、前記最小サイズと等しいサイズのノードがさらに前記二分木構造に基づいて分割されるときには、前記ノードにおける水平/垂直分割方向フラグをエントロピー符号化しない
ことを特徴とする映像符号化装置。 - 四分木と二分木とに基づくブロック分割構造を用いる映像復号装置であって、
四分木終端ノードのスキップフラグをエントロピー復号するスキップフラグ復号手段と、
前記四分木終端ノードのブロックを二分木構造に基づいて分割するかしないかを示すフラグ及び分割方向を示す水平/垂直分割方向フラグをエントロピー復号する二分木情報復号手段と、
前記二分木構造に基づく分割の最小サイズを示す情報をビットストリームから抽出するサイズ抽出手段とを備え、
前記二分木情報復号手段は、前記最小サイズと等しいサイズのノードがさらに前記二分木構造に基づいて分割されるときには、前記ノードにおける水平/垂直分割方向フラグをエントロピー復号しない
ことを特徴とする映像復号装置。 - エントロピー復号されない水平/垂直分割方向フラグの値として、前記最小サイズを満たす値を設定するサイズ設定手段を備える
請求項5記載の映像復号装置。 - 四分木と二分木とに基づくブロック分割構造を用いる映像符号化方法を実施するための映像符号化プログラムであって、
コンピュータに、
四分木構造に基づいてブロックを分割するかしないかを示すフラグをエントロピー符号化する処理と、
四分木終端ノードのスキップフラグをエントロピー符号化する処理と、
前記四分木終端ノードのブロックを二分木構造に基づいて分割するかしないかを示すフラグ及び分割方向を示す水平/垂直分割方向フラグをエントロピー符号化する処理と、
前記二分木構造に基づく分割の最小サイズを示す情報をビットストリームに多重化する処理とを実行させ、
前記最小サイズと等しいサイズのノードがさらに前記二分木構造に基づいて分割されるときには、前記ノードにおける水平/垂直分割方向フラグをエントロピー符号化させない
ための映像符号化プログラム。 - 四分木と二分木とに基づくブロック分割構造を用いる映像復号方法を実施するための映像復号プログラムであって、
コンピュータに、
四分木終端ノードのスキップフラグをエントロピー復号する処理と、
前記四分木終端ノードのブロックを二分木構造に基づいて分割するかしないかを示すフラグ及び分割方向を示す水平/垂直分割方向フラグをエントロピー復号する処理と、
前記二分木構造に基づく分割の最小サイズを示す情報をビットストリームから抽出する処理とを実行させ、
前記最小サイズと等しいサイズのノードがさらに前記二分木構造に基づいて分割されるときには、前記ノードにおける水平/垂直分割方向フラグをエントロピー復号させない
ための映像復号プログラム。 - コンピュータに、エントロピー復号されない水平/垂直分割方向フラグの値として、前記最小サイズを満たす値を設定させるための請求項8記載の映像復号プログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016251290 | 2016-12-26 | ||
JP2016251290 | 2016-12-26 | ||
PCT/JP2017/041084 WO2018123313A1 (ja) | 2016-12-26 | 2017-11-15 | 映像符号化方法、映像復号方法、映像符号化装置、映像復号装置及びプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JPWO2018123313A1 true JPWO2018123313A1 (ja) | 2019-10-31 |
Family
ID=62707265
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018558886A Pending JPWO2018123313A1 (ja) | 2016-12-26 | 2017-11-15 | 映像符号化方法、映像復号方法、映像符号化装置、映像復号装置及びプログラム |
Country Status (8)
Country | Link |
---|---|
US (1) | US20200296366A1 (ja) |
EP (1) | EP3562154A4 (ja) |
JP (1) | JPWO2018123313A1 (ja) |
KR (1) | KR20180110064A (ja) |
CN (1) | CN108702507A (ja) |
AR (1) | AR110439A1 (ja) |
RU (1) | RU2720358C1 (ja) |
WO (1) | WO2018123313A1 (ja) |
Families Citing this family (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116866564A (zh) * | 2016-10-04 | 2023-10-10 | 株式会社Kt | 用于处理视频信号的方法和装置 |
KR102543953B1 (ko) * | 2018-04-19 | 2023-06-20 | 엘지전자 주식회사 | 영상의 처리 방법 및 이를 위한 장치 |
WO2020084602A1 (en) * | 2018-10-26 | 2020-04-30 | Beijing Bytedance Network Technology Co., Ltd. | Signaling of partition information |
CN118233633A (zh) * | 2018-11-08 | 2024-06-21 | 交互数字Vc控股公司 | 基于块的表面的视频编码或解码的量化 |
CN111277828B (zh) * | 2018-12-04 | 2022-07-12 | 华为技术有限公司 | 视频编解码方法、视频编码器和视频解码器 |
CN111355951B (zh) | 2018-12-24 | 2023-11-10 | 华为技术有限公司 | 视频解码方法、装置及解码设备 |
CN111385572B (zh) * | 2018-12-27 | 2023-06-02 | 华为技术有限公司 | 预测模式确定方法、装置及编码设备和解码设备 |
WO2020134817A1 (zh) * | 2018-12-27 | 2020-07-02 | 华为技术有限公司 | 预测模式确定方法、装置及编码设备和解码设备 |
CN113508588B (zh) * | 2019-01-02 | 2024-07-23 | 弗劳恩霍夫应用研究促进协会 | 编码和解码图像 |
CN113366855A (zh) * | 2019-02-03 | 2021-09-07 | 北京字节跳动网络技术有限公司 | 基于条件的非对称四叉树分割 |
CN113454994B (zh) | 2019-03-21 | 2022-03-01 | 三星电子株式会社 | 用于对具有针对每个块形状设置的块尺寸的视频进行编码/解码的方法和装置 |
WO2020228717A1 (en) | 2019-05-13 | 2020-11-19 | Beijing Bytedance Network Technology Co., Ltd. | Block dimension settings of transform skip mode |
WO2020233664A1 (en) * | 2019-05-22 | 2020-11-26 | Beijing Bytedance Network Technology Co., Ltd. | Sub-block based use of transform skip mode |
CA3148299C (en) | 2019-07-26 | 2024-06-04 | Beijing Bytedance Network Technology Co., Ltd. | Determination of picture partition mode based on block size |
US11388401B2 (en) * | 2020-06-26 | 2022-07-12 | Google Llc | Extended transform partitions for video compression |
CN115278259A (zh) * | 2022-07-12 | 2022-11-01 | 重庆邮电大学 | 基于纹理特性的vvc多叉树结构快速决策方法及存储介质 |
WO2024099024A1 (en) * | 2022-11-11 | 2024-05-16 | Mediatek Inc. | Methods and apparatus of arbitrary block partition in video coding |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7660475B2 (en) * | 2004-12-22 | 2010-02-09 | Ntt Docomo, Inc. | Method and apparatus for coding positions of coefficients |
KR101813189B1 (ko) * | 2010-04-16 | 2018-01-31 | 에스케이 텔레콤주식회사 | 영상 부호화/복호화 장치 및 방법 |
CA2838575C (en) * | 2011-07-11 | 2018-06-12 | Panasonic Corporation | Image decoding method, image coding method, image decoding apparatus, image coding apparatus, and image coding and decoding apparatus |
US9332283B2 (en) * | 2011-09-27 | 2016-05-03 | Broadcom Corporation | Signaling of prediction size unit in accordance with video coding |
JP5972888B2 (ja) * | 2011-09-29 | 2016-08-17 | シャープ株式会社 | 画像復号装置、画像復号方法および画像符号化装置 |
JP6318729B2 (ja) * | 2014-03-14 | 2018-05-09 | 三菱電機株式会社 | 端末装置及びデータ管理装置 |
WO2016090568A1 (en) * | 2014-12-10 | 2016-06-16 | Mediatek Singapore Pte. Ltd. | Binary tree block partitioning structure |
WO2016203881A1 (ja) * | 2015-06-18 | 2016-12-22 | シャープ株式会社 | 算術復号装置及び算術符号化装置 |
-
2017
- 2017-11-15 KR KR1020187025696A patent/KR20180110064A/ko not_active Application Discontinuation
- 2017-11-15 CN CN201780015512.7A patent/CN108702507A/zh active Pending
- 2017-11-15 WO PCT/JP2017/041084 patent/WO2018123313A1/ja active Application Filing
- 2017-11-15 EP EP17889238.6A patent/EP3562154A4/en not_active Withdrawn
- 2017-11-15 RU RU2018131581A patent/RU2720358C1/ru active
- 2017-11-15 JP JP2018558886A patent/JPWO2018123313A1/ja active Pending
- 2017-11-15 US US16/082,018 patent/US20200296366A1/en not_active Abandoned
- 2017-12-22 AR ARP170103656A patent/AR110439A1/es unknown
Also Published As
Publication number | Publication date |
---|---|
CN108702507A (zh) | 2018-10-23 |
KR20180110064A (ko) | 2018-10-08 |
EP3562154A1 (en) | 2019-10-30 |
RU2720358C1 (ru) | 2020-04-29 |
EP3562154A4 (en) | 2019-12-25 |
WO2018123313A1 (ja) | 2018-07-05 |
AR110439A1 (es) | 2019-03-27 |
US20200296366A1 (en) | 2020-09-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2018123313A1 (ja) | 映像符号化方法、映像復号方法、映像符号化装置、映像復号装置及びプログラム | |
KR101645787B1 (ko) | 인트라 예측 방법과 이를 이용한 부호화기 및 복호화기 | |
US20220232203A1 (en) | Methods and Apparatuses for Transform Skip Mode Information Signaling | |
EP2942958B1 (en) | Coding unit split signaling for pcm coded blocks | |
US10841588B2 (en) | Video encoding device, video decoding device, video encoding method, video decoding method, and program using inter prediction | |
WO2018123316A1 (ja) | 映像符号化方法、映像復号方法、映像符号化装置、映像復号装置及びプログラム | |
WO2018123314A1 (ja) | 映像符号化方法、映像復号方法、映像符号化装置、映像復号装置及びプログラム | |
WO2018123312A1 (ja) | 映像符号化方法、映像復号方法、映像符号化装置、映像復号装置及びプログラム | |
WO2018123315A1 (ja) | 映像符号化方法、映像復号方法、映像符号化装置、映像復号装置及びプログラム | |
WO2018123317A1 (ja) | 映像符号化方法、映像復号方法、映像符号化装置、映像復号装置及びプログラム | |
JP6590412B2 (ja) | 映像符号化装置、方法及びプログラム、並びに映像復号装置、方法及びプログラム | |
US10110892B2 (en) | Video encoding device, video decoding device, video encoding method, video decoding method, and program | |
KR20200054052A (ko) | 화면내 블록 복사를 사용하는 비디오 신호 처리 방법 및 장치 | |
KR20150021075A (ko) | 비디오 인코딩 장치, 비디오 디코딩 장치, 비디오 인코딩 방법, 비디오 디코딩 방법 및 프로그램 |