JP2021528003A - ビデオコーディングにおけるサブタイルを含むタイルパーティション - Google Patents
ビデオコーディングにおけるサブタイルを含むタイルパーティション Download PDFInfo
- Publication number
- JP2021528003A JP2021528003A JP2020570501A JP2020570501A JP2021528003A JP 2021528003 A JP2021528003 A JP 2021528003A JP 2020570501 A JP2020570501 A JP 2020570501A JP 2020570501 A JP2020570501 A JP 2020570501A JP 2021528003 A JP2021528003 A JP 2021528003A
- Authority
- JP
- Japan
- Prior art keywords
- picture
- tile
- segment
- partition structure
- subsegment
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000005192 partition Methods 0.000 title claims abstract description 207
- 238000000034 method Methods 0.000 claims abstract description 177
- 238000000638 solvent extraction Methods 0.000 claims abstract description 35
- 239000011159 matrix material Substances 0.000 claims description 57
- 238000009795 derivation Methods 0.000 claims description 37
- 238000000926 separation method Methods 0.000 claims description 33
- 230000015654 memory Effects 0.000 claims description 26
- 238000012545 processing Methods 0.000 claims description 26
- 238000004590 computer program Methods 0.000 claims description 8
- 238000004891 communication Methods 0.000 claims description 7
- 238000013139 quantization Methods 0.000 claims description 7
- 230000003287 optical effect Effects 0.000 claims description 3
- 230000004044 response Effects 0.000 claims 3
- 238000010586 diagram Methods 0.000 abstract description 30
- 230000000875 corresponding effect Effects 0.000 description 28
- 230000006870 function Effects 0.000 description 22
- 230000008569 process Effects 0.000 description 19
- 230000011664 signaling Effects 0.000 description 13
- 239000002245 particle Substances 0.000 description 10
- 241000023320 Luma <angiosperm> Species 0.000 description 8
- OSWPMRLSEDHDFF-UHFFFAOYSA-N methyl salicylate Chemical compound COC(=O)C1=CC=CC=C1O OSWPMRLSEDHDFF-UHFFFAOYSA-N 0.000 description 8
- 230000033001 locomotion Effects 0.000 description 7
- 239000013598 vector Substances 0.000 description 6
- 101000878595 Arabidopsis thaliana Squalene synthase 1 Proteins 0.000 description 5
- 230000006835 compression Effects 0.000 description 5
- 238000007906 compression Methods 0.000 description 5
- 230000001419 dependent effect Effects 0.000 description 5
- 230000002123 temporal effect Effects 0.000 description 5
- 238000001914 filtration Methods 0.000 description 4
- 238000013468 resource allocation Methods 0.000 description 4
- 238000003491 array Methods 0.000 description 3
- 230000000007 visual effect Effects 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000005202 decontamination Methods 0.000 description 2
- 230000003588 decontaminative effect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000004886 head movement Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 238000009877 rendering Methods 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 101710143285 4-phosphopantoate-beta-alanine ligase Proteins 0.000 description 1
- 240000006829 Ficus sundaica Species 0.000 description 1
- 102100024368 Inositol polyphosphate 5-phosphatase K Human genes 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 230000001010 compromised effect Effects 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 229920000069 polyphenylene sulfide Polymers 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 230000032258 transport Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/119—Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/11—Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/124—Quantisation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/172—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/174—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/46—Embedding additional information in the video signal during the compression process
- H04N19/463—Embedding additional information in the video signal during the compression process by compressing encoding parameters before transmission
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/593—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/90—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
- H04N19/96—Tree coding, e.g. quad-tree coding
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
【選択図】図12A
Description
コンテキスト適応型バイナリ算術コーディング(CABAC)は、HEVCおよびVVCで使用されるエントロピーコーディングツールである。CABACは、複雑さを低く保ち、より頻繁に使用されるシンボルのビットの確率のモデリングを可能にするバイナリシンボルを符号化するように設定される。コーディングモードは、一般に、局所的に良好に相関しているので、確率モデルは、局所的なコンテキストに基づいて適応的に選択される。
HEVCにおけるスライスの概念は、ピクチャを独立してコード化されたスライスに分割し、各スライスは、CTUの単位でラスタ走査順序で読み取られる。同じピクチャのスライスに、異なるコーディングタイプを使用することができる。たとえば、スライスは、Iスライス、Pスライス、またはBスライスのいずれかとすることができる。しかしながら、スライスの主な目的は、データが失われた場合に再同期を可能にすることである。
HEVCビデオコーディング規格はまた、ピクチャを長方形の空間的に独立した領域に分割する「タイル」と呼ばれるツールを含む。タイルを使用して、HEVCにおけるピクチャを、任意の所与のタイルが所与の行と所与の列との交点に位置するサンプルの行および列にパーティショニングすることができる。図2は、4行のタイルおよび5列のタイルを使用したタイルパーティショニングの一例を示しており、その結果、そのピクチャについて合計20個のタイルが得られる。図2に見られるように、HEVCにおけるタイルは、常に、CTU境界と整合される。
図7は、ピクチャ10に復号されるビットストリーム12を示す。図8は、64のユニットUにパーティショニングされたピクチャ10を示す。図11A〜図11Cは、図11Bに示されるようなサブセグメント(たとえば、T1−1、T1−2、T1−3、T1−4)も使用する、図11Aに示される64のユニットUを有する別の例示的なピクチャ10を示す。ユニットUの一例は、H.264から知られているマクロブロックである。ユニットUの別の例は、HEVCから知られているCTUである。
図9に見られるように、ビデオストリーム内のピクチャ10またはピクチャ10の一部は、空間パーティション構造Sに分割され、パーティション構造Sは、少なくとも3つのセグメントT1、T2、T3を含む。各セグメントT1、T2、T3は、ユニットUを含み、セグメントT1、T2、T3のうちの少なくとも1つは、2つ以上のユニットUを含む。ユニットUの空間サイズは、ビットストリーム12の1つまたは複数のコードワード17でシグナリングされ、そこから復号される。加えて、ビットストリーム12内の少なくとも1つのコード化セグメントTのサイズまたは位置を示す1つまたは複数のコードワード16が、ビットストリーム12から構文解析される。
第1の実施形態では、フレキシブルタイルは、あらかじめ規定された順序で走査され、タイル幅およびタイル高さは、タイルごとに指定される。1つまたは複数の実施形態では、あらかじめ規定された順序は、たとえば、ユニット(たとえば、CTU)に沿ったラスタ走査順序であり、タイルサイズはユニットで指定される。代替的に、あらかじめ規定された順序は、サブセグメントに沿ったラスタ走査順序であり、タイルサイズは、サブセグメントに関して指定される。
tiles_enabled_flag:このフラグは、1または0の値に設定され得る。1に設定されているとき、このフラグは、PPSを参照する各ピクチャ内にタイルが複数あることを指定する。0に設定されているとき、このフラグは、PPSを参照する各ピクチャ内にタイルが1つしかないことを指定する。
flexible_tiles_enabled_flag:このフラグは、1または0の値に設定され得る。1に設定されているとき、このフラグは、PPSを参照するピクチャをタイルにパーティショニングするためにフレキシブルタイルが使用されることを指定する。flexible_tiles_enabled_flag=0は、PPSを参照するピクチャをタイルにパーティショニングするためにフレキシブルタイルが使用されないことを指定する。
sub−tile_width_minus1 plus 1は、コーディングツリーユニット内のサブタイルユニットの幅を指定する。sub−tile_width_minus1は、0からPicWidthInCtbsY−1の範囲内であるものとする。
sub−tile_height_minus1 plus 1は、コーディングツリーユニット内のサブタイルユニットの高さを指定する。sub−tile_height_minus1は、0からPicHeightInCtbsY−1の範囲内であるものとする。
tile_width_minus1[i] plus 1は、サブタイル幅ユニットの単位でi番目のタイルの幅を指定する。
tile_height_minus1[i] plus 1は、サブタイル高さユニットの単位でi番目のタイルの高さを指定する。
read_more_tiles()は、以下のように指定される。
・タイルに割り振られていないCTUがピクチャ内に少なくとも1つある場合、read_more_tiles()の戻り値は、TRUEに等しい。
・そうでなければ、read_more_tiles()の戻り値は、FALSEに等しい。
[tile_coordinate_y+y][tile_coordinate_x+x]=tile_id:
1.tile_coordinate_y+yは、PicHeightInCtbsY未満でなければならない。
2.tile_coordinate_x+xは、PicWidthInCtbsY未満でなければならない。
3.CTU_tile_assignment[tile_coordinate_y+y][tile_coordinate_x+x]は、「タイル無し」に等しくなければならない。
タイルT1の高さおよび幅は、サブタイルユニットAにおいて1×1として指定される。
タイルT2の高さおよび幅は、サブタイルユニットAにおいて1×2として指定される。
タイルT3の高さおよび幅は、サブタイルユニットBにおいて1×1として指定される。
タイルT4の高さおよび幅は、サブタイルユニットBにおいて1×1として指定される。
タイルT5の高さおよび幅は、サブタイルユニットBにおいて1×2として指定される。
好ましい実施形態では、タイルパーティション構造は、任意選択でサブタイルユニットを使用して、タイルの高さおよび幅をシグナリングすることによって搬送される。タイルは、整数個のサブタイルからなり、サブタイルは、CTUのような整数個のコーディングユニットからなる。コーディングユニットまたはサブタイルの空間サイズは、(たとえば、コーディングユニットに関して)ビットストリームでシグナリングされる。
1)任意の他のタイルにコピーされない、これは、次のタイルサイズが、幅および高さを使用して明示的にシグナリングされることを意味する、または
2)次のタイルにコピーされる、または
3)次のn個のタイルにコピーされる、ここでは、コピーする回数がシグナリングされる。
tiles_enabled_flag=1は、PPSを参照する各ピクチャ内にタイルが複数あることを指定する。tiles_enabled_flag=0は、PPSを参照する各ピクチャ内にタイルが1つしかないことを指定する。tiles_enabled_flag値が、CVS内でアクティブ化されるすべてのPPSについて同じであることが、ビットストリーム適合の要件である。
flexible_tiles_enabled_flag=1は、PPSを参照するピクチャをタイルにパーティショニングするためにフレキシブルタイルが使用されることを指定する。flexible_tiles_enabled_flag=0は、PPSを参照するピクチャをタイルにパーティショニングするためにフレキシブルタイルが使用されないことを指定する。flexible_tiles_enabled_flag=1である場合、変数tile_idの値および2次元配列CTU_tile_assigmentの値は次のように指定される。
number_of_tiles_in_picture_minus2 plus 2は、ピクチャ内のタイル数を指定する。number_of_tiles_in_picture_minus2は、0からPicSizeInCtbsY−2の範囲内であるものとする。
subtile_width_minus1 plus 1は、コーディングツリーユニット内のサブタイルユニットの幅を指定する。subtile_width_minus1は、0からPicWidthInCtbsY−1の範囲内であるものとする。
subtile_height_minus1 plus 1は、コーディングツリーユニット内のサブタイルユニットの高さを指定する。subtile_height_minus1は、0からPicHeightInCtbsY−1の範囲内であるものとする。
use_previous_tile_size_flag=1は、現在のタイルのサイズが前のタイルのサイズに等しいことを指定する。use_previous_tile_size_flag=0は、現在のタイルのサイズが前のタイルのサイズと等しくないことを指定する。存在しない場合、use_previous_tile_size_flagの値は0に等しいと推定される。
tile_height_minus1[i]=tile_height_minus1[i−1]
tile_width_minus1[i]=tile_width_minus1[i−1]
tile_width_minus1[i] plus 1は、タイルユニット内のi番目のタイルの幅を指定する。
tile_height_minus1[i] plus 1は、タイルユニット内のi番目のタイルの高さを指定する。
1.tile_coordinate_y+ctu_yの値は、PicHeightInCtbsY未満であるものとする。
2.tile_coordinate_x+ctu_xの値は、PicWidthInCtbsY未満であるものとする。
3.CTU_tile_assignment[tile_coordinate_x+ctu_x][tile_coordinate_y+ctu_y]の値は、「タイル無し」に等しいものとする。
1.use_previous tile_size_flagが存在しない場合
2.use_previous tile_size_flagが0に等しいとき、および
3.use_previous tile_size_flagが1に等しいとき。
第4の実施形態では、本開示は、所与のユニット、たとえば、ユニットU、またはサブタイル、たとえば、サブタイルSSが、新しいタイルを開始するか、開始しないかを決定するための方法を提供する。たとえば、サブタイルおよび/またはユニットのサイズが規定され、次いで、符号化または復号のためにあらかじめ規定された順序(たとえば、ラスタ走査順序)で走査される。
tiles_enabled_flag:このフラグが1に設定されると、PPSを参照する各ピクチャ内にタイルが複数あることを指定する。このフラグが0に設定されると、PPSを参照する各ピクチャ内にタイルが1つしかないことを指定する。
tiles_status_flag_enabled このフラグが1に設定されると、タイリング構造がステータスフラグ方法を使用してシグナリングされることを指定する。このフラグが0に設定されると、タイリング構造がタイルステータスフラグ方法を使用してシグナリングされないことを指定する。
ctu_status[i] これが0に設定されると、copy_id()を使用して、現在のCTUのタイルIDが使用可能な近接するタイルからコピーされることを指定する。これが1に設定されると、set_new_id()を使用して、現在のCTUに新しいタイルIDが設定されることを指定する。
exist():この関数は、タイルID(tileIdAboveLeft、tileIdAbove、またはtileIdLeft)を有する近接するブロックについてタイルIDが存在するかどうかを示す。
set_new_id():この関数は、現在のCTUについて新しいタイルIDを設定する。
copy_id():この関数は、表4に提供される詳細に従って、近接するブロックからタイルIDをコピーする。
assign_ctu_to_tile():この関数は、ctu_statusフラグおよびctu_status_disambiguatorフラグを使用して、所与のCTUを明示的なタイルIDに割り振る。この関数はまた、所与のCTUのすぐ左側、所与のCTUのすぐ上、および所与のCTUのすぐ上と左側(すなわち、斜め上)に配置された近接CTUが存在する場合、そのステータスを所与のCTUに割り振る。
read_more_tiles():この関数は、以下のように、ラスタ走査順序など、あらかじめ規定された走査順序で読み取られる。
タイルに割り振られていないCTUがピクチャ内に少なくとも1つある場合、read_more_tiles()の戻り値をTRUEに設定する。
そうでなければ、read_more_tiles()の戻り値をFALSEに設定する。
図17A〜図17Cは、一実施形態によれば、図14に見られるピクチャのタイルパーティション(図17A)のctu_statusビット(図17B)を示す。この実施形態では、空であるセルは、そのCTUのビットがctu_statusでシグナリングされないことを示す。「?」インジケータは、曖昧性除去ビットが必要であることを表す。図17Cは、対応するctu_status曖昧性除去ビットを示す。
tiles_enabled_flag:このフラグが1に設定されると、各ピクチャ内の複数のタイルがPPSを参照することを示す。このフラグが0に設定されると、各ピクチャ内の単一のタイルのみがPPSを参照することを示す。
tile_flag:このフラグは、現在のCTUのタイルIDが、近接するCTUのタイルIDに等しくなるように設定されているか、または新しいタイルを開始するかを示す。
CTU_tile_assignment[x][y]=previous_tile;
tile_flagが1に等しいとき、CTU_tile_assignment[x][y]およびtile_idの値は、以下のように指定される。
CTU_tile_assignment[x][y]=tile_id;
tile_id=tile_id+1;
tile_flag1:このフラグは、現在のCTUのタイルIDが、近接するCTUのタイルIDに等しくなるように設定されているか、または新しいタイルを開始するかを示す。
CTU_tile_assignment[x][y]=tile_id;
tile_id=tile_id+1;
tile_flag2:このフラグは、現在のCTUのタイルIDが現在のCTUのすぐ上の、または現在のCTUのすぐ左側のCTUのタイルIDに等しくなるように設定されているかを示す。
CTU_tile_assignment[x][y]=CTU_tile_assignment[x][y−1];
tile_flag2が1に設定されているとき、CTU_tile_assignment[x][y]の値は、以下のように現在のCTUのすぐ上のCTUの値に設定される。
CTU_tile_assignment[x][y]=CTU_tile_assignment[x−1][y];
第4の実施形態では、本開示は、上述の第1の実施形態によって提供されるものと同様のタイルを走査するための方法を提供する。しかしながら、この第5の実施形態は、以下の追加の特徴のうちの1つまたは複数を含む。特に、この実施形態は、以下も可能である。
1.「伝統的なタイルモード」における伝統的なタイルの使用および「フレキシブルタイルモード」におけるフレキシブルタイルの使用。動作するモードの決定は、たとえば、flexible_tiles_enabled_flagなどのフラグを使用してシグナリングされる、および/または
2.サブタイルを使用することができる。サブタイルの粒度を、明示的にシグナリングすることができる。本明細書では、サブタイルのサイズを指定するために、別の単語の粒度が使用される。たとえば、サブタイルのサイズは、xおよびy座標系において、またはユニットサイズに関して指定される。1つまたは複数の実施形態における粒度は、明示的にシグナリングされる。代替的に、粒度は、あらかじめ規定することができる。
3.タイルの特定のサイズ仕様。たとえば、この実施形態は、現在のタイルのための最新のタイルのサイズ、または現在のタイルのすぐ左または上のタイルのサイズを使用して指定することができる。指定されたサイズは、たとえば、モード値をシグナリングすることによって、現在のタイルまたはすべての残りのタイルに適用される。
tiles_enabled_flag:このフラグが1であるとき、PPSを参照する各ピクチャに複数のタイルがあることを示す。このフラグが0であるとき、PPSを参照する各ピクチャがタイルを1つしか有していないことを示す。
flexible_tiles_enabled_flag:このフラグが1であるとき、フレキシブルタイルが規定されていることを示す。このフラグが0であるとき、フレキシブルタイルシンタックスを使用せずにタイルが規定されていることを示す。
sub_tiles_flag:このフラグが1に設定されているとき、サブタイルが使用されることを示す。
tile_horizontal_granularity:この値は、コーディングツリーユニットの単位でタイル水平粒度を指定する。
tile_vertical_granularity:この値は、コーディングツリーユニットの単位でタイル垂直粒度を指定する。
copy_tile_size_mode:この値は、現在のタイルサイズに関する決定がどのように行われるべきかを示す。特に:
copy_tile_size_mode=0は、タイルサイズが明示的にシグナリングされることを示す。
copy_tile_size_mode=1は、最後にシグナリングされたサイズが使用されることを示す。
copy_tile_size_mode=2は、現在のタイルの上/左のサンプルの左側のタイルサイズが使用されることを示す。
copy_tile_size_mode=3は、現在のタイルの上/左のサンプルより上のタイルサイズが使用されることを示す。
copy_tile_size_mode=4は、最後にシグナリングされたタイルがすべての残りのタイルに使用されることを示す。
copy_tile_size_mode=5は、現在のタイルの上/左のサンプルの左側のタイルがすべての残りのタイルに使用されることを示す。
copy_tile_size_mode=6は、現在のタイルの上/左のサンプルより上のタイルがすべての残りのタイルに使用されることを示す。
copy_from_last_signaled_tile():これは、最後にシグナリングされたタイルの幅および長さを現在のタイルの幅および長さにコピーする関数である。
copy_from_above_tile():これは、現在のタイルの上のタイルの幅および長さを現在のタイルの幅および長さにコピーする関数である。
copy_from_left_tile():これは、現在のタイルの左側のタイルの幅および長さを現在のタイルの幅および長さにコピーする関数である。
この実施形態では、本開示は、ピクチャをサブタイルにパーティショニングし、次いで、あらかじめ規定された走査順序でサブタイルを走査するための方法を提供する。このプロセス中、サブタイルごとにタイル識別子(タイルid)が指定される。あらかじめ規定された順序は、上述したようにラスタ走査順であり、サブタイルサイズは、1つのCTUユニットのサイズに等しいか、またはサブタイルサイズは、異なるサイズであるように指定される(たとえば、明示的なコードワードを使用して)。もちろん、当業者は、タイトル識別子が、代替または追加として、ユニットに対しても指定され得ることを理解されよう。
tiles_enabled_flag:このフラグが1に設定されているとき、PPSを参照する各ピクチャにタイルが複数あることを示す。このフラグが0に設定されているとき、PPSを参照する各ピクチャ内にタイルが1つしかないことを指定する。
sub_tile_size_equal_to_ctu_size_flag:このフラグが1に設定されているとき、サブタイルの高さおよび幅が両方ともCTUの高さおよび幅に等しいことを示す。sub_tile_size_equal_to_ctu_size_flag=0は、サブタイルの高さおよび幅が両方ともCTUの高さおよび幅に等しくないことを指定する。
num_sub_tiles_horizontal=PicWidthInCtbsY
num_sub_tiles_vertical=PicHeightInCtbsY
sub_tile_width_minus1=0
sub_tile_height_minus1=0
sub_tile_width_minus1 plus 1:この値は、コーディングツリーユニットの単位でサブタイル幅を指定する。変数num_sub_tiles_horizontalは、PicWidthInCtbsY/(sub_tile_width_minus1+1)に設定される。
sub_tile_height_minus1 plus 1:この値は、コーディングツリーユニットの単位でサブタイルの高さを指定する。変数num_sub_tiles_verticalは、PicHeightInCtbsY/(sub_tile_height_minus1+1)に設定される。
tile_id[y][x]は、座標yおよびxを有するサブタイルのタイルIDを指定する。
CTU_tile_assignmentの値:CTU_tile_assignmentの値は、たとえば以下のように指定される。
この実施形態の態様は、一意のまたは独立したサブセグメントを示すために、本明細書で説明する他の実施形態(たとえば、第5の実施形態)に適用することができる。
tiles_enabled_flag:このフラグが1に設定されているとき、PPSを参照する各ピクチャに複数のタイルがあることを示す。このフラグが0に設定されているとき、PPSを参照する各ピクチャ内にタイルが1つしかないことを示す。
flexible_tiles_enabled_flag:このフラグが1に設定されているとき、フレキシブルタイルが規定されていることを示す。このフラグが0に設定されているとき、フレキシブルタイルシンタックスを使用せずにタイルが規定されることを示す。
sub−tile_width:この値は、コーディングツリーユニットの単位でサブタイル幅を指定する。
sub−tile_height:この値は、コーディングツリーユニットの単位でサブタイルの高さを指定する。
use_zero_to_indicate_independent_tile_flag:このフラグが1に設定されているとき、独立したタイルが0に等しいtile_idでコード化されることを示す。独立したタイルは、サブタイル幅(たとえば、CTU)に等しいタイル幅と、サブタイル高さ(たとえば、CTU)に等しいタイル高さとを有するタイルである。このフラグが0に設定されているとき、独立したタイルが従属タイルと同じ方法でコード化されることを示す。
use_fixed_length_code_for_tile_id_flag:このフラグが1に設定されているとき、タイルidが固定長コーディングを使用して符号化されることを示す。このフラグが0に設定されているとき、タイルidが固定長コーディングを使用して符号化されることを示す。
number_of_unique_tile_id:これは、タイルが他のすべてのタイルに依存することを示すためにタイルIDに使用する値である。
tile_id[i][j]:この値は、座標iおよびjを有するサブタイル(たとえば、CTU)のタイルIDを指定する。
本開示の第8の実施形態では、ピクチャは、4分木および/またはフレキシブルタイルスプリッティングを使用してタイルに分割される。CUを分離するためのHEVCプロセスに類似する、4分木を使用して分割するためのこのプロセス。
tiles_enabled_flag:このフラグが1に設定されると、PPSを参照する各ピクチャに複数のタイルがあることを示す。このフラグが0に設定されると、PPSを参照する各ピクチャにタイルが1つしかないことを示す。
quadtree_split_flag:このフラグが1に設定されると、タイルは、tile_widthがctu_widthよりも大きく、tile_heightがctu_heightよりも大きい場合、4分木を使用して分離され、tile_widthがctu_widthに等しく、tile_heightがctu_heightよりも大きい場合、水平方向に分離され、tile_widthがctu_widthよりも大きく、tile_heightがctu_heightに等しい場合、垂直方向に分離されることを示す。このフラグが0に設定されると、タイルは4分木分離を使用して分離されないことを示す。tile_widthがctu_widthに等しく、tile_heightがctu_heightに等しいとき、ビットストリーム適合性は、quadtree_split_flagの値が0に等しいことを必要とすることに留意されたい。
flexible_split_flag:このフラグが1に設定されると、フレキシブルタイル分離を使用してタイルが分離されることを示す。このフラグが0に設定されると、タイルがさらに分離されないことを示す。
split_in_horizontal_direction_flag:このフラグが1に設定されると、フレキシブル分離が水平方向に行われることを示す。このフラグが0に設定されると、フレキシブル分離が垂直方向に行われることを示す。split_in_horizontal_direction_flagが存在しない場合、フラグ値は、tile_widthがctu_widthに等しく、tile_heightがctu_heightよりも大きい場合、1と推定され、tile_widthがctu_widthよりも大きく、tile_heightがctu_heightに等しい場合、0と推定される。
split_position_minus1:フレキシブル分離の分離位置をCTUの単位で指定する。split_position_minus1は、split_in_horizontal_direction_flagが1に設定されている場合、0からtile_widthー2の範囲、split_in_horizontal_direction_flagが0に等しい場合、0からtile_heightー2の範囲であるものとする。
read next_tile():この関数は、タイルを再帰的に読み取り、現在のタイルについてもはや分離を行わない場合、ラスタ走査順で次のタイルに移動する。以下のいずれかのケースに該当する場合、さらなる分離は必要ない。
1.タイル幅はCTU幅に等しく、タイル高さはCTU高さに等しい、および/または
2.flexible_split_flagは、0に設定されている。
split_tile_horizontally():この関数は、現在のタイルを、CTU高さに関して、位置tile_height/2で、タイルAおよびタイルBに水平方向に分離し、分割は整数分割である。
split_tile_vertically():この関数は、現在のタイルを、CTU幅の単位で、位置tile_width/2で、タイルAおよびタイルBに垂直方向に分離し、分割は整数分割である。
split_tile_using_quadtree():この関数は、現在のタイルを、CTU高さに関して、位置tile_height/2で、およびCTU幅に関して、tile_width/2で、タイルA、タイルB、タイルC、およびタイルDに水平方向および垂直方向に分離し、分割は整数分割である。
split_tile_using_flexible_split():この関数は、現在のタイルを、位置split_position_minus1 plus 1で、split_in_horizontal_directionが1に等しい場合、水平方向に、または、split_in_horizontal_direction_flagが0に等しい場合、垂直方向に、タイルAおよびタイルBに分離する。
この実施形態では、タイル構造は、タイル間の境界を指定することによって表される。本開示内では、タイル間の境界は、「分割線」とも呼ばれる。
tiles_enabled_flag:このフラグが1に設定されると、PPSを参照する各ピクチャに複数のタイルがあることを示す。このフラグが0に設定されると、PPSを参照する各ピクチャにタイルが1つしかないことを示す。
tile_divider_line_enabled_flag:このフラグが1に設定されると、分割線がタイリング構造を表すために使用されることを示す。このフラグが0に設定されると、分割線がタイリング構造を表すために使用されないことを示す。
horizontal_divider_lines_count:この値は、水平分割線の数を指定する。
vertical_divider_lines_count:この値は、垂直分割線の数を指定する。
horizontal_divider_lines[i]:この値は、すべての水平分割線をリストする。分割線は、その端部の座標によって指定される。このリスト内のすべての分割線は水平であるので、3つの座標は、各分割線を一意に表すのに十分であり、すなわち、単一のy値および2つのx値である。
vertical_divider_lines[i]:この値は、すべての垂直分割線をリストする。分割線は、その端部の座標によって指定される。このリスト内のすべての分割線は垂直であるので、各分割線を一意に表すのに3つの座標で十分である。すなわち、2つのy値と1つのx値である。
corner_list:これは、位置および方向によって表されるすべてのコーナー点のリストである(┌,┐,└,┘)。このリストは、すべてのピクチャ境界ならびにすべての水平および垂直の分割線(それらの交差を含む)を考慮する。
本開示のこの実施形態は、構造内にあり、特定の特性を有する点のセットを使用してタイル構造を説明する。これらの点は、本明細書では「T字接合」と呼ばれる。
tiles_enabled_flag:このフラグが1に設定されると、PPSを参照する各ピクチャに複数のタイルがあることを示す。このフラグが0に設定されると、PPSを参照する各ピクチャにタイルが1つしかないことを示す。
tiles_enabled_flag:このフラグが1に設定されると、PPSを参照する各ピクチャに複数のタイルがあることを示す。このフラグが0に設定されると、PPSを参照する各ピクチャにタイルが1つしかないことを示す。
tile_t_junction_enabled_flag:このフラグが1に設定されると、T字接合がタイリング構造を表すために使用されることを示す。
t_junction_size_minus1 plus one:この値は、シグナリングされるT字接合の数を指定する。
t_junction_new_row_seq:この値は、T字接合の数に等しい長さを有するビットシーケンスである。
t_junction_new_row_seq:この値は1で始まり、T字接合が走査線を変更するたびにトグルする。例示的なケースとして、14のタイル構造の場合、t_junction_new_row_seqは、1110010110に設定される。これを使用すると、前のT字接合と同じ走査線に位置する限り、T字接合についてxとyの両方をシグナリングする必要はない。
t_junction_list:これは、規定された走査順序でのすべてのT字接合(それらの位置および方向を含む)のリストである。
complete_tile_list:これは、すべての完成タイルを保持するリストである。完成タイルは、その4つのコーナーで指定される。complete_tile_listは、ピクチャ内のすべてのユニットを含む1つのタイルで初期化される。
update_complete_tile_list():これは、完成タイルのリストを更新する関数として規定され、以下のように表される。
update_complete_tile_list(){
・t_junction_list[i]の位置および方向を使用して、各アームが別のT字接合またはピクチャ境界に達するまで、t_junction_list[i]のすべてのアームを拡張する。
・各アームの2つの辺のユニットが同じタイルに割り振られている場合、新しく作成されたタイルを追加することによって、完成タイルリストを更新する。
}
この実施形態は、タイルの数が、通常、ピクチャ内のブロックの数よりもはるかに少ないという観察に基づいている。この実施形態は、タイリング構造を符号化するためにこのスパース性を活用する。
・開始コーナーの数(開始コーナー行列のもの)は、タイルの数に等しい。
・終了コーナーの数(開始コーナー行列のもの)は、タイルの数に等しい。
・開始コーナー行列の第1の要素は、常に1に設定される。
・終了コーナー行列の最後の要素は、常に1に設定される。
tiles_enabled_flag:このフラグが1に設定されると、PPSを参照する各ピクチャに複数のタイルがあることを示す。このフラグが0に設定されると、PPSを参照する各ピクチャにタイルが1つしかないことを示す。
sparse_matrix_compression_enabled_flag:このフラグが1に設定されると、疎行列がタイリング構造を表すために使用されることを示す。
sparse_matrix_compression_mode:これは、開始コーナー行列および終了コーナー行列にどの疎行列圧縮方法が使用されるかを示す。このモードを0に設定することは、圧縮された疎行(CSR)法が使用されることを示す。
start_corners_stream_1は、start_corners_matrixを築くために使用されている第1の配列である。この配列は、start_corners_stream_1[i]=start_corners_matrixの(i)行目の非ゼロ要素の数として構築される。
tiles_count:この値は、タイルの数を指定する。これはまた、start_corner_matrixおよびend_corner_matrixにおける非ゼロ値の数を与える。
start_corners_stream_2は、start_corners_matrixを築くために使用されている第2の配列である。この配列は、start_corners_matrixの各要素の列インデックス(0〜n−1)を含み、したがって、start_corners_matrix内の非ゼロ要素の長さの数である。
end_corners_stream_1は、end_corners_matrixを築くために使用されている第1の配列である。この配列は、end_corners_stream_1[i]=end_corners_matrixの(i)行目の非ゼロ要素の数として構築される。
end_corners_stream_2は、end_corners_matrixを築くために使用されている第2の配列である。この配列は、end_corners_matrixの各要素の列インデックス(0〜n−1)を含み、したがって、end_corners_matrix内の非ゼロ要素の長さの数である。
start_corners_matrixは、2つの配列start_corners_stream1およびstart_corners_stream_2によって一意に規定される開始コーナーの行列である。
end_corners_matrixは、2つの配列end_corners_stream1およびend_corners_stream_2によって一意に規定される終了コーナーの行列である。
complete_tile_listは、空のリストとして初期化された完成タイルのリストである。
update_complete_tile_list()は、start_corners_matrixおよびend_corners_matrixからタイルを読み取り、complete_tile_listにタイルを追加する関数である。ラスタ走査方向を左から右、上から下と仮定すると、この関数は以下のように表される。
update_complete_tile_list(){
・start_corners_matrixでラスタ走査方向に最初の1の値を見つける。
・end_corners_matrixで対応する1の値を見つける。
・開始コーナーおよび終了コーナーの座標を使用して、complete_tile_listにタイルを追加する。
・start_corners_matrixで対応する開始コーナーをゼロに設定する。
}
Claims (57)
- ピクチャを復号する方法(30)であって、
複数のコード化セグメントと、前記複数のコード化セグメントに関連付けられた情報とを含むビットストリーム(12)を受信する(32)ことと、
前記ビットストリーム内の前記情報から、
前記ピクチャを複数のピクチャセグメントに分割するパーティション構造であって、
各ピクチャセグメントは、前記複数のコード化セグメントのうちの1つに対応し、1つまたは複数のサブセグメントを含み、
少なくとも1つのピクチャセグメントは、少なくとも2つのサブセグメントを含み、
各サブセグメントは、複数のユニットを含み、各ユニットは、前記ピクチャの領域に対応する、
パーティション構造と、
前記パーティション構造のサブセグメントのサブセグメントサイズと、
前記パーティション構造のユニットのユニットサイズと、
を導出する(34)ことと、
前記パーティション構造に従って、前記ビットストリームで受信された前記複数のコード化セグメントを復号すること(38)であって、前記ピクチャセグメントのうちの所与の1つの第2のユニット(U3)についてのイントラ予測モードの導出は、前記ピクチャセグメントのうちの前記所与の1つの第1のユニット(U2)についての導出されたイントラ予測モードに依存し、任意の他のピクチャセグメントのユニットについての任意のイントラ予測モードから独立している、前記複数のコード化セグメントを復号すること(38)と
を含む、方法(30)。 - 前記第1のユニットの量子化パラメータ値に基づいて、他のピクチャセグメントのユニットの任意の量子化パラメータ値から独立して、前記第2のユニットの量子化パラメータ値を導出すること(36)をさらに含む、請求項1に記載の方法。
- 前記パーティション構造を導出することは、前記ビットストリームを送るエンコーダがフレキシブルパーティショニングを使用しているというインジケーションを受信したこと(62)に応答して、前記パーティション構造を導出することを含む、請求項1または2に記載の方法。
- 前記パーティション構造を導出することは、前記ビットストリームを送るエンコーダがサブセグメントを使用しているというインジケーション(181)を受信したことに応答して、前記パーティション構造を導出することを含む、請求項1または2に記載の方法。
- 前記ビットストリームにおいて受信された前記複数のコード化セグメントを復号することは、あらかじめ規定された復号順序に従って各ピクチャセグメントを復号すること(66)を含む、請求項1から4のいずれか一項に記載の方法。
- 前記あらかじめ規定された復号順序は、ラスタ走査順序である、請求項5に記載の方法。
- サブセグメントサイズを導出することは、前記パーティション構造がサブセグメントを含むというインジケーションを受信したことに応答して、前記サブセグメントの前記サブセグメントサイズを選択的に導出すること(182)を含む、請求項1から6のいずれか一項に記載の方法。
- サブセグメントサイズを導出することは、第1のサブセグメントの第1のサブセグメントサイズ、および第2のサブセグメントの第2のサブセグメントサイズを導出することを含み、前記第1のサブセグメントサイズおよび前記第2のサブセグメントサイズが異なる、請求項1から7のいずれか一項に記載の方法。
- 前記パーティション構造を導出することは、近接するピクチャセグメントからピクチャセグメントのセグメントサイズをコピーすること(152、156、164、168)をさらに含む、請求項1から8のいずれか一項に記載の方法。
- 前記複数のコード化セグメントに関連付けられた前記情報は、
前記近接するピクチャセグメントと、
近接するサブセグメントと、
ピクチャセグメントを復号するための順序と
のうちの1つの前記パーティション構造内の位置に基づいて、
前記近接するピクチャセグメントと、
前記近接するサブセグメントと
のうちの1つの選択を示すモードインジケータを含む、請求項1から9のいずれか一項に記載の方法。 - サブセグメントサイズに基づいて、セグメントの空間サイズを導出することをさらに含む、請求項1から10のいずれか一項に記載の方法。
- ピクチャを符号化する方法(20)であって、
ピクチャを複数のピクチャセグメントに分割するパーティション構造を規定すること(22)であって、
各ピクチャセグメントは、1つまたは複数のサブセグメントを含み、少なくとも1つのピクチャセグメントは、少なくとも2つのサブセグメントを含み、
各サブセグメントは、複数のユニットを含み、各ユニットは、前記ピクチャの領域に対応する、
パーティション構造を規定すること(22)と、
複数のコード化セグメントを生成するために、前記パーティション構造に従って、前記ピクチャセグメントを符号化すること(28)であって、各コード化セグメントは、前記パーティション構造の前記ピクチャセグメントのうちの1つに対応し、各コード化セグメントは、前記ピクチャセグメントのうちの所与の1つの第2のユニットについてのイントラ予測モードの導出が、前記ピクチャセグメントの前記所与の1つの第1のユニットについての導出されたイントラ予測モードに依存し、任意の他のピクチャセグメントのユニットについての任意のイントラ予測モードから独立しているように独立している、前記ピクチャセグメントを符号化すること(28)と、
前記複数のコード化セグメントと、前記ピクチャを前記ピクチャセグメントに分割するために使用される前記パーティション構造を示す情報とを含むビットストリーム(12)を生成することであって、前記情報は、前記パーティション構造のユニットのユニットサイズと、前記パーティション構造のサブセグメントのサブセグメントサイズとを示す、ビットストリーム(12)を生成することと、
前記ビットストリームを送信すること(29)と
を含む、方法(20)。 - ビットストリームを生成することは、前記パーティション構造がサブセグメントを含むというインジケーション(45)を含むように前記ビットストリームを生成することをさらに含む、請求項12に記載の方法。
- 前記複数のピクチャセグメントの各々の高さおよび幅のうちの1つについての最大公約数(GCD)値を決定することと、
各サブセグメントの前記高さおよび前記幅のうちの前記1つを前記GCD値に設定すること(96)と
をさらに含む、請求項12または13に記載の方法。 - 第1のピクチャセグメントの縁部は、2つ以上の隣接するピクチャセグメントの対応する縁部に接する、請求項1から14のいずれか一項に記載の方法。
- 前記情報は、前記パーティション構造の第1のサブセグメントの第1のサブセグメントサイズと、前記パーティション構造の第2のサブセグメントの第2のサブセグメントサイズとを示し、前記第1のサブセグメントサイズと前記第2のサブセグメントサイズとは異なる、請求項1から15のいずれか一項に記載の方法。
- 前記パーティション構造は、前記ピクチャをサブセグメントに分割し、各サブセグメントは、すべての前記ピクチャセグメントの最大公約数である幅および高さを有する、請求項1から16のいずれか一項に記載の方法。
- 前記情報は、前記パーティション構造のサブセグメントの高さ、幅、および面積のうちの1つを、前記パーティション構造のユニットの高さ、幅、および面積の各々の整数倍として示す、請求項1から17のいずれか一項に記載の方法。
- 前記情報は、前記パーティション構造の第1のサブセグメントの高さ、幅、および面積のうちの1つを、前記パーティション構造の第2のサブセグメントの高さ、幅、および面積のうちの各々の整数倍として示す、請求項1から17のいずれか一項に記載の方法。
- 前記情報は、前記パーティション構造のすべての前記サブセグメントについての単一のサブセグメントサイズを含む、請求項1から17のいずれか一項に記載の方法。
- 前記情報は、前記パーティション構造の第1のピクチャセグメントおよびサブセグメントのうちの1つの高さおよび幅の一方または両方を含む、請求項1から20のいずれか一項に記載の方法。
- 前記情報は、第2のピクチャセグメントの高さおよび幅の一方または両方が、第1のピクチャセグメントのそれぞれの高さおよび幅のそれぞれの一方または両方と異なる旨のインジケータを含む、請求項1から18のいずれか一項に記載の方法。
- 前記情報は、第2のサブセグメントの高さおよび幅の一方または両方が、第1のサブセグメントのそれぞれの高さおよび幅のそれぞれの一方または両方と異なる旨のインジケータを含む、請求項1から18のいずれか一項に記載の方法。
- 前記情報は、前記コード化セグメントを受信するデコーダが、所与のピクチャセグメントおよび所与のサブセグメントのうちの1つのサイズに関連付けられた1つまたは複数の属性を、近接するピクチャセグメントおよび近接するサブセグメントの各々からコピーすべきであることを示す、請求項1から18および22から23のいずれか一項に記載の方法。
- 前記情報は、前記パーティション構造内の前記近接するピクチャセグメントまたは近接するサブセグメントの位置に基づいて、前記近接するピクチャセグメントまたは前記近接するサブセグメントを示す、請求項24に記載の方法。
- 前記情報は、ピクチャセグメント識別子を含み、各ピクチャセグメント識別子は、前記パーティション構造のサブセグメントのユニットの前記ピクチャセグメントのうちの1つを示す、請求項1から8および12から17のいずれか一項に記載の方法。
- 前記パーティション構造の少なくとも1つのユニットまたはサブセグメントは、前記ピクチャの非長方形領域に対応する、請求項1から9、12から17、および26のいずれか一項に記載の方法。
- 前記情報は、前記パーティション構造のすべての前記サブセグメントについて単一のサイズを含む、請求項1から9、12から17、および26から27のいずれか一項に記載の方法。
- 前記情報は、ユニットが所与のピクチャセグメント内の唯一のユニットであることを示す独立したユニット識別子を含む、請求項1から9および12から17のいずれか一項に記載の方法。
- 前記情報は、サブセグメントが所与のピクチャセグメント内の唯一のサブセグメントであることを示す独立したサブセグメント識別子をさらに含む、請求項1から9、12から17、および28のいずれか一項に記載の方法。
- 前記情報は、前記パーティション構造の前記ピクチャセグメントまたは前記サブセグメント間で共有される終了点を規定する情報をさらに含む、請求項1から9および12から17のいずれか一項に記載の方法。
- 前記パーティション構造の各サブセグメントは、前記ピクチャの長方形領域および前記ピクチャの正方形領域のうちの1つに対応する、請求項1から9、12から17、および28から31のいずれか一項に記載の方法。
- 前記情報は、前記パーティション構造のすべての前記サブセグメントについての単一のサブセグメントサイズを含む、請求項1から9、12から17、および28から32のいずれか一項に記載の方法。
- 前記パーティション構造は、垂直分割線v1、v2、v3、および水平分割線h1、h2、h3、h4、h5、h6のうちの少なくとも1つを使用して、前記ピクチャをピクチャセグメントおよびサブセグメントのうちの一方に分割する、請求項1から9および12から17のいずれか一項に記載の方法。
- 前記パーティション構造は、4分木分離、中間分離、フレキシブル分離、および整数分割のうちの少なくとも1つを使用して、前記ピクチャをピクチャセグメントおよびサブセグメントのうちの一方に分割する、請求項1から9、12から17、および31から34のいずれか一項に記載の方法。
- 前記情報は、前記パーティション構造の前記ピクチャセグメントを分割する分割線の終了点の座標を含む、請求項1から9、12から17、および31から34のいずれか一項に記載の方法。
- 前記パーティション構造は、1つまたは複数のT字接合T−Jを使用して、前記ピクチャを前記ピクチャセグメントに分割し、各T字接合は、2つまたは3つのピクチャセグメントの境界にある前記パーティション構造内の点を規定する、請求項1から9、12から17、および31から34のいずれか一項に記載の方法。
- 前記情報は、前記1つまたは複数のT字接合の各々の位置および方向の一方または両方を含む、請求項37に記載の方法。
- 前記パーティション構造は、各ピクチャセグメントのコーナーを、ピクチャセグメントごとに、開始コーナーおよび終了コーナーの対応する値を規定するグリッド上に配列することによって、前記ピクチャセグメントを分割する、請求項1から9、12から17、および34のいずれか一項に記載の方法。
- 前記情報は、
前記グリッド上の前記パーティション構造内の所与のピクチャセグメントの開始を示す開始コーナインジケータのシーケンスまたは行列と、
前記グリッド上の前記パーティション構造内の前記所与のピクチャセグメントの終了を示す終了コーナインジケータのシーケンスまたは行列と
のうちの一方または両方をさらに含む、請求項1から9、12から17、34、および39のいずれか一項に記載の方法。 - 前記グリッドは、前記パーティション構造のサブセグメントに関して規定される、請求項39または40に記載の方法。
- 複数のコード化セグメントと、前記複数のコード化セグメントに関連付けられた情報とを含むビットストリーム(12)を受信すること(32)と、
前記ビットストリーム内の前記情報から、
前記ピクチャを複数のピクチャセグメントに分割するパーティション構造であって、
各ピクチャセグメントは、前記複数のコード化セグメントのうちの1つに対応し、1つまたは複数のサブセグメントを含み、
少なくとも1つのピクチャセグメントは、少なくとも2つのサブセグメントを含み、
各サブセグメントは、複数のユニットを含み、各ユニットは、前記ピクチャの領域に対応する、
パーティション構造と、
前記パーティション構造のサブセグメントのサブセグメントサイズと、
前記パーティション構造のユニットのユニットサイズと、
を導出する(34)ことと、
前記パーティション構造に従って、前記ビットストリームで受信された前記複数のコード化セグメントを復号すること(38)であって、前記ピクチャセグメントのうちの所与の1つの第2のユニット(U3)についてのイントラ予測モードの導出は、前記ピクチャセグメントのうちの前記所与の1つの第1のユニット(U2)についての導出されたイントラ予測モードに依存し、任意の他のピクチャセグメントのユニットについての任意のイントラ予測モードから独立している、前記複数のコード化セグメントを復号すること(38)と
を行うように設定されている、デコーダ回路(510)。 - 請求項2から11および14から40のいずれか一項に記載の方法を実施するようにさらに設定されている、請求項42に記載のデコーダ回路。
- 前記デコーダ回路は、前記復号セグメントを表示するように設定されたディスプレイ(880)内に備えられる、請求項42または43に記載のデコーダ回路。
- デコーダ(450)であって、
複数のコード化セグメントと、前記複数のコード化セグメントに関連付けられた情報とを含むビットストリームを受信する(32)ように設定された通信回路(535、545)と、
命令(530)を記憶するように設定されたメモリ(540)と、
前記メモリおよび前記通信回路に動作可能に接続され、前記メモリに記憶された前記命令を実行するように設定された処理回路(510)とを備え、それによって、前記デコーダは、
前記ビットストリーム内の前記情報から、
前記ピクチャを複数のピクチャセグメントに分割するパーティション構造であって、
各ピクチャセグメントは、前記複数のコード化セグメントのうちの1つに対応し、1つまたは複数のサブセグメントを含み、
少なくとも1つのピクチャセグメントは、少なくとも2つのサブセグメントを含み、
各サブセグメントは、複数のユニットを含み、各ユニットは、前記ピクチャの領域に対応する、
パーティション構造と、
前記パーティション構造のサブセグメントのサブセグメントサイズと、
前記パーティション構造のユニットのユニットサイズと、
を導出する(34)ことと、
前記パーティション構造に従って、前記ビットストリームで受信された前記複数のコード化セグメントを復号すること(38)であって、前記ピクチャセグメントのうちの所与の1つの第1のユニットについてのイントラ予測モードの導出は、前記ピクチャセグメントのうちの前記所与の1つの第2のユニットについての導出されたイントラ予測モードに依存し、任意の他のピクチャセグメントのユニットについての任意のイントラ予測モードから独立している、前記複数のコード化セグメントを復号すること(38)と
を行うように設定されている、デコーダ(450)。 - 請求項2から11および14から40のいずれか一項に記載の方法を実施するようにさらに設定されている、請求項45に記載のデコーダ。
- 前記デコーダは、前記復号セグメントを表示するように設定されたディスプレイ(880)内に備えられる、請求項45または46に記載のデコーダ。
- デコーダ(450)内の処理回路(510)によって実行されると、前記デコーダに、請求項1から11および14から40のいずれか一項に記載の方法のうちのいずれか1つを実行させる実行可能命令を含む、コンピュータプログラム(530)。
- キャリアは、電子信号、光信号、無線信号、またはコンピュータ可読記憶媒体のうちの1つである、請求項48に記載のコンピュータプログラムを含むキャリア。
- デコーダ(450)内の処理回路(510)によって実行されると、前記デコーダに、請求項1から11および14から40のいずれか一項に記載の方法のうちのいずれか1つを実行させる実行可能命令を含むコンピュータプログラム(530)を含む、非一時的コンピュータ可読記憶媒体(540)。
- ピクチャを複数のピクチャセグメントに分割するパーティション構造を規定すること(22)であって、各ピクチャセグメントは、1つまたは複数のサブセグメントを含み、前記パーティション構造の少なくとも1つのピクチャセグメントは、2つ以上のサブセグメントを含み、各サブセグメントは、複数のユニットを含み、各ユニットは、前記ピクチャの領域に対応する、パーティション構造を規定すること(22)と、
複数のコード化セグメントを生成するために、前記パーティション構造に従って、前記ピクチャセグメントを符号化すること(28)であって、各コード化セグメントは、前記パーティション構造の前記ピクチャセグメントのうちの1つに対応し、各コード化セグメントは、前記ピクチャセグメントのうちの所与の1つの第2のユニットについてのイントラ予測モードの導出が、前記ピクチャセグメントの前記所与の1つの第1のユニットについての導出されたイントラ予測モードに依存し、任意の他のピクチャセグメントのユニットについての任意のイントラ予測モードから独立しているように独立している、前記ピクチャセグメントを符号化すること(28)と、
前記複数のコード化セグメントと、前記ピクチャを前記ピクチャセグメントに分割するために使用される前記パーティション構造を示す情報とを含むビットストリーム(12)を生成することであって、前記情報は、前記パーティション構造のユニットのユニットサイズと、前記パーティション構造のサブセグメントのサブセグメントサイズとを示す、ビットストリーム(12)を生成することと、
前記ビットストリームを送信すること(29)と
を行うように設定された、エンコーダ回路(500)。 - 請求項12から41のいずれか一項に記載の方法を実施するようにさらに設定されている、請求項51に記載のエンコーダ回路。
- エンコーダ(400)であって、
命令(520)を記憶するように設定されたメモリ(515)と、
前記メモリに動作可能に接続され、前記メモリに記憶された前記命令を実行するように設定された処理回路(500)であって、それによって、前記エンコーダは、
ピクチャをピクチャセグメントに分割するパーティション構造を規定すること(22)であって、各ピクチャセグメントは、1つまたは複数のサブセグメントを含み、少なくとも1つのピクチャセグメントは、少なくとも2つのサブセグメントを含み、前記パーティション構造の各サブセグメントは、複数のユニットを含み、各ユニットは、前記ピクチャの領域に対応する、パーティション構造を規定すること(22)と、
複数のコード化セグメントを生成するために、前記パーティション構造に従って、前記ピクチャセグメントを符号化すること(24)であって、各コード化セグメントは、前記パーティション構造の前記ピクチャセグメントのうちの1つに対応し、各コード化セグメントは、前記ピクチャセグメントのうちの所与の1つの第2のユニットについての任意のイントラ予測モードの任意の導出が、前記ピクチャセグメントの前記所与の1つの第1のユニットについての導出されたイントラ予測モードに依存し、任意の他のピクチャセグメントのユニットについての任意のイントラ予測モードから独立しているように独立している、前記ピクチャセグメントを符号化すること(24)と、
前記複数のコード化セグメントと、前記ピクチャを前記ピクチャセグメントに分割するために使用される前記パーティション構造を示す情報とを含むビットストリームを生成することであって、前記情報は、前記パーティション構造のユニットのサイズと、前記パーティション構造のサブセグメントのサイズとを示す、ビットストリームを生成することと、
を行うように設定されている、処理回路(500)と、
前記ビットストリームを送信(29)するように設定された通信回路(530、540)と
を備える、エンコーダ(400)。 - 請求項12から41のいずれか一項に記載の方法を実施するようにさらに設定されている、請求項53に記載のエンコーダ。
- エンコーダ内の処理回路によって実行されると、前記エンコーダに、請求項および12から41のいずれか一項に記載の方法のうちのいずれか1つを実行させる実行可能命令を含む、コンピュータプログラム(520)。
- キャリアは、電子信号、光信号、無線信号、またはコンピュータ可読記憶媒体のうちの1つである、請求項55に記載のコンピュータプログラムを含むキャリア。
- エンコーダ(400)内の処理回路(500)によって実行されると、前記エンコーダに、請求項12から41のいずれか一項に記載の方法のうちのいずれか1つを実行させる実行可能命令を含むコンピュータプログラム(520)を含む、非一時的コンピュータ可読記憶媒体(515)。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201862688301P | 2018-06-21 | 2018-06-21 | |
US62/688,301 | 2018-06-21 | ||
PCT/EP2019/066400 WO2019243539A1 (en) | 2018-06-21 | 2019-06-20 | Tile partitions with sub-tiles in video coding |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021528003A true JP2021528003A (ja) | 2021-10-14 |
JP7313385B2 JP7313385B2 (ja) | 2023-07-24 |
Family
ID=67003504
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020570501A Active JP7313385B2 (ja) | 2018-06-21 | 2019-06-20 | ビデオコーディングにおけるサブタイルを含むタイルパーティション |
Country Status (6)
Country | Link |
---|---|
US (2) | US11553180B2 (ja) |
EP (1) | EP3811612A1 (ja) |
JP (1) | JP7313385B2 (ja) |
CN (1) | CN112640455A (ja) |
MX (1) | MX2020013864A (ja) |
WO (1) | WO2019243539A1 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
MX2021007874A (es) | 2018-12-27 | 2021-10-26 | Huawei Tech Co Ltd | Un codificador de video, un decodificador de video y métodos correspondientes. |
EP3935835A4 (en) * | 2019-03-08 | 2022-12-14 | Telefonaktiebolaget Lm Ericsson (Publ) | METHODS OF PROVIDING DEPENDENT/INDEPENDENT SCORE ENCODING/DECODING AND ASSOCIATED DEVICES |
US11412264B2 (en) * | 2019-09-24 | 2022-08-09 | Qualcomm Incorporated | Parameter set signaling for video coding |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017172783A1 (en) * | 2016-03-30 | 2017-10-05 | Qualcomm Incorporated | Improvement on tile grouping in hevc and l-hevc file formats |
Family Cites Families (40)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090279601A1 (en) | 2008-05-08 | 2009-11-12 | Telefonaktiebolaget Lm Ericsson (Publ) | Method and Apparatus of Displaying Video |
US20090320081A1 (en) | 2008-06-24 | 2009-12-24 | Chui Charles K | Providing and Displaying Video at Multiple Resolution and Quality Levels |
US9300976B2 (en) | 2011-01-14 | 2016-03-29 | Cisco Technology, Inc. | Video encoder/decoder, method and computer program product that process tiles of video data |
US9215473B2 (en) * | 2011-01-26 | 2015-12-15 | Qualcomm Incorporated | Sub-slices in video coding |
CN102685474B (zh) * | 2011-03-10 | 2014-11-05 | 华为技术有限公司 | 预测模式的编解码方法、编解码设备及网络系统 |
US10298939B2 (en) | 2011-06-22 | 2019-05-21 | Qualcomm Incorporated | Quantization in video coding |
US9398307B2 (en) | 2011-07-11 | 2016-07-19 | Sharp Kabushiki Kaisha | Video decoder for tiles |
KR101912485B1 (ko) | 2011-08-25 | 2018-10-26 | 선 페이턴트 트러스트 | 타일 부호화 스킴을 이용한 영상 부호화, 추출 및 복호화 방법 및 장치 |
US9584819B2 (en) | 2011-10-24 | 2017-02-28 | Qualcomm Incorporated | Grouping of tiles for video coding |
US9124895B2 (en) | 2011-11-04 | 2015-09-01 | Qualcomm Incorporated | Video coding with network abstraction layer units that include multiple encoded picture partitions |
EP3328081B1 (en) | 2011-11-11 | 2019-10-16 | GE Video Compression, LLC | Effective prediction using partition coding |
PL3024243T3 (pl) * | 2012-04-16 | 2018-01-31 | Ericsson Telefon Ab L M | Flaga stałej struktury płytek, wskazująca na możliwość równoległego przetwarzania dla sekwencji skompresowanego wideo |
CN108718410B (zh) | 2012-06-26 | 2022-05-24 | Lg 电子株式会社 | 视频编码方法、视频解码方法和使用其的装置 |
FR2993084A1 (fr) | 2012-07-09 | 2014-01-10 | France Telecom | Procede de codage video par prediction du partitionnement d'un bloc courant, procede de decodage, dispositifs de codage et de decodage et programmes d'ordinateur correspondants |
US9161039B2 (en) | 2012-09-24 | 2015-10-13 | Qualcomm Incorporated | Bitstream properties in video coding |
US9749627B2 (en) * | 2013-04-08 | 2017-08-29 | Microsoft Technology Licensing, Llc | Control data for motion-constrained tile set |
US20160295200A1 (en) | 2013-11-20 | 2016-10-06 | Koninklijke Philips N.V. | Generaton of images for an autostereoscopic multi-view display |
CN105744272B (zh) | 2014-12-09 | 2019-07-19 | 深圳力维智联技术有限公司 | 基于非对称Tile划分的图像编解码方法及其装置 |
US10070130B2 (en) | 2015-01-30 | 2018-09-04 | Qualcomm Incorporated | Flexible partitioning of prediction units |
US20180139453A1 (en) * | 2015-03-13 | 2018-05-17 | Lg Electronics Inc. | Method of processing video signal and device for same |
WO2016180486A1 (en) | 2015-05-12 | 2016-11-17 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Composite scalable video streaming |
US10368072B2 (en) * | 2015-05-29 | 2019-07-30 | Qualcomm Incorporated | Advanced arithmetic coder |
US10404992B2 (en) | 2015-07-27 | 2019-09-03 | Qualcomm Incorporated | Methods and systems of restricting bi-prediction in video coding |
KR102332006B1 (ko) | 2016-02-09 | 2021-12-01 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 효율적인 감소성 또는 효율적인 랜덤 액세스를 허용하는 픽처/비디오 데이터 스트림들에 대한 개념 |
US10547854B2 (en) * | 2016-05-13 | 2020-01-28 | Qualcomm Incorporated | Neighbor based signaling of intra prediction modes |
JP7001968B2 (ja) | 2016-06-08 | 2022-01-20 | ソニーグループ株式会社 | 画像処理装置および方法 |
WO2018018486A1 (en) | 2016-07-28 | 2018-02-01 | Mediatek Inc. | Methods of reference quantization parameter derivation for signaling of quantization parameter in quad-tree plus binary tree structure |
CN115767106B (zh) | 2016-10-04 | 2023-10-10 | 有限公司B1影像技术研究所 | 图像编码/解码方法和计算机可读记录介质 |
GB2557430B (en) * | 2016-10-12 | 2020-01-15 | Mediatek Inc | Methods and apparatuses of constrained multi-type-tree block partition for video coding |
US11172208B2 (en) | 2017-02-28 | 2021-11-09 | Nokia Technologies Oy | Method and apparatus for improving the visual quality of viewport-based omnidirectional video streaming |
EP3606077A4 (en) | 2017-03-22 | 2021-01-06 | Industry - University Cooperation Foundation Hanyang University | LOOP FILTERING PROCESS ACCORDING TO AN ADAPTIVE PIXEL CLASSIFICATION STANDARD |
US10609414B2 (en) * | 2017-05-08 | 2020-03-31 | Qualcomm Incorporated | Context modeling for transform coefficient coding |
US10893256B2 (en) | 2017-06-26 | 2021-01-12 | Nokia Technologies Oy | Apparatus, a method and a computer program for omnidirectional video |
CN111543060B (zh) | 2017-10-09 | 2024-03-08 | 诺基亚技术有限公司 | 用于视频编码和解码的装置、方法和计算机程序 |
EP3721636A1 (en) | 2017-12-07 | 2020-10-14 | Koninklijke KPN N.V. | Method for adaptive streaming of media |
CN109996069B (zh) | 2018-01-03 | 2021-12-10 | 华为技术有限公司 | 视频图像编解码方法及设备 |
WO2019141901A1 (en) | 2018-01-17 | 2019-07-25 | Nokia Technologies Oy | An apparatus, a method and a computer program for omnidirectional video |
WO2019194573A1 (en) | 2018-04-05 | 2019-10-10 | Lg Electronics Inc. | Method for transmitting 360-degree video, method for receiving 360-degree video, apparatus for transmitting 360-degree video, and apparatus for receiving 360-degree video |
CN118042173A (zh) | 2018-09-05 | 2024-05-14 | 华为技术有限公司 | 视频解码方法及视频解码器 |
ES2966479T3 (es) * | 2019-03-23 | 2024-04-22 | Huawei Tech Co Ltd | Un codificador, un decodificador y métodos correspondientes para la intrapredicción |
-
2019
- 2019-06-20 MX MX2020013864A patent/MX2020013864A/es unknown
- 2019-06-20 WO PCT/EP2019/066400 patent/WO2019243539A1/en active Application Filing
- 2019-06-20 EP EP19732993.1A patent/EP3811612A1/en active Pending
- 2019-06-20 US US17/253,997 patent/US11553180B2/en active Active
- 2019-06-20 JP JP2020570501A patent/JP7313385B2/ja active Active
- 2019-06-20 CN CN201980054347.5A patent/CN112640455A/zh active Pending
-
2022
- 2022-12-06 US US18/075,686 patent/US20230097014A1/en active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017172783A1 (en) * | 2016-03-30 | 2017-10-05 | Qualcomm Incorporated | Improvement on tile grouping in hevc and l-hevc file formats |
Non-Patent Citations (2)
Title |
---|
"SERIES H: AUDIOVISUAL AND MULTIMEDIA SYSTEMS Infrastructure of audiovisual services - Coding of movi", RECOMMENDATION ITU-T H.265 (12/2016) HIGH EFFICIENCY VIDEO CODING, JPN6022014348, 16 March 2017 (2017-03-16), pages 83 - 84, ISSN: 0004989149 * |
SJOBERG, RICKARD ET AL.: "Flexible Tiles", JOINT VIDEO EXPERTS TEAM (JVET) OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11 11TH MEETING: LJUB, vol. JVET-K0260 (version 2), JPN6022014347, 14 July 2018 (2018-07-14), ISSN: 0004989150 * |
Also Published As
Publication number | Publication date |
---|---|
US11553180B2 (en) | 2023-01-10 |
EP3811612A1 (en) | 2021-04-28 |
JP7313385B2 (ja) | 2023-07-24 |
CN112640455A (zh) | 2021-04-09 |
MX2020013864A (es) | 2021-03-25 |
WO2019243539A1 (en) | 2019-12-26 |
US20230097014A1 (en) | 2023-03-30 |
US20210274174A1 (en) | 2021-09-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111373752B (zh) | 译码视频数据的方法和设备以及非暂时性计算机可读介质 | |
KR102629907B1 (ko) | 타일 그룹 id에 기초한 화상들의 인코딩 및 디코딩 | |
US9967577B2 (en) | Acceleration interface for video decoding | |
ES2746102T3 (es) | Codificación de valores de racha en base al índice de paleta en la codificación de vídeo basada en paletas | |
KR101895296B1 (ko) | 동영상 처리 방법 및 장치 | |
RU2760850C1 (ru) | Гибкие разбиения тайлов | |
US9270994B2 (en) | Video encoder/decoder, method and computer program product that process tiles of video data | |
US20230097014A1 (en) | Tile Partitions with Sub-Tiles in Video Coding | |
KR101834237B1 (ko) | 동영상 처리 방법 및 장치 | |
KR20150037944A (ko) | 비디오 처리를 위한 송신 장치 및 방법 | |
US20240171755A1 (en) | Picture Tile Attributes Signaled Per-Tile | |
JP2018056686A (ja) | 画像符号化装置、画像符号化方法、及び画像符号化プログラム、並びに、画像復号装置、画像復号方法、及び画像復号プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210305 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210305 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220407 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220419 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20220719 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221019 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230214 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230301 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230613 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230711 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7313385 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |