JP7843891B2 - 動画像符号化装置、動画像復号装置および集積回路 - Google Patents
動画像符号化装置、動画像復号装置および集積回路Info
- Publication number
- JP7843891B2 JP7843891B2 JP2025068469A JP2025068469A JP7843891B2 JP 7843891 B2 JP7843891 B2 JP 7843891B2 JP 2025068469 A JP2025068469 A JP 2025068469A JP 2025068469 A JP2025068469 A JP 2025068469A JP 7843891 B2 JP7843891 B2 JP 7843891B2
- Authority
- JP
- Japan
- Prior art keywords
- tile
- group
- flag
- ctu
- tiles
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/119—Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/129—Scanning of coding units, e.g. zig-zag scan of transform coefficients or flexible macroblock ordering [FMO]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/13—Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/174—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/42—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
- H04N19/436—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation using parallelised computational arrangements
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Computing Systems (AREA)
- Theoretical Computer Science (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Description
以下、図面を参照しながら本発明の実施形態について説明する。
本明細書で用いる演算子を以下に記載する。
本実施形態に係る動画像符号化装置11および動画像復号装置31の詳細な説明に先立って、動画像符号化装置11によって生成され、動画像復号装置31によって復号される符号化ストリームTeのデータ構造について説明する。
符号化ビデオシーケンスでは、処理対象のシーケンスSEQを復号するために動画像復号装置31が参照するデータの集合が規定されている。シーケンスSEQは、図4(a)に示すように、シーケンスパラメータセットSPS(Sequence Parameter Set)、ピクチャパラメータセットPPS(Picture Parameter Set)、ピクチャPICT、及び、付加拡張情報SEI(Supplemental Enhancement Information)を含んでいる。
符号化ピクチャでは、処理対象のピクチャPICTを復号するために動画像復号装置31が参照するデータの集合が規定されている。ピクチャPICTは、図4(b)に示すように、タイルグループ0~タイルグループNTG-1を含む(NTGはピクチャPICTに含まれるタイルの総数)。
セグメントとは、ピクチャを分割して送信するための単位であり、符号化データ上では、バイトアラインされたビット列として符号化、復号される。
・画面上ではCTUの集合に対応する
・符号化データ上ではバイト単位でアラインされる
・セグメント先頭でCABAC初期化を行う
・同じピクチャ内のセグメント間では予測を制限することができる(他のセグメントの参照が制限可能である)
予測の制限とは、例えば、セグメントがタイルの場合、対象タイルと異なるタイルの画像を用いたイントラ予測を行わない制限を行う。セグメントがスライスの場合も同様に、対象スライスと異なるスライスの画像を用いたイントラ予測を行わない制限を行う。
符号化タイルグループでは、処理対象のタイルグループを復号するために動画像復号装置31が参照するデータの集合が規定されている。タイルグループは、図4(c)に示すように、タイルグループヘッダ、および、タイルグループデータを含んでいる。さらに、タイルグループデータの後にバイトアライン用のトレイリングデータ(rbsp_tile_group_trailing_bits)を含んでもよい。
タイルグループヘッダは、タイルグループタイプ指定情報(tile_group_type)を含んでもよい。
符号化タイルでは、処理対象のタイルを復号するために動画像復号装置31が参照するデータの集合が規定されている。タイルは図4(d)に示すようにCTUを含む。CTUはタイルを構成する固定サイズ(例えば128x128)のブロックであり、最大符号化単位(LCU:Largest Coding Unit)と呼ぶこともある。
図8(a)は、タイルグループTileGr0を複数のタイルTile0~Tile3(太い実線の矩形)に分割する例である。タイルは1つ以上のCTUから構成される矩形のセグメントである。各CTUのアドレス(タイルスキャン順のCTUアドレスctbAddrTs)は各タイルの左上から右下にラスタスキャン順に設定される。
図4(e)には、処理対象のCTUを復号するために動画像復号装置31が参照するデータの集合が規定されている。CTUは、再帰的な4分木分割(QT(Quad Tree)分割)、2分木分割(BT(Binary Tree)分割)あるいは3分木分割(TT(Ternary Tree)分割)により符号化処理の基本的な単位である符号化ユニットCUに分割される。BT分割とTT分割を合わせてマルチツリー分割(MT(Multi Tree)分割)と呼ぶ。再帰的な4分木分割により得られる木構造のノードのことを符号化ノード(Coding Node)と称する。4分木、2分木、及び3分木の中間ノードは、符号化ノードであり、CTU自身も最上位の符号化ノードとして規定される。
図4(f)に示すように、処理対象の符号化ユニットを復号するために動画像復号装置31が参照するデータの集合が規定されている。具体的には、CUはCUヘッダ、予測パラメータ、変換パラメータ、量子化変換係数等から構成される。CUヘッダでは予測モード等が規定される。
本実施形態に係る動画像復号装置31(図9)の構成について説明する。
以下、各モジュールの概略動作を説明する。パラメータ復号部302はヘッダ情報、分割情報、予測情報、量子化変換係数等のパラメータの復号処理を行う。
図10は、動画像復号装置31の概略的動作を説明するフローチャートである。
PicWidthInCtbsY = Ceil(pic_width_in_luma_samples/ctuWidth)
PicHeightInCtbsY = Ceil(pic_height_in_luma_samples/ctuHeight)
ここでの除算(/)は小数精度とする。
NumTileRows = num_tile_rows_minus1+1
NumTilesInPic = NumTileColumns*NumTileRows
ヘッダ復号部3020は、下式でタイルサイズを導出してもよい。
ColWidth[m] = (m+1)*PicWidthInCtbsY/NumTileColumns-m*PicWidthInCtbsY/NumTileColumns
for(n=0;n<NumTileRows;n++)
RowHeight[n] = (n+1)*PicHeightInCtbsY/NumTileRows-n*PicHeightInCtbsY/NumTileRows
uniform_spacing_flagの値が0の場合、ピクチャの各タイルの幅、高さは個別に設定される。動画像符号化装置では各タイルの幅ColWidth[m]、高さRowHeight[n]をタイル毎に符号化する。動画像復号装置のヘッダ復号部3020はタイル毎にColWidth[m]、RowHeight[n]を下記のように復号する。
RowHeight[n] = tile_row_height_minus1[m]+1 (0<=n<NumTileRows-1)
ColWidth[NumTileColumns-1] = PicWidthInCtbsY-sum_m(ColWidth[m])
RowHeight[NumTileRows-1] = PicHeightInCtbsY-sum_n(RowHeight[n])
ここで、sum_m(ColWidth[m])は、ColWidth[m](0<=m<NumTileColumns-1)の総和、sum_n(RowHeight[n])はRowHeight[n](0<=n<NumTileRows-1)の総和を表す。
Σはn=1からkまでの和を表す。
FirstCtbAddrTs[]はtileIdxをタイルの最初のCTUアドレスに変換するテーブルであり、下記のように導出される。
if (tileStartFlag) {
FirstCtbAddrTs[tileIdx] = ctbAddrTs
tileStartFlag = 0
}
tileEndFlag = (ctbAddrTs==PicSizeInCtbsY-1) || (TileId[ctbAddrTs+1]!=TileId[ctbAddrTs])
if(tileEndFlag) {
tileIdx++
tileStartFlag = 1
}
}
ここでTileId[]はタイルスキャン順のCTUアドレスをタイル識別子に変換するテーブルである。一例を以下に示す。
for (i=0; i<=num_tile_columns_minus1; i++,tileIdx++)
for (y=RowBd[j]; y<RowBd[j+1]; y++)
for (x=ColBd[i]; x<ColBd[i+1]; x++)
TileId[CtbAddrRsToTs[y*PicWidthInCtbsY+x]] = TileIdx
ここでRowBD[]とColBD[]は各タイル行の垂直方向の最大座標と各タイル列の水平方向の最大座標を格納するテーブルであり、CTU単位で表現される。一例を以下に示す。
RowBd[j+1] = RowBd[j]+RowHeight[j]
For (ColBd[0]=0,i=0; i<=num_tile_columns_minus1; i++)
ColBd[i+1] = ColBd[i]+ColWidth[i]
(ピクチャ内のCTUスキャン順の導出方法1)
また、CtbAddrRsToTs[]はピクチャ内のラスタスキャン順のCTUアドレスをタイルスキャン順のCTUアドレスに変換するテーブルである。CT情報復号部3021は、以下の処理によって、CtbAddrRsToTs[]を導出してもよい。この導出方法は、ピクチャ内をタイル順にラスタスキャンを行い、さらにタイル内をCTU順でラスタスキャンする場合のCTUのスキャン順に相当する。なおCTUをCTBと呼んでも良い。CTUスキャン順をCTBスキャン順と呼んでも良い。
tbX = ctbAddrRs%PicWidthInCtbsY
tbY = ctbAddrRs/PicWidthInCtbsY
for(i=0; i<=num_tile_columns_minus1; i++)
if(tbX>=ColBd[i]) tileX = i
for(j=0; j<=num_tile_rows_minus1; j++)
if(tbY>=RowBd[j]) tileY = j
CtbAddrRsToTs[ctbAddrRs] = 0
for(i=0; i<tileX; i++)
CtbAddrRsToTs[ctbAddrRs] += RowHeight[tileY]*ColWidth[i]
for(j=0; j<tileY; j++)
CtbAddrRsToTs[ctbAddrRs] += PicWidthInCtbsY*RowHeight[j]
CtbAddrRsToTs[ctbAddrRs] += (tbY-RowBd[tileY])*ColWidth[tileX]+tbX-ColBd[tileX]
}
(ピクチャ内のCTUスキャン順の導出方法0)
CT情報復号部3021は、ctbAddrTsとCtbAddrTsToRs[]を用いて、ラスタスキャン順のCTUアドレスctbAddrRsを下式で導出する。
CtbAddrTsToRs[]はタイルスキャン順のCTUアドレスをラスタスキャン順のCTUアドレスに変換するテーブルであり、下記のように導出される。
CtbAddrTsToRs[CtbAddrRsToTs[ctbAddrRs]] = ctbAddrRs
なお、CtbAddrTsToRs[]とCtbAddrTsToRs[]の導出は、動画像符号化装置11では、CT情報符号化部1111で行う。ヘッダ符号化部1110及びヘッダ復号部3020で行ってもよい。
CtbAddrRsToTs[CtbAddrTsToRs[ctbAddrTs]] = ctbAddrTs
CT情報復号部3021はタイル内の各CTUをタイルスキャン順に復号し、全てのCTUの復号終了後、end_of_tile_one_bitを復号する。
上述の例では、ピクチャ単位(PPS)でタイルの幅と高さを規定したが、変形例1ではピクチャを分割するタイルグループ毎にフレキシブルにタイルサイズを設定する例を説明する。
TileGrHeightInCtbsY[j] = Ceil((tile_group_rows_height_minus1[j]+1)/ctuHeight)
ヘッダ復号部3020は、ピクチャ内の水平、垂直方向のタイルグループ数NumTileGrColumns、NumTileGrRows、および、ピクチャ内のタイルグループの総数NumTileGrsInPicを以下で導出する。
NumTileGrRows = num_tile_group_rows_minus1+1
NumTilesGrsInPic = NumTileGrColumns*NumTileGrRows
ヘッダ復号部3020は、j番目のタイルグループ内の水平、垂直方向のタイル数NumTileColumns[j]、NumTileRows[j]、および、タイルグループ内のタイルの総数NumTilesInPic[j]を以下で導出する。
NumTileRows[j] = num_tile_rows_minus1[j]+1
NumTilesInPic[j] = NumTileColumns[j]*NumTileRows[j]
ヘッダ復号部3020はj番目のタイルグループの各タイルの幅ColWidth[j][m]、高さRowHeight[j][n]を下記のように復号する。
RowHeight[j][n] = tile_row_height_minus1[j][m]+1 (0<=n<NumTileRows[j]-1)
ColWidth[j][NumTileColumns[j]-1] = TileGrWidthInCtbsY[j]-sum_m(ColWidth[j][m])
RowHeight[j][NumTileRows[j]-1] = TileGrHeightInCtbsY[j]-sum_n(RowHeight[j][n])
ここで、sum_m(ColWidth[j][m])は、ColWidth[j][m] (0<=m<NumTileColumns[j]-1)の総和、sum_n(RowHeight[j][n])はRowHeight[j][n] (0<=n<NumTileRows[j]-1)の総和を表す。
for (l=0; l<NumTileGrColumns; l++)
for (j=0,tileIdx=0; j<=num_tile_rows_minus1[k]; j++)
for(i=0; i<=num_tile_columns_minus1[l]; i++,tileIdx++)
for(y=RowBd[k][j]; y<RowBd[k][j+1]; y++)
for(x=ColBd[l][i]; x<ColBd[l][i+1]; x++)
TileId[CtbAddrRsToTs[y*PicWidthInCtbsY+x]] = TileIdx
それ以外のヘッダ復号部3020の処理は、上述のPPSでタイルの幅と高さを規定する例と同じである。
ウェーブフロント並列処理(WPP:Wavefront Pararrel Processing)は、CTU行をセグメントとして用いることにより、符号化効率の低下を抑えながら多数のセグメントの並列符号化又は並列復号を実現できる。
図15は、タイルグループ(セグメントグループ)単位で、異なる種類のセグメントを利用する例を示す。この例では、TileGr0、TileGr1では、セグメントとしてタイルを用い、TileGr2ではセグメントとしてCTU行を用い、TileGr3ではセグメントとしてスライスを用いる例を示す。
変形例2ではセグメントはタイル、CTU行(CTU row)のいずれかであり、タイルグループ単位でタイルとCTUのいずれか一方を使用する場合を説明する。
entropy_coding_sync_enabled_flag
else
entropy_coding_sync_enabled_flag=0
図18(b)は、エントリポイントのシンタックス構成を示す図である。図中TileGrHeightInCtbsYはタイルグループのCTU単位の高さであり、num_tiles_in_tile_group_minus1はタイルグループのタイル数から1を引いた値である。
それ以外、タイルグループに含まれるタイル数-1(ここではnum_tiles_in_tile_group_minus1)をNumEntryPointにセットする。
ヘッダ符号化部1110又はヘッダ復号部3020は、NumEntryPointが0より大きい場合にエントリポイントの情報(offset_len_minus1とNumEntryPoint個のentry_point_offset_minus1)を符号化又は復号する。
なお、タイル内のCTUをあるループ変数であるインデックスjを用いて0から、タイルグループ内のタイル数NumCtusInTile[tileIdx]までループして、CTU(coding_tree_unit())を復号する構成においては、ctbAddrInTile = jである。
つまり、CT情報復号部3021は、(entropy_coding_sync_enabled_flag && (CtbAddrInTile+1)%TileWidthInCtbsY==0)の場合、すなわち、entropy_coding_sync_enabled_flagが1の場合、CTU行右端でCTU復号後に固定値のend_of_subset_one_bitを復号する。また、対象CTUがCTU行の先頭(左端)である場合、対象CTU coding_tree_unit()を符号化又は復号する前に、セグメント(ここではCTU行)の最後を示すビット列を復号することでも同じ処理ができる。例えば、また対象CTU coding_tree_unit()の前に、entropy_coding_sync_enabled_flag && ((CtbAddrInTile)%TileWidthInCtbsY)==0 && CtbAddrInTile!=0の判定でend_of_subset_one_bitを符号化又は復号してもよい。
TileWidthInCtbsY = ColWidth[tileIdx % (num_tile_columns_minus1 + 1) ]
ここで、tileIdxは、対象タイルのラスタスキャン位置である。num_tile_columns_minus1はタイルのピクチャ内のタイルの行数である。tileIdx % (num_tile_columns_minus1 + 1)は、タイルのCTU行位置を導出する。タイルのCTU行位置をインデックスとしてColWidth[]を参照することで対象タイルの対象タイルのCTU単位の幅を導出する。
タイルグループ内のタイルインデックスであるループ変数jを用いて表すと、CT情報符号化部1111又はCT情報復号部3021は、対象CTU coding_tree_unit()を符号化又は復号した後に、以下の式が成り立つ場合に、セグメント(ここではCTU行)の最後を示すビット列であるend_of_subset_one_bitを符号化又は復号してもよい。
end_of_subset_one_bit
CT情報符号化部1111又はCT情報復号部3021は、j==NumCtusInTile[tileIdx]-1の場合(タイルグループ内の最後のCTUの場合)、固定値のend_of_subset_one_bitを符号化又は復号する。
タイル内のCTUに関するループ処理(ループ変数j)において、タイル内のCTUアドレスを設定し(S2606)、対象CTUを復号する(S2608)。
WPPがオン、かつ、CTU行の最後のCTUの場合、S2612に進む。そうでない場合、次のCTU復号処理に進む。既に説明したように、タイル内CTUアドレスを示すループ変数jを用いて、CtbAddrInTile=jと導出し、TileWidthInCtbsY = ColWidth[ TgTileIdx[ i ] % (num_tile_columns_minus1 + 1) ]と導出してもよい。また対象CTU coding_tree_unit()を符号化又は復号する前に、entropy_coding_sync_enabled_flag && ((CtbAddrInTile)%TileWidthInCtbsY)==0 && CtbAddrInTile!=0の判定でend_of_subset_one_bitを符号化又は復号してもよい。
タイルグループの最後のCTUである場合、次のCTU復号処理に進む。そうでない場合、バイトアライン用のビット列を復号する(S2616)。
end_of_subset_one_bit
上記の処理では、WPPを使う場合(entropy_coding_sync_enabled_flag==1の場合)には各CTU行の最後に、セグメント終端を示すビットとバイトアラインを挿入するが、タイルグループの最後に相当する最後のCTU行(j==NumCtusInTile[tileIdx]-1)ではバイトアラインを省略する。WPP時にはタイルグループがCTU行から構成されるため、タイルグループの最後=最後のCTU行の最後である。WPPを使わない場合(entropy_coding_sync_enabled_flag==0の場合)には、タイルの最後にセグメント終端を示すビットとバイトアラインを挿入するが、タイルグループの最後(i==num_tiles_in_tile_group_minus1)では、バイトアラインを省略する。これは既に、図4(c)で説明したように、タイルグループデータの後にバイトアライン用のトレイリングデータ(rbsp_tile_group_trailing_bits)を含む構成において、トレイリングデータで挿入するバイトアラインと重複することを避けるためである。トレイリングデータでバイトアラインを行わない構成では、タイルグループの終端でも、タイルグループのデータの中でバイトアラインを挿入してもよい。
変形例3ではタイルグループ内のセグメントとして、タイル、スライスのいずれか一方を排他的に使用する場合を説明する。
スライス有効フラグslice_enabled_flag、タイル数num_tiles_in_tile_group_minus1、の順に通知する場合、以下の処理を行う。ヘッダ符号化部1110又はヘッダ復号部3020は、タイルグループヘッダでslice_enabled_flagを符号化又は復号する。slice_enabled_flagが0の場合にnum_tiles_in_tile_group_minus1を符号化又は復号する。num_tiles_in_tile_group_minus1、slice_enabled_flagを復号しない場合には各々0に設定する。
以下の例では、スライスの先頭アドレスをエントリポイントとして符号化又は復号することによりビットストリーム上でのスライスの先頭位置を指定する構成を示す。
変形例5では、タイル、CTU行、スライスを排他的に設定する例を説明する。図22は、タイルセグメントとCTU行セグメントとスライスセグメントの排他構成を説明する図である。図に示すように、変形例5では、タイルグループ内に、複数のタイルセグメントがある場合、CTU行セグメントがある場合、スライスセグメントがある場合、および、タイルグループ内に単一のセグメント(ここではタイルと呼ぶ)がある場合のいずれかをとる。
図23(a)はタイルグループヘッダの一例である。図では、タイルの個数が1の場合にentropy_coding_sync_enabled_flagを通知し、entropy_coding_sync_enabled_flagが0(WPPオフ)の場合はslice_enabled_flagを通知する。
num_tiles_in_tile_group_minus1、slice_enabled_flag、entropy_coding_sync_enabled_flagの順に通知する場合、以下の処理を行う。ヘッダ符号化部1110又はヘッダ復号部3020は、num_tiles_in_tile_group_minus1を符号化又は復号する。num_tiles_in_tile_group_minus1が0の場合にslice_enabled_flagを符号化又は復号する。次にslice_enabled_flagが0の場合にentropy_coding_sync_enabled_flagを符号化又は復号する。num_tiles_in_tile_group_minus1、entropy_coding_sync_enabled_flag、slice_enabled_flagを復号しない場合には各々0に設定する。
entropy_coding_sync_enabled_flag、num_tiles_in_tile_group_minus1、slice_enabled_flagの順に通知する場合、以下の処理を行う。ヘッダ符号化部1110又はヘッダ復号部3020は、タイルグループヘッダでentropy_coding_sync_enabled_flagを符号化又は復号する。entropy_coding_sync_enabled_flagが0の場合にnum_tiles_in_tile_group_minus1を符号化又は復号する。次にnum_tiles_in_tile_group_minus1が0の場合にslice_enabled_flagを符号化又は復号する。num_tiles_in_tile_group_minus1、entropy_coding_sync_enabled_flag、slice_enabled_flagを復号しない場合には各々0に設定する。
entropy_coding_sync_enabled_flag、slice_enabled_flag、num_tiles_in_tile_group_minus1の順に通知する場合、以下の処理を行う。ヘッダ符号化部1110又はヘッダ復号部3020は、タイルグループヘッダでentropy_coding_sync_enabled_flagを符号化又は復号する。entropy_coding_sync_enabled_flagが0の場合にslice_enabled_flagを符号化又は復号する。次にslice_enabled_flagが0の場合にnum_tiles_in_tile_group_minus1を符号化又は復号する。num_tiles_in_tile_group_minus1、entropy_coding_sync_enabled_flag、slice_enabled_flagを復号しない場合には各々0に設定する。
slice_enabled_flag、num_tiles_in_tile_group_minus1、entropy_coding_sync_enabled_flagの順に通知する場合、以下の処理を行う。ヘッダ符号化部1110又はヘッダ復号部3020は、タイルグループヘッダでslice_enabled_flagを符号化又は復号する。slice_enabled_flagが0の場合にnum_tiles_in_tile_group_minus1を符号化又は復号する。次にnum_tiles_in_tile_group_minus1が0の場合にentropy_coding_sync_enabled_flagを符号化又は復号する。num_tiles_in_tile_group_minus1、entropy_coding_sync_enabled_flag、slice_enabled_flagを復号しない場合には各々0に設定する。
slice_enabled_flag、entropy_coding_sync_enabled_flag、num_tiles_in_tile_group_minus1の順に通知する場合、以下の処理を行う。ヘッダ符号化部1110又はヘッダ復号部3020は、タイルグループヘッダでslice_enabled_flagを符号化又は復号する。slice_enabled_flagが0の場合にentropy_coding_sync_enabled_flagを符号化又は復号する。次にentropy_coding_sync_enabled_flagが0の場合にnum_tiles_in_tile_group_minus1を符号化又は復号する。num_tiles_in_tile_group_minus1、entropy_coding_sync_enabled_flag、slice_enabled_flagを復号しない場合には各々0に設定する。
ここでは、タイルグループ中の個々のタイル内でCTUをラスタスキャンし、タイル中のCTU行の先頭(左端)でCABAC初期化を行う例を説明する。
また、タイル内CTUをj=0からタイル内CTU数-1までインクリメントしてCTUをループ処理する場合に、ループ変数jをctbAddrInTileとして利用しても良い。
ここでは、タイルグループ中のCTUをラスタスキャンし、タイルグループ中のCTU行の先頭(左端)でCABAC初期化を行う例を説明する。
ctbAddrInTileGroup = ctbAddrTs-FirstCtbAddrTs[tile_group_address]
また、タイル内CTUをj=0からタイルグループ内CTU数-1までインクリメントしてCTUをループ処理する場合に、ループ変数jをctbAddrInTileGroupとして利用しても良い。
図27は、矩形タイルグループを含むタイルグループを説明する図である。タイルグループは、ピクチャを複数のタイルに分割した後に、複数のタイルをグループ化して伝送する技術である。タイルをグループ化して伝送し、グループを単位としてヘッダを伝送することにより、ヘッダのオーバーヘッドを減らすことができる。また、タイルグループ単位で抽出した場合においても、タイルグループ内でタイルに分割できるため、並列処理が可能である。タイルグループには、矩形タイルグループの場合と、矩形タイルグループではない場合があり、後述のシンタックス要素rect_tile_group_flagを用いて1,0で識別する。
図27(b)では、3×2のタイルがある場合、左側の2×2のタイルをTileGroup0、1×1のタイルをTileGroup2、1×1のタイルをTileGroup2となる例を示す。
タイルグループ中のタイルとWPP(CTU行)はいずれもタイルグループをセグメントに分割してセグメント単位で並列処理を行う。セグメント間のイントラ予測は、タイルでは基本的には禁止され、CTU行では基本的には許可される。タイルグループの先頭を除き、セグメント先頭では、ビットストリームのバイト位置を示すためのエントリポイントが伝送される。
・WPP有効フラグentropy_coding_sync_enabled_flagを通知するシンタックス
・WPP有効フラグの値制限もしくは復号制限
・タイルグループ内のCTUスキャン順(タイルベースCTUスキャン順(タイルスキャン) or タイルグループベースCTUスキャン順)
以下、WPP有効フラグentropy_coding_sync_enabled_flagをタイルグループで通知する構成を説明し、その後、entropy_coding_sync_enabled_flagをピクチャパラメータセットで通知する構成を説明する。WPP有効フラグの値制限もしくは復号制限及びCTUスキャン順については各々の構成のサブ構成として説明する。
図30は、本実施形態の一形態のタイルグループとウェーブフロントプロセッシング(CTU行セグメント)の関係を示す図である。ここでは、CTUのスキャン順は、タイルスキャン順であり、タイル単位でCTUのラスタスキャンを行う。この図では、ピクチャ中に4×3のタイルがある場合において、左側の2×3のタイルをTileGroup0、右上の2×1のタイルをTileGroup1、1×1のタイルをTileGroup2、1×1のタイルをTileGroup3、1×2のタイルをTileGroup4として構成する例を示す。1×1のタイルから構成されるTileGroup2は、ウェーブフロントプロセッシング(WPP)がオンのタイルグループである。つまり、TileGroup2は、タイル(タイルグループ)中をさらにCTU行からなるセグメントに分割して符号化される。なお、ピクチャ内のタイルインデックスはラスタスキャン順に付与される。
deltaTileIdx[i] = bottom_right_tile_idx[i]-top_left_tile_idx[i]
続いて、差分deltaTileIdx[i]と、ピクチャ中の水平方向のタイル数(num_tile_columns_minus1+1)から、タイルグループの水平方向のタイル数と垂直方向のタイル数を導出する。ここでは、タイル数から1を引いた値を導出する。
NumTileRowsInTileGroupMinus1[i] = (deltaTileIdx[i]/(num_tile_columns_minus1+1))
NumTileColumnsInTileGroupMinus1[i] = (deltaTileIdx[i]%(num_tile_columns_minus1+1))
最後に、タイルグループのタイル幅と高さの積から、タイルグループ中のタイル数NumTilesInTileGroup[i]を導出する。
NumTilesInTileGroup[i] = (NumTileRowsInTileGroupMinus1[i]+1)*
(NumTileColumnsInTileGroupMinus1[i]+1)
例えば図30の例では、ピクチャは4×3タイルであるからnum_tile_columns_minus1+1=4である。各タイルグループi = 0..4の左上のタイルインデックスtop_left_tile_idx[i]と右下のタイルインデックスbottom_right_tile_idx[i]は以下となる。
top_left_tile_idx[0] = 0、bottom_right_tile_idx[0] = 9
top_left_tile_idx[1] = 2、bottom_right_tile_idx[1] = 3
top_left_tile_idx[2] = 6、bottom_right_tile_idx[2] = 6
top_left_tile_idx[3] = 7、bottom_right_tile_idx[3] = 11
top_left_tile_idx[4] = 10、bottom_right_tile_idx[4] = 10
よって、TileGroup0は、
NumTileRowsInTileGroupMinus1[0] = deltaTileIdx[0]
= bottom_right_tile_idx[0]-top_left_tile_idx[0]/(num_tile_columns_minus1+1)
= (9-0)/4 = 2
NumTileColumnsInTileGroupMinus1[0] = (9-0)%4 = 1
NumTilesInTileGroup[0] = (1+1)*(2+1) =6
TileGroup1は、
NumTileRowsInTileGroupMinus1[1] = (3-2)/4 = 0
NumTileColumnsInTileGroupMinus1[1] = (3-2)%4 = 1
NumTilesInTileGroup[1] = (0+1)*(1+1) = 2
と導出される。
TileGroup2は、
NumTileRowsInTileGroupMinus1[2] = (6-6)/4 = 0
NumTileColumnsInTileGroupMinus1[2] = (6-6)%4 = 0
NumTilesInTileGroup[2] = (0+1)*(0+1) = 1
と導出される。
TileGroup3は、
NumTileRowsInTileGroupMinus1[3] = (11-7)/4 = 1
NumTileColumnsInTileGroupMinus1[3] = (11-7)%4 = 0
NumTilesInTileGroup[2] = (1+1)*(0+1) = 2
と導出される。
TileGroup4は、
NumTileRowsInTileGroupMinus1[4] = (10-10)/4 = 0
NumTileColumnsInTileGroupMinus1[4] = (10-10)%4 = 0
NumTilesInTileGroup[4] = (0+1)*(0+1) = 1
と導出される。
while( tile_group_address != rect_tile_group_id[ tileGroupIdx ] )
tileGroupIdx++
NumTilesInCurrTileGroup = NumTilesInTileGroup[tileGroupIdx]
tileIdx = top_left_tile_idx[tileGroupIdx]
for(j=0, tIdx=0; j<(NumTileRowsInTileGroupMinus1[tileGroupIdx]+1); j++, tileIdx+=num_tile_columns_minus1+1) {
for(i=0, currTileIdx=tileIdx; i<(NumTileColumnsInTileGroupMinus1[tileGroupIdx]+1); i++, currTileIdx++, tIdx++) {
TgTileIdx[tIdx] = currTileIdx
}
}
ヘッダ符号化部1110及びヘッダ復号部3020は、rect_tile_group_flag==0の場合には、num_tiles_in_tile_group_minus1から、以下の擬似コードによって、タイルグループに含まれるタイルの数NumTilesInTileGroupとタイルグループ内のタイルのインデックスTgTileIdx[tIdx]を導出する。
TgTileIdx[0] = tile_group_address
for(i=1; i<NumTilesInTileGroup; i++)
TgTileIdx[i] = TgTileIdx[i-1]+1
さらに、ヘッダ符号化部1110及びヘッダ復号部3020は、以下の式によって、タイルグループヘッダを符号化、復号する時点で以下の式によって、対象タイルグループに含まれるタイルの数を導出してもよい。
ヘッダ符号化部1110又はヘッダ復号部3020は、タイルグループに含まれるタイル数NumTilesInCurrTileGroupが1の場合に、entropy_coding_sync_enabled_flagを符号化又は復号する。
CtbAddrInRs = CtbAddrTsToRs[ctbAddrInTs]
tbX = CtbAddrInRs % PicWidthInCtbsY
tbY = CtbAddrInRs / PicWidthInCtbsY
for(j=0; j<=num_tile_rows_minus1; j++)
if(tbY>=RowBd[j])
tileY = j
TileGroupHeightInCtbsY = RowHeight[tileY]
TileGroupHeightInCtbsYはタイルグループの高さを示すCTU数、TileHeightInCtbsYはタイルの高さを示すCTU数ともよぶ。
tbY = CtbAddrInRs / PicWidthInCtbsY
for(j=0; j<=num_tile_rows_minus1; j++)
if(tbY>=RowBd[j])
tileY = j
TileHeightInCtbsY = RowHeight[tileY]
TileGroupHeightInCtbsY = 0
for(j=0; j<(NumTileRowsInTileGroupMinus1[tileGroupIdx]+1; j=j+1)
TileGroupHeightInCtbsY += RowHeight[tileY+j]
ここでtileYは、対象タイルグループの左上タイルのピクチャ中(もしくはサブピクチャ中)の位置を示す値であり、上述した方法で導出してもよい。なお、tileYはタイル単位の値である。
タイルグループの幅を示すCTU数TileGroupWidthInCtbsYを以下のように導出してもよい。例えば、タイルグループの幅のタイルの数(NumTileColsInTileGroupMinus1[tileGroupIdx]+1)だけ、各タイルの高さColWidthを加算する。
tbY = CtbAddrInRs / PicWidthInCtbsY
for(i=0; i<=num_tile_columns_minus1; i++)
if(tbX>=ColBd[i])
tileX = i
TileWidthInCtbsY = ColWidth [tileX]
TileGroupWidthInCtbsY = 0
for(j=0; j<(NumTileColsInTileGroupMinus1[tileGroupIdx]+1; j=j+1)
TileGroupWidthInCtbsY += ColWidth[tileX+j]
ここでtileXは、対象タイルグループの左上タイルのタイル単位のピクチャ中(もしくはサブピクチャ中)の位置を示す値であり、上述した方法で導出してもよい。
図32は、本実施形態の一形態のタイルグループとウェーブフロントプロセッシング(CTU行セグメント)の関係を示す図である。図30の例では、タイルグループ中のタイルの数が1個の場合に限定してWPPを利用可能としていたが、本例では、矩形タイルグループもしくはタイルグループ中のタイルの数が1個の場合に、WPPを利用可能とする。この図では、矩形タイルグループが有効であり、TileGroup0、TileGroup2、TileGroup4で、WPPが有効になる例を示す。TileGroup0、TileGroup4では、タイルグループ内に複数のタイルが含まれるが、タイル内でWPPをオンにする。WPPのオンオフに関わらず、タイルグループをタイル毎にラスタ順にスキャンし、さらに各タイル内でラスタ順でCTUのスキャンを行う(タイルスキャン順)。
entropy_coding_sync_enabled_flag
図32に示すように、ピクチャ内では、各タイルグループを順にスキャンする。タイルグループ内ではラスタスキャン順に各タイルをスキャンする、また、各タイル内ではラスタスキャン順にCTUをスキャンする。セグメントは、WPPオフ(entropy_coding_sync_enabled_flag==0)のタイルグループ(TileGroup1, TileGroup3)では、タイル単位であり、WPPオン(entropy_coding_sync_enabled_flag==1)のタイルグループ(TileGroup0,TileGroup2, TileGroup4)では、タイル内のCTU行単位である。タイルグループの先頭セグメント以外では、エントリポイントを符号化又は復号する。すなわち、WPPがオフのタイルグループではタイル数-1個のエントリポイント、WPPがオンの場合には、タイル内のCTU行の数-1個のエントリポイントをもつ。エントリポイントは、図32中に示すとおりである。
上記の構成によれば、タイルグループ内のタイルをさらにCTU行のセグメントに分割して処理できるので、並列数を増やすことができるという効果を奏する。
図34は、本実施形態の一形態のタイルグループとウェーブフロントプロセッシングのヘッダのシンタックス構成を示す図である。図35(b)は、タイルとウェーブフロントの排他構成を備える構成のヘッダ符号化部1110及びヘッダ復号部3020の動作を説明する図である。
entropy_coding_sync_enabled_flag
また、ヘッダ復号部3020は、single_tile_in_pic_flagが1の場合に、rect_tile_group_flagを1と導出してもよい。例えば、符号化データにsingle_tile_per_tile_group_flagが現れない場合(例えば、single_tile_in_pic_flag=1)の場合に、single_tile_per_tile_group_flagを1と導出し、single_tile_per_tile_group_flagの場合に、rect_tile_group_flagを1と導出してもよい。この場合、ヘッダ符号化部1110又はヘッダ復号部3020は、矩形タイルグループ(rect_tile_group_flag==1)の場合(S3011)、entropy_coding_sync_enabled_flagを符号化又は復号する(S3012)。そうでない場合、entropy_coding_sync_enabled_flagを0(WPPオフ)にセットする。
entropy_coding_sync_enabled_flag
上記の構成によれば、タイルグループ内のタイルをさらにCTU行のセグメントに分割して処理できるので、並列数を増やすことができるという効果を奏する。
図37は、タイルベースCTUスキャン順の導出方法を示すフローチャート図である。
CT情報復号部3021(もしくはパラメータ復号部302)又はCT情報符号化部1111(もしくはヘッダ符号化部1110)は、以下の処理によって、CtbAddrRsToTs[]を導出してもよい。
tileGroupTLCol = top_left_tile_idx[i] % (num_tile_columns_minus1+1)
tileGroupTLRow = top_left_tile_idx[i] / (num_tile_columns_minus1+1)
tileGroupXInCtbY = 0
tileGroupYInCtbY = 0
for (j=0; j<tileGroupTLCol; j++)
tileGroupXInCtbY = tileGroupXInCtbY+ColWidth[j]
for (j=0; j<tileGroupTLRow; j++)
tileGroupYInCtbY = tileGroupYInCtbY+RowHeight[j]
tileYInCtb = tileGroupYInCtbY
(S202)
for (row=0; row<=NumTileRowsInTileGroupMinus1[i]; row++) { // TileRasterScanInTileGroup
tileYInCtb = tileYInCtb+RowHeight[tileGroupTLRow+row]
tileXInCtb = tileGroupXInCtbY
for (col=0; col<=NumTileColsInTileGroupMinus1[i]; col++) { // TileRasterScanInTileGroup
tileXInCtb = tileXInCtb+ColWidth[tileGroupTLCol+col]
(S203)
for (y=0; y<RowHeight[tileGroupTLRow+row]; y++) { // CtbRasterScan in Tile
for (x=0; x<ColWidth[tileGroupTLCol+col]; x++) { // CtbRasterScan in Tile
(S204)
ctbAddrRs = (x+tileXInCtb)+(y+tileYInCtb)*PicHeightInCtbsY
(S205)
CtbAddrRsToTs[ctbAddrRs] = ctbAddrTs
CtbAddrTsToRs[ctbAddrTs] = ctbAddrRs
(S206)
ctbAddrTs++
}
}
}
}
S201:タイルグループの左上タイルアドレスtileGroupTLCol、tileGroupTLRowを導出する。タイルグループの左上CTUアドレスtileGroupXInCtbY、tileGroupYInCtbYを導出する。
0 1 2 3 4 5 6 7 8 9 10 11
12 13 14 15 16 17 18 19 20 21 22 23
24 25 26 27 28 29 30 31 32 33 34 35
36 37 38 39 40 41 42 43 44 45 46 47
48 49 50 51 52 53 54 55 56 57 58 59
60 61 62 63 64 65 66 67 68 69 70 71
72 73 74 75 76 77 78 79 80 81 82 83
84 85 86 87 88 89 90 91 92 93 94 95
96 97 98 99 100 101 102 103 104 105 106 107
WPPオフの場合、TileGroup0のCTUスキャン順は以下である。
3 4 5 15 16 17 27 28 29
36 37 38 48 49 50 60 61 62
39 40 41 51 52 53 63 64 65
72 73 74 84 85 86 96 97 98
75 76 77 87 88 89 99 100 101
WPPオンの場合、TileGroup0のCTUスキャン順は以下である。
12 13 14 15 16 17
24 25 26 27 28 29
36 37 38 39 40 41
48 49 50 51 52 53
60 61 62 63 64 65
72 73 74 75 76 77
84 85 86 87 88 89
96 97 98 99 100 101
図39は、本実施形態の一形態のタイルグループとウェーブフロントプロセッシングのヘッダのシンタックス構成を示す図である。
ヘッダ符号化部1110及びヘッダ復号部3020は、ピクチャ中のタイル数が1(single_tile_in_pic_flag==1)もしくは矩形タイルグループの場合(rect_tile_group_flag==1)もしくはタイルグループに含まれるタイル数NumTilesInCurrTileGroupが1の場合に、entropy_coding_sync_enabled_flagを符号化もしくは復号する。
entropy_coding_sync_enabled_flag
なお、ヘッダ符号化部1110及びヘッダ復号部3020は、ピクチャ中のタイル数が1(single_tile_in_pic_flag==1)もしくは矩形タイルグループの場合(rect_tile_group_flag==1)の場合に、entropy_coding_sync_enabled_flagを符号化もしくは復号する構成であってもよい。
entropy_coding_sync_enabled_flag
(ピクチャ内のCTUスキャン順の導出方法2、タイルグループベースCTUスキャン順)
CT情報復号部3021は、ピクチャパラメータセットで通知されたentropy_coding_sync_enabled_flagがオンの場合には、以下の処理によって、CtbAddrRsToTs[]を導出してもよい。この導出方法では、ピクチャ内をタイルグループ順にスキャンを行い(TileGroupLoop)、さらにタイルグループ内をCTU順でラスタスキャン(CtbRasterScan in TileGroup)することでCTUスキャン順を導出する。図38(b)に本構成のフローチャートを示す。なお、ピクチャ単位で通知されたentropy_coding_sync_enabled_flagがオフの場合には、既に、ピクチャ内のCTUスキャン順の導出方法1で説明したように、タイルベースCTUスキャン順を用いてCtbAddrRsToTs[]を導出する。
<パラメータセットでWPP有効フラグを伝送する構成>
以下、タイルグループヘッダではなく、パラメータセットでWPP有効フラグを通知する構成を説明する。以下の構成では、タイルグループを復号する前の段階で、セグメントの並列復号が可能か否かが分かるという共通の効果を奏する。また、ピクチャ単位でWPPを用いるか否かを選択するため、画面全体でエントリポイントの位置が明らかであるという効果を奏する。また、動画像復号装置と、動画像符号化装置もしくは画像伝送システムとの間で能力交換が容易にできるという効果を奏する。
図42は、本実施形態の一形態のタイルグループとウェーブフロントプロセッシングのパラメータセットのシンタックス構成を示す図である。この構成では、ヘッダ符号化部1110又はヘッダ復号部3020は、タイルグループヘッダではなく、パラメータセットにおいて、ピクチャに1つのentropy_coding_sync_enabled_flagを符号化又は復号する。
この構成では、矩形タイルグループであるか否かは、ピクチャパラメータセットで識別できるので、タイルグループを復号する前に、セグメントの並列復号が可能かどうかが分かるという効果を奏する。
この場合、タイルグループ中でタイルとCTU行セグメントを排他的に処理できるという効果を奏する。
2個以上のタイル(タイルインデックスはi)を含むタイルグループの場合に、entropy_coding_sync_enabled_flag[i]を常に1とする符号化データを復号する動画像復号装置では、タイルグループ中でタイルとCTU行セグメントを排他的に処理できるという効果を奏する。
(パラメータセット伝送+タイルグループベースCTUスキャン順)
以下では、さらに、タイルグループヘッダではなく、パラメータセットでWPP有効フラグを通知する構成において、WPP有効フラグが1の場合に、タイルグループ内のCTUスキャン順を、タイルベースCTUスキャン順からタイルグループベースCTUスキャン順に変更する構成を説明する。
図42は、本実施形態の一形態のタイルグループとウェーブフロントプロセッシングのパラメータセットのシンタックス構成を示す図である。この構成では、ヘッダ符号化部1110又はヘッダ復号部3020は、タイルグループヘッダではなく、パラメータセットにおいて、ピクチャに1つのentropy_coding_sync_enabled_flagを符号化又は復号する。
参照ピクチャメモリ306は、加算部312が生成したCUの復号画像を、対象ピクチャ及び対象CU毎に予め定めた位置に記憶する。
加算部312はブロックの復号画像を参照ピクチャメモリ306に記憶し、また、ループフィルタ305に出力する。
次に、本実施形態に係る動画像符号化装置11の構成について説明する。図24は、本実施形態に係る動画像符号化装置11の構成を示すブロック図である。動画像符号化装置11は、予測画像生成部101、減算部102、変換・量子化部103、逆量子化・逆変換部105、加算部106、ループフィルタ107、予測パラメータメモリ109、符号化パラメータ決定部110、パラメータ符号化部111、エントロピー符号化部104を含んで構成される。
上述した動画像符号化装置11及び動画像復号装置31は、動画像の送信、受信、記録、再生を行う各種装置に搭載して利用することができる。なお、動画像は、カメラ等により撮像された自然動画像であってもよいし、コンピュータ等により生成された人工動画像(CGおよびGUIを含む)であってもよい。
また、上述した動画像復号装置31および動画像符号化装置11の各ブロックは、集積回路(ICチップ)上に形成された論理回路によってハードウェア的に実現してもよいし、CPU(Central Processing Unit)を用いてソフトウェア的に実現してもよい。
本出願は、2019年2月8日に出願された日本国特許出願:特願2019-021630、2019年3月25日に出願された日本国特許出願:特願2019-057031に対して優先権の利益を主張するものであり、それを参照することにより、その内容の全てが本書に含まれる。
31 動画像復号装置
101、308 予測画像生成部
104 エントロビー符号化部(符号化部)
107、305 ループフィルタ
111 パラメータ符号化部
301 エントロピー復号部
302 パラメータ復号部(分割部)
3020 ヘッダ復号部
3021 CT情報復号部
3022 CU復号部
109、306 参照ピクチャメモリ
108、307 予測パラメータメモリ
105、311 逆量子化・逆変換部
102 減算部
103 変換・量子化部
104 エントロピー符号化部
106 加算部
110 符号化パラメータ決定部
1110 ヘッダ符号化部
1111 CT情報符号化部
1112 CU符号化部
Claims (4)
- 符号化データを復号する動画像復号装置において、
Context-adaptive binary arithmetic coding(CABAC)の同期処理が行われるか否かを示すフラグと、1ビットのシンタックスエレメントと、バイトアライン用のビット列と、を復号する復号部を備え、
前記フラグの値が1の場合、
前記バイトアライン用のビット列は、タイルグループの最後のCTUではなく、CTU行の最後のCTUであるときに復号されることを特徴とする動画像復号装置。 - 前記バイトアライン用のビット列は、前記タイルグループの最後のCTUでは省略されることを特徴とする請求項1に記載の動画像復号装置。
- 符号化データを生成する動画像符号化装置において、
Context-adaptive binary arithmetic coding(CABAC)の同期処理が行われるか否かを示すフラグと、1ビットのシンタックスエレメントと、バイトアライン用のビット列と、を符号化する符号化部を備え、
前記フラグの値が1の場合、
前記バイトアライン用のビット列は、タイルグループの最後のCTUではなく、CTU行の最後のCTUであるときに、符号化されることを特徴とする動画像符号化装置。 - 符号化データを復号する集積回路において、
Context-adaptive binary arithmetic coding(CABAC)の同期処理が行われるか否かを示すフラグと、1ビットのシンタックスエレメントと、バイトアライン用のビット列と、を復号する復号部を備え、
前記フラグの値が1の場合、
前記バイトアライン用のビット列は、タイルグループの最後のCTUではなく、CTU行の最後のCTUであるときに、復号されることを特徴とする集積回路。
Applications Claiming Priority (6)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2019021630 | 2019-02-08 | ||
| JP2019021630 | 2019-02-08 | ||
| JP2019057031 | 2019-03-25 | ||
| JP2019057031 | 2019-03-25 | ||
| JP2020571301A JPWO2020162609A1 (ja) | 2019-02-08 | 2020-02-07 | 動画像符号化装置および動画像復号装置 |
| PCT/JP2020/004869 WO2020162609A1 (ja) | 2019-02-08 | 2020-02-07 | 動画像符号化装置および動画像復号装置 |
Related Parent Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2020571301A Division JPWO2020162609A1 (ja) | 2019-02-08 | 2020-02-07 | 動画像符号化装置および動画像復号装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2025105675A JP2025105675A (ja) | 2025-07-10 |
| JP7843891B2 true JP7843891B2 (ja) | 2026-04-10 |
Family
ID=71947960
Family Applications (2)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2020571301A Pending JPWO2020162609A1 (ja) | 2019-02-08 | 2020-02-07 | 動画像符号化装置および動画像復号装置 |
| JP2025068469A Active JP7843891B2 (ja) | 2019-02-08 | 2025-04-18 | 動画像符号化装置、動画像復号装置および集積回路 |
Family Applications Before (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2020571301A Pending JPWO2020162609A1 (ja) | 2019-02-08 | 2020-02-07 | 動画像符号化装置および動画像復号装置 |
Country Status (7)
| Country | Link |
|---|---|
| US (3) | US11818355B2 (ja) |
| EP (1) | EP3923581A4 (ja) |
| JP (2) | JPWO2020162609A1 (ja) |
| KR (1) | KR102946134B1 (ja) |
| CN (1) | CN113396593A (ja) |
| CA (2) | CA3129377A1 (ja) |
| WO (1) | WO2020162609A1 (ja) |
Families Citing this family (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN117676138A (zh) * | 2017-12-06 | 2024-03-08 | V-诺瓦国际有限公司 | 编码信号的方法、编码器、解码数据流的方法以及解码器 |
| WO2020111023A1 (en) * | 2018-11-30 | 2020-06-04 | Sharp Kabushiki Kaisha | Systems and methods for signaling tile structures for pictures of coded video |
| KR102946134B1 (ko) * | 2019-02-08 | 2026-04-01 | 샤프 가부시키가이샤 | 비디오 코딩 장치 및 비디오 디코딩 장치 |
| US20240223774A1 (en) * | 2022-12-30 | 2024-07-04 | Qualcomm Incorporated | Parallel processing for video coding |
| CN120712781A (zh) * | 2023-02-17 | 2025-09-26 | 联发科技股份有限公司 | 视频编解码中基于片的ctu并行处理 |
Family Cites Families (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| RS64003B1 (sr) * | 2012-04-13 | 2023-03-31 | Ge Video Compression Llc | Kodiranje slike sa niskim kašnjenjem |
| US9161039B2 (en) * | 2012-09-24 | 2015-10-13 | Qualcomm Incorporated | Bitstream properties in video coding |
| US20150016503A1 (en) * | 2013-07-15 | 2015-01-15 | Qualcomm Incorporated | Tiles and wavefront processing in multi-layer context |
| US20160234498A1 (en) * | 2015-02-05 | 2016-08-11 | Sharp Laboratories Of America, Inc. | Methods and systems for palette table coding |
| JPWO2016203981A1 (ja) * | 2015-06-16 | 2018-04-05 | シャープ株式会社 | 画像復号装置及び画像符号化装置 |
| US11197006B2 (en) * | 2018-06-29 | 2021-12-07 | Interdigital Vc Holdings, Inc. | Wavefront parallel processing of luma and chroma components |
| KR102946134B1 (ko) * | 2019-02-08 | 2026-04-01 | 샤프 가부시키가이샤 | 비디오 코딩 장치 및 비디오 디코딩 장치 |
-
2020
- 2020-02-07 KR KR1020217028882A patent/KR102946134B1/ko active Active
- 2020-02-07 WO PCT/JP2020/004869 patent/WO2020162609A1/ja not_active Ceased
- 2020-02-07 EP EP20753187.2A patent/EP3923581A4/en active Pending
- 2020-02-07 CA CA3129377A patent/CA3129377A1/en active Pending
- 2020-02-07 JP JP2020571301A patent/JPWO2020162609A1/ja active Pending
- 2020-02-07 CN CN202080012887.XA patent/CN113396593A/zh active Pending
- 2020-02-07 US US17/429,024 patent/US11818355B2/en active Active
- 2020-02-07 CA CA3292756A patent/CA3292756A1/en active Pending
-
2023
- 2023-09-13 US US18/367,527 patent/US12192466B2/en active Active
-
2024
- 2024-11-21 US US18/954,597 patent/US20250080740A1/en active Pending
-
2025
- 2025-04-18 JP JP2025068469A patent/JP7843891B2/ja active Active
Non-Patent Citations (1)
| Title |
|---|
| Tomohiro Ikai , et al.,AHG12: Wavefront processing in a tile group , Joint Video Experts Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11 13th Meeting: Marrakech, MA, 9-18 Jan. 2019, JVET-M JVET-M0070,2019年01月18日,p. 1~3 |
Also Published As
| Publication number | Publication date |
|---|---|
| WO2020162609A1 (ja) | 2020-08-13 |
| CA3129377A1 (en) | 2020-08-13 |
| US20220182631A1 (en) | 2022-06-09 |
| CN113396593A (zh) | 2021-09-14 |
| US12192466B2 (en) | 2025-01-07 |
| US11818355B2 (en) | 2023-11-14 |
| JPWO2020162609A1 (ja) | 2021-12-23 |
| KR20210122850A (ko) | 2021-10-12 |
| EP3923581A4 (en) | 2022-11-16 |
| JP2025105675A (ja) | 2025-07-10 |
| KR102946134B1 (ko) | 2026-04-01 |
| EP3923581A1 (en) | 2021-12-15 |
| US20250080740A1 (en) | 2025-03-06 |
| CA3292756A1 (en) | 2026-03-02 |
| US20240007635A1 (en) | 2024-01-04 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP7843891B2 (ja) | 動画像符号化装置、動画像復号装置および集積回路 | |
| US9077998B2 (en) | Padding of segments in coded slice NAL units | |
| CN114586356B (zh) | 用于在视频/图像编码系统中对变换系数进行编码的方法和设备 | |
| US10136161B2 (en) | DMM prediction section, image decoding device, and image coding device | |
| US12028541B2 (en) | Moving image encoding and decoding | |
| JP2025016813A (ja) | 動画像符号化装置および動画像復号装置 | |
| US11652991B2 (en) | Video decoding apparatus with picture tile structure | |
| CN113632475A (zh) | 图像解码装置 | |
| CN115088256B (zh) | 选择性地用信号通知滤波可用信息的图像编码/解码方法和装置以及发送比特流的方法 | |
| WO2020067440A1 (ja) | 動画像符号化装置および動画像復号装置 | |
| WO2020100833A1 (ja) | 動画像復号装置、動画像符号化装置、動画像復号方法および動画像符号化方法 | |
| CN114762349A (zh) | 用于图像/视频编译的高级别语法信令方法和装置 | |
| WO2020045275A1 (ja) | 画像復号装置および画像符号化装置 | |
| JP2020107961A (ja) | 動画像符号化装置および動画像復号装置 | |
| JP2020005199A (ja) | 画素サンプリングインターリーブ画像符号化/復号装置 | |
| JP2021153214A (ja) | 動画像符号化装置および動画像復号装置 | |
| JP2022002356A (ja) | 動画像符号化装置および動画像復号装置 | |
| JP2021153215A (ja) | 動画像符号化装置および動画像復号装置 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20250418 |
|
| RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20250428 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20260106 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20260217 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20260317 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20260331 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7843891 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |