JP2023522224A - 参照ピクチャリスト上の制約 - Google Patents
参照ピクチャリスト上の制約 Download PDFInfo
- Publication number
- JP2023522224A JP2023522224A JP2022563090A JP2022563090A JP2023522224A JP 2023522224 A JP2023522224 A JP 2023522224A JP 2022563090 A JP2022563090 A JP 2022563090A JP 2022563090 A JP2022563090 A JP 2022563090A JP 2023522224 A JP2023522224 A JP 2023522224A
- Authority
- JP
- Japan
- Prior art keywords
- picture
- sub
- video
- current
- pictures
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 claims abstract description 210
- 238000012545 processing Methods 0.000 claims abstract description 67
- 238000003672 processing method Methods 0.000 claims abstract description 23
- 238000011084 recovery Methods 0.000 claims description 17
- 238000004590 computer program Methods 0.000 claims description 13
- 230000001131 transforming effect Effects 0.000 claims description 11
- 230000004044 response Effects 0.000 claims description 3
- 239000010410 layer Substances 0.000 description 91
- 230000033001 locomotion Effects 0.000 description 73
- 230000008569 process Effects 0.000 description 44
- 239000002356 single layer Substances 0.000 description 22
- 239000013598 vector Substances 0.000 description 20
- 241001482237 Pica Species 0.000 description 19
- 230000011664 signaling Effects 0.000 description 12
- 230000002123 temporal effect Effects 0.000 description 11
- 238000010586 diagram Methods 0.000 description 10
- 238000013461 design Methods 0.000 description 9
- 238000000605 extraction Methods 0.000 description 8
- 238000013139 quantization Methods 0.000 description 8
- 230000015654 memory Effects 0.000 description 7
- 238000012952 Resampling Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 238000005192 partition Methods 0.000 description 5
- 238000000638 solvent extraction Methods 0.000 description 5
- 238000003491 array Methods 0.000 description 4
- 230000006835 compression Effects 0.000 description 4
- 238000007906 compression Methods 0.000 description 4
- 238000001914 filtration Methods 0.000 description 4
- 230000007246 mechanism Effects 0.000 description 4
- 230000011218 segmentation Effects 0.000 description 4
- FMYKJLXRRQTBOR-UBFHEZILSA-N (2s)-2-acetamido-4-methyl-n-[4-methyl-1-oxo-1-[[(2s)-1-oxohexan-2-yl]amino]pentan-2-yl]pentanamide Chemical group CCCC[C@@H](C=O)NC(=O)C(CC(C)C)NC(=O)[C@H](CC(C)C)NC(C)=O FMYKJLXRRQTBOR-UBFHEZILSA-N 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 3
- 101150103552 cagE gene Proteins 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 230000006837 decompression Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 238000006073 displacement reaction Methods 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000013515 script Methods 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 230000000153 supplemental effect Effects 0.000 description 2
- 108091008143 L ribosomal proteins Proteins 0.000 description 1
- 241000023320 Luma <angiosperm> Species 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 238000013467 fragmentation Methods 0.000 description 1
- 238000006062 fragmentation reaction Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- OSWPMRLSEDHDFF-UHFFFAOYSA-N methyl salicylate Chemical compound COC(=O)C1=CC=CC=C1O OSWPMRLSEDHDFF-UHFFFAOYSA-N 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/40—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video transcoding, i.e. partial or full decoding of a coded input stream followed by re-encoding of the decoded output stream
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/105—Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/157—Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
- H04N19/159—Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/174—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/188—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a video data packet, e.g. a network abstraction layer [NAL] unit
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/573—Motion compensation with multiple frame prediction using two or more reference frames in a given prediction direction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Television Signal Processing For Recording (AREA)
Abstract
Description
パリ条約に基づく適用可能な特許法および/または規則に基づいて、本願は、2020年4月20日出願の米国特許仮出願第63/012713号の優先権および利益を適時に主張することを目的とする。法に基づくすべての目的のために、上記出願の開示全体は、本明細書の開示の一部として参照により援用される。
AU Access Unit(アクセスユニット)
AUD Access Unit Delimiter(アクセスユニット区切り文字)
AVC Advanced Video Coding(高度映像コーディング)
CLVS Coded Layer Video Sequence(コーディングされたレイヤ映像シーケンス)
CPB Coded Picture Buffer(コーディングされたピクチャバッファ)
CRA Clean Random Access(クリーンランダムアクセス)
CTU Coding Tree Unit(コーディングツリーユニット)
CVS Coded Video Sequence(コーディングされた映像シーケンス)
DCI Decoding Capability Information(復号能力情報)
DPB Decoded Picture Buffer(復号ピクチャバッファ)
EOB End Of Bitstream(ビットストリーム終端)
EOS End Of Sequence(シーケンス終端)
GDR Gradual Decoding Refresh(漸次的復号更新)
HEVC High Efficiency Video Coding(高効率映像コーディング)
HRD Hypothetical Reference Decoder(仮想参照デコーダ)
IDR Instantaneous Decoding Refresh(瞬時復号更新)
JEM Joint Exploration Model(共同探索モデル)
MCTS Motion-Constrained Tile Sets(動き制約タイルセット)
NAL Network Abstraction Layer(ネットワーク抽象化レイヤ)
OLS Output Layer Set(出力レイヤセット)
PH Picture Header(ピクチャヘッダ)
PPS Picture Parameter Set(ピクチャパラメータセット)
PTL Profile,Tier and Level(プロファイル、層およびレベル)
PU Picture Unit(ピクチャユニット)
RADL Random Access Decodable Leading(ランダムアクセス復号可能リード)(ピクチャ)
RAP Random Access Point(ランダムアクセスポイント)
RASL Random Access Skipped Leading(ランダムアクセススキップリード)(ピクチャ)
RBSP Raw Byte Sequence Payload(生バイトシーケンスペイロード)
RPL Reference Picture List(参照ピクチャリスト)
SEI Supplemental Enhancement Information(補足強化情報)
SPS Sequence Parameter Set(シーケンスパラメータセット)
STSA Step-wise Temporal Sublayer Access(段階的時間的サブレイヤアクセス)
SVC Scalable Video Coding(スケーラブル映像コーディング)
VCL Video Coding Layer(映像コーディングレイヤ)
VPS Video Parameter Set(映像パラメータセット)
VTM VVC Test Model(VVC試験モデル)
VUI Video Usability Information(映像ユーザビリティ情報)
VVC Versatile Video Coding(汎用映像コーディング)
i)BLAピクチャの基本機能性は、CRAピクチャにシーケンスNALユニットの終端を加えることで実現でき、このシーケンスNALユニットの終端が存在することは、後続のピクチャが単層ビットストリームにおいて新しいCVSを開始することを示す。
ii)VVCの開発において、NALユニットヘッダのNALユニットタイプフィールドに6ビットの代わりに5ビットを用いることによって示されるように、HEVCよりも少ないNALユニットタイプを規定することが望ましかった。
(特定のピクチャの)関連付けられたIRAPピクチャ:復号順における前のIRAPピクチャ(存在する場合)は、特定のピクチャと同じ値nuh_layer_idを有する。
クリーンランダムアクセス(CRA)PU:コーティングされたピクチャがCRAピクチャであるPU。
クリーンランダムアクセス(CRA)ピクチャ:それぞれのVCL NALユニットのnal_unit_typeがCRA_NUTであるIRAPピクチャ。
コーディング映像シーケンス(CVS):復号順で、CVSS AUに続き、CVSS AUである後続のAUまで(ただし後続のAUは含まない)のすべてのAUを含む、CVSS AUでない0以上のAUから構成される、AUのシーケンス。
コーディング映像シーケンス開始(CVSS)AU:CVSの各レイヤにPUがあり、各PUのコーディングされたピクチャがCLVSSピクチャであるAU。
漸次的復号更新(GDR)AU:本PU各々のコーディングされたピクチャがGDRピクチャであるAU。
漸次的復号更新(GDR)PU:コーディングされたピクチャがGDRピクチャであるPU。
漸次的復号更新(GDR)ピクチャ:NALユニットのnal_unit_typeがGDR_NUTであるピクチャ。
瞬時復号更新(IDR)PU:コーディングされたピクチャがIDRピクチャであるPU。
瞬時復号更新(IDR)ピクチャ:それぞれのVCL NALユニットのnal_unit_typeがIDR_W_RADLまたはIDR_N_LPであるIRAPピクチャ。
イントラランダムアクセスポイント(IRAP)AU:CVSの各レイヤにPUが存在し、各PUのコーディングされたピクチャがIRAPピクチャであるAU。
イントラランダムアクセスポイント(IRAP)PU:コーディングされたピクチャがIRAPピクチャであるPU。
イントラランダムアクセスポイント(IRAP)ピクチャ:IDR_W_RADLからCRA_NUTの範囲内で、すべてのVCL NALユニットのnal_unit_typeが同じ値であるコーディングされたピクチャ。
先頭ピクチャ:関連付けられたIRAPピクチャと同じレイヤにあり、関連付けられたIRAPピクチャに出力順で先行するピクチャ。
出力順:復号ピクチャがDPBから出力される順番(DPBから出力される復号ピクチャの場合)。
ランダムアクセス復号可能先頭(RADL)PU:コーディングされたピクチャがRADLピクチャであるPU。
ランダムアクセス復号可能先頭(RADL)ピクチャ:それぞれのVCL NALユニットのnal_unit_typeがRADL_NUTであるピクチャ。
ランダムアクセススキップ先頭(RASL)PU:コーディングされたピクチャが、RASLピクチャであるPU。
ランダムアクセススキップ先頭(RASL)ピクチャ:それぞれのVCL NALユニットのnal_unit_typeがRASL_NUTであるピクチャ。
段階的時間的サブレイヤアクセス(STSA)PU:コーディングされたピクチャがSTSAピクチャであるPU。
段階的時間的サブレイヤアクセス(STSA)ピクチャ:それぞれのVCL NALユニットのnal_unit_typeがSTSA_NUTであるピクチャ。
注- STSAピクチャは、インター予測参照に対してSTSAピクチャと同じTemporalIdを有するピクチャを使用しないことに留意されたい。STSAピクチャと同じTemporalIdを有する復号順序でSTSAピクチャの後続のピクチャは、STSAピクチャと同じTemporalIdを有する復号順序でインター予測参照にはSTSAピクチャの前のピクチャを使用しない。STSAピクチャは、STSAピクチャにおいて、STSAピクチャを含むサブレイヤに対して、直下のサブレイヤからのアップスイッチを有効化する。STSAピクチャのTemporal Idは0より大きくなければならない。
サブピクチャ:ピクチャ内の1つ以上のスライスの矩形領域。
後端ピクチャ:出力順の関連付けられたIRAPピクチャに続くnon-IRAPピクチャで、STSAピクチャではない。
注- IRAPピクチャに関連付けられた後端ピクチャも、IRAPピクチャの復号順に従うことに留意されたい。関連付けられたIRAPピクチャの出力順に続き、関連付けられたIRAPピクチャに復号順で先行するピクチャは、許可されない。
nuh_reserved_zero_bitは、0に等しいものとする。nuh_reserved_zero_bitの値1は、将来、ITU-T|ISO/IECにより規定してもよい。デコーダは、nuh_reserved_zero_bitが1に等しいNALユニットを無視する(すなわち、ビットストリームから削除し、廃棄する)。
nuh_layer_idの値は、1つのコーディングされたピクチャのすべてのVCL NALユニットに対して同じであるものとする。コーディングされたピクチャまたはPUのnuh_layer_idの値は、コーディングされたピクチャまたはPUのVCL NALユニットのnuh_layer_idの値である。
AUD、PH、EOS、FD NALユニットのnuh_layer_idの値は、以下のように制約される。
- nal_unit_typeがAUD_NUTに等しい場合、nuh_layer_idはvps_layer_id[0]に等しいものとする。
- あるいは、nal_unit_typeがPH_NUT、EOS_NUT、FD_NUTに等しい場合、nuh_layer_idは関連付けられたVCL NALユニットのnuh_layer_idであるものとする。
注1- DCI、VPS、およびEOB NALユニットのnuh_layer_idの値は制約されていない。
nal_unit_typeは、表5で規定されているように、NALユニットタイプ、すなわちNALユニットに含まれるRBSPデータ構造のタイプを規定する。
UNSPEC_28..UNSPEC_31の範囲内にあり、意味論が規定されていないnal_unit_typeを有するNALユニットは、本明細書で規定される復号処理に影響を及ぼさないものとする。
注2- UNSPEC_28..UNSPEC_31の範囲内にあるNALユニットタイプ、アプリケーションにより決定されたとおりに使用されてもよい。本明細書では、nal_unit_typeのこれらの値の復号処理は規定されていない。異なるアプリケーションはこれらのNALユニットタイプを異なる目的で使用してもよいので、これらのnal_unit_type値を有するNALユニットを生成するエンコーダの設計、およびこれらのnal_unit_type値を有するNALユニットのコンテンツを解釈するデコーダの設計にあたり、特に注意しなければならない。本明細書は、これらの値の管理を定義していない。これらのnal_unit_type値は、使用の「衝突」(すなわち、同じnal_unit_type値に対するNALユニットのコンテンツの意味の異なる定義)が重要でない、または可能でない、または管理された状況、例えば、制御アプリケーションまたはトランスポート仕様において、またはビットストリームが分散される環境を制御することによって定義または管理されるコンテキストでの使用にのみ適している場合がある。
(附属書Cに規定されるように)ビットストリームのDUにおけるデータの数を決定すること以外の目的のために、デコーダは、nal_unit_typeの予約済みの値を使用するすべてのNALユニットのコンテンツを無視する(ビットストリームから取り除き、廃棄する)ものとする。
注3- この要件は、本明細書に適合する拡張を将来的に定義することを可能にする。
注5- IDR_N_LPに等しいnal_unit_typeを有するIDR(Instantaneous Decoding Refresh)ピクチャは、ビットストリームに存在する関連付けられた先頭ピクチャを有さない。IDR_W_RADLに等しいnal_unit_typeを有するIDRピクチャは、ビットストリームに存在する関連付けられたRASLピクチャ有していないが、ビットストリームに関連付けられたRADLピクチャを有していてもよい。
-mixed_nalu_types_in_pic_flagが0に等しい場合、nal_unit_typeの値は、ピクチャの全てのVCL NALユニットについて同一であるものとし、ピクチャまたはPUは、このピクチャまたはPUのコーディングされたスライスNALユニットと同一のNALユニットタイプを有するとみなされる。
- そうでない場合(mixed_nalu_types_in_pic_flagが1に等しい)、このピクチャは、少なくとも2つのサブピクチャを有し、このピクチャのVCL NALユニットは、以下のような正確に2つの異なるnal_unit_type値を有するものとする。このピクチャの少なくとも1つのサブピクチャのVCL NALユニットは、全てSTSA_NUT、RADL_NUT、RASL_NUT、IDR_W_RADL、IDR_N_LP、またはCRA_NUTに等しい特定のnal_unit_typeを有する一方、ピクチャ内の他のサブピクチャのVCL NALユニットは、全て、異なる特定値としてTRAIL_NUT、RADL_NUT、またはRASL_NUTに等しいnal_unit_typeを有するものとする。
-各ピクチャは、復号順においてビットストリームの第1のピクチャを除き、復号順において前のIRAPピクチャに関連付けられていると考えられる。
-ピクチャがIRAPピクチャの先頭ピクチャである場合、RADLまたはRASLピクチャとする。
-ピクチャがIRAPピクチャの後端ピクチャである場合、RADLまたはRASLピクチャではないものとする。
-IDRピクチャに関連付けられたRASLピクチャは、ビットストリームに含まれていないものとする。
-RADLピクチャは、IDR_N_LPに等しいnal_unit_typeを有するIDRピクチャに関連付けられたビットストリームに含まれていないものとする。
注6- 各パラメータセットが参照されるときに、(ビットストリームにおいて、または本明細書で規定されていない外部手段によって)利用可能である限り、IRAP PUの前のすべてのPUを破棄することにより、IRAP PUの位置でランダムアクセスを実行する(かつ、復号順においてIRAPピクチャおよびすべての後続の非RASLピクチャを正しく復号する)ことが可能である。
-IRAPピクチャに復号順で先行するピクチャは、IRAPピクチャに出力順で先行し、IRAPピクチャに関連付けられたRADLピクチャを出力順で先行するものとする。
-CRAピクチャに関連付けられたRASLピクチャは、出力順でCRAピクチャに関連付けられたRADLピクチャに先行するものとする。
-CRAピクチャに関連付けられたRASLピクチャは、復号順でCRAピクチャに先行するIRAPピクチャの出力順に従うものとする。
-field_seq_flagが0に等しく、現在のピクチャがIRAPピクチャに関連付けられた先頭ピクチャに等しい場合、同じIRAPピクチャに関連付けられたすべての非先頭ピクチャに復号順で先行するものとする。そうでない場合、picAおよびpicBを、それぞれ、1つのIRAPピクチャに関連付けられた、復号順序において、最初のおよび最後の先頭ピクチャとすると、復号順において、復号順でpicAに先行する非先頭ピクチャが最大1つ存在し、復号順でpicAおよびpicBの間に非先頭ピクチャはないものとする。
nuh_temporal_id_plus1の値は0に等しくないものとする。
変数TemporalIdは、以下のように導出される。
TemporalId=nuh_temporal_id_plus1-1 (36)
nal_unit_typeがIDR_W_RADL~RSV_IRAP_12の範囲内にある場合、TemporalIdは0に等しいものとする。
nal_unit_typeがSTSA_NUTであり、vps_independent_layer_flag[GeneralLayerIdx[nuh_layer_id]]が1に等しい場合は、TemporalIdは0でないものとする。
TemporalIdの値は、1つのAUのすべてのVCL NALユニットに対して同じであるものとする。コーディングされたピクチャ、PU、またはAUのTemporalIdの値は、コーディングされたピクチャ、PU、またはAUのVCL NALユニットのTemporalIdの値である。サブレイヤ表現のTemporalIdの値は、サブレイヤ表現におけるすべてのVCL NALユニットのTemporalIdの最大値である。
-nal_unit_typeがDCI_NUT、VPS_NUT、VPS_NUT、またはSPS_NUTに等しい場合、TemporalIdは0に等しく、NALユニットを含むAUのTemporalIdは0に等しいものとする。
-そうでない場合、nal_unit_typeがPH_NUTに等しい場合、TemporalIdは、NALユニットを含むPUのTemporalIdであるものとする。
-そうでない場合、nal_unit_typeがEOS_NUTまたはEOB_NUTに等しい場合、TemporalIdは0に等しいものとする。
-そうでない場合、nal_unit_typeがAUD_NUT、FD_NUT、PREFIX_SEI_NUT、またはSUFFIX_SEI_NUTに等しい場合、TemporalIdはNALユニットを含むAUのTemporalIdであるものとする。
-そうでない場合、nal_unit_typeがPPS_NUT、PREFIX_APS_NUT、またはSUFFIX_APS_NUTに等しい場合、TemporalIdはNALユニットを含むPUのTemporalId以上であるものとする。
注7- NALユニットが非VCL NALユニットである場合、TemporalIdの値は、非VCL NALユニットが適用されるすべてのAUのTemporalId値の最小値に等しい。nal_unit_typeがPPS_NUT、PREFIX_APS_NUT、またはSUFFIX_APS_NUTに等しい場合、TemporalIdは、AUを含むTemporalId以上であってもよく、すべてのPPSおよびAPSがビットストリームの始まりに含まれてもよく(例えば、それらが帯域外に輸送されている場合、受信機はそれらをビットストリームの先端に配置する)、第1のコーディングされたピクチャは、0に等しいTemporalIdを有する。
1に等しいmixed_nalu_types_nalu_pic_flagは、PPSを参照する各ピクチャが2つ以上のVCL NALユニットを有し、VCL NALユニットがnal_unit_typeの同じ値を有さず、ピクチャがIRAPピクチャでないことを規定する。0に等しいmixed_nalu_types_in_pic_flagは、PPSを参照する各ピクチャが1つ以上のVCL NALユニットを有し、PPSを参照する各ピクチャのVCL NALがnal__unit_typeの同じ値を有することを規定する。
no_mixed_nalu_types_in_pic_constraint_flagが1に等しい場合は、mixed_nalu_types_in_pic_flagの値は0に等しいものとする。
nal_unit_type値nalUnitTypeAがIDR_W_RADL~CRA_NUTの範囲内にある各スライスで、nal_unit_typeの別の値を有する1つ以上のスライスをも含むpicA(すなわち、ピクチャpicAのmixed_nalu_types_in_pic_flagの値が1に等しい)において、下記が適用される。
-このスライスは、対応するsubpic_treated_as_pic_flag[i]の値が1に等しいサブピクチャsubpicAに属するものとする。
-このスライスは、nal_unit_typeがnalUnitTypeAに等しくないVCL NALユニットを含むpicAのサブピクチャに属さないものとする。
-nalUnitTypeAがCRAに等しい場合、復号順序および出力順序でCLVSにおける現在のピクチャに後続するすべてのPUのために、それらのPUにおけるsubpicAにおけるスライスのRefPicList[0]およびRefPicList[1]は、アクティブエントリにおける復号順でpicAに先行するいずれのピクチャも含まないものとする。
-そうでない場合(すなわち、nalUnitTypeAがIDR_W_RADLまたはIDR_N_LPである)、復号順に現在のピクチャに続くCLVSにおけるすべてのPUについて、これらのPUにおけるsubpicAにおけるスライスのRefPicList[0]もRefPicList[1]のいずれも、アクティブエントリにおいて復号順でpicAに先行する任意のピクチャを含まないものとする。
注1- 1に等しいmixed_nalu_types_in_pic_flagは、PPSを参照するピクチャが、異なるNALユニットタイプを有するスライスを含み、例えば、サブピクチャビットストリームマージ演算に由来するコーディングされたピクチャであり、ビットストリーム構造のマッチングと更に元のビットストリームのパラメータのアラインメントとを確実にしなければならないことを示す。このようなアラインメントの一例は、以下のようである。sps_idr_rpl_present_flagの値が0に等しく、mixed_nalu_types_in_pic_flagが1に等しい場合は、PPSを参照するピクチャは、nal_unit_typeがIDR_W_RADLまたはIDR_N__LPと等しいスライスを有することはできない。
...
ph_pic_order_cnt_lsbは、現在のピクチャのピクチャオーダカウントmodulo MaxPicOrderCntLsbを規定する。ph_pic_order_cnt_lsb構文要素の長さは、log2_max_pic_order_cnt_lsb_minus4+4ビットである。ph_pic_order_cnt_lsbの値は、0~MaxPicOrderCntLsb-1の範囲内にあるものとする。
RpPicOrderCntVal=PicOrderCntVal + recovery_poc_cnt (81)
...
各iが0または1に等しい場合、RefPicList[i]における第1のNumRefIdxActive[i]エントリは、RefPicList[i]におけるアクティブエントリと称され、RefPicList[i]における他のエントリは、RefPicList[i]における非アクティブエントリと称される。
注2- 特定のピクチャは、RefPicList[0]におけるエントリおよびRefPicList[1]におけるエントリの両方により参照されることがあり得る。また、特定のピクチャが、RefPicList[0]における複数のエントリによって、またはRefPicList[1]における複数のエントリにより参照されることもあり得る。
注3- RefPicList[0]のアクティブエントリおよびRefPicList[1]のアクティブエントリは、現在のピクチャおよび復号順において現在のピクチャに続く1または複数のピクチャのインター予測のために使用してもよい全ての参照ピクチャをまとめて参照する。RefPicList[0]の非アクティブエントリおよびRefPicList[1]の非アクティブエントリは、現在のピクチャのインター予測のためには使用されないが、復号順において現在のピクチャに続く1つ以上のピクチャのためのインター予測において用いられ得る全ての参照ピクチャを集合的に参照する。
注4- RefPicList[0]またはRefPicList[1]には、対応するピクチャがDPBに存在しないため、「参照ピクチャなし」に等しいエントリが1または複数ある場合がある。「参照ピクチャなし」に等しいRefPicList[0]またはRefPicList[0]における各非アクティブエントリは、無視されるべきである。「参照ピクチャなし」に等しいRefPicList[0]またはRefPicList[1]における各アクティブエントリごとに、意図しないピクチャ損失を推測すべきである。
- 各iが0または1に等しい場合、num_ref_entries[i][RplsIdx[i]]は、NumRefIdxActive[i]よりも小さくてはならない。
- RefPicList[0]またはRefPicList[1]の各アクティブエントリによって参照されるピクチャは、DPBに含まれ、かつ現在のピクチャのTemporalId以下とする。
- RefPicList[0]またはRefPicList[1]の各エントリによって参照されるピクチャは、現在のピクチャではなく、0に等しいnon_reference_picture_flagを有するものとする。
- ピクチャのスライスのRefPicList[0]またはRefPicList[1]におけるSTRPエントリと、同じピクチャの同じスライスまたは異なるスライスのRefPicList[0]またはRefPicList[1]におけるLTRPエントリとは、同じピクチャを参照しないものとする。
- 現在のピクチャのPicOrderCntValとエントリにより参照されるピクチャのPicOrderCntValとの差分が224以上であるRefPicList[0]またはRefPicList[1]において、LTRPエントリはないものとする。
- setOfRefPicsは、RefPicList[0]において現在のピクチャと同じnuh_layer_idを有する全てのエントリと、RefPicList[1]において現在のピクチャと同じnuh_layer_idを有する全てのエントリとにより参照される固有のピクチャのセットである。setOfRefPicsにおけるピクチャの数は、MaxDpbSize-1以下であるものとする。ここで、MaxDpbSizeは、A.4.2項に規定されるとおりであり、setOfRefPicsは、ピクチャの全てのスライスで同一である。
- 現在のスライスがSTSA_NUTに等しいnal_unit_typeを有する場合、現在のピクチャのものとTemporalIdが等しく、かつnuh_layer_idが現在のピクチャのものと等しいRefPicList[0]またはRefPicList[1]においてアクティブエントリが存在しないものとする。
- 現在のピクチャが、復号順において、現在のピクチャのものとTemporalIdが等しく、かつ現在のピクチャのものとnuh_layer_idが等しいSTSAピクチャの後に続くピクチャである場合、復号順において、STSAピクチャに先行し、現在のピクチャのものとTemporalIdが等しく、かつ現在のピクチャのものとnuh_layer_idが等しいピクチャは、RefPicList[0]またはRefPicList[1]にアクティブエントリとして含まれるピクチャはないものとする。
- 現在のピクチャがCRAピクチャの場合、RefPicList[0]またはRefPicList[1]のエントリにより参照されるピクチャであって、復号順において先行するIRAPピクチャ(存在する場合)に、出力順または復号順において、先行するピクチャはないものとする。
- 現在のピクチャが後端ピクチャである場合、RefPicList[0]またはRefPicList[1]のアクティブエントリにより参照されるピクチャであって、現在のピクチャに関連付けられたIRAPピクチャのために利用不可な参照ピクチャを生成するための復号処理によって生成されたピクチャはないものとする。
- 現在のピクチャが、復号順と出力順の両方において、同じIRAPピクチャに関連付けられた1または複数の先頭ピクチャに続く後端ピクチャである場合、RefPicList[0]またはRefPicList[1]のエントリにより参照されるピクチャであって、現在のピクチャに関連付けられたIRAPピクチャのために利用不可な参照ピクチャを生成するための復号処理により生成されたピクチャはないものとする。
- 現在のピクチャがリカバリポイントピクチャであるか、またはリカバリポイントピクチャの出力順序において後続するピクチャである場合、リカバリポイントピクチャのGDRピクチャのために使用不可能な参照ピクチャを生成するための復号処理によって生成されたピクチャを含むRefPicList[0]またはRefPicList[1]のエントリはない。
- 現在のピクチャが後端ピクチャである場合、出力順または復号順において、関連付けられたIRAPピクチャに先行するRefPicList[0]またはRefPicList[1]のアクティブエントリにより参照されるピクチャはないものとする。
- 現在のピクチャが、復号順および出力順の両方において、同じIRAPピクチャに関連付けられた1または複数の先頭ピクチャに続く後端ピクチャである場合、出力順または復号順において、関連付けられたIRAPピクチャに先行するRefPicList[0]またはRefPicList[1]におけるエントリにより参照されるピクチャはないものとする。
- 現在のピクチャがRADLピクチャである場合、RefPicList[0]またはRefPicList[1]に以下のいずれかに該当するアクティブエントリはないものとする。
o RASLピクチャ
o 利用不可能な参照ピクチャを生成するために、復号処理によって生成されたピクチャ
o 関連付けられたIRAPピクチャに復号順において先行するピクチャ
- 現在のピクチャのスライスのRefPicList[0]またはRefPicList[1]における各ILRPエントリにより参照されるピクチャは、現在のピクチャと同じAU内にあるものとする。
- 現在のピクチャのスライスのRefPicList[0]またはRefPicList[1]における各ILRPエントリにより参照されるピクチャは、DPBに存在し、かつ現在のピクチャのものよりも小さいnuh_layer_idを有するものとする。
- スライスのRefPicList[0]またはRefPicList[1]における各ILRPエントリは、アクティブエントリであるものとする。
...
chroma_format_idcの値に基づいて、現在のピクチャのサンプル配列の数は、以下のとおりである。
-chroma_format_idcが0に等しい場合、現在のピクチャは、1つのサンプル配列SLからなる。
-そうでない場合(chroma_format_idcが0でない場合)、現在のピクチャは、3つのサンプル配列SL、SCb、SCrからなる。
現在のピクチャの復号処理は、項目7からの構文要素および大文字変数を入力とする。各NALユニットにおける各構文要素の意味を解釈する場合、また項目8の残りの部分において、用語「ビットストリーム」(またはその一部、例えば、ビットストリームのCVS)は、BitstreamToDecode(またはその一部)を指す。
-separate_colour_plane_flagが0に等しい場合、現在のピクチャを出力として、復号処理を1回呼び出す。
-そうでない場合(separate_colour_plane_flagが1に等しい)、復号処理を3回呼び出す。復号処理への入力は、colour_plane_idの値が同一なコーディングされたピクチャの全てのNALユニットである。colour_plane_idの特定値を有するNALユニットの復号処理は、colour_plane_idの特定値を有する単色カラーフォーマットを有するCVSのみがビットストリームに存在するかのように特定される。3つの復号処理の各々のアウトプットは、現在のピクチャの3つのサンプル配列の1つに割り当てられ、colour_plane_idがそれぞれ0、1、および2に等しいNALユニットが、SL、SCb、およびSCrに割り当てられる。
- ピクチャオーダカウントに関連する変数および関数は、8.3.1項で規定されるように導出される。これは、ピクチャの第1のスライスに対してのみ呼び出す必要がある。
- 非IDRピクチャの各スライスの復号処理の最初に、参照ピクチャリスト0(RefPicList[0])と参照ピクチャリスト1(RefPicList[1])の導出のために、8.3.2項に規定された参照ピクチャリスト構築のための復号処理が呼び出される。
- 8.3.3項の参照ピクチャマーキングのための復号処理が呼び出され、参照ピクチャは、「参照のために使用されていない」または「長期参照のために使用される」としてマークされてもよい。これは、ピクチャの第1のスライスに対してのみ呼び出す必要がある。
- 現在のピクチャが、NoOutputBeforeRecoveryFlagが1に等しいCRAピクチャまたはNoOutputBeforeRecoveryFlagが1に等しいGDRピクチャである場合、8.3.4項で規定される利用不可能な参照ピクチャを生成するための復号処理が呼び出されるが、ピクチャの第1のスライスに対してのみ呼び出される必要がある。
- PictureOutputFlagは、以下のように設定される。
- 以下の条件の1つが真である場合、PictureOutputFlagを0に等しく設定する。
- 現在のピクチャはRASLピクチャであり、関連付けられたIRAPピクチャのNoOutputBeforeRecoveryFlagは1に等しい。
- gdr_enabled_flagは1に等しく、現在のピクチャは、NoOutputBeforeRecoveryFlagが1に等しいGDRピクチャである。
- gdr_enabled_flagは1に等しく、現在のピクチャは、NoOutputBeforeRecoveryFlagが1に等しいGDRピクチャに関連付けられ、現在のピクチャのPicOrderCntValは、関連付けられたGDRピクチャのRpPicOrderCntValよりも小さい。
- sps_video_parameter_set_idが0より大きく、ols_mode_idcが0に等しく、現在のAUは、以下の条件を全て満たすピクチャpicAを含む。
- PicAは、1に等しいPictureOutputFlagを有する。
- PicAは、現在のピクチャのものよりも大きいnuh_layer_id nuhLidを有する。
- PicAはOLSの出力レイヤに属する(すなわち、OutputLayerIdInOls[TargetOlsIdx][0]はnuhLidに等しい)。
- sps_video_parameter_set_idが0より大きく、ols_mode_idcが2に等しく、ols_output_layer_flag[TargetOlsIdx][GeneralLayerIdx[nuh_layer_id]]は0に等しい。
- そうでない場合、PictureOutputFlagがpic_output_flagに等しく設定される。
a. 更に、1つ以上の用語が定義されている:関連付けられたGDRサブピクチャ、関連付けられたIRAPサブピクチャ、CRAサブピクチャ、GDRサブピクチャ、IDRサブピクチャ、IRAPサブピクチャ、先頭サブピクチャ、RADLサブピクチャ、RASLサブピクチャ、STSAサブピクチャ、後端サブピクチャ。
a. 一例において、この制約は、以下のように規定される。ピクチャ内にサブピクチャインデックスiおよびjを有する任意の2つの隣接するサブピクチャの場合、subpic_transpeted_pic_flag[i]またはsubpic_transpeted_pic_flag[j]が0に等しい場合、2つのサブピクチャは、同じNALユニットタイプを持つものとする。
a. あるいは、サブピクチャインデックスiを有するいずれかのサブピクチャが0に等しいsubpic_transpeted_pic_flag[i]を有する場合、ピクチャにおける全てのサブピクチャは、同一のNALユニットタイプを有するものとする(すなわち、ピクチャにおける全てのVCL NALユニットは、同一のNALユニットタイプを有するものとする、すなわち、mixed_nalu_types_in_pic_flagが0に等しいものとする)。これは、全てのサブピクチャが、それらに対応する1に等しいsubpic_treated_as_pic_flag[]を有する場合、mixed_naru_types_in_pic_flagが1にだけなり得ることを意味する。
このように、デコーダを適合させるために出力される全てのピクチャが正確である必要があるという制約によって、このようなピクチャ内のRADLサブピクチャを保証することができる。しかし、関連付けられたCRAピクチャが1に等しいNoOutputBeforeRecoveryFlagを有する場合、このようなピクチャ内の「中間値」RASLサブピクチャの「正確性」の保証も行われるが、実際には必要ではない。保証の不必要な部分は、問題ではなく、適合するエンコーダまたはデコーダを実装するための複雑さを増すこともない。この場合、NoOutputBeforeRecoveryFlagが1であるCRAピクチャに関連付けられたこのようなRASLサブピクチャは、復号処理によって出力されてもよいが、表示に使用することを意図していないので、表示に使用するべきでないことを明確にするために、注意を追加することが有用である。
a. RASLサブピクチャを含むピクチャ
b. 関連付けされたIRAPサブピクチャを含むピクチャに、復号順において先行するピクチャ。
a. nuh_layer_idがlayerIdに等しく、subpicIdxに等しいサブピクチャインデックスを持つRASLサブピクチャを含むピクチャ。
b. 関連付けされたIRAPサブピクチャを含むピクチャに、復号順において先行するピクチャ。
nal_unit_typeは、表5で規定されているように、NALユニットタイプ、すなわちNALユニットに含まれるRBSPデータ構造のタイプを規定する。
UNSPEC_28..UNSPEC_31の範囲内にあり、意味論が規定されていないnal_unit_typeを有するNALユニットは、本明細書で規定される復号処理に影響を及ぼさないものとする。
注2- UNSPEC_28..UNSPEC_31の範囲内にあるNALユニットタイプ、アプリケーションにより決定されたとおりに使用されてもよい。本明細書では、nal_unit_typeのこれらの値の復号処理は規定されていない。異なるアプリケーションはこれらのNALユニットタイプを異なる目的で使用してもよいので、これらのnal_unit_type値を有するNALユニットを生成するエンコーダの設計、およびこれらのnal_unit_type値を有するNALユニットのコンテンツを解釈するデコーダの設計にあたり、特に注意しなければならない。本明細書は、これらの値の管理を定義していない。これらのnal_unit_type値は、使用の「衝突」(すなわち、同じnal_unit_type値に対するNALユニットのコンテンツの意味の異なる定義)が重要でない、または可能でない、または管理された状況、例えば、制御アプリケーションまたはトランスポート仕様において、またはビットストリームが分散される環境を制御することによって定義または管理されるコンテキストでの使用にのみ適している場合がある。
(附属書Cに規定されるように)ビットストリームのDUにおけるデータの数を決定すること以外の目的のために、デコーダは、nal_unit_typeの予約済みの値を使用するすべてのNALユニットのコンテンツを無視する(ビットストリームから取り除き、廃棄する)ものとする。
注3-この要件は、本明細書に適合する拡張を将来的に定義することを可能にする。
注5- IDR_N_LPに等しいnal_unit_typeを有するIDR(Instantaneous Decoding Refresh)ピクチャは、ビットストリームに存在する関連付けられた先頭ピクチャを有さない。IDR_W_RADLに等しいnal_unit_typeを有するIDRピクチャは、ビットストリームに存在する関連付けられたRASLピクチャ有していないが、ビットストリームに関連付けられたRADLピクチャを有していてもよい。
nal_unit_typeの値は、1つのサブピクチャのすべてのVCL NALユニットについて同じものとする。1つのサブピクチャは、このサブピクチャのVCL NALユニットと同じNALユニットタイプを有すると見なされている。
- mixed_nalu_types_in_pic_flagが0に等しい場合、nal_unit_typeの値は、ピクチャの全てのVCL NALユニットについて同一であるものとし、ピクチャまたはPUは、このピクチャまたはPUのNALユニットと同一のNALユニットタイプを有するとみなされる。
- そうでない場合(mixed_nalu_types_in_pic_flagが1に等しい)、このピクチャは、少なくとも2つのサブピクチャを有し、このピクチャのVCL NALユニットは、以下のような正確に2つの異なるnal_unit_type値を有するものとする。このピクチャの少なくとも1つのサブピクチャのVCL NALユニットは、全てSTSA_NUT、RADL_NUT、RASL_NUT、IDR_W_RADL、IDR_N_LP、またはCRA_NUTに等しい特定のnal_unit_typeを有する一方、ピクチャ内の他のサブピクチャのVCL NALユニットは、全て、異なる特定値としてTRAIL_NUT、RADL_NUT、またはRASL_NUTに等しいnal_unit_typeを有するものとする。
1に等しいmixed_nalu_types_nalu_pic_flagは、PPSを参照する各ピクチャが2つ以上のVCL NALユニットを有し、VCL NALユニットがnal_unit_typeの同じ値を有さない[[ピクチャがIRAPピクチャでない]]ことを規定する。0に等しいmixed_nalu_types_in_pic_flagは、PPSを参照する各ピクチャが1つ以上のVCL NALユニットを有し、PPSを参照する各ピクチャのVCL NALがnal__unit_typeの同じ値を有することを規定する。
no_mixed_nalu_types_in_pic_constraint_flagが1に等しい場合は、mixed_nalu_types_in_pic_flagの値は0に等しいものとする。
- このスライスは、対応するsubpic_treated_as_pic_flag[i]の値が1に等しいサブピクチャsubpicAに属するものとする。
- このスライスは、nal_unit_typeがnalUnitTypeAに等しくないVCL NALユニットを含むpicAのサブピクチャに属さないものとする。
- nalUnitTypeAがCRAに等しい場合、復号順序および出力順序でCLVSにおける現在のピクチャに後続するすべてのPUのために、それらのPUにおけるsubpicAにおけるスライスのRefPicList[0]およびRefPicList[1]は、アクティブエントリにおける復号順でpicAに先行するいずれのピクチャも含まないものとする。
- そうでない場合(すなわち、nalUnitTypeAがIDR_W_RADLまたはIDR_N_LPである)、復号順において現在のピクチャに続くCLVSにおけるすべてのPUについて、これらのPUにおけるsubpicAにおけるスライスのRefPicList[0]とRefPicList[1]のいずれも、アクティブエントリにおいて復号順でpicAに先行する任意のピクチャを含まないものとする。]]
...
ビットストリーム適合性の要件は、以下の制約が適用されることである。
- RefPicList[0]またはRefPicList[1]の各アクティブエントリによって参照されるピクチャは、DPBに含まれ、かつ現在のピクチャのTemporalId以下とする。
- RefPicList[0]またはRefPicList[1]の各エントリによって参照されるピクチャは、現在のピクチャではなく、0に等しいnon_reference_picture_flagを有するものとする。
- ピクチャのスライスのRefPicList[0]またはRefPicList[1]におけるSTRPエントリと、同じピクチャの同じスライスまたは異なるスライスのRefPicList[0]またはRefPicList[1]におけるLTRPエントリとは、同じピクチャを参照しないものとする。
- 現在のピクチャのPicOrderCntValとエントリにより参照されるピクチャのPicOrderCntValとの差分が224以上であるRefPicList[0]またはRefPicList[1]において、LTRPエントリはないものとする。
- setOfRefPicsは、RefPicList[0]において現在のピクチャと同じnuh_layer_idを有する全てのエントリと、RefPicList[1]において現在のピクチャと同じnuh_layer_idを有する全てのエントリとにより参照される固有のピクチャのセットである。setOfRefPicsにおけるピクチャの数は、MaxDpbSize-1以下であるものとする。ここで、MaxDpbSizeは、A.4.2項に規定されるとおりであり、setOfRefPicsは、ピクチャの全てのスライスで同一である。
- 現在のスライスがSTSA_NUTに等しいnal_unit_typeを有する場合、現在のピクチャのものとTemporalIdが等しく、かつnuh_layer_idが現在のピクチャのものと等しいRefPicList[0]またはRefPicList[1]においてアクティブエントリが存在しないものとする。
- 現在のピクチャが、復号順において、現在のピクチャのものとTemporalIdが等しく、かつ現在のピクチャのものとnuh_layer_idが等しいSTSAピクチャの後に続くピクチャである場合、復号順において、STSAピクチャに先行し、現在のピクチャのものとTemporalIdが等しく、かつ現在のピクチャのものとnuh_layer_idが等しいピクチャは、RefPicList[0]またはRefPicList[1]にアクティブエントリとして含まれるピクチャはないものとする。
o RASLピクチャ
o 関連付けられたIRAPピクチャに復号順において先行するピクチャ
- 現在のピクチャのスライスのRefPicList[0]またはRefPicList[1]における各ILRPエントリにより参照されるピクチャは、DPBに存在し、かつ現在のピクチャのものよりも小さいnuh_layer_idを有するものとする。
- スライスのRefPicList[0]またはRefPicList[1]における各ILRPエントリは、アクティブエントリであるものとする。
本願は、2021年4月19日出願の国際特許出願第PCT/US2021/027963号に基づくものであり、2020年4月20日出願の米国特許仮出願第63/012713号の優先権および利益を主張する。前述のすべての特許出願は、その全体が参照により本明細書に組み込まれる。
Claims (38)
- 映像処理方法であって、
1つ以上のサブピクチャを含む1つ以上のピクチャを含む映像と、前記映像のビットストリームとの間の変換を行うことを含み、
前記ビットストリームは、サブピクチャがイントラランダムアクセスポイントサブピクチャの先頭サブピクチャでないことに呼応して、サブピクチャがランダムアクセスタイプのサブピクチャにはなり得ないことを規定するフォーマット規則に準拠し、
前記先頭サブピクチャは、出力順で前記イントラランダムアクセスポイントサブピクチャに先行する、
方法。 - 前記イントラランダムアクセスポイントサブピクチャは、すべての映像コーディングレイヤ(VCL)ネットワーク抽象化レイヤ(NAL)ユニットが、IDR_W_RADLからCRA_NUTの範囲内のNALユニットタイプの同じ値を有するサブピクチャである、
請求項1に記載の方法。 - 前記ランダムアクセスタイプのサブピクチャは、ランダムアクセス復号可能な先頭サブピクチャを含む、
請求項1に記載の方法。 - 前記ランダムアクセス復号可能な先頭サブピクチャは、各映像コーディングレイヤ(VCL)ネットワーク抽象化レイヤ(NAL)ユニットが、RADL_NUTに等しいNALユニットタイプを有するサブピクチャである、
請求項3に記載の方法。 - 前記ランダムアクセスタイプのサブピクチャは、ランダムアクセススキップ先頭サブピクチャを含む、
請求項1に記載の方法。 - 前記ランダムアクセススキップ先頭サブピクチャは、各映像コーディングレイヤ(VCL)ネットワーク抽象化レイヤ(NAL)がRASL_NUTに等しいNALユニットタイプを有するサブピクチャである、
請求項5に記載の方法。 - 映像処理方法であって、
複数のサブピクチャを含む1つ以上のピクチャを含む映像と、前記映像のビットストリームとの間で変換を行うことを含み、
前記ビットストリームは、第1のサブピクチャおよび第2のサブピクチャが同じネットワーク抽象化レイヤ(NAL)ユニットのレイヤ識別子と同じサブピクチャインデックスとを有し、かつ、前記第1のサブピクチャが前記第2のサブピクチャに復号順で先行することに呼応して、リカバリポイントピクチャにおいて前記第1のサブピクチャが前記第2のサブピクチャに先行することを規定するフォーマット規則に準拠する、
方法。 - 映像処理方法であって、
現在のスライスを含む現在のサブピクチャを含む現在のピクチャを含む映像と、前記映像のビットストリームとの間で変換を行うことを含み、
前記ビットストリームはフォーマット規則に準拠し、
前記フォーマット規則は、ピクチャが前記ビットストリームにおいて示される順序を規定し、
前記フォーマット規則は、前記現在のスライスの参照ピクチャリストのエントリが、前記現在のピクチャに第2の順序に従って先行する第2のピクチャに第1の順序に従って先行する第1のピクチャを含むことを禁止し、
前記第2のピクチャは、前記現在のサブピクチャと同じネットワーク抽象化ユニット(NAL)ユニットのレイヤ識別子と同じサブピクチャインデックスを有するイントラランダムアクセスポイントサブピクチャを含み、
前記現在のサブピクチャはクリーンランダムアクセスサブピクチャである、
方法。 - 前記第1の順序は復号順または出力順を含む、
請求項8に記載の方法。 - 前記第2の順序は復号順を含む、
請求項8~9のいずれかに記載の方法。 - 前記参照ピクチャリストは、List0参照ピクチャリストを含む、
請求項8~10のいずれかに記載の方法。 - 前記参照ピクチャリストは、List1参照ピクチャリストを含む、
請求項8~10のいずれかに記載の方法。 - 前記クリーンランダムアクセスサブピクチャは、各映像コーディングレイヤ(VCL)NALユニットがCRA_NUTに等しいNALユニットタイプを有するイントラランダムアクセスポイントサブピクチャである、
請求項8~12のいずれかに記載の方法。 - 映像処理方法であって
現在のスライスを含む現在のサブピクチャを含む現在のピクチャを含む映像と、前記映像のビットストリームとの間で変換を行うことを含み、
前記ビットストリームはフォーマット規則に準拠し、
前記フォーマット規則は、ピクチャが前記ビットストリームにおいて示される順序を規定し、
前記フォーマット規則は、前記現在のスライスの参照ピクチャリストのアクティブエントリが、第1の順序に従って第2のピクチャに先行する第1のピクチャを含むことを禁止し、
前記第2のピクチャは、現在のサブピクチャと同じネットワーク抽象化ユニット(NAL)ユニットのレイヤ識別子と同じサブピクチャインデックスを有するイントラランダムアクセスポイントサブピクチャを含み、
前記現在のサブピクチャは、第2の順序で前記イントラランダムアクセスポイントサブピクチャに後続する、
方法。 - 前記第1の順序は復号順または出力順を含む、
請求項14に記載の方法。 - アクティブエントリは、現在のスライスのインター予測において参照インデックスとして使用されるために利用可能なエントリに対応する、
請求項14と15のいずれかに記載の方法。 - 前記第2の順序は復号順および出力順を含む、
請求項14に記載の方法。 - 前記参照ピクチャリストは、List0参照ピクチャリストを含む、
請求項14~17のいずれかに記載の方法。 - 前記参照ピクチャリストは、List1参照ピクチャリストを含む、
請求項14~17のいずれかに記載の方法。 - 映像処理方法であって
現在のスライスを含む現在のサブピクチャを含む現在のピクチャを含む映像と、前記映像のビットストリームとの間で変換を行うことを含み、
前記ビットストリームはフォーマット規則に準拠し、
前記フォーマット規則は、ピクチャが前記ビットストリームにおいて示される順序を規定し、
前記フォーマット規則は、現在のスライスの参照ピクチャリストのエントリが、第1の順序または第2の順序に従って第2のピクチャに先行する第1のピクチャを含むことを禁止し、
前記第2のピクチャは、0以上の関連する先頭サブピクチャを有し、前記現在のサブピクチャと同じネットワーク抽象化ユニット(NAL)ユニットのレイヤ識別子と同じサブピクチャインデックスを有するイントラランダムアクセスポイントサブピクチャを含み、
前記現在のサブピクチャは、前記第1の順序および前記第2の順序において前記イントラランダムアクセスポイントサブピクチャおよび前記0以上の関連する先頭サブピクチャに後続する、
方法。 - 前記第1の順序は復号順を含む、
請求項20に記載の方法。 - 前記第2の順序は出力順を含む、
請求項20に記載の方法。 - 前記参照ピクチャリストは、List0参照ピクチャリストを含む、
請求項20~22のいずれかに記載の方法。 - 前記参照ピクチャリストは、List1参照ピクチャリストを含む、
請求項20~22のいずれかに記載の方法。 - 映像処理方法であって
現在のスライスを含む現在のサブピクチャを含む現在のピクチャを含む映像と、前記映像のビットストリームとの間で変換を行うことを含み、
前記ビットストリームは、前記現在のサブピクチャがランダムアクセス復号可能先頭サブピクチャであることに呼応して、前記現在のスライスの参照ピクチャリストのアクティブエントリが、前記現在のサブピクチャのものと同じサブピクチャインデックスを有するランダムアクセススキップ先頭サブピクチャを含む第1のピクチャ、および、前記ランダムアクセス復号可能先頭サブピクチャに関連するイントラランダムアクセスポイントサブピクチャを含む第3のピクチャに復号順で先行する第2のピクチャ、のいずれか1つ以上を含むことを禁止されることを規定するフォーマット規則に準拠する、
方法。 - 前記アクティブエントリは、前記現在のスライスのインター予測において参照インデックスとして使用されるために利用可能なエントリに対応する、
請求項25に記載の方法。 - 前記参照ピクチャリストは、List0参照ピクチャリストを含む、
請求項25に記載の方法。 - 前記参照ピクチャリストは、List1参照ピクチャリストを含む、
請求項25に記載の方法。 - 前記変換を行うことは、前記映像を前記ビットストリームに符号化することを含む、
請求項1~28のいずれかに記載の方法。 - 前記変換を行うことは、前記映像から前記ビットストリームを生成することを含み、
前記方法は、前記ビットストリームを非一時的なコンピュータ可読記録媒体に記憶することをさらに含む、
請求項1から28のいずれかに記載の方法。 - 前記変換を行うことは、前記ビットストリームから前記映像を復号することを含む、
請求項1から28のいずれかに記載の方法。 - 請求項1から31の1項以上に記載の方法を実装するように構成される処理装置を備える、
映像復号装置。 - 請求項1から31の1項以上に記載の方法を実装するように構成される処理装置を備える、
映像符号化装置。 - コンピュータ命令が記憶されたコンピュータプログラム製品であって、
前記命令は、処理装置により実行されると、前記処理装置に、請求項1から31のいずれかに記載の方法を実装させる、
コンピュータプログラム製品。 - 請求項1から31のいずれか1項に記載の映像処理方法に従って生成されるビットストリームを記憶する、
非一時的なコンピュータ可読記憶媒体。 - 非一時的なコンピュータ可読記憶媒体であって、
請求項1から31のいずれかに記載の方法を処理装置に実装させる命令を記憶する、
非一時的なコンピュータ可読記憶媒体。 - ビットストリーム生成方法であって、
請求項1から31のいずれか1項に記載の方法に従って映像のビットストリームを生成することと、
前記ビットストリームをコンピュータ可読プログラム媒体に記憶することと、を含む、
方法。 - 本明細書に記載の開示された方法またはシステムに従って生成された方法、装置またはビットストリーム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202063012713P | 2020-04-20 | 2020-04-20 | |
US63/012,713 | 2020-04-20 | ||
PCT/US2021/027963 WO2021216448A1 (en) | 2020-04-20 | 2021-04-19 | Constraints on reference picture lists |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2023522224A true JP2023522224A (ja) | 2023-05-29 |
JP7529795B2 JP7529795B2 (ja) | 2024-08-06 |
Family
ID=78269884
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022563090A Active JP7529795B2 (ja) | 2020-04-20 | 2021-04-19 | 参照ピクチャリスト上の制約 |
Country Status (7)
Country | Link |
---|---|
US (2) | US11889060B2 (ja) |
EP (1) | EP4122195A4 (ja) |
JP (1) | JP7529795B2 (ja) |
KR (1) | KR20230002395A (ja) |
CN (1) | CN115462070A (ja) |
BR (1) | BR112022021342A2 (ja) |
WO (1) | WO2021216448A1 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021132963A1 (ko) * | 2019-12-23 | 2021-07-01 | 엘지전자 주식회사 | 슬라이스 또는 픽처에 대한 nal 유닛 타입 기반 영상 또는 비디오 코딩 |
Family Cites Families (36)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
ATE555475T1 (de) | 2004-04-28 | 2012-05-15 | Panasonic Corp | Stream-erzeugungsvorrichtung für bewegliche bilder, kodierungsvorrichtung für bewegliche bilder, multiplex-vorrichtung für bewegliche bilder und decodierungsvorrichtung für bewegliche bilder |
US8665968B2 (en) | 2009-09-30 | 2014-03-04 | Broadcom Corporation | Method and system for 3D video coding using SVC spatial scalability |
US10003817B2 (en) * | 2011-11-07 | 2018-06-19 | Microsoft Technology Licensing, Llc | Signaling of state information for a decoded picture buffer and reference picture lists |
US9503702B2 (en) | 2012-04-13 | 2016-11-22 | Qualcomm Incorporated | View synthesis mode for three-dimensional video coding |
US9979958B2 (en) * | 2012-04-20 | 2018-05-22 | Qualcomm Incorporated | Decoded picture buffer processing for random access point pictures in video sequences |
US9736476B2 (en) | 2012-04-27 | 2017-08-15 | Qualcomm Incorporated | Full random access from clean random access pictures in video coding |
US20140003504A1 (en) * | 2012-07-02 | 2014-01-02 | Nokia Corporation | Apparatus, a Method and a Computer Program for Video Coding and Decoding |
US9491457B2 (en) | 2012-09-28 | 2016-11-08 | Qualcomm Incorporated | Signaling of regions of interest and gradual decoding refresh in video coding |
US20140092953A1 (en) | 2012-10-02 | 2014-04-03 | Sharp Laboratories Of America, Inc. | Method for signaling a step-wise temporal sub-layer access sample |
WO2014059049A1 (en) | 2012-10-09 | 2014-04-17 | Rodriguez Arturo A | Output management of prior decoded pictures at picture format transitions in bitstreams |
US9325997B2 (en) | 2012-11-16 | 2016-04-26 | Huawei Technologies Co., Ltd | Signaling scalability information in a parameter set |
KR102431453B1 (ko) | 2012-11-21 | 2022-08-11 | 엘지전자 주식회사 | 영상 디코딩 방법 및 이를 이용하는 장치 |
US20140218473A1 (en) | 2013-01-07 | 2014-08-07 | Nokia Corporation | Method and apparatus for video coding and decoding |
US9521393B2 (en) | 2013-01-07 | 2016-12-13 | Qualcomm Incorporated | Non-nested SEI messages in video coding |
US9998735B2 (en) * | 2013-04-01 | 2018-06-12 | Qualcomm Incorporated | Inter-layer reference picture restriction for high level syntax-only scalable video coding |
US9674533B2 (en) | 2013-04-05 | 2017-06-06 | Qualcomm Incorporated | Picture alignments in multi-layer video coding |
CN105379277B (zh) | 2013-07-15 | 2019-12-17 | 株式会社Kt | 用于编码/解码可伸缩视频信号的方法和装置 |
US9860529B2 (en) | 2013-07-16 | 2018-01-02 | Qualcomm Incorporated | Processing illumination compensation for video coding |
US10070125B2 (en) * | 2013-07-31 | 2018-09-04 | Nokia Technologies Oy | Method and apparatus for video coding and decoding |
WO2015125494A1 (en) | 2014-02-21 | 2015-08-27 | Sharp Kabushiki Kaisha | System for temporal identifier handling for hybrid scalability |
WO2015140401A1 (en) | 2014-03-17 | 2015-09-24 | Nokia Technologies Oy | An apparatus, a method and a computer program for video coding and decoding |
EP3202150B1 (en) | 2014-09-30 | 2021-07-21 | Microsoft Technology Licensing, LLC | Rules for intra-picture prediction modes when wavefront parallel processing is enabled |
US9800898B2 (en) | 2014-10-06 | 2017-10-24 | Microsoft Technology Licensing, Llc | Syntax structures indicating completion of coded regions |
US20170105004A1 (en) | 2015-10-07 | 2017-04-13 | Qualcomm Incorporated | Methods and systems of coding a predictive random access picture using a background picture |
PT3925213T (pt) | 2019-03-11 | 2023-11-03 | Huawei Tech Co Ltd | Restrições de imagens do tipo de unidades nal mistas |
CN113853792A (zh) * | 2019-05-11 | 2021-12-28 | 北京字节跳动网络技术有限公司 | 带有参考图片重采样的编解码工具 |
US11166033B2 (en) | 2019-06-06 | 2021-11-02 | Qualcomm Incorporated | Adaptation parameter set in access unit in video coding |
US11483558B2 (en) | 2019-06-21 | 2022-10-25 | Tencent America LLC | Method for region-wise scalability with adaptive resolution change |
US20210076074A1 (en) | 2019-09-11 | 2021-03-11 | Qualcomm Incorporated | Maximum and minimum block sizes signaling at high level syntax for video coding and transform units |
JP7414980B2 (ja) * | 2019-10-13 | 2024-01-16 | 北京字節跳動網絡技術有限公司 | 参照ピクチャリサンプリングと映像コーディングツールとの間の相互作用 |
US11375232B2 (en) | 2019-12-10 | 2022-06-28 | Zte (Uk) Limited | Sub picture signaling in video coding |
CA3164485A1 (en) | 2019-12-20 | 2021-06-24 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Decoder, encoder and methods for mixing nal units of different nal unit types in video streams |
MX2022007897A (es) | 2019-12-23 | 2022-09-26 | Lg Electronics Inc | Codificacion de imagen o video basada en informacion asociada a la unidad nal. |
US11399188B2 (en) | 2020-01-01 | 2022-07-26 | Tencent America LLC | Method for mixed NAL unit type support in a coded picture |
CN115191118A (zh) * | 2020-01-05 | 2022-10-14 | 抖音视界有限公司 | 在视频编解码中使用自适应颜色变换 |
KR20220156832A (ko) * | 2020-03-21 | 2022-11-28 | 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 | 서브 픽처 및 스케일러빌러티 조합 |
-
2021
- 2021-04-19 BR BR112022021342A patent/BR112022021342A2/pt unknown
- 2021-04-19 JP JP2022563090A patent/JP7529795B2/ja active Active
- 2021-04-19 WO PCT/US2021/027963 patent/WO2021216448A1/en unknown
- 2021-04-19 EP EP21791788.9A patent/EP4122195A4/en active Pending
- 2021-04-19 KR KR1020227035276A patent/KR20230002395A/ko unknown
- 2021-04-19 CN CN202180029943.5A patent/CN115462070A/zh active Pending
-
2022
- 2022-10-20 US US17/969,976 patent/US11889060B2/en active Active
-
2023
- 2023-12-04 US US18/528,032 patent/US20240137493A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
JP7529795B2 (ja) | 2024-08-06 |
US20230059682A1 (en) | 2023-02-23 |
US11889060B2 (en) | 2024-01-30 |
BR112022021342A2 (pt) | 2022-12-13 |
WO2021216448A1 (en) | 2021-10-28 |
KR20230002395A (ko) | 2023-01-05 |
EP4122195A1 (en) | 2023-01-25 |
CN115462070A (zh) | 2022-12-09 |
EP4122195A4 (en) | 2023-06-21 |
US20240137493A1 (en) | 2024-04-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7420965B2 (ja) | 隣接するサブピクチャのコーディング | |
US20240048689A1 (en) | Sublayers information in video coding | |
JP2024075706A (ja) | 参照ピクチャ順序の制約 | |
WO2021257529A1 (en) | Decoded picture buffer management and subpictures in video coding | |
CN115668924A (zh) | 参考图片信息的约束 | |
JP7529795B2 (ja) | 参照ピクチャリスト上の制約 | |
JP7518207B2 (ja) | コーディングされた映像におけるnalユニットの順序 | |
JP2023529422A (ja) | 映像コーディングにおける補足強化情報メッセージのスケーラブルネスティング | |
JP2023526807A (ja) | サブレイヤ数制限 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221121 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20221121 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20231226 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240116 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240415 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240625 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240725 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7529795 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |