JP2023529430A - 映像ビットストリームにおけるサブレイヤ信号通知 - Google Patents
映像ビットストリームにおけるサブレイヤ信号通知 Download PDFInfo
- Publication number
- JP2023529430A JP2023529430A JP2022575463A JP2022575463A JP2023529430A JP 2023529430 A JP2023529430 A JP 2023529430A JP 2022575463 A JP2022575463 A JP 2022575463A JP 2022575463 A JP2022575463 A JP 2022575463A JP 2023529430 A JP2023529430 A JP 2023529430A
- Authority
- JP
- Japan
- Prior art keywords
- video
- level
- picture
- bitstream
- sli
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000011664 signaling Effects 0.000 title description 10
- 238000000034 method Methods 0.000 claims abstract description 81
- 230000000153 supplemental effect Effects 0.000 claims abstract description 16
- 238000012545 processing Methods 0.000 claims description 38
- 238000004590 computer program Methods 0.000 claims description 12
- 230000001131 transforming effect Effects 0.000 claims description 6
- 230000033001 locomotion Effects 0.000 description 73
- 239000010410 layer Substances 0.000 description 68
- 229920010524 Syndiotactic polystyrene Polymers 0.000 description 20
- 238000002490 spark plasma sintering Methods 0.000 description 20
- 239000013598 vector Substances 0.000 description 20
- 208000034188 Stiff person spectrum disease Diseases 0.000 description 19
- 208000012112 ischiocoxopodopatellar syndrome Diseases 0.000 description 19
- 238000005516 engineering process Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 10
- 238000000605 extraction Methods 0.000 description 10
- 238000013139 quantization Methods 0.000 description 8
- 238000012952 Resampling Methods 0.000 description 7
- 230000015654 memory Effects 0.000 description 7
- 238000012360 testing method Methods 0.000 description 7
- 238000004891 communication Methods 0.000 description 6
- 230000001419 dependent effect Effects 0.000 description 6
- 238000013461 design Methods 0.000 description 6
- 230000008859 change Effects 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 238000003672 processing method Methods 0.000 description 5
- 230000004044 response Effects 0.000 description 5
- 238000000638 solvent extraction Methods 0.000 description 5
- 230000006835 compression Effects 0.000 description 4
- 238000007906 compression Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000005192 partition Methods 0.000 description 4
- 239000002356 single layer Substances 0.000 description 4
- 230000002123 temporal effect Effects 0.000 description 4
- 108091000069 Cystinyl Aminopeptidase Proteins 0.000 description 3
- 102100020872 Leucyl-cystinyl aminopeptidase Human genes 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000001914 filtration Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 238000003491 array Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000006837 decompression Effects 0.000 description 2
- 238000006073 displacement reaction Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000002688 persistence Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 238000013515 script Methods 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 241000023320 Luma <angiosperm> Species 0.000 description 1
- 101100011511 Mus musculus Elovl6 gene Proteins 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 230000003139 buffering effect Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 238000013467 fragmentation Methods 0.000 description 1
- 238000006062 fragmentation reaction Methods 0.000 description 1
- 239000011229 interlayer Substances 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- OSWPMRLSEDHDFF-UHFFFAOYSA-N methyl salicylate Chemical compound COC(=O)C1=CC=CC=C1O OSWPMRLSEDHDFF-UHFFFAOYSA-N 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/46—Embedding additional information in the video signal during the compression process
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/30—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
- H04N19/31—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the temporal domain
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/146—Data rate or code amount at the encoder output
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/172—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/184—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/30—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Aiming, Guidance, Guns With A Light Source, Armor, Camouflage, And Targets (AREA)
Abstract
Description
パリ条約に基づく適用可能な特許法および/または規則に基づいて、本願は、2020年6月8日出願の米国特許仮出願第63/036,365号の優先権および利益を適時に主張することを目的とする。法に基づくすべての目的のために、上記出願の開示全体は、本明細書の開示の一部として参照により援用される。
本明細書は、映像コーディング技術に関する。具体的には、サブピクチャシーケンスのためのレベル情報を規定し、信号通知することに関する。本発明は、シングルレイヤ映像コーディングおよびマルチレイヤ映像コーディングに対応する任意の映像コーディング規格または非標準映像コーデック、例えば、開発中の汎用映像コーディング(VVC)に適用してもよい。
APS Adaptation Parameter Set(適応パラメータセット)
AU Access Unit(アクセスユニット)
AUD Access Unit Delimiter(アクセスユニット区切り文字)
AVC Advanced Video Coding(高度映像コーディング)
BP Buffering Period(バッファリング期間)
CLVS Coded Layer Video Sequence(コーディッドレイヤ映像シーケンス)
CPB Coded Picture Buffer(コーディッドピクチャバッファ)
CRA Clean Random Access(クリーンランダムアクセス)
CTU Coding Tree Unit(コーディングツリーユニット)
CVS Coded Video Sequence(コーディッド映像シーケンス)
DPB Decoded Picture Buffer(復号されたピクチャバッファ)
DPS Decoding Parameter Set(復号パラメータセット)
DUI Decoding Unit Information(復号ユニット情報)
EOB End Of Bitstream(ビットストリーム終端)
EOS End Of Sequence(シーケンス終端)
GCI General Constraints Information(一般的な制約情報)
GDR Gradual Decoding Refresh(漸次的復号リフレッシュ)
HEVC High Efficiency Video Coding(高効率映像コーディング)
HRD Hypothetical Reference Decoder(仮想参照デコーダ)
IDR Instantaneous Decoding Refresh(瞬時復号リフレッシュ)
JEM Joint Exploration Model(共同探索モデル)
MCTS Motion-Constrained Tile Sets(動き制約タイルセット)
NAL Network Abstraction Layer(ネットワーク抽象化レイヤ)
OLS Output Layer Set(出力レイヤセット)
PH Picture Header(ピクチャヘッダ)
PPS Picture Parameter Set(ピクチャパラメータセット)
PT Picture Timing(ピクチャタイミング)
PTL Profile, Tier and Level(プロファイル、ティアおよびレベル)
PU Picture Unit(ピクチャユニット)
RRP Reference Picture Resampling(参照ピクチャ再サンプリング)
RBSP Raw Byte Sequence Payload(生バイトシーケンスペイロード)
SEI Supplemental Enhancement Information(補足強化情報)
SH Slice Header(スライスヘッダ)
SLI Subpicture Level Information(サブピクチャレベル情報)
SPS Sequence Parameter Set(シーケンスパラメータセット)
SVC Scalable Video Coding(スケーラブル映像コーディング)
VCL Video Coding Layer(映像コーディングレイヤ)
VPS Video Parameter Set(映像パラメータセット)
VTM VVC Test Model(VVC試験モデル)
VUI Video Usability Information(映像ユーザビリティ情報)
VVC Versatile Video Coding(汎用映像コーディング)
映像コーディング規格は、主に周知のITU-TおよびISO/IEC規格の開発によって発展してきた。ITU-TはH.261とH.263を作り、ISO/IECはMPEG-1とMPEG-4Visualを作り、両団体はH.262/MPEG-2VideoとH.264/MPEG-4AVC(Advanced Video Coding)とH.265/HEVC規格を共同で作った。H.262以来、映像コーディング規格は、時間的予測と変換コーディングが利用されるハイブリッド映像コーディング構造に基づく。HEVCを超えた将来の映像コーディング技術を探索するため、2015年には、VCEGとMPEGが共同でJVET(Joint Video Exploration Team)を設立した。それ以来、多くの新しい方法がJVETによって採用され、JEM(Joint Exploration Model)と呼ばれる参照ソフトウェアに組み込まれてきた。JVETは四半期に1回開催され、新しいコーディング規格はHEVCに比べて50%のビットレート低減を目指している。2018年4月のJVET会議において、新しい映像コーディング規格を「VVC(Versatile Video Coding)」と正式に命名し、その時、第1版のVVCテストモデル(VTM)をリリースした。VVCの標準化に寄与する努力が続けられているので、すべてのJVET会議において、VVC標準に新しいコーディング技術が採用されている。毎回の会議の後、VVC作業草案およびテストモデルVTMは更新される。VVCプロジェクトは、現在、2020年7月の会合における技術完成(FDIS)を目指している。
HEVCには、正規のスライス、依存性のあるスライス、タイル、WPP(Wavefront Parallel Processing)という4つの異なる画像分割スキームがあり、これらを適用することで、最大転送ユニット(MTU)サイズのマッチング、並列処理、エンドツーエンドの遅延の低減が可能になる。
VVCにおいて、1つのピクチャは、1または複数のタイル行および1または複数のタイル列に分割される。1つのタイルは、1つのピクチャの1つの矩形領域を覆う1つのCTUのシーケンスである。1つのタイルにおけるCTUは、そのタイル内でラスタスキャン順にスキャンされる。
AVCおよびHEVCにおいて、ピクチャの空間的解像度は、新しいSPSを使用する新しいシーケンスがIRAPピクチャで始まらない限り、変更することができない。VVCは、常にイントラコーディング化されたIRAPピクチャを符号化せずに、ある位置のシーケンス内でピクチャの解像度を変更することを可能にする。この特徴は、参照ピクチャがデコードされている現在のピクチャと異なる解像度を有する場合、インター予測に使用される参照ピクチャをリサンプリングすることが必要であるため、参照ピクチャリサンプリング(RPR)と称する。
SVC(Scalable Video Coding、時には、映像コーディングにおけるスケーラビリティとも呼ばれる)は、BL(Base Layer:基本レイヤ)(時には、RL(Reference Layer:参照レイヤ)と呼ばれる)および1または複数のEL(Enhancement Layer:スケーラブルエンハンスメントレイヤ)が使用される映像コーディングを参照する。SVCにおいて、ベースレイヤは、基本品質レベルの映像データを担持することができる。1つ以上のエンハンスメントレイヤは、例えば、より高い空間的、時間的、および/または信号対雑音(SNR)レベルをサポートするように、追加の映像データを担持することができる。エンハンスメントレイヤは、前の、符号化されたレイヤに対して定義されてもよい。例えば、下層がBLとして機能し、上層がELとして機能することができる。中間レイヤは、ELまたはRLのいずれか、またはその両方として機能することができる。例えば、中間レイヤ(例えば、最下レイヤでも最上レイヤでもないレイヤ)は、中間レイヤの下のレイヤ、例えば、ベースレイヤまたは任意の介在する増強レイヤのためのELであってもよく、同時に、中間レイヤの上の1つ以上の増強レイヤのためのRLとしての役割を果たす。同様に、HEVC規格のマルチビューまたは3D拡張では、複数のビューが存在してもよく、1つのビューの情報を利用して別のビューの情報をコーディング(例えば、符号化または復号)することができる(例えば、動き推定、動きベクトル予測および/または他の冗長性)。
360°映像のストリーミング、すなわち、全方向性映像のストリーミングにおいて、任意の特定の瞬間に、全方向性映像球体全体のサブセット(すなわち、現在のビューポート)のみがユーザにレンダリングされ、一方、ユーザは、自分の頭をいつでも回して視線の向きを変更し、その結果、現在のビューポートを変更することができる。クライアント側が現在のビューポートで覆われていない領域を少なくともある程度低品質に表現し、かつユーザにレンダリングする準備ができていることが望ましいが、ユーザが突然その視線方向を球面上の任意の場所に変えた場合に備えて、すぐにユーザにレンダリングされている現在のビューポートに対してのみ、全方向性映像の高品質表現が必要となる。全方位映像全体の高品質表現を適切な粒度でサブピクチャに分割することにより、このような最適化が有効化される。VVCを使用して、2つの表現は、互いに独立した2つのレイヤとして符号化され得る。
AVC、HEVC、VVCはパラメータ集合を規定する。パラメータセットのタイプは、SPS、PPS、APS、VPS等である。SPS、PPSは、AVC、HEVC、VVCのすべてでサポートされている。VPSは、HEVCから導入されたものであり、HEVCおよびVVCの両方に含まれる。APSは、AVCまたはHEVCに含まれていなかったが、最近のVVC草案のテキストに含まれている。
映像コーディング規格は、通常、プロファイルおよびレベルを規定する。一部の映像コーディング規格は、HEVCや開発中のVVCなどのティアも規定する。
最近のVVC草案テキストにおいて、VVCにおけるサブピクチャシーケンスのレベル情報の規定および信号通知は、サブピクチャレベル情報(SLI)SEIメッセージによるものであり、VVCのC.7項で規定されるサブピクチャサブビットストリーム抽出処理を適用することで、ビットストリームからサブピクチャシーケンスを抽出することができる。
サブピクチャレベル情報SEIメッセージは、付録Aに従ってサブピクチャシーケンスを含む抽出されたビットストリームの適合性を試験する場合に、ビットストリームにおけるサブピクチャシーケンスが適合するレベルに関する情報を含む。
CLVSの任意のピクチャにサブピクチャレベル情報SEIメッセージが存在する場合、CLVSの第1のピクチャに対してサブピクチャレベル情報SEIメッセージが存在するものとする。サブピクチャレベル情報SEIメッセージは、現在のレイヤについて、現在のピクチャからCLVSの終わりまで復号順で持続する。同じCLVSに適用されるすべてのサブピクチャレベル情報SEIメッセージは、同じコンテンツを有するものとする。1つのサブピクチャシーケンスは、1つのCLVS内のすべてのサブピクチャで構成され、これらのサブピクチャは同じサブピクチャインデックス値を有する。
1つのCLVSに対して1つのサブピクチャレベル情報SEIメッセージが存在する場合、sps_subpic_treated_as_pic_flag[i]の値は、0~sps_num_subpics_minus1の範囲内にある各iの値において、1に等しいものとすることが、ビットストリーム適合性の要件である。
sli_ref_level_fraction_minus1[i][j]が存在しない場合、その値は、Ceil(256*SubpicSizeY[j]÷PicSizeInSamplesY*MaxLumaPs(general_level_idc)÷MaxLumaPs(sli_ref_level_idc[i])-1に等しいと推論される。
変数LayerRefLevelFraction[i][j]は、sli_ref_level_fraction_minus1[i][j]+1に等しく設定される。
変数OlsRefLevelFraction[i][j]は、sli_non_subpic_layers_fraction[i]+(256-sli_non_subpic_layers_fraction[i])÷256*(sli_ref_level_fraction_minus1[i][j]+1)に等しく設定される。
変数SubpicCpbSizeVcl[i][j]およびSubpicCpbSizeNal[i][j]は、以下のように導出される。
SubpicCpbSizeVcl[i][j]=Floor(CpbVclFactor*MaxCPB*OlsRefLevelFraction[i][j]÷256) (D.6)
SubpicCpbSizeNal[i][j]=Floor(CpbNalFactor*MaxCPB*OlsRefLevelFraction[i][j]÷256) (D.7)
A.4.2項で規定されるように、sli_ref_level_idc[i]から導出されたMaxCPBを用いる。
変数SubpicBitRateVcl[i][j]およびSubpicBitRateNal[i][j]は、以下のように導出される。
SubpicBitRateVcl[i][j]=Floor(CpbVclFactor*ValBR*OlsRefLevelFraction[0][j]÷256) (D.8)
SubpicBitRateNal[i][j]=Floor(CpbNalFactor*ValBR*OlsRefLevelFraction[0][j]÷256) (D.9)
ここで、ValBRの値は、以下のように導出される。
-VPSまたはSPSにおけるそれぞれのHRDパラメータにおいてbit_rate_value_minus1[Htid][ScIdx]が利用可能である場合、ValBRは、(bit_rate_value_minus1[Htid][ScIdx]+1)*2(6+bit_rate_scale)に等しく設定され、ここでHtidは考慮されたサブレイヤインデックス、ScIdxは考慮されたスケジュールインデックスである。
-そうでない場合、ValBRは、A.4.2項で規定されるように、sli_ref_level_idc[0]から導出されたMaxBRに等しく設定される。
注記1-サブピクチャを抽出するとき、結果として得られるビットストリームは、SubpicCpbSizeVcl[i][j]およびSubpicCpbSizeNal[i][j]以上のCpbSize(VPS、SPSのいずれかに示される、または推論される)と、SubpicBitRateVcl[i][j]およびSubpicBitRateNal[i][j]以上のBitRate(VPS、SPSのいずれかに示される、または推論される)を有する。
抽出処理への入力ビットストリームにおいて、sps_num_subpics_minus1が0より大きいレイヤから、jが0からsps_num_subpics_minus1までの範囲内にあるj番目のサブピクチャを、0より大きいsps_num_subpics_minus1を有するレイヤから抽出し、general_tier_flagが0に等しく、levelがsli_ref_level_idc[i](iは0からnum_ref_level_minus1の範囲)に等しいプロファイルに適合することによって得られるビットストリーム中の各レイヤは、付録Cで規定される各ビットストリーム適合性試験において、以下の制約に従うものとするのがビットストリーム適合性の要件である。
-Ceil(256*SubpicSizeY[j]÷LayerRefLevelFraction[i][j])は、MaxLumaPs以下であるものとする。ここで、MaxLumaPsは、レベルsli_ref_level_idc[i]に対して表A.1で規定されている。
-Ceil(256*(sps_subpic_width_minus1[j]+1)*CtbSizeY÷LayerRefLevelFraction[i][j])の値は、Sqrt(MaxLumaPs*8)以下であるものとする。
-Ceil(256*(sps_subpic_height_minus1[j]+1)*CtbSizeY÷LayerRefLevelFraction[i][j])の値は、Sqrt(MaxLumaPs*8)以下であるものとする。
-SubpicWidthInTiles[j]の値は、MaxTileCols以下であり、SubpicHeightInTiles[j]の値は、MaxTileRows以下であるものとする。ここで、MaxTileColsおよびMaxTileRowsは、レベルsli_ref_level_idc[i]に対して表A.1で規定されている。
-SubpicWidthInTiles[j]*SubpicHeightInTiles[j]の値は、MaxTileCols*MaxTileRows*LayerRefLevelFraction[i][j]以下であるものとする。ここで、MaxTileColsおよびMaxTileRowsは、レベルsli_ref_level_idc[i]に対して表A.1で規定されている。
jが0からsps_num_subpics_minus1までの範囲内にあるj番目のサブピクチャを抽出し、general_tier_flagが0に等しく、レベルがref_level_idc[i](iは0からsli_num_ref_level_minus1の範囲)に等しいプロファイルに適合することによって得られる各レイヤは、付録Cで規定される各ビットストリーム適合性試験において、以下の制約に従うものとするのがビットストリーム適合性の要件である。
-AU0のSubpicSizeInSamplesYの値について、j番目のサブピクチャに対応するAU0のNumBytesInNalUnit変数の合計は、AU0のSubpicSizeInSamplesYの値に対して、FormatCapabilityFactor*(Max(SubpicSizeY[j],fR*MaxLumaSr*OlsRefLevelFraction[i][j]÷256)+MaxLumaSr*(AuCpbRemovalTime[0]-AuNominalRemovalTime[0])*OlsRefLevelFraction[i][j])÷(256*MinCr)以下とする。ここで、MaxLumaSrとFormatCapabilityFactorは、レベルsli_ref_level_idc[i]においてそれぞれ、AU0に適用される表A.2および表A.3で規定された値であり、MinCrは、A.4.2に示したように導出される。
-AU0のSubpicSizeInSamplesYの値について、j番目のサブピクチャに対応するAUn(nは0より大きい)のNumBytesInNalUnit変数の合計は、FormatCapabilityFactor*MaxLumaSr*(AuCpbRemovalTime[n]-AuCpbRemovalTime[n-1])*OlsRefLevelFraction[i][j]÷(256*MinCr)以下とする。ここで、MaxLumaSrとFormatCapabilityFactorは、レベルsli_ref_level_idc[i]において、それぞれAUnに適用される表A.2および表A.3で規定された値であり、MinCrは、A.4.2に示したように導出される。
サブピクチャシーケンスレベルインジケータSubpicLevelIdcの値は、以下のように導出される。
SubpicLevelIdc=general_level_idc
SubpicLevelIdx=0
for(i=num_ref_level_minus1;i>=1;i--)
if(OlsLevelFraction[i]<=256){
SubpicLevelIdc=sli_ref_level_idc[i]
SubpicLevelIdx=i
} (D.10)
general_tier_flagが0に等しく、かつSubpicLevelIdcに等しいレベルを有するプロファイルに準拠するサブピクチャシーケンスビットストリームは、付録Cで規定されるように、各ビットストリーム適合性試験のための以下の制約に従うものとする。
-VCL HRDパラメータの場合、SubpicCpbSizeVcl[i]は、CpbVclFactor*MaxCPB以下とする。ここで、表A.3にCpbVclFactorを規定し、表A.1にMaxCPBをCpbVclFactorビットの単位で規定される。
-NAL HRDパラメータの場合、SubpicCpbSizeNal[i]は、CpbNalFactor*MaxCPB以下とする。ここで、表A.3にCpbNalFactorを規定し、表A.1にMaxCPBをCpbNalFactorビットの単位で規定される。
-VCL HRDパラメータの場合、SubpicBitRateVcl[i]は、CpbVclFactor*MaxBR以下とする。ここで、表A.3にCpbVclFactorを規定し、表A.1にMaxBRをCpbVclFactorビットの単位で規定される。
-NAL HRDパラメータの場合、SubpicBitRateNal[i]は、CpbNalFactor*MaxBR以下とする。ここで、表A.3にCpbNalFactorを規定し、表A.1にMaxBRをCpbNalFactorビットの単位で規定される。
注記2-サブピクチャシーケンスが抽出されるとき、結果として得られるビットストリームは、SubpicCpbSizeVcl[i][j]およびSubpicCpbSizeNal[i][j]以上のCpbSize(VPS、SPSのいずれかに示される、または推論される)と、SubpicBitRateVcl[i][j]およびSubpicBitRateNal[i][j]以上のBitRate(VPS、SPSのいずれかに示される、または推論される)を有する。
既存のサブピクチャシーケンスのレベル情報の規定および信号通知のためのVVC設計は、以下の問題を有する。
上記課題を解決するために、以下に示す方法が開示されている。本発明は、一般的な概念を説明するための例と見なされるべきであり、狭義に解釈されるべきではない。さらに、本発明は、個々に適用されてもよいし、任意に組み合わせて適用されてもよい。
1)第1の問題を解決するために、sli_max_sublayers_minus1、sli_sublayer_info_present_flag、および信号通知された部分および参照レベル指標のサブレイヤのループを追加し、PTL構文構造におけるレベル情報の信号通知と整合性をとる。
a.一例において、さらに、sli_cbr_constraint_flagもまたサブレイヤに固有にされ、すなわち、sli_cbr_constraint_flag[k]に変更され、サブレイヤのためにループ内に移動される。
i.一例において、さらに、下位サブレイヤのsli_cbr_constraint_flag[k]が存在しない場合、sli_cbr_constraint_flag[k+1]に等しいと推論される。
b.一例において、さらに、下位サブレイヤのための分数または参照レベル指標が存在しない場合、次の上位サブレイヤのためのものと同じであると推論される。
2)第2の問題を解決するために、SLI SEIメッセージがビットストリームに含まれているか、または外部手段によって提供されるかのいずれかで、パラメータセットおよび他の3つの適合性/HRD関連のSEIメッセージ、即ちPT、BP、DUI SEIメッセージと整合性をとることを可能にする。
3)第3の問題を解決するために、持続性範囲を1つのCVSから1つ以上のCVSに変更し、レベル情報が信号通知されるまたは信号通知されてもよいVPSおよびSPSと整合性を取るようにする。
4)第4の問題を解決するため、1つのピクチャにつき1つのサブピクチャを有するレイヤが1つ以上存在する場合を含むように、サブピクチャシーケンスの定義を変更する。
5)第5の問題を解決するために、1つのCVSに対して1つのSLI SEIメッセージが存在する場合、sps_num_subpics_minus1の値は、1つのピクチャ当たり複数のサブピクチャを有するレイヤ内のピクチャによって参照されるすべてのSPSに対して同じであることを要件とする。
6)第6の問題を解決するために、sli_num_subpics_minus1のセマンティクスを、構文要素が1つのピクチャ当たり複数のサブピクチャを有するレイヤのサブピクチャに関するものとなるように規定する。
7)第7の問題を解決するために、SLI SEIメッセージのセマンティクスにおける最後の制約セットにおいて、変数SubpicLevelIdcおよびSubpicLevelIdxの両方並びに配列SubpicCpbSizeVcl、SubpicCpbSizeNal、SubpicBitRateVcl、およびSubpicBitRateNalに配列インデックス、サブピクチャシーケンスのインデックスを追加する。
以下は、本章の上記に要約されたいくつかの発明の態様のためのいくつかの例示的な実施形態であり、VVC仕様に適用できる。既に追加または修正された最も関連する部分には太字のイタリック体において下線を付し、削除された部分のうちのいくつかは、[[]]を使用して示す。
本実施形態は、項目1~7およびその一部の小項目についてである。
本願は、2020年6月8日出願の米国特許仮出願第63/036,365号の優先権および利益を主張する、2021年6月7日出願の国際特許出願第PCT/US2021/036253号に基づく。法に基づくすべての目的のために、上記出願の開示全体は、本明細書の開示の一部として参照により援用される。
Claims (15)
- 映像データを処理する方法であって、
規則に従って、1つ以上の出力レイヤセット(OLS)を含む映像と前記映像のビットストリームとの間で変換を行うことを含み、
この規則は、サブピクチャレベル情報(SLI)補足強化情報(SEI)メッセージが、このSLI SEIメッセージが適用される1つ以上のOLSのコーディッド映像シーケンスのセットにおけるサブピクチャシーケンスのレベルに関する情報を含むことを規定し、SLI SEIメッセージの構文構造は、(1)サブピクチャシーケンスのためのサブレイヤの最大数を規定する第1の構文要素と、(2)サブピクチャシーケンスのためのレベル情報が1つ以上のサブレイヤ表現のために存在するかどうかを規定する第2の構文要素と、(3)ビットストリームのレベル制限の一部にそれぞれ関連付けられた多数のサブレイヤのためのループと、各サブピクチャシーケンスが適合するレベルを示すレベル指標と、を含む、方法。 - 前記第1の構文要素の値は、0から映像パラメータセットに示される最大サブレイヤ数マイナス1の範囲である、
請求項1に記載の方法。 - 第2の構文要素がビットストリームに含まれていないことに呼応して、第2の構文要素は0であると推論される、
請求項1または請求項2に記載の方法。 - 1つのサブレイヤkに関連付けられたビットストリームのレベル制限の一部が存在しないことに呼応して、前記一部は、1つのサブレイヤk+1に関連する部分に等しいと推論される、
請求項1から請求項3のいずれかに記載の方法。 - 1つのサブレイヤkに関連付けられたレベル指標が存在しないことに呼応して、前記レベル指標は1つのサブレイヤk+1に関連付けられたレベル指標に等しいと推論される、
請求項1から請求項4のいずれかに記載の方法。 - 前記構文構造は、各サブレイヤに対して、前記レベル指標に関連付けられたビットストリームのレベル制限の一部を規定する第3の構文要素をさらに含み、サブレイヤkに関連付けられた第3の構文要素が存在しないことに呼応して、第3の構文要素は、サブレイヤk+1に関連付けられた構文要素に等しいと推論される、
請求項1から請求項5のいずれかに記載の方法。 - 前記構文構造は、各々のサブピクチャシーケンスに信号通知される参照レベルの数を規定する第4の構文要素をさらに含む、
請求項1から請求項6のいずれかに記載の方法。 - 前記構文構造は、1つの仮想ストリームスケジューラ(HSS)が1つのサブピクチャシーケンスに対して間欠ビットレートモードで動作するか或いは一定ビットレート(CBR)モードで動作するかを規定する第5の構文要素をさらに含む、
請求項1から請求項7のいずれかに記載の方法。 - 前記変換は、前記映像を前記ビットストリームに符号化することを含む、
請求項1から請求項8のいずれか1項に記載の方法。 - 前記変換は、前記ビットストリームから前記映像を復号することを含む、
請求項1から請求項8のいずれか1項に記載の方法。 - 映像のビットストリームを記憶するための方法であって、
規則に従って、1つ以上の出力レイヤセット(OLS)を含む前記映像から前記映像のビットストリームを生成することと、前記生成されたビットストリームを記憶することと、を含み、
この規則は、サブピクチャレベル情報(SLI)補足強化情報(SEI)メッセージが、このSLI SEIメッセージが適用される1つ以上のOLSのコーディッド映像シーケンスのセットにおけるサブピクチャシーケンスのレベルに関する情報を含むことを規定し、SLI SEIメッセージの構文構造は、(1)サブピクチャシーケンスのためのサブレイヤの最大数を規定する第1の構文要素と、(2)サブピクチャシーケンスのためのレベル情報が1つ以上のサブレイヤ表現のために存在するかどうかを規定する第2の構文要素と、(3)ビットストリームのレベル制限の一部にそれぞれ関連付けられた多数のサブレイヤのためのループと、各サブピクチャシーケンスが適合するレベルを示すレベル指標と、を含む、
方法。 - 請求項1~11の1項以上に記載の方法を実装するように構成される処理装置を備える、
映像復号装置。 - 請求項1~11の1項以上に記載の方法を実装するように構成されるプロセッサを備える、
映像符号化装置。 - コンピュータコードが記憶されたコンピュータプログラム製品であって、
前記コードは、処理装置により実行されると、前記処理装置に、請求項1~11のいずれかに記載の方法を実装させる、
コンピュータプログラム製品。 - 映像処理装置によって行われる方法によって生成される映像のビットストリームを記憶する、非一時的なコンピュータ可読記録媒体であって、
前記方法は、規則に従って、1つ以上の出力レイヤセット(OLS)を含む映像から映像のビットストリームを生成することと、前記生成されたビットストリームを記憶することと、を含み、
この規則は、サブピクチャレベル情報(SLI)補足強化情報(SEI)メッセージが、このSLI SEIメッセージが適用される1つ以上のOLSのコーディッド映像シーケンスのセットにおけるサブピクチャシーケンスのレベルに関する情報を含むことを規定し、SLI SEIメッセージの構文構造は、(1)サブピクチャシーケンスのためのサブレイヤの最大数を規定する第1の構文要素と、(2)サブピクチャシーケンスのためのレベル情報が1つ以上のサブレイヤ表現のために存在するかどうかを規定する第2の構文要素と、(3)ビットストリームのレベル制限の一部にそれぞれ関連付けられた多数のサブレイヤのためのループと、各サブピクチャシーケンスが適合するレベルを示すレベル指標と、を含む、
非一時的なコンピュータ可読記録媒体。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202063036365P | 2020-06-08 | 2020-06-08 | |
US63/036,365 | 2020-06-08 | ||
PCT/US2021/036253 WO2021252393A1 (en) | 2020-06-08 | 2021-06-07 | Sublayer signaling in a video bitstream |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2023529430A true JP2023529430A (ja) | 2023-07-10 |
JPWO2021252393A5 JPWO2021252393A5 (ja) | 2024-02-27 |
JP7538256B2 JP7538256B2 (ja) | 2024-08-21 |
Family
ID=78846488
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022575464A Pending JP2023529431A (ja) | 2020-06-08 | 2021-06-07 | 映像ピクチャにおけるサブピクチャ数の制約 |
JP2022575463A Active JP7538256B2 (ja) | 2020-06-08 | 2021-06-07 | 映像ビットストリームにおけるサブレイヤ信号通知 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022575464A Pending JP2023529431A (ja) | 2020-06-08 | 2021-06-07 | 映像ピクチャにおけるサブピクチャ数の制約 |
Country Status (7)
Country | Link |
---|---|
US (3) | US11849136B2 (ja) |
EP (2) | EP4154524A4 (ja) |
JP (2) | JP2023529431A (ja) |
KR (2) | KR20230019847A (ja) |
CN (3) | CN115699728A (ja) |
BR (1) | BR112022025036A2 (ja) |
WO (3) | WO2021252393A1 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA3239062A1 (en) * | 2022-01-10 | 2023-07-13 | Guangdong Oppo Mobile Telecomminications Corp., Ltd. | Signaling general constraints information for video coding |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9131245B2 (en) * | 2011-09-23 | 2015-09-08 | Qualcomm Incorporated | Reference picture list construction for video coding |
US9942545B2 (en) * | 2013-01-03 | 2018-04-10 | Texas Instruments Incorporated | Methods and apparatus for indicating picture buffer size for coded scalable video |
SG10201913539SA (en) * | 2013-04-07 | 2020-02-27 | Dolby Int Ab | Signaling change in output layer sets |
KR102698537B1 (ko) * | 2013-04-08 | 2024-08-23 | 지이 비디오 컴프레션, 엘엘씨 | 효율적인 다-시점/계층 코딩을 허용하는 코딩 개념 |
WO2015052943A1 (en) * | 2013-10-13 | 2015-04-16 | Sharp Kabushiki Kaisha | Signaling parameters in vps extension and dpb operation |
US20150237356A1 (en) * | 2014-02-18 | 2015-08-20 | Microsoft Corporation | Host encoder for hardware-accelerated video encoding |
US10701400B2 (en) * | 2017-03-21 | 2020-06-30 | Qualcomm Incorporated | Signalling of summarizing video supplemental information |
WO2018221368A1 (ja) * | 2017-05-31 | 2018-12-06 | シャープ株式会社 | 動画像復号装置、及び動画像符号化装置 |
TW202101985A (zh) * | 2019-03-11 | 2021-01-01 | 美商Vid衡器股份有限公司 | 子圖片適應性解析度改變方法及裝置 |
AU2020406151A1 (en) | 2019-12-20 | 2022-08-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Video data stream, video encoder, apparatus and methods for HRD timing fixes, and further additions for scalable and mergeable bitstreams |
CA3184462A1 (en) | 2020-05-22 | 2021-11-25 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Subpicture-related video coding concepts |
US20220109865A1 (en) * | 2020-10-02 | 2022-04-07 | Sharp Kabushiki Kaisha | Systems and methods for signaling picture buffer information for intra random access point picture sub-bitstreams in video coding |
-
2021
- 2021-06-07 JP JP2022575464A patent/JP2023529431A/ja active Pending
- 2021-06-07 KR KR1020227042895A patent/KR20230019847A/ko active Search and Examination
- 2021-06-07 EP EP21821188.6A patent/EP4154524A4/en active Pending
- 2021-06-07 CN CN202180041267.3A patent/CN115699728A/zh active Pending
- 2021-06-07 WO PCT/US2021/036253 patent/WO2021252393A1/en unknown
- 2021-06-07 JP JP2022575463A patent/JP7538256B2/ja active Active
- 2021-06-07 CN CN202180041401.XA patent/CN115804086A/zh active Pending
- 2021-06-07 CN CN202180041271.XA patent/CN115843431A/zh active Pending
- 2021-06-07 BR BR112022025036A patent/BR112022025036A2/pt unknown
- 2021-06-07 EP EP21822302.2A patent/EP4154525A4/en active Pending
- 2021-06-07 KR KR1020227042894A patent/KR102708610B1/ko active IP Right Grant
- 2021-06-07 WO PCT/US2021/036257 patent/WO2021252396A1/en unknown
- 2021-06-07 WO PCT/US2021/036254 patent/WO2021252394A1/en active Application Filing
-
2022
- 2022-12-06 US US18/076,085 patent/US11849136B2/en active Active
- 2022-12-06 US US18/076,045 patent/US11831895B2/en active Active
-
2023
- 2023-11-24 US US18/518,768 patent/US20240107046A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
US20230099628A1 (en) | 2023-03-30 |
WO2021252394A1 (en) | 2021-12-16 |
KR20230019846A (ko) | 2023-02-09 |
KR20230019847A (ko) | 2023-02-09 |
US20240107046A1 (en) | 2024-03-28 |
CN115804086A (zh) | 2023-03-14 |
KR102708610B1 (ko) | 2024-09-20 |
EP4154525A1 (en) | 2023-03-29 |
EP4154525A4 (en) | 2023-10-25 |
CN115699728A (zh) | 2023-02-03 |
CN115843431A (zh) | 2023-03-24 |
EP4154524A4 (en) | 2023-11-15 |
BR112022025036A2 (pt) | 2022-12-27 |
EP4154524A1 (en) | 2023-03-29 |
JP7538256B2 (ja) | 2024-08-21 |
US20230100470A1 (en) | 2023-03-30 |
WO2021252393A1 (en) | 2021-12-16 |
US11849136B2 (en) | 2023-12-19 |
WO2021252396A1 (en) | 2021-12-16 |
US11831895B2 (en) | 2023-11-28 |
JP2023529431A (ja) | 2023-07-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7513755B2 (ja) | サブピクチャサブビットストリーム抽出処理におけるスケーリングウィンドウ | |
JP7544843B2 (ja) | サブピクチャとスケーラビリティの組み合わせ | |
JP7506184B2 (ja) | 映像コーディングにおけるスケーリングウィンドウ | |
WO2021257529A1 (en) | Decoded picture buffer management and subpictures in video coding | |
JP2024015106A (ja) | サブピクチャレベルに基づいたパーティション計算 | |
JP7538256B2 (ja) | 映像ビットストリームにおけるサブレイヤ信号通知 | |
JP7564250B2 (ja) | 映像コーディングにおける補足強化情報メッセージのスケーラブルネスティング | |
JP7513756B2 (ja) | サブレイヤ数制限 | |
JP7511680B2 (ja) | サブピクチャサブビットストリーム抽出プロセスにおける補足エンハンスメント情報の処理 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230125 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230125 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240216 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20240216 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20240227 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240312 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240612 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240709 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240808 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7538256 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |