JP2022050361A - 映像動作点レコード構文及びセマンティクス - Google Patents
映像動作点レコード構文及びセマンティクス Download PDFInfo
- Publication number
- JP2022050361A JP2022050361A JP2021151188A JP2021151188A JP2022050361A JP 2022050361 A JP2022050361 A JP 2022050361A JP 2021151188 A JP2021151188 A JP 2021151188A JP 2021151188 A JP2021151188 A JP 2021151188A JP 2022050361 A JP2022050361 A JP 2022050361A
- Authority
- JP
- Japan
- Prior art keywords
- format
- operating point
- video
- bitstream
- visual media
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 claims abstract description 168
- 230000000007 visual effect Effects 0.000 claims abstract description 116
- 238000006243 chemical reaction Methods 0.000 claims abstract description 36
- 238000012545 processing Methods 0.000 claims abstract description 36
- 239000010410 layer Substances 0.000 claims description 131
- 239000002356 single layer Substances 0.000 claims description 32
- 230000004044 response Effects 0.000 claims description 22
- 230000008569 process Effects 0.000 claims description 13
- 239000013598 vector Substances 0.000 description 18
- 230000009471 action Effects 0.000 description 14
- 229920010524 Syndiotactic polystyrene Polymers 0.000 description 13
- 238000002490 spark plasma sintering Methods 0.000 description 13
- 208000034188 Stiff person spectrum disease Diseases 0.000 description 12
- 208000012112 ischiocoxopodopatellar syndrome Diseases 0.000 description 12
- 238000010586 diagram Methods 0.000 description 11
- 238000004590 computer program Methods 0.000 description 10
- 238000005516 engineering process Methods 0.000 description 10
- 230000011664 signaling Effects 0.000 description 10
- 230000003044 adaptive effect Effects 0.000 description 9
- 238000013139 quantization Methods 0.000 description 8
- 230000007246 mechanism Effects 0.000 description 6
- 238000013507 mapping Methods 0.000 description 5
- 230000015654 memory Effects 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 5
- 230000006835 compression Effects 0.000 description 4
- 238000007906 compression Methods 0.000 description 4
- 238000011161 development Methods 0.000 description 4
- 238000003672 processing method Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 230000000153 supplemental effect Effects 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 2
- 230000004931 aggregating effect Effects 0.000 description 2
- 238000003491 array Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000006837 decompression Effects 0.000 description 2
- 238000006073 displacement reaction Methods 0.000 description 2
- 238000007689 inspection Methods 0.000 description 2
- 238000005192 partition Methods 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 238000013515 script Methods 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- FMYKJLXRRQTBOR-UBFHEZILSA-N (2s)-2-acetamido-4-methyl-n-[4-methyl-1-oxo-1-[[(2s)-1-oxohexan-2-yl]amino]pentan-2-yl]pentanamide Chemical group CCCC[C@@H](C=O)NC(=O)C(CC(C)C)NC(=O)[C@H](CC(C)C)NC(C)=O FMYKJLXRRQTBOR-UBFHEZILSA-N 0.000 description 1
- 101100533821 Arabidopsis thaliana FSD1 gene Proteins 0.000 description 1
- 108091000069 Cystinyl Aminopeptidase Proteins 0.000 description 1
- 102100020872 Leucyl-cystinyl aminopeptidase Human genes 0.000 description 1
- 241000023320 Luma <angiosperm> Species 0.000 description 1
- 240000007594 Oryza sativa Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 230000003139 buffering effect Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000005538 encapsulation Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000000945 filler Substances 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 239000011229 interlayer Substances 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- OSWPMRLSEDHDFF-UHFFFAOYSA-N methyl salicylate Chemical compound COC(=O)C1=CC=CC=C1O OSWPMRLSEDHDFF-UHFFFAOYSA-N 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 101150018269 sodB gene Proteins 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/85—Assembly of content; Generation of multimedia applications
- H04N21/854—Content authoring
- H04N21/85406—Content authoring involving a specific file format, e.g. MP4 format
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/105—Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/132—Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/172—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/184—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/186—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/188—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a video data packet, e.g. a network abstraction layer [NAL] unit
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/42—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/44—Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/593—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/90—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
- H04N19/91—Entropy coding, e.g. variable length coding [VLC] or arithmetic coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/234—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
- H04N21/2343—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
- H04N21/234327—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements by decomposing into layers, e.g. base layer and one or more enhancement layers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/234—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
- H04N21/2343—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
- H04N21/234336—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements by media transcoding, e.g. video is transformed into a slideshow of still pictures or audio is converted into text
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/44—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
- H04N21/4402—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display
- H04N21/440227—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display by decomposing into layers, e.g. base layer and one or more enhancement layers
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Computer Security & Cryptography (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Physics & Mathematics (AREA)
- Discrete Mathematics (AREA)
- General Physics & Mathematics (AREA)
Abstract
【解決手段】 一方法例は、ビジュアルメディアデータと、該ビジュアルメディアデータの1つ以上のビットストリームを格納する1つ以上のトラックを含むビジュアルメディアファイルと、の間での変換を、フォーマットルールに従って実行するステップを含み、ビジュアルメディアファイルは、動作点レコード及び動作点グループボックスを含み、フォーマットルールは、ビジュアルメディアファイルにおいて指し示される各動作点について、動作点レコード及び動作点グループボックスに、クロマフォーマットを指し示す第1要素、ビット深度情報を指し示す第2要素、最大ピクチャ幅を指し示す第3要素、及び/又は最大ピクチャ高さを指し示す第4要素を含めるかを規定する。
【選択図】 図10
Description
1. 冒頭説明
2. 略語
ACT adaptive colour transform(適応色変換)
ALF adaptive loop filter(適応ループフィルタ)
AMVR adaptive motion vector resolution(適応動きベクトルレゾリューション)
APS adaptation parameter set(適応パラメータセット)
AU access unit(アクセスユニット)
AUD access unit delimiter(アクセスユニットデリミタ)
AVC advanced video coding(アドバンストビデオコーディング)(勧告ITU-T H.264|ISO/IEC 14496-10)
B bi-predictive(双予測)
BCW bi-prediction with CU-level weights(CUレベル重みを用いた双予測)
BDOF bi-directional optical flow(双方向オプティカルフロー)
BDPCM block-based delta pulse code modulation(ブロックベースデルタプラスコード変調)
BP buffering period(バッファリング期間)
CABAC context-based adaptive binary arithmetic coding(コンテキストベース適応バイナリ算術コーディング)
CB coding block(符号化ブロック)
CBR constant bit rate(定ビットレート)
CCALF cross-component adaptive loop filter(クロスコンポーネント適応ループフィルタ)
CPB coded picture buffer(符号化ピクチャバッファ)
CRA clean random access(クリーンランダムアクセス)
CRC cyclic redundancy check(サイクリック冗長性検査)
CTB coding tree block(符号化ツリーブロック)
CTU coding tree unit(符号化ツリーユニット)
CU coding unit(符号化ユニット)
CVS coded video sequence(符号化映像シーケンス)
DPB decoded picture buffer(復号ピクチャバッファ)
DCI decoding capability information(復号能力情報)
DRAP dependent random access point(従属ランダムアクセスポイント)
DU decoding unit(復号ユニット)
DUI decoding unit information(復号ユニット情報)
EG exponential-Golomb(指数ゴロム)
EGk k-th order exponential-Golomb(K次指数ゴロム)
EOB end of bitstream(ビットストリーム終端)
EOS end of sequence(シーケンス終端)
FD filler data(フィラー(ダミー)データ)
FIFO first-in, first-out(先入先出)
FL fixed-length(固定長)
GBR green,blue,and red(緑、青、及び赤)
GCI general constraints information(一般的制約情報)
GDR gradual decoding refresh(段階的復号リフレッシュ)
GPM geometric partitioning mode(幾何学的分割モード)
HEVC high efficiency video coding(ハイエフィシェンシビデオコーディング) (勧告ITU-T H.265|ISO/IEC 23008-2)
HRD hypothetical reference decoder(仮説的リファレンスデコーダ)
HSS hypothetical stream scheduler(仮説的ストリームスケジューラ)
I intra(イントラ)
IBC intra block copy(イントラブロックコピー)
IDR instantaneous decoding refresh(即時復号リフレッシュ)
ILRP inter-layer reference picture(インターレイヤ参照ピクチャ)
IRAP intra random access point(イントラランダムアクセスポイント)
LFNST low frequency non-separable transform(低周波数非分離可能変換)
LPS least probable symbol(リーストプロバブルシンボル)
LSB least significant bit(最下位ビット)
LTRP long-term reference picture(長期参照ピクチャ)
LMCS luma mapping with chroma scaling(クロマスケーリングを用いたルママッピング)
MIP matrix-based intra prediction(行列ベースイントラ予測)
MPS most probable symbol(最確シンボル)
MSB most significant bit(最上位ビット)
MTS multiple transform selection(マルチ変換選択)
MVP motion vector prediction(動きベクトル予測)
NAL network abstraction layer(ネットワーク抽象化層)
OLS output layer set(出力レイヤセット)
OP operation point(動作点)
OPI operating point information(動作点情報)
P predictive(予測)
PH picture header(ピクチャヘッダ)
POC picture order count(ピクチャオーダーカウント)
PPS picture parameter set(ピクチャパラメータセット)
PROF prediction refinement with optical flow(オプティカルフローを用いた予測精緻化)
PT picture timing(ピクチャタイミング)
PU picture unit(ピクチャユニット)
QP quantization parameter(量子化パラメータ)
RADL random access decodable leading(ランダムアクセス復号可能リーディング(ピクチャ)
RASL random access skipped leading(ランダムアクセススキップリーディング(ピクチャ)
RBSP raw byte sequence payload(ローバイトシーケンスペイロード)
RGB red,green,and blue(赤、緑、及び青)
RPL reference picture list(参照ピクチャリスト)
SAO sample adaptive offset(サンプル適応オフセット)
SAR sample aspect ratio(サンプルアスペクト比)
SEI supplemental enhancement information(補助拡張情報)
SH slice header(スライスヘッダ)
SLI subpicture level information(サブピクチャレベル情報)
SODB string of data bits(データビット列)
SPS sequence parameter set(シーケンスパラメータセット)
STRP short-term reference picture(短期参照ピクチャ)
STSA step-wise temporal sublayer access(段階的時間サブレイヤアクセス)
TR truncated rice(トランケーテッドライス)
VBR variable bit rate(可変ビットレート)
VCL video coding layer(映像符号化レイヤ)
VPS video parameter set(ビデオパラメータセット)
VSEI versatile supplemental enhancement information(多用途補助拡張情報)(勧告ITU-T H.274|ISO/IEC 23002-7)
VUI video usability information(映像ユーザビリティ情報)
VVC versatile video coding(バーサタイルビデオコーディング)(勧告ITU-T H.266|ISO/IEC 23090-3)
3. 映像符号化序論
3.1. 映像符号化標準
3.2. ファイルフォーマット標準
3.3. VVC映像ファイルフォーマットの一部詳細
3.3.1. デコーダコンフィギュレーション情報
3.3.1.1. VVCデコーダコンフィギュレーションレコード
3.3.1.1.1. 定義
この従属節は、ISO/IEC 23090-3映像コンテンツ向けのデコーダコンフィギュレーション情報を規定する。このレコードは、各サンプルに含まれるNALユニットの長さを指し示すために各サンプル内で使用される長さフィールドのサイズと、サンプルエントリに格納される場合のパラメータセットとを含む。このレコードは外部フレームとされる(そのサイズが、それを含む構造によって供給される);
このレコードはバージョンフィールドを含む。仕様のこのバージョンは、このレコードのバージョン1を定義する。レコードへの適合しない変更は、バージョン番号の変更によって指し示されることになる。リーダ(reader)は、バージョン番号が認識されない場合、このレコード又はそれが適用されるストリームを復号することを試みないとする;
このレコードへの適合する拡張は、それを拡張するのであって、コンフィグレーションバージョンコードを変更しない。リーダは、理解できるデータの定義を超えた、認識されないデータを無視するように整えられるべきである;
トラックが、ネイティブに、又は‘subp’トラック参照を分解してではあるが、VVCビットストリームを含むとき、VvcPtlRecordがデコーダコンフィギュレーションレコードに存在するものとする。トラックのデコーダコンフィギュレーションレコード内でptl_present_flagがゼロに等しい場合、そのトラックは‘oref’トラック参照を持つものとする;
VvcPTLRecord、chroma_format_idc、及びbit_depth_minus8の構文要素の値は、このレコードによって記述されるストリームが復号されるときにアクティブにされている全てのパラメータセット(この段落中の以下の文において“全てのパラメータセット”として参照する)に対して有効であるとする。具体的には、以下の制約が適用される:
プロファイルインジケーションgeneral_profile_idcは、このコンフィギュレーションレコードに関連するストリームが適合するプロファイルを指し示すものとする;
注記1:SPSが異なるプロファイルでマークされている場合、ストリームは、もしあれば、ストリーム全体がどのプロファイルに準拠するかを決定するための検査を必要とし得る。ストリーム全体が検査されない場合、又はストリーム全体が準拠するプロファイルが存在しないことを検査が明らかにした場合、ストリーム全体が、これらのルールを満たすことができる別々のコンフィギュレーションレコードを持つ2つ以上のサブストリームに分割されるものとする;
ティアインジケーションgeneral_tier_flagは、ティアが、全てのパラメータセットにおいて指し示される最も高いティア以上であることを指し示すとする;
general_constraint_infoの各ビットは、全てのパラメータセットがそのビットをセットする場合にのみセットされ得る;
レベルインジケーションgeneral_level_idcは、能力のレベルが、全てのパラメータセットにおける最も高いティアに対して指し示される最高レベル以上であることを指し示すものとする;
次の制約がchroma_format_idcに適用される:
- ISO/IEC 23090-3で定義されるsps_chroma_format_idcの値が、トラックのNALユニットによって参照される全てのSPSにおいて同じである場合、chroma_format_idcはsps_chroma_format_idcに等しいとする;
- そうでない場合で、ptl_present_flagが1に等しい場合、chroma_format_idcは、ISO/IEC 23090-3で定義されるvps_ols_dpb_chroma_format[output_layer_set_idx]に等しいとする;
- それ以外の場合、chroma_format_idcは存在しないとする;
次の制約がbit_depth_minus8に適用される:
- ISO/IEC 23090-3で定義されるsps_bitdepth_minus8の値が、トラックのNALユニットによって参照される全てのSPSにおいて同じである場合、bit_depth_minus8はsps_bitdepth_minus8に等しいとする;
- そうでない場合で、ptl_present_flagが1に等しい場合、bit_depth_minus8は、ISO/IEC 23090-3で定義されるvps_ols_dpb_bitdepth_minus8[output_layer_set_idx]に等しいとする;
- それ以外の場合、bit_depth_minus8は存在しないとする;
クロマフォーマット及びビット深度、並びにVVC映像エレメンタリストリームによって使用されるその他の重要なフォーマット情報について、VVCデコーダコンフィギュレーションレコード内で明示的なインジケーションが提供される。2つのシーケンスがそれらのVUI情報内の色空間インジケーションにおいて異なる場合、2つの異なるVVCサンプルエントリも必要とされる;
初期化NALユニットを搬送するための配列のセットが存在する。NALユニットタイプは、DCI、VPS、SPS、PPS、プレフィックスAPS、プレフィックスSEI NALユニットのみを指し示すように制約される。ISO/IEC 23090-3において及びこの仕様において留保されるNALユニットタイプが将来において定義を得ることができ、リーダはNALユニットタイプの留保された又は許可されていない値を持つ配列を無視するものとする;
注記2:この‘耐性ある’挙動は、エラーが発生しないように設計され、将来仕様における、これらの配列への、後方互換性のある拡張の可能性を許す;
注記3:サンプルエントリにて搬送されるNALユニットは、そのサンプルエントリを参照する最初のサンプルから再構築されたアクセスユニット内の、又はさもなければ該アクセスユニットの始まりにある、AUD及びOPI NALユニット(もしあれば)のすぐ後に続くように含められる;
配列がDCI、VPS、SPS、PPS、プレフィックスAPS、プレフィックスSEIの順であることが推奨される。
3.3.1.1.2. 構文
aligned(8) class VvcPTLRecord(num_sublayers) {
unsigned int(8) num_bytes_constraint_info;
unsigned int(7) general_profile_idc;
unsigned int(1) general_tier_flag;
unsigned int(8) general_level_idc;
unsigned int(1) ptl_frame_only_constraint_flag;
unsigned int(1) ptl_multilayer_enabled_flag;
if (num_bytes_constraint_info > 0)
unsigned int(8*num_bytes_constraint_info - 2) general_constraint_info;
for (i=num_sublayers - 2; i >= 0; i--)
unsigned int(1) ptl_sublayer_level_present_flag[i];
for (j=num_sublayers; j<=8 && num_sublayers > 1; j++)
bit(1) ptl_reserved_zero_bit = 0;
for (i=num_sublayers-2; i >= 0; i--)
if (ptl_sublayer_level_present[i])
unsigned int(8) sublayer_level_idc[i];
unsigned int(8) num_sub_profiles;
for (j=0; j < num_sub_profiles; j++)
unsigned int(32) general_sub_profile_idc;
}
aligned(8) class VvcDecoderConfigurationRecord {
unsigned int(8) configurationVersion = 1;
unsigned int(16) avgFrameRate;
unsigned int(2) constantFrameRate;
unsigned int(3) numTemporalLayers;
unsigned int(2) lengthSizeMinusOne;
unsigned int(1) ptl_present_flag;
if (ptl_present_flag) {
VvcPTLRecord(numTemporalLayers) track_ptl;
unsigned int(16) output_layer_set_idx;
}
unsigned int(1) chroma_format_present_flag;
if (chroma_format_present_flag)
unsigned int(2) chroma_format_idc;
else
bit(2) reserved = '11'b;
unsigned int(1) bit_depth_present_flag;
if (bit_depth_present_flag)
unsigned int(3) bit_depth_minus8;
else
bit(3) reserved = '111'b;
unsigned int(1) reserved= '1'b;
unsigned int(8) numOfArrays;
for (j=0; j < numOfArrays; j++) {
unsigned int(1) array_completeness;
bit(1) reserved = 0;
unsigned int(6) NAL_unit_type;
unsigned int(16) numNalus;
for (i=0; i< numNalus; i++) {
unsigned int(16) nalUnitLength;
bit(8*nalUnitLength) nalUnit;
}
}
}
3.3.1.1.3. セマンティクス
general_profile_idc、general_tier_flag、general_sub_profile_idc、general_constraint_info、general_level_idc、ptl_frame_only_constraint_flag、ptl_multilayer_enabled_flag、sublayer_level_present、及びsublayer_level_idc[i]は、このコンフィギュレーションレコードが適用されるストリームについての、ISO/IEC 23090-3で定義される、フィールドgeneral_profile_idc、general_tier_flag、general_sub_profile_idcのマッチング値、general_constraint_info()、general_level_idc、ptl_multilayer_enabled_flag、ptl_frame_only_constraint_flag、sublayer_level_present、及びsublayer_level_idc[i]内のビットを含む;
avgFrameRateは、このコンフィギュレーションレコードが適用されるストリームについての、フレーム/(256秒)の単位での平均フレームレートを与える。値0は、規定されていない平均フレームレートを指し示す;
1に等しいconstantFrameRateは、このコンフィギュレーションレコードが適用されるストリームが一定のフレームレートのものであることを指し示す。値2は、ストリーム内の各時間レイヤの表現が一定フレームレートのものであることを指し示す。値0は、ストリームが一定のフレームレートのものであるかもしれないし、そうでないかもしれないことを指し示す;
1より大きいnumTemporalLayersは、このコンフィギュレーションレコードが適用されるトラックが時間スケーラブルであり、含まれる時間レイヤ(ISO/IEC 23090-3では時間サブレイヤ又はサブレイヤとしても参照される)の数がnumTemporalLayersに等しいことを指し示す。値1は、このコンフィギュレーションレコードが適用されるトラックが時間スケーラブルでないことを指し示す。値0は、このコンフィギュレーションレコードが適用されるトラックが時間スケーラブルであるかが不明であることを指し示す;
lengthSizeMinusOne+1は、このコンフィギュレーションレコードが適用されるストリーム内のVVC映像ストリームサンプルにおけるNALUnitLengthフィールドの、バイト単位での長さを指し示す。例えば、1バイトのサイズが0という値で指し示される。このフィールドの値は、1、2、又は4バイトで符号化される長さにそれぞれ対応する0、1、又は3のうちの1つであるとする;
1に等しいptl_present_flagは、トラックが特定の出力レイヤセットに対応するVVCビットストリームを含むことを規定する。0に等しいptl_present_flagは、トラックが特定の出力レイヤセットに対応するVVCビットストリームを含まずに、むしろ、出力レイヤセットを形成しない1つ以上の個別のレイヤ、又は0に等しいTemporalIdを持つサブレイヤを除く個別のサブレイヤを含み得ることを規定する;
num_sub_profilesは、デコーダコンフィギュレーションレコードにおいて指し示されるサブプロファイルの数を定める;
track_ptlは、トラックに含まれるVVCビットストリームによって表される出力レイヤセットのプロファイル、ティア、及びレベルを規定する;
output_layer_set_idxは、トラックに含まれるVVCビットストリームによって表される出力レイヤセットの出力レイヤセットインデックスを規定する。output_layer_set_idxの値は、トラックに含まれるビットストリームを復号するために、ISO/IEC 23090-3に規定されるように、VVCデコーダに外部手段によって提供されるTargetOlsIdx変数の値として使用されることができる;
0に等しいchroma_format_present_flagは、chroma_format_idcが存在しないことを規定する。1に等しいchroma_format_present_flagは、chroma_format_idcが存在することを規定する;
chroma_format_idcは、そのトラックに適用されるクロマフォーマットを指し示す。次の制約がchroma_format_idcに適用される:
- ISO/IEC 23090-3で定義されるsps_chroma_format_idcの値が、トラックのNALユニットによって参照される全てのSPSにおいて同じである場合、chroma_format_idcはsps_chroma_format_idcに等しいとする;
- そうでない場合で、ptl_present_flagが1に等しい場合、chroma_format_idcは、ISO/IEC 23090-3で定義されるvps_ols_dpb_chroma_format[output_layer_set_idx]に等しいとする;
- それ以外の場合、chroma_format_idcは存在しないとする;
0に等しいbit_depth_present_flagは、bit_depth_minus8が存在しないことを規定する。1に等しいbit_depth_present_flagは、bit_depth_minus8が存在することを規定する;
bit_depth_minus8は、そのトラックに適用されるビット深度を指し示す。次の制約がbit_depth_minus8に適用される:
- ISO/IEC 23090-3で定義されるsps_bitdepth_minus8の値が、トラックのNALユニットによって参照される全てのSPSにおいて同じである場合、bit_depth_minus8はsps_bitdepth_minus8に等しいとする;
- そうでない場合で、ptl_present_flagが1に等しい場合、bit_depth_minus8は、ISO/IEC 23090-3で定義されるvps_ols_dpb_bitdepth_minus8[output_layer_set_idx]に等しいとする;
- それ以外の場合、bit_depth_minus8は存在しないとする;
numArraysは、指し示される(1つ以上の)タイプのNALユニットの配列の数を指し示す;
array_completenessは、1に等しいとき、所与のタイプの全てのNALユニットが続く配列内にあり、ストリーム内にないことを指し示し、0に等しいとき、指し示されるタイプの追加のNALユニットがストリーム内にあり得ることを指し示し、デフォルト値及び許容値がサンプルエントリ名によって制約される;
NAL_unit_typeは、次の配列内のNALユニットのタイプを指し示す(そのタイプの全てとする):それは、ISO/IEC 23090-2で定義された値をとる;それは、DCI、VPS、SPS、PPS、APS、プレフィックスSEI、又はサフィックスSEI NALユニットを指し示す値のうち1つをとるように制約される;
numNalusは、このコンフィギュレーションレコードが適用されるストリームについてのコンフィギュレーションレコードに含まれる、指し示されたタイプのNALユニットの数を指し示す。SEIアレイは、‘宣言的’性質のSEIメッセージ、すなわち、全体としてのストリームについての情報を提供するものとする。そのようなSEIの一例は、ユーザデータSEIとし得る;
nalUnitLengthは、NALユニットのバイト単位での長さを指し示す;
nalUnitは、ISO/IEC 23090-3に規定されるように、DCI、VPS、SPS、PPS、APS又は宣言的SEI NALユニットを含む;
3.3.2. 動作点情報サンプルグループ
3.3.2.1. 定義
アプリケーションは、所与のVVCビットストリームによって提供される異なる動作点及びそれらの構成について、動作点情報(Operating Points Information)サンプルグループ(‘vopi’)を用いて通知される。各動作点は、出力レイヤセット、最大TemporarId値、並びにプロファイル、レベル、及びティアシグナリングに関係する。これらの情報は全て、‘vopi’サンプルグループによってキャプチャされる。この情報とは別に、このサンプルグループはまた、レイヤ間の従属関係情報を提供する;
VVCビットストリームに関して2つ以上のVVCトラックが存在し、且つそのVVCビットストリームに関して動作点エンティティグループが存在しないとき、次の両方が適用される:
- そのVVCビットストリームに関するVVCトラックの中に、‘vopi’サンプルグループを搬送するトラックが1つのみ存在するとする;
- そのVVCビットストリームの他の全てのVVCトラックは、‘vopi’サンプルグループを搬送するトラックへの‘oref’タイプのトラック参照を持つものとする;
所与のトラック内の任意の特定のサンプルに対して、別のトラック内の時間コロケートサンプルが、この特定のサンプルのものと同じ復号時間を有するサンプルとして定められる。‘vopi’サンプルグループを搬送するトラックTkへの‘oref’トラック参照を持つトラックTN内の各サンプルSNに対し、以下が適用される:
- トラックTk内に時間コロケートサンプルSkが存在する場合、サンプルSNは、サンプルSkと同じ‘vopi’サンプルグループエントリに関連付けられる;
- さうでない場合、サンプルSNは、復号時間においてサンプルSNに先行するトラックTk内のサンプルのうち最後のものと同じ‘vopi’サンプルグループエントリに関連付けられる;
複数のVPSがVVCビットストリームによって参照されるとき、グルーピングタイプ‘vopi’を有するサンプルグループ記述ボックスに複数のエントリを含む必要があるとし得る。より一般的な、単一のVPSが存在するケースでは、ISO/IEC 14496-12で定義されるデフォルトサンプルグループメカニズムを使用して、動作点情報サンプルグループを、各トラックフラグメントに含めるのではなく、サンプルテーブルボックスに含めることが推奨される;
grouping_type_parameterは、グルーピングタイプ‘vopi’を有するSampleToGroupBoxに対しては定められない;
3.3.2.2. 構文
class VvcOperatingPointsRecord {
unsigned int(8) num_profile_tier_level_minus1;
for (i=0; i<=num_profile_tier_level_minus1; i++) {
unsigned int(8) ptl_max_temporal_id[i];
VvcPTLRecord(ptl_max_temporal_id[i]+1) ptl[i];
}
unsigned int(1) all_independent_layers_flag;
bit(7) reserved = 0;
if (all_independent_layers_flag){
unsigned int(1) each_layer_is_an_ols_flag;
bit(7) reserved = 0;
} else
unsigned int(8) ols_mode_idc;
unsigned int(16) num_operating_points;
for (i=0; i<num_operating_points) {
unsigned int(16) output_layer_set_idx;
unsigned int(8) ptl_idx;
unsigned int(8) max_temporal_id;
unsigned int(8) layer_count;
for (j=0; j<layer_count; j++) {
unsigned int(6) layer_id;
unsigned int(1) is_outputlayer;
bit(1) reserved = 0;
}
bit(6) reserved = 0;
unsigned int(1) frame_rate_info_flag
unsigned int(1) bit_rate_info_flag
if (frame_rate_info_flag) {
unsigned int(16) avgFrameRate;
bit(6) reserved = 0;
unsigned int(2) constantFrameRate;
}
if (bit_rate_info_flag) {
unsigned int(32) maxBitRate;
unsigned int(32) avgBitRate;
}
}
unsigned int(8) max_layer_count;
for (i=0; i<max_layer_count; i++) {
unsigned int(8) layerID;
unsigned int(8) num_direct_ref_layers;
for (j=0; j<num_direct_ref_layers; j++)
unsigned int(8) direct_ref_layerID;
unsigned int(8) max_tid_il_ref_pics_plus1;
}
}
class VvcOperatingPointsInformation extends VisualSampleGroupEntry ('vopi') {
VvcOperatingPointsRecord oinf;
}
3.3.2.3. セマンティクス
num_profile_tier_level_minus1+1は、続くプロファイル、ティア、及びレベルの組み合わせ並びに関連するフィールドの数を与える;
ptl_max_temporal_id[i]は、規定されるi番目のプロファイル、ティア、及びレベル構造に関連するビットストリームのNALユニットの最大TemporalIDを与える;
注記:ptl_max_temporal_id[i]及び後述の動作点のmax_temporal_idのセマンティクスは、それらが同じ数値を搬送し得るとはいえ異なる;
ptl[i]は、i番目のプロファイル、ティア、及びレベル構造を規定する;
all_independent_layers_flag、each_layer_is_an_ols_flag、ols_mode_idc、及びmax_tid_il_ref_pics_plus1は、ISO/IEC 23090-3で定義されている;
num_operating_pointsは、それについて情報が続く動作点の数を与える;
output_layer_set_idxは、動作点を定める出力レイヤセットのインデックスである。output_layer_set_idxとlayer_id値との間のマッピングは、インデックスoutput_layer_set_idxを有する出力レイヤセットに対してVPSによって規定されるものと同じとする;
ptl_idxは、インデックスoutput_layer_set_idxを有する出力レイヤセットについて列挙されるプロファイル、レベル、及びティア構造のゼロベースのインデックスをシグナリングする;
max_temporal_idは、その動作点のNALユニットの最大TemporalIdを与える;
注記:レイヤ情報サンプルグループにおいて指し示される最大TemporalId値は、ここで指し示される最大TemporalIdとは異なるセマンティクスを持つ。しかしながら、それらは文字通り同じ数値を搬送し得る;
layer_countは、その動作点の、ISO/IEC 23090-3で定義される、必要なレイヤの数を指し示すフィールドである;
layer_idは、動作点のレイヤについてのnuh_layer_id値を提供する;
is_outputlayerは、レイヤが出力レイヤであるか否かを指し示すフラグである。1が出力レイヤを指し示す;
0に等しいframe_rate_info_flagは、動作点についてフレームレート情報が存在しないことを指し示す。値1は、動作点についてフレームレート情報が存在することを指し示す;
0に等しいbit_rate_info_flagは、動作点についてビットレート情報が存在しないことを指し示す。値1は、動作点についてビットレート情報が存在することを指し示す;
avgFrameRateは、動作点についての、フレーム/(256秒)の単位での平均フレームレートを与える。値0は、規定されていない平均フレームレートを指し示す;
1に等しいconstantFrameRateは、動作点のストリームが一定のフレームレートのものであることを指し示す。値2は、動作点のストリーム内の各時間レイヤの表現が一定フレームレートのものであることを指し示す。値0は、動作点のストリームが一定のフレームレートのものであるかもしれないし、そうでないかもしれないことを指し示す;
maxBitRateは、1秒の任意のウィンドウ上での、動作点のストリームのビット/秒単位での最大ビットレートを与える;
avgBitRateは、動作点のストリームのビット/秒単位での平均ビットレートを与える;
max_layer_countは、その関連付けられたベーストラックに関係する全ての動作点における全ての無二のレイヤのカウントである;
layerIDは、:それについて全ての直接参照レイヤが続くdirect_ref_layerIDのループ内で与えられるレイヤのnuh_layer_idである;
num_direct_ref_layersは、layerIDに等しいnuh_layer_idを有するレイヤについての直接参照レイヤの数である;
direct_ref_layerIDは、直接参照レイヤのnuh_layer_idである;
3.3.3. 動作点エンティティグループ
3.3.3.1. 全般
動作点エンティティグループは、動作点へのトラックのマッピング及び動作点のプロファイルレベル情報を提供するために定義される;
このエンティティグループに記述された動作点にマッピングされるトラックのサンプルを集約するときの暗黙の再構成プロセスは、準拠するVVCビットストリームを生じさせるために更なるNALユニットを除去することを必要としない。動作点エンティティグループに属するトラックは、動作点エンティティグループにおいて指し示されるgroup_idに対するタイプ‘oref’のトラック参照を持つとする;
動作点エンティティグループに含まれる全てのentity_id値は、同じVVCビットストリームに属するものとする。存在するとき、OperatingPointGroupBoxは、ムービーレベルのMetaBox内のGroupsListBoxに含まれるものとし、ファイルレベル又はトラックレベルのMetaBoxに含まれるのではないとする;
3.3.3.2. 構文
aligned(8) class OperatingPointGroupBox extends EntityToGroupBox('opeg',0,0)
{
unsigned int(8) num_profile_tier_level_minus1;
for (i=0; i<=num_profile_tier_level_minus1; i++)
VvcPTLRecord(0) opeg_ptl[i];
unsigned int(16) num_operating_points;
for (i=0; i<num_operating_points) {
unsigned int(16) output_layer_set_idx;
unsigned int(8) ptl_idx;
unsigned int(8) max_temporal_id;
unsigned int(8) layer_count;
for (j=0; j<layer_count; j++) {
unsigned int(6) layer_id;
unsigned int(1) is_outputlayer;
bit(1) reserved = 0;
}
bit(6) reserved = 0;
unsigned int(1) frame_rate_info_flag
unsigned int(1) bit_rate_info_flag
if (frame_rate_info_flag) {
unsigned int(16) avgFrameRate;
bit(6) reserved = 0;
unsigned int(2) constantFrameRate;
}
if (bit_rate_info_flag) {
unsigned int(32) maxBitRate;
unsigned int(32) avgBitRate;
}
unsigned int(8) entity_count;
for (j=0; j<entity_count; j++) {
unsigned int(8) entity_idx;
}
}
}
3.3.3.3. セマンティクス
num_profile_tier_level_minus1+1は、続くプロファイル、ティア、及びレベルの組み合わせ並びに関連するフィールドの数を与える;
opeg_ptl[i]は、i番目のプロファイル、ティア、及びレベル構造を規定する;
num_operating_pointsは、それについて情報が続く動作点の数を与える;
output_layer_set_idxは、動作点を定める出力レイヤセットのインデックスである。output_layer_set_idxとlayer_id値との間のマッピングは、インデックスoutput_layer_set_idxを有する出力レイヤセットに対してVPSによって規定されるものと同じとする;
ptl_idxは、インデックスoutput_layer_set_idxを有する出力レイヤセットについて列挙されるプロファイル、レベル、及びティア構造のゼロベースのインデックスをシグナリングする;
max_temporal_idは、その動作点のNALユニットの最大TemporalIdを与える;
注記:レイヤ情報サンプルグループにおいて指し示される最大TemporalId値は、ここで指し示される最大TemporalIdとは異なるセマンティクスを持つ。しかしながら、それらは文字通り同じ数値を搬送し得る;
layer_countは、その動作点の、ISO/IEC 23090-3で定義される、必要なレイヤの数を指し示すフィールドである;
layer_idは、動作点のレイヤについてのnuh_layer_id値を提供する;
is_outputlayerは、レイヤが出力レイヤであるか否かを指し示すフラグである。1が出力レイヤを指し示す;
0に等しいframe_rate_info_flagは、動作点についてフレームレート情報が存在しないことを指し示す。値1は、動作点についてフレームレート情報が存在することを指し示す;
0に等しいbit_rate_info_flagは、動作点についてビットレート情報が存在しないことを指し示す。値1は、動作点についてビットレート情報が存在することを指し示す;
avgFrameRateは、動作点についての、フレーム/(256秒)の単位での平均フレームレートを与える。値0は、規定されていない平均フレームレートを指し示す;
1に等しいconstantFrameRateは、動作点のストリームが一定のフレームレートのものであることを指し示す。値2は、動作点のストリーム内の各時間レイヤの表現が一定フレームレートのものであることを指し示す。値0は、動作点のストリームが一定のフレームレートのものであるかもしれないし、そうでないかもしれないことを指し示す;
maxBitRateは、1秒の任意のウィンドウ上での、動作点のストリームのビット/秒単位での最大ビットレートを与える;
avgBitRateは、動作点のストリームのビット/秒単位での平均ビットレートを与える;
entity_countは、動作点に存在するトラックの数を規定する;
entity_idxは、動作点に属するエンティティグループ内のentity_idリストへのインデックスを規定する。
4. 開示される技術的ソリューションによって解決される技術的問題の例
1)VvcDecoderConfigurationRecordは、クロマフォーマット及びビット深度のオプションでのシグナリングを含むが、ピクチャ幅及びピクチャ高さのシグナリングを含まず、また、動作点情報‘vopi’サンプルグループエントリ及び動作点エンティティグループ‘opeg’ボックスは、これらのパラメータのいずれも含んでいない;
しかしながら、PTLがある場所でシグナリングされるとき、クロマフォーマット、ビット深度、並びにピクチャ幅及びピクチャ高さも、追加の能力表示としてシグナリングされるべきである;
なお、ビジュアルサンプルエントリの幅及び高さフィールドは、クロッピングされたフレーム幅及び高さである。従って、クロッピングウィンドウオフセットが全てゼロであり且つピクチャがフレームであるのでない限り、幅及び高さの値は、復号ピクチャのピクチャ幅及び高さと同じにならない;
現行では、次のようなケースが発生し得る:
a. ‘oref’トラック参照なしで、1つのVVCトラックに含まれたシングルレイヤビットストリームのみである。従って、VvcPtlRecordはデコーダコンフィグレーションレコード内に存在する。しかしながら、この場合、クロマフォーマット、ビット深度、ピクチャ幅、及びピクチャ高さのうちの一部又は全てが、サンプルエントリ、‘vopi’サンプルグループエントリ、又は‘opeg’エンティティグループボックスのいずれでもシグナリングされないことが可能である;
b. 各動作点についてのPTL情報を含む動作点情報が‘vopi’サンプルグループエントリ又は‘opeg’エンティティグループボックスのいずれかに格納されて、マルチレイヤビットストリームが複数のトラックに格納される一方で、クロマフォーマット、ビット深度、ピクチャ幅、及びピクチャ高さのいずれもが、サンプルエントリ、‘vopi’サンプルグループエントリ、又は‘opeg’エンティティグループボックスのいずれでもシグナリングされない;
2)VvcDecoderConfigurationRecord内のパラメータchroma_format_idcは、パラメータセット自体で復号に十分であるため、復号のためではなく、むしろ能力インジケーションである。復号のためであっても、SPS内のchroma_format_idcが必要とされるだけでなく、マルチレイヤOLS用のvps_ols_dpb_chroma_format[]も必要とされる。従って、ここでは実際には最大のdpb_chroma_formatがシグナリングされるべきであるが、現行設計ではそうではない。対応するビット深度、ピクチャ幅、及びピクチャ高さのパラメータについても同様である;
3)ptl_present_flagが1に等しいとき、chroma_format_idcがvps_ols_dpb_chroma_format[output_layer_set_idx]に等しいものとされることが既定されている。次の2つの問題が存在する(対応するビット深度パラメータについても同様):
a. vps_ols_dpb_chroma_format[]の値は、異なるCVSに対して異なることができる。従って、これが全てのVPSに対して同じであることを要求するか、それが最大以上であることを規定するか、のいずれかを必要とする;
b. vps_ols_dpb_chroma_format[idx]のインデックス値idxは、マルチレイヤOLSのリストへのインデックスであり、それ故に、全てのOLSのリストへのインデックスであるoutput_layer_set_idxを直接使用することは正しくない。
5. 技術的ソリューションのリスト
1)ptl_present_flagが1に等しいとき、VvcDecoderConfigurationRecord内でchroma_format_idc及びbit_depth_minus8をシグナリングし、ptl_present_flagが0に等しいときには、VvcDecoderConfigurationRecord内でそれらをシグナリングしない;
2)コンフィギュレーションレコードが適用されるVVCストリームがシングルレイヤビットストリームであるとき、sps_chroma_format_idcの値は、現在サンプルエントリ記述が適用されるサンプル内のVCL NALユニットによって参照される全てのSPSに対して同じであるとするとともに、chroma_format_idcの値は、sps_chroma_format_idcに等しいとする;
3)コンフィギュレーションレコードが適用されるVVCストリームがマルチレイヤビットストリームであるとき、chroma_format_idcの値は、現在サンプルエントリ記述が適用される全てのCVSに対して、output_layer_set_idxによって特定されるOLSに適用されるvps_ols_dpb_chroma_format[output_layer_set_idx]のうちの最大値に等しいとする;
a. あるいは、上の“に等しい”が“以上である”に変更される;
4)コンフィギュレーションレコードが適用されるVVCストリームがシングルレイヤビットストリームであるとき、sps_bitdepth_minus8の値は、現在サンプルエントリ記述が適用されるサンプル内のVCL NALユニットによって参照される全てのSPSに対して同じであるとするとともに、bit_depth_minus8の値は、sps_bitdepth_minus8に等しいとする;
5)コンフィギュレーションレコードが適用されるVVCストリームがマルチレイヤビットストリームであるとき、bit_depth_minus8の値は、現在サンプルエントリ記述が適用される全てのCVSに対して、output_layer_set_idxによって特定されるOLSに適用されるvps_ols_dpb_bitdepth_minus8[output_layer_set_idx]のうちの最大値に等しいとする;
a. あるいは、上の“に等しい”が“以上である”に変更される;
6)chroma_format_idc及びbit_depth_minus8のシグナリングと同様に、VvcDecoderConfigurationRecord内でのpicture_width及びpicture_heightのシグナリングを追加する。そして、picture_widthフィールド及びpicture_heightフィールドはどちらも16ビットを使ってシグナリングされる;
a. あるいは、picture_widthフィールド及びpicture_heightフィールドはどちらも24ビットを使ってシグナリングされる;
b. あるいは、picture_widthフィールド及びpicture_heightフィールドはどちらも32ビットを使ってシグナリングされる;
c. あるいは、さらに、コンフィギュレーションレコードが適用されるVVCストリームがシングルレイヤビットストリームであるとき、picture_widthフィールド及びpicture_heightフィールドをシグナリングすることは、クロッピングウィンドウオフセットが全てゼロであり且つピクチャがフレームである場合にスキップされてもよい;
7)上のVvcDecoderConfigurationRecord内に存在する場合と同様のセマンティクス及び制約を用いて、例えばptl_idxの直後で、各動作点について、VvcOperatingPointsRecord及びOperatingPointGroupBox内でのchroma_format_idc、bit_depth_minus8、picture_width及びpicture_heightのシグナリングを追加する。
6. 実施形態
以下は、VVC映像ファイルフォーマットに関する標準仕様に適用されることができる、第5節に要約した発明態様の一部の幾つかの実施形態例である。変更対象テキストは、2020年7月のMPEGアウトプット文書N19454“Information technology ― Coding of audio-visual objects ― Part 15: Carriage of network abstraction layer (NAL) unit structured video in the ISO base media file format ― Amendment 2: Carriage of VVC and EVC in ISOBMFF”における最新ドラフト仕様に基づいている。追加又は変更された大きく関連する部分は太字イタリック体で強調表示されており、削除された部分の一部は二重括弧で強調表示されている(例えば、[[a]]は文字‘a’の削除を表す)。本質的に編集上の変更であるために強調表示していない変更も一部あり得る。
6.1. 第1実施形態
この実施形態は、項目1乃至7についてのものである。
6.1.1. デコーダコンフィギュレーション情報
6.1.1.1. VVCデコーダコンフィギュレーションレコード
6.1.1.1.1. 定義
この従属節は、ISO/IEC 23090-3映像コンテンツ向けのデコーダコンフィギュレーション情報を規定する。
...
(外1)
(外2)
(外3)
(外4)
...
(外5)
(外6)
6.1.2. 動作点情報サンプルグループ
6.1.2.1. 定義
...
6.1.2.2. 構文
(外7)
6.1.2.3. セマンティクス
(外8)
6.1.3. 動作点エンティティグループ
6.1.3.1. 全般
動作点エンティティグループは、動作点へのトラックのマッピング及び動作点のプロファイルレベル情報を提供するために定義される;
このエンティティグループに記述された動作点にマッピングされるトラックのサンプルを集約するときの暗黙の再構成プロセスは、準拠するVVCビットストリームを生じさせるために更なるNALユニットを除去することを必要としない。動作点エンティティグループに属するトラックは、動作点エンティティグループにおいて指し示されるgroup_idに対するタイプ‘oref’のトラック参照を持つとする;
動作点エンティティグループに含まれる全てのentity_id値は、同じVVCビットストリームに属するものとする。存在するとき、OperatingPointGroupBoxは、ムービーレベルのMetaBox内のGroupsListBoxに含まれるものとし、ファイルレベル又はトラックレベルのMetaBoxに含まれるのではないとする;
6.1.3.2. 構文
(外9)
6.1.3.3. セマンティクス
(外10)
Claims (19)
- ビジュアルメディアデータを処理する方法であって、
ビジュアルメディアデータと、該ビジュアルメディアデータの1つ以上のビットストリームを格納する1つ以上のトラックを含むビジュアルメディアファイルと、の間での変換を、フォーマットルールに従って実行するステップ、
を有し、
前記ビジュアルメディアファイルは、動作点レコード及び動作点グループボックスを含み、
前記フォーマットルールは、前記ビジュアルメディアファイルにおいて指し示される各動作点について、前記動作点レコード及び前記動作点グループボックスに、クロマフォーマットを指し示す第1要素、ビット深度情報を指し示す第2要素、最大ピクチャ幅を指し示す第3要素、及び/又は最大ピクチャ高さを指し示す第4要素を含めるかを規定する、
方法。 - 前記フォーマットルールは更に、前記第1要素、前記第2要素、前記第3要素、及び/又は前記第4要素が、出力レイヤセットインデックスによって特定される出力レイヤセットに関するプロファイル、レベル、及びティア構造のゼロベースインデックスを差し示す第5要素の直後にあることを規定する、請求項1に記載の方法。
- 前記フォーマットルールは更に、ビットストリームに関連する動作点に適用される前記第1要素の値、前記第2要素の値、前記第3要素の値、及び/又は前記第4要素の値に対する構文制約を、前記動作点が単一のレイヤのみを含むかに基づいて規定する、請求項1に記載の方法。
- 前記フォーマットルールは更に、前記動作点が前記単一のレイヤを含むことに応答して、前記構文制約が、前記動作点の前記ビットストリーム内のNAL(ネットワーク抽象化層)ユニットによって参照される1つ以上のシーケンスパラメータセットにおいて指し示される1つ以上のクロマフォーマット値が相等しいというものである、ことを規定する、請求項3に記載の方法。
- 前記フォーマットルールは更に、前記第1要素の前記値が前記1つ以上のクロマフォーマット値に等しいことを規定する、請求項4に記載の方法。
- 前記フォーマットルールは更に、前記動作点が2つ以上のレイヤを含むことに応答して、前記構文制約が、前記第1要素の前記値が、ビデオパラメータセットにおいて指し示されて、出力レイヤセットインデックスによって特定される出力レイヤセットに適用されるクロマフォーマット値、に等しく設定されるというものである、ことを規定する、請求項3に記載の方法。
- 前記フォーマットルールは更に、前記動作点が前記単一のレイヤを含むことに応答して、前記構文制約が、前記動作点の前記ビットストリーム内のNAL(ネットワーク抽象化層)ユニットによって参照される1つ以上のシーケンスパラメータセットにおいて指し示される1つ以上のビット深度情報値が相等しいというものである、ことを規定する、請求項3に記載の方法。
- 前記フォーマットルールは更に、前記第2要素の前記値が前記1つ以上のビット深度情報値に等しいことを規定する、請求項7に記載の方法。
- 前記フォーマットルールは更に、前記動作点が2つ以上のレイヤを含むことに応答して、前記構文制約が、前記第2要素の前記値が、ビデオパラメータセットにおいて指し示されて、出力レイヤセットインデックスによって特定される出力レイヤセットに適用されるビット深度情報値、に等しく設定されるというものである、ことを規定する、請求項3に記載の方法。
- 前記フォーマットルールは更に、前記動作点が前記単一のレイヤを含むことに応答して、前記構文制約が、前記動作点の前記ビットストリーム内のNAL(ネットワーク抽象化層)ユニットによって参照される1つ以上のシーケンスパラメータセットにおいて指し示される1つ以上のピクチャ幅値が相等しいというものである、ことを規定する、請求項3に記載の方法。
- 前記フォーマットルールは更に、前記第3要素の前記値が前記1つ以上のピクチャ幅値に等しいことを規定する、請求項10に記載の方法。
- 前記フォーマットルールは更に、前記動作点が2つ以上のレイヤを含むことに応答して、前記構文制約が、前記第3要素の前記値が、ビデオパラメータセットにおいて指し示されて、出力レイヤセットインデックスによって特定される出力レイヤセットに適用されるピクチャ幅値、に等しく設定されるというものである、ことを規定する、請求項3に記載の方法。
- 前記フォーマットルールは更に、前記動作点が前記単一のレイヤを含むことに応答して、前記構文制約が、前記動作点の前記ビットストリーム内のNAL(ネットワーク抽象化層)ユニットによって参照される1つ以上のシーケンスパラメータセットにおいて指し示される1つ以上のピクチャ高さ値が相等しいというものである、ことを規定する、請求項3に記載の方法。
- 前記フォーマットルールは更に、前記第4要素の前記値が前記1つ以上のピクチャ高さ値に等しいことを規定する、請求項13に記載の方法。
- 前記フォーマットルールは更に、前記動作点が2つ以上のレイヤを含むことに応答して、前記構文制約が、前記第4要素の前記値が、ビデオパラメータセットにおいて指し示されて、出力レイヤセットインデックスによって特定される出力レイヤセットに適用されるピクチャ高さ値、に等しく設定されるというものである、ことを規定する、請求項3に記載の方法。
- 前記変換は、ビジュアルメディアファイルを生成し、前記ビジュアルメディアファイルに前記フォーマットルールに従って前記1つ以上のビットストリームを格納することを有する、請求項1乃至15のいずれか一項に記載の方法。
- 前記変換は、前記フォーマットルールに従って前記ビジュアルメディアファイルを構文解析して、前記1つ以上のビットストリームを再構成することを有する、請求項1乃至15のいずれか一項に記載の方法。
- 請求項1乃至17のいずれか一項に記載の方法を実施するように構成されたプロセッサを有する映像処理装置。
- 実行されるときにプロセッサに請求項1乃至17のいずれか一項に記載の方法を実施させるプログラムコードを格納したコンピュータ読み取り可能媒体。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202063079910P | 2020-09-17 | 2020-09-17 | |
US63/079910 | 2020-09-17 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022050361A true JP2022050361A (ja) | 2022-03-30 |
JP7270012B2 JP7270012B2 (ja) | 2023-05-09 |
Family
ID=77801578
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021151188A Active JP7270012B2 (ja) | 2020-09-17 | 2021-09-16 | 映像動作点レコード構文及びセマンティクス |
JP2021151184A Active JP7202429B2 (ja) | 2020-09-17 | 2021-09-16 | 符号化映像におけるクロマフォーマット及びビット深度のインジケーション |
JP2021151187A Active JP7203172B2 (ja) | 2020-09-17 | 2021-09-16 | デコーダコンフィギュレーションレコードにおけるピクチャ寸法インジケーション |
Family Applications After (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021151184A Active JP7202429B2 (ja) | 2020-09-17 | 2021-09-16 | 符号化映像におけるクロマフォーマット及びビット深度のインジケーション |
JP2021151187A Active JP7203172B2 (ja) | 2020-09-17 | 2021-09-16 | デコーダコンフィギュレーションレコードにおけるピクチャ寸法インジケーション |
Country Status (5)
Country | Link |
---|---|
US (3) | US11831921B2 (ja) |
EP (3) | EP3972272A1 (ja) |
JP (3) | JP7270012B2 (ja) |
KR (3) | KR20220037379A (ja) |
CN (3) | CN114205603A (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20220115957A (ko) * | 2019-12-26 | 2022-08-19 | 바이트댄스 아이엔씨 | 비디오 코딩에서의 디코딩 파라미터 세트들 |
US11831921B2 (en) | 2020-09-17 | 2023-11-28 | Lemon Inc. | Video operating points record syntax and semantics |
WO2022065875A1 (ko) * | 2020-09-22 | 2022-03-31 | 엘지전자 주식회사 | 동작점 정보와 출력 계층 세트 정보를 시그널링하는 미디어 파일 생성/수신 방법, 장치 및 미디어 파일을 저장한 컴퓨터 판독 가능한 기록 매체 |
MX2024002397A (es) * | 2021-08-26 | 2024-04-03 | Guangdong Oppo Mobile Telecommunications Corp Ltd | Derivaciones de parametros de rice basados en el historial para el procesamiento paralelo de frente de onda en codificacion de video. |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015506650A (ja) * | 2012-01-30 | 2015-03-02 | クゥアルコム・インコーポレイテッドQualcomm Incorporated | ビデオを符号化しビデオコンテンツを記憶する方法 |
JP2018511208A (ja) * | 2015-02-11 | 2018-04-19 | クゥアルコム・インコーポレイテッドQualcomm Incorporated | 階層化されたビデオファイルフォーマットにおけるサンプルエントリー及び動作点信号伝達の設計 |
JP2018524891A (ja) * | 2015-06-18 | 2018-08-30 | クゥアルコム・インコーポレイテッドQualcomm Incorporated | 階層化hevcファイルフォーマットでのトラックおよびオペレーティングポイントシグナリングの設計 |
Family Cites Families (39)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9532046B2 (en) * | 2012-04-16 | 2016-12-27 | Qualcomm Incorporated | Reference picture set prediction for video coding |
US9479776B2 (en) * | 2012-07-02 | 2016-10-25 | Qualcomm Incorporated | Signaling of long-term reference pictures for video coding |
US9161039B2 (en) | 2012-09-24 | 2015-10-13 | Qualcomm Incorporated | Bitstream properties in video coding |
US9241158B2 (en) * | 2012-09-24 | 2016-01-19 | Qualcomm Incorporated | Hypothetical reference decoder parameters in video coding |
US9357199B2 (en) | 2013-01-04 | 2016-05-31 | Qualcomm Incorporated | Separate track storage of texture and depth views for multiview coding plus depth |
EP2941868B1 (en) | 2013-01-07 | 2020-07-08 | Nokia Technologies Oy | Method and apparatus for video coding and decoding |
US9565437B2 (en) | 2013-04-08 | 2017-02-07 | Qualcomm Incorporated | Parameter set designs for video coding extensions |
US10075729B2 (en) | 2013-07-15 | 2018-09-11 | Qualcomm Incorporated | Signaling of view ID bit depth in parameter sets |
US9794579B2 (en) | 2013-07-15 | 2017-10-17 | Qualcomm Incorporated | Decoded picture buffer operations for video coding |
KR20150010658A (ko) * | 2013-07-18 | 2015-01-28 | 삼성전자주식회사 | 비디오 포멧 파라미터 전달을 사용하는 비디오 부호화 방법 및 그 장치, 비디오 복호화 방법 및 그 장치 |
AU2014294127B2 (en) | 2013-07-22 | 2018-09-13 | Sony Corporation | Image processing device and method |
KR101757307B1 (ko) | 2013-08-20 | 2017-07-26 | 엘지전자 주식회사 | 스트리밍 서비스를 통한 미디어 데이터 전송 장치, 스트리밍 서비스를 통한 미디어 데이터 수신 장치, 스트리밍 서비스를 통한 미디어 데이터 전송 방법, 및 스트리밍 서비스를 통한 미디어 데이터 수신 방법 |
JP2017501599A (ja) | 2013-10-07 | 2017-01-12 | ヴィド スケール インコーポレイテッド | マルチレイヤビデオコーディングのコンバインドスケーラビリティ処理 |
US9712843B2 (en) * | 2013-10-23 | 2017-07-18 | Qualcomm Incorporated | Multi-layer video file format designs |
US9860540B2 (en) | 2014-01-03 | 2018-01-02 | Qualcomm Incorporated | Inference of nooutputofpriorpicsflag in video coding |
US10171833B2 (en) | 2014-03-04 | 2019-01-01 | Microsoft Technology Licensing, Llc | Adaptive switching of color spaces, color sampling rates and/or bit depths |
EP3114835B1 (en) | 2014-03-04 | 2020-04-22 | Microsoft Technology Licensing, LLC | Encoding strategies for adaptive switching of color spaces |
US9736481B2 (en) | 2014-03-14 | 2017-08-15 | Qualcomm Incorporated | Quantization parameters for color-space conversion coding |
WO2015139203A1 (en) | 2014-03-18 | 2015-09-24 | Mediatek Singapore Pte. Ltd. | Dlt signaling in 3d video coding |
WO2015184605A1 (en) | 2014-06-04 | 2015-12-10 | Mediatek Singapore Pte. Ltd. | Depth coding compatible with arbitrary bit-depth |
US9769492B2 (en) * | 2014-06-06 | 2017-09-19 | Qualcomm Incorporated | Conformance parameters for bitstream partitions |
US10063867B2 (en) * | 2014-06-18 | 2018-08-28 | Qualcomm Incorporated | Signaling HRD parameters for bitstream partitions |
US20150373343A1 (en) * | 2014-06-20 | 2015-12-24 | Qualcomm Incorporated | Representation format update in multi-layer codecs |
EP3148200B1 (en) | 2014-06-30 | 2020-06-17 | Sony Corporation | Information processing device and method selecting content files based on encoding parallelism type |
KR102051193B1 (ko) | 2014-09-12 | 2019-12-02 | 브이아이디 스케일, 인크. | 비디오 코딩을 위한 성분간 탈상관 |
TW201626798A (zh) | 2014-10-06 | 2016-07-16 | Vid Scale Inc | 用於螢幕內容編碼之改良調色編碼 |
US9838662B2 (en) | 2014-10-10 | 2017-12-05 | Qualcomm Incorporated | Harmonization of cross-component prediction and adaptive color transform in video coding |
US10271064B2 (en) * | 2015-06-11 | 2019-04-23 | Qualcomm Incorporated | Sub-prediction unit motion vector prediction using spatial and/or temporal motion information |
GB2539462B (en) | 2015-06-16 | 2019-04-03 | Canon Kk | Obtaining media data and metadata from encapsulated bit-streams wherein operating point descriptors can be dynamically set |
US10034010B2 (en) | 2015-10-14 | 2018-07-24 | Qualcomm Incorporated | Alignment of operation point sample group in multi-layer bitstreams file format |
US11223852B2 (en) * | 2016-03-21 | 2022-01-11 | Qualcomm Incorporated | Coding video data using a two-level multi-type-tree framework |
US10616582B2 (en) | 2016-09-30 | 2020-04-07 | Qualcomm Incorporated | Memory and bandwidth reduction of stored data in image/video coding |
JP2020515169A (ja) | 2017-03-20 | 2020-05-21 | シャープ株式会社 | メディアアプリケーションフォーマットでスケーラブル動画像をシグナリングするためのシステム及び方法 |
US20190320172A1 (en) * | 2018-04-12 | 2019-10-17 | Qualcomm Incorporated | Hardware-friendly sample adaptive offset (sao) and adaptive loop filter (alf) for video coding |
ES2962871T3 (es) | 2018-09-18 | 2024-03-21 | Nokia Technologies Oy | Método y aparato para señalización de restricción de perfil no binario para codificación de video |
GB2590435B (en) * | 2019-12-17 | 2023-12-20 | Canon Kk | Method, device, and computer program for improving encapsulation of media content |
WO2021188527A1 (en) * | 2020-03-17 | 2021-09-23 | Bytedance Inc. | Using video parameter set in video coding |
KR20220164549A (ko) * | 2020-04-02 | 2022-12-13 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 효율적인 관심영역, 스트림 액세스 및 파라미터 세트 처리를 허용하는 파일 포맷 체계 |
US11831921B2 (en) | 2020-09-17 | 2023-11-28 | Lemon Inc. | Video operating points record syntax and semantics |
-
2021
- 2021-09-16 US US17/477,320 patent/US11831921B2/en active Active
- 2021-09-16 KR KR1020210123944A patent/KR20220037379A/ko active Search and Examination
- 2021-09-16 EP EP21197131.2A patent/EP3972272A1/en active Pending
- 2021-09-16 KR KR1020210123952A patent/KR20220037380A/ko active Search and Examination
- 2021-09-16 KR KR1020210124038A patent/KR20220037382A/ko active Search and Examination
- 2021-09-16 US US17/477,284 patent/US11877011B2/en active Active
- 2021-09-16 JP JP2021151188A patent/JP7270012B2/ja active Active
- 2021-09-16 JP JP2021151184A patent/JP7202429B2/ja active Active
- 2021-09-16 US US17/476,809 patent/US11729427B2/en active Active
- 2021-09-16 EP EP21197130.4A patent/EP3972271A1/en active Pending
- 2021-09-16 EP EP21197128.8A patent/EP3972270A1/en active Pending
- 2021-09-16 JP JP2021151187A patent/JP7203172B2/ja active Active
- 2021-09-17 CN CN202111090735.4A patent/CN114205603A/zh active Pending
- 2021-09-17 CN CN202111090741.XA patent/CN114205626B/zh active Active
- 2021-09-17 CN CN202111090734.XA patent/CN114205602A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015506650A (ja) * | 2012-01-30 | 2015-03-02 | クゥアルコム・インコーポレイテッドQualcomm Incorporated | ビデオを符号化しビデオコンテンツを記憶する方法 |
JP2018511208A (ja) * | 2015-02-11 | 2018-04-19 | クゥアルコム・インコーポレイテッドQualcomm Incorporated | 階層化されたビデオファイルフォーマットにおけるサンプルエントリー及び動作点信号伝達の設計 |
JP2018524891A (ja) * | 2015-06-18 | 2018-08-30 | クゥアルコム・インコーポレイテッドQualcomm Incorporated | 階層化hevcファイルフォーマットでのトラックおよびオペレーティングポイントシグナリングの設計 |
Non-Patent Citations (2)
Title |
---|
"Information technology - Coding of audio-visual objects - Part 15: Carriage of network abstraction l", ISO/IEC 14496-15:2019 DAM 2, JPN7022005817, 28 December 2020 (2020-12-28), pages 14 - 19, ISSN: 0004943226 * |
ITU-T: "SERIES H: AUDIOVISUAL AND MULTIMEDIA SYSTEMS: Versatile video coding", ITU-T H.266 (08/2020), vol. pp.35-40,99-104,456-460, JPN6022053021, 31 August 2020 (2020-08-31), ISSN: 0004943225 * |
Also Published As
Publication number | Publication date |
---|---|
US11729427B2 (en) | 2023-08-15 |
CN114205626B (zh) | 2023-12-01 |
JP2022050359A (ja) | 2022-03-30 |
JP2022050360A (ja) | 2022-03-30 |
EP3972272A1 (en) | 2022-03-23 |
US11877011B2 (en) | 2024-01-16 |
CN114205626A (zh) | 2022-03-18 |
JP7202429B2 (ja) | 2023-01-11 |
CN114205602A (zh) | 2022-03-18 |
KR20220037382A (ko) | 2022-03-24 |
US20220086498A1 (en) | 2022-03-17 |
JP7270012B2 (ja) | 2023-05-09 |
US20220103865A1 (en) | 2022-03-31 |
KR20220037379A (ko) | 2022-03-24 |
EP3972271A1 (en) | 2022-03-23 |
EP3972270A1 (en) | 2022-03-23 |
JP7203172B2 (ja) | 2023-01-12 |
KR20220037380A (ko) | 2022-03-24 |
CN114205603A (zh) | 2022-03-18 |
US20220086499A1 (en) | 2022-03-17 |
US11831921B2 (en) | 2023-11-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3972274A1 (en) | Subpicture entity group signaling in coded video | |
JP7270012B2 (ja) | 映像動作点レコード構文及びセマンティクス | |
EP3972276A1 (en) | Decoding capability information storage in video coding | |
US11611752B2 (en) | Adaptation parameter set storage in video coding | |
US20230269384A1 (en) | Roll sample group in vvc video coding |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20211115 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20221121 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20221213 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230308 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230328 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230424 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7270012 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |