JP2022050370A - ビデオコーディングにおけるデコード機能情報のストレージ - Google Patents
ビデオコーディングにおけるデコード機能情報のストレージ Download PDFInfo
- Publication number
- JP2022050370A JP2022050370A JP2021151970A JP2021151970A JP2022050370A JP 2022050370 A JP2022050370 A JP 2022050370A JP 2021151970 A JP2021151970 A JP 2021151970A JP 2021151970 A JP2021151970 A JP 2021151970A JP 2022050370 A JP2022050370 A JP 2022050370A
- Authority
- JP
- Japan
- Prior art keywords
- video
- visual media
- track
- media file
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 claims abstract description 165
- 230000000007 visual effect Effects 0.000 claims abstract description 108
- 238000006243 chemical reaction Methods 0.000 claims abstract description 40
- 230000006870 function Effects 0.000 claims description 35
- 230000008569 process Effects 0.000 claims description 11
- 238000003491 array Methods 0.000 claims description 10
- 230000015654 memory Effects 0.000 claims description 8
- 230000004044 response Effects 0.000 claims description 8
- 239000010410 layer Substances 0.000 description 80
- 238000012545 processing Methods 0.000 description 23
- 230000003044 adaptive effect Effects 0.000 description 20
- 239000013598 vector Substances 0.000 description 18
- 238000004590 computer program Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 11
- 238000013139 quantization Methods 0.000 description 8
- 238000003672 processing method Methods 0.000 description 6
- 230000011664 signaling Effects 0.000 description 6
- 230000005540 biological transmission Effects 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 5
- 230000001360 synchronised effect Effects 0.000 description 5
- 230000006835 compression Effects 0.000 description 4
- 238000007906 compression Methods 0.000 description 4
- 238000013461 design Methods 0.000 description 4
- 238000000638 solvent extraction Methods 0.000 description 4
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000013507 mapping Methods 0.000 description 3
- 108091000069 Cystinyl Aminopeptidase Proteins 0.000 description 2
- 102100020872 Leucyl-cystinyl aminopeptidase Human genes 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 230000006837 decompression Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000006073 displacement reaction Methods 0.000 description 2
- 238000005192 partition Methods 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 238000009877 rendering Methods 0.000 description 2
- 238000013515 script Methods 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- FMYKJLXRRQTBOR-UBFHEZILSA-N (2s)-2-acetamido-4-methyl-n-[4-methyl-1-oxo-1-[[(2s)-1-oxohexan-2-yl]amino]pentan-2-yl]pentanamide Chemical group CCCC[C@@H](C=O)NC(=O)C(CC(C)C)NC(=O)[C@H](CC(C)C)NC(C)=O FMYKJLXRRQTBOR-UBFHEZILSA-N 0.000 description 1
- 101100533821 Arabidopsis thaliana FSD1 gene Proteins 0.000 description 1
- 241000023320 Luma <angiosperm> Species 0.000 description 1
- 240000007594 Oryza sativa Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000000945 filler Substances 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 239000011229 interlayer Substances 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- OSWPMRLSEDHDFF-UHFFFAOYSA-N methyl salicylate Chemical compound COC(=O)C1=CC=CC=C1O OSWPMRLSEDHDFF-UHFFFAOYSA-N 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 101150018269 sodB gene Proteins 0.000 description 1
- 238000013517 stratification Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 230000000153 supplemental effect Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/85—Assembly of content; Generation of multimedia applications
- H04N21/854—Content authoring
- H04N21/85406—Content authoring involving a specific file format, e.g. MP4 format
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/184—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/105—Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/132—Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/157—Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
- H04N19/159—Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/172—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/174—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/188—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a video data packet, e.g. a network abstraction layer [NAL] unit
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/30—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/42—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
- H04N19/423—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation characterised by memory arrangements
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/44—Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/513—Processing of motion vectors
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/234—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
- H04N21/23418—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/234—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
- H04N21/2343—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/236—Assembling of a multiplex stream, e.g. transport stream, by combining a video stream with other content or additional data, e.g. inserting a URL [Uniform Resource Locator] into a video stream, multiplexing software data into a video stream; Remultiplexing of multiplex streams; Insertion of stuffing bits into the multiplex stream, e.g. to obtain a constant bit-rate; Assembling of a packetised elementary stream
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/434—Disassembling of a multiplex stream, e.g. demultiplexing audio and video streams, extraction of additional data from a video stream; Remultiplexing of multiplex streams; Extraction or processing of SI; Disassembling of packetised elementary stream
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Computer Security & Cryptography (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Management Or Editing Of Information On Record Carriers (AREA)
- Television Signal Processing For Recording (AREA)
Abstract
Description
本文書はビデオファイルフォーマットに関する。具体的には、ISOベースメディア・ファイルフォーマット(ISOBMFF)に基づく、メディアファイルにおけるバーサタイルビデオコーディング(Versatile Video Coding、VVC)ビデオビットストリームに係る、画像ヘッダ(PH)、適応パラメータセット(APS)、デコード機能情報(decoding capability information、DCI)、および、動作点情報(OPI)ネットワーク抽象化層(NA)ユニットの信号化および保管に関する。本アイデアは、個々に、または様々な組み合わせで、任意のコーデック、例えばVVC標準によって符号化されたビデオビットストリーム、および、任意のビデオファイルフォーマット、例えば開発中のVVCビデオファイルフォーマットに適用され得る。
2.略語
ACT 適応色変換
ALF 適応ループフィルタ
AMVR 適応動きベクトル分解能
APS 適応パラメータセット
AU アクセスユニット
AUD アクセスユニットの区切り記号
AVC アドバンストビデオコーディング(Rec.ITU-T H.264|ISO/IEC 14496-10)
B 双予測(bi-predictive)
BCW CUレベルの重み付けによる双予測
BDOF 双方向のオプティカルフロー
BDPCM ブロックベースのデルタパルス符号変調
BP バッファ期間
CABAC コンテキストベースの適応バイナリ演算符号化
CB 符号化ブロック
CBR 固定ビットレート
CCALF クロスコンポーネント適応ループフィルタ
CPB コード化画像バッファ
CRA クリーンなランダムアクセス
CRC 巡回冗長検査(cyclic redundancy check)
CTB 符号化木ブロック
CTU 符号化木ユニット
CU コーディングユニット
CVS コード化デオシーケンス
DPB デコードされた画像バッファ
DCI デコード機能情報
DRAP 従属ランダムアクセスポイント
DU デコーディングユニット
DUI デコーディングユニット情報
EG 指数関数ゴロム(exponential-Golomb)
EGk k次の指数関数ゴロム
EOB ビットストリームの末尾
EOS シーケンスの末尾
FD フィラーデータ(filler data)
FIFO 先入先出法(first-in,first-out)
FL 固定長
GBR 緑、青、赤
GCI 一般的な制約情報
GDR 漸進的なデコーディングリフレッシュ
GPM 幾何学的パーティション化モード
HEVC 高効率ビデオコーディング(Rec.ITU-T H.265|ISO/IEC 23008-2)
HRD 仮想参照(hypothetical reference)デコーダ
HSS 仮想ストリームスケジューラ
I イントラ(intra)
IBC イントラブロックコピー
IDR 瞬時デコーディングリフレッシュ
ILRP 層間参照ピクチャ
IRAP イントラランダムアクセスポイント
LFNST 低周波非分離(non-separable)変換
LPS 最低確率シンボル
LSB 最下位ビット(least significant bit)
LTRP 長期的な参照ピクチャ
LMCS クロマスケーリングによるルマ(luma)マッピング
MIP マトリクスベースのイントラ予測
MPS 最大確率シンボル
MSB 最上位ビット(most significant bit)
MTS 多重変換選択
MVP 動きベクトル予測
NAL ネットワーク抽象化層
OLS 出力層セット
OP 動作点
OPI 動作点情報
P 予測的
PH ピクチャヘッダ
POC ピクチャーオーダーカウント
PPS 画像パラメータセット
PROF オプティカルフローによる予測精緻化(refinement)
PT ピクチャタイミング
PU ピクチャユニット
QP 量子化パラメータ
RADL ランダムアクセス復号可能リ-ディング(ピクチャ)
RASL ランダムアクセススキップリ-ディング(ピクチャ)
RBSP 生バイト(raw byte)シーケンスペイロード
RGB 赤、緑、青
RPL 参照ピクチャリスト
SAO サンプル適応オフセット
SAR サンプルのアスペクト比
SEI 補足的な強化情報
SH スライスヘッダ
SLI サブピクチャレベルの情報
SODB データビットのストリング
SPS シーケンスパラメータセット
STRP 短期の参照ピクチャ
STSA ステップ毎の時間的サブレイヤアクセス
TR トランケーテッド・ライス
VBR 可変ビットレート
VCL ビデオコーディング層
VPS ビデオパラメータセット
VSEI 汎用性の高い補足拡張情報(Rec.ITU-T H.274|ISO/IEC 23002-7)
VUI ビデオのユーザビリティ情報
VVC バーサタイルビデオコーディング(Rec.ITU-T H.266|ISO/IEC 23090-3)
3.1.ビデオコーディング規格
ビデオコーディング規格は、主に、周知のITU-TおよびISO/IEC規格の開発を通じて発展してきた。ITU-TはH.261とH.263を作り出し、ISO/IECはMPEG-1とMPEG-4Visualを作り出し、そして、2つの組織は、H.262/MPEG-2 Videoと、H.264/MPEG-4 Advanced Video Coding(AVC)と、H.265/HEVC規格とを共同で作成した。H.262から、ビデオコーディング標準は、時間的予測に加えて変換符号化(transform coding)が利用されるハイブリッドビデオコーディング構造に基づいている。HEVCを越えた将来のビデオコーディング技術を探求するために、VCEGとMPEGが共同で2015年に共同ビデオ探査チーム(Joint Video Exploration Team、JVET)を設立した。それ以来、JVETによって多くの新しい方法が採用され、そして、JEM(Joint Exploration Model)と名付けられた参照ソフトウェアの中へ入れられた。その後、バーサタイルビデオコーディング(Versatile Video Coding、VVC)プロジェクトが正式に開始されたときに、JVETは、JVET(Joint Video Experts Team)に改称された。VVCは、HEVCと比較して50%のビットレート低減を目標とする、新しいコーディング標準であり、2020年7月1日に終了した第19回会合でJVETによって最終決定された。
メディアストリーミングアプリケーションは、典型的には、IP、TCP、およびHTTPのトランスポート方式に基づいており、そして、典型的には、ISOベースのメディアファイルフォーマット(ISOBMFF)といったファイルフォーマットに依存している。そうしたストリーミングシステムの一つは、HTTP(DASH)上の動的適応ストリーミングである。ISOBMFFおよびDASHでビデオフォーマットを使用するために、AVCファイルフォーマットおよびHEVCファイルフォーマットといった、ビデオフォーマットに特有のファイルフォーマット仕様が、ISOBMFFトラックと、DASH表現と、および、セグメントと、におけるビデオコンテンツのカプセル化のために必要とされるだろう。ビデオビットストリームに関する重要な情報、例えば、プロファイル、層(tier)、およびレベル、並びに、その他の多くは、コンテンツ選択の目的、例えば、ストリーミングセッションの開始時の初期化およびストリーミングセッション中のストリーム適応の両方のための適切なメディアセグメントの選択のために、ファイルフォーマットレベルのメタデータ及び/又はDASHメディアプレゼンテーション記述(MPD)として公開される(exposed)必要があるだろう。
いくつかの新しいタイプのNALユニットがVVCに導入されてきており、PH、APS、DCI、およびOPI NALユニットを含んでいる。
適応パラメータセット(adaptation parameter set、APS)は、画像の複数のスライスにより、かつ/あるいは、異なる画像のスライスによって共有され得る、画像レベル及び/又はスライスレベルの情報を伝達するが、画像間で頻繁に変化し、かつ、変異(variants)総数が多いことがあり、従って、PPSに含めるのに適切でない。APSには、3個のタイプのパラメータが含まれている。適応ループフィルタ(ALF)パラメータ、クロマスケーリングによるルミナンスマッピング(LMCS)パラメータ、および、スケーリングリストパラメータである。APSは、プレフィックスまたはサフィックスとして、関連するスライスの前または後のいずれかに、2つの異なるNALユニットタイプで搬送され得る。後者は、超低遅延シナリオにおいて役に立つことができる。例えば、エンコーダが、画像に基づいてALFパラメータを生成する前に画像のスライスを送ることを可能にし、復号順序でその後の画像により使用される。
各PUについてピクチャヘッダ(PH)構造が存在する。PHは、別個のPH NALユニットに存在するか、または、スライスヘッダ(SH)に含まれている。PUが1つのスライスだけで構成されている場合にのみ、PHはSHに含まれ得る。設計を単純化するために、CLVS内で、PHは、PH NALユニット内に全てあるか、または、SH内に全てあるかのいずれかだけであり得る。PHがSH内にある場合、CLVS内にPH NALユニットは存在しない。
DCI NALユニットは、ビットストリームレベルのPTL情報を含んでいる。DCI NALユニットは、VVCビットストリームの送信者と受信者との間のセッションネゴシエーションの最中に使用され得る1つ以上のPTLシンタックス構造を含んでいる。DCI NALユニットがVVCビットストリーム内に存在する場合、ビットストリームのCVS内の各出力レイヤセット(OLS)は、DCI NALユニット内のPTL構造の少なくとも1つで搬送されるPTL情報に準拠する。
HEVCおよびVVCの復号プロセスは、デコーダAPIを通じて、復号化動作点(decoding operating point)、すなわち、目標OLSおよび復号されるビットストリームの最上サブレイヤ、を設定するための類似の入力変数を有する。しかしながら、伝送中にビットストリームのレイヤ及び/又はサブレイヤが除去されるシナリオ、または、装置がデコーダAPIをアプリケーションに公開しないシナリオでは、デコーダが、所与のビットストリームを処理するためにデコーダの動作点について正確に知らされないことが生じる可能性がある。従って、デコーダは、ビットストリーム内の画像の特性、例えば、デコードされた画像のための適切なバッファ割り当て、並びに、個々の画像が出力されるか否かについて、結論を下すことができない。この問題に対処するために、VVCは、新たに導入された動作点情報(OPI)NALユニットを通して、ビットストリーム内のこれら2つの変数を示すモードを追加する。ビットストリーム、および、その個々のCVSの先頭のAUにおいて、OPI NALユニットは、デコードされるべきビットストリームのターゲットOLSと最上サブレイヤに関してデコーダに通知する。
3.4.1.トラックの種類
VVCビデオファイルフォーマットは、ISOBMFFファイル内のVVCビットストリームのキャリッジ(carriage)のために、以下のタイプのビデオトラックを指定する。
a)VVCトラック:
VVCトラックは、サンプルおよびサンプルエントリにNALユニットを含めることにより、そして、おそらく、VVCビットストリームの他のサブレイヤを含む他のVVCトラックを参照することにより、そして、おそらく、VVCサブピクチャトラックを参照することによって、VVCビットストリームを表す。VVCトラックがVVCサブピクチャトラックを参照する場合には、VVCベーストラックと呼ばれる。
b)VVC非VCLトラック:
ALF、LMCSを搬送するAPS、または、スケーリングリストパラメータ、および、その他の非VCL NALユニットは、VCL NALユニットを含むトラックとは別のトラックに保管され、そして、送信される。
c)VVCサブピクチャトラック:
VVCサブピクチャトラックは、次のいずれかを含んでいる。
1つ以上のVVCサブピクチャのシーケンス
矩形領域を形成する1つ以上の完全なスライスのシーケンス
VVCサブピクチャトラックのサンプルは、次のいずれかを含んでいる。
復号順に連続するISO/IEC 23090-3において指定される1つ以上の完全なサブピクチャ
矩形領域を形成し、かつ、復号順に連続するISO/IEC 23090-3において指定される1つ以上の完全なスライス
VVCサブピクチャトラックの任意のサンプルに含まれるVVCサブピクチャまたはスライスは、復号順で連続している。
注:VVC非VCLトラックおよびVVCサブピクチャトラックは、以下のようにストリーミングアプリケーションにおいてVVCビデオの最適な配送(delivery)を可能にする。これらのトラックは、それぞれ独自のDASH表現で搬送され得る。そして、トラックのサブセットの復号化とレンダリングのために、VVCサブピクチャトラックのサブセットを含むDASH表現、並びに、非VCLトラックを含むDASH表現が、セグメント毎に、クライアントによって要求され得る。このように、APSおよび他の非VCL NALユニットの冗長な伝送が回避され得る。
3.4.2 VVCエレメンタリストリーム構造
VVCコンテンツを保管するために、3個のタイプのエレメンタリストリーム(elementary streams)が定義されている。
ビデオエレメンタリストリーム(Video elementary stream)、パラメータセットを含まないものであり、全てのパラメータセットがサンプルエントリ(sample entry)に保管される。
ビデオ及びパラメータセットエレメンタリストリーム(Video and parameter set elementary stream)、パラメータセットを含み得るものであり、そして、また、それらのサンプルエントリに保管されたパラメータセットも有し得る。
非VCL非エレメンタリストリーム(Non-VCL elementary stream)、ビデオトラックにおいて搬送されるエレメンタリストリームと同期した非VCL NALユニットを含むもの。
注:VVC非VCLトラックは、サンプルエントリにパラメータセットを含んでいない。
3.4.3 デコーダ構成情報サンプルグループ
3.4.3.1 定義
このサンプルグループのサンプルグループ記述エントリ(description entry)は、DCI NALユニットを含んでいる。同じデコーダ構成情報サンプルグループ(Decoder Configuration Information sample group)記述エントリにマップされた全てのサンプルは、同じVVCビットストリームに属する。
このサンプルグループは、VVCトラック内の異なるサンプルエントリに同じDCI NALユニットが使用されるか否か、すなわち、異なるサンプルエントリに属するサンプルが同じVVCビットストリームに属するか否か、を示す。2つのサンプルエントリのサンプルが同じデコーダ構成情報サンプルグループ記述エントリにマップされている場合、プレーヤは、デコーダの再初期化することなく、サンプルエントリを切り替えることができる。
いずれかのDCI NALユニットが、いずれかのサンプルエントリまたはインバンドに存在する場合、それは、デコーダ構成情報サンプルグループに含まれるDCI NALユニットと厳密に同一である。
3.4.3.2 シンタックス
Class DecoderConfigurationInformation extends VisualSampleGroupEntry ('dcfi') {
unsigned int(16) dciNalUnitLength;
bit(8*NalUnitLength) dciNalUnit;
}
3.4.3.3 セマンティクス
dciNalUnitLengthは、DCI NALユニットのバイト長を示す。
dciNalUnitは、ISO/IEC 23090-3に規定されているDCI NALユニットを含む。
PH、APS、DCI、およびOPI NALユニットのシグナリングに関するVVCビデオファイルフォーマットの最新設計は、以下の問題を有している。
1)VVCベーストラックおよびVVC非VCLトラックの両方は、VCL NALユニットを含まない。しかしながら、VVC非VCLトラックの現在の定義は、また、VVCベーストラックにも適用される。さらに、現在の定義では、VVC非VCLトラックは常にAPS NALユニットを含んでいる。しかしながら、このことは、非VCL NALユニットが、画像ヘッダNALユニット、および、おそらく、APS NALユニットを除く、他の非VCL NALユニットを含むことを許容しないだろう。
そうしたVVC非VCLトラックを許容することは、異なるサブピクチャがAPSの異なるセットを使用している場合、サブピクチャトラックの遅延帯域化(late-banding)のために、抽出可能なサブピクチャベースの単一層ビットストリームをファイルに最適に保管することを可能にするだろう。例えば、1つのPHトラック(VVCベーストラックと同じ情報を含むが、非VCLトラックとして)、複数のAPSトラック(VC非VCLトラックとして)、および、それぞれサブピクチャシーケンスを含んでいる複数のVVCサブピクチャトラックを有することによる。
2)APS NALユニットは、全てが、1つのVVC非VCLトラック内、または、VVCトラック内のいずれかに保管される。別の言葉で言えば、APS NALユニットを1つ以上のトラックに保管することはできない。このことは、LMCSパラメータを含むAPS NALユニット(すなわち、LMCS APS)、または、スケーリングリスト(SL APS)パラメータを含むAPS NALユニット(すなわち、SL APS)に対して機能するが、ALFパラメータを含むAPS NALユニット(すなわち、ALF APS)に対しては理想的ではない。異なるVVCサブピクチャトラックはALF APSの異なるセットを使用し得るので、複数のVVC非VCLトラックがVVCビットストリームに対してALF APSを搬送できるようにすることが望ましい。3)DCI NALユニットは、ビデオエレメンタリストリームおよびビデオとパラメータセットエレメンタリストリームの定義では考慮されない。従って、ビデオエレメンタリストリームは、パラメータセットを含まないが、DCI NALユニットを含むことがある。
4)非VCLエレメンタリストリームの定義は、非VCLエレメンタリストリームにVCL NALユニットを含む可能性を除外しない。
5)デコーダ構成情報サンプルグループは、DCI NALユニットのシグナリングのためのメカニズムを提供する。しかしながら、以下の問題が存在している。
a.最も一般的なユースケースでは、トラックの全てのサンプルは、同じビットストリームに属するだろう(または、ビットストリームの数にかかわらず、同じDCIを共有する)。そうした場合について、サンプルグループ・シグナリングを通して適用可能なDCIを探し出すことは複雑である。
b.同じデコーダ構成情報サンプルグループ記述エントリにマップされた全てのサンプルは、同じVVCビットストリームに属すると言われる。しかしながら、このことは、複数のVVCビットストリームに属しているが(例えば、EOB NALユニットによって決定される)、同一のトラック内のサンプルが、それらが可能であっても、同じDCI NALユニットを共有することを許容しない。
6)OPI NALユニットは、サンプルエントリ記述に含めることは許容されない。しかしながら、多くのケースにおいて、OPI NALユニットは、VVCビットストリーム中に存在する場合、パラメータセットと同様に扱われるべきであり、従って、それらは、サンプルエントリ記述に含まめることが許容されるべきである。
上記および他の問題を解決するために、以下にまとめるように方法が開示される。アイテムは、一般的な概念を説明するための例示として考慮されるべきであり、そして、狭義に解釈されるべきではない。さらに、これらのアイテムは、個別に、または任意の方法で組み合わせて適用することができる。
1)問題1および2を解決するために、1つ以上のアイテムが以下に提案される。
a.VVC非VCLトラックは、非VCL NALユニットのみを含むトラックとして定義され、かつ、「vvcN」トラックリファレンスを通じてVVCトラックによって参照される。
b.VVC非VCLトラックは、VCL NALユニットを含むトラックとは別のトラックに保管され、かつ、送信される、他の非VCL NALユニットを有し又は有さない、ALF、LMCS、または、スケーリングリストのパラメータを搬送する、APSを含み得ること、が指定されている。
c.VVC非VCLトラックは、VCL NALユニットを含むトラックとは別のトラックに保管され、かつ、送信される、APS NALユニットを有し又は有さない、および、他の非VCL NALユニットを有し又は有さない、画像ヘッダNALユニットを含み得ること、も指定されている。
d.ビデオストリームのピクチャヘッダNALユニットは、VVCトラックのサンプルまたはVVC非VCLトラックのサンプルのいずれかに保管され得るが、両方が同時には保管されないこと、が指定されている。
2)問題3を解決するために、1つ以上のアイテムが以下に提案される。
a.ビデオエレメンタリストリームは、VCL NALユニットを含み、そして、あらゆるパラメータセット、DCI、またはOPI NALユニットも含まないエレメンタリストリームとして定義される。全てのパラメータセット、DCI、およびOPI NALユニットは、サンプルエントリに保管されている。
i.代替的に、ビデオエレメンタリストリームは、VCL NALユニットを含み、そして、あらゆるパラメータセットまたはDCI NALユニットも含まないエレメンタリストリームとして定義される。全てのパラメータセットおよびDCI NALユニットは、サンプルエントリに保管されている。
b.DCI NALユニットをパラメータセットと全く同じに取り扱う。つまり、DCI NALユニットは、ビデオトラックのサンプルエントリ内のみにあり得るか(例えば、サンプルエントリタイプ名が「vvc1」の場合)、または、ビデオトラックのサンプルおよびサンプルエントリのいずれか又は両方にあり得る(例えば、サンプルエントリタイプ名が「vvi1」の場合)。
3)問題4を解決するために、非VCLエレメンタリストリームは非VCL NALユニットのみを含むエレメンタリストリームであり、そして、これらの非VCL NALユニットはビデオトラックで搬送されるエレメンタリストリームと同期されていること、が指定されている。
4)問題5を解決するために、1つ以上のアイテムが以下に提案される。
a.トラックの全てのサンプルが同じビットストリームに属する(または、ビットストリームの数に関係なく同じDCIを共有する)ケースについて、DCI NALユニットは、トラックレベルボックスで信号化され得る。例えば、トラックレベル・ヘッダボックス、トラックレベルメタボックス、または、別のトラックレベルボックスである。
b.複数のVVCビットストリーム(例えば、EOB NALユニットによって決定される)に属するが、同一トラック内のサンプルが、同一のデコーダ構成情報サンプルグループに属すること、そして、その結果、同一のデコーダ構成情報サンプルグループ記述エントリを共有することを許容する。
5)問題6を解決するために、OPI NALユニットは、例えば、デコーダ構成レコードの非VCL NALユニットアレイの1つとして、サンプルエントリ記述に含めることが許容される。
a.代替的に、OPI NALユニットをパラメータセットと全く同じに取り扱う。つまり、OPI NALユニットは、ビデオトラックのサンプルエントリ内のみにあり得るか(例えば、サンプルエントリタイプ名が「vvc1」の場合)、または、ビデオトラックのサンプルおよびサンプルエントリのいずれか又は両方にあり得る(例えば、サンプルエントリタイプ名が「vvi1」の場合)。
6.実施形態
以下は、上記セクション5で要約した本発明の態様に係るいくつかの例示的な実施形態であり、VVCビデオファイルフォーマットの標準仕様に適用することができる。変更されたテキストは、最新の仕様書草案(draft specification)に基づいている。追加または変更された最も関連する部分は太字のイタリック体のテキストで示され(ここでは下線)、削除された部分の一部はオープンおよびクローズの二重括弧(例えば、[[ ]])で示されており、削除されたテキストは削除または消されたテキストを示す二重括弧の間にある。本質的に編集上の変更であり、従って、強調されない他の変更も存在し得る。
6.1 第1実施形態
本実施形態は、アイテム1に関する。
6.1.1 トラックの種類
この仕様は、VVCビットストリームのキャリッジ(carriage)についてビデオトラックの以下のタイプを規定する。
a)VVCトラック:
VVCトラックは、VVCビットストリームを表している。サンプル及び/又はサンプルエンティティ内にNALユニットを含めることにより、そして、おそらく、「vopi」および「linf」サンプルグループを通じて、または、「opeg」エンティティグループを通して、VVCビットストリームの他のレイヤ及び/又はサブレイヤを含む他のVVCトラックを関連付けることにより、そして、おそらく、VVCサブピクチャトラックを参照することによるものである。
VVCトラックがVVCサブピクチャトラックを参照する場合、それは、また、VVCベーストラックとも呼ばれる。VVCベーストラックは、VCL NALユニットを含んではならず、かつ、「vvcN」トラックリファレンスを通じてVVCトラックによって参照されてはならない。
b)VVC非VCLトラック:
VVC非VCLトラックは、非VCL NALユニットのみを含むトラックであり、そして、「vvcN」トラックリファレンスを通じてVVCトラックによって参照される。
VVC非VCLトラックは、VCL NALユニットを含むトラックとは別のトラックに保管され、かつ、送信される、他の非VCL NALユニットを有し又は有さない、ALF、LMCS、または、スケーリングリストのパラメータを搬送する、APSを含み得る。
VVC非VCLトラックは、VCL NALユニットを含むトラックとは別のトラックに保管され、かつ、送信される、APS NALユニットを有し又は有さない、および、他の非VCL NALユニットを有し又は有さない、画像ヘッダNALユニットを含み得る。
c)VVCサブピクチャトラック:
VVCサブピクチャトラックは、以下のいずれかを含んでいる。
1つ以上のVVCサブピクチャのシーケンス
矩形領域を形成している1つ以上の完全なスライスのシーケンス
VVCサブピクチャトラックのサンプルは、以下のいずれかを含んでいる。
復号順に連続するISO/IEC 23090-3で既定されている1つ以上の完全なサブピクチャ
矩形領域を形成し、かつ、復号順に連続するISO/IEC 23090-3で規定されている1つ以上の完全なスライス
VVCサブピクチャトラックの任意のサンプルに含まれるVVCサブピクチャまたはスライスは、復号順で連続している。
注:VVC非VCLトラックおよびVVCサブピクチャトラックは、以下のようにストリーミングアプリケーションにおいてVVCビデオの最適な配送(delivery)を可能にする。これらのトラックは、それぞれ独自のDASH表現で搬送され得る。そして、トラックのサブセットの復号化とレンダリングのために、VVCサブピクチャトラックのサブセットを含むDASH表現、並びに、非VCLトラックを含むDASH表現が、セグメント毎に、クライアントによって要求され得る。このように、APSおよび他の非VCL NALユニットの冗長な伝送が回避され得る。そして、不必要なサブピクチャの送信も、また、回避され得る。
6.2 第2実施形態
この実施形態は、アイテム4.bに関する。
6.2.1 デコーダ[[構成]]機能情報サンプルグループ
6.2.1.1 定義
このサンプルグループのサンプルグループ記述エントリは、DCI NALユニットを含んでいる。[[同じデコーダ構成情報サンプルグループ記述エントリにマップされた全てのサンプルは、同じVVCビットストリームに属する。]]
このサンプルグループは、VVCトラック内の異なるサンプルエントリに同じDCI NALユニット[s]が使用されているか否かを示す[[すなわち、異なるサンプルエントリに属するサンプルが同じVVCビットストリームに属するか否か]]。2つのサンプルエントリのサンプルが同じデコーダ構成情報サンプルグループ記述エントリにマップされている場合、プレーヤはデコーダの再初期化なしにサンプルエントリを切り替えることができる。
任意のDCI NALユニットが任意のサンプル登録またはインバンドの中に存在する場合、それは対応するデコーダ構成情報サンプルグループエントリの中に含まれるDCI NALユニットと全く同じである。
6.2.1.2 シンタックス
Class DecoderConfigurationInformation extends VisualSampleGroupEntry ('dcfi') {
unsigned int(16) dciNalUnit;
bit(8*NalUnitLength) dciNalUnit;
}
6.2.1.3 セマンティクス
dciNalUnitLengthは、DCI NALユニットのバイト長を示す。
dciNalUnitは、ISO/IEC 23090-3に規定されているDCI NALユニットを含む。
6.3 第3実施形態
この実施形態は、アイテム5に関する。
6.3.1 VVCデコーダ構成レコードの定義
この項(subclause)は、ISO/IEC 23090-3ビデオコンテンツについてデコーダ構成情報を規定する。
このレコードは、各サンプル内で使用される長さフィールドのサイズを含み、含まれるNALユニットの長さ、並びに、サンプルエントリに保存される場合、パラメータセット、DCI、OPI、およびSEI NALユニットを示す。このレコードは外部で囲まれ(framed)ている(サイズは、それを含む構造体によって提供される)。
このレコードは、バージョンフィールドを含んでいる。本仕様のこのバージョンは、このレコードのバージョン1を定義する。レコードに対する互換性のない変更は、バージョン番号の変更で示される。読者(readers)は、バージョン番号が認識されない場合、このレコードまたは適用されるストリームのデコードを試みてはならない。
このレコードに対する互換性のある拡張は、構成バージョンコードを変更しない。読者は、理解するデータの定義を超える認識されないデータを無視するように用意すべきである。
VvcPtlRecordは、トラックがVVCビットストリームをネイティブに、または、「subp」トラック参照の解決を通じて含んでいる場合、デコーダ構成レコードに存在する。そして、この場合、VVCビットストリームについて設定された特定の出力レイヤは、フィールドoutput_layer_set_idxで示される。ptl_present_flagがトラックのデコーダ構成レコードでゼロに等しい場合、そのトラックは「oref」トラック参照を有する。
・・・
非VCL NALユニットの初期化を進めるためのアレイのセットが存在する。NALユニットタイプは、DCI、OPI、VPS、SPS、PPS、プレフィックスAPS、および、プレフィックスSEI NALユニットのみを示すように制限されている。ISO/IEC 23090-3及びこの仕様でリザーブされているNALユニットタイプは、将来に定義を取得し得るものであり、そして、読者は、NALユニットタイプのリザーブされた又は許可されていない値を伴うアレイ無視すべきである。
注2:この「耐性(“tolerant”)」行為(behavior)は、エラーが起きないように設計されており、将来の仕様における、これらのアレイに対する後方互換性(backward-compatible)のある拡張の可能性を許容している。
注3:サンプルエントリで搬送されるNALユニットは、サンプルエントリを参照する最初のサンプルから再構成されたアクセスユニットにおいて、AUDおよび(もしあれば)OPI NALユニットの直後に、または、そうでなければ最初にに含まれる。
アレイは、DCI、OPI、VPS、SPS、PPS、プレフィックスAPS、プレフィックスSEIの順であることが推奨される。
・・・
6.3.2 VVCデコーダ構成レコードのセマンティクス
・・・
numArraysは、示されたタイプのNALユニットのアレイの数を示す。
array_completenessは、1に等しい場合、所与のタイプの全てのNALユニットが以降のアレイ内にあり、かつ、ストリーム内にないことを示しす。0に等しい場合、示されたタイプの追加的なNALユニットがストリーム内にあり得ることを示す。[[デフォルトおよび]]許容される値は、サンプルエントリ名によって制約される。
NAL_unit_typeは、以降のアレイ内のNALユニットのタイプを示す(全てがそのタイである)。ISO/IEC 23090-3で定義された値をとる。DCI、OPI、VPS、SPS、PPS、プレフィックスAPS、プレフィックスSEI[または、サフィックスSEI]]NALユニットを示す値のうち1つをとるように制限されている。
numNalusは、この構成レコードが適用されるストリームの構成レコード内に含まれる、指示されたタイプのNALユニットの数を示す。SEIアレイは、「宣言的(declarative)」性質のSEIメッセージ、すなわち、ストリーム全体に関する情報を提供するもののみを含むものとする。そうしたSEIの例は、ユーザデータSEIであり得る。
nalUnitLengthは、NALユニットのバイト長を示す。
nalUnitは、ISO/IEC 23090-3に規定されように、DCI、OPI、VPS、SPS、PPS、APS、または宣言的SEI NALユニットを含む。
Claims (15)
- ビジュアルメディアデータを処理する方法であって、
フォーマットルールに従って、ビジュアルメディアファイルとビジュアルメディアデータのビットストリームとの間の変換を実行するステップ、を含み、
前記フォーマットルールは、デコード機能情報ネットワーク抽象化層ユニットが、前記ビジュアルメディアファイル内のビデオトラックのサンプルエントリ、または、前記ビデオトラックのサンプルおよび前記ビジュアルメディアファイル内のビデオトラックのサンプルエントリのいずれに含まれるか否かを、サンプルエントリのタイプが決定することを指定する、
方法。 - 前記フォーマットルールは、前記サンプルエントリのタイプがvvc1であることに応答して、デコード機能情報ネットワーク抽象化層ユニットが、前記ビデオトラックのサンプルエントリに含まれることを指定する、
請求項1に記載の方法。 - 前記フォーマットルールは、前記サンプルエントリのタイプがvvi1であることに応答して、デコード機能情報ネットワーク抽象化層ユニットが、前記ビデオトラックのサンプルおよび前記ビデオトラックのサンプルエントリに含まれることを指定する、
請求項1に記載の方法。 - 前記フォーマットルールは、前記ビジュアルメディアファイル内のビデオエレメンタリストリームがビデオコーディング層ネットワーク抽象化層ユニットを含むことを規定し、
前記フォーマットルールは、前記ビジュアルメディアファイル内のビデオ基本ストリームが、パラメータセットまたはデコード機能情報ネットワーク抽象化ユニットを含むことを禁止されることを指定し、かつ、
前記フォーマットルールは、前記ビジュアルメディアファイル内のサンプルエントリが、前記パラメータセットおよび前記デコード機能情報ネットワーク抽象化ユニットを保管することを指定する、
請求項1乃至3いずれか一項に記載の方法。 - 前記フォーマットルールは、前記ビジュアルメディアファイル内のビデオエレメンタリストリームが、前記パラメータセット、前記デコード機能情報ネットワーク抽象化ユニット、または、動作点情報ネットワーク抽象化ユニットを含むことを禁止されることを指定し、かつ、
前記フォーマットルールは、前記ビジュアルメディアファイル内のサンプルエントリが、前記パラメータセット、前記デコード機能情報ネットワーク抽象化ユニット、および、前記動作点情報ネットワーク抽象化ユニットを保管することを指定する、
請求項4に記載の方法。 - 前記フォーマットルールは、複数のバーサタイルビデオコーディング・ビットストリームに属するサンプルに応答して、かつ、同じトラックに含まれるサンプルに応答して、前記ビジュアルメディアファイル内のサンプルが、同じデコード機能情報サンプルグループに属することを許容することを指定し、かつ、
前記フォーマットルールは、前記同じデコード機能情報サンプルグループに属する全てのサンプルが、同じデコード機能情報サンプルグループ記述エントリを共有することを指定する、
請求項1乃至5いずれか一項に記載の方法。 - 前記フォーマットルールは、同一ビットストリームに属するトラックの全てのサンプルに応答して、または、多数のビットストリームにかかわらず同じデコード機能情報を共有する全てのサンプルに応答して、前記デコード機能情報ネットワーク抽象化層ユニットが、前記ビジュアルメディアファイル内のトラックレベルボックスに示されることを指定する、
請求項6に記載の方法。 - 前記トラックレベルボックスは、トラックヘッダボックス、トラックレベルメタボックス、または、別のトラックレベルボックスである、
請求項7に記載の方法。 - 前記フォーマットルールは、動作点情報ネットワーク抽象化層ユニットが、デコーダ構成レコード内の複数の非ビデオコーディング層ネットワーク抽象化層アレイの1つとして、サンプルエントリ記述内の前記ビジュアルメディアファイルに含まれることを許容することを指定する、
請求項1乃至8いずれか一項に記載の方法。 - 前記フォーマットルールは、第2サンプルエントリの第2タイプが、
動作点情報ネットワーク抽象化層ユニットが、
(1)前記ビジュアルメディアファイル内のビデオトラックの前記第2サンプルエントリ、または、
(2)前記ビジュアルメディアファイル内のビデオトラックのサンプル又は前記ビジュアルメディアファイル内のビデオトラックの前記第2サンプルエントリのいずれか、もしくは両方、
のいずれに含まれるか否かを、決定することを指定する、
請求項1乃至9いずれか一項に記載の方法。 - 前記変換は、前記ビジュアルメディアファイルを生成すること、および、前記ビットストリームを、前記フォーマットルールに従って、前記ビジュアルメディアファイルに保管すること、を含む、
請求項1乃至10いずれか一項に記載の方法。 - 前記変換は、前記ビットストリームを再構成するために、前記フォーマットルールに従って、前記ビジュアルメディアファイルを解析すること、を含む、
請求項1乃至10いずれか一項に記載の方法。 - 前記ビジュアルメディアファイルは、バーサタイルビデオコーディング(VVC)によって処理され、かつ、前記ビデオトラックは、VVCトラックである、
請求項1乃至12いずれか一項に記載の方法。 - プロセッサと、命令が保管された非一時的メモリとを含む、ビジュアルメディアデータを処理する装置であって、
前記命令が前記プロセッサによって実行されると、前記プロセッサに、請求項1乃至13のいずれか一項に記載の方法を実施させる、
装置。 - 命令を保管している非一時的コンピュータ読取り可能記憶媒体であって、
前記命令は、プロセッサに、請求項1乃至13いずれか一項に記載の方法を実施させる、
非一時的コンピュータ読取り可能記憶媒体。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202063079869P | 2020-09-17 | 2020-09-17 | |
US63/079,869 | 2020-09-17 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022050370A true JP2022050370A (ja) | 2022-03-30 |
JP7222043B2 JP7222043B2 (ja) | 2023-02-14 |
Family
ID=77801616
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021151970A Active JP7222043B2 (ja) | 2020-09-17 | 2021-09-17 | ビデオコーディングにおけるデコード機能情報のストレージ |
JP2021151922A Active JP7223088B2 (ja) | 2020-09-17 | 2021-09-17 | バーサタイルビデオコーディングのトラック符号化 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021151922A Active JP7223088B2 (ja) | 2020-09-17 | 2021-09-17 | バーサタイルビデオコーディングのトラック符号化 |
Country Status (5)
Country | Link |
---|---|
US (2) | US11711518B2 (ja) |
EP (2) | EP3972277A1 (ja) |
JP (2) | JP7222043B2 (ja) |
KR (2) | KR20220037393A (ja) |
CN (2) | CN114205610A (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11711518B2 (en) | 2020-09-17 | 2023-07-25 | Lemon Inc. | Decoding capability information storage in video coding |
US11611752B2 (en) | 2020-10-07 | 2023-03-21 | Lemon Inc. | Adaptation parameter set storage in video coding |
WO2024053954A1 (ko) * | 2022-09-05 | 2024-03-14 | 엘지전자 주식회사 | 종속 랜덤 액세스 포인트 픽처에 기반한 영상 부호화/복호화 방법, 장치 및 비트스트림 전송 방법 |
CN115474063B (zh) * | 2022-10-27 | 2023-01-10 | 中诚华隆计算机技术有限公司 | 一种流媒体后端解码方法、装置及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015511437A (ja) * | 2012-01-30 | 2015-04-16 | クゥアルコム・インコーポレイテッドQualcomm Incorporated | ビデオを符号化しビデオコンテンツを記憶する方法 |
JP2018511208A (ja) * | 2015-02-11 | 2018-04-19 | クゥアルコム・インコーポレイテッドQualcomm Incorporated | 階層化されたビデオファイルフォーマットにおけるサンプルエントリー及び動作点信号伝達の設計 |
JP2018524891A (ja) * | 2015-06-18 | 2018-08-30 | クゥアルコム・インコーポレイテッドQualcomm Incorporated | 階層化hevcファイルフォーマットでのトラックおよびオペレーティングポイントシグナリングの設計 |
Family Cites Families (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8365060B2 (en) | 2006-08-24 | 2013-01-29 | Nokia Corporation | System and method for indicating track relationships in media files |
EP2147558A2 (en) | 2007-04-17 | 2010-01-27 | Nokia Corporation | Feedback based scalable video coding |
KR101115547B1 (ko) | 2007-04-24 | 2012-03-05 | 노키아 코포레이션 | 미디어 파일들에서의 다중 디코딩 시각들을 시그날링 |
US9584792B2 (en) | 2013-01-04 | 2017-02-28 | Qualcomm Incorporated | Indication of current view dependency on reference view in multiview coding file format |
US9621919B2 (en) | 2013-10-23 | 2017-04-11 | Qualcomm Incorporated | Multi-layer video file format designs |
CN105900401B (zh) | 2014-01-07 | 2020-03-06 | 佳能株式会社 | 用于对层间依赖性进行编码的方法、装置和计算机程序 |
GB2522014A (en) | 2014-01-07 | 2015-07-15 | Canon Kk | Method, device, and computer program for encoding inter-layer dependencies in encapsulating multi-layer partitioned timed media data |
WO2016002496A1 (ja) | 2014-06-30 | 2016-01-07 | ソニー株式会社 | 情報処理装置および方法 |
US9936128B2 (en) | 2015-05-20 | 2018-04-03 | Google Llc | Automatic detection of panoramic gestures |
US10129527B2 (en) | 2015-07-16 | 2018-11-13 | Google Llc | Camera pose estimation for mobile devices |
US20170111642A1 (en) | 2015-10-14 | 2017-04-20 | Qualcomm Incorporated | Support of random access and switching of layers and sub-layers in multi-layer video files |
US10306253B2 (en) | 2015-10-14 | 2019-05-28 | Qualcomm Incorporated | Signaling of parameter sets in files of multi-layer bitstreams |
US10034010B2 (en) | 2015-10-14 | 2018-07-24 | Qualcomm Incorporated | Alignment of operation point sample group in multi-layer bitstreams file format |
US10623755B2 (en) | 2016-05-23 | 2020-04-14 | Qualcomm Incorporated | End of sequence and end of bitstream NAL units in separate file tracks |
US10652630B2 (en) | 2016-05-24 | 2020-05-12 | Qualcomm Incorporated | Sample entries and random access |
US10917564B2 (en) | 2016-10-12 | 2021-02-09 | Qualcomm Incorporated | Systems and methods of generating and processing files for partial decoding and most interested regions |
US11290755B2 (en) | 2017-01-10 | 2022-03-29 | Qualcomm Incorporated | Signaling data for prefetching support for streaming media data |
US10805650B2 (en) | 2017-03-27 | 2020-10-13 | Qualcomm Incorporated | Signaling important video information in network video streaming using mime type parameters |
US10944977B2 (en) | 2018-04-03 | 2021-03-09 | Mediatek Singapore Pte. Ltd. | Methods and apparatus for encoding and decoding overlay compositions |
WO2020097232A1 (en) | 2018-11-07 | 2020-05-14 | Futurewei Technologies, Inc. | Header parameter set for video coding |
BR112021016925A2 (pt) | 2019-02-27 | 2021-11-03 | Huawei Tech Co Ltd | Codificador, decodificador e métodos correspondentes |
WO2020179713A1 (en) | 2019-03-06 | 2020-09-10 | Sharp Kabushiki Kaisha | Systems and methods for signaling tile group information in video coding |
US11190793B2 (en) | 2019-07-09 | 2021-11-30 | Qualcomm Incorporated | Memory constraint for adaptation parameter sets for video coding |
BR112022005413A2 (pt) | 2019-09-24 | 2022-06-21 | Huawei Tech Co Ltd | Sinalização de cabeçalho de imagem em codificação de vídeo |
IL296930A (en) | 2020-03-31 | 2022-12-01 | Ericsson Telefon Ab L M | Video processing using syntax elements |
US11711518B2 (en) | 2020-09-17 | 2023-07-25 | Lemon Inc. | Decoding capability information storage in video coding |
US11611752B2 (en) | 2020-10-07 | 2023-03-21 | Lemon Inc. | Adaptation parameter set storage in video coding |
-
2021
- 2021-09-15 US US17/475,774 patent/US11711518B2/en active Active
- 2021-09-15 US US17/475,719 patent/US11750815B2/en active Active
- 2021-09-16 EP EP21197208.8A patent/EP3972277A1/en active Pending
- 2021-09-16 EP EP21197206.2A patent/EP3972276A1/en active Pending
- 2021-09-17 CN CN202111095947.1A patent/CN114205610A/zh active Pending
- 2021-09-17 CN CN202111090652.5A patent/CN114205599A/zh active Pending
- 2021-09-17 KR KR1020210124850A patent/KR20220037393A/ko active Search and Examination
- 2021-09-17 JP JP2021151970A patent/JP7222043B2/ja active Active
- 2021-09-17 KR KR1020210124840A patent/KR20220037391A/ko active Search and Examination
- 2021-09-17 JP JP2021151922A patent/JP7223088B2/ja active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015511437A (ja) * | 2012-01-30 | 2015-04-16 | クゥアルコム・インコーポレイテッドQualcomm Incorporated | ビデオを符号化しビデオコンテンツを記憶する方法 |
JP2018511208A (ja) * | 2015-02-11 | 2018-04-19 | クゥアルコム・インコーポレイテッドQualcomm Incorporated | 階層化されたビデオファイルフォーマットにおけるサンプルエントリー及び動作点信号伝達の設計 |
JP2018524891A (ja) * | 2015-06-18 | 2018-08-30 | クゥアルコム・インコーポレイテッドQualcomm Incorporated | 階層化hevcファイルフォーマットでのトラックおよびオペレーティングポイントシグナリングの設計 |
Non-Patent Citations (1)
Title |
---|
"Information technology - Coding of audio-visual objects - Part 15: Carriage of network abstraction l", ISO文書(SC29) DRAFT AMENDMENT ISO/IEC 14496-15:2019 DAM 2, JPN7022005926, 28 December 2020 (2020-12-28), pages 1 - 9, ISSN: 0004955902 * |
Also Published As
Publication number | Publication date |
---|---|
US20220086446A1 (en) | 2022-03-17 |
CN114205610A (zh) | 2022-03-18 |
CN114205599A (zh) | 2022-03-18 |
KR20220037393A (ko) | 2022-03-24 |
JP7222043B2 (ja) | 2023-02-14 |
US20220086430A1 (en) | 2022-03-17 |
JP7223088B2 (ja) | 2023-02-15 |
EP3972277A1 (en) | 2022-03-23 |
EP3972276A1 (en) | 2022-03-23 |
JP2022050366A (ja) | 2022-03-30 |
KR20220037391A (ko) | 2022-03-24 |
US11711518B2 (en) | 2023-07-25 |
US11750815B2 (en) | 2023-09-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7433280B2 (ja) | ビデオストリームにおける従属ランダムアクセスポイント指示 | |
JP7222043B2 (ja) | ビデオコーディングにおけるデコード機能情報のストレージ | |
JP2022050368A (ja) | コーディングされたビデオにおけるデコーダ・コンフィギュレーション・レコード | |
JP7202429B2 (ja) | 符号化映像におけるクロマフォーマット及びビット深度のインジケーション | |
US11611752B2 (en) | Adaptation parameter set storage in video coding | |
KR20230129008A (ko) | 교차 랜덤 액세스 포인트 시그널링 향상 | |
JP7418489B2 (ja) | サブピクチャエンティティグループに対するレベルインジケータ | |
WO2022089396A1 (en) | Decoder configuration information in vvc video coding | |
KR20230127982A (ko) | 교차 랜덤 액세스 포인트 샘플 그룹 | |
CN115428438A (zh) | 视频编解码中的水平信息 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20211115 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20221202 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230104 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230202 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7222043 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |