JP7472292B2 - ビデオ符号化およびビデオ復号のための方法、装置、およびコンピュータプログラム製品 - Google Patents
ビデオ符号化およびビデオ復号のための方法、装置、およびコンピュータプログラム製品 Download PDFInfo
- Publication number
- JP7472292B2 JP7472292B2 JP2022540734A JP2022540734A JP7472292B2 JP 7472292 B2 JP7472292 B2 JP 7472292B2 JP 2022540734 A JP2022540734 A JP 2022540734A JP 2022540734 A JP2022540734 A JP 2022540734A JP 7472292 B2 JP7472292 B2 JP 7472292B2
- Authority
- JP
- Japan
- Prior art keywords
- picture
- sub
- track
- sample
- group
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title description 56
- 238000004590 computer program Methods 0.000 title description 19
- 230000002265 prevention Effects 0.000 claims description 15
- 238000013507 mapping Methods 0.000 claims description 11
- 238000012986 modification Methods 0.000 claims description 7
- 230000004048 modification Effects 0.000 claims description 7
- 239000000523 sample Substances 0.000 description 271
- 239000010410 layer Substances 0.000 description 79
- 230000033001 locomotion Effects 0.000 description 53
- 239000013598 vector Substances 0.000 description 29
- 230000008569 process Effects 0.000 description 28
- 239000012634 fragment Substances 0.000 description 22
- 239000000872 buffer Substances 0.000 description 21
- 230000002123 temporal effect Effects 0.000 description 19
- 238000012545 processing Methods 0.000 description 15
- 238000001914 filtration Methods 0.000 description 14
- 230000000875 corresponding effect Effects 0.000 description 13
- 239000000203 mixture Substances 0.000 description 13
- 241000023320 Luma <angiosperm> Species 0.000 description 12
- 238000000605 extraction Methods 0.000 description 12
- OSWPMRLSEDHDFF-UHFFFAOYSA-N methyl salicylate Chemical compound COC(=O)C1=CC=CC=C1O OSWPMRLSEDHDFF-UHFFFAOYSA-N 0.000 description 11
- 238000000638 solvent extraction Methods 0.000 description 11
- 230000003139 buffering effect Effects 0.000 description 10
- 238000005070 sampling Methods 0.000 description 10
- 238000003491 array Methods 0.000 description 9
- 230000005540 biological transmission Effects 0.000 description 8
- 230000001419 dependent effect Effects 0.000 description 8
- 230000006870 function Effects 0.000 description 8
- AWSBQWZZLBPUQH-UHFFFAOYSA-N mdat Chemical compound C1=C2CC(N)CCC2=CC2=C1OCO2 AWSBQWZZLBPUQH-UHFFFAOYSA-N 0.000 description 8
- 238000013139 quantization Methods 0.000 description 8
- 238000013459 approach Methods 0.000 description 6
- 238000012856 packing Methods 0.000 description 6
- 230000007246 mechanism Effects 0.000 description 5
- 238000005192 partition Methods 0.000 description 5
- 230000000750 progressive effect Effects 0.000 description 5
- KUVIULQEHSCUHY-XYWKZLDCSA-N Beclometasone Chemical compound C1CC2=CC(=O)C=C[C@]2(C)[C@]2(Cl)[C@@H]1[C@@H]1C[C@H](C)[C@@](C(=O)COC(=O)CC)(OC(=O)CC)[C@@]1(C)C[C@@H]2O KUVIULQEHSCUHY-XYWKZLDCSA-N 0.000 description 4
- 230000000295 complement effect Effects 0.000 description 4
- 239000000284 extract Substances 0.000 description 4
- 101150008563 spir gene Proteins 0.000 description 4
- 230000006978 adaptation Effects 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 3
- 238000013475 authorization Methods 0.000 description 3
- 239000011229 interlayer Substances 0.000 description 3
- 230000007774 longterm Effects 0.000 description 3
- 230000011664 signaling Effects 0.000 description 3
- 230000003068 static effect Effects 0.000 description 3
- 230000001131 transforming effect Effects 0.000 description 3
- 108091000069 Cystinyl Aminopeptidase Proteins 0.000 description 2
- 102100020872 Leucyl-cystinyl aminopeptidase Human genes 0.000 description 2
- 238000012952 Resampling Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000006073 displacement reaction Methods 0.000 description 2
- 229920006395 saturated elastomer Polymers 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 239000002699 waste material Substances 0.000 description 2
- 101100025719 Oryza sativa subsp. japonica NAL1 gene Proteins 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000009849 deactivation Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000005538 encapsulation Methods 0.000 description 1
- 238000009432 framing Methods 0.000 description 1
- 230000004886 head movement Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000008450 motivation Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000003334 potential effect Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 239000013074 reference sample Substances 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 238000009738 saturating Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 239000002356 single layer Substances 0.000 description 1
- 230000000153 supplemental effect Effects 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N9/00—Details of colour television systems
- H04N9/79—Processing of colour television signals in connection with recording
- H04N9/80—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
- H04N9/804—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components
- H04N9/8042—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components involving data reduction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/30—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
- H04N19/39—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability involving multiple description coding [MDC], i.e. with separate layers being structured as independently decodable descriptions of input picture data
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/85—Assembly of content; Generation of multimedia applications
- H04N21/854—Content authoring
- H04N21/85406—Content authoring involving a specific file format, e.g. MP4 format
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/71—Indexing; Data structures therefor; Storage structures
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/105—Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/184—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/30—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
- H04N19/33—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the spatial domain
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/30—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
- H04N19/36—Scalability techniques involving formatting the layers as a function of picture distortion after decoding, e.g. signal-to-noise [SNR] scalability
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/234—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
- H04N21/2343—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
- H04N21/234345—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements the reformatting operation being performed only on part of the stream, e.g. a region of the image or a time segment
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/597—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computer Security & Cryptography (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Television Signal Processing For Recording (AREA)
Description
- ピクチャ識別子シンタックス要素の長さ、
- 第1のサブピクチャ識別子シンタックス要素のビット位置、
- 開始コードエミュレーション防止バイトがサブピクチャ識別子シンタックス要素の前または中に存在するかどうかのフラグ指示
のうちの1つまたは複数を含む。
- サブピクチャ識別子、
- サブピクチャ位置識別子
のうちの1つまたは複数を含む。
- ピクチャ識別子シンタックス要素の長さ、
- 第1のサブピクチャ識別子シンタックス要素のビット位置、
- 開始コードエミュレーション防止バイトがサブピクチャ識別子シンタックス要素の前または中に存在するかどうかのフラグ指示
のうちの1つまたは複数を含む。
- サブピクチャ識別子、
- サブピクチャ位置識別子
のうちの1つまたは複数を含む。
a)サブピクチャ識別子がパラメータセットおよび/またはピクチャヘッダ内で搬送されるかどうかを判断すること、
b)2つ以上のパラメータセットまたはピクチャヘッダがサブピクチャ識別子を含む場合、パラメータセットとピクチャヘッダとの間の優先順位を判断し、最も高い優先順位を有するパラメータセットまたはピクチャヘッダを選択すること、
c)上書き用にピクチャヘッダが選択された場合、サンプル内に存在するピクチャヘッダまたはベーストラック内のサンプルにマッピングされたサンプルグループ化のピクチャヘッダになるように上書きするためのピクチャヘッダを選択すること、
d)選択されたサブピクチャトラックのサブピクチャ識別子を含むように選択されたパラメータセットまたはピクチャヘッダを修正すること
のうちの1つまたは複数を使用することにより、パラメータセットまたはピクチャヘッダ内のサブピクチャ識別子を上書きするように構成される。
- ルーマ(Y)のみ(単色)
- ルーマおよび2つのクロマ(YCbCrまたはYCgCo)
- 緑、青、および赤(RGBとしても知られているGBR)
- 他の未指定の単色または三刺激色サンプリング(たとえば、XYZとしても知られているYZX)を表すアレイ
のうちの1つなどの、1つまたは複数のサンプルアレイから構成される。
- 単色サンプリングでは、名目上、ルーマアレイと見なされ得るただ1つのサンプルアレイが存在する。
- 4:2:0サンプリングでは、2つのクロマアレイの各々は、ルーマアレイの半分の高さおよび半分の幅を有する。
- 4:2:2サンプリングでは、2つのクロマアレイの各々は、ルーマアレイの同じ高さおよび半分の幅を有する。
- 別々の色平面が使用中でないときの4:4:4サンプリングでは、2つのクロマアレイの各々は、ルーマアレイと同じ高さおよび幅を有する。
C=D+λR (式1)
ここで、Cは最小化されるべきラグランジュコストであり、Dは考慮されるモードおよび動きベクトルによる画像歪み(たとえば、平均平方誤差)であり、Rは(候補動きベクトルを表すデータ量を含む)デコーダ内で画像ブロックを復元するために必要なデータを表すために必要とされるビット数である。
・品質スケーラビリティ:ベースレイヤピクチャはエンハンスメントレイヤピクチャよりも低い品質でコード化され、それは、たとえば、エンハンスメントレイヤ内よりも大きいベースレイヤ内の量子化パラメータ値(すなわち、変換係数量子化用よりも大きい量子化ステップサイズ)を使用して達成されてもよい。
・空間スケーラビリティ:ベースレイヤピクチャは、エンハンスメントレイヤピクチャよりも低い解像度でコード化される(すなわち、より少ないサンプルを有する)。空間スケーラビリティおよび品質スケーラビリティは、時々、同じタイプのスケーラビリティと見なされてもよい。
・ビット深度スケーラビリティ:ベースレイヤピクチャは、エンハンスメントレイヤピクチャ(たとえば、10ビットまたは12ビット)よりも低いビット深度(たとえば、8ビット)でコード化される。
・ダイナミックレンジスケーラビリティ:スケーラブルレイヤは、異なるトーンマッピング関数および/または異なる光学伝達関数を使用して取得された異なるダイナミックレンジおよび/または画像を表す。
・クロマフォーマットスケーラビリティ:ベースレイヤピクチャは、(たとえば、4:2:0クロマフォーマットでコード化された)クロマサンプルアレイ内で、エンハンスメントレイヤピクチャ(たとえば、4:4:4フォーマット)よりも低い空間解像度を提供する。
・色域スケーラビリティ:エンハンスメントレイヤピクチャは、ベースレイヤピクチャよりも豊富/広範な色表現範囲を有する-たとえば、エンハンスメントレイヤはUHDTV(ITU-R BT.2020)色域を有することができ、ベースレイヤはITU-R BT.709色域を有することができる。
・対象領域(ROI)スケーラビリティ:エンハンスメントレイヤは、ベースレイヤの空間サブセットを表す。ROIスケーラビリティは、エンハンスメントレイヤが空間サブセットのためのより高い主観的品質を提供するように、他のタイプのスケーラビリティ、たとえば、品質スケーラビリティまたは空間スケーラビリティと一緒に使用されてもよい。
・マルチビューコーディングと呼ばれる場合もある、ビュースケーラビリティ。ベースレイヤは第1のビューを表し、エンハンスメントレイヤは第2のビューを表す。
・深度拡張コーディングと呼ばれる場合もある、深度スケーラビリティ。ビットストリームの1つまたはいくつかのレイヤは、テクスチャビューを表すことができ、他の1つまたはいくつかのレイヤは、深度ビューを表すことができる。
上記のスケーラビリティケースのすべてにおいて、ベースレイヤ情報は、さらなるビットレートオーバーヘッドを最小化するようにエンハンスメントレイヤをコード化するために使用される可能性がある。
- u(n):nビットを使用する符号なし整数。nがシンタックステーブル内の「v」であるとき、ビット数は、他のシンタックス要素の値に応じて変化する。この説明のための構文解析プロセスは、最上位ビットが最初に書き込まれる符号なし整数のバイナリ表現として解釈されたビットストリームからn個の次ビットによって指定される。
- ue(v):左ビットが最初の符号なし整数指数ゴロムコード化(別名、指数ゴロムコード化)シンタックス要素。
aligned(8) class IdentifiedMediaDataBox extends Box(‘imda’) {
unsigned int(32) imda_identifier;
bit(8) data[]; //ボックスの最後まで
}
aligned(8) class EntityToGroupBox(grouping_type,version,flags)
extends FullBox(grouping_type, version, flags) {
unsigned int(32) group_id;
unsigned int(32) num_entities_in_group;
for(i=0;i<num_entities_in_group;i++)
unsigned int(32) entity_id;
}
i)復号プロセスにおいてサブピクチャがピクチャとして扱われるか否か、場合によっては、この特性はインループフィルタリング演算を除外し、個別に指示/復号/推論されてもよい。
ii)サブピクチャ境界を横切ってインループフィルタリング演算が実行されるか否か。
- 1に等しいph_subpic_id_signalling_present_flagは、サブピクチャIDマッピングがPH内でシグナリングされることを指定し、0に等しいph_subpic_id_signalling_present_flagは、サブピクチャIDマッピングがPH内でシグナリングされないことを指定する。
- ph_subpic_id_len_minus1プラス1は、シンタクックス要素ph_subpic_id[i]を表すために使用されるビットの数を指定する。
ビットストリーム適合性のために、ph_subpic_id_len_minus1の値がCLVS内のコード化ピクチャによって参照されるすべてのPHに対して等しいことが必要とされる場合がある。
- ph_subpic_id[i]は、i番目のサブピクチャのサブピクチャIDを指定する。ph_subpic_id[i]シンタックス要素の長さは、ph_subpic_id_len_minus1+1ビットである。
- ソースVVCビットストリームを符号化するとき、各サブピクチャシーケンスのslice_subpic_id値は、すべてのソースVVCビットストリームの中の他のslice_subpic_id値とは異なるように選択されてもよく、slice_subpic_idシンタックス要素の長さは、ソースVVCビットストリーム内で同じであるように選択されてもよい。
- 宛先VVCビットストリームのSPSは、ソースVVCビットストリームのSPSに基づいて認可されるかまたは書き換えられる。SPS認可は、以下のうちの1つまたは複数を含んでもよい。
○各SPS内で示されたサブピクチャレイアウトは、宛先VVCビットストリームにマージされたサブピクチャに基づいて作成される。
○ピクチャの幅および高さは、宛先VVCビットストリームにマージされたサブピクチャに基づいて各SPS内で示される。
- 宛先VVCビットストリームのPPSは、ソースVVCビットストリームのPPSに基づいて認可されるかまたは書き換えられる。PPS認可は、以下のうちの1つまたは複数を含んでもよい。
○ピクチャの幅および高さは、宛先VVCビットストリームにマージされたサブピクチャに基づいて各PPS内で示される。
○宛先VVCビットストリームにマージされたサブピクチャに従って、サブピクチャ識別子の値のリスト、すなわち、両端を含む0からサブピクチャレイアウト内のサブピクチャの数マイナス1の範囲のiに対して、pps_subpic_id[i]を認可する。
- 宛先VVCビットストリームのピクチャヘッダは、ソースVVCビットストリームのそれぞれのピクチャヘッダに基づいて認可されるかまたは書き換えられる。ピクチャヘッダ認可は、以下のうちの1つまたは複数を含んでもよい。
○宛先VVCビットストリームにマージされたサブピクチャに従って、サブピクチャ識別子の値のリスト、すなわち、両端を含む0からサブピクチャレイアウト内のサブピクチャの数マイナス1の範囲のiに対して、ph_subpic_id[i]を認可する。
- 宛先VVCビットストリーム内のコード化ピクチャごとに、ソースVVCビットストリーム内のそれぞれのコード化ピクチャからのサブピクチャは、たとえば、サブピクチャ識別子の値のリストによって示された順序で含まれる。
H.264/AVCおよびHEVCに対してISO/IEC14496-15において指定された抽出器は、参照によりNALユニットを抽出するトラックのコンパクトな形成を可能にする。抽出器は、NALユニットのような構造である。NALユニットのような構造は、NALユニットヘッダおよびNALユニットペイロードのような任意のNALユニットを備えるように指定されてもよいが、(NALユニットに必要とされる)開始コードエミュレーション防止は、NALユニットのような構造において従われないかもしれない。HEVCの場合、抽出器は1つまたは複数のコンストラクタを含む。サンプルコンストラクタは、参照により、別のトラックのサンプルからNALユニットデータを抽出する。インラインコンストラクタは、NALユニットデータを含む。インラインという用語は、たとえば、データユニットに関して、シンタックス構造を含むことが、(参照により、またはデータポインタを介してデータユニットを含むこととは対照的に)データユニットを含むかまたは搬送することを示すように定義されてもよい。抽出器がそれを必要とするファイルリーダによって処理されるとき、抽出器は、それらの出現順序で含まれるコンストラクタを転換するときに得られたバイトによって論理的に置き換えられる。ネストされた抽出は禁止される場合があり、たとえば、サンプルコンストラクタによって参照されるバイトは抽出器を含んではならず、抽出器は、直接的または間接的に別の抽出器を参照してはならない。抽出器は、現在トラック、またはタイプ‘scal’のトラック参照によって抽出器が存在するトラックにリンクされた別のトラックからデータを抽出するために1つまたは複数のコンストラクタを含んでもよい。転換された抽出器のバイトは、1つまたは複数のNALユニット全体を表すことができる。転換された抽出器は、有効長のフィールドおよびNALユニットヘッダから始まる。サンプルコンストラクタのバイトは、示された‘scal’トラック参照を介して参照されたトラック内の単一の識別されたサンプルからのみコピーされる。整列は、復号時間上で、すなわち、時間-サンプルテーブルのみを使用して、サンプル番号でカウントされたオフセットがその後に続く。抽出器はメディアレベルの概念であり、したがって、任意の編集リストが考慮される前に宛先トラックに適用される。(しかしながら、通常、2つのトラック内の編集リストは同一であることが予想される。)
class aligned(8) Extractor() {
NALUnitHeader();
do {
unsigned int(8) constructor_type;
if(constructor_type==0)
SampleConstructor();
else if(constructor_type==2)
InlineConstructor();
} while(!EndOfNALUnit())
}
- NALUnitHeader():HEVC NALユニットの最初の2バイト。特定のnal_unit_type値は抽出器を示す、たとえば、49に等しいnal_unit_type。
- constructor_typeは使用されているコンストラクタを指定する。
- EndOfNALUnit()は、この抽出器内でより多くのデータが続くときに0(偽)を返す関数であり、そうでない場合、それは1(真)を返す。
class aligned(8) SampleConstructor() {
unsigned int(8) track_ref_index;
signed int(8) sample_offset;
unsigned int((lengthSizeMinusOne+1)*8)
data_offset;
unsigned int((lengthSizeMinusOne+1)*8)
data_length;
}
data_offset:コピーする参照サンプル内の最初のバイトのオフセット。抽出がそのサンプル内のデータの最初のバイトから始まる場合、オフセットは値0を取る。
data_length:コピーするバイトの数。
class aligned(8) InlineConstructor() {
unsigned int(8) length;
unsigned int(8) inline_data[length];
}
length:このフィールドに続くInlineConstructorに属するバイトの数。
inline_data:インラインコンストラクタを転換したときに返されるデータバイト。
HEVCタイルベーストラックは、参照されたHEVCタイルトラックからのサンプルデータを暗黙的に結合することによってビットストリームを表す。HEVCでは、タイルベーストラックからタイルトラックを参照するために‘sabt’トラック参照が使用され、タイル順序付けは、‘sabt’トラック参照によって含まれるタイルトラックの順序によって示される。その上、HEVCでは、タイルトラックは、タイルベーストラックに対する‘tbas’トラック参照を有する。
ISOBMFF準拠ファイル内のVVCの格納は、ISO/IEC14496-15における新しい条項として指定されるように計画されている。本文書を書いている時点で、ISOBMFF、MPEG N18856におけるVVCの搬送に関する作業ドラフト(WD)は入手可能である。WDは、サブピクチャトラックグループの従属条項を含み、それは調査および議論のためにWDに含まれた。次の段落は特徴を要約し、WDからの引用を含む。
aligned(8) class TrackGroupTypeBox(unsigned int(32) track_group_type) extends FullBox(track_group_type,version=0,flags=0)
{
unsigned int(32) track_group_id;
if track_group_type==‘acgl’ {
unsigned int(32) level_idc;
unsigned int(32) num_active_tracks;
}
if track_group_type==‘amgl’ {
unsigned int(32) level_idc;
unsigned int(32) track_subgroup_id;
unsigned int(32) num_subgroup_ids;
for (i = 0;i<num_subgroups_ids;i++)
{
unsigned int(32) included_subgroup_id[i];
unsigned int(32) num_active_tracks[i];
}
}
}
track_group_typeはグループ化タイプを示す。
track_group_typeが‘acgl’に等しいとき、これは、このトラックが同じ値のtrack_group_idを有するトラックのグループに属することを示す。track_group_typeが‘amgl’に等しいとき、これは、このトラックが同じ値のtrack_group_idを有するトラックのグループおよびtrack_subgroup_idの値を有するサブグループに属することを示す。
num_active_tracks
num_active_tracks個のトラックのサブセットが同じ値のtrack_group_idを有するグループから選択されたとき、track_group_idを有するグループの再生は、level_idcのレベルに対応する。
num_subgroup_ids
個別のサブグループの数であり、各々は同じ値のtrack_subgroup_idによって識別され、異なるサブグループは異なる値のtrack_subgroup_idによって識別され、それに対して、一組のサブピクチャトラックが一緒に復号されたときにlevel_idcの値が示される。
included_track_subgroup_id[i]
0からnum_subgroup_idsまでの範囲のiに対して、included_track_subgroup_id[i]に等しいtrack_subgroup_idを有するトラックのそれぞれのサブグループから選択されたnum_active_tracks[i]個のトラックから構成される、同じ値のtrack_group_idを有するトラックのサブグループを再生するとき、グループの再生はlevel_idcのレベルに対応する。
- 抽出器のような手法は、バイトカウントオーバーヘッドにおいてコストがかかる。抽出器は各サンプルに含まれるので、それらはバイトカウントオーバーヘッドの観点から比較的高いコストを被る。
- 抽出器のような手法は、スライスヘッダの書き換えなどのNALユニットの任意の修正を可能にし、VVCサブピクチャのマージでは、VCL NALユニットの変化が必要とされないので、不必要に柔軟である。
- 2つ以上のソースVVCビットストリームのサブピクチャのサブセットをプレーヤに選択させるには柔軟でなく、
- サブピクチャレイアウトにおいて時間ともに変化する変更を有するには柔軟でない。
- ソースVVCビットストリームを構文解析し、それらの一部(パラメータセット、PH)を復号するようにクライアントに要求する。構文解析および復号は、以下を含む比較的複雑な動作であり得る。
○RBSP(ローバイトシーケンスペイロード)を取得するためのNALユニットからの開始コードエミュレーション防止バイトの削除
○各スライスヘッダからピクチャヘッダへの暗黙参照、ならびに各スライスヘッダからPPS、SPS、およびVPS(ビデオパラメータセット)への明示参照、ならびに異なるタイプのパラメータセット間の明示参照の記録参照されたシンタックス構造のシンタックス要素値に基づく構文解析および復号。
- 宛先VVCビットストリームを「構成」し、その一部(パラメータセット、PH)を符号化するようにクライアントに要求する。「構成」および符号化は、以下を含む比較的複雑な動作であり得る。
○マージのために選択されたソースサブピクチャトラックに基づくパラメータセットおよびピクチャヘッダの書き換え
○各スライスヘッダからピクチャヘッダへの暗黙参照、ならびに各スライドヘッダからPPS、SPS、およびVPSへの明示参照、ならびに異なるタイプのパラメータセット間の明示参照の記録。参照されたシンタックス構造のシンタックス要素値に基づく符号化。
○作成されたRBSPからNALユニットを取得するための開始コードエミュレーション防止バイトの挿入
- サブピクチャトラックが他のサブピクチャトラックなしに再生される対象ではないときに冗長的にパラメータセットおよびピクチャヘッドを含むように各サブピクチャトラックに要求する。
aligned(8) class VvcSubPicOrderEntry() extends VisualSampleGroupEntry(‘spor’)
{
unsigned int(16) num_subpics;
for (i=0;i<num_subpics;i++)
unsigned int(16) subp_track_ref_idx;
}
- サブピクチャIDがVVCベーストラックに含まれるSPS NALユニット内で搬送されるかどうかの第1の指示
- サブピクチャIDがVVCベーストラックに含まれるPPS NALユニット内で搬送されるがどうかの第2の指示
- サブピクチャIDがVVCベーストラックに含まれるピクチャヘッダ(PH)NALユニット内で搬送されるかどうかの(以下のシンタックスでph_subpic_id_flagと呼ばれる)第3の指示
- このサンプルグループ記述項目にマッピングされたサンプルに適用されるSPS NALユニット
- このサンプルグループ記述項目にマッピングされたサンプルに適用されるSPS RBSP
- VVCベーストラック内で提供されるSPS内のそれぞれの識別子の値(すなわち、ドラフトVVC規格におけるsps_seq_parameter_set_id)を参照するSPS識別子の値、SPSはこのサンプルグループ記述項目にマッピングされたサンプルに適用される
- VVCベーストラックのサンプル項目内で提供されるSPS NALユニットの中のインデックス、インデックスはこのサンプルグループ記述項目にマッピングされたサンプルに適用されるSPS NALユニットを指し示す
- VVCベーストラックのサンプル項目内で提供される(任意のタイプの)NALユニットの中のインデックス、インデックスはこのサンプルグループ記述項目にマッピングされたサンプルに適用されるSPS NALユニットを指し示す
- SPS RBSP内のサブピクチャ識別子(すなわち、sps_subpic_id[i])シンタックス要素の(ビット単位の)長さ
- 参照されるかまたは含まれるSPS NALユニットまたはSPS RBSP内の最初のサブピクチャ識別子シンタックス要素(すなわち、sps_subpic_id[0])のビット位置
- 開始コードエミュレーション防止バイトがサブピクチャ識別子シンタックス要素(すなわち、sps_subpic_id[i])の前または中に存在するかどうかを示すフラグ。このフラグは、代替として、SPS NALユニット内のiの任意の有効値を有するsps_subpic_id[i]のビット位置がSPS RBSP内のそれと異なるかどうかを示すために表現されてもよい。
- このサンプルグループ記述項目にマッピングされたサンプルに適用されるPPS NALユニット
- このサンプルグループ記述項目にマッピングされたサンプルに適用されるPPS RBSP
- VVCベーストラック内で提供されるPPS内のそれぞれの識別子の値(すなわち、ドラフトVVC規格におけるpps_pic_parameter_set_id)を参照するPPS識別子の値、PPSはこのサンプルグループ記述項目にマッピングされたサンプルに適用される
- VVCベーストラックのサンプル項目内で提供されるPPS NALユニットの中のインデックス、インデックスはこのサンプルグループ記述項目にマッピングされたサンプルに適用されるPPS NALユニットを指し示す
- VVCベーストラックのサンプル項目内で提供される(任意のタイプの)NALユニットの中のインデックス、インデックスはこのサンプルグループ記述項目にマッピングされたサンプルに適用されるPPS NALユニットを指し示す
- PPS RBSP内のサブピクチャ識別子(すなわち、pps_subpic_id[i])シンタックス要素の(ビット単位の)長さ
- 参照されるかまたは含まれるPPS NALユニットまたはPPS RBSP内の最初のサブピクチャ識別子シンタックス要素(すなわち、pps_subpic_id[0])のビット位置
- 開始コードエミュレーション防止バイトがサブピクチャ識別子シンタックス要素(すなわち、pps_subpic_id[i])の前または中に存在するかどうかを示すフラグ。このフラグは、代替として、PPS NALユニット内のiの任意の有効値を有するpps_subpic_id[i]のビット位置がPPS RBSP内のそれと異なるかどうかを示すために表現されてもよい。
- (以下のシンタックスにおいてph_subpic_id_len_minus1と呼ばれる)PH RBSP内のサブピクチャ識別子(すなわち、ph_subpic_id[i])シンタックス要素の(ビット単位の)長さ
- (以下のシンタックスにおいてph_subpic_id_bit_posと呼ばれる)PH RBSP内の最初のサブピクチャ識別子シンタックス要素(すなわち、ph_subpic_id[0])のビット位置
- 開始コードエミュレーション防止バイトがサブピクチャ識別子シンタックス要素(すなわち、ph_subpic_id[i])の前または中に存在するかどうかを示す(以下のシンタックスにおいてph_start_code_emul_flagと呼ばれる)フラグ。このフラグは、代替として、PH NALユニット内のiの任意の有効値を有するph_subpic_id[i]のビット位置がPH RBSP内のそれと異なるかどうかを示すために表現されてもよい。
aligned(8) class VvcSubPicOrderEntry() extends VisualSampleGroupEntry(’spor’)
{
unsigned int(16) num_subpics;
for (i=0;i<num_subpics;i++)
unsigned int(16) subp_track_ref_idx;
unsigned int(1) ph_subpic_id_flag;
if (ph_subpic_id_flag) {
unsigned int(1) ph_start_code_emul_flag;
unsigned int(4) ph_subpic_id_len_minus1;
unsigned int(10) ph_subpic_id_bit_pos;
} else
bit(15) reserved=0;
}
一実施形態によれば、サブピクチャトラックのグループは、コンテナファイル内のトラックグループとしてファイルライタもしくは同様のエンティティによって示され、かつ/またはコンテナ内のトラックグループからファイルリーダもしくは同様のエンティティによって構文解析される。たとえば、サブピクチャトラックのグループは、VVCサブピクチャトラックを収集する‘alte’トラックグループであってもよい。これらのVVCサブピクチャトラックから、任意のトラックは、VVCベーストラックを転換するために交換可能に選択することができる。同じ‘alte’トラックグループ内のトラックは、同じ幅、高さ、およびサブピクチャ境界特性を有する。
VVCサブピクチャトラックが他のVVCサブピクチャトラックなしに消費されるのに適している場合、正規のVVCサンプル項目が使用されてもよい(すなわち、MPEG N18856による‘vvc1’または‘vvi1’)。
- トラックのサンプル内に存在するすべてのスライス内でslice_subpic_idの値に等しいことが必要とされ得るサブピクチャID
- サブピクチャ位置ID
のうちの1つまたは複数を含む。VVCサブピクチャトラックが同じサブピクチャ位置IDの値を有するとき、それらは同じ元のコンテンツを表し、同じ幅および高さを有する。
- トラックのサンプル内に存在するそれぞれのサブピクチャのスライス内でslice_subpic_idの値に等しいことが必要とされ得るサブピクチャID
- サブピクチャ位置ID
のうちの1つまたは複数を含む。VVCサブピクチャトラックが同じサブピクチャ位置IDの値を有するとき、それらは同じ元のコンテンツを表し、同じ幅および高さを有する。
一実施形態によれば、VVCベーストラックは、正規のVVCサンプル項目タイプ(すなわち、MPEG N18856による‘vvc1’または‘vvi1’)を有する。トラック内に‘subp’トラック参照を含めることにより、ファイルライタまたは同様のエンティティは、トラックが正規の自己完結型VVCトラックではなくVVCベーストラックであることを示すことができる。別の実施形態では、特定のサンプル項目タイプ(たとえば、‘vvcb’)は、トラックがVVCベーストラックであることを示すように指定されてもよい。
図1は、ビューポート依存全方向ビデオストリーミングにVVCサブピクチャトラックがどのように使用されるかの一例である。本明細書では、「全方向」という用語は、コンテンツをレンダリングするデバイスの視界よりも大きい空間的広がりを有することができるメディアコンテンツを指すことができる。全方向コンテンツは、たとえば、水平次元で実質的に360°および垂直次元で実質的に180°をカバーすることができるが、全方向は、水平方向に360度よりも小さいビューおよび/または垂直方向に180度よりも小さいビューをカバーするコンテンツを指すこともできる。
幅および/または高さにおける特定の解像度またはピクセルカウントを参照して、以下で別の例が説明される。解像度およびピクセルカウントは例として与えられ、例示的な実施形態は、解像度およびピクセルカウントの任意の選択に同様に適用される可能性があることが理解される必要がある。
一実施形態によれば、ピクチャヘッダ(PH)NALユニットは、VVCベーストラックのサンプルに(たとえば、ファイルライタによって)含められ、かつ/またはVVCベーストラックのサンプルから(たとえば、ファイルリーダによって)構文解析されてもよい。
- PH NALユニット、およびSEI NALユニットなどのゼロ以上の他のNALユニット
- PH NALユニット
- NALユニットヘッダがないPH NALユニット
- PH RBSP
のうちの1つを含む。
- ピクチャヘッダ内のPOC関連シンタックス要素がこのサンプルグループ記述項目にマッピングされたサンプルにそのように適用されるか、または(ビットストリームを復元するときに)上書きされるべきかの指示。
- トラックの合成時間などのタイミング情報がPOC値にどのように関係するかを示す指示。たとえば、合成時間のスケーリングファクタは、合成時間をPOC値に変換するために示されてもよい。合成時間の差分は、POC関連シンタックス要素がそのように適用された前のサンプルの合成時間を現在サンプルの合成時間から減算することによって導出されてもよい。POCの差分は、合成時間のスケーリングファクタを合成時間の差分に乗算することによって導出されてもよい。POC値は、POC関連シンタックス要素がそのように適用された前のサンプルの導出されたPOC値にPOCの差分を加算することによって導出されてもよい。POC関連シンタックス要素の値は、POC値から導出されてもよい。
- ピクチャヘッダ内のPOC LSB値などのPOC関連シンタックス要素の開始ビット位置。
- POC関連シンタックス要素の(ビット単位の)長さ。
- 開始コードエミュレーション防止バイトがPOC関連シンタックス要素の前または中に存在するかどうかを示すフラグ。
一実施形態によれば、ファイルリーダまたは同様のエンティティは、VVCベーストラックを転換することによってVVCビットストリームを復元する。VVCベーストラックは、VVCベーストラックのサンプルの複合順序で転換されてもよい。VVCベーストラックのサンプルは、宛先VVCビットストリーム内のアクセスユニットに転換される。アクセスユニットは、VVCベーストラックのサンプル内で搬送されたNALユニット、および参照されたVVCサブピクチャトラックの中から選択されたVVCサブピクチャトラックのVCL NALユニットを含むように転換されてもよく、参照は、VVCベーストラックのサンプルに適用された‘spor’サンプルグループ記述項目を介して示されてもよく、いくつかの実施形態では、他の実施形態に記載されたように、‘subp’トラック参照を介して示されてもよい。
- ファイルリーダまたは同様のエンティティは、たとえば、VVCベーストラックのサンプルにマッピングされた‘spor’サンプルグループ記述項目内の指示に基づいて、どのシンタックス構造がサブピクチャIDシンタックス要素を含むかを判断する。別の例では、サブピクチャIDは、それぞれ、SPS、PPS、またはPHのNALユニットを構文解析することにより、SPS、PPS、またはPHのNALユニット内で搬送されるように判断される。
- サンプルに適用された2つ以上のシンタックス構造がサブピクチャIDシンタックス要素を含むとき、ファイルリーダまたは同様のエンティティは、シンタックス構造を含む優先順位が、特定のサンプルに適用されたサブピクチャIDシンタックス要素を含むと判断することができる。たとえば、PH内のサブピクチャIDは、PPSおよびSPS内のサブピクチャIDを無効にすることができる。最も高い優先順位を有するシンタックス構造が修正されるために選択されてもよい。
- 修正されるべきシンタックス構造は、シンタックス構造全体が復元されたビットストリーム内で繰り返されるようにすることができる。たとえば、同じPPS識別子の値を有するPPS内で以前使用されたサブピクチャIDの異なるセットでサブピクチャIDシンタックス要素を上書きすることによってPPSが修正された場合、ファイルリーダまたは同様のエンティティは、サブピクチャIDのセットが適用された復元ビットストリームのコード化ピクチャにPPS NALユニット全体のコピーを含める。
- PH NALユニット内でサブピクチャIDシンタックス要素の上書きが行われる場合、上書きが行われるPH NALユニットは、もしあれば、サンプル内に存在するPH NALユニット、または(もしあれば)VVCベーストラック内のサンプルにマッピングされた‘phdr’サンプルグループ化のPH NALユニットであるように選択される。
○サンプルグループ記述項目内で示されたシンタックス構造内の最初のサブピクチャ識別子シンタックス要素のビット位置(たとえば、修正されるべきピクチャヘッダ内のph_subpic_id[0]のビット位置)から開始し、サンプルグループ記述項目内で指定された順序の各々の選択されたVVCサブピクチャトラックからのサブピクチャIDで、各サブピクチャ識別子シンタックス要素(たとえば、ピクチャヘッダ内のph_subpic_id[i]の値)を上書きする。
- サンプル内に存在する(かつ最初のNALユニットである)とき、もしあれば、AUD NALユニット
- サンプルが同じサンプル項目に関連付けられたサンプルのシーケンスの最初のサンプルであるとき、パラメータセットNALユニットおよびSEI NALユニットは、もしあれば、同じ項目に含まれる。プレフィックスAPSおよびプレフィックスSEI NALユニットのみが同じサンプル項目内に存在できることが必要であり得ることに留意されたい。
- もしあれば、同じサンプル内に存在し、サンプル内の以下の最初に先行するNALユニット:
○もしあれば、サンプル内のPH NALユニット
○もしあれば、サンプル内の最初のVCL NALユニット
○もしあれば、VVC仕様によるAUの最後のNALユニットであることが許可される最初のNALユニット
○サンプルの最後
- もしあれば、サンプル内に存在するPH NALユニット、またはサンプルにマッピングされた‘phdr’サンプルグループ化のPH NALユニット
- もしあれば、すべてのVPS、DPS、SPS、PPS、AUD、PH、EOS、およびEOBのNALユニットを除外する、このサンプルにマッピングされた‘spor’サンプルグループ記述項目内で指定された順序で各々の参照されたVVCサブピクチャトラックからの(復号順序で)時間整列された転換サンプルのコンテンツ。トラック参照は以下に指定されたように転換される。
○参照VVCサブピクチャトラックがAPSトラックと関連付けられた場合、転換されたサンプルは、APSトラック内の時間整列されたサンプルの、もしあれば、APS NALユニットを含むことが留意されるべきである。
- (すでに上記のアクセスユニットに含まれていない)サンプル内の残りのNALユニット。
- トラック参照がVVCサブピクチャトラックのトラックIDを指し示す場合、トラック参照はVVCサブピクチャトラックに転換される。
- そうでない(トラック参照が‘alte’トラックグループを指し示す)場合、トラック参照は‘alte’トラックグループのトラックのいずれかに転換される。特定のトラック参照インデックス値が前のサンプル内の特定のトラックに転換された場合、それは現在サンプル内で以下のいずれかに転換されるべきであることが必要とされる場合がある。
○同じ特定のトラック、または
○同期サンプルを含むか、または一実施形態では、現在サンプルと時間整列された3のSAPサンプルタイプを含む、同じ‘alte’トラックグループ内の任意の他のトラック。
○サンプルグループの使用は、時変サブピクチャレイアウトの可能性を提供する。
○サンプルグループの使用は、さらなるパラメータ(たとえば、PH RBSP内のサブピクチャ識別子の長さおよび/または最初のサブピクチャ識別子のビット位置)の割当ての可能性を提供する。さらなるパラメータは時変であり得る。
Claims (15)
- コンテナファイル内で、2つ以上のサブピクチャトラックを書き込むステップと、
前記コンテナファイル内で、ビデオビットストリームに転換される対象となるベーストラックを書き込むステップと、
前記ベーストラック内で、サブピクチャのレイアウトを指示するステップと、
前記コンテナファイル内で、サブピクチャの前記レイアウト内のサブピクチャ位置ごとに第1のサブピクチャトラックまたはサブピクチャトラックのグループを示すサンプルグループ記述項目を書き込むステップであって、前記第1のサブピクチャトラックが前記それぞれのサブピクチャ位置用のサブピクチャシーケンスを含み、サブピクチャトラックの前記グループの中の任意のトラックが前記それぞれのサブピクチャ位置用の有効なサブピクチャシーケンスを含む、ステップと、
前記コンテナファイル内で、前記サンプルグループ記述項目が前記ビデオビットストリームを復元するために使用される対象となる前記ベーストラックのサンプルを指示するステップと
を含む、方法。 - コンテナファイルのベーストラックから、サブピクチャのレイアウトを構文解析するステップと、
前記コンテナファイルから、サブピクチャの前記レイアウト内のサブピクチャ位置ごとに第1のサブピクチャトラックまたはサブピクチャトラックのグループを示すサンプルグループ記述項目を構文解析するステップであって、前記第1のサブピクチャトラックが前記それぞれのサブピクチャ位置用のサブピクチャシーケンスを含み、サブピクチャトラックの前記グループの中の任意のトラックが前記それぞれのサブピクチャ位置用の有効なサブピクチャシーケンスを含む、ステップと、
前記サンプルグループ記述項目がサブピクチャトラックのグループを示すときに、サブピクチャトラックの前記グループから第2のサブピクチャトラックを選択するステップと、
前記コンテナファイルから、前記ベーストラックのどのセットのサンプルが、前記サンプルグループ記述項目がビデオビットストリームを復元するために使用される対象となるかを構文解析するステップと、
前記コンテナファイルの前記ベーストラックの前記サンプルから、サブピクチャの前記レイアウトのサブピクチャ位置ごとに前記第1のサブピクチャトラックまたは前記第2のサブピクチャトラックの時間整列サンプルを含めることにより、サンプルの前記セットに対応する前記ビデオビットストリームのコード化ピクチャを復元するステップと
を含む、方法。 - コンテナファイル内で、2つ以上のサブピクチャトラックを書き込むための手段と、
前記コンテナファイル内で、ビデオビットストリームに転換される対象となるベーストラックを書き込むための手段と、
前記ベーストラック内で、サブピクチャのレイアウトを指示するための手段と、
前記コンテナファイル内で、サブピクチャの前記レイアウト内のサブピクチャ位置ごとに第1のサブピクチャトラックまたはサブピクチャトラックのグループを示すサンプルグループ記述項目を書き込むための手段であって、前記第1のサブピクチャトラックが前記それぞれのサブピクチャ位置用のサブピクチャシーケンスを含み、サブピクチャトラックの前記グループの中の任意のトラックが前記それぞれのサブピクチャ位置用の有効なサブピクチャシーケンスを含む、手段と、
前記コンテナファイル内で、前記サンプルグループ記述項目が前記ビデオビットストリームを復元するために使用される対象となる前記ベーストラックのサンプルを指示するための手段と
を備える、装置。 - 前記コンテナファイル内で、前記ベーストラックから各々がサブピクチャトラックまたはサブピクチャトラックのトラックグループを識別する項目のリストへのトラック参照を書き込むための手段であって、前記サンプルグループ記述項目が、サブピクチャの前記レイアウト内のサブピクチャ位置ごとに、サブピクチャ位置ごとの項目の前記リストのインデックスを含み、前記インデックスが前記第1のサブピクチャトラックまたはサブピクチャトラックの前記グループを示す、手段
をさらに備える、請求項3に記載の装置。 - 前記サンプルグループ記述項目が、サブピクチャ識別情報が前記ベーストラックに含まれるパラメータセットまたはピクチャヘッダ内で搬送されるかどうかの指示を含む、請求項3または4に記載の装置。
- 前記サンプルグループ記述項目が、
サブピクチャ識別子シンタックス要素の長さ、
第1のサブピクチャ識別子シンタックス要素のビット位置、
開始コードエミュレーション防止バイトが前記サブピクチャ識別子シンタックス要素の前または中に存在するかどうかのフラグ指示
のうちの1つまたは複数を含む、請求項5に記載の装置。 - サブピクチャトラックのサンプル項目が、
サブピクチャ識別子、
サブピクチャ位置識別子
のうちの1つまたは複数を含む、請求項3~6のいずれか1項に記載の装置。 - 前記コンテナファイル内で、ピクチャヘッダNALユニット用のサンプルグループを書き込むための手段をさらに備える、請求項3~7のいずれか1項に記載の装置。
- コンテナファイルのベーストラックから、サブピクチャのレイアウトを構文解析するための手段と、
前記コンテナファイルから、サブピクチャの前記レイアウト内のサブピクチャ位置ごとに第1のサブピクチャトラックまたはサブピクチャトラックのグループを示すサンプルグループ記述項目を構文解析するための手段であって、前記第1のサブピクチャトラックが前記それぞれのサブピクチャ位置用のサブピクチャシーケンスを含み、サブピクチャトラックの前記グループの中の任意のトラックが前記それぞれのサブピクチャ位置用の有効なサブピクチャシーケンスを含む、手段と、
前記サンプルグループ記述項目がサブピクチャトラックのグループを示すときに、サブピクチャトラックの前記グループから第2のサブピクチャトラックを選択するための手段と、
前記コンテナファイルから、前記ベーストラックのどのセットのサンプルが、前記サンプルグループ記述項目がビデオビットストリームを復元するために使用される対象となるかを構文解析するための手段と、
前記コンテナファイルの前記ベーストラックの前記サンプルから、サブピクチャの前記レイアウト内のサブピクチャ位置ごとに前記第1のサブピクチャトラックまたは前記第2のサブピクチャトラックの時間整列サンプルを含めることにより、サンプルの前記セットに対応する前記ビデオビットストリームのコード化ピクチャを復元するための手段と
を備える、装置。 - 前記コンテナファイルから、前記ベーストラックから各々がサブピクチャトラックまたはサブピクチャトラックのトラックグループを識別する項目のリストへのトラック参照を読み取るための手段
をさらに備え、
前記サンプルグループ記述項目が、サブピクチャの前記レイアウト内のサブピクチャ位置ごとに、サブピクチャ位置ごとの項目の前記リストのインデックスを含み、前記インデックスが前記第1のサブピクチャトラックまたはサブピクチャトラックの前記グループを示す、
請求項9に記載の装置。 - 前記サンプルグループ記述項目が、サブピクチャ識別情報が前記ベーストラックに含まれるパラメータセットまたはピクチャヘッダ内で搬送されるかどうかの指示を含む、請求項9または10に記載の装置。
- 前記サンプルグループ記述項目が、
サブピクチャ識別子シンタックス要素の長さ、
第1のサブピクチャ識別子シンタックス要素のビット位置、
開始コードエミュレーション防止バイトが前記サブピクチャ識別子シンタックス要素の前または中に存在するかどうかのフラグ指示
のうちの1つまたは複数を含む、請求項11に記載の装置。 - サブピクチャトラックのサンプル項目が、
サブピクチャ識別子、
サブピクチャ位置識別子
のうちの1つまたは複数を含み、
前記装置は、
前記コンテナファイルから、ピクチャヘッダNALユニット用のサンプルグループを読み取るための手段、及び
サブピクチャの前記レイアウトへのサブピクチャ識別子のマッピングを指示するための手段、をさらに備える、請求項12に記載の装置。 - 指示するための前記手段が、
a)サブピクチャ識別子がパラメータセットおよび/またはピクチャヘッダ内で搬送されるかどうかを判断すること、
b)2つ以上のパラメータセットまたはピクチャヘッダがサブピクチャ識別子を含む場合、パラメータセットとピクチャヘッダとの間の優先順位を判断し、最も高い優先順位を有する前記パラメータセットまたは前記ピクチャヘッダを選択すること、
c)上書き用にピクチャヘッダが選択された場合、サンプル内に存在する前記ピクチャヘッダまたは前記ベーストラック内のサンプルにマッピングされたサンプルグループ化のピクチャヘッダになるように上書きするための前記ピクチャヘッダを選択すること、
d)選択されたサブピクチャトラックの前記サブピクチャ識別子を含むように前記選択されたパラメータセットまたはピクチャヘッダを修正すること
のオプションのうちの1つまたは複数を使用することにより、パラメータセットまたはピクチャヘッダ内の前記サブピクチャ識別子を上書きするように構成される、請求項13に記載の装置。 - オプションd)のために、前記装置が、
前記第1のサブピクチャ識別子シンタックス要素の前記ビット位置から開始し、前記サンプルグループ記述項目内で指定された順序で各々の選択されたサブピクチャトラックからのサブピクチャ識別子で各サブピクチャ識別子要素の値を上書きする
ように、前記修正を実行するための手段を備える、請求項14に記載の装置。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FI20196140 | 2019-12-31 | ||
FI20196140 | 2019-12-31 | ||
PCT/FI2020/050847 WO2021136880A1 (en) | 2019-12-31 | 2020-12-17 | A method, an apparatus and a computer program product for video encoding and video decoding |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2023508736A JP2023508736A (ja) | 2023-03-03 |
JP7472292B2 true JP7472292B2 (ja) | 2024-04-22 |
Family
ID=76687159
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022540734A Active JP7472292B2 (ja) | 2019-12-31 | 2020-12-17 | ビデオ符号化およびビデオ復号のための方法、装置、およびコンピュータプログラム製品 |
Country Status (7)
Country | Link |
---|---|
US (1) | US12088971B2 (ja) |
EP (1) | EP4085645A4 (ja) |
JP (1) | JP7472292B2 (ja) |
KR (1) | KR20220114088A (ja) |
CN (1) | CN114930868A (ja) |
BR (1) | BR112022012990A2 (ja) |
WO (1) | WO2021136880A1 (ja) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3965422A1 (en) * | 2020-09-02 | 2022-03-09 | Lemon Inc. | Brand for a media file |
EP3972279A1 (en) * | 2020-09-17 | 2022-03-23 | Lemon Inc. | Subpicture track referencing and processing |
US20220086387A1 (en) | 2020-09-17 | 2022-03-17 | Lemon Inc. | Subpicture entity groups in video coding |
WO2022065893A1 (ko) * | 2020-09-24 | 2022-03-31 | 엘지전자 주식회사 | 미디어 파일 처리 방법 및 그 장치 |
GB2605955A (en) * | 2021-04-13 | 2022-10-26 | Canon Kk | Method and apparatus for encapsulating encoded media data in a media file |
US20220345725A1 (en) | 2021-04-15 | 2022-10-27 | Lemon Inc. | Level Indicator For Sub-Picture Entity Group |
CN115618027A (zh) * | 2021-07-12 | 2023-01-17 | 腾讯科技(深圳)有限公司 | 一种数据处理方法、装置、计算机及可读存储介质 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160165321A1 (en) | 2013-07-23 | 2016-06-09 | Canon Kabushiki Kaisha | Method, device, and computer program for encapsulating partitioned timed media data using sub-track feature |
WO2017202799A1 (en) | 2016-05-24 | 2017-11-30 | Canon Kabushiki Kaisha | Method, device, and computer program for encapsulating and parsing timed media data |
WO2019138929A1 (ja) | 2018-01-12 | 2019-07-18 | ソニー株式会社 | 情報処理装置および方法 |
JP2020511816A (ja) | 2017-03-27 | 2020-04-16 | キヤノン株式会社 | メディアデータ生成方法 |
JP2020537376A (ja) | 2017-10-12 | 2020-12-17 | キヤノン株式会社 | 時限メディアデータを生成する方法、装置、およびコンピュータプログラム |
JP2021525470A (ja) | 2018-06-06 | 2021-09-24 | キヤノン株式会社 | メディアコンテンツを送信する方法、装置及びコンピュータプログラム |
JP2021528891A (ja) | 2018-06-27 | 2021-10-21 | キヤノン株式会社 | メディアコンテンツを送信する方法、装置及びコンピュータプログラム |
JP2022546910A (ja) | 2019-12-17 | 2022-11-10 | キヤノン株式会社 | メディアコンテンツのカプセル化を改善するための方法、デバイス、およびコンピュータプログラム |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7778526B2 (en) * | 2004-06-01 | 2010-08-17 | Nero Ag | System and method for maintaining DVD-subpicture streams upon conversion to higher compressed data format |
US9922680B2 (en) | 2015-02-10 | 2018-03-20 | Nokia Technologies Oy | Method, an apparatus and a computer program product for processing image sequence tracks |
US10951871B2 (en) | 2016-12-28 | 2021-03-16 | Sony Corporation | Generation device, identification information generation method, reproduction device, and image reproduction related to stereo packing of projected frames |
US11062738B2 (en) * | 2017-03-23 | 2021-07-13 | Qualcomm Incorporated | Signalling of video content including sub-picture bitstreams for video coding |
EP3646593A4 (en) | 2017-06-26 | 2021-03-31 | Nokia Technologies Oy | APPARATUS, PROCESS AND COMPUTER PROGRAM FOR OMNIDIRECTIONAL VIDEO |
CN109587478B (zh) * | 2017-09-29 | 2023-03-31 | 华为技术有限公司 | 一种媒体信息的处理方法及装置 |
CN112544084B (zh) | 2018-05-15 | 2024-03-01 | 夏普株式会社 | 图像编码装置、编码流提取装置以及图像解码装置 |
US20210008482A1 (en) | 2019-07-10 | 2021-01-14 | Violeta Staykova | System and method to verify replacement of a heating-venting and air-conditioning system air filter |
-
2020
- 2020-12-17 BR BR112022012990A patent/BR112022012990A2/pt unknown
- 2020-12-17 CN CN202080091336.7A patent/CN114930868A/zh active Pending
- 2020-12-17 WO PCT/FI2020/050847 patent/WO2021136880A1/en unknown
- 2020-12-17 JP JP2022540734A patent/JP7472292B2/ja active Active
- 2020-12-17 US US17/786,766 patent/US12088971B2/en active Active
- 2020-12-17 EP EP20909367.3A patent/EP4085645A4/en active Pending
- 2020-12-17 KR KR1020227026229A patent/KR20220114088A/ko active Search and Examination
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160165321A1 (en) | 2013-07-23 | 2016-06-09 | Canon Kabushiki Kaisha | Method, device, and computer program for encapsulating partitioned timed media data using sub-track feature |
WO2017202799A1 (en) | 2016-05-24 | 2017-11-30 | Canon Kabushiki Kaisha | Method, device, and computer program for encapsulating and parsing timed media data |
JP2020511816A (ja) | 2017-03-27 | 2020-04-16 | キヤノン株式会社 | メディアデータ生成方法 |
JP2020537376A (ja) | 2017-10-12 | 2020-12-17 | キヤノン株式会社 | 時限メディアデータを生成する方法、装置、およびコンピュータプログラム |
WO2019138929A1 (ja) | 2018-01-12 | 2019-07-18 | ソニー株式会社 | 情報処理装置および方法 |
JP2021525470A (ja) | 2018-06-06 | 2021-09-24 | キヤノン株式会社 | メディアコンテンツを送信する方法、装置及びコンピュータプログラム |
JP2021528891A (ja) | 2018-06-27 | 2021-10-21 | キヤノン株式会社 | メディアコンテンツを送信する方法、装置及びコンピュータプログラム |
JP2022546910A (ja) | 2019-12-17 | 2022-11-10 | キヤノン株式会社 | メディアコンテンツのカプセル化を改善するための方法、デバイス、およびコンピュータプログラム |
Non-Patent Citations (2)
Title |
---|
"Information technology - Coding of audio-visual objects - Part 15: Carriage of network abstraction layer (NAL) unit structured video in the ISO base media file format",ISO/IEC 14496-15:2022(E),Sixth edition,ISO/IEC,2022年10月,Pages 130-139,150,151,275-277. |
Miska M. Hannuksela, et al.,"An Overview of the OMAF Standard for 360°Video",Proceedings of 2019 Data Compression Conference (DCC),2019年03月29日,Pages 418-427,Electronic ISBN:978-1-7281-0657-1, Electronic ISSN: 2375-0359, <DOI: 10.1109/DCC.2019.00050>. |
Also Published As
Publication number | Publication date |
---|---|
JP2023508736A (ja) | 2023-03-03 |
EP4085645A1 (en) | 2022-11-09 |
EP4085645A4 (en) | 2023-12-27 |
BR112022012990A2 (pt) | 2022-11-16 |
US20230027058A1 (en) | 2023-01-26 |
US12088971B2 (en) | 2024-09-10 |
KR20220114088A (ko) | 2022-08-17 |
CN114930868A (zh) | 2022-08-19 |
WO2021136880A1 (en) | 2021-07-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11778171B2 (en) | Apparatus, a method and a computer program for video coding and decoding | |
JP7472292B2 (ja) | ビデオ符号化およびビデオ復号のための方法、装置、およびコンピュータプログラム製品 | |
US11818371B2 (en) | Coded picture with mixed VCL NAL unit type | |
US11943462B2 (en) | Signaling of constraint flags using gate flag in coded video stream | |
US11589052B2 (en) | Techniques for bitstream extraction for subpicture in coded video stream | |
US11812035B2 (en) | Method for alignment across layers in coded video stream | |
US20240187621A1 (en) | Derivation on sublayer-wise output layer set | |
AU2023203628A1 (en) | Techniques for bitstream extraction for subpicture in coded video stream | |
US12095985B2 (en) | Method for derivation of picture output for non-referenced picture in coded video stream | |
US20230089992A1 (en) | Method for indication of sublayer numbers in multilayered video stream | |
US20240040131A1 (en) | A method, an apparatus and a computer program product for video encoding and video decoding | |
CN114586364B (zh) | 编解码方法、解码装置、解码设备以及计算机可读存储介质 | |
CN114586364A (zh) | 用于多层视频流中的输出层集模式的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220630 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220630 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230615 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20230915 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20231115 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231213 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240311 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240410 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7472292 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |