JP7444872B2 - メディアデータをメディアファイルにカプセル化するための方法、装置、およびコンピュータプログラム - Google Patents
メディアデータをメディアファイルにカプセル化するための方法、装置、およびコンピュータプログラム Download PDFInfo
- Publication number
- JP7444872B2 JP7444872B2 JP2021522002A JP2021522002A JP7444872B2 JP 7444872 B2 JP7444872 B2 JP 7444872B2 JP 2021522002 A JP2021522002 A JP 2021522002A JP 2021522002 A JP2021522002 A JP 2021522002A JP 7444872 B2 JP7444872 B2 JP 7444872B2
- Authority
- JP
- Japan
- Prior art keywords
- track
- sample
- mode
- media
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 45
- 238000004590 computer program Methods 0.000 title claims description 5
- FMYKJLXRRQTBOR-UBFHEZILSA-N (2s)-2-acetamido-4-methyl-n-[4-methyl-1-oxo-1-[[(2s)-1-oxohexan-2-yl]amino]pentan-2-yl]pentanamide Chemical group CCCC[C@@H](C=O)NC(=O)C(CC(C)C)NC(=O)[C@H](CC(C)C)NC(C)=O FMYKJLXRRQTBOR-UBFHEZILSA-N 0.000 claims description 4
- 238000005538 encapsulation Methods 0.000 description 32
- 238000000605 extraction Methods 0.000 description 18
- 230000007246 mechanism Effects 0.000 description 14
- 239000002131 composite material Substances 0.000 description 12
- 238000012545 processing Methods 0.000 description 12
- 238000012360 testing method Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 9
- 230000008569 process Effects 0.000 description 9
- 238000004891 communication Methods 0.000 description 8
- AWSBQWZZLBPUQH-UHFFFAOYSA-N mdat Chemical compound C1=C2CC(N)CCC2=CC2=C1OCO2 AWSBQWZZLBPUQH-UHFFFAOYSA-N 0.000 description 8
- 230000008901 benefit Effects 0.000 description 7
- 239000010410 layer Substances 0.000 description 7
- 238000009877 rendering Methods 0.000 description 7
- 230000011664 signaling Effects 0.000 description 7
- 239000012634 fragment Substances 0.000 description 6
- 230000006835 compression Effects 0.000 description 4
- 238000007906 compression Methods 0.000 description 4
- 230000000007 visual effect Effects 0.000 description 4
- 230000003044 adaptive effect Effects 0.000 description 3
- 230000006399 behavior Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000003068 static effect Effects 0.000 description 3
- 230000002123 temporal effect Effects 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 2
- 238000013075 data extraction Methods 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 102100025027 E3 ubiquitin-protein ligase TRIM69 Human genes 0.000 description 1
- 101000830203 Homo sapiens E3 ubiquitin-protein ligase TRIM69 Proteins 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 230000004931 aggregating effect Effects 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000004806 packaging method and process Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000002356 single layer Substances 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000000153 supplemental effect Effects 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/83—Generation or processing of protective or descriptive data associated with content; Content structuring
- H04N21/845—Structuring of content, e.g. decomposing content into time segments
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/83—Generation or processing of protective or descriptive data associated with content; Content structuring
- H04N21/845—Structuring of content, e.g. decomposing content into time segments
- H04N21/8456—Structuring of content, e.g. decomposing content into time segments by decomposing the content in the time domain, e.g. in time segments
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/85—Assembly of content; Generation of multimedia applications
- H04N21/854—Content authoring
- H04N21/85406—Content authoring involving a specific file format, e.g. MP4 format
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/234—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
- H04N21/2343—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
- H04N21/23439—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements for generating different versions
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/235—Processing of additional data, e.g. scrambling of additional data or processing content descriptors
- H04N21/2353—Processing of additional data, e.g. scrambling of additional data or processing content descriptors specifically adapted to content descriptors, e.g. coding, compressing or processing of metadata
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/235—Processing of additional data, e.g. scrambling of additional data or processing content descriptors
- H04N21/2355—Processing of additional data, e.g. scrambling of additional data or processing content descriptors involving reformatting operations of additional data, e.g. HTML pages
- H04N21/2358—Processing of additional data, e.g. scrambling of additional data or processing content descriptors involving reformatting operations of additional data, e.g. HTML pages for generating different versions, e.g. for different recipient devices
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/83—Generation or processing of protective or descriptive data associated with content; Content structuring
- H04N21/84—Generation or processing of descriptive data, e.g. content descriptors
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/83—Generation or processing of protective or descriptive data associated with content; Content structuring
- H04N21/845—Structuring of content, e.g. decomposing content into time segments
- H04N21/8455—Structuring of content, e.g. decomposing content into time segments involving pointers to the content, e.g. pointers to the I-frames of the video stream
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Library & Information Science (AREA)
- Computer Security & Cryptography (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Description
複数のメディアサンプルを含む第1のトラックを前記メディアファイルに含めることであって、各メディアサンプルは1つまたは複数のNALユニットのセットを含む、前記含めることと、
抽出器を含む第2のトラックを前記メディアファイルに含めることであって、前記抽出器は前記第1のトラックに含まれる1つのメディアサンプル内のデータエンティティを参照する構造である、前記含めることと、
前記1つのメディアサンプル内に含まれる1つまたは複数のNALユニットに対して前記参照されたデータエンティティを前記1つのメディアサンプル内で識別するコピーモード属性を前記抽出器に含めることと、
を含む。
前記データエンティティが前記サンプルに含まれる全てのNALユニットのセットを含む第1のモード、
前記データエンティティが前記NALユニットのセットの1つのNALユニットを含む第2のモード、
前記データエンティティが前記NALユニットのセットの1つのNALユニットのペイロードを含む第3のモード、
前記データエンティティが前記NALユニットのセット内の指定された位置にある1つのNALユニットを含む第4のモード、
前記データエンティティが前記NALユニットのセット内の指定された位置にある1つのNALユニットのペイロードを含む第5のモード、
の1つまたは複数を含む。
メディアコンテンツをメディアデータに符号化することと、
上述のカプセル化する方法に従って、前記メディアデータを複数のトラックにカプセル化することと、
前記カプセル化されたメディアデータを含む少なくとも1つのメディアファイルを生成することと、
を含む。
上述の方法に従ってサーバ機器によってメディアファイルを生成することと、
前記生成されたメディアファイルをクライアント機器に送信することと、
を含む。
抽出器を含む第1のトラックを前記メディアファイルから取得することであって、前記抽出器は第2のトラックに含まれる1つのメディアサンプル内のデータエンティティを参照する構造である、前記取得することと、
複数のメディアサンプルを含む前記第2のトラックを前記メディアファイルから取得することであって、各メディアサンプルは1つまたは複数のNALユニットのセットを含む、前記取得することと、
前記抽出器に含まれるコピーモード属性によって識別される1つのデータエンティティを前記第2のトラックの1つのメディアサンプルから取得することと、
を含み、
前記コピーモード属性は、前記1つのメディアサンプル内に含まれる1つまたは複数のNALユニットに対して前記参照されたデータエンティティを前記1つのメディアサンプル内で識別する。
NALUnitHeader();
do {
unsigned int(8) constructor_type;
if( constructor_type == 0 )
SampleConstructor();
else if( constructor_type == 2 )
InlineConstructor();
else if ( constructor_type == 3 )
SampleConstructorFromStructure();
} while( !EndOfNALUnit() )
}
unsigned int(8) ref_index;
unsigned int(2) copy_mode;
if (copy_mode != 0) {
unsigned int(1) nalu_idc_field_size;
unsigned int(5) reserved;
unsigned int((nalu_idc_field_size+1)*8) nalu_idc;
} else {
unsigned int(6) reserved;
}
}
-”ref_index”は、データを抽出するTrack_IDを見つけるために使用するタイプ「scal」のトラック参照のインデックスを指定する。ISOBMFFの修正により、トラック参照がトラックやトラックグループを参照することができるようになったことに注意する。ref_indexがtrack_group_idに解決された場合、パーサやプレーヤは、track grouping_typeに応じて、対応するトラックグループ内の最も適切なトラックを選択する。デフォルトの動作は、指定されたtrack_group_idを持つファイルの最初のトラックを選択することである。
-”copy_mode”は、抽出器を解決する際に実行されるコピー操作(すなわち、コピーモード)を指定する。例えば、以下の値の1つ以上が選択される。
-”0”は、「サンプル」モード、すなわち、サンプルの最初のバイトからサンプルの最後までを含めてコピーすることを示す。サンプルの最初のバイトは、Sample to Chunk BoxおよびChunk Offset Boxから決定することができます。
-”1”は、「NALU」モード、すなわちi番目のNALユニットの最初のバイトから同じNALユニットの最後のバイトまでのコピー(iはnalu_idcフィールドに対応する)を示す。NALユニットに対応するコピーするバイトの長さは、メディアデータボックス「mdat」のNALユニット212の前にある長さフィールド211から決定される。
-”2”は、「NALU_payload」モード、すなわち、i番目のNALユニットのペイロードの最初のバイトから、同じNALユニットの最後のバイトまでのコピーを示す。
-”3”は、「slice_data」モード、すなわち、i番目のslice_dataの最初のバイトからこの同じsliceの最後のバイトまでのコピー(iはnalu_idcフィールドに対応する)を示す。パーサやリーダは、例えば、スライスヘッダ長の記述専用のISOBMFF構造体を読み取ることで、コピーする最初のバイトの位置を決定する。これは、サンプルに対してスライスヘッダの長さを提供する専用のサンプルグループや、各NALユニットに対してスライスヘッダの長さを提供するインストリーム構造によって示されることがある。
-「nalu_idc_field_size」:このフィールドは、nalu_idcパラメータの符号化に使われる1バイトを引いたバイト数を示す。
-「nalu_idc」:copy_modeがNALUベースの場合(copy_mode !=0)、このフィールドは抽出元となるNALUのインデックス(1ベースのインデックス)を示す。値0は予約済みである。
NALUnitHeader();
unsigned int(8) ref_index;
signed int(8) sample_offset;
unsigned int(2) copy_mode;
if (copy_mode !=0 ) { // 0: sample copy mode
unsigned int(1) nalu_idc_field_size;
unsigned int(5) reserved;
unsigned int((nalu_idc_field_size+1)*8) nalu_idc;
} else {
unsigned int(6) reserved;
}
}
unsigned int(8) ref_index; // an identifier for a group of tracks
unsigned int(2) copy_mode; // sample, NALU, NALU payload, slice data
unsigned int(1) time_aligned_extraction;
if (time_aligned_extraction == 1) {
signed int(8) sample_offset;
}
if (copy_mode != 0) {
unsigned int(1) nalu_idc_field_size;
unsigned int(4) reserved;
unsigned int((nalu_idc_field_size + 1) * 8) nalu_idc;
} else {
unsigned int(5) reserved;
}
}
NALUnitHeader();
unsigned int(8) ref_index;
signed int(8) sample_offset;
unsigned int(1) aligned_RAPs
if (aligned_RAPs == 0) {
unsigned int (8) switchable_tracks;
}
unsigned int(2) copy_mode;
if (copy_mode !=0 ) { // 0: sample copy mode
unsigned int(1) nalu_idc_field_size;
unsigned int(4) reserved;
unsigned int((nalu_idc_field_size+1)*8) nalu_idc;
} else {
unsigned int(5) reserved;
}
}
unsigned int(8) ref_index;
unsigned int(2) copy_mode;
unsigned int(1) aligned_RAPs
if (aligned_RAPs == 0) {
unsigned int (8) switchable_tracks;
}
if (copy_mode != 0) {
unsigned int(1) nalu_idc_field_size;
unsigned int(4) reserved;
unsigned int((nalu_idc_field_size+1)*8) nalu_idc;
} else {
unsigned int(5) reserved;
}
}
NALUnitHeader();
do {
unsigned int(8) constructor_type;
if( constructor_type == 0 )
SampleConstructor();
else if( constructor_type == 2 )
InlineConstructor();
else if ( constructor_type == 3
SampleConstructorFromTrackGroup ();
} while( !EndOfNALUnit() )
}
「constructor_type」は、後続の構築器を指定する。SampleConstructor、InlineConstructorおよびSampleConstructorFromTrackGroupは、constructor_typeがそれぞれ0、2、および3に対応する。その他のconstructor_typeの値は予約されている。
unsigned int(8) ref_index;
unsigned int(2) copy_mode;
unsigned int(6) reserved;
if (copy_mode != 0) {
unsigned int(8) nalu_idc; // 1-based index
if (nalu_idc == 0){
unsigned int(8) escape_nalu_idc; // To address from 255 to 511
}
}
}
-ref_indexは、データを抽出するためのtrack_group_idを探すのに使用するタイプ「scal」のトラック参照のインデックスを指定する。track grouping_typeに応じて、対応するトラックグループの中から最も適切なトラックを選択するのは、パーサやプレイヤーの役目である。デフォルトの動作は、指定されたtrack_group_idを持つファイルの最初のトラックを選択することであり得る。
-属性”copy_mode”は、抽出器を解決する際に実行されるコピー操作を指定し、特に(どのバイト範囲をコピーするかではなく)どのシンタックス構造またはデータエンティティをコピーするかを指定する。
・copy_modeを0に設定:サンプルベースのコピーモード、すなわち、サンプルの1バイト目からサンプルの最後までのバイトをコピーする。サンプルの最初のバイトは、サンプルからチャンクボックスとチャンクオフセットボックスから判断できる。
・copy_modeを1に設定:NALユニットベースのコピーモード、すなわち、i番目のNALユニットの最初のバイトから、同じNALユニットの最後のバイトまでをコピーする。コピーする最初のバイトのオフセットは、NALユニット長フィールドの値に、NALユニット長フィールドのサイズと、nalu_idc-1個のNALユニットの集約器の場合はadditional_bytesフィールドの値を加算して計算される。NALユニットに対応するコピーするバイトの長さは、メディアデータボックス「mdat」のNALユニット212の前にある長さフィールド211から決定される。
・copy_modeを2に設定:NALUペイロードベースのコピーモード、すなわち、i番目のNALUペイロードの最初のバイトからこの同じNALUの最後のバイトまでのコピーで、iはnalu_idcフィールドに対応する。
・copy_modeを3に設定:slice_dataベースのコピーモード、すなわち、i番目のslice_dataの最初のバイトからこの同じsliceの最後のバイトまでのコピー(iはnalu_idcフィールドに対応する)を行う。パーサやリーダは、スライスヘッダの長さを記述したISOBMFF構造を読むなどして、コピーする最初のバイトの位置を決定する。
-nalu_idc属性は、copy_modeがNALユニットベースまたはslice-basedの場合(copy_mode !=0)、NALユニットのインデックス(1ベースインデックス、つまり値1から始まる)を指定する。値0は、255番目のNALUを超えて抽出するためのエスケープnalu_idcが存在することを示すために予約されている(HEVCレベル6のように、ピクチャごとに最大600個のスライスセグメントが含まれる場合などの稀なケースのため)。
-escape_nalu_idc:255番目のNALUを超えて抽出を開始するためのオフセットを示す。存在しない場合は、0とみなされる。存在する場合、値0は予約されており、512番目のNALユニットからのアドレスへの8ビットの別のエスケープ値(不図示)として必要に応じて使用できる。NALユニットはnalu_idc+escape_nalu_idcで表される。
NALUnitHeader();
unsigned int(8) ref_index;
signed int(8) sample_offset;
unsigned int(2) copy_mode;
unsigned int(6) reserved;
if (copy_mode !=0 ) { // 0: sample copy mode
unsigned int(8) nalu_idc; // a 1-based index;
if (nalu_idc == 0)
unsigned int(8) escape_nalu_idc; // to address from 256 to 511
}
}
-マイクロプロセッサのような中央処理装置(CPU)1001;
-マニフェストの読み書きおよび/またはビデオの符号化および/または所定のファイルフォーマットの下でのデータの読み書きに必要な変数およびパラメータを記録するために適合されたレジスタと同様の、本発明の実施形態に係る方法の実行コードを格納するランダムアクセスメモリ(RAM)1002であって、そのメモリ容量は、例えば、拡張ポートに接続されたオプションのRAMによって拡張可能である;
-本発明の実施形態を実現するためのコンピュータプログラムを格納するROM(読み取り専用メモリ)1003;
-典型的には、処理されるべきデジタルデータが送受信される通信ネットワークに接続されるネットワークインタフェース1004。ネットワークインタフェース1004は、単一のネットワークインタフェースであってもよいし、異なるネットワークインタフェースのセット(例えば、有線および無線のインタフェース、または、異なる種類の有線または無線のインタフェース)で構成されていてもよい。データは、CPU1001で動作するソフトウェアアプリケーションの制御下で、送信のためにネットワークインタフェースに書き込まれたり、受信のためにネットワークインタフェースから読み込まれたりする;
-ユーザからの入力を受け付けたり、ユーザに情報を表示したりするためのユーザインタフェース(UI)1005;
-ハードディスク(HD)1006;
-ビデオソースやディスプレイなどの外部機器との間でデータを送受信するためのI/Oモジュール1007
に接続された通信バスを備える。
Claims (11)
- メディアデータをメディアファイルにカプセル化する方法であって、該方法は、
それぞれ1つまたは複数のNALユニットのセットを含む複数のサンプルを含む第1のトラックを前記メディアファイルに含めることと、
前記第1のトラックに含まれるサンプルまたは当該サンプル内に含まれる1つまたは複数のNALユニットを参照する参照構造を有する抽出器を含む第2のトラックを前記メディアファイルに含めることと、
を含み、
前記抽出器は、前記サンプルまたは当該サンプル内に含まれる1つまたは複数のNALユニットに含まれるデータエンティティを識別してコピーするモードを、予め定められた複数のモードから指定する情報を含むコピーモード属性を含む
方法。 - 前記複数のモードは、
前記データエンティティが前記サンプルに含まれる全てのNALユニットのセットを含む第1のモード、
前記データエンティティが前記NALユニットのセットの1つのNALユニットを含む第2のモード、
前記データエンティティが前記NALユニットのセットの1つのNALユニットのペイロードを含む第3のモード、
前記データエンティティが前記NALユニットのセット内の指定された位置にある1つのNALユニットを含む第4のモード、
前記データエンティティが前記NALユニットのセット内の指定された位置にある1つのNALユニットのペイロードを含む第5のモード、
の1つまたは複数を含む
請求項1に記載の方法。 - 前記第2または前記第3のモードにおいて、前記1つのNALユニットは前記サンプル内の最初のNALユニットである
請求項2に記載の方法。 - 前記第2または前記第3のモードにおいて、前記1つのNALユニットは前記サンプル内の最後のNALユニットである
請求項2に記載の方法。 - メディアファイルを生成する方法であって、該方法は、
メディアコンテンツをメディアデータに符号化することと、
請求項1に記載の方法に従って、前記メディアデータを複数のトラックにカプセル化することと、
前記カプセル化されたメディアデータを含む少なくとも1つのメディアファイルを生成することと、
を含む方法。 - メディアファイルを送信する方法であって、該方法は、
請求項5に記載の方法に従ってサーバ機器によってメディアファイルを生成することと、
前記生成されたメディアファイルをクライアント機器に送信することと、
を含む方法。 - メディアデータを生成するためにメディアファイルをパースする方法であって、該方法は、
第2のトラックに含まれるサンプルまたは当該サンプル内に含まれる1つまたは複数のNALユニットを参照する参照構造を有する抽出器を含む第1のトラックを前記メディアファイルから取得することと、
それぞれ1つまたは複数のNALユニットのセットを含む複数のサンプルを含む前記第2のトラックを前記メディアファイルから取得することと、
前記抽出器に含まれるコピーモード属性によって識別されるデータエンティティを前記第2のトラックのサンプルから取得することと、
を含み、
前記コピーモード属性は、前記サンプルまたは当該サンプル内に含まれる1つまたは複数のNALユニットに含まれるデータエンティティを識別してコピーするモードを、予め定められた複数のモードから指定する情報を含む
方法。 - メディアデータをメディアファイルにカプセル化するコンピュータデバイスであって、該コンピュータデバイスは、
それぞれ1つまたは複数のNALユニットのセットを含む複数のサンプルを含む第1のトラックを前記メディアファイルに含める手段と、
前記第1のトラックに含まれるサンプルまたは当該サンプル内に含まれる1つまたは複数のNALユニットを参照する参照構造を有する抽出器を含む第2のトラックを前記メディアファイルに含める手段と、
を備え、
前記抽出器は、前記サンプルまたは当該サンプル内に含まれる1つまたは複数のNALユニットに含まれるデータエンティティを識別してコピーするモードを、予め定められた複数のモードから指定する情報を含むコピーモード属性を含む
ように構成されているコンピュータデバイス。 - メディアデータを生成するためにメディアファイルをパースするコンピュータデバイスであって、該コンピュータデバイスは、
第2のトラックに含まれるサンプルまたは当該サンプル内に含まれる1つまたは複数のNALユニットを参照する参照構造を有する抽出器を含む第1のトラックを前記メディアファイルから取得する手段と、
それぞれ1つまたは複数のNALユニットのセットを含む複数のサンプルを含む前記第2のトラックを前記メディアファイルから取得する手段と、
前記抽出器に含まれるコピーモード属性によって識別されるデータエンティティを前記第2のトラックのサンプルから取得する手段と、
を備え、
前記コピーモード属性は、前記サンプルまたは当該サンプル内に含まれる1つまたは複数のNALユニットに含まれるデータエンティティを識別してコピーするモードを、予め定められた複数のモードから指定する情報を含む
ように構成されているコンピュータデバイス。 - 請求項1乃至7の何れか1項に記載の方法を実施するためのコンピュータプログラムの命令を格納したコンピュータ可読記憶媒体。
- 実行すると請求項1乃至7の何れか1項に記載の方法を実行させるコンピュータプログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
GB1819501.6 | 2018-11-29 | ||
GB1819501.6A GB2579389B (en) | 2018-11-29 | 2018-11-29 | Method, device and computer program for encapsulating media data into a media file |
PCT/EP2019/082192 WO2020109154A1 (en) | 2018-11-29 | 2019-11-22 | Method, device, and computer program for encapsulating media data into a media file |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2022511639A JP2022511639A (ja) | 2022-02-01 |
JPWO2020109154A5 JPWO2020109154A5 (ja) | 2022-11-22 |
JP7444872B2 true JP7444872B2 (ja) | 2024-03-06 |
Family
ID=65024955
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021522002A Active JP7444872B2 (ja) | 2018-11-29 | 2019-11-22 | メディアデータをメディアファイルにカプセル化するための方法、装置、およびコンピュータプログラム |
Country Status (6)
Country | Link |
---|---|
US (1) | US11638066B2 (ja) |
EP (1) | EP3888375A1 (ja) |
JP (1) | JP7444872B2 (ja) |
CN (1) | CN113170239B (ja) |
GB (1) | GB2579389B (ja) |
WO (1) | WO2020109154A1 (ja) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3734970B1 (en) * | 2019-01-08 | 2023-07-05 | Samsung Electronics Co., Ltd. | Method for processing and transmitting three-dimensional content |
US20220335978A1 (en) * | 2019-09-13 | 2022-10-20 | Nokia Technologies Oy | An apparatus, a method and a computer program for video coding and decoding |
US11589032B2 (en) * | 2020-01-07 | 2023-02-21 | Mediatek Singapore Pte. Ltd. | Methods and apparatus for using track derivations to generate new tracks for network based media processing applications |
US11871143B2 (en) | 2020-09-17 | 2024-01-09 | Lemon Inc. | Subpicture tracks in coded video |
US11930295B2 (en) * | 2020-09-17 | 2024-03-12 | Lemon Inc. | Handling of non-VCL NAL units in picture unit construction |
US11683529B2 (en) * | 2020-09-17 | 2023-06-20 | Lemon Inc. | Operational point sample group in coded video |
US20240056618A1 (en) * | 2020-12-17 | 2024-02-15 | Lg Electronics Inc. | Method and device for generating/receiving media file including nal unit array information, and method for transmitting media file |
US20220201308A1 (en) * | 2020-12-18 | 2022-06-23 | Lg Electronics Inc. | Media file processing method and device therefor |
CN113905255B (zh) * | 2021-09-28 | 2022-08-02 | 腾讯科技(深圳)有限公司 | 媒体数据的编辑方法、媒体数据的封装方法及相关设备 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013505646A (ja) | 2009-09-22 | 2013-02-14 | クゥアルコム・インコーポレイテッド | ファイルフォーマットトラック選択のためのメディアエクストラクタトラック |
WO2017029400A1 (en) | 2015-08-20 | 2017-02-23 | Koninklijke Kpn N.V. | Forming one or more tile streams on the basis of one or more video streams |
WO2017140945A1 (en) | 2016-02-17 | 2017-08-24 | Nokia Technologies Oy | An apparatus, a method and a computer program for video coding and decoding |
JP2018524877A (ja) | 2015-06-16 | 2018-08-30 | キヤノン株式会社 | カプセル化されたビットストリームからメディアデータ及びメタデータを取得するための、動作基点ディスクリプタを動的に設置可能な方法、デバイス及びコンピュータプログラム |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8976871B2 (en) * | 2009-09-16 | 2015-03-10 | Qualcomm Incorporated | Media extractor tracks for file format track selection |
BR112012031874A2 (pt) | 2010-06-14 | 2017-11-28 | Thomsom Licensing | método e aparelho para encapsular vídeo multicomponente codificado |
EP2946566B1 (en) | 2013-01-18 | 2021-09-01 | Canon Kabushiki Kaisha | Method, device, and computer program for encapsulating partitioned timed media data |
US9712843B2 (en) * | 2013-10-23 | 2017-07-18 | Qualcomm Incorporated | Multi-layer video file format designs |
GB2522014A (en) * | 2014-01-07 | 2015-07-15 | Canon Kk | Method, device, and computer program for encoding inter-layer dependencies in encapsulating multi-layer partitioned timed media data |
GB2558086B (en) * | 2014-03-25 | 2019-02-20 | Canon Kk | Methods, devices, and computer programs for improving streaming of partitioned timed media data |
EP3360330B1 (en) * | 2015-10-08 | 2021-03-24 | Koninklijke KPN N.V. | Enhancing a region of interest in video frames of a video stream |
-
2018
- 2018-11-29 GB GB1819501.6A patent/GB2579389B/en active Active
-
2019
- 2019-11-22 CN CN201980078791.0A patent/CN113170239B/zh active Active
- 2019-11-22 US US17/291,863 patent/US11638066B2/en active Active
- 2019-11-22 JP JP2021522002A patent/JP7444872B2/ja active Active
- 2019-11-22 EP EP19808782.7A patent/EP3888375A1/en active Pending
- 2019-11-22 WO PCT/EP2019/082192 patent/WO2020109154A1/en unknown
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013505646A (ja) | 2009-09-22 | 2013-02-14 | クゥアルコム・インコーポレイテッド | ファイルフォーマットトラック選択のためのメディアエクストラクタトラック |
JP2018524877A (ja) | 2015-06-16 | 2018-08-30 | キヤノン株式会社 | カプセル化されたビットストリームからメディアデータ及びメタデータを取得するための、動作基点ディスクリプタを動的に設置可能な方法、デバイス及びコンピュータプログラム |
WO2017029400A1 (en) | 2015-08-20 | 2017-02-23 | Koninklijke Kpn N.V. | Forming one or more tile streams on the basis of one or more video streams |
WO2017140945A1 (en) | 2016-02-17 | 2017-08-24 | Nokia Technologies Oy | An apparatus, a method and a computer program for video coding and decoding |
Also Published As
Publication number | Publication date |
---|---|
US11638066B2 (en) | 2023-04-25 |
CN113170239A (zh) | 2021-07-23 |
CN113170239B (zh) | 2024-03-22 |
JP2022511639A (ja) | 2022-02-01 |
US20220014827A1 (en) | 2022-01-13 |
GB2579389A (en) | 2020-06-24 |
WO2020109154A1 (en) | 2020-06-04 |
GB201819501D0 (en) | 2019-01-16 |
GB2579389B (en) | 2022-07-27 |
EP3888375A1 (en) | 2021-10-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7444872B2 (ja) | メディアデータをメディアファイルにカプセル化するための方法、装置、およびコンピュータプログラム | |
CN110870321B (zh) | 用于媒体内容的按区包装,内容覆盖度,以及发信帧包装 | |
JP6572222B2 (ja) | メディアファイルの生成方法、生成装置、及びプログラム | |
JP6743059B2 (ja) | カプセル化されたビットストリームからメディアデータ及びメタデータを取得するための、動作基点ディスクリプタを動的に設置可能な方法、デバイス及びコンピュータプログラム | |
JP7472220B2 (ja) | 方法、プログラム、及びデバイス | |
KR102320455B1 (ko) | 미디어 콘텐트를 전송하는 방법, 디바이스, 및 컴퓨터 프로그램 | |
CN114503599A (zh) | 使用gltf2场景描述中的扩展来支持视频和音频数据 | |
CN111034203A (zh) | 处理具有动态逐区封装的全向媒体 | |
JP7373581B2 (ja) | メディアコンテンツにおけるレイトバインディングのための方法および装置 | |
GB2608399A (en) | Method, device, and computer program for dynamically encapsulating media content data | |
US20220360831A1 (en) | Method, device, and computer program for encapsulating media data into a media file | |
JP2024525266A (ja) | メディアコンテンツデータを動的にカプセル化する方法、装置、およびコンピュータプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221114 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20221114 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20231018 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20231027 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231226 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240126 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240222 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 7444872 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |