JP7471731B2 - メディアファイルのカプセル化方法、メディアファイルのカプセル化解除方法及び関連機器 - Google Patents
メディアファイルのカプセル化方法、メディアファイルのカプセル化解除方法及び関連機器 Download PDFInfo
- Publication number
- JP7471731B2 JP7471731B2 JP2022561600A JP2022561600A JP7471731B2 JP 7471731 B2 JP7471731 B2 JP 7471731B2 JP 2022561600 A JP2022561600 A JP 2022561600A JP 2022561600 A JP2022561600 A JP 2022561600A JP 7471731 B2 JP7471731 B2 JP 7471731B2
- Authority
- JP
- Japan
- Prior art keywords
- file
- application scene
- media
- media stream
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 155
- 238000005538 encapsulation Methods 0.000 claims description 203
- 238000009877 rendering Methods 0.000 claims description 28
- 238000003860 storage Methods 0.000 claims description 27
- 238000013507 mapping Methods 0.000 claims description 21
- 230000005540 biological transmission Effects 0.000 claims description 14
- 238000004590 computer program Methods 0.000 claims description 12
- 230000000007 visual effect Effects 0.000 claims description 8
- 238000012546 transfer Methods 0.000 claims description 5
- 238000010586 diagram Methods 0.000 description 26
- 238000012545 processing Methods 0.000 description 16
- 230000008569 process Effects 0.000 description 14
- 230000011664 signaling Effects 0.000 description 10
- 230000006835 compression Effects 0.000 description 8
- 238000007906 compression Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 8
- 238000004891 communication Methods 0.000 description 7
- 230000003287 optical effect Effects 0.000 description 6
- 238000005259 measurement Methods 0.000 description 4
- 230000003068 static effect Effects 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000006978 adaptation Effects 0.000 description 2
- 239000012634 fragment Substances 0.000 description 2
- 238000007654 immersion Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000004020 conductor Substances 0.000 description 1
- 230000009365 direct transmission Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000012856 packing Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L65/00—Network arrangements, protocols or services for supporting real-time applications in data packet communication
- H04L65/60—Network streaming of media packets
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N13/00—Stereoscopic video systems; Multi-view video systems; Details thereof
- H04N13/10—Processing, recording or transmission of stereoscopic or multi-view image signals
- H04N13/106—Processing image signals
- H04N13/172—Processing image signals image signals comprising non-image signal components, e.g. headers or format information
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/597—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L65/00—Network arrangements, protocols or services for supporting real-time applications in data packet communication
- H04L65/60—Network streaming of media packets
- H04L65/61—Network streaming of media packets for supporting one-way streaming services, e.g. Internet radio
- H04L65/612—Network streaming of media packets for supporting one-way streaming services, e.g. Internet radio for unicast
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L65/00—Network arrangements, protocols or services for supporting real-time applications in data packet communication
- H04L65/60—Network streaming of media packets
- H04L65/70—Media network packetisation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L65/00—Network arrangements, protocols or services for supporting real-time applications in data packet communication
- H04L65/60—Network streaming of media packets
- H04L65/75—Media network packet handling
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L65/00—Network arrangements, protocols or services for supporting real-time applications in data packet communication
- H04L65/60—Network streaming of media packets
- H04L65/75—Media network packet handling
- H04L65/765—Media network packet handling intermediate
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N13/00—Stereoscopic video systems; Multi-view video systems; Details thereof
- H04N13/10—Processing, recording or transmission of stereoscopic or multi-view image signals
- H04N13/106—Processing image signals
- H04N13/128—Adjusting depth or disparity
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N13/00—Stereoscopic video systems; Multi-view video systems; Details thereof
- H04N13/10—Processing, recording or transmission of stereoscopic or multi-view image signals
- H04N13/106—Processing image signals
- H04N13/161—Encoding, multiplexing or demultiplexing different image signal components
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/21—Server components or server architectures
- H04N21/218—Source of audio or video content, e.g. local disk arrays
- H04N21/21805—Source of audio or video content, e.g. local disk arrays enabling multiple viewpoints, e.g. using a plurality of cameras
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/236—Assembling of a multiplex stream, e.g. transport stream, by combining a video stream with other content or additional data, e.g. inserting a URL [Uniform Resource Locator] into a video stream, multiplexing software data into a video stream; Remultiplexing of multiplex streams; Insertion of stuffing bits into the multiplex stream, e.g. to obtain a constant bit-rate; Assembling of a packetised elementary stream
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/236—Assembling of a multiplex stream, e.g. transport stream, by combining a video stream with other content or additional data, e.g. inserting a URL [Uniform Resource Locator] into a video stream, multiplexing software data into a video stream; Remultiplexing of multiplex streams; Insertion of stuffing bits into the multiplex stream, e.g. to obtain a constant bit-rate; Assembling of a packetised elementary stream
- H04N21/23605—Creation or processing of packetized elementary streams [PES]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/236—Assembling of a multiplex stream, e.g. transport stream, by combining a video stream with other content or additional data, e.g. inserting a URL [Uniform Resource Locator] into a video stream, multiplexing software data into a video stream; Remultiplexing of multiplex streams; Insertion of stuffing bits into the multiplex stream, e.g. to obtain a constant bit-rate; Assembling of a packetised elementary stream
- H04N21/23614—Multiplexing of additional data and video streams
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/238—Interfacing the downstream path of the transmission network, e.g. adapting the transmission rate of a video stream to network bandwidth; Processing of multiplex streams
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/25—Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
- H04N21/262—Content or additional data distribution scheduling, e.g. sending additional data at off-peak times, updating software modules, calculating the carousel transmission frequency, delaying a video stream transmission, generating play-lists
- H04N21/26258—Content or additional data distribution scheduling, e.g. sending additional data at off-peak times, updating software modules, calculating the carousel transmission frequency, delaying a video stream transmission, generating play-lists for generating a list of items to be played back in a given order, e.g. playlist, or scheduling item distribution according to such list
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/81—Monomedia components thereof
- H04N21/816—Monomedia components thereof involving special video data, e.g 3D video
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/83—Generation or processing of protective or descriptive data associated with content; Content structuring
- H04N21/845—Structuring of content, e.g. decomposing content into time segments
- H04N21/8456—Structuring of content, e.g. decomposing content into time segments by decomposing the content in the time domain, e.g. in time segments
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/85—Assembly of content; Generation of multimedia applications
- H04N21/854—Content authoring
- H04N21/85406—Content authoring involving a specific file format, e.g. MP4 format
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L2212/00—Encapsulation of packets
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- Databases & Information Systems (AREA)
- Computer Security & Cryptography (AREA)
- Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Television Signal Processing For Recording (AREA)
Description
本部分で使用される数学演算子及び優先順位はC言語を参照する。特に説明しない限り、番号付け及びカウントは0から開始することを約束する。
extends FullBox(’vvhd’, version = 0, 1) {
unsigned int(8) application_type;//8ビット符号なし整数の第1応用シーンタイプフィールド
}
aligned(8) class V3CBitstreamSampleEntry() extends VolumetricVisualSampleEntry (’v3e1’) { //6DoFメディアをカプセル化するときに、シングルトラック又はマルチトラックに応じてカプセル化することができるため、この構造はシングルトラックの場合に対応する。
V3CConfigurationBox config;
unsigned int(1) large_scale_atlas_flag;
bit(7) reserved; //予約フィールド、一般的に、フィールドは整数個のbyteを必要とし、従って、予約されたbit(ビット)で補足する必要がある。
if(large_scale_atlas_flag == 1){//大規模アトラス情報の多視点ビデオであることを示す
unsigned int(8) camera_count;
unsigned int(8) camera_count_contained;
unsigned int(8) padding_size_depth;
unsigned int(8) padding_size_texture;
for(i=0; i<camera_count_contained; i++){
unsigned int(8) camera_id;
float(32) camera_resolution_x;// float(32)は特定値の連続する32個のバイナリビットを取ることを表す
float(32) camera_resolution_y;
unsigned int(8) depth_downsample_factor;
unsigned int(32) texture_vetex_x;
unsigned int(32) texture_vetex_y;
unsigned int(32) depth_vetex_x;
unsigned int(32) depth_vetex_y;
}
}
}
aligned(8) class V3CSampleEntry() extends VolumetricVisualSampleEntry (’v3c1’) { //この構造はマルチトラックの場合に対応する。
V3CConfigurationBox config;
V3CUnitHeaderBox unit_header;
unsigned int(1) large_scale_atlas_flag;
bit(7) reserved;
if(large_scale_atlas_flag == 1){
unsigned int(8) camera_count;
unsigned int(8) camera_count_contained;
unsigned int(8) padding_size_depth;
unsigned int(8) padding_size_texture;
for(i=0; i<camera_count_contained; i++){
unsigned int(8) camera_id;
float(32) camera_resolution_x;
float(32) camera_resolution_y;
unsigned int(8) depth_downsample_factor;
unsigned int(32) texture_vetex_x;
unsigned int(32) texture_vetex_y;
unsigned int(32) depth_vetex_x;
unsigned int(32) depth_vetex_y;
}
}
}
DASH MPDシグナリングの下記[表3]に示すフォームにおいて第2応用シーンタイプフィールドv3cAppTypeを拡張できる。
large_scale_atlas_flag=1:camera_count=4;camera_count_contained=4;
padding_size_depth=0;padding_size_texture=0;
{camera_id=1;camera_resolution_x=100;camera_resolution_y=100;
depth_downsample_factor=0;texture_vetex =(0,0);depth_vetex = (0,200) }//視点1のテクスチャマップ及び視点1の深度マップ
{camera_id=2;camera_resolution_x=100;camera_resolution_y=100;
depth_downsample_factor=0;texture_vetex =(100,0);depth_vetex = (100,200) }//視点2のテクスチャマップ及び視点2の深度マップ
{camera_id=3;camera_resolution_x=100;camera_resolution_y=100;
depth_downsample_factor=0;texture_vetex =(0,100);depth_vetex = (0,300) }//視点3のテクスチャマップ及び視点3の深度マップ
{camera_id=4;camera_resolution_x=100;camera_resolution_y=100;
depth_downsample_factor=0;texture_vetex =(100,100);depth_vetex = (100,300) }//視点4のテクスチャマップ及び視点4の深度マップ
large_scale_atlas_flag=1:camera_count=4;camera_count_contained=4;
padding_size_depth=0;padding_size_texture=0;
{camera_id=1;camera_resolution_x=100;camera_resolution_y=100;
depth_downsample_factor=0;texture_vetex =(0,0);depth_vetex = (200,0) }
{camera_id=2;camera_resolution_x=100;camera_resolution_y=100;
depth_downsample_factor=0;texture_vetex =(100,0);depth_vetex = (300,0) }
{camera_id=3;camera_resolution_x=100;camera_resolution_y=100;
depth_downsample_factor=0;texture_vetex =(0,100);depth_vetex = (200,100) }
{camera_id=4;camera_resolution_x=100;camera_resolution_y=100;
depth_downsample_factor=0;texture_vetex =(100,100);depth_vetex = (300,100) }
large_scale_atlas_flag=1:camera_count=4;camera_count_contained=4;
padding_size_depth=0;padding_size_texture=0;
{camera_id=1;camera_resolution_x=100;camera_resolution_y=100;
depth_downsample_factor=1;texture_vetex =(0,0);depth_vetex = (0,200) }
{camera_id=2;camera_resolution_x=100;camera_resolution_y=100;
depth_downsample_factor=1;texture_vetex =(100,0);depth_vetex = (50,200) }
{camera_id=3;camera_resolution_x=100;camera_resolution_y=100;
depth_downsample_factor=1;texture_vetex =(0,100);depth_vetex = (100,200) }
{camera_id=4;camera_resolution_x=100;camera_resolution_y=100;
depth_downsample_factor=1;texture_vetex =(100,100);depth_vetex = (150,200) }
large_scale_atlas_flag=1:camera_count=4;camera_count_contained=2;
padding_size_depth=0;padding_size_texture=0;
{camera_id=1;camera_resolution_x=100;camera_resolution_y=100;
depth_downsample_factor=1;texture_vetex =(0,0);depth_vetex = (0,100) }//視点1のテクスチャマップ及び視点1の深度マップ
{camera_id=2;camera_resolution_x=100;camera_resolution_y=100;
depth_downsample_factor=1;texture_vetex =(100,0);depth_vetex = (100,100) }//視点2のテクスチャマップ及び視点2の深度マップ
large_scale_atlas_flag=1:camera_count=4;camera_count_contained=2;
padding_size_depth=0;padding_size_texture=0;
{camera_id=3;camera_resolution_x=100;camera_resolution_y=100;
depth_downsample_factor=1;texture_vetex =(0,0);depth_vetex = (0,100) }//視点3のテクスチャマップ及び視点3の深度マップ
{camera_id=4;camera_resolution_x=100;camera_resolution_y=100;
depth_downsample_factor=1;texture_vetex =(100,0);depth_vetex = (100,100) }//視点4のテクスチャマップ及び視点4の深度マップ
large_scale_atlas_flag=1:camera_count=4;camera_count_contained=4;
padding_size_depth=0;padding_size_texture=0;
{camera_id=1;camera_resolution_x=100;camera_resolution_y=100;
depth_downsample_factor=1;texture_vetex =(0,0);depth_vetex = (0,200) }
{camera_id=2;camera_resolution_x=100;camera_resolution_y=100;
depth_downsample_factor=1;texture_vetex =(100,0);depth_vetex = (50,200) }
{camera_id=3;camera_resolution_x=100;camera_resolution_y=100;
depth_downsample_factor=1;texture_vetex =(0,100);depth_vetex = (100,200) }
{camera_id=4;camera_resolution_x=100;camera_resolution_y=100;
depth_downsample_factor=1;texture_vetex =(100,100);depth_vetex = (150,200) }
1610 メディアストリーム取得ユニット
1620 メディアストリームカプセル化ユニット
1630 カプセル化ファイル送信ユニット
1640 カプセル化ファイル送信ユニット
1700 カプセル化解除装置
1710 カプセル化ファイル受信ユニット
1720 ファイルカプセル化解除ユニット
1730 応用シーン獲得ユニット
1740 復号レンダリング決定ユニット
1800 電子機器
1801 中央処理ユニット
1802 専用メモリ
1803 ランダムアクセスメモリ
1804 バス
1805 I/Oインタフェース
1806 入力部分
1807 出力部分
1808 記憶部分
1809 通信部分
1810 ドライバ
1811 媒体
Claims (17)
- 電子機器により実行される、メディアファイルのカプセル化方法であって、
ターゲットメディアコンテンツの当該ターゲットメディアコンテンツに対応する応用シーン下でのメディアストリームを取得するステップと、
ターゲットメディアファイルフォーマットデータボックスのボリュメトリックビジュアルメディアヘッダーデータボックスに、前記メディアストリームに対応する応用シーンのタイプを示す第1応用シーンタイプフィールドを追加し、前記メディアストリームに対応する応用シーンに基づき前記第1応用シーンタイプフィールドの数値を決定することで前記メディアストリームをカプセル化し、前記メディアストリームのカプセル化ファイルを生成するステップと、
前記カプセル化ファイルを第1機器に送信することにより前記第1機器は前記第1応用シーンタイプフィールドに基づき前記メディアストリームに対応する応用シーンを決定し、且つ前記メディアストリームに対応する応用シーンに基づき前記メディアストリームの復号方式及びレンダリング方式のうちの少なくとも一種を決定するステップと、を含む、メディアファイルのカプセル化方法。 - 前記第1応用シーンタイプフィールドの数値は、
前記メディアストリームが非大規模アトラス情報の多視点ビデオであることを表す第1値と、
前記メディアストリームが大規模アトラス情報の多視点ビデオであることを表す第2値と、
前記メディアストリームが従来のビデオ符号化方式に基づいて圧縮される点群メディアであることを表す第3値と、
前記メディアストリームが幾何学的特徴に基づいて圧縮される点群メディアであることを表す第4値と、
のうちのいずれか1つを含む、請求項1に記載のメディアファイルのカプセル化方法。 - 前記第1応用シーンタイプフィールドの数値が前記第2値に等しい場合には、前記方法は、
もし前記メディアストリームをシングルトラックに応じてカプセル化するなら、前記ターゲットメディアファイルフォーマットデータボックスのビットストリームサンプルエントリにおいて大規模アトラス識別子を追加するステップと、
もし前記大規模アトラス識別子が前記メディアストリームが大規模アトラス情報の多視点ビデオであることを示すなら、前記ビットストリームサンプルエントリにおいて、前記メディアストリームを収集するカメラの数量識別子、及び前記メディアストリームの現在のファイルに含まれるカメラに対応する視点数識別子を追加するステップと、
前記ビットストリームサンプルエントリにおいて、前記現在のファイルに含まれるカメラに対応する視点で収集されたテクスチャマップと深度マップとの解像度を追加するステップと、をさらに含む、請求項2に記載のメディアファイルのカプセル化方法。 - 前記方法は、
前記ビットストリームサンプルエントリにおいて、前記現在のファイルに含まれるカメラに対応する視点で収集された深度マップのダウンサンプリング倍数因子を追加する方式と、
前記ビットストリームサンプルエントリにおいて、前記現在のファイルに含まれるカメラに対応する視点で収集されたテクスチャマップの左上頂点の前記大規模アトラス情報における平面フレームの原点に対するオフセット量を追加する方式と、
前記ビットストリームサンプルエントリにおいて、前記現在のファイルに含まれるカメラに対応する視点で収集された深度マップの左上頂点の前記大規模アトラス情報における平面フレームの原点に対するオフセット量を追加する方式と、
前記ビットストリームサンプルエントリにおいて、前記現在のファイルに含まれるカメラに対応する視点で収集されたテクスチャマップと深度マップとのパディング幅を追加する方式と、
のうちの少なくとも一種の情報追加方式をさらに含む、請求項3に記載のメディアファイルのカプセル化方法。 - 前記第1応用シーンタイプフィールドの数値が前記第2値に等しい場合には、前記方法は、
もし前記メディアストリームをマルチトラックに応じてカプセル化するなら、前記ターゲットメディアファイルフォーマットデータボックスのサンプルエントリにおいて大規模アトラス識別子を追加するステップと、
もし前記大規模アトラス識別子が前記メディアストリームが大規模アトラス情報の多視点ビデオであることを示すなら、前記サンプルエントリにおいて、前記メディアストリームを収集するカメラの数量識別子、及び前記メディアストリームの現在のファイルに含まれるカメラに対応する視点数識別子を追加するステップと、
前記サンプルエントリにおいて、前記現在のファイルに含まれるカメラに対応する視点で収集されたテクスチャマップと深度マップとの解像度を追加するステップと、をさらに含む、請求項2に記載のメディアファイルのカプセル化方法。 - 前記方法は、
前記ターゲットメディアコンテンツのターゲット記述ファイルを生成するステップであって、前記ターゲット記述ファイルには前記メディアストリームに対応する応用シーンのタイプを示す第2応用シーンタイプフィールドが含まれる、ステップと、
前記ターゲット記述ファイルを前記第1機器に送信することにより前記第1機器は前記第2応用シーンタイプフィールドに基づき、前記メディアストリームのカプセル化ファイルのうちターゲットメディアストリームに対応するターゲットカプセル化ファイルを決定するステップと、をさらに含み、
前記カプセル化ファイルを第1機器に送信することにより前記第1機器は前記第1応用シーンタイプフィールドに基づき前記メディアストリームに対応する応用シーンを決定することは、
前記ターゲットカプセル化ファイルを前記第1機器に送信することにより前記第1機器は前記ターゲットカプセル化ファイルにおける第1応用シーンタイプフィールドに基づき前記ターゲットメディアストリームに対応するターゲット応用シーンを決定するステップを含む、請求項1に記載のメディアファイルのカプセル化方法。 - 前記ターゲットメディアコンテンツのターゲット記述ファイルを生成する前記ステップは、
前記ターゲットメディアコンテンツのハイパーテキスト転送プロトコルに基づく動的自己適応ストリーミングメディア伝送のターゲット記述ファイルにおいて前記第2応用シーンタイプフィールドを追加するステップと、
前記メディアストリームに対応する応用シーンに基づき、前記第2応用シーンタイプフィールドの数値を決定するステップと、を含む、請求項6に記載のメディアファイルのカプセル化方法。 - ターゲットメディアコンテンツの当該ターゲットメディアコンテンツに対応する応用シーン下でのメディアストリームを取得する前記ステップは、
第2機器が送信する第1多視点ビデオの第1カプセル化ファイルと第3機器が送信する第2多視点ビデオの第2カプセル化ファイルとを受信するステップと、
前記第1カプセル化ファイル及び前記第2カプセル化ファイルをそれぞれカプセル化解除し、前記第1多視点ビデオ及び前記第2多視点ビデオを獲得するステップと、
前記第1多視点ビデオ及び前記第2多視点ビデオをそれぞれ復号し、前記第1多視点ビデオにおける第1深度マップ及び第1テクスチャマップ、並びに前記第2多視点ビデオにおける第2深度マップ及び第2テクスチャマップを獲得するステップと、
前記第1深度マップ、前記第2深度マップ、前記第1テクスチャマップ及び前記第2テクスチャマップに基づき、合併多視点ビデオを獲得するステップと、を含む、請求項1に記載のメディアファイルのカプセル化方法。 - 前記第2機器において第1数量のカメラが取り付けられ、前記第3機器において第2数量のカメラが取り付けられ、前記第2機器及び前記第3機器はそれぞれ各自のカメラを利用して同一シーンに対して多視点ビデオの収集及び撮影を行い、前記第1多視点ビデオ及び前記第2多視点ビデオを獲得し、
前記第1カプセル化ファイル及び前記第2カプセル化ファイルにはいずれも前記第1応用シーンタイプフィールドが含まれ、且つ前記第1カプセル化ファイル及び前記第2カプセル化ファイルにおける第1応用シーンタイプフィールドの数値はそれぞれ、前記第1多視点ビデオ及び前記第2多視点ビデオが大規模アトラス情報の多視点ビデオであることを表すことに用いられる第2値である、請求項8に記載のメディアファイルのカプセル化方法。 - 前記メディアストリームは6自由度メディアストリーム、及び制限された6自由度メディアストリームを含む、請求項1~9のいずれか一項に記載のメディアファイルのカプセル化方法。
- 電子機器により実行される、メディアファイルのカプセル化解除方法であって、
ターゲットメディアコンテンツの当該ターゲットメディアコンテンツに対応する応用シーン下でのメディアストリームのカプセル化ファイルを受信するステップであって、前記カプセル化ファイルのターゲットメディアファイルフォーマットデータボックスのボリュメトリックビジュアルメディアヘッダーデータボックスには前記メディアストリームに対応する応用シーンのタイプを示す第1応用シーンタイプフィールドが含まれる、ステップと、
前記カプセル化ファイルをカプセル化解除し、前記第1応用シーンタイプフィールドを獲得するステップと、
前記第1応用シーンタイプフィールドに基づき、前記メディアストリームに対応する応用シーンを決定するステップと、
前記メディアストリームに対応する応用シーンに基づき、前記メディアストリームの復号方式及びレンダリング方式のうちの少なくとも一種を決定するステップと、を含む、メディアファイルのカプセル化解除方法。 - 前記第1応用シーンタイプフィールドの数値は前記メディアストリームが大規模アトラス情報の多視点ビデオであることを表すことに用いられる第2値である場合には、前記方法は、
前記カプセル化ファイルを解析し、前記メディアストリームに含まれるカメラに対応する視点で収集されたテクスチャマップ及び深度マップと前記大規模アトラス情報における平面フレームとの間のマッピング関係を獲得するステップと、
前記メディアストリームを復号し、前記メディアストリームにおけるカメラパラメータを獲得するステップと、
前記マッピング関係及び前記カメラパラメータに基づき、3次元空間に前記多視点ビデオを表示するステップと、をさらに含む、請求項11に記載のメディアファイルのカプセル化解除方法。 - 前記方法は、
前記ターゲットメディアコンテンツのターゲット記述ファイルを受信するステップであって、前記ターゲット記述ファイルには前記メディアストリームに対応する応用シーンのタイプを示す第2応用シーンタイプフィールドが含まれる、ステップと、
前記第2応用シーンタイプフィールドに基づき、前記メディアストリームのカプセル化ファイルのうちターゲットメディアストリームのターゲットカプセル化ファイルを決定するステップと、をさらに含み、
ターゲットメディアコンテンツの当該ターゲットメディアコンテンツに対応する応用シーン下でのメディアストリームのカプセル化ファイルを受信する前記ステップは、
前記ターゲットカプセル化ファイルを受信し、前記ターゲットカプセル化ファイルにおける第1応用シーンタイプフィールドに基づき、前記ターゲットメディアストリームのターゲット応用シーンを決定するステップを含む、請求項11または12に記載のメディアファイルのカプセル化解除方法。 - メディアファイルのカプセル化装置であって、
ターゲットメディアコンテンツの当該ターゲットメディアコンテンツに対応する応用シーン下でのメディアストリームを取得することに用いられるメディアストリーム取得ユニットと、
ターゲットメディアファイルフォーマットデータボックスのボリュメトリックビジュアルメディアヘッダーデータボックスに、前記メディアストリームに対応する応用シーンのタイプを示す第1応用シーンタイプフィールドを追加し、前記メディアストリームに対応する応用シーンに基づき前記第1応用シーンタイプフィールドの数値を決定することで前記メディアストリームをカプセル化し、前記メディアストリームのカプセル化ファイルを生成することに用いられるメディアストリームカプセル化ユニットであって、前記カプセル化ファイルには前記メディアストリームに対応する応用シーンのタイプを示す第1応用シーンタイプフィールドが含まれる、メディアストリームカプセル化ユニットと、
前記カプセル化ファイルを第1機器に送信することにより前記第1機器は前記第1応用シーンタイプフィールドに基づき前記メディアストリームに対応する応用シーンを決定し、且つ前記メディアストリームに対応する応用シーンに基づき前記メディアストリームの復号方式及びレンダリング方式のうちの少なくとも一種を決定することに用いられるカプセル化ファイル送信ユニットと、を含む、メディアファイルのカプセル化装置。 - メディアファイルのカプセル化解除装置であって、
ターゲットメディアコンテンツの当該ターゲットメディアコンテンツに対応する応用シーン下でのメディアストリームのカプセル化ファイルを受信することに用いられるカプセル化ファイル受信ユニットであって、前記カプセル化ファイルのターゲットメディアファイルフォーマットデータボックスのボリュメトリックビジュアルメディアヘッダーデータボックスには前記メディアストリームに対応する応用シーンのタイプを示す第1応用シーンタイプフィールドが含まれる、カプセル化ファイル受信ユニットと、
前記カプセル化ファイルをカプセル化解除し、前記第1応用シーンタイプフィールドを獲得することに用いられるファイルカプセル化解除ユニットと、
前記第1応用シーンタイプフィールドに基づき、前記メディアストリームに対応する応用シーンを決定することに用いられる応用シーン獲得ユニットと、
前記メディアストリームに対応する応用シーンに基づき、前記メディアストリームの復号方式及びレンダリング方式のうちの少なくとも一種を決定することに用いられる復号レンダリング決定ユニットと、を含む、メディアファイルのカプセル化解除装置。 - 電子機器であって、
少なくとも1つのプロセッサと、
少なくとも1つのプログラムを記憶するように配置される記憶装置と、を含み、前記少なくとも1つのプログラムが前記少なくとも1つのプロセッサにより実行されるときに、前記少なくとも1つのプロセッサに請求項1~10のいずれか一項に記載のメディアファイルのカプセル化方法又は請求項11~13のいずれか一項に記載のメディアファイルのカプセル化解除方法を実現させる、電子機器。 - コンピュータプログラムであって、命令を含み、コンピュータ上で作動されるときに、コンピュータに請求項1~10のいずれか一項に記載のメディアファイルのカプセル化方法又は請求項11~13のいずれか一項に記載のメディアファイルのカプセル化解除方法を実行させる、コンピュータプログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011098190.7 | 2020-10-14 | ||
CN202011098190.7A CN114374675B (zh) | 2020-10-14 | 2020-10-14 | 媒体文件的封装方法、媒体文件的解封装方法及相关设备 |
PCT/CN2021/118755 WO2022078148A1 (zh) | 2020-10-14 | 2021-09-16 | 媒体文件的封装方法、媒体文件的解封装方法及相关设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2023520736A JP2023520736A (ja) | 2023-05-18 |
JP7471731B2 true JP7471731B2 (ja) | 2024-04-22 |
Family
ID=81138930
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022561600A Active JP7471731B2 (ja) | 2020-10-14 | 2021-09-16 | メディアファイルのカプセル化方法、メディアファイルのカプセル化解除方法及び関連機器 |
Country Status (6)
Country | Link |
---|---|
US (1) | US12107908B2 (ja) |
EP (1) | EP4231609A4 (ja) |
JP (1) | JP7471731B2 (ja) |
KR (1) | KR102661694B1 (ja) |
CN (2) | CN116248642A (ja) |
WO (1) | WO2022078148A1 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118200611A (zh) * | 2022-12-13 | 2024-06-14 | 上海交通大学 | 视频文件发送和接收方法、装置、计算机可读存储介质 |
CN118471236A (zh) * | 2023-02-07 | 2024-08-09 | 腾讯科技(深圳)有限公司 | 一种音频编解码方法、装置、设备及介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018137817A (ja) | 2012-10-04 | 2018-08-30 | インテル・コーポレーション | 3dビデオコーディングのための予測パラメータ継承 |
CN108833937A (zh) | 2018-05-30 | 2018-11-16 | 华为技术有限公司 | 视频处理方法和装置 |
US20190114830A1 (en) | 2017-10-13 | 2019-04-18 | Samsung Electronics Co., Ltd. | 6dof media consumption architecture using 2d video decoder |
WO2020137642A1 (ja) | 2018-12-28 | 2020-07-02 | ソニー株式会社 | 情報処理装置および情報処理方法 |
WO2020166612A1 (ja) | 2019-02-12 | 2020-08-20 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 三次元データ多重化方法、三次元データ逆多重化方法、三次元データ多重化装置、及び三次元データ逆多重化装置 |
JP2021528891A (ja) | 2018-06-27 | 2021-10-21 | キヤノン株式会社 | メディアコンテンツを送信する方法、装置及びコンピュータプログラム |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120212579A1 (en) * | 2009-10-20 | 2012-08-23 | Telefonaktiebolaget Lm Ericsson (Publ) | Method and Arrangement for Multi-View Video Compression |
GB2524478A (en) * | 2014-03-20 | 2015-09-30 | Nokia Technologies Oy | Method, apparatus and computer program product for filtering of media content |
CN108616751B (zh) * | 2016-12-12 | 2023-05-12 | 上海交通大学 | 媒体信息的处理方法、装置及系统 |
WO2018120294A1 (zh) * | 2016-12-30 | 2018-07-05 | 华为技术有限公司 | 一种信息的处理方法及装置 |
WO2018177373A1 (en) * | 2017-03-30 | 2018-10-04 | Mediatek Inc. | Method and apparatus for signaling spherical region information in isobmff |
US11140380B2 (en) * | 2018-06-06 | 2021-10-05 | Lg Electronics Inc. | Method and apparatus for processing overlay media in 360 degree video system |
CN113178019B (zh) * | 2018-07-09 | 2023-01-03 | 上海交通大学 | 基于视频内容的指示信息标识方法、系统及存储介质 |
CN110704673B (zh) * | 2018-07-09 | 2022-09-23 | 上海交通大学 | 基于视频内容消费的反馈信息标识方法、系统及存储介质 |
CN112513938A (zh) * | 2018-08-06 | 2021-03-16 | 松下电器(美国)知识产权公司 | 三维数据保存方法、三维数据获得方法、三维数据保存装置以及三维数据获得装置 |
CN110944222B (zh) * | 2018-09-21 | 2021-02-12 | 上海交通大学 | 沉浸媒体内容随用户移动变化的方法及系统 |
CN111435991B (zh) * | 2019-01-11 | 2021-09-28 | 上海交通大学 | 基于分组的点云码流封装方法和系统 |
CN113615207A (zh) * | 2019-03-21 | 2021-11-05 | Lg电子株式会社 | 点云数据发送装置、点云数据发送方法、点云数据接收装置和点云数据接收方法 |
WO2021025251A1 (ko) * | 2019-08-08 | 2021-02-11 | 엘지전자 주식회사 | 포인트 클라우드 데이터 송신 장치, 포인트 클라우드 데이터 송신 방법, 포인트 클라우드 데이터 수신 장치 및 포인트 클라우드 데이터 수신 방법 |
KR102373833B1 (ko) * | 2020-01-09 | 2022-03-14 | 엘지전자 주식회사 | 포인트 클라우드 데이터 송신 장치, 포인트 클라우드 데이터 송신 방법, 포인트 클라우드 데이터 수신 장치 및 포인트 클라우드 데이터 수신 방법 |
-
2020
- 2020-10-14 CN CN202310323100.7A patent/CN116248642A/zh active Pending
- 2020-10-14 CN CN202011098190.7A patent/CN114374675B/zh active Active
-
2021
- 2021-09-16 KR KR1020227037594A patent/KR102661694B1/ko active IP Right Grant
- 2021-09-16 EP EP21879194.5A patent/EP4231609A4/en active Pending
- 2021-09-16 WO PCT/CN2021/118755 patent/WO2022078148A1/zh unknown
- 2021-09-16 JP JP2022561600A patent/JP7471731B2/ja active Active
-
2022
- 2022-09-27 US US17/954,134 patent/US12107908B2/en active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018137817A (ja) | 2012-10-04 | 2018-08-30 | インテル・コーポレーション | 3dビデオコーディングのための予測パラメータ継承 |
US20190114830A1 (en) | 2017-10-13 | 2019-04-18 | Samsung Electronics Co., Ltd. | 6dof media consumption architecture using 2d video decoder |
CN108833937A (zh) | 2018-05-30 | 2018-11-16 | 华为技术有限公司 | 视频处理方法和装置 |
JP2021528891A (ja) | 2018-06-27 | 2021-10-21 | キヤノン株式会社 | メディアコンテンツを送信する方法、装置及びコンピュータプログラム |
WO2020137642A1 (ja) | 2018-12-28 | 2020-07-02 | ソニー株式会社 | 情報処理装置および情報処理方法 |
WO2020166612A1 (ja) | 2019-02-12 | 2020-08-20 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 三次元データ多重化方法、三次元データ逆多重化方法、三次元データ多重化装置、及び三次元データ逆多重化装置 |
Also Published As
Publication number | Publication date |
---|---|
EP4231609A4 (en) | 2024-03-13 |
US20230034937A1 (en) | 2023-02-02 |
JP2023520736A (ja) | 2023-05-18 |
KR20220160646A (ko) | 2022-12-06 |
KR102661694B1 (ko) | 2024-04-26 |
CN114374675B (zh) | 2023-02-28 |
US12107908B2 (en) | 2024-10-01 |
CN114374675A (zh) | 2022-04-19 |
EP4231609A1 (en) | 2023-08-23 |
CN116248642A (zh) | 2023-06-09 |
WO2022078148A1 (zh) | 2022-04-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108702528B (zh) | 发送360视频的方法、接收360视频的方法、发送360视频的设备和接收360视频的设备 | |
JP6984841B2 (ja) | イメージ処理方法、端末およびサーバ | |
JP7058273B2 (ja) | 情報処理方法および装置 | |
WO2020002122A1 (en) | Method, device, and computer program for transmitting media content | |
WO2023029858A1 (zh) | 点云媒体文件的封装与解封装方法、装置及存储介质 | |
KR20210016530A (ko) | 미디어 콘텐츠 전송을 위한 방법, 디바이스, 및 컴퓨터 프로그램 | |
JP7471731B2 (ja) | メディアファイルのカプセル化方法、メディアファイルのカプセル化解除方法及び関連機器 | |
CN113891117B (zh) | 沉浸媒体的数据处理方法、装置、设备及可读存储介质 | |
WO2024041239A1 (zh) | 一种沉浸媒体的数据处理方法、装置、设备、存储介质及程序产品 | |
WO2023061131A1 (zh) | 媒体文件封装方法、装置、设备及存储介质 | |
WO2023226504A1 (zh) | 一种媒体数据处理方法、装置、设备以及可读存储介质 | |
WO2023024839A1 (zh) | 媒体文件封装与解封装方法、装置、设备及存储介质 | |
WO2023024841A1 (zh) | 点云媒体文件的封装与解封装方法、装置及存储介质 | |
WO2022193875A1 (zh) | 多视角视频的处理方法、装置、设备及存储介质 | |
WO2023016293A1 (zh) | 自由视角视频的文件封装方法、装置、设备及存储介质 | |
WO2023024843A1 (zh) | 媒体文件封装与解封装方法、设备及存储介质 | |
WO2023169003A1 (zh) | 点云媒体的解码方法、点云媒体的编码方法及装置 | |
TWI796989B (zh) | 沉浸媒體的數據處理方法、裝置、相關設備及儲存媒介 | |
WO2024114519A1 (zh) | 点云封装与解封装方法、装置、介质及电子设备 | |
WO2023169004A1 (zh) | 点云媒体的数据处理方法、装置、设备及介质 | |
JP2024538232A (ja) | データ処理方法、記憶媒体、及びプログラム製品 | |
CN116137664A (zh) | 点云媒体文件封装方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221007 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20221007 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20231113 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20231120 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240208 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240311 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240404 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7471731 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |