JP2023551010A - 没入型メディアのマルチアトラスカプセル化 - Google Patents

没入型メディアのマルチアトラスカプセル化 Download PDF

Info

Publication number
JP2023551010A
JP2023551010A JP2023532514A JP2023532514A JP2023551010A JP 2023551010 A JP2023551010 A JP 2023551010A JP 2023532514 A JP2023532514 A JP 2023532514A JP 2023532514 A JP2023532514 A JP 2023532514A JP 2023551010 A JP2023551010 A JP 2023551010A
Authority
JP
Japan
Prior art keywords
atlas
data
media
track
component
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2023532514A
Other languages
English (en)
Inventor
チウティン リー,
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ZTE Corp
Original Assignee
ZTE Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZTE Corp filed Critical ZTE Corp
Publication of JP2023551010A publication Critical patent/JP2023551010A/ja
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/597Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • H04N19/423Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation characterised by memory arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/236Assembling of a multiplex stream, e.g. transport stream, by combining a video stream with other content or additional data, e.g. inserting a URL [Uniform Resource Locator] into a video stream, multiplexing software data into a video stream; Remultiplexing of multiplex streams; Insertion of stuffing bits into the multiplex stream, e.g. to obtain a constant bit-rate; Assembling of a packetised elementary stream
    • H04N21/2365Multiplexing of several video streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/81Monomedia components thereof
    • H04N21/816Monomedia components thereof involving special video data, e.g 3D video
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/85Assembly of content; Generation of multimedia applications
    • H04N21/854Content authoring
    • H04N21/85406Content authoring involving a specific file format, e.g. MP4 format

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Security & Cryptography (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

メディアファイル内のボリュメトリックビデオデータの柔軟なカプセル化を提供する、方法、装置、およびシステムが、開示される。一例示的側面では、ビデオ処理のための方法は、3次元(3D)ボリュメトリックビデオデータを受信することと、3次元ボリュメトリックビデオデータをメディアファイルにエンコードすることとを含む。3Dボリュメトリックビデオデータは、1つまたはそれを上回るアトラスに対応し、それぞれ、アトラスデータと、1つまたはそれを上回る2次元(2D)コンポーネントとを備える。アトラスデータおよび1つまたはそれを上回る2Dコンポーネントは、メディアファイル内の1つまたはそれを上回るメディアトラック内に記憶される。

Description

本特許文書は、概して、ビデオ処理を対象とする。
ユーザは、コンテンツが実在するかのように見えるような方法で、それを体験することを好む。技術の進歩に伴って、没入型メディアは、かつてないほどより現実的である、コンテンツをもたらす。没入型メディアは、360度画像およびビデオ、仮想現実(VR)、拡張現実(AR)、複合現実(MR)、およびウェアラブルおよびモノのインターネット(IoT)等の新興技術プラットフォームによって駆動される、非従来的フォーマットを含む。
本特許文書は、とりわけ、メディアファイル内のボリュメトリックビデオデータの柔軟なカプセル化を提供するために実装され得る、技法を説明する。
一例示的側面では、ビデオ処理のための方法は、3次元(3D)ボリュメトリックビデオデータを受信することと、3次元ボリュメトリックビデオデータをメディアファイルにエンコードすることと含む。3Dボリュメトリックビデオデータは、1つまたはそれを上回るアトラスに対応し、それぞれ、アトラスデータと、1つまたはそれを上回る2次元(2D)コンポーネントとを備える。アトラスデータおよび1つまたはそれを上回る2Dコンポーネントは、メディアファイル内の1つまたはそれを上回るメディアトラック内に記憶される。
別の例示的側面では、ビデオ処理のための方法は、3次元(3D)ボリュメトリックビデオデータを表す、メディアファイルをデコードすることと、1つまたはそれを上回るメディアトラックのうちの少なくとも1つのメディアトラックに基づいて、3Dボリュメトリックビデオデータを再構成することとを含む。3Dボリュメトリックビデオデータは、1つまたはそれを上回るアトラスに対応し、それぞれ、アトラスデータと、1つまたはそれを上回る2次元(2D)コンポーネントとを備える。アトラスデータおよび1つまたはそれを上回る2Dコンポーネントは、メディアファイル内の1つまたはそれを上回るメディアトラック内に記憶される。
別の例示的側面では、通信装置が、開示される。本装置は、上記に説明される方法を実装するように構成される、プロセッサを含む。
さらに別の例示的側面では、コンピュータプログラム記憶媒体が、開示される。コンピュータプログラム記憶媒体は、その上に記憶されたコードを含む。コードは、プロセッサによって実行されると、プロセッサに説明される方法を実装させる。
さらに別の例示的側面では、コンピュータプログラム記憶媒体が、開示される。コンピュータプログラム記憶媒体は、本明細書に説明される方法に従って発生される、メディアファイルを記憶する。
これらおよび他の側面が、本書に説明される。
図1は、メディアファイルの例示的構造を図示する。
図2は、メディアファイルの別の例示的構造を図示する。
図3は、本技術による、ボリュメトリックビデオデータに関する例示的エンコーディングおよびデコーディングプロセスを図示する。
図4は、本技術による、エンコーダ側またはデコーダ側モジュールを実装するために使用され得る、例示的装置を示す。
図5は、本技術による、ビデオエンコーディングのための方法のフローチャート表現である。
図6は、本技術による、ビデオエンコーティングのための別の方法のフローチャート表現である。
図7は、本技術による、メディアファイルの例示的カプセル化構造を図示する。
図8は、本技術による、メディアファイルの例示的カプセル化構造を図示する。
図9は、本技術による、メディアファイルの例示的カプセル化構造を図示する。
詳細な説明
節の見出しは、本書では、可読性を改良するために使用されるにすぎず、各節内の開示される実施形態および技法の範囲をその節のみに限定しない。開示される技法は、限定ではないが、標準化機構(ISO)/国際電気標準会議(IEC)ベースのメディアファイルフォーマット規格を含む、種々の結像および/またはビデオ規格に適用可能である。
没入型メディアは、ユーザに没入型かつ完全に異なるメディア体験を与えるためのオーディオおよびビデオ等のマルチメディア技術の使用を指す。没入型メディアコンテンツを鑑賞するとき、ユーザは、(例えば、仮想現実ヘッドセットを装着することによって)リアルタイムでメディアに参加することができる。没入型メディアは、映画、ゲーム、ニュース、および/または医療治療等の多くの分野への拡張に成功している。没入型メディアコンテンツは、従来のメディアコンテンツと異なる、すなわち、視覚的コンテンツは、大画像面積および広視野を被覆し、ユーザに、コンテンツを調整する際に、その独自の選好に基づいて、より多くの柔軟性を提供する、典型的360度パノラマ視覚データである。
現在のところ、没入型メディアシステムは、ボリュメトリックビデオを使用して、3次元(3D)場面およびオブジェクトを表す。3Dビデオデータは、ボクセルによって表され、したがって、場面内の任意のオブジェクトが、6自由度の移動を通して視認されることができる。ボリュメトリックビデオは、複数のカメラから同時に収集されるデータを使用して、またはデータの3次元(3D)表現(例えば、点群データ)を使用して構成されることができる。3Dビデオデータは、次いで、(2Dコンポーネントとも称される)2Dパッチとして、2次元(2D)空間の上に投影される。例えば、ボリュメトリックビデオデータは、マッピング後の矩形画像(例えば、正投影画像)として表されることができる。代替として、ボリュメトリックビデオデータは、マッピングおよびパッチパッキング後の矩形画像として表されることができる。いくつかの実施形態では、3Dボリュメトリックビデオデータは、メディアファイル内に記憶されることができる。2Dデータの特性は、幾何学形状、属性、および/または占有マップデータ等の2Dコンポーネントとして、メディアファイル内にカプセル化される。2Dコンポーネントに加えて、アトラスデータと称される、3D空間と2D空間との間の投影関係もまた、メディアファイル内にカプセル化される。
以下の議論は、ISO基本メディアファイルフォーマットに焦点を当てる。しかしながら、関連する考慮事項および技法は、高効率ビデオコーディング(HEVC)フォーマット、多用途ビデオコーディング(VVC)フォーマット等を含む、他のメディアファイルフォーマットにも適用可能である。
制限付きスキーム情報ボックス、トラック参照ボックス、およびトラックグループボックス等のISO基本メディアファイルフォーマットは、MPEG(Moving Picture Experts Group)パート12 ISOベースメディアファイルフォーマットに基づいて公式化される、MPEG-4と称される。ボリュームビデオの投影、パッケージ化ステップ、および基本フォーマットは、MPEGによって公式化される、MPEG-I Part10を参照して動作されることができる。ISO基本ファイルフォーマットでは、全てのデータが、ボックス内にパッキングされる。すなわち、MP4ファイルによって表される、ISO基本ファイルフォーマットは、いくつかのボックスを含み、それぞれ、あるタイプと、長さとを有する。いくつかのボックスは、1つまたはそれを上回る他のボックスを含有し得るため、コンテナボックスと称される。MP4メディアファイルは、「ftyp」タイプボックスを含み、これは、ファイルフォーマットのマークとしての役割を果たし、ファイルについてのある情報を含む。「ftyp」タイプボックスの後には、1つのみのムービーボックス(「MOOV」タイプボックス)が続く。ムービーボックスは、メディアのメタデータ情報を備える、付加的なボックスを含む、コンテナボックスである。メディアファイルは、0個またはそれを上回るメディアデータボックス(「MADT」タイプボックス)を含むことができる。例えば、全てのメディアデータが、他のファイルを参照するとき、メディアファイルは、0個のメディアデータボックスを含む。メディアデータボックスはまた、メディアデータを備える、付加的なボックスを含む、コンテナボックスでもある。メディアデータの構造は、メタデータ記述によって決定される。メディアのメタデータ記述をさらにサポートするために、メタデータボックス(「メタ」タイプボックス)は、随意に、いくつかの一般的または付加的な非時間指定メタデータを記述するために使用されることができる。
上記に議論されるように、2D平面に投影される、ボリュメトリックビデオの2D表現は、幾何学的コンポーネントデータ、属性コンポーネントデータ、および/または占有コンポーネントデータを含む、2Dコンポーネントデータによって表される。アトラスデータは、3D空間と2D平面との間の投影関係を表す。マルチトラックカプセル化ビデオデータコンテナ内には、少なくとも2タイプのトラック、すなわち、アトラスパラメータ情報またはアトラスビットストリーム等のアトラス情報を搬送する、ボリュメトリック視覚的トラック(V3Cトラックとも称される)と、占有、幾何学形状、または属性コンポーネントビデオビットストリームのうちのいずれかに関する、2Dビデオエンコードデータを搬送する、ビデオトラック(V3Cコンポーネントトラックとも称される)とが存在することができる。図1は、メディアファイルの例示的構造を図示する。ISO/IECコーディング規格によると、例えば、コンテナファイルは、ボリュメトリックデータの単一トラックカプセル化を含むことができる(例えば、トラック-1)。すなわち、対応するビットストリームは、メディアファイル内の単一トラック宣言によって表される。いくつかの実施形態では、複数のボリュメトリック視覚的トラックも、同様に、ファイル内に存在することができる。図2は、メディアファイルの別の例示的構造を図示する。図2に示される実施例では、データは、コンポーネントタイプに基づいて、コンテナファイル内の個々のトラックにマップされる。
図1に示されるようなV3Cデータの単一トラックカプセル化は、V3Cエンコードビットストリームの単純なカプセル化において使用されることができる。しかしながら、単一トラックカプセル化は、複雑な3D場面に関して、非常に少ない柔軟性を提供する。あらゆるものが、単一トラック内にカプセル化されるため、全てのデータが、デコーディング目的のために伝送される必要があり、帯域幅および処理能力の潜在的な浪費につながる。
マルチトラックカプセル化は、複雑な場面に関して、より多くの柔軟性を提供し、異なるタイプのコンポーネントデータが、異なるトラックに分離されることを可能にする。図2に示されるように、各ビデオトラックは、単一タイプのコンポーネントビデオビットストリームを搬送する。しかしながら、ビデオデータをデコーディングすることは、多くの場合、ビデオデータの複数のコンポーネント(例えば、幾何学形状およびテクスチャ)を要求する。さらに、いくつかのビデオビットストリームを並行してデコーディングすることは、同期およびメモリ利用問題につながり得る。例えば、複数のビデオビットストリームの同期は、デコーダが、フレームをスキップするとき、困難である。実装の複雑性は、マルチストリーム同期に関して有意に増加し、デコーディング時間において、不必要な先行遅延につながり得る。さらに、3Dから2Dへの投影は、複数のアトラスを結果としてもたらすことができる。例えば、ボリュメトリックビデオが、複数のカメラからのデータを使用して構成されるとき、1つのアトラスが、1つまたはそれを上回る選択されたカメラからのデータに関して構築されることができる。いくつかの実施形態では、複数のカメラから捕捉された画像は、部分的に、重複する、または繰り返すことができる。抜粋することは、捕捉された画像が、アトラスにエンコードされる前に、重複された部分に対して実施されることができる。図2に示される、マルチトラックカプセル化構造は、アトラスのサブセットのみが、必要とされるとき、データ伝送および/またはデコーディングの柔軟性を提供することができない。
本特許文書は、デコーディングの複雑性を低減し、帯域幅消費を増加させるために、より柔軟なカプセル化スキームを提供するために、種々の実施形態において実装され得る、技法を開示する。いくつかの実施形態では、開示される技法は、メディアボックス内の複数のアトラスのカプセル化を可能にするように実装され、それによって、ビデオ処理が、アトラスベースで実施されることを可能にすることができる。コンポーネントトラックは、対応するアトラスおよび/またはコンポーネントタイプに基づいて編成され、それによって、デコード側の同期の必要性を低減させる、または最小限にすることができる。
図3は、本技術による、ボリュメトリックビデオデータに関する例示的エンコーディングおよびデコーディングプロセスを図示する。図3に示されるように、没入型メディアシステム300は、没入型メディア生産プラットフォーム310(エンコーダ側)と、プレーヤ端末320(デコーダ側)とを含む。没入型メディア生産プラットフォーム310は、少なくともコンテンツ生産モジュール311と、記憶モジュール312と、伝送モジュール313とを含む。コンテンツ生産モジュール311は、捕捉されたボリュメトリックビデオのエンコーディングおよびカプセル化処理のために使用される。記憶モジュール312は、カプセル化されたメディアファイルを記憶するために使用される。伝送モジュール313は、クライアント端末から要求メッセージを受信するため、および/または記憶モジュール312内に記憶されるデータ(メディアファイル等)を伝送するために使用される。ビデオデータの受信および/または伝送は、通信プロバイダによって提供される無線ネットワーク、ローカル無線エリアネットワーク、または有線方法を通して実施されることができる。
プレーヤ端末320は、少なくとも、伝送モジュール321と、メディア処理モジュール322と、メディア提示モジュール323とを含む。伝送モジュール321は、データ(例えば、メディアファイル)を受信するため、および/またはメッセージ(例えば、メディアファイル要求)を伝送モジュール313に伝送するために使用される。メディア処理モジュール322は、受信されたメディアファイルをデコードおよびカプセル化解除し、視認位置、視認方向等のユーザの現在の視認状態に従って、ボリュメトリックビデオを再構築するために使用される。メディア処理モジュール322はまた、レンダリング処理も実施する。メディア提示モジュール323は、再構築されたボリュメトリックビデオをユーザのビューポート内に提示するために使用される。
図4は、本特許技術による、エンコーダ側またはデコーダ側モジュールを実装するために使用され得る、例示的装置400を示す。装置400は、エンコーダ側またはデコーダ側技法または両方を実施するように構成され得る、プロセッサ402を含む。装置400はまた、プロセッサ実行可能命令を記憶するため、およびビデオビットストリームおよび/または表示データを記憶するためのメモリ(404)を含んでもよい。装置400は、変換回路、算術コーディング/デコーディング回路等のビデオ処理回路網(図示せず)を含んでもよい。ビデオ処理回路網は、部分的に、プロセッサの中に、および/または、部分的に、グラフィックプロセッサ、フィールドプログラマブルゲートアレイ(FPGA)等の他の専用回路網の中に含まれてもよい。
図5は、本技術による、ビデオエンコーディングのための方法500のフローチャート表現である。方法500は、動作510において、3次元(3D)ボリュメトリックビデオデータを受信することを含む。方法500はまた、動作520において、3次元ボリュメトリックビデオデータをメディアファイルにエンコードすることを含む。3Dボリュメトリックビデオデータは、1つまたはそれを上回るアトラスに対応し、それぞれ、アトラスデータと、1つまたはそれを上回る2次元(2D)コンポーネントとを備える。アトラスデータおよび1つまたはそれを上回る2Dコンポーネントは、メディアファイル内の1つまたはそれを上回るメディアトラック内に記憶される。
図6は、本技術による、ビデオデコーディングのための方法600のフローチャート表現である。方法600は、動作610において、3次元(3D)ボリュメトリックビデオデータを表す、メディアファイルをデコードすることを含む。3Dボリュメトリックビデオデータは、1つまたはそれを上回るアトラスに対応し、それぞれ、アトラスデータと、1つまたはそれを上回る2次元(2D)コンポーネントとを備える。アトラスデータおよび1つまたはそれを上回る2Dコンポーネントは、メディアファイル内の1つまたはそれを上回るメディアトラック内に記憶される。方法600はまた、動作620において、1つまたはそれを上回るメディアトラックのうちの少なくとも1つのメディアトラックに基づいて、3Dボリュメトリックビデオデータを再構築することを含む。
エンコーディングおよびデコーディングの両方の場合において、各アトラスの1つまたはそれを上回る2Dコンポーネントは、少なくとも幾何学形状コンポーネント、占有コンポーネント、または属性コンポーネントを備える。いくつかの実施形態では、アトラスデータは、3D空間から2D平面に、3Dボリュメトリックビデオデータを投影する投影関係を備える。いくつかの実施形態では、メディアファイル内の少なくとも1つのメディアトラックは、3Dボリュメトリックビデオデータの一部または全てを表す、情報を含む。例えば、メディアファイル内に記憶される、全てのトラックのトラックのサブセットが、伝送コストを低減させるために、デコードのために伝送される。
いくつかの実施形態では、1つまたはそれを上回るメディアトラックは、具体的なサンプルエントリタイプ(例えば、V3C)を伴う、ボリュメトリック視覚的トラックを含む。ボリュメトリック視覚的トラックは、1つまたはそれを上回るアトラスの全てに共通のパラメータ情報を備える。いくつかの実施形態では、ボリュメトリック視覚的トラックは、ゼロサンプルを含む。いくつかの実施形態では、ボリュメトリック視覚的トラックは、1つまたはそれを上回るサンプルを含み、各サンプルは、1つまたはそれを上回るアトラスに関するアトラスデータを搬送する。
いくつかの実施形態では、1つまたはそれを上回るメディアトラックは、具体的なサンプルエントリタイプ(例えば、下記の実施形態3に説明されるような「v3ca」)を伴う、1つまたはそれを上回るアトラストラックを含む。アトラストラックは、1つまたはそれを上回るアトラスのアトラスデータを備える。
いくつかの実施形態では、1つまたはそれを上回るメディアトラックは、第1のサンプルエントリタイプ(例えば、下記の実施形態1に説明されるような「v3cc」)を伴う、1つまたはそれを上回る第1のコンポーネントトラックを含む。第1のコンポーネントトラックは、1つまたはそれを上回るアトラスに対応する、1つまたはそれを上回るコンポーネントのデータを備える。いくつかの実施形態では、1つまたはそれを上回るメディアトラックは、第2のサンプルエントリタイプ(例えば、下記の実施形態2に説明されるような「v3ac」)を伴う、1つまたはそれを上回る第2のコンポーネントトラックを含む。第2のコンポーネントトラックは、アトラスデータと、1つまたはそれを上回るアトラスに対応する、1つまたはそれを上回るコンポーネントのデータとを備える。いくつかの実施形態では、1つまたはそれを上回るメディアトラックは、第3のサンプルエントリタイプ(例えば、下記の実施形態3に説明されるような「v3cm」)を伴う、1つまたはそれを上回る第3のコンポーネントトラックを含む。第3のコンポーネントトラックは、1つまたはそれを上回るアトラスからの特定のタイプのコンポーネントデータを搬送する。
いくつかの実施形態では、1つまたはそれを上回るメディアトラックは、複数のグループに編成される。いくつかの実施形態では、各グループは、1つまたはそれを上回るアトラスのうちの1つに対応する。いくつかの実施形態では、各グループは、3D場面内のビューの場所等の3Dボリュメトリックビデオデータと関連付けられる、グルーピング基準に起因して、ともに配列される、複数のアトラスに対応する。
いくつかの実施形態では、上記に説明されるエンコーディング方法のうちの1つに従ってエンコードされるメディアファイルは、コンピュータ可読媒体上に記憶されてもよい。
開示される技法のいくつかの実施例はさらに、以下の例示的実施形態に説明される。
実施形態1
いくつかの実施形態では、全てのアトラスのアトラスデータが、同一トラック(例えば、V3Cトラック)内に記憶される。図7は、本技術による、メディアファイルの例示的カプセル化構造700を図示する。図7に示されるように、ボリュメトリックビデオのメディアファイル(例えば、ISOファイル)は、MOOVボックス内に、タイプ「v3am」を伴う、サンプルエントリによって識別される、V3Cボリュメトリック視覚的トラックを含む。V3Cボリュメトリック視覚的トラックは、全てのアトラスに共通である、ボリュメトリックビデオおよび/またはアトラス情報のパラメータ情報を含む。
VC3ボリュメトリック視覚的トラックは、1つまたはそれを上回る対応するサンプルを含むことができる。少なくとも1つのサンプルが存在するとき、対応するMDATボックスは、ボリュメトリックビデオのパラメータ情報、アトラスパラメータ情報、および/または全てのアトラスのデータを記憶する。
V3Cコンポーネントトラックは、メディアファイル内で、限定付きビデオとして表され、ビデオサンプルエントリに対応する、SchemeTypeBoxのscheme_typeフィールド内の「vvvc」によって識別されることができる。いくつかの実施形態では、アトラスに対応する、異なるタイプのコンポーネントデータが、1つのV3Cコンポーネントトラック内に記憶される。図7に示されるように、Atlas_1(701)は、コンポーネント1、コンポーネント2等を含む、異なるタイプの複数のコンポーネントを有する。Atlas_1に対応する、全てのコンポーネントは、同一V3Cコンポーネントトラック内に記憶される。すなわち、Atlas_1に関する幾何学形状、属性、占有データ等の特性が、ともに編成され、Atlas_1を処理するための同期の複雑性を低減させる。
いくつかの実施形態では、アトラスは、コンポーネントタイプに基づいて編成される、複数のトラックに対応することができる。図7に示されるように、Atlas_2(702)は、2つのトラックに対応する。各トラックは、特定のコンポーネントタイプに対応する。例えば、Track_2は、コンポーネントタイプ1に対応する一方、Track_3は、コンポーネントタイプ2に対応する。
V3Cボリュメトリック視覚的トラックサンプルエントリに関する構文実施例が、下記の表に示される。
上記表における変数は、以下の定義を有する。
multi_atlas_flagは、メディアトラックが、複数のアトラスを含むかどうかを示す。
num_atlasは、メディアトラック内に含まれる、アトラスの数を示す。
atlas_idは、アトラスの識別子を示す。
unit_headerは、ISO/IECフォーマットにおいて定義されるように、v3c_unit_header()である。
mix_component_flagは、コンポーネントデータが、同一メディアトラック内に記憶されるかどうかを示す。0という値は、コンポーネントが、別個のメディアトラック内に記憶されることを示す。1という値は、コンポーネントが、同一メディアトラック内に記憶されることを示す。
component_group_idは、同一アトラスに属する、全てのコンポーネントデータを記憶する、メディアトラックグループの識別子(ID)を示す。
atlas_reference_track_idは、アトラスに対応する全てのコンポーネントデータが、記憶される、メディアトラックの参照IDを示す。
V3Cメディアトラックは、トラック参照、またはISO/IECフォーマットにおいて定義されている他の方法を使用して、対応するコンポーネントメディアトラックを参照/リンクし得る。
V3Cコンポーネントトラックは、タイプ「v3cc」のサンプルエントリによって識別される、異なるタイプのコンポーネントデータを含む。V3Cコンポーネントトラックは、1つのアトラスまたは複数のアトラスからのコンポーネントデータを含むことができる。V3Cコンポーネントトラックサンプルエントリに関する構文実施例が、下記の表に示される。
上記表における変数は、以下の定義を有する。
mix_component_flagは、コンポーネントデータが、同一メディアトラック内に記憶されるかどうかを示す。0という値は、コンポーネントが、別個のメディアトラック内に記憶されることを示す。1という値は、コンポーネントが、同一メディアトラック内に記憶されることを示す。
num_atlaは、メディアトラック内に含まれる、アトラスの数を示す。
atlas_idは、アトラスの識別子を示す。
atlas_tile_flagは、コンポーネントトラックが、アトラスタイルを含むかどうかを示す。0という値は、コンポーネントトラックが、アトラスタイルを含まないことを示す。1という値は、コンポーネントトラックが、1つまたはそれを上回るアトラスタイルを含むことを示す。
num_tileは、アトラスタイルの数を示す。
tile_idは、アトラスタイルの識別子を示す。
num_componentは、メディアトラック内のコンポーネントの数を示す。
component_typeは、コンポーネントデータのタイプを示す。
unit_headerは、ISO/IECフォーマットにおいて定義されるように、v3c_unit_header()である。
実施形態2
いくつかの実施形態では、アトラスデータおよび各アトラスのコンポーネントデータが、同一トラック内に記憶される。図8は、本技術による、メディアファイルの例示的カプセル化構造800を図示する。ボリュメトリックビデオのメディアファイルは、全てのアトラスに共通である、アトラス情報を記憶する、V3Cトラックを含む。本実施例では、V3Cトラックは、ゼロサンプルを含む。したがって、MADTボックスは、V3Cトラックに関するいかなるサンプルデータも含まない。
全てのアトラスに共通ではないアトラスデータは、特定のアトラスに関する、対応するコンポーネントデータとともに記憶されることができる。図8に示されるように、Atlas_1(801)に関して、Atlas_1データおよび異なるタイプの全てのコンポーネントデータ(コンポーネント1、コンポーネント2)が、同一トラック内に記憶される。同様に、Atlas_2(801)に関して、Atlas_2データおよび異なるタイプの全てのコンポーネントデータ(コンポーネント1、コンポーネント2)が、同一トラック内に記憶される。すなわち、特定のアトラスに関する全ての関連する全てのデータが、トラック内にともにパッキングされ、それによって、同期遅延を最小限にし、伝送の柔軟性を増加させる。
ここでは、V3Cアトラスおよびコンポーネントトラックは、タイプ「v3ac」のサンプルエントリによって識別されることができる。V3Cアトラスおよびコンポーネントトラックサンプルエントリに関する構文実施例が、下記の表に示される。
上記表における変数は、以下の定義を有する。
atlas_idは、アトラスの識別子を示す。
multi_atlas_flagは、メディアトラックが、複数のアトラスを含むことを示す。
num_atlasは、メディアトラック内に含まれる、アトラスの数を示す。
unit_headerは、ISO/IECフォーマットにおいて定義されるように、v3c_unit_header()である。
実施形態3
いくつかの実施形態では、1つまたはそれを上回るアトラスからの同一タイプのコンポーネントデータが、同一メディアトラック内に記憶される。全てのアトラスのコンポーネントデータは、グルーピング基準に基づいて、例えば、コンポーネントタイプに基づいて、グループに編成されることができる。図9は、本技術による、メディアファイルの例示的カプセル化構造900を図示する。実施形態2と同様に、メディアファイルは、全てのアトラスに共通である、アトラス情報を記憶する、V3Cトラックを含み、V3Cトラックは、ゼロサンプルを含む。したがって、MADTボックスは、V3Cトラックに関するいかなるサンプルデータも含まない。
本実施形態では、メディアファイルは、アトラスパラメータ情報および/または全てのアトラスのデータを記憶するために、(例えば、エントリタイプ「v3ca」によって識別される)別個のアトラストラック901を含む。複数のアトラスが、グルーピング基準に基づいて、1つのグループに編成される。例えば、複数のアトラスが、3Dボリュメトリックビデオデータに対応する、3D領域内の複数のカメラレイアウトに対応することができる。例えば、図9に示されるように、複数のアトラスのコンポーネントタイプIのコンポーネントデータ(1つのグループに属する、Atlas_1、Atlas_2、およびAtlas_3)が、V3Cコンポーネントトラック902内に記憶される。同様に、複数のアトラスのコンポーネントタイプIIのコンポーネントデータ(Atlas_1、Atlas_2、およびAtlas_3)が、V3Cコンポーネントトラック903内に記憶される。すなわち、各V3Cコンポーネントトラックが、1つまたはそれを上回るアトラスからのコンポーネントデータを含むことができる。そのような編成は、デコード側が、1つの特定のコンポーネントタイプのみを調査する必要があるとき、より効率的な処理を可能にする。
コンポーネントタイプに加えて、コンポーネントトラックおよびV3Cアトラストラックは、他のグルーピング基準に従って、グループに編成されることができる。例えば、コンポーネントトラックは、複数のアトラスの1つのグループの全てのタイプのコンポーネントデータを記憶し、次いで、コンポーネントトラックおよびV3Cアトラストラックは、1つのグループにグルーピングされることができる。種々のグルーピング基準は、3D場面の特性に従って、3Dボリュメトリックビデオデータの効率的な部分的処理を可能にするために使用されることができる。
V3Cアトラストラックサンプルエントリに関する構文実施例が、下記の表に示される。
上記表における変数は、以下の定義を有する。
multi_atlas_flagは、メディアトラックが、複数のアトラスを含むことを示す。
num_atlasは、メディアトラック内に含まれる、アトラスの数を示す。
atlas_idは、アトラスの識別子を示す。
atlas_group_flagは、V3Cアトラストラック内のアトラスの全てが、1つのグループにグルーピングされることを示す。
atlas_group_idは、V3Cアトラストラック内のアトラスの全てが属する、グループのIDを示す。
unit_headerは、ISO/IECフォーマットにおいて定義されるように、v3c_unit_header()である。
V3Cコンポーネントメディアトラックは、タイプ「v3cm」のサンプルエントリによって識別されることができる。V3Cコンポーネントトラックサンプルエントリに関する構文実施例が、下記の表に示される。
上記表における変数は、以下の定義を有する。
component_typeは、コンポーネントのタイプを示す。
num_atlasは、メディアトラック内に含まれる、アトラスの数を示す。
atlas_idは、アトラスの識別子を示す。
unit_headerは、ISO/IECフォーマットにおいて定義されるように、v3c_unit_header()である。
本書が、3Dボリュメトリックビデオデータの柔軟性なカプセル化を提供するために、種々の実施形態内に具現化され得る、技法を開示することを理解されたい。開示される技法は、複数のアトラスが、単一メディアファイルの中にカプセル化されることを可能にする。アトラスデータおよび各アトラスのコンポーネントデータは、伝送コストを低減させ、同期の複雑性を最小限にするために、異なる方法で編成されることができる。本書に説明される、開示されるメディアコンテンツ処理システムおよび他の実施形態、モジュール、および機能動作が、デジタル電子回路網で、または本書に開示される構造およびそれらの構造均等物を含む、コンピュータソフトウェア、ファームウェア、またはハードウェアで、またはそれらのうちの1つまたはそれを上回るもの組み合わせで、実装されることができる。開示されるおよび他の実施形態は、1つまたはそれを上回るコンピュータプログラム製品、すなわち、データ処理装置による実行のために、またはその動作を制御するために、コンピュータ可読媒体上でエンコードされるコンピュータプログラム命令の1つまたはそれを上回るモジュールとして、実装されることができる。コンピュータ可読媒体は、機械可読記憶デバイス、機械可読記憶基板、メモリデバイス、機械可読伝搬信号を生じさせる組成物、または1つまたはそれを上回るそれらの組み合わせであり得る。用語「データ処理装置」は、一例として、プログラマブルプロセッサ、コンピュータ、または複数のプロセッサまたはコンピュータを含む、データを処理するための全ての装置、デバイス、および機械を包含する。本装置は、ハードウェアに加えて、当該コンピュータプログラムのための実行環境を生成するコード、例えば、プロセッサファームウェア、プロトコルスタック、データベース管理システム、オペレーティングシステム、またはそれらのうちの1つまたはそれを上回るもの組み合わせを成すコードを含むことができる。伝搬信号は、人工的に発生される信号、例えば、好適な受信機装置への伝送のために情報をエンコードするように発生される、機械で発生される電気、光学、または電磁信号である。
コンピュータプログラム(プログラム、ソフトウェア、ソフトウェアアプリケーション、スクリプト、またはコードとしても公知である)が、コンパイラ型またはインタープリタ型言語を含む、任意の形態のプログラミング言語で書かれることができ、独立型プログラムとして、またはコンピューティング環境内での使用のために好適なモジュール、コンポーネント、サブルーチン、または他のユニットとしてを含む、任意の形態で展開されることができる。コンピュータプログラムは、必ずしもファイルシステム内のファイルに対応するわけではない。プログラムは、他のプログラムまたはデータを保持するファイル(例えば、マークアップ言語文書内に記憶された1つまたはそれを上回るスクリプト)の一部内に、当該プログラム専用の単一のファイル内に、または複数の協調ファイル(例えば、1つまたはそれを上回るモジュール、サブプログラム、またはコードの一部を記憶するファイル)内に記憶されることができる。コンピュータプログラムは、1つのコンピュータ上で、または1つの地点に位置する、または複数の地点を横断して分散され、通信ネットワークによって相互接続される複数のコンピュータ上で、実行されるように展開されることができる。
本書に説明されるプロセスおよび論理フローは、入力データに作用し、出力を発生させることによって機能を実施するように、1つまたはそれを上回るコンピュータプログラムを実行する、1つまたはそれを上回るプログラマブルプロセッサによって、実施されることができる。プロセスおよび論理フローはまた、特殊用途論理回路網、例えば、FPGA(フィールドプログラマブルゲートアレイ)またはASIC(特定用途向け集積回路)によって実施されることもでき、装置もまた、それとして実装されることができる。
コンピュータプログラムの実行のために好適なプロセッサは、一例として、汎用および特殊用途マイクロプロセッサの両方、および任意の種類のデジタルコンピュータのいずれか1つまたはそれを上回るプロセッサを含む。概して、プロセッサは、読取専用メモリまたはランダムアクセスメモリまたは両方から、命令およびデータを受信するであろう。コンピュータの不可欠な要素は、命令を実施するためのプロセッサ、および命令およびデータを記憶するための1つまたはそれを上回るメモリデバイスである。概して、コンピュータはまた、データを記憶するための1つまたはそれを上回る大容量記憶デバイス、例えば、磁気、磁気光学ディスク、または光ディスクを含む、またはそこからデータを受信する、またはそこにデータを転送する、または両方を行うように、動作可能に結合されるであろう。しかしながら、コンピュータは、そのようなデバイスを有する必要はない。コンピュータプログラム命令およびデータを記憶するために好適なコンピュータ可読媒体は、一例として、半導体メモリデバイス、例えば、EPROM、EEPROM、およびフラッシュメモリデバイス、磁気ディスク、例えば、内部ハードディスクまたはリムーバブルディスク、磁気光学ディスク、およびCD-ROMおよびDVD-ROMディスクを含む、あらゆる形態の不揮発性メモリ、媒体、およびメモリデバイスを含む。プロセッサおよびメモリは、特殊用途論理回路網によって補完される、またはそれに組み込まれることができる。
本特許文書は、多くの詳細を含むが、これらは、任意の発明または請求され得るものの範囲への限定としてではなく、むしろ、特定の発明の特定の実施形態に特有であり得る特徴の説明として解釈されるべきである。別個の実施形態との関連で本特許文書に説明されるある特徴もまた、単一の実施形態において組み合わせて実装されることができる。逆に、単一の実施形態との関連で説明される種々の特徴もまた、複数の実施形態において別個に、または任意の好適な副次的組み合わせにおいて実装されることができる。また、特徴が、ある組み合わせにおいて作用するものとして上記に説明され、さらに、そのようなものとして最初に請求され得るが、請求される組み合わせからの1つまたはそれを上回る特徴が、ある場合には、組み合わせから削除されることができ、請求される組み合わせは、副次的組み合わせまたは副次的組み合わせの変形例を対象とし得る。
同様に、動作が、特定の順序で図面に描写されるが、これは、望ましい結果を達成するために、そのような動作が示される特定の順序で、または順次順序で実施されること、または全ての図示される動作が実施されることを要求するものとして理解されるべきではない。また、本特許文書に説明される実施形態における種々のシステムコンポーネントの分離は、全ての実施形態においてそのような分離を要求するものとして理解されるべきではない。
いくつかの実装および実施例のみが、説明され、他の実装、向上、および変形例も、本特許文書に説明および図示されるものに基づいて成されることができる。
これらおよび他の側面が、本書に説明される。
本発明は、例えば、以下を提供する。
(項目1)
ビデオ処理のための方法であって、
3次元(3D)ボリュメトリックビデオデータを受信することと、
上記3次元ボリュメトリックビデオデータをメディアファイルにエンコードすることと
を含み、
上記3Dボリュメトリックビデオデータは、1つまたはそれを上回るアトラスに対応し、各アトラスは、アトラスデータと、1つまたはそれを上回る2次元(2D)コンポーネントとを備え、上記アトラスデータおよび上記1つまたはそれを上回る2Dコンポーネントは、上記メディアファイル内の1つまたはそれを上回るメディアトラック内に記憶される、方法。
(項目2)
ビデオ処理のための方法であって、
3次元(3D)ボリュメトリックビデオデータを表すメディアファイルをデコードすることであって、上記3Dボリュメトリックビデオデータは、1つまたはそれを上回るアトラスに対応し、各アトラスは、アトラスデータと、1つまたはそれを上回る2次元(2D)コンポーネントとを備え、上記アトラスデータおよび上記1つまたはそれを上回る2Dコンポーネントは、上記メディアファイル内の1つまたはそれを上回るメディアトラック内に記憶される、ことと、
上記1つまたはそれを上回るメディアトラックのうちの少なくとも1つのメディアトラックに基づいて、上記3Dボリュメトリックビデオデータを再構成することと
を含む、方法。
(項目3)
各アトラスのための上記1つまたはそれを上回る2Dコンポーネントは、少なくとも幾何学形状コンポーネント、占有コンポーネント、または属性コンポーネントを備える、項目1または2に記載の方法。
(項目4)
上記アトラスデータは、3D空間から2D平面に、上記3Dボリュメトリックビデオデータを投影する投影関係を備える、項目1-3のいずれかに記載の方法。
(項目5)
上記メディアファイル内の上記少なくとも1つのメディアトラックは、上記3Dボリュメトリックビデオデータの一部または全てを表す情報を含む、項目1-4のいずれかに記載の方法。
(項目6)
上記1つまたはそれを上回るメディアトラックは、具体的なサンプルエントリタイプを伴うボリュメトリック視覚的トラックを含み、上記ボリュメトリック視覚的トラックは、上記1つまたはそれを上回るアトラスの全てに共通のパラメータ情報を備える、項目1-5のいずれかに記載の方法。
(項目7)
上記ボリュメトリック視覚的トラックは、ゼロサンプルを含む、項目6に記載の方法。
(項目8)
上記ボリュメトリック視覚的トラックは、1つまたはそれを上回るサンプルを含み、各サンプルは、1つまたはそれを上回るアトラスに関するアトラスデータを搬送する、項目6に記載の方法。
(項目9)
上記1つまたはそれを上回るメディアトラックは、具体的なサンプルエントリタイプを伴うアトラストラックを含み、上記アトラストラックは、1つまたはそれを上回るアトラスのアトラスデータを備える、項目1-8のいずれかに記載の方法。
(項目10)
上記1つまたはそれを上回るメディアトラックは、第1のサンプルエントリタイプを伴う第1のコンポーネントトラックを含み、上記第1のコンポーネントトラックは、上記1つまたはそれを上回るアトラスに対応する上記1つまたはそれを上回るコンポーネントのデータを備える、項目1-9のいずれかに記載の方法。
(項目11)
上記1つまたはそれを上回るメディアトラックは、第2のサンプルエントリタイプを伴う第2のコンポーネントトラックを含み、上記第2のコンポーネントトラックは、上記アトラスデータと、上記1つまたはそれを上回るアトラスに対応する上記1つまたはそれを上回るコンポーネントのデータとを備える、項目1-10のいずれかに記載の方法。
(項目12)
上記1つまたはそれを上回るメディアトラックは、第3のサンプルエントリタイプを伴う第3のコンポーネントトラックを含み、上記第3のコンポーネントトラックは、上記1つまたはそれを上回るアトラスからの特定のタイプのコンポーネントデータを搬送する、項目1-11のいずれかに記載の方法。
(項目13)
上記1つまたはそれを上回るメディアトラックは、複数のグループに編成される、項目1-12のいずれかに記載の方法。
(項目14)
各グループは、上記1つまたはそれを上回るアトラスのうちの1つに対応する、項目13に記載の方法。
(項目15)
各グループは、上記3Dボリュメトリックビデオデータと関連付けられるグルーピング基準に起因してともに配列される複数のアトラスに対応する、項目13に記載の方法。
(項目16)
ビデオ処理装置であって、上記ビデオ処理装置は、項目1-15のうちのいずれか1つまたはそれを上回るものにおいて記載される方法を実装するように構成されるプロセッサを備える、ビデオ処理装置。
(項目17)
コンピュータプログラム製品であって、上記コンピュータプログラム製品は、その上に記憶されるコードを有しており、上記コードは、プロセッサによって実行されると、上記プロセッサに、項目1-15のうちのいずれか1つまたはそれを上回るものにおいて記載される方法を実装させる、コンピュータプログラム製品。

Claims (17)

  1. ビデオ処理のための方法であって、
    3次元(3D)ボリュメトリックビデオデータを受信することと、
    前記3次元ボリュメトリックビデオデータをメディアファイルにエンコードすることと
    を含み、
    前記3Dボリュメトリックビデオデータは、1つまたはそれを上回るアトラスに対応し、各アトラスは、アトラスデータと、1つまたはそれを上回る2次元(2D)コンポーネントとを備え、前記アトラスデータおよび前記1つまたはそれを上回る2Dコンポーネントは、前記メディアファイル内の1つまたはそれを上回るメディアトラック内に記憶される、方法。
  2. ビデオ処理のための方法であって、
    3次元(3D)ボリュメトリックビデオデータを表すメディアファイルをデコードすることであって、前記3Dボリュメトリックビデオデータは、1つまたはそれを上回るアトラスに対応し、各アトラスは、アトラスデータと、1つまたはそれを上回る2次元(2D)コンポーネントとを備え、前記アトラスデータおよび前記1つまたはそれを上回る2Dコンポーネントは、前記メディアファイル内の1つまたはそれを上回るメディアトラック内に記憶される、ことと、
    前記1つまたはそれを上回るメディアトラックのうちの少なくとも1つのメディアトラックに基づいて、前記3Dボリュメトリックビデオデータを再構成することと
    を含む、方法。
  3. 各アトラスのための前記1つまたはそれを上回る2Dコンポーネントは、少なくとも幾何学形状コンポーネント、占有コンポーネント、または属性コンポーネントを備える、請求項1または2に記載の方法。
  4. 前記アトラスデータは、3D空間から2D平面に、前記3Dボリュメトリックビデオデータを投影する投影関係を備える、請求項1-3のいずれかに記載の方法。
  5. 前記メディアファイル内の前記少なくとも1つのメディアトラックは、前記3Dボリュメトリックビデオデータの一部または全てを表す情報を含む、請求項1-4のいずれかに記載の方法。
  6. 前記1つまたはそれを上回るメディアトラックは、具体的なサンプルエントリタイプを伴うボリュメトリック視覚的トラックを含み、前記ボリュメトリック視覚的トラックは、前記1つまたはそれを上回るアトラスの全てに共通のパラメータ情報を備える、請求項1-5のいずれかに記載の方法。
  7. 前記ボリュメトリック視覚的トラックは、ゼロサンプルを含む、請求項6に記載の方法。
  8. 前記ボリュメトリック視覚的トラックは、1つまたはそれを上回るサンプルを含み、各サンプルは、1つまたはそれを上回るアトラスに関するアトラスデータを搬送する、請求項6に記載の方法。
  9. 前記1つまたはそれを上回るメディアトラックは、具体的なサンプルエントリタイプを伴うアトラストラックを含み、前記アトラストラックは、1つまたはそれを上回るアトラスのアトラスデータを備える、請求項1-8のいずれかに記載の方法。
  10. 前記1つまたはそれを上回るメディアトラックは、第1のサンプルエントリタイプを伴う第1のコンポーネントトラックを含み、前記第1のコンポーネントトラックは、前記1つまたはそれを上回るアトラスに対応する前記1つまたはそれを上回るコンポーネントのデータを備える、請求項1-9のいずれかに記載の方法。
  11. 前記1つまたはそれを上回るメディアトラックは、第2のサンプルエントリタイプを伴う第2のコンポーネントトラックを含み、前記第2のコンポーネントトラックは、前記アトラスデータと、前記1つまたはそれを上回るアトラスに対応する前記1つまたはそれを上回るコンポーネントのデータとを備える、請求項1-10のいずれかに記載の方法。
  12. 前記1つまたはそれを上回るメディアトラックは、第3のサンプルエントリタイプを伴う第3のコンポーネントトラックを含み、前記第3のコンポーネントトラックは、前記1つまたはそれを上回るアトラスからの特定のタイプのコンポーネントデータを搬送する、請求項1-11のいずれかに記載の方法。
  13. 前記1つまたはそれを上回るメディアトラックは、複数のグループに編成される、請求項1-12のいずれかに記載の方法。
  14. 各グループは、前記1つまたはそれを上回るアトラスのうちの1つに対応する、請求項13に記載の方法。
  15. 各グループは、前記3Dボリュメトリックビデオデータと関連付けられるグルーピング基準に起因してともに配列される複数のアトラスに対応する、請求項13に記載の方法。
  16. ビデオ処理装置であって、前記ビデオ処理装置は、請求項1-15のうちのいずれか1つまたはそれを上回るものにおいて記載される方法を実装するように構成されるプロセッサを備える、ビデオ処理装置。
  17. コンピュータプログラム製品であって、前記コンピュータプログラム製品は、その上に記憶されるコードを有しており、前記コードは、プロセッサによって実行されると、前記プロセッサに、請求項1-15のうちのいずれか1つまたはそれを上回るものにおいて記載される方法を実装させる、コンピュータプログラム製品。
JP2023532514A 2020-11-30 2020-11-30 没入型メディアのマルチアトラスカプセル化 Pending JP2023551010A (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2020/132660 WO2022110108A1 (en) 2020-11-30 2020-11-30 Multi-atlas encapsulation of immersive media

Publications (1)

Publication Number Publication Date
JP2023551010A true JP2023551010A (ja) 2023-12-06

Family

ID=81753880

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2023532514A Pending JP2023551010A (ja) 2020-11-30 2020-11-30 没入型メディアのマルチアトラスカプセル化

Country Status (6)

Country Link
US (1) US20220345714A1 (ja)
EP (1) EP4252421A4 (ja)
JP (1) JP2023551010A (ja)
KR (1) KR20230113781A (ja)
CN (1) CN115004699A (ja)
WO (1) WO2022110108A1 (ja)

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5510097B2 (ja) * 2010-06-16 2014-06-04 ソニー株式会社 信号伝送方法、信号送信装置および信号受信装置
FI20165115A (fi) * 2016-02-17 2017-08-18 Nokia Technologies Oy Laitteisto, menetelmä ja tietokoneohjelma videokoodausta ja videokoodauksen purkua varten
US10778993B2 (en) * 2017-06-23 2020-09-15 Mediatek Inc. Methods and apparatus for deriving composite tracks with track grouping
US10939086B2 (en) * 2018-01-17 2021-03-02 Mediatek Singapore Pte. Ltd. Methods and apparatus for encoding and decoding virtual reality content
EP3843385A4 (en) * 2018-10-08 2021-09-22 Samsung Electronics Co., Ltd. METHOD AND DEVICE FOR GENERATING A MEDIA FILE WITH THREE-DIMENSIONAL VIDEO CONTENT AND METHOD AND DEVICE FOR REPLAYING THREE-DIMENSIONAL VIDEO CONTENT
CN114930863B (zh) * 2020-01-09 2023-08-08 Lg电子株式会社 点云数据发送装置、点云数据发送方法、点云数据接收装置和点云数据接收方法

Also Published As

Publication number Publication date
EP4252421A1 (en) 2023-10-04
US20220345714A1 (en) 2022-10-27
EP4252421A4 (en) 2023-10-11
WO2022110108A1 (en) 2022-06-02
KR20230113781A (ko) 2023-08-01
CN115004699A (zh) 2022-09-02

Similar Documents

Publication Publication Date Title
CN111869201B (zh) 处理和发送三维内容的方法
TW202041020A (zh) 用信號通知點雲多媒體資料軌道的空間關係的方法和裝置
JP2022133439A (ja) メディアコンテンツを送信するための方法、装置及びコンピュータプログラム
CN114697668B (zh) 点云媒体的编解码方法及相关产品
CN113891117B (zh) 沉浸媒体的数据处理方法、装置、设备及可读存储介质
CN115053531A (zh) 在isobmff中存储来自一个v-pcc基本流的多个图集
US20220360819A1 (en) Volumetric media process methods and apparatus
EP4283996A1 (en) Volumetric media processing method and apparatus, and storage medium and electronic apparatus
JP7447293B2 (ja) 異種クライアントエンドポイントへのストリーミングのための2dビデオの適応のためのニューラルネットワークモデルの参照
JP7402976B2 (ja) 点群データのためのファイルフォーマット
CN115396647B (zh) 一种沉浸媒体的数据处理方法、装置、设备及存储介质
US20220360828A1 (en) Volumetric media process methods and apparatus
JP2023551010A (ja) 没入型メディアのマルチアトラスカプセル化
JP2023518676A (ja) 没入型メディアの設置、及び没入型メディアから異種クライアントエンドポイントへの配信
WO2023169003A1 (zh) 点云媒体的解码方法、点云媒体的编码方法及装置
WO2022151370A1 (en) Multi-track based immersive media playout
CN114374675B (zh) 媒体文件的封装方法、媒体文件的解封装方法及相关设备
WO2023024839A1 (zh) 媒体文件封装与解封装方法、装置、设备及存储介质
WO2023024841A1 (zh) 点云媒体文件的封装与解封装方法、装置及存储介质
WO2023169001A1 (zh) 一种沉浸媒体的数据处理方法、装置、设备及存储介质

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230622

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230622