JP2022524130A - ポイントクラウドの適応ストリーミングの方法及び装置 - Google Patents

ポイントクラウドの適応ストリーミングの方法及び装置 Download PDF

Info

Publication number
JP2022524130A
JP2022524130A JP2021553345A JP2021553345A JP2022524130A JP 2022524130 A JP2022524130 A JP 2022524130A JP 2021553345 A JP2021553345 A JP 2021553345A JP 2021553345 A JP2021553345 A JP 2021553345A JP 2022524130 A JP2022524130 A JP 2022524130A
Authority
JP
Japan
Prior art keywords
point cloud
component
pcc
video
main
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2021553345A
Other languages
English (en)
Other versions
JPWO2020185578A5 (ja
Inventor
ハムザ、アーマッド
フ、ヨン
Original Assignee
ヴィド スケール インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ヴィド スケール インコーポレイテッド filed Critical ヴィド スケール インコーポレイテッド
Publication of JP2022524130A publication Critical patent/JP2022524130A/ja
Publication of JPWO2020185578A5 publication Critical patent/JPWO2020185578A5/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/60Network streaming of media packets
    • H04L65/61Network streaming of media packets for supporting one-way streaming services, e.g. Internet radio
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/02Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/184Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/597Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/235Processing of additional data, e.g. scrambling of additional data or processing content descriptors

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

MPEG DASH等の適応HTTPストリーミングプロトコルを使用してV-PCC(ビデオベースポイントクラウド圧縮)データの適応ストリーミングに関する方法、装置、及びシステム。方法は、DASH MPD においてポイントクラウドのポイントクラウドデータをシグナリングすることであって、DASH MPDは、ポイントクラウドのメイン適応セットであって、メイン適応セットは、少なくとも、(1)対応する適応セットがV-PCCデータに対応することを示す一意の値に設定される@codecs属性及び(2)ポイントクラウドの表現の少なくとも1つのV-PCCシーケンスパラメータセットを含む初期化セグメントを含む、メイン適応セットと、複数の構成要素適応セットであって、各構成要素適応セットは、V-PCC構成要素の1つに対応し、少なくとも、(1)対応するV-PCC構成要素のタイプを識別するVPCCComponent記述子及び(2)V-PCC構成要素の少なくとも1つのプロパティを含む、複数の構成要素適応セットとを含む、シグナリングすることと、ネットワークを経由してDASHビットストリームを送信することとを含む。

Description

背景
[0001] 高品質3Dポイントクラウドは近年、没入型メディアの高度表現として出現した。ポイントクラウドは、各ポイントに関連付けられた色、透明度、取得時間、レーザの反射率、又は材料特性等の1つ又は複数の属性と共に各ポイントのロケーションを示す座標を使用して、3D空間で表される1組のポイントからなる。ポイントクラウドを作成するためのデータは、幾つかの方法で捕捉することができる。例えば、ポイントクラウドを捕捉する一技法は、複数のカメラ及び深度センサを使用する。光検出及び測距(LiDAR)レーザスキャナも一般に、ポイントクラウドの捕捉に使用される。ポイントクラウドを使用して物体及びシーンを現実的に再構築するために必要なポイントの数は、約数百万(又は数十億)である。したがって、効率的な表現及び圧縮が、ポイントクラウドデータの記憶及び送信にとって極めて重要である。
[0002] 3Dポイントを捕捉しレンダリングする技術の近年の進化は、テレプレゼンス、仮想現実、及び大規模動的3Dマップの分野での新規用途に繋がってきた。ISO/IEC JTC1/SC29/WG11 ムービングピクチャーエキスパーツグループ(MPEG)の3Dグラフィックスサブグループは現在、2つの3Dポイントクラウド圧縮(PCC)規格の開発に取り組んでいる:静的ポイントクラウド(静止物体のポイントクラウド)用のジオメトリベース圧縮規格及び動的ポイントクラウド(移動物体のポイントクラウド)用のビデオベース圧縮規格。これらの規格の目標は、3Dポイントクラウドの効率的且つ相互運用可能な記憶及び送信をサポートすることである。これらの規格の要件の中には、ポイントクラウドジオメトリ座標及び属性の不可逆的符号化及び/又は可逆的符号化をサポートすることがある。
図面の簡単な説明
[0003] 本明細書に添付される図面と併せて例として与えられる以下の詳細な説明から、より詳細な理解を有し得る。そのような図面における図は、詳細な説明のように、例である。したがって、図及び詳細な説明は、限定として見なされるべきではなく、他の等しく有効な例も可能であり、適当である。更に、図中の同様の参照番号は同様の要素を示す。
[0004]1つ又は複数の実施形態を実行及び/又は実施し得る一例のビデオ符号化及び復号化システムを示すブロック図である。 [0005]図1Aのビデオ符号化及び/又は復号化システムと併用される一例のビデオエンコーダユニットを示すブロック図である。 [0006]一般的なブロックベースのハイブリッドビデオ符号化システムのブロック図である。 [0007]ブロックベースのビデオデコーダの一般的なブロック図である。 [0008]ビデオベースポイントクラウド圧縮(V-PCC)のビットストリームの構造を示す。 [0009]MPD階層データモデルを示す。 [0010]MPEG-DASH MPDファイル内の1つのポイントクラウドに属するV-PCC構成要素をグループ化する例示的なDASH構成を示す。 [0011]実施形態によるポイントクラウドコンテンツをストリーミングする例示的なデコーダプロセスを示す流れ図である。
詳細な説明
実施形態を実施し得る例示的なシステム
[0012] 図1Aは、1つ又は複数の実施形態を実行及び/又は実施し得る一例のビデオ符号化及び復号化システム100を示すブロック図である。システム100は、通信チャネル116を介して符号化ビデオ情報を宛先デバイス114に送信し得るソースデバイス112を含み得る。
[0013] ソースデバイス112及び/又は宛先デバイス114は、広範囲の任意のデバイスであり得る。幾つかの代表的な実施形態では、ソースデバイス112及び/又は宛先デバイス114は、通信チャネル116を介してビデオ情報を通信することができる無線ハンドセット又は任意の無線デバイス等の無線送信及び/又は受信ユニット(WTRU)を含み得、その場合、通信チャネル116は無線リンクを含む。しかしながら、本明細書に記載、開示、又は他の方法で明示的、暗示的、及び/又は本質的に提供される(まとめて「提供される」)方法、装置、及びシステムは、必ずしも無線用途又は設定に限定されない。例えば、これらの技法は、地上波テレビジョンブロードキャスト、ケーブルテレビジョン送信、衛星テレビジョン送信、インターネットビデオ送信、記憶媒体に符号化される符号化デジタルビデオ、及び/又は他の状況に適用し得る。通信チャネル116は、符号化ビデオデータの送信に適した無線又は有線媒体の任意の組合せを含み得、及び/又は任意の組合せであり得る。
[0014] ソースデバイス112は、ビデオエンコーダユニット118、送信及び/又は受信(Tx/Rx)ユニット120、及び/又はTx/Rx要素122を含み得る。示されるように、ソースデバイス112はビデオソース124を含み得る。宛先デバイス114は、Tx/RX要素126、Tx/Rxユニット128、及び/又はビデオデコーダユニット130を含み得る。示されるように、宛先デバイス114は表示デバイス132を含み得る。Tx/Rxユニット120、128のそれぞれは、送信機、受信機、若しくは送信機と受信機との組合せ(例えば、送受信機又は送信機-受信機)であり得、又はそれを含み得る。Tx/Rx要素122、126のそれぞれは、例えばアンテナであり得る。この開示によれば、ソースデバイス112のビデオエンコーダユニット118及び/又は宛先デバイス114のビデオデコーダユニット130は、本明細書に提供される符号化技法を適用するように構成及び/又は適合(まとめて「適合」)し得る。
[0015] ソースデバイス112及び宛先デバイス114は、他の要素/構成要素又は機構を含み得る。例えば、ソースデバイス112は、外部ビデオソースからビデオデータを受信するように適合し得る。宛先デバイス114は、外部表示デバイス(図示せず)とインターフェースし得、及び/又は(例えば統合された)表示デバイス132を含み得、及び/又は使用し得る。幾つかの実施形態では、ビデオエンコーダユニット118によって生成されたデータストリームは、直接デジタル転送等により、データを搬送波信号に変調せずに他のデバイスに伝達し得、他のデバイスは、送信のためにデータを変調してもよく、又はしなくてもよい。
[0016] 本明細書に提供される技法は、任意のデジタルビデオ符号化及び/又は復号化デバイスによって実行し得る。一般に、本明細書に提供される技法は別個のビデオ符号化デバイス及び/又はビデオ復号化デバイスによって実行されるが、本技法は、通常、「CODEC」と呼ばれるビデオエンコーダ/デコーダ組合せによって実行することもできる。本明細書に提供される技法は、ビデオプリプロセッサ等によって実行することもできる。ソースデバイス112及び宛先デバイス114は、ソースデバイス112が、宛先デバイス114への送信に向けて符号化ビデオ情報を生成し得る(及び/又はビデオデータを受信、及び生成し得る)そのような符号化デバイスの単なる例である。幾つかの代表的な実施形態では、ソースデバイス112及び宛先デバイス114は、デバイス112、114のそれぞれがビデオ符号化及び復号化構成要素及び/又は要素(まとめて「要素」)の両方を含み得るような実質的に対称的に動作し得る。したがって、システム100は、ソースデバイス112と宛先デバイス114との間の単方向及び双方向ビデオ伝送の何れかをサポートし得る(例えば、特に、任意のビデオストリーミング、ビデオ再生、ビデオブロードキャスト、テレビ電話、及び/又はテレビ会議の)。特定の代表的な実施形態では、ソースデバイス112は、例えば、1つ又は複数の宛先デバイスに向けた符号化ビデオ情報を生成(及び/又はビデオデータを受信し、及び生成)するように適合されたビデオストリーミングサーバであり得、その場合、宛先デバイスは、有線及び/又は無線通信システムを経由してソースデバイス112と通信し得る。
[0017] 外部ビデオソース及び/又はビデオソース124は、ビデオカメラ等のビデオ捕捉デバイス、前に捕捉されたビデオを含むビデオアーカイブ、及び/又はビデオコンテンツプロバイダからのビデオフィードであり得、及び/又はそれらを含み得る。特定の代表的な実施形態では、外部ビデオソース及び/又はビデオソース124は、ソースビデオとしてコンピュータグラフィクスベースデータ、又はライブビデオ、アーカイブビデオ、及び/又はコンピュータ生成ビデオの組合せを生成し得る。特定の代表的な実施形態では、ビデオソース124がビデオカメラである場合、ソースデバイス112及び宛先デバイス114は、カメラフォン又はビデオフォンであり得、又はそれを実施し得る。
[0018] 捕捉された、予め捕捉された、コンピュータ生成されたビデオ、ビデオフィード、及び/又は他のタイプのビデオデータ(まとめて「未符号化ビデオ」)は、ビデオエンコーダユニット118によって符号化されて、符号化ビデオ情報を形成し得る。Tx/Rxユニット120は、符号化ビデオ情報を変調し得る(例えば、通信規格に従って、符号化ビデオ情報を搬送する1つ又は複数の変調信号を形成し得る)。Tx/Rxユニット120は、変調信号を送信のために送信機に送り得る。送信機は、Tx/Rx要素122を介して変調信号を宛先デバイス114に送信し得る。
[0019] 宛先デバイス114において、Tx/Rxユニット128は、Tx/Rx要素126を介してオーバーチャネル116から変調信号を受信し得る。Tx/Rxユニット128は、変調信号を復調して、符号化ビデオ情報を取得し得る。Tx/RXユニット128は、符号化ビデオ情報をビデオデコーダユニット130に渡し得る。
[0020] ビデオデコーダユニット130は、符号化ビデオ情報を復号化して、復号化ビデオデータを取得し得る。符号化ビデオ情報は、ビデオエンコーダユニット118によって定義されたシンタックス情報を含み得る。このシンタックス情報は1つ又は複数の要素(「シンタックス要素」)を含み得、その幾つか又は全ては符号化ビデオ情報の復号化に有用であり得る。シンタックス要素は、例えば、符号化ビデオ情報の特性を含み得る。シンタックス要素は、符号化ビデオ情報の形成に使用される非符号化ビデオの特性を含むこともでき、及び/又は非符号化ビデオの処理を記述することもできる。
[0021] ビデオデコーダユニット130は、後に記憶及び/又は外部ディスプレイ(図示せず)に表示するために、復号化ビデオデータを出力し得る。特定の代表的な実施形態では、ビデオデコーダユニット130は、復号化ビデオデータを表示デバイス132に出力し得る。表示デバイス132は、復号化ビデオデータをユーザに表示するように適合された任意の個々の表示デバイス、複数の表示デバイス、多種多様な表示デバイスの組合せを含み得る。そのような表示デバイスの例には、特に、液晶ディスプレイ(LCD)、プラズマディスプレイ、有機発光ダイオード(OLED)ディスプレイ、及び/又は陰極線管(CRT)がある。
[0022] 通信チャネル116は、無線周波数(RF)スペクトル若しくは1つ若しくは複数の物理的伝送線等の任意の無線若しくは有線通信媒体、又は無線媒体と有線媒体との任意の組合せであり得る。通信チャネル116は、ローカルエリアネットワーク、ワイドエリアネットワーク、又はインターネット等のグローバルネットワーク等のパケットベースネットワークの一部をなし得る。通信チャネル116は一般に、有線媒体及び/又は無線媒体の任意の適した組合せを含め、ビデオデータをソースデバイス112から宛先デバイス114に送信する任意の適した通信媒体又は異なる通信媒体の集まりを表す。通信チャネル116は、ルータ、スイッチ、基地局、及び/又はソースデバイス112から宛先デバイス114への通信を促進するのに有用であり得る任意の他の機器を含み得る。デバイス112と114との間のそのような通信を促進し得る通信システム例の詳細は、図15A~図15Eを参照して以下に提供される。ソースデバイス112及び宛先デバイス114を表し得るデバイスの詳細についても同様に以下に提供する。
[0023] ビデオエンコーダユニット118及びビデオデコーダユニット130は、例えば、特に、MPEG-2、H.261、H.263、H.264、H.264/AVC、及び/又はSVC拡張に従って拡張されたH.264(「H.264/SVC」)等の1つ又は複数の規格及び/又は仕様に従って動作し得る。本明細書に記載の方法、装置、及び/又はシステムが、異なる規格に従って実施される(及び/又は異なる規格に準拠する)他のビデオエンコーダ、デコーダ、及び/又はCODEC、又は将来のビデオエンコーダ、デコーダ、及び/又はCODECを含むプロプライエタリビデオエンコーダ、デコーダ、及び/又はCODECに適用可能なことを当業者なら理解する。本明細書に記載の技法は、いかなる特定の符号化規格にも限定されない。
[0024] 先に記したH.264/AVCの関連する部分は、ITU-T推奨H.264として、又はより具体的には、“ITU-T Rec. H.264 and ISO/IEC 14496-10 (MPEG4-AVC),‘Advanced Video Coding for Generic Audiovisual Services,’v5, March, 2010;”として国際電気通信連合(International Telecommunications Union)から入手可能であり、これは、参照により本明細書に援用され、本明細書ではH.264規格、H.264仕様、H.264/AVC規格及び/又は仕様と呼ばれ得る。本明細書に提供される技法は、H.264規格に準拠(例えば、概して準拠)するデバイスに適用し得る。
[0025] 図1Aに示されていないが、ビデオエンコーダユニット118及びビデオデコーダユニット130のそれぞれは、オーディオエンコーダ及び/又はオーディオデコーダを含み得、及び/又はオーディオエンコーダ及び/又はオーディオデコーダと統合し得る(適宜)。ビデオエンコーダユニット118及びビデオデコーダユニット130は、適切なMUX-DEMUXユニット、又は共通データストリーム及び/又は別個のデータストリームにおいてオーディオ及びビデオの両方の符号化を扱う他のハードウェア及び/又はソフトウェアを含み得る。該当する場合、MUX-DEMUXユニットは、例えば、ITU-T推奨H.223マルチプレクサプロトコル及び/又はユーザデータグラムプロトコル(UDP)等の他のプロトコルに準拠し得る。
[0026] 1つ又は複数のビデオエンコーダユニット118及び/又はビデオデコーダユニット130は、1つ又は複数のエンコーダ及び/又はデコーダに含まれ得、その何れかはCODECの一部として統合し得、特に、各カメラ、コンピュータ、モバイルデバイス、加入者デバイス、ブロードキャストデバイス、セットトップボックス、及び/又はサーバと統合し得、及び/又は組合せ得る。ビデオエンコーダユニット118及び/又はビデオデコーダユニット130は、1つ又は複数のマイクロプロセッサ、デジタル信号プロセッサ(DSP)、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)、離散論理、ソフトウェア、ハードウェア、ファームウェア、又はそれらの任意の組合せ等の任意の多種多様な、適したエンコーダ及び/又はデコーダ回路としてそれぞれ実施し得る。ビデオエンコーダユニット118及びビデオデコーダユニット130の何れか又は両方は実質的にソフトウェアとして実施し得、ビデオエンコーダユニット118及び/又はビデオデコーダユニット130の要素の動作は、1つ又は複数のプロセッサ(図示せず)によって実行される適切なソフトウェア命令によって実行し得る。そのような実施形態は、プロセッサに加えて、オフチップ構成要素、例えば特に、外部記憶装置(例えば不揮発性メモリの形態)及び/又は入力/出力インターフェースを含み得る。
[0027] ビデオエンコーダユニット118及び/又はビデオデコーダユニット130の要素の動作が、1つ又は複数のプロセッサによって実行されるソフトウェア命令によって実行し得る任意の実施形態では、ソフトウェア命令は、例えば特に、磁気ディスク、光ディスク、任意の他の揮発性(例えば、ランダムアクセスメモリ(「RAM」))、不揮発性(例えば、読み取り専用メモリ(「ROM」))、及び/又はCPUにより可読の大容量記憶システムを含むコンピュータ可読媒体に保持し得る。コンピュータ可読媒体は、専ら処理システムに存在し得、及び/又は処理システムにローカル又はリモートであり得る複数の相互接続された処理システムに分散した協働する又は相互接続されたコンピュータ可読媒体を含み得る。
[0028] 図1Bは、システム100等のビデオ符号化及び/又は復号化システムと併用される一例のビデオエンコーダユニット118を示すブロック図である。ビデオエンコーダユニット118は、ビデオエンコーダ133、出力バッファ134、及びシステムコントローラ136を含み得る。ビデオエンコーダ133(又はその1つ若しくは複数の要素)は、例えば特に、H.261、H.263、H.264、H.264/AVC、H.264/AVCのSVC拡張(H.264/AVC付録G)、HEVC、及び/又はHEVCのスケーラブル拡張(SHVC)等の1つ又は複数の規格及び/又は仕様に従って実施し得る。本明細書に提供される方法、装置、及び/又はシステムが、異なる規格及び/又は将来のCODECを含むプロプライエタリCODECに従って実施される他のビデオエンコーダにも適用可能であり得ることを当業者なら理解する。
[0029] ビデオエンコーダ133は、ビデオソース124及び/又は外部ビデオソース等のビデオソースから提供されたビデオ信号を受信し得る。このビデオ信号は未符号化ビデオを含み得る。ビデオエンコーダ133は、未符号化ビデオを符号化し、符号化(すなわち圧縮された)ビデオビットストリーム(BS)をその出力に提供し得る。
[0030] 符号化ビデオビットストリームBSは出力バッファ134に提供し得る。出力バッファ134は、符号化ビデオビットストリームBSをバッファリングし、通信チャネル116を介して送信するために、バッファリングビットストリーム(BBS)としてそのような符号化ビデオビットストリームBSを提供し得る。
[0031] 出力バッファ134から出力されたバッファリングビットストリームBBSは、後に閲覧又は送信するために記憶装置(図示せず)に送信し得る。特定の代表的な実施形態では、ビデオエンコーダユニット118は、指定された一定のビットレート及び/又は可変ビットレート(例えば、遅延をもって(例えば、非常に遅い又は最小遅延))で通信チャネル116を介してバッファリングビットストリームBBSを送信し得る視覚的通信用に構成し得る。
[0032] 符号化ビデオビットストリームBS、そして順番にバッファリングビットストリームBBSは、符号化ビデオ情報のビットを搬送し得る。バッファリングビットストリームBBSのビットは、符号化ビデオフレームのストリームとして配置し得る。符号化ビデオフレームは、イントラ符号化フレーム(例えばIフレーム)又はインター符号化フレーム(例えば、Bフレーム及び/又はPフレーム)であり得る。符号化ビデオフレームのストリームは、例えば、一連のピクチャグループ(GOP)として配置し得、各GOPの符号化ビデオフレームは指定された順序で配置される。一般に、各GOPは、イントラ符号化フレーム(例えばIフレーム)で始まり、1つ又は複数のインター符号化フレーム(例えば、Pフレーム及び/又はBフレーム)が続き得る。各GOPは1つのみのイントラ符号化フレームを含み得るが、任意のGOPは複数のイントラ符号化フレームを含み得る。Bフレームは、例えば、双方向予測は単方向予測(Pフレーム)と比較して追加の符号化遅延を生じさせ得るため、リアルタイムの低遅延用途では使用されない可能性があることが意図される。追加及び/又は他のフレームタイプを使用することもでき、符号化ビデオフレームの特定の順序は、当業者により理解されるように、変更し得る。
[0033] 各GOPはシンタックスデータ(「GOPシンタックスデータ」)を含み得る。GOPシンタックスデータは、GOPのヘッダ、GOPの1つ又は複数のフレームのヘッダ、及び/又は他の場所に配置し得る。GOPシンタックスデータは、各GOPの符号化ビデオフレームの順序を示し、定量化し、分類し及び/又は記述し得る。各符号化ビデオフレームはシンタックスデータ(「符号化フレームシンタックスデータ」)を含み得る。符号化フレームシンタックスデータは、各符号化ビデオフレームの符号化モードを示し及び/又は記述し得る。
[0034] システムコントローラ136は、チャネル116に関連付けられた種々のパラメータ及び/又は制約、ビデオエンコーダユニット118の計算能力、ユーザによる需要等を監視し得、チャネル116の指定された制約及び/又は状況に適した付随する体感品質(QoE)を提供するためのターゲットパラメータを確立し得る。ターゲットパラメータの1つ又は複数は、指定された制約及び/又はチャネル状況に応じて時折又は定期的に調整し得る。一例として、QoEは、例えば、符号化ビデオシーケンスの相対知覚品質と一般に呼ばれるメトリックを含め、ビデオ品質を評価する1つ又は複数のメトリックを使用して定量的に評価し得る。例えば、ピーク信号対雑音比(「PSNR」)メトリックを使用して測定される符号化ビデオシーケンスの相対知覚品質が、符号化ビットストリームBSのビットレート(BR)により制御し得る。ターゲットパラメータ(例えば、量子化パラメータ(QP)を含む)の1つ又は複数は、符号化ビットストリームBSのビットレートに関連付けられた制約内で相対知覚品質を最大化するように調整し得る。
[0035] 図2は、システム100等のビデオ符号化及び/又は復号化システムと併用されるブロックベースハイブリッドビデオエンコーダ200のブロック図である。
[0036] 図2を参照すると、ブロックベースハイブリッド符号化システム200は、特に、変換ユニット204、量子化ユニット206、エントロピー符号化ユニット208、逆量子化ユニット210、逆変換ユニット212、第1の加算器216、第2の加算器226、空間予測ユニット260、動き予測ユニット262、基準ピクチャ記憶装置264、1つ又は複数のフィルタ266(例えば、ループフィルタ)、及び/又はモード決定及びエンコーダコントローラユニット280を含み得る。
[0037] ビデオエンコーダ200の詳細は単なる例示であるとされ、現実世界の実施は異なり得る。現実世界の実施態様は、例えば、より多数の、より少数の、及び/又は異なる要素を含み得、及び/又は図2に示される配置から異なって配置され得る。例えば、別個に示されているが、変換ユニット204及び量子化ユニット206の両方の機能の幾つか又は全ては、例えば、H.264規格のコア変換を使用する実施態様等の現実世界の実施態様の幾つかでは高度に統合し得る。同様に、逆量子化ユニット210及び逆変換ユニット212は、現実世界の実施態様の幾つか(例えば、H.264又はHEVC規格準拠実施態様)では高度に統合し得るが、同様に、概念目的で別個に示されている。
[0038] 上述したように、ビデオエンコーダ200は、その入力202においてビデオ信号を受信し得る。ビデオエンコーダ200は、受信した未符号化ビデオから符号化ビデオ情報を生成し、符号化ビデオ情報(例えば、任意のイントラフレーム又はインターフレーム)をその出力220から符号化ビデオビットストリームBSの形態で出力し得る。ビデオエンコーダ200は、例えば、ハイブリッドビデオエンコーダとして動作し、未符号化ビデオの符号化にブロックベースの符号化プロセスを利用し得る。そのような符号化プロセスを実行するとき、ビデオエンコーダ200は、未符号化ビデオの個々のフレーム、ピクチャ、及び/又は画像(まとめて「未符号化ピクチャ」)に対して動作し得る。
[0039] ブロックベースの符号化プロセスを促進するために、ビデオエンコーダ200は、その入力202において受信した各未符号化ピクチャを複数の未符号化ビデオブロックにスライシング、区画化、分割、及び/又は区分化(まとめて「区分化」)し得る。例えば、ビデオエンコーダ200は、未符号化ピクチャを複数の未符号化ビデオ区分(例えばスライス)に区分化し得、未符号化ビデオ区分のそれぞれを未符号化ビデオブロックに区分化し得る(例えば、次に区分化し得る)。ビデオエンコーダ200は、未符号化ビデオブロックを空間予測ユニット260、動き予測ユニット262、モード決定及び符号化コントローラユニット280、及び/又は第1の加算器216に渡し、供給し、送信し、又は提供し得る。より詳細に以下に説明するように、未符号化ビデオブロックはブロック毎に提供し得る。
[0040] 空間予測ユニット260は、未符号化ビデオブロックを受信し、そのようなビデオブロックをイントラモードで符号化し得る。イントラモードは、空間ベースの圧縮の幾つかのモードの何れかを指し、イントラモードでの符号化は、未符号化ピクチャの空間ベースの圧縮を提供しようと努める。空間ベースの圧縮は、もしあれば、未符号化ピクチャ内のビデオ情報の空間冗長性を低減又はなくすことから生じ得る。予測ブロックを形成するに当たり、空間予測ユニット260は、既に符号化(「符号化ビデオブロック」)及び/又は再構築(「再構築ビデオブロック」)された未符号化ピクチャの1つ又は複数のビデオブロックを基準として各未符号化ビデオブロックの空間予測(又は「イントラ予測」)を実行し得る。符号化ビデオブロック及び/又は再構築ビデオブロックは、未符号化ビデオブロックの近隣、隣接、又は近傍(例えば、近く)にあり得る。
[0041] 動き予測ユニット262は、入力202から未符号化ビデオブロックを受信し、それらをインターモードで符号化し得る。インターモードは、例えば、Pモード(単方向予測)及び/又はBモード(双方向予測)を含む時間ベースの圧縮の幾つかのモードの何れかを指す。インターモードでの符号化は、未符号化ピクチャの時間ベースの圧縮を提供しようと努める。時間ベースの圧縮は、もしあれば、未符号化ピクチャ及び1つ又は複数の基準(例えば隣接)ピクチャ間のビデオ情報の時間冗長性を低減又はなくすことから生じ得る。動き/時間的予測ユニット262は、基準ピクチャ(「基準ビデオブロック」)の1つ又は複数のビデオブロックに対する各未符号化ビデオブロックの時間的予測(又は「インター予測」)を実行し得る。実行される時間的予測は、単方向予測(例えば、Pモードの場合)及び/又は双方向予測(例えば、Bモードの場合)であり得る。
[0042] 単方向予測の場合、基準ビデオブロックは、1つ又は複数の先に符号化されたピクチャ及び/又は先に再構築されたピクチャからであり得る。符号化されたピクチャ及び/又は再構築された1つ又は複数のピクチャは、未符号化ピクチャの近隣、隣接、及び/又は近傍にあり得る。
[0043] 双方向予測の場合、基準ビデオブロックは、1つ又は複数の先に符号化されたピクチャ及び/又は先に再構築されたピクチャからであり得る。符号化されたピクチャ及び/又は再構築されたピクチャは、未符号化ピクチャの近隣、隣接、及び/又は近傍にあり得る。
[0044] 複数の基準ピクチャが使用される場合(H.264/AVC及び/又はHEVC等の近年のビデオ符号化規格等の場合であり得る)、ビデオブロック毎に、その基準ピクチャインデックスが、続く出力及び/又は送信のためにエントロピー符号化ユニット208に送信され得る。基準インデックスは、時間的予測が基準ピクチャ記憶装置264内のどの1つ又は複数の基準ピクチャから来るのかを識別するのに使用し得る。
[0045] 典型的には高度に統合されるが、動き推定及び動き補償に関する動き/時間的予測ユニット262の機能は、別個のエンティティ又はユニット(図示せず)により実行されてもよい。動き推定は、基準ピクチャビデオブロックに対する各未符号化ビデオブロックの動きを推定するのに実行し得、未符号化ビデオブロックの動きベクトルを生成することを含み得る。動きベクトルは、符号化中の未符号化ビデオブロックに対する予測ブロックの変位を示し得る。この予測ブロックは、例えば、符号化中の未符号化ビデオブロックのピクセル差に関して密に一致することがわかった基準ピクチャビデオブロックである。一致は、絶対差の和(SAD)、二乗差の和(SSD)、及び/又は他の差分メトリックによって判断し得る。動き補償は、動き推定によって特定された動きベクトルに基づいて予測ブロックをフェッチ及び/又は生成することを含み得る。
[0046] 動き予測ユニット262は、未符号化ビデオブロックを基準ピクチャ記憶装置264に記憶された基準ピクチャからの基準ビデオブロックと比較することによって、未符号化ビデオブロックの動きベクトルを計算し得る。動き予測ユニット262は、基準ピクチャ記憶装置264に含まれる基準ピクチャの部分ピクセル位置の値を計算し得る。幾つかの場合、加算器226又はビデオエンコーダ200の別のユニットが、再構築ビデオブロックの部分ピクセル位置を計算し得、再構築ビデオブロックを部分ピクセル位置の計算された値と共に基準ピクチャ記憶装置264に記憶し得る。動き予測ユニット262は、基準ピクチャの(例えば、Iフレーム、及び/又はPフレーム、及び/又はBフレームの)サブ整数(sub-integer)ピクセルを補間し得る。
[0047] 動き予測ユニット262は、選択された動き予測子に対して動きベクトルを符号化するように構成し得る。動き/時間的予測ユニット262によって選択される動き予測子は、例えば、既に符号化された近隣ブロックの動きベクトルの平均値に等しいベクトルであり得る。未符号化ビデオブロックの動きベクトルを符号化するには、動き/時間的予測ユニット262は、動きベクトルと動き予測子との間の差分を計算して、動きベクトル差分値を形成し得る。
[0048] H.264及びHEVCは、1組の潜在な基準フレームを「リスト」と呼ぶ。基準ピクチャ記憶装置264に記憶される1組の基準ピクチャは、基準フレームのそのようなリストに対応し得る。動き/時間的予測ユニット262は、基準ピクチャ記憶装置264からの基準ピクチャの基準ビデオブロックを未符号化ビデオブロック(例えば、Pフレーム又はBフレームの)と比較し得る。基準ピクチャ記憶装置264内の基準ピクチャがサブ整数ピクセルの値を含む場合、動き/時間的予測ユニット262によって計算される動きベクトルは、基準ピクチャのサブ整数ピクセルロケーションを指し得る。動き/時間的予測ユニット262は、計算された動きベクトルをエントロピー符号化ユニット208及び動き/時間的予測ユニット262の動き補償機能に送信し得る。動き予測ユニット262(又はその動き補償機能)は、符号化中の未符号化ビデオブロックに対する予測ブロックの誤差値を計算し得る。動き予測ユニット262は、予測ブロックに基づいて予測データを計算し得る。
[0049] モード決定及びエンコーダコントローラユニット280は、符号化モードであるイントラモード又はインターモードの一方を選択し得る。モード決定及びエンコーダコントローラユニット280は、例えば、レート歪み最適化法及び/又は各モードで生成された誤差結果に基づいてそれを行い得る。
[0050] ビデオエンコーダ200は、動き予測ユニット262から提供された予測データを符号化中の未符号化ビデオブロックから減算することによって、残差ブロック(「残差ビデオブロック」)を形成し得る。加算器216は、この減算演算を実行し得る1つ又は複数の要素を表す。
[0051] 変換ユニット204は、変換を残差ビデオブロックに適用して、そのような残差ビデオブロックをピクセル値領域から周波数領域等の変換領域に変換し得る。変換は、例えば、本明細書に提供される変換である離散コサイン変換(DCT)又は概念的に同様の変換の何れかであり得る。変換の他の例には、特に、H.264及び/又はHEVCに定義される変換、ウェーブレット変換、整数変換、及び/又はサブバンド変換がある。変換ユニット204による残差ビデオブロックへの変換の適用は、残差ビデオブロックの変換係数の対応するブロック(「残差変換係数」)を生成する。これらの残差変換係数は、残差ビデオブロックの周波数成分の大きさを表し得る。変換ユニット204は、残差変換係数を量子化ユニット206に転送し得る。
[0052] 量子化ユニット206は、残差変換係数を量子化して、符号化ビットレートを更に低減し得る。例えば、量子化プロセスは、残差変換係数の幾つか又は全てに関連付けられたビット深度を低減し得る。特定の場合、量子化ユニット206は、QPに対応する量子化レベルによって残差変換係数の値を除算して、量子化変換係数のブロックを形成し得る。量子化の程度は、QP値を調整することによって変更し得る。量子化ユニット206は、所望の数の量子化ステップを使用して量子化を適用し、残差変換係数を表し得、使用されるステップ数(又はそれに対応して量子化レベルの値)は、残差ビデオブロックを表すのに使用される符号化ビデオビットの数を決め得る。量子化ユニット206は、レートコントローラ(図示せず)からQP値を取得し得る。量子化に続き、量子化ユニット206は、量子化変換係数をエントロピー符号化ユニット208及び逆量子化ユニット210に提供し得る。
[0053] エントロピー符号化ユニット208は、エントロピー符号化を量子化変換係数に適用して、エントロピー符号化係数(すなわち、ビットストリーム)を形成し得る。エントロピー符号化ユニット208は、適応可変長符号化(CAVLC)、コンテキスト適応バイナリ算術符号化(CABAC)、及び/又は他のエントロピー符号化技法を使用して、エントロピー符号化係数を形成し得る。CABACでは、当業者により理解されるように、コンテキスト情報(「コンテキスト」)の入力が求められ得る。このコンテキストは、例えば、近隣ビデオブロックに基づき得る。
[0054] エントロピー符号化ユニット208は、エントロピー符号化係数を動きベクトル及び1つ又は複数の基準ピクチャインデックスと共に、生の符号化ビデオビットストリームの形態で内部ビットストリームフォーマット(図示せず)に提供し得る。このビットストリームフォーマットは、ヘッダ及び/又は例えば、ビデオデコーダユニット300(図3)が生の符号化ビデオビットストリームから符号化ビデオブロックを復号化できるようにする他の情報を含む追加情報を生の符号化ビデオビットストリームに添付することにより、バッファ134(図1B)の出力に提供される符号化ビデオビットストリームBSを形成し得る。エントロピー符号化に続き、エントロピー符号化ユニット208から提供された符号化ビデオビットストリームBSは、例えば、出力バッファ134に出力し得、例えば、チャネル116を介して宛先デバイス114に送信し得、又は後に送信又は検索するためにアーカイブし得る。
[0055] 特定の代表的な実施形態では、エントロピー符号化ユニット208又はビデオエンコーダ133、200の別のユニットは、エントロピー符号化に加えて他の符号化機能を実行するように構成し得る。例えば、エントロピー符号化ユニット208は、ビデオブロックのコードブロックパターン(CBP)値を特定するように構成し得る。特定の代表的な実施形態では、エントロピー符号化ユニット208は、ビデオブロック内の量子化変換係数のランレングス符号化を実行し得る。一例として、エントロピー符号化ユニット208は、ジグザグスキャン又は他のスキャンパターンを適用して、量子化変換係数をビデオブロックに配置し、更に圧縮するためにゼロの長さを符号化し得る。エントロピー符号化ユニット208は、符号化ビデオビットストリームBSでの送信に適切なシンタックス要素を用いてヘッダ情報を構築し得る。
[0056] 逆量子化ユニット210及び逆変換ユニット212は、逆量子化及び逆変換をそれぞれ適用して、例えば、後に基準ビデオブロックの1つ(例えば、基準ピクチャリスト内の基準ピクチャの1つ内)として使用するために、残差ビデオブロックをピクセル領域で再構築し得る。
[0057] モード決定及びエンコーダコントローラユニット280は、再構築された残差ビデオブロックを基準ピクチャ記憶装置264に記憶された基準ピクチャの1つの予測ブロックに適用することにより、基準ビデオブロックを計算し得る。モード決定及びエンコーダコントローラユニット280は、1つ又は複数の補間フィルタを再構築残差ビデオブロックに適用して、動き推定に使用するためにサブ整数ピクセル値(例えば、半ピクセル位置の)を計算し得る。
[0058] 加算器226は、再構築残差ビデオブロックを動き補償予測ビデオブロックに追加して、基準ピクチャ記憶装置264に記憶される再構築ビデオブロックを生成し得る。再構築(ピクセル値領域)ビデオブロックは、動き予測ユニット262(又はその動き推定機能及び/又はその動き補償機能)により、続く未符号化ビデオ内の未符号化ビデオブロックをインター符号化するための基準ブロックの1つとして使用され得る。
[0059] フィルタ266(例えばループフィルタ)は、デブロックフィルタを含み得る。デブロックフィルタは、再構築されたマクロブロックに存在し得る視覚的アーチファクトを除去するように動作可能である。これらのアーチファクトは、例えば、Iタイプ、Pタイプ、又はBタイプ等の異なる符号化モードの使用に起因して符号化プロセスに導入され得る。アーチファクトは、例えば、受信したビデオブロックの境界及び/又はエッジに存在し得、デブロックフィルタは、ビデオブロックの境界及び/又はエッジを平滑化して、視覚的品質を改善するように動作可能である。デブロックフィルタは、加算器226の出力をフィルタリングし得る。フィルタ266は、HEVC規格によってサポートされるサンプル適応オフセット(SAO)フィルタ等の他のインループフィルタを含み得る。
[0060] 図3は、図1Aのビデオデコーダユニット130等のビデオデコーダユニットと併用される一例のビデオデコーダ300を示すブロック図である。ビデオデコーダ300は、入力302、エントロピー復号化ユニット308、動き補償予測ユニット362、空間予測ユニット360、逆量子化ユニット310、逆変換ユニット312、基準ピクチャ記憶装置364、フィルタ366、加算器326、及び出力320を含み得る。ビデオデコーダ300は、一般に、ビデオエンコーダ133、200に関して提供された符号化プロセスの逆である復号化プロセスを実行し得る。この復号化プロセスは、以下に記載のように実行し得る。
[0061] 動き補償予測ユニット362は、エントロピー復号化ユニット308から受信した動きベクトルに基づいて予測データを生成し得る。動きベクトルは、符号化動きベクトルに対応するビデオブロックの動き予測子に関して符号化し得る。動き補償予測ユニット362は、例えば、復号化すべきビデオブロックの近隣のブロックの動きベクトルの中央値として、動き予測子を決定し得る。動き予測子を決定した後、動き補償予測ユニット362は、符号化ビデオビットストリームBSから動きベクトル差分値を抽出し、動きベクトル差分値を動き予測子に加算することによって符号化動きベクトルを復号化し得る。動き補償予測ユニット362は、符号化動きベクトルと同じ解像度に動き予測子を量子化し得る。特定の代表的な実施形態では、動き補償予測ユニット362は、同じ精度を幾つか又は全ての符号化動き予測子に使用し得る。別の例として、動き補償予測ユニット362は、シーケンスパラメータセット、スライスパラメータセット、又は符号化ビデオビットストリームBSから得られるピクチャパラメータセットに含まれるデータを分析することにより、上記方法の何れかを使用し、どの方法を使用すべきかを判断するように構成し得る。
[0062] 動きベクトルを復号化した後、動き補償予測ユニット362は、動きベクトルにより識別された予測ビデオブロックを基準ピクチャ記憶装置364の基準ピクチャから抽出し得る。動きベクトルが、半ピクセル等の部分ピクセル位置を指す場合、動き補償予測ユニット362は、部分ピクセル位置の値を補間し得る。動き補償予測ユニット362は、これらの値の補間に適応補間フィルタ又は固定補間フィルタを使用し得る。動き補償予測ユニット362は、フィルタ366の何れを使用すべきかの指標、種々の代表的な実施形態では、フィルタ366の係数を受信した符号化ビデオビットストリームBSから取得し得る。
[0063] 空間予測ユニット360は、符号化ビデオビットストリームBSにおいて受信したイントラ予測モードを使用して、空間的に隣接するブロックから予測ビデオブロックを形成し得る。逆量子化ユニット310は逆量子化し得る(例えば、符号化ビデオビットストリームBSにおいて提供され、エントロピー復号化ユニット308により復号化された量子化ブロック係数を逆量子化し得る)。逆量子化プロセスは、例えば、H.264により定義されるように、従来のプロセスを含み得る。逆量子化プロセスは、各ビデオブロックのビデオエンコーダ133、200により計算された量子化パラメータQPを使用して、適用すべき量子化の程度及び/又は逆量子化の程度を決め得る。
[0064] 逆変換ユニット312は、逆変換(例えば、本明細書に記載の任意の変換の逆、逆DCT、逆整数変換、又は概念的に同様の逆変換プロセス)を変換係数に適用して、ピクセル領域での残差ビデオブロックを生成し得る。動き補償予測ユニット362は、動き補償ブロックを生成し得、補間フィルタに基づいて補間を実行し得る。サブピクセル精度の動き推定で使用すべき補間フィルタの識別子は、ビデオブロックのシンタックス要素に含まれ得る。動き補償予測ユニット362は、ビデオブロックの符号化中、ビデオエンコーダ133、200によって使用される補間フィルタを使用して、基準ブロックのサブ整数ピクセルの補間値を計算し得る。動き補償予測ユニット362は、受信したシンタックス情報に従ってビデオエンコーダ133、200により使用された補間フィルタを特定し、その補間フィルタを予測ブロックの生成に使用し得る。
[0065] 動き補償予測ユニット262は、(1)符号化ビデオシーケンスの1つ又は複数のピクチャの符号化に使用されたビデオブロックのサイズの特定にシンタックス情報を使用し得、(2)符号化ビデオシーケンスのフレームの各ビデオブロックがいかに区画化されたかを記述する区画化情報を使用し得、(3)各区画がいかに符号化されたかを示すモード(又はモード情報)を使用し得、(4)各インター符号化ビデオブロックの1つ又は複数の基準ピクチャを使用し得、及び/又は(5)符号化ビデオシーケンスの復号化するための他の情報を使用し得る。
[0066] 加算器326は、動き補償予測ユニット362又は空間予測ユニット360により生成された対応する予測ブロックと残差ブロックを合算して、復号化ビデオブロックを形成し得る。ループフィルタ366(例えば、デブロックフィルタ又はSAOフィルタ)は、復号化ビデオブロックをフィルタリングして、ブロックノイズアーチファクトを除去し、及び/又は視覚的品質を改善するために適用され得る。復号化ビデオブロックは基準ピクチャ記憶装置364に記憶し得、これは、続く動き補償に基準ビデオブロックを提供し得、表示デバイス(図示せず)への提示に向けて復号化ビデオを生成し得る。
ポイントクラウド圧縮
[0067] 図4は、ビデオベースポイントクラウド圧縮(V-PCC)のビットストリームの構造を示す。生成されたビデオビットストリーム及びメタデータは一緒に多重化されて、最終V-PCCビットストリームを生成する。
[0068] V-PCCビットストリームは、図4に示されるように1組のV-PCCユニットで構成される。V-PCC規格コミュニティドラフト(V-PCC CD)の最新版において定義されるV-PCCユニットのシンタックスを表1に与え、表1では、各V-PCCユニットはV-PCCユニットヘッダ及びV-PCCユニットペイロードを有する。V-PCCユニットヘッダは、V-PCCユニットタイプ(表2)を記述する。ユニットタイプ2、3、及び4を有するV-PCCユニットは、コミュニティドラフトで定義されるように、占有、ジオメトリ、及び属性データユニットである。これらのデータユニットは、ポイントクラウドの再構築に必要な3つの主な構成要素を表す。V-PCCユニットタイプに加えて、V-PCC属性ユニットヘッダは、属性タイプ及びそのインデックスも指定し、同じ属性タイプの複数のインスタンスをサポートできるようにする。
[0069] 占有、ジオメトリ、及び属性V-PCCユニットのペイロード(表3)は、対応する占有、ジオメトリ、及び属性パラメータセットV-PCCユニットにおいて指定されるビデオデコーダにより復号化することができるビデオデータユニット(例えば、HEVC NAL(ネットワーク抽象レイヤ)ユニット)に対応する。
Figure 2022524130000002
Figure 2022524130000003
Figure 2022524130000004
HTTP経由の動的ストリーミング(DASH)
[0070] MPEGのHTTP経由の動的適応ストリーミング(MPEG-DASH)は、変化するネットワーク状況に動的に適応することにより可能な限り最良のビデオ体感をエンドユーザに提供するユニバーサル配信フォーマットである。
[0071] MPEG-DASH等のHTTP適応ストリーミングでは、マルチメディアコンテンツの種々のビットレート代替をサーバで利用できるようにする必要がある。加えて、マルチメディアコンテンツは、それぞれが異なる特性を有し得る幾つかのメディア構成要素(例えば、オーディオ、ビデオ、テキスト)を含み得る。MPEG-DASHでは、これらの特性はメディア提示記述(MPD)によって記述される。
[0072] 図5はMPD階層データモデルを示す。MPDは、メディアコンテンツ構成要素の一貫した組の符号化バージョンが変わらないPeriodのシーケンスを記述する。各Periodは開始時間及び持続時間を有し、1つ又は複数の適応セット(AdaptationSet)で構成される。
[0073] Adaptation Setは、言語、メディアタイプ、ピクチャアスペクト比、役割、アクセス可能性、及び格付けプロパティ等の同一のプロパティを共有する1つ又は幾つかのメディアコンテンツ構成要素の1組の符号化バージョンを表す。例えば、AdaptationSetは、同じマルチメディアコンテンツの異なるビットレートのビデオ構成要素を含み得る。別のAdaptationSetは、同じマルチメディアコンテンツの異なるビットレートのオーディオ構成要素(例えば、より低品質のステレオ及びより高品質のサラウンド音)を含み得る。各AdaptationSetは通常、複数のRepresentationを含む。
[0074] Representationは、ビットレート、解像度、チャネル数、又は他の特性が他の表現と変わる1つ又は幾つかのメディア構成要素の配信可能符号化バージョンを記述する。各Representationは1つ又は複数のセグメントからなる。@id、@bandwidth、@qualityRanking、及び@dependencyId等のRepresentation要素の属性は、関連付けられたRepresentationのプロパティを指定するのに使用される。Representationは、Representationからの部分情報を記述し、部分情報を抽出する、Representationの一部であるサブ表現を含むこともできる。サブ表現は、そのサブ表現が含まれるRepresentationの低品質バージョンにアクセスする能力を提供し得る。
[0075] Segmentは、1つのHTTP要求を用いて検索することができるデータの最大単位である。各セグメントは、HTTP GET又はバイト範囲を有するHTTP GETを使用してダウンロードすることができるURL、すなわち、サーバ上のアドレス可能なロケーションを有する。
[0076] このデータモデルを使用するために、DASHクライアントはMPD XMLをパーズし、各AdaptationSet要素において提供される情報に基づいてその環境に適したAdaptationSetの集まりを選択する。各AdaptationSet内で、クライアントは、典型的には@bandwidth属性の値に基づいて、クライアントの復号化及びレンダリング能力も考慮に入れて1つのRepresentationを選択する。クライアントは、選択されたRepresentationの初期化セグメントをダウンロードし、次に、Segment全体又はSegmentのバイト範囲を要求することによりコンテンツにアクセスする。提示が開始されると、クライアントは、引き続きMedia Segment又はMedia Segmentの部分を要求し、メディア提示時系列に従ってコンテンツを再生することにより、メディアコンテンツを引き続き消費する。クライアントは、その環境からの更新された情報を考慮に入れてRepresentationを切り替え得る。クライアントは、Periodにわたり連続してコンテンツを再生すべきである。クライアントがSegmentに含まれるメディアをRepresentationにおいてアナウンスされたメディアの終わりに向けて消費した時点で、Media Presentationが終了され、新しいPeriodが開始され、又はMPDを再フェッチする必要がある。
DASHにおける記述子
[0077] MPEG-DASHは、メディアコンテンツについての特定用途向け情報を提供する記述子の概念を導入している。記述子要素は全て同じ方法で構造化され、すなわち、記述子要素は、スキームを識別するURIを提供する@schemeIdUri属性、任意選択的な属性である@value、及び任意選択的な属性である@idを含む。要素のセマンティクスは、利用されるスキームに特有である。スキームを識別するURIは、URN(ユニバーサルリソース名)又はURL(ユニバーサルリソースロケータ)であり得る。MPDは、これらの要素の使用の仕方についてのいかなる特定の情報も提供しない。適切なスキーム情報を用いて記述子要素をインスタンス作成するのは、DASHフォーマットを利用するアプリケーション次第である。これらの要素の1つを使用するDASHアプリケーションはまず、URIの形態でスキーム識別子を定義しなければならず、次に、そのスキーム識別子が使用されるとき、要素の値空間を定義しなければならない。構造化データが必要とされる場合、任意の拡張要素又は属性を別個の名前空間において定義し得る。記述子は、MPD内の幾つかのレベルで出現し得る:
-MPDレベルにおける要素の存在は、その要素がMPD要素の子であることを意味しする。
-適応セットレベルにおける要素の存在は、その要素がAdaptationSet要素の子要素であることを意味する。
-表現レベルにおける要素の存在は、その要素がRepresentation要素の子要素であることを意味する。
事前選択
[0078] MPEG-DASHでは、バンドルとは、1つのデコーダインスタンスによりまとめて消費し得る1組のメディア構成要素である。各バンドルは、デコーダ特有情報を含み、デコーダをブートストラップするメインメディア構成要素を含む。PreSelectionは、まとめて消費されることが予期されるバンドル内のメディア構成要素のサブセットを定義する。
[0079] メインメディア構成要素を含むAdaptationSetは、メインAdaptationSetと呼ばれる。メインメディア構成要素は、バンドルに関連付けられた任意のPreSelectionに常に含まれる。加えて、各バンドルは1つ又は複数の部分AdaptationSetを含み得る。部分AdaptationSetは、メインAdaptationSetと組み合わせてのみ処理し得る。
[0080] Preselectionは、表4に定義されるように、PreSelection要素を通して定義し得る。PreSelectionの選択は、PreSelection要素に含まれる属性及び要素に基づく。
Figure 2022524130000005
ポイントクラウドの適応ストリーミング
[0081] ビデオ等の従来のマルチメディアアプリケーションはなお人気があるが、VR及び没入型3Dグラフィックス等の新しいメディアに大きな関心が寄せられている。高品質3Dポイントクラウドは近年、仮想世界との新しい形態の対話及び通信を可能にする没入型メディアの高度表現として出現した。そのような動的ポイントクラウドを表すのに必要な大量の情報により、効率的な符号化アルゴリズムが必要とされる。MPEGの3DGワークグループは現在、MPEG#124会議でリリースされたコミュニティドラフト(CD)バージョンを用いたビデオベースポイントクラウド圧縮規格の開発に取り組んでいる。CDの最新バージョンは、圧縮された動的ポイントクラウドのビットストリームを定義している。これと平行してMPEGは、ポイントクラウドデータを搬送するシステム規格も開発中である。
[0082] 上記ポイントクラウド規格は、ポイントクラウドの符号化及び記憶の態様のみに対処している。しかしながら、実用的なポイントクラウドアプリケーションが、ネットワークを経由したポイントクラウドデータのストリーミングを必要とすることが考えられる。そのようなアプリケーションは、コンテンツがいかに生成されたかに応じてポイントクラウドコンテンツのライブ又はオンデマンドストリーミングを実行し得る。更に、ポイントクラウドの表現に大量の情報が必要であることに起因して、そのようなアプリケーションは、ネットワークの過負荷を避けるために、適応ストリーミング技法をサポートし、任意の所与の瞬間でのネットワーク容量に関してその瞬間での最適な閲覧体感を提供する必要がある。
[0083] ポイントクラウドの適応配信の強力な一方法候補は、HTTP経由の動的適応ストリーミング(DASH)である。しかしながら、現在のMPEG-DASH規格は、MPEG V-PCC規格に基づくポイントクラウドストリームを含め、ポイントクラウドメディアのいかなるシグナリングメカニズムも提供していない。したがって、ストリーミングクライアントがメディア提示記述子(MPD)ファイル内のポイントクラウドストリーム及びそれらの構成要素サブストリームを識別できるようにする新しいシグナリング要素を定義することが重要である。加えて、ストリーミングクライアントが、サポート可能なポイントクラウド又はその構成要素の最良のバージョンを選択できるように、ポイントクラウド構成要素に関連付けられた異なる種類のメタデータをシグナリングする必要もある。
[0084] 従来のメディアコンテンツと異なり、V-PCCメディアコンテンツは幾つかの構成要素で構成され、幾つかの構成要素は複数のレイヤを有する。各構成要素(及び/又はレイヤ)は、V-PCCビットストリームのサブストリームとして別個に符号化される。ジオメトリ及び占有マップ(テクスチャ等の幾つかの属性に加えて)等の幾つかの構成要素サブストリームは、従来のビデオエンコーダ(例えば、H.264/AVC又はHEVC)を使用して符号化される。しかしながら、これらのサブストリームは、ポイントクラウドをレンダリングするために、追加のメタデータと共にまとめて復号化される必要がある。
[0085] 幾つかのXML要素及び属性が定義される。これらのXML要素は別個の名前空間「urn:mpeg:mpegI:vpcc:2019」において定義される。名前空間指示子「vpcc:」は、このドキュメントにおけるこの名前空間を参照するのに使用される。
DASH MPDにおけるV-PCC構成要素のシグナリング
[0086] 各V-PCC構成要素及び/又は構成要素レイヤは、DASHマニフェスト(MPD)ファイルにおいて、V-PCCコンテンツのメインアクセスポイントとして機能する追加のAdaptationSet(以下、「メインAdaptationSet」)を有する別個のAdaptationSet(以下、「構成要素AdaptationSet」)として表すことができる。別の実施形態では、解像度毎に1構成要素当たり1つの適応セットがシグナリングされる。
[0087] 実施形態では、全てのV-PCC構成要素AdaptationSetを含むV-PCCストリームの適応セットは、「vpc1」に設定された@codecs属性(例えば、V-PCCに定義される)の値を有するものとし、これは、MPDがクラウドポイントに関することを示す。別の実施形態では、メインAdaptationSetのみが、「vpc1」に設定された@codecs属性を有し、一方、ポイントクラウド構成要素のAdaptationSetの@codecs属性(又はAdaptationSet要素の@codecsがシグナリングされない場合、各Representation)は、その構成要素の符号化に使用された各コーデックに基づいて設定される。ビデオ符号化構成要素の場合、@codecsの値は「resv.pccv.XXXX」に設定されるものとし、ここで、XXXXはビデオコーデック(例えば、avc1又はhvc1)の4文字コード(4CC)に対応する。
[0088] 構成要素AdaptationSet内のV-PCC構成要素のタイプ(例えば、占有マップ、ジオメトリ、又は属性)を識別するために、EssentialProperty記述子を「urn:mpeg:mpegI:vpcc:2019:component」と等しい@schemeIdUri属性と併用し得る。この記述子はVPCCComponent記述子と呼ばれる。
[0089] 適応セットレベルにおいて、適応セットのRepresentationに提示される各ポイントクラウド構成要素に1つのVPCCComponent記述子をシグナリングし得る。
[0090] 実施形態では、VPCCComponent記述子の@value属性は存在しないものとする。VPCCComponent記述子は、表5において指定されるような要素及び属性を含み得る。
Figure 2022524130000006
Figure 2022524130000007
[0091] VPCCComponent記述子の種々の要素及び属性のデータ型は、以下のXMLスキームにおいて定義し得る。
Figure 2022524130000008
[0092] 実施形態では、メインAdaptationSetは、適応セットレベルにおける1つの初期化セグメント又は表現レベル(各Representationに1つ)における複数の初期化セグメントの何れかを含むものとする。実施形態では、初期化セグメントは、コミュニティドラフトにおいて定義されるように、V-PCCデコーダの初期化に使用されるV-PCCシーケンスパラメータセットを含むものとする。1つの初期化セグメントの場合、全てのRepresentationのV-PCCシーケンスパラメータセットは、初期化セグメントに含まれ得る。2つ以上のRepresentationがメインAdaptationSetにおいてシグナリングされる場合、各Representationの初期化セグメントは、その特定のRepresentationのV-PCCシーケンスパラメータセットを含み得る。ISO/IEC 23090-10のWDに定義されるように、ISOベースメディアファイルフォーマット(ISOBMFF)がV-PCCコンテンツのメディアコンテナとして使用される場合、初期化セグメントは、ISO/IEC 14496-12に定義されるように、メタボックスを含むこともできる。このメタボックスは、VPCC CDに定義されるように、ファイルフォーマットレベルにおけるトラック及びトラック間の関係を記述するメタデータ情報を提供する1つ又は複数のVPCCGroupBoxインスタンスを含む。
[0093] 実施形態では、メインAdaptationSetのRepresentationのメディアセグメントは、コミュニティドラフトで定義されたV-PCCトラックの1つ又は複数のトラックフラグメントを含む。構成要素AdaptationSetのRepresentationのメディアセグメントは、ファイルフォーマットレベルにおける対応する構成要素トラックの1つ又は複数のトラックフラグメントを含む。
[0094] 別の実施形態では、本明細書では@videoCodec属性と呼ばれる追加の属性がVPCCComponent記述子に定義され、その値は、対応するポイントクラウド構成要素の符号化に使用されたコーデックを示す。これは、2つ以上のポイントクラウド構成要素がAdaptationSet又はRepresentationに存在する状況をサポートできるようにする。
[0095] 別の実施形態では、Role記述子要素は、V-PCC構成要素の新たに定義された値と併用されて、対応するAdaptationSet又はRepresentationの役割(例えば、ジオメトリ、占有マップ、又は属性)を示し得る。例えば、ジオメトリ、占有マップ、及び属性構成要素はそれぞれ以下の対応する値を有し得る:vpcc-ジオメトリ、vpcc-占有、及びvpcc-属性。表5に記載されるものから構成要素タイプ属性を差し引いたものと同様の追加のEssentialProperty記述子要素を適応セットレベルでシグナリングして、構成要素のレイヤ及び属性タイプ(構成要素がポイントクラウド属性である場合)を識別し得る。
V-PCC適応セットのグループ化
[0096] ストリーミングクライアントは、対応する要素内のVPCCComponent記述子をチェックすることにより、AdaptationSet又はRepresentation内のポイントクラウド構成要素のタイプを識別することが可能である。しかしながら、ストリーミングクライアントは、MPDファイルに存在する異なるポイントクラウドストリームを区別し、それらの各構成要素ストリームを識別する必要もある。
[0097] 「urn:mpeg:mpegI:vpcc:2019:vpc」に等しい@schemeIdUri属性を有するEssentialProperty要素を導入し得、これは本明細書ではVPCC記述子と呼ばれる。多くとも1つのVPCC記述子が、ポイントクラウドのメインAdaptationSetの適応セットレベルに存在し得る。2つ以上のRepresentationがメインAdaptationSetに存在する場合、多くとも1つのVPCC記述子が表現レベル(すなわち、各Representation要素内)に存在し得る。表6は、実施形態によるVPCC記述子の属性を示す。
Figure 2022524130000009
[0098] ポイントクラウドの2つ以上のバージョンが利用可能である(例えば、異なる解像度)場合、各バージョンは、1つのRepresentation及び@pcId属性に同じ値を有するVPCC記述子を含む別個の構成要素AdaptationSetに存在し得る。別の実施形態では、ポイントクラウドの異なるバージョンは、1つの(メイン)AdaptationSetのRepresentationとしてシグナリングし得る。そのような場合、VPCC記述子は各Representationに存在するものとし、@pcId属性は、メインAdaptationSetにおいて全てのRepresentationに同じ値を用いてシグナリングされてもよく、又は省かれてもよい。
[0099] 別の実施形態では、PreSelectionが、ポイントクラウドのメインAdaptationSetのIDの後にポイントクラウド構成要素に対応する構成要素AdaptationSetのIDを含む@preselectionComponents属性の値と共にMPDでシグナリングされる。PreSelectionの@codecs属性は「vpc1」に設定されるものとし、PreSelectionメディアがビデオベースポイントクラウドであることを示す。PreSelectionは、Period要素内のPreSelection要素、又は適応セットレベル(若しくは複数のバージョン/表現が同じポイントクラウドに利用可能な場合、表現レベル)における事前選択記述子を使用してシグナリングし得る。PreSelection要素が使用され、同じポイントクラウドの2つ以上のバージョンが利用可能な場合、各バージョンは別個のPreSelection要素でシグナリングされ、@preselectionComponents属性のIDリストの最初のIDは、メインAdaptationSetにおける対応するポイントクラウドバージョンのRepresentationのIDである。図6は、MPEG-DASH MPDファイル内の1つのポイントクラウドに属するV-PCC構成要素をグループ化する例示的なDASH構成を示す。
[0100] 事前選択記述子を使用して、このグループ化/関連付けは以下のようにシグナリングし得る。
Figure 2022524130000010
[0101] 別の実施形態では、ポイントクラウドのメインAdaptationSet又はそのRepresentationは、ISO/IEC 23009-1において定義される@associationId属性を使用して構成要素のAdaptationSet及び/又はRepresentationの識別子を列記し得、@associationType値はV-PCCの4CC(すなわち、「vpc1」)に設定される。
[0102] 別の実施形態では、ポイントクラウドのメインAdaptationSet又はそのRepresentationは、ISO/IEC 23009-1において定義される@dependencyId属性を使用して構成要素のAdaptationSet及び/又はRepresentationの識別子を列記し得る。これは、ポイントクラウドを再構築するために、メインAdaptationSet内のセグメントはポイントクラウド構成要素の構成要素AdaptationSetからのセグメントと併せて復号化される必要があるため、固有の従属性があるためである。
構成要素メタデータのシグナリング
[0103] ジオメトリメタデータ及び属性メタデータは通常、レンダリングに使用される。これらはV-PCCビットストリームのパラメータセット内でシグナリングされる。しかしながら、ストリーミングクライアントが可能な限り早期にこれらのメタデータ要素の情報を取得することができるように、これらのメタデータ要素をMPDにおいてシグナリングすることが必要であり得る。加えて、ストリーミングクライアントは、異なるジオメトリ及び属性メタデータ値を有するポイントクラウドの複数のバージョンから選択を行い得る(例えば、クライアントがシグナリングされた値をサポートするか否かに基づいて)。
ジオメトリメタデータのシグナリング
[0104] 「urn:mpeg:mpegI:vpcc:2019:geom_meta」に等しい@schemeIdUri属性を有するSupplementalProperty要素を導入し得、これは本明細書ではジオメトリメタデータ記述子又はgeoMeta記述子と呼ばれる。多くとも1つのgeomMeta記述子がMPDレベルに存在し得、その場合、以下考察するように下位レベルでgeoMeta記述子によりオーバーライドされない限り、MPDにおいてシグナリングされる全てのポイントクラウドのジオメトリ構成要素に当てはまる。多くとも1つのgeomMeta記述子が、メインAdaptationSet内の適応セットレベルに存在し得る。多くとも1つのgeomMeta記述子が、メインAdaptationSet内の表現レベルに存在し得る。geomMeta記述子が特定のレベルに存在する場合、geomMeta記述子は、上位レベルにおいてシグナリングされるあらゆるgeomMeta記述子をオーバーライドする。
[0105] 実施形態では、geomMeta記述子の@value属性は存在しないものとする。実施形態では、geomMeta記述子は、表7に指定される要素及び属性を含む。
Figure 2022524130000011
Figure 2022524130000012
Figure 2022524130000013
[0106] 実施形態では、geomMeta記述子の種々の要素及び属性のデータ型は、以下のXMLスキーマにおいて定義されるようなものであり得る。
Figure 2022524130000014
Figure 2022524130000015
属性メタデータのシグナリング
[0107] 「urn:mpeg:mpegI:vpcc:2019:attr_meta」に等しい@schemeIdUri属性を有するSupplementalProperty要素を導入し得、これは本明細書では属性メタデータ記述子又はattrMeta記述子と呼ばれる。多くとも1つのattrMeta記述子が、メインAdaptationSet内の適応セットレベルに存在し得る。多くとも1つのattrMeta記述子が、メインAdaptationSet内の表現レベルに存在し得る。attrMeta記述子が表現レベルに存在する場合、attrMeta記述子は、Representationが属するAdaptationSetの適応セットレベルにおいてシグナリングされるあらゆるattrMeta記述子をオーバーライドする。
[0108] 実施形態では、attrMeta記述子の@value属性は存在しない。実施形態では、attrMeta記述子は、表8において指定される要素及び属性を含み得る。
Figure 2022524130000016
Figure 2022524130000017
Figure 2022524130000018
[0109] 実施形態では、attrMeta記述子の種々の要素及び属性のデータ型は以下のXMLスキーマにおいて定義されるようなものであり得る。
Figure 2022524130000019
クライアント挙動のストリーミング
[0110] DASHクライアント(デコーダノード)は、MPDにおいて提供される情報によりガイドされる。以下は、メインポイントクラウドAdaptationSetへの構成要素AdaptationSetの関連付けがVPCC記述子を使用してシグナリングされる実施形態を仮定した、本明細書に提示されるシグナリングに従ってストリーミングポイントクラウドコンテンツを処理する一例のクライアント挙動である。図7は、実施形態による一例のストリーミングクライアントプロセスを示す流れ図である。
[0111] 711において、クライアントはまず、HTTP要求を発行し、MPDファイルをコンテンツサーバからダウンロードする。次に、クライアントはMPDファイルをパーズして、MPDファイル内のXML要素の対応するインメモリ表現を生成する。
[0112] 次に、713において、Period内の利用可能なポイントクラウドメディアコンテンツを識別するために、ストリーミングクライアントはAdaptationSet要素をスキャンして、「vpc1」に設定された@codecs属性及びVPCC記述子要素を有するAdaptationSetを見つける。その結果生成されるサブセットは、ポイントクラウドコンテンツの1組のメインAdaptationSetである。
[0113] 次に、715において、ストリーミングクライアントは、それらのAdaptationSetのVPCC記述子をチェックすることにより一意のポイントクラウドの数を識別し、VPCC記述子に同じ@pcId値を有するAdaptationSetを同じコンテンツのバージョンとしてグループ化する。
[0114] 717において、ユーザがストリーミングを望むポイントクラウドコンテンツに対応する@pcId値を有するAdaptationSetのグループが識別される。グループが2つ以上のAdaptationSetを含む場合、ストリーミングクライアントは、サポートされるバージョン(例えばビデオ解像度)を有するAdaptationSetを選択する。その他の場合、グループの単独のAdaptationSetが選ばれる。
[0115] 次に、719において、ストリーミングクライアントは、選ばれたAdaptationSetのVPCC記述子をチェックして、ポイントクラウド構成要素のAdaptationSetを識別する。これらは、@occupancyId、@geometryId、及び@attributeId属性の値から識別される。geomMeta及び/又はattrMeta記述子が選ばれたメインAdaptationSetに存在する場合、ストリーミングクライアントは、いかなるセグメントもダウンロードする前に、ポイントクラウドストリームのシグナリングされたレンダリング構成をサポートするか否かを識別することが可能である。その他の場合、クライアントは、初期化セグメントからこの情報を抽出する必要がある。
[0116] 次に、721において、クライアントは、V-PCCデコーダの初期化に必要なパラメータセットを含むメインAdaptationSetの初期化セグメントをダウンロードすることにより、ポイントクラウドのストリーミングを開始する。
[0117] 723において、ビデオ符号化構成要素ストリームの初期化セグメントがダウンロードされ、メモリにキャッシュされる。
[0118] 725において、次に、ストリーミングクライアントは、HTTPを経由して平行してメインAdaptationSet及び構成要素AdaptationSetからの時間を合わせたメディアセグメントのダウンロードを開始し、ダウンロードされたセグメントはインメモリセグメントバッファに記憶される。
[0119] 727において、時間を合わせたメディアセグメントは、各バッファから削除され、各初期化セグメントと連結される。
[0120] 最後に、729において、メディアコンテナ(例えばISOBMFF)がパーズされて、基本ストリーム情報を抽出し、V-PCC規格に従ってV-PCCビットストリームを構造化し、次に、ビットストリームが、V-PCCデコーダに渡される。
[0121] 特徴及び要素は特定の組合せで上述されているが、各特徴又は要素が単独で又は他の特徴及び要素との任意の組合せで使用可能なことを当業者なら理解しよう。加えて、本明細書に記載の方法は、コンピュータ又はプロセッサにより実行するために、コンピュータ可読媒体に組み込まれるコンピュータプログラム、ソフトウェア、又はファームウェアで実施し得る。非一時的コンピュータ可読記憶媒体の例には、読み取り専用メモリ(ROM)、ランダムアクセスメモリ(RAM)、レジスタ、キャッシュメモリ、半導体メモリデバイス、内部ハードディスク及びリムーバブルディスク等の磁気媒体、磁気光学媒体及びCD-ROMディスク等の光学媒体、並びにデジタル多用途ディスク(DVD)があるが、これらに限定されない。ソフトウェアと関連付けられたプロセッサは、WTRU 102、UE、端末、基地局、RNC、又は任意のホストコンピュータでの使用に向けて無線周波数送受信機を実施するのに使用し得る。
[0122] 更に、上述した実施形態では、処理プラットフォーム、計算システム、コントローラ、及びプロセッサを含む他のデバイスが記載されている。これらのデバイスは、少なくとも1つの中央演算処理装置(「CPU」)及びメモリを含み得る。コンピュータプログラミングの当業者によれば、動作、及び演算又は命令の象徴的表現への参照は、種々のCPU及びメモリにより実行し得る。そのような動作及び演算又は命令は、「実行される」、「コンピュータ実行される」、又は「CPU実行される」と参照し得る。
[0123] 動作、及び演算又は命令の象徴的表現が、CPUによる電気信号の操作を含むことを当業者なら理解しよう。電気システムは、電気信号の変換又は低減及びメモリシステムにおけるメモリロケーションにおけるデータビットの維持を生じさせることができ、それにより、CPUの演算、及び信号の他の処理を再構成又は他の方法で変更するデータビットを表す。データビットが維持されるメモリロケーションは、データビットに対応する又はデータビットを表す特定の電気、磁気、光学、又は有機特性を有する物理的ロケーションである。例示的な実施形態が上記プラットフォーム又はCPUに限定されず、他のプラットフォーム及びCPUが提供された方法をサポートすることもできることを理解されたい。
[0124] データビットは、磁気ディスク、光ディスク、及びCPU可読の任意の他の揮発性(例えばランダムアクセスメモリ(「RAM」))又は不揮発性(例えば読み取り専用メモリ(「ROM」))大容量記憶システムを含むコンピュータ可読媒体で維持することもできる。コンピュータ可読媒体は、専ら処理システムに存在し、又は処理システムにローカル又はリモートであり得る複数の相互接続された処理システムに分散する、協働又は相互接続されたコンピュータ可読媒体を含み得る。代表的な実施形態が上記メモリに限定されず、他のプラットフォーム及びメモリが記載の方法をサポートすることもできることが理解される。
[0125] 例示的な実施形態では、本明細書に記載の任意の演算、プロセス等は、コンピュータ可読媒体に記憶されたコンピュータ可読命令として実施し得る。コンピュータ可読命令は、モバイルユニット、ネットワーク要素、及び/又は任意の他の計算デバイスのプロセッサにより実行し得る。
[0126] システムの態様のハードウェア実施とソフトウェア実施との間の区別は殆どない。ハードウェア又はソフトウェアの使用は一般に(しかし、特定の状況では、ハードウェアとソフトウェアとの間の選択が大きくなり得るという点で常にではない)、費用対効率のトレードオフを表す設計の選択である。本明細書に記載のプロセス、及び/又はシステム、及び/又は他の技術を行えるようにし得る種々の手段(例えば、ハードウェア、ソフトウェア、及び/又はファームウェア)があり得、好ましい手段は、プロセス、及び/又はシステム、及び/又は他の技術が展開される状況に伴って様々であり得る。例えば、スピード及び正確性が最重要であると実施者が判断する場合、実施者は主にハードウェア及び/又はファームウェア手段を選び得る。柔軟性が最重要である場合、実施者は主にソフトウェア実施を選び得る。代替的には、実施者は、ハードウェア、ソフトウェア、及び/又はファームウェアの何らかの組合せを選び得る。
[0127] 上記詳細な説明は、ブロック図、フローチャート、及び/又は例の使用を介してデバイス及び/又はプロセスの種々の実施形態を記載した。そのようなブロック図、フローチャート、及び/又は例が1つ又は複数の機能及び/又は演算を含む限り、そのようなブロック図、フローチャート、又は例内の各機能及び/又は演算が個々に及び/又はまとめて、多種多様なハードウェア、ソフトウェア、ファームウェア、又はそれらの略あらゆる組合せにより実施し得ることが当業者には理解されよう。例として、適したプロセッサには、汎用プロセッサ、専用プロセッサ、従来のプロセッサ、デジタル信号プロセッサ(DSP)、複数のマイクロプロセッサ、DSPコアと関連した1つ又は複数のマイクロプロセッサ、コントローラ、マイクロコントローラ、特定用途向け集積回路(ASIC)、特定用途向け標準製品(ASSP)、フィールドプログラマブルゲートアレイ(FPGA)回路、任意の他のタイプの集積回路(IC)、及び/又は状態機械がある。
[0128] 特徴及び要素は特定の組合せで先に提供されているが、各特徴又は要素が単独で又は他の特徴及び要素と任意の組合せで使用可能なことを当業者なら理解しよう。本開示は、本願に記載の特定の実施形態に関して限定されるべきではなく、本願に記載の特定の実施形態は種々の態様の例示として意図される。当業者には明らかであるように、趣旨及び範囲から逸脱せずに多くの変更及び変形を行うことができる。本願の説明で使用される要素、動作、又は命令は、明らかにそのように提供される場合を除き、本発明にとって極めて重要又は重要であるものとして解釈されるべきではない。本明細書に列記されたものに加えて、本開示の範囲内の機能的に均等な方法及び装置が上記説明から当業者に明らかになろう。そのような変更及び変形は、添付の特許請求の範囲内であることが意図される。本開示は、添付の特許請求の範囲及びそのような特許請求の範囲が権利を有する全範囲の均等物に関してのみ限定されるべきである。本開示が特定の方法又はシステムに限定されないことを理解されたい。
[0129] 本明細書で使用される用語は、特定の実施形態を記載することだけを目的とし、限定を意図しないことも理解されたい。本明細書で使用される場合、本明細書で言及されるとき、用語「局(station)」及びその略語「STA」、「ユーザ機器」及びその略語「UE」は、(i)以下に記載される等の無線送信及び/又は受信ユニット(WTRU)、(ii)以下に記載される等のWTRUの幾つかの実施形態の何れか、(iii)特に、以下に記載される等のWTRUの幾つかの又は全ての構造及び機能が構成された無線可能及び/又は有線可能(例えば接続可能)なデバイス、(iii)以下に記載される等のWTRUの全て未満の構造及び機能が構成された無線可能及び/又は有線可能なデバイス、又は(iv)同様のものを意味し得る。
[0130] 特定の代表的な実施形態では、本明細書に記載の趣旨の幾つかの部分は、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)、デジタル信号プロセッサ(DSP)、及び/又は他の集積フォーマットを介して実施し得る。しかしながら、本明細書に開示される実施形態の幾つかの態様が全体的又は部分的に、集積回路で、1つ若しくは複数のコンピュータで実行される1つ若しくは複数のコンピュータプログラムとして(例えば、1つ若しくは複数のコンピュータシステムで実行される1つ若しくは複数のプログラムとして)、1つ若しくは複数のプロセッサで実行される1つ若しくは複数のプログラムとして(例えば、1つ若しくは複数のマイクロプロセッサで実行される1つ若しくは複数のプログラムとして)、ファームウェアとして、又はそれらの略あらゆる組合せとして等しく実施し得、回路を設計すること及び/又はソフトウェア及びファームウェアのコードを書くことが、本開示に鑑みて十分に当業者の技能内にあることを当業者なら認識しよう。加えて、本明細書に記載の趣旨のメカニズムが、多種多様な形態でプログラム製品として配布し得、本明細書に記載の趣旨の例示的な実施形態が、配布の実際の実行に使用される信号搬送媒体の特定のタイプに関係なく適用されることを当業者は理解しよう。信号搬送媒体の例には、以下があるが、これらに限定されない:フロッピーディスク、ハードディスクドライブ、CD、DVD、デジタルテープ、コンピュータメモリ等の記録可能型媒体、並びにデジタル及び/又はアナログ通信媒体(例えば、光ファイバケーブル、導波管、有線通信リンク、無線通信リンク等)等の伝送型媒体。
[0131] 本明細書に記載の趣旨は時に、異なる他の構成要素内に含まれる異なる構成要素又は異なる他の構成要素と接続された異なる構成要素を示す。そのような図示されたアーキテクチャが単なる例であり、実際には、同じ機能を達成する多くの他のアーキテクチャが実施可能であることを理解されたい。概念の意味では、同じ機能を達成する構成要素の任意の配置は事実上、所望の機能を達成し得るように「関連付けられる」。したがって、本明細書において特定の機能を達成するために組み合わせられた任意の2つの構成要素は、アーキテクチャ又は介在構成要素に関係なく、所望の機能が達成されるように互いと「関連付けられる」と見ることができる。同様に、そうして関連付けられた任意の2つの構成要素は、所望の機能を達成するように互いと「動作可能に接続」又は「動作可能に結合」されるとして見ることもでき、そうして関連付けることが可能な任意の2つの構成要素は、所望の機能を達成するように互いと「動作可能に結合可能」であるとして見ることもできる。動作可能に結合可能な具体例には、物理的に嵌合可能及び/又は物理的に相互作用可能な構成要素、及び/又は無線相互作用可能であり及び/又は無線で相互作用する構成要素、及び/又は論理的に相互作用し及び/又は論理的に相互作用可能な構成要素があるが、これらに限定されない。
[0132] 本明細書における略あらゆる複数形及び/又は単数形の用語の使用に関して、当業者ならば、状況及び/又は用途に適切なように複数形から単数形に及び/又は単数形から複数形に変換することができる。種々の単数形/複数形の置換は、明確さのために本明細書に明示的に記載され得る。
[0133] 一般に、本明細書、特に添付の特許請求の範囲(例えば、添付の特許請求の範囲の本文)で使用される用語が一般に、「オープン」用語(例えば、用語「含んでいる」は「~を含んでいるがこれに限定されない」として解釈されるべきであり、用語「有する」は「少なくとも~を有する」として解釈されるべきであり、用語「含む」は「~を含むがこれに限定されない」として解釈されるべき等)として意図されることが当業者には理解されよう。導入される請求項記載事項の特定の数が意図される場合、そのような意図は請求項に明示的に記載され、そのような記載がない場合、そのような意図は存在しないことが当業者には更に理解されよう。例えば、1つのみの項目が意図される場合、用語「1つ」又は同様の文言が使用され得る。理解の助けとして、以下の添付の特許請求の範囲及び/又は本明細書における説明は、請求項記載事項を導入するために導入句「少なくとも1つ」及び「1つ又は複数」の使用を含み得る。しかしながら、そのような句の使用は、不定冠詞「1つの(a)」又は「1つの(an)」による請求項記載事項の導入が、そのように導入される請求項記載事項を含むいかなる特定の請求項も、同じ請求項が導入句「1つ又は複数」又は「少なくとも1つ」及び「1つの(a)」又は「1つの(an)」等の不定冠詞を含む場合であっても、そのような1つのみの記載を含む実施形態に限定することの暗示として解釈されるべきではない(例えば、「1つの(a)」及び/又は「1つの(an)」は、「少なくとも1つ」又は「1つ又は複数」を意味すると解釈されるべきである)。請求項記載事項を導入するために使用される定冠詞の使用についても同じことが当てはまる。加えて、導入される請求項記載事項の特定の数が明示的に記載される場合であっても、そのような記載が少なくとも記載された数を意味するものと解釈すべきであることを当業者なら認識しよう(例えば、他の修飾がない「2つの記載事項」の裸の記載は、少なくとも2つの記載事項又は2つ以上の記載事項を意味する)。更に、「A、B、及びCの少なくとも1つ等」と同様の表現法が使用される場合、一般にそのような構造は、当業者がその表現法を理解する意味(例えば、「A、B、及びCの少なくとも1つを有するシステム」は、Aのみ、Bのみ、Cのみ、A及びBを一緒に、A及びCを一緒に、B及びCを一緒に、及び/又はA、B、及びCを一緒に等有するシステムを含むが、これらに限定されない)で意図される。「A、B、又はCの少なくとも1つ等」と同様の表現法が使用される場合、一般にそのような構造は、当業者がその表現法を理解する意味(例えば、「A、B、又はCの少なくとも1つを有するシステム」は、Aのみ、Bのみ、Cのみ、A及びBを一緒に、A及びCを一緒に、B及びCを一緒に、及び/又はA、B、及びCを一緒に等有するシステムを含むが、これらに限定されない)で意図される。2つ以上の代替の用語を提示する略あらゆる離語及び/又は離接句は、説明にあろうと、特許請求の範囲にあろうと、又は図面にあろうと関係なく、それらの用語の1つ、それらの用語の何れか一方、又は両用語を含む可能性を意図するものと理解されるべきであることが当業者には更に理解されよう。例えば、句「A又はB」は、「A」又は「B」又は「A及びB」の可能性を含むものと理解される。更に、複数の項目及び/又は項目の複数のカテゴリの列記が続く用語「の何れか」は、本明細書で使用される場合、個々に又は他の項目及び/又は項目の他のカテゴリと組み合わせて、項目及び/又は項目のカテゴリ「の何れか」、「の任意の組合せ」、「の任意の複数」、及び/又は「の複数の任意の組合せ」を含むことが意図される。更に、本明細書で使用される場合、用語「セット」又は「グループ」は、ゼロを含む任意の数の項目を含むことが意図される。更に、本明細書で使用される場合、用語「数」はゼロを含む任意の数を含むことが意図される。
[0134] 加えて、本開示の特徴又は態様がマーカッシュ群に関して記載される場合、本開示がそれにより、マーカッシュ群の任意の個々の要素又は要素のサブグループに関しても記載されることを当業者なら認識しよう。
[0135] 当業者には理解されるように、書面での説明を提供することに関して等、ありとあらゆる目的で、本明細書に開示される全ての範囲は、考えられるありとあらゆる下位範囲及びその下位範囲の組合せも包含する。任意の列記された範囲は、同範囲が少なくとも2等分、3等分、4等分、5等分、10等分等に分割することを十分に記載し、そのような分割を可能にするものとして容易に認識することができる。非限定的な例として、本明細書で論じる各範囲は、下部3分の1、中央3分の1及び上部3分の1等に容易に分割し得る。また当業者には理解されるように、「~まで」、「少なくとも」、「~より大きい」、「~より小さい」等の全ての文言は記載の数字を含み、また上述したような下位範囲に続けて分割可能な範囲を指している。最後に、当業者なら理解するように、範囲には、その個々の要素が含まれる。したがって、例えば、1~3個の細胞を有する群は、1、2、又は3個の細胞を有する群を指す。同様に、1~5個の細胞を有する群は、1、2、3、4、又は5個の細胞を有する群を指す等々。
[0136] 更に、特許請求の範囲は、その趣旨で記される場合を除き、提供される順序又は要素に限定されるものとして読まれるべきではない。加えて、任意の請求項での用語「~する手段」の使用は、米国特許法第112条(f)又はミーンズプラスファンクション請求項形式を引き合いに出すことが意図され、用語「~する手段」がないあらゆる請求項はそのように意図されない。
[0137] 本発明は特定の実施形態を参照して本明細書に示され説明されるが、本発明は示される細部に限定されることは意図されない。むしろ、特許請求の範囲の均等物の範囲及び幅内で、本発明から逸脱せずに種々の変更を細部に行い得る。
[0138] 本開示全体を通して、特定の代表的な実施形態が、代替の代表的な実施形態において又は他の代表的な実施形態と組み合わせて使用し得ることを当業者ならば理解する。
[0139] 特徴及び要素を特定の組合せで上述したが、各特徴又は要素が単独で又は他の特徴及び要素との任意の組合せで使用することができることを当業者ならば理解しよう。加えて、本明細書に記載の方法は、コンピュータ又はプロセッサにより実行されるコンピュータ可読媒体に組み込まれたコンピュータプログラム、ソフトウェア、又はファームウェアで実施し得る。非一時的コンピュータ可読記憶媒体の例には、読み取り専用メモリ(ROM)、ランダムアクセスメモリ(RAM)、レジスタ、キャッシュメモリ、半導体メモリデバイス、内部ハードディスク及びリムーバブルディスク等の磁気媒体、磁気光学媒体及びCD-ROMディスク等の光学媒体、並びにデジタル多用途ディスク(DVD)があるが、これらに限定されない。ソフトウェアと関連付けられたプロセッサは、WRTU、UE、端末、基地局、RNC、又は任意のホストコンピュータでの使用に向けて無線周波数送受信機を実施するのに使用し得る。
[0140] 更に、上述した実施形態では、処理プラットフォーム、計算システム、コントローラ、及びプロセッサを含む他のデバイスが記載されている。これらのデバイスは、少なくとも1つの中央演算処理装置(「CPU」)及びメモリを含み得る。コンピュータプログラミングの当業者によれば、動作、及び演算又は命令の象徴的表現への参照は、種々のCPU及びメモリにより実行し得る。そのような動作及び演算又は命令は、「実行される」、「コンピュータ実行される」、又は「CPU実行される」と参照し得る。
[0141] 動作、及び演算又は命令の象徴的表現が、CPUによる電気信号の操作を含むことを当業者なら理解しよう。電気システムは、電気信号の変換又は低減及びメモリシステムにおけるメモリロケーションにおけるデータビットの維持を生じさせることができ、それにより、CPUの演算、及び信号の他の処理を再構成又は他の方法で変更するデータビットを表す。データビットが維持されるメモリロケーションは、データビットに対応する又はデータビットを表す特定の電気、磁気、光学、又は有機特性を有する物理的ロケーションである。
[0142] データビットは、磁気ディスク、光ディスク、及びCPU可読の任意の他の揮発性(例えばランダムアクセスメモリ(「RAM」))又は不揮発性(例えば読み取り専用メモリ(「ROM」))大容量記憶システムを含むコンピュータ可読媒体で維持することもできる。コンピュータ可読媒体は、専ら処理システムに存在し、又は処理システムにローカル又はリモートであり得る複数の相互接続された処理システムに分散する協働又は相互接続されたコンピュータ可読媒体を含み得る。代表的な実施形態が上記メモリに限定されず、他のプラットフォーム及びメモリが記載の方法をサポートすることもできることが理解される。
[0143] 本願の説明で使用される要素、動作、又は命令は、明らかにそのように記載される場合を除き、本発明にとって極めて重要又は重要であるものとして解釈されるべきではない。加えて、冠詞「1つの(a)」は1つ又は複数の項目を包含することが意図される。1つのみの項目が意図される場合、用語「1つ」又は同様の文言が使用される。更に、複数の項目及び/又は項目の複数のカテゴリの列記が続く用語「の何れか」は、本明細書で使用される場合、個々に又は他の項目及び/又は項目の他のカテゴリと組み合わせて、項目及び/又は項目のカテゴリ「の何れか」、「の任意の組合せ」、「の任意の複数」、及び/又は「の複数の任意の組合せ」を含むことが意図される。更に、本明細書で使用される場合、用語「セット」は、ゼロを含む任意の数の項目を含むことが意図される。更に、本明細書で使用される場合、用語「数」はゼロを含む任意の数を含むことが意図される。
[0144] 更に、特許請求の範囲は、その趣旨で記される場合を除き、記載される順序又は要素に限定されるものとして読まれるべきではない。加えて、任意の請求項での用語「~する手段」の使用は、米国特許法第112条(f)を引き合いに出すことが意図され、用語「~する手段」がないあらゆる請求項はそのように意図されない。
[0145] 例として、適したプロセッサには、汎用プロセッサ、専用プロセッサ、従来のプロセッサ、デジタル信号プロセッサ(DSP)、複数のマイクロプロセッサ、DSPコアと関連した1つ又は複数のマイクロプロセッサ、コントローラ、マイクロコントローラ、特定用途向け集積回路(ASIC)、特定用途向け標準製品(ASSP)、フィールドプログラマブルゲートアレイ(FPGA)回路、任意の他のタイプの集積回路(IC)、及び/又は状態機械がある。
[0146] ソフトウェアと関連するプロセッサを使用して、無線送受信ユニット(WRTU)、ユーザ機器(UE)、端末、基地局、モビリティ管理エンティティ(MME)又は進化パケットコア(EPC)、又は任意のホストコンピュータで使用する無線周波数送受信機を実施し得る。WRTUは、ハードウェア及び/又はソフトウェア無線(SDR)を含むソフトウェアで実施されるモジュール、並びにカメラ、ビデオカメラモジュール、ビデオフォン、スピーカフォン、振動デバイス、スピーカ、マイクロホン、テレビジョン送受信機、ハンズフリーヘッドセット、キーボード、Bluetooth(登録商標)モジュール、周波数変調(FM)ラジオユニット、近距離通信(NFC)モジュール、液晶ディスプレイ(LCD)表示ユニット、有機発光ダイオード(OLED)表示ユニット、デジタル音楽プレーヤ、メディアプレーヤ、テレビゲームプレーヤモジュール、インターネットブラウザ、及び/又は任意の無線ローカルエリアネットワーク(WLAN)又は超広帯域(UWB)モジュール等の他の構成要素と併せて使用し得る。
[0147] 本発明を通信システムに関して説明したが、システムがマイクロプロセッサ/汎用コンピュータ(図示せず)上のソフトウェアで実施し得ることが意図される。特定の実施形態では、種々の構成要素の機能の1つ又は複数は、汎用コンピュータを制御するソフトウェアで実施し得る。
[0148] 加えて、本発明は特定の実施形態を参照して示され説明されたが、本発明は示される細部に限定されることは意図されない。むしろ、特許請求の範囲の均等物の範囲及び幅内で、本発明から逸脱せずに種々の変更を細部に行い得る。

Claims (20)

  1. HTTPを使用してネットワークを介して、ポイントクラウドに対応するポイントクラウドデータをストリーミングする、ネットワークノードにおいて実施される装置であって、前記ポイントクラウドデータは、前記ポイントクラウドを構成する複数のV-PCC(ビデオベースポイントクラウド圧縮)構成要素を含む前記ポイントクラウドに対応し、各構成要素は前記ポイントクラウドの少なくとも1つのバージョンを含み、前記装置は、
    DASH(HTTPの動的適応ストリーミング)MPD(メディア提示記述)において前記ポイントクラウドの前記ポイントクラウドデータをシグナリングするように構成されたプロセッサ
    を備え、
    前記DASH MPDは、
    前記ポイントクラウドのメインAdaptationSetであって、前記メインAdaptationSetは、少なくとも、(1)前記対応するAdaptationSetがV-PCCデータに対応することを示す一意の値に設定される@codecs属性と、(2)前記ポイントクラウドの表現の少なくとも1つのV-PCCシーケンスパラメータセットを含む初期化セグメントとを含む、メインAdaptationSetと、
    複数の構成要素AdaptationSetであって、各構成要素AdaptationSetは、前記V-PCC構成要素の1つに対応し、少なくとも、(1)前記対応するV-PCC構成要素のタイプを識別するVPCCComponent記述子と、(2)前記V-PCC構成要素の少なくとも1つのプロパティとを含む、複数の構成要素AdaptationSetと、
    を含み、
    前記プロセッサは、送信機に前記ネットワークを経由して前記DASHビットストリームを送信されるように更に構成される、装置。
  2. ISOベースメディアファイルフォーマット(ISOBMFF)がV-PCCコンテンツのメディアコンテナとして使用される場合、前記プロセッサは、前記ファイルフォーマットレベルにおけるV-PCCトラック及びそれらの間の関係を記述するメタデータ情報を提供する1つ又は複数のVPCCGroupBoxインスタンスを含むメタボックスを前記メインAdaptationSetの前記初期化セグメントに含むように更に構成される、請求項1に記載の装置。
  3. 前記プロセッサは、前記メインAdaptationSetの前記初期化セグメントに、適応レベルにおける1つの初期化セグメントを含むように更に構成され、前記プロセッサは、前記メインAdaptationSetの全ての表現のV-PCCシーケンスパラメータセットをそのメインAdaptationSetの前記初期化セグメントに含むように更に構成される、請求項1に記載の装置。
  4. 前記プロセッサは、前記メインAdaptationSetに、複数の表現のそれぞれの初期化セグメントを含むように更に構成され、表現に対応する各初期化セグメントは、その表現のV-PCCシーケンスパラメータセットを含む、請求項1に記載の装置。
  5. 前記プロセッサは、@videoCodec属性を含む前記VCCComponent記述子を更にシグナリングし、前記@videoCodec属性の値は、前記対応するポイントクラウド構成要素の符号化に使用されたコーデックを示す、請求項1に記載の装置。
  6. 前記プロセッサは、前記AdaptationSetに、役割記述子DASH要素を含むように更に構成され、前記役割記述子DASH要素の値は、前記対応する構成要素のジオメトリ、占有マップ、又は属性の1つとして前記対応するAdaptationSetの役割を示す、請求項1に記載の装置。
  7. 前記プロセッサは、前記VPCCComponent記述子に、前記構成要素のレイヤ及び/又は前記構成要素の属性タイプを識別する要素を含むように更に構成される、請求項1に記載の装置。
  8. 前記プロセッサは、前記メインAdaptationSetにVPCC記述子を含むように更に構成され、前記VPCC記述子は、前記メインAdaptationSetが対応する特定のポイントクラウド及び構成要素AdaptationSetの識別子を開示する、請求項1に記載の装置。
  9. 前記プロセッサは、前記ポイントクラウドの前記V-PCCデータが前記ポイントクラウドの2つ以上のバージョンを含む場合、前記バージョンに対応する1つの表現と、VPCC記述子とを含む別個のメインAdaptationSetで各バージョンをシグナリングするように更に構成され、同じポイントクラウドの異なるバージョンに対応する全てのメインAdaptationSetは、@pcId属性に同じ値を有する、請求項8に記載の装置。
  10. 前記プロセッサは、1つのメインAdaptationSetの異なる表現として所与のポイントクラウドの異なるバージョンをシグナリングするように更に構成され、VPCC記述子は各表現に存在し、@pcId属性は、(1)各表現に存在し、前記メインAdaptationSet内の全ての表現に同じ値を有してシグナリングされ、又は(2)省略される、請求項8に記載の装置。
  11. 前記プロセッサは、前記ポイントクラウドの前記メインAdaptationSetのIDの後に続く前記ポイントクラウド構成要素に対応する前記構成要素AdaptationSetのIDを含む@preselectionComponents属性の値を有するPreSelectionを前記MPDにおいてシグナリングするように更に構成される、請求項8に記載の装置。
  12. 前記プロセッサは、前記ポイントクラウドの前記メインAdaptationSetに、@associationId属性における前記構成要素AdaptationSet及び/又は表現の識別子のリストを含むように更に構成され、@associationType属性の値はV-PCCの4CCに設定される、請求項8に記載の装置。
  13. 前記プロセッサは、前記ポイントクラウドの前記メインAdaptationSetに、@dependencyId属性を使用する前記構成要素AdaptationSet及び/又は表現の識別子のリストを含むように更に構成される、請求項8に記載の装置。
  14. 前記プロセッサは、前記MPD内の前記ポイントクラウドのジオメトリメタデータ及び属性メタデータの少なくとも一方を含むように更に構成される、請求項1に記載の装置。
  15. 前記プロセッサは、@schemeIdUri属性に前記ジオメトリメタデータを含むように更に構成される、請求項14に記載の装置。
  16. 前記プロセッサは、@schemeIdUri属性に前記属性メタデータを含むように更に構成される、請求項14に記載の装置。
  17. ネットワークノードで実施される装置により実施される、HTTPを使用して前記ネットワークを介してポイントクラウドに対応するポイントクラウドデータをストリーミングする方法であって、前記ポイントクラウドデータは、前記ポイントクラウドを含む複数のV-PCC(ビデオベースポイントクラウド圧縮)構成要素を含む前記ポイントクラウドに対応し、各構成要素は前記ポイントクラウドの少なくとも1つのバージョンを含み、前記方法は、
    DASH(HTTPの動的適応ストリーミング)MPD(メディア提示記述)において前記ポイントクラウドの前記ポイントクラウドデータをシグナリングすることであって、前記DASH MPDは、前記ポイントクラウドのメインAdaptationSetであって、前記メインAdaptationSetは、少なくとも、(1)前記対応するAdaptationSetがV-PCCデータに対応することを示す一意の値に設定される@codecs属性及び(2)前記ポイントクラウドの表現の少なくとも1つのV-PCCシーケンスパラメータセットを含む初期化セグメントを含む、メインAdaptationSetと、複数の構成要素AdaptationSetであって、各構成要素AdaptationSetは、前記V-PCC構成要素の1つに対応し、少なくとも、(1)前記対応するV-PCC構成要素のタイプを識別するVPCCComponent記述子及び(2)前記V-PCC構成要素の少なくとも1つのプロパティを含む、複数の構成要素AdaptationSetとを含む、シグナリングすることと、
    前記ネットワークを経由して前記DASHビットストリームを送信することと、
    を含む方法。
  18. ISOベースメディアファイルフォーマット(ISOBMFF)が前記V-PCCコンテンツのメディアコンテナとして使用される場合、前記方法は、前記ファイルフォーマットレベルにおけるV-PCCトラック及びそれらの間の関係を記述するメタデータ情報を提供する1つ又は複数のVPCCGroupBoxインスタンスを含むメタボックスを前記メインAdaptationSetの前記初期化セグメントに含むことを更に含む、請求項17に記載の方法。
  19. 前記メインAdaptationSetの前記初期化セグメントに、適応レベルにおける1つの初期化セグメントを含み、前記メインAdaptationSetの全ての表現のV-PCCシーケンスパラメータセットをそのメインAdaptationSetの前記初期化セグメントに含むことを更に含む請求項17に記載の方法。
  20. 前記メインAdaptationSetに、複数の表現のそれぞれの初期化セグメントを含むことを更に含み、各初期化セグメントは、その表現のV-PCCシーケンスパラメータセットを含む表現に対応する、請求項17に記載の方法。
JP2021553345A 2019-03-08 2020-03-06 ポイントクラウドの適応ストリーミングの方法及び装置 Pending JP2022524130A (ja)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US201962815725P 2019-03-08 2019-03-08
US62/815,725 2019-03-08
US201962866043P 2019-06-25 2019-06-25
US62/866,043 2019-06-25
US201962908630P 2019-10-01 2019-10-01
US62/908,630 2019-10-01
PCT/US2020/021431 WO2020185578A1 (en) 2019-03-08 2020-03-06 Methods and apparatus for adaptive streaming of point clouds

Publications (2)

Publication Number Publication Date
JP2022524130A true JP2022524130A (ja) 2022-04-27
JPWO2020185578A5 JPWO2020185578A5 (ja) 2023-03-14

Family

ID=70190104

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021553345A Pending JP2022524130A (ja) 2019-03-08 2020-03-06 ポイントクラウドの適応ストリーミングの方法及び装置

Country Status (7)

Country Link
US (1) US20220166814A1 (ja)
EP (1) EP3935857A1 (ja)
JP (1) JP2022524130A (ja)
KR (1) KR20210146897A (ja)
CN (2) CN113557741B (ja)
BR (1) BR112021017800A2 (ja)
WO (1) WO2020185578A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7407951B2 (ja) 2020-01-08 2024-01-04 中興通訊股▲ふん▼有限公司 点群データ処理

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021206365A1 (ko) * 2020-04-11 2021-10-14 엘지전자 주식회사 포인트 클라우드 데이터 송신 장치, 포인트 클라우드 데이터 송신 방법, 포인트 클라우드 데이터 수신 장치 및 포인트 클라우드 데이터 수신 방법
CN114554243B (zh) * 2020-11-26 2023-06-20 腾讯科技(深圳)有限公司 点云媒体的数据处理方法、装置、设备及存储介质
EP4372420A1 (en) * 2021-07-15 2024-05-22 LG Electronics Inc. Point cloud data transmission method, point cloud data transmission device, point cloud data reception method, and point cloud data reception device
WO2023081820A1 (en) * 2021-11-05 2023-05-11 Bytedance Inc. Method, apparatus, and medium for media processing
KR102510454B1 (ko) * 2022-09-02 2023-03-16 주식회사 솔디아 전송량을 저감시킨 동영상 전송 시스템
CN115474047A (zh) * 2022-09-13 2022-12-13 福州大学 一种基于增强映射图相关性LiDAR点云编码方法及解码方法

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2003239385A1 (en) * 2002-05-10 2003-11-11 Richard R. Reisman Method and apparatus for browsing using multiple coordinated device
US8918533B2 (en) * 2010-07-13 2014-12-23 Qualcomm Incorporated Video switching for streaming video data
US9125073B2 (en) * 2012-08-03 2015-09-01 Intel Corporation Quality-aware adaptive streaming over hypertext transfer protocol using quality attributes in manifest file
DE102013211571B4 (de) * 2013-06-19 2016-02-11 Opticom Dipl.-Ing. Michael Keyhl Gmbh Konzept zur bestimmung der qualität eines mediadatenstroms mit variierender qualität-zu-bitrate
KR102064792B1 (ko) * 2013-12-17 2020-01-10 한국전자통신연구원 Http 기반의 멀티미디어 스트리밍 서비스를 위한 네트워크 대역폭 적응적 콘텐츠 생성 방법 및 시스템
US9866608B2 (en) * 2014-03-24 2018-01-09 Qualcomm Incorporated Processing continuous multi-period content
WO2015172227A1 (en) * 2014-05-13 2015-11-19 Pcp Vr Inc. Method, system and apparatus for generation and playback of virtual reality multimedia
EP3399757A1 (en) * 2017-05-04 2018-11-07 Thomson Licensing Method and apparatus to encode and decode two-dimension point clouds
CN108833927B (zh) * 2018-05-03 2019-08-16 北京大学深圳研究生院 一种基于删除量化矩阵中0元素的点云属性压缩方法
US20200202608A1 (en) * 2018-12-21 2020-06-25 Point Cloud Compression, B.V. Method and apparatus for receiving a volumetric video stream
JP7407951B2 (ja) * 2020-01-08 2024-01-04 中興通訊股▲ふん▼有限公司 点群データ処理

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7407951B2 (ja) 2020-01-08 2024-01-04 中興通訊股▲ふん▼有限公司 点群データ処理

Also Published As

Publication number Publication date
EP3935857A1 (en) 2022-01-12
CN113557741A (zh) 2021-10-26
CN113557741B (zh) 2023-12-08
CN117834914A (zh) 2024-04-05
BR112021017800A2 (pt) 2021-11-23
WO2020185578A1 (en) 2020-09-17
US20220166814A1 (en) 2022-05-26
KR20210146897A (ko) 2021-12-06

Similar Documents

Publication Publication Date Title
CN113557741B (zh) 用于点云的自适应流式传输的方法和装置
US9826254B2 (en) Method for entropy-encoding slice segment and apparatus therefor, and method for entropy-decoding slice segment and apparatus therefor
JP6545722B2 (ja) パラメータセットにおいて異なる数のビデオ信号情報シンタックス構造を選択的にシグナリングするためのシステムおよび方法
TWI633780B (zh) 高效率視訊寫碼擴展中之目標輸出層之選擇
JP5778339B2 (ja) ビデオコーディングにおける内部ビット深度増加
US11438600B2 (en) Immersive media metrics for virtual reality content with multiple viewpoints
US9877020B2 (en) Method for encoding inter-layer video for compensating luminance difference and device therefor, and method for decoding video and device therefor
JP2020526958A (ja) コンテナファイルおよびビデオビットストリームにおける関心領域の発展型シグナリング
KR101870546B1 (ko) 서브-레이어 참조 예측 종속성에 기초한 인터-레이어 rps 도출을 위한 시스템들 및 방법들
JP2021521720A (ja) 簡略化された最確モードリスト生成スキーム
US20190141350A1 (en) System and method for non-uniform video coding
US20160037177A1 (en) Interlayer video encoding method and apparatus and interlayer video decoding method and apparatus for compensating luminance difference
JP2022518894A (ja) 点群符号化のためのパラメータセット設計の方法並びにその装置及びプログラム
WO2019189340A1 (ja) 符号化装置、復号装置、符号化方法、および復号方法
TW202046733A (zh) 點雲適性資料串流方法及裝置
JP7371984B2 (ja) ビデオ符号化の方法、装置およびコンピュータプログラム
RU2795052C2 (ru) Способы и устройство для адаптивной потоковой передачи облаков точек
EP4270968A1 (en) Media file generation/reception method and device for signaling subpicture id information, and computer-readable recording medium in which media file is stored
US20240056578A1 (en) Media file generation/reception method and apparatus supporting random access in units of samples, and method for transmitting media file
Smith Receiver-Driven Video Adaptation
JP2024513512A (ja) Eosサンプルグループに基づくメディアファイル生成/受信方法及び装置、並びにメディアファイル伝送方法
KR20230124964A (ko) 레이어 정보를 포함하는 미디어 파일 생성/수신 방법,장치 및 미디어 파일 전송 방법
AU2024201923A1 (en) Slice and tile configuration for image/video coding
Arora et al. A Review on Different Video Coding Standards
WO2023229817A1 (en) Systems and methods for combining subblock motion compensation and overlapped block motion compensation

Legal Events

Date Code Title Description
RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20211101

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20211112

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230303

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230303

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20240123

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20240130

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240426