JP2024502822A - ビジュアルボリュメトリックビデオベース(v3c)及びジオメトリベース点群(g-pcc)メディアのストリーミングのためのmmtシグナリング - Google Patents
ビジュアルボリュメトリックビデオベース(v3c)及びジオメトリベース点群(g-pcc)メディアのストリーミングのためのmmtシグナリング Download PDFInfo
- Publication number
- JP2024502822A JP2024502822A JP2023540501A JP2023540501A JP2024502822A JP 2024502822 A JP2024502822 A JP 2024502822A JP 2023540501 A JP2023540501 A JP 2023540501A JP 2023540501 A JP2023540501 A JP 2023540501A JP 2024502822 A JP2024502822 A JP 2024502822A
- Authority
- JP
- Japan
- Prior art keywords
- media
- asset
- message
- receiving device
- pcc
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000000007 visual effect Effects 0.000 title claims abstract description 12
- 230000011664 signaling Effects 0.000 title description 43
- 238000000034 method Methods 0.000 claims abstract description 71
- 238000012545 processing Methods 0.000 claims abstract description 41
- VKALYYFVKBXHTF-UHFFFAOYSA-N 4-(methylsulfanyl)-m-cresol Chemical compound CSC1=CC=C(O)C=C1C VKALYYFVKBXHTF-UHFFFAOYSA-N 0.000 claims abstract 10
- 238000004891 communication Methods 0.000 claims description 68
- 230000008569 process Effects 0.000 claims description 26
- 230000006835 compression Effects 0.000 claims description 23
- 238000007906 compression Methods 0.000 claims description 23
- 238000010586 diagram Methods 0.000 abstract description 21
- 230000015654 memory Effects 0.000 description 38
- 238000005516 engineering process Methods 0.000 description 25
- 230000006870 function Effects 0.000 description 19
- 238000005538 encapsulation Methods 0.000 description 17
- 230000005540 biological transmission Effects 0.000 description 13
- 230000008859 change Effects 0.000 description 13
- 238000007726 management method Methods 0.000 description 10
- 238000012360 testing method Methods 0.000 description 10
- 230000001419 dependent effect Effects 0.000 description 9
- 230000002093 peripheral effect Effects 0.000 description 8
- 238000001228 spectrum Methods 0.000 description 8
- 230000003068 static effect Effects 0.000 description 8
- 239000002609 medium Substances 0.000 description 6
- 230000036961 partial effect Effects 0.000 description 6
- 238000009877 rendering Methods 0.000 description 6
- 238000013139 quantization Methods 0.000 description 5
- 239000013598 vector Substances 0.000 description 5
- 102100031545 Microsomal triglyceride transfer protein large subunit Human genes 0.000 description 4
- 238000013459 approach Methods 0.000 description 4
- 230000006399 behavior Effects 0.000 description 4
- 239000000969 carrier Substances 0.000 description 4
- 230000000670 limiting effect Effects 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 230000003044 adaptive effect Effects 0.000 description 3
- 230000002776 aggregation Effects 0.000 description 3
- 238000004220 aggregation Methods 0.000 description 3
- 230000001413 cellular effect Effects 0.000 description 3
- 238000013499 data model Methods 0.000 description 3
- 239000012634 fragment Substances 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- AWSBQWZZLBPUQH-UHFFFAOYSA-N mdat Chemical group C1=C2CC(N)CCC2=CC2=C1OCO2 AWSBQWZZLBPUQH-UHFFFAOYSA-N 0.000 description 3
- 230000002441 reversible effect Effects 0.000 description 3
- 101000588130 Homo sapiens Microsomal triglyceride transfer protein large subunit Proteins 0.000 description 2
- 101100172132 Mus musculus Eif3a gene Proteins 0.000 description 2
- 238000004873 anchoring Methods 0.000 description 2
- 239000000872 buffer Substances 0.000 description 2
- 238000012508 change request Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000007667 floating Methods 0.000 description 2
- 238000013467 fragmentation Methods 0.000 description 2
- 238000006062 fragmentation reaction Methods 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 229910001416 lithium ion Inorganic materials 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 239000003550 marker Substances 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 230000005055 memory storage Effects 0.000 description 2
- QELJHCBNGDEXLD-UHFFFAOYSA-N nickel zinc Chemical compound [Ni].[Zn] QELJHCBNGDEXLD-UHFFFAOYSA-N 0.000 description 2
- 230000002829 reductive effect Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000007727 signaling mechanism Effects 0.000 description 2
- 230000003936 working memory Effects 0.000 description 2
- 208000037540 Alveolar soft tissue sarcoma Diseases 0.000 description 1
- 241000760358 Enodes Species 0.000 description 1
- 230000005355 Hall effect Effects 0.000 description 1
- HBBGRARXTFLTSG-UHFFFAOYSA-N Lithium ion Chemical compound [Li+] HBBGRARXTFLTSG-UHFFFAOYSA-N 0.000 description 1
- 241000700159 Rattus Species 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 239000012572 advanced medium Substances 0.000 description 1
- 208000008524 alveolar soft part sarcoma Diseases 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000003139 buffering effect Effects 0.000 description 1
- OJIJEKBXJYRIBZ-UHFFFAOYSA-N cadmium nickel Chemical compound [Ni].[Cd] OJIJEKBXJYRIBZ-UHFFFAOYSA-N 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 239000000446 fuel Substances 0.000 description 1
- 239000012464 large buffer Substances 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 230000001404 mediated effect Effects 0.000 description 1
- 229910052987 metal hydride Inorganic materials 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 229910052759 nickel Inorganic materials 0.000 description 1
- PXHVJJICTQNCMI-UHFFFAOYSA-N nickel Substances [Ni] PXHVJJICTQNCMI-UHFFFAOYSA-N 0.000 description 1
- -1 nickel metal hydride Chemical class 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000004806 packaging method and process Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 238000001356 surgical procedure Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000000411 transmission spectrum Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/236—Assembling of a multiplex stream, e.g. transport stream, by combining a video stream with other content or additional data, e.g. inserting a URL [Uniform Resource Locator] into a video stream, multiplexing software data into a video stream; Remultiplexing of multiplex streams; Insertion of stuffing bits into the multiplex stream, e.g. to obtain a constant bit-rate; Assembling of a packetised elementary stream
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/236—Assembling of a multiplex stream, e.g. transport stream, by combining a video stream with other content or additional data, e.g. inserting a URL [Uniform Resource Locator] into a video stream, multiplexing software data into a video stream; Remultiplexing of multiplex streams; Insertion of stuffing bits into the multiplex stream, e.g. to obtain a constant bit-rate; Assembling of a packetised elementary stream
- H04N21/23614—Multiplexing of additional data and video streams
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/81—Monomedia components thereof
- H04N21/816—Monomedia components thereof involving special video data, e.g 3D video
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/597—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/21—Server components or server architectures
- H04N21/218—Source of audio or video content, e.g. local disk arrays
- H04N21/21805—Source of audio or video content, e.g. local disk arrays enabling multiple viewpoints, e.g. using a plurality of cameras
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/236—Assembling of a multiplex stream, e.g. transport stream, by combining a video stream with other content or additional data, e.g. inserting a URL [Uniform Resource Locator] into a video stream, multiplexing software data into a video stream; Remultiplexing of multiplex streams; Insertion of stuffing bits into the multiplex stream, e.g. to obtain a constant bit-rate; Assembling of a packetised elementary stream
- H04N21/23605—Creation or processing of packetized elementary streams [PES]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/41—Structure of client; Structure of client peripherals
- H04N21/414—Specialised client platforms, e.g. receiver in car or embedded in a mobile appliance
- H04N21/41407—Specialised client platforms, e.g. receiver in car or embedded in a mobile appliance embedded in a portable device, e.g. video client on a mobile phone, PDA, laptop
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/81—Monomedia components thereof
- H04N21/8146—Monomedia components thereof involving graphical data, e.g. 3D object, 2D graphics
-
- A—HUMAN NECESSITIES
- A63—SPORTS; GAMES; AMUSEMENTS
- A63F—CARD, BOARD, OR ROULETTE GAMES; INDOOR GAMES USING SMALL MOVING PLAYING BODIES; VIDEO GAMES; GAMES NOT OTHERWISE PROVIDED FOR
- A63F2300/00—Features of games using an electronically generated display having two or more dimensions, e.g. on a television screen, showing representations related to the game
- A63F2300/80—Features of games using an electronically generated display having two or more dimensions, e.g. on a television screen, showing representations related to the game specially adapted for executing a specific type of game
- A63F2300/8082—Virtual reality
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T9/00—Image coding
- G06T9/001—Model-based coding, e.g. wire frame
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Computer Graphics (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Mobile Radio Communication Systems (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Abstract
ビジュアルボリュメトリックビデオベースコーディング(V3C)メディア及びジオメトリベース点群コーディング(G-PCC)メディアのストリーミングのための方法、システム、及び装置が本明細書で説明される。受信デバイスにおいて実施される方法は、送信デバイスからストリーミングされるために利用可能なメディアアセットのリストを含む第1のメッセージ、又はメディアアセットをそれぞれ記述する1つ以上のメッセージのうちの1つ以上を受信することを含んでもよい。本方法は、送信デバイスからストリーミングされるべきメディアアセットのサブセットに対する要求を示す第2のメッセージを送信することを更に含んでもよい。メディアアセットの要求されたサブセットは、受信デバイスのビューポートに基づいて決定されてよい。本方法は、モーションピクチャエキスパートグループ(Motion Picture Experts Group)(MPEG)メディアトランスポートプロトコル(Media Transport Protocol)(MMTP)パケットを受信することと、メディアアセットの要求されたサブセットの少なくとも一部分を復元するためにパケットを処理することとを更に含んでよい。【選択図】図17
Description
(関連出願の相互参照)
本出願は、2021年1月5日に出願された米国仮出願第63/134,038号及び2021年1月5日に出願された米国仮出願第63/134,143号の利益を主張し、これらの内容は参照により本明細書に組み込まれる。
本出願は、2021年1月5日に出願された米国仮出願第63/134,038号及び2021年1月5日に出願された米国仮出願第63/134,143号の利益を主張し、これらの内容は参照により本明細書に組み込まれる。
現実又は仮想の3Dシーンが複数の現実又は仮想カメラによってキャプチャされる没入ビデオコンテンツなどの、高品質の3次元(3D)点群及び他の視覚的なボリュメトリックメディアが没入型メディアの高度な表現として最近登場した。
3D点をキャプチャしてレンダリングする技術の最近の進歩は、テレプレゼンス、仮想現実、及び大規模な動的3Dマップの分野における新規な用途を可能にし得る。ISO/IEC JTC1/SC29/WG11 Moving Picture Experts Group(MPEG)の3Dグラフィックスサブグループは現在、2つの3D点群圧縮(point cloud compression、PCC)規格である、静的点群のためのジオメトリベースの圧縮規格及び動的点群のためのビデオベースの圧縮規格の開発に取り組んでいる。これらの規格の目標は、3D点群の、効率的で相互運用可能な記憶及び送信をサポートすることであり得る。これらの規格の要件の1つは、点群ジオメトリ座標及び属性の、非可逆コーディング及び/又は可逆コーディングをサポートすることであり得る。MPEG-I Visualは、境界付けられたボリューム内の正しい運動視差を有する6DoF仮想ウォークスルーをサポートするための没入ビデオコンテンツの圧縮のための規格の開発に取り組んでいる別のMPEGサブグループである。制限された6自由度(6DoF)を有するビデオベースの点群圧縮と没入ビデオの両方が、ビデオコード化されたコンポーネントに依存し得るので、これら2つのタイプの没入メディアのこれらのコーディングは、集合的に、視覚的なボリュメトリックビデオベースのコーディング(V3C)と称されてよく、それらのコード化された情報を表すために同じビットストリームフォーマットが使用されてよい。
ビジュアルボリュメトリックビデオベースコーディング(V3C)メディア及びジオメトリベース点群コーディング(G-PCC)メディアのストリーミングのための方法、システム、及び装置が本明細書で説明される。受信デバイスにおいて実施される方法は、送信デバイスからストリーミングされるために利用可能なメディアアセットのリストを含む第1のメッセージ、又はメディアアセットをそれぞれ記述する1つ以上のメッセージのうちの1つ以上を受信することを含んでもよい。本方法は、送信デバイスからストリーミングされるべきメディアアセットのサブセットに対する要求を示す第2のメッセージを送信することを更に含んでもよい。メディアアセットの要求されたサブセットは、受信デバイスのビューポートに基づいて決定されてよい。本方法は、モーションピクチャエキスパートグループ(Motion Picture Experts Group)(MPEG)メディアトランスポートプロトコル(Media Transport Protocol)(MMTP)パケットを受信することと、メディアアセットの要求されたサブセットの少なくとも一部分を復元するためにパケットを処理することとを更に含んでよい。
より詳細な理解は、添付の図面と併せて例として与えられる以下の説明から得られ得、図中の同様の参照番号は、同様の要素を示す。
1つ以上の開示された実施形態が実装され得る、例示的な通信システムを示すシステム図である。
一実施形態による、図1Aに示される通信システム内で使用され得る、例示的な無線送信/受信ユニット(WTRU)を示すシステム図である。
一実施形態による、図1Aに示される通信システム内で使用され得る、例示的な無線アクセスネットワーク(radio access network、RAN)及び例示的なコアネットワーク(core network、CN)を示すシステム図である。
一実施形態による、図1Aに示される通信システム内で使用され得る、更なる例示的なRAN及び更なる例示的なCNを示すシステム図である。
ビデオエンコーダの一例を例示する図である。
ビデオエンコーダの一例を例示する図である。
本明細書に記載の様々な態様及び実施形態が実装され得る例示的なシステムの実施例を例示する図である。
サーバとクライアントとの間の例示的なシステムインターフェースを示す図である。
サーバとクライアントとの間の別の例示的なシステムインターフェースを示す図である。
例示的なV3Cビットストリームの構造を示す図である。
サポートされるV3C属性タイプの例を例示する表である。
ISOBMFF規格に従って実装され得るV3Cコンテナの例示的な構造を示す図である。
2つ以上のアトラス及び複数のアトラスタイルを有する例示的なマルチトラックコンテナを示す図である。
ビットストリームの構造の一例を例示する図である。
G-PCC TLVカプセル化ユニットの例示的なシンタックス構造を提供する表である。
TLVタイプパラメータの可能な値及び対応する記述を提供する表である。
G-PCC TLVユニットペイロードの例示的なシンタックス構造を提供する表である。
G-PCCジオメトリ情報及び属性情報を提供するビットストリームが単一のトラックに記憶される方式による例示的なサンプル構造を例示する図である。
マルチトラックISOBMFF G-PCCコンテナの例示的な構造を示す図である。
MMTシグナリングが実行されるシステムの例示的なエンドツーエンドアーキテクチャを描く図である。
いくつかの実施形態によるパッケージ構造の例示の図である。
定義されたアプリケーションメッセージタイプのリストを提供する表である。
V3Cアセット記述子の例示的なシンタックス構造を提供する表である。
V3CAssetGroupMessageの例示的なシンタックスを例示する表である。
Data_typeフィールドにおいて使用され得るような例示的なV3Cデータタイプ値を例示する表である。
V3CSelectionMessageの例示的なシンタックスを示す表である。
switching_modeフィールドの定義を提供する表である。
V3CViewChangeFeedbackMessageの例示的なシンタックスを例示する表である。
G-PCCアセット記述子の例示的なシンタックス構造を提供する表である。
定義されたG-PCCアプリケーションメッセージタイプの例を例示する表である。
グループメッセージの例示的なシンタックスを例示する表である。
Data_typeフィールドにおいて使用され得るような例示的なG-PCCデータタイプ値を例示する表である。
GPCC選択フィードバックメッセージの例示的なシンタックスを例示する表である。
switching_modeフィールドの定義を提供する表である。
G-PCCビュー変更フィードバックメッセージ(例えば、「GPCCViewChangeFeedback」)の例示的なシンタックスを例示する表である。
図1Aは、1つ以上の開示された実施形態が実装され得る、例示的な通信システム100を示す図である。通信システム100は、音声、データ、ビデオ、メッセージ伝達、ブロードキャストなどのコンテンツを、複数の無線ユーザに提供する、多重アクセスシステムであり得る。通信システム100は、複数の無線ユーザが、無線帯域幅を含むシステムリソースの共有を通じて、上記のようなコンテンツにアクセスすることを可能にし得る。例えば、通信システム100は、符号分割多重アクセス(code division multiple access、CDMA)、時分割多重アクセス(time division multiple access、TDMA)、周波数分割多重アクセス(frequency division multiple、FDMA)、直交FDMA(orthogonal FDMA、OFDMA)、シングルキャリアFDMA(single-carrier FDMA、SC-FDMA)、ゼロテールユニークワード離散フーリエ変換拡散OFDM(zero-tail unique-word discrete Fourier transform Spread OFDM、ZT-UW-DFT-S-OFDM)、ユニークワードOFDM(unique word OFDM、UW-OFDM)、リソースブロックフィルタ型OFDM、フィルタバンクマルチキャリア(filter bank multicarrier、FBMC)などの1つ以上のチャネルアクセス方法を用い得る。
図1Aに示すように、通信システム100は、無線送信/受信ユニット(WTRU)102a、102b、102c、102d、無線アクセスネットワーク(RAN)104、コアネットワーク(CN)106、公衆交換電話ネットワーク(public switched telephone network、PSTN)108、インターネット110、及び他のネットワーク112を含み得るが、開示された実施形態は、任意の数のWTRU、基地局、ネットワーク、及び/又はネットワーク要素を企図することが理解されるであろう。WTRU102a、102b、102c、102dの各々は、無線環境において動作し、かつ/又は通信するように構成された、任意のタイプのデバイスであり得る。例として、いずれもステーション(station、STA)と称され得るWTRU102a、102b、102c、102dは、無線信号を送信及び/又は受信するように構成され得、ユーザ機器(user equipment、UE)、モバイルステーション、固定又はモバイル加入者ユニット、加入ベースのユニット、ポケットベル、携帯電話、携帯情報端末(personal digital assistant、PDA)、スマートフォン、ラップトップ、ネットブック、パーソナルコンピュータ、無線センサ、ホットスポット又はMi-Fiデバイス、モノのインターネット(Internet of Things、IoT)デバイス、時計又は他のウェアラブル、ヘッドマウントディスプレイ(head-mounted display、HMD)、車両、ドローン、医療デバイス及び用途(例えば、遠隔手術)、産業デバイス及び用途(例えば、産業及び/又は自動処理チェーンコンテキストで動作するロボット及び/又は他の無線デバイス)、消費者電子デバイス、商業及び/又は産業無線ネットワークで動作するデバイスなどを含み得る。WTRU102a、102b、102c、及び102dのいずれも、互換的にUEと称され得る。
通信システム100はまた、基地局114a及び/又は基地局114bを含み得る。基地局114a、114bの各々は、CN106、インターネット110、及び/又は他のネットワーク112などの1つ以上の通信ネットワークへのアクセスを容易にするために、WTRU102a、102b、102c、102dのうちの少なくとも1つと無線でインターフェース接続するように構成された任意のタイプのデバイスであり得る。例として、基地局114a、114bは、基地トランシーバ局(base transceiver station、BTS)、ノードB、eノードB(eNode B、eNB)、ホームノードB、ホームeノードB、gノードB(gNB)などの次世代ノードB、新無線(NR)ノードB、サイトコントローラ、アクセスポイント(access point、AP)、無線ルータなどであり得る。基地局114a、114bは各々単一の要素として示されているが、基地局114a、114bは、任意の数の相互接続された基地局及び/又はネットワーク要素を含み得ることが理解されるであろう。
基地局114aは、RAN104の一部であり得、これはまた、基地局コントローラ(base station controller、BSC)、無線ネットワークコントローラ(radio network controller、RNC)、リレーノードなどの他の基地局、及び/又はネットワーク要素(図示せず)を含み得る。基地局114a及び/又は基地局114bは、セル(図示せず)と称され得る1つ以上のキャリア周波数で無線信号を送信及び/又は受信するように構成され得る。これらの周波数は、認可スペクトル、未認可スペクトル、又は認可及び未認可スペクトルの組み合わせであり得る。セルは、相対的に固定され得るか又は経時的に変化し得る特定の地理的エリアに、無線サービスのカバレッジを提供し得る。セルは、更にセルセクタに分けられ得る。例えば、基地局114aと関連付けられたセルは、3つのセクタに分けられ得る。したがって、一実施形態では、基地局114aは、3つのトランシーバを、すなわち、セルのセクタごとに1つのトランシーバを含み得る。一実施形態では、基地局114aは、多重入力多重出力(multiple-input multiple output、MIMO)技術を用い得、セルのセクタごとに複数のトランシーバを利用し得る。例えば、ビームフォーミングを使用して、所望の空間方向に信号を送信及び/又は受信し得る。
基地局114a、114bは、エアインターフェース116を介して、WTRU102a、102b、102c、102dのうちの1つ以上と通信し得るが、このエアインターフェース116は、任意の好適な無線通信リンク(例えば、無線周波数(radio frequency、RF)、マイクロ波、センチメートル波、マイクロメートル波、赤外線(infrared、IR)、紫外線(ultraviolet、UV)、可視光など)であり得る。エアインターフェース116は、任意の好適な無線アクセス技術(radio access technology、RAT)を使用して確立され得る。
より具体的には、上記のように、通信システム100は、多重アクセスシステムであり得、例えば、CDMA、TDMA、FDMA、OFDMA、SC-FDMAなどの、1つ以上のチャネルアクセススキームを用い得る。例えば、RAN104及びWTRU102a、102b、102cの基地局114aは、広帯域CDMA(wideband CDMA、WCDMA)を使用してエアインターフェース116を確立し得る、ユニバーサル移動体通信システム(Universal Mobile Telecommunications System、UMTS)地上無線アクセス(Terrestrial Radio Access、UTRA)などの無線技術を実装し得る。WCDMAは、高速パケットアクセス(High-Speed Packet Access、HSPA)及び/又は進化型HSPA(HSPA+)などの通信プロトコルを含み得る。HSPAは、高速ダウンリンク(Downlink、DL)パケットアクセス(High-Speed Downlink Packet Access、HSDPA)及び/又は高速アップリンク(Uplink、UL)パケットアクセス(High-Speed Uplink Packet Access、HSUPA)を含み得る。
一実施形態では、基地局114a及びWTRU102a、102b、102cは、進化型UMTS地上無線アクセス(Evolved UMTS Terrestrial Radio Access、E-UTRA)などの無線技術を実装し得、これは、ロングタームエボリューション(Long Term Evolution、LTE)及び/又はLTE-Advanced(LTE-Advanced、LTE-A)及び/又はLTE-Advanced Pro(LTE-A Pro)を使用してエアインターフェース116を確立し得る。
一実施形態では、基地局114a及びWTRU102a、102b、102cは、NR無線アクセスなどの無線技術を実装し得、これは、NRを使用してエアインターフェース116を確立し得る。
一実施形態では、基地局114a及びWTRU102a、102b、102cは、複数の無線アクセス技術を実装し得る。例えば、基地局114a及びWTRU102a、102b、102cは、例えば、デュアルコネクティビティ(dual connectivity、DC)原理を使用して、LTE無線アクセス及びNR無線アクセスを一緒に実装し得る。したがって、WTRU102a、102b、102cによって利用されるエアインターフェースは、複数のタイプの基地局(例えば、eNB及びgNB)に/から送信される複数のタイプの無線アクセス技術及び/又は送信によって特徴付けられ得る。
他の実施形態では、基地局114a及びWTRU102a、102b、102cは、IEEE802.11(すなわち、無線フィデリティ(Wireless Fidelity、WiFi)、IEEE802.16(すなわち、ワイマックス(Worldwide Interoperability for Microwave Access、WiMAX)、CDMA2000、CDMA2000 1X、CDMA2000 EV-DO、暫定規格2000(IS-2000)、暫定規格95(IS-95)、暫定規格856(IS-856)、汎欧州デジタル移動電話方式(Global System for Mobile communications、GSM)、GSM進化型高速データレート(Enhanced Data rates for GSM Evolution、EDGE)、GSM EDGE(GERAN)などの無線技術を実装し得る。
図1Aの基地局114bは、例えば、無線ルータ、ホームノードB、ホームeノードB又はアクセスポイントであり得、事業所、家庭、車両、キャンパス、工業施設、(例えば、ドローンによる使用のための)空中回廊、道路などの場所などの局所的エリアにおける無線接続を容易にするために、任意の好適なRATを利用し得る。一実施形態では、基地局114b及びWTRU102c、102dは、IEEE802.11などの無線技術を実装して、無線ローカルエリアネットワーク(wireless local area network、WLAN)を確立し得る。一実施形態では、基地局114b及びWTRU102c、102dは、IEEE802.15などの無線技術を実装して、無線パーソナルエリアネットワーク(wireless personal area network、WPAN)を確立し得る。更に別の一実施形態では、基地局114b及びWTRU102c、102dは、セルラベースのRAT(例えば、WCDMA、CDMA2000、GSM、LTE、LTE-A、LTE-A Pro、NRなど)を利用して、ピコセル又はフェムトセルを確立し得る。図1Aに示すように、基地局114bは、インターネット110への直接接続を有し得る。したがって、基地局114bは、CN106を介してインターネット110にアクセスする必要がない場合がある。
RAN104は、WTRU102a、102b、102c、102dのうちの1つ以上に、音声、データ、アプリケーション、及び/又はボイスオーバインターネットプロトコル(voice over internet protocol、VoIP)サービスを提供するように構成された任意のタイプのネットワークであり得る、CN106と通信し得る。データは、例えば、異なるスループット要件、待ち時間要件、エラー許容要件、信頼性要件、データスループット要件、モビリティ要件などの、様々なサービス品質(quality of service、QoS)要件を有し得る。CN106は、通話制御、ビリングサービス、モバイルロケーションベースのサービス、プリペイド通話、インターネット接続性、映像配信などを提供し、かつ/又はユーザ認証などの高レベルセキュリティ機能を行い得る。図1Aには示されていないが、RAN104及び/又はCN106は、RAN104と同じRAT又は異なるRATを用いる他のRANと直接又は間接的に通信し得ることが理解されよう。例えば、NR無線技術を利用し得るRAN104に接続されることに加えて、CN106はまた、GSM、UMTS、CDMA2000、WiMAX、E-UTRA又はWiFi無線技術を用いて別のRAN(図示せず)と通信し得る。
CN106はまた、PSTN108、インターネット110、及び/又は他のネットワーク112にアクセスするために、WTRU102a、102b、102c、102dのゲートウェイとして機能し得る。PSTN108は、基本電話サービス(plain old telephone service、POTS)を提供する公衆交換電話網を含み得る。インターネット110は、相互接続されたコンピュータネットワーク及びデバイスのグローバルシステムを含み得るが、これらのネットワーク及びデバイスは、送信制御プロトコル(transmission control protocol、TCP)、ユーザデータグラムプロトコル(user datagram protocol、UDP)、及び/又はTCP/IPインターネットプロトコルスイートのインターネットプロトコル(internet protocol、IP)などの、共通通信プロトコルを使用する。ネットワーク112は、他のサービスプロバイダによって所有及び/又は運営される、有線及び/又は無線通信ネットワークを含み得る。例えば、ネットワーク112は、RAN104と同じRAT又は異なるRATを用い得る1つ以上のRANに接続された別のCNを含み得る。
通信システム100におけるWTRU102a、102b、102c、102dのいくつか又は全ては、マルチモード能力を含み得る(例えば、WTRU102a、102b、102c、102dは、異なる無線リンクを介して異なる無線ネットワークと通信するための複数のトランシーバを含み得る)。例えば、図1Aに示されるWTRU102cは、セルラベースの無線技術を用い得る基地局114a、及びIEEE802無線技術を用い得る基地局114bと通信するように構成され得る。
図1Bは、例示的なWTRU102を示すシステム図である。図1Bに示すように、WTRU102は、とりわけ、プロセッサ118、トランシーバ120、送信/受信要素122、スピーカ/マイクロフォン124、キーパッド126、ディスプレイ/タッチパッド128、非リムーバブルメモリ130、リムーバブルメモリ132、電源134、全地球測位システム(global positioning system、GPS)チップセット136、及び/又は他の周辺機器138を含み得る。WTRU102は、一実施形態との一貫性を有したまま、前述の要素の任意の部分的組み合わせを含み得ることが理解されよう。
プロセッサ118は、汎用プロセッサ、専用プロセッサ、従来のプロセッサ、デジタル信号プロセッサ(digital signal processor、DSP)、複数のマイクロプロセッサ、DSPコアに関連付けられた1つ以上のマイクロプロセッサ、コントローラ、マイクロコントローラ、特定用途向け集積回路(Application Specific Integrated Circuit、ASIC)、フィールドプログラマブルゲートアレイ(Field Programmable Gate Array、FPGA)、任意の他のタイプの集積回路(integrated circuit、IC)、状態機械などであり得る。プロセッサ118は、信号コーディング、データ処理、電力制御、入力/出力処理、及び/又はWTRU102が無線環境で動作することを可能にする任意の他の機能性を実行し得る。プロセッサ118は、送信/受信要素122に結合され得るトランシーバ120に結合され得る。図1Bは、プロセッサ118及びトランシーバ120を別個のコンポーネントとして示すが、プロセッサ118及びトランシーバ120は、電子パッケージ又はチップにおいて一緒に統合され得るということが理解されよう。
送信/受信要素122は、エアインターフェース116を介して基地局(例えば、基地局114a)に信号を送信するか又は基地局(例えば、基地局114a)から信号を受信するように構成され得る。例えば、一実施形態では、送信/受信要素122は、RF信号を送信及び/又は受信するように構成されたアンテナであり得る。一実施形態では、送信/受信要素122は、例えば、IR、UV又は可視光信号を送信及び/又は受信するように構成されたエミッタ/検出器であり得る。更に別の実施形態では、送信/受信要素122は、RF信号及び光信号の両方を送信及び/又は受信するように構成され得る。送信/受信要素122は、無線信号の任意の組み合わせを送信及び/又は受信するように構成され得るということが理解されよう。
送信/受信要素122は、単一の要素として図1Bに示されているが、WTRU102は、任意の数の送信/受信要素122を含み得る。より具体的には、WTRU102は、MIMO技術を用い得る。したがって、一実施形態では、WTRU102は、エアインターフェース116を介して無線信号を送受信するための2つ以上の送信/受信要素122(例えば、複数のアンテナ)を含み得る。
トランシーバ120は、送信/受信要素122によって送信される信号を変調し、送信/受信要素122によって受信される信号を復調するように構成され得る。上記のように、WTRU102は、マルチモード能力を有し得る。したがって、トランシーバ120は、例えばNR及びIEEE802.11などの複数のRATを介してWTRU102が通信することを可能にするための複数のトランシーバを含み得る。
WTRU102のプロセッサ118は、スピーカ/マイクロフォン124、キーパッド126、及び/又はディスプレイ/タッチパッド128(例えば、液晶ディスプレイ(liquid crystal display、LCD)表示ユニット若しくは有機発光ダイオード(organic light-emitting diode、OLED)表示ユニット)に結合され得、これらからユーザが入力したデータを受信し得る。プロセッサ118はまた、ユーザデータをスピーカ/マイクロフォン124、キーパッド126、及び/又はディスプレイ/タッチパッド128に出力し得る。加えて、プロセッサ118は、非リムーバブルメモリ130及び/又はリムーバブルメモリ132などの任意のタイプの好適なメモリから情報にアクセスし、かつ当該メモリにデータを記憶し得る。非リムーバブルメモリ130は、ランダムアクセスメモリ(random-access memory、RAM)、読取り専用メモリ(read-only memory、ROM)、ハードディスク又は任意の他のタイプのメモリ記憶デバイスを含み得る。リムーバブルメモリ132は、加入者識別モジュール(subscriber identity module、SIM)カード、メモリスティック、セキュアデジタル(secure digital、SD)メモリカードなどを含み得る。他の実施形態では、プロセッサ118は、サーバ又はホームコンピュータ(図示せず)上など、WTRU102上に物理的に配置されていないメモリから情報にアクセスし、かつ当該メモリにデータを記憶し得る。
プロセッサ118は、電源134から電力を受信し得るが、WTRU102における他のコンポーネントに電力を分配し、かつ/又は制御するように構成され得る。電源134は、WTRU102に電力を供給するための任意の好適なデバイスであり得る。例えば、電源134は、1つ以上の乾電池(例えば、ニッケルカドミウム(nickel-cadmium、NiCd)、ニッケル亜鉛(nickel-zinc、NiZn)、ニッケル金属水素化物(nickel metal hydride、NiMH)、リチウムイオン(lithium-ion、Li-ion)など)、太陽セル、燃料セルなどを含み得る。
プロセッサ118はまた、GPSチップセット136に結合され得、これは、WTRU102の現在の場所に関する場所情報(例えば、経度及び緯度)を提供するように構成され得る。GPSチップセット136からの情報に加えて又はその代わりに、WTRU102は、基地局(例えば、基地局114a、114b)からエアインターフェース116を介して場所情報を受信し、かつ/又は2つ以上の近くの基地局から受信されている信号のタイミングに基づいて、その場所を判定し得る。WTRU102は、一実施形態との一貫性を有したまま、任意の好適な位置判定方法によって位置情報を取得し得るということが理解されよう。
プロセッサ118は、他の周辺機器138に更に結合され得、他の周辺機器138には、追加の特徴、機能、及び/又は有線若しくは無線接続を提供する1つ以上のソフトウェア及び/又はハードウェアモジュールが含まれ得る。例えば、周辺機器138には、加速度計、電子コンパス、衛星トランシーバ、(写真及び/又はビデオのための)デジタルカメラ、ユニバーサルシリアルバス(universal serial bus、USB)ポート、振動デバイス、テレビトランシーバ、ハンズフリーヘッドセット、Bluetooth(登録商標)モジュール、周波数変調(frequency modulated、FM)無線ユニット、デジタル音楽プレーヤ、メディアプレーヤ、ビデオゲームプレーヤモジュール、インターネットブラウザ、仮想現実及び/又は拡張現実(Virtual Reality/Augmented Reality、VR/AR)デバイス、アクティビティトラッカなどが含まれ得る。周辺機器138は、1つ以上のセンサを含み得る。センサは、ジャイロスコープ、加速度計、ホール効果センサ、磁力計、配向センサ、近接センサ、温度センサ、時間センサ、ジオロケーションセンサ、高度計、光センサ、タッチセンサ、磁力計、気圧計、ジェスチャセンサ、生体認証センサ、湿度センサなどのうちの1つ以上であり得る。
WTRU102は、(例えば、(例えば、送信のための)UL及び(例えば、受信のための)DLの両方の特定のサブフレームと関連付けられた)信号の一部又は全部の送受信が、同時及び/又は一緒であり得る、全二重無線機を含み得る。全二重無線機は、ハードウェア(例えば、チョーク)又はプロセッサを介した信号処理(例えば、別個のプロセッサ(図示せず)又はプロセッサ118を介して)を介して自己干渉を低減し、かつ又は実質的に排除するための干渉管理ユニットを含み得る。一実施形態では、WTRU102は、(例えば、(例えば、送信のための)UL又は(例えば、受信のための)DLのいずれかの特定のサブフレームと関連付けられた)信号の一部又は全部の送受信の半二重無線機を含み得る。
図1Cは、一実施形態によるRAN104及びCN106を図示するシステム図である。上記のように、RAN104は、E-UTRA無線技術を用いて、エアインターフェース116を介してWTRU102a、102b、102cと通信し得る。RAN104はまた、CN106と通信し得る。
RAN104は、eノードB160a、160b、160cを含み得るが、RAN104は、一実施形態との一貫性を有しながら、任意の数のeノードBを含み得るということが理解されよう。eノードB160a、160b、160cは各々、エアインターフェース116を介してWTRU102a、102b、102cと通信するための1つ以上のトランシーバを含み得る。一実施形態では、eノードB160a、160b、160cは、MIMO技術を実装し得る。したがって、eノードB160aは、例えば、複数のアンテナを使用して、WTRU102aに無線信号を送信し、かつ/又はWTRU102aから無線信号を受信し得る。
eノードB160a、160b、160cの各々は、特定のセル(図示せず)と関連付けられ得、UL及び/又はDLにおいて、無線リソース管理意思決定、ハンドオーバ意思決定、ユーザのスケジューリングなどを処理するように構成され得る。図1Cに示すように、eノードB160a、160b、160cは、X2インターフェースを介して互いに通信し得る。
図1Cに示されるCN106は、モビリティ管理エンティティ(mobility management entity、MME)162、サービングゲートウェイ(serving gateway、SGW)164、及びパケットデータネットワーク(packet data network、PDN)ゲートウェイ(packet data gateway、PGW)166を含み得る。前述の要素は、CN106の一部として示されているが、これらの要素のうちのいずれかも、CNオペレータ以外のエンティティによって所有及び/又は運営され得ることが理解されよう。
MME162は、S1インターフェースを介して、RAN104におけるeノードB162a、162b、162cの各々に接続され得、かつ制御ノードとして機能し得る。例えば、MME162は、WTRU102a、102b、102cのユーザを認証すること、ベアラのアクティブ化/非アクティブ化、WTRU102a、102b、102cの初期アタッチ中に特定のサービス中のゲートウェイを選択すること、などの役割を果たし得る。MME162は、RAN104と、GSM及び/又はWCDMAなどの他の無線技術を採用する他のRAN(図示せず)との間で切り替えるための制御プレーン機能を提供し得る。
SGW164は、S1インターフェースを介してRAN104におけるeノード-B160a、160b、160cの各々に接続され得る。SGW164は、概して、ユーザデータパケットをWTRU102a、102b、102cに/からルーティングし、転送し得る。SGW164は、eノード-B間ハンドオーバ中にユーザプレーンをアンカする機能、DLデータがWTRU102a、102b、102cに利用可能であるときにページングをトリガする機能、WTRU102a、102b、102cのコンテキストを管理及び記憶する機能などの、他の機能を実行し得る。
SGW164は、PGW166に接続され得、PGW166は、WTRU102a、102b、102cとIP対応デバイスとの間の通信を容易にするために、インターネット110などのパケット交換ネットワークへのアクセスをWTRU102a、102b、102cに提供し得る。
CN106は、他のネットワークとの通信を容易にし得る。例えば、CN106は、WTRU102a、102b、102cと従来の地上回線通信デバイスとの間の通信を容易にするために、PSTN108などの回路交換ネットワークへのアクセスをWTRU102a、102b、102cに提供し得る。例えば、CN106は、CN106とPSTN108との間のインターフェースとして機能するIPゲートウェイ(例えば、IPマルチメディアサブシステム(IP multimedia subsystem、IMS)サーバ)を含み得るか、又はそれと通信し得る。加えて、CN06は、WTRU102a、102b、102cに他のネットワーク112へのアクセスを提供してもよく、他のネットワーク112は、他のサービスプロバイダによって所有される、及び/又は動作される他の有線及び/又は無線ネットワークを含み得る。
WTRUは、無線端末として図1A~図1Dに記載されているが、特定の代表的な実施形態では、そのような端末は、通信ネットワークとの(例えば、一時的又は永久的に)有線通信インターフェースを使用し得ることが企図される。
代表的な実施形態では、他のネットワーク112は、WLANであり得る。
インフラストラクチャ基本サービスセット(Basic Service Set、BSS)モードのWLANは、BSSのアクセスポイント(AP)及びAPと関連付けられた1つ以上のステーション(station、STA)を有し得る。APは、BSS内に、かつ/又はBSS外にトラフィックを搬送する配信システム(Distribution System、DS)又は別のタイプの有線/無線ネットワークへのアクセス又はインターフェースを有し得る。BSS外から生じる、STAへのトラフィックは、APを通って到達し得、STAに配信され得る。STAからBSS外の宛先への生じるトラフィックは、APに送信されて、それぞれの宛先に送信され得る。BSS内のSTAどうしの間のトラフィックは、例えば、APを介して送信され得、ソースSTAは、APにトラフィックを送信し得、APは、トラフィックを宛先STAに配信し得。BSS内のSTA間のトラフィックは、ピアツーピアトラフィックとして見なされ、かつ/又は称され得る。ピアツーピアトラフィックは、ソースSTAと宛先STAとの間で(例えば、それらの間で直接的に)、直接リンクセットアップ(direct link setup、DLS)で送信され得る。特定の代表的な実施形態では、DLSは、802.11e DLS又は802.11zトンネル化DLS(tunneled DLS、TDLS)を使用し得る。独立BSS(Independent BSS、IBSS)モードを使用するWLANは、APを有しない場合があり、IBSS内又はそれを使用するSTA(例えば、STAの全部)は、互いに直接通信し得る。通信のIBSSモードは、本明細書では、「アドホック」通信モードと称され得る。
802.11acインフラストラクチャ動作モード又は同様の動作モードを使用するときに、APは、プライマリチャネルなどの固定チャネル上にビーコンを送信し得る。一次チャネルは、固定幅(例えば、20MHz幅の帯域幅)又は動的に設定された幅であり得る。プライマリチャネルは、BSSの動作チャネルであり得、APとの接続を確立するためにSTAによって使用され得る。特定の代表的な実施形態では、衝突回避を用いるキャリア感知多重アクセス(Carrier Sense Multiple Access with Collision Avoidance、CSMA/CA)は、例えば、802.11システムにおいて実装され得る。CSMA/CAの場合、APを含むSTA(例えば、全てのSTA)は、プライマリチャネルを感知し得る。プライマリチャネルが特定のSTAによってビジーであると感知され/検出され、かつ/又は判定される場合、特定のSTAはバックオフされ得る。1つのSTA(例えば、1つのステーションのみ)は、所与のBSSにおいて、任意の所与の時間に送信し得る。
高スループット(High Throughput、HT)STAは、通信のための40MHz幅のチャネルを使用し得るが、この40MHz幅のチャネルは、例えば、プライマリ20MHzチャネルと、隣接又は非隣接の20MHzチャネルとの組み合わせを介して形成され得る。
非常に高いスループット(Very High Throughput、VHT)のSTAは、20MHz、40MHz、80MHz、及び/又は160MHz幅のチャネルをサポートし得る。上記の40MHz及び/又は80MHz幅のチャネルは、連続する20MHzチャネルどうしを組み合わせることによって形成され得る。160MHzチャネルは、8つの連続する20MHzチャネルを組み合わせることによって、又は80+80構成と称され得る2つの連続していない80MHzチャネルを組み合わせることによって、形成され得る。80+80構成の場合、チャネル符号化後、データは、データを2つのストリームに分割し得るセグメントパーサを通過し得る。逆高速フーリエ変換(Inverse Fast Fourier Transform、IFFT)処理及び時間ドメイン処理は、各ストリームで別々に行われ得る。ストリームは、2つの80MHzチャネルにマッピングされ得、データは、送信STAによって送信され得る。受信STAの受信機では、80+80構成に対する上記で説明される動作は逆にされ得、組み合わされたデータを媒体アクセス制御(Medium Access Control、MAC)に送信し得る。
サブ1GHzの動作モードは、802.11af及び802.11ahによってサポートされる。チャネル動作帯域幅及びキャリアは、802.11n及び802.11acで使用されるものと比較して、802.11af及び802.11ahでは低減される。802.11afは、TVホワイトスペース(TV White Space、TVWS)スペクトルで5MHz、10MHz、及び20MHzの帯域幅をサポートし、802.11ahは、非TVWSスペクトルを使用して、1MHz、2MHz、4MHz、8MHz、及び16MHzの帯域幅をサポートする。代表的な実施形態によれば、802.11ahは、マクロカバレッジエリアにおけるMTCデバイスなどのメータタイプの制御/マシンタイプ通信(Machine-Type Communications、MTC)をサポートし得る。MTCデバイスは、例えば、特定の、かつ/又は限定された帯域幅のためのサポート(例えば、そのためのみのサポート)を含む、特定の能力を有し得る。MTCデバイスは、(例えば、非常に長いバッテリ寿命を維持するために)閾値を超えるバッテリ寿命を有するバッテリを含み得る。
複数のチャネル、並びに802.11n、802.11ac、802.11af、及び802.11ahなどのチャネル帯域幅をサポートし得るWLANシステムは、プライマリチャネルとして指定され得るチャネルを含む。プライマリチャネルは、BSSにおける全てのSTAによってサポートされる最大共通動作帯域幅に等しい帯域幅を有し得る。プライマリチャネルの帯域幅は、最小帯域幅動作モードをサポートするBSSで動作する全てのSTAの中から、STAによって設定され、かつ/又は制限され得る。802.11ahの例では、プライマリチャネルは、AP及びBSSにおける他のSTAが2MHz、4MHz、8MHz、16MHz、及び/又は他のチャネル帯域幅動作モードをサポートする場合であっても、1MHzモードをサポートする(例えば、それのみをサポートする)STA(例えば、MTCタイプデバイス)に対して1MHz幅であり得る。キャリア感知及び/又はネットワーク配分ベクトル(Network Allocation Vector、NAV)設定は、プライマリチャネルの状態に依存し得る。例えば、一次チャネルがビジーである場合、APに送信する(1MHz動作モードのみをサポートする)STAにより、利用可能な周波数帯域の大部分がアイドル状態になったとしても、利用可能な周波数帯域の全てがビジーであると見なされ得る。
米国では、802.11ahにより使用され得る利用可能な周波数帯域は、902MHz~928MHzである。韓国では、利用可能な周波数帯域は917.5MHz~923.5MHzである。日本では、利用可能な周波数帯域は916.5MHz~927.5MHzである。802.11ahに利用可能な総帯域幅は、国のコードに応じて6MHz~26MHzである。
図1Dは、一実施形態によるRAN104及びCN106を例示するシステム図である。上記のように、RAN104は、NR無線技術を用いて、エアインターフェース116を介してWTRU102a、102b、102cと通信し得る。RAN104はまた、CN106と通信し得る。
RAN104は、gNB180a、180b、180cを含み得るが、RAN104は、一実施形態との一貫性を維持しながら、任意の数のgNBを含み得ることが理解されよう。gNB180a、180b、180cは各々、エアインターフェース116を介してWTRU102a、102b、102cと通信するための1つ以上のトランシーバを含み得る。一実施形態では、gNB180a、180b、180cは、MIMO技術を実装し得る。例えば、gNB180a、108bは、ビームフォーミングを利用して、gNB180a、180b、180cに信号を送信及び/又は受信し得る。したがって、gNB180aは、例えば、複数のアンテナを使用して、WTRU102aに無線信号を送信し、かつ/又はWTRU102aから無線信号を受信し得る。一実施形態では、gNB180a、180b、180cは、キャリアアグリゲーション技術を実装し得る。例えば、gNB180aは、複数のコンポーネントキャリアをWTRU102a(図示せず)に送信し得る。これらのコンポーネントキャリアのサブセットは、未認可スペクトル上にあり得、残りのコンポーネントキャリアは、認可スペクトル上にあり得る。一実施形態では、gNB180a、180b、180cは、協調マルチポイント(Coordinated Multi-Point、CoMP)技術を実装し得る。例えば、WTRU102aは、gNB180a及びgNB180b(及び/又はgNB180c)からの協調送信を受信し得る。
WTRU102a、102b、102cは、拡張可能なヌメロロジと関連付けられた送信を使用して、gNB180a、180b、180cと通信し得る。例えば、OFDMシンボル間隔及び/又はOFDMサブキャリア間隔は、無線送信スペクトルの異なる送信、異なるセル、及び/又は異なる部分に対して変化し得る。WTRU102a、102b、102cは、様々な若しくは拡張可能な長さのサブフレーム又は送信時間間隔(transmission time interval、TTI)を使用して(例えば、様々な数のOFDMシンボル及び/又は様々な長さの絶対時間の持続し変化する時間を含む)、gNB180a、180b、180cと通信し得る。
gNB180a、180b、180cは、スタンドアロン構成及び/又は非スタンドアロン構成でWTRU102a、102b、102cと通信するように構成され得る。スタンドアロン構成では、WTRU102a、102b、102cは、他のRAN(例えば、eノードB160a、160b、160cなど)にアクセスすることなく、gNB180a、180b、180cと通信し得る。スタンドアロン構成では、WTRU102a、102b、102cは、モビリティアンカポイントとしてgNB180a、180b、180cのうちの1つ以上を利用し得る。スタンドアロン構成では、WTRU102a、102b、102cは、未認可バンドにおける信号を使用して、gNB180a、180b、180cと通信し得る。非スタンドアロン構成では、WTRU102a、102b、102cは、gNB180a、180b、180cと通信し、これらに接続する一方で、eノードB160a、160b、160cなどの別のRANとも通信し、これらに接続し得る。例えば、WTRU102a、102b、102cは、1つ以上のgNB180a、180b、180c及び1つ以上のeノードB160a、160b、160cと実質的に同時に通信するためのDC原理を実装し得る。非スタンドアロン構成では、eノードB160a、160b、160cは、WTRU102a、102b、102cのモビリティアンカとして機能し得るが、gNB180a、180b、180cは、WTRU102a、102b、102cをサービス提供するための追加のカバレッジ及び/又はスループットを提供し得る。
gNB180a、180b、180cの各々は、特定のセル(図示せず)に関連付けられ得、無線リソース管理決定、ハンドオーバ決定、UL及び/又はDLにおけるユーザのスケジューリング、ネットワークスライスのサポート、DC、NRとE-UTRAとの間の相互作用、ユーザプレーン機能(User Plane Function、UPF)184a、184bに対するユーザプレーンデータのルーティング、アクセス及びモビリティ管理機能(Access and Mobility Management Function、AMF)182a、182bに対する制御プレーン情報のルーティングなどを処理するように構成され得る。図1Dに示すように、gNB180a、180b、180cは、Xnインターフェースを介して互いに通信し得る。
図1Dに示されるCN106は、少なくとも1つのAMF182a、182b、少なくとも1つのUPF184a、184b、少なくとも1つのセッション管理機能(Session Management Function、SMF)183a、183b、及び場合によってはデータネットワーク(Data Network、DN)185a、185bを含み得る。前述の要素は、CN106の一部として示されているが、これらの要素のうちのいずれかも、CNオペレータ以外のエンティティによって所有及び/又は運営され得ることが理解されよう。
AMF182a、182bは、N2インターフェースを介してRAN104におけるgNB180a、180b、180cのうちの1つ以上に接続されてよく、制御ノードとして機能し得る。例えば、AMF182a、182bは、WTRU102a、102b、102cのユーザ認証、ネットワークスライスのためのサポート(例えば、異なる要件を有する異なるプロトコルデータユニット(protocol data unit、PDU)セッションの処理)、登録のSMF183a、183bの選択、登録エリアの管理、非アクセス層(non-access stratum、NAS)信号伝達の終了、モビリティ管理などの役割を果たし得る。ネットワークスライスは、WTRU102a、102b、102cを利用しているサービスのタイプに基づいて、WTRU102a、102b、102cのCNサポートをカスタマイズするために、AMF182a、182bによって使用され得る。例えば、異なるネットワークスライスは、超高信頼低レイテンシ(ultra-reliable low latency、URLLC)アクセスに依存するサービス、拡張大規模モバイルブロードバンド(enhanced massive mobile broadband、eMBB)アクセスに依存するサービス、MTCアクセスのためのサービスなどのような、異なる使用事例に対して確立され得る。AMF182a、182bは、RAN104と、LTE、LTE-A、LTE-A Pro、及び/又はWiFiなどの非-3GPPアクセス技術などの他の無線技術を用いる他のRAN(図示せず)との間で切り替えるための制御プレーン機能を提供し得る。
SMF183a、183bは、N11インターフェースを介して、CN106内のAMF182a、182bに接続され得る。SMF183a、183bはまた、N4インターフェースを介して、CN106内のUPF184a、184bに接続され得る。SMF183a、183bは、UPF184a、184bを選択及び制御し、UPF184a、184bを通るトラフィックのルーティングを構成し得る。SMF183a、183bは、UE IPアドレスを管理及び配分する機能、PDUセッションを管理する機能、ポリシー実施及びQoSを制御する機能、DLデータ通知を提供する機能などのような、他の機能を実行し得る。PDUセッションタイプは、IPベース、非IPベース、イーサネットベースなどであり得る。
UPF184a、184bは、N3インターフェースを介して、RAN104内のgNB180a、180b、180cのうちの1つ以上に接続されてよく、これにより、WTRU102a、102b、102cとIP対応デバイスとの間の通信を容易にするために、インターネット110などのパケット交換ネットワークへのアクセスをWTRU102a、102b、102cに提供し得る。UPF184、184bは、パケットのルーティング及び転送、ユーザプレーンポリシーの実施、マルチホームPDUセッションのサポート、ユーザプレーンQoSの処理、DLパケットのバッファリング、モビリティアンカリングなどの他の機能を実行し得る。
CN106は、他のネットワークとの通信を容易にし得る。例えば、CN106は、CN106とPSTN108との間のインターフェースとして機能するIPゲートウェイ(例えば、IPマルチメディアサブシステム(IP multimedia subsystem、IMS)サーバ)を含み得るか、又はそれと通信し得る。加えて、CN06は、WTRU102a、102b、102cに他のネットワーク112へのアクセスを提供してもよく、他のネットワーク112は、他のサービスプロバイダによって所有される、及び/又は動作される他の有線及び/又は無線ネットワークを含み得る。一実施形態では、WTRU102a、102b、102cは、UPF184a、184bへのN3インターフェース及びUPF184a、184bとDN185a、185bとの間のN6インターフェースを介して、UPF184a、184bを通じて、ローカルDN185a、185bに接続され得る。
図1A~図1D及び図1A~図1Dの対応する説明を考慮して、WTRU102a~d、基地局114a~b、eノードB160a~c、MME162、SGW164、PGW166、gNB180a~c、AMF182a~b、UPF184a~b、SMF183a~b、DN185a~b、及び/又は本明細書に記載される任意の他のデバイスの1つ以上に関して本明細書に記載される機能のうちの1つ以上又は全部は、1つ以上のエミュレーションデバイス(図示せず)によって行われ得る(図示せず)。エミュレーションデバイスは、本明細書に説明される機能の1つ以上又は全てをエミュレートするように構成された1つ以上のデバイスであり得る。例えば、エミュレーションデバイスを使用して、他のデバイスを試験し、かつ/又はネットワーク及び/若しくはWTRU機能をシミュレートし得る。
エミュレーションデバイスは、ラボ環境及び/又はオペレータネットワーク環境における他のデバイスの1つ以上の試験を実装するように設計され得る。例えば、1つ以上のエミュレーションデバイスは、通信ネットワーク内の他のデバイスを試験するために、有線及び/又は無線通信ネットワークの一部として完全に若しくは部分的に実装され、かつ/又は展開されている間、1つ以上若しくは全ての機能を実行し得る。1つ以上のエミュレーションデバイスは、有線及び/又は無線通信ネットワークの一部として一時的に実装/展開されている間、1つ以上若しくは全ての機能を実行し得る。エミュレーションデバイスは、オーバザエアの無線通信を使用して、試験する及び/又は試験を行う目的で、別のデバイスに直接結合され得る。
1つ以上のエミュレーションデバイスは、有線及び/又は無線通信ネットワークの一部として実装/展開されていない間、全てを含む1つ以上の機能を実行し得る。例えば、エミュレーションデバイスは、1つ以上のコンポーネントの試験を実装するために、試験実験室での試験シナリオ、並びに/又は展開されていない(例えば、試験用の)有線及び/若しくは無線通信ネットワークにおいて利用され得る。1つ以上のエミュレーションデバイスは、試験機器であり得る。RF回路(例えば、1つ以上のアンテナを含み得る)を介した直接RF結合及び/又は無線通信は、データを送信及び/又は受信するように、エミュレーションデバイスによって使用され得る。
本出願に記載の様々な方法及び他の態様は、図2及び図3に示すように、例えば、ビデオエンコーダ200及びデコーダ300のモジュールを修正するために使用され得る。更に、本明細書で開示される主題は、V3C、G-PCCに限定されない態様を提示し、例えば、規格又は勧告に記載されているかどうかにかかわらず、既存であるか又は将来開発されるかどうかにかかわらず、ビデオコーディングの任意のタイプ、形式、又はバージョン、並びに任意のかかる規格及び勧告(例えば、V3C及びG-PCCを含む)の拡張に適用され得る。別段の指示がない限り、又は技術的に除外されない限り、本出願に記載の態様は、個々に又は組み合わせて使用され得る。
本出願で説明する例では、V3Cアプリケーションメッセージ又はG-PCCアプリケーションメッセージのフィールドのために予約されたビット数など、様々な数値が使用される。これら及び他の特定の値は、例を説明する目的であり、説明される態様は、これらの特定の値に限定されない。
図2は、ビデオエンコーダの一例を示す図である。例示的なエンコーダ200の変形形態が企図されるが、エンコーダ200は、全ての予想される変形形態を説明することなく、明確にする目的で以下に記載される。
符号化される前に、ビデオシーケンスは、符号化前処理(201)、例えば、カラー変換を入力カラーピクチャに適用すること(例えば、RGB4:4:4からYCbCr4:2:0への変換)、又は圧縮に対してより弾力的な信号分布を得るために入力ピクチャ成分の再マッピングを実行する(例えば、色成分のうちの1つのヒストグラム等化を使用して)ことを経得る。メタデータは前処理に関連付けられてもよく、そのようなメタデータはビットストリームに添付されてもよい。
エンコーダ200では、以下に記載されるように、ピクチャは、エンコーダ要素によって符号化されてもよい。符号化されるべきピクチャは、分割され(202)、例えば、コーディングユニット(coding unit、CU)の単位で処理されてもよい。各ユニットは、例えば、イントラモード又はインターモードのいずれかを使用して符号化されてよい。ユニットがイントラモードで符号化されると、ユニットはイントラ予測を実行し(260)、インターモードでは、動き推定(275)及び動き補償(270)が実行される。エンコーダは、ユニットを符号化するためにイントラモード又はインターモードのうちのどちらを使用すべきかを決定してよく(205)、例えば、予測モードフラグによってイントラ/インターの決定を示す。予測残差は、例えば、元の画像ブロックから予測されたブロックを減算することによって(210)計算されてよい。
次いで、予測残差が変換され(225)、量子化されてよい(230)。量子化された変換係数、並びに動きベクトル及び他のシンタックス要素は、ビットストリームを出力するためにエントロピーコード化されてよい(245)。エンコーダは、変換をスキップし、量子化を非変換残差信号に直接適用し得る。エンコーダは、変換及び量子化の両方をバイパスすることができ、すなわち、残差は、変換プロセス又は量子化プロセスを適用することなく直接コード化される。
エンコーダは、符号化されたブロックを復号化して、更なる予測のための参照を提供する。量子化された変換係数は、予測残差を復号化するために逆量子化され(240)、逆変換される(250)。復号化された予測残差と予測ブロックとを組み合わせる(255)と、画像ブロックが再構成される。再構築されたピクチャには、符号化アーチファクトを低減するために、例えば、デブロッキング/SAO(サンプル適応オフセット)フィルタリングを実行するために、lnループフィルタ(265)が適用される。フィルタリングされた画像は、参照ピクチャバッファ(280)に記憶される。
図3は、ビデオデコーダの実施例を示す図である。例示的なデコーダ300では、ビットストリームは、以下に記載されるようにデコーダ要素によって復号化され、ビデオデコーダ300は、一般に、図2に記載されるように符号化パスと逆の復号化されたパスを実行する。エンコーダ200はまた、一般に、ビデオデータの符号化の一部としてビデオ復号化を実行する。特に、デコーダの入力は、ビデオエンコーダ200によって生成され得るビデオビットストリームを含んでよい。ビットストリームは、変換係数、動きベクトル、及びその他のコード化された情報を取得するために、まずエントロピー復号化されてよい(330)。ピクチャ分割情報は、ピクチャがどのように分割されるかを示し、したがって、デコーダは、復号化されたピクチャ分割情報に従ってピクチャを分けてよい(335)。変換係数は、予測残差を復号化するために、逆量子化され(340)、逆変換される(350)。復号化された予測残差と予測ブロックとを組み合わせ(355)、画像ブロックが再構成され、予測ブロックは、イントラ予測(360)又は動き補償予測(すなわち、インター予測)(375)から取得され得る(370)。ループ内フィルタ(365)は、再構成された画像に適用される。フィルタリングされた画像は、参照ピクチャバッファ(380)に記憶される。
復号化されたピクチャは、復号化後処理(385)、例えば、逆カラー変換(例えば、YCbCr4:2:0からRGB4:4:4への変換)、又は符号化前処理(201)において実行された再マッピングプロセスの逆を実行する逆再マッピングを更に経ることができる。復号化後処理は、符号化前処理において導出され、ビットストリームにおいてシグナリングされたメタデータを使用し得る。
図4は、本明細書に記載の様々な態様及び実施形態が実装され得るシステムの実施例を示す図である。システム400は、以下に説明する様々なコンポーネントを含むデバイスとして具現化されてよく、本明細書に記載される態様のうちの1つ以上を実行するように構成されてよい。そのようなデバイスの例には、パーソナルコンピュータ、ラップトップコンピュータ、スマートフォン、タブレットコンピュータ、デジタルマルチメディアセットトップボックス、デジタルテレビ受信機、パーソナルビデオ記録システム、接続された家電製品、及びサーバなどの様々な電子デバイスが含まれるが、これらに限定されない。システム400の要素は、単独で又は組み合わせて、単一の集積回路(IG)、複数のIC、及び/又は個別のコンポーネントで具体化されてもよい。例えば、少なくとも1つの例では、システム400の処理及びエンコーダ/デコーダ要素は、複数のIC及び/又は個別のコンポーネントに分散され、様々な実施形態では、システム400は、例えば通信バスを介して、又は専用の入力及び/又は出力ポートを介して、1つ以上の他のシステム、又は他の電子デバイスに通信可能に結合される。様々な実施形態では、システム400は、本明細書に記載される態様のうちの1つ以上を実装するように構成されている。
システム400は、例えば、この文書に記載された様々な態様を実施するためにその中にロードされた命令を実行するように構成された少なくとも1つのプロセッサ410を含み、プロセッサ410は、埋め込みメモリ、入出力インターフェース、及び当技術分野で知られているような様々な他の回路を含んでよい。システム400は、少なくとも1つのメモリ420(例えば、揮発性メモリデバイス及び/又は不揮発性メモリデバイス)を含む。システム400は、記憶デバイス440を含み、これは、これに限定されないが、電気的消去可能プログラマブル読み出し専用メモリ(EEPROM).読取り専用メモリ(ROM)、プログラマブル読取り専用メモリ(PROM)、ランダムアクセスメモリ(RAM)、ダイナミックランダムアクセスメモリ(DRAM)、スタティックランダムアクセスメモリ(SRAM)、フラッシュ、磁気ディスクドライブ、及び/又は光ディスクドライブを含めた、不揮発性メモリ及び/又は揮発性メモリを含むことができる。記憶デバイス440は、非限定的な例として、内部記憶デバイス、取り付け型の記憶デバイス(取り外し可能及び取り外し不可能な記憶デバイスを含む)、及び/又はネットワークアクセス可能な記憶デバイスを含むことができる。
システム400は、例えば、データを処理して、符号化されたビデオ又は復号化されたビデオを提供するように構成されたエンコーダ/デコーダモジュール430を含み、エンコーダ/デコーダモジュール430は、その独自のプロセッサ及びメモリを含み得る。エンコーダ/デコーダモジュール430は、符号化及び/又は復号化機能を実行するためにデバイスに含まれ得るモジュールを表す。既知のように、デバイスは、符号化モジュール及び復号化モジュールの一方又はその両方を含むことができる。加えて、エンコーダ/デコーダモジュール430は、システム400の個別の要素として実装され得るか、又は当業者に知られているように、ハードウェアとソフトウェアの組み合わせとしてプロセッサ410内に組み込まれてもよい。
本明細書に記載される様々な態様を実行するためにプロセッサ410又はエンコーダ/デコーダ430にロードされるべきプログラムコードは、記憶デバイス440に記憶され、その後、プロセッサ410による実行のためにメモリ420にロードされてよく、様々な実施形態によれば、プロセッサ410、メモリ420、記憶デバイス440、及びエンコーダ/デコーダモジュール430のうちの1つ以上は、本明細書に記載されたプロセスの実行中、様々なアイテムのうちの1つ以上を記憶することができる。かかる記憶されたアイテムは、これらに限定されないが、入力ビデオ、復号化されたビデオ、又は復号化されたビデオの一部分、ビットストリーム、マトリクス、変数、並びに、方程式、式、動作、及び動作論理の処理からの中間結果又は最終結果を含むことができる。
いくつかの実施形態では、プロセッサ410及び/又はエンコーダ/デコーダモジュール430の内部のメモリは、命令を記憶し、かつ符号化中又は復号化中に必要とされる処理のための作業メモリを提供するために使用される。しかしながら、他の実施形態では、処理デバイス(例えば、処理デバイスは、プロセッサ410又はエンコーダ/デコーダモジュール430のいずれかであり得る)の外部のメモリが、これらの機能のうちの1つ以上のために使用されてもよい。外部メモリは、メモリ420及び/又は記憶デバイス440、例えば、ダイナミック揮発性メモリ及び/又は不揮発性フラッシュメモリであり得る。いくつかの実施形態では、外部不揮発性フラッシュメモリを使用して、例えば、テレビのオペレーティングシステムを記憶する。少なくとも一つの実施形態では、RAMなどの高速外部ダイナミック揮発性メモリが、MPEG-2などのビデオコーディング動作及びビデオ復号化動作のためのワーキングメモリとして使用される。MPEGはMoving Picture Experts Groupを指し、MPEG-2はISO/IEC 13818と呼ばれてもよい。ISO/IEC 13818-1はH.222としても知られており、13818-2はH.262)、HEVG(HEVCは、H.265及びMPEG-H Part 2としても知られている高効率ビデオ符号化を指す)、又はVVC(多用途ビデオ符号化、JVET、ジョイント・ビデオ・エキスパート・チームによって開発されている新しい規格)として知られている場合もある。
システム400の要素への入力は、ブロック445に示されるように、様々な入力デバイスを通して提供され得る。このような入力デバイスには、(I)例えば、放送事業者による放送全体にわたり送信されるRF信号を受信する無線周波数(Radio Frequency、RF)部分、(ii)コンポーネント(Component、COMP)入力端子(又はCOMP入力端子セット)、(iii)ユニバーサルシリアルバス(Universal Serial Bus、USB)入力端子、及び/又は(iv)高解像度マルチメディアインターフェース(High Definition Multimedia Interface、HDMI)入力端子が含まれるが、これらに限定されない。他の実施例には、図4には示されていないが、コンポジットビデオが含まれてもよい。
様々な実施形態では、ブロック445の入力デバイスは、当該技術分野で既知の、関連付けられたそれぞれの入力処理要素を有してもよい。例えば、RF部分は、(i)所望の周波数を選択することと(また信号を選択する、又は信号を周波数帯域に帯域制限するとも称される)、(ii)選択された信号をダウンコンバートすることと、(iii)特定の実施形態で、(例えば)チャネルとして称され得る信号周波数帯域を選択するために、再度より狭い周波数帯域に帯域制限することと、(iv)ダウンコンバート及び帯域制限された信号を復調することと、(v)誤り訂正を実行することと、(vi)データパケットの所望のストリームを選択するために多重分離することと、に対して好適な要素に関連付けられ得る。様々な実施形態のRF部分は、これらの機能を実行するための1つ以上の要素、例えば、周波数セレクタ、信号セレクタ、帯域リミッタ、チャネルセレクタ、フィルタ、ダウンコンバータ、復調器、エラー訂正器、及びデマルチプレクサを含む。RF部分は、例えば、受信信号をより低い周波数(例えば、中間周波数又はベースバンドに近い周波数)又はベースバンドにダウンコンバートすることを含め、様々なこれらの機能を実行するチューナを含んでよい。1つのセットトップボックス実施形態では、RF部分及びその関連付けられた入力処理要素は、有線(例えば、ケーブル)媒体を介して送信されたRF信号を受信し、フィルタリング、ダウンコンバート、及び所望の周波数帯域への再フィルタリングによって周波数選択を実行する。様々な実施形態では、上で説明される(及び他の)要素の順序を並べ替える、これらの要素の一部を削除する、並びに/又は、類似若しくは異なる機能を実行する他の要素を追加してもよい。要素を追加することは、例えば、既存の要素の間に要素を挿入すること、例えば増幅器及びアナログ-デジタル変換器を挿入することを含むことができ、様々な実施形態において、RF部分はアンテナを含む。
更に、USB及び/又はHDMI端子は、システム400をUSB及び/又はHDMI接続を介して他の電子デバイスに接続するためのそれぞれのインターフェースプロセッサを含むことができ、入力処理、例えばリード・ソロモン誤り訂正の様々な態様は、例えば、別個の入力処理1C内又は必要に応じてプロセッサ410内で実施されてもよいことを理解されたい。同様に、USB又はHDMIインターフェース処理の態様は、必要に応じて、個別のインターフェースIC内又はプロセッサ410内に実装され得る。復調され、エラー訂正され、多重分離されたストリームは、例えば、プロセッサ410、及び出力デバイス上に提示するために必要に応じてデータストリームを処理するためにメモリ及び記憶要素と組み合わせて動作するエンコーダ/デコーダ430を含む、様々な処理要素に提供される。
システム400の様々な要素は、一体型ハウジング内に提供され得る。一体型ハウジング内では、様々な要素が相互接続され、適切な接続配列425、例えば、Inter-IC(I2C)バス、配線、及びプリント回路基板を含む当技術分野で知られている内部バスを使用して、それらの間でデータを送信し得る。
システム400は、通信チャネル460を介して他のデバイスとの通信を可能にする通信インターフェース450を含む。通信インターフェース450は、これに限定されないが、通信チャネル460を介してデータを送信及び受信するように構成されたトランシーバを含むことができる。通信インターフェース450は、モデム又はネットワークカードを含むことができるが、これに限定されず、通信チャネル460は、例えば、有線及び/又は無線媒体内に実装され得る。
データは、様々な実施形態では、Wi-Fiネットワーク、例えば、IEEE802.11(IEEEは、米国電気電子技術者協会(Institute of Electrical and Electronics Engineers)を指す)などの無線ネットワークを使用して、システム400にストリーミングされるか、又は別様に提供されてもよい。これらの実施例のWi-Fi信号は、Wi-Fi通信用に適合された通信チャネル460及び通信インターフェース450を介して受信される。これらの実施形態の通信チャネル460は、典型的に、ストリーミングアプリケーション及び他のオーバザトップ通信を可能にするために、インターネットを含む外部ネットワークへのアクセスを提供するアクセスポイント又はルータに接続される。他の実施形態では、入力ブロック445のHDMI接続を介してデータを配信するセットトップボックスを使用して、システム400にストリーミングデータを提供する。更に他の実施形態は、入力ブロック445のRF接続を使用してシステム400にストリーミングされたデータを提供する。上述したように、様々な実施形態は、非ストリーミング方式でデータを提供する。追加的に、様々な実施形態は、Wi-Fi以外の無線ネットワーク、例えば、セルラネットワーク又はBluetoothネットワークを使用してもよい。
システム400は、ディスプレイ475、スピーカ485、及び他の周辺デバイス495を含む様々な出力デバイスに出力信号を提供することができる。様々な実施形態のディスプレイ475は、例えば、タッチスクリーンディスプレイ、有機発光ダイオード(OLED)ディスプレイ、湾曲ディスプレイ、及び/又は折り畳み可能なディスプレイのうちの1つ以上を含む。ディスプレイ475は、テレビ、タブレット、ラップトップ、携帯電話(移動電話)、又は他のデバイス用であってもよい。ディスプレイ475はまた、他のコンポーネント(例えば、スマートフォンの場合のように、)と統合されてもよく、又は別個の(例えば、ラップトップ用の外部モニタ)であってもよい。他の周辺デバイス495は、実施形態の様々な例では、スタンドアロンのデジタルビデオディスク(又はデジタル多用途ディスク)(両用語のDVR)、ディスクプレーヤ、ステレオシステム、及び/又は照明システムのうちの1つ以上を含む。様々な実施形態は、システム400の出力に基づいて機能を提供する1つ以上の周辺デバイス495を使用する。例えば、ディスクプレーヤは、システム400の出力を再生する機能を実行する。
様々な実施形態において、制御信号が、ユーザの介入の有無に関わらず、デバイス間制御を可能にする、AVLink、Consumer Electronics Control(CEC)、又は他の通信プロトコルなどのシグナリングを使用して、システム400と、ディスプレイ475、スピーカ485、又は他の周辺デバイス495との間で通信されてよい。出力デバイスは、それぞれのインターフェース470、480及び490を通じた専用接続を介してシステム400に通信可能に結合され得る。あるいは、出力デバイスは、通信インターフェース450を介して通信チャネル460を使用してシステム400に接続されてもよい。ディスプレイ475及びスピーカ485は、例えばテレビなどの電子デバイス内のシステム400の他のコンポーネントと単一のユニットに統合されてもよく、様々な実施形態では、ディスプレイインターフェース470は、例えばタイミングコントローラ(T Con)チップなどのディスプレイドライバを含む。
ディスプレイ475及びスピーカ485は、代替的に、例えば、入力445のRF部分が個別のセットトップボックスの一部分である場合、他のコンポーネントのうちの1つ以上から分離され得る。ディスプレイ475及びスピーカ485が外部コンポーネントである様々な実施形態では、出力信号は、例えば、HDMIポート、USBポート、又はCOMP出力を含む、専用の出力接続を介して提供され得る。
実施形態は、プロセッサ410によって、又はハードウェアによって、又はハードウェア及びソフトウェアの組み合わせによって実装されたコンピュータソフトウェアによって実行され得る。非限定的な例として、実施形態は、1つ以上の集積回路によって実施されてもよい。メモリ420は、技術的環境に適した任意のタイプのものであってもよく、非限定的な例として、光メモリデバイス、磁気メモリデバイス、半導体ベースのメモリデバイス、固定メモリ、及びリムーバブルメモリなどの任意の適切なデータ記憶技術を使用して実施されてもよい。プロセッサ410は、技術的環境に適した任意のタイプのものであってもよく、非限定的な例として、マイクロプロセッサ、汎用コンピュータ、専用コンピュータ、及びマルチコアアーキテクチャに基づくプロセッサのうちの1つ又は複数を包含することができる。
様々な実装形態は、復号化を伴う。本出願で使用される「復号化」は、表示に適した最終出力を生成するために、例えば受信された符号化されたシーケンスに対して実行されるプロセスの全て又は一部を包含することができ、様々な実施形態では、そのようなプロセスは、デコーダによって通常実行されるプロセス、例えばエントロピー復号化、逆量子化、逆変換、及び差分復号化のうちの1つ又は複数を含む。様々な実施形態では、かかるプロセスはまた、又は代替的に、本出願に記載の様々な実装形態のデコーダによって実行されるプロセス、例えば、コード化点群シーケンス(例えば、ISOBMFFコンテナにカプセル化された)への部分的なアクセスを提供するために、コード化点群シーケンス(例えば、例えば、本明細書に開示するような、1つ以上のファイルフォーマット構造を使用してISOBMFFコンテナにカプセル化された)の一部分を復号化すること、などを含む。
更なる実施形態として、いくつかの例では、「復号化」はエントロピー復号化のみを指す場合があり、他の実施形態では、「復号化」は差分復号化のみを指す場合があり、他の実施形態では、「復号化」はエントロピー復号化と差分復号化との組み合わせを指す場合がある。「復号化プロセス」という語句が具体的に動作のサブセットを指すことを意図しているか、一般的により広い復号化プロセスを指すことを意図しているかは、特定の説明の文脈に基づいて明らかであり、当業者によって十分に理解されると考えられる。
様々な実装形態は、符号化を伴う。「復号化(decoding)」に関する上記の考察と同様に、本出願で使用される「符号化(encoding)」は、例えば、符号化されたビットストリームを作り出すために入力ビデオシーケンスに対して実行されるプロセスの全て又は一部を包含することができる。様々な実施形態において、このようなプロセスは、例えば、分割、差動符号化、変換、量子化、及びエントロピー符号化など、エンコーダによって典型的に実行されるプロセスのうちの1つ以上を含む。様々な実施形態では、かかるプロセスは同様に、又は代替的に、本出願に記載の様々な実施形態のエンコーダによって実行されるプロセス、例えば、コード化された点群シーケンス(例えば、ISOBMFFコンテナにカプセル化された)の異なる部分に部分的なアクセスサポートを提供するために、1つ以上のファイルフォーマット構造(例えば、本明細書に開示するような)を含むビデオベースの点群ビットストリームを符号化すること、などを含む。
更なる例として、一実施形態では、「符号化」とは、エントロピー符号化のみを指し、別の実施形態では、「符号化」とは、差動符号化のみを指し、別の実施形態では、「符号化」とは、差動符号化とエントロピー符号化との組み合わせを指す。符号化プロセスという句が、具体的に演算のサブセットを指すことを意図しているか、又は概してより広範な符号化プロセスを指すことを意図しているかは、特定の説明の文脈に基づいて明らかになり、当業者には十分に理解されると考えられる。
本明細書で使用されるシンタックス要素、例えばV3CSelectionMessage、V3CAssetGroupMessage、及びV3CViewChangeFeedbackMessageなどは、記述用語であることに留意されたい。したがって、これらは他のシンタックス要素名の使用を排除するものではない。
図がフローチャートとして提示されている場合、その図は対応する装置のブロック図も提供するものと理解されたい。同様に、図がブロック図として提示されている場合、その図は対応する方法/プロセスのフローチャートも提供するものと理解されたい。
本明細書に記載の実装形態及び態様は、例えば、方法又はプロセス、装置、ソフトウェアプログラム、データストリーム、又は信号において実装され得る。たとえ単一の形態の実装形態の文脈でのみ考察される場合でも(例えば、方法としてのみ考察される)、考察された特徴の実装形態は、他の形態(例えば、装置又はプログラム)でも実装することができる。装置は、例えば、適切なハードウェア、ソフトウェア、及びファームウェアで実装され得る。本方法は、例えば、一般に、例えば、コンピュータ、マイクロプロセッサ、集積回路、又はプログラマブルロジックデバイスを含む処理デバイスを指すプロセッサで実施されてよい。プロセッサはまた、例えば、コンピュータ、携帯電話、携帯情報端末「PDA」、及びエンドユーザ間の情報の通信を容易にする他のデバイスなどの通信デバイスを含む。
「一実施形態」、「実施形態」、「例」、「一実装形態」、又は「実装形態」、並びにそれらの他の変形は、実施形態に関連して説明された特定の特徴、構造、特性などが少なくとも1つの実施形態に含まれることを意味する。したがって、本出願全体の様々な場所に現れる、「一実施形態において」、「例において」、「一実装形態において」、又は「実装形態において」という句、並びに他の任意の変形の出現は、必ずしも全てが同じ実施形態又は例を指すとは限らない。
更に、本出願は、様々な情報を「決定する」ことに言及する場合がある。情報を決定することは、例えば、情報を推定すること、情報を計算すること、情報を予測すること、又はメモリから情報を検索することのうちの1つ以上を含むことができる。取得することは、受信すること、取り出すこと、構築すること、生成すること、及び/又は判定することを含み得る。
更に、本出願は、情報の種々の部分にアクセスすることに言及する場合がある。情報にアクセスすることは、例えば、(例えば、メモリから)情報を取得すること、情報を記憶すること、情報を移動すること、情報をコピーすること、情報を計算すること、情報を判定すること、情報を予測すること、情報を推測すること、又は情報を推定することのうちの1つ以上を含むことができる。
加えて、本出願は、様々な情報を「受信すること」に言及する場合がある。受信することは、「アクセスすること」と同様に、広義の用語であることが意図されている。情報を受信することは、例えば、情報にアクセスすること、又は情報を(例えば、メモリから)検索することのうちの1つ以上を含むことができる。更に、「受信することは」は、典型的には、例えば、情報を記憶すること、情報を処理すること、情報を送信すること、情報を移動させること、情報をコピーすること、情報を消去すること、情報を計算すること、情報を判定すること、情報を予測すること、又は情報を推定することなどの動作中に、ある方法で又は別の方法で関与する。
以下の「及び/又は」並びに「例えば「A/B」、「A及び/又はB(A and/or B)」及び「A及びBの少なくとも一方(at least one of A and B)」の場合の少なくとも1つの使用は、最初に列挙された選択肢(A)のみの選択、又は2番目に列挙された選択肢(B)のみの選択、又は両方の選択肢(A及びB)の選択を包含することを意図していることを理解されたい。更なる例として、「A、B、及び/又はC(A, B, and/or C)」及び「A、B、及びCのうちの少なくとも1つ(at least one of A, B, and C)」の場合、かかる表現は、第1のリストされた選択肢(A)のみの選択、又は第2のリストされた選択肢(B)のみの選択、又は第3のリストされた選択肢(C)のみの選択、又は第1及び第2のリストされた選択肢(A及びB)のみの選択、又は第1及び第3のリストされた選択肢(A及びC)のみの選択、又は第2及び第3のリストされた選択肢のみの選択(B及びC)のみ、又は3つ全ての選択肢の選択(A及びB及びC)を包含することが意図される。このことは、当該技術分野及び関連技術分野の当業者に明らかであるように、リストされたアイテムの数だけ拡張され得る。
また、本明細書で使用される場合、「シグナリングする」という単語は、とりわけ、対応するデコーダに対して何かを示すことを指す。いくつかの実施形態では、エンコーダは(例えば、符号化されたビットストリーム及び/又はISOBMFFコンテナなどのカプセル化ファイルにおいて)、例えば、パラメータセット、SEIメッセージ、メタデータ、編集リスト、ポストデコーダ要件、ISOBMFFコンテナにカプセル化されたコード化された点群シーケンスの異なる部分への柔軟な部分アクセスを可能にする信号、各シグナリングされたオブジェクトの依存関係リスト、空間領域へのマッピング、3D境界ボックス情報などをシグナリングしてよい。このようにして、一実施形態では、同じパラメータがエンコーダ側とデコーダ側の両方で使用される。したがって、例えば、エンコーダは、デコーダが同じ特定のパラメータを使用できるように、特定のパラメータをデコーダに送信する(明示的なシグナリング)ことができる。逆に、デコーダが既に特定のパラメータ並びに他のパラメータを有する場合、シグナリングを使用して、送信(暗黙的なシグナリング)することなく、単にデコーダが特定のパラメータを知り選択することを可能にし得る。任意の実際の機能の送信を回避することによって、様々な実施形態においてビット節約が実現され、シグナリングは様々な方法で達成され得ることを理解されたい。例えば、1つ以上のシンタックス要素、フラグなどが、様々な実施形態において、対応するデコーダに情報をシグナリングするために使用される。上記は、「シグナリングする」という語の動詞形に関連しているが、「signal」という語は、本明細書では名詞としても使用されることがある。
当業者には明らかであるように、実装形態は、例えば、記憶又は送信され得る情報を搬送するようにフォーマットされた様々な信号を生成し得る。情報は、例えば、方法を実行するための命令、又は説明されている実装形態の1つによって生成されるデータを含むことができる。例えば、信号は、説明された実施形態のビットストリームを搬送するようにフォーマットされ得る。かかる信号は、例えば、(例えば、スペクトルの無線周波数部分を使用して)電磁波として、又はベースバンド信号としてフォーマットされ得る。フォーマットすることは、例えば、データストリームを符号化し、符号化されたデータストリームで搬送波を変調することを含み得る。信号が搬送する信号は、例えば、アナログ情報又はデジタル情報であり得る。信号は、知られているように、様々な異なる有線又は無線リンクによって送信され得る。信号は、プロセッサ可読メディアに記憶され得る。
三次元(3D)画像を(例えば、3D点群を使用して)キャプチャし、レンダリングすることは、テレプレゼンス、仮想現実、及び大規模動的3Dマップなどの多くの用途を有し得る。3D点群は、没入型メディアを表すために使用されてよい。3D点群は、3D空間に表される点のセットを含んでもよい。(例えば、各)点は、座標及び/又は1つ以上の属性を含み得る。座標は、(例えば、各)点の位置を示し得る。属性は、例えば、各点に関連付けられた色、透明度、取得時間、レーザ又は材料特性などのうちの1つ又は複数を含むことができる。点群は、いくつかの方法でキャプチャ又は展開されてよい。点群は、(例えば、3D空間をサンプリングするために、)例えば、複数のカメラ及び深度センサ、光検出及び測距(LIDAR.)レーザスキャナなどを使用してキャプチャ又は展開され得る。点(例えば、座標及び/又は属性によって表される)は、例えば、3D空間内のオブジェクトのサンプリングによって生成され得る。点群は、複数の点を含むことができ、その各々は、3D空間にマッピングする座標のセット(例えば、x、y、z座標)によって表されてよく、一例では、3Dオブジェクト又はシーンは、数百万又は数十億個のサンプリングされた点を含む点群で表される、又は再構成されてよい。3D点群は、静的及び/又は動的(移動する)3Dシーンを表し得る。
点群データは、例えば、点群データを(例えば、効率的に)記憶及び/又は送信するために、表現及び/又は圧縮(例えば、点群圧縮(PCC))され得る。例えば、3D点群の効率的かつ相互運用可能な記憶及び送信をサポートするために、ジオメトリベース圧縮が、静的点群を符号化及び復号化するために利用され得、ビデオベース圧縮が、動的点群を符号化及び復号化するために利用され得る。点群サンプリング、表現、圧縮、及び/又はレンダリングは、点群のジオメトリック座標及び/又は属性の非可逆コーディング及び/又は可逆コーディング(例えば、符号化又は復号化)をサポートし得る。
図5は、サーバ502及びクライアント510のシステムインターフェース500を示す図である。サーバ502は、インターネット504及び他のネットワーク506に接続された点群サーバとし得る。クライアント510はまた、インターネット504及び他のネットワーク506に接続され、ノード(例えば、サーバ502及びクライアント510)間の通信を可能にしてもよい。各ノードは、プロセッサと、非一時的コンピュータ可読メモリ記憶媒体と、本明細書に開示する方法又は方法の一部分を実施するようにプロセッサによって実行可能である、記憶媒体内に記憶された実行可能命令とを含んでよい。1つ以上のノードは、1つ以上のセンサを更に含み得る。クライアント510は、ヘッドマウントディスプレイ(head-mounted display、HMD)508などのディスプレイの3Dビデオをレンダリングするためのグラフィックスプロセッサ512を含み得る(例えば、をも含み得る)。ノードのいずれか又は全ては、図1A~図1Dに関して上記に記載したように、WTRUを備え、ネットワークを介して通信し得る。
図6は、サーバ602及びクライアント604のためのシステムインターフェース600を示す図である。サーバ602は、点群コンテンツサーバ602とし得、点群コンテンツのデータベース、詳細レベルを処理するためのロジック、及びサーバ管理機能を含み得る。いくつかの実施例では、詳細を処理することは、帯域幅制限に起因して、又は視認距離が低減を可能にするのに十分であるために可能にされるように、クライアント604(例えば、閲覧クライアント604)に送信するための解像度を低減し得る。点群コンテンツサーバ602は、クライアント604と通信してよく、点群データ及び/又は点群メタデータを交換することができる。いくつかの例では、閲覧者向けにレンダリングされた点群データは、点群データ及び/又は点群メタデータ(例えば、点群サーバ602から視聴クライアント604にストリーミングされた)などから、詳細のレベルを低減及び/又は増加させるためにデータ構築のプロセスを経てもよい。点群サーバ602は、空間取り込みが提供された解像度で点群データをストリーミングし得るか、又はいくつかの実施形態では、例えば、帯域幅制約又は視認距離公差に準拠するためにダウンサンプリングし得る。点群サーバ602は、詳細レベルを動的に低減してもよく、いくつかの例では、点群サーバ602は、点群データをセグメント化してよく(例えば同様にしてよく)、点群内のオブジェクトを識別してよい。いくつかの例では、選択されたオブジェクトに対応する点群データ内の点は、より低い解像度データで置き換えられ得る。
クライアント604(例えば、HMDを有するクライアント604)は、ビットストリーム、例えば、ビデオベース点群圧縮(V-PCC)コード化されたビットストリームを介して点群コンテンツサーバ602から点群の一部分及び/又はタイルを要求し得る。例えば、点群の一部分及び/又はタイルは、HMDの場所及び/又は向きに基づいて取り出され得る。
点群は、各点に関連付けられた色、透明度、取得時間、レーザの反射率又は材料特性などの1つ以上の属性と共に各点の位置を示す座標を使用して3D空間内で表される点のセットから構成され得る。点群は、いくつかの方法でキャプチャされてよい。例えば、点群をキャプチャするための1つの技法は、複数のカメラ及び深度センサを使用してよい。光検出及び測距(LiDAR)レーザスキャナも、点群をキャプチャするために使用されてよい。点群を使用してオブジェクト及びシーンを現実的に再構築するために必要とされる点の数は、数百万(又は更には数十億)ほどになり得る。したがって、効率的に表現及び圧縮することが、点群データを記憶及び送信するために不可欠であり得る。点群と同様に、いくつかの没入型ビデオタイプはまた、視覚的ボリュメトリックコンテンツを表すことが可能であってもよく、例えば、6自由度(6DoF)で、限られた範囲の視聴位置及び配向内で3Dシーンの再生のためのサポートを提供することが可能であり得る。
上の段落で実質的に説明したように、少なくとも2つの3D点群圧縮(PCC)規格、すなわち、静的点群のためのジオメトリベースの圧縮規格、及び動的点群のためのビデオベースの圧縮規格が提案される。動的点群のためのビデオベースの圧縮規格に関して、視覚的ボリュメトリックビデオベースコーディング(V3C)は一例であり、V3Cベースの実装形態の様々な態様は以下のように説明され得る。
図7は、例示的なV3Cビットストリームの構造の一例を示す。図7に示すように、ビットストリームは、V3Cサンプルストリーム701を含んでよく、これは、各々がV3Cユニットヘッダ及びV3Cユニットペイロードを有するV3Cユニットのセットを含み得る。V3Cユニットヘッダは、V3Cユニットタイプを記述してよい。例えば、V3Cユニットタイプは、V3C_OVD、V3C_GVD、及び/又はV3C_AVDを含み得る。ユニットタイプV3C_OVD、V3C_GVD、及びV3C_AVDを有するV3Cユニットは、それぞれ占有ビデオデータユニット、ジオメトリ属性ビデオデータユニット、及び属性ビデオデータユニットであってよい。これらのデータユニットは、視覚的ボリュメトリックメディアコンテンツを再構成するために必要とされる3つの主要なコンポーネントを表してよい。占有V3Cユニットペイロード、ジオメトリV3Cユニットペイロード、及び属性V3Cユニットペイロードは、適切なビデオデコーダによって復号化され得るビデオデータユニット(例えば、NALユニット)に対応してよい。V3Cビットストリームはまた、1つ以上のV3C_VPSユニットを含んでよく、これは、V3Cユニットヘッダで使用され得るシンタックス要素を定義するパラメータセットを提供してよい。V3Cビットストリームは、アトラスサブビットストリーム(例えば、V3CユニットヘッダV3C_ADによって示される)を更に含んでよく、これは、少なくともNALユニットヘッダを含むユニットと、符号化されたアトラスを定義する(又は部分的に定義する)データをカプセル化するユニットとを含む、ネットワーク抽象化層(NAL)サンプルストリーム702を搬送し得る。例えば、図7に示すように、NALユニットは、アトラスタイルグループに対応するアトラスタイルグループ層703(例えば、生バイトシーケンスペイロード(RBSP))のペイロードを含んでよく、これは、パッチ(すなわち、ボリュメトリック情報に関連付けられたアトラス内の領域)を記述するヘッダ及びデータを含み得る。
図8は、サポートされるV3C属性タイプの例を例示する表である。V3C属性ユニットヘッダは、V3Cユニットタイプに加えて、属性タイプを指定してもよい。V3C属性ユニットヘッダはまた、インデックスを指定してもよく、同じ属性タイプの複数のインスタンスがサポートされることを可能にする。例えば、サポートされる属性タイプは、テクスチャ、材料、透明度、反射率、又は表面法線を含み得る。
本明細書では、V3Cコンテナファイルフォーマットについて説明する。
図9は、ISOBMFF規格に従って実装され得るようなV3Cコンテナの例示的な構造を示す。一般に、V3Cコンテナは、アトラスデータ、ジオメトリデータ、属性データ、及び占有データによって更に定義されるボリュメトリックビデオデータ900を包含し得る。より具体的には、コンテナは、サンプルエントリ内のV3Cパラメータセット及びアトラスパラメータセットと、サンプル内のアトラスコンポーネントビットストリームNALユニットとを包含するV3Cアトラストラック910を含み得る。V3Cアトラストラックはまた、ビデオ圧縮V3Cユニット(すなわち、V3C_OVD、V3C_GVD、及びV3C_AVDに等しいV3Cユニットタイプである)のペイロードを搬送する他のトラック920、930及び940、又はV3Cアトラスタイルトラックへのトラック参照を含み得る。
コンテナは、図9の920に例示されるように、サンプルがジオメトリデータ(すなわち、V3C_GVDに等しいタイプのV3Cユニットのペイロード)用のビデオコード化されたエレメンタリストリームのアクセスユニットを包含する、1つ以上のV3Cビデオコンポーネントトラックを含み得る。コンテナは、図9の930に例示されるように、サンプルが属性データ(すなわち、V3C_AVDに等しいタイプのV3Cユニットのペイロード)用のビデオコード化されたエレメンタリストリームのアクセスユニットを包含する、ゼロ以上のV3Cビデオコンポーネントトラックを含み得る。コンテナは、図9の940に例示されるように、サンプルが占有データ(すなわち、V3C_OVDに等しいタイプのV3Cユニットのペイロード)用のビデオコード化されたエレメンタリストリームのアクセスユニットを包含する、ゼロ以上のV3Cビデオコンポーネントトラックを含み得る。
図10は、2つ以上のアトラス及び複数のアトラスタイルを有する例示的なマルチトラックコンテナを例示する。複数のアトラスがV3Cメディアに存在する場合、これらのアトラスは、関連付けられたV3Cコンポーネントトラック(すなわち、関連付けられた占有マップ、ジオメトリ、及び属性情報を搬送するトラック)へのトラック参照を有する別個のアトラストラックで搬送されてもよい。アトラスデータが2つ以上のアトラスタイルを含む場合、これらのアトラスタイルは、アトラストラックによって参照される別個のアトラスタイルトラックに記憶されてもよく、追加のトラック参照は、アトラスタイルトラックから、アトラスタイルトラックによって搬送されるアトラスタイルの関連付けられたV3Cビデオコンポーネント情報を搬送するトラックに記憶される。これは、例えば、図10に例証されてよい。1001に例示されるように、V3Cトラック「v3cb」は複数のアトラスを含み得る。アトラスは、例えば、「v3a1」又は「v3ag」のサンプルエントリを有する別個のV3Cトラック1010及び1020に記憶されてもよい。V3Cトラック1010及び1020は各々、複数のアトラスタイルトラック1011及び1012を含んでよく、アトラスタイルトラック1011及び1012の各々は、V3Cコンポーネントトラック1013及び1014をそれぞれ含み得る。
上記の段落で実質的に説明したように、静的点群のためのジオメトリベースの圧縮(G-PCC)規格はまた、3D点群の効率的で相互運用可能な記憶及び送信をサポートするために定義され得る。本明細書では、そのような幾何学ベースの圧縮規格に従って実行及び/又は実装され得る方法、装置、及びシステムが提案される。
図11は、G-PCC規格で符号化されたビットストリームの構造の一例を例示する図である。図11に示すように、G-PCCビットストリーム1100は、タイプ-長さ-値(TLV)カプセル化構造としても知られるG-PCCユニットのセットを搬送し得る。1110に示すように、(すなわち、各)G-PCC TLVユニットは、TLVタイプ1111及びG-PCC TLVユニットペイロード1112を示す情報を含み得る。図11には示されていないが、GPCC TLVユニットは、例えばバイト又はビットに関して表現され得るG-PCC TLVユニットペイロード長を示す情報を更に含み得る。G-PCC TLVユニットペイロード1112は、所与のタイプの情報を含み得る。例えば、G-PCC TLVユニットペイロードは、例えば、シーケンスパラメータセット、ジオメトリパラメータセット、ジオメトリデータユニット、属性パラメータセット、属性データユニット、タイルインベントリ、フレーム境界マーカ、又はデフォルトの属性データユニットであり得る所与のタイプの情報を搬送し得る。
図12は、例えばMPEG規格に従って定義され得るG-PCC TLVカプセル化ユニットの例示的なシンタックス構造を提供する表である。図12に示すように、TLVカプセル化ユニットは、第1のビット数(又はバイト)、例えば8ビットを使用してペイロードタイプを示してよい。TLVカプセル化ユニットペイロード長は、第2のビット数(例えば、32ビット)で表されてよい。G-PCC TLVカプセル化ユニットは、示されたペイロードタイプ及びペイロード長を有するペイロードを含み得る。
図13は、TLVタイプパラメータの可能な値と、この可能な値の各々の対応する記述とを提供する表である。図13に示すように、TLVペイロードタイプは、シーケンスパラメータセット、ジオメトリパラメータセット、ジオメトリデータユニット、属性パラメータセット、属性データユニット、タイルインベントリ、フレーム境界マーカ、又はデフォルトの属性データユニットであってもよい。ユニットタイプ「2」及び「4」を有するG-PCC TLVユニットは、それぞれジオメトリデータユニット及び属性データユニットであり得る。
図14は、G-PCC TLVユニットペイロードの例示的なシンタックス構造を提供する表である。図14に示される例示的なシンタックスは、例えば、MPEG-I Part 9(ISO/IEC 23090-9)で定義されたシンタックス構造と一致し得る。ジオメトリG-PCCユニット及び属性G-PCCユニットのペイロード情報は、G-PCCデコーダによって復号化されてよく、かつ対応するジオメトリG-PCCユニット及び属性パラメータセットG-PCCユニットにおいて指定されるメディアデータユニット(例えば、TLVユニット)に対応し得る。
G-PCCファイルの高レベル構文(high-level syntax、HLS)は、ジオメトリデータ及び属性データにおけるスライス及びタイルグループの概念をサポートし得る。フレームは、複数のタイル及びスライスに分割され得る。スライスは、独立して符号化又は復号化することができる点のセットとして理解されてよい。スライスは、例えば、1つのジオメトリデータユニットと、0以上の属性データユニットとを含み得る。属性データユニットの情報は、同じスライス内のジオメトリデータユニットの対応する情報に依存し得る。スライス内で、ジオメトリデータユニットは、関連付けられた属性ユニットの前に必然的に現れてよい。スライスのデータユニットは、連続し得る。フレーム内のスライスの順序付けは、必ずしも指定されなくてもよい。
いくつかの方式では、スライスのグループは、共通タイル識別子によって識別されてもよい。いくつかの規格と一致して、各タイルのバウンディングボックスを記述するタイルインベントリが提供されてもよい。タイルは、バウンディングボックス内の別のタイルと重複し得る。各スライスは、スライスが属するタイルを識別するインデックスを包含し得る。
本明細書では、G-PCCコンテナファイルフォーマットについて説明する。G-PCCビットストリームが単一のトラックで搬送される場合、それは、G-PCC符号化されたビットストリームが単一トラック宣言によって表されることを必要とし得る。G-PCCデータの単一トラックカプセル化は、一部のケースでは、更なる処理なしにG-PCCビットストリームが単一トラックに記憶される単純なISOBMFFカプセル化を利用し得る。そのようなトラック内の各サンプルは、1つ以上のG-PCCコンポーネントを包含し得る。換言すると、各サンプルは、1つ以上のTLVカプセル化構造を含み得る。
図15は、G-PCCジオメトリ情報及び属性情報を提供するビットストリームが単一のトラックに記憶される方式による例示的なサンプル構造を例示する。図15に示すように、G-PCCビットストリームを搬送するトラックのサンプル1500は、パラメータセットを提供する第1のTLV 1510、ジオメトリデータを提供する第2のTLV 1520、及び第2のTLV 1520のジオメトリデータに対応する属性データを提供する第3のTLV 1530のうちの少なくとも一つを含み得る。
1つ以上の符号化G-PCCジオメトリビットストリーム及び1つ以上の符号化G-PCC属性ビットストリームが別々のトラックに記憶されるとき、トラック内の各サンプルは、単一のG-PCCコンポーネントデータを搬送する少なくとも1つのTLVカプセル化構造を包含してよい。
図16は、いくつかの規格(MPEG-I Part 18(ISO/IEC 23090-18)など)に従って実装され得るマルチトラックISOBMFF G-PCCコンテナの例示的な構造を示す。マルチトラックG-PCCコンテナは、それぞれftyp、moov、及びmdat構造1610、1620、及び1630によって図16に示される「ボックス」として知られる情報ユニットを含んでよく、これらは、ISO/IEC 14496-12で定義されたベースメディアファイルフォーマットと一致してよい。ftypボックス1610は、例えば、ファイルタイプ記述情報、及びメディアファイルで使用される共通データ構造を提供してよい。moovボックス1620及びmdatボックス1630は、ジオメトリパラメータセット、シーケンスパラメータセット、及びジオメトリデータTLVユニットを搬送するジオメトリビットストリームサンプルを併せて包含するG-PCCトラック1621及び1631を含んでよい。トラックはまた、G-PCC属性コンポーネントのペイロードを搬送する他のトラックへのトラック参照を含んでよい。moovボックス1620及びmdatボックス1630は、それぞれの属性の属性パラメータセットを包含し得るG-PCCトラック1622及び1632と、属性データTLVユニットを搬送する属性ビットストリームサンプルとを集合的に含んでよい。
G-PCCビットストリームが複数のトラックで搬送される場合、いくつかの規格(ISO/IEC 14496-12など)に従って実装され得るトラック参照ツールを使用して、G-PCCコンポーネントトラックをリンクしてもよい。場合によっては、1つ以上のTrackReferenceTypeBoxが、G-PCCトラックのTrackBox内のTrackReferenceBoxに追加されてもよい。TrackReferenceTypeBoxは、G-PCCトラックが参照するトラックを指定するtrack_IDの配列を包含してよい。G-PCCジオメトリトラックをG-PCC属性トラックにリンクするために、G-PCCジオメトリトラックのTrackReferenceTypeBoxのreference_typeが、関連付けられた属性トラックを識別してよい。これらのトラック参照タイプに関連付けられた4文字コード(4CC)は、参照されたトラックがG-PCC属性データの符号化ビットストリームを包含することを示し得る「gpca」であってよい。
G-PCCビットストリームのジオメトリストリームが複数のタイルを包含する場合、各タイル又はタイルのグループは、ジオメトリタイルトラックと呼ばれ得る別個のトラックにカプセル化されてよい。ジオメトリタイルトラックは、1つ以上のジオメトリタイルのTLVユニットを搬送してもよく、したがってこれらのタイルへの直接のアクセスを可能にする。同様に、複数のタイルを包含するG-PCCビットストリームの属性ストリームもまた、複数の属性タイルトラックで搬送されてもよい。
1つ以上のG-PCCタイルのデータは、コンテナの別々のジオメトリタイルトラック及び属性タイルトラックで搬送されてよい。G-PCCコード化されたストリーム用のISOBMFFコンテナにおける部分アクセスをサポートするために、点群シーン内の空間領域に対応するタイルは、いくつかのMPEG規格と一致して定義され得るDynamic3DSpatialRegionSampleEntryを有するトラックなどの時限メタデータトラックのサンプルにおいて、又は同様にいくつかのMPEG規格で定義され得るようなGPCCSpatialRegionInfoBoxボックスにおいてシグナリングされ得る。これにより、プレーヤ及びストリーミングクライアントは、点群シーン内の特定の空間領域又はタイルをレンダリングするために必要とされる情報を搬送するタイルトラックのセットを取り出すことが可能になり得る。
G-PCCベーストラックは、ISO/IEC 23090-9に記載されているように、例えば、SPS、GPS、APS、及びタイルインベントリ情報のみを包含するTLVカプセル化構造を搬送してよい。G-PCCベーストラックをジオメトリタイルトラックにリンクするために、新しいトラック参照タイプを有するトラック参照が、4CC「gpbt」を使用して定義され得る。新しいタイプのトラック参照を使用して、G-PCCベーストラックを各ジオメトリタイルトラックにリンクしてよい。
各ジオメトリタイルトラックは、例えばISO/IEC 14496-12と一致して実装され得るようなトラック参照ツールを使用して、それぞれのタイル又はタイルグループの属性情報を搬送するG-PCCタイルトラックの他の1つ以上の属性とリンクされ得る。これらのトラック参照タイプの4CCは、例えば、MPEG規格と一致して定義され得るような「gpca」であってよい。
点群シーンは、代替形態でコード化されてもよい。そのような場合、コード化G-PCCデータの代替形態は、ISO/IEC 14496-12と一致して実装され得るような、代替トラックメカニズムによって示されてよい。例えば、コード化されたG-PCCデータの代替を示すために、TrackHeaderBoxのalternate_groupフィールドが使用されてもよい。各代替G-PCCビットストリームが単一のトラックに記憶されるとき、互いの代替形態であり得るコード化されたG-PCCビットストリームを包含するG-PCCトラックは、それらのTrackHeaderBox内に同じalternate_group値を有してもよい。各代替のG-PCCビットストリームがマルチトラックコンテナに記憶されるとき、すなわち、各代替のG-PCCビットストリームの異なるコンポーネントビットストリームが別々のトラックで搬送されるとき、代替G-PCCビットストリームのG-PCCジオメトリトラックは、それらのTrackHeaderBox内で同じalternate_group値を有し得る。
MPEGメディアトランスポート(MMT)のための方法、手順、装置、及びシステムが本明細書で説明される。一般的に言えば、高度なメディアトランスポート及び配信サービスを可能にするために、ツールのセットを使用することができる。ツールは、メディア処理ユニット(MPU)フォーマット、配信、及びシグナリングの3つの異なる機能領域に分散されてもよい。そのようなツールは、一緒に効率的に使用されるように設計され得るが、それらはまた、独立して使用されてもよい。
メディア処理ユニット(MPU)機能領域は、メディアコンテンツの論理構造、MMTエンティティによって処理されるデータユニットのパッケージ及びフォーマット、並びに例えばISOベースメディアファイルフォーマットを用いたそれらのインスタンス化を定義してよい。パッケージは、高度な配信に必要な情報を提供するために、メディアコンテンツ及びそれらの関係性を含むコンポーネントを指定してよい。データのフォーマットは、記憶又は配信のいずれかのために符号化されたメディアデータをカプセル化し、記憶されるべきデータと配信されるべきデータとの間の容易な変換を可能にするように定義され得る。
配信機能領域は、MMTプロトコル(MMTP)と呼ばれるアプリケーション層トランスポートプロトコル及びペイロードフォーマットを定義してよい。アプリケーション層トランスポートプロトコルは、単一のパケットフローにおけるストリーミング配信とダウンロード配信との混合使用の多重化及びサポートなど、マルチメディアデータの配信のための拡張機能を提供し得る。ペイロードフォーマットは、メディアタイプ及び符号化方法に依存しない符号化されたメディアデータの搬送を可能にし得る。
シグナリング機能エリアは、メディアデータの配信及び消費を管理するためのシグナリングメッセージのフォーマットを定義してよい。消費管理のためのシグナリングメッセージは、パッケージの構造をシグナリングするために使用されてよく、配信管理のためのシグナリングメッセージは、ペイロードフォーマット及びプロトコル構成の構造をシグナリングするために使用されてよい。
MMTプロトコルは、単一のMMTPパケットフローを介した様々なアセットからのメディア処理ユニット(MPU)のような異なるメディアデータの多重化をサポートし得る。それは、大きな遅延を導入することなく、又は大きなバッファを必要とすることなく、異なるタイプのメディアデータ間の同期を助けるために、消費の順序で複数のタイプのデータを受信エンティティに配信し得る。MMTPはまた、単一のパケットフロー内のメディアデータ及びシグナリングメッセージの多重化をサポートしてよい。
いくつかの実施形態では、MMTPペイロードは、1つのMMTPパケットのみで搬送され得る。フラグメンテーション及びアグリゲーションは、ペイロードフォーマットによって提供されてもよく、MMTP自体によって提供されなくてもよい。MMTPは、汎用ファイル配信(GFD)モード及びMPUモードの2つのパケット化モードを定義してよい。GFDモードは、トランスポートオブジェクト内のそれらのバイト位置を使用してデータユニットを識別し得る。MPUモードは、MPU内の役割及びメディア位置を使用してデータユニットを識別し得る。MMTプロトコルは、単一の配信セッションにおける2つの異なるモードを有するパケットの混合使用をサポートし得る。MMTパケットの単一のパケットフローは、任意に2種類のペイロードで構成されてもよい。
図17は、MMTシグナリングが実行されるシステムの例示的なエンドツーエンドアーキテクチャを描く。アーキテクチャは、少なくとも、これらに限定されないが、パッケージプロバイダ1710と、一つ以上のアセットプロバイダ1721及び1722と、MMT送信エンティティ1730と、MMT受信エンティティ1740とを含んでもよい。図17に示されるように、MMT送信エンティティ1730は、パッケージ提供者1710からパッケージを受信してよい。MMT送信エンティティ1730は、MMTPパケットフローとしてMMT受信エンティティ1740へパッケージを送信する役割を担ってもよい。MMT送信エンティティ1730は、パッケージプロバイダ1710によって提供されるパッケージのプレゼンテーション情報に基づいてコンテンツプロバイダからメディアコンテンツを収集するように要求されてもよい。メディアコンテンツは、MMTPパケットフローを形成する一連のカプセル化されたMMT処理ユニットにセグメント化されるアセットとして提供されてもよい。したがって、MMT送信エンティティ1730は、アセットプロバイダ1721及び/又は1722のうちの1つ以上からアセット情報を収集してもよい。
シグナリングメッセージは、パッケージの配信及び消費を管理するために使用されてよい。MMT送信エンティティ1730とMMT受信エンティティ1740との間のインターフェース、並びにそれらの動作は、規格化され得る。MMTプロトコル(MMTP)は、MMT受信エンティティ1740によって、packet_id及びペイロードタイプに基づいて、ストリーミングされたメディアを受信して多重分離するために使用され得る。MMT受信エンティティ1740によって実行されるカプセル化解除手順は、搬送されるペイロードのタイプに依存してもよく、例えば、図17に示されたシナリオにおいて、別個に処理されてもよい。
本明細書では、MMTデータモデルの様々な態様が説明される。MMTプロトコルは、コード化されたメディアデータのストリーミング配信及びダウンロード配信の両方を提供し得る。ストリーミング配信の場合、MMTプロトコルは、MPU、アセット、及びパッケージを含む固有のデータモデルを想定してよい。MMTプロトコルは、シグナリングメッセージを使用してMPU、アセット、及びパッケージの間の構造的関係を示すことによって、配信中にデータモデルを保存してよい。
符号化されたメディアデータ及びその関連メタデータの集合は、パッケージを構築してよい。パッケージは、1又は複数のMMT送信エンティティから1つ以上のMMT受信エンティティに配信されてよい。オーディオ又はビデオコンテンツの一部など、パッケージの符号化されたメディアデータの1つ以上の部分は、アセットを構成し得る。
アセットは、アセットがグローバルに一意に識別され得るように、アセットを提供している実際の物理的位置又はサービスプロバイダに依存する可能性がない識別子に関連付けられてよい。異なる識別子を有するアセットは交換可能ではない場合がある。例えば、2つの異なるアセットは、同じコンテンツの2つの異なる符号化を搬送し得るが、それらは交換可能でなくてもよい。MMTは、特定の識別メカニズムを指定することはできないが、この目的のためにURI又はUUIDを使用することを可能にする場合がある。各アセットは、パッケージによって作成されたプレゼンテーション全体のタイムラインとは異なる持続時間であり得る独自のタイムラインを有する場合がある。
各MPUは、アセットの重複しない部分を構成することができ、すなわち、同じアセットの2つの連続するMPUは同じメディアサンプルを包含しない場合がある。各MPUは、MMT受信エンティティのプレゼンテーションエンジンによって独立的に消費され得る。
図18は、いくつかの実施形態によるパッケージ構造の例示である。図18に示すように、パッケージ1800は、論理エンティティであってもよい。パッケージ1800は、1つ以上のプレゼンテーション情報ドキュメント1810と、1つ以上のアセット1820と、各アセットに対して関連付けられたアセット配信特性(ADC)とを包含し得る。アセット1820の各々は、1つ以上のMPU1830を包含し得る。パッケージの処理はMPU単位で行われてもよく、各MPUは同じアセットIDを共有してもよい。
MMTアセットは、いくつかの実施形態に従って本明細書で更に説明される。アセットは、マルチメディアプレゼンテーションを構築するために使用される任意のマルチメディアデータであり得る。アセットは、符号化されたメディアデータを搬送するための同じアセットIDを共有するMPUの論理グルーピングであり得る。アセットの符号化されたメディアデータは、時限データ又は非時限データであり得る。時限データは、固有のタイムラインを有する符号化されたメディアデータを含んでよく、指定された時間にデータユニットの同期された復号化及びプレゼンテーションを必要とする場合がある。非時限データは、そのメディアコンテンツの復号化及びプレゼンテーションのための固有のタイムラインを持たない任意の他のタイプのデータを含み得る。非時限データの各項目の復号化時刻及びプレゼンテーション時刻は、必ずしも同一の非時限データの他の項目の復号化時刻及びプレゼンテーション時刻と関連しなくてもよい。例えば、これらは、ユーザ対話又はプレゼンテーション情報によって決定されてもよい。
時限メディアデータを搬送する同じアセットの2つのMPUは、それらのプレゼンテーション時間において重複を持たない場合がある。プレゼンテーション情報によって参照される任意のタイプのデータがアセットと見なされてもよい。個々のアセットと見なされ得るメディアデータのタイプの例は、オーディオデータ、ビデオデータ、又はウェブページデータを含み得る。
メディア処理ユニット(MPU)の特徴及び特性が、本明細書で説明される。メディア処理ユニット(MPU)は、MMTエンティティによって処理され、他のMPUから独立してプレゼンテーションエンジンによって消費され得るメディアデータ項目であり得る。
MMTエンティティによるMPUの処理は、カプセル化/カプセル化解除及びパケット化/パケット化解除を含み得る。MPUは、メディアアウェアパケット化のためのMFUの境界を示すMMTヒントトラックを含んでよい。MPUの消費は、メディア処理(例えば、符号化/復号化)及びプレゼンテーションを含み得る。
パケット化の目的で、MPUは、アクセスユニット(AU)よりも小さくなり得るデータユニットにフラグメント化され得る。MPUのシンタックス及びセマンティクスは、MPU中で搬送されるメディアデータのタイプに依存しないことがある。単一アセットのMPUは、時限メディア又は非時限メディアのいずれかを有し得る。MPUは、MPEG-4 AVC(ISO/IEC 14496-10)又はMPEG-2 TSなどのいくつかの規格のうちの1つ以上に従ってフォーマットされたデータの一部を包含してよい。
単一のMPUは、整数個のAU又は非時限データを包含し得る。時限データの場合、単一のAUは、複数のMPUにフラグメント化されない場合がある。非時限データの場合、単一のMPUは、プレゼンテーションエンジンによって消費される1つ以上の非時限データ項目を包含し得る。MPUは、関連付けられたアセット識別(asset_id)及び/又はシーケンス番号によって識別され得る。
MMTPペイロードの態様が本明細書で説明される。MMTPペイロードは、MPU、汎用オブジェクト、及びMMTプロトコルを介してパッケージを消費するための他の情報のようなメディアデータをパケット化して伝達するために使用される汎用ペイロードであってもよい。適切なMMTPペイロードフォーマットが、MPU、汎用オブジェクト、及びシグナリングメッセージをパケット化するために使用されてよい。
MMTPペイロードは、完全なMPU又はMPUの断片、シグナリングメッセージ、汎用オブジェクト、AL-FEC方式のリペアシンボル、又は他のデータユニット又は構造を搬送してもよい。ペイロードのタイプは、MMTプロトコルパケットヘッダ内のタイプフィールドによって示されてもよい。ペイロードタイプごとに、配信のための1つ以上のデータユニットと、追加又は代替として、タイプ固有ペイロードヘッダとが定義され得る。例えば、MMTPペイロードがMPUの断片を搬送するとき、MPU(例えば、MFU)の断片は、単一のデータユニットと見なされてもよい。MMTプロトコルは、同じデータタイプを有する複数のデータユニットを単一のMMTPペイロードに集約してもよい。また、単一のデータユニットを複数のMMTPパケットにフラグメント化してもよい。
MFUは、時限データのサンプル若しくはサブサンプル、又は非時限データのアイテムであってもよい。MFUは、時限データのためのAUよりも小さくてもよいメディアデータを含んでもよく、含まれるメディアデータは、メディアデコーダによって処理されてもよい。MFUは、搬送されるメディアデータの境界に関する情報を包含するMFUヘッダを含んでよい。MFUは、MPU内のMFUを一意に区別するための識別子を包含してよい。また、同じMPU内の他のMFUに対する依存性及び優先度情報を提供してもよい。
MMTPペイロードは、ペイロードヘッダ及びペイロードデータを含んでもよい。いくつかのデータタイプは、フラグメント化及びアグリゲーションを可能にしてもよく、その場合、単一のデータユニットが複数の断片に分割され得るか、又はデータユニットのセットが単一のMMTPパケットで配信される場合もある。
近年、仮想現実(VR)及び没入型ビデオ及び3Dグラフィックスなどの新しく出現しつつあるメディアタイプにかなりの関心が集まっている。没入型メディアの高度な表現として近年、高品質の3D点群が出現し、仮想世界との対話及び通信の新たな形態を可能にした。そのような点群を表すために必要な大量の情報は、効率的なコーディングアルゴリズムを必要とし得る。ビデオベースの点群圧縮のための新しい規格が現在開発中であり、ビジュアルボリュメトリックビデオベースコーディング(V3C)のための基礎を形成するであろう。ジオメトリベースの点群圧縮のための規格もまた開発されており、圧縮された静的な点群のためのビットストリームを定義し得る。並行して、V3Cメディア及びジオメトリベースの点群データの搬送を定義する規格も開発中である。
V3Cキャリッジ及び点群規格を取り巻く議論は、V3Cデータ及び点群データの記憶及びシグナリング態様に対処し得るが、そのような議論は、例えば、MPEG-DASH規格に基づくHTTPを介した動的適応ストリーミングのためのシグナリングのみに関係し得るという点において限定されてよい。異なるストリーミング及び配信アプリケーションを可能にするための別の重要な候補規格は、MPEGメディアトランスポート(MMT)である。しかしながら、MMT規格は、現在、V3Cメディアのためのシグナリングメカニズムは提供しない場合がある。したがって、ストリーミングクライアントがV3Cストリーム及びそれらのコンポーネントサブストリームを識別することを可能にする新しいシグナリング要素が望まれる。加えて、V3Cコンポーネントに関連付けられた異なる種類のメタデータをシグナリングして、ストリーミングクライアントが、サポートすることが可能な、あるいは所与の特定のネットワーク制約又は任意の所与の時間におけるユーザのビューポートを配信することができる、V3Cコンテンツ又はそのコンポーネントの最適なバージョン(複数可)を選択することを可能にすることも必要であり得る。
更に、実際の点群アプリケーションは、ネットワーク上で点群データをストリーミングすることを必要とすることが想定される。そのようなアプリケーションは、コンテンツがどのように生成されたかに応じて、点群コンテンツのライブストリーミング又はオンデマンドストリーミングのいずれかを実行してよい。点群を表すために必要とされる大量の情報に起因して、そのようなアプリケーションは、ネットワークの過負荷を回避し、任意の所与の瞬間において、例えば、その瞬間におけるネットワーク容量に関して、最適な視聴体験を提供するために、適応型ストリーミング技法をサポートする必要がある場合がある。点群コンテンツのコンポーネントは、複数のタイルに分割され得る。1つ以上のストリーミングクライアントは、例えば、帯域幅利用可能性に基づいて、(例えば、点群データ全体の代わりに)ジオメトリコンポーネントの特定のタイル部分をストリーミングすることを(例えば単に)望む(例えば、決定又は選択する)場合がある。G-PCCコンポーネントタイルデータは、異なるG-PCCタイルトラックにカプセル化され得る。(例えば、各)タイルトラックは、G-PCCコンポーネントタイルのセット又は全てのG-PCCコンポーネントタイルのセットを表してよい。
現在、MMTは、MPEG G-PCC規格に基づく点群ストリームを含む点群メディアのためのシグナリングメカニズムを提供していない。したがって、ストリーミングクライアントが点群ストリーム及びそれらのコンポーネントサブストリームを識別することを可能にする新しいシグナリング要素を定義することが重要である。ストリーミングクライアントが、サポートすることができる点群又はそのコンポーネントの最適なバージョンを選択することを可能にするために、点群コンポーネントに関連付けられた異なる種類のメタデータをシグナリングすることも必要である。
本明細書で説明される解決策は、MMTストリーミングクライアントが、V3C及びGPCCメディアコンテンツに関連付けられた異なるコンポーネント及びメタデータを識別し、クライアントがストリーミングセッション中の任意の時点でコンテンツサーバから取り出す必要があるメディアデータを選択することを可能にする新しいシグナリング要素を提供し得る。更に、本明細書で説明される解決策は、MMTストリーミングのためのG-PCCデータと、MMTを介したG-PCCデータの配信をサポートするために必要なMMTシグナリングメッセージとのカプセル化のための様々な方法を提供してもよい。
V3CコンテンツのMMT配信が、本明細書で更に説明される。V3Cコンテンツは、ストリーミングプロセス中にMMT送信エンティティを支援し得る。例えば、プレゼンテーション情報は、アプリケーションによる適切な処理を可能にするために、V3Cに準拠するMPUを記述する情報を包含し得る。
プレーヤは、現在の視聴方向、現在のビューポート、及びプレーヤが動作しているデバイスのディスプレイの特性に関する情報を受信してよい。この情報に基づいて、ビュー依存ストリーミングは、ストリーミングセッションにおいて必要とされる帯域幅を低減するために使用され得る。MMTの場合、ビュー依存ストリーミングは、1つ以上の手法によって達成されてよい。
いくつかのクライアントベースのストリーミング手法では、MMT受信エンティティは、現在のビューポート内に含まれる(又は現在のビューポートと交差する)V3Cコンテンツの部分をレンダリングするために必要とされるV3C情報を搬送するアセットのサブセットを選択するようにプレーヤによって命令されてよい。MMTセッション制御手順は、MMT送信エンティティから選択されたセットのアセットを要求するために使用されてよい。プレーヤは、サーバからのV3Cアプリケーション固有シグナリングメッセージを使用して、ビュー依存ストリーミングのために切り替えるべき適切なアセットを選択し得る。
いくつかのサーバベースの手法では、MMT受信エンティティは、MMT送信エンティティに依存して、現在のビューポートをカバーするV3Cコンテンツの部分をレンダリングするためのV3C情報を提供するアセットの正しいサブセットを選択し得る。受信エンティティは、V3Cアプリケーション固有のシグナリングを使用して、現在のビューポートに関する情報を送信エンティティに送信し得る。
V3CコンテナをMMTアセットにマッピングするための方法及び手順が本明細書で説明される。MMTを使用してV3Cコンテンツの配信をサポートするために、マルチトラックISOBMFF V3Cコンテナ内の各トラックは、別個のアセットとしてカプセル化されてよい。したがって、アセットの数は、コンテナ内のトラックの数に等しくてよい。同じV3Cコンポーネントに属するアセットは、アセットグループに論理的にグループ化され得る。これらのアセットグループは、ストリーミングクライアントがどのアセットグループを要求すべきかを決定することを可能にするために、受信エンティティにシグナリングされ得る。V3Cアプリケーション固有のMMTシグナリングが本明細書で説明される。
MMTを使用してV3C符号化されたデータをストリーミングする目的で、いくつかのV3C固有のMMTメッセージが定義される。例えば、V3Cアプリケーション固有シグナリングは、V3CAssetGroupMessageなどのグループメッセージ、V3CSelectionMessageなどの選択メッセージ、又はV3CViewChangeFeedbackMessageなどのビュー変更フィードバックメッセージの送信を含むことができる。いくつかの実施形態では、これらのメッセージは、例えば、送信エンティティがシグナリングをV3Cアプリケーションに関連付けることを可能にし得るユニフォームリソース名(URN)「urn:mpeg:mmt:app:v3c:2020」を有するアプリケーション識別子を含んでよい。
図19は、定義されたアプリケーションメッセージタイプのリストを提供する表である。提案されたMMT V3Cシグナリングでは、アプリケーションメッセージタイプのセットが定義されてよく、セットの各メッセージタイプは、図19に示すように、アプリケーションメッセージ名に関連付けられてよい。V3CAssetGroupMessageを介して、送信エンティティは、サーバにおいて利用可能なアセットのセットについてクライアントに通知し、受信エンティティにストリーミングされているアセットのリストを提供し得る。V3CSelectionMessageでは、クライアントは、アセットのセットが送信エンティティによって受信エンティティにストリーミングされることを要求してよい。V3CViewChangeFeedbackMessageでは、クライアントは、サーバベースのビュー依存ストリーミングセッションにおいて、ユーザの現在の視聴方向及びビューポートの指示をサーバに送信し得る。
MMTを介してV3Cコンテンツを送信する場合、いくつかの実施形態において、V3CAssetGroupMessageは義務的であってもよく、V3Cコンテンツに関連付けられたサーバにおいて利用可能なアセットのリストを受信エンティティに提供してもよい。このメッセージはまた、これらのアセットのうちのどれが受信エンティティに現在ストリーミングされているかについて受信エンティティに通知するために使用され得る。このリストから、受信エンティティ上で動作するクライアントは、V3CSelectionMessageメッセージを使用して、これらのV3Cアセットの一意のサブセットを要求し得る。
MMTを介したV3Cコンテンツのビュー依存配信のために、クライアントは、V3CViewChangeFeedbackMessage messageを使用して、その現在のビューポート情報をサーバに送信してよく、その後、サーバは、そのビューポートに対応するアセットを選択してクライアントに配信し得る。V3CAssetGroupMessageはまた、アセットの選択されたサブセットについてクライアントを更新するために使用され得る。図20は、V3Cアセット記述子の例示的なシンタックス構造を提供する表である。アセット記述子は、受信エンティティ及び消費アプリケーションに、V3Cコンテンツを搬送するアセットのコンテンツについて通知するために使用され得る。V3Cアセット記述子のセマンティクスが、本明細書で提供される。記述子タグ、例えば、「Descriptor_tag」は、記述子のタイプを示し得る。記述子長、例えば「Descriptor_length」は、このフィールドの後の次のバイトから記述子の最後のバイトまでカウントするバイト単位の長さを指定し得る。データタイプ、例えば、「Data_type」は、このアセット中に存在するV3Cデータのタイプを示し得る。このフィールドの値は、図22に更に示され、以下の段落で紹介され、実質的に説明され得る。依存フラグ、例えば、「Dependency_flag」は、V3Cアセットが復号化のために別のV3Cアセット中のデータに依存するかどうかを示し得る。0の値は、このV3Cコンポーネントアセットグループデータが独立して復号化され得ることを示し得る。1の値は、このV3Cアセットが復号化のために他のV3Cアセットデータに依存することを示し得る。代替グループフラグ、例えば、「Alternate_group_flag」は、このV3Cアセットが代替バージョンを有するかどうかを示し得る。0の値は、このV3Cコンポーネントアセットがいかなる代替アセットも持たないことを示し得る。1の値は、このV3Cアセットが1つ以上の代替を有することを示し得る。代替グループID、例えば、「Alternate_group_id」は、代替アセットのグループを識別するIDを示し得る。同じV3Cアセットの異なる符号化されたバージョンは、このフィールドに対して同じ値を有し得る。依存アセットID、例えば、「Dep_asset_id」は、このアセットの復号化が依存するアセットIDの値を示し得る。場合によっては、この値は、dependency_flagが1に設定されているときのみ存在し得る。例えば、V3Cビデオコンポーネントアセットは、このフィールドのための対応するV3CアトラスコンポーネントアセットIDを使用し得る。「Num_tiles」は、このアセットで搬送されるタイルの数を示し得る。「tile_id」は、特定のアトラスタイルの一意の識別子を示し得る。
図21は、V3CAssetGroupMessageの例示的なシンタックスの例を示す表である。図21の表と一致して、V3CAssetGroupMessageのセマンティクスは、以下のように説明され得る。「Message_id」は、V3Cアプリケーションメッセージの識別子を示し得る。「Version」は、V3Cアプリケーションメッセージのバージョンを示し得る。「長さ」は、次のフィールドの開始からメッセージの最後のバイトまでカウントする、V3Cアプリケーションメッセージの長さをバイト単位で示し得る。このフィールドの値は0に等しくなくてもよい。アプリケーション識別子、例えば、「Application_identifier」は、このメッセージのコンテンツを消費するアプリケーションを一意に識別するURNとしてアプリケーション識別子を示し得る。「App_message_type」は、図19に関して実質的に上記で説明したように、アプリケーション固有のメッセージタイプを示し得る。「Num_V3C_asset_groups」は、V3Cアセットグループの数を示してよく、各グループは、V3Cコンポーネントに関連付けられたアセットを包含する。「asset_group_id」は、V3Cコンポーネントと関連付けられたアセットグループの識別子を示し得る。「Num_assets」は、V3Cコンポーネントに関連付けられたアセットグループ内のアセットの数を示す。「Start_time」は、このメッセージにリストされたアセットの状態が適用可能なV3Cコンポーネントのプレゼンテーション時間を示し得る。「Data_type」は、このアセットグループに存在するV3Cデータのタイプを示し得る。このフィールドの値の例は、図22の文脈で説明され、以下の段落で紹介され、実質的に説明され得る。「Pending_flag」は、全てのデータコンポーネントがアセットグループのレンダリングの準備ができているかどうかを示し得る。例えば、「1」に設定されると、データが準備完了であることを示してもよく、そうでない場合、フラグは「0」であってもよい。「asset_id」は、アセットのアセット識別子を提供し得る。「state_flag」は、アセットの配信状態を示し得る。1(「1」)に設定されるとき、これは、送信エンティティが受信エンティティにアセットをアクティブに送信していることを示し得る。0(「0」)に設定されると、これは、送信エンティティがアセットを受信エンティティにアクティブに送信していないことを示し得る。「Sending_time_flag」は、アセットストリームの最初のMPUを含む最初のMMTPパケットに対する「sending_time」の存在を示し得る。デフォルト値は「0」であってもよい。「alternate_group_flag」は、このV3Cコンポーネントアセットが代替バージョンを有するか否かを示し得る。0の値は、このV3Cアセットがいかなる代替アセットも持たないことを示し得る。1の値は、このV3Cアセットが代替アセットを有することを示し得る。依存フラグ、例えば、「Dependency_flag」は、このV3Cコンポーネントアセットが復号化のために他のV3Cアセット中のデータに依存するかどうかを示し得る。0の値は、このV3Cコンポーネントアセットグループデータが独立して復号化され得ることを示し得る。1の値は、このV3Cアセットが復号化のために他のV3Cアセットデータに依存することを示し得る。送信時間、例えば「Sending_time」は、アセットストリームの最初のMPUを包含する最初のMMTPパケットに対する送信時間を示し得る。この情報を使用して、クライアントは、新しいアセットストリームのための新しいパケット処理パイプラインを準備してよい。「alternate_group_id」は、代替V3Cコンポーネントアセットの識別子を示し得る。同じV3Cアセットの異なる符号化されたバージョンは、このフィールドに対して同じ値を有し得る。「Dep_asset_group_id」は、このアセットの復号化が依存するアセットのためのIDを示し得る。場合によっては、この値は、例えばdependency_flagが1に設定されているときのみ存在し得る。例えば、V3C属性コンポーネントアセットは、このフィールドに対応するV3CアトラスコンポーネントアセットIDを使用し得る。「all_tiles_present_flag」は、アトラスコンポーネントの全てのタイルがアセットの一部であるか否かを示し得る。1の値は、全てのアトラスタイルについてのデータがアセットにおいて利用可能であることを示し得る。0の値は、アトラスタイルのサブセットについてのデータがアセット内で利用可能であることを示し得る。「Num_tiles」は、このアセットで搬送されるタイルの数を示し得る。「tile_id」は、特定のアトラスタイルの一意の識別子を提供してよい。
図22は、Data_typeフィールドにおいて使用され得るような例示的なV3Cデータタイプ値を例示する表である。図22に示されているように、Data_typeフィールドの値は、全てのV3Cコンポーネントデータ、アトラスコンポーネントデータ、占有コンポーネントデータ、ジオメトリコンポーネントデータ、属性コンポーネントデータ、コーデック初期化データ、動的ボリュメトリック時限メタデータ情報、又はビューポート時限メタデータ情報を示し得る。
図23は、V3CSelectionMessageの例示的なシンタックスを示す表である。図23の表と一致して、V3CSelectionMessageのセマンティクスは、以下のように説明され得る。「Message_id」は、V3Cアプリケーションメッセージの識別子を示し得る。「Version」は、V3Cアプリケーションメッセージのバージョンを示し得る。「長さ」は、V3Cアプリケーションメッセージの長さをバイト単位で示すことができ、例えば、次のフィールドの先頭からメッセージの最後のバイトまでカウントする。このフィールドの値は0に等しくなくてもよい。「Application_identifier」は、このメッセージのコンテンツを消費するアプリケーションを一意に識別するURNとしてアプリケーション識別子を示し得る。「App_message_type」は、図19に関して上記の段落で実質的に上記で説明したように、アプリケーション固有のメッセージタイプを示し得る。「Num_selected_asset_groups」は、受信エンティティによる関連付けられた状態変更要求があるアセットグループの数を示し得る。「asset_group_id」は、V3Cコンテンツと関連付けられたアセットグループの識別子を示し得る。「switching_mode」は、受信エンティティによって要求されるアセットの選択のために使用されるスイッチングモードを示し得る。「switching_mode」の値のリストは、例えば、図23を紹介し、説明する以下の段落と一致して定義され得る。「Num_assets」は、指定されたスイッチングモードによる状態変更のためにシグナリングされるアセットの数を示し得る。「Asset_id」は、指定されたスイッチングモードによる状態変更のためのアセットの識別子を示し得る。
図24は、switching_modeフィールドの定義を提供する表である。図24に示すように、「switching_mode」フィールドは、アセットの選択のために使用されるスイッチングモードを示し得る。例えば、スイッチングモードがリフレッシュに設定される場合、V3CSelectionMessageにリストされた各アセットに対して、各アセットのState_flagは「1」に設定され、V3CSelectionMessageにリストされていない全てのアセットのState_flagは「0」に設定される。スイッチングモードがトグルするように設定される場合、V3CSelectionMessageにリストされた各アセットについて、各アセットのState_flagは、例えば、元々「0」であれば「1」に、元々「1」であれば「0」に変更されるが、V3CSelectionMessageにリストされていない全てのアセットのState_flagは変更されない。スイッチングモードが、V3CSelectionMessageで指定されたアセットグループの全てのアセットに対して、全てを送信するように設定される場合、各アセットのState_flagは、「1」に設定される。
図25は、V3CViewChangeFeedbackMessageの例示的なシンタックスを示す表である。図25の表と一致して、V3CViewChangeFeedbackMessageのセマンティクスは、以下のように説明されてよい。「Message_id」は、V3Cアプリケーションメッセージの識別子を示し得る。「Version」は、V3Cアプリケーションメッセージのバージョンを示し得る。「長さ」は、次のフィールドの開始からメッセージの最後のバイトまでカウントする、V3Cアプリケーションメッセージの長さをバイト単位で示し得る。このフィールドの値は0に等しくないものとする。「Application_identifier」は、このメッセージのコンテンツを消費するアプリケーションを一意に識別するURNとしてアプリケーション識別子を示し得る。「App_message_type」は、図19に関して上記の段落で実質的に上記で説明したように、アプリケーション固有のメッセージタイプを示し得る。「Vp_pos_x」、「vp_pos_y」、及び「vp_pos_z」は、それぞれ、グローバル基準座標系におけるビューポートの位置のx、y及びz座標をメートル単位で示し得る。値は、例えば、2-16メートルの単位で提供され得る。「Vp_quat_x」、「vp_quat_y」、及び「vp_quat_z」は、それぞれ、四元数表現を使用したビューポート領域の回転のx、y、及びz成分を示し得る。座標の値は、両端値を含む-1から1の範囲内の浮動小数点値であり得る。これらの値は、四元数表現を使用して、グローバル座標軸をカメラのローカル座標軸に変換するために適用される回転のx、y、及びz成分、すなわちqX、qY、及びqZを指定し得る。四元数qWの第4の成分は、式1に従って、生成されてよく、
「clipping_near_plane」及び「clipping_far_plane」は、ビューポートの近距離及び遠距離クリッピング平面に基づく近距離及び遠距離深度(又は距離)をメートル単位で示し得る。「Horizontal_fov」は、例えば、ラジアン単位で、ビューポート領域の水平サイズに対応する経度範囲を指定してよい。この値は、0~2πの範囲内であってもよい。「vertical_fov」は、ビューポート領域の垂直サイズに対応する緯度範囲を、例えばラジアンの単位で指定してよい。この値は、0~πの範囲内であってもよい。
ストリーミングクライアント挙動に関する方法及び装置が、本明細書で説明される。MMTクライアントは、アプリケーション固有シグナリングメッセージで提供される情報によってガイドされてもよい。以下は、本明細書で提示されるMMTシグナリングを使用してV3Cコンテンツをストリーミングするためのクライアント挙動の例である。
いくつかの方法では、MMT送信エンティティは、関心のあるクライアントに「V3CAssetGroupMessage」アプリケーションメッセージを送信してよい。受信クライアントは、「V3CAssetGroupMessage」アプリケーションメッセージを構文解析し、MMTコンテンツ送信エンティティに存在するV3Cメディアアセットを識別し得る。利用可能なV3Cメディアコンテンツを識別するために、ストリーミングクライアントは、「urn:mpeg:mmt:app:v3c:2020」」に設定された「V3CAssetGroupMessage」アプリケーションメッセージ内の「application_identifier」フィールドをチェックし得る。V3Cコンテンツにおいて利用可能なV3Cアセットの全部又は一部は、「V3CAssetGroupMessage」アプリケーションメッセージにおいてシグナリングされたアセットIDをチェックすることによって識別され得る。クライアントは、ユーザの現在のビューポートに基づいてストリーミングされる必要なアセットを選んでよい。MMTクライアントは、「V3CSelectionMessage」アプリケーションメッセージを送信エンティティに送信し、利用可能なV3Cアセットのリストから関心のあるV3Cアセットを要求してよい。MMT送信エンティティは、MTPでMMTPパケットを形成し、MTTPパケットをクライアントに送信してよい。
いくつかの方法において、MMTクライアントは、MMTPパケットを受信し、MPU又はMFUをデパケット化してよい。MPU/MFUは、時限ディアコンテンツを又は非時限V3Cメディアコンテンツを包含してよい。MMTクライアントが、アセットグループ「data_type」が「0x05」に設定されたMMTPパケットを受信する場合、このV3Cアセットデータは、VPS、ASPS、AAPS、AFPS及びSEIメッセージなどの初期化情報を表す。MMTクライアントが、アセットグループ「data_type」が「0x06」に設定されたMMTPパケットを受信する場合、このV3Cアセットデータは、3D空間領域時限メタデータ情報を表してよい。このアセット内の情報は、V3Cコンテンツの部分的アクセスのために使用され得る。MMTクライアントが、アセットグループ「data_type」が「0x07」に設定されたMMTPパケットを受信する場合、このV3Cアセットデータは、初期又は推奨されたビューポート情報を示し得る。この情報を使用して、異なる基準に基づく自動的なビューポートの変更を可能にすることができる。MMTクライアントは、例えば、ユーザのビューポート又は推奨されたビューポート及び対応する1つ以上の3D空間領域に基づいて、必要なV3Cアセットを選択してよい。MMTクライアントは、対象のV3Cアセットを要求する送信エンティティに「V3CSelectionMessage」アプリケーションメッセージを送信してよい。
いくつかの方法では、ユーザのビューポートがクライアントベースのストリーミング手法において変化するとき、MMTクライアントは、「V3CSelectionMessage」アプリケーションメッセージを使用してV3Cアセットの異なるセットを要求してもよい。ユーザのビューポートがサーバベースのストリーミング手法において変化するとき、MMTクライアントは、「V3CViewChangeFeedbackMessage」メッセージを送信エンティティに送信して、ユーザの現在のビューポートをシグナリングしてよい。このメッセージを受信すると、MMT送信エンティティは、ユーザの新しいビューポート情報に基づいてV3Cアセットの新しいセットを選択し、「V3CAssetGroupMessage」アプリケーションメッセージを対応するV3Cアセットと共にMMTクライアントに送信する。MMT送信エンティティは、V3CアセットデータをMMTPパケットとしてストリーミングしてよい。MMTクライアントは、全ての要求されたV3Cアセットに対するMMTPパケットの受信を開始し、MMTPペイロードからMPU及びMFUを抽出してよい。MPU及びMFUは、メディアサンプルを直接包含してもよい、又はメディアセグメントを包含する場合もある。MMTクライアントは、メディアセグメントコンテナ(例えば、ISOBMFF)の構文解析を開始して、エレメンタリストリーム情報を抽出し、V3C規格に従ってV3Cビットストリームを構造化してよい。ビットストリームは、V3Cデコーダに渡されてよい。MMTPペイロードがV3Cメディアサンプルを包含する場合、エレメンタリストリームデータが抽出され、V3Cビットストリーム規格に従って構造化される。ビットストリームは、V3Cデコーダに渡されてよい。
MMTにおけるG-PCCデータのカプセル化及びシグナリングを対象とする実施形態が本明細書に記載される。従来のメディアコンテンツとは異なり、G-PCCメディアコンテンツは、ジオメトリ及び属性などの多数のコンポーネントを含み得る。各コンポーネントは、G-PCCビットストリームのサブストリームとして別々に符号化され得る。ジオメトリ及び属性などのコンポーネントは、例えば、G-GPCCエンコーダを使用して符号化され得る。しかしながら、これらのサブストリームは、点群をレンダリングするために追加のメタデータと共にまとめて復号化される必要があり得る。
G-PCC符号化されたコンテンツは、MMTを使用してネットワークを介して配信されてよい。ISOBMFF内のG-PCCコンポーネントが複数のトラックを使用してシグナリングされるとき、各トラックは、別個のアセットにカプセル化されるように提案されてもよく、次いで、別個のアセットは、通常の方法でMMTPパケットにパケット化されてもよい。サーバ及びクライアントが特定のG-PCCコンポーネントに対して複数のアセットのグループを識別できるようにするために、G-PCC定義のアプリケーションメッセージも提案される。
G-PCCメディアコンテンツは、ジオメトリ及び属性など、1つ以上の(例えば、複数の)コンポーネントを含み得る。(例えば各)コンポーネントは、G-PCCビットストリームのサブストリームとして別々に符号化され得る。ジオメトリ及び属性などのコンポーネントは、例えば、G-GPCCエンコーダを使用して符号化され得る。サブストリームは、例えば点群をレンダリングするために、追加のメタデータと共にまとめて復号化されてもよい。
G-PCCデータは、MMTにおいてカプセル化及びシグナリングされ得る。G-PCC符号化されたコンテンツは、MMTを使用してネットワークを介して配信されてよい。G-PCCデータは、(例えば、本明細書で説明するような)様々なカプセル化方法を使用して、MMTストリーミングのためにカプセル化され得る。MMTシグナリングメッセージは、MMTを介したG-PCCデータの配信をサポートしてよい(例えば、生成及び送信され得る)。
ISOBMFF内のG-PCCコンポーネントは、複数のトラックを使用してシグナリングされ得る。(例えば、複数のトラックのうちの)(例えば、各)トラックは、別個のアセットにカプセル化されてもよく、別個のアセットは、(例えば、次いで)MMTPパケットにパケット化されてもよい。G-PCC定義されたアプリケーションメッセージは、例えば、サーバ及びクライアントが、特定のG-PCCコンポーネントへの、又は特定のG-PCCコンポーネントのための複数のアセットのグループを識別するために、(例えば、これもまた)構成/展開されてもよい。
いくつかの例では(例えば、MMTを使用してG-PCCコンテンツの配信をサポートするために)、マルチトラックISOBMFF G-PCCコンテナ内の(例えば、各)トラックは、別個のアセットにカプセル化され得る。アセットの数は、マルチトラックISOBMFF G-PCCコンテナ内のトラックの数に等しくなり得る。いくつかの例では、(例えば、単一の)G-PCCコンポーネントに対応する複数のアセットは、グループ化され、メッセージ(例えば、「GPCCAssetGroupMessage」アプリケーションメッセージ)中でアセットグループとしてシグナリングされ得る。代替コンポーネントトラックは、例えば、(例えば、MMTPパケット内のISOBMFFファイルを最初に構文解析することなく)サーバ及びクライアント選択決定を(例えば、効率的に)可能にするために、(例えば、「GPCCAssetGroupMessage」メッセージを使用して)メッセージ内で公開されてもよい。
MMTは、アプリケーション固有シグナリングメッセージを定義してよく、これは、アプリケーション固有情報の配信をサポート(例えば、許容)してよい。G-PCC固有のシグナリングメッセージは、MMTを使用してG-PCC符号化されたデータをストリーミングするように定義(例えば、構成)されてよい。G-PCC固有のシグナリングメッセージは、ユニフォームリソース名(URN)値(例えば、「urn:mpeg:mmt:app:gpcc:2020」)」というURN値)を有するアプリケーション識別子を有し得る。
図26は、G-PCCアセット記述子の例示的なシンタックス構造を提供する表である。アセット記述子は、受信エンティティ及び消費アプリケーションに、G-PCCコンテンツを搬送するアセットのコンテンツについて通知するために使用され得る。G-PCCアセット記述子のセマンティクスが、本明細書で提供される。「descriptor_tag」は、記述子のタイプを示し得る。「Descriptor_length」は、このフィールドの後の次のバイトから記述子の最後のバイトまでカウントするバイト単位の長さを指定し得る。「Data_type」は、このアセットグループに存在するG-PCCデータのタイプを示し得る。このフィールドの値は、図29に更に示され、以下の段落で紹介され、実質的に説明され得る。「Dependency_flag」は、G-PCCアセットが復号化のために別のG-PCCアセット内のデータに依存するかどうかを示し得る。0の値は、このG-PCCコンポーネントアセットグループデータが独立して復号化され得ることを示し得る。1の値は、このG-PCCアセットが復号化のために他のG-PCCアセットデータに依存することを示し得る。「alternate_group_flag」は、このG-PCCアセットが代替バージョンを有するか否かを示し得る。0の値は、このG-PCCコンポーネントアセットがいかなる代替アセットも持たないことを示し得る。1の値は、このG-PCCアセットが1つ以上の代替を有することを示し得る。「alternate_group_id」は、代替アセットのグループを識別するIDを示し得る。同じG-PCCアセットの異なる符号化されたバージョンは、このフィールドに対して同じ値を有し得る。「Dep_asset_id」は、このアセットの復号化が依存するアセットIDの値を示し得る。場合によっては、この値は、dependency_flagが1に設定されているときのみ存在し得る。例えば、G-PCC属性コンポーネントアセットは、このフィールドのための対応するG-PCCジオメトリコンポーネントアセットIDを使用してもよい。「Num_tiles」は、このアセットで搬送されるタイルの数を示し得る。tile_idは、タイルインベントリ内の特定のタイルの一意の識別子を示す。dynamic_tile_id_flagが値0に設定されているとき、tile_idは、タイルインベントリ内に存在するタイルid値のうちの1つを表してよい。
MMT G-PCCシグナリングは、例えば、GPCCAssetGroupMessageのようなグループメッセージ、GPCCSelectionMessageFeedbackのような選択フィードバックメッセージ、及び/又はGPCCViewChangeFeedbackのような変更ビューフィードバックメッセージなどの(例えば、定義された)アプリケーションメッセージタイプのセットのうちの1つ以上を含んでよい。
図27は、定義されたG-PCCアプリケーションメッセージタイプの例を例示する表である。図27に示すように、アプリケーションメッセージタイプは、メッセージがGPCCAssetGroupMessage、GPCCSelectionMessageFeedbackメッセージ、又はGPCCViewChangeFeedbackメッセージであることを示し得る。GPCCAssetGroupMessageメッセージタイプの例では、送信エンティティは、サーバにおいて利用可能なアセットのセット、及び/又は受信エンティティにストリーミングされ得る(例えば、ストリーミングされている)アセットのリストについてクライアントに通知するために、グループメッセージ(例えば、GPCCAssetGroupMessageメッセージ)を送信し得る。選択フィードバックメッセージタイプ(例えば、GPCCSelectionMessageFeedbackメッセージタイプ)の一例では、クライアントは、選択フィードバックメッセージを使用して、アセットのセットが送信エンティティによって受信エンティティにストリーミングされることを要求してよい。変更ビューフィードバックメッセージ(例えば、GPCCViewChangeFeedbackメッセージ)の例では、クライアントは、ビュー変更フィードバックメッセージを使用して、ユーザの現在の視聴空間の指示をサーバに送信してよい。
グループメッセージ(例えば、GPCCAssetGroupMessageメッセージ)は、MMTを介してG-PCC符号化されたコンテンツを送信するために使用され得る。グループメッセージ(例えば、GPCCAssetGroupMessageメッセージ)は、サーバにおいて利用可能なG-PCCデータタイプアセットのリストをクライアントに提供してもよい、及び/又はアセットのうちのどれが受信エンティティにストリーミングされ得るか(例えば、現在ストリーミングされているか)についてクライアントに通知してもよい。クライアントは、G-PCCデータタイプアセットの一意のサブセットを(例えば、リストから)要求してよい。要求は、例えば、GPCCSelectionFeedbackメッセージを使用して行われてもよい。
クライアントは、(例えば、MMTを介したG-PCCコンテンツのビュー依存配信のために)GPCCViewChangeFeedbackメッセージを使用して、例えば、現在の視聴空間(例えば、錐台)情報をサーバに送信してもよい。サーバは、視聴空間に対応するアセットを選択し、クライアントに配信してよい。GPCCAssetGroupMessageは(例えば、また)更新され、クライアントに送信されてよい。表4は、定義されたG-PCCアプリケーションメッセージタイプの例を提供する。
図28は、GPCCAssetGroupMessageなどのグループメッセージの例示的なシンタックスを例示する表である。図28の表と一致して、GPCCAssetGroupMessageのセマンティクスは以下の通りであり得る。「Message_id」は、G-PCCアプリケーションメッセージの識別子を示し得る。「バージョン」は、G-PCCアプリケーションメッセージのバージョンを示し得る。「長さ」は、G-PCCアプリケーションメッセージの長さ(例えば、次のフィールドの先頭からメッセージの最後のバイトまでカウントするバイト単位)を示し得る。長さフィールドの値は、0(0)に等しくなくてもよい。アプリケーション識別子(例えば、「application_identifier」)は、例えば、メッセージのコンテンツを消費する、アプリケーションのタイプを(例えば、一意に)識別するURNとして、アプリケーション識別子を示し得る。アプリケーションメッセージタイプ(例えば、「app_message_type」)は、(例えば、表4中の例によって与えられるような)アプリケーション固有メッセージタイプを定義し得る。アプリケーションメッセージタイプフィールドの長さは、例えば、8ビットであってもよい。G-PCCアセットグループの数(例えば、「num_gpcc_asset_groups」)は、G-PCCアセットグループの数を示し得る。(例えば、各)アセットグループは、G-PCCコンポーネントに関連付けられたアセットを含んでよい。アセットグループ識別子(例えば、「asset_group_id」)は、G-PCCコンポーネントに関連付けられたアセットグループの識別子を示し得る。アセットの数(例えば、「num_assets」)は、G-PCCコンポーネントに関連付けられたアセットグループ内のアセットの数を示し得る。開始時間(例えば、「start_time」)は、メッセージ中にリストされたアセットの状態が適用可能であり得るG-PCCコンポーネントの提示時間を示し得る。データタイプ(例えば、「data_type」)は、図29に関して以下の段落で更に説明される、アセットグループ内に存在するG-PCC点群データのタイプを示し得る。保留フラグ(例えば、「pending_flag」)は、例えば、(例えば、全ての)データコンポーネントが、アセットグループのためにレンダリングする準備ができているかどうかを示し得る。「1」に設定された保留フラグは、データが準備完了であることを示し得る。0(「0」)に設定された保留フラグは、データの準備ができていないことを示し得る。依存フラグ(例えば、「dependency_flag」)は、G-PCCコンポーネントアセットグループが復号化のために他のG-PCCコンポーネントアセットグループデータに依存するかどうかを示し得る。0(「0」)の値は、G-PCCコンポーネントアセットグループデータが独立して復号化され得ることを示し得る。1(「1」)の値は、G-PCCコンポーネントアセットグループが復号化のために他のG-PCCコンポーネントアセットグループデータに依存することを示し得る。依存アセットグループID(例えば、「dep_asset_group_id」)は、アセットグループコンテンツ復号化が依存するアセットグループIDの値を示し得る。値は、例えば、dependency_flagが1に設定される場合/ときに(例えば、そのような場合のみ)存在し得る。例えば、G-PCC属性コンポーネントアセットグループは、依存アセットグループIDフィールドのために対応するG-PCCジオメトリコンポーネントアセットグループIDを使用してよい。アセットID(例えば、「asset_id」)は、アセットのアセット識別子を提供し得る。代替アセットグループフラグ(例えば、「alternate_asset_group_flag」)は、G-PCCコンポーネントアセットが代替バージョンを有するかどうかを示し得る。0(「0」)の値は、G-PCCコンポーネントアセットが代替バージョンを持たないことを示し得る。1(「1」)の値は、G-PCCコンポーネントアセットが代替バージョンを有することを示し得る。代替グループフラグフィールドの値は、例えば、同じG-PCCコンポーネント及び/又はアセットの異なる符号化バージョンがビットストリーム中で利用可能である場合/とき、1(「1」)に設定され得る。代替グループフラグフィールドの値は、例えば、同じG-PCCコンポーネント及び/又はアセットの異なる符号化されたバージョンがビットストリーム中で利用可能でない場合/とき、0(「0」)に設定され得る。代替アセットグループID(例えば、「alternate_asset_group_id」)は、代替G-PCCコンポーネントアセットの値(例えば、一意の値)を示し得る。G-PCCコンポーネント又はアセットの異なる符号化されたバージョンは、代替アセットグループIDフィールドについて同じ値を表してよい。状態フラグ(例えば、「state_flag」)は、アセットの配信状態を示し得る。1(「1」)に設定された状態フラグは、送信エンティティが受信エンティティにアセットをアクティブに送信していることを示し得る。0(「0」)に設定された状態フラグは、送信エンティティが受信エンティティにアセットをアクティブに送信していないことを示し得る。送信時間フラグ(例えば、「sending_time_flag」)は、アセットストリームの最初のMPUを含む最初のMMTPパケットに対する送信時間(例えば、sending_time)の存在を示し得る。デフォルト値は、例えば、0(「0」)であってもよい。送信時間(例えば、「sending_time」)は、アセットストリームの最初のMPUを含む最初のMMTPパケットの送信時間を示し得る。クライアントは、(例えば、送信時間情報を使用して)新しいアセットストリームのための新しいパケット処理パイプラインを準備してよい。動的タイルフラグ(例えば、「dynamic_tile_flag」)は、タイル及び/又はタイル識別子の数がアセット内で動的に変化し得るかどうかを示し得る。0(「0」)の値は、アセット中のタイルの数及びタイル識別子がビットストリーム全体にわたって変化しないこと、並びに/又はタイルの数(例えば、「num_tiles」)及びタイルID(例えば、「tile_id」)がシグナリングされることを示し得る。1(「1」)の値は、タイルの数を示してよく、タイル識別子はアセット内で変化する場合がある。1(「1」)の値は、タイルトラック中に存在するタイルIDがビットストリーム中で時間と共に動的に変化していることを示し得る。タイルの数(例えば、「num_tiles」)は、アセット内で搬送されるタイルの数を示し得る。タイルID(例えば、「tile_id」)は、タイルインベントリ内の特定のタイルに関する(例えば、一意の)識別子を示し得る。タイルID(例えば、「tile_id」)は、例えば、動的タイルフラグ(例えば、「dynamic_tile_flag」)が0(「0」)の値に設定される場合/ときに、タイルインベントリ内に存在するタイルid値(例えば、タイルid値のうちの1つ)を表してよい。
図29は、Data_typeフィールド中で使用され得る例示的なG-PCCデータタイプ値を示す表である。図24に示されているように、Data_typeフィールドの値は、全てのG-PCCコンポーネントデータ、ジオメトリデータ、属性データ、SPS、GPS、APS、及びタイルインベントリデータ、又は3D空間領域時限メタデータ情報を示してよい。
図30は、GPCC選択フィードバックメッセージ(例えば、「GPCCSelectionFeedback」)の例示的なシンタックスを示す表である。図30の表と一致して、GPCCSelectionFeedbackメッセージのセマンティクスは、以下の通りであり得る。メッセージID(例えば、「message_id」)は、G-PCCアプリケーションメッセージの識別子を示し得る。バージョン(例えば、「version」)は、G-PCCアプリケーションメッセージのバージョンを示し得る。長さ(例えば、「length」)は、G-PCCアプリケーションメッセージの長さ(例えば、次のフィールドの先頭からメッセージの最後のバイトまでカウントするバイト単位)を示し得る。長さフィールドの値は0に等しくなくてもよい。アプリケーション識別子(例えば、「application_identifier」)は、例えば、メッセージのコンテンツを消費する、アプリケーションのタイプを(例えば、一意に)識別するURNとして、アプリケーション識別子を示し得る。アプリケーションメッセージタイプ(例えば、「app_message_type」)は、(例えば、図27に関して上記の段落で実質的に説明された)アプリケーション固有のメッセージタイプを定義し得る。アプリケーションメッセージタイプフィールドの長さは、例えば、8ビットであってもよい。選択されたアセットグループの数(例えば、「num_selected_asset_groups」)は、受信エンティティによる関連付けられた状態変更要求が存在するアセットグループの数を示し得る。アセットグループID(例えば、「asset_group_id」)は、G-PCCコンテンツに関連付けられたアセットグループの識別子を示し得る。スイッチングモード(例えば、「switching_mode」)は、(例えば、受信エンティティによって要求されるような)アセットの選択のために使用されるスイッチングモードを示し得る。アセットの数(例えば、「num_assets」)は、(例えば、指定されたスイッチングモードに従って)状態変化のためにシグナリングされたアセットの数を示し得る。アセットID(例えば、「asset_id」)は、(例えば、指定されたスイッチングモードに従って)状態変化のためのアセットの識別子を示し得る。
図31は、switching_modeフィールドの定義を示す表である。図31に示すように、「switching_mode」フィールドは、アセットの選択のために使用されるスイッチングモードを示し得る。例えば、スイッチングモードがリフレッシュに設定されている場合、GPCCSelectionMessageFeedbackにリストされている各アセットについて、各アセットのState_flagは「1」に設定され、GPCCSelectionMessageFeedback willにリストされていない全てのアセットのState_flagは「0」に設定される。スイッチングモードがトグルするように設定される場合、GPCCSelectionMessageFeedbackにリストされた各アセットについて、各アセットのState_flagは、例えば、元々「0」であれば「1」に、元々「1」であれば「0」に変更されるが、GPCCSelectionMessageFeedbackにリストされていない全てのアセットのState_flagは変更されない。スイッチングモードが、GPCCSelectionMessageFeedbackで指定されたアセットグループの全てのアセットに対して、全てを送信するように設定される場合、各アセットのState_flagは、「1」に設定される。
図32は、G-PCCビュー変更フィードバックメッセージ(例えば、「GPCCViewChangeFeedback」)の例示的なシンタックスを示す表である。図32の表と一致して、GPCCViewChangeFeedbackメッセージのセマンティクスは、以下の通りであり得る。メッセージID(例えば、「message_id」)は、G-PCCアプリケーションメッセージの識別子を示し得る。バージョンは、G-PCCアプリケーションメッセージのバージョンを示し得る。長さは、G-PCCアプリケーションメッセージの長さを(例えば、次のフィールドの先頭からメッセージの最後のバイトまでカウントするバイト単位で)示し得る。長さフィールドの値は0に等しくなくてもよい。アプリケーション識別子(例えば、「application_identifier」)は、例えば、メッセージのコンテンツを消費する、アプリケーションのタイプを(例えば、一意に)識別するURNとして、アプリケーション識別子を示し得る。アプリケーションメッセージタイプ(例えば、「app_message_type」)は、(例えば、表4中の例によって与えられるような)アプリケーション固有メッセージタイプを定義し得る。アプリケーションメッセージタイプフィールドの長さは、例えば、8ビットであってもよい。ビューポート位置座標(例えば、vp_pos_x、vp_pos_y、vp_pos_z)は、グローバル基準座標系におけるビューポートの位置のx座標、y座標、及びz座標をメートル単位で示し得る。値は、例えば、2-16メートルの単位であってもよい。ビューポート回転(例えば、vp_quat_x、vp_quat_y、vp_quat_z)は、ビューポート領域の回転のx、y、及びz成分を(例えば、四元数表現を使用して)示し得る。値は、例えば、両端値を含む-1から1の範囲内の浮動小数点値であり得る。値は、グローバル座標軸をカメラ(例えば、四元数表現を使用する)のローカル座標軸に変換するために適用される回転のx、y、及びz成分(例えば、qX、qY及びqZ)を指定し得る。四元数qWの第4の成分は、例えば、上記の段落に実質的に記載されている式1に従って計算されてよい。点(w、x、y、z)は、これもまた上記の段落に実質的に記載されている式2に従って決定された角度だけ、ベクトル(x、y、z)によって方向付けられた軸の周りの回転を表してよい。
近平面(例えば、clipping_near_plane)でのクリッピング及び遠平面(例えば、clipping_far_plane)でのクリッピングは、例えば、ビューポートの近クリッピング平面及び遠クリッピング平面(例えば、メートル単位)に基づいて、近深度及び遠深度又は距離を示してよい。
水平視野(FOV)(例えば、horizontal_fov)は、ビューポート領域の水平サイズに対応する経度範囲を(例えば、ラジアン単位で)指定してよい。この値は、0~2πの範囲内であってもよい。
垂直FOV(例えば、vertical_fov)は、ビューポート領域の垂直サイズに対応する緯度範囲を(例えば、ラジアン単位で)指定してよい。この値は、0~πの範囲内であってもよい。
ストリーミングクライアント挙動が提供され得る(例えば、定義又は構成され得る)。MMTクライアントは、例えば、アプリケーション固有シグナリングメッセージにおいて提供される情報によってガイドされてもよい。クライアント挙動の例は、(例えば、本明細書で開示されるMMTシグナリングの例を使用して)ジオメトリベースの点群圧縮コンテンツをストリーミングするために提供される。
MMT送信エンティティは、関心のあるクライアントに「GPCCAssetGroupMessage」アプリケーションメッセージを送信してよい。受信クライアントは、「GPCCAssetGroupMessage」アプリケーションメッセージを構文解析し、MMTコンテンツ送信エンティティに存在するG-PCCメディアアセットを識別してよい。ストリーミングクライアントは、「GPCCAssetGroupMessage」アプリケーションメッセージ内の「application_identifier」フィールド(例えば、「urn:mpeg:mmt:app:gpcc:2020”)」に設定される)をチェックして、例えば、利用可能なG-PCCメディアコンテンツを識別してもよい。G-PCC点群コンテンツ内で利用可能なG-PCCアセット(例えば、全てのG-PCCアセット)は、例えば、「GPCCAssetGroupMessage」アプリケーションメッセージ内に存在するasset_idをチェックすることによって識別されてもよい。クライアントは、例えば、ユーザの現在のビューポートに基づいて、ストリーミングされるべきasset_idを選んでもよい(例えば、選択してもよい)。MMTクライアントは、利用可能なG-PCCアセットのリストから関心のあるG-PCCアセットを要求する「GPCCSelectionFeedback」アプリケーションメッセージを送信エンティティに送信してよい。MMT送信エンティティは、MTPでMMTPパケットを形成してよい。MMT送信エンティティは、MTTPパケットをクライアントに送信してよい。MMTクライアントは、MMTPパケットを受信してよい。MMTクライアントは、MPU又はMFUをデパケット化してよい。MPU/MFUは、時限又は非時限G-PCCメディアコンテンツを含んでもよい。
G-PCCアセットデータは、例えば、MMTクライアントがアセットグループ「data_type」が「3」に設定されたMMTPパケットを受信する場合、初期化情報(例えば、SPS、GPS、APS、及び/又はタイルインベントリ)を表してよい。G-PCCアセットデータは、例えば、MMTクライアントがアセットグループ「data_type」が「4」に設定されたMMTPパケットを受信する場合、3D空間領域時限メタデータ情報を表してよい。G-PCCアセット情報は、G-PCCデータの部分アクセスのために使用されてよい。
MMTクライアントは、ユーザビューポート及び対応する3D空間領域に基づいてG-PCCアセットを選択してよい。MMTクライアントは、対象のG-PCCアセットを要求する送信エンティティに「GPCCSelectionFeedback」アプリケーションメッセージを送信してよい。MMTクライアントは、例えば、ユーザビューポートが変更される場合/ときに、(例えば、「GPCCSelectionFeedback」アプリケーションメッセージを用いて)G-PCCアセットの異なるセットを要求してよい。
MMTクライアントは、例えば、ユーザビューポートが変更される場合/ときに、「GPCCViewChangeFeedback」メッセージを送信エンティティに(例えば、ユーザの現在ビューポートをシグナリングするために)送信してよい。MMT送信エンティティは、(例えば、MMTクライアントからメッセージを受信すると)、(例えば、ユーザの新しいビューポート情報に基づいて)G-PCCアセットを選択してよい。MMT送信エンティティは、「GPCCAssetGroupMessage」アプリケーションメッセージを対応するG-PCCアセットと共にMMTクライアントに送信してよい。MMT送信エンティティは、G-PCCアセットデータをMMTPパケットとしてストリーミングしてよい。
MMTクライアントは、要求されたG-PCCアセット(例えば、全て)に対するMMTPパケットの受信を開始してよい。MMTクライアントは、MMTPペイロードからMPU及びMFUを抽出してよい。MPU及びMFUは、メディアサンプル(例えば、直接)又はメディアセグメントを含んでよい。
MMTクライアントは、メディアセグメントコンテナ(例えば、ISOBMFF)の構文解析を開始して、エレメンタリストリーム情報を抽出し、G-PCCビットストリームを構造化し、ビットストリームをG-PCCデコーダに渡してよい。例えば、MMTPペイロードがG-PCCメディアサンプルを含む場合/とき、エレメンタリストリームデータは抽出及び構造化されてもよく、ビットストリームはG-PCCデコーダに渡されてもよい。
ジオメトリベースの点群(G-PCC)のMPEGメディアトランスポート(MMT)ストリーミングのためのシステム、方法、及び装置が本明細書で説明されている。G-PCC符号化されたコンテンツは、MMTを使用してネットワークを介して配信されてよい。G-PCCデータは、MMTストリーミングのためにカプセル化されてよい。MMTシグナリングメッセージは、MMTを介したG-PCCデータの配信をサポートし得る。(例えば、各)トラックは、例えば、国際規格化機構ベースメディアファイルフォーマット(ISOBMFF)内のG-PCCコンポーネントが複数のトラックを使用してシグナリングされる場合/とき、MMTPパケットにパケット化され得る別個のアセットにカプセル化されてもよい。G-PCC定義アプリケーションメッセージは、サーバ及びクライアントが、G-PCCコンポーネントのための複数のアセットのグループを識別することを可能にし得る。
特徴及び要素は、特定の組み合わせにおいて上で説明されているが、当業者は、各特徴又は要素が単独で又は他の特徴及び要素との任意の組み合わせで使用され得ることを理解されよう。更に、本明細書に説明される方法は、コンピュータ又はプロセッサによる実行のためにコンピュータ可読媒体に組み込まれたコンピュータプログラム、ソフトウェア又はファームウェアに実装され得る。コンピュータ可読媒体の例には、電子信号(有線又は無線接続を介して送信される)及びコンピュータ可読記憶媒体が含まれる。コンピュータ可読記憶媒体の例としては、読取り専用メモリ(ROM)、ランダムアクセスメモリ(RAM)、レジスタ、キャッシュメモリ、半導体メモリデバイス、内部ハードディスク及びリムーバブルディスクなどの磁気媒体、磁気光学媒体及びCD-ROMディスク及びデジタル多用途ディスク(digital versatile disk、DVD)などの光学媒体が挙げられるが、これらに限定されない。ソフトウェアと関連付けられたプロセッサを使用して、WTRU、UE、端末、基地局、RNC又は任意のホストコンピュータにおいて使用するための無線周波数トランシーバを実装し得る。
Claims (18)
- 受信デバイスにおいて実施される方法であって、前記方法は、
送信デバイスから、
前記送信デバイスから前記受信デバイスにストリーミングされるのに利用可能なメディアアセットのリストを含む第1のメッセージ、又は
前記送信デバイスから前記受信デバイスにストリーミングされるのに利用可能な前記メディアアセットをそれぞれ記述する1つ以上のメッセージのうちの少なくとも1つを受信することと、前記送信デバイスから前記受信デバイスにストリーミングされるべき前記メディアアセットのサブセットの要求であって、前記メディアアセットの前記要求されたサブセットが、前記受信デバイスのビューポートに基づいて決定される、前記メディアアセットの前記要求されたサブセットを示す情報を含む第2のメッセージを前記送信デバイスに送信することと、
前記送信デバイスから、前記第2のメッセージに応答して、1つ以上のモーションピクチャエキスパートグループ(Motion Picture Experts Group)(MPEG)メディアトランスポートプロトコル(Media Transport Protocol)(MMTP)パケットを受信することと、
前記1つ以上のMMTPパケットを処理して、前記メディアアセットの前記要求されたサブセットの少なくとも一部を復元することとを含む方法。 - 前記送信デバイスから前記受信デバイスにストリーミングされるべき前記メディアアセットの更新されたサブセットであって、前記メディアアセットの前記要求された更新されたサブセットが、前記受信デバイスの更新されたビューポートに基づいて決定される、前記メディアアセットの前記要求された更新されたサブセットについての要求を示す情報を含む第3のメッセージを前記送信デバイスに送信することを更に含む、請求項1に記載の方法。
- 前記送信デバイスから受信された前記第1のメッセージは、前記メディアアセットのリストに関連付けられたアプリケーションを識別する情報を更に含む、請求項1に記載の方法。
- 前記アプリケーションを識別する前記情報は、前記アプリケーションがビジュアルボリュメトリックビデオベースコーディング(V3C)データを消費することを示す、請求項3に記載の方法。
- 前記アプリケーションを識別する前記情報は、前記アプリケーションがジオメトリベースの点群圧縮(G-PCC)データを消費することを示す、請求項3に記載の方法。
- 前記第1のメッセージは、復号化のためのメディアアセットの別のメディアアセットへの依存性と、前記メディアアセットが依存する前記別のメディアアセットの指示と、メディアアセットが代替バージョンを有するかどうかと、前記メディアアセットの前記代替バージョンの識別のうちの1つ以上を示す情報を含む、請求項1に記載の方法。
- 受信デバイスであって、
プロセッサと、
通信インターフェースとを備え、
前記プロセッサ及び前記通信インターフェースは、送信デバイスから
前記送信デバイスから前記受信デバイスにストリーミングされるのに利用可能なメディアアセットのリストを示す情報を含む第1のメッセージ、又は
前記送信デバイスから前記受信デバイスにストリーミングされるのに利用可能な前記メディアアセットをそれぞれ記述する1つ以上のメッセージのうちの少なくとも1つを受信するように構成され、
前記プロセッサ及び前記通信インターフェースは、前記送信デバイスから前記受信デバイスにストリーミングされるべき前記メディアアセットのサブセットであって、前記メディアアセットの前記要求されたサブセットが、前記受信デバイスのビューポートに基づいて決定される、前記メディアアセットのサブセットについての要求を示す情報を含む第2のメッセージを前記送信デバイスに送信するように構成され、
前記プロセッサ及び前記通信インターフェースは、前記第2のメッセージに応答して、1つ以上のモーションピクチャエキスパートグループ(Motion Picture Experts Group)(MPEG)メディアトランスポートプロトコル(Media Transport Protocol)(MMTP)パケットを前記送信デバイスから受信するように構成され、
前記プロセッサは、前記1つ以上のMMTPパケットを処理して、前記メディアアセットの前記要求されたサブセットの少なくとも一部を復元するように構成される、受信デバイス。 - 前記送信デバイスから前記受信デバイスにストリーミングされるべき前記メディアアセットの更新されたサブセットであって、前記メディアアセットの前記要求された更新されたサブセットが、前記受信デバイスの更新されたビューポートに基づいて決定される、前記メディアアセットの前記要求された更新されたサブセットについての要求を示す情報を含む第3のメッセージを前記送信デバイスに送信することを更に含む、請求項7に記載の受信デバイス。
- 前記送信デバイスから受信された前記第1のメッセージは、前記メディアアセットのリストに関連付けられたアプリケーションを識別する情報を更に含む、請求項7に記載の受信デバイス。
- 前記アプリケーションを識別する前記情報は、前記アプリケーションがビジュアルボリュメトリックビデオベースコーディング(V3C)データを消費することを示す、請求項9に記載の受信デバイス。
- 前記アプリケーションを識別する前記情報は、前記アプリケーションがジオメトリベースの点群圧縮(G-PCC)データを消費することを示す、請求項9に記載の受信デバイス。
- 前記第1のメッセージは、復号化のためのメディアアセットの別のメディアアセットへの依存性と、前記メディアアセットが依存する前記別のメディアアセットの指示と、メディアアセットが代替バージョンを有するかどうか、及び前記メディアアセットの前記代替バージョンの識別のうちの1つ以上を示す情報を含む、請求項7に記載の受信デバイス。
- 受信デバイスであって、
プロセッサと、
通信インターフェースとを備え、
前記プロセッサ及び前記通信インターフェースは、送信デバイスから
前記送信デバイスから前記受信デバイスにストリーミングされるのに利用可能なメディアアセットのセットを示す情報を含む第1のメッセージ、又は
前記送信デバイスから前記受信デバイスにストリーミングされるのに利用可能な前記メディアアセットをそれぞれ記述する1つ以上のメッセージのうちの少なくとも1つを受信するように構成され、
前記プロセッサ及び前記通信インターフェースは、前記受信デバイスのビューポートを示す情報を含む第2のメッセージを前記送信デバイスに送信するように構成され、
前記プロセッサ及び前記通信インターフェースは、前記送信デバイスから、前記送信デバイスから前記受信デバイスにストリーミングされるべき前記メディアアセットのサブセットであって、前記メディアアセットの前記示されたサブセットが、前記受信デバイスの前記示されたビューポートに基づいて決定される、前記メディアアセットの前記示されたサブセットを示す情報を含む第3のメッセージを受信するように構成され、
前記プロセッサ及び前記通信インターフェースは、前記送信デバイスから、前記第3のメッセージに応答して、1つ以上のモーションピクチャエキスパートグループ(Motion Picture Experts Group)(MPEG)メディアトランスポートプロトコル(Media Transport Protocol)(MMTP)パケットを受信するように構成され、
前記プロセッサは、前記1つ以上のMMTPパケットを処理して、前記メディアアセットの前記示されたサブセットの少なくとも一部を復元するように構成される、受信デバイス。 - 前記プロセッサ及び前記通信インターフェースは、前記受信デバイスの更新されたビューポートを示す情報を含む第4のメッセージを前記送信デバイスに送信するように構成され、
前記プロセッサ及び前記通信インターフェースは、前記送信デバイスから、前記更新されたビューポートに関連付けられたメディアアセットの更新されたセットを示す情報を含む第4のメッセージを受信するように構成され、
前記プロセッサ及び前記通信インターフェースは、前記送信デバイスから別の1つ以上のMMTPパケットを受信するように構成され、
前記プロセッサは、前記別の1つ以上のMMTPパケットを処理して、前記受信デバイスの前記更新されたビューポートに関連付けられたメディアアセットの前記更新されたセットの前記少なくとも一部分を復元するように構成される、請求項13に記載の受信デバイス。 - 前記送信デバイスから受信された前記第1のメッセージは、前記メディアアセットのリストに関連付けられたアプリケーションを識別する情報を更に含む、請求項13に記載の受信デバイス。
- 前記アプリケーションを識別する前記情報は、前記アプリケーションがビジュアルボリュメトリックビデオベースコーディング(V3C)データを消費することを示す、請求項15に記載の受信デバイス。
- 前記アプリケーションを識別する前記情報は、前記アプリケーションがジオメトリベースの点群圧縮(G-PCC)データを消費することを示す、請求項15に記載の受信デバイス。
- 前記第1のメッセージは、復号化のためのメディアアセットの別のメディアアセットへの依存性と、前記メディアアセットが依存する前記別のメディアアセットの指示と、メディアアセットが代替バージョンを有するかどうか、及び前記メディアアセットの前記代替バージョンの識別のうちの1つ以上を示す情報を含む、請求項13に記載の受信デバイス。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202163134038P | 2021-01-05 | 2021-01-05 | |
US202163134143P | 2021-01-05 | 2021-01-05 | |
US63/134,038 | 2021-01-05 | ||
US63/134,143 | 2021-01-05 | ||
PCT/US2022/011298 WO2022150376A1 (en) | 2021-01-05 | 2022-01-05 | Mmt signaling for streaming of visual volumetric video-based (v3c) and geometry-based point cloud (g-pcc) media |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2024502822A true JP2024502822A (ja) | 2024-01-23 |
Family
ID=80050976
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023540501A Pending JP2024502822A (ja) | 2021-01-05 | 2022-01-05 | ビジュアルボリュメトリックビデオベース(v3c)及びジオメトリベース点群(g-pcc)メディアのストリーミングのためのmmtシグナリング |
Country Status (6)
Country | Link |
---|---|
US (1) | US20240022773A1 (ja) |
EP (1) | EP4275358A1 (ja) |
JP (1) | JP2024502822A (ja) |
KR (1) | KR20230129259A (ja) |
IL (1) | IL304205A (ja) |
WO (1) | WO2022150376A1 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20220329857A1 (en) * | 2021-04-13 | 2022-10-13 | Samsung Electronics Co., Ltd. | Mpeg media transport (mmt) signaling of visual volumetric video-based coding (v3c) content |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3818716A4 (en) * | 2018-07-02 | 2022-06-01 | Nokia Technologies Oy | DEVICE, METHOD AND COMPUTER PROGRAM FOR VIDEO ENCODING AND DECODING |
US11823421B2 (en) * | 2019-03-14 | 2023-11-21 | Nokia Technologies Oy | Signalling of metadata for volumetric video |
KR20230153532A (ko) * | 2019-03-21 | 2023-11-06 | 엘지전자 주식회사 | 포인트 클라우드 데이터 부호화 장치, 포인트 클라우드 데이터 부호화 방법, 포인트 클라우드 데이터 복호화 장치 및 포인트 클라우드 데이터 복호화 방법 |
-
2022
- 2022-01-05 JP JP2023540501A patent/JP2024502822A/ja active Pending
- 2022-01-05 US US18/270,963 patent/US20240022773A1/en active Pending
- 2022-01-05 KR KR1020237026390A patent/KR20230129259A/ko unknown
- 2022-01-05 EP EP22701113.7A patent/EP4275358A1/en active Pending
- 2022-01-05 WO PCT/US2022/011298 patent/WO2022150376A1/en active Application Filing
-
2023
- 2023-07-03 IL IL304205A patent/IL304205A/en unknown
Also Published As
Publication number | Publication date |
---|---|
EP4275358A1 (en) | 2023-11-15 |
WO2022150376A1 (en) | 2022-07-14 |
US20240022773A1 (en) | 2024-01-18 |
KR20230129259A (ko) | 2023-09-07 |
IL304205A (en) | 2023-09-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11568573B2 (en) | Methods and apparatus for point cloud compression bitstream format | |
US20240195999A1 (en) | Dynamic adaptation of volumetric content component sub-bitstreams in streaming services | |
US20230188751A1 (en) | Partial access support in isobmff containers for video-based point cloud streams | |
JP2023536725A (ja) | ジオメトリベースのポイントクラウドデータのためのタイルトラック | |
US20220329923A1 (en) | Video-based point cloud streams | |
AU2020280072A1 (en) | Video-based point cloud streams | |
US20240022773A1 (en) | Mmt signaling for streaming of visual volumetric video-based and geometry-based point cloud media | |
US20230276053A1 (en) | Adaptive streaming of geometry-based point clouds | |
CN116830588A (zh) | 用于基于视觉体积视频(v3c)媒体和基于几何的点云(g-pcc)媒体的流式传输的mmt信令 | |
WO2024006279A1 (en) | Signaling parameter sets for geometry-based point cloud streams | |
KR20240089338A (ko) | 기하구조 기반 포인트 클라우드의 적응적 스트리밍 | |
WO2023059730A1 (en) | Adaptive streaming of geometry-based point clouds |