WO2023084789A1 - 配信装置、配信方法及びプログラム - Google Patents
配信装置、配信方法及びプログラム Download PDFInfo
- Publication number
- WO2023084789A1 WO2023084789A1 PCT/JP2021/041968 JP2021041968W WO2023084789A1 WO 2023084789 A1 WO2023084789 A1 WO 2023084789A1 JP 2021041968 W JP2021041968 W JP 2021041968W WO 2023084789 A1 WO2023084789 A1 WO 2023084789A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- chunk
- data
- texture
- frame data
- distribution
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims description 27
- 230000004044 response Effects 0.000 claims abstract description 7
- 230000008859 change Effects 0.000 claims description 3
- 238000002716 delivery method Methods 0.000 claims 1
- 239000000872 buffer Substances 0.000 description 20
- 238000004891 communication Methods 0.000 description 18
- 238000009877 rendering Methods 0.000 description 12
- 238000013500 data storage Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 8
- 230000005540 biological transmission Effects 0.000 description 6
- 230000008569 process Effects 0.000 description 4
- 238000007906 compression Methods 0.000 description 3
- 230000006835 compression Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000033001 locomotion Effects 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 238000013144 data compression Methods 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/238—Interfacing the downstream path of the transmission network, e.g. adapting the transmission rate of a video stream to network bandwidth; Processing of multiplex streams
Definitions
- volumetric video is targeted as an example of stereoscopic video content, and a distribution system 1 that implements a chunk distribution method for volumetric video will be described.
- volumetric video and can be similarly applied to, for example, stereoscopic video content having six degrees of freedom such as a hologram.
- the client terminal 20 when the client terminal 20 also functions as an XR device, the client terminal 20 may reproduce the volumetric video. In this case, the viewing device 30 is unnecessary.
- the rendering unit 204 generates video data by rendering the chunk data (mesh chunk data and texture chunk data) buffered in the buffer unit 205 together with the virtual environment. The rendering unit 204 then transmits the video data as a stream to the viewing device 30 .
- t ⁇ [1, T] is divided into chunks, with the texture frame data before the structure of .
- the communication I/F 302 is an interface for connecting the distribution server 10 to the communication network N.
- the processor 303 is, for example, various arithmetic devices such as a CPU (Central Processing Unit).
- the memory device 304 is, for example, various storage devices such as HDD (Hard Disk Drive), SSD (Solid State Drive), RAM (Random Access Memory), ROM (Read Only Memory), and flash memory.
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Information Transfer Between Computers (AREA)
Abstract
一実施形態に係る配信装置は、ポリゴンメッシュとテクスチャとで構成される物体の立体映像コンテンツを端末に配信する配信装置であって、前記ポリゴンメッシュの各フレームデータをそれぞれ表す各メッシュフレームデータから複数の第1のチャンクデータを作成する第1のチャンク作成部と、前記テクスチャの各フレームデータをそれぞれ表す各テクスチャフレームデータから複数の第2のチャンクデータを作成する第2のチャンク作成部と、前記端末からのチャンク配信要求に応じて、前記チャンク配信要求に係る第1のチャンクデータ及び第2のチャンクデータの少なくとも一方を前記端末に送信するチャンク配信部と、を有する。
Description
本発明は、ボリュメトリックビデオやホログラム等の立体映像コンテンツの配信技術に関する。
ボリュメトリックビデオやホログラム等に代表される6自由度(6DoF:six degrees of freedom)を持つ立体映像コンテンツが知られている。このようなコンテンツを通信ネットワークにより高品質に配信するためには、高いデータ圧縮技術や通信ネットワーク/システムの負荷分散技術等の利用に加えて、コンテンツ自体の配信を制御する仕組みが必要である。特に、クライアントとなるXR(VR/AR/MR/SR等)デバイスの視界情報や仮想空間におけるユーザの位置情報等に応じて、コンテンツの配信を動的に制御する仕組みが重要である。
ボリュメトリックビデオはポリゴンメッシュ(以下、単に「メッシュ」ともいう。)とテクスチャとで構成された物体のアニメーションデータであり、クライアント側で仮想環境と合わせてレンダリングすることで、XRデバイスのディスプレイ上に表示され、視聴ができる。
ボリュメトリックビデオ配信技術として、非特許文献1~3に記載されている技術が知られている。非特許文献1では、クライアントであるAR/VRデバイスで検出されたユーザの頭の動きに基づいて、ボリュメトリックビデオのレンダリングをサーバ側で行い、2Dデータとして当該クライアントに送信する手法が提案されている。また、非特許文献2では、リアルタイムで生成されたボリュメトリックビデオをクライアントに配信し、クライアント側でレンダリングする手法が提案されている。更に、非特許文献3では、2D映像コンテンツのデータの配信に関するMPEG-DASHと呼ばれる仕組みが提案されている。MPEG-DASHでは2D映像コンテンツのデータがチャンク(又はセグメント)と呼ばれるファイルに分割されており、2D映像を再生する端末は、チャンクファイルの一覧等が記載されたマニフェストファイルに基づいて、チャンクファイルの取得要求をデータ配信サーバに対して送信する。このようなデータ配信方式はチャンク配信方式とも呼ばれる。
Serhan Gul, Dimitri Podborski, Thomas Buchholz, Thomas Schierl and Cornelius Hellge, "Low-latency cloud-based volumetric video streaming using head motion prediction," https://arxiv.org/abs/2001.06466
Sergio Orts-Escolano et al., "Holoportation: Virtual 3D teleportation in real-time," https://dl.acm.org/doi/10.1145/2984511.2984517
MPEG-DASH, https://mpeg.chiariglione.org/standards/mpeg-dash
ところで、ボリュメトリックビデオはデータ量が大きく、その配信に必要な通信ネットワークの帯域が大きいため、効率的に配信する手法が求められている。
しかしながら、上記の非特許文献1で提案されている手法では、各ユーザのレンダリングをサーバ側で行う必要があるため、サーバの負荷が大きい。また、ユーザ数が増えた場合にはサーバリソースの分割によって、各ユーザが視聴する映像品質の劣化が発生し得る。更に、クライアントからサーバに対して位置情報を高頻度に低遅延で送信する必要があり、例えば、VR酔いが発生し始めるMotion to Photon遅延を20ms以下に抑えることは通信ネットワークとサーバの両方で負担が大きい。
一方で、上記の非特許文献2で提案されている手法では、通信帯域に4Gbps必要であるが、4Gbpsの通信帯域をユーザが常に安定して確保することは難しい。また、通信ネットワークの負荷が大きいため、同一の通信ネットワークを使用する他のユーザの使用可能帯域が狭まり、他のユーザの体感品質を落としてしまう。更に、2Dデータがフレーム単位で配信されるため、各フレームをメモリにロードする負荷が高く、例えば、高性能ではないPCで映像を再生する場合やネットワーク帯域が不足している場合には、2Dデータがバッファリングされずに映像の映像が頻繁に中断されてしまう。
これに対して、チャンク配信方式を用いることで上記の課題を解決することができると考えられるが、非特許文献3に記載されているチャンク配信方式は2D映像コンテンツを対象としており、例えば、MP4形式等といったデータ形式である必要がある。
本発明の一実施形態は、上記の点に鑑みてなされたもので、立体映像コンテンツに対するチャンク配信方式を実現することを目的とする。
上記目的を達成するため、一実施形態に係る配信装置は、ポリゴンメッシュとテクスチャとで構成される物体の立体映像コンテンツを端末に配信する配信装置であって、前記ポリゴンメッシュの各フレームデータをそれぞれ表す各メッシュフレームデータから複数の第1のチャンクデータを作成する第1のチャンク作成部と、前記テクスチャの各フレームデータをそれぞれ表す各テクスチャフレームデータから複数の第2のチャンクデータを作成する第2のチャンク作成部と、前記端末からのチャンク配信要求に応じて、前記チャンク配信要求に係る第1のチャンクデータ及び第2のチャンクデータの少なくとも一方を前記端末に送信するチャンク配信部と、を有する。
立体映像コンテンツに対するチャンク配信方式を実現することができる。
以下、本発明の一実施形態について説明する。本実施形態では、立体映像コンテンツの一例としてボリュメトリックビデオを対象に、ボリュメトリックビデオに対するチャンク配信方式を実現する配信システム1について説明する。ここで、ボリュメトリックビデオとは、メッシュとテクスチャとで表される物体(人、動物等も含む。)の3Dデータ(3次元データ又は立体データともいう。)で構成されたアニメーションデータのことである。すなわち、例えば、時刻tのフレームにおける3Dデータをdtとすれば、ボリュメトリックビデオは{dt=(mt,nt)|t∈[ts,te]}と表される。mtは時刻tのフレームのメッシュデータ、ntは時刻tのフレームのテクスチャデータ、tsはボリュメトリックビデオの開始時刻、teは終了時刻である。以下、dtを時刻tの3Dフレームデータ、mtを時刻tのメッシュフレームデータ、ntを時刻tのテクスチャフレームデータとも呼ぶことにする。また、以下では、簡単のため、ts=1、te=Tとする。
なお、以下で説明する実施形態は、ボリュメトリックビデオに限られず、例えば、ホログラム等といった6自由度を持つ立体映像コンテンツに対しても同様に適用することができる。
<配信システム1の全体構成>
まず、本実施形態に係る配信システム1の全体構成について、図1を参照しながら説明する。図1は、本実施形態に係る配信システム1の全体構成の一例を示す図である。
まず、本実施形態に係る配信システム1の全体構成について、図1を参照しながら説明する。図1は、本実施形態に係る配信システム1の全体構成の一例を示す図である。
図1に示すように、本実施形態に係る配信システム1には、配信サーバ10と、クライアント端末20と、視聴デバイス30とが含まれる。配信サーバ10とクライアント端末20は、例えば、インターネット等の通信ネットワークNを介して通信可能に接続される。一方で、クライアント端末20と視聴デバイス30は、任意の有線又は無線接続方式により通信可能に接続される。
配信サーバ10は、ボリュメトリックビデオを構成する各3Dフレームデータに含まれるメッシュフレームデータ及びテクスチャフレームデータのそれぞれをチャンクと呼ばれるまとまりに分割してチャンクデータを作成すると共に、各チャンクの番号(以下、チャンク番号ともいう。)と各チャンクのデータサイズ(以下、チャンクサイズともいう。)とが含まれるチャンク情報を作成する。
また、配信サーバ10は、クライアント端末20からの視聴開始要求に応じてチャンク情報を送信すると共に、クライアント端末20からのチャンク配信要求に応じて該当のチャンクデータを送信する。
クライアント端末20は、ボリュメトリックビデオを視聴するユーザが利用する各種端末(例えば、PCやゲーム機器等)である。クライアント端末20は、チャンク情報に基づいて、配信サーバ10に対して配信を要求するチャンクデータを決定する。また、クライアント端末20は、配信サーバ10から配信されたチャンクデータをバッファすると共に、チャンクデータのレンダリングを行って映像データをストリームとして視聴デバイス30に送信する。
視聴デバイス30は、ボリュメトリックビデオを視聴するための各種端末であり、クライアント端末20から受信した映像データに基づいてボリュメトリックビデオを再生する。なお、視聴デバイス30としては、例えば、XR(VR/AR/MR/SR等)デバイスとして機能するHMD(Head Mount Display)、XRデバイスとして機能するアプリケーションプログラムが搭載されたスマーフォンやタブレット端末、ウェアラブルデバイス等が挙げられる。
なお、例えば、クライアント端末20がXRデバイスとしても機能する場合には、クライアント端末20でボリュメトリックビデオを再生してもよい。この場合、視聴デバイス30は不要である。
ここで、本実施形態に係る配信サーバ10は、チャンク作成部101と、要求受信部102と、データ配信部103と、データ記憶部104とを有する。
チャンク作成部101は、データ記憶部104に記憶されているボリュメトリックビデオからチャンクデータを作成する。このとき、チャンク作成部101は、ボリュメトリックビデオを構成する3Dフレームデータに含まれるメッシュフレームデータをチャンクに分割し、各チャンクを圧縮することでメッシュチャンクデータを作成する。同様に、チャンク作成部101は、ボリュメトリックビデオを構成する3Dフレームデータに含まれるテクスチャフレームデータをチャンクに分割し、各チャンクを圧縮することでテクスチャチャンクデータを作成する。そして、チャンク作成部101は、各メッシュチャンクデータと各テクスチャチャンクデータとに対してそれぞれチャンク番号を付与した上でデータ記憶部104に保存する。以下、メッシュチャンクデータに付与されたチャンク番号をメッシュチャンク番号、テクスチャチャンクデータに付与されたチャンク番号をテクスチャチャンク番号ともいう。なお、各チャンク番号は時系列順にそれぞれ1から順に付与される。
また、チャンク作成部101は、メッシュチャンク番号及びそのチャンク番号のメッシュチャンクデータのチャンクサイズと、テクスチャチャンク番号及びそのチャンク番号のテクスチャチャンクデータのチャンクサイズとが含まれるチャンク情報を作成する。そして、チャンク作成部101は、チャンク情報をボリュメトリックビデオと対応付けてデータ記憶部104に保存する。
要求受信部102は、クライアント端末20からの視聴開始要求やチャンク配信要求を受信する。視聴開始要求とは、ボリュメトリックビデオの視聴を開始するための要求であり、例えば、ユーザが視聴を所望するボリュメトリックビデオのID等が含まれる。また、チャンク配信要求とは、チャンクデータの配信要求であり、例えば、チャンクデータのチャンク番号(メッシュチャンク番号とテクスチャチャンク番号の少なくとも一方)が含まれる。
データ配信部103は、要求受信部102が視聴開始要求を受信した場合、この視聴開始要求に含まれるIDのボリュメトリックビデオに対応付けられているチャンク情報を要求元のクライアント端末20に送信する。また、データ配信部103は、要求受信部102がチャンク配信要求を受信した場合、このチャンク配信要求に含まれるチャンク番号のチャンクデータを要求元のクライアント端末20に送信する。
データ記憶部104は、ボリュメトリックビデオと、このボリュメトリックから作成されたチャンクデータ(メッシュチャンクデータとテクスチャチャンクデータ)及びチャンク情報と記憶する。なお、ボリュメトリックビデオにはそのボリュメトリックビデオを一意に識別するID(以下、ボリュメトリックビデオIDともいう。)が付与されている。
また、本実施形態に係るクライアント端末20は、データ受信部201と、要求チャンク決定部202と、要求送信部203と、レンダリング部204と、バッファ部205とを有する。
データ受信部201は、配信サーバ10からのチャンク情報やチャンクデータを受信する。また、データ受信部201は、配信サーバ10から受信したチャンクデータをバッファ部205にバッファ(一時的に記憶)する。
要求チャンク決定部202は、チャンク情報に基づいて、配信サーバ10に対して配信を要求するチャンクデータのチャンク番号を決定する。
要求送信部203は、ボリュメトリックビデオの視聴を開始する場合に視聴開始要求を配信サーバ10に送信する。また、要求送信部203は、要求チャンク決定部202によりチャンク番号が決定された場合、そのチャンク番号が含まれるチャンク配信要求を配信サーバ10に送信する。
レンダリング部204は、バッファ部205にバッファされているチャンクデータ(メッシュチャンクデータとテクスチャチャンクデータ)を仮想環境と合わせてレンダリングすることで映像データを生成する。そして、レンダリング部204は、映像データをストリームとして視聴デバイス30に送信する。
バッファ部205は、配信サーバ10から受信したメッシュチャンクデータとテクスチャチャンクデータをそれぞれバッファ(一時的に記憶)する。
<チャンクデータ作成処理>
以下、本実施形態に係るチャンクデータ作成処理について、図2を参照しながら説明する。図2は、本実施形態に係るチャンクデータ作成処理の一例を示すフローチャートである。なお、このチャンクデータ作成処理はオフラインで実施(つまり、ボリュメトリックビデオの再生よりも前に事前に実施)される。
以下、本実施形態に係るチャンクデータ作成処理について、図2を参照しながら説明する。図2は、本実施形態に係るチャンクデータ作成処理の一例を示すフローチャートである。なお、このチャンクデータ作成処理はオフラインで実施(つまり、ボリュメトリックビデオの再生よりも前に事前に実施)される。
配信サーバ10のチャンク作成部101は、データ記憶部104に記憶されているボリュメトリックビデオを構成する3Dフレームデータ{dt=(mt,nt)|t∈[1,T]}に含まれるメッシュフレームデータ{mt|t∈[1,T]}及びテクスチャフレームデータ{nt|t∈[1,T]}をそれぞれチャンクに分割する(ステップS101)。
このとき、メッシュフレームデータ{mt|t∈[1,T]}に関しては、チャンク作成部101は、例えば、各3Dフレームデータdt(又は各ポリゴンメッシュフレームmt)の内容を分析し、フレーム補間等に基づいて、各チャンクのチャンクサイズが最も小さくようにメッシュフレームデータ{mt|t∈[1,T]}をチャンクに分割する。
一方で、テクスチャフレームデータ{nt|t∈[1,T]}に関しては、チャンク作成部101は、例えば、互いに隣り合うテクスチャフレームデータnt及びnt+1をt=1から順に分析し、テクスチャの構造が大きく変化する前までのテクスチャフレームデータを1つのチャンクとして、テクスチャフレームデータ{nt|t∈[1,T]をチャンクに分割する。例えば、時刻t1,t2,t3(ただし、t1<t2<t3)でテクスチャの構造が大きく変化した場合、{nt|t∈[1,t1-1]}と{nt|t∈[t1,t2-1]}と{nt|t∈[t2,t3-1]}と{nt|t∈[t3,T]}の4つのチャンクに分割される。ここで、テクスチャの構造が大きく変化する場合とは、例えば、テクスチャフレームデータntが表すテクスチャとテクスチャフレームデータnt+1が表すテクスチャとの間で、明るさ、色、濃淡、模様のパターン等を数値化して比較したときに、それらのうちの少なくとも一部が予め決められた所定の閾値以上変化した場合のことをいう。なお、テクスチャの構造が大きく変化する場合は、例えば、テクスチャフレームデータntが表すテクスチャとテクスチャフレームデータnt+1が表すテクスチャとの間で、明るさ、色、濃淡、模様のパターン等を数値化して重み付け和等を計算したときに、その重み付け和の値が予め決められた所定の閾値以上変化した場合のことであってもよい。
なお、上記のステップS101において、メッシュフレームデータとテクスチャフレームデータは互いに独立にチャンクに分割されることに留意されたい。
次に、配信サーバ10のチャンク作成部101は、上記のステップS101で分割された各チャンクのチャンクサイズが最も小さくなるように各フレームデータ(各メッシュフレームデータ及び各テクスチャフレームデータ)を圧縮する(ステップS102)。すなわち、メッシュフレームデータに関して、チャンク作成部101は、上記のステップS101で分割された各チャンクのチャンクサイズが最も小さくなるように各メッシュフレームデータmtを圧縮する。同様に、テクスチャフレームデータに関して、チャンク作成部101は、上記のステップS101で分割された各チャンクのチャンクサイズが最も小さくなるように各テクスチャフレームデータntを圧縮する。これにより、チャンク単位の圧縮後のメッシュフレームデータで構成されるメッシュチャンクデータと、チャンク単位の圧縮後のテクスチャフレームデータで構成されるテクスチャチャンクデータとが作成されたことになる。
次に、配信サーバ10のチャンク作成部101は、上記のステップS101で作成されたメッシュチャンクデータとテクスチャチャンクデータとをデータ記憶部104に保存する(ステップS103)。また、このとき、チャンク作成部101は、各メッシュチャンクデータに対してメッシュチャンク番号を付与すると共に、各テクスチャチャンクデータに対してテクスチャチャンク番号を付与する。
ここで、メッシュチャンクデータの一例を図3に示す。図3に示す例では、メッシュフレームデータm1~m10が1つのチャンクに分割されており、これらのメッシュフレームデータm1~m10の各々を圧縮したデータで構成されるメッシュチャンクデータが、メッシュチャンク番号「1」のメッシュチャンクデータとなっている。同様に、メッシュフレームデータm11~m15が1つのチャンクに分割されており、これらのメッシュフレームデータm11~m15の各々を圧縮したデータで構成されるメッシュチャンクデータが、メッシュチャンク番号「2」のメッシュチャンクデータとなっている。
また、テクスチャチャンクデータの一例を図4に示す。図4に示す例では、テクスチャフレームデータn1~n10が1つのチャンクに分割されており、これらのテクスチャフレームデータn1~n10の各々を圧縮したデータで構成されるテクスチャフレームデータが、テクスチャチャンク番号「1」のテクスチャフレームデータとなっている。同様に、テクスチャフレームデータn11~n30が1つのチャンクに分割されており、これらのテクスチャフレームデータn11~n30の各々を圧縮したデータで構成されるテクスチャフレームデータが、テクスチャチャンク番号「2」のテクスチャフレームデータとなっている。
そして、配信サーバ10のチャンク作成部101は、チャンク番号とチャンクサイズとが含まれるチャンク情報を作成してボリュメトリックビデオと対応付けてデータ記憶部104に保存する(ステップS104)。具体的には、チャンク情報には、メッシュチャンク番号及びそのチャンク番号のメッシュチャンクデータのチャンクサイズと、テクスチャチャンク番号及びそのチャンク番号のテクスチャチャンクデータのチャンクサイズとが含まれる。
<ボリュメトリックビデオ再生処理>
以下、本実施形態に係るボリュメトリックビデオ再生処理について、図5を参照しながら説明する。図5は、本実施形態に係るボリュメトリックビデオ再生処理の一例を示すシーケンス図である。
以下、本実施形態に係るボリュメトリックビデオ再生処理について、図5を参照しながら説明する。図5は、本実施形態に係るボリュメトリックビデオ再生処理の一例を示すシーケンス図である。
クライアント端末20の要求送信部203は、視聴開始要求を配信サーバ10に送信する(ステップS201)。ここで、視聴開始要求には、ユーザが視聴を所望するボリュメトリックビデオのボリュメトリックビデオIDが含まれる。
配信サーバ10のデータ配信部103は、要求受信部102が視聴開始要求を受信すると、当該視聴開始要求に含まれるボリュメトリックビデオIDのボリュメトリックビデオに対応付けられているチャンク情報をデータ記憶部104から取得し、取得したチャンク情報を要求元のクライアント端末20に送信する(ステップS202)。
以下のステップS203~ステップS208は、ユーザがボリュメトリックビデオを視聴している間、繰り返し実行される。
クライアント端末20の要求チャンク決定部202は、チャンク情報に基づいて、配信サーバ10に対して配信を要求するチャンクデータのチャンク番号(メッシュチャンク番号とテクスチャチャンク番号)を決定する(ステップS203)。ここで、要求チャンク決定部202は、既知のチャンク配信方式と同様の手法により配信を要求するチャンクデータのチャンク番号を決定すればよい。例えば、メッシュチャンク番号「k1」までのメッシュチャンクデータとテクスチャチャンク番号「k2」までのテクスチャチャンクデータとが受信済みであるとする。この場合、要求チャンク決定部202は、現在のネットワーク帯域やバッファ部205の空き容量等といった条件と、メッシュチャンク番号「k1+1」以降のメッシュチャンクデータのチャンクサイズと、テクスチャチャンク番号「k2+1」のテクスチャチャンクデータのチャンクサイズとに基づいて、「k1+1」以降のメッシュチャンク番号と、「k2+1」以降のテクスチャチャンク番号とを、配信サーバ10に対して配信を要求するチャンクデータのチャンク番号として決定する。なお、例えば、配信サーバ10に対して配信を要求するチャンクデータのチャンク番号として、メッシュチャンク番号又はテクスチャチャンク番号のいずれか一方のみが決定される場合が存在してもよい。
次に、クライアント端末20の要求送信部203は、上記のステップS203で決定されたチャンク番号(メッシュチャンク番号とテクスチャチャンク番号)が含まれるチャンク配信要求を配信サーバ10に送信する(ステップS204)。なお、メッシュチャンク番号とテクスチャチャンク番号のいずれか一方のみがチャンク配信要求に含まれる場合が存在してもよい。
配信サーバ10のデータ配信部103は、要求受信部102がチャンク配信要求を受信すると、上記のステップS202で受信した視聴開始要求に含まれるボリュメトリックビデオIDのボリュメトリックビデオのチャンクデータのうち、当該チャンク配信要求に含まれるチャンク番号のチャンクデータ(メッシュチャンクデータとテクスチャチャンクデータ)を要求元のクライアント端末20に送信する(ステップS205)。
クライアント端末20のデータ受信部201は、配信サーバ10からチャンクデータ(メッシュチャンクデータとテクスチャチャンクデータ)を受信すると、これらのチャンクデータをバッファ部205に格納する(ステップS206)。これにより、メッシュチャンクデータとテクスチャチャンクデータがバッファ部205にバッファされたことになる。
以下のステップS207~ステップS208は、バッファ部205の容量が或る閾値th1を超えた場合に、その容量が別の或る閾値th2(<th1)を下回るまで、上記のステップS203~ステップS206と並列に繰り返し実行される。例えば、典型的には、バッファ部205が一杯になった場合に、バッファ部205が空になるまで、以下のステップS207~ステップS208が上記のステップS203~ステップS206と並列に繰り返し実行される。
クライアント端末20のレンダリング部204は、バッファ部205にバッファされているチャンクデータ(メッシュチャンクデータとテクスチャチャンクデータ)を仮想環境と合わせてレンダリングする(ステップS207)。これにより、映像データが生成される。バッファ部205にバッファされているチャンクデータ(メッシュチャンクデータとテクスチャチャンクデータ)のレンダリングの様子の一例を図6に示す。図6に示す例では、メッシュチャンク番号「1」のメッシュチャンクデータ1~メッシュチャンク番号「4」のメッシュチャンクデータ4と、テクスチャチャンク番号「1」のテクスチャチャンクデータ1~テクスチャチャンク番号「2」のテクスチャチャンクデータ2とがバッファ部205にバッファされており、これらのチャンクデータに含まれるフレームデータ(メッシュフレームデータとテクスチャフレームデータ)が時系列順にレンダリングされる。
なお、すべてのフレームデータがレンダリングされたチャンクデータはバッファ部205から削除される。これにより、上記のステップS206で新たなチャンクデータをバッファ部205にバッファさせることが可能となる。
クライアント端末20のレンダリング部204は、上記のステップS207で生成された映像データをストリームとして視聴デバイス30に送信する(ステップS208)。これにより、視聴デバイス30では、クライアント端末20から受信した映像データに基づいてボリュメトリックビデオが再生される。
<配信サーバ10及びクライアント端末20のハードウェア構成>
≪配信サーバ10≫
次に、本実施形態に係る配信サーバ10のハードウェア構成について、図7を参照しながら説明する。図7は、本実施形態に係る配信サーバ10のハードウェア構成の一例を示す図である。
≪配信サーバ10≫
次に、本実施形態に係る配信サーバ10のハードウェア構成について、図7を参照しながら説明する。図7は、本実施形態に係る配信サーバ10のハードウェア構成の一例を示す図である。
図7に示すように、本実施形態に係る配信サーバ10は、外部I/F301と、通信I/F302と、プロセッサ303と、メモリ装置304とを有する。これらの各ハードウェアは、それぞれがバス305を介して通信可能に接続される。
外部I/F301は、記録媒体301a等の外部装置とのインタフェースである。なお、記録媒体301aとしては、例えば、CD(Compact Disc)、DVD(Digital Versatile Disk)、SDメモリカード(Secure Digital memory card)、USB(Universal Serial Bus)メモリカード等が挙げられる。
通信I/F302は、配信サーバ10が通信ネットワークNに接続するためのインタフェースである。プロセッサ303は、例えば、CPU(Central Processing Unit)等の各種演算装置である。メモリ装置304は、例えば、HDD(Hard Disk Drive)、SSD(Solid State Drive)、RAM(Random Access Memory)、ROM(Read Only Memory)、フラッシュメモリ等の各種記憶装置である。
本実施形態に係る配信サーバ10は、上記のハードウェア構成を有することにより、上述した各種処理を実現することができる。ただし、図7に示すハードウェア構成は一例であって、配信サーバ10は、他のハードウェア構成を有していてもよい。例えば、配信サーバ10は、キーボードやマウス等の入力装置、ディスプレイ等の表示装置等のハードウェアを更に有していてもよい。また、例えば、配信サーバ10は、複数のプロセッサ303を有していてもよいし、複数のメモリ装置304を有していてもよい。
なお、図1に示したチャンク作成部101、要求受信部102及びデータ配信部103は、例えば、配信サーバ10にインストールされた1以上のプログラムが、プロセッサ303に実行させる処理により実現される。また、図1に示したデータ記憶部104は、例えば、HDDやSSD等といった補助記憶装置により実現される。ただし、データ記憶部104は、例えば、配信サーバ10と通信ネットワークを介して接続されるデータベースサーバ等により実現されてもよい。
≪クライアント端末20≫
次に、本実施形態に係るクライアント端末20のハードウェア構成について、図8を参照しながら説明する。図8は、本実施形態に係るクライアント端末20のハードウェア構成の一例を示す図である。
次に、本実施形態に係るクライアント端末20のハードウェア構成について、図8を参照しながら説明する。図8は、本実施形態に係るクライアント端末20のハードウェア構成の一例を示す図である。
図8に示すように、本実施形態に係るクライアント端末20は、入力装置401と、表示装置402と、外部I/F403と、通信I/F404と、プロセッサ405と、メモリ装置406とを有する。これらの各ハードウェアは、それぞれがバス407を介して通信可能に接続される。
入力装置401は、例えば、キーボードやマウス、タッチパネル等である。表示装置402は、例えば、ディスプレイ等である。なお、クライアント端末20は、例えば、入力装置401及び表示装置402のうちの少なくとも一方を有していなくてもよい。
外部I/F403は、記録媒体403a等の外部装置とのインタフェースである。なお、記録媒体403aとしては、例えば、CD、DVD、SDメモリカード、USBメモリカード等が挙げられる。
通信I/F404は、クライアント端末20が通信ネットワークNに接続したり、視聴デバイス30に映像データを送信したりするためのインタフェースである。プロセッサ405は、例えば、CPUやGPU(Graphics Processing Unit)等の各種演算装置である。メモリ装置406は、例えば、HDD、SSD、RAM、ROM、フラッシュメモリ等の各種記憶装置である。
本実施形態に係るクライアント端末20は、上記のハードウェア構成を有することにより、上述した各種処理を実現することができる。ただし、図8に示すハードウェア構成は一例であって、クライアント端末20は、他のハードウェア構成を有していてもよい。例えば、クライアント端末20は、複数のプロセッサ405を有していてもよいし、複数のメモリ装置406を有していてもよい。
なお、図1に示したデータ受信部201、要求チャンク決定部202、要求送信部203及びレンダリング部204は、例えば、クライアント端末20にインストールされた1以上のプログラムが、プロセッサ405に実行させる処理により実現される。また、図1に示したバッファ部205は、例えば、メモリ装置406により実現される。
<まとめ>
以上のように、本実施形態に係る配信システム1は、チャンク配信方式を実現する際に、ボリュメトリックビデオを構成する3Dフレームデータに含まれるメッシュフレームデータとテクスチャフレームデータをそれぞれ独立にチャンク化する。これにより、メッシュフレームデータの各チャンクと、テクスチャフレームデータの各チャンクとをそれぞれ高い圧縮率で圧縮することが可能となり、メッシュチャンクデータのチャンクサイズとテクスチャチャンクデータのチャンクサイズとを削減させることが可能となる。このため、クライアント端末20の処理負荷を削減させることが可能となり、2D映像コンテンツと比較してデータサイズが大きいボリュメトリックビデオ等といった立体映像コンテンツであっても中断の少ない再生を実現することが可能となる。
以上のように、本実施形態に係る配信システム1は、チャンク配信方式を実現する際に、ボリュメトリックビデオを構成する3Dフレームデータに含まれるメッシュフレームデータとテクスチャフレームデータをそれぞれ独立にチャンク化する。これにより、メッシュフレームデータの各チャンクと、テクスチャフレームデータの各チャンクとをそれぞれ高い圧縮率で圧縮することが可能となり、メッシュチャンクデータのチャンクサイズとテクスチャチャンクデータのチャンクサイズとを削減させることが可能となる。このため、クライアント端末20の処理負荷を削減させることが可能となり、2D映像コンテンツと比較してデータサイズが大きいボリュメトリックビデオ等といった立体映像コンテンツであっても中断の少ない再生を実現することが可能となる。
本発明は、具体的に開示された上記の実施形態に限定されるものではなく、請求の範囲の記載から逸脱することなく、種々の変形や変更、既知の技術との組み合わせ等が可能である。
1 配信システム
10 配信サーバ
20 クライアント端末
30 視聴デバイス
101 チャンク作成部
102 要求受信部
103 データ配信部
104 データ記憶部
201 データ受信部
202 要求チャンク決定部
203 要求送信部
204 レンダリング部
205 バッファ部
301 外部I/F
301a 記録媒体
302 通信I/F
303 プロセッサ
304 メモリ装置
305 バス
401 入力装置
402 表示装置
403 外部I/F
403a 記録媒体
404 通信I/F
405 プロセッサ
406 メモリ装置
407 バス
N 通信ネットワーク
10 配信サーバ
20 クライアント端末
30 視聴デバイス
101 チャンク作成部
102 要求受信部
103 データ配信部
104 データ記憶部
201 データ受信部
202 要求チャンク決定部
203 要求送信部
204 レンダリング部
205 バッファ部
301 外部I/F
301a 記録媒体
302 通信I/F
303 プロセッサ
304 メモリ装置
305 バス
401 入力装置
402 表示装置
403 外部I/F
403a 記録媒体
404 通信I/F
405 プロセッサ
406 メモリ装置
407 バス
N 通信ネットワーク
Claims (7)
- ポリゴンメッシュとテクスチャとで構成される物体の立体映像コンテンツを端末に配信する配信装置であって、
前記ポリゴンメッシュの各フレームデータをそれぞれ表す各メッシュフレームデータから複数の第1のチャンクデータを作成する第1のチャンク作成部と、
前記テクスチャの各フレームデータをそれぞれ表す各テクスチャフレームデータから複数の第2のチャンクデータを作成する第2のチャンク作成部と、
前記端末からのチャンク配信要求に応じて、前記チャンク配信要求に係る第1のチャンクデータ及び第2のチャンクデータの少なくとも一方を前記端末に送信するチャンク配信部と、
を有する配信装置。 - 前記第1のチャンク作成部は、
前記各メッシュフレームデータ又は前記立体映像コンテンツの各フレームデータの内容を分析し、フレーム補間に基づいて、各チャンクのサイズが最も小さくなるように、前記各メッシュフレームデータを複数のチャンクに分割することで、前記複数の第1のチャンクデータを作成する、請求項1に記載の配信装置。 - 前記第2のチャンク作成部は、
前記各テクスチャフレームデータのうち、互いに隣り合う時刻のテクスチャフレームデータ同士を時系列順に分析し、互いに隣り合う時刻のテクスチャフレームデータ間で前記テクスチャの構造が所定以上変化した場合、前記テクスチャの構造が所定以上変化する前までの各テクスチャフレームデータを1つのチャンクとして前記各テクスチャフレームデータを複数のチャンクに分割することで、前記複数の第2のチャンクデータを作成する、請求項1又は2に記載の配信装置。 - 前記テクスチャの構造は、前記テクスチャの明るさ、色、濃淡、模様のパターンの少なくとも1つである、請求項3に記載の配信装置。
- 前記複数の第1のチャンクデータそれぞれのチャンク番号及びデータサイズと、前記複数の第2のチャンクデータそれぞれのチャンク番号及びデータサイズとが含まれるチャンク情報を作成するチャンク情報作成部と、
前記端末からの視聴開始要求に応じて、前記視聴開始要求に係るチャンク情報を前記端末に送信するチャンク情報配信部と、を有し、
前記チャンク配信要求には、前記端末において、前記チャンク情報に基づいて決定されたチャンク番号が含まれる、請求項1乃至4の何れか一項に記載の配信装置。 - ポリゴンメッシュとテクスチャとで構成される物体の立体映像コンテンツを端末に配信するコンピュータが、
前記ポリゴンメッシュの各フレームデータをそれぞれ表す各メッシュフレームデータから複数の第1のチャンクデータを作成する第1のチャンク作成手順と、
前記テクスチャの各フレームデータをそれぞれ表す各テクスチャフレームデータから複数の第2のチャンクデータを作成する第2のチャンク作成手順と、
前記端末からのチャンク配信要求に応じて、前記チャンク配信要求に係る第1のチャンクデータ及び第2のチャンクデータの少なくとも一方を前記端末に送信するチャンク配信手順と、
を実行する配信方法。 - コンピュータを、請求項1乃至5の何れか一項に記載の配信装置として機能させるプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2021/041968 WO2023084789A1 (ja) | 2021-11-15 | 2021-11-15 | 配信装置、配信方法及びプログラム |
JP2023559395A JPWO2023084789A1 (ja) | 2021-11-15 | 2021-11-15 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2021/041968 WO2023084789A1 (ja) | 2021-11-15 | 2021-11-15 | 配信装置、配信方法及びプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
WO2023084789A1 true WO2023084789A1 (ja) | 2023-05-19 |
Family
ID=86335564
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PCT/JP2021/041968 WO2023084789A1 (ja) | 2021-11-15 | 2021-11-15 | 配信装置、配信方法及びプログラム |
Country Status (2)
Country | Link |
---|---|
JP (1) | JPWO2023084789A1 (ja) |
WO (1) | WO2023084789A1 (ja) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150262421A1 (en) * | 2014-03-14 | 2015-09-17 | Matterport, Inc. | Processing and/or transmitting 3d data |
US20190035129A1 (en) * | 2017-07-28 | 2019-01-31 | Baobab Studios Inc. | Systems and methods for real-time complex character animations and interactivity |
-
2021
- 2021-11-15 WO PCT/JP2021/041968 patent/WO2023084789A1/ja active Application Filing
- 2021-11-15 JP JP2023559395A patent/JPWO2023084789A1/ja active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150262421A1 (en) * | 2014-03-14 | 2015-09-17 | Matterport, Inc. | Processing and/or transmitting 3d data |
US20190035129A1 (en) * | 2017-07-28 | 2019-01-31 | Baobab Studios Inc. | Systems and methods for real-time complex character animations and interactivity |
Non-Patent Citations (2)
Title |
---|
GUL SERHAN, PODBORSKI DIMITRI, BUCHHOLZ THOMAS, SCHIERL THOMAS, HELLGE CORNELIUS: "Low-latency cloud-based volumetric video streaming using head motion prediction", PROCEEDINGS OF THE 30TH ACM WORKSHOP ON NETWORK AND OPERATING SYSTEMS SUPPORT FOR DIGITAL AUDIO AND VIDEO, ACMPUB27, NEW YORK, NY, USA, 10 June 2020 (2020-06-10) - 11 June 2020 (2020-06-11), New York, NY, USA , pages 27 - 33, XP058459582, ISBN: 978-1-4503-7945-8, DOI: 10.1145/3386290.3396933 * |
SERGIO ORTS-ESCOLANO ; CHRISTOPH RHEMANN ; SEAN FANELLO ; WAYNE CHANG ; ADARSH KOWDLE ; YURY DEGTYAREV ; DAVID KIM ; PHILIP: "Holoportaion; Virtual 3D Teleportation in Real-time", UIST'16: PROCEEDINGS OF THE 29TH ANNUAL SYMPOSIUM ON USER INTERFACE SOFTWARE AND TECHNOLOGY, 16 October 2016 (2016-10-16) - 19 October 2016 (2016-10-19), pages 741 - 754, XP058299654, ISBN: 978-1-4503-4189-9, DOI: 10.1145/2984511.2984517 * |
Also Published As
Publication number | Publication date |
---|---|
JPWO2023084789A1 (ja) | 2023-05-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112104879B (zh) | 一种视频编码方法、装置、电子设备及存储介质 | |
JP7205485B2 (ja) | Vrビデオ用に画像解像度を最適化してビデオストリーミングの帯域幅を最適化する画像処理のための方法及びストリーミングサーバ | |
EP2672452B1 (en) | Moving image distribution server, moving image playback device, control method, program, and recording medium | |
KR102027410B1 (ko) | 계층화된 신호 품질 계층에서의 재구성 데이터의 송신 | |
US11128903B2 (en) | Systems and methods of orchestrated networked application services | |
JP2022516847A (ja) | 適応ポイントクラウド属性コーディングのための方法、装置、及びコンピュータプログラム | |
EP2897367A1 (en) | Methods and systems of storage level video fragment management | |
WO2017107911A1 (zh) | 一种视频云平台播放视频的方法及装置 | |
KR20080049710A (ko) | 임의 포맷의 대형 객체의 통신을 지원하기 위한 원격프로토콜 | |
US9530451B2 (en) | Reducing network bandwidth usage in a distributed video editing system | |
KR20120058227A (ko) | 프리젠테이션 가상화를 위한 화면 부호화 방법 및 서버 | |
WO2020261689A1 (ja) | 情報処理装置、情報処理方法、再生処理装置及び再生処理方法 | |
US20130031149A1 (en) | Systems and methods of distributed file storage | |
Haynes et al. | Visualcloud demonstration: A dbms for virtual reality | |
WO2023084789A1 (ja) | 配信装置、配信方法及びプログラム | |
US10469794B2 (en) | Information processing apparatus, information processing method, and information processing system for content management using play lists | |
Vats et al. | Semantic-aware view prediction for 360-degree videos at the 5g edge | |
WO2022149189A1 (ja) | 配信制御装置、配信制御システム、配信制御方法、及びプログラム | |
US10521086B1 (en) | Frame interpolation for media streaming | |
Tang et al. | Hybrid remote display protocol for mobile thin client computing | |
US20240144602A1 (en) | Distribution control system, distribution control apparatus, distribution control method, and program | |
JP2022063882A (ja) | 情報処理装置および方法、並びに、再生装置および方法 | |
JP7234776B2 (ja) | 受信データ表示プログラム、受信データ表示方法、及び電子機器 | |
US10135896B1 (en) | Systems and methods providing metadata for media streaming | |
Matsui et al. | Virtual desktop display acceleration technology: RVEC |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 21964142 Country of ref document: EP Kind code of ref document: A1 |
|
WWE | Wipo information: entry into national phase |
Ref document number: 2023559395 Country of ref document: JP |
|
WWE | Wipo information: entry into national phase |
Ref document number: 18709239 Country of ref document: US |