JP2022049708A - 生成装置、3次元データ送信装置、及び3次元データ再生装置 - Google Patents

生成装置、3次元データ送信装置、及び3次元データ再生装置 Download PDF

Info

Publication number
JP2022049708A
JP2022049708A JP2018243372A JP2018243372A JP2022049708A JP 2022049708 A JP2022049708 A JP 2022049708A JP 2018243372 A JP2018243372 A JP 2018243372A JP 2018243372 A JP2018243372 A JP 2018243372A JP 2022049708 A JP2022049708 A JP 2022049708A
Authority
JP
Japan
Prior art keywords
image data
data
image
dimensional data
dimensional
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2018243372A
Other languages
English (en)
Inventor
靖昭 徳毛
Yasuaki Tokuge
智幸 山本
Tomoyuki Yamamoto
恭平 池田
Kyohei Ikeda
敦稔 〆野
Atsutoshi Simeno
真毅 高橋
Masatake Takahashi
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2018243372A priority Critical patent/JP2022049708A/ja
Priority to PCT/JP2019/050083 priority patent/WO2020137876A1/ja
Publication of JP2022049708A publication Critical patent/JP2022049708A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/238Interfacing the downstream path of the transmission network, e.g. adapting the transmission rate of a video stream to network bandwidth; Processing of multiplex streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/438Interfacing the downstream path of the transmission network originating from a server, e.g. retrieving encoded video stream packets from an IP network

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

【課題】画像品位の低下を抑制し、通信量および通信に係る処理を軽減させる。【解決手段】生成装置であって、複数の視点方向に対応する各画像を含む第1種の画像データと、1又は複数の視点方向に対応する各画像を含む第2種の画像データとの参照先を示すメタ情報を生成するメタ情報生成部(113)を備え、第2種の画像データは、何れかの視点方向について、解像度が第1種の画像データに含まれる画像よりも高い画像を含む。【選択図】図1

Description

本発明の一態様は、メタ情報を生成する生成装置、3次元データ送信装置、及び3次元データ再生装置に関する。
近年、映像を配信するための様々な技術が開発されている。映像を配信するための技術としては、MPEG(Moving Picture Experts Group)にて現在標準化作業が進められているDASH(Dynamic Adaptive Streaming over HTTP)が挙げられる(非特許文献1)。DASHでは、MPD(Media Presentation Description)データ等のメタデータのフォーマットが規定されている。
ISO/IEC 23009-1 Second edition 2014-05-15
しかしながら、上述のような従来技術においては、3次元データを再生する場合に、再生時の視点方向からでは見えない部分についても不必要に高精細な画像を取得しており、通信量および通信に係る処理が増大するという問題がある。
本発明の一態様は、上記の課題に鑑みてなされたものであり、3次元データ再生時における画像品位の低下を抑制しつつ、通信量および通信に係る処理を軽減させるためのメタ情報を生成する生成装置を実現することを目的とする。
上記の課題を解決するために、本発明の一態様に係る生成装置は、3次元データに関するメタ情報を生成する生成装置であって、前記3次元データを構成する1又は複数の第1種の画像データであって、複数の視点方向に対応する各画像を含む1又は複数の第1種の画像データと、前記3次元データを構成する複数の第2種の画像データであって、1又は複数の視点方向に対応する各画像を含む複数の第2種の画像データとの参照先を示すメタ情報を生成するメタ情報生成部を備えており、前記複数の第2種の画像データは、少なくとも何れかの視点方向について、解像度が前記第1種の画像データに含まれる画像よりも高い画像を含む。
本発明の一態様によれば、3次元データ再生時における画像品位の低下を抑制しつつ、通信量および通信に係る処理を軽減させるためのメタ情報を生成する生成装置を実現できる。
実施形態1に係る3次元データ送信装置の機能ブロック図である。 実施形態1に係る3次元データ再生装置の機能ブロック図である。 3次元モデルに対する各視点方向を示す図およびMPDの概要を示す図である。 メッシュモデルである3次元モデルを上方向から見た場合における3次元データの概要を示す図である。 デプス画像生成部が生成する画像データであって、各視点方向に対応するデプス画像を含む画像データを示す図である。 MPDの記述例を示す図である。 実施形態1に係る処理の流れを示すフローチャートである。 ポイントクラウドである3次元モデルを上方向から見た場合における3次元データの概要を示す図である。 3次元モデルに対する各視点方向を示す図およびMPDの概要を示す図である。 メッシュモデルである3次元モデルを上方向から見た場合における3次元データの概要を示す図である。 デプス画像生成部が生成する画像データであって、各視点方向に対応するデプス画像を含む画像データを示す図である。 MPDの記述例を示す図である。 実施形態2に係る処理の流れを示すフローチャートである。 ポイントクラウドである3次元モデルを上方向から見た場合における3次元データの概要を示す図である。
以下、本発明の実施形態について、詳細に説明する。ただし、本実施形態に記載されている構成は、特に特定的な記載がない限り、この発明の範囲をそれのみに限定する趣旨ではなく、単なる説明例に過ぎない。
〔実施形態1〕
本発明の第1の実施形態について図1~図7を参照して説明する。本実施形態においては、後述する3次元データ再生装置が、メタ情報の一種であるMPD(Media Presentation Description)を参照して単一のストリームによって3次元データを示すセグメントデータを取得し、再生する工程の一例について説明する。ここで、3次元データとは、点群やメッシュによって表現される立体的な3次元モデルを示すデータである。また、セグメントデータとは、3次元データを時分割したHTTP伝送の伝送単位(例えば、ISOBMFF(ISO Base Media File Format)をベースにしたデータ)である。
以下、3次元データの参照先を示すメタ情報としてMPDを例に挙げて説明するが、これに限定されず、例えば、MPDに準ずるXML(eXtensible Markup Language)等であってもよい。
本実施形態に係る各装置における主な工程として、以下の(1)~(4)が実行される。
(1)3次元データ送信装置が、取得した3次元モデルを参照して3次元データを示すセグメントデータと、当該セグメントデータの参照先を示すMPDとを生成する。
(2)3次元データ再生装置が、MPDと3次元データ再生時における視点位置および視点方向とを取得する。なお、本明細書においては、視点位置および視点方向を、単に視点方向と呼称することもある。
(3)3次元データ再生装置が、MPDを参照して当該視点方向に応じたセグメントデータを単一のストリームによって取得する。
(4)3次元データ再生装置が、当該セグメントデータを参照して3次元データを再生する。
以下、3次元データ再生装置においては、3次元モデルを対象とした映像、即ち動画が再生されるものとして説明するが、これに限定されず単に静止画であってもよい。また、本実施形態において、3次元モデルは、メッシュモデルであるものとして説明する。
〔1.3次元データ送信装置100の構成〕
図1は、本実施形態に係る3次元データ送信装置100の機能ブロック図である。図1に示す通り、3次元データ送信装置100は、制御部110、記憶部120、及び通信部130を備えている。
制御部110は、3次元データ送信装置100全体を統括する制御装置であって、視点受付部111、デプス画像生成部112、メタ情報生成部113、および符号化部114としても機能する。
視点受付部111は、3次元モデルに対する各視点位置及び視点方向となる仮想視点を取得または設定する。デプス画像生成部112は、入力された3次元モデルを対象とするデプス画像を生成する。ここで、デプス画像とは、各画素にデプス値が割り当てられた画像である。また、ここでのデプス値は、視点受付部111から入力された視点位置を基準とした値が割り当てられる。
メタ情報生成部113は、視点受付部111から入力された視点位置と、デプス画像生成部112が生成したデプス画像とから、3次元データを示すセグメントデータの参照先を示すMPDを生成する。当該MPDの詳細については後述する。符号化部114は、デプス画像生成部112から入力されたデプス画像を符号化する。また、制御部110は、通信部130による通信処理に関する制御を行う通信制御部としても機能する。
記憶部120は、各種データを格納する記憶装置であって、メタ情報記憶部121およびセグメントデータ記憶部122としても機能する。メタ情報記憶部121は、MPDを示す情報を格納する。また、セグメントデータ記憶部122は、セグメントデータを格納する。
通信部130は、3次元データ再生装置200等の外部装置との通信処理を行うインターフェースであって、メタ情報送信部(第1送信部)131およびセグメントデータ送信部(第2送信部)132としても機能する。メタ情報送信部131は、MPDを示す情報を送信する。また、セグメントデータ送信部132は、セグメントデータを送信する。
〔2.3次元データ再生装置200の構成〕
図2は、本実施形態に係る3次元データ再生装置200の機能ブロック図である。図2に示す通り、3次元データ再生装置200は、制御部210、通信部230、表示部240、及びMPDを示す情報等を少なくとも一時的に格納する、図示しない記憶部(メモリ)を備える。
制御部210は、3次元データ再生装置200全体を統括する制御装置であって、視点受付部(第2取得部)211、選択部212、及び再生部213としても機能する。
視点受付部211は、3次元データを再生する場合における視点方向を取得する。選択部212は、後述するメタ情報取得部231が取得したMPDに参照先が記述されたセグメントデータについて、視点受付部211が取得した視点方向に対応するセグメントデータを選択する。
再生部213は、入力されたセグメントデータを参照して3次元データを再生する部材であって、復号部214、3次元モデル生成部215および視点画像合成部216としても機能する。
復号部214は、入力されたセグメントデータを復号する。3次元モデル生成部215は、復号されたセグメントデータを参照して3次元モデルを生成する。視点画像合成部216は、3次元データを再生する場合における視点位置を参照して当該視点位置から見た3次元モデルを示す画像を合成する。
また、制御部210は、通信部230による通信処理に関する制御を行う通信制御部、及び表示部240による表示処理に関する制御を行う表示制御部としても機能する。
通信部230は、3次元データ送信装置100等の外部装置との通信処理を行うインターフェースであって、メタ情報取得部(第1取得部)231およびセグメントデータ取得部(第3取得部)232としても機能する。メタ情報取得部231は、MPDを示す情報を取得する。セグメントデータ取得部232は、選択部212が選択したセグメントデータを取得する。また、表示部240は、動画像を表示可能な表示パネルである。
〔3.MPDについて〕
本実施形態における3次元データの概要、及びメタ情報生成部113が生成するMPDの一例について説明する。図3(A)は、3次元空間上における3次元モデルに対する各視点方向を示す図である。また、図3(B)は、MPDの概要を示す図である。以下、3次元モデルまたは3次元空間に対する視点方向として、図3(A)のv1~v4に示す4つの視点方向を例に挙げて説明するが、当該視点方向の数は、例えば2又は3であってもよいし、5以上であってもよい。
図3(B)に示すMPDのAdaptationSet(a)~(e)は、何れも視点方向v1~v4から見た3次元モデルを示すデプス画像のセグメントデータの参照先を内包している。なお、MPDは、上位の階層要素から順に、MPD要素、Period要素、AdaptationSet要素、Representation要素、SegmentList要素、及び、SegmentURL要素を含む木構造となっており、後述する図6等においては、一部の要素が省略されている。また、SegmentURL要素が、上述したセグメントデータの参照先に相当する。
図3(B)において、AdaptationSet(a)は、3次元モデル全体を一様な解像度でエンコードしたセグメントデータの参照先を示している。また、AdaptationSet(b)~(e)は、何れかの視点方向について、(a)よりも解像度が高く、他の視点方向については(a)よりも解像度が低いセグメントデータの参照先を示している。
図4は、メッシュモデルである3次元モデルを上方向から見た場合における3次元データの概要を示す図である。また、図5は、デプス画像生成部112が生成する画像データであって、各視点方向に対応するデプス画像を含む画像データを示す図である。また、前記画像データ自体もデプス画像である。ここで、図5(a)に示す画像データは、第1種の画像データの一例に相当する。また、図5(b)および図示しない図5(c)~(e)に示す画像データは、第2種の画像データに相当する。
また、図6は、MPDの記述例を示す図である。ここで、図4~図6における(a)~(e)は、図3(B)におけるAdaptationSet(a)~(e)に対応する。また、図4~図6に示す例において、(a)は、各視点方向について一様な映像品質であるXGA画像がパッキングされた第1種の画像データの一例に対応する。また、(b)~(e)は何れかの視点方向についてXGA画像よりも解像度が高いFHD画像と、当該視点方向以外の視点方向についてXGA画像よりも解像度が低いVGA画像とがパッキングされた第2種の画像データの一例に対応する。
図6に例示するMPDにおいて、AdaptationSet(a)は、上述したように各視点方向について映像品質、即ちパッキングされた画像の解像度が一様であり、ViewPointQualityタグが付加されていない。一方で、AdaptationSet(b)~(e)は、各視点方向について映像品質が一様でなく、ViewPointQualityタグが付加されている。また、例えば(b)に含まれるViewPointQualityタグにおいては、quality=”high”の値を有するviewpointが、視点方向v1に対応する。また、例えば、当該viewpointにおける、(x1,y1,z1)は、視点位置を示している。また、(p1,q1,r1)は、当該視点位置からの、3次元モデルに対する視点方向を示している。また、他のAdaptationSetおよびviewpointについても同様に説明される。
また、各AdaptationSetが内包する1又は複数のRepresentationのそれぞれには、互いに異なるビットレートの映像に対応するセグメントデータであって、各解像度の画像が同様にパッキングされた画像データを示すセグメントデータの参照先が含まれている。
ここで、Representationタグに含まれる属性bandwidthは、当該Representationに対応するセグメントデータを受信・再生するために必要なネットワーク帯域を示している。また、同一のAdaptationSetに含まれる各Representationにおいては、対応するセグメントデータのビットレートが高い程、bandwidthの値は大きい値となる。
また、3次元データに関するメタ情報を生成する生成装置は、当該生成装置が、メタ情報を生成するメタ情報生成部113を備えるか、メタ情報生成部113自体であることによって実現される。即ち、本実施形態に係る、3次元データに関するメタ情報を生成する生成装置は、3次元データを構成する1又は複数の第1種の画像データであって、複数の視点方向に対応する各画像を含む1又は複数の第1種の画像データと、3次元データを構成する複数の第2種の画像データであって、1又は複数の視点方向に対応する各画像を含む複数の第2種の画像データとの参照先を示すメタ情報を生成するメタ情報生成部113を備えており、前記複数の第2種の画像データは、少なくとも何れかの視点方向について、解像度が前記第1種の画像データに含まれる画像よりも高い画像を含む構成であってもよい。
上記の構成によれば、3次元データ再生時における画像品位の低下を抑制しつつ、通信量および通信に係る処理を軽減させるためのメタ情報を生成する生成装置を実現できる。
また、メタ情報を生成する生成装置は、図6に例示するように、メタ情報として、各視点方向に対応する各画像の解像度を識別するViewPointQualityタグを含むMPDを生成してもよい。これにより、ViewPointQualityタグによって解像度を識別可能なMPDを生成する生成装置を実現できる。
〔4.3次元データ再生に係る処理の流れ〕
本実施形態に係る3次元データ送信装置100および3次元データ再生装置200による3次元データの生成および再生に係る処理の流れについて図7を参照して説明する。図7は、本実施形態に係る処理の流れを示すフローチャートである。
また、以下の各ステップにおいて、ステップS101~S103は、3次元データ送信装置100における処理であり、ステップS104~S114は、3次元データ再生装置200における処理である。
ステップS101において、デプス画像生成部112は、入力された3次元モデルと、視点受付部111から入力された仮想視点と参照して、仮想視点を基準としたデプス画像を生成する。
ステップS102において、メタ情報生成部113は、デプス画像生成部112が生成したデプス画像と当該仮想視点とを参照してMPDを生成する。また、制御部110は、生成したMPDをメタ情報記憶部121に格納する。
ステップS103において、符号化部114は、デプス画像生成部112が生成したデプス画像を符号化する。また、制御部110は、符号化したデプス画像を、セグメントデータとして、セグメントデータ記憶部122に格納する。また、制御部110は、生成したMPDが示すセグメントデータの参照先と、セグメントデータ記憶部122に格納する格納先とをURLを介して整合させる。
ステップS104以降の処理は、3次元データ再生装置200における処理である。ステップS104において、メタ情報取得部231は、3次元データ送信装置100からMPDを取得する。
ステップS105において、選択部212は、メタ情報取得部231が取得したMPDについて、ViewPointQualityタグが付加されたAdaptationSetを抽出する。また、当該AdaptationSetは、図6の例における(b)~(e)のAdaptationSetに相当する。
ステップS106において、選択部212は、抽出されたAdaptationSetのViewPointQualityタグについて、quality=“high”の値を有するviewpointが示す視線ベクトルと、視点受付部211が取得した視点方向が示す視点ベクトルとの差分の最も小さいAdaptationSetを抽出する。
ステップS107において、選択部212は、当該差分が所定の閾値であるTh未満であるか否かを判定する。選択部212が、当該差分がTh未満であると判定した場合には、続いてステップS108の処理が実行され、当該差分がTH以上であると判定した場合には、続いてステップS109の処理が実行される。
ステップS108において、選択部212は、ステップS106で抽出したAdaptationSetを、セグメントデータ取得部232が取得するセグメントデータの参照元として決定する。また、当該セグメントデータは、第2種の画像データに対応する。
ステップS109において、選択部212は、ViewPointQualityタグが付加されていないAdaptationSetを、セグメントデータ取得部232が取得するセグメントデータの参照元として決定する。また、当該セグメントデータは、第1種の画像データに対応する。また、上述したように、当該AdaptationSetは、図6の例における(a)のAdaptationSetに相当する。ステップS106からステップS109において上述した工程によれば、3次元データ再生装置200は、視点方向に応じた好適な画像データを取得できる。
ステップS110において、選択部212は、ステップS108またはステップS109において決定したAdaptationSetから、3次元データを再生する場合におけるビットレートに対応するRepresentationを選択する。また、選択部212は、Representationを選択する場合に、各Representationタグに含まれる属性bandwidthの値を参照して好適なビットレートを選択してもよい。また、セグメントデータ取得部232は、当該Representationが示す参照先から、セグメントデータ送信部132によって送信されたセグメントデータを取得する。なお、3次元データを再生する場合におけるビットレートは、3次元データ送信装置100、3次元データ再生装置200間における回線速度に応じて決定されてもよいし、ユーザが3次元データ再生装置200を操作することによって指定可能であってもよい。
ステップS111において、復号部214は、セグメントデータ取得部232が取得したセグメントデータを復号する。
ステップS112において、3次元モデル生成部215は、復号されたセグメントデータを参照して3次元モデルを生成する。
ステップS113において、視点画像合成部216は、視点受付部211から入力された視点位置から見た3次元モデルを示す画像を合成する。
ステップS114において、再生部213は、当該画像を表示部240に表示させる。
上述したように、本実施形態に係る3次元データ送信装置100は、3次元データを送信する3次元データ送信装置100であって、メタ情報生成装置(メタ情報生成部)113と、メタ情報生成装置が生成したメタ情報を外部装置に送信する第1送信部(メタ情報送信部)131と、前記外部装置からの要求に応答して、前記第1種の画像データおよび前記第2種の画像データの少なくとも何れかを、前記外部装置に送信する第2送信部(セグメントデータ送信部)132と、を備えている構成である。上記の構成によれば、メタ情報、並びに第1種の画像データおよび第2種の画像データの少なくとも何れかを外部装置に送信可能な3次元データ送信装置100を実現できる。
また、上述したように、本実施形態に係る3次元データ再生装置200は、3次元データを再生する3次元データ再生装置200であって、3次元データを構成する1又は複数の第1種の画像データであって、複数の視点方向に対応する各画像を含む1又は複数の第1種の画像データと、3次元データを構成する複数の第2種の画像データであって、1又は複数の視点方向に対応する各画像を含む複数の第2種の画像データとの参照先を示すメタ情報を取得する第1取得部(メタ情報取得部)231と、3次元データを再生する場合における、3次元データが示すオブジェクトに対する視点方向を取得する第2取得部(視点受付部)211と、当該視点方向に対応する参照先であって、前記メタ情報が示す参照先から、3次元データの再生に要する、前記第1種の画像データおよび前記第2種の画像データの少なくとも何れかを取得する第3取得部(セグメントデータ取得部)232と、前記第3取得部が取得した第1種の画像データおよび前記第2種の画像データの少なくとも何れかを参照して、前記3次元データを再生する再生部213と、を備えており、前記複数の第2種の画像データは、少なくとも何れかの視点方向について、解像度が前記第1種の画像データに含まれる画像よりも高い画像を含む構成である。上記の構成によれば、上述したメタ情報を参照して画像データを取得し、3次元データを再生可能な3次元データ再生装置200を実現できる。
〔実施形態1の変形例〕
本変形例においては、3次元モデルがメッシュモデルではなく、ポイントクラウド(点群)である場合について図8を参照して説明する。なお、説明の便宜上、上記実施形態にて説明した事項についての重複する説明を繰り返さない。
図8は、ポイントクラウドである3次元モデルを上方向から見た場合における3次元データの概要を示す図である。また、図8は、実施形態1における図4に対応する。
3次元モデルがポイントクラウドである場合、デプス画像生成部112は、各視点方向について、1/2サブサンプルした点群を示すデプス画像、即ち点の数を元の3次元モデルから1/2に間引いたデプス画像を含む第1種の画像データ、及び、所定の視点方向について点の数を元の3次元モデルから間引かずにサンプリングした点群を示すデプス画像と、当該視点方向以外の視点方向について、1/4サブサンプルした点群を示すデプス画像、即ち点の数を元の3次元モデルから1/4に間引いたデプス画像とを含む第2種の画像データを生成する。ここで、第1種の画像データは、図8(a)に対応し、第2種の画像データは、図8(b)~(e)に対応する。本変形例の構成においてもメタ情報生成部113は、実施形態1と同様のMPDを生成し、以降の処理に使用することができる。
〔実施形態2〕
本発明の第2の実施形態について、図1、2、及び図9~図13を参照して説明する。なお、説明の便宜上、上記実施形態にて説明した部材と同じ機能を有する部材については、同じ符号を付記し、その説明を繰り返さない。本実施形態においては、3次元データ再生装置が、MPDを参照して互いに異なる複数のストリームによって3次元データを示すセグメントデータを取得し、再生する工程の一例について説明する。以下、当該ストリームの数は2つであるものとして説明するが、これに限定されず、3以上のストリームが使用されることによって、本実施形態で説明する処理が実現されてもよい。
本実施形態に係る各装置における主な工程として、以下の(1)~(4)が実行される。
(1)3次元データ送信装置が、取得した3次元モデルを参照して3次元データを示すセグメントデータと、当該セグメントデータの参照先を示すMPDとを生成する。
(2)3次元データ再生装置が、MPDと3次元データ再生時における視点方向を取得する。
(3)3次元データ再生装置が、MPDを参照して、3次元モデル全体の概要を示すセグメントデータと当該視点方向に応じたセグメントデータとを2つのストリームによって取得する。
(4)3次元データ再生装置が、各セグメントデータを参照して3次元データを再生する。
〔1.3次元データ送信装置100の構成〕
本実施形態においても図1に示す3次元データ送信装置100の構成を用いる。ただし、セグメントデータ送信部132は、2つのセグメントデータを2つのストリームによって並行して外部の装置に送信する機能を有する。
〔2.3次元データ再生装置200の構成〕
本実施形態においても図2に示す3次元データ再生装置200の構成を用いる。ただし、セグメントデータ取得部232は、セグメントデータを2つのストリームによって並行して外部の装置から取得する機能を有する。
〔3.MPDについて〕
本実施形態における3次元データの概要、及びメタ情報生成部113が生成するMPDの一例について説明する。図9(A)は、3次元空間上における3次元モデルに対する各視点方向を示す図である。図9(A)は、図3(A)と同一であり、本実施形態においてもv1~v4に示す4つの視点方向を例に挙げて説明する。
図9(B)は、MPDの概要を示しており、図3(B)の構成とは互いに異なる。図9(B)において、AdaptationSet(a)は、図3(B)の構成と同様に、3次元モデル全体を一様な解像度でエンコードしたセグメントデータを示している。一方で、AdaptationSet(b)~(e)は、何れかの視点方向について(a)よりも解像度が高いデプス画像を含む第2種の画像データを示すセグメントデータの参照先を内包しているが、各第2種の画像データは、図10(b)~(e)および図11(b)に示すように、他の視点方向についてのデプス画像を含んでいない。
ここで、図10は、メッシュモデルである3次元モデルを上方向から見た場合における3次元データの概要を示す図である。また、図11は、デプス画像生成部112が生成する画像データであって、各視点方向に対応するデプス画像を含む画像データを示す図である。
また、図12は、MPDの記述例を示す図である。ここで、図10~図12における(a)~(e)は、図9(B)におけるAdaptationSet(a)~(e)に対応する。
また、図10~図12に示す例において、(a)は、各視点方向について一様な映像品質であるVGA画像がパッキングされた第1種の画像データの一例に対応する。また、(b)~(e)は何れかの視点方向についてVGA画像およびXGA画像よりも解像度が高いFHD画像を含む第2種の画像データの一例に対応する。
図12に例示するMPDにおいては。各AdaptationSetがgroupの属性を有し、0または1の値を有している。これは、3次元データ再生装置200が3次元データを再生する場合に、group=0の値を有するAdaptationSetに由来するセグメントデータと、group=1の値を有するAdaptationSetに由来するセグメントデータとが、少なくとも1つずつ必要なことが規定されていることを示している。
〔4.3次元データ再生に係る処理の流れ〕
本実施形態に係る3次元データ送信装置100および3次元データ再生装置200による3次元データの生成および再生に係る処理の流れについて図13を参照して説明する。図13は、本実施形態に係る処理の流れを示すフローチャートである。
ステップS101からステップS106までは、実施形態1と同様の処理が行われる。ただし、ステップS102でメタ情報生成部113が生成し、処理対象となるMPDは、図12に例示したMPDである。ステップS106の処理が実行されたのち、続いてステップS207の処理が実行される。
ステップS207において、選択部212は、ステップS104で取得部が取得したMPDについて、group=0の値を有するAdaptationSetから、3次元データを再生する場合におけるビットレートに対応するRepresentationを選択する。ここで、group=0の値を有するAdaptationSetとは、図12の例における(a)のAdaptationSetに相当する。また、選択部212は、本ステップS207および後述するステップS208においてRepresentationを選択する場合に、各Representationタグに含まれる属性bandwidthの値を参照して好適なビットレートを選択してもよい。また、セグメントデータ取得部232は、当該Representationが示す参照先から、セグメントデータ送信部132によって送信されたセグメントデータを取得する。また、当該セグメントデータは、第1種の画像データに対応する。
ステップS208において、選択部212は、ステップS105で選択した、group=1の値を有するAdaptationSetから、3次元データを再生する場合におけるビットレートに対応するRepresentationを選択する。ここで、group=1の値を有するAdaptationSetとは、図12の例における(b)~(e)のAdaptationSetに相当する。また、セグメントデータ取得部232は、当該Representationが示す参照先から、セグメントデータ送信部132によって送信されたセグメントデータを取得する。また、当該セグメントデータは、第2種の画像データに対応する。
また、ステップS207とステップS208とにおけるセグメントデータ取得部232の処理は並行してなされてもよい。即ち、セグメントデータ送信部132は、2つのストリームのうち一方のストリームを使用してステップS207における第1種の画像データに対応するセグメントデータを送信しつつ、もう一方のストリームを使用してステップS208における第2種の画像データに対応するセグメントデータを送信し、セグメントデータ取得部232が各画像データを並行して取得してもよい。
ステップS207の処理およびステップS208の処理が実行されたのち、続いてステップS111の処理が実行される。
ステップS111からステップS114においては、実施形態1と同様の処理が実行させる。なお、ステップS112において、3次元モデル生成部215が映像の各フレームに対応する3次元モデルを生成する場合には、第2種の画像データに対応するセグメントデータのみを参照し、第1種の画像データに対応するセグメントデータを参照しない、ということは行われない。
〔実施形態2の変形例1〕
本変形例においては、3次元モデルがメッシュモデルではなく、ポイントクラウド(点群)である場合について図14を参照して説明する。なお、説明の便宜上、上記実施形態にて説明した事項についての重複する説明を繰り返さない。
図14は、ポイントクラウドである3次元モデルを上方向から見た場合における3次元データの概要を示す図である。また、図14は、実施形態2における図10に対応する。
3次元モデルがポイントクラウドである場合、デプス画像生成部112は、各視点方向について、1/4サブサンプルした点群を示すデプス画像、即ち点の数を元の3次元モデルから1/4に間引いたデプス画像を含む第1種の画像データ、及び、所定の視点方向について3/4サブサンプルした点群であって、元の3次元モデルと、第1種の画像データに含まれるデプス画像が示す点群との差分となる点群を示すデプス画像を含む第2種の画像データを生成する。ここで、第1種の画像データは、図14(a)に対応し、第2種の画像データは、図14(b)~(e)に対応する。
本変形例の構成においてもメタ情報生成部113は、実施形態2と同様のMPDを生成し、以降の処理に使用することができる。
〔実施形態2の変形例2〕
実施形態2の第2の変形例について説明する。なお、説明の便宜上、上記実施形態にて説明した事項についての重複する説明を繰り返さない。
ステップS207およびステップS208において、セグメントデータ送信部132は、単一のストリームにおける複数のレイヤーによって、第1種の画像データに対応するセグメントデータと、第2種の画像データとを、3次元データ再生装置200に送信する構成でもよい。また、複数のレイヤーとは、例えばベースレイヤーとエンハンスメントレイヤーとの2つのレイヤーであってもよい。
本変形例の構成によれば、セグメントデータ取得部232は、単一のストリームによって、第1種の画像データに対応するセグメントデータと第2種の画像データに対応するセグメントデータとを並行して取得できる。なお、本変形例の構成は、実施形態2の変形例1に対しても適用可能である。
〔ソフトウェアによる実現例〕
3次元データ送信装置100の制御ブロック(特に視点受付部111、デプス画像生成部112、メタ情報生成部113および符号化部114)、並びに3次元データ再生装置200の制御ブロック(特に視点受付部211、選択部212、再生部213)は、集積回路(ICチップ)等に形成された論理回路(ハードウェア)によって実現してもよいし、ソフトウェアによって実現してもよい。
後者の場合、3次元データ送信装置100および3次元データ再生装置200は、各機能を実現するソフトウェアであるプログラムの命令を実行するコンピュータを備えている。このコンピュータは、例えば少なくとも1つのプロセッサ(制御装置)を備えていると共に、上記プログラムを記憶したコンピュータ読み取り可能な少なくとも1つの記録媒体を備えている。そして、上記コンピュータにおいて、上記プロセッサが上記プログラムを上記記録媒体から読み取って実行することにより、本発明の目的が達成される。上記プロセッサとしては、例えばCPU(Central Processing Unit)を用いることができる。上記記録媒体としては、「一時的でない有形の媒体」、例えば、ROM(Read Only Memory)等の他、テープ、ディスク、カード、半導体メモリ、プログラマブルな論理回路などを用いることができる。また、上記プログラムを展開するRAM(Random Access Memory)などをさらに備えていてもよい。また、上記プログラムは、該プログラムを伝送可能な任意の伝送媒体(通信ネットワークや放送波等)を介して上記コンピュータに供給されてもよい。なお、本発明の一態様は、上記プログラムが電子的な伝送によって具現化された、搬送波に埋め込まれたデータ信号の形態でも実現され得る。
〔まとめ〕
本発明の態様1に係る生成装置は、3次元データに関するメタ情報を生成する生成装置であって、前記3次元データを構成する1又は複数の第1種の画像データであって、複数の視点方向に対応する各画像を含む1又は複数の第1種の画像データと、前記3次元データを構成する複数の第2種の画像データであって、1又は複数の視点方向に対応する各画像を含む複数の第2種の画像データとの参照先を示すメタ情報を生成するメタ情報生成部(113)を備えており、前記複数の第2種の画像データは、少なくとも何れかの視点方向について、解像度が前記第1種の画像データに含まれる画像よりも高い画像を含む構成である。上記の構成によれば、3次元データ再生時における画像品位の低下を抑制しつつ、通信量および通信に係る処理を軽減させるためのメタ情報を生成する生成装置を実現できる。
本発明の態様2に係る生成装置は、上記の態様1において、前記メタ情報生成部は、前記メタ情報として、各視点方向に対応する各画像の解像度を識別するViewPointQualityタグを含むMPDを生成してもよい。上記の構成によれば、ViewPointQualityタグによって解像度を識別可能なMPDを生成する生成装置を実現できる。
本発明の態様3に係る3次元データ送信装置(100)は、3次元データを送信する3次元データ送信装置であって、上記の態様1又は2における生成装置と、前記メタ情報を外部装置に送信する第1送信部(131)と、前記外部装置からの要求に応答して、前記第1種の画像データ、及び前記第2種の画像データの少なくとも何れかを、前記外部装置に送信する第2送信部(132)と、を備える構成としてもよい。上記の構成によれば、メタ情報、並びに第1種の画像データおよび第2種の画像データの少なくとも何れかを外部装置に送信可能な3次元データ送信装置を実現できる。
本発明の態様4に係る3次元データ送信装置は、上記の態様3において、前記第2送信部は、前記第1種の画像データと前記第2種の画像データとを、互いに異なる複数のストリームによって送信する構成としてもよい。上記の構成によれば、第1種の画像データと第2種の画像データとを別々のストリームによって送信可能な3次元データ送信装置を実現できる。
本発明の態様5に係る3次元データ送信装置は、上記の態様3において、前記第2送信部は、前記第1種の画像データと前記第2種の画像データとを、単一のストリームにおける複数のレイヤーによって送信する構成としてもよい。上記の構成によれば、第1種の画像データと第2種の画像データとを単一のストリームによって送信可能な3次元データ送信装置を実現できる。
本発明の態様6に係る3次元データ再生装置(200)は、3次元データを再生する3次元データ再生装置であって、前記3次元データを構成する1又は複数の第1種の画像データであって、複数の視点方向に対応する各画像を含む1又は複数の第1種の画像データと、前記3次元データを構成する複数の第2種の画像データであって、1又は複数の視点方向に対応する各画像を含む複数の第2種の画像データとの参照先を示すメタ情報を取得する第1取得部(231)と、前記3次元データを再生する場合における、前記3次元データが示すオブジェクトに対する視点方向を取得する第2取得部(211)と、当該視点方向に対応する参照先であって、前記メタ情報が示す参照先から、3次元データの再生に要する、前記第1種の画像データおよび前記第2種の画像データの少なくとも何れかを取得する第3取得部(232)と、前記第3取得部が取得した第1種の画像データおよび前記第2種の画像データの少なくとも何れかを参照して、前記3次元データを再生する再生部(213)と、を備えており、前記複数の第2種の画像データは、少なくとも何れかの視点方向について、解像度が前記第1種の画像データに含まれる画像よりも高い画像を含む構成である。上記の構成によれば、上述したメタ情報を参照して画像データを取得し、3次元データを再生可能な3次元データ再生装置を実現できる。
本発明の態様7に係る3次元データ再生装置は、上記の態様6において、前記第1取得部は、前記メタ情報として、各視点方向に対応する各画像の解像度を識別するViewPointQualityタグを含むMPDを取得し、前記第3取得部は、前記ViewPointQualityタグを参照して決定されたAdaptationSetが参照先を示す画像データを取得してもよい。上記の構成によれば、ViewPointQualityタグを参照して決定された画像データを取得する3次元データ再生装置を実現できる。
本発明の態様8に係る3次元データ再生装置は、上記の態様6又は7において、前記第3取得部は、前記第2取得部が取得した視点方向が示すベクトルと、前記第2種の画像データに含まれる、解像度が第1種の画像データに含まれる画像よりも高い画像に対応する視点方向が示すベクトルとの差分が閾値未満である場合、少なくとも前記第2種の画像データを取得し、当該閾値以上である場合、前記第2種の画像データを取得せず、前記第1種の画像データを取得する構成としてもよい。上記の構成によれば、視点方向に応じた好適な画像データを取得して3次元データを再生可能な3次元データ再生装置を実現できる。
本発明の態様9に係る3次元データ再生装置は、上記の態様6から8までの何れかにおいて、前記第3取得部は、前記第1種の画像データと前記第2種の画像データとを、互いに異なる複数のストリームによって取得する構成としてもよい。上記の構成によれば、第1種の画像データと第2種の画像データとを別々のストリームによって取得可能な3次元データ再生装置を実現できる。
本発明の態様10に係る3次元データ再生装置は、上記の態様6から8までの何れかにおいて、前記第3取得部は、前記第1種の画像データと前記第2種の画像データとを、単一のストリームにおける複数のレイヤーによって取得する構成としてもよい。上記の構成によれば、第1種の画像データと第2種の画像データとを単一のストリームによって取得可能な3次元データ再生装置を実現できる。
本発明の各態様に係る生成装置、3次元データ送信装置、および3次元データ再生装置は、コンピュータによって実現してもよく、この場合には、コンピュータを上記各装置が備える各部(ソフトウェア要素)として動作させることにより上記各装置をコンピュータにて実現させる上記各装置の制御プログラム、およびそれを記録したコンピュータ読み取り可能な記録媒体も、本発明の範疇に入る。
本発明は上述した各実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能であり、異なる実施形態にそれぞれ開示された技術的手段を適宜組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。さらに、各実施形態にそれぞれ開示された技術的手段を組み合わせることにより、新しい技術的特徴を形成することができる。
100 3次元データ送信装置
110、210 制御部
111 視点受付部
112 デプス画像生成部
113 メタ情報生成部
114 符号化部
120 記憶部
121 メタ情報記憶部
122 セグメントデータ記憶部
130、230 通信部
131 メタ情報送信部(第1送信部)
132 セグメントデータ送信部(第2送信部)
200 3次元データ再生装置
211 視点受付部(第2取得部)
212 選択部
213 再生部
214 復号部
215 3次元モデル生成部
216 視点画像合成部
231 メタ情報取得部(第1取得部)
232 セグメントデータ取得部(第3取得部)
240 表示部

Claims (10)

  1. 3次元データに関するメタ情報を生成する生成装置であって、
    前記3次元データを構成する1又は複数の第1種の画像データであって、複数の視点方向に対応する各画像を含む1又は複数の第1種の画像データと、
    前記3次元データを構成する複数の第2種の画像データであって、1又は複数の視点方向に対応する各画像を含む複数の第2種の画像データと
    の参照先を示すメタ情報を生成するメタ情報生成部を備えており、
    前記複数の第2種の画像データは、少なくとも何れかの視点方向について、解像度が前記第1種の画像データに含まれる画像よりも高い画像を含む
    ことを特徴とする生成装置。
  2. 前記メタ情報生成部は、
    前記メタ情報として、各視点方向に対応する各画像の解像度を識別するViewPointQualityタグを含むMPDを生成する
    ことを特徴とする請求項1に記載の生成装置。
  3. 3次元データを送信する3次元データ送信装置であって、
    請求項1又は2に記載の生成装置と、
    前記メタ情報を外部装置に送信する第1送信部と、
    前記外部装置からの要求に応答して、前記第1種の画像データおよび前記第2種の画像データの少なくとも何れかを、前記外部装置に送信する第2送信部と、
    を備えることを特徴とする3次元データ送信装置。
  4. 前記第2送信部は、前記第1種の画像データと前記第2種の画像データとを、互いに異なる複数のストリームによって送信する
    ことを特徴とする請求項3に記載の3次元データ送信装置。
  5. 前記第2送信部は、前記第1種の画像データと前記第2種の画像データとを、単一のストリームにおける複数のレイヤーによって送信する
    ことを特徴とする請求項3に記載の3次元データ送信装置。
  6. 3次元データを再生する3次元データ再生装置であって、
    前記3次元データを構成する1又は複数の第1種の画像データであって、複数の視点方向に対応する各画像を含む1又は複数の第1種の画像データと、
    前記3次元データを構成する複数の第2種の画像データであって、1又は複数の視点方向に対応する各画像を含む複数の第2種の画像データと
    の参照先を示すメタ情報を取得する第1取得部と、
    前記3次元データを再生する場合における、前記3次元データが示すオブジェクトに対する視点方向を取得する第2取得部と、
    当該視点方向に対応する参照先であって、前記メタ情報が示す参照先から、3次元データの再生に要する、前記第1種の画像データおよび前記第2種の画像データの少なくとも何れかを取得する第3取得部と、
    前記第3取得部が取得した第1種の画像データおよび前記第2種の画像データの少なくとも何れかを参照して、前記3次元データを再生する再生部と、
    を備えており、
    前記複数の第2種の画像データは、少なくとも何れかの視点方向について、解像度が前記第1種の画像データに含まれる画像よりも高い画像を含む
    ことを特徴とする3次元データ再生装置。
  7. 前記第1取得部は、
    前記メタ情報として、各視点方向に対応する各画像の解像度を識別するViewPointQualityタグを含むMPDを取得し、
    前記第3取得部は、
    前記ViewPointQualityタグを参照して決定されたAdaptationSetが参照先を示す画像データを取得する
    ことを特徴とする請求項6に記載の3次元データ再生装置。
  8. 前記第3取得部は、
    前記第2取得部が取得した視点方向が示すベクトルと、前記第2種の画像データに含まれる、解像度が第1種の画像データに含まれる画像よりも高い画像に対応する視点方向が示すベクトルとの差分が閾値未満である場合、少なくとも前記第2種の画像データを取得し、当該閾値以上である場合、前記第2種の画像データを取得せず、前記第1種の画像データを取得する
    ことを特徴とする請求項6又は7に記載の3次元データ再生装置。
  9. 前記第3取得部は、前記第1種の画像データと前記第2種の画像データとを、互いに異なる複数のストリームによって取得する
    ことを特徴とする請求項6から8までの何れか1項に記載の3次元データ再生装置。
  10. 前記第3取得部は、前記第1種の画像データと前記第2種の画像データとを、単一のストリームにおける複数のレイヤーによって取得する
    ことを特徴とする請求項6から8までの何れ1項に記載の3次元データ再生装置。
JP2018243372A 2018-12-26 2018-12-26 生成装置、3次元データ送信装置、及び3次元データ再生装置 Pending JP2022049708A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2018243372A JP2022049708A (ja) 2018-12-26 2018-12-26 生成装置、3次元データ送信装置、及び3次元データ再生装置
PCT/JP2019/050083 WO2020137876A1 (ja) 2018-12-26 2019-12-20 生成装置、3次元データ送信装置、及び3次元データ再生装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018243372A JP2022049708A (ja) 2018-12-26 2018-12-26 生成装置、3次元データ送信装置、及び3次元データ再生装置

Publications (1)

Publication Number Publication Date
JP2022049708A true JP2022049708A (ja) 2022-03-30

Family

ID=71128670

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018243372A Pending JP2022049708A (ja) 2018-12-26 2018-12-26 生成装置、3次元データ送信装置、及び3次元データ再生装置

Country Status (2)

Country Link
JP (1) JP2022049708A (ja)
WO (1) WO2020137876A1 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2022149189A1 (ja) * 2021-01-05 2022-07-14
US20240144602A1 (en) * 2021-04-30 2024-05-02 Nippon Telegraph And Telephone Corporation Distribution control system, distribution control apparatus, distribution control method, and program

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018147089A1 (ja) * 2017-02-10 2018-08-16 ソニー株式会社 情報処理装置および方法

Also Published As

Publication number Publication date
WO2020137876A1 (ja) 2020-07-02

Similar Documents

Publication Publication Date Title
KR102241082B1 (ko) 복수의 뷰포인트들에 대한 메타데이터를 송수신하는 방법 및 장치
RU2711591C1 (ru) Способ, устройство и компьютерная программа для адаптивной потоковой передачи мультимедийного контента виртуальной реальности
US11537562B2 (en) Auxiliary manifest file to provide timed metadata
KR102261559B1 (ko) 정보 처리 방법 및 장치
KR20190117675A (ko) 생성된 콘텐츠를 포함하는 미디어 데이터를 인코딩하기 위한 방법 및 장치
KR20190008901A (ko) 가상 현실 미디어 콘텐트의 스트리밍을 개선하는 방법, 디바이스, 및 컴퓨터 프로그램
WO2019202207A1 (en) Processing video patches for three-dimensional content
US11252397B2 (en) File generation apparatus and file generation method as well as reproduction apparatus and reproduction method
CN105379302B (zh) 信息处理设备和信息处理方法
KR100513056B1 (ko) 영상 컨텐츠의 적응 변환 장치 및 그 방법
KR20210016530A (ko) 미디어 콘텐츠 전송을 위한 방법, 디바이스, 및 컴퓨터 프로그램
CN109644296A (zh) 一种视频流传输方法、相关设备及系统
US11348307B2 (en) Method and device for processing content
US10945000B2 (en) File generation apparatus and file generation method as well as reproduction apparatus and reproduction method
CN114450966A (zh) 用于异构沉浸式媒体的表示和流式传输的数据模型
CN113891117B (zh) 沉浸媒体的数据处理方法、装置、设备及可读存储介质
WO2019007120A1 (zh) 一种媒体数据的处理方法和装置
WO2021065277A1 (ja) 情報処理装置、再生処理装置及び情報処理方法
CN113852829A (zh) 点云媒体文件的封装与解封装方法、装置及存储介质
CN113574903B (zh) 针对媒体内容中的后期绑定的方法和装置
WO2020137876A1 (ja) 生成装置、3次元データ送信装置、及び3次元データ再生装置
KR20170009977A (ko) 기간들에 걸쳐 오브젝트들을 식별하기 위한 방법 및 이에 대응하는 디바이스
CN114116617A (zh) 点云媒体的数据处理方法、装置、设备及可读存储介质
US20200374567A1 (en) Generation apparatus, reproduction apparatus, generation method, reproduction method, control program, and recording medium
WO2023169003A1 (zh) 点云媒体的解码方法、点云媒体的编码方法及装置