以下、本技術を実施するための形態(以下、実施の形態という)について説明する。なお、説明は以下の順序で行う。
1.実施の形態の概要
2.画像処理システムの構成例
3.選択装置の第1実施の形態(選択装置24A)
4.選択装置の第2実施の形態(選択装置24B)
5.選択装置の第3実施の形態(選択装置24C)
6.選択装置の第4実施の形態(選択装置24D)
7.選択装置の第5実施の形態(選択装置24E)
8.選択装置の第6実施の形態(選択装置24F)
9.選択装置の第7実施の形態(選択装置24G)
10.配信処理と再生処理
11.コンピュータ構成例
12.応用例
<1.実施の形態の概要>
初めに、図1および図2を参照して、本技術を適用した画像処理システムの概要について説明する。
本技術を適用した画像処理システムは、複数の撮像装置で撮像して得られた撮影画像からオブジェクトの3Dモデルを生成して配信する配信側と、配信側から伝送される3Dモデルを受け取り、再生表示する再生側とからなる。
配信側においては、所定の撮影空間を、その外周から複数の撮像装置で撮像を行うことにより複数の撮影画像が得られる。撮影画像は、例えば、動画像で構成される。各撮像装置は、測距測定器を備えており、被写体のテクスチャ情報に加えて、被写体までの距離も測定することができる。そして、異なる方向の複数の撮像装置から得られた撮影画像を用いて、撮影空間において表示対象となる複数のオブジェクトの3Dモデルが生成される。オブジェクトの3Dモデルの生成は、同一のオブジェクトについて、複数の撮像装置で得られた複数の撮影画像及び距離情報から、重複する領域のテクスチャ情報及び距離情報をまとめたり、一つの撮像装置で死角となる領域のテクスチャ情報及び距離情報を、他の撮像装置で得られたテクスチャ情報及び距離情報で補って再構成することから、3Dモデルの再構成と呼ばれる。
図1の例では、撮影空間がサッカースタジアムのフィールドに設定された例が示されており、フィールドの外周であるスタンド側に配置された複数の撮像装置によって、フィールド上のプレイヤ等が撮影されている。3Dモデルの再構成により、例えば、フィールド上のプレイヤ、審判、サッカーボール、サッカーゴール、などがオブジェクトとして抽出され、各オブジェクトについて3Dモデルが生成(再構成)される。
生成された多数のオブジェクトの3Dモデルのデータ(以下、3Dモデルデータとも称する。)は所定の記憶装置に格納される。3Dモデルデータのデータフォーマットについては、図2を参照して後述する。
そして、所定の記憶装置に格納された撮影空間に存在する多数のオブジェクトのうち、所定のオブジェクトの3Dモデルが、再生側の要求に応じて伝送され、再生側で、再生および表示される。
再生側は、撮影空間に存在する多数のオブジェクトのうち、視聴対象のオブジェクトだけを要求して、表示装置に表示させる。例えば、再生側は、視聴者の視聴範囲が撮影範囲となるような仮想カメラを想定し、撮影空間に存在する多数のオブジェクトのうち、仮想カメラで捉えられるオブジェクトのみを要求して、表示装置に表示させる。実世界において視聴者が任意の視点からフィールドを見ることができるように、仮想カメラの視点は任意の位置に設定することができる。
図1の例では、生成されたオブジェクトとしての多数のプレーヤのうち、四角で囲んだ3人のプレーヤのみが、表示装置で表示される。
図2は、3Dモデルデータのデータフォーマットの例を示している。
3Dモデルデータのデータフォーマットとしては、様々なフォーマットをとり得る。
データフォーマットの一つは、オブジェクトのジオメトリ情報(形状情報)を、オブジェクトの3次元位置を点(頂点)の集合(点群)で表し、その各点に対応してオブジェクトの色情報を保有する形式である。この形式では、1つのオブジェクトに対して、1つのジオメトリ情報と色情報が保持される。本実施の形態では、この形式を、ポイントクラウド形式と記述する。
図3は、ポイントクラウド形式におけるジオメトリ情報の例を示している。
図3において破線で示される領域には、オブジェクトの1点のx座標、y座標、及びz座標に相当する3個のデータが、1行ずつ列挙されている。
データフォーマットの他の一つは、オブジェクトのジオメトリ情報を、上記ポイントクラウド形式と同様の点の集合(点群)か、または、ポリゴンメッシュと呼ばれる頂点(Vertex)と頂点間のつながりで表し、オブジェクトの色情報を、各撮像装置が撮影した撮影画像(2次元テクスチャ画像)で保有する形式である。この形式では、1つのオブジェクトに対して、1つのジオメトリ情報と、撮像装置の台数と同じ枚数の撮影画像(2次元テクスチャ画像)からなる色情報が保持される。本実施の形態では、この形式を、マルチテクスチャジオメトリ形式と記述する。
データフォーマットのさらに他の一つは、オブジェクトのジオメトリ情報をポリゴンメッシュで表し、その各ポリゴンメッシュに対応してオブジェクトの色情報を保有する形式である。各ポリゴンメッシュに貼り付けられる色情報としての2次元テクスチャ画像はUV座標系で表現される。この形式では、1つのオブジェクトに対して、1つのジオメトリ情報と、1つの2次元テクスチャ画像からなる色情報が保持される。本実施の形態では、この形式を、UVテクスチャジオメトリ形式と記述する。UVテクスチャジオメトリ形式は、MPEG-4 AFX (Animation Framework eXtension)で規格化された形式である。
データフォーマットのさらに他の一つは、オブジェクトのジオメトリ情報を各撮像装置が撮影した撮影画像に対応する距離情報で表し、オブジェクトの色情報を、各撮像装置が撮影した撮影画像(2次元テクスチャ画像)で保有する形式である。各撮像装置が撮影した撮影画像に対応する距離情報には、撮影画像の各画素に対応させて、被写体までの奥行き方向の距離をデプス値として格納したデプス画像が採用される。この形式では、1つのオブジェクトに対して、撮像装置の台数と同じ枚数のデプス画像からなるジオメトリ情報と、撮像装置の台数と同じ枚数の撮影画像(2次元テクスチャ画像)からなる色情報が保持される。本実施の形態では、この形式を、マルチテクスチャデプス形式と記述する。マルチテクスチャデプス形式のメリットは、3Dモデルデータを伝送する場合の符号化方式として、AVC(Advanced Video Coding)方式、HEVC(High Efficiency Video Coding)方式等を、そのまま利用することができ、高効率に圧縮することができる点である。
ポイントクラウド形式およびUVテクスチャジオメトリ形式は、仮想カメラの位置(仮想視点)に関わらず、色情報が同一となるViewIndependentな形式である。
これに対して、マルチテクスチャジオメトリ形式およびマルチテクスチャデプス形式は、仮想カメラの位置(仮想視点)によって、色情報が変化し得るViewDependentな形式である。
以上のような各種の3Dモデルデータのデータフォーマットのうち、どのようなデータフォーマットを採用するかは任意である。再生側がデータフォーマットを指定してもよいし、配信側がデータフォーマットを決定してもよい。また、アプリケーションごとに予めデータフォーマットを決めておいてもよい。
<2.画像処理システムの構成例>
図4は、本技術を適用した画像処理システムの構成例を示すブロック図である。
図4の画像処理システム10は、図1で説明した配信側として、撮像装置21−1乃至21−N(N>1)、再構成装置22、記憶装置23、選択装置24、符号化装置25、および、送受信装置26を備える。
また、画像処理システム10は、図1で説明した再生側として、再生装置28、および、表示装置29を備える。配信側の送受信装置26と再生側の再生装置28は、ネットワーク27を介して接続される。
撮像装置21(撮像装置21−1乃至21−N)は、所定の撮影空間の外周の所定の位置に配置され、撮影空間を撮影し、その結果得られる動画像を再構成装置22に供給する。以下では、特に言及する場合を除いて、撮像装置21の個数が7個である場合を例にして説明する。
撮像装置21は、測距測定器を備えており、被写体のテクスチャ画像(テクスチャ情報)に加えて、被写体までの距離も測定することができ、テクスチャ画像と同じ視点からのデプス画像の動画像も生成し、再構成装置22に供給する。
撮像装置21−1乃至21−Nそれぞれは、異なる位置に配置され、撮影空間を他の撮像装置21と異なる方向から撮影する。各撮像装置21のワールド座標系上の位置は既知であり、各撮像装置21のカメラパラメータ(外部パラメータおよび内部パラメータ)も、再構成装置22に供給される。
再構成装置22は、撮像装置21−1乃至21−Nそれぞれから供給される撮影空間内のテクスチャ画像およびデプス画像の動画像を用いて、撮影空間内に存在する多数のオブジェクトについて、オブジェクトごとに3Dモデルを生成し、生成された各オブジェクトの3Dモデルのデータ(以下3Dモデルデータと称する。)を記憶装置23に供給する。
記憶装置23は、再構成装置22によって生成された各オブジェクトの3Dモデルデータを記憶する。記憶装置23には、各オブジェクトの3Dモデルデータが、図2を参照して説明したポイントクラウド形式、UVテクスチャジオメトリ形式、マルチテクスチャジオメトリ形式、およびマルチテクスチャデプス形式の全ての形式で記憶されてもよいし、画像処理システム10のアプリケーションによってデータ形式が規定されている場合には、少なくともその規定されたデータフォーマットで記憶される。
本実施の形態においては、複数の撮像装置21が撮影した動画像に映る撮影空間内の被写体のうち、どの被写体を、3Dモデルを生成する対象のオブジェクトとするかは問わない。どのような方法でオブジェクトを決定してもよく、動画像に映る所定の被写体がオブジェクトとして決定され、他のオブジェクトと適切に分離されて、3Dモデルが生成される。
また、再構成装置22は、各撮像装置21のカメラパラメータから、3Dモデルデータを生成した各オブジェクトのグローバルな位置情報(以下、グローバル位置情報と称する。)を計算し、各撮像装置21のカメラパラメータとともに、記憶装置23に記憶させる。
換言すれば、本実施の形態においては、再生装置28に伝送され得る複数のオブジェクトの3Dモデルが、オブジェクトごとに適切に分離されて、ワールド座標系上の位置も既知な状態で記憶装置23に記憶されていることが前提となっている。
選択装置24は、再生装置28が所定のオブジェクトを特定したオブジェクト特定情報に基づいて、記憶装置23に記憶されている複数のオブジェクトのなかから、所定のオブジェクトを選択し、選択したオブジェクトの3Dモデルデータを符号化装置25に供給する。オブジェクト特定情報は、再生装置28からネットワーク27を介して送受信装置26で受信され、送受信装置26から選択装置24へ供給される。
符号化装置25は、選択装置24から供給される所定のオブジェクトの3Dモデルデータを、例えば、AVC方式、HEVC方式等の所定の符号化方式で符号化する。符号化して得られた3Dモデルの符号化ストリームは、送受信装置26へ供給される。
送受信装置26は、符号化装置25から供給された3Dモデルの符号化ストリームを、ネットワーク27を介して再生装置28へ送信する。また、送受信装置26は、再生装置28からネットワーク27を介して送信されてきたオブジェクト特定情報を受信(取得)し、選択装置24へ供給する。
なお、配信側の再構成装置22、記憶装置23、選択装置24、符号化装置25、および、送受信装置26は、それぞれ、個別に構成されてもよいし、2つ以上の装置が一体化された構成でもよい。例えば、図4において破線で示されるように、記憶装置23、選択装置24、符号化装置25、および、送受信装置26が1つの配信装置を構成してもよい。この場合、記憶装置23、選択装置24、符号化装置25、および、送受信装置26は、それぞれ、配信装置の記憶部、選択部、符号化部、および、送受信部を構成する。
ネットワーク27は、例えば、インターネット、電話回線網、衛星通信網、Ethernet(登録商標)を含む各種のLAN(Local Area Network)、WAN(Wide Area Network)、IP−VPN(Internet Protocol−Virtual Private Network)などの専用回線網などで構成される。
再生装置28は、送受信部41、復号部42、描画部43、仮想視点検出部44、および、入力部45を備える。
再生装置28の送受信部41は、送受信装置26から供給される各オブジェクトの3Dモデルデータを符号化した符号化ストリームを受信(取得)し、復号部42に供給する。また、送受信部41は、所定のオブジェクトを特定するオブジェクト特定情報を仮想視点検出部44から取得し、ネットワーク27を介して送受信装置26に送信する。
復号部42は、送受信部41から供給される符号化ストリームを、符号化装置25における符号化方式に対応する方式で復号する。復号部42は、復号して得られる1以上のオブジェクトの3Dモデルデータを描画部43に供給する。
描画部43は、復号部42から供給される1以上のオブジェクトの3Dモデルデータに基づいて、仮想カメラの視点からのオブジェクトの画像(オブジェクト画像)を表示画像として生成し、表示装置29に供給する。描画部43には、仮想視点検出部44から、仮想カメラの視点に基づく視聴範囲を示す仮想カメラ視聴範囲情報が供給され、復号部42から供給される1以上のオブジェクトの3Dモデルを、仮想カメラの視聴範囲に透視投影することにより、仮想カメラの視点からのオブジェクトの画像が生成される。
仮想視点検出部44は、仮想カメラの視点を検出し、仮想カメラの視点に基づく視聴範囲を示す仮想カメラ視聴範囲情報を生成し、描画部43に供給する。また、仮想視点検出部44は、仮想カメラの視聴範囲に存在する1以上のオブジェクトを特定するオブジェクト特定情報を生成し、送受信部41に供給する。仮想視点検出部44は、表示装置29としてのヘッドマウントディスプレイに付されたマーカ等を撮影することで、視聴者の視聴位置や視聴範囲を検出してもよい。
入力部45は、コントローラ、マウス等の入力装置で構成される。入力部45は、例えば、視聴者による視聴位置の指示や、表示対象とするオブジェクトの指定などを受け付ける。入力部45で受け付けられた各種の入力情報は、必要に応じて再生装置28内の各部へ供給される。
表示装置29は、例えば、2次元ヘッドマウントディスプレイ(HMD)や2次元モニタなどにより構成される。表示装置29は、描画部43から供給される表示画像を2次元表示する。
なお、表示装置29は、3次元ヘッドマウントディスプレイや3次元モニタなどにより構成されてもよい。この場合、描画部43は、表示画像に加えてデプス画像も供給し、表示装置29は、描画部43から供給される表示画像とデプス画像に基づいて表示画像を3次元表示する。
以上のように構成される画像処理システム10において、選択装置24は、記憶装置23に記憶されている撮影空間に含まれる全てのオブジェクトのうち、所定の条件を満たすオブジェクトのみを選択して、選択したオブジェクトの3Dモデルデータを、再生装置28に伝送する。
再生装置28は、記憶装置23に記憶されている撮影空間に含まれる全てのオブジェクトのうち、所定の条件を満たすオブジェクトの3Dモデルデータを取得して、取得したオブジェクトの3Dモデルデータに基づいて、オブジェクト画像を生成し、表示装置29に表示させる。
配信側と再生側で、撮影空間に含まれる全てのオブジェクトのうち、表示に必要なオブジェクトの3Dモデルデータのみを伝送することにより、視聴者が視聴するオブジェクト画像の画質を担保しつつ、再生側の処理負荷を削減するとともに、伝送帯域を削減することを実現する。
なお、本明細書では、配信側から再生側に伝送される伝送データとして映像情報についてのみ説明し、音声情報についての説明は省略するが、動画像に対応する音声情報も合わせて伝送される。
以下では、選択装置24として取り得る各種の構成について、詳細に説明する。
<3.選択装置の第1実施の形態>
(選択装置の構成例)
図5は、選択装置24の第1実施の形態としての選択装置24Aの構成例を示している。
選択装置24Aは、3Dモデル選択部61Aを備える。
選択装置24Aでは、3Dモデルデータのデータフォーマットとして、ポイントクラウド形式およびUVテクスチャジオメトリ形式の一方または両方が適用される。
選択装置24Aには、入力データとして、記憶装置23に記憶されている全てのオブジェクトについて、各オブジェクトを識別する識別情報であるオブジェクトID、および、3Dモデルデータが供給される。
3Dモデルデータのデータフォーマットは、ポイントクラウド形式およびUVテクスチャジオメトリ形式の一方または両方であるので、3Dモデルデータは、点の集合(点群)で表されたジオメトリ情報と点ごとの色情報か、または、ポリゴンメッシュで表されたジオメトリ情報と各ポリゴンメッシュの色情報の一方または両方である。
また、選択装置24Aには、オブジェクト特定情報として再生装置28から供給される、仮想カメラの視点に基づく視聴範囲の情報である仮想カメラ視聴範囲情報も入力される。仮想カメラ視聴範囲情報は、例えば、仮想カメラの外部パラメータおよび内部パラメータと、視錐台の前方クリップ面を表すNear情報、並びに、視錐台の後方クリップ面を表すFar情報で構成される。
3Dモデル選択部61Aは、図6に示されるように、再生装置28から供給される仮想カメラ視聴範囲情報に基づいて、記憶装置23に記憶されている全てのオブジェクトについて、オブジェクトが仮想カメラ70の視聴範囲内、具体的には、斜線を付して示される視錐台71に含まれるか否かを判定し、伝送する3Dモデルのオブジェクトを選択(決定)する。
より具体的には、3Dモデル選択部61Aは、オブジェクトを構成する各頂点情報を仮想カメラ70の画像面72に投影し、各頂点情報に対応するUV座標の少なくとも1つが仮想カメラ70の画像面72に含まれる場合には、再生装置28に3Dモデルデータを伝送するオブジェクトに決定する。一方、各頂点情報に対応するUV座標の全てが仮想カメラ70の画像面72に含まれない場合には、そのオブジェクトは、再生装置28に3Dモデルデータを伝送しないオブジェクトに決定される。
図6の例では、オブジェクト73−1を投影した投影面74−1は、仮想カメラ70の画像面72に含まれるため、オブジェクト73−1は、伝送するオブジェクトに決定される。オブジェクト73−2を投影した投影面74−2は、仮想カメラ70の画像面72に含まれないため、オブジェクト73−2は、伝送しないオブジェクトに決定される。仮想カメラ70の画像面72は、UV座標系で表される。
3Dモデル選択部61Aは、再生装置28に伝送する3Dモデルのオブジェクトとして選択したオブジェクトのオブジェクトIDと3Dモデルデータを出力データとして、符号化装置25に出力する。
なお、各オブジェクトの全ての頂点情報を仮想カメラ70の画像面72に投影する処理を、記憶装置23に記憶されている全てのオブジェクトについて実行すると、処理負荷が大きい。
そこで、例えば、各オブジェクトのグローバル位置情報の代表値を予め計算して、記憶装置23に記憶しておき、代表値のみを仮想カメラ70の画像面72に投影して、伝送する3Dモデルのオブジェクトに該当するか否かを判定してもよい。オブジェクトのグローバル位置情報の代表値としては、例えば、オブジェクトの全ての頂点情報の平均値などを用いることができる。
あるいはまた、各オブジェクトのグローバル位置情報の代表値として、図7に示されるように、オブジェクト毎にバウンディングボックスを予め計算して、記憶装置23に記憶しておき、バウンディングボックスの頂点を仮想カメラ70の画像面72に投影して、伝送する3Dモデルのオブジェクトに該当するか否かを判定してもよい。
図7は、オブジェクト73−1のバウンディングボックス75−1と、オブジェクト73−2のバウンディングボックス75−2が、仮想カメラ70の画像面72に投影される例を示している。
(第1のオブジェクト選択処理)
図8は、選択装置24Aによるオブジェクト選択処理(第1のオブジェクト選択処理)を説明するフローチャートである。この処理は、例えば、送受信装置26を介して再生装置28から仮想カメラ視聴範囲情報が供給されたとき、開始される。
初めに、ステップS11において、3Dモデル選択部61Aは、送受信装置26を介して再生装置28から供給された、仮想カメラ70の視点に基づく仮想カメラ視聴範囲情報を取得する。
ステップS12において、3Dモデル選択部61Aは、記憶装置23に記憶されている全てのオブジェクトについて、オブジェクトを識別するオブジェクトIDと3Dモデルデータを取得する。
ステップS13において、3Dモデル選択部61Aは、記憶装置23から取得した全てのオブジェクトのうち、所定のオブジェクトを注目オブジェクトに設定する。
ステップS14において、3Dモデル選択部61Aは、注目オブジェクトが仮想カメラ70の視聴範囲内に含まれるかを判定する。
より具体的には、3Dモデル選択部61Aは、注目オブジェクトを構成する全頂点情報を仮想カメラ70の画像面72に投影し、各頂点情報に対応するUV座標の少なくとも1つが仮想カメラ70の画像面72に含まれるか否かを判定する。
あるいは簡単に計算する場合には、3Dモデル選択部61Aは、注目オブジェクトのグローバル位置情報の代表値を仮想カメラ70の画像面72に投影し、代表値に対応するUV座標の少なくとも1つが仮想カメラ70の画像面72に含まれるか否かを判定する。
ステップS14で、注目オブジェクトが仮想カメラ70の視聴範囲内に含まれると判定された場合、処理はステップS15に進み、3Dモデル選択部61Aは、注目オブジェクトを、再生装置28に3Dモデルデータを伝送する伝送オブジェクトに決定する。ステップS16において、3Dモデル選択部61Aは、伝送オブジェクトのオブジェクトIDと3Dモデルデータを、符号化装置25に出力する。
一方、ステップS14で、注目オブジェクトが仮想カメラ70の視聴範囲内に含まれないと判定された場合、ステップS15およびS16はスキップされる。
ステップS17において、3Dモデル選択部61Aは、記憶装置23から取得した全てのオブジェクトを注目オブジェクトに設定したかを判定する。
ステップS17で、まだ全てのオブジェクトを注目オブジェクトに設定していないと判定された場合、処理はステップS13に戻され、上述したステップS13乃至S17の処理が繰り返される。すなわち、まだ注目オブジェクトに設定されていないオブジェクトが次の注目オブジェクトに設定され、仮想カメラ70の視聴範囲内に含まれるオブジェクトであるか否かが判定される。
一方、ステップS17で、全てのオブジェクトを注目オブジェクトに設定したと判定された場合、第1のオブジェクト選択処理は終了する。
第1のオブジェクト選択処理によれば、仮想カメラ70の視聴範囲内のオブジェクトの3Dモデルデータを再生装置28に伝送するので、表示画像の生成に必要なオブジェクトの3Dモデルデータのみを送信することで、伝送帯域を削減することができる。
<4.選択装置の第2実施の形態>
(選択装置の構成例)
図9は、選択装置24の第2実施の形態としての選択装置24Bの構成例を示している。
選択装置24Bは、3Dモデル選択部61Bを備える。
選択装置24Bでは、3Dモデルデータのデータフォーマットとして、ポイントクラウド形式およびUVテクスチャジオメトリ形式の一方または両方が適用される。したがって、3Dモデルデータは、第1実施の形態と同様に、点の集合(点群)で表されたジオメトリ情報と点ごとの色情報か、または、ポリゴンメッシュで表されたジオメトリ情報と各ポリゴンメッシュごとの色情報の一方または両方である。
第2実施の形態では、仮想カメラの視点に基づく仮想カメラ視聴範囲情報ではなく、視聴者が表示対象として指定したオブジェクトのオブジェクトIDが、オブジェクト特定情報として再生装置28から選択装置24Bに供給される。
そのため、3Dモデル選択部61Bは、最初に、図10のAに示されるように、記憶装置23に記憶されている全てのオブジェクトのオブジェクトIDとグローバル位置情報を、再生装置28に送信する。
各オブジェクトのグローバル位置情報としては、例えば、図10のBに示されるように、バウンディングボックスの頂点のx座標の最小値xminおよび最大値xmax、y座標の最小値yminおよび最大値ymax、並びに、z座標の最小値zminおよび最大値zmaxを採用することができる。
選択装置24Bには、視聴者によって指定された1以上のオブジェクトのオブジェクトIDが、第1実施の形態における、仮想カメラの視点に基づく仮想カメラ視聴範囲情報に代えて、オブジェクト特定情報として、再生装置28から送信されてくる。
例えば、図11に示されるように、オブジェクトIDとして1、3、および5を表すオブジェクト特定情報が、再生装置28から選択装置24Bに送信されたとする。
選択装置24Bの3Dモデル選択部61Bは、再生装置28から送信されてきたオブジェクト特定情報に基づいて、オブジェクトIDが1、3、および5のオブジェクトを、再生装置28に3Dモデルデータを伝送する伝送オブジェクトに決定する。そして、3Dモデル選択部61Bは、伝送オブジェクトに決定した各オブジェクトの3Dモデルデータ、即ち、ジオメトリ情報と色情報を、記憶装置23から取得し、符号化装置25に供給する。
なお、第2実施の形態では、仮想カメラ視聴範囲情報の再生装置28からの取得は省略することができる。
(第2のオブジェクト選択処理)
図12は、選択装置24Bによるオブジェクト選択処理(第2のオブジェクト選択処理)を説明するフローチャートである。この処理は、例えば、再生装置28の電源がオンされ、視聴者によって再生を開始する操作が行われたとき、開始される。
初めに、ステップS31において、3Dモデル選択部61Bは、記憶装置23に記憶されている全てのオブジェクトのオブジェクトIDとグローバル位置情報を取得する。
ステップS32において、3Dモデル選択部61Bは、取得した全てのオブジェクトのオブジェクトIDとグローバル位置情報を再生装置28に送信する。全てのオブジェクトのオブジェクトIDとグローバル位置情報は、3Dモデル選択部61から符号化装置25に出力され、符号化装置25、送受信装置26等を介して、再生装置28に送信される。
ステップS33において、3Dモデル選択部61Bは、再生装置28から送信されてきたオブジェクト特定情報を、送受信装置26を介して取得する。
ステップS34において、3Dモデル選択部61Bは、オブジェクト特定情報に基づいて、再生装置28に3Dモデルデータを伝送する伝送オブジェクトを決定する。
ステップS35において、3Dモデル選択部61Bは、伝送オブジェクトのオブジェクトIDと3Dモデルデータを、符号化装置25に出力する。
以上で、第2のオブジェクト選択処理が終了する。
第2のオブジェクト選択処理によれば、視聴者が表示対象として指定したオブジェクトの3Dモデルデータを再生装置28に伝送するので、視聴者がオブジェクト単位で、表示または非表示を指定することができる。また、視聴者が表示対象として指定したオブジェクトの3Dモデルデータのみを送信することで、伝送帯域を削減することができる。
<5.選択装置の第3実施の形態>
(選択装置の構成例)
図13は、選択装置24の第3実施の形態としての選択装置24Cの構成例を示している。
選択装置24Cは、3Dモデル選択部61および画像選択部81を備える。
選択装置24Cでは、3Dモデルデータのデータフォーマットとして、マルチテクスチャジオメトリ形式が適用される。したがって、3Dモデルデータは、ポリゴンメッシュで表されたジオメトリ情報と、撮像装置21の台数と同じ枚数の撮影画像(テクスチャ画像)で表される。
3Dモデル選択部61は、上述した第1実施の形態の3Dモデル選択部61A、または、上述した第2実施の形態の3Dモデル選択部61Bで構成され、記憶装置23に記憶されている全てのオブジェクトのなかから、所定の条件を満たすオブジェクトのみを選択し、伝送オブジェクトに決定する。
詳細な説明は省略するが、3Dモデル選択部61が3Dモデル選択部61Aで構成される場合、3Dモデル選択部61は、オブジェクト特定情報としての仮想カメラ視聴範囲情報を再生装置28から取得し、仮想カメラ視聴範囲情報に基づいて、記憶装置23に記憶されている全てのオブジェクトのなかから、伝送オブジェクトを決定する。
一方、3Dモデル選択部61が3Dモデル選択部61Bで構成される場合、3Dモデル選択部61は、視聴者が指定したオブジェクトを表すオブジェクト特定情報を再生装置28から取得し、オブジェクト特定情報に基づいて、記憶装置23に記憶されている全てのオブジェクトのなかから、伝送オブジェクトを決定する。
図13において破線で示される、入力データであるオブジェクト特定情報としてのオブジェクトID、出力データである、記憶装置23に記憶されている全てのオブジェクトのオブジェクトIDとグローバル位置情報は、3Dモデル選択部61が3Dモデル選択部61Bで構成される場合の入出力データを示している。
3Dモデル選択部61は、決定した伝送オブジェクトのオブジェクトIDおよび3Dモデルデータと、全てのオブジェクトのグローバル位置情報を、画像選択部81に供給する。
また、画像選択部81には、全ての撮像装置21のカメラパラメータが、記憶装置23から供給される。
第3実施の形態では、上述したように、3Dモデルデータは、ポリゴンメッシュのジオメトリ情報と、撮像装置21の台数と同じ枚数の撮影画像で構成される。3Dモデルデータの一部である撮像装置21の台数と同じ枚数の撮影画像のなかには、3Dモデル選択部61で決定された伝送オブジェクトが含まれない画像が存在する場合がある。
画像選択部81は、伝送オブジェクトの3Dモデルデータの一部である複数枚(撮像装置21の台数と同じ枚数)の撮影画像のなかから、伝送オブジェクトが含まれる撮影画像のみを選択する。
例えば、図14に示されるように、3Dモデル選択部61が、仮想カメラ70の視聴範囲内に含まれる3つのオブジェクト91−1乃至91−3のうち、視聴者の指定によって、オブジェクト91−2が伝送オブジェクトに決定されたとする。2つのオブジェクト91−1および91−3は、再生装置28に伝送しないオブジェクト(以下、非伝送オブジェクトと称する。)とされる。
画像選択部81は、上述した3Dモデル選択部61Aと同様に、オブジェクト91−2を構成する頂点情報を複数の撮像装置21それぞれの画像面に投影し、オブジェクト91−2が画像面に含まれるか、すなわち、オブジェクト91−2が撮影画像に含まれるか否かを判定する。
図14の例では、3つの撮像装置21−1乃至21−3が示されており、オブジェクト91−2は、撮像装置21−1と撮像装置21−2の画像面に含まれるため、撮像装置21−1と撮像装置21−2が撮像した撮影画像は、伝送する撮影画像(以下、伝送撮影画像と称する。)に決定される。一方、撮像装置21−3の画像面にはオブジェクト91−2は含まれないため、撮像装置21−3が撮像した撮影画像は、伝送しない撮影画像(以下、非伝送撮影画像と称する。)に決定される。
なお、第1実施の形態と同様に、演算の負荷を減らすため、バウンディングボックスの頂点座標など、各オブジェクトのグローバル位置情報の代表値を用いて、各撮像装置21が撮像した撮影画像に含まれるか否かを計算し、伝送する画像を決定してもよい。
例えば、図15に示されるように、1個の伝送オブジェクトの3Dモデルデータは、ジオメトリ情報としての1つのポリゴンメッシュと、色情報としての撮像装置21の台数と同じ枚数、即ち、7枚の撮影画像で構成されるが、画像選択部81の画像選択処理の結果、撮像装置21−3と撮像装置21−6で撮像された撮影画像が、伝送しない撮影画像に決定される(非選択とされる)。
画像選択部81は、伝送オブジェクトのオブジェクトIDと3Dモデルデータを、符号化装置25に出力する。ただし、3Dモデルデータは、色情報に関しては、撮像装置21の台数と同じ枚数の撮影画像のうち、伝送オブジェクトが含まれる撮影画像のみである。また、画像選択部81は、3Dモデルデータとして送信する撮影画像に対応する撮像装置21のカメラパラメータも、符号化装置25に出力する。
(第3のオブジェクト選択処理)
図16は、選択装置24Cによるオブジェクト選択処理(第3のオブジェクト選択処理)を説明するフローチャートである。この処理は、例えば、再生装置28の電源がオンされ、視聴者によって再生を開始する操作が行われたとき、開始される。
初めに、ステップS51において、3Dモデル選択部61は、記憶装置23に記憶されている全てのオブジェクトのなかから、伝送オブジェクトを決定する伝送オブジェクト決定処理を実行する。
換言すれば、ステップS51では、3Dモデル選択部61は、オブジェクト特定情報としての仮想カメラ視聴範囲情報に基づいて伝送オブジェクトを決定する図8の第1のオブジェクト選択処理か、または、視聴者が指定したオブジェクトを表すオブジェクト特定情報に基づいて伝送オブジェクトを決定する図12の第2のオブジェクト選択処理を実行する。処理の結果得られた伝送オブジェクトのオブジェクトIDと3Dモデルデータが、画像選択部81に供給される。
ステップS52において、画像選択部81は、全ての撮像装置21のカメラパラメータを記憶装置23から取得する。
ステップS53において、画像選択部81は、伝送オブジェクトの1つを、注目する注目オブジェクトに設定する。
ステップS54において、画像選択部81は、注目オブジェクトが複数の撮像装置21で撮像されたそれぞれの撮影画像に含まれるかを判定する。
ステップS54で、注目オブジェクトが複数の撮像装置21で撮像された撮影画像の少なくとも1枚に含まれると判定された場合、処理はステップS55に進み、画像選択部81は、注目オブジェクトが含まれる撮影画像を、伝送撮影画像に決定する。一方、注目オブジェクトが含まれない撮影画像は、非伝送撮影画像に決定される。
ステップS56において、画像選択部81は、注目オブジェクトのオブジェクトIDと3Dモデルデータを、符号化装置25に出力する。ただし、3Dモデルデータは、色情報に関しては、撮像装置21の台数と同じ7枚の撮影画像のうち、ステップS55で伝送撮影画像に決定された撮影画像のみである。また、画像選択部81は、伝送撮影画像に対応する撮像装置21のカメラパラメータも、符号化装置25に出力する。
一方、ステップS54で、注目オブジェクトが複数の撮像装置21で撮像された全ての撮影画像に含まれないと判定された場合、ステップS55およびS56の処理はスキップされる。
ステップS57において、画像選択部81は、全ての伝送オブジェクトを注目オブジェクトに設定したかを判定する。
ステップS57で、まだ全ての伝送オブジェクトを注目オブジェクトに設定していないと判定された場合、処理はステップS53に戻され、上述したステップS53乃至S57の処理が繰り返される。すなわち、まだ注目オブジェクトに設定されていない伝送オブジェクトが次の注目オブジェクトに設定され、複数の撮像装置21で撮像されたそれぞれの撮影画像が、伝送撮影画像であるか、または、非伝送撮影画像であるかが判断される。
一方、ステップS57で、全ての伝送オブジェクトを注目オブジェクトに設定したと判定された場合、第3のオブジェクト選択処理は終了する。
なお、上述した処理では、伝送オブジェクトを1つずつ、注目オブジェクトに設定し、ステップS54乃至S56の処理を繰り返し処理する方法を採用したが、複数の撮像装置21で撮像されたそれぞれの撮影画像が、伝送撮影画像であるか、または、非伝送撮影画像であるかを、全ての伝送オブジェクトに対して同時に判断してもよい。
第3のオブジェクト選択処理によれば、オブジェクト特定情報により特定されるオブジェクトの3Dモデルデータのみを再生装置28に伝送するので、伝送帯域を削減することができる。
また、オブジェクト特定情報により特定されるオブジェクトの3Dモデルデータのうち、オブジェクト特定情報により特定されるオブジェクトを含まない撮影画像は非伝送撮影画像として伝送しないので、さらに伝送帯域を削減することができる。
<6.選択装置の第4実施の形態>
(選択装置の構成例)
図17は、選択装置24の第4実施の形態としての選択装置24Dの構成例を示している。
第4実施の形態において、上述した第1乃至第3実施の形態と対応する部分については同一の符号を付してあり、その説明は適宜省略する。
選択装置24Dでは、3Dモデルデータのデータフォーマットとして、第3実施の形態と同様に、マルチテクスチャジオメトリ形式が適用される。
選択装置24Dは、3Dモデル選択部61、画像選択部81、および、切出し部100を備える。
即ち、第4実施の形態に係る選択装置24Dは、第3実施の形態と同様の3Dモデル選択部61および画像選択部81に加えて、切出し部100が追加された構成とされる。第4実施の形態のその他の構成は、第3実施の形態と同一である。
出力データについて、第3実施の形態の選択装置24Cと、第4実施の形態の選択装置24Dを比較すると、第3実施の形態の3Dモデルデータが、第4実施の形態では、3Dモデルジオメトリと、切出し画像および切出し情報メタデータに変更されている。
3Dモデルジオメトリは、第3実施の形態の3Dモデルデータに含まれるポリゴンメッシュで表されたジオメトリ情報を表す。したがって、3Dモデルデータのジオメトリ情報については、第3実施の形態と第4実施の形態で違いはない。
一方、3Dモデルデータの色情報に関し、第3実施の形態の出力データである伝送オブジェクトを含む撮影画像が、第4実施の形態において、伝送オブジェクトを含む撮影画像のなかから伝送オブジェクト部分を切り出した切出し画像と、切出し領域の位置を示す情報である切出し情報メタデータに変更されている。
入力データについては、第3実施の形態と第4実施の形態は同様である。
切出し部100は、オブジェクト領域設定部101と切出し画像生成部102を含む。
切出し部100は、画像選択部81から供給される、伝送オブジェクトを含む撮影画像から、伝送オブジェクトを含む切出し領域の画像を切り出すことにより、切出し画像を生成する。ここで、画像の切り出しとは、画像の一部分を切り出すこと、例えば画像の必要な部分を切り出すことであり、クロッピングともいう。
オブジェクト領域設定部101は、3Dモデルデータにより表される3Dモデルに基づいて、伝送オブジェクトを含む撮影画像において、伝送オブジェクトを含むオブジェクト領域を設定する。
切出し画像生成部102は、撮影画像からオブジェクト領域の画像を切り出すことにより、切出し画像を生成する。また、切出し画像生成部102は、撮影画像内の切出し領域の位置を示す切出し情報メタデータを生成する。切出し画像生成部102は、切出し画像、切出し情報メタデータ、及び、各撮像装置21のカメラパラメータを符号化装置25に供給する。
図18乃至図21を参照して、切出し部100が実行する切出し処理を説明する。
画像選択部81から切出し部100に供給される撮影画像は、図18に示されるように、伝送オブジェクトが含まれる撮影画像である。
図18は、第3実施の形態の説明で示した図15と同じ図である。
例えば、撮像装置21の台数と同じ7枚の撮影画像のうち、撮像装置21−1、21−2、21−4、21−5、および21−7によって撮像された撮影画像が、伝送撮影画像として、切出し部100に供給される。一方、撮像装置21−3および21−6によって撮像された、伝送オブジェクトが含まれない撮影画像は、切出し部100に供給されない。
切出し部100は、画像選択部81から供給される、伝送オブジェクトを含む撮影画像から、伝送オブジェクトを含む切出し領域の画像を切り出すことにより、切出し画像を生成する。
いま、図19に示されるように、撮像装置21−1、21−2、21−4、21−5、および21−7によって撮像された5枚の撮影画像に、伝送オブジェクトとして、オブジェクト1(Object1)、オブジェクト2(Object2)、オブジェクト3(Object3)の3つのオブジェクトが含まれていたとする。オブジェクト1乃至3は、いずれもプレーヤに対応する部分である。
切出し部100は、撮像装置21−1によって撮像された撮影画像から、オブジェクト1乃至3をそれぞれ含む切出し画像cr11乃至cr13を生成する。
また、切出し部100は、撮像装置21−2によって撮像された撮影画像から、オブジェクト1乃至3をそれぞれ含む切出し画像cr21乃至cr23を生成する。
また、切出し部100は、撮像装置21−4によって撮像された撮影画像から、オブジェクト1乃至3をそれぞれ含む切出し画像cr41乃至cr43を生成する。
また、切出し部100は、撮像装置21−5によって撮像された撮影画像から、オブジェクト1乃至3をそれぞれ含む切出し画像cr51乃至cr53を生成する。
また、切出し部100は、撮像装置21−7によって撮像された撮影画像から、オブジェクト1乃至3をそれぞれ含む切出し画像cr71乃至cr73を生成する。
なお、オブジェクト1乃至3のいずれかを含む切出し画像cr11乃至cr73の解像度は、同一の解像度としてもよいし、解像度を変更してもよい。
切出し画像cr11乃至cr73の解像度を異なるように設定する場合、例えば、図20に示されるように、仮想カメラ70の位置に最も近い位置で撮像した撮影画像の切出し画像を高解像度に設定し、その他の撮影画像の切出し画像を低解像度とすることができる。
図20の例では、仮想カメラ70の位置に最も近い位置で撮像した撮像装置21が撮像装置21−2であり、撮像装置21−2によって撮像された撮影画像から切り出された切出し画像cr21乃至cr23が高解像度に設定され、その他の切出し画像cr11乃至cr13および切出し画像cr41乃至cr73が、切出し画像cr21乃至cr23よりも低い低解像度とされている。
その他の変形例として、オブジェクト単位に低解像度と高解像度を変えてもよい。例えば、オブジェクト1の切出し画像cr11乃至cr71を高解像度にし、オブジェクト2の切出し画像cr12乃至cr72と、オブジェクト3の切出し画像cr13乃至cr73を低解像度としてもよい。
また、ネットワーク帯域や、配信側および再生側の負荷等のリソースに応じて、切出し画像の解像度を適応的に変更して伝送してもよい。
(切出し処理)
図21のフローチャートを参照して、切出し部100により実行される切出し処理について説明する。
初めに、ステップS71において、オブジェクト領域設定部101は、画像選択部81から供給される、伝送オブジェクトを含む撮影画像である伝送撮影画像のうち、所定の1枚を選択する。
ステップS72において、オブジェクト領域設定部101は、選択した伝送撮影画像内に含まれる伝送オブジェクトの1つを選択する。
ステップS73において、オブジェクト領域設定部101は、伝送撮影画像に対して、選択した伝送オブジェクトを含むオブジェクト領域を設定する。例えば、図22に示されるように、伝送撮影画像280に対して、伝送オブジェクト281を含む矩形の領域をオブジェクト領域282に設定する。
ステップS74において、切出し画像生成部102は、撮影画像からオブジェクト領域の画像を切り出すことにより、切出し画像を生成する。
ステップS75において、切出し画像生成部102は、撮影画像内の切出し領域の位置を示す切出し情報メタデータを生成する。
ここで、図23を参照して、切出し情報メタデータの例について説明する。
図23は、伝送撮影画像280においてオブジェクト領域282が設定され、切出し画像283が切り出された場合の例を示している。
例えば、切出し画像生成部102は、次式(1)乃至(4)により、切出し情報メタデータに含まれる各パラメータを計算する。
occupancyX=rangeX/width' ・・・(1)
occupancyY=rangeY/height' ・・・(2)
normOffsetX=offsetX/width' ・・・(3)
normOffsetY=offsetY/height' ・・・(4)
ここで、width'は伝送撮影画像280の幅であり、height'は伝送撮影画像2801の高さである。rangeXはオブジェクト領域282の幅であり、rangeYはオブジェクト領域282の高さである。offsetXは、伝送撮影画像280の左上隅とオブジェクト領域282の左上隅との間のX方向(幅方向)の距離であり、offsetYは、伝送撮影画像280の左上隅とオブジェクト領域282の左上隅との間のY方向(高さ方向)の距離である。
従って、occupancyXは、伝送撮影画像280におけるオブジェクト領域282のX方向の占有率を示し、occupancyYは、伝送撮影画像280におけるオブジェクト領域282のY方向の占有率を示す。normOffsetXはoffsetXを正規化したパラメータであり、normOffsetYはoffsetYを正規化したパラメータである。これらのパラメータにより、伝送撮影画像280内のオブジェクト領域282の位置が示される。
なお、図内の点Pの伝送撮影画像280の座標系における座標(u’,v’)と、切出し画像283の座標系における座標(u,v)との関係は、次式(5)及び(6)により表される。
u=(u'−normOffsetX)/occupancyX ・・・(5)
v=(v'−normOffsetY)/occupancyY ・・・(6)
図24は、切出し情報メタデータの具体例を示している。
図24の例では、normOffsetX、occupancyX、normOffsetY、及び、occupancyYが、それぞれ0.05、0.5、0.01、及び、0.5に設定されている。
図21のフローチャートの説明に戻り、ステップS76において、オブジェクト領域設定部101は、選択した伝送撮影画像内に含まれる全ての伝送オブジェクトを選択したかを判定する。
ステップS76で、選択した伝送撮影画像内に含まれる全ての伝送オブジェクトをまだ選択していないと判定された場合、処理はステップS72に戻され、上述したステップS72乃至S76の処理が繰り返される。すなわち、選択した伝送撮影画像内に含まれる次の伝送オブジェクトが選択され、同様の処理が実行される。
一方、ステップS76で、選択した伝送撮影画像内に含まれる全ての伝送オブジェクトを選択したと判定された場合、処理はステップS77に進む。
ステップS77において、オブジェクト領域設定部101は、画像選択部81から供給された全ての伝送撮影画像を選択したかを判定する。
ステップS77で、まだ全ての伝送撮影画像を選択していないと判定された場合、処理はステップS71に戻され、上述したステップS71乃至S77の処理が繰り返される。すなわち、画像選択部81から供給された伝送撮影画像のうち、まだ選択されていない次の伝送撮影画像が選択され、同様の処理が実行される。
一方、ステップS77で、全ての伝送撮影画像を選択したと判定された場合、処理はステップS78に進み、切出し部100は、生成した切出し画像とその切出し情報メタデータ、および、各撮像装置21のカメラパラメータを符号化装置25に出力して、切出し処理を終了する。
(第4のオブジェクト選択処理)
図25は、選択装置24Dによるオブジェクト選択処理(第4のオブジェクト選択処理)を説明するフローチャートである。この処理は、例えば、再生装置28の電源がオンされ、視聴者によって再生を開始する操作が行われたとき、開始される。
初めに、ステップS91において、3Dモデル選択部61は、記憶装置23に記憶されている全てのオブジェクトのなかから、伝送オブジェクトを決定する伝送オブジェクト決定処理を実行する。
換言すれば、ステップS91では、3Dモデル選択部61は、オブジェクト特定情報としての仮想カメラ視聴範囲情報に基づいて伝送オブジェクトを決定する図8の第1のオブジェクト選択処理か、または、視聴者が指定したオブジェクトを表すオブジェクト特定情報に基づいて伝送オブジェクトを決定する図12の第2のオブジェクト選択処理を実行する。処理の結果得られた伝送オブジェクトのオブジェクトIDと3Dモデルデータが、画像選択部81に供給される。
ステップS92において、画像選択部81は、全ての撮像装置21のカメラパラメータを記憶装置23から取得する。
ステップS93において、画像選択部81は、撮像装置21の台数と同じ枚数の撮影画像のなかから、伝送オブジェクトを含む撮影画像である伝送撮影画像を選択する伝送撮影画像選択処理を実行する。換言すれば、画像選択部81は、図16のステップS53乃至S57の処理を実行する。これにより、複数の撮像装置21で撮像された撮影画像のうち、1枚以上の伝送撮影画像と、撮像装置21のカメラパラメータが、切出し部100に供給される。
ステップS94において、切出し部100は、1枚以上の伝送撮影画像から、オブジェクト領域の画像を切り出した切出し画像と、その切出し領域の位置を示す切出し情報メタデータを生成する切出し処理を実行する。換言すれば、切出し部100は、図21のステップS71乃至S77の処理を実行する。
ステップS95において、選択装置24Dは、伝送オブジェクトのオブジェクトID、3Dモデルジオメトリ、切出し画像、切出し情報メタデータ、および、カメラパラメータを、符号化装置25に出力して、処理を終了する。伝送オブジェクトのオブジェクトIDおよび3Dモデルジオメトリは、3Dモデル選択部61から出力され、切出し画像、切出し情報メタデータ、および、カメラパラメータは、切出し部100から出力される。
以上の第4のオブジェクト選択処理によれば、オブジェクト特定情報により特定されるオブジェクトの3Dモデルデータのみを再生装置28に伝送するので、伝送帯域を削減することができる。
また、伝送撮影画像選択処理により、オブジェクト特定情報により特定されるオブジェクトを含まない撮影画像は非伝送撮影画像として伝送しないので、さらに伝送帯域を削減することができる。
さらに、オブジェクトを含む撮影画像から、オブジェクト領域の画像を切出した切出し画像を生成して伝送するので、撮影画像をそのまま伝送するよりも、さらに伝送帯域を削減することができる。
また、仮想カメラ70の位置に最も近い位置で撮像した撮影画像の切出し画像を高解像度に設定して伝送した場合には、伝送帯域を減らしつつ、最適な解像度で試聴することができる。
<7.選択装置の第5実施の形態>
(選択装置の構成例)
図26は、選択装置24の第5実施の形態としての選択装置24Eの構成例を示している。
第5実施の形態において、上述した第1乃至第4実施の形態と対応する部分については同一の符号を付してあり、その説明は適宜省略する。
選択装置24Eでは、3Dモデルデータのデータフォーマットとして、第3実施の形態と同様に、マルチテクスチャジオメトリ形式が適用される。
選択装置24Eは、3Dモデル選択部61、画像選択部81、切出し部100、切出し画像選択部300、および、パッキング部320を備える。
即ち、第5実施の形態に係る選択装置24Eは、第4実施の形態に係る構成に加えて、切出し画像選択部300とパッキング部320が追加された構成とされている。第5実施の形態のその他の構成は、第4実施の形態と同一である。
切出し画像選択部300は、再生装置28に再生用データとして送信する切出し画像が、不図示の設定部等で予め設定されたQ(Q>0)枚以下となるように切出し画像を選択する。1つの伝送オブジェクトに関して、切出し部100から供給された切出し画像の枚数が、Q枚以上である場合には、切出し画像選択部300において、Q枚の切出し画像に削減され、Q枚より少ない場合には、切出し部100から供給されたままの枚数の切出し画像が、パッキング部320に供給される。
切出し画像選択部300は、重要度設定部301及び再生用データ選択部302を備える。
選択装置24Eには、各撮像装置21のカメラパラメータに加えて、仮想カメラのカメラパラメータも供給される。
重要度設定部301は、各撮像装置21のカメラパラメータ、及び、仮想カメラのカメラパラメータに基づいて、各撮像装置21の重要度を設定する。
再生用データ選択部302は、各撮像装置21の重要度に基づいて、Q枚以下の切出し画像を選択する。また、再生用データ選択部302は、選択した各切出し画像の重要度として、それらの撮像に用いられた撮像装置21の重要度を設定する。再生用データ選択部302は、選択した切出し画像とその重要度、並びに、切出し画像に対応する切出し情報メタデータ及びカメラパラメータをパッキング部320に供給する。
パッキング部320は、複数枚の切出し画像を1つの画像にパッキング(結合)することにより、パッキング画像を生成する。
パッキング部320は、パッキング画像生成部321及びメタデータ生成部322を備える。
パッキング画像生成部321は、必要に応じて各切出し画像の重要度を用いながら、各切出し画像をパッキングするためのレイアウトであるパッキングレイアウトを設定する。そして、パッキング画像生成部321は、必要に応じて各切出し画像の重要度を用いながら、各切出し画像をパッキングレイアウト内の各パッキング領域にマッピングすることにより、パッキング画像を生成し、符号化装置25に供給する。パッキングする単位は、撮像装置21ごとでもよいし、伝送オブジェクトごとでもよい。あるいはまた、全ての切出し画像を1つのパッキング画像としてパッキングしてもよい。
メタデータ生成部322は、切出し画像をマッピングした位置を示すパッキング情報メタデータを生成する。
メタデータ生成部322は、パッキング画像に含まれる各切出し画像の切出し情報メタデータ、パッキング情報メタデータ、及び、カメラパラメータを、符号化装置25に供給する。
(再生用データ選択処理)
図27のフローチャートを参照して、切出し画像選択部300により実行される再生用データ選択処理について説明する。
初めに、ステップS121において、重要度設定部301は、再生装置28から送受信装置26等を介して仮想カメラのカメラパラメータを取得する。また、重要度設定部301は、各撮像装置21のカメラパラメータを切出し部100から取得する。仮想カメラのカメラパラメータは、例えば、撮像装置21のカメラパラメータと同じ種類のパラメータを含む。
ステップS122において、重要度設定部301は、伝送オブジェクトの1つを選択する。
ステップS123において、重要度設定部301は、変数iに1を設定する。
ステップS124において、重要度設定部301は、各撮像装置21−iの重要度P(i)(i=1乃至N)を計算する。
重要度P(i)は、例えば、各撮像装置21(現実の視点)と仮想カメラとの間の位置及び方向のうち少なくとも1つの相対関係に基づいて計算される。
図28乃至図30を参照して、重要度P(i)の計算方法について説明する。なお、図28乃至図30では、撮像装置21の台数が8台である場合で説明する。
図28は、各撮像装置21から、表示対象となるオブジェクト331の方向と、仮想カメラ332から、オブジェクト331の方向との関係に基づいて、各撮像装置21の重要度P(i)を計算する例を示している。この場合、重要度P(i)は、次式(7)により算出される。
P(i)=Ci・Cv ・・・(7)
ここで、Ciは、撮像装置21−iからオブジェクト331へのベクトルを示している。Cvは、仮想カメラ332からオブジェクト331へのベクトルを示している。Ci・Cvは、ベクトルCiとベクトルCvの内積を示している。
従って、重要度P(i)は、ベクトルCiとベクトルCvのなす角に反比例し、ベクトルCiとベクトルCvのなす角が小さくなるほど、重要度P(i)が高くなる。すなわち、オブジェクト331に対する方向が仮想カメラ332に近い撮像装置21ほど、重要度P(i)が高くなる。
なお、ベクトルCi及びベクトルCvは、オブジェクト331の代表点Rを基準にして設定される。代表点Rは、任意の方法により設定可能である。例えば、各撮像装置21及び仮想カメラ332の光軸からの距離の合計が最小となるオブジェクト331上の点が、代表点Rに設定される。或いは、例えば、ワールド座標系のX方向、Y方向、及び、Z方向の各方向におけるオブジェクト331の頂点の座標の最大値と最小値の中間の位置が、代表点Rに設定される。或いは、例えば、オブジェクト331の中で最も重要な位置が、代表点Rに設定される。例えば、オブジェクト331が人である場合、人の顔の中心等が、代表点Rに設定される。
図29は、各撮像装置21の光軸(現実の視点の方向)と仮想カメラ332の光軸(仮想の視点の方向)との関係に基づいて、重要度P(i)を計算する例を示している。この場合、重要度P(i)は、次式(8)により算出される。
P(i)=Zi・Zv ・・・(8)
ここで、Ziは、撮像装置21−iの光軸ベクトルを示している。Zvは、仮想カメラ332の光軸ベクトルを示している。Zi・Zvは、光軸ベクトルZiと光軸ベクトルZvの内積を示している。
従って、重要度P(i)は、光軸ベクトルZiと光軸ベクトルZvのなす角に反比例し、ベクトルZiとベクトルZvのなす角が小さくなるほど、重要度P(i)が高くなる。すなわち、光軸の方向が仮想カメラ332に近い撮像装置21ほど、重要度P(i)が高くなる。
図30は、各撮像装置21と仮想カメラ332との間の距離に基づいて、重要度P(i)を計算する例を示している。この場合、重要度P(i)は、次式(9)により算出される。
P(i)=1−Di/ΣDi ・・・(9)
ここで、Diは、撮像装置21−iと仮想カメラ332との間の距離を示している。
従って、仮想カメラ332に近い撮像装置21ほど、重要度P(i)が高くなる。
なお、図29の重要度P(i)及び図30の重要度P(i)は、オブジェクト331の位置や動きとは無関係である。従って、各撮像装置21及び仮想カメラ332の位置及び向きが固定であれば、重要度P(i)を固定することが可能である。
なお、重要度設定部301は、上述した3種類の重要度P(i)のうち2種類以上を組み合わせて、重要度を設定するようにしてもよい。
また、重要度設定部301は、各撮像装置21により撮像された撮影画像の内容に基づいて、重要度を設定するようにしてもよい。例えば、表示対象となるオブジェクトの正面に近い撮像装置21の重要度を高くするようにしてもよい。或いは、例えば、表示対象となるオブジェクトが人である場合、顔が写っている撮影画像を撮像した撮像装置21の重要度を高くするようにしてもよい。
図27に戻り、ステップS125において、重要度設定部301は、変数iを1つインクリメントする。
ステップS126において、重要度設定部301は、変数iがN以下であるか否かを判定する。なお、Nは、撮像装置21の台数である。変数iがN以下であると判定された場合、処理はステップS124に戻る。
その後、ステップS126において、変数iがNより大きいと判定されるまで、ステップS124乃至ステップS126の処理が繰り返し実行される。これにより、全ての撮像装置21−iの重要度P(i)が計算される。
一方、ステップS126において、変数iがNより大きいと判定された場合、処理はステップS127に進む。
ステップS127において、再生用データ選択部302は、重要度P(i)に基づいて、再生用データを選択する。すなわち、再生用データ選択部302は、重要度P(i)が高い方の撮像装置21からQ枚の切出し画像を選択する。
なお、規定枚数の切出し画像を選択するのではなく、重要度P(i)が所定の閾値以上の撮像装置21で撮像された切出し画像の全てを選択してもよい。この場合、切出し画像の選択枚数は固定されない。
また、再生用データ選択部302は、各切出し画像の重要度として、切出し画像を撮像した撮像装置21の重要度P(i)を設定する。
ステップS128において、再生用データ選択部302は、全ての伝送オブジェクトを選択したかを判定する。
ステップS128で、全ての伝送オブジェクトをまだ選択していないと判定された場合、処理はステップS122に戻され、上述したステップS122乃至S127の処理が繰り返される。すなわち、次の伝送オブジェクトが選択され、同様の処理が実行される。
一方、ステップS128で、全ての伝送オブジェクトを選択したと判定された場合、処理はステップS1129に進み、再生用データ選択部302は、選択した切出し画像とその重要度、切出し画像に対応する切出し情報メタデータ、および、カメラパラメータをパッキング部320に供給して、再生用データ選択処理は終了する。
(パッキング処理)
次に、図31のフローチャートを参照して、パッキング部320により実行されるパッキング処理について説明する。
初めに、ステップS151において、パッキング画像生成部321は、パッキングレイアウトを設定する。ここで、パッキングレイアウトには、パッキング画像と同じ矩形の領域内において、切出し画像をマッピングするためのパッキング領域のレイアウトが示される。
例えば、パッキングレイアウトは、選択される切出し画像の数(以下、選択数と称する。)や、各切出し画像の重要度に基づいて設定される。
例えば、切出し画像の選択数が可変の場合、選択数に基づいて、パッキングレイアウトが設定される。例えば、パッキング画像と同じ大きさの矩形の領域が、選択数分のパッキング領域に分割されたパッキングレイアウトが設定される。このとき、各パッキング領域の形状及び大きさが同じでもよいし、異なっていてもよい。後者の場合、例えば、重要度が高い切出し画像がマッピングされるパッキング領域ほど大きくなる。
図32は、同じ形状及び大きさのパッキング領域が格子状に配列されたパッキングレイアウトの例を示している。
パッキングレイアウト341では、同じ形状及び大きさの矩形のパッキング領域が、縦1行×横3列に配列されている。パッキングレイアウト342では、同じ形状及び大きさの矩形のパッキング領域が、縦2行×横2列に配列されている。パッキングレイアウト343では、同じ形状及び大きさの矩形のパッキング領域が、縦3行×横3列に配列されている。
一方、切出し画像の選択数が固定の場合、パッキングレイアウトが固定されてもよいし、或いは、必要に応じて変更されてもよい。パッキングレイアウトが固定の場合、各パッキング領域の形状及び大きさが同じであってもよいし、異なっていてもよい。各パッキング領域の形状又は大きさが異なっている場合、例えば、重要度が高い切出し画像がマッピングされるパッキング領域ほど大きくなる。一方、パッキングレイアウトが可変の場合、例えば、各切出し画像の重要度に応じて、各パッキング領域の大きさが設定される。例えば、重要度が高い切出し画像がマッピングされるパッキング領域ほど大きくなる。
ステップS152において、パッキング画像生成部321は、変数iに1を設定する。
ステップS153において、パッキング画像生成部321は、格子状のパッキングレイアウトであるかを判定する。パッキング画像生成部321は、設定したパッキングレイアウトにおいて、同じ形状及び大きさのパッキング領域が格子状に並んでいない場合、格子状のパッキングレイアウトでないと判定し、処理はステップS154に進む。
ステップS154において、メタデータ生成部322は、パッキング領域iのメタデータを生成する。具体的には、格子状でないパッキングレイアウトの場合、パッキング情報メタデータは、各パッキング領域に対応する複数のパッキング領域メタデータを含む。そして、メタデータ生成部322は、パッキング領域iに対応するパッキング領域メタデータを生成する。
図33は、格子状でないパッキングレイアウトの例を示している。
図33のパッキングレイアウト361では、中央の大きなパッキング領域の上及び下に、同じ形状及び大きさのパッキング領域が縦1行×横3列に配置されている。
例えば、パッキングレイアウト361の斜線で示されるパッキング領域362のパッキング領域メタデータの各パラメータは、次式(10)乃至(13)により計算される。
occupancyX=rangeX/width' ・・・(10)
occupancyY=rangeY/height' ・・・(11)
normOffsetX=offsetX/width' ・・・(12)
normOffsetY=offsetY/height' ・・・(13)
ここで、width'はパッキングレイアウト361(パッキング画像)の幅であり、height'はパッキングレイアウト361の高さである。rangeXはパッキング領域362の幅であり、rangeYはパッキング領域362の高さである。offsetXは、パッキングレイアウト361の左上隅とパッキング領域362の左上隅との間のX方向(幅方向)の距離であり、offsetYは、パッキングレイアウト361の左上隅とパッキング領域362の左上隅との間のY方向(高さ方向)の距離である。
従って、occupancyXは、パッキングレイアウト361(パッキング画像)におけるパッキング領域362のX方向の占有率を示し、occupancyYは、パッキングレイアウト361におけるパッキング領域362のY方向の占有率を示す。normOffsetXはoffsetXを正規化したパラメータであり、normOffsetYはoffsetYを正規化したパラメータである。
ステップS155において、パッキング画像生成部321は、パッキング領域iにマッピングする切出し画像を選択する。このとき、例えば、パッキング画像生成部321は、重要度が高い切出し画像ほど、大きなパッキング領域にマッピングされるように切出し画像を選択する。或いは、例えば、パッキング画像生成部321は、パッキング領域iの形状に近い形状の切出し画像を選択する。
また、メタデータ生成部322は、選択した切出し画像に対応する撮像装置21を示すID(識別情報)をパッキング領域メタデータに追加する。
図34は、パッキング領域メタデータの具体例を示している。
図34の例では、normOffsetX、occupancyX、normOffsetY、及び、occupancyYが、それぞれ0.33、0.33、0.8、及び、0.2に設定されている。また、camera_idが、1に設定されている。camera_idは、パッキング領域にマッピングされる切出し画像に対応する撮像装置21のIDを示すパラメータである。
ステップS155で、パッキング領域iにマッピングする切出し画像が選択され、パッキング領域iに対応するパッキング領域メタデータに撮像装置21のIDが追加された後、処理はステップS157に進む。
一方、ステップS153において、格子状のパッキングレイアウトであると判定された場合、処理はステップS156に進む。
ステップS156において、パッキング画像生成部321は、ステップS155の処理と同様に、パッキング領域iにマッピングする切出し画像を選択する。また、メタデータ生成部322は、選択した切出し画像に対応する撮像装置21のIDをパッキング情報メタデータに追加する。
図35は、格子状のパッキングレイアウトに対応するパッキング情報メタデータの例を示している。
図35の左側は、パッキングレイアウトの例を示している。このパッキングレイアウトには、同じ形状及び大きさのパッキング領域が縦4行×横3列に格子状に配列されている。
図35の右側は、左側のパッキングレイアウトに対して生成されるパッキング情報メタデータの例を示している。この例では、パッキングレイアウトの行数を表すパラメータrawに4が設定され、列数を表すパラメータcolumnに3が設定されている。また、各パッキング領域にマッピングされる切出し画像に対応する撮像装置21のIDを示すパラメータcamera_idが設定されている。例えば、1行目の1列目のパッキング領域のcamera_idは2に設定され、1行目の2列目のパッキング領域のcamera_idは1に設定され、2行目の1列目のパッキング領域のcamera_idは3に設定されている。
例えば、メタデータ生成部322は、ループ内の最初のステップS156の処理において、パラメータraw及びcolumnの値を設定する。また、メタデータ生成部322は、各ループ内のステップS156の処理において、切出し画像をマッピングするパッキング領域に対応するパラメータcamera_idに、その切出し画像に対応する撮像装置21のIDを設定する。
ステップS156で、パッキング領域iにマッピングする切出し画像が選択され、撮像装置21のIDがパッキング情報メタデータに追加された後、処理はステップS157に進む。
ステップS157において、メタデータ生成部322は、変数iがM以下であるか否かを判定する。なお、Mは、パッキングレイアウト内のパッキング領域の数を表す。
ステップS157で、変数iがM以下であると判定された場合、処理はステップS153に戻り、ステップS157において、変数iがMより大きいと判定されるまで、ステップS153乃至ステップS157の処理が繰り返し実行される。これにより、パッキングレイアウト内の各パッキング領域にマッピングされる切出し画像が選択されるとともに、パッキング情報メタデータが生成される。
一方、ステップS157で、変数iがMより大きいと判定された場合、処理はステップS158に進む。
ステップS158において、パッキング画像生成部321は、パッキング画像を生成する。具体的には、パッキング画像生成部321は、各切出し画像をパッキングレイアウトの各パッキング領域にマッピングする。これにより、複数の切出し画像が1つに結合されたパッキング画像が生成される。
例えば、図36に示されるように、縦1080画素×横1920画素の9枚の撮影画像から切り出された切出し画像が、縦540画素×横960画素のパッキング領域が縦3行×横3列に配列されたパッキングレイアウトにそれぞれマッピングされる。これにより、9枚の切出し画像が1枚のパッキング画像に結合される。
このとき、パッキング画像生成部321は、各切出し画像の大きさをマッピングするパッキング領域の大きさに合わせるために、切出し画像の拡縮を行う。例えば、図37に示されるように、切出し画像381がパッキング領域391にマッピングされる場合、切出し画像381の縦方向及び横方向が縮小される。また、切出し画像382がパッキング領域392にマッピングされる場合、切出し画像382の縦方向が縮小され、横方向が拡大される。
同様に、パッキング画像生成部321は、各切出し画像をパッキングレイアウトの各パッキング領域にマッピングする。これにより、各切出し画像が1つに結合されたパッキング画像が生成される。
ステップS159において、パッキング部320は、生成したパッキング画像を、各切出し画像の切出し情報メタデータ、パッキング画像のパッキング情報メタデータ、および、カメラパラメータとともに、符号化装置25に出力して、パッキング処理が終了する。
(第5のオブジェクト選択処理)
図38は、選択装置24Eによるオブジェクト選択処理(第5のオブジェクト選択処理)を説明するフローチャートである。この処理は、例えば、再生装置28の電源がオンされ、視聴者によって再生を開始する操作が行われたとき、開始される。
初めに、ステップS171において、3Dモデル選択部61は、記憶装置23に記憶されている全てのオブジェクトのなかから、伝送オブジェクトを決定する伝送オブジェクト決定処理を実行する。
換言すれば、ステップS171では、3Dモデル選択部61は、オブジェクト特定情報としての仮想カメラ視聴範囲情報に基づいて伝送オブジェクトを決定する図8の第1のオブジェクト選択処理か、または、視聴者が指定したオブジェクトを表すオブジェクト特定情報に基づいて伝送オブジェクトを決定する図12の第2のオブジェクト選択処理を実行する。処理の結果得られた伝送オブジェクトのオブジェクトIDと3Dモデルデータが、画像選択部81に供給される。
ステップS172において、画像選択部81は、全ての撮像装置21と仮想カメラのカメラパラメータを取得する。
ステップS173において、画像選択部81は、撮像装置21の台数と同じ枚数の撮影画像のなかから、伝送オブジェクトを含む撮影画像である伝送撮影画像を選択する伝送撮影画像選択処理を実行する。換言すれば、画像選択部81は、図16のステップS53乃至S57の処理を実行する。これにより、複数の撮像装置21で撮像された撮影画像のうち、1枚以上の伝送撮影画像と、撮像装置21のカメラパラメータが、切出し部100に供給される。
ステップS174において、切出し部100は、1枚以上の伝送撮影画像から、オブジェクト領域の画像を切り出した切出し画像と、その切出し領域の位置を示す切出し情報メタデータを生成する切出し処理を実行する。換言すれば、切出し部100は、図21のステップS71乃至S77の処理を実行する。生成された切出し画像とその切出し情報メタデータ、及び、全ての撮像装置21と仮想カメラのカメラパラメータが、切出し画像選択部300に供給される。
ステップS175において、切出し画像選択部300は、再生装置28に再生用データとして送信する切出し画像の枚数が所定枚数(例えば、Q枚以下)となるように、切出し画像の重要度に応じて切出し画像を選択する再生用データ選択処理を実行する。換言すれば、切出し画像選択部300は、図27のステップS121乃至S129の処理を実行する。
ステップS176において、パッキング部320は、切出し画像選択部300で選択された複数枚の切出し画像を1つの画像にパッキングすることにより、パッキング画像を生成するパッキング処理を実行する。換言すれば、パッキング部320は、図31のステップS151乃至S158の処理を実行する。
ステップS177において、選択装置24Eは、伝送オブジェクトのオブジェクトID、3Dモデルジオメトリ、パッキング画像、切出し情報メタデータ、パッキング情報メタデータ、および、カメラパラメータを、符号化装置25に出力して、第5のオブジェクト選択処理を終了する。伝送オブジェクトのオブジェクトIDおよび3Dモデルジオメトリは、3Dモデル選択部61から出力され、パッキング画像、切出し情報メタデータ、パッキング情報メタデータ、および、カメラパラメータは、パッキング部320から出力される。
以上の第5のオブジェクト選択処理によれば、オブジェクト特定情報により特定されるオブジェクトの3Dモデルデータのみを再生装置28に伝送するので、伝送帯域を削減することができる。
また、伝送撮影画像選択処理により、オブジェクト特定情報により特定されるオブジェクトを含まない撮影画像は非伝送撮影画像として伝送しないので、さらに伝送帯域を削減することができる。
さらに、オブジェクトを含む撮影画像から、オブジェクト領域の画像を切出した切出し画像を生成して伝送するので、撮影画像をそのまま伝送するよりも、さらに伝送帯域を削減することができる。
また、再生用データ選択処理により、切出し画像の重要度に応じて切出し画像を所定枚数に削減し、それらをパッキング処理により1つの画像にパッキングして伝送するので、伝送帯域を減らしつつ、最適な解像度で試聴することができる。
<8.選択装置の第6実施の形態>
(選択装置の構成例)
図39は、選択装置24の第6実施の形態としての選択装置24Fの構成例を示している。
第6実施の形態において、上述した第1乃至第5実施の形態と対応する部分については同一の符号を付してあり、その説明は適宜省略する。
選択装置24Fでは、3Dモデルデータのデータフォーマットとして、オブジェクトの色情報が撮像装置21の台数と同じ枚数の撮影画像で構成され、オブジェクトのジオメトリ情報が撮像装置21の台数と同じ枚数のデプス画像で構成される、マルチテクスチャデプス形式が適用される。なお、以下では、色情報としての撮影画像を、デプス画像との区別を容易にするため、テクスチャ画像と称して説明する。
選択装置24Fは、3Dモデル選択部61、および、テクスチャデプス画像選択部421を備える。すなわち、選択装置24Fは、第3実施の形態と同様の3Dモデル選択部61に、テクスチャデプス画像選択部421がさらに追加された構成とされている。
3Dモデル選択部61には、全オブジェクトの3Dモデルデータが供給される。3Dモデルデータは、撮像装置21の台数と同じ枚数のテクスチャ画像とデプス画像で構成される。
3Dモデル選択部61は、オブジェクト特定情報に基づいて、記憶装置23に記憶されている全てのオブジェクトのなかから、伝送オブジェクトを決定(選択)する。3Dモデル選択部61は、決定した伝送オブジェクトの3Dモデルデータ、即ち、複数枚のテクスチャ画像とデプス画像を、テクスチャデプス画像選択部421に供給する。
テクスチャデプス画像選択部421には、全ての撮像装置21のカメラパラメータが記憶装置23から供給される。
テクスチャデプス画像選択部421は、図13に示した第3実施の形態の画像選択部81と同様の処理を行う。ただし、第3実施の形態の画像選択部81が扱う3Dモデルデータが、マルチテクスチャジオメトリ形式のデータであったのに対して、テクスチャデプス画像選択部421が扱う3Dモデルデータは、マルチテクスチャデプス形式のデータである点が異なる。
すなわち、テクスチャデプス画像選択部421は、撮像装置21の台数と同じ枚数のテクスチャ画像とデプス画像のなかから、伝送オブジェクトを含むテクスチャ画像とデプス画像を選択する伝送画像選択処理を実行する。
図40は、テクスチャデプス画像選択部421が実行する伝送画像選択処理を説明する図である。図40は、第3実施の形態で説明した図15に対応する。
図40を第3実施の形態で説明した図15と比較すると、色情報であるテクスチャ画像については同一であり、ジオメトリ情報が、ポリゴンメッシュによる表現から、デプス画像による表現に変更されている。図40において、dep1乃至dep7は、7個の撮像装置21−1乃至21−7で生成されたデプス画像を表す。
図15で説明した例と同様に、7個の撮像装置21−1乃至21−7で撮影された7枚のテクスチャ画像のうち、撮像装置21−3と撮像装置21−6で撮影されたテクスチャ画像が伝送しないテクスチャ画像に決定されたとする。この場合、テクスチャデプス画像選択部421は、デプス画像に関しても同様に、撮像装置21−3と撮像装置21−6で生成されたデプス画像を、伝送しないデプス画像に決定する。
テクスチャデプス画像選択部421は、伝送オブジェクトのオブジェクトIDと3Dモデルデータを、符号化装置25に出力する。ただし、3Dモデルデータは、テクスチャ画像とデプス画像で表現されるマルチテクスチャデプス形式であり、撮像装置21の台数と同じ枚数の撮影画像のうち、伝送オブジェクトが含まれるテクスチャ画像とデプス画像のみである。また、画像選択部81は、3Dモデルデータとして送信するテクスチャ画像とデプス画像に対応する撮像装置21のカメラパラメータも、符号化装置25に出力する。
(第6のオブジェクト選択処理)
図41は、選択装置24Fによるオブジェクト選択処理(第6のオブジェクト選択処理)を説明するフローチャートである。この処理は、例えば、再生装置28の電源がオンされ、視聴者によって再生を開始する操作が行われたとき、開始される。
初めに、ステップS191において、3Dモデル選択部61は、記憶装置23に記憶されている全てのオブジェクトのなかから、伝送オブジェクトを決定する伝送オブジェクト決定処理を実行する。
換言すれば、ステップS191では、3Dモデル選択部61は、オブジェクト特定情報としての仮想カメラ視聴範囲情報に基づいて伝送オブジェクトを決定する図8の第1のオブジェクト選択処理か、または、視聴者が指定したオブジェクトを表すオブジェクト特定情報に基づいて伝送オブジェクトを決定する図12の第2のオブジェクト選択処理を実行する。処理の結果得られた伝送オブジェクトのオブジェクトIDと3Dモデルデータが、テクスチャデプス画像選択部421に供給される。
ステップS192において、テクスチャデプス画像選択部421は、全ての撮像装置21のカメラパラメータを記憶装置23から取得する。
ステップS193において、テクスチャデプス画像選択部421は、撮像装置21の台数と同じ枚数のテクスチャ画像とデプス画像のなかから、伝送オブジェクトを含むテクスチャ画像とデプス画像を選択する伝送画像選択処理を実行する。
ステップS194において、選択装置24Fは、伝送オブジェクトのオブジェクトID、伝送オブジェクトが含まれるテクスチャ画像とデプス画像からなる3Dモデルデータ、および、伝送するテクスチャ画像とデプス画像に対応する撮像装置21のカメラパラメータを、符号化装置25に出力して、第6のオブジェクト選択処理を終了する。伝送オブジェクトのオブジェクトIDは、3Dモデル選択部61から出力され、3Dモデルデータ、および、カメラパラメータは、テクスチャデプス画像選択部421から出力される。
以上の第6のオブジェクト選択処理によれば、オブジェクト特定情報により特定されるオブジェクトの3Dモデルデータのみを再生装置28に伝送するので、伝送帯域を削減することができる。
また、伝送画像選択処理により、オブジェクト特定情報により特定されるオブジェクトを含まないテクスチャ画像とデプス画像は伝送しないので、さらに伝送帯域を削減することができる。
<9.選択装置の第7実施の形態>
(選択装置の構成例)
図42は、選択装置24の第7実施の形態としての選択装置24Gの構成例を示している。
第7実施の形態において、上述した第1乃至第6実施の形態と対応する部分については同一の符号を付してあり、その説明は適宜省略する。
選択装置24Gでは、3Dモデルデータのデータフォーマットとして、第6実施の形態と同様に、マルチテクスチャデプス形式が適用される。
選択装置24Gは、3Dモデル選択部61、テクスチャデプス画像選択部421、および、テクスチャデプス切出し部441を備える。
即ち、第7実施の形態に係る選択装置24Gは、図39に示した第6実施の形態と同様の3Dモデル選択部61とテクスチャデプス画像選択部421に、テクスチャデプス切出し部441がさらに追加された構成とされる。第7実施の形態のその他の構成は、第6実施の形態と同一である。
テクスチャデプス切出し部441には、テクスチャデプス画像選択部421から、伝送オブジェクトが含まれるテクスチャ画像およびデプス画像と、撮像装置21のカメラパラメータが、供給される。
テクスチャデプス切出し部441は、図17で示した第4実施の形態の切出し部100と同様に、オブジェクト領域の画像を切り出す切出し処理を行う。ただし、3Dモデルデータのデータフォーマットが、第4実施の形態ではポリゴンメッシュとテクスチャ画像で表現されるマルチテクスチャジオメトリ形式であったのに対して、第7実施の形態ではテクスチャ画像とデプス画像で表現されるマルチテクスチャデプス形式である点が異なる。
より具体的には、テクスチャデプス切出し部441は、テクスチャデプス画像選択部421から供給される伝送オブジェクトが含まれるテクスチャ画像に対して、オブジェクト領域の画像を切出すことにより、テクスチャ切出し画像を生成する。テクスチャ切出し画像の生成については、第4実施の形態の切出し部100と同様である。
また、テクスチャデプス切出し部441は、テクスチャデプス画像選択部421から供給される伝送オブジェクトが含まれるデプス画像に対して、オブジェクト領域の画像を切出すことにより、デプス切出し画像を生成する。
さらに、テクスチャデプス切出し部441は、テクスチャ画像およびデプス画像からの切出し領域の位置を示す切出し情報メタデータを生成する。テクスチャデプス切出し部441は、テクスチャ切出し画像およびデプス切出し画像とそれらの切出し情報メタデータ、及び、各撮像装置21のカメラパラメータを符号化装置25に供給する。
(デプス画像の説明)
図43は、デプス画像を説明する図である。
図43の例では、テクスチャ切出し画像460に、3つのオブジェクト461乃至463が撮像されている。
この場合、テクスチャデプス切出し部441は、伝送オブジェクトごとに、デプス切出し画像を生成する。
具体的には、図43の右側上段に示されるように、例えば、テクスチャデプス切出し部441は、オブジェクト461については、デプス切出し画像481を生成する。デプス切出し画像481は、テクスチャ切出し画像460と同一サイズで、オブジェクト461の領域の画素値がオブジェクト461の距離zを表す所定の解像度で表現され、オブジェクト461の領域以外の画素値が任意の固定値(図43の例では0)で表現される画像である。
テクスチャデプス切出し部441は、オブジェクト462については、デプス切出し画像482を生成する。デプス切出し画像482は、テクスチャ切出し画像460と同一サイズで、オブジェクト462の領域の画素値がオブジェクト462の距離zを表す所定の解像度で表現され、オブジェクト462の領域以外の画素値が任意の固定値(図43の例では0)で表現される画像である。
同様に、テクスチャデプス切出し部441は、オブジェクト463については、デプス切出し画像483を生成する。デプス切出し画像483は、テクスチャ切出し画像460と同一サイズで、オブジェクト463の領域の画素値がオブジェクト463の距離zを表す所定の解像度で表現され、オブジェクト463の領域以外の画素値が任意の固定値(図43の例では0)で表現される画像である。
なお、デプス切出し画像のサイズは、オブジェクトごとに異なるようにしてもよい。
具体的には、例えば、図43の右側下段に示されるように、テクスチャデプス切出し部441は、オブジェクト461については、テクスチャ切出し画像460上のオブジェクト461の領域に対応する領域の画素値が、オブジェクト461の距離zを表す、その領域を含む矩形の最小サイズのデプス切出し画像491を生成する。
同様に、テクスチャデプス切出し部441は、オブジェクト462については、テクスチャ切出し画像460上のオブジェクト462の領域に対応する領域を含む矩形の最小サイズのデプス切出し画像492、オブジェクト463については、テクスチャ切出し画像460上のオブジェクト463の領域に対応する領域を含む矩形の最小サイズのデプス切出し画像493を生成する。
この場合、テクスチャ切出し画像460と同一サイズでデプス切出し画像を生成した場合と比べて、デプス切出し画像のデータ量を削減することができる。
図44は、切出し情報メタデータの例を示している。
X方向(幅方向)およびY方向(高さ方向)に関するテクスチャ画像およびデプス画像からの切出し領域の位置は、図23を参照して説明したoffsetX、rangeX、offsetY、rangeYで表される。
あるいはまた、テクスチャ画像およびデプス画像の幅width'または高さheight'で除算した式(1)乃至(4)のoccupancyX、occupancyY、normOffsetX、normOffsetYで、切出し領域の位置を表現してもよい。
さらに、第7実施の形態の切出し情報メタデータには、デプス切出し画像に関する切出し情報として、z座標の最小値zminと最大値zmaxが含まれる。
図45は、最小値zminと最大値zmaxを説明する図である。
図45に示されるように、オブジェクト521のz座標の最小値と最大値が最小値zminと最大値zmaxであるとすると、その最小値zminと最大値zmaxが、切出し情報メタデータに格納される。オブジェクト毎に最小値zminと最大値zmaxを伝送することにより、オブジェクト毎の量子化が可能となる。
(第7のオブジェクト選択処理)
図46は、選択装置24Gによるオブジェクト選択処理(第7のオブジェクト選択処理)を説明するフローチャートである。この処理は、例えば、再生装置28の電源がオンされ、視聴者によって再生を開始する操作が行われたとき、開始される。
初めに、ステップS231において、3Dモデル選択部61は、記憶装置23に記憶されている全てのオブジェクトのなかから、伝送オブジェクトを決定する伝送オブジェクト決定処理を実行する。
換言すれば、ステップS231では、3Dモデル選択部61は、オブジェクト特定情報としての仮想カメラ視聴範囲情報に基づいて伝送オブジェクトを決定する図8の第1のオブジェクト選択処理か、または、視聴者が指定したオブジェクトを表すオブジェクト特定情報に基づいて伝送オブジェクトを決定する図12の第2のオブジェクト選択処理を実行する。処理の結果得られた伝送オブジェクトのオブジェクトIDと3Dモデルデータが、テクスチャデプス画像選択部421に供給される。
ステップS232において、テクスチャデプス画像選択部421は、全ての撮像装置21のカメラパラメータを記憶装置23から取得する。
ステップS233において、テクスチャデプス画像選択部421は、撮像装置21の台数と同じ枚数のテクスチャ画像とデプス画像のなかから、伝送オブジェクトを含むテクスチャ画像とデプス画像を選択する伝送画像選択処理を実行する。
ステップS234において、テクスチャデプス切出し部441は、伝送オブジェクトを含むテクスチャ画像とデプス画像のオブジェクト領域を切り出し、オブジェクト毎のテクスチャ切出し画像およびデプス切出し画像と、それらの切出し情報メタデータを生成する切出し処理を実行する。
ステップS235において、選択装置24Gは、伝送オブジェクトのオブジェクトID、伝送オブジェクト毎のテクスチャ切出し画像およびデプス切出し画像からなる3Dモデルデータ、切出し情報メタデータ、並びに、カメラパラメータを、符号化装置25に出力して、第7のオブジェクト選択処理を終了する。伝送オブジェクトのオブジェクトIDは、3Dモデル選択部61から出力され、3Dモデルデータ、切出し情報メタデータ、および、カメラパラメータは、テクスチャデプス切出し部441から出力される。
以上の第7のオブジェクト選択処理によれば、オブジェクト特定情報により特定されるオブジェクトの3Dモデルデータのみを再生装置28に伝送するので、伝送帯域を削減することができる。
また、伝送画像選択処理により、オブジェクト特定情報により特定されるオブジェクトを含まないテクスチャ画像とデプス画像は伝送しないので、さらに伝送帯域を削減することができる。
さらに、オブジェクトを含むテクスチャ画像とデプス画像から、オブジェクト領域の画像を切出したテクスチャ切出し画像とデプス切出し画像を生成して伝送するので、テクスチャ画像とデプス画像をそのまま伝送するよりも、さらに伝送帯域を削減することができる。
なお、第7実施の形態において、テクスチャデプス切出し部441の後段に、図26に示した第5実施の形態と同様の、切出し画像選択部300およびパッキング部320の少なくとも1つをさらに設け、テクスチャ切出し画像とデプス切出し画像をさらに選択したり、1つの画像にパッキングして伝送する構成としてもよい。
<10.配信処理と再生処理>
最後に、画像処理システム10の配信側全体の処理である配信処理と、再生側の処理である再生処理について説明する。
(配信処理)
最初に、図47のフローチャートを参照して、画像処理システム10の配信側による配信処理について説明する。
初めに、ステップS301において、複数の撮像装置21それぞれは、所定の撮影空間を撮影し、その結果得られる動画像を再構成装置22に供給する。
ステップS302において、再構成装置22は、撮像装置21−1乃至21−Nそれぞれから供給される撮影空間内の動画像を用いて、撮影空間内に存在する多数のオブジェクトについて、オブジェクトごとに3Dモデルを生成し、生成された各オブジェクトの3Dモデルデータを記憶装置23に供給する。
動画像のなかで何をオブジェクトに設定するか、どのようにオブジェクトを分離するかについては、任意の手法を採用することができ、各オブジェクトは適切に分離されて、オブジェクト毎の3Dモデルデータが記憶装置23に記憶される。
ステップS303において、選択装置24は、再生装置28から送信されてくるオブジェクトを特定するオブジェクト特定情報を、送受信装置26から取得する。
オブジェクト特定情報は、例えば、仮想カメラの視聴範囲情報である仮想カメラ視聴範囲情報や、視聴者が表示対象として指定したオブジェクトのオブジェクトIDの情報などである。オブジェクト特定情報として、オブジェクトIDの情報を取得する場合には、予め各オブジェクトのオブジェクトIDとグローバル位置情報が、再生装置28に送信される。
ステップS304において、選択装置24は、オブジェクト特定情報に基づいて、記憶装置23に記憶されている全てのオブジェクトのなかから、送信するオブジェクトを決定(選択)し、決定した1以上のオブジェクトのオブジェクトIDと3Dモデルデータを符号化装置25に供給する。この処理の詳細として、上述した第1乃至第7のオブジェクト選択処理のいずれかが実行される。
ステップS305において、符号化装置25は、送信することを決定した1以上のオブジェクトのオブジェクトIDと3Dモデルデータを、例えば、AVC方式、HEVC方式等の所定の符号化方式で符号化する。符号化して得られた3Dモデルの符号化ストリームは、送受信装置26へ供給される。
ステップS306において、送受信装置26は、符号化装置25から供給された3Dモデルの符号化ストリームを、ネットワーク27を介して再生装置28へ送信する。
以上の配信処理によれば、複数の撮像装置21で撮像されて生成された、多数のオブジェクトの3Dモデルのうち、一部の3Dモデルを選択して、再生装置28で再生されるように、3Dモデルデータを伝送することができる。
(再生処理)
次に、図48のフローチャートを参照して、画像処理システム10の再生側による再生処理について説明する。
初めに、ステップS321において、再生装置28の仮想視点検出部44は、仮想カメラの視聴範囲に存在する1以上のオブジェクトを特定するオブジェクト特定情報を生成し、送受信部41に供給する。
オブジェクト特定情報は、例えば、仮想カメラの視聴範囲情報である仮想カメラ視聴範囲情報や、視聴者が表示対象として指定したオブジェクトのオブジェクトIDの情報などである。オブジェクト特定情報として、オブジェクトIDの情報を取得する場合には、予め各オブジェクトのオブジェクトIDとグローバル位置情報が、送受信装置26から再生装置28に送信される。
ステップS322において、送受信部41は、仮想視点検出部44から供給されたオブジェクト特定情報を、送受信装置26にネットワーク27を介して送信する。
ステップS323において、送受信部41は、送受信装置26から供給される、1以上のオブジェクトの3Dモデルデータを符号化した符号化ストリームを受信(取得)し、復号部42に供給する。
ステップS324において、復号部42は、送受信部41から供給された3Dモデルの符号化ストリームを、符号化装置25における符号化方式に対応する方式で復号する。復号部42は、復号して得られる1以上のオブジェクトの3Dモデルデータを描画部43に供給する。
ステップS325において、描画部43は、復号部42から供給された1以上のオブジェクトの3Dモデルデータに基づいて、仮想カメラの視点からのオブジェクトの画像(オブジェクト画像)を表示画像として生成し、表示装置29に供給する。
ステップS326において、表示装置29は、描画部43から供給された表示画像を2次元表示して、再生処理を終了する。
以上の再生処理によれば、複数の撮像装置21で撮像されて生成された、多数のオブジェクトの3Dモデルのうち、一部の3Dモデルのみを選択して、表示装置29に表示させることができる。
画像処理システム10によれば、複数の撮像装置21で撮像されて生成された多数のオブジェクトのうち、オブジェクト特定情報に基づいて所定の条件を満たしたオブジェクトのみの3Dモデルデータが、再生側へ伝送される。
このように、撮影空間に含まれる全てのオブジェクトのうち、必要なオブジェクトのみの3Dモデルデータを伝送することにより、視聴者が視聴するオブジェクト画像の画質を担保しつつ、再生側の処理負荷を削減するとともに、伝送帯域を削減することができる。不要なオブジェクトの3Dモデルデータを伝送しないことで、視聴者が視聴するオブジェクト画像の画質を向上させることができる。
オブジェクト特定情報として、例えば、仮想カメラの視聴範囲情報である仮想カメラ視聴範囲情報を採用した場合には、視聴者の視聴範囲内のオブジェクトの3Dモデルデータのみを伝送することにより伝送帯域を削減し、表示画像を生成することができる。
オブジェクト特定情報として、例えば、視聴者が表示対象として指定したオブジェクトのオブジェクトIDの情報を採用した場合には、視聴者が表示するオブジェクトを指定することができ、伝送帯域を削減した表示画像を生成することができる。
<11.コンピュータ構成例>
上述した一連の処理は、ハードウエアにより実行することもできるし、ソフトウエアにより実行することもできる。一連の処理をソフトウエアにより実行する場合には、そのソフトウエアを構成するプログラムが、コンピュータにインストールされる。ここで、コンピュータには、専用のハードウエアに組み込まれているコンピュータや、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータなどが含まれる。
図49は、上述した一連の処理をプログラムにより実行するコンピュータのハードウエアの構成例を示すブロック図である。
コンピュータ900において、CPU(Central Processing Unit)901,ROM(Read Only Memory)902,RAM(Random Access Memory)903は、バス904により相互に接続されている。
バス904には、さらに、入出力インタフェース905が接続されている。入出力インタフェース905には、入力部906、出力部907、記憶部908、通信部909、及びドライブ910が接続されている。
入力部906は、キーボード、マウス、マイクロフォンなどよりなる。出力部907は、ディスプレイ、スピーカなどよりなる。記憶部908は、ハードディスクや不揮発性のメモリなどよりなる。通信部909は、ネットワークインタフェースなどよりなる。ドライブ910は、磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリなどのリムーバブルメディア911を駆動する。
以上のように構成されるコンピュータ900では、CPU901が、例えば、記憶部908に記憶されているプログラムを、入出力インタフェース905及びバス904を介して、RAM903にロードして実行することにより、上述した一連の処理が行われる。
コンピュータ900(CPU901)が実行するプログラムは、例えば、パッケージメディア等としてのリムーバブルメディア911に記録して提供することができる。また、プログラムは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の伝送媒体を介して提供することができる。
コンピュータ900では、プログラムは、リムーバブルメディア911をドライブ910に装着することにより、入出力インタフェース905を介して、記憶部908にインストールすることができる。また、プログラムは、有線または無線の伝送媒体を介して、通信部909で受信し、記憶部908にインストールすることができる。その他、プログラムは、ROM902や記憶部908に、あらかじめインストールしておくことができる。
なお、コンピュータ900が実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われるプログラムであっても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで処理が行われるプログラムであっても良い。
<12.応用例>
本開示に係る技術は、様々な製品へ応用することができる。例えば、本開示に係る技術は、自動車、電気自動車、ハイブリッド電気自動車、自動二輪車、自転車、パーソナルモビリティ、飛行機、ドローン、船舶、ロボット、建設機械、農業機械(トラクター)などのいずれかの種類の移動体に搭載される装置として実現されてもよい。
図50は、本開示に係る技術が適用され得る移動体制御システムの一例である車両制御システム7000の概略的な構成例を示すブロック図である。車両制御システム7000は、通信ネットワーク7010を介して接続された複数の電子制御ユニットを備える。図50に示した例では、車両制御システム7000は、駆動系制御ユニット7100、ボディ系制御ユニット7200、バッテリ制御ユニット7300、車外情報検出ユニット7400、車内情報検出ユニット7500、及び統合制御ユニット7600を備える。これらの複数の制御ユニットを接続する通信ネットワーク7010は、例えば、CAN(Controller Area Network)、LIN(Local Interconnect Network)、LAN(Local Area Network)又はFlexRay(登録商標)等の任意の規格に準拠した車載通信ネットワークであってよい。
各制御ユニットは、各種プログラムにしたがって演算処理を行うマイクロコンピュータと、マイクロコンピュータにより実行されるプログラム又は各種演算に用いられるパラメータ等を記憶する記憶部と、各種制御対象の装置を駆動する駆動回路とを備える。各制御ユニットは、通信ネットワーク7010を介して他の制御ユニットとの間で通信を行うためのネットワークI/Fを備えるとともに、車内外の装置又はセンサ等との間で、有線通信又は無線通信により通信を行うための通信I/Fを備える。図50では、統合制御ユニット7600の機能構成として、マイクロコンピュータ7610、汎用通信I/F7620、専用通信I/F7630、測位部7640、ビーコン受信部7650、車内機器I/F7660、音声画像出力部7670、車載ネットワークI/F7680及び記憶部7690が図示されている。他の制御ユニットも同様に、マイクロコンピュータ、通信I/F及び記憶部等を備える。
駆動系制御ユニット7100は、各種プログラムにしたがって車両の駆動系に関連する装置の動作を制御する。例えば、駆動系制御ユニット7100は、内燃機関又は駆動用モータ等の車両の駆動力を発生させるための駆動力発生装置、駆動力を車輪に伝達するための駆動力伝達機構、車両の舵角を調節するステアリング機構、及び、車両の制動力を発生させる制動装置等の制御装置として機能する。駆動系制御ユニット7100は、ABS(Antilock Brake System)又はESC(Electronic Stability Control)等の制御装置としての機能を有してもよい。
駆動系制御ユニット7100には、車両状態検出部7110が接続される。車両状態検出部7110には、例えば、車体の軸回転運動の角速度を検出するジャイロセンサ、車両の加速度を検出する加速度センサ、あるいは、アクセルペダルの操作量、ブレーキペダルの操作量、ステアリングホイールの操舵角、エンジン回転数又は車輪の回転速度等を検出するためのセンサのうちの少なくとも一つが含まれる。駆動系制御ユニット7100は、車両状態検出部7110から入力される信号を用いて演算処理を行い、内燃機関、駆動用モータ、電動パワーステアリング装置又はブレーキ装置等を制御する。
ボディ系制御ユニット7200は、各種プログラムにしたがって車体に装備された各種装置の動作を制御する。例えば、ボディ系制御ユニット7200は、キーレスエントリシステム、スマートキーシステム、パワーウィンドウ装置、あるいは、ヘッドランプ、バックランプ、ブレーキランプ、ウィンカー又はフォグランプ等の各種ランプの制御装置として機能する。この場合、ボディ系制御ユニット7200には、鍵を代替する携帯機から発信される電波又は各種スイッチの信号が入力され得る。ボディ系制御ユニット7200は、これらの電波又は信号の入力を受け付け、車両のドアロック装置、パワーウィンドウ装置、ランプ等を制御する。
バッテリ制御ユニット7300は、各種プログラムにしたがって駆動用モータの電力供給源である二次電池7310を制御する。例えば、バッテリ制御ユニット7300には、二次電池7310を備えたバッテリ装置から、バッテリ温度、バッテリ出力電圧又はバッテリの残存容量等の情報が入力される。バッテリ制御ユニット7300は、これらの信号を用いて演算処理を行い、二次電池7310の温度調節制御又はバッテリ装置に備えられた冷却装置等の制御を行う。
車外情報検出ユニット7400は、車両制御システム7000を搭載した車両の外部の情報を検出する。例えば、車外情報検出ユニット7400には、撮像部7410及び車外情報検出部7420のうちの少なくとも一方が接続される。撮像部7410には、ToF(Time Of Flight)カメラ、ステレオカメラ、単眼カメラ、赤外線カメラ及びその他のカメラのうちの少なくとも一つが含まれる。車外情報検出部7420には、例えば、現在の天候又は気象を検出するための環境センサ、あるいは、車両制御システム7000を搭載した車両の周囲の他の車両、障害物又は歩行者等を検出するための周囲情報検出センサのうちの少なくとも一つが含まれる。
環境センサは、例えば、雨天を検出する雨滴センサ、霧を検出する霧センサ、日照度合いを検出する日照センサ、及び降雪を検出する雪センサのうちの少なくとも一つであってよい。周囲情報検出センサは、超音波センサ、レーダ装置及びLIDAR(Light Detection and Ranging、Laser Imaging Detection and Ranging)装置のうちの少なくとも一つであってよい。これらの撮像部7410及び車外情報検出部7420は、それぞれ独立したセンサないし装置として備えられてもよいし、複数のセンサないし装置が統合された装置として備えられてもよい。
ここで、図51は、撮像部7410及び車外情報検出部7420の設置位置の例を示す。撮像部7910,7912,7914,7916,7918は、例えば、車両7900のフロントノーズ、サイドミラー、リアバンパ、バックドア及び車室内のフロントガラスの上部のうちの少なくとも一つの位置に設けられる。フロントノーズに備えられる撮像部7910及び車室内のフロントガラスの上部に備えられる撮像部7918は、主として車両7900の前方の画像を取得する。サイドミラーに備えられる撮像部7912,7914は、主として車両7900の側方の画像を取得する。リアバンパ又はバックドアに備えられる撮像部7916は、主として車両7900の後方の画像を取得する。車室内のフロントガラスの上部に備えられる撮像部7918は、主として先行車両又は、歩行者、障害物、信号機、交通標識又は車線等の検出に用いられる。
なお、図51には、それぞれの撮像部7910,7912,7914,7916の撮影範囲の一例が示されている。撮像範囲aは、フロントノーズに設けられた撮像部7910の撮像範囲を示し、撮像範囲b,cは、それぞれサイドミラーに設けられた撮像部7912,7914の撮像範囲を示し、撮像範囲dは、リアバンパ又はバックドアに設けられた撮像部7916の撮像範囲を示す。例えば、撮像部7910,7912,7914,7916で撮像された画像データが重ね合わせられることにより、車両7900を上方から見た俯瞰画像が得られる。
車両7900のフロント、リア、サイド、コーナ及び車室内のフロントガラスの上部に設けられる車外情報検出部7920,7922,7924,7926,7928,7930は、例えば超音波センサ又はレーダ装置であってよい。車両7900のフロントノーズ、リアバンパ、バックドア及び車室内のフロントガラスの上部に設けられる車外情報検出部7920,7926,7930は、例えばLIDAR装置であってよい。これらの車外情報検出部7920〜7930は、主として先行車両、歩行者又は障害物等の検出に用いられる。
図50に戻って説明を続ける。車外情報検出ユニット7400は、撮像部7410に車外の画像を撮像させるとともに、撮像された画像データを受信する。また、車外情報検出ユニット7400は、接続されている車外情報検出部7420から検出情報を受信する。車外情報検出部7420が超音波センサ、レーダ装置又はLIDAR装置である場合には、車外情報検出ユニット7400は、超音波又は電磁波等を発信させるとともに、受信された反射波の情報を受信する。車外情報検出ユニット7400は、受信した情報に基づいて、人、車、障害物、標識又は路面上の文字等の物体検出処理又は距離検出処理を行ってもよい。車外情報検出ユニット7400は、受信した情報に基づいて、降雨、霧又は路面状況等を認識する環境認識処理を行ってもよい。車外情報検出ユニット7400は、受信した情報に基づいて、車外の物体までの距離を算出してもよい。
また、車外情報検出ユニット7400は、受信した画像データに基づいて、人、車、障害物、標識又は路面上の文字等を認識する画像認識処理又は距離検出処理を行ってもよい。車外情報検出ユニット7400は、受信した画像データに対して歪補正又は位置合わせ等の処理を行うとともに、異なる撮像部7410により撮像された画像データを合成して、俯瞰画像又はパノラマ画像を生成してもよい。車外情報検出ユニット7400は、異なる撮像部7410により撮像された画像データを用いて、視点変換処理を行ってもよい。
車内情報検出ユニット7500は、車内の情報を検出する。車内情報検出ユニット7500には、例えば、運転者の状態を検出する運転者状態検出部7510が接続される。運転者状態検出部7510は、運転者を撮像するカメラ、運転者の生体情報を検出する生体センサ又は車室内の音声を集音するマイク等を含んでもよい。生体センサは、例えば、座面又はステアリングホイール等に設けられ、座席に座った搭乗者又はステアリングホイールを握る運転者の生体情報を検出する。車内情報検出ユニット7500は、運転者状態検出部7510から入力される検出情報に基づいて、運転者の疲労度合い又は集中度合いを算出してもよいし、運転者が居眠りをしていないかを判別してもよい。車内情報検出ユニット7500は、集音された音声信号に対してノイズキャンセリング処理等の処理を行ってもよい。
統合制御ユニット7600は、各種プログラムにしたがって車両制御システム7000内の動作全般を制御する。統合制御ユニット7600には、入力部7800が接続されている。入力部7800は、例えば、タッチパネル、ボタン、マイクロフォン、スイッチ又はレバー等、搭乗者によって入力操作され得る装置によって実現される。統合制御ユニット7600には、マイクロフォンにより入力される音声を音声認識することにより得たデータが入力されてもよい。入力部7800は、例えば、赤外線又はその他の電波を利用したリモートコントロール装置であってもよいし、車両制御システム7000の操作に対応した携帯電話又はPDA(Personal Digital Assistant)等の外部接続機器であってもよい。入力部7800は、例えばカメラであってもよく、その場合搭乗者はジェスチャにより情報を入力することができる。あるいは、搭乗者が装着したウェアラブル装置の動きを検出することで得られたデータが入力されてもよい。さらに、入力部7800は、例えば、上記の入力部7800を用いて搭乗者等により入力された情報に基づいて入力信号を生成し、統合制御ユニット7600に出力する入力制御回路などを含んでもよい。搭乗者等は、この入力部7800を操作することにより、車両制御システム7000に対して各種のデータを入力したり処理動作を指示したりする。
記憶部7690は、マイクロコンピュータにより実行される各種プログラムを記憶するROM(Read Only Memory)、及び各種パラメータ、演算結果又はセンサ値等を記憶するRAM(Random Access Memory)を含んでいてもよい。また、記憶部7690は、HDD(Hard Disc Drive)等の磁気記憶デバイス、半導体記憶デバイス、光記憶デバイス又は光磁気記憶デバイス等によって実現してもよい。
汎用通信I/F7620は、外部環境7750に存在する様々な機器との間の通信を仲介する汎用的な通信I/Fである。汎用通信I/F7620は、GSM(登録商標)(Global System of Mobile communications)、WiMAX(登録商標)、LTE(登録商標)(Long Term Evolution)若しくはLTE−A(LTE−Advanced)などのセルラー通信プロトコル、又は無線LAN(Wi−Fi(登録商標)ともいう)、Bluetooth(登録商標)などのその他の無線通信プロトコルを実装してよい。汎用通信I/F7620は、例えば、基地局又はアクセスポイントを介して、外部ネットワーク(例えば、インターネット、クラウドネットワーク又は事業者固有のネットワーク)上に存在する機器(例えば、アプリケーションサーバ又は制御サーバ)へ接続してもよい。また、汎用通信I/F7620は、例えばP2P(Peer To Peer)技術を用いて、車両の近傍に存在する端末(例えば、運転者、歩行者若しくは店舗の端末、又はMTC(Machine Type Communication)端末)と接続してもよい。
専用通信I/F7630は、車両における使用を目的として策定された通信プロトコルをサポートする通信I/Fである。専用通信I/F7630は、例えば、下位レイヤのIEEE802.11pと上位レイヤのIEEE1609との組合せであるWAVE(Wireless Access in Vehicle Environment)、DSRC(Dedicated Short Range Communications)、又はセルラー通信プロトコルといった標準プロトコルを実装してよい。専用通信I/F7630は、典型的には、車車間(Vehicle to Vehicle)通信、路車間(Vehicle to Infrastructure)通信、車両と家との間(Vehicle to Home)の通信及び歩車間(Vehicle to Pedestrian)通信のうちの1つ以上を含む概念であるV2X通信を遂行する。
測位部7640は、例えば、GNSS(Global Navigation Satellite System)衛星からのGNSS信号(例えば、GPS(Global Positioning System)衛星からのGPS信号)を受信して測位を実行し、車両の緯度、経度及び高度を含む位置情報を生成する。なお、測位部7640は、無線アクセスポイントとの信号の交換により現在位置を特定してもよく、又は測位機能を有する携帯電話、PHS若しくはスマートフォンといった端末から位置情報を取得してもよい。
ビーコン受信部7650は、例えば、道路上に設置された無線局等から発信される電波あるいは電磁波を受信し、現在位置、渋滞、通行止め又は所要時間等の情報を取得する。なお、ビーコン受信部7650の機能は、上述した専用通信I/F7630に含まれてもよい。
車内機器I/F7660は、マイクロコンピュータ7610と車内に存在する様々な車内機器7760との間の接続を仲介する通信インタフェースである。車内機器I/F7660は、無線LAN、Bluetooth(登録商標)、NFC(Near Field Communication)又はWUSB(Wireless USB)といった無線通信プロトコルを用いて無線接続を確立してもよい。また、車内機器I/F7660は、図示しない接続端子(及び、必要であればケーブル)を介して、USB(Universal Serial Bus)、HDMI(登録商標)(High-Definition Multimedia Interface)、又はMHL(Mobile High-definition Link)等の有線接続を確立してもよい。車内機器7760は、例えば、搭乗者が有するモバイル機器若しくはウェアラブル機器、又は車両に搬入され若しくは取り付けられる情報機器のうちの少なくとも1つを含んでいてもよい。また、車内機器7760は、任意の目的地までの経路探索を行うナビゲーション装置を含んでいてもよい。車内機器I/F7660は、これらの車内機器7760との間で、制御信号又はデータ信号を交換する。
車載ネットワークI/F7680は、マイクロコンピュータ7610と通信ネットワーク7010との間の通信を仲介するインタフェースである。車載ネットワークI/F7680は、通信ネットワーク7010によりサポートされる所定のプロトコルに則して、信号等を送受信する。
統合制御ユニット7600のマイクロコンピュータ7610は、汎用通信I/F7620、専用通信I/F7630、測位部7640、ビーコン受信部7650、車内機器I/F7660及び車載ネットワークI/F7680のうちの少なくとも一つを介して取得される情報に基づき、各種プログラムにしたがって、車両制御システム7000を制御する。例えば、マイクロコンピュータ7610は、取得される車内外の情報に基づいて、駆動力発生装置、ステアリング機構又は制動装置の制御目標値を演算し、駆動系制御ユニット7100に対して制御指令を出力してもよい。例えば、マイクロコンピュータ7610は、車両の衝突回避あるいは衝撃緩和、車間距離に基づく追従走行、車速維持走行、車両の衝突警告、又は車両のレーン逸脱警告等を含むADAS(Advanced Driver Assistance System)の機能実現を目的とした協調制御を行ってもよい。また、マイクロコンピュータ7610は、取得される車両の周囲の情報に基づいて駆動力発生装置、ステアリング機構又は制動装置等を制御することにより、運転者の操作に拠らずに自律的に走行する自動運転等を目的とした協調制御を行ってもよい。
マイクロコンピュータ7610は、汎用通信I/F7620、専用通信I/F7630、測位部7640、ビーコン受信部7650、車内機器I/F7660及び車載ネットワークI/F7680のうちの少なくとも一つを介して取得される情報に基づき、車両と周辺の構造物や人物等の物体との間の3次元距離情報を生成し、車両の現在位置の周辺情報を含むローカル地図情報を作成してもよい。また、マイクロコンピュータ7610は、取得される情報に基づき、車両の衝突、歩行者等の近接又は通行止めの道路への進入等の危険を予測し、警告用信号を生成してもよい。警告用信号は、例えば、警告音を発生させたり、警告ランプを点灯させたりするための信号であってよい。
音声画像出力部7670は、車両の搭乗者又は車外に対して、視覚的又は聴覚的に情報を通知することが可能な出力装置へ音声及び画像のうちの少なくとも一方の出力信号を送信する。図50の例では、出力装置として、オーディオスピーカ7710、表示部7720及びインストルメントパネル7730が例示されている。表示部7720は、例えば、オンボードディスプレイ及びヘッドアップディスプレイの少なくとも一つを含んでいてもよい。表示部7720は、AR(Augmented Reality)表示機能を有していてもよい。出力装置は、これらの装置以外の、ヘッドホン、搭乗者が装着する眼鏡型ディスプレイ等のウェアラブルデバイス、プロジェクタ又はランプ等の他の装置であってもよい。出力装置が表示装置の場合、表示装置は、マイクロコンピュータ7610が行った各種処理により得られた結果又は他の制御ユニットから受信された情報を、テキスト、イメージ、表、グラフ等、様々な形式で視覚的に表示する。また、出力装置が音声出力装置の場合、音声出力装置は、再生された音声データ又は音響データ等からなるオーディオ信号をアナログ信号に変換して聴覚的に出力する。
なお、図50に示した例において、通信ネットワーク7010を介して接続された少なくとも二つの制御ユニットが一つの制御ユニットとして一体化されてもよい。あるいは、個々の制御ユニットが、複数の制御ユニットにより構成されてもよい。さらに、車両制御システム7000が、図示されていない別の制御ユニットを備えてもよい。また、上記の説明において、いずれかの制御ユニットが担う機能の一部又は全部を、他の制御ユニットに持たせてもよい。つまり、通信ネットワーク7010を介して情報の送受信がされるようになっていれば、所定の演算処理が、いずれかの制御ユニットで行われるようになってもよい。同様に、いずれかの制御ユニットに接続されているセンサ又は装置が、他の制御ユニットに接続されるとともに、複数の制御ユニットが、通信ネットワーク7010を介して相互に検出情報を送受信してもよい。
なお、上述した画像処理システム10の各機能を実現するためのコンピュータプログラムを、いずれかの制御ユニット等に実装することができる。また、このようなコンピュータプログラムが格納された、コンピュータで読み取り可能な記録媒体を提供することもできる。記録媒体は、例えば、磁気ディスク、光ディスク、光磁気ディスク、フラッシュメモリ等である。また、上記のコンピュータプログラムは、記録媒体を用いずに、例えばネットワークを介して配信されてもよい。
以上説明した車両制御システム7000に、上述した画像処理システム10を適用する場合、例えば、画像処理システム10の撮像装置21は、撮像部7410の少なくとも一部に相当する。また、再構成装置22、記憶装置23、選択装置24、符号化装置25、送受信装置26、および、再生装置28は一体化され、マイクロコンピュータ7610と記憶部7690に相当する。表示装置29は、表示部7720に相当する。なお、画像処理システム10を統合制御ユニット7600に適用する場合、ネットワーク27は設けられず、視聴者である搭乗者の入力部7800の操作により視聴者の視線方向および視聴位置が入力される。以上のようにして、画像処理システム10を、図50に示した応用例の統合制御ユニット7600に適用することにより、視聴者が所望する領域のみのオブジェクトを表示する表示画像を表示部7720等に高画質(高解像度)に表示することができる。
また、画像処理システム10の少なくとも一部の構成要素は、図50に示した統合制御ユニット7600のためのモジュール(例えば、一つのダイで構成される集積回路モジュール)において実現されてもよい。あるいは、画像処理システム10が、図50に示した車両制御システム7000の複数の制御ユニットによって実現されてもよい。
また、本明細書において、システムとは、複数の構成要素(装置、モジュール(部品)等)の集合を意味し、すべての構成要素が同一筐体中にあるか否かは問わない。したがって、別個の筐体に収納され、ネットワークを介して接続されている複数の装置、及び、1つの筐体の中に複数のモジュールが収納されている1つの装置は、いずれも、システムである。
なお、本明細書に記載された効果はあくまで例示であって限定されるものではなく、他の効果があってもよい。
また、本開示の実施の形態は、上述した実施の形態に限定されるものではなく、本開示の要旨を逸脱しない範囲において種々の変更が可能である。
例えば、本開示は、1つの機能をネットワークを介して複数の装置で分担、共同して処理するクラウドコンピューティングの構成をとることができる。
また、上述のフローチャートで説明した各ステップは、1つの装置で実行する他、複数の装置で分担して実行することができる。
さらに、1つのステップに複数の処理が含まれる場合には、その1つのステップに含まれる複数の処理は、1つの装置で実行する他、複数の装置で分担して実行することができる。
なお、本技術は以下のような構成も取ることができる。
(1)
複数の3Dモデルのオブジェクトの中から、所定の条件を満たすオブジェクトを選択する3Dモデル選択部と、
選択された前記オブジェクトの3Dモデルデータを送信する送信部と
を備える画像処理装置。
(2)
前記3Dモデルデータは、複数の方向から撮像した複数枚のテクスチャ画像で前記オブジェクトの色情報を表し、前記オブジェクトのジオメトリ情報を点の集合またはポリゴンメッシュで表した形式のデータである
前記(1)に記載の画像処理装置。
(3)
前記3Dモデルデータは、複数の方向から撮像した複数枚のテクスチャ画像で前記オブジェクトの色情報を表し、前記オブジェクトのジオメトリ情報を前記テクスチャ画像の画素値に対応させて距離情報を格納した複数枚のデプス画像で表した形式のデータである
前記(1)に記載の画像処理装置。
(4)
前記3Dモデル選択部は、受信したオブジェクトを特定するオブジェクト特定情報に基づいて、前記所定の条件を満たすオブジェクトを選択する
前記(1)乃至(3)のいずれかに記載の画像処理装置。
(5)
前記オブジェクト特定情報は、仮想カメラの視点に基づく視聴範囲を示す仮想カメラ視聴範囲情報である
前記(4)に記載の画像処理装置。
(6)
前記3Dモデル選択部は、前記オブジェクトのグローバル位置情報の代表値が、前記仮想カメラの視聴範囲に含まれるか否かにより、所定の条件を満たすか否かを判定する
前記(5)に記載の画像処理装置。
(7)
前記オブジェクト特定情報は、視聴者が表示対象として指定したオブジェクトのオブジェクトIDの情報である
前記(4)に記載の画像処理装置。
(8)
生成された前記3Dモデルデータは、複数の方向から撮像した複数枚のテクスチャ画像を含み、
選択された前記オブジェクトの前記複数枚のテクスチャ画像のうち、前記オブジェクトが含まれるテクスチャ画像のみを選択する画像選択部をさらに備え、
前記送信部は、前記3Dモデルデータのテクスチャ画像として、前記画像選択部で選択された前記テクスチャ画像を送信する
前記(1)乃至(7)のいずれかに記載の画像処理装置。
(9)
前記画像選択部で選択された前記テクスチャ画像の前記オブジェクト部分を切り出し、切出し画像を生成する切出し部をさらに備え、
前記送信部は、前記3Dモデルデータのテクスチャ画像として、前記切出し部で生成された前記切出し画像を送信する
前記(8)に記載の画像処理装置。
(10)
前記3Dモデルデータは、前記オブジェクトのジオメトリ情報を点の集合で表し、その各点に対応して前記オブジェクトの色情報を保有する形式のデータである
前記(4)乃至(9)のいずれかに記載の画像処理装置。
(11)
前記3Dモデルデータは、前記オブジェクトのジオメトリ情報をポリゴンメッシュで表し、その各ポリゴンメッシュに対応して前記オブジェクトの色情報を保有する形式のデータである
前記(4)乃至(9)のいずれかに記載の画像処理装置。
(12)
画像処理装置が、
複数の3Dモデルのオブジェクトの中から、所定の条件を満たすオブジェクトを選択し、
選択した前記オブジェクトの3Dモデルデータを送信する
ステップを含む画像処理方法。
(13)
複数の3Dモデルのオブジェクトの中から所定の条件を満たすオブジェクトとして選択された前記オブジェクトの3Dモデルデータを受信する受信部と、
受信された前記オブジェクトの3Dモデルデータに基づいて、仮想カメラの視点からの前記オブジェクトの表示画像を生成する描画部と
を備える画像処理装置。
(14)
前記3Dモデルデータは、複数の方向から撮像した複数枚のテクスチャ画像で前記オブジェクトの色情報を表し、前記オブジェクトのジオメトリ情報を点の集合またはポリゴンメッシュで表した形式のデータである
前記(13)に記載の画像処理装置。
(15)
前記3Dモデルデータは、複数の方向から撮像した複数枚のテクスチャ画像で前記オブジェクトの色情報を表し、前記オブジェクトのジオメトリ情報を前記複数の方向から測定した距離情報を前記テクスチャ画像の画素値に対応させて格納した複数枚のデプス画像で表した形式のデータである
前記(13)に記載の画像処理装置。
(16)
前記仮想カメラの視点に基づく視聴範囲を示す仮想カメラ視聴範囲情報を生成する仮想視点検出部をさらに備え、
前記受信部は、さらに、前記仮想カメラ視聴範囲情報を送信する
前記(13)乃至(15)のいずれかに記載の画像処理装置。
(17)
視聴者が表示対象とするオブジェクトの指定を受け付ける入力部をさらに備え、
前記受信部は、さらに、前記入力部で指定されたオブジェクトのオブジェクトIDの情報を送信する
前記(13)乃至(15)のいずれかに記載の画像処理装置。
(18)
前記3Dモデルデータは、前記オブジェクトのジオメトリ情報を点の集合で表し、その各点に対応して前記オブジェクトの色情報を保有する形式のデータである
前記(13)に記載の画像処理装置。
(19)
前記3Dモデルデータは、前記オブジェクトのジオメトリ情報をポリゴンメッシュで表し、その各ポリゴンメッシュに対応して前記オブジェクトの色情報を保有する形式のデータである
前記(13)に記載の画像処理装置。
(20)
画像処理装置が、
複数の3Dモデルのオブジェクトの中から所定の条件を満たすオブジェクトとして選択された前記オブジェクトの3Dモデルデータを受信し、
受信した前記オブジェクトの3Dモデルデータに基づいて、仮想カメラの視点からの前記オブジェクトの表示画像を生成する
ステップを含む画像処理方法。