WO2023228289A1

WO2023228289A1 - 映像修正装置、映像修正方法、及びプログラム

Info

Publication number: WO2023228289A1
Application number: PCT/JP2022/021306
Authority: WO
Inventors: 笑添趙; 隆文奥山
Original assignee: 日本電信電話株式会社
Priority date: 2022-05-24
Filing date: 2022-05-24
Publication date: 2023-11-30

Abstract

本開示は、テクスチャ及びポリゴンメッシュによって構成された三次元映像を配信するにあたって、ユーザの体感品質を極力落とさないで、サーバ及びクライアント側の通信端末の再生負荷を軽減することを目的とする。　そのため、本開示の装置は、三次元モデルの顔や手等の高画質にする必要がある部分以外の部分(服を着ている部分等)に対して、ポリゴンメッシュのジオメトリに対する簡素化度合いを高くし、顔や手等の高画質にする必要がある部分に対して、ポリゴンメッシュのジオメトリに対する簡素化度合いを高くしない（又は全く簡素化しない）。これにより、ユーザの体感品質を極力落とさないで、サーバ及びクライアント側の通信端末の再生負荷を軽減することができる。

Description

映像修正装置、映像修正方法、及びプログラム

　本開示は、テクスチャ及びポリゴンメッシュによって構成された三次元映像を修正する技術に関する。

　高品質なボリュメトリックビデオ又はホログラムに代表される６自由度(6DoF)のコンテンツのネットワークを通した配信の実現には、データ圧縮、ネットワーク又はシステム状況以外に、クライアント側のＡＲ(Augmented Reality)又はＶＲ(Virtual Reality)又は用のデバイスの視界情報、仮想空間でのユーザの位置を動的に構成し、配信制御へ適用していく仕組みが必要である。これらのボリュメトリックビデオである三次元映像はテクスチャとポリゴンメッシュ（単に「メッシュ」ともいう）で構成されたアニメーションデータであり、クライアント側の端末で仮想環境と合わせてレンダリングをすることで、ＡＲ又はＶＲ用等の端末のディスプレイ上に表示されることで、ユーザが視聴できる。一方、ボリュメトリックビデオはデータ量が大きく、ネットワーク配信を行ったときに広い帯域を必要とする。

　ボリュメトリックビデオ配信技術が開示された文献として、非特許文献１、非特許文献２、及び非特許文献３が挙げられる。

　非特許文献１では、サーバが、クライアント側のからＡＲ又はＶＲ用のデバイスによって検出された頭の動きに基づいて、ボリュメトリックビデオのレンダリングを行い、二次元映像にしてクライアントに送る手法が提案されている。

　また、非特許文献２では、サーバがリアルタイムで生成されたボリュメトリックビデオをリアルタイムにクライアント側の端末に配信し、クライアント側の端末がレンダリングして再生する手法が提案されている。

　さらに、非特許文献３では、サーバが、ネットワーク帯域に応じてボリュメトリックビデオのLevel Of Detailを動的に変更させることで、再生に必要なデータ量を削減する手法が提案されている。

Serhan Gul, Dimitri Podborski, Thomas Buchholz, Thomas Schierl, Cornelius Hellge, "Low-latency cloud-based volumetric video streaming using head motion prediction"<https://arxiv.org/abs/2001.06466> Sergio Orts-Escolano, Christoph Rhemann, et al., "Holoportation: Virtual 3D Teleportation in Real-time", UIST 2016, October 16-19, 2016〈http://dx.doi.org/10.1145/2984511.2984517〉 HoloStream/Arctrus<https://arcturus.studio/holostream>

　しかし、ボリュメトリックビデオ配信は、データ量が大きく、配信に必要なネットワーク帯域が大きいため、効率的に配信する手法が求められている。

　非特許文献１の手法では、サーバがユーザごとにレンダリングを行う必要があるため、サーバの負担が大きく、ユーザ数が増えたときに、サーバのリソースの分割により、それぞれのユーザが視聴する視点映像品質の劣化が考えられる。更に、高頻度でクライアントからＶＲヘッドセットの位置情報を低遅延で行う必要があり、所謂ＶＲ酔いが発生し始めるMotion to Photon 遅延を20msに満たすことは、ネットワークとサーバの両方の負担が大きい。

　また、非特許文献２の手法では，通信帯域に4Gbps必要であり、将来的な消費者が使える回線において常に安定した4Gbpsの通信帯域の確保が難しい。更に、ネットワークの回線への負荷が大きいため、同一のネットワークを使用するほかのユーザの使用可能帯域が狭まり、ユーザの体感品質を落としてしまう。

　更に、非特許文献３の手法では、ネットワークの使用可能帯域が狭いときには、視聴中のボリュメトリックビデオの視聴者が見える三次元（３Ｄ）データの面（前面）、更に被写体の顔や手等の高画質にする必要がある部分も含めて、画質とLevel Of Detailを落としてしまうため、大幅なユーザの体感品質の低下をもたらしてしまう。

　本発明は、上記の点に鑑みてなされたものであって、ユーザの体感品質を極力落とさないで、サーバ及びクライアント側の通信端末の再生負荷を軽減することを目的とする。

　上記課題を解決するため、請求項１に係る発明は、テクスチャ及びポリゴンメッシュによって構成された三次元映像を修正する映像修正装置であって、前記三次元映像のデータからフレームである三次元画像のデータを取得する三次元画像取得部と、前記三次元画像のデータにおける三次元モデルの前記ポリゴンメッシュの各頂点に対し、第１の重要度属性値を付与する第１の重要度属性値付与部と、前記三次元モデルに対して各仮想カメラの仮想視点から見える各二次元画像のデータを出力する二次元画像出力部と、前記各二次元画像のデータに対してボーン推定することで、前記各二次元画像のデータの各ボーン情報を得るボーン推定部と、機械学習を用いて前記各ボーン情報に係る各ボーン推定信頼度を比較し、前記各二次元画像のデータのうち前記ボーン推定信頼度が所定順位以上に高い所定の二次元画像のデータを選択する二次元画像選択部と、前記二次元画像選択部によって選択された前記所定の二次元画像のデータの前記ボーン情報に基づいて、前記所定の二次元画像のデータにおける前記三次元モデルの特定部位を示す領域を選択すると共に、前記特定部位を示す領域に隣接する領域であって前記特定部位と同種の色である前記三次元モデルの隣接部位を示す領域を選択する部分領域選択部と、前記特定部位を示す領域及び前記隣接部位を示す領域のポリゴンメッシュの各頂点に対し、前記第１の重要度属性値に替えて第２の重要度属性値を付与する第２の重要度属性値付与部と、前記第１の重要度属性値が付与された各頂点に係るポリゴンメッシュのジオメトリに対する簡素化度合いに比べて、前記第２の重要度属性値が付与された各頂点に係るポリゴンメッシュのジオメトリに対する簡素化度合いを高くすることで、前記三次元画像のデータを簡素化する簡素化部と、を有する映像修正装置である。

　以上説明したように本発明によれば、ユーザの体感品質を極力落とさないで、サーバ及びクライアント側の通信端末の再生負荷を軽減することができるという効果を奏する。

第１の実施形態に係る通信システムの全体構成図である。第１の実施形態に係る映像修正装置の電気的なハードウェア構成図である。本実施形態に係る通信端末の電気的なハードウェア構成図である。第１の実施形態に係る映像修正装置の機能構成図である。第１の実施形態に係る映像修正装置の処理を示すフローチャートである。第１の実施形態に係る映像修正装置の処理を示すフローチャートである。ポリゴンメッシュの頂点を示す図である。複数の仮想カメラを三次元モデルの周りに配置した概念図である。三次元モデルに対して任意の仮想カメラの仮想視点から見える二次元画像を示した図である。二次元画像の三次元モデルのボーン情報を示した図である。二次元画像の三次元モデルのポリゴンメッシュを示した図である。二次元画像の三次元モデルの顔のボーン情報を示した図である。二次元画像の三次元モデルの顔及び顔の隣接部分（首）のポリゴンメッシュを示す図である。簡素化した後の二次元画像の三次元モデルのポリゴンメッシュを示した図である。第２の実施形態に係る映像修正装置の機能構成図である。第２の実施形態に係る映像修正装置の処理を示すフローチャートである。第２の実施形態に係る映像修正装置の処理を示すフローチャートである。

　以下、図面に基づいて本発明の実施形態を説明する。

　●第１の実施形態
　〔実施形態のシステム構成〕
　まず、図１を用いて、第１の実施形態の通信システムの全体構成について説明する。図１は、第１の実施形態に係る通信システムの全体構成図である。

　図１に示されているように、本実施形態の通信システム１は、映像修正装置３、及び通信端末５によって構築されている。通信端末５は、ユーザによって管理及び使用される。

　また、映像修正装置３と通信端末５は、インターネット等の通信ネットワーク１００を介して通信することができる。通信ネットワーク１００の接続形態は、無線又は有線のいずれでも良い。

　映像修正装置３は、単数又は複数のコンピュータによって構成されている。映像修正装置３が複数のコンピュータによって構成されている場合には、「映像修正装置」と示しても良いし、「映像修正システム」と示しても良い。

　映像修正装置３は、テクスチャ及びポリゴンメッシュによって構成された三次元映像(ボリュメトリックビデオ又はホログラム等)を修正する。

　通信端末５は、コンピュータであり、図１では、一例としてノート型パソコンが示されている。図１では、ユーザ（ここでは、映像修正者）が、通信端末５を操作する。なお、通信端末５を用いずに、映像修正装置３単独で処理をしてもよい。

　〔ハードウェア構成〕
　＜映像修正装置のハードウェア構成＞
　次に、図２を用いて、映像修正装置３の電気的なハードウェア構成を説明する。図２は、映像修正装置の電気的なハードウェア構成図である。

　映像修正装置３は、コンピュータとして、図２に示されているように、ＣＰＵ(Central Processing Unit)３０１、ＲＯＭ(Read Only Memory)３０２、ＲＡＭ(Random Access Memory)３０３、ＳＳＤ(Solid State Drive)３０４、外部機器接続Ｉ／Ｆ(Interface)３０５、ネットワークＩ／Ｆ３０６、メディアＩ／Ｆ３０９、及びバスライン３１０を備えている。

　これらのうち、ＣＰＵ３０１は、映像修正装置３全体の動作を制御する。ＲＯＭ３０２は、ＩＰＬ(Initial Program Loader)等のＣＰＵ３０１の駆動に用いられるプログラムを記憶する。ＲＡＭ３０３は、ＣＰＵ３０１のワークエリアとして使用される。

　ＳＳＤ３０４は、ＣＰＵ３０１の制御に従って各種データの読み出し又は書き込みを行う。なお、ＳＤＤ３０４の代わりに、ＨＤＤ(Hard Disk Drive)を用いても良い。

　外部機器接続Ｉ／Ｆ３０５は、各種の外部機器を接続するためのインターフェースである。この場合の外部機器は、ディスプレイ、スピーカ、キーボード、マウス、ＵＳＢ(Universal Serial Bus)メモリ、及びプリンタ等である。

　ネットワークＩ／Ｆ３０６は、通信ネットワーク１００を介してデータ通信をするためのインターフェースである。

　メディアＩ／Ｆ３０９は、フラッシュメモリ等の記録メディア３０９ｍに対するデータの読み出し又は書き込み（記憶）を制御する。記録メディア３０９ｍには、ＤＶＤ(Digital Versatile Disc)やＢｌｕ-ｒａｙＤｉｓｃ（登録商標）等も含まれる。

　バスライン３１０は、図２に示されているＣＰＵ３０１等の各構成要素を電気的に接続するためのアドレスバスやデータバス等である。

　＜通信端末のハードウェア構成＞
　次に、図３を用いて、通信端末５の電気的なハードウェア構成を説明する。図３は、通信端末の電気的なハードウェア構成図である。

　通信端末５は、コンピュータとして、図３に示されているように、ＣＰＵ５０１、ＲＯＭ５０２、ＲＡＭ５０３、ＳＳＤ５０４、外部機器接続Ｉ／Ｆ(Interface)５０５、ネットワークＩ／Ｆ５０６、ディスプレイ５０７、ポインティングデバイス５０８、メディアＩ／Ｆ５０９、及びバスライン５１０を備えている。

　これらのうち、ＣＰＵ５０１は、通信端末５全体の動作を制御する。ＲＯＭ５０２は、ＩＰＬ等のＣＰＵ５０１の駆動に用いられるプログラムを記憶する。ＲＡＭ５０３は、ＣＰＵ５０１のワークエリアとして使用される。

　ＳＳＤ５０４は、ＣＰＵ５０１の制御に従って各種データの読み出し又は書き込みを行う。なお、ＳＳＤ５０４の代わりに、ＨＤＤ(Hard Disk Drive)を用いてもよい。

　外部機器接続Ｉ／Ｆ５０５は、各種の外部機器を接続するためのインターフェースである。この場合の外部機器は、ディスプレイ、スピーカ、キーボード、マウス、ＵＳＢメモリ、及びプリンタ等である。

　ネットワークＩ／Ｆ５０６は、通信ネットワーク１００を介してデータ通信をするためのインターフェースである。

　ディスプレイ５０７は、各種画像を表示する液晶や有機ＥＬ(Electro Luminescence)などの表示手段の一種である。

　ポインティングデバイス５０８は、各種指示の選択や実行、処理対象の選択、カーソルの移動などを行う入力手段の一種である。なお、ユーザＹがキーボードを使う場合は、ポインティングデバイス５０８の機能をＯＦＦにしてもよい。

　メディアＩ／Ｆ５０９は、フラッシュメモリ等の記録メディア５０９ｍに対するデータの読み出し又は書き込み（記憶）を制御する。記録メディア５０９ｍには、ＤＶＤやＢｌｕ-ｒａｙＤｉｓｃ（登録商標）等も含まれる。

　バスライン５１０は、図４に示されているＣＰＵ５０１等の各構成要素を電気的に接続するためのアドレスバスやデータバス等である。

　〔第１の実施形態の映像修正装置の機能構成〕
　次に、図４を用いて、映像修正装置の機能構成について説明する。図４は、第１の実施形態における映像修正装置の機能構成図である。なお、図４の映像修正装置３ａは、図１の映像修正装置の一例である。

　図４において、映像修正装置３ａは、入力部３０、三次元画像取得部３１、第１の重要度属性値付与部３２、二次元画像出力部３３、ボーン推定部３４、二次元画像選択部３５、部分領域選択部３６、第２の重要度属性値付与部３８、簡素化部４０、及び出力部４１を有する。これら各部は、プログラムに基づき図２のＣＰＵ３０１による命令によって実現される機能である。

　これらのうち、入力部３０は、ユーザ（映像修正者）の通信端末５から、及びネットワークＩ／Ｆ３０６を介して、修正対象である三次元映像のデータの入力を受け付ける。

　三次元画像取得部３１は、三次元映像のデータからフレームである三次元画像のデータを取得する。

　第１の重要度属性値付与部３２は、三次元画像のデータにおける三次元モデルｍのポリゴンメッシュの各頂点に対し、第１の重要度属性値(例えば、0.5)を付与する。図７は、ポリゴンメッシュの頂点を示す図である。図７に示すように、四角形のポリゴンメッシュの場合、ポリゴンメッシュpm1には４つの頂点vt1,vt2,vt3,vt4が存在する。また、ポリゴンメッシュpm1に隣接するポリゴンメッシュpm2には４つの頂点vt2,vt3,vt5,vt6が存在する。

　二次元画像出力部３３は、三次元モデルに対して各仮想カメラの仮想視点から見える各二次元画像のデータを出力する。図８は、複数の仮想カメラを三次元モデルの周りに配置した概念図である。図８に示すように、三次元モデルｍの周りには、複数の仮想カメラvc1～vc8が配置されている。なお、仮想カメラの数は１つ以上であればいくつでも良い。また、各仮想カメラは等間隔に配置しても良いし、等間隔に配置しなくてもよい。

　また、図９Ａは、三次元モデルに対して任意の仮想カメラの仮想視点から見える二次元画像を示した図である。二次元画像出力部３３は、図９Ａに示すような各二次元画像のデータを出力する。

　ボーン推定部３４は、各二次元画像のデータに対してボーン推定することで、各二次元画像のデータのボーン情報を得る。図９Ｂは、二次元画像の三次元モデルのボーン情報を示した図である。ボーン推定部３４は、図９Ｂに示すようなボーン情報を得る。図１０Ａは、二次元画像の三次元モデルの顔のボーン情報を示した図である。図１０Ａは、図９Ｂの顔及び顔の隣接部位（周辺部位）を拡大した図である。

　二次元画像選択部３５は、機械学習を用いて各ボーン情報に係るボーン推定信頼度を比較し、各二次元画像のデータのうちボーン推定信頼度が所定順位（例えば、３番目）以上に高い所定の二次元画像のデータを選択する。例えば、図８に示すように、８つの仮想カメラvc1～vc8が配置されている場合、二次元画像選択部３５は、ボーン推定信頼度が高い上位３つのうちのいずれの二次元画像のデータを選択しても良いし、一番ボーン推定信頼度が高い二次元画像のデータを選択してもよい。

　部分領域選択部３６は、二次元画像選択部３５によって選択された所定の二次元画像のデータのボーン情報に基づいて、所定の二次元画像のデータにおける三次元モデルｍの特定部位（顔等）を示す領域を選択する。また、部分領域選択部３６は、特定部位(顔等)を示す領域に隣接する領域であって特定部位と同種の色である三次元モデルｍの隣接部位（首等）を示す領域を選択する。図９Ｃは、二次元画像の三次元モデルのポリゴンメッシュを示した図である。図１０Ｂは、二次元画像の三次元モデルの顔及び顔の隣接部分（首）のポリゴンメッシュを示す図である。図１０Ｂは、図９Ｃの顔及び顔の隣接部位（周辺部位）を拡大した図である。図１０Ａに示すように、顔のポリゴンメッシュpm11の隣接する隣接部位として、首のポリゴンメッシュpm12が示されている。

　第２の重要度属性値付与部３８は、特定部位を示す領域及び隣接部位を示す領域のポリゴンメッシュの各頂点に対し、第１の重要度属性値に替えて第２の重要度属性値（例えば、1.0）を付与する。

　簡素化部４０は、第１の重要度属性値が付与された各頂点に係るポリゴンメッシュのジオメトリに対する簡素化度合いに比べて、第２の重要度属性値が付与された各頂点に係るポリゴンメッシュのジオメトリに対する簡素化度合いを高くすることで、三次元画像のデータを簡素化する。図１１は、簡素化した後の二次元画像の三次元モデルのポリゴンメッシュを示した図である。図１１に示すように、衣服から露出している部位（顔、首、手、腕
、すね、膝、太ももの一部）のジオメトリに対する簡素化度合いは低く、衣服部分のジオメトリに対する簡素化度合いは高くなっている。

　なお、第２の重要度属性値が1.0の場合、簡素化部４０は全く簡素化しないが、例えば、0.9等にして若干簡素化してもよい。また、第１の重要度属性値が高く、第２の重要度属性値が低くても良い。この場合、簡素化部４０は、詳細化（密度化）することで、図１１に示すように同じ結果になる。

　出力部４１は、簡素化後の三次元画像のデータを出力する。出力方法としては、通信端末５等に対して、三次元画像のデータを送信したり、この三次元画像としてのフレームによって構成された三次元映像を生成して出力したりすることが挙げられる。

　〔第１の実施形態の処理又は動作〕
　続いて、図６乃至図１１を用いて、第１の実施形態の処理又は動作について説明する。図５及び図６は、第１の実施形態に係る映像修正装置の処理を示すフローチャートである。

　Ｓ１１：図５に示されているように、まず、入力部３０は、ユーザ（映像修正者）の通信端末５から、及びネットワークＩ／Ｆ３０６を介して、修正対象である三次元映像のデータの入力を受け付ける。

　Ｓ１２：三次元画像取得部３１は、三次元映像のデータからフレームである三次元画像のデータを取得する。

　Ｓ１３：第１の重要度属性値付与部３２は、三次元画像のデータにおける三次元モデルｍのポリゴンメッシュの各頂点に対し、第１の重要度属性値(例えば、0.5)を付与する。

　Ｓ１４：二次元画像出力部３３は、三次元モデルに対して各仮想カメラの仮想視点から見える各二次元画像のデータを出力する。

　Ｓ１５：ボーン推定部３４は、各二次元画像のデータに対してボーン推定することで、各二次元画像のデータのボーン情報を得る。

　Ｓ１６：二次元画像選択部３５は、機械学習を用いて各ボーン情報に係るボーン推定信頼度を比較し、各二次元画像のデータのうちボーン推定信頼度が所定順位以上に高い所定の二次元画像のデータを選択する。

　Ｓ１７：部分領域選択部３６は、二次元画像選択部３５によって選択された所定の二次元画像のデータのボーン情報に基づいて、所定の二次元画像のデータにおける三次元モデルｍの特定部位（顔等）を示す領域を選択する。

　Ｓ１８：更に、部分領域選択部３６は、特定部位(顔等)を示す領域に隣接する領域であって特定部位と同種の色である三次元モデルｍの隣接部位（首等）を示す領域を選択する。

　Ｓ１９：第２の重要度属性値付与部３８は、特定部位を示す領域及び隣接部位を示す領域のポリゴンメッシュの各頂点に対し、第１の重要度属性値に替えて第２の重要度属性値を付与する。

　Ｓ２０：簡素化部４０は、第１の重要度属性値が付与された各頂点に係るポリゴンメッシュのジオメトリに対する簡素化度合いに比べて、第２の重要度属性値が付与された各頂点に係るポリゴンメッシュのジオメトリに対する簡素化度合いを高くすることで、三次元画像のデータを簡素化する。

　Ｓ２１：出力部４１は、簡素化後の三次元画像のデータを出力する。

　以上により、第１の実施形態の処理又は動作の説明が終了する。

　〔第１の実施形態の効果〕
　以上説明したように本実施形態によれば、簡素化部４０は、三次元モデルｍの顔や手等の高画質にする必要がある部分以外の部分(服を着ている部分等)に対して、ポリゴンメッシュのジオメトリに対する簡素化度合いを高くし、顔や手等の高画質にする必要がある部分に対して、ポリゴンメッシュのジオメトリに対する簡素化度合いを高くしない（又は全く簡素化しない）。これにより、ユーザの体感品質を極力落とさないで、サーバ及びクライアント側の通信端末の再生負荷を軽減することができる。

　●第２の実施形態
　続いて、図１２乃至図１４を用いて、第２の実施形態について説明する。なお、第２の実施形態の全体構成、電気的なハードウェア構成に関しては、第１の実施形態と同様であるため、説明を省略する。また、第２の実施形態の機能構成のうち、第１の実施形態の機能構成と同様の機能構成については同じ符号を付して説明を省略する。

　〔第２の実施形態の映像修正装置の機能構成〕
　図１２を用いて、映像修正装置の機能構成について説明する。図１２は、第２の実施形態における映像修正装置の機能構成図である。なお、図４の映像修正装置３ｂは、図１の映像修正装置の一例である。

　図１２において、映像修正装置３ｂは、入力部３０、三次元画像取得部３１、第１の重要度属性値付与部３２、二次元画像出力部３３、画像認識部３７、第２の重要度属性値付与部３８、第３の重要度属性値付与部３９、簡素化部４０、及び出力部４１を有する。これら各部は、プログラムに基づき図２のＣＰＵ３０１による命令によって実現される機能である。

　これらのうち、入力部３０、三次元画像取得部３１、第１の重要度属性値付与部３２、二次元画像出力部３３、第２の重要度属性値付与部３８、簡素化部４０、及び出力部４１は、第１の実施形態と同様であるため、第２の実施形態に特有の機能構成について説明する。

　画像認識部３７は、二次元画像出力部３３によって出力された各二次元画像のデータにおける三次元モデルの特定部位（顔等）を示す領域を画像認識する。この画像認識の手法は、一般的な技術による。

　第３の重要度属性値付与部３９は、特定部位（顔等）の領域に隣接する三次元モデルの隣接領域のポリゴンメッシュの各頂点に対し、特定部位を示す領域から離れるにつれて第１の重要度属性値になるまで段階的に異なる所定の重要度属性値を付与する。この場合、本実施形態の簡素化部４０は、第１の重要度属性値が付与された各頂点に係るポリゴンメッシュのジオメトリに対する簡素化度合いに対し、所定の重要度属性値が付与された各頂点に係るポリゴンメッシュのジオメトリに対する簡素化度合いを段階的に高くして、第２の重要度属性値が付与された各頂点に係るポリゴンメッシュのジオメトリに対する簡素化度合いを最も高くすることで、三次元画像のデータを簡素化する。

　例えば、第３の重要度属性値付与部３９は、第２の重要度属性値(例えば、1.0)の領域を起点とし、第２の重要度属性値ではない接続頂点の重要度属性値（所定の重要度属性値）を線形減少の再帰処理を適用していく。この再帰処理は、また次の接続頂点を起点とし、繰り返され初期値（第１の重要度続映値）と同一値(例えば、0.5)にまで減少した時点で処理が終了する。

　〔第２の実施形態の処理又は動作〕
　続いて、図１３及び図１４を用いて、第２の実施形態の処理又は動作について説明する。図１３及び図１４は、第２の実施形態に係る映像修正装置の処理を示すフローチャートである。なお、ステップＳ３１～Ｓ３４は、第１の実施形態のステップＳ１１～Ｓ１４と同様の処理内容であるため、説明を省略する。

　Ｓ３５：二次元画像出力部３３によって出力された各二次元画像のデータにおける三次元モデルの特定部位（顔等）を示す領域を画像認識する。

　Ｓ３６：第２の重要度属性値付与部３８は、特定部位を示す領域のポリゴンメッシュの各頂点に対し、第１の重要度属性値に替えて第２の重要度属性値を付与する。

　Ｓ３７：第３の重要度属性値付与部３９は、特定部位の領域に隣接する三次元モデルの隣接領域のポリゴンメッシュの各頂点に対し、特定部位を示す領域から離れるにつれて第１の重要度属性値になるまで段階的に異なる所定の重要度属性値を付与する。

　Ｓ３８：簡素化部４０は、第１の重要度属性値が付与された各頂点に係るポリゴンメッシュのジオメトリに対する簡素化度合いに対し、所定の重要度属性値が付与された各頂点に係るポリゴンメッシュのジオメトリに対する簡素化度合いを段階的に高くして、第２の重要度属性値が付与された各頂点に係るポリゴンメッシュのジオメトリに対する簡素化度合いを最も高くすることで、三次元画像のデータを簡素化する。

　Ｓ３９：出力部４１は、簡素化後の三次元画像のデータを出力する。

　〔第２の実施形態の効果〕
　以上説明したように本実施形態によれば、第１の実施形態と同様の効果を奏する。また、第２の実施形態の簡素化部４０は、段階的にポリゴンメッシュのジオメトリに対する簡素化度合いを高くするため、三次元映像の閲覧者には違和感が少なく、よりユーザ（閲覧者）の体感品質を向上させることができる。

　〔補足〕
　本発明は上述の実施形態に限定されるものではなく、以下に示すような構成又は処理（動作）であってもよい。
（１）映像修正装置３はコンピュータとプログラムによっても実現できるが、このプログラムを（非一時的な）記録媒体に記録することも、通信ネットワーク１００を介して提供することも可能である。
（２）上記実施形態では、通信端末５の一例としてノート型パソコンが示されているが、これに限るものではなく、例えば、デスクトップパソコン、タブレット端末、スマートフォン、スマートウォッチ、カーナビゲーション装置、冷蔵庫、電子レンジ等であってもよい。
（３）各ＣＰＵ３０１，５０１は、単一だけでなく、複数であってもよい。

１　通信システム
３　映像修正装置
５　通信端末
３０　入力部
３１　三次元画像取得部
３２　第１の重要度属性値付与部
３３　二次元画像出力部
３４　ボーン推定部
３５　二次元画像選択部
３６　部分領域選択部
３７　画像認識部
３８　第２の重要度属性値付与部
３９　第３の重要度属性値付与部
４０　簡素化部
４１　出力部

Claims

　テクスチャ及びポリゴンメッシュによって構成された三次元映像を修正する映像修正装置であって、
　前記三次元映像のデータからフレームである三次元画像のデータを取得する三次元画像取得部と、
　前記三次元画像のデータにおける三次元モデルの前記ポリゴンメッシュの各頂点に対し、第１の重要度属性値を付与する第１の重要度属性値付与部と、
　前記三次元モデルに対して各仮想カメラの仮想視点から見える各二次元画像のデータを出力する二次元画像出力部と、
　前記各二次元画像のデータに対してボーン推定することで、前記各二次元画像のデータの各ボーン情報を得るボーン推定部と、
　機械学習を用いて前記各ボーン情報に係る各ボーン推定信頼度を比較し、前記各二次元画像のデータのうち前記ボーン推定信頼度が所定順位以上に高い所定の二次元画像のデータを選択する二次元画像選択部と、
　前記二次元画像選択部によって選択された前記所定の二次元画像のデータの前記ボーン情報に基づいて、前記所定の二次元画像のデータにおける前記三次元モデルの特定部位を示す領域を選択すると共に、前記特定部位を示す領域に隣接する領域であって前記特定部位と同種の色である前記三次元モデルの隣接部位を示す領域を選択する部分領域選択部と、
　前記特定部位を示す領域及び前記隣接部位を示す領域のポリゴンメッシュの各頂点に対し、前記第１の重要度属性値に替えて第２の重要度属性値を付与する第２の重要度属性値付与部と、
　前記第１の重要度属性値が付与された各頂点に係るポリゴンメッシュのジオメトリに対する簡素化度合いに比べて、前記第２の重要度属性値が付与された各頂点に係るポリゴンメッシュのジオメトリに対する簡素化度合いを高くすることで、前記三次元画像のデータを簡素化する簡素化部と、
　を有する映像修正装置。
　前記簡素化部は、前記第１の重要度属性値が付与された各頂点に係るポリゴンメッシュのジオメトリに対して簡素化しない、請求項１に記載の映像修正装置。
　テクスチャ及びポリゴンメッシュによって構成された三次元映像を修正する映像修正装置が実行する映像修正方法であって、
　前記映像修正装置は、
　前記三次元映像のデータからフレームである三次元画像のデータを取得する三次元画像取得処理と、
　前記三次元画像のデータにおける三次元モデルの前記ポリゴンメッシュの各頂点に対し、第１の重要度属性値を付与する第１の重要度属性付与処理と、
　前記三次元モデルに対して各仮想カメラの仮想視点から見える各二次元画像のデータを出力する二次元画像出力処理と、
　前記各二次元画像のデータに対してボーン推定することで、前記各二次元画像のデータの各ボーン情報を得るボーン推定処理と、
　機械学習を用いて前記各ボーン情報に係る各ボーン推定信頼度を比較し、前記各二次元画像のデータのうち前記ボーン推定信頼度が所定順位以上に高い所定の二次元画像のデータを選択する二次元画像選択処理と、
　前記二次元画像選択処理によって選択された前記所定の二次元画像のデータの前記ボーン情報に基づいて、前記所定の二次元画像のデータにおける前記三次元モデルの特定部位を示す領域を選択すると共に、前記特定部位を示す領域に隣接する領域であって前記特定部位と同種の色である前記三次元モデルの隣接部位を示す領域を選択する部分領域選択処理と、
　前記特定部位を示す領域及び前記隣接部位を示す領域のポリゴンメッシュの各頂点に対し、前記第１の重要度属性値に替えて第２の重要度属性値を付与する第２の重要度属性付与処理と、
　前記第１の重要度属性値が付与された各頂点に係るポリゴンメッシュのジオメトリに対する簡素化度合いに比べて、前記第２の重要度属性値が付与された各頂点に係るポリゴンメッシュのジオメトリに対する簡素化度合いを高くすることで、前記三次元画像のデータを簡素化する簡素化処理と、
　を実行する映像修正方法。
　コンピュータに、請求項３に記載の方法を実行させるプログラム。
　テクスチャ及びポリゴンメッシュによって構成された三次元映像を修正する映像修正装置であって、
　前記三次元映像のデータからフレームである三次元画像のデータを取得する三次元画像取得部と、
　前記三次元画像のデータにおける三次元モデルの前記ポリゴンメッシュの各頂点に対し、第１の重要度属性値を付与する第１の重要度属性値付与部と、
　前記三次元モデルに対して各仮想カメラの仮想視点から見える各二次元画像のデータを出力する二次元画像出力部と、
　前記各二次元画像のデータにおける前記三次元モデルの特定部位を示す領域を画像認識する画像認識部と、
　前記特定部位を示す領域のポリゴンメッシュの各頂点に対し、前記第１の重要度属性値に替えて第２の重要度属性値を付与する第２の重要度属性値付与部と、
　前記特定部位の領域に隣接する前記三次元モデルの隣接領域のポリゴンメッシュの各頂点に対し、前記特定部位を示す領域から離れるにつれて前記第１の重要度属性値になるまで段階的に異なる所定の重要度属性値を付与する第３の重要度属性値付与部と、
　前記第１の重要度属性値が付与された各頂点に係るポリゴンメッシュのジオメトリに対する簡素化度合いに対し、前記所定の重要度属性値が付与された各頂点に係るポリゴンメッシュのジオメトリに対する簡素化度合いを前記段階的に高くして、前記第２の重要度属性値が付与された各頂点に係るポリゴンメッシュのジオメトリに対する簡素化度合いを最も高くすることで、前記三次元画像のデータを簡素化する簡素化部と、
　を有する映像修正装置。
　前記簡素化部は、前記第１の重要度属性値が付与された各頂点に係るポリゴンメッシュのジオメトリに対して簡素化しない、請求項５に記載の映像修正装置。
　テクスチャ及びポリゴンメッシュによって構成された三次元映像を修正する映像修正装置が実行する映像修正方法であって、
　前記映像修正装置は、
　前記三次元映像のデータからフレームである三次元画像のデータを取得する三次元画像取得処理と、
　前記三次元画像のデータにおける三次元モデルの前記ポリゴンメッシュの各頂点に対し、第１の重要度属性値を付与する第１の重要度属性付与処理と、
　前記三次元モデルに対して各仮想カメラの仮想視点から見える各二次元画像のデータを出力する二次元画像出力処理と、
　前記各二次元画像のデータにおける前記三次元モデルの特定部位を示す領域を画像認識する画像認識処理と、
　前記特定部位を示す領域のポリゴンメッシュの各頂点に対し、前記第１の重要度属性値に替えて第２の重要度属性値を付与する第２の重要度属性付与処理と、
　前記特定部位の領域に隣接する前記三次元モデルの隣接領域のポリゴンメッシュの各頂点に対し、前記特定部位を示す領域から離れるにつれて前記第１の重要度属性値になるまで段階的に異なる所定の重要度属性値を付与する第３の重要度属性付与処理と、
　前記第１の重要度属性値が付与された各頂点に係るポリゴンメッシュのジオメトリに対する簡素化度合いに対し、前記所定の重要度属性値が付与された各頂点に係るポリゴンメッシュのジオメトリに対する簡素化度合いを前記段階的に高くして、前記第２の重要度属性値が付与された各頂点に係るポリゴンメッシュのジオメトリに対する簡素化度合いを最も高くすることで、前記三次元画像のデータを簡素化する簡素化処理と、
　を実行する映像修正方法。
　コンピュータに、請求項７に記載の方法を実行させるプログラム。