JP2023547616A

JP2023547616A - 品質アセスメントのための方法、装置、及びプログラム

Info

Publication number: JP2023547616A
Application number: JP2023524598A
Authority: JP
Inventors: ジャン，シァン; ホアン，チャオ; リウ，シャン
Original assignee: テンセント・アメリカ・エルエルシー
Priority date: 2021-07-13
Filing date: 2022-07-12
Publication date: 2023-11-13
Also published as: KR20230043921A; US20230027519A1; WO2023288231A1; EP4371075A1; WO2023288231A9

Abstract

本開示の態様は、３次元（３Ｄ）グラフィクスモデリングのための品質アセスメントの方法及び装置を提供する。いくつかの例で、品質アセスメントのための装置は処理回路を含む。処理回路は、３次元（３Ｄ）空間から２次元（２Ｄ）空間への投影のための仮想カメラのポジション変化に応答して、更新された仮想カメラポジションを決定する。処理回路は、基準２Ｄ画像を生成するよう、更新された仮想カメラポジションに従って基準３Ｄ表現を投影し、かつ、アセスメント２Ｄ画像を生成するよう、更新された仮想カメラポジションに従ってアセスメント中の３Ｄ表現を投影する。処理回路は、基準２Ｄ画像及びアセスメント２Ｄ画像に基づき、更新された仮想カメラポジションに関連したアセスメントスコアを計算する。

Description

［関連出願への相互参照］
本願は、２０１２年７月１３日付けで出願された米国特許仮出願第６３／２２１３６５号、「Image Based Sampling Metric for Mesh Quality Assessment」に対する優先権の利益を主張して２０２２年７月１１日付けで出願された米国特許出願第１７／８６２１５４号、「IMAGE BASED SAMPLING METRIC FOR QUALITY ASSESSMENT」に対する優先権の利益を主張するものである。先願の開示は、それらの全文を参照により本願に援用される。

［技術分野］
本開示は、３次元（３Ｄ）グラフィクスモデリングのための品質アセスメントに概して関係がある実施形態について記載する。

ここで提供される背景の記載は、本開示の背景を一般的に提示するためのものである。現在名前を挙げられている発明者の研究は、この背景セクションで記載されている範囲において、出願時に先行技術としてさもなければ認められていない可能性がある記載の側面と同様に、本開示に対する先行技術として明示的にも暗黙的にも認められるものではない。

世界、例えば、世界の中の対象物、世界の中の環境、などを捕捉して３次元（３Ｄ）空間で表現するために、様々な技術が開発されている。世界の３Ｄ表現は、インタラクション及びコミュニケーションのより没入的な形を可能にすることができる。

いくつかの実施形態で、処理回路は、更新された仮想カメラポジションを決定するよう、ポジション変化の回転マトリクスを前の仮想カメラポジションに適用する。いくつかの例で、処理回路は、ユーザインターフェースにより入力パラメータとして回転マトリクスを受け取る。

いくつかの実施形態で、処理回路は、複数の仮想カメラのポジション変化に基づき第１の複数の更新された仮想カメラポジションを決定する。処理回路は、第１の複数の更新された仮想カメラポジションに関連した第１の複数の基準２Ｄ画像を生成するよう、第１の複数の更新された仮想カメラポジションに従って基準３Ｄ表現を投影し、かつ、第１の複数の更新された仮想カメラポジションに関連した第１の複数のアセスメント２Ｄ画像を生成するよう、第１の複数の更新された仮想カメラポジションに従ってアセスメント中の３Ｄ表現を投影する。処理回路は、第１の複数の基準２Ｄ画像及び第１の複数のアセスメント２Ｄ画像に基づき、第１の複数の更新された仮想カメラポジションに夫々関連している第１の複数のアセスメントスコアを計算する。処理回路は、第１の複数のアセスメントスコアの加重平均されたアセスメントスコアを計算する。

一例では、第１の複数の更新された仮想カメラポジションは、３Ｄ空間内の球上に均等にサンプリングされる。他の例では、第１の複数の更新された仮想カメラポジションは、３Ｄ空間内の球上にランダムにサンプリングされる。

いくつかの例で、アセスメント中の３Ｄ表現は、基準３Ｄ表現のフレームに対応している複数のフレームを含む。第１の複数の更新された仮想カメラポジションは、アセスメント中の３Ｄ表現の第１のフレーム及び基準３Ｄ表現の第１の対応するフレームを投影するために使用される。処理回路は、複数の仮想カメラの第２の複数の更新された仮想カメラポジションを決定する。第２の複数の更新された仮想カメラポジションは、アセスメント中の３Ｄ表現の第２のフレーム及び基準３Ｄ表現の第２の対応するフレームを投影するために使用される。

一例では、処理回路は、カメラ移動経路に基づき複数の仮想カメラの第２の複数の更新された仮想カメラポジションを決定する。

他の例では、処理回路は、第１のカメラ移動経路に基づき第２の複数の更新された仮想カメラポジションの中で第１のポジションを決定し、かつ、第２のカメラ移動経路に基づき第２の複数の更新された仮想カメラポジションの中で第２のポジションを決定する。第１のポジションは、複数の仮想カメラの中の第１の仮想カメラに関連しており、第２のポジションは、複数の仮想カメラの中の第２の仮想カメラに関連している。

いくつかの例で、第１の複数のアセスメントスコアの加重平均されたアセスメントスコアを計算するために、処理回路は、アセスメント中の３Ｄ表現の投影に基づき、第１の複数のアセスメントスコアを重み付けする重みを決定し、重みに基づき、加重平均されたアセスメントスコアを計算する。一例では、処理回路は、第１の複数のアセスメント２Ｄ画像において投影される有効なピクセルの各々の数に基づき、第１の複数のアセスメントスコアを重み付けする重みを決定する。他の例では、処理回路は、第１の複数の更新された仮想カメラポジションに対応する投影面までのアセスメント中の３Ｄ表現の各々の距離に基づき、第１の複数のアセスメントスコアを重み付けする重みを決定する。

いくつかの例で、アセスメント中の３Ｄ表現は、基準３Ｄ表現のフレームに対応している複数のフレームを含む。第１の複数の更新された仮想カメラポジションは、アセスメント中の３Ｄ表現の第１のフレーム及び基準３Ｄ表現の第１の対応するフレームを投影するために使用され、加重平均されたアセスメントスコアは、第１のフレームに対する第１のフレームレベルアセスメントスコアである。処理回路は、第１の複数の更新された仮想カメラポジションに基づき、第１のフレームレベルアセスメントスコアを重み付けする第１のフレーム重みを決定する。処理回路は、複数のフレームに対する加重平均スコアである最終的なアセスメントスコアを計算する。第１のフレームレベルアセスメントスコアは、最終的なアセスメントスコアにおいて第１のフレーム重みによって重み付けされている。

一例では、処理回路は、第１の複数の更新された仮想カメラポジションの中のポジションの数に基づき、第１のフレーム重みを決定する。他の例では、処理回路は、第１の複数の更新された仮想カメラポジションの中のポジションに基づき、第１のフレーム重みを決定する。

一例では、アセスメントスコアは、ピーク信号対雑音比（peak signal-to-noise ratio，ＰＳＮＲ）に基づき計算される。一例では、アセスメントスコアは、構造類似性指数メトリック（structural similarity index metric，ＳＳＩＭ）に基づき計算される。一例では、アセスメントスコアは、視覚情報フィデリティ（visual information fidelity，ＶＩＦ）に基づき計算される。一例では、アセスメントスコアは、ビデオマルチメソッドアセスメント融合（video multi-method assessment fusion，ＶＭＡＦ）に基づき計算される。一例では、アセスメントスコアは、盲目／非参照型画像空間品質評価器（blind/referenceless image spatial quality evaluator，ＢＲＩＳＱＵＥ）に基づき計算される。一例では、アセスメントスコアは、歪み識別に基づいた画像の真偽及び完全性の評価（distortion identification-based image verity and integrity evaluation，ＤＩＩＶＩＮＥ）に基づき計算される。

本開示の態様は、コンピュータによって実行される場合に、コンピュータに、３Ｄグラフィクスモデリングのための品質アセスメントの方法を実行させる命令を記憶している非一時的なコンピュータ可読媒体も提供する。

開示されている対象の更なる特徴、性質、及び様々な利点は、以下の詳細な説明及び添付の図面からより明らかになる。

いくつかの例の中で、３次元（３Ｄ）空間から２次元（２Ｄ）空間へ投影する一例を説明する図を示す。１６個の異なるビュー方向からレンダリングされる２Ｄ画像を示す。いくつかの例の中で、画像ベースサンプリングメトリックの計算を説明する図を示す。本開示のいくつかの実施形態に係る他のプロセスを説明するフローチャートを示す。本開示のいくつかの実施形態に係る他のプロセスを説明するフローチャートを示す。本開示のいくつかの実施形態に係る他のプロセスを説明するフローチャートを示す。実施形態に係るコンピュータシステムの模式図である。

本開示の態様は、３Ｄグラフィクスモデリングのための品質アセスメントの技術を提供する。いくつかの例で、当該技術は、３次元（３Ｄ）表現の品質アセスメントのための画像ベースサンプリングメトリックを改善することができる。

いくつかの例では、点群（ポイントクラウド）及びメッシュが世界の３Ｄ表現として使用可能である。点群は、３Ｄ空間内の点の組であり、各点は、関連する属性、例えば、色、材料特製、テクスチャ情報、強度属性、反射属性、モーション関連属性、モダリティ属性、及び様々な他の属性を持っている。そのような点群は、大量のデータを含む可能性があり、記憶及び伝送するのに費用及び時間がかかる場合がある。いくつかの例では、より高速な伝送又は記憶の削減のために、点群を表すために必要なデータの両方を減らすべく、圧縮技術が開発され得る。例えば、点群の不可逆圧縮は、リアルタイム通信及び６自由度（６ＤｏＦ）仮想現実において有用であることができる。いくつかの例では、圧縮技術は、元の３Ｄ表現に対して歪みを持った点群を生成するために、元の３Ｄ表現（例えば、元の点群、元のメッシュ、など）に適用され得る。

メッシュ（いくつかの例ではポリゴンメッシュとも呼ばれる。）は、多面体オブジェクトの形状を定義する、頂点、辺、及び面の集合である。面には、通常、三角形（三角メッシュ）、四角形（クワッド）、又は他の簡単な凸多角形がある。いくつかの例では、面には、凹面多角形又は穴を持った多角形が含まれ得る。いくつかの例では、メッシング技術は、数値計算の速度又は精度を向上させることを目標として開発され得る。いくつかの例では、メッシング技術は、元の３Ｄ表現に対して歪みを持った新しいメッシュを生成するために、元の３Ｄ表現（例えば、元の点群、元のメッシュ、など）に適用され得る。

本開示の対象に従って、３Ｄ表現の品質アセスメントは、２種類のアプローチ、すなわち、点に基づいたアプローチ及び画像に基づいたアプローチを用いて、実行され得る。

いくつかの例で、点に基づいたアプローチを使用するために、３Ｄ表現は点群表現に変換される。例えば、第１のメッシュを第２のメッシュと比較するために、第１のメッシュの表面サンプリングは、第１のメッシュに関連した第１の点群表現を生成することができ、第２のメッシュの表面サンプリングは、第２のメッシュに関連した第２の点群表現を生成することができる。第１のメッシュに関連した第１の点群表現及び第２のメッシュに関連した第２の点群表現に基づき、ピーク信号対雑音比（ＰＳＮＲ）、点群品質メトリック（point cloud quality metric，ＰＣＱＭ）、などのいくつかのメトリックが計算され得る。

いくつかの例で、第１の３Ｄ表現は点群（第１の点群と呼ばれる。）であり、第２の３Ｄ表現はメッシュである。メッシュの表面サンプリングは、第２の点群を生成することができる。第１の点群及び第２の点群に基づき、ピーク信号対雑音比（ＰＳＮＲ）、点群品質メトリック（ＰＣＱＭ）、などのいくつかのメトリックが、第１の３Ｄ表現と第２の３Ｄ表現とを比較するために、計算され得る。

いくつかの例で、画像に基づいたアプローチを使用するために、３Ｄ表現は、３Ｄ空間から２Ｄ空間へ投影される。例えば、３Ｄ表現は、２次元（２Ｄ）画像を生成するよう投影面上に投影され得、３Ｄ表現の品質アセスメントは２Ｄ画像に基づく。３Ｄ表現の夫々は、点群、メッシュ、などの如何なる適切な３Ｄ表現でもあることができる。いくつかの例で、３Ｄ空間から２Ｄ空間への投影によって生成される２Ｄ画像は、色値の２Ｄマトリクス（カラー画像とも呼ばれる。）、バイナリマスク値の２Ｄマトリクス（マスク画像とも呼ばれる。）、及びデプス値の２Ｄマトリクス（デプス画像とも呼ばれる。）を含むことができる点に留意されたい。

図１は、いくつかの例の中で、２Ｄ空間で１つ以上の２Ｄ画像（１５０）をレンダリングするために３Ｄ空間で３Ｄ表現（１１０）を投影する一例を説明する図を示す。

３Ｄ表現（１１０）は、点群又はメッシュであることができる。図１の例において、３Ｄ表現（１１０）の境界球（bounding sphere）（１２０）が取得され得る。一例で、境界球（１２０）は、３Ｄ表現（１１０）の境界ボックス（例えば、長方形ボックス）を決定し、境界ボックスの中心及び対角線に基づき境界球（１２０）を決定することによって、取得され得る。

いくつかの例で、２Ｄ画像（１５０）は、３Ｄ空間内の境界球（１２０）の中心の方を指すビュー方向（例えば、ビュー方向ベクトルｖｄ_ｉにより定義される。）に基づき生成され得る。

いくつかの例で、２Ｄ画像（１５０）は、直交投影によりレンダリングされ得る。ビュー方向ベクトルｖｄ_ｉの投影面（１３０）は、境界球（１２０）に接する面であり、ビュー方向ベクトルｖｄ_ｉに垂直である。

いくつかの例で、ビュー方向は、３Ｄ空間から２Ｄ空間への投影のための仮想カメラを用いて説明することができる。例えば、仮想カメラのポジション（仮想カメラポジションとも呼ばれる。）は、境界球（１２０）上で決定され、ビュー方向は、仮想カメラポジションから境界球（１２０）の中心への方向である。他の例では、ビュー方向が決定される場合に、ビュー方向に平行であって境界球（１２０）の中心を通る直線は、仮想カメラポジションで境界球と交わることができる。図１の例において、仮想カメラが、例えば、位置Ａに置かれる場合に、その仮想カメラのビュー方向は、ビュー方向ベクトルｖｄ_ｉによって特定され得る。２Ｄ画像（１５０）は、例えば、位置Ａに置かれてビュー方向において３Ｄ表現（１１０）を撮影する仮想カメラによってされたものとして説明することができる。

本開示の態様に従って、ビュー方向ベクトルｖｄ_ｉに従うレンダリング結果は、カラー画像、マスク画像、及びデプス画像を含む２Ｄ画像であることができる。いくつかの例で、カラーバッファは、ビュー方向ベクトルｖｄ_ｉに関連したカラー画像を記憶し、マスクバッファは、ビュー方向ベクトルｖｄ_ｉに関連したマスク画像を記憶し、デプスバッファは、ビュー方向ベクトルｖｄ_ｉに関連したデプス画像を記憶する。

いくつかの例で、３Ｄ表現（１１０）はメッシュであり、カラーバッファは、ピクセル（ｍ，ｎ）ごとに、最も近い投影された三角形の色、例えば、ＲＧＢ値又は他の色フォーマット値を記憶することができる。一例では、３Ｄ表現（１１０）は、テクスチャ化されたメッシュであり、ＲＧＢ色は、三角形ＵＶ座標を用いてテクスチャマップの双線形補間により取得され得る。他の例では、３Ｄ表現（１１０）は、頂点ごとに色分けされたメッシュ（非テクスチャマップ）であり、ピクセルの色は、重心座標を用いて頂点の色を混合することに基づき決定され得る。マスクバッファは、ピクセル（ｍ，ｎ）ごとに、バイナリ値を記憶することができる。一例では、ピクセル（ｍ，ｎ）のバイナリ値は、そのピクセルの投影が存在する場合には１にセットされ、そうでない場合には、そのピクセルのバイナリ値は０にセットされる。デプスバッファは、ピクセル（ｍ，ｎ）ごとに、３Ｄ空間における投影面（１３０）から３Ｄ表面（投影面上のピクセル（ｍ，ｎ）からメッシュまでのビュー方向ベクトルｖｄ_ｉの最も近い交差点）までの距離ｄ_ｍ，ｎ（図１では（１４０）によって示されている。）を記憶することができる。

図１の例では、カラー画像が、ビュー方向ベクトルｖｄ_ｉによって特定されるビュー方向に従う投影からレンダリングされる２Ｄ画像（１５０）を例示するために示されている。

図２は、１６個の異なるビュー方向からレンダリングされる２Ｄ画像（例えば、カラー画像）（２５１）～（２６６）を示す。

本開示のいくつかの態様に従って、画像に基づいたアプローチは、アセスメント中の３Ｄ表現（第２の３Ｄ表現とも呼ばれる。）の品質を基準３Ｄ表現（第１の３Ｄ表現とも呼ばれる。）に基づき評価するために、画像ベースサンプリングメトリック（image-based sampling metric，ＩＢＳＭ）を用いてアセスメントスコアを計算することができる。いくつかの例で、基準３Ｄ表現は、元の３Ｄ表現であり、アセスメント中の３Ｄ表現は、元の３Ｄ表現に基づき（例えば、モデリング技術に従って）生成される。アセスメント中の３Ｄ表現は、元の３Ｄ表現に対して歪みを有していることがある。

いくつかの例で、ＩＢＳＭを用いてアセスメントスコアを計算するために、複数の投影画像が生成される。例えば、仮想カメラの第１の組は、２Ｄ画像の第１の組を生成するために第１の３Ｄ表現に関して特定のポジションで配置され、また、仮想カメラの第２の組は、２Ｄ画像の第２の組を生成するために第２の３Ｄ表現に関して対応するポジションで配置される。次いで、ＩＢＳＭのアセスメントスコアが、２Ｄ画像の第１の組及び２Ｄ画像の第２の組に基づき計算され得る。いくつかの例で、仮想カメラはビュー方向を特定するために使用される点に留意されたい。仮想カメラの第１の組及び仮想カメラの第２の組は、第１の３Ｄ表現及び第２の３Ｄ表現について、対応するカメラポジションで配置され得る。カメラポジションはビュー方向と関連付けられている。よって、２Ｄ画像の第１の組及び２Ｄ画像の第２の組は、同じビュー方向から撮影される。

具体的に、いくつかの例で、第１のカラーバッファは、ビュー方向に関連したカラー画像の第１の組を記憶し、第１のマスクバッファは、ビュー方向に関連したマスク画像の第１の組を記憶し、第１のデプスバッファは、ビュー方向に関連したデプス画像の第１の組を記憶する。同様に、第２のカラーバッファは、ビュー方向に関連したカラー画像の第２の組を記憶し、第２のマスクバッファは、ビュー方向に関連したマスク画像の第２の組を記憶し、第２のデプスバッファは、ビュー方向に関連したデプス画像の第２の組を記憶する。

いくつかの例で、カラー画像及びデプス画像のＰＳＮＲ値は、カラーバッファ及びデプスバッファの各対に基づきビュー方向ごとに計算され得る。カラー画像のＰＳＮＲ値は、色歪みを推定する。一例では、ＰＳＮＲ値は、第１のカラーバッファ内の第１のカラー画像及び第２のカラーバッファ内の第２のカラー画像に基づき計算される。第１のカラー画像及び第２のカラー画像は、同じビュー方向を有することができる。デプス画像のＰＳＮＲ値は、ジオメトリ歪みを推定する。一例では、ＰＳＮＲ値は、第１のデプスバッファ内の第１のデプス画像及び第２のデプスバッファ内の第２のデプス画像に基づき計算される。第１のデプス画像及び第２のデプス画像は、同じビュー方向を有することができる。

一例では、最終的なＰＳＮＲ値は、異なるビュー方向及び異なる時間フレーム（例えば、メッシュの複数のフレームを含むダイナミックメッシュ）からの全てのＰＳＮＲ値を平均することによって計算される。

図３は、いくつかの例の中で、画像ベースサンプリングメトリックを用いてアセスメント値を計算することを説明する図を示す。

図３の例において、第１の３Ｄ表現（３１０Ａ）は、基準３Ｄ表現であり、第２の３Ｄ表現（３１０Ｂ）は、アセスメント中の３Ｄ表現である。

いくつかの例で、ビュー方向の組（例えば、Ｖ１、Ｖ２、Ｖ３などによって示されている。）が決定される。ビュー方向の組に従って、複数の投影画像（２Ｄ画像とも呼ばれる。）の第１の組が、第１の３Ｄ表現（３１０Ａ）に関して生成され、複数の投影画像の第２の組が、第２の３Ｄ表現（３１０Ｂ）に関して生成される。例えば、ビュー方向Ｖ２に従って、カラー画像ＣＯＬＯＲ２Ａ、マスク画像ＭＡＳＫ２Ａ、及びデプス画像ＤＥＰＴＨ２Ａが第１の３Ｄ表現（３１０Ａ）から生成される。カラー画像ＣＯＬＯＲ２ＡはカラーバッファＡに記憶され、マスク画像ＭＡＳＫ２ＡはマスクバッファＡに記憶され、デプス画像ＤＥＰＴＨ２ＡはデプスバッファＡに記憶される。

同様に、ビュー方向Ｖ２に従って、カラー画像ＣＯＬＯＲ２Ｂ、マスク画像ＭＡＳＫ２Ｂ、及びデプス画像ＤＥＰＴＨ２Ｂが第２の３Ｄ表現（３１０Ｂ）から生成される。カラー画像ＣＯＬＯＲ２ＢはカラーバッファＢに記憶され、マスク画像ＭＡＳＫ２ＢはマスクバッファＢに記憶され、デプス画像ＤＥＰＴＨ２ＢはデプスバッファＢに記憶される。

いくつかの例で、カラーバッファＡは、ビュー方向の組の中のビュー方向から投影された第１の３Ｄ表現（３１０Ａ）のカラー画像を記憶することができる。マスクバッファＡは、ビュー方向の組の中のビュー方向から投影された第１の３Ｄ表現（３１０Ａ）のマスク画像を記憶することができる。デプスバッファＡは、ビュー方向の組の中のビュー方向から投影された第１の３Ｄ表現（３１０Ａ）のデプス画像を記憶することができる。同様に、カラーバッファＢは、ビュー方向の組の中のビュー方向から投影された第２の３Ｄ表現（３１０Ｂ）のカラー画像を記憶することができる。マスクバッファＢは、ビュー方向の組の中のビュー方向から投影された第２の３Ｄ表現（３１０Ｂ）のマスク画像を記憶することができる。デプスバッファＢは、ビュー方向の組の中のビュー方向から投影された第２の３Ｄ表現（３１０Ｂ）のデプス画像を記憶することができる。

一例では、平均二乗誤差（ＭＳＥ）が、同じビュー方向の２つの画像の間の差を計算するために使用可能である。例えば、ビュー方向Ｖ２に関連したカラーＭＳＥ値は、カラー画像ＣＯＬＯＲ２Ａ及びカラー画像ＣＯＬＯＲ２Ｂに基づき計算され、ビュー方向Ｖ２に関連したデプスＭＳＥ値は、デプス画像ＤＥＰＴＨ２Ａ及びデプス画像ＤＥＰＴＨ２Ｂに基づき計算される。一例では、ビュー方向Ｖ２に関連したカラーＰＳＮＲ値は、カラーＭＳＥ値に基づき計算され、ビュー方向Ｖ２に関連したデプスＰＳＮＲ値は、デプスＭＳＥ値に基づき計算される。一例では、カラーアセスメントスコアは、ビュー方向に関連したカラーＰＳＮＲ値の平均として計算される。他の例では、デプスアクセスメントスコアは、ビュー方向に関連したデプスＰＳＮＲ値の平均として計算される。

いくつかの例で、第１の３Ｄ表現（３１０Ａ）は複数のフレームを含み、第２の３Ｄ表現（３１０Ｂ）は複数のフレームを含む。一例では、フレームレベルアセスメントスコア、例えば、フレームレベルカラーアセスメントスコア、フレームレベルデプスアセスメントスコア、などは、対応するフレームの各対について計算される。次いで、カラーメトリックが、フレームレベルカラーアセスメントスコアの全ての平均として計算され、デプスメトリックが、フレームレベルデプスアセスメントスコアの全ての平均として計算される。

いくつかの例では、最終的なアセスメント値は、全てのＰＳＮＲ値（例えば、メッシュの複数のフレームが存在する場合に、全てのビュー方向及びフレームのカラーＰＳＮＲ値、デプスＰＳＮＲ値）を平均することによって、計算される。最終的なアセスメントスコアは、第２の３Ｄ表現（３１０Ｂ）の品質を評価するために使用される。

いくつかの関係がある例では、ビュー方向（仮想カメラポジションとも呼ばれる。）は、ビュー方向の数が決定されると固定される。更に、最終的なアセスメントスコアは、空間ドメイン及び時間ドメインの違いに関係なく、異なるビュー方向及びフレームからのＰＳＮＲを平均することによって取得される。本開示の態様に従って、ＰＳＮＲ値は、人間の視覚と十分に強く相関しない場合がある。

本開示のいくつかの態様は、３Ｄ表現の品質アセスメントのためのＩＢＳＭメトリックを改善する技術を提供する。技術は、個別的に適用可能であり、あるいは、任意に組み合わされた形で適用可能である。

本開示の態様に従って、３Ｄ表現を比較するための仮想カメラのポジション（ビュー方向に対応。）は変更することができる。仮想カメラポジションは、常に固定ではなく、変更することができる。

いくつかの実施形態で、仮想カメラポジションの変化は、最初の仮想カメラポジションに適用可能である。３Ｄ表現の境界球上の最初の仮想カメラポジションは、如何なる手段によっても、例えば、フィボナッチ球格子などを使用して、決定され得る。

いくつかの例では、（３Ｄ表現のための）境界球の周りで仮想カメラポジションを回転させ、更新された仮想カメラポジションを決定するために、最初の仮想カメラポジションに対して回転マトリクスが適用される。更新された仮想カメラポジションは、２Ｄ画像を生成するために使用され、２Ｄ画像は、品質アセスメントのために使用される。いくつかの例で、回転マトリクスは、ユーザインターフェースから受け取られた入力パラメータなどのユーザ入力パラメータによって指定され得る。一例では、回転マトリクスは、回転の大きさを持った回転軸に基づき決定され得る。他の例では、回転マトリクスは、予め定義された順序で異なる軸に沿った３つの回転軸から取得され得る（別名、ヨー、ピッチ、ロール表現）。他の例では、回転マトリクスは、四元数表現によって表現され得る。

いくつかの実施形態で、仮想カメラポジションは、３Ｄ表現の境界球上に均等にサンプリング（配置、分布）される。いくつかの実施形態で、仮想カメラポジションは、３Ｄ表現の境界球上にランダムにサンプリング（例えば、配置、分布）される。

いくつかの実施形態で、仮想カメラポジションは時間とともに変化することができる。いくつかの例で、３Ｄ表現は、異なる時間タイプを持った複数のフレームを含む。一例では、各フレームは、異なる仮想カメラポジション配置を有してもよい。いくつかの例で、仮想カメラのポジションはフレームごとに変化することができる。一例では、仮想カメラのポジションは、境界球上のカメラ移動経路に従って変化することができる。いくつかの例で、仮想カメラは、境界球上で同じ又は異なるカメラ移動経路を有してもよい。一例では、カメラ移動経路は固定であることができる。他の例では、カメラ移動経路は、ユーザ入力によって、例えば、ユーザインターフェースから受け取られた入力パラメータとして、指定される。

本開示の態様に従って、適応重み付け技術が使用可能である。例えば、空間（例えば、仮想カメラポジション、仮想カメラ）及び時間（例えば、フレーム）にわたってアセスメントスコア（例えば、ＰＳＮＲ値）を平均するのではなく、より適応的な重み付けストラテジが、アセスメント中の３Ｄ表現の最終的なアセスメントスコアを計算することにおいて適用され得る。

いくつかの例で、フレームごとのアセスメントスコアは、各仮想カメラからの加重和として計算され得る。例えば、式（１）は、ｉ番目のフレームのアセスメントスコアを計算するために使用され得る。
ここで、Ｓ_ｉ ^ｊは、ｉ番目のフレーム内のｊ番目の仮想カメラのアセスメントスコアを表す。一例では、アセスメントスコアは、カラーバッファに基づき計算されたカラーＰＳＮＲ値、若しくはデプスバッファに基づき計算されたデプスＰＳＮＲ値、又は何らかの多のメトリックであることができる。Ｗ_ｉ ^ｊは、スコアＳ_ｉ ^ｊに対する重み付け係数を表す。Ｆ_ｉは、ｉ番目のフレームの重み付けされたアセスメントスコアを表す。重みＷ_ｉ ^ｊは、レンダリングされた画像（投影画像）内の有効なピクセルの数、視点までの距離、などを含む種々の因子を考慮に入れることができる。

一例では、第１の投影画像内の有効なピクセルの第１の数が第２の投影画像内の有効なピクセルの第２の数よりも多い場合に、より大きい重みが第１の投影画像に割り当てられる。一例では、投影画像の有効なピクセルの数は、投影画像のマスク画像内の「１」の数によって決定され得る。

一例では、視点までの距離は、投影面までの点の平均距離を用いて計算される。一例では、視点までの距離は、投影画像のデプス画像内の有効なデプス値の平均デプス値を用いて計算される。

更に、最終的なアセスメントスコアは、フレームのスコアからの加重和であることができ、これは、式（２）に示されるように定式化され得る。
ここで、Ｔ_ｉは、ｉ番目のフレームに対する重み付け係数を表し、Ｆは、全てのフレームにわたって重み付けされた最終的なアセスメントスコアを表す。重みＴ_ｉは、書くフレーム内の仮想カメラの数、仮想カメラポジション、などを含む種々の因子を考慮に入れることができる。一例では、異なるフレームの投影のために、異なる数の仮想カメラが使用される。仮想カメラの数が多い（投影された２Ｄ画像の数が多い）フレームは、より大きい重みを有してよい。他の例では、異なる仮想カメラポジションは、有効なピクセルの数が異なるか又は視点までの距離が異なる画像を生成する場合がある。仮想カメラポジションがフレームごとに異なる場合に、フレームに対する重みは、仮想カメラポジションの違いを考慮に入れることができる。

本開示の態様に従って、追加の目的メトリックが３Ｄ表現の品質アセスメントで使用可能である。目的メトリックは、ＰＳＮＲよりも人間の視覚により良く相関することができ、単にＰＳＮＲを計算することよりも、レンダリングされたフレームの品質を評価するために使用することができる。

いくつかの実施形態で、構造類似性指数メトリック（ＳＳＩＭ）、視覚情報フィデリティ（ＶＩＦ）、ビデオマルチメソッドアセスメント融合（ＶＭＡＦ）などのようないくつかのメトリックが、３Ｄ基準表現（基準メッシュ、基準点群など）に基づきアセスメント中の３Ｄ表現（例えば、アセスメント中の点群、アセスメント中のメッシュ）の品質を決定するために使用されてもよい。一例では、元のメッシュは、圧縮されたメッシュ（元のメッシュに対して歪みを有する場合がある。）の品質アセスメントのための３Ｄ基準表現として使用される。ＳＳＩＭ、ＶＩＦ、ＶＭＡＦなどのようなメトリックは、元のメッシュに基づき、圧縮されたメッシュの品質を決定するために使用されてもよい。

いくつかの実施形態で、盲目／非参照型画像空間品質評価器（ＢＲＩＳＱＵＥ）、歪み識別に基づいた画像の真偽及び完全性の評価（ＤＩＩＶＩＮＥ）などのようないくつかのメトリックが、縮小参照又は非参照を用いてアセスメント中の３Ｄ表現（例えば、アセスメント中の点群、アセスメント中のメッシュ）の品質を決定することができる。一例では、元のメッシュは、圧縮されたメッシュの品質アセスメントを実行するために必要とされない。他の例では、元のメッシュの部分のみが、圧縮されたメッシュの品質アセスメントを実行するために必要とされる。

図４は、本開示の実施形態に係るプロセス（４００）を説明するフローチャートを示す。プロセス（４００）は、３Ｄ表現の品質アセスメントで使用され得る。いくつかの実施形態で、プロセス（４００）は、ソフトウェア命令で実装され、よって、処理回路がソフトウェア命令を実行するときに、処理回路はプロセス（４００）を実行する。プロセスは（Ｓ４０１）から始まり、（Ｓ４１０）へ進む。

（Ｓ４１０）で、更新された仮想カメラポジションが、仮想カメラのポジション変化に応答して決定される。仮想カメラは、３次元（３Ｄ）空間から２次元（２Ｄ）空間への投影のために使用される。

いくつかの例で、ポジション変化の回転マトリクスが、更新された仮想カメラポジションを決定するよう、前の仮想カメラポジションに適用される。一例では、回転マトリクスは、ユーザインターフェースにより入力パラメータとして受け取られる。

（Ｓ４２０）で、基準３Ｄ表現が、基準２Ｄ画像を生成するよう、更新された仮想カメラポジションに従って投影される。基準３Ｄ表現は点群又はメッシュであることができる。基準２Ｄ画像はカラー画像、マスク画像及びデプス画像を含むことができる。

（Ｓ４３０）で、アセスメント中の３Ｄ表現が、アセスメント２Ｄ画像を生成するよう、更新された仮想カメラポジションに従って投影される。

（Ｓ４４０）で、更新された仮想カメラポジションに関連したアセスメントスコアが、基準２Ｄ画像及びアセスメント２Ｄ画像に基づき計算される。

いくつかの実施形態で、品質アセスメントは複数のカメラを使用する。いくつかの例で、第１の複数の更新された仮想カメラポジションが、複数の仮想カメラのポジション変化に基づき決定される。基準３Ｄ表現は、第１の複数の更新された仮想カメラポジションに関連した第１の複数の基準２Ｄ画像を生成するよう、第１の複数の更新された仮想カメラポジションに従って投影される。アセスメント中の３Ｄ表現は、第１の複数の更新された仮想カメラポジションに関連した第１の複数のアセスメント２Ｄ画像を生成するよう、第１の複数の更新された仮想カメラポジションに従って投影される。第１の複数の更新された仮想カメラポジションに夫々関連している第１の複数のアセスメントスコアが、第１の複数の基準２Ｄ画像及び第１の複数のアセスメント２Ｄ画像に基づき計算される。次いで、第１の複数のアセスメントスコアの加重平均されたアセスメントスコアが計算される。

実施形態において、第１の複数の更新された仮想カメラポジションは、３Ｄ空間内の球上に均等にサンプリングされる。他の実施形態においては、第１の複数の更新された仮想カメラポジションは、３Ｄ空間内の球上にランダムにサンプリングされる。

いくつかの例で、アセスメント中の３Ｄ表現は、基準３Ｄ表現のフレームに対応している複数のフレームを含む。第１の複数の更新された仮想カメラポジションは、アセスメント中の３Ｄ表現の第１のフレーム及び基準３Ｄ表現の第１の対応するフレームを投影するために使用される。いくつかの例で、複数の仮想カメラの第２の複数の更新された仮想カメラポジションが決定され得る。第２の複数の更新された仮想カメラポジションは、アセスメント中の３Ｄ表現の第２のフレーム及び基準３Ｄ表現の第２の対応するフレームを投影するために使用される。一例では、複数の仮想カメラの第２の複数の更新された仮想カメラポジションが、カメラ移動経路に基づきを決定される。

他の例では、第２の複数の更新された仮想カメラポジションの中の第１のポジションが、第１のカメラ移動経路に基づき決定される。第１のポジションは、複数の仮想カメラの中の第１の仮想カメラに関連している。第２の複数の更新された仮想カメラポジションの中の第２のポジションが、第２のカメラ移動経路に基づき決定される。第２のポジションは、複数の仮想カメラの中の第２の仮想カメラに関連している。

いくつかの例で、第１の複数のアセスメントスコアの加重平均されたアセスメントスコアを計算するために、第１の複数のアセスメントスコアを重み付けする重みがアセスメント中の３Ｄ表現の投影に基づき決定され、加重平均されたアセスメントスコアが重みに基づき計算される。一例では、第１の複数のアセスメントスコアを重み付けする重みは、第１の複数のアセスメント２Ｄ画像において投影される有効なピクセルの各々の数に基づき決定される。他の例では、第１の複数のアセスメントスコアを重み付けする重みは、第１の複数の更新された仮想カメラポジションに対応する投影面までのアセスメント中の３Ｄ表現の各々の距離に基づき決定される。

いくつかの例で、アセスメント中の３Ｄ表現は、基準３Ｄ表現のフレームに対応している複数のフレームを含み、第１の複数の更新された仮想カメラポジションは、アセスメント中の３Ｄ表現の第１のフレーム及び基準３Ｄ表現の第１の対応するフレームを投影するために使用され、加重平均されたアセスメントスコアは、第１のフレームに対する第１のフレームレベルアセスメントスコアである。いくつかの例で、第１のフレームレベルアセスメントスコアを重み付けする第１のフレーム重みは、第１の複数の更新された仮想カメラポジションに基づき決定される。複数のフレームに対する加重平均スコアである最終的なアセスメントスコアが計算される。第１のフレームレベルアセスメントスコアは、最終的なアセスメントスコアにおいて第１のフレーム重みによって重み付けされている。一例では、第１のフレーム重みは、第１の複数の更新された仮想カメラポジションの中のポジションの数に基づき決定される。他の例では、第１のフレーム重みは、第１の複数の更新された仮想カメラポジションの中のポジションに基づき決定される。

実施形態において、アセスメントスコアは、ピーク信号対雑音比（ＰＳＮＲ）に基づき計算される。他の実施形態においては、アセスメントスコアは、構造類似性指数メトリック（ＳＳＩＭ）に基づき計算される。他の実施形態においては、アセスメントスコアは、視覚情報フィデリティ（ＶＩＦ）に基づき計算される。他の実施形態においては、アセスメントスコアは、ビデオマルチメソッドアセスメント融合（ＶＭＡＦ）に基づき計算される。他の実施形態においては、アセスメントスコアは、盲目／非参照型画像空間品質評価器（ＢＲＩＳＱＵＥ）に基づき計算される。他の実施形態においては、アセスメントスコアは、歪み識別に基づいた画像の真偽及び完全性の評価（ＤＩＩＶＩＮＥ）に基づき計算される。

次いで、プロセスは（Ｓ４９９）へ進んで終了する。

プロセス（４００）は、適切に適応され得る。プロセス（４００）のステップは、変更及び／又は省略することができる。追加のステップが加えられてもよい。如何なる適切な実施順序も使用することができる。

図５は、本開示の実施形態に係るプロセス（５００）を説明するフローチャートを示す。プロセス（５００）は、３Ｄ表現の品質アセスメントで使用され得る。いくつかの実施形態において、プロセス（５００）は、ソフトウェア命令で実装され、よって、処理回路がソフトウェア命令を実行するとき、処理回路はプロセス（５００）を実行する。プロセスは（Ｓ５０１）から始まり、（Ｓ５１０）へ進む。

（Ｓ５１０）で、基準３次元（３Ｄ）表現が、基準２次元（２Ｄ）画像を生成するよう、仮想カメラの複数の仮想カメラポジションに従って投影される。仮想カメラは、３Ｄ空間から２Ｄ空間への投影のために使用される。一例では、複数の仮想カメラポジションは固定ポジションである。他の例では、複数の仮想カメラポジションは、フレームごとに変化してもよい。

（Ｓ５２０）で、アセスメント中の３Ｄ表現が、アセスメント２Ｄ画像を生成するよう、仮想カメラの複数の仮想カメラポジションに従って投影される。

（Ｓ５３０）で、仮想カメラに関連したアセスメントスコアが、基準２Ｄ画像及びアセスメント２Ｄ画像に基づき計算され得る。

（Ｓ５４０）で、アセスメント中の３Ｄ表現に対するアセスメントスコアの加重平均されたアセスメントスコアが計算される。アセスメントスコアを重み付けする重みは、アセスメント中の３Ｄ表現の投影に基づき決定される。

いくつかの例で、アセスメントスコアを重み付けする重みは、アセスメント２Ｄ画像において投影される有効なピクセルの各々の数に基づき決定される。他の例では、アセスメントスコアを重み付けする重みは、複数の仮想カメラポジションに対応する投影面までのアセスメント中の３Ｄ表現の各々の距離に基づき決定される。

いくつかの例で、アセスメント中の３Ｄ表現は、基準３Ｄ表現のフレームに対応している複数のフレームを含む。加重平均されたアセスメントスコアは、第１のフレームに対する第１のフレームレベルアセスメントスコアである。第１のフレームレベルアセスメントスコアを重み付けする第１のフレーム重みが、複数の仮想カメラポジションに基づき決定される。複数のフレームに対する加重平均されたスコアである最終的なアセスメントスコアが計算される。最終的なアセスメントスコアは、第１のフレーム重みによって重み付けされている第１のフレームレベルアセスメントスコアを含む。一例では、第１のフレーム重みは、複数の仮想カメラポジションの中のポジションの数に基づき決定される。他の例では、第１のフレーム重みは、複数の仮想カメラポジションの中のポジションに基づき決定される。

次いで、プロセスは（Ｓ５９９）へ進んで終了する。

プロセス（５００）は、適切に適応され得る。プロセス（５００）のステップは、変更及び／又は省略することができる。追加のステップが加えられてもよい。如何なる適切な実施順序も使用することができる。

図６は、本開示の実施形態に係るプロセス（６００）を説明するフローチャートを示す。プロセス（６００）は、３Ｄ表現の品質アセスメントで使用され得る。いくつかの実施形態において、プロセス（６００）は、ソフトウェア命令で実装され、よって、処理回路がソフトウェア命令を実行するとき、処理回路はプロセス（６００）を実行する。プロセスは（Ｓ６０１）から始まり、（Ｓ６１０）へ進む。

（Ｓ６１０）で、３次元（３Ｄ）空間から２次元（２Ｄ）空間へ投影するための仮想カメラの仮想カメラポジションに従って、アセスメント中の３Ｄ表現が、アセスメント２Ｄ画像を生成するよう投影される。

（Ｓ６２０）で、アセスメントスコアが、アセスメント２Ｄ画像に基づき計算される。実施形態において、アセスメントスコアは、構造類似性指数メトリック（ＳＳＩＭ）に基づき計算される。他の実施形態においては、アセスメントスコアは、視覚情報フィデリティ（ＶＩＦ）に基づき計算される。他の実施形態においては、アセスメントスコアは、ビデオマルチメソッドアセスメント融合（ＶＭＡＦ）に基づき計算される。他の実施形態においては、アセスメントスコアは、盲目／非参照型画像空間品質評価器（ＢＲＩＳＱＵＥ）に基づき計算される。他の実施形態においては、アセスメントスコアは、歪み識別に基づいた画像の真偽及び完全性の評価（ＤＩＩＶＩＮＥ）に基づき計算される。

いくつかの例で、メトリックが基準を必要とする場合に、３Ｄ基準表現が、基準２Ｄ画像を生成するよう、仮想カメラの仮想カメラポジションに従って投影され得る。

次いで、プロセスは（Ｓ６９９）へ進んで終了する。

プロセス（６００）は、適切に適応され得る。プロセス（６００）のステップは、変更及び／又は省略することができる。追加のステップが加えられてもよい。如何なる適切な実施順序も使用することができる。

上述された技術は、コンピュータ可読命令を使用してコンピュータソフトウェアとして実装され、１つ以上のコンピュータ可読媒体に物理的に記憶され得る。例えば、図７は、開示されている対象の特定の実施形態を実装するのに適したコンピュータシステム（７００）を示す。

コンピュータソフトウェアは、１つ以上のコンピュータ中央演算処理装置（ＣＰＵ）、グラフィクス処理ユニット（ＧＰＵ）などによって、直接に、又は解釈、マイクロコード実行などを通じて、実行され得る命令を含むコードを生成するように、アセンブリ、コンパイル、リンキングなどのメカニズムに従い得る如何なる適切な機械コード又はコンピュータ言語によってもコーディング可能である。

命令は、例えば、パーソナルコンピュータ、タブレットコンピュータ、サーバ、スマートフォン、ゲーム機、インターネット・オブ・シングス（Internet of Things）デバイス、などを含む様々なタイプのコンピュータ又はその構成要素で実行可能である。

コンピュータシステム（７００）に関して図７に示されるコンポーネントは、本質的に例示であり、本開示の実施形態を実装するコンピュータソフトウェアの使用又は機能の範囲に関して如何なる限定も示唆することを意図しない。コンポーネントの構成は、コンピュータシステム（７００）の例示的な実施形態において説明される構成要素のうちのいずれか１つ又は組み合わせに関して何らかの依存又は要件を有するものとして解釈されるべきではない。

コンピュータシステム（７００）は、特定のヒューマンインターフェース入力デバイスを含んでよい。かようなヒューマンインターフェース入力デバイスは、例えば、触覚入力（例えば、キーストローク、スワイプ、データグロープ動作）、音声入力（例えば、声、拍手）、視覚入力（例えば、ジェスチャ）、嗅覚入力（図示せず。）を通じた一人以上のユーザによる入力に反応してよい。ヒューマンインターフェースデバイスはまた、音声（例えば、発話、音楽、周囲音）、画像（例えば、スキャンされた画像、静止画カメラから取得された写真画像）、映像（例えば、２次元映像、立体視映像を含む３次元映像）などの、人による意識的な入力に必ずしも直接には関係しない特定のメディアを捕捉するためにも使用され得る。

入力ヒューマンインターフェースデバイスは、キーボード（７０１）、マウス（７０２）、トラックパッド（７０３）、タッチスクリーン（７１０）、データグローブ（図示せず。）、ジョイスティック（７０５）、マイク（７０６）、スキャナ（７０７）、カメラ（７０８）（各１つしか表されていない。）のうちの１つ以上を含んでよい。

コンピュータシステム（７００）は、特定のヒューマンインターフェース出力デバイスも含んでよい。かようなヒューマンインターフェース出力デバイスは、例えば、触覚出力、音響、光、及び匂い／味を通じて一人以上のユーザの感覚を刺激するものであってよい。かようなヒューマンインターフェース出力デバイスは、触覚出力デバイス（例えば、タッチスクリーン（７１０）、データグローブ（図示せず。）、又はジョイスティック（７０５）による触覚フィードバック、しかし、入力デバイスとして機能しない触覚フィードバックデバイスも存在することができる。）、音声出力デバイス（例えば、スピーカ（７０９）、ヘッドホン（図示せず。））、視覚出力デバイス（例えば、夫々タッチスクリーン入力機能の有無によらず、夫々触覚フィードバック機能の有無によらず、ＣＲＴスクリーン、ＬＣＤスクリーン、プラズマスクリーン、ＯＬＥＤスクリーンを含み、それらのうちのいくつかは、立体視出力、仮想現実メガネ（図示せず。）、ホログラフィックディスプレイ及びスモークタンク（図示せず。）などの手段により２次元視覚出力又は３次元よりも多い次元の出力を出力可能であり得るスクリーン（７１０））、及びプリンタ（図示せず。）を含んでよい。

コンピュータシステム（７００）は、人がアクセス可能な記憶デバイス及びそれらの関連する媒体、例えば、ＣＤ／ＤＶＤ又は同様の媒体（７２１）によるＣＤ／ＤＶＤＲＯＭ／ＲＷ（７２０）、サムドライブ（７２２）、リムーバブルハードディスク又はソリッドステートドライブ（７２３）、レガシー磁気媒体、例えば、テープ及びフロッピー（登録商標）ディスク（図示せず。）、専用のＲＯＭ／ＡＳＩＣ／ＰＬＤベースデバイス、例えば、セキュリティドングル（図示せず。）、なども含むことができる。

当業者であれば、目下開示されている対象に関連して使用されている「コンピュータ可読媒体」という用語が、伝送媒体、搬送波、又は他の一時的な信号を含まないことも理解するはずである。

コンピュータシステム（７００）は、１つ以上の通信ネットワーク（７５５）へのインターフェース（７５４）も含むことができる。ネットワークは、例えば、ワイヤレス、ワイヤライン、光であることができる。ネットワークは更に、ローカル、ワイドエリア、メトロポリタン、車両及び産業、実時間、遅延耐性、などであることができる。ネットワークの例には、イーサネット（登録商標）などのローカルエリアネットワーク、ワイヤレスＬＡＮ、ＧＳＭ、３Ｇ、４Ｇ、５Ｇ、ＬＴＥなどを含むセルラーネットワーク、ケーブルＴＶ、衛星ＴＶ、及び地上放送ＴＶを含むＴＶワイヤライン又はワイヤレス広域デジタルネットワーク、ＣＡＮＢｕｓを含む車両及び産業ネットワーク、などがある。特定のネットワークは、一般に、特定の汎用デジタルポート又はペリフェラルバス（７４９）（例えば、コンピュータシステム（７００）のＵＳＢポートなど）に取り付けられた外付けネットワークインターフェースアダプタを必要とする。他は、一般に、後述されるようなシステムバスへの取り付け（例えば、ＰＣコンピュータシステムへのイーサネットネットワーク、又はスマートフォンコンピュータシステムへのセルラーネットワークインターフェース）によってコンピュータシステム（７００）のコアに組み込まれる。これらのネットワークのいずれかを使用して、コンピュータシステム（７００）は他のエンティティと通信することができる。そのような通信は、一方向の受信専用（例えば、ブロードキャストＴＶ）又は一方向の送信専用（例えば、特定のＣＡＮＢｕｓデバイスへのＣＡＮＢｕｓ）であることができ、あるいは、例えば、ローカル若しくは広域デジタルネットワークを使用して他のコンピュータシステムに対して双方向であることができる。特定のプロトコル又はプロトコルスタックが、上述されたようなネットワーク及びネットワークインターフェースの夫々で使用可能である。

上記のヒューマンインターフェースデバイス、人がアクセス可能な記憶デバイス、及びネットワークインターフェースは、コンピュータシステム（７００）のコア（７４０）へ取り付けられ得る。

コア（７４０）は、１つ以上の中央演算処理装置（ＣＰＵ）（７４１）、グラフィクス処理ユニット（ＧＰＵ）（７４２）、フィールドプログラマブルゲートエリア（ＦＰＧＡ）（７４３）の形をとる専用のプログラム可能処理ユニット、特定のタスクのためのハードウェアアクセラレータ（７４４）、グラフィクスアダプタ（７５０）などを含むことができる。これらのデバイスは、リードオンリーメモリ（ＲＯＭ）（７４５）、ランダムアクセスメモリ（７４６）、内部のユーザアクセス不能ハードドライブなどの内蔵大容量記憶装置、ＳＳＤ、など（７４７）とともに、システムバス（７４８）を通じて接続されてよい。いくつかのコンピュータシステムでは、システムバス（７４８）は、追加のＣＰＵ、ＧＰＵなどによる拡張を可能にするように、１つ以上の物理プラグの形でアクセス可能であることができる。コアのシステムバス（７４８）へ直接に又はペリフェラルバス（７４９）を通じて、周辺機器が取り付けられ得る。一例では、スクリーン（７１０）がグラフィクスアダプタ（７５０）へ接続され得る。ペリフェラルバスのためのアーキテクチャは、ＰＣＩ、ＵＳＢ、などを含む。

ＣＰＵ（７４１）、ＧＰＵ（７４２）、ＦＰＧＡ（７４３）、及びアクセラレータ（７４４）は、組み合わせて上記のコンピュータコードを構成することができる特定の命令を実行可能である。そのコンピュータコードは、ＲＯＭ（７４５）又はＲＡＭ（７４６）に記憶され得る。一時データもＲＡＭ（７４６）に記憶可能であり、一方、永続性データは、例えば、内蔵大容量記憶装置（７４７）に記憶可能である。メモリデバイスのいずれかへの高速な格納及び読み出しは、キャッシュメモリの使用により可能にされ得る。キャッシュメモリは、１つ以上のＣＰＵ（７４１）、ＧＰＵ（７４２）、大容量記憶装置（７４７）、ＲＯＭ（７４５）、ＲＡＭ（７４６）などと密接に関連し得る。

コンピュータ可読媒体は、様々なコンピュータ実装動作を実行するためのコンピュータコードを有することができる。媒体及びコンピュータコードは、本開示の目的のために特別に設計及び構成されたものであることができ、あるいは、それらは、コンピュータソフトウェア技術で通常の知識を有する者によく知られており利用可能である種類のものであることができる。

例として、限定としてではなく、アーキテクチャ（７００）を備えたコンピュータシステム、具体的にはコア（７４０）は、１つ以上の有形なコンピュータ可読媒体において具現されているソフトウェアを実行するプロセッサ（ＣＰＵ、ＧＰＵ、ＦＰＧＡ、アクセラレータ、などを含む。）の結果として機能を提供することができる。かようなコンピュータ可読媒体は、コア内蔵大容量記憶装置（７４７）又はＲＯＭ（７４５）などの、非一時的な性質であるコア（７４０）の特定の記憶装置に加えて、先に紹介されたユーザアクセス可能な大容量記憶装置に関連した媒体であることができる。本開示の様々な実施形態を実装するソフトウェアは、そのようなデバイスに記憶され、コア（７４０）によって実行可能である。コンピュータ可読媒体には、特定のニーズに応じて、１つ以上のメモリデバイス又はチップが含まれ得る。ソフトウェアは、コア（７４０）、及び、具体的には、その中のプロセッサ（ＣＰＵ、ＧＰＵ、ＦＰＧＡなどを含む。）に、ＲＡＭ（７４６）に記憶されているデータ構造を定義することと、ソフトウェアによって定義されたプロセスに従ってそのようなデータ構造を変更することとを含め、本明細書で説明されている特定のプロセス又は特定のプロセスの特定の部分を実行させることができる。追加的に、又は代替案として、コンピュータシステムは、本明細書で説明されている特定のプロセス又は特定のプロセスの特定の部分を実行するようにソフトウェアの代わりに又はそれとともに動作することができる、回路内でハードワイヤード又は別なふうに具現されたロジック（例えば、アクセラレータ（７４４））の結果として、機能を提供することができる。ソフトウェアへの言及は、必要に応じて、ロジックを包含することができ、その逆も同様である。コンピュータ可読媒体への言及は、必要に応じて、実行のためのソフトウェアを記憶している回路（例えば、集積回路（ＩＣ））、実行のためのロジックを具現する回路、又は両方を包含することができる。本開示は、ハードウェア及びソフトウェアの如何なる適切な組み合わせも包含する。

本開示は、いくつかの非限定的な実施例について記載してきたが、本開示の範囲内にある代替、交換、及び様々な置換均等物が存在する。よって、明らかなように、当業者であれば、たとえ本明細書で明示的に図示又は説明されていないとしても、本開示の原理を具現し、よって、その精神及び範囲の中にある多数のシステム及び方法に想到可能である。

Claims

品質アセスメントのための方法であって、
３次元（３Ｄ）空間から２次元（２Ｄ）空間への投影のための仮想カメラのポジション変化に応答して、更新された仮想カメラポジションを決定するステップと、
基準２Ｄ画像を生成するよう前記更新された仮想カメラポジションに従って基準３Ｄ表現を投影するステップと、
アセスメント２Ｄ画像を生成するよう前記更新された仮想カメラポジションに従ってアセスメント中の３Ｄ表現を投影するステップと、
前記基準２Ｄ画像及び前記アセスメント２Ｄ画像に基づき、前記更新された仮想カメラポジションに関連したアセスメントスコアを計算するステップと
を有する方法。
前記更新された仮想カメラポジションを決定するステップは、
前記更新された仮想カメラポジションを決定するよう前記ポジション変化の回転マトリクスを前の仮想カメラポジションに適用するステップを更に有する、
請求項１に記載の方法。
ユーザインターフェースにより入力パラメータとして前記回転マトリクスを受け取るステップを更に有する、
請求項２に記載の方法。
複数の仮想カメラのポジション変化に基づき第１の複数の更新された仮想カメラポジションを決定するステップと、
前記第１の複数の更新された仮想カメラポジションに関連した第１の複数の基準２Ｄ画像を生成するよう前記第１の複数の更新された仮想カメラポジションに従って前記基準３Ｄ表現を投影するステップと、
前記第１の複数の更新された仮想カメラポジションに関連した第１の複数のアセスメント２Ｄ画像を生成するよう前記第１の複数の更新された仮想カメラポジションに従って前記アセスメント中の３Ｄ表現を投影するステップと、
前記第１の複数の基準２Ｄ画像及び前記第１の複数のアセスメント２Ｄ画像に基づき、前記第１の複数の更新された仮想カメラポジションに夫々関連している第１の複数のアセスメントスコアを計算するステップと、
前記第１の複数のアセスメントスコアの加重平均されたアセスメントスコアを計算するステップと
を更に有する、請求項１に記載の方法。
前記第１の複数の更新された仮想カメラポジションは、前記３Ｄ空間内の球上に均等にサンプリングされるか、又は前記３Ｄ空間内の前記球上にランダムにサンプリングされる、
請求項４に記載の方法。
前記アセスメント中の３Ｄ表現は、前記基準３Ｄ表現のフレームに対応している複数のフレームを有し、
前記第１の複数の更新された仮想カメラポジションは、前記アセスメント中の３Ｄ表現の第１のフレーム及び前記基準３Ｄ表現の第１の対応するフレームを投影するために使用され、
当該方法は、前記複数の仮想カメラの第２の複数の更新された仮想カメラポジションを決定するステップを更に有し、
前記第２の複数の更新された仮想カメラポジションは、前記アセスメント中の３Ｄ表現の第２のフレーム及び前記基準３Ｄ表現の第２の対応するフレームを投影するために使用される、
請求項４に記載の方法。
カメラ移動経路に基づき前記複数の仮想カメラの前記第２の複数の更新された仮想カメラポジションを決定するステップを更に有する、
請求項６に記載の方法。
第１のカメラ移動経路に基づき前記第２の複数の更新された仮想カメラポジションの中で、前記複数の仮想カメラの中の第１の仮想カメラに関連した第１のポジションを決定するステップと、
第２のカメラ移動経路に基づき前記第２の複数の更新された仮想カメラポジションの中で、前記複数の仮想カメラの中の第２の仮想カメラに関連した第２のポジションを決定するステップと
を更に有する、請求項６に記載の方法。
前記第１の複数のアセスメントスコアの前記加重平均されたアセスメントスコアを計算するステップは、
前記アセスメント中の３Ｄ表現の投影に基づき、前記第１の複数のアセスメントスコアを重み付けする重みを決定するステップと、
前記重みに基づき前記加重平均されたアセスメントスコアを計算するステップと
を更に有する、
請求項４に記載の方法。
前記第１の複数のアセスメント２Ｄ画像において投影される有効なピクセルの各々の数と、
前記第１の複数の更新された仮想カメラポジションに対応する投影面までの前記アセスメント中の３Ｄ表現の各々の距離と
のうちの少なくとも１つに基づき、前記第１の複数のアセスメントスコアを重み付けする重みを決定することを更に有する、
請求項９に記載の方法。
前記アセスメント中の３Ｄ表現は、前記基準３Ｄ表現のフレームに対応している複数のフレームを有し、
前記第１の複数の更新された仮想カメラポジションは、前記アセスメント中の３Ｄ表現の第１のフレーム及び前記基準３Ｄ表現の第１の対応するフレームを投影するために使用され、
前記加重平均されたアセスメントスコアは、前記第１のフレームに対する第１のフレームレベルアセスメントスコアであり、
当該方法は、
前記第１の複数の更新された仮想カメラポジションに基づき、前記第１のフレームレベルアセスメントスコアを重み付けする第１のフレーム重みを決定するステップと、
前記複数のフレームに対する加重平均スコアである最終的なアセスメントスコアを計算するステップと
を有し、
前記第１のフレームレベルアセスメントスコアは、前記最終的なアセスメントスコアにおいて前記第１のフレーム重みによって重み付けされている、
請求項４に記載の方法。
前記第１のフレーム重みを決定するステップは、
前記第１の複数の更新された仮想カメラポジションの中のポジションの数と、
前記第１の複数の更新された仮想カメラポジションの中の前記ポジションと
のうちの少なくとも１つに基づき前記第１のフレーム重みを決定することを有する、
請求項１１に記載の方法。
前記アセスメントスコアは、ピーク信号対雑音比（ＰＳＮＲ）、構造類似性指数メトリック（ＳＳＩＭ）、視覚情報フィデリティ（ＶＩＦ）、ビデオマルチメソッドアセスメント融合（ＶＭＡＦ）、盲目／非参照型画像空間品質評価器（ＢＲＩＳＱＵＥ）、及び歪み識別に基づいた画像の真偽及び完全性の評価（ＤＩＩＶＩＮＥ）のうちの少なくとも１つを有する、
請求項１に記載の方法。
品質アセスメントのための装置であって、
請求項１乃至１３のうちいずれか一項に記載の方法を実行するよう構成される処理回路を有する装置。
コンピュータで実行される場合に、該コンピュータに、請求項１乃至１３のうちいずれか一項に記載の方法を実行させるプログラム。