WO2021193672A1

WO2021193672A1 - 三次元モデル生成方法及び三次元モデル生成装置

Info

Publication number: WO2021193672A1
Application number: PCT/JP2021/012093
Authority: WO
Inventors: 研翔寺西; 哲史吉川; 徹松延; 将貴福田
Original assignee: パナソニックＩｐマネジメント株式会社
Priority date: 2020-03-27
Filing date: 2021-03-23
Publication date: 2021-09-30
Also published as: US20230005216A1; EP4131166A4; EP4131166A1; JPWO2021193672A1

Abstract

情報処理装置によって実行される三次元モデル生成方法であって、被写体を複数の視点から撮影することで得られた複数の画像を取得し（Ｓ１０１）、複数の画像のうちの第１画像の第１の点に類似する類似点を、第１画像とは異なる第２画像における第１の点に基づく探索領域における複数の第２の点から探索し（Ｓ１１３）、第１の点と、複数の第２の点のそれぞれとの間の類似度を用いて、探索結果の精度を算出し（Ｓ１１４）、探索結果、および、精度を用いて三次元モデルを生成する（Ｓ１１５）。

Description

三次元モデル生成方法及び三次元モデル生成装置

　本開示は、三次元モデル生成方法及び三次元モデル生成装置に関する。

　特許文献１には、被写体を複数の視点から撮影することにより得られる複数の画像を用いて、被写体の三次元モデルを生成する技術が開示されている。

特開２０１７－１３０１４６号公報

　三次元モデルの生成処理には、三次元モデルの生成精度を向上させることが望まれている。

　本開示は、三次元モデルの生成精度を向上させることができる三次元モデル生成方法等を提供する。

　本開示の一態様に係る三次元モデル生成方法は、情報処理装置によって実行される三次元モデル生成方法であって、被写体を複数の視点から撮影することで得られた複数の画像を取得し、前記複数の画像のうちの第１画像の第１の点に類似する類似点を、前記第１画像とは異なる第２画像における前記第１の点に基づく探索領域における複数の第２の点から探索し、前記第１の点と、前記複数の第２の点のそれぞれとの間の類似度を用いて、探索結果の精度を算出し、前記探索結果、および、前記精度を用いて前記被写体の三次元モデルを生成する。

　また、本開示の一態様に係る三次元モデル生成装置は、メモリと、プロセッサとを備え、前記プロセッサは、前記メモリを用いて、被写体を複数の視点から撮影することで得られた複数の画像を取得し、前記複数の画像のうちの第１画像の第１の点に類似する類似点を、前記第１画像とは異なる第２画像における前記第１の点に基づく探索領域から探索し、前記第１の点と、前記探索領域における複数の第２の点のそれぞれとの間の類似度を用いて、前記第１の点に基づいて生成される三次元点の精度を算出し、前記探索の結果、および、前記精度を用いて前記被写体の三次元モデルを生成する。

　なお、本開示は、上記三次元モデル生成方法に含まれるステップをコンピュータに実行させるプログラムとして実現されてもよい。また、本開示は、そのプログラムを記録したコンピュータによって読み取り可能なＣＤ－ＲＯＭ等の非一時的な記録媒体として実現されてもよい。また、本開示は、そのプログラムを示す情報、データ又は信号として実現されてもよい。そして、それらプログラム、情報、データ及び信号は、インターネット等の通信ネットワークを介して配信されてもよい。

　本開示の三次元モデル生成方法などによれば、三次元モデルの生成精度を向上させることができる。

図１は、実施の形態に係る三次元モデル生成方法の概要を説明するための図である。図２は、実施の形態に係る三次元モデル生成装置の特徴的な構成を示すブロック図である。図３は、探索部による探索処理について説明するための図である。図４は、被写体と複数のフレームの関係を示す図である。図５は、第１精度が所定の精度よりも低い場合の例を示す図である。図６は、第１フレームにおいて第１精度が所定の精度よりも低くなりやすいエッジを示す図である。図７は、第１精度が所定の精度よりも高い場合の例を示す図である。図８は、第１フレームにおいて第１精度が所定の精度よりも高くなりやすいエッジを示す図である。図９は、三次元モデルの生成処理の第１の例について説明するための図である。図１０は、三次元モデルの生成処理の第２の例について説明するための図である。図１１は、三次元モデル生成装置の動作の一例を示すフローチャートである。図１２は、生成部によるステップＳ１０４の生成処理の詳細の一例を示すフローチャートである。図１３は、変形例における探索部による探索処理について説明するための図である。

　（本開示に至った経緯）
　特許文献１に開示されている技術では、複数の画像間における類似点を探索することで三次元モデルを生成する。一般に、類似点の探索では、一の画像の一の画素の類似点を他の画像から探索する場合、カメラの幾何制約から他の画像上のエピポーラ線が算出され、エピポーラ線上の複数の画素について探索が行われる。しかしながら、エピポーラ線上に同じようなテクスチャが並んでいる場合などのように、一の画素に類似している画素がエピポーラ線上に複数ある場合、探索の精度が低下するという課題がある。

　そこで、本開示では、三次元モデルの生成精度を向上させることができる三次元モデル生成方法等を提供する。

　これによれば、探索結果、および、当該探索結果の精度を用いて三次元モデルを生成するため、例えば、三次元モデルの生成に精度の低い探索結果を採用しない、あるいは、精度の高い探索結果を優先的に採用することで、三次元モデルの生成精度を向上させることができる。

　また、前記探索では、複数の前記第２画像のそれぞれについて前記類似点を探索し、前記精度の算出では、前記複数の第２画像にそれぞれ対応する複数の第１探索結果のそれぞれの第１精度を算出し、前記三次元モデルの生成では、前記複数の第１探索結果、および、前記複数の第１精度を用いて前記三次元モデルを生成してもよい。

　これによれば、複数の第１探索結果、および、複数の第１精度を用いて三次元モデルを生成するため、例えば、三次元モデルの生成に精度の低い第１探索結果を採用しない、あるいは、精度の高い第１探索結果を優先的に採用することで、より精度の高い三次元点を生成することができる。よって、三次元モデルの生成精度を向上させることができる。

　また、前記三次元モデルの生成では、算出された前記第１精度が所定の精度よりも小さい第２画像における前記第１探索結果を用いずに、前記三次元モデルを生成してもよい。

　これによれば、三次元モデルの生成に所定の閾値よりも精度の低い第１探索結果を採用しないため、より精度の高い三次元点を生成することができる。

　また、前記三次元モデルの生成では、前記複数の第２画像から、算出された前記第１精度が高い順にＮ（Ｎは１以上の整数）枚を選択し、選択したＮ枚の第２画像に対応するＮ個の第１探索結果を用いて前記三次元モデルを生成してもよい。

　これによれば、三次元モデルの生成に精度が高いＮ個の第１探索結果を優先的に採用するため、より精度の高い三次元点を生成することができる。

　また、前記三次元モデルの生成では、前記複数の第１探索結果に基づいて、前記複数の第１探索結果にそれぞれが対応する複数の三次元点を生成し、前記複数の三次元点を、対応する第１探索結果の第１精度が高いほど大きく重み付けされた加重平均を行うことで統合三次元点を生成し、生成した前記統合三次元点を含む前記三次元モデルを生成してもよい。

　これによれば、三次元モデルの生成において、複数の第１探索結果をそれぞれ用いて生成された複数の三次元点に対して、精度が高いほど大きく重み付けがされた加重平均を行うことで統合三次元点を生成するため、より精度の高い三次元点を生成することができる。

　また、前記探索は、複数の前記第１の点のそれぞれについて行われ、前記精度の算出では、前記複数の第１の点のそれぞれについて、前記複数の第１精度を算出し、前記三次元モデルの生成では、前記複数の第１の点のそれぞれについて、前記複数の第１探索結果、および、前記複数の第１精度を用いて三次元点を生成することで得られる複数の三次元点を含む三次元モデルを、前記三次元モデルとして生成してもよい。

　このため、複数の第１の点のそれぞれについて、より精度の高い三次元点を生成することができる。よって、三次元モデルの生成精度を向上させることができる。

　また、前記精度の算出では、前記複数の第１の点のそれぞれについて、当該第１の点について算出された前記複数の第１精度を示す複数の値の総和を当該第１の点に基づく探索結果の第２精度として算出し、前記三次元モデルの生成では、前記複数の三次元点と、前記複数の三次元点に対応する複数の前記第２精度とを含む三次元モデルを前記三次元モデルとして生成してもよい。

　このため、三次元モデルに含まれる複数の三次元点のそれぞれに、当該三次元点を生成したときに用いた複数の探索結果の複数の第１精度に基づく第２精度を対応付けることができる。

　また、前記三次元モデルの生成では、所定の精度より高い第２精度に対応する２つの高精度な三次元点の間の、前記所定の精度より低い第２精度に対応する１以上の低精度な三次元点を、前記２つの高精度な三次元点を基準にして補正してもよい。

　これによれば、例えば、低精度であるほど補正のための移動を許容する量を大きくして、高精度な三次元点を基準にして低精度な三次元点を補正することができるため、三次元モデルの生成精度を向上させることができる。

　また、前記探索領域は、前記第１の点に対応するエピポーラ線上の複数の画素により構成される領域であってもよい。

　このため、第１画素に類似する画素の候補を第２画像から効果的に選択することができる。

　本開示の一態様に係る三次元モデル生成装置は、メモリと、プロセッサとを備え、前記プロセッサは、前記メモリを用いて、被写体を複数の視点から撮影することで得られた複数の画像を取得し、前記複数の画像のうちの第１画像の第１の点に類似する類似点を、前記第１画像とは異なる第２画像における前記第１の点に基づく探索領域から探索し、前記第１の点と、前記探索領域における複数の第２の点のそれぞれとの間の類似度を用いて、前記第１の点に基づいて生成される三次元点の精度を算出し、前記探索の結果、および、前記精度を用いて前記被写体の三次元モデルを生成する。

　以下では、本開示に係る三次元モデル生成方法等の各実施の形態について、図面を用いて詳細に説明する。なお、以下に説明する各実施の形態は、いずれも本開示の一具体例を示すものである。したがって、以下の各実施の形態で示される数値、形状、構成要素、構成要素の配置及び接続形態、ステップ、ステップの順序等は、一例であり、本開示を限定する主旨ではない。

　また、各図は、模式図であり、必ずしも厳密に図示されたものではない。また、各図において、実質的に同一の構成に対しては同一の符号を付しており、重複する説明は省略又は簡略化する場合がある。

　（実施の形態）
　［概要］
　まず、図１を参照しながら、実施の形態に係る三次元モデル生成方法の概要について説明する。

　図１は、実施の形態に係る三次元モデル生成方法の概要を説明するための図である。図２は、実施の形態に係る三次元モデル生成装置１００の特徴的な構成を示すブロック図である。

　三次元モデル生成方法では、図１に示すように、複数の撮像装置３０１を用いて異なる複数の視点において撮影された複数の画像から所定の領域の三次元モデルを生成する。ここで、所定の領域は、静止している静止物体或いは人物等の動いている動体、又は、その両方を含む領域である。言い換えると、所定の領域は、例えば、静止している静止物体、及び、動いている動体のうち少なくとも一方を被写体として含む領域である。

　静止物体と動物体とを含む所定の領域の例として、バスケットボール等のスポーツの試合が行われている会場、又は、人物或いは車が存在する道路上の空間等がある。なお、所定の領域は、被写体となる特定の対象物だけではなく、風景等を含んでもよい。図１には、被写体５００が建屋である場合を例示している。また、以下では、被写体となる特定の対象物だけではなく、風景等を含む所定の領域を、単に被写体ともいう。

　三次元モデル生成システム４００は、図２に示すように、複数の撮像装置３０１を含む撮像装置群３００と、推定装置２００と、三次元モデル生成装置１００とを備える。

　（複数の撮像装置）
　複数の撮像装置３０１は、所定の領域を撮影する複数の撮像装置である。複数の撮像装置３０１は、それぞれ被写体を撮影し、撮影した複数のフレームをそれぞれ推定装置２００に出力する。本実施の形態では、撮像装置群３００には、２台以上の撮像装置３０１が含まれる。また、複数の撮像装置３０１は、互いに異なる視点から同一の被写体を撮影する。フレームは、言い換えると、画像である。

　なお、三次元モデル生成システム４００は、撮像装置群３００を備えるとしたが、これに限らずに、１台の撮像装置３０１を備えてもよい。例えば、三次元モデル生成システム４００では、実空間上に存在する被写体を、１台の撮像装置３０１を移動させながら１台の撮像装置３０１に互いに視点の異なる複数のフレームからなる多視点画像を生成させるように撮影させてもよい。複数のフレームのそれぞれは、撮像装置３０１の位置及び姿勢の少なくとも一方が互いに異なる撮像装置３０１により撮影（生成）されたフレームである。

　また、各撮像装置３０１は、二次元画像を生成するカメラでもよいし、三次元モデルを生成する三次元計測センサを備えるカメラでもよい。本実施の形態では、複数の撮像装置３０１は、それぞれ二次元画像を生成するカメラである。

　複数の撮像装置３０１は、それぞれが撮影したフレームを推定装置２００に出力できるように、有線通信又は無線通信によって、推定装置２００に直接接続されてもよいし、又は、通信機器若しくはサーバ等の図示しないハブを介して推定装置２００に間接的に接続されてもよい。

　なお、複数の撮像装置３０１でそれぞれ撮影されたフレームは、リアルタイムに推定装置２００に出力されてもよい。また。フレームは、一度メモリ又はクラウドサーバ等の外部記憶装置に記録された後、それらの外部記憶装置から推定装置２００に出力されてもよい。

　また、複数の撮像装置３０１は、それぞれ監視カメラ等の固定カメラであってもよいし、ビデオカメラ、スマートフォン、又は、ウェアラブルカメラ等のモバイルカメラであってもよいし、撮影機能付きドローン等の移動カメラであってもよい。

　（推定装置）
　推定装置２００は、１台以上の撮像装置３０１に複数の視点から被写体を撮影させることでカメラ校正を行う。推定装置２００は、例えば、複数の撮像装置３０１でそれぞれ撮影された複数のフレームに基づいて複数の撮像装置３０１の位置及び姿勢を推定するカメラ校正を行う。ここで、撮像装置３０１の姿勢とは、撮像装置３０１の撮影方向、及び、撮像装置３０１の傾きの少なくとも一方を示す。撮像装置３０１の撮影方向とは、撮像装置３０１の光軸の方向である。撮像装置３０１の傾きとは、基準姿勢からの撮像装置３０１の光軸周りの回転角度である。

　推定装置２００は、具体的には、複数の撮像装置３０１から取得した複数のフレームに基づいて、複数の撮像装置３０１のカメラパラメータを推定する。ここで、カメラパラメータとは、撮像装置３０１の特性を示すパラメータであり、撮像装置３０１の焦点距離及び画像中心等からなる内部パラメータと、撮像装置３０１の位置（より具体的には、三次元位置）及び姿勢を示す外部パラメータとを含む複数のパラメータである。つまり、複数の撮像装置３０１それぞれの位置及び姿勢は、複数の撮像装置３０１それぞれのカメラパラメータを推定することで得られる。

　なお、推定装置２００が撮像装置３０１の位置及び姿勢を推定する推定方法は、特に限定されない。推定装置２００は、例えば、Ｖｉｓｕａｌ－ＳＬＡＭ（Ｓｉｍｕｌｔａｎｅｏｕｓ　Ｌｏｃａｌｉｚａｔｉｏｎ　ａｎｄ　Ｍａｐｐｉｎｇ）技術を用いて複数の撮像装置３０１の位置及び姿勢を推定してもよい。或いは、推定装置２００は、例えば、Ｓｔｒｕｃｔｕｒｅ－Ｆｒｏｍ－Ｍｏｔｉｏｎ技術を用いて複数の撮像装置３０１の位置及び姿勢を推定してもよい。

　ここで、図３を用いて、推定装置２００による複数の撮像装置３０１の位置及び姿勢の推定方法について説明する。

　推定装置２００は、Ｖｉｓｕａｌ－ＳＬＡＭ技術またはＳｔｒｕｃｔｕｒｅ－Ｆｒｏｍ－Ｍｏｔｉｏｎ技術を用いて、複数の撮像装置３０１で撮影された複数のフレーム５３１～５３３のそれぞれから特徴的な点を特徴点として抽出し、抽出された複数の特徴点のうち、複数のフレーム間で類似する類似点の組を抽出する、特徴点の探索を行う。推定装置２００は、特徴点の探索を行うことで、複数のフレーム５３１～５３３に共通して映る被写体５１０上の点を特定することができるため、抽出した類似点の組を用いて被写体５１０上の点の三次元座標を三角測量の原理で求めることができる。

　このようにして、推定装置２００は、類似点の組を複数抽出し、複数の類似点の組を用いることで、各撮像装置３０１の位置及び姿勢を推定することができる。推定装置２００は、各撮像装置３０１の位置及び姿勢を推定する過程で、類似点の各組について三次元座標を算出し、算出した複数の三次元座標で示される複数の三次元点を含む三次元モデル５２０を生成してもよい。複数の三次元点のそれぞれは、三次元空間における被写体５１０上の位置を示す。推定装置２００は、各撮像装置３０１の位置及び姿勢と、マップ情報とを推定結果として得る。得られた三次元モデル５２０は、カメラパラメータとともに最適化処理されているため、所定の精度よりも精度が高い情報である。また、三次元モデル５２０は、複数の三次元点それぞれの三次元位置を含む。なお、三次元モデル５２０は、複数の三次元位置だけでなく、各三次元点の色、各三次元点の周辺の表面形状、各三次元点がどのフレームによって生成されたかを示す情報などを含んでいてもよい。

　また、推定装置２００は、推定処理を高速化するために、類似点の組の数を所定の数に制限することで、疎な三次元点群を含む三次元モデル５２０を生成してもよい。推定装置２００は、所定の数の類似点の組であっても、十分な精度で各撮像装置３０１の位置及び姿勢を推定することができるからである。なお、所定の数は、各撮像装置３０１の位置及び姿勢を十分な精度で推定することができる数に決定されていてもよい。また、推定装置２００は、類似点の組のうち所定の類似度以上で類似している組を用いて、各撮像装置３０１の位置及び姿勢を推定してもよい。この結果、推定装置２００は、推定処理に用いる類似点の組の数を、所定の類似度以上で類似している組の数に制限することができる。

　また、推定装置２００は、例えば、上記技術を用いて推定した撮像装置３０１の位置及び姿勢に基づいて、撮像装置３０１と被写体５１０との間の距離をカメラパラメータとして算出してもよい。なお、三次元モデル生成システム４００は、測距センサを備え、当該測距センサを用いて撮像装置３０１と被写体５１０との間の距離が測定されてもよい。

　推定装置２００は、有線通信又は無線通信によって、三次元モデル生成装置１００に直接接続されてもよいし、又は、通信機器或いはサーバ等の図示しないハブを介して推定装置２００に間接的に接続されてもよい。これにより、推定装置２００は、複数の撮像装置３０１から受信した複数のフレーム、及び、推定した複数の撮像装置３０１の複数のカメラパラメータを三次元モデル生成装置１００に出力する。

　なお、推定装置２００により推定されたカメラパラメータは、リアルタイムに三次元モデル生成装置１００に出力されてもよい。また、カメラパラメータは、一度メモリ又はクラウドサーバ等の外部記憶装置に記録された後、それらの外部記憶装置から三次元モデル生成装置１００に出力されてもよい。

　推定装置２００は、例えば、制御プログラムと、当該制御プログラムを実行するプロセッサ又は論理回路等の処理回路と、当該制御プログラムを記憶する内部メモリ又はアクセス可能な外部メモリ等の記録装置と、を備えるコンピュータシステムを少なくとも備える。

　（三次元モデル生成装置）
　三次元モデル生成装置１００は、複数の撮像装置３０１で撮影された複数のフレームと推定装置２００で推定されたカメラパラメータとに基づいて、所定の領域の三次元モデルを生成する。具体的には、三次元モデル生成装置１００は、複数の撮像装置３０１それぞれのカメラパラメータと、複数のフレームとに基づいて、被写体の三次元モデルを仮想的な三次元空間上に生成する三次元モデル生成処理を実行する装置である。

　なお、被写体の三次元モデルは、被写体の実物が撮影されたフレームから、仮想的な三次元空間上に復元された、被写体の三次元形状及び被写体の色を含むデータである。被写体の三次元モデルは、多視点の、つまり、異なる複数の視点において複数の撮像装置３０１で撮影された複数の二次元画像それぞれに写る被写体上の複数の点それぞれの三次元位置を示す点の集合である。

　三次元位置は、例えば、互いに直交するＸ軸、Ｙ軸、及び、Ｚ軸のそれぞれの位置を示すＸ成分、Ｙ成分、及び、Ｚ成分からなる三値情報で表される。なお、三次元位置を示す複数の点が含む情報には、三次元位置（つまり、座標を示す情報）だけでなく、各点の色を示す情報、各点及びその周辺の表面形状を表す情報等が含まれてもよい。このように、三次元位置の情報は、フレームの撮影視点と被写体との間の距離の情報以外の情報も含む。

　三次元モデル生成装置１００は、例えば、制御プログラムと、当該制御プログラムを実行するプロセッサ又は論理回路等の処理回路と、当該制御プログラムを記憶する内部メモリ又はアクセス可能な外部メモリ等の記録装置と、を備えるコンピュータシステムを少なくとも備える。三次元モデル生成装置１００は、情報処理装置である。三次元モデル生成装置１００の各処理部による機能は、ソフトウェアによって実現されてもよいし、ハードウェアによって実現されてもよい。

　また、三次元モデル生成装置１００は、予めカメラパラメータを記憶していてもよい。この場合、三次元モデル生成システム４００は、推定装置２００を備えなくてもよい。また、複数の撮像装置３０１は、三次元モデル生成装置１００と無線又は有線によって通信可能に接続されていてもよい。

　また、撮像装置３０１が撮影した複数のフレームは、三次元モデル生成装置１００に直接出力されてもよい。この場合、撮像装置３０１は、例えば、有線通信又は無線通信によって、三次元モデル生成装置１００に直接接続されてもよいし、又は、通信機器若しくはサーバ等の図示しないハブを介して三次元モデル生成装置１００に間接的に接続されてもよい。

　［三次元モデル生成装置の構成］
　続いて、図２を参照しながら、三次元モデル生成装置１００の構成の詳細について説明する。

　三次元モデル生成装置１００は、複数のフレームから三次元モデルを生成する装置である。三次元モデル生成装置１００は、受信部１１０と、記憶部１２０と、取得部１３０と、生成部１４０と、出力部１５０と、を備える。

　受信部１１０は、推定装置２００から、複数の撮像装置３０１が撮影した複数のフレームと、推定装置２００で推定されたカメラパラメータと、を受信する。これにより、受信部１１０は、第１視点から撮影された被写体の第１フレーム（第１画像）と、第２視点から撮影された被写体の第２フレーム（第２画像）とを取得する。つまり、受信部１１０により受信された複数のフレームは、第１フレームおよび第２フレームを含む。受信部１１０は、推定装置２００から三次元モデル５２０を取得してもよい。受信部１１０は、受信した複数のフレームと、カメラパラメータとを記憶部１２０に出力する。受信部１１０は、例えば、推定装置２００と通信するための通信インターフェースである。三次元モデル生成装置１００と推定装置２００とが無線通信する場合、受信部１１０は、例えば、アンテナと無線通信回路とを備える。或いは、三次元モデル生成装置１００と推定装置２００とが有線通信する場合、受信部１１０は、例えば、通信線に接続されるコネクタと有線通信回路とを備える。なお、受信部１１０は、推定装置２００を介さずに、複数のフレームを複数の撮像装置３０１から受信してもよい。

　記憶部１２０は、受信部１１０により受信された、複数のフレーム及びカメラパラメータを記憶する。記憶部１２０は、受信部１１０により受信された三次元モデル５２０を記憶してもよい。なお、記憶部１２０は、三次元モデル生成装置１００が備える各処理部の処理結果を記憶してもよい。記憶部１２０は、例えば、三次元モデル生成装置１００が備える各処理部が実行する制御プログラムを記憶する。記憶部１２０は、例えば、ＨＤＤ（Ｈａｒｄ　Ｄｉｓｋ　Ｄｒｉｖｅ）、フラッシュメモリ等により実現される。

　取得部１３０は、記憶部１２０に記憶されている、複数のフレームと、各撮像装置３０１のカメラパラメータとを、記憶部１２０から取得し、生成部１４０に出力する。

　なお、三次元モデル生成装置１００は、記憶部１２０及び取得部１３０を備えていなくてもよい。この場合、受信部１１０は、複数の撮像装置３０１から受信した複数のフレームと、推定装置２００から受信した各撮像装置３０１のカメラパラメータとを生成部１４０に出力してもよい。

　生成部１４０は、複数のフレームと、カメラパラメータとを用いて三次元モデルを生成する。生成部１４０は、探索部１４１と、算出部１４２と、モデル生成部１４３とを有する。

　探索部１４１は、複数のフレームのうちの第１フレームの第１の点に類似する類似点を、第２フレームにおける第１の点に基づく探索領域における複数の第２の点から探索する。第１の点は、具体的には、第１フレームを構成する複数の第１画素のうちの一の第１画素である。探索領域は、複数の第２フレームにおいて、第１フレームの第１の点に対応するエピポーラ線で規定される領域であり、例えば、エピポーラ線上の複数の第２の点により構成される領域である。複数の第２の点は、具体的には、探索領域に含まれる複数の第２画素である。なお、第１の点、および、第２の点のそれぞれは、特徴点であってもいいし、特徴点でなくてもよい。

　なお、探索部１４１は、第１フレームを構成する複数の第１画素のそれぞれについて、当該第１画素に類似する類似点（類似画素）を第２フレームの探索領域における複数の第２画素から探索してもよい。探索部１４１は、複数の第１画素のそれぞれについて、上記の類似点の探索を行ってもよいし、１つの第１画素について上記類似点の探索を行ってもよい。また、探索部１４１は、複数の第２フレームのそれぞれについて上記の類似点の探索を行ってもよい。探索部１４１は、複数の第２フレームのそれぞれについて上記の類似点の探索を行ってもよいし、１つの第２フレームについて上記の類似点の探索を行ってもよい。

　図３は、探索部１４１による探索処理について説明するための図である。図３では、第１視点Ｖ１の撮像装置３０１により被写体５１０を含む第１フレーム５３１が撮像され、第２視点Ｖ２の撮像装置３０１により被写体５１０を含む第２フレーム５３２が撮像され、第３視点Ｖ３の撮像装置３０１により被写体５１０を含む第２フレーム５３３が撮像された例を示している。

　探索部１４１は、第１画素毎に、第１フレームを撮像した撮像装置３０１の位置と、当該第１画素の第１フレーム上の二次元座標とを結ぶ直線が、処理対象の第２フレームに投影されたエピポーラ線を算出する。例えば、探索部１４１は、図３に示すように、第１視点Ｖ１と、第１画素５４１とを結ぶ直線Ｌ１が、第２フレーム５３２に投影されたエピポーラ線５５２を算出する。また、探索部１４１は、直線Ｌ１が第２フレーム５３３に投影されたエピポーラ線５５３を算出する。そして、探索部１４１は、第１フレーム５３１における処理対象の第１画素５４１に類似する類似点を、第２フレーム５３２、５３３のエピポーラ線５５２、５５３上からそれぞれ探索する。

　算出部１４２は、第１画素と、探索領域における複数の第２画素のそれぞれとの間の類似度を用いて、探索結果の精度を算出する。探索結果の精度とは、例えば、探索領域において探索された類似点（第１画素に類似する第２画素）の確からしさに対応する。探索結果の精度が高ければ高いほど、類似点の確からしさは高くなる。類似点の確からしさは、類似点の類似度と異なる。例えば、類似度が高くても、探索領域に類似度が高い複数の第２画素が存在すれば、類似点の確からしさは低くなる。すなわち、類似点の確からしさは、類似点以外の第２画素の類似度に影響される。

　算出部１４２は、第１フレームと、処理対象の第２フレームとの間で小領域間のＮｏｒｍａｌｉｚｅｄ　Ｃｒｏｓｓ　Ｃｏｒｒｅｌａｔｉｏｎ（ＮＣＣ）を示すＮ（Ｉ，Ｊ）を、類似度として式１を用いて算出する。Ｎ（Ｉ，Ｊ）は、－１から１の間の数値で表され、１に近づくほど類似度が高いことを示す。

　算出部１４２は、第１画素と、探索領域における複数の第２画素のそれぞれとの間の類似度を算出するため、複数の類似度を算出する。算出部１４２は、１つの探索領域について算出された複数の類似度の総和である第１の総和を式２を用いて算出する。第１の総和は、探索結果の精度の一例である第１精度に対応する。第１の総和が小さければ小さいほど、第１精度は高くなる。算出部１４２は、第１画素に類似する類似点を探索し、第１精度を、探索の対象となる複数の第２フレームのそれぞれについて算出する。第１精度は、処理対象の第２フレームの探索領域の複数の第２画素から第１画素の類似点を探索した際の精度を示す。

　なお、式２において、（Ｉ，Ｊ）は、第１フレームにおける第１画素の座標を示す。また、（Ｘ，Ｙ）は、処理対象の第２フレームにおけるエピポーラ線の始点の座標を示し、（Ｓ，Ｔ）は、処理対象の第２フレームにおけるエピポーラ線の終点の座標を示す。ｉは、参照する第２フレームを特定するためのフレーム番号を示す。

　なお、式２による第１の総和には、第１閾値Ｔｈ１を超えるＮ（Ｉ，Ｊ）のみを含めてもよい。

　次に、算出部１４２による算出処理の具体例について図４～図８を用いて説明する。

　図４は、被写体５１０と複数のフレーム５６１～５６３の関係を示す図である。図４は、撮像した複数の撮像装置３０１の光軸が互いに平行である例を示す。なお、説明の便宜上、複数の撮像装置３０１の光軸が互いに平行である例を示しているのであって、複数の撮像装置３０１の光軸が互いに平行であることには限定されない。

　図５は、第１フレーム５６１において第１精度が所定の精度よりも低い場合の例を示す図である。つまり、図５は、式２を用いて算出された第１の総和が第２閾値Ｔｈ２（図示されない）を超える場合の例を示す。このように、第１の総和が第２閾値Ｔｈ２を超える場合、算出部１４２は、第１画素５７１に対して探索される第２画素の探索の精度を所定の精度より低いと判定してもよい。以下、具体的に説明する。

　図５の（ａ）～（ｃ）は、それぞれ、第１フレーム５６１、第２フレーム５６２および第２フレーム５６３を示す図である。図５の（ｄ）は、第１フレーム５６１の第１画素５７１に類似する画素の探索対象となる第２フレーム５６２のエピポーラ線５７２上の複数の第２画素と、第１画素５７１と当該複数の第２画素との間の類似度（マッチングスコア）との関係を示すグラフである。図５の（ｄ）に示されるグラフの横軸は、エピポーラ線上の第２画素の位置を示し、縦軸は、第２画素のスコア（類似度）を示す。エピポーラ線５７２は、第１フレーム５６１を撮像した撮像装置３０１の位置と第１画素５７１（あるいは第１画素５７１に対応する三次元空間上の被写体の点）とを結ぶ直線が第２フレーム５６２に投影された直線である。図５の（ｅ）は、第１フレーム５６１の第１画素５７１に類似する画素の探索対象となる第２フレーム５６３のエピポーラ線５７３上の複数の第２画素と、第１画素５７１と当該複数の第２画素との間の類似度（マッチングスコア）との関係を示すグラフである。エピポーラ線５７３は、第１フレーム５６１を撮像した撮像装置３０１の位置と第１画素５７１（あるいは第１画素５７１に対応する三次元空間上の被写体の点）とを結ぶ直線が第２フレーム５６３に投影された直線である。なお、図５の（ｄ）および（ｅ）では、類似度（マッチングスコア）のことを単にスコアと表記する。

　図５の（ｂ）および（ｃ）に示されるように、第１画素５７１に対応するエピポーラ線５７２、５７３上には、第１画素５７１に類似する画素が多く（例えば、所定数以上）並んでいるため、第１閾値Ｔｈ１を超えるマッチングスコアを有する第２画素が多く（例えば、所定数以上）含まれる。例えば、エピポーラ線５７２、５７３が第２フレーム５６２、５６３のエッジ上に沿っている場合に、第１閾値Ｔｈ１を超えるマッチングスコアを有する第２画素がエピポーラ線５７２、５７３に多く含まれやすくなる。例えば、図６において破線で示すようなエッジがエピポーラ線に沿う場合、第１閾値Ｔｈ１を超えるマッチングスコアを有する第２画素が多く（例えば、所定数以上）含まれやすくなる。

　なお、算出部１４２は、マッチングスコアが第１閾値Ｔｈ１を超える第２画素を、第１画素５７１に類似する類似点であると判定することとしてもよい。

　また、図５の（ｄ）に示されるグラフの横軸は、説明のために、第２画素の位置を示したが、第１の総和の算出に第２画素の位置は必須ではない。

　図７は、第１フレーム５６１において第１精度が所定の精度以上となる場合の例を示す図である。つまり、図７は、式２を用いて算出された第１の総和が第２閾値Ｔｈ２以下である場合の例を示す。このように、第１の総和が第２閾値Ｔｈ２以下の場合、算出部１４２は、第１画素５７１に対して探索される第２画素の探索の精度を所定の精度以上と判定してもよい。以下、具体的に説明する。

　図７の（ａ）～（ｃ）は、それぞれ、第１フレーム５６１、第２フレーム５６２および第２フレーム５６３を示す図である。図７の（ｄ）は、第１フレーム５６１の第１画素５７４に類似する画素の探索対象となる第２フレーム５６２のエピポーラ線５７５上の複数の第２画素と、第１画素５７４と当該複数の第２画素との間の類似度（マッチングスコア）との関係を示すグラフである。エピポーラ線５７５は、第１フレーム５６１を撮像した撮像装置３０１の位置と第１画素５７４（あるいは第１画素５７４に対応する三次元空間上の被写体の点）とを結ぶ直線が第２フレーム５６２に投影された直線である。図７の（ｅ）は、第１フレーム５６１の第１画素５７４に類似する画素の探索対象となる第２フレーム５６３のエピポーラ線５７６上の複数の第２画素と、第１画素５７４と当該複数の第２画素との間の類似度（マッチングスコア）との関係を示すグラフである。エピポーラ線５７６は、第１フレーム５６１を撮像した撮像装置３０１の位置と第１画素５７４（あるいは第１画素５７４に対応する三次元空間上の被写体の点）とを結ぶ直線が第２フレーム５６３に投影された直線である。なお、図７の（ｄ）および（ｅ）では、類似度（マッチングスコア）のことを単にスコアと表記する。

　図７の（ｂ）および（ｃ）に示されるように、第１画素５７４に対応するエピポーラ線５７５、５７６上には、第１画素５７４に類似する画素が少ない（例えば、所定数未満）ため、第１閾値Ｔｈ１を超えるマッチングスコアを有する第２画素が少ない（例えば、所定数未満）。例えば、エピポーラ線５７５、５７６が第２フレーム５６２、５６３のエッジと交差している場合に、第１閾値Ｔｈ１を超えるマッチングスコアを有する第２画素の数が少なくなりやすくなる。例えば、図８において破線で示すようなエッジがエピポーラ線に交差する場合、第１閾値Ｔｈ１を超えるマッチングスコアを有する第２画素が少なく（例えば、所定数未満）なりやすくなる。

　図５および図７を用いて説明したように、第１の総和が大きくなるほど、第１画素に類似する第２画素の数が多くなるため、誤った第２画素を第１画素にマッチングさせてしまう可能性が高くなる。反対に、第１の総和が小さくなるほど、第１画素に類似する第２画素の数が少なくなるため、適切な第２画素を第１画素にマッチングさせる可能性が高くなる。このため、第１の総和は、値が大きいほど探索の精度が低いことを示す指標として利用することができる。

　なお、第１精度は、第１の総和の逆数であってもよいし、所定の固定値から第１の総和が減算された値であってもよい。

　なお、算出部１４２は、第１の総和が第２閾値Ｔｈ２以下の場合であっても、マッチングスコアが第１閾値Ｔｈ１を超える第２画素がない場合、探索の精度を所定の精度より低いと判定してもよい。これは、エピポーラ線上に第１画素に類似する類似点がないからである。

　図２に戻り、算出部１４２は、第１の総和を、複数の第２フレーム毎に算出する。このため、１つの第１画素について、複数の第１の総和が得られる。算出部１４２は、１つの第１画素について得られた複数の第１の総和の総和である第２の総和を式３を用いて算出する。第２の総和は、探索結果の精度の一例である第２精度に対応する。第２精度は、処理対象の複数の第１画素の類似点を複数の第２フレームから探索した際の精度を示す。

　ｎは、参照する複数の第２フレームの枚数を示す。

　算出部１４２は、第１フレームの全ての第１画素のそれぞれについて、複数の第１の総和を算出する。そして、算出部１４２は、複数の第１の総和を用いて第２の総和を算出する。第２の総和は、値が大きいほど第２精度が低いことを示す指標として利用することができる。

　なお、第２精度は、第２の総和の逆数であってもよいし、所定の固定値から第２の総和が減算された値であってもよい。

　なお、式２により得られた第１の総和が０の場合には、式３による第２の総和の算出に、当該第１の総和を含めなくてもよい。

　モデル生成部１４３は、探索部１４１による探索結果、および、算出部１４２により算出された精度を用いて三次元モデルを生成する。具体的には、モデル生成部１４３は、複数の第２フレームにそれぞれに対して行われた探索の結果である複数の第１探索結果、および、複数の第１精度を用いて三次元モデルを生成する。なお、モデル生成部１４３は、複数の第１画素のそれぞれについて、複数の第１探索結果、および、複数の第１精度を用いて三次元点を生成することで得られる複数の三次元点を含む三次元モデルを生成する。

　図９は、三次元モデルの生成処理の第１の例について説明するための図である。

　例えば、モデル生成部１４３は、算出された第１精度を示す第１の総和が第２閾値Ｔｈ２よりも大きい、つまり、第１精度が所定の精度より低い第２フレームにおける第１探索結果を用いずに、三次元モデルを生成してもよい。モデル生成部１４３は、図９に示すように、第２閾値Ｔｈ２よりも大きい精度Ａ１（第２フレーム５３２について算出された第１の総和）の第２フレーム５３２における第１探索結果を用いずに、第２閾値Ｔｈ２以下の精度Ａ２（第２フレーム５３３について算出された第１の総和）の第２フレーム５３３における第１探索結果を用いて三次元点５２２を生成する。このように、モデル生成部１４３は、精度が低いと判定された第１探索結果を除外して、他の第１探索結果により類似点として選択された複数の第２画素のそれぞれと、第１画素との複数の組を用いて被写体５１０上の点の三次元座標で示される三次元点５２２を三角測量の原理で算出する。モデル生成部１４３は、例えば、図９に示すように、第１視点Ｖ１および第１画素５４１を結ぶ直線Ｌ１と、第３視点Ｖ３および第２画素５４３を結ぶ直線Ｌ３との交点を三次元点５２２として生成する。

　また、例えば、モデル生成部１４３は、複数の第２フレームから、算出された第１精度が高い順にＮ（Ｎは１以上の整数）枚を選択し、選択したＮ枚の第２フレームに対応するＮ個の第１探索結果を用いて三次元モデルを生成してもよい。モデル生成部１４３は、精度が高い順に選択されたＮ個の第１探索結果を用いて、類似点として選択された複数の第２画素のそれぞれと、第１画素との複数の組を用いて被写体５１０上の点の三次元座標で示される三次元点を三角測量の原理で算出する。

　なお、１つの第１画素について複数の三次元点が算出された場合、モデル生成部１４３は、複数の三次元点の平均を算出することで１つの第１画素に対応する１つの三次元点を生成してもよい。第２閾値Ｔｈ２は、所定の精度の一例である。このように、三次元モデルの生成処理に第２閾値Ｔｈ２よりも大きい第１探索結果を採用しないため、より精度の高い三次元点を生成することができる。

　第１の例におけるこれらの２つの例では、三次元モデルの生成処理に精度が高いＮ個の第１探索結果を優先的に採用するため、より精度の高い三次元点を生成することができる。

　図１０は、三次元モデルの生成処理の第２の例について説明するための図である。

　例えば、モデル生成部１４３は、複数の第１探索結果に基づいて、複数の第１探索結果にそれぞれが対応する複数の三次元点を生成する。具体的には、モデル生成部１４３は、複数の第２フレームのそれぞれについて、第１画素と第１画素に類似する第２画素との組を求める。そして、モデル生成部１４３は、１つの組から１つの三次元点を生成することで、複数の三次元点を生成する。そして、モデル生成部１４３は、複数の三次元点を、対応する第１探索結果の第１精度が高いほど大きく重み付けされた加重平均を行うことで統合三次元点を生成し、生成した統合三次元点を含む三次元モデルを生成してもよい。上記の第１の例では、精度が高い第１探索結果を優先的に採用する例であったが、第２の例では、図１０に示すように、全ての第１探索結果に基づいて類似点として選択された複数の第２画素５４２、５４３のそれぞれと、第１画素５４１との複数の組を用いて、被写体５１０上の点の三次元座標で示される三次元点５２１、５２２を三角測量の原理で算出する。モデル生成部１４３は、例えば、図１０に示すように、第１視点Ｖ１および第１画素５４１を結ぶ直線Ｌ１と、第２視点Ｖ２および第２画素５４２を結ぶ直線Ｌ２との交点を三次元点５２１として生成し、直線Ｌ１と第３視点Ｖ３および第２画素５４３を結ぶ直線Ｌ３との交点を三次元点５２２として生成する。そして、三次元モデルの生成において、複数の第１探索結果をそれぞれ用いて生成された複数の三次元点５２１、５２２に対して、精度が高いほど大きく重み付けがされた加重平均を行うことで統合三次元点を生成する。このため、精度が高い三次元点の成分が多く含まれるように複数の三次元点を統合することができ、より精度の高い三次元点を生成することができる。

　また、モデル生成部１４３は、複数の三次元点と、複数の三次元点にそれぞれが対応する複数の第２精度とを含む三次元モデルを生成してもよい。このため、三次元モデルに含まれる複数の三次元点のそれぞれに、当該三次元点を生成したときに用いた複数の探索結果の複数の第１精度に基づく第２精度を対応付けることができる。

　これにより、例えば、モデル生成部１４３は、三次元モデルを、第２精度を重みとしてフィルタリング（平滑化）することができる。具体的には、モデル生成部１４３は、所定の精度より大きい第２精度に対応する２つの高精度な三次元点の間の、所定の精度以下の第２精度に対応する１以上の低精度な三次元点を、２つの高精度な三次元点を基準にして補正してもよい。これによれば、例えば、低精度であるほど補正のための移動を許容する量を大きくして、高精度な三次元点を基準にして低精度な三次元点を補正することができるため、三次元モデルの生成精度を向上させることができる。

　［三次元モデル生成装置の動作］
　次に、三次元モデル生成装置１００の動作について、図１１を用いて説明する。図１１は、三次元モデル生成装置１００の動作の一例を示すフローチャートである。

　まず、三次元モデル生成装置１００では、受信部１１０が、推定装置２００から、複数の撮像装置３０１が撮影した複数のフレームと、各撮像装置３０１のカメラパラメータとを受信する（Ｓ１０１）。ステップＳ１０１は、複数の画像を取得するステップの一例である。なお、受信部１１０は、複数のフレームと、カメラパラメータとを１タイミングで受信しなくてもよく、それぞれを異なるタイミングで受信してもよい。つまり、複数のフレームの取得と、カメラパラメータの取得とは、互いに同じタイミングで行われてもよいし、互いに異なるタイミングで行われてもよい。

　次に、記憶部１２０は、受信部１１０により受信された、複数の撮像装置３０１が撮影した複数のフレームと、各撮像装置３０１のカメラパラメータとを記憶する（Ｓ１０２）。

　次に、取得部１３０は、記憶部１２０に記憶されている複数のフレームとカメラパラメータとを取得し、取得した複数のフレームとカメラパラメータとを生成部１４０に出力する（Ｓ１０３）。

　次に、生成部１４０は、複数のフレームとカメラパラメータとを用いて三次元モデルを生成する（Ｓ１０４）。なお、三次元モデルを生成するステップＳ１０４の詳細は、図１２を用いて後述する。

　そして、出力部１５０は、生成部１４０において生成された三次元モデルを出力する（Ｓ１０５）。

　図１２は、生成部１４０によるステップＳ１０４の生成処理の詳細の一例を示すフローチャートである。

　生成部１４０は、互いに対応するタイミングで撮影された多視点画像のフレームセット毎のループ１を行う（Ｓ１１１）。ループ１では、フレームセット毎にループ２を行う。

　生成部１４０は、処理対象のフレームセットのうちの第１フレームの第１画素毎のループ２を行う（Ｓ１１２）。ループ２では、第１画素毎にステップＳ１１３～ステップＳ１１５の処理を行う。

　探索部１４１は、処理対象の第１画素について、処理対象のフレームセットのうちの複数の第２フレーム上で当該第１画素に対応するエピポーラ線上の複数の第２画素から、当該第１画素に類似する類似点を探索する（Ｓ１１３）。ステップＳ１１３の詳細は、探索部１４１の説明において記載したため省略する。

　算出部１４２は、複数の第２フレームのそれぞれについて、処理対象の第１画素に類似する類似点の探索の第１精度を算出する（Ｓ１１４）。ステップＳ１１４の詳細は、算出部１４２の説明において記載したため省略する。

　モデル生成部１４３は、ステップＳ１１３により得られた複数の第１探索結果と、ステップＳ１１４により得られた複数の第１精度とを用いて三次元モデルを生成する（Ｓ１１５）。ステップＳ１１５の詳細は、モデル生成部１４３の説明において記載したため省略する。

　ループ２は、処理対象のフレームセットの第１フレームに含まれる全ての第１画素についてステップＳ１１３～Ｓ１１５の処理が終了すると終了する。

　ループ１は、全てのフレームセットについてループ２が終了すると終了する。

　［効果等］
　本実施の形態に係る三次元モデル生成方法は、情報処理装置によって実行される三次元モデル生成方法であって、被写体を複数の視点から撮影することで得られた複数のフレームを取得し（Ｓ１０１）、複数のフレームのうちの第１フレームの第１画素に類似する類似点を、第１フレームとは異なる第２フレームにおける第１画素に基づく探索領域における複数の第２画素から探索し（Ｓ１１３）、第１画素と、複数の第２画素のそれぞれとの間の類似度を用いて、探索結果の精度を算出し（Ｓ１１４）、探索結果、および、精度を用いて三次元モデルを生成する（Ｓ１１５）。

　また、本実施の形態に係る三次元モデル生成方法において、探索（Ｓ１１３）では、複数の第２フレームのそれぞれについて類似点を探索する。精度の算出（Ｓ１１４）では、複数の第２フレームにそれぞれ対応する複数の第１探索結果のそれぞれの第１精度を算出する。被写体の三次元モデルの生成（Ｓ１１５）では、複数の第１探索結果、および、複数の第１精度を用いて三次元モデルを生成する。

　また、本実施の形態に係る三次元モデル生成方法において、三次元モデルの生成（Ｓ１１５）では、算出された精度が所定の精度よりも小さい第２フレームにおける第１探索結果を用いずに、三次元モデルを生成してもよい。これによれば、三次元モデルの生成に所定の閾値よりも精度の低い第１探索結果を採用しないため、より精度の高い三次元点を生成することができる。

　また、本実施の形態に係る三次元モデル生成方法において、三次元モデルの生成（Ｓ１１５）では、複数の第２フレームから、算出された第１精度が高い順にＮ（Ｎは１以上の整数）枚を選択し、選択したＮ枚の第２フレームに対応するＮ個の第１探索結果を用いて三次元モデルを生成してもよい。これによれば、三次元モデルの生成に精度が高いＮ個の第１探索結果を優先的に採用するため、より精度の高い三次元点を生成することができる。

　また、本実施の形態に係る三次元モデル生成方法において、三次元モデルの生成（Ｓ１１５）では、複数の第１探索結果に基づいて、複数の第１探索結果にそれぞれが対応する複数の三次元点を生成し、複数の三次元点を、対応する第１探索結果の第１精度が高いほど大きく重み付けされた加重平均を行うことで統合三次元点を生成し、生成した統合三次元点を含む三次元モデルを生成する。これによれば、三次元モデルの生成において、複数の第１探索結果をそれぞれ用いて生成された複数の三次元点に対して、精度が高いほど大きく重み付けがされた加重平均を行うことで統合三次元点を生成するため、より精度の高い三次元点を生成することができる。

　また、本実施の形態に係る三次元モデル生成方法において、探索（Ｓ１１３）は、複数の第１画素のそれぞれについて行われる。精度の算出（Ｓ１１４）では、複数の第１画素のそれぞれについて、複数の第１精度を算出する。三次元モデルの生成（Ｓ１１５）では、複数の第１画素のそれぞれについて、複数の第１探索結果、および、複数の第１精度を用いて三次元点を生成することで得られる複数の三次元点を含む三次元モデルを、三次元モデルとして生成する。このため、複数の第１画素のそれぞれについて、より精度の高い三次元点を生成することができる。よって、三次元モデルの生成精度を向上させることができる。

　また、本実施の形態に係る三次元モデル生成方法において、精度の算出（Ｓ１１４）では、複数の第１画素のそれぞれについて、当該第１画素について算出された複数の第１精度を示す複数の値（つまり、マッチングスコア）の総和を当該第１の点に基づく探索結果の第２精度として算出する。三次元モデルの生成（Ｓ１１５）では、複数の三次元点と、第２精度とを含む三次元モデルを三次元モデルとして生成する。このため、三次元モデルに含まれる複数の三次元点のそれぞれに、当該三次元点を生成したときに用いた複数の探索結果の複数の第１精度に基づく第２精度を対応付けることができる。

　また、本実施の形態に係る三次元モデル生成方法において、三次元モデルの生成（Ｓ１１５）では、所定の精度より高い第２精度に対応する２つの高精度な三次元点の間の、所定の精度以下の第２精度に対応する１以上の低精度な三次元点を、２つの高精度な三次元点を基準にして補正する。これによれば、例えば、低精度であるほど補正のための移動を許容する量を大きくして、高精度な三次元点を基準にして低精度な三次元点を補正することができるため、三次元モデルの生成精度を向上させることができる。

　また、本実施の形態に係る三次元モデル生成方法において、探索領域は、第１画素に対応するエピポーラ線上の複数の第２画素により構成される領域である。このため、第１画素に類似する画素の候補を第２画像から効果的に選択することができる。

　［変形例１］
　また、上記実施の形態に係る三次元モデル生成方法は、探索結果の精度を算出することで、被写体の三次元モデルを生成したが、探索結果の精度を算出することは省略されてもよい。例えば、変形例１に係る三次元モデル生成方法は、情報処理装置によって実行される。変形例１に係る三次元モデル生成方法は、被写体を第１視点から撮影することで得られた第１画像と、前記被写体を第２視点から撮影することで得られた第２画像と、を取得し、前記第１画像の第１の点に類似する類似点を探索するために、前記第１の点に基づいて前記第２画像の探索領域を特定し、前記探索領域の複数の第２の点のそれぞれと前記第１の点とが類似する度合いを示す類似度を算出することで、前記探索領域において前記類似点を探索し、前記探索の結果、および、算出された複数の類似度のばらつきに基づいて前記被写体の三次元モデルを生成する。

　例えば、図７の（ｄ）に示されるグラフにおける複数の類似度は、図５（ｄ）に示されるグラフにおける複数の類似度よりも、局所的に分布している。言い換えれば、図７の（ｄ）に示されるグラフにおける複数の類似度は、図５の（ｄ）に示されるグラフにおける複数の類似度に比べて、ばらつきが大きく、標準偏差が大きい。そこで、算出部１４２は、例えば、複数の類似度の標準偏差を算出する。そして、モデル生成部１４３は、算出された標準偏差が所定の閾値以上で、かつ、最も大きい類似度が所定の閾値以上の場合、最も大きい類似度を有する第２画素（類似点）を三次元モデル生成に用いる。また、モデル生成部１４３は、算出された標準偏差が所定に閾値未満の場合、最も大きい類似度を有する第２画素を三次元モデルに用いない。なお、複数の類似度のばらつきを示す指標は、標準偏差に限らない。

　［その他の変形例］
　上記実施の形態および変形例１に係る三次元モデル生成方法では、ＮＣＣを類似度（マッチングスコア）として算出したがこれに限らない。例えば、第１フレームと、処理対象の第２フレームとの間で小領域間の画素値の差分の二乗和であるＳＳＤ（Ｓｕｍ　ｏｆ　Ｓｑｕａｒｅｄ　Ｄｉｆｆｅｒｅｎｃｅ）を示すＳＳＤ（Ｉ，Ｊ）を類似度として式４を用いて算出してもよい。ＳＳＤ（Ｉ，Ｊ）は、値が小さくなるほど類似度が高いことを示す。

　上記実施の形態および変形例１に係る三次元モデル生成方法では、探索領域を複数の第２フレームにおいて、第１フレームの第１の点（第１画素）に対応するエピポーラ線で規定される領域であるとしたがこれに限らない。例えば、探索部１４１は、図１３に示すように、複数の第２フレーム５３２、５３３のそれぞれを撮像した撮像装置３０１の位置および姿勢と、事前に取得された既知の三次元モデル５１３（三次元点群）との関係から、第１フレーム５３１の第１画素５８１に対応する、複数の第２フレーム５３２、５３３のそれぞれにおける第３画素５８２、５８３を特定する。そして、探索部１４１は、第３画素５８２、５８３を基準とした第３画素５８２、５８３を含む領域を、探索領域５９２、５９３として決定してもよい。探索部１４１は、例えば、第３画素５８２、５８３を中心とした矩形の領域を探索領域５９２、５９３として決定してもよい。なお、探索領域は、矩形に限らずに、正方形、円形など他の特定の形状の領域であってもよい。なお、事前に取得された既知の三次元モデル５１３は、図３を用いて説明した推定装置２００により生成された三次元モデル５２０であってもよい。

　以上、本開示に係る三次元モデル生成方法等について、上記各実施の形態に基づいて説明したが、本開示は、上記各実施の形態に限定されるものではない。

　例えば、上記実施の形態および変形例では、三次元モデル生成装置等が備える各処理部は、ＣＰＵと制御プログラムとによって実現されると説明した。例えば、当該処理部の構成要素は、それぞれ１つ又は複数の電子回路で構成されてもよい。１つ又は複数の電子回路は、それぞれ、汎用的な回路でもよいし、専用の回路でもよい。１つ又は複数の電子回路には、例えば、半導体装置、ＩＣ（Ｉｎｔｅｇｒａｔｅｄ　Ｃｉｒｃｕｉｔ）、又は、ＬＳＩ（Ｌａｒｇｅ　Ｓｃａｌｅ　Ｉｎｔｅｇｒａｔｉｏｎ）等が含まれてもよい。ＩＣ又はＬＳＩは、１つのチップに集積されてもよく、複数のチップに集積されてもよい。ここでは、ＩＣ又はＬＳＩと呼んでいるが、集積の度合いによって呼び方が変わり、システムＬＳＩ、ＶＬＳＩ（Ｖｅｒｙ　Ｌａｒｇｅ　Ｓｃａｌｅ　Ｉｎｔｅｇｒａｔｉｏｎ）、又は、ＵＬＳＩ（Ｕｌｔｒａ　Ｌａｒｇｅ　Ｓｃａｌｅ　Ｉｎｔｅｇｒａｔｉｏｎ）と呼ばれるかもしれない。また、ＬＳＩの製造後にプログラムされるＦＰＧＡ（Ｆｉｅｌｄ　Ｐｒｏｇｒａｍｍａｂｌｅ　Ｇａｔｅ　Ａｒｒａｙ）も同じ目的で使うことができる。

　また、本開示の全般的又は具体的な態様は、システム、装置、方法、集積回路、又は、コンピュータプログラムで実現されてもよい。或いは、当該コンピュータプログラムが記憶された光学ディスク、ＨＤＤ（Ｈａｒｄ　Ｄｉｓｋ　Ｄｒｉｖｅ）若しくは半導体メモリ等のコンピュータ読み取り可能な非一時的記録媒体で実現されてもよい。また、システム、装置、方法、集積回路、コンピュータプログラム及び記録媒体の任意な組み合わせで実現されてもよい。

　その他、各実施の形態に対して当業者が思いつく各種変形を施して得られる形態や、本開示の趣旨を逸脱しない範囲で実施の形態における構成要素及び機能を任意に組み合わせることで実現される形態も本開示に含まれる。

　本開示は、三次元モデル生成装置又は三次元モデル生成システムに適用でき、例えば、フィギュア作成、地形若しくは建物の構造認識、人物の行動認識、又は、自由視点映像の生成等に適用できる。

　１００　　三次元モデル生成装置
　１１０　　受信部
　１２０　　記憶部
　１３０　　取得部
　１４０　　生成部
　１４１　　探索部
　１４２　　算出部
　１４３　　モデル生成部
　１５０　　出力部
　２００　　推定装置
　３００　　撮像装置群
　３０１　　撮像装置
　４００　　三次元モデル生成システム
　５００、５１０　　被写体
　５１１、５２０　　三次元モデル
　５２１、５２２　　三次元点
　５３１、５６１　　第１フレーム
　５３２、５３３、５６２、５６３　　第２フレーム
　５４１、５７１、５７４、５８１　　第１画素
　５４２、５４３　　第２画素
　５５２、５５３、５７２、５７３、５７５、５７６　　エピポーラ線
　５８２、５８３　　第３画素
　５９２、５９３　　探索領域
　Ｌ１～Ｌ３　　直線
　Ｖ１　　第１視点
　Ｖ２　　第２視点
　Ｖ３　　第３視点

Claims

　情報処理装置によって実行される三次元モデル生成方法であって、
　被写体を複数の視点から撮影することで得られた複数の画像を取得し、
　前記複数の画像のうちの第１画像の第１の点に類似する類似点を、前記第１画像とは異なる第２画像における前記第１の点に基づく探索領域における複数の第２の点から探索し、
　前記第１の点と、前記複数の第２の点のそれぞれとの間の類似度を用いて、探索結果の精度を算出し、
　前記探索結果、および、前記精度を用いて前記被写体の三次元モデルを生成する
　三次元モデル生成方法。
　前記探索では、複数の前記第２画像のそれぞれについて前記類似点を探索し、
　前記精度の算出では、前記複数の第２画像にそれぞれ対応する複数の第１探索結果のそれぞれの第１精度を算出し、
　前記三次元モデルの生成では、前記複数の第１探索結果、および、前記複数の第１精度を用いて前記三次元モデルを生成する
　請求項１に記載の三次元モデル生成方法。
　前記三次元モデルの生成では、算出された前記第１精度が所定の精度よりも小さい第２画像における前記第１探索結果を用いずに、前記三次元モデルを生成する
　請求項２に記載の三次元モデル生成方法。
　前記三次元モデルの生成では、
　　前記複数の第２画像から、算出された前記第１精度が高い順にＮ（Ｎは１以上の整数）枚を選択し、
　　選択したＮ枚の第２画像に対応するＮ個の第１探索結果を用いて前記三次元モデルを生成する
　請求項２に記載の三次元モデル生成方法。
　前記三次元モデルの生成では、
　　前記複数の第１探索結果に基づいて、前記複数の第１探索結果にそれぞれが対応する複数の三次元点を生成し、
　　前記複数の三次元点を、対応する第１探索結果の第１精度が高いほど大きく重み付けされた加重平均を行うことで統合三次元点を生成し、
　　生成した前記統合三次元点を含む前記三次元モデルを生成する
　請求項２に記載の三次元モデル生成方法。
　前記探索は、複数の前記第１の点のそれぞれについて行われ、
　前記精度の算出では、前記複数の第１の点のそれぞれについて、前記複数の第１精度を算出し、
　前記三次元モデルの生成では、前記複数の第１の点のそれぞれについて、前記複数の第１探索結果、および、前記複数の第１精度を用いて三次元点を生成することで得られる複数の三次元点を含む三次元モデルを、前記三次元モデルとして生成する
　請求項２から５のいずれか１項に記載の三次元モデル生成方法。
　前記精度の算出では、前記複数の第１の点のそれぞれについて、当該第１の点について算出された前記複数の第１精度を示す複数の値の総和を当該第１の点に基づく探索結果の第２精度として算出し、
　前記三次元モデルの生成では、前記複数の三次元点と、前記複数の三次元点に対応する複数の前記第２精度とを含む三次元モデルを前記三次元モデルとして生成する
　請求項６に記載の三次元モデル生成方法。
　前記三次元モデルの生成では、
　所定の精度より高い第２精度に対応する２つの高精度な三次元点の間の、前記所定の精度より低い第２精度に対応する１以上の低精度な三次元点を、前記２つの高精度な三次元点を基準にして補正する
　請求項７に記載の三次元モデル生成方法。
　前記探索領域は、前記第１の点に対応するエピポーラ線上の複数の画素により構成される領域である
　請求項１から８のいずれか１項に記載の三次元モデル生成方法。
　メモリと、
　プロセッサとを備え、
　前記プロセッサは、前記メモリを用いて、
　被写体を複数の視点から撮影することで得られた複数の画像を取得し、
　前記複数の画像のうちの第１画像の第１の点に類似する類似点を、前記第１画像とは異なる第２画像における前記第１の点に基づく探索領域から探索し、
　前記第１の点と、前記探索領域における複数の第２の点のそれぞれとの間の類似度を用いて、前記第１の点に基づいて生成される三次元点の精度を算出し、
　前記探索の結果、および、前記精度を用いて前記被写体の三次元モデルを生成する
　三次元モデル生成装置。
　情報処理装置によって実行される三次元モデル生成方法であって、
　被写体を第１視点から撮影することで得られた第１画像と、前記被写体を第２視点から撮影することで得られた第２画像と、を取得し、
　前記第１画像の第１の点に類似する類似点を探索するために、前記第１の点に基づいて前記第２画像の探索領域を特定し、
　前記探索領域の複数の第２の点のそれぞれと前記第１の点とが類似する度合いを示す類似度を算出することで、前記探索領域において前記類似点を探索し、
　前記探索の結果、および、算出された複数の類似度のばらつきに基づいて前記被写体の三次元モデルを生成する
　三次元モデル生成方法。