JP7105246B2 - 再構成方法および再構成装置 - Google Patents

再構成方法および再構成装置 Download PDF

Info

Publication number
JP7105246B2
JP7105246B2 JP2019551083A JP2019551083A JP7105246B2 JP 7105246 B2 JP7105246 B2 JP 7105246B2 JP 2019551083 A JP2019551083 A JP 2019551083A JP 2019551083 A JP2019551083 A JP 2019551083A JP 7105246 B2 JP7105246 B2 JP 7105246B2
Authority
JP
Japan
Prior art keywords
dimensional
reconstruction
images
point
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019551083A
Other languages
English (en)
Other versions
JPWO2019082797A1 (ja
Inventor
ジェン プオン ビエン
ポンサク ラサン
敏康 杉尾
徹 松延
哲史 吉川
達也 小山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Intellectual Property Corp of America
Original Assignee
Panasonic Intellectual Property Corp of America
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Intellectual Property Corp of America filed Critical Panasonic Intellectual Property Corp of America
Publication of JPWO2019082797A1 publication Critical patent/JPWO2019082797A1/ja
Application granted granted Critical
Publication of JP7105246B2 publication Critical patent/JP7105246B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/50Depth or shape recovery
    • G06T7/55Depth or shape recovery from multiple images
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T17/00Three-dimensional [3D] modelling for computer graphics
    • G06T17/20Finite element generation, e.g. wire-frame surface description, tesselation
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/40Analysis of texture
    • G06T7/41Analysis of texture based on statistical description of texture
    • G06T7/44Analysis of texture based on statistical description of texture using image operators, e.g. filters, edge density metrics or local histograms
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/97Determining parameters from multiple pictures
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/54Extraction of image or video features relating to texture
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/757Matching configurations of points or features
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30236Traffic on road, railway or crossing

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Geometry (AREA)
  • Computer Graphics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Image Analysis (AREA)

Description

本開示は、再構成方法および再構成装置に関する。
特許文献1には、複数の画像から対象物の三次元モデルを再構成する多視差立体視を用いた三次元再構成方法が開示されている。
米国特許第8331615号明細書
しかしながら、上記特許文献に係る技術には、更なる改善が必要とされていた。
本開示の一態様に係る再構成方法は、三次元空間上の同一の対象空間を異なる位置および姿勢で配置された複数のカメラにより撮像することで得られた複数の二次元画像を用いて三次元モデルを、プロセッサを用いて再構成する再構成方法であって、前記複数の二次元画像のそれぞれの画像情報に応じて、前記複数の二次元画像に含まれる特徴点のマッチング処理において使用するマッチングパターンのサイズおよび形状を決定し、決定した前記マッチングパターンに基づいて前記マッチング処理を行うことで、複数の三次元点により構成される第1三次元点群を再構成し、前記複数の二次元画像を用いて、前記第1三次元点群に新たな三次元点を追加することで三次元点が増加された第2三次元点群を生成し、前記第2三次元点群を用いて前記三次元モデルを再構成する。
なお、これらの全般的または具体的な態様は、システム、方法、集積回路、コンピュータプログラムまたはコンピュータ読み取り可能なCD-ROMなどの記録媒体で実現されてもよく、システム、方法、集積回路、コンピュータプログラムおよび記録媒体の任意な組み合わせで実現されてもよい。
上記態様によれば、更なる改善を実現することができる。
図1は、実施の形態に係る画像生成システムの構成の一例を示すブロック図である。 図2は、実施の形態に係る再構成モジュールの処理ブロックの第1の例を示すブロック図である。 図3は、実施の形態に係る再構成モジュールの処理ブロックの第2の例を示すブロック図である。 図4は、実施の形態1に係る画像生成システムによる動作の一例を示すシーケンス図である。 図5は、実施の形態に係る三次元再構成方法の処理の第1の例を示すフローチャートである。 図6は、実施の形態に係る三次元再構成方法の処理の第2の例を示すフローチャートである。 図7は、実施の形態に係る領域判定処理の一例を示すフローチャートである。 図8は、実施の形態に係る、特徴点のマッチング処理に用いられるパターンを決定するパターン決定処理の一例を示すフローチャートである。 図9は、実施の形態に係る三次元点群を再構成する処理の一例を示すフローチャートである。 図10は、2枚の画像間の特徴点のペアのエピポーラ拘束を示す図である。 図11は、カメラパラメータの推定方法及び三次元モデルの再構成方法を説明するための図である。 図12は、実施の形態に係る三次元点群の三次元点を増加させる処理の一例を示すフローチャートである。 図13は、実施の形態に係る三次元点群の三次元点を増加させる処理の一例を示すフローチャートである。 図14Aは、三次元点群再構成手法(3D Reconstruction)を実施する際のカメラ配置例を示した図である。 図14Bは、三次元点群再構成手法(3D Reconstruction)を実施する際のカメラ配置例を示した図である。 図15は本開示における3次元点群再構成手法(3D Reconstruction)を実施する際のカメラ配置方法の具体例を示した図である。 図16は、変形例に係る画像生成システムの構成の一例を示すブロック図である。
(本開示の基礎となった知見)
従来、三次元シーンを再構成する方法としては、2つの手法がある。
第1の手法では、デプスマップは、右目画像および左目画像からなる2つの画像を用いて再構成される。この処理のために、2つの画像を撮像する2つのカメラの位置は、左右の目として厳密に定められている必要がある。様々な始点からの複数のデプスマップは、さらに単一の三次元シーンモデルに融合されてもよい。
第1の手法では、シーンの三次元モデルは、様々な視点から構成される。複数の画像を撮像する複数のカメラの位置は、デプスマップを用いる第1の手法のように厳密に定められていなくてもよい。つまり、第2の手法では、第1の手法よりもより自由度が高い。しかしながら、三次元再構成方法は、第1の手法よりもはるかに難しい。通常、疎な三次元点群を再構成することしかできず、その多くはテクスチャ領域によるものである。どちらの手法でも、非テクスチャ領域では、三次元点群の再構成結果は、精度および信頼性を欠くこととなる。
したがって、テクスチャ領域および非テクスチャ領域の両方に適切であり、かつ、効果的な三次元再構成を実現することが求められている。
そこで、本開示の一態様に係る再構成方法は、三次元空間上の同一の対象空間を異なる位置および姿勢で配置された複数のカメラにより撮像することで得られた複数の二次元画像を用いて三次元モデルを、プロセッサを用いて再構成する再構成方法であって、前記複数の二次元画像のそれぞれの画像情報に応じて、前記複数の二次元画像に含まれる特徴点のマッチング処理において使用するマッチングパターンのサイズおよび形状を決定し、決定した前記マッチングパターンに基づいて前記マッチング処理を行うことで、複数の三次元点により構成される第1三次元点群を再構成し、前記複数の二次元画像を用いて、前記第1三次元点群に新たな三次元点を追加することで三次元点が増加された第2三次元点群を生成し、前記第2三次元点群を用いて前記三次元モデルを再構成する。
これによれば、画像情報に応じて動的に変更されたサイズおよび形状のマッチングパターンを用いてマッチング処理を行うため、領域に応じて適切な三次元点を再構成することができ、かつ、処理時間を短くすることができる。
また、前記マッチングパターンの決定では、前記複数の二次元画像のそれぞれについて、当該二次元画像を構成している1以上の領域をテクスチャ領域と非テクスチャ領域とに分類し、前記テクスチャ領域に分類した第1領域内には第1のサイズのパターンを前記マッチングパターンとして決定し、前記非テクスチャ領域に分類した第2領域には前記第1のサイズよりも大きい第2のサイズのパターンを前記マッチングパターンとして決定してもよい。
これにより、テクスチャ領域における再構成処理に要する時間を短くすることができ、効率よく処理を行うことができる。また、非テクスチャ領域では、第1のサイズよりも大きい第2のサイズを用いて特徴点のマッチング処理を行うため、領域に応じて適切な三次元点を再構成することができる。
また、前記分類では、前記複数の二次元画像のそれぞれについて、当該二次元画像を構成する複数の画素の画素値に基づく分散マップおよびエッジマップを算出し、算出した前記分散マップおよび前記エッジマップを用いて、前記二次元画像を構成している前記1以上の領域をテクスチャ領域と非テクスチャ領域とに分類してもよい。
このため、二次元画像の領域を、効果的にテクスチャ領域と非テクスチャ領域とに分類することができる。
また、本開示の一態様に係る再構成装置は、三次元空間上の同一の対象空間を異なる位置および姿勢で配置された複数のカメラにより撮像することで得られた複数の二次元画像を用いて三次元モデルを再構成する再構成装置であって、プロセッサを備え、前記プロセッサは、前記複数の二次元画像のそれぞれの画像情報に応じて、前記複数の二次元画像に含まれる特徴点のマッチング処理において使用するマッチングパターンのサイズおよび形状を決定し、決定した前記マッチングパターンに基づいて前記マッチング処理を行うことで、複数の三次元点により構成される第1三次元点群を再構成し、前記複数の二次元画像を用いて、前記第1三次元点群に新たな三次元点を追加することで三次元点が増加された第2三次元点群を生成し、前記第2三次元点群を用いて前記三次元モデルを再構成する。
これによれば、画像情報に応じて動的に変更されたサイズおよび形状のマッチングパターンを用いてマッチング処理を行うため、領域に応じて適切な三次元点を再構成することができ、かつ、処理時間を短くすることができる。
なお、これらの全般的または具体的な態様は、システム、方法、集積回路、コンピュータプログラムまたはコンピュータ読み取り可能なCD-ROMなどの記録媒体で実現されてもよく、システム、方法、集積回路、コンピュータプログラムまたは記録媒体の任意な組み合わせで実現されてもよい。
以下、本開示の一態様に係る再構成方法および再構成装置について、図面を参照しながら具体的に説明する。
なお、以下で説明する実施の形態は、いずれも本開示の一具体例を示すものである。以下の実施の形態で示される数値、形状、材料、構成要素、構成要素の配置位置及び接続形態、ステップ、ステップの順序などは、一例であり、本開示を限定する主旨ではない。また、以下の実施の形態における構成要素のうち、最上位概念を示す独立請求項に記載されていない構成要素については、任意の構成要素として説明される。
(実施の形態)
実施の形態1に係る画像生成システムについて説明する。
図1は、実施の形態に係る画像生成システムの構成の一例を示すブロック図である。
図1に示すように、画像生成システム100は、複数のカメラ102と、複数のカメラ102にそれぞれ対応して接続される複数の撮像装置104と、画像生成装置101と、ディスプレイ108と、入力装置110とを備える。画像生成システム100は、さらに、同期装置116を備えていてもよい。
複数のカメラ102は、互いに異なる位置に配置され、互いに異なる姿勢で固定されており、三次元空間上の同一の対象空間を撮像する。これにより、複数のカメラ102は、異なる複数の視点から異なる視線方向で撮像された複数の画像を得ることができる。個々で得られる複数の画像は、それぞれ、二次元画像である。複数のカメラ102は、それぞれ、異なる複数のタイミングにおいて撮像することにより、複数の画像を得てもよい。複数のカメラ102は、例えば、予め定められたフレームレートで複数の画像としての複数のフレームを含む動画像を撮像するカメラであってもよい。複数のカメラ102による撮像のタイミングは、同期装置116により互いに同期されていてもよい。なお、図1の画像生成システム100では、2つのカメラ102が示されているが、画像生成システム100は、2以上のカメラ102を備えていてもよい。
複数の撮像装置104は、複数のカメラ102のそれぞれに対応して設けられ、複数のカメラ102において撮像されることにより得られた画像を記憶し、記憶した画像をプロセッサ106に出力する。なお、複数の撮像装置104は、複数のカメラ102に内蔵されていてもよい。つまり、複数のカメラ102のそれぞれは、撮像装置104の機能を有していてもよい。
画像生成装置101は、プロセッサ106と、外部メモリ112と、モデルデータベース114とを備える。プロセッサ106は、校正モジュール2と、再構成モジュール4と、レンダリングモジュール8と、メモリ10とを有する。画像生成装置101は、再構成装置の一例である。
校正モジュール2は、複数のカメラ102の校正を実行することで、複数のカメラ102それぞれのカメラパラメータを取得する。カメラパラメータは、三次元空間におけるカメラの位置及び姿勢を示す外部パラメータと、カメラの焦点距離、収差、画像中心等の光学系の特性を示す内部パラメータとを含む。校正方法は、例えば、SFM(Structure From Motion)技術を用いて行われてもよいし、または既知の校正パターンに基づいて行われてもよい。校正処理は、一度に実行されてもよいし、セットアップまたは移動の変化に対処するために、徐々に実行されてもよい。校正処理は、例えば、三次元再構成の前に行われ、得られたカメラパラメータを外部メモリに記憶する。
再構成モジュール4は、複数のカメラ102により撮像されることにより得られた複数の二次元画像、および、複数のカメラ102のそれぞれのカメラパラメータを用いて、高密度で正確な三次元モデルを再構成する。再構成モジュール4は、三次元モデルを再構成する際、外部メモリに記憶されているカメラパラメータを読み出して、読み出したカメラパラメータを用いる。
レンダリングモジュール8は、再構成モジュール4において再構成された三次元モデルと、複数のカメラ102から得られた複数の画像とを用いて、三次元シーンの仮想画像をレンダリングまたは生成する。レンダリングモジュール8は、レンダリングまたは生成した仮想画像をディスプレイ108に出力する。仮想画像は、複数のカメラ102の撮像対象となる三次元空間上の同一の対象空間を複数のカメラ102の視点とは異なる仮想的な視点から見たときの二次元画像である。
プロセッサ106が有する校正モジュール2、再構成モジュール4およびレンダリングモジュール8の機能は、汎用のプロセッサがプログラムを実行することで実現されることに限らずに、専用回路により実現されてもよい。つまり、これらの機能は、ソフトウェアで実現されてもよいし、ハードウェアで実現されてもよい。
メモリ10は、校正モジュール2、再構成モジュール4およびレンダリングモジュール8による各処理において生成された中間データを一時的に記憶してもよい。
プロセッサ106に接続されたディスプレイ108は、レンダリングモジュール8により出力された仮想画像を表示する。つまり、ディスプレイ108は、プロセッサ106から出力された画像を表示する装置であり、例えば、液晶ディスプレイ、有機EL(Electro Luminescence)ディスプレイなどにより実現される。プロセッサ106から出力される画像には、入力を受け付けるためのGUI(Graphical User Interface)が含まれていてもよい。
入力装置110は、ディスプレイ108に接続され、ユーザが所望する仮想的な視点である仮想視点を指定する入力をユーザから受け付け、受け付けた入力を示す入力信号をディスプレイ108に出力する。仮想視点の数およびカメラパスは、レンダリングモジュール8に仮想ビューを生成するように指示する予め定められたパターンに基づいて再構成されてもよい。入力装置110は、例えば、リモートコントローラ、ゲームパッド、マウス、キーボードなどにより実現される。
なお、ディスプレイ108は、入力信号を受信すると、プロセッサ106から受信している複数の仮想的な視点から見たときの複数の仮想画像のうち、入力信号に応じた仮想画像に切り替えて表示してもよい。
また、ディスプレイ108は、プロセッサ106から複数の視点から見たときの複数の仮想画像を受信していない場合、入力信号をプロセッサ106に送信してもよい。この場合、プロセッサ106は、受信した入力信号に応じた視点から見たときの仮想画像を生成し、生成した仮想画像をディスプレイ108に出力する。そして、ディスプレイ108は、プロセッサ106から出力された仮想画像を表示する。また、この場合、入力装置110は、ディスプレイ108に接続されていなくてもよく、プロセッサ106に直接接続されており、プロセッサ106に入力信号を送信する構成であってもよい。
なお、図1で説明した、接続とは、通信接続であり、有線で電気的に接続されてなくてもよく、無線接続であってもよい。つまり、接続は、有線による通信接続であってもよいし、無線による通信接続であってもよい。
外部メモリ112は、例えば、プログラムなどのようなプロセッサ106が必要とする情報を格納してもよい。外部メモリ112は、プロセッサ106の処理で生じたデータを格納してもよい。
モデルデータベース114は、再構成モジュール4またはレンダリングモジュール8で使用されるシーンの事前再構成モデルを格納している。
図2は、実施の形態に係る再構成モジュールの処理ブロックの第1の例を示すブロック図である。
再構成モジュール4は、領域判定モジュール202と、三次元点再構成モジュール204と、三次元点増加モジュール206とを有する。再構成モジュール4は、複数のカメラ102にそれぞれ撮像された複数の画像と、複数のカメラ102のそれぞれに対応する複数のカメラパラメータを取得する。取得された複数の画像、および、複数のカメラパラメータは、領域判定モジュール202に入力される。なお、ここで再構成モジュール4が取得する複数の画像、つまり、複数のカメラ102により撮像された複数の画像は、それぞれ二次元画像である。
領域判定モジュール202は、取得した複数の画像のそれぞれについて、当該画像を構成している1以上の領域をテクスチャ領域と非テクスチャ領域とに分類する。つまり、領域判定モジュール202は、複数の画像のそれぞれを構成する1以上の領域のそれぞれが、テクスチャ領域であるか、非テクスチャ領域であるかを判定する。領域判定モジュール202における領域判定処理の具体例は、後述する。
三次元点再構成モジュール204は、領域判定モジュール202における判定結果に応じたサイズおよび形状であるマッチングパターンに基づいて、疎な三次元点群を再構成する。
三次元点増加モジュール206は、三次元点再構成モジュール204により再構成された疎な三次元点群である第1三次元点群に、領域判定モジュール202における判定結果に応じたサイズおよび形状であるマッチングパターンに基づいて、新たな三次元点を追加する。これにより、三次元点増加モジュール206は、三次元点が増加された密な複数の三次元点により構成される第2三次元点群を生成する。三次元点増加モジュール206は、得られた第2三次元点群を用いて三次元モデルを再構成する。
なお、再構成モジュール4が備える各モジュールの機能は、汎用のプロセッサがプログラムを実行することで実現されることに限らずに、専用回路により実現されてもよい。つまり、これらの機能は、ソフトウェアで実現されてもよいし、ハードウェアで実現されてもよい。
ここで、再構成モジュール4は、特徴点のマッチング処理において、固定されたサイズおよび形状であるマッチングパターンを用いることで、三次元点群を再構成することができる。しかしながら、固定されたサイズおよび形状であるマッチングパターンを用いることには、3つの改善点がある。1つ目は、テクスチャ領域および非テクスチャ領域にはそれぞれ適したサイズのマッチングパターンがあり、固定されたサイズおよび形状であるマッチングパターンを用いると、テクスチャ領域および非テクスチャ領域両方に対して同時に正確性を有しない点である。2つ目は、非テクスチャ領域を用いて三次元点群を生成するには、マッチングパターンのサイズを大きくする必要が有るが、テクスチャ領域において大きなマッチングパターンを用いると、三次元点群の再構成処理に長い時間が必要となる点である。3つ目は、固定されたサイズおよび形状であるマッチングパターンは、前景オブジェクトおよび背景オブジェクトを同じマッチングパターンでカバーするため、前景オブジェクトにおける三次元点群は実際のオブジェクトよりも大きくなってしまう点である。これらに対処するために、再構成モジュール4における三次元再構成処理のマッチングに用いられるマッチングパターンは、再構成モジュール4が入力した複数の画像のそれぞれの画像情報に応じて動的に変更される。画像情報は、1枚の画像を構成する1以上の領域のそれぞれがテクスチャ領域であるか、非テクスチャ領域であるかを示す情報である。例えば、再構成モジュール4は、画像を構成する1以上の領域のそれぞれについて、当該領域がテクスチャ領域である場合に、非テクスチャ領域である場合の第2のサイズよりも小さい第1のサイズのマッチングパターンを用いて特徴点のマッチング処理を行う。これにより、テクスチャ領域における再構成処理に要する時間を短くすることができ、効率よく処理を行うことができる。また、非テクスチャ領域では、第1のサイズよりも大きい第2のサイズを用いて特徴点のマッチング処理を行うため、精度およびロバスト性を向上させることができる。また、特徴点のマッチング処理に用いられるマッチングパターンの形状は固定されておらず、拡張部分はテクスチャ領域をカバーしないため、前景オブジェクトにおける三次元点群が実際のオブジェクトよりも大きくなることを低減することができる。このように、再構成モジュール4は、テクスチャ領域と非テクスチャ領域とで、概念が異なるマッチングパターンを用いて特徴点のマッチング処理を行うため、精度およびロバスト性と、処理に要する時間とを改善することができる。
図3は、実施の形態に係る再構成モジュールの処理ブロックの第2の例を示すブロック図である。
再構成モジュール4Aは、三次元点再構成モジュール204Aと、三次元点増加モジュール206Aとを有する。再構成モジュール4Aは、複数のカメラ102にそれぞれ撮像された複数の画像と、複数のカメラ102のそれぞれに対応する複数のカメラパラメータを取得する。第2の例の再構成モジュール4Aでは、三次元点再構成モジュール204Aおよび三次元点増加モジュール206Aのそれぞれが、第1の例の再構成モジュール4の領域判定モジュール202による領域判定処理と同じ領域判定処理を実行する点が異なる。その他の構成は、第1の例の再構成モジュール4と同様であるので説明を省略する。なお、第2の例の場合、領域判定処理は三次元点再構成モジュール204Aおよび三次元点増加モジュール206Aのそれぞれにおいて行われ、同じ処理が繰り返される場合があるため、第1の例よりも効率的ではない。
図4は、実施の形態1に係る画像生成システムによる動作の一例を示すシーケンス図である。
一の撮像装置104は、一のカメラ102により撮像された画像を画像生成装置101に送信する(S1)。同様に、他の撮像装置104は、他のカメラ102により撮像された画像を画像生成装置101に送信する(S2)。
次に、画像生成装置101では、プロセッサ106が複数のカメラ102により撮像された複数の画像を取得する(S3)。この時、プロセッサ106は、同一のタイミングで複数のカメラ102により撮像された複数の画像を取得してもよい。
そして、プロセッサ106の再構成モジュール4は、校正モジュール2により既に行われた校正処理により得られた複数のカメラ102のカメラパラメータと、取得した複数の画像とを用いて、三次元モデルを生成する(S4)。
プロセッサ106のレンダリングモジュール8は、生成された三次元モデルと、複数の画像とを用いて、仮想視点から対象空間を見たときの仮想画像を生成する(S5)。
レンダリングモジュール8は、生成した仮想画像をディスプレイ108に出力する(S6)。
入力装置110は、ユーザが所望する仮想視点を示す入力信号をディスプレイ108に出力する(S7)。
ディスプレイ108は、画像生成装置101により出力された仮想画像のうちで、入力信号に応じた仮想画像を表示する(S8)。
図5は、実施の形態に係る三次元再構成方法の処理の第1の例を示すフローチャートである。つまり、図5のフローチャートは、再構成モジュール4により実行される三次元再構成方法の処理の一例を示す。
まず、再構成モジュール4は、複数の撮像装置104から複数のカメラ102において撮像された複数の画像と、複数のカメラ102にそれぞれ対応する複数のカメラパラメータとを取得する(S11)。
次に、再構成モジュール4の領域判定モジュール202は、取得した複数の画像のそれぞれについて、当該画像を構成する1以上の領域がテクスチャ領域であるか非テクスチャ領域であるかを判定する領域判定処理を行う(S12)。これにより、領域判定モジュール202は、複数の画像のそれぞれについて、当該画像の領域をテクスチャ領域と非テクスチャ領域とに区分する。領域判定処理の詳細は、図7を用いて後述する。
領域判定モジュール202は、取得した複数の画像のそれぞれの画像情報に応じて、複数の二次元画像に含まれる特徴点のマッチング処理において使用するマッチングパターンのサイズおよび形状を決定するパターン決定処理を行う(S13)。パターン決定処理の詳細は、図8を用いて後述する。
再構成モジュール4の三次元点再構成モジュール204は、決定したマッチングパターンに基づいてマッチング処理を行うことで、複数の三次元点により構成される第1三次元点群を再構成する(S14)。三次元点群の再構成処理の詳細は、図9~図11を用いて後述する。
再構成モジュール4の三次元点増加モジュール206は、複数の画像を用いて、再構成された第1三次元点群に新たな三次元点を追加することで三次元点が増加された第2三次元点群を生成する(S15)。三次元点の増加処理の詳細は、図12、13を用いて後述する。
再構成モジュール4は、ステップS14で三次元点が増加されることで得られた高密度の三次元点群である第2三次元点群を出力する(S16)。
図6は、実施の形態に係る三次元再構成方法の処理の第2の例を示すフローチャートである。つまり、図6のフローチャートは、再構成モジュール4Aにより実行される三次元再構成方法の処理の一例を示す。
再構成モジュール4Aは、複数の撮像装置104から複数のカメラ102において撮像された複数の画像と、複数のカメラ102にそれぞれ対応する複数のカメラパラメータとを取得する(S11)。
次に、再構成モジュール4Aの三次元点再構成モジュール204Aは、複数の画像のそれぞれについて領域判定処理およびパターン決定処理を行い、処理結果に応じたサイズおよび形状であるマッチングパターンに基づいて、第1三次元点群を再構成する(S14A)。
再構成モジュール4Aの三次元点増加モジュール206Aは、複数の画像のそれぞれについて領域判定処理およびパターン決定処理を行い、判定結果に応じたサイズおよび形状であるマッチングパターンに基づいて、再構成された第1三次元点群の三次元点を増加させる(S15A)。
再構成モジュール4Aは、ステップS14Aで三次元点が増加されることで得られた高密度の三次元点群である第2三次元点群を出力する(S16A)。
図7は、実施の形態に係る領域判定処理の一例を示すフローチャートである。
まず、領域判定モジュール202は、複数の画像およびカメラパラメータを用いて、複数の画像のそれぞれについて以下のステップS22~S25の処理を実行するループ1を開始する(S21)。
領域判定モジュール202は、処理対象の画像について、分散ヒートマップを算出する(S22)。分散ヒートマップは、例えば、画像を構成する複数の画素毎に算出される分散であり、当該画素を基準とした所定の領域に含まれる複数の画素の画素値の分散により構成される。分散は、例えば、第1の画素を中心とするm×nの画素の領域の各画素値の分散であり、第1の画素に対応している。ここで、mおよびnのそれぞれは、2以上の整数であり、mおよびnは互いに等しくてもよいし異なっていてもよい。画素値は、画素の輝度値であってもよいし、画素の各RGB値から求められる値であってもよい。このように、分散ヒートマップは、処理対象の画像を構成する複数の画素のそれぞれを基準として算出される複数の分散によって構成される。
なお、分散ヒートマップは、処理対象の画像を構成する複数の画素毎に対応する分散により構成されていなくてもよく、当該画像を複数の領域に分割した場合の複数の領域のそれぞれについて算出される分散により構成されていてもよい。
領域判定モジュール202は、処理対象の画像について、エッジマップを算出する(S23)。エッジマップは、例えば、画像上におけるエッジの分布を示す情報である。領域判定モジュール202は、算出したエッジマップを用いて、画像を複数の領域に区切ることができる。
領域判定モジュール202は、処理対象の画像について、当該画像を構成する1以上の領域のそれぞれについて、当該領域がテクスチャ領域であるか非テクスチャ領域であるかを推定する(S24)。具体的には、領域判定モジュール202は、エッジマップを用いて区切った複数の領域のそれぞれについて、当該領域が、分散ヒートマップにおいて閾値を超える分散に対応する画素または領域を含む領域であるか否かを判定する。領域判定モジュール202は、閾値を超える分散に対応する画素または領域を含む領域である場合、当該領域をテクスチャ領域であると推定し、閾値を超える分散に対応する画素または領域を含まない領域である場合、当該領域を非テクスチャ領域であると推定する。
そして、領域判定モジュール202は、推定した結果を用いて、処理対象の画像における領域ついて、テクスチャ領域および非テクスチャ領域を示すテクスチャ/非テクスチャ領域マップを生成し、テクスチャ/非テクスチャ領域マップを出力する(S25)。
領域判定モジュール202は、ステップS25の後で、複数の画像のうちまだループ1における処理が行われていない次の画像に対してステップS22~S25を実行する。
なお、領域判定処理は、第1の例の再構成モジュール4では、領域判定モジュール202が行う処理であるが、第2の例の再構成モジュール4Aで説明したように、三次元点再構成モジュール204Aおよび三次元点増加モジュール206Aのそれぞれが行ってもよい。
図8は、実施の形態に係る、特徴点のマッチング処理に用いられるマッチングパターンを決定するパターン決定処理の一例を示すフローチャートである。
領域判定モジュール202は、複数の画像のうちの一の画像を構成する複数の画素のそれぞれについて以下のループ3を実行するループ2を開始する(S31)。
領域判定モジュール202は、処理対象の画像について、当該画像を構成する複数の画素のそれぞれについて以下のステップS33~S35を実行するループ3を開始する(S32)。
領域判定モジュール202は、領域判定処理における結果を用いて、処理対象の画素がテクスチャ領域の画素であるか否かを判定する(S33)。
領域判定モジュール202は、処理対象の画素がテクスチャ領域の画素であると判定した場合(S33でYes)、当該画素に対応するマッチングパターンとして第1のサイズのマッチングパターンに決定する。第1のサイズのマッチングパターンは、例えば、固定されたサイズおよび形状のマッチングパターンである。
領域判定モジュール202は、処理対象の画素がテクスチャ領域の画素でない、つまり、処理対象の画素が非テクスチャ領域の画素であると判定した場合(S33でNo)、当該画素に対応するマッチングパターンとして、処理対象の画素が属する非テクスチャ領域の形状に応じたマッチングパターンであって、第2のサイズのマッチングパターンに決定する。第2のサイズのマッチングパターンは、処理対象の画素を中心として、所定の条件を満たすまで互いに異なる複数の方向に領域を拡大したときのサイズおよびマッチングパターンに決定される。互いに異なる複数の方向は、処理対象の画素を中心として、上方向、下方向、右方向および左方向の4方向であってもよいし、上記4方向のうちの2方向、3方向などであってもよいし、上記4方向に右上方向、右下方向、左上方向および左下方向の4方向をさらに加えた8方向であってもよいし、その他の複数の方向であってもよい。所定の条件とは、(i)拡大した端部から中心までの距離が最大距離に等しいこと、(ii)拡大した端部の画素がテクスチャ領域に属したこと、(iii)拡大した端部の画素の局所平均値が処理対象の画素の局所平均値よりも大きく異なる(つまり局所平均値の差分が閾値より大きい)ことのいずれかである。
領域判定モジュール202は、ステップS34またはステップS35の後で、複数の画素のうちまだループ3における処理が行われていない次の画素に対してステップS33~S34を実行する。
また、領域判定モジュール202は、ループ3が終了した後で、複数の画像のうちまだループ2における処理が行われていない次の画像に対してループ3を実行する。
なお、パターン決定処理は、第1の例の再構成モジュール4では、領域判定モジュール202が行う処理であるが、第2の例の再構成モジュール4Aで説明したように、三次元点再構成モジュール204Aおよび三次元点増加モジュール206Aのそれぞれが行ってもよい。
図9は、実施の形態に係る三次元点群を再構成する処理の一例を示すフローチャートである。
三次元点再構成モジュール204は、複数の画像のそれぞれから複数の特徴点(キーポイント)を抽出する(S41)。
次に、三次元点再構成モジュール204は、複数の画像のうちの2枚の画像のそれぞれで抽出された複数の特徴点を用いて、2枚の画像間で対応する複数の特徴点をマッチングするマッチング処理を行う。マッチング処理は、例えば、以下のループ4の処理である。
具体的には、三次元点再構成モジュール204は、2つの画像のうちの一の画像において抽出された複数の特徴点のそれぞれについて以下のステップS43~S45を実行するループ4を開始する(S42)。
三次元点再構成モジュール204は、処理対象の特徴点について、エピポーラ線に沿って三角測量することによって2つの画像のうちの他の画像において抽出された複数の特徴点から三次元点候補を決定する(S43)。
三次元点再構成モジュール204は、特徴点のマッチング処理に用いられるマッチングパターンに基づいて、第1のフォトコンシステンシースコア(photo-consistency score)を満たす三次元点候補の第1のセットを取得する(S44)。
三次元点再構成モジュール204は、特徴点のマッチング処理に用いられるマッチングパターンに基づいて、第1のセットの三次元点候補を最適化することで、三次元点候補の第2のセットを取得する(S45)。
三次元点再構成モジュール204は、ステップS45の後で、複数の特徴点のうちまだループ4における処理が行われていない次の特徴点に対してステップS43~S45を実行する。
ステップS43~S45が行われることにより、対応する特徴点のペアが複数得られる。ステップS41~S45の処理は、複数の画像のうちの2枚を抽出することでできる全ての組み合わせに対して行われてもよい。
最後に、三次元点再構成モジュール204は、第2のセットの三次元点候補のうちでよりよいフォトコンシステンシースコア(photo-consistency score)を満たす三次元点候補を選択し、選択した三次元点候補により構成される疎な三次元点群を出力する(S46)。
なお、フォトコンシステンシースコアは、NCC(Normalized Cross Correlation)またはその派生技術に基づいて算出されることが好ましい。なお、フォトコンシステンシースコアは、SSD(Sum of Squared Differences)などのNCC以外の技術を用いて算出されてもよい。
図10は、2枚の画像間の特徴点のペアのエピポーラ拘束を示す図である。
画像501における、三次元空間上の三次元点Mを撮像した二次元点mを特徴点としたときに、当該二次元点mに対応する特徴点を画像502からエピポーラ拘束を用いて求める例について説明する。まず、各カメラの外部パラメータを用いて、画像501を撮像したカメラの光学中心Cと、画像502を撮像したカメラの光学中心C’とが求められる。そして、カメラの光学中心Cと、二次元点mの画像501における座標とを用いて、光学中心Cおよび二次元点mを通る、三次元空間上の直線503を算出する。次に、直線503と、画像502を撮像したカメラの外部パラメータとを用いて、画像502上において直線503に対応する線であるエピポーラ線504を算出する。そして、画像502におけるエピポーラ線504上の特徴点を三角測量することによって三次元点候補を得ることができる。つまり、エピポーラ線504上にある全ての特徴点を、直線503上の二次元点mに対応する二次元点m’を特定するための候補点とすることができる。
図11は、カメラパラメータの推定方法及び三次元モデルの再構成方法を説明するための図である。カメラの内部パラメータは既知であり、3枚のフレーム(画像511、画像512、及び画像513)を用いて、カメラの外部パラメータを推定し、被写体の三次元モデルを再構成する例を説明する。
各カメラのカメラパラメータを取得するには、0を原点とする世界座標系におけるカメラの回転行列R1、R2、R3及び並進ベクトルT1、T2、T3を算出する必要がある。まず、画像511と画像512を撮像したカメラの回転行列及び並進ベクトルを算出する方法を述べる。画像511上の点m1=(u1、v1、1)と画像512上の点m2が対応している時、両者には(式1)を満たすエピポーラ方程式が成り立つ。
Figure 0007105246000001
ここで、FをFundamental matrix(F行列)と呼ぶ。再構成モジュール4は、各カメラの内部パラメータKを用いて、(式2)に示す変換式によりそれぞれの点を各カメラ座標系の点m1=(x1、y1、z1)及びm2=(x2、y2、z2)として取得できる。エピポーラ方程式は(式3)のように書き換えられる。
Figure 0007105246000002
Figure 0007105246000003
ここで、EをEssential matrix(E行列)と呼ぶ。再構成モジュール4は、複数の対応点を用いてE行列の各要素を算出できる。また、再構成モジュール4は、画像間の点m1及びm2のような対応点を複数用いてF行列の各要素を算出した後、(式4)の変換式によりE行列を取得してもよい。
E=K-1FK (式4)
再構成モジュール4は、このE行列を分解することにより、世界座標系において画像511から画像512への回転行列及び並進ベクトルを取得できる。世界座標系における第1カメラの位置及び世界座標系の各軸に対する第1カメラの傾きが既知の場合は、再構成モジュール4は、第1カメラと第2カメラとの相対関係を用いて、世界座標系における第1カメラ及び第2カメラの位置及び姿勢を取得できる。再構成モジュール4は、世界座標系における第1カメラの位置及び姿勢を、映像以外のカメラの情報(例えば、カメラが備えるジャイロセンサ又は加速度センサ等のセンサで得られた情報)を用いて算出してもよいし、予め計測しておいてもよい。また、第1カメラのカメラ座標系を世界座標系として、他のカメラの位置及び姿勢を算出してもよい。
なお、カメラのレンズ歪みを考慮する場合、再構成モジュール4は、歪みモデルを用いて、画像上の点の位置を補正し、補正された位置を用いてF行列又はE行列を取得する。再構成モジュール4は、一例として(式5)に示すレンズの半径方向の歪みモデルなどを使用する。
uundistorted=u(1+k1r2+k2r4+k3r6)
vundistorted=v(1+k1r2+k2r4+k3r6)
r2=u2+v2 (式5)
また、再構成モジュール4は、画像511と画像512の回転行列及び並進ベクトルを用いて形成される三角形により、対応点の世界座標系上の対応点の三次元点Mの座標を取得できる。
また、上記の幾何学的関係は3視点に拡張できる。画像511と画像512に対し画像513を追加する場合、再構成モジュール4は、画像512と画像513、及び画像511と画像513についてもそれぞれE行列を算出し、各カメラ間の相対的な回転行列及び並進ベクトルを取得する。再構成モジュール4は、これらを統合することにより、画像513のカメラの世界座標系における回転行列及び並進ベクトルを算出できる。
また、画像513と画像511、画像513と画像512のそれぞれで対応点から画像513の回転行列及び並進ベクトルを算出してもよい。詳細には、画像511と画像513、及び画像512と画像513で対応点を求める。ここで、画像511上の点m1、及び画像512上の点m2に対応する画像513上の点m3が得られたとすると、この対応点の三次元点Mの座標は取得できているため、画像513上の点と三次元空間内の座標の対応関係を取得できる。この時、(式6)が成り立つ。
Figure 0007105246000004
ここでPをPerspective matrix(P行列)と呼ぶ。P行列、E行列、及び内部行列には(式7)の関係が成り立つため、再構成モジュール4は、画像513のE行列を取得でき、これにより回転行列及び並進ベクトルを求めることができる。
P=KE (式7)
なお、内部パラメータが未知の場合でも、再構成モジュール4は、F行列又はP行列を算出した後、内部行列は上三角行列であり、E行列は正定値対称行列であるという制約の下にF行列及びP行列を分割することで、内部行列及びE行列を求めることが可能である。
図12は、実施の形態に係る三次元点群の三次元点を増加させる処理の一例を示すフローチャートである。
三次元点増加モジュール206は、三次元点群を構成する全ての三次元点から1つの三次元点を処理対象の三次元点として選択する(S51)。
次に、三次元点増加モジュール206は、選択した三次元点に基づいて空の画素を検出する(S52)。空の画素とは、対応する三次元点が無い画素のことを示す。例えば、三次元点増加モジュール206は、複数の三次元点のそれぞれについて、当該三次元点に対応する画素が複数の画像のそれぞれに含まれるか否かを事前に判定していてもよい。三次元点増加モジュール206は、判定結果を全ての三次元点に対応付けてもよい。例えば、全ての三次元点は、それぞれ、どの画像上のどの画素と対応しているかを示す対応情報を保持してもよい。三次元点が対応情報を予め保持している場合、三次元点増加モジュール206は、選択された三次元点がどの画像上のどの画素と対応しているかを効率良く検出することができる。また、三次元点増加モジュール206は、対応する画素の周囲の空の画素についても効率良く検出することができる。
次に、三次元点増加モジュール206は、空の画素が有るか否かを判定する(S53)。
三次元点増加モジュール206は、空の画素が有ると判定した場合(S53でYes)、検出した空の画素の三次元情報と法線ベクトルとを初期化する(S54)。
三次元点増加モジュール206は、NCCを用いて初期化された三次元情報および法線ベクトルを最適化する(S55)。
三次元点増加モジュール206は、NCCと閾値Thrとを比較し、NCCが閾値Thrよりも大きいか否かを判定する(S56)。
三次元点増加モジュール206は、NCCが閾値Thrよりも大きいと判定した場合(S56でYes)、新しい三次元点を追加し、三次元点のリストおよび空の画素のリストを更新する(S57)。
三次元点増加モジュール206は、NCCが閾値Thr以下であると判定した場合(S56でNo)、または、ステップS57の後において、ステップS51に戻り、次の処理対象とする三次元点を、三次元点群を構成する全ての三次元点から選択する。
ステップS53において、三次元点増加モジュール206は、空の画素がないと判定した場合(S53でNo)、処理対象の画素が最後の画素であるか否かを判定する(S58)。
三次元点増加モジュール206は、処理対象の画素が最後の画素であると判定した場合(S58でYes)、三次元点を増加させる処理を終了する。三次元点増加モジュール206は、処理対象の画素が最後の画素でないと判定した場合(S58でNo)、ステップS51に戻り、次の処理対象とする三次元点を、三次元点群を構成する全ての三次元点から選択する。
なお、空の画素は、三次元情報を有さない画素を参照することができる。
図13は、実施の形態に係る三次元点群の三次元点を増加させる処理の一例を示すフローチャートである。
三次元点増加モジュール206は、三次元情報を有さない画素を検出する(S61)。
三次元点増加モジュール206は、三次元情報を有さない1以上の画素のそれぞれについて、当該画素の三次元情報を、当該画素に最も近い、三次元情報を有する画素の三次元情報で初期化する(S62)。
三次元点増加モジュール206は、類似性スコア(similarity score)を最適化することで初期化された画素の初期の三次元情報を変換し、三次元情報を精度を向上させる(S63)。類似性スコアの最適化は、複数の画像間の複数の画素の不一致を最小化することによって達成されうる。不一致は、フォトコンシステンシースコアとは逆の関係にある。
なお、図12の処理と図13の処理とは、三次元点を増加させる処理において両方行われてもよいし、いずれか一方が行われてもよい。
図14Aおよび図14Bは、三次元点群再構成手法(3D Reconstruction)を実施する際のカメラ配置例を示した図である。
三次元再構成を行うために複数のカメラを空間に配置する場合、図14Aの模式図のように1台毎に隣に配置されるカメラとの間の距離が一定距離以上となるように離した状態で、複数のカメラを空間に散在させてもよい。
また、図14Bの模式図のように2台を含む1台以上のカメラをグループとして、そのカメラグループ毎に隣に配置されるカメラグループとの間の距離が一定距離以上となるように離した状態で、複数のカメラを空間に散在させてもよい。この場合、1台のカメラをカメラグループとして扱ってもよい。つまり、1台のカメラのカメラグループと、2台以上のカメラのカメラグループとが混在していてもよい。なお、同一のカメラグループに属する2台以上のカメラは、例えば、一定距離未満で位置が隣接することを満たすカメラとしてもよいし、光軸方向の差が所定の角度範囲未満であることを満たすカメラとしてもよい。なお、カメラ単体の種類としてステレオカメラを利用してもよく、ステレオカメラを利用する場合、単一位置から距離情報を取得してもよい。なお、各カメラの設置位置の高さは同一である必要はなく、それぞれ異なっていても構わない。
単体カメラを配置した場合、1台以上の他のカメラの情報を参照し三次元再構成を行う。カメラグループを含むカメラ配置の場合は、カメラグループ単位で三次元点群の生成および距離情報の取得を行い、それらの結果をカメラグループ間で統合することで三次元再構成を行うような段階的処理を行ってもよい。また、単体カメラの配置と同様にカメラグループ間において情報を参照し、三次元再構成を行ってもよい。
図15は本開示における三次元点群再構成手法(3D Reconstruction)を実施する際のカメラ配置方法の具体例を示した図である。
カメラ配置方法の具体例として交差点にカメラを配置した場合について説明する。
交差点600において、三次元再構成を実施するために複数のカメラの配置方法の一例としては、以下が挙げられる。
車道を上方から撮像するために、4機の信号機605のそれぞれに、単体カメラまたはカメラグループまたはその両方を配置する。
歩道を上方から撮像するために、歩道信号610、建造物615、設置用ポール620などに単体カメラまたはカメラグループまたはその両方を配置する。
なお、歩道橋、照明などの建造物がある場合、当該建造物にカメラなどを配置してもよい。
また、交差点中央の上空にカメラを配置してもよい。
また、車載カメラ、ドローンに搭載されているカメラなどの、移動カメラを利用してもよい。
また、上記の交差点と同様のカメラ配置を、踏切に適用してもよい。
上記実施の形態では、画像生成システム100は、複数のカメラ102により撮像された複数の画像は、複数の撮像装置104を経由して画像生成装置101に出力される構成としたが、これに限らない。例えば、図16に示す画像生成システム100Aのように、複数のカメラ102により撮像された複数の画像は、ネットワーク130を介して画像生成装置101Aに出力される構成としてもよい。この場合、複数の画像は、ネットワーク130を介して、一端サーバ138のストレージ132に蓄積される構成であってもよい。そして、画像生成装置101Aは、サーバ138からストレージ132に蓄積された複数の画像を、プロセッサ106AのネットワークIF12を介して取得する構成であってもよい。
このような、ビュー依存合成は、医療産業、映画産業、ビデオゲーム産業、建築産業、科学コミュニティ、およびエンジニアリングコミュニティを含む広範囲のアプリケーションにおいて有用である。
上述のビュー依存合成には、視覚的な違和感を最小限とする、現実的なレンダリングと高画質が必要である。また、可視性、オクルージョン、および色/輝度の違いを処理する方法が必要である。
本実施の形態に係る再構成方法によれば、画像情報に応じて動的に変更されたサイズおよび形状のマッチングパターンを用いてマッチング処理を行うため、精度およびロバスト性を向上させることができ、かつ、処理時間を短くすることができる。
本実施の形態に係る再構成方法および再構成装置では、三次元アプリケーションに使用することができるシーンの三次元モデルを再構成するための方法および装置である。再構成方法では、分散ヒートマップが各画像について算出され、テクスチャエッジのヒートマップも各画像について算出される。再構成方法では、分散ヒートマップ、および、テクスチャエッジのヒートマップを使用することによって、大きな分散領域およびエッジ領域をテクスチャ領域として定義し、それ以外の領域を非テクスチャ領域として定義する。テクスチャ領域内の画素は、当該画素に沿った小さな第1のサイズのマッチングパターンによって、隣接する画素と区別することができる。したがって、予め定められたパターンセットから小さなマッチングパターンを選択することができ、三次元再構成のための測光的に類似の評価(photometric similar evaluation)を利用できる。非テクスチャ領域の画素では、十分なテクスチャが存在しないため、隣接する画素との間では、小さなマッチングパターンで区別しにくい。十分なテクスチャを収集するために、測光的に類似の評価のためのマッチングパターンは、所定の画素から互いに異なる複数の方向に拡大されることで得られる領域である。各方向について、(i)拡大した端部から中心までの距離が最大距離に等しいこと、(ii)拡大した端部の画素がテクスチャ領域に属したこと、(iii)拡大した端部の画素の局所平均値が処理対象の画素の局所平均値よりも大きく異なる(つまり局所平均値の差分が閾値より大きい)ことのいずれかを満たす場合、マッチングパターンを決定するための領域の拡大は停止する。この拡大によって、マッチングパターンは、ピクセルをその近傍ピクセルから区別するために、より有用なテクスチャ情報を収集することができる。したがって、このマッチングパターンは、測光的に類似の評価に対してロバスト性を有し、かつ、精度の高い三次元モデルを生成することができる。
所定の画素の強度分散は、所定の画素を含むいくつかの近隣ピクセルを用いて算出される。算出された強度分散のうち、所定の閾値よりも大きい分散値は、豊富なテクスチャを含む領域であることを示しており、豊富なテクスチャは測光的に類似の評価に対してロバスト性を有する。したがって、分散値が所定の閾値よりも大きい画素では、高精度で効率的な三次元再構成のために小さなパターンを使用できる。
なお、本開示を上記実施の形態に基づいて説明してきたが、本開示は、上記の実施の形態に限定されないのはもちろんである。以下のような場合も本開示に含まれる。
(1)上記の各装置は、具体的には、マイクロプロセッサ、ROM、RAM、ハードディスクユニット、ディスプレイユニット、キーボード、マウスなどから構成されるコンピュータシステムで実現され得る。RAMまたはハードディスクユニットには、コンピュータプログラムが記憶されている。マイクロプロセッサが、コンピュータプログラムにしたがって動作することにより、各装置は、その機能を達成する。ここでコンピュータプログラムは、所定の機能を達成するために、コンピュータに対する指令を示す命令コードが複数個組み合わされて構成されたものである。
(2)上記の各装置を構成する構成要素の一部または全部は、1個のシステムLSI(Large Scale Integration:大規模集積回路)から構成されているとしてもよい。システムLSIは、複数の構成部を1個のチップ上に集積して製造された超多機能LSIであり、具体的には、マイクロプロセッサ、ROM、RAMなどを含んで構成されるコンピュータシステムである。ROMには、コンピュータプログラムが記憶されている。マイクロプロセッサが、ROMからRAMにコンピュータプログラムをロードし、ロードしたコンピュータプログラムにしたがって演算等の動作することにより、システムLSIは、その機能を達成する。
(3)上記の各装置を構成する構成要素の一部または全部は、各装置に脱着可能なICカードまたは単体のモジュールから構成されてもよい。ICカードまたはモジュールは、マイクロプロセッサ、ROM、RAMなどから構成されるコンピュータシステムである。ICカードまたはモジュールには、上記の超多機能LSIが含まれてもよい。マイクロプロセッサが、コンピュータプログラムにしたがって動作することにより、ICカードまたはモジュールは、その機能を達成する。このICカードまたはこのモジュールは、耐タンパ性を有してもよい。
(4)本開示は、上記に示す方法で実現されてもよい。また、これらの方法をコンピュータにより実現するコンピュータプログラムで実現してもよいし、コンピュータプログラムからなるデジタル信号で実現してもよい。
また、本開示は、コンピュータプログラムまたはデジタル信号をコンピュータ読み取り可能な記録媒体、例えば、フレキシブルディスク、ハードディスク、CD-ROM、MO、DVD、DVD-ROM、DVD-RAM、BD(Blu-ray(登録商標) Disc)、半導体メモリなどに記録したもので実現してもよい。また、これらの記録媒体に記録されているデジタル信号で実現してもよい。
また、本開示は、コンピュータプログラムまたはデジタル信号を、電気通信回線、無線または有線通信回線、インターネットを代表とするネットワーク、データ放送等を経由して伝送してもよい。
また、本開示は、マイクロプロセッサとメモリを備えたコンピュータシステムであって、メモリは、コンピュータプログラムを記憶しており、マイクロプロセッサは、コンピュータプログラムにしたがって動作してもよい。
また、プログラムまたはデジタル信号を記録媒体に記録して移送することにより、またはプログラムまたはデジタル信号をネットワーク等を経由して移送することにより、独立した他のコンピュータシステムにより実施するとしてもよい。
(5)上記実施の形態及び上記変形例をそれぞれ組み合わせるとしてもよい。
なお、上記各実施の形態において、各構成要素は、専用のハードウェアで構成されるか、各構成要素に適したソフトウェアプログラムを実行することによって実現されてもよい。各構成要素は、CPUまたはプロセッサなどのプログラム実行部が、ハードディスクまたは半導体メモリなどの記録媒体に記録されたソフトウェアプログラムを読み出して実行することによって実現されてもよい。ここで、上記各実施の形態の再構成方法、再構成装置などを実現するソフトウェアは、次のようなプログラムである。
すなわち、このプログラムは、コンピュータに、三次元空間上の同一の対象空間を異なる位置および姿勢で配置された複数のカメラにより撮像することで得られた複数の二次元画像を用いて三次元モデルを、プロセッサを用いて再構成する再構成方法であって、前記複数の二次元画像のそれぞれの画像情報に応じて、前記複数の二次元画像に含まれる特徴点のマッチング処理において使用するマッチングパターンのサイズおよび形状を決定し、決定した前記マッチングパターンに基づいて前記マッチング処理を行うことで、複数の三次元点により構成される第1三次元点群を再構成し、前記複数の二次元画像を用いて、前記第1三次元点群に新たな三次元点を追加することで三次元点が増加された第2三次元点群を生成し、前記第2三次元点群を用いて前記三次元モデルを再構成する再構成方法を実行させる。
以上、本開示の一つまたは複数の態様に係る再構成方法および再構成装置について、実施の形態に基づいて説明したが、本開示は、この実施の形態に限定されるものではない。本開示の趣旨を逸脱しない限り、当業者が思いつく各種変形を本実施の形態に施したものや、異なる実施の形態における構成要素を組み合わせて構築される形態も、本開示の範囲内に含まれてもよい。
本開示は、再構成方法または再構成装置において有利に利用される。
2 校正モジュール
4、4A 再構成モジュール
8 レンダリングモジュール
10 メモリ
12 ネットワークIF
100、100A 画像生成システム
101、101A 画像生成装置
102 カメラ
104 撮像装置
106、106A プロセッサ
108 ディスプレイ
110 入力装置
112 外部メモリ
114 モデルデータベース
116 同期装置
130 ネットワーク
132 ストレージ
138 サーバ
202 領域判定モジュール
204、204A 三次元点再構成モジュール
206、206A 三次元点増加モジュール
301、302、501、502、511~513 画像
503 直線
504 エピポーラ線

Claims (4)

  1. 三次元空間上の同一の対象空間を異なる位置および姿勢で配置された複数のカメラにより撮像することで得られた複数の二次元画像を用いて三次元モデルを、プロセッサを用いて再構成する再構成方法であって、
    前記複数の二次元画像のそれぞれの画像情報に応じて、前記複数の二次元画像に含まれる特徴点のマッチング処理において使用するマッチングパターンのサイズおよび形状を決定し、
    決定した前記マッチングパターンに基づいて前記マッチング処理を行うことで、複数の三次元点により構成される第1三次元点群を再構成し、
    前記複数の二次元画像を用いて、前記第1三次元点群に新たな三次元点を追加することで三次元点が増加された第2三次元点群を生成し、
    前記第2三次元点群を用いて前記三次元モデルを再構成する
    再構成方法。
  2. 前記マッチングパターンの決定では、
    前記複数の二次元画像のそれぞれについて、当該二次元画像を構成している1以上の領域をテクスチャ領域と非テクスチャ領域とに分類し、
    前記テクスチャ領域に分類した第1領域内には第1のサイズのパターンを前記マッチングパターンとして決定し、
    前記非テクスチャ領域に分類した第2領域には前記第1のサイズよりも大きい第2のサイズのパターンを前記マッチングパターンとして決定する
    請求項1に記載の再構成方法。
  3. 前記分類では、
    前記複数の二次元画像のそれぞれについて、当該二次元画像を構成する複数の画素の画素値に基づく分散マップおよびエッジマップを算出し、
    算出した前記分散マップおよび前記エッジマップを用いて、前記二次元画像を構成している前記1以上の領域をテクスチャ領域と非テクスチャ領域とに分類する
    請求項2に記載の再構成方法。
  4. 三次元空間上の同一の対象空間を異なる位置および姿勢で配置された複数のカメラにより撮像することで得られた複数の二次元画像を用いて三次元モデルを再構成する再構成装置であって、
    プロセッサを備え、
    前記プロセッサは、
    前記複数の二次元画像のそれぞれの画像情報に応じて、前記複数の二次元画像に含まれる特徴点のマッチング処理において使用するマッチングパターンのサイズおよび形状を決定し、
    決定した前記マッチングパターンに基づいて前記マッチング処理を行うことで、複数の三次元点により構成される第1三次元点群を再構成し、
    前記複数の二次元画像を用いて、前記第1三次元点群に新たな三次元点を追加することで三次元点が増加された第2三次元点群を生成し、
    前記第2三次元点群を用いて前記三次元モデルを再構成する
    再構成装置。
JP2019551083A 2017-10-23 2018-10-18 再構成方法および再構成装置 Active JP7105246B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201762575723P 2017-10-23 2017-10-23
US62/575,723 2017-10-23
PCT/JP2018/038885 WO2019082797A1 (ja) 2017-10-23 2018-10-18 再構成方法および再構成装置

Publications (2)

Publication Number Publication Date
JPWO2019082797A1 JPWO2019082797A1 (ja) 2020-11-12
JP7105246B2 true JP7105246B2 (ja) 2022-07-22

Family

ID=66246345

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019551083A Active JP7105246B2 (ja) 2017-10-23 2018-10-18 再構成方法および再構成装置

Country Status (3)

Country Link
US (1) US11328479B2 (ja)
JP (1) JP7105246B2 (ja)
WO (1) WO2019082797A1 (ja)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6548518B2 (ja) * 2015-08-26 2019-07-24 株式会社ソニー・インタラクティブエンタテインメント 情報処理装置および情報処理方法
JP7223978B2 (ja) * 2018-05-23 2023-02-17 パナソニックIpマネジメント株式会社 校正装置および校正方法
US11282180B1 (en) * 2019-04-24 2022-03-22 Apple Inc. Object detection with position, pose, and shape estimation
CN112215940B (zh) * 2019-07-11 2024-01-19 台达电子工业股份有限公司 场景模型的建构系统及其建构方法
JP7467074B2 (ja) * 2019-11-05 2024-04-15 キヤノン株式会社 画像処理装置、画像処理方法、及びプログラム
CN112652056B (zh) * 2020-12-25 2023-09-05 北京奇艺世纪科技有限公司 一种3d信息展示方法及装置
CN116917946A (zh) 2021-02-28 2023-10-20 镭亚股份有限公司 提供临时纹理应用以增强3d建模的方法和系统
CN112967398B (zh) * 2021-03-01 2023-07-25 北京奇艺世纪科技有限公司 一种三维数据重建方法、装置及电子设备
CN114565648A (zh) * 2022-02-28 2022-05-31 上海商汤临港智能科技有限公司 重建车位评测方法、装置、设备及存储介质
JP7394934B1 (ja) 2022-08-16 2023-12-08 株式会社デンソーテン 情報処理装置、情報処理方法、およびプログラム
KR102870672B1 (ko) * 2022-08-29 2025-10-15 한국전자통신연구원 3차원 공간 정보 생성 방법 및 장치
CN115346006A (zh) * 2022-10-20 2022-11-15 潍坊歌尔电子有限公司 3d重建方法、装置、电子设备和存储介质
JP2024062300A (ja) * 2022-10-24 2024-05-09 キヤノン株式会社 画像処理装置、画像処理方法及びコンピュータプログラム
CN115546379A (zh) * 2022-11-29 2022-12-30 思看科技(杭州)股份有限公司 一种数据处理方法、装置和计算机设备
CN119379819B (zh) * 2024-09-18 2025-12-09 鹏城实验室 点云数据处理方法、装置、设备和存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008310724A (ja) 2007-06-18 2008-12-25 Nippon Telegr & Teleph Corp <Ntt> 3次元形状復元装置,3次元形状復元方法,3次元形状復元プログラム及びそのプログラムを格納した記録媒体
JP2016121917A (ja) 2014-12-24 2016-07-07 パナソニックIpマネジメント株式会社 3次元情報復元装置、3次元情報復元システム、及び3次元情報復元方法
US20160314593A1 (en) 2015-04-21 2016-10-27 Hexagon Technology Center Gmbh Providing a point cloud using a surveying instrument and a camera device
WO2017033853A1 (ja) 2015-08-26 2017-03-02 株式会社ソニー・インタラクティブエンタテインメント 情報処理装置および情報処理方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8698899B2 (en) * 2005-04-15 2014-04-15 The University Of Tokyo Motion capture system and method for three-dimensional reconfiguring of characteristic point in motion capture system
US8331615B2 (en) 2007-08-01 2012-12-11 The Board Of Trustees Of The University Of Illinois Match, expand, and filter technique for multi-view stereopsis
US9078048B1 (en) * 2008-07-15 2015-07-07 Google Inc. Finding and populating spatial ad surfaces in video
CN102411703A (zh) * 2010-09-21 2012-04-11 索尼公司 检测图像序列中的特定对象的装置、方法和视频摄像设备
CN104041017B (zh) * 2012-01-17 2017-08-11 索尼公司 信息处理设备和方法
JP2016038886A (ja) * 2014-08-11 2016-03-22 ソニー株式会社 情報処理装置および情報処理方法
US9830706B2 (en) * 2015-09-17 2017-11-28 Skycatch, Inc. Generating georeference information for aerial images

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008310724A (ja) 2007-06-18 2008-12-25 Nippon Telegr & Teleph Corp <Ntt> 3次元形状復元装置,3次元形状復元方法,3次元形状復元プログラム及びそのプログラムを格納した記録媒体
JP2016121917A (ja) 2014-12-24 2016-07-07 パナソニックIpマネジメント株式会社 3次元情報復元装置、3次元情報復元システム、及び3次元情報復元方法
US20160314593A1 (en) 2015-04-21 2016-10-27 Hexagon Technology Center Gmbh Providing a point cloud using a surveying instrument and a camera device
WO2017033853A1 (ja) 2015-08-26 2017-03-02 株式会社ソニー・インタラクティブエンタテインメント 情報処理装置および情報処理方法

Also Published As

Publication number Publication date
US20200250885A1 (en) 2020-08-06
US11328479B2 (en) 2022-05-10
JPWO2019082797A1 (ja) 2020-11-12
WO2019082797A1 (ja) 2019-05-02

Similar Documents

Publication Publication Date Title
JP7105246B2 (ja) 再構成方法および再構成装置
US11295516B2 (en) Reconstruction method, reconstruction device, and generation method for generating a three-dimensional (3D) model
EP2992508B1 (en) Diminished and mediated reality effects from reconstruction
US10789765B2 (en) Three-dimensional reconstruction method
US9412034B1 (en) Occlusion handling for computer vision
US11017587B2 (en) Image generation method and image generation device
JP7285834B2 (ja) 三次元再構成方法および三次元再構成装置
CN109690620A (zh) 三维模型生成装置以及三维模型生成方法
JP7660284B2 (ja) 三次元モデル生成方法及び三次元モデル生成装置
JPWO2020075252A1 (ja) 情報処理装置、プログラム及び情報処理方法
JP7407428B2 (ja) 三次元モデル生成方法及び三次元モデル生成装置
CN117635809A (zh) 3d模型生成方法、系统及电子设备
TW201436552A (zh) 用於使用至少一較高訊框率之影像流而增加影像流之訊框率之方法及裝置
JP2020004219A (ja) 3次元形状データを生成する装置、方法、及びプログラム
CN117611765A (zh) 虚拟场景模型的生成方法、装置、存储介质及电子设备
JP2013185905A (ja) 情報処理装置及び方法、並びにプログラム
KR102358854B1 (ko) 얼굴 이미지 색상 합성 장치 및 방법
JP6857924B1 (ja) モデル生成装置、及び、モデル生成方法
KR101804157B1 (ko) 개선된 sgm 기반한 시차 맵 생성 방법
KR101619486B1 (ko) 좌표변환 매트릭스를 이용한 3차원 큐브 파노라마 장치
US20120162215A1 (en) Apparatus and method for generating texture of three-dimensional reconstructed object depending on resolution level of two-dimensional image
JP6991700B2 (ja) 情報処理装置、情報処理方法、プログラム
JP6595878B2 (ja) 要素画像群生成装置及びそのプログラム
CN116704111B (zh) 图像处理方法和设备
KR20190029842A (ko) 지피유 가속 컴퓨팅을 이용한 3차원 복원 클라우드 포인트 생성 방법

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210804

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220621

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220711

R150 Certificate of patent or registration of utility model

Ref document number: 7105246

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150