JP2020061130A - グラフ信号処理を使用したオブジェクトの高密度な表面を再構築するためのシステムおよび方法 - Google Patents

グラフ信号処理を使用したオブジェクトの高密度な表面を再構築するためのシステムおよび方法 Download PDF

Info

Publication number
JP2020061130A
JP2020061130A JP2019159751A JP2019159751A JP2020061130A JP 2020061130 A JP2020061130 A JP 2020061130A JP 2019159751 A JP2019159751 A JP 2019159751A JP 2019159751 A JP2019159751 A JP 2019159751A JP 2020061130 A JP2020061130 A JP 2020061130A
Authority
JP
Japan
Prior art keywords
graph
azimuth values
signal processing
polarization
azimuth
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019159751A
Other languages
English (en)
Other versions
JP6830988B2 (ja
Inventor
アニル クマール,アチャンナ
Anil Kumar Achanna
アニル クマール,アチャンナ
プルショタマン,バラムラリダー
Purushothaman Balamuralidhar
マリスワミー チャンドラ,ギリシュ
Mariswamy Chandra Girish
マリスワミー チャンドラ,ギリシュ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tata Consultancy Services Ltd
Original Assignee
Tata Consultancy Services Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tata Consultancy Services Ltd filed Critical Tata Consultancy Services Ltd
Publication of JP2020061130A publication Critical patent/JP2020061130A/ja
Application granted granted Critical
Publication of JP6830988B2 publication Critical patent/JP6830988B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/50Depth or shape recovery
    • G06T7/55Depth or shape recovery from multiple images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/14Fourier, Walsh or analogous domain transformations, e.g. Laplace, Hilbert, Karhunen-Loeve, transforms
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01BMEASURING LENGTH, THICKNESS OR SIMILAR LINEAR DIMENSIONS; MEASURING ANGLES; MEASURING AREAS; MEASURING IRREGULARITIES OF SURFACES OR CONTOURS
    • G01B11/00Measuring arrangements characterised by the use of optical techniques
    • G01B11/24Measuring arrangements characterised by the use of optical techniques for measuring contours or curvatures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/50Depth or shape recovery
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/95Computational photography systems, e.g. light-field imaging systems
    • H04N23/951Computational photography systems, e.g. light-field imaging systems by using two or more images to influence resolution, frame rate or aspect ratio
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20048Transform domain processing
    • G06T2207/20056Discrete and fast Fourier transform, [DFT, FFT]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20072Graph-based image processing
    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01LSEMICONDUCTOR DEVICES NOT COVERED BY CLASS H10
    • H01L27/00Devices consisting of a plurality of semiconductor or other solid-state components formed in or on a common substrate
    • H01L27/14Devices consisting of a plurality of semiconductor or other solid-state components formed in or on a common substrate including semiconductor components sensitive to infrared radiation, light, electromagnetic radiation of shorter wavelength or corpuscular radiation and specially adapted either for the conversion of the energy of such radiation into electrical energy or for the control of electrical energy by such radiation
    • H01L27/144Devices controlled by radiation
    • H01L27/146Imager structures
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N2013/0074Stereoscopic image analysis
    • H04N2013/0081Depth or disparity estimation from stereoscopic image signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Algebra (AREA)
  • Computing Systems (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Image Analysis (AREA)
  • Length Measuring Devices By Optical Means (AREA)
  • Investigating Or Analysing Materials By Optical Means (AREA)

Abstract

【課題】グラフ信号処理を使用したオブジェクトの高密度な表面の再構築のためのシステム及び方法を提供する。【解決手段】システムと方法は、抽出された1以上のスパース3次元形状から、オブジェクトの第1領域に対応する方位角値の第1セットを識別することにより、πの曖昧性を解決する。位相角を使用して、方位角値の第1セットと推定される方位角値の第2セットとの間の関係構造をキャプチャしたグラフを構築する。構築されたグラフに対応するグラフフーリエ変換(GFT)行列を取得する。そして、グラフ信号処理技術により、GFT行列と方位角値の第1セットから、オブジェクトの第2領域に対応する方位角値の第2セットを推定する。【選択図】図2A

Description

関連する出願と優先権の相互参照
この特許出願は、2018年9月1日に提出されたインド特許出願201821032911の優先権を主張する。
技術分野
本明細書の開示は、一般的に表面の再構築に関し、より詳細には、グラフ信号処理を使用したオブジェクトの高密度な表面の再構築のためのシステムおよび方法に関する。
現実世界のオブジェクトの形状と外観のデジタル再構築または再現は、特にさまざまな分野での応用性により、このデジタル時代に大きな趨勢を獲得している。特に、オブジェクトの3次元(3D)再構築は近年注目を集めている。従来の技術の中には、異なる照明条件下で3Dスキャンと写真との組み合わせを使用して、オブジェクトの形状と反射率のモデルを取得するものがある。これらの特徴の両方が測定されると、モデルを使用して、あらゆる環境の光を反射して、オブジェクトがどのような視点から見えるかを忠実にレンダリングすることができる。
広く使用されているデジタル再構築技術の1つは、マルチビューステレオ(MVS)技術である。MVSは、複数の画像から高密度の3Dモデルを再構築する。MVSはコンピュータビジョンで集中的に研究されており、コンピュータグラフィックス、ロボット工学、コンピュータ支援設計、および人間とコンピュータの相互作用の幅広いアプリケーションに使用されている。MVSは、エピポーラ拘束のある特徴の対応関係を見つけることに依存している。したがって、対応関係を確実に見つけることができないため、特徴のないオブジェクトの処理には根本的な欠陥がある。しかしながら、特徴がスパース(sparse)な3Dオブジェクトでは、MVSは基本的に特徴の対応に基づいているため、MVSなどの一般的なマルチビュー3D再構築方法では高密度の再構築ができない。
本開示の実施態様は、従来のシステムにおいて発明者によって認識された上述の技術的問題の1以上の解決策として技術的改善を提示する。例えば、1つの実施態様において、グラフ信号処理を使用してオブジェクトの高密度な(dense)表面を再構築する方法が提供され、該方法は、画像キャプチャデバイスを使用して、複数のマルチビュー偏光画像をキャプチャするステップであって、複数のマルチビュー偏光画像の各々は、複数の偏光角で変わるオブジェクトのマルチピクセル画像を含む、前記ステップ;キャプチャされた複数の偏光画像に基づいて、1以上のハードウェアプロセッサによって複数のステップを実施(perform)するステップであって、該複数のステップは:(i)キャプチャされた複数のマルチビュー偏光画像の各々にマルチビューステレオ(MVS)技術を実行(implement)することにより、オブジェクトの1以上のスパース(sparse)3次元形状を抽出するステップであって、1以上のスパース3次元形状は、オブジェクトの第1領域に対応する方位角値の第1セット(set)を識別するために使用される、前記ステップ;および(ii)キャプチャされた複数のマルチビュー偏光画像に偏光反射率モデリング技術を実行することにより、オブジェクトの表面点の各ビューに対応する偏光度および位相角を計算するステップ;を含む、前記ステップ;位相角と1以上のスパース3次元形状を使用して、グラフ信号処理技術により方位角値の第2セットを推定するステップであって、該推定は:(i)1以上のスパース3次元形状から、オブジェクトの第1領域に対応する方位角値の第1セットを識別するステップ;(ii)位相角を使用して、方位角値の第1セットと推定される方位角値の第2セットとの間の関係構造をキャプチャしたグラフを構築するステップ;(iii)グラフ信号処理技術によって構築されたグラフに対応するグラフフーリエ変換(GFT)行列を取得するステップ;および(iv)GFT行列および方位角値の第1セットから、グラフ信号処理技術によってオブジェクトの第2領域に対応する明確な(曖昧性のない(unambiguous))方位角値を含む方位角値の第2セットを推定するステップ;を含む、前記ステップ;推定された方位角値の第2セットと位相角との比較に基づいて、オブジェクトの偏光正反射(specular reflection)優勢領域および偏光拡散反射(diffuse reflection)優勢領域を分類するステップ;分類に基づいて、非線形最小二乗推定技術を実行することにより天頂角を推定するステップであって、天頂角は、オブジェクトの表面の偏光度と屈折率との関数である、前記ステップ;方位角値の第2セットおよび天頂角を使用して、オブジェクトの高密度な3次元表面を再構築するステップ;グラフ信号処理技術の実行によって方位角値の第1セットに対応するサンプリングセットを取得するステップ;グラフ信号再構築技術を使用してGFT行列に線形変換を実施するステップ;方位角値の第2セットを推定するための位相角のグラフフーリエ変換(GFT)スペクトルをグラフ信号処理技術によって表すステップ;およびGFTスペクトルに基づいて、カットオフグラフ周波数を選択して方位角値の第2セットを推定すること;を含み、カットオフグラフ周波数は構築されたグラフに対応する。
別の側面では、グラフ信号処理を使用してオブジェクトの高密度な表面を再構築するためのシステムが提供され、該システムは:命令を記憶するメモリ;1以上の通信インターフェース;および1以上の通信インターフェースを介してメモリに結合された1以上のハードウェアプロセッサを含み、1以上のハードウェアプロセッサは、以下の命令:画像キャプチャデバイスを使用して、複数のマルチビュー偏光画像をキャプチャするステップであって、複数のマルチビュー偏光画像の各々は、複数の偏光角で変わるオブジェクトのマルチピクセル画像を含む、前記ステップ;キャプチャされた複数の偏光画像に基づいて、複数のステップを実施するステップであって、該複数のステップは:(i)キャプチャされた複数のマルチビュー偏光画像の各々にマルチビューステレオ(MVS)技術を実行することにより、オブジェクトの1以上のスパース3次元形状を抽出するステップであって、1以上のスパース3次元形状は、オブジェクトの第1領域に対応する方位角値の第1セットを識別するために使用される、前記ステップ;および(ii)キャプチャされた複数のマルチビュー偏光画像に偏光反射率モデリング技術を実行することにより、オブジェクトの表面点の各ビューに対応する偏光度および位相角を計算するステップ;を含む、前記ステップ;位相角と1以上のスパース3次元形状を使用して、グラフ信号処理技術により方位角値の第2セットを推定するステップであって、該推定は:(i)1以上のスパース3次元形状から、オブジェクトの第1領域に対応する方位角値の第1セットを識別するステップ;(ii)位相角を使用して、方位角値の第1セットと推定される方位角値の第2セットとの間の関係構造をキャプチャしたグラフを構築するステップ;(iii)グラフ信号処理技術によって構築されたグラフに対応するグラフフーリエ変換(GFT)行列を取得するステップ;および(iv)GFT行列および方位角値の第1セットから、グラフ信号処理技術によってオブジェクトの第2領域に対応する明確な方位角値を含む方位角値の第2セットを推定するステップ;を含む、前記ステップ;推定された方位角値の第2セットと位相角との比較に基づいて、オブジェクトの偏光正反射優勢領域および偏光拡散反射優勢領域を分類するステップ;分類に基づいて、非線形最小二乗推定技術を実行することにより天頂角を推定するステップであって、天頂角は、オブジェクトの表面の偏光度と屈折率との関数である、前記ステップ;方位角値の第2セットおよび天頂角を使用して、オブジェクトの高密度な3次元表面を再構築するステップ;方位角値の第2セットを推定するステップの前に、グラフ信号処理技術の実行によって方位角値の第1セットに対応するサンプリングセットを取得するステップ;グラフ信号再構築技術を使用してGFT行列に線形変換を実施して、方位角値の第2セットを推定するステップ;方位角値の第2セットを推定するための位相角のグラフフーリエ変換(GFT)スペクトルをグラフ信号処理技術を使用して表すことによって、グラフを構築するステップ;およびGFTスペクトルに基づいて、カットオフグラフ周波数を選択して方位角値の第2セットを推定することによって、GFTスペクトルを表すステップ;によって構成され、カットオフグラフ周波数は構築されたグラフに対応する。
さらに、別の側面では、1以上の命令を含む1以上の非一時的な機械可読情報記憶媒体が提供され、該命令は、1以上のハードウェアプロセッサによって執行されると、1以上のハードウェアプロセッサに、グラフ信号処理を使用してオブジェクトの高密度な表面を再構築する方法を実行させ、該方法は、画像キャプチャデバイスを使用して、複数のマルチビュー偏光画像をキャプチャするステップであって、複数のマルチビュー偏光画像の各々は、複数の偏光角で変わるオブジェクトのマルチピクセル画像を含む、前記ステップ;キャプチャされた複数の偏光画像に基づいて、複数のステップを実施するステップであって、該複数のステップは:(i)キャプチャされた複数のマルチビュー偏光画像の各々にマルチビューステレオ(MVS)技術を実行することにより、オブジェクトの1以上のスパース3次元形状を抽出するステップであって、1以上のスパース3次元形状は、オブジェクトの第1領域に対応する方位角値の第1セットを識別するために使用される、前記ステップ;および(ii)キャプチャされた複数のマルチビュー偏光画像に偏光反射率モデリング技術を実行することにより、オブジェクトの表面点の各ビューに対応する偏光度および位相角を計算するステップ;を含む、前記ステップ;位相角と1以上のスパース3次元形状を使用して、グラフ信号処理技術により方位角値の第2セットを推定するステップであって、該推定は:(i)1以上のスパース3次元形状から、オブジェクトの第1領域に対応する方位角値の第1セットを識別するステップ;(ii)位相角を使用して、方位角値の第1セットと推定される方位角値の第2セットとの間の関係構造をキャプチャしたグラフを構築するステップ;(iii)グラフ信号処理技術によって構築されたグラフに対応するグラフフーリエ変換(GFT)行列を取得するステップ;および(iv)GFT行列および方位角値の第1セットから、グラフ信号処理技術によってオブジェクトの第2領域に対応する明確な方位角値を含む方位角値の第2セットを推定するステップ;を含む、前記ステップ;推定された方位角値の第2セットと位相角との比較に基づいて、オブジェクトの偏光正反射優勢領域および偏光拡散反射優勢領域を分類するステップ;分類に基づいて、非線形最小二乗推定技術を実行することにより天頂角を推定するステップであって、天頂角は、オブジェクトの表面の偏光度と屈折率との関数である、前記ステップ;方位角値の第2セットおよび天頂角を使用して、オブジェクトの高密度な3次元表面を再構築するステップ;グラフ信号処理技術の実行によって方位角値の第1セットに対応するサンプリングセットを取得するステップ;グラフ信号再構築技術を使用してGFT行列に線形変換を実施するステップ;グラフ信号処理技術を使用して方位角値の第2セットを推定するための位相角のグラフフーリエ変換(GFT)スペクトルを表すステップ;およびカットオフグラフ周波数を選択して方位角値の第2セットを推定するステップ;を含み、カットオフグラフ周波数は構築されたグラフに対応する。
前述の一般的な説明および以下の詳細な説明の両方は、例示および説明のみであり、特許請求の範囲の本発明を制限するものではないことを理解されたい。
本開示に組み込まれ、本開示の一部を構成する添付図面は、例示的な実施態様を示し、説明とともに、開示された原理を説明する役目を果たす。
図1は、本開示のいくつかの実施態様による、グラフ信号処理を使用するオブジェクトの高密度な表面の再構築のためのシステムのブロック図を示す。
図2Aは、本開示のいくつかの実施態様による、グラフ信号処理を使用したオブジェクトの高密度な表面の再構築のプロセスに含まれるステップを示すフロー図である。 図2Bは、本開示のいくつかの実施態様による、グラフ信号処理を使用したオブジェクトの高密度な表面の再構築のプロセスに含まれるステップを示すフロー図である。 図2Cは、本開示のいくつかの実施態様による、グラフ信号処理を使用したオブジェクトの高密度な表面の再構築のプロセスに含まれるステップを示すフロー図である。
図3A−3Bは、本開示のいくつかの実施態様による、キャプチャされた複数のマルチビュー偏光画像の例を示す。 図3Cは、本開示のいくつかの実施態様による、キャプチャされた複数のマルチビュー偏光画像の例を示す。
図4は、本開示のいくつかの実施態様による、マルチビューステレオ(MVS)技術を実行することにより抽出された1以上のスパース3次元形状の例を示す。
図5は、本開示のいくつかの実施態様による、構築されたグラフの例を示す。
図6Aは、本開示のいくつかの実施態様による、グラフ周波数に関する実際の方位角のグラフフーリエスペクトルのゲイン線図を示す。
図6Bは、本開示のいくつかの実施態様による、グラフ周波数に関する計算された位相角のゲイン線図を示している。
図7A−7Cは、本開示のいくつかの実施態様による、提案された方法論および従来のシステムおよび方法を実行することにより取得された結果のグラフィカル分類を示す。
例示的な実施態様は、添付の図面を参照して説明される。図では、参照番号の左端の数字は、参照番号が最初に現れる図を識別する。便宜上、図面全体を通して同じ参照番号を使用して、同じまたは同様の部品を指す。開示された原理の例および特徴が本明細書で説明されているが、開示された実施態様の精神および範囲から逸脱することなく、修正、適合、および他の実行が可能である。以下の詳細な説明は例示としてのみ考慮されることを意図しており、真の範囲および精神は添付の特許請求の範囲によって示される。
本開示の実施態様は、グラフ信号処理を使用してオブジェクトの高密度な表面の再構築のためのシステムおよび方法を提供する。マルチビューステレオ(MVS)3次元(3D)表面再構築は、3Dスキャンと印刷、製品検査などの拡張現実を含むアプリケーションのコンピュータビジョンにおける重要な問題である。これらのアプリケーションの多くでは、高密度な再構築を取得することが最も望ましい。しかしながら、実際には、MVSのさまざまな制限(たとえば、特徴の対応に基づいている)により、オブジェクトの高密度な表面の再構築を提供できない。
偏光マルチビューステレオ(PMS)として知られる代替アプローチは、偏光からの測光情報と複数のビューからのエピポーラ拘束を組み合わせることにより、特徴がスパースなオブジェクトの高密度3D表面を再構築する(参照: Z. Cui, J. Gu, B. Shi, P. Tan, and J. Kautz, “Polarimetric multi-view stereo,” in Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, 2017, pp. 1558-1567)。PMSは、偏光拡散のみまたは偏光正反射のみの実用的ではない仮定を使用せず、照明方向または赤緑青および深度(RGB−D)センサーなどの追加センサーの必要性も克服する。
偏光されていない光が表面に入射すると、ほとんどの表面は部分的に偏光された光を反射する。この偏光された光は、黄褐色のオブジェクトの表面法線に関する豊富な情報を含み、偏光からの形状(SfP)キューの基礎を形成する。このようにPMSを使用して取得される表面法線は高密度であり、上記の他の技術とは異なり、制御された照明や高密度な特徴を必要としないため、滑らかな特徴のない3Dオブジェクトを高密度に再構築できる。
しかしながら、偏光から取得された表面法線には特定の曖昧性があり、形状の再構築に有意義に使用する前に解決する必要がある。SfPアプローチを使用する際の主な曖昧性の1つは、位相角からの方位角の推定にある。方位角推定では、π/2の曖昧性とπの曖昧性と呼ばれる2種類の曖昧性を解決する必要がある。
従来のシステムおよび方法のいくつかは、π/2の曖昧性の解決を提供するが、従来のシステムおよび方法のいずれも、πの曖昧性の解決を提供しない。PMSなどの従来のシステムと方法は、単純にπの曖昧性をバイパスする一方で、高密度な再構築を提供するため、πの曖昧性を解決しない。
ここで図面、特に図1〜7Cを参照すると、類似の参照文字は図面全体を通して一貫して対応する特徴を示し、好ましい実施態様が示され、これらの実施態様は、以下の例示的なシステムおよび/または方法の文脈で説明される。
図1は、本開示の一実施態様による、グラフ信号処理を使用したオブジェクトの高密度な表面の再構築のためのシステム100の例示的なブロック図を示している。一実施態様では、システム100は、1以上のプロセッサ104、通信インターフェースデバイスまたは入力/出力(I/O)インターフェース106、および1以上のプロセッサ104に動作可能に結合された1以上のデータ記憶デバイスまたはメモリ102を含む。ハードウェアプロセッサである1以上のプロセッサ104は、1以上のマイクロプロセッサ、マイクロコンピュータ、マイクロコントローラ、デジタル信号プロセッサ、中央処理ユニット、ステートマシン、論理回路、および/または操作命令に基づいて信号を操縦(manipulate)するデバイスとして実行できる。他の機能の中でも、プロセッサは、メモリ102に格納されたコンピュータ可読命令をフェッチして執行するように構成されている。一実施態様では、システム100は、ラップトップコンピュータ、ノートブック、ハンドヘルドデバイス、ワークステーション、メインフレームコンピュータ、サーバ、ネットワーククラウドなどの様々なコンピューティングシステムで実行することができる。
I/Oインターフェースデバイス106は、さまざまなソフトウェア、および、例えばウェブインターフェース、グラフィカルユーザーインターフェースなどのハードウェアインターフェースを含むことができ、LAN、ケーブルなどの有線ネットワーク、およびWLAN、セルラー、衛星などのワイヤレスネットワークを含む、多種多様なネットワークN/Wおよびプロトコルタイプ内での複数の通信を容易にすることができる。一実施態様では、I/Oインターフェースデバイスは、多数のデバイスを互いにまたは別のサーバに接続するための1以上のポートを含むことができる。
メモリ102は、例えば、スタティックランダムアクセスメモリ(SRAM)およびダイナミックランダムアクセスメモリ(DRAM)などの揮発性メモリ、および/または、読み取り専用メモリ(ROM)、消去可能なプログラマブルROM、フラッシュメモリ、ハードディスク、光ディスク、および磁気テープなどの不揮発性メモリを含む、当技術分野で知られている任意のコンピュータ可読媒体を含み得る。
図1を参照して、図2A〜図2Cは、本開示のいくつかの実施態様による、グラフ信号処理を使用するオブジェクトの高密度な表面の再構築のための方法の例示的なフロー図を示す。一実施態様では、システム100は、1以上のハードウェアプロセッサ104に動作可能に結合されたメモリ102の1以上のデータストレージデバイスを備え、1以上のプロセッサ104による方法のステップの執行のための命令を格納するように構成される。ここで、本開示の方法のステップを、図1に示されるシステム100のコンポーネントおよびフロー図を参照して説明する。本開示の実施態様では、ハードウェアプロセッサ104は、命令が構成されると、本明細書で説明される1以上の方法を実施する。
本開示の一実施態様によれば、ステップ201で、画像キャプチャデバイス(図示せず)を介して複数のマルチビュー偏光画像をキャプチャすることができ、複数のマルチビュー偏光画像の各々は、複数の偏光角で変わるオブジェクトのマルチピクセル画像を含む。画像キャプチャデバイスは、偏光レンズを備えたデジタル一眼レフカメラ(DSLR)カメラを含むことができるが、これに限定されない。DSLRカメラの偏光レンズを異なる偏光角で回転させて、各角度から(関心のある)オブジェクトの少なくとも1つのマルチピクセル画像をキャプチャし、複数のマルチビュー偏光画像を取得する。
当技術分野で知られているように、偏光されていない光が任意のオブジェクトに当たると、3つのタイプの反射、すなわち偏光正反射、偏光拡散反射、および偏光されていない拡散反射が観察され、偏光正反射および偏光拡散反射の両方は、ほとんどの表面で部分的に偏光される。次に、反射光は偏光レンズを通過し、前述のように、偏光レンズは異なる偏光角(つまり、少なくとも3つの異なる偏光角)で回転し、複数のマルチビュー偏光画像を取得する。図3A〜図3Cを参照すると、0°(度)、60°、および120°でキャプチャされた複数のマルチビュー偏光画像の例を参照することができる。
本開示の一実施態様によれば、ステップ202で、1以上のハードウェアプロセッサ104は、キャプチャされた複数の偏光画像に基づいて複数のステップを実施する。ステップ202(i)で、1以上のハードウェアプロセッサ104は、キャプチャされた複数のマルチビュー偏光画像の各々にマルチビューステレオ(MVS)技術を実行することにより、オブジェクトの1以上のスパース3次元形状を抽出する。一実施態様では、1以上のスパース3次元形状を使用して、オブジェクトの第1領域に対応する方位角値の第1セットを識別する(以下のステップ203(i)で説明する)。
当該技術分野で知られているように、MVS技術(またはマルチビュー3次元(3D)表面再構築技術)は、異なる視点から撮影された画像のセットから完全な3次元(3D)モデルを再構築することを含む。MVS技術は、2つの主要なステップで構成される:(i)局所(local)画像マッチング法を使用して、写真一貫性測定と可視性モデルに基づいて3Dポイントを推定するステップ、(ii)推定された3Dポイントクラウドから3Dモデルを再構築するステップ。
一実施態様では、オブジェクトの1以上のスパース3次元形状を抽出するために実行され得るMVS技術は、レベルセット技術またはスペースカービング技術を含み得る。MVS技術の実行によって抽出された複数の偏光画像の各々のスパース表現(または1以上のスパース3次元形状)は、復元データを含み、それによって強化されたマルチビュー偏光画像を提供する。実行例において、図4を参照すると、キャプチャされた複数のマルチビュー偏光画像の各々にMVS技術を実行することにより抽出されたスパース3次元形状の例が参照され得る(図3A〜3Cで参照すると)。
ステップ202(ii)で、1以上のハードウェアプロセッサ104は、キャプチャされた複数のマルチビュー偏光画像に偏光反射率モデリング技術(例えば、ランバートモデリング)を実行することにより、オブジェクトの表面点の各ビューに対応する偏光度および位相角を計算する。当技術分野で知られているように、とりわけ、反射光の偏光成分の大きさ、1以上の正反射によって引き起こされる強度エッジ、表面法線の拘束などを正確に予測するために、偏光反射率モデリング技術が使用される。
前述のように、偏光されていない光がオブジェクトに当たると、偏光正反射、偏光拡散反射、および偏光されていない拡散反射の3つのタイプの反射が観察される場合があり、偏光正反射と偏光拡散反射の両方が、ほとんどの表面で部分的に偏光されている。かかる反射偏光成分の強度は、偏光関数、例えばΦpolの偏光角の関数として正弦波的に変わる。特に、偏光拡散反射Idp(Φpol)および偏光正反射Isp(Φpol)に対応する測定強度は、以下の式(1)で表される
ここで、
およびImaxとIminは、観測された正弦波状に変わる強度の最大値と最小値をそれぞれ示す。オブジェクトの表面の任意の点での位相角Φ(phi)と方位角φは、優勢的な反射タイプに依存し、以下の式(2)に示すように関連している。
係数
は非偏光強度を示し、
係数
は偏光度と呼ばれる。
反射のタイプ、つまり偏光拡散反射または偏光正反射に応じて、偏光度ρは以下の式(3)および(4)のように関連する場合がある。
ここで、nとθはそれぞれ屈折率と天頂角を示す。一実施態様では、式(3)は、偏光正反射の関係を提供する一方で、式(4)は偏光拡散反射の関係を提供する。一般に、位相角Φ(phi)は、原点またはゼロ交差に関して経過した振動の一部を示す。偏光度は、オブジェクトに対応する入射光の偏光度を含む。一実施態様では、計算された位相角Φ(phi)は、特徴が制限された領域での方位角値の推定を容易にする。
上記のステップ201と同じシナリオ例を考えて、偏光反射モデリング技術、たとえば非線形最小二乗アルゴリズムを使用して、位相角Φと偏光度ρを0°(度)、60°および120°で次のようにキャプチャされた複数のマルチビュー偏光画像に対して計算することができる。
Φ=0.9777、0.0896、0.5204、0.3205、および0.8261;
ここで、計算された位相角値は、オブジェクトの表面上の5つの隣接点のセットに対応し、各計算された位相値は、5つの隣接点のセットのうちの1つの点に対応する。
本開示の一実施態様によれば、ステップ203において、1以上のハードウェアプロセッサ104は、計算された位相角および1以上のスパース3次元形状を使用して、方位角値の第2セットを推定し、方位角値の第2セットは、グラフ信号処理技術を実行することにより推定される。推定された方位角値の第2セット(明確な方位角値を含む)は、πとπ/2の両方の曖昧性を解決する。したがって、単にπ/2の曖昧性を解決する従来のシステムおよび方法と比較して、提案された開示は、グラフ信号処理技術を実行することにより、πおよびπ/2の両方の曖昧性を解決する方法論を提供する。方位角値の第2セットを推定してπの曖昧性を解決するプロセスを詳細に検討することができる。
グラフ信号処理
グラフ信号、グラフフーリエ変換(GFT)、帯域制限、サンプリングおよびサンプリングされた信号の再構築を理解することにより、方位角値の第2セットを推定するためのグラフ信号処理(グラフ信号処理技術とも呼ばれる)の実行について説明する。
一実施態様では、グラフ信号は、サンプルがグラフGのノードによってインデックス付けされる信号である。
は、V={1,2,…,N}のセットでインデックス付けされたN個のノードで構成される、既知の接続された無向の加重グラフを示し、エッジ
によって接続され、ここで、wpqはpthとqthとのノード間のエッジの重みを示し、wpp=0である。[W]p、q=wpqのN×N隣接行列Wは対称行列、つまり、無向グラフの仮定による
である。グラフラプラシアンはキー行列を含み、L=D−Wとして定義でき、ここで、対角行列D=diag{d,d,…,d}は次数行列と呼ばれ、すべてにおいて、
グラフ信号処理技術のグラフシフト演算子Sは、シフト演算子、つまり、従来の離散信号処理技術におけるシフトz−1によって実施されるのと同様の関数を実施する。一般に、Sの選択は、ラプラシアン行列または隣接行列のいずれかを含む。Sは対称行列であるため、分解S=[u,……,u]diag(λ,……,λ)[u,……,uを受け入れる。固有ベクトルU={u,……,u}および対応する固有値{λ,……,λ}は、グラフのコンテキストで頻度の概念を提供し、したがって、行列UおよびUは、それぞれ順グラフフーリエ変換(GFT)行列および逆GFT行列と呼ばれる場合がある(参照:D. I. Shuman, S. K. Narang, P. Frossard, A. Ortega, and P. Vandergheynst, “The emerging field of signal processing on graphs: Extending high-dimensional data analysis to networks and other irregular domains,” IEEE Signal Processing Magazine, vol. 30, no. 3, pp. 83-98, 2013)。したがって、グラフ信号fのGFTおよび逆GFTは、それぞれ
として定義できる。
さらに、グラフ信号fは、|λp|>ωですべてのpに対して
の場合、
ω帯域制限として定義できる。
一実施形態では、R={1,2,……,r)および相補セットを
とし、rはωより小さい固有値の数を示し、UVRはRに対応する列を含むUのサブ行列を示す。したがって、ω帯域制限信号は、以下の式(5)で表すことができる:
セット{u,u……,u}は、PWω(G)で示されるペイリー・ウィーナー空間と呼ばれるベクトル空間に広がり、すべてのω帯域制限グラフ信号を含む。
一実施態様では、帯域制限により、情報の損失なしに信号fをサンプリングし再構築することができる。Sがサンプリングセットを示すもの、つまり、Sは、|S|=dのサンプリングノードのインデックスを含むとする。
を、その列がSの指標関数であり、サンプリングセット演算子
である、サイズN×dの行列とする(Reference: A. Anis, A. Gadde, and A. Ortega, “Efficient sampling set selection for bandlimited graph signals using graph spectral proxies,” IEEE Transactions on Signal Processing, vol. 64, no. 14, pp. 3775-3789, 2016)。サンプリングされたベクトルは
同様に、サンプリングされた信号fからの再構築は、以下の式(6)を使用して実施でき、
ここで、サブ行列は、
である。
行列UVRおよびUSRの次元を参照すると、
が再構成の基本要件であることが簡単に分かる。
上記のグラフ信号処理技術から、方位角値の第2セットの推定を詳細に検討することができる。計算された位相角と1以上のスパース3次元形状を使用して方位角値の第2セットが推定されることを思い出して、一実施態様では、1以上のハードウェアプロセッサ104は、ステップ203(i)で、1以上のスパース3次元形状から、オブジェクトの第1領域に対応する方位角値の第1セットを識別する。
一実施態様では、第1領域は、オブジェクトの特徴が豊富な領域を含む。当技術分野で知られているように、MVS技術などの従来の技術は特徴の対応に基づいており、したがって、1以上のスパース3次元形状から、方位角値の第1セットを直接的に識別することができる。1以上のスパース3次元形状(図4を参照)から、方位角値(ラジアン単位)の第1セットは、0.7706および1.7507として識別され得る。
本開示の一実施態様によれば、ステップ203(ii)において、1以上のハードウェアプロセッサ104は、計算された位相角を使用して、方位角値の第1セットと推定される方位角値の第2セットとの間の関係構造を含むグラフを構築する。提案された開示は、2つの観測を考慮した後のグラフの構築を容易にし、すなわち、偏光拡散反射または偏光正反射のみで、位相角場と方位角場の絶対変化は同義、つまり小さな近傍領域における各位相角値と方位角値との間の絶対角距離は類似しており;また、オブジェクトの反射タイプが変化すると、位相角場がπ/2だけ急激に変化する。
計算された位相角と上記の2つの観測に基づいて、提案された開示はグラフの構築を容易にし、構築されたグラフは、方位角値の第2セットの各々の間の関係構造を効果的にキャプチャする。グラフを構築するプロセスを詳細に検討することができる。N×Nをキャプチャされた偏光画像サイズとし、N=Nを画像内のピクセル数とする。一実施態様では、セットV={1,2,…,N}によってインデックス付けされたNノードグラフが最初に構築され得る。ここで、任意の
について、Φはノードpでの位相角を示し、さらに任意の2つのノード
の間で、エッジの重みwpqは、以下の式(7)で計算され得る:
ここで、関数は
であり、
およびdist(p,q)は、ピクセルpとqの位置間のユークリッド距離を示す。g(Φ,Φ)は、2つの角度ΦとΦの間の距離を計算し、反射タイプの変化による位相角π/2の変化に対して不変であることが容易にわかる。
再び式(7)を参照すると、式(7)の係数εおよびεが近傍領域を決定する。図5を参照して、例示的なシナリオを考慮すると、構築されたグラフの例を参照することができ、ノードはオブジェクトの第1領域を表す。
本開示の一実施態様によれば、ステップ203(iii)で、1以上のハードウェアプロセッサ104は、構築されたグラフに対応するGFT行列を取得する。一実施態様では、再び式(7)を参照して、エッジ重みεおよびεを使用して、グラフラプラシアンL、GFT行列Uなどのグラフの残りの属性を取得することができる。グラフ信号再構築技術を実行することにより、グラフラプラシアンL、GFT行列U、およびその他の残りの属性を取得(または推定)することができる。例示的な実行では、図5において構築されたグラフを再び参照して、上記のグラフ信号処理技術を実行することにより、以下の表1に示されるように対応するGFT行列を取得することができる。
一実施態様では、1以上のハードウェアプロセッサ(104)は、方位角値の第2セットを推定するグラフ信号再構築技術を実行することにより、GFT行列に線形変換を実施する。「Systems and methods for sampling and reconstruction of band-limited graph signals by a graph parity check matrix technique」というタイトルの、共同所有の同時係属中のインド出願「201821009840」に記載されているように、グラフ信号再構築技術は、グラフパリティチェック行列によってサンプリングされた信号の再構築を提供する。線形変換行列は、以下の表2に示すように、グラフ信号再構築技術を実行することで取得できる。
本開示の一実施態様によれば、ステップ203(iv)で、1以上のハードウェアプロセッサ104は、GFT行列および方位角値の第1セットから、グラフ信号処理技術を実行することにより、オブジェクト表面の第2領域に対応する明確な方位角値を含む、方位角値の第2のセットを推定する。一実施態様では、第2領域は、方位角値の第2セットが推定されるオブジェクトの特徴が制限された領域を含む。図5の構築されたグラフを再び参照すると、ノード3、4、および5は第2領域を表す。
上述のように、従来のシステムおよび方法は、π/2の曖昧性のみを解決するものであり、従来のシステムおよび方法はいずれも、πの曖昧性を解決するものではない。次に、方位角値の第2セットを推定するプロセスを詳細に検討することができる。
一実施態様において、
は、それぞれΦ=[Φ,Φ,…,Φおよびφ=[φ,φ,…,φとして表現され得る位相角および方位角のベクトルを示すとし、ここで、Φと同様に、すべての
に対して、φは、ノードpの方位角を示す。Φ、構築されたグラフ、および方位値の最初のセットを取得すると、問題(提案された開示によって解決される)は、方位値の第2第1を推定することである。
本開示の実施態様によれば、ΦおよびφのGFTは、
として計算され得る。ΦはΦの曖昧な推定に過ぎないことを想起し、式(7)を使用して構築されたグラフエッジでは、
および
の両方が同じ滑らかさを持っていること、つまり、両方とも同じカットオフグラフの周波数ω、または文字
を持っていることがわかる。Vは、信頼できる深度情報が得られるオブジェクトの領域の第1セット(つまり、特徴が豊富な領域)に対応する頂点のセットを表し、それにより、方位角値の第1セットが使用可能になる。
グラフ信号ΦV++CΦ、φV++Cφは、グラフインデックス(または頂点のセット)Vにそれぞれ対応する位相角および方位角を示す。頂点のセットVに対応する位相角は明確なので、ΦV+=φV+である。セットVおよびグラフ信号φV+は、サンプリングセットSおよびサンプリングされたグラフ信号f(上記のグラフ信号処理技術で説明)に類似していることに注意されたく、このアナロジーから、サンプリングされた方位角φV+および式(2)を使用して、次の式(8)に示すように、方位角信号(または方位角値の第2セット)を推定でき:
ここで、UV+RはUSRと同様であり、セットRは、上記のように
であるため、GFTスペクトル
を観察することによって見つけることができる。
さらに、カットオフグラフ周波数ωは、GFTスペクトルが正確に0に到達しないため、GFTスペクトル
に閾値を設定することで決定できる。推定されたφは、πとπ/2の両方の曖昧性を解決する。さらに、上記のグラフ信号処理技術で説明したように、|V|>|R|は、φを推定するための基本的な要件で構成される。したがって、グラフを構築するステップは、方位角値の第2セットを推定するための位相角のグラフフーリエ変換(GFT)スペクトルをグラフ信号処理技術によって表すことを含む。
実行例では、上記の表1のGFT行列および識別された値の第1セットから、方位角値の第2セット(ラジアン単位)は、1.9068、-2.0293および2.7394と推定され得る。さらに再び図5を参照すると、GFTスペクトル(ノード1およびノード2を含む)の例を参照することができる。
本開示の一実施態様によれば、ステップ204で、1以上のハードウェアプロセッサ104は、推定された方位角値の第2セットと計算された位相角との比較に基づいて、オブジェクトの偏光正反射優勢領域および偏光拡散反射優勢領域を分類する。一実施態様では、識別された方位角値の第1セットと推定された方位角値の第2セットとの組み合わせに基づいて比較を実施することができる。したがって、識別された方位角値の第1セットと推定された方位角値の第2セット(ラジアン)の組み合わせは以下を含むことができる:
0.7706、1.7507、1.9068、-2.2093、および2.7394;
一実施態様では、比較は、例えば、方位角値の第1セットおよび方位角値の第2セットから計算された位相角を減算することにより実施され得る。実行例では、上記のステップ202(ii)で計算された位相角、すなわち、Φ=0.9777、0.0896、0.5204、0.3205、および0.8261を考慮すると、オブジェクトの偏光正反射優勢領域および偏光拡散反射優勢領域を分類するための比較に基づいて以下の値のセットを取得でき得る:
-0.2071、1.6611、1.3864、-3.9205、および1.9132;
ここで、第1の値、つまり-0.2071は0.7706から0.09777を引くことによって取得され、第2の値1.6611は1.7507から0.0896を引くことなどによって取得される。
上記の値のセットを参照すると、第2の値、第3の値、および第5の値がπ/2(つまり、1.57)に近いため、第2のノード、第3のノード、および第5のノード(5つのエッジのセットを含むグラフで検討した場合)はπ/2に近いため、第2のノード、第3のノード、第5のノードは偏光正反射優勢領域として分類される一方で、第1のノードおよび第4のノードは偏光拡散反射優勢領域として分類され得る。最後に、第4のノードは、πの曖昧性が解決されることを示している。
本開示の一実施態様によれば、ステップ205で、1以上のハードウェアプロセッサ104は、非線形最小二乗推定法を実行することで、オブジェクトの偏光正反射優勢領域および偏光拡散反射優勢領域の分類に基づいて、天頂角を推定し、天頂角は、偏光度とオブジェクト表面の屈折率との関数である。天頂角θは、式(3)または式(4)を使用して推定できる。
当技術分野で知られているように、非線形最小二乗法は、m個の観察を非線形な未知のn個(m>n)のパラメーターのモデルにフィットさせる最小二乗分析の形式で使用する。これは非線形回帰のある種の形式として使用される。この手法の基礎はモデルを線形のもので近似し、逐次的繰り返しによって洗練していくことである。
一般に、当技術分野で知られているように、天頂角(方位角および偏光度とともに)は、ピクセルの1以上の勾配の取得を容易にし、ピクセルの1以上の勾配は、プライマリおよびセカンダリ軸上のマルチビュー偏光画像のセットの深度の変化であり、プライマリおよびセカンダリ軸は、画像キャプチャデバイスを使用してキャプチャされた(マルチビュー偏光画像セットの中から)マルチビュー偏光画像に対応する水平および垂直軸を示す。一実施態様では、推定された天頂角は、オブジェクトの3次元表面(すなわち、高密度な3D表面)の再構築を促進する(以下のステップ206に示され議論される)。実行例では、天頂角はθ=35度(つまり、ラジアンで0.610)と推定される。
本開示の一実施態様によれば、ステップ206で、方位角値の第2セットおよび天頂角を使用して、オブジェクトの高密度な3次元表面を再構築することができる。方位角値の第2セットおよび推定された天頂角を統合することにより、つまり(Φ、φ)を使用して、高密度の3次元表面の再構築は、既知の従来のシステムおよび方法のいずれかを使用して、たとえばIsocontour深度トレース技術によって実施できる。
本開示の一実施態様によれば、提案された方法論の実行例(すなわち、グラフ信号処理技術による方位角値の第2セットの推定)、および従来のシステムおよび方法との比較がシミュレーション結果のセットを介して詳細に考慮され得る。提案された方法論は、ひとつのオブジェクト、つまり人工的なオブジェクトに対して執行された。 最初に、伝統的なシステムと技術を使用して天頂角と方位角の両方が推定(または計算)され、5つの異なる偏光角、つまり{0、30、60、90、120}に対応する5つの偏光画像が取得される。さらに、位相角Φは、式(1)を解くことにより、すべてのポイントで(つまり、5つの隣接ポイントのセット各々に)計算された。
計算された位相角Φを使用して、ε=π/6およびε=10を想定することにより、上記のグラフ信号処理技術によってグラフを構築できる。さらに、構築されたグラフに対応するGFT行列は、グラフ信号処理技術を実行することにより取得され得る。図6Aを参照すると、グラフ周波数λに関する実際の方位角(すなわち、グランドトゥルース方位角)のグラフフーリエスペクトルのゲイン線図を参照することができる。さらに図6Bを参照すると、グラフ周波数λに関する計算された位相角のグラフフーリエスペクトルのゲイン線図を参照することができる。
再び図6を参照すると、位相角と識別された方位角値の第1セットおよび推定された方位角値の第2セットの組み合わせとは、構築されたグラフでキャプチャされた同一の帯域制限を持ち、同一の帯域制限は、組み合わされた方位角値の第1セットと方位角値の第2セットの各々の間の最適な表現(つまり、適切にキャプチャされた関係構造)を表す。
したがって、Φを使用し、GFTスペクトルから、1以上のハードウェアプロセッサ104は、カットオフグラフ周波数を選択して方位角値の第2セットを推定し、カットオフグラフ周波数は構築されたグラフに対応する。再び図6を参照すると、50のグラフ周波数の後、大きさは無視できるようになるため、カットオフグラフ周波数はω=50、および対応する|R|=70として選択される。
さらに、サンプリングセット|V|(上記のグラフ信号処理技術で説明したように)は、100(約13%)として選択でき、サンプリングセット|V|のグラフインデックスは、ランダムに選択できる。これらの位置では、実際の方位角が既知であると想定され(上記のように)、式(8)を使用することにより、人工的なオブジェクトの特徴が制限された領域の方位角値の第2セットが推定される。
本開示の一実施態様によれば、提案された方法論と従来のシステムおよび方法との比較を詳細に検討することができ、比較により偏光正反射優勢領域および偏光拡散優勢領域の分類が容易になる。シミュレーションおよび分類のために、図7Aに示すように、偏光正反射優勢領域と偏光拡散優勢領域の両方が、チェッカーパターンで1以上のハードウェアプロセッサ104によって最初に生成された。再び図7Aを参照すると、白に対応する領域は偏光正反射優勢を示し、黒に対応する領域は偏光拡散優勢を示す。
1以上のハードウェアプロセッサ104は、複数の明確な位置について70個のサンプル(すなわち、サンプルの約9%)をさらに選択する。図7B〜7Cを参照すると、提案された方法論を実行することにより、および従来のシステムおよび方法(例えば、PMS技術)を実行することにより取得された結果の分類が参照され得る。再び図7B〜7Cを参照すると、サンプルの数が等しい場合、提案された方法論は、従来のシステムおよび方法と比較して、より良い分類を実施することに留意されたい。
提案された開示の実施態様によれば、高密度な3次元表面再構築のための提案されたグラフ信号処理技術の利点がここで考慮され得る。ステップ201〜206で説明したように、提案された方法論では、πとπ/2の曖昧性を別々に解決できる。また、図7A〜7Cを再び参照すると、提案された方法論は、従来のシステムおよび方法のいくつか、例えばラベル伝播アプローチと比較して、π/2の曖昧性の解決において著しい改善を示す。
特徴が制限された領域に対応する方位角値の推定時に(つまり、オブジェクトの第2領域の値の第2セットを推定することにより)、従来のシステムおよび方法のいずれかを実行して、スパースオブジェクトの高密度な深度を再構築できる。最後に、上記のシミュレーション結果を介して示されるように、提案された方法論は、特徴が制限された領域で方位角値を推定するために、オブジェクトの特徴が豊富な領域からの非常に少数のサンプルを必要とする(従来のシステムおよび方法と比較して)。
一実施態様では、メモリ102は、グラフ信号処理技術を使用してオブジェクトの高密度な表面の再構築に関連する任意のデータを格納するように構成することができる。一実施態様では、複数のマルチビュー偏光画像、1以上のスパース3次元形状、偏光度および位相角、方位角値の第1セット、構築されたグラフ、および方位角値の第2セットなどは、メモリ102に格納される。さらに、グラフ信号処理技術を使用したオブジェクトの高密度な表面の再構築に関するすべての情報(入力、出力など)は、参照目的で履歴データとしてデータベースに保存することもできる。
書面による説明は、当業者が実施態様を作成および使用できるようにするために、本明細書の主題を説明する。主題の実施態様の範囲は、特許請求の範囲によって定義され、当業者が思い付く他の修正を含むことができる。かかる他の修正は、クレームのリテラル言語と異ならない類似の要素を持っている場合、またはクレームのリテラル言語と実質的な違いのない同等の要素を含む場合、クレームの範囲内にあることを意図している。
本明細書の本開示の実施態様は、グラフ信号処理技術を実行することによりπの曖昧性を解決する未解決の問題に対処する。したがって、実施態様は、πの曖昧性を解決することにより、高密度な表面の再構築を提供する。さらに、本明細書の実施態様は、推定された方位角値の第2セットと位相角との比較に基づいて、偏光正反射優勢領域および偏光拡散反射優勢領域の分類をさらに提供する。
保護範囲は、そのようなプログラムに拡張され、その中にメッセージを含むコンピュータ可読手段に加えられることを理解されたい。そのようなコンピュータ可読記憶手段は、プログラムがサーバまたはモバイルデバイスまたは任意の適切なプログラム可能なデバイスで実行されるときに、方法の1以上のステップを実施するためのプログラムコード手段を含む。ハードウェアデバイスは、例えば、サーバまたはパーソナルコンピュータなどのようなあらゆる種類のコンピュータ、またはそれらの任意の組み合わせを含む、プログラム可能なあらゆる種類のデバイスであり得る。ハードウェアデバイスは、例えば、サーバまたはパーソナルコンピュータなどのようなあらゆる種類のコンピュータ、またはそれらの任意の組み合わせを含む、プログラム可能なあらゆる種類のデバイスであり得る。デバイスは、例えば、ハードウェア手段、例えば、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)、もしくは、たとえば、ASICおよびFPGA、または少なくとも1つのマイクロプロセッサと少なくとも1つのメモリとソフトウェアモジュールが配置されているハードウェア手段とソフトウェア手段の組み合わせであり得る手段も含み得る。したがって、手段はハードウェア手段とソフトウェア手段の両方を含むことができる。本明細書で説明される方法の実施態様は、ハードウェアおよびソフトウェアで実行され得る。デバイスにはソフトウェア手段も含まれる場合がある。あるいは、実施形態は、異なるハードウェアデバイス、例えば、複数のCPUを使用して実行され得る。
本明細書の実施態様は、ハードウェア要素およびソフトウェア要素を含むことができる。ソフトウェアに実行される実施態様は、ファームウェア、常駐ソフトウェア、マイクロコードなどを含むが、これらに限定されない。本明細書で説明される様々なモジュールによって実施される関数は、他のモジュールまたは他のモジュールの組み合わせによって実施されてもよい。この説明の目的のために、コンピュータ使用可能またはコンピュータ読み取り可能な媒体は、命令執行システム、装置、またはデバイスによって、またはそれらに関連して使用するプログラムを含む、格納する、通信する、伝播する、または転送することができる任意の装置であり得る。
図示されたステップは、示された例示的な実施態様を説明するために提示されており、進行中の技術開発が特定の関数が実施される方法を変えることが予想される。これらの例は、限定ではなく、例示の目的でここに提示されている。さらに、機能的構成要素の境界は、説明の便宜上、本明細書で任意に定義されている。指定された関数とその関係が適切に実施される限り、代替の境界を定義できる。本明細書に含まれる教示に基づいて、代替物(本明細書に記載されるものの均等物、拡張、変形、逸脱などを含む)は、関連技術の当業者には明らかであろう。かかる代替物は、開示された実施態様の範囲および精神に含まれる。また、「含む(comprising)」、「有する(having)」、「含有する(containing)」、および「含む(including)」などの単語およびその他の類似の形式は、意味が同等であり、これらの単語のいずれか1以上に続く項目が無制限であることを意味するそのようなアイテムの完全なリストであること、またはリストされたアイテムのみに限定されることを意味する。また、本明細書および添付の特許請求の範囲で使用される単数形「a」、「an」、および「the」は、文脈がそうでないことを明確に示さない限り、複数の参照を含むことに留意しなければならない。
さらに、本開示と一致する実施態様を実行する際に、1以上のコンピュータ可読記憶媒体を使用することができる。コンピュータで読み取り可能な記憶媒体とは、プロセッサで読み取り可能な情報またはデータを格納できる任意のタイプの物理メモリを指す。したがって、コンピュータ可読記憶媒体は、本明細書に記載の実施態様と一致するステップまたは段階をプロセッサに執行させるための命令を含む、1以上のプロセッサによる実行のための命令を格納し得る。「コンピュータ可読媒体」という用語は、有形のアイテムを含み、搬送波と一時的な信号、つまり一時的でないものを除外すると理解されるべきである。例には、ランダムアクセスメモリ(RAM)、読み取り専用メモリ(ROM)、揮発性メモリ、不揮発性メモリ、ハードドライブ、CD ROM、DVD、フラッシュドライブ、ディスク、およびその他の既知の物理記憶媒体が含まれる。
開示および実施例は例示としてのみ考慮されることを意図しており、開示された実施態様の真の範囲および精神は添付の特許請求の範囲によって示される。

Claims (15)

  1. グラフ信号処理を使用してオブジェクトの高密度な表面を再構築する方法であって、該方法は、プロセッサ実行型の以下のステップ:
    画像キャプチャデバイスを使用して、複数のマルチビュー偏光画像をキャプチャするステップ(201)であって、複数のマルチビュー偏光画像の各々は、複数の偏光角でオブジェクトのマルチピクセル画像を含む、前記ステップ;
    キャプチャされた複数の偏光画像に基づいて、1以上のハードウェアプロセッサによって複数のステップを実施するステップ(202)であって、該複数のステップは:
    (i)キャプチャされた複数のマルチビュー偏光画像の各々にマルチビューステレオ(MVS)技術を実行することにより、オブジェクトの1以上のスパース3次元形状を抽出するステップ(202(i))であって、1以上のスパース3次元形状は、オブジェクトの第1領域に対応する方位角値の第1セットを識別するために使用される、前記ステップ;および
    (ii)キャプチャされた複数のマルチビュー偏光画像に偏光反射率モデリング技術を実行することにより、オブジェクトの表面点の各ビューに対応する偏光度および位相角を計算するステップ(202(ii));
    を含む、前記ステップ;
    位相角と1以上のスパース3次元形状を使用して、グラフ信号処理技術により方位角値の第2セットを推定するステップ(203)であって、該推定は:
    (i)1以上のスパース3次元形状から、オブジェクトの第1領域に対応する方位角値の第1セットを識別するステップ(203(i));
    (ii)位相角を使用して、方位角値の第1セットと推定される方位角値の第2セットとの間の関係構造をキャプチャしたグラフを構築するステップ(203(ii));
    (iii)グラフ信号処理技術によって構築されたグラフに対応するグラフフーリエ変換(GFT)行列を取得するステップ(203(iii));および
    (iv)GFT行列および方位角値の第1セットから、グラフ信号処理技術によってオブジェクトの第2領域に対応する明確な方位角値を含む方位角値の第2セットを推定するステップ(203(iv));
    を含む、前記ステップ;
    推定された方位角値の第2セットと位相角との比較に基づいて、オブジェクトの偏光正反射優勢領域および偏光拡散反射優勢領域を分類するステップ(204);
    分類に基づいて、非線形最小二乗推定技術を実行することにより天頂角を推定するステップ(205)であって、天頂角は、オブジェクトの表面の偏光度と屈折率との関数である、前記ステップ;および
    方位角値の第2セットおよび天頂角を使用して、オブジェクトの高密度な3次元表面を再構築するステップ(206);
    を含む、前記方法。
  2. 方位角値の第2セットを推定するステップの前に、グラフ信号処理技術の実行によって方位角値の第1セットに対応するサンプリングセットを取得する、請求項1に記載の方法。
  3. 方位角値の第2セットを推定するステップが、グラフ信号再構築技術を使用してGFT行列に線形変換を実施することを含む、請求項1に記載の方法。
  4. グラフを構築するステップが、方位角値の第2セットを推定するための位相角のグラフフーリエ変換(GFT)スペクトルをグラフ信号処理技術によって表すことを含む、請求項1に記載の方法。
  5. GFTスペクトルを表すステップが、GFTスペクトルに基づいて、カットオフグラフ周波数を選択して方位角値の第2セットを推定することを含み、カットオフグラフ周波数は構築されたグラフに対応する、請求項4に記載の方法。
  6. 位相角と、識別された方位角値の第1セットおよび推定された方位角値の第2セットの組み合わせとが、構築されたグラフ上でキャプチャされた同一の帯域制限を有し、同一の帯域制限は、方位角値の第1セットおよび方位角値の第2セットの組み合わせの各々の間の最適な表現を表す、請求項1に記載の方法。
  7. グラフ信号処理を使用してオブジェクトの高密度な表面を再構築するシステム(100)であって、該システム(100)は:
    命令を記憶するメモリ(102);
    1以上の通信インターフェース(106);および
    1以上の通信インターフェース(106)を介してメモリ(102)に結合された1以上のハードウェアプロセッサ(104)
    を含み、
    1以上のハードウェアプロセッサ(104)は、以下の命令:
    画像キャプチャデバイスを使用して、複数のマルチビュー偏光画像をキャプチャするステップであって、複数のマルチビュー偏光画像の各々は、複数の偏光角で変わるオブジェクトのマルチピクセル画像を含む、前記ステップ;
    キャプチャされた複数の偏光画像に基づいて、複数のステップを実施するステップであって、該複数のステップは:
    (i)キャプチャされた複数のマルチビュー偏光画像の各々にマルチビューステレオ(MVS)を実行することにより、オブジェクトの1以上のスパース3次元形状を抽出するステップであって、1以上のスパース3次元形状は、オブジェクトの第1領域に対応する方位角値の第1セットを識別するために使用される、前記ステップ;および
    (ii)キャプチャされた複数のマルチビュー偏光画像に偏光反射率モデリング技術を実行することにより、オブジェクトの表面点の各ビューに対応する偏光度および位相角を計算するステップ;
    を含む、前記ステップ;
    位相角と1以上のスパース3次元形状を使用して、グラフ信号処理技術により方位角値の第2セットを推定するステップであって、該推定は:
    (i)1以上のスパース3次元形状から、オブジェクトの第1領域に対応する方位角値の第1セットを識別するステップ;
    (ii)位相角を使用して、方位角値の第1セットと推定される方位角値の第2セットとの間の関係構造をキャプチャしたグラフを構築するステップ;
    (iii)グラフ信号処理技術によって構築されたグラフに対応するグラフフーリエ変換(GFT)行列を取得するステップ;および
    (iv)GFT行列および方位角値の第1セットから、グラフ信号処理技術によってオブジェクトの第2領域に対応する明確な方位角値を含む方位角値の第2セットを推定するステップ;
    を含む、前記ステップ;
    推定された方位角値の第2セットと位相角との比較に基づいて、オブジェクトの偏光正反射優勢領域および偏光拡散反射優勢領域を分類するステップ;
    分類に基づいて、非線形最小二乗推定技術を実行することにより天頂角を推定するステップであって、天頂角は、オブジェクトの表面の偏光度と屈折率との関数である、前記ステップ;および
    方位角値の第2セットおよび天頂角を使用して、オブジェクトの高密度な3次元表面を再構築するステップ、
    によって構成される、前記システム(100)。
  8. 1以上のハードウェアプロセッサ(104)が、方位角値の第2セットを推定するステップの前に、グラフ信号処理技術の実行によって方位角値の第1セットに対応するサンプリングセットを取得するように構成される、請求項7に記載のシステム(100)。
  9. 1以上のハードウェアプロセッサ(104)が、グラフ信号再構築技術を使用してGFT行列に線形変換を実施して、方位角値の第2セットを推定するように構成される、請求項7に記載のシステム(100)。
  10. 1以上のハードウェアプロセッサ(104)が、グラフ信号処理技術を使用して、方位角値の第2セットを推定するための位相角のグラフフーリエ変換(GFT)スペクトルを表すことによって、グラフを構築するように構成される、請求項7に記載のシステム(100)。
  11. 1以上のハードウェアプロセッサ(104)が、GFTスペクトルに基づいて、カットオフグラフ周波数を選択して方位角値の第2セットを推定することによって、GFTスペクトルを表すように構成され、カットオフグラフ周波数は構築されたグラフに対応する、請求項10に記載のシステム(100)。
  12. 位相角と、識別された方位角値の第1セットおよび推定された方位角値の第2セットの組み合わせとが、構築されたグラフ上でキャプチャされた同一の帯域制限を有し、同一の帯域制限は、方位角値の第1セットおよび方位角値の第2セットの組み合わせの各々の間の最適な表現を表す、請求項7に記載のシステム(100)。
  13. 1以上の命令を含む1以上の非一時的な機械可読情報記憶媒体であって、該命令は1以上のハードウェアプロセッサによって執行されると:
    画像キャプチャデバイスを使用して、複数のマルチビュー偏光画像をキャプチャするステップ(201)であって、複数のマルチビュー偏光画像の各々は、複数の偏光角で変わるオブジェクトのマルチピクセル画像を含む、前記ステップ;
    キャプチャされた複数の偏光画像に基づいて、1以上のハードウェアプロセッサによって複数のステップを実施するステップ(202)であって、該複数のステップは:
    (i)キャプチャされた複数のマルチビュー偏光画像の各々にマルチビューステレオ(MVS)技術を実行することにより、オブジェクトの1以上のスパース3次元形状を抽出するステップ(202(i))であって、1以上のスパース3次元形状は、オブジェクトの第1領域に対応する方位角値の第1セットを識別するために使用される、前記ステップ;および
    (ii)キャプチャされた複数のマルチビュー偏光画像に偏光反射率モデリング技術を実行することにより、オブジェクトの表面点の各ビューに対応する偏光度および位相角を計算するステップ(202(ii));
    を含む、前記ステップ;
    位相角と1以上のスパース3次元形状を使用して、グラフ信号処理技術により方位角値の第2セットを推定するステップ(203)であって、該推定は:
    (i)1以上のスパース3次元形状から、オブジェクトの第1領域に対応する方位角値の第1セットを識別するステップ(203(i));
    (ii)位相角を使用して、方位角値の第1セットと推定される方位角値の第2セットとの間の関係構造をキャプチャしたグラフを構築するステップ(203(ii));
    (iii)グラフ信号処理技術によって構築されたグラフに対応するグラフフーリエ変換(GFT)行列を取得するステップ(203(iii));および
    (iv)GFT行列および方位角値の第1セットから、グラフ信号処理技術によってオブジェクトの第2領域に対応する明確な方位角値を含む方位角値の第2セットを推定するステップ(203(iv));
    を含む、前記ステップ;
    推定された方位角値の第2セットと位相角との比較に基づいて、オブジェクトの偏光正反射優勢領域および偏光拡散反射優勢領域を分類するステップ(204);
    分類に基づいて、非線形最小二乗推定技術を実行することにより天頂角を推定するステップ(205)であって、天頂角は、オブジェクトの表面の偏光度と屈折率との関数である、前記ステップ;および
    方位角値の第2セットおよび天頂角を使用して、オブジェクトの高密度な3次元表面を再構築するステップ(206);
    をさせる、前記1以上の非一時的な機械可読情報記憶媒体。
  14. 方位角値の第2セットを推定するステップの前に、グラフ信号処理技術の実行によって方位角値の第1セットに対応するサンプリングセットを取得する、請求項13に記載の1以上の非一時的な機械可読情報記憶媒体。
  15. 方位角値の第2セットを推定するステップが、グラフ信号再構築技術を使用してGFT行列に線形変換を実施することを含む、請求項13に記載の1以上の非一時的な機械可読情報記憶媒体。
JP2019159751A 2018-09-01 2019-09-02 グラフ信号処理を使用したオブジェクトの高密度な表面を再構築するためのシステムおよび方法 Active JP6830988B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
IN201821032911 2018-09-01
IN201821032911 2018-09-01

Publications (2)

Publication Number Publication Date
JP2020061130A true JP2020061130A (ja) 2020-04-16
JP6830988B2 JP6830988B2 (ja) 2021-02-17

Family

ID=67928585

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019159751A Active JP6830988B2 (ja) 2018-09-01 2019-09-02 グラフ信号処理を使用したオブジェクトの高密度な表面を再構築するためのシステムおよび方法

Country Status (3)

Country Link
US (1) US11409837B2 (ja)
EP (1) EP3617999B1 (ja)
JP (1) JP6830988B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11693924B2 (en) * 2019-06-06 2023-07-04 Hitachi, Ltd. System and method for maintenance recommendation in industrial networks
KR20210030147A (ko) * 2019-09-09 2021-03-17 삼성전자주식회사 3d 렌더링 방법 및 장치
US11815454B2 (en) * 2020-03-27 2023-11-14 Samsung Electronics Co., Ltd. Method and system for optimizing Monte Carlo simulations for diffuse reflectance spectroscopy
CN111786656B (zh) * 2020-05-29 2022-11-08 南京邮电大学 一种基于滤波器的带限图信号采样方法
CN117610495B (zh) * 2024-01-23 2024-04-16 合肥晶合集成电路股份有限公司 辅助图形的添加方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4435867B2 (ja) * 2008-06-02 2010-03-24 パナソニック株式会社 法線情報を生成する画像処理装置、方法、コンピュータプログラム、および、視点変換画像生成装置
WO2011070708A1 (ja) * 2009-12-08 2011-06-16 パナソニック株式会社 画像処理装置
US20160261844A1 (en) * 2015-03-06 2016-09-08 Massachusetts Institute Of Technology Methods and Apparatus for Enhancing Depth Maps with Polarization Cues
JP2017016431A (ja) * 2015-07-01 2017-01-19 株式会社ソニー・インタラクティブエンタテインメント 画像処理装置、画像処理システム、多視点カメラ、および画像処理方法
JP2018041278A (ja) * 2016-09-07 2018-03-15 株式会社ソニー・インタラクティブエンタテインメント 情報処理装置および画像領域分割方法
US20180122137A1 (en) * 2016-11-03 2018-05-03 Mitsubishi Electric Research Laboratories, Inc. Methods and Systems for Fast Resampling Method and Apparatus for Point Cloud Data

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011071929A2 (en) * 2009-12-07 2011-06-16 Photon-X, Inc. 3d visualization system
GB2490872B (en) * 2011-05-09 2015-07-29 Toshiba Res Europ Ltd Methods and systems for capturing 3d surface geometry
CN104246826B (zh) * 2012-01-03 2017-12-15 阿森蒂亚影像有限公司 编码定位系统、方法和装置
JP6693514B2 (ja) * 2015-04-30 2020-05-13 ソニー株式会社 画像処理装置と画像処理方法およびプログラム
AU2017250112B2 (en) * 2016-04-12 2020-09-17 Quidient, Llc Quotidian scene reconstruction engine
WO2018061508A1 (ja) 2016-09-28 2018-04-05 ソニー株式会社 撮像素子、画像処理装置、および画像処理方法、並びにプログラム
JP2019067323A (ja) * 2017-10-05 2019-04-25 ソニー株式会社 情報処理装置、情報処理方法、及び記録媒体
WO2019215820A1 (ja) * 2018-05-08 2019-11-14 株式会社ソニー・インタラクティブエンタテインメント 情報処理装置および被写体情報取得方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4435867B2 (ja) * 2008-06-02 2010-03-24 パナソニック株式会社 法線情報を生成する画像処理装置、方法、コンピュータプログラム、および、視点変換画像生成装置
WO2011070708A1 (ja) * 2009-12-08 2011-06-16 パナソニック株式会社 画像処理装置
US20160261844A1 (en) * 2015-03-06 2016-09-08 Massachusetts Institute Of Technology Methods and Apparatus for Enhancing Depth Maps with Polarization Cues
JP2017016431A (ja) * 2015-07-01 2017-01-19 株式会社ソニー・インタラクティブエンタテインメント 画像処理装置、画像処理システム、多視点カメラ、および画像処理方法
JP2018041278A (ja) * 2016-09-07 2018-03-15 株式会社ソニー・インタラクティブエンタテインメント 情報処理装置および画像領域分割方法
US20180122137A1 (en) * 2016-11-03 2018-05-03 Mitsubishi Electric Research Laboratories, Inc. Methods and Systems for Fast Resampling Method and Apparatus for Point Cloud Data

Also Published As

Publication number Publication date
JP6830988B2 (ja) 2021-02-17
EP3617999A1 (en) 2020-03-04
US20200073909A1 (en) 2020-03-05
US11409837B2 (en) 2022-08-09
EP3617999B1 (en) 2023-04-19

Similar Documents

Publication Publication Date Title
JP6830988B2 (ja) グラフ信号処理を使用したオブジェクトの高密度な表面を再構築するためのシステムおよび方法
Tola et al. Efficient large-scale multi-view stereo for ultra high-resolution image sets
Tafti et al. Recent advances in 3D SEM surface reconstruction
Ahmadabadian et al. A comparison of dense matching algorithms for scaled surface reconstruction using stereo camera rigs
Wu et al. Robust photometric stereo via low-rank matrix completion and recovery
Ceylan et al. Coupled structure-from-motion and 3D symmetry detection for urban facades
Dall'Asta et al. A comparison of semiglobal and local dense matching algorithms for surface reconstruction
WO2015135323A1 (zh) 一种摄像机跟踪方法及装置
Dave et al. Pandora: Polarization-aided neural decomposition of radiance
Rodola et al. Regularized pointwise map recovery from functional correspondence
Vasconcelos et al. Automatic camera calibration using multiple sets of pairwise correspondences
Shi et al. Symmetry and orbit detection via lie‐algebra voting
CN113284237A (zh) 一种三维重建方法、系统、电子设备及存储介质
Shakeri et al. Polarimetric monocular dense mapping using relative deep depth prior
Thiruselvam et al. Feature‐assisted stereo correlation
Arrigoni et al. Robust global motion estimation with matrix completion
Del Pizzo et al. Automatic orientation of image sequences in cultural heritage
Delaunoy et al. Two cameras and a screen: How to calibrate mobile devices?
CN110570511A (zh) 点云数据的处理方法、装置、系统和存储介质
Fan et al. Deep Shape and SVBRDF Estimation using Smartphone Multi‐lens Imaging
Ylimäki et al. Fast and accurate multi‐view reconstruction by multi‐stage prioritised matching
Hui et al. Determining shape and motion from monocular camera: A direct approach using normal flows
Shiradkar et al. Auto-calibrating photometric stereo using ring light constraints
Tang et al. A self-calibration algorithm based on a unified framework for constraints on multiple views
Recker et al. Depth data assisted structure-from-motion parameter optimization and feature track correction

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200121

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210104

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210127

R150 Certificate of patent or registration of utility model

Ref document number: 6830988

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250