JP2014164497A - 画像処理装置、画像処理方法及びプログラム - Google Patents

画像処理装置、画像処理方法及びプログラム Download PDF

Info

Publication number
JP2014164497A
JP2014164497A JP2013034701A JP2013034701A JP2014164497A JP 2014164497 A JP2014164497 A JP 2014164497A JP 2013034701 A JP2013034701 A JP 2013034701A JP 2013034701 A JP2013034701 A JP 2013034701A JP 2014164497 A JP2014164497 A JP 2014164497A
Authority
JP
Japan
Prior art keywords
light source
image
image processing
processing apparatus
imaging
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2013034701A
Other languages
English (en)
Inventor
Hideyasu Tashiro
秀康 田代
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2013034701A priority Critical patent/JP2014164497A/ja
Publication of JP2014164497A publication Critical patent/JP2014164497A/ja
Pending legal-status Critical Current

Links

Abstract

【課題】従来の手法では、高精度に光源を推定しようとした場合、光源パラメータの数が膨大になってしまったり、推定処理に多くの時間が掛かったりしてしまう。
【解決手段】画像処理装置であって、複数の異なる視点からの撮像により得られた撮像画像と、所定の数の領域に分割された撮像シーン内の環境を表す環境マップとを用いて、当該撮像シーンにおいて被写体に影や光源の写り込みを生み出す光源の方向を推定する光源方向推定手段と、前記光源方向推定手段で推定された前記方向に基づいて、前記撮像シーン内の光源を表す光源パラメータを設定する光源パラメータ設定手段と、前記光源パラメータ設定手段で設定された光源パラメータに基づいて、前記撮像シーン内の光源を推定する光源推定手段とを有することを特徴とする。
【選択図】図9

Description

本発明は、複数の異なる視点から撮像された画像の画像処理に関する。
撮像画像に対して撮像者の意図に沿った効果を与えるために、画像加工ソフトウェアなどを用いて加工処理を行う場合がある。例えば、撮像画像の光源の種類や方向を変えたり、仮想物体を合成するなどの加工処理である。このような加工処理によって不自然さが無い画像を作成するためには熟練者が時間をかけて加工処理を行う必要があったが、近年、一定条件下で自動化する技術も提案されている。例えば、撮像画像内の被写体形状や質感、撮像シーン内の光源が分かっている場合に、撮像画像からこれらの情報を推定する種々の技術が提案されている。
このうち、光源推定に関しては、鏡面球等の特殊な装置を撮像シーン内に配置することで光源を推定する手法がある。この手法では、カメラの位置と、光源が写り込んだ鏡面球の撮像画像に基づいて計算処理することにより光源が推定される。この手法における問題点、すなわち、光源を推定する為に撮像シーン内に鏡面球を配置・撮像しなければならないという点を踏まえ、以下のような新たな手法も提案されている。
まず、被写体の形状と反射特性が既知という条件下で被写体をレンダリングしたCG画像と撮像画像との差を最小化するように、CG画像上の光源パラメータの値を調整することで、撮像シーン内の光源を推定する技術が提案されている(非特許文献1)。
また、光源を推定する際に各光源パラメータの重要さに応じて、パラメータの数を増加又は間引くことにより、少ない光源パラメータの数で高精度に光源を推定する技術が提案されている(非特許文献2)。
I. Sato, Y. Sato, and K. Ikeuchi. "Illumination from Shadows", IEEE Trans. PAMI, 290-300, 2003. T. Okabe, I. Sato, and Y. Sato. "Spherical Harmonics vs. HaarWavelets: Basis for Recovering Illumination from Cast Shadows", CVPR, 50-57, 2004.
しかしながら、非特許文献1の手法では、高精度に光源を推定しようとした場合、光源パラメータの数が膨大になってしまい、推定処理に多くの時間が掛かってしまう。また、非特許文献2の手法によれば、少ない光源パラメータの数で高精度に光源を推定することができるが、全方向について各光源パラメータが重要かどうかを調べることが必要となり、やはり推定処理に多くの時間が掛かってしまう。
本発明に係る画像処理装置は、複数の異なる視点からの撮像により得られた撮像画像と、所定の数の領域に分割された撮像シーン内の環境を表す環境マップとを用いて、当該撮像シーンにおいて被写体に影や光源の写り込みを生み出す光源の方向を推定する光源方向推定手段と、前記光源方向推定手段で推定された前記方向に基づいて、前記撮像シーン内の光源を表す光源パラメータを設定する光源パラメータ設定手段と、前記光源パラメータ設定手段で設定された光源パラメータに基づいて、前記撮像シーン内の光源を推定する光源推定手段とを有することを特徴とする。
本発明によれば、鏡面球等の特殊な装置を用いることなく、かつ、推定処理に多くの時間を要することなく、高精度に光源を推定することができる。
多眼方式の撮像装置のイメージ図である。 実施例1に係る多眼カメラの内部構成を示すブロック図である。 撮像部の内部構成を示す図である。 画像処理部の内部構成を示すブロック図である。 (a)は環境マップを示す図、(b)は環境マップを展開した図、(c)は環境マップ下に配置された直方体と平面板を撮像して得られた画像である。 半球面を粗く均等分割した環境マップを示す図である。 従来手法の光源推定処理を説明する図である。 実施例1に係る光源推定処理を説明する図である。 画像処理部における処理の流れを示すフローチャートである。 主光源の方向を推定する処理の詳細を示すフローチャートである。 主光源の方向を推定する処理を説明する図である。 主光源の方向を推定する処理を説明する図である。 光源推定処理の詳細を示すフローチャートである。
[実施例1]
図1は、本実施例において、被写体の形状を取得するための多眼方式の撮像装置(多眼カメラ)であって、複数の個眼カメラで構成されるカメラアレイの外観を示す図である。図1におけるカメラアレイでは、9個の個眼カメラ101〜109が、3行3列の正方格子上に配置されている。すべての個眼カメラは、筺体111の同一平面上に配置され、その光軸はすべて平行であり、配置された平面に垂直である。シャッターボタン110は、撮像を制御するボタンであり、ユーザがシャッターボタン110を押すことで、撮像がなされる。
なお、カメラアレイの構成は図1で示したものに限られるわけではなく、異なる個数の個眼カメラを異なるレイアウト(放射状、円形状など)で配置してもよい。
図2は、図1で示した多眼カメラの内部構成を示すブロック図である。
撮像部101〜109は、被写体の光情報をセンサーで受光しA/D変換を施しデータ転送経路であるバス214にデジタルデータを出力する。
フラッシュ201は、被写体に光を照射する。
ROM202とRAM203は、撮像や画像処理に必要なプログラム、データ、作業領域などをCPU204に提供する。
CPU204は、RAM203をワークメモリとして、ROM202やRAM203に格納されたプログラムを実行し、バス214を介して各部を制御する。これにより、後述する様々な処理が実行される。
撮像部制御部205は、フォーカスを合わせる、シャッターを開く、絞りを調節するなどの、CPU204から指示された撮像系の制御を行う。
操作部206は、ボタンやモードダイヤルなどが該当し、これらを介して入力されたユーザ指示を受け取る。
CG生成部207は、文字やグラフィックなどを生成する。
表示部208は、一般的には液晶ディスプレイが広く用いられており、CG生成部207や後述のデジタル信号処理部209、画像処理部213から受け取った撮像画像や文字の表示を行う。また、タッチスクリーン機能を有していても良く、その場合は、ユーザ指示を操作部206の入力として扱うことも可能である。
デジタル信号処理部209は、デジタル値にホワイトバランス処理、ガンマ処理、ノイズ低減処理などを行い、デジタル画像を生成する。
圧縮・伸張部210は、上記デジタル値をJPEGやMPEGなどのファイルフォーマットに変換する処理を行う。
外部メモリ制御部211は、PCその他メディア212(例えば、ハードディスク、メモリーカード、CFカード、SDカード、USBメモリ)につなぐためのインターフェースである。
画像処理部213は、撮像部101〜109から得られたデジタル画像或いは、デジタル信号処理部から出力されるデジタル画像を利用して新たな画像を生成する。
なお、多眼カメラの構成要素は上記以外にも存在するが、本実施例の主眼ではないので、説明を省略する。
図3は、撮像部101〜109の内部構成を示す図である。
撮像部101〜109は、装着フィルター301、レンズ302、絞り303、シャッター304、光学フィルター305、センサー306などから構成され、被写体の光量を検知する。A/D変換部307は、被写体の光量をデジタル値に変換し、バス214にデジタルデータを出力する。
図4は、画像処理部213の内部構成を示したブロック図である。
撮像画像データ取得部404は、複数の視点から撮像した画像データ(以下、「複数視点画像データ」と呼ぶ。)を、入力端子401を介して取得する。同様に、カメラパラメータ取得部405は、撮像カメラのカメラパラメータを、入力端子402を介して取得する。取得された複数視点画像データ及びカメラパラメータは形状データ導出部406、光源方向推定部409、光源推定部411へ送られる。
形状データ導出部406は、複数視点画像データから被写体の形状データを導出する。形状データは、被写体の表面形状を表す多数の3次元座標の集合で構成される。導出した形状データは、ポリゴン生成部407へ送られる。
ポリゴン生成部407は、形状データ導出部406で導出した形状データから被写体のポリゴンデータを生成する。生成したポリゴンデータは、反射特性取得部408、光源方向推定部409、光源推定部411へ送られる。
反射特性取得部408は、複数視点画像データと、予め用意された反射特性データの中から、被写体のポリゴンデータに対応する反射特性を、入力端子403を介して取得する。取得した反射特性は、光源方向推定部409及び光源推定部411へ送られる。
光源方向推定部409は、複数視点画像データ、被写体のポリゴンデータ、反射特性を用いて、全光源パラメータの中で、撮像シーンにおいて被写体に影や光源の写り込みを生み出す重要な光源(以下、「主光源」と呼ぶ。)のパラメータとその方向を推定する。推定した主光源のパラメータの方向は、光源パラメータ設定部410へ送られる。
光源パラメータ設定部410は、推定された主光源の方向に基づいて、撮像シーン内の光源をより少ない数の光源パラメータで高精度に推定し得るような光源パラメータを設定する。設定した光源パラメータは、光源推定部411へ送られる。
光源推定部411は、複数視点画像データ、被写体のポリゴンデータ、反射特性、光源パラメータ設定部410で設定した光源パラメータから、撮像シーン内の光源を推定する。推定した光源は、CG画像データ生成部412へ送られる。
CG画像データ生成部412は、光源推定部411で推定した撮像シーン内の光源を用いて、複数視点画像データを合成・加工処理したCG画像データを生成する。生成したCG画像データは、出力端子413から出力される。
画像処理部213における処理の詳細について説明する前に、本実施例に係る光源推定と従来手法との差異について説明する。
CGの分野では一般的に半球状の画像(無限遠環境マップ(以下、単に「環境マップ」と呼ぶ。))を用いて撮像シーン内の環境を表現することが多い。本実施例でも撮像シーン内の環境を、半球面を36×9の領域に均等分割した環境マップで表すこととする。図5の(a)は、この環境マップを示す図である。また、図5の(b)は、この環境マップを極角θ、方位角φに関して、縦、横方向に展開した図であり、白の矩形領域503は光源を示している。そして、図5の(c)は、この36×9に均等分割された環境マップ下に配置された直方体501と平面板502を、光源503の下で斜め上から撮像して得られた画像を示している。以下に、図5の(c)に示す撮像画像を用い、本実施例に係る手法によって光源推定を行った場合に要する時間と従来手法によって光源推定を行った場合に要する時間とを比較した結果を示す。なお、光源推定にはメモリ4GB、Intel Xeon3.17GHzのCPUを搭載したPCを用いた。
半球面を36×9に分割した環境マップをそのまま用いて光源推定を行うとすると、光源パラメータの数が36×9=324と膨大な数になる。そこで、従来手法では、半球面を粗く12×3に均等分割した環境マップ(図6を参照)における各領域を、更に3×3に細かく分割して光源推定を行い、どの光源パラメータが重要かどうかを全方向について調べる(図7の(a)を参照)。そして、重要と判定した領域については細かく分割した光源パラメータ、重要でない領域については粗く分割した光源パラメータをそれぞれ用いて光源を推定したところ(図7の(b)を参照)、計算に要した時間は1331秒であった。
一方、本実施例に係る手法では、まず、半球面を粗く12×3に分割した光源パラメータの内の一部の領域(図8の(a)における斜線で示された領域:ここでは1つ置き)の光源パラメータで被写体をレンダリングしたCG画像を生成する。図8の(b)は、抜き出された一部の領域の光源パラメータの下で生成されたCG画像を示している。そして、生成したCG画像と図5の(c)で示した実写の撮像画像とを比較して、被写体に影や光源の写り込みを作るような重要な光源パラメータ(主光源)を決定し、その後、決定された主光源の方向に基づいて少ない数の光源パラメータを導出して光源を推定する。撮像シーン内で重要な光源パラメータをまず粗く調べた後に光源を推定する為、従来の手法と比べて計算に要する時間は短くて済み、より高速な光源推定が可能となる。
続いて、画像処理部213における処理の流れについて説明する。
図9は、画像処理部213における処理の流れを示すフローチャートである。なお、この一連の処理は、以下に示す手順を記述したコンピュータ実行可能なプログラムをROM202からRAM203上に読み込んだ後に、CPU204によって該プログラムを実行することによって実施される。
ステップ901において、撮像画像データ取得部404は、撮像画像データ(複数視点画像データ)を取得する。
ステップ902において、カメラパラメータ取得部405は、撮像に用いた多眼カメラに対応するカメラパラメータを取得する。ここで、カメラパラメータは、カメラアレイを構成する各個眼カメラの焦点距離や光軸ずれを表す内部パラメータと、各個眼カメラの3次元座標を表す外部パラメータ等から成る。
ステップ903において、形状データ導出部406は、ステップ901で取得した複数視点画像データとステップ902で取得したカメラパラメータから、被写体の形状データを導出する。具体的には、Structure From MotionやPatch-based Multiview Stereo等の形状推定アルゴリズムを用いて、被写体の形状データを導出する。導出された形状データは、RAM203等の所定の記憶領域に記憶される。
ステップ904において、ポリゴン生成部407は、ステップ903で導出した被写体形状データから、ドロネー分割による領域分割やポアソン関数を用いた表面構成手法等を用いてポリゴンデータを生成する。生成されたポリゴンデータは、RAM203等の所定の記憶領域に記憶される。
ステップ905において、反射特性取得部408は、ステップ904で生成したポリゴンデータに対応する反射特性を、予め用意された反射特性データの中から取得する。具体的には、ステップ901で取得した複数視点画像のうちの任意の画像(例えば、個眼カメラ105で撮像された画像)に対して、既存の物体認識技術を適用することにより、ポリゴンデータ内の各ポリゴンに対応した反射特性を取得する。なお、反射特性データは、ROM202等の記憶領域に予め保存しておき、適宜参照可能なようにしておけばよい。取得された反射特性は、ポリゴンデータに対応付けて、RAM203等の所定の記憶領域に記憶される。ここでは、被写体となる直方体及び平面板の反射特性は、反射光の輝度が出射方向に対して一様なLambert反射とし、反射率はそれぞれ0.01、1とする。尚、撮像画像がカラー画像である場合は、同様の処理をR, G, Bの3チャンネルそれぞれについて行う。本実施例では簡単の為、撮像画像が白黒画像の1チャンネルのみであるものとして説明する。
ステップ906において、光源方向推定部409は、ステップ904で生成したポリゴンデータと、ステップ905で取得した反射特性から、撮像画像内に写っている被写体の影や光源の写り込みを生成する光源(主光源)の方向Φm(φ,θ)を推定する。主光源の方向Φm(φ,θ)は、前述の図5の(a)に示す方位角φ、極角θから成る2×1ベクトルで表される。
図10は、主光源の方向を推定する処理の詳細を示すフローチャートである。
本実施例では、半球面を12×3に均等分割した計36個の領域(光源パラメータ)から成る環境マップ(前述の図6を参照)を用いて主光源を推定する場合について説明する。各領域に対応する光源パラメータには、光源1,光源2,光源3,・・・,光源36といった具合に対応した番号が割り振られている。
ステップ1001において、光源方向推定部409は、予め所定の記憶領域に記憶しておいた、全36個の領域の中から抜き出された一部の領域(光源パラメータ)のうちの1の光源パラメータを取得する。この場合において、左上に位置する光源パラメータから順に取得され、各光源パラメータの番号と対応付けてRAM203等の所定の記憶領域に記憶される。ここでは、最終的に、図11の(a)に示されるように、光源1、光源3、光源5といった奇数番号に対応する各光源パラメータ(計18個)が取得されることになる。当然のことながら、一部の光源パラメータの抜き出し方は上記に限定されるものではなく、偶数番号に対応する光源パラメータを1つ置きに抜き出してもよいし、さらには2つ置き或いは3つ置きに抜き出してもよい。一部の光源パラメータをどのように抜き出すかは、計算に使用するCPUの処理能力、半球面の分割数などに応じて適宜設定すればよい。
ステップ1002において、光源方向推定部409は、被写体のポリゴンデータ、反射特性、ステップ1001で取得した光源パラメータを用いて、被写体のCG画像を生成する。図11の(b)は、生成されたCG画像の一例を示している。
ステップ1003において、光源方向推定部409は、ステップ901で取得した撮像画像と、ステップ1002で生成したCG画像との差分(絶対値)を求め、その平均値を平均差分σとして導出する。具体的には、撮像画像とCG画像との間で対応する画素同士の値(例えば、0〜255のいずれかの値)を順次比較して、その差分の絶対値を累積していき、得られた累積値を全画素数で割ることにより、差分の平均値を求める。なお、このときに使用する撮像画像は、例えばカメラアレイの中央に配置された個眼カメラ105で取得した撮像画像など、複数の撮像画像のうちの任意の撮像画像でよい。得られた平均差分σは、各光源パラメータの番号と対応付けてRAM203等の所定の記憶領域に記憶される(図11の(c)を参照)。
ステップ1004において、すべての抜き出した光源パラメータについて、平均差分σを導出したかどうかを判定する。未処理の光源パラメータがあれば、ステップ1001に戻り、ステップ1001〜1003の各処理を繰り返す。
ステップ1005において、光源方向推定部409は、ステップ1004で導出した各光源パラメータに対する平均差分σのうち、σ<σth(例えば、σth=0.5)の関係を満たす光源パラメータを、主光源と見做し、主光源の方向を決定する。図11の(c)の例では、光源20の光源パラメータについて得られた平均差分σが0.46であり、σth=0.5より小さい。よって、光源20の光源パラメータが主光源として特定され、その方向Φm(方位角φ,極角θ):(225,45)が主光源の方向として推定される(図11の(d))。なお、この方向Φm(φ,θ):(225,45)は、図5の(a)における光源503の方向を概ね指していることが分かる。このようにして推定された主光源の方向Φm(φ,θ)は、その光源パラメータの番号と対応付けてRAM203等の所定の記憶領域に記憶される。
以上が、主光源の方向推定処理の内容である。
図9のフローチャートの説明に戻る。
ステップ907において、光源パラメータ設定部410は、ステップ906で推定された主光源の方向Φm(φ,θ)に基づいて、撮像シーン内の光源をより少ない数の光源パラメータで高精度に推定し得るような光源パラメータを設定する。具体的には、以下の式(1)を用いて、より小さな領域の光源パラメータを含むような新たな光源パラメータを設定する。
本実施例では、ΔΦ=35(度)とする(図12の(a)を参照)。まず、前述の図6のように、半球面を12×3(即ち30(度/個))に均等分割する。次に、各領域のうち、上記式(1)を満たす部分(図12の(b)の斜線部分)を、さらに小さな単位(ここでは10(度/個))に細かく分割する。つまり、推定された主光源の方向Φmとの差分が所定の閾値ΔΦより小さい部分についてのみ、さらに小さな単位に分割する。分割後は、分割前の領域内の左上から右下の順に新たに番号を割り当てる。例えば、光源7は2つに再分割されて新たに光源7,光源7といった番号が割り振られ、光源8は4つに再分割されて新たに光源8,光源8,光源8,光源8といった番号が割り振られる(図12の(c)を参照)。このように上記式(1)を満たす領域について再分割した領域を含む光源パラメータ(光源1,光源2,・・・光源7,光源7,・・・,光源35,光源36の計72個)を、新たな光源パラメータとして設定する(図12の(d)を参照)。なお、再分割の際の単位は、求める精度などに応じた任意の値となることはいうまでもない。設定した光源パラメータは、所定の記憶領域に記憶される。
ステップ908において、光源推定部411は、撮像画像データ、カメラパラメータ、被写体のポリゴンデータ、反射特性、ステップ907で設定した光源パラメータから、撮像シーン内の光源を推定する。
図13は、光源推定処理の詳細を示すフローチャートである。
ステップ1301において、光源推定部411は、ステップ901で取得した複数視点画像データから、任意の撮像画像の画素値qを取得する。ここでは、個眼カメラ105で取得された撮像画像の画素値を取得するものとする。また、撮像画像データのサイズは256×256pixelであり、画像の左上から右下の順に各ピクセルの番号iが1,2,・・・,T(本実施例ではT=256)のように割り振られている。取得した画素値は、番号iに対して昇順に並べたT×1ベクトルとして(式(2)を参照)、RAM203等の所定の記憶領域に記憶される。
ステップ1302において、光源推定部411は、カメラパラメータ、被写体のポリゴンデータ、反射特性、ステップ907で設定した光源パラメータから、各光源パラメータが被写体を照射している環境下のCG画像を生成する。ここでは、個眼カメラ105を光学中心としたCG画像が生成されるものとする。本実施例の場合、設定された光源パラメータの数が72個であるので、計72枚のCG画像が生成されることになる。なお、生成するCG画像のデータサイズは、撮像画像と同じ256×256pixelとする。
ステップ1303において、光源推定部411は、ステップ1302で生成したCG画像のうち、光源L(L:1〜72)のみの環境下で生成したCG画像における、ピクセルiの画素値R(L)を取得する。取得した画素値R(L)は、以下の式(3)のように並べたT×L行列R(ここではL=72)として、RAM203等の所定の記憶領域に記憶される。
ここで、光源推定の基本的性質である明るさの線形性について説明する。
明るさの線形性とは、複数の光源下で観察される物体の明るさが各光源下の物体の明るさの線形和で表されるという性質である。この性質を用いると、図12の(b)のような無限遠環境マップで表される任意の光源環境は、各光源Lの線形和で表すことができる。従って、ステップ1301で取得した撮像画像の画素値と、ステップ1303で生成したCG画像の画素値との間に以下の式(4)の関係が成り立つ。
ここで、α, α, α, ・・・, αLMは、各光源Lの輝度の重み付けを表す係数(以下、単に「重み付け係数」と呼ぶ。)である。
ステップ1304において、光源推定部411は、上記式(4)の左辺と右辺の差分で表される評価関数f(α, α, α, ・・・, αLM)に対し、最急降下法や共役勾配法等を用いて評価関数fが最小となる重み付け係数α〜αLMを導出する。導出された重み付け係数αは、撮像シーン内の光源パラメータとして、RAM203等の所定の記憶領域に記憶される。
以上が、光源推定処理の内容である。
図9のフローチャートの説明に戻る。
ステップ909において、CG画像生成部412は、ステップ908で推定した光源パラメータ(重み付け係数を含む)と、所定の記憶領域に記憶しておいた形状・反射特性が既知の仮想物体データから、撮像画像内に仮想物体を合成したCG画像を生成する。
以上が、画像処理部213における処理の内容である。
以上述べたとおり、本実施例によれば、被写体の形状、反射特性を基に、比較的少ない数の光源パラメータで被写体をレンダリングしたCG画像と撮影画像との比較により、光源が推定される。これにより、高速かつ高精度に撮影シーン内の光源を推定することができる。
本実施例では、多眼方式の撮像装置を用いて複数視点の画像を取得する場合について説明した。しかし、被写体を囲むように配置した複数台の撮像装置で構成される撮像システムを用いたり、撮像装置又は被写体を動かしながら動画撮像することで複数視点の画像を取得するようにしても良い。
また、反射特性を取得する際に既存の物体認識技術を用いて被写体に対応する反射特性を記憶領域から取得する方法について説明したが、複数視点画像を用いて反射特性を推定しても良い。例えば、被写体がLambert反射であると仮定し、複数視点の撮像画像で取得したRGB画素値の平均から被写体の反射特性を求めても良い。光沢性を持つ被写体に対してはPhongモデルや、Torrance−Sparrowモデル等の光沢性を持つ反射モデルを用いて反射特性を推定しても良い。
さらに、本実施例では、主光源の方向を決定する際にCG画像と撮像画像との比較を行った。しかしながら、半球面を粗く分割した環境マップを用いて1回光源推定を行い、重み付け係数が最大となる光源パラメータの方向を主光源の方向として決定するようにしても良い。また、被写体の形状と被写体に写り込んだ正反射光から主光源の方向を決定しても良い。
そして、本実施例では、主光源の方向を1つだけ決定したが、主光源かどうかを判定するパラメータ値が予め設定しておいた条件を満たすのであれば、複数の光源の方向を主光源の方向として決定しても良い。
また、推定する光源パラメータとして半球面を36×9に均等分割した無限遠環境マップを用いたが、撮像シーン内の光源環境を表現する光源パラメータであれば良く、分割数、分割方法や、無限遠光源であることを限定するものではない。例えば、光源パラメータとして、半球面を等立体角で分割するジオデシックドーム(geodesic dome)や、被写体が仮想的な立方体の中央に配置していると見做し、撮像シーン内の光源を立方体の各面で表現するキューブマップを用いても良い。また、様々な空間周波数の正弦波を基底関数に持つ球面調和関数や、有限長波形を基底関数に持つウェーブレット関数を用いても良い。
さらに、本実施例では、CG画像として、撮像画像に形状・反射特性が既知の仮想物体を合成したが、撮像シーン内の光源パラメータを用いた画像処理であれば良く、特に仮想物体の合成処理に限定するものではない。例えば、撮像画像の光源環境を変化させたCG画像を生成しても良い。
(その他の実施形態)
また、本発明の目的は、以下の処理を実行することによっても達成される。即ち、上述した実施形態の機能を実現するソフトウェアのプログラムコードを記録した記憶媒体を、システム或いは装置に供給し、そのシステム或いは装置のコンピュータ(またはCPUやMPU等)が記憶媒体に格納されたプログラムコードを読み出す処理である。この場合、記憶媒体から読み出されたプログラムコード自体が前述した実施の形態の機能を実現することになり、そのプログラムコード及び該プログラムコードを記憶した記憶媒体は本発明を構成することになる。

Claims (14)

  1. 複数の異なる視点からの撮像により得られた撮像画像と、所定の数の領域に分割された撮像シーン内の環境を表す環境マップとを用いて、当該撮像シーンにおいて被写体に影や光源の写り込みを生み出す光源の方向を推定する光源方向推定手段と、
    前記光源方向推定手段で推定された前記方向に基づいて、前記撮像シーン内の光源を表す光源パラメータを設定する光源パラメータ設定手段と、
    前記光源パラメータ設定手段で設定された光源パラメータに基づいて、前記撮像シーン内の光源を推定する光源推定手段と
    を有することを特徴とする画像処理装置。
  2. 前記光源方向推定手段は、前記所定の数の領域の中から抜き出された一部の領域に対応する各光源下におけるCG画像を生成し、生成された各CG画像と前記撮像画像とを比較することにより、前記方向を推定することを特徴とすることを特徴とする請求項1に記載の画像処理装置。
  3. 前記光源方向推定手段は、前記各CG画像について前記撮像画像との差分の平均値を求め、求められた各平均値と所定の閾値とを比較することにより、前記方向を推定することを特徴とする請求項2に記載の画像処理装置。
  4. 前記光源パラメータ設定手段は、前記光源方向推定手段で推定された前記方向に基づき、前記所定の数の領域よりも小さな領域に対応する光源パラメータを設定することを特徴とする請求項1乃至3のいずれか1項に記載の画像処理装置。
  5. 前記光源パラメータ設定手段は、前記所定の数に分割された各領域のうち、前記光源方向推定手段で推定された前記方向との差分が所定の閾値より小さい領域についてさらに小さな単位に分割することにより、前記所定の数の領域よりも小さな領域に対応する光源パラメータを設定することを特徴とする請求項1又は3記載の画像処理装置。
  6. 前記環境マップとして、半球面を均等分割した無限遠環境マップを用いることを特徴とする請求項1乃至5のいずれか1項に記載の画像処理装置。
  7. 前記環境マップとして、半球面を等立体角で分割したジオデシックドームを用いることを特徴とする請求項1乃至5のいずれか1項に記載の画像処理装置。
  8. 前記環境マップとして、前記撮像シーン内の光源を立方体の各面で表現するキューブマップを用いることを特徴とする請求項1乃至5のいずれか1項に記載の画像処理装置。
  9. 前記環境マップとして、球面調和関数を用いることを特徴とする請求項1乃至5のいずれか1項に記載の画像処理装置。
  10. 前記環境マップとして、ウェーブレット関数を用いることを特徴とする請求項1乃至5のいずれか1項に記載の画像処理装置。
  11. 前記光源推定手段は、前記光源パラメータ設定手段で設定された各光源パラメータ下におけるCG画像を生成し、生成した各CG画像の画素値の線形和が撮像画像の画素値と一致するような、各CG画像の重み付け係数を導出することを特徴とする請求項1乃至10のいずれか1項に記載の画像処理装置。
  12. 前記撮像画像は、多眼方式の撮像装置を用いて撮像されることを特徴とする請求項1乃至11のいずれか1項に記載の画像処理装置。
  13. 複数の異なる視点からの撮像により得られた撮像画像と、所定の数の領域に分割された撮像シーン内の環境を表す環境マップとを用いて、当該撮像シーンにおいて被写体に影や光源の写り込みを生み出す光源の方向を推定する光源方向推定ステップと、
    前記光源方向推定ステップで推定された前記方向に基づいて、前記撮像シーン内の光源を表す光源パラメータを設定する光源パラメータ設定ステップと、
    前記光源パラメータ設定ステップで設定された光源パラメータに基づいて、前記撮像シーン内の光源を推定する光源推定ステップと
    を含むことを特徴とする画像処理方法。
  14. コンピュータを請求項1乃至12のいずれか1項に記載の画像処理装置として機能させるためのプログラム。
JP2013034701A 2013-02-25 2013-02-25 画像処理装置、画像処理方法及びプログラム Pending JP2014164497A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013034701A JP2014164497A (ja) 2013-02-25 2013-02-25 画像処理装置、画像処理方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013034701A JP2014164497A (ja) 2013-02-25 2013-02-25 画像処理装置、画像処理方法及びプログラム

Publications (1)

Publication Number Publication Date
JP2014164497A true JP2014164497A (ja) 2014-09-08

Family

ID=51615049

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013034701A Pending JP2014164497A (ja) 2013-02-25 2013-02-25 画像処理装置、画像処理方法及びプログラム

Country Status (1)

Country Link
JP (1) JP2014164497A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017126883A (ja) * 2016-01-14 2017-07-20 キヤノン株式会社 画像処理装置、撮像装置および画像処理プログラム
CN113274734A (zh) * 2021-06-08 2021-08-20 网易(杭州)网络有限公司 虚拟场景的生成方法、装置和终端设备
JP2021524628A (ja) * 2018-05-24 2021-09-13 マイクロソフト テクノロジー ライセンシング,エルエルシー 照明推定

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017126883A (ja) * 2016-01-14 2017-07-20 キヤノン株式会社 画像処理装置、撮像装置および画像処理プログラム
US10356384B2 (en) 2016-01-14 2019-07-16 Canon Kabushiki Kaisha Image processing apparatus, image capturing apparatus, and storage medium for storing image processing program
JP2021524628A (ja) * 2018-05-24 2021-09-13 マイクロソフト テクノロジー ライセンシング,エルエルシー 照明推定
JP7386812B2 (ja) 2018-05-24 2023-11-27 マイクロソフト テクノロジー ライセンシング,エルエルシー 照明推定
CN113274734A (zh) * 2021-06-08 2021-08-20 网易(杭州)网络有限公司 虚拟场景的生成方法、装置和终端设备
CN113274734B (zh) * 2021-06-08 2024-02-02 网易(杭州)网络有限公司 虚拟场景的生成方法、装置和终端设备

Similar Documents

Publication Publication Date Title
US10867430B2 (en) Method and system of 3D reconstruction with volume-based filtering for image processing
JP6425780B1 (ja) 画像処理システム、画像処理装置、画像処理方法及びプログラム
CN110910486B (zh) 室内场景光照估计模型、方法、装置、存储介质以及渲染方法
CN109242961B (zh) 一种脸部建模方法、装置、电子设备和计算机可读介质
US20180014003A1 (en) Measuring Accuracy of Image Based Depth Sensing Systems
CN110148204B (zh) 用于在真实环境的视图中表示虚拟对象的方法和系统
US11589023B2 (en) Image processing apparatus, image processing method, and storage medium
JP6625745B2 (ja) 画像処理装置
TW201618545A (zh) 用於全視差光場壓縮之預處理器
JPWO2019031259A1 (ja) 画像処理装置および方法
JP2016537901A (ja) ライトフィールド処理方法
JP6045378B2 (ja) 情報処理装置、情報処理方法及びプログラム
JP2020523703A (ja) ダブル視野角画像較正および画像処理方法、装置、記憶媒体ならびに電子機器
CN111612878B (zh) 将静态照片制作成三维效果视频的方法及装置
CN107517346A (zh) 基于结构光的拍照方法、装置及移动设备
TW201921318A (zh) 用於產生場景之舖磚式三維影像表示之設備及方法
CN109190533B (zh) 图像处理方法和装置、电子设备、计算机可读存储介质
CN111866523B (zh) 全景视频合成方法、装置、电子设备和计算机存储介质
WO2018052100A1 (ja) 画像処理装置、画像処理方法、画像処理プログラム
US10163250B2 (en) Arbitrary view generation
JP6575999B2 (ja) 照明情報取得装置、照明復元装置、およびこれらのプログラム
TW201824178A (zh) 全景即時影像處理方法
JP2014164497A (ja) 画像処理装置、画像処理方法及びプログラム
JP2016114445A (ja) 3次元位置算出装置およびそのプログラム、ならびに、cg合成装置
CN109166176B (zh) 三维人脸图像的生成方法与装置