本発明の画像処理装置は、偏光面が順次変化する直線偏光を偏光照明として被写体表面に照射する偏光光源と、カメラ(撮像装置)とを備えている。このカメラは、各々が1画素に相当するサイズを有する複数の光感知セルを備え、被写体表面の反射光から被写体表面の輝度画像を取得する。本発明の画像処理装置は、更に、輝度画像を高解像度化する高解像度化処理部を備えている。この高解像度化処理部は、偏光面の変化に伴う輝度画像の輝度変動量を用いて、被写体表面における1画素よりも小さなサブ画素領域の法線を推定する。そして、推定した法線を用いて輝度画像を高解像度化する。本発明では、カメラが被写体表面の輝度画像を取得するとき、偏光光源とカメラとの配置関係が固定された状態で直線偏光の偏光面が変化する。照明光の偏光状態を利用することにより、光源の位置を大きく移動させることなく、1画素内の法線分布(法線ヒストグラム)を求めることが可能になる。
本明細書における「高解像度化」とは、図1Aに示すように、本来的には輝度が平均化された1画素について、その1画素に含まれる複数のサブ画素領域の輝度を推定し、輝度画像の解像度を高めることである。1画素内に含まれる個々のサブ画素領域の輝度は、各々のサブ画素領域の法線を求めることにより、決定することができる。高解像度化処理部は、専用のハードウェアによって実現される場合に限られず、ソフトウェアとハードウェアとの組み合わせによっても好適に実現され得る。例えば、公知の構成を有するハードウェア(プロセッサ)に本発明の処理を実行するフトウェア(プログラム)を組み込むことにより、本発明の高解像度処理装部を構成することができる。このようなプログラムは、好適には記録媒体に記録された状態で画像処理装置に組み込まれるが、通信線を介して、あるいは無線により、画像処理装置に組み込まれることも可能である。
本発明では、後に詳しく説明するように、まず偏光照明が照射された被写体表面における多重反射を利用し、1画素内の法線ヒストグラムを求める。そして、その法線ヒストグラムを構成する個々の法線に対応したサブ画素領域の配置を決定する。
なお、「1画素」のサイズは、撮像素子の撮像面に配列された個々の光感知セル(フォトダイオード)のサイズに相当する。通常、1つの光感知セルが1つの画素に相当するが、隣接する4つの光感知セルの中心部が1画素として機能する場合もある。そのような場合でも、1画素のサイズは、光感知セルのサイズに相当する。
以下、図面を参照しながら、本発明による画像処理装置の実施形態を説明する。
(実施形態1)
図1Bは、本発明の実施形態1における画像処理装置の全体構成を模式的に示す図である。
自在ズーミング機能を有する本実施形態の画像処理装置101は、偏光光源102、偏光カメラ103を備えている。被写体104を撮影する際には、偏光光源102からの偏光照明105が被写体104に照射される。被写体104の表面で反射した偏光照明(偏光反射光106)が偏光カメラ103に到達して偏光情報が偏光カメラ103内に記録される。偏光カメラ104は、後述するように、被写体104の輝度画像と偏光情報の両方を取得できる。
偏光照明105と偏光反射光106のなす角度LV107は、10°以下であることが望ましい。角度LV107を小さくすることにより、被写体104上の微細な凹凸構造で発生する光の多重反射(Interreflection)を利用して、凹凸構造に関する情報を取得することが可能になる。また、角度LV107を小さくすることにより、被写体104の表面での影の影響を少なくすることができる。角度LV107を10°以下にすることにより、屈折率1.4〜2.0の自然物体において、光のP偏光とS偏光がほぼ等価な挙動を示すことがフレネル反射理論からわかる。これらの詳細については、後述する。
図2は、本実施形態における偏光カメラ103の構成例を示す図である。
この偏光カメラ103は、偏光撮像素子201、輝度・偏光情報処理部202、偏光面制御部204、撮像制御部205を備えている。
偏光面制御部204から偏光照明の偏光面を変化させる度に画像を撮像する。これにより、輝度画像Y(260)、および偏光位相画像P(270)が、偏光面の異なる各偏光状態に対応して複数得られる。高解像度化処理部203からは、高解像度化法線画像208、および高解像度輝度画像209が生成される。
本実施形態における偏光カメラ103は、モノクロ画像と偏光画像を同時にリアルタイムで取得することができる。この偏光カメラ103は、輝度画像Y、偏光度画像D、偏光位相画像Pの3種類の画像データを出力する。
偏光カメラ103に内蔵された偏光撮像素子201は、輝度画像と被写体の部分偏光の画像とを同時に取得する。このため、偏光撮像素子201では、複数の異なる偏光主軸を有する微細パターン化偏光子のアレイをCCDやMOSセンサなどの撮像素子上に配置している。微細パターン化偏光子としては、フォトニック結晶や構造複屈折波長板、ワイヤーグリッド等が利用できる。この構成は特許文献1に開示されている。
図3は、偏光光源102の構成例を示す図である。偏光光源102は、偏光フィルタ部301、非偏光を発生する光源302、可動ミラー308、ミラー309、可動ミラー制御部312、シャッター310、311を備えている。
偏光フィルタ部301は、ツイステッドネマィック液晶セルと偏光フィルムとを組み合わせた電圧印加型液晶デバイスなどで構成され得る。偏光フィルタ部301は、光源302から発生した非偏光の光を、任意の偏光角度に偏光面を有する直線偏光に変換する。偏光面を回転させることが可能なデバイスの構成例は、特許文献2、3、非特許文献3等に開示されている。
可動ミラー308は、図3の位置Aから位置Bとを移動可能である。可動ミラー308が位置Aにあるとき、光源302からの光は301、およびシャッター311を通過して偏光面を回転させながらその被写体を照射する。同時に画像が撮像され、これを複数回実施する。すなわち偏光面が0°状態(図の状態303)で第1の画像を撮像し、偏光面が45°状態(図の状態304)で第2の画像を撮像し、偏光面が90°状態(図の状態305)で第3の画像を撮像し、偏光面が135°状態(図の状態306)で第4の画像を撮像する。
偏光面の回転に要する時間は、上記文献によれば、20(ms)程度である。これは、動画の1フレーム時間内に収まると考えて良い。このため、4方向の偏光回転を実施して撮影をすると、実質8(フレーム)時間程度=約0.5(sec)で1セットの撮影が終了する。この時間内は、被写体とカメラの相対的運動はゼロであることが望ましい。
なお、偏光フィルタ部301の機能をOFFにして、非偏光を被写体に照射することもできる。その場合は、可動ミラー308が図3の位置Bに移動する。そして、光は光源302からミラー309へ導かれ、シャッター310を通過して被写体に照射される。その場合、光の偏光面は参照符号307で示すように、あらゆる方向にランダムに存在する。このように、シャッター310、311は、互いに開閉の状態をとり、同時に偏光と非偏光が照射されることを防ぐ。
図4は、偏光面の角度ΨIの定義を示す図である。被写体に向かってX−Y座標系を設定し、偏光面の角度は、X軸負向きを0°としてY軸正向きを正向に回転角を定義するものとする。偏光入射角度ΨIが反射において保存される場合には、反射光の偏光面角度と入射光の偏光面角度は同一となる。
図5は、偏光撮像素子201の撮像面を示す図である。撮像面には、複数の光感知セル(フォトダイオード)が行および列状に規則的に配列されている。個々の光感知セルは、光電変換により、入射したた光の量に応じて電気信号を生成する。本実施形態の偏光カメラ103では、撮像面がパターン化偏光子のアレイによって覆われている。偏光撮像素子201の各光感知セルに対してパターン偏光子の1個が対応する。隣接する4つの光感知セルに対応する4つのパターン偏光子は、それぞれ、偏光透過面が0°、45°、90°、135°となるように設定されている。図5の画素セット501、502は、それぞれ、2×2画素からなり、その中心位置が1画素だけシフトしている。この画素セット502の4個の画素からのデータを取得した後、画素セット203の4個の画素からのデータを取得することができる。このように、2×2画素のウインドウを1画素ずつずらしながら処理することによって、偏光情報と輝度情報を、解像度を実質的に落とさずに得ることができる。すなわち、撮像素子の解像度(画素数またはフォトダイオード数)が1120×868の場合には、1119×867画素のY、D、P画像を得ることができる。
図5の例では、隣接する4つの光感知セルの信号に基づいて、それらの中心部に位置する領域の偏光情報を得ることができる。例えば、画素セット501の中心領域(サイズは1つの光感知セルのサイズに相当)が、「1画素」として機能する。1画素のサイズは、1個の光感知セルのサイズに相当しているが、1画素の中心位置は、光感知セルの中心位置に拘束されない。
本発明によれば、1つの光感知セルのサイズよりも小さなサイズを有する領域の法線を推定し、そのような微細な領域の輝度を求めることができる。
次に、図6を参照して、輝度画像Y、偏光位相画像Pの求め方を説明する。
最初に、振幅をAo、パターン偏光子の偏光透過面角度をΨo、位相をΦoとして、偏光情報を表す正弦関数の式を以下のように仮定する。
図2に示す輝度・偏光情報処理部202では、45°の間隔で偏光角度が異なる4つの偏光画素の4個の輝度値から輝度画像Yが計算され、輝度画像Y206が生成される。
輝度・偏光情報処理202では、サンプルされた4個の輝度値から余弦関数へのフィッティングを行う。まず偏光角度が0°、45°(=π/4)、90°(=π/2)、135°(=3π/4)における輝度の2乗誤差Eを以下のように定義する。
この2乗誤差を最小化する余弦関数の位相φoは、以下の式から求められる。
ソフトウエアによる実装において、逆三角関数などの数学関数では、一般に以下のような制限が課されている。
この角度範囲を考慮すると、aとcの大小関係からの場合わけを行うことによって、最小値をとる角度と最大値をとる角度は以下のように計算できる。
この最大値をとるΨmaxの値を、そのまま、偏光位相画像P207とすればよい。
次に、振幅の最大値と最小値を求める。まず、振幅Aoを求めるため、以下の式を用いて2乗誤差の最小化を行う。
得られた振幅Aoを用いて、振幅の最大値と最小値は以下のようになる。
このように、本実施形態では、照明条件を固定して1回の撮影がされた際、撮像された偏光画像から輝度画像Yと、偏光画像Pという2種類の画像情報を得ることができる。
前述のように、撮像素子の画像解像度とほぼ等しい解像度が得られるため、輝度画像Yの解像度は、撮像素子にパターン化偏光子を設置しない状態の輝度画像の解像度とほぼ変わらないと考えられる。一方、本実施形態における撮像素子からは、輝度画像Yに加えて偏光画像Pを同時に獲得することもできる。したがって、本実施形態によれば、偏光情報として偏光位相と偏光度が増加したことになる。つまり偏光カメラを用いることで、従来の輝度画像情報よりも被写体の表面反射に関する、より多くの情報が得られる。
本実施形態では、さらに偏光照明の偏光面を変えながら偏光カメラでの撮影を行う。これにより、輝度の撮像だけでは不可能な1画素内の微細領域(サブ画素)の情報を含む画像の取得を実現する。
図7Aおよび図7Bは、本発明者らが表面の滑らかな陶器製コップと表面に微細凹凸を有する木の板を被写体として偏光撮像をした画像を示す。図7Aの左側に位置する2つの画像は、照明の偏光面の角度=0°の偏光画像である。一方、図7Aの右側に位置する2つの画像は、照明の偏光面の角度=90°の偏光画像である。図7Bの4つの画像は、それぞれ、図7ABの4つの画像を模式的に描いた図である。これらの図に示す画像は、いずれも、図2に示す輝度画像Yに相当する。
図7Aおよび図7Bの上段に位置する画像から明らかなように、表面が滑らかな陶器では、偏光照明の偏光を変化させても輝度パターンの変化はあまり観測されなかった。しかし、多くの凹凸が存在する木の板では、図7Aおよび図7Bの下段に位置する画像から明らかなように、偏光照明の偏光面を変化させると、観測される輝度画像に大きな変化があることが判明した。
図8Aは、木の板の表面に入射する光(偏光照明)の偏光面を変化させながら輝度画像を撮影した場合の同一画素値の輝度変動を示すグラフである。図8Bは、撮像対象となる木の板の輝度画像である。図8Cは図8Bの木の板の表面の凹凸を模式的に示した図である。
図8Aは、偏光照明の偏光面の角度ΨIが0°、45°、90°、135°のときに得られた輝度画像の特定の画素における輝度Yを示している。このグラフから、輝度Yは各偏光照明の偏光面の角度ΨIに対して周期変動を示すことがわかる。このような輝度Yの角度ΨIの依存性に関する情報は、照明の偏光状態を変化させずに撮像した普通の偏光撮像では観測できていない新しい情報である。
図9(a)から(c)は、偏光照明の偏光面の角度をΨI=0°、45°、90°、135°と4種類に変化させて偏光画像を取得した場合に得られる情報を説明している。図9(a)は、照明の偏光面の角度を示している。被写体で反射された偏光照明の光は、偏光透過軸の角度ΨO=0°、45°、90°、135°というパターン偏光子のモザイクからなる偏光画素に入射する。各角度の偏光画素にて得られる輝度の空間的変化が9(c)のグラフにおいて曲線901で示されている。曲線901の偏光位相は、図5で示す受光素子上の偏光子モザイクの4画素の位置の偏光透過軸の角度ΨOに対して得られる空間的変動に相当する。輝度Yの変動は、照明の偏光面の変化に伴うΨIの軸で得られる時間的な変動(図9(b))になっていることに注意する。
今、この輝度Yの変化の関数を周期180°の余弦関数として近似することを考える。照明の偏光面の角度をΨIとして以下のように表現する。
この関数には、振幅、位相、平均値の3種の情報が含まれている。振幅と平均値を用いる最大値Ymax、最小値Ymin、および最大値および最小値を与える角度ΨImax、ΨIminの情報を取得する。4つの等間隔の角度サンプルから余弦関数をフィッティングして上記の値を推定する手法は、(式1)から(式12)で説明した方法がそのまま使える。
偏光でない通常の入力輝度としての原画像となる理論輝度を以下の式で求める。
次に、被写体表面の1画素内の凹凸のモデルを説明する。
本実施形態で採用する微細凹凸モデルは、物理ベースコンピュータグラフィックス分野で広く使われている「マイクロファセットモデル」である。
図10は、凹凸のある表面を観察した場合の1画素内の微細法線分布を示す斜視図である。カメラの1画素を示す領域1001は、平均輝度を有するが、その内部の輝度分布は不明である。すなわち、1つの画素内の構造までは、撮影することができない。
微細凹凸モデルでは、表面が鏡面反射のみを示す仮想的な微細面(マイクロファセット)で構成されていると仮定し、その各マイクロファセットが微細法線を有していると考える。各マイクロファセットは鏡面反射のみを呈するため、照明方向L、および視点方向Vを決定すると、その角度関係において、光るマイクロファセット1002の群と光らないマイクロファセット1003の群とがある。1画素内に存在するすべての光るマイクロファセット1002の輝度を合計したものが1画素の平均輝度に相当する。光らないマイクロファセットからの輝度はゼロ(真黒)となる。
図11に示すように、光るマイクロファセット1002の微細法線は照明ベクトルLと視線ベクトルVのちょうど2等分ベクトルHに相当している。すなわち、1画素以内の凹凸構造を推定することは、このマイクロファセットの微細法線を推定することになる。
次に、マイクロファセットに偏光照明が入射した場合の作用を考える。ただし、入射する偏光照明と撮影するカメラの視線との間の角度は、図1の角度107で示されるように、ゼロ度に近いという特殊な幾何学的な関係を想定している。
図12は、マイクロファセット1201に対して入射角がゼロに近い偏光が入射して直接反射をカメラで観測する様子を示している。図12(a)、(b)では、入射する偏光の偏光面が90°異なっている。しかし、反射光の偏光情報は、光の進行方向が変わるだけで入射光とほぼ同一である。これは以下の理由による。
図13は、フレネル反射率の入射角依存性を示すグラフである。横軸が入射角、縦軸がフレネル反射率をである。この依存性は、屈折率n=1.8と想定して描いたものである。ほぼ垂直入射とみなせる0°〜10°付近の入射角度は、範囲1301に相当する。グラフから読み取れるように、この範囲1301では、P偏光もS偏光も反射率がほぼ同一である。したがって、偏光がほぼ垂直に表面に入射した場合には、表面に対するP波とS波という偏光の区別がほとんど無くなる。なお、この事実は、屈折率n=1.4〜2.0の自然物体において、広く成立する。
入射角度が10°以下の場合、偏光照明を回転させても反射率がほとんど変らず反射光のエネルギーが変わらないため、観測される輝度は不変となる。つまり、入射偏光面の回転に伴う輝度変動は発生しない。このような場合、輝度Yの角度ΨI依存性は、図8Aにで示したような実験結果にはならないことになる。
図14(a)および(b)は、同じく被写体に偏光照明が入射角ゼロ付近で入射され反射光をカメラで観察している状態を示す。この例では、2つのマイクロファセットが対になり、多重反射を起こしていると考える。具体的には、2つのマイクロファセットがグルーブ(Groove):溝1401を形成し、その斜面で2回の反射が発生していると仮定する。
この種の多重反射は、表面の凹凸が多い被写体表面、例えば布、木材、人の肌、皮など様々な自然物で発生していると考えられる。1回目と2回目の反射の性質が重要となり、3回目以降の多重反射は輝度が小さくほぼ無視できる。一般に反射の性質を鏡面反射と拡散反射に分離した場合、
1)1回目:拡散反射 2回目: 鏡面反射
2)1回目:拡散反射 2回目: 拡散反射
3)1回目:鏡面反射 2回目: 拡散反射
4)1回目:鏡面反射 2回目: 鏡面反射
の4通りの現象が想定できる。
このうち、1)と2)は最初の反射によって拡散光として非偏光となり、あらゆる方向に光を反射する。しかし実験によると被写体が着色して輝度が暗い場合はこの1回目の拡散反射成分は比較的弱い。これは被写体の内部への光の浸透が少ないことを意味し、フレネル理論によればそれと相補的な3)4)の鏡面反射の現象が優位となる。また、3)のように2回目を拡散反射と考えた場合には、その入射と反射の幾何学的関係から、当然、4)も同時に発生していることがわかる。この場合には、偏光度、輝度のいずれの基準でも、鏡面反射の現象が主たる輝度成分となる。
以上から、4)の1回目も2回目も鏡面反射という現象を主要な現象として考えればよい。
図15は、1回目、2回目とも鏡面反射を想定した場合の対となるマイクロファセットの位置関係を示している。グルーブ(Groove)を形成する斜面1501、1502の被写体のマクロな表面1503から測定した角度をαとβとする。また、1回目反射の入射角をθ1とし、2回目反射の入射角θ2とする。更に、入射光、反射光とグルーブ斜面とのなす角度をγとδとすると、以下の関係が成立する。
ただし、角度LVは図1で定義した入射角と反射角であり、0°〜10°程度と想定される。グルーブの斜面がおおよそ対称であると考えると、α=βが成立する。したがって、
と推定できる。
再び図13を参照する。図13のフレネル反射率のグラフには、上記の角度範囲に相当する範囲1302が記載されている。グラフから読み取れるように、この入射角の範囲1302では、P偏光の反射率が極めて弱くなる。
図14(a)で示すように、グルーブの主軸方向1402に対して垂直に入射する偏光照明はP偏光である。上述の理由から、このP偏光は1回および2回反射を経由する間に極めて弱くなる。一方図14(b)で示すS偏光は、2回の反射を経てもそれほど弱まらない。その結果、グルーブに対してP偏光となる入射偏光面においては、反射光はエネルギー的にも極めて弱くなり、輝度が低下する。一方、S偏光となる入射偏光面においては、反射光はそれほどエネルギーが減衰せず輝度も高い。
以上のようにマイクロファセットが対となるグルーブを形成すると仮定すれば、実験にて得られた入射光の偏光面の回転による反射光の輝度変化が説明できる。このため、本発明の好ましい実施形態では、これを活用した以下の表面モデルを用いる。
図16は、以上の考察から得られた被写体表面の「3領域モデル」を説明する図である。3領域モデルとは、1画素の表面凹凸の法線構造を多重反射と偏光現象の観点から簡略化したモデルである。3領域モデルでは、1画素において以下の3種類の2次元領域が各々一定の面積比率で混合されているとする。なお、このモデルでは、後述するようにグルーブはT領域とD領域に分離される。
1)直接反射領域:S(Specular)領域:
入射光が直接反射し、入射光の偏光面回転に対して反射輝度が変動しないマイクロファセットで形成される領域。この領域のマイクロファセット法線は、入射光とカメラ視点ベクトルとの2等分線に相当する。
2)2回反射領域:T(Twice Reflection):
入射光がグルーブにて2回反射を起こして2回目に反射する領域。入射の偏光面回転に対し反射輝度が変化するマイクロファセットで形成される。
3)暗領域:D(Dark)領域:
入射光がカメラと無関係の方向に反射し輝度に寄与しないマイクロファセットで形成される領域。この領域はさらに2つに分類できる。第1はグルーブを形成する1回目反射の領域であり、グルーブの他の斜面を照明するが、カメラ撮影視点からは光っていない領域である。第2は全く異なる未知方向へ光を反射する領域である。ただしこの未知方向の場合は扱いが不便であるため、本発明の好ましい実施形態においては、T領域を作る1回目反射と同じ向きのマイクロファセット法線を有すると仮定する。この領域の反射輝度もまた入射光の偏光面回転に対して変動しない。
この3領域が1画素内を構成する凹凸に対応すると考える。各領域での法線、すなわちマイクロファセット法線および1画素内における各マイクロファセットの面積比率を求めることによって、法線ヒストグラムを推定することができる。なお、マイクロファセットの法線の向きは、2つの自由度を有している。具体的には、方位角度および天頂角によって法線の方向は特定される。
以下、法線の向き、輝度、面積比率の求め方を説明する。
図17(a)は、3領域モデルの凹凸が被写体表面の1画素内において、ある方位角に整列して存在する状態を模式的に示す斜視図である。グルーブの主軸1701が主方位角ΨImaxに相当している。図17(b)は、偏光照明の偏光面の角度と主軸1701の主方位角ΨImaxとの関係を示す図である。
図14における考察から、この主軸1701は偏光照明を回転させた際の最大輝度の向きに一致することがわかる。そこで、これ以降、主方位角はΨImaxに等しいとして取り扱う。
S、T、D各領域におけるマイクロファセット法線の向きは、この主方位角ΨImaxから90°ずれた角度ΨIminを共通して有し、個別に天頂角を有する2自由度の角度にて表現される。
まず、S領域における法線の天頂角は、入射光と反射光の2等分角に等しくなる。法線は、これ以降はカメラ座標系でカメラ投影面上での点として表現する。これは後の勾配空間(p、q)とほぼ同じ意味になる。
図18(a)および(b)は、入射光Lと反射光Vとカメラ座標系XYZの関係を表している。カメラ座標系で照明ベクトルが
となる。
そこで、このベクトルとカメラの視点ベクトルとの2等分線としてS領域での法線は
となり、ほぼカメラ視点に向かってくる法線となる。なお、ここでΨIは照明の偏光面角度である。
次に、T領域を考察する。S領域での法線のように、幾何学的に概略値を求めることも可能である。しかし、ここでは、偏光カメラで取得される偏光位相画像Pから求めるものとする。P画像を観察すると、入射偏光角ΨINと観測される位相角Ψoutとの間に、ある回転角のずれがあることがわかる。たとえば、ΨI=45°の場合に、この回転角のズレ量ΔΨを観測したとすると、フレネル反射の理論からθが求められる。
図19は、グルーブの主軸に平行なS軸と垂直なP軸の座標系に対して、偏光のエネルギーEpおよびEsと偏光面がどのように変化するかを示す図である。入射角をθ、屈折率をnとするとP波とS波に対するエネルギーのフレネル反射率はFp(θ、n)、Fs(θ、n)を用いて以下のようになる。簡単のためθ1=θ2としている。
ここで、偏光照明の偏光面角度ΨIとグルーブのなす角度ΨINは、偏光面回転から観測される値ΨImaxがグルーブの主軸角度に等しいことから、以下のように決定できる。
屈折率nは被写体に係わる量のため本質的には未知である。ここでは、近似値としてn=1.5〜1.8を用いればよい。なお、この値はプラスチック、樹脂、ガラスなど自然界に存在する典型的な誘電体の屈折率である。
こうして式21を満たすθ1を決定すればよい。
したがって、T領域における法線の天頂角はカメラ座標系では、
となる。
D領域の法線は3領域モデルにおける仮定より
とすればよい。
次に、各領域の輝度につき考察する。絶対的な輝度は実際の実験条件における偏光照明照度やカメラ設定により変動するため、基準値は観測された輝度画像Yの観測から求める必要がある。この基準値として、画像内の鏡面反射領域の最大輝度MAX_Yを用いる。この最大輝度は、3領域モデルのS領域が1画素の全体(100%)を占める場合に得られる。大輝度MAX_YをS領域の輝度Isとする。
S領域の輝度は、照明光を1回反射した際の反射輝度である。これは、図13のフレネル反射率のカーブにおいて、入射角度が範囲1301の領域内にあるときの反射による輝度に相当する。そこで、この式から、屈折率n=1.5〜1.8を仮定して、入射角θ1で1回反射し、さらに入射角θ1で2回目の反射をするT領域のP波とS波の反射輝度が、以下のように推定できる。
D領域の輝度は、画像内の鏡面反射領域の最小輝度MIN_Yを用いる。この最小輝度は3反射モデルの1画素の全体(100%)を占める場合に得られる。
図20は、3領域モデルの各領域におけるマイクロファセット法線、反射輝度、および面積比率を示す図である。まず、3領域の反射輝度を以下のようにIs、IPT、IST、Idと仮定する。T領域では、P波とS波の入射によって反射輝度が異なることに注意する。
1)S領域・・・Is
2)T領域・・・P波入射の際 IPT、S波入射の際IST
3)D領域・・・Id
これら輝度値は、上述のように、観測値から推定できる。このため、1画素の単位面積に対する面積比のみを未知数とする。これらの未知数を、以下のように、As、AT、(1−As−AT)とする。
1)S領域・・・As
2)T領域・・・AT
3)D領域・・・(1−As−AT)
入射偏光がP波のときに観測される1画素の輝度、およびS波のときに観測される1画素の輝度が、それぞれ、輝度最小値Ymin、最大値Ymaxに対応していることが明らかである。このため、輝度の最大値Yminと最小値Ymaxについて、以下の重み付け平均の式が成立する。
すなわち未知数As、A
T、A
Dは以下の式で推定できる。
以上で、1画素内を3領域モデルでモデル化したときの各領域の法線、輝度、面積比率のすべてが推定できたことになる。ただし、法線の表現形式がカメラ座標系での方位角と天頂角による角度表現では以降の解析に不便である。このため、法線を勾配空間(p、q)に変換する。
勾配空間(p、q)は、実質的に図18で示したカメラ投影面平面と考えてよい。
図21は、2次元勾配空間において求められたマイクロファセット法線の位置を示す図である。S領域の法線は、ほぼ原点上に位置する。被写体表面のグルーブの主軸方向に直交する線2102上にT領域とD領域の法線が位置する。図22は、3領域モデルから得られるマイクロファセット法線のヒストグラムである。主方位角の線上に3個の分布が各々の面積比の高さを有して整列した形になる。
以上で1画素内法線ヒストグラムが推定できたので、以降は法線の最適配置を決定する。ここでは、1画素内を2×2の4画素に分割して法線を求める場合を例に説明する。高解像度への自在ズームは、再度2×2を繰り返すことで実現できる。
まずヒストグラムから得られる各領域に属する画素は、
となる。ただし[]はガウス記号である。
図23から図26は、初期法線配列として1画素を4分割したサブ画素に上記の3種の領域に対応する法線配置を割り当てる方法を示す。この割り当て方法は、グルーブの主方位角ΨImaxの角度に依存するため、45°範囲ごとに区切って図23から図26で説明している。
図23(a)が3領域のヒストグラムの一例を示してものとする。この例では、T領域が2画素、D領域が1画素、S領域が1画素となる。主方位角の範囲は、X軸に近い水平方向である。T領域とD領域の法線をなるべく対にしつつ、主方位角に直交させる。このとき、図23(b)のように、主方位角の線2301に対して、谷を形成する凹(Convcave)タイプと図23(c)のように、山を形成する凸(Convex)タイプとの2種類の配列が考えられ、各々で2通りの配列の組み合わせがある。この図では、S領域の法線は紙面に垂直に近く手前に向いていることを示す。
図24、図25、図26では、おなじ法線ヒストグラムで主方位角だけが異なる場合を描いている。いずれも主方位角の線に対して、これを谷とする凹の場合と稜とする凸の場合とで配列の候補が合計4通りある。なお、配列の組み合わせ数はヒストグラムにより変動することに注意する。
図27(a)および(b)は、すべてがS領域になったヒストグラムの場合であり、配列の可能性は図27(b)のように1通りである。
以上のように図22に示される1つの法線の分布関数(3領域モデルから得られるマイクロファセット法線のヒストグラム)と、図17(a)、(b)に表される主方位角ΨImaxの情報とから、複数の空間配列の可能性が生まれる。このため、この4種類の候補から最適配列を決定すればよい。このような決定方法は、非特許文献1に記載されている方法と同様である。ただし、3領域モデルと主方位角の情報があるため、候補数が本来の4!=24通りから大幅に減少しており、最適化は容易になる。
法線の最適化は、基本的には非特許文献1に記載されている、エネルギー評価関数を最大化する繰りかえし法にて実施すればよい。以下に簡単に処理の流れを説明する。
図28(a)および(b)は、法線ヒストグラムから得られる法線配列が、8次元の配列空間(Arrangement Space)内の1点として表現される様子を示している。この8次元での密度分布関数は混合ガウス分布モデル(GMM:Gaussian Mixture Model)にて表現されている。この確率密度分布関数をテクストンGMMモデルと称する。同一の法線ヒストグラム分布から生成される等価クラス(Equivalencer Class)内には、それを代表する4画素の法線配列が存在し、この8次元の結合ベクトルを3Dテクストン(3Dtexton)、あるいは単にテクストンと称する。この解テクストン(Solution texton)を求めることが目的である。解テクストンの最適選択は、法線から表面を計算する際の積分可能性の拘束条件から実現される。各画素S=(x、y)におけるテクストンをL(S)とすると積分可能性は、線積分がゼロになる条件から計算される。
図29(a)は法線の積分可能性を用いた最適化を説明する図である。非特許文献1にあるように2×2画素のセルにおいて線積分を考え、この線積分をゼロにすることが条件である。
ただし、各画素での法線は勾配空間での表現を使って
である。そこで各画素における積分可能性のエネルギー関数は、
とおき、このエネルギー関数を最大化することによって上記線積分を最小とできる。
隣接する画素対をs、tとする場合、そのオーバーラップ画素領域での積分可能性も考慮する必要がある。図29(b)はこのシフト画素(Shifted pixel)2901での条件を表現している。積分値の条件は、
このオーバーラップ画素領域でのテクストンも解テクストンから得られるはずである。しかし、本来の画素からは出現しない配列パターンであるため、図28においては、画素からははずれた位置2802にある。しかし出現確率はテクストンGMMモデルのガウス関数成分の最大値で表現できるので、この確率にて重みづけする。すなわち、この画素対における条件は、以下を最大化することとなる。
解テクストンは2つのエネルギー関数の積を画像全体において最大化するものとして得られる。
ここでsは画像の全画素を示し、Neighbor(s、t)はすべての4近傍の画素の対を示す。また{}内が求める解テクストンである。
この最適化処理は複雑なため、効率的に実行するためには、1)積分可能性を拘束条件とする初期解を確率伝搬法(Belief Propagation)にて求め、2)その初期解からマルコフ連鎖モンテカルロ(MCMC:Markov Chain Monte Carlo)法を用いた最適化にて収束させる、という2段階のステップを踏む。詳細については、非特許文献1に従う。以上の最適化処理の結果、最適な法線空間配置が決定できる。
図30(a)から(c)は、以上の処理をまとめて1画素の高解像度化の効果を示す図である。以上の処理により、原画像の1画素を2×2に高解像度化した4画素における法線は図30(b)のように最適配置されたものとする。すると図19で示したように3領域モデルにおいてはS、D、Iの各領域法線向きが輝度に一意的に対応するため結果として1画素内を2×2画素に輝度として高解像度化できる。ただし画素輝度はあくまで非偏光照明下での撮影を基準にすべきである。したがって、図30(a)に示すように原画像の輝度は図9における平均輝度Ymaxとなり、高解像度化された輝度は、
1)S領域・・・Is
2)T領域・・・(IPT+IST)/2
3)D領域・・・Id
となる(図30(c)参照)。
図31は、本発明における被写体撮影から画像処理を経て1画素以内の法線分布ヒストグラム、法線配列を推定し、さらに1画素内輝度の配列までを推定するすべての手順を示すフローチャートである。図31において、点線で囲まれた部分が高解像度化処理部の処理に相当している。高解像度化処理部は、図31において、点線で囲まれた部分の処理ステップを、例えば公知のハードウェアに実行させるプログラムを内蔵している。
ステップS3101で実験環境として偏光照明とカメラ視点とのなす角度∠LVを測定する。これはカメラに付属したフラッシュ装置の場合には既知である。また被写体のフレネル反射率の基礎となる屈折率nの値をたとえばn=1.8などと仮定する。
ステップS3102で偏光面の角度ΨIを回転させながら偏光照明を被写体に照射して被写体の偏光撮影を実施する。そして各ΨIの角度におけるY画像とP画像を取得する。
ステップS3103で輝度変動するY画像の各画素で(式14)にて関数フィッティングを行う。この方法は(式1)から(式12)で用いた方法をそのまま用いればよい。ここから輝度が最大、最小となる位相角ΨImax、ΨImin、そのときの輝度YImax、Yminを求める。
ステップS3104にて3領域モデルにおけるS、T、Dの各領域の法線の方位(Azimuth)角および天頂(AZenith)角を求める。この角度2自由度が法線を表現する。方法は、(式17)から(式21)を用いる。ここで用いる図13のフレネル反射の理論カーブは屈折率を仮定したn=1.8として描いたものである。
ステップS3105では、3領域モデルにおけるS、T、D各領域の輝度を求める。(式22)から(式24)に従う。
ステップS3106では、3領域モデルにおけるS、T、D各領域の面積比を(式26)を用いて求める。
ステップS3107では、法線の表現方式を角度からカメラ座標系での勾配空間(p、q)に変換した後、図21、図22で示す1画素内の法線ヒストグラムを求める。
ステップS3108では、図23から図28で示すように法線のヒストグラム分布から1画素内の法線の最適配列を求める。
ステップS3109では図30で示すように1画素内にて最適配置された法線から輝度を求める。
(実施形態2)
第1の実施形態では、偏光照明と偏光カメラを用いて高解像度化を実施していた。しかし、偏光カメラはパターン偏光子を作りこむ特殊な形態であるために高価である。さらに、偏光板による光量低下で感度が低くなり、画質低下の可能性がある。本実施形態では、実施形態1と同じく偏光面が回転する偏光照明を用いながら、画像撮影には通常の輝度を観測するカメラを利用して自在ズーミングを可能とする。
図32は、第2の実施形態を示す図である。本実施形態の構成が、図1に示す構成と異なる点は、カメラ3201が偏光カメラではなく、通常の輝度を観測するカメラであることだけである。
図33は、このカメラ3201を説明する図である。このカメラ3201は、輝度撮像素子3301、偏光面制御部204、撮像制御部205を備えている。偏光面制御部204から偏光照明を変化させる度に画像を撮像する。こうすることにより、輝度画像Y(206)が各偏光状態に対応して複数得られる。さらに高解像度化処理部3303から高解像度化法線画像208、および高解像度輝度画像209が生成される。
図34は、輝度撮像素子3301を示す図である。この輝度撮像素子3301には、図5のようなパターン偏光子が存在しない。このため、元の撮像素子の解像度が1120×868の場合には、同じ解像度である1120×868画素のY画像を得ることができる。また図34(a)の輝度撮像素子ではモノクロ撮像素子を書いているが、図34(b)のように既知のベイヤーモザイクを搭載したカラー撮像素子を利用してもよい。ただし、カメラ3201から出力される画像は、輝度画像Yのみであり、偏光情報であるP画像を取得できない。このため、(式21)で示した3領域モデルのグルーブの斜面における入射角θ1が求められない。そこで
と仮定する。そして、(式15)を用いて、
という幾何学的関係のみから、T領域の法線の角度αを確定し、法線の天頂角θ1を確定するものとする。こうして式39が得られる。
D領域の法線は3領域モデルにおける仮定より、以下の式40で示される。
図35は、本発明の実施形態2に係わる処理の流れを示すフローチャートである。
図31のフローチャートと異なる部分は、ステップS3501において照明の偏光面ΨIを変化させた撮影を実施して各ΨIにつきY画像を取得する部分、およびステップS3502におけるS、T、D領域での方位角と天頂角を求める部分のみである。なお点線で囲まれた部分が高解像度化処理部の処理に相当している。
なお、本実施形態2において、画像をカラー輝度画像とする構成は、ここに含まれるものとする。その手法は、輝度カメラとしてカラーカメラを用いる方法、および偏光照明をカラー化する方法のいずれでも構わないがいずれも公知技術であるから詳細な説明は省略する。
また、本実施形態2において医療用用途に画像をマルチバンドカラー輝度画像とする構成もここに含まれるものとする。その手法は輝度カメラとしてマルチバンドカラーカメラを用いる方法であり、公知技術であるから詳細な説明は省略する。
また、本実施形態2において監視カメラ用途に画像を赤外画像、偏光光源を赤外光源とするなどの構成もここに含まれるが、公知の技術であるため説明は省略する。
(実施形態3)
以下、動画と静止画を切り替えながら撮影可能な画像処理装置の実施形態を説明する。本実施形態は、基本的な構成として、実施形態1および2のいずれの構成を採用することも可能である。ここでは、実施形態2の構成を有する場合を例に説明する。
一般に動画の撮像、再現では、人間の解像度に関する感覚がやや低下し、高解像度化の効果がみえづらい。しかし、静止画の撮像、再現においては、高解像度が効果的になる。例えば、医療用内視鏡カメラなどの分野では、通常、医師が動画として撮像、観察を行うが、病巣部分では静止画撮影が実施される。
そこで、動画撮影時には非偏光光源にて通常の動画撮像を行ない、従来型の動画高解像化処理を実施することとする。一方、コマンド指示により、静止画を撮影するときには、自在ズーミングが可能な偏光光源を照射して画像を撮像する。
従来型の動画高解像度化処理は、後述する。まず、静止画を撮影する場合を説明する。
図36は、本実施形態のムービーカメラ3500の構成を示す図である。本実施形態では、動画・静止画コマンド入力部3601がカメラに搭載されている。動画撮影時には、非偏光照明の照射が偏光面制御部204、撮像制御部205を経由して行われる。同時に撮像素子3301からの画像信号は動画静止画選択部3602を経由して輝度動画列メモリバッファ3603内に時間的に連続して取得される。輝度動画列メモリバッファ3603内から読み出された画像信号は、「動き」ベースの既存の動画高解像度化処理部3604で処理され、高解像度動画3605として蓄積される。
一方、静止画撮影時には、偏光照明の照射が偏光面制御部204、撮像制御部205を経由して行われる。同時に撮像素子3301からの画像信号が3602を経由して輝度画像としてメモリに蓄積され、実施形態2で説明した高解像度化処理が高解像度化処理部3303で実施される。
図37は制御方法を示すフローチャートである。
最初にステップS3700にて静止画撮影コマンドの入力の有無を判断する。ステップS3700で静止画撮影コマンドが入力が無(NO)場合、動画撮影を行う。具体的にはステップS3701にて非偏光照明がONとなり、ステップS3702で動画が録画されて、ステップS3703にて既存の動画高解像度化処理が行われる。この動画高解像度化処理には例えば、特許文献3に開示されているような従来技術が使われる。
この動画像高解像度化技術は、動画複数フレーム間の動きを用いる一般的な技術であり、以下の処理が実行される。
補間を行って最初の高解像度推定画像を生成する。位置合わせを行って位置合わせ画像を生成する。高解像度推定画像を不鮮明化し、不鮮明化画像と位置合わせ画像とを減算して残差画像を生成する。欠損していない周辺画素の残差値を用いて欠損残差を補間する。点拡がり逆関数を用いて残差画像から逆投影画像を生成し、平滑化画像と逆投影画像とを組み合わせて強調係数を生成する。強調係数を高解像度推定画像に更新して新たな高解像度推定画像を生成することにより、欠損画素の残差値を欠損していない周辺画素の残差値から補間する。
ステップS3700で静止画撮影コマンドが入力が有(YES)の場合、静止画撮影を行う。具体的には、ステップS3704にて偏光照明がONになる。そしてステップS3501で偏光照明の偏光面を替えながら静止画撮像が行われる。そして本実施形態2で説明した高解像度化処理がステップS3500で行われる。
以上の処理により、動画、静止画ともに高解像度化処理が行われ、かつ静止画部分では高解像度法線画像も得られる。
(実施形態4)
本実施形態では、実施形態1および2における偏光光源102を、より高速に偏光面を回転することが可能な光源3800に替えている。こうすることにより、本実施形態では、動画撮影においても、静止画における技術をそのまま用いて高解像度化を実現する。偏光光源102以外の構成は、図1および図2、図32および図33に示す構成と同一である。
図38は、高速に偏光面を45°ずつ回転させるための偏光光源の構成を示している。この偏光光源は、パターン化偏光子フィルタ3801とLED面光源3802とを備えている。
パターン化偏光子フィルタ3801としては、フィルム型の偏光板のほか、フォトニック結晶や構造複屈折波長板、ワイヤーグリッド等が利用できる。LED面光源3802は、45°ずつ異なる偏光面を有するパターン偏光子3701の各々に対して独立に点灯するように分割されている。そして0°、45°、90°、135°のパターン化偏光子にそれぞれ相当するLED面光源の3802における4つの分割発光領域A、B、C、Dが順次点灯する。例えば、分割発光領域Aが点灯しているとき、他の分割発光領域B、C、Dは点灯していない。このとき、分割発光領域Aからでた光は、偏光していないが、パターン化偏光子フィルタ3801における角度0°のパターン化偏光子に入射する。そのパターン化偏光子の偏光透過軸の方向に偏光した光のみがパターン化偏光子フィルタ3801を透過することができる。こうして、分割発光領域A、B、C、Dを順次点灯させることにより、図38の参照符号303から306に示すように、出射光の偏光面が回転する。分割発光領域A、B、C、Dの各々は、少なくとも1つのLED素子を含んでいる。
なお、簡単のため、図38に示す構成では、パターン偏光子フィルタ3801は4分割構成を有しているが、例えば、偏光面の方位が異なる4つのパターン化偏光子と、各パターン化偏光子に割り当てられた発光領域とが、より細かく分割された構成を採用しても良い。
また、すべての分割発光領域を点灯させれば、非偏光光源307として機能させることもできる。この構成により、偏光面の回転に要する時間をLEDの点灯応答速度である10(μS)程度まで短縮することができ、フレーム切り替え時間内に偏光面の変化を完了させられる。これにより動画撮影時に偏光面を変える時間が問題にならないほど短くなる。
図39は、この偏光光源を用いて動画を撮影する場合のタイムチャートを示している。時間t1(3901)は、偏光面切り替え時間を示し、時間t2(3902)は1フレームの撮像露光時間を示す。この場合、1枚の偏光画像撮影には、t1+t2=T(sec)を要する。したがって、高解像度のためには、4T(sec)を1セットとする4枚の異なる偏光面照明での画像が必要となる。動画を高解像度するためには、この4T(sec)の時間内は被写体が動かないことが必要である。したがって、通常の被写体を撮影する動画においては
を満たさねばならない。このため
となる高速度撮影が必要になる。このような高速度撮影も、撮像素子をより高速化し、かつ本実施形態における照明の照度を向上して露光時間を短縮すれば可能となる。結果的に動画においても、自在に高解像度化を実現できる。
(実施形態5)
本実施形態は、実施形態2と同じく偏光面が回転する偏光照明を用いながら、画像撮影には通常のカラー輝度カメラを利用して自在ズーミングを可能とする。
図40は、実施形態5を示す図である。実施形態2の図33と異なる点は、カメラ3201が通常のカラーカメラであることのみである。カラーカメラは、カラー撮像素子4001により、R、G、Bの波長帯別にR画像4002、G画像4003、B画像4004を取得する。
偏光面制御部204から偏光照明を変化させる度にカラー画像を撮像することにより、カラー輝度画像である4002、4003、4004が各偏光状態に対応して複数得られる。そしてカラー高解像度化処理部4005の処理により高解像度法線画像208、および高解像度カラー画像4006が生成される。本実施形態の主たる効果は、実施形態2の画像の単なるカラー化ではなく、カラー情報を使うことによって各種の不要な多重反射成分を正確に分離して物理的に必要な多重反射成分を利用できる点にある。
図14を参照しながら行った説明において、マイクロファセットがグルーブ:溝1401を形成し、その斜面で2回の反射が発生していると仮定した。この場合の1回目と2回目の反射の性質を鏡面反射と拡散反射に分離した場合、
1)1回目:拡散反射 2回目: 鏡面反射
2)1回目:拡散反射 2回目: 拡散反射
3)1回目:鏡面反射 2回目: 拡散反射
4)1回目:鏡面反射 2回目: 鏡面反射
の4通りの現象が想定でき、実施形態2においては、被写体の着色が暗い場合には、4)の1回目も2回目も鏡面反射という現象を主要な現象として考えて解析した。しかし一般には1)から3)の多重反射の成分を観測輝度から成分として分離する前処理が必要になる。実施形態2においてはモノクロ処理を想定していたため、この分離を正確に実施することは困難であった。
本実施形態においては、RGBのカラー成分を用いてこの問題を解決する。以下、各多重反射の物理的な性質を説明する。
なお、以下の説明においては、反射現象によって、光の色と偏光の属性が変わる点がポイントである。(i)拡散光は媒質の内部に一旦浸透した光が射出するため、照明光が白色の場合に物体の媒質の色で着色されること、および(ii)出射時の偏光は出射角に依存し、本実施形態においては45−50°となるために、きわめて低くほとんど非偏光である点に注意する。
図41は、上記1)に相当する2回反射を描いたものである。1回目の反射で非偏光の拡散光となった光は物体の媒質固有の色を有するため、2回目の鏡面反射では着色した反射成分となるとともに鏡面反射として部分偏光を呈する。図では、これを楕円4101、4102で表現している。なお楕円は正確に部分偏光の形状を表現するわけではなく模式的に表現している。ここで入射光の偏光方向を変えると媒質内に屈折・浸透する光量が変化するため2回目反射への入射光量が変動し、結果的に2回目の反射成分の光量は変動するため、4101、4102のような楕円の大きさが変動し、輝度が変動する。
図42は、上記2)に相当する2回反射の様子を描いたものである。1回目の反射で着色した拡散光は2回目に再度着色した拡散光として射出する。また入射光の偏光方向を変えると媒質内に屈折・浸透する光量が変化するため2回目反射への入射光量が変動し、結果的に2回目の反射成分の光量も変動するが、反射光は非偏光である。
図43は、上記3)に相当する2回反射を描いたものである。1回目の反射で鏡面反射した光は色は白色光のまま鏡面反射の偏光となる。そして2回目には着色した非偏光の拡散光として反射するが、入射光の偏光方向を変えると1回目に反射する光量が変化するため結果的に2回目の反射成分の光量は変動する。
以上、最終的に観測される2回反射後の光の性質をまとめると表1のようになる。
本実施形態で主に利用する4)の1、2回とも鏡面反射の反射光のみが白色光を維持するのに対して、1)から3)の反射光は、すべて物体色に着色しているカラー光である。両輝度成分ともに照明の偏光方向を変えると個別に変動するためこれを分離するためには、モノクロ輝度のみでは不可能である。
そこで、カラーカメラを用いて偏光照明の偏光面を順次変えながら撮影し、カラー輝度R、G、Bの変化の関数を周期180°の余弦関数として近似する。照明の偏光面の角度をΨIとして以下のようになる。ここで輝度Iと振幅Aはいずれも(R、G、B)の3成分を有するベクトルとしている。この輝度変動における位相φIは一般に各色とも共通である。
ここで得られた最小値を物体色と仮定し、
また光源色を既知として
とすると以下のベクトル方程式が成立する。
図44はこのベクトルの関係の概念図をRGB色空間内にて表したものである。
この方程式は2未知数に対してRGBの3成分を有するため最小2乗法にて説くことができる。結果として得られた重み係数を用いて変動する輝度を成分分離することができ、表1における4)の反射成分は、
となる。
図45は、以上の動作を表したフローチャートである。実施形態2で説明した図34と異なるのはS4501でカラーRGB画像を取得する部分、およびS4502でカラーRGB成分から表14)の1、2回とも鏡面反射の成分を分離する部分のみである。分離された輝度成分は照明の白色を有するため輝度のみの取り扱いが可能であり、フローチャートの他の部分は同一である。ここで得られる高解像度画像は、鏡面反射成分だけになるためこれを再度、式46を用いて合成することにより、最終的な高解像度カラー画像を得ることができる。
なお、実施形態1から5を通じて、偏光照明の偏光面回転角は45°きざみを例として説明してきたが、この角度は任意である。
本発明の画像処理装置は、偏光面が順次変化する直線偏光を偏光照明として被写体表面に照射する偏光光源と、カメラ(撮像装置)とを備えている。このカメラは、各々が1画素に相当するサイズを有する複数の光感知セルを備え、被写体表面の反射光から被写体表面の輝度画像を取得する。本発明の画像処理装置は、更に、輝度画像を高解像度化する高解像度化処理部を備えている。この高解像度化処理部は、偏光面の変化に伴う輝度画像の輝度変動量を用いて、被写体表面における1画素よりも小さなサブ画素領域の法線を推定する。そして、推定した法線を用いて輝度画像を高解像度化する。本発明では、カメラが被写体表面の輝度画像を取得するとき、偏光光源とカメラとの配置関係が固定された状態で直線偏光の偏光面が変化する。照明光の偏光状態を利用することにより、光源の位置を大きく移動させることなく、1画素内の法線分布(法線ヒストグラム)を求めることが可能になる。
本明細書における「高解像度化」とは、図1Aに示すように、本来的には輝度が平均化された1画素について、その1画素に含まれる複数のサブ画素領域の輝度を推定し、輝度画像の解像度を高めることである。1画素内に含まれる個々のサブ画素領域の輝度は、各々のサブ画素領域の法線を求めることにより、決定することができる。高解像度化処理部は、専用のハードウェアによって実現される場合に限られず、ソフトウェアとハードウェアとの組み合わせによっても好適に実現され得る。例えば、公知の構成を有するハードウェア(プロセッサ)に本発明の処理を実行するフトウェア(プログラム)を組み込むことにより、本発明の高解像度処理装部を構成することができる。このようなプログラムは、好適には記録媒体に記録された状態で画像処理装置に組み込まれるが、通信線を介して、あるいは無線により、画像処理装置に組み込まれることも可能である。
本発明では、後に詳しく説明するように、まず偏光照明が照射された被写体表面における多重反射を利用し、1画素内の法線ヒストグラムを求める。そして、その法線ヒストグラムを構成する個々の法線に対応したサブ画素領域の配置を決定する。
なお、「1画素」のサイズは、撮像素子の撮像面に配列された個々の光感知セル(フォトダイオード)のサイズに相当する。通常、1つの光感知セルが1つの画素に相当するが、隣接する4つの光感知セルの中心部が1画素として機能する場合もある。そのような場合でも、1画素のサイズは、光感知セルのサイズに相当する。
以下、図面を参照しながら、本発明による画像処理装置の実施形態を説明する。
(実施形態1)
図1Bは、本発明の実施形態1における画像処理装置の全体構成を模式的に示す図である。
自在ズーミング機能を有する本実施形態の画像処理装置101は、偏光光源102、偏光カメラ103を備えている。被写体104を撮影する際には、偏光光源102からの偏光照明105が被写体104に照射される。被写体104の表面で反射した偏光照明(偏光反射光106)が偏光カメラ103に到達して偏光情報が偏光カメラ103内に記録される。偏光カメラ104は、後述するように、被写体104の輝度画像と偏光情報の両方を取得できる。
偏光照明105と偏光反射光106のなす角度LV107は、10°以下であることが望ましい。角度LV107を小さくすることにより、被写体104上の微細な凹凸構造で発生する光の多重反射(Interreflection)を利用して、凹凸構造に関する情報を取得することが可能になる。また、角度LV107を小さくすることにより、被写体104の表面での影の影響を少なくすることができる。角度LV107を10°以下にすることにより、屈折率1.4〜2.0の自然物体において、光のP偏光とS偏光がほぼ等価な挙動を示すことがフレネル反射理論からわかる。これらの詳細については、後述する。
図2は、本実施形態における偏光カメラ103の構成例を示す図である。
この偏光カメラ103は、偏光撮像素子201、輝度・偏光情報処理部202、偏光面制御部204、撮像制御部205を備えている。
偏光面制御部204から偏光照明の偏光面を変化させる度に画像を撮像する。これにより、輝度画像Y(260)、および偏光位相画像P(270)が、偏光面の異なる各偏光状態に対応して複数得られる。高解像度化処理部203からは、高解像度化法線画像208、および高解像度輝度画像209が生成される。
本実施形態における偏光カメラ103は、モノクロ画像と偏光画像を同時にリアルタイムで取得することができる。この偏光カメラ103は、輝度画像Y、偏光度画像D、偏光位相画像Pの3種類の画像データを出力する。
偏光カメラ103に内蔵された偏光撮像素子201は、輝度画像と被写体の部分偏光の画像とを同時に取得する。このため、偏光撮像素子201では、複数の異なる偏光主軸を有する微細パターン化偏光子のアレイをCCDやMOSセンサなどの撮像素子上に配置している。微細パターン化偏光子としては、フォトニック結晶や構造複屈折波長板、ワイヤーグリッド等が利用できる。この構成は特許文献1に開示されている。
図3は、偏光光源102の構成例を示す図である。偏光光源102は、偏光フィルタ部301、非偏光を発生する光源302、可動ミラー308、ミラー309、可動ミラー制御部312、シャッター310、311を備えている。
偏光フィルタ部301は、ツイステッドネマィック液晶セルと偏光フィルムとを組み合わせた電圧印加型液晶デバイスなどで構成され得る。偏光フィルタ部301は、光源302から発生した非偏光の光を、任意の偏光角度に偏光面を有する直線偏光に変換する。偏光面を回転させることが可能なデバイスの構成例は、特許文献2、3、非特許文献3等に開示されている。
可動ミラー308は、図3の位置Aから位置Bとを移動可能である。可動ミラー308が位置Aにあるとき、光源302からの光は301、およびシャッター311を通過して偏光面を回転させながらその被写体を照射する。同時に画像が撮像され、これを複数回実施する。すなわち偏光面が0°状態(図の状態303)で第1の画像を撮像し、偏光面が45°状態(図の状態304)で第2の画像を撮像し、偏光面が90°状態(図の状態305)で第3の画像を撮像し、偏光面が135°状態(図の状態306)で第4の画像を撮像する。
偏光面の回転に要する時間は、上記文献によれば、20(ms)程度である。これは、動画の1フレーム時間内に収まると考えて良い。このため、4方向の偏光回転を実施して撮影をすると、実質8(フレーム)時間程度=約0.5(sec)で1セットの撮影が終了する。この時間内は、被写体とカメラの相対的運動はゼロであることが望ましい。
なお、偏光フィルタ部301の機能をOFFにして、非偏光を被写体に照射することもできる。その場合は、可動ミラー308が図3の位置Bに移動する。そして、光は光源302からミラー309へ導かれ、シャッター310を通過して被写体に照射される。その場合、光の偏光面は参照符号307で示すように、あらゆる方向にランダムに存在する。このように、シャッター310、311は、互いに開閉の状態をとり、同時に偏光と非偏光が照射されることを防ぐ。
図4は、偏光面の角度ΨIの定義を示す図である。被写体に向かってX−Y座標系を設定し、偏光面の角度は、X軸負向きを0°としてY軸正向きを正向に回転角を定義するものとする。偏光入射角度ΨIが反射において保存される場合には、反射光の偏光面角度と入射光の偏光面角度は同一となる。
図5は、偏光撮像素子201の撮像面を示す図である。撮像面には、複数の光感知セル(フォトダイオード)が行および列状に規則的に配列されている。個々の光感知セルは、光電変換により、入射したた光の量に応じて電気信号を生成する。本実施形態の偏光カメラ103では、撮像面がパターン化偏光子のアレイによって覆われている。偏光撮像素子201の各光感知セルに対してパターン偏光子の1個が対応する。隣接する4つの光感知セルに対応する4つのパターン偏光子は、それぞれ、偏光透過面が0°、45°、90°、135°となるように設定されている。図5の画素セット501、502は、それぞれ、2×2画素からなり、その中心位置が1画素だけシフトしている。この画素セット502の4個の画素からのデータを取得した後、画素セット203の4個の画素からのデータを取得することができる。このように、2×2画素のウインドウを1画素ずつずらしながら処理することによって、偏光情報と輝度情報を、解像度を実質的に落とさずに得ることができる。すなわち、撮像素子の解像度(画素数またはフォトダイオード数)が1120×868の場合には、1119×867画素のY、D、P画像を得ることができる。
図5の例では、隣接する4つの光感知セルの信号に基づいて、それらの中心部に位置する領域の偏光情報を得ることができる。例えば、画素セット501の中心領域(サイズは1つの光感知セルのサイズに相当)が、「1画素」として機能する。1画素のサイズは、1個の光感知セルのサイズに相当しているが、1画素の中心位置は、光感知セルの中心位置に拘束されない。
本発明によれば、1つの光感知セルのサイズよりも小さなサイズを有する領域の法線を推定し、そのような微細な領域の輝度を求めることができる。
次に、図6を参照して、輝度画像Y、偏光位相画像Pの求め方を説明する。
最初に、振幅をAo、パターン偏光子の偏光透過面角度をΨo、位相をΦoとして、偏光情報を表す正弦関数の式を以下のように仮定する。
図2に示す輝度・偏光情報処理部202では、45°の間隔で偏光角度が異なる4つの偏光画素の4個の輝度値から輝度画像Yが計算され、輝度画像Y206が生成される。
輝度・偏光情報処理202では、サンプルされた4個の輝度値から余弦関数へのフィッティングを行う。まず偏光角度が0°、45°(=π/4)、90°(=π/2)、135°(=3π/4)における輝度の2乗誤差Eを以下のように定義する。
この2乗誤差を最小化する余弦関数の位相φoは、以下の式から求められる。
ソフトウエアによる実装において、逆三角関数などの数学関数では、一般に以下のような制限が課されている。
この角度範囲を考慮すると、aとcの大小関係からの場合わけを行うことによって、最小値をとる角度と最大値をとる角度は以下のように計算できる。
この最大値をとるΨmaxの値を、そのまま、偏光位相画像P207とすればよい。
次に、振幅の最大値と最小値を求める。まず、振幅Aoを求めるため、以下の式を用いて2乗誤差の最小化を行う。
得られた振幅Aoを用いて、振幅の最大値と最小値は以下のようになる。
このように、本実施形態では、照明条件を固定して1回の撮影がされた際、撮像された偏光画像から輝度画像Yと、偏光画像Pという2種類の画像情報を得ることができる。
前述のように、撮像素子の画像解像度とほぼ等しい解像度が得られるため、輝度画像Yの解像度は、撮像素子にパターン化偏光子を設置しない状態の輝度画像の解像度とほぼ変わらないと考えられる。一方、本実施形態における撮像素子からは、輝度画像Yに加えて偏光画像Pを同時に獲得することもできる。したがって、本実施形態によれば、偏光情報として偏光位相と偏光度が増加したことになる。つまり偏光カメラを用いることで、従来の輝度画像情報よりも被写体の表面反射に関する、より多くの情報が得られる。
本実施形態では、さらに偏光照明の偏光面を変えながら偏光カメラでの撮影を行う。これにより、輝度の撮像だけでは不可能な1画素内の微細領域(サブ画素)の情報を含む画像の取得を実現する。
図7Aおよび図7Bは、本発明者らが表面の滑らかな陶器製コップと表面に微細凹凸を有する木の板を被写体として偏光撮像をした画像を示す。図7Aの左側に位置する2つの画像は、照明の偏光面の角度=0°の偏光画像である。一方、図7Aの右側に位置する2つの画像は、照明の偏光面の角度=90°の偏光画像である。図7Bの4つの画像は、それぞれ、図7ABの4つの画像を模式的に描いた図である。これらの図に示す画像は、いずれも、図2に示す輝度画像Yに相当する。
図7Aおよび図7Bの上段に位置する画像から明らかなように、表面が滑らかな陶器では、偏光照明の偏光を変化させても輝度パターンの変化はあまり観測されなかった。しかし、多くの凹凸が存在する木の板では、図7Aおよび図7Bの下段に位置する画像から明らかなように、偏光照明の偏光面を変化させると、観測される輝度画像に大きな変化があることが判明した。
図8Aは、木の板の表面に入射する光(偏光照明)の偏光面を変化させながら輝度画像を撮影した場合の同一画素値の輝度変動を示すグラフである。図8Bは、撮像対象となる木の板の輝度画像である。図8Cは図8Bの木の板の表面の凹凸を模式的に示した図である。
図8Aは、偏光照明の偏光面の角度ΨIが0°、45°、90°、135°のときに得られた輝度画像の特定の画素における輝度Yを示している。このグラフから、輝度Yは各偏光照明の偏光面の角度ΨIに対して周期変動を示すことがわかる。このような輝度Yの角度ΨIの依存性に関する情報は、照明の偏光状態を変化させずに撮像した普通の偏光撮像では観測できていない新しい情報である。
図9(a)から(c)は、偏光照明の偏光面の角度をΨI=0°、45°、90°、135°と4種類に変化させて偏光画像を取得した場合に得られる情報を説明している。図9(a)は、照明の偏光面の角度を示している。被写体で反射された偏光照明の光は、偏光透過軸の角度ΨO=0°、45°、90°、135°というパターン偏光子のモザイクからなる偏光画素に入射する。各角度の偏光画素にて得られる輝度の空間的変化が9(c)のグラフにおいて曲線901で示されている。曲線901の偏光位相は、図5で示す受光素子上の偏光子モザイクの4画素の位置の偏光透過軸の角度ΨOに対して得られる空間的変動に相当する。輝度Yの変動は、照明の偏光面の変化に伴うΨIの軸で得られる時間的な変動(図9(b))になっていることに注意する。
今、この輝度Yの変化の関数を周期180°の余弦関数として近似することを考える。照明の偏光面の角度をΨIとして以下のように表現する。
この関数には、振幅、位相、平均値の3種の情報が含まれている。振幅と平均値を用いる最大値Ymax、最小値Ymin、および最大値および最小値を与える角度ΨImax、ΨIminの情報を取得する。4つの等間隔の角度サンプルから余弦関数をフィッティングして上記の値を推定する手法は、(式1)から(式12)で説明した方法がそのまま使える。
偏光でない通常の入力輝度としての原画像となる理論輝度を以下の式で求める。
次に、被写体表面の1画素内の凹凸のモデルを説明する。
本実施形態で採用する微細凹凸モデルは、物理ベースコンピュータグラフィックス分野で広く使われている「マイクロファセットモデル」である。
図10は、凹凸のある表面を観察した場合の1画素内の微細法線分布を示す斜視図である。カメラの1画素を示す領域1001は、平均輝度を有するが、その内部の輝度分布は不明である。すなわち、1つの画素内の構造までは、撮影することができない。
微細凹凸モデルでは、表面が鏡面反射のみを示す仮想的な微細面(マイクロファセット)で構成されていると仮定し、その各マイクロファセットが微細法線を有していると考える。各マイクロファセットは鏡面反射のみを呈するため、照明方向L、および視点方向Vを決定すると、その角度関係において、光るマイクロファセット1002の群と光らないマイクロファセット1003の群とがある。1画素内に存在するすべての光るマイクロファセット1002の輝度を合計したものが1画素の平均輝度に相当する。光らないマイクロファセットからの輝度はゼロ(真黒)となる。
図11に示すように、光るマイクロファセット1002の微細法線は照明ベクトルLと視線ベクトルVのちょうど2等分ベクトルHに相当している。すなわち、1画素以内の凹凸構造を推定することは、このマイクロファセットの微細法線を推定することになる。
次に、マイクロファセットに偏光照明が入射した場合の作用を考える。ただし、入射する偏光照明と撮影するカメラの視線との間の角度は、図1の角度107で示されるように、ゼロ度に近いという特殊な幾何学的な関係を想定している。
図12は、マイクロファセット1201に対して入射角がゼロに近い偏光が入射して直接反射をカメラで観測する様子を示している。図12(a)、(b)では、入射する偏光の偏光面が90°異なっている。しかし、反射光の偏光情報は、光の進行方向が変わるだけで入射光とほぼ同一である。これは以下の理由による。
図13は、フレネル反射率の入射角依存性を示すグラフである。横軸が入射角、縦軸がフレネル反射率をである。この依存性は、屈折率n=1.8と想定して描いたものである。ほぼ垂直入射とみなせる0°〜10°付近の入射角度は、範囲1301に相当する。グラフから読み取れるように、この範囲1301では、P偏光もS偏光も反射率がほぼ同一である。したがって、偏光がほぼ垂直に表面に入射した場合には、表面に対するP波とS波という偏光の区別がほとんど無くなる。なお、この事実は、屈折率n=1.4〜2.0の自然物体において、広く成立する。
入射角度が10°以下の場合、偏光照明を回転させても反射率がほとんど変らず反射光のエネルギーが変わらないため、観測される輝度は不変となる。つまり、入射偏光面の回転に伴う輝度変動は発生しない。このような場合、輝度Yの角度ΨI依存性は、図8Aにで示したような実験結果にはならないことになる。
図14(a)および(b)は、同じく被写体に偏光照明が入射角ゼロ付近で入射され反射光をカメラで観察している状態を示す。この例では、2つのマイクロファセットが対になり、多重反射を起こしていると考える。具体的には、2つのマイクロファセットがグルーブ(Groove):溝1401を形成し、その斜面で2回の反射が発生していると仮定する。
この種の多重反射は、表面の凹凸が多い被写体表面、例えば布、木材、人の肌、皮など様々な自然物で発生していると考えられる。1回目と2回目の反射の性質が重要となり、3回目以降の多重反射は輝度が小さくほぼ無視できる。一般に反射の性質を鏡面反射と拡散反射に分離した場合、
1)1回目:拡散反射 2回目: 鏡面反射
2)1回目:拡散反射 2回目: 拡散反射
3)1回目:鏡面反射 2回目: 拡散反射
4)1回目:鏡面反射 2回目: 鏡面反射
の4通りの現象が想定できる。
このうち、1)と2)は最初の反射によって拡散光として非偏光となり、あらゆる方向に光を反射する。しかし実験によると被写体が着色して輝度が暗い場合はこの1回目の拡散反射成分は比較的弱い。これは被写体の内部への光の浸透が少ないことを意味し、フレネル理論によればそれと相補的な3)4)の鏡面反射の現象が優位となる。また、3)のように2回目を拡散反射と考えた場合には、その入射と反射の幾何学的関係から、当然、4)も同時に発生していることがわかる。この場合には、偏光度、輝度のいずれの基準でも、鏡面反射の現象が主たる輝度成分となる。
以上から、4)の1回目も2回目も鏡面反射という現象を主要な現象として考えればよい。
図15は、1回目、2回目とも鏡面反射を想定した場合の対となるマイクロファセットの位置関係を示している。グルーブ(Groove)を形成する斜面1501、1502の被写体のマクロな表面1503から測定した角度をαとβとする。また、1回目反射の入射角をθ1とし、2回目反射の入射角θ2とする。更に、入射光、反射光とグルーブ斜面とのなす角度をγとδとすると、以下の関係が成立する。
ただし、角度LVは図1で定義した入射角と反射角であり、0°〜10°程度と想定される。グルーブの斜面がおおよそ対称であると考えると、α=βが成立する。したがって、
と推定できる。
再び図13を参照する。図13のフレネル反射率のグラフには、上記の角度範囲に相当する範囲1302が記載されている。グラフから読み取れるように、この入射角の範囲1302では、P偏光の反射率が極めて弱くなる。
図14(a)で示すように、グルーブの主軸方向1402に対して垂直に入射する偏光照明はP偏光である。上述の理由から、このP偏光は1回および2回反射を経由する間に極めて弱くなる。一方図14(b)で示すS偏光は、2回の反射を経てもそれほど弱まらない。その結果、グルーブに対してP偏光となる入射偏光面においては、反射光はエネルギー的にも極めて弱くなり、輝度が低下する。一方、S偏光となる入射偏光面においては、反射光はそれほどエネルギーが減衰せず輝度も高い。
以上のようにマイクロファセットが対となるグルーブを形成すると仮定すれば、実験にて得られた入射光の偏光面の回転による反射光の輝度変化が説明できる。このため、本発明の好ましい実施形態では、これを活用した以下の表面モデルを用いる。
図16は、以上の考察から得られた被写体表面の「3領域モデル」を説明する図である。3領域モデルとは、1画素の表面凹凸の法線構造を多重反射と偏光現象の観点から簡略化したモデルである。3領域モデルでは、1画素において以下の3種類の2次元領域が各々一定の面積比率で混合されているとする。なお、このモデルでは、後述するようにグルーブはT領域とD領域に分離される。
1)直接反射領域:S(Specular)領域:
入射光が直接反射し、入射光の偏光面回転に対して反射輝度が変動しないマイクロファセットで形成される領域。この領域のマイクロファセット法線は、入射光とカメラ視点ベクトルとの2等分線に相当する。
2)2回反射領域:T(Twice Reflection):
入射光がグルーブにて2回反射を起こして2回目に反射する領域。入射の偏光面回転に対し反射輝度が変化するマイクロファセットで形成される。
3)暗領域:D(Dark)領域:
入射光がカメラと無関係の方向に反射し輝度に寄与しないマイクロファセットで形成される領域。この領域はさらに2つに分類できる。第1はグルーブを形成する1回目反射の領域であり、グルーブの他の斜面を照明するが、カメラ撮影視点からは光っていない領域である。第2は全く異なる未知方向へ光を反射する領域である。ただしこの未知方向の場合は扱いが不便であるため、本発明の好ましい実施形態においては、T領域を作る1回目反射と同じ向きのマイクロファセット法線を有すると仮定する。この領域の反射輝度もまた入射光の偏光面回転に対して変動しない。
この3領域が1画素内を構成する凹凸に対応すると考える。各領域での法線、すなわちマイクロファセット法線および1画素内における各マイクロファセットの面積比率を求めることによって、法線ヒストグラムを推定することができる。なお、マイクロファセットの法線の向きは、2つの自由度を有している。具体的には、方位角度および天頂角によって法線の方向は特定される。
以下、法線の向き、輝度、面積比率の求め方を説明する。
図17(a)は、3領域モデルの凹凸が被写体表面の1画素内において、ある方位角に整列して存在する状態を模式的に示す斜視図である。グルーブの主軸1701が主方位角ΨImaxに相当している。図17(b)は、偏光照明の偏光面の角度と主軸1701の主方位角ΨImaxとの関係を示す図である。
図14における考察から、この主軸1701は偏光照明を回転させた際の最大輝度の向きに一致することがわかる。そこで、これ以降、主方位角はΨImaxに等しいとして取り扱う。
S、T、D各領域におけるマイクロファセット法線の向きは、この主方位角ΨImaxから90°ずれた角度ΨIminを共通して有し、個別に天頂角を有する2自由度の角度にて表現される。
まず、S領域における法線の天頂角は、入射光と反射光の2等分角に等しくなる。法線は、これ以降はカメラ座標系でカメラ投影面上での点として表現する。これは後の勾配空間(p、q)とほぼ同じ意味になる。
図18(a)および(b)は、入射光Lと反射光Vとカメラ座標系XYZの関係を表している。カメラ座標系で照明ベクトルが
となる。
そこで、このベクトルとカメラの視点ベクトルとの2等分線としてS領域での法線は
となり、ほぼカメラ視点に向かってくる法線となる。なお、ここでΨIは照明の偏光面角度である。
次に、T領域を考察する。S領域での法線のように、幾何学的に概略値を求めることも可能である。しかし、ここでは、偏光カメラで取得される偏光位相画像Pから求めるものとする。P画像を観察すると、入射偏光角ΨINと観測される位相角Ψoutとの間に、ある回転角のずれがあることがわかる。たとえば、ΨI=45°の場合に、この回転角のズレ量ΔΨを観測したとすると、フレネル反射の理論からθが求められる。
図19は、グルーブの主軸に平行なS軸と垂直なP軸の座標系に対して、偏光のエネルギーEpおよびEsと偏光面がどのように変化するかを示す図である。入射角をθ、屈折率をnとするとP波とS波に対するエネルギーのフレネル反射率はFp(θ、n)、Fs(θ、n)を用いて以下のようになる。簡単のためθ1=θ2としている。
ここで、偏光照明の偏光面角度ΨIとグルーブのなす角度ΨINは、偏光面回転から観測される値ΨImaxがグルーブの主軸角度に等しいことから、以下のように決定できる。
屈折率nは被写体に係わる量のため本質的には未知である。ここでは、近似値としてn=1.5〜1.8を用いればよい。なお、この値はプラスチック、樹脂、ガラスなど自然界に存在する典型的な誘電体の屈折率である。
こうして式21を満たすθ1を決定すればよい。
したがって、T領域における法線の天頂角はカメラ座標系では、
となる。
D領域の法線は3領域モデルにおける仮定より
とすればよい。
次に、各領域の輝度につき考察する。絶対的な輝度は実際の実験条件における偏光照明照度やカメラ設定により変動するため、基準値は観測された輝度画像Yの観測から求める必要がある。この基準値として、画像内の鏡面反射領域の最大輝度MAX_Yを用いる。この最大輝度は、3領域モデルのS領域が1画素の全体(100%)を占める場合に得られる。大輝度MAX_YをS領域の輝度Isとする。
S領域の輝度は、照明光を1回反射した際の反射輝度である。これは、図13のフレネル反射率のカーブにおいて、入射角度が範囲1301の領域内にあるときの反射による輝度に相当する。そこで、この式から、屈折率n=1.5〜1.8を仮定して、入射角θ1で1回反射し、さらに入射角θ1で2回目の反射をするT領域のP波とS波の反射輝度が、以下のように推定できる。
D領域の輝度は、画像内の鏡面反射領域の最小輝度MIN_Yを用いる。この最小輝度は3反射モデルの1画素の全体(100%)を占める場合に得られる。
図20は、3領域モデルの各領域におけるマイクロファセット法線、反射輝度、および面積比率を示す図である。まず、3領域の反射輝度を以下のようにIs、IPT、IST、Idと仮定する。T領域では、P波とS波の入射によって反射輝度が異なることに注意する。
1)S領域・・・Is
2)T領域・・・P波入射の際 IPT、S波入射の際IST
3)D領域・・・Id
これら輝度値は、上述のように、観測値から推定できる。このため、1画素の単位面積に対する面積比のみを未知数とする。これらの未知数を、以下のように、As、AT、(1−As−AT)とする。
1)S領域・・・As
2)T領域・・・AT
3)D領域・・・(1−As−AT)
入射偏光がP波のときに観測される1画素の輝度、およびS波のときに観測される1画素の輝度が、それぞれ、輝度最小値Ymin、最大値Ymaxに対応していることが明らかである。このため、輝度の最大値Yminと最小値Ymaxについて、以下の重み付け平均の式が成立する。
すなわち未知数As、A
T、A
Dは以下の式で推定できる。
以上で、1画素内を3領域モデルでモデル化したときの各領域の法線、輝度、面積比率のすべてが推定できたことになる。ただし、法線の表現形式がカメラ座標系での方位角と天頂角による角度表現では以降の解析に不便である。このため、法線を勾配空間(p、q)に変換する。
勾配空間(p、q)は、実質的に図18で示したカメラ投影面平面と考えてよい。
図21は、2次元勾配空間において求められたマイクロファセット法線の位置を示す図である。S領域の法線は、ほぼ原点上に位置する。被写体表面のグルーブの主軸方向に直交する線2102上にT領域とD領域の法線が位置する。図22は、3領域モデルから得られるマイクロファセット法線のヒストグラムである。主方位角の線上に3個の分布が各々の面積比の高さを有して整列した形になる。
以上で1画素内法線ヒストグラムが推定できたので、以降は法線の最適配置を決定する。ここでは、1画素内を2×2の4画素に分割して法線を求める場合を例に説明する。高解像度への自在ズームは、再度2×2を繰り返すことで実現できる。
まずヒストグラムから得られる各領域に属する画素は、
となる。ただし[]はガウス記号である。
図23から図26は、初期法線配列として1画素を4分割したサブ画素に上記の3種の領域に対応する法線配置を割り当てる方法を示す。この割り当て方法は、グルーブの主方位角ΨImaxの角度に依存するため、45°範囲ごとに区切って図23から図26で説明している。
図23(a)が3領域のヒストグラムの一例を示してものとする。この例では、T領域が2画素、D領域が1画素、S領域が1画素となる。主方位角の範囲は、X軸に近い水平方向である。T領域とD領域の法線をなるべく対にしつつ、主方位角に直交させる。このとき、図23(b)のように、主方位角の線2301に対して、谷を形成する凹(Convcave)タイプと図23(c)のように、山を形成する凸(Convex)タイプとの2種類の配列が考えられ、各々で2通りの配列の組み合わせがある。この図では、S領域の法線は紙面に垂直に近く手前に向いていることを示す。
図24、図25、図26では、おなじ法線ヒストグラムで主方位角だけが異なる場合を描いている。いずれも主方位角の線に対して、これを谷とする凹の場合と稜とする凸の場合とで配列の候補が合計4通りある。なお、配列の組み合わせ数はヒストグラムにより変動することに注意する。
図27(a)および(b)は、すべてがS領域になったヒストグラムの場合であり、配列の可能性は図27(b)のように1通りである。
以上のように図22に示される1つの法線の分布関数(3領域モデルから得られるマイクロファセット法線のヒストグラム)と、図17(a)、(b)に表される主方位角ΨImaxの情報とから、複数の空間配列の可能性が生まれる。このため、この4種類の候補から最適配列を決定すればよい。このような決定方法は、非特許文献1に記載されている方法と同様である。ただし、3領域モデルと主方位角の情報があるため、候補数が本来の4!=24通りから大幅に減少しており、最適化は容易になる。
法線の最適化は、基本的には非特許文献1に記載されている、エネルギー評価関数を最大化する繰りかえし法にて実施すればよい。以下に簡単に処理の流れを説明する。
図28(a)および(b)は、法線ヒストグラムから得られる法線配列が、8次元の配列空間(Arrangement Space)内の1点として表現される様子を示している。この8次元での密度分布関数は混合ガウス分布モデル(GMM:Gaussian Mixture Model)にて表現されている。この確率密度分布関数をテクストンGMMモデルと称する。同一の法線ヒストグラム分布から生成される等価クラス(Equivalencer Class)内には、それを代表する4画素の法線配列が存在し、この8次元の結合ベクトルを3Dテクストン(3Dtexton)、あるいは単にテクストンと称する。この解テクストン(Solution texton)を求めることが目的である。解テクストンの最適選択は、法線から表面を計算する際の積分可能性の拘束条件から実現される。各画素S=(x、y)におけるテクストンをL(S)とすると積分可能性は、線積分がゼロになる条件から計算される。
図29(a)は法線の積分可能性を用いた最適化を説明する図である。非特許文献1にあるように2×2画素のセルにおいて線積分を考え、この線積分をゼロにすることが条件である。
ただし、各画素での法線は勾配空間での表現を使って
である。そこで各画素における積分可能性のエネルギー関数は、
とおき、このエネルギー関数を最大化することによって上記線積分を最小とできる。
隣接する画素対をs、tとする場合、そのオーバーラップ画素領域での積分可能性も考慮する必要がある。図29(b)はこのシフト画素(Shifted pixel)2901での条件を表現している。積分値の条件は、
このオーバーラップ画素領域でのテクストンも解テクストンから得られるはずである。しかし、本来の画素からは出現しない配列パターンであるため、図28においては、画素からははずれた位置2802にある。しかし出現確率はテクストンGMMモデルのガウス関数成分の最大値で表現できるので、この確率にて重みづけする。すなわち、この画素対における条件は、以下を最大化することとなる。
解テクストンは2つのエネルギー関数の積を画像全体において最大化するものとして得られる。
ここでsは画像の全画素を示し、Neighbor(s、t)はすべての4近傍の画素の対を示す。また{}内が求める解テクストンである。
この最適化処理は複雑なため、効率的に実行するためには、1)積分可能性を拘束条件とする初期解を確率伝搬法(Belief Propagation)にて求め、2)その初期解からマルコフ連鎖モンテカルロ(MCMC:Markov Chain Monte Carlo)法を用いた最適化にて収束させる、という2段階のステップを踏む。詳細については、非特許文献1に従う。以上の最適化処理の結果、最適な法線空間配置が決定できる。
図30(a)から(c)は、以上の処理をまとめて1画素の高解像度化の効果を示す図である。以上の処理により、原画像の1画素を2×2に高解像度化した4画素における法線は図30(b)のように最適配置されたものとする。すると図19で示したように3領域モデルにおいてはS、D、Iの各領域法線向きが輝度に一意的に対応するため結果として1画素内を2×2画素に輝度として高解像度化できる。ただし画素輝度はあくまで非偏光照明下での撮影を基準にすべきである。したがって、図30(a)に示すように原画像の輝度は図9における平均輝度Ymaxとなり、高解像度化された輝度は、
1)S領域・・・Is
2)T領域・・・(IPT+IST)/2
3)D領域・・・Id
となる(図30(c)参照)。
図31は、本発明における被写体撮影から画像処理を経て1画素以内の法線分布ヒストグラム、法線配列を推定し、さらに1画素内輝度の配列までを推定するすべての手順を示すフローチャートである。図31において、点線で囲まれた部分が高解像度化処理部の処理に相当している。高解像度化処理部は、図31において、点線で囲まれた部分の処理ステップを、例えば公知のハードウェアに実行させるプログラムを内蔵している。
ステップS3101で実験環境として偏光照明とカメラ視点とのなす角度∠LVを測定する。これはカメラに付属したフラッシュ装置の場合には既知である。また被写体のフレネル反射率の基礎となる屈折率nの値をたとえばn=1.8などと仮定する。
ステップS3102で偏光面の角度ΨIを回転させながら偏光照明を被写体に照射して被写体の偏光撮影を実施する。そして各ΨIの角度におけるY画像とP画像を取得する。
ステップS3103で輝度変動するY画像の各画素で(式14)にて関数フィッティングを行う。この方法は(式1)から(式12)で用いた方法をそのまま用いればよい。ここから輝度が最大、最小となる位相角ΨImax、ΨImin、そのときの輝度YImax、Yminを求める。
ステップS3104にて3領域モデルにおけるS、T、Dの各領域の法線の方位(Azimuth)角および天頂(AZenith)角を求める。この角度2自由度が法線を表現する。方法は、(式17)から(式21)を用いる。ここで用いる図13のフレネル反射の理論カーブは屈折率を仮定したn=1.8として描いたものである。
ステップS3105では、3領域モデルにおけるS、T、D各領域の輝度を求める。(式22)から(式24)に従う。
ステップS3106では、3領域モデルにおけるS、T、D各領域の面積比を(式26)を用いて求める。
ステップS3107では、法線の表現方式を角度からカメラ座標系での勾配空間(p、q)に変換した後、図21、図22で示す1画素内の法線ヒストグラムを求める。
ステップS3108では、図23から図28で示すように法線のヒストグラム分布から1画素内の法線の最適配列を求める。
ステップS3109では図30で示すように1画素内にて最適配置された法線から輝度を求める。
(実施形態2)
第1の実施形態では、偏光照明と偏光カメラを用いて高解像度化を実施していた。しかし、偏光カメラはパターン偏光子を作りこむ特殊な形態であるために高価である。さらに、偏光板による光量低下で感度が低くなり、画質低下の可能性がある。本実施形態では、実施形態1と同じく偏光面が回転する偏光照明を用いながら、画像撮影には通常の輝度を観測するカメラを利用して自在ズーミングを可能とする。
図32は、第2の実施形態を示す図である。本実施形態の構成が、図1に示す構成と異なる点は、カメラ3201が偏光カメラではなく、通常の輝度を観測するカメラであることだけである。
図33は、このカメラ3201を説明する図である。このカメラ3201は、輝度撮像素子3301、偏光面制御部204、撮像制御部205を備えている。偏光面制御部204から偏光照明を変化させる度に画像を撮像する。こうすることにより、輝度画像Y(206)が各偏光状態に対応して複数得られる。さらに高解像度化処理部3303から高解像度化法線画像208、および高解像度輝度画像209が生成される。
図34は、輝度撮像素子3301を示す図である。この輝度撮像素子3301には、図5のようなパターン偏光子が存在しない。このため、元の撮像素子の解像度が1120×868の場合には、同じ解像度である1120×868画素のY画像を得ることができる。また図34(a)の輝度撮像素子ではモノクロ撮像素子を書いているが、図34(b)のように既知のベイヤーモザイクを搭載したカラー撮像素子を利用してもよい。ただし、カメラ3201から出力される画像は、輝度画像Yのみであり、偏光情報であるP画像を取得できない。このため、(式21)で示した3領域モデルのグルーブの斜面における入射角θ1が求められない。そこで
と仮定する。そして、(式15)を用いて、
という幾何学的関係のみから、T領域の法線の角度αを確定し、法線の天頂角θ1を確定するものとする。こうして式39が得られる。
D領域の法線は3領域モデルにおける仮定より、以下の式40で示される。
図35は、本発明の実施形態2に係わる処理の流れを示すフローチャートである。
図31のフローチャートと異なる部分は、ステップS3501において照明の偏光面ΨIを変化させた撮影を実施して各ΨIにつきY画像を取得する部分、およびステップS3502におけるS、T、D領域での方位角と天頂角を求める部分のみである。なお点線で囲まれた部分が高解像度化処理部の処理に相当している。
なお、本実施形態2において、画像をカラー輝度画像とする構成は、ここに含まれるものとする。その手法は、輝度カメラとしてカラーカメラを用いる方法、および偏光照明をカラー化する方法のいずれでも構わないがいずれも公知技術であるから詳細な説明は省略する。
また、本実施形態2において医療用用途に画像をマルチバンドカラー輝度画像とする構成もここに含まれるものとする。その手法は輝度カメラとしてマルチバンドカラーカメラを用いる方法であり、公知技術であるから詳細な説明は省略する。
また、本実施形態2において監視カメラ用途に画像を赤外画像、偏光光源を赤外光源とするなどの構成もここに含まれるが、公知の技術であるため説明は省略する。
(実施形態3)
以下、動画と静止画を切り替えながら撮影可能な画像処理装置の実施形態を説明する。本実施形態は、基本的な構成として、実施形態1および2のいずれの構成を採用することも可能である。ここでは、実施形態2の構成を有する場合を例に説明する。
一般に動画の撮像、再現では、人間の解像度に関する感覚がやや低下し、高解像度化の効果がみえづらい。しかし、静止画の撮像、再現においては、高解像度が効果的になる。例えば、医療用内視鏡カメラなどの分野では、通常、医師が動画として撮像、観察を行うが、病巣部分では静止画撮影が実施される。
そこで、動画撮影時には非偏光光源にて通常の動画撮像を行ない、従来型の動画高解像化処理を実施することとする。一方、コマンド指示により、静止画を撮影するときには、自在ズーミングが可能な偏光光源を照射して画像を撮像する。
従来型の動画高解像度化処理は、後述する。まず、静止画を撮影する場合を説明する。
図36は、本実施形態のムービーカメラ3500の構成を示す図である。本実施形態では、動画・静止画コマンド入力部3601がカメラに搭載されている。動画撮影時には、非偏光照明の照射が偏光面制御部204、撮像制御部205を経由して行われる。同時に撮像素子3301からの画像信号は動画静止画選択部3602を経由して輝度動画列メモリバッファ3603内に時間的に連続して取得される。輝度動画列メモリバッファ3603内から読み出された画像信号は、「動き」ベースの既存の動画高解像度化処理部3604で処理され、高解像度動画3605として蓄積される。
一方、静止画撮影時には、偏光照明の照射が偏光面制御部204、撮像制御部205を経由して行われる。同時に撮像素子3301からの画像信号が3602を経由して輝度画像としてメモリに蓄積され、実施形態2で説明した高解像度化処理が高解像度化処理部3303で実施される。
図37は制御方法を示すフローチャートである。
最初にステップS3700にて静止画撮影コマンドの入力の有無を判断する。ステップS3700で静止画撮影コマンドが入力が無(NO)場合、動画撮影を行う。具体的にはステップS3701にて非偏光照明がONとなり、ステップS3702で動画が録画されて、ステップS3703にて既存の動画高解像度化処理が行われる。この動画高解像度化処理には例えば、特許文献3に開示されているような従来技術が使われる。
この動画像高解像度化技術は、動画複数フレーム間の動きを用いる一般的な技術であり、以下の処理が実行される。
補間を行って最初の高解像度推定画像を生成する。位置合わせを行って位置合わせ画像を生成する。高解像度推定画像を不鮮明化し、不鮮明化画像と位置合わせ画像とを減算して残差画像を生成する。欠損していない周辺画素の残差値を用いて欠損残差を補間する。点拡がり逆関数を用いて残差画像から逆投影画像を生成し、平滑化画像と逆投影画像とを組み合わせて強調係数を生成する。強調係数を高解像度推定画像に更新して新たな高解像度推定画像を生成することにより、欠損画素の残差値を欠損していない周辺画素の残差値から補間する。
ステップS3700で静止画撮影コマンドが入力が有(YES)の場合、静止画撮影を行う。具体的には、ステップS3704にて偏光照明がONになる。そしてステップS3501で偏光照明の偏光面を替えながら静止画撮像が行われる。そして本実施形態2で説明した高解像度化処理がステップS3500で行われる。
以上の処理により、動画、静止画ともに高解像度化処理が行われ、かつ静止画部分では高解像度法線画像も得られる。
(実施形態4)
本実施形態では、実施形態1および2における偏光光源102を、より高速に偏光面を回転することが可能な光源3800に替えている。こうすることにより、本実施形態では、動画撮影においても、静止画における技術をそのまま用いて高解像度化を実現する。偏光光源102以外の構成は、図1および図2、図32および図33に示す構成と同一である。
図38は、高速に偏光面を45°ずつ回転させるための偏光光源の構成を示している。この偏光光源は、パターン化偏光子フィルタ3801とLED面光源3802とを備えている。
パターン化偏光子フィルタ3801としては、フィルム型の偏光板のほか、フォトニック結晶や構造複屈折波長板、ワイヤーグリッド等が利用できる。LED面光源3802は、45°ずつ異なる偏光面を有するパターン偏光子3701の各々に対して独立に点灯するように分割されている。そして0°、45°、90°、135°のパターン化偏光子にそれぞれ相当するLED面光源の3802における4つの分割発光領域A、B、C、Dが順次点灯する。例えば、分割発光領域Aが点灯しているとき、他の分割発光領域B、C、Dは点灯していない。このとき、分割発光領域Aからでた光は、偏光していないが、パターン化偏光子フィルタ3801における角度0°のパターン化偏光子に入射する。そのパターン化偏光子の偏光透過軸の方向に偏光した光のみがパターン化偏光子フィルタ3801を透過することができる。こうして、分割発光領域A、B、C、Dを順次点灯させることにより、図38の参照符号303から306に示すように、出射光の偏光面が回転する。分割発光領域A、B、C、Dの各々は、少なくとも1つのLED素子を含んでいる。
なお、簡単のため、図38に示す構成では、パターン偏光子フィルタ3801は4分割構成を有しているが、例えば、偏光面の方位が異なる4つのパターン化偏光子と、各パターン化偏光子に割り当てられた発光領域とが、より細かく分割された構成を採用しても良い。
また、すべての分割発光領域を点灯させれば、非偏光光源307として機能させることもできる。この構成により、偏光面の回転に要する時間をLEDの点灯応答速度である10(μS)程度まで短縮することができ、フレーム切り替え時間内に偏光面の変化を完了させられる。これにより動画撮影時に偏光面を変える時間が問題にならないほど短くなる。
図39は、この偏光光源を用いて動画を撮影する場合のタイムチャートを示している。時間t1(3901)は、偏光面切り替え時間を示し、時間t2(3902)は1フレームの撮像露光時間を示す。この場合、1枚の偏光画像撮影には、t1+t2=T(sec)を要する。したがって、高解像度のためには、4T(sec)を1セットとする4枚の異なる偏光面照明での画像が必要となる。動画を高解像度するためには、この4T(sec)の時間内は被写体が動かないことが必要である。したがって、通常の被写体を撮影する動画においては
を満たさねばならない。このため
となる高速度撮影が必要になる。このような高速度撮影も、撮像素子をより高速化し、かつ本実施形態における照明の照度を向上して露光時間を短縮すれば可能となる。結果的に動画においても、自在に高解像度化を実現できる。
(実施形態5)
本実施形態は、実施形態2と同じく偏光面が回転する偏光照明を用いながら、画像撮影には通常のカラー輝度カメラを利用して自在ズーミングを可能とする。
図40は、実施形態5を示す図である。実施形態2の図33と異なる点は、カメラ3201が通常のカラーカメラであることのみである。カラーカメラは、カラー撮像素子4001により、R、G、Bの波長帯別にR画像4002、G画像4003、B画像4004を取得する。
偏光面制御部204から偏光照明を変化させる度にカラー画像を撮像することにより、カラー輝度画像である4002、4003、4004が各偏光状態に対応して複数得られる。そしてカラー高解像度化処理部4005の処理により高解像度法線画像208、および高解像度カラー画像4006が生成される。本実施形態の主たる効果は、実施形態2の画像の単なるカラー化ではなく、カラー情報を使うことによって各種の不要な多重反射成分を正確に分離して物理的に必要な多重反射成分を利用できる点にある。
図14を参照しながら行った説明において、マイクロファセットがグルーブ:溝1401を形成し、その斜面で2回の反射が発生していると仮定した。この場合の1回目と2回目の反射の性質を鏡面反射と拡散反射に分離した場合、
1)1回目:拡散反射 2回目: 鏡面反射
2)1回目:拡散反射 2回目: 拡散反射
3)1回目:鏡面反射 2回目: 拡散反射
4)1回目:鏡面反射 2回目: 鏡面反射
の4通りの現象が想定でき、実施形態2においては、被写体の着色が暗い場合には、4)の1回目も2回目も鏡面反射という現象を主要な現象として考えて解析した。しかし一般には1)から3)の多重反射の成分を観測輝度から成分として分離する前処理が必要になる。実施形態2においてはモノクロ処理を想定していたため、この分離を正確に実施することは困難であった。
本実施形態においては、RGBのカラー成分を用いてこの問題を解決する。以下、各多重反射の物理的な性質を説明する。
なお、以下の説明においては、反射現象によって、光の色と偏光の属性が変わる点がポイントである。(i)拡散光は媒質の内部に一旦浸透した光が射出するため、照明光が白色の場合に物体の媒質の色で着色されること、および(ii)出射時の偏光は出射角に依存し、本実施形態においては45−50°となるために、きわめて低くほとんど非偏光である点に注意する。
図41は、上記1)に相当する2回反射を描いたものである。1回目の反射で非偏光の拡散光となった光は物体の媒質固有の色を有するため、2回目の鏡面反射では着色した反射成分となるとともに鏡面反射として部分偏光を呈する。図では、これを楕円4101、4102で表現している。なお楕円は正確に部分偏光の形状を表現するわけではなく模式的に表現している。ここで入射光の偏光方向を変えると媒質内に屈折・浸透する光量が変化するため2回目反射への入射光量が変動し、結果的に2回目の反射成分の光量は変動するため、4101、4102のような楕円の大きさが変動し、輝度が変動する。
図42は、上記2)に相当する2回反射の様子を描いたものである。1回目の反射で着色した拡散光は2回目に再度着色した拡散光として射出する。また入射光の偏光方向を変えると媒質内に屈折・浸透する光量が変化するため2回目反射への入射光量が変動し、結果的に2回目の反射成分の光量も変動するが、反射光は非偏光である。
図43は、上記3)に相当する2回反射を描いたものである。1回目の反射で鏡面反射した光は色は白色光のまま鏡面反射の偏光となる。そして2回目には着色した非偏光の拡散光として反射するが、入射光の偏光方向を変えると1回目に反射する光量が変化するため結果的に2回目の反射成分の光量は変動する。
以上、最終的に観測される2回反射後の光の性質をまとめると表1のようになる。
本実施形態で主に利用する4)の1、2回とも鏡面反射の反射光のみが白色光を維持するのに対して、1)から3)の反射光は、すべて物体色に着色しているカラー光である。両輝度成分ともに照明の偏光方向を変えると個別に変動するためこれを分離するためには、モノクロ輝度のみでは不可能である。
そこで、カラーカメラを用いて偏光照明の偏光面を順次変えながら撮影し、カラー輝度R、G、Bの変化の関数を周期180°の余弦関数として近似する。照明の偏光面の角度をΨIとして以下のようになる。ここで輝度Iと振幅Aはいずれも(R、G、B)の3成分を有するベクトルとしている。この輝度変動における位相φIは一般に各色とも共通である。
ここで得られた最小値を物体色と仮定し、
また光源色を既知として
とすると以下のベクトル方程式が成立する。
図44はこのベクトルの関係の概念図をRGB色空間内にて表したものである。
この方程式は2未知数に対してRGBの3成分を有するため最小2乗法にて説くことができる。結果として得られた重み係数を用いて変動する輝度を成分分離することができ、表1における4)の反射成分は、
となる。
図45は、以上の動作を表したフローチャートである。実施形態2で説明した図34と異なるのはS4501でカラーRGB画像を取得する部分、およびS4502でカラーRGB成分から表14)の1、2回とも鏡面反射の成分を分離する部分のみである。分離された輝度成分は照明の白色を有するため輝度のみの取り扱いが可能であり、フローチャートの他の部分は同一である。ここで得られる高解像度画像は、鏡面反射成分だけになるためこれを再度、式46を用いて合成することにより、最終的な高解像度カラー画像を得ることができる。
なお、実施形態1から5を通じて、偏光照明の偏光面回転角は45°きざみを例として説明してきたが、この角度は任意である。