(参考例1)
本参考例の画像処理装置は、図1に示すように、光を対象空間に照射する発光源2と、受光光量に応じた受光出力を発生する複数個の感光部1aが配列され対象空間を撮像する光検出素子10と、発光源2から対象空間へ光を照射していないときの各感光部1aの受光出力と発光源2から対象空間へ光を照射したときの各感光部1aの受光出力との差分からなる受光出力の振幅値を画素値とする振幅画像f1(図2参照)を生成する画像生成部3と、画像生成部3で生成された振幅画像f1に基づいて対象空間内に存在する物体(本参考例では、人物)Obの特徴量を抽出する特徴量抽出部4と、通常動作モードとテンプレート作成モードとを選択的に設定する動作モード設定部(図示せず)と、動作モード設定部にてテンプレート作成モードが設定されている状態で光検出素子10により対象空間内の物体Obとして認証対象者を撮像したときに特徴量抽出部4により抽出された認証対象者の顔の特徴量に基づいてテンプレート(本参考例では、顔テンプレート)を作成し当該テンプレートを登録保持(記憶)するテンプレート作成記憶部TPと、動作モード設定部にて通常動作モードが設定されている状態で特徴量抽出部4により抽出された物体の特徴量をテンプレート作成記憶部TPに登録保持されているテンプレートと照合して類似度を算出する類似度演算部5と、類似度演算部5で算出された類似度が所定値以上になる物体Obをテンプレートに相当する対象物として認識する対象物認識部6(つまり、対象物認識部6は、類似度に基づいて、テンプレートに相当する対象物の存否を判断する)とを備えている。なお、光検出素子10は後述の受光光学系7を通して対象空間を撮像する。
上述の特徴量抽出部4は、振幅画像f1の振幅値から求められる各画素の微分強度値である振幅微分値を画素値とする振幅微分画像を生成し当該振幅微分画像を規定の閾値で2値化した画像からなる出力画像f2(図4参照)を生成する画像加工手段(図示せず)を備えており、画像加工手段にて生成された出力画像f2から顔の特徴量を抽出する。また、対象物認識部6は、類似度演算部5で算出された類似度が上記所定値以上になる場合に、光検出素子10により撮像された物体Obが認証対象者本人であることを認証する認証機能を有している。言い換えれば、対象物認識部6は、類似度演算部5で算出された類似度が上記所定値未満の場合には、光検出素子10により撮像された物体Obが認証対象者本人であるとは認証しない。
したがって、本参考例の画像処理装置では、予めテンプレート作成モードにおいて入室を希望する人物(物体Ob)を光検出素子10により撮像してテンプレートを作成しておき、その後、通常動作モードにおいて生成された振幅微分画像を規定の閾値で2値化した出力画像f2とテンプレートとのパターンマッチングを行って類似度を算出し、算出された類似度に基づいて上記人物が入室の許可されている認証対象者本人であるか否かを判定する顔認証を行うことができる。
以下、本参考例の画像処理装置の各構成要素について詳述する。
本参考例では、光検出素子10として、1個の感光部1aと1個の電荷集積部1b(図1参照)とを形成する単位構成の受光素子1(図5(a),(b)参照)を1枚の半導体基板に複数個配列したイメージセンサを想定している。
受光素子1は、不純物を添加したシリコン層からなる半導体層11を備えるとともに、半導体層11の主表面の全面に亘ってシリコン酸化膜からなる絶縁膜12を有し、半導体層11に絶縁膜12を介して制御電極13を設けた構成を有する。受光素子1はMIS素子として知られた構造であるが、1個の受光素子1として機能する領域に複数個(図示例では5個)の制御電極13を備える点が通常のMIS素子とは異なる。絶縁膜12および制御電極13は発光源2から対象空間に照射される光と同波長の光が透過するように材料が選択され、絶縁膜12を通して半導体層11に光が入射すると、半導体層11の内部に電荷が生成される。つまり、受光素子1の受光面は図5(a),(b)における半導体層11の主表面(上面)になる。図示例の半導体層11の導電形はn形であり、光の照射により生成される電荷としては電子eを利用する。
この構造の受光素子1では、制御電極13に正の制御電圧+Vを印加すると、半導体層11には制御電極13に対応する部位に電子eを集積するポテンシャル井戸(空乏層)14が形成される。つまり、半導体層11にポテンシャル井戸14を形成するように制御電極13に制御電圧を印加した状態で光が半導体層11に照射されると、ポテンシャル井戸14の近傍で生成された電子eの一部はポテンシャル井戸14に捕獲されてポテンシャル井戸14に集積され、残りの電子eは半導体層11の深部での再結合により消滅する。また、ポテンシャル井戸14から離れた場所で生成された電子eも半導体層11の深部での再結合により消滅する。つまり、光が照射されると半導体層11が電荷を生成する感光部1aとして機能し、ポテンシャル井戸14は電荷を集積して保持する電荷集積部1bとして機能する。
上述のように、ポテンシャル井戸14は制御電圧を印加した制御電極13に対応する部位に形成されるから、制御電圧を印加する制御電極13の個数を変化させることにより半導体層11の主表面に沿ったポテンシャル井戸14の面積を変化させることができる。半導体層11で生成された電荷のうちポテンシャル井戸14に集積される電荷の割合は、ポテンシャル井戸14の面積が大きいほど多くなり、後述するようにポテンシャル井戸に集積した電荷を利用するから、ポテンシャル井戸14の面積を大きくするほど感度を高めたことになる。言い換えると、感光部1aの感度をポテンシャル井戸14の面積により制御したことになる。また、ポテンシャル井戸14は電荷集積部1bとして機能するから、制御電極13に印加する制御電圧を変化させることにより、受光面に占める電荷集積部1bの面積を変化させ、電荷集積部1bの面積を変化させることにより感光部1aの感度を調節すると言える。
例えば、図5(a)のように内側の3個の制御電極13に制御電圧+Vを印加し外側の2個の制御電極13には電圧を印加しない(0V)場合と、図5(b)のように中央の1個の制御電極13に制御電圧+Vを印加し残りの4個の制御電極13には電圧を印加しない(0V)場合とでは、図5(a)の場合のほうが電荷集積部1bであるポテンシャル井戸14が受光面に占める面積が大きくなる。したがって、図5(a)の状態のほうが図5(b)の状態に比較して同光量に対してポテンシャル井戸14に集積される電荷の割合が多くなり、実質的に感光部1aの感度を高めたことになる。
本参考例の光検出素子10は、上述のように複数個の受光素子1を1枚の半導体基板に配列したイメージセンサを想定しており、上述した受光素子1において電荷集積部1bであるポテンシャル井戸14から電荷を取り出すには、CCDと同様の技術を採用する。つまり、ポテンシャル井戸14に電荷が集積された後に、制御電極13に印加する制御電圧の印加パターンを制御することによってポテンシャル井戸14に集積された電荷を転送し、半導体層11に設けた図示しない電極から電荷を取り出す。電荷を転送するための構成としては、フレーム転送型のCCDと同様の構成あるいはインターライン型のCCDと同様の構成を採用することができる。フレーム転送型のCCDと同様の構成を採用する場合には図5の右方向または左方向に電荷を転送するようにポテンシャル井戸14の形状を変化させればよく、インターライン型のCCDと同様の構成を採用する場合には図5の左右方向に沿ったCCDを設け、ポテンシャル井戸14からCCDに電荷を引き渡した後にCCDにより図5の左右方向に電荷を転送すればよい。
上述したように、受光素子1において、半導体層11は、光の入射により電荷を生成する感光部1a(図1参照)として機能するとともに、制御電極13に制御電圧を印加しポテンシャル井戸14を形成することにより感光部1aで生成された電荷を集積する電荷集積部1b(図1参照)として機能する。また、半導体層11に光が入射している間に制御電極13に印加する制御電圧の印加パターンを変化させることによって感光部1aの感度を制御することができる。
電荷集積部1bに集積した電荷を取り出すために、フレーム転送型のCCDと同様の構成を採用する場合には、制御電極13に印加する制御電圧の印加パターンを制御することによって電荷を転送することになるから、電荷集積部1bに電荷を集積する集積期間とは異なる取出期間において電荷集積部1bの電荷を取り出すことができるように制御電極13に印加する制御電圧を制御すればよく、半導体層11は制御電極13とともに電荷取出部1c(図1参照)としても機能する。
上述の光検出素子10は、例えば、1枚の半導体基板上に設定した二次元正方格子の格子点上にそれぞれ上述した構成の受光素子1を配置して構成され、例えば100個×100個の受光素子1をマトリクス状に配列した構成を有している。また、マトリクス状に配列した受光素子1のうち垂直方向の各列では一体に連続する半導体層11を共用するとともに、制御電極13を垂直方向に並設することにより、半導体層11を垂直方向への電荷の転送経路として用いることができる。イメージセンサとしての光検出素子10を構成するには、半導体基板に、垂直方向の各列の半導体層11の一端から電荷を受け取って水平方向に電荷を転送するCCDからなる水平転送部を設ける。なお、図1では制御電極13を各感光部1aに1個ずつ対応付けた形で示しているが、実際には図5のように複数個(例えば5個)の制御電極13を設ける。また、本参考例では制御電極13を電荷取出部1cにおける電荷の転送に兼用している。
対象空間に光を照射する発光源2としては、例えば多数個の発光ダイオードを一平面上に配列したものや半導体レーザと発散レンズとを組み合わせたものを用いる。発光源2から放射する光は、赤外線と可視光とのどちらでも用いることができる。赤外線を用いれば夜間でも発光源2の点灯に気付かれることがないから監視カメラなどの目的に適した構成になり、可視光を用いれば人が目で見るときの状態に近い画像を得ることができる。発光源2は、制御回路部8から出力される所定の変調周波数の変調信号により駆動される。変調信号には方形波を用い、変調周波数は10〜100kHzから選択し、デューティは50%としてある。したがって、発光源2は10〜100μsの周期で点灯と消灯とを同じ時間ずつ交互に繰り返すことになる。発光源2が点灯と消灯とを繰り返す周期は人の目では認識できない程度の短い周期にする。つまり、発光源2は実際には点灯と消灯とを繰り返しているが、人の目には連続して点灯しているように見えることになる。ただし、これらの数値は一例であり、変調周波数は適宜に設定可能である。
一方、光検出素子10には受光光学系7を通して光が入射する。受光光学系7は光検出素子10の各受光素子1に対象空間を投影するために設けられている。すなわち、受光光学系7は、光検出素子10において受光素子1を配列した2次元平面に対象空間である3次元空間をマッピングする。したがって、光検出素子10から受光光学系7を通して見る視野内に存在する物体Obは受光素子1に対応付けられる。
ところで、図1では光検出素子10の機能の理解を容易にするために、受光素子1の機能を上述したように感光部1aと電荷集積部1bと電荷取出部1cとに分けて記載している。ただし、図1における電荷取出部1cは、半導体層11だけではなく上述した水平転送部も含んでいる。また、感光部1aと電荷集積部1bと電荷取出部1cとは、上述のように制御電極13を共用しており、制御回路部8で生成され制御電極13に印加される制御電圧の印加パターンを制御することによって、感光部1aへの光の照射により生成される電荷のうち電荷集積部1bに集積する電荷の割合を決める感度の調節と、電荷集積部1bを形成するタイミングの調節と、電荷取出部1cにより電荷集積部1bから電荷を取り出すタイミングの調節とがなされる。つまり、制御電圧の印加パターンと印加パターンを変化させるタイミングとを制御することにより、電荷集積部1bに電荷を集積する集積期間と、集積期間とは異なる期間であって電荷取出部1cにより電荷集積部1bから電荷を取り出して画像生成部3に受光出力を与える取出期間とを制御することができる。
以下に具体的な動作を説明する。発光源2は図6(a)に示すように点灯と消灯とを交互に繰り返すように制御回路部4からの変調信号により駆動される。点灯と消灯との各期間(以下、それぞれ点灯期間Ta、消灯期間Tbと呼ぶ)は本参考例では等しくしてある(つまり、変調信号のデューティは50%にしている)。発光源2から対象空間に照射され物体Obで反射された光は、図6(b)のように、物体Obまでの距離に応じた遅れ時間Tdで受光素子1に入射する。ただし、遅れ時間Tdは点灯期間Taおよび消灯期間Tbに比較すると通常はごく短時間であるから無視することができる。
制御回路部8は、制御電極13に印加する制御電圧を制御し、発光源2の点灯期間Taに電荷集積部1bの面積を大きくすることによって集積した電荷と、消灯期間Tbに電荷集積部1bの面積を大きくすることによって集積した電荷とをそれぞれ受光出力として画像生成部3に与える。つまり、点灯期間Taに感光部1aを高感度にした状態で電荷集積部1bに集積した電荷を受光出力として取り出す状態と、消灯期間Tbに感光部1aを高感度にした状態で電荷集積部1bに集積した電荷を受光出力として取り出す状態とを繰り返すように、制御回路部8により制御電極13への制御電圧の印加パターンを制御する。
受光出力は、点灯期間Taの全期間と消灯期間Tbの全期間とのそれぞれについて集積した電荷を用いることを想定しているが、点灯期間Taの一部期間と消灯期間Tbの一部期間とのそれぞれについて集積した電荷を用いるようにしてもよい。後者の場合には、電荷を集積する期間を等しくしておけば、点灯期間Taと消灯期間Tbとのデューティを50%以外とすることができ、また受光出力における遅れ時間Tdの影響による誤差を除去することができる。また、1回の点灯期間Taあるいは消灯期間Tbは短時間であって、1回の点灯期間Taあるいは消灯期間Tbでは画像生成部3で処理する(振幅画像f1を生成する)のに必要な大きさの受光出力を得るのは難しいから、複数回の点灯期間Taで電荷集積部1bに集積した電荷を点灯期間Taの受光出力として用い、複数回の消灯期間Tbで電荷集積部1bに集積した電荷を消灯期間Tbの受光出力として用いるのが望ましい。電荷集積部1bに電荷を集積する集積期間と、電荷取出部1cが電荷集積部1bから電荷を取り出して受光出力として画像生成部3に与える取出期間とは、上述したように制御電極13に印加する制御電圧により調節することができる。
画像生成部3は、点灯期間Taの受光出力と消灯期間Tbの受光出力との差分(言い換えれば、発光源2から対象空間へ光を照射していないときの各感光部1aの受光出力と発光源2から対象空間へ光を照射したときの各感光部1aの受光出力との差分)を各感光部1a(受光素子1)ごとの画素値とする振幅画像f1を生成する。図示例では説明を単純にするために、1回の点灯期間Taにおける受光出力Aaを点灯期間Taの受光出力とし、1回の消灯期間Tbにおける受光出力Abを消灯期間Tbの受光出力としている。
したがって、図7に曲線Eで示すように、環境光の強度が時間経過に伴って変化しているとすると、この曲線Eは発光源2の消灯期間Tbにおいて感光部1aに入射する光の強度に相当し、結果的に消灯期間Tbにおける受光出力Abに対応する。このように発光源2の消灯期間Tbの受光出力Abは曲線Eの高さに相当するから、発光源2の点灯期間Taの受光出力Aaは曲線Eよりも高くなる。つまり、発光源2が点灯と消灯とを繰り返すことにより、光検出素子10からの受光出力Aa,Abは、点灯期間Taには曲線Eよりも高くなり、消灯期間Tbには曲線Eの高さになる。発光源2から対象空間に照射された光に対応する受光出力は曲線Eよりも上の部分であるから、点灯期間Taの受光出力Aaと消灯期間Tbの受光出力Abとの差分(Aa−Ab)を求めることにより、環境光の影響を除去して発光源2から対象空間に照射された光の成分のみを抽出することができる。この差分(Aa−Ab)を各受光素子1の位置に対応付けた画像が振幅画像f1になる。
なお、差分(Aa−Ab)は隣接した点灯期間Taの受光出力Aaと消灯期間Tb(図示例では点灯期間Taの直後の消灯期間Tbを用いている)の受光出力Abとから求めており、差分(Aa−Ab)を求める点灯期間Taと消灯期間Tbとを合わせた程度の期間では環境光の強度Eは実質的に変化がないものとみなしている。したがって、点灯期間Taと消灯期間Tbとにおける環境光による受光出力は相殺され、発光源2から対象空間に照射され物体Obで反射された反射光に対応する受光出力のみが残り、結果的に、振幅画像f1では、物体Obのみを強調した画像を得ることができる。
上述した構成では、感光部1aと電荷集積部1bとで半導体層11を共用しているから、ポテンシャル井戸14の面積を大きくし感光部1aが高感度になるように制御電極13に制御電圧を印加している期間ではない期間(つまり、ポテンシャル井戸14の面積を小さくし感光部1aを低感度に設定している期間やポテンシャル井戸14に集積した電荷を転送している期間)であっても、受光素子1に光が入射していると電荷集積部1bに電荷が集積される。すなわち、電荷集積部1bには感光部1aを高感度に設定することにより生成した電荷以外の電荷が混入する。ただし、電荷集積部1bに電荷を保持したり電荷を転送したりしている期間には、感光部1aが低感度であって電荷集積部1bの面積が小さくなっているから不要な電荷の混入量は比較的少なくなる。なお、点灯期間Taの電荷と消灯期間Tbの電荷とをそれぞれ電荷集積部1bに保持している期間において混入する不要な電荷に対応する成分は、差分を求める際に環境光に対応する成分とともに除去することができる。
なお、図5(b)のように電荷集積部1bの面積を小さくしている期間において、必要な電荷以外の電荷の混入を抑制するために、この期間における電荷集積部1bに対応した制御電極13の近傍を遮光膜で覆う構成を採用してもよい。また、上述したように、点灯期間Taと消灯期間Tbとの全期間に亘って感光部1aを高感度に維持しておく(つまり、電荷集積部1bの面積を大きい状態に保つ)必要はなく、点灯期間Taと消灯期間Tbとの一部期間において感光部1aを高感度にする期間を設ければよいから、物体Obまで距離が既知である場合には、図8のように、物体Obまでの距離に応じた遅れ時間Tdを考慮し、発光源2の点灯または消灯から遅れ時間Tdが経過した後に感光部1aを高感度にして電荷集積部1bに電荷を集積してもよい。この場合には電荷集積部1bに集積される電荷の量は、図6に示した制御を行う場合に比較すると、遅れ時間Tdに相当する程度少なくなるが、点灯期間Taと消灯期間Tbとに受光した光量を正確に反映した受光出力Aa,Abが得られるから、環境光の影響をより確実に除去できると言える。
ところで、画像生成部3にて生成された振幅画像f1(図2参照)は特徴量抽出部4に与えられる。ここで、図2に示す振幅画像f1の画像座標系は、振幅画像f1の左上を原点とし、x軸の正方向(x方向)を水平右方向、y軸の正方向(y方向)を鉛直下方向とする左手系座標系としてあり、特徴量抽出部4では、図2に示すようなマスクサイズが3×3画素のソーベルフィルタhx,hy(なお、図2には、x方向のソーベルフィルタhx、y方向のソーベルフィルタhyそれぞれについて、振幅画像f1上の重み係数の配置を示してある)を振幅画像f1の全ての画素に適用して局所空間微分を行い、振幅画像f1の振幅値から求められる各画素の微分強度値である振幅微分値を画素とする振幅微分画像を生成し、当該振幅微分画像を上記閾値で2値化して得られた出力画像f2(図4参照)から物体Obの特徴量(本参考例では、人物の顔の特徴量)を抽出する。
振幅画像f1の画素(u,v)における微分強度値を|G(u,v)|とすれば、微分強度値|G(u,v)|は、振幅画像f1における注目画素の隣接する8画素(注目画素の8近傍)の画素値(本参考例では、振幅値)を用いて求められる値である。ここにおいて、微分強度値|G(u,v)|は、図3(a)に示すように注目画素p5を中心とする3×3画素の局所領域(矩形領域)における各画素p1〜p9それぞれの画素値を図3(b)に示すようにa〜iとすれば、x方向の微分値dxおよびy方向の微分値dyを用いて下記の(式1)で表される。
|G(u,v)|={(dx2 (u,v)+dy2(u,v)}1/2 (式1)
ただし、
dx(u,v)=(c+2f+i)−(a+2d+g) (式2)
dy(u,v)=(g+2h+i)−(a+2b+c) (式3)
(式1)によって求めた振幅微分値を画素値に持つ振幅微分画像においては振幅画像f1における振幅差の大きい部位ほど振幅微分値が大きくなる。特徴量抽出部は、振幅微分画像を上記閾値で2値化することにより出力画像f2を生成する。
そして、類似度演算部5において特徴量抽出部4により抽出された物体Obの特徴量とテンプレート作成記憶部TPに登録されているテンプレートとを照合して算出された類似度が対象物認識部6へ与えられ、対象物認識部6では、類似度演算部5で算出された類似度が上記所定値以上になる場合に、光検出素子10により撮像された物体Obである人物の顔が認証対象者本人の顔であることを認証(顔認証)する。なお、対象物認識部6では、周知の顔認証の技術を適宜採用すればよく、アフィン変換などの周知の変換技術を適宜用いる。
しかして、本参考例の画像処理装置では、光検出素子10のダイナミックレンジの範囲内であれば対象空間の環境光の変動に起因した各感光部1aの受光出力の変化の影響を受けることなく同じ画素値が得られることとなるから、つまり、画像生成部3にて生成される画像として、対象空間の環境光の変動の影響を受けることなく同じ振幅画像f1が得られることとなるから、物体Obの特徴量を安定して抽出することが可能となり、対象空間の環境光の変動の影響を受けることなく対象物を認識することができる。要するに、本参考例では、環境光の影響を受けることなく認証対象者の顔の認証判断を行うことができる。ここにおいて、振幅画像はダイナミックの範囲内であれば環境光の影響を受けないので、例えば物体Obである人の顔と光検出素子10との距離が同じ状況で微分画像を求めた場合には、顔の同じ位置にエッジができる。また、特徴量抽出部4において特徴量を抽出する入力画像として振幅微分画像を2値化して得た出力画像f2を用いているので、振幅画像を用いる場合に比べて、データ量(情報量)を少なくでき、高速に顔認証処理をすることが可能となる。また、振幅画像を用いる場合に比べて、段差のように距離の変化率が大きい領域と距離の変化率が小さい領域とを容易に識別することが可能になり、対象物を正確に認識することができるという利点がある。
さらに、光検出素子10に入射する反射光のパワーは距離の2乗に反比例するので、例えば、光検出素子10の前に立っている人の画素値に比べると、背景の画素値が低くなり、図9(a)の濃淡画像f11と同じ状況で撮像した図9(b)上段の振幅画像f1を上記閾値で2値化することにより図9(b)下段のように背景が除去された振幅2値画像f4を得ることができ、振幅2値画像f4における処理領域を対象物のみに限定することが可能となる。したがって、顔のみが光検出素子10の比較的近くに位置することが多い顔認証の用途では、特に適しており、対象物である顔のみを抽出して認証に要する時間の短縮化を図れるとともに、顔認証の精度の向上を図れる。すなわち、振幅画像はダイナミックレンジの範囲内であれば環境光の影響を受けず、しかも、振幅画像を例えば上記閾値で2値化することにより対象空間内に存在する対象物である物体Obの背景を抽出しにくくなり、対象物のみを主に抽出することができるので、濃淡画像全体から特徴量を抽出する場合に比べて、対象物のみを中心にして特徴量を抽出することができ、特徴量の抽出にかかる時間が短縮される。また、環境光の影響を受けていない振幅画像に基づいて生成した振幅微分画像から特徴量を抽出するので、より精度よく安定して顔の特徴量を抽出することができ、結果的に顔認証の精度の向上を図れる。また、特徴量の位置関係により個人の認証を行う場合、顔全体を認証に用いる場合と比べて情報量を減らすことができ、また、テンプレート作成記憶部TPに複数の顔テンプレートが登録されている場合においても、特徴量の位置関係から本人の可能性が高い顔テンプレートの候補について優先的に類似度を算出して認証を行うことも可能となる。
例えば、図10に示すように物体Obである人物の側方に対象空間を照明している照明装置Lが存在している(つまり、物体Obの側方から照射される環境光が存在している)ような状況においては、図11(b)の上側に示した濃淡画像f11の各画素の微分強度値を画素値とする濃淡微分画像を適宜閾値で2値化して得られる図11(b)の下側に示した出力画像f12では顔の特徴量(顔の輪郭、目、鼻、口など)のうち認識できない箇所が多くなってしまう。これに対して、図11(a)の上側に示した振幅画像f1の各画素の微分強度値を画素値とする振幅微分画像を2値化して得られる図11(a)の下側に示した出力画像f2では顔の特徴量をより認識しやすくなっていることが分かる。要するに、濃淡画像を画像処理して得られる出力画像f12は環境光の影響を受けやすいのに対して、振幅画像を画像処理して得られる出力画像f2は環境光の影響を受けにくいので、対象物認識部6において安定して対象物を認識することができる。また、微分強度値は画像の明るさの影響を受け難いので、振幅微分画像を2値化して得られた出力画像f2を用いてテンプレートマッチングを行うことで、テンプレート作成モードにおいて光検出素子10により対象空間を撮像してテンプレートを作成するときの対象空間の明るさと、通常動作モード時において光検出素子10により対象空間を撮像して対象物の認識を行うときの対象空間の明るさとが異なっていても、対象空間の明るさの変動の影響を受け難く、振幅画像そのものから特徴量を抽出する場合に比べて、特徴量をより正確に抽出することが可能となる。
なお、顔の特徴量を抽出する技術について図12を利用して説明すれば、まず、図12(a)に示す振幅画像f1から図12(b)に示す出力画像(振幅微分画像を2値化して得られる画像)f2を作成する。ここにおいて、目、鼻、口などは頬や額などに比べて微分強度値が大きくなるので、振幅微分画像を2値化した場合、図12(b)に示す出力画像f2のように、目、鼻、口、顔の輪郭のみを抽出することが可能となる。したがって、図12(b)に示す出力画像f2において目、鼻、口などの各部位の端点を抽出することによって、図12(c)に示すように顔の特徴点Cを抽出することができ、これらの特徴点の位置関係を用いて顔認証を行うことができる。
(参考例2)
参考例1では、点灯期間Taの受光出力Aaと消灯期間Tbの受光出力Abとは異なる取出期間において光検出素子10から画像生成部3に与えている。つまり、点灯期間Taに対応する集積期間に集積した電荷を受光出力として画像生成部3に与える取出期間と、消灯期間Tbに対応する集積期間に集積した電荷を受光出力として画像生成部3に与える取出期間とが個別に設けられている。本参考例は、点灯期間Taの受光出力Aaと消灯期間Tbの受光出力とを一括して画像生成部3に与えるように取出期間を設定する。つまり、点灯期間Taに対応する集積期間に集積した電荷と、消灯期間Tbに対応する集積期間に集積した電荷とをともに光検出素子10に設けた異なる電荷集積部1bにおいて保持しておき、1回の取出期間において両方の電荷をまとめて画像生成部3に与えるのである。
本参考例では、隣り合う2個1組の受光素子1を1画素として扱い、1画素となる2個の受光素子1における感光部1aの各一方をそれぞれ他方に対して高感度にするように、制御電極13に印加する制御電圧を調節する。つまり、1画素となる2個の感光部1aの一方は発光源2の点灯期間Taにおいて高感度にし、他方は発光源2の消灯期間Tbにおいて高感度にする。また、高感度にしていないほうの感光部1aは低感度にする。
本参考例の動作を具体的に説明する。図13に示すように、1画素となる2個の受光素子1がそれぞれ3個の制御電極13を備えるものとして動作を説明する。ただし、1個の受光素子1に対する制御電極13の個数は3個に限られるものではない。
以下では、1画素を構成する2個の受光素子1の各制御電極13を区別するために、図13のように、各制御電極13に(1)〜(6)の数字を付与して区別する。すなわち、組になる2個の受光素子1のうちの一方は制御電極(1)〜(3)を備え、他方は制御電極(4)〜(6)を備える。なお、1画素ずつの受光素子1に対応付けて、それぞれオーバフロードレインを設けるのが望ましい。
参考例1において説明したように、感光部1aの感度を制御するには受光面に占めるポテンシャル井戸14の面積が変化するように制御電極13に印加する制御電圧の印加パターンを制御するから、1画素を構成する2個の受光素子1の制御電極13に印加する制御電圧の印加パターンを、発光源2の点灯期間Taと消灯期間Tbとに同期させて変化させれば、2個の受光素子1のうちの一方の電荷集積部1bには点灯期間Taにおける電荷が集積され、他方の電荷集積部1bには消灯期間Tbにおける電荷が集積される。
つまり、発光源2の点灯期間Taには、図13(a)のように、制御電極(1)〜(3)に対応するポテンシャル井戸14の面積を大きくするために、1画素の一方の受光素子1に対応した3個の制御電極(1)〜(3)のすべてに同電圧である正の制御電圧(+V)を印加し、この期間には他方の受光素子1に対応した3個の制御電極(4)〜(6)のうちの中央の制御電極(5)にのみ正の制御電圧(+V)を印加してポテンシャル井戸14の面積を小さくする。つまり、制御電極(1)〜(3)に対応する領域は感光部1aを高感度に設定した状態になり、制御電極(4)〜(6)に対応する領域は感光部1aを低感度に設定した状態になる。したがって、制御電極(4)〜(6)に対応する領域では、受光による新たな電荷(電子e)の生成量が制御電極(1)〜(3)に対応する領域に比べて大幅に少なくなり、制御電極(1)〜(3)に対応する領域のポテンシャル井戸14には受光出力Aaに相当する電荷が集積される。
一方、発光源2の消灯期間Tbには、図13(b)のように、制御電極(4)〜(6)に対応するポテンシャル井戸14の面積を大きくするために、1画素の一方の受光素子1に対応した3個の制御電極(4)〜(6)のすべてに同電圧である正の制御電圧(+V)を印加し、この期間には他方の受光素子1に対応した3個の制御電極(1)〜(3)のうちの中央の制御電極(2)にのみ正の制御電圧(+V)を印加してポテンシャル井戸14の面積を小さくする。つまり、制御電極(4)〜(6)に対応する領域は感光部1aを高感度に設定した状態になり、制御電極(1)〜(3)に対応する領域は感光部1aを低感度に設定した状態になる。したがって、制御電極(1)〜(3)に対応する領域では、受光による新たな電荷(電子e)の生成量が制御電極(4)〜(6)に対応する領域に比べて大幅に少なくなり、制御電極(4)〜(6)に対応する領域のポテンシャル井戸14には受光出力Abに相当する電荷が集積される。
図13(a)の状態では点灯期間Taに対応する電荷を集積することができ、図13(b)の状態では消灯期間Tbに対応する電荷を集積することができるから、図13(a)の状態と図13(b)の状態とが1回ずつ得られるように制御電圧の印加パターンを制御すれば、点灯期間Taと消灯期間Tbとの受光出力Aa,Abを得ることができる。しかしながら、点灯期間Taと消灯期間Tbとの長さによっては、1回ずつでは受光素子1に入射する光量が少なく受光素子1の内部で発生するショットノイズにより受光出力Aa,AbのS/Nが悪化する場合がある。この場合には、図13(a)と図13(b)との両状態を複数回ずつ繰り返すことにより電荷集積部1bに複数回分の電荷を集積した後に、電荷取出部1cによって受光出力Aa,Abを取り出せばよい。
電荷取出部1cは、1画素となる2個の受光素子1の電荷集積部1bに、それぞれ発光源2の点灯期間Taにおける電荷と消灯期間Tbにおける電荷とが集積された後に、取出期間を設けて2種類の受光出力Aa,Abを一括して画像生成部3に与える。つまり、参考例1では、点灯期間Taの電荷を集積する集積期間、この電荷を取り出す取出期間、消灯期間Tbの電荷を集積する集積期間、この電荷を取り出す取出期間の4期間で2種類の受光出力Aa,Abを得ていたのに対して、本参考例では、点灯期間Taの電荷を集積する集積期間、消灯期間Tbの電荷を集積する集積期間、両方の電荷を取り出す取出期間の3期間で2種類の受光出力Aa,Abを得ることができる。
ところで、本参考例では、図13(a)の状態と図13(b)の状態とのいずれにおいても各3個の制御電極(1)〜(3)または(4)〜(6)に同時に印加する制御電圧(+V)と、1個の制御電極(2)または(5)のみに印加する制御電圧(+V)とは等しくなるように設定してある。したがって、ポテンシャル井戸14の面積が変化してもポテンシャル井戸14の深さはほぼ一定に保たれる。つまり、ポテンシャル井戸14の間の障壁付近で生成されポテンシャル井戸14に流れ込む電荷は、隣り合うポテンシャル井戸14にほぼ均等に振り分けられることになる。
以下では、ポテンシャル井戸14に不要な電荷が混入しても画像生成部3で振幅画像f1を生成する際に不要な電荷の影響を除去できる理由を説明する。ここで、説明を簡単にするために、ポテンシャル井戸14に集積される電荷の量がポテンシャル井戸14の面積に比例するものとする。本参考例では、感光部1aを高感度にしている状態と低感度にしている状態とでは、ポテンシャル井戸14の面積にはほぼ3倍の違いがあるから、集積される電荷の量は3倍異なるものとする。
いま、1個の制御電極13に対応するポテンシャル井戸14を形成したときに(図13(a)の状態で制御電極(5)に対応したポテンシャル井戸14に相当する)、このポテンシャル井戸14に、発光源2からの光により集積される電荷の量をSとし、環境光により集積される電荷の量をNとする。図13(a)の状態で制御電極(5)に対応するポテンシャル井戸14に集積される電荷の量は(S+N)であるから、制御電極(1)〜(3)に対応するポテンシャル井戸14に集積される電荷の量は(3S+3N)になる。一方、図13(b)の状態は消灯期間Tbであるから、発光源2からの光により集積される電荷はなく、制御電極(2)に対応するポテンシャル井戸14に集積される電荷の量はNであるから、制御電極(4)〜(6)に対応するポテンシャル井戸14に集積される電荷の量は3Nになる。
画像生成部3において振幅画像を生成する際には、図13(a)の状態で制御電極(1)〜(3)に対応するポテンシャル井戸14に集積された電荷と、図13(b)の状態で制御電極(4)〜(6)に対応するポテンシャル井戸14に集積された電荷とに対応する受光出力Aa,Abを減算する。ただし、図13(a)の状態において制御電極(5)に対応するポテンシャル井戸14には不要な電荷が集積されており、その量は(S+N)であるから、消灯期間Tbの受光出力Abに相当する電荷の量は(S+N)と3Nとを加算した量である(S+4N)になる。一方、図13(b)の状態において制御電極(2)に対応するポテンシャル井戸には不要な電荷が集積されており、その量はNであるから、点灯期間Taの受光出力Aaに相当する電荷の量は(3S+3N)とNとを加算した量である(3S+4N)になる。つまり、点灯期間Taに対応する受光出力Aaは(3S+4N)に対応し、消灯期間Tbに対応する受光出力Abは(S+4N)に対応するから、画像生成部3において振幅画像f1を生成する際には、(Aa−Ab)∝{(3S+4N)−(S+4N)}=2Sに相当する演算を行うことになり、不要な電荷と環境光とに対応した成分が除去される。
(参考例3)
参考例2では、1画素を形成する2個の受光素子1について、3個ずつの制御電極(1)〜(3)または(4)〜(6)に同時に印加する制御電圧(+V)と、1個の制御電極(2)または(5)のみに印加する制御電圧(+V)とが等しくなるように設定していたから、ポテンシャル井戸14の面積には変化が生じるものの、深さはほぼ等しくなっている。
本参考例は、参考例2と同様に2個の受光素子1により1画素を形成しているが、参考例2ではポテンシャル井戸14の深さを変化させなかったのに対して本参考例では、図14に示すように、ポテンシャル井戸14の面積とともに深さを変化させる技術を採用している。すなわち、3個ずつの制御電極(1)〜(3)または(4)〜(6)に同時に印加する制御電圧(+V)を、1個の制御電極(2)または(5)にのみ印加する制御電圧よりも高く設定し、面積の大きいポテンシャル井戸14の深さよりも面積の小さいポテンシャル井戸14の深さのほうを浅くしている。例えば、面積の大きいポテンシャル井戸14を形成する際に3個ずつの制御電極(1)〜(3)または(4)〜(6)に同時に印加する電圧を7Vとすれば、面積の小さいポテンシャル井戸14を形成する際に1個の制御電極(2)または(5)にのみ印加する電圧を3Vなどと設定するのである。
ところで、制御電圧を印加していない制御電極(1)(3)または(4)(6)に対応する部位で生じた電荷は、ポテンシャル井戸14に流れ込もうとする。このとき、ポテンシャル井戸14が深いほうが電荷の流れ込む確率が高くなると考えられる。すなわち、上述のように、感光部1aを高感度に設定して電荷を集積する際のポテンシャル井戸14を、感光部1aを低感度に設定して電荷を保持するポテンシャル井戸14よりも深くしたことより、高感度に設定して電荷を集積しているポテンシャル井戸14(3個ずつの制御電極(1)〜(3)または(4)〜(6)に対応するポテンシャル井戸14)に電荷がより多く流れ込むことになる。その結果、低感度に設定して電荷を保持しているポテンシャル井戸14(1個のみの制御電極(2)または(5)に対応するポテンシャル井戸14)によって保持されている電荷に、制御電極(1)(3)または(4)(6)に対応する部位で生成された不要な電荷が混入される確率が低減される。要するに、電荷を保持するポテンシャル井戸14に流れ込む不要な電荷を参考例2よりもさらに低減させることができる。他の構成および動作は参考例2と同様であり、図14(a)(b)の状態を交互に繰り返すことにより点灯期間Taと消灯期間Tbとに対応する電荷を2個の受光素子1にそれぞれ集積し、2個の受光素子1に集積した電荷を1回の取出期間において一括して受光出力Aa,Abとして取り出すのである。
(参考例4)
本参考例は、図15に示すように、参考例3の構成に加えて、各受光素子1に対応する3個ずつの制御電極(1)〜(3)または(4)〜(6)のうちの中央の制御電極(2)または(5)に印加する制御電圧を両側の制御電極(1)(3)または(4)(6)に印加する制御電圧よりも高くし、かつ中央の制御電極(2)または(5)に遮光膜15を重ねたものである。
本参考例では、受光素子1の一部を遮光膜15で覆っているから、遮光膜15で覆った部位ではポテンシャル井戸14に光が入射せず、光による電荷がほとんど生成されないから、電荷を保持するためにポテンシャル井戸14の面積を小さくしている状態では電荷がほとんど生成されず、保持している電荷に雑音成分となる電荷が混入する可能性を大幅に低減することができる。さらに、本参考例では、電荷を生成するために面積を大きくしているポテンシャル井戸14に対応する部位では、3個ずつの制御電極(1)〜(3)または(4)〜(6)のうち中央の制御電極(2)または(5)に印加する電圧を両側の制御電極(1)(3)または(4)(6)に印加する電圧よりも高くしているから、制御電極(2)または(5)に対応する部位では光による電荷がほとんど生成されないものの、受光素子1のうち制御電極(1)(3)(4)(6)に対応する部位で生成された電荷を制御電極(2)(5)に対応する部位に流し込むことができ、生成された電荷を集積することができる。
ところで、参考例3の構成では、電荷を生成する期間において3個ずつの制御電極(1)〜(3)または(4)〜(6)に対応するポテンシャル井戸14の深さがほぼ一定であるから、電荷を生成する期間と電荷を保持する期間とを数ns以下の短時間で切り換えた場合に、電荷を生成する期間において制御電極(1)(3)または(4)(6)に対応する部位で生成された電荷の一部が、電荷を保持する期間において制御電極(2)または(5)に対応する部位に移動することなく取り残されるおそれがある。取り残された電荷は、隣りの受光素子1に対応して形成されるポテンシャル井戸14に流れ込むから、隣接する受光素子1のポテンシャル井戸14の間で電荷が混合される可能性がある。つまり、電荷に含まれる雑音成分が多くなる可能性がある。
これに対して、本参考例では、電荷を生成する際にポテンシャル井戸14に深い部位と浅い部位とを形成して階段状としているから、制御電極(1)(3)または(4)(6)に対応する部位で生成された電荷は生成と同時に制御電極(2)または(5)に対応する部位に移動する。すなわち、電荷を生成する期間と電荷を保持する期間とを数ns以下の短時間で切り換えた場合であっても、隣接する受光素子1に形成されるポテンシャル井戸14の間で電荷が混合される可能性が少なくなり、雑音成分の低減につながる。なお、ポテンシャル井戸14を階段状に形成する技術は遮光膜15の有無にかかわらず採用可能である。他の構成および動作は参考例3と同様であり、本参考例においても参考例3と同様に、図15(a)(b)の状態を交互に繰り返すことにより、点灯期間Taと消灯期間Tbとに対応する電荷を集積し、さらに両電荷を一括して取り出す取出期間を設けるように制御電極13に印加する制御電圧の印加パターンを制御する。
参考例2ないし参考例4では、光電素子1ごとに3個ずつの制御電極13を対応付けているが、制御電極13は光電素子1ごとに4個以上設けるようにしてもよい。さらに、1画素を形成する制御電極13について制御電圧を印加する制御電極13の個数を1個と3個との2段階に切り換えるようにしているが、3段階以上に切り換えることも可能である。
(実施形態)
上述した各参考例においては、特徴量抽出部4における画像加工手段が画像生成部3にて生成された振幅画像f1から振幅微分画像を生成しているが、本実施形態では画像加工手段が振幅画像f1の振幅値から求められる各画素の微分方向値である振幅勾配方向値を画素値とする振幅勾配方向画像f3(図16参照)を生成し、振幅勾配方向画像f3から特徴量を抽出する点が相違する。なお、本実施形態の画像処理装置の基本構成は参考例1と同様なので図示を省略する。
特徴量抽出部4の画像加工手段において、振幅勾配方向画像f3の生成にあたっては、参考例1と同様に、図2に示すようなマスクサイズが3×3画素のソーベルフィルタhx,hyを振幅画像f1の全ての画素に適用して局所空間微分を行い、振幅画像f1の振幅値から求められる各画素の微分方向値である振幅勾配方向(以下、振幅勾配方向値と称す)を画素値とする振幅勾配方向画像を生成するが、振幅勾配方向値θは、上述の(式2)と(式3)とを用いて下記の(式4)で表される。
θ=tan-1{dx/dy} (式4)
ただし、図16に示した振幅勾配方向画像f3は、(式4)にて求めた振幅勾配方向値θが0度〜359度の範囲内で大きくなるにつれて濃度値が徐々に大きくなるスケール(振幅勾配方向値θが0度のときに濃度値が最小となり且つ振幅勾配方向値θが359度のときに濃度値が最大となるスケール)を用いて各振幅勾配方向値θから換算した濃度値を画素値とした画像である。
そして、参考例1と同様、類似度演算部5において特徴量抽出部4により抽出された物体Obの特徴量とテンプレート作成記憶部TPに登録されているテンプレートとを照合して算出された類似度が対象物認識部6へ与えられ、対象物認識部6では、類似度演算部5で算出された類似度が上記所定値以上になる場合に、光検出素子10により撮像された物体Obである人物の顔が認証対象者本人の顔であることを認証(顔認証)する。
ここにおいて、特徴量抽出部4において特徴量を抽出するにあたっては、例えば、振幅勾配方向値を図17(a)に示すような4方向E1,E2,E3,E4で4値化して同図(b)に示すような振幅勾配方向画像(ここでは、4値化画像)f3を作成する。そして、同図(b)に示すようなマスクサイズが7×7画素のフィルタh1を全ての画素に適用して、フィルタh1の中に含まれる4方向E1,E2,E3,E4それぞれの数をカウントし、方向E1のカウント数と方向E3のカウント数とがそれぞれ閾値(例えば、14)以上であった場合にその位置(7×7画素の中心画素)を有効画素とし、閾値未満である場合にその位置を無効画素とする処理を繰り返す。そして、有効画素を白領域、無効画素を黒領域とする図17(c)に示すようなマスク画像を作成し、図17(c)のようなマスク画像を利用してマスク処理を行うことにより顔の中で目、鼻、口などの個人の特徴的な部位のみを抽出し、抽出した部位のみを用いて顔認証を行うようにすればよい。このようなマスク処理を行うことにより、顔の中で目、鼻、口などの個人の特徴的な部位のみを抽出することが可能となるので、顔全体の画像を用いて認証処理を行う場合に比べて、認証に要する時間の短縮および認証精度の向上を図れる。
しかして、本実施形態の画像処理装置では、光検出素子10のダイナミックレンジの範囲内であれば対象空間の環境光の変動に起因した各感光部1aの受光出力の変化の影響を受けることなく同じ画素値が得られることとなるから、つまり、画像生成部3にて生成される画像として、対象空間の環境光の変動の影響を受けることなく同じ振幅画像f1が得られることとなるから、物体Obの特徴量を安定して抽出することが可能となり、対象空間の環境光の変動の影響を受けることなく対象物を認識することができる。要するに、本実施形態においても、環境光の影響を受けることなく認証対象者の顔の認証判断を行うことができる。ここにおいて、特徴量抽出部4において特徴量を抽出する入力画像として上述の振幅勾配方向画像f3を用いているので、振幅画像を用いる場合に比べて、発光源2と対象空間内に存在する物体Obとの間の距離の変化による物体Obでの反射光の変化の影響を軽減でき、対象物を正しく認識することができる。さらに説明すれば、発光源2と物体Obとの距離が変化することによって、物体Obからの反射光が変化するので、振幅画像において物体の画素値が全体的に変化する。したがって、振幅画像をそのまま入力画像として用いると、距離の変化の影響を受けてしまう。これに対して、振幅勾配方向画像を入力画像として用いる場合には、図18の(a)の上段の振幅画像f1と(b)の上段の振幅画像f1とのように全体的な画素値の変化があっても、図18(a)の振幅画像f1の振幅勾配方向画像f3(図18(a)の下段)と図18(b)の振幅画像f1の振幅勾配方向画像f3(図18(b)の下段)との比較から分かるように、変化しにくい特徴があるので、振幅勾配方向画像f3を用いることによって距離の変化による影響を軽減することができる(図19に示すように、3×3画素をミクロ的に見た例で説明すれば、照明変動があって画素値が変化しても、振幅勾配方向Bは変わりにくい)。
例えば、上述の図10に示すように物体Obである人物の側方に対象空間を照明している照明装置Lが存在している(つまり、物体Obの側方から照射される環境光が存在している)ような状況においては、図20(b)の上側に示した濃淡画像f11の各画素の微分方向値(濃度勾配方向値)を上述のスケールを用いて換算した値を画素値とする図20(b)の下側に示した濃度勾配方向画像f13では顔の特徴量(顔の輪郭、目、鼻、口、頭、額など)のうち認識できない箇所が多くなってしまう。これに対して、図20(a)の上側に示した振幅画像f1の各画素の微分方向値(振幅勾配方向値)を上述のスケールを用いて換算した値を画素値とする図20(a)の下側に示した振幅勾配方向画像f3では顔の特徴量をより認識しやすくなっていることが分かる。要するに、濃淡画像f11を画像処理して得られる濃度勾配方向画像f13は環境光の影響を受けやすいのに対して、振幅画像f1を画像処理して得られる振幅勾配方向画像f3は環境光の影響を受けにくいので、対象物認識部6において安定して対象物を認識することができる。また、振幅勾配方向値θは画像の明るさの影響を受け難いので、上述の振幅勾配方向画像を用いてテンプレートマッチングを行うことで、テンプレート作成モードにおいて光検出素子10により対象空間を撮像してテンプレートを作成するときの対象空間の明るさと、通常動作モード時において光検出素子10により対象空間を撮像して対象物の認識を行うときの対象空間の明るさとが異なっていても、対象空間の明るさの変動の影響を受け難く、振幅画像そのものから特徴量を抽出する場合に比べて、特徴量をより正確に抽出することが可能となる。
なお、上述の特徴量抽出部4において振幅勾配方向値θを求めるにあたっては注目画素p5(図3(a)参照)の8近傍の画素p1〜p4,p6〜p9の画素値a〜d,f〜iを用いてdx(u,v)、dy(u,v)を算出しているが、4近傍や16近傍の画素の画素値を用いて算出することも可能である。また、dx(u,v)およびdy(u,v)から振幅勾配方向値θを求める関数として逆正接関数(tan-1)を採用しているが、他の関数を用いることも可能である。このような関数としては、dx(u,v)とdy(u,v)との比の非線形性を修正して振幅勾配方向値θに線形性が得られる関数が望ましい。