以下、本発明の実施の形態(以下実施形態という)である画像監視装置1について、図面に基づいて説明する。画像監視装置1は、所定の空間(監視空間)が撮影された画像(実画像)を、人や不審物等の前景物体が存在しないときの監視空間を模した三次元モデルから生成した背景画像(模擬画像)と比較することによって、実画像における変化画素(実画像において模擬画像と相違する相違画素)を抽出する本発明に係る画像比較装置の例を含み、相違画素に基づいて人や不審物等の物体を検知して報知する。
[画像監視装置1の構成]
図1は画像監視装置1の概略の構成を示すブロック図である。画像監視装置1は、撮影部2、通信部3、記憶部4、画像処理部5、および報知部6からなる。
撮影部2は監視カメラであり、通信部3を介して画像処理部5と接続され、監視空間を所定の時間間隔で撮影して実画像を生成し、実画像を順次、画像処理部5に入力する撮影手段である。例えば、撮影部2は、監視空間であるイベント会場の一角に設置されたポールに当該監視空間を俯瞰する所定の固定視野を有して設置され、監視空間をフレーム周期1秒で撮影してカラー画像を生成する。なお、撮影部2はカラー画像の代わりにモノクロ画像を生成してもよい。
通信部3は通信回路であり、その一端が画像処理部5に接続され、他端が撮影部2および報知部6と接続される。通信部3は、撮影部2から実画像を取得して画像処理部5に入力し、画像処理部5から入力された検知情報を報知部6に出力する。検知情報は、画像処理部5が検知した物体の種類や検知した領域等を含む情報である。
例えば、撮影部2および報知部6がイベント会場内の監視センターに設置され、通信部3、記憶部4および画像処理部5が遠隔地の画像解析センターに設置される場合、通信部3と撮影部2、および通信部3と報知部6をそれぞれインターネット回線にて接続し、通信部3と画像処理部5はバスで接続する構成とすることができる。その他、例えば各部を同一建屋内に設置する場合は、通信部3と撮影部2を同軸ケーブルまたはLAN(Local Area Network)で接続し、通信部3と報知部6はディスプレイケーブル、通信部3と画像処理部5はバスで接続するなど、各部の設置場所に応じた形態で適宜接続される。
記憶部4は、ROM(Read Only Memory)、RAM(Random Access Memory)等のメモリ装置であり、各種プログラムや各種データを記憶する。記憶部4は画像処理部5と接続されて、画像処理部5との間でこれらの情報を入出力する。
画像処理部5は、CPU(Central Processing Unit)、DSP(Digital Signal Processor)、MCU(Micro Control Unit)等の演算装置で構成される。画像処理部5は、記憶部4からプログラムを読み出して実行することにより各種処理手段・制御手段として動作し、必要に応じて、各種データを記憶部4から読み出し、生成したデータを記憶部4に記憶させる。また、画像処理部5は、通信部3経由で撮影部2から取得した実画像から人や不審物等の物体を検知し、検知した物体に関する検知情報を生成して通信部3に出力させる。
報知部6は、液晶ディスプレイまたはCRT(Cathode Ray Tube)ディスプレイ等のディスプレイ装置であり、通信部3から入力された検知情報に含まれる物体の種類や領域等の情報を表示することによって監視員に報知する。報知部6には、さらに、注意喚起を強調するためにブザーやランプ等を含めることもできる。監視員は表示された検知情報を視認して対処の要否等を判断し、必要に応じて対処員を急行させる等の対処を行う。
なお、本実施形態においては、通信部3と画像処理部5の組に対して撮影部2が1台である画像監視装置1を例示するが、別の実施形態においては、通信部3と画像処理部5の組に対して撮影部2が2台以上接続された構成とすることもできる。その場合、通信部3は各撮影部2から実画像を時分割で受信し、画像処理部5は各撮影部からの実画像を時分割処理または並列処理する。
[画像監視装置1の機能]
図2は画像監視装置1の概略の機能ブロック図である。図2には専ら、通信部3、記憶部4および画像処理部5の機能が示されており、具体的には、通信部3は実画像取得手段30、検知情報出力手段31等として機能し、記憶部4は三次元モデル記憶手段40、模擬画像記憶手段(背景画像記憶手段)41、マップ記憶手段42、カメラ情報記憶手段43等として機能し、画像処理部5は、模擬画像生成手段(背景画像生成手段)50、エッジ抽出手段51、相違画素抽出手段(変化画素抽出手段)52、物体検知手段53等として機能する。
実画像取得手段30は、撮影手段である撮影部2から実画像を順次取得して、取得した実画像をエッジ抽出手段51に順次出力する。
三次元モデル記憶手段40は、撮影部2が撮影する監視空間を構成する複数の構成物の三次元モデルを予め記憶している。
三次元モデルは、建築設計時に作成されたIFC(Industry Foundation Classes)規格の建物情報、三次元CADデータ等あるいは事前の実計測データから取得できる。
構成物は、例えば、壁、床、ドアなどの建築構造物、机や椅子などの什器であり、監視空間を監視する観点において当該監視空間に存在すべきとされる常設物体である。各構成物には当該構成物を識別する識別子を予め付与しておく。また、構成物が複雑な形状を有する場合などには、構成物を構成する面ごとに当該識別子を付与しておく。当該識別子は後述するエッジの識別に用いられ、以降、構造線識別子と称する。なお、構造線識別子は構成物を記述する線要素ごとに付与してもよい。
三次元モデルは、監視空間を模したXYZ座標系における各構成物の位置、姿勢、立体形状にて表される三次元座標値および各構成物の表面の色、テクスチャ、反射特性のデータを含み、これらのデータが対応する構造線識別子と紐付けて記憶されている。
なお、三次元モデルは精密であるほど良く、例えばドアであればドア板とドアノブ、机であれば天板と脚というように色、テクスチャおよび反射特性が異なるパーツそれぞれを構成物と定義して三次元モデルを記憶させておくのが好適である。他方、壁のように大きな構成物は各面の光源からの距離の差が大きくなるため各面を構成物と定義するのが好適である。
また、三次元モデル記憶手段40はさらに当該監視空間の照明モデルも予め記憶している。照明モデルは、監視空間を照明する1以上の光源について、監視空間を模したXYZ座標系における当該光源の位置および当該光源の配光、色温度などで表される照明特性を含む。光源は人工照明や太陽等である。各光源には当該光源を識別する光源番号を予め付与され、位置および照明特性のデータが対応する光源番号と紐付けて記憶されている。照明モデルは、各光源の点消灯状態を設定し、点灯状態が設定された光源の出力を照明特性に演算することにより、監視空間に対する複数の照明条件を模擬できる。
すなわち、三次元モデル記憶手段40は、撮影部2が撮影対象としている所定の空間を構成する複数の構成物それぞれの三次元座標値と各構成物の色、テクスチャ、反射特性、および該空間を照明する光源の照明特性を含んだ環境モデルを記憶している。
カメラ情報記憶手段43は監視空間を模したXYZ座標系における撮影部2のカメラパラメータを予め記憶している。カメラパラメータは外部パラメータと内部パラメータからなる。外部パラメータはXYZ座標系における撮影部2の位置姿勢である。内部パラメータは撮影部2の焦点距離、中心座標、歪係数などである。カメラパラメータは事前のキャリブレーションによって計測され、カメラ情報記憶手段43に記憶される。このカメラパラメータをピンホールカメラモデルに適用することによってXYZ座標系の座標を撮影部2の撮影面を表すxy座標系に変換できる。
模擬画像生成手段50は、三次元モデル記憶手段40から三次元モデル、照明モデルを読み出し、カメラ情報記憶手段43からカメラパラメータを読み出す。そして、カメラパラメータにより求まる撮影部2の撮影面に、照明条件に対応して三次元モデルをレンダリングすることによって、監視空間の背景画像を模擬画像として仮想的に生成し、生成した背景画像を模擬画像記憶手段41に記憶させる。本実施形態では、模擬画像生成手段50は、実画像取得手段30が実画像を取得するタイミングに同期して模擬画像を生成する。
具体的には、まず模擬画像生成手段50は、カメラパラメータからXYZ座標系における撮影部2の撮影面を導出する。次に模擬画像生成手段50は、照明モデルに記憶された位置および照明特性に従った光線データを生成し、光線データの有無や出力を各照明条件に合わせて調整する。続いて模擬画像生成手段50は、構成物での反射による光線データの色や出力の変化を構成物の色、テクスチャ、反射特性に従って調整する。そして模擬画像生成手段50は光源から撮影面に到達する直接光、反射光の光線データを撮影面の各画素値に設定して背景画像を生成する。
また、模擬画像生成手段50は、撮影部2の撮影面に設定する画素値に、光線の反射元である構成物またはその面の構造線識別子を対応付けて模擬画像記憶手段41に記憶させる。
模擬画像記憶手段41は、模擬画像生成手段50が生成した背景画像とその画素に対応付けられた構造線識別子とを記憶している。
エッジ抽出手段51は、実画像および模擬画像のそれぞれから、各画素におけるエッジ方向を少なくとも含むエッジ情報を抽出する。つまり、エッジ抽出手段51は実画像取得手段30から入力された実画像にエッジオペレータを適用して各画素のエッジ情報(実エッジ情報)を抽出し、抽出した実エッジ情報を相違画素抽出手段52に出力する。また、エッジ抽出手段51は、模擬画像記憶手段41から模擬画像を読み出し、読み出した模擬画像にエッジオペレータを適用して各画素のエッジ画像(模擬エッジ情報)を生成し、抽出した模擬エッジ情報を相違画素抽出手段52に出力する。
本実施形態では、エッジ抽出手段51は、実画像および模擬画像それぞれの画素ごとに、エッジ強度とエッジ方向とからなるエッジ情報を算出する。ここで、エッジ方向はエッジ強度の勾配値であり、後述する実エッジパターンおよび模擬エッジパターンの形状をその法線方向で表す情報である。例えば、エッジ方向は0度以上180度未満を値域とする無向な情報とすることができる。また、エッジ方向は0度以上360度未満を値域とする有向な情報としてもよく、この場合は、例えば、道路面にペイントされた白線の輪郭画素であればどの向きに道路面の地をなす黒いアスファルトがあるかというような、近傍の様子をさらに含めた情報とすることができる。また、エッジ方向は、法線方向を表す勾配値を接線方向に変換した値としてもよい。例えば、エッジオペレータとしてソーベルオペレータ(Sobel Operator)、ラプラシアンフィルタ(Laplacian Filter)などを用いることができる。
なお、後述の処理にてエッジ情報としてエッジ方向のみを用いる構成とすることもでき、この場合には、エッジ抽出手段51は、エッジ情報としてエッジ方向のみを出力すれば足りる。
エッジ情報は上述のように画素ごとに求められる。つまり、物体の輪郭線などに対応する画素に限られず、基本的にはエッジオペレータの演算結果として全ての画素についてエッジ情報が算出され定義される。但し、例えば、照明状況によって白飛びや黒つぶれが生じた画像領域などでは、算出されるエッジ情報がノイズまたは信頼性の低い情報となることがある。よって、エッジ強度が閾値TE未満であるエッジ情報は除外することとしてもよい。閾値TEは実験に基づき予め定めることができる。
このように、エッジ抽出手段51は、実画像および模擬画像のそれぞれから、各画素における実エッジ情報および模擬エッジ情報を抽出する。そして、エッジ抽出手段51が抽出するエッジ情報には少なくともエッジ方向を含み、好適にはエッジ抽出手段51が抽出するエッジ情報はエッジ方向とエッジ強度を含む。
各画素のエッジ情報を画像における画素配列に対応させて並べたデータはエッジ画像と称される。そこで、各画素の実エッジ情報を並べたデータを実エッジ画像、各画素の模擬エッジ情報を並べたデータを模擬エッジ画像と称することにする。
相違画素抽出手段52は、実画像の画素のうち、その近傍領域にて実画像と模擬画像とで互いに類似するエッジパターンが検出されないものを相違画素として抽出する。すなわち、実画像の各画素を注目画素として、その近傍領域において、複数の画素の模擬エッジ情報が形成する模擬エッジパターンを求め、実エッジ情報に関し当該模擬エッジパターンと所定基準以上に類似した類似パターンが検出されない注目画素を相違画素とする。実画像と模擬画像との比較を同一座標の画素のみならず当該画素を含む近傍を比較範囲として行うことで、キャリブレーション誤差があっても精度良く相違画素を抽出できる。
ここで、画素単位でエッジ情報の類似を判定すると、本来は相違画素とすべき画素であるにも拘らず、近傍領域内にエッジ情報の類似度の高い画素が現れることもしばしばである。そのため、画素単位で相違を判定すると相違画素が十分に抽出されずに、人や不審物等の前景物体を検出し損ねる場合がある。そこで、実画像と模擬画像とに同一構造線が写っている画素ならばその近傍領域にエッジ情報として表れる輪郭やテクスチャが類似することに着目し、近傍領域において類似するエッジパターンが検出されない画素を相違画素として抽出するのである。
具体的には、実画像中の各画素を注目画素に順次設定して注目画素が相違画素か否かを判定する。模擬エッジパターンは、注目画素を中心とする近傍領域において複数の連続する画素の模擬エッジ情報から形成される形状パターンである。例えば、当該模擬エッジパターンは物体の輪郭線など模擬画像における輝度境界線に対応して得られる。一方、類似パターンか否かの判定対象とされるのは実エッジパターンである。実エッジパターンは、近傍領域内の連続する画素の実エッジ情報から形成される形状パターンであり、例えば、当該実エッジパターンは実画像における輝度境界線に対応して得られる。
本実施形態では、相違画素抽出手段52は、注目画素の近傍領域にて当該注目画素と類似するエッジ情報を有する模擬画像の画素(類似画素)を探索し、類似画素の位置に対応して模擬エッジパターンを生成する。これに対応して、注目画素を含む実エッジパターンが類似パターンとなることが期待できる。よって、ここでは、類似パターンは注目画素を含む実エッジパターンであるとする。
例えば、相違画素抽出手段52は、画素単位のエッジ情報の類似度SPX(画素類似度)が閾値TPX以上である画素を類似画素とする。なお、近傍領域に画素類似度SPXが閾値TPX以上の画素が複数含まれる場合は、画素類似度SPXが最も高い画素を類似画素とする。画素類似度SPXは例えば、次式で定義する。
ここで、SPX(・)が画素類似度であり、iは注目画素を表し、bは近傍領域内の画素を表す。また、mi,mbはそれぞれ画素i,bのエッジ強度であり、di,dbはそれぞれ画素i,bのエッジ方向であり、λはエッジ強度の差とエッジ方向の差との画素類似度への寄与を調整する調整係数、M(・)はエッジ強度の差、D(・)はエッジ方向の差である。
近傍領域は、生じ得るキャリブレーション誤差の上限とエッジパターンの上限サイズとを見積もって、見積もった上限値に応じた広さに予め設定する。エッジパターンの上限サイズにはキャリブレーション誤差に回転成分が含まれても対応可能とする意義がある。例えば、キャリブレーション誤差の上限を±2画素(5×5画素の領域)、エッジパターンの上限サイズ±4画素(9×9画素の領域)と見積もった場合、近傍領域は13×13画素の領域と設定される。
ここで、注目画素を基準に固定的に13×13画素の近傍領域を設定してもよいが、本実施形態においては、注目画素を基準に5×5画素の領域を設定して当該領域内でエッジパターンの中央を決定し、決定したエッジパターンの中央を基準に9×9画素の領域を設定する、というように動的に近傍領域を設定することで処理量を削減する。
つまり、類似画素の探索はキャリブレーション誤差の見積もりに応じた範囲で行い、エッジパターンの抽出は類似画素を基準としてエッジパターンの最大サイズの範囲で行うことにより処理負荷を減じることができる。
このように、相違画素抽出手段52は、近傍領域よりも狭く予め定めた大きさで注目画素の周りに設定した領域(探索領域)にて、当該注目画素の実エッジ情報と最も類似する模擬エッジ情報を有する類似画素を探索し、当該類似画素を含む模擬エッジパターンを用いて類似パターンを検出する構成とすることができる。
なお、実画像の画素ごとに、撮影部2から当該画素に写る被写体までの距離が遠いほど狭く、撮影部2から当該画素に写る被写体までの距離が近いほど広い近傍領域を設定してもよい。
上述したように本実施形態では、類似パターンは注目画素を含む実エッジパターンであるとしている。さらにここで、類似パターンの候補となる実エッジパターンは、模擬エッジパターンと同じ画素配置パターンを有するとし、当該実エッジパターンの模擬エッジパターンに対する類似度が閾値以上であれば、当該実エッジパターンは類似パターンであるとする。
具体的には、類似パターンの検出は、次式に従い模擬エッジパターンと実エッジパターンとの類似度(パターン類似度)SPTを算出して、パターン類似度SPTを閾値TPTと比較し、SPT≧TPTである実エッジパターンを注目画素に対応して得られた模擬エッジパターンの類似パターンと判定する。
ここで、SPT(・)はパターン類似度、PBは模擬エッジパターン、PIは実エッジパターン、Tは模擬エッジパターン(または実エッジパターン)を形成する画素の数、D(・)はエッジ方向の差であり、pB i,pI iはそれぞれ模擬エッジパターン、実エッジパターンを形成する画素のうちi番目の画素のエッジ方向を表す。なお、模擬エッジパターンと実エッジパターンとは上述のように同じ画素配置パターンであり、それぞれにおけるインデックスiが同じ画素は当該画素配置パターンにて同じ位置にある。
類似パターンの検出処理の結果、類似パターンが検出されない場合は、注目画素を相違画素と判定する。一方、類似パターンが検出された場合は、注目画素は背景画像の画素と同定され、模擬エッジパターンと類似パターンとの位置関係から、実画像での注目画素とこれに対応する模擬画像の画素(対応画素)との位置関係が求まる。なお、本実施形態では、類似パターンは注目画素を含み模擬エッジパターンと同じ画素配置パターンとしており、この場合、類似画素が対応画素となる。
物体の輪郭線など、画像における輝度境界線に対応して実エッジパターン、模擬エッジパターンを定義する場合、そのエッジ強度は輝度境界線が存在しない画素におけるエッジ強度より基本的には大きくなることが期待できる。しかし、その場合であっても実エッジ情報では、既に述べた汚れや微小な凹凸といった種々の要因によりエッジ強度が変動しやすく、かすれや途切れが生じやすいという特徴がある。一方、模擬エッジ情報ではそのような要因が捨象され、かすれや途切れが生じにくいという特徴がある。この差異のため、パターン類似度SPTをエッジ強度成分を含めて定義すると不安定な尺度となる。一方、形状の特徴はエッジ方向で表すことができる。そこで、上式に示したように、エッジ方向の差に応じたパターン類似度SPTを用いている。
また、当該特徴ゆえに、類似パターン検出に用いるリファレンスのエッジパターンを模擬エッジ情報から生成することによって、かすれや途切れの影響を受けにくい類似パターンの検出を可能にする。
また、エッジ方向についても、それが大きく変化する輝度境界線は別々の物体の輪郭線が組み合わさったものである可能性が高くなり、それら物体の位置関係の変化やレンダリングにおける視線方向のわずかな差などにより、パターン類似度SPTが影響を受けることが起こり得る。よって、輝度境界線に対応する模擬エッジパターンを構成する連続画素は、模擬エッジ情報中のエッジ方向が類似する範囲にするのがよい。
つまり、模擬エッジ情報中のエッジ方向が類似する連続画素を模擬エッジパターンとして抽出し、実エッジ画像中の注目画素の位置に当該模擬エッジパターンと類似する類似パターンが現れているか否かを判定するのがよい。
このように、相違画素抽出手段52は、近傍領域において、模擬画像における輝度境界線に沿って並び(模擬エッジ情報が表す輝度境界線に沿って並び)、且つ模擬エッジ情報におけるエッジ方向が類似する複数の画素から形成される模擬エッジパターンを抽出し、当該模擬エッジパターンを用いて類似パターンを検出する。
更には、相違画素抽出手段52は、模擬画像に含まれる構造線識別子を利用し、同一の構造線識別子が付与された画素の模擬エッジ情報から模擬エッジパターンを生成することにより、複数の構造線が入り混じった形状パターンの生成を防ぎ、誤って相違画素として抽出される可能性を減ずることができる。すなわち、相違画素抽出手段52は、近傍領域において構造線識別子が同一である複数の画素の模擬エッジ情報から形成される模擬エッジパターンを用いて類似パターンを検出することで相違画素の抽出精度を向上させることができる。
また、実画像中の人や不審物などの前景物体が注目画素に設定された場合は、前景物体の現れた領域が近傍領域に設定され、当該領域では背景のエッジ情報が隠れるため、近傍領域中に注目画素の実エッジ情報と類似する模擬エッジ情報がそもそも検出されないことも多く、エッジパターンの比較を行うまでもなく画素単位の比較で足りる場合もしばしばである。
そこで、相違画素抽出手段52は、エッジパターンの比較の前に、画素類似度SPXを算出して閾値TPXと比較し、画素類似度SPXが閾値TPX未満である画素(非類似画素)を相違画素と判定することにより処理負荷を減じることができる。つまり、相違画素抽出手段52は、類似画素を探索する領域(近傍領域または探索領域)内にて注目画素の実エッジ情報と類似する画素が検出されない場合に、当該注目画素を相違画素として抽出する。
また、上述のように、実画像にて前景物体が現れた領域では背景のエッジ情報が隠れるので、実画像の画素が模擬画像の画素と同定されることは起こらないことが期待されるところ、無関係な位置にある実画像の画素と模擬画像の画素との間にて偶然にエッジ情報が類似して、本来、類似画素や対応画素とすべきではない画素を類似画素や対応画素としてしまう可能性は上昇する。そこで、相違画素抽出手段52は、過去の対応画素の情報をマップ記憶手段42に記憶させておき、これを再利用することで対応画素の特定の精度向上、および相違画素の抽出精度の向上を図る。
マップ記憶手段42は、実画像の画素と、模擬画像において当該画素に対応する対応画素との位置関係を記憶する。例えば、実画像の画素ごとに、対応画素の座標、または実画像の画素の座標に対する対応画素の相対座標が記憶される。
具体的には、実エッジ画像において模擬エッジパターンに対する類似パターンが検出されたときの注目画素と、当該模擬エッジパターンを形成する画素であり注目画素との画素類似度が最も高い画素との位置関係をマップ記憶手段42に記憶させることができる。
マップ記憶手段42に記憶される当該位置関係は実画像と模擬画像との画素単位のズレ量を表す。換言すると当該位置関係は実画像と模擬画像とのキャリブレーション誤差に相当する。
上述のように、相違画素抽出手段52が当該位置関係をマップ記憶手段42に記憶させる構成とすることができる。一方、相違画素抽出手段52はこれらの位置関係を読み出して利用する。つまり、相違画素抽出手段52は、撮影部2が取得する時系列の実画像を順次、模擬画像と比較する処理において、類似パターンが検出された注目画素を模擬画像の画素と同定して、それら同一とされた画素同士の位置関係をマップ記憶手段42に記憶させ、新たに比較する実画像における注目画素のうちマップ記憶手段42に位置関係が記憶されているものについては、当該位置関係をなす模擬画像の画素を含む模擬エッジパターンを用いて類似パターンを検出する。
以下、図3〜図6を用いて、画像監視装置1による処理の一例を具体的に説明する。図3は実エッジ画像および模擬エッジ画像の例を示す模式図であり、図3(a)に示す実エッジ画像100には実エッジパターンの例として実エッジ101,102を示している。具体的には、実エッジ101,102は実線上の画素において、有効な実エッジ情報を抽出されている。一方、点線で示す部分の画素では有効な実エッジ情報が抽出されず、実エッジ101の一部はかすれている。図3(a)には実エッジ画像100として、注目画素110を中心とする13×13画素の近傍領域を示している。
図3(b)に示す模擬エッジ画像200には模擬エッジパターンの例として模擬エッジ201,202を示している。具体的には、模擬エッジ201,202は実線上の画素において、有効な模擬エッジ情報を抽出されている。なお、模擬エッジ201,202にはかすれは生じていない。図3(b)には模擬エッジ画像200として、図3(a)の実エッジ画像100と撮影面での座標が同じ範囲、つまり注目画素110の近傍領域と同じ13×13画素の領域が示されている。
図4は、図3(b)の模擬エッジ画像200に設定する類似画素の探索領域の例を示す模式図である。模擬エッジ画像200上で注目画素210を中心に5×5画素の探索領域211を設定し、探索領域211から類似画素212が検出されている。なお、図4には、図3(b)の模擬エッジ201,202が実線で示され、図3(a)の実エッジ101,102が一点鎖線で示されている。
図5は模擬エッジパターンの抽出処理を説明するための模式図である。図5(a)の模擬エッジ画像200には、類似画素212を中心とする9×9画素のパターン抽出窓220が示されている。図5(b)は模擬画像記憶手段41に記憶されている構造線識別子の模式図であり、模擬画像300の画素に対応付けて構造線識別子を示している。模擬画像300として、実エッジ画像100および模擬エッジ画像200と同じ近傍領域を示しており、模擬エッジ201と対応する画素に構造線識別子「2」、模擬エッジ202と対応する画素に構造線識別子「1」が定義されている。
相違画素抽出手段52は、パターン抽出窓220内から模擬エッジパターンを求める。ここでは、模擬エッジパターンを、同一の構造線識別子が付与された画素の模擬エッジ情報から生成する例を示しており、相違画素抽出手段52は、類似画素212と同一の構造線識別子「2」が設定された画素のうちパターン抽出窓220内の画素からなるパターン310を抽出する。この構造線識別子に基づくパターン310と対応して模擬エッジ画像200から模擬エッジパターン230が抽出される。模擬エッジパターン230のデータは、当該パターンを構成する各画素のエッジ方向の情報を例えば、画素の並びに沿って配列したベクトル表現231とすることができる。
図6は模擬エッジパターン230に対応して設定された実エッジパターンを示す模式図である。実エッジ画像100に示す領域130は、模擬エッジパターン230における画素配置のパターンを、パターン230における類似画素212の位置が注目画素110に一致するように平行移動させたものである。ここで示す例では、当該領域130により実エッジパターン131を生成する。実エッジパターン131のデータのベクトル表現132は、模擬エッジパターンのベクトル表現231と同様に定義される。
相違画素抽出手段52は、ベクトル表現231の模擬エッジパターン230とベクトル表現132の実エッジパターン131とに対して(4)式、(5)式を適用してパターン類似度SPTを算出し、SPT≧TPTであれば実エッジパターン131を、注目画素に対応して得られた模擬エッジパターン230の類似パターンと判定する。
ここで、類似パターン抽出に用いるリファレンスのエッジパターンの他の生成方法について図7に示す模式図を用いて述べる。
例えば、リファレンスのエッジパターンとして、構造線識別子が異なる画素を含む模擬エッジパターンを用いる構成が考えられる。図7(a)は、図3〜図6に示した実エッジ画像100、模擬エッジ画像200、模擬画像300の例に、当該構成を適用して得られた実エッジパターンの領域140を示している。領域140の画素配置パターンは、図5の類似画素212を中心とする9×9画素のパターン抽出窓220内における、構造線識別子「2」および「1」の画素からなる模擬エッジパターンの画素配置パターンと同一とされる。図5の実画像100における実エッジ101(又は注目画素110)に対する実エッジ102の位置が、模擬エッジ画像200における模擬エッジ201(又は類似画素212)に対する模擬エッジ202の位置からずれているため、実エッジ102が領域140から外れている。
上述のように模擬エッジパターンをリファレンスに用いる構成には、かすれや途切れの影響を受けにくいという特長があり、複数の構造線識別子を含む模擬エッジパターンをリファレンスに用いる場合も当該特長が得られる。一方、複数の構造線識別子を含む模擬エッジパターンにおいては、構造線識別子が異なるエッジ同士の位置関係の変化などが起こることがあり、それに起因してパターン類似度SPTが低下し、相違画素の誤抽出、過剰抽出が生じ易くなる。この点で、リファレンスの模擬エッジパターンに含まれる構造線識別子の種類は少ない方がよく、上述した同一の構造線識別子の画素からなる模擬エッジパターンが好適である。
図7(b)は、実画像100からリファレンスのエッジパターンを生成する構成の問題点を説明する模式図である。上述したように実エッジ101はかすれている。このようにかすれ等の影響で、注目画素110に対応して設定される実エッジパターンの領域140は図7(b)に示すように小さくなり、前景のエッジと偶然に一致する可能性が高まる。この点で上述したように模擬エッジパターンに基づいてリファレンスを生成する方法が好適である。
物体検知手段53は、相違画素が監視対象の物体によるものか否かを判定し、監視対象の物体によるものと判定した場合に監視対象の物体を検知した旨を表す検知情報を生成し、生成した検知情報を検知情報出力手段31に出力する。
例えば、物体検知手段53は、互いの近傍(例えば8近傍)に抽出された相違画素を同一物体によるものとしてラベル付けするラベリング処理を行う。そして、ラベルごとの相違画素の実エッジ情報を抽出した相違エッジ画像と、人の形状を模した人形状モデルとのパターンマッチングを行い、一致度が所定値以上であるラベルの相違画素を人によるものと判定する。または、このパターンマッチングに代えて機械学習した識別器を用いる構成とすることもできる。この場合、物体検知手段53は、例えば上記各ラベルの外接矩形を設定し、当該外接矩形と重複を有する識別窓を設定する。そして、識別窓内の実画像を、予め人の画像特徴を学習した人識別器に入力して、人と識別された識別窓内の相違画素を人によるものと判定し、人と識別された識別窓が無かったラベルを不審物によるものと判定する。
検知情報出力手段31は物体検知手段53から入力された検知情報を報知部6に出力する。
[画像監視装置1の動作]
図8は画像監視装置1の概略の動作のフロー図である。
通信部3は実画像取得手段30として動作し、撮影部2から実画像を順次取得する(ステップS1)。
画像処理部5は、実画像取得手段30から実画像を取得するごとに、模擬画像生成手段50として動作し、模擬画像を生成する(ステップS2)。これにより、実画像の撮影時刻から推定される日照状態や、撮影時刻における照明スイッチの状態などから把握される人工照明の点消灯状態に応じた模擬画像を生成することが可能である。また、撮影部2の視野が変化する場合には、それに対応した模擬画像を生成することができる。模擬画像生成手段50は生成した背景画像を模擬画像記憶手段41に記憶させる。
また、画像処理部5は実画像取得手段30から実画像を取得するごとに、エッジ抽出手段51として動作し、実画像から実エッジ画像を生成すると共に(ステップS3)、当該実画像の取得に対応して生成された模擬画像を模擬画像記憶手段41から読み出して当該模擬画像から模擬エッジ画像を生成する(ステップS4)。
次に、画像処理部5は相違画素抽出手段52として動作し、ステップS3にて生成された実エッジ画像と、ステップS4にて生成された模擬エッジ画像とに基づいて相違画素を抽出する(ステップS5)。
図9は相違画素抽出処理S5の概略のフロー図である。相違画素抽出手段52は実画像の各画素を順次、注目画素として設定する(ステップS10)。ここで、実画像と模擬画像との間にはキャリブレーション誤差が存在し得るため、実画像の注目画素が模擬画像では異なる位置の画素に対応し得る。これに関し、過去に取得された実画像に対する相違画素抽出処理にて、注目画素に対応する模擬画像の対応画素の位置がマップ記憶手段42に記憶されている可能性がある。そこで、相違画素抽出手段52は、マップ記憶手段42に対応画素の情報があるか否かを確認し(ステップS12)、当該情報が記録されていない場合には(ステップS12にて「NO」の場合)、模擬画像にて注目画素と類似するエッジ情報を有する類似画素を探索する(ステップS14)。
類似画素の探索は注目画素の近傍にて行われる。本実施形態では、注目画素を中心にしてキャリブレーション誤差の上限に応じた大きさの探索領域を設定し、当該探索領域内にて類似画素を探す。例えば、探索領域は既に述べたように5×5画素の矩形領域とする。
探索の結果、模擬画像に類似画素が見つからなかった場合(ステップS16にて「NO」の場合)、相違画素抽出手段52は注目画素を背景(模擬画像)の画素ではないとして相違画素と判定する(ステップS18)。例えば、ステップS18にて相違画素と判定される例として、注目画素が実画像に現れた輝度境界線(物体輪郭など)に位置し大きな強度のエッジをなすのに対し、探索領域の模擬画像にそれに相当するエッジが存在しない場合がある。
一方、探索の結果、模擬画像に類似画素が検出された場合(ステップS16にて「YES」の場合)、相違画素抽出手段52は模擬画像記憶手段41から構造線識別子の情報を取得し(ステップS20)、類似画素と同一の構造線識別子が付与された画素の模擬エッジ情報から模擬エッジパターンを生成する(ステップS22)。例えば、相違画素抽出手段52は、模擬エッジパターンとして、類似画素を含む複数の画素であって、模擬画像に現れた輝度境界線に沿って並び、且つ構造線識別子が共通である互いに隣接した画素群についての配置およびエッジ方向を求める。なお、構造線識別子が同一という条件に代えて、または当該条件に加えて、模擬エッジパターンをなす互いに隣接した複数の画素におけるエッジ方向の変動範囲が所定の閾値以下である、または隣接画素間でのエッジ方向の差が所定の閾値以下であるという条件を課して模擬エッジパターンを定めてもよい。閾値は90度未満とすることが好適であり、例えば45度とすることができる。
相違画素抽出手段52は、ステップS22にて類似画素に対応して模擬エッジパターンを生成すると、次に、実エッジ画像における実エッジパターンの中に当該模擬エッジパターンに類似するものである類似パターンが存在するかを調べる(ステップS24)。本実施形態では、実エッジパターンは、模擬エッジパターンと同じ画素配置パターンを、模擬エッジパターン内の類似画素の位置が注目画素に重なるように配置したものであるとし、当該実エッジパターンに対して上記の(4)式、(5)式で定義するパターン類似度SPTを算出し、SPTが閾値TPT以上であれば当該実エッジパターンを類似パターンと判定し、SPTが閾値TPT未満であれば類似パターンはないと判定する。
類似パターンが存在すれば(ステップS24にて「YES」の場合)、相違画素抽出手段52はステップS14にて得られた類似画素をステップS10にて設定された注目画素の対応画素と判定し(ステップS26)、マップ記憶手段42に、当該注目画素に関する対応画素情報として当該対応画素の位置を記録する(ステップS28)。
一方、類似パターンがないと判定した場合(ステップS24にて「NO」の場合)、相違画素抽出手段52は、注目画素を相違画素であると判定する(ステップS18)。
このように、ステップS16にて実画像の注目画素に対し模擬画像に類似画素が見つかっても、この1画素のエッジ情報のみを以て直ちに注目画素が相違画素ではないと判断するのではなく、複数の画素からなるエッジパターンでの比較をさらに行って相違画素であるか否かを判断することにより、精度の高い相違画素検出が可能となる。
さて、上述のように対応画素情報の記録(ステップS28)を行うので、ステップS10にて設定された注目画素について対応画素情報が存在する場合がある(ステップS12にて「YES」の場合)。この場合は、相違画素抽出手段52は、対応画素情報をマップ記憶手段42から取得することで(ステップS30)、類似画素の探索に関する処理(ステップS14,S16)を省略して、エッジパターンでの比較処理(ステップS20〜S24)に進み、相違画素であるか対応画素であるかを判定する(ステップS18,S26)。これにより処理負荷の軽減、処理時間の短縮が図られる。
ちなみに、この場合は、対応画素に対応して模擬エッジパターンが生成される。すなわち、相違画素抽出手段52は模擬画像記憶手段41から構造線識別子の情報を取得し(ステップS20)、対応画素と同一の構造線識別子が付与された画素の模擬エッジ情報から模擬エッジパターンを生成する(ステップS22)。
以上の処理S10〜S30を実画像の各画素について繰り返し(ステップS32にて「NO」の場合)、実画像の全画素について処理が終わると(ステップS32にて「YES」の場合)、相違画素抽出手段52は図8のステップS6に処理を進める。
画像処理部5はステップS5にて相違画素が抽出された場合には(ステップS6にて「YES」の場合)、物体検知手段53として動作し、当該相違画素が監視対象の物体によるものか否かを判定する物体認識処理を行う(ステップS7)。そして、監視対象の物体によるものと判定した場合には、監視対象の物体を検知した旨を表す検知情報を生成し、生成した検知情報を検知情報出力手段31に出力する。
通信部3は物体検知手段53からの検知情報を受けて検知情報出力手段31として動作し、当該検知情報を報知部6に出力する(ステップS8)。
画像監視装置1は実画像を取得するごとに上述のステップS1〜S8の処理を繰り返す。なお、ステップS5にて相違画素が抽出されなかった場合には(ステップS6にて「NO」の場合)、ステップS7,S8は省略して次の実画像の処理に移る。
[変形例]
(1)上述の実施形態では、前景物体が存在しないときの監視空間を模した三次元モデルから生成した模擬画像、すなわち背景画像の模擬画像を実画像と比較する例を示したが、模擬画像はこれに限らない。例えば、模擬画像は、消火器などの監視対象物のモデルを含めた三次元モデルから生成したものとしてもよい。本発明に係る画像比較装置は、当該模擬画像と実画像とを比較し、相違画素に基づいて監視対象物の持ち去りや移動を検知する用途に利用できる。
また、模擬画像は、車両などの識別対象物の三次元モデルから生成したものとしてもよい。本発明に係る画像比較装置は、当該模擬画像と実画像とを比較し、相違画素に基づいて識別対象物を同定または検索する用途に利用できる。
また、模擬画像は、工場生産品などの検査対象物の三次元モデルから生成したものとしてもよい。本発明に係る画像比較装置は、当該模擬画像と実画像とを比較し、相違画素に基づいて検査対象物の傷の有無等を検査する用途に利用できる。
(2)上述の実施形態では、実エッジパターン、模擬エッジパターンとして、物体の輪郭線など実画像、模擬画像における輝度境界線に対応して得られる形状パターンを用いて説明したが、本発明におけるエッジパターンはそのような形状パターンに限られない。エッジ情報は上述したように、物体の輪郭線などに対応する画素に限られず、基本的にはエッジオペレータの演算結果として全ての画素について得られる。よって、一般的に、エッジパターンは複数画素からなる領域におけるエッジ情報の集合と定義することができる。
よって、実画像における注目画素が輪郭線などを構成するものでなくても、本発明を適用することができる。
(3)上述の実施形態では、模擬エッジパターンとして類似画素を通る形状パターンを生成したが、模擬エッジパターンは類似画素の近傍を通る輪郭線等の形状パターンとしてもよい。例えば、模擬エッジ画像にて類似画素の近くに当該類似画素よりも大きなエッジ強度を有する形状パターンが存在するような場合に、その類似画素の近くにて得られる形状パターンを模擬エッジパターンとする。この場合、例えば、上述の実施形態と同様、実エッジパターンとして模擬エッジパターンと同じ画素配置パターンを仮定する構成では、実エッジパターンは、注目画素と類似画素との位置関係に応じて模擬エッジパターンを平行移動して設定すればよい。つまり、実エッジパターンは注目画素を含まず、その近傍に設定され得る。
(4)上述の実施形態では、実エッジパターンとして、模擬エッジパターンである形状パターンと同じ画素配置パターンを仮定したが、実エッジパターンは模擬エッジパターンとは独立して抽出してもよい。つまり、類似画素を起点として模擬エッジが伸びる方向に画素を連ねて模擬エッジパターンを抽出したのと同様に、注目画素を起点として実エッジが伸びる方向に画素を連ねて実エッジパターンを抽出し、当該実エッジパターンの画素におけるエッジ情報と模擬エッジパターンの画素におけるエッジ情報とを比較して当該実エッジパターンが模擬エッジパターンの類似パターンであるかを判定する構成とすることができる。
(5)上述の実施形態では、撮影部2の視野は固定としているが可変であってもよい。すなわち、撮影部2が走査機構を備え撮影方向を変化させたり、ズーム機構を備え画角を変化させたりするものであってもよい。