JP5290227B2

JP5290227B2 - 対象物検知装置及びその学習装置

Info

Publication number: JP5290227B2
Application number: JP2010077798A
Authority: JP
Inventors: 高晴黒川
Original assignee: Secom Co Ltd
Current assignee: Secom Co Ltd
Priority date: 2010-03-30
Filing date: 2010-03-30
Publication date: 2013-09-18
Anticipated expiration: 2030-03-30
Also published as: JP2011210054A

Description

本発明は、入力画像に現れる対象物を検知する対象物検知装置、及びその学習に用いる学習装置に関する。

近年、監視カメラの画像やデジタルスチルカメラの画像から人や顔などの存在を検知する研究が盛んに行われている。検知処理には、パターンマッチング装置や識別器による探索的手法が用いられる。すなわち、画像内の各所に窓を設定して各窓画像をパターンマッチング装置や識別器に入力し、これらが出力する検出結果を集計して集計値が高い位置に対象物を検知する。

画像中の対象物はその対象物の全体像が撮像されているとは限らず、対象物の一部分が他の物体に隠蔽されている場合もある。一部隠蔽状態にある対象物を検知するために、従来、対象物の複数の特徴点を検出し、これら特徴点の検出結果を統合判定することが行なわれている。

例えば、特許文献１に記載の従来技術では、対象物の標本画像について複数の特徴点と当該特徴点の位置に対する当該標本画像の基準点の位置（相対位置）とを予め学習しておき、入力画像から検出された特徴点から見た相対位置に投票を行い、入力画像内にて当該投票の集計値が閾値を超えると対象物が存在すると判定する。つまり、複数の特徴点が標本画像においてと同じ位置関係で検出されるとそれらの特徴点からの投票が入力画像内にて１個所に集まり、投票の集計値が閾値を超えて対象物が検知されるのである。

特開平９−２１６１０号公報

特徴点には、基準点との相対位置がばらつきやすいものとそうでないものがある。例えば、対象物が人である場合、頭部は可動域が小さいため頭部周辺の特徴点と基準点との相対位置のばらつきは比較的小さいが、脚部は可動域が大きいため脚部周辺の特徴点と基準点との相対位置は大きくばらつく。

このことは、ばらつきの小さな特徴点に係る投票は１箇所に集まりやすいが、ばらつきの大きな特徴点に係る投票は１箇所に集まりにくいことを意味する。そのため、これらの特徴点を一律に投票すると、検知漏れが起こりやすくなるという問題があった。

本発明は上記問題点を解決するためになされたものであり、特徴点と基準点との相対位置のばらつきやすさによる投票の格差が是正され、対象物を高精度に検知できる対象物検知装置、及び当該対象物検知装置の構築に用いる学習装置を提供することを目的とする。

本発明に係る対象物検知装置は、入力画像に現れる対象物を検知するものであって、予め設定された前記対象物を撮影した対象物体像の特徴を示す画像特徴を有する複数の特徴点ごとに、前記対象物体像における所定の基準点と特徴点との相対位置と、当該相対位置のばらつき度とを含む特徴点情報を記憶した記憶部と、前記入力画像の中から前記特徴点を検出する特徴点検出部と、前記特徴点検出部にて検出された特徴点について、前記入力画像における当該特徴点の位置との相対位置を中心に前記ばらつき度に応じた距離特性にて投票値を算出する投票部と、前記投票値を前記入力画像における各位置において集計して対象物の存在を判定する対象物判定部と、を有する。

他の本発明に係る対象物検知装置においては、前記投票部の前記距離特性が、前記ばらつき度が大きいほど前記中心からの投票位置の距離範囲を広くするものである。

さらに他の本発明に係る対象物検知装置においては、前記投票部の前記距離特性が、前記ばらつき度が大きいほど前記中心から離れる距離に応じて前記投票値を緩やかに減衰させるものである。

本発明に係る学習装置は、上記対象物検知装置に用いる前記特徴点情報を生成するものであって、前記対象物が撮された複数の標本画像を格納されている標本画像記憶部と、前記各標本画像から所定の画像特徴を有する標本特徴点を抽出する標本特徴点抽出部と、前記標本画像相互間にて位置及び前記画像特徴が類似する前記標本特徴点からなるクラスタを生成するクラスタリング部と、前記クラスタごとに、統計分析により前記標本特徴点の位置の分布に関する標本分布の情報を求め、さらに、前記標本画像における所定の基準点の、前記標本分布における所定の代表位置からの相対位置である標本相対位置を求め、当該クラスタごとの前記標本分布の情報及び前記標本相対位置を前記特徴点分布の情報及び前記相対位置とした前記特徴点情報を生成する特徴点情報生成部と、を有する。

本発明に係る対象物検知装置によれば、特徴点のばらつきやすさによる投票の格差が是正され、対象物を高精度に検知できるようになり、また本発明に係る学習装置によれば、当該対象物検知装置の構築が可能となる。

本発明の実施形態に係る対象物検知装置の概略の構成を示すブロック図である。対象物標本画像の一例を示す模式図である。特徴点の例について特徴点情報の一部のパラメータを対象物標本画像に対応する二次元領域上にて模式的に表現した模式図である。特徴点情報を構成するパラメータ群を表形式に表した模式図である。入力画像にて検出された特徴点の例を示す模式図である。同一の対象物に検出された複数の特徴点について投票の様子を例示する模式図である。対象物判定処理の様子を説明するための図である。本発明の実施形態に係る対象物検知装置の概略の動作を示すフロー図である。特徴点検出処理及び投票処理の概略のフロー図である。対象物判定処理の概略のフロー図である。本発明の実施形態に係る学習装置の概略の構成を示すブロック図である。標本点とクラスタとの関係を示す模式図である。本発明の実施形態に係る学習装置の概略の動作を示すフロー図である。

以下、本発明の実施の形態（以下実施形態という）である対象物検知装置１、及び学習装置２について、図面に基づいて説明する。対象物検知装置１は、例えば、監視空間から得られた監視画像等を入力画像とし、当該入力画像に現れる対象物を検知する。本実施形態は人を対象物とし、監視空間から得られた監視画像において、人の特徴点を検出することで侵入者を検知し、侵入者を検知すると異常信号を出力する。学習装置２は、対象物検知装置１に用いる特徴点情報を学習により生成する。

［対象物検知装置］
図１は、実施形態に係る対象物検知装置１の概略の構成を示すブロック図である。対象物検知装置１は、撮像部１０、画像取得部１１、検知記憶部１２、特徴点情報設定部１３、検知制御部１４及び検知出力部１５を含んで構成される。画像取得部１１は撮像部１０と接続され、画像取得部１１、検知記憶部１２、特徴点情報設定部１３及び検知出力部１５は検知制御部１４と接続される。

撮像部１０は監視カメラであり、監視空間内に設置される。例えば、監視カメラは監視空間の天井部に監視空間を俯瞰して設置される。当該監視カメラは、監視空間を所定の時間間隔（例えば１秒）で撮影し、各画素が多階調の画素値で表現される監視画像を順次、出力する。

画像取得部１１は、撮像部１０により撮影された監視画像を取得して検知制御部１４に取り込むインターフェース回路である。以下、画像取得部１１から検知制御部１４に入力される画像を入力画像と称する。

検知記憶部１２は、ＲＯＭ（Read Only Memory）、ＲＡＭ（Random Access Memory）、ハードディスク等の記憶装置であり、検知制御部１４で使用されるプログラムやデータを記憶する。検知記憶部１２はこれらプログラム、データを検知制御部１４との間で入出力する。検知記憶部１２に記憶されるデータには、特徴点情報１２０、投票画像１２１が含まれる。

特徴点情報１２０は、対象物の画像特徴を有する複数の特徴点ごとに、特徴点を識別する特徴点番号、対象物画像における重心位置等の基準点位置と特徴点位置との相対位置、入力画像から特徴点を検出するための検出基準、及び相対位置のばらつき度から構成されている。

この特徴点情報１２０は、対象物が撮像された多数の対象物標本画像を基に、後述する学習装置２によって予め生成される。

図２は、対象物標本画像の一例を示す模式図である。本実施形態では検知対象物は人であり、対象物標本画像は人の全体画像である。各対象物標本画像は、人の形状に合わせて幅（水平）方向６４ピクセル×高さ（垂直）方向１２８ピクセルの縦長の矩形に規格化され、その重心座標（３２，６４）を対象物基準点Ｂと定める。

図３は、特徴点の例について特徴点情報１２０の一部のパラメータを対象物標本画像に対応する二次元領域上にて模式的に表現した模式図であり、図３（ａ）〜（ｃ）はそれぞれ異なる特徴点に対応する。また、図４は、特徴点情報１２０を構成するパラメータ群を表形式に表した模式図である。図３，図４を参照して特徴点情報１２０を構成する各パラメータを説明する。ここで、設定されている特徴点の数はＭ（＞１）個とし、各特徴点には１〜Ｍの特徴点番号（特徴点＃）を通しで付与する。Ｍ個の特徴点の位置（図３にて“×”印）はそれぞれ異なり、特徴点＃１〜＃Ｍのそれぞれについてその位置から対象物基準点ＢへのベクトルＲ_１〜Ｒ_Ｍが当該特徴点の相対位置として、特徴点情報１２０に記憶されている。また特徴点情報１２０には、Ｍ個の特徴点の検出基準として、特徴点＃１〜＃Ｍのそれぞれの位置における対象物標本画像の特徴量を表すＮ次元のベクトルＡ_１〜Ａ_Ｍが記憶されている。

特徴量は公知のシェイプコンテキスト（Shape Context）やヒストグラム・オブ・オリエンティッド・グラディエント（ＨＯＧ：Histograms of Oriented Gradients；Navneet Dalal and Bill Triggs，“Histograms of Oriented Gradients for Human Detection”，In Proceedings of IEEE Conference Computer Vision and Pattern Recognition 2005）等である。

シェイプコンテキストは特徴点周辺におけるエッジの分布特性を表す特徴量であり、データはベクトル形式である。シェイプコンテキストは特徴点を中心に設定された分析窓内の画像を分析して算出され、そのベクトルの各要素のインデックスは分析窓内を複数に分割した小領域と量子化されたエッジ方向との組み合わせに対応し、各要素の値はインデックスが表す小領域においてインデックスが表すエッジ方向を有するエッジの強度の和に対応する。ＨＯＧも特徴点周辺における輝度微分値の分布特性を表すベクトル量である。シェイプコンテキストもＨＯＧも、特徴点周辺における輝度勾配の分布特性を表しており、照明変動に頑強であることから対象物の検知に適している。

Ｍ個の特徴点のばらつき度も各特徴点ごとに異なり得る特徴量であり、特徴点＃１〜＃Ｍのそれぞれについてそのばらつき度Ｖ_１〜Ｖ_Ｍが特徴点情報１２０として記憶されている。本実施形態では、ばらつき度は特徴点位置と基準点位置との相対位置に関する学習した複数の標本画像における分散値である。ばらつき度はｘ方向（水平方向）の成分ｖｘと、ｙ方向（垂直方向）の成分ｖｙとを有している。図３にて特徴点を中心とする実線の楕円は所定の信頼度の信頼区間に相当する範囲を表しており、分散値から求められる。なお、当該楕円のｘ方向、ｙ方向それぞれの半径に対応させて記したｖｘ、ｖｙそれぞれの平方根（つまり標準偏差）の表示は、それら半径の比がｘ方向、ｙ方向の標準偏差の比で与えられることを示している。

なお、特徴点位置と基準点位置との相対位置の分布を解析して、分布の主軸を求め、この主軸に直交する軸との２軸で表してもよい。

特徴点位置と基準点位置との相対位置のばらつきは姿勢の変動やプロポーションの個人差などにより生じる。図３（ａ）に示す特徴点＃１は頭部付近の特徴点を表しており、図３（ｃ）に示す特徴点＃Ｍは脚部付近の特徴点を表している。頭部に比べて脚部は可動域が大きいため、特徴点＃１のばらつき度より特徴点＃Ｍのばらつき度の方が大きい（ｖｘ_１＞ｖｘ_Ｍ，ｖｙ_１＞ｖｙ_Ｍ）。

投票画像１２１は、対象物判定に使用される情報であって、入力画像から検出された複数の特徴点について、特徴点それぞれのばらつき度を加味して入力画像と同じ大きさのフレーム上の相対位置に投票した結果を示す画像である。また、本実施形態では、後述するように複数の倍率（検知倍率）にて対象物検知処理が行われることに対応して、投票画像１２１は検知倍率ごとに用意される。

特徴点情報設定部１３は、特徴点情報１２０を外部から入力するＵＳＢ端子、ＣＤドライブ、ネットワークアダプタ等のインターフェース回路及びそれぞれのドライバ・プログラム、及び入力された特徴点情報１２０を検知記憶部１２に格納させるプログラムからなる。この特徴点情報設定部１３を介して、学習装置２にて生成された特徴点情報２１２が入力され、特徴点情報１２０として検知記憶部１２に格納される。

検知制御部１４はＤＳＰ(Digital Signal Processor)、ＭＣＵ(Micro Control Unit)等の演算装置を用いて構成される。検知制御部１４は、画像取得部１１からの入力画像を処理して人の存在有無を判定し、人を検知すると異常信号を検知出力部１５へ出力する処理を行う。具体的には、検知制御部１４は検知記憶部１２からプログラムを読み出して実行し、後述する特徴点検出部１４０、投票部１４１、対象物判定部１４２、異常判定部１４３として機能する。

特徴点検出部１４０は、入力画像から各特徴点を検出し、当該検出された特徴点の特徴点番号、当該特徴点が検出された入力画像内の位置（検出位置）、当該特徴点の検出度、及び当該特徴点を検出したときの検知倍率を対応付けた特徴点検出情報を投票部１４１に出力する。

特徴点検出部１４０は入力画像内の各位置を中心に分析窓を設定して分析窓内の特徴量を抽出し、当該特徴量を各特徴点の検出基準と比較して検出度を算出する。そして、算出された検出度が予め設定された特徴点検出閾値Ｔｐを超えていれば当該位置に当該特徴点を検出し、検出度がＴｐを超えていなければ当該位置に当該特徴点を検出しない。特徴量は、本実施形態では上述したシェイプコンテキストとするが、ＨＯＧとすることもできる。なお、特徴量は、後述する学習装置２にて検出基準を学習したときに用いられた特徴量と同じ種類とする必要がある。

本実施形態では検出基準として特徴量を記憶しており、この場合、特徴点検出部１４０はパターンマッチングを行なって特徴点を検出する。すなわち、抽出された特徴量と検出基準の特徴量とのユークリッド距離ｄを検出度として算出し、ｄがＴｐ以下であれば特徴点を検出する。

検出基準として識別関数を記憶する別の実施形態においては、特徴点検出部１４０は、抽出された特徴量を識別関数に入力してその出力値である尤度を検出度として算出し、尤度がＴｐより大きければ特徴点を検出する。つまり特徴点検出部１４０は識別器として動作するように構成される。

入力画像に撮像されている対象物のサイズは様々であることに対応して、特徴点検出部１４０は、特徴点の検出に際して、検知倍率を調整して対象物のサイズの多様性への適合処理を行う。ここで、検知倍率αは、対象物標本画像に撮像されていた対象物のサイズを基準にしたときの、入力画像に撮像されている対象物のサイズの倍率である。具体的には、入力画像に撮像されている対象物のサイズを対象物標本画像のサイズに合わせるために、入力画像の方を予め設定された複数段階の検知倍率に応じて拡大又は縮小する。その拡大・縮小により、入力画像は元のサイズの１／αとなる。検知倍率αは、例えば（１．０５）^３倍、（１．０５）^２倍、１．０５倍、１．０倍、１／１．０５倍、１／（１．０５）^２倍、１／（１．０５）^３倍の７段階に設定する。拡大・縮小処理は公知のバイリニア補間法などにより行うことができる。

投票部１４１は、入力画像にて検出された特徴点それぞれについて投票値を求める。具体的には、投票部１４１は、特徴点情報１２０及び、特徴点検出部１４０からの特徴点検出情報を参照して、特徴点検出部１４０により検出された各特徴点について、当該特徴点の検出位置Ｐから当該特徴点の相対位置Ｒだけずらした相対基準点Ｑを算出し、このＱを中心とし当該特徴点のばらつき度に応じた距離特性の投票値を設定する。そして、設定された投票位置と投票値との関係を対象物判定部１４２へ出力する。検出時の検知倍率をαとすると、特徴点＃ｊの相対基準点Ｑは次式により算出される。
Ｑ＝（Ｐ＋Ｒ_ｊ）／α ・・・・・・（１）

ここで、検出された特徴点が真である場合には、相対基準点Ｑは、対象物基準点Ｂが存在する位置を表す。つまり、同一の対象物から検出される特徴点同士はそれぞれの相対基準点Ｑが理想的には互いに一致する。実際には検出された特徴点はそのばらつきにより、相対位置を表すベクトルＲの始点とした特徴点の代表位置からのずれを有し、その分、同一の対象物から検出された特徴点同士の相対基準点Ｑの間にも距離が生じる。

特徴点＃ｊの検出位置Ｐを（ｐ_ｘ，ｐ_ｙ）、相対基準点Ｑを（ｑ_ｘ，ｑ_ｙ）と表すと入力画像における各画素（ｘ，ｙ）の投票値ｆ（ｘ，ｙ）を次式で定義することができる。

（２）式で表されるｆ（ｘ，ｙ）は平均が相対基準点Ｑであり、分散がばらつき度Ｖ_ｊである２次元正規分布である。（２）式で定義される投票値には、相対基準点Ｑで最大値を示し、相対基準点Ｑから遠ざかるほど小さくなる距離減衰特性が与えられる。そして、ばらつき度Ｖ_ｊが大きいほど緩慢な距離減衰特性が与えられ、ばらつき度Ｖ_ｊが小さいほど急峻な距離減衰特性が与えられる。つまり投票部１４１は、投票値を相対基準点からの距離に応じて減少させる。すなわち、相対基準点が対象物基準点Ｂに近いほど、対象物基準点Ｂにて高い投票値が設定される。

ｗは、検出度の関数であり、検出度が特徴点検出閾値Ｔｐを超えるほど大きな値となるように設定される。つまり投票値ｆ（ｘ，ｙ）は、検出度が特徴点検出閾値Ｔｐを超えるほど大きく重みづけされる。すなわち検出の信頼性が高い特徴点ほど高い投票値が設定される。例えば、ユークリッド距離ｄに対してｗ＝ｅｘｐ（−ｋｄ）と設定される。但し、ｋは予め設定された正の定数である。また、例えば、検出度が尤度Ｌである別の実施形態では、ｗ＝Ｌと設定することができる。

投票値の関数ｆは（２）式以外のものに定義することもでき、例えば、次に示す（３）式で表される四角錘型関数、又は（４）式で表される円錐型関数で規定することができる。

これら（３）式，（４）式の関数によれば上述したような距離減衰特性のほか、投票値が設定される距離範囲がばらつき度に応じた広さに制限される。なお、（２）式の投票関数においても、例えば次の（５）式を満たす距離範囲に制限することができる。ちなみに（５）式は正規分布における３σの信頼区間を表す。このように制限することで、真の対象物の基準点が存在することが確からしい範囲のみに投票値を設定でき、対象物検知の信頼性が向上する。

また、さらに別の実施形態として、（５）式の範囲にｆ（ｘ，ｙ）＝ｗの投票値を設定する構成としてもよい。

図５は、入力画像４００にて検出された特徴点の例を示す模式図である。図５において“×”印が検出された特徴点の位置を示す。例えば、特徴点４０１、４０２，４０３が同一人の肩、左足、右足に検出されている。

図６は同一の対象物に検出された特徴点４０１〜４０３について投票の様子を例示する模式図である。なお、入力画像４００に撮像されている当該対象物の重心の真値は（ｘ０，ｙ０）であるとする。図６に示す画像４３０は入力画像４００の一部である。また、グラフ４５０は入力画像４３０における直線ｙ＝ｙ０に沿った位置での本実施形態による投票の様子を示すものであり、横軸が位置、縦軸は投票値ｆ（ｘ，ｙ）を表す。領域４１１〜４１３はそれぞれ特徴点４０１〜４０３に対する相対基準点４２１〜４２３を中心として設定される投票範囲を表す。また、グラフ４５１〜４５３は当該投票範囲での投票値であり、それぞれ特徴点４０１〜４０３に対する投票値を表す。

対象物基準点Ｂである重心（ｘ０，ｙ０）と、各特徴点の相対基準点４２１〜４２３との位置の相違が各特徴点の検出位置のずれに対応する。（ｘ０，ｙ０）には、ｘ方向に比較的小さなずれで検出された特徴点４０１及び４０２の投票値のみならず、比較的大きなずれで検出された特徴点４０３の投票値も設定されている。

一方、グラフ４７０は、本実施形態のグラフ４５０との対比のため、仮にばらつき度Ｖを全特徴点共通の一定値としたときの投票の様子を示したものである。グラフ４７０におけるグラフ４７１〜４７３がそれぞれグラフ４５０におけるグラフ４５１〜４５３に対応する。グラフ４７０は、ずれが大きい特徴点４０３の投票値（グラフ４７３）は（ｘ０，ｙ０）には設定されない点で、グラフ４５０と基本的な相違を有する。

特徴点のばらつき度が大きいということは当該特徴点が広範囲で検出される可能性があることを意味し、逆に特徴点のばらつき度が小さいということは当該特徴点が狭い範囲で検出されることを意味する。対象物検知装置１は上述したように、特徴点のばらつき度に応じた距離減衰特性の投票値を設定したり、特徴点のばらつき度に応じた距離範囲に投票値を設定したりすることによって、ばらつきやすい特徴点からも真に対象物が存在する対象物基準点に対する有効な投票が行なわれるため、ばらつきにくい特徴点に偏った投票が回避されて対象物の誤検出や検出漏れを防ぐことが可能となる。

また投票値に距離減衰特性を与えることによって特徴点の存在確率に相応した投票が行なわれるため、ばらつきやすい特徴点からの不当に高い投票を防いだ精度の高い投票が可能となる。

投票部１４１は、上述のように特徴点ごとに各位置（ｘ，ｙ）への投票値ｆ（ｘ，ｙ）を設定する。対象物判定部１４２は、各位置に設定された投票値は投票画像１２１における当該位置の画素値に累積加算され集計される（一次集計）。この各特徴点についての投票値の設定は検知倍率ごとに行われ、また投票画像への加算も、当該検知倍率に対応した投票画像を用いて検知倍率ごとに行われる。

対象物判定部１４２は、投票部１４１にて投票値を設定された投票画像に基づき、入力画像の各位置における投票値についてさらに集計処理（二次集計）を行う。具体的には、対象物の撮像状態やプロポーションの個体差が原因で、同一対象物の投票値が複数の検知倍率に跨って設定されることがある。そこで対象物判定部１４２は、検知倍率が隣接する同一位置の投票値をさらに加算する（二次集計）。これにより撮像状態や個体差による部位間の大きさバランスを吸収することができ、対象物の検出漏れを防ぐことができる。そして、集計値が予め設定された対象物検知閾値Ｔｏを超える位置に対象物が存在すると判定し、一方、集計値がＴｏを超える位置が１つも無い場合は入力画像内に対象物は存在しないと判定し、当該判定結果を出力する。判定結果は異常判定部１４３に入力される。

また、真に対象物が存在する位置の近傍において複数の位置で集計値がＴｏを超える場合がある。そこで対象物判定部１４２は、投票画像１２１を複数のブロックに分割してブロックごとに集計値が極大となる位置（ピーク点）を検出し、ピーク点の集計値のみを対象物検知閾値Ｔｏと比較する。ブロックの大きさは検知倍率に応じて拡大・縮小した入力画像上での対象物の大きさより小さく設定する。これにより対象物の誤検出を防ぐことができる

対象物判定部１４２は、判定結果として対象物が存在すると判定された入力画像内の位置、当該位置における集計値、当該集計値が算出された検知倍率を対応付けた対象物検知情報を生成する。

図７は対象物判定処理の様子を説明するための図であり、図７（ａ）は入力画像５００、及び対象物が撮像されている位置位置（ｘ１，ｙ１）及び（ｘ２，ｙ２）を示す模式図である。図７（ｂ）は、図７（ａ）に示す入力画像５００から検出された特徴点に対する投票値が、互いに検知倍率の異なる投票画像５１０〜５１６に対して設定されている様子を示す模式図である。なお、図７（ｂ）は、各投票画像５１０〜５１６のｘ方向及びｙ方向のサイズを揃え、ｘ軸、ｙ軸と直交する方向に投票画像を検知倍率αの順に並べたｘｙα三次元空間を表している。図７（ｂ）において、円は投票範囲を表しており、対象物が撮像されている位置（ｘ１，ｙ１）及び（ｘ２，ｙ２）に投票が集中していることが分かる。これらを集計すると位置（ｘ１，ｙ１）及び（ｘ２，ｙ２）に対象物検知閾値Ｔｏを超えるピークが検出され、位置（ｘ１，ｙ１）及び（ｘ２，ｙ２）に対象物の存在が判定される。

異常判定部１４３は対象物判定部１４２により対象物の存在が判定されると侵入異常が検知されたとして侵入異常信号を検知出力部１５へ出力する。

検知出力部１５は外部装置と接続され、当該外部装置へ侵入異常信号を出力するインターフェース回路である。外部装置は、侵入者の存在を警報するスピーカー、ブザー又はランプ等の警報表示手段や、通信網を介して接続される遠隔地のセンタ装置等である。

次に、対象物検知装置１の動作を説明する。図８は、対象物検知装置１の概略の動作を示すフロー図である。例えば、装置の管理者が電源を投入すると各部が動作を始める。画像取得部１１は所定時間間隔で撮像された画像を検知制御部１４に入力する。検知制御部１４は画像が入力されるたびにステップＳ１０〜Ｓ１８からなる処理を繰り返す。

画像が入力されると（Ｓ１０）、検知制御部１４の特徴点検出部１４０は入力画像から特徴点を検出し、検知制御部１４の投票部１４１は検出結果に応じた投票を投票画像１２１に対して行なう（Ｓ１２）。

図９は、特徴点検出処理及び投票処理（Ｓ１２）の概略のフロー図である。図９を参照して特徴点検出処理及び投票処理を説明する。

特徴点検出部１４０は、７段階の検知倍率を順次、注目倍率に設定し（Ｓ１２０）、全ての検知倍率に対してステップＳ１２１〜Ｓ１３２の処理を繰り返すループ処理を実行する。

検知倍率のループ処理において、まず特徴点検出部１４０は、注目倍率が１以外である場合には、拡大又は縮小を行うことで注目倍率に応じたサイズの入力画像を生成する（Ｓ１２１）。特徴点検出部１４０は、当該入力画像の全ての画素位置を順次、分析窓の中心に設定し、設定した各位置での当該分析窓内の特徴量を抽出する（Ｓ１２２）。抽出された特徴量はその抽出位置と対応付けられ、特徴量情報として検知記憶部１２に一時記憶される。この段階で特徴量を算出し保存しておき、後の処理で随時利用可能とすることで、無駄な重複算出を省くことができる。また、投票部１４１は注目倍率の投票画像１２１の各画素値を０に初期化する（Ｓ１２３）。

次に、特徴点検出部１４０は、検知倍率のループ処理内において、特徴点情報１２０に記憶されているＭ個の特徴点＃ｍ（１≦ｍ≦Ｍ）を順次、注目特徴点に設定し（Ｓ１２４）、さらに入力画像内の各画素位置を順次、注目位置に設定し（Ｓ１２５）、特徴点と画素位置の全組み合わせに対してステップＳ１２６〜Ｓ１３１の処理を繰り返すループ処理を実行する。

特徴点と画素位置とに関するループ処理において、特徴点検出部１４０は、特徴点情報１２０から注目特徴点の検出基準を読み出し、さらにステップＳ１２２にて生成された特徴量情報から注目位置の特徴量を読み出して、注目位置の特徴量を注目特徴点の検出基準と比較して検出度を算出し（Ｓ１２６）、算出された検出度を特徴点検出閾値Ｔｐと比較する（Ｓ１２７）。

検出度が特徴点検出閾値Ｔｐを超えていれば（Ｓ１２７にて「ＹＥＳ」）、注目位置に注目特徴点が検出されたとして、特徴点検出部１４０から投票部１４１に注目倍率、注目特徴点の特徴点番号、注目位置及び検出度が通知される。投票部１４１は、特徴点情報１２０から注目特徴点のばらつき度Ｖ及び相対位置Ｒを読み出し、通知された注目倍率α、注目位置Ｐ及び検出度ｄと、読み出したばらつき度Ｖ及び相対位置Ｒとを（１）式、（２）式に代入することで、入力画像内の各画素位置（ｘ，ｙ）に対する投票値ｆ（ｘ，ｙ）を算出し（Ｓ１２８）、算出された各画素位置（ｘ，ｙ）の投票値ｆ（ｘ，ｙ）を注目倍率の投票画像１２１において対応する画素位置（ｘ，ｙ）の画素値に加算する（Ｓ１２９）。ステップＳ１２９の加算処理は一次集計に相当する。一方、検出度がＴｐ以下のときは（Ｓ１２７にて「ＮＯ」）、注目位置に注目特徴点は検出されなかったとしてステップＳ１２８とＳ１２９は省略される。

こうして全特徴点、全倍率について入力画像全体を走査し終えると（Ｓ１３０にて「ＹＥＳ」、かつＳ１３１にて「ＹＥＳ」、かつＳ１３２にて「ＹＥＳ」）、特徴点検出処理及び投票処理は終了する。

特徴点検出処理及び投票処理が終わると図８に示すように、対象物検知装置１の処理は対象物判定処理Ｓ１４へ進む。対象物判定処理Ｓ１４では、検知制御部１４の対象物判定部１４２により、以下に説明するように、ステップＳ１２で作成された投票画像を基にして入力画像中に対象物が存在するか否かの判定が行われる。

図１０は、対象物判定処理（Ｓ１４）の概略のフロー図である。図１０を参照して対象物判定処理（Ｓ１４）を説明する。

対象物判定部１４２は、検知倍率ごとに、検知倍率が隣接する投票画像の対応する画素値同士、すなわち一次集計値同士を加算し合い（Ｓ１４０）、各検知倍率の投票画像をブロック分割してブロックごとにピークの画素を検出する（Ｓ１４１）。ステップＳ１４０の加算処理は二次集計に相当する。

次に対象物判定部１４２は、各ピーク画素を順次、注目ピーク画素に設定し（Ｓ１４２）、全てのピーク画素に対してステップＳ１４３〜Ｓ１４５の処理を繰り返すループ処理を実行する。

ピーク画素に関するループ処理において、対象物判定部１４２は、注目ピーク画素の画素値（二次集計値）を対象物検知閾値Ｔｏと比較する（Ｓ１４３）。そして、集計値がＴｏより大きければ注目ピーク画素の位置に対象物を検知したとして（Ｓ１４３にて「ＹＥＳ」）、注目ピーク画素の位置と、注目ピーク画素の画素値と、注目ピーク画素が属する投票画像の検知倍率とを対応付けた対象物検知情報を生成して、検知記憶部１２に記憶させる（Ｓ１４４）。一方、集計値がＴｏ以下の場合（Ｓ１４３にて「ＮＯ」）、ステップＳ１４４は省略される。

こうして全てのピーク画素について処理し終えると（Ｓ１４５にて「ＹＥＳ」）、対象物判定処理Ｓ１４は終了する。

対象物判定部１４２が処理を終えると、検知制御部１４の異常判定部１４３は検知記憶部１２を参照して対象物検知情報の有無を確認し（Ｓ１６）、対象物検知情報が１つでも記憶されていれば対象物が検知されたとして（Ｓ１６にて「ＹＥＳ」）、侵入異常信号を検知出力部１５へ出力し、検知出力部１５に警報を出力させる（Ｓ１８）。

以上の処理を終えると、処理は再びステップＳ１０へ戻される。

上記実施形態では、画像取得部１１は撮像部１０と接続され、検知制御部１４はオンライン処理で対象物を検知した。しかし、画像取得部１１が録画装置と接続され、検知制御部１４がオフライン処理で対象物を検知する構成としてもよい。

特徴点検出部１４０は上述の実施形態では、入力画像内の全画素位置を走査するようにしたが、入力画像からブロッブやコーナーを予備検出し、予備検出された位置及びその周辺のみを走査するようにしてもよい。このとき、標本点設定部２２０がブロッブを検出するのであれば特徴点検出部１４０もブロッブを予備検出し、標本点設定部２２０がコーナーを検出するのであれば特徴点検出部１４０もコーナーを予備検出する。

上記実施形態においては、学習装置２にて算出されたばらつき度が特徴点情報２１２の一部として特徴点情報設定部１３から入力され検知記憶部１２に格納された。別の実施形態として、特徴点情報設定部１３はキーボード、マウス等の操作入力装置をさらに備え、対象物検知装置１の管理者が特徴点情報設定部１３を操作してばらつき度を入力する構成としてもよい。

［学習装置］
図１１は、実施形態に係る学習装置２の概略の構成を示すブロック図である。学習装置２は、学習操作部２０、学習記憶部２１、学習制御部２２及び学習出力部２３を含んで構成される。学習操作部２０、学習記憶部２１及び学習出力部２３は学習制御部２２と接続される。

学習操作部２０はキーボード、マウス等のユーザインターフェース装置であり、装置の管理者により操作され、学習の開始指示や特徴点の情報の出力指示を学習制御部２２に与える。

学習記憶部２１はＲＯＭ、ＲＡＭ、ハードディスク等の記憶装置であり、学習制御部２２で使用されるプログラムやデータを記憶する。学習記憶部２１はこれらプログラム、データを学習制御部２２との間で入出力する。学習記憶部２１に記憶されるデータには、標本画像２１０、標本点情報２１１、特徴点情報２１２が含まれる。

標本画像２１０は特徴点情報２１２を作成する基礎となる画像であり、当該学習に先立って予め記憶される。標本画像２１０は、対象物が撮像された多数（数千〜数万枚程度）の対象物標本画像、及び対象物が撮像されていない多数（数千〜数万枚程度）の非対象物標本画像とからなる。標本画像２１０のそれぞれには当該画像を識別する標本番号が付与されている。対象物標本画像は６４×１２８画素の基準サイズに予め揃えられている。

標本点情報２１１は各対象物標本画像内に設定された標本点（標本特徴点）の情報である。標本点情報２１１は、各標本点の位置、特徴量及び、当該標本点が設定された対象物標本画像を特定する標本番号を含む。

特徴点情報２１２は標本点情報２１１を基に作成された特徴点の情報である。その内容は上述した特徴点情報１２０と同じであり、各特徴点の特徴点番号、相対位置、特徴量、ばらつき度といったパラメータ群である。

学習出力部２３は生成された特徴点情報２１２を学習装置２の外部へ出力するＵＳＢ端子、ＣＤドライブ、ネットワークアダプタ等のインターフェース回路、及びそれぞれのドライバ・プログラムからなる。外部出力された各データは対象物検知装置１に入力される。

学習制御部２２は、ＤＳＰ、ＭＣＵ等の演算装置を用いて構成される。学習制御部２２は、標本画像２１０から特徴点情報２１２を生成して、生成した特徴点情報２１２を学習出力部２３へ出力する処理を行う。具体的には、学習制御部２２は、学習記憶部２１からプログラムを読み出して実行し、後述する標本点設定部２２０、クラスタリング部２２１、特徴点情報生成部２２２として機能する。

標本点設定部２２０は、標本画像から所定の画像特徴を有する標本点を抽出する標本特徴点抽出部として機能する。具体的には、各対象物標本画像内に複数の標本点を設定して標本点における特徴量を抽出し、各標本点の位置と特徴量と当該標本点が設定された対象物標本画像の標本番号とを対応付けた標本点情報２１１を学習記憶部２１に記憶させる。

本実施形態では、標本点として、コーナー（corner）と呼ばれるエッジの交点、又はブロッブ（blob）と呼ばれる輝度極大点などを用いる。具体的には、ハリス−ラプラス（Harris-Laplace）の方法など公知のコーナー検出方法により各対象物標本画像からコーナーを検出して特徴点に設定し、又は、ＳＩＦＴ（Scale-Invariant Feature Transform）など公知のブロッブ検出方法により各対象物標本画像からブロッブを検出して検出されたブロッブを特徴点に設定する。輝度に特徴のある標本点を設定することで、対象物の検知に有効な特徴点情報を効率的に生成できる。

なお、標本点の設定の仕方として、対象物標本画像の全体に予め設定された個数の複数の標本点をランダムに設定する方法や、対象物標本画像内に等間隔で複数の標本点をグリッド状に設定する方法を採用することもできる。

標本点設定部２２０は、各対象物標本画像の標本点それぞれに分析窓を設定して分析窓内の特徴量を抽出する。特徴量は、本実施形態では上述したシェイプコンテキストとするが、ＨＯＧとすることもできる。

クラスタリング部２２１は、標本画像相互間にて位置及び画像特徴が類似する標本点からなるクラスタ（cluster）を生成する。具体的には、クラスタリング部２２１は標本点情報２１１を参照し、位置及び特徴量に着目して標本点をクラスタリングすることによって、位置及び特徴量が類似する標本点のクラスタを生成する。これにより、多数の対象物標本画像間で対象物の同じ部位を表す標本点が１つのクラスタにまとめられる。生成されたクラスタの情報は、特徴点情報生成部２２２へ出力される。

クラスタリングにはｋ−平均クラスタリング、種々の凝集クラスタリング（群平均法など）など公知の手法を用いることができる。

またこのとき、位置及び特徴量に同時に着目してクラスタリングを行っても良いし、まず特徴量に着目したクラスタリングを行い、次いで位置に着目したクラスタリングを行っても良い。

特徴点情報生成部２２２は、クラスタごとに、統計分析により標本点の位置の分布（標本分布）の情報を求め、さらに、標本画像における所定の基準点の、標本分布における所定の代表位置からの相対位置である標本相対位置を求める。そして、クラスタごとの標本分布の情報及び標本相対位置に基づく特徴点分布の情報及び相対位置を含む特徴点情報を生成する。具体的には特徴点情報生成部２２２は、クラスタごとに、標本点の位置のばらつき度を統計分析すると共に、標本点の特徴量を用いて検出基準を学習し、当該ばらつき度と当該検出基準と当該クラスタの対象物基準点に対する相対位置とを対応付けた特徴点情報２１２を生成し、生成された特徴点情報２１２を学習記憶部２１に記憶させる。特徴点情報２１２は１つのクラスタから１つ生成される。本実施形態では、クラスタ＃ｍに属する標本点の位置の分散値を特徴点＃ｍのばらつき度Ｖとして算出する。また、クラスタ＃ｍに属する標本点の位置の平均値を当該クラスタの代表位置として算出し、算出した代表位置の座標から対象物基準点Ｂの座標を引いたベクトルを特徴点＃ｍの相対位置として算出する。さらに、クラスタ＃ｍに属する標本点の特徴量の平均（平均ベクトル）を特徴点＃ｍの検出基準として算出する。

対象物検知装置１の特徴点検出部１４０が識別器として動作する構成では、特徴点情報生成部２２２は、クラスタ＃ｍの代表位置における特徴量を非対象物標本画像のそれぞれからも抽出し、クラスタ＃ｍに属する標本点の特徴量と非対象物標本画像から抽出された特徴量とに公知のブースティング（Boosting）又はサポートベクターマシーン（Support Vector Machine）等の学習アルゴリズムを適用して検出基準である識別関数を学習する。

なお、少数の対象物標本画像から生成されたクラスタからは、対象物を検知する十分な精度を有した特徴点情報を生成できる可能性が低い。そこで特徴点情報生成部２２２はクラスタに属する標本点の設定元となった対象物標本画像の数を計数して、計数値が所定値以下のクラスタの情報からは特徴点情報２１２を生成しないように構成することができる。これにより十分な対象物検知精度を有した特徴点情報を生成できる。また、これにより不当に小さいばらつき度や不当に大きなばらつき度が算出されることを防止できるため、高い対象物検知精度を有した特徴点情報を生成できる。

図１２は、標本点とクラスタとの関係を示す模式図である。図１２は、各対象物標本画像６００〜６０３にて互いに対応する特徴を有する標本点であるコーナー６１０〜６１３（“×”印）が、点線で示す領域内にばらついて検出された様子を示している。コーナーにおいてクラスタリング用の特徴量を抽出する領域６２０〜６２３を、コーナーを示す“×”印を囲む実線の円で表している。この場合、コーナー６１０〜６１３は点線の領域に対応するクラスタ６５０にまとめられる。また、クラスタの代表位置６３０〜６３３（黒丸）は、当該クラスタにまとめられるコーナーの平均位置に設定されている。当該代表位置が当該クラスタに対応する特徴点となり、当該特徴点の特徴量を抽出する領域である局所領域６４０〜６４３を当該特徴点を囲む実線の円で表している。

次に、学習装置２の動作を説明する。図１３は、学習装置２の概略の動作を示すフロー図である。例えば、管理者が学習装置２の電源を投入し学習操作部２０を操作して学習の開始を指示すると、学習装置２は学習処理を行う。以下、図１３を参照して学習処理を説明する。

学習制御部２２は標本点設定部２２０により、各対象物標本画像内に複数の標本点を設定する（Ｓ２０）。そして、各対象物標本画像において当該画像から抽出された標本点それぞれの位置に分析窓を設定して当該分析窓内から特徴量を抽出し（Ｓ２１）、抽出された特徴量に抽出元の対象物標本画像の標本番号及び抽出元の標本点の位置を対応付けて標本点情報２１１を生成し学習記憶部２１に記憶させる。

次に、学習制御部２２はクラスタリング部２２１により、標本点情報２１１に対して位置と特徴量に着目したクラスタリング処理を行い、対象物標本画像間で位置及び特徴量が類似する標本点同士がまとめられたクラスタを生成する（Ｓ２２）。クラスタリング部２２１は、クラスタリングの結果として、各標本点の標本点情報２１１に当該標本点が属するクラスタを識別するクラスタ番号を追記する。

学習制御部２２は特徴点情報生成部２２２により、ステップＳ２２にて生成された各クラスタを順次、注目クラスタに設定し（Ｓ２３）、全てのクラスタに対してステップＳ２４〜Ｓ２９の処理を繰り返すループ処理を実行する。

クラスタのループ処理において、特徴点情報生成部２２２は、標本点情報２１１を参照して、注目クラスタに属する標本点の位置を代表する代表位置を算出し（Ｓ２４）、また、算出された代表位置の対象物基準点Ｂに対する相対位置Ｒを算出し（Ｓ２５）、さらに、注目クラスタに属する標本点の位置のばらつき度Ｖを算出する（Ｓ２６）。

さらに、特徴点情報生成部２２２は、注目クラスタに属する標本点の特徴量を用いて検出基準の学習を行う（Ｓ２７）。

対象物検知装置１の特徴点検出部１４０がパターンマッチングにより特徴点を検出する場合、特徴点情報生成部２２２は注目クラスタに属する標本点の特徴量の平均特徴量を検出基準として学習する。この場合、検出基準は対象物標本画像の画像情報のみを用いて学習されることになる。

対象物検知装置１の特徴点検出部１４０が識別器として動作する別の実施形態の場合、特徴点情報生成部２２２は、注目クラスタに属する標本点の特徴量すなわち対象物標本画像の画像情報に加え、非対象物標本画像の画像情報を用いて学習を行なう。すなわち、特徴点情報生成部２２２は、ステップＳ２４において算出された代表位置における特徴量を非対象物標本画像のそれぞれからも抽出し、注目クラスタに属する標本点の特徴量と非対象物標本画像から抽出された特徴量とにブースティング又はサポートベクターマシーンを適用して検出基準を学習する。

特徴点情報生成部２２２は、以上ステップＳ２４〜Ｓ２７にて注目クラスタに対応する特徴点の情報を求めると、新たな特徴点番号、注目クラスタの相対位置Ｒ、注目クラスタのばらつき度Ｖ及び、注目クラスタの検出基準を対応付けて新たな特徴点情報２１２を生成し学習記憶部２１に記憶させる（Ｓ２８）。

全てのクラスタについて処理し終えると（Ｓ２９にて「ＹＥＳ」）、学習処理は終了する。

学習処理の終了後、管理者が学習操作部２０を操作して特徴点情報２１２の出力を指示すると、学習制御部２２は学習記憶部２１から特徴点情報２１２を読み出して学習出力部２３に出力させる。

なお、上記実施形態においては基準点Ｂを標本画像２１０の重心位置に定めたが、特徴点間で共通していれば基準点Ｂは標本画像２１０の左上端、右下端など任意の位置でもよい。

また上記実施形態では、特徴点情報生成部２２２は特徴点のばらつき度として分散値を算出した。別の実施形態として、特徴点情報生成部２２２は、クラスタごとに標本点の平均位置からの差の絶対値の平均値を当該クラスタのばらつき度として算出したり、クラスタごとに標本点の平均位置からの距離の最大値を当該クラスタのばらつき度として算出する構成としてもよい。

１対象物検知装置、２学習装置、１０撮像部、１１画像取得部、１２検知記憶部、１３特徴点情報設定部、１４検知制御部、１５検知出力部、２０学習操作部、２１学習記憶部、２２学習制御部、２３学習出力部、１２０特徴点情報、１２１投票画像、１４０特徴点検出部、１４１投票部、１４２対象物判定部、１４３異常判定部、２１０標本画像、２１１標本点情報、２１２特徴点情報、２２０標本点設定部、２２１クラスタリング部、２２２特徴点情報生成部、４００，５００入力画像、４０１〜４０３特徴点、５１０〜５１６投票画像、６００〜６０３対象物標本画像、６１０〜６１３コーナー、６５０クラスタ、６３０〜６３３代表位置。

Claims

入力画像に現れる対象物を検知する対象物検知装置であって、
予め設定された前記対象物を撮影した対象物体像の特徴を示す画像特徴を有する複数の特徴点ごとに、前記対象物体像における所定の基準点と特徴点との相対位置と、当該相対位置のばらつき度とを含む特徴点情報を記憶した記憶部と、
前記入力画像の中から前記特徴点を検出する特徴点検出部と、
前記特徴点検出部にて検出された特徴点について、前記入力画像における当該特徴点の位置との相対位置を中心に前記ばらつき度に応じた距離特性にて投票値を算出する投票部と、
前記投票値を前記入力画像における各位置において集計して対象物の存在を判定する対象物判定部と、
を有することを特徴とする対象物検知装置。
請求項１に記載の対象物検知装置において、
前記投票部の前記距離特性は、前記ばらつき度が大きいほど前記中心からの投票位置の距離範囲を広くすること、を特徴とする対象物検知装置。
請求項１又は請求項２に記載の対象物検知装置において、
前記投票部の前記距離特性は、前記ばらつき度が大きいほど前記中心から離れる距離に応じて前記投票値を緩やかに減衰させること、を特徴とする対象物検知装置。
請求項１から請求項３のいずれか１つに記載の対象物検知装置に用いる前記特徴点情報を生成する学習装置であって、
前記対象物が撮された複数の標本画像を格納されている標本画像記憶部と、
前記各標本画像から所定の画像特徴を有する標本特徴点を抽出する標本特徴点抽出部と、
前記標本画像相互間にて位置及び前記画像特徴が類似する前記標本特徴点からなるクラスタを生成するクラスタリング部と、
前記クラスタごとに、統計分析により前記標本特徴点の位置の分布に関する標本分布の情報を求め、さらに、前記標本画像における所定の基準点の、前記標本分布における所定の代表位置からの相対位置である標本相対位置を求め、当該クラスタごとの前記標本分布の情報及び前記標本相対位置を前記特徴点分布の情報及び前記相対位置とした前記特徴点情報を生成する特徴点情報生成部と、
を有することを特徴とする学習装置。