以下、本発明の実施形態について説明する。
図1は、本実施形態に係る警備システム10の構成概略図である。警備システム10は、店舗、オフィス、マンション、倉庫、家屋などの各監視対象物件12に設置される警備装置14、公衆電話回線などの通信網16を介して各警備装置14と接続される警備センタ装置18、及び利用者装置20とを含んで構成される。さらに、警備システム10は、監視対象物件12の監視領域を撮影した監視画像に基づいて監視対象物件12の異常を検出するための1以上の画像処理装置としての画像センサ22、及び、画像センサ22により撮影された監視画像を記録する録画装置24を含んで構成される。画像センサ22及び録画装置24は警備装置14と通信可能に接続される。
警備装置14は、構内LANなどを介してそれ自体に接続された画像センサ22からアラーム信号を受信すると、そのアラーム信号及び警備装置14自体の識別信号、又は、監視対象物件12あるいは異常を検出した画像センサ22の識別信号を警備センタ装置18へ送信する。そのために、警備装置14は、画像センサ22と通信するための通信インターフェースと、警備センタ装置18及び利用者装置20と通信するための通信インターフェースと、それらを制御するための制御ユニットを有する。
警備センタ装置18は、いわゆるコンピュータで構成され、通信網16を介して警備装置14と通信するための通信インターフェースと、液晶ディスプレイなどの表示装置と、ブザーやLEDなどで構成される報知部を備える。警備センタ装置18は、警備装置14から通信網16を介してアラーム信号を受信すると、そのアラーム信号を送信した警備装置14が設置された監視対象物件12及び検出された異常の内容を報知部及び表示装置を通じて監視員に報知する。
利用者装置20も、いわゆるコンピュータで構成され、通信網16を介して警備装置14と通信するための通信インターフェース、液晶ディスプレイなどの表示装置、及び、キーボードやマウスなど、警備装置14を遠隔操作するための操作コマンドを入力するためのユーザインターフェースを備える。利用者装置20は、ユーザインターフェースを介して予め登録されている監視対象物件12を観察する操作がなされると、登録されている監視対象物件12に設置された警備装置14に対して、現在撮影中の監視画像又は録画装置24に記録されている監視画像を利用者装置20に送信することを要求する各種の画像要求信号を送信する。そして、警備装置14から監視画像を受信すると、利用者装置20は要求された監視画像を表示装置に表示する。
録画装置24は、HDDなどの磁気ディスク装置、DATなどの磁気テープ、DVD-RAMなどの光記録媒体のように、録画装置24に着脱自在となる記録媒体と、それら記録媒体にアクセスしてデータの読み書きを行う装置で構成される。録画装置24は、画像センサ22が撮影した監視画像を警備装置14から受け取り、撮影時刻と関連付けて記録する。
図2は、画像センサ22の構成概略図である。
通信部30は、画像センサ22と警備装置14との間で構内LANなどの通信ネットワークを介して各種の設定信号及び制御信号などを送受信する入出力インターフェースであり、イーサネット(登録商標)などの各種の通信インターフェース回路及びそれらを駆動するドライバソフトウェアなどで構成される。具体的には、通信部30は、後述の信号処理部42によって侵入者が検出された場合に、侵入者を検出したことを示すアラーム信号を警備装置14に出力する。
撮影部32は、CCDなどの、可視光などに感度を有する光電変換器で構成された2次元検出器と、その2次元検出器上に監視領域の像を結像する結像光学系などで構成される。撮影部32は、監視領域を撮影することによって撮影画像を取得する。本実施形態では撮影部32は、一定の時間間隔(例えば1/5秒)ごとに撮影を行うが、撮影部32の撮影方法はこれには限られない。取得された撮影画像は記憶部34に記憶される。
撮影部32は魚眼レンズを含んで構成され、すなわち、撮影部32は全方位(360度)を撮影領域(監視領域)とすることができる全方位カメラである。当該全方位カメラは、例えば監視対象物件12の天井などに設置され、監視領域を下方とし、略鉛直下方向を光学中心としている。
なお、全方位カメラである撮影部32で撮像された撮影画像は全方位画像であり、全体として円形の像となっており、円形の中心が光学中心に対応する位置となっている。そして、撮影画像においては、監視領域の鉛直上方向が、撮影画像の径方向であって光学中心から外側へ向かう方向となり、監視領域の水平方向が撮影画像の周方向となる。
監視領域に侵入者が存在する場合、撮影部32が取得した撮影画像には、当該侵入者(人物)に相当する人領域が含まれることとなる。また、撮影画像に人物の影が写っている場合があり、その場合には、撮影画像には、影に相当する影領域が含まれることとなる。
記憶部34は、半導体メモリ、磁気ディスク(HDD)、又はCD-ROM、DVD-RAMなどの光ディスクドライブ及びその記録媒体で構成される、記憶手段である。記憶部34には、画像センサ22の各部を動作させるための画像処理プログラムが記憶される。また、図2に示される通り、記憶部34には、撮影部32が取得した撮影画像36、基準画像38、及び参照情報40が記憶される。
基準画像38は、監視領域内に人物が存在していないときの撮影画像36に基づいて信号処理部42により作成される。基準画像38は1枚であってもよいが、複数枚の基準画像38が作成されてもよい。例えば、信号処理部42は、撮影部32が順次取得した撮影画像36のフレーム間差分を求め、フレーム間での対応画素間の輝度差の絶対値の平均値を求める。そして、信号処理部42は、その平均値が所定の基準よりも小さい撮影画像36を基準画像38として記憶部34に記憶させる。また、基準画像38は、照明状態の変動、太陽の日周変動などの監視領域の変動に対応するために、一定周期(例えば、10分間隔)毎に更新されるのが好適である。
参照情報40は、検出対象となる人物の実空間におけるサイズ(例えば高さ180cm、幅60cm)を示す参照サイズを含んで構成される。
信号処理部42は、組み込み型のマイクロプロセッサユニットと、ROM、RAMなどのメモリと、その周辺回路とを有し、画像センサ22の各種信号処理を実行する。図2に示されるように、信号処理部42は、抽出手段44、ラベル整形手段46、追跡手段48、及び判定手段50の機能を発揮する。信号処理部42がこれらの手段を発揮することで、撮影画像36において、人物に相当する画像領域である人領域が検出される。特に、本実施形態においては、撮影画像36において、人物に相当する人領域と当該人物の影に相当する影領域とを適切に分離した上で、撮影画像36から人領域が検出される。以下、信号処理部42が有する各手段について説明する。
抽出手段44は、撮影画像36と、記憶部34に予め記憶された基準画像38とを比較して、両画像間で相違する画素を抽出し、抽出された画素と抽出されない画素とからなる二値画像(変化領域画像)を求める処理を行う。ここで「両画像間で相違する画素」とは、撮影画像36と基準画像38との間で輝度値又は色成分の差が所定値以上である撮影画像36の画素を意味し、当該画素を抽出画素と呼ぶ。
図3には、撮影画像36(a)、基準画像38(b)、及び変化領域画像39(c)の例が示されている。図3(a)の例のように、撮影画像36に人領域60及び影領域62が含まれている場合には、人領域60に対応する画素及び影領域62に対応する画素の両方が抽出画素となる。
また、抽出手段44は、各抽出画素に対して識別子(ラベル)を付与するラベリング処理を行う。ラベルとしては、例えば当該変化領域画像39内でユニークな数値を用いることができる。ラベリング処理では、ある抽出画素に注目したとき、当該抽出画素に隣接している他の抽出画素からなる一塊の抽出画素群を1つの変化領域64(図3(c)参照)とみなす。なお、抽出画素に隣接する画素とは、抽出画素の上下左右方向に隣接する画素であってもよいし、斜め方向に隣接する画素まで含めてもよい。その上で、各変化領域64に対して異なるラベルを付与し、変化領域画像39の画素値として記憶する処理を行う。以下、ラベルが付与された変化領域64のことをラベル領域66と呼ぶ。これにより、撮影画像36において、基準画像38から変化した領域である1又は複数の変化領域64(ラベル領域66)が抽出される。当該ラベル領域66を示す画像が変化領域画像39である。
ラベル整形手段46は、抽出手段44により抽出された各ラベル領域66から人領域を求めるために、ラベル領域66を整形する処理を実行する。本実施形態では、人領域及び影領域を含んで抽出された一つの大きいラベル領域66から人領域に相当する大きさに切り出すことで複数のラベル領域に分離するラベル分離処理を実行する。ラベル分離処理の詳細については後述する。なお、ラベル整形手段46は、複数のラベル領域66を1つのラベル領域66として統合するラベル統合処理や、ラベル領域66を削除するラベル削除処理を行ってもよい。
例えば、ラベル統合処理は、所定範囲内にある複数のラベル領域66を、統合した場合に人物らしい大きさあるいは形状の領域となるかどうかなどの所定の条件に基づいて、複数のラベル領域66を統合する処理である。ラベル統合処理によれば、例えば、同一人物の上半身と下半身とがそれぞれ異なるラベル領域66として抽出された場合に、当該2つのラベル領域66を統合して1人の人物に対応する1つのラベル領域66とすることができる。ラベル削除処理は、明らかに人物でないと判断できるラベル領域66を削除する処理である。例えば、参照サイズに対して大きすぎる、あるいは小さすぎるラベル領域66を削除する。
また、ラベル整形手段46は、ラベル分離処理によって分離されたラベル領域の画像特徴に基づいて人領域を検出する人領域判定処理を実行する。人領域判定処理の詳細については後述する。なお、図2に示す通り、ラベル整形手段46は、ヒストグラム算出手段52及び人領域検出手段54を含むが、これらの手段によりラベル分離処理及び人領域判定処理が実現される。
追跡手段48は、撮影部32が順次取得した撮影画像36のそれぞれから抽出され、ラベル整形手段46にて整形されたラベル領域66を時間的に追跡する処理を行う。具体的には、追跡手段48は、今回取得された撮影画像36から抽出されてラベル整形手段46により整形された、人領域に対応する各ラベル領域66と、過去に取得された撮影画像36から抽出されて、記憶部34に追跡用情報として記憶されているラベル領域66(以下「追跡ラベル領域」と記載する)とを同定する処理(同一人物に対応する人領域であると判定する処理)を行う。ここで、追跡用情報は、追跡ラベル領域に関する、追跡ID、撮影画像36上の位置、及び追跡用特徴量が関連付けられた情報である。追跡用特徴量は、追跡ラベル領域の実空間におけるサイズや形状、輝度ヒストグラム、テクスチャ情報などである。また、本実施形態では、撮影画像36上の位置としては、追跡ラベル領域の略中央最下部の位置の座標としている。
追跡手段48は、今回取得された撮影画像36のラベル領域66の追跡用特徴量及び位置と、追跡ラベル領域の追跡用特徴量及び位置とを比較する。例えば、追跡用特徴量が類似し、且つ、位置が近いもので同定する。そして、今回取得された撮影画像36のラベル領域66に対して、同定された追跡ラベル領域と同一の追跡IDを付与し、時系列に従って、今回取得された撮影画像36の当該ラベル領域66の追跡IDと、撮影画像36上の位置などを関連付けた上で記憶部34に追跡用情報として保存する。
なお、今回取得された撮影画像36のラベル領域66において、追跡ラベル領域と同定が得られなかったものについては、新規の人物が出現したものとして、当該ラベル領域66の追跡特徴量に新規の追跡IDを付与する。また、これまで追跡していた追跡ラベル領域のうち、今回取得された撮影画像36のラベル領域66と同定が得られなかったものがある場合、当該追跡ラベル領域に対応する人物が消失したものとして、当該追跡用情報を削除する。
判定手段50は、追跡ラベル領域のそれぞれについて、侵入者か否かを判定する。本実施形態では、予め定めたフレーム数(例えば、5フレーム)以上、連続して人領域として追跡されている追跡ラベル領域を侵入者であると判定する。なお、追跡ラベル領域の推定移動速度などの特徴量を求め、求めた特徴量と予め記憶された人らしい特徴量(人らしい速度など)とを比較することにより、当該追跡ラベル領域が人らしいかを更に判定し、侵入者か否かを判定してもよい。
画像センサ22の構成概要としては以上の通りである。以下、ラベル整形手段46に含まれるヒストグラム算出手段52及び人領域検出手段54が実行するラベル分離処理及び人領域判定処理の詳細について説明する。なお、抽出手段44において複数のラベル領域66が抽出された場合、ヒストグラム算出手段52及び人領域検出手段54は、各ラベル領域66に対して以下に説明する処理を実行するが、ここでは1つのラベル領域66に注目して処理の内容を説明する。
まず、ラベル分離処理について説明する。図4には、ラベル領域66が抽出された変化領域画像39が示されている。ヒストグラム算出手段52は、変化領域画像39(撮影画像36)の光学中心70を原点とした極座標において、当該極座標の各方位角θに対するラベル領域66の画素数を計数する。すなわち、ヒストグラム算出手段52は、光学中心70から撮影画像36の径方向に延びる幅1画素分の直線72を周方向に単位角度ずつずらしていきながら、直線72上にあるラベル領域66の画素数を計数していく。なお、本実施形態では単位角度を1度としているが、単位角度はこれには限られない。
次いで、ヒストグラム算出手段52は、光学中心70を原点とする極座標における方位角と、ラベル領域66の画素数とからなるヒストグラム、すなわち、方位角毎のラベル領域66の画素数を表すヒストグラムを求める。図5に、ヒストグラム算出手段52が生成したヒストグラムの例が示されている。図5に示すヒストグラムにおいては、横軸が方位角を表し、縦軸がラベル領域66の画素数を表している。
人領域検出手段54は、ヒストグラム算出手段52が求めたヒストグラムにおいて、山の頂上(極大値)を検出し、極大値を示す方位角を特定する。当該方位角を頭頂部角度と記載する。図5に示したヒストグラムにおいては、極大値が2つ存在するため、人領域検出手段54は、2つの頭頂部角度a及びbを特定する。
次いで、人領域検出手段54は、特定した頭頂部角度において、光学中心70から最も離れたラベル領域66の画素位置(「最遠端位置」と記載する)を特定する。図6に、特定された最遠端位置80が示されている。上述のように、図5及び図6の例では、2つの頭頂部角度a及びbが特定されているため、図6に示すように、2つの最遠端位置80a及びbが特定されている。言うまでもないが、最遠端位置80aは頭頂部角度aに対応するものであり、最遠端位置80bは頭頂部角度bに対応するものである。最遠端位置80は、人物の頭頂部が存在する候補となる。
なお、人領域検出手段54は、ヒストグラムにおいて、頭頂部角度におけるラベル領域66の画素数が画素数閾値よりも小さい場合、当該頭頂部角度に人物の頭頂部が存在するとみなさないようにしてもよい。画素数閾値は予め決められていてもよいが、当該頭頂部角度における光学中心70から最遠端位置80までの距離に基づいて決定されてもよい。具体的には、光学中心70から最遠端位置80までの距離が大きくなるほど、画素数閾値を小さくするようにしてもよい。
また、特定する頭頂部角度の数を制限するようにしてもよい。これは、多数の頭頂部角度が特定されると、1つのラベル領域66が不要に多くの領域に分離されてしまうおそれがあるからである。
人領域検出手段54は、特定した最遠端位置80に人物の頭頂部が存在するとみなして撮影画像36内において人領域を求める。人領域の求め方は種々の求め方を採用することができるが、本実施形態では、人領域検出手段54は、画像範囲としての分離枠82(図6参照)を用いて人領域を求める。
分離枠82のサイズ及び形状は、参照情報40及び最遠端位置80に基づいて決定される。すなわち、分離枠82は、参照情報40の参照サイズにて規定される大きさの検出対象(人物)が丁度収まるように、分離枠82のサイズ及び形状を決定される。ここで、最遠端位置80を考慮するのは、全方位カメラで撮影された画像の特性上、同一サイズの人物であっても、撮影画像36内の当該人物の位置に応じて(特に光学中心70からの径方向における位置に応じて)人領域のサイズが変わるためである。
人領域検出手段54は、最遠端位置80に人物の頭頂部が存在するとみなした場合における参照サイズに相当するサイズ及び形状からなる分離枠82を設定する。最遠端位置80における分離枠82のサイズは、撮影部32の床面からの設置高さや焦点距離などの撮影条件情報を用いて参照サイズを逆透視変換することによって求めることができる。また、分離枠82の形状は、全方位カメラを用いて撮影しているため、環状扇形(annular sector)として設定している。図6の例では、最遠端位置80aに対応する分離枠82a、及び、最遠端位置80bに対応する分離枠82bが設定される。
なお、好ましくは、人領域検出手段54は、設定した分離枠82を撮影画像36の周方向に移動(スイープ)させながら、分離枠82内に含まれるラベル領域66の画素の数を計数し、分離枠82内のラベル領域66の画素の数が最大となる位置に分離枠82を設定する。なお、分離枠82のスイープは、分離枠82内に対応する最遠端位置80が含まれる範囲内、あるいはヒストグラム(図5参照)における山に基づく一定の角度範囲内であってよい。図7には、スイープされた後の分離枠82a及び82bが示されている。
分離枠82が設定されることで、1つのラベル領域66が、分離枠82内の部分と、それ以外の部分との複数の部分ラベル領域(部分変化領域)に分離されることとなる。図7の例では、1つのラベル領域66が、分離枠82a内の部分ラベル領域66a、分離枠82b内の部分ラベル領域66b、分離枠82a及び82b外の部分ラベル領域66cの3つの部分ラベル領域に分離される。
ヒストグラム算出手段52が求めたヒストグラムにおいて、山の頂上(極大値)が複数検出された場合、人領域検出手段54は、頭頂部角度におけるラベル領域66の画素数が大きい山であるほど人物に相当する部分である可能性が高いため、好適には、ヒストグラムにおいて画素数が大きい山から順に分離枠82を設定し、部分ラベル領域に分離する。このように頭頂部角度におけるラベル領域66の画素数が大きい山を優先して部分ラベル領域に分離することで、人物の像を含む可能性が高い部分ラベル領域を優先して分離することができる。これにより、複数の部分ラベル領域に分離する処理において、真の人領域が複数の部分ラベル領域に誤って分離されてしまう可能性が低減される。
続いて、人領域判定処理について説明する。人領域判定処理では、人領域検出手段54は、各部分ラベル領域の実空間における推定サイズや各部分ラベル領域に相当する撮影画像36の画像特徴に応じて、各部分ラベル領域が人領域であるか否かを判定する。具体的には、人領域検出手段54は、各部分ラベル領域の実空間における推定サイズ(推定幅・推定高さ)を求め、求めた推定サイズと予め記憶された人らしいサイズとを比較することにより、当該部分ラベル領域が「人らしい」か否かを判定する。また、影領域は、輪郭部分のエッジ強度が弱いといった特徴や、基準画像38のテクスチャが撮影画像36にも保存されるといった特徴、部分ラベル領域が負の輝度変化を示す(部分ラベル領域内の画素の輝度値が、基準画像38における対応領域中の画素の輝度値よりも低い)といった特徴などがある。したがって、部分ラベル領域のこれらの特徴量を算出し、予め設定された影らしい値と比較することにより、当該部分ラベル領域が「影らしい」か否かを判定する。
そして、人領域検出手段54は、「人らしい」と判定され、且つ、「影らしくない」と判定された部分ラベル領域を人領域であると判定する。このようにラベル分離処理及び人領域判定処理を実行することにより、人領域及び影領域を含む1つのラベル領域66から人領域が切り出され、撮影画像36から人領域を検出することが可能となる。
なお、ヒストグラム算出手段52が算出したヒストグラムにおいて、図8(a)に示すように、方位角0度(360度)に跨った山が形成される場合が考えられる。このような場合、方位角0度に跨った山は本来1つの山であるが、ヒストグラム上の表現に起因して、人領域検出手段54が当該山を2つの山として認識してしまう。これにより、不適切な分離枠82が設定されてしまい、適切な人領域の切り出しができなくなるおそれがある。
したがって、好適には、ヒストグラム算出手段52は、各方位角のうち、ラベル領域66の画素数が最も小さい値となる方位角を0度とした上で、ヒストグラムを求める。あるいは、ヒストグラムを求めた際に0度の方位角において画素数が0でない場合、当該ヒストグラムにおいて画素数が最も小さい値となる方位角を求め、当該方位角を0度となるようヒストグラムを補正(スライド)してもよい。この場合、頭頂部角度は補正分を考慮した値を使用する。これにより、例えば図8(a)のようなヒストグラムが生成されることが防止されて、図8(b)に示すような、好適な、すなわち方位角0度に跨る山が存在しないヒストグラムを生成することができる。これにより、不適切な分離枠82が設定されてしまい、適切な人領域の切り出しができなくなることが防止される。
なお、上述の実施形態では、人領域検出手段54が分離枠82を設定した上で人領域を求めていたが、人領域の求め方としてはその他の方法であってもよい。例えば、最遠端位置80に人物の頭頂部が存在するとみなして、撮影画像36自体から人領域を求めてもよい。具体的には、最遠端位置80を基準として撮影画像36から人物らしい形状や色などでパターンマッチングすることにより人領域を求めたり、最遠端位置80を基準として識別器を用いて人領域を求めるようにしてもよい。例えば、最遠端位置80に人物の頭頂部が存在しているとみなしたときに当該人物が存在しうる位置範囲内において撮影画像36からパターンマッチングしたり、識別器を用いて検出したりしてもよい。又は、最遠端位置80に人物の頭頂部が存在しているとみなしたときに当該人物が存在しうる方向範囲内において撮影画像36からパターンマッチングしたり、識別器を用いて検出したりしてもよい。
以上説明した通り、本実施形態によれば、地面に立っている人物や歩行している人物などのように、地面から鉛直上方向に頭頂部が位置している姿勢にある人物を、鉛直下方向を光学中心とした全方位カメラにて撮像した場合、当該人物が存在する方位角においては、ヒストグラムにおけるラベル領域66の画素数が大きくなることに鑑みて頭頂部角度を特定し、頭頂部角度における最遠端位置80(すなわち人物の頭頂部に相当する位置)が特定される。その上で、最遠端位置80に基づいて、1つのラベル領域66から人領域が切り出される。これにより、全方位カメラで取得された撮影画像36から、歪補正をすることなく人領域と影領域とを適切に分離した上で、人領域を検出することができる。
以下、図9に示すフローチャートに従って、ラベル分離処理の流れを説明する。図9に示された各ステップは、撮影画像36から抽出されたラベル領域66の数だけ繰り返し実行される。各ステップにおいて処理の対象となっているラベル領域66を対象ラベル領域と記載する。
ステップS10において変数nが0に初期化される。変数nは分離枠82の設定数を表す変数である。
ステップS12において、ラベル整形手段46は、対象ラベル領域の実空間におけるサイズが検出対象となる参照サイズ以下であるか否かを判定する。参照サイズ以下である場合、それ以上のラベル分離は一人の人物に対応する人領域を誤って複数の部分ラベル領域に分離してしまう恐れがあり、不要なラベル分離であるため、対象ラベル領域に対する処理を終了し、次のラベル領域66についての処理を実行する。対象ラベル領域のサイズが参照サイズ以下ではない場合、ステップS14に進む。
ステップS14において、ヒストグラム算出手段52は、対象ラベル領域について、方位角毎のラベル領域66の画素数を表すヒストグラムを求める。
ステップS16において、人領域検出手段54は、ステップS14において求められたヒストグラムにおいて、未処理の山の中で最も高い山(すなわち最もラベル領域66の画素が多く検出された方位角)を選択する。
ステップS18において、人領域検出手段54は、ステップS16で選択した山の高さ(すなわち画素数)が画素数閾値以下であるか否かを判定する。選択した山の高さが画素数閾値以下である場合、当該ヒストグラムにはラベル分離の処理対象となる山は最早存在しないことになるので、対象ラベル領域に対する処理を終了し、次のラベル領域66についての処理を実行する。選択した山の高さが画素数閾値より大きい場合、ステップS20に進む。なお、ステップS18において、上記の山の高さの判定に加えて、又は山の高さ判定に代えて、山の角度範囲であるΘ幅を求め、求めたΘ幅が予め定めた角度閾値以下の場合に、当該対象ラベル領域に対する処理を終了してもよい。
ステップS20において、人領域検出手段54は、ステップS16で選択した山の頂上に対応する方位角を頭頂部角度として特定した上で、当該頭頂部角度において光学中心70から最も離れたラベル領域66の画素位置を最遠端位置80として特定する。
ステップS22において、人領域検出手段54は、ステップS20で特定した最遠端位置80に人物の頭頂部が存在するとみなした場合における、当該人物に相当する分離枠82を設定する。
ステップS24において、人領域検出手段54は、ステップS22で設定した分離枠82を撮影画像36の周方向にスイープさせて、分離枠82内のラベル領域66の画素の数が最大となる位置に分離枠82を移動させる。
ステップS26において、人領域検出手段54は、対象ラベル領域を、ステップS24で移動された分離枠82内の部分ラベル領域と、それ以外の部分ラベル領域とに分離する。
ステップS28において、ラベル整形手段46は、変数nを1インクリメントする。
ステップS30において、人領域検出手段54は、ステップS26で分離された、分離枠82外の部分ラベル領域のサイズが参照サイズ以下であるか否かを判定する。参照サイズ以下である場合、分離枠82外の部分ラベル領域(すなわち次に処理対象となり得る領域)のそれ以上のラベル分離は不要であるため、対象ラベル領域に対する処理を終了し、次のラベル領域66についての処理を実行する。参照サイズ以下ではない場合、ステップS32に進む。
ステップS32において、ラベル整形手段46は、変数nが、ステップS14で求めたヒストグラムが有する山の総数に達したか否かを判定する。本実施形態では、山の総数以上の数の部分ラベル領域の分離を行わないため、変数nが山の総数に達した場合、対象ラベル領域に対する処理を終了し、次のラベル領域66についての処理を実行する。変数nが山の総数に達していない場合、ステップS34に進む。
ステップS34において、ラベル整形手段46は、変数nが予め設定された回数閾値(例えば3)に達したか否かを判定する。上述のように、1つのラベル領域66が不要に多くの領域に分離されてしまうのを防止するため、回数閾値を設定することが出来る。変数nが回数閾値に達した場合、対象ラベル領域に対する処理を終了し、次のラベル領域66についての処理を実行する。変数nが回数閾値に達していない場合、ステップS16に戻り、再度のステップS16以降の処理において、人領域検出手段54は、ステップS14で求められたヒストグラムの中で次に高い山について処理を行う。
図9に示すフローチャートにより、ラベル領域66が複数の部分ラベル領域に分離される。その後、上述のように、人領域検出手段54により人領域判定処理が実行されることによって、分離された各部分ラベル領域が人領域であるか否かが判定される。
以上、本発明に係る実施形態を説明したが、本発明は上記実施形態に限られるものではなく、本発明の趣旨を逸脱しない限りにおいて種々の変更が可能である。