発明の目的および利点は、請求の範囲に具体的に記載された構成要素および組み合わせによって実現され達成される。
前述の一般的な説明および以下の詳細な説明は、典型例および説明のためのものであって、本発明を限定するためのものではない、と理解される。
本発明の非限定的な実施形態を、図面を参照して説明する。図面において、同様のコンポーネントおよび要素には同じ参照番号が付されている。
監視用のカメラで撮影された一連のフレーム画像の全てにおいて人物の領域を画像認識して複数の特徴情報が抽出される場合、そのための処理負荷が過大になる。一方、その各フレーム画像における人物の領域を画像認識して複数の特徴を抽出する処理を簡略化すると、抽出された特徴情報の精度が低くなることある。また、一連のフレーム画像が間引きされて、その中から、処理対象とされるフレーム画像が或る時間間隔で取り出されることもある。この場合、人物の映像を含むフレーム画像の数が少なくなるので、人物を捕捉し損なうことがある。
フレーム画像において監視対象となる人物は様々な位置に出現する。フレーム画像において特徴が抽出される領域を決定するには、監視システム導入の際に、実際に撮影されたフレーム画像を分析して、フレーム画像のどの領域でどの特徴を抽出すれば人物の特徴抽出の精度が高くなるかを、試行錯誤で決定し、特徴毎に抽出領域を決定し調整することが望ましい。また、複数のカメラで監視が行われる場合、その全てのカメラに対して、個々に特徴毎の抽出領域が設定されることが望ましい。しかし、そのための作業は煩雑でコストが高い。
発明者たちは、一連のフレーム画像中に出現する或る人物の領域の大きさは、人物の移動方向に対して或る変化形態を示す、と認識した。発明者たちは、そのような変化形態に基づいて、抽出される特徴毎に、フレーム画像における人物領域の特徴抽出に適した位置を自動的に決定すれば、人物を捕捉し損なうことがなく、人物の特徴抽出のための処理負荷を低減することができる、と認識した。
実施形態の目的は、一連のフレーム画像から監視対象の識別または認識に適したフレーム画像を選択できるようにすることである。
実施形態の別の目的は、フレーム画像における監視対象の識別または認識に適した監視対象の位置を自動的に決定できるようにすることである。
図1は、実施形態による、監視システムに用いられる情報処理装置100の概略的な構成(configuration)の例を示している。
情報処理装置100は、プロセッサ112、メモリ114、入出力インタフェース(I/O)116、内部バス、等を含む例えばパーソナル・コンピュータのようなコンピュータまたは監視装置であってもよい。プロセッサ112は、コンピュータ用のCPU(Central Processing Unit)であってもよい。プロセッサ112およびメモリ114は、入出力インタフェース116に結合されている。メモリ114には、例えば、主記憶装置および半導体メモリ等が含まれる。情報処理装置100は、さらに、入出力インタフェース(I/O)116に結合された、入力部122、表示部124、記録媒体読み取り用のドライブ128、および記憶部130を含んでいる。入力部122は、例えばキーボード、マウスまたはタッチパッドのようなポインティング・デバイス、およびタッチパネルを含んでいてもよい。ドライブ128は、例えば光ディスクのような記録媒体129を読み取るために設けられている。記憶部130は、ハードディスク・ドライブ(HDD)および/またはフラッシュメモリ・ドライブ(SSD:Solid State Drive)であってもよい。情報処理装置100は、さらに、入出力インタフェース(I/O)116に結合された、USBインタフェース(USB I/F)142、およびネットワーク・インタフェース(NW I/F)144を含んでいる。情報処理装置100において、USBインタフェース142および/またはネットワーク・インタフェース144は、少なくともカメラ202〜206からの画像信号を入力する入力部としても機能してもよい。
情報処理装置100において、入力部122、表示部124、およびドライブ128は、情報処理装置100の外部にあって、外部要素として情報処理装置100に結合されてもよい。
プロセッサ112は、操作監視機能を含む例えば集積回路として実装された専用のプロセッサであってもよい。また、プロセッサ112は、メモリ114および/または記憶部130に格納された画像処理機能を有するアプリケーション・プログラムに従って動作するものであってもよい。アプリケーション・プログラムは、記録媒体129に格納されていて、ドライブ128によって記録媒体129から読み出されて情報処理装置100にインストールされてもよい。
カメラ202〜206は、USBケーブルによって、USBインタフェース142および任意にUSBハブ146を介して情報処理装置100に結合される。情報処理装置100は、ネットワーク・インタフェース144を介し、さらに外部ネットワーク5を介して、監視センタに設置された監視センタ装置(図示せず)に接続されてもよい。
図2は、情報処理装置100のプロセッサ112の概略的な構成(configuration)の例を示している。
プロセッサ112は、例えば、制御部1120、画像取得部1122、移動体検出部1124、移動体変化検出部1128、適切画像選択部1130、特徴領域割当部1132、特徴抽出処理部1136、およびその他の処理部1138を含んでいてもよい。制御部1120は、画像取得部1122、移動体検出部1124、移動体変化検出部1128、適切画像選択部1130、特徴領域割当部1132、特徴抽出処理部1136および処理部1138に制御信号を供給して、これらの要素の動作を制御してもよい。
映像取得部1122は、カメラ202〜206で撮影されて記憶部130に格納された一連のフレーム画像のデータを取り出して、移動体検出部1124に供給する。
移動体検出部1124は、フレーム画像のデータから移動体を検出して追跡する。移動体検出部1124は、例えば、移動体に対応する複数種類のテンプレート・マッチングを行い、フレーム画像から移動体を抽出し、抽出した移動体の追跡を行う。移動体の検出には、その他の既知の技術を用いてもよい。例えば、予め用意された背景画像と現在のフレーム画像との間の差分を移動体として抽出し、この差分領域の重なりに基づいてその移動体を追跡してもよい。
移動体の位置およびサイズまたは大きさが、移動体の輪郭の外接長方形の中心および高さで表される。代替形態として、移動体の位置は、移動体の輪郭の外接長方形の特定位置(例えば、右上)の頂点で表されてもよい。また、移動体のサイズは、移動体の輪郭の外接長方形の高さと幅の積(面積)または高さと幅の和で表されてもよい。
移動体検出部1124は、フレーム画像における移動体の外接長方形の領域を切り出し、例えば図15のような、各移動体の位置およびサイズを決定して、移動体の識別情報と共に移動体変化検出部1128に供給する。
移動体変化検出部1128は、例えば図15のような移動体の位置およびサイズ(高さ)に基づいて、例えば図16のような隣接フレーム間での移動体の位置およびサイズの差分を生成する。
適切画像選択部1130は、フレーム画像における移動体領域の位置に基づいて、特徴抽出に適したフレーム画像であるかどうかを判定し、特徴抽出に適したフレーム画像とその移動体領域に関する情報を特徴抽出処理部1136に供給する。適切画像選択部1130は、各移動体が、対象経路として規定された移動方向に沿って移動しているかどうかを判定する。規定の移動方向は、経路形状により予め与えることも可能である。規定の移動方向は、例えば、人の顔が映るように配置されたカメラでは、フレーム画像の奥から手前の方向であってもよい。例えば、その規定の移動方向と逆方向に後ろ向きで移動する移動体または人は、そのカメラの監視対象としなくてもよい。また、対象経路として規定する移動方向は、一連のフレーム画像における多数の人の移動方向の統計的な平均であっても、または一連の画像フレームにおける各人が最後の方で現れる画像フレームから遡って直近の数フレームにおける各人の移動方向の統計的な平均であってもよい。適切画像選択部1130は、人の移動方向が、規定の移動方向である場合、人のサイズの増加傾向が減少または非増加へと変化する境界Bを求める。適切画像選択部1130は、その境界Bの前後の2つのフレーム画像を、それぞれの異なる特徴を抽出するのに適したフレーム画像であるとしてもよい。規定の経路が角を曲がる形態のものであれば、その境界Bの前のフレーム画像が、人の全体的特徴と顔特徴の両特徴を抽出するのに用いられてもよい。一方、規定の経路が直線的な経路であれば、その境界Bの前のフレーム画像が人の全体的特徴の抽出に用いられ、その境界Bの後のフレーム画像が人の顔特徴を抽出するのに用いられてもよい。
特徴抽出処理部1136は、移動適切画像選択部1130の判定に従って、人の領域の画像を認識して、それぞれの特徴を抽出する。或る移動体識別情報または人識別情報の人の特徴が抽出される場合、特徴抽出処理部1136は、特徴の抽出に適したフレーム画像に関する情報に基づいて、そのフレーム画像を記憶部130から読み込んで、そのフレーム画像において位置およびサイズで表される人の領域に対して画像認識を行ってその特徴を抽出する。
人の全体的特徴には、例えば、身長、歩容特徴、服の色、等がある。特徴抽出処理部1136は、既知の技術を用いて、身長について、例えば、その位置とサイズに基づいて、グラフ・カット等のセグメンテーションによって画像中でのサイズを抽出し、カメラ校正情報を用いて身長に換算してもよい。特徴抽出処理部1136は、服の色について、例えば、セグメンテーション領域内のRGB(赤、緑、青)情報に基づいて認識および色を抽出してもよく、上半身と下半身に領域を分けて認識および色を抽出してもよい。顔検出処理として、例えばブースティング(Boosting)が用いられて、顔画像が切り出されてもよい。
特徴領域割当部1132は、フレーム画像における特徴抽出に適した人領域の位置に関するデータが充分に蓄積したとき、フレーム画像においてそれぞれの特徴抽出に適したその人領域の位置の領域を割り当ててもよい。その割当領域は、長方形またはその他の任意の形状であってもよい。特徴領域割当部1132は、抽出したい特徴の集合ごとに、その特徴を抽出するのに適した位置の領域を決定する。その後、特徴抽出処理部1136は、割り当てられた領域内に人領域の位置が来るフレーム画像のその人領域に対して、人領域に対して画像認識を行って特徴を抽出する。
図3は、カメラ202から見てその視野における右上側の奥から左下側の手前の方向に移動する移動体識別情報ID=jが付与された移動体または人を監視する、通路の側部におけるカメラ202の配置の例を示している。移動体識別情報IDは、フレーム画像に出現する移動体または人を識別するために付与される任意の順序番号であってもよい。
図4は、カメラ202によって撮影された、移動体識別情報ID=jが付与された人の映像を含むフレーム画像FN=iの例を示している(i=1〜N)。この場合、カメラ204は、概して人を前方斜め右横から見下ろす視野を有する。
図4において、フレーム画像FN=iにおける中央の縦長の長方形状の領域の枠は、移動体識別情報ID=jが付与された人の輪郭を含むまたは人の輪郭に外接する長方形であり、高さおよび幅のサイズを有し、中心位置×を有する。フレーム画像FN=iには、例えば移動体識別情報ID=j−1およびj+1等が付与された他の人の映像が含まれていてもよい。
図5は、カメラ202によって撮影された一連の複数のフレーム画像FN=1〜Nに出現する、同じ背景上で移動体識別情報ID=jが付与された人を表す長方形の移動とサイズの変化の例を示している。フレーム番号FN=1〜Nは、最新のフレーム画像から最も古いフレーム画像までに対して、現在から過去へ遡る順序で付与される。この場合、通路に沿って人を表す長方形の中心位置が右上側の奥から左下側の手前へと概ね直線的に移動し、その長方形のサイズがその移動とともに徐々に拡大し、途中で或る位置または時点を境界Bにして徐々に縮小する。
但し、人物として画像認識または特徴抽出が困難な長方形またはそのような長方形のみを含むフレーム画像は、処理の対象から除外されてもよい。そのような長方形は、例えば、フレーム画像の上下左右の辺に接していて、横幅より小さい高さを有する長方形、高さ対幅の比が人物を表し得る或る閾値より大きいまたは或る閾値より小さい長方形、およびピクセル数で或る閾値のより小さい高さもしくは幅または面積を有するものである。図24は、処理の対象から除外され得る人を表す長方形の配置および形状を含むフレーム画像FN=01、02、03、および(N+1)の例を示している。
図6は、図5の人を表す長方形の中心位置の移動方向に沿った移動距離に対する人を表す長方形のサイズの変化の例を示している。この場合、人を表す長方形のサイズは高さである。
図6において、移動とともに、最初のフレーム画像FN=Nから途中のフレーム画像FN=3までに、移動体識別情報ID=jの人を表す長方形のサイズが徐々に増大する。その後、或る位置または時点を境界Bにして、フレーム画像FN=3から最新または最後のフレーム画像FN=1までの間に、移動体識別情報ID=jの人を表す長方形のサイズが徐々に減少する。
この場合、移動体識別情報ID=jの人を表す長方形の高さが最大であるフレーム画像FN=3は、その境界Bの直前に位置し、人の全身の映像が最大の高さおよび幅を有し最大の解像度を有するので、移動体識別情報ID=jの人の全身的特徴を識別または抽出するのに適している。また、移動体識別情報ID=jの人の顔領域が最大であるフレーム画像FN=1は、人の顔部分の映像が最大の高さおよび幅を有し最大の解像度を有するので、移動体識別情報ID=jの人の顔の特徴を識別または抽出するのに適している。従って、移動体識別情報ID=jの人の全身的特徴および顔特徴の識別に適したものとして、この場合、N個のフレーム画像の中から2つのフレーム画像FN=3および1だけが選択される。
図7は、カメラ204から見てその視野における上側の奥から下側の手前の方向に移動する移動体識別情報ID=jが付与された人を監視する、通路の天井におけるカメラ204の配置の例を示している。
図8は、カメラ204によって撮影された、移動体識別情報ID=jが付与された人の映像を含むフレーム画像FN=iの例を示している(i=1〜N)。この場合、カメラ204は、概して人を前方斜め上から見下ろす視野を有する。
図9は、カメラ204によって撮影された一連の複数のフレーム画像FN=1〜Nに出現する、同じ背景上で移動体識別情報ID=jが付与された人を表す長方形の移動とサイズの変化の例を示している。この場合、通路に沿って人を表す長方形の位置が中上側の奥から中下側の手前へと概ね直線的に移動し、その長方形のサイズがその移動とともに徐々に拡大し、途中で或る位置または時点を境界Bにして途中で徐々に縮小する。但し、例えば図24に示されているような人物として画像認識または特徴抽出が困難な長方形またはそのような長方形のみを含むフレーム画像は、除外されてもよい。
図10は、図9の人を表す長方形の中心位置の移動方向に沿った移動距離に対する人を表す長方形のサイズの変化の例を示している。この場合、人を表す長方形のサイズは高さである。
図10において、移動とともに、最初のフレーム画像FN=Nから途中のフレーム画像FN=3までに、移動体識別情報ID=jの人を表す長方形のサイズが徐々に増大する。その後、或る位置または時点を境界Bにして、フレーム画像FN=3から最新または最後のフレーム画像FN=1までの間に、移動体識別情報ID=jの人を表す長方形のサイズが徐々に減少する。この場合、図6の場合と同様に、移動体識別情報ID=jの人の全身的特徴および顔特徴の識別に適したものとして、N個のフレーム画像の中から2つのフレーム画像FN=3および1だけが選択される。
図11は、カメラ206から見てその視野における右上側の奥から前方へ移動し途中で左へ曲がってさらに左側の方向に移動する移動体識別情報ID=jが付与された人を監視する、通路の天井におけるカメラ206の配置の例を示している。
図12は、カメラ206によって撮影された、移動体識別情報ID=jが付与された人の映像を含むフレーム画像FN=iの例を示している(i=1〜N)。この場合、カメラ206は、概して人を前方斜め上および斜め横から見下ろす視野を有する。
図13は、カメラ206によって撮影された一連の複数のフレーム画像FN=1〜Nに出現する、同じ背景上で移動体識別情報ID=jが付与された人を表す長方形の移動とサイズの変化の例を示している。この場合、通路に沿って人を表す長方形の位置が右上側の奥から右下側の手前の方向に概ね直線的に移動し、その長方形のサイズがその移動とともに徐々に拡大し、途中で顔を左に向けて左に曲がり、そこからさらに左側へと直線的に移動してそのままの高さのサイズで消失する。但し、例えば図24に示されているような人物として画像認識または特徴抽出が困難な長方形またはそのような長方形のみを含むフレーム画像は、除外されてもよい。
図14は、図13の人を表す長方形の中心位置の移動方向に沿った移動距離に対する人を表す長方形のサイズの変化の例を示している。この場合、人を表す長方形のサイズは高さである。
図14において、移動とともに、最初のフレーム画像FN=Nから途中のフレーム画像FN=3までに、移動体識別情報ID=jの人を表す長方形のサイズが徐々に増大する。フレーム画像FN=3までは、人は正面を向いている。その後、或る時点を境界Bにして、フレーム画像FN=3から最新または最後のフレーム画像FN=1までの間に、移動体識別情報ID=jの人の顔が横向きになって左側へと移動する。
この場合、人の長方形の高さが最大であるフレーム画像FN=3は、その境界Bの直前に位置し、移動体識別情報ID=jの人がほぼ正面を向いていてその全身の映像が概して最大の高さおよび幅を有し最大の解像度を有するので、移動体識別情報ID=jの人の全身的特徴を抽出するのに適している。また、人の顔領域が最大でほぼ正面を向いているフレーム画像FN=3は、移動体識別情報ID=jの人の顔部分の映像が、最大の高さおよび幅を有し最大の解像度を有するので、移動体識別情報ID=jの人の顔の特徴を識別するのに適している。フレーム画像FN=1、2は、人を表す長方形のサイズは最大であるが、顔が正面を向かず左側を向いているので、顔の特徴の識別に適さない。従って、移動体識別情報ID=jの人の全身的特徴および顔特徴の両方の識別に適したものとして、N個のフレーム画像の中からその境界Bの直前の1つのフレーム画像FN=3だけが選択される。
図15は、一連のフレーム画像FN=1〜Nにおける複数の移動体識別情報ID1〜5の人の位置およびサイズ(高さ)の表の例を示している。ここで、FN=1が時間的に最も新しいフレーム画像を表す。また、例えば、x方向は図4、8および12の画面における左方向であり、y方向は、図4、8および12の画面における下方向である。
図15の表において、最新のフレーム画像FN=1から遡ってフレーム画像FN=6までにおける移動体識別情報ID=1〜5の人を表す長方形の中心位置(x,y)およびサイズの例を示している。この場合、長方形のサイズは、長方形のy方向の高さを表す。代替形態として、長方形のサイズは、長方形のy方向の高さとx方向の幅の和であっても、長方形のy方向の高さの2乗とx方向の幅の2乗の和の平方根、即ち長方形の対角線の距離であっても、または長方形のy方向の幅とx方向の幅の積、即ち長方形の面積であってもよい。
図16は、図15の隣接する2つのフレーム画像FN=1と2、2と3、3と4、...の間の複数の移動体識別情報ID1〜5の人の位置(座標)およびサイズ(高さ)の差分の表の例を示している。ここで、差分は、或るフレーム画像(例えばFN=1)における位置およびサイズから、それぞれその前のフレーム画像(例えばFN=2)における位置およびサイズを減算した値である。
図16の表において、例えば、移動体識別情報ID3の長方形のサイズは、フレーム画像FN=3とFN=4の間で、サイズの差分が正から負に転じ、増加から減少に転じ、フレーム画像FN=1に近づくに従って減少している。また、例えば、移動体識別情報ID1の長方形のサイズは、フレーム画像FN=1とFN=2の間で、サイズの差分が正から負に転じ、増加から減少に転じている。
図17Aおよび17Bは、情報処理装置100によって実行される、長時間にわたって連続的に撮影されたフレーム画像の中から、位置およびサイズに関して有意な差異を有する一連のフレーム画像FN=1〜Nを選択するための予備処理のためのフローチャートの例を示している。その連続的に撮影されたフレーム画像は、例えば、毎秒2、15または30フレームの高いレートで撮影されたものであってもよい。選択された一連のフレーム画像FN=1〜Nは、例えば、図5、9、13および15のようなものであってもよい。
図17Aのステップ510において、情報処理装置100のプロセッサ112(その画像取得部1122)は、記憶部130から、長時間にわたって連続的に撮影されたフレーム画像を取得する。
ステップ512において、プロセッサ112(その移動体検出部1124)は、長時間にわたって連続的に撮影されたフレーム画像の中から、人の画像として識別され同じ移動体識別情報が付与される少なくとも一人または1つの移動体の画像を含む一連のフレーム画像1〜mを決定する。プロセッサ112(移動体検出部1124)は、フレーム画像1〜m中の移動体を検出して、各フレーム画像における移動体の外接長方形の領域を切り出し、例えば図15の表のような、各移動体を表す長方形の中心位置およびサイズを決定し、同じ移動体に同じ移動体識別情報を付与する。プロセッサ112(移動体検出部1124)は、各フレーム画像における各移動体を表す長方形の中心位置およびサイズをその移動体識別情報と共にそのフレーム画像の識別情報に関連付けて記憶部130に格納する。
ステップ514〜556は、フレーム画像1〜mにおける複数の移動体識別情報IDの各々について繰り返し実行される。ここで、mはNより大きい整数である(m>N)。また、フレーム画像は、その番号が大きくなるに従って(昇順に)時間的により古い過去のフレーム画像を表す。
ステップ516において、プロセッサ112(その移動体変化検出部1128)は、フレーム画像1〜mの中で、着目する移動体識別情報IDの人の映像について、処理対象となり得るフレーム画像M1〜Mn(M1<Mn≦m)を決定する。フレーム画像M1〜Mnは、例えば、上述したような、人物として画像認識または特徴抽出が困難な人を表す長方形またはそのような長方形のみを含むフレーム画像が除外されたものであってもよい。プロセッサ112(移動体変化検出部1128)は、さらに、開始フレームとして、フレーム画像1〜m中の着目する移動体識別情報IDの人の映像を含む最新フレームM1を設定し、メモリ114に格納する。
ステップ518〜554において、フレーム画像M1〜Mnにおける1つの移動体識別情報IDの長方形の中心位置およびサイズの各差分に関する判定が繰り返し実行される。
ステップ520において、プロセッサ112(移動体変化検出部1128)は、対象1として開始フレームを設定する。最初は、対象1として、開始フレームであるフレーム画像M1が設定される。ステップ522において、プロセッサ112(移動体変化検出部1128)は、対象2として対象1の前のフレーム画像(M1+1)を設定する。
ステップ524〜538は、対象2のフレームとして対象1の前の1つ以上のフレーム画像に対して、対象1との間の1つの移動体識別情報IDの長方形の中心位置およびサイズの各差分に関する判定が繰り返し実行される。
ステップ526において、プロセッサ112(移動体変化検出部1128)は、対象1と対象2の間の長方形の中心位置およびサイズの差分を算出する。例えば、移動体識別情報ID=1について、最初は、対象1としてのフレーム画像M1における長方形の中心位置座標(x4,y4)と、対象2としてのフレーム画像(M1+1)における長方形の中心位置座標(x5,y5)の間の差分(Δx45,Δy45)が求められる。また、例えば、移動体識別情報ID=1について、最初は、対象1としてのフレーム画像M1における長方形の高さ(Hy4)と、対象2としてのフレーム画像(M1+1)における長方形の高さ(Hy5)の間の差分ΔHy45が求められる。
図17Bのステップ532において、プロセッサ112(移動体変化検出部1128)は、対象1と対象2の間の長方形の中心位置の差分ΔPおよびサイズの差分ΔHyをそれぞれ閾値Pth、Sthと比較して、それぞれ閾値Pth、Sthより小さいかどうかを判定する(ΔP=(Δx2+Δy2)1/2<Pth、ΔHy<Sth)。それらの差分のいずれかがそれぞれ閾値Pth、Sthより小さいと判定された場合は、手順はステップ534に進む。それらの差分のいずれもそれぞれ閾値Pth、Sthより小さくない、即ちそれらの差分のいずれもそれぞれ閾値Pth、Sth以上である、と判定された場合は、手順はステップ542に進む。
ステップ534において、プロセッサ112(移動体変化検出部1128)は、対象2より前のフレーム画像が、フレーム画像M1+2〜Mnの中に存在するかどうかを判定する。対象2より前のフレーム画像が存在すると判定された場合は、手順はステップ536に進む。対象2より前のフレーム画像が存在しないと判定された場合は、手順はステップ538に進む。
ステップ536において、プロセッサ112(移動体変化検出部1128)は、対象2=対象2の前のフレーム画像と設定する。例えば、現在の対象2がフレーム画像(M1+1)の場合、新しい対象2としてフレーム画像(M1+2)が設定される。その後、手順はステップ538に進む。
ステップ536の後で、ステップ538でステップ526に戻って、プロセッサ112(移動体変化検出部1128)は、対象1とその更新された対象2との間の長方形の中心位置およびサイズの差分を算出する。例えば、移動体識別情報ID=1について、対象1としてのフレーム画像M1における長方形の中心位置座標(x4,y4)と、対象2としてのフレーム画像(M1+2)における長方形の中心位置座標(x6,y6)の間の差分(Δx46,Δy46)が求められる。また、例えば、移動体識別情報ID=1について、対象1としてのフレーム画像M1における長方形の高さ(Hy4)と、対象2としてのフレーム画像(M1+2)における長方形の高さ(Hy6)の間の差分ΔHy46が求められる。
ステップ542において、プロセッサ112(移動体変化検出部1128)は、対象1および対象2のフレーム画像の識別情報と、その両フレーム画像における同じ識別情報の移動体を表す長方形の間の差分(Δx,Δy)および差分ΔHyとを記憶部130に格納する。このようにして、同じ移動体識別情報の人を表す長方形が、対象1のフレーム画像のものに対して有意な差分を有する対象2のフレーム画像が選択される。
ステップ550において、プロセッサ112(移動体変化検出部1128)は、対象2より前のフレーム画像が、対象2より前のフレーム画像((M1+2)〜M2)の中に存在するかどうかを判定する。対象2より前のフレーム画像が存在すると判定された場合は、手順はステップ552に進む。対象2より前のフレーム画像が存在しないと判定された場合は、手順はステップ554に進む。
ステップ552において、プロセッサ112(移動体変化検出部1128)は、次の開始フレームとして現在の対象2のフレーム画像を設定する。その後、手順はステップ554に進む。ステップ552において開始フレームとして設定された対象2のフレーム画像は、ステップ520において次の対象1として設定される。
このようにして、フレーム画像1〜mまたはそのフレーム画像M1〜M2の中から、1つの移動体識別情報が付与される人の長方形の中心位置およびサイズに関して有意な差異を有する一連のフレーム画像FN=1〜Nが選択される。それによって、選択された各フレーム画像に対して類似し有意な差異のないフレーム画像が除去またはフィルタリングにより除外され、処理されるフレーム画像の数を低減することができ、処理負荷を小さくすることができる。例えば、隣接する元のフレーム画像間で位置および/またはサイズの差分が小さい場合、人が非常にゆっくり歩いているかまたは立ち止まっていることを表す。この場合、人の位置およびサイズの変化が適切に検出されない可能性がある。これに対して、フレーム画像M1〜M2に図17Aおよび17Bの処理を施すことによって、選択されたフレーム画像FN=1〜Nについて有意な量の差分を有する変化が検出できるように、余分なフレーム画像が間引かれる。それによって、例えば図15および16の表におけるフレーム画像FN=1〜Nにおける人を表す長方形の位置およびサイズの推移並びにそれらの差分が、人の映像の位置およびサイズの変化を検出するのに有意なデータとなる。
図18は、情報処理装置100によって実行される、一連のフレーム画像FN=1〜Nの中から、特定の移動体識別情報IDについて人の身体的特徴および顔特徴を識別するのに適した2つまたは1つのフレーム画像を選択するためのフローチャートの例を示している。
図18を参照すると、ステップ662〜678は、1つ以上の移動体識別情報IDについて繰り返し実行される。
ステップ664において、情報処理装置100のプロセッサ112(その適切画像選択部1130)は、1つの移動体識別情報IDについて、一連のフレーム画像FN=1〜Nにおける一連の位置の差分で表される移動が、規定の移動方向を表すかどうかを判定する。ここで、一連の位置とは、人を表す複数の長方形の中心位置である。その移動が規定の移動方向を表していないと判定された場合は、手順は図18のルーチンを出る。その移動が規定の移動方向を表していると判定された場合は、手順はステップ666に進む。
その規定の移動方向は、例えば、通路が、カメラの視野における右上側の奥から左下側の手前へ向かう場合、および右上側の奥から前方へ向かい途中で左へ曲がる場合において、一連の位置の横x軸方向の全ての差分が負(Δx<0)でありかつ縦y軸方向の全ての差分が正(Δy>0)であることである。その規定の移動方向は、その通路の配置が左右逆の場合は、例えば、一連の位置の横x軸方向の全ての差分が正(Δx>0)でありかつ縦y軸方向の全ての差分が正(Δy>0)となる。
ステップ666において、プロセッサ112(適切画像選択部1130)は、一連のフレーム画像FN=1〜Nにおける人を表す長方形のサイズまたは高さが、時間経過とともに(FN=NからFN=1まで)或る時点まで増加傾向を示しかつ途中でその増加傾向が変化するかどうかを判定する。そのサイズが増加傾向を示しかつ増加傾向が途中で変化すると判定された場合は、手順はステップ668に進む。そのサイズが増加傾向を示すことがなくまたはその増加傾向が途中で変化することはないと判定された場合は、手順は図18のルーチンを出る。それによって、例えば、一連のフレーム画像FN=1〜Nにおいて、移動体としての昆虫がカメラの視野で規定の移動方向で空中を飛んでカメラに向かって接近し徐々に拡大して突然消える場合のそのような移動体が除外できるであろう。
ステップ668において、プロセッサ112(適切画像選択部1130)は、一連のフレーム画像FN=1〜Nを特徴抽出対象として決定する。
ステップ670において、プロセッサ112(適切画像選択部1130)は、一連のフレーム画像FN=1〜Nの長方形の一連の中心位置の差分およびサイズによって表される経路が、例えば図11〜14のような角を曲がるパターンであるかどうかを判定する。その経路が角を曲がるパターンであると判定された場合は、手順はステップ672に進む。その経路が角を曲がるパターンでないと判定された場合は、手順はステップ674に進む。
ステップ672において、プロセッサ112(適切画像選択部1130)は、移動体識別情報ID=jの身体的特徴および顔特徴を識別するためのフレーム画像として、人を表す長方形のサイズまたは高さが増大から非増大に転じる境界Bの直前のフレーム画像FN=Iを選択する。
例えば、図13および14において、身体的特徴および顔特徴を識別するためのフレーム画像として、フレーム画像FN=3が選択される。この場合、フレーム画像FN=3では、移動体識別情報ID=jの人は、ほぼ正面を向いており、かつ人を表す長方形の面積が大きい。フレーム画像FN=2では、移動体識別情報ID=jの人を表す長方形の高さは最大であるが、顔が斜め横を向いており、顔の特徴を識別するのに適していないであろう。但し、人の横向きの特徴が識別または抽出される場合には、さらに、長方形のサイズまたは高さが増大から非増大に転じる境界Bの直後のフレーム画像FN=2が選択されてもよい。
ステップ674において、プロセッサ112(適切画像選択部1130)は、移動体識別情報ID=jの身体的特徴を識別するためのフレーム画像として、人が正面を向き、かつ人を表す長方形のサイズまたは高さが増大から減少に転じる境界Bの直前のフレーム画像FN=Iを選択する。この場合、人の全身の高さおよび幅の両サイズが最大となる。さらに、プロセッサ112(適切画像選択部1130)は、移動体識別情報ID=jの顔特徴を識別するためのフレーム画像として、顔が正面を向き、かつ顔領域の高さおよび幅の両サイズが最大となるフレーム画像FN=1を選択する。
例えば、図5および6において、身体的特徴を識別するためのフレーム画像としてフレーム画像FN=3が選択される。この場合、フレーム画像FN=3では、移動体識別情報ID=jの人は、人の全身を表す長方形の高さおよび幅の両サイズが最も大きい。また、図5および6において、顔特徴を識別するためのフレーム画像として最新のフレーム画像FN=1が選択される。但し、最新のフレーム画像FN=1では顔の領域の一部が画面から切れまたははみ出す可能性がある場合は、長方形のサイズまたは高さが増大から減少に転じる境界Bの後にある、最新のフレーム画像FN=1の直前のフレーム画像FN=2が選択されてもよい。
ステップ676において、プロセッサ112(適切画像選択部1130)は、身体的特徴を識別するためのフレーム画像FN=Iと、顔特徴を識別するためのフレーム画像FN=Iまたは1とを、特徴識別用または特徴抽出用のフレーム画像として決定する。sついで、プロセッサ112(適切画像選択部1130)は、そのフレーム画像FN=Iおよびフレーム画像FN=Iまたは1の識別情報を、特徴識別用または特徴抽出用のフレーム画像として記憶部130に格納する。フレーム画像の識別情報は、フレーム画像1〜mにおけるフレーム番号または時刻で表されてもよい。
全ての移動体識別情報についてステップ662〜678が繰り返された後、手順は図18のルーチンを出る。
このようにして選択されて記憶部130に格納された、身体的特徴識別用のフレーム画像FN=Iと、顔特徴識別用のフレーム画像FN=Iまたは1の識別情報は、フレーム画像1〜mに関連付けて格納されて、フレーム画像1〜mにおける人の検索に用いられてもよい。さらに、その選択されたフレーム画像FN=Iおよび/または1に関連付けて、その移動体識別情報ID=jの人を表す長方形の位置情報が格納されて、その人の識別に用いられてもよい。それによって、監視者または管理人は、情報処理装置100の入力部122を操作して、フレーム画像1〜mから2つまたは1つのフレーム画像FN=Iおよび/または1を取り出して表示部124に表示し、移動体識別情報ID=jの人を表す長方形を強調表示させて、その人の特徴を観察し、識別しまたは確認することができる。それよって、フレーム画像1〜mに含まれる複数の人の身体的特徴および顔特徴の識別または抽出が短時間で効率的に行える。
さらに、フレーム画像FN=Iおよび/または1について、特徴抽出処理部1136によって、画像認識を行って身体的特徴および顔特徴が抽出されて検索情報またはキーワードとしてフレーム画像FN=Iまたは1に関連付けて記憶部130に格納されてもよい。それによって、監視者または管理人は、情報処理装置100の入力部122を操作して、検索情報に基づいて、フレーム画像1〜mの中から、特定の身体的特徴および顔特徴を有する人の映像を含むフレーム画像を検索して表示部124に表示することができる。それによって、フレーム画像1〜mに含まれる特定の身体的特徴および顔特徴を有する人の検索が短時間で効率的に行える。
図19は、情報処理装置100によって実行される、一連のフレーム画像FN=1〜Nにおいて、移動体または人の身体的特徴および顔特徴を識別するのに適した特徴領域を割り当ておよび抽出するためのフローチャートの例を示している。
図19を参照すると、ステップ720は、図17Aおよび17Bの処理(ステップ510〜556)と同様である。ステップ720において、プロセッサ112(画像取得部1122)は、記憶部130から、長時間にわたって連続的に撮影されたフレーム画像を取得する。次いで、プロセッサ112(移動体検出部1124)は、長時間にわたって連続的に撮影されたフレーム画像の中から、人の画像として識別され同じ移動体識別情報が付与される少なくとも一人の画像を含む一連のフレーム画像1〜mを決定する。次いで、プロセッサ112(移動体変化検出部1128)は、フレーム画像1〜mの中から、1つの移動体識別情報が付与される人を表す長方形の位置およびサイズに関して有意な差異を有する一連のフレーム画像FN=1〜Nを決定する。
ステップ740において、プロセッサ112(その特徴領域割当部1132)は、身体的特徴および顔特徴を識別するのに適した、人を表す長方形の中心位置の可能な範囲を表す特徴領域が、フレーム画像の画面において割り当てられているかどうかを判定する。その特徴領域が未だ割り当てられていないと判定された場合は、手順はステップ752に進む。最初は、特徴領域が未だ割り当てられていない。その特徴領域が既に割り当てられていると判定された場合は、手順はステップ754に進む。
ステップ752は、図18の処理に類似した処理であり、後で詳しく説明する図20のフローチャートに相当する処理を含んでいる。ステップ752において、プロセッサ112(適切画像選択部1130)は、一連のフレーム画像FN=1〜Nの人を表す長方形の一連の中心位置の差分およびサイズまたは高さに基づいて、特徴の識別または抽出に適した長方形の中心位置を格納する。
図22Aは、特徴識別用または特徴抽出用の長方形の中心位置902および904の例を示している。図22Bは、多数の移動体識別情報について蓄積された多数の中心位置902および904の例を示している。図22Cは、蓄積された多数の中心位置902および904に基づいて割り当てられた特徴領域912、914の例を示している。
図22A〜22Cにおいて、中心位置902は身体的特徴を識別するのに適した長方形の中心位置であり、中心位置904は顔特徴を識別するのに適した長方形の中心位置である。
ステップ762において、プロセッサ112(特徴領域割当部1132)は、長方形の中心位置のデータの数が閾値より多いかどうかを判定する。この閾値は、特徴領域を割り当てるのに充分なデータ数を表す。データの数が閾値より多いと判定された場合は、手順は図19のルーチンを出る。データの数が閾値より多くないと判定された場合は、手順はステップ772に進む。
ステップ772は、後で詳しく説明する図21のフローチャートに相当する処理を含んでいる。ステップ772において、プロセッサ112(特徴領域割当部1132)は、複数の移動体識別情報の身体的特徴を識別するのに適した各長方形の中心位置の集合を、フレーム画像における身体的特徴を識別するのに適した特徴領域として割り当てる。また、プロセッサ112(特徴領域割当部1132)は、複数の移動体識別情報の顔特徴を識別するのに適した各長方形の中心位置の集合を、フレーム画像における顔特徴を識別するのに適した特徴領域として割り当てる。それによって、以後、身体的特徴および顔特徴を識別するための長方形の中心位置の範囲を表す2つまたは1つの特徴領域が、フレーム画像の画面において割り当て済みとなる。
ステップ754は、図18の処理に類似した処理であり、後で詳しく説明する図23のフローチャートに相当する処理を含んでいる。ステップ754において、プロセッサ112(適切画像選択部1130)は、身体的特徴および顔特徴を識別するのに適した長方形の中心位置がそれぞれの特徴領域の範囲にあるフレーム画像FN=I、およびFN=Iまたは1を、特徴識別用または特徴抽出用のフレーム画像として決定する。
図19のステップ774において、プロセッサ112(適切画像選択部1130)は、経路が角かまたは直線かに応じて、図22Cのような特徴領域922および/または924に中心が位置する移動体識別情報IDの長方形の領域を含むフレーム画像FN=IおよびFN=Iまたは1を選択する。次いで、プロセッサ112(適切画像選択部1130)は、フレーム画像FN=IおよびFN=Iまたは1におけるその移動体識別情報ID=jの長方形の領域を、特徴識別用または特徴抽出用の領域として抽出する。次いで、プロセッサ112(その特徴抽出処理部1136)は、フレーム画像FN=Iおよび/または1に関連付けて、その移動体識別情報ID=jの人を表す2つまたは1つの長方形の位置情報を記憶部130に格納してもよい。プロセッサ112(特徴抽出処理部1136)は、その2つまたは1つの長方形の領域から、移動体識別情報ID=jの身体的特徴および顔特徴を識別し抽出して、そのフレーム画像の識別情報に関連付けて記憶部130に格納してもよい。
図20は、情報処理装置100によって実行される、一連のフレーム画像FN=1〜Nの中から、身体的特徴および顔特徴を識別するのに適した、特徴識別用のまたは特徴抽出用の長方形の位置を決定するためのフローチャートの例を示している。
図20において、ステップ662〜674は、図18のものと同様である。
ステップ677において、プロセッサ112(適切画像選択部1130)は、フレーム画像FN=Iおよび/または1における、例えば図22Aに示されているような特徴識別用または特徴抽出用の長方形の中心位置902および904の座標を記憶部130に格納する。中心位置902は、人の身体的特徴を識別するのに適した長方形の中心位置であり、中心位置904は、人の顔特徴を識別するのに適した長方形の中心位置である。その後、手順はステップ678に進む。
図19のステップ752または図20の処理が、複数の移動体識別情報IDについて反復的に実行されて、例えば図22Bのような多数の特徴識別または特徴抽出に適した長方形の中心位置902および904が蓄積される。
図21は、情報処理装置100によって実行される、フレーム画像において身体的特徴および顔特徴を識別するのに適した特徴領域を割り当てるためのフローチャートの例を示している。
図21を参照すると、ステップ802〜810は、相異なる特徴を抽出するのに適した長方形の中心位置902、904の集合の数だけ実行される。図22Bでは、身体的特徴を識別するのに適した長方形の中心位置902と、顔特徴を識別するのに適した長方形の中心位置902の2つの集合が存在する。
ステップ804において、プロセッサ112(特徴領域割当部1132)は、位置902または904の集合の各重心Gを求める。
ステップ806において、プロセッサ112(特徴領域割当部1132)は、重心Gを通るように各集合の複数の位置902または904の分散方向に伸びる直線912および914を求める。
ステップ808において、プロセッサ112(特徴領域割当部1132)は、位置902の集合に対する直線912に基づいてその直線912を2次元的に直線912に公差または直交する方向に拡大して、その集合の全ての位置902を含むように長方形状の特徴領域922を決定する。また、プロセッサ112(特徴領域割当部1132)は、位置904の集合の直線914に基づいてその直線914を2次元的に直線914に公差または直交する方向に拡大して、その集合の全ての位置904を含むように長方形状の特徴領域924を決定する。例えば、特徴領域922は、身体的特徴を抽出するのに適した長方形の中心位置の範囲を表す。また、例えば、特徴領域924は、顔特徴を抽出するのに適した長方形の中心位置の範囲を表す。このようにして割り当てられた特徴領域922、924は、図19のステップ774において人の特徴識別または特徴抽出に利用できるものとなる。特徴領域は、特徴識別領域または特徴抽出領域と称してもよい。
図23は、情報処理装置100によって実行される、一連のフレーム画像FN=1〜Nの中から、身体的特徴および顔特徴を識別するための長方形の中心位置が特徴領域の範囲にあるフレーム画像FN=IおよびFN=Iまたは1を決定するためのフローチャートの例を示している。
ステップ662〜670は、図18のものと同様である。
ステップ670において経路が角を曲がるパターンであると判定された場合、ステップ671において、プロセッサ112(適切画像選択部1130)は、経路を角と決定する。その後、手順はステップ678に進む。
ステップ670において経路が角を曲がるパターンでないと判定された場合、ステップ673において、プロセッサ112(適切画像選択部1130)は、経路を直線と決定する。その後、手順はステップ678に進む。
このようにして決定された経路の種類に応じて、図19のステップ774において、特徴領域922、924に基づいて、身体的特徴および顔特徴を識別または抽出するのに適したフレーム画像FN=Iおよび/または1とその長方形の領域が抽出される。
このようにして、一連のフレーム画像1〜mの中から、身体的特徴および顔特徴の識別に適した人の映像を含むフレーム画像を効率的に抽出することができる。
ここで挙げた全ての例および条件的表現は、発明者が技術促進に貢献した発明および概念を読者が理解するのを助けるためのものであり、ここで具体的に挙げたそのような例および条件に限定することなく解釈され、また、明細書におけるそのような例の編成は本発明の優劣を示すこととは関係ない、と理解される。本発明の実施形態を詳細に説明したが、本発明の精神および範囲から逸脱することなく、それに対して種々の変更、置換および変形を施すことができる、と理解される。
以上の実施例を含む実施形態に関して、さらに以下の付記を開示する。
(付記1)撮影されたフレーム画像における、少なくとも1つの移動体の画像を含む一連のフレーム画像を決定する移動体検出部と、
前記一連のフレーム画像における前記1つの移動体の移動方向が或る方向であり、かつ前記1つの移動体のサイズの増加傾向に変化がある場合に、前記1つの移動体のサイズの増加傾向と非増加傾向との間の境界の前と後のフレーム画像の少なくとも一方のフレーム画像を、前記1つの移動体の身体的特徴または顔特徴を識別するためのフレーム画像として決定して記憶部に格納する適切画像選択部と、
を含む監視装置。
(付記2)前記適切画像選択部は、
前記或る方向が、角を含む経路を表す場合に、前記境界の直前のフレーム画像を、前記1つの移動体の身体的特徴および顔特徴を識別するためのフレーム画像として決定し、
前記或る方向が、角を含まない経路を表す場合に、前記境界の直前のフレーム画像を前記1つの移動体の身体的特徴を識別するためのフレーム画像として、および前記境界の後のフレーム画像を前記1つの移動体の顔特徴を識別するためのフレーム画像として決定するものであることを特徴とする、付記1に記載の監視装置。
(付記3)前記少なくとも1つの移動体は複数の移動体であり、
さらに、前記境界の前と後の少なくとも一方のフレーム画像における前記複数の移動体の複数位置を蓄積し、前記複数位置の集合を身体的特徴および顔特徴の少なくとも一方の特徴を識別するための特徴領域として前記記憶部に格納する特徴領域割当部を含む、付記1または2に記載の監視装置。
(付記4)前記適切画像選択部は、前記一連のフレーム画像の中から、或る移動体の位置が前記特徴領域内に位置するフレーム画像を選択するものである、付記3に記載の監視装置。
(付記5)前記適切画像選択部は、前記或る移動体の移動方向が前記或る方向でありかつ前記或る移動体のサイズの増加傾向に変化がある場合に、前記或る移動体の位置が前記特徴領域内に位置するフレーム画像を選択するものである、付記4に記載の監視装置。
(付記6)さらに、前記撮影されたフレーム画像の中から、前記1つの移動体の位置が位置閾値より大きい変化を示しまたは前記1つの移動体がサイズ閾値より大きい変化を示す複数のフレーム画像を、前記一連のフレーム画像として取り出す移動体変化検出部を含む、付記1乃至4のいずれかに記載の監視装置。
(付記7)撮影されたフレーム画像における、少なくとも1つの移動体の画像を含む一連のフレーム画像を決定し、
前記一連のフレーム画像における前記1つの移動体の移動方向が或る方向であり、かつ前記1つの移動体のサイズの増加傾向に変化がある場合に、前記1つの移動体のサイズの増加傾向と非増加傾向との間の境界の前と後のフレーム画像の少なくとも一方のフレーム画像を、前記1つの移動体の身体的特徴または顔特徴を識別するためのフレーム画像として決定して記憶部に格納する
処理を情報処理装置に実行させるためのプログラム。
(付記8)情報処理装置が、
撮影されたフレーム画像における、少なくとも1つの移動体の画像を含む一連のフレーム画像を決定し、
前記一連のフレーム画像における前記1つの移動体の移動方向が或る方向であり、かつ前記1つの移動体のサイズの増加傾向に変化がある場合に、前記1つの移動体のサイズの増加傾向と非増加傾向との間の境界の前と後のフレーム画像の少なくとも一方のフレーム画像を、前記1つの移動体の身体的特徴または顔特徴を識別するためのフレーム画像として決定して記憶部に格納する
処理を実行する方法。