以下、本発明の領域分割装置を含んだ好適な実施の形態(以下実施形態という)の一例として、領域分割装置により監視画像上の人物領域を抽出し、人物領域の形状に基づく人物姿勢の推定により異常の発生を監視する画像監視装置1について、図面に基づいて説明する。本発明の領域分割装置は、領域分割部41として画像監視装置1に具備され、監視画像を注目人物が写っている人物領域とそれ以外の背景領域に分割する。
[画像監視装置1の構成]
図1は画像監視装置1の概略の構成を示したブロック図である。画像監視装置1は撮像部2、記憶部3及び出力部5が制御部4に接続されてなる。
撮像部2は監視カメラである。撮像部2は監視空間を移動する人物を撮像するために監視空間を臨むように設置され、監視空間を所定の時間間隔で撮影する。撮影された監視空間の監視画像は順次、制御部4へ出力される。本実施形態においては、人物の位置を3次元座標で特定するために、2つの撮像部2−1,2−2が共通視野を有して設置される。これらの撮像部2のカメラパラメータは、予めのキャリブレーションにより計測して記憶部3に記憶させておく。
記憶部3は、ROM(Read Only Memory)、RAM(Random Access Memory)等の記憶装置である。記憶部3は、各種プログラムや各種データを記憶し、制御部4との間でこれらの情報を入出力する。
各種データには、追跡情報30、人物形状モデル31、グラフ情報32、領域評価情報33及びカメラパラメータ(不図示)が含まれる。
追跡情報30は人物を追跡した結果である人物位置、人物の追跡のために生成され当該人物を特徴づける人物テンプレートなどのデータである。人物ごとの人物IDに対応付けられて当該人物の人物位置及び人物テンプレートなどが記憶される。監視空間を模した3次元座標系における人物の頭部中心の座標が当該人物の人物位置として記憶される。
人物形状モデル31は人物の形状を模した形状データである。本実施形態では、立位の人物の頭部、胴部及び脚部の3部分それぞれを鉛直軸を回転軸とする回転楕円体で近似し、これらを上から順に鉛直方向に整列した立体形状データを予め作成して記憶させておく。
後述する領域分割部41は、監視画像に対して図2に示すようなグラフを生成し、当該グラフを最小のエネルギーで人物領域(対象物領域)と背景領域とに2分割する切断をグラフカット(Graph Cut)法により導出することで監視画像から人物領域を抽出する。人物領域及び背景領域の最小単位を素領域と称する。素領域は少なくとも1つの画素からなり、監視画像は複数の素領域からなる。領域分割部41は素領域をそれぞれ対象物領域と背景領域とのいずれかに帰属させて帰属状態を決定することにより監視画像を領域分割する。
図2に示すグラフにおいて、水平面の斜視図が画素の集合である画像を模式的に表している。領域分割部41は素領域として1つ1つの画素をノードに設定すると共に人物領域側及び背景領域側の仮想のターミナルとしてソースS及びシンクTを設定する。また、各隣接ノード間のリンク(n−link)を設定し、各ノードとソースとの間及び各ノードとシンクとの間にもリンク(t−link)を設定する。さらに各リンクに当該リンクの結合度を設定する。こうして領域分割部41は監視画像に対するグラフを生成する。結合度は領域分割のために行うリンクの切断に要するコストとしてエネルギーに計上される。以下、結合度の値をコストと称する。
領域分割部41は各n−linkに、領域分割に伴い当該n−linkを切断するときのエッジコストを設定する。また、各ノードとソースSとの間のt−linkには当該t−linkを切断して当該ノードを背景領域に帰属させるときのコスト(背景帰属時コスト)を設定し、各ノードとシンクTとの間のt−linkには当該t−linkを切断して当該ノードを対象物領域に帰属させるときのコスト(対象物帰属時コスト)を設定する。各コストは帰属状態が尤もらしくないときに高くなる値であるため、監視画像を人物領域側のノードと背景領域側のノードとに2分割する際に切断されるリンクのコストの総和が領域分割のエネルギーとして定義され、エネルギーを最小化する切断がグラフカット法により導出される。エネルギーを最小化する切断を導出することは帰属状態の尤もらしさを最大化する領域分割を導出することと等価である。
グラフ情報32は領域分割のエネルギーの基礎となるコストのデータである。隣接画素{p(xp,yp),q(xq,yq)}の組み合わせごとのエッジコストcE(p,q)が記憶されると共に、画素p(xp,yp)ごとに、ソースSとの間の背景帰属時コスト{cC(p,S)+λ・cS(p,S)}、シンクTとの間の対象物帰属時コスト{cC(p,T)+λ・cS(p,T)}が記憶される。
ここで、cC(p,S)は色特徴に係る背景帰属時コスト(背景帰属時色コスト)、cS(p,S)は形状特徴に係る背景帰属時コスト(背景帰属時形状コスト)、cC(p,T)は色特徴に係る対象物帰属時コスト(対象物帰属時色コスト)、cS(p,T)は形状特徴に係る対象物帰属時コスト(対象物帰属時形状コスト)である。λは領域分割のエネルギーに対する色特徴のエネルギー(色エネルギー)の寄与度と比較した、領域分割のエネルギーに対する形状特徴のエネルギー(形状エネルギー)の寄与度の比の値である。当該寄与度の比の値であるλを特徴比率と称する。
後述する領域分割部41は特徴比率λを調整することで、高精度な領域分割を行う。そのために領域分割部41は、複数通りの特徴比率λで領域分割を行って特徴比率λごとにエネルギーを最小化する帰属状態候補を決定し、帰属状態候補の優劣の指標である領域評価値(領域分割評価値)を各候補に対して算出し、領域評価値が高い候補を最終的な領域分割結果として決定する。
領域評価情報33は各特徴比率λにおける帰属状態候補、及びその領域評価値である。帰属状態候補は、各画素の帰属領域を表すラベル行列のデータである。領域評価値はスカラのデータであり、対応する領域分割結果の良否を表す指標値である。
制御部4は、CPU(Central Processing Unit)、DSP(Digital Signal Processor)、MCU(Micro Control Unit)等の演算装置を用いて構成され、記憶部3からプログラムを読み出して実行することで人物追跡部40、領域分割部41、異常姿勢判定部42等として機能する。
人物追跡部40は撮像部2からの監視画像を処理して、監視画像上に写っている各人物の人物位置を追跡し、当該監視画像、当該人物位置、当該人物に付与した人物ID及び当該監視画像を撮像した撮像部2に予め付与されたカメラIDを領域分割部41に出力する。
領域分割部41は人物追跡部40から監視画像及び各人物の人物位置を入力されると、当該監視画像を当該人物が写っている人物領域とそれ以外の背景領域とに領域分割し、領域分割結果を異常姿勢判定部42に出力する。
領域分割部41は、初期領域設定部410、特徴比率設定部411、分割コスト算出部412、エネルギー算出部413、分割候補生成部414及び領域決定部415から構成される。
以下、領域分割部41を構成する各部について説明する。
初期領域設定部410は、人物領域の初期値として監視画像上に人物領域の概略位置と概略形状とを有した初期領域を設定し、初期領域の情報を分割コスト算出部412に出力する。初期領域は領域分割の手がかりとなる。
具体的には初期領域設定部410は、人物追跡部40から入力された各人物の人物位置及び人物形状モデル31を参照し、人物位置を基準にして人物形状モデル31を監視画像上に配置することにより初期領域を設定する。そのために初期領域設定部410は、監視空間を模した仮想空間中の人物位置に人物形状モデル31を配置し、配置した人物形状モデル31をカメラパラメータを用いた座標変換により監視画像に投影し、投影した領域を初期領域に設定する。初期領域は人物ごとに設定され、さらに当該人物を複数の撮像部2により撮像している場合は各撮像部2が撮像した監視画像ごとに設定される。撮像部2とカメラパラメータと監視画像との対応関係はカメラIDにより特定される。
図3は初期領域設定部410による処理を説明する模式図である。図3(a)は人物101が写った監視画像100である。初期領域設定部410には当該監視画像100と、当該人物101を追跡して得た仮想空間110におけるXYZ座標系の人物位置112が入力される。入力される人物位置112は頭部中心座標で代表されている。図3(b)は人物モデル113から初期領域121を生成する処理を説明する仮想空間110の模式的な斜視図であり、図3(c)はその処理結果を示す模式図である。初期領域設定部410は、人物モデル113を、その頭部中心を人物位置112に合わせ、その下端を床面111に接地させて仮想空間110に配置し、カメラパラメータを用いて人物モデル113を撮像部2(カメラ114)の撮像面115のxy座標系に投影する。これにより監視画像100と同じxy座標系の投影画像120に人物モデル113を投影した初期領域121が算出される。
領域分割部41は、互いに種類が異なる複数種類の画像特徴を用いて領域分割を行う。例えば領域分割部41は対象物及び背景の色特徴と対象物の形状特徴とを領域分割に用いる。複数種類の画像特徴を用いることで、例えば色特徴による領域分割の精度が低下するときに形状特徴の寄与度を上げるといったように制御することで、単独の画像特徴を用いた場合よりも高精度な領域分割が期待できる。ところが対象物と背景との間の関係は多様であり、予め寄与度を設定するのは難しい。そこで領域分割部41は複数通りの寄与度で領域分割を行って最良の寄与度での領域分割結果を求める。
領域分割部41は、色エネルギーE
C、形状エネルギーE
S及びエッジのエネルギーE
Eの線形和である領域分割のエネルギーEを最小化する帰属状態を最良の帰属状態として導出する。このときエッジのエネルギーE
Eに対する色エネルギーE
C及び形状エネルギーE
Sそれぞれの寄与度をα
C、α
Sで表わすと、領域分割のエネルギーEは次式のようになる。
本実施形態では式(1)を下記式(2)のように変形し、またα
Cを定数として扱うことにより、上述した1つの変数λで色特徴及び形状特徴それぞれの寄与度合を制御する。
ここで、Aは各ノードがそれぞれ対象物領域と背景領域とのいずれに帰属するか、つまり帰属状態を設定したラベル行列である。
特徴比率設定部411は、素領域における複数種類の画像特徴それぞれを領域分割に寄与させる寄与度を複数通りに設定する寄与度設定部である。具体的には、特徴比率設定部411は上述の特徴比率λを複数通りに設定し、当該特徴比率λを分割コスト算出部412に入力する。特徴比率設定部411は例えば特徴比率λを0.0,0.1,0,2,0.3,…,3.9と40段階で設定する。
領域分割部41は、寄与度ごとに、帰属状態を適宜変更し、素領域それぞれの各画像特徴が当該各帰属状態にあることの尤もらしさの程度を当該寄与度で重み付けて総和した寄与度依存評価値を比較して当該尤もらしさを最大化する帰属状態候補を選定する候補選定部としての機能と、寄与度ごとに選定した帰属状態候補について、それらの優劣を寄与度に依存しない評価基準により評価した領域分割評価値を算出し、当該領域分割評価値が最も高い帰属状態候補を領域分割結果として決定する領域分割決定部の機能とを備える。この領域分割部41の候補選定部としての機能は、本実施形態では分割コスト算出部412、エネルギー算出部413及び分割候補生成部414で実現される。また領域分割部41の領域分割決定部としての機能は領域決定部415で実現される。
分割コスト算出部412は、初期領域を基準にして、監視画像の各画素に対し、当該画素の画像特徴が対象物領域及び背景領域それぞれに帰属することの尤もらしくなさ、すなわち尤もらしさの程度の低さを表すコストを画像特徴ごとに上記帰属度として算出する。
具体的には分割コスト算出部412は、初期領域を基準に、監視画像中で対象物の一部である可能性が十分に高い複数の画素(対象物シード)と監視画像中で背景の一部である可能性が十分に高い複数の画素(背景シード)を設定して対象物シードの色特徴量(対象物色特徴)及び背景シードの色特徴量(背景色特徴)を抽出する。そして、対象物色特徴と各画素の色特徴とを比較して当該画素が対象物領域に帰属することの尤もらしくなさを表す対象物帰属時色コストcC(p,T)を算出し、背景色特徴と各画素の色特徴とを比較して当該画素が背景領域に帰属することの尤もらしくなさを表す背景帰属時色コストcC(p,S)を算出する。
さらに分割コスト算出部412は、初期領域の形状を基準に各画素の位置が対象物領域内である確率と背景領域内である確率とを設定する。そして分割コスト算出部411は各画素の位置が対象物領域内である確率に基づいて当該画素が対象物領域に帰属することの尤もらしくなさを表す対象物帰属時形状コストcS(p,T)を算出し、各画素の位置が背景領域内である確率に基づいて当該画素が背景領域に帰属することの尤もらしくなさを表す背景帰属時形状コストcS(p,S)を算出する。
そして分割コスト算出部412は、背景帰属時色コストと背景帰属時形状コストを特徴比率λにて重みづけ加算して背景帰属時コスト{cC(p,S)+λ・cS(p,S)}を求め、対象物帰属時色コストと対象物帰属時形状コストを特徴比率λにて重みづけ加算して対象物帰属時コスト{cC(p,T)+λ・cS(p,T)}を求めて、これらを記憶部3のグラフ情報32に記憶させる。
また分割コスト算出部412は各隣接画素間に対してその輝度差に応じたエッジコストcE(p,q)を算出して記憶部3のグラフ情報32に記憶させる。
以下、エッジコストcE(p,q)の算出について説明する。
分割コスト算出部412は、画素pとその隣接画素qの間に設定したn−linkそれぞれに対して次式で表されるエッジコストc
E(p,q)を算出する。
ここで、Ipは画素pの画素値、Iqは隣接画素qの画素値、dist(p,q)は画素pの位置と隣接画素qの位置との間の距離を表す。βは調整用の定数であり、事前実験等を通じて適切な値が予め設定される。
以下、対象物シードの設定と対象物帰属時色コストcC(p,T)の算出について説明する。
分割コスト算出部412は、監視画像における初期領域の内側の画素値から対象物の色特徴の基準とする対象物色特徴を抽出する。対象物領域を高精度に抽出するには、対象物色特徴は、対象物の一部である可能性が十分に高く、対象物を構成する色を網羅していることが望ましい。そこで、分割コスト算出部412は、初期領域の中心軸上の画素群を対象物シードと定め、当該対象物シードの画素値の正規化色ヒストグラムhOを対象物色特徴として抽出する。
図4には図3の初期領域121の中心軸上に設定した対象物シード200を例示している。対象物シード200は対象物領域か背景物領域かが曖昧な初期領域121の輪郭付近を含まないように設定されている。
分割コスト算出部412は、以下に示す式(4)及び式(5)に従い対象物帰属時色コストc
C(p,T)を算出する。
ここで、Ipは画素pの画素値、hOは対象物シードの正規化色ヒストグラムであり、hO(Ip)は画素値Ipが対象物の色である確率を表す。LC(p|оbj)の値は画素pの色が対象物の色である確率が高いほど小さく、同確率が低いほど大きくなる。K(>1)は大きなコスト値を表す定数であり、十分に大きな値が予め設定される。
以下、背景シードの設定と背景帰属時色コストcC(p,S)の算出について説明する。
分割コスト算出部412は、監視画像における初期領域の外側の画素値から背景の色特徴の基準とする背景色特徴を抽出する。対象物領域を高精度に抽出するには、背景シードは、背景の一部である可能性が十分に高く、対象物との境界に存在する背景の色を網羅していることが望ましい。そこで、分割コスト算出部412は、初期領域を所定距離だけ離れて囲む外周部の画素群を背景シードと定め、当該背景シードの画素値の正規化色ヒストグラムhBを背景色特徴として抽出する。具体的には、分割コスト算出部412は、初期領域を所定回数だけ膨張して膨張領域の周囲画素を背景シードと定める。膨張回数は初期領域の近似誤差より大きく定めることができ、例えば10回程度とすることができる。
図4には初期領域121の輪郭から10画素だけ離れた外周部に設定した背景シード201を例示している。背景シード201は対象物領域か背景物領域かが曖昧な初期領域121の輪郭付近を含まないように設定されている。
分割コスト算出部412は、以下に示す式(6)及び式(7)に従い背景帰属時色コストc
C(p,S)を算出する。
ここで、hBは背景シードの正規化色ヒストグラムであり、hB(Ip)は画素値Ipが背景領域の色である確率を表す。K,Ipは上述の通りである。LC(p|bkg)の値は画素pの色が背景の色である確率が高いほど小さく、同確率が低いほど大きくなる。
以下、対象物帰属時形状コストcS(p,T)の算出について説明する。
分割コスト算出部412は、初期領域の位置及び形状に基づいて各画素位置における対象物画素の存在確率ρOを設定する。具体的には分割コスト算出部412は、対象物画素の存在確率ρOとして初期領域の外側の画素に0、初期領域の内側で初期領域の輪郭からの距離が遠い画素ほど1に近づく値を設定する。対象物画素の存在確率ρOの例を図4に示す。図4に示す存在確率ρOのグラフの横軸は、図4の上部に示す初期領域121を含む画像にて一点鎖線で示すx軸方向の直線に沿った位置を画素数で表しており、縦軸がρOである。この例ではρOは対象物シード200で最大値である1となり、初期領域121の輪郭での値0へ向けて直線的に減少し、当該輪郭より外側では0となる。
分割コスト算出部412は、以下に示す式(8)及び式(9)に従いρ
Oを基にした対象物帰属時形状コストc
S(p,T)を算出する。
ここで、ρO(p)は画像中において画素pの位置が対象物領域内である確率を表す。Kは上述の通りである。LS(p|оbj)の値は画素pの位置が対象物領域内である確率が高いほど小さく、同確率が低いほど大きくなる。
以下、背景帰属時形状コストcS(p,S)の算出について説明する。
分割コスト算出部412は、初期領域の位置及び形状に基づいて各画素位置における背景画素の存在確率ρBを設定する。具体的には分割コスト算出部412は、背景画素の存在確率ρBとして背景シード201の内側の画素に0、背景シード201の外側で背景シード201からの距離が遠い画素ほど1に近づく値を設定する。背景画素の存在確率ρBの例を図4に示す。図4に示す存在確率ρBのグラフの横軸は、図4の上部に示す初期領域121を含む画像にて一点鎖線で示すx軸方向の直線に沿った位置を画素数で表しており、縦軸がρBである。この例ではρBは背景シード201から外側へ向けて直線的に増加する。
分割コスト算出部412は、以下に示す式(10)及び式(11)に従いρ
Bを基にした背景帰属時形状コストc
S(p,S)を算出する。
ここで、ρB(p)は画像中において画素pの位置が背景領域内である確率を表す。Kは上述の通りである。LS(p|bkg)の値は画素pの位置が背景領域内である確率が高いほど小さく、同確率が低いほど大きくなる。
なお、図4では対象物画素の存在確率ρOと背景画素の存在確率ρBの値を初期領域121と背景シード201とに挟まれる周囲にて共に0とする例を示したが、図5のように初期領域121の境界の外側及び内側にρO及びρBが0より大きな値となる範囲を設定してもよい。
このように分割コスト算出部412が各コストを計算し、画像特徴ごとの寄与度で重み付けされたコストをグラフ情報32に設定することにより監視画像を領域分割するためのグラフが完成する。
エネルギー算出部413は、各画素の帰属領域を仮決めした試行帰属領域設定において各画素の設定と対応するコスト値を当該画素の帰属度として記憶部3から読み出し、これらを画像内にて総和して当該試行帰属領域設定が表す領域分割のエネルギー値(寄与度依存評価値)を算出する。
具体的にはエネルギー算出部413は、分割候補生成部414から入力されるラベル行列Aに対し、以下のようにして式(2)のエネルギーEを算出し、分割候補生成部414に出力する。
すなわち、エネルギー算出部413は、背景領域に帰属させた各画素の背景帰属時コスト{cC(p,S)+λ・cS(p,S)}及び対象物領域に帰属させた各画素の対象物帰属時コスト{cC(p,T)+λ・cS(p,T)}を加算して色エネルギーと形状エネルギーの重みづけ和(EC+λ・ES)を算出する。
また、エネルギー算出部413は、対象物領域に帰属させた画素と背景領域に帰属させた画素とが隣り合っている隣接画素すなわち領域分割により切断されるn−linkのエッジコストcE(p,q)の総和をエッジエネルギーEEとして算出する。
そして、エネルギー算出部413は、これらを加算して(EC+λ・ES+EE)をエネルギーEとして算出する。
分割候補生成部414は、各特徴比率λにおいてエネルギーEを最小化する帰属状態を帰属状態候補として導出し、帰属状態候補を領域決定部415に出力する。そのために分割候補生成部414は、分割コスト算出部412により生成されたグラフにグラフカット法を適用することにより帰属状態候補を導出する。すなわち分割候補生成部414は、帰属状態を適宜変更しつつ、当該帰属状態をエネルギー算出部413に入力してエネルギーを算出させ、算出させたエネルギーの大小を比較する処理を繰り返して、エネルギーを最小化する帰属状態候補を導出する。エネルギーの最小化を図ることは、各画素の画像特徴が帰属状態にあることの尤もらしさを画像全体で最大化することと等価である。
領域決定部415(領域分割決定部)は、特徴比率ごとに選定した帰属状態候補についてそれらの優劣を、特徴比率に依存しない一律の評価基準により評価して領域評価値を算出し、領域評価値が最も高い帰属状態候補を領域分割結果として決定して異常姿勢判定部42に出力する。
具体的には、領域決定部415は、評価基準として各特徴比率における帰属状態候補に対して以下に示す式(12)〜(14)に従い領域評価値Vを算出し、帰属状態候補の間で領域評価値Vを比較して領域評価値Vが最も高い帰属状態候補を選出する。
式(12)の1/VCは帰属状態候補における対象物領域と背景領域との境界部における色の相違度を評価する評価基準である。式(12)の1/VSは対象物の形状を近似して予め設定された近似領域と帰属状態候補における対象物領域との形状一致度を評価する評価基準である。ここで、式(12)に示したようにVに対する1/VCと1/VSの配分はλに依らず一定である。また、式(12)の(VC+VS)は領域分割の結果である帰属状態候補に対して算出できるものの、(VC+VS)をエネルギーとして定義し(VC+VS)を最小化する帰属状態候補をグラフカット法により導出することは困難である。
式(13)における総和対象とする画素pの集合Edgeは対象物の輪郭画素からなる集合であり、また、N(p)は対象物の輪郭画素に隣接する背景画素の集合、distは画素pとqとの距離である。γは調整用の定数であり、事前実験等を通じて適切な一定値が予め設定される。1/VCの値はλごとの帰属状態候補それぞれにおける対象物領域と背景領域との境界が実際に監視画像における色の境界に近く位置するときほど高くなり、色の境界から外れて位置するときほど低くなる。1/VCの値は領域分割の結果の優劣に応じて変化するが、λの値そのものに依存しない値である。
図6はN(p)を説明する図であり、同図の左側に対象物の輪郭画素を含む部分画像の模式図を示している。ここで、n−linkのコストは図2に示すように各画素の4近傍について算出している。これに対し、N(p)は図6に示すように対象物の輪郭画素の8近傍から求めるなど、n−linkのコストを算出したときよりも多くの隣接画素との相違を評価するのがよい。こうすることで分割候補生成部414における色特徴のエネルギーによる評価よりも厳しい領域評価値を算出でき、帰属状態候補間の優劣をより厳密に評価することができる。
式(14)におけるMλは帰属状態候補における対象物領域と初期領域とで画素位置が一致する画素数であり、M0は初期領域の画素数、MSは帰属状態候補の画素数である。初期領域との一致画素数Mλが増えると1/VSは高くなる。ただし1/MSの項により、対象物領域が単に大きいだけ(例えば対象物領域が初期領域を包含する状態)で1/VSが不当に高くなることを抑制している。つまり、1/VSは対象物がとり得る形状を近似して予め設定された初期領域に対する対象物領域の形状一致度である。1/VSは帰属状態候補それぞれにおける対象物領域の形状が対象物のとり得る形状に近いほど高くなり、とり得る形状から外れるほど低くなる。1/VSの値は領域分割の結果の優劣に応じて変化するが、λの値そのものに依存しない値である。
図7、図8は特徴比率λと領域評価値Sとの関係を示すグラフであり、ぞれぞれ横軸を特徴比率λ、縦軸を領域評価値Sとしている。
このうち図7は対象物の周囲に対象物の周囲と似た色の背景が存在する状況での例であり、一方、図8は対象物の周囲に対象物の周囲と似た色の背景が存在しない状況での例である。すなわち図7の状況では図8の状況よりも色特徴による領域分割の精度が低下し、特徴比率λを大きくして形状特徴の寄与を増加させることで領域分割の精度が向上すると考察できる。実際に、図8の状況ではλが0.4のときにSが最大となっているに対し、図7の状況ではλが1.0のときにSが最大となっており、考察と符合する結果となっている。
以上のようにして監視画像ごとに各画像特徴の寄与度を適応的に設定した領域分割が可能となる。これにより領域分割の精度低下要因となる画像特徴の寄与度を下げて他の画像特徴の寄与度を上げることができるので対象物と背景との関係の多様性に適応した高精度な領域分割が可能となる。
異常姿勢判定部42は、領域分割部41が抽出した各人物の人物領域の形状が異常事態の発生を示す異常姿勢であるか否かを判定し、人物領域のいずれかが異常姿勢と判定された場合に所定の異常信号を出力部5に出力する。具体的には、異常姿勢判定部42は各人物領域の形状と予め登録してある異常姿勢パターンとの類似度を算出して予め設定したしきい値と比較し、しきい値以上の類似度が算出された人物領域を異常姿勢であると判定し、そうでなければ異常姿勢でないと判定する。例えば、両手を挙げた姿勢の形状パターンを強盗事件の発生を示す異常姿勢パターンとして予め登録しておくことができる。
出力部5は異常姿勢判定部42から異常信号が入力されると当該異常信号を外部に出力する外部出力装置である。例えば、出力部5は、電話網あるいはインターネットなどの広域網を介して警備センターと接続された通信回路で構成され、警備センターに異常信号を送信することによって異常事態の発生を通報する。
[画像監視装置1の動作]
図9は画像監視装置1の監視動作の概略を示すフロー図である。図9を参照して画像監視装置1の動作を説明する。監視空間が無人であることを確認した管理者が装置に電源を投入すると、各部、各手段が初期化され動作を開始する(S1)。初期化の後は、撮像部2から制御部4へ新たな監視画像が入力されるたびに、ステップS2〜S7の処理がループ処理として繰り返される。
新たな監視画像が入力されると制御部4の人物追跡部40は、監視画像上の人物を追跡して監視画像上での当該人物の位置を特定する(S2)。人物追跡部40は新たな監視画像にて特定した人物位置を人物ID及びカメラIDと対応付けて記憶部3の追跡情報30に記憶させる。
制御部4は、新たな監視画像上に人物が存在しているか否か、すなわち追跡情報30に新たな監視画像にて特定した人物位置が記憶されているか否かを確認する(S3)。人物が存在しなければ(ステップS3にてNO)、制御部4は以降の処理をスキップして処理をステップS1へ戻す。
人物が存在していれば(ステップS3にてYES)、制御部4は新たな監視画像から得た追跡情報30を領域分割部41に入力し、領域分割部41は各人物の人物領域を抽出する(S4)。
図10は人物領域抽出処理の概略のフロー図である。以下、図10を参照してステップS4の人物領域抽出処理を説明する。
まず、領域分割部41の初期領域設定部410は、記憶部3から人物形状モデル31と、監視画像に対応するカメラIDのカメラパラメータとを読みだし、各人物の人物位置を基準にして仮想空間中に人物形状モデル31を配置し、配置した人物形状モデル31をカメラパラメータにより監視画像上に投影して各人物の初期領域を設定する(S100)。
次に、領域分割部41の分割コスト算出部412は、各人物の初期領域に基づいて対象物シードと背景シードを生成する。そして分割コスト算出部412は、各初期領域の中央部に位置する対象物シードから正規化色ヒストグラムhOを対象物色特徴として抽出し、また各初期領域の周辺部に位置する背景シードから正規化色ヒストグラムhBを背景色特徴として抽出する(S101)。
続いて、分割コスト算出部412は、各人物の初期領域からの距離に応じて各画素における対象物画素の存在確率ρOと背景画素の存在確率ρBをそれぞれ対象物形状特徴、背景形状特徴として算出する(S102)。
続いて領域分割部41の特徴比率設定部411は特徴比率λに初期値を設定し(S103)、特徴比率λについてのループ処理S104〜S108を実行する。初期値は例えば0.1である。
λのループ処理において、まず領域分割部41の分割コスト算出部412は監視画像に対して領域分割のためのグラフを生成する。
すなわち分割コスト算出部412は、式(3)に従って隣接画素の組み合わせごとのエッジコストcE(p,q)を算出し、記憶部3のグラフ情報32に記憶させる。また分割コスト算出部412は、式(6),式(7)に従って画素ごとの背景帰属時色コストcC(p,S)を算出すると共に式(10),式(11)に従って画素ごとの背景帰属時形状コストcS(p,S)を算出し、これらを特徴比率λにて重み加算して背景帰属時コスト{cC(p,S)+λ・cS(p,S)}を記憶部3のグラフ情報32に記憶させる。さらに分割コスト算出部412は、式(4),式(5)に従って画素ごとの対象物帰属時色コストcC(p,T)を算出すると共に式(8),式(9)に従って画素ごとの対象物帰属時形状コストcS(p,T)を算出し、これらを特徴比率λにて重み加算して対象物帰属時コスト{cC(p,T)+λ・cS(p,T)}を記憶部3のグラフ情報32に記憶させる(S104)。
λのループ処理において、次に領域分割部41の分割候補生成部414はグラフ情報32で定義されるグラフにMinimum Cut/Maximum Flowアルゴリズムを適用して最小のエネルギーにて当該グラフを対象物領域のノードと背景領域のノードに2分割する帰属状態候補を導出する(S105)。すなわち分割候補生成部414は帰属状態Aを微小変動させながら当該帰属状態をエネルギー算出部413に入力して式(2)のエネルギーEを算出させる処理を繰り返して、エネルギーEを最小化する帰属状態候補Aを選定する。分割候補生成部414は導出した帰属状態候補を特徴比率λと対応付けて記憶部3の領域評価情報33に記憶させる。
λのループ処理において、次に領域分割部41の領域決定部415は式(12)〜(14)に従って、ステップS105にて選定した帰属状態候補に対して特徴比率に依存しない一律の領域評価値を算出する(S106)。領域決定部415は算出した領域評価値を現時点の特徴比率λと対応付けて記憶部3の領域評価情報33に記憶させる。
続いて特徴比率設定部411はλにΔλを加算してλを更新し(S107)、更新したλをλmaxと比較し(S108)、λがλmax以下である間は(S108にてNO)、領域分割部41は処理をステップS104に戻して更新したλの設定でループ処理を繰り返す。
他方、λがλmaxを超えていたら(S108にてYES)、領域分割部41はループ処理を終了してステップS109に処理を進める。
このようにして複数通りの特徴比率λにて領域評価情報33が生成されると、領域決定部415は領域評価情報33の中から領域評価値が最大のときの人物領域を選出して異常姿勢判定部42に出力する(S109)。
一般に、最良の特徴比率は画像ごとに異なり、特徴比率に対する領域分割結果の変動は比較的大きい。よって最良の領域分割結果を得るには、最良の特徴比率と当該特徴比率設定下での最良の帰属状態を求めなければならないが、特徴比率と帰属状態を同時探索することは困難であり、現実的ではない。そこで領域分割部41は処理を2段階に分け、これにより最良の領域分割結果を求めることを可能にしている。
すなわち最良の領域分割結果を求めるために領域分割部41は、ステップS105においては、特徴比率を複数通りに固定して帰属状態の変更を許容することで特徴比率に依存して定義されたエネルギーを最小化する帰属状態候補を選定し、ステップS109においては、選定された各帰属状態(各帰属状態候補)を固定することで特徴比率に依存しない一律の領域分割評価値が最大となる帰属状態候補及び特徴比率を決定する。つまり、複数通りの特徴比率の設定それぞれにおいてローカル・ベストな領域分割結果を得、これらを特徴比率に依存しない領域評価値で優劣を比較してグローバル・ベストな領域分割結果を決定するのである。
以上の処理により各人物の人物領域が抽出されると、制御部4は図9のステップS5へ処理を進める。
再び図9を参照して画像監視処理の続きを説明する。
制御部4の異常姿勢判定部42は、領域決定部415から入力された各人物の人物領域の形状と異常姿勢パターンとの類似度を算出して予め設定したしきい値と比較し、しきい値以上の類似度が算出された人物領域を異常姿勢であると判定し、そうでなければ異常姿勢でないと判定する(S5)。
異常姿勢判定部42は人物領域のいずれかが異常姿勢と判定された場合に(ステップS6にてYES)、所定の異常信号を生成して出力部5に当該信号を出力する(S7)。異常信号を入力された出力部5は警備センターに異常信号を送信し、通報を行う。他方、人物領域のいずれも異常姿勢と判定されなければ(ステップS6にてNO)、ステップS7の異常出力処理はスキップされる。
以上の処理を終えると、制御部4は処理をステップS1に戻し、次の監視画像に対する処理が行われる。
[変形例]
(1)別の実施形態において領域決定部415は以下のようにして領域評価値Vを算出することもできる。
(1−1)図6を参照した説明において領域決定部415は対象物の輪郭画素を、総和対象とする画素pの集合Edgeとし、対象物の輪郭画素に隣接する背景画素を隣接画素N(p)とした。別の実施形態において、領域決定部415は対象物領域と背景画素との境界に沿う背景側の画素pを集合Edgeとし、各画素pに隣接する対象物画素を隣接画素N(p)とすることもできる。
(1−2)領域決定部415は、対象物の輪郭画素を集合Edgeとして式(13)と同様にVC1を算出するとともに、境界に沿う背景側の画素を集合Edgeとして式(13)と同様にVC2を算出し、これらの和(VC1+VC2)をVCとして算出することもできる。
(1−3)領域決定部415は、監視画像にエッジオペレータによる処理を施してエッジ強度画像を生成し、境界に沿ってエッジ強度値を累積して累積値を累積数にて正規化することによりVCを算出してもよい。
(1−4)上記実施形態において領域決定部415は、3つの回転楕円体で模した人物形状モデルを投影して生成した1つの近似領域(初期領域)を基にVSを算出した。これに代えて領域決定部415は、腕や脚をさらに加えた人物形状モデルを腕や脚の姿勢を複数通りに変更して姿勢ごとの近似領域を生成し、各近似領域との形状一致度を算出してそれらの最大値をVSとしてもよい。
(1−5)上記いずれかの方法により算出したVCのみから領域評価値Vを求めてもよいし(V=1/VC)、上記いずれかの方法により算出したVSのみから領域評価値Vを求めてもよい(V=1/VS)。
(2)上記実施形態では1つ1つの画素を素領域として領域分割を行う例を示した。しかし、ノードに対応付ける素領域は画素以外であってもよい。例えば、互いに画素値が類似する画素を予めまとめてセグメント化し、各セグメントをノードに設定して領域分割を行うこともできる。
この場合、各セグメントに対する色コストは、当該セグメントの代表画素値(画素値の平均値、中央値または最頻値)を用いて算出する、あるいは当該セグメントを構成する画素それぞれに対する色コストを算出してそれらの色コストの代表値(コストの平均値、中央値または最大値)を当該セグメントの色コストとする。
また各セグメントに対する形状コストは、当該セグメントと初期領域との重なり度合いを用いて算出する、あるいは当該セグメントを構成する画素に対する存在確率の代表値(存在確率の平均値、中央値または最頻値)を当該セグメントの形状コストとする。
このようにすることで領域分割の精度を低下させずにノードを減らすことができるので、精度維持と負荷減少を両立することができる。
セグメントをノードに設定した場合、特徴比率λの変化に対して領域評価値が細かく変化しなくなり段階的な変化となる傾向が得られる。これは特徴比率λの変化に対する帰属状態候補の変化がセグメント単位になるためである。このことから領域評価値の最大値探索において、特徴比率λのステップを粗く(Δλを大きく)して探索の処理負荷を減ずることができる、または特徴比率λのステップを段階的に細かくして探索の処理負荷を減ずることができる。
図11は、後者を適用して2段階探索を行ったときの特徴比率λと領域評価値との関係を示すグラフであり、第1段階で粗いΔλを用いて大域的な探索を行い、第2段階で細かいΔλを用いて局所的な探索を行う処理例である。
すなわち探索の第1段階にて、特徴比率設定部411はΔλを0.2に設定して0.0〜3.8までの20段階の特徴比率λを設定し、分割コスト算出部412とエネルギー算出部413と分割候補生成部414はこれら20段階のコスト算出とエネルギー算出と帰属状態候補生成を行い、領域決定部415はこれら20段階の帰属状態候補に対する領域評価値(図11中の○で示すプロット)を算出して領域評価値が最大となる特徴比率λ1を仮決定する。そして探索の第2段階にて、Δλを0.05に設定してλ1周辺に10段階の特徴比率λを設定し、領域決定部415はこれら10段階の帰属状態候補に対する領域評価値(図11中の◆で示すプロット)を算出して領域評価値が最大となる特徴比率λを最終決定する。このようにすれば0.0〜3.8までの特徴比率λの範囲での探索を、を全範囲にてΔλを0.05に設定して均一に探索する場合よりも少ないλの設定数で行うことができ、λの設定数を少なくして細かいΔλでの探索が可能となる。すなわちセグメントをノードに設定することにより処理負荷の減少と領域分割の精度向上とを両立することができる。
(3)上記実施形態では画像特徴として色と形状とを用いる例を示したが、他の画像特徴を用いることもできる。例えば色と動き特徴量とを用いる。この場合、背景差分処理を行って各画素の背景差分値を動き特徴量とすることができる。また、オプティカルフロー分析を行って各画素の移動ベクトルの大きさを動き特徴量とすることもできる。
(4)上記実施形態ではグラフカット法によりエネルギーを最小化する帰属状態候補を導出した。別の実施形態ではグラフカット法に代えてマルコフ連鎖モンテカルロ (Markov Chain Monte Carlo:MCMC) 法、信念伝播(Belief Propagation)法、ツリー重み再配分メッセージ伝達(Tree-Reweighted Message Passing:TRW)法を用いてエネルギーを最小化する帰属状態候補を導出できる。
(5)上記実施形態では、色特徴量に係るコストと形状特徴量に係るコストを特徴比率λにて重み付け加算した背景帰属時コストと対象物帰属時コストをt−linkに設定して領域分割を行った。別の実施形態では、背景帰属時コストを背景帰属時色コストと背景帰属時形状コストの2種類に分けて設定すると共に、対象物帰属時コストを対象物帰属時色コストと対象物帰属時形状コストの2種類に分けて設定する。この場合、図12に示すような色特徴に係るソースSC及び形状特徴に係るソースSSという画像特徴ごとのソースを有するグラフを生成して、各ノードから色コストと形状コストのいずれかを選択してエネルギーEを算出する。
図12のような複数のソースを有するグラフに対してエネルギーEを最小化する分割領域を導出する方法としては、複数種類の画像特徴を順次、選択画像特徴に設定し、当該選択画像特徴をラベルαとするα拡張(α-expansion)法や、選択画像特徴をラベルαとし非選択画像特徴の1つをラベルβとするα−β交換(αβ-swap)法を利用することができる。
こうすることで、さらに、頭部では色重視の領域分割を行い脚部では形状重視の領域分割を行うというように、部位ごとにエネルギーEを最小化する画像特徴を選択することができるので、対象物の部位ごとに異なる精度低下要因が生じても対象物の領域を高精度に抽出できる。
(6)上記実施形態において初期領域は初期領域設定部410により自動設定される例を示したが、本発明の領域分割装置を静止画からの領域分割処理に適用する場合、初期領域設定部410にポインティングデバイス等を含めて構成し、人手により初期領域を設定するのが好適である。