WO2010073929A1

WO2010073929A1 - 人判定装置、方法およびプログラム

Info

Publication number: WO2010073929A1
Application number: PCT/JP2009/070822
Authority: WO
Inventors: 利憲細井
Original assignee: 日本電気株式会社
Priority date: 2008-12-22
Filing date: 2009-12-14
Publication date: 2010-07-01
Also published as: CN102257529A; US20110268321A1; JPWO2010073929A1; CN102257529B; US8571274B2; EP2381415A4; EP2381415A1; JP5251987B2

Abstract

　人判定装置は、外部カメラからの映像信号に基づく画像から抽出した障害物の上記画像上の領域を示す情報が格納される障害物記憶部と、上記画像から抽出した物体の一部が上記障害物により隠蔽されている場合に、上記物体が基準面に接する接地点が上記画像上で取り得る範囲を、上記障害物記憶部に格納された上記障害物の領域と推定し、該推定範囲と、予め与えられた人の身長と頭部の大きさと位置の相対関係とに基づいて、上記物体の上記接地点から最も離れた部位を人の頭部と仮定した場合の、該頭部が上記画像上で取り得る範囲を計算する頭部範囲計算手段と、該計算した頭部の範囲において、上記頭部に対応する形状を有する領域があるか否かを判定する頭部検出手段と、を有する。

Description

人判定装置、方法およびプログラム

　本発明は、カメラからの映像信号に基づく画像中に出現する物体が人であるか否かを判定する技術に関する。

　非特許文献１には、画像中に出現する物体が人であるか否かを判定できる方法が開示されている。この判定方法では、顔であるか否かを判定する処理を画像全体にわたって繰り返し実行し、画像中にある顔を検出する。検出対象を顔ではなく人体とすれば、映っている物体が人であるか否かを判定できる。

　非特許文献２には、画像中に出現する物体が人であるか否かを判定できる別の方法が開示されている。この判定方法では、ある時点の画像(背景画像)と現在の画像との差分をとるという低演算量の処理を用いる。この差分に基づいて、何か動いている物体がありそうな部分領域を高速に検出し、その部分領域の画像に対してのみ、「人間」か「車」か「それ以外」かを判定する。つまり、物体がありそうな部分領域を高速に絞り込むことで、「人」か「人でない」かを判定する処理の実行回数を削減している。

　なお、非特許文献２に記載の判定方法では、画像から得られた形状などから計算された特徴量を使って比較的単純な判定処理を採用しているが、例えば非特許文献３に記載の統計的な画像認識手法を組みあわせることにより、僅かな処理時間の増加だけで、判定性能を高めることができる。

　また、非特許文献１に記載の手法は高速性を特長としているが、これは旧来のパターン識別処理を繰り返す手法と比較した場合の特長である。非特許文献１に記載の手法と非特許文献２に記載されたような画像同士の差分計算のみを行う手法とを比較すると、後者の差分計算を行う手法の方が明らかに低演算量である。

　ところで、人の頭部が人体の一部として必ず存在することを利用して、「頭がある」か「頭がない」かを判定することによって、「人」か「人でない」かを判定することは容易に思いつく。例えば、顔は頭の一部であるので、非特許文献３に記載の顔探索処理によって、事実上「人である」か「人でない」かを判定できる。

　一般的に、頭がある程度大きく画像上に映っている場合は、「顔」か「顔でない」かを判定する顔判定処理における判定率が、「人」か「人でない」かを判定する処理よりも高い。また、顔判定処理は、顔以外の人体の部位が隠蔽されていても、正しい判定結果を得られる。しかも、顔判定処理については、非特許文献１のように、物体がありそうな部分領域を高速に検出する手法を前処理として組み合わせることで、ある程度、処理の高速化が可能であると容易に予想できる。

　特許文献１には、「顔」か「顔でない」かを判定する別の処理が記載されている。特許文献１に記載の方法では、レーザーレーダーで見つけた物体について、物体が存在する領域の画像から「顔がある」か「顔がない」かを判定することで、「人」か「人でない」かを判定する。

　特許文献２には、単純に顔を探索する領域を絞るだけでなく、複数のカメラを使ってステレオ視することでカメラから物体までの距離を計測し、該計測結果に基づいて、探索すべき顔の画像上での大きさも絞り込む手法が開示されている。この手法によれば、顔を探索するための演算量を抑えることができる。

　特許文献３には、画像中の人間の顔に対応する顔領域を抽出し、その顔領域の重心位置の床からの高さをカメラパラメータを参照して推定し、その推定結果から、画像中の車椅子領域を抽出する方法が記載されている。

特開２００７－１８７６１８号公報特開２００７－１５６９３９号公報ＷＯ２００２／０５６２５１（再公表特許）

Ｐａｕｌ　Ｖｉｏｌａ，　Ｍｉｃｈａｅｌ　Ｊｏｎｅｓ，　"Ｒａｐｉｄ　ｏｂｊｅｃｔ　ｄｅｔｅｃｔｉｏｎ　ｕｓｉｎｇ　ａ　ｂｏｏｓｔｅｄ　ｃａｓｃａｄｅ　ｏｆ　ｓｉｍｐｌｅ　ｆｅａｔｕｒｅｓ"，Ｐｒｏｃｅｅｄｉｎｇ　ｏｆ　Ｃｏｍｐｕｔｅｒ　Ｖｉｓｉｏｎ　ａｎｄ　Ｐａｔｔｅｒｎ　Ｒｅｃｏｇｎｉｔｉｏｎ　２００１，２００１年Ｃｏｌｌｉｎｓ，Ｌｉｐｔｏｎ，Ｋａｎａｄｅ，Ｆｕｊｉｙｏｓｈｉ，Ｄｕｇｇｉｎｓ，Ｔｓｉｎ，Ｔｏｌｌｉｖｅｒ，Ｅｎｏｍｏｔｏ，ａｎｄ　Ｈａｓｅｇａｗａ，"Ａ　Ｓｙｓｔｅｍ　ｆｏｒ　Ｖｉｄｅｏ　Ｓｕｒｖｅｉｌｌａｎｃｅ　ａｎｄ　Ｍｏｎｉｔｏｒｉｎｇ：　ＶＳＡＭ　Ｆｉｎａｌ　Ｒｅｐｏｒｔ"，　Ｔｅｃｈｎｉｃａｌ　ｒｅｐｏｒｔ　ＣＭＵ－ＲＩ－ＴＲ－００－１２，Ｒｏｂｏｔｉｃｓ　Ｉｎｓｔｉｔｕｔｅ，Ｃａｒｎｅｇｉｅ　Ｍｅｌｌｏｎ　Ｕｎｉｖｅｒｓｉｔｙ，　Ｍａｙ，２０００年細井利憲，石寺永記、"動き領域の見えに基づく物体認識"，ＦＩＴ２００６講演論文集，２００６年

　しかし、非特許文献１に記載の方法においては、画像中の物体のありそうな部分画像のすべてに対して、顔であるか否かの判定を行う必要があるため、演算量が多く、処理速度が遅くなってしまう。このため、高速な処理が要求される用途に対して、演算性能が低い、低価格のハードウェアを利用することができない。

　また、障害物による人物の隠蔽面積が大きい場合は、高い判定性能を得られない場合がある。このため、高い判定性能が要求される用途への適用は困難である。

　非特許文献２に記載の方法においては、差分画像を用いることで演算量の軽減が可能とされているものの、障害物による人物の隠蔽面積が大きい場合は、高い判定性能を得られない場合がある。このため、非特許文献１の場合と同様、高い判定性能が要求される用途への適用は困難である。

　非特許文献２に記載の判定方法に非特許文献３に記載の統計的な画像認識手法を組み合わせた手法においては、僅かな処理時間の増加だけで、判定性能を高めることができるものの、障害物による人物の隠蔽面積が大きい場合に、判定処理が困難になる場合がある。したがって、この手法を高い判定性能が要求される用途へ適用することは困難である。

　特許文献１、３に記載の方法はいずれも、物体が映っている部分画像領域から単純に顔を探索する処理を行うだけであり、演算量が多く、処理速度が遅くなってしまう。

　また、障害物による物体の隠蔽面積が大きい場合は、高い判定性能を得られない場合がある。このため、特許文献１、３に記載の方法も、非特許文献１、２の場合と同様、高い判定性能が要求される用途への適用は困難である。

　特許文献２に記載の手法においては、複数のカメラが必要であるため、システムを構成する上で機材のコストが高くなる。

　また、ステレオ視で得られる距離の精度が低いと探索する顔の大きさをうまく絞り込むことができないので、正確な距離を得るためにカメラの設置位置や設置環境に強い制約が生じ、その結果、設置場所が限定されてしまう。

　本発明の目的は、上記問題を解決し、障害物により物体の一部が隠蔽されている場合でも、精度良く、低演算量で、物体が人であるか否かを判定できる、人判定装置、方法およびプログラムを提供することにある。

　上記目的を達成するため、本発明の人判定装置は、
　外部カメラからの映像信号に基づく画像から抽出した障害物の前記画像上の領域を示す情報が格納される障害物記憶部と、
　前記画像から抽出した物体の一部が前記障害物により隠蔽されている場合に、前記物体が基準となる面に接する接地点が前記画像上で取り得る範囲を、前記障害物記憶部に格納された前記障害物の領域と推定し、該推定した範囲と、予め与えられた人の身長と頭部の大きさと位置の相対関係とに基づいて、前記物体における前記接地点から最も離れた部位を人の頭部と仮定した場合の、該頭部が前記画像上で取り得る範囲を計算する頭部範囲計算手段と、
　前記頭部範囲計算手段で計算した前記頭部の範囲において、前記頭部に対応する形状を有する領域があるか否かを判定する頭部検出手段と、を有することを特徴とする。

　本発明の人判定方法は、外部カメラからの映像信号に基づく画像中に出現する物体が人であるか否かを判定する人判定方法であって、前記障害物の前記画像上の領域を示す情報が格納された障害物記憶部を参照し、前記画像から抽出した物体の一部が前記障害物により隠蔽されている場合に、前記物体が基準となる面に接する接地点が前記画像上で取り得る範囲を、前記障害物記憶部に格納された前記障害物の領域と推定し、該推定した範囲と、予め与えられた人の身長と頭部の大きさと位置の相対関係とに基づいて、前記物体における前記接地点から最も離れた部位を人の頭部と仮定した場合の、該頭部が前記画像上で取り得る範囲を計算し、該計算した前記頭部の範囲において、前記頭部に対応する形状を有する領域があるか否かを判定することを特徴とする。

　本発明のプログラムは、外部カメラからの映像信号に基づく画像中に出現する物体が人であるか否かを判定するコンピュータに用いるプログラムであって、
　前記障害物の前記画像上の領域を示す情報が格納された障害物記憶部を参照する処理と、
　前記画像から抽出した物体の一部が前記障害物により隠蔽されている場合に、前記物体が基準となる面に接する接地点が前記画像上で取り得る範囲を、前記障害物記憶部に格納された前記障害物の領域と推定する処理と、
　前記推定した範囲と、予め与えられた人の身長と頭部の大きさと位置の相対関係とに基づいて、前記物体における前記接地点から最も離れた部位を人の頭部と仮定した場合の、該頭部が前記画像上で取り得る範囲を計算する処理と、
　前記計算した前記頭部の範囲において、前記頭部に対応する形状を有する領域があるか否かを判定する処理とを、前記コンピュータに実行させることを特徴とする。

本発明の第１の実施形態である人判定装置の構成を示すブロック図である。図１に示す人判定装置の全体動作を説明するためのフローチャートである。画像中の物体の接地点および頭頂点とその接地点が取りうる範囲を説明するための模式図である。人物が床面に直立している状態における頭頂点から接地点に向けた方向がある１点を向いている状態を示す模式図である。

１００　　データ処理装置
１１０　　隠蔽可能性診断手段
１２０　　接地点範囲計算手段
１３０　　位置・サイズ推定手段
１４０　　統合スコア算出手段
１５０　　人間サイズ適合判定手段
１６０　　頭部検出手段
１７０　　人判定手段
２００　　記憶装置
２１０　　障害物記憶部
２２０　　カメラパラメータ記憶部
２２０　　頭部検出パラメータ記憶部

　次に、本発明の実施形態について図面を参照して説明する。

（第１の実施形態）
　図１は、本発明の第１の実施形態である人判定装置の構成を示すブロック図である。図１を参照すると、人判定装置は、外部カメラから供給される映像信号に基づく画像中に、予め設定された障害物以外の物体が含まれる場合に、その物体が人であるか否かを判定するものであって、その主要部は、データ処理装置１００と記憶装置２００からなる。外部カメラは、例えば定点カメラである。

　記憶装置２００は、障害物記憶部２１０、カメラパラメータ記憶部２２０および頭部検出パラメータ記憶部２３０を含む。

　障害物記憶部２１０は、外部カメラから供給される映像信号に基づく画像上の、予め設定された障害物（人物や物体に隠蔽を与える可能性がある障害物）の領域を記憶している。障害物の画像上の形状を画素単位で表した情報を障害物記憶部２１０に保持することが望ましいが、例えば、複数の矩形領域の組み合わせとして、障害物の領域の情報を障害物記憶部２１０に保持してもよい。ここで、複数の矩形領域の組み合わせとは、小ブロックの組み合わせによって１つの障害物の形状を表現することを意味する。

　カメラパラメータ記憶部２２０は、外部カメラからの映像信号に基づく画像上における座標系、つまり画像座標系と、実世界の座標系、つまり地図上の座標系との間における相互変換を行うためのパラメータを記憶する。このパラメータは、事前（装置の運用前）に計算する。具体的には、参考文献１「Ｒ．　Ｙ．　Ｔｓａｉ，　”Ａ　Ｖｅｒｓａｔｉｌｅ　Ｃａｍｅｒａ　Ｃａｌｉｂｒａｔｉｏｎ　Ｔｅｃｈｎｉｑｕｅ　ｆｏｒ　Ｈｉｇｈ－Ａｃｃｕｒａｃｙ　３Ｄ　Ｍａｃｈｉｎｅ　Ｖｉｓｉｏｎ　Ｍｅｔｒｏｌｏｇｙ　Ｕｓｉｎｇ　Ｏｆｆ－ｔｈｅ－Ｓｈｅｌｆ　ＴＶ　Ｃａｍｅｒａｓ　ａｎｄ　Ｌｅｎｓｅｓ”，ＩＥＥＥ　Ｊｏｕｒｎａｌ　ｏｆ　Ｒｏｂｏｔｉｃｓ　ａｎｄ　Ａｕｔｏｍａｔｉｏｎ，　Ｖｏｌ．ＲＡ－３，Ｎｏ．４，ｐｐ．３２３－３４４，１９８７年」に記載されたカメラキャリブレーション手法を利用し、このカメラキャリブレーション手法によって導出された、カメラの内部パラメータおよび外部パラメータをカメラパラメータ記憶部２２０に記憶する。ここで、内部パラメータは、カメラの焦点距離などの情報を含む。外部パラメータは、カメラの位置や姿勢の情報を含む。

　なお、上記のカメラキャリブレーション手法は良く知られている技術であるので、ここでの詳細な説明は省略する。また、本実施形態の人判定装置の構成には、外部カメラそのものは含まれないが、カメラ・レンズ自身とカメラが設置された状況を記述するこのパラメータを事前に計算してカメラパラメータ記憶部２２０に格納することで、画像座標系と地図上の座標系の間の対応する点の相互変換を行うことが可能となる。

　頭部検出パラメータ記憶部２３０は、画像中に「頭部がある」か「頭部がない」かを判定するためのパラメータが格納されている。本実施形態において、「頭部がある」か「頭部がない」かを判定する手法は特に限定されるものではない。例えば、参考文献２「佐藤敦、一般学習ベクトル量子化による文字認識、電子情報通信学会技術報告、ＰＲＭＵ９５－２１９、１９９６年」に記載された、統計的パターン認識手法である「一般化学習ベクトル量子化」によって「頭部」か「頭部でない」かを認識する処理を繰り返し実行して頭部を探索してもよい。この場合は、”参照ベクトル”と呼ばれるパラメータが頭部検出パラメータ記憶部２３０に格納される。

　上記の「一般化学習ベクトル量子化」によれば、「頭部」と「頭部でない」の２つのカテゴリのそれぞれについて、そのカテゴリに属する１つ以上の参照ベクトルを用意する。入力されたデータと参照ベクトルとの距離を計算し、入力データを、最も距離が近い参照ベクトルと同じカテゴリに分類する。直感的には、参照ベクトルは、「頭部」を代表するベクトルと「頭部でない」を代表するベクトルがそれぞれ複数含まれる、ベクトルの集合である。

　データ処理装置１００は、プログラム制御により動作するコンピュータシステムであって、隠蔽可能性診断手段１１０、接地点範囲計算手段１２０、位置・サイズ推定手段１３０、人間サイズ適合判定手段１４０、頭部範囲計算手段１５０、頭部検出手段１６０および人判定手段１７０を有する。

　隠蔽可能性診断手段１１０は、外部カメラからの映像信号を受信し、その映像信号に基づく画像上で、「人」か「人でない」かを判定する対象である物体の領域が、障害物記憶部２１０に保持されている障害物の領域と画像座標上で接触するか否かを判定する。物体の領域が障害物の領域に接触する場合は、隠蔽可能性診断手段１１０は、障害物による物体の隠蔽が生じていると診断する。物体の領域が障害物の領域に接触していない場合は、隠蔽可能性診断手段１１０は、障害物による物体の隠蔽は生じていないと診断する。

　なお、仮に画像上で物体と障害物が接触しているとしても、外部カメラ側から見て物体が障害物の手前にある場合のように、明らかに障害物による物体の隠蔽が生じていない場合には、隠蔽可能性診断手段１１０は、障害物による物体の隠蔽は生じていないと診断する。障害物の領域は既知であり、物体の領域がその障害物の領域を隠蔽するような状態を検出することで、外部カメラ側から見て物体が障害物の手前にある状態を検出することができる。

　また、画像上における物体の抽出手法は、どのような方法を用いても良い。例えば、特許文献２に記載のような、ある時点の画像(背景画像)と現在の画像との差分に基づいて画像上における物体を抽出してもよい。

　接地点範囲計算手段１２０は、物体が地面や床面等の基準となる面（ここでは地面と仮定する）に接触する接地点、つまり物体が人であるなら足元に相当する点が、画像座標上でとり得る範囲を、障害物を考慮した上で計算する。さらに、物体の接地点から最も離れた点（部位）、つまり物体が人であるなら頭頂部に相当する点（以後、頭頂点と記述する）が、画像座標上でとり得る範囲を、障害物を考慮した上で計算する。

　位置・サイズ推定手段１３０は、画像座標系での物体の接地点および頭頂点の２点から、物体が現実世界の座標系でとり得る位置、つまり地図座標上での物体の位置と、物体のサイズを計算する。ただし、接地点範囲計算手段１２０では、物体の接地点および頭頂点の２点がそれぞれとり得る範囲が求められるため、位置・サイズ推定手段１３０で計算される結果は、物体がとり得る位置の範囲と、物体がとり得るサイズの範囲である。

　人間サイズ適合判定部１４０は、実世界の座標系での物体のサイズと統計的に生物としての人がとり得るサイズとを比較し、人としてあり得るサイズか否かを判定する。位置・サイズ推定手段１３０で算出される結果は、物体がとり得るサイズの範囲であるので、物体がとり得るサイズの範囲内と、統計的に人がとり得るサイズの範囲内に重複があれば、物体は人である可能性がある。

　ここで、物体がとり得るサイズの範囲は、前述の参考文献１に記載のTsaiの手法により求めた物体の大きさ（高さ）の最低値から最高値の範囲であって、例えば５０ｃｍ～１３０ｃｍという範囲である。一方、統計的に人がとり得るサイズの範囲は、例えば、日本人（小学生）であれば、身長１１０ｃｍ～１８０ｃｍの範囲とされる。この場合、１１０ｃｍ～１３０ｃｍの範囲が重複するため、物体がその範囲の身長の人間である可能性がある。

　頭部範囲計算手段１５０は、物体領域が画像座標上でとり得る範囲と、生物としての人の人体と頭部との位置・サイズの関係から、仮に物体が「人である」と仮定した場合に頭部が画像座標上で存在しうる得る範囲と、頭部のサイズがとり得る範囲を計算する。

　物体領域が画像座標上でとり得る範囲は、位置・サイズ指定手段１３０にて計算された値であって、物体がとり得る位置・サイズの範囲とそれに隣接する障害物の領域を加えたものである。この物体領域に基づいて、物体の高さの最低値から最大値を求められる。一方、医学的に身長と頭部の大きさの相対関係（身長と頭の大きさの比率、および全身における頭部の位置の関係）は一定の範囲内に収まる。このことから、人間の身長が判明すれば、頭の位置が取り得る範囲を求めることができる。したがって、物体の高さが人間の身長であると仮定し、頭の大きさ、頭の位置が取り得る範囲を絞り込むことができる。

　なお、人体の姿勢によって頭部がとり得る位置・サイズの範囲は変動するので、人体の姿勢については、本発明の用途に応じて制約を付加すればよい。例えば、人の歩行動作か直立姿勢しか観測できない状況の映像を本実施形態の人判定装置の入力とする場合は、歩行中の体全体と頭部との位置・サイズの関係と、直立している状態における体全体と頭部との位置・サイズの関係を制約として利用すればよい。

　頭部検出手段１６０は、画像中の特定の領域（頭部範囲計算手段１５０にて絞り込んだ領域）について、「頭部がある」か「頭部がない」かを判定する。この判定において、例えば、画像の輝度情報に基づいて統計的なパターン認識を行うパターン認識手法を利用して、特定の領域中の頭部の検出を行ってもよい。尚、本発明は「人」であるか「人でない」かを判定するものであるため、頭部の位置が確定しない手法であっても構わない。

　人物判定手段１７０は、頭部検出手段１６０にて特定の領域（頭部範囲計算手段１５０にて絞り込んだ領域）について「頭部がない」と判定された場合に、その領域により示される物体が人か否かを判定する。この判定では、例えば、物体の領域の縦横比を利用して人か否かを判定してもよいし、画像の輝度情報に基づく統計的パターン認識手法で、直接人か否かを判定してもよい。

　次に、本実施形態の人判定装置の全体の動作について詳細に説明する。

　以下の説明では、外部カメラからの映像信号に基づく画像について、事前処理として、あらかじめ、「人」か「人でない」かを判定する対象である物体の領域が絞り込まれているものと仮定する。具体的には、物体の領域を画像座標上の領域として示す情報が隠蔽可能性診断手段１１０に入力されてもよいし、物体の領域を画像から切り出した情報が隠蔽可能性診断手段１１０に入力されてもよい。ただし、実際は、絞り込まれた領域内に物体が存在しない場合がある。この場合は、人間サイズ適合判定手段１４０にて「人でない」と判定される。このようなことから、物体の領域を示す情報として、物体がありそうな領域を示す情報が隠蔽可能性診断手段１１０に入力されてもよい。

　図２は、図１に示した人判定装置の全体動作を説明するためのフローチャートである。

　まず、隠蔽可能性診断手段１１０が、物体の領域と障害物領域が画像上で接触しているか否かを判定する（ステップＳ１１０）。これにより、物体が障害物により隠蔽されている可能性があるか否かがわかる。

　次に、接地点計算手段１２０が、画像座標系における、物体が地面と接地する点（接地点）がとり得る範囲と物体における地面から最も離れた点（頭頂点）がとり得る範囲を求める（Ｓ１２０）。この際、接地点計算手段１２０は、障害物による隠蔽を考慮し、それら２つの点がとり得る可能性がある範囲を計算する。なお、ステップＳ１１０にて、物体と障害物の接触がないと判定された場合（物体が障害物に隠蔽されている可能性がない場合）は、物体の接地点および頭頂点が単に求められることになる。

　次に、位置・サイズ推定手段１３０が、ステップＳ１２０で求めた、画像座標系上での物体の接地点および頭頂点の各範囲から、物体が地図座標上でとり得る位置の範囲と物体のとり得るサイズの範囲をそれぞれ推定する（ステップＳ１３０）。この画像座標系から実世界座標系への変換は、カメラパラメータ記憶部２２０に保持されている値に基づいて行われる。

　次に、人間サイズ適合判定手段１４０が、ステップＳ１３０で求めた、地図座標上における物体のサイズの範囲が人物として適切なサイズの範囲に含まれるか否かを判定する（ステップＳ１４０）。ステップＳ１３０で求めた物体がとり得るサイズの範囲の少なくとも一部が、統計的に人がとり得るサイズの範囲内に収まっていれば、物体は「人」である可能性があるため、ステップＳ１４０にて適合していると判定される。一方、ステップＳ１３０で求めた物体がとり得るサイズの範囲が、統計的に人がとり得るサイズの範囲と重複しない場合は、「人」である可能性がないため、ステップＳ１４０にて適合していないと判定される。適合と判定された場合は、次のステップＳ１５０へ進む。不適合である場合は、処理を終了する。

　人間サイズ適合判定手段１４０にて適合と判定された場合は、頭部範囲計算手段１５０が、物体が人物であると仮定し、画像座標上で人物の頭部が存在し得る位置とサイズの各範囲を算出する（ステップＳ１５０）。

　次に、頭部検出部１６０が、頭部検出パラメータ記憶部２３０に格納されたパラメータを参照して、ステップＳ１５０で算出した頭部があり得る位置・サイズの範囲内に「頭部がある」か「頭部がない」かを判定する（ステップＳ１６０）。例えば、前述の統計的なパターン認識手法を用いることで、「頭部がある」か「頭部がない」かを判定することができる。

　ステップＳ１６０で「頭部がある」と判定された場合は、頭部検出部１６０は、かかる物体は「人」であるとの判定結果を出力し、その後、処理は終了する。一方、ステップＳ１６０で「頭部がない」と判定された場合（もしくはうまく頭部を検出できない場合）は、人物判定手段１７０が、人物判定処理を行う（ステップＳ１７０）。この人判定処理には、人か否かを判定する任意の処理を割り当てることができる。例えば、物体の領域の縦横比を利用して人か否かを判定してもよいし、画像の輝度情報に基づく統計的パターン認識手法で、直接人か否かを判定してもよい。

　以上説明した本実施形態の人判定装置によれば、障害物により隠蔽された物体の領域を考慮して、画像座標系におけるその物体の位置・サイズの範囲を計算し、その計算した範囲を地図座標上の範囲に変換し、その変換した範囲に基づいて物体が人間であるか否かを判定する。物体が人間である可能性がある場合にのみ、「頭部がある」か「頭部がない」かの判定処理が実行されるので、演算処理量を軽減することができる。

　また、障害物により隠蔽された物体の領域を考慮して、画像座標系におけるその物体の位置・サイズの範囲を絞り込み、その絞り込んだ範囲において、「頭部がある」か「頭部がない」かの判定処理を行う。これにより、演算量が軽減され、高性能に「頭部がある」か「頭部がない」かを判定できる。このように、頭部以外の隠蔽があっても、「人」か「人でない」かの判定処理を低演算量かつ高性能に実現できる。

　ここでは、図１に示した人判定装置の動作を、具体的な条件とともに詳細に説明する。

　本実施例では、画像座標系の上方向が実世界の座標系での高さ方向である場合、つまり人物が床面に直立している状態において、頭部が画像において上方向、足元が下方向に見える場合について説明する。

　また、物体を遮蔽する可能性がある障害物が、床に置かれた机や箱形状または板形状の物のみであると仮定する。この条件によれば、人の接地点と頭頂部の両点に対して障害物による遮蔽が生じる場合と、接地点に対してのみ障害物による遮蔽が生じる場合とがある。接地点と頭頂部の両方が隠蔽される場合は、そもそも、画像上の物体の領域を検出できない。したがって、事実上、遮蔽を考慮すべきなのは接地点のみとみなせる。

　以下では、画像の中から検出した１つの物体について、人であるか否かを判定する場合の動作を詳細に説明する。

　隠蔽可能性診断手段１１０に入力されるデータは、外部カメラからの画像データと、物体の領域を示す矩形の座標値とを含む。障害物記憶部２１０には、画像上の障害物の領域を複数の小さな矩形の集合体として表した情報が、あらかじめ記憶されている。この障害物記憶部２１０への障害物の情報の格納は、外部カメラから得られた画像データについて、人手による作業を介して行われる。仮に、画像を撮影するカメラが固定されている場合、別の時刻に撮影された画像に対しても、格納した障害物情報をそのまま利用可能である。障害物の領域を複数の小さな矩形の集合体として表す場合の入力作業量は、画素単位で障害物領域の情報を入力する場合のそれよりも少ない。

　また、カメラ画像座標系と実世界の座標系との相互変換のためのパラメータが、予めカメラパラメータ記憶部２２０に格納されている。このパラメータは、前述の参考文献１に記載されたカメラキャリブレーション手法を用いて事前に算出する。

　以下に、カメラキャリブレーション手法の具体的な適用例を簡潔に説明する。

　カメラのレンズが持つ定数値（焦点距離など）は既知である。実世界の座標の基準となる平面、例えば地面上の３点以上の複数の点について、手作業によって、カメラで実際に撮影した画像上の座標値および対応する実世界の地面（地図座標）上の座標値を求める。次に、これらの値を前述の参考文献１に記載された式に適用することで、カメラパラメータを計算する。

　頭部検出手段１４０での「頭部がある」か「頭部がない」かを判定する手法として、前述の参考文献２に記載されている「一般化学習ベクトル量子化」による「頭部」か「頭部でない」かの判定処理を、処理対象領域から切り出せるあらゆる部分領域に対して実行するものとする。これにあわせて、画像の部分領域を「頭部」か「頭部でない」か判定するためのパラメータとして、「一般化学習ベクトル量子化」によって学習された参照ベクトルを計算しておき、これを事前に頭部検出パラメータ記憶部２３０に格納しておく。

　以下、図１及び図２を参照して、人判定の動作を詳細に説明する。

　まず、図２のステップＳ１１０に相当する動作を実行する。このステップＳ１１０では、物体に隠蔽が発生している可能性があるか否かを判定するために、障害物領域と物体領域である矩形領域が接触しているか否かを判定する。

　なお、本実施例では、先述のとおり、画像座標系の上方向が実世界の座標系での高さ方向であって、かつ物体の接地点と頭頂部の２点に対する障害物による遮蔽が、接地点のみの場合という条件が与えられている。しかも、次段のステップＳ１２０では、画像上では物体の下端に相当する物体の接地点と、画像上では物体の上端に相当する頭頂点の２点以外は必要でない。このため、ステップＳ１１０の処理を簡略化することができる。

　具体的には、ステップＳ１１０では、障害物領域（矩形）の上辺と物体領域（矩形）の下辺との接触のみを判定すればよい。障害物領域を示す小さな複数の矩形のそれぞれの上端と、物体領域（矩形）の下端の座標値を比較して、物体の下端の座標値の方が画像上で接触していれば、障害物により物体の一部が隠蔽されている可能性がある。

　次に、図２のステップＳ１２０に相当する動作を実行する。

　ステップＳ１１０で障害物による隠蔽がないと判定された場合は、物体の下端の点を接地点と決定し、物体の上端の点を頭頂点と決定する。図３に示す例では、２つの物体のうち、図面に向かって右側の物体については、ステップＳ１１０で障害物による隠蔽がないと判定される。したがって、この右側の物体については、その下端の点Ｐ１が接地点とされ、その上端の点Ｐ２が頭頂点とされる。

　一方、ステップＳ１１０で障害物による隠蔽があると判定された場合は、障害物領域の上端から下端までの間に物体の接地点がある可能性がある。したがって、障害物領域の上端から下端までの範囲（図３のＨ）が物体の接地点がとり得る範囲であるとされる。物体の上端の点が地面から最も離れた点（頭頂点）とされる。この地面から最も離れた点は、ステップＳ１１０で隠蔽がないと判定された場合に決定された頭頂点と同じである。

　次に、図２のステップ１３０に相当する動作を実行する。

　ステップＳ１２０で接地点と頭頂点がそれぞれ１点に決定している場合は、画像座標上の接地点を実世界の座標上での点に変換することで、実世界の物体の位置、つまり地図座標上での物体の位置が求まる。さらに、物体の頭頂点についても、画像座標から地図座標への変換を行い、その変換した物体の頭頂点と地図座標上の物体の位置とに基づいて、物体のサイズを求める。

　上記の座標変換による計算手法として、前述の参考文献１に記載の計算手法を用いることができる。より具体的には、そのような計算手法として、参考文献３（小川雄三，藤吉弘亘，”実空間に対応したＭａｓｔｅｒ－Ｓｌａｖｉｎｇによる追尾カメラシステム”，第9回画像センシングシンポジウム，２００３年）に記載された実世界座標の高さの取得のための計算手法（式（８）および式（９）を参照）を用いることができる。

　一方、ステップＳ１２０で接地点が１点ではなく、とり得る範囲として求まった場合には、その接地点に対応する物体の地図座標上の位置も範囲として求める必要がある。この範囲の計算には、次のような近似計算を用いる。

　まず、物体の接地点がとり得る範囲において最も上部にあたる点、つまり障害物と接触している点を、地図座標に変換した点（点Ａとする）と、物体の接地点がとり得る範囲において最も下部にあたる点、つまり障害物の下端の点を、地図座標に座標変換した点（点Ｂとする）をそれぞれ計算する。そして、点Ａと点Ｂの間の範囲を地図座標上で物体がとり得る範囲とみなせばよい。また、実世界の物体のサイズも範囲として求める必要があるが、この計算は、物体の接地点が点Ａの場合に求まるサイズと、物体の接地点が点Ｂの場合に求まるサイズとの間を、物体のサイズの範囲とすればよい。

　次に、図２のステップＳ１４０に相当する動作を実行する。

　ステップＳ１３０で求まった物体の実際のサイズの範囲について、人間がとり得るサイズの範囲と重複しているか否かを調べる。具体的には、統計的に人間の体がとり得る身長の上限と下限の値を、人間がとり得る範囲とすればよい。本発明を実際に適用する状況において、画像中に出現する人を日本国籍の大人に限定できる場合には、その統計値を利用すればよい。もちろん、身長の上限値と下限値をそのまま利用するのではなく、統計的な身長の分布から、実用上無視してよい上限値と下限値を使えばよい。

　ステップＳ１４０の動作で、人間である可能性がないと判断された場合は、「人でない」と判定し、処理を終える。

　次に、図２のステップＳ１５０に相当する動作を実行して、画像座標上で頭部が存在しうる範囲と、頭部のサイズの範囲を予測する。ステップＳ１４０において求まった物体の高さを人の身長と仮定した場合に、人物の頭部が存在する箇所と、頭部サイズの範囲を求める。具体的には、画像中の人の姿勢が歩行か直立に限られる場合は、人の身長に対する頭部の大きさの分布に応じて、頭部のサイズの範囲を予測できる。また、頭頂点から頭部の大きさ分だけの範囲に頭部があると予測できる。

　次に、図２のステップＳ１６０に相当する動作を実行する。

　ステップＳ１５０で予測された頭部があり得る範囲と、頭部がとり得るサイズの範囲に限定して、「頭部がある」か「頭部がない」かを判定する。この判定手法としては、統計的なパターン認識方式の１つである「一般化学習ベクトル量子化」による「頭部」か「頭部でない」かの判定処理を、処理対象領域から切り出せるあらゆる部分領域に対して実行する。「頭部がある」か「頭部がない」かを判定する範囲を絞り込めているほど、処理時間の増大を防ぐことができる。

　ステップＳ１６０の動作で、「頭部がある」と判定された場合は、「人である」と判定し、処理を終える。

　次に、図２のステップＳ１７０に相当する動作を実行する。

　ステップＳ１７０には、人か否かを判定する任意の処理を割り当てることができるが、本実施例では、対象物体の領域の縦横比で判定する。人が歩行者か直立姿勢であれば、画像上の物体領域は縦長であるため、「人」と判定して処理を終える。そうでなければ、「人でない」と判定して処理を終える。

　もちろん、ステップＳ１６０までの処理で人であるという判定性効率が実用上十分なものであれば、ステップＳ１７０を省略しても構わない。

　次に、本実施例の効果について説明する。

　本実施例では、障害物による隠蔽の可能性を考慮しつつ、「頭部がある」か「頭部がない」かの判定処理の範囲を絞り込む処理をしているため、無駄な計算をすることなく高精度に「頭部がある」か「頭部がない」かを判断できる。これにより、「人」か「人でない」かの判定処理を、頭部以外の隠蔽がある場合でも、低演算量で、かつ、高精度に実現できる。

　ところで、本実施例では、実世界の座標系での高さ方向を画像座標系の上方向としているが、高さ方向を、上方向ではなく、別の方向としてもよい。この場合、上方向と別の方向のなす角度に対応する回転角で入力画像を回転してもよい。また、障害物による隠蔽の判定時に、入力される画像座標系の上方向を回転して適用すれば、上述した処理と同じ効果を得ることができる。つまり、入力される画像をあらかじめ回転しておくか、もしくは物体の頭頂方向から接地点方向を軸とした画像座標系とみなし、物体と障害物との隠蔽関係を適用すればよい。

　なお、位置・サイズ推定手段１３０の計算式は、この回転について考慮されているので、そのまま利用できる。

　実世界の座標系での高さ方向、もしくはその反対方向が、画像座標系の一定方向ではなく、画像中のある１点に向かっている場合がある。より具体的には、図４に示すように、人物が床面に直立している状態において、頭頂点から接地点に向けた方向がある１点を向いている場合がある。このような状態は、例えば、カメラをほぼ地面方向に向けた場合にみられる。この場合、物体の頭頂方向と接地点方向が画像上の位置に応じて異なる。この場合は、物体の下端方向と障害物の下端方向がそれぞれ画像上の１点に向かっているとみなして、物体と障害物との隠蔽関係を適用すればよい。

　また、レンズによる画像の歪みが大きい場合には、単に１点を向いているとはいえないが、画像全体の中の物体の位置に対応した上端と下端の方向を別途メモリに記憶しておき、この方向を参照して処理を切り替えればよい。

　図２に示した一連の処理は、外部カメラから供給される映像信号のフレーム毎に実施してもよい。また、画像上で物体が抽出されたフレームに対してのみ、図２に示した一連の処理を実行してもよい。

　本発明によれば、カメラで撮影された動画像や静止画像に映った物体が「人」であるか「人でない」かを、ある程度の隠れがあっても、低演算量で、安価な機材を用いて判定できる。このため、机や棚など障害物が数多くある室内における人物監視といった用途に適用できる。

　以上、実施形態を参照して本発明を説明したが、本発明は上述した実施形態や実施例に限定されるものではない。本発明の構成および動作については、本発明の趣旨を逸脱しない範囲において、当業者が理解し得る様々な変更を行うことができる。

　例えば、図１に示した構成において、各手段の一部を統合して構成を簡単化してもよい。例えば、人判定装置は、外部カメラからの映像信号に基づく画像から抽出した障害物の上記画像上の領域を示す情報が格納される障害物記憶部と、上記画像から抽出した物体の一部が上記障害物により隠蔽されている場合に、上記物体が基準となる面に接する接地点が上記画像上で取り得る範囲を、上記障害物記憶部に格納された上記障害物の領域と推定し、該推定した範囲と、予め与えられた人の身長と頭部の大きさと位置の相対関係とに基づいて、上記物体における上記接地点から最も離れた部位を人の頭部と仮定した場合の、該頭部が上記画像上で取り得る範囲を計算する頭部範囲計算手段と、上記頭部範囲計算手段で計算した上記頭部の範囲において、上記頭部に対応する形状を有する領域があるか否かを判定する頭部検出手段と、を有するものであってもよい。

　上記の構成によれば、物体を隠蔽した障害物の範囲を考慮して物体の範囲を推定し、その推定範囲内で頭部が取り得る範囲を絞り込むようになっている。したがって、範囲を絞り込んだ分だけ、頭部の判定処理における演算量を削減することができ、処理速度も速くすることができる。

　また、複数のカメラを用いる必要がないので、コスト増大やカメラの設置条件による制約の問題を回避することができる。

　上記の人判定装置において、上記画像の座標上の点と実世界の座標上の点を互いに座標変換できるパラメータを保持するカメラパラメータ記憶部と、上記カメラパラメータ記憶部に保持したパラメータを参照して、上記接地点の推定範囲と上記基準となる面からの上記部位の高さとから決まる、上記画像の座標上で上記物体が取り得る位置およびサイズの範囲を、上記実世界の座標上の位置およびサイズの範囲に返還する位置・サイズ推定手段と、上記実世界の座標における人体の大きさと頭の大きさの統計的な分布に基づいて、上記位置・サイズ推定手段で変換した上記実世界の座標上における上記物体の位置およびサイズの範囲が人としてあり得る範囲であるか否かを判定する人間サイズ適合判定手段とをさらに有し、上記頭部範囲計算手段は、上記人間サイズ適合判定手段にて上記物体の位置およびサイズの範囲が人としてあり得る範囲であると判定された場合に、上記物体の範囲のうちの頭部が存在し得る範囲を予測してもよい。

　また、上記の人判定装置において、上記画像上における上記障害物の領域が矩形形状の領域として定義されており、上記画像の座標上で、上記基準とされる面に垂直な方向において、上記物体の領域が上記障害物の領域の上端と接触するか否かを判定し、それら領域が接触する場合に、上記障害物により上記物体の一部が隠蔽されていると判定する隠蔽可能性診断手段をさらに有していてもよい。

　さらに、上記の人判定装置において、上記隠蔽可能性診断手段にて上記障害物により上記物体の一部が隠蔽されていると判定された場合に、上記画像の座標上で、上記基準とされる面に垂直な方向において、上記障害物の領域の下端から上端までの範囲を上記接地点の範囲として推定する接地点範囲計算手段をさらに有し、上記頭部範囲計算手段は、接地点範囲計算手段で推定した範囲に基づいて、上記頭部の範囲を計算してもよい。

　さらに、上記の人判定装置において、上記頭部検出手段で頭部に対応する形状が検出されなかった場合に、上記画像の座標上で、上記物体の領域の形状が予め与えられた人の形状を示す条件を満たすか否かを判定し、条件を満たす場合に、上記物体が人であると判定する人判定手段を、さらに有していてもよい。

　また、図１に示した構成において、データ処理装置１００としてパーソナルコンピュータを用い、記憶装置２００として半導体メモリを用いることができる。この場合、障害物記憶部２１０、カメラパラメータ記憶部２２０および頭部検出パラメータ記憶部２３０は、半導体メモリ上の一部とみなせる。また、隠蔽可能性診断手段１１０、接地点範囲計算手段１２０、位置・サイズ推定手段１３０、人間サイズ適合判定部１４０、頭部範囲計算手段１５０、頭部検出手段１６０および人物判定手段１７０は、パーソナルコンピュータのＣＰＵが人判定用プログラムを実行することで提供することができる。人判定用プログラムは、図２に示した一連の処理をＣＰＵに実行させるものである。

　また、上述した実施形態では、画像座標における物体の位置およびサイズの推定範囲を地図座標上の範囲に変換し、その変換した範囲が人としてあり得る範囲であるか否かを、実世界の座標における人体の大きさと頭の大きさの統計的な分布に基づいて判定している。これに代えて、地図座標における人体の大きさと頭の大きさの統計的な分布に基づく範囲を画像座標上の範囲に変換して、その変換した範囲に基づいて、画像座標における物体の大きさの推定範囲が人としてあり得る範囲であるか否かを判定してもよい。

　本発明は、監視カメラ全般に適用することができる。

　この出願は、２００８年１２月２２日に出願された日本出願特願２００８－３２５４４７を基礎とする優先権を主張し、その開示の全てをここに取り込む。

Claims

　外部カメラからの映像信号に基づく画像から抽出した障害物の前記画像上の領域を示す情報が格納される障害物記憶部と、
　前記画像から抽出した物体の一部が前記障害物により隠蔽されている場合に、前記物体が基準となる面に接する接地点が前記画像上で取り得る範囲を、前記障害物記憶部に格納された前記障害物の領域と推定し、該推定した範囲と、予め与えられた人の身長と頭部の大きさと位置の相対関係とに基づいて、前記物体における前記接地点から最も離れた部位を人の頭部と仮定した場合の、該頭部が前記画像上で取り得る範囲を計算する頭部範囲計算手段と、
　前記頭部範囲計算手段で計算した前記頭部の範囲において、前記頭部に対応する形状を有する領域があるか否かを判定する頭部検出手段と、を有する人判定装置。
　前記画像の座標上の点と実世界の座標上の点を互いに座標変換できるパラメータを保持するカメラパラメータ記憶部と、
　前記カメラパラメータ記憶部に保持したパラメータを参照して、前記接地点の推定範囲と前記基準となる面からの前記部位の高さとから決まる、前記画像の座標上で前記物体が取り得る位置およびサイズの範囲を、前記実世界の座標上の位置およびサイズの範囲に返還する位置・サイズ推定手段と、
　前記実世界の座標における人体の大きさと頭の大きさの統計的な分布に基づいて、前記位置・サイズ推定手段で変換した前記実世界の座標上における前記物体の位置およびサイズの範囲が人としてあり得る範囲であるか否かを判定する人間サイズ適合判定手段とをさらに有し、
　前記頭部範囲計算手段は、前記人間サイズ適合判定手段にて前記物体の位置およびサイズの範囲が人としてあり得る範囲であると判定された場合に、前記物体の範囲のうちの頭部が存在し得る範囲を計算する、請求の範囲第１項に記載の人判定装置。
　前記画像上における前記障害物の領域が矩形形状の領域として定義されており、
　前記画像の座標上で、前記基準とされる面に垂直な方向において、前記物体の領域が前記障害物の領域の上端と接触するか否かを判定し、それら領域が接触する場合に、前記障害物により前記物体の一部が隠蔽されていると判定する隠蔽可能性診断手段をさらに有する、請求の範囲第１項または第２項に記載の人判定装置。
　前記隠蔽可能性診断手段にて前記障害物により前記物体の一部が隠蔽されていると判定された場合に、前記画像の座標上で、前記基準とされる面に垂直な方向において、前記障害物の領域の下端から上端までの範囲を前記接地点の範囲として推定する接地点範囲計算手段をさらに有し、
　前記頭部範囲計算手段は、接地点範囲計算手段で推定した範囲に基づいて、前記頭部の範囲を計算する、請求の範囲第３項に記載の人判定装置。
　前記頭部検出手段で頭部に対応する形状が検出されなかった場合に、前記画像の座標上で、前記物体の領域の形状が予め与えられた人の形状を示す条件を満たすか否かを判定し、条件を満たす場合に、前記物体が人であると判定する人判定手段を、さらに有する、請求の範囲第１項から第４項のいずれか１項に記載の人判定装置。
　外部カメラからの映像信号に基づく画像中に出現する物体が人であるか否かを判定する人判定方法であって、
　前記障害物の前記画像上の領域を示す情報が格納された障害物記憶部を参照し、
　前記画像から抽出した物体の一部が前記障害物により隠蔽されている場合に、前記物体が基準となる面に接する接地点が前記画像上で取り得る範囲を、前記障害物記憶部に格納された前記障害物の領域と推定し、
　該推定した範囲と、予め与えられた人の身長と頭部の大きさと位置の相対関係とに基づいて、前記物体における前記接地点から最も離れた部位を人の頭部と仮定した場合の、該頭部が前記画像上で取り得る範囲を計算し、
　該計算した前記頭部の範囲において、前記頭部に対応する形状を有する領域があるか否かを判定する、人判定方法。
　外部カメラからの映像信号に基づく画像中に出現する物体が人であるか否かを判定するコンピュータに用いるプログラムであって、
　前記障害物の前記画像上の領域を示す情報が格納された障害物記憶部を参照する処理と、
　前記画像から抽出した物体の一部が前記障害物により隠蔽されている場合に、前記物体が基準となる面に接する接地点が前記画像上で取り得る範囲を、前記障害物記憶部に格納された前記障害物の領域と推定する処理と、
　前記推定した範囲と、予め与えられた人の身長と頭部の大きさと位置の相対関係とに基づいて、前記物体における前記接地点から最も離れた部位を人の頭部と仮定した場合の、該頭部が前記画像上で取り得る範囲を計算する処理と、
　前記計算した前記頭部の範囲において、前記頭部に対応する形状を有する領域があるか否かを判定する処理とを、前記コンピュータに実行させるプログラム。