JP5002575B2 - 非定常度推定装置、非定常度推定方法、非定常度推定プログラム - Google Patents

非定常度推定装置、非定常度推定方法、非定常度推定プログラム Download PDF

Info

Publication number
JP5002575B2
JP5002575B2 JP2008304946A JP2008304946A JP5002575B2 JP 5002575 B2 JP5002575 B2 JP 5002575B2 JP 2008304946 A JP2008304946 A JP 2008304946A JP 2008304946 A JP2008304946 A JP 2008304946A JP 5002575 B2 JP5002575 B2 JP 5002575B2
Authority
JP
Japan
Prior art keywords
feature
motion
identification
stationary
feature quantity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008304946A
Other languages
English (en)
Other versions
JP2010128947A (ja
Inventor
恭子 数藤
達哉 大澤
佳織 若林
秀樹 小池
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2008304946A priority Critical patent/JP5002575B2/ja
Publication of JP2010128947A publication Critical patent/JP2010128947A/ja
Application granted granted Critical
Publication of JP5002575B2 publication Critical patent/JP5002575B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、映像中に含まれる動物体の動きに基づく特徴量からシーンの非定常度を識別する技術に関する。
近年、多数のカメラを備えた映像監視システムが普及し、監視業務の効率化が必要とされている。そのため、映像監視システムに映像蓄積機能だけでなく、動物体検出機能や人物追跡機能など、映像から情報を抽出する機能が組み込まれるようになった。そうした機能の一つとして、普段と異なるシーンを自動検出する非定常検出の技術が求められており、これを既存の映像監視システムに映像モジュールに組み込みたいとのニーズが高まっている。
映像から非定常なシーンを検出する手がかりとして、映像中の動物体の位置の変化と動き方向の変化を検出するには、各時刻における位置の座標と、その座標における動きベクトルの組として特徴量とすることで、その特徴量の違いから非定常なシーンを検出することができる。しかしながら、非定常なシーンの検出には次の問題が提起されている。
第一の問題点は、動きベクトル抽出の処理はノイズの影響を受けやすく、特徴量のばらつきが多いことが原因で、定常、非定常を安定して分離することが困難なことである。
第二の問題点は、動きベクトルの時間変化をどのようにして識別器へ入力するかということである。画像の画素ごとに動きベクトルを記憶する場合、数千から数十万のオーダーの画素のフレーム数倍の情報となる。このようにすると、計算上のメモリ使用量や統計処理に要する時間が膨大となり、リアルタイムの検出処理への入力には不向きである。動物体の存在する領域のみの情報を保持することでメモリ量を減らすことが可能であるが、その領域の数が時間とともに変化するような場合、特徴量の次元数が変化してしまうため、統計処理のうえで扱いにくい。そこで、映像中の動物体の位置の変化及び動き方向の変化について、これを安定した低次元の特徴量として抽出する方法が必要である。
第三の問題点は、定常・非定常を分ける情報として何を特徴量に用いるべきなのかは、カメラの設置場所とそこで観察される映像によって異なると考えられるが、あらかじめどんな特徴量が最適であるかを見極めるのは難しく、自動的に特徴量を選択する手法が示されていないことである。必ずしもすべてを用いればよいわけではなく、定常/非定常の分離に寄与しない特徴は、識別演算の上でノイズとなる可能性があり、計算コストが無駄になるおそれがある。
第一の問題点に対しては、非特許文献1に動物体領域内での空間的、時間的動き平均を求める方法が提案されている。この方法は、動領域が人間かそうでないかを識別するための動きに基づく特徴量として提案されており、領域ごとの比較を行う場合に有効である。しかし、領域ごとの比較ではなく、画像全体の特徴量とする方法は示されていない。画像全体についての特徴量を抽出するためには、その中に含まれる主要な動物体の動き特徴を反映できるような工夫が必要である。
羽下哲司,鷲見和彦,八木康史 「変化領域内の動きの時空間特徴に着目した屋外情景における歩行者の検出」電子情報通信学会論文誌D−II、vol.J87−D−II,No.5,pp.1104−1111,2004. 松山隆司,久野義徳,井宮淳編「コンピュータビジョン」新技術コミュニケーションズ 3.3.4節 pp.172 申,渡辺,菅原 「テンポラルテンプレートを用いた動画像解析手法」電子情報通信学会技術研究報告、PRMU2002 馬場 「角度データの統計」統計数理研究所彙報 第28巻第一号、pp.41--45,1981 Zeng Wenhua,Ma Jian,"A Novel Incremental SVM Learning Algorithm,"The 8th International Conference on Computer Supported Cooperative Work in Design Proceedings,pp.658--662,2003.
従来の技術では、動きベクトル抽出の処理はノイズの影響を受けやすく、動きベクトルを用いた特徴量はばらつきが多いため、安定した定常/非定常の分類が困難である。動物体領域内での空間的、時間的動き平均を求める既存の方法を用いるとしても、領域ごとの比較ではなく画像全体の特徴量とする方法は示されていない。
また、画像の画素ごとに動きベクトルを記憶する場合、数千から数十万のオーダーの特徴量となり、計算上のメモリ使用量や統計処理に要する時間が膨大となり、リアルタイム処理に不向きである。動物体の存在する領域のみの情報を保持することでメモリ量を減らすと、その領域の数が時間と共に変化するような場合、特徴量の次元数が変化してしまうため、統計処理に向き難い。
さらに、定常・非定常を分ける情報として、抽出可能な動き特徴は、動物体の位置、動きの方向、大きさ、時間などがあるが、これらの情報の中で、定常/非定常の違いに寄与しないものを用いることは、識別演算の上でノイズとなる可能性があり、計算コストも無駄になるおそれがある。そのため、動物体の動き特徴のうち、位置、動き方向、大きさ、動きの連続時間などのうち、いずれの要素を特徴量に反映するのか、その組み合わせを選択する手段が必要である。
本発明は、このような事情に鑑みてなされたものであり、動物体の動き特徴から安定的に定常/非定常を分類することを解決課題としている。
そこで、請求項1記載の発明は、前記課題を解決すべく、撮影装置で撮影された映像中に含まれる動物体の動きに基づく特徴量を抽出し、統計的な処理によってシーンの非定常性を識別する装置であって、前記撮影装置からの入力映像中において動物体の動きに基づく特徴量を抽出する動き特徴抽出手段と、前記動き特徴抽出手段の抽出した特徴量から前記入力映像の非定常性を識別する識別手段と、を備え、前記動き特徴抽出部は、前記入力映像から時系列の特徴量を生成する複数の特徴量抽出モジュールと、前記各特徴量抽出モジュールの生成した特徴量を、特徴量選択基準に基づいて選択し、該選択された各特徴量の組合せの時系列を前記識別部に出力する特徴量選択手段と、を備え、前記各特徴量抽出モジュールは、前記入力映像中の動物体領域を抽出し、該動物体領域と背景領域の二値画像を求める変化領域抽出手段と、前記入力映像中の時系列の各画像において、各画素の位置(x.y)と該画素の動き方向(u.v)を示す二次元ベクトルをペアにした動きベクトル配列(x.y.u.v)を求める動きベクトル算出手段と、前記動物体領域の情報と前記動きベクトル配列の情報とを統合し、該統合されたベクトルのペアを特徴量として求める統合ベクトル算出手段と、を備えることを特徴としている。
請求項2記載の発明は、請求項1記載の非定常度推定装置であって、前記統合ベクトル算出手段は、時系列の前記二値画像を時間的に重畳したモーション履歴画像を、前記動物体領域に数値をあてはめ前記背景領域をゼロとして生成するモーション履歴生成手段と、前記動きベクトル配列を、前記モーション履歴画像を用いてマスク処理を行うマスク処理手段と、を備えることを特徴としている。
請求項3記載の発明は、請求項1または2のいずれか1項に記載の非定常度推定装置であって、前記各特徴量抽出モジュールは、前記統合されたベクトルのペアが連続して出現する時間をカウントする連続時間カウント手段をさらに備え、前記カウント時間を前記統合されたベクトルのペアに付加した特徴量を前記特徴量選択部に出力することを特徴としている。
請求項4記載の発明は、請求項1〜3のいずれか1項に記載の非定常度推江地装置であって、前記識別手段は、各特徴量抽出モジュールの特徴量を組み合わせたN次元の識別特徴量を、SVM(サポートベクタマシン)手法を用いて定常/非定常に分類するSVM識別手段と、前記SVM識別手段で生成されたサポートベクトル群および定常/非定常の識別結果から、N次元の特徴量の要素に応じて該要素を最終的に識別に用いるか否かを示すN個の論理値を前記識別機器にフィードバックする特徴量評価手段とを備え、定常・非定常のプラグの時系列を識別結果として表示させることを特徴としている。
請求項5記載の発明は、撮影装置で撮影された映像中に含まれる動物体の動きに基づく特徴量を抽出し、統計的な処理によってシーンの非定常性を識別する方法であって、動き特徴量抽出手段が、前記撮影装置からの入力映像中において動物体の動きに基づく特徴量を抽出する動き特徴抽出ステップと、識別手段が、前記動き特量抽出ステップで抽出した特徴量から前記入力映像の非定常性を識別する識別ステップと、を有し、前記動き特徴抽出ステップは、複数の特徴量抽出モジュールのそれぞれが、前記入力映像から時系列の特徴量を生成する特徴量生成ステップと、特徴量選択手段が、前記特徴量生成ステップで生成した各特徴量を、特徴量選択基準に基づいて選択し、該選択された各特徴量の組合せの時系列を前記識別部に出力する特徴量選択ステップと、を有し、前記特徴量生成ステップは、前記入力映像中の動物体領域を抽出し、該動物体領域と背景領域の二値画像を求める変化領域抽出ステップと、前記入力映像中の時系列の各画像において、各画素の位置(x.y)と該画素の動き方向(u.v)を示す二次元ベクトルをペアにした動きベクトル配列(x.y.u.v)を求める動きベクトル算出ステップと、前記動物体領域の情報と前記動きベクトル配列の情報とを統合し、該統合されたベクトルのペアを特徴量として求める統合ベクトル算出ステップと、を有することを特徴としている。
請求項6記載の発明は、請求項5記載の非定常度推定方法であって、前記統合ベクトル算出ステップは、時系列の前記二値画像を時間的に重畳したモーション履歴画像を、前記動物体領域に数値をあてはめ前記背景領域をゼロとして生成するモーション履歴生成ステップと、前記動きベクトル配列を、前記モーション履歴画像を用いてマスク処理を行うマスク処理ステップと、を有することを特徴としている。
請求項7記載の発明は、請求項5または6のいずれか1項に記載の非定常度推定方法であって、前記特徴量生成ステップは、前記各特徴量抽出モジュールが前記統合されたベクトルのペアが連続して出現する時間をカウントする連続時間カウントステップをさらに有し、前記カウント時間を前記統合されたベクトルのペアに付加した特徴量を前記特徴量選択ステップで用いることを特徴としている。
請求項8記載の発明は、請求項5〜7のいずれか1項に記載の非定常度推定方法であって、前記識別ステップは、特徴量生成ステップで生成された各特徴量を組み合わせたN次元の識別特徴量を、SVM(サポートベクタマシン)識別手器を用いて定常/非定常に分類するSVM識別ステップと、前記SVM識別ステップで生成されたサポートベクトル群および定常/非定常の識別結果から、N次元の特徴量の要素に応じて該要素を最終的に識別に用いるか否かを示すN個の論理値を前記識別器にフィードバックする特徴量評価ステップと、を有し、定常・非定常のプラグの時系列を識別結果として表示させることを特徴としている。
請求項記載の発明は、請求項1〜4のいずれか1項に記載の非定常度推定装置として、コンピュータを機能させることを特徴とする非定常度推定プログラムに関する。
請求項1〜9記載の発明によれば、動物体の動き特徴から安定的に定常/非定常が分類され、ノイズに影響されることなく、高速に高精度な非定常検出を行うことができる。
図1は、本発明の実施形態に係る非定常度推定装置の構成例を示し、該推定装置1には映像監視システムの撮影装置(例えばデジタルカメラ,デジタルビデオカメラなど)からネットワーク経由で映像データが入力されている。
前非定常度記推定装置1は、コンピュータにより構成され、前記映像データを入力する映像入力部2と、この映像入力部2の入力映像から動物体の動き特徴を時系列に抽出する動き特徴抽出部3と、この動き特徴抽出部3の抽出した時系列の動き特徴に基づいて動き特徴の非定常度を示す数値を求める識別部4と、この識別部4の求めた数値を表示する表示部5とを有している。
この各部2〜5の処理機能は、コンピュータのハードウェアとソフトウェアの協働によって実現されている。このとき前記識別部4は、非定常度の数値を閾値判定して非定常か否かを示す論理値を前記表示部5に出力することもできる。ここで出力される前記表示部5は例えばモニタなどでよい。
なお、前記非定常度推定装置1は、通常のコンピュータの構成要素、例えば前記各部2〜5の処理を制御する演算手段(例えばCPU:Central Processor Unit)、前記各部2〜5の処理データを記憶可能なメモリ(RAM)、前記各部2〜5の処理データを保存可能なハードディスクドライブ装置、ネットワーク接続用の通信デバイス、ポインティングデバイスやキーボードなどの入力手段を有している。以下、前記各部2〜5の具体的に処理内容を説明する。
(1)映像入力部2
前記映像入力部2に入力される映像データは、例えばAVIファイルやJPEG画像列などでよく、前記映像入力部2には映像データが1フレームずつ入力される。ここでは前記映像入力部2は通信デバイスをもって実現されている。
(2)動き特徴抽出部3
前記動き特徴抽出部3は、入力された映像データを複数フレームずつ用いて、物体の動き特徴を抽出する。ここで抽出される動き特徴は、映像に含まれる動物体の領域およびその動き方向およびその変化に関する情報をもつ数値とする。
具体的には、前記動き特徴抽出部3は、図2に示すように、特徴量抽出モジュール群6と特徴量選択部7とに大別されている。この特徴量抽出モジュール群6は、k種類の特徴量抽出モジュールにより構成されている。図2中は、各特徴量抽出モジュールを、特徴量1抽出モジュールから特徴量k抽出モジュールと示している。この各特徴量抽出モジュールは、映像入力部2から入力された時系列の画像フレームを用いて、それぞれ特徴量1から特徴量kを抽出し、その時系列をそれぞれ特徴量選択部7に出力している。
この特徴量1から特徴量kは、画像フレームの時系列から抽出可能な特徴、即ち画像フレーム中の動物体が動くことによって生じる画像の変化の特徴を意味する。ここでは動きベクトルとして説明する。ただし、時空間特徴(動領域を「1」、背景を「0」とする二値画像を1列に展開して複数フレーム分並べた、画素数×フレーム数次元の特徴量)や、フレーム間差分特徴(隣り合うフレーム同士の差分によって生成される二値画像の画素の並びである、画素数次元の特徴量)などを用いてもよい。
前記特徴量選択部7では、特徴量選択基準に基づき特徴量1から特徴量kのいずれかを組み合わせたN次元の識別特徴量を時系列に出力する。この特徴量選択基準は、各特徴量のいずれを用いるかを示す基準、即ち特徴量1から特徴量kに対応する数値の組からなり、外部からGUI(Graphic User Interface)、またはコマンドプロンプトで入力することができる。この場合の入力は前記入力手段を用いればよい。なお、前記特徴量選択基準はプログラムなどに事前に定義された閾値としてもよい。
図3は、前記各特徴量抽出モジュールの構成例を示している。ここでは各特徴量抽出モジュールは、変化領域抽出部8,動きベクトル算出部9,統合ベクトル部10,連続時間カウント部13,配列格納部14を有している。
具体的な処理を説明すれば、まず前記動きベクトル算出部9は、動きベクトル配列を求める。この動きベクトルは、画像中の各画素の位置(x.y)と、該位置(x.y)の検出時刻におけるその画素の動き方向(u.v)を示す二次元ベクトルとを対応させた組(x.y.u.v)の配列とする。ここで求めた動きベクトル(x.y.u.v)を、前記統合ベクトル算出部10に出力する。
以下、本実施形態では、一般的にオプティカルフローと呼ばれるものと、これを空間的、時間的に平均するなど加工したベクトルとを合わせて動きベクトルとする。このオプティカルフローを求めるには輝度勾配に基づく方法や、非特許文献2に記載された領域のマッチングに基づく方法を用いてもよい。つぎに前記変化領域抽出部8では、動物体領域と背景領域を分離した二値画像を前記統合ベクトル算出部10に出力する。
前記統合ベクトル算出部10は、前記変化領域算出部8の出力した二値画像と、前記動きベクトル算出部9の出力した動きベクトルとから、画像全体の特徴量として統合されたベクトルを求め、前記連続時間カウント部13に出力する。ここで動きベクトル算出部9の出力は、各画素に対応した動きベクトル(始点座標と終点座標で定まる4次元の情報)からなる数値の集合の時系列である。
例えば、(代表ベクトルの始点x座標、代表ベクトルの始点y座標、代表ベクトルの終点x座標、代表ベクトル終点y座標)の組の時系列として出力される。統合ベクトル算出部10は、変化領域の情報(二値画像)と動きベクトルの情報を統合して、画像全体としての動き特徴を示す統合された動きベクトルの時系列が出力される。
図4は、前記統合ベクトル算出部10の構成例を示している。ここでは前記統合ベクトル算出部10は、モーション履歴画像生成部11,マスク処理部12を有している。このモーション履歴画像生成部11は、変化領域の時間的変化を重畳した画像(モーション履歴画像)を生成する。このモーション履歴画像は、ある一定時間における動物体の動きの大きさや方向を知るために用いられ、非特許文献3にその方法が示されている。
具体的には、前記モーション履歴画像生成部11には、前記変化領域抽出部8から時系列の二値画像が入力され、動き領域の画素にゼロ以外の数値をあてはめ、それ以外の領域をゼロとしたマスク画像を生成する。このマスク画像はマスク処理部12に入力される。このマスク処理部12には、併せて前記動きベクトル算出部9から動きベクトル配列(x,y,u,v)が入力される。そして、前記マスク処理部12は、マスク画像のマスク内部についてベクトルを平均化することで統合されたベクトルを求めている。ここでは空間平均と時間平均から動きベクトルを統合する。
前記マスク処理部12の統合処理の一例を図5に基づき説明する。図5(a)は、時刻tにおける変化領域と、その領域の動きの方向と大きさを示すベクトルを矢印で表示している。図5(b)は、同様に時刻t+kにおける状態を表している。図5(c)は、時刻tと時刻t+1の変化領域を重畳した状態を表している。この状態はモーション履歴画像に該当する。
すなわち、前記モーション履歴画像生成部11の処理は、図5(a)〜図5(c)間の処理に相当している。ここでは時刻tと時刻t+kの2つの時刻のみを重畳しているが、間隔kや何時刻分を重畳するかは可変パラメータなので、任意に変更できる。図5(c)の重畳した変化領域について、領域ごとに内接する矩形の縦横の長さを求め、矩形の外周または矩形の面積が一定の閾値以上であるもの、または大きい方から一定の数だけの領域を選択する。この閾値および前記可変パラメータはプログラムなどに定義しておけばよい。
そして、前記モーション履歴画像生成部11は、前記選択領域を「1」、それ以外の領域を「0」とするような、マスク画像を出力する。図5(d)において、前記選択領域のみについて、ベクトルの統合を行う。このときマスクの内部のベクトルの平均を求め、これを統合されたベクトルとする。図5(d)は、統合ベクトル算出部における処理を示している。図5(d)中の矢印Pは代表ベクトルに相当している。また、図5(e)(f)は、図5(c)(d)の具体的な処理画像例を示している。以下、統合の処理方法の例を2つ示す。
第一の方法は、まず、図5(a)における時刻tの変化領域A(t) 1と変化領域A(t) 2内の画素すべてに、それぞれ領域の動きの方向と大きさを示すベクトルv(t) 1とベクトルv(t) 2に対応する数値を付与する。同様に、図5(b)における時刻t+kの変化領域A(t+k) 1と変化領域A(t+k) 2内の画素すべてに、それぞれ領域の動きの方向と大きさを示すベクトルv(t+k) 1とベクトルv(t+k) 2に対応する数値をもたせる。
つぎに、図5(c)において、矩形内の画素がそれぞれその数値をもっているとき、矩形が重なり合う部分には両方の矩形の数値を統合した数値を与える。ベクトルに対応する数値をベクトルの(始点x,始点y)と(終点x,終点y)の組とするとき、平均はこれら4つの数値それぞれの平均として求める。
また、ベクトルに対応する数値をベクトルの方向(360度)をN個の領域に分割して、1からNまでの数値をあてはめてもよい。この場合は、矩形が重なり合う部分には、その数値の平均した数値を与える。方向の分割の仕方は、例えば0度〜45度および315度〜360度、45度〜135度、135度〜225度、225度〜315度の4分割(N=4)などのようにして、各領域に数値1〜4を割り当てればよい。
この場合に315度の境界で数値に不連続性が生じるため、この方向のベクトルが頻繁に発生する場合には誤差が大きくなるため注意が必要である。したがって、45度の方向の発生頻度が低ければ、前述のとおりの4分割とし、0度の方向の発生頻度が低ければ、0度〜90度、90度〜180度、180度〜270度、270度〜360度の4分割というように、発生頻度の低い方向を不連続の境界にもってくるようにする。より正確に対応する必要がある場合、もしくは発生頻度の低い方向が不明な場合には、非特許文献4に記載された角度統計の相関係数を適用することもできる。
第二の方法は、変化領域のうち面積最大の領域のベクトルに対応するベクトルの(始点x,始点y)と(終点x,終点y)の組を代表ベクトルとする方法である。
ここで前記連続時間カウント部13の処理例を述べる。ここでは前記統合ベクトル算出部10にて統合されたベクトル(画像の時系列に対応する数値の時系列)が入力されている。このとき前記連続時間カウント部13は、統合されたベクトルがゼロでない連続時間をカウントする(動きベクトルの時間平均がゼロでないフレームをカウントする。)。カウントされた連続時間は、前記配列格納部(例えばメモリなど)14にて統合されたベクトルとともにデータ配列に特徴量として格納され、前記特徴量選択部7に出力される。
ここでカウントされた連続時間は、動物体がどの程度の時間連続して出現するかを示していることから、これを特徴量に加えることで前記識別部4において、長時間動き続けている動物体がある場合に、これを非定常として検出することが可能となる。
以上の各特徴量抽出モジュールの処理フローを図6に示す。ここでは入力される映像フレームをI(x,y,t−s),I(x,y,t−s+1),,,I(x,y,t)とする。また、「x,y」は画像の座標値、tは現在の時刻、sは現在の特徴量を求めるために必要な過去のフレームの枚数を示し、処理の開始はt=0とする。
S01:まず、オプティカルフローを算出する。ここではオプティカルフローを求めた画像をIo(x,y,t)=(u(x,y,t),v(x,y,t))とする。
S02.S03:S01と平行して背景差分などによって動物体領域を求め(S02)、該領域にラベリングと各領域の画素数の算出処理を施す(S03)。
ここでは動物体領域を、ラベリングして属する画素数の多いほうからn個の領域についての面積(画素数)をA0(x,y,t),...,An(x,y,t)とする。
S04:S03の算出処理した画像について空間平均(中心座標、方向ベクトル)を算出する。ここでは時刻tにおいて座標(x,y)の画素がk番目の動領域に属していて、その画素数がMのとき、Ak(x,y,t)=Mとする。空間平均(中心座標、方向ベクトル)算出の出力を(Xs(t),Ys(t),us(t),vs(t))として、以下のように計算する。
s(t)=(Ak(x,y,t)!=0であるxの平均)
s(t)=(Ak(x,y,t)!=0であるyの平均)
s(t)=1/(Σk=1〜nk(x,y,t))×Σk=1〜nu(x,y,t)×Ak(x,y,t)
s(t)=1/(Σk=1〜nk(x,y,t))×Σk=1〜nv(x,y,t)×Ak(x,y,t)
その後に「t=t+1」として、S101.S102に戻って次フレームの処理を続ける。
S05:時間平均(中心座標、方向ベクトル)の算出を行う(S05)。ここでは(Xs(t−s),Ys(t−s),us(t−s),vs(t−s)),...(Xs(t),Ys(t),us(t),vs(t))の時間平均(Xst(t),Yst(t),ust(t),vst(t))を成分ごとの平均として求める。
S06〜S08:S05で時間平均を求めた結果の動きベクトル(ust(t),vst(t))が、連続したゼロベクトル(0,0)か否かを確認する(S06)。
そして、連続したゼロベクトル(0,0)のフレーム数[C(t)=0]を除外し(S07)、連続したゼロベクトル(0,0)でないフレーム数[C(t)=C(t−1)+1]をカウントする(S08)。
S09:S05で求めた時間平均にS08にてカウントしたフレーム数C(t)を加えた(Xst(t),Yst(t),ust(t),vst(t),C(t))を特徴量としてデータ配列に格納する。
(3)識別部4
図7は、前記識別部4の構成例を示している。ここでは前記識別部4には、特徴量1から特徴量kの組み合わせからなるN次元の識別特徴量の時系列データが入力される。図7中のSVM識別器15は、入力された時系列データをSVM(サポートベクタマシン)手法を用いて統計的に識別特徴量を定常と非定常に識別した結果を特徴量評価部6に出力する。ここで時系列の入力に対するSVMのアルゴリズムとしては、非特許文献5に記載のように、インクリメンタルな1クラスのSVMを用いて、教師無しのオンライン識別を用いることができる。
特徴量評価部16は、SVM識別器15を用いた識別の過程で生成されるサポートベクトル群を用いて、N次元の特徴量の要素に対応して、その要素を最終的に識別に用いるかどうかの判定を行う。ここではON/OFFを示すN個の論理値をSVM識別器15にフィードバックしている。サポートベクトルは、入力された各特徴量のサブセットであって、定常と非定常の識別境界に位置する特徴量に当たるため、サポートベクトル群および定常、非定常の分布を調べることで、入力された各特徴量のどの次元が定常と非定常の分離に寄与しているかを推定することができる。
図8は実際の画像から得られた特徴量を用いて識別を行い、特徴量のうちの2次元分の特徴軸上で、定常と非定常とサポートベクトルの分布を示したものである。図8(a)は、サポートベクトルは定常の島(定常のクラスと考えられる)の周辺に偏って分布し、定常の分布の外側に非定常が分布しており、比較的よく定常と非定常が分離できているが、図8(b)ではサポートベクトルと定常が重なっており非定常も定常と重なりが大きい。
そこで、前記特徴量評価部16は、サポートベクトルの偏り具合を評価することで、その特徴次元が定常、非定常の識別に寄与しているかどうかの指標に用いることができる。ここでは特徴量の各次元について、定常の分散に対するサポートベクトルの分散の比、または定常の分散に対する非定常の分散の比を求め、比の値が大きいほうが、その特徴次元での分離度がよいと判定し、分離度の高い次元はON、低い次元はOFFとするN個の論理値が前記SVM識別器15にフィードバックされ、定常・非定常のフラグ(flag)の時系列が表示部5に出力され、表示部5で画面表示される。
このように前記非定常度推定装置1によれば、動き特徴抽出部3において映像中の動物体の動きベクトルに基づく情報を低次元の特徴量として安定的に抽出し、統計的な識別器4に入力できるため、高速に高精度な非定常検出を行うことができる。特に、動き特徴抽出部3が、動きの連続性を特徴量に加え、動きベクトルを動物体領域の動きの大きさや該領域自体の大きさを反映して、空間的・時間的に平均化することから、特徴量の安定化が図られ、特徴量の次元数による計算量が減少し、この点で高速で低コストの非定常検出が実現する。また、識別器4が、特徴量評価部16を用いて、サポートベクトルおよび定常/非定常の部分分布状態から特徴量を評価し、識別に有効に寄与する特徴量の要素を選択することから、定常/非定常に寄与しないノイズの影響が抑制され、識別演算の計算コストも低減される。
なお、本発明は、上記実施形態に限定されるものではなく、装置構成などは各請求項に記載した範囲内で適宜に変更することができる。例えば、図9に示すように、前記各特徴量抽出モジュールの連続時間カウント部13を廃止することもできる。この場合は、図6中のS06〜S09が省略され、前記各統合ベクトル算出部10で統合されたベクトル(画像の時系列に対応する数値の時系列)、即ち図9の時間平均(Xst(t),Yst(t),ust(t),vst(t))が特徴量に用いられるものの、通常の動物体であれば好適に非定常度として検出することができる。
また、本発明は、前記非定常度推定装置1としてコンピュータを機能させるプログラムとしても構築することができる。このプログラムは、コンピュータに前記各部1〜5の処理のすべてを実行させるものでもよく、また前記動き特徴抽出部3・前記識別部4などの一部の処理を実行させるものでもよい。
このプログラムは、Webサイトなどからのダウンロードによってコンピュータに提供することができる。また、前記プログラムは、CD−ROM,DVD−ROM,CD−R,CD−RW,DVD−R,DVD−RW,MO,HDD,Blu−ray Disk(登録商標)などの記録媒体に格納してコンピュータに提供してもよい。この記録媒体から読み出されたプログラムコード自体が前記実施形態の処理を実現するので、該記録媒体も本発明を構成する。
本発明の実施形態に係る非定常度推定装置の構成例図。 同 動き特徴抽出部の構成例図。 同 各特徴量抽出モジュールの構成例図。 同 統合ベクトル算出部の構成例図。 (a)は時刻tにおける変化領域と、その変化領域の動きの方向と大きさを示す模式図、(b)は時刻t+1に移行した状態を示す模式図、(c)は(a)〜(c)の変化領域を重畳した模式図、(d)は選択した領域のベクトル統合を示す模式図、(e)(f)は具体的処理例を示す図。 同 各特徴量抽出モジュールの処理フロー図。 同 識別部の構成例図。 (a)(b)は、サポートベクトルの偏りの比較例図。 各特徴量抽出モジュールの他例を示す構成図。
符号の説明
1…非定常度推定装置
2…映像入力部
3…動き特徴抽出部(動き特徴週出手段)
4…識別部(識別手段)
5…表示部
6…特徴量抽出モジュール群
7…特徴量選択部(特徴量選択手段)
8…変化領域選択部(変化領域抽出手段)
9…動きベクトル算出部(動きベクトル算出手段)
10…統合ベクトル算出部(統合ベクトル算出手段)
11…モーション履歴画像生成部(モーション画像生成手段)
12…マスク処理部(マスク処理手段)
13…連続時間カウント部(連続カウント手段)
14…配列格納部
15…SVM識別器(SVM識別手段)
16…特徴量評価部(特徴量評価手段)

Claims (9)

  1. 撮影装置で撮影された映像中に含まれる動物体の動きに基づく特徴量を抽出し、統計的な処理によってシーンの非定常性を識別する装置であって、
    前記撮影装置からの入力映像中において動物体の動きに基づく特徴量を抽出する動き特徴抽出手段と、
    前記動き特徴抽出手段の抽出した特徴量から前記入力映像の非定常性を識別する識別手段と、を備え、
    前記動き特徴抽出部は、前記入力映像から時系列の特徴量を生成する複数の特徴量抽出モジュールと、
    前記各特徴量抽出モジュールの生成した特徴量を、特徴量選択基準に基づいて選択し、該選択された各特徴量の組合せの時系列を前記識別部に出力する特徴量選択手段と、を備え、
    前記各特徴量抽出モジュールは、前記入力映像中の動物体領域を抽出し、該動物体領域と背景領域の二値画像を求める変化領域抽出手段と、
    前記入力映像中の時系列の各画像において、各画素の位置(x.y)と該画素の動き方向(u.v)を示す二次元ベクトルをペアにした動きベクトル配列(x.y.u.v)を求める動きベクトル算出手段と、
    前記動物体領域の情報と前記動きベクトル配列の情報とを統合し、該統合されたベクトルのペアを特徴量として求める統合ベクトル算出手段と、
    を備えることを特徴とする非定常度推定装置。
  2. 前記統合ベクトル算出手段は、時系列の前記二値画像を時間的に重畳したモーション履歴画像を、前記動物体領域に数値をあてはめ前記背景領域をゼロとして生成するモーション履歴生成手段と、
    前記動きベクトル配列を、前記モーション履歴画像を用いてマスク処理を行うマスク処理手段と、
    を備えることを特徴とする請求項1記載の非定常度推定装置。
  3. 前記各特徴量抽出モジュールは、前記統合されたベクトルのペアが連続して出現する時間をカウントする連続時間カウント手段をさらに備え、
    前記カウント時間を前記統合されたベクトルのペアに付加した特徴量を前記特徴量選択部に出力する
    ことを特徴とする請求項1または2のいずれか1項に記載の非定常度推定装置。
  4. 前記識別手段は、各特徴量抽出モジュールの特徴量を組み合わせたN次元の識別特徴量を、SVM(サポートベクタマシン)手法を用いて定常/非定常に分類するSVM識別手段と、
    前記SVM識別手段で生成されたサポートベクトル群および定常/非定常の識別結果から、N次元の特徴量の要素に応じて該要素を最終的に識別に用いるか否かを示すN個の論理値を前記識別機器にフィードバックする特徴量評価手段とを備え、
    定常・非定常のプラグの時系列を識別結果として表示させることを特徴とする請求項1〜3のいずれか1項に記載の非定常度推定装置。
  5. 撮影装置で撮影された映像中に含まれる動物体の動きに基づく特徴量を抽出し、統計的な処理によってシーンの非定常性を識別する方法であって、
    動き特徴量抽出手段が、前記撮影装置からの入力映像中において動物体の動きに基づく特徴量を抽出する動き特徴抽出ステップと、
    識別手段が、前記動き特量抽出ステップで抽出した特徴量から前記入力映像の非定常性を識別する識別ステップと、を有し、
    前記動き特徴抽出ステップは、複数の特徴量抽出モジュールのそれぞれが、前記入力映像から時系列の特徴量を生成する特徴量生成ステップと、
    特徴量選択手段が、前記特徴量生成ステップで生成した各特徴量を、特徴量選択基準に基づいて選択し、該選択された各特徴量の組合せの時系列を前記識別部に出力する特徴量選択ステップと、を有し、
    前記特徴量生成ステップは、前記入力映像中の動物体領域を抽出し、該動物体領域と背景領域の二値画像を求める変化領域抽出ステップと、
    前記入力映像中の時系列の各画像において、各画素の位置(x.y)と該画素の動き方向(u.v)を示す二次元ベクトルをペアにした動きベクトル配列(x.y.u.v)を求める動きベクトル算出ステップと、
    前記動物体領域の情報と前記動きベクトル配列の情報とを統合し、該統合されたベクトルのペアを特徴量として求める統合ベクトル算出ステップと、
    を有することを特徴とする非定常度推定方法。
  6. 前記統合ベクトル算出ステップは、時系列の前記二値画像を時間的に重畳したモーション履歴画像を、前記動物体領域に数値をあてはめ前記背景領域をゼロとして生成するモーション履歴生成ステップと、
    前記動きベクトル配列を、前記モーション履歴画像を用いてマスク処理を行うマスク処理ステップと、
    を有することを特徴とする請求項5記載の非定常度推定方法。
  7. 前記特徴量生成ステップは、前記各特徴量抽出モジュールが前記統合されたベクトルのペアが連続して出現する時間をカウントする連続時間カウントステップをさらに有し、
    前記カウント時間を前記統合されたベクトルのペアに付加した特徴量を前記特徴量選択ステップで用いる
    ことを特徴とする請求項5または6のいずれか1項に記載の非定常度推定方法。
  8. 前記識別ステップは、特徴量生成ステップで生成された各特徴量を組み合わせたN次元の識別特徴量を、SVM(サポートベクタマシン)識別手器を用いて定常/非定常に分類するSVM識別ステップと、
    前記SVM識別ステップで生成されたサポートベクトル群および定常/非定常の識別結果から、N次元の特徴量の要素に応じて該要素を最終的に識別に用いるか否かを示すN個の論理値を前記識別器にフィードバックする特徴量評価ステップと、を有し、
    定常・非定常のプラグの時系列を識別結果として表示させることを特徴とする請求項5〜7のいずれか1項に記載の非定常度推定方法。
  9. 請求項1〜4のいずれか1項に記載の非定常度推定装置として、コンピュータを機能させることを特徴とする非定常度推定プログラム。
JP2008304946A 2008-11-28 2008-11-28 非定常度推定装置、非定常度推定方法、非定常度推定プログラム Expired - Fee Related JP5002575B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008304946A JP5002575B2 (ja) 2008-11-28 2008-11-28 非定常度推定装置、非定常度推定方法、非定常度推定プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008304946A JP5002575B2 (ja) 2008-11-28 2008-11-28 非定常度推定装置、非定常度推定方法、非定常度推定プログラム

Publications (2)

Publication Number Publication Date
JP2010128947A JP2010128947A (ja) 2010-06-10
JP5002575B2 true JP5002575B2 (ja) 2012-08-15

Family

ID=42329275

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008304946A Expired - Fee Related JP5002575B2 (ja) 2008-11-28 2008-11-28 非定常度推定装置、非定常度推定方法、非定常度推定プログラム

Country Status (1)

Country Link
JP (1) JP5002575B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013124923A1 (ja) * 2012-02-23 2013-08-29 パナソニック株式会社 興味区間特定装置、興味区間特定方法、興味区間特定プログラム
US10091419B2 (en) 2013-06-14 2018-10-02 Qualcomm Incorporated Computer vision application processing
JP6116765B1 (ja) * 2015-12-02 2017-04-19 三菱電機株式会社 物体検出装置及び物体検出方法
US10984334B2 (en) * 2017-05-04 2021-04-20 Viavi Solutions Inc. Endpoint detection in manufacturing process by near infrared spectroscopy and machine learning techniques
CN112231479B (zh) * 2020-10-23 2023-03-31 新华三信息安全技术有限公司 一种安全审计方法及装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002312769A (ja) * 2001-04-16 2002-10-25 Matsushita Electric Ind Co Ltd 監視装置及びそのパラメータ設定方法

Also Published As

Publication number Publication date
JP2010128947A (ja) 2010-06-10

Similar Documents

Publication Publication Date Title
Chavdarova et al. Wildtrack: A multi-camera hd dataset for dense unscripted pedestrian detection
US10984252B2 (en) Apparatus and method for analyzing people flows in image
Cernekova et al. Information theory-based shot cut/fade detection and video summarization
US8619135B2 (en) Detection of abnormal behaviour in video objects
RU2607774C2 (ru) Способ управления в системе захвата изображения, устройство управления и машиночитаемый носитель данных
US10079974B2 (en) Image processing apparatus, method, and medium for extracting feature amount of image
EP3709266A1 (en) Human-tracking methods, apparatuses, systems, and storage media
US11527000B2 (en) System and method for re-identifying target object based on location information of CCTV and movement information of object
JP2004199669A (ja) 顔検出
JP2004192637A (ja) 顔検出
JP6616521B2 (ja) 画像処理装置
US11049256B2 (en) Image processing apparatus, image processing method, and storage medium
JP5002575B2 (ja) 非定常度推定装置、非定常度推定方法、非定常度推定プログラム
Kumar et al. Key frame extraction from consumer videos using sparse representation
CN103391424A (zh) 分析监控摄像机捕获的图像中的对象的方法和对象分析器
CN108229289B (zh) 目标检索方法、装置和电子设备
CN113920585A (zh) 行为识别方法及装置、设备和存储介质
Ryan Crowd monitoring using computer vision
KR102584708B1 (ko) 과소 및 과밀 환경을 지원하는 군중위험관리시스템 및 방법
JPWO2018179119A1 (ja) 映像解析装置、映像解析方法およびプログラム
JP6598952B2 (ja) 画像処理装置及び方法及び監視システム
JP4449483B2 (ja) 画像解析装置、および画像解析方法、並びにコンピュータ・プログラム
JP5599228B2 (ja) 繁忙検知システム及び繁忙検知プログラム
JP2010087937A (ja) 映像検出装置、映像検出方法および映像検出プログラム
US11908197B2 (en) Information processing apparatus, information processing method, and storage medium

Legal Events

Date Code Title Description
RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20100611

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20101217

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120112

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120117

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120314

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120515

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120521

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150525

Year of fee payment: 3

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees