JP2007325277A - 協調フレームワークのサポートシステム、監視ビデオのマイニングのサポート方法、及びプログラム - Google Patents
協調フレームワークのサポートシステム、監視ビデオのマイニングのサポート方法、及びプログラム Download PDFInfo
- Publication number
- JP2007325277A JP2007325277A JP2007147961A JP2007147961A JP2007325277A JP 2007325277 A JP2007325277 A JP 2007325277A JP 2007147961 A JP2007147961 A JP 2007147961A JP 2007147961 A JP2007147961 A JP 2007147961A JP 2007325277 A JP2007325277 A JP 2007325277A
- Authority
- JP
- Japan
- Prior art keywords
- events
- abnormal
- mining
- training
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/52—Surveillance or monitoring of activities, e.g. for recognising suspicious objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/762—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using clustering, e.g. of similar faces in social networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Evolutionary Computation (AREA)
- Databases & Information Systems (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Medical Informatics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Software Systems (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- General Engineering & Computer Science (AREA)
- Image Analysis (AREA)
- Closed-Circuit Television Systems (AREA)
- Burglar Alarm Systems (AREA)
Abstract
【課題】異常事象を検出するために監視ビデオのマイニングを行う協調フレームワークを提供する。
【解決手段】協調フレームワークは2段階のトレーニング過程を導入し、高い誤警報率の問題を緩和する。第1段階では、ビデオストリームのセグメントに監視なしクラスタリングを行い(ステップ302)、異常事象のセットに対するユーザのフィードバックに基づいてクリーンなトレーニングセットを生成する(ステップ303)。第2段階では、クリーンなトレーニングセットを用いて異常事象の分析のためのより緻密なモデルをトレーニングし(ステップ304)、複数のカメラからの動作検出結果を相互検証して結合する(ステップ305及びステップ306)。
【選択図】図3
【解決手段】協調フレームワークは2段階のトレーニング過程を導入し、高い誤警報率の問題を緩和する。第1段階では、ビデオストリームのセグメントに監視なしクラスタリングを行い(ステップ302)、異常事象のセットに対するユーザのフィードバックに基づいてクリーンなトレーニングセットを生成する(ステップ303)。第2段階では、クリーンなトレーニングセットを用いて異常事象の分析のためのより緻密なモデルをトレーニングし(ステップ304)、複数のカメラからの動作検出結果を相互検証して結合する(ステップ305及びステップ306)。
【選択図】図3
Description
本発明は、ビデオのモニタ(監視)及び分析の分野に関する。即ち、本発明は、監視ビデオのマイニングを行う協調フレームワークのサポートシステム、異常事象を検出するための監視ビデオのマイニングのサポート方法、及びプログラムに関する。
セキュリティの要求の高まりに応じて、ますます多くのビデオ監視システムが配備されている。しかし、システムを監視する訓練された人材の数は限られているため、全てを有効にモニタすることはもちろん、オフラインのビデオ監視システムから集められた膨大な量のデータを分析することができない。よって、異常事象の自動的なマイニングと検出が必要であり、これを一般に時系列の分類として決定することができる。事象の検出及び認識への監視ありデータマイニングアプローチは、トレーニングサンプルから参照事象シーケンスのモデルを学習し、次に、これらのシーケンスが1つの事象クラス内のばらつきを許容する一方で異なる事象クラスを識別するように適合基準を考案する。音声認識で広く使用されている適合技術である動的タイムワーピング(DTW(Dynamic Time Warping))が、人間の動作パターンの認識に使用されている。有限状態機械(FSM(Finite-state machine))も、空間像から車の動きをモデル化するのに使用されている。これらの監視ありアプローチの1つの一般的な仮定は、対象となる事象が既に知られており、これに従ってモデル化できることである。これまでに見たことのない特異な事象を検出するには、監視なしデータマイニングアプローチや半監視アプローチが必要である。このようなアプローチの性能は反復の数に依存するが、これは個別に手作業で設定しなくてはならないため、誤警報(false alarm)の発生が多くなる。
監視アプリケーションの対象となる異常事象を、その希少性(めったに起こらないこと)と意外性(これまでに見たことのないこと)によって特徴づけることができる。異常事象の希少性は、このような事象のトレーニングデータの数を制限してしまう。大きな攻撃の前の怪しい(異常な)各活動は、個々に検討すると警報を生じるには十分でないかもしれないが、遠隔位置からの証拠が組み合わされた場合に何らかの異常事象が発生することがより明らかであろう。2つの異常事象間の相違は、通常は異常事象と正常な事象との相違と同じくらい大きいため、一般的な異常事象のモデルをトレーニングすることが困難である。また、正常事象のトレーニングデータは豊富にあり、これらの正常事象はいくつかの領域で集中発生する傾向にある。
本発明の種々の実施の形態は、異常事象を検出するために監視ビデオのマイニングを行う協調フレームワークを説明するものであり、ここで問題は二項の分類問題として決定される。
このフレームワークは2段階のトレーニング過程を導入し、監視ビデオ内の異常事象のマイニングにおける高い誤警報率の問題を緩和する。第1段階では、ビデオストリームのセグメントに監視なしマイニングを行い、異常事象のセットへのユーザのフィードバックに基づいてクリーンなトレーニングセットを生成する。第2段階では、クリーンなトレーニングセットを用いて異常事象の分析のためのより緻密なモデルをトレーニングし、複数のカメラからの動作検出結果を相互検証して結合することができる。
本発明の具体的な態様を以下に述べる。
第1の態様は、監視ビデオのマイニングを行う協調フレームワークのサポートシステムであって、複数のカメラから1つ以上の入力ビデオストリームを複数の事象にセグメント化するよう機能する特徴抽出及び時間分割モジュールと、前記複数の事象の監視なしマイニングによって異常事象のセットを生成するよう機能するガウス混合モデルと、前記異常事象のセットに対するユーザフィードバックに基づいて誤って分類された正常事象を識別し、クリーンなトレーニングセットを生成するよう機能するユーザフィードバックモジュールと、前記1つ以上の入力ビデオストリームに対して動作検出を実行するよう機能するトレーニングモデルとを含む。
第2の態様は、第1の態様において、前記複数の事象の各々が複数のセグメンテーション及び視覚特徴を含む。
第3の態様は、第1の態様において、前記異常事象のセットの各々が、前記正常事象のモデルからの偏差により前記モデルに適合しないセグメントである。
第4の態様は、第1の態様において、前記特徴抽出及び時間分割モジュールが前記1つ以上のビデオストリームに対してバックグラウンド除去を行うよう機能する。
第5の態様は、第1の態様において、前記ガウス混合モデルが前記複数の事象の各々をパラメータ化してクラスタリングするよう機能する。
第6の態様は、第1の態様において、前記トレーニングモジュールが隠れマルコフモデル及び結合隠れマルコフモデルのうちの一方である。
第7の態様は、第1の態様において、前記隠れマルコフモデル及び/又は前記結合隠れマルコフモデルが前記事象のクリーンなトレーニングセットによってトレーニングされる。
第8の態様は、第1の態様において、観測ベクトルの確率密度関数をパラメータ化関数の和としてパラメータ化することによって前記隠れマルコフモデルトレーニングされる。
第9の態様は、第1の態様において、前記結合隠れマルコフモデルが、複数の前記1つ以上の入力ビデオストリームからの動作検出結果を結合するよう機能する。
第10の態様は、異常事象を検出するための監視ビデオのマイニングのサポート方法であって、1つ以上の入力ビデオストリームを複数の事象にセグメント化することと、前記複数の事象を監視なしマイニングによってクラスタリングすることで異常事象のセットを生成することと、前記異常事象のセットへのユーザフィードバックに基づいて正常事象のクリーンなトレーニングセットを得ることと、前記クリーンなトレーニングセットを用いて異常事象の動作検出用モジュールをトレーニングすることと、前記モジュールによる動作検出の結果を相互検証によって絞り込むこととを含む。
第11の態様は、第10の態様において、前記1つ以上のビデオストリームの特徴抽出及び時間分割にバックグラウンド除去を用いることを更に含む。
第12の態様は、第10の態様において、ガウス混合モデルを用いて前記複数の事象をパラメータ化し、クラスタリングすることを更に含む。
第13の態様は、第10の態様において、前記事象のトレーニングセット内の全ての識別特徴対の非類似性マトリックスに基づいて、主要クラスタを階層クラスタリングによって識別することを更に含む。
第14の態様は、第10の態様において、近似カルバック・ライブラー情報量をペアワイズ非類似性測度として用いることによって前記事象のトレーニングセットをクラスタリングすることを更に含む。
第15の態様は、第10の態様において、前記異常事象の動作検出のために1つ以上の隠れマルコフモデルをトレーニングすることを更に含む。
第16の態様は、第10の態様において、最小記述長の原理に従って最良のモデルを選択することを更に含む。
第17の態様は、第10の態様において、観測ベクトルの確率密度関数をパラメータ化関数の和としてパラメータ化することによって前記1つ以上の隠れマルコフモデルをトレーニングすることを更に含む。
第18の態様は、第10の態様において、複数の前記1つ以上の入力ビデオストリームからの動作検出結果を結合隠れマルコフモデルによって結合することを更に含む。
第19の態様は、監視ビデオのマイニングを行うための協調フレームワークのサポートシステムによって実行することができるプログラムであって、1つ以上の入力ビデオストリームを複数の事象にセグメント化するステップと、前記複数の事象を監視なしマイニングによってクラスタリングすることで異常事象のセットを生成するステップと、前記異常事象のセットへのユーザフィードバックに基づいて正常事象のクリーンなトレーニングセットを得るステップと、前記クリーンなトレーニングセットを用いて異常事象の動作検出用モジュールをトレーニングするステップと、前記モジュールによる動作検出の結果を相互検証によって絞り込むステップと、を含む。
第20の態様は、監視ビデオのマイニングを行うための協調フレームワークのサポートシステムであって、1つ以上の入力ビデオストリームを複数の事象にセグメント化する手段と、前記複数の事象を監視なしマイニングによってクラスタリングすることで異常事象のセットを生成する手段と、前記異常事象のセットへのユーザフィードバックに基づいて正常事象のクリーンなトレーニングセットを得る手段と、前記クリーンなトレーニングセットを用いて異常事象の動作検出用モジュールをトレーニングする手段と、前記モジュールによる動作検出の結果を相互検証によって絞り込む手段と、を含む。
本発明のいくつかの実施の形態を図面によって詳細に説明する。
本発明は、同様の参照番号が同様の要素を示す添付の図面に、限定のためではなく一例として示される。本開示物における「1つの」又は「いくつかの」実施の形態の参照は必ずしも同一の実施の形態に対してなされるのではなく、このような参照は少なくとも1つの実施の形態に対してなされることに注意されたい。
また、本発明の上記及び下記の例示的な実施形態は、情報処理装置によって実行されてもよい。当該情報処理装置は、例えば、ビデオストリームやユーザフィードバック等を受け取る入力部、プロセッサによる実行の際の作業領域を形成するとともにモジュールや処理対象としてのビデオストリーム等のデータを格納する記憶部、処理内容や処理結果を表示する表示部、及び、データを通信網などに出力する出力部などを含む。プロセッサは、モジュールを読み出し実行することにより、処理対象のデータ等に対して当該プログラムの手順に対応した処理をする。
図1は、本発明の1つの実施の形態における、異常事象を検出するために監視ビデオのマイニングを行う例示的な協調フレームワーク(collaborative framework)100の図である。この図はコンポーネントを機能上別個のものとして示しているが、このような説明は例示のためにすぎない。この図に示すコンポーネントを任意に結合したり、別個のソフトウェア、ファームウェアやハードウェアコンポーネントに分割したりできることが当業者には明らかであろう。また、このようなコンポーネントは、結合又は分割の態様に関係なく同一のコンピュータデバイス又は複数のコンピュータデバイスにおいて実行可能であり、複数のコンピュータデバイスを1つ以上のネットワークによって接続できることが当業者には明らかであろう。
図1を参照すると、協調フレームワークの中央部はトレーニング過程であり、このトレーニング課程は少なくとも以下のものからなる。特徴抽出及び時間分割モジュール102は、複数のカメラからの入力ビデオストリーム101を動作検出に基づいてセグメント化するように機能することができる。セグメント/事象毎に、事象内の移動オブジェクトの位置及びサイズの確率分布をビデオセグメントを表す識別特徴として適合させ、これをガウス混合モデル(GMM(Gaussian mixture model))103によってパラメータ化してクラスタリングすることができる。モデルベースのアプローチを用いて、1つのクラスに関する制限されたラベル付きトレーニングデータ、即ち正常事象に基づいて分類子をトレーニングする。次に、正常事象モデルからの偏差により、全ての正常事象の主要なクラスタからのモデルに適合しないセグメントとして異常事象を定義することができる。誤警報された異常事象をユーザフィードバックモジュール104に送り、誤って分類された正常事象を識別し、クリーンなトレーニングセットを生成する。次に、未分割時系列では一般にDTWをしのぐ隠れマルコフモデル(HMM(Hidden Markov Model))又は結合隠れマルコフモデル(CHMM(coupled Hidden Markov Model))であってもよいトレーニングモジュール105を、ユーザフィードバックに基づいたクリーンなトレーニングセットによってトレーニングし、初めのブートストラップにおける高い誤警報率を抑えることができる。
このフレームワークはスケーラブルであり、複数の監視システムからのデータに基づいて異常事象を協調して検出するように展開させることができる。フレームワークをオフラインの分析ツールやオンラインの警報トリガとして用いることができる。限定されない例として、郵便室(mail room)の見取図及びカメラの位置を図2に示す。郵便室に取り付けられた5台のカメラから7日(56時間)分の同期ビデオストリームを集めてフレームワークを検証することができる。
図3は、本発明の1つの実施の形態における、異常事象を検出するために監視ビデオのマイニングを行う例示的な方法を示すフローチャートである。この図は説明のために機能ステップを特定の順序で示しているが、この方法はステップの特定の順序や特定の構成に限定されない。当業者は、この図に示す種々のステップの省略、再構成、結合や変更が種々の方法で可能であることを理解するであろう。
図3を参照すると、ステップ301で入力ビデオストリームを事象にセグメント化し(セグメンテーション及び視覚特徴)、ステップ302において監視なし事象マイニングを行い、GMMによるクラスタリングによって異常事象のセットを生成する。GMMベースの事象マイニングはより高い検出率、よってより高い誤警報率で動作するため、ステップ303は監視なし学習から生成された異常事象のセットに対するユーザフィードバックに基づいて正常事象のクリーンなトレーニングセットを取得し、トレーニング過程をブートストラップして加速させる。次に、ステップ304でクリーンなトレーニングセットを用いてHMMをトレーニングし、異常事象を検出することができる。ステップ305では、複数のカメラからのビデオストリームに対して隠れマルコフモデル(HMM)の代わりに結合隠れマルコフモデル(CHMM)を使用し、検出された異常事象を結合することができる。最後に、ステップ306で検出結果を相互検証によって絞り込むことができる。
いくつかの実施の形態では、特徴抽出及び時間分割にバックグラウンド除去法を使用して入力ビデオストリーム内の動作ブロブ(blob)を見出し、各ブロブの周りに境界ボックスをはめることができる。次に、ビデオストリームのうちの1つから少なくとも1つのブロブが検出された場合のフレームのシーケンスとして事象を定義することができる。全てのカメラからの多数の連続フレームに動作ブロブがない場合は、最後の事象の終わりと判断する。この時間分割及び視覚特徴抽出処理の例示的なフローチャートを図4に示す。
いくつかの実施の形態では、階層クラスタリングを使用し、事象のトレーニングセット(セグメント)における全ての識別特徴対の非類似性マトリックスに基づいて主要クラスタを識別する。多数の正常事象をラベル付けすることは厄介なため、監視なし方法を用いてトレーニングデータ内のクラスタを見出すことができる。近似カルバック・ライブラー(KL)情報量(Kullback-Leibler divergence)をペアワイズ非類似性測度として用いてトレーニングの事象をクラスタリングすることができる。ここで、KL情報量とは「真の」確率分布Pから任意の確率分布Qまでの自然の距離の尺度であり、Pは一般にデータ、観測又は正確に計算された確率分布を表し、尺度Qは一般に理論、モデル、記述又はPの近似値を表す。
いくつかの実施の形態では、ユーザフィードバックに基づき、クラスタ内の少数のセグメントを異常なセグメントとしてマーク付けすることができる。自動的な方法も誤りを犯すことから免れることができず、前述のクラスタリングアプローチも例外ではない。異常であるとして除去された事象を調べた後、誤警報を手作業でラベル付けし、誤警報セグメントを正常事象のクリーンなトレーニングセットに戻すことができる。人間の介入は事象マイニングに意味論的な考えを与える上で極めて重要であるため、この作業は正常事象と異常事象の境界の微調整に役立つ。
いくつかの実施の形態において、正常事象のみを含むトレーニングセット及び最良のモデルを最小記述長(MDL(Minimum Description Length))の原理に従って選択することができる場合は、いくつかの隠れマルコフモデル(HMM)を異常事象の検出のためにトレーニングすることができる。ここで、HMMは統計モデルであり、モデル化するシステムは未知パラメータを用いたマルコフ過程であると仮定し、観測可能なパラメータから隠しパラメータを決定することを課題とする。そして、抽出したモデルパラメータを用いて更なる分析を行うことができる。通常のマルコフモデルとは異なり、状態はHMMではじかに見えないが、状態によって影響を受けた変数が可視である。各状態は可能な出力トークンの確率分布を有する。よって、HMMにより生成されたトークンのシーケンスは状態のシーケンスに関する情報をある程度提供する。所与のデータセットに対する最良の仮説はデータの最大圧縮をもたらすものであり、即ち、MDL原理によれば、データを文字どおり記述するのに必要な数よりも少ない記号を用いてデータを記述することである。
いくつかの実施の形態では、パラメータ化された関数の和として確率密度関数(PDF(probability density function))をモデル化するGMMを使用し、観測ベクトルのPDFをパラメータ化することによってHMMをトレーニングする。各観測ベクトルは、画像内で検出された3つの最大境界ボックスの位置及びサイズからなる。ベクトルの成分は独立しており、よって共分散行列は対角行列であると仮定する。限定されない例では、図2に示す郵便室の56時間分のビデオから長さが20から300フレームに及ぶ408のセグメントを抽出し、これを用いて3から8状態のHMMをトレーニングし、2から9核(kernel)のGMMを用いて観測PDFをパラメータ化することができる。6核GMM観測PDFの4状態HMMはモデルの複雑さとトレーニングセットを生成する全体的な尤度とのバランスがとれた状態に達するため、MDL原理に基づいて6核のGMM観測PDFの4状態のHMMを正常事象のモデルとして選択することができる。
いくつかの実施の形態では、CHMMを正常事象用にトレーニングすることができる。この場合、CHMMは、本質的に関連するデータフローの複数のストリームを分析するために広く用いられる。視覚特徴を抽出し、正常事象用のCHMMからこの事象が生成される尤度をフォワード・バックワードアルゴリズムによって評価し、テストセグメントを正常事象又は異常事象に分類することができる。尤度が閾値よりも低い場合、この事象を異常なものとして分類する。
図2の限定されない例を再び参照すると、フレームワークは、408のセグメントのうち、これらに限定されないが、誰かが1つ以上の郵便箱をいじっていたり、誰かがコピー機を開けていたり、誰かが監視カメラにいたずらしようとしていたりすることを含む事象に対応する20の異常セグメントを検出する。正常事象の殆どはセグメント内の持続時間が短い(従ってフレームが少ない)ため、シーケンスが長いほど、予めトレーニングされた正常事象モデルから生成される尤度が低くなる傾向にある。持続時間の任意の閾値を手作業で設定する代わりに、系統的なデータ駆動型アプローチによってこれらの結果を得ることができる。このアプローチの利点は、事象検出の際に動作の位置と事象の持続時間の双方が考慮されることにある。
コンピュータの技術に熟達した者には明らかであるように、従来の汎用デジタルコンピュータ、又は本開示物の教示内容に従ってプログラムされた専用のデジタルコンピュータ又はマイクロプロセッサを用いて1つの実施の形態を実施することができる。ソフトウェアの技術に熟達した者には明らかであるように、本開示物の教示内容に基づき、適切なソフトウェアコーディングを熟練のプログラマによって容易に準備することができる。また、当業者には容易に明らかであるように、集積回路を作製したり、従来のコンポーネントの回路の適切なネットワークを相互接続したりすることによって本発明を実施してもよい。
1つの実施の形態は、命令が記憶された機械可読媒体であるコンピュータプログラム製品を含み、この機械可読媒体は、1つ以上のコンピュータデバイスをプログラムし、本明細書に示した特徴のいずれかを実行するために使用することができる。機械可読媒体は、フロッピー(登録商標)ディスク、光ディスク、DVD、CD−ROM、マイクロドライブ、光磁気ディスク、ROM、RAM、EPROM、EEPROM、DRAM、VRAM、フラッシュメモリデバイス、磁気もしくは光カード、ナノシステム(分子記憶ICを含む)を含む1種以上のディスク、又は命令やデータの記憶に好適なあらゆるタイプの媒体もしくはデバイスを含むことができるが、これらに限定されない。コンピュータ可読媒体のいずれか1つに記憶される本発明はソフトウェアを含み、このソフトウェアは汎用/専用コンピュータ又はマイクロプロセッサのハードウェアを制御し、コンピュータ又はマイクロプロセッサがユーザ又は本発明の結果を用いた他の機構と対話できるようにする。このようなソフトウェアは、デバイスのドライバ、オペレーティングシステム、実行環境/コンテナ及びアプリケーションを含むことができるが、これらに限定されない。
本発明の好適な実施の形態の上記の説明は、例示及び説明のために設けられたものである。上記の説明は包括的であるように意図されたものではなく、本発明を開示されたものと寸分違わない形に限定するように意図されたものでもない。多くの変更物及び変形物が当業者には明らかであろう。特に、「モジュール」の概念が前述のシステム及び方法の実施の形態に使用されているが、このような概念を、コンポーネント、ビーン、クラス、方法、タイプ、インターフェース、オブジェクトモデル及び他の好適な概念などの同等の概念と同じ意味で使用できることが明らかであろう。本発明の原理及びその実際的な用途を最も効果的に説明するために実施の形態が選択され、説明されており、これによって当業者は本発明、種々の実施の形態及び考えられる特定の使用に好適な種々の変更物を理解することができる。本発明の請求の範囲は、請求項及びその均等物によって定義されるように意図される。
100 協調フレームワーク
102 3−Dレイアウト生成モジュール
103 ガウス混合モデル
104 ユーザフィードバックモジュール
105 トレーニングモジュール
102 3−Dレイアウト生成モジュール
103 ガウス混合モデル
104 ユーザフィードバックモジュール
105 トレーニングモジュール
Claims (20)
- 監視ビデオのマイニングを行う協調フレームワークのサポートシステムであって、
複数のカメラから1つ以上の入力ビデオストリームを複数の事象にセグメント化するよう機能する特徴抽出及び時間分割モジュールと、
前記複数の事象の監視なしマイニングによって異常事象のセットを生成するよう機能するガウス混合モデルと、
前記異常事象のセットに対するユーザフィードバックに基づいて誤って分類された正常事象を識別し、クリーンなトレーニングセットを生成するよう機能するユーザフィードバックモジュールと、
前記1つ以上の入力ビデオストリームに対して動作検出を実行するよう機能するトレーニングモデルと、
を含む前記システム。 - 前記複数の事象の各々が複数のセグメンテーション及び視覚特徴を含む、請求項1に記載のシステム。
- 前記異常事象のセットの各々が、前記正常事象のモデルからの偏差により前記モデルに適合しないセグメントである、請求項1に記載のシステム。
- 前記特徴抽出及び時間分割モジュールが前記1つ以上のビデオストリームに対してバックグラウンド除去を行うよう機能する、請求項1に記載のシステム。
- 前記ガウス混合モデルが前記複数の事象の各々をパラメータ化してクラスタリングするよう機能する、請求項1に記載のシステム。
- 前記トレーニングモジュールが隠れマルコフモデル及び結合隠れマルコフモデルのうちの一方である、請求項1に記載のシステム。
- 前記隠れマルコフモデル及び/又は前記結合隠れマルコフモデルが前記事象のクリーンなトレーニングセットによってトレーニングされる、請求項6に記載のシステム。
- 観測ベクトルの確率密度関数をパラメータ化関数の和としてパラメータ化することによって前記隠れマルコフモデルトレーニングされる、請求項6に記載のシステム。
- 前記結合隠れマルコフモデルが、複数の前記1つ以上の入力ビデオストリームからの動作検出結果を結合するよう機能する、請求項6に記載のシステム。
- 異常事象を検出するための監視ビデオのマイニングのサポート方法であって、
1つ以上の入力ビデオストリームを複数の事象にセグメント化することと、
前記複数の事象を監視なしマイニングによってクラスタリングすることで異常事象のセットを生成することと、
前記異常事象のセットに対するユーザフィードバックに基づいて正常事象のクリーンなトレーニングセットを得ることと、
前記クリーンなトレーニングセットを用いて異常事象の動作検出用モジュールをトレーニングすることと、
前記モジュールによる動作検出の結果を相互検証によって絞り込むことと、
を含む前記方法。 - 前記1つ以上のビデオストリームの特徴抽出及び時間分割にバックグラウンド除去を用いることを更に含む、請求項10に記載の方法。
- ガウス混合モデルを用いて前記複数の事象をパラメータ化し、クラスタリングすることを更に含む、請求項10に記載の方法。
- 前記事象のトレーニングセット内の全ての識別特徴対の非類似性マトリックスに基づいて、主要クラスタを階層クラスタリングによって識別することを更に含む、請求項10に記載の方法。
- 近似カルバック・ライブラー情報量をペアワイズ非類似性測度として用いることによって前記事象のトレーニングセットをクラスタリングすることを更に含む、請求項10に記載の方法。
- 前記異常事象の動作検出のために1つ以上の隠れマルコフモデルをトレーニングすることを更に含む、請求項10に記載の方法。
- 最小記述長の原理に従って最良のモデルを選択することを更に含む、請求項15に記載の方法。
- 観測ベクトルの確率密度関数をパラメータ化関数の和としてパラメータ化することによって前記1つ以上の隠れマルコフモデルをトレーニングすることを更に含む、請求項10に記載の方法。
- 複数の前記1つ以上の入力ビデオストリームからの動作検出結果を結合隠れマルコフモデルによって結合することを更に含む、請求項10に記載の方法。
- 監視ビデオのマイニングを行うための協調フレームワークのサポートシステムによって実行することができるプログラムであって、
1つ以上の入力ビデオストリームを複数の事象にセグメント化するステップと、
前記複数の事象を監視なしマイニングによってクラスタリングすることで異常事象のセットを生成するステップと、
前記異常事象のセットに対するユーザフィードバックに基づいて正常事象のクリーンなトレーニングセットを得るステップと、
前記クリーンなトレーニングセットを用いて異常事象の動作検出用モジュールをトレーニングするステップと、
前記モジュールによる動作検出の結果を相互検証によって絞り込むステップと、
を含むプログラム。 - 監視ビデオのマイニングを行うための協調フレームワークのサポートシステムであって、
1つ以上の入力ビデオストリームを複数の事象にセグメント化する手段と、
前記複数の事象を監視なしマイニングによってクラスタリングすることで異常事象のセットを生成する手段と、
前記異常事象のセットに対するユーザフィードバックに基づいて正常事象のクリーンなトレーニングセットを得る手段と、
前記クリーンなトレーニングセットを用いて異常事象の動作検出用モジュールをトレーニングする手段と、
前記モジュールによる動作検出の結果を相互検証によって絞り込む手段と、
を含む前記システム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US11/446,893 US8009193B2 (en) | 2006-06-05 | 2006-06-05 | Unusual event detection via collaborative video mining |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2007325277A true JP2007325277A (ja) | 2007-12-13 |
Family
ID=38789591
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007147961A Pending JP2007325277A (ja) | 2006-06-05 | 2007-06-04 | 協調フレームワークのサポートシステム、監視ビデオのマイニングのサポート方法、及びプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US8009193B2 (ja) |
JP (1) | JP2007325277A (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009245207A (ja) * | 2008-03-31 | 2009-10-22 | Fujifilm Corp | 確率分布構築方法、確率分布構築装置、および確率分布構築プログラム、並びに被写体検出方法、被写体検出装置、および被写体検出プログラム |
JP2011109656A (ja) * | 2009-11-13 | 2011-06-02 | Ntt Docomo Inc | ビデオデータの同期をとる方法及び装置 |
JP2012518845A (ja) * | 2009-02-19 | 2012-08-16 | パナソニック株式会社 | 異常挙動検出の正確度および堅牢性を向上させるためのシステムならびに方法 |
JP2018045302A (ja) * | 2016-09-12 | 2018-03-22 | キヤノン株式会社 | 情報処理装置、情報処理方法及びプログラム |
Families Citing this family (43)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10223934B2 (en) | 2004-09-16 | 2019-03-05 | Lena Foundation | Systems and methods for expressive language, developmental disorder, and emotion assessment, and contextual feedback |
US9355651B2 (en) | 2004-09-16 | 2016-05-31 | Lena Foundation | System and method for expressive language, developmental disorder, and emotion assessment |
US8938390B2 (en) | 2007-01-23 | 2015-01-20 | Lena Foundation | System and method for expressive language and developmental disorder assessment |
US8078465B2 (en) * | 2007-01-23 | 2011-12-13 | Lena Foundation | System and method for detection and analysis of speech |
US9240188B2 (en) | 2004-09-16 | 2016-01-19 | Lena Foundation | System and method for expressive language, developmental disorder, and emotion assessment |
US8269834B2 (en) * | 2007-01-12 | 2012-09-18 | International Business Machines Corporation | Warning a user about adverse behaviors of others within an environment based on a 3D captured image stream |
US8295542B2 (en) | 2007-01-12 | 2012-10-23 | International Business Machines Corporation | Adjusting a consumer experience based on a 3D captured image stream of a consumer response |
US8588464B2 (en) * | 2007-01-12 | 2013-11-19 | International Business Machines Corporation | Assisting a vision-impaired user with navigation based on a 3D captured image stream |
CA2676380C (en) | 2007-01-23 | 2015-11-24 | Infoture, Inc. | System and method for detection and analysis of speech |
US8284258B1 (en) * | 2008-09-18 | 2012-10-09 | Grandeye, Ltd. | Unusual event detection in wide-angle video (based on moving object trajectories) |
DE102009021765A1 (de) * | 2009-05-18 | 2010-11-25 | Deutsches Zentrum für Luft- und Raumfahrt e.V. | Verfahren zum automatischen Erkennen einer Situationsänderung |
US8649594B1 (en) * | 2009-06-04 | 2014-02-11 | Agilence, Inc. | Active and adaptive intelligent video surveillance system |
US20110157355A1 (en) * | 2009-12-28 | 2011-06-30 | Yuri Ivanov | Method and System for Detecting Events in Environments |
US8923607B1 (en) * | 2010-12-08 | 2014-12-30 | Google Inc. | Learning sports highlights using event detection |
US8904517B2 (en) | 2011-06-28 | 2014-12-02 | International Business Machines Corporation | System and method for contexually interpreting image sequences |
US20130027561A1 (en) * | 2011-07-29 | 2013-01-31 | Panasonic Corporation | System and method for improving site operations by detecting abnormalities |
US8744123B2 (en) | 2011-08-29 | 2014-06-03 | International Business Machines Corporation | Modeling of temporarily static objects in surveillance video data |
US8959082B2 (en) | 2011-10-31 | 2015-02-17 | Elwha Llc | Context-sensitive query enrichment |
US9824296B2 (en) * | 2011-11-10 | 2017-11-21 | Canon Kabushiki Kaisha | Event detection apparatus and event detection method |
US9552648B1 (en) * | 2012-01-23 | 2017-01-24 | Hrl Laboratories, Llc | Object tracking with integrated motion-based object detection (MogS) and enhanced kalman-type filtering |
GB2501542A (en) * | 2012-04-28 | 2013-10-30 | Bae Systems Plc | Abnormal behaviour detection in video or image surveillance data |
US9129640B2 (en) * | 2012-12-12 | 2015-09-08 | Crowdflik, Inc. | Collaborative digital video platform that enables synchronized capture, curation and editing of multiple user-generated videos |
US9589190B2 (en) | 2012-12-21 | 2017-03-07 | Robert Bosch Gmbh | System and method for detection of high-interest events in video data |
WO2015054342A1 (en) | 2013-10-09 | 2015-04-16 | Mindset Systems | Method of and system for automatic compilation of crowdsourced digital media productions |
CN104574438B (zh) * | 2014-12-23 | 2017-05-31 | 中国矿业大学 | 一种用于绞车主轴轴向偏移视频检测方法 |
CN104660988B (zh) * | 2015-01-27 | 2018-01-26 | 中国矿业大学 | 矿用提升机绞车主轴径向偏移检测方法 |
US10803399B1 (en) * | 2015-09-10 | 2020-10-13 | EMC IP Holding Company LLC | Topic model based clustering of text data with machine learning utilizing interface feedback |
SG10201510337RA (en) * | 2015-12-16 | 2017-07-28 | Vi Dimensions Pte Ltd | Video analysis methods and apparatus |
US10839856B2 (en) | 2016-03-09 | 2020-11-17 | Kyle Quinton Beatch | Systems and methods for generating compilations of photo and video data |
WO2019113477A1 (en) | 2017-12-07 | 2019-06-13 | Lena Foundation | Systems and methods for automatic determination of infant cry and discrimination of cry from fussiness |
CN110032917A (zh) * | 2018-01-12 | 2019-07-19 | 杭州海康威视数字技术股份有限公司 | 一种异常事件检测方法、装置及电子设备 |
CN109284705B (zh) * | 2018-09-07 | 2021-10-26 | 电子科技大学 | 一种交通监控视频的异常检测方法 |
CN109033476B (zh) * | 2018-09-11 | 2022-04-01 | 北京航空航天大学 | 一种基于事件线索网络的智能时空数据事件分析方法 |
US11727020B2 (en) * | 2018-10-11 | 2023-08-15 | International Business Machines Corporation | Artificial intelligence based problem descriptions |
CN109522451B (zh) * | 2018-12-13 | 2024-02-27 | 连尚(新昌)网络科技有限公司 | 重复视频检测方法和装置 |
EP3706047A1 (en) | 2019-03-04 | 2020-09-09 | Siemens Aktiengesellschaft | Cluster based classification for time series data |
CN110097028B (zh) * | 2019-05-14 | 2021-03-30 | 河北工业大学 | 基于三维金字塔图像生成网络的人群异常事件检测方法 |
CN111080651B (zh) * | 2019-12-12 | 2022-07-12 | 西南科技大学 | 基于水流分割的石油钻井污染气体自动监测方法 |
US11132585B2 (en) * | 2019-12-17 | 2021-09-28 | Robert Bosch Gmbh | System and method for detecting abnormal passenger behavior in autonomous vehicles |
WO2022094130A1 (en) * | 2020-10-29 | 2022-05-05 | Visual One Technologies Inc. | Custom event detection for surveillance cameras |
CN112329614A (zh) * | 2020-11-04 | 2021-02-05 | 湖北工业大学 | 一种异常事件检测方法及系统 |
CN114862857B (zh) * | 2022-07-07 | 2022-10-11 | 合肥高斯智能科技有限公司 | 一种基于两阶段学习的工业产品外观异常检测方法及系统 |
CN116579601B (zh) * | 2023-03-27 | 2024-03-05 | 中国安全生产科学研究院 | 矿山安全生产风险监测预警系统及方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000148762A (ja) * | 1998-11-04 | 2000-05-30 | Nippon Telegr & Teleph Corp <Ntt> | 動詞クラスタリング装置および方法と動詞クラスタリングプログラムを記録した記録媒体 |
JP2004151797A (ja) * | 2002-10-29 | 2004-05-27 | Nippon Hoso Kyokai <Nhk> | 統計解析装置、統計解析方法及び統計解析プログラム |
JP2005189832A (ja) * | 2003-12-05 | 2005-07-14 | Mitsubishi Electric Research Laboratories Inc | ビデオからハイライトを検出する方法 |
WO2005069158A2 (ja) * | 2004-01-16 | 2005-07-28 | Nec Corp | テキスト処理方法/プログラム/プログラム記録媒体/装置 |
JP2006505040A (ja) * | 2002-11-01 | 2006-02-09 | 三菱電機株式会社 | 映像の内容をマイニングする方法 |
JP2006039689A (ja) * | 2004-07-22 | 2006-02-09 | Nara Institute Of Science & Technology | 画像処理装置、画像処理方法、画像処理プログラムおよびそのプログラムを記録した記録媒体 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5091780A (en) * | 1990-05-09 | 1992-02-25 | Carnegie-Mellon University | A trainable security system emthod for the same |
US6028626A (en) * | 1995-01-03 | 2000-02-22 | Arc Incorporated | Abnormality detection and surveillance system |
US7296231B2 (en) * | 2001-08-09 | 2007-11-13 | Eastman Kodak Company | Video structuring by probabilistic merging of video segments |
US7302451B2 (en) * | 2004-05-07 | 2007-11-27 | Mitsubishi Electric Research Laboratories, Inc. | Feature identification of events in multimedia |
US7821870B2 (en) * | 2005-08-19 | 2010-10-26 | Mitsubishi Electric Research Laboratories Inc. | Method and system for identifying moving objects using acoustic signals |
-
2006
- 2006-06-05 US US11/446,893 patent/US8009193B2/en not_active Expired - Fee Related
-
2007
- 2007-06-04 JP JP2007147961A patent/JP2007325277A/ja active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000148762A (ja) * | 1998-11-04 | 2000-05-30 | Nippon Telegr & Teleph Corp <Ntt> | 動詞クラスタリング装置および方法と動詞クラスタリングプログラムを記録した記録媒体 |
JP2004151797A (ja) * | 2002-10-29 | 2004-05-27 | Nippon Hoso Kyokai <Nhk> | 統計解析装置、統計解析方法及び統計解析プログラム |
JP2006505040A (ja) * | 2002-11-01 | 2006-02-09 | 三菱電機株式会社 | 映像の内容をマイニングする方法 |
JP2005189832A (ja) * | 2003-12-05 | 2005-07-14 | Mitsubishi Electric Research Laboratories Inc | ビデオからハイライトを検出する方法 |
WO2005069158A2 (ja) * | 2004-01-16 | 2005-07-28 | Nec Corp | テキスト処理方法/プログラム/プログラム記録媒体/装置 |
JP2006039689A (ja) * | 2004-07-22 | 2006-02-09 | Nara Institute Of Science & Technology | 画像処理装置、画像処理方法、画像処理プログラムおよびそのプログラムを記録した記録媒体 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009245207A (ja) * | 2008-03-31 | 2009-10-22 | Fujifilm Corp | 確率分布構築方法、確率分布構築装置、および確率分布構築プログラム、並びに被写体検出方法、被写体検出装置、および被写体検出プログラム |
JP2012518845A (ja) * | 2009-02-19 | 2012-08-16 | パナソニック株式会社 | 異常挙動検出の正確度および堅牢性を向上させるためのシステムならびに方法 |
JP2011109656A (ja) * | 2009-11-13 | 2011-06-02 | Ntt Docomo Inc | ビデオデータの同期をとる方法及び装置 |
JP2018045302A (ja) * | 2016-09-12 | 2018-03-22 | キヤノン株式会社 | 情報処理装置、情報処理方法及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
US8009193B2 (en) | 2011-08-30 |
US20070279490A1 (en) | 2007-12-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2007325277A (ja) | 協調フレームワークのサポートシステム、監視ビデオのマイニングのサポート方法、及びプログラム | |
Meenpal et al. | Facial mask detection using semantic segmentation | |
US11188789B2 (en) | Detecting poisoning attacks on neural networks by activation clustering | |
Choi et al. | Understanding collective activitiesof people from videos | |
Kosmopoulos et al. | Robust visual behavior recognition | |
EP2919153A1 (en) | Event detection apparatus and event detection method | |
Malgireddy et al. | Language-motivated approaches to action recognition | |
US20160300111A1 (en) | Generic Object Detection on Fixed Surveillance Video | |
Velastin et al. | People detection and pose classification inside a moving train using computer vision | |
Ullah et al. | Dominant motion analysis in regular and irregular crowd scenes | |
Vu et al. | Audio-video event recognition system for public transport security | |
US11194330B1 (en) | System and method for audio classification based on unsupervised attribute learning | |
Rehman et al. | Multi-modal anomaly detection by using audio and visual cues | |
Perez et al. | Using the conflict in Dempster–Shafer evidence theory as a rejection criterion in classifier output combination for 3D human action recognition | |
Bibi et al. | Automated multi-feature human interaction recognition in complex environment | |
KR20170082025A (ko) | 기계 학습 기반 얼굴 인식을 이용한 저작권을 가진 동영상 식별 장치 및 방법 | |
WO2015193288A1 (en) | Fusion-based object-recognition | |
Berclaz et al. | Multi-camera tracking and atypical motion detection with behavioral maps | |
Ouivirach et al. | Clustering human behaviors with dynamic time warping and hidden Markov models for a video surveillance system | |
Pandiaraja et al. | An analysis of abnormal event detection and person identification from surveillance cameras using motion vectors with deep learning | |
Huang et al. | Person re-identification across multi-camera system based on local descriptors | |
JP2009122829A (ja) | 情報処理装置、情報処理方法、およびプログラム | |
CN116863406A (zh) | 一种基于人工智能的智能报警安防系统及其方法 | |
Zhao et al. | A unified framework with a benchmark dataset for surveillance event detection | |
Yanakova et al. | Facial recognition technology on ELcore semantic processors for smart cameras |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100520 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20111227 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120313 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20120703 |