JP2013501288A - ビデオ映像の監視 - Google Patents

ビデオ映像の監視 Download PDF

Info

Publication number
JP2013501288A
JP2013501288A JP2012523371A JP2012523371A JP2013501288A JP 2013501288 A JP2013501288 A JP 2013501288A JP 2012523371 A JP2012523371 A JP 2012523371A JP 2012523371 A JP2012523371 A JP 2012523371A JP 2013501288 A JP2013501288 A JP 2013501288A
Authority
JP
Japan
Prior art keywords
trajectory
frame
interest
point
trajectories
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2012523371A
Other languages
English (en)
Other versions
JP5634517B2 (ja
Inventor
淳人 牧
パーベット、フランク
ステンガー、ビョルン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Publication of JP2013501288A publication Critical patent/JP2013501288A/ja
Application granted granted Critical
Publication of JP5634517B2 publication Critical patent/JP5634517B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • G06T7/277Analysis of motion involving stochastic approaches, e.g. using Kalman filters
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • G06T7/246Analysis of motion using feature-based methods, e.g. the tracking of corners or segments

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)
  • Closed-Circuit Television Systems (AREA)
  • Image Processing (AREA)

Abstract

2つの移動特徴の動きの間に指示的関係を持つ移動特徴の対を判定することによって、映像内の固有の動きを識別する。例えば、歩行者の動きは、歩行者の両足の動きの指示的関係によって識別される。この指示的関係は、一方の足が周囲に対して移動するとき、他方の足は静止している、というものである。

Description

本発明は、映像解析に関し、より具体的には映像内の移動特徴の識別に関する。
映像内の移動特徴の動きは、映像の複数フレームの各々における特徴の位置を示す軌跡によって表わすことができる。そのような軌跡を分析しその特徴を探すことによって、映像内の移動特徴を識別することができる。移動特徴は、例えば、映像における歩行者に関するものである。映像中の歩行者検出には、空間または建物に立ち入る人々または立ち去る人々の数を判定するといった、いくつかの応用例がある。自動車用途の歩行者検出もある。例えば、車両前方の物体の分析に基づいた自動ブレーキシステムの制御である。
歩行者のような注目物体を検出するには、注目物体の軌跡を注目していない他の物体の軌跡から識別しなければならない。映像中の物体の動きは、しばしば複雑な軌跡をえがく。したがって、物体を不正確に識別したり、注目物体を逸する可能性がある。
そこで、本発明は上記問題に対処し、映像中で固有の動きを識別する方法の提供を目的とする。
本発明の態様によれば、映像中で固有の動きを識別する映像解析方法が提供される。それぞれが映像シーケンス上の特徴の動きを示す複数の軌跡から、固有の動き(characteristic motion)が識別される。該方法は、指示的関係(indicative relationship)を持つ軌跡対を決定することを含む。軌跡対がそのような関係を持っていることが判明すると、その軌跡対は、固有の動きに対応するものとして分類される。
本発明の実施形態によれば、軌跡対間に存在しうる相関に基づいて、軌跡は分析され、分類される。
固有の動きは、歩行の動きであってもよい。歩いている歩行者の二本の足の動きには、いくつかの相関がある。
本発明の実施形態によれば、軌跡対を構成する第1および第2の軌跡は、静的区間と動的区間を有する。軌跡対を分類するのに用いられる軌跡対の指示的関係は、第1の軌跡の静的区間が第2の軌跡の動的区間と一致することである。
歩いている歩行者の足の軌跡は静的区間と動的区間を持つことから、この分析は歩行者の検出を可能にする。歩行者の地面に立っている方の足は静止しており、従って静的である。歩行者の別の方の足は地面に対して移動し、従って動的区間にあると考えることができる。歩行者が歩くと、一方の足を静的区間とし、他方の足を動的区間としながら、それぞれの足で静的区間と動的区間が交互に入れ替わる。
本発明の実施形態によれば、静的区間および動的区間を持つ軌跡が識別され、静的区間と動的区間を持つ軌跡の集合についてペアワイズ分析( pair wise analysis)が行なわれる。
これにより、空間的に足にかかわる軌跡を個々に識別して同一歩行者に関する軌跡対を識別することができる。
静的区間では、軌跡が示す特徴はその周囲に対して静止している。動的区間では、軌跡が示す特徴は、その周囲に対して移動している。
本発明の実施形態によれば、第1および第2の軌跡の指示的関係は、軌跡対の動きの方向の相関である。
歩行者の足の動きは、歩行者が歩く方向とほぼ平行であることが見込まれる。これは、空間的に歩行者の両足に関する軌跡対の識別に用いることができる。
本発明の実施形態によれば、第1および第2の軌跡の動き方向の相関は、第1の軌跡が第2の軌跡に対して実質的に平行であることを含む。
本発明の実施形態によれば、方法は複数の軌跡を判定することをさらに含む。
映像シーケンスの各フレームに注目点を置くことにより複数の軌跡が判定される。注目点は映像中の特徴に対応する。第1のフレーム内の特徴について軌跡を構築するために、次フレームの注目点とこれに先行するフレームの注目点の対応が判定される。1つのフレームにおける所与の注目点について、次フレームにおいて対応する2以上の注目点が用いられてもよい。注目点の対応を用いることにより、第1のフレーム内の注目点の軌跡が構築される。フレーム間、注目点間の複数の対応の可能性から、第1のフレーム内の注目点について、起こり得る軌跡が2以上見つかるかもしれない。
本方法は、フレーム間の注目点マッチングの柔軟性を許容する。複数の軌跡のうちのいくつかは、全フレームにわたって同じ物理的特徴を追跡しないかもしれない。しかしながら、他の軌跡と比べて、そのような軌跡が指示的関係を持つ可能性は低い。したがってそのような軌跡は指示的関係が存在するかどうかの判定をする際に破棄される。このような柔軟性は、物体がオクルージョンによって不明瞭になる場合、当該物体が不明瞭となるフレームからでさえも軌跡を常に生成できることから有利に働く。また、フレーム対にまたがり物体の2以上の空間的な一致がある場合、これらはすべて複数の軌跡に含めてもよい。
本発明の実施形態によれば、フレームにおいて注目点を表わすノードと、後続フレームにおいて同じ特徴に対応する注目点をつなぐエッジとを持つ非循環グラフを構築し、該グラフをトラバースすることにより、複数の軌跡が判定される。
本発明の実施形態によれば、非循環グラフをトラバースすることは、増補確率に基づいて、各ノードでエッジの確率的な選択を行なうことを含む。増補確率は、軌跡のトレース可能な深さに依存する係数を含むことができる。この係数は、指示的関係が存在するかどうかをより確実に判定しやすい長い軌跡に対して有利に働くのを可能にする。増補確率は、速度のような物理的特性の保存に基づいた係数を含んでもよい。これは、対象物に見込まれた特性を持っている軌跡に対して有利に働くことを可能にし、非物質的な軌跡を除外することをこのように可能にする。
本発明の実施形態によれば、指示的関係はランダム決定森を用いて判定される。
本発明の態様によれば、本発明に従う方法をコンピューターに実行させる命令を伝えるコンピューター可読媒体が提供される。
本発明の態様によれば、映像中の固有の動きを識別するための映像解析システムが提供される。
発明の実施形態を以下の図面を参照しながら説明する。
図1はデータ処理システムのブロック図である。 図2は映像内の移動特徴を認識する方法のフローチャートである。 図3はフレーム間で起こり得る軌跡のトレース図である。 図4は映像シーケンスにおいて対象を追跡する方法を示すフローチャートである。 図5は後のフレームの注目点との空間的な一致として分析されるフレームの注目点を示す図である。 図6は特徴の確率的な軌跡を生成するのに用いられる非循環グラフを示す図である。 図7は歩行者が歩く際の動きの固有パターンを複数の軌跡から識別する方法を示す図である。 図8は軌跡が足に関連するものであるか否かをランダム森分類器を用いて分類する方法を示す図である。 図8Aは速度ベクトル対の例を示す図である。 図9はランダム決定森を示す図である。 図10はランダム決定森からの決定木を示す図である。 図11は2つの軌跡の動きの方向の相関に基づく関数を計算する方法を示す図である。 図11Aは軌跡およびその一次の方向ベクトルの例を示す図である。 図12は、2つの軌跡の動きの位相の時間的な相関に基づく関数を計算する方法を示すである。
図1は、映像内の移動特徴を認識するためのデータ処理システム100を示している。データ処理システム100は、プロセッサ102、メモリ104、入力モジュール108および出力モジュール110を含む。メモリ104は、映像内の移動特徴を認識するためのプログラム106を記憶する。プログラム106は、プロセッサ102上で実行することができる。入力モジュール108は、映像シーケンスにおける移動特徴を認識する分析のために該映像シーケンスの入力を受け取ることができ、また、出力モジュール110は、その分析の結果を出力することができる。入力モジュール108は、ビデオカメラまたはビデオレコーダーからの映像データを受信することができるデータ接続でもよい。入力モジュール108は、インターネットのようなネットワーク上の映像データを受信することができるネットワーク接続でもよい。データ処理システム100は、従来のコンピューターでもよい。以下、プログラム106によって行なわれる方法を説明する。
図2は、映像内の移動特徴を認識する方法のフローチャートを示す。映像は、フレームのシーケンスから構成される。各々のフレームは、同時に1組の特徴を表現する。映像が再生される場合、映像内の特徴の動きは、該映像の連続フレーム上でのそれらの位置の変化に反映される。したがって、映像中の特徴の軌跡は、映像シーケンス上の各フレームについての位置と見なすことが可能である。特徴の軌跡を、物体の見込まれる動きと比較することにより、物体に対応するものとして特徴を認識することができる。例えば、映像中に現れる、歩いている人の足は、固有の動きのパターンを持つ。足が地面に接している時、歩行者のその足は固定区間を持ち、足が地面に対して移動している時、その足は移動区間を持つ。また、歩行者の足の歩行の動きには相関性がある。一方の足が静止している時、他方の足は動いている。映像内の特徴の動きを、足の動きのような予期される固有のパターンと比較することによって、足のような特徴を映像において識別することができ、したがって、歩行者を識別することができる。
映像内の移動特徴を認識するには、映像のフレームについての特徴の軌跡が必要である。映像内の物体の軌跡を追跡するには、映像フレームにおいてその物体の位置を識別することが必要である。したがって、対処すべき2つの問題がある。物体の位置を各フレームにおいて識別しなければならない。また、追跡するフレームにおいて同じ物体を識別しなければならない。
方法のステップS100は、映像シーケンスの各フレームに注目点を置くことを含んでいる。シーケンスの2以上のフレームで起こりうる一定の特徴を示す個々のフレームの空間的ピクセルパターンを検出する。例えば、第1ステップが、各フレームのコーナーを発見することを含んでもよい。
映像内の特徴の軌跡を検出するために、ステップS101において、直接先行するフレームにおける特徴に対応する注目点が判定される。
ステップS102では、シーケンスの第1のフレーム内の所与の注目点について、1組の起こり得る軌跡を生成する。注目点について起こり得る最も一般的な軌跡の組は、次フレームにおいて識別される注目点のうちのいずれかの次フレームにおける位置を含む。フレームの外部や、フレーム内の別の物体の背後、つまり当該フレームにおいて示されない位置に通じる軌跡とすることも可能である。
起こり得る軌跡の組は、フレーム対を考慮し、該フレーム対における空間的なマッチング(matching)注目点を識別することにより判定する。マッチング注目点の対は、マッチングスコアを計算することにより識別する。マッチングスコアについては、注目点位置の間の空間距離および注目点のアピアランスの類似性のような要因を考慮する。これは、2フレーム以内で似たような位置および/または類似のアピアランスを持つ注目点を識別することにより達成することができる。空間的なフレームのマッチング対から、フレームシーケンスを通して該マッチング対をトレースすることにより、起こり得る軌跡を構築する。
映像シーケンスの第1のフレーム内の物体について起こり得る軌跡の組は、第2の後続するフレーム内の多数の注目点を含んでもよい。起こり得る軌跡の組を、物体の軌跡が従うものと予期されるパターンに基づく制約を実行することによって絞り込む。これは、例えば物体の速度保存のような物理法則とすることができる。
起こり得る軌跡の数を絞り込んだ時点で、軌跡が更なる処理に必要な場合、起こりそうな軌跡の確率的な選択を行う。結果として生ずる軌跡は、例えばジェスチャ認識アルゴリズムにおける更なる処理において用いられる。確率的な選択が繰り返される場合、選択された軌跡は相違しうることに留意されたい。
次にステップS103内において、軌跡を固有の動きのパターンと比較する。
図3は、フレーム間の起こり得る軌跡のトレース図を示している。図3において一番上のフレームは最近のフレームであり、また、時間的に前のフレームは最近のフレームの下に示される。入力シーケンスの各フレームにおいて、いくつかの注目点が見つかる。隣のフレームの注目点との間であり得る対応はリンクによって示される。
図4は、映像シーケンス内の対象を追跡する方法を示すフローチャートである。例えば、映像シーケンスは、解像度1280×720ピクセルで60フレーム/秒の350フレームとする。図4に示す方法では、映像シーケンスのフレームにおけるコーナー検出により特徴を追跡する。図1に示されるデータ処理システム100を参照しながら、この方法について説明する。ステップS1において、映像シーケンスの各フレームから注目点を抽出する。各フレームのコーナーを検出するために、ハリス・コーナー検出器が用いられる。各フレームにおける注目点の位置は、メモリ104のセクションに記憶される。ハリス・コーナー検出器は、画像の領域を考慮し、これをわずかにシフトし、その領域を当該画像の重複領域と比較することにより、画像内のコーナーの位置を検出する。ハリス・コーナー検出器は、プログラム106の一部として実装される。すべての方向で重複領域の変化があるところにコーナーは位置する。ハリス・コーナー検出器については、「C. Harris and M. Stephens, 'A Combined Corner and Edge Detector', Proc. Forth Alvey Vision Conference, pages 147-151, 1988」に記載されている。
時点tのフレームにおける注目点をp(t)と表す。ここで、i=1,...,nは、注目点のインデックスである。フレームtにおける注目点p(t)の二次元位置はx(t)である。
ステップS2では、諸フレームの注目点間の一致(match)を判定する。一フレームの各注目点について、空間的な祖先である前フレームの注目点が識別される。この識別は、現フレームで検討しているコーナーの一定範囲内に存在する前フレームの注目点を分析することにより行う。
図5は、時間tのフレームにおける注目点p(t)の空間的な一致であるとして分析される時間t−1のフレームにおける注目点p(t−1)を示す。フレームtにおける注目点p(t)の位置x(t)の範囲R内において位置x(t−1)を持つ注目点p(t−1)を分析する。範囲Rの外側の位置x’(t−1)を持つ注目点p’(t−1)は、注目点p(t)との空間的な一致とされることはない。
各注目点対について、時間的なマッチングスコアを計算する。時間的なマッチングスコアは、前フレームにおける注目点と現フレームにおける注目点とを一致させる。
時間的なマッチングスコアは2つの注目点のアピアランス類似性およびそれらの空間距離に基づく。
時点tのフレームにおける注目点p(t)と、時点t−1の前フレームにおける注目点p(t−1)の間の時間的なマッチングスコアをPij(p(t),p(t−1))と表す。これは、次式によって計算することができる。
Figure 2013501288
ここで、Sijは、注目点p(t)と注目点p(t−1)の間のアピアランス類似である。アピアランス類似は、それぞれのフレーム中の注目点周囲の局所画像領域から計算される。
これは、局所画像領域間の絶対差の正規化平均の和として計算される。Dijは、注目点間の空間距離であり、次式から計算される。αおよびβは、正の重み付け係数である。
Figure 2013501288
空間的な一致は、時間的なマッチングスコアPijに基づいて識別される。2進値Eij(t)は、時点tのフレームにおける注目点p(t)と時点t−1の前フレームにおける注目点p(t−1)の間の空間的な一致の各々に関連付けられる。空間的な一致は、現フレームにおける所与のコーナーの時間的なマッチングスコアの最高値として選択してもよい。あるいは、最大値のしきい値範囲内で時間的なマッチングスコアを持つ一致をすべて空間的な一致として選択してもよい。したがって、
Figure 2013501288
のいずれかについて、Eij(t)=1である。ここで、eはしきい値である。
処理を逆に考えても空間的な一致は判定される。前フレームの各注目点について、時間的なマッチングスコアが現フレームの注目点について計算される。
ステップS3では、2つのフレーム間の一致総数を制限する。これは、一致数を単に一定に維持すればよい。フレーム対間の一致数が一定となるように、しきい値eは動的に調整してもよい。フレーム間の一致総数4nは、一致の固定数として適切な定数であることが分かった。これらは最も高い時間的なマッチングスコアを持ったものとして選択されている。これにより、コーナーの最大マッチングスコアが低い値である場合に、一致がないコーナーが結果として生じるかも知れない。
ステップS3の後に、シーケンスの各フレームにおけるいくつかの注目点と、フレーム間の注目点のアクティブな一致の組を入手することができ、確率的な軌跡抽出のためのグラフを構築することができる。
このグラフをステップS4において構築する。各フレームtに対して、1組の注目点p(t)がある。また、時間的に隣接するフレーム間において、時点tのフレームと時点t−1のフレームの注目点との間に1組の一致Eij(t)がある。これらはグラフG(N,E)を構築するのに用いられる。グラフNのノードは、前フレームにおいて一致した注目点を表わし、エッジ(E)は、注目点間の一致を表わす。このグラフは、映像シーケンスの最終フレームに注目点の各々のルートノードを定めることによって構築される。当該注目点から前フレームにおける注目点へのエッジがアクティブな一致のそれぞれについて加えられる。ノードは、前フレームで一致した注目点について定められる。この処理を、当該シーケンスの最終フレームに先行するフレームからのアクティブな一致について繰り返し、以下の図5に示すような非循環グラフが生成される。これは、確率的な軌跡を生成するのに用いることができる。このグラフは、T個のフレームについて構築される。各エッジEij(t)には、その重み係数としてp(t)が与えられる。
エッジのトレース可能な深さ、すなわち、グラフにおいて特徴点p(t)の空間的な祖先を持つフレームの数をd[Eij(t)]と表記する。グラフG(N,E)を表わすデータはメモリ104に記憶される。データは、N個のノードの各々のx(t)に対する値、各エッジEij(t)に対するPij(t)およびd[Eij(t)]の値として記憶される。
ステップS5において、この非周期グラフをトラバースすることにより軌跡を生成する。トラバースはいずれかのルートノードから開始する。また、エッジの確率的な選択を行う。この処理を各ノードで繰り返す。確率的な選択は、増補確率に基づいて行う。この増補確率は、マッチングスコアから計算され、トレース可能な深さおよび速度保存係数を考慮するための係数を含んでいる。
増補確率、あるいはサンプリング確率P’ij(p(t),p(t−1))は、次式から与えられる。
Figure 2013501288
ここで、γとδは正の重み係数である。また、Vijは次式から与えられる速度保存係数である。
Figure 2013501288
上記速度保存係数の式は、問題のフレームx(T)における注目点の位置、前フレームx(T−1)内の軌跡における注目点の位置、および軌跡X(T+1)内で次の点と見なされている注目点の位置を考慮に入れる。
トレース可能な深さに依存する係数を含んだ増補確率を使用することは、長い軌跡を支持することを意味する。長い軌跡は、短い軌跡より利用価値が高い場合が多い。また速度保存係数は、検討中のフレームに至るまで軌跡内の物体の速度を保存する特徴点間のリンクを支持することを意味する。これにより、非循環グラフをトラバースする場合、物理的特徴の動きに対応する可能性がありそうな滑らかな軌跡を確実にたどることができる。
非循環グラフは、最終フレームの特徴点に対応する物体について複数の確率的な軌跡を生成するために複数回にわたりトラバースすることができる。生成される軌跡は相違するものとなり、このため少なくともいくつかのものは正確ではない。しかしながら、連続するフレームの対応に関して不確実性がある場合であっても可能性のある軌跡を許容することにより、シーケンスの一部においてオクルージョンにより物体が不明瞭になる場合であっても比較的長いフレームシーケンスの軌跡を得ることができる。
一の物体についての複数の軌跡は、例えば、特定の固有の動きを持つ映像シーケンス内の特徴を検出するパターン認識アルゴリズムに有用である。この場合、シーケンスの最終フレームにおける各注目点について、複数の起こり得る軌跡を検査し、特定の固有の動きを持つものについてすべての起こり得る軌跡を検査すると効果的であるかもしれない。非循環グラフを用いて複数の起こり得る軌跡を生成することは、上記の応用に特に適している。
非循環グラフのトラバースの後、確率的な軌跡X(t)=[x(t),x(t−1),...x(t−T+1)]をメモリ104に記憶する。これは、この軌跡に属する点のフレーム内の位置の集合を表わす。
図6は、上述した方法を用いて特徴の確率的な軌跡を生成するのに用いられる非循環グラフを示している。最近のフレームにおける注目点は、グラフの一番上のノードとして示される。これら注目点は、1組のエッジによって前フレームにおける注目点に連結される。時間的なマッチングスコアが、時間的に隣接するフレームにおいて注目点を表わすノードをつなぐ各エッジに関連付けられる。
注目点のグラフから軌跡を抽出するために、各ノードにおいて、そのノードを前のフレームにおいて注目点を表わすノードに接続しているエッジのうちの1つが選択される。
歩行者の歩行の動きを識別するために、軌跡を固有のパターンと比較するステップは、空間的に歩行者に一方の足に関する特徴を識別すること、および、歩行者の2本の足に対応する動きに相関を持つ特徴の対を検出することを含んでいる。これについて図7を参照して述べる。
図7は、複数の軌跡から、歩行者の歩行の動きの固有のパターンを識別する方法を示している。
上述したように、確率的な軌跡の計算以外の方法によって複数の軌跡を得ることができる。例えば、「Peter Sand, Seth Teller, Particle Video: Long-Range Motion Estimation using Point Trajectories, Proceedings of the 2006 IEEE Computer Society Conference on Computer Vision and Pattern Recognition, p.2195-2202, June 17-22, 2006」に記載されるような粒子技術を軌跡の生成に用いることができる。粒子映像技術は、粒子の軌跡を生成する。粒子は、像点を表わす。オプティカルフロー推定は、隣接フレームにおいて粒子の位置を検出するのに用いられ、フレームにおける粒子間をつなぐリンクは、相対的な粒子運動を数量化するのに用いられる。
ステップS601において、候補軌跡を識別する。軌跡が空間的に足に関係するかどうか判断するために、およそ1つの歩行周期の軌跡の動きが分析される。軌跡が足の位置に対応する注目点に関連している場合、歩行周期内で移動区間および固定区間を持つことが期待される。したがって、ステップS601において、一の歩行周期内で動的区間および固定区間を持つものが候補軌跡として識別される。
候補軌跡が識別されると、関連する候補軌跡対をステップS602において検出する。歩いている歩行者については、二本の足の動きは相関することが期待される。この相関は、時間的かつ空間的である。相関の時間的な態様は、歩いている歩行者の一方の足が固定区間にある場合、他方の足は動的区間にあることが期待されるということである。二本の足の空間的な位置もまた相関を持つことが予期される。これらの相関に加えて、歩行者の足の動きの方向についても相関があることが期待される。歩いている人の二本の足の軌跡は、歩行者が歩いている方向においてほぼ平行であることが期待される。上記の相関を持っている候補軌跡対を識別することによって、映像シーケンスにおいて歩行者の足に関係する注目点の動きから歩行者が識別される。
足に関連するものであるか足に関連するものでないかによって軌跡を分類し、ステップS601において候補軌跡を識別するには、ランダム森分類器を用いることができる。
足に関連するものであるか否か軌跡を分類するのにランダム森分類器を用いる方法を図8に示す。ステップS701において、軌跡を標準形に変換する。軌跡を標準形に変換することは、軌跡の角度のような係数、軌跡に関係しうる歩行者の速度、歩行者のステップの幅および相を説明することを意味する。標準形への変換は、カメラの動きのような線運動の削減、およびステップ振幅のような軌跡の正規化態様を含んでもよい。
軌跡の標準形は、次のように表記される。
Figure 2013501288
ステップS702において、特徴ベクトルvおよびvを軌跡の標準形から生成する。これらの特徴ベクトルは、4つの時点t,t,tおよびtを任意に選択し、それらの位置で軌跡を5つのセクションにカットすることで生成される。特徴ベクトルは、次式から与えられる。
Figure 2013501288
図8Aは、速度ベクトル対の例を示している。特徴を計算するために、多数の速度ベクトル対がサンプリングされる。
ステップS703において、特徴fおよびfを特徴ベクトルおよびランダムに選択した変数から計算する。この特徴は、次のように距離および2つのベクトルvおよびvの内積として計算される。
Figure 2013501288
ここで、a、a、bおよびbは0と1の間の値をとる任意の係数である。
カット点t、t、t、tおよび係数a、a、b、bについて異なる値を用いることにより、fとfの多数のバリエーションを作ることができる。
ステップS704において、ランダム決定森を用いることにより、足に関連するものであるか足に関連しないものであるかに軌跡を分類する。
図9は、ランダム決定森800を示している。ランダム決定森800は、8本の決定木810、820、830、840、850、860、870、880を持つ。各軌跡は、全部で8本の木を用いて分類される。木の各分岐点においてパラメーターt、t、t、t、a、a、bおよびbを用いてfとfの関数が計算される。この関数の値に基づいて、左の枝と右の枝のどちらをたどるかの判定がなされる。左と右の枝のどちらを選ぶかの選択に用いられるしきい値θの値は、足/非足の分散の情報増加が最大となるように選定される。
図10は、図9に示した決定森800から取り出した決定木810を示している。決定木902の各ノードにおいて、当該木をトラバースする場合、軌跡が当該ノードに達する条件つき確率を2本の縦線の高さで示す。決定木810のルートノード902において、この点の特徴は足であるか否かの情報がないことから、足の特徴904に関する軌跡の縦線と、非足の特徴906に関する軌跡の縦線は等しい。この木のトラバースの際に、fとfの関数値が計算され、問題の軌跡についてのこれら値に基づいて、左の枝のノード910または右の枝のノード908のいずれかに到達する。トラバースは継続し、各分岐点で異なる関数の値が計算される。葉ノード(例えば920)に到達すると、木810からの条件つき確率は、決定森における他の木からの条件つき確率と結合され、この確率に基づいて、軌跡は、足あるいは非足のどちらかに分類される。
ランダム森は、各分岐点について、パラメーターt、t、t、t、a、a、bおよびb、関数fおよびf、各分岐点のしきい値θに関する一連の値として記憶される。これらの値はメモリ104に記憶する。これらは、手動で映像シーケンスの特徴に注釈を付与し、関数fおよびfの値を計算し、最大の情報利得を与えるしきい値θに対する値を選択することにより、プログラム106の実行に先立って計算される。
足の候補軌跡が識別されると、これらを分析し、同一歩行者について相関する足の組を検出する。この分析についても、上述と同様の方法でランダム決定森を用いて行う。ランダム決定森において木をトラバースする場合に判定を下すのに用いられる関数は、検討中の2つの軌跡の動きの方向の相関、および軌跡における動きの移動区間と固定区間の相関に基づいて計算される。
図11は、2つの軌跡X(t)およびX(t)の動きの方向の相関に基づく関数を計算する方法を示している。ステップS1001において、各軌跡の動きの方向を検出する。軌跡X(t)の動きの方向は、位置x(T)の集合T=t...t−T+1の分散行列を計算し、分散行列の最大固有値に対応する固有ベクトルξを計算することにより検出される。したがって、ξは、X(t)の一次の方向を表わす。第2の軌跡X(t)の一次の方向ξも同様に計算される。
図11Aは、軌跡X(t)および一次の方向ベクトルξの例を示している。
ステップS1002において、2つの軌跡に関連している時点tのフレームにおける注目点の位置x(t)およびX(t)に基づいて、該2つの軌跡について歩行方向のベクトルxiu(t)を計算する。
Figure 2013501288
ステップS1003において、互いの動きの方向の内積および歩行の方向によりコンシステンシーcを計算する。
Figure 2013501288
コンシステンシーは、歩行者の足の移動方向がほぼ平行になること、および、これらの方向は歩行の歩行方向とほぼ平行になることが見込まれるという事実を利用するものである。
ステップS1004において、コンシステンシーに基づいた関数fおよびランダムベクトルΦを計算する。
Figure 2013501288
図12は、検討中の2つの軌跡X(t)およびX(t)の動きの位相の時間的な相関に基づいて関数を計算する方法を示している。
ステップS1101において、軌跡の速度ベクトルY(t)を計算する。
Figure 2013501288
ここで、T=t,...t−T+2について、y(T)=x(T)−x(T−1)である。
ステップS1102において、修正した速度ベクトルを計算する。次式すなわち
Figure 2013501288
を用いることにより、一定のカメラモーションを相殺することができる。修正された速度ベクトルは次式を用いて生成される。
Figure 2013501288
ステップS1103において、修正された速度ベクトルを固定のカット点でl個の部分にカットする。そしてステップS1104において、カットされ修正された速度ベクトルの内積に基づくベクトルを計算する。
Figure 2013501288
最後にステップS1105において、このベクトルおよびランダムベクトルに基づいた関数を計算する。

Claims (20)

  1. 各々が映像シーケンス上の特徴の動きを示す複数の軌跡から前記映像シーケンス内の固有の動きを識別する映像解析方法であって、
    前記複数の軌跡から第1の軌跡および第2の軌跡を判定すること;および
    前記固有の動きに対応するものとして前記第1の軌跡および前記第2の軌跡を分類すること;
    を含み、前記第1の軌跡と前記第2の軌跡の間に指示的関係が存在する、方法。
  2. 前記第1および第2の軌跡は、各々が静的区間および動的区間を持っており、前記指示的関係は、前記第1の軌跡の前記静的区間と前記第2の軌跡の前記動的区間の一致を含む、請求項1の方法。
  3. 前記複数の軌跡から1組の軌跡を判定することをさらに含み、前記1組の軌跡における各軌跡は、静的区間および動的区間を持っており、前記第1の軌跡および前記第2の軌跡は、前記1組の軌跡から判定される、請求項2の方法。
  4. 軌跡によってその動きが示される特徴は、前記静的区間では周囲に対して静止し、前記特徴は、前記動的区間では周囲に対して移動する、請求項2または3の方法。
  5. 前記指示的関係は、前記第1の軌跡および前記第2の軌跡により示される動きの方向の相関を含む、上記のいずれかの方法。
  6. 前記動きの方向の前記相関は、前記第1の軌跡が前記第2の軌跡に対して実質的に平行であることを含む、請求項5の方法。
  7. 前記固有の動きは歩行の動きである、上記のいずれかの方法。
  8. 前記複数の軌跡を判定することをさらに含み、該複数の軌跡を判定することは、
    前記映像シーケンスの各フレームにおける注目点を識別すること;
    前記第1のフレーム以外の各フレームについて、前記映像シーケンスの前フレームにおける注目点に対応する少なくとも1つの注目点を判定すること;および
    前記第1のフレーム内の注目点について複数の軌跡を構築することを含み、各軌跡は前記映像シーケンスにおける少なくとも1つの前記次フレームおよび前記第1のフレームにおける位置を含み、前記第1のフレーム内の前記位置は前記第1のフレーム内の前記注目点の位置であり、前記少なくとも1つの次フレームは、前記シーケンスの次フレームの各々を連続的に検討することにより判定され、少なくとも1つの軌跡は前フレームに伸び、その軌跡において、前フレームにおいて該軌跡に含まれる注目点に対応する注目点の位置を含む、上記のいずれかの方法。
  9. 前記第1のフレーム内の注目点について複数の軌跡を構築することは、前記フレームにおいて前記注目点を表わすノードと、後続フレームにおいて同じ特徴に対応する注目点をつなぐエッジとを備える非循環グラフを構築すること、および、前記複数の軌跡を生成するために前記非循環グラフをトラバースすること、を含む請求項8の方法。
  10. 前記非循環グラフをトラバースすることは、増補確率に基づいて各ノードのエッジの確率的な選択を行うことを含む請求項9の方法。
  11. 前記増補確率は、前記軌跡のトレース可能な深さに基づいた係数を含む請求項10の方法。
  12. 前記増補確率は、物理量保存に基づいた係数を含む請求項10または11の方法。
  13. 前記物理量は速度である請求項12の方法。
  14. 前記指示的関係は、ランダム決定森を用いて判定される、上記のいずれかの方法。
  15. コンピューター上で実行されたときに、上記のいずれかの請求項に従う方法を該コンピューターに行なわせる計算機実行可能命令を伝えるコンピューター可読媒体。
  16. 各々が映像シーケンス上の特徴の動きを示す複数の軌跡のためのストレージ;および
    前記複数の軌跡から第1の軌跡および第2の軌跡を判定し、
    固有の動きに対応するものとして前記第1の軌跡および前記第2の軌跡を分類するプロセッサ
    を具備し、前記第1の軌跡と前記第2の軌跡の間に指示的関係が存在する、映像解析システム。
  17. 前記プロセッサは、前記複数の軌跡から、静的区間と動的区間を持った1組の軌跡を判定し、該1組の軌跡から前記第1の軌跡および前記第2の軌跡を判定する、請求項16のデータ処理システム。
  18. 前記プロセッサは、
    前記映像シーケンスの各フレームにおける注目点を識別し;
    前記第1のフレーム以外の各フレームについて、前記映像シーケンスの前フレームにおける注目点に対応する少なくとも1つの注目点を判定し;
    前記第1のフレーム内の注目点について複数の軌跡を構築し、各軌跡は前記映像シーケンスにおける少なくとも1つの前記次フレームおよび前記第1のフレームにおける位置を含み、前記第1のフレーム内の前記位置は前記第1のフレーム内の前記注目点の位置であり、前記少なくとも1つの次フレームは、前記シーケンスの次フレームの各々を連続的に検討することにより判定され、少なくとも1つの軌跡は前フレームに伸び、その軌跡において、前フレームにおいて該軌跡に含まれる注目点に対応する注目点の位置を含んでおり、
    前記複数の軌跡は、前記第1のフレーム内の前記注目点についての複数の軌跡を含む、請求項16または17の映像解析システム。
  19. 前記フレームにおいて前記注目点を表わすノードと、各フレームについて前記少なくとも1つの注目点を前記の前フレーム内で対応する前記注目点につなぐ、少なくとも1つのエッジを含む非循環グラフのためのストレージをさらに具備する、請求項18の映像解析システム。
  20. ランダム森分類器のためのストレージをさらに具備し、前記プロセッサは、前記第1および第2の軌跡を分類するのに前記ランダム森分類器を用いる、請求項16〜19のいずれかの映像解析システム。
JP2012523371A 2009-08-06 2009-08-06 ビデオ映像の監視 Expired - Fee Related JP5634517B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/GB2009/001932 WO2011015800A1 (en) 2009-08-06 2009-08-06 Correlated probabilistic trajectories pedestrian motion detection using a decision forest

Publications (2)

Publication Number Publication Date
JP2013501288A true JP2013501288A (ja) 2013-01-10
JP5634517B2 JP5634517B2 (ja) 2014-12-03

Family

ID=42112158

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012523371A Expired - Fee Related JP5634517B2 (ja) 2009-08-06 2009-08-06 ビデオ映像の監視

Country Status (4)

Country Link
US (1) US8811666B2 (ja)
JP (1) JP5634517B2 (ja)
GB (1) GB2488445A (ja)
WO (1) WO2011015800A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021012692A (ja) * 2019-07-04 2021-02-04 アークソフト コーポレイション リミテッドArcSoft Corporation Limited 物体識別方法、システム及び電子機器

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2485733A (en) * 2009-08-06 2012-05-23 Toshiba Res Europ Ltd Correlated probabilistic trajectories pedestrian motion detection using a decision forest
AU2011265430B2 (en) * 2011-12-21 2015-03-19 Canon Kabushiki Kaisha 3D reconstruction of partially unobserved trajectory
US9245204B2 (en) * 2012-01-02 2016-01-26 Telecom Italia S.P.A. Method and system for comparing images
KR101901958B1 (ko) * 2012-03-26 2018-11-08 한국전자통신연구원 휴리스틱 함수의 학습을 이용한 고속 경로를 탐색을 위한 장치 및 그 방법
CN103425967B (zh) * 2013-07-21 2016-06-01 浙江大学 一种基于行人检测和跟踪的人流监控方法
GB201408795D0 (en) * 2014-05-19 2014-07-02 Mccormack Owen System and method for determining demographic information
US9684830B2 (en) * 2014-11-14 2017-06-20 Intel Corporation Automatic target selection for multi-target object tracking
CN108090916B (zh) * 2017-12-21 2019-05-07 百度在线网络技术(北京)有限公司 用于跟踪视频中的目标图形的方法和装置
CN109657703B (zh) * 2018-11-26 2023-04-07 浙江大学城市学院 基于时空数据轨迹特征的人群分类方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002099918A (ja) * 2000-09-12 2002-04-05 Internatl Business Mach Corp <Ibm> 画像処理方法、画像処理システムおよび記録媒体
JP2008009914A (ja) * 2006-06-30 2008-01-17 Canon Inc 画像処理装置、画像処理方法、プログラム、記憶媒体

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6683968B1 (en) * 1999-09-16 2004-01-27 Hewlett-Packard Development Company, L.P. Method for visual tracking using switching linear dynamic system models
US8103109B2 (en) * 2007-06-19 2012-01-24 Microsoft Corporation Recognizing hand poses and/or object classes
WO2012014430A1 (ja) * 2010-07-27 2012-02-02 パナソニック株式会社 移動体検出装置および移動体検出方法
US8335350B2 (en) * 2011-02-24 2012-12-18 Eastman Kodak Company Extracting motion information from digital video sequences

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002099918A (ja) * 2000-09-12 2002-04-05 Internatl Business Mach Corp <Ibm> 画像処理方法、画像処理システムおよび記録媒体
JP2008009914A (ja) * 2006-06-30 2008-01-17 Canon Inc 画像処理装置、画像処理方法、プログラム、記憶媒体

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
FRANK PERBET,外2名, "CORRELATED PROBABILISTIC TRAJECTORIES FOR PEDESTRIAN MOTION DETECTION",[ONLINE], JPN7013003916, 17 July 2009 (2009-07-17), ISSN: 0002663264 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021012692A (ja) * 2019-07-04 2021-02-04 アークソフト コーポレイション リミテッドArcSoft Corporation Limited 物体識別方法、システム及び電子機器
JP7086138B2 (ja) 2019-07-04 2022-06-17 アークソフト コーポレイション リミテッド 物体識別方法、システム及び電子機器

Also Published As

Publication number Publication date
GB2488445A (en) 2012-08-29
US8811666B2 (en) 2014-08-19
JP5634517B2 (ja) 2014-12-03
US20120219184A1 (en) 2012-08-30
WO2011015800A1 (en) 2011-02-10
GB201203951D0 (en) 2012-04-18

Similar Documents

Publication Publication Date Title
JP5634517B2 (ja) ビデオ映像の監視
Shen et al. Multiobject tracking by submodular optimization
JP2013501289A (ja) 画像解析方法
CN110782483B (zh) 基于分布式相机网络的多视图多目标跟踪方法及系统
Jafari et al. Real-time RGB-D based people detection and tracking for mobile robots and head-worn cameras
Nguyen et al. Fast occluded object tracking by a robust appearance filter
JP4782901B2 (ja) 移動体検出装置および移動体検出方法
Benedek 3D people surveillance on range data sequences of a rotating Lidar
KR100601933B1 (ko) 사람검출방법 및 장치와 이를 이용한 사생활 보호방법 및 시스템
KR100612858B1 (ko) 로봇을 이용하여 사람을 추적하는 방법 및 장치
Le et al. Long-term time-sensitive costs for crf-based tracking by detection
US20120269384A1 (en) Object Detection in Depth Images
Sun et al. Moving foreground object detection via robust SIFT trajectories
Liciotti et al. People detection and tracking from an RGB-D camera in top-view configuration: review of challenges and applications
CN113326835A (zh) 一种动作检测方法、装置、终端设备和存储介质
Chamveha et al. Head direction estimation from low resolution images with scene adaptation
Manikandan et al. Human object detection and tracking using background subtraction for sports applications
Guclu et al. Integrating global and local image features for enhanced loop closure detection in RGB-D SLAM systems
CN112308921A (zh) 一种基于语义和几何的联合优化动态slam方法
Kadim et al. Deep-learning based single object tracker for night surveillance.
Albu et al. Generic temporal segmentation of cyclic human motion
Nguyen et al. 3d pedestrian tracking using local structure constraints
Farazi et al. Real-time visual tracking and identification for a team of homogeneous humanoid robots
JP5241687B2 (ja) 物体検出装置及び物体検出プログラム
Ukita et al. High-order framewise smoothness-constrained globally-optimal tracking

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20131029

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20131205

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20131212

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20131219

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20131226

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140106

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20140109

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140318

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140516

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140916

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20141014

LAPS Cancellation because of no payment of annual fees