JP2013501289A - 画像解析方法 - Google Patents

画像解析方法 Download PDF

Info

Publication number
JP2013501289A
JP2013501289A JP2012523372A JP2012523372A JP2013501289A JP 2013501289 A JP2013501289 A JP 2013501289A JP 2012523372 A JP2012523372 A JP 2012523372A JP 2012523372 A JP2012523372 A JP 2012523372A JP 2013501289 A JP2013501289 A JP 2013501289A
Authority
JP
Japan
Prior art keywords
frame
interest
point
trajectories
trajectory
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2012523372A
Other languages
English (en)
Inventor
パーベット、フランク
淳人 牧
ステンガー、ビョルン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Publication of JP2013501289A publication Critical patent/JP2013501289A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • G06T7/277Analysis of motion involving stochastic approaches, e.g. using Kalman filters
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • G06T7/246Analysis of motion using feature-based methods, e.g. the tracking of corners or segments

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)

Abstract

固有パターンと比較することにより移動特徴の動きを映像シーケンスにおいて認識する。映像シーケンスのフレーム対における空間的な一致点を識別することにより、映像シーケンスを通して起こり得る物体の軌跡を生成する。固有パターンを検出する際には、複数の起こり得る軌跡を分析する。この起こり得る軌跡を、分析に適するように選択してもよい。これは、分析がより簡単になる長い軌跡を選択することを含む。このことは、追跡している物体が一時的に別の物体の背後となる場合に、連続的な軌跡が生成されることを意味する。

Description

この発明は映像解析に関し、より具体的には、動きに基づく映像内の移動特徴の認識に関する。
映像内で人々のような移動特徴を認識するいくつかの応用がある。例えば、歩行者認識を自動車の自動ブレーキシステムの制御に利用することができる。
映像内の移動特徴を認識するためには、映像フレームを通して特徴の動きを判定しなければならず、この動きは、当該特徴について期待される動きと比較される。
特徴の動きまたは軌跡は、映像の複数フレームの各々における特徴の位置と見なすことができる。より長い軌跡を利用可能な場合、より正確な認識結果を得ることができる。オクルージョンによって、映像フレーム内のいくつかの特徴が不明瞭になる場合がある。これは、そのような特徴について返される軌跡の長さを制限することがある。フレーム間の特徴マッチングにおいてエラーが発生することもある。これについても、特徴の軌跡の長さを制限し得る。
特徴について期待される動きの特性を選択することには課題がある。正確な分類を可能にする動きの特性は、特徴の存在有無がはっきり区別される場合の特性である。
本発明は、上述の問題に対処することを目的とする。
本発明の態様によれば、映像内の移動特徴シーケンスを認識する方法が提供される。移動特徴は、映像シーケンス上の特徴的な動きのパターンを持つ。映像シーケンスは、第1のフレームおよび複数の次フレームを含む。
該方法は、映像シーケンスの各フレームに注目点を置くことを含む。注目点は、移動特徴に対応する可能性がある。第1のフレーム内の特徴について軌跡を構築するために、次フレームとそれに先行するフレームにおける注目点の間の対応が判定される。1つのフレームにおける所与の注目点について、対応する次フレームにおける2以上の注目点が用いられる場合がある。注目点の対応を用いることにより、第1のフレーム内の注目点の軌跡が構築される。フレーム間の注目点間に複数の対応が存在する可能性から、第1のフレーム内の注目点について2以上の起こり得る軌跡が検出され得る。
第1のフレーム内の注目点の複数の軌跡がひとたび構築されると、これらは特徴的な動きのパターンと比較される。この比較に基づいて、第1のフレーム内の特徴を認識することができる。
本方法は、フレーム間の注目点マッチングの柔軟性を許容する。複数の軌跡のうちのいくつかは、全フレームにわたって同じ物理的特徴を追跡しないかもしれない。しかしながら、他の軌跡と比べて、そのような軌跡が固有パターンを持つ可能性は低く、これは、固有パターンの比較が行われる際に除外される。このような柔軟性は、物体がオクルージョンによって不明瞭になる場合、当該物体が不明瞭となるフレームからでさえも軌跡を常に生成できることから有利に働く。また、フレーム対にまたがり物体の2以上の空間的な一致がある場合、これらはすべて複数の軌跡に含めてもよい。
第1のフレームは、映像シーケンスの開始あるいは終了のいずれかとすることができる。
本発明の実施形態によれば、映像シーケンスをフレームの重複対のシーケンスとみなすことにより、フレーム間で注目点のマッチングをする。各フレーム対において、この対の第2のフレーム内の1組の注目点の各々が、この対の第1のフレーム内の注目点の同じ特徴に一致する確率を計算する。
本発明の実施形態によれば、異なるフレームにおける2つの注目点が同じ特徴に一致する確率は、注目点間の空間距離あるいは注目点間のアピアランス類似性に基づく。
本発明の実施形態によれば、フレームにおいて注目点を表わすノードと、後続フレームにおいて同じ特徴に対応する注目点をつなぐエッジとを持つ非循環グラフを構築し、該グラフをトラバースすることにより、複数の軌跡が判定される。
本発明の実施形態によれば、非循環グラフをトラバースすることは、増補確率に基づいて、各ノードでエッジの確率的な選択を行なうことを含む。増補確率は、軌跡のトレース可能な深さに依存する係数を含むことができる。この係数は、指示的関係が存在するかどうかをより確実に判定しやすい長い軌跡に対して有利に働くのを可能にする。増補確率は、速度のような物理的特性の保存に基づいた係数を含んでもよい。これは、対象物に見込まれた特性を持っている軌跡に対して有利に働くことを可能にし、非物質的な軌跡を除外することを可能にする。
本発明の実施形態によれば、軌跡は、ランダム決定森を用いて固有パターンと比較される。
本発明の実施形態によれば、固有パターンは、複数の軌跡からの2つの軌跡の間の相関である。
本発明の実施形態によって、軌跡は、軌跡対の間に存在し得る相関に基づいて分析され、分類される。
固有の動きは、歩行の動きであってもよい。歩いている歩行者の二本の足の動きの間には、いくつかの相関がある。
本発明の実施形態によれば、軌跡対を構築する第1および第2の軌跡は、静的区間と動的区間を持つ。軌跡対を分類するのに用いられる軌跡対間の指示的関係は、第1の軌跡の静的区間は、第2の軌跡の動的区間と一致するということである。
この分析によれば、歩いている歩行者の足の軌跡が静的区間と動的区間を持つことから歩行者を検出することができる。歩行者の立っている方の足は地面に対して静止しており、したがって静的である。歩行者のもう一方の足は地面に対して移動する。したがって動的区間にあるとみなすことができる。歩行者が歩くと、一方の足が静的区間である場合、他方の足は動的区間であり、各足は静的区間と動的区間を交互に繰り返す。
本発明の実施形態によれば、第1および第2の軌跡の間の指示的関係は、軌跡対の動きの方向の間の相関である。
歩行者の足の動きは、その歩行者が歩いている方向とほぼ平行になることが見込まれる。これは、歩行者の両足に関連する可能性のある軌跡対を識別することに用いることができる。
本発明の実施形態によれば、第1および第2の軌跡の動きの方向の相関は、第1の軌跡が第2の軌跡と実質的に平行であることを含んでいる。
本発明の態様によれば、本発明に従う方法をコンピューターに実行させる命令を伝えるコンピューター可読媒体が提供される。
本発明の態様によれば、映像内の移動特徴を認識するための映像解析システムが提供される。
発明の実施形態を以下の図面を参照しながら説明する。
図1はデータ処理システムのブロック図である。 図2は映像内の移動特徴を認識する方法のフローチャートである。 図3はフレーム間で起こり得る軌跡のトレース図である。 図4は映像シーケンスにおいて対象を追跡する方法を示すフローチャートである。 図5は後のフレームの注目点との空間的な一致として分析されるフレームの注目点を示す図である。 図6は特徴の確率的な軌跡を生成するのに用いられる非循環グラフを示す図である。 図7は歩行者が歩く際の動きの固有パターンを複数の軌跡から識別する方法を示す図である。 図8は軌跡が足に関連するものであるか否かをランダム森分類器を用いて分類する方法を示す図である。 図8Aは速度ベクトル対の例を示す図である。 図9はランダム決定森を示す図である。 図10はランダム決定森からの決定木を示す図である。 図11は2つの軌跡の動きの方向の相関に基づく関数を計算する方法を示す図である。 図11Aは軌跡およびその一次の方向ベクトルの例を示す図である。 図12は、2つの軌跡の動きの位相の時間的な相関に基づく関数を計算する方法を示すである。
図1は、映像内の移動特徴を認識するためのデータ処理システム100を示している。データ処理システム100は、プロセッサ102、メモリ104、入力モジュール108および出力モジュール110を含む。メモリ104は、映像内の移動特徴を認識するためのプログラム106を記憶する。プログラム106は、プロセッサ102上で実行することができる。入力モジュール108は、映像シーケンスにおける移動特徴を認識する分析のために該映像シーケンスの入力を受け取ることができ、また、出力モジュール110は、その分析の結果を出力することができる。入力モジュール108は、ビデオカメラまたはビデオレコーダーからの映像データを受信することができるデータ接続でもよい。入力モジュール108は、インターネットのようなネットワーク上の映像データを受信することができるネットワーク接続でもよい。データ処理システム100は、従来のコンピューターでもよい。以下、プログラム106によって行なわれる方法を説明する。
図2は、映像内の移動特徴を認識する方法のフローチャートを示す。映像は、フレームのシーケンスから構成される。各々のフレームは、同時に1組の特徴を表現する。映像が再生される場合、映像内の特徴の動きは、該映像の連続フレーム上でのそれらの位置の変化に反映される。したがって、映像中の特徴の軌跡は、映像シーケンス上の各フレーム内の位置と見なすことが可能である。特徴の軌跡を、物体の見込まれる動きと比較することにより、物体に対応するものとして特徴を認識することができる。例えば、映像中に現れる、歩いている人の足は、固有の動きのパターンを持つ。足が地面に接している時、歩行者のその足は固定区間を持ち、足が地面に対して移動している時、その足は移動区間を持つ。また、歩行者の足の歩行の動きには相関性がある。一方の足が静止している時、他方の足は動いている。映像内の特徴の動きを、足の動きのような予期される固有のパターンと比較することによって、足のような特徴を映像において識別することができ、したがって、歩行者を識別することができる。
映像内の移動特徴を認識するには、映像のフレームについての特徴の軌跡が必要である。映像内の物体の軌跡を追跡するには、映像フレームにおいてその物体の位置を識別することが必要である。したがって、対処すべき2つの問題がある。物体の位置を各フレームにおいて識別しなければならない。また、追跡するフレームにおいて同じ物体を識別しなければならない。
方法のステップS100は、映像シーケンスの各フレームに注目点を置くことを含んでいる。シーケンスの2以上のフレームで起こりうる一定の特徴を示す個々のフレームの空間的ピクセルパターンを検出する。例えば、第1ステップが、各フレームのコーナーを発見することを含んでもよい。
映像内の特徴の軌跡を検出するために、ステップS101において、直接先行するフレームにおける特徴に対応する注目点が判定される。
ステップS102では、シーケンスの第1のフレーム内の所与の注目点について、1組の起こり得る軌跡を生成する。注目点について起こり得る最も一般的な軌跡の組は、次フレームにおいて識別される注目点のうちのいずれかの次フレームにおける位置を含む。フレームの外部や、フレーム内の別の物体の背後、つまり当該フレームにおいて示されない位置に通じる軌跡とすることも可能である。
起こり得る軌跡の組は、フレーム対を考慮し、該フレーム対における空間的なマッチング(matching)注目点を識別することにより判定する。マッチング注目点の対は、マッチングスコアを計算することにより識別する。マッチングスコアについては、注目点位置の間の空間距離および注目点のアピアランスの類似性のような要因を考慮する。これは、2フレーム以内で似たような位置および/または類似のアピアランスを持つ注目点を識別することにより達成することができる。空間的なフレームのマッチング対から、フレームシーケンスを通して該マッチング対をトレースすることにより、起こり得る軌跡を構築する。
映像シーケンスの第1のフレーム内の物体について起こり得る軌跡の組は、第2の後続するフレーム内の多数の注目点を含んでもよい。起こり得る軌跡の組を、物体の軌跡が従うものと予期されるパターンに基づく制約を実行することによって絞り込む。これは、例えば物体の速度保存のような物理法則とすることができる。
起こり得る軌跡の数を絞り込んだ時点で、軌跡が更なる処理に必要な場合、起こりそうな軌跡の確率的な選択を行う。結果として生ずる軌跡は、例えばジェスチャ認識アルゴリズムにおける更なる処理において用いられる。確率的な選択が繰り返される場合、選択された軌跡は相違しうることに留意されたい。
次にステップS103内において、軌跡を固有の動きのパターンと比較する。
図3は、フレーム間の起こり得る軌跡のトレース図を示している。図3において一番上のフレームは最近のフレームであり、また、時間的に前のフレームは最近のフレームの下に示される。入力シーケンスの各フレームにおいて、いくつかの注目点が見つかる。隣のフレームの注目点との間であり得る対応はリンクによって示される。
図4は、映像シーケンス内の対象を追跡する方法を示すフローチャートである。例えば、映像シーケンスは、解像度1280×720ピクセルで60フレーム/秒の350フレームとする。図4に示す方法では、映像シーケンスのフレームにおけるコーナー検出により特徴を追跡する。図1に示されるデータ処理システム100を参照しながら、この方法について説明する。ステップS1において、映像シーケンスの各フレームから注目点を抽出する。各フレームのコーナーを検出するために、ハリス・コーナー検出器が用いられる。各フレームにおける注目点の位置は、メモリ104のセクションに記憶される。ハリス・コーナー検出器は、画像の領域を考慮し、これをわずかにシフトし、その領域を当該画像の重複領域と比較することにより、画像内のコーナーの位置を検出する。ハリス・コーナー検出器は、プログラム106の一部として実装される。すべての方向で重複領域の変化があるところにコーナーは位置する。ハリス・コーナー検出器については、「C. Harris and M. Stephens, 'A Combined Corner and Edge Detector', Proc. Forth Alvey Vision Conference, pages 147-151, 1988」に記載されている。
時点tのフレームにおける注目点をp(t)と表す。ここで、i=1,...,nは、注目点のインデックスである。フレームtにおける注目点p(t)の二次元位置はx(t)である。
ステップS2では、諸フレームの注目点間の一致(match)を判定する。一フレームの各注目点について、空間的な祖先である前フレームの注目点が識別される。この識別は、現フレームで検討しているコーナーの一定範囲内に存在する前フレームの注目点を分析することにより行う。
図5は、時間tのフレームにおける注目点p(t)の空間的な一致であるとして分析される時間t−1のフレームにおける注目点p(t−1)を示す。フレームtにおける注目点p(t)の位置x(t)の範囲R内において位置x(t−1)を持つ注目点p(t−1)を分析する。範囲Rの外側の位置x’(t−1)を持つ注目点p’(t−1)は、注目点p(t)との空間的な一致とされることはない。
各注目点対について、時間的なマッチングスコアを計算する。時間的なマッチングスコアは、前フレームにおける注目点と現フレームにおける注目点とを一致させる。
時間的なマッチングスコアは2つの注目点のアピアランス類似性およびそれらの空間距離に基づく。
時点tのフレームにおける注目点p(t)と、時点t−1の前フレームにおける注目点p(t−1)の間の時間的なマッチングスコアをPij(p(t),p(t−1))と表す。これは、次式によって計算することができる。
Figure 2013501289
ここで、Sijは、注目点p(t)と注目点p(t−1)の間のアピアランス類似である。アピアランス類似は、それぞれのフレーム中の注目点周囲の局所画像領域から計算される。
これは、局所画像領域間の絶対差の正規化平均の和として計算される。Dijは、注目点間の空間距離であり、次式から計算される。
Figure 2013501289
空間的な一致は、時間的なマッチングスコアPijに基づいて識別される。2進値Eij(t)は、時点tのフレームにおける注目点p(t)と時点t−1の前フレームにおける注目点p(t−1)の間の空間的な一致の各々に関連付けられる。空間的な一致は、現フレームにおける所与のコーナーの時間的なマッチングスコアの最高値として選択してもよい。あるいは、最大値のしきい値範囲内で時間的なマッチングスコアを持つ一致をすべて空間的な一致として選択してもよい。したがって、
Figure 2013501289
のいずれかについて、Eij(t)=1である。ここで、eはしきい値である。
処理を逆に考えても空間的な一致は判定される。前フレームの各注目点について、時間的なマッチングスコアが現フレームの注目点について計算される。
ステップS3では、2つのフレーム間の一致総数を制限する。これは、一致数を単に一定に維持すればよい。フレーム対間の一致数が一定となるように、しきい値eは動的に調整してもよい。フレーム間の一致総数4nは、一致の固定数として適切な定数であることが分かった。これらは最も高い時間的なマッチングスコアを持ったものとして選択されている。これにより、コーナーの最大マッチングスコアが低い値である場合に、一致がないコーナーが結果として生じるかも知れない。
ステップS3の後に、シーケンスの各フレームにおけるいくつかの注目点と、フレーム間の注目点のアクティブな一致の組を入手することができ、確率的な軌跡抽出のためのグラフを構築することができる。
このグラフをステップS4において構築する。各フレームtに対して、1組の注目点p(t)がある。また、時間的に隣接するフレーム間において、時点tのフレームと時点t−1のフレームの注目点との間に1組の一致Eij(t)がある。これらはグラフG(N,E)を構築するのに用いられる。グラフNのノードは、前フレームにおいて一致した注目点を表わし、エッジ(E)は、注目点間の一致を表わす。このグラフは、映像シーケンスの最終フレームに注目点の各々のルートノードを定めることによって構築される。当該注目点から前フレームにおける注目点へのエッジがアクティブな一致のそれぞれについて加えられる。ノードは、前フレームで一致した注目点について定められる。この処理を、当該シーケンスの最終フレームに先行するフレームからのアクティブな一致について繰り返し、以下の図6に示すような非循環グラフが生成される。これは、確率的な軌跡を生成するのに用いることができる。このグラフは、T個のフレームについて構築される。各エッジEij(t)には、その重み係数としてp(t)が与えられる。
エッジのトレース可能な深さ、すなわち、グラフにおいて特徴点p(t)の空間的な祖先を持つフレームの数をd[Eij(t)]と表記する。グラフG(N,E)を表わすデータはメモリ104に記憶される。データは、N個のノードの各々のx(t)に対する値、各エッジEij(t)に対するPij(t)およびd[Eij(t)]の値として記憶される。
ステップS5において、この非周期グラフをトラバースすることにより軌跡を生成する。トラバースはいずれかのルートノードから開始する。また、エッジの確率的な選択を行う。この処理を各ノードで繰り返す。確率的な選択は、増補確率に基づいて行う。この増補確率は、マッチングスコアから計算され、トレース可能な深さおよび速度保存係数を考慮するための係数を含んでいる。
増補確率、あるいはサンプリング確率P’ij(p(t),p(t−1))は、次式から与えられる。
Figure 2013501289
ここで、γとδは正の重み係数である。また、Vijは次式から与えられる速度保存係数である。
Figure 2013501289
上記速度保存係数の式は、問題のフレームx(T)における注目点の位置、前フレームx(T−1)内の軌跡における注目点の位置、および軌跡X(T+1)内で次の点と見なされている注目点の位置を考慮に入れる。
トレース可能な深さに依存する係数を含んだ増補確率を使用することは、長い軌跡を支持することを意味する。長い軌跡は、短い軌跡より利用価値が高い場合が多い。また速度保存係数は、検討中のフレームに至るまで軌跡内の物体の速度を保存する特徴点間のリンクを支持することを意味する。これにより、非循環グラフをトラバースする場合、物理的特徴の動きに対応する可能性がありそうな滑らかな軌跡を確実にたどることができる。
非循環グラフは、最終フレームの特徴点に対応する物体について複数の確率的な軌跡を生成するために複数回にわたりトラバースすることができる。生成される軌跡は相違するものとなり、このため少なくともいくつかのものは正確ではない。しかしながら、連続するフレームの対応に関して不確実性がある場合であっても可能性のある軌跡を許容することにより、シーケンスの一部においてオクルージョンにより物体が不明瞭になる場合であっても比較的長いフレームシーケンスの軌跡を得ることができる。
一の物体についての複数の軌跡は、例えば、特定の固有の動きを持つ映像シーケンス内の特徴を検出するパターン認識アルゴリズムに有用である。この場合、シーケンスの最終フレームにおける各注目点について、複数の起こり得る軌跡を検査し、特定の固有の動きを持つものについてすべての起こり得る軌跡を検査すると効果的であるかもしれない。非循環グラフを用いて複数の起こり得る軌跡を生成することは、上記の応用に特に適している。
非循環グラフのトラバースの後、確率的な軌跡X(t)=[x(t),x(t−1),...x(t−T+1)]をメモリ104に記憶する。これは、この軌跡に属する点のフレーム内の位置の集合を表わす。
図6は、上述した方法を用いて特徴の確率的な軌跡を生成するのに用いられる非循環グラフを示している。最近のフレームにおける注目点は、グラフの一番上のノードとして示される。これら注目点は、1組のエッジによって前フレームにおける注目点に連結される。時間的なマッチングスコアが、時間的に隣接するフレームにおいて注目点を表わすノードをつなぐ各エッジに関連付けられる。
注目点のグラフから軌跡を抽出するために、各ノードにおいて、そのノードを前のフレームにおいて注目点を表わすノードに接続しているエッジのうちの1つが選択される。
歩行者の歩行の動きを識別するために、軌跡を固有のパターンと比較するステップは、空間的に歩行者に一方の足に関する特徴を識別すること、および、歩行者の2本の足に対応する動きに相関を持つ特徴の対を検出することを含んでいる。これについて図7を参照して述べる。
図7は、複数の軌跡から、歩行者の歩行の動きの固有のパターンを識別する方法を示している。
ステップS601において、候補軌跡を識別する。軌跡が空間的に足に関係するかどうか判断するために、およそ1つの歩行周期の軌跡の動きが分析される。軌跡が足の位置に対応する注目点に関連している場合、歩行周期内で移動区間および固定区間を持つことが期待される。したがって、ステップS601において、一の歩行周期内で動的区間および固定区間を持つものが候補軌跡として識別される。
候補軌跡が識別されると、関連する候補軌跡対をステップS602において検出する。歩いている歩行者については、二本の足の動きは相関することが期待される。この相関は、時間的かつ空間的である。相関の時間的な態様は、歩いている歩行者の一方の足が固定区間にある場合、他方の足は動的区間にあることが期待されるということである。二本の足の空間的な位置もまた相関を持つことが予期される。これらの相関に加えて、歩行者の足の動きの方向についても相関があることが期待される。歩いている人の二本の足の軌跡は、歩行者が歩いている方向においてほぼ平行であることが期待される。上記の相関を持っている候補軌跡対を識別することによって、映像シーケンスにおいて歩行者の足に関係する注目点の動きから歩行者が識別される。
足に関連するものであるか足に関連するものでないかによって軌跡を分類し、ステップS601において候補軌跡を識別するには、ランダム森分類器を用いることができる。
足に関連するものであるか否か軌跡を分類するのにランダム森分類器を用いる方法を図8に示す。ステップS701において、軌跡を標準形に変換する。軌跡を標準形に変換することは、軌跡の角度のような係数、軌跡に関係しうる歩行者の速度、歩行者のステップの幅および相を説明することを意味する。標準形への変換は、カメラの動きのような線運動の削減、およびステップ振幅のような軌跡の正規化態様を含んでもよい。
軌跡の標準形は、次のように表記される。
Figure 2013501289
ステップS702において、特徴ベクトルvおよびvを軌跡の標準形から生成する。これらの特徴ベクトルは、4つの時点t,t,tおよびtを任意に選択し、それらの位置で軌跡を5つのセクションにカットすることで生成される。特徴ベクトルは、次式から与えられる。
Figure 2013501289
図8Aは、速度ベクトル対の例を示している。特徴を計算するために、多数の速度ベクトル対がサンプリングされる。
ステップS703において、特徴fおよびfを特徴ベクトルおよびランダムに選択した変数から計算する。この特徴は、次のように距離および2つのベクトルvおよびvの内積として計算される。
Figure 2013501289
ここで、a、a、bおよびbは0と1の間の値をとる任意の係数である。
カット点t、t、t、tおよび係数a、a、b、bについて異なる値を用いることにより、fとfの多数のバリエーションを作ることができる。
ステップS704において、ランダム決定森を用いることにより、足に関連するものであるか足に関連しないものであるかに軌跡を分類する。
図9は、ランダム決定森800を示している。ランダム決定森800は、8本の決定木810、820、830、840、850、860、870、880を持つ。各軌跡は、全部で8本の木を用いて分類される。木の各分岐点においてパラメーターt、t、t、t、a、a、bおよびbを用いてfとfの関数が計算される。この関数の値に基づいて、左の枝と右の枝のどちらをたどるかの判定がなされる。左と右の枝のどちらを選ぶかの選択に用いられるしきい値θの値は、足/非足の分散の情報増加が最大となるように選定される。
図10は、図9に示した決定森800から取り出した決定木810を示している。決定木902の各ノードにおいて、当該木をトラバースする場合、軌跡が当該ノードに達する条件つき確率を2本の縦線の高さで示す。決定木810のルートノード902において、この点の特徴は足であるか否かの情報がないことから、足の特徴904に関する軌跡の縦線と、非足の特徴906に関する軌跡の縦線は等しい。この木のトラバースの際に、fとfの関数値が計算され、問題の軌跡についてのこれら値に基づいて、左の枝のノード910または右の枝のノード908のいずれかに到達する。トラバースは継続し、各分岐点で異なる関数の値が計算される。葉ノード(例えば920)に到達すると、木810からの条件つき確率は、決定森における他の木からの条件つき確率と結合され、この確率に基づいて、軌跡は、足あるいは非足のどちらかに分類される。
ランダム森は、各分岐点について、パラメーターt、t、t、t、a、a、bおよびb、関数fおよびf、各分岐点のしきい値θに関する一連の値として記憶される。これらの値はメモリ104に記憶する。これらは、手動で映像シーケンスの特徴に注釈を付与し、関数fおよびfの値を計算し、最大の情報利得を与えるしきい値θに対する値を選択することにより、プログラム106の実行に先立って計算される。
足の候補軌跡が識別されると、これらを分析し、同一歩行者について相関する足の組を検出する。この分析についても、上述と同様の方法でランダム決定森を用いて行う。ランダム決定森において木をトラバースする場合に判定を下すのに用いられる関数は、検討中の2つの軌跡の動きの方向の相関、および軌跡における動きの移動区間と固定区間の相関に基づいて計算される。
図11は、2つの軌跡X(t)およびX(t)の動きの方向の相関に基づく関数を計算する方法を示している。ステップS1001において、各軌跡の動きの方向を検出する。軌跡X(t)の動きの方向は、位置x(T)の集合T=t...t−T+1の分散行列を計算し、分散行列の最大固有値に対応する固有ベクトルξを計算することにより検出される。したがって、ξは、X(t)の一次の方向を表わす。第2の軌跡X(t)の一次の方向ξも同様に計算される。
図11Aは、軌跡X(t)および一次の方向ベクトルξの例を示している。
ステップS1002において、2つの軌跡に関連している時点tのフレームにおける注目点の位置x(t)およびX(t)に基づいて、該2つの軌跡について歩行方向のベクトルxiu(t)を計算する。
Figure 2013501289
ステップS1003において、互いの動きの方向の内積および歩行の方向によりコンシステンシーcを計算する。
Figure 2013501289
コンシステンシーは、歩行者の足の移動方向がほぼ平行になること、および、これらの方向は歩行の歩行方向とほぼ平行になることが見込まれるという事実を利用するものである。
ステップS1004において、コンシステンシーに基づいた関数fおよびランダムベクトルΦを計算する。
Figure 2013501289
図12は、検討中の2つの軌跡X(t)およびX(t)の動きの位相の時間的な相関に基づいて関数を計算する方法を示している。
ステップS1101において、軌跡の速度ベクトルY(t)を計算する。
Figure 2013501289
ここで、T=t,...t−T+2について、y(T)=x(T)−x(T−1)である。
ステップS1102において、修正した速度ベクトルを計算する。次式すなわち
Figure 2013501289
を用いることにより、一定のカメラモーションを相殺することができる。修正された速度ベクトルは次式を用いて生成される。
Figure 2013501289
ステップS1103において、修正された速度ベクトルを固定のカット点でl個の部分にカットする。そしてステップS1104において、カットされ修正された速度ベクトルの内積に基づくベクトルを計算する。
Figure 2013501289
最後にステップS1105において、このベクトルおよびランダムベクトルに基づいた関数を計算する。
Figure 2013501289
両足に関連するものであるか否かに軌跡対を分類するために、別のランダム決定森が用いられる。決定森の結果として、同じ両足に関連する多数の軌跡対が生ずるかも知れない。主要クラスターを検出するためにmean-shiftアルゴリズムが用いられ、最も起こりそうなクラスターの平均が最終結果になる。

Claims (20)

  1. 映像シーケンス内の移動特徴を認識する方法であって、前記移動特徴は前記映像シーケンス上の固有パターンを持ち、前記映像シーケンスは第1のフレームおよび複数の次フレームを含み、該方法は、
    前記映像シーケンスの各フレームにおける注目点を識別すること;
    前記第1のフレーム以外の各フレームについて、前記映像シーケンスの前フレームにおける注目点に対応する少なくとも1つの注目点を判定すること;
    前記第1のフレーム内の注目点について複数の軌跡を構築することであって、各軌跡は前記映像シーケンスにおける少なくとも1つの前記次フレームおよび前記第1のフレームにおける位置を含み、前記第1のフレーム内の前記位置は前記第1のフレーム内の前記注目点の位置であり、前記少なくとも1つの次フレームは、前記シーケンスの次フレームの各々を連続的に検討することにより判定され、少なくとも1つの軌跡は前フレームに伸び、その軌跡において、前フレームにおいて該軌跡に含まれる注目点に対応する注目点の位置を含むこと;および
    前記複数の軌跡を前記固有パターンと比較すること、を含む方法。
  2. 前記第1のフレーム以外の各フレームについて、前記映像シーケンスの前フレームにおける注目点に対応する少なくとも1つの注目点を判定することは、
    前記映像シーケンスをフレームの重複対のシーケンスとみなすこと、ここで、各フレーム対は第1のフレームおよび第2のフレームを持ち、前記フレーム対は、前記第2のフレームが前記シーケンス内の次のフレーム対の第1のフレームとなるように重複し;
    各フレーム対について、フレーム対の前記第2のフレームにおける複数の注目点の各々が、前記フレーム対内の第1のフレーム内の注目点と同じ特徴に対応する確率を計算すること;および
    各フレーム対について、前記映像シーケンスの前フレームにおける注目点に対応する少なくとも1つの注目点を、前記対の前記確率に基いて選択すること、を含む請求項1の方法。
  3. フレーム対の前記第2のフレーム内の複数の注目点の各々が前記フレーム対における前記第1のフレーム内の注目点と同じ特徴に一致する前記確率は、前記第2のフレーム内の注目点と前記第1のフレーム内の注目点の間の空間距離および/または類似性に基づく、請求項2の方法。
  4. 前記第1のフレーム内の注目点について複数の軌跡を構築することは、フレームにおいて注目点を表わすノードと、後続フレームにおいて同じ特徴に対応する注目点をつなぐエッジとを持つ非循環グラフを構築し、該グラフをトラバースすることにより複数の軌跡を判定すること、を含む上記請求項のいずれかの方法。
  5. 前記非循環グラフをトラバースすることは、増補確率に基づいて、各ノードでエッジの確率的な選択を行なうことを含む請求項4の方法。
  6. 前記増補確率は、軌跡のトレース可能な深さに依存する係数を含む請求項5の方法。
  7. 前記増補確率は、物理量保存に基づいた係数を含む請求項5または6の方法。
  8. 前記物理量は速度である請求項7の方法。
  9. 前記複数の軌跡を前記固有パターンと比較することは、ランダム決定森を用いることを含む上記請求項のいずれかの方法。
  10. 前記固有パターンは、前記複数の軌跡からの2つの軌跡の間の相関を含む上記請求項のいずれかの方法。
  11. 前記相関は、前記2つの軌跡のいずれかの軌跡の静的区間と、該2つの軌跡の別の軌跡の動的区間の間の対応である請求項10の方法。
  12. 前記相関は、前記2つの軌跡の方向における対応を含む請求項10または11の方法。
  13. 前記相関はランダム決定森を用いて判定される請求項10〜12のいずれかの方法。
  14. コンピューター上で実行されたときに、上記のいずれかの請求項に従う方法を該コンピューターに行なわせる計算機実行可能命令を伝えるコンピューター可読媒体。
  15. 第1のフレームおよび複数の次フレームを含む映像シーケンスを受け取る入力モジュール;
    記憶モジュール;および
    前記映像シーケンスの各フレームにおける注目点を識別し、前記注目点を前記記憶モジュールに記憶し、前記第1のフレーム以外の各フレームについて、前記映像シーケンスの前フレームにおける注目点に対応する少なくとも1つの注目点を決定し、前記第1のフレーム内の注目点について複数の軌跡を構築し、各軌跡は前記映像シーケンスの前記第1のフレームおよび前記次フレームの少なくともいずれかにおける位置を含んでおり、前記第1のフレーム内の前記位置は前記第1のフレーム内の前記注目点の位置であり、前記少なくとも1つの次フレームにおける前記位置は前記のシーケンスの各次フレームを連続的に検討することにより判定され、該位置において少なくとも1つの軌跡が前フレームに延び、前記少なくとも1つの次フレームにおける前記位置は当該軌跡に含まれる前フレーム内の注目点に対応する、当該軌跡における注目点の位置を含んでおり、
    前記複数の軌跡を移動特徴の固有パターンと比較するプロセッサを具備する映像解析システム。
  16. 前記フレームにおいて前記注目点を表わすノード、および、各フレームについて前記少なくとも1つの注目点と前記前フレーム内の対応する前記注目点とを結ぶ少なくとも1つのエッジを含む非循環グラフを記憶するためのストレージをさらに具備し、前記プロセッサは、前記非循環グラフをトラバースして前記第1のフレーム内の前記注目点について前記複数の軌跡を構築する請求項15の映像解析システム。
  17. 前記固有パターンは、前記複数の軌跡からの2つの軌跡の間の相関を含む請求項15または16の映像解析システム。
  18. 前記相関は、前記2つの軌跡におけるいずれかの軌跡の静的区間と、該2つの軌跡の別の軌跡の動的区間の間の対応である請求項17の映像解析システム。
  19. 前記プロセッサは、前記第1のフレーム以外の各フレームについて、前記映像シーケンスの前フレームにおける注目点に対応する少なくとも1つの注目点を、前記少なくとも1つの注目点と前記前フレームにおける注目点の間の空間距離および/またはアピアランス類似性を計算することにより計算する請求項16〜18のうちのいずれかの映像解析システム。
  20. 前記記憶モジュールは、ランダム森分類器をさらに記憶し、前記複数の軌跡を前記固有パターンと比較するために前記ランダム森分類器を用いる請求項16〜19のいずれかの映像解析システム。
JP2012523372A 2009-08-06 2009-08-06 画像解析方法 Pending JP2013501289A (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/GB2009/001948 WO2011015801A1 (en) 2009-08-06 2009-08-06 Correlated probabilistic trajectories pedestrian motion detection using a decision forest

Publications (1)

Publication Number Publication Date
JP2013501289A true JP2013501289A (ja) 2013-01-10

Family

ID=42116035

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012523372A Pending JP2013501289A (ja) 2009-08-06 2009-08-06 画像解析方法

Country Status (4)

Country Link
US (1) US9014422B2 (ja)
JP (1) JP2013501289A (ja)
GB (1) GB2485733A (ja)
WO (1) WO2011015801A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109478319A (zh) * 2016-07-11 2019-03-15 三菱电机株式会社 动态图像处理装置、动态图像处理方法及动态图像处理程序

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8879831B2 (en) * 2011-12-15 2014-11-04 Microsoft Corporation Using high-level attributes to guide image processing
TW201421423A (zh) * 2012-11-26 2014-06-01 Pixart Imaging Inc 影像感測器及其運作方法
CN104408444A (zh) * 2014-12-15 2015-03-11 北京国双科技有限公司 人体动作识别方法和装置
CN105512610B (zh) * 2015-11-25 2019-01-29 华南理工大学 一种基于感兴趣点位置信息的视频中人体动作识别方法
EP3393367B1 (en) 2015-12-22 2019-07-24 Koninklijke Philips N.V. Medical imaging apparatus and medical imaging method for inspecting a volume of a subject
WO2018018194A1 (zh) * 2016-07-24 2018-02-01 严映军 一种兴趣定位技术的使用情况统计方法和判断系统
US10210603B2 (en) * 2016-10-17 2019-02-19 Conduent Business Services Llc Store shelf imaging system and method
US10627818B2 (en) * 2018-03-28 2020-04-21 Zoox, Inc. Temporal prediction model for semantic intent understanding
CN110942019B (zh) * 2019-11-25 2024-01-23 深圳市甲易科技有限公司 一种用于找出两条轨迹的最长伴随子路径的分析方法
US11403856B2 (en) 2020-08-26 2022-08-02 Ford Global Technologies, Llc Group object-tracking

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002099918A (ja) * 2000-09-12 2002-04-05 Internatl Business Mach Corp <Ibm> 画像処理方法、画像処理システムおよび記録媒体
JP2008009914A (ja) * 2006-06-30 2008-01-17 Canon Inc 画像処理装置、画像処理方法、プログラム、記憶媒体

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SG114479A1 (en) 2000-11-27 2005-09-28 Ibm Selecting a target device in a device network
WO2007096002A1 (en) * 2006-02-27 2007-08-30 Robert Bosch Gmbh Trajectory retrieval system, method and software for trajectory data retrieval
US8811666B2 (en) * 2009-08-06 2014-08-19 Kabushiki Kaisha Toshiba Monitoring of video images

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002099918A (ja) * 2000-09-12 2002-04-05 Internatl Business Mach Corp <Ibm> 画像処理方法、画像処理システムおよび記録媒体
JP2008009914A (ja) * 2006-06-30 2008-01-17 Canon Inc 画像処理装置、画像処理方法、プログラム、記憶媒体

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
FRANK PERBET,外2名, "CORRELATED PROBABILISTIC TRAJECTORIES FOR PEDESTRIAN MOTION DETECTION",[ONLINE], JPN7013003917, 17 July 2009 (2009-07-17), ISSN: 0002663136 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109478319A (zh) * 2016-07-11 2019-03-15 三菱电机株式会社 动态图像处理装置、动态图像处理方法及动态图像处理程序

Also Published As

Publication number Publication date
GB201203946D0 (en) 2012-04-18
US20120224744A1 (en) 2012-09-06
GB2485733A (en) 2012-05-23
WO2011015801A1 (en) 2011-02-10
US9014422B2 (en) 2015-04-21

Similar Documents

Publication Publication Date Title
JP5634517B2 (ja) ビデオ映像の監視
JP2013501289A (ja) 画像解析方法
Shen et al. Multiobject tracking by submodular optimization
US11789545B2 (en) Information processing device and method, program and recording medium for identifying a gesture of a person from captured image data
JP5726125B2 (ja) 奥行き画像内の物体を検出する方法およびシステム
US8005263B2 (en) Hand sign recognition using label assignment
JP4782901B2 (ja) 移動体検出装置および移動体検出方法
CN110782483B (zh) 基于分布式相机网络的多视图多目标跟踪方法及系统
CN113326835B (zh) 一种动作检测方法、装置、终端设备和存储介质
Kanezaki et al. Fast object detection for robots in a cluttered indoor environment using integral 3D feature table
Chamveha et al. Head direction estimation from low resolution images with scene adaptation
Guclu et al. Integrating global and local image features for enhanced loop closure detection in RGB-D SLAM systems
Sharma et al. Analytical review on object segmentation and recognition
Albu et al. Generic temporal segmentation of cyclic human motion
CN116129523A (zh) 动作识别方法、装置、终端及计算机可读存储介质
KR101756916B1 (ko) 행위 인식 장치 및 방법
CN114550298A (zh) 短视频的动作识别方法及系统
JP5241687B2 (ja) 物体検出装置及び物体検出プログラム
JP4997179B2 (ja) 画像処理装置、方法およびプログラム
Zhang et al. Long-term face tracking in the wild using deep learning
Espinace et al. Unsupervised identification of useful visual landmarks using multiple segmentations and top-down feedback
Torabi et al. Joint detection and activity recognition of construction workers using convolutional neural networks
Ildarabadi et al. Improvement Tracking Dynamic Programming using Replication Function for Continuous Sign Language Recognition
US20230196752A1 (en) Information processing apparatus, information processing method, and non-transitory computer-readable storage medium
Wang et al. Robust object tracking with a hierarchical ensemble framework

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20131029

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20131205

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20131212

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20131219

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20131226

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20140109

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140318

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20140916