JP5759124B2

JP5759124B2 - カメラ・システムから得られた画像の中のオブジェクトを分析するためのコンピュータ化方法及びシステム

Info

Publication number: JP5759124B2
Application number: JP2010181999A
Authority: JP
Inventors: ジャンフランコ・ドレットー; イー・ヤオ
Original assignee: General Electric Co
Current assignee: General Electric Co
Priority date: 2009-08-18
Filing date: 2010-08-17
Publication date: 2015-08-05
Anticipated expiration: 2030-08-17
Also published as: KR20110018850A; KR101686246B1; EP2287782A3; EP2287782A2; JP2011040070A; CN101996315A; US20110044497A1; US7953245B2; CN101996315B

Description

本発明は、一般的に云えば、インテリジェント・カメラ・システムに関し、より具体的には、カメラ・システムを用いてオブジェクトの分析を改善することのできるシステム、方法及びプログラム製品に関するものである。

カメラ監視システムは益々「知能的」になっている。と云うのは、これらのカメラ・システムから得られる画像及びデータが、カメラで得られたデータ（すなわち、ビデオ）についての人による観察及び分析を（少なくとも部分的に）必要とせずに益々分析可能になっているからである。

どんな種類の自動ビデオ分析でも、ビデオ中のオブジェクト（１つ又は複数）を効果的に認識し、検出し及び／又は分類する能力に様々な因子が悪影響を及ぼすことがある。正確で有効なオブジェクト分析に影響を及ぼす虞のある因子には、場面の照度、場面のスケール、及びカメラ（１つ又は複数）の回転が挙げられる。

従って、オブジェクトの認識、検出及び／又は分類を含めてカメラ・システムの「知能」及びオブジェクト分析の改善が現在必要とされている。

米国特許第７２６９２８５号

本発明は、カメラ・システムの「知能(intelligence)」を改善することによって、カメラ・システムにおける上記の欠点の少なくとも幾分かを克服する。より詳しく述べると、本発明は、オブジェクト認識、オブジェクト検出及びオブジェクト分類を含むオブジェクト分析を改善するためのシステム、方法及びプログラム製品を対象とする。

従って、本発明の一面によれば、カメラ・システムから得られた画像の中のオブジェクトを分析するためのコンピュータ化方法が提供される。このコンピュータ化方法は、カメラ・システムから複数の画素を持つ少なくとも１つの画像を受け取る段階と、前記複数の画素の各々の画素のために一群（pool）の特徴(feature) を計算する段階と、前記一群の特徴及び前記少なくとも１つの画像の幾何学的中心から一群の特徴の半径方向モーメントを導出する行為、及び前記一群の特徴から一群の特徴の中心モーメントを導出する行為の内の一方を行う段階と、前記少なくとも１つの画像の面積と前記導出された一群の特徴の半径方向モーメント及び前記導出された一群の特徴の中心モーメントの内の一方とに基づいて正規化記述子を計算する段階と、正規化記述子に基づいて、コンピュータにより、前記少なくとも１つの画像中の少なくとも１つのオブジェクトを認識する行為、前記少なくとも１つの画像中の少なくとも１つのオブジェクトを検出する行為、及び前記少なくとも１つの画像中の少なくとも１つのオブジェクトを分類する行為の内の少なくとも１つを行う段階とを有する。

本発明の別の一面によれば、カメラ・システムから得られた画像の中のオブジェクトを分析するためのコンピュータ化方法が提供される。このコンピュータ化方法は、カメラ・システムから複数の画素を持つ少なくとも１つの画像を受け取る段階と、前記複数の画素の各々の画素のために一群の特徴を計算する段階と、前記一群の特徴から一群の特徴の中心モーメントを導出する段階と、前記一群の特徴の中心モーメントに基づいて一群の中心モーメント不変量を計算する段階と、前記少なくとも１つの画像の面積及び前記一群の特徴の中心モーメントに基づいて正規化記述子を計算する段階と、前記正規化記述子に基づいて、コンピュータにより、前記少なくとも１つの画像中の少なくとも１つのオブジェクトを認識する行為、前記少なくとも１つの画像中の少なくとも１つのオブジェクトを検出する行為、及び前記少なくとも１つの画像中の少なくとも１つのオブジェクトを分類する行為の内の少なくとも１つを行う段階とを有する。

本発明の別の一面によれば、カメラ・システムから得られた画像の中のオブジェクトを分析するための方法を提供するコンピュータ実行可能な命令を持つコンピュータ読取り可能な媒体が提供される。前記方法は、カメラ・システムから複数の画素を持つ少なくとも１つの画像を受け取る段階と、前記複数の画素の各々の画素のために一群の特徴を計算する段階と、前記一群の特徴及び前記少なくとも１つの画像の幾何学的中心から一群の特徴の半径方向モーメントを導出する行為、及び前記一群の特徴から一群の特徴の中心モーメントを導出する行為の内の一方を行う段階と、前記少なくとも１つの画像の面積と前記導出された一群の特徴の半径方向モーメント及び前記導出された一群の特徴の中心モーメントの内の一方とに基づいて正規化記述子を計算する段階と、正規化記述子に基づいて、コンピュータにより、前記少なくとも１つの画像中の少なくとも１つのオブジェクトを認識する行為、前記少なくとも１つの画像中の少なくとも１つのオブジェクトを検出する行為、及び前記少なくとも１つの画像中の少なくとも１つのオブジェクトを分類する行為の内の少なくとも１つを行う段階とを有する。

本発明の別の一面によれば、カメラ・システムから得られた画像の中のオブジェクトを分析するためのシステムが提供される。このシステムは、カメラ・システムから複数の画素を持つ少なくとも１つの画像を受け取るシステムと、前記複数の画素の各々の画素のために一群の特徴を計算するシステムと、前記一群の特徴及び前記少なくとも１つの画像の幾何学的中心から一群の特徴の半径方向モーメントを導出する行為、及び前記一群の特徴から一群の特徴の中心モーメントを導出する行為の内の一方を行うシステムと、前記少なくとも１つの画像の面積と前記導出された一群の特徴の半径方向モーメント及び前記導出された一群の特徴の中心モーメントの内の一方とに基づいて正規化記述子を計算するシステムと、前記正規化記述子に基づいて、前記少なくとも１つの画像中の少なくとも１つのオブジェクトを認識する行為、前記少なくとも１つの画像中の少なくとも１つのオブジェクトを検出する行為、及び前記少なくとも１つの画像中の少なくとも１つのオブジェクトを分類する行為の内の少なくとも１つを行うシステムとを有する。

本発明の様々な他の特徴及び利点は、以下の詳しい説明及び図面から明らかになろう。

図面は、本発明を実施するために現在考えられる実施形態を例示している。

図１は、本発明の様々な面を取り入れた、カメラを基にしたオブジェクトを分析するためのシステムの概略図である。図２Ａは、本発明の一実施形態に従ったシステムによって用いることのできる様々な回転角度の１つでの空中撮影画像である。図２Ｂは、本発明の一実施形態に従ったシステムによって用いることのできる様々な回転角度の別の１つでの空中撮影画像である。図２Ｃは、本発明の一実施形態に従ったシステムによって用いることのできる様々な回転角度の別の１つでの空中撮影画像である。図２Ｄは、本発明の一実施形態に従ったシステムによって用いることのできる様々な回転角度の別の１つでの空中撮影画像である。図３は、本発明の様々な面を取り入れた、カメラを基にしたオブジェクトを分析するためのシステムの概略図である。

本発明の様々な面では、カメラ・システムを用いる従来のシステムに対して様々な利点を提供する。本発明によるシステム、方法及びプログラム製品は、カメラ・システムから得られたデータ（例えば、ビデオ、画像、画像領域など）の中のオブジェクト（例えば、車両、人間など）をより効果的に分析することができる。本発明の様々な面での改善には、ノイズ及び画像変換（例えば、照度変動、カメラ回転変動、スケール変動など）に対して、より容易にオブジェクトを検出し、オブジェクトを分類し及び／又はオブジェクトを認識する能力が含まれる。本発明の様々な面を用いるカメラ・システムの「知能」は効果的に増大する。

本発明の様々な面は、例えば、オブジェクトを検出し、オブジェクトを分類し及び／又はオブジェクトを認識することを含めて、より効率よくオブジェクトを分析する能力を含む。実施形態の下で分析することのできるオブジェクトは、事実上、カメラ・システムから得られたる車両、人などを含む任意の物とすることができる。

オブジェクト検出は、特定のクラスに属するオブジェクトが画像中にどれほどの量あるか、特定のクラス内のオブジェクト（１つ又は複数）が画像の中のどの場所にあるか、及び／又は画像中のオブジェクト（１つ又は複数）のおおよその大きさがどれほどであるかを決定する能力を含む。例えば、単一の画像について、オブジェクト検出は、所与のクラス（例えば、可能性のある全ての車両を含むクラス）に属しているオブジェクトを検出することを含むことができる。

オブジェクト分類は、検出されたオブジェクトがＮ個のオブジェクト・クラスの内のどのクラスに属しているかを決定するする能力を含む。例えば、Ｎ個のクラスのオブジェクトが検出可能である（例えば、Ｎ＝３であり、その第１のクラスが全てのスポーツ用多目的車を含み、第２のクラスが全てのセダンを含み、第３のクラスが全てのトラックを含む）と仮定する。そこで、単一の画像について、オブジェクト分類は、検出されたオブジェクトがＮ個のクラスの内のどのクラスに属しているか分類することができる。例えば、画像中に車両Ｗが含まれている場合、オブジェクト分類は、その車両がスポーツ用多目的車、セダン又はトラックであるかどうか決定することができる。

オブジェクト認識は、検出されたオブジェクトが、収集されたオブジェクトの画像のライブラリーからの同じ特定のオブジェクトであるかどうか決定する能力を含む。例えば、新しい画像が或るオブジェクトを含んでいる場合、オブジェクト認識は、該画像中に含まれたオブジェクトが、収集されたライブラリーに予め存在する同じ特定のオブジェクトを表しているかどうか認識することを含む。例えば、車両に関して、特定の所有者のスポーツ用多目的車（例えば、２００５年型、ダークブルーの、ルーフ・ラック付きホンダ・エレメントＥＸ）をユーザーが認識しようとしていると仮定する。オブジェクト認識は、収集されたオブジェクト（例えば、車両）の画像のライブラリーに基づいて、受け取った画像（１つ又は複数）中にその特定の所有者のスポーツ用多目的車が存在するかどうか適切に決定することができる。オブジェクト認識は、たとえ画像ライブラリーが、例えば、同じ属性（例えば、２００５年型、ダークブルー、スポーツ用多目的車、ホンダ製、エレメント・モデル、エレメントＥＸモデル、及び同様なもの）を持つ他の車両の画像を含んでいる場合でも、画像（１つ又は複数）中に、例えば、所有者の２００５年型、ダークブルーの、ルーフ・ラック付きホンダ・エレメントＥＸを認識する能力を含むことができる。オブジェクト認識は、オブジェクトのクラス又はオブジェクト分類に拘りなく、収集されたライブラリーに含まれている特定のオブジェクトが画像（１つ又は複数）中に含まれている（又は含まれていない）ことを認識することを含む。

本発明の様々な面では、一群の画像特徴に画像モーメントを適用するという考え方に基づいた新しいクラスの外観記述子(appearance descriptor) を含む。画像モーメント及び画像特徴の注意深い設計によって、記述子はスケール及び回転不変にし、また照度変化に対してロバスト（頑強）にすることができる。また様々な面では、積分表現に基づいている高速の計算手順を含む。それらの不変性は、それらを、例えば、スケール及び回転不変性が屡々重要である空中ビデオからの車両検出の用途に適したものとする。

外観記述子の設計は、ここ１０年間にかなりの注目を集めた。その理由は、多くの実際の用途では、画像特徴整合からオブジェクト整合に及ぶタスク、又はオブジェクト検出からオブジェクト・カテゴリー認識に及ぶタスクを支援するために記述子の計算を必要とするからである。記述子の重要な属性はその弁別性であるが、しかし、別の問題は、照度及び視点変動に起因した、ノイズ及び画像変換に関するその頑強さである。記述子の計算量はまた主要な属性である。これは、実行時と共にトレーニング段階（例えば、特徴選択）の際に問題になることがある。実際に、殆ど全てのタスクは、幾つかの画像領域に対応するデータから大量の統計値（すなわち、外観記述子）の計算を必要とする。本発明の様々な面では、計算効率、スケール及び回転変換に対する不変性などの問題に対処する一クラスの新しい記述子を導入する。

本発明の様々な面では、画像特徴のモーメントを導入し、これは、画像空間から、全ての画素の各々が画像特徴ベクトルに割り当てられる場合に画像の所望の局部的記述を含んでいる空間へのマップの設計を可能にする。本発明の様々な面では、回転不変性について検討して、新しい一群の等方性特徴を提供する。

本発明の実施形態は、３つの異なる外観記述子を含む。これらの記述子は全てスケール不変であり、また画像特徴の等方性に依存して回転不変にすることができる。どんな場合でも、第１の外観記述子は、所与の領域の画像特徴の中心モーメントを計算する。第２の外観記述子は、全ての画像特徴に対して計算された一組の不変量である。第３の外観記述子は、画像特徴の半径方向モーメントを計算する。

計算効率は、積分画像表現の使用を画像特徴のモーメントの計算へ拡張する手順を設計することによって、本発明の様々な面で対処する。所与の画像について、これは、多数の量の予備計算を法として、一定時間内で新しい記述子の計算を可能にする。

本発明の様々な面では、スケール及び回転に対する不変性の問題に注目する新しいクラスの記述子を含み、そのために新しい一組の画像特徴が生成される。様々な面ではまた、一定時間内で記述子の計算を可能にする新しい手順が含まれる。これは予備計算段階後に得られ、そのコストは画像特徴の次元数に線形に比例し、二次式的に比例しない。

本発明の一実施形態は、空中ビデオからの車両検出の問題に対処する。記述子は、サポート・ベクター・マシーン（ＳＶＭ）のような分類子(classifier)と共に用いると最も効率がよいので、従来の方法よりも優れている。

〔画像特徴のモーメント〕
画像特徴及び画像特徴のモーメントが、本書で開示するように定義される。

Ｉを、全ての

について定義された単色画像又はＲＧＢ画像であるとする。Φは、Ｉ、すなわち画素（ｘ，ｙ）をｄ次元の画像特徴ベクトルにマッピングする一般的フィルタリング演算である。

画像Ｉの回転が画素（ｘ，ｙ）を中心にして演算される。ｆ_ｉ（ｘ，ｙ）が回転に基づいて変化しなかった場合、それは等方性特徴である。そうでない場合は、ｆ_ｉは異方性である。例えば、Ｉ_ｘ≒∂Ｉ／∂ｘは異方性特徴であるが、画像勾配｜▽Ｉ｜の大きさは等方性特徴である。全てのモーメントの集合は、２つの変数を持つ多項式の空間上への画像特徴の投影である。

ｐ及びｑが負でない整数であるとして、次数ｎ＝ｐ＋ｑの画像特徴ｆのモーメントｍ_ｐｑは、次のように定義される。

ここで、従来ではモーメントの定義は全て画像特徴を確率密度と見なしていることに注意されたい。しかしながら、本発明の様々な面では、画像特徴は確率密度として取り扱われない。｛ｆ_ｉ｝が区分的に連続であって、有界支持を持つ限り、全ての次数のモーメントが存在して、一意的に決定される。全ての実際的事例では、これらの条件は広く満たされる。

本発明の様々な面ではまた、表記法ｍ_ｎ≒［ｍ_０ｎ ^Ｔ，．．．，ｍ_ｎ０ ^Ｔ］^Ｔを導入し、これは次数ｎのｎ＋１個のモーメントの規則正しい配列を表す。

同様に、μ_ｐｑは、成分μ_ｐｑ，ｉを持つ、次数ｎ＝ｐ＋ｑ≧２の画像特徴ｆの中心モーメントであり、次のように定義される。

表記法μ_ｎ≒［μ_０ｎ ^Ｔ，．．．，μ_ｎ０ ^Ｔ］^Ｔは、次数ｎのｎ＋１個の中心モーメントの規則正しい配列を表す。

μ_２及びμ_３から、特徴ｆの並進及び回転に対して不変である７つの異なる統計値（ふー(Hu)の不変量として知られている）を抽出することが可能である。それらは、

として表され、またそれらは、次のように定義された成分を持つベクトルである。

τ_１，i＝μ_２０，ｉ＋μ_０２，ｉ、
τ_２，ｉ＝（μ_２０，ｉ−μ_０２，ｉ）^２＋４(μ_１１，ｉ）^２、
τ_３，ｉ＝（μ_３０，ｉ−３μ_１２，ｉ）^２＋（３μ_２１，ｉ−μ_０３，ｉ）^２、
τ_４，ｉ＝（μ_３０，ｉ＋μ_１２，ｉ）^２＋（μ_２１，ｉ＋μ_０３，ｉ）^２、
τ_５，ｉ＝（μ_３０，ｉ−３μ_１２，ｉ）(μ_３０，ｉ＋μ_１２，ｉ）［(μ_３０，ｉ＋μ_１２，ｉ）^２−
３(μ_２１，ｉ＋μ_０３，ｉ）^２］＋（３_{μ２１，ｉ}＋μ_０３，ｉ）(μ_２１，ｉ＋μ_０３，ｉ）
［３(μ_３０，ｉ＋μ_１２，ｉ）^２-（μ_２１，ｉ＋μ_０３，ｉ）^２］、
τ_６，ｉ＝（μ_２０，ｉ−μ_０２，ｉ）［(μ_３０，ｉ＋μ_１２，ｉ）^２-（μ_２１，ｉ＋μ_０３，ｉ）^２］＋
４ μ_１１，ｉ（μ_３０，ｉ＋μ_１２，ｉ）(μ_２１，ｉ＋μ_０３，ｉ）、
τ_７，ｉ＝（３μ_２１，ｉ−３μ_０３，ｉ）(μ_３０，ｉ＋μ_１２，ｉ）［(μ_３０，ｉ＋μ_１２，ｉ）^２−
３(μ_２１，ｉ＋μ_０３，ｉ）^２］-（３μ_３０，ｉ＋μ_１２，ｉ）(μ_２１，ｉ＋μ_０３，ｉ）
［３(μ_３０，ｉ＋μ_１２，ｉ）^２-（μ_２１，ｉ＋μ_０３，ｉ）^２］ (４）
次数ｎ≧１の画像特徴ｆの半径方向モーメントは次のように定義される。

ここで、

は、ドメインΩの幾何学的中心を表す。これらのモーメントは、特徴ｆの回転に対して不変であるという基本的属性を持つ。

〔外観記述子〕
Ｄ⊂Ωは単純に接続されたドメインであり、ここで｜Ｄ｜はドメインの面積を表す。
外観記述子について、画像特徴｛ｆ（ｘ，ｙ）｜（ｘ，ｙ）∈Ｄ｝を記述子ベクトル

にマッピングするオペレータを考察する。本発明の様々な面では、本書で述べる画像特徴のモーメントに基づいて３つの外観記述子を、以下のように定義する。

〈１〉中心モーメント（ＣＭ）記述子：
ドメインＤに対して計算された画像特徴の中心モーメント｛μ_ｉ｝の集合から、次数ｎ≧２の中心モーメント記述子は、Ｊ_ＣＭ＝［（ｎ^２＋３ｎ−４）／２］ｄ成分を持つ次のベクトルとして定義される。

〈２〉中心モーメント不変（ＣＭＩ）記述子：
ドメインＤに対して計算された画像特徴の中心モーメント不変量｛τ_ｉ｝の集合から、中心モーメント不変記述子は次のように定義される。

これは、Ｊ_ＣＭＩ＝７ｄ成分を持つベクトルである。

〈３〉半径方向モーメント（ＲＭ）記述子：
ドメインＤに対して計算された画像特徴の半径方向モーメント｛ｍ_ｉ｝の集合から、次数ｎ≧１の半径方向モーメント記述子は次のように定義される。

これは、Ｊ_ＲＭ＝ｎｄ成分を持つベクトルである。

〈４〉領域共分散（ＲＣ）記述子：
上述の３つの外観記述子の実行可能性を試験する際に、以下の領域共分散（ＲＣ）記述子が比較として用いられた。領域Ｄ上の画像特徴ｆの共分散行列は次のように定義される。

ここで、

は、Ｄに対する平均画像特徴ベクトルである。ｋ_ｆが正定値対称行列であるとすると、領域共分散記述子は、ｋ_ｆのＪ_ＲＣ＝（ｄ^２＋ｄ）／２個の独立項を含むベクトルｙ_ＲＣによって与えられる。

〔外観記述子属性〕
４つの全ての記述子は画像の有効で且つ非常に低い次元の表現、特にＲＭを提供することができる。対照的に、結合ヒストグラムによる広く用いられている表現では、α〜Ｏである、次元数

を持つ記述子が生じたであろう。

ＣＭ、ＣＭＩ及びＲＭにおいて、画像特徴は確率分布と見なされており、記述子は、特徴が計算のドメインに対してどのように分布しているかを集約する。ＲＣでは、画像特徴はランダム・ベクトルと見なされており、その記述子はその共分散である。もし特徴が空間情報を含んでいる場合には、ＲＣはこの情報を他の特徴と相関させる。

全ての記述子は、複数の特徴の情報を融合する適切な方法を提供する。ＲＣが各対の画像特徴の間の相関を内在的に計算することによって上記のことを行っている間に、ＣＭ、ＣＭＩ及びＲＭは、幾つかの画像特徴を他のものの組合せになるように設定することによって上記のことを可能にする。本発明の様々な面では、３つの新しい記述子（すなわち、ＣＭ、ＣＭＩ、ＲＭ）の次元数は、ＲＣにおけるように二次式的ではなく、ｄに線形に比例する。

所与の時点において、Ｄが一様な背景の上にオブジェクトを含んでおり、その後の時点でオブジェクトが並進したが、まだＤの内部にあると仮定する。全ての記述子は、ＲＭを除いて、このような並進に対して不変であり、ＲＭはＤの幾何学的中心に対して計算される。このような場合、ＲＭは、特定のオブジェクトを局在化するための良好な記述子になり得る。

全ての画素における特徴が、スケール不変である情報を符号化すると仮定すると、式６、７、８及び９で演算された｜Ｄ｜に対する正規化により、全ての記述子がスケール不変にされる。しかしながら、完全にスケール不変である特徴がない場合でも、スケールに関して非常に高度の不変性を達成することが可能であることに注意されたい。

このようなとき、以下の事実が生じる。すなわち、（ａ）画像特徴｛ｆ_ｉ｝が全て等方性であれば、ＣＭＩ、ＲＭ及びＲＣは回転不変である。（ｂ）｛ｆ_ｉ｝の幾分かが異方性であれば、ＣＭＩ、ＲＭ及びＲＣは回転不変ではない。（ｃ）｛ｆ_ｉ｝の性質に拘わらず、ＣＭは回転不変ではない。従って、用途に依存して、回転不変性（分散）は必要条件であったり無かったりする。

全ての記述子は照度不変性問題を画像特徴の設計に委ねている。ＲＣはまた、特徴に付加的な変動を引き起こす照度変化に対して不変である。これは、中間の特徴が記述子計算から除かれているからである。

〔画像特徴の集合〕
本発明の様々な面では、画像特徴の集合を生成するためにフィルタリング処理を用いることができる。例えば、２組のフィルタΦ_Ａ及びΦ_Ｉを用いることができ、そこで、Φ_Ａは異方性特徴の集合であり、またΦ_Ｉは等方性特徴の集合である。

１組のフィルタΦ_Ａは、画像特徴が次のように計算されるようになっている。

ここで、Ｒ、Ｇ及びＢは画像ＩのＲＧＢカラー・チャンネルであり、また他の量は画像強度の第１及び第２次偏導関数の大きさである。これは照度でもなく、また特徴のスケール不変集合でもない。最終的に、ＲＣ記述子が計算されたときのみ、ｘ及びｙが存在する。

１組のフィルタΦ_Ｉは、画像特徴が次のように計算されるようになっている。

ここで、

ＲＧＢカラー・チャンネル、及び画像強度の勾配の大きさである。前述と同様に、ＲＣ記述子が計算されたときのみ、

が存在する。最後の３つの特徴は形状パラメータであり、画像強度によって生成された３Ｄ形状の局部的記述、すなわち、

を与える。

は主曲率κ_１及びκ_２の極座標での表現であり、他方、ｓは形状係数であり、これはまたスケール不変である。それらは、次のように定義された高速の手順により計算することができる。

Φ_Ｉは、特徴の照度不変集合ではない。ＲＧＢチャンネルをそれぞれのチャンネルの対数のラプラシアンと置き換えることによって、照度頑強性を増大させることができる。対数の後の任意の微分により乗法性照度変化を相殺して、加法的なものを著しく低減させる。これらの修正を行った実験は首尾よく行われた。

〔積分表現による高速アルゴリズム〕
Ωに対して定義された画像Ｉは、積分画像として知られており、それは

のように表される。この表現は、Ｏ（１）個のオペレーションにより任意の矩形のドメインに対する画像の積分を計算することを可能にする。ここで、Ｄの面積＝［ｘ’，ｘ”］×［ｙ’，ｙ”］は、｜Ｄ｜＝Ａ（ｘ’，ｙ’）−Ａ（ｘ”，ｙ’）＋Ａ（ｘ”，ｙ”）−Ａ（ｘ’，ｙ”）として計算することができることに留意されたい。上式で、

であり、これは便宜的に予備計算できる。この表現は、ＣＭ、ＣＭＩ及びＲＭ記述子を計算するための高速アルゴリズムを導出するために用いることができる。

〈２〉ＣＭ記述子：
ｙ_ＣＭを計算するために、モーメントの集合｛μ_ｐｑ｜ｐ＋ｑ＝２，．．．，ｎ｝を用いることができる。２項定理により、次のようにモーメントを中心モーメントに関連付けることができる。

従って、中心モーメントはモーメントの集合｛ｍ_ｐｑ｜ｐ＋ｑ＝０，．．．，ｎ｝から計算することができる。次いで、該モーメントは、次式を定義することによって積分表現を利用することができる。

そして、Ｄに対するモーメントは次のように計算することができる。

ここで、式（１６）における量ｕ^ｐｖ^ｑは、便宜的に予備計算することができる。最後に、計算全体は、式（１６）のために［（ｎ^２＋３ｎ＋２）／２］ｄの積分表現の初期形成を必要とし、それらの各々はドメインΩに対する１回のパスで計算することができ、そこで、各記述子はＯ（ｎ^２ｄ）個のオペレーションの一定計算量で求められる。

〈３〉ＣＭＩ記述子：
ｙ_ＣＭＩを計算するために、中心モーメントμ_２及びμ_３を必要とし、これらは上述した手順で計算することができ、それらから不変量の集合｛τ_ｉ｝を計算することができる。計算全体は、１０ｄの積分画像の初期形成を必要とし、各記述子はＯ（ｄ）個のオペレーションの一定計算量で求められる。

〈４〉ＲＭ記述子：
ｙ_ＲＭを計算するために、ｍ_１，．．．，ｍ_ｎを必要とする。２項定理により、次のようにモーメントを半径方向モーメントに関連付けることができる。

ここで、

である。従って、半径方向モーメントは｛ｍ_ｐｑ｜ｐ＋ｑ＝０，．．．，２ｎ｝から計算することができ、次にそれは前に説明したように計算することができる。計算全体は、式（１６）のために（２ｎ^２＋２ｎ＋１）ｄの積分表現の初期形成を必要とし、各記述子はＯ（ｎｄ）個のオペレーションの一定計算量で求められる。

表１は、画像特徴の数ｄ及び記述子次数ｎの関数として、記述子長さ、計算すべき積分表現の数（パス数）、並びに一つの記述子当りのオペレーションの数についての一覧表を示す。

表１は、４つの記述子の主要な計算特性をまとめて示している。ここで、強力な記述子を得るのにｎ＝２又は３で充分であり得ることに気付かれよう。ｎが固定されている場合、計算すべき積分表現の数は、ＲＣ記述子についてはＯ（ｄ^２）であり、他の３つの記述子についてはＯ（ｄ）である。同じことが、予備計算段階後に１つの記述子を計算するためのオペレーションの数に当てはまり、それはＲＣ記述子についてはＯ（ｄ^２）であり、他の全ての記述子についてはＯ（ｄ）である。ここでまた、ｎが小さい場合、ＲＭ記述子が非常に短いことに留意されたい。

〔実験例〕
異方性画像特徴Φ_Ａ及び等方性画像特徴Φ_Ｉと組み合わせて、ＲＣ記述子、次数３のＣＭ記述子、ＣＭＩ記述子及び次数２のＲＭ記述子の性能を分析するため実験を行った。試験台としての用途は、空中ビデオからの車両検出であった。引き窓方式を採用して、全ての画素において、方形画像面積に対する記述子を５つの異なるスケールで計算して、スコアを出力するＳＶＭ分類子に供給する。形態学的フィルタリング及び連結成分を、閾値弁別されたスコアに対して計算し、これにより車両スケールを調整し、検出を行った。

ＣＭ、ＣＭＩ及びＲＭ記述子を用いる全ての実験で、ＳＶＭ分類子を展開した。ＲＣ記述子を用いる全ての実験では、核（−γｄ（ｙ，ｙ’）^２）を持つＳＶＭが展開される。ここで、ｄ（ｙ，ｙ’）は、関連した多様体の曲率を考慮する正定値共分散行列についての測定基準である。実験はまた、共分散行列の空間の既知の構造が与えられると、単純線形ＳＶＭが最適と云えないことを証明した。定数γは試行錯誤によって最適化される。

様々な回転角度に取り付けられたカメラから収集した複数の幹線道路交通シーケンスより成るデータセットを使用した。具体的に述べると、これらのシーケンスは、０°、２０°、３５°、６５°及び９０°に回転させたカメラにより収集された。例えば、図２Ａ〜図２Ｄを参照されたい。これらの図は、様々な角度（例えば、図２Ａの０°、図２Ｂの４５°、図２Ｃの６５°、及び図２Ｄの９０°）に回転させて得られた空中撮影画像７０を示している。各ビデオについて、幹線道路に沿って移動する各車両（オブジェクト７２，７４）の周りに矩形の関心領域（ＲＯＩ）を記録することによって、車両の地上較正位置及びサイズを手動で注釈付けし、その結果、全部で約４７０００の異なるＲＯＩ（５９０の異なる車両に対応する）が得られた。ＲＯＩのサイズは、車両の種類に依存して約３０×２０から１２０×４０画素に変化する。

全ての記述子について、分類子出力の受信動作特性（ＲＯＣ）曲線が、正及び負のラベル付けしたサンプル（すなわち、それぞれ車両を含んでいるＲＯＩ又は含んでいないＲＯＩ）に対応して、与えられた。全てのサンプルについてカメラ回転量が知られているので、各回転角度に対応する複数のＲＯＣ曲線を引くことが可能である。最適な全ての記述子について、全てのカメラ回転量に対して評価されたＲＯＣ曲線が与えられ、また回転に起因にしてどの程度の変動が予測され得るかを表す一標準偏差の上限及び下限が付加される。

０°に回転させたシーケンスから、５重相互妥当性確認した正及び負のサンプルが使用された。その上、妥当性確認は、試験グループに合成的に回転させたサンプルを加えることによって行われ、回転は０°と１８０°との間の範囲内で一様に、２０°の間隔でサンプリングした。

特徴に関係なく、ＣＭ記述子は回転に非常に敏感であり、これはその理論的属性と一致する。ＲＣ記述子は、それが異方性特徴を使用するとき、回転に非常に敏感であり、また等方性特徴の場合は不変になり、性能が著しく増大する。再度述べると、これはその属性と一致する。ＣＭＩ及びＲＭ記述子は、特徴に関係なく、最良の実行体(performer) である。それらは、Φ_ＡからΦ_Ｉへ切り換えることによって改善し、またそれらは、Φ_Ａが使用されるときに回転不変でなくても、回転変動に対して限られた敏感さを示す。

次の特徴の群；

についてのＣＭＩ記述子の性能を分析した。Φ_Ｃは等方性であり、これはＣＭＩ及びＲＭを回転不変にし、またそれらの良好な性能を説明している。対照的に、Φ_ｇは異方性であり、これは性能を劣化させ且つ回転に対する敏感さを大きくする。Φ_ＣをΦ_ｇで増強してΦ_Ａを形成したとき、有意な改善も劣化も観察されなかった。これは、ＣＭＩ及びＲＭの比較的良好な性能を説明しており、それはＲ、Ｇ及びＢ画像特徴の優勢性に起因する。Φ_Ｉを分解したとき、Φ_ｓが等方性であり、従って、ＣＭＩ及びＲＭが回転不変であり、性能がΦ_Ｃの場合を越えることもあることに注意されたい。従って、Φ_ＣをΦ_ｓで増強してΦ_Ｉを形成したとき、最良の性能が得られる。この分析は、一群の特徴Φ_ｓを付加することの重要性を強調しており、Φ_ｓの付加がΦ_ｇの付加よりも一層有効であることを証明した。

０°に回転させたシーケンスから、トレーニングのために正及び負のサンプルを使用し、且つ２０°、４５°、６５°及び９０°に回転させたシーケンスからのサンプルを試験のために使用した。これは、記述子計算に影響を及ぼす新しいノイズ源を含んでいる実際の回転させた画像データにより妥当性確認を行うので、より興味深いやり方である。

記述子は一般に、合成的に回転させた試験サンプルの場合に機能したように、カメラの回転に対する敏感さを増大して、正確に機能する。具体的に述べると、等方性特徴を持つ場合でも、ＲＣ記述子の平均性能に明らかな劣化がある。また、等方性特徴を持つＣＭＩはほんの僅か性能が低下すると思われるのに対して、ＲＭはこの合成データから実際のデータへの切換えに最も影響されないと思われる。

０°に回転させたシーケンスからの正及び負のサンプルと共に、合成的に回転させた正及び負のサンプルをトレーニングのためにを使用し、且つ２０°、４５°、６５°及び９０°に回転させたシーケンスからのサンプルを試験のために使用した。

Φ_Ａにより、全ての記述子は性能を改善し、ＲＣの場合は著しく、またＣＭの場合はそれ以上にさえも改善する。これは、カメラの回転に対するそれらの敏感さを考えると、予測されたものであり、敏感さはより豊富なトレーニング・データセットによって平滑化される。Φ_Ｉにより、ＣＭは有意に改善する。ＲＣ、ＣＭＩ及びＲＭが回転不変であると想定されるので、それらの性能は僅かな変化しか受けない。全体として、全ての可能な回転を含むトレーニングの場合でも、ＣＭ及びＲＣ記述子よりもＣＭＩ記述子の方が性能が優れており、それ以上にＲＭ記述子が優れている。

表２は、ＲＯＣの下の面積を示し且つＲＣ、ＣＭ、ＣＭＩ及びＲＭ記述子の間の比較を示す。包括的性能パラメータとして、表２は、ＲＯＣ曲線の下の面積Ａ_ＲＯＣを、カメラ回転に起因した対応する標準偏差σ_ＡＲＯＣと共に示す（すなわち、Ａ_ＲＯＣ±σ_ＡＲＯＣ）。Ａ_ＲＯＣがより大きいことは、同じ偽陽性率で真の陽性率がより大きくなる、従って性能が一層良好になることを示唆している。表により、等方性特徴を持つＣＭＩ及び（それ以上に）ＲＭ記述子が最良の実行体であることが確認される。

分類子を、０°に回転させたシーケンスからのサンプルのみによってトレーニングした。スペースの制約により、等方性特徴を持つＲＣ、ＣＭＩ及びＲＭ記述子についての結果のみを示す。画像により、カメラ回転に対してＲＭ記述子の優れた頑強さがもたらされる。幹線道路上の車両のみが検出され、このことが、幹線道路の外側の面積を用いて負のサンプルを生成したことによるものであることに注意されたい。線形ＳＶＭの使用により、ＲＣ記述子についてＳＶＭを用いた場合と比べると（これは、共分散行列の間の測地的距離の計算を必要とする）、トレーニング及び試験の両方の際に、１０倍のスピードアップの改善が得られることに注意されたい。

図２Ａ〜図２Ｄは静止カメラから送られてきた画像を示しているが、検出器が運動情報を利用するものではなく、検出器は、ビデオの整合を必要とせずに、カメラが移動しているときに使用することができることに注意されたい。

最後に、この作業において、不変性を２つのやり方で、すなわち、（ａ）それらを記述子設計に取り入れることによって、また（ｂ）人為的に変換されたサンプルを生成することにより、それらをＳＶＭに取り入れることによって、取り扱った。（ａ）の方が（ｂ）よりも効果的であることが分かった。

それにより、相異なる視点からトレーニング・データを収集する負担が軽減され、データ処理量が低減され、また一方では、視点の変化には関係なく、頑強な性能が生じる。

本発明の様々な面では、一群の画像特徴に画像モーメントを適用するという考え方に基づいて新しいクラスの外観記述子を提供した。画像モーメント及び画像特徴の注意深い設計によって、スケール及び回転不変外観記述子を生成することができ、それらはまた照度変化に対して頑強（ロバスト）にすることができる。積分表現が、これらの記述子を計算するための高速の手順を設計するために利用され、また積分表現が魅力的な計算量低減属性を持つことが見出された。本質的に、記述子は、ユークリッド幾何及び線形分類子が分類目的のためにそれらを効果的に利用するのに充分である空間内に所在する。広範な実験を実施したことにより、どの記述子がスケール及び回転変動に対して最も頑強であるのかを定め、また半径方向モーメントに基づいた最良の記述子が、空中ビデオにおける車両検出のためのよく知られている領域共分散記述子よりもかなり性能が優れていることを見出した。本発明の様々な面では、前記のクラスの記述子は、実時間人間検出やオブジェクト・カテゴリー認識のような多くの他の用途において有効な構成要素になることができる。

図１について説明すると、本発明の実施形態に従った、オブジェクトを分析するためのシステム、すなわち、システム１０が示されている。システム１０は、カメラ・システム１１０と相互作用し且つカメラ・システム１１０から複数の画像を受け取るコンピュータ２０を含む。一実施形態では、カメラ・システム１１０は、（例えば、ヘリコプターに取り付けられた）少なくとも１つの空中カメラ１０２、少なくとも１つの固定又は静止カメラ１０４、及び少なくとも１つのパン−傾斜−ズーム（ＰＴＺ）カメラ１０６を含むことができる。カメラ・システム１１０内に示されたカメラ（１つ又は複数）の数及び種類は、本発明で制限することを意味していない。本発明の様々な面では、他の数、種類及び場所を用いることができることは明らかである。

図１及び図３を参照して説明すると、システム１０及びそのコンピュータ２０は、最終的には、カメラ・システム１１０から受け取った画像中のオブジェクトを分析することができる。各々の画像は複数の画素を有する。画像は１つ以上の画像領域を有することができる。

コンピュータ２０は、受け取った画像又は画像領域中のオブジェクト（１つ又は複数）を認識し、検出し及び／又は分類するためのオブジェクト分析器２２を有する。オブジェクト分析器２２は、特徴群モジュール２４と、モーメント群計算器３０と、正規化記述子モジュール４０とを有することができる。

図３に示されているように、コンピュータ２０内のオブジェクト分析器２２は、カメラ・システム１１０から複数の画素を持つ少なくとも１つの画像を受け取る。オブジェクト分析器２２は、最終的に、画像（１つ又は複数）中のオブジェクト（１つ又は複数）を分析する際にＲＭ、ＣＭＩ及び／又はＣＭの内の少なくとも１つを見つけ又は計算する。

カメラ・システム１１０から画像（１つ又は複数）を受け取った後に、オブジェクト分析器２２がＲＭを計算している場合、特徴群モジュール２４が該画像（１つ又は複数）中の複数の画素の内の各々の画素のために一群の特徴を計算する。オブジェクト分析器２２はまた画像（１つ又は複数）の幾何学的中心を計算する。モーメント群計算器３０が、前記一群の特徴及び前記計算された幾何学的中心から一群の特徴の半径方向モーメントを導出する。正規化記述子モジュール４０が次いで、式（８）に示されているように、前記導出された一群の特徴の半径方向モーメントに基づいて正規化記述子を計算する。

カメラ・システム１１０から画像（１つ又は複数）を受け取った後に、オブジェクト分析器２２がＣＭＩを計算している場合、特徴群モジュール２４が該画像（１つ又は複数）中の複数の画素の内の各々の画素のために一群の特徴を計算する。モーメント群計算器３０が、前記一群の特徴から一群の特徴の中心モーメントを導出する。正規化記述子モジュール４０が次いで、式（７）に示されているように、前記導出された一群の特徴の中心モーメントに基づいて正規化記述子を計算する。

カメラ・システム１１０から画像（１つ又は複数）を受け取った後に、オブジェクト分析器２２がＣＭを計算している場合、特徴群モジュール２４が該画像（１つ又は複数）中の複数の画素の内の各々の画素のために一群の特徴を計算する。オブジェクト分析器２２はまた、画像（１つ又は複数）の面積を計算する。モーメント群計算器３０が、前記一群の特徴及び前記計算された面積から一群の特徴の中心モーメントを導出する。正規化記述子モジュール４０が次いで、前記導出された一群の特徴の中心モーメント及び前記画像（１つ又は複数）の面積に基づいて正規化記述子を計算する。

正規化記述子（例えば、ＲＭ、ＣＭＩ、ＣＭ）のどれが計算されるかに応じて、更なる決定が行われた。すなわち、ＲＭを計算する場合、一群の特徴が等方性であるとき、導出された一群の特徴の半径方向モーメントは回転不変であること、及び一群の特徴の半径方向モーメントの導出がユーザー選択可能な次数であってよいことが決定された。同様に、ＣＭＩを計算する場合、一群の特徴が等方性であるとき、導出された一群の特徴の中心モーメントがまた回転不変であること、及び一群の特徴の中心モーメントの導出が固定次数を持つことが決定された。同様に、ＣＭを計算する場合、一群の特徴が等方性であること、及び一群の特徴の中心モーメントの導出がユーザー選択可能な次数であってよいことが決定された。

いずれの場合でも、正規化記述子が正規化記述子モジュール４０によって計算されると、コンピュータ２０はまた、現在既知の又は後で開発された方法を用いて、受け取った画像（１つ又は複数）及び／又は画像領域（１つ又は複数）中のオブジェクト（１つ又は複数）を認識、検出及び／又は分類するように、正規化記述子を画像及びデータのライブラリーと比較することができる。

コンピュータ技術分野の当業者には、説明したように生成されるソフトウエアを、マイクロプロセッサのような汎用又は専用コンピュータ装置と組み合わせて、本発明の実施形態を具現化するコンピュータ・システム又はコンピュータ・サブシステムを生成することができよう。本発明の実施形態に従った装置又はシステムは、限定するものではないが、中央処理装置（ＣＰＲＵ）、メモリ、記憶装置、通信リンク及び装置、サーバー、Ｉ／Ｏ装置、或いは本発明の実施形態を含むソフトウエア、ファームウエア、ハードウエア又はそれらのサブセットの任意の組合せで構成された１つ以上の処理システムの任意の従属部品を含んでいる１つ以上の処理システムであってよい。

本発明の一実施形態に従ったコンピュータ・プログラム製品は、本発明の発見法を含む社会的ネットワークを発見する方法を遂行させるようにコンピュータ・システム上で実行可能である。コンピュータ・システムは、マイクロプロセッサと、入力装置と、表示装置と、インタ−ネットワークか又はイーサーネット及びイントラネットのようなネットワークのいずれかに対するインターフェースとを含む。マイクロプロセッサは通信母線に接続される。コンピュータはまた、メモリを含む。メモリは、ランダム・アクセス・メモリ（ＲＡＭ）及び読出し専用メモリ（ＲＯＭ）を含むことができる。コンピュータ・システムは更に記憶装置を含む。記憶装置は、ハードディスク駆動装置、或いはフレキシブルディスク駆動装置又は光ディスク駆動装置のような取外し可能なディスク駆動装置とすることができる。記憶装置はまた、コンピュータ・プログラム又は他の命令をコンピュータ・システムにロードするための他の同様な手段であってよい。コンピュータ・システムはまた通信ユニットを含む。通信ユニットは、コンピュータがＩ／Ｏインターフェースを介して他のデータベース及びインターネットに接続できるようにする。通信ユニットは、他のデータベースからデータを受信すると共に伝送することができる。通信ユニットは、コンピュータ・システムをデータベースとＬＡＮ、ＭＡＮ、ＷＡＮ及びインターネットのようなネットワークとに接続できるようにするモデム、イーサーネット・カード又は任意の同様な装置を含むことができる。コンピュータ・システムは、Ｉ／Ｏインターフェースを介して該システムにアクセス可能である入力装置によりユーザーからの入力を容易にする。様々なモジュールはまた、ハードウエア・ユニットの形態であってよい。

コンピュータ・システムは、入力データを処理するために１つ以上の記憶素子に記憶されている一組の命令を実行する。一組の命令はプログラム命令手段であってよい。記憶素子はまた、要望されるとおりにデータ又は他の情報を保持することができる。記憶素子は、処理装置に存在する情報源又は物理的メモリの形態であってよい。

一組の命令は、本発明の一実施形態の方法を構成する工程のような特定のタスクを遂行するように処理装置に命令する様々なコマンドを含むことができる。一組の命令はソフトウエア・プログラムの形態であってよい。更に、ソフトウエアは、一群の別々のプログラム、より大きいプログラムを持つプログラム・モジュール、又はプログラム・モジュールの一部の形態であってよい。ソフトウエアはまた、オブジェクト指向プログラミングの形態のモジュール式プログラミングを含むことができる。処理装置による入力データの処理は、ユーザーの指令、以前の処理の結果、又は別の処理装置によってなされた要求に応答するものであってよい。

従って、本発明の一実施形態によれば、カメラ・システムから得られた画像の中のオブジェクトを分析するためのコンピュータ化方法が提供される。このコンピュータ化方法は、カメラ・システムから複数の画素を持つ少なくとも１つの画像を受け取る段階と、前記複数の画素の各々の画素のために一群の特徴を計算する段階と、前記一群の特徴及び前記少なくとも１つの画像の幾何学的中心から一群の特徴の半径方向モーメントを導出する行為、及び前記一群の特徴から一群の特徴の中心モーメントを導出する行為の内の一方を行う段階と、前記少なくとも１つの画像の面積と前記導出された一群の特徴の半径方向モーメント及び前記導出された一群の特徴の中心モーメントの内の一方とに基づいて正規化記述子を計算する段階と、正規化記述子に基づいて、コンピュータにより、前記少なくとも１つの画像中の少なくとも１つのオブジェクトを認識する行為、前記少なくとも１つの画像中の少なくとも１つのオブジェクトを検出する行為、及び前記少なくとも１つの画像中の少なくとも１つのオブジェクトを分類する行為の内の少なくとも１つを行う段階とを有する。

本発明の別の実施形態によれば、カメラ・システムから得られた画像の中のオブジェクトを分析するためのコンピュータ化方法が提供される。このコンピュータ化方法は、カメラ・システムから複数の画素を持つ少なくとも１つの画像を受け取る段階と、前記複数の画素の各々の画素のために一群の特徴を計算する段階と、前記一群の特徴から一群の特徴の中心モーメントを導出する段階と、前記一群の特徴の中心モーメントに基づいて一群の中心モーメント不変量を計算する段階と、前記少なくとも１つの画像の面積及び前記一群の特徴の中心モーメントに基づいて正規化記述子を計算する段階と、前記正規化記述子に基づいて、コンピュータにより、前記少なくとも１つの画像中の少なくとも１つのオブジェクトを認識する行為、前記少なくとも１つの画像中の少なくとも１つのオブジェクトを検出する行為、及び前記少なくとも１つの画像中の少なくとも１つのオブジェクトを分類する行為の内の少なくとも１つを行う段階とを有する。

本発明の別の実施形態によれば、カメラ・システムから得られた画像の中のオブジェクトを分析するための方法を提供するコンピュータ実行可能な命令を持つコンピュータ読取り可能な媒体が提供される。前記方法は、カメラ・システムから複数の画素を持つ少なくとも１つの画像を受け取る段階と、前記複数の画素の各々の画素のために一群の特徴を計算する段階と、前記一群の特徴及び前記少なくとも１つの画像の幾何学的中心から一群の特徴の半径方向モーメントを導出する行為、及び前記一群の特徴から一群の特徴の中心モーメントを導出する行為の内の一方を行う段階と、前記少なくとも１つの画像の面積と前記導出された一群の特徴の半径方向モーメント及び前記導出された一群の特徴の中心モーメントの内の一方とに基づいて正規化記述子を計算する段階と、正規化記述子に基づいて、コンピュータにより、前記少なくとも１つの画像中の少なくとも１つのオブジェクトを認識する行為、前記少なくとも１つの画像中の少なくとも１つのオブジェクトを検出する行為、及び前記少なくとも１つの画像中の少なくとも１つのオブジェクトを分類する行為の内の少なくとも１つを行う段階とを有する。

本発明の別の実施形態によれば、カメラ・システムから得られた画像の中のオブジェクトを分析するためのシステムが提供される。このシステムは、カメラ・システムから複数の画素を持つ少なくとも１つの画像を受け取るシステムと、前記複数の画素の各々の画素のために一群の特徴を計算するシステムと、前記一群の特徴及び前記少なくとも１つの画像の幾何学的中心から一群の特徴の半径方向モーメントを導出する行為、及び前記一群の特徴から一群の特徴の中心モーメントを導出する行為の内の一方を行うシステムと、前記少なくとも１つの画像の面積と前記導出された一群の特徴の半径方向モーメント及び前記導出された一群の特徴の中心モーメントの内の一方とに基づいて正規化記述子を計算するシステムと、前記正規化記述子に基づいて、前記少なくとも１つの画像中の少なくとも１つのオブジェクトを認識する行為、前記少なくとも１つの画像中の少なくとも１つのオブジェクトを検出する行為、及び前記少なくとも１つの画像中の少なくとも１つのオブジェクトを分類する行為の内の少なくとも１つを行うシステムとを有する。

本発明を好ましい実施態様に関して説明したが、明確に述べたものとは別に、様々な等価な構成、変更及び修正が特許請求の範囲内で可能であることが認められよう。

１０カメラを基にしたオブジェクトの分析システム
２０コンピュータ
５０風景
５２橋／障害物
５４道路／幹線道路
６０牽引トレーラー
６２乗用車
６４スポーツ用多目的車
７０空中撮影画像
７２第１のオブジェクト
７４第２のオブジェクト
１１０カメラ・システム
１０２空中カメラ
１０４固定カメラ
１０６ＰＴＺカメラ

Claims

カメラ・システムから得られた画像の中のオブジェクトを分析するためのコンピュータ化方法であって、
カメラ・システムから複数の画素を持つ少なくとも１つの画像を受け取る段階と、
前記複数の画素の各々の画素のために一群の特徴を計算する段階と、
前記一群の特徴及び前記少なくとも１つの画像の幾何学的中心から一群の特徴の半径方向モーメントを導出する段階と、
前記一群の特徴から一群の特徴の中心モーメントを導出する段階と、
前記少なくとも１つの画像の面積と、前記導出された一群の特徴の半径方向モーメントに基づいて、半径方向モーメント正規化記述子を計算する段階と、
前記導出された一群の特徴の中心モーメントに基づいて、中心モーメント正規化記述子を計算する段階と、
前記半径方向モーメント正規化記述子及び前記中心モーメント正規化記述子の一方に基づいて、コンピュータにより、前記少なくとも１つの画像中の少なくとも１つのオブジェクトを認識する行為、前記少なくとも１つの画像中の少なくとも１つのオブジェクトを検出する行為、及び前記少なくとも１つの画像中の少なくとも１つのオブジェクトを分類する行為の内の少なくとも１つを行う段階と
を有し、
前記一群の特徴は等方性または異方性である、
コンピュータ化方法。
前記正規化記述子に基づいて、コンピュータにより、前記少なくとも１つの画像中の少なくとも１つのオブジェクトを認識する行為、前記少なくとも１つの画像中の少なくとも１つのオブジェクトを検出する行為、及び前記少なくとも１つの画像中の少なくとも１つのオブジェクトを分類する行為を行う段階を有する、請求項１記載の方法。
前記少なくとも１つのオブジェクトは車両であり、
前記カメラ・システムの一部分が空中ビデオ装置を含んでいる、請求項１または２に記載の方法。
更に、前記コンピュータから、前記認識されたオブジェクト、前記検出されたオブジェクト及び前記分類されたオブジェクトの内の１つの識別表示を出力する段階を含んでいる請求項１乃至３のいずれかに記載の方法。
前記一群の特徴から一群の特徴の中心モーメント不変量を導出する行為を有しており、
前記中心モーメント正規化記述子が、中心モーメント不変正規化記述子を含む、請求項１乃至４のいずれかに記載の方法。
前記少なくとも１つの画像は画像領域を有しており、
前記導出する段階はユーザー選択可能な次数を有している、請求項１乃至５のいずれかに記載の方法。
それぞれが前記複数の画素の各々の画素を画像特徴ベクトルにマッピングする２組のフィルタを用いるフィルタリング演算を実行して、異方性特徴の集合と等方性特徴の集合とを生成する段階を有する、請求項１乃至６のいずれかに記載の方法。
カメラ・システムから得られた画像の中のオブジェクトを分析するためのシステムであって、
カメラ・システムから複数の画素を持つ少なくとも１つの画像を受け取るシステムと、前記複数の画素の各々の画素のために一群の特徴を計算するシステムと、
前記一群の特徴及び前記少なくとも１つの画像の幾何学的中心から一群の特徴の半径方向モーメントを導出する行為、及び前記一群の特徴から一群の特徴の中心モーメントを導出する行為を行うシステムと、
前記少なくとも１つの画像の面積と、前記導出された一群の特徴の半径方向モーメントに基づいて、半径モーメント正規化記述子を計算すると共に、前記導出された一群の特徴の中心モーメントの内の一方とに基づいて、中心モーメント正規化記述子を計算するシステムと、
前記半径方向モーメント正規化記述子及び前記中心モーメント正規化記述子の一方に基づいて、前記少なくとも１つの画像中の少なくとも１つのオブジェクトを認識する行為、前記少なくとも１つの画像中の少なくとも１つのオブジェクトを検出する行為、及び前記少なくとも１つの画像中の少なくとも１つのオブジェクトを分類する行為の内の少なくとも１つを行うシステムと、
を有し、
前記一群の特徴は等方性または異方性である、
画像のオブジェクトを分析するためのシステム。
それぞれが前記複数の画素の各々の画素を画像特徴ベクトルにマッピングする２組のフィルタを用いるフィルタリング演算を実行して、異方性特徴の集合と等方性特徴の集合とを生成する行為を行うシステムと、
カメラ・システムを有している請求項８記載のシステム。