JP4575374B2 - ビデオの時間的な画像シーケンス中の移動オブジェクトを検出する方法 - Google Patents

ビデオの時間的な画像シーケンス中の移動オブジェクトを検出する方法 Download PDF

Info

Publication number
JP4575374B2
JP4575374B2 JP2006516831A JP2006516831A JP4575374B2 JP 4575374 B2 JP4575374 B2 JP 4575374B2 JP 2006516831 A JP2006516831 A JP 2006516831A JP 2006516831 A JP2006516831 A JP 2006516831A JP 4575374 B2 JP4575374 B2 JP 4575374B2
Authority
JP
Japan
Prior art keywords
image
feature
detection window
determining
features
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2006516831A
Other languages
English (en)
Other versions
JP2006527881A (ja
Inventor
ヴァイオラ、ポール・エイ
ジョーンズ、マイケル・ジェイ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Research Laboratories Inc
Original Assignee
Mitsubishi Electric Research Laboratories Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Research Laboratories Inc filed Critical Mitsubishi Electric Research Laboratories Inc
Publication of JP2006527881A publication Critical patent/JP2006527881A/ja
Application granted granted Critical
Publication of JP4575374B2 publication Critical patent/JP4575374B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • G06T7/246Analysis of motion using feature-based methods, e.g. the tracking of corners or segments
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • G06V10/443Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
    • G06V10/446Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering using Haar-like filters, e.g. using integral image techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/751Comparing pixel values or logical combinations thereof, or feature values having positional relevance, e.g. template matching
    • G06V10/7515Shifting the patterns to accommodate for positional errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/774Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/103Static body considered as a whole, e.g. static pedestrian or occupant recognition

Description

本発明は、包括的にはコンピュータビジョンおよびパターン認識に関し、特にビデオ中の歩行者のような移動オブジェクトの検出に関する。
画像中のオブジェクトを検出および認識するために、パターン認識手法が、コンピュータビジョンの領域でかなりの成功を収めており、その例としては、顔、自動車、および歩行者の検出がある。例えば、Avidan著「サポートベクトルの追跡(Support vector tracking)」(IEEE Conference on Computer Vision and Pattern Recognition, 2001)、Papageorgiou等著「オブジェクト検出のための一般的枠組み(A general framework for object detection)」(International Conference on Computer Vision, 1998)、Rowley等著「ニューラルネットワークによる顔検出(Neural network-based face detection)」(IEEE Patt. Anal. Mach. Intell., Volume 20, pages 22-38, 1998)、Schneiderman等著「顔および車に適用される3Dオブジェクト検出のための統計的方法(A statistical method for 3D object detection applied to faces and cars)」(International Conference on Computer Vision, 2000)、およびViola等著「ブーストされた単純な特徴のカスケードを用いた高速オブジェクト検出(Rapid object detection using a boosted cascade of simple features)」(IEEE Conference on Computer Vision and Pattern Recognition, 2001)を参照願いたい。
上記の手法は、通常、機械学習を用いて、多数の訓練画像から検出器またはフィルタを作成する。次に、フィルタで入力画像を走査し、ターゲットオブジェクトと一致する特徴パターンを見つける。上記のシステムの性能は、顔の検出の場合は、非常に良好であるが、歩行者の場合は、あまり思わしくない。これは、おそらく、歩行者の画像が、体の姿勢および衣服の変化のために、より多様であるのに対し、顔のテクスチャおよび構造は、極めて均一であり、動きも比較的少ないためである。したがって、時間順に並んだ画像シーケンスに対して、ならびに単一の静止画に対して機能する方法を提供することが望ましい。
歩行者の検出は、画像の解像度が比較的低い(例えば、ターゲットオブジェクトが合計で約100〜200画素、例えば、5×20画素または10×20画素しかない場合がある)監視用途ではより困難になる。より良好な画像強度の関数を用いた歩行者の検出の改良は、価値のある研究ではあるが、新たな解決策が必要とされている。
人間の動きのパターン、特に振り子のような歩行の動きは、他の種類の動きと区別可能であり、動きを用いて人物を認識および検出できることはよく知られている。Cutler等著「ロバストなリアルタイムの周期的な動き検出:分析と応用(Robust real-time periodic motion detection: Analysis and applications)」(IEEE Patt. Anal. Mach. Intell., Volume 22, pages 781-796, 2000)、Lee著「認識および分類のための歩行動態(Gait dynamics for recognition and classification)」(MIT AI Lab., Memo, AIM-2001-019, MIT, 2001)、Liu等著「空間および時間の周期性を見出す(Finding periodicity in space and time)」(IEEE International Conference on Computer Vision, pages 376-383, 1998)、およびPolana等著「活動の検出(Detecting activities)」(Journal of Visual Communication and Image Representation, June 1994)を参照願いたい。
強度による手法とは対照的に、上記の手法は、通常、多数のフレームにわたって移動オブジェクトを追跡し、次に動きを解析して、周期性または他の手がかりを探そうとする。動きの「スタイル」を検出するプロセスは、非常に効率的であり、画像全体の網羅的探索を複数の解像度スケールで行うことが可能である。大きな画像データセットで訓練されると、高い検出率および非常に低い誤認識率を達成することができる。
人間の動き解析の分野は、極めて広範であり、Hoffman等の文献「生物の動きの解釈(The interpretation of biological motion)」(Biological Cybernetics, pages 195-204, 1982)にまで遡る歴史がある。従来技術のシステムのほとんどは、問題の半分が既に解決済であり(すなわち、特定のタイプの移動オブジェクト、例えば、人物は、検出されており)、残る問題は、その特定の移動オブジェクトの長期にわたる動きのパターンを認識、分類、または解析することだけであるとみなしている。
最近では、動きによる方法に関心が高まっているが、これは、この方法が監視問題に応用できるためである。この分野の関連文献の優れた概要が、上記のCutler等に記載されている。Cutler等は、画像に直接機能するシステムを記載する。Cutler等のシステムは、まずオブジェクトの分割および追跡を行う。オブジェクトをオブジェクトの重心にそろえる。次に、2D格子を作成し、この2D格子に周期解析を適用する。
オブジェクト検出の分野も同様に広範であるが、強度情報と動き情報の両方を同時に用いて歩行者の直接検出を行うシステムは、知られていない。歩行者は、静止強度画像において、まずエッジを抽出し、次に、エッジをサンプルのセットと照合することによって検出されてきた。Gavrila等著「「スマートな」車両のためのリアルタイムなオブジェクト検出(Real-time object detection for "smart" vehicles)」(IEEE International Conference on Computer Vision, pages 87-93, 1999)を参照願いたい。Gavrila等のシステムは、高度に最適化されており、自動車に組み込まれる候補となっていたようである。それにもかかわらず、公表された検出率は、約75%であり、誤認識率は、1画像あたり2であった。他の関連文献としては、上記のPapageorgiou等のものがある。Papageorgiou等のシステムは、過完備なウェーブレットで訓練したサポートベクトルマシンを用いて歩行者を検出する。公表された実験データによると、Papageorgiou等の誤認識率は、関連する顔検出システムより著しく高い。
したがって、短期間の動き情報および外観情報のパターンを時間的な画像シーケンスから直接抽出して、歩行者のような移動オブジェクトの事象を検出することが望ましい。
本発明は、画像の強度情報および動き情報を共に統合することによって、特定のタイプの移動オブジェクトを検出するシステムを提供する。フィルタセットで結合画像セットを走査する。例えば、フィルタは、矩形であり、結合画像は、ビデオ中の連続する画像に関数を適用することによって得られる。フィルタでの走査により特徴値を生成する。特徴を総和し分類する。
分類器は、歩行者のような特定のタイプのオブジェクトの動き情報と外観情報の両方を利用するように訓練される。過去の手法の中には、動き情報に基づいて検出器を構築したものもあった。他の検出器は、外観情報に基づく。しかし、本発明は、単一の検出器に動き情報と外観情報の両方を統合する。
図1は、時間順に並んだ画像シーケンス101(すなわちビデオ)中の移動オブジェクト105(例えば、歩行者)を検出する方法100を示す。選択画像111を入力ビデオ101から得る(110)(例えば、隣接ペア、重複ペア、2枚おきの画像等)。選択画像111に関数102を適用して(120)、結合画像セット121を生成する。結合画像は、様々なサイズの検出ウィンドウまたは「パッチ」(例えば、画像全体、それぞれが画像の1/4である4つのウィンドウ等)に分割される。フィルタ200で結合画像セットの検出ウィンドウを走査して評価し、特徴131を求め(130)、これらの特徴131を総和して(140)累積スコアC141を得る。これらの累積スコアを分類して(150)、特定の検出ウィンドウが本当に特定のタイプの移動オブジェクト(例えば、歩行者105)を含むかどうかを判定する。これを全ての結合画像の、全ての検出ウィンドウについて繰り返し(151)、次に、ビデオ101中の全ての画像について繰り返す(152)。
フィルタ、特徴、および分類器
図2A〜図2Fに示すように、本発明の動的な歩行者検出器は、Viola他によって2002年7月22日付で出願された米国特許出願第10/200,726号「オブジェクト認識システム(Object Recognition System)」(参照により本明細書中に援用する)に記載されるような矩形フィルタ200を用いる。
図2Fは、包囲する検出ウィンドウ201(この例では、8つの結合画像202)に対する矩形フィルタ200を示す。何万もの他の単純な構成の矩形フィルタを用いることができることに留意すべきである。フィルタは、検出ウィンドウのサイズに合う様々なサイズにすることができる。2つの矩形フィルタの場合、影なしの矩形内の画素強度の総和を影付きの矩形内の画素強度の総和から引く。3つの矩形からなるフィルタの場合、影なしの矩形の画素の総和に2を掛け、2倍の数の影付き画素を構成する、等を行う。他の結合関数も本発明によるフィルタとともに用いることができる。本発明のフィルタの評価は、従来技術のより複雑なフィルタよりも非常に高速であるため、本フィルタの演算は、単純であることが好ましい。
Viola他は、1枚の画像中の静止した顔を検出するために矩形フィルタを用いる。本発明では、Viola他の研究を2つの方法で拡張する。第1に、本発明では、内部構成要素を対角線上に配置した矩形フィルタも用いる(図2Eを参照)。対角フィルタは、利点として、振り子のような足の動きの検出に適している。また、対角フィルタは、様々な向きのオブジェクトに敏感である。対角線の角度は、フィルタ内の構成要素である矩形のアスペクト比によって調整することができる。第2に、本発明では、後述のように、時間的にずれた画像の組み合わせにフィルタを適用する。これらの矩形フィルタは、その設計により、様々なスケール、向き、およびアスペクト比で極めて高速に評価されて領域平均を測定することができる。これらのフィルタは、いくぶん限定されるように思われるかもしれないが、歩行者のような特定の移動オブジェクトの検出精度を高めることができる有用な情報を提供することが証明できる。
正式には、本発明のフィルタ、特徴および分類器を用いた演算は、次のように定義される(さらなる詳細については、Viola他を参照)。次式に従って、画像特徴h(x)にαまたはβの重みを割り当てる。
Figure 0004575374
ここで、フィルタf(x)は、画像xの線形関数、すなわち検出ウィンドウであり、θは、所定のフィルタしきい値である。次式に従って、累積関数C(x)に1か0の値を割り当てる。
Figure 0004575374
ここで、hは、画像xの複数の特徴であり、Tは、所定の分類器しきい値である。外観と動きを同時に考慮する定義を後述する。
従来技術では、動き情報は、オプティカルフローおよびブロック動きの推定を含む様々な方法で、画像ペアから抽出された。ブロック動き推定は、推定のスケールを決める比較ウィンドウの指定を必要とする。これは、マルチスケールのオブジェクト検出と完全には対応しない。オブジェクト検出の状況で、オプティカルフローの推定は、通常、かなり時間がかかり、画素毎に何百回または何千回もの演算を必要とする。もっと高速なものが望ましい。
本発明を、分類器のために特徴値を求めるための矩形フィルタを用いて記載してきたが、他のタイプのフィルタを用いることもできることが理解されるべきである。例えば、ガボールフィルタまたはガウスフィルタといった他の線形または非線形フィルタを矩形フィルタの代わりに用いることもできる。矩形フィルタの利点は、評価の計算が極めて効率的であることである。しかし、他のタイプのフィルタの方がより複雑な動き情報および外観情報を取り込むことができる可能性があり、ゆえに有利である場合がある。Daugman「2次元の視覚皮質フィルタによって最適化された空間解像度、空間周波数、および向きの不確定性関係(Uncertainty Relation for Resolution in Space, Spatial Frequency, and Orientation Optimized by Two-Dimensional Visual Cortical Filters)」(J. Opt. Soc. Am. A, vol 2, no 7, pp. 1160-1169, July 1985)を参照願いたい。
結合画像
したがって、図3A〜図3Hに示すように、本発明の特徴は、Viola他の特徴と異なり、結合画像セット121に対して動作する。結合画像セットは、選択画像111に様々な関数102を適用することによって求めることができる。例えば、選択画像セットは、連続する画像ペア(交わらないまたは重複する)を含む。別法として、セットは、所定の期間にわたる9枚おきの画像を含むことができるか、または、3枚組の画像を含むことができる。選択画像111の他の組み合わせおよび時間順も可能である。
選択画像111に関数102を適用すると、「結合」画像が生成される。例えば、関数は単純に、セット中の1枚の画像を選択することができる(図3A)。関数は、セット中の選択画像を互いから引くことができる。この場合、結合画像は、差分画像すなわちデルタ画像として知られるものである(図3B)。差分の絶対値の総和が非ゼロである結合画像の(例えば、オブジェクトのエッジに沿った)領域は、動きに対応する。動きの大きさおよび方向もまた後述のように求めることができる。
動きの方向は、選択画像111に他の関数102を適用することによって求めることができる。例えば、関数は、セット中の画像を「シフト」してから差分を求めることができる。シフトは、例えば、実質的に画像平面における線形の動き、円形の動き、または画像平面に略垂直な動きを検出するための線形、回転、スケール、またはその組み合わせとすることができる。図3Cおよび図3Dは、上(U)および下(D)にシフトした画像を示し、図3Eおよび図3Fは、左(L)および右(R)にシフトした画像を示し、図3Gは、回転(R○:このR○は、以下の記載も含め、Rを○で囲んだものを意味し、回転を指す)させた画像を示し、図3Hは、スケール(s)のシフトを示す。この関数グループは、次式によって表すことができる。
Figure 0004575374
ここで、IおよびIt+1は、時間で表した画像であり、矢印は、線形シフト演算子を示し、R○は、回転であり、sは、スケーリングを示す。シフトは、1つまたはそれ以上の画素とすることができる。他の差分、および他のシフト演算も可能であるが、上記の例は、本発明の目的で計算が単純で速いことに留意すべきである。
ある動き特徴は、差分画像Δと、グループ{U、L、R、D、R○、s}のシフトした画像のうち1つまたはそれ以上との間の差分の絶対値の総和をf=r(Δ)−r(S)に従って比較し、ここで、Sは、{U、L、R、D、R○、s}のうちの1つであり、rは、検出ウィンドウ内の総和である。これらの特徴は、特定の領域が所与の方向に移動している可能性に関連する情報を抽出する。
別の動き特徴は、同一画像内の総和をf=φ(S)に従って比較し、ここで、φは図2A〜図2Fに示した例のようなフィルタである。これらの特徴は、動きのブレを近似的に測定する。
別の動き特徴は、動き画像のうち1つにおける動きの大きさをf=r(S)として測定する。
動きの大きさは、セット中の画像間の時間差分によって求めることもできる。
本発明では、セット中の単一の画像に対して動作するフィルタf=φ(I)を用いる外観特徴も用いる。
画像のある領域において、移動オブジェクトが一旦検出されると、それ以後の画像でオブジェクトを追跡して、動きの大きさおよび方向をよりよく理解することが可能であることに留意すべきである。移動オブジェクトの位置が既知であるため、それ以後の画像では小部分のみを評価すればよく、これは、より速いフレームレートで行うことができる。
動き特徴ならびに外観特徴は、関数{I、Δ、U、D、L、R、R○、s}の「統合画像」を用いて高速に評価することができる。フィルタは、検出ウィンドウに適合する限り、任意のサイズ、アスペクト比、または向きとすることができるため、可能な動き特徴および外観特徴は、非常に多い。フィルタは、様々なサイズにスケーリングすることもできる。これらのフィルタは、高速処理のためにキャッシュに記憶することができる。訓練中、陽性の例を陰性の例と最もよく分離する特徴を選択する。
動き特徴F131は、次式で表される。
Figure 0004575374
そして、累積スコア141は、次式で表される。
Figure 0004575374
画像ピラミッド
複数のスケールでの検出をサポートするために、関数102{上矢印、↓、←、→、R○、s}を検出スケールに関して定義する。これにより、動き速度の測定を確実にスケールに対して不変の方法で行うようにする。スケールに対する不変性は、訓練画像を20×15画素の基本解像度にスケーリングすることによって、訓練中に達成される。スケールに対する検出の不変性は、画像ピラミッドに対して操作を行うことによって達成される。最初に、IおよびIt+1のピラミッドを計算する。{Δ、U、D、L、R、R○、s}のピラミッド表現は、次のように計算される。
Figure 0004575374
ここで、Xは、ピラミッドのl番目の階層を示す。スケーリングした20×15の訓練画像から学習される分類器および特徴は、スケールに対して不変の方法でピラミッドの各階層に対して動作する。
訓練
訓練プロセスは、Adaboostを用いて、特徴のサブセットを選択し、分類器を作成する。Adaboostは、効果的な学習アルゴリズム、および一般化された性能に対する強力な制限を提供する。Freund等著「オンライン学習の決定理論的な一般化およびブースティングへの応用(A decision-theoretic generalization of on-line learning and an application to boosting)」(Computational Learning Theory, Eurocolt '95, pages 23-37. Springer-Verlag, 1995)、Schapire等著「票差のブースティング:投票方法の有効性に対する新たな説明(Boosting the margin: A new explanation for the effectiveness of voting methods)」(Proceedings of the Fourteenth International Conference on Machine Learning, 1997)、およびTieu等著「画像の取り出しをブーストする(Boosting image retrieval)」(International Conference on Computer Vision, 2000)を参照願いたい。
発明の効果
本発明は、ビデオシーケンス中の移動オブジェクトを検出する方法を提供する。本方法は、矩形フィルタを用いて、結合画像を走査し、その特徴を求める。特徴を総和して、歩行者のような特定の移動オブジェクトを検出する。
本発明を好適な実施形態の例として説明してきたが、本発明の精神および範囲内で様々な他の適応および修正を行うことができることが理解される。したがって、添付の特許請求の範囲の目的は、本発明の真の精神および範囲に入る変形および修正をすべて網羅することである。
本発明による、移動オブジェクトを検出する方法のフロー図である。 本発明によって用いられる矩形フィルタのブロック図である。 本発明によって用いられる矩形フィルタのブロック図である。 本発明によって用いられる矩形フィルタのブロック図である。 本発明によって用いられる矩形フィルタのブロック図である。 本発明によって用いられる矩形フィルタのブロック図である。 本発明によって用いられる矩形フィルタのブロック図である。 本発明によって用いられる結合画像のブロック図である。 本発明によって用いられる結合画像のブロック図である。 本発明によって用いられる結合画像のブロック図である。 本発明によって用いられる結合画像のブロック図である。 本発明によって用いられる結合画像のブロック図である。 本発明によって用いられる結合画像のブロック図である。 本発明によって用いられる結合画像のブロック図である。 本発明によって用いられる結合画像のブロック図である。

Claims (16)

  1. ビデオの時間的な画像シーケンス中の移動オブジェクトを検出する方法であって、
    時間順に並んだ画像シーケンスから画像を選択することと、
    複数の選択画像の差分画像、および前記複数の選択画像の1枚ごとの単一画像を含んで構成される結合画像セットを生成するために、前記差分画像を求めるための関数セットを適用することと、
    前記結合画像セット中の前記単一画像の検出ウィンドウについて所望の外観特徴との一致度を求めるための2次元フィルタを走査することで抽出される外観特徴と、前記結合画像セット中の前記差分画像の検出ウィンドウについて動きの大きさあるいは方向を求めるための2次元フィルタを走査することで抽出される動き特徴のそれぞれの特徴を求めるために前記結合画像セット中の検出ウィンドウについて複数の2次元フィルタを走査してそれぞれの特徴を求めることと、
    前記動き特徴および外観特徴を統合した特徴として、求めたそれぞれの特徴を総和して累積スコアを求めることと、
    前記累積スコアが所定のしきい値よりも大きい場合に、前記移動オブジェクトを含むものとして前記検出ウィンドウを分類することと
    を含むビデオの時間的な画像シーケンス中の移動オブジェクトを検出する方法。
  2. 前記移動オブジェクトは、歩行者である請求項1に記載の方法。
  3. 前記選択画像は、隣接する画像ペアである請求項1に記載の方法。
  4. 前記選択すること、前記適用すること、前記特徴を求めること、前記累積スコアを求めること、および前記分類することは、前記ビデオ全体について繰り返される請求項1に記載の方法。
  5. 各結合画像を検出ウィンドウセットに分割することと、
    前記特徴を求めること、前記累積スコアを求めること、および前記分類することを前記各検出ウィンドウについて繰り返すことと
    をさらに含む請求項1に記載の方法。
  6. 前記外観特徴および前記動き特徴を抽出するためのそれぞれの前記2次元フィルタは、対角線上に配置された複数の矩形フィルタを含んで構成される請求項1に記載の方法。
  7. 前記複数の矩形フィルタは、関連する前記検出ウィンドウに適合するようなサイズである請求項6に記載の方法。
  8. 前記特徴を求めることは、検出ウィンドウxについてj番目の特徴h として前記外観特徴または前記動き特徴を求めるための2次元フィルタをf(x)とし、前記2次元フィルタf(x)により抽出された特徴のしきい値をθとして、下式
    Figure 0004575374
    に従って、j番目の特徴hをαまたはβの重みのいずれかとして求める請求項1に記載の方法。
  9. 前記累積スコアを求めることは、Tを所定の分類器のしきい値として、前記特徴hに基づいて下式
    Figure 0004575374
    に従って、累積和C(x)を1または0の値に割り当てることで前記累積スコアを求める請求項8に記載の方法。
  10. 前記差分画像は、シフトした選択画像の差分である請求項1に記載の方法。
  11. 前記シフトは、線形である請求項10に記載の方法。
  12. 前記シフトは、回転である請求項10に記載の方法。
  13. 前記シフトは、スケールを拡大縮小するものである請求項10に記載の方法。
  14. 前記関数セットにおける前記シフトの量は、前記検出ウィンドウの大きさに応じて定義される請求項1に記載の方法。
  15. 前記移動オブジェクトの動きの方向を求めることをさらに含む請求項1に記載の方法。
  16. 前記移動オブジェクトの動きの大きさを求めることをさらに含む請求項1に記載の方法。
JP2006516831A 2003-06-17 2004-05-31 ビデオの時間的な画像シーケンス中の移動オブジェクトを検出する方法 Active JP4575374B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/463,800 US7212651B2 (en) 2003-06-17 2003-06-17 Detecting pedestrians using patterns of motion and appearance in videos
PCT/JP2004/007866 WO2004114219A1 (en) 2003-06-17 2004-05-31 Method for detecting a moving object in a temporal sequence of images of a video

Publications (2)

Publication Number Publication Date
JP2006527881A JP2006527881A (ja) 2006-12-07
JP4575374B2 true JP4575374B2 (ja) 2010-11-04

Family

ID=33517147

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006516831A Active JP4575374B2 (ja) 2003-06-17 2004-05-31 ビデオの時間的な画像シーケンス中の移動オブジェクトを検出する方法

Country Status (5)

Country Link
US (1) US7212651B2 (ja)
EP (1) EP1634244B1 (ja)
JP (1) JP4575374B2 (ja)
CN (1) CN100550055C (ja)
WO (1) WO2004114219A1 (ja)

Families Citing this family (78)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8788020B2 (en) 1998-10-23 2014-07-22 Varian Medical Systems, Inc. Method and system for radiation application
US7259784B2 (en) 2002-06-21 2007-08-21 Microsoft Corporation System and method for camera color calibration and image stitching
US20050046703A1 (en) * 2002-06-21 2005-03-03 Cutler Ross G. Color calibration in photographic devices
US7495694B2 (en) * 2004-07-28 2009-02-24 Microsoft Corp. Omni-directional camera with calibration and up look angle improvements
US20050117015A1 (en) * 2003-06-26 2005-06-02 Microsoft Corp. Foveated panoramic camera system
US20050053267A1 (en) * 2003-09-05 2005-03-10 Varian Medical Systems Technologies, Inc. Systems and methods for tracking moving targets and monitoring object positions
US7590941B2 (en) * 2003-10-09 2009-09-15 Hewlett-Packard Development Company, L.P. Communication and collaboration system using rich media environments
JP3934119B2 (ja) * 2004-06-14 2007-06-20 本田技研工業株式会社 車両周辺監視装置
US7593057B2 (en) * 2004-07-28 2009-09-22 Microsoft Corp. Multi-view integrated camera system with housing
US7466841B2 (en) * 2004-08-16 2008-12-16 Siemens Corporate Research, Inc. Method for traffic sign detection
US7885440B2 (en) * 2004-11-04 2011-02-08 Dr Systems, Inc. Systems and methods for interleaving series of medical images
US7768544B2 (en) * 2005-01-21 2010-08-03 Cutler Ross G Embedding a panoramic image in a video stream
US7286707B2 (en) * 2005-04-29 2007-10-23 National Chiao Tung University Object-detection method multi-class Bhattacharyya Boost algorithm used therein
JP4767595B2 (ja) * 2005-06-15 2011-09-07 パナソニック株式会社 対象物検出装置及びその学習装置
US7576766B2 (en) * 2005-06-30 2009-08-18 Microsoft Corporation Normalized images for cameras
DE102005038603A1 (de) 2005-08-16 2007-02-22 Robert Bosch Gmbh Verfahren und Vorrichtung zur Verfolgung eines Objekts in einer Bildersequenz
US7630571B2 (en) * 2005-09-15 2009-12-08 Microsoft Corporation Automatic detection of panoramic camera position and orientation table parameters
US20070189607A1 (en) * 2005-10-17 2007-08-16 Siemens Corporate Research Inc System and method for efficient feature dimensionality and orientation estimation
US8024189B2 (en) 2006-06-22 2011-09-20 Microsoft Corporation Identification of people using multiple types of input
US7697839B2 (en) * 2006-06-30 2010-04-13 Microsoft Corporation Parametric calibration for panoramic camera systems
EP1912157A1 (en) * 2006-10-09 2008-04-16 MAGNETI MARELLI SISTEMI ELETTRONICI S.p.A. Digital image processing system for automatically representing surrounding scenes to the driver of a vehicle for driving assistance, and corresponding operating method
US20080147488A1 (en) * 2006-10-20 2008-06-19 Tunick James A System and method for monitoring viewer attention with respect to a display and determining associated charges
US8259806B2 (en) * 2006-11-30 2012-09-04 Dolby Laboratories Licensing Corporation Extracting features of video and audio signal content to provide reliable identification of the signals
WO2008065764A1 (en) * 2006-11-30 2008-06-05 Mitsubishi Electric Corporation Motion vector detecting device
US20080255840A1 (en) * 2007-04-16 2008-10-16 Microsoft Corporation Video Nametags
US8245043B2 (en) * 2007-06-15 2012-08-14 Microsoft Corporation Audio start service for Ad-hoc meetings
US8526632B2 (en) * 2007-06-28 2013-09-03 Microsoft Corporation Microphone array for a camera speakerphone
US8300080B2 (en) 2007-06-29 2012-10-30 Microsoft Corporation Techniques for detecting a display device
US8165416B2 (en) * 2007-06-29 2012-04-24 Microsoft Corporation Automatic gain and exposure control using region of interest detection
US8330787B2 (en) 2007-06-29 2012-12-11 Microsoft Corporation Capture device movement compensation for speaker indexing
US8219387B2 (en) * 2007-12-10 2012-07-10 Microsoft Corporation Identifying far-end sound
US8744069B2 (en) * 2007-12-10 2014-06-03 Microsoft Corporation Removing near-end frequencies from far-end sound
US8433061B2 (en) * 2007-12-10 2013-04-30 Microsoft Corporation Reducing echo
US8314829B2 (en) 2008-08-12 2012-11-20 Microsoft Corporation Satellite microphones for improved speaker detection and zoom
US10667727B2 (en) 2008-09-05 2020-06-02 Varian Medical Systems, Inc. Systems and methods for determining a state of a patient
MY159289A (en) * 2008-09-24 2016-12-30 Mimos Berhad A system and a method for identifying human behavioural intention based on an effective motion analysis
US8909572B2 (en) * 2008-10-03 2014-12-09 The Trustees Of Columbia University In The City Of New York Systems, methods, and media for performing classification using a boosted classifier
KR101192365B1 (ko) * 2008-12-18 2012-10-17 한국전자통신연구원 얼굴 검출 시스템 및 그 방법
JP2010165052A (ja) * 2009-01-13 2010-07-29 Canon Inc 画像処理装置及び画像処理方法
US8509526B2 (en) * 2010-04-13 2013-08-13 International Business Machines Corporation Detection of objects in digital images
JP4712907B2 (ja) * 2010-10-12 2011-06-29 パナソニック株式会社 対象物検出装置及びその学習装置
JP4741036B2 (ja) * 2011-02-18 2011-08-03 パナソニック株式会社 特徴抽出装置、対象物検出装置、特徴抽出方法、および対象物検出方法
KR101289087B1 (ko) * 2011-11-03 2013-08-07 인텔 코오퍼레이션 얼굴 검출 방법, 장치, 및 이 방법을 실행하기 위한 컴퓨터 판독 가능한 기록 매체
US20130156343A1 (en) * 2011-12-20 2013-06-20 Harman International Industries, Incorporated System for communicating relationship data associated with image characteristics
US8594488B1 (en) * 2012-03-13 2013-11-26 Google Inc. Methods and systems for video retargeting using motion saliency
CN103366177B (zh) * 2012-03-28 2016-12-07 佳能株式会社 对象检测分类器生成方法和设备、图像对象检测方法和设备
FR2990038A1 (fr) 2012-04-25 2013-11-01 St Microelectronics Grenoble 2 Procede et dispositif de detection d'un objet dans une image
US9260122B2 (en) * 2012-06-06 2016-02-16 International Business Machines Corporation Multisensor evidence integration and optimization in object inspection
JP6121997B2 (ja) * 2012-06-14 2017-04-26 トヨタ自動車株式会社 識別器生成装置およびパターン検出装置
KR20140013142A (ko) * 2012-07-18 2014-02-05 삼성전자주식회사 이미지에서 목표를 검출하는 목표 검출 방법 및 이미지 처리 장치
US9633436B2 (en) 2012-07-26 2017-04-25 Infosys Limited Systems and methods for multi-dimensional object detection
US9336436B1 (en) * 2013-09-30 2016-05-10 Google Inc. Methods and systems for pedestrian avoidance
GB2519620B (en) * 2013-10-23 2015-12-30 Imagination Tech Ltd Skin colour probability map
CN104881881B (zh) 2014-02-27 2018-04-10 株式会社理光 运动对象表示方法及其装置
US10460194B2 (en) * 2014-03-07 2019-10-29 Lior Wolf System and method for the detection and counting of repetitions of repetitive activity via a trained network
JP6609505B2 (ja) * 2016-04-06 2019-11-20 Kddi株式会社 画像合成装置及びプログラム
US10241514B2 (en) 2016-05-11 2019-03-26 Brain Corporation Systems and methods for initializing a robot to autonomously travel a trained route
US10282849B2 (en) * 2016-06-17 2019-05-07 Brain Corporation Systems and methods for predictive/reconstructive visual object tracker
US10016896B2 (en) * 2016-06-30 2018-07-10 Brain Corporation Systems and methods for robotic behavior around moving bodies
CN106203276A (zh) * 2016-06-30 2016-12-07 中原智慧城市设计研究院有限公司 一种视频客流统计系统及客流统计方法
WO2018009552A1 (en) 2016-07-05 2018-01-11 Nauto Global Limited System and method for image analysis
EP3481661A4 (en) 2016-07-05 2020-03-11 Nauto, Inc. AUTOMATIC DRIVER IDENTIFICATION SYSTEM AND METHOD
EP3497405B1 (en) 2016-08-09 2022-06-15 Nauto, Inc. System and method for precision localization and mapping
JP6940612B2 (ja) 2016-09-14 2021-09-29 ナウト, インコーポレイテッドNauto, Inc. ニアクラッシュ判定システムおよび方法
US10733460B2 (en) 2016-09-14 2020-08-04 Nauto, Inc. Systems and methods for safe route determination
CN106504266B (zh) * 2016-09-29 2019-06-14 北京市商汤科技开发有限公司 行走行为的预测方法和装置、数据处理装置和电子设备
US10274325B2 (en) 2016-11-01 2019-04-30 Brain Corporation Systems and methods for robotic mapping
US10001780B2 (en) 2016-11-02 2018-06-19 Brain Corporation Systems and methods for dynamic route planning in autonomous navigation
EP3535646A4 (en) 2016-11-07 2020-08-12 Nauto, Inc. SYSTEM AND METHOD FOR DETERMINING DRIVER DISTRACTION
US10723018B2 (en) 2016-11-28 2020-07-28 Brain Corporation Systems and methods for remote operating and/or monitoring of a robot
US10852730B2 (en) 2017-02-08 2020-12-01 Brain Corporation Systems and methods for robotic mobile platforms
WO2018229550A1 (en) 2017-06-16 2018-12-20 Nauto Global Limited System and method for adverse vehicle event determination
US10552671B2 (en) * 2017-11-22 2020-02-04 King Fahd University Of Petroleum And Minerals Multi-kernel fuzzy local Gabor feature extraction method for automatic gait recognition
WO2019169031A1 (en) 2018-02-27 2019-09-06 Nauto, Inc. Method for determining driving policy
CN108520216B (zh) * 2018-03-28 2022-05-03 电子科技大学 一种基于步态图像的身份识别方法
US11050933B2 (en) * 2018-04-27 2021-06-29 Continenal Automotive Systems, Inc. Device and method for determining a center of a trailer tow coupler
US10951859B2 (en) 2018-05-30 2021-03-16 Microsoft Technology Licensing, Llc Videoconferencing device and method
KR102198912B1 (ko) * 2018-09-21 2021-01-06 네이버웹툰 유한회사 비디오 영상 내의 행동 인식 방법 및 장치

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5150426A (en) * 1990-11-20 1992-09-22 Hughes Aircraft Company Moving target detection method using two-frame subtraction and a two quadrant multiplier
JP3300092B2 (ja) * 1993-02-19 2002-07-08 オリンパス光学工業株式会社 画像特徴抽出装置
GB9308952D0 (en) * 1993-04-30 1993-06-16 Philips Electronics Uk Ltd Tracking objects in video sequences
JPH1091795A (ja) * 1996-09-12 1998-04-10 Toshiba Corp 移動物体検出装置及び移動物体検出方法
WO1998028706A1 (en) * 1996-12-23 1998-07-02 Esco Electronics Corporation Low false alarm rate video security system using object classification
JP3725784B2 (ja) * 1998-08-07 2005-12-14 コリア インスティテュート オブ サイエンス アンド テクノロジー 色フレームイメージシーケンスで移動体を検出する装置及び方法
JP3141004B2 (ja) * 1998-08-31 2001-03-05 インターナショナル・ビジネス・マシーンズ・コーポレ−ション 動画中のオブジェクトを分類する方法
US7099510B2 (en) * 2000-11-29 2006-08-29 Hewlett-Packard Development Company, L.P. Method and system for object detection in digital images
US6778705B2 (en) * 2001-02-27 2004-08-17 Koninklijke Philips Electronics N.V. Classification of objects through model ensembles
TW503650B (en) * 2001-04-13 2002-09-21 Huper Lab Co Ltd Method using image screen to detect movement of object
JP2003044853A (ja) * 2001-05-22 2003-02-14 Matsushita Electric Ind Co Ltd 顔検出装置、顔向き検出装置、部分画像抽出装置及びそれらの方法
US7177445B2 (en) * 2002-04-16 2007-02-13 Koninklijke Philips Electronics N.V. Discriminating between changes in lighting and movement of objects in a series of images using different methods depending on optically detectable surface characteristics

Also Published As

Publication number Publication date
CN1698069A (zh) 2005-11-16
JP2006527881A (ja) 2006-12-07
EP1634244B1 (en) 2013-09-18
US7212651B2 (en) 2007-05-01
WO2004114219A1 (en) 2004-12-29
EP1634244A1 (en) 2006-03-15
CN100550055C (zh) 2009-10-14
US20040258307A1 (en) 2004-12-23

Similar Documents

Publication Publication Date Title
JP4575374B2 (ja) ビデオの時間的な画像シーケンス中の移動オブジェクトを検出する方法
Viola et al. Detecting pedestrians using patterns of motion and appearance
Dang et al. Review and comparison of face detection algorithms
Kölsch et al. Robust Hand Detection.
Wu et al. A detection system for human abnormal behavior
Jia et al. Visual tracking via coarse and fine structural local sparse appearance models
Jun et al. Robust real-time face detection using face certainty map
Chetverikov et al. Dynamic texture as foreground and background
Qazi et al. Human action recognition using SIFT and HOG method
Mekonnen et al. Comparative evaluations of selected tracking-by-detection approaches
Silambarasi et al. 3D spatial-temporal view based motion tracing in human action recognition
Kruppa et al. Using Local Context To Improve Face Detection.
Lobachev et al. Machine learning models and methods for human gait recognition
Corvee et al. Combining face detection and people tracking in video sequences
Farhadi et al. Efficient human detection based on parallel implementation of gradient and texture feature extraction methods
Socolinsky et al. Fast face detection with a boosted cccd classifier
Singh et al. Development of accurate face recognition process flow for authentication
Khan et al. A new approach for human identification using AI
Yashwanth et al. STIP based activity recognition
Nesvadba et al. Towards a real-time and distributed system for face detection, pose estimation and face-related features
Vijayakumar et al. Video Surveillance for Intruder Detection and Tracking
Chen et al. Multi-view Human Head Detection in Static Images.
Song et al. Subsampling-based HOG for Multi-scale real-time Pedestrian Detection
Gupta FACE DETECTION AND TRACKING
Ahad et al. A simple approach for low-resolution activity recognition

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070419

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20070530

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070629

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100201

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100216

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100517

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100608

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100722

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100817

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100819

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 4575374

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130827

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250