JP4974975B2 - 画像において物体の位置を特定する方法及びシステム - Google Patents
画像において物体の位置を特定する方法及びシステム Download PDFInfo
- Publication number
- JP4974975B2 JP4974975B2 JP2008183867A JP2008183867A JP4974975B2 JP 4974975 B2 JP4974975 B2 JP 4974975B2 JP 2008183867 A JP2008183867 A JP 2008183867A JP 2008183867 A JP2008183867 A JP 2008183867A JP 4974975 B2 JP4974975 B2 JP 4974975B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- descriptor
- transformation
- regression function
- motion
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/20—Analysis of motion
- G06T7/277—Analysis of motion involving stochastic approaches, e.g. using Kalman filters
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10016—Video; Image sequence
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30241—Trajectory
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30248—Vehicle exterior or interior
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Image Analysis (AREA)
Description
状態・空間推定方法は、通常、マルコフ過程を使用し、動きパラメータの確率密度関数(pdf)を構築する。たとえば、カルマンフィルタリングは正規分布を使用する。しかしながら、カルマンフィルタリング方法は、多峰(マルチモーダル)分布について述べていない。
モデル整合方法は、物体モデルと画像において見られるような物体との間の差に基づいてコスト関数を定義する。コスト関数は、動きパラメータを最小化することによって解かれる。一例はオプティカルフロー推定であり、そこでは、物体モデルと画像強度との間の二乗差の和が、反復最小二乗問題として最小化される。この方法の主な問題は、各反復に対して画像勾配、ヤコビアン行列及びヘッセ行列の計算が必要であるということであり、それによって方法は低速になる。
リー代数を使用して、平均値シフト演算を使用する堅固な動き推定に対し、ユークリッド運動群構造を有する分布のモードを見つけることができる。動きが大きい場合、平均値シフトは失敗する可能性があることが知られている。リー代数に対しベクトル加算演算が定義されることによって、アフィン「スネーク(snake)」を追跡する一連のアフィン動きが組み込まれる。
図1は、本発明の一実施形態による、一連の画像Ii110において移動する物体115を追跡する方法及びシステム100を示す。一連の画像110を、カメラ102によって取得することができる。別法として、一連の画像110を、永久メモリ又は通信インタフェースから方法100に提供してもよい。一般性を失うことなく、方法100を、物体115の非線形の動きに関して説明する。しかしながら、本方法は、いかなるタイプの動きを伴う物体をも追跡することができる。
本発明の実施形態を、物体115のパラメトリック動き変換A(2)について説明する。パラメトリック変換は、所与の変数に適用されるパラメータの関数である。変数には、ピクセル特徴、領域特徴、ピクセル座標及び領域座標が含まれる。パラメータは、たとえば、アフィン、透視動き変換、並びに有限数のパラメータによって表すことができる他の線形及び非線形の、剛体運動変換及び非剛体運動変換を含む。本発明はまた、他の動き変換、たとえば相似変換S(2)及びユークリッド運動SE(2)と使用することも可能である。
図3は、物体115を囲む単位正方形201の表現を示す。単位正方形は、物体座標における単位正方形201内部の規則的な格子において確定されるいくつかの勾配方向ヒストグラムを含む。スケール不変特徴変換(scale invariant feature transform)(SIFT)記述子と同様に、ヒストグラムに対する各ピクセルの寄与は、ピクセルの勾配の大きさに比例する。単位正方形301は、6×6=36のブロック302に分割され、各ブロックに対してヒストグラムが確定される。これについては、参照により本明細書に援用される、D.Lowe著、「Distinctive image features from scale−invariant Keypoints」(Intl.J.of Comp.Vision,60(2):91−110,2004)を参照されたい。
図4は、本発明の実施形態による、回帰関数f140を訓練する方法を示す。訓練の結果は、回帰係数Ωの推定値である。回帰係数は、物体記述子oを動き変換ΔMと相関させる。回帰関数が訓練され画像に適用される方法は、物体追跡及び物体検出の場合と同じである。
訓練中、物体115の初期位置は、一連の画像110の初期(訓練)画像I0420における初期追跡領域160によって近似される。追跡領域160は、概して、画像座標による物体115の位置を示す。したがって、物体座標における物体115の位置の位置変換行列M0460もまた既知である。物体検出のために、訓練に、物体を含む訓練画像が提供される。図7を参照されたい。
d次元多様体は位相空間であり、局所的にユークリッド空間に類似する。多様体上のすべての点が近傍を有し、それに対して同相写像が存在し、それは近傍をRdに写像する。
訓練セット410に基づく訓練480中、回帰係数Ω470が推定される。回帰係数470は、物体記述子oを動き変換ΔMと相関させる。これ説明するために、回帰関数Ω470は、回帰関数140に相当する。
物体115の外観は時間の経過によって変化する可能性がある。シーンの照明の量もまた変化する可能性がある。これは特に、自然の屋外の設定で物体を追跡する場合に当てはまる。したがって、本発明では、前に処理された画像及び追跡領域に従って訓練セット410を更新する(450)。
図6は、本発明による物体追跡方法の擬似コードである。ここでは、回帰関数f140を訓練する。追跡は、式(4)を使用して、画像間の物体の動き150を推定し、式(3)を使用して位置Mを更新する(170)。
図7は、本発明の実施形態による、ターゲット画像702において物体領域を検出する方法を示す。訓練領域710に物体を含む(初期)訓練画像701で開始する。ここでは、現実世界の座標に関して、又はターゲット画像における物体の姿勢に関して、物体の相対的な姿勢については既知ではない。ここで姿勢とは、物体の3次元位置及び3次元方向を意味する。たとえば、訓練画像における車の視点は側面からである場合があり、ターゲット画像における同じ車の視点は正面からである場合がある。姿勢が異なる可能性があるため、物体のサイズもまた2つの画像で異なる可能性がある。本発明では、訓練画像701から物体記述子715を生成し、たとえば、記述子は上述したように方向ヒストグラムである。別法として、他の記述子、たとえば外観、統計を使用することも可能である。
物体の検出及び追跡のための上記方法を、他の次元まで拡張することができる。たとえば、3次元空間において3次元物体を検出し追跡することができる。パラメトリック変換及び記述子は、対応するより高次元か又はより低次元で定義される。たとえば、3次元物体を、サーフェスマップ、ボリュームデータ又は3次元距離によって定義することができる。
Claims (18)
- 画像において物体の位置を特定する方法であって、
訓練画像における領域にパラメトリック変換のセットを適用するステップであって、変換領域のセットを確定し、前記パラメトリック変換のパラメータがリー代数に写像され、前記領域が物体を含む、適用するステップと、
各変換領域に対し物体記述子を確定するステップと、
前記パラメトリック変換のセットと前記物体記述子のセットとから回帰関数を訓練するステップと、
ターゲット画像から前記物体記述子を確定するステップと、
前記ターゲット画像における前記物体の位置を確定するために、前記ターゲット画像の前記物体記述子に対し前記回帰関数を適用するステップと、
を含む、画像において物体の位置を特定する方法。 - 移動する物体の一連のターゲット画像の各ターゲット画像に対し前記物体記述子を確定するステップと、
前記移動する物体の位置を確定するために、各物体記述子に対し前記回帰関数を適用するステップと、
をさらに含む、請求項1に記載の画像において物体の位置を特定する方法。 - 前記移動する物体の位置に従って前記領域の位置を更新するステップをさらに含む、請求項2に記載の画像において物体の位置を特定する方法。
- 前記パラメトリック変換はアフィンである、請求項1に記載の画像において物体の位置を特定する方法。
- 前記パラメトリック変換は透視である、請求項1に記載の画像において物体の位置を特定する方法。
- 前記画像は深度写像に対応する、請求項2に記載の画像において物体の位置を特定する方法。
- 各画像はボリュメトリックデータセットであり、前記位置は3次元である、請求項1に記載の画像において物体の位置を特定する方法。
- 前記パラメータは、行列対数演算によって前記リー代数に写像される、請求項1に記載の画像において物体の位置を特定する方法。
- 前記領域は、前記物体記述子を確定するように単位領域に写像される、請求項1に記載の画像において物体の位置を特定する方法。
- 前記物体記述子は方向ヒストグラムである、請求項1に記載の画像において物体の位置を特定する方法。
- 前記物体記述子は共分散行列である、請求項1に記載の画像において物体の位置を特定する方法。
- 前記移動する物体の位置を確定するために、各物体記述子に対し前記回帰関数を適用するステップは、前記移動する物体の画像において物体の位置を特定する位置の尤度が前記物体の前の位置の尤度を下回るまで繰り返される、請求項2に記載の画像において物体の位置を特定する方法。
- 前記物体記述子及び前記回帰関数は行列であり、前記ターゲット画像における前記物体の位置を確定するために、前記ターゲット画像の前記物体記述子に対し前記回帰関数を適用するステップは行列乗算である、請求項1に記載の画像において物体の位置を特定する方法。
- 各ターゲット画像に対し前記回帰関数の係数を更新するステップをさらに含む、請求項2に記載の画像において物体の位置を特定する方法。
- 前記ターゲット画像を複数の窓に分割するステップと、
各窓に対し前記物体記述子を確定するステップと、
各窓に対し収束窓を確定するために、各窓の前記物体記述子に対し前記回帰関数を適用するステップと、
各収束窓に対し窓記述子を確定するステップと、
各収束窓に対し類似性スコアを確定するために、前記領域の前記物体記述子を各窓記述子と比較するステップと、
前記ターゲット画像における前記物体の位置として、スコアが最高である前記収束窓に関連する前記窓を選択するステップと、
を含む、請求項1に記載の画像において物体の位置を特定する方法。 - 画像において物体の位置を特定するシステムであって、
訓練画像における領域にパラメトリック変換のセットを適用する手段であって、変換領域のセットを確定し、前記パラメトリック変換のパラメータがリー代数に写像され、前記領域が物体を含む、適用する手段と、
各変換領域に対し物体記述子を確定する手段と、
前記リー代数に写像される前記パラメトリック変換のセットと前記物体記述子のセットとから回帰関数を訓練する手段と、
ターゲット画像から前記物体記述子を確定する手段と、
前記ターゲット画像における前記物体の位置を確定するために、前記ターゲット画像の前記物体記述子に対し前記回帰関数を適用する手段と、
を具備する、画像において物体の位置を特定するシステム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US11/862,554 | 2007-09-27 | ||
US11/862,554 US7961952B2 (en) | 2007-09-27 | 2007-09-27 | Method and system for detecting and tracking objects in images |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009087326A JP2009087326A (ja) | 2009-04-23 |
JP4974975B2 true JP4974975B2 (ja) | 2012-07-11 |
Family
ID=40508414
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008183867A Expired - Fee Related JP4974975B2 (ja) | 2007-09-27 | 2008-07-15 | 画像において物体の位置を特定する方法及びシステム |
Country Status (3)
Country | Link |
---|---|
US (1) | US7961952B2 (ja) |
JP (1) | JP4974975B2 (ja) |
CN (1) | CN101398934B (ja) |
Families Citing this family (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8401239B2 (en) * | 2009-03-30 | 2013-03-19 | Mitsubishi Electric Research Laboratories, Inc. | Object tracking with regressing particles |
TW201040893A (en) * | 2009-05-12 | 2010-11-16 | Ind Tech Res Inst | Method and apparatus for recognitizing types of vehicles |
KR20100124532A (ko) * | 2009-05-19 | 2010-11-29 | 삼성전자주식회사 | 데이터 처리 장치 및 방법 |
KR101586007B1 (ko) * | 2009-06-25 | 2016-01-21 | 삼성전자주식회사 | 데이터 처리 장치 및 방법 |
DE102010016964B4 (de) * | 2010-05-17 | 2014-05-15 | Krauss-Maffei Wegmann Gmbh & Co. Kg | Verfahren und Vorrichtung zur Steuerung einer computergenerierten Anzeige eines virtuellen Objekts |
US8600106B1 (en) * | 2010-08-31 | 2013-12-03 | Adobe Systems Incorporated | Method and apparatus for tracking objects within a video frame sequence |
CN103814384B (zh) * | 2011-06-09 | 2017-08-18 | 香港科技大学 | 基于图像的跟踪 |
US8675997B2 (en) * | 2011-07-29 | 2014-03-18 | Hewlett-Packard Development Company, L.P. | Feature based image registration |
CN102509309B (zh) * | 2011-11-04 | 2013-12-18 | 大连海事大学 | 一种基于图像匹配的目标点定位系统 |
CN108197631B (zh) * | 2012-07-23 | 2022-06-28 | 苹果公司 | 提供图像特征描述符的方法 |
CN102853793B (zh) * | 2012-09-27 | 2015-03-25 | 中国科学院高能物理研究所 | 坐标变换数据处理方法和装置 |
US9076227B2 (en) * | 2012-10-01 | 2015-07-07 | Mitsubishi Electric Research Laboratories, Inc. | 3D object tracking in multiple 2D sequences |
CN102982556B (zh) * | 2012-11-01 | 2016-06-15 | 江苏科技大学 | 基于流形上粒子滤波算法的视频目标跟踪方法 |
KR20140105103A (ko) * | 2013-02-21 | 2014-09-01 | 삼성전자주식회사 | 장기의 움직임을 추적하는 방법, 장치 및 의료 영상 시스템 |
US20140278235A1 (en) * | 2013-03-15 | 2014-09-18 | Board Of Trustees, Southern Illinois University | Scalable message passing for ridge regression signal processing |
US10983041B2 (en) * | 2014-02-12 | 2021-04-20 | New York University | Fast feature identification for holographic tracking and characterization of colloidal particles |
JP2015206768A (ja) * | 2014-04-23 | 2015-11-19 | 株式会社東芝 | 前景領域抽出装置、前景領域抽出方法及びプログラム |
US9195903B2 (en) | 2014-04-29 | 2015-11-24 | International Business Machines Corporation | Extracting salient features from video using a neurosynaptic system |
US9245196B2 (en) * | 2014-05-09 | 2016-01-26 | Mitsubishi Electric Research Laboratories, Inc. | Method and system for tracking people in indoor environments using a visible light camera and a low-frame-rate infrared sensor |
US9373058B2 (en) | 2014-05-29 | 2016-06-21 | International Business Machines Corporation | Scene understanding using a neurosynaptic system |
US10115054B2 (en) | 2014-07-02 | 2018-10-30 | International Business Machines Corporation | Classifying features using a neurosynaptic system |
US10445885B1 (en) | 2015-10-01 | 2019-10-15 | Intellivision Technologies Corp | Methods and systems for tracking objects in videos and images using a cost matrix |
CN105488505B (zh) * | 2015-12-31 | 2019-01-11 | 中国科学院电子学研究所 | 一种对具有旋转角度的目标进行识别的方法 |
US10534964B2 (en) * | 2017-01-30 | 2020-01-14 | Blackberry Limited | Persistent feature descriptors for video |
CN107203766B (zh) * | 2017-04-19 | 2019-08-20 | 杭州泽火科技有限公司 | 精确定位图像中字符的方法、装置及系统 |
CN107181976B (zh) * | 2017-04-28 | 2021-01-29 | 华为技术有限公司 | 一种弹幕显示方法及电子设备 |
CN111742191B (zh) * | 2018-02-26 | 2022-01-14 | 三菱电机株式会社 | 三维位置推定装置及三维位置推定方法 |
CN109086734B (zh) * | 2018-08-16 | 2021-04-02 | 新智数字科技有限公司 | 一种对人眼图像中瞳孔图像进行定位的方法及装置 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5263107A (en) * | 1991-01-31 | 1993-11-16 | Sharp Kabushiki Kaisha | Receptive field neural network with shift-invariant pattern recognition |
IT1257073B (it) * | 1992-08-11 | 1996-01-05 | Ist Trentino Di Cultura | Sistema di riconoscimento, particolarmente per il riconoscimento di persone. |
US5640492A (en) * | 1994-06-30 | 1997-06-17 | Lucent Technologies Inc. | Soft margin classifier |
US6112195A (en) * | 1997-03-27 | 2000-08-29 | Lucent Technologies Inc. | Eliminating invariances by preprocessing for kernel-based methods |
US6134344A (en) * | 1997-06-26 | 2000-10-17 | Lucent Technologies Inc. | Method and apparatus for improving the efficiency of support vector machines |
US7174040B2 (en) * | 2002-07-19 | 2007-02-06 | Intel Corporation | Fast method for training and evaluating support vector machines with a large set of linear features |
JP4144377B2 (ja) * | 2003-02-28 | 2008-09-03 | ソニー株式会社 | 画像処理装置および方法、記録媒体、並びにプログラム |
US6803933B1 (en) * | 2003-06-16 | 2004-10-12 | Hewlett-Packard Development Company, L.P. | Systems and methods for dot gain determination and dot gain based printing |
US7751643B2 (en) * | 2004-08-12 | 2010-07-06 | Semiconductor Insights Inc. | Method and apparatus for removing uneven brightness in an image |
US7620204B2 (en) * | 2006-02-09 | 2009-11-17 | Mitsubishi Electric Research Laboratories, Inc. | Method for tracking objects in videos using covariance matrices |
US7899253B2 (en) * | 2006-09-08 | 2011-03-01 | Mitsubishi Electric Research Laboratories, Inc. | Detecting moving objects in video by classifying on riemannian manifolds |
-
2007
- 2007-09-27 US US11/862,554 patent/US7961952B2/en not_active Expired - Fee Related
-
2008
- 2008-07-15 JP JP2008183867A patent/JP4974975B2/ja not_active Expired - Fee Related
- 2008-09-23 CN CN2008101658179A patent/CN101398934B/zh not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
CN101398934A (zh) | 2009-04-01 |
JP2009087326A (ja) | 2009-04-23 |
CN101398934B (zh) | 2012-06-06 |
US20090087023A1 (en) | 2009-04-02 |
US7961952B2 (en) | 2011-06-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4974975B2 (ja) | 画像において物体の位置を特定する方法及びシステム | |
US8401239B2 (en) | Object tracking with regressing particles | |
CN111780763B (zh) | 一种基于视觉地图的视觉定位方法、装置 | |
CN109118564B (zh) | 一种基于融合体素的三维点云标记方法和装置 | |
CN111750864B (zh) | 一种基于视觉地图的重定位方法和装置 | |
JP4849464B2 (ja) | フレームシーケンス中のオブジェクトを追跡するコンピュータ化された方法 | |
US20160379375A1 (en) | Camera Tracking Method and Apparatus | |
US11941831B2 (en) | Depth estimation | |
CN104820996B (zh) | 一种基于视频的自适应分块的目标跟踪方法 | |
CN114424250A (zh) | 结构建模 | |
GB2520613A (en) | Target region fill utilizing transformations | |
CN109074666B (zh) | 用于估计无纹理对象的姿势的系统和方法 | |
Hanek et al. | The contracting curve density algorithm: Fitting parametric curve models to images using local self-adapting separation criteria | |
JP2008544404A (ja) | 薄板スプライン変換を用いて非剛体運動をモデル化するための直接的方法 | |
Du et al. | New iterative closest point algorithm for isotropic scaling registration of point sets with noise | |
GB2566443A (en) | Cross-source point cloud registration | |
CN115797419A (zh) | 点云配准方法、设备及介质 | |
CN117726747A (zh) | 补全弱纹理场景的三维重建方法、装置、存储介质和设备 | |
KR101766823B1 (ko) | 불규칙한 조도 변화에 강건한 영상 기반 주행거리 측정 시스템 및 방법 | |
CN115143958A (zh) | 一种基于gpu加速的多传感器融合的slam方法 | |
CN113034675A (zh) | 一种场景模型构建方法、智能终端及计算机可读存储介质 | |
Singh et al. | Kernel based approach for accurate surface estimation | |
Kaess et al. | MCMC-based multiview reconstruction of piecewise smooth subdivision curves with a variable number of control points | |
WO2020021238A1 (en) | Method of model alignment through localisation usage | |
CN113570667B (zh) | 视觉惯导补偿方法、装置及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110520 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120223 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120313 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120410 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4974975 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150420 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |