JP4490076B2 - 物体追跡方法、物体追跡装置、プログラム、および、記録媒体 - Google Patents
物体追跡方法、物体追跡装置、プログラム、および、記録媒体 Download PDFInfo
- Publication number
- JP4490076B2 JP4490076B2 JP2003380327A JP2003380327A JP4490076B2 JP 4490076 B2 JP4490076 B2 JP 4490076B2 JP 2003380327 A JP2003380327 A JP 2003380327A JP 2003380327 A JP2003380327 A JP 2003380327A JP 4490076 B2 JP4490076 B2 JP 4490076B2
- Authority
- JP
- Japan
- Prior art keywords
- probability density
- density distribution
- distribution
- information
- likelihood
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Closed-Circuit Television Systems (AREA)
- Image Analysis (AREA)
Description
背景差分法による人物検出背景差分法は物体の実時間検出における簡便かつ効果的な手法の一つであり、ビデオ監視システム等で用いられている。通常、各時刻での背景画像が既知である状況で用いられるが、最近では照明変化に対しても頑健な手法(例えば、非特許文献9、10参照。)も開発されており、その適用範囲が広がりつつある。
CSP法(Cross−Power Spectrum Phase analysis:白色化相互相関法)は図14に示すように2本のマイクロホンi、jで受音した信号si(n)、sj(n)よりCSP係数および到達時間差τを推定し、音源の方向φを推定する手法である。
ここでは、画像情報と音情報との統合による話者検出の従来手法について述べる。時刻tにおいて、画像情報および音情報から得られた確率密度分布をそれぞれPV、PAとした時、話者の存在に関する尤度分布Fは次式のように定義されている。
T.Zhao,R.Nevatia and Fengjun Lv,"Segmentation and Tracking of Multiple Humans in Complex Situations.",Proc. of CVPR,Vol.2,pp.194−201,2001 M.Isard and A.Blake,"Condensation−conditional density propagation for visual tracking",Int.J.of Computer Vision,29(1),pp5−28,1998 M.Isard and A.Blake,"ICondensation:Unifying Low−Level and High−Level Tracking in a stochastic framework",Proc.of ECCV ,pp.893−908,1998 T.Nishiura,T.Yamada,S.nakamura and K.Shikano,"Localization of Multiple Sound sources Based on a CSP Analysis with a Microphone Array",Proc.of ICASSP,SP−L4−6,pp.1053−1056,2000 N.Nishiura,T.Yamada and S.Nagata"A speaker position detection system using audio−visual information",Proc.of 13th Symposium on Human Interface,pp.469−474,1997(in Japanese) D.N.Zotkin,R.Duraiswami and L.S.Davis,"Joint Audio−Visual Tracking using Particle Filters",EURASIP J.of Applied Signal Process,vol.2002(11),pp.1154−1164,2002 M.J.Beal,H.Attias and N.Jojic,"Audio−Video Sensor Fusion with probabilistic Graphical Models",Proc. of ECCV,pp736−752,2002 S.Spors,R.Rabenstein and N.Strobel,"Joint Audio−Video Object Tracking",Proc.of ICIP,pp.393−396,2001 T.Matsuyama,T.Wada,H.Habe and K.Tanahashi,"Background Subtraction under Varying Illumination",IEICE Trans.D−II,Vol.J84−D−II,No.10,2001,2201−2211(in Japanese) M.Tsuchida,T.Kawanishi,H.Murase and S.Takagi,"BackgroundSubtraction under Changing Illumination",Technical Report of IEICE,PRMU2002−176,pp.43−48,2002(in Japanese) T.Nishiura,M.Nakamura,A.Lee,H.Saruwatari and K.Shikano,"Talker Tracking Display On Autonomous Mobile Robot With A Moving Microphone Array",Proc. of ICAD2002,pp.244−247,2002
時刻tにおける尤度分布FをPVもしくはPt v(φ)(下記の数式8により定義)並びにPAもしくはPt A(φ)(下記の数式9により定義)の重み付き線形和として次式のように定義する。
(1)尤度分布の更新
ある時刻tにおける尤度分布Ft(φ)を、時刻t−1における尤度分布Ft-1(φ)と、時刻tにおける観測結果から求めた尤度分布Fを用いて次式のように定義する。なおφは方位を表わす。
背景差分法の結果を用いた人物追跡は、人物の抽出が安定して行われる限りは良好に動作する。しかし、オクルージョンの発生、一時的な照明変動などにより、人物が抽出できない、もしくは抽出精度が低下した場合にはそれが短時間であっても、動作が不安定になる。そこでPVおよび時刻t−1の確率密度分布Pt-1 v(φ)を用いて、時刻tにおける確率密度分布Pt v(φ)を次式のように定義する。
各マイクロホンからの出力信号の処理では、既存技術である加算CSP法を適用し、加算後のCSP係数を用いて話者位置の確率密度分布Pt A(φ)を用いて、話者の追跡を行う。周辺雑音が存在する環境において話者の追跡を行う場合、語句間や会話の切れ目の音が途切れる区間において雑音の影響を受けPt A(φ)が不連続に変化し、安定した追跡が困難である。Pt A(φ)を時間の経過とともに滑らかかつ連続的に変化するように定義できれば、より安定した話者の追跡が可能になる。そこで、Pt A(φ)を以下のように定義する。
ここで、前記方法を実行できる物体追跡システムの構成の一例について図面を用いて以下に説明する。
初めに、オクルージョンにより一時的に人物93が背景差分法により検出されない場合について、人物追跡を行った。処理において、前記数式8の定数はν=0.8とした。
周辺雑音がある環境において音情報を用いた話者93追跡を行った。雑音としては室内空調の他、人物と異なる位置に設置したスピーカ91(audio speake、−120(deg.))から音楽を流した。話者93(speaker)にはカッセトプレーヤを携帯してもらい、テープに記録された英会話を再生した。データのサンプリング間隔を0.1秒、数式9の定数をa=0.8として約20秒間処理を行った。
画像情報と音情報の両方を用いた話者の追跡を行った。図9に示す環境において、話者93はマイクロホンアレイと全方位カメラとを中心に、ほぼ等速度でその周りを移動した。その際、途中でオクルージョンや比較的長時間(数秒)の声の途切れを発生させ、一方の情報が利用できない状況を作った。なお処理において、定数ν、a、k2はいずれも0.8とした。
22…入力装置
23…結果表示モニタ
31…情報取得部
32…確率密度分布推定部
33…尤度分布推定部
34…位置検出部
35…検出結果表示部
41…入力情報規格化処理部
42…入力装置特性蓄積部
51…確率密度分布算出部
52…重み係数決定部
53…確率密度分布統合部
54…確率密度分布蓄積部
61…重み係数決定部
62…尤度分布算出部
63…尤度分布蓄積部
71…尤度ピーク検出部
72…位置検出部
81…全方位カメラ
82…円形マイクロホンアレイ
91…オーディオスピーカ
92…ついたて
93…話者
Claims (10)
- 追跡対象物体に関する複数のモーダル情報から物体位置の確率密度分布を各々算出し、それらの重み付き線形和から物体の位置情報を得る物体追跡方法において、
各モーダルの確率密度分布の最大値を基に比例配分させて重みを決めて、該決めた重みの線形和による確率密度分布を統合して得られる尤度分布から物体の位置情報を得ることを特徴とする物体追跡方法。 - 観測結果から得た尤度分布と前時刻の尤度分布の重み付き線形和で現時刻の尤度分布を決めることを特徴とする請求項1に記載の物体追跡方法。
- 前記確率密度分布を得る際に、観測結果から得た確率密度分布と前時刻の確率密度分布とを重み付き線形和として統合して現時刻の確率密度分布を得ることを特徴とする請求項1または2に記載の物体追跡方法。
- 入力装置から複数のモーダル情報を取得する情報取得工程と、
前記複数のモーダル情報から確率密度分布を各々算出する確率密度分布推定工程と、
前記複数の確率密度分布を重み付き線形和として統合して尤度分布を算出する尤度分布推定工程と、
前記尤度分布から追跡対象物体の位置を算出する位置検出工程と、
前記追跡対象物体の位置を結果表示モニタに表示する検出結果表示工程と、を備えたことを特徴とする請求項1ないし3のいずれか1項に記載の物体追跡方法。 - 追跡対象物体に関する複数のモーダル情報から物体位置の確率密度分布を各々算出する手段と、
各モーダルの確率密度分布の最大値を基に比例配分させて重みを決める手段と、
前記決めた重みの線形和による確率密度分布を統合して得られる尤度分布から物体の位置情報を得る手段と、
を有することを特徴とする物体追跡装置。 - 観測結果から得た尤度分布と前時刻の尤度分布の重み付き線形和で現時刻の尤度分布を決めることを特徴とする請求項5に記載の物体追跡装置。
- 前記確率密度分布を得る際に、観測結果から得た確率密度分布と前時刻の確率密度分布とを重み付き線形和として統合して現時刻の確率密度分布を得ることを特徴とする請求項5または6に記載の物体追跡装置。
- 入力装置から複数のモーダル情報を取得する情報取得手段と、
前記複数のモーダル情報から確率密度分布を各々算出する確率密度分布推定手段と、
前記複数の確率密度分布を重み付き線形和として統合して尤度分布を算出する尤度分布推定手段と、
前記尤度分布から追跡対象物体の位置を算出する位置検出手段と、
前記追跡対象物体の位置を結果表示モニタに表示する検出結果表示手段と、を備えたことを特徴とする請求項5ないし7のいずれか1項に記載の物体追跡装置。 - 請求項1ないし4のいずれか1項に記載の物体追跡方法を、コンピュータに実行させるためのプログラム。
- 請求項9に記載のプログラムを記録した、コンピュータ読み取り可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003380327A JP4490076B2 (ja) | 2003-11-10 | 2003-11-10 | 物体追跡方法、物体追跡装置、プログラム、および、記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003380327A JP4490076B2 (ja) | 2003-11-10 | 2003-11-10 | 物体追跡方法、物体追跡装置、プログラム、および、記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005141687A JP2005141687A (ja) | 2005-06-02 |
JP4490076B2 true JP4490076B2 (ja) | 2010-06-23 |
Family
ID=34690097
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003380327A Expired - Fee Related JP4490076B2 (ja) | 2003-11-10 | 2003-11-10 | 物体追跡方法、物体追跡装置、プログラム、および、記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4490076B2 (ja) |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7860162B2 (en) | 2005-09-29 | 2010-12-28 | Panasonic Corporation | Object tracking method and object tracking apparatus |
JP2007257088A (ja) * | 2006-03-20 | 2007-10-04 | Univ Of Electro-Communications | ロボット装置及びそのコミュニケーション方法 |
JP4462339B2 (ja) * | 2007-12-07 | 2010-05-12 | ソニー株式会社 | 情報処理装置、および情報処理方法、並びにコンピュータ・プログラム |
WO2009113265A1 (ja) | 2008-03-11 | 2009-09-17 | パナソニック株式会社 | タグセンサシステムおよびセンサ装置、ならびに、物体位置推定装置および物体位置推定方法 |
JP4582174B2 (ja) * | 2008-03-28 | 2010-11-17 | ソニー株式会社 | 追跡処理装置、追跡処理方法、プログラム |
JP4730404B2 (ja) * | 2008-07-08 | 2011-07-20 | ソニー株式会社 | 情報処理装置、および情報処理方法、並びにコンピュータ・プログラム |
CN102105811B (zh) | 2009-02-19 | 2013-10-16 | 松下电器产业株式会社 | 物体位置推定系统、物体位置推定装置、物体位置推定方法及物体位置推定程序 |
JP5258651B2 (ja) * | 2009-03-25 | 2013-08-07 | 株式会社東芝 | 物体検出装置、物体検出方法、及び、プログラム |
CN102449427A (zh) * | 2010-02-19 | 2012-05-09 | 松下电器产业株式会社 | 物体位置修正装置、物体位置修正方法及物体位置修正程序 |
JP2012149906A (ja) * | 2011-01-17 | 2012-08-09 | Mitsubishi Electric Corp | 音源位置推定装置、音源位置推定方法および音源位置推定プログラム |
JP6075287B2 (ja) * | 2011-06-30 | 2017-02-08 | 日本電気株式会社 | 解析エンジン制御装置 |
WO2013128839A1 (ja) * | 2012-03-02 | 2013-09-06 | 日本電気株式会社 | 画像認識システム、画像認識方法およびコンピュータ・プログラム |
JP6349448B1 (ja) * | 2017-08-23 | 2018-06-27 | 株式会社 ディー・エヌ・エー | 情報処理装置、情報処理プログラム、及び、情報処理方法 |
JP7233035B2 (ja) * | 2017-08-30 | 2023-03-06 | パナソニックIpマネジメント株式会社 | 収音装置、収音方法、及びプログラム |
JP7124746B2 (ja) * | 2019-02-12 | 2022-08-24 | コニカミノルタ株式会社 | 物体の部分位置推定プログラム、物体の部分位置推定用ニューラルネットワーク構造、物体の部分位置推定方法、および物体の部分位置推定装置 |
EP4083911A4 (en) * | 2019-12-25 | 2024-01-10 | Kyocera Corp | INFORMATION PROCESSING DEVICE, DETECTION DEVICE, INFORMATION PROCESSING METHOD, AND INFORMATION PROCESSING SYSTEM |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04304552A (ja) * | 1991-04-02 | 1992-10-27 | Nec Corp | 確率的規則の学習装置 |
JPH0785277A (ja) * | 1993-09-13 | 1995-03-31 | Nippon Telegr & Teleph Corp <Ntt> | データ分類方式 |
JPH1141577A (ja) * | 1997-07-18 | 1999-02-12 | Fujitsu Ltd | 話者位置検出装置 |
JP2000041228A (ja) * | 1998-07-22 | 2000-02-08 | Fujitsu Ltd | 話者位置検出装置 |
-
2003
- 2003-11-10 JP JP2003380327A patent/JP4490076B2/ja not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04304552A (ja) * | 1991-04-02 | 1992-10-27 | Nec Corp | 確率的規則の学習装置 |
JPH0785277A (ja) * | 1993-09-13 | 1995-03-31 | Nippon Telegr & Teleph Corp <Ntt> | データ分類方式 |
JPH1141577A (ja) * | 1997-07-18 | 1999-02-12 | Fujitsu Ltd | 話者位置検出装置 |
JP2000041228A (ja) * | 1998-07-22 | 2000-02-08 | Fujitsu Ltd | 話者位置検出装置 |
Also Published As
Publication number | Publication date |
---|---|
JP2005141687A (ja) | 2005-06-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4490076B2 (ja) | 物体追跡方法、物体追跡装置、プログラム、および、記録媒体 | |
Zhou et al. | Target detection and tracking with heterogeneous sensors | |
JP6367258B2 (ja) | オーディオ処理装置 | |
US9899025B2 (en) | Speech recognition system adaptation based on non-acoustic attributes and face selection based on mouth motion using pixel intensities | |
Donley et al. | Easycom: An augmented reality dataset to support algorithms for easy communication in noisy environments | |
Chen et al. | Real-time speaker tracking using particle filter sensor fusion | |
US8140458B2 (en) | Information processing apparatus, information processing method, and computer program | |
Busso et al. | Smart room: Participant and speaker localization and identification | |
US10582117B1 (en) | Automatic camera control in a video conference system | |
CN107820037B (zh) | 音频信号、图像处理的方法、装置和系统 | |
JP2004515982A (ja) | テレビ会議及び他の適用においてイベントを予測する方法及び装置 | |
JP2015019371A5 (ja) | ||
KR101508092B1 (ko) | 화상 회의를 지원하는 방법 및 시스템 | |
Zhang et al. | AcousticFusion: Fusing sound source localization to visual SLAM in dynamic environments | |
D'Arca et al. | Robust indoor speaker recognition in a network of audio and video sensors | |
US11460927B2 (en) | Auto-framing through speech and video localizations | |
D'Arca et al. | Person tracking via audio and video fusion | |
D'Arca et al. | Look who's talking: Detecting the dominant speaker in a cluttered scenario | |
US11107476B2 (en) | Speaker estimation method and speaker estimation device | |
Cabañas-Molero et al. | Multimodal speaker diarization for meetings using volume-evaluated SRP-PHAT and video analysis | |
Pingali et al. | Audio-visual tracking for natural interactivity | |
Nguyen et al. | Selection of the closest sound source for robot auditory attention in multi-source scenarios | |
Kılıç et al. | Audio-visual tracking of a variable number of speakers with a random finite set approach | |
Kim et al. | Auditory and visual integration based localization and tracking of humans in daily-life environments | |
Wang et al. | Real-time automated video and audio capture with multiple cameras and microphones |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060406 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20090521 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090714 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090910 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20091006 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20091203 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100105 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100225 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100323 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100401 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130409 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |