JP5629249B2 - 音源定位システム及び音源定位方法 - Google Patents
音源定位システム及び音源定位方法 Download PDFInfo
- Publication number
- JP5629249B2 JP5629249B2 JP2011182774A JP2011182774A JP5629249B2 JP 5629249 B2 JP5629249 B2 JP 5629249B2 JP 2011182774 A JP2011182774 A JP 2011182774A JP 2011182774 A JP2011182774 A JP 2011182774A JP 5629249 B2 JP5629249 B2 JP 5629249B2
- Authority
- JP
- Japan
- Prior art keywords
- sound source
- model
- source localization
- sound
- distribution
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000004807 localization Effects 0.000 title claims description 74
- 238000000034 method Methods 0.000 title claims description 34
- 238000009826 distribution Methods 0.000 claims description 55
- 238000001228 spectrum Methods 0.000 claims description 32
- 239000002245 particle Substances 0.000 claims description 28
- 230000007704 transition Effects 0.000 claims description 27
- 238000004364 calculation method Methods 0.000 claims description 13
- 238000005070 sampling Methods 0.000 claims description 9
- 239000000203 mixture Substances 0.000 claims description 5
- 238000012952 Resampling Methods 0.000 claims description 4
- 230000006870 function Effects 0.000 description 14
- 238000001514 detection method Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 7
- 238000012546 transfer Methods 0.000 description 7
- 238000002474 experimental method Methods 0.000 description 5
- 230000014509 gene expression Effects 0.000 description 5
- 239000011159 matrix material Substances 0.000 description 4
- 238000011156 evaluation Methods 0.000 description 3
- 238000000354 decomposition reaction Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000001427 coherent effect Effects 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 230000003362 replicative effect Effects 0.000 description 1
- 238000001507 sample dispersion Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 230000017105 transposition Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01S—RADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
- G01S3/00—Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received
- G01S3/80—Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received using ultrasonic, sonic or infrasonic waves
- G01S3/8006—Multi-channel systems specially adapted for direction-finding, i.e. having a single aerial system capable of giving simultaneous indications of the directions of different signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0272—Voice signal separating
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/005—Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L2021/02161—Number of inputs available containing the signal or the noise to be suppressed
- G10L2021/02166—Microphone arrays; Beamforming
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Acoustics & Sound (AREA)
- Health & Medical Sciences (AREA)
- Remote Sensing (AREA)
- Quality & Reliability (AREA)
- Computational Linguistics (AREA)
- Radar, Positioning & Navigation (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- General Health & Medical Sciences (AREA)
- Otolaryngology (AREA)
- Circuit For Audible Band Transducer (AREA)
- Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
Description
N≦Nmax<M
(1)入力信号の自己相関行列
(3)固有ベクトルと伝達関数を用いたMUSICスペクトルの計算を行う。
(1)入力信号の自己相関行列の計算
入力信号の自己相関行列は、時間ΔTで観測したサンプル値の相関として計算する。
(2)固有値分解
(3)固有ベクトルと伝達関数を用いたMUSICスペクトルの計算
MUSICスペクトルは以下の式にしたがって計算する。
<st,d,1> = 0.8, <st,d,0> = 1-0.8=0.2
のように設定する。0.8の代わりに1にしてもほぼ同様に動作する。
a) C(xt,d)=0 の場合、j=0 とする。つまり
a) 0〜1 区間から一様乱数を生成 rp’とする。
b) p=1〜P まで
i. rp’← rp’-wp
ii. rp’< 0 になったら、
iii.wp’← 1/P (リサンプル後の重みは全てのパーティクルで等しい)
c) a) に戻る。
Nmax = 3, α0 = [1,1], β0 =1, a0 = 1, b0 = 500
また、パーティクル数はP=500 とした。実験で使用した室内の残響時間はRT20 = 840 [msec] であった。
Claims (5)
- 音データを検出する音検出部と、
検出された音データに基づいて、方向及び時間ごとのMUSICスペクトルを演算するMUSICスペクトル演算部と、
各方向の音源の有無による状態、状態の遷移を記述する状態遷移モデル、及び音源有りの状態及び音源無しの状態に観測されるMUSICスペクトルを記述する観測モデルを定め、MUSICスペクトルの時系列データに基づいて、前記観測モデル及び前記状態遷移モデルのモデルパラメータの事後分布を推定する、モデルパラメータ推定部と、
推定されたモデルパラメータの事後分布に基づいて、方向及び時間ごとの音源存在事後確率のパーティクルをサンプルすることによって、音源定位を行う音源定位部と、を備えた音源定位システム。 - 前記観測モデルとしてガウス混合モデルを使用する請求項1に記載の音源定位システム。
- 音データを検出するステップと、
検出された音データに基づいて、方向及び時間ごとのMUSICスペクトルを演算するステップと、
各方向の音源の有無による状態、状態の遷移を記述する状態遷移モデル、及び音源有りの状態及び音源無しの状態に観測されるMUSICスペクトルを記述する観測モデルを定め、MUSICスペクトルの時系列データに基づいて、前記観測モデル及び前記状態遷移モデルのモデルパラメータの事後分布を推定するステップと、
推定されたモデルパラメータの事後分布に基づいて、方向及び時間ごとの音源存在事後確率のパーティクルをサンプルすることによって、音源定位を行うステップと、を含む音源定位方法。 - 前記観測モデルとしてガウス混合モデルを使用する請求項3に記載の音源定位方法。
- 音源定位を行うステップは、P個のパーティクルをサンプルするステップと、各パーティクルについて重みを計算するステップと、各パーティクルの重みを正規化するステップと、各パーティクルの重みを使用してリサンプリングを行うステップと、を含む請求項3または4に記載の音源定位方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011182774A JP5629249B2 (ja) | 2011-08-24 | 2011-08-24 | 音源定位システム及び音源定位方法 |
US13/590,624 US20130051569A1 (en) | 2011-08-24 | 2012-08-21 | System and a method for determining a position of a sound source |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011182774A JP5629249B2 (ja) | 2011-08-24 | 2011-08-24 | 音源定位システム及び音源定位方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013044950A JP2013044950A (ja) | 2013-03-04 |
JP5629249B2 true JP5629249B2 (ja) | 2014-11-19 |
Family
ID=47743763
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011182774A Active JP5629249B2 (ja) | 2011-08-24 | 2011-08-24 | 音源定位システム及び音源定位方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US20130051569A1 (ja) |
JP (1) | JP5629249B2 (ja) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105336335B (zh) * | 2014-07-25 | 2020-12-08 | 杜比实验室特许公司 | 利用子带对象概率估计的音频对象提取 |
JP6603919B2 (ja) * | 2015-06-18 | 2019-11-13 | 本田技研工業株式会社 | 音声認識装置、および音声認識方法 |
WO2017108097A1 (en) * | 2015-12-22 | 2017-06-29 | Huawei Technologies Duesseldorf Gmbh | Localization algorithm for sound sources with known statistics |
JP6538624B2 (ja) * | 2016-08-26 | 2019-07-03 | 日本電信電話株式会社 | 信号処理装置、信号処理方法および信号処理プログラム |
JP6982966B2 (ja) * | 2017-03-14 | 2021-12-17 | 大成建設株式会社 | 音源探査装置 |
CN108564171A (zh) * | 2018-03-30 | 2018-09-21 | 北京理工大学 | 一种基于快速全局k均值聚类的神经网络声源角度估计方法 |
CN117496997B (zh) * | 2023-12-27 | 2024-04-05 | 湘江实验室 | 基于惩罚机制的声源检测方法、装置及存储介质 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100304666B1 (ko) * | 1999-08-28 | 2001-11-01 | 윤종용 | 음성 향상 방법 |
EP1473964A3 (en) * | 2003-05-02 | 2006-08-09 | Samsung Electronics Co., Ltd. | Microphone array, method to process signals from this microphone array and speech recognition method and system using the same |
KR100586893B1 (ko) * | 2004-06-28 | 2006-06-08 | 삼성전자주식회사 | 시변 잡음 환경에서의 화자 위치 추정 시스템 및 방법 |
US8275148B2 (en) * | 2009-07-28 | 2012-09-25 | Fortemedia, Inc. | Audio processing apparatus and method |
-
2011
- 2011-08-24 JP JP2011182774A patent/JP5629249B2/ja active Active
-
2012
- 2012-08-21 US US13/590,624 patent/US20130051569A1/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
JP2013044950A (ja) | 2013-03-04 |
US20130051569A1 (en) | 2013-02-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5629249B2 (ja) | 音源定位システム及び音源定位方法 | |
US7626889B2 (en) | Sensor array post-filter for tracking spatial distributions of signals and noise | |
KR100486736B1 (ko) | 두개의 센서를 이용한 목적원별 신호 분리방법 및 장치 | |
JP4912778B2 (ja) | 信号源の軌跡をモデル化する方法及びシステム | |
Vu et al. | Blind speech separation employing directional statistics in an expectation maximization framework | |
JP4248445B2 (ja) | マイクロホンアレイ方法及びシステム、並びにこれを用いた音声認識方法及び装置 | |
US7583808B2 (en) | Locating and tracking acoustic sources with microphone arrays | |
EP2530484B1 (en) | Sound source localization apparatus and method | |
JP3812887B2 (ja) | 信号処理システムおよび方法 | |
Taseska et al. | Blind source separation of moving sources using sparsity-based source detection and tracking | |
Varzandeh et al. | Exploiting periodicity features for joint detection and DOA estimation of speech sources using convolutional neural networks | |
Traa et al. | Multichannel source separation and tracking with RANSAC and directional statistics | |
Brutti et al. | Tracking of multidimensional TDOA for multiple sources with distributed microphone pairs | |
JP6538624B2 (ja) | 信号処理装置、信号処理方法および信号処理プログラム | |
Hadad et al. | Multi-speaker direction of arrival estimation using SRP-PHAT algorithm with a weighted histogram | |
CN114616483A (zh) | 声源定位设备、声源定位方法和程序 | |
CN116106826A (zh) | 声源定位方法、相关装置和介质 | |
Zhagyparova et al. | Supervised learning-based sound source distance estimation using multivariate features | |
JP2019184747A (ja) | 信号分析装置、信号分析方法および信号分析プログラム | |
Zaken et al. | Neural-Network-Based Direction-of-Arrival Estimation for Reverberant Speech-the Importance of Energetic, Temporal and Spatial Information | |
Sun et al. | Indoor sound source localization and number estimation using infinite Gaussian mixture models | |
Li et al. | Robust speech dereverberation based on wpe and deep learning | |
US11425495B1 (en) | Sound source localization using wave decomposition | |
Nagira et al. | Complex extension of infinite sparse factor analysis for blind speech separation | |
JP6082679B2 (ja) | 信号源数推定装置、信号源数推定方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20131127 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140825 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140924 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20141003 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5629249 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |