JP2009071510A - 点音源検出方法 - Google Patents
点音源検出方法 Download PDFInfo
- Publication number
- JP2009071510A JP2009071510A JP2007236822A JP2007236822A JP2009071510A JP 2009071510 A JP2009071510 A JP 2009071510A JP 2007236822 A JP2007236822 A JP 2007236822A JP 2007236822 A JP2007236822 A JP 2007236822A JP 2009071510 A JP2009071510 A JP 2009071510A
- Authority
- JP
- Japan
- Prior art keywords
- sound source
- spectrum
- point sound
- sound
- main lobe
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
【解決手段】指向性マイクにより所定の周波数について、全方向にわたって観測した音圧分布の空間スペクトルの波形を、あらかじめ作成された点音源についての空間スペクトルの波形と対比し、両者の差分についての平坦度を求め、それが所定の閾値以内にあるか否かを判定することにより点音源を検出する。
【選択図】図2
Description
また、上記の欠点を克服する方法として、環境に配置したマイクと、ロボットに搭載したマイクアレイを統合することにより、音源定位性能を向上させることも知られている(非特許文献1参照)。
ただし、VSは音速、Li(0)はC0からi番目のマイク(i=1,2…,M)までの距離であり、LO(0)は、C0からマイクアレイの中心までの距離である。
ただし、tは時刻、ωは音源の周波数を表わす。
この式(2)を用いることにより、アレイのマイク配置ごとの空間スペクトルの形状が得られる。
E(ω,θ)=model(ω,θ)S0(ω) (5)
であり、それ以外の場合は、
E(ω,θ)=0 (6)
である。
A(θ,ω)={org(ω,θ)−E(ω,θ)+[Pθ0(ω)−S0(ω)]}(7)
と定義する。
すなわち、ここで残差が閾値を超え、モデルに不適合と判定されたピークは、それ以降の定位計算から除外し、その残差が閾値以内にある場合のみ、次のピークに対して同様のモデルに適合するか否かの判定を行う。
このような対比を各周波数について繰り返し、干渉を受けていない点音源とみなしうるピークの方向及び音圧を抽出する。この際の対比により、メインローブモデルに適合していると判定されるピークを図4に、また減算された後のピークの形状を図5に示す。
図中、破線は観測されたスペクトルであり、実線はメルクマールAである。また、鎖線はメインローブモデルを示す。
さらに、本発明方法は、移動ロボットによる音源定位の際にも、近接した複数音源や音源までの距離差の如何にかかわらず有効であるという利点がある。
また、1回の定位計算に用いるデータ長を128msec(2048点)とし、800Hzから3000Hzの範囲で8Hzごとにメインローブの適合判定を行った。この判定に用いる閾値はピークパワーを1とし、実施例2では0.12、それ以外の実施例では0.09とした。
同一音源を45°方向、距離2.2mと180°方向、距離2.0mに配置した場合と、周波数成分にそれぞれ重なりのない3種類の混合サイン波を30°方向、距離5.0m、45°方向、距離2.2mと180°方向、距離2.0mに配置した場合について、10秒間の収録音に対する各周波数での検出を行った。
この際のそれぞれの検出率(detect ratio)及び誤検出率(error ratio)を表1に示す。ここでいう検出率とは、定位計算回数に対する音源の真値に対し±10°以内で検出した回数の割合であり、誤検出率とは、検出した方向の±10°以内に音源がないときの割合である。
しかしながら、この場合、検出率は低くても、誤検出率は必ずしも高くはないことから、干渉に対しては影響されにくいということができる。また、個々の検出率が低い場合でも、検出したピークの総和から、連続的な音源検出を行うことができる。
この例における本発明の定位誤差は6°程度であった。
90°方向及び135°方向から、それぞれ1kHzのサイン波を出力した際に観測される、近接した音源間に生じる偽ピークを図10に示す。図中、Aは、観測されたスペクトル、Bは評価されたメインローブである。この場合、メインローブ両端でモデルとの差が大きく、減算後のスペクトルCは上に凸の曲線となりメインローブモデルとは一致しない。
このようにして、反射の影響を受けた場合のスペクトル(ω=1270Hz)を図12に示す。この際の音源K、Lはそれぞれ3つのサイン波の混合音で、その周波数はK(700、1030、1300Hz)及びL(850、1270、1600Hz)であった。図中のAは観測されたスペクトル、Bは評価されたメインローブ、Cは減算後のスペクトルである。
図12には、図11の右上の角方向からの反射音とみられるピークが、165°方向音源Lのピークよりも大きく観測されている。
次に、10秒間の収録音に対する周波数ごとのピークを検出し、その結果を表2に示す。
すなわち、まず音源、ロボットの両方を静止した状態で実験を行い、次に音源数を2〜5の範囲で変化させ、DSBF+FBS法と比較した。その結果を表3に示す。
音源としては、ロボットの移動方向右側にスピーカー1及び2、左側に4及び3を配置し、スピーカー1,3として男声及び女声、スピーカー2,4としてに音楽を用いた。
ロボットを15秒間で5m直進させ、FBS法及び本発明方法により音響定位評価を行った。その結果、本発明方法による検出率は、FBS法と比較して14%高く、平均ストリーム長はDSBF+FBS法が3.55secであるのに対し、本発明方法は6.96secであった。そして、0〜5sec区間の近接したスピーカー3,4(60°方向付近)及び15〜20sec区間のスピーカー1(270°方向付近)で特に著しい差が認められた。
Claims (4)
- 指向性マイクにより所定の周波数について、全方向にわたって観測した音圧分布の空間スペクトルの波形を、あらかじめ作成された点音源についての空間スペクトルの波形と対比し、両者の差分についての平坦度を求め、それが所定の閾値以内にあるか否かを判定することにより行う点音源検出方法。
- あらかじめ作成された空間スペクトルのメインローブモデルを用いる請求項1記載の点音源検出方法。
- 閾値として、観測された空間スペクトルから特定スペクトルEを減算した後のスペクトルについて、最小二乗法でメルクマールAを通る直線を求め、メインローブ幅内での、この直線との残差を計算して得た数値を用いる請求項1又は2記載の点音源検出方法。
- 複数の指向性マイクを搭載したロボットにより行う請求項1ないし3のいずれかに記載の点音源検出方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007236822A JP5007400B2 (ja) | 2007-09-12 | 2007-09-12 | 点音源検出方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007236822A JP5007400B2 (ja) | 2007-09-12 | 2007-09-12 | 点音源検出方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009071510A true JP2009071510A (ja) | 2009-04-02 |
JP5007400B2 JP5007400B2 (ja) | 2012-08-22 |
Family
ID=40607331
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007236822A Expired - Fee Related JP5007400B2 (ja) | 2007-09-12 | 2007-09-12 | 点音源検出方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5007400B2 (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015029296A1 (ja) * | 2013-08-29 | 2015-03-05 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 音声認識方法及び音声認識装置 |
CN105427860A (zh) * | 2015-11-11 | 2016-03-23 | 百度在线网络技术(北京)有限公司 | 远场语音识别方法和装置 |
CN113281704A (zh) * | 2021-04-27 | 2021-08-20 | 维沃移动通信有限公司 | 方位角确定方法、装置、电子设备和介质 |
CN114166339A (zh) * | 2021-12-07 | 2022-03-11 | 昆明理工大学 | 一种低频结合高频二次波束形成定位方法 |
WO2023100262A1 (ja) * | 2021-11-30 | 2023-06-08 | Jfeアドバンテック株式会社 | 音波遮蔽フード及び音波遮蔽フードを備えた音源方位標定装置 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003140686A (ja) * | 2001-10-31 | 2003-05-16 | Nagoya Industrial Science Research Inst | 音声入力の雑音抑制方法、雑音抑制制御プログラム、記録媒体及び音声信号入力装置 |
-
2007
- 2007-09-12 JP JP2007236822A patent/JP5007400B2/ja not_active Expired - Fee Related
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003140686A (ja) * | 2001-10-31 | 2003-05-16 | Nagoya Industrial Science Research Inst | 音声入力の雑音抑制方法、雑音抑制制御プログラム、記録媒体及び音声信号入力装置 |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015029296A1 (ja) * | 2013-08-29 | 2015-03-05 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 音声認識方法及び音声認識装置 |
JPWO2015029296A1 (ja) * | 2013-08-29 | 2017-03-02 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 音声認識方法及び音声認識装置 |
US9818403B2 (en) | 2013-08-29 | 2017-11-14 | Panasonic Intellectual Property Corporation Of America | Speech recognition method and speech recognition device |
CN105427860A (zh) * | 2015-11-11 | 2016-03-23 | 百度在线网络技术(北京)有限公司 | 远场语音识别方法和装置 |
CN113281704A (zh) * | 2021-04-27 | 2021-08-20 | 维沃移动通信有限公司 | 方位角确定方法、装置、电子设备和介质 |
CN113281704B (zh) * | 2021-04-27 | 2024-04-02 | 维沃移动通信有限公司 | 方位角确定方法、装置、电子设备和介质 |
WO2023100262A1 (ja) * | 2021-11-30 | 2023-06-08 | Jfeアドバンテック株式会社 | 音波遮蔽フード及び音波遮蔽フードを備えた音源方位標定装置 |
CN114166339A (zh) * | 2021-12-07 | 2022-03-11 | 昆明理工大学 | 一种低频结合高频二次波束形成定位方法 |
CN114166339B (zh) * | 2021-12-07 | 2022-10-18 | 昆明理工大学 | 一种低频结合高频二次波束形成定位方法 |
Also Published As
Publication number | Publication date |
---|---|
JP5007400B2 (ja) | 2012-08-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10959018B1 (en) | Method for autonomous loudspeaker room adaptation | |
US10602267B2 (en) | Sound signal processing apparatus and method for enhancing a sound signal | |
US10777214B1 (en) | Method for efficient autonomous loudspeaker room adaptation | |
JP6042858B2 (ja) | マルチセンサ音源定位 | |
JP4248445B2 (ja) | マイクロホンアレイ方法及びシステム、並びにこれを用いた音声認識方法及び装置 | |
EP2868117B1 (en) | Systems and methods for surround sound echo reduction | |
JP6065030B2 (ja) | 収音装置、プログラム及び方法 | |
US9781508B2 (en) | Sound pickup device, program recorded medium, and method | |
Brutti et al. | Multiple source localization based on acoustic map de-emphasis | |
US20130083832A1 (en) | Processing Signals | |
JP2012150237A (ja) | 音信号処理装置、および音信号処理方法、並びにプログラム | |
JP6065028B2 (ja) | 収音装置、プログラム及び方法 | |
JP2008079256A (ja) | 音響信号処理装置、音響信号処理方法及びプログラム | |
JP2008236077A (ja) | 目的音抽出装置,目的音抽出プログラム | |
JP5007400B2 (ja) | 点音源検出方法 | |
JP6540730B2 (ja) | 収音装置、プログラム及び方法、並びに、判定装置、プログラム及び方法 | |
RU2019124546A (ru) | Способ и устройство для захвата аудиоинфомации с использованием формирования диаграммы направленности | |
WO2010109711A1 (ja) | 音声処理装置、音声処理方法、及び、プログラム | |
JP2010121975A (ja) | 音源定位装置 | |
US8452592B2 (en) | Signal separating apparatus and signal separating method | |
JP2007006253A (ja) | 信号処理装置、マイクロフォンシステム、話者方向検出方法及び話者方向検出プログラム | |
Ganguly et al. | Real-time Smartphone implementation of noise-robust Speech source localization algorithm for hearing aid users | |
KR20160101628A (ko) | 음원의 3차원 위치 파악 방법 및 그 장치와, 음원의 3차원 위치를 이용한 음질 개선 방법 및 그 장치 | |
Scheuing et al. | Disambiguation of TDOA estimates in multi-path multi-source environments (DATEMM) | |
Hadad et al. | Multi-speaker direction of arrival estimation using SRP-PHAT algorithm with a weighted histogram |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100707 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100625 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120410 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120416 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150608 Year of fee payment: 3 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |