JP5098176B2 - 音源方向判定方法及び装置 - Google Patents
音源方向判定方法及び装置 Download PDFInfo
- Publication number
- JP5098176B2 JP5098176B2 JP2006002284A JP2006002284A JP5098176B2 JP 5098176 B2 JP5098176 B2 JP 5098176B2 JP 2006002284 A JP2006002284 A JP 2006002284A JP 2006002284 A JP2006002284 A JP 2006002284A JP 5098176 B2 JP5098176 B2 JP 5098176B2
- Authority
- JP
- Japan
- Prior art keywords
- sound source
- frequency
- phase difference
- spectrum
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 13
- 238000001228 spectrum Methods 0.000 claims description 152
- 238000011156 evaluation Methods 0.000 claims description 31
- 238000010586 diagram Methods 0.000 description 26
- 238000012886 linear function Methods 0.000 description 22
- 238000000926 separation method Methods 0.000 description 9
- 238000004364 calculation method Methods 0.000 description 6
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 238000002474 experimental method Methods 0.000 description 3
- 238000009434 installation Methods 0.000 description 3
- 230000005236 sound signal Effects 0.000 description 3
- 230000003595 spectral effect Effects 0.000 description 3
- 230000002238 attenuated effect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 210000005069 ears Anatomy 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/005—Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
Landscapes
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Otolaryngology (AREA)
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
Description
前式(1)の両辺を周波数fで微分すると、
ここで、さらに前式(2)を変形すると、行路差Δdは、
請求項2記載の発明は、所定間隔に配置された二つのマイクにより得られた2チャンネルの音響信号を基に音の到来方向を特定する音源方向判定装置において、前記2チャンネルの音響信号における位相差スペクトルを求める位相差スペクトル生成手段と、前記2チャンネルの音響信号の少なくともいずれか一方のパワースペクトラムを求めるパワースペクトル生成手段と、前記パワースペクトラムのピークの中から、前記パワースペクトラムが極大値となる周波数から差分が所定値以内である周波数の範囲に対応するピークの極大値近傍部分を選択する選択手段と、前記位相差スペクトラムのうち、前記選択されたピークの極大値近傍部分の周波数に対応する部分を、周波数に関して一次近似した関数である、一次近似関数の傾きを、推定可能な全ての音源方向が取りうる値の範囲で求める音源方向推定手段と、前記求められた傾きの一次近似関数夫々について、当該一次近似関数を表わす直線に近い値を取る前記位相差スペクトル内のスペクトル値に対応する前記パワースペクトル内のパワー値が大きいほど、前記一次近似関数の評価を大きくするように評価する評価手段と、前記評価の結果、評価値の大きい一次近似関数に基づいて、音源毎の音源方向を求める音源方向特定手段とを備えたことを特徴とする音源方向判定装置である。
このように、位相差スペクトルのみならず、パワースペクトルも考慮して音源毎の到来方向を判定するようにしたから、1つの音源はもちろんのこと、たとえば、人の声や楽器の音などの周波数帯域が重なり合った複数の音源についても、それらの音源方向を正しく判定できる。
図1(a)は、第一実施形態に係るの音源方向判定装置の概念的な構成図である。この図において、音源方向判定装置10は、各々ほぼ同一の特性で低域から高域までの広範囲な周波数範囲の音を検出して電気信号(以下、音響信号)に変換する無指向性または音源方向への同一指向性を有する2つのセンサ(第一センサ11及び第二センサ12)と、それらのセンサから出力された2つの音響信号S1、S2の各々を高速フーリエ変換する2つのFFT部(第一FFT部13及び第二FFT部14)と、第一FFT部13から出力された第一FFT信号S3と第二FFT部14から出力された第二FFT信号S4とに基づいて、それらのFFT信号S3、S4の位相差スペクトル信号S5を生成する位相差スペクトル信号生成部15と、第一FFT部13から出力された第一FFT信号S3と第二FFT部14から出力された第二FFT信号S4とに基づいて、それらのFFT信号S3、S4のパワースペクトル信号S6を生成するパワースペクトル信号生成部16と、前記位相差スペクトル信号S5及びパワースペクトル信号S6を用いて不図示の音源の方向を判定する音源方向判定部17とを含む。
図2は、複数の音源(便宜的に第一音源18と第二音源19とする)と2つのセンサ(第一センサ11及び第二センサ12)との位置関係図である。ここで、2つのセンサ(第一センサ11及び第二センサ12)の間隔をSとし、その間隔Sの中間点をCとする。また、2つのセンサ(第一センサ11及び第二センサ12)の設置位置を通る直線をx軸、そのx軸上の中間点Cの垂線をy軸とする。さらに、第一音源18から中間点Cに直線20を引くと共に、第二音源19から中間点Cに直線21を引き、これらの直線20、21とy軸とのなす角度をそれぞれθa、θbとする。
〔第二実施形態〕
図5は、第二実施形態の構成図である。この図において、音源方向判定装置30は、それぞれマイクロフォンやADC等からなる二つのセンサ(第一音声入力部31及び第二音声入力部32)を備え、これらの第一音声入力部31及び第二音声入力部32は、不図示の音源からの音をデジタルの音響信号S1、S2に変換して出力する。音響信号S1、S2は、二つの直交変換部(第一直交変換部33及び第二直交変換部34)に入力され、これら二つの直交変換部(第一直交変換部33及び第二直交変換部34)は、デジタル化された2チャンネルの音響信号S1、S2を直交変換処理(フーリエ変換等)して周波数領域の信号(FFT信号S3、S4)に変換する。FFT信号S3、S4は、位相差算出部35に入力され、位相差算出部35は、第一直交変換部33及び第二直交変換部34から出力される二つのFFT信号S3、S4の実部及び虚部から両チャンネルのクロススペクトルスを算出し、このクロススペクトルから両チャンネルの位相差スペクトル信号S5を求める。また、一方の直交変換部(ここでは第二直交変換部34)から出力されるFFT信号S4は、振幅算出部36にも入力されており、この振幅算出部36は、片側のチャンネルから得られるFFT信号S4より、パワースペクトル信号S6を求める。このようにして求められた位相差スペクトル信号S5とパワースペクトル信号S6は、到来方評価部37に入力され、この到来方評価部37は、位相差スペクトル信号S5にパワースペクトル信号S6を考慮して一次関数の傾きαを評価し、その傾きαから音源の方向を決定する。
ここで、第一音声入力部31と第二音声入力部32から出力されるデジタル化された2つの音響信号S1、S2を時系列デジタルデータx(t)、y(t)で表すことにする。ただし、tは時間である。
=xRe[f]*yRe[f]+xIm[f]*yIm[f] ・・・・(4)
虚部:CRosIm[f]
=yRe[f]*xIm[f]−xRe[f]*yIm[f] ・・・・(5)
=atan2(CRosRe[f],CRosIm[f]×180/π ・・・・(6)
=sqRt(xRe[f]*xRe[f]+xIm[f]*xIm[f])・・・・(7)
Pbi[f]=1または0〔1:P[f]≧Pthのとき、0:P[f]<Pthのとき〕・・・・(9)
この場合、しきい値Pthを超えた周波数部分についてのみ位相差スペクトラムを加算していくことになるためノイズ成分に攪乱されることが少なくなる。また、しきい値Pthを超えた部分についてはその寄与を定数としているため突出したピークに引きずられることも少なくなる。
図8は、倍音系列のホルマント変動の説明概念図である。人間の声は、発音する音の種類により、固有のホルマントを持ち、倍音系列のうちいくつかは低く抑えられてしまう。このため、前記の第2実施形態の場合は、低くなった倍音系列が充分に反映されない。
また、第2実施形態の第1変形例の場合は、一種のノーマライズ手法であるが、しきい値が高すぎたときには低く抑えられた倍音は切り捨てられてしまい、逆にしきい値が低すぎたときには倍音以外の部分まで入ってしまう。これを補うために、前記の評価式(8)のP[f]を、次式(10)で示すPfor[f]で置き換える。
Pfor[f]=P[f]または0〔P[f]:|f−fpk|<fthのとき、0:|f−fpk|≧fthのとき〕・・・・(10)
ここで、fpkはパワースペクトラム状の極大値(各ピーク値)をあたる周波数fである。この変形により各音源からの寄与部分をそのパワーに応じて取り込みつつノイズ部分の切り捨てが可能となる。
以上に述べた第2実施形態およびその変形例は以下の数式(式(11))の形にまとめることができる。
図9は、第三実施形態の構成図である。この第三実施形態の音源方向判定装置40と第二実施形態の音源方向判定装置30との違いは、第三実施形態の音源方向判定装置40の振幅算出部36aは、両側のチャンネルから得られるFFT信号S3、S4より、両側のチャンネルの振幅値をそれぞれ求める点にあり、また、到来方評価部37aは、一次関数の傾きが正の時に片側のチャンネルの振幅値(パワースペクトル信号S6)を考慮し、負の時は他方のチャンネルの振幅値(パワースペクトル信号S6)を考慮して傾き評価する点にある。
=sqRt(xRe[f]*xRe[f]+xIm[f]*xIm[f])
・・・・(12)
PR[f]
=sqRt(yRe[f]*yRe[f]+yIm[f]*yIm[f])
・・・・(13)
12 第二センサ(マイク)
10 音源方向判定装置
15 位相差スペクトル信号生成部(位相差スペクトル生成手段)
16 パワースペクトル信号生成部(パワースペクトル生成手段)
17c 判定部(音源方向特定手段)
Claims (2)
- 所定間隔に配置された二つのマイクにより得られた2チャンネルの音響信号を基に音の到来方向を特定する音源方向判定方法において、
前記2チャンネルの音響信号における位相差スペクトルを求める第1のステップと、
前記2チャンネルの音響信号の少なくともいずれか一方のパワースペクトラムを求める第2のステップと、
前記パワースペクトラムのピークの中から、前記パワースペクトラムが極大値となる周波数から差分が所定値以内である周波数の範囲に対応するピークの極大値近傍部分を選択する選択ステップと、
前記位相差スペクトラムのうち、前記選択されたピークの極大値近傍部分の周波数に対応する部分を、周波数に関して一次近似した関数である、一次近似関数の傾きを、推定可能な全ての音源方向が取りうる値の範囲で求める推定ステップと、
前記求められた傾きの一次近似関数夫々について、当該一次近似関数を表わす直線に近い値を取る前記位相差スペクトル内のスペクトル値に対応する前記パワースペクトル内のパワー値が大きいほど、前記一次近似関数の評価を大きくするように評価する評価ステップと、
前記評価の結果、評価値の大きい一次近似関数に基づいて、音源毎の音源方向を求める第3のステップと
を含むことを特徴とする音源方向判定方法。 - 所定間隔に配置された二つのマイクにより得られた2チャンネルの音響信号を基に音の到来方向を特定する音源方向判定装置において、
前記2チャンネルの音響信号における位相差スペクトルを求める位相差スペクトル生成手段と、
前記2チャンネルの音響信号の少なくともいずれか一方のパワースペクトラムを求めるパワースペクトル生成手段と、
前記パワースペクトラムのピークの中から、前記パワースペクトラムが極大値となる周波数から差分が所定値以内である周波数の範囲に対応するピークの極大値近傍部分を選択する選択手段と、
前記位相差スペクトラムのうち、前記選択されたピークの極大値近傍部分の周波数に対応する部分を、周波数に関して一次近似した関数である、一次近似関数の傾きを、推定可能な全ての音源方向が取りうる値の範囲で求める音源方向推定手段と、
前記求められた傾きの一次近似関数夫々について、当該一次近似関数を表わす直線に近い値を取る前記位相差スペクトル内のスペクトル値に対応する前記パワースペクトル内のパワー値が大きいほど、前記一次近似関数の評価を大きくするように評価する評価手段と、
前記評価の結果、評価値の大きい一次近似関数に基づいて、音源毎の音源方向を求める音源方向特定手段と
を備えたことを特徴とする音源方向判定装置。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006002284A JP5098176B2 (ja) | 2006-01-10 | 2006-01-10 | 音源方向判定方法及び装置 |
US11/651,682 US20070160230A1 (en) | 2006-01-10 | 2007-01-10 | Device and method for determining sound source direction |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006002284A JP5098176B2 (ja) | 2006-01-10 | 2006-01-10 | 音源方向判定方法及び装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007183202A JP2007183202A (ja) | 2007-07-19 |
JP5098176B2 true JP5098176B2 (ja) | 2012-12-12 |
Family
ID=38232776
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006002284A Expired - Fee Related JP5098176B2 (ja) | 2006-01-10 | 2006-01-10 | 音源方向判定方法及び装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US20070160230A1 (ja) |
JP (1) | JP5098176B2 (ja) |
Families Citing this family (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB0720473D0 (en) * | 2007-10-19 | 2007-11-28 | Univ Surrey | Accoustic source separation |
JP5195652B2 (ja) * | 2008-06-11 | 2013-05-08 | ソニー株式会社 | 信号処理装置、および信号処理方法、並びにプログラム |
US8724829B2 (en) | 2008-10-24 | 2014-05-13 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for coherence detection |
KR101519104B1 (ko) | 2008-10-30 | 2015-05-11 | 삼성전자 주식회사 | 목적음 검출 장치 및 방법 |
US8620672B2 (en) * | 2009-06-09 | 2013-12-31 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for phase-based processing of multichannel signal |
JP5368272B2 (ja) * | 2009-11-20 | 2013-12-18 | ジェイ・アール・シー特機株式会社 | 音響信号処理装置 |
US8897455B2 (en) * | 2010-02-18 | 2014-11-25 | Qualcomm Incorporated | Microphone array subset selection for robust noise reduction |
US9794678B2 (en) * | 2011-05-13 | 2017-10-17 | Plantronics, Inc. | Psycho-acoustic noise suppression |
US8818800B2 (en) * | 2011-07-29 | 2014-08-26 | 2236008 Ontario Inc. | Off-axis audio suppressions in an automobile cabin |
JP5826582B2 (ja) * | 2011-10-13 | 2015-12-02 | 株式会社熊谷組 | 音源方向推定方法、音源方向推定装置、及び、音源推定用画像の作成装置 |
US8768275B2 (en) * | 2011-11-10 | 2014-07-01 | National Instruments Corporation | Spectral averaging |
TR201807219T4 (tr) * | 2012-01-17 | 2018-06-21 | Koninklijke Philips Nv | Audio kaynağı konum tahmini |
WO2013156818A1 (en) | 2012-04-19 | 2013-10-24 | Nokia Corporation | An audio scene apparatus |
KR102324283B1 (ko) * | 2015-07-31 | 2021-11-12 | 현대오토에버 주식회사 | 듀얼 마이크를 이용한 위상오류필터 기반의 음원 방향 검출 시스템 및 그 방법 |
US9858403B2 (en) | 2016-02-02 | 2018-01-02 | Qualcomm Incorporated | Liveness determination based on sensor signals |
WO2019171580A1 (ja) * | 2018-03-09 | 2019-09-12 | 日本電気株式会社 | 信号源識別装置、信号源識別方法、プログラム |
TWI811685B (zh) * | 2021-05-21 | 2023-08-11 | 瑞軒科技股份有限公司 | 會議室系統及音訊處理方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3070581B2 (ja) * | 1998-07-07 | 2000-07-31 | 日本電気株式会社 | パッシブソーナーの目標特徴素抽出方法、目標推定方法及び装置 |
JP2000035474A (ja) * | 1998-07-17 | 2000-02-02 | Fujitsu Ltd | 音源位置検出装置 |
US7215786B2 (en) * | 2000-06-09 | 2007-05-08 | Japan Science And Technology Agency | Robot acoustic device and robot acoustic system |
-
2006
- 2006-01-10 JP JP2006002284A patent/JP5098176B2/ja not_active Expired - Fee Related
-
2007
- 2007-01-10 US US11/651,682 patent/US20070160230A1/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
US20070160230A1 (en) | 2007-07-12 |
JP2007183202A (ja) | 2007-07-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5098176B2 (ja) | 音源方向判定方法及び装置 | |
US8767978B2 (en) | System and method for processing sound signals implementing a spectral motion transform | |
De La Cuadra et al. | Efficient pitch detection techniques for interactive music | |
EP0566131B1 (en) | Method and device for discriminating voiced and unvoiced sounds | |
JP4177452B2 (ja) | 音源位置検知装置 | |
US8949118B2 (en) | System and method for robust estimation and tracking the fundamental frequency of pseudo periodic signals in the presence of noise | |
KR20060042966A (ko) | 음원 신호 분리 장치 및 방법, 및 피치 검출 장치 및 방법 | |
JP2004538525A (ja) | 周波数分析によるピッチ判断方法および装置 | |
JP2008236077A (ja) | 目的音抽出装置,目的音抽出プログラム | |
JP2006195449A (ja) | 声質判定装置、声質判定方法、および声質判定プログラム | |
JP2005266797A (ja) | 音源信号分離装置及び方法、並びにピッチ検出装置及び方法 | |
JP4654621B2 (ja) | 音声処理装置およびプログラム | |
Benetos et al. | Auditory spectrum-based pitched instrument onset detection | |
JP4119112B2 (ja) | 混合音の分離装置 | |
Bonada | Wide-band harmonic sinusoidal modeling | |
Coyle et al. | Onset detection using comb filters | |
JPWO2008001779A1 (ja) | 基本周波数推定法および音響信号推定システム | |
Dziubiński et al. | High accuracy and octave error immune pitch detection algorithms | |
Beauchamp | Comparison of vocal and violin vibrato with relationship to the source/filter model | |
Danayi et al. | A novel algorithm based on time-frequency analysis for extracting melody from human whistling | |
Blandin et al. | Influence of speech sound spectrum on the computation of octave band directivity patterns | |
Bucci et al. | Non-impulsive signal deconvolution for computation of violin impulse responses | |
Lee et al. | Adversarial audio synthesis using a harmonic-percussive discriminator | |
TW201142820A (en) | Acoustical wave identification system and the method thereof | |
JP5495858B2 (ja) | 音楽音響信号のピッチ推定装置及び方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20081111 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110427 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110506 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110623 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110729 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110920 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20111130 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120227 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20120305 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120417 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120607 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120828 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120910 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20151005 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5098176 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |