JP5683140B2 - Noise-to-noise direct ratio estimation device, interference noise elimination device, perspective determination device, sound source distance measurement device, method of each device, and device program - Google Patents
Noise-to-noise direct ratio estimation device, interference noise elimination device, perspective determination device, sound source distance measurement device, method of each device, and device program Download PDFInfo
- Publication number
- JP5683140B2 JP5683140B2 JP2010134495A JP2010134495A JP5683140B2 JP 5683140 B2 JP5683140 B2 JP 5683140B2 JP 2010134495 A JP2010134495 A JP 2010134495A JP 2010134495 A JP2010134495 A JP 2010134495A JP 5683140 B2 JP5683140 B2 JP 5683140B2
- Authority
- JP
- Japan
- Prior art keywords
- noise
- direct ratio
- sound
- signal
- frequency domain
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Description
この発明は、例えば、音声通話や、音声入力によって機器を操作するハンズフリー方式等に応用でき、マイクロホンから特定の距離範囲内に位置する音源の音だけを強調して収音する際に用いられる耐雑音直間比推定装置、干渉雑音除去装置、遠近判定装置、音源距離測定装置、各装置の方法と各装置プログラムに関する。 The present invention can be applied to, for example, a voice call, a hands-free method of operating a device by voice input, and the like, and is used when collecting sound by emphasizing only the sound of a sound source located within a specific distance range from a microphone. The present invention relates to a noise-to-noise ratio estimation device, an interference noise removal device, a perspective determination device, a sound source distance measurement device, a method of each device, and a device program.
従来、音源との距離を識別し特定の距離範囲にある音源からの音だけを強調若しくは抑圧する目的で、マイクロホンから受信した信号から、直接音と残響音のそれぞれのパワーを推定して直間比を求める考えがある(例えば、非特許文献1)。図面を参照して従来の直間比推定装置が直間比を求める考えを説明する。 Conventionally, for the purpose of identifying the distance from a sound source and enhancing or suppressing only the sound from the sound source within a specific distance range, the power of the direct sound and reverberant sound is estimated from the signal received from the microphone, There is an idea of obtaining the ratio (for example, Non-Patent Document 1). The idea that the conventional direct ratio estimation apparatus obtains the direct ratio will be described with reference to the drawings.
図1に直間比推定装置を利用する場面を例示する。小型マイクロホンアレー11を、例えば4人の発話者12〜14が取り囲んで会議をしている場面を想定する。その会議室内には、テレビ16、電話17、館内放送用のスピーカ18が配置されているものとする。このような場面において、館内放送の音声や、電話の音等を収音せずに、小型マイクロホンアレー11を中心として所定の距離範囲内(破線で示す円内)に位置する発話者12〜14の発話だけを収音したい。 FIG. 1 illustrates a scene in which the direct ratio estimation apparatus is used. Assume that a small microphone array 11 is surrounded by, for example, four speakers 12 to 14 for a conference. It is assumed that a television 16, a telephone 17, and a speaker 18 for broadcasting in the hall are arranged in the conference room. In such a scene, the speakers 12 to 14 located within a predetermined distance range (within a circle indicated by a broken line) around the small microphone array 11 without picking up the voice of the in-house broadcast or the sound of the telephone. I want to collect only the utterances.
マイクロホンアレーから音源までの距離を見分けるために、受信音に含まれる直接音と間接音(残響音)との比(以降、直間比と称する)に着目する。図2に屋内にマイクロホンを置いて音を収録した際の、音源21からマイクロホン22までの音の伝搬経路を示す。直接音とは、音源21からマイクロホンまで直接到達する太い実線で示す音波である。一方の残響音とは、音源21から発した音が壁や床や天井などで反射してからマイクロホン22に到達する破線で示す音波である。
In order to distinguish the distance from the microphone array to the sound source, attention is paid to the ratio of direct sound and indirect sound (reverberation sound) included in the received sound (hereinafter referred to as direct ratio). FIG. 2 shows a sound propagation path from the
図3に直間比とマイクロホン間距離との関係を示す。図3の横軸はマイクロホンから音源までの距離、縦軸は直間比である。一般的に間接音はマイクロホンからの距離に依存しない一定の大きさを示す。その間接音に対して直接音は、マイクロホンからの距離の増加に伴って単調に減少する特性を示す。その直接音を間接音で除した直間比は、直接音と同様に距離の増加に伴って単調に減少する特性になる。 FIG. 3 shows the relationship between the direct ratio and the distance between the microphones. The horizontal axis in FIG. 3 is the distance from the microphone to the sound source, and the vertical axis is the direct ratio. In general, the indirect sound has a certain magnitude that does not depend on the distance from the microphone. In contrast to the indirect sound, the direct sound exhibits a characteristic that monotonously decreases as the distance from the microphone increases. The direct ratio obtained by dividing the direct sound by the indirect sound has a characteristic that decreases monotonously as the distance increases, as in the case of the direct sound.
従来の直間比推定装置は、受信音からこの直間比を推定し、音源のマイクロホンアレーからの距離を推定することができる。 A conventional direct ratio estimation device can estimate the direct ratio from the received sound and estimate the distance of the sound source from the microphone array.
しかし、一般にマイクロホンで収音した信号には、直接音と残響音の他に、各マイクロホン固有の雑音が重畳される。上記した従来の方法では雑音が考慮されておらず、雑音レベルが大きい場合に直間比の推定精度が劣化する課題がある。 However, in general, in addition to direct sound and reverberation sound, noise specific to each microphone is superimposed on a signal collected by a microphone. In the conventional method described above, noise is not taken into account, and there is a problem that the accuracy of the direct ratio is deteriorated when the noise level is large.
この発明は、このような問題点に鑑みてなされたものであり、雑音による直間比推定精度の劣化を防ぎ、雑音が存在しても高い精度で直間比を推定することができる耐雑音直間比推定装置と、それを用いた干渉雑音除去装置、遠近判定装置、音源距離測定装置と、各装置の方法と、装置プログラムを提供することを目的とする。 The present invention has been made in view of such problems, and prevents noise-to-direct ratio estimation accuracy from being deteriorated due to noise, and is capable of estimating the direct ratio with high accuracy even when noise is present. It is an object of the present invention to provide a direct ratio estimation device, an interference noise removal device, a perspective determination device, a sound source distance measurement device, a method of each device, and a device program using the same.
この発明の耐雑音直間比推定装置は、複数の周波数領域変換部と、直間比推定部とを備える。複数の周波数領域変換部は、複数のマイクロホンで受音された受音信号を周波数領域の信号に変換する。直間比推定部は、空間相関行列算出手段と、信号パワー推定手段と、直間比算出手段と、を具備する。空間相関行列算出手段は、複数の周波数領域変換部の出力する周波数領域の信号を入力としてその周波数領域の信号をベクトル化して空間相関行列を算出する。信号パワー推定手段は、予め与えられるマイクロホンの配置情報と、受信音から算出される空間相関行列とから直接音のパワーと残響音のパワーと雑音のパワーとで構成されるベクトルを求め、そのベクトル要素の内の直接音のパワーと残響音のパワーを出力する。直間比算出手段は、直接音のパワーを残響音のパワーで除した直間比を算出する。 The noise-to-noise direct ratio estimation device of the present invention includes a plurality of frequency domain conversion units and a direct ratio estimation unit. The plurality of frequency domain conversion units convert the received sound signals received by the plurality of microphones into frequency domain signals. The direct ratio estimating unit includes a spatial correlation matrix calculating means, a signal power estimating means, and a direct ratio calculating means. The spatial correlation matrix calculation means calculates the spatial correlation matrix by vectorizing the frequency domain signals with the frequency domain signals output from the plurality of frequency domain transform units as inputs. The signal power estimation means obtains a vector composed of direct sound power, reverberant power and noise power from the microphone arrangement information given in advance and the spatial correlation matrix calculated from the received sound, and the vector Outputs the power of the direct sound and reverberant sound of the element. The direct ratio calculation means calculates the direct ratio obtained by dividing the power of the direct sound by the power of the reverberant sound.
また、この発明の干渉雑音除去装置等は、この発明の耐雑音直間比推定装置を含むものであって、その他に1個のマイクロホンアレーと、処理対象信号生成部と、対象信号調整部と、逆周波数領域変換部と、を具備する。 Further, the interference noise removing apparatus of the present invention includes the noise-to-noise direct ratio estimating apparatus of the present invention, and in addition, one microphone array, a processing target signal generating unit, a target signal adjusting unit, And an inverse frequency domain transform unit.
この発明の耐雑音直間比推定装置は、直間比推定を行う際に利用するマイクロホン間相互相関の情報に、雑音が持つ相互相関のモデルを新たに追加して信号のパワーを求める。これにより、直接音、残響音、雑音の3つの成分のパワーを別々に推定することが可能であり、直間比の推定精度を向上させることができる。 The noise-resistant direct ratio estimation apparatus of the present invention newly adds a cross-correlation model of noise to information on the cross-correlation between microphones used when performing direct ratio estimation, and obtains signal power. Thereby, it is possible to estimate the powers of the three components of the direct sound, the reverberant sound, and the noise separately, and it is possible to improve the estimation accuracy of the direct ratio.
また、この発明の干渉雑音除去装置は、雑音のある環境でもマイクロホンに近い音源の音を強調し、遠い音源からの音を除去することができる。 Moreover, the interference noise removal apparatus of the present invention can enhance the sound of a sound source close to the microphone even in a noisy environment, and can remove the sound from a far sound source.
以下、この発明の実施の形態を図面を参照して説明する。複数の図面中同一のものには同じ参照符号を付し、説明は繰り返さない。また、以下の説明において、テキスト中で使用する記号「 ̄」や「^」等は、本来直前の文字の真上に記載されるべきものであるが、テキスト記法の制限により、当該文字の直後に記載する。式中においてはこれらの記号は本来の位置に記述している。 Embodiments of the present invention will be described below with reference to the drawings. The same reference numerals are given to the same components in a plurality of drawings, and the description will not be repeated. In the following description, the symbols “ ̄”, “^”, etc. used in the text should be written directly above the immediately preceding character, but immediately after the character due to restrictions on the text notation. It describes. In the formula, these symbols are written in their original positions.
図4にこの発明の耐雑音直間比推定装置100の機能構成例を示す。その動作フローを図5に示す。耐雑音直間比推定装置100は、複数の周波数領域変換部421〜42Mと、直間比推定部44とから成る。複数の周波数領域変換部421〜42Mのそれぞれには、マイクロホンアレー41を構成する複数のマイクロホンm1〜mMで受音された受音信号が入力される。直間比推定部44は、空間相関行列算出手段441と、信号パワー推定手段442と、直間比算出手段443と、を具備する。耐雑音直間比推定装置100の各部と各手段とは、例えばROM、RAM、CPU等で構成されるコンピュータに所定のプログラムが読み込まれて、CPUがそのプログラムを実行することで実現されるものである。
FIG. 4 shows an example of the functional configuration of the noise-resistant direct
複数の周波数領域変換部421,…,42Mは、複数のマイクロホンm1,…mMで受音された受音信号xm(n)を周波数領域の信号に変換する(ステップS42)。周波数領域変換部421,…,42Mは、受音信号xm(n)を、例えばサンプリング周波数16kHzでサンプリングしてディジタル信号に変換し、例えば256個のサンプルを1フレームとして、それぞれのフレームにおいて離散フーリエ変換を行い周波数成分Xm(ω,l)を出力する(ステップS42)。ωは周波数、lはフレーム番号である。なお、受音信号xm(n)をディジタル信号に変換するA/D変換器は省略している。
A plurality of frequency
空間相関行列算出手段441は、複数の周波数領域変換手段421,…,42Mが出力する周波数領域の信号X1(ω,l),…,XM(ω,l)を入力として、周波数領域の信号X1(ω,l),…,XM(ω,l)をベクトル化し、その入力信号を用いて式(1)に示す空間相関行列R(ω,l)を算出する(ステップS441)。
Spatial correlation
ここでTは行列の転置、Hは共役転置を、Lは平均を求めるフレームの数を表す。空間相関行列R(ω,l)は、信号パワー推定手段442に入力される。 Here, T is a matrix transposition, H is a conjugate transposition, and L is the number of frames for which an average is obtained. The spatial correlation matrix R (ω, l) is input to the signal power estimation unit 442.
信号パワー推定手段442は、空間相関行列算出手段441が出力する空間相関行列R(ω,l)の各成分Rij(ω,l)と、予め与えられているマイクロホンアレーのマイクロホン配置と、音源の方向より与えられる行列Rd(ω)(式(3))と、行列Rr(ω)(式(4))と行列Rn(ω)(式(5))の各成分、dij(ω)と、rij(ω)と、n ij(ω)と、のそれぞれで構成される式(6)に示す行列A(ω)と、式(7)に示すB(ω)を用いる。行列Rn(ω)(式(5))はM×Mの単位行列である。
The signal power estimation unit 442 includes each component R ij (ω, l) of the spatial correlation matrix R (ω, l) output from the spatial correlation
ここで、Dmnはm番目のマイクロホンとn番目のマイクロホンの距離、θはマイクロホンアレーの正面から見た音源の方向である。ここでは、マイクロホンアレーの形状は直線配置とし、マイクロホンアレーの正面とはマイクロホンの並ぶ直線の法線方向を意味する。 Here, D mn is the distance between the m-th microphone and the n-th microphone, and θ is the direction of the sound source viewed from the front of the microphone array. Here, the shape of the microphone array is a linear arrangement, and the front of the microphone array means the normal direction of a straight line in which the microphones are arranged.
そして、式(8)に示す連立方程式を立て、これを解くことで直接音のパワーPd(ω,l)と残響音のパワーPr(ω,l)と雑音のパワーPn(ω,l)で構成されるベクトルP(ω,l)(式(9))を求め、直接音パワーPd(ω,l)と残響音パワーPr(ω,l)を出力する。 Then, simultaneous equations Pd (ω, l), reverberant power P r (ω, l), and noise power P n (ω, l) are established by solving the simultaneous equations shown in equation (8). The vector P (ω, l) (equation (9)) composed of l) is obtained, and the direct sound power P d (ω, l) and the reverberation power P r (ω, l) are output.
なお、マイクロホンアレーの配置が直線以外の配置の場合の行列Rd(ω)は、より一般的な式(10)に示す形式で表せる。 Note that the matrix R d (ω) in the case where the arrangement of the microphone array is other than a straight line can be expressed in the form shown in the more general expression (10).
ここでDmn(θ) ̄は、角度θ°方向から見たときのm番目のマイクロホンとn番目のマイクロホンの距離差を表す。また、式(8)の連立方程式の解の導出は、例えば式(12)に示すようにA(ω)の擬似逆行列A+(ω)(式(11))を、B(ω,l)の左から掛ける方法で行われる。 Here, D mn (θ)  ̄ represents a distance difference between the m-th microphone and the n-th microphone when viewed from the direction of the angle θ °. Further, the derivation of the solution of the simultaneous equations of Expression (8) is performed by, for example, converting the pseudo inverse matrix A + (ω) (Expression (11)) of A (ω) to B (ω, l as shown in Expression (12). ) From the left side.
直間比算出手段443は、直接音パワーPd(ω,l)と残響音パワーPr(ω,l)より、式(13)によって直間比ER(l)を算出して出力する。 The direct ratio calculation means 443 calculates the direct ratio E R (l) from the direct sound power P d (ω, l) and the reverberant sound power P r (ω, l) according to the equation (13) and outputs it. .
この実施例1の方法は、雑音のパワーを除いて直接的に直間比を求めるので、正確な直間比の推定が可能である。この耐雑音直間比推定装置100は、干渉雑音除去装置に利用することができる。図6に、耐雑音直間比推定装置100を含む干渉雑音除去装置200の機能構成例を示す。その動作フローを図7に示す。
In the method according to the first embodiment, since the direct ratio is directly obtained without the noise power, it is possible to accurately estimate the direct ratio. This noise-to-noise direct
干渉雑音除去装置200は、1個のマイクロホンアレー41と、耐雑音直間比推定装置100と、処理対象信号生成部43と、対象信号調整部45と、逆周波数領域変換部46と、を具備する。耐雑音直間比推定装置100は、複数の周波数領域変換部421,…,42Mと直間比推定部44を備える図4で説明済みのものと同じものである。マイクロホンアレー41を除く各機能構成部は、例えばROM、RAM、CPU等で構成されるコンピュータに所定のプログラムが読み込まれて、CPUがそのプログラムを実行することで実現されるものである。
The interference
マイクロホンアレー41は複数のマイクロホンm1,…mMから成る。複数の周波数領域変換部421,…,42Mは、複数のマイクロホンm1,…mMで受音された受音信号xm(n)がそれぞれ入力され、各受音信号を周波数領域の信号に変換する(ステップS42)。
処理対象信号生成部43は、複数の周波数領域変換部421,…,42Mが出力する周波数領域の信号Xm(ω,l)を合成して処理対象信号Y(ω,l)を生成する(ステップS43)。耐雑音直間比推定装置100は、上記したのと同じ動作を行い直間比ER(ω,l)を算出して出力する(ステップS44)。ただし、ここで述べる干渉雑音除去装置では、直間比として式(13)の分母と分子における総和演算を除いた式(14)を使用する。
Processing
対象信号調整部45は、処理対象信号Y(ω,l)と、直間比ER(ω,l)を入力としてその値に応じて処理対象信号Y(ω,l)の振幅を調整した処理後信号Z(ω,l)を生成する(ステップS45)。 The target signal adjustment unit 45 receives the processing target signal Y (ω, l) and the direct ratio E R (ω, l) as input and adjusts the amplitude of the processing target signal Y (ω, l) according to the values. A post-processing signal Z (ω, l) is generated (step S45).
逆周波数領域変換部46は、処理後信号Z(ω,l)を時間領域の信号z(n)に変換する(ステップS46)。ステップS42〜ステップS46までの動作は、全ての受音信号xm(n)が終了するまで継続される。
The inverse frequency
ここで、直間比ER(ω,l)の値に応じて調整とは、ER(ω,l)の閾値処理や、その値が大きいほど処理後信号Z(ω,l)の振幅を大きくする処理や、その値が大きいほど処理後信号Z(ω,l)の振幅を小さくする等の処理を含む。詳しくは後述する。 Here, adjustment according to the value of the direct ratio E R (ω, l) means threshold processing of E R (ω, l) and the amplitude of the post-processing signal Z (ω, l) as the value increases. And processing such as decreasing the amplitude of the post-processing signal Z (ω, l) as the value increases. Details will be described later.
以上の動作により、1個のマイクロホンアレーによって、例えば、特定の距離範囲にある音だけを強調し、その範囲外の音は抑圧して収音する雑音除去が行われる。以降、各部のより具体的な機能構成例を示して更に詳しくこの発明を説明する。 With the above operation, noise removal is performed by, for example, emphasizing only sounds within a specific distance range and suppressing and collecting sounds outside the range by one microphone array. Hereinafter, the present invention will be described in more detail by showing more specific functional configuration examples of the respective units.
〔処理対象信号生成部〕
図8に処理対象信号生成部43のより具体的な機能構成例を示す。処理対象信号生成部43は、複数の重み乗算手段4311〜431Mと、加算手段432を備える。複数の重み乗算手段4311〜431Mは、M個のマイクロホンで受音した複数の受音信号xm(n)の、それぞれの周波数成分X1(ω,l),…,XM(ω,l)に重み係数wm(ω)を乗ずる。
[Processing signal generator]
FIG. 8 shows a more specific functional configuration example of the processing target
重み乗算手段4311〜431Mで使用する重みには、例えばM個のマイクロホンが無指向性の場合にはwm=1/Mとすることで全ての周波数成分X1(ω,l),…,XM(ω,l)の平均を取ることで、処理対象信号Y(ω,l)を安定化させる。また、M個のマイクロホンが指向性を持つ場合には、w1=1,wm=0(m={2,…,M})とすることで、特定のマイクロホンの信号だけを使用することができる。例えば、参考文献「大賀、山崎、金田著、“音響システムとディジタル信号処理”電子情報通信学会発行」に記載されているような方法を利用して、重みビームフォーミングのフィルタ係数を使用すれば、マイクロホンアレーで任意の指向性を形成することもできる。 For the weights used in the weight multiplication means 431 1 to 431 M , for example, when M microphones are omnidirectional, w m = 1 / M so that all frequency components X 1 (ω, l), .., X M (ω, l) is averaged to stabilize the processing target signal Y (ω, l). Also, when M microphones have directivity, use only a specific microphone signal by setting w 1 = 1, w m = 0 (m = {2,..., M}). Can do. For example, using a method such as that described in the reference “Oga, Yamazaki, Kanada,“ Sound System and Digital Signal Processing ”published by the Institute of Electronics, Information and Communication Engineers”, using filter coefficients for weighted beamforming, Arbitrary directivity can be formed with a microphone array.
加算手段432は、重みが乗ぜられた全ての周波数成分X1(ω,l),…,XM(ω,l)を加算して処理対象信号Y(ω,l)を出力する。 The adding means 432 adds all the frequency components X 1 (ω, l),..., X M (ω, l) multiplied by the weights and outputs the processing target signal Y (ω, l).
〔対象信号調整部〕
対象信号調整部45は、例えば、フィルタ係数算出手段451と、乗算手段452とで構成できる(図6)。フィルタ係数算出手段451は、直間比ER(ω,l)を入力としてフィルタ係数G(ω,l)を算出して出力する。フィルタ係数G(ω,l)の算出には、例えば式(15)に示すように閾値を用いた2値のフィルタなどが用いられる。
[Target signal adjustment section]
The target signal adjustment unit 45 can be configured by, for example, a filter
なお、閾値Thは、直間比ER(ω,l)の最小値と最大値の間の任意の値が設定できる。閾値Thを最小値(0)に近づけると音質は向上する。逆に閾値Thを最大値に近づけると雑音抑圧効果は高めるが受音信号の歪みが大きくなり音質が劣化する。 The threshold value Th can be set to any value between the minimum value and the maximum value of the direct ratio E R (ω, l). The sound quality is improved when the threshold Th is brought close to the minimum value (0). On the contrary, when the threshold value Th is brought close to the maximum value, the noise suppression effect is enhanced, but the distortion of the received sound signal is increased and the sound quality is deteriorated.
このように閾値Thは、音質と雑音抑圧との関係でトレードオフの関係を持つ。よって、閾値Thは、このトレードオフの関係を考慮した上で、利用目的に応じて経験的に決定される。 Thus, the threshold Th has a trade-off relationship between the sound quality and the noise suppression. Therefore, the threshold Th is determined empirically in accordance with the purpose of use in consideration of this trade-off relationship.
また、フィルタ係数G(ω,l)の算出に際して式(16)に示すように、直間比の値が閾値Th2を下回る時間周波数帯域を強調するようにすれば、特定の距離範囲より遠くの音源を強調することができる。 Further, when calculating the filter coefficient G (ω, l), as shown in the equation (16), if a time frequency band in which the value of the direct ratio falls below the threshold Th 2 is emphasized, it is farther than a specific distance range. The sound source can be emphasized.
なお、フィルタ係数G(ω,l)の例として0か1の2値のフィルタを挙げたが、フィルタ係数G(ω,l)は必ずしも0と1である必要はなく、例えば、0.1と0.9のように十分異なる値であれば良い。 In addition, although the binary filter of 0 or 1 was mentioned as an example of filter coefficient G ((omega), l), filter coefficient G ((omega), l) does not necessarily need to be 0 and 1, for example, 0.1 And a sufficiently different value such as 0.9.
また、フィルタ係数G(ω,l)には、1以上の実数を設定するようにしても良い。つまり、処理対象信号Y(ω,l)を増幅するようにしても良い。また、0.1以下の値に設定して処理対象信号Y(ω,l)を大きく抑圧するようにしても良い。 Further, a real number of 1 or more may be set for the filter coefficient G (ω, l). That is, the processing target signal Y (ω, l) may be amplified. Alternatively, the processing target signal Y (ω, l) may be greatly suppressed by setting the value to 0.1 or less.
このようにして求めたフィルタ係数G(ω,l)が、乗算手段452において、処理対象信号Y(ω,l)に乗じて処理後信号Z(ω,l)=G(ω,l)・Y(ω,l)が生成される。よって、処理後信号Z(ω,l)を、直間比ER(ω,l)の大きな処理対象信号Y(ω,l)のみで構成することができる。つまり、直接音のみを抽出することができる。
The
この発明の実施例2として、実施例1で述べた直間比ER(l)を用いて音源の遠近を判定する遠近判定装置300を説明する。図9に遠近判定装置300の機能構成例を示す。遠近判定装置300は、マイクロホンアレー41と、耐雑音直間比推定装置100と、遠近判定部121と、を備える。マイクロホンアレー41と、耐雑音直間比推定装置100は、干渉雑音除去装置200のものと同じである。遠近判定装置300も、例えばROM、RAM、CPU等で構成されるコンピュータに所定のプログラムが読み込まれて、CPUがそのプログラムを実行することで実現される。
As a second embodiment of the present invention, a
遠近判定装置300は、複数の異なる距離にある音源が異なる時刻に発音するときに、ある時刻に受音された音の音源が遠くにあるのか近くにあるのかを判定するものである。遠近判定装置300を構成する遠近判定部121は、蓄積手段1211と、判定手段1212と、を備える。
The
蓄積手段1211は、直間比ERを過去L時間フレーム分蓄積して、比較対象直間比E^を出力する。比較対象直間比E^には、例えば蓄積された直間比ER(l)の平均値E^=1/LΣl LER(l)や、最小値と最大値の平均値E^=1/2(maxER(l)+minER(l))等が用いられる。
The accumulating
判定手段1212は、直間比ER(l)と、比較対象直間比E^を比較して、ER(l)>E^の時には遠近判定結果Ylに距離が近いことを表す例えば1を、ER(l)<E^の時には遠近判定結果Ylに距離が遠いことを表す例えば0を出力する。この遠近判定結果Ylは、直近の過去L時間分の受音信号が、比較的近い音源からの音であるか、又は、比較的遠い音源からの音であるかを表すものである。
The
この遠近判定結果Ylを用いることで、逐次入力される受音信号を、マイクロホンとその音源間との距離によって切り分けることが可能である。つまり、複数の音源の音を、マイクロホンからの距離に応じて選択することができる。 The distance determination result by using a Y l, the received sound signal inputted sequentially, it is possible to isolate the distance between the between the microphone and the sound source. That is, sounds from a plurality of sound sources can be selected according to the distance from the microphone.
図10にこの発明の音源距離測定装置400の機能構成例を示す。音源距離測定装置400は、1個のマイクロホンアレー41と、耐雑音直間比推定装置100と、距離−直間比データベース(以降、距離−直間比DBと称する)47と、距離判定部48と、を具備する。耐雑音直間比推定装置100は、複数の周波数領域変換部421,…,42Mと直間比推定部44を含む。マイクロホンアレー41を除く各機能構成部は、例えばROM、RAM、CPU等で構成されるコンピュータに所定のプログラムが読み込まれて、CPUがそのプログラムを実行することで実現されるものである。
FIG. 10 shows a functional configuration example of the sound source
マイクロホンアレー41は複数のマイクロホンm1,…mMから成る。複数の周波数領域変換部421,…,42Mは、複数のマイクロホンm1,…mMで受音された受音信号xm(n)がそれぞれ入力され、各受音信号を周波数領域の信号に変換する。周波数領域変換部421,…,42Mは、フレーム毎に離散フーリエ変換を行い周波数成分Xm(ω,l)を出力する。
直間比推定部44は、複数の周波数領域変換部421,…,42mが出力する周波数領域の信号Xm(ω,l)を入力として受音信号の直間比ERを推定する。
Chokkan
距離−直間比DB47は、直間比ERとマイクロホンアレーと音源との距離との関係を
記録している。距離判定部48は、直間比を入力として距離−直間比DB47を参照してその直間比と対応する音源距離推定値d^を推定する。
Distance -
受音信号の中には、特定の周波数帯域に成分が集中しているものもある。そのような受音信号の直間比ERを、直間比算出手段443で算出した場合、直間比ERの推定精度は劣化してしまう。 Some received signals have components concentrated in a specific frequency band. When the direct ratio E R of such a sound reception signal is calculated by the direct ratio calculation means 443, the estimation accuracy of the direct ratio E R deteriorates.
そこで、式(17)に示すように、特定の周波数領域Ωにおける直間比Eを算出する直間比算出手段443′(図4)を用いることで、直間比の推定精度を向上させることが出来る。 Therefore, as shown in the equation (17), by using the direct ratio calculation means 443 ′ (FIG. 4) for calculating the direct ratio E in a specific frequency region Ω, the accuracy of the direct ratio is improved. I can do it.
ここで周波数領域Ωは、例えば信号成分の集中する周波数帯域を選択するなどして決定される。例えば、任意のm番目のマイクロホンに接続された周波数領域変換部42mの出力Xm(ω,l)のうち、式(18)に示す様にXm(ω,l)の絶対値が予め設定された閾値Pthより大きい値を持つ周波数ωを選んだり、Xm(ω,l)の絶対値が大きい方からK番目までの周波数ωを選ぶことで決定される。
Here, the frequency region Ω is determined, for example, by selecting a frequency band in which signal components are concentrated. For example, among the outputs X m (ω, l) of the
ここで、Pthは、例えば|Xm(ω,l)|の全周波数の平均値などが用いられる。 Here, P th is, for example | X m (ω, l) | of an average value of all the frequency used.
図11に、この発明の干渉雑音除去装置500の機能構成例を示す。干渉雑音除去装置500は、実施例1で述べた耐雑音直間比推定装置100と、処理対象信号生成部72と、対象信号調整部73と、逆周波数領域変換部74と、を具備する。
FIG. 11 shows a functional configuration example of the interference noise removing apparatus 500 of the present invention. The interference noise removal apparatus 500 includes the noise-to-noise direct
処理対象信号生成部72は、耐雑音直間比推定装置100内の複数の周波数領域変換部421〜42Mが出力する周波数領域の信号Xm(ω,l)を入力として処理対象信号X(ω,l)を出力する。処理対象信号X(ω,l)は、周波数領域の信号Xm(ω,l)を例えば図示しない加算手段等で合成したものである。加算する前に、各周波数領域の信号Xm(ω,l)に、重みを乗じる様にしても良い。
The processing target
対象信号調整部73は、耐雑音直間比推定装置100が出力する直間比E(ω)と、処理対象信号生成部72が出力する処理対象信号X(ω,l)を入力として、処理対象信号X(ω,l)の振幅を調整した処理後信号Y(ω,l)を生成する。逆周波数領域変換部74は、処理後信号Y(ω,l)を時間領域の信号y(n)に変換する。
The target
対象信号調整部73は、例えば、距離算出手段731、フィルタ形成手段732、乗算手段733、を備える。距離算出手段731は、マイクロホンアレー41と音源との間の距離と、直間比ER(ω,l)との関係を示す関数式d=f(ER(ω,l))を内蔵し、入力される直間比Eに応じた音源距離推定値d^を算出する。
The target
フィルタ形成手段732は、式(19)に示すように、音源距離推定値d^が、2つの大きさが異なる閾値dfとdnの間の値を取る時間周波数成分を強調するように設定し、2つの距離区間内の帯状の領域にある音源だけを強調するフィルタを形成する。 Filter forming means 7 3 2, as shown in equation (19), the sound source distance estimate d ^ is, emphasize the two time frequency components takes a value between the different sizes threshold d f and d n so And a filter for emphasizing only the sound source in the band-like region in the two distance sections is formed.
ここで、G(ω,l)のlとωは、上記した直間比推定部43の処理の内、空間相関行列算出手段431において式(1)で平均を行ったL個のフレーム及び直間比算出手段443において平均を行った周波数Ω(式(17))に含まれる全ての周波数に対して、同じG(ω,l)が乗算される。また、式(19)においてG(ω,l)の値は必ずしも1と0である必要は無く、例えば、0.9と0.1のように十分大きさが異なる値でも良い。
Here, l and ω of G (ω, l) are the L frames obtained by averaging the equation (1) in the spatial correlation matrix calculation means 431 and the direct values of the processing of the direct
乗算手段733は、処理対象信号X(ω,l)に、フィルタG(ω,l)を乗じて処理後信号Y(ω,l)を生成する。したがって、処理後信号Y(ω,l)は、2つの距離区間内、つまり、マイクロホンアレー41から特定の距離範囲に位置する音源の音声が、強調若しくは抑圧されたものとなる。この処理後信号Y(ω,l)は、逆周波数領域変換部73で時間領域の信号y(n)に変換される。
The multiplying
上記した実施例の空間相関行列R(ω,l)は、式(1)から明らかなように、フレーム数Lの平均値を元にしたものである。従って、音源の位置が移動する場合には、正確に直間比を求めることができない。そこで、音源の位置が移動する場合でも、正確に直間比を求めることができる耐雑音直間比推定装置600を説明する。 The spatial correlation matrix R (ω, l) in the above-described embodiment is based on the average value of the number of frames L, as is apparent from the equation (1). Therefore, when the position of the sound source moves, the direct ratio cannot be obtained accurately. Therefore, a noise-resistant direct ratio estimation apparatus 600 that can accurately determine the direct ratio even when the position of the sound source moves will be described.
この実施例では、例えば図12に示すような等間隔配置のマイクロホンアレー130を利用する。この実施例による直間比推定部44の機能構成は、図4に示したものと同じである。
In this embodiment, for example, a
信号パワー推定手段442′(図4)は、空間相関行列算出手段441′が出力する小空間相関行列R′(ω,l)の各成分R′i,j(ω,l)と、予め与えられているマイクロホンアレーのマイクロホン配置と、音源の方向より与えられる行列Rd(ω)(式(3))と、行列Rr(ω)(式(4))と行列Rn(ω)(式(5))の各成分、di,j(ω)と、ri,j(ω)と、ni,j(ω)より、それぞれ構成される式(20)に示す行列A(ω)と、式(21)に示すB(ω,l)を用いる。ここで、小空間相関行列R′(ω,l)とは、小マイクロホンアレー毎に求めた空間相関行列の和で求まる行列である(式(22))。 The signal power estimation means 442 ′ (FIG. 4) gives in advance each component R ′ i, j (ω, l) of the small spatial correlation matrix R ′ (ω, l) output from the spatial correlation matrix calculation means 441 ′. And the matrix R d (ω) given by the direction of the sound source (formula (3)), the matrix R r (ω) (formula (4)) and the matrix R n (ω) ( A matrix A (ω) shown in Expression (20), which is composed of each component of Expression (5), d i, j (ω), r i, j (ω), and n i, j (ω). ) And B (ω, l) shown in equation (21). Here, the small spatial correlation matrix R ′ (ω, l) is a matrix obtained by the sum of the spatial correlation matrices obtained for each small microphone array (formula (22)).
但し、B(ω,l)の各成分であるR11′(ω,l),R12′(ω,l),R21′(ω,l),R22′(ω,l)は、式(22)に示すR′(ω,l)で求められる。 However, R 11 ′ (ω, l), R 12 ′ (ω, l), R 21 ′ (ω, l), R 22 ′ (ω, l), which are the components of B (ω, l), It is obtained by R ′ (ω, l) shown in the equation (22).
但し、
式(22)と式(23)は、図13に示すように隣接するマイクロホンを2個ずつの小アレーとして移動した場合の空間相関行列の和で求まる小空間相関行列を算出する。つまり、隣接するマイクロホンを2個ずつ括った小アレーを移動(130a→130b→ … →130g)して空間相関行列の和を求める。マイクロホンの数をM′個とすると、式(20)は式(24)、式(21)は式(25)、式(22)は式(26)で表せる。 Expressions (22) and (23) calculate a small spatial correlation matrix obtained by the sum of the spatial correlation matrices when adjacent microphones are moved as two small arrays as shown in FIG. That is, a small array including two adjacent microphones is moved (130a → 130b →... → 130g) to obtain the sum of spatial correlation matrices. When the number of microphones is M ′, Expression (20) can be expressed by Expression (24), Expression (21) can be expressed by Expression (25), and Expression (22) can be expressed by Expression (26).
そして、式(8)に示す連立方程式を立て、これを解くことで直接音のパワーPd(ω,l)と残響音のパワーPr(ω,l)と雑音のパワーPn(ω,l)で構成されるベクトルP(ω,l)(式(9))を求め、直接音パワーPd(ω,l)と残響音パワーPr(ω,l)を出力する。 Then, simultaneous equations Pd (ω, l), reverberant power P r (ω, l), and noise power P n (ω, l) are established by solving the simultaneous equations shown in equation (8). The vector P (ω, l) (equation (9)) composed of l) is obtained, and the direct sound power P d (ω, l) and the reverberation power P r (ω, l) are output.
直間比算出手段443は、実施例1と全く同じ処理を行う。以上説明したように空間相関行列算出手段441′のように、小アレー毎に求めた空間相関行列の和で求まる小空間相関行列を算出することで、移動する音源に対しても正確な直間比を求めることができる。 The direct ratio calculation means 443 performs exactly the same processing as in the first embodiment. As described above, by calculating the small spatial correlation matrix obtained by the sum of the spatial correlation matrices obtained for each small array as in the spatial correlation matrix calculating means 441 ′, it is possible to obtain an accurate straight line for a moving sound source. The ratio can be determined.
なお、小アレーを構成するマイクロホンの数を2個の例で説明したが、その数はいくつでも良い。また、そのマイクロホンの配置も等間隔に直線配置されたリニアアレーに限定されない。長方形平面アレー、三角形平面アレー、直方体アレー等、一定規則で配列された複数のマイクロホンから成る小マイクロホンアレーの平行移動で重なる位置に、マイクロホンが設けられるマイクロホンアレーであれば何でも良い。 Although the number of microphones constituting the small array has been described with two examples, the number may be any number. Further, the arrangement of the microphones is not limited to a linear array arranged linearly at equal intervals. Any microphone array may be used as long as a microphone is provided at a position overlapping by translation of a small microphone array composed of a plurality of microphones arranged in a regular rule, such as a rectangular planar array, a triangular planar array, and a rectangular parallelepiped array.
〔実験結果〕
この発明の効果を確認する目的で、音源21から白色雑音が発せられたときにマイクロホンアレーで受音した信号を用いて直間比を推定し、従来方法と比較する実験を行った。
〔Experimental result〕
For the purpose of confirming the effect of the present invention, an experiment was performed in which the direct ratio was estimated using signals received by the microphone array when white noise was emitted from the
図14にシミュレーション条件を示す。平面サイズが4×6mで、高さが2.7mの部屋を想定した。なお図14は部屋を上から見た図である。8個のマイクロホンを半径6cmの円状に配置したマイクロホンアレーを用いた。マイクロホンアレーは床から高さを1.5mの位置に配置した。そして円の中心軸から角度10°の方向で、高さ1.5mの位置に音源21を配置した。部屋の残響時間は約550ms、サンプリング周波数は16kHz、処理における1フレームの長さは512サンプルである。
FIG. 14 shows the simulation conditions. A room having a plane size of 4 × 6 m and a height of 2.7 m was assumed. FIG. 14 is a view of the room as viewed from above. A microphone array in which eight microphones were arranged in a circle with a radius of 6 cm was used. The microphone array was placed at a height of 1.5m from the floor. The
図15にSNR:10dBとした時、図16にSNR:20dBとした時を示す。それぞれ(a)が従来方法、(b)がこの発明である。横軸は距離(cm)、縦軸は直間比(dB)である。○実線が推定した直間比、●破線が正しい直間比を示す。 FIG. 15 shows the time when SNR: 10 dB, and FIG. 16 shows the time when SNR: 20 dB. (A) is the conventional method, and (b) is the present invention. The horizontal axis is the distance (cm), and the vertical axis is the direct ratio (dB). ○ The solid line indicates the estimated direct ratio, and ● the broken line indicates the correct direct ratio.
図15と16の(a)と(b)を比較すると、どちらもこの発明の方が誤差が少ないことが分かる。例えばSNR:10dB(図15)の距離10cmの音源に対する直間比の推定誤差は、従来技術が10dBであるのに対して本発明による耐雑音直間比推定装置では約5dBである。また、雑音のパワーが10分の1の関係にある図15と16とを比較すると、図15(b)と図16(b)との間にはほとんど差がないことが分かる。この結果は、この発明の方法が、重畳する雑音の大きさに影響を受け難いことを示している。このように、この発明による耐雑音直間比推定方法によればマイクロホンに無相関な雑音が重畳した場合でも精度よく直間比を推定する効果を奏する。 Comparing FIGS. 15 and 16 (a) and (b), it can be seen that the present invention has less error. For example, the estimation error of the direct ratio with respect to a sound source with a SNR of 10 dB (FIG. 15) at a distance of 10 cm is about 5 dB in the noise-resistant direct ratio estimation apparatus according to the present invention, while the conventional technique has 10 dB. Further, comparing FIG. 15 and FIG. 16 where the noise power is 1/10, it can be seen that there is almost no difference between FIG. 15 (b) and FIG. 16 (b). This result shows that the method of the present invention is not easily affected by the magnitude of the superimposed noise. As described above, according to the noise-resistant direct ratio estimation method according to the present invention, there is an effect of accurately estimating the direct ratio even when uncorrelated noise is superimposed on the microphone.
なお、上記方法及び装置において説明した処理は、記載の順に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されるとしても良い。また、上記装置及び方法を実装したマイクロホンアレーを2つ以上利用することで、干渉雑音除去システムなどを構築しても良い。 Note that the processes described in the above method and apparatus are not only executed in time series according to the order of description, but may also be executed in parallel or individually as required by the processing capability of the apparatus that executes the processes. good. Further, an interference noise removal system or the like may be constructed by using two or more microphone arrays on which the above apparatus and method are mounted.
また、上記装置における処理手段をコンピュータによって実現する場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、各装置における処理手段がコンピュータ上で実現される。 Further, when the processing means in the above apparatus is realized by a computer, the processing contents of functions that each apparatus should have are described by a program. Then, by executing this program on the computer, the processing means in each apparatus is realized on the computer.
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。具体的には、例えば、磁気記録装置として、ハードディスク装置、フレキシブルディスク、磁気テープ等を、光ディスクとして、DVD(Digital Versatile Disc)、DVD−RAM(Random Access Memory)、CD−ROM(Compact Disc Read Only Memory)、CD−R(Recordable)/RW(ReWritable)等を、光磁気記録媒体として、MO(Magneto Optical disc)等を、半導体メモリとしてEEP−ROM(Electronically Erasable and Programmable-Read Only Memory)等を用いることができる。 The program describing the processing contents can be recorded on a computer-readable recording medium. As the computer-readable recording medium, for example, any recording medium such as a magnetic recording device, an optical disk, a magneto-optical recording medium, and a semiconductor memory may be used. Specifically, for example, as a magnetic recording device, a hard disk device, a flexible disk, a magnetic tape or the like, and as an optical disk, a DVD (Digital Versatile Disc), a DVD-RAM (Random Access Memory), a CD-ROM (Compact Disc Read Only). Memory), CD-R (Recordable) / RW (ReWritable), etc., magneto-optical recording medium, MO (Magneto Optical disc), etc., semiconductor memory, EEP-ROM (Electronically Erasable and Programmable-Read Only Memory), etc. Can be used.
また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD−ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記録装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。 The program is distributed by selling, transferring, or lending a portable recording medium such as a DVD or CD-ROM in which the program is recorded. Further, the program may be distributed by storing the program in a recording device of a server computer and transferring the program from the server computer to another computer via a network.
また、各手段は、コンピュータ上で所定のプログラムを実行させることにより構成することにしてもよいし、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。 Each means may be configured by executing a predetermined program on a computer, or at least a part of these processing contents may be realized by hardware.
Claims (8)
上記直間比推定部は、
上記複数の周波数領域変換部の出力する周波数領域の信号を入力としてその周波数領域の信号をベクトル化して空間相関行列を算出する空間相関行列算出手段と、
予め与えられる上記マイクロホンの配置情報と、上記空間相関行列とから直接音のパワーと残響音のパワーと雑音のパワーとで構成されるベクトルを求め、そのベクトル要素の内の直接音のパワーと残響音のパワーを出力する信号パワー推定手段と、
上記直接音のパワーを上記残響音のパワーで除した上記直間比を算出する直間比算出手段と、
を具備する耐雑音直間比推定装置。 A plurality of frequency domain converters for receiving received signals received by a plurality of microphones and converting the received signals into frequency domain signals, and direct sound power and reverberation using the frequency domain signals as inputs. A noise-tolerant direct ratio estimation device comprising a direct ratio estimator for calculating a direct ratio obtained by calculating a sound power and a noise power and dividing the direct sound power by the reverberant power,
The direct ratio estimator is
A spatial correlation matrix calculating means for calculating a spatial correlation matrix by vectorizing a signal in the frequency domain with the frequency domain signal output from the plurality of frequency domain transform units as an input;
A vector composed of direct sound power, reverberant sound power and noise power is obtained from the microphone arrangement information given in advance and the spatial correlation matrix, and the direct sound power and reverberation among the vector elements are obtained. Signal power estimation means for outputting the power of sound;
Direct ratio calculation means for calculating the direct ratio obtained by dividing the power of the direct sound by the power of the reverberant sound;
A noise-to-noise direct ratio estimation apparatus comprising:
上記複数の周波数領域変換部に受音された受音信号をそれぞれ入力する複数のマイクロホンから成るマイクロホンアレーと、
上記複数の周波数領域変換部の出力する周波数領域の信号を合成して処理対象信号を生成する処理対象信号生成部と、
上記処理対象信号と、上記直間比を入力として当該直間比が大きいほど上記処理対象信号の振幅を大きく調整した処理後信号を生成する対象信号調整部と、
上記処理後信号を時間領域の信号に変換する逆周波数領域変換部と、
を具備する干渉雑音除去装置。 An interference noise elimination apparatus including the noise-to-noise ratio ratio estimation apparatus according to claim 1,
A microphone array composed of a plurality of microphones, each of which receives a received sound signal received by the plurality of frequency domain converters;
A processing target signal generation unit that generates a processing target signal by combining frequency domain signals output from the plurality of frequency domain conversion units;
A target signal adjustment unit that generates a processed signal in which the amplitude of the processing target signal is adjusted to be larger as the direct ratio is larger with the processing target signal and the direct ratio as an input;
An inverse frequency domain transform unit for transforming the processed signal into a time domain signal;
An interference noise removing apparatus comprising:
上記複数の周波数領域変換部に受音された受音信号をそれぞれ入力する複数のマイクロホンから成るマイクロホンアレーと、
上記複数の周波数領域変換部の出力する周波数領域の信号を合成して処理対象信号を生成する処理対象信号生成部と、
上記処理対象信号と、上記直間比を入力として当該直間比が小さいほど上記処理対象信号の振幅を大きく調整した処理後信号を生成する対象信号調整部と、
上記処理後信号を時間領域の信号に変換する逆周波数領域変換部と、
を具備する干渉雑音除去装置。 An interference noise elimination apparatus including the noise-to-noise ratio ratio estimation apparatus according to claim 1,
A microphone array composed of a plurality of microphones, each of which receives a received sound signal received by the plurality of frequency domain converters;
A processing target signal generation unit that generates a processing target signal by combining frequency domain signals output from the plurality of frequency domain conversion units;
A target signal adjustment unit that generates a post-processing signal in which the amplitude of the processing target signal is adjusted to be larger as the direct ratio is smaller, with the processing target signal and the direct ratio being input;
An inverse frequency domain transform unit for transforming the processed signal into a time domain signal;
An interference noise removing apparatus comprising:
上記遠近判定部は、
上記直間比を、周波数方向に平均して周波数平均直間比を出力する周波数平均手段と、
上記周波数平均直間比を過去の所定時間分のフレームを蓄積して、比較対象直間比を出力する蓄積手段と、
上記周波数平均直間比と、上記比較対象直間比とを比較して遠近判定結果を出力する判定手段と、
を具備する遠近判定装置。 A perspective determination device including the noise-to-noise direct ratio estimation device according to claim 1 and including a perspective determination unit,
The perspective determination unit
Frequency averaging means for averaging the direct ratio in the frequency direction and outputting the frequency average direct ratio;
Accumulating means for accumulating frames for a predetermined period of time in the frequency average direct ratio and outputting the comparative direct ratio;
A determination means for comparing the frequency average direct ratio and the comparison target direct ratio and outputting a perspective determination result;
A perspective determination device comprising:
上記複数の周波数領域変換部に受音された受音信号をそれぞれ入力する複数のマイクロホンから成るマイクロホンアレーと、
上記直間比と距離との関係を記録した距離−直間比データベースと、
上記直間比を入力として上記距離−直間比データベースを参照して当該直間比と対応する音源距離推定値を推定する距離判定部と、
を具備する音源距離測定装置。 A sound source distance measuring device including the noise-to-noise direct ratio estimating device according to claim 1,
A microphone array composed of a plurality of microphones, each of which receives a received sound signal received by the plurality of frequency domain converters;
A distance-direct ratio database that records the relationship between the direct ratio and distance;
A distance determination unit that estimates the sound source distance estimate corresponding to the direct ratio by referring to the distance-direct ratio database using the direct ratio as an input;
A sound source distance measuring device comprising:
上記複数の周波数領域変換部が出力する周波数領域の信号を入力として処理対象信号を出力する処理対象信号生成部と、
上記耐雑音直間比推定装置が出力する直間比と、上記処理対象信号とを入力として上記複数のマイクロホンから成るマイクロホンアレーから特定の距離範囲に位置する音源の音声を、強調若しくは抑圧した処理後信号を生成する対象信号調整部と、
上記処理後信号を時間領域の信号に変換する逆周波数領域変換部と、
を具備する干渉雑音除去装置。 An interference noise elimination apparatus including the noise-to-noise ratio ratio estimation apparatus according to claim 1,
A processing target signal generation unit that outputs a processing target signal with the frequency domain signals output by the plurality of frequency domain conversion units;
Processing that emphasizes or suppresses the sound of a sound source located in a specific distance range from the microphone array composed of the plurality of microphones, with the direct ratio output from the noise-tolerant direct ratio estimation device and the processing target signal as inputs. A target signal adjustment unit for generating a post signal;
An inverse frequency domain transform unit for transforming the processed signal into a time domain signal;
An interference noise removing apparatus comprising:
空間相関行列算出部が、上記複数の周波数領域変換部の出力する周波数領域の信号を入力としてその周波数領域の信号をベクトル化して空間相関行列を算出する空間相関行列算出過程と、
信号パワー推定部が、予め与えられる上記マイクロホンの配置情報と、上記空間相関行列とから直接音のパワーと残響音のパワーと雑音のパワーとで構成されるベクトルを求め、そのベクトル要素の内の直接音のパワーと残響音のパワーを出力する信号パワー推定過程と、
直間比算出部が、上記直接音のパワーを上記残響音のパワーで除した直間比を算出する直間比算出過程と、
を含む耐雑音直間比推定方法。 A plurality of frequency domain conversion units, a frequency domain conversion process for converting a received signal received by a plurality of microphones into a frequency domain signal;
A spatial correlation matrix calculation unit, wherein the spatial correlation matrix calculation unit calculates a spatial correlation matrix by vectorizing the frequency domain signal by inputting the frequency domain signal output from the plurality of frequency domain transform units;
A signal power estimation unit obtains a vector composed of direct sound power, reverberant sound power and noise power from the microphone arrangement information given in advance and the spatial correlation matrix, and among the vector elements, A signal power estimation process that outputs the power of the direct sound and the power of the reverberant sound,
The direct ratio calculation unit calculates the direct ratio obtained by dividing the power of the direct sound by the power of the reverberant sound; and
A noise-to-noise ratio estimation method including:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010134495A JP5683140B2 (en) | 2010-06-11 | 2010-06-11 | Noise-to-noise direct ratio estimation device, interference noise elimination device, perspective determination device, sound source distance measurement device, method of each device, and device program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010134495A JP5683140B2 (en) | 2010-06-11 | 2010-06-11 | Noise-to-noise direct ratio estimation device, interference noise elimination device, perspective determination device, sound source distance measurement device, method of each device, and device program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011259398A JP2011259398A (en) | 2011-12-22 |
JP5683140B2 true JP5683140B2 (en) | 2015-03-11 |
Family
ID=45475035
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010134495A Expired - Fee Related JP5683140B2 (en) | 2010-06-11 | 2010-06-11 | Noise-to-noise direct ratio estimation device, interference noise elimination device, perspective determination device, sound source distance measurement device, method of each device, and device program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5683140B2 (en) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2812724A4 (en) * | 2012-02-09 | 2016-02-10 | Nokia Technologies Oy | Estimating distances between devices |
JP5698166B2 (en) * | 2012-02-28 | 2015-04-08 | 日本電信電話株式会社 | Sound source distance estimation apparatus, direct ratio estimation apparatus, noise removal apparatus, method thereof, and program |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001166025A (en) * | 1999-12-14 | 2001-06-22 | Matsushita Electric Ind Co Ltd | Sound source direction estimating method, sound collection method and device |
JP2008079256A (en) * | 2006-09-25 | 2008-04-03 | Toshiba Corp | Acoustic signal processing apparatus, acoustic signal processing method, and program |
JP5123595B2 (en) * | 2007-07-31 | 2013-01-23 | 独立行政法人情報通信研究機構 | Near-field sound source separation program, computer-readable recording medium recording this program, and near-field sound source separation method |
JP5235605B2 (en) * | 2008-10-21 | 2013-07-10 | 日本電信電話株式会社 | Utterance direction estimation apparatus, method and program |
JP5079761B2 (en) * | 2009-09-01 | 2012-11-21 | 日本電信電話株式会社 | Direct ratio estimation device, sound source distance measurement device, noise removal device, method of each device, and device program |
-
2010
- 2010-06-11 JP JP2010134495A patent/JP5683140B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2011259398A (en) | 2011-12-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5079761B2 (en) | Direct ratio estimation device, sound source distance measurement device, noise removal device, method of each device, and device program | |
JP6335985B2 (en) | Multi-sensor sound source localization | |
KR101449433B1 (en) | Noise cancelling method and apparatus from the sound signal through the microphone | |
KR101456866B1 (en) | Method and apparatus for extracting the target sound signal from the mixed sound | |
JP6584930B2 (en) | Information processing apparatus, information processing method, and program | |
US8238569B2 (en) | Method, medium, and apparatus for extracting target sound from mixed sound | |
US20090034756A1 (en) | System and method for extracting acoustic signals from signals emitted by a plurality of sources | |
JP3582712B2 (en) | Sound pickup method and sound pickup device | |
JP6065028B2 (en) | Sound collecting apparatus, program and method | |
JP5738218B2 (en) | Acoustic signal emphasizing device, perspective determination device, method and program thereof | |
JP6225245B2 (en) | Signal processing apparatus, method and program | |
JP5060465B2 (en) | Sound collection device, sound collection method, sound collection program, recording medium | |
JP5143802B2 (en) | Noise removal device, perspective determination device, method of each device, and device program | |
JP5683140B2 (en) | Noise-to-noise direct ratio estimation device, interference noise elimination device, perspective determination device, sound source distance measurement device, method of each device, and device program | |
JP5635024B2 (en) | Acoustic signal emphasizing device, perspective determination device, method and program thereof | |
JP5698166B2 (en) | Sound source distance estimation apparatus, direct ratio estimation apparatus, noise removal apparatus, method thereof, and program | |
JP5826465B2 (en) | Instantaneous direct ratio estimation device, noise removal device, perspective determination device, sound source distance measurement device, method of each device, and device program | |
JPH09261792A (en) | Sound receiving method and its device | |
JP2017083566A (en) | Noise suppression device, noise suppression method, and program | |
JP4116600B2 (en) | Sound collection method, sound collection device, sound collection program, and recording medium recording the same | |
CN116106826A (en) | Sound source positioning method, related device and medium | |
JP5815489B2 (en) | Sound enhancement device, method, and program for each sound source | |
JP3720795B2 (en) | Sound source receiving position estimation method, apparatus, and program | |
KR20090098552A (en) | Apparatus and method for automatic gain control using phase information | |
JP2005077205A (en) | System for estimating sound source direction, apparatus for estimating time delay of signal, and computer program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20121004 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130725 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130924 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20131031 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A132 Effective date: 20140430 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140522 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150106 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150113 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5683140 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |