JP4879195B2 - Noise reduction device - Google Patents

Noise reduction device Download PDF

Info

Publication number
JP4879195B2
JP4879195B2 JP2008008271A JP2008008271A JP4879195B2 JP 4879195 B2 JP4879195 B2 JP 4879195B2 JP 2008008271 A JP2008008271 A JP 2008008271A JP 2008008271 A JP2008008271 A JP 2008008271A JP 4879195 B2 JP4879195 B2 JP 4879195B2
Authority
JP
Japan
Prior art keywords
filter
microphone
output signal
signal
adaptive filter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2008008271A
Other languages
Japanese (ja)
Other versions
JP2008199594A (en
Inventor
健作 藤井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toa Corp
Original Assignee
Toa Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toa Corp filed Critical Toa Corp
Priority to JP2008008271A priority Critical patent/JP4879195B2/en
Publication of JP2008199594A publication Critical patent/JP2008199594A/en
Application granted granted Critical
Publication of JP4879195B2 publication Critical patent/JP4879195B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Circuit For Audible Band Transducer (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To reduce a noise component without deteriorating audio itself caused by the action of a filter. <P>SOLUTION: The noise reduction apparatus comprises: a first linear prediction filter to which an output signal of a first microphone is inputted; a second linear prediction filter to which an output signal of a second microphone is inputted; a first adaptive filter to which an output signal from the first linear prediction filter is inputted and of which a filter coefficient is updated so as to minimize an error signal between output signals of the second linear prediction filter and of itself; a second adaptive filter to which the output signal of the first microphone is inputted; a subtractor which outputs a signal resulting from subtracting an output signal of the second adaptive filter from the output signal of the second microphone; and an inverse filter to which the signal outputted from the subtractor is inputted to restore a second audio signal inputted to the second microphone. <P>COPYRIGHT: (C)2008,JPO&amp;INPIT

Description

本願発明は、マイクロホンに入力された音声から、騒音成分を低減させて出力する騒音低減装置に関する。   The present invention relates to a noise reduction device for reducing noise components and outputting them from voice input to a microphone.

実環境下では、マイクロホンで採取した音声に騒音が重畳することは避けられない。そのために騒音を低減して音声を強調する方法が検討され、これまでに数多くの手法が提案されている。一般に、それら従来の方法は、使用するマイクロホンの数に基づき、以下の二種類に分けられる。第一は、マイクロホンの数が一つのシステムに適用される方法で、スペクトルサブトラクション法(SS法)がその代表である。第二は、マイクロホンの数を複数とするマイクロホンアレーに適用される方法である。   Under actual circumstances, it is inevitable that noise is superimposed on the voice collected by the microphone. For this purpose, methods for enhancing noise by reducing noise have been studied, and many methods have been proposed so far. Generally, these conventional methods are divided into the following two types based on the number of microphones used. The first is a method that is applied to a system with one microphone, and the spectral subtraction method (SS method) is a representative example. The second is a method applied to a microphone array having a plurality of microphones.

以上の手法には適応される環境に適不適がある。多数の騒音が多方面から入射する環境下ではSS法が有利である。一方、騒音と音声のマイクロホンへの入射角が明確に異なり、多数のマイクロホンが設置可能な空間的に余裕がある場合には、マイクロホンアレーの方が有利である。これは音声と騒音に関する空間情報を利用することができる分、騒音の除去性能の向上が期待されるためである。   These methods are not suitable for the environment in which they are applied. The SS method is advantageous in an environment where many noises are incident from many directions. On the other hand, when the incident angles of noise and voice to the microphone are clearly different and there is a sufficient space where a large number of microphones can be installed, the microphone array is more advantageous. This is because the noise removal performance is expected to be improved as much as the spatial information related to voice and noise can be used.

これまでに提案されているマイクロホンアレーシステムは、マイクロホンの間隔に制約があるという問題がある。この問題については、マイクロホンアレーシステムによる騒音低減法により解決している(例えば非特許文献1参照)。
中野裕文、藤井健作、伊藤良生、”2マイクロホンアレーシステムによる騒音低減法、”信学技報、EA2006-14、May.2006 S.ヘイキン、”適応フィルタ入門、”武部幹(訳)、現代工学社、1999 藤井健作、多田豪、棟安実治、”マイクロホンアレーによる男性と女性の分離のための予備的検討、”2003春季日音講論集、2-8-19、March、2003
The microphone array systems proposed so far have a problem in that there is a restriction on the distance between the microphones. This problem is solved by a noise reduction method using a microphone array system (see Non-Patent Document 1, for example).
Hirofumi Nakano, Kensaku Fujii, Yoshio Ito, “Noise Reduction Method Using a Two-Microphone Array System,” IEICE Technical Report, EA2006-14, May. 2006 S. Heykin, “Introduction to Adaptive Filters,” Miki Takebe (translation), Hyundai Engineering, 1999 Kensaku Fujii, Go Tada, Meiji Muneyasu, “Preliminary Study for Separation of Men and Women by Microphone Array,” 2003 Spring Nihon Ronshu, 2-8-19, March, 2003

しかし、この手法で用いたEE′法にはシステムの動作が不安定になるという問題がある。そこで本発明ではこの問題を解決するためマイクロホンアレーシステムに適用する新たな手法を提供することを目的としている。   However, the EE ′ method used in this method has a problem that the operation of the system becomes unstable. Therefore, the present invention aims to provide a new technique applied to a microphone array system in order to solve this problem.

上記課題を解決するために、本願発明に係る騒音低減装置は、音声及び騒音がそれぞれ第1音声信号及び第1騒音信号として入力される第1マイクロホンと、前記第1マイクロホンと異なる位置に配設されるとともに前記音声及び前記騒音がそれぞれ第2音声信号及び第2騒音信号として入力される第2マイクロホンと、前記第1マイクロホンの出力信号が入力されるとともに、前記第1マイクロホンの出力信号から音声の相関を除去するようにフィルタ係数が更新される第1線形予測フィルタと、前記第2マイクロホンの出力信号が入力されるとともに、前記第1線形予測フィルタのフィルタ係数と同じ値でフィルタ係数が更新される第2線形予測フィルタと、前記第1線形予測フィルタからの出力信号が入力され第2線形予測フィルタからの出力信号と自己の出力信号のうち一方から他方を差し引くことによって得られる信号のパワーを最小化するようにフィルタ係数が更新される第1適応フィルタと、前記第1マイクロホンの出力信号が入力されるとともに、前記第1線形予測フィルタのフィルタ係数と同じ値でフィルタ係数が更新される第2適応フィルタと、前記第2マイクロホンの出力信号と前記第2適応フィルタの出力信号のうち一方から他方を引くことによって得られる誤差信号を出力する減算器と、前記減算器から出力された信号が入力され、前記第2マイクロホンに入力された前記第2音声信号を復元する逆フィルタと、を備える。   In order to solve the above-described problems, a noise reduction device according to the present invention is arranged at a position different from the first microphone and a first microphone into which voice and noise are input as a first voice signal and a first noise signal, respectively. And the second microphone to which the voice and the noise are input as the second voice signal and the second noise signal, respectively, the output signal of the first microphone, and the voice from the output signal of the first microphone. The first linear prediction filter whose filter coefficient is updated so as to remove the correlation and the output signal of the second microphone are input, and the filter coefficient is updated with the same value as the filter coefficient of the first linear prediction filter A second linear prediction filter, and an output signal from the first linear prediction filter is input to the second linear prediction filter. The first adaptive filter whose filter coefficient is updated so as to minimize the power of the signal obtained by subtracting one of the output signal and the self output signal from the other, and the output signal of the first microphone are input. In addition, the second adaptive filter whose filter coefficient is updated with the same value as the filter coefficient of the first linear prediction filter, the output signal of the second microphone, and the output signal of the second adaptive filter are changed from one to the other. A subtractor that outputs an error signal obtained by subtraction; and an inverse filter that receives the signal output from the subtractor and restores the second audio signal input to the second microphone.

また、上記騒音低減装置において、前記第1マイクロホンから前記第2マイクロホンまでの音響伝搬特性をhabとし、前記第2マイクロホンから前記第1マイクロホンまでの音響伝搬特性をhbaとすると、前記逆フィルタは、1/(1−hab hba)の関数を有するフィルタとしてもよい。 Further, in the noise reduction device, when the acoustic propagation characteristic from the first microphone to the second microphone is h ab and the acoustic propagation characteristic from the second microphone to the first microphone is h ba , the inverse filter May be a filter having a function of 1 / (1-h ab h ba ).

また、上記騒音低減装置において、前記音響伝搬特性habを、前記第1適応フィルタのフィルタ係数と同じ値としてもよい。 In the noise reduction device, the acoustic propagation characteristic hab may be the same value as a filter coefficient of the first adaptive filter.

また、上記騒音低減装置において、前記第2マイクロホンの出力信号が入力されるとともに、前記第2マイクロホンの出力信号から音声の相関を除去するようにフィルタ係数が更新される第3線形予測フィルタと、前記第1マイクロホンの出力信号が入力されるとともに、前記第3線形予測フィルタのフィルタ係数と同じ値でフィルタ係数が更新される第4線形予測フィルタと、前記第3線形予測フィルタからの出力信号が入力され第4線形予測フィルタからの出力信号と自己の出力信号のうち一方から他方を差し引くことによって得られる誤差信号のパワーを最小化するようにフィルタ係数が更新される第3適応フィルタと、をさらに備え、前記音響伝搬特性hbaを、前記第3適応フィルタのフィルタ係数と同じ値としてもよい。
また、上記騒音低減装置において、前記第1適応フィルタ及び前記第2適応フィルタは複数あるステップサイズのいずれかによって更新され、前記第1減算器の出力のパワーに対する前記第2適応フィルタの出力のパワーが比較的大きい場合は大きいステップサイズが採用され、前記第1減算器の出力のパワーに対する前記第2適応フィルタの出力のパワーが比較的小さい場合は小さいステップサイズが採用されるようにしてもよい。
Further, in the noise reduction device, a third linear prediction filter in which an output signal of the second microphone is input and a filter coefficient is updated so as to remove a speech correlation from the output signal of the second microphone; A fourth linear prediction filter in which an output signal of the first microphone is input and a filter coefficient is updated with the same value as a filter coefficient of the third linear prediction filter, and an output signal from the third linear prediction filter is A third adaptive filter whose filter coefficients are updated so as to minimize the power of the error signal obtained by subtracting one of the output signal from the fourth linear prediction filter and its own output signal from the other. In addition, the acoustic propagation characteristic h ba may be the same value as the filter coefficient of the third adaptive filter.
Further, in the noise reduction device, the first adaptive filter and the second adaptive filter are updated by any one of a plurality of step sizes, and the output power of the second adaptive filter with respect to the output power of the first subtractor. A large step size may be employed when the power is relatively large, and a small step size may be employed when the output power of the second adaptive filter relative to the power of the first subtractor is relatively small. .

また、上記騒音低減装置において、PEjを前記第1減算器の出力のパワーとし、PYjを前記第2適応フィルタの出力のパワーとし、Eを任意の値とすると、前記第1減算器の出力のパワーに対する前記第2適応フィルタの出力のパワーの大きさは、2E PYj/(PEj+E PYj)によって判断してもよい。
また、上記騒音低減装置において、前記第2マイクロホンの出力信号が入力されるとともに、前記第3適応フィルタのフィルタ係数と同じ値でフィルタ係数が更新される第4適応フィルタと、前記第1マイクロホンの出力信号と前記第4適応フィルタの出力信号のうち一方から他方を引くことによって得られる誤差信号を出力する第2減算器と、をさらに備え、前記第3適応フィルタ及び前記第4適応フィルタは複数あるステップサイズのいずれかによって更新され、前記第2減算器の出力のパワーに対する前記第4適応フィルタの出力のパワーが比較的大きい場合は大きいステップサイズが採用され、前記第2減算器の出力のパワーに対する前記第4適応フィルタの出力のパワーが比較的小さい場合は小さいステップサイズが採用されるようにしてもよい。
In the noise reduction apparatus, when P Ej is the output power of the first subtractor, P Yj is the output power of the second adaptive filter, and E is an arbitrary value, the first subtractor The magnitude of the output power of the second adaptive filter relative to the output power may be determined by 2E P Yj / (P Ej + E P Yj ).
In the noise reduction apparatus, a fourth adaptive filter in which an output signal of the second microphone is input and a filter coefficient is updated with the same value as the filter coefficient of the third adaptive filter, and the first microphone A second subtractor for outputting an error signal obtained by subtracting one of the output signal and the output signal of the fourth adaptive filter from the other, and a plurality of the third adaptive filter and the fourth adaptive filter are provided. If the output power of the fourth adaptive filter is relatively large with respect to the output power of the second subtractor, the larger step size is adopted, and the output of the second subtractor is updated. When the output power of the fourth adaptive filter relative to the power is relatively small, a small step size is adopted. It may be.

本願の騒音低減装置によれば、フィルタの働きによる音声自体の劣化を招くことなく、騒音成分を低減させることができる。   According to the noise reduction device of the present application, it is possible to reduce the noise component without causing deterioration of the sound itself due to the function of the filter.

以下、本発明の好ましい実施の形態について説明する。   Hereinafter, preferred embodiments of the present invention will be described.

(1.2マイクロホンアレーシステムの基本構造)
図1にマイクロホンアレーシステムの基本構造を示す。同図ではマイクロホンはAとBの2つを使用しており、ADF(Adaptive digital filter)は適応フィルタを示している。また本実施形態では左方向から音声信号sj、右方向から騒音信号njが到来するものとしている。
(1.2 Basic structure of microphone array system)
Figure 1 shows the basic structure of the microphone array system. In the figure, the microphones A and B are used, and ADF (Adaptive digital filter) indicates an adaptive filter. In the present embodiment, it is assumed that the audio signal s j comes from the left direction and the noise signal n j comes from the right direction.

ここで、マイクロホンAB間の音響系をhabとすると、マイクロホンBに入力される騒音信号nb jは、マイクロホンAに到来する騒音信号ベクトルna jを用いて、 Here, assuming that the acoustic system between the microphones AB is h ab , the noise signal n b j input to the microphone B uses the noise signal vector n a j arriving at the microphone A,


と表すことができる。同様にマイクロホンBからAの音響系をhbaとすると、マイクロホンAに入力される音声信号sa jはマイクロホンBに到来する音声信号sb j
を用いて、

It can be expressed as. Similarly, if the acoustic system from microphones B to A is h ba , the audio signal s a j input to the microphone A is the audio signal s b j arriving at the microphone B.
Using,


と示される。このときマイクロホンA、Bから出力される信号xa j、xb jはそれぞれ、

It is indicated. At this time, signals x a j and x b j output from the microphones A and B are respectively


となる。
ここで適応フィルタADFの係数Hab jの更新に通常の学習同定法である(例えば非特許文献2参照)、

It becomes.
Here, a normal learning identification method is used to update the coefficient H ab j of the adaptive filter ADF (see, for example, Non-Patent Document 2).


を用いる場合を考える。上式においてejは推定誤差であり、

Consider the case of using. In the above equation, e j is the estimation error,


と表される。さらにyjは適応フィルタの出力信号であり、

It is expressed. Y j is the output signal of the adaptive filter,


と示される。
このとき、適応フィルタのk番目の要素について考えると、右辺第2項の分子は、

It is indicated.
At this time, considering the k-th element of the adaptive filter, the numerator of the second term on the right-hand side is


となる。ここで式(8)の成分のうち、平均が0となる成分は適応フィルタの係数更新に効力をもたない。すなわち、騒音と音声は相関をもたないことから、それらを無視すれば、

It becomes. Here, among the components of equation (8), the component whose average is 0 has no effect on the coefficient update of the adaptive filter. That is, noise and voice have no correlation, so if you ignore them,


とおくことができる。さらに式(1)(7)を代入すると、

It can be said. Further substituting equations (1) and (7),


と展開される。さらに、同様にして音声と騒音は相関をもたないので、それらを無視すると、

And expanded. Similarly, voice and noise have no correlation, so if you ignore them,


となる。ここで右辺第1項目sb jsa j(k)は、適応フィルタが音声に対する線形予測器として動作していることを示している。また、第2項では音声に自己相関がないとしてもHab j(k)sa j(k)2は0とはならず、第3項による推定誤差による適応フィルタの係数更新を妨害する。

It becomes. Here, the first item s b j s a j (k) on the right side indicates that the adaptive filter operates as a linear predictor for speech. In the second term, even if there is no autocorrelation in the speech, H ab j (k) s a j (k) 2 does not become 0, and the adaptive filter coefficient update due to the estimation error according to the third term is disturbed.

(2.提案マイクロホンアレーシステム)
図2に本実施形態に係るマイクロホンアレーシステムの基本構造を示す。同図のLPF(Linear Prediction Filter)は線形予測器を示している。ただし、マイクロホンBに接続されている線形予測器は更新を行わず、マイクロホンAに接続されている線形予測器のフィルタ係数と同じ係数をもつフィルタとしている。同様に図の下方にある適応フィルタも更新は行わず、図の中央の適応フィルタの係数をコピーしたものである。また図2においてマイクロホンA、Bに接続されている線形予測器の出力信号xa′ j、xb′ jはそれぞれ、
(2. Proposed microphone array system)
FIG. 2 shows the basic structure of the microphone array system according to this embodiment. LPF (Linear Prediction Filter) in the figure shows a linear predictor. However, the linear predictor connected to the microphone B is not updated, and the filter has the same coefficient as the filter coefficient of the linear predictor connected to the microphone A. Similarly, the adaptive filter at the bottom of the figure is not updated, and the coefficient of the adaptive filter at the center of the figure is copied. In FIG. 2, the output signals x a ′ j and x b ′ j of the linear predictors connected to the microphones A and B are respectively


と表すことができる。ここで、sa′ j、na′ jはxa′jに含まれる音声成分と騒音成分、sb′ j、nb′ jはxb′の音声成分と騒音成分を示している。これらの信号を用いて学習同定法を適用すると、

It can be expressed as. Here, s a ′ j and n a ′ j indicate speech components and noise components included in x a ′ j, and s b ′ j and n b ′ j indicate speech components and noise components of x b ′ . Applying the learning identification method using these signals,


と示される。また、e′jは提案法における推定誤差であり、

It is indicated. E ′ j is the estimation error in the proposed method,


と表すことができる。ただし、y′jは適応フィルタの出力信号であり、

It can be expressed as. Where y ′ j is the output signal of the adaptive filter,


となる。
これらを用いて前節と同様の式展開を行うと、

It becomes.
Using these, the same expression expansion as the previous section,


となりさらに、

と展開できる。ここで音声と騒音には相関がないことから、それらを無視すると、

In addition,

And can be expanded. Here, there is no correlation between voice and noise, so if you ignore them,


となる。ここで線形予測器の働きにより音声の相関が除去できれば、sb′ jsa′ j(k)の期待値は0と近似される。したがって、

It becomes. If the speech correlation can be removed by the action of the linear predictor, the expected value of s b ′ j s a ′ j (k) is approximated to zero. Therefore,


と書きかえることができる。また右辺第二項は、

Can be rewritten. The second term on the right side is


となり、第一項のシステム同定への影響を小さくすることができる。
さらにこのときの出力ejは、

Thus, the influence on the system identification of the first term can be reduced.
Furthermore, the output e j at this time is


であり、ここでHabがhabに近似できたとすると、

If H ab can be approximated to h ab , then


となる。これより、騒音が除去できた音声のみの信号を出力信号として取り出すことができると期待される。

It becomes. As a result, it is expected that a voice-only signal from which noise can be removed can be extracted as an output signal.

(3.シミュレーションによるシステムの動作確認)
適応フィルタADFの収束特性をシミュレーションにより確認を行う。シミュレーションの評価として推定誤差
(3. Confirmation of system operation by simulation)
The convergence characteristics of the adaptive filter ADF are confirmed by simulation. Estimation error as an evaluation of simulation


を用いる。ただし、

Is used. However,


であり、Tはタップ数を示している。シミュレーション条件として、
・線形予測器LPF
更新法:学習同定法
ステップサイズμ:0.1
タップ数:128
・適応フィルタADF
更新法:学習同定法
ステップサイズμ:0.01
タップ数:128
・入力信号
音声信号sj:標本化周期8kHzの男性音声
騒音信号nj:音声信号とのパワー比を0dBとした有色騒音信号
・マイクロホンAB間の音響伝播特性:0.9z-2
とする。

And T indicates the number of taps. As simulation conditions,
・ Linear predictor LPF
Update method: Learning identification method Step size μ: 0.1
Number of taps: 128
・ Adaptive filter ADF
Update method: Learning identification method Step size μ: 0.01
Number of taps: 128
・ Input signal audio signal s j : male audio noise signal with sampling period 8 kHz n j : colored noise signal with a power ratio of 0 dB to audio signal and acoustic propagation characteristics between microphones AB: 0.9z- 2
And

これらの条件においてシミュレーションを行った結果、図3が得られる。同図より適応フィルタは推定誤差が約−10dBを中心に振動していることが確認できる。これは音声が外乱として働いているため、音声が大きくなる区間ではその影響を無視できず推定が妨害れるためだと考えられる。また出力される信号の騒音抑圧効果を、   As a result of the simulation under these conditions, FIG. 3 is obtained. From the figure, it can be confirmed that the adaptive filter oscillates around the estimated error of about -10dB. This is thought to be because the voice works as a disturbance and the influence cannot be ignored in the section where the voice is loud and the estimation is disturbed. Also, the noise suppression effect of the output signal


で表す。上式においてes、enは出力信号eに含まれる音声信号成分を示しており、Iは入力サンプル数を示している。ここで出力される信号のSN比は12.3dBとなる。これより騒音が低減できたことを指標から確認することができる。

Represented by In the above equation e s, e n denotes an audio signal component contained in the output signal e, I denotes the number of input samples. The signal-to-noise ratio of the output signal is 12.3 dB. It can be confirmed from the index that noise can be reduced.

(4.音声のパワーによる更新制御)
本実施形態において音声は外乱として働く。これは式(20)を見れば明らかである。したがって外乱の大きくなる区間で更新を行うことは推定の悪化につながる。そこで本節では、図2における出力音声ejとフィルタ出力yjを用いて更新を制御する手法を説明する。本実施形態では更新の制御を実現するため、ステップサイズμを
(4. Update control by voice power)
In this embodiment, the voice works as a disturbance. This is clear from equation (20). Therefore, updating in a section where the disturbance is large leads to a deterioration in estimation. Therefore, in this section, a method for controlling the update using the output sound e j and the filter output y j in FIG. 2 will be described. In this embodiment, in order to realize the update control, the step size μ is set to


と決める。ここでEはステップサイズを制御するためのパラメータで本実施形態では0.01と設定する。またPYj、PEjはそれぞれ適応フィルタの出力yjとシステムの出力ejのパワーである。これらPYj、PEjは図4のようなブロック図で導出される。

Decide. Here, E is a parameter for controlling the step size, and is set to 0.01 in this embodiment. P Yj and P Ej are the power of the output y j of the adaptive filter and the output e j of the system, respectively. These P Yj and P Ej are derived by a block diagram as shown in FIG.

ブロック図において、   In the block diagram:


と計算でき、α1=1-1/1024、α2=1-1/256としている。これは本実施形態で用いている騒音が定常であるので、PYjの値もできる限り一定に保つために時間変化を少ないため小さくするためである。

And α 1 = 1-1 / 1024 and α 2 = 1-1 / 256. This is because the noise used in the present embodiment is stationary, so that the value of P Yj is kept constant as much as possible so that the time change is small and small.


とPYj、PEjを決定する。PEjをこのように求めるのは音声信号の入力にステップサイズをすばやく対応させるためである。また本実施形態では、式(28)で求めるステップサイズを、

And P Yj and P Ej are determined. The reason why P Ej is obtained in this way is to quickly correspond the step size to the input of the audio signal. In the present embodiment, the step size obtained by the equation (28) is


と制限をする。以上の手法によりステップサイズμを決定したときの適応フィルタの収束特性を、シミュレーションにより確認する。

And restrict. The convergence characteristic of the adaptive filter when the step size μ is determined by the above method is confirmed by simulation.

前節と同様の条件でシミュレーションを行うと推定誤差の推移は図5のようになる。同図によれば推定誤差が約−20dBで推移しており、図3と比べれば性能が改善していることが確認できる。また出力のSN比は23.0dBとなり、図7の出力信号波形を見れば騒音がほとんど目立たなくなっていることが確認できる。   When simulation is performed under the same conditions as in the previous section, the transition of the estimation error is as shown in FIG. According to the figure, the estimation error changes at about -20 dB, and it can be confirmed that the performance is improved as compared with FIG. The output signal-to-noise ratio is 23.0 dB, and it can be confirmed that the noise is almost inconspicuous by looking at the output signal waveform in FIG.

(5.音声復元のための検討)
次に得られる出力信号ejについて考える。前述の式(23)によると、得られる出力信号ejは、
(5. Examination for voice restoration)
Consider the output signal e j next obtained. According to the above-described formula (23), the output signal e j obtained is


となり、騒音を除去した信号を得ることができる。しかし、この信号はマイクロホンBで観測される音声信号sb jが変調されたものである。これは得られる出力信号の音質劣化を意味している。

Thus, a signal from which noise is removed can be obtained. However, this signal is obtained by modulating the audio signal s b j observed by the microphone B. This means that the sound quality of the obtained output signal is degraded.

そこで、本節では前節までの手法で得られた出力信号ejを用いて原音声sb jを復元する手法について説明する。上式においてsa jには、 Therefore, in this section, a method for restoring the original speech s b j using the output signal e j obtained by the methods up to the previous section will be described. In the above equation, s a j is


の関係がある。

There is a relationship.

したがって、1/(1-Hab j Thba)という関数を持つIIR(Infinite Impulse Response)フィルタを形成し、システムの出力信号ejを入力すれば、 Therefore, if an IIR (Infinite Impulse Response) filter having a function 1 / (1-H ab j T h ba ) is formed and the output signal e j of the system is input,


となり、マイクロホンBで観測できる音声信号sb jを得ることができる。

Thus, an audio signal s b j that can be observed with the microphone B can be obtained.

しかし、上式においてhbaはマイクロホンBからAの音響伝播特性である。そこで、前節までのマイクロホンAB間の音響特性Hab jを求める手法をマイクロホンBA間にも適用することでマイクロホンBA間のhba jの推定を行う。得られるHbaが十分な推定を行うことができればhbaと近似することができるので、これを代入することで目的のフィルタを作成する。これを実現するためのシステムを図8に示す。図のようにejを逆フィルタへ入力することで音声を復元できた出力信号ojを得ることができる。 However, in the above equation, h ba is the acoustic propagation characteristic of microphones B to A. Therefore, h ba j between the microphones BA is estimated by applying the method for obtaining the acoustic characteristic H ab j between the microphones AB up to the previous section also between the microphones BA. If the obtained H ba can be estimated sufficiently, it can be approximated to h ba, and the target filter is created by substituting this. A system for realizing this is shown in FIG. As shown in the figure, by inputting e j to the inverse filter, it is possible to obtain an output signal o j that can restore the voice.

Hba jを推定するためのシステムを図9に示す。同図におけるADFのフィルタ係数ベクトルが目的のHba jに一致する。ここでHba jは音声信号が参照信号となるためそれを考慮し更新を行わなければならない。つまり、Hba jに入力される信号ベクトルの成分xb′′ j(k)に含まれる音声成分sb′′(k)の信号が小さいと参照信号が外乱に埋もれてしまうので、この状態で更新を行うと推定が悪化してしまう。しかしsb′′(k)は実際には観測できない信号であるため、出力信号oj-kをsb′′ j(k)を生成する際に使用する線形予測器に入力し、得られる信号o′j-kを用いて更新タップの制御を行う。この更新式をHab jのK番目の要素Hab j(k)について表すと、 A system for estimating H ba j is shown in FIG. The ADF filter coefficient vector in the figure matches the target H ba j . Here, H ba j must be updated in consideration of the audio signal as a reference signal. In other words, if the signal component s b ′ ′ (k) contained in the component x b ′ ′ j (k) of the signal vector input to H ba j is small, the reference signal is buried in the disturbance. If you update with, the estimation will get worse. However, since s b ′ ′ (k) is a signal that cannot actually be observed, the output signal o jk is obtained by inputting it to the linear predictor used to generate s b ′ ′ j (k). The update tap is controlled using the signal o ′ j -k . Expressing this update equation for H ab j of K-th element H ab j (k),


となる。上式においてPsは音声の平均パワー、またeb′ jは推定誤差信号で、

It becomes. Where P s is the average power of the speech, and e b ′ j is the estimated error signal,


と示される。また図9のLPFの特性をLjとすると、上式におけるo′j-kは、

It is indicated. Also, assuming that the LPF characteristic in FIG. 9 is L j , o ′ j −k in the above equation is


と表すことができる。

It can be expressed as.

(6.シミュレーションによる音声復元の確認)
シミュレーションにより、提案法の動作確認を行う。まず、図8におけるHba jの収束特性について確認を行う。適応アルゴリズムについては前節で示した手法を用いそのパラメータとして、
・線形予測器LPF
更新法:学習同定法
ステップサイズμ:0.1
タップ数:128
・適応フィルタADF
ステップサイズμ:0.01
タップ数:128
とする。また他の条件は第5節でのシミュレーション条件と同様とする。
(6. Confirmation of voice restoration by simulation)
The operation of the proposed method is confirmed by simulation. First, to confirm the convergence characteristics of the H ba j in FIG. For the adaptive algorithm, the method shown in the previous section is used and its parameters are:
・ Linear predictor LPF
Update method: Learning identification method Step size μ: 0.1
Number of taps: 128
・ Adaptive filter ADF
Step size μ: 0.01
Number of taps: 128
And Other conditions are the same as the simulation conditions in Section 5.

以上の条件でシミュレーションを行うと収束特性は図10のようになる。同図から約−16dBまで推定ができていることが確認できる。また、図5と比較するとHab jの収束よりも時間がかかることも確認できる。これは更新制御のため更新の頻度が低下したためだと考えられる。 When simulation is performed under the above conditions, the convergence characteristics are as shown in FIG. From the figure, it can be confirmed that the estimation is up to about -16dB. It can also be confirmed that it takes longer than the convergence of H ab j as compared with FIG. This is thought to be due to the fact that the frequency of updates has decreased due to update control.

次に音声復元効果をシミュレーションにより確認する。本実施形態では評価指標として式(27)のSNRoutの他に、音質評価指標VEと総合評価指標OEを用いる。それぞれ、 Next, the sound restoration effect is confirmed by simulation. In the present embodiment, a sound quality evaluation index VE and a comprehensive evaluation index OE are used as evaluation indexes in addition to the SNR out of Expression (27). Respectively,


と示される。上式において、os jは出力信号ojに含まれる音声信号成分であり、Iは入力サンプル数である。

It is indicated. In the above equation, o s j is an audio signal component included in the output signal o j , and I is the number of input samples.

これらの条件でシミュレーションを行うと出力信号ojとして図11が得られる。この指標はVE=14.7dB、OE=13.8dB、SNRout=20.3dBとなる。ejについて評価を行うとVE=2.4dB、OE=2.3dB、SNRout=23.6dBとなることから提案手法が音質改善に効果があることが確認できる。 When simulation is performed under these conditions, FIG. 11 is obtained as the output signal o j . This indicator VE = 14.7dB, OE = 13.8dB, the SNR out = 20.3dB. When e j is evaluated, VE = 2.4 dB, OE = 2.3 dB, and SNR out = 23.6 dB, which confirms that the proposed method is effective in improving sound quality.

(7.まとめ)
本実施形態では、マイクロホンアレーシステムに適用するアルゴリズムについて説明した。この手法によりマイクロホン間の音響系を推定することで騒音を低減できることをシミュレーションにより確認できた。また得られた音声信号は劣化しているため、それを元の音声に復元する手法についても合わせて説明した。この手法により劣化した音声の音質を改善できることを確認できた。
(7. Summary)
In the present embodiment, the algorithm applied to the microphone array system has been described. It was confirmed by simulation that noise can be reduced by estimating the acoustic system between microphones by this method. Since the obtained audio signal has deteriorated, the method of restoring it to the original audio has also been described. It was confirmed that the sound quality of degraded speech can be improved by this method.

本願の騒音低減装置によれば、音声自体の劣化を招くことなく騒音成分を低減させることができるので、音声通信の技術分野において利用できる。   According to the noise reduction device of the present application, the noise component can be reduced without causing deterioration of the voice itself, and thus can be used in the technical field of voice communication.

マイクロホンアレーシステムの基本構造を示した図である。It is the figure which showed the basic structure of the microphone array system. 本実施形態に係るマイクロホンアレーシステムを示した図である。It is the figure which showed the microphone array system which concerns on this embodiment. マイクロホンアレーシステムの動作確認を示した図である。It is the figure which showed the operation | movement confirmation of the microphone array system. PV、PEの導出ブロック図である。P V, is a derivation block diagram of the P E. ステップサイズ制御を行ったときの推定誤差を示した図である。It is the figure which showed the estimation error when performing step size control. マイクロホンA側に入力される信号波形を示した図である。It is a figure showing a signal waveform inputted to the microphone A side. 出力信号波形を示した図である。It is the figure which showed the output signal waveform. 音声復元システムを示した図である。It is the figure which showed the audio | voice restoration system. マイクロホンBからAの音響系を推定するためのシステムを示した図である。1 is a diagram showing a system for estimating an acoustic system of microphones B to A. FIG. Hbaの収束特性を示した図である。It is the figure which showed the convergence characteristic of Hba . 出力信号波形を示した図である。It is the figure which showed the output signal waveform.

Claims (7)

音声及び騒音がそれぞれ第1音声信号及び第1騒音信号として入力される第1マイクロホンと、
前記第1マイクロホンと異なる位置に配設されるとともに前記音声及び前記騒音がそれぞれ第2音声信号及び第2騒音信号として入力される第2マイクロホンと、
前記第1マイクロホンの出力信号が入力されるとともに、前記第1マイクロホンの出力信号から音声の相関を除去するようにフィルタ係数が更新される第1線形予測フィルタと、
前記第2マイクロホンの出力信号が入力されるとともに、前記第1線形予測フィルタのフィルタ係数と同じ値でフィルタ係数が更新される第2線形予測フィルタと、
前記第1線形予測フィルタからの出力信号が入力され第2線形予測フィルタからの出力信号と自己の出力信号のうち一方から他方を差し引くことによって得られる信号のパワーを最小化するようにフィルタ係数が更新される第1適応フィルタと、
前記第1マイクロホンの出力信号が入力されるとともに、前記第1適応フィルタのフィルタ係数と同じ値でフィルタ係数が更新される第2適応フィルタと、
前記第2マイクロホンの出力信号と前記第2適応フィルタの出力信号のうち一方から他方を引くことによって得られる誤差信号を出力する第1減算器と、
前記第1減算器から出力された信号が入力され、前記第2マイクロホンに入力された前記第2音声信号を復元する逆フィルタと、を備える騒音低減装置。
A first microphone into which voice and noise are input as a first voice signal and a first noise signal, respectively;
A second microphone disposed at a different position from the first microphone and receiving the voice and the noise as a second voice signal and a second noise signal, respectively;
A first linear prediction filter in which an output signal of the first microphone is input and a filter coefficient is updated so as to remove a correlation of speech from the output signal of the first microphone;
A second linear prediction filter that receives the output signal of the second microphone and updates the filter coefficient with the same value as the filter coefficient of the first linear prediction filter;
A filter coefficient is provided so as to minimize the power of a signal obtained by subtracting one of the output signal from the second linear prediction filter and the output signal from the second linear prediction filter when the output signal from the first linear prediction filter is input. A first adaptive filter to be updated;
A second adaptive filter in which the output signal of the first microphone is input and the filter coefficient is updated with the same value as the filter coefficient of the first adaptive filter;
A first subtractor that outputs an error signal obtained by subtracting one of the output signal of the second microphone and the output signal of the second adaptive filter from the other;
A noise reduction device comprising: an inverse filter that receives the signal output from the first subtractor and restores the second audio signal input to the second microphone.
前記第1マイクロホンから前記第2マイクロホンまでの音響伝搬特性をhabとし、前記第2マイクロホンから前記第1マイクロホンまでの音響伝搬特性をhbaとすると、前記逆フィルタは、1/(1−hab hba)の関数を有するフィルタである、請求項1に記載の騒音低減装置。 When the acoustic propagation characteristic from the first microphone to the second microphone is h ab and the acoustic propagation characteristic from the second microphone to the first microphone is h ba , the inverse filter is 1 / (1-h The noise reduction device according to claim 1, which is a filter having a function of ab h ba ). 前記音響伝搬特性habを、前記第1適応フィルタのフィルタ係数と同じ値とする、請求項2に記載の騒音低減装置。 The noise reduction device according to claim 2, wherein the acoustic propagation characteristic hab is set to the same value as a filter coefficient of the first adaptive filter. 前記第2マイクロホンの出力信号が入力されるとともに、前記第2マイクロホンの出力信号から音声の相関を除去するようにフィルタ係数が更新される第3線形予測フィルタと、
前記第1マイクロホンの出力信号が入力されるとともに、前記第3線形予測フィルタのフィルタ係数と同じ値でフィルタ係数が更新される第4線形予測フィルタと、
前記第3線形予測フィルタからの出力信号が入力され第4線形予測フィルタからの出力信号と自己の出力信号のうち一方から他方を差し引くことによって得られる誤差信号のパワーを最小化するようにフィルタ係数が更新される第3適応フィルタと、をさらに備え、
前記音響伝搬特性hbaを、前記第3適応フィルタのフィルタ係数と同じ値とする、請求項2又は3に記載の騒音低減装置。
A third linear prediction filter in which an output signal of the second microphone is input and a filter coefficient is updated so as to remove a correlation of speech from the output signal of the second microphone;
A fourth linear prediction filter in which an output signal of the first microphone is input and a filter coefficient is updated with the same value as the filter coefficient of the third linear prediction filter;
A filter coefficient that minimizes the power of the error signal obtained by subtracting one of the output signal from the fourth linear prediction filter and its own output signal when the output signal from the third linear prediction filter is input. A third adaptive filter in which is updated,
The noise reduction device according to claim 2 or 3, wherein the acoustic propagation characteristic h ba is set to the same value as a filter coefficient of the third adaptive filter.
前記第1適応フィルタ及び前記第2適応フィルタは複数あるステップサイズのいずれかによって更新され、前記第1減算器の出力のパワーに対する前記第2適応フィルタの出力のパワーが比較的大きい場合は大きいステップサイズが採用され、前記第1減算器の出力のパワーに対する前記第2適応フィルタの出力のパワーが比較的小さい場合は小さいステップサイズが採用される、請求項1乃至4のうちいずれか一の項に記載の騒音低減装置。   The first adaptive filter and the second adaptive filter are updated according to any one of a plurality of step sizes, and the step is large when the output power of the second adaptive filter with respect to the output power of the first subtractor is relatively large. The size is adopted, and a small step size is adopted when the output power of the second adaptive filter is relatively small with respect to the output power of the first subtractor. The noise reduction device described in 1. PEjを前記第1減算器の出力のパワーとし、PYjを前記第2適応フィルタの出力のパワーとし、Eを任意の値とすると、前記第1減算器の出力のパワーに対する前記第2適応フィルタの出力のパワーの大きさは、2E PYj/(PEj+E PYj)によって判断される、請求項5に記載の騒音低減装置。 When P Ej is the output power of the first subtractor, P Yj is the output power of the second adaptive filter, and E is an arbitrary value, the second adaptation with respect to the output power of the first subtractor The noise reduction device according to claim 5, wherein the magnitude of the output power of the filter is determined by 2E P Yj / (P Ej + E P Yj ). 前記第2マイクロホンの出力信号が入力されるとともに、前記第3適応フィルタのフィルタ係数と同じ値でフィルタ係数が更新される第4適応フィルタと、
前記第1マイクロホンの出力信号と前記第4適応フィルタの出力信号のうち一方から他方を引くことによって得られる誤差信号を出力する第2減算器と、をさらに備え、
前記第3適応フィルタ及び前記第4適応フィルタは複数あるステップサイズのいずれかによって更新され、前記第2減算器の出力のパワーに対する前記第4適応フィルタの出力のパワーが比較的大きい場合は大きいステップサイズが採用され、前記第2減算器の出力のパワーに対する前記第4適応フィルタの出力のパワーが比較的小さい場合は小さいステップサイズが採用される、請求項4乃至6のうちいずれか一の項に記載の騒音低減装置。
A fourth adaptive filter in which the output signal of the second microphone is input and the filter coefficient is updated with the same value as the filter coefficient of the third adaptive filter;
A second subtractor that outputs an error signal obtained by subtracting one of the output signal of the first microphone and the output signal of the fourth adaptive filter from the other; and
The third adaptive filter and the fourth adaptive filter are updated by any one of a plurality of step sizes, and a large step is obtained when the output power of the fourth adaptive filter relative to the output power of the second subtractor is relatively large. The size is adopted, and a small step size is adopted when the power of the output of the fourth adaptive filter with respect to the power of the output of the second subtracter is relatively small. The noise reduction device described in 1.
JP2008008271A 2007-01-17 2008-01-17 Noise reduction device Active JP4879195B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008008271A JP4879195B2 (en) 2007-01-17 2008-01-17 Noise reduction device

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2007008458 2007-01-17
JP2007008458 2007-01-17
JP2008008271A JP4879195B2 (en) 2007-01-17 2008-01-17 Noise reduction device

Publications (2)

Publication Number Publication Date
JP2008199594A JP2008199594A (en) 2008-08-28
JP4879195B2 true JP4879195B2 (en) 2012-02-22

Family

ID=39758099

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008008271A Active JP4879195B2 (en) 2007-01-17 2008-01-17 Noise reduction device

Country Status (1)

Country Link
JP (1) JP4879195B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109716786A (en) * 2016-09-16 2019-05-03 阿凡达公司 The active noise of earphone eliminates system

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5191413B2 (en) * 2009-02-05 2013-05-08 Toa株式会社 Identification apparatus and identification method
US9076427B2 (en) * 2012-05-10 2015-07-07 Cirrus Logic, Inc. Error-signal content controlled adaptation of secondary and leakage path models in noise-canceling personal audio devices
WO2015049921A1 (en) * 2013-10-04 2015-04-09 日本電気株式会社 Signal processing apparatus, media apparatus, signal processing method, and signal processing program

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3381731B2 (en) * 1992-08-14 2003-03-04 ソニー株式会社 Noise reduction device
JP2004064584A (en) * 2002-07-31 2004-02-26 Kanda Tsushin Kogyo Co Ltd Signal separation and extraction apparatus
WO2006095736A1 (en) * 2005-03-07 2006-09-14 Toa Corporation Noise eliminating apparatus

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109716786A (en) * 2016-09-16 2019-05-03 阿凡达公司 The active noise of earphone eliminates system
CN109716786B (en) * 2016-09-16 2020-06-09 阿凡达公司 Active noise cancellation system for earphone

Also Published As

Publication number Publication date
JP2008199594A (en) 2008-08-28

Similar Documents

Publication Publication Date Title
JP5451876B2 (en) Acoustic multichannel cancellation
Spriet et al. Adaptive feedback cancellation in hearing aids with linear prediction of the desired signal
JP5738488B2 (en) Beam forming equipment
KR20190085927A (en) Adaptive beamforming
JPWO2006049260A1 (en) Signal processing method, signal processing apparatus, and signal processing program
EP3080975A1 (en) Echo cancellation
JP2007306553A (en) Multi-channel echo compensation
WO2007049644A1 (en) Echo suppressing method and device
WO2009104252A1 (en) Sound processor, sound processing method and sound processing program
US11197093B2 (en) Echo suppression device, echo suppression method, and non-transitory computer-readable recording medium which records echo suppression program
WO2012099518A1 (en) Method and device for microphone selection
JP4879195B2 (en) Noise reduction device
US9602922B1 (en) Adaptive echo cancellation
Rombouts et al. Generalized sidelobe canceller based combined acoustic feedback-and noise cancellation
JP4920511B2 (en) Multichannel echo canceller
Mohammed A new adaptive beamformer for optimal acoustic echo and noise cancellation with less computational load
KR100754558B1 (en) Periodic signal enhancement system
KR101185650B1 (en) Method and apparatus for eliminating acoustic echo from voice signal
KR102045953B1 (en) Method for cancellating mimo acoustic echo based on kalman filtering
KR20080038714A (en) Postprocessing method for removing cross talk
GB2329097A (en) Echo cancellers
JP4324036B2 (en) Echo cancellation device
JP2009033549A (en) Speech processor and echo removing method
JP2007124678A (en) Signal processing device using adaptive filter
JP2006014359A (en) Echo suppression processing system

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20091218

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20111114

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111122

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111129

R150 Certificate of patent or registration of utility model

Ref document number: 4879195

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141209

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141209

Year of fee payment: 3

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141209

Year of fee payment: 3

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250