JP5738488B2 - ビームフォーミング装置 - Google Patents
ビームフォーミング装置 Download PDFInfo
- Publication number
- JP5738488B2 JP5738488B2 JP2014529174A JP2014529174A JP5738488B2 JP 5738488 B2 JP5738488 B2 JP 5738488B2 JP 2014529174 A JP2014529174 A JP 2014529174A JP 2014529174 A JP2014529174 A JP 2014529174A JP 5738488 B2 JP5738488 B2 JP 5738488B2
- Authority
- JP
- Japan
- Prior art keywords
- signal
- target sound
- unit
- target
- sound blocking
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/20—Arrangements for obtaining desired frequency or directional characteristics
- H04R1/32—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
- H04R1/40—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/005—Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2201/00—Details of transducers, loudspeakers or microphones covered by H04R1/00 but not provided for in any of its subgroups
- H04R2201/40—Details of arrangements for obtaining desired directional characteristic by combining a number of identical transducers covered by H04R1/40 but not provided for in any of its subgroups
- H04R2201/403—Linear arrays of transducers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2499/00—Aspects covered by H04R or H04S not otherwise provided for in their subgroups
- H04R2499/10—General applications
- H04R2499/13—Acoustic transducers and sound field adaptation in vehicles
Landscapes
- Health & Medical Sciences (AREA)
- Otolaryngology (AREA)
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- General Health & Medical Sciences (AREA)
- Circuit For Audible Band Transducer (AREA)
- Soundproofing, Sound Blocking, And Sound Damping (AREA)
- Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
Description
この発明は、複数のマイクロフォン信号から目的信号を強調した信号を得るためにビームフォーミングを行うビームフォーミング装置に関するものである。
雑音が大きい環境下や複数の信号源が存在する環境下で、車載ハンズフリーのような通話システムを構築するためには、特定の信号源(話者)の信号のみを分離して抽出する技術が必要となる。この技術の一つとしてビームフォーマが挙げられる。ビームフォーマはマイクロアレイによる複数チャネルの信号を足し合わせることで目的方向の信号を強調するものであり、固定型のビームフォーマと適応型のビームフォーマがある。
最も単純な固定型ビームフォーマは遅延和法(Delay and Sum)であり、図6に示すように2チャンネルのマイク901,902と、信号遅延部903および遅延和部904で構成される。この遅延和法は、一般に計算量が少なくて済むが、車載目的など多数のマイクを使用することが困難な場合には、サイドローブが大きい、残響環境下に弱い、低周波領域に対しては十分な指向性が得られないなどの問題があった。
低周波領域において指向性を上げるためにはマイクロフォンアレイの全体のアレイ長を長くする必要がある。例えば、1000Hzの音に対してメインローブが±10°程度の指向性を得ようとした場合、アレイ長は約2m必要となる。また、単純にマイクロフォンアレイの間隔を長くすることによりアレイ長を大きくすると、グレーティングローブが目的方向以外に発生して指向性が低下するという問題があった(非特許文献1参照)。従って、グレーティングローブを抑えて低周波数領域での指向性を保つためには、多数のマイクロフォンを密に並べる必要があり、非常にコストがかかるという問題があった。
低周波領域において指向性を上げるためにはマイクロフォンアレイの全体のアレイ長を長くする必要がある。例えば、1000Hzの音に対してメインローブが±10°程度の指向性を得ようとした場合、アレイ長は約2m必要となる。また、単純にマイクロフォンアレイの間隔を長くすることによりアレイ長を大きくすると、グレーティングローブが目的方向以外に発生して指向性が低下するという問題があった(非特許文献1参照)。従って、グレーティングローブを抑えて低周波数領域での指向性を保つためには、多数のマイクロフォンを密に並べる必要があり、非常にコストがかかるという問題があった。
これに対して、適応ビームフォーマは、目的方向の感度を一定に保った上で雑音音源が死角になるよう指向性を形成する方式であり、低周波領域に対しても有効で残響環境下においても雑音抑制を行うことができる。適応ビームフォーマには様々な方式があるが、遅延和法の拡張とみなすことができる方式の一つに、一般化サイドローブキャンセラ(GSC, Generalized Sidelobe Canceller)がある。一般化サイドローブキャンセラは、固定ビームフォーマと適応フィルタによりノイズを抑圧するビームフォーマであり、2チャンネルのマイクによる一般的なGriffith-Jim型のGSCは、図7に示すように構成される。2チャンネルのマイク901,902、信号遅延部903、遅延和部904、目的音遮断部905および適応フィルタ906で構成され、目的音遮断部905はマイク信号の減算による減算型ビームフォーマを行う。目的音遮断部905の出力を用いて適応フィルタ906においてノイズ成分を推定し、遅延和部904の出力との差分を求める。
減算型ビームフォーマの出力結果には、目的信号が差し引かれたノイズ成分だけが残っていると考えられ、適応フィルタの入力として適用することにより遅延和法の結果からノイズ成分を除去することができる。しかし、単純な減算だけでは十分に目的信号を除去できない場合が多く、適応フィルタにおいて十分にノイズを除去できない、目的信号まで除去してしまうという問題があった。
この対策として、特許文献1では、目的音遮断部を固定ビームフォーマの出力とマイク入力を用いた適応フィルタにより構成し、各マイク入力から目的信号を除去するように構成している。単なる減算型ビームフォーマよりも目的音を除去した信号が得られるため、後段の適応フィルタでのノイズ抑圧の性能を向上させることができる。
この対策として、特許文献1では、目的音遮断部を固定ビームフォーマの出力とマイク入力を用いた適応フィルタにより構成し、各マイク入力から目的信号を除去するように構成している。単なる減算型ビームフォーマよりも目的音を除去した信号が得られるため、後段の適応フィルタでのノイズ抑圧の性能を向上させることができる。
大賀寿郎、山崎芳男、金田豊著、「音響システムとディジタル処理」、初版、社団法人 電子情報通信学会、1995年3月25日、p181−186
しかしながら、上述した特許文献1に開示された技術は、固定ビームフォーマにおいて複数の入力信号の位相を固定FIR(Finite Impulse Response)フィルタなどで揃えることでSN比(Signal to Noise Ratio)を向上させるものであり、音場の環境によって周波数帯ごとに位相のずれ方や強度が異なる場合や変動する場合は、高精度に位相を合わせることができず、位相合わせの性能が低下するという課題があった。
この発明は上記のような課題を解決するためになされたもので、複数の入力信号の位相合わせの精度を向上させ、SN比を向上させた出力信号を得ることを目的とする。
この発明に係るビームフォーミング装置は、異なるマイクロフォンで収集された音声がそれぞれ変換された第1の音声信号および第2の音声信号から、互いに相関性を有する目的信号を除去する第1の目的音遮断部および第2の目的音遮断部と、第1の目的音遮断部が目的信号を除去する際に取得した情報を用いて、第1の音声信号と第2の音声信号の位相を合わせて合成する位相合わせ部と、第1の目的音遮断部および第2の目的音遮断部において目的信号を除去した信号から、位相合わせ部の出力信号に含まれるノイズ成分を学習するノイズ学習部とを備えるものである。
この発明によれば、音場の環境の変化に影響を受けることなく、高精度に複数の入力信号の位相合わせを行い、SN比を向上させた出力信号を得ることができる。
実施の形態1.
図1は、この発明の実施の形態1によるビームフォーミング装置の構成を示す図である。
実施の形態1のビームフォーミング装置は、第1のマイク101、第2のマイク102、第1の目的音遮断部103、第2の目的音遮断部104、位相合わせ部105、ノイズ学習部106で構成されている。
第1のマイク101および第2のマイク102は、外部音を電気信号(第1の音声信号および第2の音声信号)に変換する。第1の目的音遮断部103は、第2のマイク102の信号を利用して、第1のマイク101の信号から目的音を遮断する処理を行う。第2の目的音遮断部104は、第1のマイク101の信号を利用して、第2のマイク102の信号から目的音を遮断する処理を行う。位相合わせ部105は、第1の目的音遮断部103から入力される処理結果を用いて、第1のマイク101と第2のマイク102から入力される入力信号の位相合わせを行う。ノイズ学習部106は、第1の目的音遮断部103と第2の目的音遮断部104から出力される信号の混合信号を用いて、位相合わせ部105の出力信号からノイズ成分を学習する。
図1は、この発明の実施の形態1によるビームフォーミング装置の構成を示す図である。
実施の形態1のビームフォーミング装置は、第1のマイク101、第2のマイク102、第1の目的音遮断部103、第2の目的音遮断部104、位相合わせ部105、ノイズ学習部106で構成されている。
第1のマイク101および第2のマイク102は、外部音を電気信号(第1の音声信号および第2の音声信号)に変換する。第1の目的音遮断部103は、第2のマイク102の信号を利用して、第1のマイク101の信号から目的音を遮断する処理を行う。第2の目的音遮断部104は、第1のマイク101の信号を利用して、第2のマイク102の信号から目的音を遮断する処理を行う。位相合わせ部105は、第1の目的音遮断部103から入力される処理結果を用いて、第1のマイク101と第2のマイク102から入力される入力信号の位相合わせを行う。ノイズ学習部106は、第1の目的音遮断部103と第2の目的音遮断部104から出力される信号の混合信号を用いて、位相合わせ部105の出力信号からノイズ成分を学習する。
次に、この実施の形態1のビームフォーミング装置の動作について説明する。
なお以下では、第1の目的音遮断部103および第2の目的音遮断部104に、LMS(Least Mean Squares filter)による適応フィルタを用いる場合を例に説明を行う。
図1に示すように、第1の目的音遮断部103は、第1のマイク101の信号x1から第2のマイク102の信号x2を入力として、LMS適応フィルタにより残差信号を求める。これにより、第1のマイク101、第2のマイク102の両方に含まれる相関のある信号(目的信号)を第1のマイク101の信号x1から除去することができる。
なお以下では、第1の目的音遮断部103および第2の目的音遮断部104に、LMS(Least Mean Squares filter)による適応フィルタを用いる場合を例に説明を行う。
図1に示すように、第1の目的音遮断部103は、第1のマイク101の信号x1から第2のマイク102の信号x2を入力として、LMS適応フィルタにより残差信号を求める。これにより、第1のマイク101、第2のマイク102の両方に含まれる相関のある信号(目的信号)を第1のマイク101の信号x1から除去することができる。
時刻nにおける第1のマイク101の信号をx1(n)、第2のマイク102の信号をx2(n)、第1の目的音遮断部103の出力をy1(n)、第1の目的音遮断部103のLMS適応フィルタのフィルタ係数をF(n) =[h0(n), h1(n), …, hp-1(n)]Tとすると、以下の式(1)から式(3)を用いて音声除去後の信号e1(n)が求められる。
X2(n) = [x2(n), x2(n-1), …, x2(n-p-1)]T ・・・(1)
e1(n) = x1(n) - y1(n) = x1(n) - FT(n)・X2(n) ・・・(2)
F(n+1) = F(n) + μ・e1(n)・X2(n) ・・・(3)
X2(n) = [x2(n), x2(n-1), …, x2(n-p-1)]T ・・・(1)
e1(n) = x1(n) - y1(n) = x1(n) - FT(n)・X2(n) ・・・(2)
F(n+1) = F(n) + μ・e1(n)・X2(n) ・・・(3)
式(3)においてμは学習速度を求める定数であって1より小さい正の値、式(1)においてpはLMS適応フィルタの長さ、式(1)および式(2)においてTは転置行列を示す。なおLMS適応フィルタの長さpは、音声信号が相関を持つ程度の長さを用いる。LMS適応フィルタはパワーが強い時にフィルタ係数の学習が進みやすいため、音声区間で学習が進み、第1のマイク101の信号x1から音声信号を除去しやすい。
同様に、第2の目的音遮断部104は、第2のマイク102の信号x2から第1のマイク101の信号x1を入力として、LMS適応フィルタにより残差信号を求める。これにより、第2のマイク102、第1のマイク101の両方に含まれる相関のある信号(目的信号)を第2のマイク102の信号x2から除去することができる。
一方、位相合わせ部105は、第1のマイク101の信号x1と第2のマイク102の号x2を、FIRフィルタを通して合成する。ここで、FIRフィルタの係数として、第1の目的音遮断部103が学習したLMS適応フィルタのフィルタ係数F(n)が設定される。第1の目的音遮断部103で学習されたフィルタ係数F(n)は、第2のマイク102の信号x2を第1のマイク101の信号x1と位相を合わせるように学習した係数であるため、第2のマイク102の信号x2に畳み込むことによって第1のマイク101の信号x1と位相が合わされた信号を得ることができる。つまり、第1のマイク101の信号x1と、第2のマイク102の信号x2に第1の目的音遮断部103が学習したフィルタ係数F(n)を畳み込んだ信号とを加算し、平均化する。時刻nにおける位相合わせ部105の出力信号z(n)は、以下の式(4)で表される。
z(n) = (x1(n) + FT(n)・X2(n))/2 ・・・(4)
位相合わせ部105の処理により、従来例で示した遅延加算よりも音声を強調したビームフォーミングを実現することができる。
z(n) = (x1(n) + FT(n)・X2(n))/2 ・・・(4)
位相合わせ部105の処理により、従来例で示した遅延加算よりも音声を強調したビームフォーミングを実現することができる。
また、第1の目的音遮断部103の出力信号y1と第2の目的音遮断部104の出力信号y2は加算されてノイズ信号noiseとなり、ノイズ学習部106に入力される。ノイズ学習部106は、当該ノイズ信号noiseを入力とし、位相合わせ部105の出力信号zを目的信号とするNLMS(Normalized Least Mean Squares filter)適応フィルタにより、位相合わせ部105の出力信号zに含まれるノイズ成分を学習する。位相合わせ部105の出力信号zからノイズ学習部106の出力信号を減算することにより、ノイズを除去した信号eを得ることができる。
時刻nにおける第1の目的音遮断部103の出力信号y1(n)と第2の目的音遮断部104の出力信号y2(n)の加算信号をnoise(n)、フィルタ係数をFN(n) =[hn0(n), hn1(n), …, hnp-1(n)]Tとすると、ノイズ除去後の信号e(n)は以下の式(5)から式(7)に基づいて算出される。
N(n) = [noise(n), noise(n-1), …, noise(n-p-1)]T ・・・(5)
e(n) = z(n) - FNT(n)・N(n) ・・・(6)
FN(n+1) = FN(n) + μ・ne(n)・N(n)/N T(n)N(n) ・・・(7)
N(n) = [noise(n), noise(n-1), …, noise(n-p-1)]T ・・・(5)
e(n) = z(n) - FNT(n)・N(n) ・・・(6)
FN(n+1) = FN(n) + μ・ne(n)・N(n)/N T(n)N(n) ・・・(7)
なお、上述した説明では、第1の目的音遮断部103および第2の目的音遮断部104の適応フィルタとしてLMSを用い、ノイズ学習部106の適応フィルタとしてNLMSを用いる例を示したが、RLS(Recursive Least Squares)やアフィン射影フィルタなど他の適応フィルタを用いて構成してもよい。
以上のように、この実施の形態1によれば、位相合わせ部105のフィルタ係数として、第1の目的音遮断部103が学習したフィルタ係数を適用するように構成したので、一般化サイドローブキャンセラ(GSC)や固定ビームフォーマと比較してよりSN比が良好な信号を位相合わせ部105から得ることができる。また、第1の目的音遮断部103の演算処理の過程で得られる係数を、位相合わせ部105のフィルタ係数として適用することができるため、位相合わせの処理を効率よく行うことができる。
また、この実施の形態1によれば、ノイズ学習部106において位相合わせ部105の出力信号に含まれるノイズ成分を学習し、学習したノイズ成分を減算するように構成したので、ノイズが抑制され、SN比が向上した信号を得ることができる。
実施の形態2.
図2は、この発明の実施の形態2によるビームフォーミング装置の構成を示す図である。この実施の形態2では、適応フィルタを用いた第1の目的音遮断部103´および第2の目的音遮断部104´とし、さらに実施の形態1で示した位相合わせ部105をゲイン調整部107aおよび合成部107bで構成している。
なお、以下では、実施の形態1によるビームフォーミング装置の構成要素と同一または相当する部分には実施の形態1で使用した符号と同一の符号を付して説明を省略または簡略化する。
図2は、この発明の実施の形態2によるビームフォーミング装置の構成を示す図である。この実施の形態2では、適応フィルタを用いた第1の目的音遮断部103´および第2の目的音遮断部104´とし、さらに実施の形態1で示した位相合わせ部105をゲイン調整部107aおよび合成部107bで構成している。
なお、以下では、実施の形態1によるビームフォーミング装置の構成要素と同一または相当する部分には実施の形態1で使用した符号と同一の符号を付して説明を省略または簡略化する。
第1の目的音遮断部103´は適応フィルタで構成され、第1のマイク101の信号x1および第2のマイク102の信号x2から、第1のマイク101の信号x1に含まれるノイズ成分y1を推定する。推定したノイズ成分y1を第1のマイク101の信号x1から除去することにより、音声除去後の信号e1を得る。第2の目的音遮断部104´は適応フィルタで構成され、第1のマイク101の信号x1および第2のマイク102の信号x2から、第2のマイク102の信号x2に含まれるノイズ成分y2を推定する。推定したノイズ成分y2を第2のマイク102の信号x2から除去することにより、音声除去後の信号e2を得る。
ゲイン調整部107aは第1の目的音遮断部103´の出力信号y1のゲインを調整し、合成部107bはゲイン調整をした信号を第1のマイク101の信号x1から減算する。これにより、実施の形態1の位相合わせ部105の出力信号zと同一の信号を得る。ノイズ学習部106は、第1の目的音遮断部103´の音声除去後の信号e1と、第2の目的音遮断部104´の音声除去後の信号e2との加算信号を用いて、ゲイン調整後の出力信号zからノイズ成分を学習する。ゲイン調整後の出力信号zからノイズ学習部106の出力信号を減算することにより、ノイズを除去した信号eを得ることができる。
上述した実施の形態1では、位相合わせ部105においてFIRフィルタを用いて畳み込み演算を行う例を示したが、この実施の形態2に示すように、第1の目的音遮断部103´および第2の目的音遮断部104´に適応フィルタを用いる場合には、FIRフィルタによる畳み込み演算が不要となり、上述した式(2)および式(4)に基づいて算出される以下の式(8)および式(9)により第1の目的音遮断部103´の出力とゲイン調整部107aにより出力信号z(n)を得ることができる。
まず上述した式(2)より、以下の式(8)が得られる。
FT(n)・X2(n) = x1(n) - e1(n) ・・・(8)
まず上述した式(2)より、以下の式(8)が得られる。
FT(n)・X2(n) = x1(n) - e1(n) ・・・(8)
上述した式(4)と、式(8)を用いて、以下の式(9)に示すように出力信号z(n)は、第1のマイク101の信号x1(n)およびゲイン調整を行った音声除去後の信号e1(n)で表される。
z(n) = (x1(n) + FT(n)・X2(n))/2 ・・・(9)
= (x1(n) + x1(n) - e1(n))/2
= x1(n) - e1(n)/2
z(n) = (x1(n) + FT(n)・X2(n))/2 ・・・(9)
= (x1(n) + x1(n) - e1(n))/2
= x1(n) - e1(n)/2
式(9)で示すように、音声除去後の信号e1(n)をゲイン調整部107aに出力し、ゲイン調整部107aが信号e1(n)のゲインを1/2に調整した後、第1のマイク101の信号x1(n)から減算することにより、出力信号z(n)が得られる。式(9)では、上述した実施の形態1と同一の結果を得るため、ゲイン調整部107aにおけるゲインを1/2に設定する場合を示したが、第1のマイク101および第2のマイク102のゲインバランスなどに応じて数値を適宜変更してもよい。
以上のように、この実施の形態2によれば、第1の目的音遮断部103´および第2の目的音遮断部104´として適応フィルタを用いて第1のマイク101の信号および第2のマイク102の信号に含まれるノイズ成分を推定し、ゲイン調整部107aが音声除去後の信号のゲインを調整し、第1のマイク101の信号から減算するように構成したので、位相合わせを行うためのFIRフィルタを設ける必要がなく、演算量を削減することができる。
実施の形態3.
上述した実施の形態1および実施の形態2では、第1のマイク101および第2のマイク102の2つのマイクを備える構成を示したが、この実施の形態3では、マイクの数を3以上のN個に拡張した場合のビームフォーミング装置について説明する。
上述した実施の形態1および実施の形態2では、第1のマイク101および第2のマイク102の2つのマイクを備える構成を示したが、この実施の形態3では、マイクの数を3以上のN個に拡張した場合のビームフォーミング装置について説明する。
図3は、この発明の実施の形態3によるビームフォーミング装置の構成を示す図である。
実施の形態3のビームフォーミング装置は、アレイマイク部108、目的音遮断対集合部109、位相合わせ部105およびノイズ学習部106で構成されている。
アレイマイク部108は、第1のマイク108A、第2のマイク108B、・・・、第Nのマイク108NのN個のマイクで構成される。各マイク108A,108B,・・・,108Nは外部音を電気信号に変換する。目的音遮断対集合部109は、マイクの個数Nに対してN−1個の目的音遮断対を備える。図3の例では第1の目的音遮断対109A、第2の目的音遮断対109B、・・・、第N−1の目的音遮断対109(N−1)で構成している。各目的音遮断対109A,109B,・・・,109(N−1)は第1のマイク108Aの信号(代表音声信号)とその他のマイク108B,・・・,108Nの信号(その他の複数の音声信号)を用いて互いに相関性を有する信号(目的信号)を除去する。
実施の形態3のビームフォーミング装置は、アレイマイク部108、目的音遮断対集合部109、位相合わせ部105およびノイズ学習部106で構成されている。
アレイマイク部108は、第1のマイク108A、第2のマイク108B、・・・、第Nのマイク108NのN個のマイクで構成される。各マイク108A,108B,・・・,108Nは外部音を電気信号に変換する。目的音遮断対集合部109は、マイクの個数Nに対してN−1個の目的音遮断対を備える。図3の例では第1の目的音遮断対109A、第2の目的音遮断対109B、・・・、第N−1の目的音遮断対109(N−1)で構成している。各目的音遮断対109A,109B,・・・,109(N−1)は第1のマイク108Aの信号(代表音声信号)とその他のマイク108B,・・・,108Nの信号(その他の複数の音声信号)を用いて互いに相関性を有する信号(目的信号)を除去する。
図4は、この発明の実施の形態3によるビームフォーミング装置の目的音遮断対の構成を示す図である。図4では、第1の目的音遮断対109Aを例に示している。
第1の目的音遮断対109Aは、第1の入力目的音遮断部111Aおよび第2の入力目的音遮断部112Aで構成される。第1の入力目的音遮断部111Aは、第1のマイク108Aの信号x1から目的音を遮断し、位相合わせ部105において位相合わせを行うための情報を出力する。第2の入力目的音遮断部112Aは、第2のマイク108Bの信号x2から目的音を遮断し、ノイズ学習部106においてノイズを学習するための信号を出力する。
第1の目的音遮断対109Aは、第1の入力目的音遮断部111Aおよび第2の入力目的音遮断部112Aで構成される。第1の入力目的音遮断部111Aは、第1のマイク108Aの信号x1から目的音を遮断し、位相合わせ部105において位相合わせを行うための情報を出力する。第2の入力目的音遮断部112Aは、第2のマイク108Bの信号x2から目的音を遮断し、ノイズ学習部106においてノイズを学習するための信号を出力する。
位相合わせ部105は、N−1個の目的音遮断対109A,109B,・・・,109(N−1)から入力される結果を用いて、N個のマイク108A,108B,・・・,108Nから入力される信号の位相合わせを行う。ノイズ学習部106は、N−1個の目的音遮断対109A,109B,・・・,109(N−1)から出力される信号の合算信号を用いて、位相合わせ部105の出力信号からノイズ成分を学習する。
第Kの目的音遮断対109K(1≦K≦N−1)における第1の入力目的音遮断部111Kでは、第1のマイク108Aの信号x1を教師信号、第K+1のマイクの信号xK+1を入力信号として、上述した式(1)から式(3)と同様に、以下の式(10)から式(12)に示すようにNLMSによる適応フィルタを用いて第1のマイク108Aの信号x1から目的信号を除去する学習を行う。
XK(n) = [xK(n), xK(n-1), …, xK(n-p-1)]T ・・・(10)
e1K(n) = x1(n) - y1K(n) = x1(n) - FK T(n)・XK(n) ・・・(11)
FK(n+1) = FK(n) + μ・e1K(n)・XK(n) ・・・(12)
上述した式(10)から式(12)において、XKは第K+1のマイクの信号xK+1、FKはNLMSのフィルタ係数、y1KはNLMSにおける残差信号である。
XK(n) = [xK(n), xK(n-1), …, xK(n-p-1)]T ・・・(10)
e1K(n) = x1(n) - y1K(n) = x1(n) - FK T(n)・XK(n) ・・・(11)
FK(n+1) = FK(n) + μ・e1K(n)・XK(n) ・・・(12)
上述した式(10)から式(12)において、XKは第K+1のマイクの信号xK+1、FKはNLMSのフィルタ係数、y1KはNLMSにおける残差信号である。
一方、第Kの目的音遮断対109Kにおける第2の入力目的音遮断部112Kは、第1のマイク108Aの信号x1を入力信号、第K+1のマイクの信号xK+1を教師信号として、上述した式(10)から式(12)とは逆の学習を以下の式(13)から式(15)に基づいて行う。
X1(n) = [x1(n), x1(n-1), …, x1(n-p-1)]T ・・・(13)
eK(n) = xK(n) - yK(n) = xK(n) - F1K T(n)・X1(n) ・・・(14)
F1K(n+1) = F1K(n) + μ・eK(n)・X1(n) ・・・(15)
上述した式(13)から式(15)において、X1は第1のマイク101の信号、F1KはNLMSのフィルタ係数、yKは第Kの目的音遮断対109Kの出力信号、すなわち残差信号である。
X1(n) = [x1(n), x1(n-1), …, x1(n-p-1)]T ・・・(13)
eK(n) = xK(n) - yK(n) = xK(n) - F1K T(n)・X1(n) ・・・(14)
F1K(n+1) = F1K(n) + μ・eK(n)・X1(n) ・・・(15)
上述した式(13)から式(15)において、X1は第1のマイク101の信号、F1KはNLMSのフィルタ係数、yKは第Kの目的音遮断対109Kの出力信号、すなわち残差信号である。
位相合わせ部105は、第1の入力目的音遮断部111Aの出力信号、すなわち第2のマイク108Bから第Nのマイクの出力信号に対してFKを係数とするFIRフィルタで畳み込みを行った信号を、第1のマイク108Aの信号x1に加算する。
ノイズ学習部106は、第1から第N−1の目的音遮断対109A,109B,・・・,109(N−1)の第2の入力目的音遮断部112A,112B,・・・,112(N−1)から出力される目的音を遮断した出力信号y1,y2,・・・,yN-1を加算したノイズ信号noiseを入力とし、位相合わせ部105の出力信号zを目的信号とするNLMS適応フィルタにより、位相合わせ部105の出力信号zに含まれるノイズ成分を学習する。位相合わせ部105の信号からノイズ学習部106の出力を減算することにより、ノイズ除去後の信号eを得ることができる。
ノイズ学習部106は、第1から第N−1の目的音遮断対109A,109B,・・・,109(N−1)の第2の入力目的音遮断部112A,112B,・・・,112(N−1)から出力される目的音を遮断した出力信号y1,y2,・・・,yN-1を加算したノイズ信号noiseを入力とし、位相合わせ部105の出力信号zを目的信号とするNLMS適応フィルタにより、位相合わせ部105の出力信号zに含まれるノイズ成分を学習する。位相合わせ部105の信号からノイズ学習部106の出力を減算することにより、ノイズ除去後の信号eを得ることができる。
以上のように、この実施の形態3によれば、3以上のN個のマイクで構成されたアレイマイク部108と、N−1個の目的音遮断対で構成された目的音遮断対集合部109を備え、各目的音遮断対は代表マイクの信号と、それ以外のマイクの信号を入力として、代表マイクの信号から目的信号を除去する第1の入力目的音遮断部と、その他の各マイクの入力信号から目的信号を除去する第2の入力目的音遮断部を備えるように構成したので、3以上のマイク数を備えた装置においても、位相合わせの精度を向上させることができる。また、効率のよい位相合わせを行うことができる。
なお、上述した実施の形態3では、代表マイクである第1のマイク108Aの信号と、その他のマイク108B,・・・,108Nの信号を用いて目的音遮断対集合部109を構成する例を示したが、代表マイクは第1のマイク108A以外で構成してもよく、例えば、SN比の最も高いマイクを代表マイクに選択するなど、周囲の状況に合わせて切り替えてもよい。
また、上述した実施の形態3では、適応フィルタとしてLMSを用いる例を示したが、NLMSやアフィン射影フィルタなど他のアルゴリズムを用いて構成してもよい。
また、上述した実施の形態3では、適応フィルタとしてLMSを用いる例を示したが、NLMSやアフィン射影フィルタなど他のアルゴリズムを用いて構成してもよい。
実施の形態4.
図5は、この発明の実施の形態4によるビームフォーミング装置の構成を示す図である。この実施の形態4では、上述した実施の形態1で示したビームフォーミング装置に音声区間検出部120を追加して設けている。
音声区間検出部120は、第1のマイク101の信号および第2のマイク102の信号を入力として、入力された信号の音声区間を検出する。音声区間検出には公知の技術を適用することができる。例えば、以下に示す参考文献1に開示された音声区間判別装置の検出技術を適用することができる。
・参考文献1
特開平10−171487号公報
図5は、この発明の実施の形態4によるビームフォーミング装置の構成を示す図である。この実施の形態4では、上述した実施の形態1で示したビームフォーミング装置に音声区間検出部120を追加して設けている。
音声区間検出部120は、第1のマイク101の信号および第2のマイク102の信号を入力として、入力された信号の音声区間を検出する。音声区間検出には公知の技術を適用することができる。例えば、以下に示す参考文献1に開示された音声区間判別装置の検出技術を適用することができる。
・参考文献1
特開平10−171487号公報
第1の目的音遮断部103および第2の目的音遮断部104は、音声区間検出部120の検出結果を参照し、音声区間であることを示す検出結果が入力された場合には適応フィルタの学習処理を行い、音声区間でないことを示す検出結果が入力された場合には適応フィルタの学習処理を行わないように構成することができる。
以上のように、この実施の形態4によれば、第1および第2のマイク101,102の信号の音声区間を検出する音声区間検出部120を備え、第1および第2の目的音遮断部103,104が音声区間検出部120の検出結果を参照し、音声区間であることを検出した場合にのみ適応フィルタの学習処理を行うように構成したので、適応フィルタの誤学習を防止し、より高精度にフィルタ係数を学習することができる。
なお、上述した実施の形態4では、実施の形態1で示したビームフォーミング装置に音声区間検出部120を適用する例を示したが、実施の形態2および実施の形態3で示したビームフォーミング装置にも適用可能である。
なお、本願発明はその発明の範囲内において、各実施の形態の自由な組み合わせ、あるいは各実施の形態の任意の構成要素の変形、もしくは各実施の形態において任意の構成要素の省略が可能である。
101 第1のマイク、102 第2のマイク、103,103´ 第1の目的音遮断部、104,104´ 第2の目的音遮断部、105 位相合わせ部、106 ノイズ学習部、107a ゲイン調整部、107b 合成部、108 アレイマイク部、109 目的音遮断対集合部、109A 第1の目的音遮断対、111A 第1の入力目的音遮断部、112A 第2の入力目的音遮断部、120 音声区間検出部。
Claims (8)
- 入力された音声信号に対して演算処理を行い、指向特性を形成するビームフォーミング装置において、
異なるマイクロフォンで収集された音声がそれぞれ変換された第1の音声信号および第2の音声信号から、互いに相関性を有する目的信号を除去する第1の目的音遮断部および第2の目的音遮断部と、
前記第1の目的音遮断部が前記目的信号を除去する際に取得した情報を用いて、前記第1の音声信号と前記第2の音声信号の位相を合わせて合成する位相合わせ部と、
前記第1の目的音遮断部および前記第2の目的音遮断部において前記目的信号を除去した信号から、前記位相合わせ部の出力信号に含まれるノイズ成分を学習するノイズ学習部とを備えたことを特徴とするビームフォーミング装置。 - 前記第1の目的音遮断部および前記第2の目的音遮断部は、前記第1の音声信号および前記第2の音声信号から前記目的信号を除去する際にフィルタ係数を学習し、
前記位相合わせ部は、前記第1の目的音遮断部が学習したフィルタ係数を前記第2の音声信号に畳み込み、当該フィルタ係数を畳み込んだ第2の音声信号を前記第1の音声信号に加算し、位相を合わせることを特徴とする請求項1記載のビームフォーミング装置。 - 前記第1の目的音遮断部および前記第2の目的音遮断部は、前記第2の音声信号および前記第1の音声信号に含まれるノイズ成分を推定する適応フィルタで構成され、
前記位相合わせ部は、前記第1の目的音遮断部が推定したノイズ成分に基づいて算出した音声除去信号の利得を調整するゲイン調整部を備え、当該ゲイン調整部で利得を調整した音声除去信号を前記第1の音声信号から減算することを特徴とする請求項1記載のビームフォーミング装置。 - 入力された音声信号に対して演算処理を行い、指向特性を形成するビームフォーミング装置において、
N個(N≧3)のマイクロフォンで収集された音声がそれぞれ変換された代表音声信号およびその他複数の音声信号から、互いに相関性を有する目的信号を除去するN−1個の目的音遮断対で構成される目的音遮断対集合部と、
前記N−1個の目的音遮断対が前記目的信号を除去する際に取得した情報を用いて、前記代表音声信号および前記その他複数の音声信号の位相を合わせて合成する位相合わせ部と、
前記N−1個の目的音遮断対において前記目的信号を除去した信号から、前記位相合わせ部の出力信号に含まれるノイズ成分を学習するノイズ学習部とを備え、
前記N−1個の目的音遮断対は、前記代表音声信号から前記目的信号を除去する第1の入力目的音遮断部と、前記その他複数の音声信号のいずれかから前記目的信号を除去する第2の入力目的音遮断部とを備えることを特徴とするビームフォーミング装置。 - 前記位相合わせ部は、前記N−1個の目的音遮断対の各第1の入力目的音遮断部が前記代表音声信号から前記目的信号を除去する際に学習したフィルタ係数を前記その他複数の音声信号に畳み込み、当該フィルタ係数を畳み込んだ音声信号を前記代表音声信号に加算し、位相を合わせることを特徴とする請求項4記載のビームフォーミング装置。
- 前記第1の音声信号および前記第2の音声信号に含まれる音声区間を検出する音声区間検出部を備え、
前記第1の目的音遮断部および前記第2の目的音遮断部は、前記音声区間検出部において音声区間が検出された場合に、前記フィルタ係数の学習を行うことを特徴とする請求項2記載のビームフォーミング装置。 - 前記第1の音声信号および前記第2の音声信号に含まれる音声区間を検出する音声区間検出部を備え、
前記第1の目的音遮断部および前記第2の目的音遮断部は、前記音声区間検出部において音声区間が検出された場合に、前記適応フィルタによるノイズ成分の推定を行うことを特徴とする請求項3記載のビームフォーミング装置。 - 前記代表音声信号および前記その他複数の音声信号に含まれる音声区間を検出する音声区間検出部を備え、
前記N−1個の目的音遮断対は、前記音声区間検出部において音声区間が検出された場合に、前記フィルタ係数の学習を行うことを特徴とする請求項5記載のビームフォーミング装置。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2012/069997 WO2014024248A1 (ja) | 2012-08-06 | 2012-08-06 | ビームフォーミング装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP5738488B2 true JP5738488B2 (ja) | 2015-06-24 |
JPWO2014024248A1 JPWO2014024248A1 (ja) | 2016-07-21 |
Family
ID=50067534
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014529174A Expired - Fee Related JP5738488B2 (ja) | 2012-08-06 | 2012-08-06 | ビームフォーミング装置 |
Country Status (5)
Country | Link |
---|---|
US (1) | US9503809B2 (ja) |
JP (1) | JP5738488B2 (ja) |
CN (1) | CN104521245B (ja) |
DE (1) | DE112012006780T5 (ja) |
WO (1) | WO2014024248A1 (ja) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5738488B2 (ja) * | 2012-08-06 | 2015-06-24 | 三菱電機株式会社 | ビームフォーミング装置 |
US9460727B1 (en) * | 2015-07-01 | 2016-10-04 | Gopro, Inc. | Audio encoder for wind and microphone noise reduction in a microphone array system |
US9613628B2 (en) | 2015-07-01 | 2017-04-04 | Gopro, Inc. | Audio decoder for wind and microphone noise reduction in a microphone array system |
WO2018127483A1 (en) * | 2017-01-03 | 2018-07-12 | Koninklijke Philips N.V. | Audio capture using beamforming |
WO2018229821A1 (ja) | 2017-06-12 | 2018-12-20 | ヤマハ株式会社 | 信号処理装置、遠隔会議装置、および信号処理方法 |
JP7370693B2 (ja) | 2018-07-18 | 2023-10-30 | 株式会社東芝 | 部分放電検出システム、学習システム、部分放電検出方法、コンピュータプログラム及び電気機器 |
US11234073B1 (en) * | 2019-07-05 | 2022-01-25 | Facebook Technologies, Llc | Selective active noise cancellation |
CN110677786B (zh) * | 2019-09-19 | 2020-09-01 | 南京大学 | 一种用于提升紧凑型声重放系统空间感的波束形成方法 |
CN111798860B (zh) * | 2020-07-17 | 2022-08-23 | 腾讯科技(深圳)有限公司 | 音频信号处理方法、装置、设备及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08122424A (ja) * | 1994-09-01 | 1996-05-17 | Nec Corp | 適応アレイ装置 |
JP2006217649A (ja) * | 2006-03-20 | 2006-08-17 | Toshiba Corp | 信号処理装置 |
JP2010152021A (ja) * | 2008-12-25 | 2010-07-08 | Nec Corp | 信号処理方法、信号処理装置、並びに信号処理プログラム |
JP2010160245A (ja) * | 2009-01-07 | 2010-07-22 | Nara Institute Of Science & Technology | 雑音抑圧処理選択装置,雑音抑圧装置およびプログラム |
WO2010109708A1 (ja) * | 2009-03-25 | 2010-09-30 | 株式会社東芝 | 受音信号処理装置、方法およびプログラム |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10171487A (ja) | 1996-12-11 | 1998-06-26 | Mitsubishi Electric Corp | 音声区間判別装置 |
US20070076898A1 (en) * | 2003-11-24 | 2007-04-05 | Koninkiljke Phillips Electronics N.V. | Adaptive beamformer with robustness against uncorrelated noise |
JP4840060B2 (ja) * | 2006-10-03 | 2011-12-21 | ソニー株式会社 | ヘッドホン、ノイズ低減処理システム及びノイズ低減処理方法 |
US8731002B2 (en) * | 2011-03-25 | 2014-05-20 | Invensense, Inc. | Synchronization, re-synchronization, addressing, and serialized signal processing for daisy-chained communication devices |
US9795044B2 (en) * | 2011-08-22 | 2017-10-17 | Catalyst Lifestyle Limited | Waterproof case |
US8705781B2 (en) * | 2011-11-04 | 2014-04-22 | Cochlear Limited | Optimal spatial filtering in the presence of wind in a hearing prosthesis |
JP5738488B2 (ja) * | 2012-08-06 | 2015-06-24 | 三菱電機株式会社 | ビームフォーミング装置 |
-
2012
- 2012-08-06 JP JP2014529174A patent/JP5738488B2/ja not_active Expired - Fee Related
- 2012-08-06 CN CN201280075124.5A patent/CN104521245B/zh not_active Expired - Fee Related
- 2012-08-06 US US14/411,980 patent/US9503809B2/en not_active Expired - Fee Related
- 2012-08-06 WO PCT/JP2012/069997 patent/WO2014024248A1/ja active Application Filing
- 2012-08-06 DE DE112012006780.0T patent/DE112012006780T5/de not_active Ceased
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08122424A (ja) * | 1994-09-01 | 1996-05-17 | Nec Corp | 適応アレイ装置 |
JP2006217649A (ja) * | 2006-03-20 | 2006-08-17 | Toshiba Corp | 信号処理装置 |
JP2010152021A (ja) * | 2008-12-25 | 2010-07-08 | Nec Corp | 信号処理方法、信号処理装置、並びに信号処理プログラム |
JP2010160245A (ja) * | 2009-01-07 | 2010-07-22 | Nara Institute Of Science & Technology | 雑音抑圧処理選択装置,雑音抑圧装置およびプログラム |
WO2010109708A1 (ja) * | 2009-03-25 | 2010-09-30 | 株式会社東芝 | 受音信号処理装置、方法およびプログラム |
Also Published As
Publication number | Publication date |
---|---|
US9503809B2 (en) | 2016-11-22 |
DE112012006780T5 (de) | 2015-06-03 |
CN104521245B (zh) | 2017-10-10 |
US20150181329A1 (en) | 2015-06-25 |
CN104521245A (zh) | 2015-04-15 |
WO2014024248A1 (ja) | 2014-02-13 |
JPWO2014024248A1 (ja) | 2016-07-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5738488B2 (ja) | ビームフォーミング装置 | |
EP2183853B1 (en) | Robust two microphone noise suppression system | |
CN108141656B (zh) | 用于麦克风的数字信号处理的方法和装置 | |
US8958572B1 (en) | Adaptive noise cancellation for multi-microphone systems | |
EP2438766B1 (en) | Acoustic multi-channel echo cancellation | |
JP5371197B2 (ja) | マルチチャネルエコー補正システムおよび方法 | |
US8682006B1 (en) | Noise suppression based on null coherence | |
KR20190085927A (ko) | 적응성 빔포밍 | |
EP1855457A1 (en) | Multi channel echo compensation using a decorrelation stage | |
JP4957810B2 (ja) | 音処理装置、音処理方法及び音処理プログラム | |
JP4973655B2 (ja) | 適応アレイ制御装置、方法、プログラム、及びこれを利用した適応アレイ処理装置、方法、プログラム | |
JP2012216998A (ja) | 信号処理装置及び信号処理方法 | |
JPWO2009051132A1 (ja) | 信号処理システムと、その装置、方法及びそのプログラム | |
JP2020504966A (ja) | 遠距離音の捕捉 | |
KR20110021306A (ko) | 마이크로폰의 신호 보상 장치 및 그 방법 | |
JP4879195B2 (ja) | 騒音低減装置 | |
US11195540B2 (en) | Methods and apparatus for an adaptive blocking matrix | |
JP2009272876A (ja) | 音源分離強調システム | |
Agrawal et al. | Dual microphone beamforming algorithm for acoustic signals |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150324 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150421 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5738488 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |