JP2007147732A - 雑音低減システム及び雑音低減方法 - Google Patents

雑音低減システム及び雑音低減方法 Download PDF

Info

Publication number
JP2007147732A
JP2007147732A JP2005338727A JP2005338727A JP2007147732A JP 2007147732 A JP2007147732 A JP 2007147732A JP 2005338727 A JP2005338727 A JP 2005338727A JP 2005338727 A JP2005338727 A JP 2005338727A JP 2007147732 A JP2007147732 A JP 2007147732A
Authority
JP
Japan
Prior art keywords
noise
signal
frequency spectrum
microphones
reference signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2005338727A
Other languages
English (en)
Other versions
JP4096104B2 (ja
Inventor
Masato Akagi
正人 赤木
Junfeng Li
リ・ジュンフン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Advanced Institute of Science and Technology
Original Assignee
Japan Advanced Institute of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Japan Advanced Institute of Science and Technology filed Critical Japan Advanced Institute of Science and Technology
Priority to JP2005338727A priority Critical patent/JP4096104B2/ja
Publication of JP2007147732A publication Critical patent/JP2007147732A/ja
Application granted granted Critical
Publication of JP4096104B2 publication Critical patent/JP4096104B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

【課題】非コヒーレント雑音フィールドでも高い雑音抑圧性能が得られるようにする。
【解決手段】ブロッキングマトリクス(BM)ユニット14は、マイクロホン111-1〜111-Mから出力される観測信号に含まれている目的音声信号の到来時刻のずれが較正された信号を受けて、基準チャネルとしてのマイクロホン111-1を除く残りのマイクロホンから出力される観測信号に対応し、目的音声信号が抑圧された雑音基準信号を生成する。フィルタユニット15は、BMユニット14によって生成される雑音基準信号の周波数スペクトルの歪みを、コヒーレンス関数を用いて定義された、雑音基準信号の周波数スペクトル及び音声基準信号の周波数スペクトルの相互相関と、コヒーレンス関数を用いて定義された、雑音基準信号の周波数スペクトルの自己相関との関係を反映した雑音キャンセラ係数を用いて補正する。
【選択図】 図1

Description

本発明は、雑音環境における音声認識に必要な雑音低減を含む前処理に好適な雑音低減システム及び雑音低減方法に関する。
音声認識システムは、既に一部の分野で実用化されており、当該音声認識システムの種々の分野への普及には大きな期待が寄せられている。しかし、実使用環境には望まれない雑音が存在し、当該雑音により歪みが生じた音声が入力されると認識性能は大幅に低下する。そこで、雑音中の音声認識のための前処理として、雑音低減(雑音抑圧もしくは雑音除去)のための処理が行われている。
この種の処理では、複数のマイクロホン(マイクロホン対)から構成されるマイクロホンアレイを利用して、各マイクロホン間に生じる到来音の到達時間差(到来時間差)に基づいてビームフォーマを構築することにより、雑音(のスペクトル)が推定される。この推定された雑音(のスペクトル)をマイクロホンから出力される信号(のスペクトル)から差し引くことにより、雑音が低減(キャンセル)された目的音声(のスペクトル)が得られる。
このような雑音低減手法を実現するアルゴリズムは、多チャンネルアルゴリズムと呼ばれる。多チャンネルアルゴリズム、例えばビームフォーマに基づくアルゴリズムは、マイクロホンアレイにより空間フィルタを構成する手法である。
ビームフォーマとして、遅延和(delay-and-sum)ビームフォーマ(DSBF)、例えば非特許文献1に記載された線形制約付きビームフォーマが知られている。この線形制約付きビームフォーマは、当該ビームフォーマの出力を最小化することにより、目的の方向とは異なる方向からの信号を抑圧している間、当該目的の方向から到着する信号が歪まないように維持する。また、非特許文献1に記載のビームフォーマを改良したものに、非特許文献2に記載された一般化(汎用)サイドローブ・キャンセラー(generalized side lobe canceller: GSC)ビームフォーマがある。これらのビームフォーマでは、目的の音声信号がキャンセルされる(打ち消される)のを回避するために、適応信号処理が使用される。しかしながら適応信号処理は、実際の雑音状況の下でのシステム(雑音低減システム)の安定性を減少させる。
そこで、マイクロホン対を使用する、差分型(subtractive)ビームフォーマに基づいたアルゴリズムが提案されている(例えば、非特許文献3及び4参照)。この非特許文献3及び4に記載のビームフォーマのうち、例えば非特許文献4に記載のビームフォーマの優位性は、特に突然の雑音に関し、少ないマイクロホンと分析的な雑音推定スキームだけで、高い方向性雑音低減(抑圧)性能を有する点にある。この優位性は、完全なコヒーレント雑音フィールド(干渉性雑音場)に対応する環境に方向性雑音だけが存在するという仮定の下で引き出される。
ここで、非特許文献4に記載のビームフォーマ、つまり雑音低減アルゴリズムに基づく差分型ビームフォーマについて説明する。雑音の多い環境の中にマイクロホンアレイを構成する複数のマイクロホンが配置されているものとする。この場合、各マイクロホンで観測される信号は、2つの成分からなる。第1は目的とする音声信号(認識されるべき音声信号)であり、第2は決定される方向から到来する付加的な方向性雑音(Directional Noise)である。したがって、隣接する1対のマイクロホンで観測される信号x1(t)及びx2(t)は、次式
1(t)=s(t) + n(t) (1)
2(t)=s(t) + n(t-δ) (2)
のように表すことができる。ここで、δは方向性雑音信号の隣接するマイクロホン間の相対的時間遅れである。
この信号モデルに基づき、非特許文献4に記載の差分型ビームフォーマでは、次の3ステップに要約される雑音低減アルゴリズム(以下、基本雑音低減アルゴリズムと称する)が実行される。
ステップ1:雑音スペクトル推定
方向性雑音のスペクトルを推定するために、時間領域(time domain)のビームフォーマ(差分型ビームフォーマ)がτ≠0を条件として次式
12(t)= 1/4{[x1(t+τ) - x1(t-τ)] - [x2(t+τ) - x2(t-τ)]} (3)
のように構築される。ここで、ビームフォーマの出力がいかなる目的の音声成分を含まないことに注目する。
方向性雑音信号の到着の方向(direction of arrival:DOA)が与えられると、周波数領域の雑音スペクトルN(ω)は、上記ビームフォーマの出力u12(t)から、次式
N(ω)=U12(ω)/{exp(jωδ/2)sin(ωδ/2)sinωτ} (4)
に従い容易に推定することができる。ここで、分子のU12(ω)は、u12(t)の短時間フーリエ変換であり、分母のexp(jωδ/2)sinωδ/2sinωτは重み係数である。
ステップ2:雑音方向推定
式(4)の中で示されるように、方向性雑音信号のDOA情報は雑音スペクトルの推定のために必要不可欠である。このために、従来の相互相関DOA推定を適用する2種のビームフォーマを統合した強健な方向方位測定器が、例えば非特許文献5に記載されている。
ステップ3:雑音低減
雑音スペクトルを推定した後に、非線形のスペクトル減算が、複数のマイクロホンのうちのある1つのマイクロホンによって受信された雑音のある信号から推定雑音を低減するために使用される。
上述の基本雑音低減アルゴリズムは、他の雑音低減アルゴリズムと比較して次のような利点を有する。それは、フレーム単位でスペクトル分析し、フレーム単位で雑音スペクトルを推定することにより種々の方向性雑音に対処することができる点である。
O.L. Frost,「An algorithm for linearly constrained adaptive array processing」,In Proc,IEEE,vol. 60,pp. 926-935,1972 L.J. Griffiths and C.W. Jim,「An alternative approach to linearly constrained adaptive beamforming」,IEEE Trans. on Antennas Propagat.,vol.AP-30,pp. 27-34,1982 水町,赤木,「マイクロホン対を用いたスペクトルサブトラクションによる雑音除去法」,電子情報通信学会論文誌,1999年4月,A,Vol.J82-A,N0.4,pp.503-512 M. Akagi and M. Mizumachi,「Noise Reduction by Paired Microphones」, In Proc. EUROSPEECH97,pp. 335-338,1997 M. Mizumachi and M. Akagi,「Noise reduction method that is equipped for a robust direction finder in adverse environments」, In Proc. IEEE Workshop on Robust Method for Speech Recognition in Adverse Conditions,pp. 179-182,1999
しかしながら、実際的な雑音状況、例えば、拡散雑音(diffuse noise)フィールドとして近似的にモデル化することができる自動車環境或いは残響のある部屋の中は、一般にコヒーレント雑音フィールドではない。したがって、自動車環境或いは残響のある部屋の中のような実際的な雑音状況の下では、上述した非特許文献3に記載の基本雑音低減アルゴリズムを適用したビームフォーマの優位性は低下する。
本発明は上記事情を考慮してなされたものでその目的は、非コヒーレント雑音フィールドでも高い方向性雑音抑圧性能が得られる雑音低減システム及び雑音低減方法を提供することにある。
本発明の1つの観点によれば、雑音環境における音声認識に必要な雑音低減を含む前処理を行う雑音低減システムが提供される。この雑音低減システムは、認識すべき目的音声を含む音響を電気信号に変換して観測信号として出力するための複数のマイクロホンから構成されるマイクロホンアレイと、前記複数のマイクロホンから出力される観測信号に含まれている目的音声信号の到来時刻のずれを当該複数のマイクロホンのうち基準チャネルとして予め定められたマイクロホンを基準に較正する較正器と、前記複数のマイクロホンから出力される観測信号に対応する前記較正器による較正後の信号に基づき、前記基準チャネルに対応し且つ目的の方向とは異なる方向からの信号が抑圧された信号の周波数スペクトルを、音声基準信号の周波数スペクトルとして生成する固定ビームフォーマユニットと、前記複数のマイクロホンから出力される観測信号に対応する前記較正器による較正後の信号を受けて、前記基準チャネルを除く残りのマイクロホンから出力される観測信号に対応し、目的音声信号が抑圧された信号の周波数スペクトルを、雑音基準信号の周波数スペクトルとして生成するブロッキングマトリクスユニットと、前記ブロッキングマトリクスユニットによって生成される、前記残りのマイクロホンから出力される観測信号に対応する雑音基準信号の周波数スペクトルの歪みを、コヒーレンス関数を用いて定義された、前記雑音基準信号の周波数スペクトル及び前記音声基準信号の周波数スペクトルの相互相関と、コヒーレンス関数を用いて定義された、前記雑音基準信号の周波数スペクトルの自己相関との関係を反映した雑音キャンセラ係数を用いて補正するフィルタユニットと、前記フィルタユニットの出力から、前記固定ビームフォーマユニットによって生成される音声基準信号の周波数スペクトルに含まれていると推定される雑音スペクトルを生成する推定雑音生成器と、前記固定ビームフォーマユニットによって生成される音声基準信号の周波数スペクトルから前記推定雑音生成器によって生成される雑音スペクトルを除去する推定雑音除去器とを具備する。
本発明によれば、ブロッキングマトリクスユニットによって生成される雑音基準信号の周波数スペクトルの歪みが、当該ブロッキングマトリクスユニットの次段に設けられたフィルタユニットによって、コヒーレンス関数を用いて定義された、雑音基準信号の周波数スペクトル及び音声基準信号の周波数スペクトルの相互相関と、コヒーレンス関数を用いて定義された、雑音基準信号の周波数スペクトルの自己相関との関係を反映した雑音キャンセラ係数を用いて補正される。これにより、非コヒーレント雑音フィールドでも高い方向性雑音抑圧性能を確保できる。
以下、本発明の実施の形態につき図面を参照して説明する。
図1は本発明の一実施形態に係る雑音低減システムの構成を示すブロック図である。本実施形態において、図1の雑音低減システムは、音声認識システムの音声入力システムに用いられる。音声入力システムは、話者が発声した音声を入力し、当該音声に雑音が重畳されている場合に当該雑音を推定し、その雑音推定の結果に基づいて目的音を強調する処理を行う機能を有する。つまり音声入力システム1は、雑音環境における音声認識のための前処理を行う機能を有する。音声入力システムは音声認識のための前処理の一部として、話者が発声した音声に含まれている雑音を低減する図1に示す雑音低減システムを含む。音声認識システムは、音声入力システムによる前処理によって強調された目的音声信号に基づき目的音声を認識する。ここでは、音声認識システムは、車載用、例えばカーナビゲーション装置用の音声認識システムであるものとする。
図1の雑音低減システムは、マイクロホンアレイ11と、較正器12と、固定ビームフォーマ(FBF)ユニット13と、ブロッキングマトリクス(BM)ユニット14と、雑音キャンセラ15と、逆短時間フーリエ変換器(ISTFT)16とから構成される。
マイクロホンアレイ11は、複数のマイクロホン、好ましくは少なくとも3個のマイクロホン、例えばM個(Mは3以上の整数)の無指向性マイクロホン111-1,111-2,…,111-Mから構成される。マイクロホン111-1〜111-Mは、直線上に等間隔(例えば10cm間隔)で配置されている。このようなマイクロホン111-1〜111-M(の配列からなるマイクロホンアレイ11)が雑音の多い環境に配置されている場合、マイクロホン111-1〜111-Mの各々で観測される音(音響)は少なくとも2つの成分に大別される。第1は、ある1つの方向から到来する認識されるべき音声(目的音声)である。第2は、決定される方向から到来する、付加的な、方向性のある低減(抑圧もしくは除去)されるべき雑音(方向性雑音:Directional Noise)である。
マイクロホン111-1〜111-Mは、それぞれ当該マイクロホンに到来する、目的音声及び雑音(方向性雑音)を受けて、その目的音声及び雑音が重畳された音を電気信号(観測信号)に変換する。マイクロホン111-1〜111-Mに到来する目的音声の方向が、当該マイクロホン111-1〜111-Mの配列方向に直交していない場合、この目的音声は当該マイクロホン111-1〜111-Mにそれぞれ時間差をもって到達する。今、目的音声がマイクロホン111-1に到達する時刻をt、目的音声が隣接するマイクロホンの各々に到達する時刻の差分をζとする。この場合、目的音声は、マイクロホン111-2〜111-Mにそれぞれ時刻t−ζ〜t−(M−1)ζに到達する。つまり、目的音声がマイクロホン111-1に到達する時刻tを基準とした場合、当該目的音声は、マイクロホン111-2〜111-Mに、それぞれ時間差(到来時間差)ζ〜(M−1)ζをもって到達する。ここでは、マイクロホンアレイ11に対する目的音声の到来方向は予め分かっており、ζは既知であるものと仮定する。この仮定は、図1の雑音低減システムを含む音声認識システムがカーナビゲーション装置に用いられる本実施形態では成立する。なお、ζが既知でない構成でも、当該ζは前記非特許文献3に記載されているように推定可能である。方向性雑音についても同様である。
較正器12は、マイクロホンアレイ1のマイクロホン111-1,111-2,…,111-Mからそれぞれ出力される観測信号x'1(t),x'2(t),…,x'M(t)を入力する。較正器12は、入力された信号x'1(t)〜x'M(t)に含まれている目的音声信号s()の到来方向が、仮想的に、マイクロホン111-1〜111-Mの配列方向に直交する方向、つまりマイクロホンアレイ1の正中面に揃えられるように、時間シフト操作を行う。ここでは較正器12は、信号x'1(t)を基準に、信号x'2(t)〜x'M(t)に対して相対的にそれぞれ時間ζ〜(M−1)ζだけシフト(プラス方向にシフト)する。
このような較正器12による時間シフトにより、目的音声の音源(話者)とマイクロホンアレイ1との間の位置関係に影響される目的音声の伝搬特性が補償されて、信号x'1(t)〜x'M(t)にそれぞれ含まれている目的音声信号s()の到来時刻が揃えられる。つまり、較正器12による時間シフトにより、目的音声の到来方向がマイクロホンアレイ1の正中面であると仮定できる。このことは、各マイクロホン111-1〜111-Mが、同相の同一の音声信号s(t)を出力するように予め較正されていること、つまり各マイクロホン111-1〜111-Mが目的音声の到来方向に向かって事前に配置されていることと等価である。以下の説明では、較正器12の出力(時間遅れ補償出力)である較正(時間シフト)後の信号x'1(t)〜x'M(t)をx1(t)〜xM(t)で表す。
i番目(i=1,2,…,M)のマイクロホン111-iから出力される観測信号x'i(t)に対応する時間シフト後の信号xi(t)は、信号x1(t)を基準とした場合、次式
i(t)=s(t) + n(t-(i-1)δ) (5)
のように表される。ここで、s(t)は目的音声信号、n()は方向性雑音信号、δは方向性雑音信号の隣接するマイクロホン間の相対的時間遅れである。この例のように、信号x1(t)を基準とした場合、当該信号x1(t)に対応するマイクロホン111-1を基準(参照)チャネルと呼び、当該信号x1(t)を基準(参照)信号と呼ぶ。
ここで、n(t-(i-1)δ)を
i(t)=n(t-(i-1)δ) (6)
のように表すと、式(5)は次式
i(t)=s(t) + ni(t) (7)
に示す信号モデルで表される。この式(7)は、信号xi(t)を、i番目のマイクロホン111-iで観察される雑音のある信号と仮定した場合、当該信号xi(t)が、目的音声信号s(t)及び付加雑音信号ni(t)からなることを意味する。ここで、各マイクロホン111-iで観察される付加雑音信号ni(t)が全ての望まない信号を含むことに注目する。この望まない信号が、前記基本雑音低減アルゴリズムの中で仮定されるような方向性雑音だけでなく、同時に全方向に伝搬する、方向性のない雑音(非方向性雑音: Non-Directional Noise)を含んでいても構わない。
較正器12からの出力信号x1(t),x2(t),…,xM(t)はFBF(固定ビームフォーマ)ユニット13に入力される。FBFユニット13は、短時間フーリエ変換器(STFT)131とFBF(固定ビームフォーマ)132とから構成される。STFT131は、信号xi(t)(i=1,2,…,M)を一定のサンプリング周期でサンプリングして得られるデジタル信号(つまり信号xi(t)に対応するデジタル信号)を、短時間フーリエ変換(Short Time Fourier Transform: STFT)する。これによりSTFT131は、較正器12からの出力信号x1(t),x2(t),…,xM(t)に対する短時間フーリエ変換結果X1(ω),X2(ω),…,XM(ω)を出力する。
STFT131による短時間フーリエ変換結果X1(ω),X2(ω),…,XM(ω)はFBF132に入力される。このFBF132には、例えば従来から知られている遅延和ビームフォーマが用いられる。FBF132は、目的の方向とは異なる方向からの信号(妨害信号)を抑圧している間、当該目的の方向から到着する信号(目的音声信号)が歪まないように維持する。本実施形態におけるFBF132は、短時間フーリエ変換結果X1(ω),X2(ω),…,XM(ω)のうち、基準(参照)チャネルからの出力信号(つまり音声基準信号)に対する短時間フーリエ変換結果だけを取り出すフィルタ(all-passフィルタ)をなす。また本実施形態では、マイクロホン111-1が基準チャネルに割り当てられている。この場合、FBF132は、基準チャネル以外のチャネル、即ちマイクロホン111-2〜111-Mに対応するx2(t)〜xM(t)に対する短時間フーリエ変換結果X2(ω)〜XM(ω)をブロックする。
FBF132(FBFユニット13)の出力をYFBF(ω)とすると、このYFBF(ω)は次式
FBF(ω)=X1(ω)=S(ω) + N1(ω) (8)
に示すように、音声基準信号x1(t)=s(t) + n1(t)に対する短時間フーリエ変換結果X1(ω)=S(ω) + N1(ω)によって与えられる。ここでは、YFBF(ω)自体を便宜的に音声基準信号と呼ぶ。但し、この音声基準信号YFBF(ω)は雑音信号(雑音スペクトル)を含む。
なお、STFT131とFBF132との配置を入れ替えても構わない。この場合、基準チャネルとしてのマイクロホン111-1に対応する較正器12からの出力信号x1(t)だけがFBF132により取り出される。このFBF132により取り出された信号x1(t)がSTFT131により短時間フーリエ変換される。このSTFT131によるx1(t)に対する短時間フーリエ変換結果X1(ω)が、FBFユニット13の出力(FBF出力信号)YFBF(ω)として用いられる。
較正器12からの出力信号x1(t),x2(t),…,xM(t)はBM(ブロッキングマトリクスユニット)14にも入力される。BMユニット14は、M−1個の差分型ビームフォーマ(SBF)141-2,141-3,…,141-MとSTFT(短時間フーリエ変換器)142とから構成される。SBF141-i(i=2,…,M)は、前記基本雑音低減アルゴリズムで適用される差分型ビームフォーマと同様の仕組みにより、目的の音声成分(目的音声信号)をブロックする。即ちSBF141-iは、x1(t)及びxi(t)に基づき、τ≠0を条件として、前記式(3)と同様の次式
1i(t)= 1/4{[x1(t+τ) - x1(t-τ)] - [xi(t+τ) - xi(t-τ)]} (9)
で示される雑音基準信号u1i(t)を出力する機能を有する。この雑音基準信号u1i(t)、つまりSBF141-iの出力u1i(t)は、目的音声信号がブロッキング(抑圧)された信号である。
BMユニット14内のSTFT(短時間フーリエ変換器)142は、当該BMユニット14内のSBF141-2〜141-Mの各々の出力u12(t)〜u1M(t)を短時間フーリエ変換する。これによりSTFT142は、SBF141-2〜141-Mの出力u12(t)〜u1M(t)の周波数スペクトルU12(ω)〜U1M(ω)を生成する。スペクトルU1i(ω)(i=2,…,M)は、上記式(7)で示される信号モデルに従い、次式
1i(ω)=1/2{jsinωτ(N1(ω) - Ni(ω))} (10)
のように表される。
本実施形態では、1番目のマイクロホン111-1及びi番目のマイクロホン111-iでそれぞれ観測される雑音信号N1(ω)及びNi(ω)が直接関連付けられず、それらに関する事前仮定(推定)がなされていない。このため、式(8)の周波数表現を、基本雑音低減アルゴリズムで適用される前記式(4)で示されるように公式化できないことに注目する。
雑音キャンセラ15は、フィルタユニット151と加算回路152,153とから構成される。フィルタユニット151は、フィルタ151-2〜151-Mから構成される。フィルタユニット151のフィルタ151-2〜151-Mの個数M−1が、マイクロホンアレイ11を構成するマイクロホン111-1〜111-Mの個数Mより1つ少ないことに注意する。
フィルタ151-i(i=2,…,M)は、BMユニット14内のSTFT142の出力U1i(ω)を雑音キャンセラ係数Hi(ω)によりフィルタリングし、Hi(ω)U1i(ω)を出力する。STFT142の出力U1i(ω)に対応するSBF141-iの出力(雑音基準信号)u1i(t)は、前記したように目的音声信号がブロッキング(抑圧)された信号である。しかし、SBF141-iにより、目的音声信号をブロッキングすると、つまり目的音声信号を消し去って雑音成分だけを取り出すと、雑音スペクトルに歪みが生じる。この歪みの補正(スペクトル補正)のために、U1i(ω)を雑音キャンセラ係数Hi(ω)によりフィルタリングするフィルタ151-iが用いられる。加算回路152は、各マイクロホン(チャネル)111-iに対応したフィルタ151-iの出力Hi(ω)U1i(ω)、つまりフィルタ151-2〜151-Mの出力H2(ω)U12(ω)〜HM(ω)U1M(ω)を受けて、その和H(ω)U(ω)を算出し、その和H(ω)U(ω)を雑音キャンセラ出力YNC(ω)として出力する。このYNC(ω)は、音声基準信号に含まれている雑音の評価結果としての推定された雑音スペクトル(推定雑音スペクトル)を表す。つまり加算回路152は、フィルタ151-2〜151-Mの出力H2(ω)U12(ω)〜HM(ω)U1M(ω)から推定雑音スペクトルを生成する推定雑音生成器として用いられる。Hi(ω)U1i(ω)はYNC(ω)=H(ω)U(ω)のi番目(i=2,…,M)の要素である。
さて、フィルタ151-iの雑音キャンセラ係数Hi(ω)の最適値、つまり最適フィルタ(雑音キャンセラフィルタ)H*i,opt(ω)は、雑音信号(雑音スペクトル)U1i(ω)と音声基準信号YFBF(ω)とに基づいて与える(設定する)ことができる。この最適フィルタH*i,opt(ω)は、目的(推定)雑音信号と当該フィルタH*i,opt(ω)、つまりフィルタ151-iの出力との誤差の二乗を最小にする(Least Mean Square:LMS)ように設定される。ここで、U1i(ω)は、BMユニット14(内のSBF141-i)によって目的音声信号がブロッキングされた雑音信号の周波数スペクトルである。そこで、U1i(ω)をBM出力信号と呼ぶこともある。一方、YFBF(ω)は、FBFユニット13(内のFBF132)の出力である。そこで、YFBF(ω)をFBF出力信号と呼ぶこともある。
ウィーナーの理論並びに音声基準信号YFBF(ω)及び推定雑音スペクトル(雑音キャンセラ出力)YNC(ω)の間の平均二乗誤差の最小化(Minimum Mean Square Error:MMSE)によれば、i番目のチャネルにおける最適フィルタH*i,opt(ω)は次式
*i,opt(ω)=φU1iFBF(ω)/φUi11i(ω) (11)
によって与えられる。ここで、*は共役オペレータを表し、φU1iFBF(ω)は、BM出力信号U1i(ω)及びFBF出力信号YFBF(ω)のクロス(相互)パワーのスペクトル密度(CPSD)である。またφU1i1i(ω)は、BM出力信号U1i(ω)のオート(自己)パワーのスペクトル密度(APSD)である。
FBF出力信号(音声基準信号)YFBF(ω)=S(ω) + N1(ω)に含まれている目的音声信号S(ω)と雑音N1(ω)とは無相関(零相関)、つまりφS(ω) N1(ω)=0(φs,n1(ω)=0)であると仮定できる。すると、雑音成分しか含んでいないU1i(ω)とS(ω)も無相関(零相関)、つまりφS(ω) U1i(ω)=0となる。この場合、CPSD(相互相関) φU1iFBF(ω)は次式
φU1iFBF(ω)=φU1i(S(ω) + N1(ω))=φU1i1(ω) (12)
のように表されることから、式(11)に示されるHi,opt(ω)の分子は,フィルタ151-iの入力Ui(ω)と目的雑音信号(フィルタ151-iの出力として得たい値)との相互相関となる。
上述の、雑音と目的音声信号との間の零相関φS(ω) U1i(ω)=0(φni,s(ω)=0)と各マイクロホン111-iでの雑音パワースペクトルは等しい(φni,ni(ω)=φn,n(ω))という仮定の下では、CPSD(相互相関)“φU1ii(ω)”及びAPSD(自己相関)“φU1i1i(ω)”は次式
φU1i1i(ω)=1/2{jφn,nsinωτ(1 - Γn1,ni(ω))} (13)
φU1i1i(ω)=1/2[jφn,nsin2ωτ(1 - R{Γn1,ni(ω)})] (14)
のように計算することができる。ここで、Γn1,ni(ω)は次式
Γn1,ni=φn1,ni(ω)/{φn1,n1(ω)φni,ni(ω)}1/2 (15)
で定義された1番目のマイクロホン111-1とi番目のマイクロホン111-iとの間のコヒーレンス関数である。R{Γn1,ni(ω)})は、コヒーレンス関数Γn1,ni(ω)の関数である。このコヒーレンス関数は、雑音フィールドの特性を分析する手段として、広く使用されている。つまり、CPSD(相互相関)“φU1ii(ω)”及びAPSD(自己相関)“φU1i1i(ω)”が、コヒーレンス関数を用いて定義される。
上記式(13)及び(14)で表されるφU1i1i(ω)及びφU1ii(ω)を式(11)に代入すると、次式に示す雑音キャンセラNC(雑音低減NR)のための最適フィルタ(最適NCフィルタ、最適NRフィルタ)Hi,opt(ω)
i,opt(ω)= -j(1 - Γn1,ni)/{sinωτ(1 - R{Γn1,ni(ω)}) (16)
を得ることができる。ここで、Hi,opt(ω)は上述した音声基準信号YFBF(ω)及び雑音キャンセラ出力YNC(ω)の間の平均二乗誤差の最小化(MMSE)、つまり最小二乗法(Least Mean Square:LMS)による最適解を提供し、コヒーレンス関数の関数を表すことに注意する。
このように本実施形態では、コヒーレンス関数を使用して最適フィルタHi,opt(ω)が設定される。このことは、基準のマイクロホン111-1と他のマイクロホン111-iとの間のコヒーレンス関数だけ分かれば、最適フィルタHi,opt(ω)が設計できることを表す。この最適フィルタHi,opt(ω)を適用した雑音低減アルゴリズムは、完全にコヒーレントな雑音フィールドを前提としない一般的な表現を示す。
さて、FBFユニット13(内のFBF132)によって音声基準信号YFBF(ω)=X1(ω)=S(ω) + N1(ω)が取得され、BMユニット14(内のSBF141-2〜141-M及びSTFT142)によって雑音基準信号u12(t)〜u1M(t)の周波数スペクトルU12(ω)〜U1M(ω)(U(ω)=[U12(ω),…,U1M(ω)])が取得されたものとする。また、雑音キャンセラ15内のフィルタ151-2〜151-M及び加算回路(推定雑音生成器)152によって音声基準信号YFBF(ω)に含まれている雑音の評価結果(推定雑音スペクトル)YNC(ω)が取得されたものとする。すると、雑音キャンセラ15内の加算回路153は、YFBF(ω)と、YNC(ω)の符号が反転された−YNC(ω)との和、つまりYFBF(ω)とYNC(ω)との差分Yo(ω)を、次式
o(ω)=YFBF(ω) - YNC(ω)=YFBF(ω) - H(ω)U(ω) (17)
に従って計算する。
このように、加算回路153の出力Yo(ω)は、雑音を含む音声基準信号YFBF(ω)から雑音の評価結果(推定雑音スペクトル)YNC(ω)を差し引くことにより取得される。しかも、Yo(ω)の計算に用いられるYNC(ω)は完全にコヒーレントな雑音フィールドを前提とせずに取得される。したがってYo(ω)は、非コヒーレントな雑音フィールドでも、拡散雑音フィールドでも、雑音が抑圧されたものとなる。このように加算回路153は、音声基準信号YFBF(ω)から推定雑音スペクトルYNC(ω)を除去する雑音除去器として用いられる。ISTFT16は、加算回路153の出力Yo(ω)、即ち音声基準信号YFBF(ω)から推定雑音スペクトルYNC(ω)が除去されたYo(ω)を逆フーリエ変換(逆短時間フーリエ変換)することにより、認識されるべき目的音声信号を生成する。
本実施形態で適用される雑音低減アルゴリズム(以下、本雑音低減アルゴリズムと称する)において、Yo(ω)を求めるのに用いられるH(ω)、U(ω)及びYFBF(ω)のうち、H(ω)はコヒーレンス関数に依存し、YFBF(ω)及びU(ω)はそれぞれFBFユニット13及びBMユニット14によって決定される。したがってYo(ω)はコヒーレンス関数のみに依存する。よって、コヒーレンス関数を使用して、本雑音低減アルゴリズムの性能を検討することは可能である。
以下、本雑音低減アルゴリズムの性能の理論的解析について説明する。ここでは、本雑音低減アルゴリズムの雑音低減性能を示すために使用される手段(性能評価手段)が与えられる。次に、その性能は、理論上定義された雑音フィールドでのコヒーレンス関数に基づいて検討される。
本雑音低減アルゴリズムの性能を検討するために、目的信号が存在しない場合の入力のパワースペクトル密度(PSD)とシステム出力のパワースペクトル密度との比率として、次式
NR=φx,x(ω)/φYoo(ω) (18)
に示す雑音低減性能(NR)が定義される。ここで、φx,x(ω)及びφYoo(ω)は、それぞれ、システム入力とシステム出力のPSD(パワースペクトル密度)である。
式(14),(16)及び(17)を式(18)に代入すると、複雑なコヒーレンス関数の項におけるNR(雑音低減性能)を次式
NR=1/{1 - (Σ|Hi(ω)|2φU1i1i)/((M - 1)φn,n)}
=1/{1 - (Σ|1 - Γn1,ni(ω)|2/2(1 - R{Γn1,ni(ω)}/(M - 1)} (19)
のように書き直すことができる。
ここで、Zi=|Hi(ω)|2φU1i1i)/((M - 1)φn,n))またはZi=|1 - Γn1,ni(ω)|2/2(1 - R{Γn1,ni(ω)}/(M - 1)}とすると、ΣZiはi=2〜i=MまでのZiの総和を表す。式(19)は、雑音低減性能が雑音フィールドのコヒーレンス関数にのみ依存することを示す。
以下では、理論上定義された雑音フィールドにおける本雑音低減アルゴリズムの性能を検討する。
(1) コヒーレント雑音フィールド
マイクロホンアレイ11から遠く離れたフィールドにおける点音源のようなコヒーレント雑音フィールドにおいて、コヒーレンス関数Γni,nj(ω)は次式
Γni,nj(ω)=exp(-jωδij) (20)
で与えられる。ここでδijは、i番目のマイクロホンとj番目のマイクロホンの間の時間遅れを表わす。
式(20)において、iを1に、jをiに、それぞれ置き換えて、その置き換え後の式(20)を式(16)に代入すると、最適フィルタ(最適NCフィルタ、最適NRフィルタ)のための最適解は次式
H^i,opt(ω)=1/{exp(jωδ1i/2)sinωτsin(ωδ1i/2)} (21)
で表される。
本雑音低減アルゴリズムと基本雑音低減アルゴリズムとの関係を見つけ出すために、マイクロホンアレイ11アレイが2つのマイクロホンだけからなるものと仮定する。この場合、式(21)では、時間遅れδ1iをδによって表すことができる。この式(21)を式(4)と比較すると、当該2つの式はまさしく同じであるといえる。それは次の結論を示す。
(a) 本雑音低減アルゴリズムは、完全なコヒーレント雑音フィールドでは、基本雑音低減アルゴリズムに帰着する。
(b) 本雑音低減アルゴリズムは、完全なコヒーレント雑音のためのMMSEセンスの最適解を与える。
(c) 本雑音低減アルゴリズム及び基本雑音低減アルゴリズムは2つの最小分散無歪み応答(minimum variance distortionless responds: MVDR)ビームフォーマに基づいた手法である。
式(20)を式(19)に代入すると、本雑音低減アルゴリズムの雑音低減性能NRがコヒーレント雑音フィールドでの全ての周波数で無限大に達することが分かる。
(2) 非コヒレント雑音フィールド
マイクロホン自身の雑音のような非コヒレント雑音フィールドにおいては、コヒーレンス関数は全ての周波数でゼロ(つまりΓn1,ni(ω)=0,∀ω)である。このような雑音フィールドでは、雑音は全ての周波数で約3dB低減する。
(3) 拡散雑音フィールド
拡散雑音フィールドは、反響する空間及び自動車環境のような多くの実際的なノイズ環境のための合理的なモデルであることが知られている。拡散雑音フィールドは次式
Γ(ω)=sin(ωd/c)/(ωd/c) (22)
に示すコヒーレンス関数によって特徴付けられる。ここでd及びcは、それぞれ、隣接するマイクロホン間の間隔(以下、エレメント間間隔と称する)及び音速を表わす。式(22)を式(19)に代入すると、雑音低減性能がエレメント間間隔d及びマイクロホンMの数に依存することが分かる。
図2及び図3は、図1の雑音低減システムが拡散雑音フィールドに置かれている場合における、それぞれ、異なるマイクロホンの数M及びエレメント間間隔d毎の雑音低減性能を表す。図2の例ではエレメント間間隔dは10cmに固定され、図3の例ではマイクロホンの数Mは3に固定されている。この図2及び図3は、本雑音低減アルゴリズムが低周波領域(500HZ以下の領域)を除く周波数領域で高い雑音低減能力を達成し、低周波領域(特にエレメント間間隔dが小さい場合)の中で比較的低い雑音低減能力を達成することを示す。本雑音低減アルゴリズムは、従来から知られている他の雑音低減アルゴリズムと比較して、拡散雑音フィールドでの低周波領域を除く周波数領域の雑音を低減する際にその優位性を発揮する。
次に、本雑音低減アルゴリズムの性能を評価するための実験及び結果について説明する。まず、マイクロホンアレイ11として、エレメント間間隔dが10cmの3つのマイクロホンからなる等間隔線形アレイが、自動車に搭載される。この自動車が100km/hの速度で走っている状態で、多チャネル雑音記録が全てのチャネルに亙って行われた。ここでは、ATR音声言語通信研究所のデータベースから得られる20の日本の文からなるクリーンな(雑音のない)音声信号が用いられた。この音声信号及び雑音信号は、16ビットの精度で8kHzで再サンプリングされる。本発明者らは、クリーンな音声信号及び実際の多チャネル自動車雑音信号を人為的に混合することにより、異なる広域のSNR(信号雑音比)レベル[−5,15]dBで多チャネル雑音信号を生成した。
ここでは、本雑音低減アルゴリズム、及び基本雑音低減アルゴリズムを含む他の従来の雑音低減アルゴリズムが、雑音推定精度を改善するために最も適切なマイクロホンアレイ(M=3、d=10cm)を使用して実施された。ここで、本雑音低減アルゴリズムをPRO−GSBF(a proposed noise reduction algorithm based on a generalized subtractive beamformer)と呼ぶ、基本雑音低減アルゴリズムをORG−GSBF(a original noise reduction algorithm based on a subtractive beamformer)と呼ぶ。また、基本雑音低減アルゴリズム以外の他の雑音低減アルゴリズムとして、GSCビームフォーマ(ORG−GSC)及び遅延和ビームフォーマ(DSBF)が適用された。
図4は、雑音を含む入力の種々のSNRに対する平均のセグメンタル信号雑音比(segmental SNR:SEGSNR)の実験結果を示す。図4において、特性41は、本雑音低減アルゴリズム(PRO−GSBF)を適用した場合の平均のSEGSNRを示し、特性42,43及び44は、それぞれ、他の雑音低減アルゴリズムである、ORG−SBF(基本雑音低減アルゴリズム、ORG−GSC(GSCビームフォーマ)及びDSBF(遅延和ビームフォーマ)を適用した場合の平均のSEGSNRを示す。図4から、PRO−GSBFが、最も高い音声品質に対応する最も高いSEGSNR環境を提供することは明らかである。
図5は、入力のSNRに対する平均のメル周波数ケプストラム係数(Mel Frequency Cepstral Coefficient:MFCC)距離(distance)の実験結果を示す。図5において、特性50は、基準チャネルのマイクロホンでの平均のMFCC距離を示し、特性51は、PRO−GSBFを適用した場合の平均のMFCC距離を示す。また、特性52,53及び54は、それぞれ、ORG−SBF、ORG−GSC及びDSBFを適用した場合の平均のMFCC距離を示す。図5から、PRO−GSBFが、最も低い音声歪みに対応する最も低いMFCC距離を提供することは明らかである。
本雑音低減アルゴリズムの利点は、他の従来の雑音低減アルゴリズムと比較して、自動車環境中の全てのSNRで最も高い雑音低減性能を示すことから確認される。この高い雑音低減性能は、任意の信号モデル(基本雑音低減アルゴリズムを適用する上で仮定される完全にコヒーレントな雑音フィールドを前提としない信号モデル)に基づいた一般的な差分型ビームフォーマの使用に寄与することができる。
上記実施形態では、雑音低減システム(を含む音声入力システム)が、カーナビゲーション装置用の音声認識システムに適用される場合を想定している。しかし、雑音低減システムを他の音声認識システムに適用することも可能である。
なお、本発明は、上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合せにより種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。
本発明の一実施形態に係る雑音低減システムの構成を示すブロック図。 図1の雑音低減システムが拡散雑音フィールドに置かれている場合における、異なるマイクロホンの数毎の雑音低減性能を示す図。 図1の雑音低減システムが拡散雑音フィールドに置かれている場合における、異なるエレメント間間隔毎の雑音低減性能を示す図。 本実施形態で適用される雑音低減アルゴリズムにおける種々のSNRに対する平均のセグメンタル信号雑音比(SEGSNR)の実験結果を他の従来の雑音低減アルゴリズムにおけるそれと対比して示す図。 本実施形態で適用される雑音低減アルゴリズムにおける種々のSNRに対する平均のメル周波数ケプストラム係数(MFCC)距離の実験結果を他の従来の雑音低減アルゴリズムにおけるそれと対比して示す図。
符号の説明
11…マイクロホンアレイ、12…較正器、13…固定ビームフォーマ(FBF)ユニット、14…ブロッキングマトリクス(BM)ユニット、15…雑音キャンセラ、16…逆短時間フーリエ変換器(ISTFT)、111-1〜111-M…マイクロホン、131,142…短時間フーリエ変換器(STFT)、132…固定ビームフォーマ(FBF)、141-2〜141-M…差分型ビームフォーマ(SBF)、151…フィルタユニット、151-2〜151-M…フィルタ、152…加算回路(推定雑音生成器),153…加算回路(推定雑音除去器)。

Claims (4)

  1. 雑音環境における音声認識に必要な雑音低減を含む前処理を行う雑音低減システムにおいて、
    認識すべき目的音声を含む音響を電気信号に変換して観測信号として出力するための複数のマイクロホンから構成されるマイクロホンアレイと、
    前記複数のマイクロホンから出力される観測信号に含まれている目的音声信号の到来時刻のずれを当該複数のマイクロホンのうち基準チャネルとして予め定められたマイクロホンを基準に較正する較正器と、
    前記複数のマイクロホンから出力される観測信号に対応する前記較正器による較正後の信号に基づき、前記基準チャネルに対応し且つ目的の方向とは異なる方向からの信号が抑圧された信号の周波数スペクトルを、音声基準信号の周波数スペクトルとして生成する固定ビームフォーマユニットと、
    前記複数のマイクロホンから出力される観測信号に対応する前記較正器による較正後の信号を受けて、前記基準チャネルを除く残りのマイクロホンから出力される観測信号に対応し、目的音声信号が抑圧された信号の周波数スペクトルを、雑音基準信号の周波数スペクトルとして生成するブロッキングマトリクスユニットと、
    前記ブロッキングマトリクスユニットによって生成される、前記残りのマイクロホンから出力される観測信号に対応する雑音基準信号の周波数スペクトルの歪みを、コヒーレンス関数を用いて定義された、前記雑音基準信号の周波数スペクトル及び前記音声基準信号の周波数スペクトルの相互相関と、コヒーレンス関数を用いて定義された、前記雑音基準信号の周波数スペクトルの自己相関との関係を反映した雑音キャンセラ係数を用いて補正するフィルタユニットと、
    前記フィルタユニットの出力から、前記固定ビームフォーマユニットによって生成される音声基準信号の周波数スペクトルに含まれていると推定される雑音スペクトルを生成する推定雑音生成器と、
    前記固定ビームフォーマユニットによって生成される音声基準信号の周波数スペクトルから前記推定雑音生成器によって生成される雑音スペクトルを除去する推定雑音除去器と
    を具備することを特徴とする雑音低減システム。
  2. 前記ブロッキングマトリクスユニットは、
    前記複数のマイクロホンの個数がMの場合、前記複数のマイクロホンのうち前記基準チャネルに対応するマイクホンを除く残りのM−1個のマイクロホンに対応するM−1個の差分型ビームフォーマであって、前記基準チャネルとしてのマイクロホンから出力される観測信号に対応する前記較正器による較正後の信号と、前残りのM−1個のマイクロホンから出力される観測信号に対応する前記較正器による較正後の信号とに基づき前記雑音基準信号を生成するM−1個の差分型ビームフォーマと、
    前記M−1個の差分型ビームフォーマによって生成される前記雑音信号を受けて、当該雑音信号の周波数スペクトルを生成するフーリエ変換器と
    から構成されることを特徴とする請求項1記載の雑音低減システム。
  3. 前記フィルタユニットは、前記M−1個の差分型ビームフォーマによって生成される、前記残りのマイクロホンから出力される観測信号に対応する前記雑音基準信号の周波数スペクトルを、前記雑音キャンセラ係数によりフィルタリングするM−1個のフィルタを含み、当該M−1個のフィルタの前記雑音キャンセラ係数に反映される前記相互相関及び前記自己相関は、前記基準チャネルとしてのマイクロホンと前記残りのマイクロホンとの間のコヒーレンス関数を用いて定義されることを特徴とする請求項2記載の雑音低減システム。
  4. 雑音環境における音声認識のための前処理の一部として雑音を低減するための雑音低減方法において、
    マイクロホンアレイを構成する複数のマイクロホンから出力される観測信号に含まれている目的音声信号の到来時刻のずれを当該複数のマイクロホンのうち基準チャネルとして予め定められたマイクロホンを基準に較正するステップと、
    前記複数のマイクロホンから出力される観測信号に対応する前記較正後の信号に基づき、前記基準チャネルに対応し且つ目的の方向とは異なる方向からの信号が抑圧された信号の周波数スペクトルを、音声基準信号の周波数スペクトルとして生成するステップと、
    前記複数のマイクロホンから出力される観測信号に対応する前記較正後の信号に基づき、前記基準チャネルを除く残りのマイクロホンから出力される観測信号に対応し、目的音声信号が抑圧された信号の周波数スペクトルを、雑音基準信号の周波数スペクトルとして生成するステップと、
    前記残りのマイクロホンから出力される観測信号に対応して生成される前記雑音基準信号の周波数スペクトルの歪みを、コヒーレンス関数を用いて定義された、前記雑音基準信号の周波数スペクトル及び前記音声基準信号の周波数スペクトルの相互相関と、コヒーレンス関数を用いて定義された、前記雑音基準信号の周波数スペクトルの自己相関との関係を反映した雑音キャンセラ係数を持つフィルタを用いて補正するステップと、
    前記フィルタを用いて補正された前記雑音基準信号の周波数スペクトルから、前記音声基準信号の周波数スペクトルに含まれていると推定される雑音スペクトルを生成するステップと、
    前記音声基準信号の周波数スペクトルから前記推定される雑音スペクトルを除去するステップと
    を具備することを特徴とする雑音低減方法。
JP2005338727A 2005-11-24 2005-11-24 雑音低減システム及び雑音低減方法 Active JP4096104B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005338727A JP4096104B2 (ja) 2005-11-24 2005-11-24 雑音低減システム及び雑音低減方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005338727A JP4096104B2 (ja) 2005-11-24 2005-11-24 雑音低減システム及び雑音低減方法

Publications (2)

Publication Number Publication Date
JP2007147732A true JP2007147732A (ja) 2007-06-14
JP4096104B2 JP4096104B2 (ja) 2008-06-04

Family

ID=38209245

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005338727A Active JP4096104B2 (ja) 2005-11-24 2005-11-24 雑音低減システム及び雑音低減方法

Country Status (1)

Country Link
JP (1) JP4096104B2 (ja)

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009052444A2 (en) * 2007-10-19 2009-04-23 Creative Technology Ltd Microphone array processor based on spatial analysis
KR100917460B1 (ko) 2007-08-07 2009-09-14 한국과학기술원 잡음제거 장치 및 방법
CN101964934A (zh) * 2010-06-08 2011-02-02 浙江大学 二元麦克风微阵列语音波束形成方法
KR20110021419A (ko) * 2009-08-26 2011-03-04 삼성전자주식회사 복소 스펙트럼 잡음 제거 장치 및 방법
WO2012026126A1 (ja) * 2010-08-25 2012-03-01 旭化成株式会社 音源分離装置、音源分離方法、及び、プログラム
CN102664023A (zh) * 2012-04-26 2012-09-12 南京邮电大学 一种麦克风阵列语音增强的优化方法
US8477962B2 (en) 2009-08-26 2013-07-02 Samsung Electronics Co., Ltd. Microphone signal compensation apparatus and method thereof
WO2016027680A1 (ja) * 2014-08-18 2016-02-25 ソニー株式会社 音声処理装置、音声処理方法、並びにプログラム
WO2016174491A1 (en) * 2015-04-29 2016-11-03 Intel Corporation Microphone array noise suppression using noise field isotropy estimation
JP2017040752A (ja) * 2015-08-19 2017-02-23 沖電気工業株式会社 音声判定装置、方法及びプログラム、並びに、音声信号処理装置
CN107742522A (zh) * 2017-10-23 2018-02-27 科大讯飞股份有限公司 基于麦克风阵列的目标语音获取方法及装置
WO2018219582A1 (en) * 2017-05-29 2018-12-06 Harman Becker Automotive Systems Gmbh Sound capturing
CN108962274A (zh) * 2018-07-11 2018-12-07 会听声学科技(北京)有限公司 一种语音增强方法,装置及耳机
CN112201229A (zh) * 2020-10-09 2021-01-08 百果园技术(新加坡)有限公司 一种语音处理方法、装置及系统
CN113744752A (zh) * 2021-08-30 2021-12-03 西安声必捷信息科技有限公司 语音处理方法及装置

Cited By (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8934640B2 (en) 2007-05-17 2015-01-13 Creative Technology Ltd Microphone array processor based on spatial analysis
KR100917460B1 (ko) 2007-08-07 2009-09-14 한국과학기술원 잡음제거 장치 및 방법
CN101828407A (zh) * 2007-10-19 2010-09-08 创新科技有限公司 基于空间分析的麦克风阵列处理器
WO2009052444A3 (en) * 2007-10-19 2009-06-25 Creative Tech Ltd Microphone array processor based on spatial analysis
CN105376673B (zh) * 2007-10-19 2020-08-11 创新科技有限公司 一种电子设备
CN105376673A (zh) * 2007-10-19 2016-03-02 创新科技有限公司 基于空间分析的麦克风阵列处理器
WO2009052444A2 (en) * 2007-10-19 2009-04-23 Creative Technology Ltd Microphone array processor based on spatial analysis
GB2466172A (en) * 2007-10-19 2010-06-16 Creative Tech Ltd Microphone array processor based on spatial analysis
GB2466172B (en) * 2007-10-19 2013-03-06 Creative Tech Ltd Microphone array processor based on spatial analysis
US8477962B2 (en) 2009-08-26 2013-07-02 Samsung Electronics Co., Ltd. Microphone signal compensation apparatus and method thereof
KR101581885B1 (ko) * 2009-08-26 2016-01-04 삼성전자주식회사 복소 스펙트럼 잡음 제거 장치 및 방법
KR20110021419A (ko) * 2009-08-26 2011-03-04 삼성전자주식회사 복소 스펙트럼 잡음 제거 장치 및 방법
CN101964934A (zh) * 2010-06-08 2011-02-02 浙江大学 二元麦克风微阵列语音波束形成方法
KR101339592B1 (ko) 2010-08-25 2013-12-10 아사히 가세이 가부시키가이샤 음원 분리 장치, 음원 분리 방법, 및 프로그램을 기록한 컴퓨터 판독 가능한 기록 매체
WO2012026126A1 (ja) * 2010-08-25 2012-03-01 旭化成株式会社 音源分離装置、音源分離方法、及び、プログラム
CN102664023A (zh) * 2012-04-26 2012-09-12 南京邮电大学 一种麦克风阵列语音增强的优化方法
WO2016027680A1 (ja) * 2014-08-18 2016-02-25 ソニー株式会社 音声処理装置、音声処理方法、並びにプログラム
US20170229137A1 (en) * 2014-08-18 2017-08-10 Sony Corporation Audio processing apparatus, audio processing method, and program
US10580428B2 (en) * 2014-08-18 2020-03-03 Sony Corporation Audio noise estimation and filtering
US10186278B2 (en) 2015-04-29 2019-01-22 Intel Corporation Microphone array noise suppression using noise field isotropy estimation
WO2016174491A1 (en) * 2015-04-29 2016-11-03 Intel Corporation Microphone array noise suppression using noise field isotropy estimation
JP2017040752A (ja) * 2015-08-19 2017-02-23 沖電気工業株式会社 音声判定装置、方法及びプログラム、並びに、音声信号処理装置
WO2018219582A1 (en) * 2017-05-29 2018-12-06 Harman Becker Automotive Systems Gmbh Sound capturing
US10869126B2 (en) 2017-05-29 2020-12-15 Harman Becker Automotive Systems Gmbh Sound capturing
CN107742522A (zh) * 2017-10-23 2018-02-27 科大讯飞股份有限公司 基于麦克风阵列的目标语音获取方法及装置
CN107742522B (zh) * 2017-10-23 2022-01-14 科大讯飞股份有限公司 基于麦克风阵列的目标语音获取方法及装置
CN108962274A (zh) * 2018-07-11 2018-12-07 会听声学科技(北京)有限公司 一种语音增强方法,装置及耳机
CN112201229A (zh) * 2020-10-09 2021-01-08 百果园技术(新加坡)有限公司 一种语音处理方法、装置及系统
CN113744752A (zh) * 2021-08-30 2021-12-03 西安声必捷信息科技有限公司 语音处理方法及装置

Also Published As

Publication number Publication date
JP4096104B2 (ja) 2008-06-04

Similar Documents

Publication Publication Date Title
JP4096104B2 (ja) 雑音低減システム及び雑音低減方法
CN107039045B (zh) 用于语音增强的全局优化最小二乘后滤波
JP6584930B2 (ja) 情報処理装置、情報処理方法およびプログラム
Omologo et al. Environmental conditions and acoustic transduction in hands-free speech recognition
EP2647221B1 (en) Apparatus and method for spatially selective sound acquisition by acoustic triangulation
CN110085248B (zh) 个人通信中降噪和回波消除时的噪声估计
EP1658751B1 (en) Audio input system
JP4671303B2 (ja) マイクロホンアレイ用ポストフィルタ
US5574824A (en) Analysis/synthesis-based microphone array speech enhancer with variable signal distortion
KR101239604B1 (ko) 잡음 감소를 위한 다중채널 적응형 음성 신호 처리
US8204252B1 (en) System and method for providing close microphone adaptive array processing
US8345890B2 (en) System and method for utilizing inter-microphone level differences for speech enhancement
JP5091948B2 (ja) ブラインド信号抽出
Schmalenstroeer et al. Multi-stage coherence drift based sampling rate synchronization for acoustic beamforming
JPH10207490A (ja) 信号処理装置
Song et al. An integrated multi-channel approach for joint noise reduction and dereverberation
KR20110021306A (ko) 마이크로폰의 신호 보상 장치 및 그 방법
Priyanka et al. Adaptive Beamforming Using Zelinski-TSNR Multichannel Postfilter for Speech Enhancement
Comminiello et al. A novel affine projection algorithm for superdirective microphone array beamforming
CN115932733A (zh) 声源定位及语音增强方法、装置
Ayllón et al. An evolutionary algorithm to optimize the microphone array configuration for speech acquisition in vehicles
Adcock Optimal filtering and speech recognition with microphone arrays
Li et al. A two-microphone noise reduction method in highly non-stationary multiple-noise-source environments
Pfeifenberger et al. A multi-channel postfilter based on the diffuse noise sound field
KR101537653B1 (ko) 주파수 또는 시간적 상관관계를 반영한 잡음 제거 방법 및 시스템

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070802

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20070802

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20070829

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070911

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071026

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071127

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080219

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150