JP5163435B2 - 信号処理装置およびプログラム - Google Patents
信号処理装置およびプログラム Download PDFInfo
- Publication number
- JP5163435B2 JP5163435B2 JP2008287867A JP2008287867A JP5163435B2 JP 5163435 B2 JP5163435 B2 JP 5163435B2 JP 2008287867 A JP2008287867 A JP 2008287867A JP 2008287867 A JP2008287867 A JP 2008287867A JP 5163435 B2 JP5163435 B2 JP 5163435B2
- Authority
- JP
- Japan
- Prior art keywords
- matrix
- sound
- covariance matrix
- specifying
- sound source
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Circuit For Audible Band Transducer (AREA)
Description
K. Tachibana, et. al., "Efficient Blind Source Separation Combining Closed-Form Second Order ICA and Nonclosed-Form Higher-Order ICA," International Conference on Acoustics, Speech, and Signal Processing (ICASSP), Vol. 1, pp. 45-48, Apr. 2007.
図1は、本発明の第1実施形態に係る信号処理装置のブロック図である。相互に間隔をあけて平面PL内に配置された収音機器M1および収音機器M2が信号処理装置100に接続される。収音機器M1および収音機器M2の周囲の相異なる位置には複数の音源S(S1,S2)が存在する。音源S1から放射された音SV1と音源S2から放射された音SV2との混合音が収音機器M1および収音機器M2に到達する。収音機器M1および収音機器M2の各々は、周囲の音(音源S1からの音SV1と音源S2からの音SV2との混合音)の波形を表す観測信号V(V1,V2)を生成するマイクロホンである。収音機器M1は観測信号V1を生成し、収音機器M2は観測信号V2を生成する。
Rxx(f)=E[X(t,f)X(t,f)H]
=Σ_{t}X(t,f)X(t,f)H ……(1)
E[X(t,f)]=[E[x1(t,f)] E[x2(t,f)]]H=[0 0]H ……(2)
Rxx(f)≒Rxx1(f)+Rxx2(f) ……(3)
Rxx2(f)≒Rxx(f)−Rxx1(f) ……(3a)
Rxx1(f)=σ2w1(f)w1(f)H ……(4)
Rxx(f)−σ2w1(f)w1(f)H≧0 ……(5)
遅延加算型ビームフォーマで構成されるフィルタ処理部34(図2)においては、観測信号V1の強度x1(t,f)および遅延素子341の係数w21の乗算値と、観測信号V2の強度x2(t,f)および遅延素子343の係数w22の乗算値との加算(w21x1(t,f)+w22x2(t,f))が分離信号U2として加算部345から出力される。したがって、分離信号U2は、以下の数式(6)のように、係数列w2(f)の転置(エルミート転置)行列w2(f)Hと強度x1(t,f)および強度x2(t,f)を要素とする観測ベクトルX(t,f)との乗算に相当する。
w21x1(t,f)+w22x2(t,f)=w2(f)HX(t,f) ……(6)
{w2(f)HX(t,f)}2=w2(f)HX(t,f)w2(f)HX(t,f)
=w2(f)HX(t,f)X(t,f)Hw2(f)
=w2(f)HRxx(f)w2(f) ……(7)
max{w2(f)HRxx2(f)w2(f)} ……(8a)
w2(f)Hw2(f)=1 ……(8b)
共分散行列Rxx2(f)が共分散行列Rxx(f)と共分散行列Rxx1(f)の差分に近似される(Rxx2(f)≒Rxx(f)−Rxx1(f))ことを考慮すると、前述の数式(8a)は以下の数式(8c)に変形される。
max{w2(f)H(Rxx(f)−Rxx1(f))w2(f)}
=max{w2(f)HRxx(f)w2(f)−w2(f)HRxx1(f)w2(f)} ……(8c)
max{w2(f)HRxx(f)w2(f)/w2(f)HRxx1(f)w2(f)} ……(8d)
J(w2(f))=w2(f)HRxx(f)w2(f)−λw2(f)HRxx1(f)w2(f) ……(8e)
Rxx(f)w2(f)=λRxx1(f)w2(f) ……(8f)
以上が係数列w2(f)を特定する具体的な方法である。
次に、本発明の第2実施形態を説明する。なお、以下の各形態において作用や機能が第1実施形態と同等である要素については、以上と共通の符号を付して各々の詳細な説明を適宜に省略する。図8に示すように、第2実施形態の初期値決定部22は、第1実施形態に白色化部72と有色化部74とを追加した構成である。
Rxx_white(f)=E[Rxx(f)−1/2X(t,f)X(t,f)HRxx(f)−H/2]
=I ……(9)
Rxx_white(f)=Rxx1_white(f)+Rxx2_white(f) ……(3b)
Rxx2_white(f)=Rxx_white(f)−Rxx1_white(f)
=I−Rxx1_white(f) ……(3c)
w1_white(f)=Rxx(f)−1/2w1(f)/‖Rxx(f)−1/2w1(f)‖ ……(10)
Rxx1_white(f)=w1_white(f)w1_white(f)H/{w1_white(f)H*Rxx(f)−1*w1_white(f)} ……(11)
w2(f)=Rxx(f)1/2w2_white(f) ……(12)
図10は、本発明の第3実施形態に係る信号処理装置100のブロック図である。図10に示すように、第3実施形態の信号処理装置100は、方向推定部82と移動判定部84とを第1実施形態に追加した構成である。図10の初期値決定部22(行列決定部66)は、複数回にわたって順次に初期的な分離行列W0を特定する。例えば、初期値決定部22は、所定個(例えば100個)の観測ベクトルX(t,f)を単位として、共分散行列(Rxx(f),Rxx1(f),Rxx2(f))の特定と分離行列W0の特定とを順次に実行する。
以上に例示した各形態には様々な変形が加えられる。具体的な変形の態様を例示すれば以下の通りである。なお、以下の例示から2以上の態様を任意に選択して組合せてもよい。
以上の各形態においては、所定の方向の音を強調する遅延加算型ビームフォーマをフィルタ処理部32およびフィルタ処理部34として利用したが、所定の方向の音を抑圧する(すなわち死角を形成する)死角制御型(null)ビームフォーマをフィルタ処理部32およびフィルタ処理部34として利用した構成も好適である。例えば、図2のフィルタ処理部32の加算部325およびフィルタ処理部34の加算部345を減算部に変更することで死角制御型ビームフォーマが実現される。死角制御型ビームフォーマを採用した場合、行列決定部66は、方向θ1に死角が形成されるようにフィルタ処理部32の各係数(w11,w12)を決定し、方向θ2に死角が形成されるようにフィルタ処理部34の各係数(w21,w22)を決定する。したがって、分離信号U1においては音源S1からの音SV1が抑制され(音SV2が強調され)、分離信号U2においては音源S2からの音SV2が抑制される(音SV1が強調される)。
行列特定部56が係数列w1(f)や共分散行列Rxx1(f)を特定する方法は任意である。例えば、第1実施形態においては、音源S1から採取したインパルス応答が強調されるように遅延加算型ビームフォーマ(フィルタ処理部32)の係数列w1(f)を決定したが、遅延加算型ビームフォーマに代えて、死角制御型ビームフォーマや適応型ビームフォーマを利用して係数列w1(f)を決定する構成も採用される。
以上の各形態においては、信号処理部10や学習処理部24を具備する信号処理装置100を例示したが、信号処理部10や学習処理部24を省略した信号処理装置100も実現される。信号処理装置100の行列決定部66が生成した初期的な分離行列W0を信号処理装置100とは別体の装置の学習処理部24に提供することで分離行列Wが生成される。また、学習処理部24による学習は本発明において必須ではない。すなわち、行列決定部66の生成した分離行列W0を分離行列Wとして信号処理部10が使用する構成(学習処理部24を省略した構成)も採用される。
以上の各形態においては音源S(S1,S2)が2個である場合を例示したが、3個以上の音源Sからの音を分離する場合にも本発明は適用される。行列特定部56や減次部58の動作は、音源Sの個数をN(Nは2以上の自然数)として以下のように一般化される。行列特定部56は、音源Sの方向が確定している(N−1)個の音SVの各々について共分散行列Rxx1(f)を特定する。減次部58は、行列特定部54が特定した共分散行列Rxx(f)から(N−1)個の共分散行列Rxx1(f)を減次することで、音源Sの方向が確定していない音SVの共分散行列Rxx2(f)を特定する。なお、信号処理装置100にはN個以上の収音機器Mが接続される。第3実施形態においては、N個の音源Sの各々について差分値Δ(Δ1〜ΔN)が算定され、音源Siの移動の有無が差分値Δiに応じて判定される。
Claims (9)
- 音源の方向が相違する複数の音の混合音を複数の収音機器で収音した複数の観測信号から共分散行列を特定する第1行列特定手段と、
前記複数の音のうち第1音の共分散行列を特定する第2行列特定手段と、
前記観測信号の共分散行列から前記第1音の共分散行列を減次する減次手段と
を具備する信号処理装置。 - 音源の方向が相違するN個(Nは2以上の自然数)の音の混合音を複数の収音機器で収音した複数の観測信号から共分散行列を特定する第1行列特定手段と、
前記N個の音のうち(N−1)個の第1音の共分散行列を特定する第2行列特定手段と、
前記観測信号の共分散行列から前記(N−1)個の第1音の共分散行列を減次することで、前記第1音以外の第2音の共分散行列を特定する減次手段と
を具備する信号処理装置。 - 前記第2行列特定手段は、前記第1音を強調または抑制するフィルタ処理の第1係数列と前記第1係数列の転置行列と調整係数とを乗算した前記第1音の共分散行列と、前記観測信号の共分散行列との差分が零以上となる条件のもとで前記調整係数が最大化されるように、前記第1音の共分散行列を特定する
請求項2の信号処理装置。 - 前記第2音を強調または抑制するフィルタ処理の第2系数列を前記第2音の共分散行列から特定する係数列特定手段
を具備する請求項2または請求項3の信号処理装置。 - 前記複数の観測信号を白色化する白色化手段と、
前記係数列特定手段が特定した第2係数列を有色化する有色化手段とを具備する
請求項4の信号処理装置。 - 前記第2行列特定手段は、前記第1音を強調または抑制するフィルタ処理の第1係数列と前記第1音の共分散行列とを特定し、
前記第1音と前記第2音とを分離するための分離行列を前記第1係数列および前記第2系数列から生成する行列決定手段を具備する
請求項4または請求項5の信号処理装置。 - 前記行列決定手段が決定した分離行列を初期値として学習を実行する学習処理手段
を具備する請求項6の信号処理装置。 - 前記行列決定手段は、前記分離行列を順次に生成し、
前記学習処理手段による学習後の分離行列から各音源の方向を推定する方向推定手段と、
前記行列決定手段が生成した分離行列に対応した各音源の方向と前記方向推定手段が推定した各音源の方向との相違に応じて前記各音源の移動の有無を判定する移動判定手段とを具備し、
前記学習処理手段は、前記各音源が移動したと前記移動判定手段が判定した場合に、前記行列決定手段が生成した分離行列を初期値として学習を実行し、前記各音源が移動していないと前記移動判定手段が判定した場合に、分離行列の学習を停止し、または、分離行列を初期化せずに学習を継続する
請求項7の信号処理装置。 - 音源の方向が相違する複数の音の混合音を複数の収音機器で収音した複数の観測信号から共分散行列を特定する第1行列特定処理と、
前記複数の音のうち第1音の共分散行列を特定する第2行列特定処理と、
前記観測信号の共分散行列から前記第1音の共分散行列を減次する減次処理と
をコンピュータに実行させるプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008287867A JP5163435B2 (ja) | 2008-11-10 | 2008-11-10 | 信号処理装置およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008287867A JP5163435B2 (ja) | 2008-11-10 | 2008-11-10 | 信号処理装置およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010114829A JP2010114829A (ja) | 2010-05-20 |
JP5163435B2 true JP5163435B2 (ja) | 2013-03-13 |
Family
ID=42303010
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008287867A Expired - Fee Related JP5163435B2 (ja) | 2008-11-10 | 2008-11-10 | 信号処理装置およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5163435B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP4184950A1 (en) * | 2017-06-09 | 2023-05-24 | Oticon A/s | A microphone system and a hearing device comprising a microphone system |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3878892B2 (ja) * | 2002-08-21 | 2007-02-07 | 日本電信電話株式会社 | 収音方法、収音装置、および収音プログラム |
-
2008
- 2008-11-10 JP JP2008287867A patent/JP5163435B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2010114829A (ja) | 2010-05-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2021036297A (ja) | 信号処理装置、信号処理方法、及びプログラム | |
JP5207479B2 (ja) | 雑音抑圧装置およびプログラム | |
US20170140771A1 (en) | Information processing apparatus, information processing method, and computer program product | |
EP2237271B1 (en) | Method for determining a signal component for reducing noise in an input signal | |
Wang et al. | Noise power spectral density estimation using MaxNSR blocking matrix | |
Schasse et al. | Estimation of subband speech correlations for noise reduction via MVDR processing | |
JP6724905B2 (ja) | 信号処理装置、信号処理方法、およびプログラム | |
JP5277887B2 (ja) | 信号処理装置およびプログラム | |
Kodrasi et al. | Analysis of eigenvalue decomposition-based late reverberation power spectral density estimation | |
Kodrasi et al. | EVD-based multi-channel dereverberation of a moving speaker using different RETF estimation methods | |
Huang et al. | Globally optimized least-squares post-filtering for microphone array speech enhancement | |
Habets et al. | Dereverberation | |
JP6190373B2 (ja) | オーディオ信号ノイズ減衰 | |
Hoang et al. | Multichannel speech enhancement with own voice-based interfering speech suppression for hearing assistive devices | |
JP5233772B2 (ja) | 信号処理装置およびプログラム | |
Hoang et al. | Joint maximum likelihood estimation of power spectral densities and relative acoustic transfer functions for acoustic beamforming | |
Tammen et al. | Joint estimation of RETF vector and power spectral densities for speech enhancement based on alternating least squares | |
JP5163435B2 (ja) | 信号処理装置およびプログラム | |
JP5387442B2 (ja) | 信号処理装置 | |
JP5263020B2 (ja) | 信号処理装置 | |
JP2017151216A (ja) | 音源方向推定装置、音源方向推定方法、およびプログラム | |
JP2010085733A (ja) | 音声強調システム | |
US11025324B1 (en) | Initialization of adaptive blocking matrix filters in a beamforming array using a priori information | |
JP5338395B2 (ja) | 信号処理装置およびプログラム | |
Schmid et al. | A maximum a posteriori approach to multichannel speech dereverberation and denoising |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110919 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20121114 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20121120 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20121203 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20151228 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5163435 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |