JP2017191309A - ブラインド信号分離方法およびその装置 - Google Patents

ブラインド信号分離方法およびその装置 Download PDF

Info

Publication number
JP2017191309A
JP2017191309A JP2017038785A JP2017038785A JP2017191309A JP 2017191309 A JP2017191309 A JP 2017191309A JP 2017038785 A JP2017038785 A JP 2017038785A JP 2017038785 A JP2017038785 A JP 2017038785A JP 2017191309 A JP2017191309 A JP 2017191309A
Authority
JP
Japan
Prior art keywords
matrix
signal
vector
permutation
blind
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2017038785A
Other languages
English (en)
Inventor
晋哉 齋藤
Shinya Saito
晋哉 齋藤
邦夫 大石
Kunio Oishi
邦夫 大石
利博 古川
Toshihiro Furukawa
利博 古川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Publication of JP2017191309A publication Critical patent/JP2017191309A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Circuit For Audible Band Transducer (AREA)

Abstract

【課題】観測信号から未知信号源信号を推定するブラインド信号分離方法とその装置を提供する。
【解決手段】窓関数を乗算した観測信号の短時間離散フーリエ変換後、観測信号の相互スペクトル密度行列をエポック時刻毎に求め、混合行列とそのエルミート行列の積、並びに観測信号の相互スペクトル密度行列のエルミート性を利用して、それらの行列の対角要素と対角要素の下に位置する要素のみから制約条件付きフォワードモデル型最小2乗型同時対角化問題を導出する。この問題をラグランジュの未定乗数法により能率的に解法し、混合行列を推定する。次いで、混合行列の条件数と分離信号の振幅スペクトルを用いてパーミュテーションの基準周波数ビンを決定め、同一信号源から発生した信号の周波数ビン間の電力比相関性を用いてパーミュテーション問題を解法し、信号分離性能を向上させる。
【選択図】図1

Description

本発明は、未知の畳み込み混合系により混在した互いに統計的に独立な未知信号源信号を、観測信号のみから推定するブラインド信号分離方法に係わり、特に、最小2乗型同時対角化問題の解法を用いて高い精度で信号を分離することができるブラインド信号分離装置に関する。
複数の未知信号源信号が未知の畳み込み混合系により混在されて観測されるとき、観測信号を分離して混在前の未知信号源信号を推定する処理をブラインド信号分離という。ブラインド信号分離では、未知信号源信号間の統計的独立性のみを条件として、観測信号から未知信号源信号を推定する方法であり、信号源の位置或いは観測信号の到来方向の推定を必ずしも必要としない方法である。
最小2乗型同時対角化問題の解法を用いたブラインド信号分離方法が非特許文献2と特許文献1で提案されている。これらの方法は、最小2乗型同時対角化問題の解法による混合行列の推定、最小2乗型一般化逆行列を用いた混合行列からの分離行列の推定、スケーリング問題の解法、パーミュテーション問題の解法の4つの手順から成る。
周波数ビン間の電力比の相関に基づきパーミュテーション行列を推定する方法が非特許文献3で提案されている。
先行技術論文
非特許文献1
V.Maurandi and E.Moreau,“A decoupled Jacobi−like algorithm for non−unitary joint diagonalization of complex−valued matrices”,IEEE Signal Processing Letters,vol.21,no.12,pp.1453−1456,Dec.2014.
M.Rajih,P.Comon,and R.A.Harshman,"Enhanced line search:A novel method to accelerate PARAFAC",SIAM J.Matrix Anal.Appl.,vol.30,no.2,pp.1128−1147,Sep.2008. H.Sawada,S.Araki,and S.Makino,"Measuring dependence of bin−wise separated signals for permutation alignment in frequency−domain BSS"Proc.IEEE Int.Symp.Circuits Syst.,pp.3247−3250,May 2007 齋藤 晋哉、大石 邦夫、古川 利博,”ブラインド信号分離方法およびその装置”,特開2015−210512号、2015−11−24
従来のブラインド信号分離方法で使用されている最小2乗型同時対角化問題の解法は、実環境下で十分な信号分離精度を得ることができるが、解法手順が収束に要する演算量が多く、演算コストが増大することが問題となっている。
同一信号源から発生した信号の隣接周波数ビンに相関があることを利用した従来のパーミュテーション問題の解法では、経験に基づき基準周波数ビンを決めており、適切な周波数ビンが選択されたとは言えない。
同一信号源から発生した信号の隣接周波数ビンに相関があることを利用した従来のパーミュテーション問題の解法では、1度誤りが生じると、これ以降の解法が誤り続ける確率が非常に高くなる。
本発明はこのような事情を鑑みてなされたものであり、最小2乗型同時対角化問題の解法手順を用いた従来のブラインド信号分離方法の信号分離精度を損なうことなく、解法手順が収束に要する演算量の削減、更に、パーミュテーション問題の解法において、分離フィルタの出力振幅スペクトルと条件数を用いて基準周波数ビンを適切に決定することを目的とする。
このような目的に応えるために本発明(請求項1記載の発明)に係るブラインド信号分離方法は、互いに統計的に独立な未知信号源信号と未知の畳み込み混合系により、複数の未知信号源信号が混在した観測信号のみからブラインドで空間伝達関数を推定する方法であって、時間周波数領域においてエポック時刻毎に観測信号ベクトルから相互スペクトル密度行列を求め、各エポック時刻において周波数ビンの中からフロベニウスノルムが最大となる相互スペクトル密度行列を求め、そのノルムで全ての同エポック時刻の相互スペクトル密度行列を正規化した後、混合行列とそのエルミート行列の積、並びに相互スペクトル密度行列がエルミート行列であることを利用して、それらの行列の対角要素とその対角要素の下に位置する要素のみから混合行列を推定するために、正規化された相互スペクトル密度行列をベクトルに変換し、このベクトルの次元を削減し、混合行列の列ベクトルのノルムが1になることを制約条件としてフォワードモデル型最小2乗型同時対角化問題をラグランジュの未定乗数法により反復することなく解法することにより次元削減ベクトルを推定した後、ベクトルの次元を復元し、次元復元ベクトルを行列に変換することによって混合行列を推定し、一般化逆行列を用いて混合行列から分離行列を算出し、同一信号源から発生した信号の周波数ビンの電力比に相関があることを利用してパーミュテーション問題を解法するために、指定した周波数帯域における分離フィルタの出力信号の振幅スペクトルの平均値を求め、同周波数帯域における混合行列とそのエルミート行列の行列積によって求められる行列の条件数が最小となる周波数ビンにおいて、振幅スペクトルがその平均値以上となっている場合、この周波数ビンをパーミュテーション行列の推定のための基準周波数ビンに選択することを特徴とする。
本発明(請求項2記載の発明)に係るブラインド信号分離方法は、信号源信号と観測信号間の混合行列を推定する際、混合行列の列ベクトルのノルムが1になることをフォワードモデル型最小2乗型同時対角化問題の制約条件に加え、この問題をラグランジュの未定乗数を導入して反復することなく解法することにより、ベクトルの次元削減との相乗効果によって混合行列の推定に要する演算量を削減することを特徴とする。
本発明(請求項3記載の発明)に係るブラインド信号分離方法は、パーミュテーション問題の解法の際、基準周波数ビンの決定に、推定された混合行列とそのエルミート行列の行列積によって求められる行列の条件数、並びに、分離フィルタの出力信号の振幅スペクトルを使用することを特徴とする。
すなわち、本発明によれば、観測信号の空間相関行列を制約条件付き最小2乗型同時対角化問題の対象に、ラグランジュの未定乗数法によって最小2乗型同時対角化問題の近似解、即ち、混合行列を求めることができ、演算量の低減と推定性能の向上を両立させる。
また、本発明によれば、混合行列を用いた条件数に基づき分離性能を評価し、パーミュテーション問題の基準周波数ビンの選定に利用することにより、全体の信号分離性能を向上させる。
本発明によれば、時間周波数領域においてエポック時刻毎に観測信号ベクトルから相互スペクトル密度行列を求め、各エポック時刻において周波数ビンの中からフロベニウスノルムが最大と相互スペクトル密度行列を求め、そのノルムで全ての同エポック時刻の相互スペクトル密度行列を正規化した後、混合行列とそのエルミート行列の積、並びに相互スペクトル密度行列がエルミート行列であることを利用して、それらの行列の対角要素と対角要素の下に位置する要素のみから混合行列を推定するために、正規化された相互スペクトル密度行列をベクトルに変換し、このベクトルの次元を削減し、混合行列の列ベクトルのノルムが1になることを制約条件としてフォワードモデル型最小2乗型同時対角化問題に加え、ラグランジュの未定乗数法により解法することにより次元削減ベクトルを推定しているので、演算量を削減できるという効果がある。
また、本発明に係るブラインド信号分離方法及びブラインド信号分離装置では、信号源信号と観測信号間の混合行列を推定する際、混合行列の列ベクトルのノルムが1になることをフォワードモデル型最小2乗型同時対角化問題の制約条件に加え、この問題をラグランジュの未定乗数を導入して反復することなく解法することにより、少ない演算量で混合行列を推定できるという効果がある。
更に、パーミュテーション問題の解法では、パーミュテーション問題の解法の際、基準周波数ビンの決定に、推定された混合行列とそのエルミート行列の行列積によって求められる行列の条件数、並びに、分離フィルタの出力信号の振幅スペクトルを使用することで、パーミュテーション行列の割り当て正答率が向上するという効果がある。
本発明に係るブラインド信号分離方法の実施の形態を示す図である。 本発明に係るブラインド信号分離方法において最小2乗型同時対角化問題の対角化行列のラグランジェ未定乗数法の適用について説明するためのフローチャートである。 本発明に係るブラインド信号分離方法において最小2乗型同時対角化問題の対角行列の解法について説明するためのフローチャートである。 本発明に係るブラインド信号分離方法のパーミュテーション問題の解法について説明するためのフローチャートである。 本発明に係る信号分離方法の実施例1における信号源(スピーカ)とマイクロホンの位置関係を表す平面図である。 本発明に係る信号分離方法の実施例1における部屋の残響時間と信号分離性能の関係を示す図である。 実施例2における従来のパーミュテーション問題の解法によるパーミュテーション行列の割り当て結果を示す図である。 実施例2における本発明に係るブラインド信号分離方法によるパーミュテーション行列の割り当て結果を示す図である。 分離行列の推定に本発明に係るブラインド信号分離方法を使用して、パーミュテーション問題の解法には特許文献1を使用した場合と、本発明に係るブラインド信号分離方法の実施例2におけるパーミュテーション行列の割り当て正答率、信号分離性能、反復回数、音質評価を比較する図である。
本発明に係るブラインド信号分離方法の実施の形態について図面を参照して説明する。
1.畳み込み混合モデル
図1に示すように、時刻tにおいてN個の信号源11、12、…、1Nから発せられた信号源信号s(t)が畳み込み混合されてx(t)として観測される。s(t)は平均0で互いに統計的独立な非定常信号である。hij(t)は信号源1jからマイクロホン2iまでの経路の時不変なインパルス応答で、因果的で非最小位相系である。また、n(t)はマイクロホン2iに加わる平均0、分散σのガウス性白色雑音で、s(t)と統計的独立である。時刻tにおいてJ個のマイクロホン21、22、…、2Jで観測される観測信号x(t)は式(1)で表される。ここで、J≧N≧2とする。
Figure 2017191309
ここで、*は畳み込み演算を表す。
観測信号x(t)を31で短時間フーリエ変換すると、フレーム時刻mにおける観測信号は式(2)により表される。式(2)において、win(t)は窓関数、Kは短時間フーリエ変換の点数、Tは2つの重複窓間のシフトサイズ、ω=2πk/K、k=0,1,…,K−1、をそれぞれ表す。離散フーリエ変換の点数Kがhij(t)のインパルス応答長より十分に大きいとき観測信号は式(3)により近似される。ここで、hij(t)のK点離散フーリエ変換をhij(ω)、s(t)に窓関数を乗算した後、K点短時間フーリエ変換で時間周波数領域に変換したフレーム時刻mの信号源信号をs(ω,m)、同様に、n(t)に窓関数を乗算した後、K点短時間フーリエ変換で時間周波数領域に変換したフレーム時刻mの雑音をn(ω,m)とそれぞれ表記している。また、式(3)において、x(ω,m)はフレーム時刻mに各マイクロホンでの観測信号ベクトル、s(ω,m)はフレーム時刻mに各信号源信号ベクトル、混合行列H(ω)はN個の信号源からJ個のマイクロホンまでの混合行列、n(ω,m)は雑音ベクトルでそれぞれ式(4)、(7)、(5)、(8)により定義される。入手可能なエポック時刻の総数をMとすると、1≦m≦Mとなる。信号源信号の共分散行列はP(ω,m)=E[s(ω,m)s(ω,m)]∈RN×Nで、対角行列となる。E[・]と上付き添字は期待値と複素共役転置をそれぞれ表す。また、上付き添字とRN×Nは転置とN×Nの実数空間を表す。
Figure 2017191309
信号を分離するには51、52、…、5Kで周波数ビン毎に式(9)を満足する分離行列W(ω)を推定し、60で信号源の割り当てを定めるパーミュテーション行列Π(ω)∈RN×Nを決定する。周波数ビン毎に独立にΠ(ω)を決定しても信号が完全に分離する保証はなく、同一信号源から発生した信号の隣接または近接周波数ビンに相関があることを利用してパーミュテーション行列Π(ω)を決定する。
Figure 2017191309
ここで、D(ω)∈CN×Nは周波数ビン毎に異なる任意の対角行列である。
スケーリング問題とパーミュテーション問題を順に解法した後、71、72、…、7Kでx(ω,m)に左から分離行列W(ω)を乗算すると、周波数ビンωにおける分離信号y(ω,m)は式(10)で表される。尚、スケーリング問題の解法については後述する。式(10)を80で短時間逆フーリエ変換と重複加算によって時間領域に変換すると分離信号y(t)が求められる。雑音の分散σが十分に小さいとき、y(t)≒s(t)になる。尚、分離信号ベクトルy(ω,m)は式(11)により表される。
Figure 2017191309
本発明に関するブラインド信号分離方法について、図1乃至図4を参照して詳細に説明する。図2乃至図4は、図1の31における短時間フーリエ変換後、ブラインド信号分離システム40において本発明により周波数ビン毎に推定される分離行列の算出手順を示したものである。図4は、分離行列の算出後、ブラインド信号分離システム40において本発明によりパーミュテーション行列の算出手順を示したものである。
観測信号x(ω,m)の共分散行列P(ω,m)∈CJ×Jは式(12)で与えられる。式(13)の制約条件を課して式(14)を満足する対角化行列B(ω)と対角行列Λ(ω,m)を求めると、式(9)よりB(ω)とW(ω)の関係は式(15)で与えられる。ただし、CJ×JはJ×Jの複素空間を表す。
Figure 2017191309
ただし、Iは単位行列である。
2.最小2乗型同時対角化問題とその解法
観測信号x(ω,m)の共分散行列P(ω,m)の推定値P(ω,m)を正規化して、式(17)を最小にする対角化行列B(ω)と対角行列Λ(ω,m)を求める。式(17)は最小2乗型同時対角化問題の解法として知られている。
Figure 2017191309
本発明では、制約条件付き最小2乗型同時対角化問題を解法することによって混合行列B(ω)を推定した後、分離行列W(ω)を求める。次いで、対角行列Λ(ω,m)を推定するために、最小2乗法を用いて分離行列W(ω)を用いた評価量を最小化する。本発明では、混合行列と対角行列の推定を交互に繰り返す。音声は低域周波数帯にフォルマントと呼ばれる振幅スペクトルのピークを有している。この音声波形の特徴を失うことなく、式(23)によって観測信号x(ω,m)の共分散行列P(ω,m)を正規化することが、本発明の特徴の一つである。
2.1 時間周波数領域における観測信号の共分散行列の正規化
時間領域観測信号は式(18)の短時間フーリエ変換によって時間周波数領域に変換される。
Figure 2017191309
式(18)において、w(t)は窓関数、Kは短時間フーリエ変換の点数、Tは2つの重複窓間のシフトサイズ、Tはエポックサイズ、N+1は各エポックにおける総重複フレーム数でK+N≦T、1=0,1,…,Nをそれぞれ表す。
ステップS101においてエポック時刻mにおける時間周波数領域観測信号の共分散行列を式(19)によって推定される。
Figure 2017191309
混合行列B(ω)と分離行列W(ω)を縦続に接続したとき、そのインパルス応答は式(15)を最小にすることによって求められる。式(21)の評価量ζ(W(ω))をW(ω)によって微分すると、分離行列W(ω)は式(22)によって求められる。B(ωB(ω)のランクがNのときのみ、式(21)の評価量ζ(W(ω))は零になる。一方、B(ωB(ω)のランクがN未満のとき、ζ(W(ω))は零より大きくなる。そこで、制約条件‖b(ω)‖=1に制約条件rank(B(ωB(ω))=Nを付け加え、混合行列B(ω)の推定のための最小2乗型同時対角化問題を解法する。ここで、b(ω)はB(ω)のj番目の列ベクトル、‖・‖はユークリッドノルム、rank(A)は行列Aのランクをそれぞれ表す。
Figure 2017191309
ここで、‖・‖はフロベニウスノルムを表す。
ステップS102においてP(ω,m)を式(23)によって正規化する。
Figure 2017191309
2.2 対角行列の解法
(m)の推定値を使用して、式(24)のバックワード型最小2乗型同時対角化問題に最小2乗法を適用すると、対角行列Λ(m)はステップS104において式(25)で推定される。式(25)においてdiag[A]は行列Aの対角行列を表す。式(24)からはωの記述を省略している。
Figure 2017191309
ここで、γはラグランジェの未定乗数を表す。
2.3 混合行列の解法
制約条件‖b=1を課したフォワードモデル型最小2乗型同時対角化問題を周波数ビンω毎に解くことによって、対角化行列B、即ち、混合行列を求める。評価量を式(26)に示す。式(26)はフォワードモデル型最小2乗型同時対角化問題として知られている。
ベクトル表現を用いると、式(26)の評価関数は式(27)のように表現することができる。ここで、r(m)、G、d(m)、Gd(m)はそれぞれ式(28)〜(31)により表される。ただし、vec{A}は行列Aの列を積み重ねることによって行列Aを列ベ
Figure 2017191309
列Λのi番目の要素を表す。
Figure 2017191309
ステップS105においてDを式(32)によって計算すると、式(27)の制約条件付きフォワードモデル型最小2乗型同時対角化問題の近似解GはステップS106において式(34)のラグランジェの未定乗数法によって求められる。ステップS105からステップS108までの実施の形態については第3章で述べる。
Figure 2017191309
ここで、vec−1{a}はJ×1の列ベクトルaをJ×Jの行列に変換する演算を表す。また、ステップS106において計算されたDの逆行列をD−1と表記すると、dはD−1のk番目の列クトルである。
ステップS109において累乗法を1回用いて式(40)を最小にするbを算出する。次いで、ステップS110において式(41)のようにBを特異値分解する。ここで、tr[A]は行列Aのトレースを表す。
Figure 2017191309
ステップS111においてBBのランクがN未満のとき、Bを式(47)の行列によって置き換える。ここで、ステップS112において正規直交基底v,v,…,vによって張られる空間に直交する空間の正規直交基底vr+1,vr+2,…,v、同様に、ステップS113において正規直交基底u,u,…,uによって張られる空間に直交する空間の正規直交基底ur+1,ur+2,…,uがそれぞれ求められる。
Figure 2017191309
ここで、δ>0とする。ステップS114において追加される特異値δは、式(47)の右辺の√N/(√N+δN)によって条件tr[Σ]=√Nを満足するように設定される。
式(21)を最小にする分離行列は式(22)によって推定される。誤差の限界εを下回るまでGとΛ(m)の推定がステップS116において繰り返される。
3.最小2乗型同時対角化問題の次元削減法とその解法
最小2乗型同時対角化問題の解法は、対角行列と混合行列の解法から成る。混合行列の解法は対角行列の解法に比べ演算量が多いので、混合行列の推定に要する演算量の低減は、最小2乗型同時対角化問題の解法の演算量の低減に有効である。P(m)とvec−1{g}はエルミート行列であるので、P(m)とvec−1{g}の対角要素より上の要素は、P(m)とvec−1{g}の対角要素より下の要素の複素共役に等しい。この性質を利用すると、混合行列の推定に要する演算量を低減することができる。Qlow∈RJ2×J(J+1)/2とQup∈RJ2×J(J+1)/2を式(50)と式(51)によってそれぞれ定義する。
Figure 2017191309
3.1 ベクトルの次元削減
lowはP(m)とvec−1{g}の対角要素を含む下三角の要素をそれぞれ抽出し、次元を削減するために使用される。P(m)の対角要素を含む下三角の要素を取り出し、ベクトルa(m)low∈CJ(J+1)/2×1は式(52)に基づきステップS103よって生成できる。尚、式(52)と(53)は数学的にそれぞれ式(56)と(57)に等しいので、行列とベクトルの乗算を実行することなく、P(m)とbの推定値の要素を式(56)と(57)に基づき並び替えることによってa(m)low、Clow∈CJ(J+1)/2×1を算出することができる。
Figure 2017191309
3.1 対角化行列の解法
upはP(m)とvec−1{g}の上三角の要素をそれぞれ抽出し、次元を削減するために使用される。P(m)とvec−1{g}の上三角の要素を取り出し、ベクトルa(m)up∈CJ(J+1)/2×1とCup∈CJ(J+1)/2×1は式(58)と(59)にステップS103においてよって生成できる。
Figure 2017191309
lowとQupは式(61)の関係を満たす。式(64)にP(m)とvec−1{g}の対角要素を零にする行列Aを示す。aは行列Aのi行i列の対角要素を表す。Aのi行i列の対角要素aは式(64)によって与えられる。行列Aを用いると、式(58)と(59)は式(65)と(66)によってそれぞれ表現することもできる。
3.2 次元削減ベクトルを用いた評価関数
式(52)、(53)、(58)、(59)を用いると、式(27)は式(67)になる。ここで、γはラグランジェの未定乗数を表す。また、CDLS low(Clow)とCDLS up(Cup)はそれぞれ式(69)と(70)で与えられる。
Figure 2017191309
Figure 2017191309
式(69)には制約条件‖b=1が課せられる。一方、この制約条件は式(70)には課せられない。これは、式(70)はvec−1{g}の対角より上の要素に関する最小化問題であるので、対角要素における制約条件は不要となるからである。CDLS low(Clow)とCDLS up(Cup)はそれぞれClowとCupに関して最小化される。
3.3 次元削減評価関数の最小化
ステップS105においてAを式(71)によって計算すると、CDLS low(Clow)を最小にするClowはステップS107において式(72)によって推定される。
Figure 2017191309
式(75)と(76)よりClowを用いてCDLS up(Cup)を表現すると、式(77)を得る。CDLS up(Clow)をClowで偏微分して式(72)を代入すると、零ベクトルになる。即ち、CDLS low(Clow)を最小にする解はCDLS up(Clow)を最小にする複数の解の一つであるので、CDLS up(Cup)を最小化することなく、CDLS low(Clow)を最小化することによってClowの推定値を求めることができる。
Figure 2017191309
3.4 混合行列の復元
ステップS108において式(79)によってcから復元したgのvec−1{g}を式(80)に示す。式(81)と(82)を用いると、式(80)は式(83)によって表現することができる。この式の導出にあたって、式(80)の右辺第2項が式(84)によって表現できることを使用している。
Figure 2017191309
ステップS109において混合行列Bのi番目の列ベクトルは累乗法を用いて式(85)を最小化することによって求められる。
式(56)によりP(m)をa(m)lowに変換した後、式(72)によって最小化問題の解Clowを求め、式(81)、(83)、並びに(85)によって最小解Clowを混合行列の推定値bに変換することによって、次元削減ベクトルを利用して演算量を削減することが可能となる。即ち、混合行列の推定に次元削減ベクトルを導入することにより演算量を削減することができる。
4.パーミュテーション問題の解法
ステップS117において分離フィルタの出力信号の振幅スペクトルを求める。
ステップS118において指定した周波数帯域における振幅スペクトルの平均値を算出する。
ステップS119において指定した周波数帯域において、行列B(ωB(ω)の条件数が最小となる周波数ビンで、振幅スペクトルがその平均値以上となっている場合、この周波数ビンをパーミュテーション行列の推定のための基準周波数ビンに選択する。
ステップS120において式(89)に基づき、同一信号源から発生した信号の周波数ビンの電力比に相関があることを利用してパーミュテーション行列を推定する。
Figure 2017191309
ここで、Tr(・)は行列のトレースを表す。また、Qは行列の各行に1となる要素が1箇所、その他の要素は0で、1となる要素の位置が他の行と重複しない行列の集合である。
ステップS121において全周波数ビンが終了するまで、パーミュテーション行列を推定する。式(90)のように観測信号x(ω,m)にΠ(ω)W(ω)を左から乗算して分離信号y(ω,m)を得る。
4.1 評価データ
図5のように4.45×3.55×2.5メートルの部屋に4個の信号源(スピーカ)11(3.35、1.36、1.2)、12(2.83、2.81、1.2)、13(1.14、2.28、1.2)、14(1.72、0.69、1.2)を半径1.2メートルの円の円周上に、円の中心に位置する一辺が16.33センチメートルの正方形の頂点に4個のマイクロホン21(2.34、1.78、1.2)、22(2.23、1.89、1.2)、23(2.11、1.78、1.2)、24(2.23、1.66、1.2)をそれぞれ配置した。符号の後のカッコは3次元の座標を表している。尚、図5は信号源(スピーカ)とマイクロホンの位置関係を示す平面図である。部屋の残響時間は100ミリ秒から900ミリ秒に設定し、標本化周波数8kHz、量子化ビット数16ビットで信号源とマイクロホンの間のインパルス応答は人工的に発生させた。実験条件は、1000秒の音声データ、K=8192点の短時間フーリエ変換、エポック当たり重複率80%の2個のフレームの使用、窓関数にはハニング窓を用いた。マイクロホン21、22、23、24のSNRの設定方法については4.2で説明する。本発明に係るブラインド信号分離方法では、ε=ε=10−6、δ(ω)=σ(ω)を用いている。スケーリング問題は周波数ビン毎に分離行列の行ベクトルを正規化することによって解法した。C言語で作成したプログラムをインテル製コアi7−2600 3.4GHzプロセッサを用いて実行した。信号源信号からマイクロホンまでの経路は時不変のインパルス応答で、因果的で非最小位相系であるので、因果的な分離行列を実現するために、Π(ω−1D(ω−1W(ω)にe−jπkを乗算した後、逆離散フーリエ変換をして分離フィルタのインパルス応答を得た。
4.2 評価指標
ブラインド信号分離方法の信号分離性能を次の方法で評価した.式(91)によって観測信号における所望信号源信号と干渉信号の電力の比、式(92)によって出力信号における所望信号源信号と干渉信号の電力の比をそれぞれ計算し、ブラインド信号分離装置の各出力の信号分離性能を求める。各出力の平均を信号分離性能とした。−γij(t)は式(93)のΓ(ω)のi行j列の要素を、wij(t)はW(ω)の要素をそれぞれ離散逆フーリエ変換したものである。また、分離行列の推定アルゴリズムにおいて収束に要した計算時間も評価指標とする。SNRは、最適な分離行列e−jπkD(ω−1(H(ωH(ω))−1H(ωとパーミュテーション行列Πopt(ω)を使用して観測信号から信号源信号を分離した後、分離信号y(t)に含まれる雑音と干渉信号の電力と所望信号源信号の電力の比によって計算した。最適なパーミュテーション行列Πopt(ω)は式(94)によって求めた。また、非ブラインド法は、受信信号を使用して分離行列を計算した後、混合行列が入手可能であるとして、式(95)によってパーミュテーション行列を求めた。即ち、推定した分離行列に最適なパーミュテーション行列を求めることになり、ブラインド信号分離装置の性能の上限を与えることになる。
Figure 2017191309
ここで、Copt(ω)=e−jπkD(ω−1(H(ωH(ω))−1H(ωH(ω)、C(ω)=W(ω)H(ω)である。
4.3 評価対象
最小2乗型同時対角化問題の解法を用いた3種類のフォワードモデル型ブラインド信号分離方法(非特許文献1、非特許文献2、特許文献1)を比較対象とする。従来のブラインド信号分離方法(非特許文献1、非特許文献2、特許文献1)と本発明に係るブラインド信号分離方法における分離行列の推定精度を比較するため、パーミュテーション行列の推定法は共通の手法(非特許文献3)を使用した。尚、基準周波数ビンには1119Hzを用いた。
4.4 評価結果
部屋の残響時間と信号分離性能の関係を図6に示す。尚、図6においてSNRは20dBに設定している。また、太字の数字が最も優れた性能を表している。図6の信号分離性能から明らかなように、特許文献1と等しい信号分離性能(高い出力SIR)を最も短時間で得ることができた。この要因はラグランジェの未定乗数法を最小2乗型同時対角化問題に導入したこと、行列のエルミート性を利用してベクトルの次元を削減したことが貢献したと考えられる。また、非ブラインド法の出力SIR、即ち、ブラインド信号分離装置の上限に近い値を、本発明に係るブラインド信号分離装置が短い演算時間で実現できることが分かる。
5.1 評価データ
図5のように4.45×3.55×2.5メートルの部屋に4個の信号源(スピーカ)11(3.35、1.36、1.2)、12(2.83、2.81、1.2)、13(1.14、2.28、1.2)、14(1.72、0.69、1.2)を半径1.2メートルの円の円周上に配置した。次いで、円の中心に位置する一辺が16.33センチメートルの正方形の頂点に配置した4個のマイクロホン21(2.34、1.78、1.2)、22(2.23、1.89、1.2)、23(2.11、1.78、1.2)、24(2.23、1.66、1.2)に、2つのマイクロホン25,26を付け加え、それぞれ座標(2.23,1.78,1.32)、(2.23,1.78、1.09)に配置した。部屋の残響時間は900ミリ秒に設定し、標本化周波数8kHz、量子化ビット数16ビットで信号源とマイクロホンの間のインパルス応答は人工的に発生させた。実験条件は、1000秒の音声データ、K=8192点の短時間フーリエ変換、エポック当たり重複率80%の2個のフレームの使用、窓関数にはハニング窓を用いた。SNRは20dBに設定した。本発明に係るブラインド信号分離方法では、ε=ε=10−6、δ(ω)=σ(ω)、パーミュテーション問題の解法において基準周波数ビンに決定するために、1kHzから1.5kHzを周波数帯域として用いている。スケーリング問題は周波数ビン毎に分離行列の行ベクトルを正規化することによって解法した。信号源信号からマイクロホンまでの経路は時不変のインパルス応答で、因果的で非最小位相系であるので、因果的な分離行列を実現するために、Π(ω−1D(ω−1W(ω)にe−jπkを乗算した後、逆離散フーリエ変換をして分離フィルタのインパルス応答を得た。
6.2 評価指標
信号源とマイクロホンの個数が共に4である場合、式(96)に示す24種類のパーミュテーション行列の何れか1つが各周波数ビンに割り当てられる。割り当てられたパーミュテーション行列が、任意のパーミュテーション行列に一致する割合と信号分離性能を計算する。
Figure 2017191309
5.3 評価対象
同一信号源から発生した信号の周波数ビン間の電力比に相関があることを利用したパーミュテーション問題の解法(非特許文献3)を比較対象とする。従来のブラインド信号分離方法(特許文献1)と本発明に係るブラインド信号分離方法におけるパーミュテーション行列の推定精度、反復回数、分離信号の音質を比較する。
5.4 評価結果
図7と図8に各周波数ビンに割り当てられたパーミュテーション行列の番号を×印で示す。パーミュテーション行列Πとパーミュテーション行列の番号iの関係を式(96)に示している。尚、0への割り当ては、該当するパーミュテーション行列が無いことを表している。図7では、各周波数ビンでパーミュテーション行列の番号18に割り当てられると未知信号源への割り当てが揃うことになる。したがって、番号18を除く他の番号への割り当ては間違いになる。一方、図8では、各周波数ビンでパーミュテーション行列の番号15に割り当てられると未知信号源への割り当てが揃うことになる。したがって、番号15を除く他の番号への割り当ては間違いになる。低周波数帯域(0〜2kHz)と全周波数帯域におけるパーミュテーション行列の割り当て結果を図9にまとめる。本発明に係るパーミュテーション行列の推定法が特許文献1の方法に比べ正答率が向上していることが分かる。また、信号分離性能においても、本発明に係るパーミュテーション行列の推定法が高い出力SIR、分離信号の音質向上(高いPESQスコア)を達成することができた。
11〜1N…信号源、21〜2J…マイクロホン、31…短時間フーリエ変換、40…ブラインド信号分離システム、51、52、…、5K…最小2乗型同時対角化問題の解法、60…パーミュテーション問題の解法、71、72、…、7K…畳み込み演算、80…離散逆フーリエ変換と重複加算

Claims (4)

  1. 互いに統計的に独立な未知信号源信号と未知の畳み込み混合系により、複数の未知信号源信号が混在した観測信号のみからブラインドで空間伝達関数を推定する方法であって、時間周波数領域においてエポック時刻毎に観測信号ベクトルから相互スペクトル密度行列を求め、各エポック時刻において周波数ビンの中からフロベニウスノルムが最大となる相互スペクトル密度行列を求め、そのノルムで全ての同エポック時刻の相互スペクトル密度行列を正規化した後、混合行列とそのエルミート行列の積、並びに相互スペクトル密度行列がエルミート行列であることを利用して、それらの行列の対角要素とその対角要素の下に位置する要素のみから混合行列を推定するために、正規化された相互スペクトル密度行列をベクトルに変換し、このベクトルの次元を削減し、混合行列の列ベクトルのノルムが1になることを制約条件としてフォワードモデル型最小2乗型同時対角化問題をラグランジュの未定乗数法により反復することなく解法することにより次元削減ベクトルを推定した後、ベクトルの次元を復元し、次元復元ベクトルを行列に変換することによって混合行列を推定し、一般化逆行列を用いて混合行列から分離行列を算出し、同一信号源から発生した信号の周波数ビンの電力比に相関があることを利用してパーミュテーション問題を解法するために、指定した周波数帯域における分離フィルタの出力信号の振幅スペクトルの平均値を求め、同周波数帯域における混合行列とそのエルミート行列の行列積によって求められる行列の条件数が最小となる周波数ビンにおいて、振幅スペクトルがその平均値以上となっている場合、この周波数ビンをパーミュテーション行列の推定のための基準周波数ビンに選択することを特徴とするブラインド信号分離方法。
  2. 請求項1記載の最小2乗型同時対角化問題の解法を用いたブラインド信号分離方法において、信号源信号と観測信号間の混合行列を推定する際、混合行列の列ベクトルのノルムが1になることをフォワードモデル型最小2乗型同時対角化問題の制約条件に加え、この問題をラグランジュの未定乗数を導入して反復することなく解法することにより、ベクトルの次元削減との相乗効果によって混合行列の推定に要する演算量を削減することを特徴とするブラインド信号分離方法。
  3. 請求項1乃至請求項2のいずれか1項に記載の最小2乗型同時対角化問題の解法を用いたブラインド信号分離方法において、パーミュテーション問題の解法の際、基準周波数ビンの決定に、推定された混合行列とそのエルミート行列の行列積によって求められる行列の条件数、並びに、分離フィルタの出力信号の振幅スペクトルを使用することを特徴とするブラインド信号分離方法。
  4. 請求項1乃至請求項3のいずれか1項に記載のブラインド信号分離方法を用いて信号源分離を行うように構成されていることを特徴とするブラインド信号分離方法を用いたブラインド信号分離装置。
JP2017038785A 2016-04-08 2017-02-13 ブラインド信号分離方法およびその装置 Pending JP2017191309A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2016088533 2016-04-08
JP2016088533 2016-04-08

Publications (1)

Publication Number Publication Date
JP2017191309A true JP2017191309A (ja) 2017-10-19

Family

ID=60084777

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017038785A Pending JP2017191309A (ja) 2016-04-08 2017-02-13 ブラインド信号分離方法およびその装置

Country Status (1)

Country Link
JP (1) JP2017191309A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108736917A (zh) * 2018-05-09 2018-11-02 哈尔滨工业大学 一种时频协同的扩频分集接收方法及实现装置
CN109616138A (zh) * 2018-12-27 2019-04-12 山东大学 基于分段频点选择的语音信号盲分离方法和双耳助听系统
TWI665661B (zh) * 2018-02-14 2019-07-11 美律實業股份有限公司 音頻處理裝置及音頻處理方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI665661B (zh) * 2018-02-14 2019-07-11 美律實業股份有限公司 音頻處理裝置及音頻處理方法
CN108736917A (zh) * 2018-05-09 2018-11-02 哈尔滨工业大学 一种时频协同的扩频分集接收方法及实现装置
CN108736917B (zh) * 2018-05-09 2020-08-07 哈尔滨工业大学 一种时频协同的扩频分集接收方法及实现装置
CN109616138A (zh) * 2018-12-27 2019-04-12 山东大学 基于分段频点选择的语音信号盲分离方法和双耳助听系统

Similar Documents

Publication Publication Date Title
JP6288561B2 (ja) ブラインド信号分離方法およびその装置
Benesty et al. Frequency-domain blind source separation
US11257488B2 (en) Source localization method by using steering vector estimation based on on-line complex Gaussian mixture model
US20110044462A1 (en) Signal enhancement device, method thereof, program, and recording medium
Douglas et al. Scaled natural gradient algorithms for instantaneous and convolutive blind source separation
Saito et al. Convolutive blind source separation using an iterative least-squares algorithm for non-orthogonal approximate joint diagonalization
JP2017191309A (ja) ブラインド信号分離方法およびその装置
WO2015182379A1 (en) Method for estimating source signals from mixture of source signals
Wang Multi-band multi-centroid clustering based permutation alignment for frequency-domain blind speech separation
JP5509481B2 (ja) ブラインド信号分離方法およびその装置
Kubo et al. Efficient full-rank spatial covariance estimation using independent low-rank matrix analysis for blind source separation
Asaei et al. Binary sparse coding of convolutive mixtures for sound localization and separation via spatialization
Leglaive et al. Student's t source and mixing models for multichannel audio source separation
US11694707B2 (en) Online target-speech extraction method based on auxiliary function for robust automatic speech recognition
Bando et al. Weakly-Supervised Neural Full-Rank Spatial Covariance Analysis for a Front-End System of Distant Speech Recognition.
Duong et al. Spatial covariance models for under-determined reverberant audio source separation
Asamizu et al. Overdetermined blind source separation using approximate joint diagonalization
JP2019159290A (ja) 適応ブラインド信号分離方法およびその装置
Bu et al. A robust nonlinear microphone array postfilter for noise reduction
Nishikawa et al. Multistage ICA for blind source separation of real acoustic convolutive mixture
Inoue et al. Sepnet: a deep separation matrix prediction network for multichannel audio source separation
Nishikawa et al. Stable learning algorithm for blind separation of temporally correlated acoustic signals combining multistage ICA and linear prediction
Bella et al. Bin-wise combination of time-frequency masking and beamforming for convolutive source separation
Emura et al. Multi-delay sparse approach to residual crosstalk reduction for blind source separation
Saito et al. Determined and overdetermined convolutive blind source extractions by approximate joint diagonalization

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170529