JP7375905B2

JP7375905B2 - フィルタ係数最適化装置、フィルタ係数最適化方法、プログラム

Info

Publication number: JP7375905B2
Application number: JP2022502756A
Authority: JP
Inventors: 遼太郎佐藤; 健太丹羽
Original assignee: Nippon Telegraph and Telephone Corp
Current assignee: Nippon Telegraph and Telephone Corp
Priority date: 2020-02-28
Filing date: 2020-02-28
Publication date: 2023-11-08
Anticipated expiration: 2040-02-28
Also published as: WO2021171533A1; JPWO2021171533A1; US20230088204A1

Description

本発明は、目的音強調におけるフィルタ係数を最適化する技術に関する。

特定の方角から到来する音（以下、目的音という）のみを強調し、その他の方角から到来する音（以下、非目的音という）を抑圧する信号処理手法として、マイクロホンアレイを用いたビームフォーミングがよく知られている。この手法は、電話会議システム、自動車内のコミュニケーションシステム、スマートスピーカー等で実用化されている。

ビームフォーミングに関する従来手法の多くは、何らかの制約のもとでコスト関数の最適化問題を解くことで最適なフィルタを導出していた。例えば、非特許文献１に記載のMVDR(Minimum Variance Distortionless Response)ビームフォーマは、出力信号のパワーをコスト関数としてこれを目的音源方角に対する無歪制約条件のもと最小化することで得られる。

また、非特許文献１に記載の手法のような最小分散法によるビームフォーマ設計手法として、複数の方角に強調したい音源がある状況で、複数の音源方向に対する応答に関して制約を課しつつ非目的音を抑圧するものもこれまでに提案されている。その一つに、線形拘束付最小分散型(Linearly Constrained Minimum Variance, LCMV)ビームフォーマがある（非特許文献２参照）。LCMVビームフォーマは、複数の方角に対するビームフォーマの応答に等式制約を課すことで目的音を強調しつつ、出力信号の分散を最小化することで非目的音を抑圧する。以下、LCMVビームフォーマの設計手法について詳しく説明する。

まず、種々の定義とノーテーションを導入する。以下では、信号を短時間フーリエ変換(Short-Time Fourier Transform)を行った後の時間周波数領域の値として扱う。

時間フレームの添字をt=1, …, T、周波数ビンの添字をf=1, …, Fで表す。また、ベクトルvや行列Mの複素共役転置を、v^HやM^Hのように上付きの^Hで表す。

LCMVビームフォーマの設計は、M個のマイク素子からなるマイクアレイの観測信号から、不要な音である非目的音を消去しつつ予め定めた複数の方角からの音である目的音を強調するような線形フィルタ（ビームフォーマ）を構成するというものである。時間フレームt、周波数ビンfにおけるマイクアレイのMチャンネルの観測信号をx_f,t∈C^M(f=1, …, F, t=1, …, T)とおく。ここで、音を発する信号源である音源が遠方にD個存在し、マイクアレイには事実上の平面波として到来しているという状況を仮定する。また、すべての音源とすべてのマイク素子が同一平面上にあることを仮定する。音源d (d=1, …, D)から放音されマイクアレイに時間フレームt、周波数ビンfに到来する信号をs_d,f,t∈C(d=1, …, D, f=1, …, F, t=1, …, T)とおく。音源dの音は、方角θ_dから到来するものとする。ここで、方角θ_dは既知であると仮定する。

音源dからマイクアレイのM個のマイク素子への周波数ビンfでのアレイマニフォールドベクトル（以下、方角θ_dから到来する平面波の音波に対応する周波数ビンfでのアレイマニフォールドベクトルという）をa_f,d∈C^M(f=1, …, F, d=1, …, D)とおくと、観測信号をx_f,tは、次式により表される。

ただし、n_f,t(f=1, …, F, t=1, …, T)は観測の過程で加わる雑音やその他残響・非方向性雑音からなるノイズ成分を表す。なお、アレイマニフォールドベクトルa_f,dはマイクアレイや系全体の物理的特性から、周波数ビンf毎に自動的に決まる量である。

以下、周波数ビンfでの線形フィルタをw_f∈C^M(f=1, …, F)と表し、これをビームフォーマのフィルタ係数と呼ぶ。このフィルタ係数が、ビームフォーマの動作を定める。

ビームフォーマの出力信号y_f,t(f=1, …, F, t=1, …, T)は、次式により表される。

つまり、ビームフォーマの設計とは、式(2)を満たすフィルタ係数w_f(f=1, …, F)をいかに設計するかということである。

ここで、フィルタ係数w_fとアレイマニフォールドベクトルa_f,dの内積w_f ^Ha_f,dはビームフォーマの方角θ_dに対する周波数ビンfでの応答特性を意味する。したがって、方角θ_dの音源（つまり、音源d）から到来する音を必ず一定のゲインで集音したいという状況では、次式の制約条件（無歪制約条件という）をフィルタ係数w_fに対して課すという方法がしばしば用いられる。

（ただし、f=1, …, F）
この無歪制約条件を満たしつつ、不要な音源からの信号に対するゲインができるだけ小さくなるようにフィルタ係数w_fを設定することで、音源dから到来する音の強調が達成できる。

なお、複数の音源から到来する音を同時に強調したい場合には、この無歪制約条件を複数個同時に課せばよい。

ビームフォーマには非目的音を抑圧することが要求されるため、目的音強調という制約のもと非目的音を最小化するように、フィルタ係数w_fを設定することが求められる。このことを数学的に定式化するために、非目的音の分散を表すコスト関数を定義する。このコスト関数を最小化するようにフィルタ係数を設定することで、所望のビームフォーマが設計できると期待される。

非目的音の空間相関行列R_f(f=1, …, F)をR_f:=E_t[x_f,tx_f,t ^H]と定義すると、非目的音の分散を表すコスト関数L_{MV_f}(w_f)が周波数ビンf=1, …, Fごとに定義できる。具体的には、コスト関数L_{MV_f}(w_f)は次式のようになる。

式(3)の制約条件のもと、このコスト関数L_{MV_f}(w_f)の和を最小化するように、フィルタ係数w_f(f=1, …, F)を設定することで、ビームフォーマを設計できる。このことを数式で表すと、次式の最適化問題となる。

式(5)の最適化問題を解くことにより、最適なフィルタ係数を得ることができる。

なお、式(5)の最適化問題は、周波数ビンf=1, …, Fごとに別々の最適化問題に分離することができる。つまり、式(5)の最適化問題の代わりに、周波数ビンfについて、次式の最適化問題を解くようにしてもよい。

以上説明した式(5)または式(6)の最適化問題を解くことにより、LCMVビームフォーマを設計することができる。これが従来のLCMVビームフォーマの設計手法である。

J. Capon, "High-resolution frequency-wavenumber spectrum analysis", Proceedings of the IEEE, vol.57, no.8, pp.1408-1418, Aug. 1969. 浅野太, "日本音響学会編音響テクノロジーシリーズ16 音のアレイ信号処理 -音源の定位・追跡と分離-", コロナ社, pp.86-90, 2011.

従来のLCMVビームフォーマの設計手法では、式(5)の最適化問題を解く必要がある。

しかし、式(5)の最適化問題では、隣接周波数ビン間のフィルタ係数の関係性については考慮していない、具体的には隣接周波数ビン間の位相差を小さくすることについては考慮していないため、性質のよい、安定したビームフォーマを設計することができない。

そこで本発明では、隣接周波数ビン間のフィルタ係数の関係性を考慮することにより、性質のよい、安定したビームフォーマを設計することができるフィルタ係数最適化技術を提供することを目的とする。

本発明の一態様は、Dを1以上の整数とし、D個の音源（以下、音源1、…、音源Dとする）からの音（以下、目的音という）を強調するビームフォーマのフィルタ係数w={w₁, …, w_F}（ただし、w_f(f=1, …, F、Fは1以上の整数)は周波数ビンfのフィルタ係数）の最適値w^*を計算する最適化部を含むフィルタ係数最適化装置であって、R_f(f=1, …, F)を周波数ビンfに関する前記目的音以外の音の空間相関行列、L_{MV_f}(w_f)=w_f ^HR_fw_f(f=1, …, F)をフィルタ係数w_fに関するコスト関数、θ_d(d=1, …, D)を音源dが存在する方角、a_f,d(f=1, …, F, d=1, …, D)を方角θ_dから到来する平面波の音波に対応する周波数ビンfでのアレイマニフォールドベクトル、L(w)を前記コスト関数L_{MV_f}(w_f)の和Σ_f=1 ^FL_{MV_f}(w_f)と所定の正則化項との和を用いて定義される、フィルタ係数wに関するコスト関数とし、前記最適化部は、所定の制約条件のもとでのフィルタ係数wに関する最適化問題min_wL(w)に基づいて、前記最適値w^*を計算するものであり、前記所定の正則化項は、方角θ_dに対する周波数ビンfでのビームフォーマの応答w_f ^Ha_f,d(f=1, …, F, d=1, …, D)に関する隣接周波数ビン間での位相の差分を用いて定義されるものである。

本発明の一態様は、Dを1以上の整数とし、D個の音源（以下、音源1、…、音源Dとする）からの音（以下、目的音という）を強調するビームフォーマのフィルタ係数w={w₁, …, w_F}（ただし、w_f(f=1, …, F、Fは1以上の整数)は周波数ビンfのフィルタ係数）の最適値w^*を計算する最適化部を含むフィルタ係数最適化装置であって、θ_d(d=1, …, D)を音源dが存在する方角、a_f,d(f=1, …, F, d=1, …, D)を方角θ_dから到来する平面波の音波に対応する周波数ビンfでのアレイマニフォールドベクトルとし、前記最適化部は、方角θ_dに対する周波数ビンfでのビームフォーマの応答w_f ^Ha_f,d(f=1, …, F, d=1, …, D)に関する隣接周波数ビン間での位相の差分が小さくなるように誘導することにより、前記最適値w^*を計算する。

本発明によれば、隣接周波数ビン間のフィルタ係数の関係性を考慮してフィルタ係数を最適化することにより、性質のよい、安定したビームフォーマを設計することが可能となる。

フィルタ係数最適化アルゴリズムを示す図である。潜在変数最適化アルゴリズムを示す図である。フィルタ係数最適化アルゴリズムを示す図である。フィルタ係数最適化アルゴリズムを示す図である。フィルタ係数最適化装置１００の構成を示すブロック図である。フィルタ係数最適化装置１００の動作を示すフローチャートである。最適化部１２０の構成を示すブロック図である。最適化部１２０の動作を示すフローチャートである。本発明の実施形態における各装置を実現するコンピュータの機能構成の一例を示す図である。

以下、本発明の実施の形態について、詳細に説明する。なお、同じ機能を有する構成部には同じ番号を付し、重複説明を省略する。

各実施形態の説明に先立って、この明細書における表記方法について説明する。

_（アンダースコア）は下付き添字を表す。例えば、x^y_zはy_zがxに対する上付き添字であり、x_{y_z}はy_zがxに対する下付き添字であることを表す。

また、ある文字xに対する^xや~xのような上付き添え字の”^”や”~”は、本来”x”の真上に記載されるべきであるが、明細書の記載表記の制約上、^xや~xと記載しているものである。

＜技術的背景＞
性質のよい、安定したビームフォーマを設計するために、隣接周波数ビン間のフィルタ係数の関係性を考慮したコスト項（以下、正則化項という）を利用することが考えられる。この手法では、背景技術で説明したコスト関数Σ_fL_{MV_f}(w_f)に正則化項を追加することで新たなコスト関数を導入し、この新たなコスト関数の最適化問題を解くことでフィルタ係数を決定する。隣接周波数ビン間のフィルタ係数の関係性としてフィルタ係数に関連する位相成分の周波数方向の一階差分・二階差分を用いることにすると、これらはそれぞれ位相遅延・群遅延に対応するので、これらに対応する正則化項を利用することで安定した遅延特性のフィルタが設計できると期待される。

なお、隣接周波数ビン間のフィルタ係数の関係性として、単純なフィルタ係数の差分を用いなかったのは、計算量が膨大になってしまう可能性があるためであり、この問題を回避するため、上記位相遅延・群遅延との対応を考慮し、本願発明ではフィルタ係数に関連する位相成分の差分に着目した。

《周波数方向平滑化による正則化項》
ここでは、周波数方向平滑化による正則化項として、フィルタ係数に関連する位相成分の差分を用いた正則化項を説明する。この正則化項は、ビームフォーマを構成するフィルタの群遅延や位相遅延を直接制御することを可能とする。

方角θ_dに対する周波数ビンfでのビームフォーマの応答は複素数w_f ^Ha_f,dで表される。このビームフォーマの応答w_f ^Ha_f,dの絶対値|w_f ^Ha_f,d|を振幅、偏角∠(w_f ^Ha_f,d)を位相と呼ぶ。以下、周波数方向平滑化による正則化項の例として２つの形式について示す。

（連続形式）
当該形式の正則化項の一例として、隣接周波数ビン間で位相の一階差分をとることにより定義される正則化項がある。この正則化項は次式で与えられる。

また、別の例として、隣接周波数ビン間で位相の二階差分をとることにより定義される正則化項がある。この正則化項は次式で与えられる。

ここで、式(7)、式(8)のη（ただし、ηは所定の正の数）は重みパラメータを表す。また、式(7)、式(8)に出現する|・|_2πは次式で定義されるノルムである。

つまり、|x|_2πは変数xの周期性を考慮した特殊なノルムである。

（離散形式）
当該形式の正則化項を定義するために、フィルタ係数w_fとアレイマニフォールドベクトルa_f,dに対して、ビームフォーマの応答w_f ^Ha_f,dの位相に依存し離散的な値をとる変数c_f,d(f=1, …, F, d=1, …, D)を導入する。具体的には、複素平面を、原点を中心にC個の中心角が等しい扇形に切り分けて、連続する番号1, …, Cを反時計回りで付番し、複素数w_f ^Ha_f,dが位置する扇形の番号をc_f,dとする。したがって、離散変数c_f,dは1, …, Cのいずれかの値をとる。また、フィルタ係数w_f、アレイマニフォールドベクトルa_f,dと離散変数c_f,dと間で、次式が成立する。

式(10)を満たす離散変数c_f,dを用いて、次式の正則化項を定義する。

ここで、式(11)のη（ただし、ηは所定の正の数）は重みパラメータを表す。また、式(11)に出現する|・|_Cは次式で定義されるノルムである。

つまり、|x|_Cは変数xの周期性を考慮した特殊なノルムである。

c_f=(c_f,1, …, c_f,D)とおくと、式(11)の正則化項（以下、^L_η(c_1,1, …, c_F,D)とする）は以下のように表される。

以下、LCMVビームフォーマ設計に正則化項^L_η(c_1,1, …, c_F,D)を導入した例について説明する。D個の方角θ₁, …, θ_Dのうち、1個目の方角（すなわち、方角θ₁）に特に重要な目的音が存在すると仮定し、方角θ₁に対して無歪制約条件w_f ^Ha_f,1=1(f=1, …, F)を課すことにする。すると、解くべき最適化問題は以下のようになる。

この最適化問題は、離散変数c_f(f=1, …, F)がとりうるすべての値に対してコスト関数Σ_f=1 ^FL_{MV_f}(w_f)+Σ_f=1 ^F-1^L_ηf(c_f, c_f+1)を最小化するフィルタ係数w_fの最適値を求めた後、その中でコスト関数Σ_f=1 ^FL_{MV_f}(w_f)+Σ_f=1 ^F-1^L_ηf(c_f, c_f+1)の値が最小となるものを最適値とすることで解くことができるが、実はより効率的なアルゴリズムが存在する。このアルゴリズムを図１に示す。

離散変数c_fの値を定めると、他の周波数ビンの値に依らず、離散変数c_fの値だけに応じてフィルタ係数w_fの最適値が決まるため、各周波数ビンfに対して前もってC^D個ある離散変数c_fがとりうるすべての値に対してフィルタ係数w^fを求めておくことで、当該最適化問題は離散変数c_fに関する最短経路問題に帰着される。したがって、当該最適化問題は、ダイクストラ（Dijkstra）法を適用することで高速に解くことができる。このことを利用したのが図１のアルゴリズムである。

式(15)の最適化問題では、１つの方角に対する無歪制約条件を用いたが、複数の方角に対する無歪制約条件を用いるようにしてもよい。しかし、複数の方角に対する無歪制約条件を用いるようにすると、制約が厳格になりすぎて、解が求まらないことがある。そこで、無歪制約条件を緩和することが考えられるが、この場合、非凸最適化問題になってしまうことがある。一般に、非凸最適化問題は解くのが困難である。そこで、以下では、非凸最適化問題を解く代わりに、当該問題と等価な凸最適化問題を解くことにより、フィルタ係数を最適化する手法について説明する。

まず、非凸最適化問題を、当該問題と等価な凸最適化問題に変形する方法及び変形により得られる凸最適化問題を解く方法について説明する。次に、制約条件を緩和することにより得られる非凸最適化問題へ適用した例を２つ説明する。

《非凸最適化問題と等価な凸最適化問題への変形及びその解法》
ここでは、非凸最適化問題を、当該問題と等価な凸最適化問題に変形する方法と、変形により得られる凸最適化問題を解く方法とについて説明する。以下、次式により定義される潜在変数~wに関する最適化問題を考える。

ここで、L_convexは潜在変数~wに関する強凸関数、L_d(d=1, …, D、Dは1以上の整数)は潜在変数~wに関する関数である。つまり、関数L_d(d=1, …, D)は必ずしも凸である必要はない。

一般に、式(16)の最適化問題は、非凸な関数をコスト関数とする最適化問題、すなわち、非凸最適化問題となる。先述の通り、非凸最適化問題は困難な問題であるため、ある種の近似を導入してより解きやすい凸最適化問題に帰着させることを考える。そこで、ここでは関数L_d(~w) (d=1, …, D)を複数の凸関数から構成される区分的凸関数(piecewise convex function)で近似することを考える。

以下、区分的凸関数の定義について説明する。近似対象となる関数L_d(~w) (d=1, …, D)に対して、その定義域をC個の閉凸集合である領域S_d,1, …, S_d,Cに分割する。そして、領域S_d,1, …, S_d,Cの各々で定義される関数Λ_d,c(c=1, …, C)を導入する。この新たに導入する関数Λ_d,cは領域S_d,c上で凸関数であり、領域S_d,c上で関数L_dを近似する関数である。なお、関数L_dが領域S_d,c上で凸関数である場合は、領域S_d,c上でΛ_d,c=L_dとすればよい。これにより、関数L_d(~w)は、区分的凸関数Λ_d,c(c=1, …, C)により近似的に表すことができる。なお、一般に、Cの値（つまり、関数L_dの定義域を分割する数）を大きくするほど、よりよい精度の区分的凸関数で近似することができる。

しかし、当該近似を用いると、式(16)の最適化問題による最適化対象である潜在変数に加え、最適化問題の解である最適値がどの領域に属しているかを表す離散変数が新たに最適化対象として加わり、最適化すべき変数の数が増えてしまう。ただし、離散変数を固定すると、潜在変数に対しては最適化問題が（非凸最適化ではなく）凸最適化に帰着されるため、比較的容易に解くことができる。以下、具体的に説明する。近似を用いて定式化される最適化問題は、c_d(d=1, …, D)を1, …, Cを値にとる離散変数として、次式により表される。

式(17)は次式と等価である。

式(18)に含まれるmin_~w(L_convex(~w)+Σ_d=1 ^DΛ_{d,c_d}(~w))は、潜在変数~wに関する凸最適化問題であり、比較的容易に解くことができる。以下、その手順について説明する。まず、離散変数(c₁, …, c_D)がとり得るすべての値に対して、凸最適化問題min_~w(L_convex(~w)+Σ_d=1 ^DΛ_{d,c_d}(~w))を解く。これにより、C^D個の離散変数(c₁, …, c_D)がとり得るすべての値について凸最適化問題min_~w(L_convex(~w)+Σ_d=1 ^DΛ_{d,c_d}(~w))の解が求まる。そして、得られた凸最適化問題の解のうち、コスト関数L_convex(~w)+Σ_d=1 ^DΛ_{d,c_d}(~w)の値が最小となるものを最適値とする。これにより、式(18)の最適化問題を解くことができる。この解法の手順を図示したものが図２である。

式(16)の非凸最適化問題は、これと等価な式(18)の凸最適化問題に変形でき、式(18)の凸最適化問題は、図２の潜在変数最適化アルゴリズムにより解くことができる。

《適用例》
ここでは、上記説明した、非凸最適化問題を凸最適化問題に変形したうえで最適値を求める汎用的な枠組みを、式(3)の制約条件を緩和することにより得られる非凸最適化問題へ適用した例について説明する。

先述の通り、非特許文献１の従来技術では、等式制約である式(3)を多数課すため、適切なフィルタ係数が得られないというおそれがあった。そこで、現実の状況に適した、より緩い制約条件を用いることを考える。具体的には、式(3)の制約条件の代わりに、ビームフォーマの応答の振幅にのみ制約を課す制約条件（つまり、位相に関する制約がない制約条件）を用いることを考える。例えば、次式を用いることができる。

また、別の例として、次式を用いることもできる。

式(19)の制約条件、式(20)の制約条件は、それぞれビームフォーマの応答の振幅が一定値（具体的には1）であるという制約、ビームフォーマの応答の振幅が一定値（具体的には1）以上であればよいという制約を表す。式(19)の制約条件、式(20)の制約条件は、いずれも数学的には非凸な制約として分類されるものである。

以下、式(20)を制約条件とする最適化問題について考える。式(20)の制約条件は、複素数w_f ^Ha_f,dの絶対値が1以上であるというものである。これは、幾何学的には、複素数w_f ^Ha_f,dが複素平面上で単位円上かその外側に位置しなければならないということを意味する。そこで、まず、複素平面を、原点を中心にC個の扇形に等分する。このC個の扇形が、先ほどのC個の領域に相当する。そして、各扇形の境界と内側において、元の制約である式(20)をC個の凸関数で近似する。

以下、具体的に説明する。周波数ビンf(f=1, …, F)、音源d(d=1, …, D)に対して離散変数c_f,dを1, …, Cを値にとる変数とする。また、γ_f,d=w_f ^Ha_f,dとする。周波数ビンf(f=1, …, F)、音源d(d=1, …, D)に対して定義される凸関数Λ_{(f,d),c_f,d}(γ_f,d)(c_f,d=1, …, C)は、複素数γ_f,dの値を、複素平面上の中心角2π/Cで原点を中心とする扇形の内側かつ|γ_f,d|≧1を満たす範囲にあるように制限するものとして定義する。そして、C個の凸関数Λ_{(f,d),c_f,d}(γ_f,d)(c_f,d=1, …, C)を用いた区分的凸関数で式(20)を近似する。

例えば、関数Λ_{(f,d),c_f,d}を次式で表される関数とすることができる。

ここで、R(z)は複素数zの実部を表す。

なお、Cの値を大きくすると、より精度よく近似できるようになるが、図２のアルゴリズムを用いて最適化問題を解く場合、離散変数のすべての組合せを調べる必要があるため、計算量が増大する。

以上より、式(20)を制約条件とするフィルタ係数最適化問題は次式の凸最適化問題に帰着する。

ここで、c_f=(c_f,1, …, c_f,D)である。

この最適化問題は、図２の潜在変数最適化アルゴリズムを適用することで解くことができるものであり、そのアルゴリズムを図３に示す。つまり、図３は、図２の潜在変数最適化アルゴリズムに基づいて得られるフィルタ係数最適化アルゴリズムを示す。

《適用例２》
ここでは、制約条件|w_f ^Ha_f,d|≧1(f=1, …, F, d=1, …, D)のもとでコスト関数Σ_f=1 ^FL_{MV_f}(w_f)+Σ_f=1 ^F-1^L_ηf(c_f, c_f+1)を用いて定義されるフィルタ係数wの最適化問題を考える。この問題は、制約条件w_f ^Ha_f,d=1(f=1, …, F, d=1, …, D)を制約条件|w_f ^Ha_f,d|≧1(f=1, …, F, d=1, …, D)とすることにより得られる非凸最適化問題である。

《周波数方向平滑化による正則化項》で定義した離散変数c_f,dと《適用例》で定義した離散変数c_f,dは、同じ意味であることに留意すると、上記非凸最適化問題は以下の凸最適化問題に帰着する。

式(23)の最適化問題も、式(15)の最適化問題と同様、ダイクストラ法を適用することで高速に解くことができる。そのアルゴリズムを図４に示す。

＜第１実施形態＞
フィルタ係数最適化装置１００は、M個（ただし、Mは1以上の整数）のマイク素子からなるマイクアレイを用いて、D個（ただし、Dは1以上の整数）の音源（以下、音源1、…、音源Dとする）からの音（以下、目的音という）を観測した信号（観測信号）から、目的音を強調するビームフォーマのフィルタ係数w={w₁, …, w_F}（ただし、w_f(f=1, …, F、Fは1以上の整数)は周波数ビンfのフィルタ係数）の最適値w^*を計算する。観測信号はフィルタ係数の最適化に用いる入力データであるため、以下、観測信号のことを最適化用データということにする。

以下、図５～図６を参照してフィルタ係数最適化装置１００を説明する。図５は、フィルタ係数最適化装置１００の構成を示すブロック図である。図６は、フィルタ係数最適化装置１００の動作を示すフローチャートである。図５に示すようにフィルタ係数最適化装置１００は、セットアップデータ計算部１１０と、最適化部１２０と、記録部１９０を含む。記録部１９０は、フィルタ係数最適化装置１００の処理に必要な情報を適宜記録する構成部である。記録部１９０は、例えば、最適化対象となるフィルタ係数を記録する。

図６に従いフィルタ係数最適化装置１００の動作について説明する。

Ｓ１１０において、セットアップデータ計算部１１０は、最適化用データを用いて、フィルタ係数wを最適化する際に用いるセットアップデータを計算する。フィルタ係数wを最適化するためにコスト関数を用いる場合、セットアップデータとして、例えば、観測信号に基づいて得られる、周波数ビンfに関する目的音以外の音の空間相関行列R_f(f=1, …, F)、音源dが存在する方角θ_d(d=1, …, D)から到来する平面波の音波に対応する周波数ビンfでのアレイマニフォールドベクトルa_f,d(f=1, …, F, d=1, …, D)がある。

Ｓ１２０において、最適化部１２０は、Ｓ１１０で生成したセットアップデータを用いてフィルタ係数wの最適値w^*を計算する。例えば、最適化部１２０は、所定の制約条件のもとでのフィルタ係数wに関する最適化問題min_wL(w)に基づいて、最適値w^*を計算することができる。ここで、L_{MV_f}(w_f)=w_f ^HR_fw_f(f=1, …, F)をフィルタ係数w_fに関するコスト関数とし、関数L(w)は関数L_{MV_f}(w_f)の和Σ_f=1 ^FL_{MV_f}(w_f)と所定の正則化項との和を用いて定義される、フィルタ係数wに関するコスト関数である。また、所定の正則化項とは、方角θ_dに対する周波数ビンfでのビームフォーマの応答w_f ^Ha_f,d(f=1, …, F, d=1, …, D)に関する隣接周波数ビン間での位相の差分を用いて定義される正則化項のことである。

正則化項の例をいくつか挙げる。ここで、ηは所定の正の数であり、∠(w_f ^Ha_f,d) (f=1, …, F, d=1, …, D)は方角θ_dに対する周波数ビンfでのビームフォーマの応答w_f ^Ha_f,dの位相を表すものとする。

１つ目の例として、ηΣ_f=1 ^F-1Σ_d=1 ^D|∠(w_f ^Ha_f,d)-∠(w_f+1 ^Ha_f+1,d)|_2πがある。２つ目の例として、ηΣ_f=1 ^F-2Σ_d=1 ^D|∠(w_f ^Ha_f,d)-2∠(w_f+1 ^Ha_f+1,d)+∠(w_f+2 ^Ha_f+2,d)|_2πがある。

そして、３つ目の例として、ηΣ_f=1 ^F-1Σ_d=1 ^D|c_f,d-c_f+1,d|_Cがある。ここで、Cは1以上の整数であり、c_f,d(f=1, …, F, d=1, …, D)は位相∠(w_f ^Ha_f,d)に対して∠(w_f ^Ha_f,d)∈[2π(c_f,d-1)/C, 2πc_f,d/C]が成立する1, …, Cのいずれかを値にとる離散変数である。

以下、正則化項として３つ目の例を用いる場合について説明する。この場合、制約条件の例として、次式により表現されるものがある。

（ただし、f=1, …, F）
また、制約条件の別の例として、次式により表現されるものがある。

（ただし、f=1, …, F, d=1, …, D）
以下、最適化部１２０が制約条件(*)のもとでコスト関数L_{MV_f}(w_f)の和Σ_f=1 ^FL_{MV_f}(w_f)と正則化項ηΣ_f=1 ^F-1Σ_d=1 ^D|c_f,d-c_f+1,d|_Cとの和を用いて定義されるコスト関数の最適化問題を解く場合（場合１）と、最適化部１２０が制約条件(**)のもとでコスト関数L_{MV_f}(w_f)の和Σ_f=1 ^FL_{MV_f}(w_f)と正則化項ηΣ_f=1 ^F-1Σ_d=1 ^D|c_f,d-c_f+1,d|_Cとの和を用いて定義されるコスト関数の最適化問題を解く場合（場合２）について説明する。

（場合１）
以下、図７～図８を参照して、最適化部１２０について説明する。図７は、最適化部１２０の構成を示すブロック図である。図８は、最適化部１２０の動作を示すフローチャートである。図７に示すように最適化部１２０は、初期化部１２１、候補計算部１２２、最適値決定部１２３を含む。

図８に従い最適化部１２０の動作について説明する。ここで、c_f=(c_f,1, …, c_f,D) (f=1, …, F)を離散変数c_f,1, …, c_f,Dにより定義される離散変数とする。

Ｓ１２１において、初期化部１２１は、次式により、α₀[c_f](f=1, …, F)を初期化する。

Ｓ１２２において、候補計算部１２２は、周波数ビンfごとに、離散変数c_fがとり得るすべての値に対して、α_f[c_f]を計算し、変数c_optの値をc_opt=argmin_cα_F[c]とする。

（ただし、^L_ηf(c_f, c_f+1)=ηΣ_d=1 ^D|c_f,d-c_f+1,d|_C）
Ｓ１２３において、最適値決定部１２３は、Ｓ１２２で計算した変数c_optの値を入力とし、周波数ビンfに対して、Fから1まで降順に、次式によりフィルタ係数w_fの最適値w_f ^*と変数c_optの値を計算し、w^*={w₁ ^*, …, w_F ^*}により最適値w^*を得る。

（場合２）
この場合、最適化部１２０が、制約条件(**)のもとで最適化問題を解く代わりに、フィルタ係数w、離散変数c₁, …, c_Fに関する最適化問題min_{{c_f,w_f}}(Σ_f=1 ^FL_{MV_f}(w_f)+Σ_f=1 ^FΣ_d=1 ^DΛ_{(f,d),c_f,d}(w_f ^Ha_f,d)+ηΣ_f=1 ^F-1Σ_d=1 ^D|c_f,d-c_f+1,d|_C)を解くことにより最適値w^*を計算してもよい。ここで、c_f=(c_f,1, …, c_f,D) (f=1, …, F)は離散変数c_f,1, …, c_f,Dにより定義される離散変数、Λ_{(f,d),c_f,d}(f=1, …, F, d=1, …, D)は次式で定義される変数γ_f,dに関する関数（ただし、γ_f,d=w_f ^Ha_f,d）である。

以下、図７～図８を参照して、最適化部１２０について説明する。図７は、最適化部１２０の構成を示すブロック図である。図８は、最適化部１２０の動作を示すフローチャートである。図７に示すように最適化部１２０は、初期化部１２１、候補計算部１２２、最適値決定部１２３を含む。

図８に従い最適化部１２０の動作について説明する。

以上まとめると、最適化部１２０は、方角θ_dに対する周波数ビンfでのビームフォーマの応答w_f ^Ha_f,d(f=1, …, F, d=1, …, D)に関する隣接周波数ビン間での位相の差分が小さくなるように誘導することにより、最適値w^*を計算するものであるといえる。

本発明の実施形態によれば、隣接周波数ビン間のフィルタ係数の関係性を考慮してフィルタ係数を最適化することにより、性質のよい、安定したビームフォーマを設計することが可能となる。

＜補記＞
図９は、上述の各装置を実現するコンピュータの機能構成の一例を示す図である。上述の各装置における処理は、記録部２０２０に、コンピュータを上述の各装置として機能させるためのプログラムを読み込ませ、制御部２０１０、入力部２０３０、出力部２０４０などに動作させることで実施できる。

本発明の装置は、例えば単一のハードウェアエンティティとして、キーボードなどが接続可能な入力部、液晶ディスプレイなどが接続可能な出力部、ハードウェアエンティティの外部に通信可能な通信装置（例えば通信ケーブル）が接続可能な通信部、ＣＰＵ（Central Processing Unit、キャッシュメモリやレジスタなどを備えていてもよい）、メモリであるＲＡＭやＲＯＭ、ハードディスクである外部記憶装置並びにこれらの入力部、出力部、通信部、ＣＰＵ、ＲＡＭ、ＲＯＭ、外部記憶装置の間のデータのやり取りが可能なように接続するバスを有している。また必要に応じて、ハードウェアエンティティに、ＣＤ－ＲＯＭなどの記録媒体を読み書きできる装置（ドライブ）などを設けることとしてもよい。このようなハードウェア資源を備えた物理的実体としては、汎用コンピュータなどがある。

ハードウェアエンティティの外部記憶装置には、上述の機能を実現するために必要となるプログラムおよびこのプログラムの処理において必要となるデータなどが記憶されている（外部記憶装置に限らず、例えばプログラムを読み出し専用記憶装置であるＲＯＭに記憶させておくこととしてもよい）。また、これらのプログラムの処理によって得られるデータなどは、ＲＡＭや外部記憶装置などに適宜に記憶される。

ハードウェアエンティティでは、外部記憶装置（あるいはＲＯＭなど）に記憶された各プログラムとこの各プログラムの処理に必要なデータが必要に応じてメモリに読み込まれて、適宜にＣＰＵで解釈実行・処理される。その結果、ＣＰＵが所定の機能（上記、…部、…手段などと表した各構成部）を実現する。

本発明は上述の実施形態に限定されるものではなく、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。また、上記実施形態において説明した処理は、記載の順に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されるとしてもよい。

既述のように、上記実施形態において説明したハードウェアエンティティ（本発明の装置）における処理機能をコンピュータによって実現する場合、ハードウェアエンティティが有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記ハードウェアエンティティにおける処理機能がコンピュータ上で実現される。

この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。具体的には、例えば、磁気記録装置として、ハードディスク装置、フレキシブルディスク、磁気テープ等を、光ディスクとして、ＤＶＤ（Digital Versatile Disc）、ＤＶＤ－ＲＡＭ（Random Access Memory）、ＣＤ－ＲＯＭ（Compact Disc Read Only Memory）、ＣＤ－Ｒ（Recordable）／ＲＷ（ReWritable）等を、光磁気記録媒体として、ＭＯ（Magneto-Optical disc）等を、半導体メモリとしてＥＥＰ－ＲＯＭ（Electronically Erasable and Programmable-Read Only Memory）等を用いることができる。

また、このプログラムの流通は、例えば、そのプログラムを記録したＤＶＤ、ＣＤ－ＲＯＭ等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。

このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。そして、処理の実行時、このコンピュータは、自己の記憶装置に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるＡＳＰ（Application Service Provider）型のサービスによって、上述の処理を実行する構成としてもよい。なお、本形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの（コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等）を含むものとする。

また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、ハードウェアエンティティを構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。

上述の本発明の実施形態の記載は、例証と記載の目的で提示されたものである。網羅的であるという意思はなく、開示された厳密な形式に発明を限定する意思もない。変形やバリエーションは上述の教示から可能である。実施形態は、本発明の原理の最も良い例証を提供するために、そして、この分野の当業者が、熟考された実際の使用に適するように本発明を色々な実施形態で、また、色々な変形を付加して利用できるようにするために、選ばれて表現されたものである。すべてのそのような変形やバリエーションは、公正に合法的に公平に与えられる幅にしたがって解釈された添付の請求項によって定められた本発明のスコープ内である。

Claims

Dを1以上の整数とし、
D個の音源（以下、音源1、…、音源Dとする）からの音（以下、目的音という）を強調するビームフォーマのフィルタ係数w={w₁, …, w_F}（ただし、w_f(f=1, …, F、Fは1以上の整数)は周波数ビンfのフィルタ係数）の最適値w^*を計算する最適化部を含むフィルタ係数最適化装置であって、
R_f(f=1, …, F)を周波数ビンfに関する前記目的音以外の音の空間相関行列、L_{MV_f}(w_f)=w_f ^HR_fw_f(f=1, …, F)をフィルタ係数w_fに関するコスト関数、θ_d(d=1, …, D)を音源dが存在する方角、a_f,d(f=1, …, F, d=1, …, D)を方角θ_dから到来する平面波の音波に対応する周波数ビンfでのアレイマニフォールドベクトル、L(w)を前記コスト関数L_{MV_f}(w_f)の和Σ_f=1 ^FL_{MV_f}(w_f)と所定の正則化項との和を用いて定義される、フィルタ係数wに関するコスト関数とし、
前記最適化部は、所定の制約条件のもとでのフィルタ係数wに関する最適化問題min_wL(w)に基づいて、前記最適値w^*を計算するものであり、
前記所定の正則化項は、方角θ_dに対する周波数ビンfでのビームフォーマの応答w_f ^Ha_f,d(f=1, …, F, d=1, …, D)に関する隣接周波数ビン間での位相の差分を用いて定義されるものである
フィルタ係数最適化装置。
請求項１に記載のフィルタ係数最適化装置であって、
ηを所定の正の数、∠(w_f ^Ha_f,d) (f=1, …, F, d=1, …, D)を方角θ_dに対する周波数ビンfでのビームフォーマの応答w_f ^Ha_f,dの位相とし、
前記所定の正則化項は、ηΣ_f=1 ^F-1Σ_d=1 ^D|∠(w_f ^Ha_f,d)-∠(w_f+1 ^Ha_f+1,d)|_2πまたはηΣ_f=1 ^F-2Σ_d=1 ^D|∠(w_f ^Ha_f,d)-2∠(w_f+1 ^Ha_f+1,d)+∠(w_f+2 ^Ha_f+2,d)|_2πである
ことを特徴とするフィルタ係数最適化装置。
請求項１に記載のフィルタ係数最適化装置であって、
ηを所定の正の数、Cを1以上の整数、∠(w_f ^Ha_f,d) (f=1, …, F, d=1, …, D)を方角θ_dに対する周波数ビンfでのビームフォーマの応答w_f ^Ha_f,dの位相、c_f,d(f=1, …, F, d=1, …, D)を位相∠(w_f ^Ha_f,d)に対して∠(w_f ^Ha_f,d)∈[2π(c_f,d-1)/C, 2πc_f,d/C]が成立する1, …, Cのいずれかを値にとる離散変数とし、
前記所定の正則化項は、ηΣ_f=1 ^F-1Σ_d=1 ^D|c_f,d-c_f+1,d|_Cである
ことを特徴とするフィルタ係数最適化装置。
請求項３に記載のフィルタ係数最適化装置であって、
前記所定の制約条件は、次式により表現されるものである

（ただし、f=1, …, F）
ことを特徴とするフィルタ係数最適化装置。
請求項３に記載のフィルタ係数最適化装置であって、
前記所定の制約条件は、次式により表現されるものである

（ただし、f=1, …, F, d=1, …, D）
ことを特徴とするフィルタ係数最適化装置。
請求項４に記載のフィルタ係数最適化装置であって、
c_f=(c_f,1, …, c_f,D) (f=1, …, F)を離散変数c_f,1, …, c_f,Dにより定義される離散変数とし、
前記最適化部は、
周波数ビンfごとに、離散変数c_fがとり得るすべての値に対して、次式によりα_f[c_f]を計算し、変数c_optの値をc_opt=argmin_cα_F[c]とする候補計算部と、

（ただし、^L_ηf(c_f, c_f+1)=ηΣ_d=1 ^D|c_f,d-c_f+1,d|_C）
周波数ビンfに対して、Fから1まで降順に、次式によりフィルタ係数w_fの最適値w_f ^*と変数c_optの値を計算し、w^*={w₁ ^*, …, w_F ^*}により前記最適値w^*を得る最適値決定部とを含む

ことを特徴とするフィルタ係数最適化装置。
請求項５に記載のフィルタ係数最適化装置であって、
c_f=(c_f,1, …, c_f,D) (f=1, …, F)を離散変数c_f,1, …, c_f,Dにより定義される離散変数、Λ_{(f,d),c_f,d}(f=1, …, F, d=1, …, D)を次式で定義される変数γ_f,dに関する関数（ただし、γ_f,d=w_f ^Ha_f,d）とし、

前記最適化部は、前記最適化問題min_wL(w)を解く代わりに、フィルタ係数w、離散変数c₁, …, c_Fに関する最適化問題min_{{c_f,w_f}}(Σ_f=1 ^FL_{MV_f}(w_f)+Σ_f=1 ^FΣ_d=1 ^DΛ_{(f,d),c_f,d}(w_f ^Ha_f,d)+ηΣ_f=1 ^F-1Σ_d=1 ^D|c_f,d-c_f+1,d|_C)を解くことにより前記最適値w^*を計算する
ことを特徴とするフィルタ係数最適化装置。
請求項７に記載のフィルタ係数最適化装置であって、
前記最適化部は、
周波数ビンfごとに、離散変数c_fがとり得るすべての値に対して、次式によりα_f[c_f]を計算し、変数c_optの値をc_opt=argmin_cα_F[c]とする候補計算部と、

（ただし、^L_ηf(c_f, c_f+1)=ηΣ_d=1 ^D|c_f,d-c_f+1,d|_C）
周波数ビンfに対して、Fから1まで降順に、次式によりフィルタ係数w_fの最適値w_f ^*と変数c_optの値を計算し、w^*={w₁ ^*, …, w_F ^*}により前記最適値w^*を得る最適値決定部とを含む

ことを特徴とするフィルタ係数最適化装置。
Dを1以上の整数とし、
D個の音源（以下、音源1、…、音源Dとする）からの音（以下、目的音という）を強調するビームフォーマのフィルタ係数w={w₁, …, w_F}（ただし、w_f(f=1, …, F、Fは1以上の整数)は周波数ビンfのフィルタ係数）の最適値w^*を計算する最適化部を含むフィルタ係数最適化装置であって、
θ_d(d=1, …, D)を音源dが存在する方角、a_f,d(f=1, …, F, d=1, …, D)を方角θ_dから到来する平面波の音波に対応する周波数ビンfでのアレイマニフォールドベクトルとし、
前記最適化部は、方角θ_dに対する周波数ビンfでのビームフォーマの応答w_f ^Ha_f,d(f=1, …, F, d=1, …, D)に関する隣接周波数ビン間での位相の差分が小さくなるように誘導することにより、前記最適値w^*を計算する
フィルタ係数最適化装置。
Dを1以上の整数とし、
フィルタ係数最適化装置が、D個の音源（以下、音源1、…、音源Dとする）からの音（以下、目的音という）を強調するビームフォーマのフィルタ係数w={w₁, …, w_F}（ただし、w_f(f=1, …, F、Fは1以上の整数)は周波数ビンfのフィルタ係数）の最適値w^*を計算する最適化ステップを含むフィルタ係数最適化方法であって、
R_f(f=1, …, F)を周波数ビンfに関する前記目的音以外の音の空間相関行列、L_{MV_f}(w_f)=w_f ^HR_fw_f(f=1, …, F)をフィルタ係数w_fに関するコスト関数、θ_d(d=1, …, D)を音源dが存在する方角、a_f,d(f=1, …, F, d=1, …, D)を方角θ_dから到来する平面波の音波に対応する周波数ビンfでのアレイマニフォールドベクトル、L(w)を前記コスト関数L_{MV_f}(w_f)の和Σ_f=1 ^FL_{MV_f}(w_f)と所定の正則化項との和を用いて定義される、フィルタ係数wに関するコスト関数とし、
前記最適化ステップは、所定の制約条件のもとでのフィルタ係数wに関する最適化問題min_wL(w)に基づいて、前記最適値w^*を計算するものであり、
前記所定の正則化項は、方角θ_dに対する周波数ビンfでのビームフォーマの応答w_f ^Ha_f,d(f=1, …, F, d=1, …, D)に関する隣接周波数ビン間での位相の差分を用いて定義されるものである
フィルタ係数最適化方法。
Dを1以上の整数とし、
フィルタ係数最適化装置が、D個の音源（以下、音源1、…、音源Dとする）からの音（以下、目的音という）を強調するビームフォーマのフィルタ係数w={w₁, …, w_F}（ただし、w_f(f=1, …, F、Fは1以上の整数)は周波数ビンfのフィルタ係数）の最適値w^*を計算する最適化ステップを含むフィルタ係数最適化方法であって、
θ_d(d=1, …, D)を音源dが存在する方角、a_f,d(f=1, …, F, d=1, …, D)を方角θ_dから到来する平面波の音波に対応する周波数ビンfでのアレイマニフォールドベクトルとし、
前記最適化ステップは、方角θ_dに対する周波数ビンfでのビームフォーマの応答w_f ^Ha_f,d(f=1, …, F, d=1, …, D)に関する隣接周波数ビン間での位相の差分が小さくなるように誘導することにより、前記最適値w^*を計算する
フィルタ係数最適化方法。
請求項１ないし９のいずれか１項に記載のフィルタ係数最適化装置としてコンピュータを機能させるためのプログラム。