JP7375904B2 - フィルタ係数最適化装置、潜在変数最適化装置、フィルタ係数最適化方法、潜在変数最適化方法、プログラム - Google Patents
フィルタ係数最適化装置、潜在変数最適化装置、フィルタ係数最適化方法、潜在変数最適化方法、プログラム Download PDFInfo
- Publication number
- JP7375904B2 JP7375904B2 JP2022502755A JP2022502755A JP7375904B2 JP 7375904 B2 JP7375904 B2 JP 7375904B2 JP 2022502755 A JP2022502755 A JP 2022502755A JP 2022502755 A JP2022502755 A JP 2022502755A JP 7375904 B2 JP7375904 B2 JP 7375904B2
- Authority
- JP
- Japan
- Prior art keywords
- optimization
- filter coefficient
- convex
- latent variable
- function
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000005457 optimization Methods 0.000 title claims description 197
- 238000000034 method Methods 0.000 title claims description 29
- 238000004364 calculation method Methods 0.000 claims description 14
- 239000011159 matrix material Substances 0.000 claims description 6
- 230000006870 function Effects 0.000 description 74
- 238000012545 processing Methods 0.000 description 20
- 238000010586 diagram Methods 0.000 description 18
- 230000004044 response Effects 0.000 description 9
- 230000008569 process Effects 0.000 description 7
- 238000013461 design Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 230000015654 memory Effects 0.000 description 5
- 230000009466 transformation Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000008929 regeneration Effects 0.000 description 2
- 238000011069 regeneration method Methods 0.000 description 2
- 230000002040 relaxant effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000001131 transforming effect Effects 0.000 description 2
- 230000006399 behavior Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/15—Correlation function computation including computation of convolution operations
- G06F17/156—Correlation function computation including computation of convolution operations using a domain transform, e.g. Fourier transform, polynomial transform, number theoretic transform
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/20—Arrangements for obtaining desired frequency or directional characteristics
- H04R1/32—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
- H04R1/40—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/11—Complex mathematical operations for solving equations, e.g. nonlinear equations, general mathematical optimization problems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10K—SOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
- G10K11/00—Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
- G10K11/18—Methods or devices for transmitting, conducting or directing sound
- G10K11/26—Sound-focusing or directing, e.g. scanning
- G10K11/34—Sound-focusing or directing, e.g. scanning using electrical steering of transducer arrays, e.g. beam steering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0272—Voice signal separating
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/12—Circuits for transducers, loudspeakers or microphones for distributing signals to two or more loudspeakers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2203/00—Details of circuits for transducers, loudspeakers or microphones covered by H04R3/00 but not provided for in any of its subgroups
- H04R2203/12—Beamforming aspects for stereophonic sound reproduction with loudspeaker arrays
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- Computational Mathematics (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Analysis (AREA)
- Otolaryngology (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Databases & Information Systems (AREA)
- Algebra (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Multimedia (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Operations Research (AREA)
- Filters That Use Time-Delay Elements (AREA)
- Complex Calculations (AREA)
- Circuit For Audible Band Transducer (AREA)
Description
本発明は、目的音強調におけるフィルタ係数など最適化の対象となるモデルの潜在変数を最適化する技術に関する。
特定の方角から到来する音(以下、目的音という)のみを強調し、その他の方角から到来する音(以下、非目的音という)を抑圧する信号処理手法として、マイクロホンアレイを用いたビームフォーミングがよく知られている。この手法は、電話会議システム、自動車内のコミュニケーションシステム、スマートスピーカー等で実用化されている。
これまでに提案されているビームフォーマの設計手法の例として、複数の方角に強調したい音源がある状況で、複数の音源方向に対する応答に関して制約を課しつつ非目的音を抑圧するものがある。その一つに、線形拘束付最小分散型(Linearly Constrained Minimum Variance, LCMV)ビームフォーマがある(非特許文献1参照)。LCMVビームフォーマは、複数の方角に対するビームフォーマの応答に等式制約を課すことで目的音を強調しつつ、出力信号の分散を最小化することで非目的音を抑圧する。以下、LCMVビームフォーマの設計手法について詳しく説明する。
まず、種々の定義とノーテーションを導入する。以下では、信号を短時間フーリエ変換(Short-Time Fourier Transform)を行った後の時間周波数領域の値として扱う。
時間フレームの添字をt=1, …, T、周波数ビンの添字をf=1, …, Fで表す。また、ベクトルvや行列Mの複素共役転置を、vHやMHのように上付きのHで表す。
LCMVビームフォーマの設計は、M個のマイク素子からなるマイクアレイの観測信号から、不要な音である非目的音を消去しつつ予め定めた複数の方角からの音である目的音を強調するような線形フィルタ(ビームフォーマ)を構成するというものである。時間フレームt、周波数ビンfにおけるマイクアレイのMチャンネルの観測信号をxf,t∈CM(f=1, …, F, t=1, …, T)とおく。ここで、音を発する信号源である音源が遠方にD個存在し、マイクアレイには事実上の平面波として到来しているという状況を仮定する。また、すべての音源とすべてのマイク素子が同一平面上にあることを仮定する。音源d (d=1, …, D)から放音されマイクアレイに時間フレームt、周波数ビンfに到来する信号をsd,f,t∈C(d=1, …, D, f=1, …, F, t=1, …, T)とおく。音源dの音は、方角θdから到来するものとする。ここで、方角θdは既知であると仮定する。
音源dからマイクアレイのM個のマイク素子への周波数ビンfでのアレイマニフォールドベクトル(以下、方角θdから到来する平面波の音波に対応する周波数ビンfでのアレイマニフォールドベクトルという)をaf,d∈CM(f=1, …, F, d=1, …, D)とおくと、観測信号をxf,tは、次式により表される。
ただし、nf,t(f=1, …, F, t=1, …, T)は観測の過程で加わる雑音やその他残響・非方向性雑音からなるノイズ成分を表す。なお、アレイマニフォールドベクトルaf,dはマイクアレイや系全体の物理的特性から、周波数ビンf毎に自動的に決まる量である。
以下、周波数ビンfでの線形フィルタをwf∈CM(f=1, …, F)と表し、これをビームフォーマのフィルタ係数と呼ぶ。このフィルタ係数が、ビームフォーマの動作を定める。
ビームフォーマの出力信号yf,t(f=1, …, F, t=1, …, T)は、次式により表される。
つまり、ビームフォーマの設計とは、式(2)を満たすフィルタ係数wf(f=1, …, F)をいかに設計するかということである。
ここで、フィルタ係数wfとアレイマニフォールドベクトルaf,dの内積wf
Haf,dはビームフォーマの方角θdに対する周波数ビンfでの応答特性を意味する。したがって、方角θdの音源(つまり、音源d)から到来する音を必ず一定のゲインで集音したいという状況では、次式の制約条件(無歪制約条件という)をフィルタ係数wfに対して課すという方法がしばしば用いられる。
(ただし、f=1, …, F)
この無歪制約条件を満たしつつ、不要な音源からの信号に対するゲインができるだけ小さくなるようにフィルタ係数wfを設定することで、音源dから到来する音の強調が達成できる。
この無歪制約条件を満たしつつ、不要な音源からの信号に対するゲインができるだけ小さくなるようにフィルタ係数wfを設定することで、音源dから到来する音の強調が達成できる。
なお、複数の音源から到来する音を同時に強調したい場合には、この無歪制約条件を複数個同時に課せばよい。
ビームフォーマには非目的音を抑圧することが要求されるため、目的音強調という制約のもと非目的音を最小化するように、フィルタ係数wfを設定することが求められる。このことを数学的に定式化するために、非目的音の分散を表すコスト関数を定義する。このコスト関数を最小化するようにフィルタ係数を設定することで、所望のビームフォーマが設計できると期待される。
非目的音の空間相関行列Rf(f=1, …, F)をRf:=Et[xf,txf,t
H]と定義すると、非目的音の分散を表すコスト関数LMV_f(wf)が周波数ビンf=1, …, Fごとに定義できる。具体的には、コスト関数LMV_f(wf)は次式のようになる。
式(3)の制約条件のもと、このコスト関数LMV_f(wf)の和を最小化するように、フィルタ係数wf(f=1, …, F)を設定することで、ビームフォーマを設計できる。このことを数式で表すと、次式の最適化問題となる。
式(5)の最適化問題を解くことにより、最適なフィルタ係数を得ることができる。
なお、式(5)の最適化問題は、周波数ビンf=1, …, Fごとに別々の最適化問題に分離することができる。つまり、式(5)の最適化問題の代わりに、周波数ビンfについて、次式の最適化問題を解くようにしてもよい。
以上説明した式(5)または式(6)の最適化問題を解くことにより、LCMVビームフォーマを設計することができる。これが従来のLCMVビームフォーマの設計手法である。
浅野 太, "日本音響学会編 音響テクノロジーシリーズ16 音のアレイ信号処理 -音源の定位・追跡と分離-", コロナ社, pp.86-90, 2011.
従来のLCMVビームフォーマの設計手法では、式(3)の制約条件により、ビームフォーマの応答の振幅(つまり、入力信号に対する出力信号の振幅比)と位相(つまり、入力信号に対する出力信号の位相遅延)の両者に厳格な制約を課す。そのため、式(5)または式(6)の最適化問題、すなわち、”s.t. …”以下の条件を満たす範囲で、コスト関数ΣfLMV_f(wf)またはコスト関数LMV_f(wf)を最小化するようなフィルタ係数を求めるという問題には、式(3)の制約条件の数が多すぎるとフィルタ係数の取り得る値の範囲が著しく制限され、非目的音を抑圧することが可能なフィルタ係数を求めることが困難になってしまうという問題があった。
この問題を解消するために、式(3)の制約条件の代わりに、より緩いコスト関数や制約条件を導入し、最適化問題の解がないという状況を避ける方法が考えられる。しかし、この場合、コスト関数の形や制約条件を緩和することにより、ビームフォーマの設計にあたって解くべき最適化問題が数学的には非凸最適化となり、最適化問題を解くのが困難になることがあった。
そこで本発明では、非凸最適化問題を解く代わりに、当該問題と等価な凸最適化問題を解くことにより、潜在変数を最適化する技術を提供することを目的とする。
本発明の一態様は、Dを1以上の整数とし、D個の音源(以下、音源1、…、音源Dとする)からの音(以下、目的音という)を強調するビームフォーマのフィルタ係数w={w1, …, wF}(ただし、wf(f=1, …, F、Fは1以上の整数)は周波数ビンfのフィルタ係数)の最適値w*を計算する最適化部を含むフィルタ係数最適化装置であって、Rf(f=1, …, F)を周波数ビンfに関する前記目的音以外の音の空間相関行列、LMV_f(wf)=wf
HRfwf(f=1, …, F)をフィルタ係数wfに関するコスト関数とし、前記最適化部は、所定の制約条件のもとでのフィルタ係数wに関する最適化問題minw_1, …, w_FΣf=1
FLMV_f(wf)に基づいて、前記最適値w*を計算するものであり、前記所定の制約条件は、フィルタ係数wf(f=1, …, F)の位相に関する制約を含まないものである。
本発明の一態様は、Lconvexを潜在変数~wに関する強凸関数、Ld(d=1, …, D、Dは1以上の整数)を潜在変数~wに関する関数とし、潜在変数~wに関する最適化問題min~w(Lconvex(~w)+Σd=1
DLd(~w))に基づいて、潜在変数~wの最適値~w*を計算する最適化部を含む潜在変数最適化装置であって、Cを1以上の整数、Sd,1, …, Sd,C(d=1, …, D)を関数Ldの定義域をC個の閉凸集合に分割することにより得られる領域、Λd,c(d=1, …, D, c=1, …, C)を領域Sd,cで定義され、関数Ldを近似する凸関数、cd(d=1, …, D)を1, …, Cを値にとる離散変数とし、前記最適化部は、前記最適化問題min~w(Lconvex(~w)+Σd=1
DLd(~w))を解く代わりに、潜在変数~w、離散変数c1, …, cDに関する最適化問題minc_1, …, c_D(min~w(Lconvex(~w)+Σd=1
DΛd,c_d(~w)))を解くことにより前記最適値~w*を計算する。
本発明によれば、非凸最適化問題を解く代わりに、当該問題と等価な凸最適化問題を解くことにより、潜在変数を最適化することが可能となる。
以下、本発明の実施の形態について、詳細に説明する。なお、同じ機能を有する構成部には同じ番号を付し、重複説明を省略する。
各実施形態の説明に先立って、この明細書における表記方法について説明する。
_(アンダースコア)は下付き添字を表す。例えば、xy_zはyzがxに対する上付き添字であり、xy_zはyzがxに対する下付き添字であることを表す。
また、ある文字xに対する^xや~xのような上付き添え字の”^”や”~”は、本来”x”の真上に記載されるべきであるが、明細書の記載表記の制約上、^xや~xと記載しているものである。
<技術的背景>
まず、非凸最適化問題を、当該問題と等価な凸最適化問題に変形する方法及び変形により得られる凸最適化問題を解く方法について説明する。次に、この方法を式(3)の制約条件を緩和することにより得られる非凸最適化問題へ適用した例について説明する。最後に、音源強調以外に適用した例について説明する。
まず、非凸最適化問題を、当該問題と等価な凸最適化問題に変形する方法及び変形により得られる凸最適化問題を解く方法について説明する。次に、この方法を式(3)の制約条件を緩和することにより得られる非凸最適化問題へ適用した例について説明する。最後に、音源強調以外に適用した例について説明する。
《非凸最適化問題と等価な凸最適化問題への変形及びその解法》
ここでは、非凸最適化問題を、当該問題と等価な凸最適化問題に変形する方法と、変形により得られる凸最適化問題を解く方法とについて説明する。以下、次式により定義される潜在変数~wに関する最適化問題を考える。
ここでは、非凸最適化問題を、当該問題と等価な凸最適化問題に変形する方法と、変形により得られる凸最適化問題を解く方法とについて説明する。以下、次式により定義される潜在変数~wに関する最適化問題を考える。
ここで、Lconvexは潜在変数~wに関する強凸関数、Ld(d=1, …, D、Dは1以上の整数)は潜在変数~wに関する関数である。つまり、関数Ld(d=1, …, D)は必ずしも凸である必要はない。
一般に、式(7)の最適化問題は、非凸な関数をコスト関数とする最適化問題、すなわち、非凸最適化問題となる。先述の通り、非凸最適化問題は困難な問題であるため、ある種の近似を導入してより解きやすい凸最適化問題に帰着させることを考える。そこで、ここでは関数Ld(~w) (d=1, …, D)を複数の凸関数から構成される区分的凸関数(piecewise convex function)で近似することを考える。
以下、区分的凸関数の定義について説明する。近似対象となる関数Ld(~w) (d=1, …, D)に対して、その定義域をC個の閉凸集合である領域Sd,1, …, Sd,Cに分割する。そして、領域Sd,1, …, Sd,Cの各々で定義される関数Λd,c(c=1, …, C)を導入する。この新たに導入する関数Λd,cは領域Sd,c上で凸関数であり、領域Sd,c上で関数Ldを近似する関数である。なお、関数Ldが領域Sd,c上で凸関数である場合は、領域Sd,c上でΛd,c=Ldとすればよい。これにより、関数Ld(~w)は、区分的凸関数Λd,c(c=1, …, C)により近似的に表すことができる。なお、一般に、Cの値(つまり、関数Ldの定義域を分割する数)を大きくするほど、よりよい精度の区分的凸関数で近似することができる。
しかし、当該近似を用いると、式(7)の最適化問題による最適化対象である潜在変数に加え、最適化問題の解である最適値がどの領域に属しているかを表す離散変数が新たに最適化対象として加わり、最適化すべき変数の数が増えてしまう。ただし、離散変数を固定すると、潜在変数に対しては最適化問題が(非凸最適化ではなく)凸最適化に帰着されるため、比較的容易に解くことができる。以下、具体的に説明する。近似を用いて定式化される最適化問題は、cd(d=1, …, D)を1, …, Cを値にとる離散変数として、次式により表される。
式(8)は次式と等価である。
式(9)に含まれるmin~w(Lconvex(~w)+Σd=1
DΛd,c_d(~w))は、潜在変数~wに関する凸最適化問題であり、比較的容易に解くことができる。以下、その手順について説明する。まず、離散変数(c1, …, cD)がとり得るすべての値に対して、凸最適化問題min~w(Lconvex(~w)+Σd=1
DΛd,c_d(~w))を解く。これにより、CD個の離散変数(c1, …, cD)がとり得るすべての値について凸最適化問題min~w(Lconvex(~w)+Σd=1
DΛd,c_d(~w))の解が求まる。そして、得られた凸最適化問題の解のうち、コスト関数Lconvex(~w)+Σd=1
DΛd,c_d(~w)の値が最小となるものを最適値とする。これにより、式(9)の最適化問題を解くことができる。この解法の手順を図示したものが図1である。
式(7)の非凸最適化問題は、これと等価な式(9)の凸最適化問題に変形でき、式(9)の凸最適化問題は、図1の潜在変数最適化アルゴリズムにより解くことができる。
《適用例》
ここでは、上記説明した、非凸最適化問題を凸最適化問題に変形したうえで最適値を求める汎用的な枠組みを、式(3)の制約条件を緩和することにより得られる非凸最適化問題へ適用した例について説明する。
ここでは、上記説明した、非凸最適化問題を凸最適化問題に変形したうえで最適値を求める汎用的な枠組みを、式(3)の制約条件を緩和することにより得られる非凸最適化問題へ適用した例について説明する。
先述の通り、非特許文献1の従来技術では、等式制約である式(3)を多数課すため、適切なフィルタ係数が得られないというおそれがあった。そこで、現実の状況に適した、より緩い制約条件を用いることを考える。具体的には、式(3)の制約条件の代わりに、ビームフォーマの応答の振幅にのみ制約を課す制約条件(つまり、位相に関する制約がない制約条件)を用いることを考える。例えば、次式を用いることができる。
また、別の例として、次式を用いることもできる。
式(10)の制約条件、式(11)の制約条件は、それぞれビームフォーマの応答の振幅が一定値(具体的には1)であるという制約、ビームフォーマの応答の振幅が一定値(具体的には1)以上であればよいという制約を表す。式(10)の制約条件、式(11)の制約条件は、いずれも数学的には非凸な制約として分類されるものである。
以下、式(11)を制約条件とする最適化問題について考える。式(11)の制約条件は、複素数wf
Haf,dの絶対値が1以上であるというものである。これは、幾何学的には、複素数wf
Haf,dが複素平面上で単位円上かその外側に位置しなければならないということを意味する。そこで、まず、複素平面を、原点を中心にC個の扇形に等分する。このC個の扇形が、先ほどのC個の領域に相当する。そして、各扇形の境界と内側において、元の制約である式(11)をC個の凸関数で近似する。
以下、具体的に説明する。周波数ビンf(f=1, …, F)、音源d(d=1, …, D)に対して離散変数cf,dを1, …, Cを値にとる変数とする。また、γf,d=wf
Haf,dとする。周波数ビンf(f=1, …, F)、音源d(d=1, …, D)に対して定義される凸関数Λ(f,d),c_f,d(γf,d)(cf,d=1, …, C)は、複素数γf,dの値を、複素平面上の中心角2π/Cで原点を中心とする扇形の内側かつ|γf,d|≧1を満たす範囲にあるように制限するものとして定義する。
例えば、関数Λ(f,d),c_f,dを次式で表される関数とすることができる。
ここで、R(z)は複素数zの実部を表す。
そして、C個の凸関数Λ(f,d),c_f,d(γf,d)(cf,d=1, …, C)を用いた区分的凸関数で式(11)を近似する。
図2A、図2B、図2C、図2Dは、式(11)をC個の凸関数Λ(f,d),c_f,d(γf,d)で近似する様子を示す図である。図2Aは、複素平面上の式(11)の制約条件を図示したものであり、近似対象を表す。図2Bは、近似のために導入された凸関数Λ(f,d),c_f,d(γf,d)の一例を図示したものである。図2C及び図2Dは、最小値minc_f,d=1,…,CΛ(f,d),c_f,d(γf,d)を図示したものあり、図2CはC=6の場合、図2DはC=10の場合の図である。
なお、Cの値を大きくすると、より精度よく近似できるようになるが、図1のアルゴリズムを用いて最適化問題を解く場合、離散変数のすべての組合せを調べる必要があるため、計算量が増大する。
以上より、式(11)を制約条件とするフィルタ係数最適化問題は次式の凸最適化問題に帰着する。
ここで、cf=(cf,1, …, cf,D)である。
この最適化問題は、図1の潜在変数最適化アルゴリズムを適用することで解くことができるものであり、そのアルゴリズムを図3に示す。つまり、図3は、図1の潜在変数最適化アルゴリズムに基づいて得られるフィルタ係数最適化アルゴリズムを示す。
《局所再生システムへの適用》
ここでは、別の適用例について説明する。具体的には、多数のスピーカを用いた局所再生システムについて説明する。
ここでは、別の適用例について説明する。具体的には、多数のスピーカを用いた局所再生システムについて説明する。
空間中に無指向性スピーカがK個存在し、N+M個の受聴点のうち、前半のN個の点では音を再生しつつ後半のM個の点では音が漏れないような局所再生システムを構成することを考える。そのために、1ch音源に線形フィルタを畳み込んで各スピーカから再生する信号処理を行う。
これまでの説明と同様、時間周波数領域で議論する。音を再生するN個の点については、周波数ビンfでのK個の無指向性スピーカから点i(i=1, …, N)へのアレイマニフォールドベクトルをaf,i∈CKとする。また、音が漏れないようにするM個の点については、周波数ビンfでのK個の無指向性スピーカから点j(j=1, …, M)へのアレイマニフォールドベクトルをbf,j∈CKとする。また、設計したいフィルタ係数をwf(f=1, …, F)とする。
音を再生する点i(i=1, …, N)に関しては、点iにおける周波数ビンfでの応答wf
Haf,iの振幅が一定値以上であってほしい。一方、音が漏れてほしくない点j(j=1, …, M)に関しては、点jにおける周波数ビンfでの応答wf
Hbf,jの振幅ができるだけ小さい値になってほしい。したがって、このフィルタ係数の最適化問題は次式により定式化される。
式(14)の最適化問題は、図3のアルゴリズムと同様のアルゴリズムにより解くことができるため、所望の局所再生システムを設計することができる。
<第1実施形態>
フィルタ係数最適化装置100は、M個(ただし、Mは1以上の整数)のマイク素子からなるマイクアレイを用いて、D個(ただし、Dは1以上の整数)の音源(以下、音源1、…、音源Dとする)からの音(以下、目的音という)を観測した信号(観測信号)から、目的音を強調するビームフォーマのフィルタ係数w={w1, …, wF}(ただし、wf(f=1, …, F、Fは1以上の整数)は周波数ビンfのフィルタ係数)の最適値w*を計算する。観測信号はフィルタ係数の最適化に用いる入力データであるため、以下、観測信号のことを最適化用データということにする。
フィルタ係数最適化装置100は、M個(ただし、Mは1以上の整数)のマイク素子からなるマイクアレイを用いて、D個(ただし、Dは1以上の整数)の音源(以下、音源1、…、音源Dとする)からの音(以下、目的音という)を観測した信号(観測信号)から、目的音を強調するビームフォーマのフィルタ係数w={w1, …, wF}(ただし、wf(f=1, …, F、Fは1以上の整数)は周波数ビンfのフィルタ係数)の最適値w*を計算する。観測信号はフィルタ係数の最適化に用いる入力データであるため、以下、観測信号のことを最適化用データということにする。
以下、図4~図5を参照してフィルタ係数最適化装置100を説明する。図4は、フィルタ係数最適化装置100の構成を示すブロック図である。図5は、フィルタ係数最適化装置100の動作を示すフローチャートである。図4に示すようにフィルタ係数最適化装置100は、セットアップデータ計算部110と、最適化部120と、記録部190を含む。記録部190は、フィルタ係数最適化装置100の処理に必要な情報を適宜記録する構成部である。記録部190は、例えば、最適化対象となるフィルタ係数を記録する。
図5に従いフィルタ係数最適化装置100の動作について説明する。
S110において、セットアップデータ計算部110は、最適化用データを用いて、フィルタ係数wを最適化する際に用いるセットアップデータを計算する。フィルタ係数wを最適化するためにコスト関数を用いる場合、セットアップデータとして、例えば、観測信号に基づいて得られる、周波数ビンfに関する目的音以外の音の空間相関行列Rf(f=1, …, F)、音源dが存在する方角θd(d=1, …, D)から到来する平面波の音波に対応する周波数ビンfでのアレイマニフォールドベクトルaf,d(f=1, …, F, d=1, …, D)がある。
S120において、最適化部120は、S110で生成したセットアップデータを用いてフィルタ係数wの最適値w*を計算する。例えば、最適化部120は、フィルタ係数wf(f=1, …, F)の位相に関する制約を含まないという制約条件のもとでのフィルタ係数wに関する最適化問題minw_1, …, w_FΣf=1
FLMV_f(wf)に基づいて、最適値w*を計算することができる。ここで、LMV_f(wf)=wf
HRfwf(f=1, …, F)はフィルタ係数wfに関するコスト関数である。なお、Σf=1
FLMV_f(wf)のことをフィルタ係数wに関するコスト関数という。
フィルタ係数wf(f=1, …, F)の位相に関する制約を含まないという制約条件の例として、次式により表現されるものがある。
(ただし、f=1, …, F, d=1, …, D)
また、制約条件の別の例として、次式により表現されるものがある。
また、制約条件の別の例として、次式により表現されるものがある。
(ただし、f=1, …, F, d=1, …, D)
最適化部120は、制約条件(*)のもとで最適化問題minw_1, …, w_FΣf=1 FLMV_f(wf)を解く代わりに、フィルタ係数w、離散変数c1, …, cFに関する最適化問題min{c_f,w_f}(Σf=1 FLMV_f(wf)+Σf=1 FΣd=1 DΛ(f,d),c_f,d(wf Haf,d))を解くことにより最適値w*を計算するようにしてもよい。ここで、Cを1以上の整数、cf,d(f=1, …, F, d=1, …, D)を1, …, Cを値にとる離散変数、cf=(cf,1, …, cf,D) (f=1, …, F)を離散変数cf,1, …, cf,Dにより定義される離散変数とし、関数Λ(f,d),c_f,d (f=1, …, F, d=1, …, D)は次式で定義される変数γf,dに関する関数である(ただし、γf,d=wf Haf,d)。
最適化部120は、制約条件(*)のもとで最適化問題minw_1, …, w_FΣf=1 FLMV_f(wf)を解く代わりに、フィルタ係数w、離散変数c1, …, cFに関する最適化問題min{c_f,w_f}(Σf=1 FLMV_f(wf)+Σf=1 FΣd=1 DΛ(f,d),c_f,d(wf Haf,d))を解くことにより最適値w*を計算するようにしてもよい。ここで、Cを1以上の整数、cf,d(f=1, …, F, d=1, …, D)を1, …, Cを値にとる離散変数、cf=(cf,1, …, cf,D) (f=1, …, F)を離散変数cf,1, …, cf,Dにより定義される離散変数とし、関数Λ(f,d),c_f,d (f=1, …, F, d=1, …, D)は次式で定義される変数γf,dに関する関数である(ただし、γf,d=wf Haf,d)。
以下、図6~図7を参照して、最適化問題min{c_f,w_f}(Σf=1
FLMV_f(wf)+Σf=1
FΣd=1
DΛ(f,d),c_f,d(wf
Haf,d))を解くための最適化部120について説明する。図6は、最適化部120の構成を示すブロック図である。図7は、最適化部120の動作を示すフローチャートである。図6に示すように最適化部120は、候補計算部122、最適値決定部123を含む。
図7に従い最適化部120の動作について説明する。
S122において、候補計算部122は、周波数ビンfごとに、離散変数(cf,1, …, cf,D)がとり得るすべての値に対して、次式によりフィルタ係数wfの最適値の候補wf
candidate[(cf,1, …, cf,D)]を計算する。
S123において、最適値決定部123は、周波数ビンfごとに、S122で計算した候補wf
candidate[(cf,1, …, cf,D)]のうち、コスト関数LMV_f(wf)+Σd=1
DΛ(f,d),c_f,d(wf
Haf,d)の値を最小とする候補を最適値wf
*とし、w*={w1
*, …, wF
*}により最適値w*を得る。
本発明の実施形態によれば、非凸最適化問題を解く代わりに、当該問題と等価な凸最適化問題を解くことにより、フィルタ係数を最適化することが可能となる。
<第2実施形態>
ここでは、非凸最適化問題と等価な凸最適化問題を解くための一般的な実施形態について説明する。
ここでは、非凸最適化問題と等価な凸最適化問題を解くための一般的な実施形態について説明する。
潜在変数最適化装置100は、最適化用データから、潜在変数~wの最適値~w*を計算する。ここで、最適化用データとは潜在変数の最適化に用いる入力データ、または、潜在変数の最適化に用いる入力データと出力データの組である。
潜在変数最適化装置100は、潜在変数~wに関する最適化問題min~w(Lconvex(~w)+Σd=1
DLd(~w))(ただし、Lconvexは潜在変数~wに関する強凸関数、Ld(d=1, …, D、Dは1以上の整数)は潜在変数~wに関する関数)に基づいて、最適値~w*を計算する。例えば、潜在変数最適化装置100は、最適化問題min~w(Lconvex(~w)+Σd=1
DLd(~w))を解く代わりに、潜在変数~w、離散変数c1, …, cDに関する最適化問題minc_1, …, c_D(min~w(Lconvex(~w)+Σd=1
DΛd,c_d(~w)))を解くことにより最適値~w*を計算する。ここで、Cを1以上の整数、Sd,1, …, Sd,C(d=1, …, D)を関数Ldの定義域をC個の閉凸集合に分割することにより得られる領域とし、関数Λd,c(d=1, …, D, c=1, …, C)は領域Sd,cで定義され、関数Ldを近似する凸関数である。また、変数cd(d=1, …, D)は1, …, Cを値にとる離散変数である。
以下、図4~図5を参照して潜在変数最適化装置100を説明する。図4は、潜在変数最適化装置100の構成を示すブロック図である。図5は、潜在変数最適化装置100の動作を示すフローチャートである。図4に示すように潜在変数最適化装置100は、セットアップデータ計算部110と、最適化部120と、記録部190を含む。記録部190は、潜在変数最適化装置100の処理に必要な情報を適宜記録する構成部である。記録部190は、例えば、最適化対象となる潜在変数を記録する。
図5に従い潜在変数最適化装置100の動作について説明する。
S110において、セットアップデータ計算部110は、最適化用データを用いて、潜在変数~wを最適化する際に用いるセットアップデータを計算する。セットアップデータは、例えば、最適化問題minc_1, …, c_D(min~w(Lconvex(~w)+Σd=1
DΛd,c_d(~w)))で用いる各パラメータである。
S120において、最適化部120は、S110で生成したセットアップデータを用いて潜在変数~wの最適値~w*を計算する。
以下、図6~図7を参照して、最適化部120について説明する。図6は、最適化部120の構成を示すブロック図である。図7は、最適化部120の動作を示すフローチャートである。図6に示すように最適化部120は、候補計算部122、最適値決定部123を含む。
図7に従い最適化部120の動作について説明する。
S122において、候補計算部122は、離散変数(c1, …, cD)がとり得るすべての値に対して、次式により潜在変数~wの最適値の候補~wcandidate[(c1, …, cD)]を計算する。
S123において、最適値決定部123は、S122で計算した候補~wcandidate[(c1, …, cD)]のうち、コスト関数Lconvex(~w)+Σd=1
DΛd,c_d(~w)の値を最小とする候補を最適値~w*とする。
本発明の実施形態によれば、非凸最適化問題を解く代わりに、当該問題と等価な凸最適化問題を解くことにより、潜在変数を最適化することが可能となる。
<第3実施形態>
フィルタ係数最適化装置100は、K個(ただし、Kは1以上の整数)の無向性スピーカを用いて構成され、予め定まったN+M個(ただし、N, Mは1以上の整数)の点のうち、N個の点では音を再生しつつM個の点では音が漏れないようにする局所再生システムのフィルタ係数w={w1, …, wF}(ただし、wf(f=1, …, F、Fは1以上の整数)は周波数ビンfのフィルタ係数)の最適値w*を計算する。ここで、最適化用データとは潜在変数の最適化に用いる入力データ、または、潜在変数の最適化に用いる入力データと出力データの組である。
フィルタ係数最適化装置100は、K個(ただし、Kは1以上の整数)の無向性スピーカを用いて構成され、予め定まったN+M個(ただし、N, Mは1以上の整数)の点のうち、N個の点では音を再生しつつM個の点では音が漏れないようにする局所再生システムのフィルタ係数w={w1, …, wF}(ただし、wf(f=1, …, F、Fは1以上の整数)は周波数ビンfのフィルタ係数)の最適値w*を計算する。ここで、最適化用データとは潜在変数の最適化に用いる入力データ、または、潜在変数の最適化に用いる入力データと出力データの組である。
以下、図4~図5を参照してフィルタ係数最適化装置100を説明する。図4は、フィルタ係数最適化装置100の構成を示すブロック図である。図5は、フィルタ係数最適化装置100の動作を示すフローチャートである。図4に示すようにフィルタ係数最適化装置100は、セットアップデータ計算部110と、最適化部120と、記録部190を含む。記録部190は、フィルタ係数最適化装置100の処理に必要な情報を適宜記録する構成部である。記録部190は、例えば、最適化対象となるフィルタ係数を記録する。
図5に従いフィルタ係数最適化装置100の動作について説明する。
S110において、セットアップデータ計算部110は、最適化用データを用いて、フィルタ係数wを最適化する際に用いるセットアップデータを計算する。フィルタ係数wを最適化するためにコスト関数を用いる場合、セットアップデータとして、例えば、周波数ビンfでのK個の無指向性スピーカから点i(i=1, …, N)へのアレイマニフォールドベクトルaf,i(f=1, …, F, i=1, …, N)、周波数ビンfでのK個の無指向性スピーカから点j(j=1, …, M)へのアレイマニフォールドベクトルbf,j(f=1, …, F, j=1, …, M)がある。
S120において、最適化部120は、S110で生成したセットアップデータを用いてフィルタ係数wの最適値w*を計算する。例えば、最適化部120は、フィルタ係数wf(f=1, …, F)の位相に関する制約を含まないという制約条件のもとでのフィルタ係数wに関する最適化問題minw_1, …, w_FΣf=1
FΣj=1
M|wf
Hbf,j|2に基づいて、最適値w*を計算することができる。なお、Σf=1
F|Σj=1
M|wf
Hbf,j|2のことをフィルタ係数wに関するコスト関数という。
フィルタ係数wf(f=1, …, F)の位相に関する制約を含まないという制約条件の例として、次式により表現されるものがある。
(ただし、f=1, …, F, i=1, …, N)
最適化部120は、制約条件(*)のもとで最適化問題minw_1, …, w_FΣf=1 FΣj=1 M|wf Hbf,j|2を解く代わりに、フィルタ係数w、離散変数c1, …, cFに関する最適化問題min{c_f,w_f}(Σf=1 FΣj=1 M|wf Hbf,j|2+Σf=1 FΣi=1 NΛ(f,i),c_f,i(wf Haf,i))を解くことにより最適値w*を計算するようにしてもよい。ここで、Cを1以上の整数、cf,i(f=1, …, F, i=1, …, N)を1, …, Cを値にとる離散変数、cf=(cf,1, …, cf,N) (f=1, …, F)を離散変数cf,1, …, cf,Nにより定義される離散変数とし、関数Λ(f,i),c_f,i (f=1, …, F, i=1, …, N)は次式で定義される変数γf,iに関する関数である(ただし、γf,i=wf Haf,i)。
最適化部120は、制約条件(*)のもとで最適化問題minw_1, …, w_FΣf=1 FΣj=1 M|wf Hbf,j|2を解く代わりに、フィルタ係数w、離散変数c1, …, cFに関する最適化問題min{c_f,w_f}(Σf=1 FΣj=1 M|wf Hbf,j|2+Σf=1 FΣi=1 NΛ(f,i),c_f,i(wf Haf,i))を解くことにより最適値w*を計算するようにしてもよい。ここで、Cを1以上の整数、cf,i(f=1, …, F, i=1, …, N)を1, …, Cを値にとる離散変数、cf=(cf,1, …, cf,N) (f=1, …, F)を離散変数cf,1, …, cf,Nにより定義される離散変数とし、関数Λ(f,i),c_f,i (f=1, …, F, i=1, …, N)は次式で定義される変数γf,iに関する関数である(ただし、γf,i=wf Haf,i)。
以下、図6~図7を参照して、最適化問題min{c_f,w_f}(Σf=1
FΣj=1
M|wf
Hbf,j|2+Σf=1
FΣi=1
NΛ(f,i),c_f,i(wf
Haf,i))を解くための最適化部120について説明する。図6は、最適化部120の構成を示すブロック図である。図7は、最適化部120の動作を示すフローチャートである。図6に示すように最適化部120は、候補計算部122、最適値決定部123を含む。
図7に従い最適化部120の動作について説明する。
S122において、候補計算部122は、周波数ビンfごとに、離散変数(cf,1, …, cf,N)がとり得るすべての値に対して、次式によりフィルタ係数wfの最適値の候補wf
candidate[(cf,1, …, cf,N)]を計算する。
S123において、最適値決定部123は、周波数ビンfごとに、S122で計算した候補wf
candidate[(cf,1, …, cf,N)]のうち、コスト関数Σj=1
M|wf
Hbf,j|2+Σi=1
NΛ(f,i),c_f,i(wf
Haf,i)の値を最小とする候補を最適値wf
*とし、w*={w1
*, …, wF
*}により最適値w*を得る。
本発明の実施形態によれば、非凸最適化問題を解く代わりに、当該問題と等価な凸最適化問題を解くことにより、フィルタ係数を最適化することが可能となる。
<補記>
図8は、上述の各装置を実現するコンピュータの機能構成の一例を示す図である。上述の各装置における処理は、記録部2020に、コンピュータを上述の各装置として機能させるためのプログラムを読み込ませ、制御部2010、入力部2030、出力部2040などに動作させることで実施できる。
図8は、上述の各装置を実現するコンピュータの機能構成の一例を示す図である。上述の各装置における処理は、記録部2020に、コンピュータを上述の各装置として機能させるためのプログラムを読み込ませ、制御部2010、入力部2030、出力部2040などに動作させることで実施できる。
本発明の装置は、例えば単一のハードウェアエンティティとして、キーボードなどが接続可能な入力部、液晶ディスプレイなどが接続可能な出力部、ハードウェアエンティティの外部に通信可能な通信装置(例えば通信ケーブル)が接続可能な通信部、CPU(Central Processing Unit、キャッシュメモリやレジスタなどを備えていてもよい)、メモリであるRAMやROM、ハードディスクである外部記憶装置並びにこれらの入力部、出力部、通信部、CPU、RAM、ROM、外部記憶装置の間のデータのやり取りが可能なように接続するバスを有している。また必要に応じて、ハードウェアエンティティに、CD-ROMなどの記録媒体を読み書きできる装置(ドライブ)などを設けることとしてもよい。このようなハードウェア資源を備えた物理的実体としては、汎用コンピュータなどがある。
ハードウェアエンティティの外部記憶装置には、上述の機能を実現するために必要となるプログラムおよびこのプログラムの処理において必要となるデータなどが記憶されている(外部記憶装置に限らず、例えばプログラムを読み出し専用記憶装置であるROMに記憶させておくこととしてもよい)。また、これらのプログラムの処理によって得られるデータなどは、RAMや外部記憶装置などに適宜に記憶される。
ハードウェアエンティティでは、外部記憶装置(あるいはROMなど)に記憶された各プログラムとこの各プログラムの処理に必要なデータが必要に応じてメモリに読み込まれて、適宜にCPUで解釈実行・処理される。その結果、CPUが所定の機能(上記、…部、…手段などと表した各構成部)を実現する。
本発明は上述の実施形態に限定されるものではなく、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。また、上記実施形態において説明した処理は、記載の順に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されるとしてもよい。
既述のように、上記実施形態において説明したハードウェアエンティティ(本発明の装置)における処理機能をコンピュータによって実現する場合、ハードウェアエンティティが有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記ハードウェアエンティティにおける処理機能がコンピュータ上で実現される。
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。具体的には、例えば、磁気記録装置として、ハードディスク装置、フレキシブルディスク、磁気テープ等を、光ディスクとして、DVD(Digital Versatile Disc)、DVD-RAM(Random Access Memory)、CD-ROM(Compact Disc Read Only Memory)、CD-R(Recordable)/RW(ReWritable)等を、光磁気記録媒体として、MO(Magneto-Optical disc)等を、半導体メモリとしてEEP-ROM(Electronically Erasable and Programmable-Read Only Memory)等を用いることができる。
また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD-ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。
このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。そして、処理の実行時、このコンピュータは、自己の記憶装置に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。なお、本形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの(コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等)を含むものとする。
また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、ハードウェアエンティティを構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。
上述の本発明の実施形態の記載は、例証と記載の目的で提示されたものである。網羅的であるという意思はなく、開示された厳密な形式に発明を限定する意思もない。変形やバリエーションは上述の教示から可能である。実施形態は、本発明の原理の最も良い例証を提供するために、そして、この分野の当業者が、熟考された実際の使用に適するように本発明を色々な実施形態で、また、色々な変形を付加して利用できるようにするために、選ばれて表現されたものである。すべてのそのような変形やバリエーションは、公正に合法的に公平に与えられる幅にしたがって解釈された添付の請求項によって定められた本発明のスコープ内である。
Claims (10)
- Dを1以上の整数とし、
D個の音源(以下、音源1、…、音源Dとする)からの音(以下、目的音という)を強調するビームフォーマのフィルタ係数w={w1, …, wF}(ただし、wf(f=1, …, F、Fは1以上の整数)は周波数ビンfのフィルタ係数)の最適値w*を計算する最適化部を含むフィルタ係数最適化装置であって、
Rf(f=1, …, F)を周波数ビンfに関する前記目的音以外の音の空間相関行列、LMV_f(wf)=wf HRfwf(f=1, …, F)をフィルタ係数wfに関するコスト関数とし、
前記最適化部は、所定の制約条件のもとでのフィルタ係数wに関する最適化問題minw_1, …, w_FΣf=1 FLMV_f(wf)に基づいて、前記最適値w*を計算するものであり、
前記所定の制約条件は、フィルタ係数wf(f=1, …, F)の位相に関する制約を含まないものである
フィルタ係数最適化装置。 - 請求項3に記載のフィルタ係数最適化装置であって、
Cを1以上の整数、cf,d(f=1, …, F, d=1, …, D)を1, …, Cを値にとる離散変数、cf=(cf,1, …, cf,D) (f=1, …, F)を離散変数cf,1, …, cf,Dにより定義される離散変数、Λ(f,d),c_f,d (f=1, …, F, d=1, …, D)を次式で定義される変数γf,dに関する関数(ただし、γf,d=wf Haf,d)とし、
前記最適化部は、前記最適化問題minw_1, …, w_FΣf=1 FLMV_f(wf)を解く代わりに、フィルタ係数w、離散変数c1, …, cFに関する最適化問題min{c_f,w_f}(Σf=1 FLMV_f(wf)+Σf=1 FΣd=1 DΛ(f,d),c_f,d(wf Haf,d))を解くことにより前記最適値w*を計算する
ことを特徴とするフィルタ係数最適化装置。 - 請求項4に記載のフィルタ係数最適化装置であって、
前記最適化部は、
周波数ビンfごとに、離散変数(cf,1, …, cf,D)がとり得るすべての値に対して、次式によりフィルタ係数wfの最適値の候補wf candidate[(cf,1, …, cf,D)]を計算する候補計算部と、
周波数ビンfごとに、前記候補wf candidate[(cf,1, …, cf,D)]のうち、コスト関数LMV_f(wf)+Σd=1 DΛ(f,d),c_f,d(wf Haf,d)の値を最小とする候補をフィルタ係数wfの最適値wf *とし、w*={w1 *, …, wF *}により前記最適値w*を得る最適値決定部とを含む
ことを特徴とするフィルタ係数最適化装置。 - Lconvexを潜在変数~wに関する強凸関数、Ld(d=1, …, D、Dは1以上の整数)を潜在変数~wに関する関数とし、
潜在変数~wに関する最適化問題min~w(Lconvex(~w)+Σd=1 DLd(~w))に基づいて、潜在変数~wの最適値~w*を計算する最適化部を含む潜在変数最適化装置であって、
Cを1以上の整数、Sd,1, …, Sd,C(d=1, …, D)を関数Ldの定義域をC個の閉凸集合に分割することにより得られる領域、Λd,c(d=1, …, D, c=1, …, C)を領域Sd,cで定義され、関数Ldを近似する凸関数、cd(d=1, …, D)を1, …, Cを値にとる離散変数とし、
前記最適化部は、前記最適化問題min~w(Lconvex(~w)+Σd=1 DLd(~w))を解く代わりに、潜在変数~w、離散変数c1, …, cDに関する最適化問題minc_1, …, c_D(min~w(Lconvex(~w)+Σd=1 DΛd,c_d(~w)))を解くことにより前記最適値~w*を計算する
潜在変数最適化装置。 - Dを1以上の整数とし、
フィルタ係数最適化装置が、D個の音源(以下、音源1、…、音源Dとする)からの音(以下、目的音という)を強調するビームフォーマのフィルタ係数w={w1, …, wF}(ただし、wf(f=1, …, F、Fは1以上の整数)は周波数ビンfのフィルタ係数)の最適値w*を計算する最適化ステップを含むフィルタ係数最適化方法であって、
Rf(f=1, …, F)を周波数ビンfに関する前記目的音以外の音の空間相関行列、LMV_f(wf)=wf HRfwf(f=1, …, F)をフィルタ係数wfに関するコスト関数とし、
前記最適化ステップは、所定の制約条件のもとでのフィルタ係数wに関する最適化問題minw_1, …, w_FΣf=1 FLMV_f(wf)に基づいて、前記最適値w*を計算するものであり、
前記所定の制約条件は、フィルタ係数wf(f=1, …, F)の位相に関する制約を含まないものである
フィルタ係数最適化方法。 - Lconvexを潜在変数~wに関する強凸関数、Ld(d=1, …, D、Dは1以上の整数)を潜在変数~wに関する関数とし、
潜在変数最適化装置が、潜在変数~wに関する最適化問題min~w(Lconvex(~w)+Σd=1 DLd(~w))に基づいて、潜在変数~wの最適値~w*を計算する最適化ステップを含む潜在変数最適化方法であって、
Cを1以上の整数、Sd,1, …, Sd,C(d=1, …, D)を関数Ldの定義域をC個の閉凸集合に分割することにより得られる領域、Λd,c(d=1, …, D, c=1, …, C)を領域Sd,cで定義され、関数Ldを近似する凸関数、cd(d=1, …, D)を1, …, Cを値にとる離散変数とし、
前記最適化ステップは、前記最適化問題min~w(Lconvex(~w)+Σd=1 DLd(~w))を解く代わりに、潜在変数~w、離散変数c1, …, cDに関する最適化問題minc_1, …, c_D(min~w(Lconvex(~w)+Σd=1 DΛd,c_d(~w)))を解くことにより前記最適値~w*を計算する
潜在変数最適化方法。 - 請求項1ないし5のいずれか1項に記載のフィルタ係数最適化装置、請求項6または7に記載の潜在変数最適化装置のいずれかとしてコンピュータを機能させるためのプログラム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2020/008232 WO2021171532A1 (ja) | 2020-02-28 | 2020-02-28 | フィルタ係数最適化装置、潜在変数最適化装置、フィルタ係数最適化方法、潜在変数最適化方法、プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2021171532A1 JPWO2021171532A1 (ja) | 2021-09-02 |
JP7375904B2 true JP7375904B2 (ja) | 2023-11-08 |
Family
ID=77491189
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022502755A Active JP7375904B2 (ja) | 2020-02-28 | 2020-02-28 | フィルタ係数最適化装置、潜在変数最適化装置、フィルタ係数最適化方法、潜在変数最適化方法、プログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US20230083284A1 (ja) |
JP (1) | JP7375904B2 (ja) |
WO (1) | WO2021171532A1 (ja) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012222518A (ja) | 2011-04-06 | 2012-11-12 | Nippon Telegr & Teleph Corp <Ntt> | フィルタ設計における反射物の配置決定方法、装置、プログラム |
US9668066B1 (en) | 2015-04-03 | 2017-05-30 | Cedar Audio Ltd. | Blind source separation systems |
JP2018107697A (ja) | 2016-12-27 | 2018-07-05 | キヤノン株式会社 | 信号処理装置、信号処理方法及びプログラム |
JP2020126138A (ja) | 2019-02-05 | 2020-08-20 | 日本電信電話株式会社 | 潜在変数最適化装置、フィルタ係数最適化装置、潜在変数最適化方法、フィルタ係数最適化方法、プログラム |
-
2020
- 2020-02-28 WO PCT/JP2020/008232 patent/WO2021171532A1/ja active Application Filing
- 2020-02-28 JP JP2022502755A patent/JP7375904B2/ja active Active
- 2020-02-28 US US17/802,105 patent/US20230083284A1/en active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012222518A (ja) | 2011-04-06 | 2012-11-12 | Nippon Telegr & Teleph Corp <Ntt> | フィルタ設計における反射物の配置決定方法、装置、プログラム |
US9668066B1 (en) | 2015-04-03 | 2017-05-30 | Cedar Audio Ltd. | Blind source separation systems |
JP2018107697A (ja) | 2016-12-27 | 2018-07-05 | キヤノン株式会社 | 信号処理装置、信号処理方法及びプログラム |
JP2020126138A (ja) | 2019-02-05 | 2020-08-20 | 日本電信電話株式会社 | 潜在変数最適化装置、フィルタ係数最適化装置、潜在変数最適化方法、フィルタ係数最適化方法、プログラム |
Also Published As
Publication number | Publication date |
---|---|
JPWO2021171532A1 (ja) | 2021-09-02 |
US20230083284A1 (en) | 2023-03-16 |
WO2021171532A1 (ja) | 2021-09-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11246000B2 (en) | Audio precompensation filter optimized with respect to bright and dark zones | |
Jin et al. | Multizone soundfield reproduction using orthogonal basis expansion | |
US9966081B2 (en) | Method and apparatus for synthesizing separated sound source | |
JP2019078864A (ja) | 楽音強調装置、畳み込みオートエンコーダ学習装置、楽音強調方法、プログラム | |
JP5342521B2 (ja) | 局所再生方法、局所再生装置及びそのプログラム | |
Olivieri et al. | Theoretical and experimental comparative analysis of beamforming methods for loudspeaker arrays under given performance constraints | |
JP6815956B2 (ja) | フィルタ係数算出装置、その方法、及びプログラム | |
WO2021255786A1 (ja) | 音響エリア再生方法、および、音響エリア再生装置 | |
JP7375904B2 (ja) | フィルタ係数最適化装置、潜在変数最適化装置、フィルタ係数最適化方法、潜在変数最適化方法、プログラム | |
JP6970366B2 (ja) | 音像再現装置、音像再現方法及び音像再現プログラム | |
JP7375905B2 (ja) | フィルタ係数最適化装置、フィルタ係数最適化方法、プログラム | |
JP7428251B2 (ja) | 目的音信号生成装置、目的音信号生成方法、プログラム | |
JP5596632B2 (ja) | フィルタ係数決定装置、局所再生装置、フィルタ係数決定方法、及びプログラム | |
JP2018077139A (ja) | 音場推定装置、音場推定方法、プログラム | |
JP7156064B2 (ja) | 潜在変数最適化装置、フィルタ係数最適化装置、潜在変数最適化方法、フィルタ係数最適化方法、プログラム | |
JP7444243B2 (ja) | 信号処理装置、信号処理方法、およびプログラム | |
JP5583181B2 (ja) | 縦続接続型伝達系パラメータ推定方法、縦続接続型伝達系パラメータ推定装置、プログラム | |
Belloch et al. | GPU-based WFS systems with mobile virtual sound sources and room compensation | |
JP7173356B2 (ja) | Psd最適化装置、psd最適化方法、プログラム | |
JP7173355B2 (ja) | Psd最適化装置、psd最適化方法、プログラム | |
Tuna et al. | Data-driven local average room transfer function estimation for multi-point equalization | |
WO2024038522A1 (ja) | 信号処理装置、信号処理方法、プログラム | |
Zotter et al. | Higher-order ambisonic microphones and the wave equation (linear, lossless) | |
CN110677782B (zh) | 信号自适应噪声过滤器 | |
WO2023002554A1 (ja) | 音響特性計算装置、音響特性計算方法、プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220707 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230926 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20231009 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7375904 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |