WO2021171532A1 - フィルタ係数最適化装置、潜在変数最適化装置、フィルタ係数最適化方法、潜在変数最適化方法、プログラム - Google Patents
フィルタ係数最適化装置、潜在変数最適化装置、フィルタ係数最適化方法、潜在変数最適化方法、プログラム Download PDFInfo
- Publication number
- WO2021171532A1 WO2021171532A1 PCT/JP2020/008232 JP2020008232W WO2021171532A1 WO 2021171532 A1 WO2021171532 A1 WO 2021171532A1 JP 2020008232 W JP2020008232 W JP 2020008232W WO 2021171532 A1 WO2021171532 A1 WO 2021171532A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- filter coefficient
- optimization
- convex
- function
- latent variable
- Prior art date
Links
- 238000005457 optimization Methods 0.000 title claims abstract description 183
- 238000000034 method Methods 0.000 title claims description 29
- 238000004364 calculation method Methods 0.000 claims description 14
- 239000013598 vector Substances 0.000 claims description 12
- 239000011159 matrix material Substances 0.000 claims description 6
- 238000005516 engineering process Methods 0.000 abstract description 2
- 230000006870 function Effects 0.000 description 74
- 238000010586 diagram Methods 0.000 description 11
- 230000004044 response Effects 0.000 description 8
- 238000004891 communication Methods 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 3
- 230000002040 relaxant effect Effects 0.000 description 3
- 230000001131 transforming effect Effects 0.000 description 3
- 239000004065 semiconductor Substances 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000006399 behavior Effects 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 239000000047 product Substances 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/20—Arrangements for obtaining desired frequency or directional characteristics
- H04R1/32—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
- H04R1/40—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/11—Complex mathematical operations for solving equations, e.g. nonlinear equations, general mathematical optimization problems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/15—Correlation function computation including computation of convolution operations
- G06F17/156—Correlation function computation including computation of convolution operations using a domain transform, e.g. Fourier transform, polynomial transform, number theoretic transform
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10K—SOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
- G10K11/00—Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
- G10K11/18—Methods or devices for transmitting, conducting or directing sound
- G10K11/26—Sound-focusing or directing, e.g. scanning
- G10K11/34—Sound-focusing or directing, e.g. scanning using electrical steering of transducer arrays, e.g. beam steering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0272—Voice signal separating
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/12—Circuits for transducers, loudspeakers or microphones for distributing signals to two or more loudspeakers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2203/00—Details of circuits for transducers, loudspeakers or microphones covered by H04R3/00 but not provided for in any of its subgroups
- H04R2203/12—Beamforming aspects for stereophonic sound reproduction with loudspeaker arrays
Definitions
- the present invention relates to a technique for optimizing the latent variables of the model to be optimized, such as the filter coefficient in the emphasis of the target sound.
- Beamforming using a microphone array is a signal processing method that emphasizes only the sound coming from a specific direction (hereinafter referred to as the target sound) and suppresses the sound coming from other directions (hereinafter referred to as the non-target sound). well known. This method has been put to practical use in conference call systems, communication systems in automobiles, smart speakers, and the like.
- LCMV linearly constrained minimum variation
- the signal is treated as a value in the time frequency domain after performing a short-time Fourier transform.
- the design of the LCMV beam former is to emphasize the target sound, which is the sound from multiple predetermined directions, while eliminating the non-purpose sound, which is an unnecessary sound, from the observation signal of the microphone array consisting of M microphone elements.
- D sound sources that are signal sources that emit sound in the distance, and that they arrive at the microphone array as a virtual plane wave. It is also assumed that all sound sources and all microphone elements are coplanar.
- the sound of the sound source d shall come from the direction ⁇ d.
- the array manifold vectors a f and d are quantities that are automatically determined for each frequency bin f from the physical characteristics of the microphone array and the entire system.
- This filter coefficient determines the behavior of the beamformer.
- the inner product w f H a f, d of the filter coefficient w f and the array manifold vectors a f, d means the response characteristic in the frequency bin f with respect to the direction ⁇ d of the beamformer. Therefore, in a situation where it is desired to always collect the sound coming from the sound source in the direction ⁇ d (that is, the sound source d) with a constant gain, the constraint condition (called the distortion-free constraint condition) of the following equation is applied to the filter coefficient w f .
- the method of imposing is often used.
- the beamformer Since the beamformer is required to suppress the non-purpose sound, it is required to set the filter coefficient w f so as to minimize the non-purpose sound under the constraint of enhancing the target sound.
- a cost function that represents the variance of non-purpose sounds. It is expected that a desired beamformer can be designed by setting the filter coefficient so as to minimize this cost function.
- the cost function L representing the variance of non-objective sounds.
- the cost function L MV_f (w f ) is as follows.
- L MV_f (w f) the filter coefficients
- the optimum filter coefficient can be obtained by solving the optimization problem of Eq. (5).
- the LCMV beamformer can be designed by solving the optimization problem of Eq. (5) or Eq. (6) explained above. This is the conventional LCMV beamformer design method.
- an object of the present invention is to provide a technique for optimizing a latent variable by solving a convex optimization problem equivalent to the non-convex optimization problem instead of solving the non-convex optimization problem.
- One aspect of the present invention is a beamformer filter coefficient in which D is an integer of 1 or more and the sound (hereinafter referred to as a target sound) from D sound sources (hereinafter referred to as sound source 1, ..., Sound source D) is emphasized.
- L convex is a strong convex function with respect to the latent variable ⁇ w
- x y_z means that y z is a superscript for x
- x y_z means that y z is a subscript for x
- L convex is a strongly convex function with respect to the latent variable ⁇ w
- the optimization problem of Eq. (7) is an optimization problem in which a non-convex function is a cost function, that is, a non-convex optimization problem.
- the larger the value of C that is, the number of divisions of the domain of the function L d ), the better the accuracy of the piecewise convex function.
- Equation (8) is equivalent to the following equation.
- the non-convex optimization problem of Eq. (7) can be transformed into the convex optimization problem of Eq. (9) equivalent to this, and the convex optimization problem of Eq. (9) is solved by the latent variable optimization algorithm of FIG. be able to.
- the constraint condition of Eq. (10) and the constraint condition of Eq. (11) are the constraint that the amplitude of the response of the beamformer is a constant value (specifically 1), and the amplitude of the response of the beamformer is a constant value (specifically). In terms of, it expresses the constraint that 1) or more is sufficient. Both the constraint condition of Eq. (10) and the constraint condition of Eq. (11) are mathematically classified as non-convex constraints.
- Eq. (11) is a constraint.
- the constraint of Eq. (11) is that the absolute value of the complex numbers w f H a f, d is 1 or more. This means that geometrically, the complex numbers w f H a f, d must be located on or outside the unit circle on the complex plane. Therefore, first, the complex plane is equally divided into C sectors centered on the origin. These C sectors correspond to the C regions mentioned earlier. Then, at the boundary and inside of each sector, the original constraint equation (11) is approximated by C convex functions.
- R (z) represents the real part of the complex number z.
- FIG. 2A, 2B, 2C, and 2D are diagrams showing how the equation (11) is approximated by C convex functions ⁇ (f, d), c_f, d ( ⁇ f, d).
- FIG. 2A illustrates the constraint condition of the equation (11) on the complex plane and represents an approximation target.
- FIG. 2B illustrates an example of the convex functions ⁇ (f, d), c_f, d ( ⁇ f, d) introduced for approximation.
- FIG. 3 shows a filter coefficient optimization algorithm obtained based on the latent variable optimization algorithm of FIG.
- the amplitude of the response w f H a f, i at the frequency bin f at the point i should be equal to or higher than a certain value.
- the amplitude of the response w f H b f, j at the frequency bin f at the point j to be as small as possible. Therefore, this filter coefficient optimization problem is formulated by the following equation.
- the filter coefficient optimization device 100 uses a microphone array composed of M microphone elements (where M is an integer of 1 or more) and uses D sound sources (where D is an integer of 1 or more) sound sources (hereinafter, sound source 1).
- the beamformer's filter coefficient w ⁇ w 1 ,..., w F ⁇ (hereinafter referred to as the target sound) that emphasizes the target sound from the signal (observation signal) that observes the sound (hereinafter referred to as the target sound) from (referred to as sound source D).
- FIG. 4 is a block diagram showing the configuration of the filter coefficient optimizing device 100.
- FIG. 5 is a flowchart showing the operation of the filter coefficient optimizing device 100.
- the filter coefficient optimization device 100 includes a setup data calculation unit 110, an optimization unit 120, and a recording unit 190.
- the recording unit 190 is a component unit that appropriately records information necessary for processing of the filter coefficient optimizing device 100.
- the recording unit 190 records, for example, the filter coefficient to be optimized.
- the setup data calculation unit 110 calculates the setup data used when optimizing the filter coefficient w by using the optimization data.
- the optimization unit 120 calculates the optimum value w * of the filter coefficient w using the setup data generated in S110.
- the optimum value w * may be calculated by solving a f, d)).
- C is an integer of 1 or more
- FIG. 6 is a block diagram showing the configuration of the optimization unit 120.
- FIG. 7 is a flowchart showing the operation of the optimization unit 120. As shown in FIG. 6, the optimization unit 120 includes a candidate calculation unit 122 and an optimum value determination unit 123.
- the candidate calculation unit 122 sets the optimum value of the filter coefficient w f by the following equation for all possible values of the discrete variables (c f, 1 , ..., c f, D) for each frequency bin f. Calculate the candidate w f candidate [(c f, 1 ,..., c f, D )].
- the filter coefficient can be optimized by solving the convex optimization problem equivalent to the non-convex optimization problem instead of solving the non-convex optimization problem.
- the latent variable optimization device 100 calculates the optimum value ⁇ w * of the latent variable ⁇ w from the optimization data.
- the optimization data is input data used for optimizing latent variables, or a set of input data and output data used for optimizing latent variables.
- C is an integer of 1 or more
- FIG. 4 is a block diagram showing the configuration of the latent variable optimization device 100.
- FIG. 5 is a flowchart showing the operation of the latent variable optimization device 100.
- the latent variable optimization device 100 includes a setup data calculation unit 110, an optimization unit 120, and a recording unit 190.
- the recording unit 190 is a component unit that appropriately records information necessary for processing of the latent variable optimization device 100.
- the recording unit 190 records, for example, a latent variable to be optimized.
- the setup data calculation unit 110 calculates the setup data used when optimizing the latent variables ⁇ w using the optimization data.
- the optimization unit 120 calculates the optimum value ⁇ w * of the latent variable ⁇ w using the setup data generated in S110.
- FIG. 6 is a block diagram showing the configuration of the optimization unit 120.
- FIG. 7 is a flowchart showing the operation of the optimization unit 120.
- the optimization unit 120 includes a candidate calculation unit 122 and an optimum value determination unit 123.
- the candidate calculation unit 122 sets the candidate for the optimum value of the latent variable ⁇ w to all the possible values of the discrete variable (c 1 ,..., c D ) by the following equation ⁇ w candidate [(c 1 ,, c D). ..., C D )] is calculated.
- the candidate that minimizes the value of ( ⁇ w) is the optimum value ⁇ w * .
- the filter coefficient optimizer 100 is configured by using K (however, K is an integer of 1 or more) undirected speakers, and N + M are predetermined (however, N and M are integers of 1 or more).
- K is an integer of 1 or more
- N + M are predetermined (however, N and M are integers of 1 or more).
- the optimization data is input data used for optimizing latent variables, or a set of input data and output data used for optimizing latent variables.
- FIG. 4 is a block diagram showing the configuration of the filter coefficient optimizing device 100.
- FIG. 5 is a flowchart showing the operation of the filter coefficient optimizing device 100.
- the filter coefficient optimization device 100 includes a setup data calculation unit 110, an optimization unit 120, and a recording unit 190.
- the recording unit 190 is a component unit that appropriately records information necessary for processing of the filter coefficient optimizing device 100.
- the recording unit 190 records, for example, the filter coefficient to be optimized.
- the setup data calculation unit 110 calculates the setup data used when optimizing the filter coefficient w by using the optimization data.
- the optimization unit 120 calculates the optimum value w * of the filter coefficient w using the setup data generated in S110.
- 2. Note that ⁇ f 1 F
- ⁇ j 1 M
- 2 is called a cost function related to the filter coefficient w.
- C is an integer of 1 or more
- c f (c f) , 1 ,..., c f, N )
- FIG. 6 is a block diagram showing the configuration of the optimization unit 120.
- FIG. 7 is a flowchart showing the operation of the optimization unit 120. As shown in FIG. 6, the optimization unit 120 includes a candidate calculation unit 122 and an optimum value determination unit 123.
- the candidate calculation unit 122 sets the optimum value of the filter coefficient w f by the following equation for all possible values of the discrete variables (c f, 1 , ..., c f, N) for each frequency bin f. Calculate the candidate w f candidate [(c f, 1 ,..., c f, N )].
- 2 + ⁇ i 1 N ⁇ (f, i), c_f, i (w f H a f, i )
- the candidate that minimizes the value is the optimum value w f *, and w
- the filter coefficient can be optimized by solving the convex optimization problem equivalent to the non-convex optimization problem instead of solving the non-convex optimization problem.
- FIG. 8 is a diagram showing an example of a functional configuration of a computer that realizes each of the above-mentioned devices.
- the processing in each of the above-mentioned devices can be carried out by causing the recording unit 2020 to read a program for causing the computer to function as each of the above-mentioned devices, and operating the control unit 2010, the input unit 2030, the output unit 2040, and the like.
- the device of the present invention is, for example, as a single hardware entity, an input unit to which a keyboard or the like can be connected, an output unit to which a liquid crystal display or the like can be connected, and a communication device (for example, a communication cable) capable of communicating outside the hardware entity.
- Communication unit CPU (Central Processing Unit, cache memory, registers, etc.) to which can be connected, RAM and ROM as memory, external storage device as hard hardware, and input, output, and communication units of these , CPU, RAM, ROM, has a connecting bus so that data can be exchanged between external storage devices.
- a device (drive) or the like capable of reading and writing a recording medium such as a CD-ROM may be provided in the hardware entity.
- a physical entity equipped with such hardware resources includes a general-purpose computer and the like.
- the external storage device of the hardware entity stores the program required to realize the above-mentioned functions and the data required for processing this program (not limited to the external storage device, for example, reading a program). It may be stored in a ROM, which is a dedicated storage device). Further, the data obtained by the processing of these programs is appropriately stored in a RAM, an external storage device, or the like.
- each program stored in the external storage device (or ROM, etc.) and the data necessary for processing each program are read into the memory as needed, and are appropriately interpreted, executed, and processed by the CPU. ..
- the CPU realizes a predetermined function (each component represented by the above, ..., ... Means, etc.).
- the present invention is not limited to the above-described embodiment, and can be appropriately modified without departing from the spirit of the present invention. Further, the processes described in the above-described embodiment are not only executed in chronological order according to the order described, but may also be executed in parallel or individually depending on the processing capacity of the device that executes the processes or if necessary. ..
- the processing function in the hardware entity (device of the present invention) described in the above embodiment is realized by a computer
- the processing content of the function that the hardware entity should have is described by a program.
- the processing function in the above hardware entity is realized on the computer.
- the program that describes this processing content can be recorded on a computer-readable recording medium.
- the computer-readable recording medium may be, for example, a magnetic recording device, an optical disk, a photomagnetic recording medium, a semiconductor memory, or the like.
- a hard disk device, a flexible disk, a magnetic tape, or the like as a magnetic recording device is used as an optical disk
- a DVD (Digital Versatile Disc), a DVD-RAM (Random Access Memory), or a CD-ROM (Compact Disc Read Only) is used as an optical disk.
- Memory CD-R (Recordable) / RW (ReWritable), etc.
- MO Magnetto-Optical disc
- EP-ROM Electroically Erasable and Programmable-Read Only Memory
- semiconductor memory can be used.
- the distribution of this program is carried out, for example, by selling, transferring, renting, etc., a portable recording medium such as a DVD or CD-ROM on which the program is recorded. Further, the program may be stored in the storage device of the server computer, and the program may be distributed by transferring the program from the server computer to another computer via a network.
- a computer that executes such a program first stores, for example, a program recorded on a portable recording medium or a program transferred from a server computer in its own storage device. Then, when the process is executed, the computer reads the program stored in its own storage device and executes the process according to the read program. Further, as another execution form of this program, a computer may read the program directly from a portable recording medium and execute processing according to the program, and further, the program is transferred from the server computer to this computer. It is also possible to execute the process according to the received program one by one each time. In addition, the above processing is executed by a so-called ASP (Application Service Provider) type service that realizes the processing function only by the execution instruction and result acquisition without transferring the program from the server computer to this computer. May be.
- the program in this embodiment includes information to be used for processing by a computer and equivalent to the program (data that is not a direct command to the computer but has a property of defining the processing of the computer, etc.).
- the hardware entity is configured by executing a predetermined program on the computer, but at least a part of these processing contents may be realized in terms of hardware.
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- Computational Mathematics (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Analysis (AREA)
- Otolaryngology (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Databases & Information Systems (AREA)
- Algebra (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Multimedia (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Operations Research (AREA)
- Filters That Use Time-Delay Elements (AREA)
- Complex Calculations (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
非凸最適化問題を解く代わりに、当該問題と等価な凸最適化問題を解くことにより、潜在変数を最適化する技術を提供する。Lconvexを潜在変数~wに関する強凸関数、Ldを潜在変数~wに関する関数とし、最適化問題min~w(Lconvex(~w)+Σd=1
DLd(~w))に基づいて、潜在変数~wの最適値~w*を計算する最適化部を含む潜在変数最適化装置であって、Sd,1,…,Sd,Cを関数Ldの定義域をC個の閉凸集合に分割することにより得られる領域、Λd,cを領域Sd,cで定義され、関数Ldを近似する凸関数、cdを1,…,Cを値にとる離散変数とし、最適化部は、上記最適化問題を解く代わりに、最適化問題minc_1,…,c_D(min~w(Lconvex(~w)+Σd=1
DΛd,c_d(~w)))を解くことにより最適値~w*を計算する。
Description
本発明は、目的音強調におけるフィルタ係数など最適化の対象となるモデルの潜在変数を最適化する技術に関する。
特定の方角から到来する音(以下、目的音という)のみを強調し、その他の方角から到来する音(以下、非目的音という)を抑圧する信号処理手法として、マイクロホンアレイを用いたビームフォーミングがよく知られている。この手法は、電話会議システム、自動車内のコミュニケーションシステム、スマートスピーカー等で実用化されている。
これまでに提案されているビームフォーマの設計手法の例として、複数の方角に強調したい音源がある状況で、複数の音源方向に対する応答に関して制約を課しつつ非目的音を抑圧するものがある。その一つに、線形拘束付最小分散型(Linearly Constrained Minimum Variance, LCMV)ビームフォーマがある(非特許文献1参照)。LCMVビームフォーマは、複数の方角に対するビームフォーマの応答に等式制約を課すことで目的音を強調しつつ、出力信号の分散を最小化することで非目的音を抑圧する。以下、LCMVビームフォーマの設計手法について詳しく説明する。
まず、種々の定義とノーテーションを導入する。以下では、信号を短時間フーリエ変換(Short-Time Fourier Transform)を行った後の時間周波数領域の値として扱う。
時間フレームの添字をt=1, …, T、周波数ビンの添字をf=1, …, Fで表す。また、ベクトルvや行列Mの複素共役転置を、vHやMHのように上付きのHで表す。
LCMVビームフォーマの設計は、M個のマイク素子からなるマイクアレイの観測信号から、不要な音である非目的音を消去しつつ予め定めた複数の方角からの音である目的音を強調するような線形フィルタ(ビームフォーマ)を構成するというものである。時間フレームt、周波数ビンfにおけるマイクアレイのMチャンネルの観測信号をxf,t∈CM(f=1, …, F, t=1, …, T)とおく。ここで、音を発する信号源である音源が遠方にD個存在し、マイクアレイには事実上の平面波として到来しているという状況を仮定する。また、すべての音源とすべてのマイク素子が同一平面上にあることを仮定する。音源d (d=1, …, D)から放音されマイクアレイに時間フレームt、周波数ビンfに到来する信号をsd,f,t∈C(d=1, …, D, f=1, …, F, t=1, …, T)とおく。音源dの音は、方角θdから到来するものとする。ここで、方角θdは既知であると仮定する。
音源dからマイクアレイのM個のマイク素子への周波数ビンfでのアレイマニフォールドベクトル(以下、方角θdから到来する平面波の音波に対応する周波数ビンfでのアレイマニフォールドベクトルという)をaf,d∈CM(f=1, …, F, d=1, …, D)とおくと、観測信号をxf,tは、次式により表される。
ただし、nf,t(f=1, …, F, t=1, …, T)は観測の過程で加わる雑音やその他残響・非方向性雑音からなるノイズ成分を表す。なお、アレイマニフォールドベクトルaf,dはマイクアレイや系全体の物理的特性から、周波数ビンf毎に自動的に決まる量である。
以下、周波数ビンfでの線形フィルタをwf∈CM(f=1, …, F)と表し、これをビームフォーマのフィルタ係数と呼ぶ。このフィルタ係数が、ビームフォーマの動作を定める。
ビームフォーマの出力信号yf,t(f=1, …, F, t=1, …, T)は、次式により表される。
つまり、ビームフォーマの設計とは、式(2)を満たすフィルタ係数wf(f=1, …, F)をいかに設計するかということである。
ここで、フィルタ係数wfとアレイマニフォールドベクトルaf,dの内積wf
Haf,dはビームフォーマの方角θdに対する周波数ビンfでの応答特性を意味する。したがって、方角θdの音源(つまり、音源d)から到来する音を必ず一定のゲインで集音したいという状況では、次式の制約条件(無歪制約条件という)をフィルタ係数wfに対して課すという方法がしばしば用いられる。
(ただし、f=1, …, F)
この無歪制約条件を満たしつつ、不要な音源からの信号に対するゲインができるだけ小さくなるようにフィルタ係数wfを設定することで、音源dから到来する音の強調が達成できる。
この無歪制約条件を満たしつつ、不要な音源からの信号に対するゲインができるだけ小さくなるようにフィルタ係数wfを設定することで、音源dから到来する音の強調が達成できる。
なお、複数の音源から到来する音を同時に強調したい場合には、この無歪制約条件を複数個同時に課せばよい。
ビームフォーマには非目的音を抑圧することが要求されるため、目的音強調という制約のもと非目的音を最小化するように、フィルタ係数wfを設定することが求められる。このことを数学的に定式化するために、非目的音の分散を表すコスト関数を定義する。このコスト関数を最小化するようにフィルタ係数を設定することで、所望のビームフォーマが設計できると期待される。
非目的音の空間相関行列Rf(f=1, …, F)をRf:=Et[xf,txf,t
H]と定義すると、非目的音の分散を表すコスト関数LMV_f(wf)が周波数ビンf=1, …, Fごとに定義できる。具体的には、コスト関数LMV_f(wf)は次式のようになる。
式(3)の制約条件のもと、このコスト関数LMV_f(wf)の和を最小化するように、フィルタ係数wf(f=1, …, F)を設定することで、ビームフォーマを設計できる。このことを数式で表すと、次式の最適化問題となる。
式(5)の最適化問題を解くことにより、最適なフィルタ係数を得ることができる。
なお、式(5)の最適化問題は、周波数ビンf=1, …, Fごとに別々の最適化問題に分離することができる。つまり、式(5)の最適化問題の代わりに、周波数ビンfについて、次式の最適化問題を解くようにしてもよい。
以上説明した式(5)または式(6)の最適化問題を解くことにより、LCMVビームフォーマを設計することができる。これが従来のLCMVビームフォーマの設計手法である。
浅野 太, "日本音響学会編 音響テクノロジーシリーズ16 音のアレイ信号処理 -音源の定位・追跡と分離-", コロナ社, pp.86-90, 2011.
従来のLCMVビームフォーマの設計手法では、式(3)の制約条件により、ビームフォーマの応答の振幅(つまり、入力信号に対する出力信号の振幅比)と位相(つまり、入力信号に対する出力信号の位相遅延)の両者に厳格な制約を課す。そのため、式(5)または式(6)の最適化問題、すなわち、”s.t. …”以下の条件を満たす範囲で、コスト関数ΣfLMV_f(wf)またはコスト関数LMV_f(wf)を最小化するようなフィルタ係数を求めるという問題には、式(3)の制約条件の数が多すぎるとフィルタ係数の取り得る値の範囲が著しく制限され、非目的音を抑圧することが可能なフィルタ係数を求めることが困難になってしまうという問題があった。
この問題を解消するために、式(3)の制約条件の代わりに、より緩いコスト関数や制約条件を導入し、最適化問題の解がないという状況を避ける方法が考えられる。しかし、この場合、コスト関数の形や制約条件を緩和することにより、ビームフォーマの設計にあたって解くべき最適化問題が数学的には非凸最適化となり、最適化問題を解くのが困難になることがあった。
そこで本発明では、非凸最適化問題を解く代わりに、当該問題と等価な凸最適化問題を解くことにより、潜在変数を最適化する技術を提供することを目的とする。
本発明の一態様は、Dを1以上の整数とし、D個の音源(以下、音源1、…、音源Dとする)からの音(以下、目的音という)を強調するビームフォーマのフィルタ係数w={w1, …, wF}(ただし、wf(f=1, …, F、Fは1以上の整数)は周波数ビンfのフィルタ係数)の最適値w*を計算する最適化部を含むフィルタ係数最適化装置であって、Rf(f=1, …, F)を周波数ビンfに関する前記目的音以外の音の空間相関行列、LMV_f(wf)=wf
HRfwf(f=1, …, F)をフィルタ係数wfに関するコスト関数とし、前記最適化部は、所定の制約条件のもとでのフィルタ係数wに関する最適化問題minw_1, …, w_FΣf=1
FLMV_f(wf)に基づいて、前記最適値w*を計算するものであり、前記所定の制約条件は、フィルタ係数wf(f=1, …, F)の位相に関する制約を含まないものである。
本発明の一態様は、Lconvexを潜在変数~wに関する強凸関数、Ld(d=1, …, D、Dは1以上の整数)を潜在変数~wに関する関数とし、潜在変数~wに関する最適化問題min~w(Lconvex(~w)+Σd=1
DLd(~w))に基づいて、潜在変数~wの最適値~w*を計算する最適化部を含む潜在変数最適化装置であって、Cを1以上の整数、Sd,1, …, Sd,C(d=1, …, D)を関数Ldの定義域をC個の閉凸集合に分割することにより得られる領域、Λd,c(d=1, …, D, c=1, …, C)を領域Sd,cで定義され、関数Ldを近似する凸関数、cd(d=1, …, D)を1, …, Cを値にとる離散変数とし、前記最適化部は、前記最適化問題min~w(Lconvex(~w)+Σd=1
DLd(~w))を解く代わりに、潜在変数~w、離散変数c1, …, cDに関する最適化問題minc_1, …, c_D(min~w(Lconvex(~w)+Σd=1
DΛd,c_d(~w)))を解くことにより前記最適値~w*を計算する。
本発明によれば、非凸最適化問題を解く代わりに、当該問題と等価な凸最適化問題を解くことにより、潜在変数を最適化することが可能となる。
以下、本発明の実施の形態について、詳細に説明する。なお、同じ機能を有する構成部には同じ番号を付し、重複説明を省略する。
各実施形態の説明に先立って、この明細書における表記方法について説明する。
_(アンダースコア)は下付き添字を表す。例えば、xy_zはyzがxに対する上付き添字であり、xy_zはyzがxに対する下付き添字であることを表す。
また、ある文字xに対する^xや~xのような上付き添え字の”^”や”~”は、本来”x”の真上に記載されるべきであるが、明細書の記載表記の制約上、^xや~xと記載しているものである。
<技術的背景>
まず、非凸最適化問題を、当該問題と等価な凸最適化問題に変形する方法及び変形により得られる凸最適化問題を解く方法について説明する。次に、この方法を式(3)の制約条件を緩和することにより得られる非凸最適化問題へ適用した例について説明する。最後に、音源強調以外に適用した例について説明する。
まず、非凸最適化問題を、当該問題と等価な凸最適化問題に変形する方法及び変形により得られる凸最適化問題を解く方法について説明する。次に、この方法を式(3)の制約条件を緩和することにより得られる非凸最適化問題へ適用した例について説明する。最後に、音源強調以外に適用した例について説明する。
《非凸最適化問題と等価な凸最適化問題への変形及びその解法》
ここでは、非凸最適化問題を、当該問題と等価な凸最適化問題に変形する方法と、変形により得られる凸最適化問題を解く方法とについて説明する。以下、次式により定義される潜在変数~wに関する最適化問題を考える。
ここでは、非凸最適化問題を、当該問題と等価な凸最適化問題に変形する方法と、変形により得られる凸最適化問題を解く方法とについて説明する。以下、次式により定義される潜在変数~wに関する最適化問題を考える。
ここで、Lconvexは潜在変数~wに関する強凸関数、Ld(d=1, …, D、Dは1以上の整数)は潜在変数~wに関する関数である。つまり、関数Ld(d=1, …, D)は必ずしも凸である必要はない。
一般に、式(7)の最適化問題は、非凸な関数をコスト関数とする最適化問題、すなわち、非凸最適化問題となる。先述の通り、非凸最適化問題は困難な問題であるため、ある種の近似を導入してより解きやすい凸最適化問題に帰着させることを考える。そこで、ここでは関数Ld(~w) (d=1, …, D)を複数の凸関数から構成される区分的凸関数(piecewise convex function)で近似することを考える。
以下、区分的凸関数の定義について説明する。近似対象となる関数Ld(~w) (d=1, …, D)に対して、その定義域をC個の閉凸集合である領域Sd,1, …, Sd,Cに分割する。そして、領域Sd,1, …, Sd,Cの各々で定義される関数Λd,c(c=1, …, C)を導入する。この新たに導入する関数Λd,cは領域Sd,c上で凸関数であり、領域Sd,c上で関数Ldを近似する関数である。なお、関数Ldが領域Sd,c上で凸関数である場合は、領域Sd,c上でΛd,c=Ldとすればよい。これにより、関数Ld(~w)は、区分的凸関数Λd,c(c=1, …, C)により近似的に表すことができる。なお、一般に、Cの値(つまり、関数Ldの定義域を分割する数)を大きくするほど、よりよい精度の区分的凸関数で近似することができる。
しかし、当該近似を用いると、式(7)の最適化問題による最適化対象である潜在変数に加え、最適化問題の解である最適値がどの領域に属しているかを表す離散変数が新たに最適化対象として加わり、最適化すべき変数の数が増えてしまう。ただし、離散変数を固定すると、潜在変数に対しては最適化問題が(非凸最適化ではなく)凸最適化に帰着されるため、比較的容易に解くことができる。以下、具体的に説明する。近似を用いて定式化される最適化問題は、cd(d=1, …, D)を1, …, Cを値にとる離散変数として、次式により表される。
式(8)は次式と等価である。
式(9)に含まれるmin~w(Lconvex(~w)+Σd=1
DΛd,c_d(~w))は、潜在変数~wに関する凸最適化問題であり、比較的容易に解くことができる。以下、その手順について説明する。まず、離散変数(c1, …, cD)がとり得るすべての値に対して、凸最適化問題min~w(Lconvex(~w)+Σd=1
DΛd,c_d(~w))を解く。これにより、CD個の離散変数(c1, …, cD)がとり得るすべての値について凸最適化問題min~w(Lconvex(~w)+Σd=1
DΛd,c_d(~w))の解が求まる。そして、得られた凸最適化問題の解のうち、コスト関数Lconvex(~w)+Σd=1
DΛd,c_d(~w)の値が最小となるものを最適値とする。これにより、式(9)の最適化問題を解くことができる。この解法の手順を図示したものが図1である。
式(7)の非凸最適化問題は、これと等価な式(9)の凸最適化問題に変形でき、式(9)の凸最適化問題は、図1の潜在変数最適化アルゴリズムにより解くことができる。
《適用例》
ここでは、上記説明した、非凸最適化問題を凸最適化問題に変形したうえで最適値を求める汎用的な枠組みを、式(3)の制約条件を緩和することにより得られる非凸最適化問題へ適用した例について説明する。
ここでは、上記説明した、非凸最適化問題を凸最適化問題に変形したうえで最適値を求める汎用的な枠組みを、式(3)の制約条件を緩和することにより得られる非凸最適化問題へ適用した例について説明する。
先述の通り、非特許文献1の従来技術では、等式制約である式(3)を多数課すため、適切なフィルタ係数が得られないというおそれがあった。そこで、現実の状況に適した、より緩い制約条件を用いることを考える。具体的には、式(3)の制約条件の代わりに、ビームフォーマの応答の振幅にのみ制約を課す制約条件(つまり、位相に関する制約がない制約条件)を用いることを考える。例えば、次式を用いることができる。
また、別の例として、次式を用いることもできる。
式(10)の制約条件、式(11)の制約条件は、それぞれビームフォーマの応答の振幅が一定値(具体的には1)であるという制約、ビームフォーマの応答の振幅が一定値(具体的には1)以上であればよいという制約を表す。式(10)の制約条件、式(11)の制約条件は、いずれも数学的には非凸な制約として分類されるものである。
以下、式(11)を制約条件とする最適化問題について考える。式(11)の制約条件は、複素数wf
Haf,dの絶対値が1以上であるというものである。これは、幾何学的には、複素数wf
Haf,dが複素平面上で単位円上かその外側に位置しなければならないということを意味する。そこで、まず、複素平面を、原点を中心にC個の扇形に等分する。このC個の扇形が、先ほどのC個の領域に相当する。そして、各扇形の境界と内側において、元の制約である式(11)をC個の凸関数で近似する。
以下、具体的に説明する。周波数ビンf(f=1, …, F)、音源d(d=1, …, D)に対して離散変数cf,dを1, …, Cを値にとる変数とする。また、γf,d=wf
Haf,dとする。周波数ビンf(f=1, …, F)、音源d(d=1, …, D)に対して定義される凸関数Λ(f,d),c_f,d(γf,d)(cf,d=1, …, C)は、複素数γf,dの値を、複素平面上の中心角2π/Cで原点を中心とする扇形の内側かつ|γf,d|≧1を満たす範囲にあるように制限するものとして定義する。
例えば、関数Λ(f,d),c_f,dを次式で表される関数とすることができる。
ここで、R(z)は複素数zの実部を表す。
そして、C個の凸関数Λ(f,d),c_f,d(γf,d)(cf,d=1, …, C)を用いた区分的凸関数で式(11)を近似する。
図2A、図2B、図2C、図2Dは、式(11)をC個の凸関数Λ(f,d),c_f,d(γf,d)で近似する様子を示す図である。図2Aは、複素平面上の式(11)の制約条件を図示したものであり、近似対象を表す。図2Bは、近似のために導入された凸関数Λ(f,d),c_f,d(γf,d)の一例を図示したものである。図2C及び図2Dは、最小値minc_f,d=1,…,CΛ(f,d),c_f,d(γf,d)を図示したものあり、図2CはC=6の場合、図2DはC=10の場合の図である。
なお、Cの値を大きくすると、より精度よく近似できるようになるが、図1のアルゴリズムを用いて最適化問題を解く場合、離散変数のすべての組合せを調べる必要があるため、計算量が増大する。
以上より、式(11)を制約条件とするフィルタ係数最適化問題は次式の凸最適化問題に帰着する。
ここで、cf=(cf,1, …, cf,D)である。
この最適化問題は、図1の潜在変数最適化アルゴリズムを適用することで解くことができるものであり、そのアルゴリズムを図3に示す。つまり、図3は、図1の潜在変数最適化アルゴリズムに基づいて得られるフィルタ係数最適化アルゴリズムを示す。
《局所再生システムへの適用》
ここでは、別の適用例について説明する。具体的には、多数のスピーカを用いた局所再生システムについて説明する。
ここでは、別の適用例について説明する。具体的には、多数のスピーカを用いた局所再生システムについて説明する。
空間中に無指向性スピーカがK個存在し、N+M個の受聴点のうち、前半のN個の点では音を再生しつつ後半のM個の点では音が漏れないような局所再生システムを構成することを考える。そのために、1ch音源に線形フィルタを畳み込んで各スピーカから再生する信号処理を行う。
これまでの説明と同様、時間周波数領域で議論する。音を再生するN個の点については、周波数ビンfでのK個の無指向性スピーカから点i(i=1, …, N)へのアレイマニフォールドベクトルをaf,i∈CKとする。また、音が漏れないようにするM個の点については、周波数ビンfでのK個の無指向性スピーカから点j(j=1, …, M)へのアレイマニフォールドベクトルをbf,j∈CKとする。また、設計したいフィルタ係数をwf(f=1, …, F)とする。
音を再生する点i(i=1, …, N)に関しては、点iにおける周波数ビンfでの応答wf
Haf,iの振幅が一定値以上であってほしい。一方、音が漏れてほしくない点j(j=1, …, M)に関しては、点jにおける周波数ビンfでの応答wf
Hbf,jの振幅ができるだけ小さい値になってほしい。したがって、このフィルタ係数の最適化問題は次式により定式化される。
式(14)の最適化問題は、図3のアルゴリズムと同様のアルゴリズムにより解くことができるため、所望の局所再生システムを設計することができる。
<第1実施形態>
フィルタ係数最適化装置100は、M個(ただし、Mは1以上の整数)のマイク素子からなるマイクアレイを用いて、D個(ただし、Dは1以上の整数)の音源(以下、音源1、…、音源Dとする)からの音(以下、目的音という)を観測した信号(観測信号)から、目的音を強調するビームフォーマのフィルタ係数w={w1, …, wF}(ただし、wf(f=1, …, F、Fは1以上の整数)は周波数ビンfのフィルタ係数)の最適値w*を計算する。観測信号はフィルタ係数の最適化に用いる入力データであるため、以下、観測信号のことを最適化用データということにする。
フィルタ係数最適化装置100は、M個(ただし、Mは1以上の整数)のマイク素子からなるマイクアレイを用いて、D個(ただし、Dは1以上の整数)の音源(以下、音源1、…、音源Dとする)からの音(以下、目的音という)を観測した信号(観測信号)から、目的音を強調するビームフォーマのフィルタ係数w={w1, …, wF}(ただし、wf(f=1, …, F、Fは1以上の整数)は周波数ビンfのフィルタ係数)の最適値w*を計算する。観測信号はフィルタ係数の最適化に用いる入力データであるため、以下、観測信号のことを最適化用データということにする。
以下、図4~図5を参照してフィルタ係数最適化装置100を説明する。図4は、フィルタ係数最適化装置100の構成を示すブロック図である。図5は、フィルタ係数最適化装置100の動作を示すフローチャートである。図4に示すようにフィルタ係数最適化装置100は、セットアップデータ計算部110と、最適化部120と、記録部190を含む。記録部190は、フィルタ係数最適化装置100の処理に必要な情報を適宜記録する構成部である。記録部190は、例えば、最適化対象となるフィルタ係数を記録する。
図5に従いフィルタ係数最適化装置100の動作について説明する。
S110において、セットアップデータ計算部110は、最適化用データを用いて、フィルタ係数wを最適化する際に用いるセットアップデータを計算する。フィルタ係数wを最適化するためにコスト関数を用いる場合、セットアップデータとして、例えば、観測信号に基づいて得られる、周波数ビンfに関する目的音以外の音の空間相関行列Rf(f=1, …, F)、音源dが存在する方角θd(d=1, …, D)から到来する平面波の音波に対応する周波数ビンfでのアレイマニフォールドベクトルaf,d(f=1, …, F, d=1, …, D)がある。
S120において、最適化部120は、S110で生成したセットアップデータを用いてフィルタ係数wの最適値w*を計算する。例えば、最適化部120は、フィルタ係数wf(f=1, …, F)の位相に関する制約を含まないという制約条件のもとでのフィルタ係数wに関する最適化問題minw_1, …, w_FΣf=1
FLMV_f(wf)に基づいて、最適値w*を計算することができる。ここで、LMV_f(wf)=wf
HRfwf(f=1, …, F)はフィルタ係数wfに関するコスト関数である。なお、Σf=1
FLMV_f(wf)のことをフィルタ係数wに関するコスト関数という。
フィルタ係数wf(f=1, …, F)の位相に関する制約を含まないという制約条件の例として、次式により表現されるものがある。
(ただし、f=1, …, F, d=1, …, D)
また、制約条件の別の例として、次式により表現されるものがある。
また、制約条件の別の例として、次式により表現されるものがある。
(ただし、f=1, …, F, d=1, …, D)
最適化部120は、制約条件(*)のもとで最適化問題minw_1, …, w_FΣf=1 FLMV_f(wf)を解く代わりに、フィルタ係数w、離散変数c1, …, cFに関する最適化問題min{c_f,w_f}(Σf=1 FLMV_f(wf)+Σf=1 FΣd=1 DΛ(f,d),c_f,d(wf Haf,d))を解くことにより最適値w*を計算するようにしてもよい。ここで、Cを1以上の整数、cf,d(f=1, …, F, d=1, …, D)を1, …, Cを値にとる離散変数、cf=(cf,1, …, cf,D) (f=1, …, F)を離散変数cf,1, …, cf,Dにより定義される離散変数とし、関数Λ(f,d),c_f,d (f=1, …, F, d=1, …, D)は次式で定義される変数γf,dに関する関数である(ただし、γf,d=wf Haf,d)。
最適化部120は、制約条件(*)のもとで最適化問題minw_1, …, w_FΣf=1 FLMV_f(wf)を解く代わりに、フィルタ係数w、離散変数c1, …, cFに関する最適化問題min{c_f,w_f}(Σf=1 FLMV_f(wf)+Σf=1 FΣd=1 DΛ(f,d),c_f,d(wf Haf,d))を解くことにより最適値w*を計算するようにしてもよい。ここで、Cを1以上の整数、cf,d(f=1, …, F, d=1, …, D)を1, …, Cを値にとる離散変数、cf=(cf,1, …, cf,D) (f=1, …, F)を離散変数cf,1, …, cf,Dにより定義される離散変数とし、関数Λ(f,d),c_f,d (f=1, …, F, d=1, …, D)は次式で定義される変数γf,dに関する関数である(ただし、γf,d=wf Haf,d)。
以下、図6~図7を参照して、最適化問題min{c_f,w_f}(Σf=1
FLMV_f(wf)+Σf=1
FΣd=1
DΛ(f,d),c_f,d(wf
Haf,d))を解くための最適化部120について説明する。図6は、最適化部120の構成を示すブロック図である。図7は、最適化部120の動作を示すフローチャートである。図6に示すように最適化部120は、候補計算部122、最適値決定部123を含む。
図7に従い最適化部120の動作について説明する。
S122において、候補計算部122は、周波数ビンfごとに、離散変数(cf,1, …, cf,D)がとり得るすべての値に対して、次式によりフィルタ係数wfの最適値の候補wf
candidate[(cf,1, …, cf,D)]を計算する。
S123において、最適値決定部123は、周波数ビンfごとに、S122で計算した候補wf
candidate[(cf,1, …, cf,D)]のうち、コスト関数LMV_f(wf)+Σd=1
DΛ(f,d),c_f,d(wf
Haf,d)の値を最小とする候補を最適値wf
*とし、w*={w1
*, …, wF
*}により最適値w*を得る。
本発明の実施形態によれば、非凸最適化問題を解く代わりに、当該問題と等価な凸最適化問題を解くことにより、フィルタ係数を最適化することが可能となる。
<第2実施形態>
ここでは、非凸最適化問題と等価な凸最適化問題を解くための一般的な実施形態について説明する。
ここでは、非凸最適化問題と等価な凸最適化問題を解くための一般的な実施形態について説明する。
潜在変数最適化装置100は、最適化用データから、潜在変数~wの最適値~w*を計算する。ここで、最適化用データとは潜在変数の最適化に用いる入力データ、または、潜在変数の最適化に用いる入力データと出力データの組である。
潜在変数最適化装置100は、潜在変数~wに関する最適化問題min~w(Lconvex(~w)+Σd=1
DLd(~w))(ただし、Lconvexは潜在変数~wに関する強凸関数、Ld(d=1, …, D、Dは1以上の整数)は潜在変数~wに関する関数)に基づいて、最適値~w*を計算する。例えば、潜在変数最適化装置100は、最適化問題min~w(Lconvex(~w)+Σd=1
DLd(~w))を解く代わりに、潜在変数~w、離散変数c1, …, cDに関する最適化問題minc_1, …, c_D(min~w(Lconvex(~w)+Σd=1
DΛd,c_d(~w)))を解くことにより最適値~w*を計算する。ここで、Cを1以上の整数、Sd,1, …, Sd,C(d=1, …, D)を関数Ldの定義域をC個の閉凸集合に分割することにより得られる領域とし、関数Λd,c(d=1, …, D, c=1, …, C)は領域Sd,cで定義され、関数Ldを近似する凸関数である。また、変数cd(d=1, …, D)は1, …, Cを値にとる離散変数である。
以下、図4~図5を参照して潜在変数最適化装置100を説明する。図4は、潜在変数最適化装置100の構成を示すブロック図である。図5は、潜在変数最適化装置100の動作を示すフローチャートである。図4に示すように潜在変数最適化装置100は、セットアップデータ計算部110と、最適化部120と、記録部190を含む。記録部190は、潜在変数最適化装置100の処理に必要な情報を適宜記録する構成部である。記録部190は、例えば、最適化対象となる潜在変数を記録する。
図5に従い潜在変数最適化装置100の動作について説明する。
S110において、セットアップデータ計算部110は、最適化用データを用いて、潜在変数~wを最適化する際に用いるセットアップデータを計算する。セットアップデータは、例えば、最適化問題minc_1, …, c_D(min~w(Lconvex(~w)+Σd=1
DΛd,c_d(~w)))で用いる各パラメータである。
S120において、最適化部120は、S110で生成したセットアップデータを用いて潜在変数~wの最適値~w*を計算する。
以下、図6~図7を参照して、最適化部120について説明する。図6は、最適化部120の構成を示すブロック図である。図7は、最適化部120の動作を示すフローチャートである。図6に示すように最適化部120は、候補計算部122、最適値決定部123を含む。
図7に従い最適化部120の動作について説明する。
S122において、候補計算部122は、離散変数(c1, …, cD)がとり得るすべての値に対して、次式により潜在変数~wの最適値の候補~wcandidate[(c1, …, cD)]を計算する。
S123において、最適値決定部123は、S122で計算した候補~wcandidate[(c1, …, cD)]のうち、コスト関数Lconvex(~w)+Σd=1
DΛd,c_d(~w)の値を最小とする候補を最適値~w*とする。
本発明の実施形態によれば、非凸最適化問題を解く代わりに、当該問題と等価な凸最適化問題を解くことにより、潜在変数を最適化することが可能となる。
<第3実施形態>
フィルタ係数最適化装置100は、K個(ただし、Kは1以上の整数)の無向性スピーカを用いて構成され、予め定まったN+M個(ただし、N, Mは1以上の整数)の点のうち、N個の点では音を再生しつつM個の点では音が漏れないようにする局所再生システムのフィルタ係数w={w1, …, wF}(ただし、wf(f=1, …, F、Fは1以上の整数)は周波数ビンfのフィルタ係数)の最適値w*を計算する。ここで、最適化用データとは潜在変数の最適化に用いる入力データ、または、潜在変数の最適化に用いる入力データと出力データの組である。
フィルタ係数最適化装置100は、K個(ただし、Kは1以上の整数)の無向性スピーカを用いて構成され、予め定まったN+M個(ただし、N, Mは1以上の整数)の点のうち、N個の点では音を再生しつつM個の点では音が漏れないようにする局所再生システムのフィルタ係数w={w1, …, wF}(ただし、wf(f=1, …, F、Fは1以上の整数)は周波数ビンfのフィルタ係数)の最適値w*を計算する。ここで、最適化用データとは潜在変数の最適化に用いる入力データ、または、潜在変数の最適化に用いる入力データと出力データの組である。
以下、図4~図5を参照してフィルタ係数最適化装置100を説明する。図4は、フィルタ係数最適化装置100の構成を示すブロック図である。図5は、フィルタ係数最適化装置100の動作を示すフローチャートである。図4に示すようにフィルタ係数最適化装置100は、セットアップデータ計算部110と、最適化部120と、記録部190を含む。記録部190は、フィルタ係数最適化装置100の処理に必要な情報を適宜記録する構成部である。記録部190は、例えば、最適化対象となるフィルタ係数を記録する。
図5に従いフィルタ係数最適化装置100の動作について説明する。
S110において、セットアップデータ計算部110は、最適化用データを用いて、フィルタ係数wを最適化する際に用いるセットアップデータを計算する。フィルタ係数wを最適化するためにコスト関数を用いる場合、セットアップデータとして、例えば、周波数ビンfでのK個の無指向性スピーカから点i(i=1, …, N)へのアレイマニフォールドベクトルaf,i(f=1, …, F, i=1, …, N)、周波数ビンfでのK個の無指向性スピーカから点j(j=1, …, M)へのアレイマニフォールドベクトルbf,j(f=1, …, F, j=1, …, M)がある。
S120において、最適化部120は、S110で生成したセットアップデータを用いてフィルタ係数wの最適値w*を計算する。例えば、最適化部120は、フィルタ係数wf(f=1, …, F)の位相に関する制約を含まないという制約条件のもとでのフィルタ係数wに関する最適化問題minw_1, …, w_FΣf=1
FΣj=1
M|wf
Hbf,j|2に基づいて、最適値w*を計算することができる。なお、Σf=1
F|Σj=1
M|wf
Hbf,j|2のことをフィルタ係数wに関するコスト関数という。
フィルタ係数wf(f=1, …, F)の位相に関する制約を含まないという制約条件の例として、次式により表現されるものがある。
(ただし、f=1, …, F, i=1, …, N)
最適化部120は、制約条件(*)のもとで最適化問題minw_1, …, w_FΣf=1 FΣj=1 M|wf Hbf,j|2を解く代わりに、フィルタ係数w、離散変数c1, …, cFに関する最適化問題min{c_f,w_f}(Σf=1 FΣj=1 M|wf Hbf,j|2+Σf=1 FΣi=1 NΛ(f,i),c_f,i(wf Haf,i))を解くことにより最適値w*を計算するようにしてもよい。ここで、Cを1以上の整数、cf,i(f=1, …, F, i=1, …, N)を1, …, Cを値にとる離散変数、cf=(cf,1, …, cf,N) (f=1, …, F)を離散変数cf,1, …, cf,Nにより定義される離散変数とし、関数Λ(f,i),c_f,i (f=1, …, F, i=1, …, N)は次式で定義される変数γf,iに関する関数である(ただし、γf,i=wf Haf,i)。
最適化部120は、制約条件(*)のもとで最適化問題minw_1, …, w_FΣf=1 FΣj=1 M|wf Hbf,j|2を解く代わりに、フィルタ係数w、離散変数c1, …, cFに関する最適化問題min{c_f,w_f}(Σf=1 FΣj=1 M|wf Hbf,j|2+Σf=1 FΣi=1 NΛ(f,i),c_f,i(wf Haf,i))を解くことにより最適値w*を計算するようにしてもよい。ここで、Cを1以上の整数、cf,i(f=1, …, F, i=1, …, N)を1, …, Cを値にとる離散変数、cf=(cf,1, …, cf,N) (f=1, …, F)を離散変数cf,1, …, cf,Nにより定義される離散変数とし、関数Λ(f,i),c_f,i (f=1, …, F, i=1, …, N)は次式で定義される変数γf,iに関する関数である(ただし、γf,i=wf Haf,i)。
以下、図6~図7を参照して、最適化問題min{c_f,w_f}(Σf=1
FΣj=1
M|wf
Hbf,j|2+Σf=1
FΣi=1
NΛ(f,i),c_f,i(wf
Haf,i))を解くための最適化部120について説明する。図6は、最適化部120の構成を示すブロック図である。図7は、最適化部120の動作を示すフローチャートである。図6に示すように最適化部120は、候補計算部122、最適値決定部123を含む。
図7に従い最適化部120の動作について説明する。
S122において、候補計算部122は、周波数ビンfごとに、離散変数(cf,1, …, cf,N)がとり得るすべての値に対して、次式によりフィルタ係数wfの最適値の候補wf
candidate[(cf,1, …, cf,N)]を計算する。
S123において、最適値決定部123は、周波数ビンfごとに、S122で計算した候補wf
candidate[(cf,1, …, cf,N)]のうち、コスト関数Σj=1
M|wf
Hbf,j|2+Σi=1
NΛ(f,i),c_f,i(wf
Haf,i)の値を最小とする候補を最適値wf
*とし、w*={w1
*, …, wF
*}により最適値w*を得る。
本発明の実施形態によれば、非凸最適化問題を解く代わりに、当該問題と等価な凸最適化問題を解くことにより、フィルタ係数を最適化することが可能となる。
<補記>
図8は、上述の各装置を実現するコンピュータの機能構成の一例を示す図である。上述の各装置における処理は、記録部2020に、コンピュータを上述の各装置として機能させるためのプログラムを読み込ませ、制御部2010、入力部2030、出力部2040などに動作させることで実施できる。
図8は、上述の各装置を実現するコンピュータの機能構成の一例を示す図である。上述の各装置における処理は、記録部2020に、コンピュータを上述の各装置として機能させるためのプログラムを読み込ませ、制御部2010、入力部2030、出力部2040などに動作させることで実施できる。
本発明の装置は、例えば単一のハードウェアエンティティとして、キーボードなどが接続可能な入力部、液晶ディスプレイなどが接続可能な出力部、ハードウェアエンティティの外部に通信可能な通信装置(例えば通信ケーブル)が接続可能な通信部、CPU(Central Processing Unit、キャッシュメモリやレジスタなどを備えていてもよい)、メモリであるRAMやROM、ハードディスクである外部記憶装置並びにこれらの入力部、出力部、通信部、CPU、RAM、ROM、外部記憶装置の間のデータのやり取りが可能なように接続するバスを有している。また必要に応じて、ハードウェアエンティティに、CD-ROMなどの記録媒体を読み書きできる装置(ドライブ)などを設けることとしてもよい。このようなハードウェア資源を備えた物理的実体としては、汎用コンピュータなどがある。
ハードウェアエンティティの外部記憶装置には、上述の機能を実現するために必要となるプログラムおよびこのプログラムの処理において必要となるデータなどが記憶されている(外部記憶装置に限らず、例えばプログラムを読み出し専用記憶装置であるROMに記憶させておくこととしてもよい)。また、これらのプログラムの処理によって得られるデータなどは、RAMや外部記憶装置などに適宜に記憶される。
ハードウェアエンティティでは、外部記憶装置(あるいはROMなど)に記憶された各プログラムとこの各プログラムの処理に必要なデータが必要に応じてメモリに読み込まれて、適宜にCPUで解釈実行・処理される。その結果、CPUが所定の機能(上記、…部、…手段などと表した各構成部)を実現する。
本発明は上述の実施形態に限定されるものではなく、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。また、上記実施形態において説明した処理は、記載の順に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されるとしてもよい。
既述のように、上記実施形態において説明したハードウェアエンティティ(本発明の装置)における処理機能をコンピュータによって実現する場合、ハードウェアエンティティが有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記ハードウェアエンティティにおける処理機能がコンピュータ上で実現される。
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。具体的には、例えば、磁気記録装置として、ハードディスク装置、フレキシブルディスク、磁気テープ等を、光ディスクとして、DVD(Digital Versatile Disc)、DVD-RAM(Random Access Memory)、CD-ROM(Compact Disc Read Only Memory)、CD-R(Recordable)/RW(ReWritable)等を、光磁気記録媒体として、MO(Magneto-Optical disc)等を、半導体メモリとしてEEP-ROM(Electronically Erasable and Programmable-Read Only Memory)等を用いることができる。
また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD-ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。
このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。そして、処理の実行時、このコンピュータは、自己の記憶装置に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。なお、本形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの(コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等)を含むものとする。
また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、ハードウェアエンティティを構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。
上述の本発明の実施形態の記載は、例証と記載の目的で提示されたものである。網羅的であるという意思はなく、開示された厳密な形式に発明を限定する意思もない。変形やバリエーションは上述の教示から可能である。実施形態は、本発明の原理の最も良い例証を提供するために、そして、この分野の当業者が、熟考された実際の使用に適するように本発明を色々な実施形態で、また、色々な変形を付加して利用できるようにするために、選ばれて表現されたものである。すべてのそのような変形やバリエーションは、公正に合法的に公平に与えられる幅にしたがって解釈された添付の請求項によって定められた本発明のスコープ内である。
Claims (10)
- Dを1以上の整数とし、
D個の音源(以下、音源1、…、音源Dとする)からの音(以下、目的音という)を強調するビームフォーマのフィルタ係数w={w1, …, wF}(ただし、wf(f=1, …, F、Fは1以上の整数)は周波数ビンfのフィルタ係数)の最適値w*を計算する最適化部を含むフィルタ係数最適化装置であって、
Rf(f=1, …, F)を周波数ビンfに関する前記目的音以外の音の空間相関行列、LMV_f(wf)=wf HRfwf(f=1, …, F)をフィルタ係数wfに関するコスト関数とし、
前記最適化部は、所定の制約条件のもとでのフィルタ係数wに関する最適化問題minw_1, …, w_FΣf=1 FLMV_f(wf)に基づいて、前記最適値w*を計算するものであり、
前記所定の制約条件は、フィルタ係数wf(f=1, …, F)の位相に関する制約を含まないものである
フィルタ係数最適化装置。 - 請求項3に記載のフィルタ係数最適化装置であって、
Cを1以上の整数、cf,d(f=1, …, F, d=1, …, D)を1, …, Cを値にとる離散変数、cf=(cf,1, …, cf,D) (f=1, …, F)を離散変数cf,1, …, cf,Dにより定義される離散変数、Λ(f,d),c_f,d (f=1, …, F, d=1, …, D)を次式で定義される変数γf,dに関する関数(ただし、γf,d=wf Haf,d)とし、
前記最適化部は、前記最適化問題minw_1, …, w_FΣf=1 FLMV_f(wf)を解く代わりに、フィルタ係数w、離散変数c1, …, cFに関する最適化問題min{c_f,w_f}(Σf=1 FLMV_f(wf)+Σf=1 FΣd=1 DΛ(f,d),c_f,d(wf Haf,d))を解くことにより前記最適値w*を計算する
ことを特徴とするフィルタ係数最適化装置。 - 請求項4に記載のフィルタ係数最適化装置であって、
前記最適化部は、
周波数ビンfごとに、離散変数(cf,1, …, cf,D)がとり得るすべての値に対して、次式によりフィルタ係数wfの最適値の候補wf candidate[(cf,1, …, cf,D)]を計算する候補計算部と、
周波数ビンfごとに、前記候補wf candidate[(cf,1, …, cf,D)]のうち、コスト関数LMV_f(wf)+Σd=1 DΛ(f,d),c_f,d(wf Haf,d)の値を最小とする候補をフィルタ係数wfの最適値wf *とし、w*={w1 *, …, wF *}により前記最適値w*を得る最適値決定部とを含む
ことを特徴とするフィルタ係数最適化装置。 - Lconvexを潜在変数~wに関する強凸関数、Ld(d=1, …, D、Dは1以上の整数)を潜在変数~wに関する関数とし、
潜在変数~wに関する最適化問題min~w(Lconvex(~w)+Σd=1 DLd(~w))に基づいて、潜在変数~wの最適値~w*を計算する最適化部を含む潜在変数最適化装置であって、
Cを1以上の整数、Sd,1, …, Sd,C(d=1, …, D)を関数Ldの定義域をC個の閉凸集合に分割することにより得られる領域、Λd,c(d=1, …, D, c=1, …, C)を領域Sd,cで定義され、関数Ldを近似する凸関数、cd(d=1, …, D)を1, …, Cを値にとる離散変数とし、
前記最適化部は、前記最適化問題min~w(Lconvex(~w)+Σd=1 DLd(~w))を解く代わりに、潜在変数~w、離散変数c1, …, cDに関する最適化問題minc_1, …, c_D(min~w(Lconvex(~w)+Σd=1 DΛd,c_d(~w)))を解くことにより前記最適値~w*を計算する
潜在変数最適化装置。 - Dを1以上の整数とし、
フィルタ係数最適化装置が、D個の音源(以下、音源1、…、音源Dとする)からの音(以下、目的音という)を強調するビームフォーマのフィルタ係数w={w1, …, wF}(ただし、wf(f=1, …, F、Fは1以上の整数)は周波数ビンfのフィルタ係数)の最適値w*を計算する最適化ステップを含むフィルタ係数最適化方法であって、
Rf(f=1, …, F)を周波数ビンfに関する前記目的音以外の音の空間相関行列、LMV_f(wf)=wf HRfwf(f=1, …, F)をフィルタ係数wfに関するコスト関数とし、
前記最適化ステップは、所定の制約条件のもとでのフィルタ係数wに関する最適化問題minw_1, …, w_FΣf=1 FLMV_f(wf)に基づいて、前記最適値w*を計算するものであり、
前記所定の制約条件は、フィルタ係数wf(f=1, …, F)の位相に関する制約を含まないものである
フィルタ係数最適化方法。 - Lconvexを潜在変数~wに関する強凸関数、Ld(d=1, …, D、Dは1以上の整数)を潜在変数~wに関する関数とし、
潜在変数最適化装置が、潜在変数~wに関する最適化問題min~w(Lconvex(~w)+Σd=1 DLd(~w))に基づいて、潜在変数~wの最適値~w*を計算する最適化ステップを含む潜在変数最適化方法であって、
Cを1以上の整数、Sd,1, …, Sd,C(d=1, …, D)を関数Ldの定義域をC個の閉凸集合に分割することにより得られる領域、Λd,c(d=1, …, D, c=1, …, C)を領域Sd,cで定義され、関数Ldを近似する凸関数、cd(d=1, …, D)を1, …, Cを値にとる離散変数とし、
前記最適化ステップは、前記最適化問題min~w(Lconvex(~w)+Σd=1 DLd(~w))を解く代わりに、潜在変数~w、離散変数c1, …, cDに関する最適化問題minc_1, …, c_D(min~w(Lconvex(~w)+Σd=1 DΛd,c_d(~w)))を解くことにより前記最適値~w*を計算する
潜在変数最適化方法。 - 請求項1ないし5のいずれか1項に記載のフィルタ係数最適化装置、請求項6または7に記載の潜在変数最適化装置のいずれかとしてコンピュータを機能させるためのプログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022502755A JP7375904B2 (ja) | 2020-02-28 | 2020-02-28 | フィルタ係数最適化装置、潜在変数最適化装置、フィルタ係数最適化方法、潜在変数最適化方法、プログラム |
US17/802,105 US20230083284A1 (en) | 2020-02-28 | 2020-02-28 | Filter coefficient optimization apparatus, latent variable optimization apparatus, filter coefficient optimization method, latent variable optimization method, and program |
PCT/JP2020/008232 WO2021171532A1 (ja) | 2020-02-28 | 2020-02-28 | フィルタ係数最適化装置、潜在変数最適化装置、フィルタ係数最適化方法、潜在変数最適化方法、プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2020/008232 WO2021171532A1 (ja) | 2020-02-28 | 2020-02-28 | フィルタ係数最適化装置、潜在変数最適化装置、フィルタ係数最適化方法、潜在変数最適化方法、プログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
WO2021171532A1 true WO2021171532A1 (ja) | 2021-09-02 |
Family
ID=77491189
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PCT/JP2020/008232 WO2021171532A1 (ja) | 2020-02-28 | 2020-02-28 | フィルタ係数最適化装置、潜在変数最適化装置、フィルタ係数最適化方法、潜在変数最適化方法、プログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US20230083284A1 (ja) |
JP (1) | JP7375904B2 (ja) |
WO (1) | WO2021171532A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20220376198A1 (en) * | 2020-12-11 | 2022-11-24 | Boe Technology Group Co., Ltd. | Organic Light Emitting Device and Display Apparatus |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9668066B1 (en) * | 2015-04-03 | 2017-05-30 | Cedar Audio Ltd. | Blind source separation systems |
JP2018107697A (ja) * | 2016-12-27 | 2018-07-05 | キヤノン株式会社 | 信号処理装置、信号処理方法及びプログラム |
JP2020126138A (ja) * | 2019-02-05 | 2020-08-20 | 日本電信電話株式会社 | 潜在変数最適化装置、フィルタ係数最適化装置、潜在変数最適化方法、フィルタ係数最適化方法、プログラム |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5337189B2 (ja) * | 2011-04-06 | 2013-11-06 | 日本電信電話株式会社 | フィルタ設計における反射物の配置決定方法、装置、プログラム |
-
2020
- 2020-02-28 US US17/802,105 patent/US20230083284A1/en active Pending
- 2020-02-28 WO PCT/JP2020/008232 patent/WO2021171532A1/ja active Application Filing
- 2020-02-28 JP JP2022502755A patent/JP7375904B2/ja active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9668066B1 (en) * | 2015-04-03 | 2017-05-30 | Cedar Audio Ltd. | Blind source separation systems |
JP2018107697A (ja) * | 2016-12-27 | 2018-07-05 | キヤノン株式会社 | 信号処理装置、信号処理方法及びプログラム |
JP2020126138A (ja) * | 2019-02-05 | 2020-08-20 | 日本電信電話株式会社 | 潜在変数最適化装置、フィルタ係数最適化装置、潜在変数最適化方法、フィルタ係数最適化方法、プログラム |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20220376198A1 (en) * | 2020-12-11 | 2022-11-24 | Boe Technology Group Co., Ltd. | Organic Light Emitting Device and Display Apparatus |
Also Published As
Publication number | Publication date |
---|---|
JP7375904B2 (ja) | 2023-11-08 |
US20230083284A1 (en) | 2023-03-16 |
JPWO2021171532A1 (ja) | 2021-09-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Jin et al. | Multizone soundfield reproduction using orthogonal basis expansion | |
US20210289304A1 (en) | Audio precompensation filter optimized with respect to bright and dark zones | |
Tylka et al. | Performance of linear extrapolation methods for virtual sound field navigation | |
Lee et al. | Fast generation of sound zones using variable span trade-off filters in the DFT-domain | |
US11881206B2 (en) | System and method for generating audio featuring spatial representations of sound sources | |
WO2021171532A1 (ja) | フィルタ係数最適化装置、潜在変数最適化装置、フィルタ係数最適化方法、潜在変数最適化方法、プログラム | |
Aarts et al. | On-axis and far-field sound radiation from resilient flat and dome-shaped radiators | |
Olivieri et al. | Theoretical and experimental comparative analysis of beamforming methods for loudspeaker arrays under given performance constraints | |
Benbara et al. | Bending waves focusing in arbitrary shaped plate-like structures: Application to spatial audio in cars | |
Padois et al. | Acoustic imaging with spherical microphone array and Kriging | |
JP6815956B2 (ja) | フィルタ係数算出装置、その方法、及びプログラム | |
Comanducci et al. | Synthesis of soundfields through irregular loudspeaker arrays based on convolutional neural networks | |
Felix et al. | Improved active noise control algorithm based on the convex combination method | |
US11356790B2 (en) | Sound image reproduction device, sound image reproduction method, and sound image reproduction program | |
WO2021171533A1 (ja) | フィルタ係数最適化装置、フィルタ係数最適化方法、プログラム | |
WO2021255925A1 (ja) | 目的音信号生成装置、目的音信号生成方法、プログラム | |
Thiergart et al. | Parametric spatial sound processing using linear microphone arrays | |
WO2020162188A1 (ja) | 潜在変数最適化装置、フィルタ係数最適化装置、潜在変数最適化方法、フィルタ係数最適化方法、プログラム | |
JP7444243B2 (ja) | 信号処理装置、信号処理方法、およびプログラム | |
JP2015171111A (ja) | 音場収音再生装置、システム、方法及びプログラム | |
Belloch et al. | GPU-based WFS systems with mobile virtual sound sources and room compensation | |
JP7207539B2 (ja) | 学習データ拡張装置、学習データ拡張方法、およびプログラム | |
Jälmby et al. | Compression of room impulse responses for compact storage and fast low-latency convolution | |
WO2021024474A1 (ja) | Psd最適化装置、psd最適化方法、プログラム | |
WO2021024475A1 (ja) | Psd最適化装置、psd最適化方法、プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 20921904 Country of ref document: EP Kind code of ref document: A1 |
|
ENP | Entry into the national phase |
Ref document number: 2022502755 Country of ref document: JP Kind code of ref document: A |
|
NENP | Non-entry into the national phase |
Ref country code: DE |
|
122 | Ep: pct application non-entry in european phase |
Ref document number: 20921904 Country of ref document: EP Kind code of ref document: A1 |