JP2015082745A - Microphone arrangement determination device and microphone arrangement determination method and program - Google Patents
Microphone arrangement determination device and microphone arrangement determination method and program Download PDFInfo
- Publication number
- JP2015082745A JP2015082745A JP2013219787A JP2013219787A JP2015082745A JP 2015082745 A JP2015082745 A JP 2015082745A JP 2013219787 A JP2013219787 A JP 2013219787A JP 2013219787 A JP2013219787 A JP 2013219787A JP 2015082745 A JP2015082745 A JP 2015082745A
- Authority
- JP
- Japan
- Prior art keywords
- microphone
- correlation
- arrangement
- transfer characteristics
- transfer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
Description
本発明は、複数のマイクロホンやスピーカで構成されたアレー装置を用いたビームフォーミング技術に関する。特に、マイクロホンと音源との間の伝達特性の最適な性質を明らかにした拡散センシングに基づくビームフォーミング技術に関する。 The present invention relates to a beam forming technique using an array device composed of a plurality of microphones and speakers. In particular, the present invention relates to a beam forming technique based on diffuse sensing that has clarified the optimum property of the transfer characteristic between a microphone and a sound source.
非特許文献1及び2が、マイクロホンアレーを用いた拡散センシングに基づく音声強調技術の従来技術として知られている。非特許文献1及び2では、反射構造体により擬似的な拡散音場を生成し、その中にマイクロホンアレーを設置して、拡散センシングを実現している。
しかしながら、従来技術において、反射構造体をマイクロホンアレーの近傍に設置することで疑似的な拡散音場を生成するためには、装置規模が大きくなる傾向がある。何故ならば、反射構造体の容積と残響時間の相関性は高くて、残響時間が長くなるほど、拡散音場に近づくためである。例えば、非特許文献2では、直径1メートルの球に収まる程度の大きさの反射構造体を構築している。ところが、適用するアプリケーションによって、装置規模はあらかじめ限定されることが多い。容積が限定されてしまうと、伝達特性の相関性が高くなり、指向性能が劣化してしまうことが課題である。
However, in the related art, in order to generate a pseudo diffuse sound field by installing the reflecting structure in the vicinity of the microphone array, the scale of the device tends to increase. This is because the correlation between the volume of the reflecting structure and the reverberation time is high, and the longer the reverberation time, the closer to the diffuse sound field. For example, in Non-Patent
装置の容積が限られた中で、伝達特性間の相関を低減させるためには、装置構成を工夫する必要がある。例えば、反射構造体の形状を工夫する、反射構造体の中に拡散を誘発するような機構を取り付ける、マイクロホンまたは反射構造体に可動部を取り付けて音場の状況に応じて動かす、指向性の異なるマイクロホンを組み合わせたアレーを用いるなどの手段で実現できると考えられている。ただし、上記の実装で考えられる装置は相当多くのパターン数があると考えられるので、どの装置パターンが適切であるかを判断することが難しい。 In order to reduce the correlation between transfer characteristics in a limited volume of the device, it is necessary to devise the device configuration. For example, devise the shape of the reflective structure, attach a mechanism that induces diffusion in the reflective structure, attach a movable part to the microphone or the reflective structure, and move it according to the state of the sound field. It is considered that this can be realized by means such as using an array in which different microphones are combined. However, since the devices considered in the above implementation are considered to have a considerable number of patterns, it is difficult to determine which device pattern is appropriate.
本発明の目的は、各装置パターンにおける伝達特性の相関性を評価する量を導入し、それに基づいてマイクロホン配置を決定する技術を提供することである。 An object of the present invention is to provide a technique for introducing a quantity for evaluating the correlation of transfer characteristics in each device pattern and determining the microphone arrangement based on the introduced quantity.
上記の課題を解決するために、本発明の一態様によるマイクロホン配置決定装置は、伝達特性計算部、伝達特性相関計算部、周波数平均部及び最適配置選択部を含む。伝達特性計算部は、複数のマイクロホンの設置位置、角度及び指向性のすべての組み合わせからなるマイクロホン配置候補について、マイクロホンと音源間の伝達特性を計算する。伝達特性相関計算部は、配置を固定されたマイクロホンセットがなければ複数のマイクロホンから選択した所定の数のマイクロホンセットに関するマイクロホン配置候補について伝達特性間の相関を計算し、配置を固定されたマイクロホンセットがあれば配置を固定されたマイクロホンセットに配置を固定されていない所定の数のマイクロホンを加えたマイクロホンセットに関するマイクロホン配置候補について伝達特性間の相関を計算する。周波数平均部は、伝達特性間の相関を周波数平均化し、伝達特性の相関性が低いマイクロホン配置候補に関するマイクロホンセットの配置を固定する。最適配置選択部は、伝達特性間の相関に基づいて最も伝達特性の相関性が低いマイクロホン配置候補を最適なマイクロホン配置として出力する。 In order to solve the above-described problem, a microphone arrangement determination apparatus according to an aspect of the present invention includes a transfer characteristic calculation unit, a transfer characteristic correlation calculation unit, a frequency average unit, and an optimum arrangement selection unit. The transfer characteristic calculation unit calculates transfer characteristics between the microphone and the sound source for microphone arrangement candidates including all combinations of installation positions, angles, and directivities of a plurality of microphones. The transfer characteristic correlation calculation unit calculates a correlation between transfer characteristics for microphone arrangement candidates related to a predetermined number of microphone sets selected from a plurality of microphones if there is no microphone set with a fixed arrangement, and a microphone set with a fixed arrangement. If there is, a correlation between transfer characteristics is calculated for a microphone arrangement candidate for a microphone set obtained by adding a predetermined number of microphones whose arrangement is not fixed to a microphone set whose arrangement is fixed. The frequency averaging unit averages the correlation between the transfer characteristics, and fixes the arrangement of the microphone sets related to the microphone arrangement candidates having low correlation of the transfer characteristics. The optimum arrangement selection unit outputs a microphone arrangement candidate having the lowest correlation of the transfer characteristics as the optimum microphone arrangement based on the correlation between the transfer characteristics.
この発明によれば、解析的に伝達特性を算出することが可能なマイクロホン配置候補の中から、最も伝達特性間の相関を低減することができるマイクロホン配置を導出することができる。 According to the present invention, a microphone arrangement that can most reduce the correlation between transfer characteristics can be derived from among microphone arrangement candidates that can analytically calculate the transfer characteristics.
以下、本発明の実施形態について説明する。なお、以下の説明に用いる図面では、同じ機能を持つ構成部や同じ処理を行うステップには同一の符号を記し、重複説明を省略する。以下の説明において、テキスト中で使用する記号「→(上付き添字の右矢印)」、「^(キャレット)」、「-(上付き添字のハイフン)」等は、本来直前の文字の真上に記載されるべきものであるが、テキスト記法の制限により、当該文字の直後に記載する。式中においてはこれらの記号は本来の位置に記述している。下付き添字中で使用する「_(アンダースコア)」は下付き添字を表す。例えば、xy_zはyzがxに対する下付き添字であることを表す。また、ベクトルや行列の各要素単位で行われる処理は、特に断りが無い限り、そのベクトルやその行列の全ての要素に対して適用されるものとする。 Hereinafter, embodiments of the present invention will be described. In the drawings used for the following description, constituent parts having the same function and steps for performing the same process are denoted by the same reference numerals, and redundant description is omitted. In the following explanations, the symbols used in the text “ → (superscript right arrow)”, “^ (caret)”, “ - (superscript hyphen)”, etc. are directly above the previous character. It should be written immediately after the character due to restrictions on text notation. In the formula, these symbols are written in their original positions. “_ (Underscore)” used in the subscript indicates a subscript. For example, x y_z represents that yz is a subscript to x. Further, the processing performed for each element of a vector or matrix is applied to all elements of the vector or matrix unless otherwise specified.
まず、非特許文献1で説明されているこれまでの拡散センシングに基づく音声強調技術について説明する。
First, a speech enhancement technique based on conventional diffusion sensing described in Non-Patent
[観測信号のモデル化]
M(≧2)本のマイクロホンを用いて一つのターゲット音とK(≧1)個の雑音を受音する状況を考える。多くの雑音が存在する中で任意の位置にあるターゲット音を強調する指向制御を目的にする。K個の雑音源を抑圧し、ターゲット音を強調することで、この目的を達成することができる。m(m=1,2,…,M)番目のマイクロホンとターゲット音、k(k=1,2,…,K)番目の雑音との間のインパルス応答をそれぞれam(i)、bk,m(i)とする。ただし、インパルス応答長をLとし、i=0,1,…,L-1とする。なお、インパルス応答長Lは、装置の規模や構造、設置された部屋の状況によって定まる残響時間により実験的に定めればよい。ターゲット音をs(t)とし、k番目の雑音の音源信号をnk(t)とするとき、m番目のマイクロホンで観測した観測信号xm(t)は、次式でモデル化される。
[Modeling of observed signals]
Consider a situation where one target sound and K (≧ 1) noises are received using M (≧ 2) microphones. It aims at the directivity control which emphasizes the target sound in arbitrary positions in the presence of many noises. This objective can be achieved by suppressing K noise sources and emphasizing the target sound. The impulse responses between the m (m = 1,2, ..., M) th microphone and the target sound, and the k (k = 1,2, ..., K) th noise are a m (i) and b k , respectively. , m (i). However, the impulse response length is L, and i = 0, 1,..., L−1. The impulse response length L may be determined experimentally based on the reverberation time determined by the scale and structure of the apparatus and the situation of the installed room. When the target sound is s (t) and the k-th noise source signal is n k (t), the observed signal x m (t) observed by the m-th microphone is modeled by the following equation.
ここで、tは時間のインデックスを表わす。 Here, t represents a time index.
観測信号xm(t)を短時間フーリエ変換することで、式(1)の畳み込み混合は、次式のような周波数領域における瞬時混合として近似される。 By performing a short-time Fourier transform on the observation signal x m (t), the convolutional mixture of Equation (1) is approximated as an instantaneous mixture in the frequency domain as shown in the following equation.
ここで、ωは周波数を表し、τはフレームのインデックスを表わす。例えば、48kHzでサンプリングを行い、タップ数を2048とする。また、Xm(ω,τ)は観測信号xm(t)の時間周波数表現を表わし、S(ω,τ)はターゲット音の音源信号s(t)の時間周波数表現を表わし、Nk(ω,τ)はk番目の雑音の音源信号nk(t)の時間周波数表現を表わす。am(ω)はターゲット音とm番目のマイクロホンとの間の周波数特性を表し、bk,m(ω)はk番目の雑音とm番目のマイクロホンとの間の周波数特性を表す。以後am(ω)、bk,m(ω)を伝達特性と呼ぶ。式(2)を行列形式で表記すると、次式のようになる。 Here, ω represents a frequency, and τ represents a frame index. For example, sampling is performed at 48 kHz, and the number of taps is 2048. X m (ω, τ) represents the time frequency representation of the observed signal x m (t), S (ω, τ) represents the time frequency representation of the sound source signal s (t) of the target sound, and N k ( ω, τ) represents a time-frequency representation of the k-th noise source signal n k (t). a m (ω) represents a frequency characteristic between the target sound and the m-th microphone, and b k, m (ω) represents a frequency characteristic between the k-th noise and the m-th microphone. Hereinafter, a m (ω) and b k, m (ω) are referred to as transfer characteristics. When Expression (2) is expressed in matrix form, the following expression is obtained.
であり、Tは転置を表わす。 And T represents transposition.
[ビームフォーミング]
ビームフォーミング後の出力信号y(t)は、次式のように観測信号xm(t)と、ターゲット音を強調するように設計されたフィルタwm(t)とを畳み込むことで得られる。
[Beam forming]
The output signal y (t) after beam forming is obtained by convolving an observation signal x m (t) with a filter w m (t) designed to emphasize the target sound as in the following equation.
ここで、Jはフィルタ長を表わし、インパルス応答長Lと同程度とすればよい。y(t)の時間周波数表現であるY(ω,τ)は、次式で近似的に求められる。 Here, J represents the filter length and may be approximately the same as the impulse response length L. Y (ω, τ), which is a time frequency representation of y (t), is approximately obtained by the following equation.
ここで、Hは共役転置を表し、W→ m(ω)の複素共役がwm(j)の周波数応答に対応する。 Here, H represents the conjugate transpose, and the complex conjugate of W → m (ω) corresponds to the frequency response of w m (j).
出力信号Y(ω,τ)に含まれる雑音成分をYN(ω,τ)と書くとき、次式のパワーpN(ω)は雑音成分のパワーとして定義される。 When the noise component included in the output signal Y (ω, τ) is written as Y N (ω, τ), the power p N (ω) in the following equation is defined as the power of the noise component.
ここで、ETは時間的な期待値演算を表わす。音源信号が互いに無相関であると仮定すると、パワーpN(ω)は伝達特性b→ k(ω)とフィルタW→(ω)だけで次式に示すように計算できる。 Here, E T represents a temporal expected value calculation. Assuming that the sound source signals are uncorrelated with each other, the power p N (ω) can be calculated as shown in the following equation using only the transfer characteristic b → k (ω) and the filter W → (ω).
アレー信号処理の分野では、パワーpN(ω)を最小化するために、様々なフィルタ設計法が説明されてきた。代表例として、遅延和法と最尤法を説明する(参考文献1参照)。
〔参考文献1〕浅野太、「音のアレイ信号処理 -音源の定位・追跡と分離-」、コロナ社、2011年
In the field of array signal processing, various filter design methods have been described to minimize power p N (ω). As a representative example, the delay sum method and the maximum likelihood method will be described (see Reference 1).
[Reference 1] Taichi Asano, “Sound Array Signal Processing-Sound Source Localization / Tracking and Separation”, Corona, 2011
遅延和法において、フィルタW→ DSは、次式により、ターゲット音の直接音を強調するように設計される。 In the delay sum method, the filter W → DS is designed to emphasize the direct sound of the target sound by the following equation.
は、ターゲット音の直接音のアレイ・マニフォールド・ベクトルを表わす。要素hm(ω)は、ターゲット音からm番目のマイクロホンまでの直接音の経路の伝達係数を表し、ターゲット音とm番目のマイクロホン間の距離をdm、音速をc、虚数単位をjとすると、例えば次式により計算できる。 Represents the array manifold vector of the direct sound of the target sound. The element h m (ω) represents the transfer coefficient of the direct sound path from the target sound to the m-th microphone, where d m is the distance between the target sound and the m-th microphone, c is the speed of sound, and j is the imaginary unit. Then, for example, it can be calculated by the following equation.
また、最尤法において、フィルタW→ MLは、次式により、ターゲット音の直接音を強調し、パワーpN(ω)を最小化するように設計される。 In the maximum likelihood method, the filter W → ML is designed to enhance the direct sound of the target sound and minimize the power p N (ω) by the following equation.
ここで、R(ω)は雑音の空間相関行列を表わす。例えば、音源信号間が無相関であると仮定すると、雑音の空間相関行列R(ω)は次式のように、伝達特性b→ k(ω)のみを用いて計算される。 Here, R (ω) represents a spatial correlation matrix of noise. For example, assuming that the sound source signals are uncorrelated, the noise spatial correlation matrix R (ω) is calculated using only the transfer characteristic b → k (ω) as shown in the following equation.
参考文献1に記載されているような古典的なアレー信号処理において、マイクロホン間の間隔をどのようにアレンジするのかといったことが考えられてきた。しかし、特定の周波数を除いてマイクロホン間の相関が高くなることが多かった。代表的な問題として知られているのは以下の二つである。一つ目は波長の長い低周波帯域では、伝達特性間の相関が高くなりやすいので、狭指向制御しづらいことである。二つ目は波長の短い高周波帯域では、波長の半波長以下の間隔でマイクロホンを並べない限り、特定のターゲット音以外の音を強調してしまう空間エリアジングが生じることである。以上の二点から、広帯域に渡ってパワーpN(ω)を小さくすることは困難とされてきた。
In classical array signal processing as described in
[拡散センシング]
非特許文献1では、広帯域に渡ってパワーpN(ω)を小さくするために、伝達特性の性質がどういう性質であるべきかが検討され、拡散センシングという基礎理論が纏められている。
[Diffusion sensing]
In
拡散センシングのコンセプトは、“伝達特性の物理的変調”により、次式のように広帯域に渡って伝達特性を無相関化させることにある。 The concept of diffuse sensing is to make the transfer characteristic uncorrelated over a wide band by “physical modulation of the transfer characteristic” as shown in the following equation.
ここで、伝達特性の物理的変調とは、伝達特性の性質そのものを変えるためのあらゆる物理的手段のことを指し、例えば、(1)マイクロホンの近傍に反射構造体を設置する、(2)反射構造体の構造を複雑化する、(3)球(剛体)等の回折を誘発する物体を設置する、(4)マイクロホンの配置を変える、(5)マイクロホンそのものの指向性(無指向性、単一指向性、双指向性など)を混在させる、(6)指向性マイクの近傍に反射・回折を設置する、(7)収録する室の壁や床などの素材を変える、などの手段が挙げられる。非特許文献1で提案されている方式は、多数回反射を繰り返し、等方位的に反射音が到来する音場(拡散音場)を生成し、その中にマイクロホンアレーを設置する方式である。例えば、マイクロホンアレーを包囲するような形状の反射構造体を作り、一面だけ開けておけば、反射構造体内に到来した音が自ずと反射を繰り返し、疑似的な拡散音場を生成することになる。
Here, the physical modulation of the transfer characteristic means any physical means for changing the nature of the transfer characteristic itself, for example, (1) a reflective structure is installed near the microphone, (2) reflection Complicate the structure of the structure, (3) Install an object that induces diffraction, such as a sphere (rigid body), (4) Change the placement of the microphone, (5) Directivity of the microphone itself (omnidirectional, simple (6) Install reflection / diffraction in the vicinity of the directional microphone, (7) Change the material such as the walls and floor of the recording room, etc. It is done. The method proposed in
拡散音場にマイクロホンアレーを設置すると伝達特性間が無相関化される理由を簡単に説明する。伝達特性間の相関をγ(ω)とすると、拡散音場における相関γ(ω)は次式により計算されることが知られている。 The reason why transfer characteristics are uncorrelated when a microphone array is installed in a diffuse sound field will be briefly described. It is known that the correlation γ (ω) in the diffuse sound field is calculated by the following equation, where γ (ω) is the correlation between the transfer characteristics.
ここで、ESは空間的な期待値演算を表し、p→はマイクロホン間の位置ベクトルを表わす。 Here, E S represents the spatial expectation operation, p → represents the position vector between microphones.
マイクロホン間の距離||p→||が十分に広いとすると、拡散音場における伝達特性間の相関γ(ω)の期待値は0になる。 If the distance || p → || between the microphones is sufficiently wide, the expected value of the correlation γ (ω) between the transfer characteristics in the diffuse sound field is zero.
この特性を利用するために、従来技術においては、反射構造体により疑似的な拡散音場を物理的に生成し、その中にマイクロホンアレーを設置してきた(非特許文献1、2参照)。
In order to utilize this characteristic, in the prior art, a pseudo diffuse sound field is physically generated by a reflecting structure, and a microphone array is installed therein (see
また、パワーpN(ω)を小さくするために、事前のシミュレーションや測定により用意した伝達特性を用いたフィルタ設計方式を検討してきた。簡単に言えば、ターゲット音のみを強調するようにしてきたが、拡散センシングに基づく制御では伝達特性そのものを強調するように設計される。 In addition, in order to reduce the power p N (ω), filter design methods using transfer characteristics prepared by prior simulation and measurement have been studied. Simply put, only the target sound has been emphasized, but the control based on diffuse sensing is designed to emphasize the transfer characteristic itself.
遅延和法をベースとする場合、次式のように、アレイ・マニフォールド・ベクトルh→(ω)をターゲット音の伝達特性a→(ω)に置き換えることで、フィルタW→ DS1(ω)を設計できる。 When the delay sum method is used as a base, the filter W → DS1 (ω) is designed by replacing the array manifold vector h → (ω) with the target sound transfer characteristic a → (ω) as shown in the following equation. it can.
この場合、伝達特性a→(ω)をシミュレーションや実測により事前に用意する必要がある。 In this case, it is necessary to prepare the transfer characteristic a → (ω) in advance by simulation or actual measurement.
また、最尤法をベースとする場合、次式によりフィルタW→ DS2(ω)を設計できる。 Further, when the maximum likelihood method is used as a base, the filter W → DS2 (ω) can be designed by the following equation.
この場合も同様に、伝達特性a→(ω)や空間相関行列R(ω)をシミュレーションや実測により事前に用意する必要がある。先に挙げたような物理的手段を用いて、疑似的な拡散音場を生成し音を収音する場合、伝達特性が自ずと無相関化されていることが期待されるので、パワーpN(ω)を広帯域に渡って小さくすることができた。 Similarly in this case, it is necessary to prepare the transfer characteristic a → (ω) and the spatial correlation matrix R (ω) in advance by simulation or actual measurement. When using a physical means such as those mentioned above to generate a pseudo diffuse sound field and pick up the sound, it is expected that the transfer characteristics are naturally uncorrelated, so the power p N ( ω) could be reduced over a wide band.
<第一実施形態>
本実施形態では、何らかの物理的手段により、伝達特性間の相関を低減させることを目的としている。従来技術では、反射構造物を用いて拡散させた音場にマイクロホンを配置することで、伝達特性間の相関を低減させることを実践してきた。しかし、伝達特性をシミュレーションや実測により、あらかじめ用意することが課題であった。
<First embodiment>
The purpose of this embodiment is to reduce the correlation between transfer characteristics by some physical means. In the prior art, it has been practiced to reduce the correlation between transfer characteristics by arranging a microphone in a sound field diffused using a reflective structure. However, it has been a problem to prepare transfer characteristics in advance by simulation or actual measurement.
本実施形態では、事前に解析的に伝達特性のモデル化が可能なマイクロホン素子の(1)設置位置、(2)角度、(3)指向性といった要素を変数とし、各変数の組み合わせからなる多数の配置候補の中から、最も伝達特性間の相関を低減させる可能性のあるマイクロホン配置候補を探索し、最適なマイクロホン配置を実装したマイクロホンアレー装置を構成できるようにする。 In this embodiment, elements such as (1) installation position, (2) angle, and (3) directivity of microphone elements that can be analytically modeled on transfer characteristics analytically in advance are variables, and a large number of combinations of each variable. Among these arrangement candidates, a microphone arrangement candidate that most likely reduces the correlation between the transfer characteristics is searched, and a microphone array device that implements an optimum microphone arrangement can be configured.
具体的には、マイクロホンアレー装置を構成するマイクロホン数をM、各マイクロホンの設置位置の候補数をP1、各マイクロホンの角度(水平角、仰角の組み合わせを含む)をP2、各マイクロホンの指向性の種類をP3とすると、マイクロホンの配置方法としてK(=P1×P2×P3)パターンがあり得ることになる。Kパターンのマイクロホン配置候補に対してM本のマイクロホンを配置するL(=KCM)パターンのマイクロホン配置候補における伝達特性間の相関を評価して、最適なマイクロホン配置を決定する。 Specifically, the number of microphones constituting the microphone array device is M, the number of candidate positions of each microphone is P 1 , the angle of each microphone (including the combination of horizontal angle and elevation angle) is P 2 , and the direction of each microphone If the sex type is P 3 , there can be a K (= P 1 × P 2 × P 3 ) pattern as a microphone arrangement method. An optimum microphone arrangement is determined by evaluating a correlation between transfer characteristics in an L (= K C M ) pattern microphone arrangement candidate in which M microphones are arranged with respect to a K pattern microphone arrangement candidate.
図1に、Kパターンのマイクロホン配置候補及びNパターンの音源位置候補の一例を示す。M個のマイクロホンはそれぞれ予め定められたP1個の設置位置候補のいずれかに配置される。各マイクロホンは予め定められたP2通りの角度のいずれかに向かって設置される。各マイクロホンは予め定められたP3種類の指向性のうちいずれかの指向性を持つ。音源は予め定められたN個の設置位置候補のいずれかに配置される。図1では、M=7、P1=10としてマイクロホン配置候補の一例を示しており、N=6として音源位置候補の一例を示している。 FIG. 1 shows an example of K pattern microphone arrangement candidates and N pattern sound source position candidates. Each of the M microphones is arranged at any one of P 1 predetermined installation position candidates. Each microphone is placed toward any angle P 2 types determined in advance. Each microphone has either the directivity of the P 3 kinds of directivity predetermined. The sound source is arranged in one of N predetermined installation position candidates. In FIG. 1, an example of a microphone arrangement candidate is shown as M = 7 and P 1 = 10, and an example of a sound source position candidate is shown as N = 6.
図2を参照して、第一実施形態に係るマイクロホン配置決定装置の機能構成の一例を説明する。マイクロホン配置決定装置は、伝達特性計算部1、伝達特性相関計算部2、周波数平均部3、最適配置選択部4、マイクロホン配置候補記憶部7及び音源位置候補記憶部8を含む。マイクロホン配置決定装置は、例えば、中央演算処理装置(Central Processing Unit、CPU)、主記憶装置(Random Access Memory、RAM)などを有する公知又は専用のコンピュータに特別なプログラムが読み込まれて構成された特別な装置である。マイクロホン配置決定装置は、例えば、中央演算処理装置の制御のもとで各処理を実行する。マイクロホン配置決定装置に入力されたデータや各処理で得られたデータは、例えば、主記憶装置に格納され、主記憶装置に格納されたデータは必要に応じて読み出されて他の処理に利用される。マイクロホン配置決定装置が備える各記憶部は、例えば、RAM(Random Access Memory)などの主記憶装置、ハードディスクや光ディスクもしくはフラッシュメモリ(Flash Memory)のような半導体メモリ素子により構成される補助記憶装置、またはリレーショナルデータベースやキーバリューストアなどのミドルウェアにより構成することができる。マイクロホン配置決定装置が備える各記憶部は、それぞれ論理的に分割されていればよく、一つの物理的な記憶装置に記憶されていてもよい。
With reference to FIG. 2, an example of a functional configuration of the microphone arrangement determination device according to the first embodiment will be described. The microphone arrangement determination device includes a transfer
マイクロホン配置候補記憶部7には、予め定めたP1個の設置位置候補、P2通りの角度及びP3種類の指向性の全てを組み合わせたK(=P1×P2×P3)パターンのマイクロホン配置候補が記憶されている。 The microphone placement candidate storage unit 7 has a K (= P 1 × P 2 × P 3 ) pattern that combines all of P 1 preset installation position candidates, P 2 angles, and P 3 types of directivity. Microphone placement candidates are stored.
音源位置候補記憶部8には、予め定めたN個の設置位置候補に対応するNパターンの音源位置候補が記憶されている。
The sound source position
図3を参照しながら、第一実施形態のマイクロホン配置決定装置が実行するマイクロホン配置決定方法の処理フローの一例を、実際に行われる手続きの順に従って説明する。 With reference to FIG. 3, an example of the processing flow of the microphone arrangement determination method executed by the microphone arrangement determination apparatus according to the first embodiment will be described in the order of procedures actually performed.
ステップS1において、伝達特性計算部1は、マイクロホン配置候補記憶部7に記憶されたKパターンのマイクロホン配置候補と音源位置候補記憶部8に記憶されたNパターンの音源位置候補とを入力とし、伝達特性A(ω)=[A1 T(ω),…,AK T(ω)]Tを解析的に導出する。伝達特性A(ω)は伝達特性相関計算部2へ入力される。ここで、Ak(ω)=[Ak,1(ω),…,Ak,N(ω)]であり、Ak,n(ω)はk番目のマイクロホン配置候補とn番目の音源位置候補との間の伝達特性を表す。以下に解析的に伝達特性を算出する方法の一例を示す。
In
k番目のマイクロホン配置候補の位置を原点としたときのn番目の音源位置候補の相対位置ベクトルをqk,n=rk,n[sin(θk,n)cos(φk,n), sin(θk,n)sin(φk,n), cos(θk,n)]Tと表す。ここで、rk,nはk番目のマイクロホン配置候補とn番目の音源位置候補との間の距離を表し、θk,nはk番目のマイクロホン配置候補とn番目の音源位置候補との間の仰角を表し、φk,nはk番目のマイクロホン配置候補とn番目の音源位置候補との間の水平角を表す。また、θk,n (R)はk番目のマイクロホン配置候補における設置角度の仰角を表し、φk,n (R)はk番目のマイクロホン配置候補における設置角度の水平角を表す。また、k番目のマイクロホン配置候補の設置角度ベクトルをqk (R)=[sin(θk,n (R))cos(φk,n (R)), sin(θk,n (R))sin(φk,n (R)), cos(θk,n (R))]Tと表す。このとき、k番目のマイクロホン配置候補とn番目の音源位置候補との間の受音ゲインDk,nは、マイクロホンの指向性の種類に応じて、以下のように算出することができる。 q k, n = r k, n (sin (θ k, n ) cos (φ k, n ), relative position vector of the nth sound source position candidate when the position of the kth microphone placement candidate is the origin sin (θ k, n ) sin (φ k, n ), cos (θ k, n )] T Where r k, n represents the distance between the kth microphone placement candidate and the nth sound source position candidate, and θ k, n is between the kth microphone placement candidate and the nth sound source position candidate. Φ k, n represents the horizontal angle between the kth microphone arrangement candidate and the nth sound source position candidate. Θ k, n (R) represents the elevation angle of the installation angle in the kth microphone arrangement candidate, and φ k, n (R) represents the horizontal angle of the installation angle in the kth microphone arrangement candidate. Also, the installation angle vector of the kth microphone placement candidate is q k (R) = (sin (θ k, n (R) ) cos (φ k, n (R) ), sin (θ k, n (R) ) sin (φ k, n (R) ), cos (θ k, n (R) )] T. At this time, the sound reception gain D k, n between the kth microphone arrangement candidate and the nth sound source position candidate can be calculated as follows according to the type of directivity of the microphone.
(i)無指向性マイクロホン素子を用いた場合の受音ゲインDk,nは次式で表される。 (i) The sound reception gain D k, n when using an omnidirectional microphone element is expressed by the following equation.
(ii)単一指向性マイクロホン素子を用いた場合の受音ゲインDk,nは次式で表される。 (ii) The sound reception gain D k, n when a unidirectional microphone element is used is expressed by the following equation.
(iii)超指向性マイクロホン素子を用いた場合の受音ゲインDk,nは次式で表される。 (iii) The sound reception gain D k, n when a super-directional microphone element is used is expressed by the following equation.
自由音場での収録を前提とした場合の伝達特性は、上記のいずれかの方法で算出された受音ゲインDk,nを用いて次式により算出される。 The transfer characteristic on the premise of recording in a free sound field is calculated by the following equation using the sound reception gain D k, n calculated by any one of the above methods.
ここまでは、反射波の影響を含めた伝達特性のモデル化を行わなかったが、例えば、部屋や車内といった空間の固定された位置にマイクロホンアレーを設置する場合には、反射波を含めた伝達特性のモデル化を行ったほうがよい。反射波のモデル化には様々な方法があるが、例えば、鏡像法によるモデル化が挙げられる(参考文献2参照)。
〔参考文献2〕J. B. Allen and D. A. Berkley, “Image method for efficiently simulating small-room acoustics”, The Journal of the Acoustical Society of America, vol. 65, no. 4, pp. 943-950, 1979.
Up to this point, we did not model the transfer characteristics including the effect of reflected waves.For example, when a microphone array is installed at a fixed position in a space such as a room or a car, the transfer characteristics including the reflected waves are not transmitted. It is better to model the characteristics. Although there are various methods for modeling the reflected wave, for example, modeling by a mirror image method is given (see Reference 2).
[Reference 2] JB Allen and DA Berkley, “Image method for efficiently simulating small-room acoustics”, The Journal of the Acoustical Society of America, vol. 65, no. 4, pp. 943-950, 1979.
また、Nパターンの音源位置候補の位置に必ずしも音源がなければならないわけではなく、事前に音源が存在しそうな位置に対して高い重みを与えることで、音場で予測される観測信号の空間的特性をモデル化してもよい。 In addition, the sound source does not necessarily have to be located at the positions of the N pattern sound source position candidates. By giving a high weight to the position where the sound source is likely to exist in advance, the spatial position of the observed signal predicted in the sound field Characteristics may be modeled.
ステップS2において、伝達特性相関計算部2は、伝達特性A(ω)を入力として、L(=KCM)パターンのマイクロホン配置候補それぞれにおける伝達特性間の相関C(ω)=[C1(ω),…,CL(ω)]Tを計算する。i(i=1,…,L)番目のマイクロホン配置候補におけるマイクロホンのインデックスを{σ1(i),…,σM(i)}∈σ(i)と表す。ここで、σm(i)は1以上K以下の整数の中で該当する値を出力する関数である。
In step S2, the transfer characteristic
伝達特性間の相関の計算方法は様々あるが、(i)伝達特性の相関のパワー平均Ci (1)(ω)を用いる方法、(ii)通信路容量Ci (2)(ω)を用いる方法、(iii)条件数Ci (3)(ω)を用いる方法、(iv)行列式Ci (4)(ω)を用いる方法の四つを示す。 There are various methods for calculating the correlation between transfer characteristics. (I) The method using the power average C i (1) (ω) of the correlation of transfer characteristics, (ii) The channel capacity C i (2) (ω) There are four methods: (iii) a method using the condition number C i (3) (ω), and (iv) a method using the determinant C i (4) (ω).
(i)まず、伝達特性の相関のパワー平均Ci (1)(ω)の計算方法を以下に示す。制御点の全ての組み合わせで伝達特性間の相関のパワーを次式により計算して平均化する。 (i) First, the calculation method of the power average C i (1) (ω) of the correlation of the transfer characteristics is shown below. The correlation power between the transfer characteristics is calculated and averaged by the following equation for all combinations of control points.
ここで、βnはn番目の音源位置に対する重みであり、音源が存在する可能性が高い位置ほど大きな値に設定する。音源の位置に関する事前情報がない場合には、βn=1とすればよい。伝達特性の相関が低いほどCi (1)(ω)の値は小さくなり、完全に伝達特性間が無相関である場合にCi (1)(ω)=0になる。 Here, β n is a weight for the nth sound source position, and is set to a larger value as the position where the sound source is more likely to exist. If there is no prior information regarding the position of the sound source, β n = 1 may be set. The value of the lower correlation of the transfer characteristic C i (1) (ω) becomes small, between fully transfer characteristic becomes C i (1) (ω) = 0 in the case of uncorrelated.
(ii)次に、通信路容量を用いる方法を示す。通信路容量とは、無線におけるMIMO(Multiple-Input and Multiple-Output)系ではよく用いられている尺度であり、音源とマイクロホン間を伝送路として見立てたときの伝送路で送れる最大の情報量である(参考文献3参照)。
〔参考文献3〕G. J. Foschini et al., “On limits of wireless communications in a fading environment when using multi-element antennas”, Wireless Personal Communications, 1998, vol. 6, no. 3, pp.311-335
(ii) Next, a method using the channel capacity will be described. Channel capacity is a measure often used in wireless multiple-input and multiple-output (MIMO) systems, and is the maximum amount of information that can be sent on the transmission path when the sound source and microphone are considered as the transmission path. Yes (see Reference 3).
[Reference 3] GJ Foschini et al., “On limits of wireless communications in a fading environment when using multi-element antennas”, Wireless Personal Communications, 1998, vol. 6, no. 3, pp. 311-335
通信路容量Ci (2)(ω)は次式で計算できる。 The channel capacity C i (2) (ω) can be calculated by the following equation.
ここで、PSNR(ω)は音源信号とセンサノイズの平均的なSN比である。また、Λi,m(ω)はi番目のM本のマイクロホンによるマイクロホン配置候補において期待される空間相関行列Ri(ω)のm番目の固有値であり、Λi,1(ω)≧…≧Λi,M(ω)≧0のように整列されている。音源信号が互いに無相関であると仮定すると、空間相関行列Ri(ω)は解析された伝達特性を用いて、次式により近似的に計算することができる。 Here, P SNR (ω) is an average S / N ratio between the sound source signal and sensor noise. Λ i, m (ω) is the m-th eigenvalue of the spatial correlation matrix R i (ω) expected in the microphone placement candidate by the i-th M microphones, and Λ i, 1 (ω) ≧. Aligned as ≧ Λ i, M (ω) ≧ 0. Assuming that the sound source signals are uncorrelated with each other, the spatial correlation matrix R i (ω) can be approximately calculated by the following equation using the analyzed transfer characteristics.
伝達特性の相関が低いほどCi (2)(ω)の値は大きくなる。完全に伝達特性間が無相関である場合、固有値がΛi,1(ω)≒…≒Λi,M(ω)のように平滑になるので、空間相関行列Ri(ω)のトレース一定の条件下で通信路容量Ci (2)(ω)は最大になる。 The lower the transfer characteristic correlation, the larger the value of C i (2) (ω). When the transfer characteristics are completely uncorrelated, the eigenvalue is smoothed as Λ i, 1 (ω) ≒… ≒ Λ i, M (ω), so the trace of the spatial correlation matrix R i (ω) is constant. Under such conditions, the channel capacity C i (2) (ω) is maximized.
(iii)次に、条件数Ci (3)(ω)を用いる方法を示す。n番目のマイクロホンにおける条件数は、次式のように空間相関行列Ri(ω)の最大固有値と最小固有値の比で計算される。 (iii) Next, a method using the condition number C i (3) (ω) will be described. The condition number in the nth microphone is calculated by the ratio of the maximum eigenvalue and the minimum eigenvalue of the spatial correlation matrix R i (ω) as shown in the following equation.
伝達特性の相関が低いほどCi (3)(ω)の値は小さくなる。完全に伝達特性間が無相関である場合、Ci (3)(ω)=1になる。 The lower the transfer characteristic correlation, the smaller the value of C i (3) (ω). When the transfer characteristics are completely uncorrelated, C i (3) (ω) = 1.
(iv)最後に、行列式Ci (4)(ω)を用いる方法を示す。行列式は、固有値分布の平滑度合を評価するために用いられる一つの評価関数である。 (iv) Finally, a method using the determinant C i (4) (ω) is shown. The determinant is one evaluation function used to evaluate the smoothness of the eigenvalue distribution.
伝達特性の相関が低いほどCi (4)(ω)の値は大きくなる。完全に伝達特性間が無相関である場合、Ci (4)(ω)=1になる。 The lower the transfer characteristic correlation, the larger the value of C i (4) (ω). If the transfer characteristics are completely uncorrelated, C i (4) (ω) = 1.
ステップS3において、周波数平均部3は、上記で述べた四種のうちのいずれか一種の方式で計算された伝達特性間の相関C(ω)=[C1(ω),…,CL(ω)]Tを入力とし、次式により周波数平均化された伝達特性間の相関C-=[C- 1,…,C- L]Tを出力する。 In step S3, the frequency averaging unit 3 correlates the transfer characteristics C (ω) = [C 1 (ω),..., C L (calculated by any one of the four methods described above. ω)] T is input, and the correlation C − = [C − 1 ,..., C − L ] T between the transfer characteristics averaged by the following equation is output.
ここで、Ωは平均化する周波数インデックスの集合であり、|Ω|はその総数を表わす。また、g(ω)は周波数毎の重みを表わす。音声が白色的であると仮定するのであれば、g(ω)=1としても問題ない。 Here, Ω is a set of frequency indexes to be averaged, and | Ω | represents the total number. G (ω) represents a weight for each frequency. If it is assumed that the voice is white, there is no problem even if g (ω) = 1.
ステップS4において、最適配置選択部4は、周波数平均化された伝達特性間の相関C-=[C- 1,…,C- L]Tを入力とし、最も伝達特性の相関性が低くなるマイクロホンの組み合わせ方{σ1(iopt),…,σM(iopt)}∈σ(iopt)を出力する。
In step S4, the optimum
伝達特性間の相関として、例えば、パワー平均Cj (1)(ω)や条件数Cj (3)(ω)を用いた場合には、次式によりマイクロホンの組み合わせのインデックスioptを選択する。 For example, when the power average C j (1) (ω) or the condition number C j (3) (ω) is used as the correlation between the transfer characteristics, the index i opt of the microphone combination is selected by the following equation: .
また、伝達特性間の相関として、例えば、通信路容量Cj (2)(ω)や行列式Cj (4)(ω)を用いた場合には、次式によりマイクロホンの組み合わせのインデックスioptを選択する。 In addition, for example, when the channel capacity C j (2) (ω) or the determinant C j (4) (ω) is used as the correlation between the transfer characteristics, the index i opt of the microphone combination is Select.
このように、第一実施形態のマイクロホン配置決定装置は、マイクロホン素子の(1)設置位置、(2)角度、(3)指向性といった要素を変数とし、各変数の組み合わせからなる多数の配置候補について、解析的に伝達特性の導出を行うため、シミュレーションや実測により事前に伝達特性を用意する必要がない。こうして導出した伝達特性に基づいて伝達特性間の相関を計算することで、最も伝達特性の相関性が低いマイクロホン配置を決定することができる。 As described above, the microphone arrangement determining apparatus according to the first embodiment has a plurality of arrangement candidates including combinations of variables, with variables such as (1) installation position, (2) angle, and (3) directivity of the microphone element. Since the transfer characteristic is derived analytically, it is not necessary to prepare the transfer characteristic in advance by simulation or actual measurement. By calculating the correlation between the transfer characteristics based on the transfer characteristics thus derived, it is possible to determine the microphone arrangement with the lowest correlation of the transfer characteristics.
<第二実施形態>
第一実施形態では、解析的に算出した伝達特性に基づいて、伝達特性間の相関を低減するために最適なマイクロホン配置を決定する処理フローについて説明した。しかし、マイクロホンの本数や配置方法について多数の候補を用意すると、マイクロホン配置候補のパターン数が大きな値になってしまい、計算量が膨大になる場合がある。第二実施形態では、マイクロホンの最適配置計算における計算量を削減したマイクロホン配置決定装置について説明する。
<Second embodiment>
In the first embodiment, the processing flow for determining the optimum microphone arrangement to reduce the correlation between the transfer characteristics based on the analytically calculated transfer characteristics has been described. However, if a large number of candidates for the number of microphones and the arrangement method are prepared, the number of microphone arrangement candidate patterns becomes a large value, and the calculation amount may be enormous. In the second embodiment, a description will be given of a microphone arrangement determination apparatus that reduces the amount of calculation in the optimum arrangement calculation of microphones.
計算量削減のための基本的なアイデアは、伝達特性の相関性を低減することに貢献するマイクロホンを逐次的に選択しながら候補を絞ることである。これにより、伝達特性の相関性を計算するパターン数が減少し、全体の計算量を削減することができる。 The basic idea for reducing the amount of calculation is to narrow down candidates while sequentially selecting microphones that contribute to reducing the correlation of transfer characteristics. As a result, the number of patterns for calculating the correlation of the transfer characteristics is reduced, and the overall calculation amount can be reduced.
図4を参照して、第二実施形態に係るマイクロホン配置決定装置の機能構成の一例を説明する。第二実施形態に係るマイクロホン配置決定装置は、第一実施形態と同様に、伝達特性計算部1、最適配置選択部4、マイクロホン配置候補記憶部7及び音源位置候補記憶部8を含む。第二実施形態に係るマイクロホン配置決定装置は、さらに、伝達特性相関計算部5及び周波数平均部6を含む。
With reference to FIG. 4, an example of a functional configuration of the microphone arrangement determination device according to the second embodiment will be described. The microphone arrangement determination device according to the second embodiment includes a transfer
図5を参照しながら、第二実施形態のマイクロホン配置決定装置が実行するマイクロホン配置決定方法の処理フローの一例を、実際に行われる手続きの順に従って説明する。 With reference to FIG. 5, an example of the processing flow of the microphone arrangement determination method executed by the microphone arrangement determination apparatus according to the second embodiment will be described in the order of procedures actually performed.
ステップS1において、伝達特性計算部1は、第一実施形態と同様に、マイクロホン配置候補記憶部7に記憶されたKパターンのマイクロホン配置候補と音源位置候補記憶部8に記憶されたNパターンの音源位置候補とを入力とし、伝達特性A(ω)=[A1 T(ω),…,AK T(ω)]Tを解析的に導出する。伝達特性の計算方法は、第一実施形態と同様であるので、ここでは詳細な説明は省略する。
In step S <b> 1, as in the first embodiment, the transfer
ステップS5aにおいて、伝達特性相関計算部5は、Kパターンのマイクロホン配置候補の中から、伝達特性間の相関の低減に貢献するρ本のマイクロホンの組み合わせをP組選択する。すでに配置が固定されているマイクロホンが存在する場合には、まだ配置が固定されていないマイクロホンの中からρ本のマイクロホンの組み合わせをP組選択する。マイクロホンの組み合わせはマイクロホンセットと呼ぶこともある。ρは2以上の任意の整数である。配置候補選択部5の処理は繰り返し実行されるが、ρの値は実行する度に毎回異なる値であっても構わない。以降の説明では、ρ=2の場合を例として説明する。Pは2以上の任意の整数である。Pの値に制限はないが、小さい値であるほど計算量が削減することに対応するため、より小さい値とすることが望ましい。
In step S5a, the transfer characteristic
ステップS5bにおいて、伝達特性相関計算部5は、伝達特性A(ω)を入力として、L2(=KCP)パターンのマイクロホン配置候補それぞれにおける伝達特性間の相関C(ω)=[C1(ω),…,CL_2(ω)]Tを計算する。p(p=1,…,P)番目の選択されたマイクロホンのインデックスを{σ1(p),…,σρ(p)}∈σ(p)と表す。j(j=1,…,L2)番目のρ本のマイクロホンの組み合わせ候補とn番目の音源位置との間の伝達特性をαj,n (2)(ω)=[Aσ_1(j),n(ω),…,Aσ_ρ(j),n(ω)]Tとする。αj,n (2)(ω)は入力された伝達特性A(ω)から計算されるものである。
In step S5b, the transfer characteristic
伝達特性間の相関の計算方法は、第一実施形態と同様に、(i)伝達特性の相関のパワー平均Ci (1)(ω)を用いる方法、(ii)通信路容量Ci (2)(ω)を用いる方法、(iii)条件数Ci (3)(ω)を用いる方法、(iv)行列式Ci (4)(ω)を用いる方法の四種類の中から任意の尺度を用いて計算すればよい。 As in the first embodiment, the method for calculating the correlation between the transfer characteristics is as follows: (i) a method using the power average C i (1) (ω) of the correlation of the transfer characteristics, and (ii) a channel capacity C i (2 ) Method using (ω), (iii) Method using condition number C i (3) (ω), (iv) Method using determinant C i (4) (ω) It is sufficient to calculate using
(i)まず、伝達特性の相関のパワー平均Ci (1)(ω)の計算方法を以下に示す。 (i) First, the calculation method of the power average C i (1) (ω) of the correlation of the transfer characteristics is shown below.
伝達特性の相関が低いほどCi (1)(ω)の値は小さくなり、完全に伝達特性間が無相関である場合にCi (1)(ω)=0になる。 The value of the lower correlation of the transfer characteristic C i (1) (ω) becomes small, between fully transfer characteristic becomes C i (1) (ω) = 0 in the case of uncorrelated.
(ii)次に、通信路容量Ci (2)(ω)の計算方法を以下に示す。 (ii) Next, a calculation method of the channel capacity C i (2) (ω) is shown below.
ここで、PSNR(ω)は音源信号とセンサノイズの平均的なSN比である。また、Λj,m (2)(ω)はj番目のρ本のマイクロホンセットによるマイクロホン配置候補において期待される空間相関行列Rj (2)(ω)のm番目の固有値であり、Λj,1 (2)(ω)≧…≧Λj,ρ (2)(ω)≧0のように整列されている。音源信号が互いに無相関であると仮定すると、空間相関行列Rj (2)(ω)は解析された伝達特性を用いて、次式により近似的に計算することができる。 Here, P SNR (ω) is an average S / N ratio between the sound source signal and sensor noise. Also, Λ j, m (2) (ω) is the m-th eigenvalue of the spatial correlation matrix R j (2) (ω) expected in the microphone placement candidate by the j-th ρ microphone set, and Λ j , 1 (2) (ω) ≧… ≧ Λ j, ρ (2) (ω) ≧ 0. Assuming that the sound source signals are uncorrelated with each other, the spatial correlation matrix R j (2) (ω) can be approximately calculated by the following equation using the analyzed transfer characteristics.
伝達特性の相関が低いほどCi (2)(ω)の値は大きくなる。完全に伝達特性間が無相関である場合、固有値がΛi,1 (2)(ω)≒…≒Λi,ρ (2)(ω)のように平滑になるので、空間相関行列Ri (2)(ω)のトレース一定の条件下で通信路容量Ci (2)(ω)は最大になる。 The lower the transfer characteristic correlation, the larger the value of C i (2) (ω). When the transfer characteristics are completely uncorrelated, the eigenvalues become smooth as Λ i, 1 (2) (ω) ≈… ≈Λ i, ρ (2) (ω), so the spatial correlation matrix R i (2) Trace capacity of (ω) The channel capacity C i (2) (ω) is maximized under constant conditions.
(iii)次に、条件数Ci (3)(ω)の計算方法を以下に示す。 (iii) Next, the calculation method of the condition number C i (3) (ω) is shown below.
伝達特性の相関が低いほどCi (3)(ω)の値は小さくなる。完全に伝達特性間が無相関である場合、Ci (3)(ω)=1になる。 The lower the transfer characteristic correlation, the smaller the value of C i (3) (ω). When the transfer characteristics are completely uncorrelated, C i (3) (ω) = 1.
(iv)最後に、行列式Ci (4)(ω)の計算方法を以下に示す。 (iv) Finally, the calculation method of the determinant C i (4) (ω) is shown below.
伝達特性の相関が低いほどCi (4)(ω)の値は大きくなる。完全に伝達特性間が無相関である場合、Ci (4)(ω)=1になる。 The lower the transfer characteristic correlation, the larger the value of C i (4) (ω). If the transfer characteristics are completely uncorrelated, C i (4) (ω) = 1.
ステップS6aにおいて、周波数平均部6は、上記で述べた四種のうちのいずれか一種の方式で計算された伝達特性間の相関C(ω)=[C1(ω),…,CL_2(ω)]Tを入力とし、次式により周波数平均化された伝達特性間の相関C-=[C- 1,…,C- L_2]Tを出力する。 In step S6a, the frequency averaging unit 6 correlates the transfer characteristics C (ω) = [C 1 (ω),..., C L_2 ( ω)] T is input, and a correlation C − = [C − 1 ,..., C − L — 2 ] T between frequency-averaged transfer characteristics by the following equation is output.
ステップS6bにおいて、周波数平均部6は、伝達特性間の相関C-に基づいて、伝達特性の相関性が低くなるP個のマイクロホン組み合わせ候補{σ1(p),…,σρ(p)}(p=1,…,P)を出力する。伝達特性間の相関として、例えば、パワー平均Cj (1)(ω)や条件数Cj (3)(ω)を用いた場合には、C- jの小さい順にP個のマイクロホン配置候補を選択する。伝達特性間の相関として、例えば、通信路容量Cj (2)(ω)や行列式Cj (4)(ω)を用いた場合には、C- jの大きい順にP個のマイクロホン配置候補を選択する。 In step S6b, the frequency averaging unit 6, the correlation C between the transfer characteristic - based on, P number of microphones combination candidate correlation of the transfer characteristic decreases {σ 1 (p), ... , σ ρ (p)} (P = 1, ..., P) is output. For example, when the power average C j (1) (ω) or the condition number C j (3) (ω) is used as the correlation between the transfer characteristics, P microphone arrangement candidates are selected in ascending order of C − j. select. As the correlation between the transfer characteristic, for example, in the case of using the communication channel capacity C j (2) (ω) and the determinant C j (4) (ω) is, C - j a descending order into P microphone arrangement candidates Select.
ステップS6cにおいて、周波数平均部6は、上述の処理で選択されたP個のマイクロホンの組み合わせσ1(p),…,σρ(p)を固定する。続いて、ステップS6dにおいて、周波数平均部6は、M本のマイクロホンの配置が決定しているかどうかを判定し、M本以上のマイクロホンの配置が決定している場合には、次のステップS4へ処理を進める。配置が決定しているマイクロホンの本数がM未満であれば、ステップS5aへ処理を戻す。これにより、伝達特性相関計算部5及び周波数平均部6の処理は、M本のマイクロホンの組み合わせが決定されるまで繰り返し実行されることになる。以上の処理により、M本のマイクロホンの組み合わせにおいて、Pパターンのマイクロホン配置候補に対応する周波数平均化された伝達特性間の相関C-=[C- 1,…,C- P]Tを算出することができる。
In step S6c, the frequency averaging unit 6 fixes the combination of P microphones σ 1 (p),..., Σ ρ (p) selected in the above process. Subsequently, in step S6d, the frequency averaging unit 6 determines whether the arrangement of M microphones has been determined. If the arrangement of M or more microphones has been determined, the process proceeds to the next step S4. Proceed with the process. If the number of microphones whose arrangement has been determined is less than M, the process returns to step S5a. Thereby, the processes of the transfer characteristic
ステップS4において、最適配置選択部4は、伝達特性間の相関C-=[C- 1,…,C- P]Tを入力とし、最も伝達特性の相関性が低くなるマイクロホンの組み合わせ{σ1(popt),…,σM(popt)}∈σ(popt)を出力する。
In step S4, the optimum
伝達特性間の相関として、例えば、パワー平均Cj (1)(ω)や条件数Cj (3)(ω)を用いた場合には、次式によりマイクロホンの組み合わせのインデックスpoptを選択する。 For example, when the power average C j (1) (ω) or the condition number C j (3) (ω) is used as the correlation between the transfer characteristics, the microphone combination index p opt is selected by the following equation: .
また、伝達特性間の相関として、例えば、通信路容量Cj (2)(ω)や行列式Cj (4)(ω)を用いた場合には、次式によりマイクロホンの組み合わせのインデックスpoptを選択する。 As a correlation between transfer characteristics, for example, when channel capacity C j (2) (ω) or determinant C j (4) (ω) is used, the index p opt of the combination of microphones is Select.
このように第二実施形態のマイクロホン配置決定装置は、伝達特性の相関性を低減することに貢献するマイクロホンを逐次的に選択しながら最適なマイクロホン配置を決定するため、伝達特性間の相関を計算するパターン数を減少することができ、全体の計算量を削減することができる。 As described above, the microphone arrangement determining apparatus according to the second embodiment calculates the correlation between the transfer characteristics in order to determine the optimum microphone arrangement while sequentially selecting the microphones that contribute to reducing the correlation of the transfer characteristics. The number of patterns to be reduced can be reduced, and the overall calculation amount can be reduced.
この発明は上述の実施形態に限定されるものではなく、この発明の趣旨を逸脱しない範囲で適宜変更が可能であることはいうまでもない。上記実施例において説明した各種の処理は、記載の順に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。 The present invention is not limited to the above-described embodiment, and it goes without saying that modifications can be made as appropriate without departing from the spirit of the present invention. The various processes described in the above-described embodiments are not only executed in time series according to the order described, but may be executed in parallel or individually as required by the processing capability of the apparatus that executes the processes.
[プログラム、記録媒体]
上記実施形態で説明した各装置における各種の処理機能をコンピュータによって実現する場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記各装置における各種の処理機能がコンピュータ上で実現される。
[Program, recording medium]
When various processing functions in each device described in the above embodiment are realized by a computer, the processing contents of the functions that each device should have are described by a program. Then, by executing this program on a computer, various processing functions in each of the above devices are realized on the computer.
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。 The program describing the processing contents can be recorded on a computer-readable recording medium. As the computer-readable recording medium, for example, any recording medium such as a magnetic recording device, an optical disk, a magneto-optical recording medium, and a semiconductor memory may be used.
また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD−ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。 The program is distributed by selling, transferring, or lending a portable recording medium such as a DVD or CD-ROM in which the program is recorded. Furthermore, the program may be distributed by storing the program in a storage device of the server computer and transferring the program from the server computer to another computer via a network.
このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。そして、処理の実行時、このコンピュータは、自己の記録媒体に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。なお、本形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの(コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等)を含むものとする。 A computer that executes such a program first stores, for example, a program recorded on a portable recording medium or a program transferred from a server computer in its own storage device. When executing the process, the computer reads a program stored in its own recording medium and executes a process according to the read program. As another execution form of the program, the computer may directly read the program from a portable recording medium and execute processing according to the program, and the program is transferred from the server computer to the computer. Each time, the processing according to the received program may be executed sequentially. Also, the program is not transferred from the server computer to the computer, and the above-described processing is executed by a so-called ASP (Application Service Provider) type service that realizes the processing function only by the execution instruction and result acquisition. It is good. Note that the program in this embodiment includes information that is used for processing by an electronic computer and that conforms to the program (data that is not a direct command to the computer but has a property that defines the processing of the computer).
また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、本装置を構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。 In this embodiment, the present apparatus is configured by executing a predetermined program on a computer. However, at least a part of these processing contents may be realized by hardware.
1 伝達特性計算部
2、5 伝達特性相関計算部
3、6 周波数平均部
4 最適配置選択部
7 マイクロホン配置候補記憶部
8 音源配置候補記憶部
DESCRIPTION OF
Claims (5)
配置を固定されたマイクロホンセットがなければ上記複数のマイクロホンから選択した所定の数のマイクロホンセットに関する上記マイクロホン配置候補について上記伝達特性間の相関を計算し、配置を固定されたマイクロホンセットがあれば当該配置を固定されたマイクロホンセットに配置を固定されていない所定の数のマイクロホンを加えたマイクロホンセットに関する上記マイクロホン配置候補について上記伝達特性間の相関を計算する伝達特性相関計算部と、
上記伝達特性間の相関を周波数平均化し、伝達特性の相関性が低い上記マイクロホン配置候補に関する上記マイクロホンセットの配置を固定する周波数平均部と、
上記伝達特性間の相関に基づいて最も伝達特性の相関性が低い上記マイクロホン配置候補を最適なマイクロホン配置として出力する最適配置選択部と、
を含むマイクロホン配置決定装置。 A transfer characteristic calculation unit that calculates transfer characteristics between the microphone and the sound source for microphone placement candidates composed of all combinations of installation positions, angles, and directivities of a plurality of microphones;
If there is no microphone set with a fixed arrangement, the correlation between the transfer characteristics is calculated for the microphone arrangement candidates for a predetermined number of microphone sets selected from the plurality of microphones, and if there is a microphone set with a fixed arrangement, A transfer characteristic correlation calculation unit for calculating a correlation between the transfer characteristics for the microphone arrangement candidate related to the microphone set obtained by adding a predetermined number of microphones whose arrangement is not fixed to the microphone set whose arrangement is fixed;
A frequency averaging unit that averages the correlation between the transfer characteristics, and fixes the arrangement of the microphone set related to the microphone arrangement candidate with low transfer characteristic correlation; and
An optimum arrangement selection unit that outputs the microphone arrangement candidate having the lowest correlation of the transfer characteristics based on the correlation between the transfer characteristics as an optimum microphone arrangement;
A microphone arrangement determination device including:
上記伝達特性相関計算部は、上記伝達特性から計算される空間相関行列の固有値分布の平滑度合いを表す行列式を上記伝達特性間の相関として計算するものである
マイクロホン配置決定装置。 The microphone arrangement determining apparatus according to claim 1, wherein
The microphone arrangement determining apparatus, wherein the transfer characteristic correlation calculation unit calculates a determinant representing a smoothness of an eigenvalue distribution of a spatial correlation matrix calculated from the transfer characteristic as a correlation between the transfer characteristics.
伝達特性相関計算部が、上記複数のマイクロホンから選択した所定の数のマイクロホンセットに関する上記マイクロホン配置候補について上記伝達特性間の相関を計算する第一伝達特性相関計算ステップと、
周波数平均部が、上記伝達特性間の相関を周波数平均化し、伝達特性の相関性が低い上記マイクロホンセットの配置を固定する周波数平均ステップと、
上記伝達特性相関計算部が、配置を固定されたマイクロホンセットに配置を固定されていない所定の数のマイクロホンを加えたマイクロホンセットに関する上記マイクロホン配置候補について上記伝達特性間の相関を計算する第二伝達特性相関計算ステップと、
最適配置選択部が、上記伝達特性間の相関に基づいて最も伝達特性の相関性が低い上記マイクロホン配置候補を最適なマイクロホン配置として出力する最適配置選択ステップと、
を含むマイクロホン配置決定方法。 A transfer characteristic calculating step for calculating a transfer characteristic between the microphone and the sound source for a microphone arrangement candidate including all combinations of installation positions, angles, and directivities of a plurality of microphones;
A first transfer characteristic correlation calculating step in which a transfer characteristic correlation calculating unit calculates a correlation between the transfer characteristics for the microphone arrangement candidates related to a predetermined number of microphone sets selected from the plurality of microphones;
A frequency averaging unit that frequency-averages the correlation between the transfer characteristics and fixes the arrangement of the microphone set with low transfer characteristic correlation; and
A second transmission in which the transfer characteristic correlation calculation unit calculates a correlation between the transfer characteristics for the microphone arrangement candidates related to a microphone set in which a predetermined number of microphones whose arrangement is not fixed is added to a microphone set whose arrangement is fixed. A characteristic correlation calculation step;
An optimal placement selection unit that outputs the microphone placement candidate having the lowest correlation in transfer characteristics based on the correlation between the transfer characteristics as an optimum microphone placement; and
A microphone placement determination method including:
上記第一伝達特性相関計算ステップを実行した後、上記配置を固定されたマイクロホンセットに含まれるマイクロホンの数が上記複数のマイクロホンの数以上となるまで、上記周波数平均ステップ及び上記第二伝達特性相関計算ステップを繰り返し実行する
マイクロホン配置決定方法。 A microphone arrangement determination method according to claim 3,
After performing the first transfer characteristic correlation calculating step, the frequency averaging step and the second transfer characteristic correlation until the number of microphones included in the microphone set having the fixed arrangement becomes equal to or greater than the number of the plurality of microphones. A microphone placement determination method that repeatedly executes calculation steps.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013219787A JP5791685B2 (en) | 2013-10-23 | 2013-10-23 | Microphone arrangement determining apparatus, microphone arrangement determining method and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013219787A JP5791685B2 (en) | 2013-10-23 | 2013-10-23 | Microphone arrangement determining apparatus, microphone arrangement determining method and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015082745A true JP2015082745A (en) | 2015-04-27 |
JP5791685B2 JP5791685B2 (en) | 2015-10-07 |
Family
ID=53013143
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013219787A Active JP5791685B2 (en) | 2013-10-23 | 2013-10-23 | Microphone arrangement determining apparatus, microphone arrangement determining method and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5791685B2 (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017147686A (en) * | 2016-02-19 | 2017-08-24 | 日本放送協会 | Inverse filter calculation device and program thereof |
JP2022127623A (en) * | 2021-02-19 | 2022-08-31 | ノキア テクノロジーズ オサケユイチア | Audio capture in presence of noise |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS57143997A (en) * | 1981-03-02 | 1982-09-06 | Nippon Telegr & Teleph Corp <Ntt> | Noise suppressing method |
JP2000134688A (en) * | 1998-10-28 | 2000-05-12 | Fujitsu Ltd | Microphone array device |
JP2000338990A (en) * | 1999-05-26 | 2000-12-08 | Mitsubishi Electric Corp | Sound signal processor, sound signal processing method and computer-readable recording medium recorded with sound signal processing program |
WO2007026827A1 (en) * | 2005-09-02 | 2007-03-08 | Japan Advanced Institute Of Science And Technology | Post filter for microphone array |
JP2012222518A (en) * | 2011-04-06 | 2012-11-12 | Nippon Telegr & Teleph Corp <Ntt> | Reflection object placement determination method, device and program in filter design |
JP2013135373A (en) * | 2011-12-27 | 2013-07-08 | Nippon Telegr & Teleph Corp <Ntt> | Zoom microphone device |
-
2013
- 2013-10-23 JP JP2013219787A patent/JP5791685B2/en active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS57143997A (en) * | 1981-03-02 | 1982-09-06 | Nippon Telegr & Teleph Corp <Ntt> | Noise suppressing method |
JP2000134688A (en) * | 1998-10-28 | 2000-05-12 | Fujitsu Ltd | Microphone array device |
JP2000338990A (en) * | 1999-05-26 | 2000-12-08 | Mitsubishi Electric Corp | Sound signal processor, sound signal processing method and computer-readable recording medium recorded with sound signal processing program |
WO2007026827A1 (en) * | 2005-09-02 | 2007-03-08 | Japan Advanced Institute Of Science And Technology | Post filter for microphone array |
JP2012222518A (en) * | 2011-04-06 | 2012-11-12 | Nippon Telegr & Teleph Corp <Ntt> | Reflection object placement determination method, device and program in filter design |
JP2013135373A (en) * | 2011-12-27 | 2013-07-08 | Nippon Telegr & Teleph Corp <Ntt> | Zoom microphone device |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017147686A (en) * | 2016-02-19 | 2017-08-24 | 日本放送協会 | Inverse filter calculation device and program thereof |
JP2022127623A (en) * | 2021-02-19 | 2022-08-31 | ノキア テクノロジーズ オサケユイチア | Audio capture in presence of noise |
US11877127B2 (en) | 2021-02-19 | 2024-01-16 | Nokia Technologies Oy | Audio capture in presence of noise |
JP7416843B2 (en) | 2021-02-19 | 2024-01-17 | ノキア テクノロジーズ オサケユイチア | Audio capture in the presence of noise |
Also Published As
Publication number | Publication date |
---|---|
JP5791685B2 (en) | 2015-10-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6594222B2 (en) | Sound source information estimation apparatus, sound source information estimation method, and program | |
Shahbazpanahi et al. | A covariance fitting approach to parametric localization of multiple incoherently distributed sources | |
JP4660773B2 (en) | Signal arrival direction estimation device, signal arrival direction estimation method, and signal arrival direction estimation program | |
JP6211890B2 (en) | Sound collector | |
CN106537501B (en) | Reverberation estimator | |
CN111489753B (en) | Anti-noise sound source positioning method and device and computer equipment | |
JP2018063200A (en) | Sound source position estimation device, sound source position estimation method, and program | |
Belloch et al. | On the performance of multi-GPU-based expert systems for acoustic localization involving massive microphone arrays | |
CN106093920B (en) | It is a kind of based on the adaptive beam-forming algorithm diagonally loaded | |
US11830471B1 (en) | Surface augmented ray-based acoustic modeling | |
CN103837858B (en) | A kind of far field direction of arrival estimation method for planar array and system | |
JP5791685B2 (en) | Microphone arrangement determining apparatus, microphone arrangement determining method and program | |
JP6117142B2 (en) | Conversion device | |
Frank et al. | Constant-beamwidth kronecker product beamforming with nonuniform planar arrays | |
KR101354960B1 (en) | Method for an Estimation of Incident Wave Direction by Applying Regional Concept | |
JP6063890B2 (en) | Conversion device | |
Huiying et al. | A novel dual-channel matching method based on time reversal and its performance for sound source localization in enclosed space | |
JP5815489B2 (en) | Sound enhancement device, method, and program for each sound source | |
Astapov et al. | Far field speech enhancement at low SNR in presence of nonstationary noise based on spectral masking and MVDR beamforming | |
Xiong et al. | Study of MVDR beamforming with spatially distributed source: theoretical analysis and efficient microphone array geometry optimization method | |
CN110782913A (en) | Implementation of beam forming voice enhancement algorithm based on general MCU | |
Brandstein et al. | Cell-based beamforming (CE-BABE) for speech acquisition with microphone arrays | |
Han et al. | Sound source localization using multiple circular microphone arrays based on harmonic analysis | |
JP2017040572A (en) | Device, method, and program for estimating direction-of-arrival | |
Kousaka et al. | Implementation of target sound extraction system in frequency domain and its performance evaluation in actual room environments |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20150715 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150728 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150804 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5791685 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |