JP2017059956A - Sound source extraction system and sound source extraction method - Google Patents
Sound source extraction system and sound source extraction method Download PDFInfo
- Publication number
- JP2017059956A JP2017059956A JP2015182147A JP2015182147A JP2017059956A JP 2017059956 A JP2017059956 A JP 2017059956A JP 2015182147 A JP2015182147 A JP 2015182147A JP 2015182147 A JP2015182147 A JP 2015182147A JP 2017059956 A JP2017059956 A JP 2017059956A
- Authority
- JP
- Japan
- Prior art keywords
- sound source
- sound
- microphones
- target
- extraction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
Description
本発明は、複数のマイクロホンを用いて目的音源から伝搬する音を抽出する音源抽出システム及び音源抽出方法に関する。 The present invention relates to a sound source extraction system and a sound source extraction method for extracting sound propagating from a target sound source using a plurality of microphones.
一般に、多様な音源が存在する空間の中から、目的とする特定の音源から伝搬する音のみを抽出するための種々の技術が知られている(特許文献1参照)。このうち、特にビームフォーミング法は、複数のマイクロホンを有するマイクロホンアレイを用いて、所定位置に存在する目的音源から伝搬した音を収集し、演算処理により目的音源が位置する方向を特定することで、目的音源を他の音源から分離して抽出することが可能となる。このようなビームフォーミング法を適用することにより、目的音源が静止している場合だけではなく、目的音源が移動している場合もそれに追随することができる。 In general, various techniques for extracting only sound propagating from a target specific sound source from a space where various sound sources exist are known (see Patent Document 1). Among these, in particular, the beam forming method uses a microphone array having a plurality of microphones, collects the sound propagated from the target sound source existing at a predetermined position, and specifies the direction in which the target sound source is located by calculation processing. It is possible to extract the target sound source separately from other sound sources. By applying such a beam forming method, it is possible to follow not only when the target sound source is stationary but also when the target sound source is moving.
上記ビームフォーミングを適用する場合、マイクロホンアレイから見て目的音源と同じ方向に妨害音源が存在すると、目的音源と妨害音源とを分離できない事態も生じ得る。この場合、マイクロホンアレイから目的音源に向かうビームの幅を狭めることで、目的音源を妨害音源から分離して音の空間分解能を高める効果が得られる。しかし、ビームフォーミング法によるビームの幅を狭めることは、マイクロホンや音の各種パラメータによる制約を受けるとともに、空間分解能を高めるための演算量の増加が避けられない。また、多数のマイクロホンアレイを設置して目的音源を多様な方向から監視することも想定されるが、この場合であっても各々のマイクロホンアレイが独立に目的音源を抽出するので、それぞれのビームの幅の範囲内に妨害音が存在する場合には、上述の問題を回避することは困難である。 When the beam forming is applied, if a disturbing sound source exists in the same direction as the target sound source when viewed from the microphone array, a situation in which the target sound source and the disturbing sound source cannot be separated may occur. In this case, by narrowing the width of the beam from the microphone array toward the target sound source, it is possible to obtain an effect of increasing the spatial resolution of the sound by separating the target sound source from the disturbing sound source. However, narrowing the beam width by the beam forming method is limited by various parameters of the microphone and sound, and an increase in the amount of calculation for increasing the spatial resolution is inevitable. In addition, it is assumed that a large number of microphone arrays are installed to monitor the target sound source from various directions, but even in this case, each microphone array independently extracts the target sound source, It is difficult to avoid the above-mentioned problem when there is an interference sound within the range of the width.
本発明はこれらの問題を解決するためになされたものであり、目的音源からの音を抽出する際の演算処理により、ビームフォーミング法を適用する場合に比べて良好な性能を確保し得る音源抽出システム等を提供することを目的とする。 The present invention has been made to solve these problems, and the sound source extraction that can ensure better performance than the case where the beam forming method is applied by the arithmetic processing when extracting the sound from the target sound source. The purpose is to provide a system.
上記課題を解決するために、本発明の音源抽出システムは、目的音源から伝搬する音を抽出する音源抽出システムであって、複数の単位領域に分割される所定の抽出領域外に分散配置され、前記目的音源を含む1又は2以上の音源から伝搬する音を収集する複数のマイクロホンと、前記複数のマイクロホンのそれぞれの出力信号に基づき、予め前記1又は2以上の音源の位置に対応付けられた前記複数の単位領域の各々から前記複数のマイクロホンの各々に至る音伝搬の複数の伝達関数を要素として含む行列を算出し、当該行列から1つの逆行列を求めておき、この逆行列を用いて前記目的音源から発生する音を抽出する演算手段と、を備えて構成される。 In order to solve the above problems, a sound source extraction system of the present invention is a sound source extraction system that extracts sound propagating from a target sound source, and is distributed and arranged outside a predetermined extraction region divided into a plurality of unit regions. A plurality of microphones collecting sound propagating from one or more sound sources including the target sound source, and the output signals of the plurality of microphones are associated with the positions of the one or more sound sources in advance. A matrix including a plurality of transfer functions of sound propagation from each of the plurality of unit regions to each of the plurality of microphones as an element is calculated, and one inverse matrix is obtained from the matrix, and the inverse matrix is used. And an arithmetic means for extracting a sound generated from the target sound source.
本発明の音源抽出システムによれば、目的音源と妨害音源が存在する抽出領域を複数の単位領域に区分し、複数のマイクロホンの各出力信号に基づき、予め各単位領域の位置毎に音伝搬の伝達関数を求めて、その逆特性を与える1つの逆行列を用いることで、目的音源から伝搬する音を抽出するものである。よって、各マイクロホンの位置から同一方向に目的音源と妨害音源が存在する状況であっても、従来のビームフォーミング法の音源分離のような煩雑な演算を行うことなく、抽出領域の全体に分布するマイクロホンの出力信号に基づき確実に目的音源を妨害音源から分離して抽出可能となる。 According to the sound source extraction system of the present invention, the extraction region where the target sound source and the disturbing sound source are present is divided into a plurality of unit regions, and sound propagation is performed in advance for each position of each unit region based on each output signal of the plurality of microphones. The sound that propagates from the target sound source is extracted by obtaining a transfer function and using one inverse matrix that gives its inverse characteristics. Therefore, even in a situation where the target sound source and the disturbing sound source exist in the same direction from the position of each microphone, it is distributed over the entire extraction region without performing complicated calculations such as sound source separation in the conventional beam forming method. The target sound source can be reliably separated and extracted from the disturbing sound source based on the output signal of the microphone.
本発明において、前記複数のマイクロホンに含まれる所定数の前記マイクロホンをそれぞれ具備し、前記抽出領域外の異なる位置に配置された複数のマイクロホンアレイを更に設けることができる。この場合、音源抽出システムにおける複数のマイクロホンアレイは、所謂アレイオブアレイズ(array of arrays)を構成する。例えば、L個のマイクロホンアレイの各々がM個のマイクロホンを有する場合、全部でL×M個のマイクロホンが設置されることになる。このような配置であっても、システム全体で1つの逆行列を生成するので、前述のように同一方向に存在する目的音源と妨害音源を分離する効果が得られることに加え、容易に設置できる点で有用性が高い。なお、複数のマイクロホンアレイは、抽出領域外で偏った配置にせずに、外縁部の近傍に分散配置することが望ましい。 In the present invention, a plurality of microphone arrays each having a predetermined number of the microphones included in the plurality of microphones and arranged at different positions outside the extraction region can be further provided. In this case, the plurality of microphone arrays in the sound source extraction system constitute a so-called array of arrays. For example, when each of the L microphone arrays has M microphones, L × M microphones are installed in total. Even with such an arrangement, since one inverse matrix is generated in the entire system, the effect of separating the target sound source and the disturbing sound source existing in the same direction as described above can be obtained, and in addition, it can be easily installed. Highly useful in terms. Note that it is desirable that the plurality of microphone arrays be dispersedly arranged in the vicinity of the outer edge portion without being biasedly arranged outside the extraction region.
本発明において、前記複数のマイクロホンアレイとして、球形状のバッフルの表面に前記所定数のマイクロホンが配置された球状マイクロホンアレイを用いることができる。球状マイクロンアレイは小型に構成できる点でメリットがあるとともに、比較的簡単に前述の逆行列を生成する演算を行うことが可能となる。また、システムとしてロバストになる。 In the present invention, a spherical microphone array in which the predetermined number of microphones are arranged on the surface of a spherical baffle can be used as the plurality of microphone arrays. The spherical micron array is advantageous in that it can be made compact, and it is possible to perform the operation for generating the inverse matrix relatively easily. Moreover, it becomes robust as a system.
また、上記課題を解決するために、本発明の音源抽出方法は、目的音源から伝搬する音を抽出する音源抽出方法であって、複数の単位領域に分割される所定の抽出領域外に分散配置された複数のマイクロホンにより、前記目的音源を含む1又は2以上の音源から伝搬する音を収集する音収集ステップと、前記複数のマイクロホンのそれぞれの出力信号に基づき、予め前記1又は2以上の音源の位置に対応付けられた前記複数の単位領域の各々から前記複数のマイクロホンの各々に至る音伝搬の複数の伝達関数を要素として含む行列を算出し、当該行列から得られた1つの逆行列を求めておき、この逆行列を用いて前記目的音源から伝搬する音を抽出する演算ステップと、を備えている。 In order to solve the above-described problem, the sound source extraction method of the present invention is a sound source extraction method for extracting sound propagating from a target sound source, and is distributed outside a predetermined extraction area divided into a plurality of unit areas. A sound collecting step of collecting sounds propagating from one or more sound sources including the target sound source using the plurality of microphones, and the one or more sound sources in advance based on respective output signals of the plurality of microphones A matrix including a plurality of transfer functions of sound propagation from each of the plurality of unit regions associated with the position to each of the plurality of microphones as an element, and one inverse matrix obtained from the matrix is calculated. And a calculation step for extracting a sound propagated from the target sound source using the inverse matrix.
本発明の音源抽出方法によれば、前述の音源抽出システムと同様の作用効果を実現することができる。また、複数のマイクロホンアレイを更に設ける構成についても、前述と同様に適用可能である。なお、本発明の音源抽出方法において、前記演算ステップでは、前記複数のマイクロホンの配置に応じた空間的窓関数を用いて前記目的音源を抽出することが望ましい。 According to the sound source extraction method of the present invention, it is possible to achieve the same operational effects as those of the sound source extraction system described above. Further, a configuration in which a plurality of microphone arrays are further provided can be applied in the same manner as described above. In the sound source extraction method of the present invention, it is preferable that the target sound source is extracted using a spatial window function corresponding to the arrangement of the plurality of microphones in the calculation step.
本発明によれば、複数の単位領域に分割される抽出領域外に複数のマイクロホンを分散配置し、音伝搬の複数の伝達関数に基づいて得られる1つの逆行列を用いて目的音源から伝搬する音を抽出するようにしたので、従来のビームフォーミング法で問題となる目的音源と妨害音源の方向性による影響を回避しつつ、シンプルな演算処理により信頼性の高い音源抽出システムを構築することが可能となる。 According to the present invention, a plurality of microphones are dispersedly arranged outside an extraction region divided into a plurality of unit regions, and propagated from a target sound source using one inverse matrix obtained based on a plurality of transfer functions of sound propagation. Since the sound is extracted, it is possible to construct a highly reliable sound source extraction system by simple arithmetic processing while avoiding the influence of the direction of the target sound source and the disturbing sound source, which is a problem in the conventional beam forming method. It becomes possible.
以下、本発明を適用した音源抽出システムの実施形態について添付図面を参照しながら説明する。ただし、以下に述べる実施形態は本発明の技術思想を適用した形態の例であって、本発明が本実施形態の内容により限定されることはない。 Embodiments of a sound source extraction system to which the present invention is applied will be described below with reference to the accompanying drawings. However, the embodiments described below are examples of forms to which the technical idea of the present invention is applied, and the present invention is not limited by the contents of the present embodiments.
図1は、本実施形態の音源抽出システムで用いる主な構成要素である球状マイクロホンアレイ(以下、単に「マイクロホンアレイ」という)1の構造を示している。図1に示すマイクロホンアレイ1は、硬質材料からなる球形状のバッフル10と、このバッフル10の球表面の所定位置にそれぞれ配置された複数のマイクロホン11と、複数のマイクロホン11から出力される電気信号を伝送する複数の配線が収納された配線部12とを備えている。
FIG. 1 shows the structure of a spherical microphone array (hereinafter simply referred to as “microphone array”) 1, which is a main component used in the sound source extraction system of the present embodiment. A
図1の下部に示すように、本実施形態の音源抽出システムを含む空間内の位置は、X、Y、Z座標を変換して、方位角θ、仰角φ、距離rによる極座標で表示される。例えば、任意のマイクロホン11の極座標上の位置は、(θm、φm、rm)と表すことができ、球形状のバッフル10の中心を原点と仮定すれば、1つのマイクロホンアレイ1に取り付けられた全てのマイクロホン11は互いに等しい距離rmに設定されることになる。
As shown in the lower part of FIG. 1, the position in the space including the sound source extraction system of this embodiment is displayed in polar coordinates by converting the X, Y, and Z coordinates, and the azimuth angle θ, the elevation angle φ, and the distance r. . For example, the position of an arbitrary microphone 11 on the polar coordinates can be expressed as (θ m , φ m , r m ). If the center of the spherical baffle 10 is assumed to be the origin, the microphone 11 is attached to one
1つのマイクロホンアレイ1が有する複数のマイクロホン11のそれぞれの位置については制約されないが、一般的なビームフォーミング法と同様の構成を採用することができる。また、1つのマイクロホンアレイ1が有する複数のマイクロホン11の個数については、少なすぎると精度が低下し、多すぎると後述の演算に必要な演算量が増大する。例えば、1つのマイクロホンアレイ1に64個のマイクロホン11が取り付けられる。
Each position of the plurality of microphones 11 included in one
ここで、各マイクロホン11の音圧pmは、次の(1)式で表される。
r→ m:マイクロホンの位置べクトル
r→ s:音源の位置べクトル
ps:音源の音圧
hn:球ハンケル関数
h’n:hnを微分した関数
Pn:n次ルジャンドル多項式
Here, the sound pressure p m of each microphone 11 is expressed by the following equation (1).
r → m : Microphone position vector
r → s : position vector of sound source
p s : Sound pressure of the sound source
h n : Spherical Hankel function
h ′ n : a function obtained by differentiating h n
P n : n-th order Legendre polynomial
なお、従来の手法では、上述の音圧pmをそれぞれのマイクロホン11について取得し、所謂ビームフォーミング法を用いて目的音源の抽出を行うのに対し、本実施形態の音源抽出システムにおいては、従来のビームフォーミング法とは異なる手法で目的音源の抽出を行う点が特徴的である。この点の詳細については後述する。 In the conventional method, the sound pressure p m of the above-obtained for each of the microphones 11, while the extraction of the target sound source by using a so-called beam forming method, the signal extraction system of the present embodiment, conventional It is characteristic that the target sound source is extracted by a method different from the beam forming method. Details of this point will be described later.
本実施形態の音源抽出システムでは、図1のマイクロホンアレイ1を複数個用いることで、所謂アレイオブアレイズ(array of arrays)を構成する。各マイクロホン11及び各マイクロホンアレイ1はサンプリング同期させる必要がある。図2は、本実施形態の音源抽出システムにおける複数のマイクロホンアレイ1の配置例を示している。図2では、理解の容易のため、XY座標で表される領域AAに配置される音源抽出システムを想定しているが、実際の音源抽出システムはZ方向も含む3次元空間に構成される。図2の例では、抽出領域Aを含む矩形状の領域AAのうち、抽出領域Aの外部における4つの角部に対称的に配置された4つのマイクロホンアレイ1(a)、1(b)、1(c)、1(d)を示している。この場合、各々のマイクロホンアレイ1がN個ずつのマイクロホン11を有する場合、全部で4N個のマイクロホン11が存在することになる。なお、それぞれのマイクロホンアレイ1の設置位置は自由に定めることができるが、できるだけ位置が偏らないよう、抽出領域Aの外縁部の近傍に分散配置することが望ましい。
In the sound source extraction system of the present embodiment, a so-called array of arrays is configured by using a plurality of
抽出領域Aは、X方向及びY方向に沿って等間隔に配置された直線群により多数のグリッドG(本発明の単位領域)を構成する。そして、抽出すべき目的音源を含む1又は2以上の音源の各々は、抽出領域AのいずれかのグリッドGに点音源として配置されると仮定し、そのグリッドGの位置に基づいて各音源から個々のマイクロホン11に至る伝達関数による音源抽出の演算処理が行われる。なお、具体的な演算処理については後述する。ここで、抽出領域A内におけるグリッドGのサイズ及び個数は特に制約されないが、演算量と空間分解能に応じて適切に設定される。すなわち、抽出領域A内において、グリッドGが小さ過ぎると演算量が増加し、グリッドGが大き過ぎると空間分解能が足りずに音源同士の分離が難しくなるので、グリッドGを適度なサイズに設定する必要がある。 The extraction area A constitutes a number of grids G (unit areas of the present invention) by a group of straight lines arranged at equal intervals along the X and Y directions. Then, it is assumed that each of one or more sound sources including the target sound source to be extracted is arranged as a point sound source in any grid G of the extraction region A, and based on the position of the grid G, Calculation processing of sound source extraction by a transfer function reaching each microphone 11 is performed. Specific calculation processing will be described later. Here, the size and number of grids G in the extraction region A are not particularly limited, but are appropriately set according to the calculation amount and the spatial resolution. That is, in the extraction area A, if the grid G is too small, the amount of computation increases. If the grid G is too large, the spatial resolution is insufficient and separation of sound sources becomes difficult, so the grid G is set to an appropriate size. There is a need.
図3は、図2の配置例に対応する音源抽出システムの機能ブロックの一例を示している。図3に示す音源抽出システムには、図2の4つのマイクロホンアレイ1(a)、1(b)、1(c)、1(d)に加えて、AD変換部20と、演算処理部21と、出力部22とを備えている。このうち、AD変換部20、演算処理部21、出力部22は、例えば、前述のマイクロホンアレイ1の4つの配線部12と接続可能なパーソナルコンピュータ等により一体的に構成することができる。
FIG. 3 shows an example of functional blocks of a sound source extraction system corresponding to the arrangement example of FIG. In the sound source extraction system shown in FIG. 3, in addition to the four microphone arrays 1 (a), 1 (b), 1 (c), and 1 (d) shown in FIG. And an
4つのマイクロホンアレイ1が有する4N個のマイクロホン11は、各音源から伝搬した音を収集してアナログ信号Saにそれぞれ変換し、それを対応する配線部12を経由してAD変換部20に伝送する。AD変換部20は、4N個のマイクロホン11から出力された4N個のアナログ信号Saを所定のサンプリング周波数でそれぞれサンプリングし、4N個のディジタル信号Sdに変換する。すなわち、AD変換部20には、少なくともマイクロホン11の個数に相当する複数のAD変換器が並列に配置されている。演算処理部21は、AD変換部20で得られた各ディジタル信号Sdを用いて、目的音源の抽出に必要な後述の演算処理を実行し、演算結果に対応する信号Sを生成する。出力部22は、演算処理部21から出力された信号Sを、システム外部の装置あるいはシステム内部の記憶手段や表示手段等に出力する。
The 4N microphones 11 included in the four
次に、本実施形態の音源抽出システムにおける演算処理の概要について説明する。図4は、予め逆行列を算出する処理の流れを示すフローチャートである。ここでは、所定の抽出領域A内に存在するグリッドGに既知の出力音を発生する基準音源を配置する。図4に示すように、各マイクロホン11の出力信号(図3のディジタル信号Sdに相当)に基づいて、N個のマイクロホンアレイ1が有する全てのマイクロホン11の出力信号に対応する音圧pmを取得する(ステップS1)。例えば、全部でL個のマイクロホン11が存在する場合、それぞれに対応するL個の音圧pmが得られる。
Next, an outline of arithmetic processing in the sound source extraction system of the present embodiment will be described. FIG. 4 is a flowchart showing a flow of processing for calculating an inverse matrix in advance. Here, a reference sound source that generates a known output sound is arranged in a grid G existing in a predetermined extraction area A. As shown in FIG. 4, on the basis of the output signals of the microphones 11 (corresponding to the digital signal Sd in FIG. 3), the sound pressure p m corresponding to the output signals of all the microphones 11 having the N pieces of the
ここで、球状のマイクロホンアレイ1を用いる場合の各々のマイクロホン11における音圧pmは、既に説明したように、前述の(1)式で表される。グリッドGに存在する基準音源からの音は、多様な経路を経て各々のマイクロホン11に入力される。よって、各々のマイクロホンアレイ1が有する各々のマイクロホン11に関し、当該基準音源の位置(図2のグリッドGに対応)からの音伝搬の伝達関数を得ることができ、これを全てのグリッドGに対して順次計算する(ステップS2)。ステップS2において、所定のマイクロホンアレイ1が有する各マイクロホン11の伝達関数Hamは、例えば、(1)式に関連して、次の(2)式で表すことができる。
r→ a:マイクロホンアレイの位置べクトル
r→:音源の位置べクトル
Ra:バッフルの半径
hn:球ハンケル関数
h’n:hnを微分した関数
Pn:n次ルジャンドル多項式
Here, the sound pressure p m in each of the microphones 11 in the case of using a
r → a : Microphone array position vector
r → : Sound source position vector
R a : radius of baffle
h n : Spherical Hankel function
h ′ n : a function obtained by differentiating h n
P n : n-th order Legendre polynomial
ここで、所定のマイクロホンアレイ1が有する各マイクロホン11の全音圧pamは、実際には、次の(3)式で表すように抽出領域A内の体積積分で表される。
一方、本実施形態の抽出領域Aは前述のようにグリッドGに分割されるので、所定の空間分解能に応じて(3)式の演算回数が増減し、グリッドGの設定により演算処理を簡素化することができる。まず、全てのマイクロホンアレイ1が有する全てのマイクロホン11の出力を要素とする出力ベクトルSを用いると、次の(4)式が成り立つ。
Λ:全てのグリッド点に音源があると仮定したときにそれぞれの音源が発生している音の大きさ(分布)
(4)式において、分布Λの要素は、抽出領域A内の任意のグリッドGにおける音エネルギーの合計を表している。
On the other hand, since the extraction area A of the present embodiment is divided into the grid G as described above, the number of calculations of the expression (3) increases or decreases according to a predetermined spatial resolution, and the calculation process is simplified by setting the grid G. can do. First, when an output vector S having elements of outputs of all microphones 11 included in all
Λ: Sound volume (distribution) generated by each sound source when it is assumed that there are sound sources at all grid points
In the equation (4), the element of the distribution Λ represents the sum of sound energy in an arbitrary grid G in the extraction area A.
本実施形態の音源抽出システムでは、上述の分布Λを求めるために(4)式より全ての伝達関数Hamを要素とする行列Hを求め、さらにその逆行列H−1を予め求めておき、この1つの逆行列H−1を用いた演算を行う点が特徴的である。従って、(2)式で得られる全ての伝達関数Hamに基づき、前述の逆行列H−1を生成する(ステップS3)。一方、抽出領域A内にある目的音源の音圧ptを求める場合は、まず全てのマイクロホンアレイ1が有する全てのマイクロホン11の出力信号に基づき、出力ベクトルSを決定する。
In the sound source extraction system of this embodiment, in order to obtain the above distribution Λ, a matrix H having all transfer functions H am as elements is obtained from the equation (4), and an inverse matrix H −1 is obtained in advance. It is characteristic that an operation using this one inverse matrix H −1 is performed. Therefore, the above-described inverse matrix H −1 is generated based on all the transfer functions H am obtained by the expression (2) (step S3). On the other hand, when obtaining the sound pressure p t of the target sound source in the extraction region A, based on the output signals of all the microphones 11 to first all the
次いで、目的音源の音圧ptを次の(5)式に基づき算出する。
なお、(5)式で用いる空間的窓関数Wtは、グリッド化された抽出領域Aの空間分解能に依存して適宜に設定される。以上のようにして、本実施形態の音源抽出システムの演算処理の結果、抽出領域A内における目的音源が抽出でき、後述するように妨害音源が存在する場合であっても、目的音源を確実に分離可能となる。 Note that the spatial window function W t used in the equation (5) is set as appropriate depending on the spatial resolution of the gridded extraction region A. As described above, the target sound source can be extracted in the extraction area A as a result of the calculation processing of the sound source extraction system of the present embodiment, and the target sound source can be reliably detected even when there is a disturbing sound source as will be described later. Separable.
ここで、本実施形態の音源抽出システムにおいて、前述の演算処理を適用する場合の効果について、図5及び図6を用いて説明する。図5は、2個のマイクロホンアレイ1a、1bにより目的音源30を抽出する際、それぞれ同じ方向に2個の妨害音源31a、31bが存在する状況で、従来のビームフォーミング法を適用する場合を模式的に示し、図6は、図5と同様の状況で本発明に係る手法を適用する場合を模式的に示している。いずれにおいても、一方のマイクロホンアレイ1aからビームBaの方向に目的音源30及び一方の妨害音源31aが配置され、他方のマイクロホンアレイ1bから見てビームBbの方向に目的音源30及び他方の妨害音源31bが配置され、さらに両方のビームBa、Bbが互いに直交する位置関係にある。
Here, in the sound source extraction system of the present embodiment, the effect when the above-described arithmetic processing is applied will be described with reference to FIGS. 5 and 6. FIG. 5 schematically shows a case where the conventional beam forming method is applied in a situation where there are two
まず、図5に示すように従来の手法を適用する場合には、一方のマイクロホンアレイ1aによるビームBaの範囲に目的音源30と妨害音源31aの両方が存在するとともに、他方のマイクロホンアレイ1bによるビームBbの範囲に目的音源30と妨害音源31bの両方が存在する状態にある。従来の手法では、2個のマイクロホンアレイ1a、1bは、それぞれが独立に音響拡散の逆特性を計算して目的音源30を抽出するので、それぞれのビームBa、Bbの指向性(ビーム幅)の制約により目的音源30を妨害音源31a、31bから分離することが困難となる。この場合、複雑な音源分離アルゴリズムを適用して目的音源30と妨害音源31a、31bを分離することは演算量の増加を招くので現実的ではない。
First, when the conventional method is applied as shown in FIG. 5, both the
これに対し、図6では、本発明に係る手法を適用する場合において、予めそれぞれのマイクロホンアレイ1a、1bの全てのマイクロホン11の出力に基づき計算される前述の1つの逆行列を用いて目的音源30を抽出する。よって、例えば、一方のマイクロホンアレイ1aから見たとき、図6に仮想的なビームBcを示すように、互いに方向が異なる目的音源30と妨害音源31a、31bを分離することができる。他方のマイクロホンアレイ1bから見たときの目的音源30と妨害音源31a、31bの関係についても同様である。従って、音源抽出システムの全体において、目的音源30とそれ以外の多数の妨害音源がそれぞれ異なるグリッドGに位置している限り、各々の妨害音源の影響を受けることなく目的音源30を容易に抽出することが可能となる。
On the other hand, in FIG. 6, when applying the method according to the present invention, the target sound source is obtained using the above-described one inverse matrix calculated based on the outputs of all the microphones 11 of the respective microphone arrays 1a and 1b. 30 is extracted. Therefore, for example, when viewed from one microphone array 1a, the
次に、本実施形態の音源抽出システムを用いる場合の性能のシミュレーション検証結果について、図7を用いて説明する。本発明との対比のため、図7(A)は音源抽出に関する手法を適用しない場合、図7(B)は従来のビームフォーミング法を適用する場合、図7(C)は本発明に係る手法を適用する場合のそれぞれの実験による検証結果が示される。いずれの図においても、目的音源30と妨害音源31の両方が存在する状況で、それぞれ目的音源30の抽出性能を比較した。横軸の時間範囲は1秒とし、縦軸は−1〜+1の範囲で正規化された音圧とした。また、音源抽出システムとしては、音源抽出の対象である抽出領域の中心から互いに3m離れた2個のマイクロホンアレイ1を設置し、それぞれに64個のマイクロホン11を取り付けた条件とした。また、目的音源30としては、25msのホワイトノイズのバースト信号の出力期間と25msの信号停止期間とを繰り返すように設定した。なお、目的音源30と妨害音源31は独立である。
Next, performance simulation verification results when the sound source extraction system of this embodiment is used will be described with reference to FIG. For comparison with the present invention, FIG. 7A shows a case where a method related to sound source extraction is not applied, FIG. 7B shows a case where a conventional beam forming method is applied, and FIG. 7C shows a method according to the present invention. The verification result by each experiment when applying is shown. In any figure, the extraction performance of the
図7(A)に示すように、上記各手法を適用しない場合の結果から、目的音源30と妨害音源31は、それぞれの音圧レベルのピークが等しくなるように設定した。よって、図7(A)では、目的音源30の音圧レベルが妨害音源31に埋もれた状態となる。一方、従来のビームフォーミング法を適用した図7(B)では、目的音源30を妨害音源31から分離できるが、そのSN比は約10.4dBであった。これに対し、本発明に係る手法を適用した図7(C)では、目的音源30を妨害音源31から分離でき、かつSN比が約18.6dBとなり、図7(B)に比べて明確に改善されたことが確認できた。
As shown in FIG. 7A, based on the results when the above methods are not applied, the
以上説明したように、本発明を適用した音源抽出システム(音源抽出方法)を採用することにより、グリッド化した抽出領域A内の各音源から全てのマイクロホン11に至る伝達関数の行列を反転した1つの逆行列を生成し、それにより妨害音源の方向性に影響されることなく目的音源を良好な性能で抽出することができる。この場合、従来のビームフォーミング法で用いる複雑な音源分離アルゴリズムは不要であり、シンプルな演算処理で目的音源の抽出が可能となる。また、本発明を適用した音源抽出システムにより、目的音源が静止している場合だけではなく、目的音源が移動している場合もそれに追随して抽出することができる。なお、抽出領域A内の複数のマイクロホン11は、マイクロホンアレイ1を構成しない場合も本発明の適用が可能であるが、所定数のマイクロホンアレイ1を用いることで、抽出領域Aの角部などに簡単に設置できる効果を得られる。
As described above, by adopting the sound source extraction system (sound source extraction method) to which the present invention is applied, the matrix of the transfer function from each sound source in the grid extraction region A to all the microphones 11 is inverted 1 By generating two inverse matrices, the target sound source can be extracted with good performance without being affected by the directionality of the disturbing sound source. In this case, the complicated sound source separation algorithm used in the conventional beam forming method is unnecessary, and the target sound source can be extracted by a simple arithmetic processing. In addition, the sound source extraction system to which the present invention is applied can extract not only when the target sound source is stationary but also when the target sound source is moving. Note that the present invention can be applied to a plurality of microphones 11 in the extraction region A even when the
以上、本実施形態に基づき本発明の内容を具体的に説明したが、本発明は上述の実施形態に限定されるものではなく、その要旨を逸脱しない範囲で多様な変更を施すことができる。上記実施形態の主な構成要素(図1、図2、図3)や演算処理の手順(図4)などについては、上記実施形態で開示した内容に限定されるものではなく、本発明の作用効果を得られる限り、適宜に変更可能である。 The contents of the present invention have been specifically described above based on the present embodiment, but the present invention is not limited to the above-described embodiment, and various modifications can be made without departing from the scope of the present invention. The main components (FIGS. 1, 2, and 3) and the calculation processing procedure (FIG. 4) of the above embodiment are not limited to the contents disclosed in the above embodiment, and the operation of the present invention. As long as the effect is obtained, it can be appropriately changed.
1…マイクロホンアレイ
10…バッフル
11…マイクロホン
12…配線部
20…AD変換部
21…演算処理部
22…出力部
30…目的音源
31…妨害音源
A…抽出領域
G…グリッド
DESCRIPTION OF
Claims (7)
複数の単位領域に分割される所定の抽出領域外に分散配置され、前記目的音源を含む1又は2以上の音源から伝搬する音を収集する複数のマイクロホンと、
前記複数のマイクロホンのそれぞれの出力信号に基づき、予め前記1又は2以上の音源の位置に対応付けられた前記複数の単位領域の各々から前記複数のマイクロホンの各々に至る音伝搬の複数の伝達関数を要素として含む行列を算出し、当該行列から1つの逆行列を求めておき、この逆行列を用いて前記目的音源から伝搬する音を抽出する演算手段と、
を備えることを特徴とする音源抽出システム。 A sound source extraction system that extracts sound propagating from a target sound source,
A plurality of microphones that are distributed outside a predetermined extraction region divided into a plurality of unit regions and that collect sound propagating from one or more sound sources including the target sound source;
A plurality of transfer functions of sound propagation from each of the plurality of unit regions previously associated with the positions of the one or more sound sources to each of the plurality of microphones based on output signals of the plurality of microphones Calculating a matrix including the element, obtaining one inverse matrix from the matrix, and using the inverse matrix to extract sound propagating from the target sound source,
A sound source extraction system comprising:
複数の単位領域に分割される所定の抽出領域外に分散配置された複数のマイクロホンにより、前記目的音源を含む1又は2以上の音源から伝搬する音を収集する音収集ステップと、
前記複数のマイクロホンのそれぞれの出力信号に基づき、予め前記1又は2以上の音源の位置に対応付けられた前記複数の単位領域の各々から前記複数のマイクロホンの各々に至る音伝搬の複数の伝達関数を要素として含む行列を算出し、当該行列から得られた1つの逆行列を求めておき、この逆行列を用いて前記目的音源から伝搬する音を抽出する演算ステップと、
を備えることを特徴とする音源抽出方法。 A sound source extraction method for extracting sound propagating from a target sound source,
A sound collecting step of collecting sound propagating from one or more sound sources including the target sound source by using a plurality of microphones distributed outside a predetermined extraction region divided into a plurality of unit regions;
A plurality of transfer functions of sound propagation from each of the plurality of unit regions previously associated with the positions of the one or more sound sources to each of the plurality of microphones based on output signals of the plurality of microphones Calculating a matrix including the element, obtaining one inverse matrix obtained from the matrix, and extracting the sound propagating from the target sound source using the inverse matrix;
A sound source extraction method comprising:
The sound source extraction method according to claim 6, wherein in the calculation step, the target sound source is extracted using a spatial window function corresponding to the arrangement of the plurality of microphones.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015182147A JP2017059956A (en) | 2015-09-15 | 2015-09-15 | Sound source extraction system and sound source extraction method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015182147A JP2017059956A (en) | 2015-09-15 | 2015-09-15 | Sound source extraction system and sound source extraction method |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2017059956A true JP2017059956A (en) | 2017-03-23 |
Family
ID=58390566
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015182147A Pending JP2017059956A (en) | 2015-09-15 | 2015-09-15 | Sound source extraction system and sound source extraction method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2017059956A (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109471145A (en) * | 2018-10-17 | 2019-03-15 | 中北大学 | A kind of alliteration positioning and orientation method based on acoustic passive location array with four sensors platform |
CN112526451A (en) * | 2020-10-29 | 2021-03-19 | 清华大学 | Compressed beam forming and system based on microphone array imaging |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0587619A (en) * | 1991-09-26 | 1993-04-06 | Ono Sokki Co Ltd | Sound extraction method and apparatus |
JP2000152372A (en) * | 1998-09-11 | 2000-05-30 | Mitsubishi Heavy Ind Ltd | Directional microphone, and sound source survey device using the same |
JP2004279845A (en) * | 2003-03-17 | 2004-10-07 | Univ Waseda | Signal separating method and its device |
US20130147835A1 (en) * | 2011-12-09 | 2013-06-13 | Hyundai Motor Company | Technique for localizing sound source |
JP2013183358A (en) * | 2012-03-02 | 2013-09-12 | Oki Electric Ind Co Ltd | Sound pickup device and program |
JP2015079080A (en) * | 2013-10-16 | 2015-04-23 | 日本電信電話株式会社 | Sound source position estimation device, method, and program |
-
2015
- 2015-09-15 JP JP2015182147A patent/JP2017059956A/en active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0587619A (en) * | 1991-09-26 | 1993-04-06 | Ono Sokki Co Ltd | Sound extraction method and apparatus |
JP2000152372A (en) * | 1998-09-11 | 2000-05-30 | Mitsubishi Heavy Ind Ltd | Directional microphone, and sound source survey device using the same |
JP2004279845A (en) * | 2003-03-17 | 2004-10-07 | Univ Waseda | Signal separating method and its device |
US20130147835A1 (en) * | 2011-12-09 | 2013-06-13 | Hyundai Motor Company | Technique for localizing sound source |
JP2013183358A (en) * | 2012-03-02 | 2013-09-12 | Oki Electric Ind Co Ltd | Sound pickup device and program |
JP2015079080A (en) * | 2013-10-16 | 2015-04-23 | 日本電信電話株式会社 | Sound source position estimation device, method, and program |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109471145A (en) * | 2018-10-17 | 2019-03-15 | 中北大学 | A kind of alliteration positioning and orientation method based on acoustic passive location array with four sensors platform |
CN109471145B (en) * | 2018-10-17 | 2022-12-06 | 中北大学 | Double-sound positioning attitude determination method based on quaternary acoustic array platform |
CN112526451A (en) * | 2020-10-29 | 2021-03-19 | 清华大学 | Compressed beam forming and system based on microphone array imaging |
CN112526451B (en) * | 2020-10-29 | 2024-04-19 | 清华大学 | Compressed beam forming and system based on microphone array imaging |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9549253B2 (en) | Sound source localization and isolation apparatuses, methods and systems | |
KR101349268B1 (en) | Method and apparatus for mesuring sound source distance using microphone array | |
JP6635903B2 (en) | Sound source position estimating apparatus, sound source position estimating method, and program | |
JP5488679B1 (en) | Microphone array selection device, microphone array selection program, and sound collection device | |
Yang et al. | Functional delay and sum beamforming for three-dimensional acoustic source identification with solid spherical arrays | |
JP2008236077A (en) | Target sound extracting apparatus, target sound extracting program | |
JP5494699B2 (en) | Sound collecting device and program | |
Epain et al. | Super-resolution sound field imaging with sub-space pre-processing | |
JP2018170717A (en) | Sound pickup device, program, and method | |
JP2017059956A (en) | Sound source extraction system and sound source extraction method | |
JP5997007B2 (en) | Sound source position estimation device | |
JP3766006B2 (en) | Receiver | |
TWI429885B (en) | Method for visualizing sound source energy distribution in reverberant environment | |
Alon et al. | Spherical microphone array with optimal aliasing cancellation | |
Akcakaya et al. | Performance analysis of the Ormia ochracea’s coupled ears | |
US11122363B2 (en) | Acoustic signal processing device, acoustic signal processing method, and acoustic signal processing program | |
JP2008089312A (en) | Signal arrival direction estimation apparatus and method, signal separation apparatus and method, and computer program | |
Belloch et al. | Real-time sound source localization on an embedded GPU using a spherical microphone array | |
CN111755021A (en) | Speech enhancement method and device based on binary microphone array | |
Zhao et al. | Large region acoustic source mapping using movable arrays | |
JP7003393B2 (en) | Terminal device, its control method and control program | |
JP2019075616A (en) | Sound field recording apparatus and sound field recording method | |
Li et al. | Ghost image suppression based on particle swarm optimization-MVDR in sound field reconstruction | |
JP5172909B2 (en) | Reflected sound information estimation apparatus, reflected sound information estimation method, program | |
Shi et al. | Modeling the directivity of parametric loudspeaker |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A80 | Written request to apply exceptions to lack of novelty of invention |
Free format text: JAPANESE INTERMEDIATE CODE: A80 Effective date: 20151013 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180911 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20180911 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190717 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190723 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20200204 |