JP6763332B2 - Sound collectors, programs and methods - Google Patents

Sound collectors, programs and methods Download PDF

Info

Publication number
JP6763332B2
JP6763332B2 JP2017068486A JP2017068486A JP6763332B2 JP 6763332 B2 JP6763332 B2 JP 6763332B2 JP 2017068486 A JP2017068486 A JP 2017068486A JP 2017068486 A JP2017068486 A JP 2017068486A JP 6763332 B2 JP6763332 B2 JP 6763332B2
Authority
JP
Japan
Prior art keywords
gain
sound
area
target area
directivity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017068486A
Other languages
Japanese (ja)
Other versions
JP2018170717A (en
Inventor
大 藤枝
大 藤枝
一浩 片桐
一浩 片桐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2017068486A priority Critical patent/JP6763332B2/en
Publication of JP2018170717A publication Critical patent/JP2018170717A/en
Application granted granted Critical
Publication of JP6763332B2 publication Critical patent/JP6763332B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、収音装置、プログラム及び方法に関し、例えば、特定のエリアの音のみを強調し、それ以外のエリアの音を抑圧する場合に適用し得るものである。 The present invention relates to a sound collecting device, a program and a method, and can be applied to, for example, a case where only a sound in a specific area is emphasized and a sound in another area is suppressed.

従来、特定の方向に存在する音(音声や音響;以下、音声及び音響をまとめて音響と呼ぶこともある)を強調し、それ以外の音を抑圧する技術として、マイクアレイを用いたビームフォーマがある。ビームフォーマとは、各マイクに到達する信号の時間差を利用して指向性や死角を形成する技術である(非特許文献1、非特許文献2参照)。 Conventionally, a beam former using a microphone array is used as a technique for emphasizing sounds existing in a specific direction (voice and sound; hereinafter, sound and sound are sometimes collectively referred to as sound) and suppressing other sounds. There is. The beam former is a technique for forming directivity and blind spots by utilizing the time difference between signals arriving at each microphone (see Non-Patent Document 1 and Non-Patent Document 2).

しかし、単純にビームフォーマの指向性を収音目的とするエリア(以下、「目的エリア」と呼ぶ)に向けただけでは、目的エリアの周囲に雑音源が存在する場合、目的エリア内に存在する音源(以下、「目的エリア音」と呼ぶ)だけでなく、目的エリア外に存在する雑音源(以下、「非目的エリア音」と呼ぶ)も同時に収音してしまうという問題が存在する。 However, if the directivity of the beam former is simply directed to an area for sound collection purposes (hereinafter referred to as "target area"), if there is a noise source around the target area, it exists in the target area. There is a problem that not only the sound source (hereinafter referred to as "target area sound") but also the noise source existing outside the target area (hereinafter referred to as "non-purpose area sound") is picked up at the same time.

この問題に対して、複数のマイクアレイを用いて、別々の方向から指向性を目的エリアに向けて交差させ、目的エリア音を収音する従来方式が提案されている(特許文献1)。特許文献1に記載された方式では、各マイクアレイのビームフォーマ出力を同時に処理することで、目的エリアを抽出する。 To solve this problem, a conventional method has been proposed in which directivity is crossed from different directions toward a target area by using a plurality of microphone arrays, and sound in the target area is picked up (Patent Document 1). In the method described in Patent Document 1, the target area is extracted by simultaneously processing the beamformer output of each microphone array.

図6は、従来の複数のマイクアレイを用いた収音処理の例について示した説明図である。 FIG. 6 is an explanatory diagram showing an example of sound collection processing using a plurality of conventional microphone arrays.

図6では、2つのマイクアレイMA(MA、MA)の指向性を目的エリアに向けた場合の例について示している。 FIG. 6 shows an example in which the directivity of the two microphone arrays MA (MA 1 and MA 2 ) is directed toward the target area.

図6(a)は、2つのマイクアレイMA、MAの指向性を目的エリアに向けた場合の各マイクアレイMAや、目的エリア音の音源との位置関係について示している。また、図6(a)では、マイクアレイMA、MAに対応する指向性(ビームフォーマの指向性)D1、D2についても図示している。さらに、図6(a)の例では、目的エリアの音源の周囲に非目的エリア音の音源が存在している。従って、図6(a)の状態では、マイクアレイMA、MAのビームフォーマ出力には、共に、目的エリアにある音源による目的エリア音だけでなく、同じ指向性方向の非目的エリアにある音源による非目的エリア音が含まれてしまう。 FIG. 6A shows the positional relationship between each microphone array MA and the sound source of the target area sound when the directivity of the two microphone arrays MA 1 and MA 2 is directed toward the target area. Further, FIG. 6A also illustrates the directivity (directivity of the beam former) D1 and D2 corresponding to the microphone arrays MA 1 and MA 2 . Further, in the example of FIG. 6A, a sound source of the non-purpose area sound exists around the sound source of the target area. Therefore, in the state of FIG. 6A, both the beamformer outputs of the microphone arrays MA 1 and MA 2 are not only in the target area sound by the sound source in the target area but also in the non-purpose area in the same directivity direction. Non-purpose area sound from the sound source is included.

図6(b)、図6(c)は、それぞれ、2つのマイクアレイMA、MAのビームフォーマ出力の周波数成分を示している。音声のスパース性を仮定すると、図6(b)、図6(c)に示すように、一つの周波数成分には一つの音源(目的エリア音又は非目的エリア音)しか含まれない。そして、目的エリアは全てのマイクアレイの指向性に含まれているため、目的エリア音の周波数成分は、全てのビームフォーマ出力に、同じ割合、同じ分布で含まれる。これと比較して、非目的エリア音の周波数成分は、ビームフォーマ出力ごとに異なっている。このような特徴から、各ビームフォーマ出力に共通に含まれる周波数成分は、目的エリア音が有する成分と推定することができ、これに基づいて、特許文献1等に記載された従来の目的エリア音の収音方法が実現されている。 6 (b) and 6 (c) show the frequency components of the beamformer outputs of the two microphone arrays MA 1 and MA 2 , respectively. Assuming the sparsity of speech, as shown in FIGS. 6 (b) and 6 (c), one frequency component includes only one sound source (target area sound or non-target area sound). Since the target area is included in the directivity of all the microphone arrays, the frequency components of the target area sound are included in all the beam former outputs in the same proportion and with the same distribution. In comparison, the frequency component of the non-purpose area sound is different for each beamformer output. From these characteristics, the frequency component commonly included in each beamformer output can be estimated to be a component of the target area sound, and based on this, the conventional target area sound described in Patent Document 1 and the like can be estimated. The sound collection method of is realized.

図7は、従来の収音方法を適用した収音装置10の機能的構成について示したブロック図である。 FIG. 7 is a block diagram showing a functional configuration of the sound collecting device 10 to which the conventional sound collecting method is applied.

図6に示す従来の収音装置10は、データ入力部2、周波数領域変換部3、指向性形成部4、伝搬遅延差補正部5、パワー補正部6、第1の減算部7、及び第2の減算部8を有している。 The conventional sound collecting device 10 shown in FIG. 6 includes a data input unit 2, a frequency domain conversion unit 3, a directivity forming unit 4, a propagation delay difference correction unit 5, a power correction unit 6, a first subtraction unit 7, and a first subtraction unit 7. It has a subtraction unit 8 of 2.

マイクアレイMA、MAからの捕捉信号は、それぞれ、データ入力部2においてアナログ信号からデジタル信号(データ)に変換され、周波数領域変換部3において時間領域から周波数領域へと変換されて捕捉信号群X及びXが得られる。そして、指向性形成部4において図6(a)の指向性D1、指向性D2のような指向性を有するビームフォーマが適用されてビームフォーマ出力信号Xma1(f)及びXma2(f)が得られる。そして、伝搬遅延差補正部5において各マイクアレイと目的エリアとの距離(既知の情報)に基づいていずれかのビームフォーマ出力信号Xma1(f)及びXma2(f)を遅延させてタイミングを合わせて、遅延補正信号X’ma1(f)及びX’ma2(f)が得られる。 The captured signals from the microphone arrays MA 1 and MA 2 are each converted from an analog signal to a digital signal (data) in the data input unit 2 and converted from a time domain to a frequency domain in the frequency domain conversion unit 3, respectively. Groups X 1 and X 2 are obtained. Then, a beam former having directivity such as the directivity D1 and the directivity D2 of FIG. 6A is applied to the directivity forming unit 4, and the beamformer output signals X ma1 (f) and X ma2 (f) are generated. can get. Then, the propagation delay difference correction unit 5 delays one of the beam former output signals X ma1 (f) and X ma2 (f) based on the distance (known information) between each microphone array and the target area to adjust the timing. together, the delay correction signal X 'ma1 (f) and X' ma2 (f) is obtained.

パワー補正部6では、各マイクアレイと目的エリアとの距離による振幅差に加えて、目的エリア内の話者の向きに適応するため、(1)式によって振幅補正係数αma1(アルファ)を算出する。なお、(1)式中の演算子mode(A(f))は、変数fにより値が変わる関数値A(f)のうち最も多く出現した値(最頻値)を得る演算子である。また、最頻値に代えて、(2)式のように中央値を用いても良い。なお、(2)式中の演算子median(A(f))は、変数fにより値が変わる関数値A(f)の中央値を得る演算子である。

Figure 0006763332
In the power correction unit 6, in addition to the amplitude difference due to the distance between each microphone array and the target area, the amplitude correction coefficient α ma1 (alpha) is calculated by the equation (1) in order to adapt to the direction of the speaker in the target area. To do. The operator mode f (A (f)) in the equation (1) is an operator that obtains the most frequently occurring value (mode) of the function values A (f) whose values change depending on the variable f. .. Further, instead of the mode value, the median value may be used as in Eq. (2). The operator median f (A (f)) in the equation (2) is an operator that obtains the median value of the function value A (f) whose value changes depending on the variable f.
Figure 0006763332

そして、第1の減算部7において、マイクアレイMAに係る遅延補正信号X’ma1(f)から振幅補正係数αma1によって振幅を補正したマイクアレイMAに係る遅延補正信号X’ma2(f)をスペクトル減算することにより、両ビームフォーマ出力で重なっている目的エリア音成分が消去され、マイクアレイMAに係る遅延補正信号X’ma1(f)に含まれている非目的エリア音成分Nma1(f)が抽出される。(3)式は、概ねこのような考え方に従っている算出式である。
ma1=X’ma1−αma1・X’ma2 …(3)
Then, in the first subtracting unit 7, 'delay correction signal X according ma1 from (f) to the microphone array MA 2 obtained by correcting the amplitude by the amplitude correction coefficient alpha ma1' ma2 delay correction signal X according to the microphone array MA 1 (f ) by spectral subtraction to both beamformer erased object area sound components overlapping in the output, the delay correction signal X 'ma1 (f) non-target area sound components contained in the N of the microphone array MA 1 ma1 (f) is extracted. Equation (3) is a calculation equation that generally follows this way of thinking.
N ma1 = X 'ma1 -α ma1 · X' ma2 ... (3)

そして、第2の減算部8において、マイクアレイMAに係る遅延補正信号X’ma1(f)から非目的エリア音成分Nma1(f)をスペクトル減算することにより、目的エリア音Yma1(f)が抽出される。(4)式は、概ねこのような考え方に従っている算出式である((4)式中のβma1(ベータ)は、非目的エリア音の除去強度を定めている一定値を取る係数である)。
ma1=X’ma1−βma1・Nma1…(4)
Then, in the second subtracting unit 8, by spectral subtraction of the non-target area sound component N ma1 (f) from the delay correction signal X 'ma1 according to the microphone array MA 1 (f), sound object area Y ma1 (f ) Is extracted. Equation (4) is a calculation equation that generally follows this idea (β ma1 (beta) in equation (4) is a coefficient that takes a constant value that determines the removal intensity of non-purpose area sound). ..
Y ma1 = X'ma1- β ma1 · N ma1 ... (4)

以上のように、従来の収音方法を適用した収音装置では、目的エリアの周囲に非目的エリア音源が存在していても、目的エリア音のみを収音することができる。 As described above, in the sound collecting device to which the conventional sound collecting method is applied, even if the non-purpose area sound source exists around the target area, only the target area sound can be picked up.

特開2014−72708号公報Japanese Unexamined Patent Publication No. 2014-722708

浅野太著、“音のアレイ信号処理 −音源の定位・追跡と分離”、社団法人日本音響学会、コロナ社、2011年2月25日発行Tadashi Asano, "Sound Array Signal Processing-Sound Source Localization, Tracking and Separation", Acoustical Society of Japan, Corona Publishing Co., Ltd., February 25, 2011 矢頭隆、森戸誠、山田圭、小川哲司共著、“正方形マイクロホンアレイによる音源分離技術(<特集>音声認識技術の実用化への取り組み)”、一般社団法人情報処理学会、情報処理51(11)、pp.1410−1416.2010年Takashi Yato, Makoto Morito, Kei Yamada, Tetsuji Ogawa, "Sound Source Separation Technology by Square Microphone Array (<Special Feature> Efforts to Practical Use of Speech Recognition Technology)", Information Processing Society of Japan, Information Processing 51 (11) , Pp. 1410-1416.2010

しかし、従来の収音方法では、各マイクアレイMAと目的エリアとの距離による振幅差と目的エリア内の話者の向きとに適応するために、(1)式のような最頻値の演算か、(2)式のような中央値の演算を必要とする。最頻値を算出するには度数分布(ヒストグラムとも呼ぶ)を作成する必要があり、度数分布を作成するには多数の比較演算に加えて、階級の細かさ(分解能)を経験的に決める必要がある。また、中央値を算出するには与えられたデータを大小の順で並べ替える必要があり、多数の比較演算を行う必要がある。 However, in the conventional sound collection method, in order to adapt to the amplitude difference due to the distance between each microphone array MA and the target area and the orientation of the speaker in the target area, the mode calculation as in Eq. (1) is performed. Or, the operation of the median value as in Eq. (2) is required. To calculate the mode, it is necessary to create a frequency distribution (also called a histogram), and to create a frequency distribution, it is necessary to empirically determine the fineness (resolution) of the class in addition to many comparison operations. There is. In addition, in order to calculate the median, it is necessary to sort the given data in order of magnitude, and it is necessary to perform a large number of comparison operations.

また、さらに、従来の収音方法では、やはり各マイクアレイMAと目的エリアとの距離による振幅差と目的エリア内の話者の向きとに適応するための振幅補正係数αma1を算出するために、マイクアレイの数は2個でなければならない。そのため、例えば、図8のように、目的エリアを3次元的に設定する場合には、2つのマイクアレイMA、MAをマイク数3個以上の平面マイクアレイ(図8は、4つのマイク1〜1を用いた平面マイクアレイの例を示している)として、2つのマイクアレイMA、MAの指向性が目的エリア内(例えば、目的エリアの中心位置近傍)で交差するように注意深く設置しなければならない。 Further, in the conventional sound collection method, in order to calculate the amplitude correction coefficient α ma1 for adapting to the amplitude difference due to the distance between each microphone array MA and the target area and the orientation of the speaker in the target area. , The number of microphone arrays must be two. Therefore, for example, when the target area is set three-dimensionally as shown in FIG. 8, two microphone arrays MA 1 and MA 2 are set as a flat microphone array having three or more microphones (FIG. 8 shows four microphones). as it has) shows an example of a planar microphone array using 1 1 to 1 4, so that the two microphone arrays MA 1, the directivity of the MA 2 intersect in the object area (e.g., a central position near the destination area) Must be installed carefully.

つまり、従来の収音方法では、演算量が多いという課題や、パラメータを事前に経験的に決めなければならないという課題や、マイク及びマイクアレイそれぞれの数と配置が制限されるという課題があった。 In other words, the conventional sound collection method has a problem that the amount of calculation is large, a problem that parameters must be determined empirically in advance, and a problem that the number and arrangement of each microphone and microphone array are limited. ..

そのため、より少ない演算量で、事前に決定しなければならないパラメータなしに、マイク及びマイクアレイそれぞれの数と配置に制限されることなく、目的エリア音のみを強調する収音装置、プログラム及び方法が望まれている。 Therefore, with less computation, sound collectors, programs and methods that emphasize only the target area sound, without being limited by the number and placement of each microphone and microphone array, without parameters that must be determined in advance. It is desired.

第1の本発明の収音装置は、(1)複数のマイクアレイが出力する捕捉信号を周波数領域に変換した入力信号のそれぞれに対し、ビームフォーマによって目的エリア音方向へ指向性を形成する際の指向性ゲインを取得する指向性ゲイン算出手段と、(2)それぞれの前記マイクアレイの指向性ゲインに基づいて目的エリア音を強調するエリア強調ゲインを取得するエリア強調ゲイン算出手段と、(3)前記マイクアレイの入力信号と、前記エリア強調ゲイン算出手段が取得したエリア強調ゲインに基づいて、目的エリア音を強調した目的エリア強調信号を取得する目的エリア音取得手段とを有することを特徴とする。 The first sound collecting device of the present invention is (1) when the beam former forms directivity in the target area sound direction for each of the input signals obtained by converting the captured signals output by the plurality of microphone arrays into the frequency domain. The directivity gain calculation means for acquiring the directivity gain of the above, (2) the area enhancement gain calculation means for acquiring the area enhancement gain for emphasizing the target area sound based on the directivity gain of each of the microphone arrays, and (3). ) It is characterized by having a target area sound acquisition means for acquiring a target area emphasis signal that emphasizes the target area sound based on the input signal of the microphone array and the area emphasis gain acquired by the area emphasis gain calculation means. To do.

第2の本発明の収音プログラムは、コンピュータを、(1)複数のマイクアレイが出力する捕捉信号を周波数領域に変換した入力信号のそれぞれに対し、ビームフォーマによって目的エリア音方向へ指向性を形成する際の指向性ゲインを取得する指向性ゲイン算出手段と、(2)それぞれの前記マイクアレイの指向性ゲインに基づいて目的エリア音を強調するエリア強調ゲインを取得するエリア強調ゲイン算出手段と、(3)前記マイクアレイの入力信号と、前記エリア強調ゲイン算出手段が取得したエリア強調ゲインに基づいて、目的エリア音を強調した目的エリア強調信号を取得する目的エリア音取得手段として機能させることを特徴とする。 The second sound collection program of the present invention uses a beamformer to direct the computer in the direction of the sound in the target area for each of the input signals obtained by converting the captured signals output by the plurality of microphone arrays into the frequency region. A directivity gain calculation means for acquiring the directivity gain at the time of formation, and (2) an area enhancement gain calculation means for acquiring an area enhancement gain for emphasizing the target area sound based on the directivity gain of each of the microphone arrays. , (3) Based on the input signal of the microphone array and the area enhancement gain acquired by the area enhancement gain calculation means, the target area sound is functioned as a target area sound acquisition means for acquiring the target area emphasis signal that emphasizes the target area sound. It is characterized by.

第3の本発明は、収音方法において、(1)指向性ゲイン算出手段、エリア強調ゲイン算出手段、及び目的エリア音取得手段を備え、(2)前記指向性ゲイン算出手段は、複数のマイクアレイが出力する捕捉信号を周波数領域に変換した入力信号のそれぞれに対し、ビームフォーマによって目的エリア音方向へ指向性を形成する際の指向性ゲインを取得し、(3)前記エリア強調ゲイン算出手段は、それぞれの前記マイクアレイの指向性ゲインに基づいて目的エリア音を強調するエリア強調ゲインを取得し、(4)前記目的エリア音取得手段は、前記マイクアレイの入力信号と、前記エリア強調ゲイン算出手段が取得したエリア強調ゲインに基づいて、目的エリア音を強調した目的エリア強調信号を取得することを特徴とする。 A third aspect of the present invention includes (1) directional gain calculating means, area emphasis gain calculating means, and target area sound acquiring means in a sound collecting method, and (2) the directional gain calculating means includes a plurality of microphones. For each of the input signals obtained by converting the captured signal output by the array into the frequency region, the directional gain at the time of forming the directivity in the target area sound direction by the beam former is acquired, and (3) the area emphasis gain calculation means. Acquires an area enhancement gain that emphasizes the target area sound based on the directional gain of each of the microphone arrays, and (4) the target area sound acquisition means obtains the input signal of the microphone array and the area enhancement gain. Based on the area emphasis gain acquired by the calculation means, the target area emphasis signal that emphasizes the target area sound is acquired.

本発明によれば、より少ない演算量で、事前に決定しなければならないパラメータなしに、マイク及びマイクアレイそれぞれの数と配置に制限されることなく目的エリア音のみを強調することができる。 According to the present invention, it is possible to emphasize only the target area sound without being limited by the number and arrangement of the microphone and the microphone array, respectively, with less calculation amount and without parameters that must be determined in advance.

第1、第3、第4の実施形態に係る収音装置の機能的構成について示したブロック図である。It is a block diagram which showed the functional structure of the sound collecting apparatus which concerns on 1st, 3rd, 4th Embodiment. 第1の実施形態に係る収音装置における収音処理の概要(技術思想)について示した説明図(イメージ図)である。It is explanatory drawing (image figure) which showed the outline (technical idea) of the sound collecting process in the sound collecting apparatus which concerns on 1st Embodiment. 第1の実施形態に係るマイクアレイの構成例について示した説明図である。It is explanatory drawing which showed the configuration example of the microphone array which concerns on 1st Embodiment. 第1の実施形態に係る指向性ゲイン算出部の内部構成について示したブロック図である。It is a block diagram which showed the internal structure of the directivity gain calculation part which concerns on 1st Embodiment. 第2の実施形態に係る収音装置の機能的構成について示したブロック図である。It is a block diagram which showed the functional structure of the sound collecting apparatus which concerns on 2nd Embodiment. 従来の収音方法の例について示した説明図である。It is explanatory drawing which showed the example of the conventional sound collection method. 従来の収音装置の機能的構成について示したブロック図である。It is a block diagram which showed the functional structure of the conventional sound collecting apparatus. 従来の収音装置で用いられる平面マイクアレイの構成例について示した説明図である。It is explanatory drawing which showed the structural example of the plane microphone array used in the conventional sound collecting apparatus.

(A)第1の実施形態
以下、本発明による収音装置、プログラム及び方法の第1の実施形態を、図面を参照しながら詳述する。
(A) First Embodiment Hereinafter, the first embodiment of the sound collecting device, the program and the method according to the present invention will be described in detail with reference to the drawings.

(A−1)第1の実施形態の構成
図1は、この実施形態の収音装置100の機能的構成について示したブロック図である。なお、図1において、括弧内の符号は、後述する第3及び第4の実施形態で用いられる符号である。
(A-1) Configuration of First Embodiment FIG. 1 is a block diagram showing a functional configuration of the sound collecting device 100 of this embodiment. In FIG. 1, the reference numerals in parentheses are the reference numerals used in the third and fourth embodiments described later.

収音装置100は、M個のマイクアレイMA(MA〜MA)から供給される音響信号を用いて、目的エリアの音源からの目的エリア音を収音する目的エリア音収音処理を行う。 The sound collecting device 100 uses the acoustic signals supplied from the M microphone arrays MA (MA 1 to MA M ) to perform the target area sound collecting process for collecting the target area sound from the sound source in the target area. ..

各マイクアレイMAは、それぞれ目的エリアが存在する空間の、目的エリアを指向できる場所に配置される。 Each microphone array MA is arranged in a space where the target area exists so that the target area can be directed.

なお、図1のマイクアレイMA〜MAは、それぞれマイク1を直線状に等間隔で配置するように図示したが、この限りではなく、ビームフォーマを実行できる配置であればよい。各マイクアレイMAを構成するマイク1の個数は、少なくとも2個以上である以外に制限はなく、マイクアレイMAごとに異なっても良く、全てのマイクアレイMAで同じであっても良い。以下では、任意のi番目のマイクアレイMAのマイク1の個数をLと表すものとする。したがって、マイクアレイMA〜MAのマイク1の個数はそれぞれL〜Lとなる。 The microphone arrays MA 1 to MA M in FIG. 1 are shown so that the microphones 1 are arranged linearly at equal intervals, but the present invention is not limited to this, and any arrangement may be used as long as the beam former can be executed. The number of microphones 1 constituting each microphone array MA is not limited except that it is at least two or more, and may be different for each microphone array MA or may be the same for all microphone array MAs. The following denote the number of the microphone 1 for any i th microphone array MA i and L i. Accordingly, the number of the microphone 1 of the microphone array MA 1 to MA M becomes L 1 ~L M respectively.

また、各マイクアレイMAを構成するマイク1の配置は、目的エリアを指向できること以外に制限はない、例えば、第1の実施形態において、複数のマイク1を直線状に配置したリニアマイクアレイでも良いし、複数のマイク1を平面上に配置した平面マイクアレイでも良いし、複数のマイク1を結晶型(正多角形配置、長方形配置、正多面体配置、正多角柱配置、直方体配置など)に配置した結晶型マイクアレイ等でも良い。また、マイク1の配置は、マイクアレイMAごとに異なっても良く、全てのマイクアレイMAで同じであっても良い。 Further, the arrangement of the microphones 1 constituting each microphone array MA is not limited except that the target area can be directed. For example, in the first embodiment, a linear microphone array in which a plurality of microphones 1 are arranged linearly may be used. However, a flat microphone array in which a plurality of microphones 1 are arranged on a plane may be used, or a plurality of microphones 1 may be arranged in a crystal shape (regular polygonal arrangement, rectangular arrangement, regular polyhedron arrangement, regular polygonal pillar arrangement, rectangular body arrangement, etc.). A crystal type microphone array or the like may be used. Further, the arrangement of the microphones 1 may be different for each microphone array MA, and may be the same for all the microphone arrays MA.

次に、収音装置100における収音処理(目的エリア音の強調方法;この実施形態の収音方法)の概要(技術思想)について、図2を用いて説明する。 Next, an outline (technical idea) of the sound collection process (method of emphasizing the target area sound; the sound collection method of this embodiment) in the sound collection device 100 will be described with reference to FIG.

まず、図2(a−1)〜図2(a−3)を参照する。図2(a−1)では、マイクアレイMAを構成するいずれかのマイク1によって捕捉された捕捉信号に係る周波数成分(以下、「MAの振幅」と呼ぶ)を示している。また、図2(a−3)では、マイクアレイMAに係るビームフォーマ出力(BF出力)の周波数成分(以下、「BF1の振幅」とも呼ぶ)を示している。さらに、図2(a−2)は、「BF1の振幅」を「MAの振幅」で除した値(以下、「MAの指向性ゲイン」と呼ぶ)を示している。 First, reference is made to FIGS. 2 (a-1) to 2 (a-3). FIG. 2A-1 shows a frequency component (hereinafter, referred to as “amplitude of MA 1 ”) related to a captured signal captured by any of the microphones 1 constituting the microphone array MA 1 . Further, in FIG. 2 (a-3), shows the beamformer output of the microphone array MA 1 frequency components (BF Output) (hereinafter, also referred to as "amplitude BF1"). Further, FIG. 2A-2 shows a value obtained by dividing the “amplitude of BF 1” by the “amplitude of MA 1 ” (hereinafter, referred to as “directivity gain of MA 1 ”).

次に、図2(b−1)〜図2(b−3)を参照する。図2(b−1)では、マイクアレイMAを構成するいずれかのマイク1によって捕捉された捕捉信号に係る周波数成分(以下、「MAの振幅」と呼ぶ)を示している。また、図2(b−3)では、マイクアレイMAに係るビームフォーマ出力(BF出力)の周波数成分(以下、「BF2の振幅」とも呼ぶ)を示している。さらに、図2(b−2)は、「BF2の振幅」を「MAの振幅」で除した値(以下、「MAの指向性ゲイン」と呼ぶ)を示している。 Next, reference is made to FIGS. 2 (b-1) to 2 (b-3). FIG. 2B-1 shows a frequency component (hereinafter, referred to as “amplitude of MA 2 ”) related to a captured signal captured by any of the microphones 1 constituting the microphone array MA 2 . Further, FIG. 2 (b-3) shows a frequency component (hereinafter, also referred to as “amplitude of BF 2”) of the beam former output (BF output) related to the microphone array MA 2 . Further, FIG. 2 (b-2) shows a value obtained by dividing the “amplitude of BF 2” by the “amplitude of MA 2 ” (hereinafter, referred to as “directivity gain of MA 2 ”).

次に、図2(c−1)〜図2(c−3)を参照する。図2(c−1)は、図2(a−1)と同様に「MAの振幅」を示している。図2(c−2)は、「MAの指向性ゲイン」と「MA2の指向性ゲイン」を乗じたもの(以下、「エリア強調ゲイン」と呼ぶ)である。図2(c−3)は、「MAの振幅」から「MAの指向性ゲイン」を用いて抽出した目的エリア音を示している。 Next, reference is made to FIGS. 2 (c-1) to 2 (c-3). FIG. 2 (c-1) shows the “amplitude of MA 1 ” as in FIG. 2 (a-1). FIG. 2 (c-2) is a product of “MA 1 directional gain” and “MA 2 directional gain” (hereinafter referred to as “area emphasis gain”). Figure 2 (c-3) shows a destination area sound extracted using the "directional gain MA 1" from the "amplitude MA 1".

「MAの指向性ゲイン」と「MAの指向性ゲイン」は、ビームフォーマの方法によって、ビームフォーマ後に算出する必要がある場合とない場合とがある。例えば、遅延和法によるビームフォーマ(非特許文献1参照)ではビームフォーマ後の振幅が求まるので、指向性ゲインは除算によって求める必要がある。また例えば、従来のスペクトル減算によるビームフォーマに関する非特許文献2参照では、ビームフォーマ後の振幅を求めるように記載されているが、実際には式変形によって指向性ゲインを求めるようにすることもできる。また例えば、特開2007−318528号公報(以下、「参考文献1」と呼ぶ)に記載された方法は、指向性ゲインを求めて捕捉信号の周波数成分に乗じることでビームフォーマ後の振幅を得る方法なので、指向性ゲインは直接求まる。 The "directivity gain of MA 1 " and the "directivity gain of MA 2 " may or may not need to be calculated after the beamformer depending on the method of the beamformer. For example, in the beam former by the delay sum method (see Non-Patent Document 1), the amplitude after the beam former can be obtained, so that the directivity gain needs to be obtained by division. Further, for example, in Reference to Non-Patent Document 2 relating to a conventional beam former by spectrum subtraction, it is described that the amplitude after the beam former is obtained, but in reality, the directivity gain can be obtained by transforming the equation. .. Further, for example, the method described in JP-A-2007-318528 (hereinafter referred to as "Reference 1") obtains the amplitude after the beam former by obtaining the directivity gain and multiplying it by the frequency component of the captured signal. Since it is a method, the directional gain can be obtained directly.

以上のようにして得られた「MAの指向性ゲイン」と「MAの指向性ゲイン」は、非目的エリア音に対しては0と1が互い違いになっているが、目的エリア音の周波数成分に対しては必ず1となっている。したがって、2つの指向性ゲインを掛け合わせることで、図2(c−2)の「エリア強調ゲイン」のように、目的エリア音の周波数成分のみを強調するゲインが得られる。言い換えると、「MAの指向性ゲイン」及び「MAの指向性ゲイン」は、非目的エリア音の成分については、0又は1のいずれかの値(0又は1に近似した値)をとり得るが、目的エリア音の周波数成分については両方とも必ず1(1に近似した値)となっている。 In the "directivity gain of MA 1 " and "directional gain of MA 2 " obtained as described above, 0 and 1 are staggered for the non-purpose area sound, but the target area sound It is always 1 for the frequency component. Therefore, by multiplying the two directional gains, a gain that emphasizes only the frequency component of the target area sound can be obtained as in the “area emphasis gain” of FIG. 2 (c-2). In other words, "MA 1 directional gain" and "MA 2 directional gain" take either 0 or 1 value (value close to 0 or 1) for the non-purpose area sound component. However, the frequency components of the target area sound are always 1 (values close to 1).

なお、「MAの指向性ゲイン」と「MAの指向性ゲイン」において、それぞれが抑圧可能な非目的エリア音に対する指向性ゲインは必ず0になるとは限らないが、必ず小さな値(例えば、0に近似した値)にはなっており、目的エリア音に対する指向性ゲインは必ず1以下になるので、「エリア強調ゲイン」における非目的エリア音に対するゲインは必ず小さくなる。 In "MA 1 directional gain" and "MA 2 directional gain", the directional gain for the non-purpose area sound that can be suppressed by each is not always 0, but it is always a small value (for example,). Since it is a value close to 0) and the directivity gain for the target area sound is always 1 or less, the gain for the non-target area sound in the “area emphasis gain” is always small.

そこで、この実施形態の収音装置100では、マイクアレイMAごとに算出された指向性ゲインを、周波数成分ごとに全マイクアレイMAに渡って掛け合わせることで算出したエリア強調ゲインを用いて目的エリア音を抽出するものとする。これにより、この実施形態の収音装置100では、従来技術のように最頻値や中央値を求める必要がないので、比較的少ない演算量で、目的エリア音を強調する処理を実現することができる。 Therefore, in the sound collecting device 100 of this embodiment, the target area is used by using the area enhancement gain calculated by multiplying the directivity gain calculated for each microphone array MA over all the microphone arrays MA for each frequency component. Sound shall be extracted. As a result, in the sound collecting device 100 of this embodiment, it is not necessary to obtain the mode value and the median value as in the prior art, so that it is possible to realize a process of emphasizing the target area sound with a relatively small amount of calculation. it can.

ところで、各マイクアレイMAの構成は、例えば、図3のように、3つのマイクアレイMA〜MAを用意し、2つのマイクアレイMA、MAは2つのマイク1、1を横方向(図3における水平方向)に並べたリニアアレイとし、マイクアレイMAはマイク2個を縦方向(図3における垂直方向)に並べたリニアアレイとしてもよい。 By the way, as for the configuration of each microphone array MA, for example, as shown in FIG. 3, three microphone arrays MA 1 to MA 3 are prepared, and two microphone arrays MA 1 and MA 3 have two microphones 1 1 , 1 and 2 . The linear array may be arranged in the horizontal direction (horizontal direction in FIG. 3), and the microphone array MA 2 may be a linear array in which two microphones are arranged in the vertical direction (vertical direction in FIG. 3).

図3のように各マイクアレイMAを配置した場合、収音装置100は、それぞれのマイクアレイMAにおいて目的エリア方向を収音するビームフォーマからビームフォーマのゲインを算出し、周波数成分ごとに3つのビームフォーマのゲインを全て掛け合わせることで、目的エリア音を抽出することができる。図3において、マイクアレイMA〜MAの指向性(指向性の中心面)をD11〜D13と図示している。つまり、マイクアレイMA〜MAのそれぞれの指向性D11〜D13の中心面は、図3中の指向性D11〜D13に示す平面となり、この実施形態の収音装置100によって定まる目的エリアは指向性D11〜D13の中心面が交わる位置の周辺となる。 When each microphone array MA is arranged as shown in FIG. 3, the sound collecting device 100 calculates the gain of the beam former from the beam former that collects the sound in the target area direction in each microphone array MA, and three for each frequency component. By multiplying all the gains of the beam former, the target area sound can be extracted. In FIG. 3, the directivity (central surface of directivity) of the microphone arrays MA 1 to MA 3 is shown as D11 to D13. That is, the central surfaces of the directivities D11 to D13 of the microphone arrays MA 1 to MA 3 are the planes shown in the directivity D11 to D13 in FIG. 3, and the target area determined by the sound collecting device 100 of this embodiment is directed. It is around the position where the central planes of sexes D11 to D13 intersect.

次に、収音装置100の内部構成について図1を用いて説明する。 Next, the internal configuration of the sound collecting device 100 will be described with reference to FIG.

図1に示すように、第1の実施形態に係る収音装置100は、データ入力部102、周波数領域変換部103、指向性ゲイン算出部104、エリア強調ゲイン算出部105、及び目的エリア音抽出部106を有している。収音装置100内部の各構成要素の詳細については後述する。 As shown in FIG. 1, the sound collecting device 100 according to the first embodiment includes a data input unit 102, a frequency domain conversion unit 103, a directivity gain calculation unit 104, an area emphasis gain calculation unit 105, and a target area sound extraction. It has a part 106. Details of each component inside the sound collecting device 100 will be described later.

収音装置100において、デジタル信号に変換された後の処理構成を、プロセッサやメモリ等を備えるコンピュータにプログラム(実施形態に係る収音プログラムを含む)を実行させるようにしてもよいが、その場合であっても、機能的には、図1で表すことができる。 In the sound collecting device 100, a computer having a processor, a memory, or the like may execute a program (including a sound collecting program according to the embodiment) for the processing configuration after being converted into a digital signal. Even so, functionally, it can be represented in FIG.

次に、指向性ゲイン算出部104の内部構成について図4を用いて説明する。 Next, the internal configuration of the directivity gain calculation unit 104 will be described with reference to FIG.

図4は指向性ゲイン算出部104内部の機能的構成について示したブロック図である。 FIG. 4 is a block diagram showing a functional configuration inside the directivity gain calculation unit 104.

指向性ゲイン算出部104は、マイクアレイMA〜MAに対してそれぞれ雑音推定部111〜111及びスペクトル減算ゲイン算出部112〜112を有している。指向性ゲイン算出部104内部の各構成要素の詳細については後述する。 Directional gain calculating unit 104 includes a noise estimator 111 1 - 111 M and spectral subtraction gain calculating unit 112 1 to 112 M respectively microphone array MA 1 to MA M. Details of each component inside the directivity gain calculation unit 104 will be described later.

(A−2)第1の実施形態の動作
次に、以上のような構成を有する第1の実施形態の収音装置100の動作(この実施形態の収音方法)を説明する。
(A-2) Operation of the First Embodiment Next, the operation of the sound collecting device 100 of the first embodiment having the above configuration (sound collecting method of this embodiment) will be described.

データ入力部102は、マイクアレイMA1〜MAで捕捉した音響信号を、マイク1ごとにアナログ信号からデジタル信号(データ)に変換する。そして、データ入力部102は、得られた捕捉信号群x(t)〜x(t)は、周波数領域変換部103に与えられる。i番目の捕捉信号群x(t)は、(5)式に示すように、L個の捕捉信号xi,1(t)〜xi,Li(t)で構成されるベクトルである。
(t)=[xi,1(t),・・・,xi,Li(t)] …(5)
The data input unit 102 converts the acoustic signal captured by the microphone arrays MA1 1 to MA M from an analog signal to a digital signal (data) for each microphone 1. Then, the data input unit 102 gives the obtained captured signal group x 1 (t) to x M (t) to the frequency domain conversion unit 103. i th acquisition signal group x i (t) is a vector consisting of (5) as shown in formula, L i number of captured signals x i, 1 (t) ~x i, Li (t) ..
x i (t) = [x i, 1 (t), ..., x i, Li (t)] ... (5)

周波数領域変換部103は、マイクアレイMA〜MAから入力されたデータを、マイクごとに時間領域から周波数領域へと変換する。周波数領域変換部103は、得られた周波数領域の捕捉信号群X(f)〜X(f)を、指向性ゲイン算出部104及び目的エリア音抽出部106に与える。i番目の周波数領域の捕捉信号群X(f)は、(6)式に示すように、L個の捕捉信号Xi,1(f)〜Xi,Li(f)で構成されるベクトルである。周波数領域変換部103における変換には、高速フーリエ変換(FFT:Fast Fourier Transform)やウェーブレット変換、フィルタバンクなどを利用することができるが、FFTが最も好適である。ここで、周波数領域変換部103は、FFTを行う際、ハミング窓などの各種窓関数を用いるようにしても良い。
(f)=[Xi,1(f),・・・,Xi,Li(f)] …(6)
The frequency domain conversion unit 103 converts the data input from the microphone arrays MA 1 to MA M from the time domain to the frequency domain for each microphone. Frequency domain transform section 103, a capture signal group X 1 in the frequency domain obtained (f) ~X M (f) , giving the directional gain calculating unit 104 and the destination area sound extraction unit 106. i-th frequency domain acquired signal group X i of (f) is composed of (6) as shown in formula, L i number of captured signals X i, 1 (f) to X i, Li (f) It is a vector. For the conversion in the frequency domain transforming unit 103, a fast Fourier transform (FFT), a wavelet transform, a filter bank, or the like can be used, but the FFT is the most preferable. Here, the frequency domain transforming unit 103 may use various window functions such as a humming window when performing the FFT.
X i (f) = [X i, 1 (f), ..., X i, Li (f)] ... (6)

指向性ゲイン算出部104は、マイクアレイMAごとに、周波数領域の捕捉信号群X(f)〜X(f)に基づいてビームフォーマを適用して指向性ゲインG(f)〜G(f)を算出する。得られた指向性ゲインG(f)〜G(f)は、エリア強調ゲイン算出部105に与えられる。指向性ゲインは、1つのマイクアレイに属する捕捉信号群X(f)から、周波数ごとに1つだけ求まる(つまり、X(f)とは異なり、G(f)はスカラーである)。指向性ゲイン算出部104において、ビームフォーマの方法には、任意の方法を用いることができるが、非特許文献2に記載のスペクトル減算による方法に代表される鋭い指向性を形成できる方法が好適に用いられる。この実施形態の指向性ゲイン算出部104は、例として、図3のように、目的エリアが全てのマイク1に対して正面に位置しており、全てのマイクアレイMAが2つのマイク1、1で構成され、いずれのマイクアレイMAも同一の方法で指向性ゲインを算出し、指向性ゲインはスペクトル減算に基づく方法で算出されるものとして説明する。 Directional gain calculating unit 104, for each microphone array MA, capture signal group X 1 (f) ~X based on M (f) applying beamformer directional gain G 1 in the frequency domain (f) ~G Calculate M (f). The resulting directivity gain G 1 (f) ~G M ( f) is given to the area enhancement gain calculation unit 105. Directional gain, from the captured signal group X 1 belonging to one of the microphone array (f), obtained by one for each frequency (i.e., unlike X i (f), G i (f) is a scalar) .. In the directivity gain calculation unit 104, any method can be used as the beam former method, but a method capable of forming a sharp directivity represented by the method by spectrum subtraction described in Non-Patent Document 2 is preferable. Used. In the directional gain calculation unit 104 of this embodiment, as shown in FIG. 3, the target area is located in front of all the microphones 1, and all the microphone arrays MA have two microphones 1 1 . 1 2 is composed of, any of the microphone array MA calculates a directivity gain in the same manner, the directional gain is described as being calculated by the method based on spectral subtraction.

次に図4を用いて、指向性ゲイン算出部104の内部処理について説明する。 Next, the internal processing of the directivity gain calculation unit 104 will be described with reference to FIG.

全てのマイクアレイMAに対して同様の処理が行われるため、ここではi番目のマイクアレイMAに対応する雑音推定部111、及びスペクトル減算ゲイン算出部112の動作についてのみ記す。 Since the same processing is performed for all the microphone arrays MA, only the operations of the noise estimation unit 111 i and the spectrum subtraction gain calculation unit 112 i corresponding to the i-th microphone array MA i will be described here.

雑音推定部111は、(7)式に示すように、片方の捕捉信号からもう片方の捕捉信号を減じることで、正面方向(目的エリア方向)にある音源(目的エリア音)を抑圧し、雑音(非目的エリア音)を推定する。スペクトル減算ゲイン算出部112は、(8)式に示すように、1から非目的エリア音と捕捉信号との振幅比を減じる(スペクトル減算する)ことで、指向性ゲインG(f)を算出する。(8)式において、β(f)(ベータ)は推定された非目的エリア音の振幅を補正したりスペクトル減算の強さ(非目的エリア音の除去強度)を調整したりする周波数成分ごとに定められた定数係数である。また、(8)式において、Gminは、指向性ゲインの最小値(最大抑圧量とも呼ばれる)を定める定数値である。なお、(8)式の両辺にXi,1(f)の絶対値を乗じると、(9)式が得られ、スペクトル減算によるビームフォーマ出力の振幅が求まる。ビームフォーマ出力を得る場合には(9)式を用いるのが一般的だが、本実施形態では(8)式を用いることで指向性ゲインを直接算出するものとする。

Figure 0006763332
As shown in Eq. (7), the noise estimation unit 111 i suppresses the sound source (target area sound) in the front direction (target area direction) by subtracting the other captured signal from one captured signal. Estimate noise (non-purpose area sound). As shown in Eq. (8), the spectrum subtraction gain calculation unit 112 i reduces the amplitude ratio of the non-objective area sound and the captured signal from 1 (spectral subtraction) to obtain the directivity gain G i (f). calculate. In equation (8), β (f) (beta) is used for each frequency component that corrects the estimated amplitude of the non-purpose area sound and adjusts the strength of spectrum subtraction (removal strength of the non-purpose area sound). It is a fixed constant coefficient. Further, in the equation (8), G min is a constant value that determines the minimum value (also referred to as the maximum suppression amount) of the directivity gain. By multiplying both sides of Eq. (8) by the absolute values of X i and 1 (f), Eq. (9) is obtained, and the amplitude of the beamformer output by spectral subtraction can be obtained. When obtaining the beamformer output, the equation (9) is generally used, but in the present embodiment, the directivity gain is directly calculated by using the equation (8).
Figure 0006763332

エリア強調ゲイン算出部105は、(10)式のように、周波数成分ごとに指向性ゲインG(f)〜G(f)を掛け合わせてエリア強調ゲインH(f)を算出する。得られたエリア強調ゲインH(f)は、目的エリア音抽出部106に与えられる。
H(f) = G(f)・G(f)・…・G(f) …(10)
Area enhancement gain calculation unit 105 calculates a (10) as in equation directivity gain for each frequency component G 1 (f) ~G M ( f) by multiplying the in area emphasis gain H (f). The obtained area emphasis gain H (f) is given to the target area sound extraction unit 106.
H (f) = G 1 ( f) · G 2 (f) · ... · G M (f) ... (10)

目的エリア音抽出部106は、捕捉信号群X(f)〜X(f)のいずれか又はそれらを統合した信号に、エリア強調ゲインH(f)を乗じることで目的エリア強調信号Y(f)を算出する。得られた目的エリア強調信号Y(f)は、次段へ与えられる。エリア強調ゲインH(f)が乗じられる信号は任意であり、先頭のX1,1(f)としても良いし、最も目的エリアに近いマイク1に係る捕捉信号としても良いし、最も目的エリアに近いマイクアレイMAの捕捉信号群に遅延和ビームフォーマを適用して目的エリア音を少しだけ強調した信号としても良い。 The target area sound extraction unit 106 multiplies the captured signal group X 1 (f) to X M (f) or a signal in which they are integrated by the area emphasis gain H (f) to obtain the target area emphasis signal Y ( f) is calculated. The obtained target area emphasis signal Y (f) is given to the next stage. The signal to which the area emphasis gain H (f) is multiplied is arbitrary, and may be the first X 1, 1 (f), may be a captured signal related to the microphone 1 closest to the target area, or may be the closest target area. A delay sum beam former may be applied to the captured signal group of the nearby microphone array MA to obtain a signal in which the target area sound is slightly emphasized.

(A−3)第1の実施形態の効果
第1の実施形態によれば、以下のような効果を奏することができる。
(A-3) Effect of First Embodiment According to the first embodiment, the following effects can be obtained.

第1の実施形態によれば、マイクアレイMAごとに算出された指向性ゲインを、周波数成分ごとに全マイクアレイMAに渡って掛け合わせることで算出したエリア強調ゲインを用いて目的エリア音を抽出するので、比較的少ない演算量で、事前に決定しなければならないパラメータなしに、マイク1及びマイクアレイMAそれぞれの数と配置に制限されることなく、目的エリアが非目的エリア音源に囲まれている状況でも、目的エリア音のみを強調することができる。 According to the first embodiment, the target area sound is extracted using the area enhancement gain calculated by multiplying the directivity gain calculated for each microphone array MA over all the microphone array MAs for each frequency component. Therefore, the target area is surrounded by the non-purpose area sound source without being limited by the number and arrangement of the microphone 1 and the microphone array MA, respectively, with a relatively small amount of calculation and no parameters that must be determined in advance. Even in the situation where there is, only the target area sound can be emphasized.

(B)第2の実施形態
以下、本発明による収音装置、プログラム及び方法の第2の実施形態を、図面を参照しながら詳述する。
(B) Second Embodiment Hereinafter, the second embodiment of the sound collecting device, the program and the method according to the present invention will be described in detail with reference to the drawings.

(B−1)第2の実施形態の構成
図5は、第2の実施形態の収音装置200の機能的構成について示したブロック図であり、上述の図1と同一部分又は対称部分には、同一符号又は対称符号を付している。以下では、第2の実施形態の収音装置100Aについて、第1の実施形態との差異のみを説明する。
(B-1) Configuration of Second Embodiment FIG. 5 is a block diagram showing a functional configuration of the sound collecting device 200 of the second embodiment, and the same portion or symmetrical portion as that of FIG. 1 described above. , Same code or symmetric code. Hereinafter, only the difference between the sound collecting device 100A of the second embodiment and the sound collecting device 100A of the first embodiment will be described.

第1の実施形態(収音装置100)の説明では、各マイクアレイMAと目的エリアとの間の距離(以下、「アレイ収音距離」と呼ぶ)について何ら言及しなかった。例えば、第1の実施形態において、アレイ収音距離が高々150cm程度であるような、ある程度小規模な環境の場合には、収音装置100においてアレイ収音距離は無視して信号処理しても著しく出力信号の品質が低下することはない。しかし、アレイ収音距離の差(例えば、マイクアレイMAのアレイ収音距離とマイクアレイMAのアレイ収音距離との差)が300cm以上となるような場合、各マイクアレイMAに目的エリア音が到達する時間差が大き過ぎるために、マイクアレイMA間で目的エリア音方向を強調するタイミングがずれ、正しくエリア音を抽出できないことがある。 In the description of the first embodiment (sound collecting device 100), the distance between each microphone array MA and the target area (hereinafter, referred to as “array sound collecting distance”) is not mentioned at all. For example, in the first embodiment, in a somewhat small environment where the array sound collection distance is at most about 150 cm, the sound collection device 100 may ignore the array sound collection distance and perform signal processing. The quality of the output signal does not deteriorate significantly. However, when the difference in the array sound collection distance (for example, the difference between the array sound collection distance of the microphone array MA 1 and the array sound collection distance of the microphone array MA 2 ) is 300 cm or more, the target area is set in each microphone array MA. Since the time difference between the arrival of sounds is too large, the timing of emphasizing the target area sound direction may be different between the microphone arrays MA, and the area sound may not be extracted correctly.

そこで、第2の実施形態の収音装置200では、各マイクアレイMAのアレイ収音距離、又はマイクアレイMA同士のアレイ収音距離の差が既知であるとして、指向性ゲインを遅延させることでタイミングを合わせる。 Therefore, in the sound collecting device 200 of the second embodiment, assuming that the difference between the array sound collecting distance of each microphone array MA or the array sound collecting distance between the microphone arrays MA is known, the directivity gain is delayed. Adjust the timing.

図5に示すように、収音装置200では、エリア強調ゲイン算出部105がエリア強調ゲイン算出部105に置き換わり、さらに伝搬遅延補正部207が追加されている点で第1の実施形態と異なっている。 As shown in FIG. 5, the sound collecting device 200 differs from the first embodiment in that the area emphasis gain calculation unit 105 is replaced with the area emphasis gain calculation unit 105 and the propagation delay correction unit 207 is further added. There is.

(B−2)第2の実施形態の動作
次に、以上のような構成を有する第2の実施形態の収音装置200の動作(この実施形態の収音方法)を説明する。
(B-2) Operation of the Second Embodiment Next, the operation of the sound collecting device 200 of the second embodiment having the above configuration (sound collecting method of this embodiment) will be described.

第2の実施形態に係る収音装置200の動作は、伝搬遅延補正部207とエリア強調ゲイン算出部205除けば、第1の実施形態に係る収音装置100の動作と同様であるためその他の要素の動作説明を省略する。 The operation of the sound collecting device 200 according to the second embodiment is the same as the operation of the sound collecting device 100 according to the first embodiment except for the propagation delay correction unit 207 and the area emphasis gain calculation unit 205. The operation description of the element is omitted.

伝搬遅延補正部207は、事前に確認されたマイクアレイMAごとのアレイ収音距離又は各マイクアレイ間のアレイ収音距離の差に基づいて、アレイ収音距離が最も小さい(目的エリアと最も近い)マイクアレイMA以外のマイクアレイMAに由来する指向性ゲインG(f)〜G(f)を遅延させる。得られた遅延指向性ゲインG’(f)〜G’(f)は、エリア強調ゲイン算出部205に与えられる。すなわち、遅延指向性ゲインG’(f)〜G’(f)は、全てのマイクアレイMAについてアレイ収音距離に基づくタイミングのずれ(遅延)を補正して、タイミングを同期させた指向性ゲインとなる。 The propagation delay correction unit 207 has the smallest array sound collection distance (closest to the target area) based on the difference in the array sound collection distance for each microphone array MA or the array sound collection distance between each microphone array confirmed in advance. ) delays the directional gain G 1 derived from the microphone array MA non microphone array MA (f) ~G M (f ). The resulting delayed directional gain G '1 (f) ~G' M (f) is given to the area enhancement gain calculation unit 205. That is, the delay directional gain G '1 (f) ~G' M (f) corrects the timing shift based on the array sound collection distance for all of the microphone array MA (delay), is synchronized to the timing-oriented It becomes a directivity gain.

エリア強調ゲイン算出部205は、(11)式のように周波数成分ごとに遅延指向性ゲインG’(f)〜G’(f)を掛け合わせてエリア強調ゲインH(f)を算出する。エリア強調ゲイン算出部205は、得られたエリア強調ゲインH(f)は、目的エリア音抽出部106に与える。
H(f) = G’(f)・G’(f)・…・G’(f) …(11)
Area enhancement gain calculation unit 205 calculates (11) a delay directivity gain for each frequency component G '1 (f) ~G' M (f) a multiplying allowed by area emphasis gain H (f) as equation .. The area emphasis gain calculation unit 205 gives the obtained area emphasis gain H (f) to the target area sound extraction unit 106.
H (f) = G '1 (f) · G' 2 (f) · ... · G 'M (f) ... (11)

(B−3)第2の実施形態の効果
第2の実施形態によれば、第1の実施形態の効果に加えて以下のような効果を奏することができる。
(B-3) Effect of Second Embodiment According to the second embodiment, the following effects can be obtained in addition to the effect of the first embodiment.

第2の実施形態の収音装置200では、マイクアレイMA間のアレイ収音距離の差が300cmを超えるような大規模な環境で、かつ、目的エリアが非目的エリア音源に囲まれている状況でも、目的エリア音のみを強調することができる。 In the sound collecting device 200 of the second embodiment, the situation is such that the difference in the array sound collecting distance between the microphone arrays MA exceeds 300 cm in a large-scale environment, and the target area is surrounded by the non-purpose area sound source. However, only the target area sound can be emphasized.

(C)第3の実施形態
以下、本発明による収音装置、プログラム及び方法の第3の実施形態を、図面を参照しながら詳述する。
(C) Third Embodiment Hereinafter, the third embodiment of the sound collecting device, the program and the method according to the present invention will be described in detail with reference to the drawings.

(C−1)第3の実施形態の構成
第3の実施形態の収音装置300も上述の図1を用いて示すことができる。
(C-1) Configuration of Third Embodiment The sound collecting device 300 of the third embodiment can also be shown with reference to FIG. 1 described above.

以下では、第3の実施形態について第1及び第2の実施形態との差異のみを説明する。 In the following, only the differences between the third embodiment and the first and second embodiments will be described.

第1及び第2の実施形態の収音装置100、200では、全マイクアレイMA(MA〜MA)由来する指向性ゲインを掛け合わせることでエリア強調ゲインを算出していた。しかし、この方法は、信号に雑音を抑圧するフィルタをM回掛けていることに相当するため、第1及び第2の実施形態の収音装置100、200の出力信号はひずむおそれがある。 In the sound collecting devices 100 and 200 of the first and second embodiments, the area emphasis gain was calculated by multiplying the directional gains derived from all the microphone arrays MA (MA 1 to MA M ). However, since this method corresponds to applying a filter for suppressing noise to the signal M times, the output signals of the sound collecting devices 100 and 200 of the first and second embodiments may be distorted.

そこで、第3の実施形態の収音装置300では、単にM個の指向性ゲインを掛け合わせるのでなく、M個の指向性ゲインを掛け合わせた後でM乗根を取ることで、当該ひずみを回避する。 Therefore, in the sound collecting device 300 of the third embodiment, the distortion is obtained by multiplying the M directional gains and then taking the M root after multiplying the M directional gains, instead of simply multiplying the M directional gains. To avoid.

図1に示すように、第3の実施形態の収音装置300では、エリア強調ゲイン算出部105がエリア強調ゲイン算出部305に置き換わっている点で第1の実施形態の収音装置100と異なっている。 As shown in FIG. 1, the sound collecting device 300 of the third embodiment is different from the sound collecting device 100 of the first embodiment in that the area emphasis gain calculation unit 105 is replaced with the area emphasis gain calculation unit 305. ing.

(C−2)第3の実施形態の動作
次に、以上のような構成を有する第3の実施形態の収音装置300の動作(この実施形態の収音方法)を説明する。
(C-2) Operation of Third Embodiment Next, the operation of the sound collecting device 300 of the third embodiment having the above configuration (sound collecting method of this embodiment) will be described.

第3の実施形態に係る収音装置300の動作は、エリア強調ゲイン算出部305を除けば、第1の実施形態に係る収音装置100の動作と同様であるためその他の要素の動作説明を省略する。 Since the operation of the sound collecting device 300 according to the third embodiment is the same as the operation of the sound collecting device 100 according to the first embodiment except for the area emphasis gain calculation unit 305, the operation description of other elements will be described. Omit.

エリア強調ゲイン算出部305は、(12)式のように、周波数成分ごとに指向性ゲインG(f)〜G(f)を掛け合わせて、さらにM乗根を取ることで、エリア強調ゲインH(f)を算出する。そして、エリア強調ゲイン算出部305で得られたエリア強調ゲインH(f)は、目的エリア音抽出部106に与えられる。

Figure 0006763332
Area enhancement gain calculation unit 305, (12) as in equation by multiplying the directional gain G 1 (f) ~G M (f) for each frequency component, by further taking the M th root, the area highlighted The gain H (f) is calculated. Then, the area emphasis gain H (f) obtained by the area emphasis gain calculation unit 305 is given to the target area sound extraction unit 106.
Figure 0006763332

(C−3)第3の実施形態の効果
第3の実施形態によれば、第2の実施形態の効果に加えて、以下のような効果を奏することができる。
(C-3) Effect of Third Embodiment According to the third embodiment, the following effects can be obtained in addition to the effect of the second embodiment.

第3の実施形態の収音装置300では、エリア強調ゲインを算出する際に、掛け合わせる指向性ゲインの数の累乗根を取るので、第1の実施形態のような信号に雑音を抑圧するフィルタを多重で掛ける処理を回避できるので、より少ないひずみで目的エリア音のみを強調することができる。 In the sound collecting device 300 of the third embodiment, when calculating the area emphasis gain, the root of the number of directional gains to be multiplied is taken, so that the filter that suppresses noise in the signal as in the first embodiment is used. Since it is possible to avoid the process of multiplying multiple sounds, it is possible to emphasize only the target area sound with less distortion.

(D)第4の実施形態
以下、本発明による収音装置、プログラム及び方法の第4の実施形態を、図面を参照しながら詳述する。
(D) Fourth Embodiment Hereinafter, the fourth embodiment of the sound collecting device, the program and the method according to the present invention will be described in detail with reference to the drawings.

(D−1)第4の実施形態の構成
第4の実施形態の収音装置400も上述の図1を用いて示すことができる。
(D-1) Configuration of Fourth Embodiment The sound collecting device 400 of the fourth embodiment can also be shown with reference to FIG. 1 described above.

以下では、第4の実施形態について第3の実施形態との差異のみを説明する。 In the following, only the difference between the fourth embodiment and the third embodiment will be described.

第3の実施形態の収音装置300では、エリア強調ゲインを算出する際に、掛け合わせる指向性ゲインの数の累乗根を取ることで、第1の実施形態のような信号に雑音を抑圧するフィルタを多重で掛ける処理を回避していた。一方、周波数成分ごとに全てのマイクアレイに対する指向性ゲインの最小値をエリア強調ゲインとすることでも同様の効果を奏することができ、さらに第3の実施形態よりも少ない演算量で実現することができる。そこで、第4の実施形態の収音装置400では、周波数成分ごとに全てのマイクアレイに対する指向性ゲインの最小値を集め、エリア強調ゲインとするものとする。 In the sound collecting device 300 of the third embodiment, when calculating the area emphasis gain, noise is suppressed in the signal as in the first embodiment by taking the root of the number of directional gains to be multiplied. The process of applying multiple filters was avoided. On the other hand, the same effect can be obtained by setting the minimum value of the directivity gain for all the microphone arrays for each frequency component as the area emphasis gain, and further, it can be realized with a smaller amount of calculation than the third embodiment. it can. Therefore, in the sound collecting device 400 of the fourth embodiment, the minimum values of the directivity gains for all the microphone arrays are collected for each frequency component and used as the area emphasis gain.

図1に示すように、第4の実施形態の収音装置400では、エリア強調ゲイン算出部305がエリア強調ゲイン算出部405に置き換わっている点で第3の実施形態の収音装置300と異なっている。 As shown in FIG. 1, the sound collecting device 400 of the fourth embodiment is different from the sound collecting device 300 of the third embodiment in that the area emphasis gain calculation unit 305 is replaced with the area emphasis gain calculation unit 405. ing.

(D−2)第4の実施形態の動作
次に、以上のような構成を有する第4の実施形態の収音装置400の動作(この実施形態の収音方法)を説明する。
(D-2) Operation of the Fourth Embodiment Next, the operation of the sound collecting device 400 of the fourth embodiment having the above configuration (sound collecting method of this embodiment) will be described.

第4の実施形態に係る収音装置400の動作は、エリア強調ゲイン算出部405を除けば、第3の実施形態に係る収音装置300の動作と同様であるためその他の要素の動作説明を省略する。 Since the operation of the sound collecting device 400 according to the fourth embodiment is the same as the operation of the sound collecting device 300 according to the third embodiment except for the area emphasis gain calculation unit 405, the operation description of other elements will be described. Omit.

エリア強調ゲイン算出部405は、周波数成分ごとに全てのマイクアレイに対する指向性ゲインG(f)〜G(f)の最小値をエリア強調ゲインH(f)として算出する。エリア強調ゲイン算出部405により得られたエリア強調ゲインH(f)は、目的エリア音抽出部106に与えられる。 Area enhancement gain calculation unit 405 calculates the minimum value of the directional gain G 1 (f) ~G M ( f) for all of the microphone array for each frequency component as the area emphasis gain H (f). The area emphasis gain H (f) obtained by the area emphasis gain calculation unit 405 is given to the target area sound extraction unit 106.

上述の通り、音声のスパース性に基づき目的エリア音と雑音は周波数領域では重ならない。そして、上述の図2に示す通り、「MAの指向性ゲイン」及び「MAの指向性ゲイン」は、非目的エリア音の成分については0又は1のいずれかの値(0又は1に近似した値のいずれか)をとり得るが、目的エリア音の周波数成分については両方とも必ず1(1に近似した値)となっている。そうすると、図2(c−2)に示すように、周波数成分ごとに指向性ゲインG(f)、G(f)の最小値をとったとしても、周波数成分ごとに指向性ゲインG(f)、G(f)の最小値を取った場合と同一又は近似した値が得られることになる。 As described above, the target area sound and noise do not overlap in the frequency domain based on the sparsity of the voice. Then, as shown in FIG. 2 above, the “directive gain of MA 1 ” and the “directional gain of MA 2 ” are set to either 0 or 1 (0 or 1) for the non-purpose area sound component. Any of the approximate values) can be taken, but the frequency components of the target area sound are always 1 (values close to 1). Then, as shown in FIG. 2 (c-2), even if the minimum values of the directivity gains G 1 (f) and G 2 (f) are taken for each frequency component, the directivity gain G 1 for each frequency component is taken. The same or similar values as when the minimum values of (f) and G 2 (f) are taken can be obtained.

(D−3)第4の実施形態の効果
第4の実施形態によれば、第3の実施形態の効果に加えて、以下のような効果を奏することができる。
(D-3) Effect of Fourth Embodiment According to the fourth embodiment, the following effects can be obtained in addition to the effect of the third embodiment.

第4の実施形態の収音装置400(エリア強調ゲイン算出部405)では、第3の実施形態と異なり、累乗根の計算が不要なので、より少ない演算量で目的エリア音のみを強調することができる。 Unlike the third embodiment, the sound collecting device 400 (area emphasis gain calculation unit 405) of the fourth embodiment does not require the calculation of the power root, so that only the target area sound can be emphasized with a smaller amount of calculation. it can.

(e)他の実施形態
本発明は、上記の各実施形態に限定されるものではなく、以下に例示するような変形実施形態も挙げることができる。
(E) Other Embodiments The present invention is not limited to each of the above embodiments, and modified embodiments as illustrated below can also be mentioned.

(e−1)第2の実施形態の収音装置200のエリア強調ゲイン算出部105において、エリア強調ゲインを算出する際に、(11)式のように遅延指向性ゲインG’(f)〜G’(f)掛け合わせた後、第3の実施形態のエリア強調ゲイン算出部305と同様に、遅延指向性ゲインの数(M)の累乗根をとることで、エリア強調ゲインを得るようにしてもよい。 (E-1) in the area enhancement gain calculation unit 105 of the sound pickup apparatus 200 of the second embodiment, when calculating the area emphasis gain, (11), delayed directional gain G '1 as (f) ~G 'M (f) after multiplying, as in the area enhancement gain calculation unit 305 of the third embodiment, by taking the power root of the number of delay directional gain (M), to obtain the area emphasis gain You may do so.

また、第2の実施形態のエリア強調ゲイン算出部105において、第4の実施形態のエリア強調ゲイン算出部405と同様に、周波数成分ごとに全てのマイクアレイMAに対する遅延指向性ゲインG’(f)〜G’(f)の最小値を集め、エリア強調ゲインとして取得するようにしてもよい。 Further, in the area enhancement gain calculation unit 105 of the second embodiment, similarly to the area enhancement gain calculation unit 405 of the fourth embodiment, the delay directional gain G for all microphone arrays MA for each frequency component '1 ( collect the minimum value of f) ~G 'M (f) , may be obtained as an area emphasis gain.

100…収音装置、102…データ入力部、103…周波数領域変換部、104…指向性ゲイン算出部、105…エリア強調ゲイン算出部、106…目的エリア音抽出部。 100 ... Sound collecting device, 102 ... Data input unit, 103 ... Frequency domain conversion unit, 104 ... Directivity gain calculation unit, 105 ... Area emphasis gain calculation unit, 106 ... Target area sound extraction unit.

Claims (7)

複数のマイクアレイが出力する捕捉信号を周波数領域に変換した入力信号のそれぞれに対し、ビームフォーマによって目的エリア音方向へ指向性を形成する際の指向性ゲインを取得する指向性ゲイン算出手段と、
それぞれの前記マイクアレイの指向性ゲインに基づいて目的エリア音を強調するエリア強調ゲインを取得するエリア強調ゲイン算出手段と、
前記マイクアレイの入力信号と、前記エリア強調ゲイン算出手段が取得したエリア強調ゲインに基づいて、目的エリア音を強調した目的エリア強調信号を取得する目的エリア音取得手段と
を有することを特徴とする収音装置。
A directivity gain calculation means for acquiring the directivity gain when the beam former forms directivity in the target area sound direction for each of the input signals obtained by converting the captured signals output by a plurality of microphone arrays into the frequency domain.
An area enhancement gain calculation means for acquiring an area enhancement gain that emphasizes a target area sound based on the directivity gain of each of the microphone arrays.
It is characterized by having a target area sound acquisition unit that acquires a target area emphasis signal that emphasizes the target area sound based on the input signal of the microphone array and the area emphasis gain acquired by the area emphasis gain calculation unit. Sound collecting device.
前記エリア強調ゲイン算出手段は、周波数成分ごとに、全ての前記マイクアレイに係る指向性ゲインを掛け合わせてエリア強調ゲインを算出することを特徴とする請求項1に記載の収音装置。 The sound collecting device according to claim 1, wherein the area-enhanced gain calculating means calculates an area-enhanced gain by multiplying each frequency component by directional gains related to all the microphone arrays. 前記エリア強調ゲイン算出手段は、周波数成分ごとに、全ての前記マイクアレイに係る指向性ゲインを掛け合わせ、さらに前記マイクアレイの数に対応する累乗根を取ることでエリア強調ゲインを算出することを特徴とする請求項2に記載の収音装置。 The area enhancement gain calculation means calculates the area enhancement gain by multiplying the directional gains of all the microphone arrays for each frequency component and further taking the root corresponding to the number of the microphone arrays. The sound collecting device according to claim 2, wherein the sound collecting device is characterized. 前記エリア強調ゲイン算出手段は、周波数成分ごとに全ての前記マイクアレイに対する指向性ゲインの最小値を選択することでエリア強調ゲインを求める
ことを特徴とする請求項1に記載の収音装置。
The sound collecting device according to claim 1, wherein the area-enhanced gain calculating means obtains the area-enhanced gain by selecting the minimum value of the directivity gain for all the microphone arrays for each frequency component.
それぞれの前記マイクアレイと目的エリアとの距離の差分に応じて、全ての前記マイクアレイの指向性ゲインのタイミングのずれを補正した指向性ゲインを取得する補正手段をさらに備え、
前記エリア強調ゲイン算出手段は、前記補正手段が補正した指向性ゲインを用いてエリア強調ゲインを求める
ことを特徴とする請求項1〜4のいずれかに記載の収音装置。
Further provided with a correction means for acquiring the directivity gain corrected for the timing deviation of the directivity gains of all the microphone arrays according to the difference in the distance between each microphone array and the target area.
The sound collecting device according to any one of claims 1 to 4, wherein the area enhancement gain calculating means obtains an area enhancement gain using the directivity gain corrected by the correction means.
コンピュータを、
複数のマイクアレイが出力する捕捉信号を周波数領域に変換した入力信号のそれぞれに対し、ビームフォーマによって目的エリア音方向へ指向性を形成する際の指向性ゲインを取得する指向性ゲイン算出手段と、
それぞれの前記マイクアレイの指向性ゲインに基づいて目的エリア音を強調するエリア強調ゲインを取得するエリア強調ゲイン算出手段と、
前記マイクアレイの入力信号と、前記エリア強調ゲイン算出手段が取得したエリア強調ゲインに基づいて、目的エリア音を強調した目的エリア強調信号を取得する目的エリア音取得手段と
して機能させることを特徴とする収音プログラム。
Computer,
A directivity gain calculation means for acquiring the directivity gain when the beam former forms directivity in the target area sound direction for each of the input signals obtained by converting the captured signals output by a plurality of microphone arrays into the frequency domain.
An area enhancement gain calculation means for acquiring an area enhancement gain that emphasizes a target area sound based on the directivity gain of each of the microphone arrays.
Based on the input signal of the microphone array and the area enhancement gain acquired by the area enhancement gain calculation means, it is characterized by functioning as a target area sound acquisition means for acquiring a target area emphasis signal that emphasizes the target area sound. Sound collection program.
収音方法において、
指向性ゲイン算出手段、エリア強調ゲイン算出手段、及び目的エリア音取得手段を備え、
前記指向性ゲイン算出手段は、複数のマイクアレイが出力する捕捉信号を周波数領域に変換した入力信号のそれぞれに対し、ビームフォーマによって目的エリア音方向へ指向性を形成する際の指向性ゲインを取得し、
前記エリア強調ゲイン算出手段は、それぞれの前記マイクアレイの指向性ゲインに基づいて目的エリア音を強調するエリア強調ゲインを取得し、
前記目的エリア音取得手段は、前記マイクアレイの入力信号と、前記エリア強調ゲイン算出手段が取得したエリア強調ゲインに基づいて、目的エリア音を強調した目的エリア強調信号を取得する
ことを特徴とする収音方法。
In the sound collection method
It is equipped with a directivity gain calculation means, an area emphasis gain calculation means, and a target area sound acquisition means.
The directivity gain calculating means acquires the directivity gain when the beam former forms directivity in the target area sound direction for each of the input signals obtained by converting the captured signals output by the plurality of microphone arrays into the frequency domain. And
The area enhancement gain calculating means acquires an area enhancement gain that emphasizes a target area sound based on the directivity gain of each of the microphone arrays.
The target area sound acquisition means acquires a target area emphasis signal that emphasizes the target area sound based on the input signal of the microphone array and the area emphasis gain acquired by the area emphasis gain calculation unit. Sound collection method.
JP2017068486A 2017-03-30 2017-03-30 Sound collectors, programs and methods Active JP6763332B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017068486A JP6763332B2 (en) 2017-03-30 2017-03-30 Sound collectors, programs and methods

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017068486A JP6763332B2 (en) 2017-03-30 2017-03-30 Sound collectors, programs and methods

Publications (2)

Publication Number Publication Date
JP2018170717A JP2018170717A (en) 2018-11-01
JP6763332B2 true JP6763332B2 (en) 2020-09-30

Family

ID=64017948

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017068486A Active JP6763332B2 (en) 2017-03-30 2017-03-30 Sound collectors, programs and methods

Country Status (1)

Country Link
JP (1) JP6763332B2 (en)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7027365B2 (en) * 2019-03-13 2022-03-01 株式会社東芝 Signal processing equipment, signal processing methods and programs
WO2022000174A1 (en) * 2020-06-29 2022-01-06 深圳市大疆创新科技有限公司 Audio processing method, audio processing apparatus, and electronic device
CN112185406A (en) * 2020-09-18 2021-01-05 北京大米科技有限公司 Sound processing method, sound processing device, electronic equipment and readable storage medium
CN112423191B (en) * 2020-11-18 2022-12-27 青岛海信商用显示股份有限公司 Video call device and audio gain method
CN112634931A (en) * 2020-12-22 2021-04-09 北京声智科技有限公司 Voice enhancement method and device

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3548706B2 (en) * 2000-01-18 2004-07-28 日本電信電話株式会社 Zone-specific sound pickup device
JP4473829B2 (en) * 2006-02-28 2010-06-02 日本電信電話株式会社 Sound collecting device, program, and recording medium recording the same
RU2559520C2 (en) * 2010-12-03 2015-08-10 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Device and method for spatially selective sound reception by acoustic triangulation

Also Published As

Publication number Publication date
JP2018170717A (en) 2018-11-01

Similar Documents

Publication Publication Date Title
JP6763332B2 (en) Sound collectors, programs and methods
US9549255B2 (en) Sound pickup apparatus and method for picking up sound
JP5482854B2 (en) Sound collecting device and program
CN109285557B (en) Directional pickup method and device and electronic equipment
JP4066197B2 (en) Microphone device
JP6131989B2 (en) Sound collecting apparatus, program and method
JP5488679B1 (en) Microphone array selection device, microphone array selection program, and sound collection device
KR20090037692A (en) Method and apparatus for extracting the target sound signal from the mixed sound
CN101478711A (en) Method for controlling microphone sound recording, digital audio signal processing method and apparatus
KR20130116299A (en) Apparatus and method for spatially selective sound acquisition by acoustic triangulation
JP5737342B2 (en) Sound collecting device and program
JP5494699B2 (en) Sound collecting device and program
JP6540730B2 (en) Sound collection device, program and method, determination device, program and method
JP5648760B1 (en) Sound collecting device and program
JP6226885B2 (en) Sound source separation method, apparatus, and program
JP6436180B2 (en) Sound collecting apparatus, program and method
JP7254938B2 (en) Combined source localization and separation method for acoustic sources
JP6260666B1 (en) Sound collecting apparatus, program and method
JP6863004B2 (en) Sound collectors, programs and methods
JP6241520B1 (en) Sound collecting apparatus, program and method
JP2016163135A (en) Sound collection device, program and method
JP2017181761A (en) Signal processing device and program, and gain processing device and program
JP6879340B2 (en) Sound collecting device, sound collecting program, and sound collecting method
JP2021118461A (en) Device, program and method for sound collection
JP6624256B1 (en) Sound pickup device, program and method

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20191115

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200713

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200811

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200824

R150 Certificate of patent or registration of utility model

Ref document number: 6763332

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150