JP2016149612A - Microphone interval control device and program - Google Patents

Microphone interval control device and program Download PDF

Info

Publication number
JP2016149612A
JP2016149612A JP2015024526A JP2015024526A JP2016149612A JP 2016149612 A JP2016149612 A JP 2016149612A JP 2015024526 A JP2015024526 A JP 2015024526A JP 2015024526 A JP2015024526 A JP 2015024526A JP 2016149612 A JP2016149612 A JP 2016149612A
Authority
JP
Japan
Prior art keywords
microphone
microphones
modgi
interval
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2015024526A
Other languages
Japanese (ja)
Other versions
JP6481397B2 (en
Inventor
克之 高橋
Katsuyuki Takahashi
克之 高橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2015024526A priority Critical patent/JP6481397B2/en
Publication of JP2016149612A publication Critical patent/JP2016149612A/en
Application granted granted Critical
Publication of JP6481397B2 publication Critical patent/JP6481397B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide a microphone interval control device capable of rapidly controlling a microphone interval in response to the frequency characteristics of a noise component.SOLUTION: A microphone interval control device is based on fixedly arranged multiple microphones. Since a microphone interval is changed by the combination of two microphones among the multiple microphones, a microphone interval is selected by selecting two acquisition signals to be output to a next stage device. A feature amount expressing the frequency and largeness of change in the inclination direction of a signal waveform concerning the acquisition signal of the predetermined microphone is calculated in order to perform the selection. The feature amount reflects the level of the inclusion of a high range component. The two acquisition signals are selected in response to the calculated feature amount.SELECTED DRAWING: Figure 1

Description

本発明はマイクロホン間隔制御装置及びプログラムに関し、例えば、複数のマイクロホンが捕捉した入力信号における雑音成分を抑圧する場合に適用し得るものである。   The present invention relates to a microphone interval control device and a program, and can be applied to, for example, a case where noise components in input signals captured by a plurality of microphones are suppressed.

複数のマイクロホンを有するマイクロホンアレイを用いて雑音成分を抑圧する技術として、特許文献1の記載技術を挙げることができる。   As a technique for suppressing a noise component using a microphone array having a plurality of microphones, a technique described in Patent Document 1 can be cited.

特許文献1の記載技術では、位置関係が固定された2個のマイクロホンから構成されるマイクロホンアレイを用いた信号処理を行うことを想定していた。しかし、従来、信号処理に供するマイクロホンの位置関係は必ずしも固定であるとは限らない。例えば、図9のように、3個以上のマイクロホンを有するマイクロホンアレイを適用し、マイクロホンアレイの中から何らかの基準に基づいて2個のマイクロホンを選択して信号処理を行う場合もある。   The technique described in Patent Document 1 assumes that signal processing is performed using a microphone array composed of two microphones whose positional relationship is fixed. However, conventionally, the positional relationship of microphones used for signal processing is not always fixed. For example, as shown in FIG. 9, there may be a case where a microphone array having three or more microphones is applied, and two microphones are selected from the microphone array based on some criteria to perform signal processing.

ところで、2つのマイクロホンの間隔が広いほど、低域成分の指向性が鋭くなる一方で、高域成分には空間サンプリング定理による誤差が生じる。逆に、マイクロホン間隔が狭いほど、低域成分の指向性が広くなるものの、高域成分の指向性が正確になる。以上のように、マイクロホン間隔に応じて、鋭い指向性が形成される帯域が変化する。そのため、マイクロホンアレイを用いて背景雑音の抑圧処理を行う場合、雑音成分の周波数特性に応じてマイクロホン間隔を切り替えることにより、適切な雑音抑圧処理を実現できる。例えば、低域成分にパワーが集中しているような背景雑音が生じている場合には、マイクロホン間隔が広いマイクロホンアレイを適用して低域成分の指向性を鋭くし、捕捉信号に背景雑音の成分を適切に反映させることで、雑音抑圧効果を十分に発揮させる。   By the way, the wider the interval between two microphones, the sharper the directivity of the low frequency component, while the high frequency component has an error due to the spatial sampling theorem. On the contrary, as the microphone interval is narrower, the directivity of the low frequency component becomes wider, but the directivity of the high frequency component becomes more accurate. As described above, the band in which the sharp directivity is formed changes according to the microphone interval. Therefore, when background noise suppression processing is performed using a microphone array, appropriate noise suppression processing can be realized by switching the microphone interval according to the frequency characteristics of the noise component. For example, if background noise is generated in which power is concentrated in the low frequency components, a microphone array with a wide microphone interval is applied to sharpen the directivity of the low frequency components. By appropriately reflecting the components, the noise suppression effect can be sufficiently exerted.

以上のように、様々な雑音下でマイクロホンアレイの効果を高めるため、雑音成分の周波数特性に応じてマイクロホンアレイを構成するマイクロホンの間隔を制御することが行われている。ここで、雑音成分の周波数特性を調べる方法として、従来、ローパスフィルタやハイパスフィルタなどのフィルタを用いて注目する周波数成分を抽出する手法が採られてきた。   As described above, in order to enhance the effect of the microphone array under various noises, the interval between the microphones constituting the microphone array is controlled according to the frequency characteristic of the noise component. Here, as a method for examining the frequency characteristics of the noise component, a method of extracting a frequency component of interest using a filter such as a low-pass filter or a high-pass filter has been conventionally employed.

特開2013−126026号公報JP 2013-1206026 A 特開2014−106337号公報JP 2014-106337 A

Naofumi Aoki,”A Band Extension Technique for Narrow−Band Telephony Speech Based on Full Wave Rectification”, IEICE Trans. Commun.,Vol.E93−B(3),pp.729−731,2010Naofumi Aoki, “A Band Extension Technology for Narrow-Band Telephony Speech Base on Full Wave Rectification”, IEICE Trans. Commun. , Vol. E93-B (3), pp. 729-731, 2010

しかしながら、従来のフィルタを用いた雑音成分の周波数特性の把握方法では、(i)フィルタ処理には処理遅延が伴うために突発的な雑音特性の変動に追従できない、(ii)フィルタ処理をソフトウェア的に行う場合には、演算量が増すためにリアルタイム性が損なわれ、必要なリソース(例えばメモリ)の確保のためにコストが増す、といったような課題がある。   However, in the conventional method of grasping the frequency characteristic of the noise component using the filter, (i) the filter process involves a processing delay, so that it cannot follow a sudden change in the noise characteristic. (Ii) The filter process is software-like. However, there is a problem that real-time performance is impaired due to an increase in the amount of computation, and costs are increased in order to secure necessary resources (for example, memory).

そのため、雑音成分の周波数特性に応じてマイクロホン間隔を速やかに制御できるマイクロホン間隔制御装置及びプログラムが望まれている。   Therefore, a microphone interval control device and a program that can quickly control the microphone interval according to the frequency characteristics of the noise component are desired.

第1の本発明のマイクロホン間隔制御装置は、(1)複数のマイクロホンによる捕捉信号のうちの少なくとも1つの捕捉信号に基づき、マイクロホンの捕捉信号における、信号波形の傾き方向が変化する回数とその大きさを表し、かつ高域成分の含まれ具合を反映した特徴量を算出する特徴量算出手段と、(2)算出された上記特徴量に応じて、次段装置に出力する2つの捕捉信号を出力したマイクロホン間のマイクロホン間隔を調整するマイクロホン間隔最適化手段とを有することを特徴とする。   The microphone interval control apparatus according to the first aspect of the present invention is (1) the number of times and the magnitude of the change in the inclination direction of the signal waveform in the captured signal of the microphone based on at least one captured signal of the captured signals from the plurality of microphones And a feature amount calculating means for calculating a feature amount that reflects the degree of inclusion of the high frequency component, and (2) two captured signals to be output to the next-stage device according to the calculated feature amount. And a microphone interval optimizing means for adjusting a microphone interval between the output microphones.

第2の本発明のマイクロホン間隔制御プログラムは、コンピュータを、(1)複数のマイクロホンによる捕捉信号のうちの少なくとも1つの捕捉信号に基づき、マイクロホンの捕捉信号における、信号波形の傾き方向が変化する回数とその大きさを表し、かつ高域成分の含まれ具合を反映した特徴量を算出する特徴量算出手段と、(2)算出された上記特徴量に応じて、次段装置に出力する2つの捕捉信号を出力したマイクロホン間のマイクロホン間隔を調整するマイクロホン間隔最適化手段として機能させることを特徴とする。   A microphone interval control program according to a second aspect of the present invention is a computer that controls (1) the number of times that the inclination direction of a signal waveform in a captured signal of a microphone changes based on at least one captured signal among captured signals from a plurality of microphones. And a feature amount calculation means for calculating a feature amount that reflects the degree of inclusion of the high-frequency component, and (2) two output to the next-stage device according to the calculated feature amount It is made to function as a microphone space | interval optimization means which adjusts the microphone space | interval between the microphones which output the capture signal.

本発明によれば、雑音成分の周波数特性に応じてマイクロホン間隔を速やかに制御できるマイクロホン間隔制御装置及びプログラムを提供できる。   ADVANTAGE OF THE INVENTION According to this invention, the microphone space | interval control apparatus and program which can control a microphone space | interval rapidly according to the frequency characteristic of a noise component can be provided.

第1の実施形態のマイクロホン間隔制御装置の構成を示すブロック図である。It is a block diagram which shows the structure of the microphone space | interval control apparatus of 1st Embodiment. 第1の実施形態のマイクロホン間隔制御装置におけるマイクロホン選択制御部の詳細構成を示すブロック図である。It is a block diagram which shows the detailed structure of the microphone selection control part in the microphone space | interval control apparatus of 1st Embodiment. 第1の実施形態のマイクロホン間隔制御装置におけるマイクロホン選択制御部内のmodGI/選択制御信号対応記憶部(テーブル)の構成を示す説明図である。It is explanatory drawing which shows the structure of the modGI / selection control signal corresponding | compatible memory | storage part (table) in the microphone selection control part in the microphone space | interval control apparatus of 1st Embodiment. 第2の実施形態のマイクロホン間隔制御装置の構成を示すブロック図である。It is a block diagram which shows the structure of the microphone space | interval control apparatus of 2nd Embodiment. 第2の実施形態のマイクロホン間隔制御装置におけるマイクロホン選択・遅延制御部内のmodGI/選択・遅延制御信号対応記憶部(テーブル)の構成を示す説明図である。It is explanatory drawing which shows the structure of the modGI / selection / delay control signal corresponding | compatible memory | storage part (table) in the microphone selection / delay control part in the microphone space | interval control apparatus of 2nd Embodiment. 第3の実施形態のマイクロホン間隔制御装置の構成を示すブロック図である。It is a block diagram which shows the structure of the microphone space | interval control apparatus of 3rd Embodiment. 第3の実施形態のマイクロホン間隔制御装置におけるマイクロホン移動制御部内のmodGI/マイクロホン位置対応記憶部(テーブル)の構成を示す説明図である。It is explanatory drawing which shows the structure of the modGI / microphone position corresponding | compatible memory | storage part (table) in the microphone movement control part in the microphone space | interval control apparatus of 3rd Embodiment. 第4の実施形態のマイクロホン間隔制御装置の構成を示すブロック図である。It is a block diagram which shows the structure of the microphone space | interval control apparatus of 4th Embodiment. マイクロホンアレイの説明図である。It is explanatory drawing of a microphone array.

(A)第1の実施形態
以下、本発明によるマイクロホン間隔制御装置及びプログラムの第1の実施形態を、図面を参照しながら説明する。
(A) First Embodiment Hereinafter, a first embodiment of a microphone interval control device and a program according to the present invention will be described with reference to the drawings.

(A−1)第1の実施形態の構成
図1は、第1の実施形態のマイクロホン間隔制御装置10の構成を示すブロック図であり、当該マイクロホン間隔制御装置10から出力されたマイクロホン捕捉信号が入力されるマイクロホンアレイ処理部20も記載している。
(A-1) Configuration of the First Embodiment FIG. 1 is a block diagram showing the configuration of the microphone interval control device 10 of the first embodiment, and the microphone capture signal output from the microphone interval control device 10 is The input microphone array processing unit 20 is also described.

図1に示すマイクロホン間隔制御装置10の構成中、3個のマイクロホンm1〜m2を除く構成部分は、ハードウェア的な各種構成要素を接続して構築されたものであっても良く、また、CPU、ROM、RAMなどのプログラムの実行構成を適用してその機能を実現するように構築されたものであっても良い。いずれの構築方法を適用した場合であっても、マイクロホン間隔制御装置10の機能的な詳細構成は、図1で表す構成となっている。   In the configuration of the microphone interval control device 10 shown in FIG. 1, the components other than the three microphones m1 and m2 may be constructed by connecting various hardware components, and the CPU Further, it may be constructed so as to realize the function by applying an execution configuration of a program such as a ROM or a RAM. Regardless of which construction method is applied, the functional detailed configuration of the microphone interval control device 10 is the configuration shown in FIG.

図1において、第1の実施形態のマイクロホン間隔制御装置10は、第1〜第3のマイクロホンm1〜m3、modGI計算部11、マイクロホン選択制御部12及びマイクロホン選択部13を有する。   In FIG. 1, the microphone interval control device 10 according to the first embodiment includes first to third microphones m1 to m3, a modGI calculation unit 11, a microphone selection control unit 12, and a microphone selection unit 13.

第1〜第3のマイクロホンm1〜m3はそれぞれ、周囲の音声、音響などの音波を捕捉して電気信号(アナログ信号)に変換するものである。各マイクロホンm1〜m3は無指向性若しくは後述する正面方向に緩い指向性を有するものである。図1では省略しているが、各マイクロホンm1〜m3による捕捉信号(アナログ信号)をデジタル信号に変換するアナログ/デジタル変換器が設けられており、デジタル信号に変換された捕捉信号s1(n)〜s3(n)に与えられるようになされている。ここで、「n」は時刻を表すパラメータであるが、以降の説明においては記述を省略する。   Each of the first to third microphones m1 to m3 captures sound waves such as ambient sounds and sounds and converts them into electrical signals (analog signals). Each of the microphones m1 to m3 has non-directionality or directivity that is loose in the front direction described later. Although not shown in FIG. 1, an analog / digital converter is provided for converting captured signals (analog signals) from the microphones m1 to m3 into digital signals, and the captured signals s1 (n) converted into digital signals. To s3 (n). Here, “n” is a parameter representing time, but the description is omitted in the following description.

第1の実施形態の場合、第1〜第3のマイクロホンm1〜m3はこの順序で1直線上に配置されており、第1及び第2のマイクロホンm1及びm2のマイクロホン間隔D12は、第2及び第3のマイクロホンm2及びm3のマイクロホン間隔D23より狭くなっている。当然に、第1及び第3のマイクロホンm1及びm3のマイクロホン間隔D13は、第1及び第2のマイクロホンm1及びm2のマイクロホン間隔D12や、第2及び第3のマイクロホンm2及びm3のマイクロホン間隔D23より広い。 For the first embodiment, the first to third microphone m1~m3 are arranged in one straight line in this order, the microphone spacing D 12 between the first and second microphones m1 and m2, second and it is smaller than a microphone interval D 23 of the third microphone m2 and m3. Naturally, the microphone spacing D 13 between the first and third microphones m1 and m3 are and microphone distance D 12 of the first and second microphones m1 and m2, a microphone interval between the second and third microphones m2 and m3 wider than the D 23.

第1〜第3のマイクロホンm1〜m3からの捕捉信号s1〜s3はマイクロホン選択部13に与えられる。マイクロホン選択部13は、3入力2出力構成のものであり、マイクロホン選択制御部12から出力された選択制御信号cntlmicに応じて、自己へ入力された3つの捕捉信号s1〜s3から、2つの捕捉信号SA及びSBを選択してマイクロホンアレイ処理部20に与えるものである。マイクロホン選択部13は、例えば、2個の2入力1出力スイッチsw1及びsw2を備え、第1のスイッチsw1は、捕捉信号s1及びs2から一方を選択し、選択後の一方の捕捉信号SAとしてマイクロホンアレイ処理部20に与え、第2のスイッチsw2は、捕捉信号s2及びs3から一方を選択し、選択後の他方の捕捉信号SBとしてマイクロホンアレイ処理部20に与える。   Capture signals s1 to s3 from the first to third microphones m1 to m3 are given to the microphone selection unit 13. The microphone selection unit 13 has a configuration of three inputs and two outputs. In accordance with the selection control signal cntlmic output from the microphone selection control unit 12, two capture signals s1 to s3 input to the microphone selection unit 13 are captured. The signals SA and SB are selected and given to the microphone array processing unit 20. The microphone selection unit 13 includes, for example, two two-input one-output switches sw1 and sw2, and the first switch sw1 selects one of the captured signals s1 and s2, and the microphone as one captured signal SA after the selection. The second switch sw2 selects one of the captured signals s2 and s3, and supplies the selected signal to the microphone array processing unit 20 as the other captured signal SB after selection.

マイクロホンアレイ処理部20に与えられる捕捉信号SA及びSBを、選択前の捕捉信号s1〜s3の組み合わせで表現すると、(i)s1及びs2、(ii)s2及びs3、(iii)s1及びs3である。この3種類の組み合わせに対応する2つのマイクロホンの間隔はそれぞれD12、D23、D13となっており、従って、マイクロホン選択部13は、マイクロホン間隔を選択しているということができる。 When the captured signals SA and SB given to the microphone array processing unit 20 are expressed by a combination of captured signals s1 to s3 before selection, (i) s1 and s2, (ii) s2 and s3, (iii) s1 and s3. is there. The intervals between the two microphones corresponding to the three types of combinations are D 12 , D 23 , and D 13 , respectively. Therefore, it can be said that the microphone selection unit 13 selects the microphone interval.

第1の実施形態の場合、第1のマイクロホンm1から出力された捕捉信号s1がmodGI計算部11に与えられる。modGI計算部11は、捕捉信号s1についてのmodGI値modGIを計算し、得られたmodGI値modGIをマイクロホン選択制御部12に与える。modGI計算部11は、例えば、捕捉信号s1についてのmodGI値modGIを(1)式に従って算出する。

Figure 2016149612
In the case of the first embodiment, the captured signal s1 output from the first microphone m1 is given to the modGI calculation unit 11. The modGI calculation unit 11 calculates a modGI value modGI for the captured signal s1 and gives the obtained modGI value modGI to the microphone selection control unit 12. The mod GI calculation unit 11 calculates, for example, a mod GI value mod GI for the captured signal s 1 according to the equation (1).
Figure 2016149612

modGI値について簡単に説明する(詳細については、特許文献2参照)。modGIは、修正されたグラディエント・インデックス(Gradient Index:以下、GIと呼ぶ)を意味している。修正される前のGIについては、非特許文献1に記載されている。   The modGI value will be briefly described (refer to Patent Document 2 for details). modGI means a modified gradient index (hereinafter referred to as GI). The GI before being corrected is described in Non-Patent Document 1.

GIは、信号波形の傾き方向が変化する回数とその大きさを測る指標である。GIは、傾き方向が変化したときの、相前後するサンプルの差分絶対値の総和を、そのフレームのパワーの平方根で除算したものとして求められる。従って、GIは、1フレーム内の傾きの変化回数が多いほど大きくなり易く、また、傾きが変化したときの変化量が大きいほど大きくなり易いものである。このような性質から、GIは、入力波形に含まれる高域成分の量と直結しているということもできる。   GI is an index for measuring the number of times and the magnitude of the change in the inclination direction of the signal waveform. The GI is obtained by dividing the sum of absolute difference values of successive samples when the tilt direction is changed by the square root of the power of the frame. Therefore, the GI is likely to increase as the number of changes in inclination within one frame increases, and also increases as the amount of change when the inclination changes increases. From such a property, it can be said that GI is directly connected to the amount of high frequency components included in the input waveform.

しかしながら、GIは、変数ΔΨ(n)という0又は2の2値しかとらない、時系列的に値の大きな飛び跳ねが多発するパラメータを算出要素としているため、値が不規則に大きくなったり小さくなったりするという特徴(「値が暴れる」)がある。   However, since GI uses as a calculation element a variable ΔΨ (n) that takes only two values of 0 or 2 and has many jumps with large values in time series, the value increases or decreases irregularly. There is a characteristic ("value goes wild").

modGIは、GIの値が暴れる(値の大きな飛び跳ねを有する)という性質を有することに鑑み、GIに代えて、GIと高い相関を持ちながら、値の大きな飛び跳ねを抑制した変化が安定した新しい特徴量として提案されたものである。modGIは、特徴量算出対象の任意の信号(本願では捕捉信号s1)に関し、その「算出対象信号のパワー」で正規化された、その「算出対象信号の2階差分のパワー」(これを定数倍したものも含まれる)として定義される。   In view of the fact that modGI has the property that the value of GI is rampant (has a jump with a large value), instead of GI, it has a high correlation with GI, and a new feature with stable changes that suppresses a large jump in value It is proposed as a quantity. modGI is the “power of the second-order difference of the calculation target signal” normalized by the “power of the calculation target signal” for an arbitrary signal (captured signal s1 in the present application) of the feature quantity calculation target (this is a constant). Doubled is also included).

modGIは、GIと高い相関を持つので、信号波形の傾き方向が変化する回数とその大きさを測る安定した指標として機能し、また、入力波形に含まれる高域成分の量を反映したものとして機能する。   Since modGI has a high correlation with GI, it functions as a stable index that measures the number and magnitude of changes in the slope direction of the signal waveform, and reflects the amount of high frequency components included in the input waveform. Function.

以上のように、modGIは、信号波形(捕捉信号s1)に含まれる高域成分の量と直結しているため、modGIの観察によって雑音成分の周波数特性を推定することができ、しかも、modGIの演算が単純なのでコストを増すこともない。そのため、雑音成分の周波数特性を推定する指標(パラメータ)としてmodGIを利用することとした。   As described above, modGI is directly connected to the amount of high-frequency components included in the signal waveform (capture signal s1), so that the frequency characteristics of noise components can be estimated by observing modGI, and modGI Since the calculation is simple, it does not increase the cost. Therefore, modGI is used as an index (parameter) for estimating the frequency characteristic of the noise component.

(1)式は、特許文献2の(13)式と同じ算出式であるが、特許文献2に記載されている(5)式や(10)式〜(12)式を適用してmodGI値modGIを計算するようにしても良い。   The expression (1) is the same calculation expression as the expression (13) in Patent Document 2, but the modGI value obtained by applying the expressions (5) and (10) to (12) described in Patent Document 2. You may make it calculate modGI.

マイクロホン選択制御部12は、modGI計算部11が得た捕捉信号s1についてのmodGI値modGIに基づき、言い換えると、捕捉信号s1における雑音成分が有する周波数特性に基づき、3つの捕捉信号s1〜s3から2つの捕捉信号を選択させる選択制御信号cntlmicを生成してマイクロホン選択部13に与える。   The microphone selection control unit 12 is based on the modGI value modGI of the acquisition signal s1 obtained by the modGI calculation unit 11, in other words, based on the frequency characteristics of the noise component in the acquisition signal s1, and from the two acquisition signals s1 to s3 to 2. A selection control signal cntlmic for selecting two captured signals is generated and provided to the microphone selection unit 13.

図2は、マイクロホン選択制御部12の詳細構成を示すブロック図である。図2において、マイクロホン選択制御部12は、modGI取得部21、modGI照合・選択制御信号生成部22、modGI/選択制御信号対応記憶部23及び選択制御信号送信部24を有する。   FIG. 2 is a block diagram showing a detailed configuration of the microphone selection control unit 12. In FIG. 2, the microphone selection control unit 12 includes a modGI acquisition unit 21, a modGI collation / selection control signal generation unit 22, a modGI / selection control signal correspondence storage unit 23, and a selection control signal transmission unit 24.

modGI取得部21は、modGI計算部11が得たmodGI値modGIを取込むものである。modGI照合・選択制御信号生成部22は、取込んだmodGI値modGIをキーとして、modGI/選択制御信号対応記憶部23における該当する情報を取り出して選択制御信号cntlmicを得る(生成する)ものである。modGI/選択制御信号対応記憶部23は、modGI値modGIの複数の範囲と、その範囲に対応付けられた選択制御信号とを記憶しているものである。選択制御信号送信部24は、modGI照合・選択制御信号生成部22が得た選択制御信号cntlmicをマイクロホン選択部13に送信するものである。   The modGI acquisition unit 21 takes in the modGI value modGI obtained by the modGI calculation unit 11. The modGI collation / selection control signal generation unit 22 obtains (generates) a selection control signal cntlmic by extracting the corresponding information in the modGI / selection control signal correspondence storage unit 23 using the acquired modGI value modGI as a key. . The modGI / selection control signal correspondence storage unit 23 stores a plurality of ranges of the modGI value modGI and selection control signals associated with the ranges. The selection control signal transmission unit 24 transmits the selection control signal cntlmic obtained by the modGI matching / selection control signal generation unit 22 to the microphone selection unit 13.

図3は、modGI/選択制御信号対応記憶部23の構成例を示す説明図であり、図3は、テーブル構成の場合を示している。図3の例では、2つの境界値α及びβ(β>α)を用いてmodGI値modGIが取り得る値の範囲を3つに分けている。   FIG. 3 is an explanatory diagram illustrating a configuration example of the modGI / selection control signal correspondence storage unit 23, and FIG. 3 illustrates a table configuration. In the example of FIG. 3, the range of values that the modGI value modGI can take is divided into three using two boundary values α and β (β> α).

modGI取得部21が取得したmodGI値modGIが最も小さな値の範囲に属する場合、すなわち、modGI≦αの場合には、第1及び第3のマイクロホンm1及びm3からの捕捉信号s1、s3を選択させる選択制御信号cntlmicの内容「10」になっている。第1及び第3のマイクロホンm1及びm3の間隔D13は3つの間隔の最大であるので、捕捉信号s1における雑音成分の周波数特性が低域寄りの場合に好適な間隔である。 When the modGI value modGI acquired by the modGI acquisition unit 21 belongs to the smallest value range, that is, when modGI ≦ α, the captured signals s1 and s3 from the first and third microphones m1 and m3 are selected. The content of the selection control signal cntlmic is “10”. The spacing D 13 between the first and third microphones m1 and m3 is the largest of the three intervals, the frequency characteristic of the noise component in the acquisition signal s1 is the preferred spacing when the low-frequency closer.

modGI取得部21が取得したmodGI値modGIが中間の範囲に属する場合、すなわち、α<modGI≦βの場合には、第2及び第3のマイクロホンm2及びm3からの捕捉信号s2、s3を選択させる選択制御信号cntlmicの内容「01」になっている。第2及び第3のマイクロホンm2及びm3の間隔D23は3つの間隔の中の中間であるので、捕捉信号s1における雑音成分の周波数特性が低域寄りでも高域寄りでもない場合に好適な間隔である。 When the modGI value modGI acquired by the modGI acquisition unit 21 belongs to an intermediate range, that is, when α <modGI ≦ β, the captured signals s2 and s3 from the second and third microphones m2 and m3 are selected. The content of the selection control signal cntlmic is “01”. The spacing D 23 of the second and third microphones m2 and m3 is in the middle of the three intervals, suitable intervals when the frequency characteristic of the noise component in the acquisition signal s1 is not a high-pass nearer the low range nearer It is.

modGI取得部21が取得したmodGI値modGIが最も大きい範囲に属する場合、すなわち、β<modGIの場合には、第1及び第2のマイクロホンm1及びm2からの捕捉信号s1、s2を選択させる選択制御信号cntlmicの内容「11」になっている。第1及び第2のマイクロホンm1及びm2の間隔D12は3つの間隔の中の最小であるので、捕捉信号s1における雑音成分の周波数特性が高域寄りの場合に好適な間隔である。 Selection control for selecting captured signals s1 and s2 from the first and second microphones m1 and m2 when the modGI value modGI acquired by the modGI acquisition unit 21 belongs to the largest range, that is, when β <modGI. The content of the signal cntlmic is “11”. The spacing D 12 between the first and second microphones m1 and m2 are the smallest of the three intervals are suitable distance when the frequency characteristic of the noise component of the high-frequency closer in the acquisition signal s1.

2ビットの選択制御信号cntlmicの上位ビットは、マイクロホン選択部13の第1のスイッチsw1の有効となる入力端子を規定しており、上位ビットの「1」は第1のスイッチsw1のa入力端子を有効とし、上位ビットの「0」は第1のスイッチsw1のb入力端子を有効とすることを表している。2ビットの選択制御信号cntlmicの下位ビットは、マイクロホン選択部13の第2のスイッチsw2の有効となる入力端子を規定しており、下位ビットの「1」は第2のスイッチsw2のa入力端子を有効とし、下位ビットの「0」は第2のスイッチsw2のb入力端子を有効とすることを表している。   The upper bit of the 2-bit selection control signal cntlmic defines an input terminal that is valid for the first switch sw1 of the microphone selection unit 13, and the upper bit “1” is the a input terminal of the first switch sw1. The upper bit “0” indicates that the b input terminal of the first switch sw1 is enabled. The lower bit of the 2-bit selection control signal cntlmic defines the input terminal that is effective for the second switch sw2 of the microphone selection unit 13, and the lower bit “1” is the a input terminal of the second switch sw2. And “0” in the lower bit indicates that the b input terminal of the second switch sw2 is enabled.

マイクロホンアレイ処理部20は、入力された2つの捕捉信号SA及びSBを、2つのマイクロホンでなるマイクロホンアレイからの入力信号として公知の手法に基づいた処理を施すものである。例えば、マイクロホンアレイ処理部20が、出力信号outとして指向性信号を形成するものである場合には、特許文献1の図4(A)に示すような内部構成を有し、遅延減算処理を施して出力信号out(n)を得るものとなる。   The microphone array processing unit 20 performs processing based on a known technique on the two captured signals SA and SB that are input as input signals from a microphone array composed of two microphones. For example, when the microphone array processing unit 20 forms a directional signal as the output signal out, the microphone array processing unit 20 has an internal configuration as shown in FIG. As a result, an output signal out (n) is obtained.

(A−2)第1の実施形態の動作
次に、第1の実施形態に係るマイクロホン間隔制御装置10の動作を説明する。以下では、全体動作、マイクロホン選択制御部12における動作の順に説明する。
(A-2) Operation of the First Embodiment Next, the operation of the microphone interval control apparatus 10 according to the first embodiment will be described. Below, it demonstrates in order of the whole operation | movement and the operation | movement in the microphone selection control part 12. FIG.

周囲の音声、音響などの音波を、第1〜第3のマイクロホンm1〜m3が捕捉して得た第1〜第3の捕捉信号s1〜s3はマイクロホン選択部13に与えられる。また、第1の捕捉信号S1は、modGI計算部11に与えられる。   The first to third captured signals s1 to s3 obtained by capturing the surrounding sound waves such as sound and sound by the first to third microphones m1 to m3 are given to the microphone selecting unit 13. The first acquisition signal S1 is given to the modGI calculation unit 11.

第1の捕捉信号s1についてのmodGI値modGIが、modGI計算部11において(1)式に基づいて計算され、得られたmodGI値modGIがマイクロホン選択制御部12に与えられる。そして、マイクロホン選択制御部12において、計算されたmodGI値modGIに基づいて、言い換えると、捕捉信号s1における雑音成分が有する周波数特性に基づいて、3つの捕捉信号s1〜s3から2つの捕捉信号を選択させる選択制御信号cntlmicが生成されてマイクロホン選択部13に与えられる。   The modGI value modGI for the first acquisition signal s 1 is calculated based on the equation (1) in the modGI calculation unit 11, and the obtained modGI value modGI is given to the microphone selection control unit 12. Then, the microphone selection control unit 12 selects two captured signals from the three captured signals s1 to s3 based on the calculated modGI value modGI, in other words, based on the frequency characteristics of the noise component in the captured signal s1. A selection control signal cntlmic is generated and supplied to the microphone selection unit 13.

第1〜第3のマイクロホンm1〜m3からの3つの捕捉信号s1〜s3のうち、選択制御信号cntlmicが指示する2つの捕捉信号SA及びSBが、マイクロホン選択部13において選択されてマイクロホンアレイ処理部20に与えられる。   Of the three captured signals s1 to s3 from the first to third microphones m1 to m3, two captured signals SA and SB indicated by the selection control signal cntlmic are selected by the microphone selecting unit 13 and the microphone array processing unit. 20 is given.

そして、マイクロホンアレイ処理部20において、2つの捕捉信号SA及びSBは、2つのマイクロホンでなるマイクロホンアレイからの入力信号として公知の手法に基づいて処理される。   Then, in the microphone array processing unit 20, the two captured signals SA and SB are processed based on a known method as input signals from a microphone array composed of two microphones.

次に、マイクロホン選択制御部12における詳細動作を説明する。   Next, a detailed operation in the microphone selection control unit 12 will be described.

modGI計算部11が得たmodGI値modGIが、modGI取得部21によって取込まれてmodGI照合・選択制御信号生成部22に与えられる。modGI照合・選択制御信号生成部22によって、取込まれたmodGI値modGIがキーとなってmodGI/選択制御信号対応記憶部23に対する照合が実行され、取込まれたmodGI値modGIが属する範囲に応じた選択制御信号cntlmic(図3参照)がmodGI/選択制御信号対応記憶部23から取り出される。そして、その選択制御信号cntlmicが、選択制御信号送信部24によってマイクロホン選択部13に送信される。   The modGI value modGI obtained by the modGI calculation unit 11 is taken in by the modGI acquisition unit 21 and given to the modGI collation / selection control signal generation unit 22. The modGI collation / selection control signal generation unit 22 performs collation with the modGI / selection control signal correspondence storage unit 23 by using the captured modGI value modGI as a key, and according to the range to which the acquired modGI value modGI belongs. The selection control signal cntlmic (see FIG. 3) is extracted from the modGI / selection control signal correspondence storage unit 23. Then, the selection control signal cntlmic is transmitted to the microphone selection unit 13 by the selection control signal transmission unit 24.

(A−3)第1の実施形態の効果
以上のように、第1の実施形態によれば、modGI値modGIによって、捕捉信号s1(言い換えると、捕捉信号s1〜s3)における雑音成分の周波数特性を推定し、その結果に基づいて、雑音成分の処理(例えば雑音抑圧)に適した2つのマイクロホンを選択してマイクロホンアレイを構成することができ、マイクロホンアレイからの捕捉信号を処理する処理部の処理精度を向上させることができる。ここで、modGI値modGIを雑音成分の周波数特性を反映したパラメータに用いているため、処理遅延が少なく、演算も容易である。
(A-3) Effects of the First Embodiment As described above, according to the first embodiment, the frequency characteristics of the noise components in the captured signal s1 (in other words, the captured signals s1 to s3) by the modGI value modGI. Based on the result, two microphones suitable for noise component processing (for example, noise suppression) can be selected to form a microphone array, and a processing unit for processing a captured signal from the microphone array can be configured. Processing accuracy can be improved. Here, since the modGI value modGI is used as a parameter reflecting the frequency characteristic of the noise component, the processing delay is small and the calculation is easy.

第1の実施形態のマイクロホン間隔制御装置10を、例えば、通信端末(スマートフォンや携帯電話端末など)やテレビ会議システムなどに適用することにより通話音質の改善などの効果を期待でき、また、第1の実施形態のマイクロホン間隔制御装置10を、例えば、カーナビゲーションシステムや家電装置のボイスコマンド入力装置などに適用することにより音声認識精度の改善などの効果を期待できる。例えば、スマートフォンは使用者が種々の環境下に携帯するものであり、携帯者が乗り込んだ自動車の車内の背景雑音(窓を閉めている場合の背景雑音)は車外に比べて低域成分が中心的である。また、カーナビゲーションシステム用のボイスコマンド入力装置近傍の背景雑音の特性は、例えば、走行速度が速いか遅いか、エアコンが使用されているか否か、さらには、自動車の窓(特に前列の窓)が開いているか閉まっているかなどの様々な条件で大きく変わる。このような背景雑音の特性が種々変化する装置へ、第1の実施形態のマイクロホン間隔制御装置10を適用することは非常に有効である。   By applying the microphone interval control device 10 of the first embodiment to, for example, a communication terminal (such as a smartphone or a mobile phone terminal) or a video conference system, an effect such as improvement in call sound quality can be expected. By applying the microphone interval control device 10 of the embodiment to, for example, a car navigation system or a voice command input device of a home appliance, an effect such as improvement of voice recognition accuracy can be expected. For example, a smartphone is carried by a user in various environments, and background noise inside the car (background noise when the window is closed) of a car in which the user gets in is mainly low-frequency components compared to outside the vehicle. Is. In addition, the background noise characteristics in the vicinity of the voice command input device for the car navigation system include, for example, whether the traveling speed is fast or slow, whether an air conditioner is used, and further, an automobile window (especially a front row window). It varies greatly depending on various conditions such as whether the is open or closed. It is very effective to apply the microphone interval control device 10 of the first embodiment to such a device in which the characteristics of the background noise change variously.

(B)第2の実施形態
次に、本発明によるマイクロホン間隔制御装置及びプログラムの第2の実施形態を、図面を参照しながら説明する。
(B) Second Embodiment Next, a second embodiment of the microphone interval control device and program according to the present invention will be described with reference to the drawings.

図4は、第2の実施形態のマイクロホン間隔制御装置10Aの構成を示すブロック図であり、上述した第1の実施形態に係る図1との同一、対応部分には同一、対応符号を付して示している。   FIG. 4 is a block diagram showing the configuration of the microphone interval control apparatus 10A of the second embodiment. The same and corresponding parts as those in FIG. 1 according to the first embodiment described above are assigned the same and corresponding reference numerals. It shows.

図4において、第2の実施形態のマイクロホン間隔制御装置10Aは、第1〜第3のマイクロホンm1〜m3、modGI計算部11、マイクロホン選択・遅延制御部12A、マイクロホン選択部13及び付与遅延選択部14を有する。   In FIG. 4, the microphone interval control apparatus 10A of the second embodiment includes first to third microphones m1 to m3, a modGI calculation unit 11, a microphone selection / delay control unit 12A, a microphone selection unit 13, and an added delay selection unit. 14

上述した第1の実施形態の場合、第1〜第3のマイクロホンm1〜m3はこの順序で1直線上に配置されていた。第2の実施形態の場合、3つのマイクロホンm1〜m3は直線状ではなく、図4に示すように、三角形(例えば、直角三角形若しくは鈍角三角形)の3つの頂点の位置に固定的に配置されている。但し、マイクロホン間隔の大小関係は、第1の実施形態と同様になっている。すなわち、第1及び第2のマイクロホンm1及びm2のマイクロホン間隔D12は、第2及び第3のマイクロホンm2及びm3のマイクロホン間隔D23より狭く、第1及び第3のマイクロホンm1及びm3のマイクロホン間隔D13は、第1及び第2のマイクロホンm1及びm2のマイクロホン間隔D12や、第2及び第3のマイクロホンm2及びm3のマイクロホン間隔D23より広くなっている。 In the case of the first embodiment described above, the first to third microphones m1 to m3 are arranged on one straight line in this order. In the case of the second embodiment, the three microphones m1 to m3 are not linear, and are fixedly arranged at the positions of the three vertices of a triangle (for example, a right triangle or an obtuse triangle) as shown in FIG. Yes. However, the relationship between the microphone intervals is the same as in the first embodiment. That is, the microphone spacing D 12 between the first and second microphones m1 and m2 are narrower than the microphone spacing D 23 of the second and third microphones m2 and m3, the microphone interval between the first and third microphones m1 and m3 D 13 is wider than the microphone interval D 12 between the first and second microphones m 1 and m 2 and the microphone interval D 23 between the second and third microphones m 2 and m 3.

ここで、マイクロホン間隔制御装置10Aを搭載している装置(例えば、ボイスコマンド入力装置)の設計者が意図している音波の方向(指向性)が、第1及び第3のマイクロホンm1及びm3を結ぶ線分の直交方向であったとする。この場合、3つのマイクロホンm1〜m3が三角形の3つの頂点の位置に固定的に配置されているため、2つのマイクロホンとして第1及び第3のマイクロホンm1及びm3が選択された場合には、選択後の2つの捕捉信号SA及びSBにおける設計者が意図している方向からの成分には時間差が生じないが、2つのマイクロホンとして第1及び第2のマイクロホンm1及びm2が選択された場合や、2つのマイクロホンとして第2及び第3のマイクロホンm2及びm3が選択された場合には、選択後の2つの捕捉信号SA及びSBには、設計者が意図している方向からの成分に、図4の距離Lに相当する時間差が生じる。   Here, the direction of the sound wave (directivity) intended by the designer of a device (for example, a voice command input device) on which the microphone interval control device 10A is mounted is determined by the first and third microphones m1 and m3. Suppose that it is the orthogonal direction of the connecting line segment. In this case, since the three microphones m1 to m3 are fixedly arranged at the positions of the three vertices of the triangle, the selection is made when the first and third microphones m1 and m3 are selected as the two microphones. There is no time difference in the components from the direction intended by the designer in the latter two captured signals SA and SB, but when the first and second microphones m1 and m2 are selected as the two microphones, When the second and third microphones m2 and m3 are selected as the two microphones, the two captured signals SA and SB after the selection have components from directions intended by the designer, as shown in FIG. A time difference corresponding to the distance L is generated.

そのため、第2の実施形態では、付与遅延選択部14が設けている。付与遅延選択部14は、3つのマイクロホンm1〜m3からの2つのマイクロホンの選択結果に応じて、選択された2つのマイクロホンからの捕捉信号SA及びSBの時間差を解消するものである。   Therefore, in the second embodiment, the provision delay selection unit 14 is provided. The provision delay selection unit 14 eliminates the time difference between the captured signals SA and SB from the two selected microphones according to the selection result of the two microphones from the three microphones m1 to m3.

付与遅延選択部14は、上述した機能を発揮できれば、その詳細構成は問われないものであるが、一例として、図4に示すように構成することができる。以下では、距離Lに対応する遅延量(時間)がdであるとして説明する。付与遅延選択部14は、捕捉信号SAを時間dだけ遅延させる遅延部14A1と、捕捉信号SAをそのまま通過させるか、遅延部14A1からの遅延信号を通過させるかを切り替える2入力1出力スイッチ14A2と、捕捉信号SBを時間dだけ遅延させる遅延部14B1と、捕捉信号SBをそのまま通過させるか、遅延部14B1からの遅延信号を通過させるかを切り替える2入力1出力スイッチ14B2とを有している。なお、2つのスイッチ14A1及び14B1は、制御ビットが「1」のときにa入力端子を選択し、制御ビットが「0」のときにb入力端子を選択するものである。   The detailed configuration of the grant delay selection unit 14 is not limited as long as the above-described function can be exhibited, but can be configured as shown in FIG. 4 as an example. In the following description, it is assumed that the delay amount (time) corresponding to the distance L is d. The addition delay selection unit 14 delays the capture signal SA by time d, a 2-input 1-output switch 14A2 that switches between passing the capture signal SA as it is or passing the delay signal from the delay unit 14A1. The delay unit 14B1 delays the capture signal SB by time d, and the 2-input 1-output switch 14B2 that switches between passing the capture signal SB as it is or passing the delay signal from the delay unit 14B1. The two switches 14A1 and 14B1 select the a input terminal when the control bit is “1”, and select the b input terminal when the control bit is “0”.

2つのマイクロホンとして第1及び第3のマイクロホンm1及びm3が選択された場合には、選択後の2つの捕捉信号SA及びSBに時間差が生じていないので、付与遅延選択部14は、マイクロホン選択部13からの2つの捕捉信号SA及びSBを共に遅延させることなく、マイクロホンアレイ処理部20に与えれば良い。また、2つのマイクロホンとして第2及び第3のマイクロホンm2及びm3が選択された場合には、選択後の2つの捕捉信号SA及びSB間に捕捉信号SB側が時間差dだけ進んでいる関係があるので、付与遅延選択部14は、捕捉信号SBだけを時間差dだけ遅延させてマイクロホンアレイ処理部20に与えれば良い。さらに、2つのマイクロホンとして第1及び第2のマイクロホンm1及びm2が選択された場合には、選択後の2つの捕捉信号SA及びSB間に捕捉信号SA側が時間差dだけ進んでいる関係があるので、付与遅延選択部14は、捕捉信号SAだけを時間差dだけ遅延させてマイクロホンアレイ処理部20に与えれば良い。   When the first and third microphones m1 and m3 are selected as the two microphones, there is no time difference between the two captured signals SA and SB after selection. The two captured signals SA and SB from 13 may be supplied to the microphone array processing unit 20 without being delayed. Further, when the second and third microphones m2 and m3 are selected as the two microphones, there is a relationship in which the captured signal SB side advances by the time difference d between the two captured signals SA and SB after selection. The provision delay selection unit 14 may delay the capture signal SB by the time difference d and provide it to the microphone array processing unit 20. Further, when the first and second microphones m1 and m2 are selected as the two microphones, there is a relationship in which the capture signal SA side advances by the time difference d between the two capture signals SA and SB after selection. The provision delay selection unit 14 may delay the capture signal SA by the time difference d and provide it to the microphone array processing unit 20.

マイクロホン選択・遅延制御部12Aは、マイクロホン(の捕捉信号)の選択に応じて、マイクロホン選択後の捕捉信号に対する、以上のような遅延制御を実現できるように、第1の実施形態のmodGI/選択制御信号対応記憶部23に代えて、modGI/選択・遅延制御信号対応記憶部23Aを有している。   The microphone selection / delay control unit 12A mod_GI / selection according to the first embodiment so that the delay control as described above can be realized with respect to the captured signal after selection of the microphone according to the selection of the microphone (captured signal). Instead of the control signal correspondence storage unit 23, a modGI / selection / delay control signal correspondence storage unit 23A is provided.

図5は、modGI/選択・遅延制御信号対応記憶部23Aの構成例を示す説明図であり、上述した第1の実施形態の図3に対応する図面である。   FIG. 5 is an explanatory diagram illustrating a configuration example of the modGI / selection / delay control signal correspondence storage unit 23A, and corresponds to FIG. 3 of the first embodiment described above.

modGI/選択・遅延制御信号対応記憶部23Aも、modGI取得部21が取得したmodGI値modGIが属する範囲に応じて、3つのマイクロホンm1〜m3(の捕捉信号)から2つのマイクロホン(の捕捉信号)を選択させる選択制御信号cntlmicを得ることができるようになされている。これに加え、modGI/選択・遅延制御信号対応記憶部23Aは、modGI取得部21が取得したmodGI値modGIが属する範囲に応じて、言い換えると、選択された2つのマイクロホンの組み合わせに応じて、選択後の捕捉信号SA及びSBの時間差を解消させる遅延制御信号cntldlを得ることができるようになされている。遅延制御信号cntldlは、付与遅延選択部14を上述したように制御するものである。   The modGI / selection / delay control signal correspondence storage unit 23A also has two microphones (capture signals) from three microphones m1 to m3 (capture signals) according to the range to which the modGI value modGI acquired by the modGI acquisition unit 21 belongs. The selection control signal cntlmic for selecting can be obtained. In addition, the modGI / selection / delay control signal correspondence storage unit 23A selects according to the range to which the modGI value modGI acquired by the modGI acquisition unit 21 belongs, in other words, according to the combination of two selected microphones. A delay control signal cntldl that eliminates the time difference between the subsequent acquisition signals SA and SB can be obtained. The delay control signal cntldl controls the added delay selection unit 14 as described above.

第2の実施形態によっても、第1の実施形態と同様な効果を奏することができる。これに加え、第2の実施形態によれば、複数のマイクロホン間で、所定方向からの音波の捕捉タイミングにずれがある場合でも、そのずれを解消して、選択された捕捉信号をマイクロホンアレイ処理部に与えることができる。   According to the second embodiment, the same effect as that of the first embodiment can be obtained. In addition, according to the second embodiment, even when there is a deviation in the timing of capturing sound waves from a predetermined direction among a plurality of microphones, the deviation is eliminated and the selected acquisition signal is processed by microphone array processing. Can be given to the department.

なお、第1の実施形態に係る図1のように、複数のマイクロホンが1直線上に配置されていても、所定方向が、その直線の直交方向でない場合には、第2の実施形態におけるような捕捉タイミングのずれを解消する手段を設けることを要する。   As shown in FIG. 1 according to the first embodiment, even when a plurality of microphones are arranged on one straight line, when the predetermined direction is not the orthogonal direction of the straight line, as in the second embodiment. It is necessary to provide a means for eliminating a large shift in capture timing.

(C)第3の実施形態
次に、本発明によるマイクロホン間隔制御装置及びプログラムの第3の実施形態を、図面を参照しながら説明する。
(C) Third Embodiment Next, a third embodiment of the microphone interval control apparatus and program according to the present invention will be described with reference to the drawings.

図6は、第3の実施形態のマイクロホン間隔制御装置10Bの構成を示すブロック図であり、上述した第1の実施形態に係る図1との同一、対応部分には同一、対応符号を付して示している。   FIG. 6 is a block diagram showing the configuration of the microphone interval control apparatus 10B of the third embodiment. The same and corresponding parts as those in FIG. 1 according to the first embodiment described above are assigned the same and corresponding reference numerals. It shows.

図6において、第3の実施形態のマイクロホン間隔制御装置10Bは、2つのマイクロホンmf、mm、modGI計算部11、マイクロホン移動制御部12B及びマイクロホン移動機構15を有する。   In FIG. 6, the microphone interval control apparatus 10 </ b> B of the third embodiment includes two microphones mf, mm, modGI calculation unit 11, microphone movement control unit 12 </ b> B, and microphone movement mechanism 15.

2つのマイクロホンmf及びmmのうち、一方のマイクロホンmfは固定的に設けられており、他方のマイクロホンmmはマイクロホン移動制御部12Bによって移動可能に設けられている。マイクロホンmmの移動方向は、固定設置のマイクロホンmfに近付き又は遠ざかる方向である。すなわち、この第3の実施形態の場合、マイクロホンの数は2つであるが、その2つのマイクロホンmf及びmm間の間隔を変えることができるようになされている。   Of the two microphones mf and mm, one microphone mf is fixedly provided, and the other microphone mm is provided movably by the microphone movement control unit 12B. The moving direction of the microphone mm is a direction to approach or move away from the microphone mf that is fixedly installed. That is, in the case of the third embodiment, the number of microphones is two, but the interval between the two microphones mf and mm can be changed.

マイクロホン移動機構15は、移動可能なマイクロホンmmを移動する機構であり、その詳細構成は限定されない。一例を挙げれば以下の通りである。マイクロホン移動機構15は、駆動源としてステッピングモータを備え、ステッピングモータの回転軸にはピニオンが取り付けられている。このピニオンと係合するラックはガイドによって直動可能となされており、このラックの側面や裏面などの一部に移動可能なマイクロホンmmが固定的に取り付けられている。   The microphone moving mechanism 15 is a mechanism for moving the movable microphone mm, and its detailed configuration is not limited. An example is as follows. The microphone moving mechanism 15 includes a stepping motor as a drive source, and a pinion is attached to the rotation shaft of the stepping motor. A rack that engages with the pinion can be linearly moved by a guide, and a movable microphone mm is fixedly attached to a part of the side or back of the rack.

modGI計算部11は、マイクロホンmfから出力された捕捉信号s1についてのmodGI値modGIを計算し、得られたmodGI値modGIをマイクロホン移動制御部12Bに与える。   The modGI calculation unit 11 calculates a modGI value modGI for the captured signal s1 output from the microphone mf, and gives the obtained modGI value modGI to the microphone movement control unit 12B.

マイクロホン移動制御部12Bは、計算されたmodGI値modGIに基づいて、言い換えると、捕捉信号s1における雑音成分が有する周波数特性に基づいて、2つのマイクロホンmf及びmm間の間隔を最適化するマイクロホンmmの移動量を定め、移動制御信号cntlmvをマイクロホン移動機構15に与える。   Based on the calculated modGI value modGI, in other words, based on the frequency characteristic of the noise component in the captured signal s1, the microphone movement control unit 12B optimizes the distance between the two microphones mf and mm. A movement amount is determined, and a movement control signal cntlmv is given to the microphone moving mechanism 15.

上述した機能を発揮できれば、マイクロホン移動制御部12Bの内部構成は問われない。一例を挙げると、以下のとおりである。マイクロホン移動制御部12Bは、現状のマイクロホンmmの位置12B1(の情報)を記憶している。また、マイクロホン移動制御部12Bは、modGI値modGIが属する範囲と、その範囲に適したマイクロホンmmの位置とを対応付けた、図7に示すような構成のmodGI/マイクロホン位置対応記憶部(テーブル)23Bを内蔵している。マイクロホン移動制御部12Bは、modGI/マイクロホン位置対応記憶部(テーブル)23Bから、計算されたmodGI値modGIに適したマイクロホンmmの位置を取り出し、取り出した位置と現状のマイクロホンmmの位置12B1との差を求め、現状のマイクロホンmmの位置12B1から取り出した位置へマイクロホンmmを移動させる移動制御信号cntlmvを生成してマイクロホン移動機構15に与える。   As long as the above-described functions can be exhibited, the internal configuration of the microphone movement control unit 12B is not limited. An example is as follows. The microphone movement control unit 12B stores the current position 12B1 (information) of the microphone mm. Further, the microphone movement control unit 12B associates a range to which the modGI value modGI belongs with a position of the microphone mm suitable for the range, and a modGI / microphone position correspondence storage unit (table) configured as shown in FIG. 23B is built-in. The microphone movement control unit 12B extracts the position of the microphone mm suitable for the calculated modGI value modGI from the modGI / microphone position correspondence storage unit (table) 23B, and the difference between the extracted position and the current position 12B1 of the microphone mm. And a movement control signal cntlmv for moving the microphone mm to the position taken out from the current position 12B1 of the microphone mm is generated and given to the microphone moving mechanism 15.

第3の実施形態によっても、捕捉信号における雑音成分の周波数特性を反映させたmodGIを計算し、それに応じて、2つのマイクロホンの間隔を制御するようにしたので、第1の実施形態と同様な効果を奏することができる。   Also in the third embodiment, the modGI reflecting the frequency characteristic of the noise component in the captured signal is calculated, and the interval between the two microphones is controlled accordingly, so the same as in the first embodiment. There is an effect.

(D)第4の実施形態
次に、本発明によるマイクロホン間隔制御装置及びプログラムの第4の実施形態を、図面を参照しながら説明する。
(D) Fourth Embodiment Next, a fourth embodiment of the microphone interval control device and program according to the present invention will be described with reference to the drawings.

図8は、第4の実施形態のマイクロホン間隔制御装置10Cの構成を示すブロック図であり、上述した第1の実施形態に係る図1との同一、対応部分には同一、対応符号を付して示している。   FIG. 8 is a block diagram showing the configuration of the microphone interval control apparatus 10C of the fourth embodiment. The same and corresponding parts as those in FIG. 1 according to the first embodiment described above are assigned the same and corresponding reference numerals. It shows.

図8において、第4の実施形態のマイクロホン間隔制御装置10Cは、第1〜第3のマイクロホンm1〜m3、modGI計算部11C、マイクロホン選択制御部12及びマイクロホン選択部13に加え、音声区間検出部16を有する。   In FIG. 8, the microphone interval control device 10C according to the fourth embodiment includes a voice section detection unit in addition to the first to third microphones m1 to m3, the modGI calculation unit 11C, the microphone selection control unit 12, and the microphone selection unit 13. 16

音声区間検出部16は、第1の捕捉信号s1が音声区間か否かを、公知の音声検出技術によって検出するものであり、検出結果VをmodGI計算部11Cに与えるものである。   The voice section detection unit 16 detects whether or not the first captured signal s1 is a voice section by a known voice detection technique, and gives the detection result V to the modGI calculation unit 11C.

第4の実施形態のmodGI計算部11Cは、検出結果Vが非音声区間を表しているときに捕捉信号s1についてのmodGI値modGIを計算し、検出結果Vが音声区間を表しているときに直前のmodGI値modGIを維持させ、以上のように非音声区間でのみ更新されたmodGI値modGIをマイクロホン選択制御部12に与えるものである。   The modGI calculation unit 11C of the fourth embodiment calculates the modGI value modGI for the captured signal s1 when the detection result V represents a non-speech interval, and immediately before the detection result V represents a speech interval. The present mode GI value mod GI is maintained, and the mod GI value mod GI updated only in the non-voice interval as described above is given to the microphone selection control unit 12.

従って、第4の実施形態においては、非音声区間(言い換えると雑音区間)においてのみマイクロホン間隔の見直しが実行される。   Therefore, in the fourth embodiment, the microphone interval is reviewed only in the non-voice section (in other words, the noise section).

第4の実施形態によれば、非音声区間でのみmodGI値を更新してマイクロホンの選択を制御するので、第1の実施形態より高い効果を期待できる。   According to the fourth embodiment, since the mod GI value is updated only in the non-speech period and the selection of the microphone is controlled, a higher effect than in the first embodiment can be expected.

(E)他の実施形態
上記各実施形態ではmodGIを適用する場合を示したが、修正される前のGI(特許文献2の(4)式参照)も、信号波形の傾き方向が変化する回数とその大きさを測る指標であるので、上記各実施形態におけるmodGIに代えてGIを適用するようにしても良い。
(E) Other Embodiments In each of the above embodiments, mod GI is applied. However, the number of times that the inclination direction of the signal waveform changes also in the GI before correction (see Equation (4) in Patent Document 2). Therefore, the GI may be applied instead of the modGI in each of the above embodiments.

上記各実施形態では、マイクロホン間隔の見直しを常時行うように説明したが、背景雑音の周波数特性は定常的であることが多く、マイクロホン間隔の見直しを一時的又は間欠的に実行するように装置を構成しても良い。例えば、通信端末の電源オン時など、装置の使用開始時にのみマイクロホン間隔の見直しを稼働させ、それ以降は停止させるようにしても良い。   In each of the embodiments described above, the microphone interval is constantly reviewed. However, the frequency characteristics of the background noise are often steady, and the apparatus is arranged so that the microphone interval is reviewed temporarily or intermittently. It may be configured. For example, the review of the microphone interval may be activated only at the start of use of the apparatus, such as when the communication terminal is turned on, and may be stopped thereafter.

マイクロホンを選択する上記第1、第2、第4の実施形態では、マイクロホンの数が3個の場合を示したが、マイクロホン数は3個に限定されないことは勿論である。   In the first, second, and fourth embodiments in which the microphone is selected, the case where the number of microphones is three has been described, but it is needless to say that the number of microphones is not limited to three.

上記各実施形態では、一つの捕捉信号s1から各種制御部へ与えるmodGI値を得るものを示したが、各種の制御部へ与えるmodGI値の取得方法はこれに限定されるものではない。例えば、3種類の捕捉信号s1、s2、s3のそれぞれについてmodGI値を計算し、得られた3つのmodGI値の平均値や中央値などを制御部へ与えるmodGI値とするようにしても良い。   In each of the above embodiments, a method for obtaining a modGI value to be given to various control units from one captured signal s1 has been described. However, a method for obtaining a modGI value to be given to various control units is not limited to this. For example, a modGI value may be calculated for each of the three types of captured signals s1, s2, and s3, and an average value, a median value, and the like of the obtained three modGI values may be used as a modGI value to be given to the control unit.

上記第3の実施形態では、一方のマイクロホンだけ移動可能なものを示したが、両方のマイクロホンが共に移動可能なものであっても良い。   In the third embodiment, one of the microphones is movable. However, both microphones may be movable.

上記では、マイクロホンの選択と、マイクロホンの移動とが択一的な実施形態を説明したが、マイクロホンの選択とマイクロホンの移動とを組み合わせた実施形態を構成するようにしても良い。要は、マイクロホンアレイに入力される2つの捕捉信号を得たマイクロホンの間隔をmodGI値に制御できるものであれば良い。   In the above description, the embodiment in which the selection of the microphone and the movement of the microphone are alternatives has been described. However, an embodiment in which the selection of the microphone and the movement of the microphone are combined may be configured. In short, it is only necessary that the interval between the microphones from which the two captured signals input to the microphone array are obtained can be controlled to the modGI value.

上記各実施形態では、modGI値が新しい範囲に属すると直ちに制御信号を切り換えるものを示したが、modGI値が新しい範囲に属することが所定回数連続したときに初めて制御信号を切り換えるようにしても良い。   In each of the above embodiments, the control signal is switched immediately when the modGI value belongs to the new range. However, the control signal may be switched only when the modGI value belongs to the new range for a predetermined number of times. .

マイクロホンアレイ処理部の中には、遅延部を内部に有するものがある(特許文献1の図4参照)。第2の実施形態における付与遅延選択部14内の遅延部として、マイクロホンアレイ処理部内の遅延部を流用するようにしても良い。   Some microphone array processing units have a delay unit therein (see FIG. 4 of Patent Document 1). The delay unit in the microphone array processing unit may be used as the delay unit in the added delay selection unit 14 in the second embodiment.

上記では音声信号が目的音のように説明したが、機械音などの音響信号が目的音の場合にも、本発明の技術思想を適用することができる。   In the above description, the audio signal is described as the target sound. However, the technical idea of the present invention can be applied to the case where the acoustic signal such as a mechanical sound is the target sound.

上記各実施形態では、マイクロホンアレイからの捕捉信号を直ちに処理する装置やプログラムを示したが、マイクロホンアレイからの捕捉信号を記録媒体に記録し、それを再生する場合にも、本発明を適用することができる。   In each of the above embodiments, an apparatus or a program for immediately processing a captured signal from the microphone array has been described. However, the present invention is also applied to a case where the captured signal from the microphone array is recorded on a recording medium and reproduced. be able to.

m1〜m3、mf、mm、…マイクロホン、10、10A、10B、10C…マイクロホン間隔制御装置、11、11C…modGI計算部、12…マイクロホン選択制御部、12A…マイクロホン選択・遅延制御部、12B…マイクロホン移動制御部、13…マイクロホン選択部、14…付与遅延選択部、15…マイクロホン移動機構、16…音声区間検出部、21…modGI取得部、22…modGI照合・選択制御信号生成部、23…modGI/選択制御信号対応記憶部、23A…modGI/選択・遅延制御信号対応記憶部、24…選択制御信号送信部。   m1 to m3, mf, mm,... microphone, 10, 10A, 10B, 10C... microphone interval control device, 11, 11C... modGI calculation unit, 12 .. microphone selection control unit, 12A .. microphone selection / delay control unit, 12B. Microphone movement control unit, 13 ... microphone selection unit, 14 ... grant delay selection unit, 15 ... microphone movement mechanism, 16 ... voice interval detection unit, 21 ... modGI acquisition unit, 22 ... modGI collation / selection control signal generation unit, 23 ... modGI / selection control signal correspondence storage unit, 23A... modGI / selection / delay control signal correspondence storage unit, 24... selection control signal transmission unit.

Claims (6)

複数のマイクロホンによる捕捉信号のうちの少なくとも1つの捕捉信号に基づき、マイクロホンの捕捉信号における、信号波形の傾き方向が変化する回数とその大きさを表し、かつ高域成分の含まれ具合を反映した特徴量を算出する特徴量算出手段と、
算出された上記特徴量に応じて、次段装置に出力する2つの捕捉信号を出力したマイクロホン間のマイクロホン間隔を調整するマイクロホン間隔最適化手段と
を有することを特徴とするマイクロホン間隔制御装置。
Based on at least one of the signals captured by a plurality of microphones, it represents the number and magnitude of changes in the direction of the signal waveform slope in the captured signal of the microphone, and reflected the inclusion of high-frequency components. A feature amount calculating means for calculating a feature amount;
A microphone interval control device, comprising: a microphone interval optimizing unit that adjusts a microphone interval between microphones that output two captured signals to be output to the next-stage device according to the calculated feature amount.
上記マイクロホン間隔最適化手段は、固定的に設置された3つ以上のマイクロホンから得た捕捉信号の中から、算出された上記特徴量に応じて2つのマイクロホンからの捕捉信号を選択させて、上記マイクロホン間隔を仮想的に変更させることを特徴とする請求項1に記載のマイクロホン間隔制御装置。   The microphone interval optimizing means selects capture signals from two microphones according to the calculated feature amount from capture signals obtained from three or more microphones fixedly installed, and The microphone interval control apparatus according to claim 1, wherein the microphone interval is virtually changed. 上記マイクロホン間隔最適化手段は、移動可能な少なくとも一つのマイクロホンを、算出された上記特徴量に応じた位置に移動させて、上記マイクロホン間隔を変更させることを特徴とする請求項1に記載のマイクロホン間隔制御装置。   2. The microphone according to claim 1, wherein the microphone interval optimization unit changes the microphone interval by moving at least one movable microphone to a position corresponding to the calculated feature amount. Interval control device. 上記特徴量算出手段は、
上記捕捉信号における目的音区間を検出する目的音区間検出部と、
上記目的音区間検出部の検出結果が、目的音区間でない場合にだけ特徴量の算出をし直す特徴量算出本体と
を有することを特徴とする請求項1〜3のいずれかに記載のマイクロホン間隔制御装置。
The feature amount calculating means includes:
A target sound section detector for detecting a target sound section in the captured signal;
The microphone interval according to any one of claims 1 to 3, further comprising: a feature amount calculation main body that recalculates the feature amount only when the detection result of the target sound interval detection unit is not the target sound interval. Control device.
上記係数特徴量算出手段は、上記捕捉信号の2階差分のパワーを、上記捕捉信号のパワーで正規化した値を特徴量として算出することを特徴とする請求項1〜4のいずれかに記載の目的音成分検出装置。   5. The coefficient feature quantity calculating means calculates a value obtained by normalizing the power of the second-order difference of the capture signal with the power of the capture signal as a feature quantity. Target sound component detection device. コンピュータを、
複数のマイクロホンによる捕捉信号のうちの少なくとも1つの捕捉信号に基づき、マイクロホンの捕捉信号における、信号波形の傾き方向が変化する回数とその大きさを表し、かつ高域成分の含まれ具合を反映した特徴量を算出する特徴量算出手段と、
算出された上記特徴量に応じて、次段装置に出力する2つの捕捉信号を出力したマイクロホン間のマイクロホン間隔を調整するマイクロホン間隔最適化手段と
して機能させることを特徴とするマイクロホン間隔制御プログラム。
Computer
Based on at least one of the signals captured by a plurality of microphones, it represents the number and magnitude of changes in the direction of the signal waveform slope in the captured signal of the microphone, and reflected the inclusion of high-frequency components. A feature amount calculating means for calculating a feature amount;
A microphone interval control program that functions as a microphone interval optimizing unit that adjusts a microphone interval between microphones that output two captured signals to be output to the next stage device in accordance with the calculated feature amount. .
JP2015024526A 2015-02-10 2015-02-10 Microphone interval control device and program Active JP6481397B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015024526A JP6481397B2 (en) 2015-02-10 2015-02-10 Microphone interval control device and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015024526A JP6481397B2 (en) 2015-02-10 2015-02-10 Microphone interval control device and program

Publications (2)

Publication Number Publication Date
JP2016149612A true JP2016149612A (en) 2016-08-18
JP6481397B2 JP6481397B2 (en) 2019-03-13

Family

ID=56691826

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015024526A Active JP6481397B2 (en) 2015-02-10 2015-02-10 Microphone interval control device and program

Country Status (1)

Country Link
JP (1) JP6481397B2 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110675887A (en) * 2019-09-12 2020-01-10 厦门亿联网络技术股份有限公司 Multi-microphone switching method and system for conference system
WO2020241050A1 (en) * 2019-05-28 2020-12-03 ソニー株式会社 Audio processing device, audio processing method and program

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000069583A (en) * 1998-08-25 2000-03-03 Fujitsu Ten Ltd Voice inputting device
JP2000134688A (en) * 1998-10-28 2000-05-12 Fujitsu Ltd Microphone array device
JP2007013400A (en) * 2005-06-29 2007-01-18 Yamaha Corp Sound collection device
JP2013078118A (en) * 2011-09-15 2013-04-25 Jvc Kenwood Corp Noise reduction device, audio input device, radio communication device, and noise reduction method
JP2014052242A (en) * 2012-09-06 2014-03-20 Ihi Corp Wave receiving array apparatus
JP2014106337A (en) * 2012-11-27 2014-06-09 Oki Electric Ind Co Ltd Voice band extension device and program and voice featured value calculation device and program
JP2014187685A (en) * 2013-01-24 2014-10-02 Nippon Telegr & Teleph Corp <Ntt> Sound pickup device

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000069583A (en) * 1998-08-25 2000-03-03 Fujitsu Ten Ltd Voice inputting device
JP2000134688A (en) * 1998-10-28 2000-05-12 Fujitsu Ltd Microphone array device
JP2007013400A (en) * 2005-06-29 2007-01-18 Yamaha Corp Sound collection device
JP2013078118A (en) * 2011-09-15 2013-04-25 Jvc Kenwood Corp Noise reduction device, audio input device, radio communication device, and noise reduction method
JP2014052242A (en) * 2012-09-06 2014-03-20 Ihi Corp Wave receiving array apparatus
JP2014106337A (en) * 2012-11-27 2014-06-09 Oki Electric Ind Co Ltd Voice band extension device and program and voice featured value calculation device and program
JP2014187685A (en) * 2013-01-24 2014-10-02 Nippon Telegr & Teleph Corp <Ntt> Sound pickup device

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020241050A1 (en) * 2019-05-28 2020-12-03 ソニー株式会社 Audio processing device, audio processing method and program
CN110675887A (en) * 2019-09-12 2020-01-10 厦门亿联网络技术股份有限公司 Multi-microphone switching method and system for conference system

Also Published As

Publication number Publication date
JP6481397B2 (en) 2019-03-13

Similar Documents

Publication Publication Date Title
US10249299B1 (en) Tailoring beamforming techniques to environments
RU2596592C2 (en) Spatial audio processor and method of providing spatial parameters based on acoustic input signal
KR101210313B1 (en) System and method for utilizing inter?microphone level differences for speech enhancement
JP5528538B2 (en) Noise suppressor
JP3940662B2 (en) Acoustic signal processing method, acoustic signal processing apparatus, and speech recognition apparatus
US8238569B2 (en) Method, medium, and apparatus for extracting target sound from mixed sound
KR101456866B1 (en) Method and apparatus for extracting the target sound signal from the mixed sound
US7587055B2 (en) Sound collection system
JP5543023B2 (en) Object sound enhancement device and car navigation system
JP2014045507A (en) Improving sound quality by intelligently selecting among signals from plural microphones
KR20080111290A (en) System and method of estimating voice performance for recognizing remote voice
JP2010187363A (en) Acoustic signal processing apparatus and reproducing device
JP2009288215A (en) Acoustic processing device and method therefor
CN107863099A (en) A kind of new dual microphone speech detection and Enhancement Method
KR102191736B1 (en) Method and apparatus for speech enhancement with artificial neural network
JP4724054B2 (en) Specific direction sound collection device, specific direction sound collection program, recording medium
JP2011007861A (en) Signal processing apparatus, signal processing method and signal processing program
RU2411595C2 (en) Improved intelligibility of speech in mobile communication device by control of vibrator operation depending on background noise
JP2007215163A (en) Sound source separation apparatus, program for sound source separation apparatus and sound source separation method
JP4448464B2 (en) Noise reduction method, apparatus, program, and recording medium
JP2016042613A (en) Target speech section detector, target speech section detection method, target speech section detection program, audio signal processing device and server
KR20090037845A (en) Method and apparatus for extracting the target sound signal from the mixed sound
JP4928382B2 (en) Specific direction sound collection device, specific direction sound collection method, specific direction sound collection program, recording medium
JP6481397B2 (en) Microphone interval control device and program
CN113160846A (en) Noise suppression method and electronic device

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20171120

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20181024

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20181030

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20181226

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190115

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190128

R150 Certificate of patent or registration of utility model

Ref document number: 6481397

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150