JP2020120261A - Sound pickup device, sound pickup program, and sound pickup method - Google Patents
Sound pickup device, sound pickup program, and sound pickup method Download PDFInfo
- Publication number
- JP2020120261A JP2020120261A JP2019009597A JP2019009597A JP2020120261A JP 2020120261 A JP2020120261 A JP 2020120261A JP 2019009597 A JP2019009597 A JP 2019009597A JP 2019009597 A JP2019009597 A JP 2019009597A JP 2020120261 A JP2020120261 A JP 2020120261A
- Authority
- JP
- Japan
- Prior art keywords
- sound
- target area
- area sound
- microphone
- microphones
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
Description
本発明は、収音装置、収音プログラム及び収音方法に関し、例えば、特定のエリアの音を強調し、それ以外のエリアの音を抑制する収音装置及びプログラムに適用し得る。 The present invention relates to a sound collecting device, a sound collecting program, and a sound collecting method, and can be applied to, for example, a sound collecting device and a program that emphasize sounds in a specific area and suppress sounds in other areas.
雑音環境下で音声通信システムや音声認識応用システムを利用する場合、必要な目的音声と同時に混入する周囲の雑音は、良好なコミュニケーションを阻害し、音声認識率の低下をもたらす厄介な存在である。従来、このような複数の音源が存在する環境下において、特定の方向の音のみ分離・収音することで不要音の混入を避け必要な目的音を得る技術として、マイクアレイを用いたビームフォーマ(Beam Former;以下「BF」と呼ぶ;特許文献2参照)がある。BFとは各マイクロホンに到達する信号の時間差を利用して指向性を形成する技術である。 When a voice communication system or a voice recognition application system is used in a noisy environment, ambient noise mixed with the required target voice interferes with good communication and is a troublesome presence that lowers the voice recognition rate. Conventionally, in such an environment where multiple sound sources exist, a beamformer using a microphone array has been used as a technique for obtaining a desired target sound by separating and collecting only sound in a specific direction to avoid mixing of unnecessary sound. (Beam Former; hereinafter referred to as “BF”; see Patent Document 2). BF is a technique for forming directivity by utilizing the time difference between signals reaching each microphone.
図5は、従来において、マイクロホン数が2個の場合の減算型BFに係る構成を示すブロック図である。 FIG. 5 is a block diagram showing a configuration related to a subtraction type BF when the number of microphones is two in the related art.
ここでは、図5に示すように、θL方向から到来する音を距離dだけ離れて設置された2つのマイクロホンM1、M2で受音することを考える。θL方向から到来した音波は、まず音源に近い右のマイクロホンM1に受音される。次に、θL方向から到来した音波は距離lだけ進んで左のマイクロホンM2に到達する。したがって、マイクロホンM2での受音信号x2(t)はマイクロホンM1での受音信号x1(t)と比べて音波が距離lだけ進行するのに要する時間τLだけ遅れた信号となっている。すなわち、図5に示す構成では、以下の(1)式、(2)式の関係が成立する。なお、(1)式以下では音速を「c」と表す。
τL=(dsinθL)/c …(1)
x2(t)=x1(t−τL) …(2)
Here, as shown in FIG. 5, it is considered that the sound coming from the θ L direction is received by the two microphones M1 and M2 which are installed at a distance d. The sound wave coming from the θ L direction is first received by the right microphone M1 close to the sound source. Next, the sound wave arriving from the θ L direction travels the
τ L =(dsin θ L )/c (1)
x 2 (t) = x 1 (t-τ L) ... (2)
したがって、図5に示す構成では、遅延器21を用いてx1(t)にτLなる遅延を与え、x2(t)に加算することで、θL方向の音が強調された信号a(t)が取得できる((3)式参照)。また、図5に示す構成では、逆に、x1(t)にτLなる遅延を与え、x2(t)を減算することで信号同土が相殺され、θL方向に死角が形成された信号b(t)が取得できる((4)式参照)。
a(t)=x2(t)+x1(t−τL) …(3)
b(t)=x2(t)−x1(t−τL) …(4)
Therefore, in the configuration shown in FIG. 5, the
a (t) = x 2 ( t) + x 1 (t-τ L) ... (3)
b (t) = x 2 ( t) -x 1 (t-τ L) ... (4)
そして、(3)式、(4)式の加算・減算処理は、周波数領域でも同様に行うことができ、その場合、(3)式、(4)式はそれぞれ、以下の(5)式、(6)式に変更される。
ところで、BFは加算型と減算型の大きく2つの種類に分けられる。特に減算型BFは、加算型BFに比べ、少ないマイクロホン数で指向性を形成できるという利点がある。減算型BFの代表的な手法として、スペクトル減算法(Spectral Subtraction;以下単に「SS」とも呼ぶ)を用いたBFが挙げられる(非特許文献1参照)。 By the way, BFs are roughly classified into two types: addition type and subtraction type. In particular, the subtraction type BF has an advantage that directivity can be formed with a smaller number of microphones than the addition type BF. As a typical method of the subtraction type BF, there is a BF using a spectral subtraction method (Spectral Subtraction; hereinafter also simply referred to as “SS”) (see Non-Patent Document 1).
図6は、従来のSSに係る構成を示すブロック図である。 FIG. 6 is a block diagram showing a configuration related to the conventional SS.
図6に示す構成では、音響信号を周波数領域で処理を行なうものとして説明する。図6に示す構成では、時間周波数変換器31で周波数変換された入力信号を用いるものとする。 In the configuration shown in FIG. 6, it is assumed that the acoustic signal is processed in the frequency domain. In the configuration shown in FIG. 6, the input signal frequency-converted by the time-frequency converter 31 is used.
図6に示す構成では、まず遅延器32が目的方向θLからマイクロホンM1及びマイクロホンM2に到来する信号の時間差τLを算出し、遅延を加えることにより目的音源方向の音信号の位相を合わせる。ここで、目的音源がマイクロホンM1とマイクロホンM2の中心に対してマイクロホンM1の方向に存在する場合、遅延器32は、マイクロホンM1の入力に対し遅延処理を行うものとする。その後、加算器33が(5)式に従い加算処理を行い、減算器34が式(6)式に従い減算処理を行う。これにより、加算処理により目的音源方向の音が強調され、また減算処理により目的音源方向以外の音が抽出される。さらに、加算処理及び減算処理されたデータを用いてスペクトル減算器35が(7)式に従い処理を行うことにより、目的音源方向の音を強調し、それ以外の音を抑圧することができる。なお、(7)式において、「β」はSSの強度を変更するための係数である。
Y(ω)=A(ω)−βB(ω) …(7)
In the configuration shown in FIG. 6, the
Y(ω)=A(ω)−βB(ω) (7)
しかし、BFだけでは収音を目的とするエリア(以下、「目的エリア」と呼ぶ)の周囲に他の音源が存在する場合、目的エリア内に存在する音(以下、「目的エリア音」と呼ぶ)だけを収音することが難しい。そのため、従来、特許文献1等により、複数のマイクロホンアレイを用いて目的エリアを収音するエリア収音方式が提案されている。
However, if another sound source exists around an area whose sound is to be collected (hereinafter, referred to as “target area”) only with BF, a sound existing in the target area (hereinafter, referred to as “target area sound”). ) It is difficult to pick up only. Therefore, conventionally,
図7は、従来技術において、2つのマイクロホンアレイMA1、MA2を用いて、目的エリアの音源からの目的エリア音を収音する処理について示した説明図である。 FIG. 7 is an explanatory diagram showing a process of collecting a target area sound from a sound source of the target area using the two microphone arrays MA1 and MA2 in the conventional technique.
図7(a)は、各マイクロホンアレイの構成例について示した説明図である。図7(b)、図7(c)は、それぞれ図7(a)に示すマイクロホンアレイMA1、MA2のBF出力について周波数領域で示したグラフ(イメージ図)である。 FIG. 7A is an explanatory diagram showing a configuration example of each microphone array. FIGS. 7B and 7C are graphs (image diagrams) showing the BF outputs of the microphone arrays MA1 and MA2 shown in FIG. 7A in the frequency domain.
従来のエリア収音では、図7(a)に示すように、マイクロホンアレイMA1、MA2の指向性を別々の方向から収音したいエリア(目的エリア)で交差させて収音する。図7(a)の状態では、各マイクロホンアレイMA1、MA2の指向性に目的エリア内に存在する音(目的エリア音)だけでなく、目的エリア方向の雑音(非目的エリア音)も含まれている。しかし、図7(b)、図7(c)に示すように、マイクロホンアレイMA1、MA2の指向性を周波数領域で比較すると、目的エリア音成分はどちらの出力にも含まれるが、非目的エリア音成分は各マイクロホンアレイで異なることになる。 In the conventional area sound collection, as shown in FIG. 7A, the directivity of the microphone arrays MA1 and MA2 is crossed and collected from different directions in the desired area (target area). In the state of FIG. 7A, the directivity of each of the microphone arrays MA1 and MA2 includes not only the sound existing in the target area (target area sound) but also noise in the target area direction (non-target area sound). There is. However, as shown in FIGS. 7B and 7C, when comparing the directivities of the microphone arrays MA1 and MA2 in the frequency domain, the target area sound component is included in both outputs, but the non-target area is included. The sound component will be different for each microphone array.
従来のエリア収音技術では、このような特性を利用し、2つのマイクロホンアレイMA1、MA2のBF出力に、共通に含まれる成分以外を抑圧することで目的エリア音のみ抽出することができる。 In the conventional area sound collecting technique, by utilizing such a characteristic, only the target area sound can be extracted by suppressing components other than the components commonly included in the BF outputs of the two microphone arrays MA1 and MA2.
ところで、エリア収音方式では、異なる位置から目的エリア方向に指向性を形成するためBFの原理に基づくマイクロホンアレイの処理が必要である。目的音方向にピンポイントで指向性を向けるためには鋭い指向性の形成が求められる。これを加算型BFで実現しようとすれば多数のマイクロホンが必要で現実的ではない。そのため従来のエリア収音では、減算型BFとSSを組み合わせた処理(以下、「減算型BF+SS処理」又は単に「BF+SS処理」と呼ぶ)を用い、少ないマイクロホンで鋭利な指向性を形成している。 By the way, in the area sound collecting method, it is necessary to process the microphone array based on the BF principle in order to form directivity from different positions toward the target area. In order to pinpoint the directivity in the direction of the target sound, it is necessary to form a sharp directivity. If this is to be realized by the addition type BF, a large number of microphones are required, which is not realistic. Therefore, in the conventional area sound pickup, a process in which the subtraction type BF and the SS are combined (hereinafter referred to as “subtraction type BF+SS process” or simply “BF+SS process”) is used to form sharp directivity with a small number of microphones. ..
しかし、SS自体非線形処理であるため処理歪やミュージカルノイズの発生が避けられない。また、マイクアレイのマイク間隔によって、得意とする周波数領域が大きく異なる。 However, since SS itself is a non-linear process, processing distortion and occurrence of musical noise cannot be avoided. In addition, the frequency range in which the user is good differs greatly depending on the distance between the microphones of the microphone array.
図8に、正面方向に死角を向けた減算型BFのポーラパターンを示す。 FIG. 8 shows a polar pattern of the subtraction type BF in which the blind spot is directed in the front direction.
図8では、マイクロホンM1、M2の間隔は3cmであるものとする。この場合、当該減算型BFでは、1kHzから4kHzは概ね良好な特性を示すが、500Hz以下の低周波数域はほとんど利得が取れない。また、この場合、当該減算型BFでは、8kHz以上では少しずつ指向特性の変形が始まり、さらに高い周波数になると空間エイリアジングによって正面方向以外の方向に死角が生じるようになる。そのため、当該減算型BFにおいて、低周波数域の特性を改善するためにはマイク間隔をより大きく取る必要があり、逆に高周波数領域を改善するにはマイク間隔を狭める必要がある。このことから、従来の減算型BF+SS処理では、音声情報伝達の目的に合わせた妥協点として3cm前後のマイク間隔を採用する場合が多い。ただし、その場合でも、低周波数域の利得を稼ぐため低域ブーストなどの処置が取られる。この場合、低周波数域成分は増すが副作用として歪の増大を招く。したがって、従来のエリア収音方式は、特定のエリアの音だけを収音可能な方式として注目されているが、強調された目的音にはある程度の歪の混入が避けられない、低周波数領域の情報が欠落するなどの問題があった。 In FIG. 8, it is assumed that the distance between the microphones M1 and M2 is 3 cm. In this case, the subtraction type BF shows good characteristics in the range of 1 kHz to 4 kHz, but almost no gain can be obtained in the low frequency range of 500 Hz or lower. Further, in this case, in the subtraction type BF, the directional characteristic gradually begins to be deformed at 8 kHz or higher, and when the frequency becomes higher, a blind spot occurs in a direction other than the front direction due to spatial aliasing. Therefore, in the subtraction type BF, in order to improve the characteristics in the low frequency region, it is necessary to make the microphone interval larger, and conversely, in order to improve the high frequency region, it is necessary to narrow the microphone interval. Therefore, in the conventional subtraction type BF+SS processing, a microphone interval of about 3 cm is often adopted as a compromise point according to the purpose of voice information transmission. However, even in that case, measures such as low-frequency boosting are taken in order to gain low-frequency gain. In this case, low frequency components increase, but as a side effect, distortion increases. Therefore, the conventional area sound collection method has attracted attention as a method capable of collecting only a sound in a specific area, but it is inevitable that a certain amount of distortion is unavoidable in the emphasized target sound. There was a problem such as missing information.
以上のような問題に鑑みて、目的エリア音を収音する際の音質を改善する収音装置、収音プログラム及び収音方法が望まれている。 In view of the above problems, a sound pickup device, a sound pickup program, and a sound pickup method that improve the sound quality when picking up a target area sound are desired.
第1の本発明の収音装置は、(1)複数の指向性マイクロホンが入力される入力信号を、それぞれをスペクトル減算することで、それぞれの前記指向性マイクロホンから見て目的エリア方向に存在する非目的エリア音を抽出する非目的エリア音抽出手段と、(2)前記非目的エリア音を前記入力信号からスペクトル減算することにより目的エリア音を抽出する目的エリア音抽出手段とを有することを特徴とする。 The sound collecting apparatus of the first aspect of the present invention is (1) present in the direction of the target area when viewed from each of the directional microphones by spectrally subtracting the input signals to which the plurality of directional microphones are input. A non-target area sound extraction means for extracting a non-target area sound; and (2) a target area sound extraction means for extracting a target area sound by spectrally subtracting the non-target area sound from the input signal. And
第2の本発明の収音プログラムは、コンピュータを、(1)複数の指向性マイクロホンが入力される入力信号を、それぞれをスペクトル減算することで、それぞれの前記指向性マイクロホンから見て目的エリア方向に存在する非目的エリア音を抽出する非目的エリア音抽出手段と、(2)前記非目的エリア音を前記入力信号からスペクトル減算することにより目的エリア音を抽出する目的エリア音抽出手段として機能させることを特徴とする。 A sound collecting program according to a second aspect of the present invention allows a computer to perform (1) spectral subtraction of input signals to which a plurality of directional microphones are input, so that the direction of the target area is viewed from each of the directional microphones. A non-target area sound extracting means for extracting a non-target area sound existing in (1), and (2) functioning as a target area sound extracting means for extracting a target area sound by spectrally subtracting the non-target area sound from the input signal. It is characterized by
第3の本発明は、収音装置が行う収音方法において、(1)前記収音装置は非目的エリア音抽出手段、及び目的エリア音抽出手段を有し、(2)前記非目的エリア音抽出手段は、複数の指向性マイクロホンが入力される入力信号を、それぞれをスペクトル減算することで、それぞれの前記指向性マイクロホンから見て目的エリア方向に存在する非目的エリア音を抽出し、(3)前記目的エリア音抽出手段は、前記非目的エリア音を前記入力信号からスペクトル減算することにより目的エリア音を抽出することを特徴とする。 A third aspect of the present invention is a sound collecting method performed by a sound collecting device, wherein (1) the sound collecting device has a non-target area sound extracting means and a target area sound extracting means, and (2) the non-target area sound. The extracting means extracts the non-target area sound existing in the target area direction as viewed from each of the directional microphones by spectrally subtracting each of the input signals input to the plurality of directional microphones, (3 ) The target area sound extracting means extracts the target area sound by spectrally subtracting the non-target area sound from the input signal.
本発明によれば、目的エリア音を収音する際の音質を改善する収音装置、収音プログラム及び収音方法を提供することができる。 According to the present invention, it is possible to provide a sound collecting device, a sound collecting program, and a sound collecting method that improve sound quality when collecting a target area sound.
(A)主たる実施形態
以下、本発明による収音装置、収音プログラム及び収音方法の一実施形態を、図面を参照しながら詳述する。
(A) Main Embodiment Hereinafter, one embodiment of a sound collecting device, a sound collecting program, and a sound collecting method according to the present invention will be described in detail with reference to the drawings.
まず、この実施形態における収音装置の構成概要について説明する。 First, the outline of the configuration of the sound collecting device in this embodiment will be described.
エリア収音を実現するためには、目的とするエリアに向けて異なる位置から指向性を向ける必要がある。この実施形態の収音装置では、複数のマイクアレイに代えて指向性マイクロホンを用いたエリア収音を行うものとする。 In order to realize the area sound collection, it is necessary to direct the directivity from different positions toward the target area. In the sound collecting device of this embodiment, it is assumed that directional microphones are used in place of a plurality of microphone arrays to perform area sound collection.
従来、指向性マイクロホンには、単一指向性マイクロホンや、双極性マイクロホンや、超指向性マイクロホン等がある。 Conventionally, directional microphones include unidirectional microphones, bipolar microphones, superdirectional microphones, and the like.
単一指向性マイクロホンは、指向性と称しても背面の音をとらないだけで前方の音はすべてとる。そのため、単一指向性マイクロホンは、エリア収音のマイクロホンとしては用を成さない。また、双極性マイクロホンも横方向からの音をとらないだけなので単一指向性と同様に、エリア収音処理には不適である。超指向性マイクロホンと呼ばれるものは、その他のマイクロホンに比べ前方への鋭い指向性を有し、エリア収音への適用可能性がある。 A unidirectional microphone, even if it is called directional, does not take the sound of the back surface but takes all the sound in the front. Therefore, the unidirectional microphone cannot be used as an area pickup microphone. Further, since the bipolar microphone also does not pick up sounds from the lateral direction, it is not suitable for area sound collection processing as in the case of unidirectionality. The so-called super-directional microphone has sharp directivity to the front compared to other microphones and may be applicable to area sound collection.
超指向性マイクロホンには、構造的に干渉管を使う干渉管型と、マイクロホンユニットを2つ使う二次音圧傾度型がある。いずれの構造も超指向性マイクロホンとして一般的に使われているが、二次音圧傾度型マイクロホンは、減算型BFを信号処理ではなく電気的に行なっているものに過ぎず、原理的にエリア収音処理における周波数特性などの課題は解決されない。一方、干渉管型マイクロホンは、側面にスリットを刻んだ長めの筒を専用マイクロホンユニットの先端に取り付けて、「音響的」に指向性を狭角にしているものである。そのため、干渉管型マイクロホンをエリア収音処理に用いた場合、減算型BF+SS処理のような歪はほとんどなく、周波数特性も低域から高域まで可聴域ほぼ全域をカバーすることができる。 Superdirective microphones include an interference tube type that structurally uses an interference tube and a secondary sound pressure gradient type that uses two microphone units. Both structures are generally used as super-directional microphones, but the secondary sound pressure gradient type microphones are only those that perform subtractive BF electrically instead of signal processing, and in principle Problems such as frequency characteristics in sound collection processing cannot be solved. On the other hand, the interference tube type microphone has a long cylinder with slits on the side surface attached to the tip of a dedicated microphone unit to "acoustically" narrow the directivity. Therefore, when the interference tube type microphone is used for the area sound collection processing, there is almost no distortion as in the subtraction type BF+SS processing, and the frequency characteristic can cover almost the entire audible range from the low range to the high range.
そこで、この実施形態の収音装置では、複数の干渉管型の超指向性マイクロホンの出力を用いてエリア収音処理を行う構成とする。以下に、本発明の収音装置の具体的な構成の例について説明する。 Therefore, the sound collecting device of this embodiment is configured to perform the area sound collecting process by using the outputs of a plurality of interference tube type super-directional microphones. Hereinafter, an example of a specific configuration of the sound pickup device of the present invention will be described.
(A−1)実施形態の構成
図1は、本発明の第1の実施形態に係る収音装置の構成を示すブロック図である。
(A-1) Configuration of Embodiment FIG. 1 is a block diagram showing a configuration of a sound collecting device according to a first embodiment of the present invention.
図1は、この実施形態に係る各装置の接続構成及び収音装置10の機能的構成について示したブロック図である。
FIG. 1 is a block diagram showing a connection configuration of each device and a functional configuration of a
収音装置10は、2つの超指向性マイクロホンM(M1、M2)で捕捉した音響信号に基づいて、目的エリアを音源とする目的エリア音を収音して出力する装置である。以下では、収音装置10が出力する信号を出力信号Zと呼ぶものとする。
The
図2は、超指向性マイクロホンM1、M2の構成例について示した図(斜視図)である。 FIG. 2 is a diagram (perspective view) showing a configuration example of superdirective microphones M1 and M2.
図2に示すように、この実施形態の超指向性マイクロホンM1、M2には、側面に複数のスリットMSが形成された管を用いて構成される干渉管型の構造となっている。図2では、超指向性マイクロホンM1、M2の指向性MDの向き(方向)を点線の矢印で図示している。超指向性マイクロホンM1、M2は、干渉管型の構成であれば、具体的な形状(例えば、管やスリットの具体的形状)については図2の構成に限定されないものである。 As shown in FIG. 2, the super-directional microphones M1 and M2 of this embodiment have an interference tube type structure configured by using tubes having a plurality of slits MS formed on the side surfaces. In FIG. 2, the directions (directions) of the directional MDs of the super-directional microphones M1 and M2 are indicated by dotted arrows. Superdirective microphones M1 and M2 are not limited to the specific configurations (for example, specific configurations of tubes and slits) shown in FIG. 2 as long as they have an interference tube type configuration.
図3は、この実施形態における超指向性マイクロホンM1、M2の配置構成の例について示した説明図である。 FIG. 3 is an explanatory diagram showing an example of the arrangement configuration of the super-directional microphones M1 and M2 in this embodiment.
図3に示すように、超指向性マイクロホンM1、M2は、目的エリアが存在する空間の任意の場所に配置される。図3では、超指向性マイクロホンM1の指向性を点線で図示し、超指向性マイクロホンM2の指向性を一点鎖線で図示している。 As shown in FIG. 3, superdirective microphones M1 and M2 are arranged at arbitrary places in the space where the target area exists. In FIG. 3, the directivity of superdirective microphone M1 is shown by a dotted line, and the directivity of superdirective microphone M2 is shown by a dashed line.
図3に示すように、超指向性マイクロホンM1、M2は、各超指向性マイクロホンの指向性が目的エリアでのみ重なるような位置及び向き(指向性の方向)で配置されていれば良い。例えば、超指向性マイクロホンM1、M2は、目的エリアを挟んで対向に配置しても良い。また、超指向性マイクロホンの数は2つに限定するものではなく、目的エリアが複数存在する場合、全てのエリアをカバーできる数のマイクロホンを配置するようにしてもよい。 As shown in FIG. 3, superdirective microphones M1 and M2 may be arranged at positions and orientations (directivity directions) such that the directivity of each superdirective microphone overlaps only in the target area. For example, superdirective microphones M1 and M2 may be arranged opposite to each other with the target area in between. Further, the number of super-directional microphones is not limited to two, and when there are a plurality of target areas, a sufficient number of microphones may be arranged to cover all areas.
次に、図1を用いて収音装置10の内部構成について説明する。
Next, the internal configuration of the
収音装置10は、信号入力部101、周波数変換部102、振幅補正係数算出部103、及び目的エリア音抽出部104を有している。収音装置10を構成する各要素の詳細については後述する。
The
次に、図4を用いて、収音装置10のハードウェア構成について説明する。
Next, the hardware configuration of the
収音装置10は、全てハードウェア(例えば、専用チップ等)により構成するようにしてもよいし一部又は全部についてソフトウェア(プログラム)として構成するようにしてもよい。収音装置10は、例えば、プロセッサ及びメモリを有するコンピュータにプログラム(実施形態の収音プログラムを含む)をインストールすることにより構成するようにしてもよい。
The
図4は、収音装置10のハードウェア構成の例について示したブロック図である。
FIG. 4 is a block diagram showing an example of the hardware configuration of the
図4では、収音装置10を、ソフトウェア(コンピュータ)を用いて構成する際のハードウェア構成の例について示している。
FIG. 4 shows an example of a hardware configuration when the
図4に示す収音装置10は、ハードウェア的な構成要素として、プログラム(実施形態の収音プログラムを含む)がインストールされたコンピュータ200を有している。なお、コンピュータ200に、アナログ信号(超指向性マイクロホンM1、M2から供給される信号)をデジタル信号に変換する変換手段が搭載されていない場合、収音装置10に別途図示しない変換手段を搭載するようにしてもよい。また、コンピュータ200は、収音プログラム専用のコンピュータとしてもよいし、他の機能のプログラムと共用される構成としてもよい。
The
図4に示すコンピュータ200は、プロセッサ201、一次記憶部202、及び二次記憶部203を有している。一次記憶部202は、プロセッサ201の作業用メモリ(ワークメモリ)として機能する記憶手段であり、例えば、DRAM(Dynamic Random Access Memory)等の高速動作するメモリを適用することができる。二次記憶部203は、OS(Operating System)やプログラムデータ(実施形態に係る収音プログラムのデータを含む)等の種々のデータを記録する記憶手段であり、例えば、FLASHメモリやHDD等の不揮発性メモリを適用することができる。この実施形態のコンピュータ200では、プロセッサ201が起動する際、二次記憶部203に記録されたOSやプログラム(実施形態に係る収音プログラムを含む)を読み込み、一次記憶部202上に展開して実行する。
The
なお、コンピュータ200の具体的な構成は図4の構成に限定されないものであり、種々の構成を適用することができる。例えば、一次記憶部202が不揮発メモリ(例えば、FLASHメモリ等)であれば、二次記憶部203については除外した構成としてもよい。
The specific configuration of the
(A−2)実施形態の動作
次に、以上のような構成を有するこの実施形態における収音装置10の動作を説明する。
(A-2) Operation of Embodiment Next, the operation of the
信号入力部101は、超指向性マイクロホンM1、M2で収音した音響信号を、それぞれアナログ信号からデジタル信号y1、y2に変換する。
The
周波数変換部102は、入力信号y1、y2を、それぞれ時間領域から周波数領域の信号Y1(n)、Y2(n)に変換する。周波数変換部102は、例えば、高速フーリエ変換(FFT:Fast Fourier Transform)を用いて、時間領域の信号y1、y2を周波数領域の信号Y1(n)、Y2(n)に変換する。
The
ある特定のエリア内に存在する音(目的エリア音)だけを収音したい場合、マイクロホンの指向性を向けるだけでは、そのエリアと同一方向の線上に存在する音源(非目的エリア音)も収音してしまう。そこで、この実施形態の収音装置10では、特許文献2で提案されている、「複数のマイクロホンアレイを用い、それぞれ別々の方向から目的エリアへ指向性を向け、指向性を目的エリアで交差させることで目的エリア音を収音する(エリア収音処理)手法」を用いるものとする。ただし、この実施形態で用いられる干渉型の超指向性マイクロホンM1、M2はそれ自体が鋭い指向性を有しているため、この実施形態の収音装置10では、エリア収音処理の過程で、特許文献2におけるBFとSSによって目的音方向に指向性を形成する処理は必要としない。
If you want to pick up only the sound that exists in a certain area (target area sound), you can also pick up the sound source (non-target area sound) that exists on the line in the same direction as that area simply by pointing the microphone directivity. Resulting in. Therefore, in the
エリア収音処理によって目的音を抽出するためには、指向性入力信号Y1(n)、Y2(n)の夫々に含まれる目的音エリア音成分のパワーが同じになっている必要がある。そこで、振幅補正係数算出部103では、超指向性マイクロホンM1、M2と目的エリアとの距離の違いによって生じる目的エリア音成分の大きさの差異を補正する振幅補正係数を算出する。振幅補正係数算出部103における補正係数の算出方法は、種々考えられるが、ここでは周波数毎に振幅スペクトルの比率を算出し、その最頻値を補正係数とする(以下の(8)式、(9)式参照)。
目的エリア音抽出部104は、超指向性マイクロホンM1、M2の各時間周波数変換データY1(n)、Y2(n)を(10)式若しくは(11)式に従いSSし、目的エリア方向に存在する非目的エリア音N1(n)、N2(n)を抽出する。
N1(n)=Y1(n)−α2(n)Y2(n) …(10)
N2(n)=Y2(n)−α1(n)Y1(n) …(11)
The target area
N 1 (n)=Y 1 (n)-α 2 (n)Y 2 (n) (10)
N 2 (n)=Y 2 (n)-α 1 (n)Y 1 (n) (11)
その後、目的エリア音抽出部104は、以下の(12)式、(13)式に従い、各BF出力から非目的エリア音をSSして目的エリア音を抽出する。以下の(12)式、(13)式において、γ1(n)、γ2(n)はSS時の強度を変更するための係数である。
Z1(n)=Y1(n)−γ1(n)N1(n) …(12)
Z2(n)=Y2(n)−γ2(n)N2(n) …(13)
After that, the target area
Z 1 (n)=Y 1 (n)−γ 1 (n)N 1 (n) (12)
Z 2 (n)=Y 2 (n)−γ 2 (n)N 2 (n) (13)
(A−3)実施形態の効果
この実施形態によれば、以下のような効果を奏することができる。
(A-3) Effects of the Embodiment According to this embodiment, the following effects can be achieved.
この実施形態の収音装置10では、マイクロホンアレイを用いる代わりに干渉管型の超指向性マイクロホンを用いている。
In the
これにより、この実施形態の収音装置10では、干渉管型超指向性マイクロホンを用いることで、BF+SSによって生じる処理歪、低域周波数特性成分の欠落、高周波数域の制約などが改善され、抽出される目的音の音質が向上する。
Thereby, in the
また、この実施形態の収音装置10では、干渉管型超指向性マイクロホンを用いることで、従来(マイクロホンアレイを用いる場合)より指向性形成のためのBF+SS処理が不要であり、処理構成が大幅に簡素化することができる。
Further, in the
(B)他の実施形態
本発明は、上記の各実施形態に限定されるものではなく、以下に例示するような変形実施形態も挙げることができる。
(B) Other Embodiments The present invention is not limited to each of the above-described embodiments, but may include modified embodiments as exemplified below.
(B−1)上記の実施形態では、収音装置10の外部に、超指向性マイクロホンM1、M2が接続された構成として説明したが、収音装置10自体に超指向性マイクロホンM1、M2を搭載した構成としてもよい。
(B-1) In the above-described embodiment, the super-directional microphones M1 and M2 are connected to the outside of the
10…収音装置、101…信号入力部、102…周波数変換部、103…振幅補正係数算出部、104…目的エリア音抽出部、M1、M2…超指向性マイクロホン。 10... Sound collection device, 101... Signal input part, 102... Frequency conversion part, 103... Amplitude correction coefficient calculation part, 104... Target area sound extraction part, M1, M2... Super directional microphone.
Claims (4)
前記非目的エリア音を前記入力信号からスペクトル減算することにより目的エリア音を抽出する目的エリア音抽出手段と
を有することを特徴とする収音装置。 Non-target area sound extraction means for extracting the non-target area sound existing in the target area direction as viewed from each of the directional microphones by spectrally subtracting the input signals input to the plurality of directional microphones. ,
A target area sound extracting means for extracting a target area sound by spectrally subtracting the non-target area sound from the input signal.
複数の指向性マイクロホンが入力される入力信号を、それぞれをスペクトル減算することで、それぞれの前記指向性マイクロホンから見て目的エリア方向に存在する非目的エリア音を抽出する非目的エリア音抽出手段と、
前記非目的エリア音を前記入力信号からスペクトル減算することにより目的エリア音を抽出する目的エリア音抽出手段と
して機能させることを特徴とする収音プログラム。 Computer,
Non-target area sound extraction means for extracting the non-target area sound existing in the target area direction as viewed from each of the directional microphones by spectrally subtracting the input signals input to the plurality of directional microphones. ,
A sound collection program which functions as a target area sound extraction means for extracting a target area sound by spectrally subtracting the non-target area sound from the input signal.
前記収音装置は非目的エリア音抽出手段、及び目的エリア音抽出手段を有し、
前記非目的エリア音抽出手段は、複数の指向性マイクロホンが入力される入力信号を、それぞれをスペクトル減算することで、それぞれの前記指向性マイクロホンから見て目的エリア方向に存在する非目的エリア音を抽出し、
前記目的エリア音抽出手段は、前記非目的エリア音を前記入力信号からスペクトル減算することにより目的エリア音を抽出する
ことを特徴とする収音方法。 In the sound collecting method performed by the sound collecting device,
The sound collecting device has a non-target area sound extraction means and a target area sound extraction means,
The non-target area sound extraction means performs spectrum subtraction on the input signals to which a plurality of directional microphones are input, so that the non-target area sounds existing in the target area direction when viewed from each of the directional microphones. Extract and
The target area sound extraction means extracts a target area sound by spectrally subtracting the non-target area sound from the input signal.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019009597A JP2020120261A (en) | 2019-01-23 | 2019-01-23 | Sound pickup device, sound pickup program, and sound pickup method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019009597A JP2020120261A (en) | 2019-01-23 | 2019-01-23 | Sound pickup device, sound pickup program, and sound pickup method |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2020120261A true JP2020120261A (en) | 2020-08-06 |
Family
ID=71892239
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019009597A Pending JP2020120261A (en) | 2019-01-23 | 2019-01-23 | Sound pickup device, sound pickup program, and sound pickup method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2020120261A (en) |
-
2019
- 2019-01-23 JP JP2019009597A patent/JP2020120261A/en active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11381906B2 (en) | Conference system with a microphone array system and a method of speech acquisition in a conference system | |
US9549255B2 (en) | Sound pickup apparatus and method for picking up sound | |
KR101782050B1 (en) | Apparatus and method for enhancing audio quality using non-uniform configuration of microphones | |
JP3940662B2 (en) | Acoustic signal processing method, acoustic signal processing apparatus, and speech recognition apparatus | |
JP4066197B2 (en) | Microphone device | |
US9866957B2 (en) | Sound collection apparatus and method | |
JP5772151B2 (en) | Sound source separation apparatus, program and method | |
JP2007336232A (en) | Specific direction sound collection device, specific direction sound collection program, and recording medium | |
JP6763332B2 (en) | Sound collectors, programs and methods | |
JP4928382B2 (en) | Specific direction sound collection device, specific direction sound collection method, specific direction sound collection program, recording medium | |
JP5240026B2 (en) | Device for correcting sensitivity of microphone in microphone array, microphone array system including the device, and program | |
JP2019068133A (en) | Sound pick-up device, program, and method | |
JP6182169B2 (en) | Sound collecting apparatus, method and program thereof | |
JP5635024B2 (en) | Acoustic signal emphasizing device, perspective determination device, method and program thereof | |
JP2020120261A (en) | Sound pickup device, sound pickup program, and sound pickup method | |
JP2016163135A (en) | Sound collection device, program and method | |
JP6241520B1 (en) | Sound collecting apparatus, program and method | |
JP6260666B1 (en) | Sound collecting apparatus, program and method | |
JP5105336B2 (en) | Sound source separation apparatus, program and method | |
JP2001313992A (en) | Sound pickup device and sound pickup method | |
JP6863004B2 (en) | Sound collectors, programs and methods | |
JP3540988B2 (en) | Sounding body directivity correction method and device | |
JP2017181761A (en) | Signal processing device and program, and gain processing device and program | |
Atkins et al. | Robust superdirective beamformer with optimal regularization | |
JP6725014B1 (en) | Sound collecting device, sound collecting program, and sound collecting method |