JP4724054B2 - Specific direction sound collection device, specific direction sound collection program, recording medium - Google Patents
Specific direction sound collection device, specific direction sound collection program, recording medium Download PDFInfo
- Publication number
- JP4724054B2 JP4724054B2 JP2006165492A JP2006165492A JP4724054B2 JP 4724054 B2 JP4724054 B2 JP 4724054B2 JP 2006165492 A JP2006165492 A JP 2006165492A JP 2006165492 A JP2006165492 A JP 2006165492A JP 4724054 B2 JP4724054 B2 JP 4724054B2
- Authority
- JP
- Japan
- Prior art keywords
- signal
- specific direction
- unit
- signal amount
- gain coefficient
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Circuit For Audible Band Transducer (AREA)
- Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
- Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
Description
本発明は音声通話や機器の操作などハンズフリー方式で音声を取得する収音装置に関するものであり、特に収音装置から見て特定の方向に存在する音源からの音だけを強調して収音したい場合に適用して好適な特定方向収音装置に関する。 The present invention relates to a sound collection device that acquires a voice in a hands-free manner such as a voice call or operation of a device, and particularly emphasizes only sound from a sound source existing in a specific direction when viewed from the sound collection device. The present invention relates to a specific direction sound pickup device that is suitable for use when desired.
従来技術では、図18に示すようにx−y平面状のM個の異なる位置(p1,q1)〜(pM,qM)に配置されたマイクロホンmic.1〜mic.Mを用いて、任意の角度θSの方向にある音源から発生される音を信号とし、それ以外の方向で発せられる音を雑音とした場合に、信号のみを強調して高いSNR(信号雑音比)で収音する。図19は従来の強調収音法の構成を示すブロック図である。位置(xm,ym)に配置されたマイクロホンmで受音した信号xm(n)(m=1…M)に対し、式(1)のように遅延Dmを付加することにより信号ym(n)を得る。 In the conventional technique, as shown in FIG. 18, microphones mic. Arranged at M different positions (p 1 , q 1 ) to (p M , q M ) on the xy plane are arranged. 1-mic. When using M as a sound generated from a sound source in the direction of an arbitrary angle θ S as a signal and a sound generated in other directions as noise, only the signal is emphasized and a high SNR (signal noise) Ratio). FIG. 19 is a block diagram showing the configuration of a conventional enhanced sound collection method. The signal x m (n) (m = 1... M) received by the microphone m arranged at the position (x m , y m ) is added by adding a delay D m as shown in the equation (1). Obtain y m (n).
ym(n)=xm(n−Dm) (1)
このとき遅延量Dmは、あらかじめ与えられた所望音源の方向θSから、それぞれ式(2)により導出することができる。
Dm=(dm/c)sinθS (2)
ここでcは音速であり、dmは図18においてθS方向から到来した音波から見たときの、マイクmと基準点oの間の距離で、式(3)により表される。
dm=pmsinθ+qmcosθ (3)
次にいま得られたym(n)を式(4)のように加算することで、所望位置から発せられる音を強調した信号z(n)が求められる。
y m (n) = x m (n−D m ) (1)
At this time, the delay amount D m can be derived from the desired sound source direction θ S given in advance by the equation (2).
D m = (d m / c) sin θ S (2)
Where c is the speed of sound, d m is when viewed from the sound wave arriving from theta S direction in FIG. 18, the distance between the microphone m and a reference point o, represented by the formula (3).
d m = p m sin θ + q m cos θ (3)
Next, y m (n) obtained now is added as shown in Expression (4) to obtain a signal z (n) that emphasizes the sound emitted from the desired position.
従来技術を用いて収音装置の指向特性をある特定の方向に向け、その方向で発せられる音を強調し、それ以外の方向で発せられる音を抑圧して収音する場合に、従来技術により形成される指向特性はサイドローブを持つことから、本来抑圧したい方向から発せられる音が十分に抑圧されずに収音されてしまう問題があった。
このため強調したい音源の方向以外に非常に大きな音を発する雑音源が存在する場合に、従来技術の収音装置は所望音源に対する十分な強調効果が得られなかった。
また従来技術において、サイドローブを低減するには、マイクロホン数を増やし、またマイクロホンアレーを大型にしなければならず、実用する際には設置、運搬が困難であった。さらに従来技術による収音装置の指向特性は周波数によって変化するため、所望音や雑音のもつ周波数構造によっては、十分な強調効果が得られない問題があった。
When the sound collecting device is directed to a specific direction using conventional technology, the sound emitted in that direction is emphasized, and the sound emitted in other directions is suppressed and collected. Since the formed directional characteristic has side lobes, there is a problem in that sound emitted from the direction in which it is desired to be suppressed is collected without being sufficiently suppressed.
For this reason, when there is a noise source that emits a very loud sound other than the direction of the sound source to be emphasized, the sound collecting device of the prior art cannot obtain a sufficient enhancement effect for the desired sound source.
Further, in the prior art, in order to reduce the side lobes, the number of microphones must be increased and the microphone array must be increased in size, which is difficult to install and transport in practical use. Furthermore, since the directivity characteristics of the sound collecting device according to the prior art change depending on the frequency, there is a problem that a sufficient emphasis effect cannot be obtained depending on the frequency structure of the desired sound or noise.
本発明は以上の課題を解決されるためになされたもので、マイクロホンアレーの規模を拡大することなく、従来技術よりも高いSNRで所望音源からの音を強調して収音する装置を実現することにある。 The present invention has been made to solve the above-described problems, and realizes an apparatus for enhancing and collecting sound from a desired sound source with an SNR higher than that of the prior art without increasing the scale of a microphone array. There is.
本発明では図3に示すように、収音する領域を複数の方向の角度領域Θ1〜ΘQに分割し、マイクロホンアレーの指向性をそれぞれの方向の角度領域に向けるように制御して受音した信号を用いる。このときマイクロホンアレーによって処理された信号は、その処理前と比較して音源の存在する方向に応じてパワーが変化する。本発明ではこのパワーの変化量を利用して、それぞれの方向領域から到来する信号のパワーを推定する。そして推定されたパワーから、事前に与えられた方向の角度領域から到来する信号を強調するための利得係数を算出し、その利得係数を特定方向から到来した信号に乗算した信号を最終的な出力信号として得る。 In the present invention, as shown in FIG. 3, the sound collecting area is divided into angular areas Θ 1 to Θ Q in a plurality of directions, and the directivity of the microphone array is controlled so as to be directed to the angular areas in the respective directions. Use the sound signal. At this time, the power of the signal processed by the microphone array changes in accordance with the direction in which the sound source exists, as compared to before the processing. In the present invention, the amount of change in power is used to estimate the power of a signal arriving from each direction area. Then, from the estimated power, a gain coefficient for emphasizing a signal coming from an angle region in a given direction is calculated, and a signal obtained by multiplying the signal arriving from a specific direction by the gain coefficient is finally output. Get as a signal.
本発明による特定方向収音装置の具体的な構成としては複数のマイクロホンを搭載して構成されるマイクロホンアレーの出力信号を利用してそれぞれが異なる方向の角度領域から到来する音を強調して収音する複数のビームフォーマー部と、複数のビームフォーマー部が収音した角度領域信号のそれぞれを複数の帯域成分に分割した周波数領域信号に変換する周波数領域変換部と、各周波数領域変換部が出力する周波数領域信号の中の所望方向の角度領域の角度領域信号に所属する特定方向周波数領域信号を選択する特定方向選択部と、各角度領域に含まれる信号の総和をその角度領域の信号量とし、複数のビームフォーマー部の各角度領域に対する指向特性から求められるパラメータを要素とするゲイン行列の逆行列に対し、各周波数領域変換部が出力する周波数領域信号の信号量を乗じ、各角度領域の信号量を推定する信号量推定部と、所望方向の角度領域における信号量と、全ての角度領域における信号量の総和との比により、周波数帯域毎の利得係数を算出する利得係数算出部と、利得係数算出部が算出した利得係数を特定方向周波数領域信号の各対応する周波数帯域の信号量に乗算する乗算部とを備えることを特徴とする。 As a specific configuration of the sound collecting device in a specific direction according to the present invention, the output signals of a microphone array configured by mounting a plurality of microphones are used to emphasize and collect sounds coming from angular regions in different directions. A plurality of beamformer units for sound, a frequency domain conversion unit for converting each of the angle domain signals collected by the plurality of beamformer units into a frequency domain signal divided into a plurality of band components, and each frequency domain conversion unit A specific direction selection unit that selects a specific direction frequency domain signal belonging to an angular domain signal of an angular domain in a desired direction from among the frequency domain signals output by the signal, and a sum of signals included in each angular domain is a signal of the angular domain Each frequency domain with respect to the inverse matrix of the gain matrix whose elements are parameters obtained from the directivity characteristics for each angular domain of multiple beamformer units The signal amount estimation unit that estimates the signal amount of each angle region by multiplying the signal amount of the frequency region signal output by the conversion unit, the signal amount in the angle region of the desired direction, and the sum of the signal amount in all angle regions A gain coefficient calculation unit that calculates a gain coefficient for each frequency band according to the ratio, and a multiplication unit that multiplies the signal amount of each corresponding frequency band of the specific direction frequency domain signal by the gain coefficient calculated by the gain coefficient calculation unit. It is characterized by that.
本発明による特定方向集音装置は更に複数のマイクロホンを搭載して構成されているマイクロホンアレーの出力信号を利用してそれぞれが異なる方向の角度領域から到来する音を強調して収音する複数のビームフォーマー部と、複数のビームフォーマー部が収音した角度領域信号のそれぞれを複数の帯域成分に分割した周波数領域信号に変換する周波数領域変換部と、周波数領域変換部が出力する周波数領域信号を周波数帯域成分に分割する帯域分割部と、帯域分割部が出力する帯域成分を同一帯域成分毎に収集する同一帯域成分収集部と、同一帯域成分収集部の出力側に設けられ、各同一帯域成分収集部から出力される帯域成分を合成する帯域合成部とを備え、同一帯域成分収集部は、ビームフォーマー部の何れかが収音する所望方向の角度領域信号に所属する特定方向帯域成分を選択する特定方向選択部と、各角度領域に含まれる信号の総和をその角度領域の信号量とし、複数のビームフォーマー部の各角度領域及び周波数帯域に対する指向特性から求められるパラメータを要素とするゲイン行列の逆行列に対し、各帯域分割部が出力する周波数帯域成分の信号量を乗じ、各角度領域の信号量を推定する信号量推定部と、所望方向の角度領域における信号量と、全ての角度領域における信号量の総和との比により、利得係数を算出する利得係数算出部と、利得係数算出部が算出した利得係数を前記特定方向帯域成分に乗算する乗算部とを備えることを特徴とする。 The specific direction sound collecting apparatus according to the present invention further uses a plurality of microphones configured to mount a plurality of microphones to emphasize and collect a plurality of sounds that are collected from angle regions in different directions. A beamformer unit, a frequency domain conversion unit that converts each of the angle domain signals collected by a plurality of beamformer units into a frequency domain signal divided into a plurality of band components, and a frequency domain output by the frequency domain conversion unit Provided on the output side of the same band component collection unit, the band division unit that divides the signal into frequency band components, the same band component collection unit that collects the band components output by the band division unit for each same band component, and the same A band synthesizing unit that synthesizes the band components output from the band component collecting unit, and the same band component collecting unit is an angle in a desired direction in which any of the beam former units collects sound. A specific direction selection unit for selecting a specific direction band component belonging to the area signal, the sum of the signals included in each angular region as the signal of the angle regions, for each angle and frequency bands of a plurality of beamformer unit A signal amount estimation unit that estimates the signal amount of each angle region by multiplying the inverse matrix of the gain matrix whose elements are parameters obtained from directivity characteristics by the signal amount of the frequency band component output by each band dividing unit ; A gain coefficient calculation unit that calculates a gain coefficient based on a ratio of a signal amount in a direction angle region and a sum of signal amounts in all angle regions, and the gain coefficient calculated by the gain factor calculation unit as the specific direction band component And a multiplication unit for multiplying.
更に本発明による特定方向収音装置は前記した特定方向収音装置において、周波数領域信号の信号量は、信号のパワー値である、または、前記周波数帯域成分の信号量は、信号のパワー値であることを特徴とする。
更に、本発明による特定方向収音装置の特徴とする点は、前記した特定方向収音装置において、周波数領域信号の信号量は、信号の絶対値である、または、周波数帯域成分の信号量は、信号の絶対値であることを特徴とする。
更に、本発明による特定方向収音装置の特徴とする点は、前記した特定方向収音装置において、利得係数算出部の利得係数算出特性は所望方向の角度領域における信号量に対して、その他の角度領域における信号量が無視できる程度に微少値である場合、利得係数の値は所定の最大値で与えられ、所望方向の角度領域における信号量がその他の角度領域における信号量に対して、特定領域信号の量が無視できる程度に微少値である場合は利得係数の値はほぼ0に近い値となる特性で算出することを特徴とする。
Furthermore, in the specific direction sound pickup device according to the present invention, the signal amount of the frequency domain signal is a signal power value, or the signal amount of the frequency band component is a signal power value. characterized in that there.
Further, the specific direction sound pickup device according to the present invention is characterized in that, in the above-described specific direction sound pickup device, the signal amount of the frequency domain signal is an absolute value of the signal, or the signal amount of the frequency band component is The absolute value of the signal .
Moreover, the point which is characterized in a particular direction and collection device according to the present invention, in the specific direction and collecting apparatus described above, the gain factor calculating characteristics of the gain coefficient calculation unit for the signal amount in the desired direction of angular regions, other When the signal amount in the angle region is negligibly small, the gain coefficient value is given as a predetermined maximum value, and the signal amount in the angle region in the desired direction is specified relative to the signal amount in other angle regions . When the amount of the area signal is a negligible value, the gain coefficient value is calculated with a characteristic that is almost close to zero.
更に、本発明による特定方向収音装置の特徴とする点は、前記した特定方向収音装置において、利得係数算出部の利得係数算出特性は、所望方向の角度領域における信号量に対してその他の角度領域の信号量が小さい帯域では利得係数の値を最大値乃至は最大値に近い値に維持させ、所望方向の角度領域における信号量に対し、その他の角度領域の信号量が大きい領域では利得係数の値をほぼ0乃至0に近い値に維持させる特性で算出することを特徴とする。 Further, the specific direction sound pickup device according to the present invention is characterized in that, in the above-described specific direction sound pickup device, the gain coefficient calculation characteristic of the gain coefficient calculation unit is different from the signal amount in the angle region of the desired direction . the maximum value or the value of the signal amount is small bandwidth the gain coefficient of the angular region is kept at a value close to the maximum value, against the amount of signal in the desired direction of angular region, the gain in the region signal amount is large and other angular regions The coefficient is calculated with a characteristic that maintains the value of the coefficient at a value close to 0 to nearly 0.
本発明による特定方向収音装置によれば、所望方向の音源が発する音を強調して収音する際の強調効果を改善するために、マイクロホンアレーによって受音した信号を用いて複数のビームフォーマー部処理の結果から各音源が発する音信号のパワーを推定し、SN比に対応する利得係数を計算して所望音信号を強調する。このため従来技術で同様の効果を得るためにはマイクロホンの本数の増大やマイクロホンアレーの大型化を図る必要が有ったが、本発明によればこれらの必要が無く、実用において設置や運搬が容易な小規模システムのまま強調効果を改善する効果がある。
また本発明による特定方向収音装置では、マイクロホンアレーによって受音された信号のパワー値又は絶対値を周波数成分ごとに推定して強調処理を行うため、所望音や雑音の持つ周波数構造によらず高い強調効果を得ることができる。
According to the specific direction sound collecting apparatus of the present invention, in order to improve the enhancement effect when sound is collected by enhancing the sound emitted from a sound source in a desired direction, a plurality of beam forks are used using signals received by the microphone array. The power of the sound signal emitted from each sound source is estimated from the result of the image processing, and the desired sound signal is emphasized by calculating a gain coefficient corresponding to the SN ratio. For this reason, in order to obtain the same effect with the prior art, it was necessary to increase the number of microphones and increase the size of the microphone array. It has the effect of improving the emphasis effect with an easy small system.
Further, in the specific direction sound pickup device according to the present invention, the power value or absolute value of the signal received by the microphone array is estimated for each frequency component and the enhancement process is performed. Therefore, regardless of the frequency structure of the desired sound or noise. A high emphasis effect can be obtained.
本発明による特定方向収音装置を実施する場合、全てをハードウェアによって構成することも可能であるが、最も簡素に実施するにはコンピュータに、本発明による特定方向収音プログラムをインストールし、コンピュータに特定方向収音装置として機能させる実施形態が最良の形態である。
コンピュータに本発明による特定方向収音装置として機能させるには、コンピュータにインストールした特定方向収音プログラムによりコンピュータ内にマイクロホンアレーの出力信号を利用してそれぞれが異なる方向の角度領域から到来する音を強調して収音する複数のビームフォーマー部と、複数のビームフォーマー部が収音した角度領域信号のそれぞれを複数の帯域成分に分割した周波数領域信号に変換する周波数領域変換部と、各周波数領域変換部が出力する周波数領域信号の中の所望方向の角度領域の角度領域信号に所属する特定方向周波数領域信号を選択する特定方向選択部と、特定方向周波数領域信号の信号量と、他の方向の角度領域信号から周波数領域信号に変換された周波数領域信号の総和の量を推定する信号量推定部と、特定方向周波数領域信号の信号量と、他の方向の角度領域信号から周波数領域信号に変換された周波数領域信号の総和量を推定する信号量推定部と、特定方向周波数領域信号の信号量と、この特定方向周波数領域信号の信号量を含む他の周波数領域信号の総和量との比により周波数領域毎の利得係数を算出する利得係数算出部と、利得係数算出部が算出した利得係数を特定方向領域信号の各対応する周波数帯域の信号量に乗算する乗算部とを構築し、特定方向収音装置として機能させる。
When implementing the specific direction sound pickup apparatus according to the present invention, it is possible to configure all by hardware, but in the simplest implementation, the specific direction sound pickup apparatus according to the present invention is installed in a computer, and the computer The best mode is to let the device function as a specific direction sound pickup device.
In order for a computer to function as a specific direction sound pickup device according to the present invention, sound that arrives from angular regions in different directions by using a microphone array output signal in the computer by a specific direction sound pickup program installed in the computer. A plurality of beamformer sections for emphasizing and collecting sound, a frequency domain conversion section for converting each of the angle domain signals collected by the plurality of beamformer sections into frequency domain signals divided into a plurality of band components, and A specific direction selection unit that selects a specific direction frequency domain signal belonging to an angular domain signal of an angular domain in a desired direction from among the frequency domain signals output by the frequency domain conversion unit, a signal amount of the specific direction frequency domain signal, and the like A signal amount estimation unit for estimating the sum of frequency domain signals converted from frequency domain signals into angle domain signals in the direction of A signal amount estimation unit that estimates a signal amount of a specific direction frequency domain signal, a total amount of frequency domain signals converted from a frequency domain signal from an angle domain signal in another direction, and a signal amount of a specific direction frequency domain signal, A gain coefficient calculation unit that calculates a gain coefficient for each frequency domain based on a ratio with the total amount of other frequency domain signals including the signal quantity of the specific direction frequency domain signal, and the gain coefficient calculated by the gain coefficient calculation unit in a specific direction A multiplication unit that multiplies the signal amount of each corresponding frequency band of the region signal is constructed and functions as a specific direction sound collecting device.
はじめに本発明の全体の概要を説明する。図1は本発明の特定方向収音装置の全体構成を示している。M(≧2)個のマイクロホンから構成されるマイクロホンアレー11によって受音された信号xm(n)(m=1,2,…,M)は、第1ビームフォーマー部12−1から第Qビームフォーマー部12−QまでのQ個のビームフォーマー部12−1〜12−Qに入力される。ここでnは離散時間信号のサンプル番号を表す。
ビームフォーマー部12−1〜12−Qでは、例えば図2に示すような指向性のビームBMを、図3であらかじめ与えられたQ個の方向領域Θ1〜ΘQのいずれかに向け、該当する方向領域で発せられる音を強調して収音する処理を行い、結果を出力する。各ビームフォーマー部12−1〜12−Qの出力信号y1(n)、y2(n)、…、yQ(n)はそれぞれ周波数領域変換部13−1〜13−Qに入力され、周波数領域変換部13−1〜13−Qの出力信号Y1(ω,l)、Y2(ω,l)、…YQ(ω,l)は信号量推定部14と特定方向選択部15にそれぞれ入力される。
First, an overall outline of the present invention will be described. FIG. 1 shows the overall configuration of a sound collecting device in a specific direction according to the present invention. Signals x m (n) (m = 1, 2,..., M) received by the
In the beam former units 12-1 to 12-Q, for example, a directional beam BM as shown in FIG. 2 is directed to any one of the Q direction regions Θ 1 to Θ Q given in advance in FIG. A process of collecting sound by emphasizing the sound emitted in the corresponding direction area is performed, and the result is output. The output signals y 1 (n), y 2 (n),..., Y Q (n) of the beam former units 12-1 to 12-Q are respectively input to the frequency domain transform units 13-1 to 13-Q. The output signals Y 1 (ω, l), Y 2 (ω, l),... Y Q (ω, l) of the frequency domain transforming units 13-1 to 13-Q are the signal
信号量推定部14は、入力されたビームフォーマー部12−1〜12−Qの出力信号パワーから各方向領域Θ1〜ΘQにおける音源から発せられる音信号の総和のパワー成分を求め、これを1つのベクトルにまとめた信号パワーベクトルXest※(ω,l)(以下文中で※が付された英文字はベクトルを表わす。また数式中肉太文字はベクトルを表わす)を出力する。
特定方向選択部15は、強調したい方向領域に指向性のビームを向けたビームフォーマー部の出力を選択しYS(ω,l)として出力する。
The signal
The specific
利得係数算出部16は、入力された信号パワーベクトルXest※(ω,l)から利得係数R(ω,l)を算出し、出力する。利得係数R(ω,l)は乗算部17に入力される。乗算部17は入力された利得係数R(ω,l)と特定方向選択部15の出力YS(ω,l)を同じ周波数の成分ごとに掛け算した結果を出力する。乗算部17の出力信号YSR(ω,l)は逆周波数領域変換部18に入力され、逆離散フーリエ変換を行って時間信号に復元された信号y(n)が出力される。この信号y(n)が本発明の装置によって所望音が強調されて収音された信号である。
ビームフォーマー部12−1〜12−Q、信号量推定部14,利得係数算出部16,特定方向選択部15の詳細は別の図を用いて以下に順に説明する。
The gain
The details of the beam former units 12-1 to 12-Q, the signal
(ビームフォーマー部)
図4はビームフォーマー部12−1〜12−Qの中の一つの例えばビームフォーマー部12−qの構成を示している。同様の処理がすべてのビームフォーマー部において行われる。入力された信号xm(n)(m=1,2,…,M)はフィルタ処理部FC1〜FCMに入力される。フィルタ処理部FC1〜FCMではあらかじめ与えられた(決定方法は後述する)フィルタ係数Wqm(n)を、式(5)に示す畳み込み演算に代入して得られる信号x’qm(n)を出力する。
FIG. 4 shows the configuration of one of the beam formers 12-1 to 12-Q, for example, the beam former 12-q. Similar processing is performed in all beam former units. The input signal x m (n) (m = 1, 2,..., M) is input to the filter processing units FC1 to FCM. The filter processing units FC1 to FCM output a signal x ′ qm (n) obtained by substituting a filter coefficient W qm (n) given in advance (determination method will be described later) into the convolution operation shown in Expression (5). To do.
(信号量推定部)
図5は信号量推定部14の構成を示している。信号量推定部14に入力される周波数成分Y1(ω,l)、Y2(ω,l)、…、YQ(ω,l)はそれぞれパワー演算部PW−1〜PW−Qに入力され、信号のパワー値|Y1(ω,l)|2、|Y2(ω,l)|2、…、|YQ(ω,l)|2が出力され、ベクトル化部14Aに入力される。ベクトル化部14Aでは、入力されたパワー値を式(7)のようにベクトル形式でまとめた、ビームフォーマー部出力パワーベクトルY※(ω,l)を出力する。
FIG. 5 shows the configuration of the signal
(特定方向選択部)
図7は特定方向選択部15の構成を示している。特定方向選択部15では各ビームフォーマー部12−1〜12−Qより周波数領域変換部13−1〜13−Qを経て入力された周波数成分Y1(ω,l)からYQ(ω,l)のうち、強調したい第qs方向領域に対応するものを選択してYS(ω,l)として出力する。
YS(ω,l)=Yqs(ω,l) (11)
(Specific direction selector)
FIG. 7 shows the configuration of the specific
Y S (ω, l) = Y qs (ω, l) (11)
(利得係数算出部)
図8は利得係数算出部16における処理の流れを示している。信号量推定部14より入力された推定信号パワーベクトルXest※(ω,l)はベクトル要素抽出部16Aに入力される。ベクトル要素抽出部16Aでは式(12)に示すように、入力された推定信号パワーベクトルの第1成分を第1方向領域信号推定パワー|S1(ω,l)|2、第2成分を第2方向領域信号推定パワー、|S2(ω,l)|2のように第q成分を第q方向領域からの信号推定パワーとしてそれぞれ出力し、それらはSN比推定部16Bに入力される。
FIG. 8 shows the flow of processing in the gain
図9に示した利得係数の特性によれば特定方向信号成分Sqs(ω,l)が、他の角度領域の信号成分Sq(ω,l)より大きい程利得係数R(ω,l)は「1」に近づき、その周波数帯域の信号は減衰されることなく、そのまま出力される。特定方向信号成分Sqs(ω,l)が、他の角度領域信号成分Sq(ω,l)より小さい程、利得係数R(ω,l)は「0」に近い値となり、この場合は信号成分は利得係数R(ω,l)の乗算によって減衰される。この結果、利得係数R(ω,l)を特定方向選択部15で取り出した特定方向信号に乗算することにより特定方向信号成分が強調されて出力される。
According to the characteristics of the gain coefficient shown in FIG. 9, the gain coefficient R (ω, l) increases as the specific direction signal component S qs (ω, l) is larger than the signal component S q (ω, l) in the other angle region. Approaches “1”, and the signal in that frequency band is output without being attenuated. As the specific direction signal component S qs (ω, l) is smaller than the other angle region signal component S q (ω, l), the gain coefficient R (ω, l) becomes closer to “0”. The signal component is attenuated by multiplication of the gain factor R (ω, l). As a result, the specific direction signal component is emphasized and output by multiplying the specific direction signal extracted by the specific
ここで本発明により所望音を選択強調した収音が可能になる原理について説明する。ビームフォーマー部出力パワーベクトルY※(ω,l)の各要素である、各ビームフォーマー部の出力パワーは、式(14)に示すように、マイクロホンアレーが受音した信号Xθ※(ω,l)のパワーにその信号の音源方向および周波数に基づく指向特性が乗算された形で近似することができる。ただしここでは各音源の発する音は互いに無相関とし、すべてのマイクロホンにおいて音は同レベルで受音されると仮定している。 Here, the principle that enables the sound collection by selectively emphasizing the desired sound according to the present invention will be described. The output power of each beamformer section, which is each element of the beamformer section output power vector Y * (ω, l), is a signal X θ * (*) received by the microphone array as shown in Expression (14). It can be approximated by multiplying the power of ω, l) by the directivity characteristics based on the sound source direction and frequency of the signal. However, here, it is assumed that the sounds emitted by the sound sources are uncorrelated with each other, and the sound is received at the same level in all microphones.
第2の実施例は、実施例1の利得係数算出部16における手順に変更を加えたものである。図10は第2の実施例において用いられる利得係数算出部16の処理手順を示したものである。実施例1における利得係数算出部16との相違点は非線形処理部16Cが追加された点である。非線形処理部16CではSN比推定部16Bから出力される図9に示した特性の元利得係数をR’(ω,l)と表記することとし、この元利得係数R’(ω,l)に0から1の間で変動する非線形関数を乗算した計算結果である利得係数R(ω,l)を出力する。ここでは非線形関数はあらかじめ与えられているもので、元利得係数R’(ω,l)が大きい領域つまりΣq|Sq(ω,l)|2≒|Sqs(ω,l)|2の領域では1または1に近い値を維持し、元利得係数R’(ω,l)が小さい領域つまりΣq|Sq(ω,l)|2>>|Sqs(ω,l)|2の領域では0または0に近い値を維持する関数で、たとえば式(17)に示すハイポブリックタンジェント(例えばZ1:R(ω,l)=1/2+1/2tanh(ρR’(ω,l)−ν))や式(18)に示す対数関数(例えばZ2:R(ω,l)=1/2+1/2tanh(ρ(10 log10)R’(ω,l)−ν))と組み合わせたものなどが用いられる。図11に非線形関数の一例を示す。
In the second embodiment, the procedure in the gain
第3の実施例は、実施例1の信号量推定部14と、利得係数算出部16と、乗算部17における処理手順に変更を加えたものである。図12は第3の実施例における本発明の全体構成を示している。実施例1との相違点は周波数領域変換部13−1〜13−Qの各後段に帯域分割部19−1〜19−Qを設けた点と、この帯域分割部19−1〜19−Qで帯域分割した各帯域成分を同一周波数帯域毎に収集する同一帯域成分収集部20−1〜20−Ωとを設けた構成とした点である。
各同一帯域成分収集部20−1〜20−Ωにはそれぞれに信号量推定部14と、特定方向選択部15と、利得係数算出部16と、乗算部17とを設ける。従って、この実施例3での特徴は信号量推定部14と、特定方向選択部15と、利得係数算出部16,乗算部17の各処理がΩ個の異なる同一帯域成分収集部20−1、20−2、…20−Ωにおいて別々に行われ、同一帯域成分収集部20−1〜20−Ωに設けた乗算部17の出力が帯域合成部21により合成されている点を特徴とする。
In the third embodiment, the processing procedure in the signal
Each of the same band component collection units 20-1 to 20-Ω includes a signal
図13と図14はそれぞれ帯域分割部19−1〜19−Qと帯域合成部21の処理手順を示している。帯域分割部19−1〜19−Ωでは入力された周波数成分Y1(ω、l)〜YQ(ω、l)がΩ1からΩΩまでの帯域に分割され、それぞれ出力される。一方帯域合成部21では、入力されたΩ1からΩΩまでの帯域の周波数成分をまとめてひとつの信号Y(ω、l)として出力する。また本実施例においては、パワー推定部において用いられるゲイン行列T※の各要素は、例えば式(19)および式(20)に示すように与えられた帯域内での平均値を用いる。
FIGS. 13 and 14 show processing procedures of the band dividing units 19-1 to 19-Q and the
第4の実施例は、実施例1の信号量推定部14と、利得係数算出部16における手順に変更を加えたものである。第4の実施例に用いられる信号量推定部14の構成を図15に、利得係数算出部16の構成を図16に示す。信号量推定部14に入力される周波数成分Y1(ω,l)〜YQ(ω,l)はそれぞれ絶対値演算部14D−1〜14D−Qに入力され、信号の絶対値|Y1(ω,l)|、|Y2(ω,l)|、|Y3(ω,l)|、…|YQ(ω,l)|を出力し、ベクトル化部14Aに入力される。ベクトル化部14Aでは入力された信号を式(21)に示す絶対値ベクトルY※(ω,l)を出力する。
In the fourth example, the procedure in the signal
ゲイン行列T※の各要素は式(8)と同様にビームフォーマー部の各方向領域に対する指向特性が求められるパラメータであり、フィルタ係数から計算される指向特性のゲイン量から式(22)により定義され、事前に与えられる。
Each element of the gain matrix T * is a parameter for which the directivity characteristic with respect to each direction region of the beamformer unit is obtained in the same manner as Expression (8). From the gain amount of the directivity characteristic calculated from the filter coefficient, Expression (22) Defined and given in advance.
次に図16に示す利得係数算出部16ではベクトル要素抽出部16Aは式(23)に示すように入力された推定信号絶対値ベクトルの第1成分を|S1(ω,l)|、第2成分を|S2(ω,l)|、第3成分を|S3(ω,l)|、…としてそれぞれ出力し、それらはSN比推定部16Bに入力される。
Next, in the gain
なおこの実施例4は実施例2の信号量推定部14と利得係数算出部16に対しても適用することができる。図17は実施例2に本実施例4の変更を加えた場合の利得係数算出部16の構成を示す。
The fourth embodiment can also be applied to the signal
以上説明した本発明による収音装置は全てをハードウェアによって構成することも可能であるが、最も簡素に実現するには上述した各手順をコンピュータが解読可能なプログラム言語によって記述した本発明による収音プログラムを作成し、この収音プログラムをコンピュータにインストールし、コンピュータに収音プログラムを実行させ、コンピュータに収音装置として機能させる実施例が最良である。本発明による収音プログラムはコンピュータが読み取り可能な例えば磁気媒体、CD−ROM、半導体メモリ等の記録媒体に記録され、これらの記録媒体から、或いは通信回線を通じてコンピュータにインストールされる。インストールされた収音プログラムはコンピュータに備えられたCPUにより解読され、コンピュータを収音装置として機能させる。 The sound collecting device according to the present invention described above can be entirely configured by hardware. However, in order to achieve the simplest implementation, the above-described procedures are recorded by a program language readable by a computer. An embodiment in which a sound program is created, this sound collection program is installed in a computer, the computer executes the sound collection program, and the computer functions as a sound collection device is the best. The sound collection program according to the present invention is recorded on a computer-readable recording medium such as a magnetic medium, a CD-ROM, or a semiconductor memory, and is installed in the computer from the recording medium or through a communication line. The installed sound collection program is decoded by a CPU provided in the computer, and causes the computer to function as a sound collection device.
本発明による収音装置は例えば電話会議システム等のハンズフリー通話装置の分野で活用される。 The sound pickup device according to the present invention is utilized in the field of hands-free call devices such as a telephone conference system.
11 マイクロホンアレー 16 利得係数算出部
12−1〜12−Q ビームフォーマー部 17 乗算部
13−1〜13−Q 周波数領域変換部 18 逆周波数領域変換部
14 信号量推定部 19−1〜19−Q 帯域分割部
15 特定方向選択部 20−1〜20−Ω 同一帯域成分収集部
21 帯域合成部
DESCRIPTION OF
14 Signal amount estimation unit 19-1 to 19-Q Band division unit
15 Specific direction selector 20-1 to 20-Ω Same band component collector
21 Band synthesis unit
Claims (10)
前記複数のビームフォーマー部が収音した角度領域信号のそれぞれを複数の帯域成分に分割した周波数領域信号に変換する周波数領域変換部と、
各周波数領域変換部が出力する周波数領域信号の中の所望方向の角度領域の角度領域信号に所属する特定方向周波数領域信号を選択する特定方向選択部と、
各角度領域に含まれる信号の総和をその角度領域の信号量とし、前記複数のビームフォーマー部の各角度領域に対する指向特性から求められるパラメータを要素とするゲイン行列の逆行列に対し、各周波数領域変換部が出力する周波数領域信号の信号量を乗じ、各角度領域の信号量を推定する信号量推定部と、
所望方向の角度領域における信号量と、全ての角度領域における信号量の総和との比により、周波数帯域毎の利得係数を算出する利得係数算出部と、
前記利得係数算出部が算出した利得係数を前記特定方向周波数領域信号の各対応する周波数帯域の信号量に乗算する乗算部と、
を備えることを特徴とする特定方向収音装置。 A plurality of beamformer sections that emphasize and collect sound coming from angular regions in different directions using output signals of a microphone array configured with a plurality of microphones;
A frequency domain conversion unit that converts each of the angle domain signals collected by the plurality of beamformer units into a frequency domain signal divided into a plurality of band components;
A specific direction selection unit that selects a specific direction frequency domain signal belonging to an angular domain signal of an angular domain in a desired direction among the frequency domain signals output by each frequency domain transform unit;
For each inverse of the gain matrix whose element is a parameter obtained from the directivity characteristics of each of the plurality of beamformer units for each angle region, with the sum of the signals included in each angle region as the signal amount of that angle region. A signal amount estimation unit that multiplies the signal amount of the frequency domain signal output by the region conversion unit and estimates the signal amount of each angle region;
A gain coefficient calculation unit that calculates a gain coefficient for each frequency band by a ratio of a signal amount in an angle region of a desired direction and a sum of signal amounts in all angle regions;
A multiplier that multiplies the signal amount in each corresponding frequency band of the specific direction frequency domain signal by the gain coefficient calculated by the gain coefficient calculator;
A specific direction sound pickup device comprising:
前記複数のビームフォーマー部が収音した角度領域信号のそれぞれを複数の帯域成分に分割した周波数領域信号に変換する周波数領域変換部と、
前記周波数領域変換部が出力する周波数領域信号を周波数帯域成分に分割する帯域分割部と、
前記帯域分割部が出力する帯域成分を同一帯域成分毎に収集する同一帯域成分収集部と、
前記同一帯域成分収集部の出力側に設けられ、各同一帯域成分収集部から出力される帯域成分を合成する帯域合成部と、
を備え、
前記同一帯域成分収集部は、
前記ビームフォーマー部の何れかが収音する所望方向の角度領域信号に所属する特定方向帯域成分を選択する特定方向選択部と、
各角度領域に含まれる信号の総和をその角度領域の信号量とし、前記複数のビームフォーマー部の各角度領域及び周波数帯域に対する指向特性から求められるパラメータを要素とするゲイン行列の逆行列に対し、各帯域分割部が出力する周波数帯域成分の信号量を乗じ、各角度領域の信号量を推定する信号量推定部と、
所望方向の角度領域における信号量と、全ての角度領域における信号量の総和との比により、利得係数を算出する利得係数算出部と、
前記利得係数算出部が算出した利得係数を前記特定方向帯域成分に乗算する乗算部と、
を備えることを特徴とする特定方向収音装置。 A plurality of beamformer units that use the output signals of a microphone array configured with a plurality of microphones to emphasize and collect sound coming from angular regions in different directions; and
A frequency domain conversion unit that converts each of the angle domain signals collected by the plurality of beamformer units into a frequency domain signal divided into a plurality of band components;
A band dividing unit that divides the frequency domain signal output by the frequency domain converting unit into frequency band components;
The same band component collecting unit that collects the band components output by the band dividing unit for each same band component;
A band synthesizing unit that is provided on the output side of the same band component collecting unit and synthesizes band components output from each same band component collecting unit;
With
The same band component collecting unit
A specific direction selection unit that selects a specific direction band component belonging to an angle region signal of a desired direction in which any of the beam former units collects sound;
For the inverse matrix of the gain matrix whose elements are the parameters obtained from the directivity characteristics for each angle region and frequency band of the plurality of beamformer units, with the sum of signals included in each angle region as the signal amount of that angle region. A signal amount estimation unit that multiplies the signal amount of the frequency band component output by each band dividing unit to estimate the signal amount of each angle region;
A gain coefficient calculation unit that calculates a gain coefficient by a ratio of a signal amount in an angle region of a desired direction and a sum of signal amounts in all angle regions;
A multiplier for multiplying the specific direction band component by the gain coefficient calculated by the gain coefficient calculator;
A specific direction sound pickup device comprising:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006165492A JP4724054B2 (en) | 2006-06-15 | 2006-06-15 | Specific direction sound collection device, specific direction sound collection program, recording medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006165492A JP4724054B2 (en) | 2006-06-15 | 2006-06-15 | Specific direction sound collection device, specific direction sound collection program, recording medium |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007336232A JP2007336232A (en) | 2007-12-27 |
JP4724054B2 true JP4724054B2 (en) | 2011-07-13 |
Family
ID=38935281
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006165492A Active JP4724054B2 (en) | 2006-06-15 | 2006-06-15 | Specific direction sound collection device, specific direction sound collection program, recording medium |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4724054B2 (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10373628B2 (en) | 2016-08-31 | 2019-08-06 | Kabushiki Kaisha Toshiba | Signal processing system, signal processing method, and computer program product |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4787727B2 (en) * | 2006-12-04 | 2011-10-05 | 日本電信電話株式会社 | Audio recording apparatus, method thereof, program thereof, and recording medium thereof |
JP4928376B2 (en) * | 2007-07-18 | 2012-05-09 | 日本電信電話株式会社 | Sound collection device, sound collection method, sound collection program using the method, and recording medium |
JP4928382B2 (en) * | 2007-08-10 | 2012-05-09 | 日本電信電話株式会社 | Specific direction sound collection device, specific direction sound collection method, specific direction sound collection program, recording medium |
JP5175262B2 (en) * | 2009-12-02 | 2013-04-03 | 日本電信電話株式会社 | Voice acquisition device |
JP5549299B2 (en) * | 2010-03-23 | 2014-07-16 | ヤマハ株式会社 | Headphone |
US9838782B2 (en) * | 2015-03-30 | 2017-12-05 | Bose Corporation | Adaptive mixing of sub-band signals |
JP6517124B2 (en) * | 2015-10-26 | 2019-05-22 | 日本電信電話株式会社 | Noise suppression device, noise suppression method, and program |
EP3764359B1 (en) | 2019-07-10 | 2024-08-28 | Analog Devices International Unlimited Company | Signal processing methods and systems for multi-focus beam-forming |
EP3764358B1 (en) | 2019-07-10 | 2024-05-22 | Analog Devices International Unlimited Company | Signal processing methods and systems for beam forming with wind buffeting protection |
EP3764660B1 (en) | 2019-07-10 | 2023-08-30 | Analog Devices International Unlimited Company | Signal processing methods and systems for adaptive beam forming |
CN113031901B (en) | 2021-02-19 | 2023-01-17 | 北京百度网讯科技有限公司 | Voice processing method and device, electronic equipment and readable storage medium |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003271191A (en) * | 2002-03-15 | 2003-09-25 | Toshiba Corp | Device and method for suppressing noise for voice recognition, device and method for recognizing voice, and program |
JP2005195955A (en) * | 2004-01-08 | 2005-07-21 | Toshiba Corp | Device and method for noise suppression |
JP2006066988A (en) * | 2004-08-24 | 2006-03-09 | Nippon Telegr & Teleph Corp <Ntt> | Sound collecting method, device and program, and medium recording sound collecting program |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1806739B1 (en) * | 2004-10-28 | 2012-08-15 | Fujitsu Ltd. | Noise suppressor |
-
2006
- 2006-06-15 JP JP2006165492A patent/JP4724054B2/en active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003271191A (en) * | 2002-03-15 | 2003-09-25 | Toshiba Corp | Device and method for suppressing noise for voice recognition, device and method for recognizing voice, and program |
JP2005195955A (en) * | 2004-01-08 | 2005-07-21 | Toshiba Corp | Device and method for noise suppression |
JP2006066988A (en) * | 2004-08-24 | 2006-03-09 | Nippon Telegr & Teleph Corp <Ntt> | Sound collecting method, device and program, and medium recording sound collecting program |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10373628B2 (en) | 2016-08-31 | 2019-08-06 | Kabushiki Kaisha Toshiba | Signal processing system, signal processing method, and computer program product |
Also Published As
Publication number | Publication date |
---|---|
JP2007336232A (en) | 2007-12-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4724054B2 (en) | Specific direction sound collection device, specific direction sound collection program, recording medium | |
CN105981404B (en) | Use the extraction of the reverberation sound of microphone array | |
KR101597752B1 (en) | Apparatus and method for noise estimation and noise reduction apparatus employing the same | |
JP4986248B2 (en) | Sound source separation apparatus, method and program | |
JP3940662B2 (en) | Acoustic signal processing method, acoustic signal processing apparatus, and speech recognition apparatus | |
JP6547003B2 (en) | Adaptive mixing of subband signals | |
JP4928382B2 (en) | Specific direction sound collection device, specific direction sound collection method, specific direction sound collection program, recording medium | |
JP2017503388A5 (en) | ||
JP2002062348A (en) | Apparatus and method for processing signal | |
EP3275208B1 (en) | Sub-band mixing of multiple microphones | |
JP5785674B2 (en) | Voice dereverberation method and apparatus based on dual microphones | |
JP5060465B2 (en) | Sound collection device, sound collection method, sound collection program, recording medium | |
JP5175262B2 (en) | Voice acquisition device | |
JP4473829B2 (en) | Sound collecting device, program, and recording medium recording the same | |
JP5635024B2 (en) | Acoustic signal emphasizing device, perspective determination device, method and program thereof | |
JP6517124B2 (en) | Noise suppression device, noise suppression method, and program | |
CN111755021B (en) | Voice enhancement method and device based on binary microphone array | |
JP4928376B2 (en) | Sound collection device, sound collection method, sound collection program using the method, and recording medium | |
JP4886616B2 (en) | Sound collection device, sound collection method, sound collection program using the method, and recording medium | |
JP2018056902A (en) | Sound collecting device, program, and method | |
JP2005062096A (en) | Detection method of speaker position, system, program and record medium | |
JP2012049715A (en) | Sound source separation apparatus, sound source separation method and program | |
JP5713933B2 (en) | Sound source distance measuring device, acoustic direct ratio estimating device, noise removing device, method and program thereof | |
JP6263890B2 (en) | Audio signal processing apparatus and program | |
US20240214729A1 (en) | Apparatus and method for narrowband direction-of-arrival estimation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080804 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110107 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110118 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110302 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110329 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110408 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140415 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4724054 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |