JP2011234213A - Sound source direction estimation apparatus - Google Patents
Sound source direction estimation apparatus Download PDFInfo
- Publication number
- JP2011234213A JP2011234213A JP2010103979A JP2010103979A JP2011234213A JP 2011234213 A JP2011234213 A JP 2011234213A JP 2010103979 A JP2010103979 A JP 2010103979A JP 2010103979 A JP2010103979 A JP 2010103979A JP 2011234213 A JP2011234213 A JP 2011234213A
- Authority
- JP
- Japan
- Prior art keywords
- sound source
- microphones
- amplification degree
- sound
- source direction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
Description
本発明は、音源方向推定装置に関する。 The present invention relates to a sound source direction estimating apparatus.
従来、下記特許文献1に示されるように、テレビ会議等に適用される制御システムであって、撮像装置と複数のマイクロフォンとが筺体に設けられ、各マイクロフォンにより話者の音声を集音して電気信号に変換し、変換された電気信号を用いて話者(音源)の方向を算出するシステムが知られている。このシステムでは、算出した方向に撮像装置が向けられるよう撮像装置の角度を制御することで、話者を撮像できるようにしている。
2. Description of the Related Art Conventionally, as shown in
上記のように複数のマイクロフォンによって話者の方向を算出するシステムでは、通常、各マイクロフォンから出力される電気信号をアンプにより増幅し、増幅された電気信号の出力値を用いて音源の方向を算出する。ところが各マイクロフォンは、個体差により感度特性に多少のばらつきを有している。そこで、個々のマイクロフォンにおける感度特性のばらつきを低減するため、例えばシステムの工場出荷前において、基準音源に対する出力値を合わせるようにアンプの増幅度を調整するのが一般的である。 In a system that calculates the direction of a speaker using a plurality of microphones as described above, the electric signal output from each microphone is usually amplified by an amplifier, and the direction of the sound source is calculated using the output value of the amplified electric signal. To do. However, each microphone has some variation in sensitivity characteristics due to individual differences. Therefore, in order to reduce variations in sensitivity characteristics among individual microphones, for example, before the system is shipped from the factory, it is common to adjust the amplification degree of the amplifier so as to match the output value with respect to the reference sound source.
しかしながら、従来の技術では、アンプの増幅度の調整により一定の周波数に応じて出力値を合わせることはできたものの、個々のマイクロフォンの感度特性は周波数によってまちまちであるため、実際の使用時においてマイクロフォンに入力される音の周波数が調整時の基準音源の周波数とは異なる場合、結果的には各マイクロフォンにおける出力値に誤差が生じてしまっていた。そのため、音源の方向を精度良く算出することは難しかった。 However, with the conventional technology, although the output value can be adjusted according to a certain frequency by adjusting the amplification factor of the amplifier, the sensitivity characteristics of individual microphones vary depending on the frequency. When the frequency of the sound input to is different from the frequency of the reference sound source at the time of adjustment, as a result, an error occurs in the output value of each microphone. For this reason, it has been difficult to calculate the direction of the sound source with high accuracy.
本発明は、マイクロフォンの感度特性にばらつきがある場合であっても音源の方向を精度良く推定することができる音源方向推定装置を提供することを目的とする。 An object of the present invention is to provide a sound source direction estimation apparatus that can accurately estimate the direction of a sound source even when the sensitivity characteristics of microphones vary.
本発明に係る音源方向推定装置は、音源で生じた音を入力し音を電気信号に変換する複数のマイクロフォンと、複数のマイクロフォンのそれぞれから出力された電気信号を増幅する増幅手段と、増幅手段によって増幅されたそれぞれの電気信号における可聴域内の所定範囲の周波数成分を通過させるバンドパスフィルタと、バンドパスフィルタを通過した周波数成分に基づいて音源の方向を推定する音源方向推定手段と、を備え、複数のマイクロフォンに対応して電気信号から周波数成分を生成する際の増幅度が互いに調整可能に構成されていることを特徴とする。 A sound source direction estimating apparatus according to the present invention includes a plurality of microphones that input sound generated by a sound source and convert the sound into an electric signal, an amplifying unit that amplifies an electric signal output from each of the plurality of microphones, and an amplifying unit A band-pass filter that passes a predetermined range of frequency components within the audible range in each electric signal amplified by the sound source, and a sound source direction estimating unit that estimates the direction of the sound source based on the frequency component that has passed through the band-pass filter. The amplification degree when generating the frequency component from the electrical signal corresponding to the plurality of microphones is configured to be adjustable.
本発明に係る音源方向推定装置によれば、複数のマイクロフォンのそれぞれから出力された電気信号が増幅手段によって増幅され、増幅されたそれぞれの電気信号における可聴域内の所定範囲の周波数成分がバンドパスフィルタを通過する。そして、音源方向推定手段によって、バンドパスフィルタを通過した周波数成分に基づいて音源の方向が推定される。ここで、複数のマイクロフォンに対応して電気信号から周波数成分を生成する際の増幅度が互いに調整可能に構成されているので、個々のマイクロフォンの感度特性が周波数により異なっている場合でも、所定範囲の周波数において感度特性の相違を低減するような増幅度の調整が可能となる。よって、マイクロフォンごとの感度特性のばらつきが低減された周波数成分が得られる。こうしてばらつきが低減された周波数成分を用いて、音源方向推定手段によって音源の方向が推定されるため、音源の方向を精度良く推定することができる。 According to the sound source direction estimating apparatus according to the present invention, the electric signal output from each of the plurality of microphones is amplified by the amplifying means, and the frequency component in a predetermined range in the audible range in each of the amplified electric signals is a bandpass filter. Pass through. The sound source direction estimating means estimates the direction of the sound source based on the frequency component that has passed through the bandpass filter. Here, since the amplification degree when generating the frequency component from the electrical signal corresponding to a plurality of microphones is configured to be mutually adjustable, even if the sensitivity characteristics of the individual microphones differ depending on the frequency, a predetermined range It is possible to adjust the amplification degree so as to reduce the difference in sensitivity characteristics at the frequency of. Therefore, a frequency component in which variations in sensitivity characteristics for each microphone are reduced can be obtained. Since the direction of the sound source is estimated by the sound source direction estimating means using the frequency component in which the variation is thus reduced, the direction of the sound source can be estimated with high accuracy.
ここで、バンドパスフィルタを通過した周波数成分のうち、少なくとも一つのマイクロフォンに対応した周波数成分の増幅度を調整する増幅度調整手段を備えると好適である。 Here, it is preferable to provide an amplification degree adjusting means for adjusting the amplification degree of the frequency component corresponding to at least one of the frequency components that have passed through the bandpass filter.
このような構成によれば、バンドパスフィルタを通過した周波数成分のうち、少なくとも一つのマイクロフォンに対応した周波数成分の増幅度が増幅度調整手段によって調整されるので、バンドパスフィルタにより抽出された周波数成分における感度特性の相違を低減するように増幅度の調整を行うことができ、上記した方向推定精度の向上効果が好適に発揮される。 According to such a configuration, since the amplification degree of the frequency component corresponding to at least one microphone among the frequency components that have passed through the bandpass filter is adjusted by the amplification degree adjusting means, the frequency extracted by the bandpass filter The degree of amplification can be adjusted so as to reduce the difference in sensitivity characteristics among the components, and the above-described effect of improving the direction estimation accuracy is preferably exhibited.
また、増幅手段は、複数のマイクロフォンから出力された電気信号のうち、少なくとも一つのマイクロフォンから出力された電気信号の増幅度を調整する増幅度調整手段を有すると好適である。 In addition, it is preferable that the amplifying unit includes an amplification degree adjusting unit that adjusts an amplification degree of the electric signal output from at least one microphone among the electric signals output from the plurality of microphones.
このような構成によれば、増幅手段では、複数のマイクロフォンから出力された電気信号のうち少なくとも一つのマイクロフォンから出力された電気信号の増幅度を増幅度調整手段によって調整することができ、所定範囲の周波数において感度特性の相違を低減するような増幅度の調整が可能となる。そして、所定範囲の周波数成分をバンドパスフィルタにより抽出することでマイクロフォンごとの感度特性のばらつきが低減された周波数成分が得られ、上記した方向推定精度の向上効果が好適に発揮される。 According to such a configuration, the amplification unit can adjust the amplification degree of the electric signal output from at least one microphone among the electric signals output from the plurality of microphones by the amplification degree adjustment unit, It is possible to adjust the amplification degree so as to reduce the difference in sensitivity characteristics at the frequency of. Then, by extracting a frequency component in a predetermined range using a bandpass filter, a frequency component in which variation in sensitivity characteristics for each microphone is reduced is obtained, and the above-described effect of improving the direction estimation accuracy is preferably exhibited.
ここで、複数のマイクロフォンは、音を取り込むための開口が形成された筺体の内部に埋設されており、開口を通って筺体内に伝搬する音を入力すると好適である。 Here, the plurality of microphones are embedded in a housing in which an opening for capturing sound is formed, and it is preferable to input sound that propagates through the opening into the housing.
このような構成によれば、開口とマイクロフォンとを結ぶ方向線に対してある角度だけずれた位置で生じた音は、開口付近で回折してマイクロフォンに達する。この回折によって音は減衰するが、音源の位置する角度と音の減衰量とは、音の周波数に応じた相関関係を有する。すなわち、周波数が低い音では、角度が大きくなっても減衰量は小さいが、周波数が高い音では、角度が大きくなるほど減衰量は増大する。増幅手段によって増幅されたそれぞれの電気信号における所定範囲の周波数成分がバンドパスフィルタを通過することで、音源の位置する角度との高い相関関係を有する帯域の周波数成分を抽出することができる。そして、バンドパスフィルタを通過した周波数成分を用いて音源の方向が推定されるため、それ自体は指向性を有しない無指向性のマイクロフォンを用いた場合であっても、音源の方向を精度良く推定することができる。 According to such a configuration, the sound generated at a position shifted by a certain angle with respect to the direction line connecting the opening and the microphone is diffracted near the opening and reaches the microphone. Although sound is attenuated by this diffraction, the angle at which the sound source is located and the sound attenuation amount have a correlation according to the frequency of the sound. That is, for a sound with a low frequency, the amount of attenuation is small even when the angle is large, but for a sound with a high frequency, the amount of attenuation increases as the angle increases. A frequency component in a predetermined range in each electric signal amplified by the amplifying means passes through the bandpass filter, so that a frequency component in a band having a high correlation with the angle at which the sound source is located can be extracted. Since the direction of the sound source is estimated using the frequency component that has passed through the bandpass filter, the direction of the sound source can be accurately determined even when a non-directional microphone that does not have directivity is used. Can be estimated.
本発明によれば、マイクロフォンの感度特性にばらつきがある場合であっても音源の方向を精度良く推定することができる。 According to the present invention, the direction of a sound source can be accurately estimated even when the sensitivity characteristics of microphones vary.
以下、本発明の一実施形態に係る音源方向推定装置について図面を参照しながら説明する。以下の説明では、音源方向推定装置がテレビ会議用カメラに適用される場合について説明する。 Hereinafter, a sound source direction estimating apparatus according to an embodiment of the present invention will be described with reference to the drawings. In the following description, a case where the sound source direction estimating device is applied to a video conference camera will be described.
図1〜図3に示すように、テレビ会議用カメラAは、例えばテレビ会議に参加する複数の参加者により囲まれた位置に設置されて、発言する参加者(以下、「発言者」という)の方向を推定してその方向へカメラ35を向けることにより、発言者の映像を取得するものである。テレビ会議用カメラAは、ネットワークを介して相手方のテレビ会議システムと通信可能になっている。
As shown in FIGS. 1 to 3, the video conference camera A is installed at a position surrounded by, for example, a plurality of participants participating in the video conference, and speaks (hereinafter referred to as “speaker”). The video of the speaker is acquired by directing the
テレビ会議用カメラAは、テーブル等に載置される直径約10cmの略円筒形状で樹脂製の第1筺体10aと、第1筺体10aの軸線に沿って鉛直方向に配置された軸(図示せず)を介して第1筺体10aの上側に取り付けられ、その軸を中心として第1筺体10aに対して回転可能な略直方体形状で樹脂製の第2筺体10bとを有している。カメラ35は、第2筺体10b内に収納されている。
The video conference camera A has a substantially cylindrical shape with a diameter of about 10 cm placed on a table or the like, and a resin-made
第1筺体10aの側面には、同じ高さで周方向に90°ずつ離間する位置に4つの円形の開口11〜14が形成されている。各開口11〜14は、テレビ会議用カメラAの周囲で発せられた発言者の音声を第1筺体10a内に取り込むための穴であり、内径が約8mmになっている。
On the side surface of the
第1筺体10aの内面側には、各開口11〜14から第1筺体10a内に向けて第1筺体10aの半径方向に延びる円筒形状の4本の筒状体16〜19が固定されている。各筒状体16〜19の内径は約8mmであり、各開口11〜14の内周面と各筒状体16〜19の内壁面とは略面一になっている。各筒状体16〜19は、これらの内部に直径約8mmの円柱形上の伝搬路B1〜B4を形成している。すなわち、各伝搬路B1〜B4は、各開口11〜14から第1筺体10a内に向けて第1筺体10aの半径方向に水平に延びるように形成されている。なお、各開口11〜14は、第1筺体10aの外壁に形成された穴を意味しており、各開口11〜14には、各筒状体16〜19及び各伝搬路B1〜B4は含まれない。
Four
更に、第1筺体10aの中心側に位置する各筒状体16〜19の端部には、前面が各開口11〜14に平行になるようにして円柱形状の4個のマイクロフォン(以下、「マイク」という)1〜4が埋設されている。各マイク1〜4は、例えば直径約7mm、厚さ約4mmの、前面側でのみ集音可能な無指向性のエレクトリックコンデンサマイクである。各マイク1〜4は、直径約5mmの円形のダイヤフラムからなる振動板1a〜4aを内蔵している。各開口11〜14から各マイク1〜4の前面までの最短距離は約10mmであり、各開口11〜14の内径よりも長くなっている。また、上記したように、伝搬路B1〜B4の内径(断面)は、振動板1a〜4aよりも大きくなっている(図2参照)。これにより、伝搬路B1〜B4を通る音は振動板1a〜4aに確実に伝達されるようになっている。各マイク1〜4と各筒状体16〜19の内壁面との間には、スペーサ(図示せず)が配設されている。
Furthermore, four cylindrical microphones (hereinafter referred to as “hereinafter referred to as“ microphones ”) are formed at the ends of the
このような構成により、テレビ会議用カメラAでは、会議における発言者の音声が開口11〜14及び伝搬路B1〜B4を通じてマイク1〜4に入力される仕組みとなっている。そして、マイク1〜4に入力される音声により振動板1a〜4aが振動させられ、この振動に応じて音声が電気信号に変換され、電気信号がマイク1〜4からアンプ5〜8へ出力される(図3参照)。なお、マイク1〜4の背面側の内部空間Sには第1筺体10aの外部の音が伝搬しない構成になっている。
With such a configuration, the video conference camera A has a mechanism in which the voice of the speaker in the conference is input to the
図3に示すように、テレビ会議用カメラAは、マイク1〜4に入力された音声に基づいて所定の処理を施すことにより、発言者の方向を推定する機能を備えている。具体的には、テレビ会議用カメラAは、各マイク1〜4から出力された電気信号を入力し、入力した電気信号を増幅させる4個のアンプ(増幅手段)5〜8と、各アンプ5〜8によって増幅された各電気信号における所定範囲の周波数成分を通過させるバンドパスフィルタ(以下、「BPF」という)21〜24と、各BPF21〜24を通過した各周波数成分をアナログ−デジタル(Analog−Digital)変換するAD変換部25と、AD変換部25でデジタル変換された各周波数成分のうち、マイク1〜4の少なくとも一つに対応した周波数成分の増幅度を調整する増幅度調整部26と、増幅度調整部26から出力された周波数成分を用いて音源の方向を推定する音源方向演算部(音源方向推定手段)27、ヒストグラム登録部28、及び音源方向再演算部29とを備えている。
As shown in FIG. 3, the video conference camera A has a function of estimating the direction of the speaker by performing a predetermined process based on the sound input to the
アンプ5〜8は、マイク1〜4に各々接続されており、各マイク1〜4から出力された電気信号を増幅回路により増幅させる。各アンプ5〜8は、増幅させた電気信号を各BPF21〜24に出力する。
The
各BPF21〜24は、各アンプ5〜8から出力された電気信号を入力し、入力した電気信号のうち、例えば2.5kHz以下及び6.5kHz以上の周波数成分を遮断することにより、2.5kHz〜6.5kHzの範囲の周波数成分を通過させる。各BPF21〜24によって通過させられる周波数の範囲は、可聴域内にある所定の範囲とされる。各BPF21〜24は、2.5kHz以下の周波数成分を遮断するハイパスフィルタと、6.5kHz以上の周波数成分を遮断するローパスフィルタとを組み合わせることにより構成される。
Each BPF 21-24 receives the electrical signal output from each of the amplifiers 5-8, and, for example, by blocking frequency components of 2.5 kHz or less and 6.5 kHz or more from the input electrical signal, 2.5 kHz Pass frequency components in the range of ~ 6.5 kHz. The range of the frequency passed by each
AD変換部25は、各BPF21〜24を通過した各周波数成分をアナログ信号からデジタル信号に変換する。AD変換部25は、BPF21〜24のいずれから出力された周波数成分であるかを識別する機能を有してもよいし、各アンプ5〜8に対応して複数設けられてもよい。AD変換部25は、デジタル信号に変換した周波数成分を生成し、その周波数成分がマイク1〜4のいずれに対応する周波数成分であるかを示す信号と共にその周波数成分を増幅度調整部26に出力する。
The
増幅度調整部26は、例えばCPU(Central Processing Unit)、ROM(Read Only Memory)、RAM(Random Access Memory)等により構成されている。増幅度調整部26は、AD変換部25から出力された周波数成分を入力し、入力した周波数成分のうち、感度特性が他のマイクに対してずれたマイクに対応する周波数成分の増幅度を調整する。言い換えれば、増幅度調整部26は、各マイク1〜4に対応して電気信号から周波数成分を生成する際の増幅度を互いに調整することができる。
The amplification
より具体的に説明すると、マイク1〜4の感度特性は、個体差によりばらつきを有している。図4は、増幅度調整部26における増幅度の調整を説明するための図である。図4において、横軸は周波数を示しており、縦軸は、ある基準音をマイクの正面の一定距離離れた位置から発生させた場合における、基準値に対するマイクの出力値の相対値(すなわち感度)を示している。図4に示す例では、マイク1とマイク2とでは周波数によって感度特性が異なっている。すなわち、マイク1では周波数が高くなるにつれて相対値が低下するのに対し、マイク2では周波数が高くなるにつれて相対値が上昇する。言い換えれば、マイク1は低い周波数で感度が高く、マイク2は高い周波数で感度が高くなっている。
More specifically, the sensitivity characteristics of the
この場合、増幅度調整部26は、各BPF21〜24によって通過させられる2.5kHz〜6.5kHzの範囲における感度がマイク1とマイク2とで略等しくなるよう、マイク2の増幅度を調整する。増幅度調整部26による増幅度の調整は、AD変換部25から出力された周波数成分に対して感度特性の相違に応じた一定の係数を乗じることで行われる。より具体的には、増幅度を増加させる場合には1以上の係数が用いられ、増幅度を減少させる場合には1未満の係数が用いられる。この係数は、例えば工場出荷前において、基準音を用いた試験によって各マイク1〜4に応じて適宜設定され、増幅度調整部26に格納される。このように、増幅度調整部26による単純な演算によりマイク1〜4の感度特性を揃えることができるので、音源の方向の推定精度の向上が図られ、テレビ会議用カメラAによる発言者の撮影が確実に行われる。
In this case, the amplification
なお、増幅度調整部26による増幅度の調整は、係数を乗じる場合に限られず、各BPF21〜24によって通過させられる範囲の周波数において各マイク1〜4の感度のばらつきを低減し得る手法であれば、いずれの手法が用いられてもよい。また、図4ではマイク1及びマイク2がそれぞれ周波数に応じて一定の傾向で変化する感度特性を有する場合を例として示したが、実際にはマイクの感度特性は周波数に対して不規則にばらつくことが一般的であり、そのような場合でも、BPF21〜24における所定範囲の周波数成分の抽出と増幅度調整部26における増幅度の調整とによって、各マイク1〜4の感度特性のばらつきを低減することができる。
The adjustment of the amplification degree by the amplification
増幅度調整部26は、増幅度が調整されたマイクに対応する周波数成分と、増幅度が調整されていないマイクに対応する周波数成分とを、各周波数成分がマイク1〜4のいずれに対応する周波数成分であるかを示す信号と共に音源方向演算部27に出力する。
The amplification
音源方向演算部27、ヒストグラム登録部28、及び音源方向再演算部29は、例えばCPU(Central Processing Unit)、ROM(Read Only Memory)、RAM(Random Access Memory)等により構成されている。音源方向演算部27、ヒストグラム登録部28、及び音源方向再演算部29は、増幅度調整部26から出力された周波数成分に基づいて発言者の方向を演算することにより、発言者の方向を推定する。
The sound source
具体的には、音源方向演算部27は、増幅度調整部26から出力された各周波数成分に基づいて、各マイク1〜4に対応する周波数成分の出力値(音の大きさ)を比較することにより、音声が発せられた音源の方向を演算する。音源方向演算部27での音源の方向の演算処理としては、公知の技術を用いることができる。テレビ会議用カメラAにおける音源の方向は、第1筺体10aの周方向の所定位置(例えば開口11の中心位置)を基準として、第1筺体10aの上方から見た場合に時計回りを正とした角度(0°〜360°)で表される。音源方向演算部27による音源の方向の演算は、所定時間毎、例えば40ミリ秒毎に実行される。
Specifically, the sound source
前述したように、マイク1〜4は、開口11〜14から第1筺体10a内に所定長(例えば約10mm)入り込んだ位置に埋設されているため、周波数が高い音ほど、マイク1〜4に達する音は回折により減衰する。例えば、図5に示すように、マイク1の中心と開口11の中心とを結ぶ方向線(すなわち筒状体16の軸線)に対して音源の位置する方向が角度θだけずれていると、周波数の高い音は、角度θずれている分減衰してマイク1に達する。そして、各BPF21〜24により2.5kHz以上の周波数成分が通過させられるため、角度の影響を受けた出力値が音源方向演算部27に入力され、各マイク1〜4に対応する出力値の比較により、音源方向演算部27における音源の方向の演算が精度良く行われる。音源方向演算部27は、演算した所定時間毎の音源の方向をヒストグラム登録部28に出力する。
As described above, the
ヒストグラム登録部28は、音源方向演算部27から出力された音源の方向を入力し、入力した音源の方向を逐次記憶する。ヒストグラム登録部28による音源の方向の記憶では、常に、最も古いデータに最新のデータが上書きされる。そして、ヒストグラム登録部28は、記憶した音源の方向を20°刻みで18段階の角度範囲に分類し、分類結果に応じてヒストグラムを生成する。ヒストグラム登録部28は、生成したヒストグラムを音源方向再演算部29に出力する。
The
音源方向再演算部29は、ヒストグラム登録部28から出力されたヒストグラムを入力し、入力したヒストグラムの中で度数が最大である角度範囲における度数と、この角度範囲の近傍の角度範囲における度数とに基づいて角度範囲の平均値を求めることにより、音源の方向を再演算する。音源方向再演算部29は、再演算した音源の方向を発言者の方向としてモータ制御部31に出力する。
The sound source
こうして、音源方向演算部27、ヒストグラム登録部28、及び音源方向再演算部29による音源の方向の演算処理が行われ、発言者の方向が推定される。図1及び図3に示すように、テレビ会議用カメラAでは、第1筺体10a、開口11〜14、筒状体16〜19、マイク1〜4、アンプ5〜8、BPF21〜24、AD変換部25、増幅度調整部26、音源方向演算部27、ヒストグラム登録部28、及び音源方向再演算部29を備えて音源方向推定装置20が構成されている。
In this way, the sound source direction calculation processing is performed by the sound source
更に、図3に示すように、テレビ会議用カメラAは、音源方向推定装置20によって推定された音源の方向へカメラ35を向け、カメラ35により発言者の映像を取得する機能を備えている。具体的には、テレビ会議用カメラAは、音源方向再演算部29から出力された音源の方向に基づいてモータ駆動部32を制御するモータ制御部31と、モータ制御部31により制御されてモータ33を駆動させるモータ駆動部32と、モータ駆動部32により駆動させられてカメラ回転機構34に回転力を与えるモータ33と、モータ33に連結されて回転により第2筺体10bと共にカメラ35を旋回させるカメラ回転機構34と、映像を取得するカメラ35と、カメラ35より取得された映像の映像データを映像処理する映像処理部36と、映像処理部36により処理された映像データを転送するデータ転送部37と、データ転送部37により転送された映像データをネットワークに送信するネットワーク通信部38とを備えている。
Further, as shown in FIG. 3, the video conference camera A has a function of directing the
次に、このようなテレビ会議用カメラAにおける動作について説明する。以下の説明では、図6(a)に示すように、開口11と開口12とから等しい距離で開口13及び開口14とは反対側の45°に位置する発言者から音声が発せられた場合を例として説明する。図6(b)に示すように、各マイク1〜4に対応する周波数成分の出力値は、2.5kHz〜10kHzの間でピーク値に差が見られる。より具体的には、2.5kHz〜10kHzの間に見られる出力値は、マイク1,2では同等であり、マイク3,4ではマイク1,2よりも減衰している。一方、2.5kHz以下に見られる出力値は、マイク1〜4で略等しくなっている。
Next, the operation of the video conference camera A will be described. In the following description, as shown in FIG. 6A, a case where a voice is emitted from a speaker located at 45 ° opposite to the
音源方向推定装置20では、各BPF21〜24によって2.5kHz以下及び6.5kHz以上の周波数成分は遮断されることにより、2.5kHz〜6.5kHzの範囲の周波数成分が通過させられる。図6(b)に示す例の場合、回折の影響を大きく受けた2.5kHz〜6.5kHzの範囲の成分が出力値として抽出される。更に、増幅度調整部26によって、2.5kHz〜6.5kHzの範囲で各マイク1〜4の感度が略等しくなるよう、マイク1〜4の少なくとも一つに対応した周波数成分の増幅度が調整される。そして、増幅度調整部26から出力された各周波数成分を用いて音源の方向が演算され、音源は、45°の位置にあると推定される。音源方向推定装置20は、45°を示す信号をモータ制御部31に出力する。
In the sound source
モータ制御部31は、音源方向推定装置20から出力された45°を示す信号を入力し、モータ駆動部32を制御してモータ33を駆動させ、カメラ35が45°の方向へ向くように、カメラ回転機構34によってカメラ35を第2筺体10bと共に旋回させる。なお、モータ制御部31によるカメラ35の旋回制御は、所定時間連続して一定範囲内の音源の方向が入力された際に、入力された一定範囲内の音源の方向の平均値を用いて実行されてもよい。
The
カメラ35は、前方の映像を取得し、取得した映像を示す映像データを生成する。カメラ35は、生成した映像データを映像処理部36に出力する。映像処理部36は、カメラ35から出力された映像データを入力し、入力した映像データに映像処理を施し、映像処理後の映像データをデータ転送部37に出力する。データ転送部37は、映像処理部36から出力された映像データを入力し、入力した映像データをネットワーク通信部38に転送する。そして、ネットワーク通信部38は、データ転送部37から転送された映像データをネットワークを介して相手方のテレビ会議システムに送信する。
The
本実施形態の音源方向推定装置20によれば、各マイク1〜4から出力された電気信号が各アンプ5〜8によって増幅され、増幅されたそれぞれの電気信号における可聴域内の所定範囲の周波数成分が各BPF21〜24を通過する。そして、音源方向演算部27によって、各BPF21〜24を通過した周波数成分に基づいて音源の方向が推定される。ここで、各マイク1〜4に対応して電気信号から周波数成分を生成する際の増幅度は、増幅度調整部26によって互いに調整可能に構成されているので、各マイク1〜4の感度特性が周波数により異なっている場合でも、所定範囲の周波数において感度特性の相違を低減するような増幅度の調整が可能となる。よって、各マイク1〜4ごとの感度特性のばらつきが低減された周波数成分が得られ、ばらつきが低減された周波数成分を用いて、音源方向演算部27によって音源の方向が推定されるため、音源の方向を精度良く推定することができる。
According to the sound source
更に、各アンプ5〜8によって増幅された各電気信号における所定範囲の周波数成分がBPF21〜24を通過することで、音源の位置する角度との高い相関関係を有する帯域の周波数成分を抽出することができ、各BPF21〜24を通過した周波数成分を用いて音源の方向が推定されるため、無指向性のマイク1〜4を用いた場合であっても、音源の方向を精度良く推定することができる。
Furthermore, a frequency component in a predetermined range in each electric signal amplified by each
以上、本発明の好適な実施形態について説明したが、本発明は上記実施形態に限られるものではない。 The preferred embodiment of the present invention has been described above, but the present invention is not limited to the above embodiment.
例えば、上記実施形態では、各BPF21〜24を通過した周波数成分のうち少なくとも一つのマイクに対応した周波数成分の増幅度が増幅度調整部26によって調整される場合について説明したが、増幅度調整手段は、各アンプ5〜8に設けられてもよい。すなわち、各アンプ5〜8は、各マイク1〜4から出力された電気信号の増幅度を調整するための調整機構(例えば調整つまみ)を増幅度調整手段として有してもよい。この場合、各マイク1〜4から出力された電気信号のうち少なくとも一つのマイクから出力された電気信号の増幅度を調整機構によって調整することで、上記実施形態と同様にして、各マイク1〜4の感度特性のばらつきを低減することができる。
For example, in the above-described embodiment, the case where the amplification degree of the frequency component corresponding to at least one microphone among the frequency components that have passed through each of the
また、上記実施形態では、4個のマイク1〜4が設けられる場合について説明したが、マイクの設置個数は2又は3個であってもよく、5個以上であってもよい。また、BPF21〜24によって通過させられる周波数の範囲は、マイクの特性に応じて可聴域内の範囲で適宜設定することができる。このように可聴域内の範囲とすることで、人によって聴くことのできるあらゆる周波数の音源に音源方向推定装置を適用することができ、音源方向推定装置としての汎用性が高められる。
Moreover, although the said embodiment demonstrated the case where the four microphones 1-4 were provided, the installation number of microphones may be 2 or 3, and may be 5 or more. In addition, the range of frequencies passed by the
更にまた、上記実施形態では、音源方向推定装置20がテレビ会議用カメラAに適用される場合について説明したが、複数のマイクを備えて音源の方向を推定し、推定した音源の方向を利用する装置であればこれに限られない。例えば、本発明の音源方向推定装置は、異常音を検知して、その異常音が発生した音源の方向を映す監視カメラ等にも適用できる。
Furthermore, in the above-described embodiment, the case where the sound source
1〜4…マイク、5〜8…アンプ(増幅手段)、10a…筺体、11〜14…開口、20…音源方向推定装置、21〜24…BPF、26…増幅度調整部(増幅度調整手段)、27…音源方向演算部(音源方向推定手段)。 DESCRIPTION OF SYMBOLS 1-4 ... Microphone, 5-8 ... Amplifier (amplification means), 10a ... Housing, 11-14 ... Opening, 20 ... Sound source direction estimation apparatus, 21-24 ... BPF, 26 ... Amplification degree adjustment part (Amplification degree adjustment means) 27... Sound source direction calculation unit (sound source direction estimation means).
Claims (4)
前記複数のマイクロフォンのそれぞれから出力された前記電気信号を増幅する増幅手段と、
前記増幅手段によって増幅されたそれぞれの前記電気信号における可聴域内の所定範囲の周波数成分を通過させるバンドパスフィルタと、
前記バンドパスフィルタを通過した前記周波数成分に基づいて前記音源の方向を推定する音源方向推定手段と、を備え、
前記複数のマイクロフォンに対応して前記電気信号から前記周波数成分を生成する際の増幅度が互いに調整可能に構成されている
ことを特徴とする音源方向推定装置。 A plurality of microphones for inputting sound generated by a sound source and converting the sound into an electrical signal;
Amplifying means for amplifying the electrical signal output from each of the plurality of microphones;
A bandpass filter that passes a predetermined range of frequency components within the audible range in each of the electrical signals amplified by the amplification means;
Sound source direction estimating means for estimating the direction of the sound source based on the frequency component that has passed through the band-pass filter,
A sound source direction estimating apparatus, wherein the amplification degree when generating the frequency component from the electrical signal corresponding to the plurality of microphones is adjustable.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010103979A JP2011234213A (en) | 2010-04-28 | 2010-04-28 | Sound source direction estimation apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010103979A JP2011234213A (en) | 2010-04-28 | 2010-04-28 | Sound source direction estimation apparatus |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2011234213A true JP2011234213A (en) | 2011-11-17 |
Family
ID=45323065
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010103979A Pending JP2011234213A (en) | 2010-04-28 | 2010-04-28 | Sound source direction estimation apparatus |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2011234213A (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017205140A1 (en) * | 2016-05-24 | 2017-11-30 | Hear360 Llc | Multichannel head trackable microphone |
-
2010
- 2010-04-28 JP JP2010103979A patent/JP2011234213A/en active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017205140A1 (en) * | 2016-05-24 | 2017-11-30 | Hear360 Llc | Multichannel head trackable microphone |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TW202005415A (en) | Pattern-forming microphone array | |
KR101164299B1 (en) | Sound input device | |
KR101761312B1 (en) | Directonal sound source filtering apparatus using microphone array and controlling method thereof | |
US20160029142A1 (en) | Adaptive room equalization using a speaker and a handheld listening device | |
WO2016028448A1 (en) | Method and apparatus for estimating talker distance | |
US20140112483A1 (en) | Distance-based automatic gain control and proximity-effect compensation | |
WO2009145096A1 (en) | Audio input device, method for manufacturing the same, and information processing system | |
US10349189B2 (en) | Method and acoustic system for determining a direction of a useful signal source | |
WO2009142249A1 (en) | Voice input device and manufacturing method thereof, and information processing system | |
US11626850B2 (en) | Automated tuning by measuring and equalizing speaker output in an audio environment | |
JP5246120B2 (en) | Sound collecting device, gain control method, and program | |
WO2008062850A1 (en) | Voice input device, its manufacturing method and information processing system | |
WO2008062848A1 (en) | Voice input device, its manufacturing method and information processing system | |
JP4173280B2 (en) | System and method for decomposing a mixed wave field into individual elements | |
US7424119B2 (en) | Voice matching system for audio transducers | |
JP2011232238A (en) | Sound source direction estimation device | |
EP1511358A2 (en) | Automatic sound field correction apparatus and computer program therefor | |
JP2011234213A (en) | Sound source direction estimation apparatus | |
Lewis et al. | Low self noise: the first step to high-performance MEMS microphone applications | |
JP6433630B2 (en) | Noise removing device, echo canceling device, abnormal sound detecting device, and noise removing method | |
JP5141442B2 (en) | Sound collecting device and sound emitting and collecting device | |
JP2011232237A (en) | Sound source direction estimation device | |
JP4212635B1 (en) | Voice input device, manufacturing method thereof, and information processing system | |
JP2008124627A (en) | Sound output device and sound quality correcting method | |
JP2005136628A (en) | Stereo-microphone device |