JP2011232238A - Sound source direction estimation device - Google Patents
Sound source direction estimation device Download PDFInfo
- Publication number
- JP2011232238A JP2011232238A JP2010103971A JP2010103971A JP2011232238A JP 2011232238 A JP2011232238 A JP 2011232238A JP 2010103971 A JP2010103971 A JP 2010103971A JP 2010103971 A JP2010103971 A JP 2010103971A JP 2011232238 A JP2011232238 A JP 2011232238A
- Authority
- JP
- Japan
- Prior art keywords
- sound source
- sound
- microphone
- housing
- opening
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Circuit For Audible Band Transducer (AREA)
- Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
- Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
Abstract
Description
本発明は、音源方向推定装置に関する。 The present invention relates to a sound source direction estimating apparatus.
従来、下記特許文献1に示されるように、前面側と背面側とで集音可能な指向性のマイクロフォンを内蔵した電子機器が知られている。この機器では、第1の開口部が形成されたフロントキャビネット(筺体)の内面にマイクロフォンの前面が当接するようにしてマイクロフォンを保持すると共に、マイクロフォンの背面側には、フロントキャビネットとマイクロフォンカバーとにより空間部を形成しており、更に、この空間部に面するフロントキャビネットの部分に第2の開口部を形成している。
2. Description of the Related Art Conventionally, as shown in
このような構成により、上記の機器では、第1の開口部によって筺体の外部とマイクロフォンの前面側とを連通させると共に、第2の開口部によって筺体の外部とマイクロフォンの背面側の空間部とを連通させている。そして、フロントキャビネットの外部で生じた音を第1の開口部を通じてマイクロフォンの前面側で集音し、第2の開口部を通じてマイクロフォンの背面側で集音することにより、マイクロフォンの指向性を高めている。 With such a configuration, in the above-described device, the first opening allows the outside of the housing to communicate with the front side of the microphone, and the second opening connects the outside of the housing and the space on the back side of the microphone. Communicate. Then, sound generated outside the front cabinet is collected on the front side of the microphone through the first opening, and collected on the back side of the microphone through the second opening, thereby improving the directivity of the microphone. Yes.
しかしながら、指向性のマイクロフォンを用いる上記の機器では、マイクロフォンの前面側と背面側とで集音する構造のため、マイクロフォンの背面側に空間部を形成する必要があり、構造上の制約が大きかった。従って、マイクロフォンの背面側の空間部を確保するためには、筺体を大型化するか、筺体から突出した位置にマイクロフォンを設置することとなり、例えばテレビ会議システムに用いられるような音源の方向へ向くカメラに適用する場合には、カメラのコンパクト化を図り難いといった問題があった。そこで、こうした構造上の制約を低減するため、無指向性のマイクロフォンを用いた場合でも音源の方向を推定し得る技術が望まれていた。 However, the above-described device using a directional microphone has a structure in which sound is collected on the front side and the back side of the microphone, so it is necessary to form a space on the back side of the microphone, and there are significant structural restrictions. . Therefore, in order to secure the space on the back side of the microphone, the casing is enlarged or the microphone is installed at a position protruding from the casing. For example, the microphone is directed toward the sound source used in the video conference system. When applied to a camera, there is a problem that it is difficult to make the camera compact. Therefore, in order to reduce such structural constraints, a technique that can estimate the direction of a sound source even when an omnidirectional microphone is used has been desired.
本発明は、無指向性のマイクロフォンを用いた場合でも音源の方向を推定することができる音源方向推定装置を提供することを目的とする。 An object of this invention is to provide the sound source direction estimation apparatus which can estimate the direction of a sound source, even when an omnidirectional microphone is used.
本発明に係る音源方向推定装置は、外部の音源で生じた音を取り込むための開口が形成された筺体と、筺体の開口の内側に埋設され、開口を通って筺体内に伝搬する音により振動板を振動させて音を電気信号に変換するマイクロフォンと、マイクロフォンから出力された電気信号のうち可聴域内にある所定の周波数以上の周波数成分を通過させるハイパスフィルタと、ハイパスフィルタを通過した周波数成分に基づいて音源の方向を推定する音源方向推定部と、を備えることを特徴とする。 The sound source direction estimating device according to the present invention is a case in which an opening for capturing sound generated by an external sound source is formed, and is vibrated by sound embedded in the opening of the case and propagating through the opening into the case. A microphone that vibrates a plate to convert sound into an electrical signal, a high-pass filter that passes a frequency component of a predetermined frequency or higher in the audible range of the electrical signal output from the microphone, and a frequency component that passes through the high-pass filter And a sound source direction estimating unit that estimates the direction of the sound source based on the sound source.
本発明に係る音源方向推定装置によれば、筺体の外部の音源で生じた音が開口を通じて筺体内に取り込まれ、筺体内に埋設されたマイクロフォンにより、筺体内に伝搬した音が電気信号に変換される。ここで、開口とマイクロフォンとを結ぶ方向線に対してある角度だけずれた位置で生じた音は、開口付近で回折してマイクロフォンに達する。この回折によって音は減衰するが、音源の位置する角度と音の減衰量とは、音の周波数に応じた相関関係を有する。すなわち、周波数が低い音では、角度が大きくなっても減衰量は小さいが、周波数が高い音では、角度が大きくなるほど減衰量は増大する。よって、マイクロフォンから出力された電気信号のうち所定の周波数以上の周波数成分がハイパスフィルタを通過することで、音源の位置する角度との高い相関関係を有する帯域の周波数成分を抽出することができる。そして、音源方向推定部によって、ハイパスフィルタを通過した周波数成分に基づいて音源の方向が推定されるため、マイクロフォン自体が無指向性であっても音源の方向を推定することができる。更に、マイクロフォンは、開口に向けられた前面側でのみ集音すればよいので、マイクロフォンの背面側に集音のための空間を設ける必要がなく、筺体内の空間を配線や他の部品の配置のために利用でき、その結果として筺体のコンパクト化が図られる。また、マイクロフォンは筺体内に埋設されるため、筺体から突出した位置にマイクロフォンを設置する場合に比して外観の向上が図られる。 According to the sound source direction estimating apparatus according to the present invention, sound generated by a sound source outside the housing is taken into the housing through the opening, and the sound propagated into the housing is converted into an electric signal by the microphone embedded in the housing. Is done. Here, the sound generated at a position shifted by a certain angle with respect to the direction line connecting the opening and the microphone diffracts near the opening and reaches the microphone. Although sound is attenuated by this diffraction, the angle at which the sound source is located and the sound attenuation amount have a correlation according to the frequency of the sound. That is, for a sound with a low frequency, the amount of attenuation is small even when the angle is large, but for a sound with a high frequency, the amount of attenuation increases as the angle increases. Therefore, a frequency component in a band having a high correlation with the angle at which the sound source is located can be extracted by passing a frequency component of a predetermined frequency or higher in the electrical signal output from the microphone through the high-pass filter. Since the direction of the sound source is estimated by the sound source direction estimation unit based on the frequency component that has passed through the high-pass filter, the direction of the sound source can be estimated even if the microphone itself is omnidirectional. Furthermore, since the microphone needs to collect sound only on the front side facing the opening, it is not necessary to provide a space for collecting sound on the back side of the microphone, and the space inside the enclosure is arranged with wiring and other parts. As a result, the housing can be made compact. Further, since the microphone is embedded in the housing, the appearance can be improved as compared with the case where the microphone is installed at a position protruding from the housing.
ここで、筺体には、開口から筺体内に向けて延びる伝搬路を形成する筒状体が設けられ、マイクロフォンは、筒状体の端部に配置されており、伝搬路の断面は、マイクロフォンの振動板よりも大きいと好適である。 Here, the casing is provided with a cylindrical body that forms a propagation path extending from the opening toward the casing, and the microphone is disposed at the end of the cylindrical body. It is preferable that it is larger than the diaphragm.
この場合、筒状体が設けられることにより、マイクロフォンの振動板よりも大きい断面を有する伝搬路を通って開口からマイクロフォンへと音が伝搬するため、この音が振動板に確実に伝わり、音源の方向をより一層精度良く推定することができる。 In this case, since the cylindrical body is provided, the sound propagates from the opening to the microphone through the propagation path having a larger cross section than the diaphragm of the microphone, so that the sound is reliably transmitted to the diaphragm and the sound source The direction can be estimated with higher accuracy.
また、開口からマイクロフォンまでの最短距離は、開口の幅よりも大きいと好適である。 The shortest distance from the opening to the microphone is preferably larger than the width of the opening.
開口からマイクロフォンまでの最短距離が開口の幅よりも小さいと、周波数の高い音が回折せずにマイクロフォンに直接達してしまう可能性がある。開口からマイクロフォンまでの最短距離が開口の幅よりも大きいと、周波数の高い音がマイクロフォンに直接達してしまうことが防止され、開口付近での回折によって減衰した音がマイクロフォンに達するため、上記した音源の方向の推定効果がより好適に発揮される。 If the shortest distance from the opening to the microphone is smaller than the width of the opening, high-frequency sound may reach the microphone directly without being diffracted. If the shortest distance from the opening to the microphone is larger than the width of the opening, high-frequency sound is prevented from reaching the microphone directly, and sound attenuated by diffraction near the opening reaches the microphone. The effect of estimating the direction is more suitably exhibited.
本発明によれば、無指向性のマイクロフォンを用いた場合でも音源の方向を推定することができる。 According to the present invention, the direction of a sound source can be estimated even when an omnidirectional microphone is used.
以下、本発明の一実施形態に係る音源方向推定装置について図面を参照しながら説明する。以下の説明では、音源方向推定装置がテレビ会議用カメラに適用される場合について説明する。 Hereinafter, a sound source direction estimating apparatus according to an embodiment of the present invention will be described with reference to the drawings. In the following description, a case where the sound source direction estimating device is applied to a video conference camera will be described.
図1〜図3に示すように、テレビ会議用カメラAは、例えばテレビ会議に参加する複数の参加者により囲まれた位置に設置されて、発言する参加者(以下、「発言者」という)の方向を推定してその方向へカメラ35を向けることにより、発言者の映像を取得するものである。テレビ会議用カメラAは、ネットワークを介して相手方のテレビ会議システムと通信可能になっている。
As shown in FIGS. 1 to 3, the video conference camera A is installed at a position surrounded by, for example, a plurality of participants participating in the video conference, and speaks (hereinafter referred to as “speaker”). The video of the speaker is acquired by directing the
テレビ会議用カメラAは、テーブル等に載置される直径約10cmの略円筒形状で樹脂製の第1筺体10aと、第1筺体10aの軸線に沿って鉛直方向に配置された軸(図示せず)を介して第1筺体10aの上側に取り付けられ、その軸を中心として第1筺体10aに対して回転可能な略直方体形状で樹脂製の第2筺体10bとを有している。カメラ35は、第2筺体10b内に収納されている。
The video conference camera A has a substantially cylindrical shape with a diameter of about 10 cm placed on a table or the like, and a resin-made
第1筺体10aの側面には、同じ高さで周方向に90°ずつ離間する位置に4つの円形の開口11〜14が形成されている。各開口11〜14は、テレビ会議用カメラAの周囲で発せられた発言者の音声を第1筺体10a内に取り込むための穴であり、内径が約8mmになっている。
On the side surface of the
第1筺体10aの内面側には、各開口11〜14から第1筺体10a内に向けて第1筺体10aの半径方向に延びる円筒形状の4本の筒状体16〜19が固定されている。各筒状体16〜19の内径は約8mmであり、各開口11〜14の内周面と各筒状体16〜19の内壁面とは略面一になっている。各筒状体16〜19は、これらの内部に直径約8mmの円柱形上の伝搬路B1〜B4を形成している。すなわち、各伝搬路B1〜B4は、各開口11〜14から第1筺体10a内に向けて第1筺体10aの半径方向に水平に延びるように形成されている。なお、各開口11〜14は、第1筺体10aの外壁に形成された穴を意味しており、各開口11〜14には、各筒状体16〜19及び各伝搬路B1〜B4は含まれない。
Four
更に、第1筺体10aの中心側に位置する各筒状体16〜19の端部には、前面が各開口11〜14に平行になるようにして円柱形状の4個のマイクロフォン(以下、「マイク」という)1〜4が埋設されている。各マイク1〜4は、例えば直径約7mm、厚さ約4mmの、前面側でのみ集音可能な無指向性のエレクトリックコンデンサマイクである。各マイク1〜4は、直径約5mmの円形のダイヤフラムからなる振動板1a〜4aを内蔵している。各開口11〜14から各マイク1〜4の前面までの最短距離は約10mmであり、各開口11〜14の内径よりも長くなっている。また、上記したように、伝搬路B1〜B4の内径(断面)は、振動板1a〜4aよりも大きくなっている(図2参照)。これにより、伝搬路B1〜B4を通る音は振動板1a〜4aに確実に伝達されるようになっている。各マイク1〜4と各筒状体16〜19の内壁面との間には、スペーサ(図示せず)が配設されることが好ましい。
Furthermore, four cylindrical microphones (hereinafter referred to as “hereinafter referred to as“ microphones ”) are formed at the ends of the
このような構成により、テレビ会議用カメラAでは、会議における発言者の音声が開口11〜14及び伝搬路B1〜B4を通じてマイク1〜4に入力される仕組みとなっている。そして、マイク1〜4に入力される音声により振動板1a〜4aが振動させられ、この振動に応じて音声が電気信号に変換され、電気信号がマイク1〜4からアンプ5〜8へ出力される(図3参照)。なお、マイク1〜4の背面側の内部空間Sには第1筺体10aの外部の音が伝搬しない構成になっている。
With such a configuration, the video conference camera A has a mechanism in which the voice of the speaker in the conference is input to the
図3に示すように、テレビ会議用カメラAは、マイク1〜4に入力された音声に基づいて所定の処理を施すことにより、発言者の方向を推定する機能を備えている。具体的には、テレビ会議用カメラAは、各マイク1〜4から出力された電気信号を入力し、入力した電気信号を増幅させる4個のアンプ5〜8と、各アンプ5〜8で増幅された電気信号のうち所定の周波数以上の周波数成分を通過させるハイパスフィルタ(以下、「HPF」という)21と、HPF21を通過した周波数成分をアナログ−デジタル(Analog−Digital)変換するAD変換部22と、AD変換部22でデジタル変換された周波数成分に基づいて音源の方向を推定する音源方向演算部(音源方向推定部)23、ヒストグラム登録部24、及び音源方向再演算部25とを備えている。
As shown in FIG. 3, the video conference camera A has a function of estimating the direction of the speaker by performing a predetermined process based on the sound input to the
アンプ5〜8は、マイク1〜4に各々接続されており、各マイク1〜4から出力された電気信号を増幅回路により増幅させる。各アンプ5〜8は、電気信号の増幅度を調整するための調整つまみを有してもよい。各アンプ5〜8は、増幅させた電気信号をHPF21に出力する。
The
HPF21は、各アンプ5〜8から出力された電気信号を入力し、入力した電気信号のうち、例えば2.5kHz未満の周波数成分を遮断し、2.5kHz以上の周波数成分を通過させる。HPF21における遮断周波数は、可聴域内にある所定の周波数とされる。HPF21は、アンプ5〜8のいずれから出力された周波数成分であるかを識別する機能を有してもよいし、各アンプ5〜8ごとに複数設けられてもよい。
The
AD変換部22は、HPF21を通過した周波数成分をアナログ信号からデジタル信号に変換する。AD変換部22は、デジタル信号に変換した周波数成分を生成し、生成した周波数成分を音源方向演算部23に出力する。AD変換部22は、アンプ5〜8のいずれから出力された周波数成分であるかを識別する機能を有してもよいし、各アンプ5〜8ごとにHPF21が複数設けられる場合には、各アンプ5〜8に対応して複数設けられてもよい。
The
音源方向演算部23、ヒストグラム登録部24、及び音源方向再演算部25は、例えばCPU(Central Processing Unit)、ROM(Read Only Memory)、RAM(Random Access Memory)等により構成されている。音源方向演算部23、ヒストグラム登録部24、及び音源方向再演算部25は、AD変換部22から出力された周波数成分に基づいて発言者の方向を演算することにより、発言者の方向を推定する。
The sound source
具体的には、音源方向演算部23は、AD変換部22から出力された周波数成分に基づいて、各マイク1〜4に対応する周波数成分の出力値(音の大きさ)を比較することにより、音声が発せられた音源の方向を演算する。音源方向演算部23での音源の方向の演算処理としては、公知の技術を用いることができる。テレビ会議用カメラAにおける音源の方向は、第1筺体10aの周方向の所定位置(例えば開口11の中心位置)を基準として、第1筺体10aの上方から見た場合に時計回りを正とした角度(0°〜360°)で表される。音源方向演算部23による音源の方向の演算は、所定時間毎、例えば40ミリ秒毎に実行される。
Specifically, the sound source
ここで、本実施形態のテレビ会議用カメラAにあっては、マイク1〜4が開口11〜14から第1筺体10a内に所定長(例えば約10mm)入り込んだ位置に埋設されているため、周波数が高い音ほど、マイク1〜4に達する音は回折により減衰する。例えば、図4に示すように、マイク1の中心と開口11の中心とを結ぶ方向線(すなわち筒状体16の軸線)に対して音源の位置する方向が角度θだけずれていると、周波数の高い音は、角度θずれている分減衰してマイク1に達する。そして、HPF21により2.5kHz以上の周波数成分が通過させられるため、角度の影響を受けた出力値が音源方向演算部23に入力され、各マイク1〜4に対応する出力値の比較により、音源方向演算部23における音源の方向の演算が精度良く行われる。音源方向演算部23は、演算した所定時間毎の音源の方向をヒストグラム登録部24に出力する。
Here, in the video conference camera A of the present embodiment, since the
ヒストグラム登録部24は、音源方向演算部23から出力された音源の方向を入力し、入力した音源の方向を逐次記憶する。ヒストグラム登録部24による音源の方向の記憶では、常に、最も古いデータに最新のデータが上書きされる。そして、ヒストグラム登録部24は、記憶した音源の方向を20°刻みで18段階の角度範囲に分類し、分類結果に応じてヒストグラムを生成する。ヒストグラム登録部24は、生成したヒストグラムを音源方向再演算部25に出力する。
The
音源方向再演算部25は、ヒストグラム登録部24から出力されたヒストグラムを入力し、入力したヒストグラムの中で度数が最大である角度範囲における度数と、この角度範囲の近傍の角度範囲における度数とに基づいて角度範囲の平均値を求めることにより、音源の方向を再演算する。音源方向再演算部25は、再演算した音源の方向を発言者の方向としてモータ制御部31に出力する。
The sound source
こうして、音源方向演算部23、ヒストグラム登録部24、及び音源方向再演算部25による音源の方向の演算処理が行われ、発言者の方向が推定される。図1及び図3に示すように、テレビ会議用カメラAでは、第1筺体10a、開口11〜14、筒状体16〜19、マイク1〜4、アンプ5〜8、HPF21、AD変換部22、音源方向演算部23、ヒストグラム登録部24、及び音源方向再演算部25を備えて音源方向推定装置20が構成されている。
In this way, the sound source direction calculation process is performed by the sound source
更に、図3に示すように、テレビ会議用カメラAは、音源方向推定装置20によって推定された音源の方向へカメラ35を向け、カメラ35により発言者の映像を取得する機能を備えている。具体的には、テレビ会議用カメラAは、音源方向再演算部25から出力された音源の方向に基づいてモータ駆動部32を制御するモータ制御部31と、モータ制御部31により制御されてモータ33を駆動させるモータ駆動部32と、モータ駆動部32により駆動させられてカメラ回転機構34に回転力を与えるモータ33と、モータ33に連結されて回転により第2筺体10bと共にカメラ35を旋回させるカメラ回転機構34と、映像を取得するカメラ35と、カメラ35より取得された映像の映像データを映像処理する映像処理部36と、映像処理部36により処理された映像データを転送するデータ転送部37と、データ転送部37により転送された映像データをネットワークに送信するネットワーク通信部38とを備えている。
Further, as shown in FIG. 3, the video conference camera A has a function of directing the
次に、このようなテレビ会議用カメラAにおける動作について説明する。以下の説明では、図5(a)に示すように、開口11と開口12とから等しい距離で開口13及び開口14とは反対側の45°に位置する発言者から音声が発せられた場合を例として説明する。図5(b)に示すように、各マイク1〜4に対応する周波数成分の出力値は、2.5kHz〜10kHzの間でピーク値に差が見られる。より具体的には、2.5kHz〜10kHzの間に見られる出力値は、マイク1,2では同等であり、マイク3,4ではマイク1,2よりも減衰している。一方、2.5kHz未満に見られる出力値は、マイク1〜4で略等しくなっている。
Next, the operation of the video conference camera A will be described. In the following description, as shown in FIG. 5A, a case where a voice is uttered from a speaker located at 45 ° opposite to the
音源方向推定装置20では、HPF21によって2.5kHz未満の周波数成分は遮断され、2.5kHz以上の周波数成分が通過させられる。図5(b)に示す例の場合、回折の影響を大きく受けた2.5kHz〜10kHzの間に見られる出力値に基づいて音源の方向が演算され、音源は、45°の位置にあると推定される。音源方向推定装置20は、45°を示す信号をモータ制御部31に出力する。
In the sound source
モータ制御部31は、音源方向推定装置20から出力された45°を示す信号を入力し、モータ駆動部32を制御してモータ33を駆動させ、カメラ35が45°の方向へ向くように、カメラ回転機構34によってカメラ35を第2筺体10bと共に旋回させる。なお、モータ制御部31によるカメラ35の旋回制御は、所定時間連続して一定範囲内の音源の方向が入力された際に、入力された一定範囲内の音源の方向の平均値を用いて実行されてもよい。
The
カメラ35は、前方の映像を取得し、取得した映像を示す映像データを生成する。カメラ35は、生成した映像データを映像処理部36に出力する。映像処理部36は、カメラ35から出力された映像データを入力し、入力した映像データに映像処理を施し、映像処理後の映像データをデータ転送部37に出力する。データ転送部37は、映像処理部36から出力された映像データを入力し、入力した映像データをネットワーク通信部38に転送する。そして、ネットワーク通信部38は、データ転送部37から転送された映像データをネットワークを介して相手方のテレビ会議システムに送信する。
The
本実施形態の音源方向推定装置20によれば、第1筺体10aの外部の音源で生じた音が各開口11〜14を通じて第1筺体10a内に取り込まれ、第1筺体10a内に埋設された各マイク1〜4により、第1筺体10a内に伝搬した音が電気信号に変換される。そして、各マイク1〜4から出力された電気信号のうち2.5kHz以上の周波数成分がHPF21を通過することで、音源の位置する角度との高い相関関係を有する帯域の周波数成分を抽出することができ、音源方向演算部23によって、HPF21を通過した周波数成分に基づいて音源の方向が推定されるため、各マイク1〜4が無指向性であっても音源の方向を推定することができる。更に、各マイク1〜4は、各開口11〜14に向けられた前面側でのみ集音すればよいので、各マイク1〜4の背面側に集音のための空間を設ける必要がなく、第1筺体10a内の内部空間Sを配線や他の部品の配置のために利用でき、その結果として第1筺体10aのコンパクト化が図られる。また、各マイク1〜4は第1筺体10a内に埋設されるため、筺体から突出した位置にマイクを設置する場合に比して外観の向上が図られる。
According to the sound source
更に、筒状体16〜19が設けられることにより、各マイク1〜4の振動板1a〜4aよりも大きい断面を有する伝搬路B1〜B4を通って各開口11〜14から各マイク1〜4へと音が伝わるため、この音が各振動板1a〜4aに確実に伝わり、音源の方向をより一層精度良く推定することができる。
Furthermore, by providing the
また、各開口11〜14から各マイク1〜4までの最短距離が各開口11〜14の内径よりも大きいため、周波数の高い音が各マイク1〜4に直接達してしまうことが防止され、各開口11〜14付近での回折によって減衰した音が各マイク1〜4に達し、上記した音源の方向の推定効果がより好適に発揮される。 Moreover, since the shortest distance from each opening 11-14 to each microphone 1-4 is larger than the internal diameter of each opening 11-14, it is prevented that the sound with a high frequency reaches each microphone 1-4 directly, The sound attenuated by the diffraction in the vicinity of each opening 11-14 reaches each microphone 1-4, and the above-described effect of estimating the direction of the sound source is more suitably exhibited.
以上、本発明の好適な実施形態について説明したが、本発明は上記実施形態に限られるものではない。 The preferred embodiment of the present invention has been described above, but the present invention is not limited to the above embodiment.
例えば、上記実施形態では、筒状体16〜19は第1筺体10aの半径方向に配置され、各伝搬路B1〜B4は水平に延びる場合について説明したが、筒状体16〜19は、第1筺体10aの中心側から各開口11〜14に向けて上方又は下方に傾斜するように配置されてもよい。このような構成によれば、テレビ会議用カメラが会議の参加者の頭部の位置よりも低い位置又は高い位置に設置される場合であっても、発言者の音声を第1筺体10a内に効果的に取り込むことができる。
For example, in the above-described embodiment, the
また、上記実施形態では、筒状体16〜19は円筒形状である場合について説明したが、角筒形状であってもよい。この場合、伝搬路は角柱形状となる。また、マイク1〜4は円柱形状である場合について説明したが、直方体形状であってもよい。 Moreover, although the cylindrical bodies 16-19 demonstrated the case where it was a cylindrical shape in the said embodiment, a rectangular tube shape may be sufficient. In this case, the propagation path has a prismatic shape. Moreover, although the microphones 1-4 demonstrated the case where it was cylindrical shape, a rectangular parallelepiped shape may be sufficient.
また、上記実施形態では、4個のマイク1〜4が設けられる場合について説明したが、マイクの設置個数は1〜3個であってもよく、5個以上であってもよい。例えば、音源方向推定装置の周囲で発生する音の大きさが予め想定される場合には、1個のマイクによって、所定の周波数以上の周波数成分の出力値に基づいて音源の方向を推定することができる。 Moreover, although the said embodiment demonstrated the case where the four microphones 1-4 were provided, the installation number of microphones may be 1-3, and may be five or more. For example, when the volume of sound generated around the sound source direction estimation device is assumed in advance, the direction of the sound source is estimated based on the output value of the frequency component of a predetermined frequency or more with one microphone. Can do.
また、HPF21における遮断周波数は、マイクの特定に応じて可聴域内の範囲で適宜設定することができる。また、HPF21に加えて、HPF21を通過した周波数成分のうちHPF21の遮断周波数よりも高い周波数以下(例えば7kHz以下)の周波数成分を通すローパスフィルターを設けてもよい。この場合、HPF21及びローパスフィルターによってバンドパスフィルターが構成される。
Further, the cutoff frequency in the
更にまた、上記実施形態では、音源方向推定装置20がテレビ会議用カメラAに適用される場合について説明したが、マイクを備えて音源の方向を推定し、推定した音源の方向を利用する装置であればこれに限られない。例えば、本発明の音源方向推定装置は、異常音を検知して、その異常音が発生した音源の方向を映す監視カメラ等にも適用できる。
Furthermore, in the above-described embodiment, the case where the sound source
1〜4…マイク、1a〜4a…振動板、10a…筺体、11〜14…開口、16〜19…筒状体、20…音源方向推定装置、21…HPF、23…音源方向演算部(音源方向推定部)、B1〜B4…伝搬路。 DESCRIPTION OF SYMBOLS 1-4 ... Microphone, 1a-4a ... Diaphragm, 10a ... Housing, 11-14 ... Opening, 16-19 ... Cylindrical body, 20 ... Sound source direction estimation apparatus, 21 ... HPF, 23 ... Sound source direction calculating part (sound source Direction estimation unit), B1 to B4... Propagation path.
Claims (3)
前記筺体の前記開口の内側に埋設され、前記開口を通って前記筺体内に伝搬する前記音により振動板を振動させて前記音を電気信号に変換するマイクロフォンと、
前記マイクロフォンから出力された前記電気信号のうち可聴域内にある所定の周波数以上の周波数成分を通過させるハイパスフィルタと、
前記ハイパスフィルタを通過した前記周波数成分に基づいて前記音源の方向を推定する音源方向推定部と、
を備えることを特徴とする音源方向推定装置。 A housing in which an opening for capturing sound generated by an external sound source is formed;
A microphone that is embedded inside the opening of the housing and oscillates a diaphragm by the sound that propagates through the opening and into the housing, and converts the sound into an electrical signal;
A high-pass filter that passes a frequency component of a predetermined frequency or higher in the audible range of the electrical signal output from the microphone;
A sound source direction estimation unit that estimates the direction of the sound source based on the frequency component that has passed through the high-pass filter;
A sound source direction estimating apparatus comprising:
前記マイクロフォンは、前記筒状体の端部に配置されており、
前記伝搬路の断面は、前記マイクロフォンの前記振動板よりも大きいことを特徴とする請求項1記載の音源方向推定装置。 The casing is provided with a cylindrical body that forms a propagation path extending from the opening toward the casing,
The microphone is disposed at an end of the cylindrical body;
The sound source direction estimating apparatus according to claim 1, wherein a cross section of the propagation path is larger than the diaphragm of the microphone.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010103971A JP2011232238A (en) | 2010-04-28 | 2010-04-28 | Sound source direction estimation device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010103971A JP2011232238A (en) | 2010-04-28 | 2010-04-28 | Sound source direction estimation device |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2011232238A true JP2011232238A (en) | 2011-11-17 |
Family
ID=45321686
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010103971A Pending JP2011232238A (en) | 2010-04-28 | 2010-04-28 | Sound source direction estimation device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2011232238A (en) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017143406A (en) * | 2016-02-10 | 2017-08-17 | 日本電信電話株式会社 | Binaural sound generation device, microphone array, binaural sound generation method, program |
CN110850360A (en) * | 2018-08-21 | 2020-02-28 | 三星电子株式会社 | Sound direction detection sensor and electronic device comprising same |
JP2022189837A (en) * | 2017-09-01 | 2022-12-22 | 三星電子株式会社 | Sound direction detection sensor |
JP7403778B2 (en) | 2018-01-16 | 2023-12-25 | 株式会社ユピテル | Sound source direction identification device |
-
2010
- 2010-04-28 JP JP2010103971A patent/JP2011232238A/en active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017143406A (en) * | 2016-02-10 | 2017-08-17 | 日本電信電話株式会社 | Binaural sound generation device, microphone array, binaural sound generation method, program |
JP2022189837A (en) * | 2017-09-01 | 2022-12-22 | 三星電子株式会社 | Sound direction detection sensor |
JP7403778B2 (en) | 2018-01-16 | 2023-12-25 | 株式会社ユピテル | Sound source direction identification device |
CN110850360A (en) * | 2018-08-21 | 2020-02-28 | 三星电子株式会社 | Sound direction detection sensor and electronic device comprising same |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5097523B2 (en) | Voice input device | |
US9226070B2 (en) | Directional sound source filtering apparatus using microphone array and control method thereof | |
DK2107828T3 (en) | Interior with a sound sensor and two sound detectors | |
JP5338040B2 (en) | Audio conferencing equipment | |
JP5129024B2 (en) | Audio input device and audio conference system | |
WO2010013602A1 (en) | Differential microphone | |
KR20120049534A (en) | Apparatus for sound source signal processing and method thereof | |
WO2009145096A1 (en) | Audio input device, method for manufacturing the same, and information processing system | |
WO2009142249A1 (en) | Voice input device and manufacturing method thereof, and information processing system | |
JP2009005071A (en) | Voice input/output device and speech apparatus | |
JP2011232238A (en) | Sound source direction estimation device | |
WO2016103779A1 (en) | External auditory canal-fitted earphone microphone | |
US8135144B2 (en) | Microphone system, sound input apparatus and method for manufacturing the same | |
WO2008062848A1 (en) | Voice input device, its manufacturing method and information processing system | |
WO2023015486A1 (en) | Microphone | |
JP6433630B2 (en) | Noise removing device, echo canceling device, abnormal sound detecting device, and noise removing method | |
JP2011234213A (en) | Sound source direction estimation apparatus | |
JP4212635B1 (en) | Voice input device, manufacturing method thereof, and information processing system | |
JP2011232237A (en) | Sound source direction estimation device | |
JP5141442B2 (en) | Sound collecting device and sound emitting and collecting device | |
JP2009055483A (en) | Intercom device | |
JP4853382B2 (en) | Telephone device | |
JP4893644B2 (en) | Telephone device | |
JP4874029B2 (en) | Acoustic device and communication device | |
EP1657960B1 (en) | Method for detection of ultrasound in a listening device with two or more microphones, and listening device with two or more microphones |