JP2013135373A - ズームマイク装置 - Google Patents

ズームマイク装置 Download PDF

Info

Publication number
JP2013135373A
JP2013135373A JP2011285158A JP2011285158A JP2013135373A JP 2013135373 A JP2013135373 A JP 2013135373A JP 2011285158 A JP2011285158 A JP 2011285158A JP 2011285158 A JP2011285158 A JP 2011285158A JP 2013135373 A JP2013135373 A JP 2013135373A
Authority
JP
Japan
Prior art keywords
sound
microphone
opening
microphones
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2011285158A
Other languages
English (en)
Inventor
Kenta Niwa
健太 丹羽
Sumitaka Sakauchi
澄宇 阪内
Kenichi Furuya
賢一 古家
Manabu Okamoto
学 岡本
Yoichi Haneda
陽一 羽田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2011285158A priority Critical patent/JP2013135373A/ja
Publication of JP2013135373A publication Critical patent/JP2013135373A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

【課題】反射器内に配置される全てのマイクロホンの観測信号を拡散状態に近いものとし、観測信号のレベルを従来技術と同等以上の大きさとしつつ、観測信号に含まれる雑音を低減して目的音を高SN比で収音できるズームマイク装置を提供する。
【解決手段】ズームマイク装置は複数個のマイクロホンと、音を反射可能な素材により作成された反射器とにより構成される。反射器は第一の反射部と第二の反射部とを有する。第一の反射部は開口部を有し、開口部以外は複数個のマイクロホンが配置された三次元空間を囲む構造であり、かつ、開口部から入射した音が複数回反射してマイクロホンに達し得る構造である。第二の反射部は、第一の反射部の開口部に接する第一の開口部と、ズームマイク装置外の空間に接する第二の開口部とを有し、収音対象としない空間で発せられた音が第一の反射部内部に到達するのを防ぐ構造である。
【選択図】図9

Description

本発明は所望の位置を含む狭い範囲の音声を強調する技術(狭指向音声強調技術)を実現するズームマイク装置に関する。
例えばマイクロホンを備えた動画撮影装置(ビデオカメラやカムコーダ)で被写体をズームイン撮影する場合を考えると、ズームイン撮影に連動して被写体近傍のみからの音声が強調されることが動画撮影にとって好ましい。このような、所望の位置(目的位置)を含む狭い範囲の音声を強調する技術(狭指向音声強調技術)は、従来から研究・開発されている。なお、マイクロホンの周囲の方向とマイクロホンの感度との関係は指向性と呼ばれ、或る方向への指向性が鋭いほど、当該方向を含む狭い範囲の音声を強調し、当該範囲以外の範囲の音声を抑圧することができる。なお、この明細書では、「音声」は、人の発する声に限定されるものではなく、人や動物の声はもとより楽音や環境雑音など「音」一般を指す。
音源とマイクロホン間の伝達特性は、観測する環境に依存して変化する。例えば部屋の環境(広さ、壁の位置や素材等)やマイクロホンの近傍に設置された反射物の影響を受ける。非特許文献1では反射板をマイクロホンアレーの近傍に配置し、伝達特性自体を変えて、その影響を考慮したビームフォーミングのフィルタを設計することで、狭指向音声強調技術を実現している。後述するが、狭指向音声強調技術を実現するためには、伝達特性をより拡散状態に近づけたほうがよい。非特許文献1では反射板で音を多重反射させることで拡散状態に近い観測信号を生成している。なお、「拡散状態」とは等方位的に音が到来する状態であり、観測信号とはマイクロホンアレーを構成する各マイクロホンで観測される信号である。
図1は従来技術のズームマイク装置7の概念図を示す。断面L字状に配置された反射板71に各マイクロホン72を埋め込む。このような方法では、各マイクロホン72の観測信号に含まれる反射音の数が少ないので拡散状態に近い観測信号を生成できない。
図2は非特許文献1のズームマイク装置8の概念図を示す。ズームマイク装置7の短所を修正するために、ズームマイク装置8では四角形の1つの角を削った形状の反射板81を用いる。目的音源73に対してマイクロホンの開口面が見えるように配置するために、一部の各マイクロホン72は内向きに、残りの各マイクロホン82は外向きに反射板81に埋め込む。一部の各マイクロホン72には反射板81で囲われている空間内で多重反射した音が到来する。各マイクロホン72の拡散状態に近い観測信号に基づきフィルタを設計することで狭指向音声強調技術を実現している。
丹羽健太、阪内澄宇、古家賢一、岡本学、羽田陽一、「大型多重反射板付きマイクロホンアレーを用いた超指向性収音」、日本音響学会研究発表会講演論文集、2011年
本来は全てのマイクロホンの観測信号が拡散状態に近いものとなることが望ましい。しかしながら非特許文献1のズームマイク装置8ではその条件を満たすことはできない。つまり残りの各マイクロホン82の観測信号には反射音が含まれておらず、拡散状態に近いものとは言えない。
上述の問題を解決するために以下に示すズームマイク装置9が考えられる。図3はズームマイク装置9の概念図を示す。全てのマイクロホンの観測信号を拡散状態に近いものとするために、ズームマイク装置9では反射板81に対して全てのマイクロホン92を内向きに埋め込む。このような構成とすることで全てのマイクロホン92の観測信号が拡散状態に近いものとなる。しかし目的音源73に対するマイクロホンの開口面積dが、ズームマイク装置7及び8それぞれの開口面積d及びdに比べ小さくなる。開口面積が小さいと観測信号のレベルが小さくなり、目的音を高SN比で収音することが困難となる。
またズームマイク装置7、8及び9の何れも周囲の雑音源74から発せられる雑音が回り込むため、SN比が低くなる。特にズームマイク装置8は残りの各マイクロホン82が外向きに埋め込まれているため観測信号に含まれる雑音の量が多くなるという問題がある。
本発明は、反射器内に配置される全てのマイクロホンの観測信号を拡散状態に近いものとし、観測信号のレベルを従来技術と同等以上の大きさとしつつ、観測信号に含まれる雑音を低減して目的音を高SN比で収音できるズームマイク装置を提供することを目的とする。
上記の課題を解決するために、本発明の第一の態様によれば、ズームマイク装置は複数個のマイクロホンと、音を反射可能な素材により作成された反射器とにより構成される。反射器は第一の反射部と第二の反射部とを有する。第一の反射部は開口部を有し、開口部以外は複数個のマイクロホンが配置された三次元空間を囲む構造であり、かつ、開口部から入射した音が複数回反射してマイクロホンに達し得る構造である。第二の反射部は、第一の反射部の開口部に接する第一の開口部と、ズームマイク装置外の空間に接する第二の開口部とを有し、収音対象としない空間で発せられた音が第一の反射部内部に到達するのを防ぐ構造である。
本発明に係るズームマイク装置によれば、反射器内に配置される全てのマイクロホンの観測信号を拡散状態に近いものとし、処理対象の信号のレベルを従来技術と同等以上の大きさとし、さらに雑音を排除して目的音を高SN比で収音できるという効果を奏する。
従来技術のズームマイク装置の概略図。 非特許文献1のズームマイク装置の概略図。 非特許文献1に対し変更を加えたズームマイク装置の概略図。 図4Aは目的音源から発せられた音が反射板に反射し、マイクロホンに等方位的に到来する状態を示す図であり、図4Bは図4Aの反射板81による鏡像を示す図。 二乗ノルム化された相互相関|γ(ω,Δp ,q )|と距離|Δp |/λとの関係を示す図。 次元比ε、固有値λ及び固有値密度関数f(λ)の関係を示す図。 第一実施形態に係るズームマイク装置の機能構成を示す図。 第一実施形態に係るズームマイク装置の処理フローを示す図。 反射器に対する各マイクロホンの配置例を示す断面図。 図9の反射器の概略図。 第一反射部の開口部及び開口部以外の断面の長さ、第二反射部の第一開口部及び第二開口部の断面の長さの示す図。 第一実施形態に係るズームマイク装置の正面図。 第一実施形態に係るズームマイク装置の側面図。 第一反射部の形状の変形例を示す図。 第二反射部の形状の変形例を示す図。 第二反射部の形状の別の変形例を示す図。 反射器に対するマイクロホンの別の配置例を示す断面図。
以下、本発明の実施形態について説明する。なお、以下の説明に用いる図面では、同じ機能を持つ構成部や同じ処理を行うステップには同一の符号を記し、重複説明を省略する。以下の説明において、テキスト中で使用する記号「」は、本来直前の文字の真上に記載されるべきものであるが、テキスト記法の制限により、当該文字の直後に記載する。式中においてはこれらの記号は本来の位置に記述している。また、ベクトルや行列の各要素単位で行われる処理は、特に断りが無い限り、そのベクトルやその行列の全ての要素に対して適用されるものとする。
<第一実施形態の原理>
本実施形態では反射器をマイクロホンの近傍に設置することで、拡散状態に近い観測信号を生成し、これに基づき拡散センシングを実装し、狭指向音声強調技術を実現している。なお、拡散センシングとは”拡散状態にある信号を観測することで、多チャネルのセンサーを効果的に利用した空間制御を可能にすること”である。以下、本実施形態の原理について説明する。
<ビームフォーミングの定式化>
異なる位置にあるN個の音源から到来する音をM本のマイクロホンが捉えるものとする。但し、Mは1より大きい整数であり、NはMより大きい整数である。つまり、1<M<Nである。mをマイクロホンのインデックスとし、m=1,…,Mであり、mに関して「マイクロホンのインデックス」を単に「マイクロホン」ともいう。nを音源のインデックスとし、n=1,…,Nであり、nに関して「音源のインデックス」を単に「音源」ともいう。マイクロホンmの位置をp =[pmx,pmy,pmz]、音源nの位置をq =[qnx,qny,qnz]とする。音源nとM個のマイクロホンm間の周波数ωにおける音響伝達特性をa(ω,q )=[a(ω,p ,q ),…,a(ω,p ,q )]と定義し、N個の音源nとM個のマイクロホンm間の周波数ωにおける音響伝達特性行列をA(ω)=[a(ω,q ),…,a(ω,q )]と定義する。但し、ωは離散周波数のインデックス(周波数fと角周波数ωとの間にはω=2πfの関係があるから、離散周波数のインデックスωをこの角周波数ωと同一視してもかまわない。ωに関して「離散周波数のインデックス」を単に「周波数」ともいう)、は転置を表す。tを時刻(もしくはある時刻に対応するフレーム番号)のインデックスとし、tに関して「時刻のインデックス」を単に「時刻」ともいう。時刻t、周波数ωにおけるMチャネルの観測信号X(ω,t)=[X(ω,t),…,X(ω,t)]は、音響伝達特性行列A(ω)=[a(ω,q ),…,a(ω,q )]とN個の音源信号S(ω,t)=[S(ω,t),…,S(ω,t)]を用いると以下の式で表される。
Figure 2013135373
N個の音源信号S(ω,t)が互いに無相関な系列だと仮定すると以下の式が成り立つ(非特許文献1参照)。
Figure 2013135373
但し、<・>及びIはそれぞれ共役転置、期待値演算子及び単位行列を表す。
目的位置q から発せられる目的音の周波数領域表現を周波数ωで強調するフィルタをW(ω,q )とする。このとき、目的音の周波数領域表現が周波数ωで強調された周波数領域信号(以下、出力信号と呼ぶ)Y(ω,t,q )は以下の式で与えられる。
Figure 2013135373
フィルタW(ω,q )の設計法としては種々あるが、ここでは最小分散無歪応答法(MVDR method;minimum variance distortion response method)に拠る場合を説明する。最小分散無歪応答法では、フィルタW(ω,q )は、目的音に対応するゲインを以下の式(5)の拘束条件で拘束し、空間相関行列R(ω)を用いて出力信号Y(ω,t)のパワー|Y(ω,t)|が周波数ωで最小となるように設計される(式(4)参照)。a(ω,q )=[a(ω,q ),…,a(ω,q )]は、目的位置q に音源が在ると仮定した場合の、当該音源とM本のマイクロホンとの間の周波数ωでの伝達特性である。換言すれば、a(ω,q )は、各マイクロホンmへの目的位置q の音声の周波数ωでの伝達特性である。
Figure 2013135373
式(4)の最適解であるフィルタW(ω,q )は以下の式で与えられることが知られている。
(参考文献1)Simon Haykin著、鈴木博他訳、「適応フィルタ理論」、初版、株式会社科学技術出版、2001.pp.66-73,248-255
Figure 2013135373
空間相関行列R(ω)の逆行列が式(6)に含まれることから察せられるように、空間相関行列R(ω)の構造は鋭い指向性を実現する上で重要であることがわかる。また、式(6)から、目的位置q 以外の位置から発せられる音声(以下「目的位置q 以外の位置から発せられる音声」を「雑音」とも呼ぶ)のパワーは空間相関行列R(ω)の構造に依存することもわかる。
ここでa(ω,q )は既知であり、方向だけでなく、距離に依存する量である。観測信号の空間的な性質を表す空間相関行列R(ω)は以下の式で計算される(非特許文献1参照)。
Figure 2013135373
なお式(7)の展開は式(2)と期待値演算を平均化処理で置き換えることで実現している。
従来技術では、観測信号に対する最適なフィルタ設計が課題となっており、式(6)の最小分散無歪応答法もその一つの方法である。つまり、ある固定の空間相関行列R(ω)に対して最適なフィルタW(ω)を設計することが課題となっていた。しかし、これでは周波数帯域によっては出力信号のパワーを小さくできないことがあった。そこで本実施形態では出力信号のパワーを最小化するために最適な観測信号を生成する。つまり反射器を用いて空間相関行列R(ω)を変更し、変更した空間相関行列R(ω)に応じたフィルタW(ω)を設計することで出力信号のパワーを最小化する。以下、出力信号のパワーを最小化するために最適な空間相関行列R(ω)の構造について説明する。
<チャネル間の相互相関>
マイクロホンアレーを用いたビームフォーミングでは、マイクロホン間に生じる情報の差(時間差、振幅差など)を利用して指向制御してきた。よって、マイクロホン間の情報に差をつけること、換言すると、チャネル間の相互相関を小さくすることは重要なことである。p とp +Δp の位置にある二本のマイクロホンのチャネル間の相互相関は以下の式で計算される。
Figure 2013135373
但しは複素共役を表す。
以下、反射を多数繰り返し、等方位的に反射音が到来する場合の観測信号を拡散信号と呼ぶ。図4Aは目的音源73から発せられた音が反射板81に反射し、マイクロホンmに等方位的に到来する状態を示し、図4Bは図4Aの反射板81による鏡像を示す。このようにしてマイクロホンmで収音した観測信号が拡散信号である。拡散信号は拡散状態に近い信号と言える。例えばトンネルや洞窟の中で発せられた際の残響がかった音が拡散信号に近い。
拡散信号が到来する際の、p とp +Δp の位置にある二本のマイクロホンのチャネル間の相互相関γ(ω,Δp ,q )は以下の式で与えられることが知られている。
(参考文献2)唐沢好男、「ディジタル移動通信の電波伝搬基礎」、コロナ社、2003年、p.65-67
Figure 2013135373
ここでk(=ω/c)及びcはそれぞれ波数及び音速を表す。図5は二乗ノルム化された相互相関|γ(ω,Δp ,q )|と距離|Δp |/λとの関係を示す。但しこのλは波長を示す。図中、直接音のみの場合のθは二本のマイクロホンに対する直接音の発せられる方向を、σθはその標準偏差を表す。|γ(ω,Δp ,q )|は、二つのマイクロホン間の距離が大きくなるほど小さくなることが分かる。さらに、拡散信号の相互相関は、直接音のみの相互相関に比べ、距離に対して急激に小さくなることが分かる。例えば、|Δp |/λ=0.13以上のとき、拡散信号の相互相関|γ(ω,Δp ,q )|は0.1以下になるのに対し、直接音のみの相互相関はほぼ1.0である。従って、所定の大きさの空間内に複数個のマイクロホンを配置し拡散信号を観測する場合、直接音のみを観測する場合に比べて、相互相関を小さくするために必要なマイクロホン間の距離を小さくすることができる。それにより所定の大きさの空間内に配置できるマイクロホンの個数を多くすることができ、収音できる音が増加し、狭指向音声強調性能が向上する。
同様に、q とq +Δq の位置にある二つの音源間の相互相関γ(ω,p ,Δq )も、直接音のみの相互相関に比べ、拡散信号の相互相関のほうが距離に対して急激に小さくなる。従って、所定の大きさの収音空間内に複数の音源位置を設定し、拡散信号を観測する場合、直接音のみを観測する場合に比べて、相互相関を小さくするために必要な音源位置間の距離を小さくすることができ、収音空間内により多くの音源位置を設定することができる。つまり、音源位置をより細かく設定することができ、狭指向音声強調性能が向上する。
拡散信号を観測したときの音響伝達特性行列A(ω)の構成要素であるa (ω,p ,q )の統計的性質について述べる(非特許文献1参照)。前述の通り、拡散信号を用いマイクロホン間の距離及び音源位置間の距離を十分に大きくとれば、チャネル間の相互相関が小さくなるので、a (ω,p ,q )の実部と虚部とは、それぞれ独立に平均0、分散1の正規分布に従う。よってa (ω,p ,q )の平均、分散に関する性質は以下の式で表される。
Figure 2013135373
<空間相関行列R(ω)の固有値分布>
空間相関行列R(ω)の構造について説明する。まず空間相関行列R(ω)の構造を調査するために、固有値分解すると以下の式で表すことができる。
Figure 2013135373
但しdiag{・}は対角行列を表す。V(ω)はM個の固有ベクトルv (ω)で構成され、Λ(ω)はM個の固有値λ(ω)で構成される。なお、M個の固有値はλ(ω)≧…≧λ(ω)の順とする(非特許文献1参照)。
ここで、ランダム行列の共分散行列であるWishart行列の極限固有値定理を用いることで、空間相関行列R(ω)の固有値密度関数を導出する。まず音響伝達特性行列A(ω)の行と列の次元の比εを以下の式で定義する。
Figure 2013135373
音響伝達特性行列A(ω)を構成するa (ω,p ,q )が独立に式(10)、(11)を満たす正規分布に従うとき、R(ω)の固有値密度関数f(λ)は以下の式で計算される。
Figure 2013135373
図6は次元比ε、固有値λ及び固有値密度関数f(λ)の関係を示す。図6からεを小さくすることで固有値λが存在する範囲が狭くなり、1に集中することが分かる。つまり、観測信号の拡散の度合いを高めて、式(10)、(11)を満たす正規分布に従うことが成り立つように音源位置数Nを増やすことができれば、R(ω)のM個の固有値λ(ω)は平滑に近づき、全て1に漸近的に近づく。よってΛ(ω)は以下の式で表される。
Figure 2013135373
なお単純に音源位置数Nを増やすと、二つの音源間の距離が小さくなり、二つの音源間の相互相関γ(ω,p ,Δq )が大きくなる。そうするとa (ω,p ,q )の実部と虚部とは、それぞれ独立との要件を満たさなくなり、式(10)、(11)を満たさなくなる。本実施形態では拡散信号を観測することで収音空間内により多くの音源位置を設定し、音源位置数Nを増やすことができる。
<出力信号のパワー>
拡散信号を観測したときの式(4)の出力信号のパワーを計算する。式(6)のフィルタと式(12)の固有値、固有ベクトルを用いて、出力信号のパワーを書き直すと、以下の式になる(非特許文献1参照)。
Figure 2013135373
拡散信号を観測したとき、式(15)に示した通りM個の固有値λ(ω)は1と近似できるので、式(16)の値に注目する。固有ベクトルは直交規定群であることと、式(11)の統計的な性質から式(16)中の分子は以下のようにMに近似できる。
Figure 2013135373
よって拡散信号を観測したときの出力信号のパワーは以下の式で近似される。
Figure 2013135373
式(18)は重要な式である。それは出力信号のパワーがマイクロホン数Mのみに依存して周波数ωやマイクロホンアレーのサイズには依存しないことを示しているためである。拡散信号を観測する場合、所定の大きさの空間内により多くのマイクロホンを配置できMを大きくして出力信号のパワーを小さくできる。
上述のようにして拡散センシングを実現している。つまり拡散センシングでは観測信号の拡散の度合いを高めるように反射器を用いて制御することで(i)チャネル間の相互相関が小さくなる、(ii)空間相関行列の固有値が漸近的に1で近似できるようになる、(iii)出力信号のパワーをマイクロホン数Mのみに依存して抑圧することができる。但し、拡散センシングでは音響伝達特性行列A(ω)が既知であることを仮定している。そして音響伝達特性行列A(ω)を使って、式(7)により空間相関行列R(ω)を設計し、式(6)によりフィルタW(ω)を設計する。なお、音響伝達特性行列A(ω)は利用に先立ち、計算機上でシミュレーションして算出したり、実測することで事前に用意し、既知のものとすることができる。
以下、本実施形態の構成及び処理フローについて説明する。
<第一実施形態>
第一実施形態に係るズームマイク装置1の機能構成及び処理フローをそれぞれ図7及び図8に示す。なお、観測信号を拡散信号とするためのハードウェア構成については後述する。ズームマイク装置1はAD変換部210、フレーム生成部220、周波数領域変換部230、フィルタ適用部240、時間領域変換部250、フィルタ設計部260、記憶部290を含む。
<ステップS1>
予め、フィルタ設計部260が音声強調の対象となりえる測定位置ごとに、周波数ごとのフィルタW(ω,q )を計算しておく。音声強調の対象となりえる測定位置の総数をI(Iは1以上の予め定められた整数であり、I≦Pを満たす)とすると、W(ω,q ),…,W(ω,q ),…,W(ω,q )(1≦i≦I,ω∈Ω;iは整数、Ωは周波数ωの集合)を事前に計算しておくのである。このためには、伝達特性a(ω,q )=[a(ω,q ),…,a(ω,q )](1≦i≦I,ω∈Ω)を利用に先立ち求める必要があるが、前述の通り計算機上でシミュレーションして算出してもよいし、実環境下におけて実測することで事前に用意してもよい。シミュレーション法としては種々あるが、以下にその一例を示す。この例では伝達特性a(ω,q )を、次式のように、1つの直接音のステアリングベクトルh (0)(ω)とD個の反射音のステアリングベクトルh (d)(ω)(但し1≦d≦D)との和で表現する。
Figure 2013135373
但し、κ(d)(ω)はd番目の反射音の反射係数を、p (d)はマイクロホンmのd番目の仮想マイクロホン(鏡像)の位置を、cは音速を表し、式(19C)の||p (d)―q ||は、音源iからマイクロホンmのd番目の仮想マイクロホンまでの距離を表す。
そして、伝達特性a(ω,q )を用いて、式(6)によってW(ω,q )(1≦i≦I)を求める。なお、空間相関行列R(ω)は式(7)で計算できる。I×|Ω|個のフィルタW(ω,q )(1≦i≦I,ω∈Ω)は記憶部290に記憶される。|Ω|は集合Ωの要素数を表す。
<ステップS2>
M個のマイクロホン200−1,…,200−Mを用いて収音する。Mは2以上の整数である。
M個のマイクロホンの並べ方に制限は無い。ただし、2次元または3次元的にM個のマイクロホンを配置することによって、音声強調する方向の不確定性がなくなるという利点がある。つまり、M個のマイクロホンを水平方向に直線状に並べたときに例えば正面方向から到来する音声と真上から到来する音声との区別ができなくなるという問題を、マイクロホンを平面的ないし立体的に並べることで防ぐことができる。また、測定位置として設定できる範囲を広くとるためには、各マイクロホンの指向性は、収音位置である目的位置q になり得る位置にある程度の音圧で音声を収音可能な指向性を持っていたほうがよい。したがって、無指向性マイクロホンや単一指向性マイクロホンといった指向性が比較的緩やかなマイクロホンが好適である。
<ステップS3>
AD変換部210が、M個のマイクロホン200−1,…,200−Mで収音されたアナログ信号(収音信号)をディジタル信号x(k)=[x(k),…,x(k)]へ変換する。kは離散時間のインデックスを表す。
<ステップS4>
フレーム生成部220は、AD変換部210が出力したディジタル信号x(k)=[x(k),…,x(k)]を入力とし、チャネルごとにPサンプルをバッファに貯めてフレーム単位のディジタル信号x(t)=[x (t),…,x (t)]を出力する。tはフレーム番号のインデックスである。x (t)=[x((t−1)P+1),…,x(tP)](1≦m≦M)である。Pはサンプリング周波数にもよるが、16kHzサンプリングの場合には512点あたりが妥当である。
<ステップS5>
周波数領域変換部230は、各フレームのディジタル信号x(t)を周波数領域の信号X(ω,t)=[X(ω,t),…,X(ω,t)]に変換して出力する。ωは離散周波数のインデックスである。時間領域信号を周波数領域信号に変換する方法の一つに高速離散フーリエ変換があるが、これに限定されず、周波数領域信号に変換する他の方法を用いてもよい。周波数領域信号X(ω,t)は、各周波数ω、フレームtごとに出力される。
<ステップS6>
フィルタ適用部240は、フレームtごとに、各周波数ω∈Ωについて、周波数領域信号X(ω,t)=[X(ω,t),…,X(ω,t)]に、強調したい目的位置q に対応するフィルタW(ω,q )を適用して、出力信号Y(ω,t,q )を出力する(以下の式(21)参照)。目的位置q のインデックスSは、S∈{1,…,I}であり、フィルタW(ω,q )は記憶部290に記憶されているので、例えば、ステップS6の処理の都度、フィルタ適用部240は、強調したい目的位置q に対応するフィルタW(ω,q )を記憶部290から取得すればよい。目的位置q のインデックスSが集合{1,…,I}に属さない場合、つまり、目的位置q に対応するフィルタW(ω,q )がステップS1の処理で計算されていない場合、臨時に目的位置q に対応するフィルタW(ω,q )をフィルタ設計部260に計算させてもよいし、あるいは目的位置q に近い位置q S’に対応するフィルタW(ω,q S’)を用いてよい。
Figure 2013135373
<ステップS7>
時間領域変換部250は、第tフレームの各周波数ω∈Ωの出力信号Y(ω,t,q )を時間領域に変換して第tフレームのフレーム単位時間領域信号y(t)を得て、さらに、得られたフレーム単位時間領域信号y(t)をフレーム番号のインデックスの順番に連結して目的位置q の音声が強調された時間領域信号y(k)を出力する。周波数領域信号を時間領域信号に変換する方法は、ステップS5の処理で用いた変換方法に対応する逆変換であり、例えば高速離散逆フーリエ変換である。
ここでは、ステップS1の処理で予めフィルタW(ω,q )を計算しておく実施形態を説明したが、ズームマイク装置1の計算処理能力などに応じて、目的位置q が定まってからフィルタ設計部260が周波数ごとのフィルタW(ω,q )を計算する実施形態を採用することもできる。
<ハードウェア構成>
本実施形態のポイントは各マイクロホンの観測信号が拡散信号となる点である。なお、音源から放射された音がマイクロホンで観測されるまでの間に反射回数が多くなるほど観測信号は拡散的な信号となる。そこでハードウェア構成によって、より拡散的な信号が得られるように音響伝達特性行列A(ω)を変化させ、Λ(ω)をよりIに近づける。以下、各マイクロホンの観測信号を拡散信号とするためのハードウェア構成について説明する。
ズームマイク装置1は、M個のマイクロホン11と反射器12とにより構成される。図9は反射器12に対する各マイクロホン11の配置例を示す断面図である。図10は図9の反射器12の概略図である。但し、図10において各マイクロホン11は省略している。なお、反射器12は音を反射可能な素材により作成されている。例えばその素材は厚み1cm程度の木材、ABS樹脂(アクリロニトリル(Acrylonitrile)、ブタジエン(Butadiene)、スチレン(Styrene)共重合合成樹脂)等である。
反射器12は第一反射部121と第二反射部122とを有する。
第一反射部121は開口部121Aを有する。反射器12の、開口部121A以外の部分にはM個のマイクロホン11が配置されている。反射器12の、開口部121A以外の部分は三次元空間Zを囲む構造である。第一反射部121は、開口部121Aから入射した音が、直接、一回または複数回反射して各マイクロホン11に達し得る構造である。
第二反射部122は第一開口部122Aと第二開口部122Bとを有する。第一開口部122Aは第一反射部121の開口部121Aに密に接する。第二開口部122Bはズームマイク装置1外の空間に接する。
開口部121Aの断面の長さの最長値Bは、開口部121A以外の断面の長さの最長値Aよりも短い(図11参照)。第一開口部122Aの断面の長さの最長値は、開口部121Aの断面の長さの最長値Bと同等であり、第二開口部122Bの断面の長さの最長値Cよりも短い。つまり、B<AかつB<Cである。換言すると、反射器12は筒状であり、その一端が閉口され、他端が開口されており、中央付近に括れ部分を有している。括れ部分から一端側(閉口側)は第一反射部121からなり、括れ部分から他端側(開口側)は第二反射部122からなり、括れ部分は開口部121A及び第一開口部122Aからなり、開口が第二開口部122Bからなる。
このような構成により、ズームマイク装置1の目的音源73に対する開口面積dをズームマイク装置9の開口面積dよりも大きくすることができる(図9参照)。なおズームマイク装置1の各マイクロホン11の開口面は、ズームマイク装置9と同様に、第一反射部121の内方を向いており、直接、目的音源73の方向を向いていいないが、目的音源73から発せられた音は第二反射部122により第一反射部121内に誘導されるため、ズームマイク装置1の目的音源73に対する開口面積dは第二反射部122の形状に依存する大きさとなる。第二反射部122の長さや第二開口部122Bの大きさ等によりズームマイク装置7及び8のそれぞれの開口面積d及びdと同等以上の開口面積を確保することができる。開口面積dが大きいほうが観測信号のレベルが大きくなり、目的音を高SN比で収音できる。また第一反射部121の開口部121Aの形状(開口部121Aの断面の長さの最長値Bは、開口部121A以外の断面の長さの最長値Aよりも短い形状)により、一旦、第一反射部121内部に誘導した音を外部に逃さないという効果を奏する。
またこのような構成により、第二反射部122は正面方向から到来する音を強調する指向性を形成するので、反射器12の背面や側面から到来する雑音を物理的に抑圧できる。換言すると、第二反射部122は収音対象としない空間で発せられた音が第一反射部121内部に到達するのを防ぐ構造を有する。例えば、収音対象としない空間で発せられた音は第二反射部122の形状(つまり、第一開口部122Aの断面の長さの最長値Bが第二開口部122Bの断面の長さの最長値Cよりも短い形状)により反射され、その音が第一反射部121内部に直接到達することを低減することができる。よって、雑音を排除して目的音を高SN比で収音できる。なお第二反射部122が長いほうが雑音の回り込む可能性が低くなり、高SN比となる。
なお、括れ部分(開口部121A及び第一開口部122A)の大きさは、目的音の特性に合わせて適宜設定することができる。括れ部分を大きくすれば、第一反射部121内部に目的音を誘導しやすくなり、また低い周波数の目的音も収音しやすくなる。しかし、第一反射部121内部に一旦入ってきた目的音が括れ部分から外部へ出てしまい収音できない可能性が高まる。
以下、反射器12の形状をより詳細に説明する。第一反射部121が、底面を合わせた二つの正八角錘の多錘面を構成している。但し一方の正八角錘の頭頂点近傍を削った形状とされる。換言すると、第一反射部121は、八枚の二等辺三角形状の平面と八枚の等脚台形状の平面とからなり、二等辺三角形の等しい二本の辺同士を接合して正八角錘の多錘面を構成し、等脚台形の上辺及び下辺を結ぶ二辺同士を接合して頭頂点近傍が削られた正多角錘の多錘面を構成する。等脚台形を成す平行な二本の対辺のうち、長い辺と二等辺三角形の底辺とを接合する。
第二反射部122が、正八角錘の頭頂点近傍を削った形状とされる。換言すると、第二反射部122は、八枚の等脚台形状の平面とからなり、等脚台形の上辺及び下辺を結ぶ二辺同士を接合して頭頂点近傍が削られた正多角錘の多錘面を構成する。
第一反射部121及び第二反射部122の正八角錘の削った部分を接合して反射器12を構成する。換言すると、第一反射部121及び第二反射部122の等脚台形を成す平行な二本の対辺のうち短い辺同士を接合して反射器12を構成する。
なお、第一反射部121と第二反射部122とは一体に形成してもよいし、取り外し可能に固定してもよい。取り外し可能としている場合には、第一反射部121と第二反射部122との間に防水用のシートや風切音軽減のためのウレタン等を挟んでもよい。
図12及び図13はそれぞれズームマイク装置1の正面図及び側面図を示す。支持構造体13に上述の反射器12が搭載されている。支持構造体13は反射器12を所定の位置、向きに固定指示することを目的としている。支持構造体13は例えば型鋼、角鋼管などにより組み上げることができる。
本実施形態では、第一反射部121のみに各マイクロホン11を取り付ける穴を設けている。本実施形態では、合計96個のマイクロホンを配置しているが、マイクロホンの個数、配置位置に制限はない。但しマイクロホン間の観測信号の相互相関を小さくするために間隔を離して配置したほうがよい。例えば各マイクロホン間の間隔を|Δp |/λ=0.13m以上となるように配置する。
本実施形態では、屋外での収音に対応するために、防水、防風対策として反射器12を防水シート14で覆っている。また、開口部121Aには異物の侵入を防止するための目の粗いネット15が張られており、第一反射部121と第二反射部122との間には音を透過し、水や異物の浸入を防止するためのシート16が張られている。
<効果>
このような構成により、各マイクロホン11は全て第一反射部121に対して内向きに配置されるため、その観測信号は拡散信号となる。よって、拡散センシングを効率的に行うハードウェアになりうる。また第二反射部122により処理対象の信号のレベルを従来技術と同等以上の大きさとし、さらに雑音を排除して目的音を高SN比で収音できる。
<その他の変形例>
反射器12の形状は本実施形態に限定されるものではなく、筒状であり、その一端が閉口され、他端が開口されており、中央付近に括れ部分を有していればどのような形状であってもよい。例えば、第一反射部121の形状は、図14(A)〜(H)にそれぞれ示すように十二面体、二十面体、直方体、切頂八面体、多角柱、菱形十二面体、球体及び多角錘とその折返しからなる形状(なお、図14(H)においては本実施形態と同様の八角錐であるが他の多角錘であってももちろんよい)等であってもよく、その何れかの面に開口部121Aを設ければよい。一方、第二反射部122の形状は、図15(A)〜(D)にそれぞれ示すように多角錘型コニカルホーン、円錐型コニカルホーン、多角錘型ハイパブリックホーン、円錐型ハイパブリックホーンであってあってもよく、開口部121Aに対応する第一開口部122Aを有し、第一開口部122Aの断面の長さの最長値Bよりも大きい断面の長さの最長値Cの第二開口部122Bを有していればよい。よって、例えば、図16に示すように第二反射部122の形状はR(≧1)個の括れ部分を備える形状(蛇腹形状)であってもよい。但し何れの括れ部分の断面の長さB(1≦r≦R)も、第一反射部121における開口部121A以外の断面の長さの最長値A及び第二開口部122Bの断面の長さの最長値Cよりも短い。つまり、B<AかつB<Cである。
本実施形態では、第一反射部121上に空間Zに対して内向きにのみ各マイクロホン11を配置しているが、第一反射部121上ではなく、空間Z内に各マイクロホン11’を配置してもよい(図17参照)。また第二反射部122の内向きにマイクロホン21を配置してもよいし、第一反射部121や第二反射部122に対して外向きにマイクロホン31を配置してもよい(図17参照)。本実施形態の場合、第二反射部122に反射され第一反射部121内部の各マイクロホン11に到達しない目的音が存在するが、その一部をマイクロホン21で収音することができる。そのため、処理対象の信号のレベルを本実施形態と同等以上の大きさとし目的音を高SN比で収音できる。また、外向きに配置されたマイクロホン31の観測信号は雑音であると考えられる。そこでマイクロホン31の観測信号を用いて各マイクロホン11の観測信号に含まれる雑音を消去することができる。このような構成により、さらに目的音を高SN比で収音できる。
本実施形態ではフィルタW(ω,q )を最小分散無歪応答法により設計しているが、他の設計法であってもよい。他の例としてSN比最大化規準によるフィルタ設計法とパワーインバージョン(Power Inversion)に基づくフィルタ設計法などが考えられる。(参考文献3)。
(参考文献3)菊間信良著、「アダプティブアンテナ技術」、第1版、株式会社オーム社、2003年、pp.35-90
本発明は上記の実施形態及び変形例に限定されるものではない。例えば、上述の各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。その他、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。
<プログラム及び記録媒体>
上述したズームマイク装置1の各処理(S1〜S7)は、コンピュータに実行させることもできる。この場合はコンピュータに、目的とする装置(各種実施例で図に示した機能構成をもつ装置)として機能させるためのプログラム、またはその処理手順(各実施例で示したもの)の各過程をコンピュータに実行させるためのプログラムを、CD−ROM、磁気ディスク、半導体記憶装置などの記録媒体から、あるいは通信回線を介してそのコンピュータ内にダウンロードし、そのプログラムを実行させればよい。
<応用例>
狭指向音声強調技術は、画像に譬えて表現すれば、不鮮明な惚けた画像から鮮明な画像を生成することに対応し、音場の情報をより詳細に得ることに役立つ。以下、本発明が有用なサービス例について述べる。
第一の例として、映像と組み合わせたコンテンツ制作が挙げられる。本発明の実施形態を利用すると、雑音(目的外音声等)が多い雑音環境でも遠方の目的音声をクリアに強調することができるので、例えば、フィールド外から撮影したサッカー選手がドリブルするズームイン映像に対応した音声付けを行うことができる。
第二の例として、TV会議システム(音声会議システムでもよい)への応用が挙げられる。狭い部屋で会議する場合には、従来技術でも、数本のマイクロホンを用いて発言者の音声を強調することがそれなりに可能であったが、広い会議室(例えばマイクロホンから5m以上離れた位置に話者が存在するような広い空間)では、クリアに遠方話者の音声を強調することが困難であり、このため、各発言者の前にマイクロホンを設置する必要があった。しかし、本発明の実施形態を利用すると、遠方の音をクリアに強調することが可能であるため、各発言者の前にマイクロホンを設置することなく、広い会議室に対応したTV会議システムを構築することが可能となる。

Claims (1)

  1. 複数個のマイクロホンと、音を反射可能な素材により作成された反射器とにより構成されるズームマイク装置であって、
    前記反射器は、
    開口部を有し、開口部以外は前記複数個のマイクロホンが配置された三次元空間を囲む構造であり、かつ、前記開口部から入射した音が複数回反射して前記マイクロホンに達し得る構造である第一の反射部と、
    前記第一の反射部の前記開口部に接する第一の開口部と、当該ズームマイク装置外の空間に接する第二の開口部とを有し、収音対象としない空間で発せられた音が前記第一の反射部内部に到達するのを防ぐ構造である第二の反射部とを有する、
    ズームマイク装置。
JP2011285158A 2011-12-27 2011-12-27 ズームマイク装置 Pending JP2013135373A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011285158A JP2013135373A (ja) 2011-12-27 2011-12-27 ズームマイク装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011285158A JP2013135373A (ja) 2011-12-27 2011-12-27 ズームマイク装置

Publications (1)

Publication Number Publication Date
JP2013135373A true JP2013135373A (ja) 2013-07-08

Family

ID=48911784

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011285158A Pending JP2013135373A (ja) 2011-12-27 2011-12-27 ズームマイク装置

Country Status (1)

Country Link
JP (1) JP2013135373A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015082745A (ja) * 2013-10-23 2015-04-27 日本電信電話株式会社 マイクロホン配置決定装置、マイクロホン配置決定方法及びプログラム
JP2015198412A (ja) * 2014-04-03 2015-11-09 日本電信電話株式会社 変換装置
WO2023100262A1 (ja) * 2021-11-30 2023-06-08 Jfeアドバンテック株式会社 音波遮蔽フード及び音波遮蔽フードを備えた音源方位標定装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6213095U (ja) * 1985-07-08 1987-01-26
JPS6316788U (ja) * 1986-07-17 1988-02-03
JP2006203785A (ja) * 2005-01-24 2006-08-03 Hajime Hatano 集音器

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6213095U (ja) * 1985-07-08 1987-01-26
JPS6316788U (ja) * 1986-07-17 1988-02-03
JP2006203785A (ja) * 2005-01-24 2006-08-03 Hajime Hatano 集音器

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
JPN6014020150; 丹羽健太、阪内澄宇、古家賢一、岡本学、羽田陽一: '多重反射を利用した超指向性収音技術の検討' 電子情報通信学会技術研究報告. EA, 応用音響 111(89) , 20110616, 25〜30頁, 一般社団法人電子情報通信学会 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015082745A (ja) * 2013-10-23 2015-04-27 日本電信電話株式会社 マイクロホン配置決定装置、マイクロホン配置決定方法及びプログラム
JP2015198412A (ja) * 2014-04-03 2015-11-09 日本電信電話株式会社 変換装置
WO2023100262A1 (ja) * 2021-11-30 2023-06-08 Jfeアドバンテック株式会社 音波遮蔽フード及び音波遮蔽フードを備えた音源方位標定装置

Similar Documents

Publication Publication Date Title
US9191738B2 (en) Sound enhancement method, device, program and recording medium
Teutsch et al. Acoustic source detection and localization based on wavefield decomposition using circular microphone arrays
Doclo et al. Design of far-field and near-field broadband beamformers using eigenfilters
JP6329296B2 (ja) 収音装置
Huang et al. On the design of differential beamformers with arbitrary planar microphone array geometry
Huang et al. A flexible high directivity beamformer with spherical microphone arrays
Chang et al. Experimental validation of sound field control with a circular double-layer array of loudspeakers
KR20080073936A (ko) 실제 잡음 환경의 특성을 반영한 빔포밍 장치 및 방법
Melon et al. Evaluation of a method for the measurement of subwoofers in usual rooms
Lai et al. A Study into the Design of Steerable Microphone Arrays
US20100329480A1 (en) Highly directive endfire loudspeaker array
JP2013135373A (ja) ズームマイク装置
JP6117142B2 (ja) 変換装置
Tu et al. Robustness of a compact endfire personal audio system against scattering effects (L)
JP6691494B2 (ja) 収音装置、及び収音方法
Bai et al. Refined acoustic modeling and analysis of shotgun microphones
JP6063890B2 (ja) 変換装置
Li et al. Beamforming based on null-steering with small spacing linear microphone arrays
JP6031364B2 (ja) 収音装置及び再生装置
JP5486567B2 (ja) 狭指向音声再生処理方法、装置、プログラム
Poletti et al. Comparison of sound reproduction using higher order loudspeakers and equivalent line arrays in free-field conditions
JP5948259B2 (ja) 収音装置及び再生装置
Wang et al. Design of unidirectional acoustic probes with flexible directivity patterns using two acoustic particle velocity sensors
JP5486568B2 (ja) 音声スポット再生処理方法、装置、プログラム
JP2020058085A (ja) 収音装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140114

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140514

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140520

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140709

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20150120