JP6329296B2 - 収音装置 - Google Patents

収音装置 Download PDF

Info

Publication number
JP6329296B2
JP6329296B2 JP2017079979A JP2017079979A JP6329296B2 JP 6329296 B2 JP6329296 B2 JP 6329296B2 JP 2017079979 A JP2017079979 A JP 2017079979A JP 2017079979 A JP2017079979 A JP 2017079979A JP 6329296 B2 JP6329296 B2 JP 6329296B2
Authority
JP
Japan
Prior art keywords
sound
microphones
unit
sound collection
correlation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2017079979A
Other languages
English (en)
Other versions
JP2017153126A (ja
Inventor
健太 丹羽
健太 丹羽
小林 和則
和則 小林
仲 大室
仲 大室
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Publication of JP2017153126A publication Critical patent/JP2017153126A/ja
Application granted granted Critical
Publication of JP6329296B2 publication Critical patent/JP6329296B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Circuit For Audible Band Transducer (AREA)
  • Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)

Description

本発明は、複数のマイクロホンやスピーカで構成されたアレー装置を用いたビームフォーミング技術に関する。特に、マイクロホンと音源との間の伝達特性の最適な性質を明らかにした拡散センシングに基づくビームフォーミング技術に関する。
非特許文献1及び2が、マイクロホンアレーを用いた拡散センシングに基づく音声強調技術の従来技術として知られている。非特許文献1及び2では、反射構造体により擬似的な拡散音場を生成し、その中にマイクロホンアレーを設置して、拡散センシングを実現している。
K. Niwa, S. Sakauchi, K. Furuya, M. Okamoto, and Y. Haneda, "Diffused sensing for sharp directivity microphone array", ICASSP 2012, 2012, pp. 225 - 228 K. Niwa, Y. Hioka, K. Furuya, and Y. Haneda, "Telescopic microphone array using reflector for segregating target source from noises in same direction", ICASSP 2012, 2012, pp. 5457-5460
しかしながら、従来技術において、反射構造体をマイクロホンアレーの近傍に設置することで疑似的な拡散音場を生成するためには、装置規模が大きくなる傾向がある。何故ならば、反射構造体の容積と残響時間の相関性は高くて、残響時間が長くなるほど、拡散音場に近づくためである。例えば、非特許文献2では、直径1メートルの球に収まる程度の大きさの反射構造体を構築している。ところが、適用するアプリケーションによって、装置規模はあらかじめ限定されることが多い。容積が限定されてしまうと、伝達特性の相関性が高くなり、指向性能が劣化してしまうことが課題である。
なお、この明細書では、「音」は、人の発する声に限定されるものではなく、人や動物の声はもとより楽音や環境雑音など音一般を指す。
さらに、限られた容積の中で、伝達特性の相関を低減させるためには、装置構成を工夫する必要がある。例えば、反射構造体の形状を工夫する、反射構造体の中に拡散を誘発するような機構を取り付ける、マイクロホンまたは反射構造体に可動部を取り付けて音場の状況に応じて動かす、指向性の異なるマイクロホンを組み合わせたアレーを用いるなどの手段で実現できると考えている。ただし、上記の実装で考えられる装置は相当多くのパターン数があると考えられるので、どの装置パターンが適切であるかを判断することが難しい。
本発明の一態様は、各装置パターンにおける伝達特性の相関性を評価する量を導入し、それに基づいて装置構成を決める収音装置を提供することを目的とする。
上記の課題を解決するために、本発明の一態様によれば、収音装置は、複数のマイクロホンと、音を反射可能な素材により作成された反射部とを少なくとも含む構成物から構成される少なくとも1個の収音部を含む。収音装置は、マイクロホン間の相関を最小とする制御量Zを算出するセンサー間相関計算部と、制御量Zに基づいて、収音部を構成する複数個の構成物から一部の構成物を選択する選択部とをさらに含む。
本発明の一態様によれば、伝達特性の相関を低減する装置構成を見極めることができる。
本発明の収音装置の条件を説明するための図。 本発明の収音装置の条件を説明するための図。 本発明の収音装置に反射構造体を組合せた場合を説明するための図。 本発明の収音装置に拡散構造体を組合せた場合を説明するための図。 制御点とマイクロホンとの間の伝達特性に含まれる反射音数を増大させるような拡散構造体の設置例を示す図。 反射構造体の開口部を塞ぐような拡散構造体の設置例を示す図。 拡散構造体が凸状の面を有する立体構造物である場合の例を示す図。 第一実施形態に係る収音装置の斜視図。 第一実施形態に係る収音装置の正面図。 第一実施形態に係る収音装置の側面図。 図9のXI-XI断面を示す概念図。 図9のXII-XII断面を示す概念図。 第一実施形態に係る収音装置の機能構成を示す図。 第一実施形態に係る収音装置の処理フローを示す図。 第二実施形態に係る収音装置の機能構成を示す図。 第二実施形態に係る収音装置の処理フローを示す図。 反射部の形状の例を示す図。 第三実施形態に係る収音装置の機能構成を示す図。 第三実施形態に係る収音装置の処理フローを示す図。 第四実施形態に係る収音装置の機能構成を示す図。 第四実施形態に係る収音装置の処理フローを示す図。
以下、本発明の実施形態について説明する。なお、以下の説明に用いる図面では、同じ機能を持つ構成部や同じ処理を行うステップには同一の符号を記し、重複説明を省略する。以下の説明において、テキスト中で使用する記号「」、「^」等は、本来直前の文字の真上に記載されるべきものであるが、テキスト記法の制限により、当該文字の直後に記載する。式中においてはこれらの記号は本来の位置に記述している。また、ベクトルや行列の各要素単位で行われる処理は、特に断りが無い限り、そのベクトルやその行列の全ての要素に対して適用されるものとする。
<第一実施形態>
本実施形態は、拡散センシングを基にして、伝達特性を物理的に変調する収音装置に係るものである。
まず、非特許文献1で説明されているこれまでの拡散センシングに基づく収音処理について説明する。
[観測信号のモデル化]
M(≧2)本のマイクロホンを用いて一つのターゲット音とK(≧1)個の雑音を受音する状況を考える。多くの雑音が存在する中で任意の位置にあるターゲット音を強調する指向制御を目的にする。目的は、K個の雑音源を抑圧し、ターゲット音を強調することで達成される。m(m=1,2,…,M)番目のマイクロホンとターゲット音、k(k=1,2,…,K)番目の雑音との間のインパルス応答をそれぞれam(i)、bk,m(i)とする。ただし、インパルス応答長をLとし、i=0,1,…,L-1とする。なお、インパルス応答長Lは、装置の規模や構造、設置された部屋の状況によって定まる残響時間により、実験的に定めればよい。ターゲット音、k番目の雑音の音源信号をそれぞれs(t)、nk(t)とするとき、m番目のマイクロホンで観測した観測信号xm(t)は、次式でモデル化される。
Figure 0006329296
ここで、tは時間のインデックスを表わす。
xm(t)を短時間フーリエ変換することで、式(1)の畳み込み混合は、次式のような周波数領域における瞬時混合として近似される。
Figure 0006329296
ここで、ω、τはそれぞれ周波数、フレームのインデックスを表わす。例えば、48kHzでサンプリングを行い、タップ数を2048とする。また、Xm(ω,τ)、S(ω,τ)、Nk(ω,τ)は、それぞれ観測信号xm(t)、ターゲット音の音源信号s(t)、k番目の雑音の音源信号nk(t)の時間周波数表現を表わす。am(ω)、bk,m(ω)は、それぞれターゲット音、k番目の雑音とm番目のマイクロホンとの間の周波数特性を表し、以後これらを伝達特性と呼ぶ。式(2)を行列形式で表記すると、次式のようになる。
Figure 0006329296
であり、Tは転置を表わす。
[ビームフォーミング]
ビームフォーミング後の出力信号y(t)は、次式のように観測信号xm(t)と、ターゲット音を強調するように設計されたフィルタwm(t)とを畳み込むことで得られる。
Figure 0006329296
ここで、Jはフィルタ長を表わし、インパルス応答長Lと同程度とすればよい。y(t)の時間周波数表現であるY(ω,τ)は、次式で近似的に求められる。
Figure 0006329296
ここで、Hは共役転置を表し、W m(ω)の複素共役がwm(j)の周波数応答に対応する。
Figure 0006329296
出力信号Y(ω,τ)に含まれる雑音成分をYN(ω,τ)と書くとき、次式のパワーpN(ω)は雑音成分のパワーとして定義される。
Figure 0006329296
ここで、ETは時間的な期待値演算を表わす。音源信号が互いに無相関であると仮定すると、パワーpN(ω)は伝達特性b k(ω)とフィルタW(ω)だけで計算できる。
Figure 0006329296
アレー信号処理の分野では、pN(ω)を最小化するために、様々なフィルタ設計法が説明されてきた。代表例として、遅延和法と最尤法を説明する(参考文献1参照)。
[参考文献1]浅野太,「音のアレイ信号処理-音源の低位・追跡と分離」,コロナ社,2011年
遅延和法において、フィルタW DSは、次式により、ターゲット音の直接音を強調するように設計される。
Figure 0006329296
は、ターゲット音の直接音のアレイ・マニフォールド・ベクトルを表わす。要素hm(ω)は、ターゲット音からm番目のマイクロホンまでの直接音の経路の伝達係数を表し、ターゲット音とm番目のマイクロホン間の距離をdm、音速をc、虚数単位をjとすると、例えば次式により計算できる。
Figure 0006329296
また、最尤法において、フィルタW MLは、次式により、ターゲット音の直接音を強調し、パワーpN(ω)を最小化するように設計される。
Figure 0006329296
ここで、R(ω)は雑音の空間相関行列を表わす。例えば、音源信号間が無相関であると仮定すると、雑音の空間相関行列R(ω)は次式のように、伝達特性b k(ω)のみを用いて計算される。
Figure 0006329296
参考文献1に載っているような古典的なアレー信号処理において、マイクロホン間の間隔をどのようにアレンジするのかといったことが考えられてきた。しかし、特定の周波数を除いてマイクロホン間の相関が高くなることが多かった。代表的な問題として知られているのは以下の二つである。一つ目は波長の長い低周波帯域では、伝達特性間の相関が高くなりやすいので、狭指向制御しづらいことである。二つ目は波長の短い高周波帯域では、波長の半波長以下の間隔でマイクロホンを並べない限り、特定のターゲット音以外の音を強調してしまう空間エリアジングが生じることである。以上の2点から、広帯域に渡ってパワーpN(ω)を小さくすることは困難とされてきた。
[拡散センシング]
非特許文献1では、広帯域に渡ってパワーpN(ω)を小さくするために、伝達特性の性質がどういう性質であるべきかが検討され、拡散センシングという基礎理論が纏められている。
拡散センシングのコンセプトは、“伝達特性の物理的変調”により、次式のように広帯域に渡って伝達特性を無相関化させることにある。
Figure 0006329296
ここで、伝達特性の物理的変調とは、伝達特性の性質そのものを変えるためのあらゆる物理的手段のことを指し、例えばマイクロホンの近傍に設置された反射構造体が挙げられる。非特許文献1で提案されている方式は、多数回反射を繰り返し、等方位的に反射音が到来する音場(拡散音場)を生成し、その中にマイクロホンアレーを設置する方式である。例えば、マイクロホンアレーを包囲するような形状の反射構造体を作り、一面だけ開けておけば、反射構造体内に到来した音が自ずと反射を繰り返し、疑似的な拡散音場を生成することになる。
何故、拡散音場にマイクロホンアレーを設置すると、伝達特性間が無相関化されるのかを簡単に説明する。伝達特性間の相関をγ(ω)とすると、拡散音場における相関γ(ω)は次式により計算されることが知られている。
Figure 0006329296
ここで、ES,pはそれぞれ空間的な期待値演算、マイクロホン間の位置ベクトルを表わす。マイクロホン間の距離||p||が十分に広いとすると、拡散音場における伝達特性間の相関γ(ω)の期待値は0になる。
Figure 0006329296
だから、従来技術において反射構造体により疑似的な拡散音場を物理的に生成し、その中にマイクロホンアレーを設置してきた(非特許文献1、2参照)。
また、パワーpN(ω)を小さくするために、事前のシミュレーションや測定により用意した伝達特性を用いたフィルタ設計方式を検討してきた。簡単に言えば、ターゲット音のみを強調するようにしてきたが、拡散センシングに基づく制御では、伝達特性そのものを強調するように設計される。
遅延和法をベースとする場合、次式のように、アレイ・マニフォールド・ベクトルh(ω)をターゲット音の伝達特性a(ω)に置き換えることで、フィルタW DS1(ω)を設計できる。
Figure 0006329296
この場合、a(ω)をシミュレーションや実測により事前に用意する必要がある。
また、最尤法をベースとする場合、次式によりフィルタW DS2(ω)を設計できる。
Figure 0006329296
この場合も同様に、a(ω)やR(ω)をシミュレーションや実測により事前に用意する必要がある。先に挙げたような手段を用いて、疑似的な拡散音場を生成し、音を収音する場合、伝達特性が自ずと無相関化されていることが期待されるので、パワーpN(ω)を広帯域に渡って小さくすることができた。
<第一実施形態のポイント>
しかし、従来技術では、前述の通り、装置規模が大きくなる傾向がある。
そこで、本実施形態では、広帯域に渡って伝達特性を無相関化させるために、“伝達特性の物理的変調”として、観測信号の性質(マイクロホン間の相関)に応じて、反射部、または、マイクロホンの向きまたは位置を変更して、反射構造体の容積が限定された条件下で伝達特性の相関を小さくできる。言い換えると、反射部、または、マイクロホンを伝達特性の相関性を低減するように動かす。
以下、図1及び図2を用いて本実施形態で定義する収音装置の条件を説明する。
[必須条件]
(1)複数のマイクロホン及びフィルタリング部を含むこと
2つ以上のマイクロホン112を含み、それぞれ独立なフィルタ処理できるようなフィルタリング部160を含むこと。
(2)センサー間相関計算部を含むこと
マイクロホン間の相関性(例えば、観測信号間の相関)を計算し、後述する反射部180やマイクロホン112の可動を決定するセンサー間相関計算部210を含む。
(3-1)反射部の向きまたは配置を変更する可動制御部を含む
マイクロホン112の近傍に反射部180が一つ以上設置され、マイクロホン間の相関性に応じて、反射部180の向きまたは配置を変更するような一つ以上の可動制御部200を含むこと(図1参照)。なお、反射部180は、音を反射可能な素材により作成される。その形状は一つ以上の反射音を生じさせる形状であればいい。例えば、図1のように板状であってもよい。
(3-2)マイクロホンの向きまたは配置を変更する可動制御部を含む
マイクロホン間の相関性に応じて、マイクロホン112の向きまたは配置を変更するような一つ以上の可動制御部200を含む(図2参照)。
(3-1),(3-2)の条件は、どちらか一方存在すればよい条件である。なお、(3-1),(3-2)の構造を組合せて構わない。つまり、マイクロホン112及び反射部180の向きまたは配置を、同時に、または、別々に変更するような可動制御部200を含む構成であってもよい。
例えば、可動制御部200はモータ等からなり、センサー間相関計算部210において求めた制御量Zに応じて、回転し、回転軸に対して垂直に設置された円板を回転させ、円板上に設置されたマイクロホン112の配置を変更する(図2参照)。また、回転軸に設置された反射部180を回転させ、向きを変更する(図1参照)。利用に先立ち、予め各制御量εにおける、制御対象領域を密に分割したK'点と各マイクロホン間の伝達特性A(ω,ε)=[a 1(ω,ε),a 2(ω,ε),…,a K'(ω,ε)]を測定し、後述する伝達特性記憶部140に記憶しておく。さらに、後述するセンサー間相関計算部210において、伝達特性A(ω,ε)と観測信号X(ω,τ)=[X1(ω,τ),…,XM(ω,τ)]とから、マイクロホン間の相関性を計算し、次式により、伝達特性間の相関が最小となる制御量Zを求め、これを可動制御部200に出力する。
Figure 0006329296
マイクロホン112や反射部180の向きや配置により、伝達特性は変化するので、伝達特性間の相関が小さくなるようにマイクロホン112や反射部180の向きまたは配置を変更する。なお、複数のマイクロホン112や複数の反射部180を用いる場合には、一部を固定し、残りを可動制御部200により変更する構成としてもよい(図2参照)。
[必須ではないがあるとよい条件]
さらに、伝達特性を無相関化させるために以下のような条件を組合せる方式が考えられる。
(4)反射構造体を含むこと
音を反射・回折する素材で形成されており、開口部を有するマイクロホン112を包囲するような形状(言い換えると三次元空間を形成する形状)の反射構造体190があること(図3参照)。
(5)拡散構造体の設置
制御点Aとマイクロホン112との間の反射経路数が多くなるような拡散構造体181が一つ以上設置されていること。例えば、条件(4)と組合せて、反射構造体190の内壁面や内側に、拡散構造体181が一つ以上設置される(図4参照)。
制御点Aとマイクロホン112との間の反射経路を図5に示す。反射構造体190だけで決まる反射経路(破線)も存在するが、拡散構造体181を設置することにより、反射経路(一点鎖線)が増える。従って、拡散構造体181は、拡散構造体181を有さない場合の伝達特性を変調するものである。反射経路が増えることによって、収音装置の容積が限定された状況でも、音場の拡散性が高まるので、伝達特性間の相関が小さくなることが期待できる。なお、拡散構造体181の形状や配置位置には限定はなく、凹凸の曲面を持ってもよい。ただし、図6のように、反射構造体190の開口部を塞ぐような板を拡散構造体181としてしまった場合、制御点Aとマイクロホン112と間の反射経路を減らしてしまうので、拡散構造体181の形状や配置として適さない。よって、拡散構造体181は、収音装置に入射された音の反射回数が、拡散構造体181を有さない場合よりも多くなるように配置されている。
図4及び図7は、拡散構造体181が、曲面を有する立体構造物である場合の形状例を示す断面図である。この例では、反射構造体190の開口部と有する面と対向する内壁面に、開口部方向に突出した拡散構造体181を備え、図4では断面凹状の面を有し、図7では断面凸状の面を有する。拡散構造体181は、反射構造体190の開口部から入射された音を収音装置の内部のマイクロホンに導く構造であることが望ましい。例えば、図7の場合、拡散構造体181の先端で音を収音装置の外部に反射してしまうため、図4のほうがより望ましい形状と考えられる。
(6)指向性の異なるマイクロホンの使用
様々な指向性を持つマイクロホンを混ぜて使用することで、伝達特性間の相関を小さくし、無相関化を図る。例えば、マイクロホンの指向性に限定はないが、無指向性、単一指向性、双指向性、ハイパーカーディオイドといった様々な指向性を持つマイクロホンを混ぜて使用する。仮に、同じ位置に指向性の異なるマイクロホンを配置した場合、同じ制御点との間の伝達特性は異なるものとなる。例えば、同じ位置に無指向性のマイクロホンまたは単一指向性のマイクロホンを配置した場合、制御点Aと無指向性のマイクロホンとの間の伝達特性と、制御点Aと単一指向性のマイクロホンとの間の伝達特性とは、異なるものとなる。よって、この条件により、指向性の違いによる伝達特性の変化を利用して、さらに、伝達特性間の相関を小さくし、無相関化を図る。
<第一実施形態に係る収音装置10>
図8は収音装置10の斜視図、図9はその正面図、図10はその側面図を示す。図11は図9のXI-XI断面を示す概念図、図12は図9のXII-XII断面を示す概念図を示す。
図12に示すように、反射構造体190が形成する三次元空間の内部に11枚の円板201を直線的に配置し、さらに、円板201上に11本のマイクロホン212を配置している。さらに、図示していないが、反射構造体190が形成する三次元空間の外部(上壁の外壁面上)に11本のマイクロホン211を直線的に配置している(図11参照)。反射構造体190の形状は、一つ以上の開口部が形成されていれば、その形状に制限はないが、この実施形態では横長の直方体がベースとなっており、前面を開口面としている。また、反射構造体190は、反射面が平面であって、適度な厚みと剛性を持つ平板の反射板(例えば、反射率αを0.8とする)からなる。反射構造体190反射面は、必ずしも平面でなくともよく、凹凸のある平板であってもよい。さらに、本実施形態では、音を反射構造体の中に取り入れやすくするため、開口面にホーン191を設けている。ホーン191は、反射構造体190の外側から見た開口面積が大きく、内側から見た開口面積が小さくなるような形状としている。音が反射構造体190内に入りやすく出にくい構造となっている。なお、一つ以上の開口面があればよく、開口面の形状や数に限定はない。ホーンをつけてもよいし、つけなくてもよい。本実施形態では、開口面に拡散構造体181毎にホーン191を設けている。
反射構造体190が三次元空間を形成し、拡散構造体181がその三次元空間内に設置される。拡散構造体181は、凹状の曲面を持った形状とする。開口面から到来した音が拡散構造体181に反射して、反射構造体190内で多重に反射することを狙ってこの形状としている。拡散構造体181はQ個(Q≧1)設置されていればよく、本実施形態では、10個の拡散構造体181が設置されている(図12参照)。
マイクロホン212を反射構造体190の形成する三次元空間の内部に設置できるような構造になっている。また、反射構造体190の上壁の外壁面上にマイクロホン211を設置できるような構造になっている。
マイクロホン211は、音響的に透過な音響透過カバー192で覆われている。「音響的に透過」とは、反射・回折が生じない(または生じにくい)ことを意味し、例えば、音響透過カバー192はパンチングメタルからなる。音響透過カバー192は、マイクロホン211を衝撃等から防護するためのカバーであって、必ずしも設けなくともよい。
外側に設置したマイクロホン211は、反射構造体190による反射・回折の影響を受けにくく、強い振幅の直接音を観測できる特徴がある。また、反射構造体190の内側にマイクロホン212を設置した。マイクロホン212は、反射構造体190によって、反射・回折の影響を大きく受けるので、外側に設置したマイクロホン211とは明らかに異なる伝達特性を取得できる。よって、反射構造体190の内側に設置したマイクロホン212の伝達特性と、外側に設置したマイクロホン211の伝達特性との間の相関が小さくなることが見込まれる。なお、反射音の影響により、制御点の位置や収音環境(例えば収音装置の外部に存在する反射物等)の変化に対して、制御点からマイクロホン212への伝達特性は変調しやすく、制御点からマイクロホン212への伝達特性は変調しづらい。
反射構造体の内側の底面に、可動制御部(モータ)200を設置した。可動制御部200に可動型の反射部180を取り付けるか、マイクロホン212を取り付ける。本実施形態では、マイクロホン212を取り付けている。可動制御部200は、観測信号に応じて、伝達特性の相関を小さくするように、可動型の反射部やマイクロホンを動かす。
[収音装置10の信号処理]
第一実施形態に係る収音装置10の機能構成および処理フローを図13と図14に示す。この第一実施形態の収音装置10は、M個のマイクロホン211−m、M個のマイクロホン212−m、AD変換部120、周波数領域変換部130、フィルタリング部160、時間領域変換部170、フィルタ計算部150、伝達特性記憶部140、可動制御部200、センサー間相関計算部210を含む。m=1,2,…,Mであり、m=1,2,…,Mであり、M≧1、M≧1であり、M+M=Mである。
<マイクロホン211−m、マイクロホン212−m
個のマイクロホン211−m、M個のマイクロホン212−mを用いて収音し(s1)、アナログ信号(収音信号)をAD変換部120に出力する。M個のマイクロホン211−mが反射構造体190の外側に設置され、M個のマイクロホン212−mは反射構造体190の内側に設置されている。
<AD変換部120>
AD変換部120が、M個のマイクロホン211−mとM個のマイクロホン212−mとで収音された合計M個のアナログ信号をディジタル信号x(t)=[x1(t),…,xM(t)]Tへ変換し、(s2)、周波数領域変換部130に出力する。tは離散時間のインデックスを表す。
<周波数領域変換部130>
周波数領域変換部130は、まず、AD変換部120が出力したディジタル信号x(t)=[x1(t),…,xM(t)]Tを入力とし、チャネルごとにNサンプルをバッファに貯めてフレーム単位のディジタル信号x(τ)=[x 1(τ),…,x M(τ)]Tを生成する。τはフレーム番号のインデックスである。x m(τ)=[xm((τ-1)N+1),…,xm(τN)](1≦m≦M)である。Nはサンプリング周波数にもよるが、48kHzサンプリングの場合には2048点あたりが妥当である。次に、周波数領域変換部130は、各フレームのディジタル信号x(τ)を周波数領域の信号X(ω,τ)=[X1(ω,τ),…,XM(ω,τ)]Tに変換し(s3)、出力する。ωは離散周波数のインデックスである。時間領域信号を周波数領域信号に変換する方法の一つに高速離散フーリエ変換があるが、これに限定されず、周波数領域信号に変換する他の方法を用いてもよい。周波数領域信号X(ω,τ)は、各周波数ω、フレームτごとに出力される。
<伝達特性記憶部140>
伝達特性記憶部140は、予め収音装置10を使って測定された伝達特性A(ω,ε)=[a 1(ω,ε),…,a K'(ω,ε)]を記憶しておく。εは可動制御部200の制御量を表わし、a k(ω,ε)=[a1(ω,ε),a2(ω,ε),…,aM(ω,ε)]Tを(ただし、k=1,2,…,K')、可動制御部200をεだけ制御したときの、制御対象領域を密に分割したK'点に含まれるk点とM本のマイクロホンとの間の周波数ωでの伝達特性、換言すれば、a k(ω,ε)=[a1(ω,ε),…,aM(ω,ε)]Tは、可動制御部200をεだけ制御したときのマイクロホンアレーに含まれる各マイクロホンへのk点における周波数ωでの伝達特性とする。なお、伝達特性A(ω,ε)は、事前測定によらず、理論式やシミュレーションにより事前に用意してもよい。
<センサー間相関計算部210>
センサー間相関計算部210は、伝達特性記憶部140から伝達特性A(ω,ε)を取り出し、所定の間隔毎(フレーム毎としてもよいが、後述する可動制御部200の動作を考慮すると、例えば数分毎としてもよい)に(s20)、周波数領域信号X(ω,τ)を受け取り、各周波数ω∈Ωについて、センサー間相関を計算し(s21)、可動制御部200の制御量Zを求め、出力する。
例えば、ターゲット音とK^個の雑音の方向または位置を周波数領域信号X(ω,τ)から予測して、次式の計算をすることで、予測したターゲット音とK^個の雑音の方向または位置におけるセンサー間相関を計算し、制御量Zを求める。
Figure 0006329296
入力された伝達特性A(ω,ε)は、収音装置毎にパワーが正規化されていない可能性があるので、正規化してもよい。正規化の方法の実装例として、以下に2種類挙げる。
(i)収音装置毎に伝達特性のパワーを正規化する場合には、次式により正規化する。
Figure 0006329296
(ii)方向毎に伝達特性のパワーを正規化する場合には、次式により正規化する。
Figure 0006329296
センサー間相関の計算方法は様々あるが、(i)伝達特性の相関のパワー平均C1(ω,ε)を用いる方法、(ii)通信路容量C2(ω,ε)を用いる方法、(iii)条件数C3(ω,ε)を用いる方法、(iv)行列式C4(ω,ε)を用いる方法の4つを示す。
(i)まず、伝達特性の相関のパワー平均C1(ω,ε)の計算方法を以下に示す。制御点の全ての組み合わせで伝達特性間の相関のパワーを次式により計算して平均化する。
Figure 0006329296
伝達特性の直交性が高いほどC1(ω,ε)の値は小さくなり、完全に伝達特性間が無相関である場合にC1(ω,ε)=0になる。
(ii)次に、通信路容量を用いる方法を示す。無線におけるMIMO系ではよく用いられている尺度で、音源とマイクロホン間を伝送路として見立てたときの伝送路で送れる最大の情報量を通信路容量という(参考文献2参照)。
[参考文献2]G. J. Foschini et al., “On limits of wireless communications in a fading environment when using multi-element antennas” , Wireless Personal Communications, 1998, vol. 6, no. 3, pp.311-335
通信路容量C2(ω,ε)は次式で計算できる。
Figure 0006329296
ここで、PSNR(ω,ε)は制御量εにおける音源信号とセンサノイズの平均的なSN比、Λm(ω,ε)は制御量εにおける空間相関行列R(ω,ε)のm番目の固有値で、Λ1(ω,ε)≧…≧ΛM(ω,ε)≧0のように整列されている。音源信号が互いに無相関と仮定すると空間相関行列、R(ω,ε)は伝達特性を用いて次式で近似計算することができる。
Figure 0006329296
伝達特性の直交性が高いほどC2(ω,ε)の値は大きくなる。完全に伝達特性間が無相関である場合、固有値がΛ1(ω,ε)≒…≒ΛM(ω,ε)のように平滑になるので、空間相関行列Rn(ω,ε)のトレース一定の条件下で通信路容量C2(ω,ε)は最大になる。
(iii)次に、条件数C3(ω,ε)を用いる方法を示す。n番目のマイクロホンにおける条件数は、次式のように空間相関行列Rn(ω,ε)の最大固有値と最小固有値の比で計算される。
Figure 0006329296
伝達特性の直交性が高いほどC3(ω,ε)の値は小さくなる。完全に伝達特性間が無相関である場合、C3(ω,ε)=1になる。
(iv)最後に、行列式C4(ω,ε)を用いる方法を示す。行列式は、固有値分布の平滑度合を評価するために用いられる一つの評価関数である。
Figure 0006329296
伝達特性の直交性が高いほどC4(ω,ε)の値は大きくなる。完全に伝達特性間が無相関である場合、C4(ω,ε)=1になる。
センサー間相関計算部210は、何れかの尺度で伝達特性の相関を計算する。さらに、周波数毎に算出されたコストCi(ω,ε)(ただし、i=1,2,3,4の何れか)を平均化する。
Figure 0006329296
ここで、Ωは平均化する周波数インデックスの集合で、|Ω|はその総数を表わす。また、g(ω)は周波数毎の重みを表わす。音声が白色的であると仮定するのであれば、g(ω)=1としても問題ない。最後に、周波数平均化されたコストC^i(ε)を基に、制御量Zを求める。制御量Zは、伝達特性間の相関が最小となる制御量εである。例えば、パワー平均C1(ω,ε)や条件数C3(ω,ε)を用いた場合には、最小のコストC^1やC^3に対応する制御量εを制御量Zとし、通信路容量C2(ω,ε)や行列式C4(ω,ε)を用いた場合には、最大のコストC^2やC^4に対応する制御量εを制御量Zとする。
ターゲット音とK^個の雑音の方向または位置を周波数領域信号X(ω,τ)から予測する際には既存の音源位置推定技術を用いればよい。例えば、音源位置推定技術として、a)GCC-PHAT法、b)MUSIC法、c)ビームフォーマ法等が知られている。
a)GCC-PHAT法(詳細は参考文献2参照)
[参考文献2]C. H. Knapp et al., ”The generalized correlation method for estimation of time delay”, IEEE Trans. ASSP, 1976, vol.24, no.4, pp. 320-327
GCC-PHAT法は、音声を観測した際に、2本のマイクロホン(マイクペア)間に生じる時間差を利用して、音源到来方向を求める方式である。この場合、センサー間相関計算部210では、周波数領域信号X(ω,τ)を用いて、一般化相互相関Q(ω,τ,ρr→_j)=[Q1(ω,τ,ρr→_j),…,QU(ω,τ,ρr→_j)]を計算する。ただし、下付添え字r→_jはr を表す。また、Uはマイクペアの総数で、最大でMC2までの値を取りうる。u(u=1,2,…,U)番目のマイクペアがmu_1番目のマイクロホンとmu_2番目のマイクロホンとで構成されているとして(ただし、下付添え字u_1,u_2はそれぞれu1,u2を表す)、mu_2番目のマイクロホンで収音した周波数領域信号Xm_u_2(ω,τ)の位相をmu_1番目のマイクロホンで収音した周波数領域信号Xm_u_1(ω,τ)の位相に対して時間ρr→_jだけ遅らせた場合の相関値をQu(ω,τ,ρr→_j)とする。ただし、下付添え字m_u_1,m_u_2はそれぞれmu_1,mu_2を表し、ρr→_jは、位置r jから音が伝搬した際に生じる遅延を表わす。一般化相互相関Qu(ω,τ,ρr→_j)は次式で計算される。
Figure 0006329296
*は複素共役を表わす。
さらに、センサー間相関計算部210では、一般化相互相関Qu(ω,τ,ρr→_j)を用いて、音源位置r(τ)=[r S(τ),r 1(τ),…,r K^(τ)]を算出する。一般化相互相関Qu(ω,τ,ρr→_j)の値が大きい位置r jほど、音源が存在している可能性が高い。だから、一般化相互相関Qu(ω,τ,ρr→_j)の値が大きな位置をK^+1個抽出すればよい。例えば以下のコストCGCCが高い位置r jをK^+1個抽出すればよい。
Figure 0006329296
b)MUSIC法(詳細は参考文献3参照)
[参考文献3] R. O. Schmidt, ”Multiple emitter location and signal parameter estimation”, IEEE Transactions on Antennas and Propagation, 1986, vol.34, no.3, pp.276-280
MUSIC法は、音場に存在する音源数(K^+1)以上のマイクロホンを用いて、観測信号中に含まれる音源位置r=[r S,r 1,…,r K^]を推定する。よって、M≧K^+1とする。雑音の総数K^はあらかじめ与えるか観測した信号から推定することとする。
センサー間相関計算部210では、観測信号X(ω,τ)を用いて、ターゲット音及び雑音の空間相関行列R N(ω,τ)を計算する。まず、観測信号X(ω,τ)を用いて、空間相関行列R(ω,τ)を計算する。
Figure 0006329296
ここで、E[・]は期待値演算子を表し、例えば時間的な平均化処理で置き換えても問題ない。次に、雑音空間の空間相関行列を生成するために、R(ω,τ)を固有分解する。
Figure 0006329296
ここで、V(ω,τ)=[v 1(ω,τ),…,v M(ω,τ)]は固有ベクトル行列で、v m(ω,τ)は、V(ω,τ)の第m固有ベクトルである。また、Λ(ω,τ)=diag([Λ1(ω,τ),…,ΛM(ω,τ)])は、M個の固有値で構成された固有値行列である。1番目からK^+1番目までの固有ベクトルには音源に起因する成分が含まれるので、K^+2番目からM番目までの固有ベクトルv K^+2(ω,τ),…,v M(ω,τ)で構成される空間には定常的な雑音しか存在しないことになる。その性質を利用して、ターゲット音及び(定常的でない)雑音の空間相関行列を生成する。
Figure 0006329296
さらに、センサー間相関計算部210では、ターゲット音及び(定常的でない)雑音の空間相関行列R N(ω,τ)を用いて、ミュージックスペクトルPMUSIC(ω,τ,r j)を計算する。
Figure 0006329296
ここで、h(ω,r j)は、位置r jからM本のマイクロホン間の伝達特性であり、通常、直接音のみをモデル化して計算される。
最後に、センサー間相関計算部210では、PMUSIC(ω,τ,r j)を用いて、音源位置r=[r S,r 1,…,r K^]を算出する。PMUSIC(ω,τ,r j)の値が大きい位置r jほど、音源が存在している可能性が高い。だから、PMUSIC(ω,τ,r j)の値が大きな位置をK^+1個抽出すればよい。例えば以下のコストCMUSICが高い位置r jをK^+1個抽出すればよい。
Figure 0006329296
c)ビームフォーマ法(詳細は参考文献4参照)
[参考文献4] D. H. Johnson et al., Array Signal Processing, Prentice-Hall, Englewodd Cliffs,NJ, USA, 1993
ビームフォーマ法は、多数のビームフォーマを用意して、空間を走査することにより、音源位置を推定する方式である。
センサー間相関計算部210では、空間を走査するためのフィルタw(ω,r j)=[W1(ω,r j),…,WM(ω,r j)]Tを走査する位置毎に用意する。フィルタの設計法は様々あるが、ここでは、遅延和法と最小分散法について説明する。
遅延和法では、位置r jにあるターゲット音を強調するコストで設計されるので以下になる。
Figure 0006329296
最小分散法では、ターゲット音を強調しつつ、雑音のエネルギーを最小化するコストで設計されるので、以下で計算できる。
Figure 0006329296
他にも様々なフィルタ設計法があるが、任意の方式を用いてフィルタを設計して良い。
センサー間相関計算部210では、さらに、次式のように、フィルタw(ω,r j)と周波数領域信号X(ω,τ)を畳み込むことで、空間スペクトルPBF(ω,τ,r j)を算出する。
Figure 0006329296
最後に、センサー間相関計算部210では空間スペクトルPBF(ω,τ,r j)を用いて音源位置r(τ)を算出する。空間スペクトルPBF(ω,τ,r j)の値が大きい位置r jほど、音源が存在している可能性が高い。だから、空間スペクトルPBF(ω,τ,r j)の値が大きな位置をK^+1個抽出すればよい。例えば以下のコストCBFが高い位置r jをK^+1個抽出すればよい。
Figure 0006329296
センサー間相関計算部210は、例えば上述の方法により、ターゲット音とK^個の雑音の方向または位置を周波数領域信号X(ω,τ)から予測する。予測した位置において可動制御部200をεだけ制御したときの制御対象領域を密に分割したK'点と各マイクロホン間の伝達特性A(ω,ε)=[a 1(ω,ε),a 2(ω,ε),…,a K'(ω,ε)]は予め伝達特性記憶部140に記憶されているので、これらの値を取り出し、次式(より具体的には、式(20)〜(24)参照)により伝達特性間の相関が最小となる制御量Zを求め、可動制御部200に出力する。
Figure 0006329296
<可動制御部200>
可動制御部200は、制御量Zを受け取り、可動型の反射部180またはマイクロホン212−m(本実施形態ではM2個のマイクロホン212−m)を可動させる(s22)。
受け取った制御量Zと前時刻のZの差分が予め定めた閾値を超えた場合にマイクロホンへの伝達特性が変化したとみなし、マイクロホンへの伝達特性の変化を検知したときにのみ、可動型の反射部180またはマイクロホン212−m(本実施形態ではM2個のマイクロホン212−m)を動かしてもよい。
<フィルタ計算部150>
フィルタ計算部150は、伝達特性記憶部140から伝達特性A(ω,ε)を取り出し、フィルタW(ω,ε)を計算しておく。そして、制御量Zを受け取り、制御量Zが変更される毎に、その制御量Zに対応するフィルタW(ω,Z)をフィルタリング部160に出力する。例えば、特定の位置または方向からの音響信号を抑圧する信号処理に用いるフィルタW(ω,ε)を計算しておく。
本発明のビームフォーミング技術の要点は、観測信号の性質(マイクロホン間の相関)に応じて、拡散構造体、または、マイクロホンの向きまたは位置を変更して、広帯域に渡って伝達特性を無相関化させることである。そのため、フィルタの設計コンセプト自体に影響を与えないので、従来技術と同様の方法により、フィルタW(ω,ε)を設計することができる。例えば、参考文献5に記載されている<1>SN比最大化規準によるフィルタ設計法、<2>パワーインバージョン(Power Inversion)に基づくフィルタ設計法、<3>一つ以上の死角(雑音のゲインが抑圧される方向)を拘束条件に持つ最小分散無歪応答法によるフィルタ設計法、<4>遅延合成(Delay-and-Sum Beam Forming)法によるフィルタ設計法、<5>最尤法によるフィルタ設計法、<6>AMNOR(Adaptive Microphone-array for noise reduction)法等によって、フィルタW(ω,ε)を設計することができる。
[参考文献5]国際公開第WO2012/086834号パンフレット
例えば、遅延和法をベースとする場合、式(16)により、フィルタW DS1(ω,ε)を計算する。
Figure 0006329296
また例えば、最尤法をベースとする場合、式(17)により、フィルタW DS2(ω,ε)を計算する。
Figure 0006329296
また例えば、一つ以上の死角を拘束条件に持つ最小分散無歪応答法によるフィルタ設計法の場合、次式により、フィルタW DS3(ω,ε)を計算する。
Figure 0006329296
ただし、fS(ω,ε),fk(ω,ε)はそれぞれターゲット音、雑音k(k=1,2,…,K)に関する周波数ωでの通過特性を表す。例えば、式(26)において、伝達特性a(ω,ε)が方向θに依存する伝達特性a(ω,ε,θ)として事前に用意できる場合には、伝達特性a(ω,ε,θ)を用いて、フィルタW(ω,ε,θ)を計算し、フィルタリング部160において、特定の方向θsの信号処理が行える。また、伝達特性a(ω,ε)が方向θ、距離Dに依存する伝達特性a(ω,ε,θ,D)として事前に用意できる場合には、伝達特性a(ω,ε,θ,D)を用いて、フィルタW(ω,ε,θ,D)を計算し、フィルタリング部160において、特定の位置(特定の方向θsと距離DHにより特定される位置)の信号処理が行える。
<フィルタリング部160>
フィルタリング部160は、制御量Zが変更される毎に、フィルタ計算部150からフィルタW(ω,Z)を受け取り、フレーム毎に周波数領域信号X(ω,τ)を受け取り、フレームτごとに、各周波数ω∈Ωについて、周波数領域信号X(ω,τ)=[X1(ω,τ),…,XM(ω,τ)]Tに、フィルタW(ω,Z)を適用して(式(5)参照、s4)、出力信号Y(ω,τ)を出力する。
Figure 0006329296
例えば、フィルタリング部はM個のマイクロホン211−mによる収音信号とM個のマイクロホン212−mによる収音信号とに基づき、空間上の少なくとも複数の位置または方向から発せられた音響信号の収音特性を異ならせるものであればよい。「収音特性を異ならせる」とは、例えば、特定の位置で発せられた音響信号を局所収音して他の位置で発せられた音響信号を極力収音しないようにしたり、逆に特定の位置で発せられた音響信号を抑圧(消音)して他の位置で発せられた音響信号のみを収音したりすることを意味する。
<時間領域変換部170>
時間領域変換部170は、第τフレームの各周波数ω∈Ωの出力信号Y(ω,τ)を時間領域に変換して(s5)、第τフレームのフレーム単位時間領域信号y(τ)を得て、さらに、得られたフレーム単位時間領域信号y(τ)をフレーム番号のインデックスの順番に連結して時間領域信号y(t)を出力する。周波数領域信号を時間領域信号に変換する方法は、s3の処理で用いた変換方法に対応する逆変換であり、例えば高速離散逆フーリエ変換である。
<効果>
このような構成により、所定の指向性能に対する装置規模を従来技術よりも小さくできる。そのとき、ターゲット音と雑音を聞き分けるための手掛かりが観測信号に含まれることになるので、例えば、事前に用意した伝達特性を使ってフィルタを使って適切な信号処理をすることで、広帯域に渡って任意の指向制御が可能になる。なお、本実施形態では、予めフィルタW(ω,ε)を計算しているが、収音装置10の計算処理能力などに応じて、所定の指向性能が定まってからフィルタ計算部150が周波数ごとのフィルタW(ω,ε)を計算する構成としてもよい。
<第二実施形態>
第一実施形態と異なる部分を中心に説明する。
<第二実施形態のポイント>
本実施形態では、マイクロホンを伝達特性の相関性を低減するように選択する。
[必須条件]
(1)伝達特性の相関性を評価する部分を持つこと。
(2)評価値に基づいて、伝達特性の相関性を低減するために効果のあるマイクロホンを選択する。ここで、評価値とは、第一実施形態で求めた制御量Zに対応する。
<第二実施形態に係る収音装置20>
(1)収音装置20は、N個のマイクロホンを有する。ただし、Nは3以上の整数とする。
(2)N個のマイクロホンからM個のマイクロホンを選択する。ただし、N≧M>1とする。
(パターン1)N個のマイクロホンは、複数の異なる既定の位置に設置されているものとし、制御量Zに基づいて伝達特性の相関性が小さくなる位置に配置されたマイクロホンを選択する。
(パターン2)N個のマイクロホンは、指向性が異なり、同じ位置に設置されているものとし、制御量Zに基づいて伝達特性の相関性が小さくなる指向性のマイクロホンを選択する。
(パターン3)パターン1と2の組み合わせ。つまり、N個のマイクロホンは、複数の異なる既定の位置に設置されているものもあれば、指向性が異なり、同じ位置に設置されているものもある。制御量Zに基づいて伝達特性の相関性が小さくなるマイクロホン(どのような組み合わせであっても、伝達特性の相関性が小さくなるものであればよい)を選択する。
[収音装置20の信号処理]
第二実施形態に係る収音装置20の機能構成および処理フローを図15と図16に示す。この第二実施形態の収音装置20は、N個のマイクロホン211−n、AD変換部120、周波数領域変換部130、フィルタリング部160、時間領域変換部170、フィルタ計算部150、伝達特性記憶部140、センサー間相関計算部210、選択部220を含む。n=1,2,…,Nであり、N≧3である。
<伝達特性記憶部140>
伝達特性記憶部140は、予め収音装置20を使って測定された伝達特性A n'(ω)=[a n',1(ω),…,a n',K'(ω)]を記憶しておく。a n',k(ω)=[an',1(ω),an',2(ω),…,an',M(ω)]Tを(ただし、n'=1,2,…,NCM、k=1,2,…,K')、N個のマイクロホン211−nからM個のマイクロホンを選択した場合における、制御対象領域を密に分割したK'点に含まれるk点と選択されたM本のマイクロホンとの間の周波数ωでの伝達特性、換言すれば、a n',k(ω)=[an',1(ω),an',2(ω),…,an',M(ω)]Tは、N個のマイクロホン211−nからM個のマイクロホンを選択した場合の、選択されたM個のマイクロホンアレーに含まれる各マイクロホンへのk点における周波数ωでの伝達特性とする。ただし、Mは2以上でかつ、N以下の整数である。なお、伝達特性A n'(ω)は、事前測定によらず、理論式やシミュレーションにより事前に用意してもよい。n'は、上述のように、N個のマイクロホン211−nからM個のマイクロホンを選択する場合の全ての組み合わせに対応するインデックス(n'=1,2,…,NCM)としてもよいし、伝達特性の相関性が小さくなりそうな組み合わせのみに対応するインデックス(n'=1,2,…,N'、N'は適宜設定される伝達特性の相関性が小さくなりそうな組み合わせの総数)としてもよい。
<センサー間相関計算部210>
センサー間相関計算部210は、伝達特性A(ω,ε)に代えて、伝達特性A n'(ω)を用いる。
そのため、制御量Zは、以下のように求める。
Figure 0006329296
伝達特性の相関のパワー平均Cn',1(ω)、通信路容量Cn',2(ω)、条件数Cn',3(ω)、行列式Cn',4(ω)をそれぞれ以下の式(20'),(21'),(23'),(24')で求めることができる。
Figure 0006329296
Figure 0006329296
ただし、Λm(ω)は制御量εにおける空間相関行列R(ω)のm番目の固有値であり、空間相関行列R(ω)は次式で近似計算することができる。
Figure 0006329296
Figure 0006329296
Figure 0006329296
センサー間相関計算部210は、何れかの尺度で伝達特性の相関を計算する。さらに、周波数毎に算出されたコストCn',i(ω)(ただし、i=1,2,3,4の何れか)を平均化する。
Figure 0006329296
最後に、周波数平均化されたコストC^n',iを基に、制御量Zを求める。
<選択部220>
選択部220は、制御量Zを受け取り、制御量Zに基づいて、N個のマイクロホンからM個のマイクロホンを選択する(s23)。つまり、制御量Zを与えるn'(N個のマイクロホン211−nからM個のマイクロホンを選択する場合の組み合わせに対応するインデックス)に対応するM個のマイクロホンを選択する。
選択部220は、制御量Zを与えるn'に対応するM個のマイクロホンに対して、収音信号をAD変換部120に出力するように制御信号を出力する。他のマイクロホンに対して、収音信号をAD変換部120に出力しないように制御信号を出力する。なお、AD変換部120に対して制御量Zを与えるn'に対応するM個のマイクロホンからの収音信号のみを処理するように制御信号を出力してもよい。
<効果>
このような構成とすることで、伝達特性の相関を低減する装置構成を見極めることができる。なお、第一実施形態と第二実施形態の構造を組合せて構わない。つまり、マイクロホンを選択する選択部220を含むとともに、マイクロホンまたは反射部を動かす可動制御部200を含む構成であってもよい。Mは必ずしも定数である必要はなく、2以上N以下の整数を取る変数としてもよい。
<第三実施形態>
第二実施形態と異なる部分を中心に説明する。
<第三実施形態のポイント>
本実施形態では、反射部を伝達特性の相関性を低減するように選択する。
[必須条件]
(1)伝達特性の相関性を評価する部分を持つこと。
(2)評価値に基づいて、伝達特性の相関性を低減するために効果のある反射部を選択する。
<第三実施形態に係る収音装置30>
(1)収音装置30は、Q個の反射部を有する。ただし、Qは2以上の整数とする。
(2)Q個の反射部からP個の反射部を選択する。ただし、Q≧P≧1とする。
(パターン1)Q個の反射部は、複数の異なる既定の位置に設置されるものとし、制御量Zに基づいて伝達特性の相関性が小さくなる位置に配置される反射部を選択する。
(パターン2)Q個の反射部は、同じ位置に設置され、形状や材質が異なるものとし、制御量Zに基づいて伝達特性の相関性が小さくなる形状や材質の反射部を選択する。反射部は、音を反射可能な素材により作成される。その形状は一つ以上の反射音を生じさせる形状であればいい。例えば、図1のように板状であってもよいし、他の形状であってもよい。例えば、図4の拡散構造体181のような形状であってもよい。反射部の形状の例を図17に示す。正面から見て、矩形、楕円形、角丸長方形、菱形、正八角形、三角形等の形状に形成することができる。また、側面からみて、凹状の面、凸状の面、第形、五角形、六角形、垂直三角形、二等辺三角形となるような形状に形成することができる。
(パターン3)パターン1と2の組み合わせ。つまり、Q個の反射部のうち、複数の異なる既定の位置に設置されるものもあれば、形状や材質が異なる同じ位置に設置されるものの中から選択されたものもある。制御量Zに基づいて伝達特性の相関性が小さくなる反射部(どのような組み合わせであっても、伝達特性の相関が小さくなるものであればよい)を選択する。
なお、選択された反射部は、モータ等からなる可動部により設置されてもよいし、人手により、設置されてもよい。
[収音装置30の信号処理]
第三実施形態に係る収音装置30の機能構成及び処理フローを図18と図19に示す。この第三実施形態の収音装置30は、Q個の反射部180−q、M個のマイクロホン211−m、AD変換部120、周波数領域変換部130、フィルタリング部160、時間領域変換部170、フィルタ計算部150、伝達特性記憶部140、センサー間相関計算部210、選択部220、表示部230を含む。q=1,2,…,Q、Q≧2であり、m=1,2,…,M、M≧2である。
<伝達特性記憶部140>
伝達特性記憶部140は、予め収音装置30を使って測定された伝達特性A q'(ω)=[a q',1(ω),…,a q',K'(ω)]を記憶しておく。a q',k(ω)=[aq',1(ω),aq',2(ω),…,aq',M(ω)]Tを(ただし、q'=1,2,…,QCP、k=1,2,…,K')、Q個の反射部180−qからP個の反射部を選択した場合における、制御対象領域を密に分割したK'点に含まれるk点とM本のマイクロホンとの間の周波数ωでの伝達特性、換言すれば、a q',k(ω)=[aq',1(ω),aq',2(ω),…,aq',M(ω)]Tは、Q個の反射部180−qからP個の反射部を選択した場合の、M個のマイクロホンアレーに含まれる各マイクロホンへのk点における周波数ωでの伝達特性とする。ただし、Pは1以上でかつ、Q以下の整数である。なお、伝達特性A q'(ω)は、事前測定によらず、理論式やシミュレーションにより事前に用意してもよい。q'は、上述のように、Q個の反射部180−qからP個の反射部を選択する場合の全ての組み合わせに対応するインデックス(q'=1,2,…,QCP)としてもよいし、伝達特性の相関性が小さくなりそうな組み合わせのみに対応するインデックス(q'=1,2,…,Q'、Q'は適宜設定される伝達特性の相関性が小さくなりそうな組み合わせの総数)としてもよい。
<センサー間相関計算部210>
センサー間相関計算部210は、伝達特性A n'(ω)に代えて、伝達特性A q'(ω)を用いて、制御量Zを求める。
<選択部220>
選択部220は、制御量Zを受け取り、制御量Zに基づいて、Q個の反射部180−qからP個の反射部を選択する(s33)。つまり、制御量Zを与えるq'(Q個の反射部180−qからP個の反射部を選択する場合の組み合わせに対応するインデックス)に対応するP個の反射部を選択する。本実施形態では、選択した反射部を表示部230に表示し、人手により、P個の反射部が設置されるものとする。ただし、モータ等からなる可動部により設置されてもよい。
<効果>
このような構成とすることで、伝達特性の相関を低減する装置構成を見極めることができる。なお、第一実施形態や第二実施形態と第三実施形態の構造を組合せて構わない。つまり、(1)マイクロホンを選択する選択部220と、(2)マイクロホンまたは反射部を動かす可動制御部200との少なくとも何れか一方を含み、選択部220が反射部を選択する構成であってもよい。Pは必ずしも定数である必要はなく、1以上Q以下の整数を取る変数としてもよい。
<第四実施形態>
第三実施形態と異なる部分を中心に説明する。
<第四実施形態のポイント>
複数個のマイクロホンと、音を反射可能な素材により作成された反射部とを含むS個の収音部から、伝達特性の相関が低い収音部を選択する。ただし、Sは2以上の整数。
[必須条件]
(1)伝達特性の相関性を評価する部分を持つこと。
(2)評価値に基づいて、複数の収音部から伝達特性の相関性を低減するために効果のある収音部を選択する。ここで、評価値とは第一実施形態で求めた制御量Zに対応する。
<第四実施形態に係る収音装置40>
(1)第四実施形態に係る収音装置40は、S個の収音部を有する。ただし、Sは2以上の整数とする。
(2)S個の収音部からR個の収音部を選択する。ただし、S≧R≧1とする。
[収音装置40の信号処理]
第四実施形態に係る収音装置40の機能構成及び処理フローを図20と図21に示す。この第四実施形態の収音装置20は、S個の収音部410−s、AD変換部120、周波数領域変換部130、フィルタリング部160、時間領域変換部170、フィルタ計算部150、伝達特性記憶部140、センサー間相関計算部210、選択部220を含む。s=1,2,…,S、S≧2である。収音部410−sは、Ms個のマイクロホン211−s−mと、音を反射可能な素材により作成された反射部490−sとを含む。m=1,2,…,Msである。なお、本実施形態では、反射部を図3の反射構造体190のような形状(開口部を有するマイクロホン112を包囲するような形状)としているが、図4の拡散構造体181や反射部180のような形状であってもよく、一つの収音部に対して複数個の反射部を備える構成としてもよい。反射部は、音を反射可能な素材により作成され、その形状は一つ以上の反射音を生じさせる形状であればいい。
<伝達特性記憶部140>
伝達特性記憶部140は、予め収音装置40を使って測定された伝達特性A s(ω)=[a s,1(ω),…,a s,K'(ω)]を記憶しておく。a s,k(ω)=[as,1(ω),as,2(ω),…,as,Ms(ω)]Tを(ただし、k=1,2,…,K'、下付添え字Msは、Msを表す)、収音部410−sを選択した場合における、制御対象領域を密に分割したK'点に含まれるk点とMs本のマイクロホンとの間の周波数ωでの伝達特性、換言すれば、a s,k(ω)=[as,1(ω),as,2(ω),…,as,Ms(ω)]Tは、収音部410−sを選択した場合における、Ms個のマイクロホンアレーに含まれる各マイクロホンへのk点における周波数ωでの伝達特性とする。なお、伝達特性A s(ω)は、事前測定によらず、理論式やシミュレーションにより事前に用意してもよい。
<センサー間相関計算部210>
センサー間相関計算部210は、伝達特性A n'(ω)に代えて、伝達特性A s(ω)を用いて、制御量Zを求める。
<選択部220>
選択部220は、制御量Zを受け取り、制御量Zに基づいて、S個の収音部410−sからR個の反射部を選択する(s43)。つまり、制御量Zを与えるsに対応する収音部410−sを選択する。
選択部420は、制御量Zを与えるsに対応する収音部410−sに対して、収音信号をAD変換部120に出力するように制御信号を出力する。他の収音部410−s”(s≠s")に対して、収音信号をAD変換部120に出力しないように制御信号を出力する。なお、AD変換部120に対して制御量Zを与えるsに対応する収音部410−sからの収音信号のみを処理するように制御信号を出力してもよい。
<効果>
このような構成とすることで、伝達特性の相関を低減する構成を見極めることができる。なお、第一実施形態や第二実施形態、第三実施形態と第四実施形態の構造を組合せて構わない。
<その他の変形例>
本発明は上記の実施形態及び変形例に限定されるものではない。例えば、上述の各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。その他、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。例えば、第一実施形態では、センサー間相関計算部210において、センサー間相関を計算し(s21)、可動制御部200の制御量Zを求めているが、予め特定の位置や方向に対して、センサー間相関を計算しておき、さらに、可動制御部200の制御量Zを求めておき、利用者によって、特定の位置や方向が入力されると、対応する制御量Zを出力する構成としてもよい。
<プログラム及び記録媒体>
上述した収音装置は、コンピュータにより機能させることもできる。この場合、コンピュータを目的とする装置(各種実施形態で図に示した機能構成を持つ装置)として機能させるためのプログラム、またはコンピュータにその処理手順(各実施形態で示したもの)の各過程を実行させるためのプログラムを、そのコンピュータに実行させればよい。なお、そのプログラムは、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等のコンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータにプログラムを実行させる際には、そのプログラムを記録媒体から読み込んでもよいし、または、そのプログラムを記録したサーバ等から通信回線を介してダウンロードしてもよい。
本発明は、狭指向音声強調技術、音声スポット強調技術に利用することができる。また、AGC(Auto Gain Control)技術やエリア収音及び再生技術に利用することもできる。

Claims (9)

  1. 複数個のマイクロホンと、音を反射可能な素材により作成された反射部とを少なくとも含む構成物から構成される少なくとも1個の収音部を含む収音装置であって、
    マイクロホン間の相関を最小とする制御量Zを算出するセンサー間相関計算部と、
    前記制御量Zに基づいて、前記収音部を構成する複数個の構成物から一部の構成物を選択する選択部とをさらに含む、
    収音装置。
  2. 請求項1に記載の収音装置であって、
    前記収音部は、Nを3以上の整数とし、N個の前記マイクロホンと前記反射部とから構成され、
    Mを2以上かつN以下の整数とし、前記制御量Zに基づいて、前記N個のマイクロホンからM個のマイクロホンを選択する選択部をさらに含む、
    収音装置。
  3. 請求項1に記載の収音装置であって、
    前記収音部は、Nを3以上の整数、Qを2以上の整数とし、N個の前記マイクロホンとQ個の前記反射部とから構成され、
    Mを2以上かつN以下の整数、Pを1以上かつQ以下の整数とし、前記制御量Zに基づいて、前記N個のマイクロホンからM個のマイクロホンを選択し、前記Q個の反射部からP個の反射部を選択する選択部をさらに含む、
    収音装置。
  4. 請求項1に記載の収音装置であって、
    Sを2以上の整数とし、S個の前記収音部を含み、
    前記収音部は、複数個の前記マイクロホンと前記反射部とから構成され、
    Rを1以上かつS以下の整数とし、前記制御量Zに基づいて、前記S個の収音部からR個の収音部を選択する選択部をさらに含む、
    収音装置。
  5. 請求項1に記載の収音装置であって、
    前記収音部は、Qを2以上の整数とし、複数個の前記マイクロホンとQ個の前記反射部とから構成され、
    Pを1以上かつQ以下の整数とし、前記制御量Zに基づいて、前記Q個の反射部からP個の反射部を選択する選択部をさらに含む、
    反射装置。
  6. 請求項1から5のいずれかに記載の収音装置であって、
    前記制御量Zは、伝達特性の相関のパワー平均である
    収音装置。
  7. 請求項1から5のいずれかに記載の収音装置であって、
    前記制御量Zは、音源とマイクロホン間を伝送路として見立てたときの当該伝送路で送れる最大の情報量を表す通信路容量である
    収音装置。
  8. 請求項1から5のいずれかに記載の収音装置であって、
    前記制御量Zは、伝達特性から計算される空間相関行列の最大固有値及び最小固有値の比で計算される条件数である
    収音装置。
  9. 請求項1から5のいずれかに記載の収音装置であって、
    前記制御量Zは、伝達特性から計算される空間相関行列の固有値分布の平滑度合を表す
    行列式である
    収音装置。
JP2017079979A 2013-01-24 2017-04-13 収音装置 Expired - Fee Related JP6329296B2 (ja)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2013010806 2013-01-24
JP2013010806 2013-01-24
JP2013034616 2013-02-25
JP2013034616 2013-02-25

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2013219786A Division JP6211890B2 (ja) 2013-01-24 2013-10-23 収音装置

Publications (2)

Publication Number Publication Date
JP2017153126A JP2017153126A (ja) 2017-08-31
JP6329296B2 true JP6329296B2 (ja) 2018-05-23

Family

ID=51834749

Family Applications (3)

Application Number Title Priority Date Filing Date
JP2013219786A Expired - Fee Related JP6211890B2 (ja) 2013-01-24 2013-10-23 収音装置
JP2017079979A Expired - Fee Related JP6329296B2 (ja) 2013-01-24 2017-04-13 収音装置
JP2017079978A Expired - Fee Related JP6420402B2 (ja) 2013-01-24 2017-04-13 収音装置

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2013219786A Expired - Fee Related JP6211890B2 (ja) 2013-01-24 2013-10-23 収音装置

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2017079978A Expired - Fee Related JP6420402B2 (ja) 2013-01-24 2017-04-13 収音装置

Country Status (1)

Country Link
JP (3) JP6211890B2 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6481397B2 (ja) * 2015-02-10 2019-03-13 沖電気工業株式会社 マイクロホン間隔制御装置及びプログラム
JP6622618B2 (ja) * 2016-02-19 2019-12-18 日本放送協会 逆フィルタ算出装置及びそのプログラム
EP3447761B1 (en) * 2016-04-19 2024-02-21 Sony Interactive Entertainment Inc. Drive system and electric device provided with same
JP6588866B2 (ja) * 2016-06-15 2019-10-09 日本電信電話株式会社 変換装置
WO2018037643A1 (ja) * 2016-08-23 2018-03-01 ソニー株式会社 情報処理装置、情報処理方法及びプログラム
JP6831733B2 (ja) * 2017-03-27 2021-02-17 株式会社エンプラス エミッタの製造方法
CN108184180A (zh) * 2018-03-26 2018-06-19 东莞市哲巫本计文化传播有限公司 一种全频声音采集器

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05207117A (ja) * 1992-01-30 1993-08-13 Mazda Motor Corp マイクロホンの指向性制御装置
JP3074952B2 (ja) * 1992-08-18 2000-08-07 日本電気株式会社 雑音除去装置
JP3344647B2 (ja) * 1998-02-18 2002-11-11 富士通株式会社 マイクロホンアレイ装置
JP5826465B2 (ja) * 2010-06-11 2015-12-02 日本電信電話株式会社 瞬時直間比推定装置、雑音除去装置、遠近判定装置、音源距離測定装置と、各装置の方法と、装置プログラム
US20130282370A1 (en) * 2011-01-13 2013-10-24 Nec Corporation Speech processing apparatus, control method thereof, storage medium storing control program thereof, and vehicle, information processing apparatus, and information processing system including the speech processing apparatus
JP5395822B2 (ja) * 2011-02-07 2014-01-22 日本電信電話株式会社 ズームマイク装置
JP5337189B2 (ja) * 2011-04-06 2013-11-06 日本電信電話株式会社 フィルタ設計における反射物の配置決定方法、装置、プログラム
JP5786732B2 (ja) * 2011-04-14 2015-09-30 株式会社Jvcケンウッド 音場生成装置、音場生成システム、及び音場生成方法

Also Published As

Publication number Publication date
JP6211890B2 (ja) 2017-10-11
JP2014187685A (ja) 2014-10-02
JP6420402B2 (ja) 2018-11-07
JP2017153126A (ja) 2017-08-31
JP2017123698A (ja) 2017-07-13

Similar Documents

Publication Publication Date Title
JP6329296B2 (ja) 収音装置
US9820036B1 (en) Speech processing of reflected sound
Mohan et al. Localization of multiple acoustic sources with small arrays using a coherence test
Benesty et al. Conventional beamforming techniques
US7171008B2 (en) Reducing noise in audio systems
US10334390B2 (en) Method and system for acoustic source enhancement using acoustic sensor array
KR100856246B1 (ko) 실제 잡음 환경의 특성을 반영한 빔포밍 장치 및 방법
Gunel et al. Acoustic source separation of convolutive mixtures based on intensity vector statistics
Salvati et al. Incoherent frequency fusion for broadband steered response power algorithms in noisy environments
US20130258813A1 (en) Apparatus and method for spatially selective sound acquisition by acoustictriangulation
Bush et al. Broadband implementation of coprime linear microphone arrays for direction of arrival estimation
Lockwood et al. Beamformer performance with acoustic vector sensors in air
CN101447190A (zh) 基于嵌套子阵列的后置滤波与谱减法联合语音增强方法
US20200145752A1 (en) Method and apparatus for audio capture using beamforming
CN108447499B (zh) 一种双层圆环麦克风阵列语音增强方法
US6718041B2 (en) Echo attenuating method and device
JP6117142B2 (ja) 変換装置
JP5815489B2 (ja) 音源別音声強調装置、方法、プログラム
JP6031364B2 (ja) 収音装置及び再生装置
Nagata et al. Two-dimensional DOA estimation of sound sources based on weighted wiener gain exploiting two-directional microphones
JP6063890B2 (ja) 変換装置
JP5791685B2 (ja) マイクロホン配置決定装置、マイクロホン配置決定方法及びプログラム
JP2013135373A (ja) ズームマイク装置
JP5948259B2 (ja) 収音装置及び再生装置
JP2020058085A (ja) 収音装置

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180313

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180417

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180419

R150 Certificate of patent or registration of utility model

Ref document number: 6329296

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees