JP2015198411A - 変換装置 - Google Patents

変換装置 Download PDF

Info

Publication number
JP2015198411A
JP2015198411A JP2014076661A JP2014076661A JP2015198411A JP 2015198411 A JP2015198411 A JP 2015198411A JP 2014076661 A JP2014076661 A JP 2014076661A JP 2014076661 A JP2014076661 A JP 2014076661A JP 2015198411 A JP2015198411 A JP 2015198411A
Authority
JP
Japan
Prior art keywords
zone
conversion device
waves
microphone
sound
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2014076661A
Other languages
English (en)
Other versions
JP6063890B2 (ja
Inventor
健太 丹羽
Kenta Niwa
健太 丹羽
小林 和則
Kazunori Kobayashi
和則 小林
友規 村上
Tomoki Murakami
友規 村上
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2014076661A priority Critical patent/JP6063890B2/ja
Publication of JP2015198411A publication Critical patent/JP2015198411A/ja
Application granted granted Critical
Publication of JP6063890B2 publication Critical patent/JP6063890B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Circuit For Audible Band Transducer (AREA)
  • Aerials With Secondary Devices (AREA)

Abstract

【課題】様々な方向から到来する波を同時に、高空間分解能で解析でき、かつ、波源と観測点の間のインパルス応答長が短くなるような変換装置を提供する。
【解決手段】変換装置は、高SNゾーンを形成する高SNゾーン形成器と、Mを2以上の整数、m=1,2,…,Mとし、高SNゾーン付近の、それぞれ異なる位置に配置された、波を信号に、または、信号を波に変換可能なM個の第m変換部とを含む。M個の第m変換部において変換される波、または、変換された波は、全て同種の波である。
【選択図】図1

Description

本発明は、波を信号、または、信号を波に変換する変換技術に関する。なお、ここでいう波とは、音波や電磁波等を含むものである。音波は、周波数が20〜20kHz程度である。また、電磁波は、光波や電波等を含み、光波は、波長が400〜750nm(周波数は750THz〜400THz)程度の電磁波であり、電波は、周波数が3THz程度以下の電磁波である。また、ここでいう信号とは、情報を伝達するために記号化、符号化したものであって、その媒体としては、電気、音、光、電波等が考えられる。
非特許文献1、2及び3が、変換技術の従来技術として知られている。
非特許文献1では、パラボラ反射板の高SNゾーン位置にセンサを設置したアレイを用いて、干渉雑音の除去を実現している。なお、雑音除去性能はアレイを構成するパラボラ装置の台数に依存する。
非特許文献2及び3では、反射構造体により擬似的な拡散音場を生成し、その中にマイクロホンアレイを設置して、拡散センシングを実現している。
「2013年5月07日 アルマ望遠鏡日本製パラボラアンテナ16台の山頂施設設置が完了」、[online]、ALMA NAOJ、[平成26年2月26日検索]、インターネット<http://alma.mtk.nao.ac.jp/j/news/pressrelease/201305077095.html> K. Niwa, S. Sakauchi, K. Furuya, M. Okamoto, and Y. Haneda, "Diffused sensing for sharp directivity microphone array", ICASSP 2012, 2012, pp. 225 - 228 K. Niwa, Y. Hioka, K. Furuya, and Y. Haneda, "Telescopic microphone array using reflector for segregating target source from noises in same direction", ICASSP 2012, 2012, pp. 5457-5460
しかしながら、非特許文献1では、1つの方向に対して最適化されたアレイではあるが, 様々な方向から到来する情報を同時に解析することができない。他の方向から到来する情報を解析する場合には、パラボラ装置の向きを変更する必要がある。
非特許文献2及び3では、拡散音場にアレイを設置することで、チャネル間相関を低減させ、様々な方向から到来する音を同時に、高空間分解能で解析できる。しかし、拡散音場にアレイを設置するため、インパルス応答長が長くなる。インパルス応答長が長くなると、フィルタ長が自ずと長くなる傾向があり、処理遅延が大きくなったり、フィルタの不安点性が増すといった問題が生じる。また、設計自体も複雑なものとなり、フィルタリング時の計算量が大きくなる。
本発明は、様々な方向から到来する波を同時に、高空間分解能で解析でき、かつ、波源と観測点の間のインパルス応答長が短くなるような変換装置を提供することを目的とする。
上記の課題を解決するために、本発明の一態様によれば、変換装置は、SN比が高い範囲である高SNゾーンを形成する高SNゾーン形成器と、Mを2以上の整数、m=1,2,…,Mとし、高SNゾーン付近の、それぞれ異なる位置に配置された、波を信号に、または、信号を波に変換可能なM個の第m変換部とを含む。M個の第m変換部において変換される波、または、変換された波は、全て同種の波である。
本発明によれば、(1)様々な方向から到来する波を同時に解析可能であり、(2)(i)インパルス応答が短い、(ii)送受信エネルギーが高い、(iii)チャネル間相関が低いという3条件を満たす信号の送受信を可能とする効果を奏する。
収音装置の条件を説明するための図。 パラボラアンテナとアンテナ素子と配置例を示す図。 所定の方向とは異なる方向から電波が来る場合のSN比が高いエリアを説明するための図。 第一実施形態に係る収音装置の機能構成を示す図。 第一実施形態に係る収音装置の処理フローの例を示す図。 高SNゾーン形成器に対するマイクロホンの配置例を示す図。 高SNゾーン形成器に対するマイクロホンの配置例を示す図。 「高SNゾーン付近」の範囲を説明するための図。 「高SNゾーン付近」の範囲を説明するための図。 高SNゾーン形成面と相似形状の面の付近を説明するための図。 伝達特性を測定する方法を説明するための図。 レンズを用いた場合の「高SNゾーン付近」の範囲を説明するための図。 第二実施形態に係る再生装置の機能構成を示す図。 第二実施形態に係る再生装置の処理フローの例を示す図。 第三実施形態における高SNゾーン形成器に対するマイクロホンの位置関係を説明するための図。 第三実施形態に係る収音装置の機能構成を示す図。 高SNゾーン形成器に対するマイクロホンの配置例を示す図。 高SNゾーン形成器に対するマイクロホンの配置例を示す図。
以下、本発明の実施形態について説明する。なお、以下の説明に用いる図面では、同じ機能を持つ構成部や同じ処理を行うステップには同一の符号を記し、重複説明を省略する。以下の説明において、テキスト中で使用する記号「」等は、本来直前の文字の真上に記載されるべきものであるが、テキスト記法の制限により、当該文字の直後に記載する。式中においてはこれらの記号は本来の位置に記述している。また、ベクトルや行列の各要素単位で行われる処理は、特に断りが無い限り、そのベクトルやその行列の全ての要素に対して適用されるものとする。
<第一実施形態>
本実施形態では、波を信号に変換する変換技術に本発明を適用する例を説明する。波を信号に変換する変換技術の例として、以下の技術が挙げられる。(1)音波を電気信号に変換する技術や、(2)電磁波を電気信号に変換する技術がある。ただし、これに限るものではなく、(3)音波を光信号に変換する技術等であってもよい。(1)を実現するデバイスとしてはマイクロホンがある。(2)を実現するデバイスとしては受信アンテナがある。また、(3)を直接実現できるハードウェアがあればそれを用いてもよい。
特に、本実施形態では、波として音波を用い、複数の変換部として音波を電気信号に変換する複数のマイクロホン(マイクロホンアレイ)を用いる場合について説明する。
まず、非特許文献2で説明されているこれまでの拡散センシングに基づく収音処理について説明する。
[観測信号のモデル化]
M(≧2)本のマイクロホンを用いて一つのターゲット音とK(≧1)個の雑音を受音する状況を考える。多くの雑音が存在する中で任意の位置にあるターゲット音を強調する指向制御を目的にする。目的は、K個の雑音源を抑圧し、ターゲット音を強調することで達成される。m(m=1,2,…,M)番目のマイクロホンとターゲット音、k(k=1,2,…,K)番目の雑音との間のインパルス応答をそれぞれam(i)、bk,m(i)とする。ただし、インパルス応答長をLとし、i=0,1,…,L-1とする。なお、インパルス応答長Lは、装置の規模や構造、設置された部屋の状況によって定まる残響時間により、実験的に定めればよい。ターゲット音、k番目の雑音の音源信号をそれぞれs(t)、nk(t)とするとき、m番目のマイクロホンで観測した観測信号xm(t)は、次式でモデル化される。
Figure 2015198411

ここで、tは時間のインデックスを表わす。
xm(t)を短時間フーリエ変換することで、式(1)の畳み込み混合は、次式のような周波数領域における瞬時混合として近似される。
Figure 2015198411
ここで、ω、τはそれぞれ周波数、フレームのインデックスを表わす。また、Xm(ω,τ)、S(ω,τ)、Nk(ω,τ)は、それぞれ観測信号xm(t)、ターゲット音の音源信号s(t)、k番目の雑音の音源信号nk(t)の時間周波数表現を表わす。am(ω)、bk,m(ω)は、それぞれターゲット音、k番目の雑音とm番目のマイクロホンとの間の周波数特性を表し、以後これらを伝達特性と呼ぶ。式(2)を行列形式で表記すると、次式のようになる。
Figure 2015198411

であり、Tは転置を表わす。
[ビームフォーミング]
ビームフォーミング後の出力信号y(t)は、次式のように観測信号xm(t)と、ターゲット音を強調するように設計されたフィルタwm(t)とを畳み込むことで得られる。
Figure 2015198411
ここで、Jはフィルタ長を表わし、インパルス応答長Lと同程度とすればよい。y(t)の時間周波数表現であるY(ω,τ)は、次式で近似的に求められる。
Figure 2015198411

ここで、Hは共役転置を表し、Wm(ω)の複素共役がwm(j)の周波数応答に対応する。
Figure 2015198411
出力信号Y(ω,τ)に含まれる雑音成分をYN(ω,τ)と書くとき、次式のパワーpN(ω)は雑音成分のパワーとして定義される。
Figure 2015198411

ここで、ETは時間的な期待値演算を表わす。音源信号が互いに無相関であると仮定すると、パワーpN(ω)は伝達特性b k(ω)とフィルタW(ω)だけで計算できる。
Figure 2015198411
アレイ信号処理の分野では、pN(ω)を最小化するために、様々なフィルタ設計法が説明されてきた。代表例として、遅延和法と最尤法を説明する(参考文献1参照)。
[参考文献1]浅野太,「音のアレイ信号処理-音源の低位・追跡と分離」,コロナ社,2011年
遅延和法において、フィルタW DSは、次式により、ターゲット音の直接音を強調するように設計される。
Figure 2015198411

は、ターゲット音の直接音のアレイ・マニフォールド・ベクトルを表わす。要素hm(ω)は、ターゲット音からm番目のマイクロホンまでの直接音の経路の伝達特性を表し、ターゲット音とm番目のマイクロホン間の距離をdm、音速をc、虚数単位をjとすると、例えば次式により計算できる。
Figure 2015198411
また、最尤法において、フィルタW MLは、次式により、ターゲット音の直接音を強調し、パワーpN(ω)を最小化するように設計される。
Figure 2015198411
ここで、R(ω)は雑音の空間相関行列を表わす。例えば、音源信号間が無相関であると仮定すると、雑音の空間相関行列R(ω)は次式のように、伝達特性b k(ω)のみを用いて計算される。
Figure 2015198411
参考文献1に載っているような古典的なアレイ信号処理において、マイクロホン間の間隔をどのようにアレンジするのかといったことが考えられてきた。しかし、特定の周波数を除いてマイクロホン間の相関が高くなることが多かった。代表的な問題として知られているのは以下の二つである。一つ目は波長の長い低周波帯域では、伝達特性間の相関が高くなりやすいので、狭指向制御しづらいことである。二つ目は波長の短い高周波帯域では、波長の半波長以下の間隔でマイクロホンを並べない限り、特定のターゲット音以外の音を強調してしまう空間エリアジングが生じることである。以上の2点から、広帯域に渡ってパワーpN(ω)を小さくすることは困難とされてきた。
[拡散センシング]
非特許文献2では、広帯域に渡ってパワーpN(ω)を小さくするために、伝達特性の性質がどういう性質であるべきかが検討され、拡散センシングとして纏められている。
拡散センシングでは、アレイ構造を工夫することにより、次式で表すように伝達特性そのものが互いに無相関化するように物理的に変える。
Figure 2015198411
ここで、伝達特性の性質そのものを変えるためのあらゆる物理的手段を用いることができ、例えばマイクロホンの近傍に反射構造体を設置することで、伝達特性そのものが変化する。非特許文献2で提案されている方式は、多数回反射を繰り返し、等方位的に反射音が到来する音場(疑似拡散音場)を生成し、その中にマイクロホンアレイを設置する方式である。例えば、マイクロホンアレイを包囲するような形状の反射構造体を作り、一面だけ開けておけば、反射構造体内に到来した音が自ずと反射を繰り返し、疑似的な拡散音場を生成することになる。
何故、拡散音場にマイクロホンアレイを設置すると、伝達特性間が無相関化されるのかを簡単に説明する。伝達特性間の相関をγ(ω)とすると、拡散音場における相関γ(ω)は次式により計算されることが知られている。
Figure 2015198411
ここで、ES,pはそれぞれ空間的な期待値演算、マイクロホン間の位置ベクトルを表わす。マイクロホン間の距離||p||が十分に広いとすると、拡散音場における伝達特性間の相関γ(ω)の期待値は0に漸近する。
Figure 2015198411
だから、従来技術において反射構造体により疑似的な拡散音場を物理的に生成し、その中にマイクロホンアレイを設置してきた(非特許文献2、3参照)。
また、パワーpN(ω)を小さくするために、事前のシミュレーションや測定により用意した伝達特性を用いたフィルタ設計方式を検討してきた。簡単に言えば、ターゲット音のみを強調するようにしてきたが、拡散センシングに基づく制御では、伝達特性そのものを強調するように設計される。
遅延和法をベースとする場合、次式のように、アレイ・マニフォールド・ベクトルh(ω)をターゲット音の伝達特性a(ω)に置き換えることで、フィルタW DS1(ω)を設計できる。
Figure 2015198411

この場合、a(ω)をシミュレーションや実測により事前に用意する必要がある。
また、最尤法をベースとする場合、次式によりフィルタW DS2(ω)を設計できる。
Figure 2015198411
この場合も同様に、a(ω)やR(ω)をシミュレーションや実測により事前に用意する必要がある。先に挙げたような手段を用いて、疑似的な拡散音場を生成し、音を収音する場合、伝達特性が自ずと無相関化されていることが期待されるので、パワーpN(ω)を広帯域に渡って小さくすることができた。
<第一実施形態のポイント>
非特許文献2及び3のズームアップマイクでは、反射構造体により多数回、音波を反射し、等方位的に反射音が到来する音場(疑似拡散音場)を生成し、その内部にアレイを設置するため、インパルス応答長が長くなり、それに応じてフィルタ長が長くなってしまい、処理遅延の発生、フィルタの不安定性が増大する。
本実施形態では、非特許文献2及び3のズームアップマイクにおけるチャネル間相関を低減する考えを継承し、さらに、インパルス応答長が短い状態を維持しつつ、受音時のSN比を高める。このような構成により、様々な方向から到来する情報を安定的に同時に、高空間分解能で解析することが可能である。
本実施形態では、受音時のSN比を高めるために、高SNゾーン形成器を用いて高SNゾーンを形成し、高SNゾーン付近に複数のマイクロホンを配置する。このとき、チャネル間相関を低減するために、各マイクロホンを高SNゾーン付近の異なる位置(箇所)に配置する。なお、高SNゾーンとは、高SNゾーン形成器によって特にSN比が高められる範囲であり、例えば、高SNゾーン形成器がパラボラ反射板の場合には、そのパラボラ反射板の形成する焦点である。高SNゾーン付近とは、高SNゾーン形成器が存在する場合に、高SNゾーン形成器が存在しない場合に比べて、SN比が高まる範囲を意味する。よって、当然、高SNゾーンを含むが、高SNゾーンほどではないが、SN比が高まるような範囲を含む。
図1を用いて本実施形態で定義する収音装置の条件を説明する。
[必須条件]
(1)高SNゾーンを形成する高SNゾーン形成器を含むこと
1つ以上の高SNゾーン形成器190を含む。高SNゾーン形成器190は、音波に対して高SNゾーンFを形成する。例えば、高SNゾーン形成器190として剛体からなる凹型構造物を用いる。凹型構造物の一つとして、パラボラ反射板が考えられる。なお、高SNゾーン形成器190の必要最低数は1個である。
(2)高SNゾーン付近FEの、それぞれ異なる位置に配置された、複数のマイクロホンを含むこと
M個のマイクロホン211−mを含む。ただし、Mは2以上の整数であり、m=1,2,…,Mである。マイクロホン211−mは高SNゾーン付近FEに配置され、マイクロホン211−mとマイクロホン211−m’とは異なる位置に配置される。ただし、m'は1,2,…,Mの何れかであり、m≠m'である。なお、マイクロホン211−mの必要最低数は2個である。
(3)フィルタリング部を含むこと
M個のマイクロホンに対し、それぞれ独立なフィルタ処理できるようなフィルタリング部160を有していること。さらに、フィルタリング部160は、直接波だけでなく、反射波を含む伝達特性そのものを制御するような信号処理を行う。
<第一実施形態の概要>
通常、放物曲面をした反射器を持つパラボラアンテナ90は、1つの方向(例えば正面方向)から電波が来ることを想定し、焦点Fにアンテナ素子91を配置する(図2参照)。このような構成とすることで、電波を点ではなく面で受信することができ、SN比を高めることができる。
他の方向から電波が来る場合には、焦点付近においてSN比が高いエリアQが発生する(図3参照)。なお、このような性質はパラボラアンテナに限らず、凹型の反射部を備え、音波の焦点を形成する場合にも同様の性質が現れる。本実施形態では、焦点等の高SNゾーンの付近におけるこのような性質を利用し、焦点等の高SNゾーンの付近に複数のマイクロホンを配置し、SN比を高める。
また、マイクロホン211−mとマイクロホン211−m’とを異なる位置に配置することで、チャネル間相関を低減する。なお、焦点に複数のマイクロホンを配置した場合は、SN比は高いものの、チャネル間相関が非常に高くなるため、様々な方向から到来する電波を受信することができず、1つの方向から来る電波だけを高精度に受信することができる構成となる。
なお、SN比を高めることは、空間相関行列Rの対角成分を大きな値にすることを意味する。ただし、マイクロホン211−mで収音された観測信号をXmとすると、空間相関行列Rのmm’成分はRmm’=E[XmXm’ H]である。ここではm=1,2,…,M、m'=1,2,…,Mであり、m=m'のとき、空間相関行列Rの対角成分となり、対角成分であるRmm=E[XmXm H]はマイクロホン211−mの受音エネルギー(パワー)を表す。E[・]は期待値演算を表している。一方、チャネル間相関を低減することは、空間相関行列Rの非対角成分を小さな値にすることを意味する。この二つの条件を同時に満たすことは、空間相関行列Rの行列式det(R)を最大化することに対応する。。
本実施形態では、行列式det(R)を最大化するように、複数のマイクロホンを高SNゾーン付近の、異なる位置に配置する。さらに、本実施形態では、インパルス応答長を短くするために、言い換えると、フィルタリング部において用いるフィルタ長を短くするために、高SNゾーン形成器190の形状を、音波の反射回数が1〜2回程度となるように形成する。また、時間的な観点から言えば、高SNゾーン形成器190の形状を、直接音と主要な反射波とのマイクロホンへの到達時間の差が50ms以内となるように形成する。例えば、パラボラ形状とする。
<第一実施形態に係る収音装置10>
[収音装置10の信号処理]
第一実施形態に係る収音装置10の機能構成および処理フローを図4と図5に示す。この第一実施形態の収音装置10は、M個のマイクロホン211−m、AD変換部120、周波数領域変換部130、フィルタリング部160、時間領域変換部170、フィルタ計算部150、伝達特性記憶部140、高SNゾーン形成器190を含む。m=1,2,…,Mであり、M≧2である。
<高SNゾーン形成器190>
高SNゾーン形成器190は、所定の方向の波に対して高SNゾーンを形成する。高SNゾーン形成器190は高SNゾーンを形成するための高SNゾーン形成面を有する。高SNゾーン形成面は音波を反射可能な形状、材質、大きさであり、音波を反射することで高SNゾーンを形成する。この実施形態では、高SNゾーン形成器190は、パラボラ形状の剛体であり、パラボラ形状の内面が高SNゾーン形成面に相当する。よって、パラボラ形状の成す焦点がSNゾーンに相当し、焦点付近がSNゾーン付近に相当する。パラボラ形状の縁が成す円形の直径が、扱う波長幅の中で最大の波長幅の半波長程度以上であることが望ましい。そこで、音波の波長で扱う波長幅は0.01〜1mであるため、パラボラ形状の縁が成す円形の直径が0.5m程度以上であることが望ましい。高SNゾーン形成器190の材質は、音波を反射しやすいもの(言い換えると、反射係数の高い材質)が望ましく、硬い素材が良い。そこで、本実施形態では、硬くて面積のあるパラボラ形状の剛体を高SNゾーン形成器190として用いた。
<マイクロホン211−m>
M個のマイクロホン211−mを用いて収音し(s1)、アナログ信号(収音信号)をAD変換部120に出力する。なお、マイクロホン211−mとマイクロホン211−m’とは、高SNゾーン形成器190が形成する高SNゾーン付近の、異なる位置に配置される。ここでは、m’は1,2,…,Mの何れかであり、m≠m’である。
<高SNゾーン形成器190に対するマイクロホン211−mの位置>
空間相関行列Rの行列式det(R)が最大化されるようにM個のマイクロホンを配置すればよい。SN比を高めるためにM個のマイクロホンを高SNゾーン付近に配置する。また、チャネル間相関が低くなるように、M個のマイクロホンを異なる位置に配置する。言い換えるとM個のマイクロホンで電気信号に変換される音波の間の相関が低くなるように、M個のマイクロホンを配置すればよい。全体として、相関が低くなるように、M個のマイクロホンを配置することが望ましいが、少なくとも、1つの相関が低くなるように、M個のマイクロホン211−mを配置すれば効果を得ることができる。別の言い方をすると、M個のマイクロホンの中の、何れか2つのマイクロホンで変換される音波間の相関の組合せは、MC2個考えられるが、その相関の組合せMC2個のうち、少なくとも1つの相関が低くなるようにM個のマイクロホン211−mを配置すればよい。
図6及び図7は、それぞれ高SNゾーン形成器190に対するマイクロホン211−mの配置例を示す。
この実施形態では、マイクロホン211−mは、高SNゾーン形成器190に到来する波を遮りにくい形状の支持部191で支持されている。
図6では、支持部191は、高SNゾーン形成器190が形成する高SNゾーン付近に位置する面を含む構造物であって、その面にはマイクロホン211−mを保持するための空孔が複数形成される。例えば、M'(M'>M)個の空孔が形成されており、各マイクロホン211−mをM'個の空孔の何れかに埋め込む。この実施形態では、支持部191は、網状部材191Aと支持部材191Bとを含む。支持部材191Bは、パラボラ形状の高SNゾーン形成器190の底を頭頂点とする正四角錐の、頭頂点から伸びる各辺を形成する棒状の構造物である。正四角錐の底面と同一平面状に網状の網状部材191Aを備える。支持部材191Bは、高SNゾーン形成器190と網状部材191Aとを結合し、高SNゾーン形成器190に対して網状部材191Aを固定する。網状部材191Aは、高SNゾーン形成器190が形成する高SNゾーン付近に位置する面を含む構造物である。さらに、網状部材191Aにはマイクロホン211−mを保持するための空孔が複数形成されている。言い換えると、網状の網状部材191Aの網の目の何れかにM個のマイクロホン211−mを埋め込むことができる。
図7では、支持部191は、高SNゾーン形成器190とマイクロホン211−mとを結合する棒状の構造物である。
支持部191の形状は、上述のものに限られず、高SNゾーン形成器190に到来する波を遮りにくい形状であって、マイクロホン211−mを支持できる形状であればどのようなものであってもよい。
「高SNゾーン付近」について、説明する。高SNゾーンとは、前述の通り、高SNゾーン形成器190が所定の方向の波に対して形成する高SNゾーン(例えば焦点)を意味する。例えば、高SNゾーン形成器190は、高SNゾーンを形成するように、窪んだ凹型である。所定の方向に対して垂直な方向において、「高SNゾーン付近」の範囲とは、凹型の縁の内側を意味する(図8及び図9参照)。凹型の縁と高SNゾーンとの位置関係により、所定の方向における「高SNゾーン付近」の範囲が異なる。凹型の縁が成す平面Hと高SNゾーン形成器190の成す凹型の底を通る平面Iとの距離をHIとし、高SNゾーンFと高SNゾーン形成器190の成す凹型の底を通る平面Iとの距離をFIとすると、
(1)HI≧FIのとき、凹型の底から所定の方向に2HIまでが、所定の方向における「高SNゾーン付近」の範囲である(図8参照)。
(2)HI<FIのとき、凹型の底から所定の方向に2FIまでが、所定の方向における「高SNゾーン付近」の範囲である(図9参照)。
ただし、高SNゾーンを形成するように、窪んだ凹型であっても、必ずしも、その縁の成す面が平面になるとは限らず、また、高SNゾーン(例えば焦点)も厳密な点ではなく、ある程度の範囲を持つことから、「高SNゾーン付近」とは、高SNゾーン形成器190がない場合に比べ、ある場合に、SN比が高くなる範囲を意味している。
高SNゾーン付近において、特に、高SNゾーン形成面Jと相似形状の面J'の付近J'Eにおいて、SN比が高くなるので(図10)、付近J'Eの異なる位置にM個のマイクロホン211−mを配置することで、より適切に空間相関行列Rの行列式det(R)の最大化を図ることができる。なお、相似形状の面J'の付近J'Eとは、高SNゾーン形成面Jと類似形状の面上といってもよいし、高SNゾーン形成面と類似形状の面の付近といってもよい。要は、SN比が高い高SNゾーン付近において、特に、SN比が高くなると考えられる範囲の異なる位置にM個のマイクロホン211−mを配置すればよい。
<AD変換部120>
AD変換部120が、M個のマイクロホン211−mで収音されたM個のアナログ信号をディジタル信号x(t)=[x1(t),…,xM(t)]Tへ変換し、(s2)、周波数領域変換部130に出力する。tは離散時間のインデックスを表す。
<周波数領域変換部130>
周波数領域変換部130は、まず、AD変換部120が出力したディジタル信号x(t)=[x1(t),…,xM(t)]Tを入力とし、チャネルごとにNサンプルをバッファに貯めてフレーム単位のディジタル信号x(τ)=[x 1(τ),…,x M(τ)]Tを生成する。τはフレーム番号のインデックスである。x m(τ)=[xm((τ-1)N+1),…,xm(τN)](1≦m≦M)である。Nはサンプリング周波数にもよるが、48kHzサンプリングの場合には2048点あたりが妥当である。次に、周波数領域変換部130は、各フレームのディジタル信号x(τ)を周波数領域の信号X(ω,τ)=[X1(ω,τ),…,XM(ω,τ)]Tに変換し(s3)、出力する。ωは離散周波数のインデックスである。時間領域信号を周波数領域信号に変換する方法の一つに高速離散フーリエ変換があるが、これに限定されず、周波数領域信号に変換する他の方法を用いてもよい。周波数領域信号X(ω,τ)は、各周波数ω、フレームτごとに出力される。
<伝達特性記憶部140>
伝達特性記憶部140は、予め収音装置10を使って測定された伝達特性A(ω)=[a(ω),b 1(ω),…,b K(ω)]を記憶しておく。a(ω)=[a1(ω),…,aM(ω)]Tを、ターゲット音とM本のマイクロホンとの間の周波数ωでの伝達特性、換言すれば、a(ω)=[a1(ω),…,aM(ω)]Tは、マイクロホンアレイに含まれる各マイクロホンへのターゲット音の周波数ωでの伝達特性とする。k=1,2,…,Kであり、Kは雑音の個数であり、bk (ω)=[bk1(ω),…,bkM(ω)]Tを、雑音kとM本のマイクロホンとの間の周波数ωでの伝達特性、換言すれば、bk (ω)=[bk1(ω),…,bkM(ω)]Tは、マイクロホンアレイに含まれる各マイクロホンへの雑音kの周波数ωでの伝達特性とする。なお、伝達特性A(ω)は、事前測定によらず、理論式やシミュレーションにより事前に用意してもよい。
例えば、図11に示すように、レール94上のスピーカアレイ95を左右に移動させ、各位置における伝達特性を測定する。さらに、レール94を前後に移動させて、各位置における伝達特性を測定してもよい。なお、図11において、複数の高SNゾーン形成器190を用いているが、1つの高SNゾーン形成器190のみを用いてもよい。利用状況と同じ状況(同じ個数の、同じ配置の、同じ高SNゾーン形成器190と、M個の同じ配置の、同じマイクロホン211−m)で、伝達特性を事前に測定すればよい。このときに、空間相関行列Rの行列式det(R)が最大化されるように、1つの高SNゾーン形成器190に対してM個のマイクロホン211−mを配置すればよい。
<フィルタ計算部150>
フィルタ計算部150は、伝達特性記憶部140から伝達特性A(ω)を取り出し、フィルタW(ω)を計算し、フィルタリング部160に出力する。例えば、特定の位置または方向からの音響信号を抑圧する信号処理に用いるフィルタW(ω)を計算する。
本実施形態のビームフォーミング技術の要点は、高SNゾーン付近に複数のマイクロホンを配置してSN比を高め、複数のマイクロホンを高SNゾーン付近の異なる位置に配置することで広帯域に渡って伝達特性を無相関化させることである。そのため、フィルタの設計コンセプト自体に影響を与えないので、従来技術と同様の方法により、フィルタW(ω)を設計することができる。例えば、参考文献2に記載されている<1>SN比最大化規準によるフィルタ設計法、<2>パワーインバージョン(Power Inversion)に基づくフィルタ設計法、<3>一つ以上の死角(雑音のゲインが抑圧される方向)を拘束条件に持つ最小分散無歪応答法によるフィルタ設計法、<4>遅延合成(Delay-and-Sum Beam Forming)法によるフィルタ設計法、<5>最尤法によるフィルタ設計法、<6>AMNOR(Adaptive Microphone-array for noise reduction)法等によって、フィルタW(ω)を設計することができる。
[参考文献2]国際公開第WO2012/086834号パンフレット
例えば、遅延和法をベースとする場合、式(16)により、フィルタW DS1(ω)を計算する。
Figure 2015198411
また例えば、最尤法をベースとする場合、式(17)により、フィルタW DS2(ω)を計算する。
Figure 2015198411
また例えば、一つ以上の死角を拘束条件に持つ最小分散無歪応答法によるフィルタ設計法の場合、次式により、フィルタW DS3(ω)を計算する。
Figure 2015198411
ただし、fS(ω),fk(ω)はそれぞれターゲット音、雑音k(k=1,2,…,K)に関する周波数ωでの通過特性を表す。例えば、式(18)において、伝達特性a(ω)が方向θに依存する伝達特性a(ω,θ)として事前に用意できる場合には、伝達特性a(ω,θ)を用いて、フィルタW(ω,θ)を計算し、フィルタリング部160において、特定の方向θsの信号処理が行える。また、伝達特性a(ω)が方向θ、距離Dに依存する伝達特性a(ω,θ,D)として事前に用意できる場合には、伝達特性a(ω,θ,D)を用いて、フィルタW(ω,θ,D)を計算し、フィルタリング部160において、特定の位置(特定の方向θsと距離DHにより特定される位置)の信号処理が行える。
<フィルタリング部160>
フィルタリング部160は、予めフィルタ計算部150からフィルタW(ω)を受け取っておき、周波数領域信号X(ω,τ)を受け取り、フレームτごとに、各周波数ω∈Ωについて、周波数領域信号X(ω,τ)=[X1(ω,τ),…,XM(ω,τ)]Tに、フィルタW(ω)を適用して(式(5)参照、s4)、出力信号Y(ω,τ)を出力する。
Figure 2015198411
例えば、フィルタリング部160はマイクロホン211−mによる収音信号とマイクロホン211−m’による収音信号とに基づき、空間上の少なくとも複数の位置または方向から発せられた音響信号の収音特性を異ならせるものであればよい。「収音特性を異ならせる」とは、例えば、特定の位置で発せられた音響信号を局所収音して他の位置で発せられた音響信号を極力収音しないようにしたり、逆に特定の位置で発せられた音響信号を抑圧(消音)して他の位置で発せられた音響信号のみを収音したりすることを意味する。
<時間領域変換部170>
時間領域変換部170は、第τフレームの各周波数ω∈Ωの出力信号Y(ω,τ)を時間領域に変換して(s5)、第τフレームのフレーム単位時間領域信号y(τ)を得て、さらに、得られたフレーム単位時間領域信号y(τ)をフレーム番号のインデックスの順番に連結して時間領域信号y(t)を出力する。周波数領域信号を時間領域信号に変換する方法は、s3の処理で用いた変換方法に対応する逆変換であり、例えば高速離散逆フーリエ変換である。
<効果>
このような構成により、非特許文献1や2のズームアップマイクにおけるチャネル間相関を低減する考えを継承し、さらに、インパルス応答長を短くし、受音時のSN比を高めることができる。そのため、様々な方向から到来する波(さらには、波により示される情報)を安定的に、同時に、高空間分解能で解析することが可能になる。例えば、事前に用意した伝達特性を使ってフィルタを使って適切な信号処理をすることで、広帯域に渡って任意の指向制御が可能になる。なお、本実施形態では、予めフィルタW(ω)を計算しているが、収音装置10の計算処理能力などに応じて、音源位置、マイクロホンの配置が定まってからフィルタ計算部150が周波数ごとのフィルタW(ω)を計算する構成としてもよい。
<変形例>
本実施形態では、波として、音波を用いているが、電波や光波を用いてもよいし、他の帯域の電磁波を用いてもよい。その場合、マイクロホンに代えて、受信アンテナや受光素子等を用いることができる。要は、同種の波を信号に変換可能な複数の変換部であればよい。言い換えると、M個の変換部において変換される波が同じ種類の波であればよい。なお、変換部のことを、波を受信できるという意味から受信部と呼んでもよい。また、波源(音源)から伝わる波を入力とするという意味で波源入力部と呼んでもよい。
高SNゾーン形成器190は、壁や床、天井、鉄板、剛球(剛体(例えば鉄などの金属製や樹脂製)でできた球)により実現してもよい。要は、所定の方向の波に対して高SNゾーンを形成するものであればどのようなものであってもよい。ただし、残響時間が長くなりすぎないように、高SNゾーン付近における音波の反射回数が1〜2回程度であることが望ましい。そのため、高SNゾーン形成器190は必ずしもパラボラ形状である必要はないが、前述の通り、窪みもつ凹型(例えば碗状)であり、反射した音が集中するような形状が望ましい。さらに、残響時間が長くなりすぎないように、凹型の縁(端部)が内側に向いていない(外側を向いている)ことが望ましい。例えば、高SNゾーン形成器190が球の一部からなる場合は、半球以下とする。
例えば、波として、電波を用いる場合、高SNゾーン形成器190は、所定の方向の電波に対して高SNゾーンを形成すればよい。電波の波長で扱う波長幅は0.01〜1mである(参考文献3参照)。
[参考文献3]「周波数帯ごとの主な用途と電波の特徴」、[online]、総務省、[平成26年2月28日検索]、インターネット<http://www.tele.soumu.go.jp/j/adm/freq/search/myuse/summary/>
ただし、電波の場合、特定の波長を利用することが多いため、その特定の波長に合わせて、扱う波長幅の中で最大の波長幅の半波長程度以上であることが望ましい。高SNゾーン形成器190の材質は、電波を反射しやすいものが望ましい。そこで、固くて面積のある剛体を高SNゾーン形成器190として用いればよい。また、例えば、鉄筋やビル等により高SNゾーン形成器190を実現してもよい。
本実施形態では、パラボラ形状の剛体を高SNゾーン形成器190としているが、高SNゾーン形成器190は、音波を反射可能なものでなくともよい。要は、高SNゾーンを形成し、高SNゾーン付近に、高SNゾーン形成器が存在する場合に、高SNゾーン形成器が存在しない場合に比べて、SN比の高まるエリアを形成しさえすればよい。よって、反射以外の方法で、高SNゾーンを形成してもよい。例えば、音のフレネルレンズ(参考文献4参照)等を高SNゾーン形成器190として用いてもよい。
[参考文献4]「音のフレネルレンズ」、[online]、名古屋市科学館、[平成26年2月28日検索]、インターネット<http://www.ncsm.city.nagoya.jp/cgi-bin/visit/exhibition_guide/exhibit.cgi?id=S406&key=%E3%81%B5&keyword=%E3%83%95%E3%83%AC%E3%83%8D%E3%83%AB%E3%83%AC%E3%83%B3%E3%82%BA>
この場合、音のフレネルレンズの焦点が高SNゾーンに相当し、焦点付近が高SNゾーン付近に相当し、音のフレネルレンズが配置される面が、高SNゾーンを形成するための高SNゾーン形成面に相当する。なお、音のフレネルレンズの場合、音波で扱う波長幅が広いので、装置規模が大きくなりがちである。なお、波として、電磁波を用いる場合には、それぞれ波長に対応するレンズを用いればよい。例えば、波として光波を用いる場合には通常のレンズを、波として電波を用いる場合には電波レンズを用いればよい。
なお、レンズを用いた場合の「高SNゾーン付近」とは、所定の方向に対して垂直な方向において、「高SNゾーン付近」の範囲とは、レンズの内側を意味する。また、高SNゾーン形成面Jから高SNゾーンFまでの距離をJFとすると、高SNゾーン形成面Jから所定方向に2JFまでが、所定の方向における「高SNゾーン付近」の範囲である(図12参照)。
ただし、この場合も、波を反射可能な凹型の高SNゾーン形成器を用いた場合と同様に、「高SNゾーン付近」とは、厳密に定義できるわけではなく、高SNゾーン形成器190がない場合に比べ、ある場合に、SN比が高くなる範囲を意味している。
本実施形態では、変換部の指向性について言及していないが、様々な指向性を持つ電気音響変換器を混ぜて使用することで、伝達特性間の相関を小さくし、無相関化を図ってもよい。例えば、変換部の指向性に限定はないが、変換部としてマイクロホンを用いる場合、無指向性、単一指向性、双指向性、ハイパーカーディオイドといった様々な指向性を持つマイクロホンを混ぜて使用する。仮に、同じ位置に指向性の異なる電気音響変換器を配置した場合、同じ制御点との間の伝達特性は異なるものとなる。例えば、同じ位置に無指向性のマイクロホンと単一指向性のマイクロホンとを配置した場合、制御点と無指向性のマイクロホンとの間の伝達特性と、制御点と単一指向性のマイクロホンとの間の伝達特性とは、異なるものとなる。よって、この条件により、指向性の違いによる伝達特性の変化を利用して、さらに、伝達特性間の相関を小さくし、無相関化を図る。言い換えると、複数のマイクロホンのうちの少なくとも1つのマイクロホンの指向特性と、他の1つのマイクロホンの指向特性とが異なるものとすることで、無相関化を図る。
<第二実施形態>
第一実施形態と異なる部分を中心に説明する。
本実施形態では、信号を波に変換する変換技術に本発明を適用する例を説明する。信号を波に変換する変換技術の例として、以下の技術が挙げられる。(i)電気信号を音波に変換する技術や、(ii)電気信号を電磁波に変換する技術がある。ただし、これに限るものではなく、(iii)光信号を音波に変換する技術等であってもよい。(i)を実現するデバイスとしてはスピーカがある。(ii)を実現するデバイスとしては送信アンテナがある。また、(iii)を直接実現できるハードウェアがあればそれを用いてもよい。
特に、本実施形態では、波として音波を用い、複数の変換部として、複数のマイクロホンからなるマイクロホンアレイに代えて、電気信号を音波に変換する複数のスピーカ(スピーカアレイ)を用いる場合について説明する。
なお、本実施形態は、拡散センシングを基にして、伝達特性を物理的に変調する再生装置に係るものである。
[再生装置30の信号処理]
M(≧2)個のスピーカを用いて制御点Dで強調されるような指向制御を行うことを考える。
第二実施形態に係る再生装置30の機能構成および処理フローを図13と図14に示す。この第二実施形態の再生装置30は、M個のスピーカ311−m、周波数領域変換部300、フィルタリング部330、時間領域変換部340、フィルタ計算部320、伝達特性記憶部310、高SNゾーン形成器390を含む。m=1,2,…,Mであり、M≧2である。
信号源200が音源信号s(t)を出力する。この実施形態では、信号源200からの音源信号s(t)はディジタル信号であるとする。ただし、音源信号としてアナログ信号を用いる場合には、アナログ信号をディジタル信号s(t)へAD変換するAD変換部を設ければよい。
<周波数領域変換部300>
まず、周波数領域変換部300は、ディジタル信号s(t)を受け取り、Nサンプルをバッファに貯めてフレーム単位のディジタル信号s(τ)を出力する。次に、周波数領域変換部300は、各フレームのディジタル信号s(τ)を周波数領域の信号S(ω,τ)に変換して(s31)出力する。
<伝達特性記憶部310及びフィルタ計算部320>
伝達特性記憶部310及びフィルタ計算部320の機能構成は、第一実施形態と同様である。例えば、フィルタ計算部320は、伝達特性記憶部310から伝達特性A(ω)を取り出し、参考文献5記載の方法により、フィルタW(ω)を計算し、フィルタリング部330に出力する。例えば、特定の位置または方向への音響信号を抑圧する信号処理に用いるフィルタW(ω)を計算する。
[参考文献5]羽田陽一、片岡章俊、「自由空間伝達関数を用いた多点制御に基づく小型スピーカアレーの実空間性能」、日本音響学会研究発表会講演論文集、2008、pp.631-632
<フィルタリング部330>
フィルタリング部330は、予めフィルタ計算部320からフィルタW(ω)を受け取っておき、周波数領域信号S(ω,τ)を受け取り、フレームτごとに、各周波数ω∈Ωについて、周波数領域信号S(ω,τ)に、フィルタW(ω)を適用して(次式参照、s32)、出力信号Z(ω,τ)=[Z1(ω,τ),…,ZM(ω,τ)]を出力する。
Figure 2015198411
例えば、フィルタリング部330は、空間上の少なくとも複数の位置へ、M個のスピーカ311−mから発する音響信号の再生特性を異ならせるものであればよい。「再生特性を異ならせる」とは、例えば、特定の位置で音響信号を局所再生して他の位置で音響信号を極力再生しないようにしたり、逆に特定の位置で音響信号を再生しないようにして他の位置でのみ音響信号を再生したりすることを意味する。
<時間領域変換部340>
時間領域変換部340は、第τフレームの各周波数ω∈Ωの再生信号Z(ω,τ)=[Z1(ω,τ),…,ZM(ω,τ)]を時間領域に変換して(s33)、第τフレームのフレーム単位時間領域信号z(τ)=[z1(τ),…,zM(τ)]を得て、さらに、得られたフレーム単位時間領域信号z(τ)=[z1(τ),…,zM(τ)]をフレーム番号のインデックスの順番に連結して、時間領域信号z(t)=[z1(t),…,zM(t)]を出力する。周波数領域信号を時間領域信号に変換する方法は、s31の処理で用いた変換方法に対応する逆変換であり、例えば高速離散逆フーリエ変換である。
<スピーカ311−m及び高SNゾーン形成器390>
Mチャネルの時間領域信号z1(t),…,zM(t)はそれぞれ、スピーカアレイを構成するM個のスピーカ311のうち、チャネルに対応するスピーカで再生される(s34)。
高SNゾーン形成器390は、第一実施形態の高SNゾーン形成器190と同様の構成である。なお、高SNゾーン形成器390に対するM個のスピーカの位置関係は、第一実施形態の高SNゾーン形成器190及びM個のマイクロホン211−mを、高SNゾーン形成器390及びM個のスピーカ311−mにそれぞれ置き換えればよい。つまり、空間相関行列Rの行列式det(R)が最大化されるようにM個のスピーカを配置すればよい。SN比を高めるためにM個のスピーカを高SNゾーン(焦点)付近に配置する。また、チャネル間相関が低くなるように、M個のスピーカを異なる位置に配置する。言い換えるとM個のスピーカで電気信号に変換される音波の間の相関が低くなるように、M個のスピーカを配置すればよい。
<効果>
このような構成により、チャネル間相関を低減し、さらに、インパルス応答長及びフィルタ長を短くすることができ、様々な方向に音波を安定的に、同時に、高空間分解能で再生することが可能になる。例えば、事前に用意した伝達特性を使ってフィルタを使って適切な信号処理をすることで、広帯域に渡って任意の指向制御が可能になる。なお、本実施形態では、予めフィルタW(ω)を計算しているが、再生装置30の計算処理能力などに応じて、再生位置、マイクロホンの配置が定まってからフィルタ計算部350が周波数ごとのフィルタW(ω)を計算する構成としてもよい。
<変形例>
第一実施形態同様、波として、音波を用いているが、電波や光波を用いてもよいし、他の帯域の電磁波を用いてもよい。その場合、スピーカに代えて、送信アンテナや発光素子等を用いることができる。要は、信号を同種の波に変換可能な複数の変換部であればよい。なお、変換部のことを、波を送信できるという意味から送信部と呼んでもよい。なお、第一実施形態の変形例で説明した受信部と送信部とを合わせて送受信部と呼んでもよい。また、変換部は、波源となり、波を出力するという意味で波源出力部と呼んでもよい。なお、第一実施形態の変形例で説明した波源入力部と合わせて波源入出力部と呼んでもよい。
なお、マイクロホンをスピーカに置き換えることで、第一実施形態と同様の変形が可能である。
<第三実施形態>
第一実施形態と異なる部分を中心に説明する。
<第三実施形態のポイント>
第一実施形態と同様、本実施形態においても、非特許文献2及び3のズームアップマイクにおけるチャネル間相関を低減する考えを継承し、さらに、インパルス応答長を短くしつつ、受音時のSN比を高める。
第一実施形態では、1つの高SNゾーン形成器190に対して、M個のマイクロホン211−mを設ける構成としている。一方、本実施形態では、N個の高SNゾーン形成器190−nを含み、各高SNゾーン形成器190−nに対してMn個のマイクロホン211−mを設ける。なお、Nを2以上の整数、n=1,2,…,Nとし、Mnをnに対応する(nに応じて変化する)1以上の整数、mn=1,…,Mnとする。そして、(Σn=1 NMn)個のマイクロホン211−mの内の少なくとも1個のマイクロホン211−mをそのマイクロホン211−mに対応する高SNゾーン形成器190−nが形成する高SNゾーン以外の位置に配置することで、行列式det(R)の最大化を図る。
本実施形態では、受音時のSN比を高めるために、N個の高SNゾーン形成器を用いてそれぞれ高SNゾーンを形成し、各高SNゾーン付近に複数のマイクロホンを配置する。このとき、チャネル間相関を低減するために、少なくとも1個のマイクロホン211−mをそのマイクロホン211−mに対応する第n高SNゾーン形成器190−nが形成する高SNゾーン以外の位置に配置する。
[必須条件]
(1)それぞれ高SNゾーンを形成するN個の高SNゾーン形成器を含むこと
N個の高SNゾーン形成器190−nを含む。各高SNゾーン形成器190−nは第一実施形態の高SNゾーン形成器190と同様の構成である。
(2)各高SNゾーン形成器190−nが形成する高SNゾーン付近FEに配置されるMn個のマイクロホンを含むこと。さらに、(Σn=1 NMn)個のマイクロホン211−mの内の少なくとも1個のマイクロホン211−mをそのマイクロホン211−mに対応する高SNゾーン形成器190−nが形成する高SNゾーン以外の位置に配置すること。なお、各高SNゾーン形成器190−nに対して少なくとも1つのマイクロホン211−mを配置させるため、マイクロホン211−mの必要最低数はN個である。
(3)フィルタリング部を含むこと
n=1 NMn)個のマイクロホンに対し、それぞれ独立なフィルタ処理できるようなフィルタリング部160を有していること。入力の信号数が異なるだけで、処理内容は、第一実施形態のフィルタリング部160と同様である。
<第三実施形態の概要>
本実施形態では、第一実施形態において説明した高SNゾーン付近における性質を利用し、各高SNゾーン形成器190−nが形成する高SNゾーン付近FEにMn個のマイクロホンを配置し、SN比を高める。
また、(Σn=1 NMn)個のマイクロホン211−mの内の少なくとも1個のマイクロホン211−mをそのマイクロホン211−mに対応する高SNゾーン形成器190−nが形成する高SNゾーン以外の位置に配置することで、チャネル間相関を低減する。
特に、高SNゾーン形成器190−nに対するマイクロホン211−mn_Aの位置関係と、高SNゾーン形成器190−nに対するマイクロホン211−mn_Bの位置関係とが異なるように、配置することで、チャネル間相関をより低減することができる。ただし、N個の高SNゾーン形成器190−nに対するマイクロホン211−mの全ての位置関係が同じであっても、図15のように高SNゾーンF以外の位置にマイクロホン211−mが配置されていればよい。パラボラ形状等からなる高SNゾーン形成器190−nは、高SNゾーンに音波が集まるような形状をしているため、高SNゾーン以外の位置にマイクロホン211−mを配置すれば、非特許文献1のように全てのマイクロホンを高SNゾーンに配置した場合に比べ、マイクロホン211−mn_Aで収音する音波とマイクロホン211−mn_Bで収音する音波との間の相関が低くなるため、このような構成であっても、行列式det(R)の最大化を図ることができる。
<第三実施形態に係る収音装置50>
[収音装置50の信号処理]
第三実施形態に係る収音装置50の機能構成を図16に示す。なお、処理フローは第一実施形態に係る収音装置10と同様である。この第三実施形態の収音装置50は、AD変換部120、周波数領域変換部130、フィルタリング部160、時間領域変換部170、フィルタ計算部150、伝達特性記憶部140、N個の高SNゾーン形成器190−n、(Σn=1 NMn)個のマイクロホン211−mを含む。
なお、AD変換部120、周波数領域変換部130、フィルタリング部160、時間領域変換部170、フィルタ計算部150、伝達特性記憶部140の構成は第一実施形態と同様である。
ただし、M個のマイクロホン211−mではなく、(Σn=1 NMn)個のマイクロホン211−mで収音し、で収音された(Σn=1 NMn)個のアナログ信号、または、そのアナログ信号に対応する値を用いて各処理を行う。
<高SNゾーン形成器190−n及びマイクロホン211−m
N個の高SNゾーン形成器190−nは、第一実施形態の高SNゾーン形成器190と同様の構成である。
n=1 NMn)個のマイクロホン211−mは、第一実施形態のマイクロホン211−mと同様の構成である。
1つの高SNゾーン形成器190−nに対して、Mn個のマイクロホン211−mが設けられる。
<高SNゾーン形成器190−nに対するマイクロホン211−mの位置>
空間相関行列Rの行列式det(R)が最大化されるように、(Σn=1 NMn)個のマイクロホン211−mを配置すればよい。前述したように、(Σn=1 NMn)個のマイクロホン211−mの内の少なくとも1個のマイクロホン211−mをそのマイクロホン211−mに対応する高SNゾーン形成器190−nが形成する高SNゾーン(例えば、焦点)以外の位置に配置することで、チャネル間相関を低減し、行列式det(R)の最大化を図る。特に、高SNゾーン形成器190−nに対するマイクロホン211−mn_Aの位置関係と、高SNゾーン形成器190−nに対するマイクロホン211−mn=Bの位置関係とが異なるように、配置することで、チャネル間相関をより低減することができる。ただし、下付添え字n_A及びn_Bはそれぞれn及びnを表し、n及びnをそれぞれ1,2,…,Nの中の特定の値とし、n≠nとする。
別の言い方をすると、複数のマイクロホンで電気信号に変換される音波の間の相関が低くなるように、複数のマイクロホンを配置すればよい。全体として、相関が低くなるように、複数のマイクロホンを配置することが望ましいが、少なくとも、1つの相関が低くなるように、(Σn=1 NMn)個のマイクロホン211−mを配置すれば効果を得ることができる。別の言い方をすると、(Σn=1 NMn)個のマイクロホンの中の、何れか2つのマイクロホンで変換される音波間の相関の組合せは、PC2個考えられるが(ただしP=Σn=1 NMn)、その相関の組合せPC2個のうち、少なくとも1つの相関が低くなるように(Σn=1 NMn)個のマイクロホン211−mを配置すればよい。
図17及び図18は、それぞれ高SNゾーン形成器190−nに対するマイクロホン211−mの配置例を示す。
この実施形態では、マイクロホン211−mは、高SNゾーン形成器190−nに到来する波を遮りにくい形状の支持部191−nで支持されている。支持部191−nは第一実施形態の支持部191と同様の構成である。
図17では、支持部191−nは、高SNゾーン形成器190−nが形成する高SNゾーン付近に位置する面を含む構造物であって、その面にはマイクロホン211−mを保持するための空孔が複数形成される。
図18では、支持部191−nは、高SNゾーン形成器190−nとマイクロホン211−mとを結合する棒状の構造物である。図18はN=3、M1=3,M2=3,M3=1の場合の例を示す。
何れの例においても、(Σn=1 NMn)個のマイクロホン211−mの内の少なくとも1個のマイクロホン211−mをそのマイクロホン211−mに対応する高SNゾーン形成器190−nが形成する高SNゾーン(例えば焦点)以外の位置に配置している。また、高SNゾーン形成器190−nに対するマイクロホン211−mn_Aの位置関係と、高SNゾーン形成器190−nに対するマイクロホン211−mn_Bの位置関係とが異なるように配置されている。このような構成により、位置関係が異なるため、マイクロホン211−mn_Aで収音する音波とマイクロホン211−mn_Bで収音する音波との間の相関が低くなる。なお、前述の通り、マイクロホン211−mは、対応する高SNゾーン形成器190−nの高SNゾーン付近に配置されるため、SN比は高くなる。よって、このような構成により、行列式det(R)の最大化が図られる。
<効果>
このような構成により、第一実施形態と同様の効果を得ることができる。なお、本実施形態のポイントは、(Σn=1 NMn)個のマイクロホン211−mの内の少なくとも1個のマイクロホン211−mをそのマイクロホン211−mに対応する第n高SNゾーン形成器が形成する高SNゾーン以外の位置に配置することであり、さらには、高SNゾーン形成器190−nに対するマイクロホン211−mn_Aの位置関係と、高SNゾーン形成器190−nに対するマイクロホン211−mn_Bの位置関係とが異なるように、マイクロホン211−mn_Aとマイクロホン211−mn_Bとが配置されていることであり、このポイントを含めば、第一実施形態や第二実施形態と組み合わせてもよい。例えば、図17や図18は、第一実施形態との組合せであり、例えば、図18では、高SNゾーン形成器190−1及び190−2がそれぞれ形成する高SNゾーンの付近の異なる位置に、それぞれマイクロホン211−1〜211−3、マイクロホン211−1〜211−3を配置している。さらに、マイクロホン211−1〜211−3、マイクロホン211−1〜211−3、マイクロホン211−1は、それぞれ対応する高SNゾーン形成器190−1、190−2及び190−3が形成する高SNゾーン以外の位置に配置されている。また、高SNゾーン形成器190−1に対するマイクロホン211−1〜211−3の位置関係と、高SNゾーン形成器190−2に対するマイクロホン211−1〜211−3の位置関係と、高SNゾーン形成器190−3に対するマイクロホン211−1の位置関係とが異なるように配置されている。また第一実施形態や第二実施形態と同様の変形が適用できる。
<その他の変形例>
本発明は上記の実施形態及び変形例に限定されるものではない。例えば、上述の各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。その他、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。
<プログラム及び記録媒体>
また、上記の実施形態及び変形例で説明した各装置における各種の処理機能をコンピュータによって実現してもよい。その場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記各装置における各種の処理機能がコンピュータ上で実現される。
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。
また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD−ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させてもよい。
このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶部に格納する。そして、処理の実行時、このコンピュータは、自己の記憶部に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実施形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよい。さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。なお、プログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの(コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等)を含むものとする。
また、コンピュータ上で所定のプログラムを実行させることにより、各装置を構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。

Claims (12)

  1. 高SNゾーンを形成する高SNゾーン形成器と、
    Mを2以上の整数、m=1,2,…,Mとし、前記高SNゾーン付近の、それぞれ異なる位置に配置された、波を信号に、または、信号を波に変換可能なM個の第m変換部とを含み、
    M個の第m変換部において変換される波、または、変換された波は、全て同種の波である、
    変換装置。
  2. 請求項1の変換装置であって、
    前記M個の第m変換部において変換される波、または、変換された波の間での相関が低くなるように、前記M個の第m変換部が配置されている、
    変換装置。
  3. 請求項1または2の変換装置であって、
    前記高SNゾーン形成器は、前記高SNゾーンを形成するための高SNゾーン形成面を有する、
    変換装置。
  4. 請求項3の変換装置であって、
    前記高SNゾーン形成面は、
    前記M個の第m変換部で変換される、または、変換された波を反射可能である、
    変換装置。
  5. 請求項4の変換装置であって、
    前記同種の波は、音波であり、前記信号は電気信号である、
    変換装置。
  6. 請求項4の変換装置であって、
    前記同種の波は、電波であり、前記信号は電気信号である、
    変換装置。
  7. 請求項3から請求項6の何れかの変換装置であって、
    前記M個の第m変換部は、
    前記高SNゾーン形成面と類似形状の面の付近に配置されている、
    変換装置。
  8. 請求項1から請求項7の何れかの変換装置であって、
    前記M個の第m変換部は、
    前記高SNゾーン形成器に到来する波を遮りにくい形状の支持部で支持されている、
    変換装置。
  9. 請求項8の変換装置であって、
    M'はM以上の整数とし、前記支持部は、
    前記高SNゾーン形成器が形成する高SNゾーン付近に位置する面を含む構造物であって、当該面には前記M個の第m変換部をそれぞれ保持するためのM'個の空孔が形成される、
    変換装置。
  10. 請求項8の変換装置であって、
    前記支持部は、
    前記高SNゾーン形成器と前記M個の第m変換部とを結合する棒状の構造物である、
    変換装置。
  11. 請求項1から請求項10の何れかの変換装置であって、
    前記高SNゾーン形成器は、パラボラ形状である、
    変換装置。
  12. 請求項1から請求項12の何れかの変換装置であって、
    前記M個の第m変換部のうちの少なくとも1つの第m'変換手段の指向特性と、他の1つの第m”変換手段の指向特性とが異なる、
    変換装置。
JP2014076661A 2014-04-03 2014-04-03 変換装置 Active JP6063890B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014076661A JP6063890B2 (ja) 2014-04-03 2014-04-03 変換装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014076661A JP6063890B2 (ja) 2014-04-03 2014-04-03 変換装置

Publications (2)

Publication Number Publication Date
JP2015198411A true JP2015198411A (ja) 2015-11-09
JP6063890B2 JP6063890B2 (ja) 2017-01-18

Family

ID=54547857

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014076661A Active JP6063890B2 (ja) 2014-04-03 2014-04-03 変換装置

Country Status (1)

Country Link
JP (1) JP6063890B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020058085A (ja) * 2020-01-20 2020-04-09 日本電信電話株式会社 収音装置
JP2021078128A (ja) * 2020-01-20 2021-05-20 日本電信電話株式会社 収音装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0439799U (ja) * 1990-07-31 1992-04-03
JP2004032314A (ja) * 2002-06-25 2004-01-29 Fuji Xerox Co Ltd マイクロホンアレイ
JP2005227512A (ja) * 2004-02-12 2005-08-25 Yamaha Motor Co Ltd 音信号処理方法及びその装置、音声認識装置並びにプログラム
JP2009200704A (ja) * 2008-02-20 2009-09-03 Mitsubishi Electric Corp アレーアンテナの励振方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0439799U (ja) * 1990-07-31 1992-04-03
JP2004032314A (ja) * 2002-06-25 2004-01-29 Fuji Xerox Co Ltd マイクロホンアレイ
JP2005227512A (ja) * 2004-02-12 2005-08-25 Yamaha Motor Co Ltd 音信号処理方法及びその装置、音声認識装置並びにプログラム
JP2009200704A (ja) * 2008-02-20 2009-09-03 Mitsubishi Electric Corp アレーアンテナの励振方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020058085A (ja) * 2020-01-20 2020-04-09 日本電信電話株式会社 収音装置
JP2021078128A (ja) * 2020-01-20 2021-05-20 日本電信電話株式会社 収音装置

Also Published As

Publication number Publication date
JP6063890B2 (ja) 2017-01-18

Similar Documents

Publication Publication Date Title
Cao et al. Acoustic vector sensor: reviews and future perspectives
RU2559520C2 (ru) Устройство и способ для пространственно избирательного получения звука с помощью акустической триангуляции
JP5486694B2 (ja) 音声強調方法、装置、プログラム、記録媒体
JP6329296B2 (ja) 収音装置
Bush et al. Broadband implementation of coprime linear microphone arrays for direction of arrival estimation
JP6117142B2 (ja) 変換装置
Melon et al. Evaluation of a method for the measurement of subwoofers in usual rooms
Boone et al. Design of a highly directional endfire loudspeaker array
US20100329480A1 (en) Highly directive endfire loudspeaker array
JP6063890B2 (ja) 変換装置
Frank et al. Constant-beamwidth kronecker product beamforming with nonuniform planar arrays
JP6691494B2 (ja) 収音装置、及び収音方法
JP5337189B2 (ja) フィルタ設計における反射物の配置決定方法、装置、プログラム
JP5815489B2 (ja) 音源別音声強調装置、方法、プログラム
Peled et al. Objective performance analysis of spherical microphone arrays for speech enhancement in rooms
Li et al. Beamforming based on null-steering with small spacing linear microphone arrays
JP6031364B2 (ja) 収音装置及び再生装置
JP2013135373A (ja) ズームマイク装置
JP6294805B2 (ja) 収音装置
JP5948259B2 (ja) 収音装置及び再生装置
Hur et al. Techniques for synthetic reconfiguration of microphone arrays
Kwan et al. Speech separation algorithms for multiple speaker environments
JP6821836B2 (ja) 収音装置
JP6981559B2 (ja) 収音装置
Zhou et al. Design of a wideband linear microphone array for high-quality audio recording

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160218

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160223

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160419

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160927

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20161114

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20161213

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20161219

R150 Certificate of patent or registration of utility model

Ref document number: 6063890

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150