JP5948259B2 - 収音装置及び再生装置 - Google Patents

収音装置及び再生装置 Download PDF

Info

Publication number
JP5948259B2
JP5948259B2 JP2013010804A JP2013010804A JP5948259B2 JP 5948259 B2 JP5948259 B2 JP 5948259B2 JP 2013010804 A JP2013010804 A JP 2013010804A JP 2013010804 A JP2013010804 A JP 2013010804A JP 5948259 B2 JP5948259 B2 JP 5948259B2
Authority
JP
Japan
Prior art keywords
sound
microphone
signal
directivity
sound collection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2013010804A
Other languages
English (en)
Other versions
JP2014143570A (ja
Inventor
健太 丹羽
健太 丹羽
翔一 小山
翔一 小山
小林 和則
和則 小林
仲 大室
仲 大室
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2013010804A priority Critical patent/JP5948259B2/ja
Publication of JP2014143570A publication Critical patent/JP2014143570A/ja
Application granted granted Critical
Publication of JP5948259B2 publication Critical patent/JP5948259B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Circuit For Audible Band Transducer (AREA)

Description

本発明は、複数のマイクロホンやスピーカで構成されたアレー装置を用いたビームフォーミング技術に関する。特に、マイクロホンと音源との間の伝達特性、スピーカと再生点との間の伝達特性の最適な性質を明らかにした拡散センシングに基づくビームフォーミング技術に関する。
非特許文献1及び2が、マイクロホンアレーを用いた拡散センシングに基づく音声強調技術の従来技術として知られている。非特許文献1及び2では、反射構造体により擬似的な拡散音場を生成し、その中にマイクロホンアレーを設置して、拡散センシングを実現している。
K. Niwa, S. Sakauchi, K. Furuya, M. Okamoto, and Y. Haneda, "Diffused sensing for sharp directivity microphone array", ICASSP 2012, 2012, pp. 225 - 228 K. Niwa, Y. Hioka, K. Furuya, and Y. Haneda, "Telescopic microphone array using reflector for segregating target source from noises in same direction", ICASSP 2012, 2012, pp. 5457-5460
しかしながら、従来技術において、反射構造体をマイクロホンアレーの近傍に設置することで疑似的な拡散音場を生成するためには、装置規模が大きくなる傾向がある。何故ならば、反射構造体の容積と残響時間の相関性は高くて、残響時間が長くなるほど、拡散音場に近づくためである。例えば、非特許文献2では、直径1メートルの球に収まる程度の大きさの反射構造体を構築している。ところが、適用するアプリケーションによって、装置規模はあらかじめ限定されることが多い。容積が限定されてしまうと、伝達特性の相関性が高くなり、指向性能が劣化してしまうことが課題である。
同様にスピーカアレーを用いた拡散センシングに基づく再生技術が考えられる(参考文献1参照)。
[参考文献1]特開2012−147413号公報
しかし、この場合にも、反射構造体をスピーカアレーの近傍に設置することで疑似的な拡散音場を生成する必要があり、同様の課題がある。
本発明は、所定の指向性能に対する装置規模が従来技術よりも小さい音響装置を提供することを目的とする。つまり、従来技術の音響装置と同じ装置規模であれば、より指向性能の高い音響装置を、従来技術の音響装置と同じ指向性能であれば、より装置規模の小さい音響装置を提供することを目的とする。なお、この明細書では、音響装置とは、音を収音する収音装置と音を再生する再生装置とを含み、「音」は、人の発する声に限定されるものではなく、人や動物の声はもとより楽音や環境雑音など音一般を指す。
上記の課題を解決するために、本発明の他の態様によれば、収音装置は、複数個のマイクロホンを含む。マイクロホンのうちの少なくとも1つである第一マイクロホンの指向特性と、マイクロホンのうちの第一マイクロホン以外の少なくとも1つである第二マイクロホンの指向特性と、が異なり、収音装置は、指向特性の違いによる伝達特性の変調を利用した信号処理を行うフィルタリング部を更に有する。
上記の課題を解決するために、本発明の他の態様によれば、再生装置は、複数個のスピーカを含む。スピーカのうちの少なくとも1つである第一スピーカの指向特性と、スピーカのうちの第一スピーカ以外の少なくとも1つである第二スピーカの指向特性と、が異なり、再生装置は、指向特性の違いによる伝達特性の変調を利用した信号処理を行うフィルタリング部を更に有する。
本発明によれば、所定の指向性能に対する装置規模を従来技術よりも小さくできるという効果を奏する。
本発明の音響装置の条件を説明するための図。 反射構造体の形状を説明するための図。 制御点と電気音響変換器との間の伝達特性に含まれる反射音数を増大させるような拡散構造体の設置例を示す図。 反射構造体の開口部を塞ぐような拡散構造体の設置例を示す図。 図5Aは拡散構造体が凹状の面を有する立体構造物である場合の例を示す図、図5Bは拡散構造体が凸状の面を有する立体構造物である場合の例を示す図。 図6Aは電気音響変換器の配置を移動させるような可動制御手段を説明するための図、図6Bは拡散構造体の配置を移動させるような可動制御手段を説明するための図。 第一実施形態に係る収音装置の機能構成を示す図。 第一実施形態に係る収音装置の処理フローを示す図。 第二実施形態に係る再生装置の機能構成を示す図。 第二実施形態に係る再生装置の処理フローを示す図。
以下、本発明の実施形態について説明する。なお、以下の説明に用いる図面では、同じ機能を持つ構成部や同じ処理を行うステップには同一の符号を記し、重複説明を省略する。以下の説明において、テキスト中で使用する記号「」等は、本来直前の文字の真上に記載されるべきものであるが、テキスト記法の制限により、当該文字の直後に記載する。式中においてはこれらの記号は本来の位置に記述している。また、ベクトルや行列の各要素単位で行われる処理は、特に断りが無い限り、そのベクトルやその行列の全ての要素に対して適用されるものとする。
<第一実施形態>
本実施形態は、拡散センシングを基にして、伝達特性を物理的に変調する収音装置に係るものである。
まず、非特許文献1で説明されているこれまでの拡散センシングに基づく収音処理について説明する。
[観測信号のモデル化]
M(≧2)本のマイクロホンを用いて一つのターゲット音とK(≧1)個の雑音を受音する状況を考える。多くの雑音が存在する中で任意の位置にあるターゲット音を強調する指向制御を目的にする。目的は、K個の雑音源を抑圧し、ターゲット音を強調することで達成される。m(m=1,2,…,M)番目のマイクロホンとターゲット音、k(k=1,2,…,K)番目の雑音との間のインパルス応答をそれぞれam(i)、bk,m(i)とする。ただし、インパルス応答長をLとし、i=0,1,…,L-1とする。なお、インパルス応答長Lは、装置の規模や構造、設置された部屋の状況によって定まる残響時間により、実験的に定めればよい。ターゲット音、k番目の雑音の音源信号をそれぞれs(t)、nk(t)とするとき、m番目のマイクロホンで観測した観測信号xm(t)は、次式でモデル化される。
Figure 0005948259
ここで、tは時間のインデックスを表わす。
xm(t)を短時間フーリエ変換することで、式(1)の畳み込み混合は、次式のような周波数領域における瞬時混合として近似される。
Figure 0005948259
ここで、ω、τはそれぞれ周波数、フレームのインデックスを表わす。例えば、48kHzでサンプリングを行い、タップ数を2048とする。また、Xm(ω,τ)、S(ω,τ)、Nk(ω,τ)は、それぞれ観測信号xm(t)、ターゲット音の音源信号s(t)、k番目の雑音の音源信号nk(t)の時間周波数表現を表わす。am(ω)、bk,m(ω)は、それぞれターゲット音、k番目の雑音とm番目のマイクロホンとの間の周波数特性を表し、以後これらを伝達特性と呼ぶ。式(2)を行列形式で表記すると、次式のようになる。
Figure 0005948259
であり、Tは転置を表わす。
[ビームフォーミング]
ビームフォーミング後の出力信号y(t)は、次式のように観測信号xm(t)と、ターゲット音を強調するように設計されたフィルタwm(t)とを畳み込むことで得られる。
Figure 0005948259
ここで、Jはフィルタ長を表わし、インパルス応答長Lと同程度とすればよい。y(t)の時間周波数表現であるY(ω,τ)は、次式で近似的に求められる。
Figure 0005948259
ここで、Hは共役転置を表し、W m(ω)の複素共役がwm(j)の周波数応答に対応する。
Figure 0005948259
出力信号Y(ω,τ)に含まれる雑音成分をYN(ω,τ)と書くとき、次式のパワーpN(ω)は雑音成分のパワーとして定義される。
Figure 0005948259
ここで、ETは時間的な期待値演算を表わす。音源信号が互いに無相関であると仮定すると、パワーpN(ω)は伝達特性b k(ω)とフィルタW(ω)だけで計算できる。
Figure 0005948259
アレー信号処理の分野では、pN(ω)を最小化するために、様々なフィルタ設計法が説明されてきた。代表例として、遅延和法と最尤法を説明する(参考文献2参照)。
[参考文献2]浅野太,「音のアレイ信号処理-音源の低位・追跡と分離」,コロナ社,2011年
遅延和法において、フィルタW DSは、次式により、ターゲット音の直接音を強調するように設計される。
Figure 0005948259
は、ターゲット音の直接音のアレイ・マニフォールド・ベクトルを表わす。要素hm(ω)は、ターゲット音からm番目のマイクロホンまでの直接音の経路の伝達係数を表し、ターゲット音とm番目のマイクロホン間の距離をdm、音速をc、虚数単位をjとすると、例えば次式により計算できる。
Figure 0005948259
また、最尤法において、フィルタW MLは、次式により、ターゲット音の直接音を強調し、パワーpN(ω)を最小化するように設計される。
Figure 0005948259
ここで、R(ω)は雑音の空間相関行列を表わす。例えば、音源信号間が無相関であると仮定すると、雑音の空間相関行列R(ω)は次式のように、伝達特性b k(ω)のみを用いて計算される。
Figure 0005948259
参考文献2に載っているような古典的なアレー信号処理において、マイクロホン間の間隔をどのようにアレンジするのかといったことが考えられてきた。しかし、特定の周波数を除いてマイクロホン間の相関が高くなることが多かった。代表的な問題として知られているのは以下の二つである。一つ目は波長の長い低周波帯域では、伝達特性間の相関が高くなりやすいので、狭指向制御しづらいことである。二つ目は波長の短い高周波帯域では、波長の半波長以下の間隔でマイクロホンを並べない限り、特定のターゲット音以外の音を強調してしまう空間エリアジングが生じることである。以上の2点から、広帯域に渡ってパワーpN(ω)を小さくすることは困難とされてきた。
[拡散センシング]
非特許文献1では、広帯域に渡ってパワーpN(ω)を小さくするために、伝達特性の性質がどういう性質であるべきかが検討され、拡散センシングという基礎理論が纏められている。
拡散センシングのコンセプトは、“伝達特性の物理的変調”により、次式のように広帯域に渡って伝達特性を無相関化させることにある。
Figure 0005948259
ここで、伝達特性の物理的変調とは、伝達特性の性質そのものを変えるためのあらゆる物理的手段のことを指し、例えばマイクロホンの近傍に設置された反射構造体が挙げられる。非特許文献1で提案されている方式は、多数回反射を繰り返し、等方位的に反射音が到来する音場(拡散音場)を生成し、その中にマイクロホンアレーを設置する方式である。例えば、マイクロホンアレーを包囲するような形状の反射構造体を作り、一面だけ開けておけば、反射構造体内に到来した音が自ずと反射を繰り返し、疑似的な拡散音場を生成することになる。
何故、拡散音場にマイクロホンアレーを設置すると、伝達特性間が無相関化されるのかを簡単に説明する。伝達特性間の相関をγ(ω)とすると、拡散音場における相関γ(ω)は次式により計算されることが知られている。
Figure 0005948259
ここで、ES,pはそれぞれ空間的な期待値演算、マイクロホン間の位置ベクトルを表わす。マイクロホン間の距離||p||が十分に広いとすると、拡散音場における伝達特性間の相関γ(ω)の期待値は0になる。
Figure 0005948259
だから、従来技術において反射構造体により疑似的な拡散音場を物理的に生成し、その中にマイクロホンアレーを設置してきた(非特許文献1、2参照)。
また、パワーpN(ω)を小さくするために、事前のシミュレーションや測定により用意した伝達特性を用いたフィルタ設計方式を検討してきた。簡単に言えば、ターゲット音のみを強調するようにしてきたが、拡散センシングに基づく制御では、伝達特性そのものを強調するように設計される。
遅延和法をベースとする場合、次式のように、アレイ・マニフォールド・ベクトルh(ω)をターゲット音の伝達特性a(ω)に置き換えることで、フィルタW DS1(ω)を設計できる。
Figure 0005948259
この場合、a(ω)をシミュレーションや実測により事前に用意する必要がある。
また、最尤法をベースとする場合、次式によりフィルタW DS2(ω)を設計できる。
Figure 0005948259
この場合も同様に、a(ω)やR(ω)をシミュレーションや実測により事前に用意する必要がある。先に挙げたような手段を用いて、疑似的な拡散音場を生成し、音を収音する場合、伝達特性が自ずと無相関化されていることが期待されるので、パワーpN(ω)を広帯域に渡って小さくすることができた。
<第一実施形態のポイント>
しかし、従来技術では、前述の通り、装置規模が大きくなる傾向がある。
電気音響変換器には、指向性が備わっている。これは、電気音響変換器の構造によって決まるもので、代表的なものとして無指向性、単一指向性、双指向性、ハイパーカーディオイドなどがある。なお、この明細書において「電気音響変換器」とは、マイクホロンとスピーカとを含む概念である。音響装置を、収音装置として機能させる場合には電気音響変換器はマイクロホンからなり、再生装置として機能させる場合には電気音響変換器はスピーカからなる。通常の音響アレー装置では、同じ指向性を持つ複数の電気音響変換器でアレーを構成する。なお、この明細書では、音響アレー装置とは、マイクロホンアレーを用いて音を収音する収音装置とスピーカアレーを用いて音を再生する再生装置とを含む。本実施形態では、広帯域に渡って伝達特性を無相関化させるために、“伝達特性の物理的変調”として、あえて指向性が異なる電気音響変換器を組合せることにより、反射構造体という実装がなかったとしても、伝達特性の相関を小さくできる。
本実施形態の技術は、拡散センシングを基にして、伝達特性を物理的に変調するための再生装置についても適用することができるため、図1を用いて本発明で定義する音響装置の条件を説明する。
[必須条件]
(1)指向性の異なる2以上の電気音響変換器を含むこと
図1を用いて説明する。2つ以上の電気音響変換器を有する。電気音響変換器が持つ指向性は、少なくとも2種類以上が含まれている。図1の場合、電気音響変換機111が持つ指向性と電気音響変換機112が持つ指向性とが異なる。様々な指向性を持つ電気音響変換器を混ぜて使用することで、伝達特性間の相関を小さくし、無相関化を図る。例えば、電気音響変換器の指向性に限定はないが、無指向性、単一指向性、双指向性、ハイパーカーディオイドといった様々な指向性を持つマイクロホンを混ぜて使用する。仮に、同じ位置に指向性の異なる電気音響変換器を配置した場合、同じ制御点との間の伝達特性は異なるものとなる。例えば、同じ位置に無指向性のマイクロホンと単一指向性のマイクロホンとを配置した場合、制御点と無指向性のマイクロホンとの間の伝達特性と、制御点と単一指向性のマイクロホンとの間の伝達特性とは、異なるものとなる。よって、この条件により、指向性の違いによる伝達特性の変化を利用して、さらに、伝達特性間の相関を小さくし、無相関化を図る。
(2)フィルタリング部を含むこと
2つ以上の電気音響変換器に対し、それぞれ独立なフィルタ処理できるようなフィルタリング部160を有していること。さらに、フィルタリング部160は、指向特性の違いによる伝達特性の変調を利用した信号処理を行う。
[必須ではないがあるとよい条件]
さらに、伝達特性を無相関化させるために以下のような条件を組合せる方式が考えられる。
(3)反射構造体を含むこと
音を反射・回折する素材で形成されており、開口部を有する電気音響変換器111及び112を包囲するような形状(言い換えると三次元空間を形成する形状)の反射構造体190があること(図2参照)。なお、本実施形態では指向性が異なる電気音響変換器を組合せることにより、伝達特性の相関を小さくできるため、従来技術の反射構造体よりも小さい反射構造体を用いても従来と同様の指向性能を得ることができる。
(4)拡散構造体の設置
電気音響変換器111や電気音響変換器112の近傍に、制御点Aと電気音響変換器111や電気音響変換器112との間の反射経路数が多くなるような拡散構造体180が一つ以上設置されていること(図3参照)。制御点Aと電気音響変換器111との間の反射経路を図3に示す。拡散構造体180を設置することにより、反射経路(一点鎖線)が増える。従って、拡散構造体180は、拡散構造体180を有さない場合の伝達特性を変調するものである。反射経路が増えることによって、収音装置の容積が限定された状況でも、音場の拡散性が高まるので、伝達特性間の相関が小さくなることが期待できる。なお、拡散構造体180の形状や配置位置には限定はなく、凹凸の曲面を持ってもよい。ただし、図4のように、制御点Aと電気音響変換器112との間に板状の拡散構造体180を設ける場合、制御点Aと電気音響変換器112と間の経路を減らしてしまうので、拡散構造体180の形状や配置として適さない。よって、拡散構造体180は、収音装置に入射された音、または、再生装置に含まれるスピーカから発せられた音の反射回数が、拡散構造体180を有さない場合よりも多くなるように配置されている。
図5は、(3)及び(4)の条件を満たし(反射構造体190及び拡散構造体180を含む)、拡散構造体180が、曲面を有する立体構造物である場合の形状例を示す断面図である。この例では、反射構造体190の開口部と有する面と対向する内壁面に、開口部方向に突出した拡散構造体180を備え、図5Aでは断面凹状の面を有し、図5Bでは断面凸状の面を有する。なお、音響装置を収音装置として機能させる場合、反射構造体190の開口部から入射された音を収音装置の内部のマイクロホンに導く構造であることが望ましい。例えば、図5Bの場合、拡散構造体180の先端で音を収音装置の外部に反射してしまうため、図5Aのほうがより望ましい形状と考えられる。また、音響装置を再生装置として機能させる場合、再生装置に含まれるスピーカから発せられた音を外部に導く構造であることが望ましい。
(5)電気音響変換器または拡散構造体の向きまたは配置を変更
音響装置を収音装置として機能させる場合、以下の条件を加えてもよい。電気音響変換器(マイクロホン)111と112の少なくとも一方の向きまたは配置を変更するような可動制御手段200を含む(図6A参照)。また、上述の条件(4)(拡散構造体180を設置すること)と組合せる場合には、(例えば板状の)拡散構造体180の向きまたは配置を変更するような可動制御手段200を含む構成であってもよい(図6B参照)。なお、上述の条件(4)と組合せる場合には、電気音響変換器111、112及び拡散構造体180の少なくとも一つの向きまたは配置を、同時に、または、別々に変更するような可動制御手段200を含む構成であってもよい。
例えば、可動制御手段200はモータ等からなり、制御量Cに応じて、回転し、回転軸に対して垂直に設置された円板を回転させ、円板上に設置された電気音響変換器112の配置を変更する。また、回転軸に設置された拡散構造体180を回転させ、向きを変更する。利用に先立ち、予め各制御量εにおける伝達特性A(ω,ε)=[a(ω,ε),b 1(ω,ε),…,b M(ω,ε),]を測定し、図示しない記憶部に記憶しておく。さらに、図示しないセンサー間相関計算部において、伝達特性A(ω,ε)と観測信号X(ω,τ)=[X1(ω,τ),…,XM(ω,τ)]とから、センサー間相関を計算し、次式により、制御量Cを求め、これを可動制御手段200に出力する。
Figure 0005948259
電気音響変換器111、112や拡散構造体180の向きや配置により、伝達特性は変化するので、伝達特性間の相関が小さくなるように電気音響変換器111、112や拡散構造体180の向きまたは配置を変更する。なお、複数の電気音響変換器111、112や複数の拡散構造体180を用いる場合には、一部を固定し、残りを可動制御手段200により変更する構成としてもよい。
<第一実施形態に係る収音装置10>
[収音装置10の信号処理]
第一実施形態に係る収音装置10の機能構成および処理フローを図7と図8に示す。この第一実施形態の収音装置10は、M個のマイクロホン211−m、AD変換部120、周波数領域変換部130、フィルタリング部160、時間領域変換部170、フィルタ計算部150、伝達特性記憶部140を含む。m=1,2,…,Mであり、M≧2である。
<マイクロホン211−m>
M個のマイクロホン211−mを用いて収音し(s1)、アナログ信号(収音信号)をAD変換部120に出力する。なお、マイクロホンの指向性は2種類以上で構成される。
<AD変換部120>
AD変換部120が、M個のマイクロホン211−mで収音されたM個のアナログ信号をディジタル信号x(t)=[x1(t),…,xM(t)]Tへ変換し、(s2)、周波数領域変換部に出力する。tは離散時間のインデックスを表す。
<周波数領域変換部130>
周波数領域変換部130は、まず、AD変換部120が出力したディジタル信号x(t)=[x1(t),…,xM(t)]Tを入力とし、チャネルごとにNサンプルをバッファに貯めてフレーム単位のディジタル信号x(τ)=[x 1(τ),…,x M(τ)]Tを生成する。τはフレーム番号のインデックスである。x m(τ)=[xm((τ-1)N+1),…,xm(τN)](1≦m≦M)である。Nはサンプリング周波数にもよるが、48kHzサンプリングの場合には2048点あたりが妥当である。次に、周波数領域変換部130は、各フレームのディジタル信号x(τ)を周波数領域の信号X(ω,τ)=[X1(ω,τ),…,XM(ω,τ)]Tに変換し(s3)、出力する。ωは離散周波数のインデックスである。時間領域信号を周波数領域信号に変換する方法の一つに高速離散フーリエ変換があるが、これに限定されず、周波数領域信号に変換する他の方法を用いてもよい。周波数領域信号X(ω,τ)は、各周波数ω、フレームτごとに出力される。
<伝達特性記憶部140>
伝達特性記憶部140は、予め収音装置10を使って測定された伝達特性A(ω)=[a(ω),b 1(ω),…,b K(ω)]を記憶しておく。a(ω)=[a1(ω),…,aM(ω)]Tを、ターゲット音とM本のマイクロホンとの間の周波数ωでの伝達特性、換言すれば、a(ω)=[a1(ω),…,aM(ω)]Tは、マイクロホンアレーに含まれる各マイクロホンへのターゲット音の周波数ωでの伝達特性とする。k=1,2,…,Kであり、Kは雑音の個数であり、bk (ω)=[bk1(ω),…,bkM(ω)]Tを、雑音kとM本のマイクロホンとの間の周波数ωでの伝達特性、換言すれば、bk (ω)=[bk1(ω),…,bkM(ω)]Tは、マイクロホンアレーに含まれる各マイクロホンへの雑音kの周波数ωでの伝達特性とする。なお、伝達特性A(ω)は、事前測定によらず、理論式やシミュレーションにより事前に用意してもよい。
<フィルタ計算部150>
フィルタ計算部150は、伝達特性記憶部140から伝達特性A(ω)を取り出し、フィルタW(ω)を計算し、フィルタリング部160に出力する。例えば、特定の位置または方向からの音響信号を抑圧する信号処理に用いるフィルタW(ω)を計算する。
本発明のビームフォーミング技術の要点は、複数の電気音響変換器の指向性を異なるものとすることにより、広帯域に渡って伝達特性を無相関化させることである。そのため、フィルタの設計コンセプト自体に影響を与えないので、従来技術と同様の方法により、フィルタW(ω)を設計することができる。例えば、参考文献3に記載されている<1>SN比最大化規準によるフィルタ設計法、<2>パワーインバージョン(Power Inversion)に基づくフィルタ設計法、<3>一つ以上の死角(雑音のゲインが抑圧される方向)を拘束条件に持つ最小分散無歪応答法によるフィルタ設計法、<4>遅延合成(Delay-and-Sum Beam Forming)法によるフィルタ設計法、<5>最尤法によるフィルタ設計法、<6>AMNOR(Adaptive Microphone-array for noise reduction)法等によって、フィルタW(ω)を設計することができる。
[参考文献3]国際公開第WO2012/086834号パンフレット
例えば、遅延和法をベースとする場合、式(16)により、フィルタW DS1(ω)を計算する。
Figure 0005948259
また例えば、最尤法をベースとする場合、式(17)により、フィルタW DS2(ω)を計算する。
Figure 0005948259
また例えば、一つ以上の死角を拘束条件に持つ最小分散無歪応答法によるフィルタ設計法の場合、次式により、フィルタW DS3(ω)を計算する。
Figure 0005948259
ただし、fS(ω),fk(ω)はそれぞれターゲット音、雑音k(k=1,2,…,K)に関する周波数ωでの通過特性を表す。例えば、式(18)において、伝達特性a(ω)が方向θに依存する伝達特性a(ω,θ)として事前に用意できる場合には、伝達特性a(ω,θ)を用いて、フィルタW(ω,θ)を計算し、フィルタリング部160において、特定の方向θsの信号処理が行える。また、伝達特性a(ω)が方向θ、距離Dに依存する伝達特性a(ω,θ,D)として事前に用意できる場合には、伝達特性a(ω,θ,D)を用いて、フィルタW(ω,θ,D)を計算し、フィルタリング部160において、特定の位置(特定の方向θsと距離DHにより特定される位置)の信号処理が行える。
<フィルタリング部160>
フィルタリング部160は、予めフィルタ計算部150からフィルタW(ω)を受け取っておき、周波数領域信号X(ω,τ)を受け取り、フレームτごとに、各周波数ω∈Ωについて、周波数領域信号X(ω,τ)=[X1(ω,τ),…,XM(ω,τ)]Tに、フィルタW(ω)を適用して(式(5)参照、s4)、出力信号Y(ω,τ)を出力する。
Figure 0005948259
例えば、フィルタリング部はM個の第一マイクロホン211−mによる収音信号とM個の第二マイクロホン212−mによる収音信号とに基づき、空間上の少なくとも複数の位置または方向から発せられた音響信号の収音特性を異ならせるものであればよい。「収音特性を異ならせる」とは、例えば、特定の位置で発せられた音響信号を局所収音して他の位置で発せられた音響信号を極力収音しないようにしたり、逆に特定の位置で発せられた音響信号を抑圧(消音)して他の位置で発せられた音響信号のみを収音したりすることを意味する。
<時間領域変換部170>
時間領域変換部170は、第τフレームの各周波数ω∈Ωの出力信号Y(ω,τ)を時間領域に変換して(s5)、第τフレームのフレーム単位時間領域信号y(τ)を得て、さらに、得られたフレーム単位時間領域信号y(τ)をフレーム番号のインデックスの順番に連結して時間領域信号y(t)を出力する。周波数領域信号を時間領域信号に変換する方法は、s3の処理で用いた変換方法に対応する逆変換であり、例えば高速離散逆フーリエ変換である。
<効果>
このような構成により、所定の指向性能に対する装置規模を従来技術よりも小さくできる。そのとき、ターゲット音と雑音を聞き分けるための手掛かりが観測信号に含まれることになるので、例えば、事前に用意した伝達特性を使ってフィルタを使って適切な信号処理をすることで、広帯域に渡って任意の指向制御が可能になる。なお、本実施形態では、予めフィルタW(ω)を計算しているが、収音装置10の計算処理能力などに応じて、所定の指向性能が定まってからフィルタ計算部150が周波数ごとのフィルタW(ω)を計算する構成としてもよい。
<第二実施形態>
本発明は、スピーカを用いた再生装置として扱ってもよい。
本実施形態は、拡散センシングを基にして、伝達特性を物理的に変調する収音装置に係るものである。複数のマイクロホンからなるマイクロホンアレーに代えて、複数のスピーカからなるスピーカアレーを用いる。
[再生装置30の信号処理]
M(≧2)個のスピーカを用いて制御点Dで強調されるような指向制御を行うことを考える。
第二実施形態に係る再生装置30の機能構成および処理フローを図9と図10に示す。この第二実施形態の再生装置30は、M個のスピーカ311−m、周波数領域変換部300、フィルタリング部330、時間領域変換部340、フィルタ計算部320、伝達特性記憶部310を含む。m=1,2,…,Mであり、M≧2である。
信号源200が音源信号s(t)を出力する。この実施形態では、信号源200からの音源信号s(t)はディジタル信号であるとする。ただし、音源信号としてアナログ信号を用いる場合には、アナログ信号をディジタル信号s(t)へAD変換するAD変換部を設ければよい。
<周波数領域変換部300>
まず、周波数領域変換部300は、ディジタル信号s(t)を受け取り、Nサンプルをバッファに貯めてフレーム単位のディジタル信号s(τ)を出力する。次に、周波数領域変換部300は、各フレームのディジタル信号s(τ)を周波数領域の信号S(ω,τ)に変換して(s31)出力する。
<伝達特性記憶部310及びフィルタ計算部320>
伝達特性記憶部310及びフィルタ計算部320の機能構成は、第一実施形態と同様である。例えば、フィルタ計算部320は、伝達特性記憶部310から伝達特性A(ω)を取り出し、参考文献4記載の方法により、フィルタW(ω)を計算し、フィルタリング部330に出力する。例えば、特定の位置または方向への音響信号を抑圧する信号処理に用いるフィルタW(ω)を計算する。
[参考文献4]羽田陽一、片岡章俊、「自由空間伝達関数を用いた多点制御に基づく小型スピーカアレーの実空間性能」、日本音響学会研究発表会講演論文集、2008、pp.631-632
<フィルタリング部330>
フィルタリング部330は、予めフィルタ計算部320からフィルタW(ω)を受け取っておき、周波数領域信号S(ω,τ)を受け取り、フレームτごとに、各周波数ω∈Ωについて、周波数領域信号S(ω,τ)に、フィルタW(ω)を適用して(次式参照、s32)、出力信号Z(ω,τ)=[Z1(ω,τ),…,ZM(ω,τ)]を出力する。
Figure 0005948259
例えば、フィルタリング部330は、空間上の少なくとも複数の位置へ、M個のスピーカ311−mから発する音響信号の再生特性を異ならせるものであればよい。「再生特性を異ならせる」とは、例えば、特定の位置で音響信号を局所再生して他の位置で音響信号を極力再生しないようにしたり、逆に特定の位置で音響信号を再生しないようにして他の位置でのみ音響信号を再生したりすることを意味する。
<時間領域変換部340>
時間領域変換部340は、第τフレームの各周波数ω∈Ωの再生信号Z(ω,τ)=[Z1(ω,τ),…,ZM(ω,τ)]を時間領域に変換して(s33)、第τフレームのフレーム単位時間領域信号z(τ)=[z1(τ),…,zM(τ)]を得て、さらに、得られたフレーム単位時間領域信号z(τ)=[z1(τ),…,zM(τ)]をフレーム番号のインデックスの順番に連結して、時間領域信号z(t)=[z1(t),…,zM(t)]を出力する。周波数領域信号を時間領域信号に変換する方法は、s31の処理で用いた変換方法に対応する逆変換であり、例えば高速離散逆フーリエ変換である。
<スピーカ311−m>
Mチャネルの時間領域信号z1(t),…,zM(t)はそれぞれ、スピーカアレーを構成するM個のスピーカ311のうち、チャネルに対応するスピーカで再生される(s34)。M個のスピーカ311−mの指向性は2種類以上で構成される。
<効果>
このような構成により、所定の指向性能に対する装置規模を従来技術よりも小さくできる。なお、本実施形態では、予めフィルタW(ω)を計算しているが、再生装置30の計算処理能力などに応じて、所定の指向性能が定まってからフィルタ計算部320が周波数ごとのフィルタW(ω)を計算する構成としてもよい。
<その他の変形例>
本発明は上記の実施形態及び変形例に限定されるものではない。例えば、上述の各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。その他、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。
<プログラム及び記録媒体>
上述した収音装置及び再生装置は、コンピュータにより機能させることもできる。この場合、コンピュータを目的とする装置(各種実施形態で図に示した機能構成を持つ装置)として機能させるためのプログラム、またはコンピュータにその処理手順(各実施形態で示したもの)の各過程を実行させるためのプログラムを、そのコンピュータに実行させればよい。なお、そのプログラムは、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等のコンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータにプログラムを実行させる際には、そのプログラムを記録媒体から読み込んでもよいし、または、そのプログラムを記録したサーバ等から通信回線を介してダウンロードしてもよい。
本発明は、狭指向音声強調技術、音声スポット強調技術、狭指向音声再生技術、音声スポット再生技術に利用することができる。また、AGC(Auto Gain Control)技術やエリア収音及び再生技術に利用することもできる。

Claims (6)

  1. 複数個のマイクロホンを含む収音装置であって、
    前記マイクロホンのうちの少なくとも1つである第一マイクロホンの指向特性と、前記マイクロホンのうちの前記第一マイクロホン以外の少なくとも1つである第二マイクロホンの指向特性と、が異なり、
    前記指向特性の違いによる伝達特性の変調を利用した信号処理を行うフィルタリング部を更に有する、
    収音装置。
  2. 請求項記載の収音装置であって、
    前記フィルタリング部は、
    当該収音装置の外部に存在する第一の音源位置から発せられる音と、当該収音装置の外部に存在する第一の音源位置とは異なる第二の音源位置から発せられる音とに、異なる収音特性を与えて出力するものである、
    収音装置。
  3. 請求項1または請求項2に記載の収音装置であって、
    前記フィルタリング部は、
    前記第一マイクロホンによる収音信号と前記第二マイクロホンによる収音信号とに基づき、空間上の少なくとも複数の位置または方向から発せられた音響信号の収音特性を異ならせる、
    収音装置。
  4. 複数個のスピーカを含む再生装置であって、
    前記スピーカのうちの少なくとも1つである第一スピーカの指向特性と、前記スピーカのうちの前記第一スピーカ以外の少なくとも1つである第二スピーカの指向特性と、が異なり、
    前記指向特性の違いによる伝達特性の変調を利用した信号処理を行うフィルタリング部を更に有する、
    再生装置。
  5. 請求項記載の再生装置であって、
    前記フィルタリング部は、
    当該再生装置の外部に存在する第一の音源位置から発せられる音と、当該再生装置の外部に存在する第一の音源位置とは異なる第二の音源位置から発せられる音とに、異なる再生特性を与えて出力するものである、
    再生装置。
  6. 請求項4または請求項5に記載の再生装置であって、
    前記フィルタリング部は、
    空間上の少なくとも複数の位置へ、前記第一スピーカ及び前記第二スピーカから発する音響信号の再生特性を異ならせる、
    再生装置。
JP2013010804A 2013-01-24 2013-01-24 収音装置及び再生装置 Expired - Fee Related JP5948259B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013010804A JP5948259B2 (ja) 2013-01-24 2013-01-24 収音装置及び再生装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013010804A JP5948259B2 (ja) 2013-01-24 2013-01-24 収音装置及び再生装置

Publications (2)

Publication Number Publication Date
JP2014143570A JP2014143570A (ja) 2014-08-07
JP5948259B2 true JP5948259B2 (ja) 2016-07-06

Family

ID=51424542

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013010804A Expired - Fee Related JP5948259B2 (ja) 2013-01-24 2013-01-24 収音装置及び再生装置

Country Status (1)

Country Link
JP (1) JP5948259B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170056439A1 (en) * 2015-08-25 2017-03-02 Oxy Young Co., Ltd. Oxygen-enriched water composition, biocompatible composition comprising the same, and methods of preparing and using the same

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2973677B2 (ja) * 1992-01-27 1999-11-08 松下電器産業株式会社 反射型指向性スピーカ
JPH10224882A (ja) * 1997-02-05 1998-08-21 Nippon Hoso Kyokai <Nhk> ハイブリッド・パラボラ収音装置
US8488829B2 (en) * 2011-04-01 2013-07-16 Bose Corporartion Paired gradient and pressure microphones for rejecting wind and ambient noise

Also Published As

Publication number Publication date
JP2014143570A (ja) 2014-08-07

Similar Documents

Publication Publication Date Title
US10382849B2 (en) Spatial audio processing apparatus
KR100856246B1 (ko) 실제 잡음 환경의 특성을 반영한 빔포밍 장치 및 방법
US8098844B2 (en) Dual-microphone spatial noise suppression
JP6329296B2 (ja) 収音装置
CN106537501B (zh) 混响估计器
BR112015014380B1 (pt) Filtro e método para filtragem espacial informada utilizando múltiplas estimativas da direção de chegada instantânea
Sakamoto et al. Sound-space recording and binaural presentation system based on a 252-channel microphone array
WO2007059255A1 (en) Dual-microphone spatial noise suppression
JP6117142B2 (ja) 変換装置
JP6031364B2 (ja) 収音装置及び再生装置
JP5948259B2 (ja) 収音装置及び再生装置
JP4116600B2 (ja) 収音方法、収音装置、収音プログラム、およびこれを記録した記録媒体
Peled et al. Objective performance analysis of spherical microphone arrays for speech enhancement in rooms
JP6063890B2 (ja) 変換装置
Kowalczyk Raking early reflection signals for late reverberation and noise reduction
JP5635024B2 (ja) 音響信号強調装置、遠近判定装置、それらの方法、及びプログラム
JP6288808B2 (ja) 収音装置及び再生装置
US11830471B1 (en) Surface augmented ray-based acoustic modeling
Pertilä Acoustic source localization in a room environment and at moderate distances
Xiao et al. Spatially selective active noise control systems
JP2013135373A (ja) ズームマイク装置
Kajala A multi-microphone beamforming algorithm with adjustable filter characteristics
Bai et al. Kalman filter-based microphone array signal processing using the equivalent source model
Kowalczyk Multichannel Wiener filter with early reflection raking for automatic speech recognition in presence of reverberation
Tonelli Blind reverberation cancellation techniques

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150217

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150918

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20151104

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20151222

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160531

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160606

R150 Certificate of patent or registration of utility model

Ref document number: 5948259

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees