JP6288808B2 - 収音装置及び再生装置 - Google Patents
収音装置及び再生装置 Download PDFInfo
- Publication number
- JP6288808B2 JP6288808B2 JP2013010805A JP2013010805A JP6288808B2 JP 6288808 B2 JP6288808 B2 JP 6288808B2 JP 2013010805 A JP2013010805 A JP 2013010805A JP 2013010805 A JP2013010805 A JP 2013010805A JP 6288808 B2 JP6288808 B2 JP 6288808B2
- Authority
- JP
- Japan
- Prior art keywords
- sound
- signal
- microphone
- diffusion
- transfer characteristic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000012546 transfer Methods 0.000 claims description 82
- 238000009792 diffusion process Methods 0.000 claims description 45
- 238000001914 filtration Methods 0.000 claims description 18
- 239000000463 material Substances 0.000 claims description 6
- 238000000034 method Methods 0.000 description 43
- 238000012545 processing Methods 0.000 description 19
- 238000004364 calculation method Methods 0.000 description 16
- 238000006243 chemical reaction Methods 0.000 description 15
- 238000010586 diagram Methods 0.000 description 14
- 238000005516 engineering process Methods 0.000 description 10
- 238000013461 design Methods 0.000 description 9
- 238000012986 modification Methods 0.000 description 8
- 230000004048 modification Effects 0.000 description 8
- 230000005540 biological transmission Effects 0.000 description 7
- 230000004044 response Effects 0.000 description 7
- 230000008859 change Effects 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 238000007476 Maximum Likelihood Methods 0.000 description 5
- 239000011159 matrix material Substances 0.000 description 5
- 230000001965 increasing effect Effects 0.000 description 4
- 238000005259 measurement Methods 0.000 description 4
- 238000004088 simulation Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 230000005236 sound signal Effects 0.000 description 3
- 239000000284 extract Substances 0.000 description 2
- 238000009434 installation Methods 0.000 description 2
- 230000001172 regenerating effect Effects 0.000 description 2
- 239000008186 active pharmaceutical agent Substances 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000004080 punching Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 230000017105 transposition Effects 0.000 description 1
Images
Landscapes
- Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
- Circuit For Audible Band Transducer (AREA)
Description
[参考文献1]特開2012−147413号公報
しかし、この場合にも、反射構造体をスピーカアレーの近傍に設置することで疑似的な拡散音場を生成する必要があり、同様の課題がある。
本実施形態は、拡散センシングを基にして、伝達特性を物理的に変調する収音装置に係るものである。
M(≧2)本のマイクロホンを用いて一つのターゲット音とK(≧1)個の雑音を受音する状況を考える。多くの雑音が存在する中で任意の位置にあるターゲット音を強調する指向制御を目的にする。目的は、K個の雑音源を抑圧し、ターゲット音を強調することで達成される。m(m=1,2,…,M)番目のマイクロホンとターゲット音、k(k=1,2,…,K)番目の雑音との間のインパルス応答をそれぞれam(i)、bk,m(i)とする。ただし、インパルス応答長をLとし、i=0,1,…,L-1とする。なお、インパルス応答長Lは、装置の規模や構造、設置された部屋の状況によって定まる残響時間により、実験的に定めればよい。ターゲット音、k番目の雑音の音源信号をそれぞれs(t)、nk(t)とするとき、m番目のマイクロホンで観測した観測信号xm(t)は、次式でモデル化される。
ビームフォーミング後の出力信号y(t)は、次式のように観測信号xm(t)と、ターゲット音を強調するように設計されたフィルタwm(t)とを畳み込むことで得られる。
[参考文献2]浅野太,「音のアレイ信号処理-音源の低位・追跡と分離」,コロナ社,2011年
遅延和法において、フィルタW→ DSは、次式により、ターゲット音の直接音を強調するように設計される。
非特許文献1では、広帯域に渡ってパワーpN(ω)を小さくするために、伝達特性の性質がどういう性質であるべきかが検討され、拡散センシングという基礎理論が纏められている。
しかし、従来技術では、前述の通り、装置規模が大きくなる傾向がある。
(1)反射構造体を含むこと
音を反射・回折する素材で形成されており、開口部を有する電気音響変換器111を包囲するような形状(言い換えると三次元空間を形成する形状)の反射構造体190があること。なお、この明細書において「電気音響変換器」とは、マイクホロンとスピーカとを含む概念である。音響装置を、収音装置として機能させる場合には電気音響変換器はマイクロホンからなり、再生装置として機能させる場合には電気音響変換器はスピーカからなる。
反射構造体190の壁面や内側に2つ以上の電気音響変換器111を有し、それぞれ独立なフィルタ処理できるようなフィルタリング部160を有していること。
反射構造体190の壁面や内側に、制御点Aと電気音響変換器111との間の反射経路数が多くなるような拡散構造体180が一つ以上設置されていること。なお、音響装置を収音装置として機能させる場合、制御点はターゲット音の存在する方向若しくは位置または雑音の存在する方向若しくは位置として想定されるものであり、音響装置を再生装置として機能させる場合、制御点は再生音の音圧を上げたい方向若しくは位置(再生制御点)、または、音圧を下げたい方向若しくは位置(抑圧制御点)である。反射構造体190だけで決まる反射経路(破線)も存在するが、拡散構造体180を設置することにより、反射経路(一点鎖線)が増える。従って、拡散構造体180は、拡散構造体180を有さない場合の伝達特性を変調するものである。反射経路が増えることによって、収音装置の容積が限定された状況でも、音場の拡散性が高まるので、伝達特性間の相関が小さくなることが期待できる。なお、拡散構造体180の形状や配置位置には限定はなく、凹凸の曲面を持ってもよい。ただし、図2のように、反射構造体190の開口部を塞ぐような板を拡散構造体180としてしまった場合、制御点Aと電気音響変換器111と間の反射経路を減らしてしまうので、拡散構造体180の形状や配置として適さない。よって、拡散構造体180は、収音装置に入射された音、または、再生装置に含まれるスピーカから発せられた音の反射回数が、拡散構造体180を有さない場合よりも多くなるように配置されている。
さらに、伝達特性を無相関化させるために以下のような条件を組合せる方式が考えられる。
様々な指向性を持つ電気音響変換器を混ぜて使用することで、伝達特性間の相関を小さくし、無相関化を図る。例えば、電気音響変換器の指向性に限定はないが、無指向性、単一指向性、双指向性、ハイパーカーディオイドといった様々な指向性を持つ電気音響変換器を混ぜて使用する。仮に、同じ位置に指向性の異なる電気音響変換器を配置した場合、同じ制御点との間の伝達特性は異なるものとなる。例えば、同じ位置に無指向性のマイクロホンまたは単一指向性のマイクロホンを配置した場合、制御点Aと無指向性のマイクロホンとの間の伝達特性と、制御点Aと単一指向性のマイクロホンとの間の伝達特性とは、異なるものとなる。よって、この条件により、指向性の違いによる伝達特性の変化を利用して、さらに、伝達特性間の相関を小さくし、無相関化を図る。
反射構造体190の外側、内側に、それぞれ一つ以上の電気音響変換器112、111が設置されていること。
音響装置を収音装置として機能させる場合、以下の条件を加えてもよい。電気音響変換器(マイクロホン)111や(例えば板状の)拡散構造体180の向きまたは配置を変更するような可動制御手段200を含む(図5A及び図5B参照)。なお、電気音響変換器111及び拡散構造体180の少なくとも一つの向きまたは配置を、同時に、または、別々に変更するような可動制御手段200を含む構成であってもよい。
図6は収音装置10の斜視図、図7はその正面図、図8はその側面図を示す。図9は図7のIX-IX断面を示す概念図、図10は図7のX-X断面を示す概念図を示す。
第一実施形態に係る収音装置10の機能構成および処理フローを図11と図12に示す。この第一実施形態の収音装置10は、M個のマイクロホン211−m、AD変換部120、周波数領域変換部130、フィルタリング部160、時間領域変換部170、フィルタ計算部150、伝達特性記憶部140を含む。m=1,2,…,Mであり、M≧2である。
M個のマイクロホン211−mを用いて収音し(s1)、アナログ信号(収音信号)をAD変換部120に出力する。M個のマイクロホン212−mは反射構造体190の内側に設置されている。
AD変換部120が、M個のマイクロホン212−mで収音されたM個のアナログ信号をディジタル信号x→(t)=[x1(t),…,xM(t)]Tへ変換し、(s2)、周波数領域変換部に出力する。tは離散時間のインデックスを表す。
周波数領域変換部130は、まず、AD変換部120が出力したディジタル信号x→(t)=[x1(t),…,xM(t)]Tを入力とし、チャネルごとにNサンプルをバッファに貯めてフレーム単位のディジタル信号x→(τ)=[x→ 1(τ),…,x→ M(τ)]Tを生成する。τはフレーム番号のインデックスである。x→ m(τ)=[xm((τ-1)N+1),…,xm(τN)](1≦m≦M)である。Nはサンプリング周波数にもよるが、48kHzサンプリングの場合には2048点あたりが妥当である。次に、周波数領域変換部130は、各フレームのディジタル信号x→(τ)を周波数領域の信号X→(ω,τ)=[X1(ω,τ),…,XM(ω,τ)]Tに変換し(s3)、出力する。ωは離散周波数のインデックスである。時間領域信号を周波数領域信号に変換する方法の一つに高速離散フーリエ変換があるが、これに限定されず、周波数領域信号に変換する他の方法を用いてもよい。周波数領域信号X→(ω,τ)は、各周波数ω、フレームτごとに出力される。
伝達特性記憶部140は、予め収音装置10を使って測定された伝達特性A→(ω)=[a→(ω),b→ 1(ω),…,b→ K(ω)]を記憶しておく。a→(ω)=[a1(ω),…,aM(ω)]Tを、ターゲット音とM本のマイクロホンとの間の周波数ωでの伝達特性、換言すれば、a→(ω)=[a1(ω),…,aM(ω)]Tは、マイクロホンアレーに含まれる各マイクロホンへのターゲット音の周波数ωでの伝達特性とする。k=1,2,…,Kであり、Kは雑音の個数であり、bk →(ω)=[bk1(ω),…,bkM(ω)]Tを、雑音kとM本のマイクロホンとの間の周波数ωでの伝達特性、換言すれば、bk →(ω)=[bk1(ω),…,bkM(ω)]Tは、マイクロホンアレーに含まれる各マイクロホンへの雑音kの周波数ωでの伝達特性とする。なお、伝達特性A→(ω)は、事前測定によらず、理論式やシミュレーションにより事前に用意してもよい。
フィルタ計算部150は、伝達特性記憶部140から伝達特性A→(ω)を取り出し、フィルタW→(ω)を計算し、フィルタリング部160に出力する。例えば、特定の位置または方向からの音響信号を抑圧する信号処理に用いるフィルタW→(ω)を計算する。
[参考文献3]国際公開第WO2012/086834号パンフレット
例えば、遅延和法をベースとする場合、式(16)により、フィルタW→ DS1(ω)を計算する。
フィルタリング部160は、予めフィルタ計算部150からフィルタW→(ω)を受け取っておき、周波数領域信号X→(ω,τ)を受け取り、フレームτごとに、各周波数ω∈Ωについて、周波数領域信号X→(ω,τ)=[X1(ω,τ),…,XM(ω,τ)]Tに、フィルタW→(ω)を適用して(式(5)参照、s4)、出力信号Y(ω,τ)を出力する。
時間領域変換部170は、第τフレームの各周波数ω∈Ωの出力信号Y(ω,τ)を時間領域に変換して(s5)、第τフレームのフレーム単位時間領域信号y(τ)を得て、さらに、得られたフレーム単位時間領域信号y(τ)をフレーム番号のインデックスの順番に連結して時間領域信号y(t)を出力する。周波数領域信号を時間領域信号に変換する方法は、s3の処理で用いた変換方法に対応する逆変換であり、例えば高速離散逆フーリエ変換である。
このような構成により、所定の指向性能に対する装置規模を従来技術よりも小さくできる。そのとき、ターゲット音と雑音を聞き分けるための手掛かりが観測信号に含まれることになるので、例えば、事前に用意した伝達特性を使ってフィルタを使って適切な信号処理をすることで、広帯域に渡って任意の指向制御が可能になる。なお、本実施形態では、予めフィルタW→(ω)を計算しているが、収音装置10の計算処理能力などに応じて、所定の指向性能が定まってからフィルタ計算部150が周波数ごとのフィルタW→(ω)を計算する構成としてもよい。
主に第一実施形態と異なる部分について説明する。図13は変形例に係る収音装置10の斜視図、図14はその正面図、図15はその側面図を示す。図16は図14のXVI-XVI断面を示す概念図、図17は図14のXVII-XVII断面を示す概念図を示す。
本発明は、スピーカを用いた再生装置として扱ってもよい。
M(≧2)個のスピーカを用いて制御点Dで強調されるような指向制御を行うことを考える。
まず、周波数領域変換部300は、ディジタル信号s(t)を受け取り、Nサンプルをバッファに貯めてフレーム単位のディジタル信号s(τ)を出力する。次に、周波数領域変換部300は、各フレームのディジタル信号s(τ)を周波数領域の信号S(ω,τ)に変換して(s31)出力する。
伝達特性記憶部310及びフィルタ計算部320の機能構成は、第一実施形態と同様である。例えば、フィルタ計算部320は、伝達特性記憶部310から伝達特性A→(ω)を取り出し、参考文献4記載の方法により、フィルタW→(ω)を計算し、フィルタリング部330に出力する。例えば、特定の位置または方向への音響信号を抑圧する信号処理に用いるフィルタW→(ω)を計算する。
[参考文献4]羽田陽一、片岡章俊、「自由空間伝達関数を用いた多点制御に基づく小型スピーカアレーの実空間性能」、日本音響学会研究発表会講演論文集、2008、pp.631-632
フィルタリング部330は、予めフィルタ計算部320からフィルタW→(ω)を受け取っておき、周波数領域信号S(ω,τ)を受け取り、フレームτごとに、各周波数ω∈Ωについて、周波数領域信号S(ω,τ)に、フィルタW→(ω)を適用して(次式参照、s32)、出力信号Z→(ω,τ)=[Z1(ω,τ),…,ZM(ω,τ)]を出力する。
時間領域変換部340は、第τフレームの各周波数ω∈Ωの再生信号Z→(ω,τ)=[Z1(ω,τ),…,ZM(ω,τ)]を時間領域に変換して(s33)、第τフレームのフレーム単位時間領域信号z→(τ)=[z1(τ),…,zM(τ)]を得て、さらに、得られたフレーム単位時間領域信号z→(τ)=[z1(τ),…,zM(τ)]をフレーム番号のインデックスの順番に連結して、時間領域信号z→(t)=[z1(t),…,zM(t)]を出力する。周波数領域信号を時間領域信号に変換する方法は、s31の処理で用いた変換方法に対応する逆変換であり、例えば高速離散逆フーリエ変換である。
Mチャネルの時間領域信号z1(t),…,zM(t)はそれぞれ、スピーカアレーを構成するM個のスピーカ311−mのうち、チャネルに対応するスピーカで再生される(s34)。M個のスピーカ311−mは反射構造体190の内側に設置されている。またQ(≧1)個の拡散構造体180が反射構造体190の内側に設置されている。
このような構成により、所定の指向性能に対する装置規模を従来技術よりも小さくできる。なお、本実施形態では、予めフィルタW→(ω)を計算しているが、再生装置30の計算処理能力などに応じて、所定の指向性能が定まってからフィルタ計算部320が周波数ごとのフィルタW→(ω)を計算する構成としてもよい。
本発明は上記の実施形態及び変形例に限定されるものではない。例えば、上述の各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。その他、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。
上述した収音装置及び再生装置は、コンピュータにより機能させることもできる。この場合、コンピュータを目的とする装置(各種実施形態で図に示した機能構成を持つ装置)として機能させるためのプログラム、またはコンピュータにその処理手順(各実施形態で示したもの)の各過程を実行させるためのプログラムを、そのコンピュータに実行させればよい。なお、そのプログラムは、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等のコンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータにプログラムを実行させる際には、そのプログラムを記録媒体から読み込んでもよいし、または、そのプログラムを記録したサーバ等から通信回線を介してダウンロードしてもよい。
Claims (1)
- 複数個のマイクロホンと、
音を反射可能な素材により作成され、開口部を有し、開口部以外は前記複数個のマイクロホンが配置された三次元空間を形成する構造の反射構造体と、
音を反射可能な素材により作成され、前記三次元空間に少なくとも1つ配置されている拡散構造体とを含み、
広帯域にわたって任意の指向制御を行うためマイクロホン間の伝達特性の相関が小さくなることを利用したフィルタリングを行うために前記複数個のマイクロホンと、前記反射構造体と、前記拡散構造体とを含み、
前記拡散構造体は、前記反射構造体の開口部から入射された音を前記マイクロホンに導く構造、かつ、前記入射された音の反射回数が前記拡散構造体を有さない場合よりも多くなる構造であることを特徴とする
収音装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013010805A JP6288808B2 (ja) | 2013-01-24 | 2013-01-24 | 収音装置及び再生装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013010805A JP6288808B2 (ja) | 2013-01-24 | 2013-01-24 | 収音装置及び再生装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014143571A JP2014143571A (ja) | 2014-08-07 |
JP6288808B2 true JP6288808B2 (ja) | 2018-03-07 |
Family
ID=51424543
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013010805A Expired - Fee Related JP6288808B2 (ja) | 2013-01-24 | 2013-01-24 | 収音装置及び再生装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6288808B2 (ja) |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS59149494A (ja) * | 1983-02-16 | 1984-08-27 | Matsushita Electric Ind Co Ltd | マイクロホン装置 |
JP3205625B2 (ja) * | 1993-01-07 | 2001-09-04 | パイオニア株式会社 | スピーカ装置 |
JP2002135879A (ja) * | 2000-10-27 | 2002-05-10 | Masayuki Takizawa | 集音方法 |
JP2006060330A (ja) * | 2004-08-17 | 2006-03-02 | Toa Corp | ステレオ再生装置 |
JP4806638B2 (ja) * | 2005-01-13 | 2011-11-02 | 富士通株式会社 | 受音装置 |
-
2013
- 2013-01-24 JP JP2013010805A patent/JP6288808B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2014143571A (ja) | 2014-08-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100856246B1 (ko) | 실제 잡음 환경의 특성을 반영한 빔포밍 장치 및 방법 | |
JP6329296B2 (ja) | 収音装置 | |
US9820036B1 (en) | Speech processing of reflected sound | |
US8098844B2 (en) | Dual-microphone spatial noise suppression | |
US10334390B2 (en) | Method and system for acoustic source enhancement using acoustic sensor array | |
JP4376902B2 (ja) | 音声入力システム | |
EP2777298A1 (en) | Method and apparatus for processing signals of a spherical microphone array on a rigid sphere used for generating an ambisonics representation of the sound field | |
Sakamoto et al. | Sound-space recording and binaural presentation system based on a 252-channel microphone array | |
Bush et al. | Broadband implementation of coprime linear microphone arrays for direction of arrival estimation | |
US11830471B1 (en) | Surface augmented ray-based acoustic modeling | |
WO2007059255A1 (en) | Dual-microphone spatial noise suppression | |
JP6117142B2 (ja) | 変換装置 | |
JP6031364B2 (ja) | 収音装置及び再生装置 | |
JP5635024B2 (ja) | 音響信号強調装置、遠近判定装置、それらの方法、及びプログラム | |
JP5948259B2 (ja) | 収音装置及び再生装置 | |
JP6288808B2 (ja) | 収音装置及び再生装置 | |
JP4116600B2 (ja) | 収音方法、収音装置、収音プログラム、およびこれを記録した記録媒体 | |
JP6691494B2 (ja) | 収音装置、及び収音方法 | |
JP6063890B2 (ja) | 変換装置 | |
Kowalczyk | Raking early reflection signals for late reverberation and noise reduction | |
Firoozabadi et al. | Combination of nested microphone array and subband processing for multiple simultaneous speaker localization | |
JP2013135373A (ja) | ズームマイク装置 | |
JP2020058085A (ja) | 収音装置 | |
Tonelli | Blind reverberation cancellation techniques | |
Kowalczyk | Multichannel Wiener filter with early reflection raking for automatic speech recognition in presence of reverberation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150217 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20160212 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160405 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20160603 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160704 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20161220 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170217 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20170808 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20171031 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20171109 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180202 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180205 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6288808 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |