JP5143802B2 - 雑音除去装置、遠近判定装置と、各装置の方法と、装置プログラム - Google Patents

雑音除去装置、遠近判定装置と、各装置の方法と、装置プログラム Download PDF

Info

Publication number
JP5143802B2
JP5143802B2 JP2009201724A JP2009201724A JP5143802B2 JP 5143802 B2 JP5143802 B2 JP 5143802B2 JP 2009201724 A JP2009201724 A JP 2009201724A JP 2009201724 A JP2009201724 A JP 2009201724A JP 5143802 B2 JP5143802 B2 JP 5143802B2
Authority
JP
Japan
Prior art keywords
frequency domain
direct ratio
signal
direct
equivalent value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2009201724A
Other languages
English (en)
Other versions
JP2011055211A (ja
Inventor
裕輔 日岡
澄宇 阪内
賢一 古家
陽一 羽田
健太 丹羽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2009201724A priority Critical patent/JP5143802B2/ja
Publication of JP2011055211A publication Critical patent/JP2011055211A/ja
Application granted granted Critical
Publication of JP5143802B2 publication Critical patent/JP5143802B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
  • Circuit For Audible Band Transducer (AREA)

Description

この発明は、例えば、音声通話や、音声入力によって機器を操作するハンズフリー方式等に応用でき、マイクロホンから特定の距離範囲内に位置する音源の音だけを強調して収音する際に用いられる雑音除去装置、遠近判定装置、各装置の方法と各装置プログラムに関する。
図16に、非特許文献1に開示された従来の雑音除去装置160の機能構成を示してその動作を簡単に説明する。雑音除去装置160は、M個のマイクロホンm1〜mMと、複数の遅延部1611〜161Mと、重み乗算部1621〜162Mと、加算部163とを備える。雑音除去装置160は、M個のマイクロホンm1〜mMを用いて、座標(p,q)の点にある音源から発せられる音を信号、それ以外の点から発せられる音を雑音としたときに、信号だけを強調した高い信号対雑音比(SNR)で音声を収音する目的で利用される。
はじめに座標(pm,qm)に配置したマイクロホンで受音した受音信号xm(n)(m=1…M)に対し、遅延部1611〜161Mと重み乗算部1621〜162Mとが遅延Dmとゲインgmを付加することにより信号ym(n)を得る(式(1))。
Figure 0005143802
ここで、Dmは遅延量、gmはゲインであり、予め与えられた所望音源の位置(p,q)から、それぞれ式(2)と式(3)により導出される。
Figure 0005143802
ここで、rm,rcはそれぞれ式(4)と式(5)で定義されるマイク−音源間距離及び臨界距離であり、cは音速、VとTはそれぞれ室容積、屋内の残響時間である。
Figure 0005143802
加算部163は、信号ym(n)を加算して所望位置から発せられた音を強調した信号z(n)を求める(式(6))。
Figure 0005143802
以上のように雑音除去装置160は、所望位置から発せられた音を強調して雑音を除去する。この従来の方法でより高いSNRで音声を収音するためには、マイクロホンの数を増やすか、またはマイクロホンアレーを大型化する必要がある。
2個のマイクロホンアレーを用いることでマイクロホンアレーの大型化を回避した収音装置170が、特許文献1に開示されている。図17に収音装置170の機能構成を示してその動作を簡単に説明する。
収音装置170は、2個の小規模マイクロホンアレー3L,3R(以降、小規模は省略する)、6個の収音部4-1〜4-6、周波数変換部5、加算部6、音源信号成分推定部7、利得係数算出部8、乗算部9、逆周波数領域変換部10、を備える。
2個のマイクロホンアレー3Lと3Rは、収音対象である所望音源までの距離と同程度の間隔を空けて配置される。各収音部4-1〜4-6は、内部のフィルタによるディジタル信号処理により、マイクロホンアレー3L,3Rに指向特性を設定する。第1収音部4-1と第2収音部4-2は、所望音源位置を含む角度領域の音を収音する指向特性をマイクロホンアレー3Lと3Rにそれぞれ与える。第3収音部4-3と第4収音部4-4は、所望音源位置を含まない角度領域の音を収音する指向特性をマイクロホンアレー3Lと3Rにそれぞれ与える。第5収音部4-5は、マイクロホンアレー3Lと3Rのほぼ中間位置から所望音源の位置を含む角度領域の指向特性をマイクロホンアレー3Lと3Rに与える。第6収音部4-6は、マイクロホンアレー3Lと3Rのほぼ中間位置から所望音源の位置を含まない角度領域の指向特性をマイクロホンアレー3Lと3Rに与える。
このように収音装置170は、2個のマイクロホンアレーに指向特性を持たせることで、収音を希望する角度領域の区別を容易にする。その結果、マイクロホンアレーを小型化することができる。
野村博昭、金田豊、小島順治、"近接音場型マイクロホンアレー"日本音響学会誌、Vol.53,No.2,pp.110-116,1997.
特開2007−235358号(図2)
非特許文献1に開示された従来の雑音除去装置は、その装置から見て同じ方向で距離が異なる点に配置された音源から発せられる音の内、どれか一つを選択強調して収音するために大規模なマイクロホンアレーを必要とする問題点があった。これは、1個の小規模なマイクロホンアレーを用いた場合、従来技術では原理上、方向に関する識別能力しか持たず、同じ方向で位置が異なる複数の音源が発する音のうち、どれか一つだけを選択して収音することが不可能であるためである。そのため、距離識別の精度を向上させるためにマイクロホンアレーの大型化が必要であった。マイクロホンアレーの大型化は、雑音除去装置の設置や運搬の制約となる。
マイクロホンアレーの大型化を回避する目的の従来の収音装置170は、小規模ではあるが2個のマイクロホンアレーを必須の構成要素とするものである。よって、コストの増大や配線が煩雑化するといった問題点があった。
この発明は、このような問題点に鑑みてなされたものであり、1個のマイクロホンアレーであっても、音源との距離を識別し、特定の距離範囲にある音源からの音だけを強調若しくは抑圧することで雑音を除去する雑音除去装置と、音源との距離の遠近を判定する遠近判定装置と、それらの方法とプログラムを提供することを目的とする。
この発明の雑音除去装置は、複数のマイクロホンから成る1個のマイクロホンアレーと、複数の周波数領域変換部と、処理対象信号生成部と、直間比推定部と、対象信号調整部と、逆周波数領域変換部と、を備える。複数の周波数領域変換部は、複数のマイクロホンで受音された受音信号がそれぞれ入力され、それぞれの受音信号を周波数領域の信号に変換する。処理対象信号生成部は、複数の周波数領域変換部の出力する周波数領域の信号を合成して処理対象信号を生成する。直間比推定部は、複数の周波数領域変換部の出力する周波数領域の信号を入力として受音信号の直間比、若しくは当該値に相当する直間比相当値を推定する。対象信号調整部は、処理対象信号と、直間比又は直間比相当値を入力としてその値に応じて処理対象信号の振幅を調整した処理後信号を生成する。逆周波数領域変換部は、処理後信号を時間領域の信号に変換する。
また、この発明の遠近判定装置は、この発明の雑音除去装置と同様の1個のマイクロホンアレーと、複数の周波数領域変換部と、直間比推定部とを備え、対象信号調整部と逆周波数領域変換部とに代えて遠近判定部を備える。遠近判定部は、周波数平均手段と、蓄積手段と、判定手段とを具備する。周波数平均手段は、直間比又は直間比相当値を周波数方向に平均して周波数平均直間比相当値を出力する。蓄積手段は、周波数平均直間比相当値を過去所定フレーム分の時間蓄積して、比較対象直間比相当値を出力する。判定手段は、周波数平均直間比相当値と、比較対象直間比相当値とを比較して遠近判定結果を出力する。
この発明の雑音除去装置は、直間比、若しくは直間比相当値を推定して、その値に応じて受音信号をフィルタリングする。直間比(直間比相当値)とは、受信音に含まれる直接音と間接音(残響音)との比であり、マイクロホンと音源間との距離に応じて単調に変化する値である。この値に応じて受信音をフィルタリングすることで一定の距離範囲内にあると判定された音源の成分だけを強調又は抑圧して収音することができる。その結果、1個のマイクロホンアレーで、且つ、マイクロホンアレーと雑音除去装置本体間の配線を煩雑にすることも無く、特定の距離にある音源の音だけを収音(雑音を除去)することが可能になる。
また、この発明の遠近判定装置は、周波数平均直間比相当値を比較対象直間比相当値とを比較することで、逐次入力される周波数平均直間比相当値、つまり、発音時刻が異なる音の音源の距離の遠近を判別することができる。
この発明の雑音除去装置100を利用する場面の一例を示す図。 屋内での音の伝搬経路を示す図。 直間比とマイクロホン間距離との関係を示す図。 この発明の雑音除去装置400の機能構成例を示す図 雑音除去装置400の動作フローを示す図。 処理対象信号生成部43の機能構成例を示す図。 直間比推定部44の機能構成例を示す図。 この発明の雑音除去装置800の機能構成例を示す図。 直間比推定部84の機能構成例を示す図。 処理対象信号生成部83の機能構成例を示す図。 直間比推定部110の機能構成例を示す図。 この発明の遠近判定装置120の機能構成例を示す図。 効果確認実験の実験条件を示す図。 効果確認実験の結果を示す図であり、(a)は所望信号、(b)は入力信号、(c)は出力信号である。 直間比の一例を示す図。 非特許文献1に開示された雑音除去装置160の機能構成を示す図。 特許文献1に開示された収音装置170の機能構成を示す図。
以下、この発明の実施の形態を図面を参照して説明する。複数の図面中同一のものには同じ参照符号を付し、説明は繰り返さない。また、以下の説明において、テキスト中で使用する記号「 ̄」や「^」等は、本来直前の文字の真上に記載されるべきものであるが、テキスト記法の制限により、当該文字の直後に記載する。式中においてはこれらの記号は本来の位置に記述している。
実施例の説明の前にこの発明の考えについて説明する。
〔この発明の考え〕
この発明は、単一のマイクロホンアレーを用いて、マイクロホンアレーから特定の距離範囲にある音だけを強調若しくは抑圧して、所定の範囲内の音源の音を収音することを目的とするものである。または、受音信号の音源位置の遠近を判定するものである。
図1にこの発明の雑音除去装置100を利用する場面を例示する。小型マイクロホンアレー11を、例えば4人の発話者12〜14が取り囲んで会議をしている場面を想定する。その会議室内には、テレビ16、電話17、館内放送用のスピーカ18が配置されているものとする。このような場面において、館内放送の音声や、電話の音等を収音せずに、小型マイクロホンアレー11を中心として所定の距離範囲内(破線で示す円内)に位置する発話者12〜14の発話だけを収音したい。
この発明では、マイクロホンアレーから音源までの距離を見分けるために、受信音に含まれる直接音と間接音(残響音)との比(以降、直間比と称する)に着目する。図2に屋内にマイクロホンを置いて音を収録した際の、音源21からマイクロホン22までの音の伝搬経路を示す。直接音とは、音源21からマイクロホンまで直接到達する太い実線で示す音波である。一方の残響音とは、音源21から発した音が壁や床や天井などで反射してからマイクロホン22に到達する破線で示す音波である。
図3に直間比とマイクロホン間距離との関係を示す。図3の横軸はマイクロホンから音源までの距離、縦軸は直間比である。一般的に間接音はマイクロホンからの距離に依存しない一定の大きさを示す。その間接音に対して直接音は、マイクロホンからの距離の増加に伴って単調に減少する特性を示す。その直接音を間接音で除した直間比は、直接音と同様に距離の増加に伴って単調に減少する特性になる。
この発明の雑音除去装置と遠近判定装置は、受信音からこの直間比を推定し、受信音に含まれる音源のマイクロホンアレーからの距離を推定する。よって、直間比から、1個の小型マイクロホンアレー11を中心とした所定の距離範囲を推定することが可能である。
この発明の雑音除去装置は、その直間比に応じて処理対象信号の振幅を調整することで、所望の音源の音を収音することで雑音を除去する。また、遠近判定装置は、この直間比を用いて逐次入力される受音信号の音源の距離の遠近を判別する。
図4にこの発明の雑音除去装置400の機能構成例を示す。その動作フローを図5に示す。雑音除去装置400は、1個のマイクロホンアレー41と、複数の周波数領域変換部421〜42Mと、処理対象信号生成部43と、直間比推定部44と、対象信号調整部45と、逆周波数領域変換部46と、を具備する。マイクロホンアレー41を除く各機能構成部は、例えばROM、RAM、CPU等で構成されるコンピュータに所定のプログラムが読み込まれて、CPUがそのプログラムを実行することで実現されるものである。
マイクロホンアレー41は複数のマイクロホンm1,…mMから成る。複数の周波数領域変換部421,…,42Mは、複数のマイクロホンm1,…mMで受音された受音信号xm(n)がそれぞれ入力され、各受音信号を周波数領域の信号に変換する(ステップS42)。周波数領域変換部421,…,42Mは、受音信号xm(n)を、例えばサンプリング周波数16kHzでサンプリングしてディジタル信号に変換し、例えば256個のサンプルを1フレームとして、それぞれのフレームにおいて離散フーリエ変換を行い周波数成分Xm(ω,l)を出力する(ステップS42)。ωは周波数、lはフレーム番号である。なお、受音信号xm(n)をディジタル信号に変換するA/D変換器は省略している。
処理対象信号生成部43は、複数の周波数領域変換部421,…,42Mが出力する周波数領域の信号Xm(ω,l)を合成して処理対象信号Y(ω,l)を生成する(ステップS43)。
直間比推定部44は、複数の周波数領域変換部421,…,42mが出力する周波数領域の信号Xm(ω,l)を入力として受音信号の直間比ER(ω,l)、若しくはその直間比に相当する直間比相当値EF(ω,l)を推定する(ステップS44)。図4では、ER(ω,l)とEF(ω,l)の両者を意味するE(ω,l)と表記している。
対象信号調整部45は、処理対象信号Y(ω,l)と、直間比ER(ω,l)又は直間比相当値EF(ω,l)を入力としてその値に応じて処理対象信号Y(ω,l)の振幅を調整した処理後信号Z(ω,l)を生成する(ステップS45)。
逆周波数領域変換部46は、処理後信号Z(ω,l)を時間領域の信号z(n)に変換する(ステップS46)。ステップS41〜ステップS46までの動作は、全ての受音信号xm(n)が終了するまで継続される。
ここで、直間比ER(ω,l)又は直間比相当値EF(ω,l)の値に応じて調整とは、ER(ω,l)やEF(ω,l)の閾値処理や、その値が大きいほど処理後信号Z(ω,l)の振幅を大きくする処理や、その値が大きいほど処理後信号Z(ω,l)の振幅を小さくする等の処理を含む。詳しくは後述する。
以上の動作により、1個のマイクロホンアレーによって、例えば、特定の距離範囲にある音だけを強調し、その範囲外の音は抑圧して収音する雑音除去が行われる。以降、各部のより具体的な機能構成例を示して更に詳しくこの発明を説明する。
〔処理対象信号生成部〕
図6に処理対象信号生成部43のより具体的な機能構成例を示す。処理対象信号生成部43は、複数の重み乗算手段4311〜431Mと、加算手段432を備える。複数の重み乗算手段4311〜431Mは、M個のマイクロホンで受音した複数の受音信号xm(n)の、それぞれの周波数成分X1(ω,l),…,XM(ω,l)に重み係数wm(ω)を乗ずる。
重み乗算手段4311〜431Mで使用する重みには、例えばM個のマイクロホンが無指向性の場合にはwm=1/Mとすることで全ての周波数成分X1(ω,l),…,XM(ω,l)の平均を取ることで、処理対象信号Y(ω,l)を安定化させる。また、M個のマイクロホンが指向性を持つ場合には、w1=1,wm=0(m={2,…,M})とすることで、特定のマイクロホンの信号だけを使用することができる。例えば、参考文献「大賀、山崎、金田著、“音響システムとディジタル信号処理”電子情報通信学会発行」に記載されているような方法を利用して、重みビームフォーミングのフィルタ係数を使用すれば、マイクロホンアレーで任意の指向性を形成することもできる。
加算手段432は、重みが乗ぜられた全ての周波数成分X1(ω,l),…,XM(ω,l)を加算して処理対象信号Y(ω,l)を出力する。
〔直間比推定部〕
図7に直間比推定部44の機能構成例を示す。直間比推定部44は、空間相関行列算出手段441と、固有値展開手段442と、固有値分布算出手段443と、を備える。空間相関行列算出手段441は、複数の周波数領域変換手段421,…,42Mが出力する周波数領域の信号X1(ω,l),…,XM(ω,l)を入力として、周波数領域の信号X1(ω,l),…,XM(ω,l)をベクトル化し、その入力信号を用いて式(7)に示す空間相関行列R(ω,l)を算出する。
Figure 0005143802
ここでTは行列の転置、Hは共役転置を、Lは平均を求めるフレームの数を表す。
空間相関行列R(ω,l)は、固有値展開手段442に入力される。固有値展開手段442は、空間相関行列R(ω,l)を固有値展開して固有値λm(ω,l)と固有ベクトルvm(ω,l)に分解(式(9))し、固有値λm(ω,l)を固有値分布算出手段443に出力する(固定値展開ステップ)。
Figure 0005143802
ここでvH m(ω,l)は、固有ベクトルvm(ω,l)のエルミート転置である。また、固有値λm(ω,l)は、昇順(λ1(ω,l)<λ2(ω,l)<…<λM(ω,l))に並べられているものとする。
固有値分布算出手段443は、固有値λm(ω,l)の分布の割合を数値化して、直間比相当値EF(ω,l)を出力する(固有値分布算出ステップ)。この数値化は、例えば式(10)に示すように最大固有値λM(ω,l)の全体(固有値の総和)に対する割合や式(11)に示すエントロピー等が用いられる。
Figure 0005143802
〔対象信号調整部〕
対象信号調整部45は、例えば、フィルタ係数算出手段451と、乗算手段452とで構成できる(図4)。フィルタ係数算出部45は、直間比相当値E(ω,l)を入力としてフィルタ係数G(ω,l)を算出して出力する。フィルタ係数G(ω,l)の算出には、例えば式(12)に示すように閾値を用いた2値のフィルタなどが用いられる。
Figure 0005143802
なお、閾値Thは、直間比E(ω,l)の最小値と最大値の間の任意の値が設定できる。閾値Thを最小値(0)に近づけると音質は向上する。逆に閾値Thを最大値に近づけると雑音抑圧効果は高めるが受音信号の歪みが大きくなり音質が劣化する。
このように閾値Thは、音質と雑音抑圧との関係でトレードオフの関係を持つ。よって、閾値Thは、このトレードオフの関係を考慮した上で、利用目的に応じて経験的に決定される。
また、フィルタ係数G(ω,l)の算出に際して式(13)に示すように、直間比相当値が閾値Th2を下回る時間周波数帯域を強調するようにすれば、特定の距離範囲より遠くの音源を強調することができる。
Figure 0005143802
なお、フィルタ係数G(ω,l)の例として0か1の2値のフィルタを挙げたが、フィルタ係数G(ω,l)は必ずしも0と1である必要はなく、例えば、0.1と0.9のように十分異なる値であれば良い。
また、フィルタ係数G(ω,l)には、1以上の実数を設定するようにしても良い。つまり、処理対象信号Y(ω,l)を増幅するようにしても良い。また、0.1以下の値に設定して処理対象信号Y(ω,l)を大きく抑圧するようにしても良い。
このようにして求めたフィルタ係数G(ω,l)が、乗算部46において、処理対象信号Y(ω,l)に乗じて処理後信号Z(ω,l)=G(ω,l)・Y(ω,l)が生成される。よって、処理後信号Z(ω,l)を、直間比相当値EF(ω,l)の大きな処理対象信号Y(ω,l)のみで構成することができる。つまり、直接音のみを抽出することができる。
図8にこの発明の雑音除去装置800の機能構成例を示す。雑音除去装置800は、上記した雑音除去装置400に対して、処理対象信号生成部83と、直間比推定部84の動作が異なる。
図9に直間比推定部84の機能構成例を示す。直間比推定部84は、固有値展開手段842が、最大の固有値λM(ω,l)に対応する固有ベクトルvL(ω,l)を出力する点が直間比推定部44(図7)と異なる。その固有ベクトルvL(ω,l)は処理対象信号生成部83に入力される。
図10に処理対象信号生成部83の機能構成例を示す。処理対象信号生成部83は、固有ベクトルvL(ω,l)を重み乗算部8311〜831Mの重みとして用いる点で、処理対象信号生成部43と異なる。
マイクロホンアレー41を構成するマイクロホンの数、M個に対応する数の固有ベクトルが、それぞれ重み乗算部8311〜831Mの重みとして用いられる。つまり、m番目のマイクロホンの重みwm(ω)には、固有ベクトルvL(ω,l)のm番目の成分vL,m(ω,l)が用いられる。
最大の固有値λM(ω,l)に対応する固有ベクトルvL(ω,l)は、直接音を強調するビームフォーミングの重みとして機能することが知られている。従って、雑音除去装置800は、雑音除去装置400よりも雑音除去性能を向上させることが可能である。
実施例3として、真の直間比ER(ω,l)を求める方式の直間比推定部110を説明する。図11に直間比推定部110機能構成例を示す。直間比推定部110は、空間相関行列算出手段441と、信号パワー推定手段112と、直間比算出手段113と、を備える。空間相関行列算出手段441は、実施例1,2と同じものである。
信号パワー推定部112は、空間相関行列算出手段441が出力する空間相関行列R(ω,l)の各成分Rij(ω,l)と、予め与えられているマイクロホンアレーのマイクロホン配置と、音源の方向より与えられる行列Rd(ω)(式(14))と、行列Rr(ω)(式(15))の各成分dij(ω)と、各成分rij(ω)より、それぞれ構成される式(16)に示す行列A(ω)と、式(17)に示すB(ω)を用いる。
Figure 0005143802
ここで、Dmnはm番目のマイクロホンとn番目のマイクロホンの距離、θはマイクロホンアレーの正面から見た音源の方向である。ここでは、マイクロホンアレーの形状は直線配置とし、マイクロホンアレーの正面とはマイクロホンの並ぶ直線の法線方向を意味する。
Figure 0005143802
そして、式(18)に示す連立方程式を立て、これを解くことで直接音のパワーPd(ω,l)と残響音のパワーPr(ω,l)で構成されるベクトルP(ω,l)(式(19))を求め、直接音パワーPd(ω,l)と残響音パワーPr(ω,l)をそれぞれ出力する。
Figure 0005143802
なお、マイクロホンアレーの配置が直線以外の配置の場合の行列Rd(ω)は、より一般的な式(20)に示す形式で表せる。
Figure 0005143802
ここでDmn(θ) ̄は、角度θ°方向から見たときのm番目のマイクロホンとn番目のマイクロホンの距離差を表す。また、式(18)の連立方程式の解の導出は、例えば式(22)に示すようにA(ω)の擬似逆行列A(ω)(式(21))を、B(ω,l)の左から掛ける方法で行われる。
Figure 0005143802
直間比算出手段113は、直接音パワーPd(ω,l)と残響音パワーPr(ω,l)より、式(23)によって直間比ER(ω,l)を算出して出力する。
Figure 0005143802
この実施例3の方法は、実施例1と2の方法に比べて直接的に直間比を求めることが可能になるため、より正確な直間比の推定が可能である。また、実施例3の方法は固有値展開を用いないので計算量も削減する効果も奏する。
この発明の実施例4として、実施例1で述べた直間比相当値EF(ω,l)又は実施例3で述べた直間比ER(ω,l)を用いて音源の遠近を判定する遠近判定装置120を説明する。図12に遠近判定装置120の機能構成例を示す。遠近判定装置120は、マイクロホンアレー41と、複数の周波数領域変換部411〜41mと、直間比推定部44と、遠近判定部121と、を備える。マイクロホンアレー41と、複数の周波数領域変換部411〜41mと、直間比推定部44とは、雑音除去装置400のものと同じである。遠近判定装置120も、例えばROM、RAM、CPU等で構成されるコンピュータに所定のプログラムが読み込まれて、CPUがそのプログラムを実行することで実現される。
遠近判定装置120は、複数の異なる距離にある音源が異なる時刻に発音するときに、ある時刻に受音された音の音源が遠くにあるのか近くにあるのかを判定するものである。遠近判定装置120を構成する遠近判定部121は、周波数平均手段1210と、蓄積手段1211と、判定手段1212と、を備える。なお、以降の説明は直間比相当値EF(ω,l)を用いた例で説明する。直間比相当値EF(ω,l)を直間比ER(ω,l)に置換えても遠近判定装置120の動作に変わりはない。
周波数平均手段1210は、直間比相当値EF(ω,l)を入力として、直間比相当値EF(ω,l)を周波数方向に平均して周波数平均直間比相当値El ̄を出力する(式(24))。
Figure 0005143802
ここで、Kは周波数領域変換部421〜42Mで行ったフーリエ変換の周波数ビンの総数である。
蓄積手段1211は、周波数平均直間比相当値El ̄を過去L時間フレーム分蓄積して、比較対象直間比相当値E^を出力する。比較対象直間比相当値E^には、例えば蓄積された周波数平均直間比相当値El ̄の平均値E^=1/LΣl Ll ̄や、最小値と最大値の平均値E^=1/2(maxEl ̄+minEl ̄)等が用いられる。
判定手段1212は、周波数平均直間比相当値El ̄と、比較対象直間比相当値E^を比較して、El ̄>E^の時には遠近判定結果Ylに距離が近いことを表す例えば1を、El ̄<E^の時には遠近判定結果Ylに距離が遠いことを表す例えば0を出力する。この遠近判定結果Ylは、直近の過去L時間分の受音信号が、比較的近い音源からの音であるか、又は、比較的遠い音源からの音であるかを表すものである。
この遠近判定結果Ylを用いることで、逐次入力される受音信号を、マイクロホンとその音源間との距離によって切り分けることが可能である。つまり、複数の音源の音を、マイクロホンからの距離に応じて選択することができる。
〔実験結果〕
この発明の効果を確認する目的で、マイクロホンアレーから見て同じ方向で異なる位置に、2つの音源をそれぞれ配置し、マイクロホンアレーから遠い方の音源の音を抑圧するコンピュータシミュレーションを行った。直間比は実施例3の方法で求めた。
図13にシミュレーション条件を示す。平面サイズが4×6mで、高さが2.5mの部屋を想定した。3個のマイクロホンが直線状に4cmの間隔を空けて並べられたマイクロホンアレーを用いた。マイクロホンアレーは、中央のマイクロホンを高さ1.5mで4mの壁から1mの位置に配置した。そして中央のマイクロホンの中心軸から角度10°の方向で、マイクロホンアレーから0.5mと4.0mの距離にそれぞれ異なる音源を配置した。
図14に2つの音源から異なる音声が再生された時の雑音除去装置の出力信号を示す。図14の横軸は時間[秒]、縦軸は振幅である。マイクロホンアレーから0.5mの距離にあるスピーカは、約2秒間発音し、4.0mの距離にあるスピーカは約1.5秒〜約3.6秒の時間発音させた。以降、同じ関係で発音を繰り返すようにした。そして、4.0mの距離にあるスピーカの音を抑圧する実験を行った。
(a)は、所望信号を示す。(b)はマイクロホンアレーで受音した受音信号そのものを示す。(c)は、(b)の受音信号をこの発明の雑音除去装置で雑音を除去した雑音除去装置の出力信号を示す。直間比E(ω,l)は実施例3に示した方法で求めた。
(c)と(b)の2〜3秒間に注目すると、雑音除去装置の出力信号において、4.0mのスピーカの音が抑圧されていることが分かる。このように、この発明の雑音除去装置によれば、同じ方向で距離が異なる位置に存在する音源を雑音源として、その音だけを抑圧することが出来る。また、この結果を定量的に評価した結果、雑音の抑圧量を評価する値である信号対干渉音比(SIR)の改善量が5.4dB向上し、所望音の音質を評価する値である信号対歪み比(SDR)は11.4dBであった。このことからもこの発明の技術は所望音質とのトレードオフのバランスを取りつつ、雑音を抑圧する効果を奏することが分かる。
図15に、実施例3による方法で直間比E(ω,l)を求めた実験結果を示す。 図15の、横軸はマイクロホンアレーと音源間との距離[cm]、縦軸は直間比[dB]である。この発明の方法で推定した直間比を○でプロットする。実際の直間比を□でプロットする。
実際の直間比は、予め測定された直接音成分と残響音成分に分けたインパルス応答より求めた。
図15において、20cm以下では実際の直間比の値と異なる傾向を示すが、30cm以上の距離においては同じ傾向を示す。このことから、正しく直間比が求められていることが分かる。この直間比の値から距離が求められることも、図15から良く理解することが出来る。
このように、この発明の雑音除去装置は、1個のマイクロホンアレーでも特定の距離にある音源の音だけを強調(雑音を除去)することが可能になる。
なお、上記方法及び装置において説明した処理は、記載の順に従って時系列に実行され
るのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されるとしてもよい。
また、上記装置における処理手段をコンピュータによって実現する場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、各装置における処理手段がコンピュータ上で実現される。
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。具体的には、例えば、磁気記録装置として、ハードディスク装置、フレキシブルディスク、磁気テープ等を、光ディスクとして、DVD(Digital Versatile Disc)、DVD−RAM(Random Access Memory)、CD−ROM(Compact Disc Read Only Memory)、CD−R(Recordable)/RW(ReWritable)等を、光磁気記録媒体として、MO(Magneto Optical disc)等を、半導体メモリとしてEEP−ROM(Electronically Erasable and Programmable-Read Only Memory)等を用いることができる。
また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD−ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記録装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。
また、各手段は、コンピュータ上で所定のプログラムを実行させることにより構成することにしてもよいし、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。

Claims (11)

  1. 複数のマイクロホンから成る1個のマイクロホンアレーと、
    上記複数のマイクロホンで受音された受音信号がそれぞれ入力され、上記受音信号を周波数領域の信号に変換する複数の周波数領域変換部と、
    上記複数の周波数領域変換部の出力する周波数領域の信号を合成して処理対象信号を生成する処理対象信号生成部と、
    上記複数の周波数領域変換部の出力する周波数領域の信号を入力として上記受音信号の直間比、若しくは当該値に相当する直間比相当値を推定する直間比推定部と、
    上記処理対象信号と、上記直間比又は直間比相当値を入力としてその値に応じて上記処理対象信号の振幅を調整した処理後信号を生成する対象信号調整部と、
    上記処理後信号を時間領域の信号に変換する逆周波数領域変換部と、
    を具備する雑音除去装置。
  2. 請求項1に記載の雑音除去装置において、
    上記直間比推定部は、
    上記複数の周波数領域変換部の出力する周波数領域の信号を入力としてその周波数領域の信号をベクトル化して空間相関行列を算出する空間相関行列算出手段と、
    上記空間相関行列を入力としてその空間相関行列を固有値と固有ベクトルとに分解し、上記固有値を出力する固有値展開手段と、
    上記固有値を入力としてその固有値の分布の割合を数値化した上記直間比相当値を計算する固有値分布算出手段と、
    を備えることを特徴とする雑音除去装置。
  3. 請求項1に記載の雑音除去装置において、
    上記直間比推定部は、
    上記複数の周波数領域変換部の出力する周波数領域の信号を入力としてその周波数領域の信号をベクトル化して空間相関行列を算出する空間相関行列算出手段と、
    予め与えられる上記マイクロホンの配置情報と、上記空間相関行列とから直接音のパワーと残響音のパワーで構成されるベクトルを求め、直接音パワーと残響音パワーを出力する信号パワー推定手段と、
    上記直接音パワーを上記残響音パワーで除した上記直間比を算出する直間比算出手段と、
    を備えることを特徴とする雑音除去装置。
  4. 請求項1に記載の雑音除去装置において、
    上記直間比推定部は、
    上記複数の周波数領域変換部の出力する周波数領域の信号を入力としてその周波数領域の信号をベクトル化して空間相関行列を算出する空間相関行列算出手段と、
    上記空間相関行列を入力としてその空間相関行列を固有値と固有ベクトルとに分解し、上記固有値と、その固有値に対応する最大の固有ベクトルとを出力する固有値展開手段と、
    上記固有値を入力としてその固有値の分布の割合を数値化した上記直間比相当値を計算する固有値分布算出手段と、
    を備え、
    上記処理対象信号生成部は、
    上記複数の周波数領域変換部の出力する周波数領域の信号がそれぞれ入力され、上記最大の固有ベクトルの各成分で、上記各周波数領域の信号を重み付けする複数の重み乗算手段と、
    上記複数の重み乗算部の出力信号を加算する加算手段と、
    を備えることを特徴とする雑音除去装置。
  5. 複数のマイクロホンから成る1個のマイクロホンアレーと、
    上記複数のマイクロホンで受音された受音信号がそれぞれ入力され、上記受音信号を周波数領域の信号に変換する複数の周波数領域変換部と、
    上記複数の周波数領域変換部の出力する周波数領域の信号を入力として上記受音信号の直間比、若しくは当該値に相当する直間比相当値を推定する直間比推定部と、
    上記直間比又は直間比相当値を入力として、その値の遠近判定を行い遠近判定結果を出力する遠近判定部と、を備えた遠近判定装置であって、
    上記遠近判定部は、
    上記直間比又は直間比相当値を、周波数方向に平均して周波数平均直間比相当値を出力する周波数平均手段と、
    上記周波数平均直間比相当値を過去所定のフレーム分の時間蓄積して、比較対象直間比相当値を出力する蓄積手段と、
    上記周波数平均直間比相当値と、上記比較対象直間比相当値とを比較して遠近判定結果を出力する判定手段と、
    を具備する遠近判定装置。
  6. 複数の周波数領域変換部が、1個のマイクロホンアレーを構成する複数のマイクロホンで受音された受音信号を周波数領域の信号に変換する周波数領域変換過程と、
    処理対象信号生成部が、上記複数の周波数領域変換部の出力する周波数領域の信号を合成して処理対象信号を生成する処理対象信号生成過程と、
    直間比推定部が、上記複数の周波数領域変換部の出力する周波数領域の信号を入力として上記受音信号の直間比、若しくは当該値に相当する直間比相当値を推定する直間比推定過程と、
    対象信号調整部が、上記処理対象信号と、上記直間比又は直間比相当値を入力としてその値に応じて上記処理対象信号の振幅を調整した処理後信号を生成する対象信号調整過程と、
    逆周波数領域変換部が、上記処理後信号を時間領域の信号に変換する逆周波数領域変換過程と、
    を含む雑音除去方法。
  7. 請求項6に記載の雑音除去方法において、
    上記直間比推定過程は、
    空間相関行列算出手段が、上記複数の周波数領域変換部の出力する周波数領域の信号を入力としてその周波数領域の信号をベクトル化して空間相関行列を算出する空間相関行列算出ステップと、
    固有値展開手段が、上記空間相関行列を入力としてその空間相関行列を固有値と固有ベクトルとに分解し、上記固有値を出力する固有値展開ステップと、
    固有値分布算出手段が、上記固有値を入力としてその固有値の分布の割合を数値化した上記直間比相当値を計算する固有値分布算出ステップと、
    を含むことを特徴とする雑音除去方法。
  8. 請求項6に記載の雑音除去方法において、
    上記直間比推定過程は、
    空間相関行列算出手段が、上記複数の周波数領域変換部の出力する周波数領域の信号を入力としてその周波数領域の信号をベクトル化して空間相関行列を算出する空間相関行列算出ステップと、
    信号パワー推定手段が、予め与えられる上記マイクロホンの配置情報と、上記空間相関行列とから直接音のパワーと残響音のパワーで構成されるベクトルを求め、直接音パワーと残響音パワーを出力する信号パワー推定ステップと、
    直間比算出手段が、上記直接音パワーを上記残響音パワーで除した上記直間比を算出する直間比算出ステップと、
    を含むことを特徴とする雑音除去方法。
  9. 請求項6に記載の雑音除去方法において、
    上記直間比推定過程は、
    空間相関行列算出手段が、上記複数の周波数領域変換部の出力する周波数領域の信号を入力としてその周波数領域の信号をベクトル化して空間相関行列を算出する空間相関行列算出ステップと、
    固有値展開手段が、上記空間相関行列を入力としてその空間相関行列を固有値と固有ベクトルとに分解し、上記固有値と、その固有値に対応する最大の固有ベクトルとを出力する固有値展開ステップと、
    固有値分布算出手段が、上記固有値を入力としてその固有値の分布の割合を数値化した上記直間比相当値を計算する固有値分布算出ステップと、
    を含み、
    上記処理対象信号調整過程は、
    乗算手段が、上記複数の周波数領域変換部の出力する周波数領域の信号がそれぞれ入力され、上記最大の固有ベクトルの各成分で、上記各周波数領域の信号を重み付けする複数の重み乗算ステップと、
    加算手段が、上記複数の重み乗算部の出力信号を加算する加算ステップと、
    を含むことを特徴とする雑音除去方法。
  10. 複数の周波数領域変換部が、1個のマイクロホンアレーを構成する複数のマイクロホンで受音された受音信号を周波数領域の信号に変換する周波数領域変換過程と、
    直間比推定部が、上記複数の周波数領域変換部の出力する周波数領域の信号を入力として上記受音信号の直間比、若しくは当該値に相当する直間比相当値を推定する直間比推定過程と、
    遠近判定部が、上記直間比又は直間比相当値を入力として、その値の遠近判定を行い遠近判定結果を出力する遠近判定過程と、を含む遠近判定方法であって、
    上記遠近判定過程は、
    周波数平均手段が、上記直間比相当値を周波数方向に平均して周波数平均直間比相当値を出力する周波数平均ステップと、
    蓄積手段が、上記周波数平均直間比相当値を過去所定のフレーム分の時間蓄積して、比較対象直間比相当値を出力する蓄積ステップと、
    判定手段が、上記周波数平均直間比相当値と、上記比較対象直間比相当値とを比較して遠近判定結果を出力する判定ステップと、
    を含む遠近判定方法。
  11. 請求項1乃至4の何れかに記載した雑音除去装置、または、請求項5に記載の遠近判定装置としてコンピュータを機能させるための装置プログラム。
JP2009201724A 2009-09-01 2009-09-01 雑音除去装置、遠近判定装置と、各装置の方法と、装置プログラム Expired - Fee Related JP5143802B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009201724A JP5143802B2 (ja) 2009-09-01 2009-09-01 雑音除去装置、遠近判定装置と、各装置の方法と、装置プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009201724A JP5143802B2 (ja) 2009-09-01 2009-09-01 雑音除去装置、遠近判定装置と、各装置の方法と、装置プログラム

Publications (2)

Publication Number Publication Date
JP2011055211A JP2011055211A (ja) 2011-03-17
JP5143802B2 true JP5143802B2 (ja) 2013-02-13

Family

ID=43943776

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009201724A Expired - Fee Related JP5143802B2 (ja) 2009-09-01 2009-09-01 雑音除去装置、遠近判定装置と、各装置の方法と、装置プログラム

Country Status (1)

Country Link
JP (1) JP5143802B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5635024B2 (ja) * 2012-02-24 2014-12-03 日本電信電話株式会社 音響信号強調装置、遠近判定装置、それらの方法、及びプログラム
JP5713933B2 (ja) * 2012-02-24 2015-05-07 日本電信電話株式会社 音源距離測定装置、音響直間比推定装置、雑音除去装置、それらの方法、及びプログラム
JP5738218B2 (ja) * 2012-02-28 2015-06-17 日本電信電話株式会社 音響信号強調装置、遠近判定装置、それらの方法、及びプログラム
CN110036441B (zh) * 2016-12-16 2023-02-17 日本电信电话株式会社 目标音强调装置及方法、噪音估计用参数学习装置及方法、记录介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5123595B2 (ja) * 2007-07-31 2013-01-23 独立行政法人情報通信研究機構 近傍場音源分離プログラム、及びこのプログラムを記録したコンピュータ読取可能な記録媒体、並びに近傍場音源分離方法

Also Published As

Publication number Publication date
JP2011055211A (ja) 2011-03-17

Similar Documents

Publication Publication Date Title
KR101456866B1 (ko) 혼합 사운드로부터 목표 음원 신호를 추출하는 방법 및장치
US8238569B2 (en) Method, medium, and apparatus for extracting target sound from mixed sound
JP6584930B2 (ja) 情報処理装置、情報処理方法およびプログラム
JP5079761B2 (ja) 直間比推定装置、音源距離測定装置、雑音除去装置、各装置の方法と、装置プログラム
KR101449433B1 (ko) 마이크로폰을 통해 입력된 사운드 신호로부터 잡음을제거하는 방법 및 장치
KR101442446B1 (ko) 도달 방향 추정치로부터의 기하학적 정보 추출을 통한 사운드 수집
JP5305743B2 (ja) 音響処理装置及びその方法
US20090034756A1 (en) System and method for extracting acoustic signals from signals emitted by a plurality of sources
CN105165026A (zh) 使用多个瞬时到达方向估计的知情空间滤波的滤波器及方法
JP5772151B2 (ja) 音源分離装置、プログラム及び方法
JP5738218B2 (ja) 音響信号強調装置、遠近判定装置、それらの方法、及びプログラム
JP2001309483A (ja) 収音方法および収音装置
JP5143802B2 (ja) 雑音除去装置、遠近判定装置と、各装置の方法と、装置プログラム
KR20090037845A (ko) 혼합 신호로부터 목표 음원 신호를 추출하는 방법 및 장치
JP2007006253A (ja) 信号処理装置、マイクロフォンシステム、話者方向検出方法及び話者方向検出プログラム
JP5635024B2 (ja) 音響信号強調装置、遠近判定装置、それらの方法、及びプログラム
JPH09261792A (ja) 受音方法及びその装置
KR20190073852A (ko) 우도 최대화를 이용한 빔포밍 방법
JP5698166B2 (ja) 音源距離推定装置、直間比推定装置、雑音除去装置、それらの方法、及びプログラム
JP5683140B2 (ja) 耐雑音直間比推定装置、干渉雑音除去装置、遠近判定装置、音源距離測定装置と、各装置の方法と、装置プログラム
JP5826465B2 (ja) 瞬時直間比推定装置、雑音除去装置、遠近判定装置、音源距離測定装置と、各装置の方法と、装置プログラム
JP4116600B2 (ja) 収音方法、収音装置、収音プログラム、およびこれを記録した記録媒体
JP5815489B2 (ja) 音源別音声強調装置、方法、プログラム
KR20090098552A (ko) 위상정보를 이용한 자동 이득 조절 장치 및 방법
JP6854967B1 (ja) 雑音抑圧装置、雑音抑圧方法、及び雑音抑圧プログラム

Legal Events

Date Code Title Description
RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20110721

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20111012

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20121107

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20121113

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121121

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151130

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 5143802

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees