JP4473829B2

JP4473829B2 - 収音装置、プログラム及びこれを記録した記録媒体

Info

Publication number: JP4473829B2
Application number: JP2006052502A
Authority: JP
Inventors: 裕輔日岡; 和則小林; 賢一古家; 章俊片岡
Original assignee: Nippon Telegraph and Telephone Corp
Current assignee: Nippon Telegraph and Telephone Corp
Priority date: 2006-02-28
Filing date: 2006-02-28
Publication date: 2010-06-02
Anticipated expiration: 2026-02-28
Also published as: JP2007235358A

Description

本発明は音声通話や機器の操作などハンズフリー方式で音声を収音する収音装置に関し、特にとらえたい音声を発する所望音源以外の雑音源が多数存在する場合に大きく関係する。

図１８は非特許文献１に記載されている雑音除去機能を持つ収音装置の構成を示す。従来技術では、Ｍ個のマイクロホンＭ_１〜Ｍ_ｍを用いて、座標（p,q）の点にある所望音源１から発せられる音を信号、それ以外の点から発せられる音を雑音としたときに、信号だけを強調して高いSN比で収音する。はじめに座標（p_m,q_m）に配置したマイクロホンＭ_１〜Ｍ_ｍで受音した信号x_m(n)(m=1…M)に対し、式（１）のように遅延量D_ｍと利得g_ｍを付加することにより信号y_ｍ(n)を得る。
y_ｍ(n)＝g_ｍx_m(n−D_ｍ) （１）
このとき遅延量D_ｍと利得g_ｍは、あらかじめ与えられた所望音源１の位置(p,q)から、それぞれ式（２）と式（３）により導出することができる。

ここでr_ｍ、r_cはそれぞれ式（４）と式（５）で定義されるマイク−音源間距離および臨界距離であり、cは音速、VとTはそれぞれ室容積、室内の残響時間を示す。

次にいま得られたy_ｍ(n)を式（６）のように加算することで、所望音源１の位置から発せられる音を強調した信号z(n)が求められる。

以上が従来の雑音除去法である。この従来技術を用いてより高いSN比で信号を収音するためには、マイクロホン数を増やし、またマイクロホン相互の間隔を大きく採らなければならないためマイクロホンアレーを大型にする必要がある。
野村博昭、金田豊、小島順治、"近接音場型マイクロホンアレー、"日本音響学会誌、Vol.53, No.2, pp.110-116, 1997

従来技術の雑音除去法を用いて、収音装置から見て同じ方向で距離が異なる点に配置された音源から発せられる音のうちどれかひとつを選択、強調して収音するためには、所望音源に対するマイクロホン相互の位置を大きく異ならせる必要があるために、大規模なマイクロホンアレーが必要である。従って使用に際して設置や運搬に大掛かりな作業が必要となるため利用範囲が限られていた。また従来技術では、処理によるSN比の向上量が実用においては不十分であった。一方、小規模なマイクロホンアレーを用いた従来技術では、その原理上、方向に関する識別能力しか持たないことから、同じ方向で距離が異なる点に配置された音源が発する音のうちどれかひとつだけを選択して収音することは不可能であった。

本発明の目的は以上の問題を解決するためになされたもので、設置、運搬が容易ながら、方向だけでなく距離に関する識別能力も備え、従来技術よりも高いSN比で所望音源からの音を収音する装置を実現することにある。

本発明による収音装置は第１のマイクロホンアレーの出力信号を利用して第１のマイクロホンアレーから所望音源位置を含む角度領域の音を収音する第１収音部と、第１のマイクロホンアレーの出力信号を利用して第１のマイクロホンアレーから前記所望音源位置を含まない角度領域の音を収音する第３収音部と、第１のマイクロホンアレーとは異なる位置に配置された第２のマイクロホンアレーの出力信号を利用して第２のマイクロホンアレーから前記所望音源位置を含む角度領域の音を収音する第２収音部と、第２のマイクロホンアレーの出力信号を利用して第２のマイクロホンアレーから前記所望音源位置を含まない角度領域の音を収音する第４収音部と、第１のマイクロホンアレーの出力信号と第２のマイクロホンアレーの出力信号を利用して第１のマイクロホンアレーと第２のマイクロホンアレーの中間点から前記所望音源位置を含む角度領域の音を収音する第５収音部と、第１のマイクロホンアレーの出力信号と第２のマイクロホンアレーの出力信号を利用して前記中間点から前記所望音源位置を含まない角度領域の音を収音する第６収音部と、第１乃至第６収音部で得られた各収音信号により前記所望音源の信号量と、その他の音源の信号量とを推定する音源信号成分推定部と、前記所望音源の信号量と、前記所望音源の信号量を含む全ての音源の信号量との比から利得係数を求める利得係数算出部と、利得係数算出部で算出した利得係数を所望音源の信号を主成分とする信号に乗算する乗算部とを備えることを特徴とする。

更に、本発明による収音装置は前記記載の収音装置において、第１乃至第６収音部で得られた各収音信号は周波数領域変換手段により周波数領域変換処理され、利得係数は周波数領域変換手段で変換された各周波数領域成分毎に算出し、算出した各周波数領域毎の利得係数を所望音源の信号を主成分とする信号の各対応する周波数領域成分に乗算し、利得係数を乗算した周波数領域成分を逆周波数領域変換手段により時間領域信号に変換処理して出力することを特徴とする。

更に、本発明による収音装置は前記記載の収音装置において、信号量は信号のパワー値であることを特徴とする。
更に、本発明による収音装置は前記記載の収音装置において、信号量は信号の絶対値であることを特徴とする。
更に、本発明による収音装置は前記記載の収音装置において、利得係数算出部で算出す
る利得係数は前記所望音源の信号量に対して、前記その他の音源の信号量が無視できる程度に微少値である場合、所定の最大値で与えられ、前記その他の音源の信号量に対して、前記所望音源の信号量が無視できる程度に微少値である場合は０に近い値で与えられることを特徴とする。

更に、本発明による収音装置は前記記載の収音装置において、利得係数算出部の利得係
数算出特性を、前記その他の音源の信号量が前記所望音源の信号量より小さい領域では利得係数の値を前記所定の最大値または最大値に近い値に維持させ、前記その他の音源の信号量が前記所望音源の信号量より大きい領域では利得係数の値を０または０に近い値に維持させる変化特性を備えることを特徴とする。

本発明による収音装置によれば、マイクロホンアレーから得られる信号を利用して、第１乃至第６収音部は主に所望音源位置を含む角度領域の音と、所望音源位置を含まない角度領域の音を収音する収音特性を得る構成、つまり指向性を設定する構成であるため、マイクロホン相互間の距離が小さくても収音を希望する角度領域の区別を付けることができる。この結果、マイクロホンアレーの形状を小型化することができる。
更に、本発明による収音装置によれば収音した信号は周波数領域分割され、周波数領域分割された各周波数領域毎に各音源信号の成分量を推定し、推定された各音源信号の成分量の比を求めてSN比に相当する各周波数領域毎の利得係数を算出する。この利得係数を所望音源の音を主成分とする音源信号の各周波数領域成分に乗算することにより、所望音源の音を主成分とする音源信号に含まれる他の音源信号の量を減衰させることができる。この結果、所望音源信号のみを強調して取り出すことができることになる。

更に本発明による収音装置によれば、それぞれのマイクロホンアレーの大きさが小規模であるため設置や運搬が容易でありながら、従来技術では不可能であった同じ方向で距離が異なる点に音源が配置されたような場合にも、どれかひとつだけを強調して収音することが可能となる。
本発明によるSN比の向上に関する効果を示すために後に説明する実施例１および実施例２のシミュレーションによる実験結果を示す。図１４にシミュレーションにおける状況設定を示す。それぞれのマイクロホンアレーには５つのマイクロホンが直線上に４ｃｍの等間隔で配置されており、それぞれ座標（単位はメートル。以下同様）（0.4,0）と(-0.4,0)にその中心が位置している。図１４Ａに示すケース１では所望音源１が(0,0.5)に、１つの背景雑音源２が(0,2.5)にそれぞれ配置されている。図１４Ｂに示すケース２ではケース１の場合に加えて、(-1.6,2.5)と(1.6,2.5)の２点にもそれぞれ背景雑音源２が配置されている。

図１５Ａはケース１における所望音源１の信号、図１５Ｂはマイクロホンで受音した信号、図１５Ｃは実施例２の処理を行った後の信号を示している。また図１６Ａ、Ｂ、Ｃはそれぞれケース２における同様の信号を示している。図１５及び図１６どちらの場合でも処理前の信号に比べて、本発明の処理を行った信号のほうが所望音源の音に近く、所望音源１からの音が強調されて収音できていることが分かる。
次に図１７は処理前の信号と処理後の信号におけるSN比改善量を示している。本発明を用いた場合のSN比改善量は１３ｄB程度と従来技術と比べて１０ｄＢ以上大きいことが分かる。また実施例２において、非線形処理を追加したことでSN比改善量が増加しており、本処理を追加した効果を確認することが出来る。
以上より本発明によれば、装置の設置、運搬が容易ながら、複数の音源が発する音のうちどれか１つを選択強調して収音することができることが分かる。また本発明を用いることで、収音時のSN比改善量は実用上十分な程度まで大きく向上することが分かる。

本発明による収音装置を実現するには全てをハードウェアによって構成することも可能であるが、最も簡素に実現するにはコンピュータに本発明によるプログラムをインストールし、コンピュータに本発明による収音装置として機能させる形態が最良の実施形態である。
コンピュータによって本発明による収音装置を実現するには、コンピュータにインストールした収音プログラムにより、コンピュータ内に少なくとも第１乃至第６収音部と、周波数領域変換部と、音源信号成分推定部と、利得係数算出部と、乗算部とを構築し、収音装置として機能させる。

図１に本発明の利用状況の一例を示す。２つの小規模マイクロホンアレー３Ｌ、３Ｒをある程度（例えばマイクロホンアレー３Ｌ、３Ｒと所望音源１までの距離と同程度の距離）離れた異なる位置に配置し、それぞれマイクロホンで受音された信号に対して以下で説明する処理を行なう。以下に説明する処理を行なうことにより所望音源１の音が強調されて収音され、背景雑音源２の音は抑圧される。
図２に本発明による収音装置の全体の構成を示す。この図２を用いて本発明による収音装置の概要を説明する。マイクロホンアレー３Ｌの各マイクロホンで生成された各受音信号はこの例では第１収音部４−１と第３収音部４−３に入力される。更に、マイクロホンアレー３Ｒの各マイクロホンで生成された各受音信号はこの例では第２収音部４−２と第４収音部４−４に入力される。マイクロホンアレー３Ｌと３Ｒの中央に位置するマイクロホンの信号が第５収音部４−５と第６収音部４−６に入力される。尚、両マイクロホンアレー３Ｌと３Ｒに搭載されるマイクロホンの数は必ずしも同数である必要はない。

第１収音部４−１〜第４収音部４−４は図４に示すように各マイクロホンの受音信号x₁〜x_mが入力されるM個のフィルタ処理部４１と、これらM個のフィルタ処理部４１の各出力信号を加算する加算部４２とによって構成される。各フィルタ処理部４１は例えばＦＩＲフィルタ等で構成され、デジタル処理により収音信号に含まれる周波数成分毎に分析処理を行いマイクロホンアレー３Ｌと３Ｒの指向特性を設定する。このような技術は例えば大賀寿郎、山崎芳男、金田豊共著「音響システムとデジタル処理」平成７年３月２５日社団法人電子情報通信学会発行に記載されており、周知の技術により実現することができる。
ここでは第１収音部４−１の指向特性及び第２収音部４−２の指向特性はマイクロホンアレー３Ｌ及び３Ｒのほぼ中央位置から図３に示す所望音源１の位置を含む角度領域Θ_LとΘ_Rを収音範囲とする特性に設定する。第３収音部４−３と第４収音部４−４の指向特性はマイクロホンアレー３Ｌと３Ｒのほぼ中央位置から図３に示す所望音源１の位置を含まない角度領域Θ_L￣とΘ_R￣とを収音範囲とする特性に設定する。更に、第５収音部４−５の指向性はマイクロホンアレー３Ｌと３Ｒのほぼ中間位置から所望音源１の位置を含む角度領域Θ_Cを収音範囲とする特性に設定する。第６収音部４−６の指向性はマイクロホンアレー３Ｌと３Ｒのほぼ中間位置から所望音源１の位置を含まない角度領域Θ￣_Cの角度範囲を収音範囲とする特性に設定する。

第１乃至第６収音部４−１〜４−６の指向特性で収音された収音信号は周波数領域変換部５で周波数領域の信号に変換される。周波数領域への変換は入力された信号を短い時間長（例えばサンプリング周波数１６０００Hzの場合は２５６サンプル程度）のフレームに分解し、それぞれのフレームにおいて離散フーリエ変換を行なう。離散フーリエ変換は例えばFFT等と呼ばれている高速フーリエ変換等を用いることができる。周波数領域に変換された信号は複数の周波数領域成分に分割される。
周波数領域の信号に変換された収音信号は加算部６と音源信号成分推定部７とに入力される。加算部６へは第１収音部４−１と第２収音部４−２の出力信号を入力する。加算部６では周波数領域へ変換された各周波数領域の信号を同一周波数領域成分毎に加算する。

音源信号成分推定部７へは第１収音部４−１から第６収音部４−６の全ての出力信号を入力し、各周波数領域毎に各音源の信号量を推定する。各音源の信号量が推定できると、所望音源１の信号量対その他の音源の信号量との比つまりSN比を求めることができる。このSN比を各周波数領域毎に求め、このSN比を利得係数として乗算部９で加算部６から与えられる所望音源１の信号を主成分とする信号に各周波数領域毎に乗算することにより、所望音源１の信号を主成分とする信号に含まれる背景雑音成分を抑制することができる。乗算部９の乗算結果は逆周波数領域変換部１０で時間領域信号に変換され、雑音除去後の信号として出力される。以上は本発明の概要である。

以下では各部の構成及び動作を詳細に説明する。図４は第１収音部乃至第４収音部４−１〜４−４の構成を示している。ここでは第１収音部４−１を例示して説明するが、同様の処理が第２収音部４−２、第３収音部４−３、第４収音部４−４でも行われる。これら第１収音部４−１〜４−４は所望音源１の位置を挟んでその両側の方向から所望音源位置を含む角度領域を収音範囲とする収音特性及び所望音源位置を含まない角度領域を収音範囲とする収音特性に設定されることからサイドビームフォーマーとして機能する。第１収音部４−１に入力された信号x_LmL(n)(m_L=1,2,…,M_L)はフィルタ処理部４１に入力される。フィルタ処理部４１ではあらかじめ与えられた（決定方法は後述する）フィルタ係数ｗ_LmL(n)と入力信号ｘ_LmL(n)を、式（７）に示す畳み込み演算に代入して得られる信号ｘ'_LmL(n)を出力する。

各フィルタ処理部４１の出力信号は加算部４２に入力される。加算部４２では入力信号を式（８）のように加算し、第１収音部４−１の出力信号y_SL(n)を得る。

ここでフィルタ係数ｗ_LmL(n)は、第１収音部の指向特性D_LSPB(ω,θ)が式（９）に示す特性を持つように、例えば最小二乗法などを利用して設計される。第２収音部、第３収音部、第４収音部についても同様に、式（１０）から式（１２）のそれぞれの条件を満たすように設計される。Θ、Θ￣はそれぞれ、所望信号の周辺方向（例えば所望信号方向から±１０°程度の範囲内の方向）、それ以外の方向、を示すものとする。また、式（９）〜（１２）に示すＤ_・・・・(ω,θ)は各収音部の指向特性を表わしている。

第１収音部４−１はマイクロホンアレー３Ｌから見たときに、所望音源１の方向で発せられる音のみを強調して収音する。第３収音部はマイクロホンアレー３Ｌから見て、所望音源の方向以外で発せられる音のみを強調して収音する。第２収音部４−２はマイクロホンアレー３Ｒから見て、所望音源１の方向で発せられる音のみを強調して収音する。第４収音部４−４はマイクロホンアレー３Ｒから見て、所望音源１の方向以外で発せられる音のみを強調して収音する。

図５は正面ビームフォーマーとして機能する第５収音部４−５と第６収音部４−６における処理の流れを示している。正面ビームフォーマーにはマイクロホンアレー３Ｌの中心に配置されたマイクロホンで受音された信号x_L(ML/2)(n)と、マイクロホンアレー３Ｒの中心に配置されたマイクロホンで受音された信号x_R(MR/2)(n)が入力され、それぞれフィルタ処理部５１と５２に入力される。フィルタ処理部５１と５２では入力された信号x_L(ML/2)(n)とx_R(MR/2)(n)に、式（１３）と式（１４）に示すようなあらかじめ与えられたフィルタ係数ｗ_C(ML/2)(n)、ｗ_C(MR/2)(n)を畳み込んだ出力x'_L(ML/2)(n)、x'_R(MR/2)(n)を出力する。

ここでフィルタ係数ｗ_C(ML/2)(n)、ｗ_C(MR/2)(n)は位相特性が同じものが望ましく、例えば単一インパルス信号

が用いられる。第５収音部４−５ではフィルタ処理部５１と５２の出力信号x'_L(ML/2)(n)とx'_R(MR/2)(n)を加算部５３に入力する。加算部５３では入力された信号を式（１６）のように加算して、信号y_SC(n)を出力する。これにより第５収音部４−５では、マイクロホンアレー３Ｌとマイクロホンアレー３Ｒの間の中間点から見て、所望音源１の方向で発せられる音のみを強調して収音する。

y_SC(n)＝x'_L(ML/2)(n)＋x'_R(MR/2)(n) （１６）
第６収音部４−６ではフィルタ処理部５１と５２の出力信号x'_L(ML/2)(n)とx'_R(MR/2)(n)を減算部５４に入力する。減算部５４では入力された信号を式（１７）のように減算して、信号y_NC(n)を出力する。したがって第６収音部４−６では、マイクロホンアレー３Ｌとマイクロホンアレー３Ｒの間の中間点から見て、所望音源１の方向以外で発せられる音のみを強調して収音する。
y_NC(n)＝x'_L(ML/2)(n)−x'_R(MR/2)(n) （１７）
図６は音源信号成分推定部７における処理の流れを示している。音源信号成分推定部７に入力される周波数成分Y_SL(ω,l)、Y_NL(ω,l)、Y_SC(ω,l)、Y_NC(ω,l)、Y_SR(ω,l)、Y_NR(ω,l)はそれぞれパワー演算部６１に入力され、信号のパワー値|Y_SL(ω,l)|²、|Y_NL(ω,l)|²、|Y_SC(ω,l)|²、|Y_NC(ω,l)|²、|Y_SR(ω,l)|²、|Y_NR(ω,l)|²が出力され、ベクトル化部６２に入力される。ベクトル化部６２では、入力された第１乃至第６収音部４−１〜４−６の各出力信号のパワー値を式（１８）のようにベクトル形式でまとめた、パワーベクトルY＊(ω,l)を出力する。尚、添字＊付の文字及び式中の大文字はベクトルを表わす。

パワーベクトルY＊(ω,l)は乗算部６３に入力される。乗算部６３のもう一方の入力であるパワー推定行列T＊^＋は、擬似逆行列演算部６４の出力信号である。擬似逆行列演算部６４には式（１９）により定義されるゲイン行列T＊が入力され、その擬似逆行列T＊^＋を出力する。

ゲイン逆行列T＊の各要素は、第５収音部４−５と第６収音部４−６及び第１収音部４−１〜第４収音部４−４に設定されるΘ_x方向またはΘ_x￣方向に対する指向特性のゲインであり、例えば式（２０）から式（２３）に示すような指向特性の周波数および方向に関する平均値を用いる。

α_xは所望音の周辺方向に対する第１、第２、第５収音部４−１、４−２、４−５に設定する指向特性の平均値である。β_xは所望信号の周辺方向に対する第１、第２、第５の収音部４−１、４−２、４−５に設定する指向特性の平均値である。γ_xは所望信号の周辺方向に対する、第３、第４、第６収音部４−３、４−４、４−６に設定する指向特性の平均値である。δ_xは所望信号の周辺方向以外に対する、第３、第４、第６収音部４−３、４−４、４−６に設定する指向特性の平均値である。尚、（２０）〜（２３）式中添字xはR、C、Lの何れかを表わす。

乗算部は式（２４）に示すように入力されたビームフォーマー出力パワーベクトルとパワー推定行列の乗算を周波数成分ごとに行い、推定信号パワーベクトルX＊_opt(ω,l)を出力する。

SN比推定部８２では式（２６）を用いて推定SN比ESNR(ω,l)を計算する。

SN比推定部８２の出力である推定SN比ESNR(ω,l)が利得係数R(ω,l)として出力される。
式（２６）で求めた利得係数R(ω,l)は図８に示すように、雑音成分N_x＝|N_L(ω,l)|²+|N_C(ω,l)|²+|N_R(ω,l)|²と所望信号S_x＝|S(ω,l)|²との関係がN_x＞＞S_xである場合は利得係数R(ω,l)≒０となり、N_x＜＜S_xの場合はR(ω,l)≒１、つまり、所定の最大値となる。利得係数R(ω,l)は周波数領域毎に算出される。従って雑音の混入量が少ない周波数領域では利得係数R(ω,l)は「１」に近い値となり、所望信号成分はそのまま出力される。また雑音の混入量が多い周波数領域では利得係数R(ω,l)は「０」に近い値となり、その周波数領域の信号成分は大きく減衰され、雑音量を抑制する。このように各周波数領域毎に利得係数R(ω,l)を加算部６から与えられる所望信号を主成分とする信号Y_S(ω,l)に乗算することにより、各周波数領域毎に雑音成分が抑圧され、逆周波数領域変換部１０で時間領域に変換された信号のSN比を向上することができる。

ここで本発明により所望音を選択強調した収音が可能になる原理について説明する。各収音部４−１〜４〜６が出力する信号のパワーベクトルY＊(ω,l)の各要素となる、各収音信号の出力パワーは、式（２７）から式（３２）にそれぞれ示すように、マイクロホンアレーが受音した信号X_θ(ω,l)のパワーにその信号の音源方向および周波数に基づく指向特性が乗算された形で近似することができる。ただしここで各音源の発する音は互いに無相関とし、すべてのマイクロホンにおいて音は同レベルで受音されると仮定している。

いま音源の位置を図３に示すように所望音源１とそれ以外の３つの背景雑音源２Ｒ、２Ｃ、２Ｌに分けて考え、信号X_θ(ω,l)はS^(ω,l)、N^_L(ω,l)、N^_C(ω,l)、N^_R(ω,l)のいずれかに含まれるとする。このとき式（９）から式（１２）の範囲の下で設計された各収音部の指向特性はΘまたはΘ￣の角度領域内で一様であると仮定すると、Y＊(ω,l)は式（３３）により表される。本実施例では各角度領域に対する指向特性の代表値として式（２０）から式（２３）により求めた指向特性の平均値を用いている。

以上の関係より、あらかじめ与えられているT＊の擬似逆行列T＊^＋を左側からビームフォーマー出力パワーベクトルY＊(ω,l)にかけることで、X＊(ω,l)の推定値である推定信号パワーベクトルX＊_opt(ω,l)が求められる。

第２の実施例は、実施例１の利得係数算出部８における手順に変更を加えたものである。図９は第２の実施例において用いられる利得係数算出部８の処理手順を示したものである。実施例１における利得係数算出部８との相違点は非線形処理部８３が追加された点である。非線形処理部８３では所望音声と背景雑音の区別を強調するため、入力された推定SN比に０から１の間で変動する非線形関数Z(ω,l)を乗算した計算結果であるR(ω,l)を出力する。ここで非線形関数Z(ω,l)はあらかじめ与えられているもので、ESNR(ω,l)が大きい領域では１または１に近い値を維持し、SN比ESNR(ω,l)が小さい領域では０または０に近い値を維持する関数で、たとえば式（３５）に示すハイポブリックタンジェントや式（３６）に示す対数関数と組み合わせたものなどが用いられる。図１０に非線形関数Z(ω,l)の一例を示す。

ここでρ、νは非線形関数の特性を変化させるパラメータで任意に設定される。これ以外の部分に関しては実施例１と同様であるので説明を省略する。図１０に示した非線形特性によれば、所望音声が優勢な周波数領域ではその周波数成分を強調し、背景雑音が優勢な周波数領域ではその周波数成分を抑圧することができ、本発明によるSN比改善量を向上させる効果がある。

絶対値ベクトルは乗算部６３に入力される。乗算部６３のもう一方の入力である絶対値推定行列T＊^＋は、擬似逆行列演算部６４の出力信号である。擬似逆行列演算部６４は入力されたゲイン行列T＊の擬似逆行列T＊^＋を出力する。ゲイン行列T＊は正面ビームフォーマー部として機能する第５，第６収音部４−５、４−６及びサイドビームフォーマー部として機能する第１乃至第４収音部４−１〜４−４に設けたフィルタ処理部４１（図４参照）において用いられたフィルタ係数から計算される指向特性のゲイン量から式（３８）により定義され、事前に与えられる。

SN比推定部８２では式（４０）を用いて推定SN比ESNR(ω,l)を計算する。

これら以外の部分に関しては第１の実施例と同じであるのでこれ以上の説明を省略する。この第３の実施例によれば実施例１に比べて２乗計算をする必要が無いことから演算量を削減することができる。
なおこの実施例３は実施例２の信号源成分推定部７と利得係数算出部８に対しても適用することができる。図１３は実施例２に本実施例３の変更を加えた場合の利得係数算出部８の構成を示す。

以上説明した本発明による収音装置は全てをハードウェアによって構成することも可能であるが、最も簡素に実現するには上述した各手順をコンピュータが解読可能なプログラム言語によって記述した本発明による収音プログラムを作成し、この収音プログラムをコンピュータにインストールし、コンピュータに収音プログラムを実行させ、コンピュータに収音装置として機能させる実施例が最良である。本発明による収音プログラムはコンピュータが読み取り可能な例えば磁気媒体、CD-ROM、半導体メモリ等の記録媒体に記録され、これらの記録媒体から、或いは通信回線を通じてコンピュータにインストールされる。インストールされた収音プログラムはコンピュータに備えられたCPUにより解読され、コンピュータを収音装置として機能させる。

本発明による収音装置は例えば電話会議システム等のハンズフリー通話装置の分野で活用される。

本発明の概要を説明するための配置図。本発明による収音装置の全体を説明するためのブロック図。本発明に用いる第１〜第６収音部の指向性を説明するための平面図。本発明に用いるサイドビームフォーマー部として機能する第１〜第４収音部の構成を説明するためのブロック図。本発明に用いる正面ビームフォーマー部として機能する第５及び第６収音部の構成を説明するためのブロック図。本発明に用いる音源信号成分推定部の構成を説明するためのブロック図。本発明に用いる利得係数算出部の構成を説明するためのブロック図。図７に示した利得係数算出部で算出した利得係数の例を説明するためのグラフ。図７に示した利得係数算出部の変形例を説明するためのブロック図。図７に示した利得係数算出部で得られる利得係数の特性の一例を説明するためのグラフ。図６に示した音源信号成分推定部の変形例を説明するためのブロック図。図１１に示した音源信号成分推定部で得られた推定値を利用して利得係数を算出する利得係数算出部の構成を説明するためのブロック図。図１２に示した利得係数算出部に図９に示した利得係数算出部を適用した実施例を説明するためのブロック図。本発明の効果を確認するためのシミュレーションの適用例を説明するためのＡは背景雑音源が１個の場合、Ｂは背景雑音源が３個の場合を説明するための配置図。Ａは図１４Ａに示したシミュレーションの効果を説明するための所望音源の信号波形図、Ｂは所望音源信号に背景雑音が重畳した場合の波形図、Ｃは本発明の収音装置で収音処理した効果を表わす波形図。Ａは図１４Ｂに示したシミュレーションの結果を説明するための所望音源の信号波形図、Ｂは所望音源信号に背景雑音が重畳した波形図、Ｃは本発明の収音装置で収音処理した結果を表わす波形図。本発明の効果を説明するためのグラフ。従来技術を説明するためのブロック図。

符号の説明

１所望音源５周波数領域変換部
２背景雑音源６加算部
３Ｌ、３Ｒマイクロホンアレー７音源信号成分推定部
４−１第１収音部８利得係数算出部
４−２第２収音部９乗算部
４−３第３収音部１０逆周波数領域変換部
４−４第４収音部
４−５第５収音部
４−６第６収音部

Claims

第１のマイクロホンアレーの出力信号を利用して前記第１のマイクロホンアレーから所望音源位置を含む角度領域の音を収音する第１収音部と、
前記第１のマイクロホンアレーの出力信号を利用して前記第１のマイクロホンアレーから前記所望音源位置を含まない角度領域の音を収音する第３収音部と、
前記第１のマイクロホンアレーとは異なる位置に配置された第２のマイクロホンアレーの出力信号を利用して前記第２のマイクロホンアレーから前記所望音源位置を含む角度領域の音を収音する第２収音部と、
前記第２のマイクロホンアレーの出力信号を利用して前記第２のマイクロホンアレーから前記所望音源位置を含まない角度領域の音を収音する第４収音部と、
前記第１のマイクロホンアレーの出力信号と前記第２のマイクロホンアレーの出力信号を利用して前記第１のマイクロホンアレーと前記第２のマイクロホンアレーの中間点から前記所望音源位置を含む角度領域の音を収音する第５収音部と、
前記第１のマイクロホンアレーの出力信号と前記第２のマイクロホンアレーの出力信号を利用して前記中間点から前記所望音源位置を含まない角度領域の音を収音する第６収音部と、
前記第１乃至第６収音部で得られた各収音信号により前記所望音源の信号量と、その他の音源の信号量とを推定する音源信号成分推定部と、
前記所望音源の信号量と、前記所望音源の信号量を含む全ての音源の信号量との比から利得係数を求める利得係数算出部と、
前記利得係数算出部で算出した利得係数を所望音源の信号を主成分とする信号に乗算する乗算部と、
を備えることを特徴とする収音装置。
請求項１に記載の収音装置において、
前記第１乃至第６収音部で得られた各収音信号は周波数領域変換手段により周波数領域変換処理され、
前記利得係数は前記周波数領域変換手段で変換された各周波数領域成分毎に算出し、
算出した各周波数領域毎の利得係数を所望音源の信号を主成分とする信号の各対応す
る周波数領域成分に乗算し、
前記利得係数を乗算した前記周波数領域成分を逆周波数領域変換手段により時間領域信号に変換処理して出力することを特徴とする収音装置。
請求項１又は２の何れかに記載の収音装置において、
前記信号量は信号のパワー値であることを特徴とする収音装置。
請求項１又は２の何れかに記載の収音装置において、
前記信号量は信号の絶対値であることを特徴とする収音装置。
請求項１乃至４の何れかに記載の収音装置において、
前記利得係数算出部で算出する利得係数は前記所望音源の信号量に対して、前記その他の音源の信号量が無視できる程度に微少値である場合、所定の最大値で与えられ、前記その他の音源の信号量に対して、前記所望音源の信号量が無視できる程度に微少値である場合は０に近い値で与えられることを特徴とする収音装置。
請求項１乃至５の何れかに記載の収音装置において、
前記利得係数算出部の利得係数算出特性を、前記その他の音源の信号量が前記所望音源の信号量より小さい領域では前記利得係数の値を前記所定の最大値または最大値に近い値に維持させ、前記その他の音源の信号量が前記所望音源の信号量より大きい領域では前記利得係数の値を０または０に近い値に維持させる変化特性を備えることを特徴とする収音装置。
コンピュータが解読可能なプログラム言語によって記述され、コンピュータを請求項１
乃至６の何れかに記載の収音装置として機能させるプログラム。
コンピュータが読み取り可能な記録媒体によって構成され、この記録媒体に請求項７に記載のプログラムを記録した記録媒体。