以下、本発明の一実施の形態について図に基づいて説明する。なお、以下では、(A)第1の実施の形態の構成例、(B)第1の実施の形態の動作、(C)第1の実施の形態の実測結果、(D)第2の実施の形態の構成例、(E)第2の実施の形態の動作、(F)変形実施の態様の順に説明する。
(A)第1の実施の形態の構成例
図1は、本発明の第1の実施の形態の音声信号処理装置の構成例を示すブロック図である。この図に示すように、本発明の音声信号処理装置は、マイクロフォン10,11、ディレイ回路13〜17、FIR(Finite Impulse Response)回路18〜22、減算回路23〜27を主要な構成要素としている。なお、本発明の音声信号処理方法、および、音声信号処理プログラムについては、音声信号処理装置の動作として説明する。
ここで、マイクロフォン11,12は、相互に近接して配置され(例えば、1cm以下の距離を隔てて配置され)、音源からの音を感受して対応する音声信号にそれぞれ変換して出力する。この実施の形態では、第1のマイクロフォンとしてのマイクロフォン11は、無指向性マイクロフォンとされ、また、第2のマイクロフォンとしてのマイクロフォン12は、双指向性マイクロフォンとされている。
無指向性マイクロフォン11の指向特性を図2(A)に示す。無指向性マイクロフォン11は、全角度範囲に対して一定の感度を有するとともに、一定の位相特性を有する。なお、無指向性マイクロフォン11としては、圧力型マイクロフォンがあり、ダイナミック型マイクロフォン、コンデンサ型マイクロフォン、エレクトレットコンデンサ型マイクロフォンなどで実現される。
圧力型マイクロフォンは、振動板の正面側が開放され、背面側がハウジングで密閉された構造を有する。圧力型マイクロフォンの場合、背面側が密閉されているので、振動板の背面側の気圧は一定となり、正面側の気圧の変化によって振動板が動かされる。これにより、圧力型マイクロフォンは、マイクロフォンの配置場所における気圧の変化に従った波形信号を出力する。また、マイクロフォンの周囲の気圧変化は、マイクロフォンから見た音源の方向によらないので、音源の方向に拘わらず、感度が一定であり、出力信号の位相も一定である。
一方、双指向性マイクロフォン12の指向特性を図2(B)に示す。双指向性マイクロフォン12では、図中Aの角度を境に、正面側の180度の角度範囲から入射した音波に対する出力信号の位相と、背面側の180度の角度範囲から入射した音波に対する出力信号の位相とは、180度異なる。なお、双指向性マイクロフォンとしては、速度型マイクロフォンがあり、リボン型マイクロフォンなどで実現される。
速度型マイクロフォンは、振動板の周囲が開放された構造を有する。振動板の周囲が開放されている場合、振動板の大きさが音波の波長に対して十分小さければ、振動板の正面側の気圧と背面側の気圧は同じになり、振動板は、気圧の変化ではなく、空気の直接的な動きに従って動く。したがって、速度型マイクロフォンでは、振動板の正面側から音波が入射する場合と、振動板の背面側から音波が入射する場合とでは、振動板の振動方向が逆になる。これにより、速度型マイクロフォンでは、マイクロフォンから見た音源の方向が正面側にある場合と背面側にある場合とでは、出力信号の位相が反転する。
なお、マイクロフォン11,12から出力された信号(アナログ信号)は図示せぬA/D(Analog to Digital)変換回路によってディジタル信号に変換され、後段の回路に供給される。
ディレイ回路13〜17は、ディレイ回路13〜17のそれぞれと対になるFIR回路18〜22に対応する所定の遅延量を有し、入力された信号を所定の遅延量だけ遅延して出力する。
FIR回路18〜22は、適応フィルタを構成する。FIR回路18〜22は、図3に示すように、入力された信号を遅延する複数の遅延回路30と、それぞれの遅延回路30から出力される信号に所定の係数(h0〜hn)を乗算する複数の係数回路31と、係数回路31から出力された信号を加算する加算回路32と、誤差信号に基づいてそれぞれの係数回路31の係数を設定する制御回路33とを有している。入力信号は、遅延回路30のそれぞれによって遅延されて次段の遅延回路30に順次入力される。遅延回路30のそれぞれから出力された信号は、係数回路31によって係数h0〜hnをそれぞれ乗算され、出力される。なお、本実施の形態では、FIR回路18〜21については、n=1000程度に設定され、FIR回路22については、n=500〜600程度に設定されている。なお、これ以外の設定であってもよいことはいうまでもない。
加算回路32は、係数回路31からそれぞれ出力された信号を加算して出力する。制御回路33は、FIR回路18〜22の後段に存在する減算回路23〜27から供給される誤差信号を入力し、当該誤差信号の実効値が最小となるように各係数回路31の係数を設定する。なお、図1では、減算回路23〜27からFIR回路18〜22にフィードバックされている破線の信号が誤差信号である。
図1に戻る。減算回路23〜27は、ディレイ回路13〜17の出力信号からFIR回路18〜22の出力を減算し、得られた信号を次段の回路に供給するとともに、当該信号を誤差信号として、FIR回路18〜22にそれぞれ供給する。
前述したように、FIR回路18〜22は、適応フィルタを構成する。FIR回路18〜22には、ディレイ回路13〜17から制御の目標となる目標信号がそれぞれ与えられる。また、減算回路23〜27からは、目標信号との誤差を示す誤差信号がそれぞれ与えられる。FIR回路18〜22は、入力信号が目標信号に近づくように、すなわち、誤差信号の実効値が最小となるように、内部の係数回路31の値を設定する。
なお、ディレイ回路13〜17、FIR回路18〜22、および、減算回路23〜27は、例えば、DSP(Digital Signal Processor)によって構成されている。
(B)第1の実施の形態の動作
つぎに、第1の実施の形態の動作について説明する。
図示せぬ音源は、マイクロフォン11,12の略正面に配置される。この図示せぬ音源から放射された音は、マイクロフォン11,12に直接音として入射されるとともに、壁等によって反射されて反射音として入射される。ここで、直接音をSDとし、反射音をSRとする。直接音SDは、音源からの音が直接入射されるので、音源と略同一の波形を有する音となる。一方、反射音SRは、音源から放射され複数の経路を経由して到達した音が重畳されたものであるので、様々な振幅および位相の音が重畳された状態となっている。マイクロフォン11,12は直接音SDおよび反射音SRをそれぞれ対応する電気信号に変換して出力する。なお、マイクロフォン11は図2(A)に示す無指向性を有するので、音の到来方向に拘わらず一定の位相の音声信号を出力する。一方、マイクロフォン12は図2(B)に示す双指向性を有するので、マイクロフォン12の正面範囲から到来した音と、背面範囲から到来した音とを比較すると、位相が180度異なる音声信号を出力する。また、双指向性マイクロフォン12では、図2(B)に示すように、音の到来方向に応じて感度が異なる。したがって、マイクロフォン12から出力される音声信号は、音の到来方向に応じた振幅および位相を有する。音源は、マイクロフォン11,12の正面に配置されているので、直接音SDはマイクロフォン11,12の正面(図2(A),(B)における上側となる方向)から入射される。他方、反射音SRは様々な方向からマイクロフォン11,12に入射されるので、マイクロフォン12では位相および振幅が到来方向によって異なる。
マイクロフォン11から出力された音声信号は、ディレイ回路13とFIR回路20にそれぞれ供給される。また、マイクロフォン12から出力された音声信号は、ディレイ回路16と第1の適応フィルタとしてのFIR回路18にそれぞれ供給される。
ディレイ回路13は、マイクロフォン11から出力された音声信号をFIR回路18に対応した所定の時間だけ遅延して出力する。FIR回路18は、マイクロフォン12の出力に対して、図3に示す回路により適応フィルタリング処理を施して出力する。
減算回路23は、ディレイ回路13の出力信号からFIR回路18の出力信号を減算し、得られた信号を次段の第2の適応フィルタとしてのFIR回路19に供給するとともに、FIR回路18に誤差信号として供給する。
FIR回路18は、減算回路23から供給された信号を誤差信号として入力し、当該誤差信号の実効値が最小となるように、係数回路の係数値を設定する。具体的には、図3に示す制御回路33は、例えば、LMS(Least Mean Square)法に基づいて、ディレイ回路13から出力されたマイクロフォン11の出力信号を目標信号とし、減算回路23の出力信号を誤差信号とし、誤差信号の実効値が最小となるようにFIR回路18の係数h0〜hnを設定する。
ここで、ディレイ回路13から出力される音声信号には、マイクロフォン11から出力された、直接音SDと反射音SRとに対応する音声信号が含まれている。FIR回路18に入力される音声信号は、マイクロフォン12の出力信号であり、同様に、直接音SDと反射音SRとに対応する音声信号が含まれている。マイクロフォン11から出力される反射音SRに対応する信号が反射音SRの入射角によらず振幅が一定であるのに対し、マイクロフォン12から出力される反射音SRに対応する信号は図2(B)に示すように、反射音SRの入射角によって振幅が変化する。
FIR回路18は、減算回路23から出力される誤差信号が最小となるように係数h0〜hnを設定するが、これにより、マイクロフォン12から出力される音声信号の振幅および位相が、ディレイ回路13から出力される音声信号(マイクロフォン11から出力される音声信号が遅延された信号)の振幅および位相と略等しくなるように調整される。一般的に、直接音SDと反射音SRの大きさを比較すると、SD>SRの関係が成立する。また、反射音SRに対応する音声信号は、マイクロフォン11,12では位相および振幅がその入射角に応じて異なっている。したがって、FIR回路18は、誤差信号の実効値を最小とするために、マイクロフォン12から出力される直接音SDに対応する音声信号が、ディレイ回路13から出力される直接音SDに対応する音声信号と振幅および位相が略等しくなるように調整する。
減算回路23は、ディレイ回路13の出力信号から、FIR回路18の出力信号を減算した結果を出力する。前述のように、FIR回路18の出力信号は、直接音SDに対応する音声信号と振幅および位相が略等しくなるように調整されているので、減算回路23からは反射音SRに対応する音声信号が残差として出力される。減算回路23から出力された信号は、FIR回路18に誤差信号として供給されるとともに、次段のFIR回路19に供給される。
FIR回路19は、減算回路24から出力される誤差信号が最小となるように係数h0〜hnを設定するが、これにより、減算回路23から出力される音声信号の振幅および位相がディレイ回路14から出力されるマイクロフォン11から出力される音声信号の振幅および位相と略等しくなるように調整される。ここで、減算回路23から出力される信号は、反射音SRに対応する信号を主に含んだ信号である。一方、ディレイ回路14から出力される音声信号は、マイクロフォン11から出力される信号の遅延信号であるので、直接音SDに対応する信号と、反射音SRに対応する信号を含んでいる。FIR回路19は、減算回路23から供給された反射音SRに対応する音声信号を主に含む信号の振幅および位相を調整し、ディレイ回路14から出力される信号に含まれている反射音SRに対応する音声信号の振幅および位相と略等しくなるようにする。減算回路24は、ディレイ回路14の出力信号からFIR回路19の出力信号を減算して出力する。この結果、減算回路24から出力される音声信号は、反射音SRに対応する音声信号が減衰され、直接音SDに対応する音声信号を主に含む信号となる。減算回路24から出力された信号は、次段のディレイ回路15に供給されるとともに、誤差信号としてFIR回路19に供給される。
ディレイ回路16は、マイクロフォン12から出力された音声信号を第4の適応フィルタとしてのFIR回路20に対応した所定の時間だけ遅延して出力する。FIR回路20は、マイクロフォン11の出力に対して、図3に示す回路によりフィルタリング処理を施して出力する。
減算回路25は、ディレイ回路16の出力信号からFIR回路20の出力信号を減算し、得られた信号をFIR回路20に誤差信号として供給するとともに、次段の第5の適応フィルタとしてのFIR回路21に供給する。
FIR回路20は、減算回路25から出力される誤差信号が最小となるように係数h0〜hnを設定するが、これにより、マイクロフォン11から出力される音声信号の振幅および位相が、ディレイ回路16から出力される音声信号(マイクロフォン12から出力される音声信号が遅延された信号)の振幅および位相と略等しくなるように調整される。前述の場合と同様に、直接音SDと反射音SRの大きさを比較すると、SD>SRの関係が成立する。また、反射音SRに対応する音声信号は、マイクロフォン11,12では位相および振幅がその入射角に応じて異なっている。したがって、FIR回路20は、誤差信号の実効値を最小とするために、マイクロフォン11から出力される直接音SDに対応する音声信号が、ディレイ回路16から出力される直接音SDに対応する音声信号と振幅および位相が略等しくなるように調整する。
減算回路25は、ディレイ回路16の出力信号から、FIR回路20の出力信号を減算した結果を出力する。前述のように、FIR回路20の出力信号は、直接音SDに対応する音声信号と振幅および位相が略等しくなるように調整されているので、減算回路25からは反射音SRに対応する音声信号が残差として出力される。
FIR回路21は、減算回路26から出力される誤差信号が最小となるように係数h0〜hnを設定するが、これにより、減算回路25から出力される音声信号の振幅および位相がディレイ回路17から出力されるマイクロフォン12から出力される音声信号の振幅および位相と略等しくなるように調整される。ここで、減算回路25から出力される信号は、反射音SRに対応する信号を主に含んだ信号である。一方、ディレイ回路17から出力される音声信号は、マイクロフォン12から出力される信号の遅延信号であるので、直接音SDに対応する信号と、反射音SRに対応する信号を含んでいる。FIR回路21は、減算回路25から供給された反射音SRに対応する音声信号を主に含む信号の振幅および位相を調整し、ディレイ回路17から出力される信号に含まれている反射音SRに対応する音声信号の振幅および位相と略等しくなるようにする。減算回路26は、ディレイ回路17の出力信号からFIR回路21の出力信号を減算して出力する。この結果、減算回路26から出力される音声信号は、反射音SRに対応する音声信号が減衰され、直接音SDに対応する音声信号を主に含む信号となる。減算回路26から出力された信号は、第3の適応フィルタとしてのFIR回路22に供給される。
FIR回路22は、ディレイ回路15から出力された信号を目標信号とし、減算回路27から出力された信号を誤差信号として、誤差信号の実効値が最小値となるように、係数h0〜hnを設定する。ここで、ディレイ回路15に入力される信号は、マイクロフォン11の出力信号から反射音SRに対応する音声信号が減算された信号である。また、FIR回路22に入力される信号は、マイクロフォン12の出力信号から反射音SRに対応する音声信号が減算された信号である。FIR回路22は、減算回路27から出力される誤差信号の実効値が最小となるように、係数h0〜hnを設定する。これにより、FIR回路22から出力される信号は、ディレイ回路15から出力される信号の主要成分である直接音SDと振幅および位相が略同じとなった状態で出力される。また、減算回路26から出力される信号は、直接音SDを主に含む信号であるので、FIR回路22から出力される信号には反射音SRに対応する音声信号が殆ど含まれていない。
したがって、例えば、ディレイ回路15から出力される信号V1と、FIR回路22から出力される信号V2とを加算することにより、反射音SRに対応する信号が少なく、かつ、マイクロフォン11,12の正面方向に配置された音源からの直接音SDが強調された信号を得る。
(C)第1の実施の形態の実測結果
つぎに、第1の実施の形態の実測結果について説明する。図4は、測定環境を説明する図である。この例では、無響箱50の略中央にマイクロフォン11,12が配置されている。また、マイクロフォン11,12の正面には音源となるスピーカ40が配置されている。なお、無響箱50は、例えば、くさび形状を有するグラスウールが内部の壁面に多数配置され、可聴帯域の音を吸収することで、反射音を生じない特性を有している。また、スピーカ40からは、例えば、所定の話者が発話した音声等が放射される。
図5は比較対象となる回路を示す図である。この例では、図1に示す回路から、反射音を減衰させる処理に関する部分(ディレイ回路13,14,16,17、FIR回路18〜21、および、減算回路23〜26)を除外している。なお、ディレイ回路15、減算回路27、および、FIR回路22については、図1の場合と同様である。図5の回路では、マイクロフォン11から出力された音声信号を目標信号とし、マイクロフォン12から出力された音声信号に対してFIR回路22が適応フィルタリング処理を施し、減算回路27から出力される誤差信号が最小となるように係数h0〜hnが設定される。
図6は、図4に示す測定環境における実測結果を示す図である。すなわち、図6(A)は、図4における環境下において、図5に示す回路から出力されるV1を横軸に、V2を縦軸に対応付けし、各サンプル点を座標軸上にプロットしたものである。また、図6(B)は、同様にして、図1に示す回路の測定結果を示す図である。
2つの信号V1,V2をそれぞれ横軸および縦軸に対応付けして、各サンプル点を座標軸上にプロットした場合、各サンプル点においてV1=V2である場合には、プロットされた点は、座標軸上のY=Xの直線上を移動する。図6(A),(B)の例では、プロットされた点はY=Xの直線上に略集中していることから、いずれの回路の場合も各サンプル点においてV1=V2が略成立していると言える。つまり、図4に示す測定環境下では、反射音が存在しないことから、そのような場合には、図1と図2の回路では有意な差は生じない。
図7(A),(B)は、反射音が存在する環境下における実測結果を示している。すなわち、図8に示すように、無響箱50の内側に音を反射する板状の部材(例えば、ベニア、段ボール等)によって反射壁51を設けた状態で測定している。なお、図8では内部壁の内側のみに反射壁51を設けているが、実際にはマイクロフォン11,12の周辺部分にも反射壁を配置している。これにより、スピーカ40から放射された音は、反射壁51その他によって反射され、その一部がマイクロフォン11,12に反射音SRとして入射される。
図7(A)は、図5に示す回路による測定結果を示している。この例では、プロットされた点は、直線Y=Xから外れた位置に多く存在している。したがって、各サンプル点において、V1=V2の関係が成立していない。これは、振幅および位相が異なる複数の反射音SRの存在により、直接音SDが擾乱されているものと考えられる。
図7(B)は、図1に示す回路による測定結果を示している。この例では、プロットされた点は、直線Y=Xの近傍に存在している。したがって、各サンプル点において、V1=V2の関係が略成立している。すなわち、振幅および位相が異なる複数の反射音SRが減衰され、直接音SDが有効に抽出されていると考えられる。
図7(A),(B)の比較から、図1の回路では、反射音SRの成分を減衰させることにより、直接音SDの成分を有効に抽出していることが分かる。
図9は、図4と同様の測定環境において、無響箱50の代わりに実車を使用した実測結果を示している。すなわち、図9(A)は、実車において図5に示す回路を用いて測定した結果を示し、図9(B)は、実車において図1に示す回路を用いて測定した結果を示している。実車の場合、フロントガラス、サイドガラス、リアガラス等の音を反射しやすいガラス群が存在する。また、ドア、天井、床等の壁面には、クッション性を有する部材が使用されているが、音の吸収特性は、無響箱50のそれよりも劣っている。また、前述したガラス群および壁面は様々な方向に向いていることから、音を反射する方向も一定ではない。このため、実車の場合、図8の場合よりも反射音の特性は複雑であると考えられる。
図9(A)の例では、このような実車の複雑な反射音の特性により、プロットされた点は直線Y=X上から大きく外れた位置に不規則に存在している。
図9(B)の例では、直線Y=Xの近傍にプロットされた点が集中していることから、図1に示す回路では、前述した複雑な反射音を効率良く減衰していると言える。
以上から、図1に示す回路は、効率良く反射音を減衰し、直接音を選択的に抽出していることが分かる。
(D)第2の実施の形態の構成例
つぎに、本発明の第2の実施の形態について説明する。
図10は、本発明の第2の実施の形態の構成例を示す図である。この図において、図1と対応する部分には同一の符号を付してその説明を省略する。図10の例では、図1の場合と比較して、FIR回路20,21および減算回路25,26が除外されており、マイクロフォン12から出力された音声信号は、ディレイ回路16,17を経由して、FIR回路22に直接供給されている。それ以外の構成は、図1の場合と同様であるので、詳細な説明は省略する。
(E)第2の実施の形態の動作
つぎに、第2の実施の形態の動作について説明する。
図10の回路の場合も、マイクロフォン11,12に対して、音源からの直接音と、壁等によって反射された反射音とが入射される。マイクロフォン11,12は、これらの入射音に対応する電気信号を生成して出力する。マイクロフォン11から出力された音声信号はディレイ回路13に供給される。また、マイクロフォン12から出力された音声はディレイ回路16とFIR回路18にそれぞれ供給される。
ディレイ回路13はマイクロフォン11の出力信号を遅延し、ディレイ回路14と減算回路23に供給する。減算回路23は、ディレイ回路13によって遅延されたマイクロフォン11の出力信号からFIR回路18の出力信号を減算し、得られた結果を次段のFIR回路19に供給するとともに、FIR回路18に誤差信号として供給する。
FIR回路18は、減算回路23から出力される誤差信号の実効値が最小となるように係数h0〜hnを設定する。ここで、ディレイ回路13から出力される音声信号には、マイクロフォン11から出力された、直接音SDと反射音SRとに対応する音声信号が含まれている。FIR回路18に入力される音声信号は、マイクロフォン12の出力信号であり、同様に、直接音SDと反射音SRとに対応する音声信号が含まれている。マイクロフォン11から出力される反射音SRに対応する信号が反射音SRの入射角によらず振幅が一定であるのに対し、マイクロフォン12から出力される反射音SRに対応する信号は、図2(B)に示すように、反射音SRの入射角によって振幅が変化する。
FIR回路18は、減算回路23から出力される誤差信号が最小となるように係数h0〜hnを設定するが、これにより、マイクロフォン12から出力される音声信号の振幅および位相が、ディレイ回路13から出力される音声信号(マイクロフォン11から出力される音声信号が遅延された信号)の振幅および位相と略等しくなるように調整される。一般的に、直接音SDと反射音SRの大きさを比較すると、SD>SRの関係が成立する。また、反射音SRに対応する音声信号は、マイクロフォン11,12では位相および振幅がその入射角に応じて異なっている。したがって、FIR回路18は、誤差信号の実効値を最小とするために、マイクロフォン12から出力される直接音SDに対応する音声信号が、ディレイ回路13から出力される直接音SDに対応する音声信号と振幅および位相が略等しくなるように調整する。
減算回路23は、ディレイ回路13の出力信号から、FIR回路18の出力信号を減算した結果を出力する。前述のように、FIR回路18の出力信号は、直接音SDに対応する音声信号と振幅および位相が略等しくなるように調整されているので、減算回路23からは反射音SRに対応する音声信号が残差として出力される。減算回路23から出力された信号は、次段のFIR回路19へ供給されるとともに、FIR回路18に誤差信号として供給される。
FIR回路19は、減算回路24から出力される誤差信号が最小となるように係数h0〜hnを設定するが、これにより、減算回路23から出力される音声信号の振幅および位相がディレイ回路14から出力されるマイクロフォン11の出力信号の振幅および位相と略等しくなるように調整される。ここで、減算回路23から出力される信号は、反射音SRに対応する信号を主に含んだ信号である。一方、ディレイ回路14から出力される音声信号は、マイクロフォン11から出力される信号の遅延信号であるので、直接音SDに対応する信号と、反射音SRに対応する信号を含んでいる。FIR回路19は、減算回路23から供給された反射音SRに対応する音声信号を主に含む信号の振幅および位相を調整し、ディレイ回路14から出力される信号に含まれている反射音SRに対応する音声信号の振幅および位相と略等しくなるようにする。減算回路24は、ディレイ回路14の出力信号からFIR回路19の出力信号を減算して出力する。この結果、減算回路24から出力される音声信号は、反射音SRに対応する音声信号が減衰され、直接音SDに対応する音声信号を主に含む信号となる。減算回路24から出力された信号は、ディレイ回路15に供給される。
マイクロフォン12から出力された音声信号は、ディレイ回路16,17を経由し、ディレイ回路13,14と同じ遅延量の遅延をそれぞれ与えられた後、FIR回路22に供給される。FIR回路22は、減算回路27から出力される誤差信号が最小となるように係数h0〜hnを設定するが、これにより、FIR回路22から出力される音声信号の振幅および位相が、ディレイ回路15から出力される音声信号(目標信号)の振幅および位相と略等しくなるように調整される。ここで、減算回路24から出力される信号は、前述したように反射音SRに対応する音声信号が減衰され、直接音SDに対応する音声信号を主に含む信号であるので、FIR回路22は、ディレイ回路17から出力された音声信号の直接音SDの振幅および位相がディレイ回路15から出力される直接音SDに対応する信号の振幅および位相と等しくなるように調整する。また、FIR回路22は、ディレイ回路17の出力信号に含まれている反射音SRに対応する音声信号が減衰するように調整する。これにより、FIR回路22から出力される信号は、ディレイ回路15から出力される信号に含まれる直接音SDに対応する信号の振幅および位相が略同じであり、かつ、反射音SRが減衰された信号となる。
ディレイ回路15から出力された信号V1と、FIR回路22から出力された信号V2を、例えば、加算することにより、反射音SRが減衰され、直接音SDを主に含む信号を得ることができる。
(F)変形実施の態様
なお、上述の実施の形態は、本発明の好適な例であるが、本発明は、これらに限定されるものではなく、本発明の要旨を逸脱しない範囲において、種々の変形、変更が可能である。
例えば、以上の各実施の形態では、ディレイ回路13〜17、FIR回路18〜22、および、減算回路23〜27は、DSPによって構成するようにしたが、例えば、CPU、ROM、RAM等を有するマイクロコンピュータによって構成したり、アナログ回路またはディジタル回路によって構成したりすることも可能である。マイクロコンピュータによって実現する場合には、例えば、ROMに対して、上述した処理を実現するためのプログラムを記憶しておき、当該プログラムを実行することにより、ソフトウエア資源としてのプログラムと、ハードウエア資源としてのCPUその他が協働することにより、図1,10に示す機能ブロックを実現する。なお、当該プログラムは、ROM等に格納された状態で出荷されてもよいし、出荷された後にROM等に格納されるようにしてもよい。なお、出荷後に格納する場合には、例えば、CD−ROM等の記憶媒体に記憶した形で配布し、配布されたCD−ROMからプログラムを読み込んでROMに格納したり、例えば、インターネット等のネットワークを介して配布し、格納したりするようにしてもよい。
また、以上の各実施の形態では、マイクロフォン11としては無指向性マイクロフォンを使用し、マイクロフォン12としては双指向性マイクロフォンを使用するようにしたが、これらを逆に用いるようにしてもよい。すなわち、マイクロフォン11としては双指向性マイクロフォンを使用し、マイクロフォン12としては無指向性マイクロフォンを使用することも可能である。あるいは、これら以外の指向性を有するマイクロフォンを使用することも可能である。マイクロフォン11,12としては指向性が異なる1組のマイクロフォンを使用すればよい。
また、以上の各実施の形態では、マイクロフォン11,12として指向特性が異なるマイクロフォンを使用したが、指向特性が同じマイクロフォンを使用することも可能である。例えば、マイクロフォン11,12として、単一指向性のマイクロフォンを使用し、配置方向を異ならせることにより、「指向性を異ならせる」ようにしてもよい。具体的には、マイクロフォン11については音源に向けて配置し、マイクロフォン12については音源とは反対の方向に向けて配置するようにすればよい。あるいは、マイクロフォン12については音源に向けて配置し、マイクロフォン11については音源とは反対の方向に向けて配置するようにすればよい。これら以外にも、例えば、一方のマイクロフォンを音源からX(0≦X≦360)度外れた方向に向けて配置し、他方のマイクロフォンを音源からY(Y≠X)度外れた方向に向けて配置するようにしてもよい。
また、以上の各実施の形態では、適応フィルタの適応アルゴリズムとしては、LMS法を用いるようにしたが、これ以外のアルゴリズム(例えば、RLS(Recursive Least Squares)法)を使用してもよい。
また、以上の各実施の形態では、適応フィルタとしては、FIRフィルタを用いるようにしたが、例えば、IIR(Infinite Impulse Response)フィルタを用いるようにしてもよい。その場合、適応フィルタの適応アルゴリズムとしては、例えば、IIR−LMSアルゴリズムを用いることができる。
また、第2の実施の形態では、ディレイ回路16,17を2つ設けるようにしたが、これらの合計の遅延量を有するディレイ回路を1つ設けるようにしてもよい。
また、上述した各実施の形態の音声信号処理装置を、例えば、車載のナビゲーション装置等に搭載し、ナビゲーション装置の音声認識処理部の前処理装置として用いることが可能である。そのような場合、マイクロフォン11,12を、話者(例えば、運転者)の方向に向けて配置し、ディレイ回路15およびFIR回路22の出力信号V1,V2を加算し、得られた信号を音声認識処理部へ供給する。これにより、話者以外から生じる音の影響を少なくすることができるとともに、話者の音声が、例えば、車内で反射されることにより生ずる反射音の影響を低減することができる。このため、音声認識の精度を向上させることができる。