JP4893317B2 - 音声信号処理装置、音声信号処理方法、および、音声信号処理プログラム - Google Patents

音声信号処理装置、音声信号処理方法、および、音声信号処理プログラム Download PDF

Info

Publication number
JP4893317B2
JP4893317B2 JP2007001529A JP2007001529A JP4893317B2 JP 4893317 B2 JP4893317 B2 JP 4893317B2 JP 2007001529 A JP2007001529 A JP 2007001529A JP 2007001529 A JP2007001529 A JP 2007001529A JP 4893317 B2 JP4893317 B2 JP 4893317B2
Authority
JP
Japan
Prior art keywords
audio signal
microphone
signal
circuit
output
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2007001529A
Other languages
English (en)
Other versions
JP2008172334A (ja
Inventor
郁広 松本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
JVCKenwood Corp
Original Assignee
JVCKenwood Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by JVCKenwood Corp filed Critical JVCKenwood Corp
Priority to JP2007001529A priority Critical patent/JP4893317B2/ja
Publication of JP2008172334A publication Critical patent/JP2008172334A/ja
Application granted granted Critical
Publication of JP4893317B2 publication Critical patent/JP4893317B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
  • Circuit For Audible Band Transducer (AREA)

Description

本発明は、音声信号処理装置、音声信号処理方法、および、音声信号処理プログラムに関する。
特許文献1には、異なる指向特性を有するマイクロフォンを近接させて配置し、それぞれのマイクロフォンから得られる音声信号に対して、位相をシフトする処理および相関信号を抽出する処理を施すことにより、特定の角度範囲からの音声のみを選択的に集音するマイクロフォン装置が開示されている。
特開平2004−72630号公報(特許請求の範囲、要約書)
ところで、特許文献1に示す技術では、話者が発話した直接音が2つのマイクロフォンに入射されることが主に想定されている。
しかしながら、実際の使用環境においては、例えば、壁等によって反射された反射音も直接音とともにマイクロフォンに入射されることが一般的である。そのような反射音が直接音とともに存在している場合には、目的となる音声を効率良く抽出できない場合があるという問題点がある。
本発明は、上記の事情に基づきなされたもので、その目的とするところは、直接音のみならず反射音が存在する環境下でも目的の音を選択的に抽出することが可能な音声信号処理装置、音声信号処理方法、および、音声信号処理プログラムを提供することを目的とする。
上述の目的を達成するため、本発明の音声信号処理装置は、第1のマイクロフォンと、第1のマイクロフォンと近接して配置され、第1のマイクロフォンとは指向性を異ならせた第2のマイクロフォンと、第1のマイクロフォンから出力された第1の音声信号を目標信号とし、第2のマイクロフォンから出力された第2の音声信号に対して適応フィルタリング処理を施す第1の適応フィルタと、第1の音声信号を目標信号とし、第1の適応フィルタの誤差信号に対して適応フィルタリング処理を施す第2の適応フィルタと、第2の適応フィルタの誤差信号を目標信号とし、第2の音声信号に対して適応フィルタリング処理を施す第3の適応フィルタと、を有する。
また、他の発明の音声信号処理装置は、前述の発明に加えて、第2の音声信号を目標信号とし、第1の音声信号に対して適応フィルタリング処理を施す第4の適応フィルタと、第2の音声信号を目標信号とし、第4の適応フィルタの誤差信号に対して適応フィルタリング処理を施す第5の適応フィルタとをさらに有し、第3の適応フィルタは、第5の適応フィルタの誤差信号に対して適応フィルタリング処理を施すようにしている。
また、他の発明の音声信号処理装置は、前述の発明に加えて、第1のマイクロフォンが無指向性マイクロフォンであり、第2のマイクロフォンが双指向性マイクロフォンであるようにしている。
また、他の発明の音声信号処理装置は、前述の発明に加えて、第1および第2のマイクロフォンはともに単一指向性マイクロフォンであり、それぞれ異なる方向を向けて配置されている。
また、他の発明の音声信号処理装置は、前述の発明に加えて、各適応フィルタに供給される目標信号は、それぞれの適応フィルタに応じた遅延量を有するディレイ回路を通過した後に目標信号として与えられるようにしている。
また、他の発明の音声信号処理装置は、前述の発明に加えて、第1および第2のマイクロフォンには、目的となる音が直接音として入射され、適応フィルタ群は、直接音以外の反射音を除去するように機能するようにしている。
また、本発明の音声信号処理方法は、第1のマイクロフォンから出力された第1の音声信号を目標信号とし、第1のマイクロフォンと近接して配置され、第1のマイクロフォンとは指向性を異ならせた第2のマイクロフォンから出力された第2の音声信号に対して適応フィルタリング処理を施す第1の適応フィルタリングステップと、第1の音声信号を目標信号とし、第1の適応フィルタリングステップにおいて生成された誤差信号に対して適応フィルタリング処理を施す第2の適応フィルタリングステップと、第2の適応フィルタリングステップにおいて生成された誤差信号を目標信号とし、第2の音声信号に対して適応フィルタリング処理を施す第3の適応フィルタリングステップと、を有する。
また、本発明の音声信号処理プログラムは、第1のマイクロフォンから出力された第1の音声信号を目標信号とし、第1のマイクロフォンと近接して配置され、第1のマイクロフォンとは指向性を異ならせた第2のマイクロフォンから出力された第2の音声信号に対して適応フィルタリング処理を施す第1の適応フィルタ、第1の音声信号を目標信号とし、第1の適応フィルタの誤差信号に対して適応フィルタリング処理を施す第2の適応フィルタ、第2の適応フィルタの誤差信号を目標信号とし、第2の音声信号に対して適応フィルタリング処理を施す第3の適応フィルタ、としてコンピュータを機能させる。
本発明によれば、直接音のみならず反射音が存在する環境下でも目的の音を選択的に抽出することが可能な音声信号処理装置、音声信号処理方法、および、音声信号処理プログラムを提供することができる。
以下、本発明の一実施の形態について図に基づいて説明する。なお、以下では、(A)第1の実施の形態の構成例、(B)第1の実施の形態の動作、(C)第1の実施の形態の実測結果、(D)第2の実施の形態の構成例、(E)第2の実施の形態の動作、(F)変形実施の態様の順に説明する。
(A)第1の実施の形態の構成例
図1は、本発明の第1の実施の形態の音声信号処理装置の構成例を示すブロック図である。この図に示すように、本発明の音声信号処理装置は、マイクロフォン10,11、ディレイ回路13〜17、FIR(Finite Impulse Response)回路18〜22、減算回路23〜27を主要な構成要素としている。なお、本発明の音声信号処理方法、および、音声信号処理プログラムについては、音声信号処理装置の動作として説明する。
ここで、マイクロフォン11,12は、相互に近接して配置され(例えば、1cm以下の距離を隔てて配置され)、音源からの音を感受して対応する音声信号にそれぞれ変換して出力する。この実施の形態では、第1のマイクロフォンとしてのマイクロフォン11は、無指向性マイクロフォンとされ、また、第2のマイクロフォンとしてのマイクロフォン12は、双指向性マイクロフォンとされている。
無指向性マイクロフォン11の指向特性を図2(A)に示す。無指向性マイクロフォン11は、全角度範囲に対して一定の感度を有するとともに、一定の位相特性を有する。なお、無指向性マイクロフォン11としては、圧力型マイクロフォンがあり、ダイナミック型マイクロフォン、コンデンサ型マイクロフォン、エレクトレットコンデンサ型マイクロフォンなどで実現される。
圧力型マイクロフォンは、振動板の正面側が開放され、背面側がハウジングで密閉された構造を有する。圧力型マイクロフォンの場合、背面側が密閉されているので、振動板の背面側の気圧は一定となり、正面側の気圧の変化によって振動板が動かされる。これにより、圧力型マイクロフォンは、マイクロフォンの配置場所における気圧の変化に従った波形信号を出力する。また、マイクロフォンの周囲の気圧変化は、マイクロフォンから見た音源の方向によらないので、音源の方向に拘わらず、感度が一定であり、出力信号の位相も一定である。
一方、双指向性マイクロフォン12の指向特性を図2(B)に示す。双指向性マイクロフォン12では、図中Aの角度を境に、正面側の180度の角度範囲から入射した音波に対する出力信号の位相と、背面側の180度の角度範囲から入射した音波に対する出力信号の位相とは、180度異なる。なお、双指向性マイクロフォンとしては、速度型マイクロフォンがあり、リボン型マイクロフォンなどで実現される。
速度型マイクロフォンは、振動板の周囲が開放された構造を有する。振動板の周囲が開放されている場合、振動板の大きさが音波の波長に対して十分小さければ、振動板の正面側の気圧と背面側の気圧は同じになり、振動板は、気圧の変化ではなく、空気の直接的な動きに従って動く。したがって、速度型マイクロフォンでは、振動板の正面側から音波が入射する場合と、振動板の背面側から音波が入射する場合とでは、振動板の振動方向が逆になる。これにより、速度型マイクロフォンでは、マイクロフォンから見た音源の方向が正面側にある場合と背面側にある場合とでは、出力信号の位相が反転する。
なお、マイクロフォン11,12から出力された信号(アナログ信号)は図示せぬA/D(Analog to Digital)変換回路によってディジタル信号に変換され、後段の回路に供給される。
ディレイ回路13〜17は、ディレイ回路13〜17のそれぞれと対になるFIR回路18〜22に対応する所定の遅延量を有し、入力された信号を所定の遅延量だけ遅延して出力する。
FIR回路18〜22は、適応フィルタを構成する。FIR回路18〜22は、図3に示すように、入力された信号を遅延する複数の遅延回路30と、それぞれの遅延回路30から出力される信号に所定の係数(h〜h)を乗算する複数の係数回路31と、係数回路31から出力された信号を加算する加算回路32と、誤差信号に基づいてそれぞれの係数回路31の係数を設定する制御回路33とを有している。入力信号は、遅延回路30のそれぞれによって遅延されて次段の遅延回路30に順次入力される。遅延回路30のそれぞれから出力された信号は、係数回路31によって係数h〜hをそれぞれ乗算され、出力される。なお、本実施の形態では、FIR回路18〜21については、n=1000程度に設定され、FIR回路22については、n=500〜600程度に設定されている。なお、これ以外の設定であってもよいことはいうまでもない。
加算回路32は、係数回路31からそれぞれ出力された信号を加算して出力する。制御回路33は、FIR回路18〜22の後段に存在する減算回路23〜27から供給される誤差信号を入力し、当該誤差信号の実効値が最小となるように各係数回路31の係数を設定する。なお、図1では、減算回路23〜27からFIR回路18〜22にフィードバックされている破線の信号が誤差信号である。
図1に戻る。減算回路23〜27は、ディレイ回路13〜17の出力信号からFIR回路18〜22の出力を減算し、得られた信号を次段の回路に供給するとともに、当該信号を誤差信号として、FIR回路18〜22にそれぞれ供給する。
前述したように、FIR回路18〜22は、適応フィルタを構成する。FIR回路18〜22には、ディレイ回路13〜17から制御の目標となる目標信号がそれぞれ与えられる。また、減算回路23〜27からは、目標信号との誤差を示す誤差信号がそれぞれ与えられる。FIR回路18〜22は、入力信号が目標信号に近づくように、すなわち、誤差信号の実効値が最小となるように、内部の係数回路31の値を設定する。
なお、ディレイ回路13〜17、FIR回路18〜22、および、減算回路23〜27は、例えば、DSP(Digital Signal Processor)によって構成されている。
(B)第1の実施の形態の動作
つぎに、第1の実施の形態の動作について説明する。
図示せぬ音源は、マイクロフォン11,12の略正面に配置される。この図示せぬ音源から放射された音は、マイクロフォン11,12に直接音として入射されるとともに、壁等によって反射されて反射音として入射される。ここで、直接音をSとし、反射音をSとする。直接音Sは、音源からの音が直接入射されるので、音源と略同一の波形を有する音となる。一方、反射音Sは、音源から放射され複数の経路を経由して到達した音が重畳されたものであるので、様々な振幅および位相の音が重畳された状態となっている。マイクロフォン11,12は直接音Sおよび反射音Sをそれぞれ対応する電気信号に変換して出力する。なお、マイクロフォン11は図2(A)に示す無指向性を有するので、音の到来方向に拘わらず一定の位相の音声信号を出力する。一方、マイクロフォン12は図2(B)に示す双指向性を有するので、マイクロフォン12の正面範囲から到来した音と、背面範囲から到来した音とを比較すると、位相が180度異なる音声信号を出力する。また、双指向性マイクロフォン12では、図2(B)に示すように、音の到来方向に応じて感度が異なる。したがって、マイクロフォン12から出力される音声信号は、音の到来方向に応じた振幅および位相を有する。音源は、マイクロフォン11,12の正面に配置されているので、直接音Sはマイクロフォン11,12の正面(図2(A),(B)における上側となる方向)から入射される。他方、反射音Sは様々な方向からマイクロフォン11,12に入射されるので、マイクロフォン12では位相および振幅が到来方向によって異なる。
マイクロフォン11から出力された音声信号は、ディレイ回路13とFIR回路20にそれぞれ供給される。また、マイクロフォン12から出力された音声信号は、ディレイ回路16と第1の適応フィルタとしてのFIR回路18にそれぞれ供給される。
ディレイ回路13は、マイクロフォン11から出力された音声信号をFIR回路18に対応した所定の時間だけ遅延して出力する。FIR回路18は、マイクロフォン12の出力に対して、図3に示す回路により適応フィルタリング処理を施して出力する。
減算回路23は、ディレイ回路13の出力信号からFIR回路18の出力信号を減算し、得られた信号を次段の第2の適応フィルタとしてのFIR回路19に供給するとともに、FIR回路18に誤差信号として供給する。
FIR回路18は、減算回路23から供給された信号を誤差信号として入力し、当該誤差信号の実効値が最小となるように、係数回路の係数値を設定する。具体的には、図3に示す制御回路33は、例えば、LMS(Least Mean Square)法に基づいて、ディレイ回路13から出力されたマイクロフォン11の出力信号を目標信号とし、減算回路23の出力信号を誤差信号とし、誤差信号の実効値が最小となるようにFIR回路18の係数h〜hを設定する。
ここで、ディレイ回路13から出力される音声信号には、マイクロフォン11から出力された、直接音Sと反射音Sとに対応する音声信号が含まれている。FIR回路18に入力される音声信号は、マイクロフォン12の出力信号であり、同様に、直接音Sと反射音Sとに対応する音声信号が含まれている。マイクロフォン11から出力される反射音Sに対応する信号が反射音Sの入射角によらず振幅が一定であるのに対し、マイクロフォン12から出力される反射音Sに対応する信号は図2(B)に示すように、反射音Sの入射角によって振幅が変化する。
FIR回路18は、減算回路23から出力される誤差信号が最小となるように係数h〜hを設定するが、これにより、マイクロフォン12から出力される音声信号の振幅および位相が、ディレイ回路13から出力される音声信号(マイクロフォン11から出力される音声信号が遅延された信号)の振幅および位相と略等しくなるように調整される。一般的に、直接音Sと反射音Sの大きさを比較すると、S>Sの関係が成立する。また、反射音Sに対応する音声信号は、マイクロフォン11,12では位相および振幅がその入射角に応じて異なっている。したがって、FIR回路18は、誤差信号の実効値を最小とするために、マイクロフォン12から出力される直接音Sに対応する音声信号が、ディレイ回路13から出力される直接音Sに対応する音声信号と振幅および位相が略等しくなるように調整する。
減算回路23は、ディレイ回路13の出力信号から、FIR回路18の出力信号を減算した結果を出力する。前述のように、FIR回路18の出力信号は、直接音Sに対応する音声信号と振幅および位相が略等しくなるように調整されているので、減算回路23からは反射音Sに対応する音声信号が残差として出力される。減算回路23から出力された信号は、FIR回路18に誤差信号として供給されるとともに、次段のFIR回路19に供給される。
FIR回路19は、減算回路24から出力される誤差信号が最小となるように係数h〜hを設定するが、これにより、減算回路23から出力される音声信号の振幅および位相がディレイ回路14から出力されるマイクロフォン11から出力される音声信号の振幅および位相と略等しくなるように調整される。ここで、減算回路23から出力される信号は、反射音Sに対応する信号を主に含んだ信号である。一方、ディレイ回路14から出力される音声信号は、マイクロフォン11から出力される信号の遅延信号であるので、直接音Sに対応する信号と、反射音Sに対応する信号を含んでいる。FIR回路19は、減算回路23から供給された反射音Sに対応する音声信号を主に含む信号の振幅および位相を調整し、ディレイ回路14から出力される信号に含まれている反射音Sに対応する音声信号の振幅および位相と略等しくなるようにする。減算回路24は、ディレイ回路14の出力信号からFIR回路19の出力信号を減算して出力する。この結果、減算回路24から出力される音声信号は、反射音Sに対応する音声信号が減衰され、直接音Sに対応する音声信号を主に含む信号となる。減算回路24から出力された信号は、次段のディレイ回路15に供給されるとともに、誤差信号としてFIR回路19に供給される。
ディレイ回路16は、マイクロフォン12から出力された音声信号を第4の適応フィルタとしてのFIR回路20に対応した所定の時間だけ遅延して出力する。FIR回路20は、マイクロフォン11の出力に対して、図3に示す回路によりフィルタリング処理を施して出力する。
減算回路25は、ディレイ回路16の出力信号からFIR回路20の出力信号を減算し、得られた信号をFIR回路20に誤差信号として供給するとともに、次段の第5の適応フィルタとしてのFIR回路21に供給する。
FIR回路20は、減算回路25から出力される誤差信号が最小となるように係数h〜hを設定するが、これにより、マイクロフォン11から出力される音声信号の振幅および位相が、ディレイ回路16から出力される音声信号(マイクロフォン12から出力される音声信号が遅延された信号)の振幅および位相と略等しくなるように調整される。前述の場合と同様に、直接音Sと反射音Sの大きさを比較すると、S>Sの関係が成立する。また、反射音Sに対応する音声信号は、マイクロフォン11,12では位相および振幅がその入射角に応じて異なっている。したがって、FIR回路20は、誤差信号の実効値を最小とするために、マイクロフォン11から出力される直接音Sに対応する音声信号が、ディレイ回路16から出力される直接音Sに対応する音声信号と振幅および位相が略等しくなるように調整する。
減算回路25は、ディレイ回路16の出力信号から、FIR回路20の出力信号を減算した結果を出力する。前述のように、FIR回路20の出力信号は、直接音Sに対応する音声信号と振幅および位相が略等しくなるように調整されているので、減算回路25からは反射音Sに対応する音声信号が残差として出力される。
FIR回路21は、減算回路26から出力される誤差信号が最小となるように係数h〜hを設定するが、これにより、減算回路25から出力される音声信号の振幅および位相がディレイ回路17から出力されるマイクロフォン12から出力される音声信号の振幅および位相と略等しくなるように調整される。ここで、減算回路25から出力される信号は、反射音Sに対応する信号を主に含んだ信号である。一方、ディレイ回路17から出力される音声信号は、マイクロフォン12から出力される信号の遅延信号であるので、直接音Sに対応する信号と、反射音Sに対応する信号を含んでいる。FIR回路21は、減算回路25から供給された反射音Sに対応する音声信号を主に含む信号の振幅および位相を調整し、ディレイ回路17から出力される信号に含まれている反射音Sに対応する音声信号の振幅および位相と略等しくなるようにする。減算回路26は、ディレイ回路17の出力信号からFIR回路21の出力信号を減算して出力する。この結果、減算回路26から出力される音声信号は、反射音Sに対応する音声信号が減衰され、直接音Sに対応する音声信号を主に含む信号となる。減算回路26から出力された信号は、第3の適応フィルタとしてのFIR回路22に供給される。
FIR回路22は、ディレイ回路15から出力された信号を目標信号とし、減算回路27から出力された信号を誤差信号として、誤差信号の実効値が最小値となるように、係数h〜hを設定する。ここで、ディレイ回路15に入力される信号は、マイクロフォン11の出力信号から反射音Sに対応する音声信号が減算された信号である。また、FIR回路22に入力される信号は、マイクロフォン12の出力信号から反射音Sに対応する音声信号が減算された信号である。FIR回路22は、減算回路27から出力される誤差信号の実効値が最小となるように、係数h〜hを設定する。これにより、FIR回路22から出力される信号は、ディレイ回路15から出力される信号の主要成分である直接音Sと振幅および位相が略同じとなった状態で出力される。また、減算回路26から出力される信号は、直接音Sを主に含む信号であるので、FIR回路22から出力される信号には反射音Sに対応する音声信号が殆ど含まれていない。
したがって、例えば、ディレイ回路15から出力される信号V1と、FIR回路22から出力される信号V2とを加算することにより、反射音Sに対応する信号が少なく、かつ、マイクロフォン11,12の正面方向に配置された音源からの直接音Sが強調された信号を得る。
(C)第1の実施の形態の実測結果
つぎに、第1の実施の形態の実測結果について説明する。図4は、測定環境を説明する図である。この例では、無響箱50の略中央にマイクロフォン11,12が配置されている。また、マイクロフォン11,12の正面には音源となるスピーカ40が配置されている。なお、無響箱50は、例えば、くさび形状を有するグラスウールが内部の壁面に多数配置され、可聴帯域の音を吸収することで、反射音を生じない特性を有している。また、スピーカ40からは、例えば、所定の話者が発話した音声等が放射される。
図5は比較対象となる回路を示す図である。この例では、図1に示す回路から、反射音を減衰させる処理に関する部分(ディレイ回路13,14,16,17、FIR回路18〜21、および、減算回路23〜26)を除外している。なお、ディレイ回路15、減算回路27、および、FIR回路22については、図1の場合と同様である。図5の回路では、マイクロフォン11から出力された音声信号を目標信号とし、マイクロフォン12から出力された音声信号に対してFIR回路22が適応フィルタリング処理を施し、減算回路27から出力される誤差信号が最小となるように係数h〜hが設定される。
図6は、図4に示す測定環境における実測結果を示す図である。すなわち、図6(A)は、図4における環境下において、図5に示す回路から出力されるV1を横軸に、V2を縦軸に対応付けし、各サンプル点を座標軸上にプロットしたものである。また、図6(B)は、同様にして、図1に示す回路の測定結果を示す図である。
2つの信号V1,V2をそれぞれ横軸および縦軸に対応付けして、各サンプル点を座標軸上にプロットした場合、各サンプル点においてV1=V2である場合には、プロットされた点は、座標軸上のY=Xの直線上を移動する。図6(A),(B)の例では、プロットされた点はY=Xの直線上に略集中していることから、いずれの回路の場合も各サンプル点においてV1=V2が略成立していると言える。つまり、図4に示す測定環境下では、反射音が存在しないことから、そのような場合には、図1と図2の回路では有意な差は生じない。
図7(A),(B)は、反射音が存在する環境下における実測結果を示している。すなわち、図8に示すように、無響箱50の内側に音を反射する板状の部材(例えば、ベニア、段ボール等)によって反射壁51を設けた状態で測定している。なお、図8では内部壁の内側のみに反射壁51を設けているが、実際にはマイクロフォン11,12の周辺部分にも反射壁を配置している。これにより、スピーカ40から放射された音は、反射壁51その他によって反射され、その一部がマイクロフォン11,12に反射音Sとして入射される。
図7(A)は、図5に示す回路による測定結果を示している。この例では、プロットされた点は、直線Y=Xから外れた位置に多く存在している。したがって、各サンプル点において、V1=V2の関係が成立していない。これは、振幅および位相が異なる複数の反射音Sの存在により、直接音Sが擾乱されているものと考えられる。
図7(B)は、図1に示す回路による測定結果を示している。この例では、プロットされた点は、直線Y=Xの近傍に存在している。したがって、各サンプル点において、V1=V2の関係が略成立している。すなわち、振幅および位相が異なる複数の反射音Sが減衰され、直接音Sが有効に抽出されていると考えられる。
図7(A),(B)の比較から、図1の回路では、反射音Sの成分を減衰させることにより、直接音Sの成分を有効に抽出していることが分かる。
図9は、図4と同様の測定環境において、無響箱50の代わりに実車を使用した実測結果を示している。すなわち、図9(A)は、実車において図5に示す回路を用いて測定した結果を示し、図9(B)は、実車において図1に示す回路を用いて測定した結果を示している。実車の場合、フロントガラス、サイドガラス、リアガラス等の音を反射しやすいガラス群が存在する。また、ドア、天井、床等の壁面には、クッション性を有する部材が使用されているが、音の吸収特性は、無響箱50のそれよりも劣っている。また、前述したガラス群および壁面は様々な方向に向いていることから、音を反射する方向も一定ではない。このため、実車の場合、図8の場合よりも反射音の特性は複雑であると考えられる。
図9(A)の例では、このような実車の複雑な反射音の特性により、プロットされた点は直線Y=X上から大きく外れた位置に不規則に存在している。
図9(B)の例では、直線Y=Xの近傍にプロットされた点が集中していることから、図1に示す回路では、前述した複雑な反射音を効率良く減衰していると言える。
以上から、図1に示す回路は、効率良く反射音を減衰し、直接音を選択的に抽出していることが分かる。
(D)第2の実施の形態の構成例
つぎに、本発明の第2の実施の形態について説明する。
図10は、本発明の第2の実施の形態の構成例を示す図である。この図において、図1と対応する部分には同一の符号を付してその説明を省略する。図10の例では、図1の場合と比較して、FIR回路20,21および減算回路25,26が除外されており、マイクロフォン12から出力された音声信号は、ディレイ回路16,17を経由して、FIR回路22に直接供給されている。それ以外の構成は、図1の場合と同様であるので、詳細な説明は省略する。
(E)第2の実施の形態の動作
つぎに、第2の実施の形態の動作について説明する。
図10の回路の場合も、マイクロフォン11,12に対して、音源からの直接音と、壁等によって反射された反射音とが入射される。マイクロフォン11,12は、これらの入射音に対応する電気信号を生成して出力する。マイクロフォン11から出力された音声信号はディレイ回路13に供給される。また、マイクロフォン12から出力された音声はディレイ回路16とFIR回路18にそれぞれ供給される。
ディレイ回路13はマイクロフォン11の出力信号を遅延し、ディレイ回路14と減算回路23に供給する。減算回路23は、ディレイ回路13によって遅延されたマイクロフォン11の出力信号からFIR回路18の出力信号を減算し、得られた結果を次段のFIR回路19に供給するとともに、FIR回路18に誤差信号として供給する。
FIR回路18は、減算回路23から出力される誤差信号の実効値が最小となるように係数h〜hを設定する。ここで、ディレイ回路13から出力される音声信号には、マイクロフォン11から出力された、直接音Sと反射音Sとに対応する音声信号が含まれている。FIR回路18に入力される音声信号は、マイクロフォン12の出力信号であり、同様に、直接音Sと反射音Sとに対応する音声信号が含まれている。マイクロフォン11から出力される反射音Sに対応する信号が反射音Sの入射角によらず振幅が一定であるのに対し、マイクロフォン12から出力される反射音Sに対応する信号は、図2(B)に示すように、反射音Sの入射角によって振幅が変化する。
FIR回路18は、減算回路23から出力される誤差信号が最小となるように係数h〜hを設定するが、これにより、マイクロフォン12から出力される音声信号の振幅および位相が、ディレイ回路13から出力される音声信号(マイクロフォン11から出力される音声信号が遅延された信号)の振幅および位相と略等しくなるように調整される。一般的に、直接音Sと反射音Sの大きさを比較すると、S>Sの関係が成立する。また、反射音Sに対応する音声信号は、マイクロフォン11,12では位相および振幅がその入射角に応じて異なっている。したがって、FIR回路18は、誤差信号の実効値を最小とするために、マイクロフォン12から出力される直接音Sに対応する音声信号が、ディレイ回路13から出力される直接音Sに対応する音声信号と振幅および位相が略等しくなるように調整する。
減算回路23は、ディレイ回路13の出力信号から、FIR回路18の出力信号を減算した結果を出力する。前述のように、FIR回路18の出力信号は、直接音Sに対応する音声信号と振幅および位相が略等しくなるように調整されているので、減算回路23からは反射音Sに対応する音声信号が残差として出力される。減算回路23から出力された信号は、次段のFIR回路19へ供給されるとともに、FIR回路18に誤差信号として供給される。
FIR回路19は、減算回路24から出力される誤差信号が最小となるように係数h〜hを設定するが、これにより、減算回路23から出力される音声信号の振幅および位相がディレイ回路14から出力されるマイクロフォン11の出力信号の振幅および位相と略等しくなるように調整される。ここで、減算回路23から出力される信号は、反射音Sに対応する信号を主に含んだ信号である。一方、ディレイ回路14から出力される音声信号は、マイクロフォン11から出力される信号の遅延信号であるので、直接音Sに対応する信号と、反射音Sに対応する信号を含んでいる。FIR回路19は、減算回路23から供給された反射音Sに対応する音声信号を主に含む信号の振幅および位相を調整し、ディレイ回路14から出力される信号に含まれている反射音Sに対応する音声信号の振幅および位相と略等しくなるようにする。減算回路24は、ディレイ回路14の出力信号からFIR回路19の出力信号を減算して出力する。この結果、減算回路24から出力される音声信号は、反射音Sに対応する音声信号が減衰され、直接音Sに対応する音声信号を主に含む信号となる。減算回路24から出力された信号は、ディレイ回路15に供給される。
マイクロフォン12から出力された音声信号は、ディレイ回路16,17を経由し、ディレイ回路13,14と同じ遅延量の遅延をそれぞれ与えられた後、FIR回路22に供給される。FIR回路22は、減算回路27から出力される誤差信号が最小となるように係数h〜hを設定するが、これにより、FIR回路22から出力される音声信号の振幅および位相が、ディレイ回路15から出力される音声信号(目標信号)の振幅および位相と略等しくなるように調整される。ここで、減算回路24から出力される信号は、前述したように反射音Sに対応する音声信号が減衰され、直接音Sに対応する音声信号を主に含む信号であるので、FIR回路22は、ディレイ回路17から出力された音声信号の直接音Sの振幅および位相がディレイ回路15から出力される直接音Sに対応する信号の振幅および位相と等しくなるように調整する。また、FIR回路22は、ディレイ回路17の出力信号に含まれている反射音Sに対応する音声信号が減衰するように調整する。これにより、FIR回路22から出力される信号は、ディレイ回路15から出力される信号に含まれる直接音Sに対応する信号の振幅および位相が略同じであり、かつ、反射音Sが減衰された信号となる。
ディレイ回路15から出力された信号V1と、FIR回路22から出力された信号V2を、例えば、加算することにより、反射音Sが減衰され、直接音Sを主に含む信号を得ることができる。
(F)変形実施の態様
なお、上述の実施の形態は、本発明の好適な例であるが、本発明は、これらに限定されるものではなく、本発明の要旨を逸脱しない範囲において、種々の変形、変更が可能である。
例えば、以上の各実施の形態では、ディレイ回路13〜17、FIR回路18〜22、および、減算回路23〜27は、DSPによって構成するようにしたが、例えば、CPU、ROM、RAM等を有するマイクロコンピュータによって構成したり、アナログ回路またはディジタル回路によって構成したりすることも可能である。マイクロコンピュータによって実現する場合には、例えば、ROMに対して、上述した処理を実現するためのプログラムを記憶しておき、当該プログラムを実行することにより、ソフトウエア資源としてのプログラムと、ハードウエア資源としてのCPUその他が協働することにより、図1,10に示す機能ブロックを実現する。なお、当該プログラムは、ROM等に格納された状態で出荷されてもよいし、出荷された後にROM等に格納されるようにしてもよい。なお、出荷後に格納する場合には、例えば、CD−ROM等の記憶媒体に記憶した形で配布し、配布されたCD−ROMからプログラムを読み込んでROMに格納したり、例えば、インターネット等のネットワークを介して配布し、格納したりするようにしてもよい。
また、以上の各実施の形態では、マイクロフォン11としては無指向性マイクロフォンを使用し、マイクロフォン12としては双指向性マイクロフォンを使用するようにしたが、これらを逆に用いるようにしてもよい。すなわち、マイクロフォン11としては双指向性マイクロフォンを使用し、マイクロフォン12としては無指向性マイクロフォンを使用することも可能である。あるいは、これら以外の指向性を有するマイクロフォンを使用することも可能である。マイクロフォン11,12としては指向性が異なる1組のマイクロフォンを使用すればよい。
また、以上の各実施の形態では、マイクロフォン11,12として指向特性が異なるマイクロフォンを使用したが、指向特性が同じマイクロフォンを使用することも可能である。例えば、マイクロフォン11,12として、単一指向性のマイクロフォンを使用し、配置方向を異ならせることにより、「指向性を異ならせる」ようにしてもよい。具体的には、マイクロフォン11については音源に向けて配置し、マイクロフォン12については音源とは反対の方向に向けて配置するようにすればよい。あるいは、マイクロフォン12については音源に向けて配置し、マイクロフォン11については音源とは反対の方向に向けて配置するようにすればよい。これら以外にも、例えば、一方のマイクロフォンを音源からX(0≦X≦360)度外れた方向に向けて配置し、他方のマイクロフォンを音源からY(Y≠X)度外れた方向に向けて配置するようにしてもよい。
また、以上の各実施の形態では、適応フィルタの適応アルゴリズムとしては、LMS法を用いるようにしたが、これ以外のアルゴリズム(例えば、RLS(Recursive Least Squares)法)を使用してもよい。
また、以上の各実施の形態では、適応フィルタとしては、FIRフィルタを用いるようにしたが、例えば、IIR(Infinite Impulse Response)フィルタを用いるようにしてもよい。その場合、適応フィルタの適応アルゴリズムとしては、例えば、IIR−LMSアルゴリズムを用いることができる。
また、第2の実施の形態では、ディレイ回路16,17を2つ設けるようにしたが、これらの合計の遅延量を有するディレイ回路を1つ設けるようにしてもよい。
また、上述した各実施の形態の音声信号処理装置を、例えば、車載のナビゲーション装置等に搭載し、ナビゲーション装置の音声認識処理部の前処理装置として用いることが可能である。そのような場合、マイクロフォン11,12を、話者(例えば、運転者)の方向に向けて配置し、ディレイ回路15およびFIR回路22の出力信号V1,V2を加算し、得られた信号を音声認識処理部へ供給する。これにより、話者以外から生じる音の影響を少なくすることができるとともに、話者の音声が、例えば、車内で反射されることにより生ずる反射音の影響を低減することができる。このため、音声認識の精度を向上させることができる。
本発明は、例えば、自動車に搭載されるカーナビゲーション装置に適用することができる。
本発明の第1の実施の形態に係る音声信号処理装置の構成例を示すブロック図である。 (A)は無指向性マイクロフォンの指向特性を示す図であり、(B)は双指向性マイクロフォンの指向特性を示す図である。 図1に示すFIR回路の詳細な構成例を示す図である。 図1に示す音声信号処理装置を実測した環境を示す図である。 図1に示す音声信号処理装置の比較対象となる回路を示す図である。 (A)は図5に示す回路の図4に示す環境における測定結果であり、(B)は図1に示す回路の図4に示す環境における測定結果である。 (A)は図5に示す回路の図8に示す環境における測定結果であり、(B)は図1に示す回路の図8に示す環境における測定結果である。 図1に示す音声信号処理装置を実測した環境を示す図である。 (A)は図5に示す回路の実車内における測定結果であり、(B)は図1に示す回路の実車内における測定結果である。 本発明の第2の実施の形態に係る音声信号処理装置の構成例を示すブロック図である。
符号の説明
11 マイクロフォン(第1のマイクロフォン)
12 マイクロフォン(第2のマイクロフォン)
13〜17 ディレイ回路
18 FIR回路(第1の適応フィルタ)
19 FIR回路(第2の適応フィルタ)
20 FIR回路(第4の適応フィルタ)
21 FIR回路(第5の適応フィルタ)
22 FIR回路(第3の適応フィルタ)
23〜27 減算回路

Claims (8)

  1. 第1のマイクロフォンと、
    上記第1のマイクロフォンと近接して配置され、上記第1のマイクロフォンとは指向性を異ならせた第2のマイクロフォンと、
    上記第1のマイクロフォンから出力された第1の音声信号を目標信号とし、上記第2のマイクロフォンから出力された第2の音声信号に対して適応フィルタリング処理を施す第1の適応フィルタと、
    上記第1の音声信号を目標信号とし、上記第1の適応フィルタの誤差信号に対して適応フィルタリング処理を施す第2の適応フィルタと、
    上記第2の適応フィルタの誤差信号を目標信号とし、上記第2の音声信号に対して適応フィルタリング処理を施す第3の適応フィルタと、
    を有することを特徴とする音声信号処理装置。
  2. 前記第2の音声信号を目標信号とし、前記第1の音声信号に対して適応フィルタリング処理を施す第4の適応フィルタと、
    前記第2の音声信号を目標信号とし、上記第4の適応フィルタの誤差信号に対して適応フィルタリング処理を施す第5の適応フィルタとをさらに有し、
    前記第3の適応フィルタは、上記第5の適応フィルタの誤差信号に対して適応フィルタリング処理を施す、
    ことを特徴とする請求項1記載の音声信号処理装置。
  3. 前記第1のマイクロフォンは無指向性マイクロフォンであり、前記第2のマイクロフォンは双指向性マイクロフォンであることを特徴とする請求項1または2のいずれかに記載の音声信号処理装置。
  4. 前記第1および第2のマイクロフォンはともに単一指向性マイクロフォンであり、それぞれ異なる方向を向けて配置されていることを特徴とする請求項1または2のいずれかに記載の音声信号処理装置。
  5. 前記各適応フィルタに供給される目標信号は、それぞれの適応フィルタに応じた遅延量を有するディレイ回路を通過した後に目標信号として与えられることを特徴とする請求項1または2のいずれかに記載の音声信号処理装置。
  6. 前記第1および第2のマイクロフォンには、目的となる音が直接音として入射され、
    前記適応フィルタ群は、直接音以外の反射音を除去するように機能する、
    ことを特徴とする請求項1または2のいずれかに記載の音声信号処理装置。
  7. 第1のマイクロフォンから出力された第1の音声信号を目標信号とし、上記第1のマイクロフォンと近接して配置され、上記第1のマイクロフォンとは指向性を異ならせた第2のマイクロフォンから出力された第2の音声信号に対して適応フィルタリング処理を施す第1の適応フィルタリングステップと、
    上記第1の音声信号を目標信号とし、上記第1の適応フィルタリングステップにおいて生成された誤差信号に対して適応フィルタリング処理を施す第2の適応フィルタリングステップと、
    上記第2の適応フィルタリングステップにおいて生成された誤差信号を目標信号とし、上記第2の音声信号に対して適応フィルタリング処理を施す第3の適応フィルタリングステップと、
    を有することを特徴とする音声信号処理方法。
  8. 第1のマイクロフォンから出力された第1の音声信号を目標信号とし、上記第1のマイクロフォンと近接して配置され、上記第1のマイクロフォンとは指向性を異ならせた第2のマイクロフォンから出力された第2の音声信号に対して適応フィルタリング処理を施す第1の適応フィルタ、
    上記第1の音声信号を目標信号とし、上記第1の適応フィルタの誤差信号に対して適応フィルタリング処理を施す第2の適応フィルタ、
    上記第2の適応フィルタの誤差信号を目標信号とし、上記第2の音声信号に対して適応フィルタリング処理を施す第3の適応フィルタ、
    としてコンピュータを機能させることを特徴とするコンピュータ読取可能な音声信号処理プログラム。
JP2007001529A 2007-01-09 2007-01-09 音声信号処理装置、音声信号処理方法、および、音声信号処理プログラム Active JP4893317B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007001529A JP4893317B2 (ja) 2007-01-09 2007-01-09 音声信号処理装置、音声信号処理方法、および、音声信号処理プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007001529A JP4893317B2 (ja) 2007-01-09 2007-01-09 音声信号処理装置、音声信号処理方法、および、音声信号処理プログラム

Publications (2)

Publication Number Publication Date
JP2008172334A JP2008172334A (ja) 2008-07-24
JP4893317B2 true JP4893317B2 (ja) 2012-03-07

Family

ID=39700043

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007001529A Active JP4893317B2 (ja) 2007-01-09 2007-01-09 音声信号処理装置、音声信号処理方法、および、音声信号処理プログラム

Country Status (1)

Country Link
JP (1) JP4893317B2 (ja)

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4286637B2 (ja) * 2002-11-18 2009-07-01 パナソニック株式会社 マイクロホン装置および再生装置

Also Published As

Publication number Publication date
JP2008172334A (ja) 2008-07-24

Similar Documents

Publication Publication Date Title
US9966059B1 (en) Reconfigurale fixed beam former using given microphone array
US7930175B2 (en) Background noise reduction system
US9002027B2 (en) Space-time noise reduction system for use in a vehicle and method of forming same
US8189810B2 (en) System for processing microphone signals to provide an output signal with reduced interference
US7706549B2 (en) Broadside small array microphone beamforming apparatus
US9559736B2 (en) Auto-selection method for modeling secondary-path estimation filter for active noise control system
JP2016516343A5 (ja)
CN109313889A (zh) 缓解主动噪声控制系统中的不稳定状况
KR20090050372A (ko) 혼합 사운드로부터 잡음을 제거하는 방법 및 장치
JP2016127300A (ja) 音声処理装置
JP2007180896A (ja) 音声信号処理装置および音声信号処理方法
US8639499B2 (en) Formant aided noise cancellation using multiple microphones
US20040258255A1 (en) Post-processing scheme for adaptive directional microphone system with noise/interference suppression
EP3627851B1 (en) Signal processing method and signal processing device
CN114127845A (zh) 用于消除麦克风信号中的道路噪声的系统和方法
JP6226885B2 (ja) 音源分離方法、装置、及びプログラム
JP4977551B2 (ja) 能動型騒音制御装置
JP4893317B2 (ja) 音声信号処理装置、音声信号処理方法、および、音声信号処理プログラム
JP4367328B2 (ja) ハウリングキャンセラ
CN110876097B (zh) 信号处理方法、信号处理装置以及记录介质
US20220225024A1 (en) Method and system for using single adaptive filter for echo and point noise cancellation
JP7270140B2 (ja) 音声処理システム及び音声処理装置
Saremi Spatial audio signal processing for speech telecommunication inside vehicles
JP6361360B2 (ja) 残響判定装置及びプログラム
WO2022041030A1 (en) Low complexity howling suppression for portable karaoke

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20091222

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101122

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20111012

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20111114

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111122

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111205

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 4893317

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150106

Year of fee payment: 3