JP6295650B2 - 音声信号処理装置及びプログラム - Google Patents

音声信号処理装置及びプログラム Download PDF

Info

Publication number
JP6295650B2
JP6295650B2 JP2013267711A JP2013267711A JP6295650B2 JP 6295650 B2 JP6295650 B2 JP 6295650B2 JP 2013267711 A JP2013267711 A JP 2013267711A JP 2013267711 A JP2013267711 A JP 2013267711A JP 6295650 B2 JP6295650 B2 JP 6295650B2
Authority
JP
Japan
Prior art keywords
coherence
filter coefficient
arrival direction
coherence filter
microphones
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013267711A
Other languages
English (en)
Other versions
JP2015126279A (ja
Inventor
克之 高橋
克之 高橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2013267711A priority Critical patent/JP6295650B2/ja
Publication of JP2015126279A publication Critical patent/JP2015126279A/ja
Application granted granted Critical
Publication of JP6295650B2 publication Critical patent/JP6295650B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
  • Circuit For Audible Band Transducer (AREA)

Description

本発明は、音声信号処理装置及びプログラムに関し、例えば、電話機やテレビ会議装置などの音声信号(この明細書では、音声信号や音響信号等の音信号を「音声信号」と呼んでいる)を扱う通信機や通信ソフトウェアに適用し得るものである。
取得した音声信号中に含まれる雑音成分を抑圧する手法の一つとして、コヒーレンスフィルタ法が挙げられる。コヒーレンスフィルタ法は、特許文献1に記載されているように、左右に死角を有する信号の相互相関を周波数ごとに乗算することで、到来方位に偏りが大きい雑音成分を抑圧する手法である。
コヒーレンスフィルタ法を適用した音声信号処理装置では、2つのマイクロホンが捕捉して得た入力信号を用いて、正面の左側から到来する成分のみを含む第1の指向性信号と、右側から到来する成分のみを含む第2の指向性信号を生成し、第1及び第2の指向性信号の周波数成分毎の相関値(コヒーレンスフィルタ係数)を係数値として入力信号に乗算することにより、雑音成分を抑圧した信号を得ている。ここで、コヒーレンスフィルタ係数の演算式は、特許文献1に記載されている。
ここで、第1及び第2の指向性信号の相関値である周波数成分毎のコヒーレンスフィルタ係数の平均値であるコヒーレンスは、妨害音(抽出しようとする音声に対して妨害となる音声や音響)の到来方位を反映するパラメータとなっている。特許文献2では、妨害音の到来方位の推定に、妨害音区間でのコヒーレンスを用いることが記載されている。
特開2013−126026 特開2013−182044
浅野太著、日本音響学会編集、「音のアレイ信号処理」、コロナ社、2011年2月初版発行
コヒーレンスフィルタ法を適用した音声信号処理装置は、例えば、スマートフォンの音声入力・認識装置に適用される。2つのマイクロホンをスマートフォンの長手方向に距離(例えば14cm程度)を置いて設けることも考えられ、この場合、スマートフォンの幅方向に距離(例えば3cm程度)を置いて設けるより2つのマイクロホンの間隔(以下、マイクロホン間隔と呼ぶ)はかなり大きくなる。
マイクロホン間隔がある所定値以上に広がると、第1及び第2の指向性信号の低域成分の指向性の鋭さが増す。図9は、このことの説明図である。図9は、第1の指向性信号におけるある低域成分(例えば500Hz程度)についての指向性を表している。破線曲線はマイクロホン間隔が狭い場合を表し、実線曲線はマイクロホン間隔が広い場合を示しており、正面から90°右側にずれた方位の指向性はマイクロホン間隔が広い方が数倍(図9では4倍程度)指向性が鋭くなっている。なお、図9における円は、指向性の強度の目安を与える目盛として描いている。
鋭い指向性を有する第1及び第2の指向性信号に基づいてコヒーレンスフィルタ係数を算出した場合、マイクロホン間隔が狭い場合と比較して、コヒーレンスフィルタ係数の挙動は大きく変わる。なぜならば、例えば、妨害音が左から到来した場合に、第1の指向性信号は死角にあたるので信号値は小さくなるが、第2の指向性信号は左側の信号成分がこれまで(狭いマイクロホン間隔の場合)以上に優勢に含まれるためである。そのため、第1及び第2の指向性信号の特性差が極端に大きくなるため、相関(コヒーレンスフィルタ係数)は極めて小さくなる。このようなコヒーレンスフィルタ係数を雑音抑圧処理に適用すると、強力な雑音抑圧効果が得られるものの、目的音声成分までも大きく歪ませるため、音質が著しく劣化する。
また、マイクロホン間隔が大きくなると、空間エイリアスという一種の誤差成分が混入し、形成する指向性の形状が変形するという課題がある(非特許文献1の76頁参照)。図10は、空間エイリアスによる指向性の変化の例を示している。図10は、第1の指向性信号におけるある周波数における指向性を示している。点線曲線は、マイクロホン間隔が狭い場合の指向性を示しており、カージオイド状の形状になっている。一方、実線曲線は、マイクロホン間隔が広い場合の指向性を示しており、空間エイリアスにより、様々な方位に死角を有する独特な形状を呈している。
このような指向性を有する第1及び第2の指向性信号からコヒーレンスフィルタ係数を算出し、さらに、コヒーレンスフィルタ係数からコヒーレンスを算出した場合、コヒーレンスの挙動は大きく変化する。なぜならば、指向性が左右対称に近い形状をしているため、雑音の到来方位が例えば左斜め45°であれば、第1及び第2の指向性信号の双方が妨害音を捕捉してしまうため、妨害音であるにもかかわらず相関が大きくなり、その結果、コヒーレンスが大きくなってしまうからである。
以上のようにマイクロホン間隔が大きくなり、空間エイリアス成分が混入するようになると、到来方位の判定において、正確な推定結果が得られないという課題がある。
そのため、マイクロホン間隔が大きくても、十分な音声処理結果を得ることができる音声信号処理装置及びプログラムが望まれている。
第1の本発明は、一対のマイクロホンが捕捉して得た入力音声信号に含まれている雑音成分をコヒーレンスフィルタ処理によって抑制する音声信号処理装置において、(1)コヒーレンスフィルタ係数を算出するコヒーレンスフィルタ係数算出手段と、(2)上記入力音声信号に含まれている妨害音の到来方位を推定する到来方位推定手段と、(3)推定された到来方位に対応した補正ゲインを得て、低域のコヒーレンスフィルタ係数をその補正ゲインで補正する低域フィルタ係数補正手段と、(4)補正された低域のコヒーレンスフィルタ係数を含めた全帯域のコヒーレンスフィルタ係数を適用してコヒーレンスフィルタ処理を行うフィルタ処理実行手段とを有し、(5)到来方位に対応する上記補正ゲインは、一対のマイクロホンの間隔が狭い場合のコヒーレンスフィルタ係数に対する一対のマイクロホンの間隔が広い場合のコヒーレンスフィルタ係数の比率に基づいて決定されていることを特徴とする。
第2の本発明は、一対のマイクロホンが捕捉して得た入力音声信号に含まれている雑音成分をコヒーレンスフィルタ処理によって抑制する音声信号処理プログラムであって、コンピュータを、(1)コヒーレンスフィルタ係数を算出するコヒーレンスフィルタ係数算出手段と、(2)上記入力音声信号に含まれている妨害音の到来方位を推定する到来方位推定手段と、(3)推定された到来方位に対応した補正ゲインを得て、低域のコヒーレンスフィルタ係数をその補正ゲインで補正する低域フィルタ係数補正手段と、(4)補正された低域のコヒーレンスフィルタ係数を含めた全帯域のコヒーレンスフィルタ係数を適用してコヒーレンスフィルタ処理を行うフィルタ処理実行手段として機能させ、(5)到来方位に対応する上記補正ゲインは、一対のマイクロホンの間隔が狭い場合のコヒーレンスフィルタ係数に対する一対のマイクロホンの間隔が広い場合のコヒーレンスフィルタ係数の比率に基づいて決定されていることを特徴する。
第3の本発明は、一対のマイクロホンが捕捉して得た入力音声信号に含まれている妨害音の到来方位を推定する音声信号処理装置において、(1)少なくとも限定帯域のコヒーレンスフィルタ係数を算出するコヒーレンスフィルタ係数算出手段と、(2)限定帯域のコヒーレンスフィルタ係数を適用して限定帯域のコヒーレンスを算出する限定帯域コヒーレンス算出手段と、(3)限定帯域のコヒーレンスの種々の値と到来方位とを予め対応付けており、算出された限定帯域のコヒーレンスに基づいて、対応付けられた到来方位を得て推定値として出力する到来方位取得手段と、(4)推定された到来方位に対応した補正ゲインを得て、限定帯域のコヒーレンスフィルタ係数をその補正ゲインで補正する限定帯域フィルタ係数補正手段とを有し、(5)到来方位に対応する上記補正ゲインは、一対のマイクロホンの間隔が狭い場合のコヒーレンスフィルタ係数に対する一対のマイクロホンの間隔が広い場合のコヒーレンスフィルタ係数の比率に基づいて決定されていることを特徴とする。
第4の本発明は、一対のマイクロホンが捕捉して得た入力音声信号に含まれている妨害音の到来方位を推定する音声信号処理プログラムであって、コンピュータを、(1)少なくとも限定帯域のコヒーレンスフィルタ係数を算出するコヒーレンスフィルタ係数算出手段と、(2)限定帯域のコヒーレンスフィルタ係数を適用して限定帯域のコヒーレンスを算出する限定帯域コヒーレンス算出手段と、(3)限定帯域のコヒーレンスの種々の値と到来方位とを予め対応付けており、算出された限定帯域のコヒーレンスに基づいて、対応付けられた到来方位を得て推定値として出力する到来方位取得手段と、(4)推定された到来方位に対応した補正ゲインを得て、限定帯域のコヒーレンスフィルタ係数をその補正ゲインで補正する限定帯域フィルタ係数補正手段として機能させ、(5)到来方位に対応する上記補正ゲインは、一対のマイクロホンの間隔が狭い場合のコヒーレンスフィルタ係数に対する一対のマイクロホンの間隔が広い場合のコヒーレンスフィルタ係数の比率に基づいて決定されていることを特徴とする。
本発明によれば、マイクロホン間隔が大きくても、十分な音声処理結果を得ることができる音声信号処理装置及びプログラムを実現できる。
マイクロホン間隔が広い場合の低域におけるコヒーレンスフィルタ係数の挙動を2つの到来方位について示す説明図である。 マイクロホン間隔が狭い場合の低域におけるコヒーレンスフィルタ係数の挙動を2つの到来方位について示す説明図である。 第1の実施形態の音声信号処理装置の全体構成を示すブロック図である。 第1の実施形態の音声信号処理装置におけるコヒーレンスフィルタ処理部の詳細構成を示すブロック図である。 第1の実施形態の音声信号処理装置における補正ゲイン決定部が利用する、到来方位と補正ゲインとを対応付けた変換テーブルを示す説明図である。 第1の実施形態の音声信号処理装置におけるコヒーレンスフィルタ処理部内の到来方位推定部の詳細構成を示すブロック図である。 第1の実施形態の音声信号処理装置におけるコヒーレンスフィルタ処理部内の到来方位推定部が利用する、中域コヒーレンスと到来方位とを対応付けた変換テーブルを示す説明図である。 妨害音の到来方位毎の中域コヒーレンスの挙動を示す説明図である。 マイクロホン間隔がある所定値以上に広がると、指向性信号における低域成分の指向性の鋭さが増すことの説明図である。 空間エイリアスによる指向特性の変化の例を示す説明図である。 角度を表す用語の説明図である。
(A)第1の実施形態
以下、本発明による音声信号処理装置及びプログラムの第1の実施形態を、図面を参照しながら詳述する。第1の実施形態の音声処理装置は、コヒーレンスフィルタ法を適用して、音声信号中に含まれる雑音成分を抑圧するものである。
(A−1)第1の実施形態の考え方
マイクロホン間隔が広がることに付随して指向性信号における低域成分の指向性が強くなる現象は、上述したように不可避である。マイクロホン間隔が、低域成分の指向性が強くなる程度に広い場合には、過度な抑圧処理が行われないように、第1の実施形態では、音質と抑圧性能とがほどほどに両立するような値に、コヒーレンスフィルタ係数を補正することとした。
図1及び図2は、マイクロホン間隔が広い場合と狭い場合との低域におけるコヒーレンスフィルタ係数の挙動を2つの到来方位(斜め前及び横)について比較した図であり、図1はマイクロホン間隔が広い場合の挙動を示し、図2はマイクロホン間隔が狭い場合の挙動を示している。なお、この明細書において、「斜め前」、後述する「中間」、「横」は、前方(正面)に対して図11に示すような角度だけずれた方向をいう。マイクロホン間隔が広い場合には、図1から分かるように、コヒーレンスフィルタ係数は極めて小さい値をとる上に、妨害音の到来方位による変化がほとんどない。一方、マイクロホン間隔が狭い場合には、図2から分かるように、コヒーレンスフィルタ係数が大きくなり、到来方位によるレンジの違いも顕著になる。
このような特性に基づいて、マイクロホン間隔が広い場合において、マイクロホン間隔が狭い場合の抑圧性能と音質がほどほどに両立するコヒーレンスフィルタ係数値に近付ける。具体的には、到来方位ごとに、マイクロホン間隔が狭い場合の係数値とマイクロホン間隔が広い場合とのコヒーレンスの比率を予め算出して記憶しておき、これを低域のコヒーレンスフィルタ係数への補正ゲインとして乗算する。上述したように、マイクロホン間隔が狭い場合と広い場合の低域コヒーレンスフィルタ係数のレンジはある程度特定できるので、両者の比率を事前に定めておくことは可能である。
第1の実施形態はマイクロホン間隔が広い場合であり(例えば、10数cm)、第1の実施形態は、低域のコヒーレンスフィルタ係数を補正することで、マイクロホン間隔が狭い場合のコヒーレンスフィルタ係数の特性に近付け、音質を改善しようとしたものである。
(A−2)第1の実施形態の構成
図3は、第1の実施形態に係る音声信号処理装置の構成を示すブロック図である。ここで、一対のマイクロホンm1及びm2を除いた部分は、ハードウェアで構成することも可能であり、また、CPUが実行するソフトウェア(音声信号処理プログラム)とCPUとで実現することも可能であるが、いずれの実現方法を採用した場合であっても、機能的には図3で表すことができる。
図3において、第1の実施形態に係る音声信号処理装置10は、一対のマイクロホンm1、m2、FFT(高速フーリエ変換)部11、コヒーレンスフィルタ処理部12及びIFFT(逆高速フーリエ変換)部13を有する。
一対のマイクロホンm1、m2は、上述した課題が生じる程度に広い所定距離(若しくは任意の距離)だけ離れて配置され、それぞれ、周囲の音声を捕捉するものである。各マイクロホンm1、m2は、無指向のもの(若しくは、正面方向にごくごく緩やかな指向性を有するもの)である。各マイクロホンm1、m2で捕捉された音声信号(入力信号)は、図示しない対応するA/D変換器を介してデジタル信号s1(n)、s2(n)に変換されてFFT部11に与えられる。なお、nはサンプルの入力順を表すインデックスであり、正の整数で表現される。本文中では、nが小さいほど古い入力サンプルであり、大きいほど新しい入力サンプルであるとする。音声信号(入力信号)の帯域は、例えば、0Hz〜8000Hzである。この帯域内の部分帯域として後述する低域や中域がある。
FFT部11は、マイクロホンm1及びm2から入力信号系列s1(n)及びs2(n)を受け取り、その入力信号s1及びs2に高速フーリエ変換(あるいは離散フーリエ変換)を行うものである。これにより、入力信号s1及びs2を周波数領域で表現することができる。なお、高速フーリエ変換を実施するにあたり、入力信号s1(n)及びs2(n)から、所定のN個のサンプルからなる分析フレームFRAME1(K)及びFRAME2(K)を構成して適用する。入力信号s1(n)から分析フレームFRAME1(K)を構成する例を以下の(1)式に示すが、分析フレームFRAME2(K)も同様である。
Figure 0006295650
なお、Kはフレームの順番を表すインデックスであり、正の整数で表現される。本文中では、Kが小さいほど古い分析フレームであり、大きいほど新しい分析フレームであるとする。また、以降の説明において、特に但し書きがない限りは、分析対象となる最新の分析フレームを表すインデックスはKであるとする。
FFT部11は、分析フレームごとに高速フーリエ変換処理を施すことで、周波数領域信号X1(f,K)、X2(f,K)に変換し、得られた周波数領域信号X1(f,K)及びX2(f,K)をそれぞれ、コヒーレンスフィルタ処理部12に与える。なお、fは周波数を表すインデックスである。また、X1(f,K)は単一の値ではなく、(2)式に示すように、複数の周波数f1〜fmのスペクトル成分から構成されるものである。さらに、X1(f,K)は複素数であり、実部と虚部からなる。X2(f,K)や後述するB1(f,K)及びB2(f,K)も同様である。
X1(f,K)={X1(f1,K),X1(f2,K),…,X1(fm,K)} …(2)
後述するコヒーレンスフィルタ処理部12においては、周波数領域信号X1(f,K)及びX2(f,K)のうち、周波数領域信号X1(f,K)をメインとし、周波数領域信号X2(f,K)をサブとして処理を行うが(後述する(7)式参照)、周波数領域信号X2(f,K)をメインとし、周波数領域信号X1(f,K)をサブとして処理を行っても良い。
コヒーレンスフィルタ処理部12は、後述する図4に示す詳細構成を有し、コヒーレンスフィルタ処理を実行し、雑音成分が抑圧された信号Y(f,K)を得て、IFFT部13に与えるものである。
IFFT部13は、雑音抑圧後信号Y(f,K)に対して、逆高速フーリエ変換を施して時間領域信号である出力信号y(n)を得るものである。
図4は、コヒーレンスフィルタ処理部12の詳細構成を示すブロック図である。
図4において、コヒーレンスフィルタ処理部12は、入力信号受信部21、指向性形成部22、フィルタ係数計算部23、コヒーレンス計算部24、到来方位推定部25、補正ゲイン決定部26、フィルタ係数補正部27、フィルタ処理部28及びフィルタ処理後信号送信部29を有する。
入力信号受信部21は、FFT部11から出力された周波数領域信号X1(f,K)、X2(f,K)を受け取るものである。
指向性形成部22は、第1及び第2の指向性信号)B1(f,K)及びB2(f,K)を形成するものである。指向性信号B1(f,K)、B2(f,K)を形成する方法は、既存の方法を適用することができ、例えば、(3)式及び(4)式に従った演算により求める方法を適用することができる。
Figure 0006295650
フィルタ係数計算部23は、第1及び第2の指向性信号B1(f,K)及びB2(f,K)に基づいて、(5)式に従って、コヒーレンスフィルタ係数coef(f,K)を計算するものである。
コヒーレンス計算部24は、コヒーレンスフィルタ係数coef(f,K)に基づいて、(6)式に従って、妨害音の到来方位の推定し得る指標値としてコヒーレンスCOH(K)を計算するものである。コヒーレンスCOH(K)は、(6)式に示すように、コヒーレンスフィルタ係数coef(f、K)を中域の周波数(例えば、2000Hz〜4000Hz程度を中域とする)若しくは全周波数で算術平均した値である。
Figure 0006295650
到来方位推定部25は、妨害音の到来方位を推定し、推定した到来方位Angleを得るものである。ここで、到来方位は、正面方位からずれた角度を言い、例えば、右側にΘずれたときも左側にΘずれたときも、同様にΘとなり、どちら側にずれたかの情報は含まれていない。後述するように、補正ゲインgain(K)の決定では、どちら側にずれたかの情報は必要ではない。
到来方位推定部25は、コヒーレンスCOH(K)を利用しないで推定するものであっても良いが、以下では、コヒーレンスCOH(K)を利用して推定する場合を説明する。到来方位推定部25は、コヒーレンスCOH(K)を利用した到来方位の推定方法として、特許文献2に記載のような既存のものを適用しても良い。しかし、第1の実施形態では、後述する図6に示す詳細構成が実行する新たなコヒーレンスCOH(K)を利用した推定方法に従って推定している。なお、特許文献2に記載のような既存の推定方法を適用する場合には、上述したコヒーレンス計算部24は、コヒーレンスフィルタ係数coef(f、K)を全周波数で算術平均した値としてコヒーレンスCOH(K)を算出する。一方、図6に示す詳細構成が適用している推定方法を適用する場合には、上述したコヒーレンス計算部24は、中域の周波数についてのコヒーレンスフィルタ係数coef(f、K)を算術平均した値としてコヒーレンスCOH(K)を算出する。
補正ゲイン決定部26は、推定到来方位Angleに基づいて、低域(例えば1000Hz以下)のコヒーレンスフィルタ係数coef(f、K)に対する補正ゲインgain(K)を得る。補正ゲイン決定部26としては、推定到来方位Angleと補正ゲインgain(K)とを対応付けた図5に示すテーブルを利用するものを挙げることができる。図5は、推定到来方位Angleが範囲Θに属するときに補正ゲインgain(K)をαにし、推定到来方位Angleが範囲ψに属するときに補正ゲインgain(K)をβにし、推定到来方位Angleが範囲φに属するときに補正ゲインgain(K)をγにすることを表している。補正ゲインgain(K)には、その到来方位における、マイクロホン間隔が広い場合のコヒーレンスフィルタ係数に対するマイクロホン間隔が狭い場合のコヒーレンスフィルタ係数の比が設定されており、補正ゲインgain(K)を、マイクロホン間隔が広い場合のコヒーレンスフィルタ係数に乗算することにより、マイクロホン間隔が狭い場合のコヒーレンスフィルタ係数に変換できるようになされている。
なお、到来方位推定部25が斜め前、中間(斜め前と横の中間の角度)、横のように所定角度ずつずれた値でしか推定できない場合には、テーブルの推定到来方位Angleにはその推定角度を記述しておけば良い。また、補正ゲイン決定部26として、推定到来方位Angleから補正ゲインgain(K)を算出するための関数を利用したものを適用しても良い。
フィルタ係数補正部27は、低域のコヒーレンスフィルタ係数coef(f、K)を補正ゲインgain(K)倍だけ補正するものである。
フィルタ処理部28は、低域補正後のコヒーレンスフィルタ係数coef(f、K)を適用して、(7)式に示すように、メインの周波数領域信号X1(f,K)に対するコヒーレンスフィルタ処理を行い、雑音抑圧後信号(フィルタ処理後信号)Y(f、K)を得るものである。なお、(7)式は、各周波数のそれぞれの演算(乗算処理)を表している。
Y(f、K)=X1(f、K)×coef(f、K) …(7)
ここで、コヒーレンスフィルタ処理の物理的な意味を補足しておく。コヒーレンスフィルタ係数coef(f、K)(低域補正後のコヒーレンスフィルタ係数も同様)は、左右に死角を有する信号成分の相互相関であるので、相関が大きい場合には到来方位には偏りがない正面から到来する音声成分であり、相関が小さい場合には到来方位が右か左に偏った成分である、というように入力音声の到来方位とも対応付けられる。従って、コヒーレンスフィルタ係数coef(f、K)を乗算することは横から到来する雑音成分を抑圧する処理であるということができる。
フィルタ処理後信号送信部29は、雑音抑圧後信号Y(f,K)を後段のIFFT部13に与えるものである。また、フィルタ処理後信号送信部29は、Kを1だけ増加させて次のフレームの処理を起動させるものである。
図6は、上述した到来方位推定部25の詳細構成を示すブロック図である。図6において、到来方位推定部25は、コヒーレンス受信部31、問合せ部32、記憶部33及び到来方位送信部34を有する。
コヒーレンス受信部31は、コヒーレンス計算部24が計算したコヒーレンスCOH(K)を受信するものである。ここでのコヒーレンスCOH(K)は、中域(の周波数)についてのコヒーレンスフィルタ係数coef(f、K)を算術平均した値であり、以下、中域コヒーレンスと呼ぶこともある。
記憶部33は、中域コヒーレンスCOH(K)と到来方位Angleとを対応付けた変換テーブルを記憶しているものである。
問合せ部32は、コヒーレンス受信部31が受信した中域コヒーレンスCOH(K)に対応した到来方位Angleを取り出すものである。
到来方位送信部34は、問合せ部32が取り出した到来方位Angleを補正ゲイン決定部26に出力するものである。
図7は、記憶部33における変換テーブルの記載内容の説明図である。図7の例では、中域コヒーレンスCOH(K)がA以上B未満のときに到来方位Angleとして斜め前が対応付けられ、中域コヒーレンスCOH(K)がB以上C未満のときに到来方位Angleとして横が対応付けられ、中域コヒーレンスCOH(K)がC以上D未満のときに到来方位Angleとして中間が対応付けられている。
この変換テーブルは、空間エイリアスを含む中域コヒーレンスフィルタ係数に特有の大小関係に基づいて到来方位が得られるように構成されている。
図8は、妨害音の到来方位毎の中域コヒーレンスの挙動を示す説明図である。2000Hz〜4000Hzの中域の周波数帯では、上述した図10のように、数方位に指向性を持ち左右対称に近い、という形状をしている。そのため、ある到来方位では中域コヒーレンスCOH(K)が小さく、別の方位では中域コヒーレンスCOH(K)が大きくなるというように、到来方位による中域コヒーレンスCOH(K)の差が出やすく、この点に基づいて、図7の変換テーブルが構成されている。ここで注意を要するのは、到来方位による中域コヒーレンスのレンジは、「斜め前の場合<横の場合<中間の場合」のように、中域コヒーレンスCOH(K)の大小関数と到来方位の大小関係とに単調増加関数若しくは単調減少関数という関係がないことである。このような単調な関係がないにも関わらず、中域コヒーレンスCOH(K)を用いて到来方位を推定できることを見出したのは、本件発明者の独創力による。
(A−3)第1の実施形態の動作
次に、第1の実施形態の音声信号処理装置10の動作を、図面を参照しながら、全体動作、コヒーレンスフィルタ処理部12における詳細動作、到来方位推定部25における詳細動作の順に説明する。
一対のマイクロホンm1及びm2から入力された信号s1(n)、s2(n)はそれぞれ、FFT部11によって時間領域から周波数領域の信号X1(f,K)、X2(f,K)に変換された後、コヒーレンスフィルタ処理部12に与えられる。これにより、コヒーレンスフィルタ処理部12において、コヒーレンスフィルタ処理が実行され、得られた雑音抑圧後信号Y(f,K)がIFFT部13に与えられる。IFFT部13においては、周波数領域信号である雑音抑圧後信号Y(f,K)が、逆高速フーリエ変換によって、時間領域信号y(n)に変換され、この時間領域信号y(n)が出力される。
次に、コヒーレンスフィルタ処理部12における詳細動作を説明する。なお、コヒーレンスフィルタ処理部12の詳細構成を示す上述した図4は、コヒーレンスフィルタ処理部12の処理を示すフローチャートと見ることもできる。以下では、あるフレームの処理を説明するが、フレームごとに、以下に説明する処理が繰り返される。
新たなフレームになり、新たなフレーム(現フレームK)の周波数領域信号X1(f,K)、X2(f,K)がFFT部11から与えられると、(3)式及び(4)式に従って、第1及び第2の指向性信号B1(f,K)及びB2(f,K)が計算され、さらに、これらの指向性信号B1(f,K)及びB2(f,K)に基づき、(5)式に従って、コヒーレンスフィルタ係数coef(f,K)が計算される。さらにまた、コヒーレンスフィルタ係数coef(f,K)に基づき、(6)式に従って、妨害音の到来方位の推定し得る指標値として中域コヒーレンスCOH(K)が計算される。
その後、到来方位推定部25において、中域コヒーレンスCOH(K)をキーとして図7に示す変換テーブルが参照されて、妨害音の到来方位Angleが推定される。
そして、補正ゲイン決定部26において、推定到来方位Angleをキーとして図5の変換テーブルが参照されて、低域のコヒーレンスフィルタ係数coef(f、K)に対する補正ゲインgain(K)が得られ、フィルタ係数補正部27において、低域のコヒーレンスフィルタ係数coef(f、K)が補正ゲインgain(K)倍されて補正される。
その後、フィルタ処理部28において、得られた低域補正後のコヒーレンスフィルタ係数coef(f、K)に基づき、(7)式に従って、メインの周波数領域信号X1(f,K)に対するコヒーレンスフィルタ処理が実行され、得られた雑音抑圧後信号(フィルタ処理後信号)Y(f、K)がIFFT部13に与えられると共に、フレーム変数Kが1だけ増加されて、次のフレームの処理に移行する。
次に、到来方位推定部25における詳細動作を説明する。
コヒーレンス受信部31は、コヒーレンス計算部24が計算した中域コヒーレンスCOH(K)が与えられると、到来方位推定部25の問合せ部32によって、記憶部33から、与えられた中域コヒーレンスCOH(K)に対応する到来方位Angleが取り出されて出力される。
以上が第1の実施形態の動作概要である。
(A−4)第1の実施形態の効果
以上のように、第1の実施形態によれば、マイクロホン間隔が広がって低域で形成される指向性が極端に強くなった場合にも、マイクロホン間隔が狭い場合のコヒーレンスフィルタ係数と、マイクロホン間隔が広い場合のコヒーレンスフィルタ係数に特有の挙動の違いに基づいて、マイクロホン間隔が狭い場合のコヒーレンスフィルタ係数に近い値に補正することができる。これにより、過度な抑圧処理によって音質が劣化することがなくなる。また、マイクロホン間隔の制限を緩和し、設計者が任意の間隔でマイクロホンアレイを構成することができるようになる。
また、第1の実施形態によれば、マイクロホン間隔が広がって空間エイリアスが混入した場合にも、中域コヒーレンスフィルタ係数に特有の挙動に基づいて到来方位を推定することができるようになる。これにより、マイクロホン間隔の制限を緩和し、設計者が任意の間隔でマイクロホンアレイを構成することができるようになる。
以上の効果により、第1の実施形態の音声信号処理装置若しくはプログラムを適用した、テレビ会議装置や携帯電話機やスマートフォンなどの通信装置における通話音質の向上が期待できる。
(B)他の実施形態
上記第1の実施形態の説明においても、種々変形実施形態に言及したが、さらに、以下に例示するような変形実施形態を挙げることができる。
第1の実施形態では、低域のコヒーレンスフィルタ係数を補正ゲインで補正するものを示したが、補正ゲインに加え、調整係数を乗算し、雑音抑圧性能と音質を調整できるようにしても良い。例えば、調整用操作子(キーボード上の所定のキーを利用しても良い)に対する操作で調整係数を可変できるようにしても良く、また、調整係数の適用の有無だけを指定できるようにしても良い。
上記第1の実施形態では、一対のマイクロホンm1及びm2の間隔が固定のものを示したが、少なくとも一方のマイクロホンを移動可能とし、マイクロホンm1及びm2の間隔が可変のものであっても良い。この場合において、マイクロホン間隔に応じて、適用する変換テーブルを切り替えるようにしても良い。例えば、マイクロホン間隔が8cm〜10cm用の変換テーブル、マイクロホン間隔が10cm〜12cm用の変換テーブル、マイクロホン間隔が12cm〜14cm用の変換テーブルなど、複数の変換テーブルを用意しておき、そのときのマイクロホン間隔に応じて適用する変換テーブルを選択すれば良い。ここで、マイクロホン間隔を利用者が入力しても良く、マイクロホンの移動位置を段階的に設け、各段階に設けられたセンサによりマイクロホン間隔を自動的に得るようにしても良い。
第1の実施形態では、中域コヒーレンスCOH(K)をキーとして到来方位Angleを得、到来方位Angleをキーとして補正ゲインgain(K)を得る場合を示したが、中域コヒーレンスCOH(K)と補正ゲインgain(K)とを直接対応付けた変換テーブルを用意し、中域コヒーレンスCOH(K)をキーとして補正ゲインgain(K)を直接得るようにしても良い。第1の実施形態で説明した他の到来方位の推定方法を適用する場合においても、同様な変形実施形態を挙げることができる。
第1の実施形態では、推定した到来方位から補正ゲインを得るものを示したが、これに加え、他の目的のために推定した到来方位を適用するようにしても良い。例えば、妨害音の到来方位に応じて決定したフロアリング閾値を適用して、高域のコヒーレンスフィルタ係数にフロアリング処理を施すようにしても良い(特願2013−154825号明細書及び図面)。
第1の実施形態では、どの到来方位でも補正ゲインを適用して補正する低域が同じものを示したが、到来方位に応じて補正ゲインを適用して補正する低域の幅を変えるようにしても良い。例えば、到来方位がXのときは1000Hzまでを低域とし、到来方位がYのときは1100Hzまでを低域とするようにしても良い。これに加え、又は、これに代え、マイクロホン間隔によっても低域の幅を変えるようにしても良い。
第1の実施形態では、マイクロホン間隔によらずに中域が同じものを示したが、マイクロホン間隔によって中域の幅及び中域の中心周波数の少なくとも一方を変えるようにしても良い。
第1の実施形態で説明した到来方位の推定方法は、その用途は、コヒーレンスフィルタ法に従った雑音抑圧に限定されるものではなく、妨害音の到来方位の情報を必要とする種々の信号処理に適用することができる。例えば、コヒーレンスフィルタ法以外の雑音抑圧処理、音源分離処理、音声符号化処理などに、第1の実施形態で説明した到来方位の推定方法を適用することができる。
用途によっては、コヒーレンスフィルタ係数の算出自体を中域に限定して行っても良い。
ここで、第1の実施形態で説明した到来方位の推定方法では、正面とのずれ角度(の絶対値)として到来方位が推定されるものを示したが、右側からの到来か左側からの到来かの情報を必要とする場合には、(8)式の計算を行い、得られた値が正であれば右側からの到来、得られた値が負であれば左側からの到来と定めるようにしても良い。
Figure 0006295650
第1の実施形態において、周波数領域の信号で処理していた処理を、可能ならば時間領域の信号で処理するようにしても良く、逆に、時間領域の信号で処理していた処理を、可能ならば周波数領域の信号で処理するようにしても良い。
第1の実施形態では、雑音抑制技術として、コヒーレンスフィルタ法を単独で適用したものを示したが、他の雑音抑制技術、例えば、ボイススイッチ法、ウィーナーフィルタ法、周波数減算法と併用するようにしても良い。
上記各実施形態では、一対のマイクロホンが捕捉した信号を直ちに処理する音声信号処理装置やプログラムを示したが、本発明の処理対象の音声信号はこれに限定されるものではない。例えば、記録媒体から読み出した一対の音声信号を処理する場合にも、本発明を適用することができ、また、対向装置から送信されてきた一対の音声信号を処理する場合にも、本発明を適用することができる。
10…音声信号処理装置、11…FFT部、12…コヒーレンスフィルタ処理部、13…IFFT部、m1、m2…マイクロホン、21…入力信号受信部、22…指向性形成部、23…フィルタ係数計算部、24…コヒーレンス計算部、25…到来方位推定部、26…補正ゲイン決定部、27…フィルタ係数補正部、28…フィルタ処理部、29…フィルタ処理後信号送信部、31…コヒーレンス受信部、32…問合せ部、33…記憶部、34…到来方位送信部。

Claims (5)

  1. 一対のマイクロホンが捕捉して得た入力音声信号に含まれている雑音成分をコヒーレンスフィルタ処理によって抑制する音声信号処理装置において、
    コヒーレンスフィルタ係数を算出するコヒーレンスフィルタ係数算出手段と、
    上記入力音声信号に含まれている妨害音の到来方位を推定する到来方位推定手段と、
    推定された到来方位に対応した補正ゲインを得て、低域のコヒーレンスフィルタ係数をその補正ゲインで補正する低域フィルタ係数補正手段と、
    補正された低域のコヒーレンスフィルタ係数を含めた全帯域のコヒーレンスフィルタ係数を適用してコヒーレンスフィルタ処理を行うフィルタ処理実行手段とを有し、
    到来方位に対応する上記補正ゲインは、一対のマイクロホンの間隔が狭い場合のコヒーレンスフィルタ係数に対する一対のマイクロホンの間隔が広い場合のコヒーレンスフィルタ係数の比率に基づいて決定されている
    ことを特徴する音声信号処理装置。
  2. 上記到来方位推定手段は、
    限定された帯域のコヒーレンスフィルタ係数を適用して限定帯域のコヒーレンスを算出する限定帯域コヒーレンス算出部と、
    限定帯域のコヒーレンスの種々の値と到来方位とを予め対応付けており、算出された限定帯域のコヒーレンスに基づいて、対応付けられた到来方位を得て推定値として出力する到来方位取得部とを有する
    ことを特徴とする請求項1に記載の音声信号処理装置。
  3. 一対のマイクロホンが捕捉して得た入力音声信号に含まれている雑音成分をコヒーレンスフィルタ処理によって抑制する音声信号処理プログラムであって、
    コンピュータを、
    コヒーレンスフィルタ係数を算出するコヒーレンスフィルタ係数算出手段と、
    上記入力音声信号に含まれている妨害音の到来方位を推定する到来方位推定手段と、
    推定された到来方位に対応した補正ゲインを得て、低域のコヒーレンスフィルタ係数をその補正ゲインで補正する低域フィルタ係数補正手段と、
    補正された低域のコヒーレンスフィルタ係数を含めた全帯域のコヒーレンスフィルタ係数を適用してコヒーレンスフィルタ処理を行うフィルタ処理実行手段と
    して機能させ、
    到来方位に対応する上記補正ゲインは、一対のマイクロホンの間隔が狭い場合のコヒーレンスフィルタ係数に対する一対のマイクロホンの間隔が広い場合のコヒーレンスフィルタ係数の比率に基づいて決定されている
    ことを特徴する音声信号処理プログラム。
  4. 一対のマイクロホンが捕捉して得た入力音声信号に含まれている妨害音の到来方位を推定する音声信号処理装置において、
    少なくとも限定帯域のコヒーレンスフィルタ係数を算出するコヒーレンスフィルタ係数算出手段と、
    限定帯域のコヒーレンスフィルタ係数を適用して限定帯域のコヒーレンスを算出する限定帯域コヒーレンス算出手段と、
    限定帯域のコヒーレンスの種々の値と到来方位とを予め対応付けており、算出された限定帯域のコヒーレンスに基づいて、対応付けられた到来方位を得て推定値として出力する到来方位取得手段と
    推定された到来方位に対応した補正ゲインを得て、限定帯域のコヒーレンスフィルタ係数をその補正ゲインで補正する限定帯域フィルタ係数補正手段とを有し、
    到来方位に対応する上記補正ゲインは、一対のマイクロホンの間隔が狭い場合のコヒーレンスフィルタ係数に対する一対のマイクロホンの間隔が広い場合のコヒーレンスフィルタ係数の比率に基づいて決定されている
    ことを特徴とする音声信号処理装置。
  5. 一対のマイクロホンが捕捉して得た入力音声信号に含まれている妨害音の到来方位を推定する音声信号処理プログラムであって、
    コンピュータを、
    少なくとも限定帯域のコヒーレンスフィルタ係数を算出するコヒーレンスフィルタ係数算出手段と、
    限定帯域のコヒーレンスフィルタ係数を適用して限定帯域のコヒーレンスを算出する限定帯域コヒーレンス算出手段と、
    限定帯域のコヒーレンスの種々の値と到来方位とを予め対応付けており、算出された限定帯域のコヒーレンスに基づいて、対応付けられた到来方位を得て推定値として出力する到来方位取得手段と
    推定された到来方位に対応した補正ゲインを得て、限定帯域のコヒーレンスフィルタ係数をその補正ゲインで補正する限定帯域フィルタ係数補正手段として機能させ
    到来方位に対応する上記補正ゲインは、一対のマイクロホンの間隔が狭い場合のコヒーレンスフィルタ係数に対する一対のマイクロホンの間隔が広い場合のコヒーレンスフィルタ係数の比率に基づいて決定されている
    ことを特徴とする音声信号処理プログラム。
JP2013267711A 2013-12-25 2013-12-25 音声信号処理装置及びプログラム Active JP6295650B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013267711A JP6295650B2 (ja) 2013-12-25 2013-12-25 音声信号処理装置及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013267711A JP6295650B2 (ja) 2013-12-25 2013-12-25 音声信号処理装置及びプログラム

Publications (2)

Publication Number Publication Date
JP2015126279A JP2015126279A (ja) 2015-07-06
JP6295650B2 true JP6295650B2 (ja) 2018-03-20

Family

ID=53536737

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013267711A Active JP6295650B2 (ja) 2013-12-25 2013-12-25 音声信号処理装置及びプログラム

Country Status (1)

Country Link
JP (1) JP6295650B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022038673A1 (ja) * 2020-08-18 2022-02-24 日本電信電話株式会社 収音装置、収音方法、プログラム

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030061032A1 (en) * 2001-09-24 2003-03-27 Clarity, Llc Selective sound enhancement
JP4247037B2 (ja) * 2003-01-29 2009-04-02 株式会社東芝 音声信号処理方法と装置及びプログラム
JP4912036B2 (ja) * 2006-05-26 2012-04-04 富士通株式会社 指向性集音装置、指向性集音方法、及びコンピュータプログラム
US8724829B2 (en) * 2008-10-24 2014-05-13 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for coherence detection
JP5691804B2 (ja) * 2011-04-28 2015-04-01 富士通株式会社 マイクロホンアレイ装置及び音信号処理プログラム
JP5838861B2 (ja) * 2012-02-29 2016-01-06 沖電気工業株式会社 音声信号処理装置、方法及びプログラム

Also Published As

Publication number Publication date
JP2015126279A (ja) 2015-07-06

Similar Documents

Publication Publication Date Title
KR101597752B1 (ko) 잡음 추정 장치 및 방법과, 이를 이용한 잡음 감소 장치
JP5817366B2 (ja) 音声信号処理装置、方法及びプログラム
US8891780B2 (en) Microphone array device
WO2014054314A1 (ja) 音声信号処理装置、方法及びプログラム
JP2004187283A (ja) マイクロホン装置および再生装置
JP5838861B2 (ja) 音声信号処理装置、方法及びプログラム
JP5927887B2 (ja) 非目的音抑制装置、非目的音抑制方法及び非目的音抑制プログラム
KR20080000478A (ko) 휴대 단말기에서 복수의 마이크들로 입력된 신호들의잡음을 제거하는 방법 및 장치
JP6221257B2 (ja) 信号処理装置、方法及びプログラム
JP6314475B2 (ja) 音声信号処理装置及びプログラム
JPWO2016076237A1 (ja) 信号処理装置、信号処理方法および信号処理プログラム
JP6295650B2 (ja) 音声信号処理装置及びプログラム
JP6221258B2 (ja) 信号処理装置、方法及びプログラム
JP6638248B2 (ja) 音声判定装置、方法及びプログラム、並びに、音声信号処理装置
WO2016045706A1 (en) Method and apparatus for generating a directional sound signal from first and second sound signals
JP6221463B2 (ja) 音声信号処理装置及びプログラム
JP6631127B2 (ja) 音声判定装置、方法及びプログラム、並びに、音声処理装置
JP6263890B2 (ja) 音声信号処理装置及びプログラム
US11495241B2 (en) Echo delay time estimation method and system thereof
JP6252274B2 (ja) 背景雑音区間推定装置及びプログラム
JP6544182B2 (ja) 音声処理装置、プログラム及び方法
JP6903947B2 (ja) 非目的音抑圧装置、方法及びプログラム
JP2014164192A (ja) 信号処理装置、方法及びプログラム
JP6213324B2 (ja) 音声信号処理装置及びプログラム
JP2015025914A (ja) 音声信号処理装置及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160816

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170616

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170627

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170825

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180123

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180205

R150 Certificate of patent or registration of utility model

Ref document number: 6295650

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150