JP6263890B2 - 音声信号処理装置及びプログラム - Google Patents

音声信号処理装置及びプログラム Download PDF

Info

Publication number
JP6263890B2
JP6263890B2 JP2013154824A JP2013154824A JP6263890B2 JP 6263890 B2 JP6263890 B2 JP 6263890B2 JP 2013154824 A JP2013154824 A JP 2013154824A JP 2013154824 A JP2013154824 A JP 2013154824A JP 6263890 B2 JP6263890 B2 JP 6263890B2
Authority
JP
Japan
Prior art keywords
noise
signal
frequency
unit
averaging
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013154824A
Other languages
English (en)
Other versions
JP2015025913A (ja
Inventor
克之 高橋
克之 高橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2013154824A priority Critical patent/JP6263890B2/ja
Publication of JP2015025913A publication Critical patent/JP2015025913A/ja
Application granted granted Critical
Publication of JP6263890B2 publication Critical patent/JP6263890B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、音声信号処理装置及びプログラムに関し、例えば、電話機やテレビ会議装置などの音声信号(この明細書では、音声信号や音響信号等の音信号を「音声信号」と呼んでいる)を用いる通信機又は通信ソフトウェアに適用し得るものである。
取得した音声信号(音響信号や音声信号などの各種の音信号をこの明細書では「音声信号」と呼んでいる)中に含まれる雑音成分を抑圧する手法の一つとして、スペクトル減算法を挙げることができる。特許文献1(における第4の実施形態)には、一対のマイクロホンが捕捉した入力信号に基づいて、正面方向(一対のマイクロホンを結ぶ線分に直交する目的音源側の方向)の信号成分を抑圧して、正面に死角を有する雑音信号を形成し、一方の入力信号から雑音信号をスペクトル減算することにより、横から到来する雑音信号を抑圧する手法が記載されている。
特開2013−061421号公報
スペクトル減算法は、単純な処理で入力信号に含まれている雑音成分を抑圧できるという効果を奏する一方で、ミュージカルノイズという異音成分が発生し、音の自然さを損ねるという課題がある。
ここで、雑音成分の抑圧性能を高めればミュージカルノイズが増し、ミュージカルノイズを減らすためには抑圧性能を下げなければならないというように、雑音成分の抑圧とミュージカルノイズの発生の抑制との間にはトレードオフの関係にあるため、音質と抑圧性能を共に満足させることは難しかった。
そのため、音質の低下を招かずに雑音を十分に抑圧できる音声信号処理装置及びプログラムが望まれている。
第1の本発明は、入力音声信号から雑音信号形成手段が雑音信号を形成し、周波数減算手段が、上記入力音声信号から、形成した雑音信号をスペクトル減算することにより入力音声信号に含まれている雑音成分を抑制する音声信号処理装置において、(1)上記雑音信号形成手段が形成した上記雑音信号を、周波数領域上で平滑化してから、上記周波数減算手段に与える雑音平滑化手段を有し、(2)上記雑音平滑化手段は、上記雑音信号における各周波数の成分を、近接する周波数成分と平均化することにより平滑化する平均処理部を備え、さらに、(3)上記入力音声信号における雑音成分の到来方位を反映した値を計算する雑音方位反映値計算部と、(4)上記平均化における近接周波数成分の反映度合を表す平均化パラメータを、計算された到来方位を反映した値に応じて決定する平均化パラメータ決定部とを有することを特徴とする。
第2の本発明の音声信号処理プログラムは、コンピュータを、(1)入力音声信号から雑音信号を形成する雑音信号形成手段と、(2)形成された上記雑音信号を、周波数領域上で平滑化する雑音平滑化手段と、(3)上記入力音声信号から平滑化された雑音信号をスペクトル減算することにより入力音声信号に含まれている雑音成分を抑制する周波数減算手段として機能させ、(4)上記雑音平滑化手段は、上記雑音信号における各周波数の成分を、近接する周波数成分と平均化することにより平滑化する平均処理部を備え、さらに、上記コンピュータを、(5)上記入力音声信号における雑音成分の到来方位を反映した値を計算する雑音方位反映値計算部と、(6)上記平均化における近接周波数成分の反映度合を表す平均化パラメータを、計算された到来方位を反映した値に応じて決定する平均化パラメータ決定部として機能させることを特徴とする。
本発明によれば、一旦得られた雑音信号を周波数領域上で平滑化してから、入力音声信号からスペクトル減算するようにしたので、音質の低下を招かずに雑音を十分に抑圧できる音声信号処理装置及びプログラムを提供できる。
第1の実施形態に係る音声信号処理装置の構成を示すブロック図である。 第1の実施形態における雑音信号生成部が生成する雑音信号の指向性を示す説明図である。 第2の実施形態に係る音声信号処理装置の構成を示すブロック図である。 第2の実施形態における平均化パラメータ決定部が適用する変換テーブルを示す説明図である。 第3の実施形態に係る音声信号処理装置の構成を示すブロック図である。 第3の実施形態におけるコヒーレンス計算部の詳細構成を示すブロック図である。 第3の実施形態における指向性形成部からの指向性信号の性質を示す説明図である。 第3の実施形態における指向性形成部による2つの指向性の特性を示す説明図である。 方位ごとのコヒーレンスの挙動を示す説明図である。
(A)第1の実施形態
以下、本発明による音声信号処理装置及びプログラムの第1の実施形態を、図面を参照しながら詳述する。
第1の実施形態に係る音声信号処理装置及びプログラムは、以下の考え方によってなされたものである。
従来技術において問題となっていたミュージカルノイズの発生要因は、スペクトル減算処理により、特定の周波数成分が際立って大きくなる、あるいは、小さくなることによって、周波数領域上の孤立点が生じることであることが分かった。そこで、第1実施形態では、正面方向の抑圧処理により得られた雑音信号の各周波数成分に対して平滑化する操作を行うことにより、周波数領域での孤立点の発生を抑制し、ミュージカルノイズを軽減しようとした。
(A−1)第1の実施形態の構成
図1は、第1の実施形態に係る音声信号処理装置の構成を示すブロック図である。マイクロホンを除く図1に示す部分は、ハードウェア的に各種回路を接続して構築されても良く、また、CPU、ROM、RAMなどを有する汎用的な装置若しくはユニットが所定のプログラムを実行することで該当する機能を実現するように構築されても良く、いずれの構築方法を採用した場合であっても、機能的には、図1で表すことができる。
図1において、第1の実施形態の音声信号処理装置10は、マイクロホンm1、m2、FFT(高速フーリエ変換)部11、雑音信号生成部(正面抑圧信号生成部)12、平滑処理部13、周波数減算部14及びIFFT(逆高速フーリエ変換)部15を有する。
各マイクロホンm1、m2は、所定距離(若しくは任意の距離)だけ離れて配置され、それぞれ、周囲の音声を捕捉して電気信号(入力信号)に変換するものである。各マイクロホンm1、m2は、無指向のもの(若しくは、正面方向(後述する図2参照)にごくごく緩やかな指向性を有するもの)である。各マイクロホンm1、m2が捕捉して得た入力信号(アナログ信号)は、図示しないA/D変換器を介して、デジタル信号s1(n)、s2(n)に変換されてFFT部11に与えられる。なお、nはサンプルの入力順を表すインデックスであり、正の整数で表現される。本文中では、nが小さいほど古い入力サンプルであり、nが大きいほど新しい入力サンプルであるとする。
FFT部11は、マイクロホンm1及びマイクロホンm2からの入力信号系列s1及びs2を受け取り、その入力信号s1及びs2に高速フーリエ変換(あるいは離散フーリエ変換)を行うものである。これにより、入力信号s1及びs2は、周波数領域で表現される。なお、高速フーリエ変換を実施するに当たり、入力信号s1(n)及びs2(n)から、所定のN個のサンプルから成る、分析フレームFRAME1(K)及びFRAME2(K)を構成する。入力信号s1から分析フレームFRAME1(K)を構成する例を、以下の(1)式で表す。
Figure 0006263890
なお、Kはフレームの順番を表すインデックスであり、正の整数で表現される。本文中ではKが小さいほど古い分析フレームであり、Kが大きいほど新しい分析フレームであるとする。また、以降の動作説明において、特に但し書きがない限りは、分析対象となる最新の分析フレームを表すインデックスはKであるとする。
FFT部11は、入力信号s1から構成した分析フレームFRAME1(K)に高速フーリエ変換して得た周波数領域信号X1(f,K)、及び、入力信号s2から構成した分析フレームFRAME2(K)を高速フーリエ変換して得た周波数領域信号X2(f,K)を、雑音信号形成部12及び周波数減算部14に与えるものである。なお、fは周波数を表すインデックスである。また、X1(f,K)は、(2)式に示すように、単一の値ではなく、複数の周波数f1〜fmのスペクトル成分から構成されるものである。また、X1(f,K)は複素数であり、実部と虚部からなる。X2(f,K)や、雑音信号生成部12で生成される雑音信号N(f,K)も同様に表記されたものである。
以下の雑音信号生成部(正面抑圧信号生成部)12及び周波数減算部14においては、周波数領域信号X1(f,K)及びX2(f,K)のうち、周波数領域信号X1(f,K)をメインとし、周波数領域信号X2(f,K)をサブとして処理を行うが、周波数領域信号X2(f,K)をメインとし、周波数領域信号X1(f,K)をサブとして処理を行っても良い(後述する(3)式及び(5)式の右辺第1項にメインの信号がくる)。
雑音信号生成部12では、(3)式のような演算を行って雑音信号N(f,K)を生成する。(3)式の演算は、図2に示すように、正面に死角を有する指向性を形成する処理に相当する。従って、左右から到来する成分のみを得ることができる。今、目的方向を正面方向に想定しているので(例えば、目的話者が正面にいることを想定している)、横から到来する成分は雑音であるということができる。
N(f,K)=X1(f,K)−X2(f,K) …(3)
平滑処理部13は、雑音信号N(f,K)における各周波数の振幅スペクトルを、近傍の周波数の振幅スペクトルに近付ける平滑化を行うものである。平滑処理部13は、例えば、(4)式に示すような重み付け平均化処理により平滑化を行う。(4)式において、fiは、今処理対象の周波数(注目周波数)を表しており、周波数が小さい側から数えてi番目のFFTにおける周波数ポイントの周波数である。
Figure 0006263890
(4)式は、雑音信号N(f,K)における注目周波数fiの成分N(fi,K)と、注目周波数fiより小さい周波数成分f1〜fi−1(但し、「fi−1」は、注目周波数fiから1を減算したものを表しているのではなく、(i−1)番目のFFTにおける周波数ポイントの周波数を表している)までの周波数の平滑化後雑音信号AVE_N(fi−1,K)との重み付け平均値を計算している。(4)式の演算によって得られた平滑化後雑音信号AVE_N(fi,K)は、より低い周波数における雑音信号成分も寄与するため、周波数領域上の孤立点の発生を抑えることができる。
平滑処理部13が実行する平滑化のための演算は、(4)式の演算に限定されず、他の平滑化のための演算式を適用しても良い。例えば、注目周波数を中心とし、注目周波数を含めた近傍の複数の周波数の雑音信号成分(近傍周波数のものも平均化されていないものを適用する)の単純平均や重み付け平均を適用するようにしても良い。
周波数減算部14は、(5)式に示すように、メインの周波数領域信号X1(f,K)から平滑化後雑音信号AVE_N(f,K)をスペクトル減算して雑音抑圧後信号Y(f,K)を生成するものである。(5)式におけるε(0<ε<1)は、雑音成分の抑圧量を規定するパラメータである。(5)式の演算処理によって、入力信号に含まれる成分のうち、横から到来する雑音成分を抑圧することができる。
Y(f,K)=X1(f,K)−ε×AVE_N(f,K) …(5)
IFFT部15は、周波数領域信号である雑音抑圧後信号Y(f,K)を時間領域信号y(n)に変換するものである。なお、次段の処理回路が、周波数領域の信号の入力が好ましいものであればIFFT部15は省略される。
(A−2)第1の実施形態の動作
次に、第1の実施形態の音声信号処理装置10の動作を説明する。
一対のマイクロホンm1及びm2によって捕捉され、図示しないA/D変換器によってデジタル信号に変換された信号s1(n)、s2(n)は、FFT部11によって時間領域から周波数領域の信号X1(f,K)、X2(f,K)に変換される。
メインの周波数領域信号X1(f,K)は、雑音信号生成部12及び周波数減算部14に与えられ、サブの周波数領域信号X2(f,K)は、雑音信号生成部12に与えられる。
雑音信号生成部12においては、2つの周波数領域信号X1(f,K)及びX2(f,K)を適用した(3)式の演算が実行され、すなわち、正面方向に死角を有するような指向性の生成処理が実行され、これにより、左右から到来する成分のみを含む雑音信号N(f,K)が生成されて平滑処理部13に与えられる。
雑音信号N(f,K)に対して、平滑処理部13によって、(4)式の演算が実行され、すなわち、雑音信号N(f,K)における周波数領域での孤立点を抑制するような平滑化が実行され、平滑化後雑音信号AVE_N(fi,K)が得られて周波数減算部14に与えられる。
周波数減算部14においては、(5)式のように、メインの周波数領域信号X1(f,K)から平滑化後雑音信号AVE_N(f,K)がスペクトル減算され、雑音抑圧後信号Y(f,K)が生成される。
周波数領域信号である雑音抑圧後信号Y(f,K)は、IFFT部15によって、時間領域信号y(n)に変換されて出力される。
(A−3〉第1の実施形態の効果
第1の実施形態によれば、雑音信号をそのままスペクトル減算に適用するのではなく、雑音信号を周波数領域上で平滑化した後、スペクトル減算に適用するようにしたので、雑音抑圧後信号において、周波数領域上の孤立点の発生を防ぐことができる。従って、ミュージカルノイズを抑制しつつ、雑音抑圧を行うことができるので、音質と抑圧性能をバランスよく実現することができる。
これにより、第1の実施形態の音声信号処理装置若しくはプログラムを適用した、テレビ会議装置や携帯電話機などの通信装置における通話音質の向上が期待できる。
(B)第2の実施形態
次に、本発明による音声信号処理装置及びプログラムの第2の実施形態を、図面を参照しながら詳述する。
雑音抑圧後信号におけるミュージカルノイズの発生度合いは、SN比によっても変動する。特に、SN比が悪化した場合には、雑音信号の孤立点が増える傾向がある。そこで、第2の実施形態においては、(4)式に示すような平均処理における他の周波数成分の寄与を、SN比に応じて制御することとした。
(B−1)第2の実施形態の構成
図3は、第2の実施形態に係る音声信号処理装置の構成を示すブロック図であり、第1の実施形態に係る図1との同一、対応部分には同一符号を付して示している。
図3において、第2の実施形態の音声信号処理装置10Aは、マイクロホンm1、m2、FFT部11、雑音信号生成部12、平滑処理部13、周波数減算部14及びIFFT部15に加え、SN比計算部16及び平均化パラメータ決定部17を有する。
マイクロホンm1、m2、FFT部11、雑音信号生成部12、平滑処理部13、周波数減算部14及びIFFT部15は、第1の実施形態のものと同様であり、その機能説明は省略する。なお、第2の実施形態の平滑処理部13は、(4)式の演算を実行する際に、固定の平均化パラメータαを適用するのではなく、平均化パラメータ決定部17から与えられた平均化パラメータα(K)を適用する点は、第1の実施形態の平滑処理部と異なっている。
SN比計算部16は、FFT部11から与えられたメインの周波数領域信号X1(f,K)と、雑音信号生成部12から与えられた雑音信号N(f,K)とに基づいて、現フレームKにおけるSN比SNR(K)を計算するものである。例えば、SN比SNR(K)の計算式としては、(6)式を挙げることができる。(6)式の分母は、雑音信号のレベルであり、分子は、目的音信号のレベルである。第2の実施形態では、第1の実施形態と同様に、目的音は正面から到来し、雑音は横(左右)から到来することを前提しているので、(6)式によってSN比を推定することができる。(6)式におけるηは、0<η<1の範囲内の値をとるパラメータである。
Figure 0006263890
平均化パラメータ決定部17は、SN比計算部16が計算(推定)して得たSN比SNR(K)に基づいて、平滑処理部13が用いる平均化パラメータα(K)を決定するものである。上述したように、SN比が悪化すると周波数領域上の孤立点が増える傾向にあるので、より多くの周波数成分を寄与させて平均化処理を行うことが望ましい。そこで、SN比SNR(K)が大きければ平均化パラメータα(K)を大きくして他の周波数成分の寄与を小さくし、逆に、SN比SNR(K)が小さければ平均化パラメータα(K)を小さくして他の周波数成分の寄与を大きくすることとした。平均化パラメータ決定部17は、このような関係を満たす平均化パラメータα(K)を決定することができるのであれば、その具体的な構成は問われないものである。例えば、平均化パラメータ決定部17は、変換テーブルを利用して構成されたものであっても良く、変換関数の演算を実行するように構成されたものであっても良い。
図4は、平均化パラメータ決定部17が変換テーブルを利用して構成されたものである場合における適用する変換テーブルを示している。平均化パラメータ決定部17は、与えられたSN比SNR(K)が変換テーブルのどの範囲A以上B未満、B以上C未満、C以上D未満、…(但し、A<B<C<D<…)に属するかを判定し、属する範囲に対応付けられている値β、γ、δ、…(但し、β<γ<δ<…)を平均化パラメータα(K)として平滑処理部13に与える。例えば、SN比SNR(K)がB以上C未満の範囲の値であると、平均化パラメータ決定部17は、値がγである平均化パラメータα(K)を平滑処理部13に与える。
(B−2)第2の実施形態の動作
次に、第2の実施形態の音声信号処理装置10Aの動作を説明する。
一対のマイクロホンm1及びm2によって捕捉され、図示しないA/D変換器によってデジタル信号に変換された信号s1(n)、s2(n)は、FFT部11によって時間領域から周波数領域の信号X1(f,K)、X2(f,K)に変換される。そして、メインの周波数領域信号X1(f,K)は、雑音信号生成部12、周波数減算部14及びSN比計算部16に与えられ、サブの周波数領域信号X2(f,K)は、雑音信号生成部12に与えられる。
雑音信号生成部12においては、第1の実施形態と同様にして、雑音信号N(f,K)が生成される。生成された雑音信号N(f,K)は、SN比計算部16及び平滑処理部13に与えられる。
SN比計算部16においては、メインの周波数領域信号X1(f,K)と、雑音信号N(f,K)とに基づいて、現フレームKにおけるSN比SNR(K)が計算され、平均化パラメータ決定部17に与えられる。平均化パラメータ決定部17においては、現フレームKにおけるSN比SNR(K)に応じた平均化パラメータα(K)が決定されて平滑処理部13に与えられる。
第2の実施形態の場合、雑音信号N(f,K)に対して、平滑処理部13によって、固定値αに代えて、平均化パラメータα(K)を適用した(4)式の演算が実行され、平滑化後雑音信号AVE_N(fi,K)が得られて周波数減算部14に与えられる。
周波数減算部14においては、第1の実施形態と同様に、メインの周波数領域信号X1(f,K)から平滑化後雑音信号AVE_N(f,K)がスペクトル減算され、雑音抑圧後信号Y(f,K)が生成され、生成された雑音抑圧後信号Y(f,K)は、IFFT部15によって、時間領域信号y(n)に変換されて出力される。
(B−3〉第2の実施形態の効果
第2の実施形態によれば、SN比に応じて最適な平均化パラメータを用いて雑音信号の平均化処理を行うことができるので、SN比に依存しないミュージカルノイズの低減効果が得られる。
これにより、第2の実施形態の音声信号処理装置若しくはプログラムを適用した、テレビ会議装置や携帯電話機などの通信装置における通話音質の向上が期待できる。
(C)第3の実施形態
次に、本発明による音声信号処理装置及びプログラムの第3の実施形態を、図面を参照しながら詳述する。
上述した第2の実施形態は、雑音抑圧後信号におけるミュージカルノイズの発生度合いは、SN比によっても変動することに鑑み、(4)式に示すような平均処理における他の周波数成分の寄与を、SN比に応じて制御するものであった。
この第3の実施形態は、(4)式に示すような平均処理における他の周波数成分の寄与を、雑音の到来方位に応じて制御することとしたものである。これは、雑音抑圧後信号におけるミュージカルノイズの発生度合いは、雑音がどの方位から到来するのかによっても変動することに鑑みたものである。
図5は、第3の実施形態に係る音声信号処理装置の構成を示すブロック図であり、第1の実施形態に係る図1や第2の実施形態に係る図3との同一、対応部分には同一符号を付して示している。
図5において、第3の実施形態の音声信号処理装置10Bは、マイクロホンm1、m2、FFT部11、雑音信号生成部12、平滑処理部13、周波数減算部14及びIFFT部15に加え、コヒーレンス計算部18及び平均化パラメータ決定部17Bを有する。
マイクロホンm1、m2、FFT部11、雑音信号生成部12、平滑処理部13、周波数減算部14及びIFFT部15は、第1の実施形態のものと同様であり、平均化パラメータ決定部17Bは、第2の実施形態のものと同様であり、その機能説明は省略する。なお、第3の実施形態の平滑処理部13は、(4)式の演算を実行する際に、固定の平均化パラメータαを適用するのではなく、平均化パラメータ決定部17Bから与えられた平均化パラメータα(K)を適用する点は、第1の実施形態の平滑処理部と異なっている。また、平均化パラメータ決定部17Bは、コヒーレンスCOH(K)に基づいて平均化パラメータα(K)を決定する点は、第2の実施形態の平均化パラメータ決定部と異なっている。
コヒーレンス計算部18は、雑音の到来方位を推定し得る指標値としてコヒーレンスCOH(K)を算出するものである。
図6は、コヒーレンス計算部18の詳細構成を示すブロック図である。
図6において、コヒーレンス計算部18は、入力信号受信部21、指向性形成部22、フィルタ係数計算部23、コヒーレンス計算本体部24及びコヒーレンス送信部25を有する。
入力信号受信部21は、FFT部11から出力された周波数領域信号X1(f,K)、X2(f,K)を受け取るものである。
指向性形成部22は、特定方向に指向性が強い2種類の指向性信号(第1及び第2の指向性信号)B1(f,K)、B2(f,K)を形成するものである。指向性信号B1(f,K)、B2(f,K)を形成する方法は、既存の方法を適用することができ、例えば、(7)式及び(8)式に従った演算により求める方法を適用することができる。
Figure 0006263890
以下、第1及び第2の指向性信号B1(f,K)及びB2(f,K)の算出式の意味を、(7)式を例に、図7及び図8を用いて説明する。図7(A)に示した方向θから音波が到来し、距離lだけ隔てて設置されている一対のマイクロホンm1及びm2で捕捉されたとする。このとき、音波が一対のマイクロホンm1及びm2に到達するまでには時間差が生じる。この到達時間差τは、音の経路差をdとすると、d=l×sinθなので、音速をcとすると(9)式で与えられる。
τ=l×sinθ/c …(9)
ところで、入力信号s1(n)にτだけ遅延を与えた信号s1(t−τ)は、入力信号s2(t)と同一の信号である。従って、両者の差をとった信号y(t)=s2(t)−s1(t−τ)は、θ方向から到来した音が除去された信号となる。結果として、一対のマイクロホン(マイクロホンアレー)m1及びm2は図7(B)のような指向特性を持つようになる。
なお、以上では、時間領域での演算を記したが、周波数領域で行っても同様なことがいえる。この場合の式が、上述した(7)式及び(8)式である。今、一例として、到来方位θが±90度であることを想定する。すなわち、第1の指向性信号B1(f)は、図8(A)に示すように右方向に強い指向性を有し、第2の指向性信号B2(f)は、図8(B)に示すように左方向に強い指向性を有する。なお、以降では、θ=±90度であることを想定して説明するが、θは±90度に限定されるものではない。
フィルタ係数計算部23は、第1及び第2の指向性信号B1(f,K)及びB2(f,K)に基づいて、(10)式に従ってコヒーレンスフィルタ係数coef(f,K)を計算するものである。
コヒーレンス計算本体部25は、(11)式に示すように、コヒーレンスフィルタ係数coef(f、K)を全周波数で算術平均した値であるコヒーレンスCOH(K)を算出する。
Figure 0006263890
図9は、コヒーレンスの挙動を示した説明図である。図9に示すように、雑音の到来方位に応じてコヒーレンスの値がとるレンジが変化することが分かる。この性質を用いることで、雑音の到来方位をコヒーレンスCOH(K)によって推定することができる。
コヒーレンス送信部25は、算出されたコヒーレンスCOH(K)を平均化パラメータ決定部17Bに与えるものである。
第3の実施形態の平均化パラメータ決定部17Bは、第2の実施形態とは異なり、コヒーレンス計算部18が計算(推定)して得たコヒーレンス計算部18に基づいて、平滑処理部13が用いる平均化パラメータα(K)を決定するものであり、例えば、第2の実施形態と同様に、変換テーブルを利用して平均化パラメータα(K)を決定する(図4参照)。
第3の実施形態によれば、雑音の到来方位に応じて最適な平均化パラメータを用いて雑音信号の平均化処理を行うことができるので、雑音の到来方位に依存しないミュージカルノイズの低減効果が得られる。
これにより、第3の実施形態の音声信号処理装置若しくはプログラムを適用した、テレビ会議装置や携帯電話機などの通信装置における通話音質の向上が期待できる。
(D)他の実施形態
上記各実施形態の説明においても、種々変形実施形態について言及したが、さらに、以下に例示するような変形実施形態を挙げることができる。
上記第2の実施形態においては、SN比SNR(K)に応じて平均化パラメータタα(K)を制御するものを示したが、これに加え、SN比SNR(K)に応じて、スペクトル減算時の抑圧係数ε(K)をも制御するようにしても良い。例えば、変換テーブルを利用して、SN比SNR(K)に応じて抑圧係数ε(K)を決定する。同様に、第3の実施形態に関しても、コヒーレンスCOH(K)に応じて、平均化パラメータα(K)及び抑圧係数ε(K)の双方を制御するようにしても良い。
上記第2の実施形態の説明で言及した変換テーブルにおけるSN比SNR(K)の範囲の数は2以上であれば良く、所定の数に限定されるものではない。
上記各実施形態において、周波数領域の信号で処理していた処理を、可能ならば時間領域の信号で処理するようにしても良く、逆に、時間領域の信号で処理していた処理を、可能ならば周波数領域の信号で処理するようにしても良い。
上記第2の実施形態では、SN比SNR(K)を雑音の影響度合いを表す指標値として適用し、上記第3の実施形態では、コヒーレンスCOH(K)を雑音の影響度合いを表す指標値として適用したものを示したが、雑音の影響度合いを表すものであれば、他の指標値を適用しても良く、また、複数の指標値を同時に適用するようにしても良い。例えば、SN比SNR(K)が属する範囲とコヒーレンスCOH(K)が属する範囲との組み合わせに応じて、平均化パラメータα(K)を定めるようにしても良い。
上記各実施形態では、雑音抑制技術として、周波数減算法を単独で適用したものを示したが、他の雑音抑制技術(特許文献1参照)、例えば、ボイススイッチ法、ウィーナーフィルタ法、コヒーレンスフィルタ法と併用するようにしても良い。
上記各実施形態では、一対のマイクロホンが捕捉した信号を直ちに処理する音声信号処理装置やプログラムを示したが、本発明の処理対象の音声信号はこれに限定されるものではない。例えば、記録媒体から読み出した一対の音声信号を処理する場合にも、本発明を適用することができ、また、対向装置から送信されてきた一対の音声信号を処理する場合にも、本発明を適用することができる。
10、10A、10B…音声信号処理装置、m1、m2…マイクロホン、11…FFT(高速フーリエ変換)部、12…雑音信号生成部、13…平滑処理部、14…周波数減算部、15…IFFT(逆高速フーリエ変換)部、16…SN比計算部、17、17B…平均化パラメータ決定部、18…コヒーレンス計算部18。

Claims (2)

  1. 入力音声信号から雑音信号形成手段が雑音信号を形成し、周波数減算手段が、上記入力音声信号から、形成した雑音信号をスペクトル減算することにより入力音声信号に含まれている雑音成分を抑制する音声信号処理装置において、
    上記雑音信号形成手段が形成した上記雑音信号を、周波数領域上で平滑化してから、上記周波数減算手段に与える雑音平滑化手段を有し、
    上記雑音平滑化手段は、上記雑音信号における各周波数の成分を、近接する周波数成分と平均化することにより平滑化する平均処理部を備え、
    さらに、上記入力音声信号における雑音成分の到来方位を反映した値を計算する雑音方位反映値計算部と、
    上記平均化における近接周波数成分の反映度合を表す平均化パラメータを、計算された到来方位を反映した値に応じて決定する平均化パラメータ決定部と
    を有することを特徴とする音声信号処理装置。
  2. コンピュータを、
    入力音声信号から雑音信号を形成する雑音信号形成手段と、
    形成された上記雑音信号を、周波数領域上で平滑化する雑音平滑化手段と、
    上記入力音声信号から平滑化された雑音信号をスペクトル減算することにより入力音声信号に含まれている雑音成分を抑制する周波数減算手段と
    して機能させ、
    上記雑音平滑化手段は、上記雑音信号における各周波数の成分を、近接する周波数成分と平均化することにより平滑化する平均処理部を備え、
    さらに、上記コンピュータを、
    上記入力音声信号における雑音成分の到来方位を反映した値を計算する雑音方位反映値計算部と、
    上記平均化における近接周波数成分の反映度合を表す平均化パラメータを、計算された到来方位を反映した値に応じて決定する平均化パラメータ決定部と
    して機能させることを特徴とする音声信号処理プログラム。
JP2013154824A 2013-07-25 2013-07-25 音声信号処理装置及びプログラム Active JP6263890B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013154824A JP6263890B2 (ja) 2013-07-25 2013-07-25 音声信号処理装置及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013154824A JP6263890B2 (ja) 2013-07-25 2013-07-25 音声信号処理装置及びプログラム

Publications (2)

Publication Number Publication Date
JP2015025913A JP2015025913A (ja) 2015-02-05
JP6263890B2 true JP6263890B2 (ja) 2018-01-24

Family

ID=52490627

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013154824A Active JP6263890B2 (ja) 2013-07-25 2013-07-25 音声信号処理装置及びプログラム

Country Status (1)

Country Link
JP (1) JP6263890B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6780644B2 (ja) * 2015-06-30 2020-11-04 日本電気株式会社 信号処理装置、信号処理方法、および信号処理プログラム

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3454206B2 (ja) * 1999-11-10 2003-10-06 三菱電機株式会社 雑音抑圧装置及び雑音抑圧方法
DE112011104737B4 (de) * 2011-01-19 2015-06-03 Mitsubishi Electric Corporation Geräuschunterdrückungsvorrichtung
JP5817366B2 (ja) * 2011-09-12 2015-11-18 沖電気工業株式会社 音声信号処理装置、方法及びプログラム

Also Published As

Publication number Publication date
JP2015025913A (ja) 2015-02-05

Similar Documents

Publication Publication Date Title
US8654990B2 (en) Multiple microphone based directional sound filter
JP5817366B2 (ja) 音声信号処理装置、方法及びプログラム
JP5272920B2 (ja) 信号処理装置、信号処理方法、および信号処理プログラム
JP6187626B1 (ja) 収音装置及びプログラム
JP5672770B2 (ja) マイクロホンアレイ装置及び前記マイクロホンアレイ装置が実行するプログラム
JP2011527025A (ja) ヌル処理雑音除去を利用した雑音抑制を提供するシステム及び方法
JP6225245B2 (ja) 信号処理装置、方法及びプログラム
JP6204312B2 (ja) 収音装置
JP5838861B2 (ja) 音声信号処理装置、方法及びプログラム
US9330677B2 (en) Method and apparatus for generating a noise reduced audio signal using a microphone array
JP2016042613A (ja) 目的音声区間検出装置、目的音声区間検出方法、目的音声区間検出プログラム、音声信号処理装置及びサーバ
JP2010124370A (ja) 信号処理装置、信号処理方法、および信号処理プログラム
JP6221257B2 (ja) 信号処理装置、方法及びプログラム
JP6314475B2 (ja) 音声信号処理装置及びプログラム
JP6263890B2 (ja) 音声信号処理装置及びプログラム
JP6638248B2 (ja) 音声判定装置、方法及びプログラム、並びに、音声信号処理装置
JP6221258B2 (ja) 信号処理装置、方法及びプログラム
JP6854967B1 (ja) 雑音抑圧装置、雑音抑圧方法、及び雑音抑圧プログラム
JP6631127B2 (ja) 音声判定装置、方法及びプログラム、並びに、音声処理装置
JP6221463B2 (ja) 音声信号処理装置及びプログラム
JP6295650B2 (ja) 音声信号処理装置及びプログラム
JP2015025914A (ja) 音声信号処理装置及びプログラム
JP6903947B2 (ja) 非目的音抑圧装置、方法及びプログラム
JP6544182B2 (ja) 音声処理装置、プログラム及び方法
Zhao et al. Directional Noise Suppression Based on Dual-microphone With Desired Direction Presetting

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160517

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170421

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170502

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170620

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20171121

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20171204

R150 Certificate of patent or registration of utility model

Ref document number: 6263890

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150