JP2014164192A - 信号処理装置、方法及びプログラム - Google Patents
信号処理装置、方法及びプログラム Download PDFInfo
- Publication number
- JP2014164192A JP2014164192A JP2013036366A JP2013036366A JP2014164192A JP 2014164192 A JP2014164192 A JP 2014164192A JP 2013036366 A JP2013036366 A JP 2013036366A JP 2013036366 A JP2013036366 A JP 2013036366A JP 2014164192 A JP2014164192 A JP 2014164192A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- wiener filter
- coherence
- directivity
- iterative
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
【課題】反復ウィーナーフィルタ処理に従って雑音成分を抑圧しても、音質の自然さと、ミュージカルノイズを含む雑音の抑圧性能とがバランス良く実現できる信号処理装置を提供する。
【解決手段】信号処理装置1は、一対の入力音声信号に基づいて、第1及び第2の所定方位に死角を有する指向性特性を付与した第1及び第2の指向性信号を形成する指向性形成部12,13と、第1及び第2の指向性信号を用いてコヒーレンスを得るコヒーレンス計算部14と、コヒーレンスに基づいて、ウィーナーフィルタ処理の反復回数を制御する反復回数制御部とを備える。
【選択図】図1
【解決手段】信号処理装置1は、一対の入力音声信号に基づいて、第1及び第2の所定方位に死角を有する指向性特性を付与した第1及び第2の指向性信号を形成する指向性形成部12,13と、第1及び第2の指向性信号を用いてコヒーレンスを得るコヒーレンス計算部14と、コヒーレンスに基づいて、ウィーナーフィルタ処理の反復回数を制御する反復回数制御部とを備える。
【選択図】図1
Description
本発明は、信号処理装置、方法及びプログラムに関し、例えば、電話機やテレビ会議装置やスマートフォンなどの音声信号(この明細書では、音声信号と音響信号の双方を含めて「音声信号」と呼んでいる)を扱う通信機や通信ソフトウェアに適用し得るものである。
取得した音声信号中に含まれる雑音成分を抑圧する手法の一つとして、ウィーナーフィルタ法が挙げられる。これは、特許文献1に記載されているように、雑音を含む音声信号のスペクトルから周波数ごとにSN比を推定し、SN比に応じたゲインを入力信号スペクトルに付与することで雑音成分を抑圧する手法である(ウィーナーフィルタ係数の推定は、例えば、特許文献1の「数3」のように行う)。
ところで、ウィーナーフィルタ処理は雑音成分を抑圧する効果がある一方で、ミュージカルノイズという異音成分を発生させてしまうという課題がある。この課題への対策の一つが、非特許文献1に記載されているように、反復ウィーナーフィルタ法という手法である。これは、ウィーナーフィルタ処理後の信号から再びウィーナーフィルタ係数を推定して入力信号に付与する、という処理を数回繰り返すものである。反復ウィーナーフィルタ法は、反復することにより発生したミュージカルノイズをも含む雑音特性を推定し、雑音成分とともにミュージカルノイズも抑圧しようとしたものである。
緒方伸哉、島村徹也著、「反復スペクトル引き算法によるミュージカルノイズの低減」、日本音響学会講演論文集、pp387−388、2001年3月
しかし、反復ウィーナーフィルタ法は、反復を繰り返すたびに音声が歪み自然さが損なわれるという課題がある。また、ウィーナーフィルタ係数は過去の雑音特性の影響を反映しながら更新されていくので、処理開始直後は学習が不十分なために音質が悪い。一方、処理開始から十分な時間が経過すると、係数の学習も進むため高い音質改善効果が得られる。このように、処理開始直後か否かによって係数の推定精度も大きく変わる。
反復回数を少ない回数に固定した場合には、音声が歪み自然さが損なわれるという課題は生じないが、雑音特性の学習が不十分で雑音抑圧効果を十分に発揮できないという課題を生じる。逆に、反復回数を多い回数に固定した場合には、雑音特性の学習が十分で雑音抑圧効果を十分に発揮できるが、音声が歪み自然さが損なわれるという課題が生じる。そのため、最適な反復回数の設定が求められるが、非特許文献1にも記載されているように、反復回数の決定法について未だ有力な解法は見出されていない。
そのため、反復ウィーナーフィルタ法に従って雑音成分を抑圧しても、音質の自然さと、ミュージカルノイズを含む雑音の抑圧性能とがバランス良く実現できる信号処理装置、方法及びプログラムが望まれている。
第1の本発明は、入力音声信号に含まれている雑音成分を、反復ウィーナーフィルタ処理手段がウィーナーフィルタ処理を反復して繰り返すことによって抑圧して出力する信号処理装置において、(1)当該特徴量算出手段への入力音声信号から、その入力音声信号における目的音声の含有量を示す特徴量を算出する特徴量算出手段と、(2)上記特徴量に基づいて、ウィーナーフィルタ処理の反復回数を制御する反復回数制御手段とを備えることを特徴とする。
第2の本発明は、入力音声信号に含まれている雑音成分を、反復ウィーナーフィルタ処理手段がウィーナーフィルタ処理を反復して繰り返すことによって抑圧して出力する信号処理方法において、特徴量算出手段が、当該特徴量算出手段への入力音声信号から、その入力音声信号における目的音声の含有量を示す特徴量を算出し、反復回数制御手段が、上記特徴量に基づいて、ウィーナーフィルタ処理の反復回数を制御することを特徴とする。
第3の本発明の信号処理プログラムは、一対の入力音声信号の一方に含まれている雑音成分をウィーナーフィルタ処理を反復して繰り返すことによって抑圧して出力する信号処理装置に搭載されたコンピュータを、(1)当該特徴量算出手段への入力音声信号から、その入力音声信号における目的音声の含有量を示す特徴量を算出する特徴量算出手段と、(2)上記特徴量に基づいて、ウィーナーフィルタ処理の反復回数を制御する反復回数制御手段として機能させることを特徴とする。
本発明によれば、反復ウィーナーフィルタ処理に従って雑音成分を抑圧しても、音質の自然さと、ミュージカルノイズを含む雑音の抑圧性能とがバランス良く実現できる信号処理装置、方法及びプログラムを提供できる。
(A)主たる実施形態
以下、本発明による信号処理装置、方法及びプログラムの一実施形態を、図面を参照しながら詳述する。
以下、本発明による信号処理装置、方法及びプログラムの一実施形態を、図面を参照しながら詳述する。
この実施形態の信号処理装置、方法及びプログラムは、ウィーナーフィルタ処理を反復して繰り返す反復回数を適応的に制御することを特徴としている。
(A−1)実施形態に至った考え方(反復回数を適応的に制御する理由)
ところで、ウィーナーフィルタ係数は周波数ごとのSN比であるので、広義には「音声の含有量」という意味を有すると言える。音声の含有量という意味を有する特徴量として、他にはコヒーレンスが挙げられる。
ところで、ウィーナーフィルタ係数は周波数ごとのSN比であるので、広義には「音声の含有量」という意味を有すると言える。音声の含有量という意味を有する特徴量として、他にはコヒーレンスが挙げられる。
コヒーレンスの計算方法などについては後述するが、コヒーレンスは正面から到来する信号(目的とする音声)がどの程度入力信号中に含まれているのかを示す指標であり、コヒーレンスも、目的音声区間においてはウィーナーフィルタ係数と同様に「目的音声の含有量」を表す特徴量であるといえる。実際に、SN比とコヒーレンスは目的音声区間においては類似した挙動を有する。また、コヒーレンスは、原理的に、ウィーナーフィルタ係数のように過去の値の影響を強く受けるわけではないため、反復ウィーナーフィルタ処理の開始直後でも精度良く算出することができる。
そこで、この実施形態では、過去の値の影響を強く受ける、その時点の周波数成分ごとのウィーナーフィルタ係数を統計的に代表させた値と、コヒーレンスとの比較を通じて、反復ウィーナーフィルタ処理の学習が不十分な開始直後の期間が経過したか否かを判断し、反復ウィーナーフィルタ処理の学習が不十分な開始直後の期間が経過したと判断できたときに、反復ウィーナーフィルタ処理の反復を終了させることとした。
(A−2)実施形態の構成
図1は、この実施形態に係る信号処理装置の構成を示すブロック図である。ここで、一対のマイクm1及びm2を除いた部分は、ハードウェアで構成することも可能であり、また、CPUが実行するソフトウェア(信号処理プログラム)とCPUとで実現することも可能であるが、いずれの実現方法を採用した場合であっても、機能的には図1で表すことができる。
図1は、この実施形態に係る信号処理装置の構成を示すブロック図である。ここで、一対のマイクm1及びm2を除いた部分は、ハードウェアで構成することも可能であり、また、CPUが実行するソフトウェア(信号処理プログラム)とCPUとで実現することも可能であるが、いずれの実現方法を採用した場合であっても、機能的には図1で表すことができる。
図1において、実施形態の信号処理装置1は、一対のマイクm1、m2、FFT部11、第1の指向性形成部12、第2の指向性形成部13、コヒーレンス計算部14、反復ウィーナーフィルタ処理部(図1では反復WF処理部と表記している)15及びIFFT部16を有する。
一対のマイクm1、m2は、所定距離(若しくは任意の距離)だけ離れて配置され、それぞれ、周囲の音声を捕捉するものである。各マイクm1、m2で捕捉された音声信号(入力信号)は、図示しない対応するAD変換器を介してデジタル信号s1(n)、s2(n)に変換されてFFT部11に与えられる。なお、nはサンプルの入力順を表すインデックスであり、正の整数で表現される。本文中では、nが小さいほど古い入力サンプルであり、大きいほど新しい入力サンプルであるとする。
FFT部11は、マイクm1及びm2から入力信号系列s1(n)及びs2(n)を受け取り、その入力信号s1及びs2に高速フーリエ変換(あるいは離散フーリエ変換)を行うものである。これにより、入力信号s1及びs2を周波数領域で表現することができる。なお、高速フーリエ変換を実施するにあたり、入力信号s1(n)及びs2(n)から、所定のN個のサンプルからなる分析フレームFRAME1(K)及びFRAME2(K)を構成して適用する。入力信号s1(n)から分析フレームFRAME1(K)を構成する例を以下の(1)式に示すが、分析フレームFRAME2(K)も同様である。
なお、Kはフレームの順番を表すインデックスであり、正の整数で表現される。本文中では、Kが小さいほど古い分析フレームであり、大きいほど新しい分析フレームであるとする。また、以降の説明において、特に但し書きがない限りは、分析対象となる最新の分析フレームを表すインデックスはKであるとする。
FFT部11は、分析フレームごとに高速フーリエ変換処理を施すことで、周波数領域信号X1(f,K)、X2(f,K)に変換し、得られた周波数領域信号X1(f,K)及びX2(f,K)をそれぞれ、第1の指向性形成部12及び第2の指向性形成部13に与えると共に、一方の周波数領域信号X1(f,K)を反復ウィーナーフィルタ処理部15に与える。なお、fは周波数を表すインデックスである。また、X1(f,K)は単一の値ではなく、(2)式に示すように、複数の周波数f1〜fmのスペクトル成分から構成されるものである(但し、いずれかの周波数要素の一つを表す場合にも同様の表記を用いることもある)。さらに、X1(f,K)は複素数であり、実部と虚部からなる。X2(f,K)や後述するB1(f,K)及びB2(f,K)も同様である。
X1(f,K)={X1(f1,K),X1(f2,K),…,X1(fm,K)} …(2)
反復ウィーナーフィルタ処理部15は、周波数領域信号X1(f,K)に基づき、ウィーナーフィルタ処理を反復して繰り返し実行し、雑音成分が抑圧された信号Y(f,K)を得て、IFFT部16に与えるものである。反復ウィーナーフィルタ処理部15は、コヒーレンス計算部14から与えられたコヒーレンスCOH(K)を利用した後述する反復終了条件が成立するかを確認しており、反復終了条件が成立したときにウィーナーフィルタ処理の反復を終了させて雑音成分が抑圧された信号Y(f,K)を出力する。
反復ウィーナーフィルタ処理部15は、周波数領域信号X1(f,K)に基づき、ウィーナーフィルタ処理を反復して繰り返し実行し、雑音成分が抑圧された信号Y(f,K)を得て、IFFT部16に与えるものである。反復ウィーナーフィルタ処理部15は、コヒーレンス計算部14から与えられたコヒーレンスCOH(K)を利用した後述する反復終了条件が成立するかを確認しており、反復終了条件が成立したときにウィーナーフィルタ処理の反復を終了させて雑音成分が抑圧された信号Y(f,K)を出力する。
IFFT部16は、雑音抑圧後信号Y(f,K)に対して、逆高速フーリエ変換を施して時間領域信号である出力信号y(n)を得るものである。
第1の指向性形成部12、第2の指向性形成部13及びコヒーレンス計算部14は、反復ウィーナーフィルタ処理部15が利用するコヒーレンスCOH(K)を得るための構成である。
第1の指向性形成部12は、周波数領域信号X1(f,K)及びX2(f,K)から特定方向に指向性が強い信号B1(f,K)を形成するものである。第2の指向性形成部13は、周波数領域信号X1(f,K)及びX2(f,K)から特定方向(上述の特定方向とは異なる)に指向性が強い信号B2(f,K)を形成するものである。特定方向に指向性が強い信号B1(f,K)、B2(f,K)の形成方法としては既存の方法を適用でき、例えば、(3)式を適用して右方向に指向性が強いB1(f,K)や(4)式を適用して左方向に指向性が強いB2(f,K)が形成できる。(3)式及び(4)式では、フレームインデックスKは演算に関与しないので省略している。
これらの式の意味を、(3)式を例に、図2及び図3を用いて説明する。図2(A)に示した方向θから音波が到来し、距離lだけ隔てて設置されている一対のマイクm1及びm2で捕捉されたとする。このとき、音波が一対のマイクm1及びm2に到達するまでには時間差が生じる。この到達時間差τは、音の経路差をdとすると、d=l×sinθなので、音速をcとすると(5)式で与えられる。
τ=l×sinθ/c …(5)
ところで、入力信号s1(n)にτだけ遅延を与えた信号s1(t−τ)は、入力信号s2(t)と同一の信号である。従って、両者の差をとった信号yy(n)=s2(t)−s1(t−τ)は、θ方向から到来した音が除去された信号となる。結果として、マイクロフォンアレーm1及びm2は図2(B)のような指向特性を持つようになる。
ところで、入力信号s1(n)にτだけ遅延を与えた信号s1(t−τ)は、入力信号s2(t)と同一の信号である。従って、両者の差をとった信号yy(n)=s2(t)−s1(t−τ)は、θ方向から到来した音が除去された信号となる。結果として、マイクロフォンアレーm1及びm2は図2(B)のような指向特性を持つようになる。
なお、以上では、時間領域での演算を記したが、周波数領域で行っても同様なことがいえる。この場合の式が、上述した(3)式及び(4)式である。今、一例として、到来方位θが±90度であることを想定する。すなわち、第1の指向性形成部12からの指向性信号B1(f)は、図3(A)に示すように右方向に強い指向性を有し、第2の指向性形成部13からの指向性信号B2(f)は、図3(B)に示すように左方向に強い指向性を有する。
コヒーレンス計算部14は、以上のようにして得られた指向性信号B1(f,K)、B2(f,K)に対し、(6)式、(7)式に示す演算を施すことでコヒーレンスCOH(k)を得るものである。(6)式におけるB2(f)*はB2(f)の共役複素数である。また、フレームインデックスKは、(6)式、(7)式の演算には関与しないので、(6)式、(7)式ではフレームインデックスKの記載を省略している。
図4は、反復ウィーナーフィルタ処理部15の詳細構成を示すブロック図である。なお、ウィーナーフィルタ処理の反復を終了させる構成に特徴があり、その他の構成(ウィーナーフィルタ処理の実行構成や、それを反復させるための構成な)には既存のいかなる構成を適用しても良く、図4は一例として記載したものである。
図4において、反復ウィーナーフィルタ処理部15は、入力信号・コヒーレンス受信部21、参照信号・反復回数カウンタ初期化部22、WF係数・平均WF係数計算部23、平均WF係数比較・反復実施可否制御部24、フィルタ処理部25、反復回数カウンタ更新部26、参照信号更新部27及びフィルタ処理後信号送信部28を有する。
反復ウィーナーフィルタ処理部15においては、これらの各部21〜28が協働して動作することにより、後述する図5のフローチャートに示す処理を実行する。
入力信号・コヒーレンス受信部21は、FFT部11から出力された周波数領域信号X1(f,K)と、コヒーレンス計算部14から出力されたコヒーレンスCOH(K)とを受け取るものである。
反復回数カウンタ・参照信号初期化部22は、反復回数を表すカウンタ変数(以下、反復回数カウンタと呼ぶ)pと、各反復回数でのウィーナーフィルタ処理において入力信号となる参照信号ref(f,K,p)を初期化する。反復回数カウンタpの初期化値は0であり、参照信号ref(f,K,p)の初期化値はX1(f,K)である。
WF係数・平均WF係数計算部23は、現反復回数の参照信号ref(f,K,p)に基づいて、周波数成分ごとのウィーナーフィルタ係数(WF係数)wf_coef(f,K,p)を算出すると共に、さらに、周波数成分ごとのウィーナーフィルタ係数(WF係数)wf_coef(f,K,p)の平均(以下、平均ウィーナーフィルタ係数と呼ぶ)AVE_WF_COEF(K,p)を(8)式に従って算出するものである。ウィーナーフィルタ係数wf_coef(f,K,p)の算出には、例えば、特許文献1に記載の算出式(特許文献1の「数3」若しくは「数4」参照)を適用する。
平均WF係数比較・反復実施可否制御部24は、コヒーレンスCOH(K)と平均ウィーナーフィルタ係数AVE_WF_COEF(K,p)とを比較し、平均ウィーナーフィルタ係数AVE_WF_COEF(K,p)がコヒーレンスCOH(K)より小さいときにウィーナーフィルタ処理の反復を継続するように各部を制御し、平均ウィーナーフィルタ係数AVE_WF_COEF(K,p)がコヒーレンスCOH(K)以上のときにウィーナーフィルタ処理の反復繰り返しを終了するように各部を制御するものである。
フィルタ処理部25は、ウィーナーフィルタ処理の反復を継続する場合において、周波数成分ごとに、(9)式に示すように、入力された周波数領域信号X1(f,K)にウィーナーフィルタ係数wf_coef(f,K,p)を乗算してウィーナーフィルタ処理後信号WF_out(f,K,p)を得るものである。
WF_out(f,K,p)
=X1(f,K)×wf_coef(f,K,p) …(9)
反復回数カウンタ更新部26は、ウィーナーフィルタ処理の反復を継続する場合において、反復回数カウンタpを1インクリメントするものである。
=X1(f,K)×wf_coef(f,K,p) …(9)
反復回数カウンタ更新部26は、ウィーナーフィルタ処理の反復を継続する場合において、反復回数カウンタpを1インクリメントするものである。
参照信号更新部27は、ウィーナーフィルタ処理の反復を継続する場合において、(10)式に示すように、直前の反復回数のウィーナーフィルタ処理後信号WF_out(f,K,p−1)を新たな反復回数における参照信号ref(f,K,p)とするものである。
ref(f,K,p)=WF_out(f,K,p−1) …(10)
フィルタ処理後信号送信部28は、ウィーナーフィルタ処理の反復繰り返しを終了する場合に、その時点で得られているウィーナーフィルタ処理後信号WF_out(f,K,p)を、反復ウィーナーフィルタ処理後信号Y(f,K)としてIFFT部16に与えるものである。また、フィルタ処理後信号送信部28は、フレームを規定する変数Kを1だけ増加させて次のフレームの処理を起動させるものである。
フィルタ処理後信号送信部28は、ウィーナーフィルタ処理の反復繰り返しを終了する場合に、その時点で得られているウィーナーフィルタ処理後信号WF_out(f,K,p)を、反復ウィーナーフィルタ処理後信号Y(f,K)としてIFFT部16に与えるものである。また、フィルタ処理後信号送信部28は、フレームを規定する変数Kを1だけ増加させて次のフレームの処理を起動させるものである。
(A−3)実施形態の動作
次に、実施形態の信号処理装置1の動作を、図面を参照しながら、全体動作、反復ウィーナーフィルタ処理部15における詳細動作の順に説明する。
次に、実施形態の信号処理装置1の動作を、図面を参照しながら、全体動作、反復ウィーナーフィルタ処理部15における詳細動作の順に説明する。
一対のマイクm1及びm2から入力された信号s1(n)、s2(n)はそれぞれ、FFT部11によって時間領域から周波数領域の信号X1(f,K)、X2(f,K)に変換された後、周波数領域信号X1(f,K)は、第1の指向性形成部12、第2の指向性形成部13及び反復ウィーナーフィルタ処理部15に与えられ、周波数領域信号X2(f,K)は、第1の指向性形成部12及び第2の指向性形成部13に与えられる。
2つの周波数領域信号X1(f,K)及びX2(f,K)に基づき、第1及び第2の指向性形成部12及び13のそれぞれによって、所定の方位に死角を有する第1及び第2の指向性信号B1(f,K)及びB2(f,K)が生成される。そして、コヒーレンス計算部14において、第1及び第2の指向性信号B1(f,K)及びB2(f,K)を適用して、(6)式及び(7)式の演算が実行され、コヒーレンスCOH(K)が算出され、反復ウィーナーフィルタ処理部15に与えられる。
反復ウィーナーフィルタ処理部15においては、周波数領域信号X1(f,K)を当初の参照信号としたウィーナーフィルタ処理が、反復終了条件が成立するまで反復して繰り返し実行され、得られた反復ウィーナーフィルタ処理後信号Y(f,K)がIFFT部16に与えられる。
IFFT部16においては、周波数領域信号である反復ウィーナーフィルタ処理後信号Y(f,K)が、逆高速フーリエ変換によって、時間領域信号y(n)に変換され、この時間領域信号y(n)が出力される。
次に、反復ウィーナーフィルタ処理部15における詳細動作を、図5のフローチャートを参照しながら説明する。なお、図5は、あるフレームの処理を示しており、フレームごとに、図5に示す処理が繰り返される。
新たなフレームになり、新たなフレーム(現フレームK)の周波数領域信号X1(f,K)がFFT部11から与えられると、反復ウィーナーフィルタ処理部15は、反復回数カウンタpを0に、参照信号ref(f,K,p)を周波数領域信号X1(f,K)に初期化する(ステップS1)。
次に、反復ウィーナーフィルタ処理部15は、現反復回数の参照信号ref(f,K,p)に基づいて、周波数成分ごとのウィーナーフィルタ係数wf_coef(f,K,p)を算出すると共に、さらに、算出された周波数成分ごとのウィーナーフィルタ係数wf_coef(f,K,p)に基づいて、平均ウィーナーフィルタ係数AVE_WF_COEF(K,p)を算出する(ステップS2)。
その後、反復ウィーナーフィルタ処理部15は、平均ウィーナーフィルタ係数AVE_WF_COEF(K,p)がコヒーレンス計算部14から与えられたコヒーレンスCOH(K)より小さいか否かを判別する(ステップS3)。
反復ウィーナーフィルタ処理部15は、平均ウィーナーフィルタ係数AVE_WF_COEF(K,p)がコヒーレンスCOH(K)より小さい場合には、周波数成分ごとに、入力された周波数領域信号X1(f,K)にウィーナーフィルタ係数wf_coef(f,K,p)を乗算してウィーナーフィルタ処理後信号WF_out(f,K,p)を得(ステップS4)、反復回数カウンタpを1インクリメントし(ステップS5)、さらに、直前の反復回数のウィーナーフィルタ処理後信号WF_out(f,K,p−1)を新たな反復回数における参照信号ref(f,K,p)として(ステップS6)、上述したステップS2の処理に移行する。
一方、反復ウィーナーフィルタ処理部15は、平均ウィーナーフィルタ係数AVE_WF_COEF(K,p)がコヒーレンスCOH(K)以上の場合には、その時点で得られているウィーナーフィルタ処理後信号WF_out(f,K,p)を、反復ウィーナーフィルタ処理後信号Y(f,K)としてIFFT部16に与え、また、フレームを規定する変数Kを1だけ増加させて次のフレームの処理を移行する(ステップS7)。
(A−4)実施形態の効果
上記実施形態によれば、平均ウィーナーフィルタ係数がコヒーレンスに達するまで、ウィーナーフィルタ処理を反復して実行するようにしたので、音質と抑圧性能とをバランス良く実現することができる。
上記実施形態によれば、平均ウィーナーフィルタ係数がコヒーレンスに達するまで、ウィーナーフィルタ処理を反復して実行するようにしたので、音質と抑圧性能とをバランス良く実現することができる。
これにより、実施形態の信号処理装置を、テレビ会議システムや携帯電話やスマートフォンなどの通信装置に適用することで、通話音質の向上が期待できる。
(B)他の実施形態
上記実施形態では、反復処理の継続か終了かの判定には、全周波数成分について平均した値であるコヒーレンスCOH(K)や平均ウィーナーフィルタ係数AVE_WF_COEF(K,p)を用いたものを示したが、比較に供する2種類のパラメータは、コヒーレンスCOH(K)や平均ウィーナーフィルタ係数AVE_WF_COEF(K,p)に限定されるものではない。例えば、中央の周波数成分の値同士で比較して反復処理の継続か終了かの判定を行うようにしても良い。また例えば、全てではなく、一部の周波数成分の平均を比較して反復処理の継続か終了かの判定を行うようにしても良い。さらに、複数の周波数成分の代表値として、平均値以外の他の統計量(例えば中央値)を適用するようにしても良い。
上記実施形態では、反復処理の継続か終了かの判定には、全周波数成分について平均した値であるコヒーレンスCOH(K)や平均ウィーナーフィルタ係数AVE_WF_COEF(K,p)を用いたものを示したが、比較に供する2種類のパラメータは、コヒーレンスCOH(K)や平均ウィーナーフィルタ係数AVE_WF_COEF(K,p)に限定されるものではない。例えば、中央の周波数成分の値同士で比較して反復処理の継続か終了かの判定を行うようにしても良い。また例えば、全てではなく、一部の周波数成分の平均を比較して反復処理の継続か終了かの判定を行うようにしても良い。さらに、複数の周波数成分の代表値として、平均値以外の他の統計量(例えば中央値)を適用するようにしても良い。
上記実施形態では、コヒーレンスCOH(K)と平均ウィーナーフィルタ係数AVE_WF_COEF(K,p)とを反復ごとに比較して、反復ごとに反復処理の継続か終了かの判定を行うものを示したが、反復処理の開始前に、コヒーレンスCOH(K)に応じて、反復回数を定めるようにしても良い。例えば、上記実施形態のようにして終了タイミングを定めた場合における、コヒーレンスCOH(K)の値と実反復回数との関係を、シミュレーション等によって多数得て、それらの関係を整理して、コヒーレンスの範囲と最大反復回数との関係式、若しくは、変換テーブルを予め作成しておき、コヒーレンスが算出されたときに、関係式若しくは変換テーブルを適用して反復回数(最大反復回数)を定め、その反復回数だけウィーナーフィルタ処理を反復するようにしても良い。
上記実施形態では、反復処理の継続か終了の判定に、コヒーレンスCOH(K)を用いたものを示したが、コヒーレンスCOH(K)に代えて、「入力音声信号における目的音声の含有量」という概念を持つ他の特徴量、例えば、入力信号の零交差回数や自己相関などを用いて、反復処理の継続か終了かの判定を行うようにしても良い。
上記実施形態において、周波数領域の信号で処理していた処理を、可能ならば時間領域の信号で処理するようにしても良い。
上記実施形態では、一対のマイクが捕捉した信号を直ちに処理する場合を示したが、本発明の処理対象の音声信号はこれに限定されるものではない。例えば、記録媒体から読み出した一対の音声信号を処理する場合にも、本発明を適用することができ、また、対向装置から送信されてきた一対の音声信号を処理する場合にも、本発明を適用することができる。このような変形実施形態の場合であれば、信号処理装置に入力される段階で、既に周波数領域の信号になっていても良い。
1…信号処理装置、m1、m2…マイク、11…FFT部、12…第1の指向性形成部、13…第2の指向性形成部、14…コヒーレンス計算部、15…反復ウィーナーフィルタ処理部、16…IFFT部、21…入力信号・コヒーレンス受信部、22…参照信号・反復回数カウンタ初期化部、23…WF係数・平均WF係数計算部、24…平均WF係数比較・反復実施可否制御部、25…フィルタ処理部、26…反復回数カウンタ更新部、27…参照信号更新部、28…フィルタ処理後信号送信部。
Claims (5)
- 入力音声信号に含まれている雑音成分を、反復ウィーナーフィルタ処理手段がウィーナーフィルタ処理を反復して繰り返すことによって抑圧して出力する信号処理装置において、
当該特徴量算出手段への入力音声信号から、その入力音声信号における目的音声の含有量を示す特徴量を算出する特徴量算出手段と、
上記特徴量に基づいて、ウィーナーフィルタ処理の反復回数を制御する反復回数制御手段と
を備えることを特徴とする信号処理装置。 - 上記特徴量算出手段は、
当該第1の指向性形成部への一対の入力音声信号に基づいて、第1の所定方位に死角を有する指向性特性を付与した第1の指向性信号を形成する第1の指向性形成部と、
上記一対の入力音声信号に基づいて、上記第1の所定方位とは異なる第2の所定方位に死角を有する指向性特性を付与した第2の指向性信号を形成する第2の指向性形成部と、
上記第1及び第2の指向性信号を用いて、上記特徴量としてのコヒーレンスを得るコヒーレンス計算部とを備え、
上記一対の入力音声信号の一方が、雑音成分の抑圧対象の入力音声信号となっている
ことを特徴とする請求項1に記載の信号処理装置。 - 上記反復回数制御手段は、上記コヒーレンス計算部が計算したコヒーレンスと、周波数成分ごとのウィーナーフィルタ係数の平均値とを比較し、その比較結果に応じて、ウィーナーフィルタ処理の反復の継続又は終了を決定する
ことを特徴とする請求項2に記載の信号処理装置。 - 入力音声信号に含まれている雑音成分を、反復ウィーナーフィルタ処理手段がウィーナーフィルタ処理を反復して繰り返すことによって抑圧して出力する信号処理方法において、
特徴量算出手段が、当該特徴量算出手段への入力音声信号から、その入力音声信号における目的音声の含有量を示す特徴量を算出し、
反復回数制御手段が、上記特徴量に基づいて、ウィーナーフィルタ処理の反復回数を制御する
ことを特徴とする信号処理方法。 - 一対の入力音声信号の一方に含まれている雑音成分をウィーナーフィルタ処理を反復して繰り返すことによって抑圧して出力する信号処理装置に搭載されたコンピュータを、
当該特徴量算出手段への入力音声信号から、その入力音声信号における目的音声の含有量を示す特徴量を算出する特徴量算出手段と、
上記特徴量に基づいて、ウィーナーフィルタ処理の反復回数を制御する反復回数制御手段と
して機能させることを特徴とする信号処理プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013036366A JP2014164192A (ja) | 2013-02-26 | 2013-02-26 | 信号処理装置、方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013036366A JP2014164192A (ja) | 2013-02-26 | 2013-02-26 | 信号処理装置、方法及びプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2014164192A true JP2014164192A (ja) | 2014-09-08 |
Family
ID=51614823
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013036366A Pending JP2014164192A (ja) | 2013-02-26 | 2013-02-26 | 信号処理装置、方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2014164192A (ja) |
-
2013
- 2013-02-26 JP JP2013036366A patent/JP2014164192A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2015196729A1 (zh) | 一种麦克风阵列语音增强方法及装置 | |
JP2013061421A (ja) | 音声信号処理装置、方法及びプログラム | |
EP3080806A1 (en) | Extraction of reverberant sound using microphone arrays | |
JP6225245B2 (ja) | 信号処理装置、方法及びプログラム | |
JP5838861B2 (ja) | 音声信号処理装置、方法及びプログラム | |
JP2011244232A (ja) | マイクロホンアレイ装置及び前記マイクロホンアレイ装置が実行するプログラム | |
CN111863015A (zh) | 一种音频处理方法、装置、电子设备和可读存储介质 | |
CN110111802B (zh) | 基于卡尔曼滤波的自适应去混响方法 | |
JP6221257B2 (ja) | 信号処理装置、方法及びプログラム | |
US11380312B1 (en) | Residual echo suppression for keyword detection | |
JP2013126026A (ja) | 非目的音抑制装置、非目的音抑制方法及び非目的音抑制プログラム | |
JP6314475B2 (ja) | 音声信号処理装置及びプログラム | |
JP6840302B2 (ja) | 情報処理装置、プログラム及び情報処理方法 | |
JP6221258B2 (ja) | 信号処理装置、方法及びプログラム | |
JP6638248B2 (ja) | 音声判定装置、方法及びプログラム、並びに、音声信号処理装置 | |
JP6295650B2 (ja) | 音声信号処理装置及びプログラム | |
JP2014164192A (ja) | 信号処理装置、方法及びプログラム | |
JP6221463B2 (ja) | 音声信号処理装置及びプログラム | |
JP6263890B2 (ja) | 音声信号処理装置及びプログラム | |
US11462231B1 (en) | Spectral smoothing method for noise reduction | |
JP6631127B2 (ja) | 音声判定装置、方法及びプログラム、並びに、音声処理装置 | |
JP2015025914A (ja) | 音声信号処理装置及びプログラム | |
JP6252274B2 (ja) | 背景雑音区間推定装置及びプログラム | |
JP2018049228A (ja) | 音響処理装置および音響処理方法 | |
JP6544182B2 (ja) | 音声処理装置、プログラム及び方法 |