JP6221257B2 - 信号処理装置、方法及びプログラム - Google Patents

信号処理装置、方法及びプログラム Download PDF

Info

Publication number
JP6221257B2
JP6221257B2 JP2013036331A JP2013036331A JP6221257B2 JP 6221257 B2 JP6221257 B2 JP 6221257B2 JP 2013036331 A JP2013036331 A JP 2013036331A JP 2013036331 A JP2013036331 A JP 2013036331A JP 6221257 B2 JP6221257 B2 JP 6221257B2
Authority
JP
Japan
Prior art keywords
coherence
iterative
signal
coherence filter
processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013036331A
Other languages
English (en)
Other versions
JP2014164190A (ja
Inventor
克之 高橋
克之 高橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2013036331A priority Critical patent/JP6221257B2/ja
Priority to US14/770,806 priority patent/US9570088B2/en
Priority to PCT/JP2013/081241 priority patent/WO2014132499A1/ja
Publication of JP2014164190A publication Critical patent/JP2014164190A/ja
Application granted granted Critical
Publication of JP6221257B2 publication Critical patent/JP6221257B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0264Noise filtering characterised by the type of parameter measurement, e.g. correlation techniques, zero crossing techniques or predictive techniques

Description

本発明は信号処理装置、方法及びプログラムに関し、例えば、電話機やテレビ会議装置などの音声信号(この明細書では、音声信号と音響信号の双方を含めて「音声信号」と呼んでいる)を扱う通信機や通信ソフトウェアに適用し得るものである。
取得した音声信号中に含まれる雑音成分を抑圧する手法の一つとして、コヒーレンスフィルタ法が挙げられる。コヒーレンスフィルタ法は、特許文献1に記載されているように、左右に死角を有する信号の相互相関を周波数ごとに乗算することで、到来方位に偏りが大きい雑音成分を抑圧する手法である。
特開2008−70878号公報
しかし、コヒーレンスフィルタ法は、雑音成分を抑圧する効果があるが、一方、ミュージカルノイズという異音成分(トーン性の雑音)を発生させてしまうという課題がある。
そのため、コヒーレンスフィルタ法に従って雑音成分を抑圧しても、ミュージカルノイズの発生を抑えることができる信号処理装置、方法及びプログラムが望まれている。
第1の本発明は、入力音声信号に含まれている雑音成分をコヒーレンスフィルタ処理によって抑制する信号処理装置において、反復処理の終了条件を満たすまで、コヒーレンスフィルタ処理後の信号を、コヒーレンスフィルタ処理での入力信号として、コヒーレンスフィルタ処理を反復して繰り返す反復コヒーレンスフィルタ処理手段を有し、上記反復コヒーレンスフィルタ処理手段は、周波数領域信号となっている音声信号を処理するものであり、上記反復コヒーレンスフィルタ処理手段は、反復回数ごとに算出された、周波数成分ごとのコヒーレンスフィルタ係数の分布の代表値の挙動が所定の場合に、反復処理の終了条件が成立したと判定する反復終了判定部を有することを特徴とする。
第2の本発明は、入力音声信号に含まれている雑音成分をコヒーレンスフィルタ処理によって抑制する信号処理方法において、反復コヒーレンスフィルタ処理手段が、反復処理の終了条件を満たすまで、コヒーレンスフィルタ処理後の信号をコヒーレンスフィルタ処理での入力信号として、コヒーレンスフィルタ処理を反復して繰り返し、上記反復コヒーレンスフィルタ処理手段は、周波数領域信号となっている音声信号を処理するものであり、上記反復コヒーレンスフィルタ処理手段の反復終了判定部は、反復回数ごとに算出された、周波数成分ごとのコヒーレンスフィルタ係数の分布の代表値の挙動が所定の場合に、反復処理の終了条件が成立したと判定することを特徴とする。
第3の本発明の信号処理プログラムは、入力音声信号に含まれている雑音成分をコヒーレンスフィルタ処理によって抑制する信号処理装置に搭載されたコンピュータを、反復処理の終了条件を満たすまで、コヒーレンスフィルタ処理後の信号をコヒーレンスフィルタ処理での入力信号として、コヒーレンスフィルタ処理を反復して繰り返す反復コヒーレンスフィルタ処理手段として機能させ、上記反復コヒーレンスフィルタ処理手段は、周波数領域信号となっている音声信号を処理するものであり、上記反復コヒーレンスフィルタ処理手段は、反復回数ごとに算出された、周波数成分ごとのコヒーレンスフィルタ係数の分布の代表値の挙動が所定の場合に、反復処理の終了条件が成立したと判定する反復終了判定部を有することを特徴とする。
本発明によれば、コヒーレンスフィルタ法に従って雑音成分を抑圧しても、ミュージカルノイズの発生を抑えることができる信号処理装置、方法及びプログラムを提供できる。
第1の実施形態及び第2の実施形態の信号処理装置の全体構成を示すブロック図である。 第1の実施形態における反復コヒーレンスフィルタ処理部の詳細構成を示すブロック図である。 第1の実施形態における指向性形成部からの指向性信号の性質を示す説明図である。 第1の実施形態における指向性形成部による2つの指向性の特性を示す説明図である。 第1の実施形態における反復コヒーレンスフィルタ処理部の詳細動作を示すフローチャートである。 第2の実施形態における反復コヒーレンスフィルタ処理部の詳細構成を示すブロック図である。 第2の実施形態における反復コヒーレンスフィルタ処理部の詳細動作を示すフローチャートである。
(A)第1の実施形態
以下、本発明による信号処理装置、方法及びプログラムの第1の実施形態を、図面を参照しながら詳述する。
第1の実施形態の信号処理装置、方法及びプログラムは、コヒーレンスフィルタ処理を所定回数だけ反復して繰り返すことを特徴としている。
(A−1)第1の実施形態の構成
図1は、第1の実施形態に係る信号処理装置の構成を示すブロック図である。ここで、一対のマイクm1及びm2を除いた部分は、ハードウェアで構成することも可能であり、また、CPUが実行するソフトウェア(信号処理プログラム)とCPUとで実現することも可能であるが、いずれの実現方法を採用した場合であっても、機能的には図1で表すことができる。
図1において、第1の実施形態に係る信号処理装置1は、一対のマイクm1、m2、FFT部11、反復コヒーレンスフィルタ処理部12及びIFFT部13を有する。
一対のマイクm1、m2は、所定距離(若しくは任意の距離)だけ離れて配置され、それぞれ、周囲の音声を捕捉するものである。各マイクm1、m2で捕捉された音声信号(入力信号)は、図示しない対応するAD変換器を介してデジタル信号s1(n)、s2(n)に変換されてFFT部11に与えられる。なお、nはサンプルの入力順を表すインデックスであり、正の整数で表現される。本文中では、nが小さいほど古い入力サンプルであり、大きいほど新しい入力サンプルであるとする。
FFT部11は、マイクm1及びm2から入力信号系列s1(n)及びs2(n)を受け取り、その入力信号s1及びs2に高速フーリエ変換(あるいは離散フーリエ変換)を行うものである。これにより、入力信号s1及びs2を周波数領域で表現することができる。なお、高速フーリエ変換を実施するにあたり、入力信号s1(n)及びs2(n)から、所定のN個のサンプルからなる分析フレームFRAME1(K)及びFRAME2(K)を構成して適用する。入力信号s1(n)から分析フレームFRAME1(K)を構成する例を以下の(1)式に示すが、分析フレームFRAME2(K)も同様である。
Figure 0006221257
なお、Kはフレームの順番を表すインデックスであり、正の整数で表現される。本文中では、Kが小さいほど古い分析フレームであり、大きいほど新しい分析フレームであるとする。また、以降の説明において、特に但し書きがない限りは、分析対象となる最新の分析フレームを表すインデックスはKであるとする。
FFT部11は、分析フレームごとに高速フーリエ変換処理を施すことで、周波数領域信号X1(f,K)、X2(f,K)に変換し、得られた周波数領域信号X1(f,K)及びX2(f,K)をそれぞれ、反復コヒーレンスフィルタ処理部12に与える。なお、fは周波数を表すインデックスである。また、X1(f,K)は単一の値ではなく、(2)式に示すように、複致の周波数f1〜fmのスペクトル成分から構成されるものである。さらに、X1(f,K)は複素数であり、実部と虚部からなる。X2(f,K)や後述するB1(f,K)及びB2(f,K)も同様である。
X1(f,K)={X1(f1,K),X1(f2,K),…,X1(fm,K)} …(2)
反復コヒーレンスフィルタ処理部12は、コヒーレンスフィルタ処理を所定回数だけ繰り返し実行し、雑音成分が抑圧された信号Y(f,K)を得て、IFFT部13に与えるものである。
IFFT部13は、雑音抑圧後信号Y(f,K)に対して、逆高速フーリエ変換を施して時間領域信号である出力信号y(n)を得るものである。
図2は、反復コヒーレンスフィルタ処理部12の詳細構成を示すブロック図である。
図2において、反復コヒーレンスフィルタ処理部12は、入力信号受信部21、反復回数カウンタ・参照信号初期化部22、指向性形成部23、フィルタ係数計算部24、回数監視・反復実施可否制御部25、フィルタ処理部26、反復回数カウンタ更新部27、参照信号更新部28及びフィルタ処理後信号送信部29を有する。
反復コヒーレンスフィルタ処理部12においては、これらの各部21〜29が協働して動作することにより、後述する図5のフローチャートに示す処理を実行する。
入力信号受信部21は、FFT部11から出力された周波数領域信号X1(f,K)、X2(f,K)を受け取るものである。
反復回数カウンタ・参照信号初期化部22は、反復回数を表すカウンタ変数(以下、反復回数カウンタと呼ぶ)pと、コヒーレンスフィルタ係数を算出するための参照信号ref_1ch(f,K,p)、ref_2ch(f,K,p)を初期化する。反復回数カウンタpの初期化値は0であり、参照信号ref_1ch(f,K,p)及びref_2ch(f,K,p)の初期化値はそれぞれ、X1(f,K)、X2(f,K)である。
ここで、参照信号ref_1ch(f,K,p)の表記は、周波数がfで、フレームがK番目で、反復回数がpの信号であることを表しており、1chは、2つの参照信号の一方の信号であることを表している。
指向性形成部23は、特定方向に指向性が強い2種類の指向性信号(第1及び第2の指向性信号)B1(f,K,p)、B2(f,K,p)を形成するものである。指向性信号B1(f,K,p)、B2(f,K,p)を形成する方法は、既存の方法を適用することができ、例えば、(3)式及び(4)式に従った演算により求める方法を適用することができる。
Figure 0006221257
第1の指向性信号B1(f,K,p)は、後述するように音源方向の特定方向(右方向)に強い指向性を持つ信号であり、第2の指向性信号B2(f,K,p)は、後述するように音源方向の特定方向(左方向)に強い指向性を持つ信号である。
コヒーレンスフィルタ処理の反復が1回もなされていない状態では、参照信号の初期化値を上述したように定めているので、(3)式及び(4)式で表される第1及び第2の指向性信号B1(f,K,p)及びB2(f,K,p)はそれぞれ、(5)式、(6)式で表される。なお、(5)式及び(6)式においては、フレームインデックスK、反復回数カウンタpは演算には関与しないので、記載を省略している。
Figure 0006221257
以下、第1及び第2の指向性信号B1(f)及びB2(f)の算出式の意味を、(5)式を例に、図2及び図3を用いて説明する。図2(A)に示した方向θから音波が到来し、距離lだけ隔てて設置されている一対のマイクm1及びm2で捕捉されたとする。このとき、音波が一対のマイクm1及びm2に到達するまでには時間差が生じる。この到達時間差τは、音の経路差をdとすると、d=l×sinθなので、音速をcとすると(7)式で与えられる。
τ=l×sinθ/c …(7)
ところで、入力信号s1(n)にτだけ遅延を与えた信号s1(t−τ)は、入力信号s2(t)と同一の信号である。従って、両者の差をとった信号y(t)=s2(t)−s1(t−τ)は、θ方向から到来した音が除去された信号となる。結果として、マイクロフォンアレーm1及びm2は図2(B)のような指向特性を持つようになる。
なお、以上では、時間領域での演算を記したが、周波数領域で行っても同様なことがいえる。この場合の式が、上述した(5)式及び(6)式である。今、一例として、到来方位θが±90度であることを想定する。すなわち、第1の指向性信号B1(f)は、図3(A)に示すように右方向に強い指向性を有し、第2の指向性信号B2(f)は、図3(B)に示すように左方向に強い指向性を有する。なお、以降では、θ=±90度であることを想定して説明するが、θは±90度に限定されるものではない。
反復されたコヒーレンスフィルタ処理においては、参照信号ref_1ch(f,K,p)及びref_2ch(f,K,p)が入力信号と見なされてコヒーレンスフィルタ処理されるため、上述した(3)式及び(4)式を適用する。
フィルタ係数計算部24は、第1及び第2の指向性信号B1(f,K,p)及びB2(f,K,p)に基づいて、(8)式に従ってコヒーレンスフィルタ係数coef(f,K,p)を計算するものである。
Figure 0006221257
回数監視・反復実施可否制御部25は、反復回数カウンタpと予め定められた反復回数最大値MAXとを比較し、反復回数カウンタpが反復回数最大値MAXより小さければコヒーレンスフィルタ処理を反復させ、反復回数カウンタpが反復回数最大値MAXに達するとコヒーレンスフィルタ処理を反復させずに終了させるように各部を制御するものである。
反復回数カウンタ更新部27は、回数監視・反復実施可否制御部25がコヒーレンスフィルタ処理を反復させると決定したときに、反復回数カウンタpを1だけ増加させるものである。この増加に伴い、新たな一連のコヒーレンスフィルタ処理が始まる。
参照信号更新部28は、周波数成分ごとに、入力された周波数領域信号X1(f,K)及びX2(f,K)のそれぞれに対して、(9)式及び(10)式に示すように、フィルタ係数計算部24が算出したコヒーレンスフィルタ係数coef(f,K,p)を乗算し、フィルタ処理後信号CF_out_1ch(f,K,p)、CF_out_2ch(f,K,p)を得る。また、参照信号更新部28は、得られたフィルタ処理後信号CF_out_1ch(f,K,p)、CF_out_2ch(f,K,p)を、(11)式及び(12)式に示すように、次の反復処理における参照信号ref_1ch(f,K,p)及びref_2ch(f,K,p)に設定するものである。
Figure 0006221257
フィルタ処理後信号送信部29は、回数監視・反復実施可否制御部25がコヒーレンスフィルタ処理の反復を終了させると決定したときに、その時点で得られているフィルタ処理後信号CF_out_1ch(f,K,p)及びCF_out_2ch(f,K,p)の一方を、反復コヒーレンスフィルタ処理信号Y(f,K)としてIFFT部13に与えるものである。また、フィルタ処理後信号送信部29は、Kを1だけ増加させて次のフレームの処理を起動させるものである。
(A−2)第1の実施形態の動作
次に、第1の実施形態の信号処理装置1の動作を、図面を参照しながら、全体動作、反復コヒーレンスフィルタ処理部12における詳細動作の順に説明する。
一対のマイクm1及びm2から入力された信号s1(n)、s2(n)はそれぞれ、FFT部11によって時間領域から周波数領域の信号X1(f,K)、X2(f,K)に変換された後、反復コヒーレンスフィルタ処理部12に与えられる。これにより、反復コヒーレンスフィルタ処理部12において、コヒーレンスフィルタ処理が所定回数(M回)だけ繰り返し実行され、得られた雑音抑圧後信号Y(f,K)がIFFT部13に与えられる。
IFFT部13においては、周波数領域信号である雑音抑圧後信号Y(f,K)が、逆高速フーリエ変換によって、時間領域信号y(n)に変換され、この時間領域信号y(n)が出力される。
次に、反復コヒーレンスフィルタ処理部12における詳細動作を、図5のフローチャートを参照しながら説明する。なお、図5は、あるフレームの処理を示しており、フレームごとに、図5に示す処理が繰り返される。
新たなフレームになり、新たなフレーム(現フレームK)の周波数領域信号X1(f,K)、X2(f,K)がFFT部11から与えられると、反復コヒーレンスフィルタ処理部12は、反復回数カウンタpを0に、参照信号ref_1ch(f,K,p)及びref_2ch(f,K,p)をそれぞれ、周波数領域信号X1(f,K)、X2(f,K)に初期化する(ステップS1)。
次に、参照信号ref_1ch(f,K,p)及びref_2ch(f,K,p)に基づき、(3)式及び(4)式に従って、第1及び第2の指向性信号B1(f,K,p)及びB2(f,K,p)が計算され(ステップS2)、さらに、これらの指向性信号B1(f,K,p)及びB2(f,K,p)に基づき、(8)式に従って、コヒーレンスフィルタ係数coef(f,K,p)が計算される(ステップS3)。
そして、周波数成分ごとに、(9)式及び(10)式に示すように、入力された周波数領域信号X1(f,K)及びX2(f,K)のそれぞれと、コヒーレンスフィルタ係数coef(f,K,p)とが乗算され、フィルタ処理後信号CF_out_1ch(f,K,p)、CF_out_2ch(f,K,p)が得られる(ステップS4)。
次に、反復回数カウンタpと予め定められた反復回数最大値MAXとが比較される(ステップS5)。
反復回数カウンタpが反復回数最大値MAXより小さい場合には、反復回数カウンタpが1だけ増加されて新しい反復回数でのコヒーレンスフィルタ処理に入り(ステップS6)、直前のフィルタ処理後信号CF_out_1ch(f,K,p−1)、CF_out_2ch(f,K,p−1)が、新しい反復回数での参照信号ref_1ch(f,K,p)及びref_2ch(f,K,p)に設定された後(ステップS7)、上述したステップS2の指向性信号の計算処理に移行する。
これに対して、反復回数カウンタpが反復回数最大値MAXに達した場合には、その時点で得られているフィルタ処理後信号CF_out_1ch(f,K,p)及びCF_out_2ch(f,K,p)の一方が、反復コヒーレンスフィルタ処理信号Y(f,K)としてIFFT部13に与えられると共に、フレーム変数Kが1だけ増加されて(ステップS8)、次のフレームの処理に移行される。
(A−3)第1の実施形態の効果
第1の実施形態によれば、コヒーレンスフィルタ処理後の信号から改めてフィルタ係数を推定して入力信号に付与し、コヒーレンスフィルタ処理を所定回数だけ繰り返すので、コヒーレンスフィルタ法に従って雑音成分を抑圧しつつ、ミュージカルノイズの発生を抑えることができる。
これにより、第1の実施形態の信号処理装置を、テレビ会議システムや携帯電話やスマートフォンなどの通信装置に適用することで、通話音質の向上が期待できる。
(B)第2の実施形態
次に、本発明による信号処理装置、方法及びプログラムの第2の実施形態を、図面を参照しながら詳述する。
第2の実施形態の信号処理装置、方法及びプログラムは、コヒーレンスフィルタ処理を反復して繰り返す反復回数を適応的に制御することを特徴としている。
第1の実施形態では、コヒーレンスフィルタ処理の反復回数が固定であった。しかし、最適な反復回数は、雑音の特性によって変動する。そのため、反復回数を固定にした場合、雑音の抑圧量が不足する恐れがある。また、反復を繰り返すたびに音声が歪み自然さが損なわれる場合があり、反復回数を徒に多くしても不都合が生じる。そのため、第2の実施形態では、歪みやミュージカルノイズが少ない音質の自然さと、抑圧性能とがバランスよく実現されるような最適な反復回数を設定することを特徴としている。
(B−1)第2の実施形態の構成
第2の実施形態に係る信号処理装置1Aの全体構成も、第1の実施形態の説明で用いた上述した図1で表すことができる。但し、反復コヒーレンスフィルタ処理部12Aの内部構成が、第1の実施形態のものと異なっている。
図6は、第2の実施形態の反復コヒーレンスフィルタ処理部12Aの詳細構成を示すブロック図であり、上述した図2との同一、対応部分には同一符号を付して示している。
第2の実施形態の反復コヒーレンスフィルタ処理部12Aは、第1の実施形態の反復コヒーレンスフィルタ処理部12におけるフィルタ係数計算部24に代えて、フィルタ係数・平均CF係数計算部24Aを有し、また、第1の実施形態の反復コヒーレンスフィルタ処理部12における回数監視・反復実施可否制御部25に代えて、平均CF係数増減監視・反復実施可否制御部25Aを有する点が、第1の実施形態の反復コヒーレンスフィルタ処理部12と異なっており、その他の構成は、第1の実施形態の反復コヒーレンスフィルタ処理部12と同様である。
すなわち、第2の実施形態の反復コヒーレンスフィルタ処理部12Aは、入力信号受信部21、反復回数カウンタ・参照信号初期化部22、指向性形成部23、フィルタ係数・平均CF係数計算部24A、平均CF係数増減監視・反復実施可否制御部25A、フィルタ処理部26、反復回数カウンタ更新部27、参照信号更新部28及びフィルタ処理後信号送信部29を有する。
フィルタ係数・平均CF係数計算部24Aは、第1及び第2の指向性信号B1(f,K,p)及びB2(f,K,p)に基づいて、(8)式に従ってコヒーレンスフィルタ係数coef(f,K,p)を計算するのに加え、得られた周波数成分ごとのコヒーレンスフィルタ係数coef(0,K,p)〜coef(M−1,K,p)の平均値(以下、平均コヒーレンスフィルタ係数と呼ぶ)COH(K,p)を、(13)式に従って計算するものである。
Figure 0006221257
平均CF係数増減監視・反復実施可否制御部25Aは、現在の反復回数での平均コヒーレンスフィルタ係数COH(K,p)と、前回の反復回数での平均コヒーレンスフィルタ係数COH(K,p−1)とを比較し、現在の反復回数での平均コヒーレンスフィルタ係数COH(K,p)が前回の反復回数での平均コヒーレンスフィルタ係数COH(K,p−1)より大きければコヒーレンスフィルタ処理を反復させ、現在の反復回数での平均コヒーレンスフィルタ係数COH(K,p)が前回の反復回数での平均コヒーレンスフィルタ係数COH(K,p−1)以下であればコヒーレンスフィルタ処理を反復させずに終了させるように各部を制御するものである。
以下、平均コヒーレンスフィルタ係数COH(K,p)を反復の終了判定に利用することとした理由を説明する。
コヒーレンスフィルタ係数coef(f,K,p)は左右に死角を有する信号成分の相互相関でもあるので、相関が大きい場合は、到来方位には偏りがない正面から到来する音声成分であり、相関が小さい場合は、到来方位が右か左に偏った成分である、というように入力音声の到来方位とも対応付けられる。従って、コヒーレンスフィルタ係数coef(f,K,p)を乗算することは、横から到来する雑音成分を抑圧しているということができ、反復するほど、横から到来する成分の影響を排除されたコヒーレンスフィルタ係数が得られるようになる。
実際に、コヒーレンスフィルタ係数coef(f,K,p)を全ての周波数成分で平均した値である平均コヒーレンスフィルタ係数COH(K,p)を(13)式に従って算出して挙動を確認すると、反復回数が増すほど、雑音区間における平均コヒーレンスフィルタ係数COH(K,p)は増大していき、横から到来する成分の寄与が小さくなっていくことが確認できる。
しかし、必要以上に反復した場合には、正面から到来する成分まで抑圧されるようになり、音質が歪む。そして、その際、平均コヒーレンスフィルタ係数COH(K,p)は正面から到来する成分の影響が小さくなるため減少していく。
以上のような反復回数に応じた平均コヒーレンスフィルタ係数COH(K,p)の挙動から、平均コヒーレンスフィルタ係数COH(K,p)が極大値をとる反復回数が、抑圧性能と音質とのバランスがとれる回数であると考えられる。
そこで、反復ごとの平均コヒーレンスフィルタ係数COH(K,p)を観測し、平均コヒーレンスフィルタ係数COH(K,p)の変化(挙動)が増加から減少に転じた時点で反復処理を終了することとした。これにより、最適な反復回数で反復コヒーレンスフィルタ処理を実行させることができる。
(B−2)第2の実施形態の動作
次に、第2の実施形態の信号処理装置1Aにおける反復コヒーレンスフィルタ処理部12Aの詳細動作を、図面を参照しながら説明する。なお、第2の実施形態の信号処理装置1Aの全体動作は、第1の実施形態の信号処理装置1の全体動作と同様であるので、その説明は省略する。
図7は、第2の実施形態における反復コヒーレンスフィルタ処理部12Aの詳細動作を示すフローチャートであり、第1の実施形態に係る図5との同一ステップには同一符号を付して示している。
新たなフレーム(現フレームK)の周波数領域信号X1(f,K)、X2(f,K)が与えられると、反復回数カウンタpは0に、参照信号ref_1ch(f,K,p)及びref_2ch(f,K,p)はそれぞれ、周波数領域信号X1(f,K)、X2(f,K)に初期化される(ステップS1)。次に、参照信号ref_1ch(f,K,p)及びref_2ch(f,K,p)に基づき、(3)式及び(4)式に従って、第1及び第2の指向性信号B1(f,K,p)及びB2(f,K,p)が計算される(ステップS2)。
さらに、これらの指向性信号B1(f,K,p)及びB2(f,K,p)に基づき、(8)式に従って、コヒーレンスフィルタ係数coef(f,K,p)が計算され、得られた周波数成分ごとのコヒーレンスフィルタ係数coef(0,K,p)〜coef(M−1,K,p)に基づき、(13)式に従って、平均コヒーレンスフィルタ係数COH(K,p)が算出される(ステップS11)。
そして、現在の反復回数での平均コヒーレンスフィルタ係数COH(K,p)が、前回の反復回数での平均コヒーレンスフィルタ係数COH(K,p−1)より大きいか否かが判別される(ステップS12)。
現在の反復回数での平均コヒーレンスフィルタ係数COH(K,p)が、前回の反復回数での平均コヒーレンスフィルタ係数COH(K,p−1)より大きい場合には、周波数成分ごとに、(9)式及び(10)式に示すように、入力された周波数領域信号X1(f,K)及びX2(f,K)のそれぞれと、コヒーレンスフィルタ係数coef(f,K,p)とが乗算され、フィルタ処理後信号CF_out_1ch(f,K,p)、CF_out_2ch(f,K,p)が得られる(ステップS4)。さらに、反復回数カウンタpが1だけ増加されて新しい反復回数でのコヒーレンスフィルタ処理に入り(ステップS6)、直前のフィルタ処理後信号CF_out_1ch(f,K,p−1)、CF_out_2ch(f,K,p−1)が、新しい反復回数での参照信号ref_1ch(f,K,p)及びref_2ch(f,K,p)に設定された後(ステップS7)、上述したステップS2の指向性信号の計算処理に移行する。
これに対して、現在の反復回数での平均コヒーレンスフィルタ係数COH(K,p)が、前回の反復回数での平均コヒーレンスフィルタ係数COH(K,p−1)以下の場合には、その時点で得られているフィルタ処理後信号CF_out_1ch(f,K,p)及びCF_out_2ch(f,K,p)の一方が、反復コヒーレンスフィルタ処理信号Y(f,K)としてIFFT部13に与えられると共に、フレーム変数Kが1だけ増加されて(ステップS8)、次のフレームの処理に移行される。
(B−3)第2の実施形態の効果
第2の実施形態によれば、平均コヒーレンスフィルタ係数が増加から減少に転じる、音質と抑圧性能のバランスが良い段階で、反復コヒーレンスフィルタ処理を終了するようにしたので、音質と抑圧性能をバランス良く実現することができる。
これにより、第2の実施形態の信号処理装置を、テレビ会議システムや携帯電話やスマートフォンなどの通信装置に適用することで、通話音質の向上が期待できる。
(C)他の実施形態
第2の実施形態では、平均コヒーレンスフィルタ係数の挙動が増加から減少に転じたことを、現在の反復回数での平均コヒーレンスフィルタ係数が前回の反復回数での平均コヒーレンスフィルタ係数以下であることが1回生じたことにより判定するものを示したが、現在の反復回数での平均コヒーレンスフィルタ係数が前回の反復回数での平均コヒーレンスフィルタ係数以下であることが所定回(例えば2回)連続したときに、平均コヒーレンスフィルタ係数の挙動が増加から減少に転じたと判定するようにしても良い。
第2の実施形態では、抑圧性能と音質のバランスがとれることを目標として反復回数を制御したが、抑圧性能を重視して音質を低めにしたり、反対に、音質を重視して抑圧性能を控え目に設定したりするようにしても良い。前者の場合であれば、例えば、平均コヒーレンスフィルタ係数が減少に転じた以降も、予め定められている回数だけ反復処理を繰り返す。後者の場合であれば、例えば、平均コヒーレンスフィルタ係数が減少に転じた反復回数より、予め定められている回数だけ前の反復回数でのコヒーレンスフィルタ係数(現在より所定回数前のコヒーレンスフィルタ係数を保存するようにしておく)を適用したフィルタ処理後の信号を、出力信号とするようにすれば良い。
上記第2の実施形態では、相前後する反復回数での平均コヒーレンスフィルタ係数の大小に基づいて、反復処理の終了を判定するものを示したが、相前後する反復回数での平均コヒーレンスフィルタ係数の傾き(微分係数)に基づいて、反復処理の終了を判定するようにしても良い。傾きが0(若しくは0±α(αは極小値を判定できる程度の小さな値)の範囲内の値)に変化したときに、反復処理を終了させると判定する。傾きは、相前後する反復回数での平均コヒーレンスフィルタ係数の算出時刻の時間差が一定の場合であれば、相前後する反復回数での平均コヒーレンスフィルタ係数の差として算出することができ、相前後する反復回数での平均コヒーレンスフィルタ係数の算出時刻の時間差が一定でない場合であれば、平均コヒーレンスフィルタ係数の算出ごとにその時刻を記録しておき、相前後する反復回数での平均コヒーレンスフィルタ係数の差を、時刻の差で割ることによって算出することができる。
上記第2の実施形態では、平均コヒーレンスフィルタ係数を反復処理の終了判定に利用するものを示したが、他のパラメータを適用するようにしても良い。例えば、前後の反復回数における、中央の周波数成分のコヒーレンスフィルタ係数同士で比較して反復処理の継続か終了かの判定を行うようにしても良い。また例えば、全てではなく、一部の周波数成分の平均を比較して反復処理の継続か終了かの判定を行うようにしても良い。さらに、複数の周波数成分の代表値として、平均値以外の他の統計量(例えば中央値)を適用するようにしても良い。
上記実施形態では、前後の反復回数におけるコヒーレンスCOH(K,p)及びCOH(K,p−1)を反復ごとに比較して、反復ごとに反復処理の継続か終了かの判定を行うものを示したが、反復処理の開始前に、コヒーレンスCOH(K)に応じて、反復回数を定めるようにしても良い。例えば、上記実施形態のようにして終了タイミングを定めた場合における、コヒーレンスCOH(K)の値と実反復回数との関係を、シミュレーション等によって多数得て、それらの関係を整理して、コヒーレンス(の範囲)と最大反復回数との関係式、若しくは、変換テーブルを予め作成しておき、コヒーレンスが算出されたときに、関係式若しくは変換テーブルを適用して反復回数(最大反復回数)を定め、その反復回数だけコヒーレンスフィルタ処理を反復するようにしても良い。
上記実施形態では、反復処理の継続か終了の判定に、コヒーレンスCOH(K)を用いたものを示したが、コヒーレンスCOH(K)に代えて、「入力音声信号における目的音声の含有量」という概念を持つ他の特徴量を用いて、反復処理の継続か終了かの判定を行うようにしても良い。
上記各実施形態(特に、第1の実施形態)において、周波数領域の信号で処理していた処理を、可能ならば時間領域の信号で処理するようにしても良い。
上記各実施形態では、一対のマイクが捕捉した信号を直ちに処理する場合を示したが、本発明の処理対象の音声信号はこれに限定されるものではない。例えば、記録媒体から読み出した一対の音声信号を処理する場合にも、本発明を適用することができ、また、対向装置から送信されてきた一対の音声信号を処理する場合にも、本発明を適用することができる。このような変形実施形態の場合であれば、信号処理装置に入力される段階で、既に周波数領域の信号になっていても良い。
上記各実施形態では、入力が2chの場合を前提として構成及び動作を説明したが、本発明におけるch数はこれに限定されるものではなく、ch数を任意に設定しても良い。
1、1A…信号処理装置、11…FFT部、12、12A…反復コヒーレンスフィルタ処理部、13…IFFT部、m1、m2…マイク、21…入力信号受信部、22…反復回数カウンタ・参照信号初期化部、23…指向性形成部、24…フィルタ係数計算部、24A…フィルタ係数・平均CF係数計算部、25…回数監視・反復実施可否制御部、25A…平均CF係数増減監視・反復実施可否制御部、26…フィルタ処理部、27…反復回数カウンタ更新部、28…参照信号更新部、29…フィルタ処理後信号送信部。

Claims (6)

  1. 入力音声信号に含まれている雑音成分をコヒーレンスフィルタ処理によって抑制する信号処理装置において、
    反復処理の終了条件を満たすまで、コヒーレンスフィルタ処理後の信号を、コヒーレンスフィルタ処理での入力信号として、コヒーレンスフィルタ処理を反復して繰り返す反復コヒーレンスフィルタ処理手段を有し、
    上記反復コヒーレンスフィルタ処理手段は、周波数領域信号となっている音声信号を処理するものであり、
    上記反復コヒーレンスフィルタ処理手段は、反復回数ごとに算出された、周波数成分ごとのコヒーレンスフィルタ係数の分布の代表値の挙動が所定の場合に、反復処理の終了条件が成立したと判定する反復終了判定部を有する
    ことを特徴とする信号処理装置。
  2. 上記反復終了判定部は、コヒーレンスフィルタ係数の分布の代表値としてコヒーレンスフィルタ係数の平均値を適用し、平均値が増大から減少に転じる反復回数で、反復処理の終了条件が成立したと判定することを特徴とする請求項に記載の信号処理装置。
  3. 上記反復終了判定部は、現在の反復回数で得られたコヒーレンスフィルタ係数の平均値と、前回の反復回数で得られたコヒーレンスフィルタ係数の平均値とを大小比較することにより、反復処理の終了条件の成立、不成立を判定することを特徴とする請求項に記載の信号処理装置。
  4. 上記反復終了判定部は、コヒーレンスフィルタ係数の平均値の変化の傾きに基づいて、反復処理の終了条件の成立、不成立を判定することを特徴とする請求項に記載の信号処理装置。
  5. 入力音声信号に含まれている雑音成分をコヒーレンスフィルタ処理によって抑制する信号処理方法において、
    反復コヒーレンスフィルタ処理手段が、反復処理の終了条件を満たすまで、コヒーレンスフィルタ処理後の信号をコヒーレンスフィルタ処理での入力信号として、コヒーレンスフィルタ処理を反復して繰り返し、
    上記反復コヒーレンスフィルタ処理手段は、周波数領域信号となっている音声信号を処理するものであり、
    上記反復コヒーレンスフィルタ処理手段の反復終了判定部は、反復回数ごとに算出された、周波数成分ごとのコヒーレンスフィルタ係数の分布の代表値の挙動が所定の場合に、反復処理の終了条件が成立したと判定する
    ことを特徴とする信号処理方法。
  6. 入力音声信号に含まれている雑音成分をコヒーレンスフィルタ処理によって抑制する信号処理装置に搭載されたコンピュータを、
    反復処理の終了条件を満たすまで、コヒーレンスフィルタ処理後の信号をコヒーレンスフィルタ処理での入力信号として、コヒーレンスフィルタ処理を反復して繰り返す反復コヒーレンスフィルタ処理手段として機能させ
    上記反復コヒーレンスフィルタ処理手段は、周波数領域信号となっている音声信号を処理するものであり、
    上記反復コヒーレンスフィルタ処理手段は、反復回数ごとに算出された、周波数成分ごとのコヒーレンスフィルタ係数の分布の代表値の挙動が所定の場合に、反復処理の終了条件が成立したと判定する反復終了判定部を有する
    ことを特徴とする信号処理プログラム。
JP2013036331A 2013-02-26 2013-02-26 信号処理装置、方法及びプログラム Active JP6221257B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2013036331A JP6221257B2 (ja) 2013-02-26 2013-02-26 信号処理装置、方法及びプログラム
US14/770,806 US9570088B2 (en) 2013-02-26 2013-11-20 Signal processor and method therefor
PCT/JP2013/081241 WO2014132499A1 (ja) 2013-02-26 2013-11-20 信号処理装置および方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013036331A JP6221257B2 (ja) 2013-02-26 2013-02-26 信号処理装置、方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2014164190A JP2014164190A (ja) 2014-09-08
JP6221257B2 true JP6221257B2 (ja) 2017-11-01

Family

ID=51427789

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013036331A Active JP6221257B2 (ja) 2013-02-26 2013-02-26 信号処理装置、方法及びプログラム

Country Status (3)

Country Link
US (1) US9570088B2 (ja)
JP (1) JP6221257B2 (ja)
WO (1) WO2014132499A1 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9489963B2 (en) * 2015-03-16 2016-11-08 Qualcomm Technologies International, Ltd. Correlation-based two microphone algorithm for noise reduction in reverberation
CN106297817B (zh) * 2015-06-09 2019-07-09 中国科学院声学研究所 一种基于双耳信息的语音增强方法
US10302687B2 (en) * 2016-06-14 2019-05-28 General Electric Company Filtration thresholding
CN111181526B (zh) * 2020-01-03 2023-03-17 广东工业大学 一种用于信号处理的滤波方法

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3270866B2 (ja) * 1993-03-23 2002-04-02 ソニー株式会社 雑音除去方法および雑音除去装置
US6885746B2 (en) * 2001-07-31 2005-04-26 Telecordia Technologies, Inc. Crosstalk identification for spectrum management in broadband telecommunications systems
AU2002339995A1 (en) * 2001-09-24 2003-04-07 Clarity, Llc Selective sound enhancement
JP4247037B2 (ja) * 2003-01-29 2009-04-02 株式会社東芝 音声信号処理方法と装置及びプログラム
US7099821B2 (en) * 2003-09-12 2006-08-29 Softmax, Inc. Separation of target acoustic signals in a multi-transducer arrangement
US7424463B1 (en) * 2004-04-16 2008-09-09 George Mason Intellectual Properties, Inc. Denoising mechanism for speech signals using embedded thresholds and an analysis dictionary
KR100677396B1 (ko) * 2004-11-20 2007-02-02 엘지전자 주식회사 음성인식장치의 음성구간 검출방법
JP4896449B2 (ja) * 2005-06-29 2012-03-14 株式会社東芝 音響信号処理方法、装置及びプログラム
FR2906070B1 (fr) * 2006-09-15 2009-02-06 Imra Europ Sas Soc Par Actions Reduction de bruit multi-reference pour des applications vocales en environnement automobile
US8160273B2 (en) * 2007-02-26 2012-04-17 Erik Visser Systems, methods, and apparatus for signal separation using data driven techniques
JP5257366B2 (ja) * 2007-12-19 2013-08-07 富士通株式会社 雑音抑圧装置、雑音抑圧制御装置、雑音抑圧方法及び雑音抑圧プログラム
CN102422578B (zh) * 2009-05-07 2015-09-09 日本电气株式会社 相干接收器
JP5263020B2 (ja) * 2009-06-12 2013-08-14 ヤマハ株式会社 信号処理装置
JP5633673B2 (ja) * 2010-05-31 2014-12-03 ヤマハ株式会社 雑音抑圧装置およびプログラム
US8861745B2 (en) * 2010-12-01 2014-10-14 Cambridge Silicon Radio Limited Wind noise mitigation

Also Published As

Publication number Publication date
JP2014164190A (ja) 2014-09-08
US20160019906A1 (en) 2016-01-21
US9570088B2 (en) 2017-02-14
WO2014132499A1 (ja) 2014-09-04

Similar Documents

Publication Publication Date Title
JP5817366B2 (ja) 音声信号処理装置、方法及びプログラム
JP5805365B2 (ja) ノイズ推定装置及び方法とそれを利用したノイズ減少装置
JP5042823B2 (ja) 音声信号反響除去
JP5672770B2 (ja) マイクロホンアレイ装置及び前記マイクロホンアレイ装置が実行するプログラム
KR102004513B1 (ko) 빔포밍 애플리케이션들을 위한 적응형 위상-왜곡없는 MRE(Magnitude Response Equalization)
JPWO2006046293A1 (ja) 雑音抑圧装置
KR102076760B1 (ko) 다채널 마이크를 이용한 칼만필터 기반의 다채널 입출력 비선형 음향학적 반향 제거 방법
JP2018531555A6 (ja) ビーム形成用途のための適応的位相歪曲のない振幅応答等化
JP5838861B2 (ja) 音声信号処理装置、方法及びプログラム
JP6221257B2 (ja) 信号処理装置、方法及びプログラム
JPWO2015129760A1 (ja) 信号処理装置、方法及びプログラム
US11380312B1 (en) Residual echo suppression for keyword detection
JP5927887B2 (ja) 非目的音抑制装置、非目的音抑制方法及び非目的音抑制プログラム
JP2016054421A (ja) 残響抑制装置
JP6314475B2 (ja) 音声信号処理装置及びプログラム
JP6221258B2 (ja) 信号処理装置、方法及びプログラム
WO2020110228A1 (ja) 情報処理装置、プログラム及び情報処理方法
US10887709B1 (en) Aligned beam merger
JP6295650B2 (ja) 音声信号処理装置及びプログラム
JP6221463B2 (ja) 音声信号処理装置及びプログラム
JP6263890B2 (ja) 音声信号処理装置及びプログラム
JP2014164192A (ja) 信号処理装置、方法及びプログラム
US11462231B1 (en) Spectral smoothing method for noise reduction
JP6252274B2 (ja) 背景雑音区間推定装置及びプログラム
JP2015025914A (ja) 音声信号処理装置及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20151117

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170124

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170322

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170905

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170918

R150 Certificate of patent or registration of utility model

Ref document number: 6221257

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150