JP2015037238A - 残響抑圧装置とその方法と、プログラムとその記録媒体 - Google Patents

残響抑圧装置とその方法と、プログラムとその記録媒体 Download PDF

Info

Publication number
JP2015037238A
JP2015037238A JP2013168219A JP2013168219A JP2015037238A JP 2015037238 A JP2015037238 A JP 2015037238A JP 2013168219 A JP2013168219 A JP 2013168219A JP 2013168219 A JP2013168219 A JP 2013168219A JP 2015037238 A JP2015037238 A JP 2015037238A
Authority
JP
Japan
Prior art keywords
power spectrum
filter coefficient
unit
signal
dereverberation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2013168219A
Other languages
English (en)
Other versions
JP5815614B2 (ja
Inventor
小林 和則
Kazunori Kobayashi
和則 小林
仲 大室
Naka Omuro
仲 大室
慶介 木下
Keisuke Kinoshita
慶介 木下
中谷 智広
Tomohiro Nakatani
智広 中谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2013168219A priority Critical patent/JP5815614B2/ja
Publication of JP2015037238A publication Critical patent/JP2015037238A/ja
Application granted granted Critical
Publication of JP5815614B2 publication Critical patent/JP5815614B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Circuit For Audible Band Transducer (AREA)

Abstract

【課題】演算量を削減した残響抑圧装置を提供する。
【解決手段】パワー計算は周波数領域収音信号のパワーを周波数ごとに計算したパワースペクトルを出力し、遅延部はそのパワースペクトルを所定の遅延量だけ遅延させた遅延パワースペクトルを出力し、減算部はパワースペクトルから、上記遅延パワースペクトルにフィルタ係数を乗じたフィルタ後信号を減算して誤差信号を求め、適応アルゴリズム部は遅延パワースペクトルと上記誤差信号を入力として、当該誤差信号を最小化するようにフィルタ係数を更新し、周波数領域フィルタ部は遅延パワースペクトルに上記フィルタ係数を乗じてフィルタリングしたフィルタ後信号を出力し、残響抑圧ゲイン計算部はパワースペクトルと上記誤差信号を入力として、残響を抑圧するための残響抑圧ゲインを計算し、乗算部は上記周波数領域収音信号に上記残響抑圧ゲインを乗じて残響除去信号を出力する。
【選択図】図1

Description

本発明は、マイクロホンで収音した信号から部屋の残響による成分を抑圧する残響抑圧装置とその方法と、プログラムとその記録媒体に関する。
室内で音声を収音した場合、壁や床などで反射した残響音成分が直接音と同時に収音され音声が劣化する。例えば、広い会議室でのハンズフリーによる音声会議や、残響の多い場所での携帯端末による通話では、残響の影響により聞き取り難い音声となってしまう。
そこで、従来から、このような残響による音質劣化を軽減する目的の残響成分を抑圧する方法が提案されている。例えば、非特許文献1に開示されたマルチステップ線形予測を用いた残響抑圧装置900が知られている。
図17に、残響抑圧装置900の機能構成を示してその動作を簡単に説明する。残響抑圧装置900は、白色化部910、マルチステップ線形予測部920、残響計算部930、FFT940、FFT部950、スペクトルサブトラクション部960、逆FFT部970、を具備する。白色化部920は、時間領域の収音信号を、短いタップ長の線形予測を用いて音声の自己相関に起因する周波数特性を取り除き白色化する。マルチステップ線形予測部930は、白色化された時間領域の収音信号に対して、長いタップ長のマルチステップ線形予測を行い残響成分を予測するフィルタ係数を算出する。長いタップ長とは、サンプリング周波数を例えば8kHzと仮定すると、600〜700msの残響時間に相当する5〜6千点程度の長さである。残響計算部940は、算出されたフィルタ係数で時間領域の収音信号をフィルタリングすることで残響成分を予測する。
FFT部940は、予測された残響成分を短時間フーリエ変換によって周波数領域の信号である周波数領域残響成分に変換する。FFT950は、時間領域の収音信号を短時間フーリエ変換によって周波数領域の信号である周波数領域収音信号に変換する。
スペクトルサブトラクション部960は、周波数領域残響成分の周波数ごとのパワーと、周波数領域収音信号の周波数ごとのパワーから残響を抑圧するゲインを計算し、周波数領域収音信号に当該ゲインを乗算することで残響を抑圧した残響抑圧信号を出力する。残響抑圧信号は、逆フーリエ変換によって時間領域の残響抑圧信号に変換される。
Keisuke Kinoshita, Marc Delcroix, Tomohiro Nakaatani, and Masato Miyoshi, "Suppression of Late Reverberation Effect on Speech Signal Using Long-Term Multiple-step Linear Prediction," IEEE TRANSACTIONS ON AUDIO, SPEECH, AND LANGUAGE PROCESSING, VOL. 17, No. 4, MAY 2009.
しかし、従来の残響抑圧装置900では、長いタップ長の線形予測を用いることから、演算量が膨大になる課題があった。レビンソン・ダービンアルゴリズムによる線形予測であれば、演算量はタップ長の2乗のオーダーとなる。上記した例では6×106オーダーの計算量が必要となる。
本発明は、この課題に鑑みてなされたものであり、低演算量で残響を抑圧する残響抑圧装置とその方法と、プログラムとその記録媒体を提供することを目的とする。
本発明の残響抑圧装置は、FFT部と、パワー計算部と、遅延部と、減算部と、適応アルゴリズム部と、周波数領域フィルタ部と、残響抑圧ゲイン計算部と、乗算部と、逆FFT部と、を具備する。FFT部は、収音信号を周波数領域の周波数領域収音信号に変換する。パワー計算部は、FFT部が出力する周波数領域収音信号のパワーを周波数ごとに計算したパワースペクトルを出力する。遅延部は、パワー計算部が出力するパワースペクトルを所定の遅延量だけ遅延させた遅延パワースペクトルを出力する。減算部は、パワー計算部が出力するパワースペクトルから、遅延部が出力する遅延パワースペクトルにフィルタ係数を乗じたフィルタ後信号を減算して直接音の推定パワーを求める。適応アルゴリズム部は、遅延部が出力する遅延パワースペクトルと上記直接音の推定パワーを入力として、当該直接音の推定パワーを最小化するようにフィルタ係数を更新する。周波数領域フィルタ部は、遅延部が出力する遅延パワースペクトルに上記フィルタ係数を乗じてフィルタリングしたフィルタ後信号を出力する。残響抑圧ゲイン計算部は、パワー計算部が出力するパワースペクトルと減算部が出力する直接音の推定パワーを入力として、残響音を抑圧するための残響抑圧ゲインを計算する。乗算部は、周波数領域収音信号に残響抑圧ゲインを乗じて残響抑圧信号を出力する。逆FFT部は、乗算部が出力する残響抑圧信号を時間領域の残響抑圧信号に変換する。
本発明の残響抑圧装置によれば、減算部の出力信号である直接音の推定パワーを最小化するように適応アルゴリズムを用いてフィルタ係数をパワースペクトルの領域で更新するので、フィルタのタップ長の1乗のオーダーの演算量で残響抑圧を行うことができる。具体的な効果については後述するが、従来法と比較して演算量を大幅に削減することが可能である。
本発明の残響抑圧装置100の機能構成例を示す図。 残響抑圧装置100の動作フローを示す図。 周波数領域フィルタ部160の機能構成例を示す図。 適応アルゴリズム部150の機能構成例を示す図。 残響抑圧ゲイン計算部170の機能構成例を示す図。 本発明の残響抑圧装置200の適応アルゴリズム部250の機能構成例を示す図。 適応アルゴリズム部250の動作フローを示す図。 本発明の残響抑圧装置300の適応アルゴリズム部350の機能構成例を示す図。 適応アルゴリズム部350の動作フローを示す図。 本発明の残響抑圧装置400の残響抑圧ゲイン計算部470の機能構成例を示す図。 残響抑圧ゲイン計算部470の前半の動作フローを示す図。 残響抑圧ゲイン計算部470の後半の動作フローを示す図。 本発明の残響抑圧装置500の機能構成例を示す図。 本発明の残響抑圧装置600の機能構成例を示す図。 本発明の残響抑圧装置700の機能構成例を示す図。 評価実験の結果を示す図。 従来の残響抑圧装置900の機能構成を示す図。
以下、この発明の実施の形態を図面を参照して説明する。複数の図面中同一のものには同じ参照符号を付し、説明は繰り返さない。
図1に、この発明の残響抑圧装置100の機能構成例を示す。その動作フローを図2に示す。残響抑圧装置100は、FFT部110と、パワー計算部120と、遅延部130と、減算部140と、適応アルゴリズム部150と、周波数領域フィルタ部160と、残響抑圧ゲイン計算部170と、乗算部180と、逆FFT部190と、制御部195と、を具備する。残響抑圧装置100は、例えばROM、RAM、CPU等で構成されるコンピュータに所定のプログラムが読み込まれて、CPUがそのプログラムを実行することで実現されるものである。以下説明する各装置についても同じである。
FFT部110は、収音信号を周波数領域の周波数領域収音信号に変換する(ステップS110)。収音信号は、図示しないマイクロホンで収音した直接音と室内の壁や床などで反射した残響音とからなる信号である。収音信号は、例えばサンプリング周波数8kHzで離散値化されたディジタル信号である。図1において、収音信号をディジタル化するA/D変換器や、ディジタル信号を連続値化するD/A変換器の表記は省略している。FFT部110は、短時間フーリエ変換によって離散値化した収音信号を、例えば128個集めたフレーム単位(t=16ms)の間隔、ウィンドウサイズ32msで周波数領域収音信号に変換する。ウィンドウはハニングウィンドウの平方根を取ったものなどを用いる。
パワー計算部120は、FFT部110が出力する周波数領域収音信号を入力として、当該周波数領域収音信号のパワースペクトルを計算して出力する(ステップS120)。遅延部130は、パワー計算部120が出力するパワースペクトルを所定の遅延量だけ遅延させた遅延パワースペクトルを出力する(ステップS130)。所定の遅延量とは、例えば数10〜100ms程度の遅延時間である。
減算部140は、パワー計算部120が出力するパワースペクトルから、遅延パワースペクトルに適応アルゴリズム部150で求めたフィルタ係数を乗じたフィルタ後信号を減算して直接音の推定パワーを求める(ステップS140)。適応アルゴリズム部150は、遅延パワースペクトルと直接音の推定パワーを入力として、当該直接音の推定パワーを最小化するようにフィルタ係数を更新する(ステップS150)。
周波数領域フィルタ部160は、遅延パワースペクトルにフィルタ係数を乗じてフィルタリングしたフィルタ後信号を出力する(ステップS160)。残響抑圧ゲイン計算部170は、パワースペクトルと直接音の推定パワーを入力として、残響音を抑圧するための残響抑圧ゲインを計算する(ステップS170)。
乗算部180は、周波数領域収音信号に残響抑圧ゲインを乗じて残響抑圧信号を出力する(ステップS180)。逆FFT部190は、残響抑圧信号を、FFT部110と同じ間隔同じ点数で逆フーリエ変換し、その出力にウィンドウを乗算してオーバラップ加算して時間領域の残響抑圧信号に変換する(ステップS190)。以上説明したステップS110〜ステップS190の処理は、フレームを更新しながら(ステップS196)動作を停止するまで繰り返される(ステップS195のNo)。この繰り返し処理の制御は制御部195が行う。制御部195は、残響抑圧装置100の時系列動作を制御するものであり、特別なものではない。
残響抑圧装置100では、減算部140の出力する誤差信号(直接音の推定パワー)を最小化するように適応アルゴリズムを用いてフィルタ係数を更新することで、遅延部130で遅延させた遅延パワースペクトルから遅延前のパワースペクトルを予測している。すなわち、減算部140の出力する誤差信号は、予測できなかった信号成分ということになり、減算部140で減算された成分は予測できた信号成分ということになる。
一方、部屋の残響は、音源からマイクロホンまでに音が到達するときに、壁などで反射した音が、直接音から遅れてマイクロホンに到達する現象である。反射音は、必ず直接音よりも遅く到達するので、残響成分は、過去にマイクロホンに到達した音から予測可能である。これに対して、直接音は、最も早く到達するので過去の到達音からは完全には予測できない。よって、過去の信号から予測できない成分である減算部140の出力する誤差信号は、直接音の推定パワーとなる。
したがって、直接音の推定パワーを入力信号のパワーで除算した値をゲインとして周波数領域収音信号に乗じれば、入力信号(収音信号)のパワースペクトルが直接音の成分のパワースペクトルに変形されるので、残響音を抑圧することができる。このように残響抑圧装置100は、パワースペクトルの領域での適応アルゴリズムを用いて残響音を抑圧できる。適応アルゴリズムを用いることで周波数領域フィルタ部160のタップ長の1乗のオーダーの演算量で、残響抑圧を実現することができる。
以降では、各部のより具体的な機能構成例を示して、更に詳しく残響抑圧装置100の動作を説明する。
〔周波数領域フィルタ部〕
図3に、周波数領域フィルタ部160の機能構成例を示す。周波数領域フィルタ部160は、信号バッファ手段161と、畳み込み計算手段162と、を備える。
信号バッファ手段161は、遅延部130が出力する遅延パワースペクトル|X(ω,t−D)|の過去M個分を保存する。但し、tはフレーム番号、ωは周波数、Dは遅延部で与えられる遅延量、X(ω,t)はFFT部110が出力する周波数領域収音信号である。
畳み込み計算手段162は、適応アルゴリズム部150で保持されているMタップのフィルタ係数F(ω,m,t),m=0,…,M−1を、周波数ごとに遅延パワースペクトル|X(ω,t−D)|と畳み込み演算し、次式でフィルタ後信号|Y(ω,t−D)|を計算して減算部140に出力する。
Figure 2015037238
〔適応アルゴリズム部〕
図4に、適応アルゴリズム部150の機能構成例を示す。適応アルゴリズム部150は、更新ベクトル計算手段151と、ステップサイズ乗算手段152と、加算手段153と、フィルタ係数保持手段154と、を備える。
更新ベクトル計算手段151は、遅延パワースペクトル|X(ω,t−D)|と減算部140の出力信号E(ω,t)を入力として、適応アルゴリズムを用いて更新ベクトルU(ω,m,t)を計算する。減算部140の出力信号E(ω,t)は、次式に示すようにパワースペクトル|X(ω,t)|からフィルタ後信号|Y(ω,t−D)|を減算した誤差信号である。減算部140の出力信号E(ω,t)は、過去の信号から予測できなかった信号成分であり、直接音の推定パワーとなる。
Figure 2015037238
適応アルゴリズムは例えばNLMS法(参考文献1:Simon Haykin, Adaptive filter theory. Prentice-Hall, 1986.)を用いる。更新ベクトル計算手段151は、次式で更新ベクトルU(ω,m,t)を計算する。
Figure 2015037238
ここでnはフィルタ係数の番号である。
ステップサイズ乗算部152は、更新ベクトルU(ω,m,t)に、予め設定した0〜2の範囲のステップサイズαを乗じたフィルタ係数を出力する。加算手段153は、ステップサイズ乗算部152が出力するフィルタ係数に、フィルタ係数保持手段154に保持されている1フレーム前のフィルタ係数を加算して次のフレームのフィルタ係数F(ω,m,t+1)として出力する。
Figure 2015037238
NLMS法などの適応アルゴリズムは、減算部140が出力する誤差信号E(ω,t)の2乗平均を最小化するように動作する。よって、Dだけ過去の遅延パワースペクトル|X(ω,t−D)|から、現在の周波数領域収音信号X(ω,t)を出来る限り予測し、予測できた成分を取り除いた信号が誤差信号E(ω,t)となる。したがって、過去の信号から予測できない成分のみが残り、誤差信号E(ω,t)が直接音の推定パワーとなる。
〔残響抑圧ゲイン計算部〕
図5に、残響抑圧ゲイン計算部170の機能構成例を示す。残響抑圧ゲイン計算部170は、除算手段171と、最大値制限手段172と、時間平滑化手段173と、を備える。
除算手段171は、パワースペクトル|X(ω,t)|と直接音の推定パワーE(ω,t)を入力として、両者の比を計算し、その比をβ乗してゲインG′(ω,t)を計算する(式(5))。
Figure 2015037238
ここでβは、予め設定した定数であり、大きい値に設定するほど残響の抑圧量が強くなる。βは、おおよそ0.5〜1.0の間で設定される。
最大値制限手段172は、除算手段171が出力するゲインG′(ω,t)の値を1を上限として、式(6)と式(7)に示すように制限する。
Figure 2015037238
時間平滑化手段173は、最大値制限手段172の出力する制限されたゲインG″(ω,t)を時間平滑化して、残響抑圧ゲインG(ω,t)を出力する。時間平滑化は、例えば次式で実現される。
Figure 2015037238
ここでγは平滑化係数であり、予め設定される。γは0〜1の範囲の値を取り、1に近いほど長い時定数での平滑化となる。
残響抑圧ゲイン計算部170が出力する残響抑圧ゲインG(ω,t)は、推定した直接音の推定パワー(誤差信号)を、収音信号のパワーで除算した値を基に計算されるので、この残響抑圧ゲインG(ω,t)を周波数領域収音信号X(ω,t)に乗算することで、残響成分を抑圧した出力を得ることができる。
残響抑圧装置100は、FFTと逆FFTを用いて収音信号を周波数領域の信号に変換して、適応アルゴリズムによって直接音のパワー成分の推定を実現しているので、周波数領域フィルタ部160のタップ長の1乗のオーダーの低演算量で残響音を抑圧することができる。
図6に、この発明の残響抑圧装置200の適応アルゴリズム部250の機能構成例を示す。その動作フローを図7に示す。残響抑圧装置200は、残響抑圧装置100の適応アルゴリズム部150が、適応アルゴリズム部250に代わったのみの構成であるので、その全体の機能構成例は省略する。
適応アルゴリズム部250は、上記した適応アルゴリズム部150(図4)に対して、ステップサイズ設定手段255を備える点で異なる。ステップサイズ設定手段255は、更新ベクトル計算手段151の出力する更新ベクトルU(ω,m,t)の値に応じて、ステップサイズαを更新する。例えば、更新ベクトルU(ω,m,t)が正の値を取る場合(ステップS2551のYes)に予め設定した小さい値のステップサイズαを設定(式(9))(ステップS2552)し、更新ベクトルU(ω,m,t)が負の値を取る場合(ステップS2551のNo)に予め設定した大きい値のステップサイズαを設定(式(10))する(ステップS2553)。
Figure 2015037238
このようにステップサイズを設定することで、直接音の推定誤差を制御することができる。ステップサイズを制御しない場合は、推定誤差はプラスマイナスに均等に出るが、上記したように制御することで、直接音の推定誤差を正の方向に多く出るように制御することができる。すなわち、直接音のパワーを小さく推定してしまうことを防ぎ、音質の劣化を抑えることができる。
このように残響抑圧装置200によれば、残響抑圧装置100で得られる演算量を削減する効果に加えて、高品質な残響抑圧音を出力する効果も奏することができる。
図8に、この発明の残響抑圧装置300の適応アルゴリズム部350の機能構成例を示す。その動作フローを図9に示す。残響抑圧装置300は、残響抑圧装置100,200に対して、適応アルゴリズム部350が非負拘束手段356を具備する点で異なる。
非負拘束手段356は、加算手段153の出力する更新後のフィルタ係数F(ω,m,t+1)が負の値となった場合に、その値を0に置き換える(ステップS3562)ことで、フィルタ係数F(ω,m,t+1)が負の値にならないように制御する。
この発明では、正の値しか持たない信号のパワーに着目して残響成分の推定を行っているので、フィルタ係数は正の値を取るのが正しい解である。フィルタ係数F(ω,m,t+1)が負の値を取るということは、推定誤差であるので、その値を0に置き換えることで、より正確なフィルタ係数に修正することができる。このように、残響抑圧装置300によれば、残響抑圧装置100,200に対して正確にフィルタ係数を求めることができ、高品質な残響抑圧を行うことができる。
図10に、この発明の残響抑圧装置400の残響抑圧ゲイン計算部470の機能構成例を示す。その動作フローを図11と図12に示す。残響抑圧装置400は、残響抑圧装置100,200,300の残響抑圧ゲイン計算部170が、残響抑圧ゲイン計算部470に代わったのみの構成であるので、その全体の機能構成例は省略する。
残響抑圧ゲイン計算部470は、残響抑圧ゲイン計算部170(図5)に対して、更に、マスキングレベル計算手段474と最大値選択手段475と、を具備する点で異なる。マスキングレベル計算手段474は、減算部140が出力する直接音の推定パワーE(ω,t)から、聴覚マスキングレベルQ(ω,t)を求める。聴覚マスキングとは、周波数KのパワーがP(K)であった場合に、P(K)の関数として計算できる聴覚マスキングレベルを下回る音の成分は、人間の聴覚では聞き取れないという現象である。
聴覚マスキングレベルQ(ω,t)は、例えば次のようにして求めることができる。ある周波数ωの聴覚マスキングレベルQ(ω,t)を求める際に、その周波数の直接音の推定パワーE(ω,t)と、その1つ下の周波数の仮の聴覚マスキングレベルQ′(ω−1,t)にそれぞれ係数a,bを乗じた値を比較(ステップS4744)し、大きい値を仮の聴覚マスキングレベルQ′(ω,t)とする(ステップS4745,S4746)。これを周波数ωの最小値から順に、ω=最大値になるまで繰り返し実施する(ステップS4747のNoのループ)。係数a,bは聴覚マスキングの特性に基づいて予め設定される1未満、0以上の定数である。なお、係数a,bは周波数ωに応じて異なる値に設定しても良い。
Figure 2015037238
周波数ω=最大値になると(ステップS4747のYes、結合子A)、次に周波数ωの最大値から順に、その周波数ωの仮の聴覚マスキングレベルQ′(ω,t)と、1つ上の周波数の仮の聴覚マスキングレベルQ′(ω+1,t)に係数cを乗じた値を比較(ステップS4751)し、大きい値を聴覚マスキングレベルQ(ω,t)とする(ステップS4752,S4753)。係数cは、聴覚マスキングの特性に基づいて予め設定される1未満0以上の定数である。また、係数cは周波数ωに応じて異なる値に設定しても良い。
Figure 2015037238
以上の方法により聴覚マスキングレベルQ(ω,t)を求めることができる。
最大値選択手段475は、減算部140が出力する誤差信号E(ω,t)と、聴覚マスキングレベルQ(ω,t)を比較(ステップS4761)し、大きい方の値を、新たな直接音の推定パワー(誤差信号E(ω,t))として除算手段171に出力する。
以上の方法により、残響抑圧装置400は、聴覚マスキング特性を利用して、聴感上聞こえない残響成分を抑圧しないようにすることができる。したがって、残響抑圧装置400は、残響音の不要な抑圧をしないようにすることができ、直接音の劣化を少なくする効果を奏する。
図13に、この発明の残響抑圧装置500の機能構成例を示す。残響抑圧装置500は、残響抑圧装置100に、適応区間検出部511の構成を追加したものである。
適応区間検出部511は、遅延部130の出力する遅延パワースペクトル|X(ω,t−D)|の大きさと、予め設定した閾値を比較し、遅延パワースペクトルの大きさが閾値を超えた場合にのみ、適応アルゴリズム部150によるフィルタ係数の更新が行われるように制御する。
この制御を付加することで、収音信号の信号レベルが小さく、周囲雑音の影響を受け易い区間での、フィルタ係数の更新を停止させることができるので、より高精度に残響を抑圧するためのフィルタ係数を求めることができる。
なお、残響抑圧装置500を、残響抑圧装置100に適応区間検出部511を追加した構成で説明を行ったが、上記した残響抑圧装置200,300,400の何れにも適応区間検出部511の構成を追加することで、同様の効果を得ることができる。
図14に、この発明の残響抑圧装置600の機能構成例を示す。残響抑圧装置600は、残響抑圧装置100に、帯域集約部611と帯域展開部612の構成を追加したものである。
帯域集約部611は、パワー計算部120が出力するパワースペクトル|X(ω,t)|の周波数ωを集約し、より少ない周波数分割数になる周波数ω′に変換する。周波数ωを複数のグループに分け、そのグループ単位で、パワー計算部120の出力するパワースペクトル|X(ω,t)|の総和を取り、その値を新たな周波数ω′のパワースペクトル|X′(ω′,t)|として出力する(式(16))。
Figure 2015037238
ここでΩ(ω′)は、ω′のグループに属する周波数ωの集合である。
帯域集約部611の出力する周波数ωを集約したパワースペクトル|X′(ω′,t)|は、遅延部130、残響抑圧ゲイン計算部170、減算部140、にそれぞれ供給され、残響抑圧ゲインは周波数ω′の単位で処理される。
帯域展開部612は、残響抑圧ゲイン計算部170で求められた残響抑圧ゲインG′(ω′,t)の周波数ω′を、FFT部110の周波数分割数になる周波数ωに変換する。FFT部110の周波数ωが属する集約後の周波数ω′の残響抑圧ゲインを、周波数ωの残響抑圧ゲインにコピーすることで周波数ωに展開する(式(17))。
Figure 2015037238
このように周波数ωを集約して残響抑圧ゲインを演算することにより、演算量を減らすことができる。なお、聴覚特性は周波数に対して対数的な感度を有しているので、高い周波数ほど周波数の集約数を大きくしても聴感上の劣化は少ないので、周波数帯域によって集約する周波数ω′の大きさを変えるようにして良い。
なお、残響抑圧装置600を、残響抑圧装置100に帯域集約部611と帯域展開部612を追加した構成で説明を行ったが、上記した残響抑圧装置200,300,400,500の何れにも帯域集約部611と帯域展開部612の構成を追加することで、同様の効果を得ることができる。
図15に、この発明の残響抑圧装置700の機能構成例を示す。残響抑圧装置700は、残響抑圧装置100に、係数乗算部711と第2周波数領域フィルタ部712と減算部713の構成を追加したものである。
係数乗算部711は、適応アルゴリズム部150が出力するフィルタ係数F(ω,m,t)の各々に、予め設定した係数H(m)を乗算し、変換後のフィルタ係数F′(ω,m,t)を出力する(式(18))。
Figure 2015037238
係数H(m)の内、mが小さい部分の係数を1よりも小さく設定することで、人の口腔内の反響特性を残響成分として誤推定してしまうことを減らすことができる。人の口腔内の反響特性は、部屋の残響と比べ、短時間の応答であるため、mが小さい部分のフィルタ係数に大きく影響する。mが小さい部分のフィルタ係数に1よりも小さい係数H(m)を乗算することで、その影響を軽減することができる。
第2周波数領域フィルタ部712は、係数H(m)を乗算した後のフィルタ係数を遅延部130の出力する遅延パワースペクトル|X(ω,t−D)|に乗算する。減算部713は、パワー計算部120が出力するパワースペクトルから、第2周波数領域フィルタ部712の出力信号を減算する。減算部713の出力は、残響抑圧ゲイン計算部170に誤差信号の代わりに入力される。
残響抑圧装置700によれば、人の口腔内の反響特性を残響成分として誤推定してしまうことを減らすことができる。なお、残響抑圧装置700を、残響抑圧装置100に係数乗算部711と第2周波数領域フィルタ部712と減算部713を追加した構成で説明を行ったが、上記した残響抑圧装置200,300,400,500,600の何れにも同じ機能構成部を追加することで、同様の効果を得ることができる。
〔評価実験〕
本発明の効果を確認する目的で、残響抑圧性能を従来法と比較する評価実験を行った。評価実験は、鏡像法を用いた計算機シミュレーションにより疑似的に残響の付いた音声を生成し、その音声を残響抑圧処理した結果を、従来法とこの発明の方法を比較することで行った。評価はPESQ(Perceptual Speech Quality Measure)により実施した。
残響音声の生成の条件は次の通りである。6m×10m×3mの部屋で無指向性の音源と無指向性のマイクロホンが1mの距離で配置されているとし、壁面の反射係数を変化させてマイクロホン受音信号を生成した。音源信号には8kHzサンプリングの音声(女声10s,男声10s)を用いた。
図16に、原音と比べた時のPESQを示す。横軸は残響時間(ms)、縦軸はPESQ値である。残響時間が増えるに従い、処理前の信号はPESQ値が低下する。従来法、この発明の方法ともに、残響時間の長いデータにおいて、低下したPESQ値を0.1程度改善している。改善量は、従来法とこの発明の方法で同程度である。
一方、演算時間を比較すると、従来法では20sの音声を処理するのに約6sの時間を要した。演算時間は、Core−i7,3.4GHzの条件で処理した時間である。この発明の方法では、同じ20sの音声を処理するのに約100msの時間で演算を終了した。このように同程度のPESQを、大幅に短い演算時間である従来法の約1/60の演算量で得られることが確認できた。
このように、室内インパルス応答をパワースペクトルの領域で近似し、適応フィルタによる逐次学習を用いることで、少ない演算量で従来法と変わらない残響抑圧性能を実現することが可能となった。
上記装置における処理手段をコンピュータによって実現する場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、各装置における処理手段がコンピュータ上で実現される。
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。具体的には、例えば、磁気記録装置として、ハードディスク装置、フレキシブルディスク、磁気テープ等を、光ディスクとして、DVD(Digital Versatile Disc)、DVD-RAM(Random Access Memory)、CD-ROM(Compact Disc Read Only Memory)、CD-R(Recordable)/RW(ReWritable)等を、光磁気記録媒体として、MO(Magneto Optical disc)等を、半導体メモリとしてEEP-ROM(Electronically Erasable and Programmable-Read Only Memory)等を用いることができる。
また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD-ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記録装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。
また、各手段は、コンピュータ上で所定のプログラムを実行させることにより構成することにしてもよいし、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。

Claims (16)

  1. 収音信号を周波数領域の周波数領域収音信号に変換するFFT部と、
    上記周波数領域収音信号を入力として、当該周波数領域収音信号の周波数ごとのパワースペクトルを計算して出力するパワー計算部と、
    上記パワースペクトルを所定の遅延量だけ遅延させた遅延パワースペクトルを出力する遅延部と、
    上記パワースペクトルから、上記遅延パワースペクトルにフィルタ係数を乗じたフィルタ後信号を減算して直接音の推定パワーを求める減算部と、
    上記遅延パワースペクトルと上記直接音の推定パワーを入力として、当該直接音の推定パワーを最小化するようにフィルタ係数を更新する適応アルゴリズム部と、
    上記遅延パワースペクトルに上記フィルタ係数を乗じてフィルタリングしたフィルタ後信号を出力する周波数領域フィルタ部と、
    上記パワースペクトルと上記直接音の推定パワーを入力として、残響音を抑圧するための残響抑圧ゲインを計算する残響抑圧ゲイン計算部と、
    上記周波数領域収音信号に上記残響抑圧ゲインを乗じて残響抑圧信号を出力する乗算部と、
    上記残響抑圧信号を時間領域の残響抑圧信号に変換する逆FFT部と、
    を具備する残響抑圧装置。
  2. 請求項1に記載した残響抑圧装置において、
    上記適応アルゴリズム部は、
    遅延パワースペクトルと直接音の推定パワーを入力として、適応アルゴリズムを用いて更新ベクトルを計算する更新ベクトル計算手段と、
    上記更新ベクトルの値に応じてステップサイズを変更するステップサイズ設定手段と、
    上記更新ベクトルに、上記ステップサイズを乗算したフィルタ係数を出力する乗算手段と、
    上記乗算手段の出力するフィルタ係数に、1フレーム前のフィルタ係数を加算する加算
    手段と、
    上記加算手段の出力を、次のフレームのフィルタ係数として保持するフィルタ係数保持手段と、
    を備えることを特徴とする残響抑圧装置。
  3. 請求項1に記載した残響抑圧装置において、
    上記適応アルゴリズム部は、
    遅延パワースペクトルと直接音の推定パワーを入力として、適応アルゴリズムを用いて更新ベクトルを計算する更新ベクトル計算手段と、
    上記更新ベクトルに、上記ステップサイズを乗算したフィルタ係数を出力する乗算手段と、
    上記乗算手段の出力するフィルタ係数に、1フレーム前のフィルタ係数を加算する加算
    手段と、
    上記加算手段の出力を、次のフレームのフィルタ係数として保持するフィルタ係数保持手段と、
    を備えることを特徴とする残響抑圧装置。
  4. 請求項1乃至3の何れかに記載した残響抑圧装置において、
    上記残響抑圧ゲイン計算部は、
    上記直接音の推定パワーから聴覚マスキングレベルQ(ω,t)を計算するマスキングレベル計算手段と、
    上記直接音の推定パワーと上記聴覚マスキングレベルQ(ω,t)を比較し、大きい方の値を、新たな直接音のパワースペクトルとして上記残響抑圧ゲインの計算に選択する最大値選択手段と、
    を含むことを特徴とする残響抑圧装置。
  5. 請求項1乃至4の何れかに記載した残響抑圧装置において、
    更に、
    上記遅延パワースペクトルの大きさと、予め設定した閾値を比較し、当該遅延パワースペクトルの大きさが上記閾値を超えた場合のみ、上記適応アリゴリズム部によるフィルタ係数の更新が行われるように制御する適応区間検出部を、備えることを特徴とする残響抑圧装置。
  6. 請求項1乃至5の何れかに記載した残響抑圧装置において、
    更に、
    上記パワースペクトルの周波数分割ωを集約し、次式に示すようにより少ない周波数分割ω′に変換する帯域集約部と、
    Figure 2015037238

    ここでΩ(ω′)はω′のグループに属する周波数ωの集合、
    上記残響抑圧ゲインの周波数分割ω′を、次式に示すように上記FFT部の周波数分割ωに変換する帯域展開部と、
    Figure 2015037238

    を具備することを特徴とする残響抑圧装置。
  7. 請求項1乃至6の何れかに記載した残響抑圧装置において、
    更に、
    上記フィルタ係数F(ω,m,t)の各々に、予め設定した係数H(m)を乗算し、変換後のフィルタ係数F′(ω,m,t)を出力する係数乗算部と、
    上記変換後のフィルタ係数F′(ω,m,t)を、上記遅延パワースペクトルに乗算する第2周波数領域フィルタ部と、
    上記パワースペクトルから上記第2周波数領域フィルタ部の出力信号を減算した信号を上記直接音の推定パワーの代わりに上記残響抑圧ゲイン計算部に出力する第2減算部と、
    を具備することを特徴とする残響抑圧装置。
  8. 収音信号を周波数領域の周波数領域収音信号に変換するFFT過程と、
    上記周波数領域収音信号を入力として、当該周波数領域収音信号の周波数ごとのパワースペクトルを計算して出力するパワー計算過程と、
    上記パワースペクトルを所定の遅延量だけ遅延させた遅延パワースペクトルを出力する遅延過程と、
    上記パワースペクトルから、上記遅延パワースペクトルにフィルタ係数を乗じたフィルタ後信号を減算して直接音の推定パワーを求める減算過程と、
    上記遅延パワースペクトルと上記直接音の推定パワーを入力として、当該直接音の推定パワーを最小化するようにフィルタ係数を更新する適応アルゴリズム過程と、
    上記遅延パワースペクトルに上記フィルタ係数を乗じてフィルタリングしたフィルタ後信号を出力する周波数領域フィルタ過程と、
    上記パワースペクトルと上記直接音の推定パワーを入力として、残響音を抑圧するための残響抑圧ゲインを計算する残響抑圧ゲイン計算過程と、
    上記周波数領域収音信号に上記残響抑圧ゲインを乗じて残響抑圧信号を出力する乗算過程と、
    上記残響抑圧信号を時間領域の残響抑圧信号に変換する逆FFT過程と、
    を備える残響抑圧方法。
  9. 請求項8に記載した残響抑圧方法において、
    上記適応アルゴリズム過程は、
    遅延パワースペクトルと直接音の推定パワーを入力として、適応アルゴリズムを用いて更新ベクトルを計算する更新ベクトル計算ステップと、
    上記更新ベクトルの値に応じてステップサイズを変更するステップサイズ設定ステップ
    と、
    上記更新ベクトルに、上記ステップサイズを乗算したフィルタ係数を出力する乗算ステップと、
    上記乗算ステップで出力するフィルタ係数に、1フレーム前のフィルタ係数を加算する
    加算ステップと、
    上記加算ステップの出力を、次のフレームのフィルタ係数として保持するフィルタ係数保持ステップと、
    を含むことを特徴とする残響抑圧方法。
  10. 請求項8に記載した残響抑圧方法において、
    上記適応アルゴリズム過程は、
    遅延パワースペクトルと直接音の推定パワーを入力として、適応アルゴリズムを用いて更新ベクトルを計算する更新ベクトル計算ステップと、
    上記更新ベクトルの値に応じてステップサイズを変更するステップサイズ設定ステップと、
    上記更新ベクトルに、上記ステップサイズを乗算したフィルタ係数を出力する乗算ステップと、
    上記乗算手段の出力するフィルタ係数に、1フレーム前のフィルタ係数を加算する加算
    ステップと、
    上記加算ステップの出力を、次のフレームのフィルタ係数として保持するフィルタ係数保持ステップと、
    を含むことを特徴とする残響抑圧方法。
  11. 請求項8乃至10の何れかに記載した残響抑圧方法において、
    上記残響抑圧ゲイン計算過程は、
    上記直接音の推定パワーから聴覚マスキングレベルQ(ω,t)を計算するマスキングレベル計算ステップと、
    上記直接音の推定パワーと上記聴覚マスキングレベルQ(ω,t)を比較し、大きい方の値を、新たな直接音のパワースペクトルとして上記残響抑圧ゲインの計算に選択する最大値選択ステップと、
    を含むことを特徴とする残響抑圧方法。
  12. 請求項8乃至11の何れかに記載した残響抑圧方法において、
    更に、
    上記遅延パワースペクトルの大きさと、予め設定した閾値を比較し、当該遅延パワースペクトルの大きさが上記閾値を超えた場合のみ、上記適応アリゴリズム部によるフィルタ係数の更新が行われるように制御する適応区間検出過程を、備えることを特徴とする残響抑圧方法。
  13. 請求項8乃至12の何れかに記載した残響抑圧方法において、
    更に、
    上記パワースペクトルの周波数分割ωを集約し、次式に示すようにより少ない周波数分割ω′に変換する帯域集約過程と、
    Figure 2015037238

    ここでΩ(ω′)はω′のグループに属する周波数ωの集合、
    上記残響抑圧ゲインの周波数分割ω′を、次式に示すように上記FFT部の周波数分割ωに変換する帯域展開過程と、
    Figure 2015037238

    を備えることを特徴とする残響抑圧方法。
  14. 請求項8乃至13の何れかに記載した残響抑圧方法において、
    更に、
    上記フィルタ係数F(ω,m,t)の各々に、予め設定した係数H(m)を乗算し、変換後のフィルタ係数F′(ω,m,t)を出力する係数乗算過程と、
    上記変換後のフィルタ係数F′(ω,m,t)を、上記遅延パワースペクトルに乗算する第2周波数領域フィルタ過程と、
    上記パワースペクトルから上記第2周波数領域フィルタ部の出力信号を減算した信号を上記直接音の推定パワーの代わりに上記残響抑圧ゲイン計算部に出力する第2減算過程と、
    を備えることを特徴とする残響抑圧方法。
  15. 請求項1乃至7の何れかに記載した残響抑圧装置としてコンピュータを機能させるためのプログラム。
  16. 請求項15に記載した何れかのプログラムを記録したコンピュータで読み取り可能な記録媒体。
JP2013168219A 2013-08-13 2013-08-13 残響抑圧装置とその方法と、プログラムとその記録媒体 Active JP5815614B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013168219A JP5815614B2 (ja) 2013-08-13 2013-08-13 残響抑圧装置とその方法と、プログラムとその記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013168219A JP5815614B2 (ja) 2013-08-13 2013-08-13 残響抑圧装置とその方法と、プログラムとその記録媒体

Publications (2)

Publication Number Publication Date
JP2015037238A true JP2015037238A (ja) 2015-02-23
JP5815614B2 JP5815614B2 (ja) 2015-11-17

Family

ID=52687550

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013168219A Active JP5815614B2 (ja) 2013-08-13 2013-08-13 残響抑圧装置とその方法と、プログラムとその記録媒体

Country Status (1)

Country Link
JP (1) JP5815614B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112997249A (zh) * 2018-11-30 2021-06-18 深圳市欢太科技有限公司 语音处理方法、装置、存储介质及电子设备

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05137191A (ja) * 1991-11-11 1993-06-01 Matsushita Electric Ind Co Ltd ハウリング抑制装置
JPH06310962A (ja) * 1992-08-05 1994-11-04 Mitsubishi Electric Corp 自動音量調整装置
JP2001195085A (ja) * 1999-11-05 2001-07-19 Alpine Electronics Inc 音声認識用オーディオキャンセル装置
JP2003032780A (ja) * 2001-07-16 2003-01-31 Matsushita Electric Ind Co Ltd ハウリング検出抑圧装置、これを備えた音響装置、及び、ハウリング検出抑圧方法
WO2006123495A1 (ja) * 2005-05-18 2006-11-23 Matsushita Electric Industrial Co., Ltd. ハウリング制御装置および音響装置
JP2008219164A (ja) * 2007-02-28 2008-09-18 Sanyo Electric Co Ltd エコー防止装置及びプログラム
JP2009284465A (ja) * 2008-04-24 2009-12-03 Nec Engineering Ltd エコーキャンセラ装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05137191A (ja) * 1991-11-11 1993-06-01 Matsushita Electric Ind Co Ltd ハウリング抑制装置
JPH06310962A (ja) * 1992-08-05 1994-11-04 Mitsubishi Electric Corp 自動音量調整装置
JP2001195085A (ja) * 1999-11-05 2001-07-19 Alpine Electronics Inc 音声認識用オーディオキャンセル装置
JP2003032780A (ja) * 2001-07-16 2003-01-31 Matsushita Electric Ind Co Ltd ハウリング検出抑圧装置、これを備えた音響装置、及び、ハウリング検出抑圧方法
WO2006123495A1 (ja) * 2005-05-18 2006-11-23 Matsushita Electric Industrial Co., Ltd. ハウリング制御装置および音響装置
JP2008219164A (ja) * 2007-02-28 2008-09-18 Sanyo Electric Co Ltd エコー防止装置及びプログラム
JP2009284465A (ja) * 2008-04-24 2009-12-03 Nec Engineering Ltd エコーキャンセラ装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112997249A (zh) * 2018-11-30 2021-06-18 深圳市欢太科技有限公司 语音处理方法、装置、存储介质及电子设备

Also Published As

Publication number Publication date
JP5815614B2 (ja) 2015-11-17

Similar Documents

Publication Publication Date Title
US10403300B2 (en) Spectral estimation of room acoustic parameters
CA2732723C (en) Apparatus and method for processing an audio signal for speech enhancement using a feature extraction
JP6087762B2 (ja) 残響抑圧装置とその方法と、プログラムとその記録媒体
JP5751110B2 (ja) 残響抑制装置および残響抑制方法並びに残響抑制プログラム
JP6169849B2 (ja) 音響処理装置
US10726857B2 (en) Signal processing for speech dereverberation
JP2003534570A (ja) 適応ビームフォーマーにおいてノイズを抑制する方法
JP5645419B2 (ja) 残響除去装置
JP2011244232A (ja) マイクロホンアレイ装置及び前記マイクロホンアレイ装置が実行するプログラム
WO2019057847A1 (en) SIGNAL PROCESSOR AND METHOD FOR PROVIDING A TREATED AUDIO SIGNAL REDUCING NOISE AND REVERB
KR102076760B1 (ko) 다채널 마이크를 이용한 칼만필터 기반의 다채널 입출력 비선형 음향학적 반향 제거 방법
JP2009188724A (ja) エコー抑圧ゲイン推定方法とそれを用いたエコー消去装置と、装置プログラムと記録媒体
JP2014513320A (ja) オーディオ信号におけるドミナント周波数を減衰する方法及び装置
JP2013012841A (ja) エコー消去装置、その方法及びプログラム
JP2020028016A (ja) 残響抑制装置及び補聴器
CN111445916B (zh) 一种会议系统中音频去混响方法、装置及存储介质
JP5815614B2 (ja) 残響抑圧装置とその方法と、プログラムとその記録媒体
JP6325138B2 (ja) 音声処理システムおよび音声処理方法
JP2002223182A (ja) 反響消去方法、その装置、そのプログラム及びその記録媒体
JP2014017696A (ja) エコー抑圧ゲイン推定方法とそれを用いたエコー消去装置とプログラム
CN109493878B (zh) 一种用于回声消除的滤波方法及装置、设备、介质
JP2002062895A (ja) 収音方法およびその装置
JP6059130B2 (ja) 雑音抑圧方法とその装置とプログラム
JP2012048134A (ja) 残響除去方法とその装置とプログラム
EP3531719B1 (en) Dereverberation device and hearing aid

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20141203

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150203

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150323

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150915

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150924

R150 Certificate of patent or registration of utility model

Ref document number: 5815614

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150