JP2015037239A - 残響抑圧装置とその方法と、プログラムとその記録媒体 - Google Patents

残響抑圧装置とその方法と、プログラムとその記録媒体 Download PDF

Info

Publication number
JP2015037239A
JP2015037239A JP2013168220A JP2013168220A JP2015037239A JP 2015037239 A JP2015037239 A JP 2015037239A JP 2013168220 A JP2013168220 A JP 2013168220A JP 2013168220 A JP2013168220 A JP 2013168220A JP 2015037239 A JP2015037239 A JP 2015037239A
Authority
JP
Japan
Prior art keywords
filter coefficient
unit
signal
power spectrum
sub
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2013168220A
Other languages
English (en)
Other versions
JP6087762B2 (ja
Inventor
小林 和則
Kazunori Kobayashi
和則 小林
仲 大室
Naka Omuro
仲 大室
慶介 木下
Keisuke Kinoshita
慶介 木下
中谷 智広
Tomohiro Nakatani
智広 中谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2013168220A priority Critical patent/JP6087762B2/ja
Publication of JP2015037239A publication Critical patent/JP2015037239A/ja
Application granted granted Critical
Publication of JP6087762B2 publication Critical patent/JP6087762B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

【課題】部屋の残響の初期部分も抑圧することができる残響抑圧装置を提供する。
【解決手段】話者方向に感度が高くなるように設置した主マイクロホンで収音した信号から求めた主パワースペクトルと、話者方向の感度が低くなるように設置した副マイクロホンで収音した信号から求めた遅延副パワースペクトルの2つを用い、減算部は主パワースペクトルから、遅延副パワースペクトルにフィルタ係数を乗じたフィルタ後信号を減算して直接音の推定パワーを求め、適応アルゴリズム部は遅延副パワースペクトルと直接音の推定パワーを入力として、当該直接音の推定パワーを最小化するようにフィルタ係数を更新し、周波数領域フィルタ部は遅延副パワースペクトルにフィルタ係数を乗じてフィルタリングしたフィルタ後信号を出力し、残響抑圧ゲイン計算部は主パワースペクトルと誤差信号を入力として、残響音を抑圧するための残響抑圧ゲインを計算する。
【選択図】図2

Description

本発明は、マイクロホンで収音した信号から部屋の残響による成分を抑圧する残響抑圧装置とその方法と、プログラムとその記録媒体に関する。
室内で音声を収音した場合、壁や床などで反射した残響音成分が直接音と同時に収音され音声が劣化する。例えば、広い会議室でのハンズフリーによる音声会議や、残響の多い場所での携帯端末による通話では、残響の影響により聞き取り難い音声となってしまう。
そこで、従来から、このような残響による音質劣化を軽減する目的で、残響成分を抑圧する方法が提案されている。例えば、非特許文献1に開示されたマルチステップ線形予測を用いた残響抑圧装置900が知られている。
図21に、残響抑圧装置1000の機能構成を示してその動作を簡単に説明する。残響抑圧装置900は、白色化部910、マルチステップ線形予測部920、残響計算部930、FFT部940、FFT部950、スペクトルサブトラクション部960、逆FFT部970、を具備する。白色化部920は、短いタップ長の線形予測を用いて音声の自己相関(人の口腔内の反射特性)に起因する周波数特性を取り除き白色化する。マルチステップ線形予測部930は、白色化された時間領域の収音信号に対して、長いタップ長のマルチステップ線形予測を行い残響成分を予測するフィルタ係数を算出する。長いタップ長とは、サンプリング周波数を例えば8kHzと仮定すると、600〜700msの残響時間に相当する5〜6千点程度の長さである。残響計算部940は、算出されたフィルタ係数で時間領域の収音信号をフィルタリングすることで残響成分を予測する。
FFT部940は、予測された残響成分を短時間フーリエ変換によって周波数領域の信号である周波数領域残響成分に変換する。FFT950は、時間領域の収音信号を短時間フーリエ変換によって周波数領域の信号である周波数領域収音信号に変換する。
スペクトルサブトラクション部960は、周波数領域残響成分の周波数ごとのパワーと、周波数領域収音信号の周波数ごとのパワーから残響を抑圧するゲインを計算し、周波数領域収音信号に当該ゲインを乗算することで残響を抑圧した残響抑圧信号を出力する。残響抑圧信号は、逆フーリエ変換によって時間領域の残響抑圧信号に変換される。
Keisuke Kinoshita, Marc Delcroix, Tomohiro Nakaatani, and Masato Miyoshi, "Suppression of Late Reverberation Effect on Speech Signal Using Long-Term Multiple-step Linear Prediction," IEEE TRANSACTIONS ON AUDIO, SPEECH, AND LANGUAGE PROCESSING, VOL. 17, No. 4, MAY 2009.
しかし、従来の残響抑圧装置900では、音声自体が持っている自己相関(人の口腔内の反射特性)を取り除くための白色化処理において、部屋の音響特性に基づく初期反射成分も同時に取り除いている。また、マルチステップ線形予測部で音声の自己相関を予測してしまわないように与える数十〜数百msの遅延のために、部屋の残響の初期部分の抑圧ができない課題がある。
図1に、人の発声音がマイクロホンに到達するまでのモデルを示す。その図を参照して従来の課題を説明する。声帯で生成された振動が声道特性を通過して、音声として口から発話される。この発話された瞬間の音声が理想的な音声信号である。マイクロホンで収音される音声は、口から直接マイクロホンに到達する直接音成分と、壁や床、天井などで反射した残響音成分の2つが混ざったものである。
声道特性と残響特性の区別がつかないため、声道特性の応答長よりも遅延の大きな残響成分のみを推測し、声道特性を含まない特性のみを推定している。したがって、従来の残響抑圧装置900では、声道特性の応答長よりも遅延の少ない初期反射成分を推定することができないため、初期反射成分を抑圧することができない課題がある。また、長いタップ長の線形予測を用いることから、演算量が膨大になる課題もあった。レビンソン・ダービンアルゴリズムによる線形予測であれば、演算量はタップ長の2乗のオーダーとなる。
上記した例では6×106オーダーの計算量が必要となる。
本発明は、この課題に鑑みてなされたものであり、部屋の残響の初期部分も抑圧すると共に演算量を削減した残響除去装置とその方法と、プログラムとその記録媒体を提供することを目的とする。
本発明の残響抑圧装置は、主FFT部と、副FFT部と、主パワー計算部と、副パワー計算部と、遅延部と、減算部と、適応アルゴリズム部と、周波数領域フィルタ部118と、残響抑圧ゲイン計算部と、乗算部と、逆FFT部と、を具備する。主FFT部は、音源方向に対して最大感度を持つ主マイクロホンで収音した主収音信号を周波数領域の周波数領域主収音信号に変換する。副FFT部は、上記音源方向に最大感度を持たない副マイクロホンで収音した副収音信号を、周波数領域の周波数領域副収音信号に変換する。主パワー計算部は、主FFT部が出力する周波数領域主収音信号のパワーを、周波数ごとに計算した主パワースペクトルを出力する。副パワー計算部は、副FFT部が出力する周波数領域副収音信号のパワーを、周波数ごとに計算した副パワースペクトルを出力する。遅延部は、その副パワースペクトルを所定の遅延量だけ遅延させた遅延副パワースペクトルを出力する。主FFT部は、上記音源に対して最大感度を持つ主マイクロホンで収音した主収音信号を周波数領域の周波数領域主収音信号に変換する。減算部は、主パワースペクトルから、上記遅延副パワースペクトルにフィルタ係数を乗じたフィルタ後信号を減算して直接音の推定パワーを求める。適応アルゴリズム部は、上記遅延副パワースペクトルと上記直接音の推定パワーを入力として、当該直接音の推定パワーを最小化するように上記フィルタ係数を更新する。周波数領域フィルタ部は、上記遅延副パワースペクトルに上記フィルタ係数を乗じてフィルタリングしたフィルタ後信号を出力する。残響抑圧ゲイン計算部は、上記主パワースペクトルと上記直接音の推定パワーを入力として、残響音を抑圧するための残響抑圧ゲインを計算する。乗算部は、主FFT部が出力する周波数領域主収音信号に上記残響抑圧ゲインを乗じて残響抑圧信号を出力する。逆FFT部は、その残響抑圧信号を時間領域の残響抑圧信号に変換する。
本発明の残響抑圧装置によれば、音源に対して最大感度を持つ主マイクロホンで収音された主収音信号と、音源に対して最大感度を持たない副マイクロホンで収音された副収音信号を用いて、主収音信号に含まれる残響成分を予測することで、主収音信号に含まれる直接音成分を残響と誤推定してしまうことを防止することができ、部屋の残響音の初期部分も含めて抑圧することができる。また、フィルタ係数を、パワースペクトルの領域で更新するので、フィルタのタップ長の1乗のオーダーの演算量で残響抑圧を行うことができ、従来法と比較して演算量も大幅に削減することが可能である。
人の発声音がマイクロホンに到達するまでのモデルを示す図。 本発明の残響抑圧装置100の機能構成例を示す図。 残響抑圧装置100の動作フローを示す図。 主マイクロホンと副マイクロホンの配置例を示す図。 周波数領域フィルタ部108の機能構成例を示す図。 適応アルゴリズム部107の機能構成例を示す図。 残響抑圧ゲイン計算部109の機能構成例を示す図。 本発明の残響抑圧装置200の機能構成例を示す図。 ビームフォーマ部210の機能構成例を示す図。 本発明の残響抑圧装置300の機能構成例を示す図。 本発明の残響抑圧装置400の適応アルゴリズム部407の機能構成例を示す図。 適応アルゴリズム部407の動作フローを示す図。 本発明の残響抑圧装置500の適応アルゴリズム部507の機能構成例を示す図。 適応アルゴリズム部507の動作フローを示す図。 本発明の残響抑圧装置600の残響抑圧ゲイン計算部607の機能構成例を示す図。 残響抑圧ゲイン計算部607の前半の動作フローを示す図。 残響抑圧ゲイン計算部607の後半の動作フローを示す図。 本発明の残響抑圧装置700の機能構成例を示す図。 本発明の残響抑圧装置800の機能構成例を示す図。 本発明の残響抑圧装置900の機能構成例を示す図。 従来の残響抑圧装置1000の機能構成を示す図。
以下、この発明の実施の形態を図面を参照して説明する。複数の図面中同一のものには同じ参照符号を付し、説明は繰り返さない。
〔この発明の考え〕
この発明では、声道特性を残響として推定してしまうことを防止する目的で、マイクロホンの指向特性を利用する。話者方向に感度が高くなるように設置した主マイクロホンと、話者方向の感度が低くなるように設置した副マイクロホンの2つを用いる。
主マイクロホンで収音した主収音信号に含まれる残響成分を、副マイクロホンで収音した副収音信号から推測する。話者方向に感度が低い副マイクロホンでは、話者音声の直接音成分のレベルが主マイクロホンに比べて低くなっているので、主収音信号に含まれる直接音成分(声道特性のみの経路)の推定が難しくなる。つまり、声道特性を残響特性として推定してしまうことを防ぐことができる。よって、初期反射成分も含めて残響成分を推測することができるので、初期反射も含めて残響成分を抑圧することが可能になる。また、減算部の出力信号である誤差信号を最小化するように適応アルゴリズムを用いてフィルタ係数を、パワースペクトルの領域で更新するので、フィルタのタップ長の1乗のオーダーの演算量で残響抑圧を行うことができる。
図2に、この発明の残響抑圧装置100の機能構成例を示す。その動作フローを図3に示す。残響抑圧装置100は、主FFT部101と、副FFT部102と、主パワー計算部103と、副パワー計算部104と、遅延部105と、減算部106と、適応アルゴリズム部107と、周波数領域フィルタ部108と、残響抑圧ゲイン計算部109と、乗算部110と、逆FFT部111と、制御部112と、を具備する。残響抑圧装置100は、例えばROM、RAM、CPU等で構成されるコンピュータに所定のプログラムが読み込まれて、CPUがそのプログラムを実行することで実現されるものである。以下説明する各装置についても同じである。
主FFT部101は、音源方向に最大感度を持つ主マイクロホンで収音した主収音信号を周波数領域の周波数領域主収音信号に変換する(ステップS101)。副FFT部102は、上記音源方向に最大感度を持たない副マイクロホンで収音した副収音信号を、周波数領域の周波数副収音信号に変換する(ステップS102)。
図4に、主マイクロホンと副マイクロホンの配置例を示す。部屋40の屋内に、音源、この例では一人の話者10と、主マイクロホン20と、副マイクロホン30と、が配置されている。主マイクロホン10は指向性マイクロホンであり、話者10の方向に最大感度の指向方向を向けて配置されている。副マイクロホン30も指向性マイクロホンであり、その最大感度の指向方向を、主マイクロホン10と180°異なる方向に向けて配置されている。このように、副マイクロホン30は、音源方向に最大感度を持たないように配置される。
主収音信号は話者10の発声した音声が支配的な信号であり、副収音信号は残響音が支配的な信号である。主収音信号と副収音信号は、例えばサンプリング周波数8kHzで離散値化されたディジタル信号である。図2において、収音信号をディジタル化するA/D変換器や、ディジタル信号を連続値化するD/A変換器の表記は省略している。主FFT部101と副FFT部102は、短時間フーリエ変換によって、離散値化した主収音信号と副収音信号を、例えば128個集めたフレーム単位(t=16ms)の間隔、ウィンドウサイズ32msで周波数領域収音信号に変換する。ウィンドウはハニングウィンドウの平方根を取ったものなどを用いる。
主パワー計算部103は、主FFT部101が出力する周波数領域主収音信号のパワーを、周波数ごとに計算した主パワースペクトルを出力する(ステップS103)。副パワー計算部104は、副FFT部102が出力する周波数領域副収音信号のパワーを、周波数ごとに計算した副パワースペクトルを出力する(ステップS104)。
遅延部105は、副パワー計算部104が出力する副パワースペクトルを所定の遅延量だけ遅延させた遅延副パワースペクトルを出力する(ステップS105)。所定の遅延量とは、数10ms〜100ms程度の遅延時間である。
減算部106は、主パワー計算部103が出力する主パワースペクトルから、周波数領域フィルタ部108が出力するフィルタ後信号を減算して直接音の推定パワーを求める(ステップS106)。適応アルゴリズム部107は、遅延部105が出力する遅延副パワースペクトルと減算部106が出力する直接音の推定パワーを入力として、当該誤差信号を最小化するように上記フィルタ係数を更新する(ステップS107)。
周波数領域フィルタ部108は、遅延部105が出力する遅延副パワースペクトルに上記適応アルゴリズム部107で更新したフィルタ係数を乗じてフィルタリングしたフィルタ後信号を出力する(ステップS108)。残響抑圧ゲイン計算部109は、主パワー計算部103が出力する主パワースペクトルと減算部106が出力する直接音の推定パワーを入力として、残響音を抑圧するための残響抑圧ゲインを計算する(ステップS109)。
乗算部110は、主FFT部101が出力する周波数領域主収音信号に残響抑圧ゲインを乗じて残響抑圧信号を出力する(ステップS110)。逆FFT部111は、残響抑圧信号を、主FFT部101と同じ間隔同じ点数で逆フーリエ変換し、その出力にウィンドウを乗算してオーバラップ加算して時間領域の残響抑圧信号に変換する(ステップS111)。以上説明したステップS101〜ステップS111の処理は、フレームを更新しながら(ステップS112b)動作を停止するまで繰り返される(ステップS112aのNo)。この繰り返し処理の制御は制御部112が行う。制御部112は、残響抑圧装置100の時系列動作を制御するものであり、特別なものではない。
残響抑圧装置100では、減算部106の出力する誤差信号を最小化するように適応アルゴリズムを用いてフィルタ係数を更新することで、遅延部105で遅延させた遅延副パワースペクトルから遅延前の副パワースペクトルを予測している。すなわち、減算部106の出力する誤差信号は、予測できなかった信号成分ということになり、減算部106で減算された成分は予測できた信号成分ということになる。
一方、部屋の残響は、音源からマイクロホンまでに音が到達するときに、壁などで反射した音が、直接音から遅れてマイクロホンに到達する現象である。反射音は、必ず直接音よりも遅く到達するので、残響成分は、過去にマイクロホンに到達した音から予測可能である。これに対して、直接音は、最も早く到達するので過去の到達音からは完全には予測できない。よって、過去の信号から予測できない成分である減算部106の出力する誤差信号は、直接音の推定パワーとなる。
したがって、直接音の推定パワー(誤差信号)を、主パワースペクトルのパワーで除算した値をゲインとして周波数領域主収音信号に乗じれば、主マイクロホンで収音した主収音信号のスペクトルが、直接音の推定パワーのスペクトルに変形されるので、残響音を抑圧することができる。このように残響抑圧装置100は、パワースペクトルの領域での適応アルゴリズムを用いて残響音を抑圧できる。適応アルゴリズムを用いることで周波数領域フィルタ部108のタップ長の1乗のオーダーの演算量で、残響抑圧を実現することができる。
以降では、各部のより具体的な機能構成例を示して、更に詳しく残響抑圧装置100の動作を説明する。
〔周波数領域フィルタ部〕
図5に、周波数領域フィルタ部108の機能構成例を示す。周波数領域フィルタ部108は、信号バッファ手段1081と、畳み込み計算手段1082と、を備える。
信号バッファ手段1081は、遅延部105が出力する遅延副パワースペクトル|Z(ω,t−D)|の過去M個分を保存する。但し、tはフレーム番号、ωは周波数、Dは遅延部で与えられる遅延量、Z(ω,t)は副FFT部102が出力する周波数領域副収音信号である。
畳み込み計算手段1082は、適応アルゴリズム部107で保持されているMタップのフィルタ係数F(ω,m,t),m=0,…,M−1を、周波数ごとに遅延副パワースペクトル|Z(ω,t−D)|と畳み込み演算し、次式でフィルタ後信号|Y(ω,t−D)|を計算して減算部106に出力する。
Figure 2015037239
〔適応アルゴリズム部〕
図6に、適応アルゴリズム部107の機能構成例を示す。適応アルゴリズム部107は、更新ベクトル計算手段1071と、ステップサイズ乗算手段1072と、加算手段1073と、フィルタ係数保持手段1074と、を備える。
更新ベクトル計算手段1071は、遅延副パワースペクトル|Z(ω,t−D)|と減算部106の出力信号E(ω,t)を入力として、適応アルゴリズムを用いて更新ベクトルU(ω,m,t)を計算する。減算部106の出力信号E(ω,t)は、次式に示すように主パワースペクトル|X(ω,t)|からフィルタ後信号|Y(ω,t−D)|を減算した誤差信号である。減算部106の出力信号E(ω,t)は、過去の信号から予測できなかった信号成分であり、直接音の推定パワーとなる。
Figure 2015037239
適応アルゴリズムは例えばNLMS法(参考文献1:Simon Haykin, Adaptive filter theory. Prentice-Hall, 1986.)を用いる。更新ベクトル計算手段1071は、次式で更新ベクトルU(ω,m,t)を計算する。
Figure 2015037239
ここでnはフィルタ係数の番号である。
ステップサイズ乗算部1072は、更新ベクトルU(ω,m,t)に、予め設定した0〜2の範囲のステップサイズαを乗じたフィルタ係数を出力する。加算手段1073は、ステップサイズ乗算部1072が出力するフィルタ係数に、フィルタ係数保持手段1074に保持されている1フレーム前のフィルタ係数を加算して次のフレームのフィルタ係数F(ω,m,t+1)として出力する。
Figure 2015037239
NLMS法などの適応アルゴリズムは、減算部106が出力する誤差信号E(ω,t)の2乗平均を最小化するように動作する。よって、Dだけ過去の遅延副パワースペクトル|Z(ω,t−D)|から、現在の周波数領域収音信号X(ω,t)を出来る限り予測し、予測できた成分を取り除いた信号が誤差信号E(ω,t)となる。したがって、過去の信号から予測できない成分のみが残り、誤差信号E(ω,t)が直接音の推定パワーとなる。
〔残響抑圧ゲイン計算部〕
図7に、残響抑圧ゲイン計算部109の機能構成例を示す。残響抑圧ゲイン計算部109は、除算手段1091と、最大値制限手段1092と、時間平滑化手段1093と、を備える。
除算手段1091は、主パワースペクトル|X(ω,t)|と直接音の推定パワーE(ω,t)を入力として、両者の比を計算し、その比をβ乗してゲインG′(ω,t)を計算する(式(5))。
Figure 2015037239
ここでβは、予め設定した定数であり、大きい値に設定するほど残響の抑圧量が強くなる。βは、おおよそ0.5〜1.0の間で設定される。
最大値制限手段1092は、除算手段1091が出力するゲインG′(ω,t)の値を1を上限として、式(6)と式(7)に示すように制限する。
Figure 2015037239
時間平滑化手段1093は、最大値制限手段1092の出力する制限されたゲインG″(ω,t)を時間平滑化して、残響抑圧ゲインG(ω,t)を出力する。時間平滑化は、例えば次式で実現される。
Figure 2015037239
ここでγは平滑化係数であり、予め設定される。γは0〜1の範囲の値を取り、1に近いほど長い時定数での平滑化となる。
残響抑圧ゲイン計算部109が出力する残響抑圧ゲインG(ω,t)は、推定した直接音の推定パワー(誤差信号)を、収音信号のパワーで除算した値を基に計算されるので、この残響抑圧ゲインG(ω,t)を周波数領域収音信号X(ω,t)に乗算することで、残響成分を抑圧した出力を得ることができる。
残響抑圧装置100は、主マイクロホンで収音した主マイクロホン収音信号に含まれる残響成分を、副マイクロホンで収音した副マイクロホン収音信号から推測する。話者方向に感度が低い副マイクロホンでは、話者音声の直接音成分のレベルが主マイクロホンに比べて低くなっているので、主マイクロホン収音信号に含まれる直接音成分(声道特性のみの経路)を推定し難くなる。すなわち、声道特性を残響特性として推定してしまうことを防ぐことができる。よって、初期反射成分も含めて残響成分を推測することができ、初期反射も含めて残響成分を抑圧することが可能となる。
また、残響抑圧装置100は、FFTと逆FFTを用いて収音信号を周波数領域の信号に変換して、適応アルゴリズムによって直接音成分の推定を実現しているので、周波数領域フィルタ部108のタップ長の1乗のオーダーの低演算量で残響成分を抑圧することができる。
図8に、この発明の残響抑圧装置200の機能構成例を示す。残響抑圧装置200は、上記残響抑圧装置100に、ビームフォーマ部210と、ヌルビームフォーマ部220の構成を追加したものである。
ビームフォーマ部210は、複数のマイクロホンで収音した収音信号が入力され、上記複数のマイクロホンで構成されるマイクロホン感度の指向性を、音源方向に設定して主収音信号を出力する。主収音信号は、残響抑圧装置100の主FFT部101の入力信号である。
ヌルビームフォーマ220は、複数のマイクロホンで収音した収音信号が入力され、上記複数のマイクロホンで構成されるマイクロホン感度の指向性を、上記音源方向以外の方向に設定して副収音信号を出力する。副収音信号は、残響抑圧装置100の副FFT部102の入力信号である。
図9に、ビームフォーマ部210の機能構成例を示す。ビームフォーマ部210は、複数のマイクロホンで収音した収音信号がそれぞれ入力される複数のマイクロホンの数に対応する数のフィルタ手段211〜211と、複数(N個)のフィルタの出力信号を加算する加算手段212と、を備える。
フィルタ手段211〜211に、それぞれ設定するフィルタ係数の値によって、複数のマイクロホンで構成されるマイクロホン感度の指向性を制御することができる。ビームフォーマ部210のフィルタ手段211〜211のフィルタ係数は、そのマイクロホン感度の最大感度の指向性を、音源方向に向けるように設定される。ビームフォーマ部210の加算手段212の出力信号は、残響抑圧装置100の主FFT部101の入力信号となる。
ヌルビームフォーマ部220の機能構成も、ビームフォーマ部210と同じである。但し、ヌルビームフォーマ部220のフィルタ手段221〜221(図示は省略)のフィルタ係数は、複数のマイクロホンで構成されるマイクロホン感度の最小感度の指向性を、音源方向に向けるように設定される。ヌルビームフォーマ部220の加算手段222の出力信号は、残響抑圧装置100の副FFT部102の入力信号となる。
このように、ビームフォーマ部210とヌルビームフォーマ部220とを備えて、主収音信号と副収音信号を合成することで、単一の指向性マイクロホンを2本使う場合に比べて、より鋭いマイクロホン感度の指向特性を実現させることで残響抑制性能を向上させることができる。
図10に、この発明の残響抑圧装置300の機能構成例を示す。残響抑圧装置300は、残響抑圧装置200に対して更に、音源方向検出部330と、ビームフォーマフィルタ係数設定部340と、ヌルビームフォーマフィルタ係数設定部350と、を具備する。
音源方向検出部330は、複数のマイクロホンで収音した収音信号を入力として、音源の方向を推定して音源方向を出力する。音源方向は、複数の収音信号の位相差から推定することが可能であり、周知技術で実現が可能である。
ビームフォーマフィルタ係数設定部340は、音源方向検出部330の出力する音源方向を入力として、当該音源方向の感度が高くなるようにビームフォーマ部210のフィルタ係数を設定する。
ヌルビームフォーマフィルタ係数設定部350は、音源方向検出部330の出力する音源方向を入力として、当該音源方向の感度が低くなるようにヌルビームフォーマ部220のフィルタ係数を設定する。
このように、音源方向検出部330とビームフォーマフィルタ係数設定部340とヌルビームフォーマフィルタ係数設定部350と、を備えることで、話者が移動したような場合でも適切に残響抑圧を行うことが可能になる。
図11に、この発明の残響抑圧装置400の適応アルゴリズム部407の機能構成例を示す。その動作フローを図12に示す。残響抑圧装置400は、残響抑圧装置100の適応アルゴリズム部107が、適応アルゴリズム部407に代わったのみの構成であるので、その全体の機能構成例は省略する。
適応アルゴリズム部407は、上記した適応アルゴリズム部107(図5)に対して、ステップサイズ設定手段4071を備える点で異なる。ステップサイズ設定手段4071は、更新ベクトル計算手段1071の出力する更新ベクトルU(ω,m,t)の値に応じて、ステップサイズαを更新する。例えば、更新ベクトルU(ω,m,t)が正の値を取る場合(ステップS4071aのYes)に予め設定した小さい値のステップサイズαを設定(式(9))(ステップS4071b)し、更新ベクトルU(ω,m,t)が負の値を取る場合(ステップS4071aのNo)に予め設定した大きい値のステップサイズαを設定(式(10))する(ステップS4071c)。
Figure 2015037239
このようにステップサイズを設定することで、直接音の推定誤差を制御することができる。ステップサイズを制御しない場合は、推定誤差はプラスマイナスに均等に出るが、上記したように制御することで、直接音の推定誤差を正の方向に多く出るように制御することができる。すなわち、直接音を小さく推定してしまうことを防ぎ、音質の劣化を抑えることができる。
このように残響抑圧装置400によれば、残響抑圧装置100で得られる演算量を削減する効果に加えて、高品質な残響抑圧音を出力する効果も奏することができる。
図13に、この発明の残響抑圧装置500の適応アルゴリズム部507の機能構成例を示す。その動作フローを図14に示す。残響抑圧装置500は、上記した残響抑圧装置100〜400に対して、適応アルゴリズム部507が非負拘束手段5071を具備する点で異なる。
非負拘束手段5071は、加算手段1073の出力する更新後のフィルタ係数F(ω,m,t+1)が負の値となった場合に、その値を0に置き換える(ステップS5071b)ことで、フィルタ係数F(ω,m,t+1)が負の値にならないように制御する。
この発明では、正の値しか持たない信号のパワーに着目して残響成分の推定を行っているので、フィルタ係数は正の値を取るのが正しい解である。フィルタ係数F(ω,m,t+1)が負の値を取るということは、推定誤差であるので、その値を0に置き換えることで、より正確なフィルタ係数に修正することができる。このように、残響抑圧装置500によれば、残響抑圧装置100〜400に対して正確にフィルタ係数を求めることができ、高品質な残響抑圧を行うことができる。
図15に、この発明の残響抑圧装置600の残響抑圧ゲイン計算部609の機能構成例を示す。その動作フローを図16と図17に示す。残響抑圧装置600は、上記した残響抑圧装置100〜500の残響抑圧ゲイン計算部109が、残響抑圧ゲイン計算部609に代わったのみの構成であるので、その全体の機能構成例は省略する。
残響抑圧ゲイン計算部609は、残響抑圧ゲイン計算部109(図7)に対して、更に、マスキングレベル計算手段6091と最大値選択手段6092と、を具備する点で異なる。マスキングレベル計算手段6091は、減算部106が出力する直接音の推定パワー|E(ω,t)|から、聴覚マスキングレベルQ(ω,t)を求める。聴覚マスキングとは、周波数KのパワーがP(k)であった場合に、P(K)の関数として計算できる聴覚マスキングレベルを下回る音の成分は、人間の聴覚では聞き取れないという現象である。
聴覚マスキングレベルQ(ω,t)は、例えば次のようにして求めることができる。ある周波数ωの聴覚マスキングレベルQ(ω,t)を求める際に、その周波数の直接音の推定パワーE(ω,t)と、その1つ下の周波数の仮の聴覚マスキングレベルQ′(ω−1,t)にそれぞれ係数a,bを乗じた値を比較(ステップS6091d)し、大きい値を仮の聴覚マスキングレベルQ′(ω,t)とする(ステップS6091e,S6091f)。これを周波数ωの最小値から順に、ω=最大値になるまで繰り返し実施する(ステップS6091gのNoのループ)。係数a,bは聴覚マスキングの特性に基づいて予め設定される1未満、0以上の定数である。また、係数a,bは周波数ωに応じて異なる値に設定しても良い。
Figure 2015037239
周波数ω=最大値になると(ステップS6091gのYes,結合子A)、次に周波数ωの最大値から順に、その周波数ωの仮の聴覚マスキングレベルQ′(ω,t)と、1つ上の周波数の仮の聴覚マスキングレベルQ′(ω+1,t)に係数cを乗じた値を比較(ステップS6091k)し、大きい値を聴覚マスキングレベルQ(ω,t)とする(ステップS6091L,S6091m)。係数cは、聴覚マスキングの特性に基づいて予め設定される1未満0以上の定数である。また、係数cは周波数ωに応じて異なる値に設定しても良い。
Figure 2015037239
以上の方法により聴覚マスキングレベルQ(ω,t)を求めることができる。
最大値選択手段6092は、減算部106が出力する直接音の推定パワーE(ω,t)と、聴覚マスキングレベルQ(ω,t)を比較(ステップS6092a)し、大きい方の値を新たな直接音の推定パワー(誤差信号E(ω,t))として除算手段1091に出力する。
以上の方法により、残響抑圧装置600は、聴覚マスキング特性を利用して、聴感上聞こえない残響成分を抑圧しないようにすることができる。したがって、残響抑圧装置600は、残響音の不要な抑圧をしないようにすることができ、直接音の劣化を少なくする効果を奏する。
図18に、この発明の残響抑圧装置700の機能構成例を示す。残響抑圧装置700は、残響抑圧装置100に、適応区間検出部701の構成を追加したものである。
適応区間検出部701は、遅延部105の出力する遅延副パワースペクトル|Z(ω,t−D)|の大きさと、予め設定した閾値を比較し、遅延パワースペクトルの大きさが閾値を超えた場合にのみ、適応アルゴリズム部107によるフィルタ係数の更新が行われるように制御する。
この制御を付加することで、収音信号の信号レベルが小さく、周囲雑音の影響を受け易い区間での、フィルタ係数の更新を停止させることができるので、より高精度に残響を抑圧するためのフィルタ係数を求めることができる。
なお、残響抑圧装置700を、残響抑圧装置100に適応区間検出部701を追加した構成で説明を行ったが、上記した残響抑圧装置200,300,400,500,600の何れにも適応区間検出部701の構成を追加することで、同様の効果を得ることができる。
図19に、この発明の残響抑圧装置800の機能構成例を示す。残響抑圧装置800は、残響抑圧装置100に、第1帯域集約部801と、第2帯域集約部802と、帯域展開部803の構成を追加したものである。
第1帯域集約部801は、主パワー計算部103が出力する主パワースペクトル|X(ω,t)|の周波数ωを集約し、より少ない周波数分割数になる周波数ω′に変換する。周波数ωを複数のグループに分け、そのグループ単位で、主パワー計算部103の出力するパワースペクトル|X(ω,t)|の総和を取り、その値を新たな周波数ω′の主パワースペクトル|X′(ω′,t)|として出力する(式(16))。主パワースペクトル|X′(ω′,t)|は、残響抑圧ゲイン計算部109と減算部106に供給される。
Figure 2015037239
ここでΩ(ω′)は、ω′のグループに属する周波数ωの集合である。
第2帯域集約部802は、帯域集約部801と同様にして副パワー計算部104の出力信号|Z(ω,t)|の周波数分割ωを集約し、より少ない周波数分割ω′に変換する。
第2帯域集約部802の出力する周波数ωを集約したパワースペクトル|Z′(ω′,t)|は、遅延部105を介して、適応アルゴリズム部107と周波数領域フィルタ部108、にそれぞれ供給される。残響抑圧ゲイン計算部109は、周波数ω′の単位で処理を行う。
帯域展開部803は、残響抑圧ゲイン計算部109で求められた残響抑圧ゲインG′(ω′,t)の周波数ω′を、主FFT部101の周波数分割数になる周波数ωに変換する。主FFT部101の周波数ωが属する集約後の周波数ω′の残響抑圧ゲインを、周波数ωの残響抑圧ゲインにコピーすることで周波数ωに展開する(式(17))。
Figure 2015037239
このように周波数ωを集約して残響抑圧ゲインを演算することにより、演算量を減らすことができる。なお、聴覚特性は周波数に対して対数的な感度を有しているので、高い周波数ほど周波数の集約数を大きくしても聴感上の劣化は少ないので、周波数帯域によって集約する周波数ω′の大きさを変えるようにして良い。
なお、残響抑圧装置800を、残響抑圧装置100に第1帯域集約部801と第2帯域集約部802と帯域展開部803を追加した構成で説明を行ったが、上記した残響抑圧装置200,300,400,500,600,700の何れにも同じ構成を追加することで、同様の効果を得ることができる。
図20に、この発明の残響抑圧装置900の機能構成例を示す。残響抑圧装置900は、残響抑圧装置100に、係数乗算部901と、第2周波数領域フィルタ部902と、第2減算部903の構成を追加したものである。
係数乗算部901は、適応アルゴリズム部107が出力するフィルタ係数F(ω,m,t)の各々に、予め設定した係数H(m)を乗算し、変換後のフィルタ係数F′(ω,m,t)を出力する(式(18))。
Figure 2015037239
係数H(m)の内、mが小さい部分の係数を1よりも小さく設定することで、人の口腔内の反響特性を残響成分として誤推定してしまうことを減らすことができる。人の口腔内の反響特性は、部屋の残響と比べ、短時間の応答であるため、mが小さい部分のフィルタ係数に大きく影響する。mが小さい部分のフィルタ係数に1よりも小さい係数H(m)を乗算することで、その影響を軽減することができる。
第2周波数領域フィルタ部902は、係数H(m)を乗算した後のフィルタ係数を遅延部105の出力する遅延副パワースペクトル|Z(ω,t−D)|に乗算する。第2減算部903は、主パワー計算部103が出力する主パワースペクトルから、第2周波数領域フィルタ部902の出力信号を減算する。減算部903の出力は、残響抑圧ゲイン計算部109に直接音の推定パワーの代わりに入力される。
残響抑圧装置900によれば、人の口腔内の反響特性を残響成分として誤推定してしまうことを減らすことができる。なお、残響抑圧装置900を、残響抑圧装置100に係数乗算部901と第2周波数領域フィルタ部902と減算部903を追加した構成で説明を行ったが、上記した残響抑圧装置200,300,400,500,600,700,800の何れにも同じ機能構成部を追加することで、同様の効果を得ることができる。
以上説明したこの発明の残響抑圧装置によれば、話者に対して指向性を向けた主マイクロホンで収音された主収音信号と、話者からの直接音をなるべく拾わないように話者に対して指向性の谷を向けて設置された副マイクロホンで収音された副収音信号を用いて、主収音信号に含まれる残響成分を予測することで、主収音信号に含まれる直接音成分を残響と誤推定してしまうことを防ぐことができ、部屋の残響成分の初期部分を含めて抑圧することができる。
上記装置における処理手段をコンピュータによって実現する場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、各装置における処理手段がコンピュータ上で実現される。
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。具体的には、例えば、磁気記録装置として、ハードディスク装置、フレキシブルディスク、磁気テープ等を、光ディスクとして、DVD(Digital Versatile Disc)、DVD-RAM(Random Access Memory)、CD-ROM(Compact Disc Read Only Memory)、CD-R(Recordable)/RW(ReWritable)等を、光磁気記録媒体として、MO(Magneto Optical disc)等を、半導体メモリとしてEEP-ROM(Electronically Erasable and Programmable-Read Only Memory)等を用いることができる。
また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD-ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記録装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。
また、各手段は、コンピュータ上で所定のプログラムを実行させることにより構成することにしてもよいし、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。

Claims (20)

  1. 音源方向に対して最大感度を持つ主マイクロホンで収音した主収音信号を周波数領域の
    周波数領域主収音信号に変換する主FFT部と、
    上記音源方向に最大感度を持たない副マイクロホンで収音した副収音信号を、周波数領
    域の周波数領域副収音信号に変換する副FFT部と、
    上記周波数領域主収音信号のパワーを、周波数ごとに計算した主パワースペクトルを出
    力する主パワー計算部と、
    上記周波数領域副収音信号のパワーを、周波数ごとに計算した副パワースペクトルを出
    力する副パワー計算部と、
    上記副パワースペクトルを所定の遅延量だけ遅延させた遅延副パワースペクトルを出力
    する遅延部と、
    上記主パワースペクトルから、上記遅延副パワースペクトルにフィルタ係数を乗じたフィルタ後信号を減算して直接音の推定パワーを求める減算部と、
    上記遅延副パワースペクトルと上記直接音の推定パワーを入力として、当該直接音の推
    定パワーを最小化するように上記フィルタ係数を更新する適応アルゴリズム部と、
    上記遅延副パワースペクトルに上記フィルタ係数を乗じてフィルタリングしたフィルタ
    後信号を出力する周波数領域フィルタ部と、
    上記主パワースペクトルと上記直接音の推定パワーを入力として、残響音を抑圧するた
    めの残響抑圧ゲインを計算する残響抑圧ゲイン計算部と、
    上記周波数領域主収音信号に上記残響抑圧ゲインを乗じて残響抑圧信号を出力する乗算部と、
    上記残響除去信号を時間領域の残響抑圧信号に変換する逆FFT部と、
    を具備する残響抑圧装置。
  2. 請求項1に記載した残響抑圧装置において、
    更に、
    複数のマイクロホンで収音した収音信号が入力され、上記複数のマイクロホンで構成されるマイクロホン感度の指向性を、上記音源方向に設定して上記主収音信号を出力するビームフォーマ部と、
    上記複数のマイクロホンで収音した収音信号が入力され、上記複数のマイクロホンで構成されるマイクロホン感度の指向性を、上記音源方向以外の方向に設定して上記副収音信号を出力するヌルビームフォーマ部と、
    を具備する残響抑圧装置。
  3. 請求項2に記載した残響抑圧装置において、
    更に、
    上記複数のマイクロホンで収音した収音信号を入力として、音源の方向を推定して音源方向を出力する音源方向検出部と、
    上記音源方向を入力として、当該音源方向の感度が高くなるように上記ビームフォーマ部のフィルタ係数を設定するビームフォーマフィルタ係数設定部と、
    上記音源方向を入力として、当該音源方向の感度が低くなるように上記ヌルビームフォーマ部のフィルタ係数を設定するヌルビームフォーマ係数設定部と、
    を具備する残響抑圧装置。
  4. 請求項1乃至3の何れかに記載した残響抑圧装置において、
    上記適応アルゴリズム部は、
    遅延パワースペクトルと誤差信号を入力として、適応アルゴリズムを用いて更新ベクトルを計算する更新ベクトル計算手段と、
    上記更新ベクトルの値に応じてステップサイズを変更するステップサイズ設定手段と、
    上記更新ベクトルに、上記ステップサイズを乗算したフィルタ係数を出力する乗算手段と、
    上記乗算手段の出力するフィルタ係数に、1フレーム前のフィルタ係数を加算する加算
    手段と、
    上記加算手段の出力を、次のフレームのフィルタ係数として保持するフィルタ係数保持手段と、
    を備えることを特徴とする残響抑圧装置。
  5. 請求項1乃至3の何れかに記載した残響抑圧装置において、
    上記適応アルゴリズム部は、
    遅延パワースペクトルと直接音の推定パワーを入力として、適応アルゴリズムを用いて更新ベクトルを計算する更新ベクトル計算手段と、
    上記更新ベクトルに、上記ステップサイズを乗算したフィルタ係数を出力する乗算手段と、
    上記乗算手段の出力するフィルタ係数に、1フレーム前のフィルタ係数を加算する加算
    手段と、
    上記加算手段の出力する更新後のフィルタ係数が負の値となった場合に、当該フィルタ係数の値を0に置き換える非負拘束手段と、
    上記非負拘束手段の出力を、次のフレームのフィルタ係数として保持するフィルタ係数保持手段と、
    を備えることを特徴とする残響抑圧装置。
  6. 請求項1乃至5の何れかに記載した残響抑圧装置において、
    上記残響抑圧ゲイン計算部は、
    上記誤差信号から聴覚マスキングレベルQ(ω,t)を計算するマスキングレベル計算手段と、
    上記誤差信号と上記聴覚マスキングレベルQ(ω,t)を比較し、大きい方の値を、新たな直接音の推定パワーとして上記残響抑圧ゲインの計算に選択する最大値選択手段と、
    を含むことを特徴とする残響抑圧装置。
  7. 請求項1乃至6の何れかに記載した残響抑圧装置において、
    更に、
    上記遅延パワースペクトルの大きさと、予め設定した閾値を比較し、当該遅延パワースペクトルの大きさが上記閾値を超えた場合のみ、上記適応アリゴリズム部によるフィルタ係数の更新が行われるように制御する適応区間検出部を、備えることを特徴とする残響抑圧装置。
  8. 請求項1乃至7の何れかに記載した残響抑圧装置において、
    更に、
    上記パワースペクトルの周波数分割ωを集約し、次式に示すようにより少ない周波数分割ω′に変換する帯域集約部と、
    Figure 2015037239

    ここでΩ(ω′)はω′のグループに属する周波数ωの集合、
    上記副パワースペクトルの周波数分割ωを集約し、次式に示すようにより少ない周波数分割ω′に変換する第2帯域集約部と、
    Figure 2015037239

    上記残響抑圧ゲインの周波数分割ω′を、次式に示すように上記FFT部の周波数分割ωに変換する帯域展開部と、
    Figure 2015037239

    を具備することを特徴とする残響抑圧装置。
  9. 請求項1乃至8の何れかに記載した残響抑圧装置において、
    更に、
    上記フィルタ係数F(ω,m,t)の各々に、予め設定した係数H(m)を乗算し、変換後のフィルタ係数F′(ω,m,t)を出力する係数乗算部と、
    上記変換後のフィルタ係数F′(ω,m,t)を、上記遅延パワースペクトルに乗算する第2周波数領域フィルタ部と、
    上記パワースペクトルから上記第2周波数領域フィルタ部の出力信号を減算した信号を上記直接音の推定パワーの代わりに上記残響抑圧ゲイン計算部に出力する第2減算部と、
    を具備することを特徴とする残響抑圧装置。
  10. 音源方向に対して最大感度を持つ主マイクロホンで収音した主収音信号を周波数領域の
    周波数領域主収音信号に変換する主FFT過程と、
    上記音源方向に最大感度を持たない副マイクロホンで収音した副収音信号を、周波数領
    域の周波数領域副収音信号に変換する副FFT過程と、
    上記周波数領域主収音信号のパワーを、周波数ごとに計算した主パワースペクトルを出
    力する主パワー計算過程と、
    上記周波数領域副収音信号のパワーを、周波数ごとに計算した副パワースペクトルを出
    力する副パワー計算過程と、
    上記副パワースペクトルを所定の遅延量だけ遅延させた遅延副パワースペクトルを出力
    する遅延過程と、
    上記主パワースペクトルから、上記遅延副パワースペクトルにフィルタ係数を乗じたフィルタ後信号を減算して直接音の推定パワーを求める減算過程と、
    上記遅延副パワースペクトルと上記直接音の推定パワーを入力として、当該直接音の推
    定パワーを最小化するように上記フィルタ係数を更新する適応アルゴリズム過程と、
    上記遅延副パワースペクトルに上記フィルタ係数を乗じてフィルタリングしたフィルタ
    後信号を出力する周波数領域フィルタ過程と、
    上記主パワースペクトルと上記直接音の推定パワーを入力として、残響音を抑圧するた
    めの残響抑圧ゲインを計算する残響抑圧ゲイン計算過程と、
    上記周波数領域主収音信号に上記残響抑圧ゲインを乗じて残響抑圧信号を出力する乗算過程と、
    上記残響除去信号を時間領域の残響抑圧信号に変換する逆FFT過程と、
    を備える残響抑圧方法。
  11. 請求項10に記載した残響抑圧方法において、
    更に、
    複数のマイクロホンで収音した収音信号が入力され、上記複数のマイクロホンで構成されるマイクロホン感度の指向性を、上記音源方向に設定して上記主収音信号を出力するビームフォーマ過程と、
    上記複数のマイクロホンで収音した収音信号が入力され、上記複数のマイクロホンで構成されるマイクロホン感度の指向性を、上記音源方向以外の方向に設定して上記副収音信号を出力するヌルビームフォーマ過程と、
    を備える残響抑圧方法。
  12. 請求項11に記載した残響抑圧方法において、
    更に、
    上記複数のマイクロホンで収音した収音信号を入力として、音源の方向を推定して音源方向を出力する音源方向検出過程と、
    上記音源方向を入力として、当該音源方向の感度が高くなるように上記ビームフォーマ部のフィルタ係数を設定するビームフォーマフィルタ係数設定過程と、
    上記音源方向を入力として、当該音源方向の感度が低くなるように上記ヌルビームフォーマ部のフィルタ係数を設定するヌルビームフォーマ係数設定過程と、
    を備える残響抑圧方法。
  13. 請求項10乃至12の何れかに記載した残響抑圧方法において、
    上記適応アルゴリズム過程は、
    遅延パワースペクトルと誤差信号を入力として、適応アルゴリズムを用いて更新ベクトルを計算する更新ベクトル計算ステップと、
    上記更新ベクトルの値に応じてステップサイズを変更するステップサイズ設定ステップ
    と、
    上記更新ベクトルに、上記ステップサイズを乗算したフィルタ係数を出力する乗算ステップと、
    上記乗算ステップの出力するフィルタ係数に、1フレーム前のフィルタ係数を加算する
    加算ステップと、
    上記加算ステップの出力を、次のフレームのフィルタ係数として保持するフィルタ係数保持ステップと、
    を含むことを特徴とする残響抑圧方法。
  14. 請求項10乃至12の何れかに記載した残響抑圧方法において、
    上記適応アルゴリズム過程は、
    遅延パワースペクトルと直接音の推定パワーを入力として、適応アルゴリズムを用いて更新ベクトルを計算する更新ベクトル計算ステップと、
    上記更新ベクトルに、上記ステップサイズを乗算したフィルタ係数を出力する乗算ステップと、
    上記乗算手段の出力するフィルタ係数に、1フレーム前のフィルタ係数を加算する加算
    ステップと、
    上記加算手段の出力する更新後のフィルタ係数が負の値となった場合に、当該フィルタ係数の値を0に置き換える非負拘束ステップと、
    上記非負拘束手段の出力を、次のフレームのフィルタ係数として保持するフィルタ係数保持ステップと、
    を含むことを特徴とする残響抑圧方法。
  15. 請求項10乃至14の何れかに記載した残響抑圧方法において、
    上記残響抑圧ゲイン計算過程は、
    上記誤差信号から聴覚マスキングレベルQ(ω,t)を計算するマスキングレベル計算ステップと、
    上記誤差信号と上記聴覚マスキングレベルQ(ω,t)を比較し、大きい方の値を、新たな直接音の推定パワーとして上記残響抑圧ゲインの計算に選択する最大値選択ステップと、
    を含むことを特徴とする残響抑圧方法。
  16. 請求項10乃至15の何れかに記載した残響抑圧方法において、
    更に、
    上記遅延パワースペクトルの大きさと、予め設定した閾値を比較し、当該遅延パワースペクトルの大きさが上記閾値を超えた場合のみ、上記適応アリゴリズム部によるフィルタ係数の更新が行われるように制御する適応区間検出過程を、備えることを特徴とする残響抑圧方法。
  17. 請求項10乃至16の何れかに記載した残響抑圧方法において、
    更に、
    上記主パワースペクトルの周波数分割ωを集約し、次式に示すようにより少ない周波数分割ω′に変換する第1帯域集約過程と、
    Figure 2015037239

    ここでΩ(ω′)はω′のグループに属する周波数ωの集合、
    上記副パワースペクトルの周波数分割ωを集約し、次式に示すようにより少ない周波数分割ω′に変換する第2帯域集約過程と、
    Figure 2015037239

    上記残響抑圧ゲインの周波数分割ω′を、次式に示すように上記FFT部の周波数分割ωに変換する帯域展開過程と、
    Figure 2015037239

    を備えることを特徴とする残響抑圧方法。
  18. 請求項1乃至17の何れかに記載した残響抑圧方法において、
    更に、
    上記フィルタ係数F(ω,m,t)の各々に、予め設定した係数H(m)を乗算し、変換後のフィルタ係数F′(ω,m,t)を出力する係数乗算過程と、
    上記変換後のフィルタ係数F′(ω,m,t)を、上記遅延パワースペクトルに乗算する第2周波数領域フィルタ過程と、
    上記パワースペクトルから上記第2周波数領域フィルタ部の出力信号を減算した信号を上記直接音の推定パワーの代わりに上記残響抑圧ゲイン計算部に出力する第2減算過程と、
    を備えることを特徴とする残響抑圧方法。
  19. 請求項1乃至9の何れかに記載した残響抑圧装置としてコンピュータを機能させるためのプログラム。
  20. 請求項19に記載した何れかのプログラムを記録したコンピュータで読み取り可能な記録媒体。
JP2013168220A 2013-08-13 2013-08-13 残響抑圧装置とその方法と、プログラムとその記録媒体 Active JP6087762B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013168220A JP6087762B2 (ja) 2013-08-13 2013-08-13 残響抑圧装置とその方法と、プログラムとその記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013168220A JP6087762B2 (ja) 2013-08-13 2013-08-13 残響抑圧装置とその方法と、プログラムとその記録媒体

Publications (2)

Publication Number Publication Date
JP2015037239A true JP2015037239A (ja) 2015-02-23
JP6087762B2 JP6087762B2 (ja) 2017-03-01

Family

ID=52687551

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013168220A Active JP6087762B2 (ja) 2013-08-13 2013-08-13 残響抑圧装置とその方法と、プログラムとその記録媒体

Country Status (1)

Country Link
JP (1) JP6087762B2 (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3273608A1 (en) * 2016-07-20 2018-01-24 Sennheiser Communications A/S An adaptive filter unit for being used as an echo canceller
CN108986799A (zh) * 2018-09-05 2018-12-11 河海大学 一种基于倒谱滤波的混响参数估计方法
JP2019004466A (ja) * 2017-06-12 2019-01-10 ヤマハ・ユニファイド・コミュニケーションズ 収音装置、放収音装置、信号処理方法、及びプログラム
CN110136733A (zh) * 2018-02-02 2019-08-16 腾讯科技(深圳)有限公司 一种音频信号的解混响方法和装置
JP2021081746A (ja) * 2017-03-20 2021-05-27 ボーズ・コーポレーションBose Corporation ノイズ低減のためのオーディオ信号処理
CN113542980A (zh) * 2021-07-21 2021-10-22 深圳市悦尔声学有限公司 一种抑制扬声器串扰的方法

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07104768A (ja) * 1993-10-04 1995-04-21 Toyota Motor Corp 車室内騒音低減装置
WO2004034734A1 (ja) * 2002-10-08 2004-04-22 Nec Corporation アレイ装置および携帯端末
WO2005125272A1 (ja) * 2004-06-16 2005-12-29 Matsushita Electric Industrial Co., Ltd. ハウリング抑圧装置、プログラム、集積回路、およびハウリング抑圧方法
JP2007274714A (ja) * 2007-05-07 2007-10-18 Matsushita Electric Works Ltd エコーキャンセラ
JP2008205896A (ja) * 2007-02-21 2008-09-04 Yamaha Corp 放収音装置
JP2010140063A (ja) * 2010-03-24 2010-06-24 Nec Corp 雑音抑圧の方法及び装置
US20110019833A1 (en) * 2008-01-31 2011-01-27 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E. V. Apparatus and method for computing filter coefficients for echo suppression
WO2012014451A1 (ja) * 2010-07-26 2012-02-02 パナソニック株式会社 多入力雑音抑圧装置、多入力雑音抑圧方法、プログラムおよび集積回路
WO2012109384A1 (en) * 2011-02-10 2012-08-16 Dolby Laboratories Licensing Corporation Combined suppression of noise and out - of - location signals
US20120207325A1 (en) * 2011-02-10 2012-08-16 Dolby Laboratories Licensing Corporation Multi-Channel Wind Noise Suppression System and Method
US20130028432A1 (en) * 2011-07-28 2013-01-31 Fujitsu Limited Reverberation suppression device, reverberation suppression method, and computer-readable recording medium storing reverberation suppression program
US20130054253A1 (en) * 2011-08-30 2013-02-28 Fujitsu Limited Audio encoding device, audio encoding method, and computer-readable recording medium storing audio encoding computer program

Patent Citations (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07104768A (ja) * 1993-10-04 1995-04-21 Toyota Motor Corp 車室内騒音低減装置
WO2004034734A1 (ja) * 2002-10-08 2004-04-22 Nec Corporation アレイ装置および携帯端末
US20050213432A1 (en) * 2002-10-08 2005-09-29 Osamu Hoshuyama Array device and mobile terminal
WO2005125272A1 (ja) * 2004-06-16 2005-12-29 Matsushita Electric Industrial Co., Ltd. ハウリング抑圧装置、プログラム、集積回路、およびハウリング抑圧方法
US20080285774A1 (en) * 2004-06-16 2008-11-20 Takeo Kanamori Howling Suppression Device, Program, Integrated Circuit, and Howling Suppression Method
JP2008205896A (ja) * 2007-02-21 2008-09-04 Yamaha Corp 放収音装置
JP2007274714A (ja) * 2007-05-07 2007-10-18 Matsushita Electric Works Ltd エコーキャンセラ
US20110019833A1 (en) * 2008-01-31 2011-01-27 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E. V. Apparatus and method for computing filter coefficients for echo suppression
JP2011514706A (ja) * 2008-01-31 2011-05-06 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ エコー抑制のためのフィルタ係数を演算する装置および方法
JP2010140063A (ja) * 2010-03-24 2010-06-24 Nec Corp 雑音抑圧の方法及び装置
WO2012014451A1 (ja) * 2010-07-26 2012-02-02 パナソニック株式会社 多入力雑音抑圧装置、多入力雑音抑圧方法、プログラムおよび集積回路
US20120177223A1 (en) * 2010-07-26 2012-07-12 Takeo Kanamori Multi-input noise suppression device, multi-input noise suppression method, program, and integrated circuit
WO2012109384A1 (en) * 2011-02-10 2012-08-16 Dolby Laboratories Licensing Corporation Combined suppression of noise and out - of - location signals
US20120207325A1 (en) * 2011-02-10 2012-08-16 Dolby Laboratories Licensing Corporation Multi-Channel Wind Noise Suppression System and Method
US20130028432A1 (en) * 2011-07-28 2013-01-31 Fujitsu Limited Reverberation suppression device, reverberation suppression method, and computer-readable recording medium storing reverberation suppression program
JP2013030956A (ja) * 2011-07-28 2013-02-07 Fujitsu Ltd 残響抑制装置および残響抑制方法並びに残響抑制プログラム
US20130054253A1 (en) * 2011-08-30 2013-02-28 Fujitsu Limited Audio encoding device, audio encoding method, and computer-readable recording medium storing audio encoding computer program
JP2013050540A (ja) * 2011-08-30 2013-03-14 Fujitsu Ltd オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10291784B2 (en) 2016-07-20 2019-05-14 Sennheiser Communications A/S Adaptive filter unit for being used as an echo canceller
EP3273608A1 (en) * 2016-07-20 2018-01-24 Sennheiser Communications A/S An adaptive filter unit for being used as an echo canceller
US10506105B2 (en) 2016-07-20 2019-12-10 Sennheiser Communication A/S Adaptive filter unit for being used as an echo canceller
JP7098771B2 (ja) 2017-03-20 2022-07-11 ボーズ・コーポレーション ノイズ低減のためのオーディオ信号処理
JP2021081746A (ja) * 2017-03-20 2021-05-27 ボーズ・コーポレーションBose Corporation ノイズ低減のためのオーディオ信号処理
US11594240B2 (en) 2017-03-20 2023-02-28 Bose Corporation Audio signal processing for noise reduction
JP2019004466A (ja) * 2017-06-12 2019-01-10 ヤマハ・ユニファイド・コミュニケーションズ 収音装置、放収音装置、信号処理方法、及びプログラム
JP7334399B2 (ja) 2017-06-12 2023-08-29 ヤマハ株式会社 収音装置、放収音装置、信号処理方法、及びプログラム
CN110136733A (zh) * 2018-02-02 2019-08-16 腾讯科技(深圳)有限公司 一种音频信号的解混响方法和装置
CN110136733B (zh) * 2018-02-02 2021-05-25 腾讯科技(深圳)有限公司 一种音频信号的解混响方法和装置
CN108986799A (zh) * 2018-09-05 2018-12-11 河海大学 一种基于倒谱滤波的混响参数估计方法
CN113542980A (zh) * 2021-07-21 2021-10-22 深圳市悦尔声学有限公司 一种抑制扬声器串扰的方法
CN113542980B (zh) * 2021-07-21 2023-03-31 深圳市悦尔声学有限公司 一种抑制扬声器串扰的方法

Also Published As

Publication number Publication date
JP6087762B2 (ja) 2017-03-01

Similar Documents

Publication Publication Date Title
JP6087762B2 (ja) 残響抑圧装置とその方法と、プログラムとその記録媒体
US10403300B2 (en) Spectral estimation of room acoustic parameters
US10028055B2 (en) Audio signal correction and calibration for a room environment
CN106664473B (zh) 信息处理装置、信息处理方法和程序
CA2732723C (en) Apparatus and method for processing an audio signal for speech enhancement using a feature extraction
TWI463817B (zh) 可適性智慧雜訊抑制系統及方法
JP4778582B2 (ja) 適応音響エコー消去
US9716962B2 (en) Audio signal correction and calibration for a room environment
KR20190085924A (ko) 빔 조향
WO2014181330A1 (en) A method and apparatus for suppression of unwanted audio signals
US20190267018A1 (en) Signal processing for speech dereverberation
SE1150031A1 (sv) Metod och anordning för mikrofonval
JP2020504966A (ja) 遠距離音の捕捉
JP6840302B2 (ja) 情報処理装置、プログラム及び情報処理方法
Mishra et al. Unsupervised noise-aware adaptive feedback cancellation for hearing aid devices under noisy speech framework
JP5815614B2 (ja) 残響抑圧装置とその方法と、プログラムとその記録媒体
JP2003250193A (ja) 反響消去方法、この方法を実施する装置、プログラムおよびその記録媒体
JP2002223182A (ja) 反響消去方法、その装置、そのプログラム及びその記録媒体
CN110268726A (zh) 新式智能助听器
Iotov et al. Computationally efficient fixed-filter anc for speech based on long-term prediction for headphone applications
JP2002062895A (ja) 収音方法およびその装置
JPWO2021070278A1 (ja) 雑音抑圧装置、雑音抑圧方法、及び雑音抑圧プログラム
JP6059130B2 (ja) 雑音抑圧方法とその装置とプログラム
US20240121554A1 (en) Howling suppression device, howling suppression method, and non-transitory computer readable recording medium storing howling suppression program
JP2012048134A (ja) 残響除去方法とその装置とプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150811

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160715

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160726

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160825

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170131

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170202

R150 Certificate of patent or registration of utility model

Ref document number: 6087762

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150