JP2018078490A - 反響消去装置、その方法及びプログラム - Google Patents

反響消去装置、その方法及びプログラム Download PDF

Info

Publication number
JP2018078490A
JP2018078490A JP2016219916A JP2016219916A JP2018078490A JP 2018078490 A JP2018078490 A JP 2018078490A JP 2016219916 A JP2016219916 A JP 2016219916A JP 2016219916 A JP2016219916 A JP 2016219916A JP 2018078490 A JP2018078490 A JP 2018078490A
Authority
JP
Japan
Prior art keywords
echo
frequency domain
time domain
signal
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2016219916A
Other languages
English (en)
Other versions
JP6502307B2 (ja
Inventor
島内 末廣
Suehiro Shimauchi
末廣 島内
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2016219916A priority Critical patent/JP6502307B2/ja
Publication of JP2018078490A publication Critical patent/JP2018078490A/ja
Application granted granted Critical
Publication of JP6502307B2 publication Critical patent/JP6502307B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Circuit For Audible Band Transducer (AREA)
  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)

Abstract

【課題】与えられた収音信号のサンプル系列に対し、即座に、反響が従来よりも適切に消去された反響消去信号の系列を生成し得る反響消去装置等を提供する。
【解決手段】想定されるインパルス応答の実効長のサンプルの数よりも反響消去処理の処理単位とするサンプルの数が大きいものとし、入力信号と音響伝達経路の伝達特性の推定値とを用いて周波数領域のエコー推定値を求めるエコー推定部と、時間領域の収音信号とエコー推定値との差分である残差信号を求める減算部と、時間領域の残差信号を周波数領域の残差信号に変換する第二周波数領域変換部と、周波数領域の入力信号と残差信号とを用いて、伝達特性の推定値を更新する伝達経路特性更新部と、入力信号と収音信号とを繰り返し用いて、伝達特性の推定値が収束するまでエコー推定部と時間領域変換部と減算部と第二周波数領域変換部と伝達経路特性更新部とにおける処理を繰り返すように制御する制御部とを含む。
【選択図】図2

Description

本発明は、スピーカとマイクロホンとの音響結合に起因する反響の消去方法に関する。
スピーカとマイクロホンとが同一空間に配備されたとき、スピーカからの再生音がマイクロホンに回り込むため、マイクロホンにより収音された収音信号に、反響(エコー)が混入する。収音信号から反響を除去するための反響消去方法が従来から考案されている(非特許文献1参照)。
図1を用いて従来の反響消去方法について説明する。図1は、周波数領域において音響伝達経路の伝達特性の推定値を求める反響消去装置の機能ブロック図を示す。ここで、収音信号y(n)に対してNサンプル毎の信号フレームを構成し、1フレームを処理単位として反響消去処理が実行されるものとし、音響伝達経路のインパルス応答の実効長はLサンプルであると想定する。
まず、周波数領域変換部10は、(N+L-1)サンプル過去から、現時刻nまでのスピーカ3への入力信号x(n-N-L+1),x(n-N-L+2),…,x(n)を取得し、これを離散フーリエ変換することで、周波数領域の入力信号X(0),X(1),…,X(N+L-1)を得る。
次に、エコー推定部20は、各周波数番号k(k=0,1,…,N+L-1)において、周波数領域のエコー推定値Y^(k)=H(k)X(k)を計算する。なお、H(k)は周波数領域の音響伝達経路の伝達特性の推定値である。
時間領域変換部30は、周波数領域のエコー推定値Y^(k)を逆離散フーリエ変換することで、時間領域のエコー推定値y^(n-N-L+1),y^(n-N-L+2),…,y^(n)を得る。さらに、その最後Nサンプル分の要素y^(n-N+1),y^(n-N+2),…,y^(n)を抜きだし、減算部40に出力する。
減算部40は、Nサンプルの収音信号y(n-N+1),y(n-N+2),…,y(n)と時間領域のエコー推定値y^(n-N+1),y^(n-N+2),…,y^(n)との差分である残差信号e(n-N+1),e(n-N+2),…,e(n)を得る。この残差信号は、反響消去信号としても送話端5へ出力される。
周波数領域変換部50は、残差信号e(n-N+1),e(n-N+2),…,e(n)の系列の前にL点の零系列を加え、離散フーリエ変換により、N+L点の周波数領域の残差信号E(k)を得る。
伝達経路特性更新部60は、各周波数番号kにおける周波数領域の音響伝達経路の伝達特性の推定値H(k)を次式により更新する。
Figure 2018078490
ただし、μkは更新量を調整するステップサイズであり、P(k)は入力信号のパワーの大きさに依存した正規化係数、*は複素共役を表す。
反響消去装置90は、Nサンプル分の離散時間が経過した時点で、周波数領域変換部10の処理に戻り、入力信号x(n)および、収音信号y(n)を取得し直し、処理を繰り返す。
C. Breining et al., "Acoustic echo control. An application of very-high-order adaptive filters", in IEEE Signal Processing Magazine, vol. 16, no. 4, pp. 42-69, Jul 1999.
多くの反響消去方法は、音声通話用に考案されており、円滑な通話を実現するために、反響消去にかかる処理遅延の低減が要求される。このため、収音信号の少数のサンプルに対して、逐次エコー推定値を推定し、反響消去信号を出力する必要がある。多くの場合、スピーカとマイクロホンの間の音響伝達経路のインパルス応答をまず推定し、それにスピーカ3への入力信号x(n)を適用することで、エコー推定値の推定が実現される。インパルス応答は、数10〜数100msの長さを有し、これらのサンプル値の全ての推定を、逐次与えられる収音信号の少数のサンプルと、スピーカ3への入力信号のサンプルを参照して、実行することになる。このため、未知数の数(インパルス応答のサンプルの数)が、満足すべき方程式の数(収音信号のサンプル数)を上回る、解が不定な連立方程式を逐次解いていくことにより、インパルス応答の各サンプルが推定されることになる。このため、従来の反響消去方法では、実際に十分に反響信号が消去されるまでに、一定の時間を要する。図1に挙げた処理においても、各周波数番号kにおける周波数領域の音響伝達経路の伝達特性の推定値H(k)が適切に推定され、反響(エコー)が十分消去されるためには、一定時間の信号の入力を要する。
本発明は、与えられた収音信号のサンプル系列に対し、即座に、反響が従来よりも適切に消去された反響消去信号の系列を生成し得る反響消去装置、その方法及びプログラムを提供することを目的とする。
上記の課題を解決するために、本発明の一態様によれば、反響消去装置は、想定されるインパルス応答の実効長のサンプルの数よりも反響消去処理の処理単位とするサンプルの数Nが大きいものとし、Nサンプル毎に、時間領域の入力信号xを周波数領域の入力信号Xに変換する第一周波数領域変換部と、繰り返し回数の番号を示すインデックスをpとし、入力信号Xと周波数領域の音響伝達経路の伝達特性の推定値Hpとを用いて、周波数領域のエコー推定値Y^pを求めるエコー推定部と、エコー推定値Y^pを時間領域のエコー推定値y^pに変換する時間領域変換部と、時間領域の収音信号yとエコー推定値y^pとの差分である時間領域の残差信号epを求める減算部と、時間領域の残差信号epを周波数領域の残差信号Epに変換する第二周波数領域変換部と、入力信号Xと残差信号Epとを用いて、推定値Hpを更新し、更新後の推定値Hp+1を得る伝達経路特性更新部と、入力信号Xと収音信号yとを用いて、更新後の推定値Hp+1が収束するまでエコー推定部と時間領域変換部と減算部と第二周波数領域変換部と伝達経路特性更新部とにおける処理を繰り返すように制御する制御部とを含む。
上記の課題を解決するために、本発明の他の態様によれば、反響消去方法は、想定されるインパルス応答の実効長のサンプルの数よりも反響消去処理の処理単位とするサンプルの数Nが大きいものとし、Nサンプル毎に、時間領域の入力信号xを周波数領域の入力信号Xに変換する第一周波数領域変換ステップと、繰り返し回数の番号を示すインデックスをpとし、入力信号Xと周波数領域の音響伝達経路の伝達特性の推定値Hpとを用いて、周波数領域のエコー推定値Y^pを求めるエコー推定ステップと、エコー推定値Y^pを時間領域のエコー推定値y^pに変換する時間領域変換ステップと、時間領域の収音信号yとエコー推定値y^pとの差分である時間領域の残差信号epを求める減算ステップと、時間領域の残差信号epを周波数領域の残差信号Epに変換する第二周波数領域変換ステップと、入力信号Xと残差信号Epとを用いて、推定値Hpを更新し、更新後の推定値Hp+1を得る伝達経路特性更新ステップとを含み、入力信号Xと収音信号yとを用いて、更新後の推定値Hp+1が収束するまでエコー推定ステップと時間領域変換ステップと減算ステップと第二周波数領域変換ステップと伝達経路特性更新ステップとにおける処理を繰り返す。
本発明によれば、与えられた収音信号のサンプル系列に対し、即座に、反響が従来よりも適切に消去された反響消去信号の系列を生成し得るという効果を奏する。
従来技術に係る反響消去装置の機能ブロック図。 第一実施形態に係る反響消去装置の機能ブロック図。 第一実施形態に係る反響消去装置の処理フローの例を示す図。 第一実施形態に係る伝達経路特性更新部の処理例を説明するための図。 第一実施形態の変形例に係る伝達経路特性更新部の処理例を説明するための図。
以下、本発明の実施形態について、説明する。なお、以下の説明に用いる図面では、同じ機能を持つ構成部や同じ処理を行うステップには同一の符号を記し、重複説明を省略する。以下の説明において、テキスト中で使用する記号「^」等は、本来直前の文字の真上に記載されるべきものであるが、テキスト記法の制限により、当該文字の直後に記載する。式中においてはこれらの記号は本来の位置に記述している。また、ベクトルや行列の各要素単位で行われる処理は、特に断りが無い限り、そのベクトルやその行列の全ての要素に対して適用されるものとする。
<第一実施形態のポイント>
本実施形態における反響消去方法は、未知数の数(インパルス応答のサンプルの数L)よりも、満足すべき方程式の数(収音信号のサンプル数N)が大きいものとする。つまり、本実施形態では、反響消去信号の出力の遅延に若干ながらの猶予が与えられた場合を考える。例えば、音声通話用途ではなく、音声認識システムにおいて、話者に音声の発話を促すガイダンス音声や報知音などをスピーカから再生した場合に、音声収録用に回り込む反響(エコー)を消去し、発話者の音声のみを、音声認識システムに与えることを想定する。この場合、音声通話用途と比較し、僅かながら、反響消去信号を出力するまでの遅延時間の増加が許容される利用例もある。本実施形態では、このように、音声通話用途と比較して、出力の遅延に若干ながらの猶予が与えられた場合を考える。すなわち、図1の従来技術において、音声通話用では、1回の処理単位で扱う収音信号のサンプル数Nが、例えば、10ms程度に相当するのに対し、ここでは、100msあるいは数100ms程度の長さで設定し得る場合を想定する。この場合においても、図1の従来技術は適用できるが、そのまま適用した場合には、一定時間の間、反響が十分に消去されないという問題は依然として生じる。これは、音声通話用途の場合、未知数の数(インパルス応答のサンプルの数L)が、満足すべき方程式の数(収音信号のサンプル数N)を上回り、L>Nの劣決定な連立方程式を解く問題であり、伝達特性の推定値を一意に決定できない状況に問題がある。一方、本実施形態では、L<Nの優決定な連立方程式を解く問題に変わっており、例えば、最小二乗法により、伝達特性の推定値を一意に決定することができる。しかしながら、図1の従来技術で得られる伝達特性の推定値は最小二乗法の解とはなっていない。このため、一定時間の間、反響が十分に消去されない問題が依然として残る。実際に最小二乗法を適用するには、入力信号についての相関行列の逆行列を解く必要があるが、非常に高次元の行列の逆行列を数値的に安定に解くのは、非常に困難である。このため、本実施形態では、逆行列を直接解かずに、伝達特性の推定値を、再帰的に最小二乗解へと近づける方法で実現する。
従来の反響消去方法の多くは、音声通話に適用するため、出力信号(反響消去信号)の遅延時間を小さくする要件のもと、解がその時点で一意に定まらない劣決定な連立方程式を解くことで、スピーカとマイクロホンの間の音響伝達経路の伝達特性を推定していた。このため、伝達特性の推定に一定の時間を要し、処理の開始当初や伝達特性が変動した直後において、反響が十分に消去できない時間区間が生じた。本実施形態では、未知数の数(インパルス応答のサンプルの数L)よりも、満足すべき方程式の数(収音信号のサンプル数N)を大きくとれる用途(例えば、音声通話以外の音声認識システムなど出力信号の遅延時間に関する要件が緩和された用途)に、反響消去方法を適用する場合に、音響伝達経路の伝達特性の推定が、解をその都度一意に決定できる優決定の連立方程式を解く問題として扱えることに着目した。しかしながら、要件が変わったとはいえ、従来の反響消去方法をそのまま適用するだけでは、優決定の連立方程式を解くことにならず、依然として、反響の消去が不十分となることがあるため、優決定の連立方程式の最小二乗解を求める新たな方法を考案した。この方法では、最小二乗法において通常必要となる入力信号についての非常に高次元な相関行列の逆行列を直接計算することの数値的な不安定性を避けるために、従来、劣決定の連立方程式を解く場合には意味を持たなかった、同一の入力信号と収音信号のサンプルを用いた再帰的な残差信号の評価処理を加えた。これにより、優決定の要件においては、新たに加えた再帰的な残差信号の評価が、最小二乗法における逆行列計算を直接的に解くことに対する数値的に安定な代用の役割を果たし、より正確な音響伝達経路の伝達特性の推定を可能とした。
<反響消去装置100>
図2は第一実施形態に係る反響消去装置100の機能ブロック図を、図3はその処理フローを示す。
反響消去装置100は、周波数領域変換部110とエコー推定部120と時間領域変換部130と減算部140と周波数領域変換部150と伝達経路特性更新部160と制御部170とを含む。
反響消去装置100は、受話端2を介して入力される入力信号x(n)と、マイクロホン4を介して収音された収音信号y(n)とを入力とする。スピーカ3とマイクロホン4とは同一空間に配備される。入力信号x(n)は、スピーカ3で再生され、その再生音がマイクロホン4に回り込むため、マイクロホン4により収音された収音信号y(n)に反響(エコー)が混入する。反響消去装置100は、収音信号y(n)から反響(エコー)の推定値を取り除き、反響消去信号(誤差信号eP(n))を求め、送話端5に出力する。なお、受話端2、送話端5は、例えば、音声認識を行いながら発話を行い、利用者との対話を実現する対話システム等に接続される。
以下、各部の処理内容を説明する。
<周波数領域変換部110>
周波数領域変換部110は、入力信号x(n)を入力とし、入力信号x(n)をNサンプル取得する毎に、N+L-1サンプル過去から、現時刻nまでのスピーカ3への入力信号x(n-N-L+1),x(n-N-L+2),…,x(n)を取得し、(L+N)個の時間領域の入力信号x(n-N-L+1),x(n-N-L+2),…,x(n)を周波数領域の入力信号X(0),X(1),…,X(N+L-1)に変換し(S110)、エコー推定部120と伝達経路特性更新部160とに出力する。例えば、離散フーリエ変換により周波数領域の信号に変換する。なお、想定されるインパルス応答のサンプルの数をLとし、NはLより大きい整数の何れかとする。k=0,1,…,N+L-1とし、X(0),X(1),…,X(N+L-1)をX(k)とも表現する。過去の入力信号x(n-N-L+1),x(n-N-L+2),…,x(n-1)は図示しない記憶部に格納しておき、Nサンプル取得する毎に記憶部から取得すればよい。なお、他のデータ(取得した信号や計算により求めた信号等)に関しても必要に応じて図示しない記憶部に格納しておき、取得する構成とすればよい。
<エコー推定部120>
エコー推定部120は、入力信号X(k)と音響伝達経路の伝達特性の推定値Hp(k)とを入力とし、これらの値を用いて、周波数領域のエコー推定値Y^p(k)を求め(S120)、時間領域変換部130に出力する。例えば、次式によりエコー推定値Y^p(k)を求める。
Y^p(k)=Hp(k)X(k) (11)
なお、前述の通り、本実施形態では、同一の入力信号と収音信号のサンプルを用いた再帰的な残差信号の評価処理を加える。pは、再帰的な評価処理を行う際の繰り返し回数の番号を示すインデックスであり、p=1,2,…,Pとする。
<時間領域変換部130>
時間領域変換部130は、周波数領域のエコー推定値Y^p(k)を入力とし、周波数領域のエコー推定値Y^p(0),Y^p(1),…,Y^p(N+L-1)を時間領域のエコー推定値y^p(n-N-L+1),y^p(n-N-L+2),…,y^p(n)に変換し(S130)、減算部140に出力する。例えば、最後Nサンプル分のエコー推定値y^p(n-N+1),y^p(n-N+2),…,y^p(n)を抜きだし、減算部140に出力してもよい。時間領域変換部130は、周波数領域変換部110の変換方式の逆変換に対応する変換方式により、周波数領域のエコー推定値を時間領域のエコー推定値に変換すればよい。例えば、逆離散フーリエ変換により時間領域の信号に変換する。
<減算部140>
減算部140は、エコー推定値y^p(n-N-L+1),y^p(n-N-L+2),…,y^p(n)と収音信号y(n)とを入力とする。エコー推定値y^p(n-N-L+1),y^p(n-N-L+2),…,y^p(n)のうちの最後Nサンプル分のエコー推定値y^p(n-N+1),y^p(n-N+2),…,y^p(n)と、N-1サンプル過去から現時刻nまでの収音信号y(n-N+1),y(n-N+2),…,y(n)との差分である残差信号ep(n-N+1),ep(n-N+2),…,ep(n)を求め(S140)、周波数領域変換部150に出力する。例えば、ep(i)=y(i)-y^p(i)(i=n-N+1,n-N+2,…,n)である。なお、p=Pの場合には反響消去信号として残差信号ep(n-N+1),ep(n-N+2),…,ep(n)を送話端5にも出力する。
<周波数領域変換部150>
周波数領域変換部150は、時間領域の残差信号ep(n-N+1),ep(n-N+2),…,ep(n)を入力とし、これらの値を周波数領域の残差信号Ep(0),Ep(1),…,Ep(N+L-1)に変換し(S150)、伝達経路特性更新部160に出力する。周波数領域変換部150は、周波数領域変換部110の変換方式と同様の変換方式により、時間領域の残差信号を周波数領域の残差信号に変換すればよい。例えば、残差信号ep(n-N+1),ep(n-N+2),…,ep(n)の系列の前に、L点の零系列を加え、離散フーリエ変換により、N+L点の周波数領域の残差信号Ep(k)を得る。
<伝達経路特性更新部160>
伝達経路特性更新部160は、入力信号X(0),X(1),…,X(N+L-1)と残差信号Ep(0),Ep(1),…,Ep(N+L-1)とを入力とし、これらの値を用いて、推定値Hp(k)を更新し(S160)、更新後の推定値Hp+1(k)をエコー推定部120に出力する。例えば、推定値Hp(k)は次式により更新する。
Figure 2018078490
ただし、μkは更新量を調整するステップサイズであり、P(k)は入力信号のパワーの大きさに依存した正規化係数、*は複素共役を表す。なお、周波数領域の推定値Hp+1(k)を得る際、推定値Hp+1(k)を時間領域に変換した推定値hp+1(0),hp+1(1),…,hp+1(N+L-1)が、前半のサンプル以外の要素において零となるように、音響伝達経路の伝達特性の更新において、時間領域における拘束をかけてもよい。例えば、(i)更新後の推定値Hp+1(k)を直接時間領域に変換し、前半のサンプル以外の要素を零に置換え、再度周波数領域の信号に変換してもよいし、(ii)式(12)の右辺第2項の更新項部分のみを時間領域に変換し、前半のサンプル以外の要素を零に置換え、再度周波数領域の信号に変換した後、式(12)により更新してもよい。図4Aに示す後半のサンプルに生じるノイズを零に置換えることで消去し(図4B参照)、より安定した伝達特性の推定を可能とする。
<制御部170>
制御部170は、所定の条件を満たすまでエコー推定部120と時間領域変換部130と減算部140と周波数領域変換部150と伝達経路特性更新部160とにおける処理S120,S130,S140,S150,S160を繰り返すように制御する(S170)。なお、エコー推定部120と伝達経路特性更新部160とにおける処理S120,S160では繰り返し回数pに関わらず入力信号X(0),X(1),…,X(N+L-1)を用い、減算部140における処理S140では繰り返し回数pに関わらず収音信号y(n),y(n-1),…,y(n-N+1)を用いる。
所定の条件とは、推定値Hp+1(k)が収束したか否かを調べることができる条件であればよい。例えば、(i)所定の回数、処理を繰り返したか否か(所定の回数以上処理を繰り返したのであれば、推定値Hp+1(k)は収束していると想定する)、(ii)所定の時間、処理を繰り返したか否か(所定の時間以上処理を繰り返したのであれば、推定値Hp+1(k)は収束していると想定する)、(iii)推定値Hp+1(k)と推定値Hp(k)との差分が所定の閾値よりも小さいか否かを判定することで、収束したか否かを調べることができる。例えば、(i)所定の回数、処理を繰り返した場合、(ii)所定の時間、処理を繰り返した場合、(iii)推定値Hp+1(k)と推定値Hp(k)との差分が所定の閾値よりも小さい場合に、推定値Hp+1(k)が収束したと判定する。
(i)の場合、制御部170は、処理S120,S130,S140,S150,S160の処理回数pをカウントしておき、所定の回数Pを超えるまで、上述の処理を繰り返すように各部に制御信号を送信する。
(ii)の場合、制御部170は、最初の処理(例えばエコー推定処理S120)を行ってからの経過時間を計測しておき、所定の時間(例えばNサンプル分の離散時間)が経過するまで、上述の処理を繰り返すように各部に制御信号を送信する。
(iii)の場合、制御部170は、推定値Hp+1(k)と推定値Hp(k)とを取得し、その差分が所定の閾値よりも大きいか否かを判定し、大きい場合には、上述の処理を繰り返すように各部に制御信号を送信する。
なお、これらの条件を組合せてもよい。例えば、条件(i)所定の回数、処理を繰り返した場合、または、条件(iii)推定値Hp+1(k)と推定値Hp(k)との差分が所定の閾値よりも小さい場合に、推定値Hp+1(k)が収束したと判定する。
制御部170は、減算部140が、条件を満たすまでは残差信号ep(n-N+1),ep(n-N+2),…,ep(n)を周波数領域変換部150のみに出力し、条件を満たしたときは周波数領域変換部150及び送話端5に出力するように制御する。本実施形態では、条件(i)のみを適用した例を示している。そのため、p=1,2,…,Pとし、p=1,2,…,P-1の場合には残差信号eP(n-N+1),eP(n-N+2),…,eP(n)を周波数領域変換部150のみに出力し、p=Pの場合には周波数領域変換部150及び送話端5に出力する。
反響消去装置100は、Nサンプル分の離散時間が経過した時点で、処理S110に戻り、入力信号x(n)および、収音信号y(n)を取得し直し、処理S110〜S170を繰り返す。なお、Nサンプル分の離散時間が経過する毎に、推定値Hp(k)の初期値H1(k)の値として、過去の推定値(例えば1フレーム前において最後に得られる推定値HP(k))をそのまま継承して用いてもよいし、零にリセットしてもよい。
図1の従来技術との違いは、処理S170が加わり、同一の入力信号と収音信号に対して、更新された周波数領域の伝達特性の推定値Hp(k)を再度適用して、残差を評価し、再帰的に更新を繰り返すようにした点である。この繰り返しにより、入力信号の相関行列の逆行列演算を行うことなく、伝達特性の推定値Hp(k)を最小二乗解に近づけることができる。このため、本実施形態により、L<Nの場合において、処理の開始直後から、十分に反響が消去された信号を出力することができる。
<効果>
以上の構成により、スピーカ3とマイクロホン4の間の伝達特性の想定されるインパルス応答のサンプル数Lよりも多くのサンプル数Nの収音信号を1つの処理単位として反響消去を行う反響消去方法において、入力信号についての相関行列の逆行列を直接的に計算することなく、伝達特性の最小二乗解を近似的に得ることができる。これにより、伝達特性の推定に、一定時間の信号の入力を要する必要がなく、処理の開始直後から、十分に反響が消去された信号を出力することができる。なお、本実施形態では、周波数領域でエコーの推定(S120)や伝達特性の推定(S160)を行っているが、これらの処理を時間領域で行ってもよい。ただし、この場合、計算量が増える。また、この場合には周波数領域変換部110、時間領域変換部130、周波数領域変換部150を削除してもよい。また、スピーカへの入力信号や、マイクロホンからの収音信号が多チャネルの場合における反響消去においても、本発明を適用することが可能であり、同様の効果を得ることができる。
<変形例>
音響伝達経路のインパルス応答長が実効的にNより短いとみなせるならば、L>Nの場合においても、本発明を適用し、効果を得ることができる。すなわち、音の再生や収音の段階において、信号のバッファ処理等に起因して、入力信号x(n)が実際にスピーカ3から再生されるまでに遅延が生じたり、マイクロホン4で収音された収音信号y(n)が実際に反響消去処理のために取得されるまでに遅延が生じる場合などにおいて、この遅延を予め知ることができないときは、その遅延時間も含めて、Lの値を大きく設定し、Nより大きくせざるを得ない場合がある。その場合においても、本発明は適用可能である。以下、適用方法について、第一実施形態と異なる部分を中心に説明する。
<伝達経路特性更新部160>
伝達経路特性更新部160は、入力信号X(0),X(1),…,X(N+L-1)と残差信号Ep(0),Ep(1),…,Ep(N+L-1)とを入力とし、これらの値を用いて、推定値Hp(k)を更新する際(S160)、更新後の推定値H'p+1(k)が、時間領域において,音響伝達経路のインパルス応答の実効長L'個のサンプルのみ非零の値を取り得るように拘束をかける。例えば、一旦、更新後の推定値H'p+1(k)を時間領域の推定値h'p+1(0),h'p+1(1),…,h'p+1(N+L-1)に変換し、前半Lサンプルの中で、最大のピーク値を含む区間を音響伝達経路のインパルス応答の実効長L'の長さで切り出す。つまり、時間領域の推定値h'p+1(0),h'p+1(1),…,h'p+1(N+L-1)の最大のピーク値を検出し、そのピーク値のサンプル値から、または、そのピーク値から数サンプル前のサンプル値から、L'サンプル分のサンプル値を切り出す。切り出した区間以外の要素を零に置換えてから、置換え後の時間領域の推定値hp+1(0),hp+1(1),…,hp+1(N+L-1)を再度、周波数領域の推定値Hp+1(k)に変換することで、音響伝達経路の伝達特性に時間領域における拘束をかける。なお、L>N>L'を満たすようにNを設定する。本変形例では、実質的にL'<Nの優決定な連立方程式を解く問題に変わっており、第一実施形態の場合と同様、伝達特性の推定値を再帰的に最小二乗解へと近づけることができる。また、図5Aに示す前半Lサンプルの中で、最大のピーク値を含む区間以外に生じるノイズを零に置換えることで消去し(図5B参照)、より安定した伝達特性の推定を可能とする。なお、このような前半Lサンプルの有効範囲を狭めることになる時間領域における拘束は、S120〜S160の繰り返しの初期段階では適用しない方が、伝達特性の変動に対して柔軟に対応できる。例えば、S120〜S160の繰り返しを10回行うとした場合(P=10)、最初の5回は、前半Lサンプルの有効範囲を狭める拘束は行わず、繰り返しの後半5回において、推定された音響伝達経路のインパルス応答が最大のピーク値を取る区間を特定し、その区間以外を零とする拘束を適用するように実装することができる。
<効果>
このような構成とすることで、L>Nの場合にも第一実施形態と同様の効果を得ることができる。
<その他の変形例>
本発明は上記の実施形態及び変形例に限定されるものではない。例えば、上述の各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。その他、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。
<プログラム及び記録媒体>
また、上記の実施形態及び変形例で説明した各装置における各種の処理機能をコンピュータによって実現してもよい。その場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記各装置における各種の処理機能がコンピュータ上で実現される。
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。
また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD−ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させてもよい。
このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶部に格納する。そして、処理の実行時、このコンピュータは、自己の記憶部に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実施形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよい。さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。なお、プログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの(コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等)を含むものとする。
また、コンピュータ上で所定のプログラムを実行させることにより、各装置を構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。

Claims (5)

  1. 想定されるインパルス応答の実効長のサンプルの数よりも反響消去処理の処理単位とするサンプルの数Nが大きいものとし、Nサンプル毎に、時間領域の入力信号xを周波数領域の入力信号Xに変換する第一周波数領域変換部と、
    繰り返し回数の番号を示すインデックスをpとし、前記入力信号Xと周波数領域の音響伝達経路の伝達特性の推定値Hpとを用いて、周波数領域のエコー推定値Y^pを求めるエコー推定部と、
    前記エコー推定値Y^pを時間領域のエコー推定値y^pに変換する時間領域変換部と、
    時間領域の収音信号yとエコー推定値y^pとの差分である時間領域の残差信号epを求める減算部と、
    時間領域の前記残差信号epを周波数領域の残差信号Epに変換する第二周波数領域変換部と、
    前記入力信号Xと前記残差信号Epとを用いて、前記推定値Hpを更新し、更新後の推定値Hp+1を得る伝達経路特性更新部と、
    前記入力信号Xと前記収音信号yとを用いて、前記更新後の推定値Hp+1が収束するまで前記エコー推定部と前記時間領域変換部と前記減算部と前記第二周波数領域変換部と前記伝達経路特性更新部とにおける処理を繰り返すように制御する制御部とを含む、
    反響消去装置。
  2. 請求項1の反響消去装置であって、
    想定される遅延及びインパルス応答の実効長を含むサンプルの数をLとし、NをLより大きい整数の何れかとし、前記第一周波数領域変換部は、Nサンプル毎に、(L+N)個の時間領域の入力信号x(n-N-L+1),(n-N-L+2),…,x(n)を周波数領域の入力信号X(0),X(1),…,X(N+L-1)に変換し、
    前記エコー推定部は、前記入力信号X(0),X(1),…,X(N+L-1)と音響伝達経路の伝達特性の推定値Hp(0),Hp(1),…,Hp(N+L-1)とを用いて、周波数領域のエコー推定値Y^p(0),Y^p(1),…,Y^p(N+L-1)を求め、
    前記時間領域変換部は、前記エコー推定値Y^p(0),Y^p(1),…,Y^p(N+L-1)を時間領域のエコー推定値y^p(n-N-L+1),y^p(n-N-L+2),…,y^p(n)に変換し、
    前記減算部は、時間領域の収音信号y(n-N+1),y(n-N+2),…,y(n)とエコー推定値y^p(n-N+1),y^p(n-N+2),…,y^p(n)との差分である残差信号ep(n-N+1),ep(n-N+2),…,ep(n)を求め、
    前記第二周波数領域変換部は、時間領域の前記残差信号ep(n-N+1),ep(n-N+2),…,ep(n)を周波数領域の残差信号Ep(0),Ep(1),…,Ep(N+L-1)に変換し、
    前記伝達経路特性更新部は、前記入力信号X(0),X(1),…,X(N+L-1)と前記残差信号Ep(0),Ep(1),…,Ep(N+L-1)とを用いて、前記推定値Hp(0),Hp(1),…,Hp(N+L-1)を更新し、更新後の推定値H'p+1(0),H'p+1(1),…,H'p+1(N+L-1)を得、
    前記制御部は、前記入力信号X(0),X(1),…,X(N+L-1)と前記収音信号y(n),y(n-1),…,y(n-N+1)とを用いて、前記更新後の推定値Hp+1(0),Hp+1(1),…,Hp+1(N+L-1)が収束するまで前記エコー推定部と前記時間領域変換部と前記減算部と前記第二周波数領域変換部と前記伝達経路特性更新部とにおける処理を繰り返すように制御する、
    反響消去装置。
  3. 請求項1の反響消去装置であって、
    想定される遅延及びインパルス応答の実効長を含むサンプルの数をLとし、インパルス応答の実効長のサンプルの数をL'とし、NをL'より大きく、Lより小さい整数の何れかとし、前記第一周波数領域変換部は、Nサンプル毎に、(L+N)個の時間領域の入力信号x(n-N-L+1),(n-N-L+2),…,x(n)を周波数領域の入力信号X(0),X(1),…,X(N+L-1)に変換し、
    前記エコー推定部は、前記入力信号X(0),X(1),…,X(N+L-1)と音響伝達経路の伝達特性の推定値Hp(0),Hp(1),…,Hp(N+L-1)とを用いて、周波数領域のエコー推定値Y^p(0),Y^p(1),…,Y^p(N+L-1)を求め、
    前記時間領域変換部は、前記エコー推定値Y^p(0),Y^p(1),…,Y^p(N+L-1)を時間領域のエコー推定値y^p(n-N-L+1),y^p(n-N-L+2),…,y^p(n)に変換し、
    前記減算部は、時間領域の収音信号y(n-N+1),y(n-N+2),…,y(n)とエコー推定値y^p(n-N+1),y^p(n-N+2),…,y^p(n)との差分である残差信号ep(n-N+1),ep(n-N+2),…,ep(n)を求め、
    前記第二周波数領域変換部は、時間領域の前記残差信号ep(n-N+1),ep(n-N+2),…,ep(n)を周波数領域の残差信号Ep(0),Ep(1),…,Ep(N+L-1)に変換し、
    前記伝達経路特性更新部は、前記入力信号X(0),X(1),…,X(N+L-1)と前記残差信号Ep(0),Ep(1),…,Ep(N+L-1)とを用いて、前記推定値Hp(0),Hp(1),…,Hp(N+L-1)の更新の際、更新後の推定値Hp+1(0),Hp+1(1),…,Hp+1(N+L-1)を時間領域の推定値hp+1(n-N-L+1),hp+1(n-N-L+2),…,hp+1(n)に変換したとき、前記変換後の推定値hp+1(n-N-L+1),hp+1(n-N-L+2),…,hp+1(n)が、ピーク値を含むL'サンプル分の区間以外の区間で値が零となるよう前記更新後の推定値Hp+1(0),Hp+1(1),…,Hp+1(N+L-1)の算出に拘束を与え、
    前記制御部は、前記入力信号X(0),X(1),…,X(N+L-1)と前記収音信号y(n),y(n-1),…,y(n-N+1)とを用いて、推定値H'p+1(0),H'p+1(1),…,H'p+1(N+L-1)が収束するまで前記エコー推定部と前記時間領域変換部と前記減算部と前記第二周波数領域変換部と前記伝達経路特性更新部とにおける処理を繰り返すように制御する、
    反響消去装置。
  4. 想定されるインパルス応答の実効長のサンプルの数よりも反響消去処理の処理単位とするサンプルの数Nが大きいものとし、Nサンプル毎に、時間領域の入力信号xを周波数領域の入力信号Xに変換する第一周波数領域変換ステップと、
    繰り返し回数の番号を示すインデックスをpとし、前記入力信号Xと周波数領域の音響伝達経路の伝達特性の推定値Hpとを用いて、周波数領域のエコー推定値Y^pを求めるエコー推定ステップと、
    前記エコー推定値Y^pを時間領域のエコー推定値y^pに変換する時間領域変換ステップと、
    時間領域の収音信号yとエコー推定値y^pとの差分である時間領域の残差信号epを求める減算ステップと、
    時間領域の前記残差信号epを周波数領域の残差信号Epに変換する第二周波数領域変換ステップと、
    前記入力信号Xと前記残差信号Epとを用いて、前記推定値Hpを更新し、更新後の推定値Hp+1を得る伝達経路特性更新ステップとを含み、
    前記入力信号Xと前記収音信号yとを用いて、前記更新後の推定値Hp+1が収束するまで前記エコー推定ステップと前記時間領域変換ステップと前記減算ステップと前記第二周波数領域変換ステップと前記伝達経路特性更新ステップとにおける処理を繰り返す、
    反響消去方法。
  5. 請求項1から請求項3の何れかの反響消去装置として、コンピュータを機能させるためのプログラム。
JP2016219916A 2016-11-10 2016-11-10 反響消去装置、その方法及びプログラム Active JP6502307B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016219916A JP6502307B2 (ja) 2016-11-10 2016-11-10 反響消去装置、その方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016219916A JP6502307B2 (ja) 2016-11-10 2016-11-10 反響消去装置、その方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2018078490A true JP2018078490A (ja) 2018-05-17
JP6502307B2 JP6502307B2 (ja) 2019-04-17

Family

ID=62151022

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016219916A Active JP6502307B2 (ja) 2016-11-10 2016-11-10 反響消去装置、その方法及びプログラム

Country Status (1)

Country Link
JP (1) JP6502307B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110865574A (zh) * 2019-11-19 2020-03-06 万翼科技有限公司 一种设备控制方法及相关装置
CN111785289A (zh) * 2019-07-31 2020-10-16 北京京东尚科信息技术有限公司 残留回声消除方法和装置
CN114566176A (zh) * 2022-02-23 2022-05-31 苏州蛙声科技有限公司 基于深度神经网络的残余回声消除方法及系统
CN114566176B (en) * 2022-02-23 2024-07-09 宁波蛙声科技有限公司 Residual echo cancellation method and system based on deep neural network

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH098709A (ja) * 1995-04-20 1997-01-10 Nippon Telegr & Teleph Corp <Ntt> サブバンド反響消去方法
JP2002503910A (ja) * 1998-02-13 2002-02-05 テレフオンアクチーボラゲット エル エム エリクソン(パブル) 雑音環境におけるフィルタ適応化の制御方法および装置
JP2003188776A (ja) * 2001-12-21 2003-07-04 Nippon Telegr & Teleph Corp <Ntt> 音響エコー消去方法、装置及び音響エコー消去プログラム
JP2010288174A (ja) * 2009-06-15 2010-12-24 Nippon Telegr & Teleph Corp <Ntt> 周波数領域エコー除去装置、周波数領域エコー除去方法、プログラム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH098709A (ja) * 1995-04-20 1997-01-10 Nippon Telegr & Teleph Corp <Ntt> サブバンド反響消去方法
JP2002503910A (ja) * 1998-02-13 2002-02-05 テレフオンアクチーボラゲット エル エム エリクソン(パブル) 雑音環境におけるフィルタ適応化の制御方法および装置
JP2003188776A (ja) * 2001-12-21 2003-07-04 Nippon Telegr & Teleph Corp <Ntt> 音響エコー消去方法、装置及び音響エコー消去プログラム
JP2010288174A (ja) * 2009-06-15 2010-12-24 Nippon Telegr & Teleph Corp <Ntt> 周波数領域エコー除去装置、周波数領域エコー除去方法、プログラム

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111785289A (zh) * 2019-07-31 2020-10-16 北京京东尚科信息技术有限公司 残留回声消除方法和装置
CN111785289B (zh) * 2019-07-31 2023-12-05 北京京东尚科信息技术有限公司 残留回声消除方法和装置
CN110865574A (zh) * 2019-11-19 2020-03-06 万翼科技有限公司 一种设备控制方法及相关装置
CN114566176A (zh) * 2022-02-23 2022-05-31 苏州蛙声科技有限公司 基于深度神经网络的残余回声消除方法及系统
CN114566176B (en) * 2022-02-23 2024-07-09 宁波蛙声科技有限公司 Residual echo cancellation method and system based on deep neural network

Also Published As

Publication number Publication date
JP6502307B2 (ja) 2019-04-17

Similar Documents

Publication Publication Date Title
JP5391103B2 (ja) 多チャネルエコー消去方法、多チャネルエコー消去装置、多チャネルエコー消去プログラム及びその記録媒体
JP2002189476A (ja) 独立成分分析を用いた能動騒音除去方法
JP5016581B2 (ja) エコー抑圧装置、エコー抑圧方法、エコー抑圧プログラム、記録媒体
JP6502307B2 (ja) 反響消去装置、その方法及びプログラム
JP5161157B2 (ja) 周波数領域エコー除去装置、周波数領域エコー除去方法、プログラム
JP5469564B2 (ja) 多チャネルエコー消去方法、多チャネルエコー消去装置及びそのプログラム
JP5524316B2 (ja) パラメータ推定装置、エコー消去装置、パラメータ推定方法、及びプログラム
JP6537997B2 (ja) エコー抑圧装置、その方法、プログラム、及び記録媒体
JP5438629B2 (ja) ステレオ反響消去方法、ステレオ反響消去装置、ステレオ反響消去プログラム
JP5583181B2 (ja) 縦続接続型伝達系パラメータ推定方法、縦続接続型伝達系パラメータ推定装置、プログラム
JP4559989B2 (ja) エコー抑圧方法、エコー抑圧プログラム、記録媒体
JP6343585B2 (ja) 未知伝達系推定装置、未知伝達系推定方法、およびプログラム
JP5925149B2 (ja) 音響結合量推定装置、エコー消去装置、その方法及びプログラム
JP4425114B2 (ja) 反響消去方法、反響消去装置、反響消去プログラム、及びこれを記録した記録媒体
JP5033109B2 (ja) 音響エコーキャンセラ装置とその方法と、プログラムと記録媒体
Cifani et al. A PEM-AFROW based algorithm for acoustic feedback control in automotive speech reinforcement systems
JP4094523B2 (ja) 反響消去装置、方法、及び反響消去プログラム、そのプログラムを記録した記録媒体
JP7235117B2 (ja) エコー消去装置、エコー消去方法、プログラム
JP6389805B2 (ja) 伝達系推定装置、その方法及びプログラム
JP5097148B2 (ja) 音響結合量算出装置とその方法と、プログラム
JPWO2006095861A1 (ja) 未知系構造推定装置およびその方法
JP2019220917A (ja) エコー消去装置、エコー消去方法、プログラム
JP6356087B2 (ja) エコー消去装置、その方法及びプログラム
JP5889233B2 (ja) 音響結合量推定装置、エコー消去装置、その方法及びプログラム
JPWO2022195955A5 (ja)

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180302

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190117

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190129

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190222

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190319

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190320

R150 Certificate of patent or registration of utility model

Ref document number: 6502307

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150