JP5421877B2 - エコー消去方法、エコー消去装置及びエコー消去プログラム - Google Patents

エコー消去方法、エコー消去装置及びエコー消去プログラム Download PDF

Info

Publication number
JP5421877B2
JP5421877B2 JP2010188246A JP2010188246A JP5421877B2 JP 5421877 B2 JP5421877 B2 JP 5421877B2 JP 2010188246 A JP2010188246 A JP 2010188246A JP 2010188246 A JP2010188246 A JP 2010188246A JP 5421877 B2 JP5421877 B2 JP 5421877B2
Authority
JP
Japan
Prior art keywords
signal
echo
received signal
collected sound
sampling period
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2010188246A
Other languages
English (en)
Other versions
JP2012049689A (ja
Inventor
翔一郎 齊藤
陽一 羽田
末廣 島内
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2010188246A priority Critical patent/JP5421877B2/ja
Publication of JP2012049689A publication Critical patent/JP2012049689A/ja
Application granted granted Critical
Publication of JP5421877B2 publication Critical patent/JP5421877B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Circuit For Audible Band Transducer (AREA)
  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)

Description

この発明は受話信号のサンプリング周期とは必ずしも一致しないサンプリング周期で収音される収音信号からエコー信号を消去するエコー消去方法、エコー消去装置に関する。
音声対話システムにおいて、スピーカで再生された音が受聴者側のマイクロホンによって収音され、発話者側のスピーカで再生された音をエコーと呼ぶ。このエコーが存在すると通話が困難になるため、音声対話システムにはこのエコーを消去するためのエコー消去装置が導入される。
図1は適応フィルタを用いた従来のエコー消去装置100の構成を示したものである。なお、以下、対応する構成には同様の符号を付す。このエコー消去装置100の動作は以下のようになっている。
受話端11から得られた受話信号x(n)は、D/A変換部12とエコー模擬部110に入力される。受話信号x(n)はD/A変換部12によってアナログ化され、x(t)となる。なお、nは離散サンプル番号を表し、tは連続時間値を表す。x(t)はスピーカ13によって再生され、再生された音はエコー経路31を通ってマイクロホン21で収音され、y(t)となる。y(t)はA/D変換部22によってデジタル化され、収音信号y(n)となる。
エコー模擬部110において、受話信号x(n)は、擬似エコー経路部111と適応フィルタ更新部112に入力される。擬似エコー経路部111では、適応フィルタh^(n)のタップ長L以上の受話信号x(n)を蓄積し、以下のように、受話信号x(n)とh^(n)を畳み込むことで擬似エコー信号y^(n)を得る。
y^(n)=h^(n)・x(n) (1)
但し、h^(n)=[h(n)(1),h(n)(2),…,h(n)(L)]
x(n)=[x(n),x(n−1),…,x(n−L+1)]
Tは転置を表し、h(n)(i)はサンプル番号nの時刻における適応フィルタのi番目のフィルタ係数を表す。
差信号生成部120は、以下のように収音信号y(n)から擬似エコー信号y^(n)を差し引き、送話信号e(n)を生成する。
e(n)=y(n)−y^(n) (2)
送話信号e(n)は、送話端23及び適応フィルタ更新部112に入力され、送話端23においてはD/A変換器を介し、スピーカ等により再生される。適応フィルタ更新部112は、非特許文献1に記載されているNLMSアルゴリズムを用いる場合、以下のように受話信号x(n)と送話信号e(n)とからh^(n)を更新し、擬似エコー経路部111に出力する。
Figure 0005421877
但し、μは更新量を制御するステップサイズ(0<μ<2)を表し、σは式(3)右辺第2項の分数の分母が0にならないようにするための微小な正の定数を表す。
この図1に示したエコー消去装置100は、受話信号x(n)と収音信号y(n)のサンプリング周期が完全に一致していることを前提としている。しかし、PDAなどエコー消去装置を動作させることを念頭に作られていないデバイスでは、スピーカとマイクロホンのシステムが別々に動作していて、受話信号x(n)と収音信号y(n)のサンプリング周期がわずかにずれることがある。サンプリング周期がずれた場合、受話信号x(n)と収音信号y(n)の関係が線形のエコー経路で表せなくなり、図1に示したエコー消去装置100では、エコーを十分に消去できないか、又は全くエコーを消去できないことになる。
この問題に関し、特許文献1には、受話信号のサンプリング周期とは必ずしも一致しないサンプリング周期で収音される収音信号からエコー信号を消去するエコー消去装置、エコー消去方法が記載されている。
図2はこの特許文献1に記載されているエコー消去装置200の構成を示したものである。エコー消去装置200は、m個(但し、mは4以上の整数)の評価用受話信号補間部201〜201と、m個の評価用エコー模擬部210〜210と、m個の評価用差信号生成部220〜220と、誤差評価部203と、伸縮係数計算部205と、送話用受話信号補間部261と、送話用エコー模擬部270と、送話用差信号生成部280とを有する。このエコー消去装置200の動作は以下のようになっている。
受話端11から得られた受話信号x(n)は、D/A変換部12、m個の評価用受話信号補間部201〜201及び送話用受話信号補間部261に入力される。受話信号x(n)はD/A変換部12によってアナログ化され、x(t)となる。x(t)はスピーカ13によって再生され、再生された音はエコー経路31を通ってマイクロホン21で収音され、y(t)となる。y(t)はA/D変換部22によってデジタル化され、収音信号y(n)となり、m個の評価用差信号生成部220〜220と送話用差信号生成部280に入力される。ここで、収音信号y(n)を複数の区間j(jは正の整数)に分割する。区間jの最初のサンプル番号をnと表す。サンプル番号nが区間jに属する場合には、n≦n≦nj+1−1と表される。
m個の評価用受話信号補間部201〜201は、対応する評価用伸縮係数αi,j(但し、iは正の整数であり、1≦i≦mとする)と受話信号x(n)が入力され、補間式を用いて受話信号x(n)のサンプリング周期をαi,j倍した場合に得られる評価用受話信号x’(n)を推定し、出力する。評価用受話信号x’(n)の補間式は例えば以下とされる。
x’(n)=(l−k+1){x(k)−x’(n−1)}+x(k−1) (4)
但し、lは、
=lxi,j+(n−ly,j)αi,j (5)
とする。なお、x’(0)は例えば、x’(0)=0とする。lxi,jは受話信号を伸縮させる際の基準となる受話信号のサンプル番号を表し、ly,jはlxi,jに対応する収音信号のサンプル番号を表す。また、kはこのlを下回らない最小の整数を表す。
Figure 0005421877
以上の補間処理を、m個の評価用受話信号補間部201〜201において行い、評価用受話信号x’(n)を出力する。なお、評価用受話信号補間部201〜201は、区間jからj+1へと移行する際、iに対応するlxi,jの値lx0,jを送話用受話信号補間部261へ出力する。なお、iは、区間jにおいて、予め定めた基準での誤差が最も小さいiの値を表す。また、新たに伸縮係数計算部205から得られるm個の評価用伸縮係数αi,j+1の伸縮の基準となる受話信号x(n)のサンプル番号は、前の区間jの最終サンプルy(nj+1−1)に対し、
Figure 0005421877
と置く。但し、αi0,jは、iに対応する評価用伸縮係数である。このようにすることによって、求めるべき評価用伸縮係数が1の場合、つまりサンプリング周期にズレがない場合でも問題なく動作する。
評価用エコー模擬部210〜210は、評価用受話信号x’(n)と誤差信号e(n)が入力され、評価用擬似エコー信号y^(n)を出力する。各評価用エコー模擬部210〜210は、図示していないが、図1に示したエコー模擬部110と同様、擬似エコー経路部111と適応フィルタ更新部112を有しており、それぞれ以下の処理を行う。擬似エコー経路部111は、評価用受話信号x’(n)が入力され、評価用擬似エコー信号y^(n)を出力する。例えば、擬似エコー経路部111では、適用フィルタh^(n)のタップ長L以上の評価用受話信号x’(n)を蓄積し、以下のように、評価用受話信号x’(n)とh^(n)を畳み込むことで擬似エコー信号y^(n)を得る。
y^(n)=h^ (n)・x’(n) (8)
但し、
h^(n)=[h (n)(1),h (n)(2),…,h (n)(L)]
x’(n)=[x’(n),x’(n−1),…,x’(n−L+1)]
適応フィルタ更新部112は、評価用受話信号x’(n)と誤差信号e(n)が入力され、適応フィルタを更新する。適応フィルタ更新部112は、非特許文献1に記載されているNLMSアルゴリズムを用いる場合、以下のように評価用受話信号x’(n)と誤差信号e(n)とからh^(n)を更新する。
Figure 0005421877
更新した適応フィルタをコピーし、擬似エコー経路部111に出力する。
評価用差信号生成部220〜220は、収音信号y(n)と対応する評価用擬似エコー信号y^(n)が入力され、y(n)とy^(n)の差である誤差信号e(n)を出力する。
(n)=y(n)−y^(n) (10)
誤差評価部203は、誤差信号e(n)が入力され、区間jにおいて、予め定めた基準での誤差が最も小さいiの値をiとして出力する。例えば、誤差評価部203は、区間jにおいて、各誤差信号e毎の平均二乗誤差e を算出し、最も平均二乗誤差の小さいiの値をiとして出力する。誤差評価部203に区間jの最終サンプルn=nj+1−1に対応する誤差信号が入力された場合に、以下のように区間jでの平均二乗誤差を算出する。
Figure 0005421877
伸縮係数計算部205は、iが入力され、iを用いて送話用伸縮係数α0,j+1を決定する。さらに、送話用伸縮係数α0,j+1を用いて新たな評価用伸縮係数αi,j+1を算出し、送話用伸縮係数α0,j+1を送話用受話信号補間部261へ、評価用伸縮係数αi,j+1を評価用受話信号補間部201〜201へ出力する。なお、区間j=1のときに、評価用受話信号補間部201〜201で用いる評価用伸縮係数αi,jの初期値αi,1には、伸縮係数の真値を含むように範囲[αmin,1,αmax,1]を設定し、評価伸縮係数の初期値αi,1のうち少なくとも一つが真値近傍の単峰性に近い挙動を示す範囲に含まれるように分割数(m−1)を設定してもよい。例えば、区間j=1の場合、評価用伸縮係数αi,1は、
Figure 0005421877
として計算して求め、評価用受話信号補間部201〜201へ出力する。区間j≧2の場合には、iに対応する評価用伸縮係数を送話用伸縮係数αi0,j(=α0,j)とし、区間j+1における伸縮係数の範囲[αmin,j+1,αmax,j+1]を以下のように式(13),(13)’または(13)’’によって求める。
αi0,j=αmin,jの場合、
αmin,j+1=αi0,j ,αmax,j+1=αi0+1,j (13)
αi0,j=αmax,jの場合、
αmin,j+1=αi0−1,j ,αmax,j+1=αi0,j (13)’
それ以外の場合、
αmin,j+1=αi0〜1,j ,αmax,j+1=αi0+1,j
(13)’’
更に、以下のように式(14)によって、新たな評価用伸縮係数αi,j+1を算出する。
Figure 0005421877
送話用受話信号補間部261は、受話信号x(n)と送話用伸縮係数α0,jが入力され、補間式を用いて受話信号x(n)のサンプリング周期をα0,j倍した場合に得られる送話用受話信号x’(n)を推定し、出力する。サンプルを補間する際の基準となるサンプル番号lx0,jについてはiに対応する評価用受話信号補間部201より入力されるlx0,j−1を用いる。送話用受話信号を出力する処理については以上の処理を除いて評価用受話信号補間部201と同一である。送話用受話信号x’(n)の推定は、例えば評価用受話信号補間部で用いた補間式(4)を用いて行う。
送話用エコー模擬部270は、送話用受話信号x’(n)と送話信号e(n)が入力され、送話用擬似エコー信号y^(n)を出力する。送話用エコー模擬部270は、図示していないが、評価用エコー模擬部210〜210と同様に、擬似エコー経路部111と適応フィルタ更新部112を有し、それぞれ以下の処理を行う。擬似エコー経路部111は、送話用受話信号x’(n)が入力され、送話用擬似エコー信号y^(n)を出力する。例えば、擬似エコー経路部111では、適用フィルタh^(n)のタップ長L以上の送話用受話信号x’(n)を蓄積し、式(8)により、送話用受話信号x’(n)とh^(n)を畳み込むことで擬似エコー信号y^(n)を得る。
適応フィルタ更新部112は、送話用受話信号x’(n)と送話信号e(n)が入力され、適応フィルタを更新する。適応フィルタ更新部112は、非特許文献1に記載されているNLMSアルゴリズムを用いる場合、式(9)により送話用受話信号x’(n)と送話信号e(n)とからh^(n)を更新する。更新した適応フィルタをコピーし、擬似エコー経路部111に出力する。
送話用差信号生成部280は、式(10)により、収音信号y(n)と送話用擬似エコー信号y^(n)が入力され、y(n)とy^(n)の差である送話信号e(n)を出力する。
特開2010−56778号公報
Simon Haykin, Adaptive Filter Theory, Prentice Hall International Inc, third edition, 1996, p.432-437.
上述したように、特許文献1に記載されているエコー消去装置では、適応フィルタを複数用意し、それぞれにサンプル間隔を修正した補間受話信号(評価用受話信号)を入力し、最も消去量が大きくなるフィルタを選ぶことで伸縮係数を求め、エコー消去性能を向上させることで、受話信号のサンプリング周期とは必ずしも一致しないサンプリング周期で収音される収音信号からエコー信号を良好に消去することができるものとなっている。
しかしながら、正しい補間受話信号を計算するための伸縮係数を探索するため、多くの適応フィルタを用意しなくてはならず、演算量が増加し、また全体の構成が非常に複雑になってしまうといった問題があった。
この発明の目的はこの問題に鑑み、受話信号と収音信号のサンプリング周期がずれている場合であっても簡易な構成で収音信号からエコー信号を良好に消去することができ、かつ演算量も従来に比し、削減することができるようにしたエコー消去方法、エコー消去装置及びエコー消去プログラムを提供することにある。
請求項1の発明によれば、受話信号のサンプリング周期とは必ずしも一致しないサンプリング周期で収音される収音信号からエコー信号を消去するエコー消去方法は、受話信号と収音信号を用い、所定のサンプル数の受話信号と収音信号の相関値をある時間間隔毎に計算する相関値計算過程と、前記相関値を用い、時間経過に伴う相関値のピーク位置の変動を検出することで、受話信号と収音信号のサンプリング周期のずれの大きさを推定し、そのずれから伸縮係数αを計算する伸縮係数計算過程と、受話信号と伸縮係数αと補間式を用い、受話信号のサンプリング周期をα倍した場合に得られる補間受話信号を推定する受話信号補間過程と、補間受話信号と送話信号を用い、擬似エコー信号を算出するエコー模擬過程と、収音信号と擬似エコー信号を用い、収音信号と擬似エコー信号の差である送話信号を算出する差信号生成過程とを含む。
請求項2の発明では請求項1の発明において、伸縮係数計算過程はある時間間隔毎に計算される相関値同士の相関を計算することでピーク位置の変動を検出する。
請求項3の発明では請求項2の発明において、伸縮係数計算過程はピーク位置の変動を検出する際、相関値同士の相関を計算するFFT長をゼロ詰めにより補間して長くする。
請求項4の発明によれば、受話信号のサンプリング周期とは必ずしも一致しないサンプリング周期で収音される収音信号からエコー信号を消去するエコー消去方法は、受話信号と収音信号を用い、所定のサンプル数の受話信号と収音信号のインパルス応答をある時間間隔毎に計算するインパルス応答計算過程と、前記インパルス応答を用い、時間経過に伴うインパルス応答のピーク位置の変動を検出することで、受話信号と収音信号のサンプリング周期のずれの大きさを推定し、そのずれから伸縮係数αを計算する伸縮係数計算過程と、受話信号と伸縮係数αと補間式を用い、受話信号のサンプリング周期をα倍した場合に得られる補間受話信号を推定する受話信号補間過程と、補間受話信号と送話信号を用い、擬似エコー信号を算出するエコー模擬過程と、収音信号と擬似エコー信号を用い、収音信号と擬似エコー信号の差である送話信号を算出する差信号生成過程とを含む。
請求項5の発明では請求項4の発明において、伸縮係数計算過程はある時間間隔毎に計算されるインパルス応答同士の相関を計算することでピーク位置の変動を検出する。
請求項6の発明では請求項5の発明において、伸縮係数計算過程はピーク位置の変動を検出する際、インパルス応答同士の相関を計算するFFT長をゼロ詰めにより補間して長くする。
請求項7の発明によれば、受話信号のサンプリング周期とは必ずしも一致しないサンプリング周期で収音される収音信号からエコー信号を消去するエコー消去装置は、受話信号と収音信号が入力され、所定のサンプル数の受話信号と収音信号の相関値をある時間間隔毎に計算して出力する相関値計算部と、前記相関値が入力され、時間経過に伴う相関値のピーク位置の変動を検出することで、受話信号と収音信号のサンプリング周期のずれの大きさを推定し、そのずれから伸縮係数αを計算して出力する伸縮係数計算部と、受話信号と伸縮係数αが入力され、補間式を用いて受話信号のサンプリング周期をα倍した場合に得られる補間受話信号を推定し、出力する受話信号補間部と、補間受話信号と送話信号が入力され、擬似エコー信号を算出して出力するエコー模擬部と、収音信号と擬似エコー信号が入力され、収音信号と擬似エコー信号の差である送話信号を算出して出力する差信号生成部とを具備し、伸縮係数計算部はある時間間隔毎に入力される相関値同士の相関を計算することでピーク位置の変動を検出する。
請求項8の発明によれば、受話信号のサンプリング周期とは必ずしも一致しないサンプリング周期で収音される収音信号からエコー信号を消去するエコー消去装置は、受話信号と収音信号が入力され、所定のサンプル数の受話信号と収音信号のインパルス応答をある時間間隔毎に計算して出力するインパルス応答計算部と、前記インパルス応答が入力され、時間経過に伴うインパルス応答のピーク位置の変動を検出することで、受話信号と収音信号のサンプリング周期のずれの大きさを推定し、そのずれから伸縮係数αを計算して出力する伸縮係数計算部と、受話信号と伸縮係数αが入力され、補間式を用いて受話信号のサンプリング周期をα倍した場合に得られる補間受話信号を推定し、出力する受話信号補間部と、補間受話信号と送話信号が入力され、擬似エコー信号を算出して出力するエコー模擬部と、収音信号と擬似エコー信号が入力され、収音信号と擬似エコー信号の差である送話信号を算出して出力する差信号生成部とを具備し、伸縮係数計算部はある時間間隔毎に入力されるインパルス応答同士の相関を計算することでピーク位置の変動を検出する。
この発明によれば、受話信号と収音信号のサンプリング周期がずれている場合であっても簡易な構成で収音信号からエコー信号を効果的に消去することができ、かつ演算量も従来に比し、削減することができる。
エコー消去装置の従来構成例を示すブロック図。 受話信号と収音信号のサンプリング周期がずれている場合であってもエコー信号を消去することができるようにしたエコー消去装置の従来構成例を示すブロック図。 この発明によるエコー消去装置の第1の実施例の構成を示すブロック図。 この発明によるエコー消去装置の第2の実施例の構成を示すブロック図。 実験結果を説明するためのグラフ。
以下、この発明の実施形態を図面を参照して実施例により説明する。
図3はこの発明によるエコー消去装置の実施例1の構成を示したものであり、エコー消去装置300は相関値計算部310と、伸縮係数計算部320と、受話信号補間部330と、エコー模擬部110と、差信号生成部120とを有する。エコー模擬部110は、図1に示したエコー模擬部110と同様の構成とされ、擬似エコー経路部111と適応フィルタ更新部112を有する。
受話端11から得られた受話信号x(n)はD/A変換部12、相関値計算部310及び受話信号補間部330に入力される。受話信号x(n)はD/A変換部12によってアナログ化され、x(t)となる。x(t)はスピーカ13によって再生され、再生された音はエコー経路31を通ってマイクロホン21で収音され、y(t)となる。y(t)はA/D変換部22によってデジタル化され、収音信号y(n)となり、相関値計算部310と差信号生成部120に入力される。
相関値計算部310では受話信号x(n)と収音信号y(n)の相関値を計算する。現在から過去N個のサンプルを用いて、
x(n)=[x(n),x(n−1),…,x(n−N+1)]
y(n)=[y(n),y(n−1),…,y(n−N+1)]
のように表記すると、相関値c(n)は、
c(n)=IFFT[FFT[x(n)FFT[y(n)]] (15)
と計算することができる。ここで、*は複素共役を表す。また、c(n)は、
c(n)=[c(0,n),c(1,n),…,c(l,n),…,c(N−1,n)]
であり、lは0≦l≦N−1の整数である。NはFFT長のため、通常は2のべき乗とすることが多い。
相関値計算部310はここでは式(15)に示した時間軸の相関そのものではなく、相関の周波数領域表現である
C(n)=FFT[x(n)FFT[y(n)] (16)
をある時間間隔M毎に計算し、計算した相関値C(n)を伸縮係数計算部320に出力する。なお、Mはサンプル数(1以上の整数で、受話信号x(n)側を基準に計測)を表し、つまりMサンプル分の時間間隔毎に相関値計算部310は相関値C(n)を計算して出力する。このMは固定値でもよいし、変動する値でもよい。変動する場合はこのMの値も伸縮係数計算部320に出力する。固定値であれば、例えばM=Nと置く。
伸縮係数計算部320では時間間隔M毎に送られてくる相関値C(n)を保持し、比較する。受話信号x(n)と収音信号y(n)にサンプリング周期のずれがある場合には時間がMサンプル分経過すると、相関値C(n)のピーク位置がその分だけずれるため、時間経過に伴う相関値C(n)のピーク位置の変動を検出することで、受話信号x(n)と収音信号y(n)のサンプリング周期のずれの大きさを推定することができる。ここでは、相関値C(n)同士のさらに相関をとることでピーク位置がずれた量を検出する。相関値C(n)の相関をd とすると、
=IFFT[[C(n+M)[C(n)]] (17)
のように計算することができる。ここで、d は、
=[d(0),d(1),…,d(N−1)]
である。
ところで、受話信号x(n)と収音信号y(n)のサンプリング周期のずれ量はわずかであるため、通常はNサンプルのFFT長では正確なピーク位置の計算を行うことは困難となる。そのため、FFT長をI倍して長くし、ピーク位置計算のためにゼロ詰めによる補間を行う。
FFT長がNのとき、FFT長をI倍にすることを考えると、
=[C(n+M)[C(n)] (18)
但し、D =[D(0),D(1),…,D(N−1)]に対し、
Figure 0005421877
とし、
M,I =IFFT[DM,I ] (20)
として、d のサンプル値をゼロ詰めにより補間したdM,I を求める。
このdM,I のうちで、最も大きな正のピークを持つ値を求め、そのサンプルのインデックスをl(0≦1≦IN−1)とすると、受話信号1サンプル当り、収音信号が何サンプル分ずれているかという値gは、
g=l/IM (21)
として計算することができる。このgを用いて、
α=1−g (22)
とすれば、伸縮係数αを求めることができる。
この伸縮係数αの計算は、最初に一度だけ行ってもよいし、時間間隔Mの値を変えながら計算し、相関値の相関の値が最も大きくなった時のαを最適値として更新していってもよい。相関値は離散的にしか求まらないため、相関値とサンプルの位置関係により求まる最大値が異なり、よって時間間隔Mを変えながら計算し、伸縮係数αの値を更新していくのが好ましい。但し、このように異なる相関値の相関を比較する際には、信号の大きさに関する正規化が必要になるため、
Figure 0005421877
のように正規化されたDM,n を用いる。伸縮係数α(jは区間番号を表す)は受話信号補間部330に出力される。
受話信号補間部330には伸縮係数αと受話信号x(n)が入力される。受話信号補間部330は補間式を用いて受話信号x(n)のサンプリング周期をα倍した場合に得られる補間受話信号x’(n)を推定し、出力する。
補間受話信号x’(n)の補間式は例えば前述の式(4)と同様、以下のようになる。
x’(n)=(ln−k+1){x(k)−x’(n−1)}+x(k−1) (24)
但し、lnは、
ln=lx,j+(n−ly,j)α (25)
とする。なお、x’(0)には適当な値を設定してもよい。例えば、x’(0)=0とする。lx,jは受話信号を伸縮させる際の基準となる受話信号のサンプル番号を表し、ly,jはlx,jに対応する収音信号のサンプル番号を表す。kはこのlnを下回らない最小の整数を表す。
なお、補間式として式(24)に代えて、以下の線形補間式を用いてもよい。
x’(n)=(ln−k+1)x(k)+(k−ln)x(k−1) (26)
また、p次のニュートン補間を用いてもよい。例えば、p=2の場合、補間式は、
Figure 0005421877
となる。この式ではx(k)からx(k−p)までの信号が補間に必要となる。この時、図示していないが、受話信号補間部330に受話信号蓄積部を設けてもよい。
以上の補間処理を受話信号補間部330において行い、補間受話信号x’(n)を出力する。なお、受話信号を伸縮させる際の基準となる受話信号のサンプル番号は、前の区間jの最終サンプルy(nj+1−1)に対し、
Figure 0005421877
と置く。なお、伸縮係数αの初期値αには適当な値を設定してもよい。例えば、α=1と設定してもよい。
エコー模擬部110は補間受話信号x’(n)と送話信号e(n)が入力され、擬似エコー信号y^(n)を出力する。エコー模擬部110の擬似エコー経路部111と適応フィルタ更新部112はそれぞれ以下の処理を行う。
擬似エコー経路部111には補間受話信号x’(n)が入力され、擬似エコー信号y^(n)を出力する。例えば、擬似エコー経路部111では適応フィルタh^(n)のタップ長L以上の補間受話信号x’(n)を蓄積し、式(8)により、補間受話信号x’(n)とh^(n)を畳み込むことで擬似エコー信号y^(n)を得る。
適応フィルタ更新部112には補間受話信号x’(n)と送話信号e(n)が入力され、適応フィルタを更新する。適応フィルタ更新部112は、非特許文献1に記載されているNLMSアルゴリズムを用いる場合、式(9)により補間受話信号x’(n)と送話信号e(n)とからh^(n)を更新する。更新した適応フィルタをコピーし、擬似エコー経路部111に出力する。
差信号生成部120には収音信号y(n)と擬似エコー信号y^(n)が入力され、式(10)によりy(n)とy^(n)の差である送話信号e(n)を計算して出力する。
以上説明したように、この例では伸縮係数を相関値から直接求めるものとなっており、伸縮係数を適応フィルタの消去量から探索していく従来例に比し、構成の簡略化と探索処理の省略を図ることができ、演算量を大幅に削減することができる。
なお、上述した例ではゼロ詰めにより補間し、FFT長をI倍しているが、必ずしもこのようにする必要はない。但し、ピーク位置をより精度良く得るためにはゼロ詰めにより補間し、FFT長を長くするのが好ましい。
図4はこの発明によるエコー消去装置の実施例2の構成を示したものであり、この例ではエコー消去装置400は図3に示した実施例1の構成における相関値計算部310に代えてインパルス応答計算部410を具備するものとなっている。
インパルス応答計算部410には受話信号x(n)と収音信号y(n)が入力され、インパルス応答計算部410はインパルス応答を計算する。インパルス応答h(n)は、
Figure 0005421877
と計算することができる。実施例1で式(15)のように相関値c(n)を計算する代わりにこのようにインパルス応答h(n)を計算し、相関値c(n)の代わりに用いることができる。つまり、必要なのは相関値のピークそのものではなく、相関値のピーク位置が時間経過と共にどうずれるかを見ることなので、ピークのあるインパルス応答波形でも同様に目的が達せられる。
インパルス応答計算部410はここでは式(29)に示した時間軸のインパルス応答ではなく、インパルス応答の周波数領域表現である。
Figure 0005421877
をある時間間隔M毎に計算し、計算したインパルス応答H(n)を伸縮係数計算部420に出力する。
伸縮係数計算部420では時間間隔M毎に送られてくるインパルス応答H(n)を保持し、比較する。受話信号x(n)と収音信号y(n)にサンプリング周期のずれがある場合には時間がMサンプル分経過すると、インパルス応答h(n)のピーク位置がその分だけずれるため、時間経過に伴うインパルス応答h(n)のピーク位置の変動を検出することで、受話信号x(n)と収音信号y(n)のサンプリング周期のずれの大きさを推定することができる。ここでは実施例1の場合と同様、インパルス応答h(n)同士の相関をとることでピーク位置がずれた量を検出する。また、実施例1と同様、精度良くピーク位置を得るためにFFT長をI倍して長くし、ゼロ詰めによる補間を行う。
伸縮係数計算部420では上記のようにして実施例1と同様、最も大きな正のピーク値を持つサンプルのインデックスlが求められ、式(21),(22)により伸縮係数αが求められる。伸縮係数αは受話信号補間部330に出力される。以下、受話信号補間部330等の処理は実施例1と同様に行われる。
[実験結果]
図5は実施例1の手法をシミュレーションデータに対して適用した結果を示したものである。
受話信号x(n)には8KHzサンプリングの白色雑音を用い、収音信号y(n)としては受話信号x(n)に予め用意したインパルス応答を畳み込んだ後、ダウンサンプラとアップサンプラを用い、サンプリング周期を1.001倍に変更した信号を用いた。この場合の伸縮係数αの真値は、
1000/1001=0.999000999
である。
まず、FFT長NをN=256として、ある時刻での受話信号x(n)と収音信号y(n)の相関値を計算する(図5(a))。そして、M=5120サンプル後に再び受話信号x(n)と収音信号y(n)の相関値を計算する(図5(b))。この2つの相関値のさらに相関をとり、I=4としてオーバーサンプリングしたものを図5(c)に示す。
図5(c)のグラフから最も大きな正のピーク位置のインデックスlはl=21と求まり、伸縮係数αは、
Figure 0005421877
と計算される。真値との誤差は0.003%である。
この求まった伸縮係数αを元に非特許文献1のNLMSアルゴリズムを用い、エコー消去を行ったところ、受話信号x(n)の補正前(補間前)は2dB程度の消去量しか得られなかったものが、23.98dBのエコー消去量を得ることができた。
以上説明したエコー消去装置、エコー消去方法はコンピュータと、コンピュータにインストールされたエコー消去プログラムによって実現することができる。コンピュータにインストールされたエコー消去プログラムはコンピュータのCPUによって解読されてコンピュータに上述したエコー消去方法を実行させる。
この発明によるエコー消去装置・方法はハンズフリー通話やハンズフリー音声認識などの分野で活用される。
110 エコー模擬部 111 擬似エコー経路部
112 適応フィルタ更新部 120 差信号生成部
300 エコー消去装置 310 相関値計算部
320 伸縮係数計算部 330 受話信号補間部
400 エコー消去装置 410 インパルス応答計算部
420 伸縮係数計算部

Claims (9)

  1. 受話信号のサンプリング周期とは必ずしも一致しないサンプリング周期で収音される収音信号からエコー信号を消去するエコー消去方法であって、
    受話信号と収音信号を用い、所定のサンプル数の前記受話信号と前記収音信号の相関値をある時間間隔毎に計算する相関値計算過程と、
    前記相関値を用い、時間経過に伴う前記相関値のピーク位置の変動を検出することで、前記受話信号と前記収音信号のサンプリング周期のずれの大きさを推定し、そのずれから伸縮係数αを計算する伸縮係数計算過程と、
    前記受話信号と前記伸縮係数αと補間式を用い、前記受話信号のサンプリング周期をα倍した場合に得られる補間受話信号を推定する受話信号補間過程と、
    前記補間受話信号と送話信号を用い、擬似エコー信号を算出するエコー模擬過程と、
    前記収音信号と前記擬似エコー信号を用い、前記収音信号と前記擬似エコー信号の差である前記送話信号を算出する差信号生成過程とを含むことを特徴とするエコー消去方法。
  2. 請求項1記載のエコー消去方法において、
    前記伸縮係数計算過程はある時間間隔毎に計算される前記相関値同士の相関を計算することで前記ピーク位置の変動を検出することを特徴とするエコー消去方法。
  3. 請求項2記載のエコー消去方法において、
    前記伸縮係数計算過程は前記ピーク位置の変動を検出する際、前記相関値同士の相関を計算するFFT長をゼロ詰めにより補間して長くすることを特徴とするエコー消去方法。
  4. 受話信号のサンプリング周期とは必ずしも一致しないサンプリング周期で収音される収音信号からエコー信号を消去するエコー消去方法であって、
    受話信号と収音信号を用い、所定のサンプル数の前記受話信号と前記収音信号のインパルス応答をある時間間隔毎に計算するインパルス応答計算過程と、
    前記インパルス応答を用い、時間経過に伴う前記インパルス応答のピーク位置の変動を検出することで、前記受話信号と前記収音信号のサンプリング周期のずれの大きさを推定し、そのずれから伸縮係数αを計算する伸縮係数計算過程と、
    前記受話信号と前記伸縮係数αと補間式を用い、前記受話信号のサンプリング周期をα倍した場合に得られる補間受話信号を推定する受話信号補間過程と、
    前記補間受話信号と送話信号を用い、擬似エコー信号を算出するエコー模擬過程と、
    前記収音信号と前記擬似エコー信号を用い、前記収音信号と前記擬似エコー信号の差である前記送話信号を算出する差信号生成過程とを含むことを特徴とするエコー消去方法。
  5. 請求項4記載のエコー消去方法において、
    前記伸縮係数計算過程はある時間間隔毎に計算される前記インパルス応答同士の相関を計算することで前記ピーク位置の変動を検出することを特徴とするエコー消去方法。
  6. 請求項5記載のエコー消去方法において、
    前記伸縮係数計算過程は前記ピーク位置の変動を検出する際、前記インパルス応答同士の相関を計算するFFT長をゼロ詰めにより補間して長くすることを特徴とするエコー消去方法。
  7. 受話信号のサンプリング周期とは必ずしも一致しないサンプリング周期で収音される収音信号からエコー信号を消去するエコー消去装置であって、
    受話信号と収音信号が入力され、所定のサンプル数の前記受話信号と前記収音信号の相関値をある時間間隔毎に計算して出力する相関値計算部と、
    前記相関値が入力され、時間経過に伴う前記相関値のピーク位置の変動を検出することで、前記受話信号と前記収音信号のサンプリング周期のずれの大きさを推定し、そのずれから伸縮係数αを計算して出力する伸縮係数計算部と、
    前記受話信号と前記伸縮係数αが入力され、補間式を用いて前記受話信号のサンプリング周期をα倍した場合に得られる補間受話信号を推定し、出力する受話信号補間部と、
    前記補間受話信号と送話信号が入力され、擬似エコー信号を算出して出力するエコー模擬部と、
    前記収音信号と前記擬似エコー信号が入力され、前記収音信号と前記擬似エコー信号の差である前記送話信号を算出して出力する差信号生成部とを具備し、
    前記伸縮係数計算部はある時間間隔毎に入力される前記相関値同士の相関を計算することで前記ピーク位置の変動を検出することを特徴とするエコー消去装置。
  8. 受話信号のサンプリング周期とは必ずしも一致しないサンプリング周期で収音される収音信号からエコー信号を消去するエコー消去装置であって、
    受話信号と収音信号が入力され、所定のサンプル数の前記受話信号と前記収音信号のインパルス応答をある時間間隔毎に計算して出力するインパルス応答計算部と、
    前記インパルス応答が入力され、時間経過に伴う前記インパルス応答のピーク位置の変動を検出することで、前記受話信号と前記収音信号のサンプリング周期のずれの大きさを推定し、そのずれから伸縮係数αを計算して出力する伸縮係数計算部と、
    前記受話信号と前記伸縮係数αが入力され、補間式を用いて前記受話信号のサンプリング周期をα倍した場合に得られる補間受話信号を推定し、出力する受話信号補間部と、
    前記補間受話信号と送話信号が入力され、擬似エコー信号を算出して出力するエコー模擬部と、
    前記収音信号と前記擬似エコー信号が入力され、前記収音信号と前記擬似エコー信号の差である前記送話信号を算出して出力する差信号生成部とを具備し、
    前記伸縮係数計算部はある時間間隔毎に入力される前記インパルス応答同士の相関を計算することで前記ピーク位置の変動を検出することを特徴とするエコー消去装置。
  9. 請求項1乃至6記載のいずれかのエコー消去方法をコンピュータに実行させるためのプログラム。
JP2010188246A 2010-08-25 2010-08-25 エコー消去方法、エコー消去装置及びエコー消去プログラム Expired - Fee Related JP5421877B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010188246A JP5421877B2 (ja) 2010-08-25 2010-08-25 エコー消去方法、エコー消去装置及びエコー消去プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010188246A JP5421877B2 (ja) 2010-08-25 2010-08-25 エコー消去方法、エコー消去装置及びエコー消去プログラム

Publications (2)

Publication Number Publication Date
JP2012049689A JP2012049689A (ja) 2012-03-08
JP5421877B2 true JP5421877B2 (ja) 2014-02-19

Family

ID=45904091

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010188246A Expired - Fee Related JP5421877B2 (ja) 2010-08-25 2010-08-25 エコー消去方法、エコー消去装置及びエコー消去プログラム

Country Status (1)

Country Link
JP (1) JP5421877B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102780821B (zh) * 2012-07-06 2014-08-13 歌尔声学股份有限公司 一种送受话端采样率偏差纠正方法和系统
WO2019044664A1 (ja) * 2017-08-28 2019-03-07 株式会社ソニー・インタラクティブエンタテインメント 音声信号処理装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3607625B2 (ja) * 2001-02-08 2005-01-05 日本電信電話株式会社 多チャネル反響抑圧方法、その装置、そのプログラム及びその記録媒体
JP4834046B2 (ja) * 2008-08-27 2011-12-07 日本電信電話株式会社 エコー消去装置、エコー消去方法、エコー消去プログラム、記録媒体

Also Published As

Publication number Publication date
JP2012049689A (ja) 2012-03-08

Similar Documents

Publication Publication Date Title
EP2327156B1 (en) Method for determining updated filter coefficients of an adaptive filter adapted by an lms algorithm with pre-whitening
JP2004056453A (ja) エコー抑圧方法及び装置
CN112017679B (zh) 用于自适应滤波器系数更新的方法及装置、设备
EP2710787A1 (en) Non-linear post-processing for acoustic echo cancellation
JP5838861B2 (ja) 音声信号処理装置、方法及びプログラム
JP4834046B2 (ja) エコー消去装置、エコー消去方法、エコー消去プログラム、記録媒体
JP2013507804A (ja) 時間領域・周波数領域統合反響消去装置及び方法
WO2012070670A1 (ja) 信号処理装置、信号処理方法、及び信号処理プログラム
JP5662232B2 (ja) エコー消去装置、その方法及びプログラム
JP5235226B2 (ja) エコー消去装置及びそのプログラム
JP5421877B2 (ja) エコー消去方法、エコー消去装置及びエコー消去プログラム
JPWO2012070668A1 (ja) 信号処理装置、信号処理方法、及び信号処理プログラム
JP2005318518A (ja) ダブルトーク状態判定方法、エコーキャンセル方法、ダブルトーク状態判定装置、エコーキャンセル装置およびプログラム
JP2004078021A (ja) 収音方法、収音装置、および収音プログラム
JP5524316B2 (ja) パラメータ推定装置、エコー消去装置、パラメータ推定方法、及びプログラム
JP6182862B2 (ja) 信号処理装置、信号処理方法、及び信号処理プログラム
US20140066134A1 (en) Audio processing device, audio processing method, and recording medium recording audio processing program
JP6143702B2 (ja) エコー消去装置、その方法及びプログラム
EP4199368A1 (en) Adaptive delay diversity filter, and echo cancelling device and method using same
JP4478045B2 (ja) エコー消去装置、エコー消去方法、エコー消去プログラムおよびその記録媒体
JP5013580B2 (ja) 適応フィルタ装置、エコーキャンセラ、フィルタ係数の更新方法
JP2010156742A (ja) 信号処理装置および方法
KR20050047374A (ko) 통신 기기용 하이브리드 소음 제거 시스템 및 방법
JPWO2013032001A1 (ja) 音声処理装置、その制御方法および制御プログラム
JP2019036917A (ja) パラメータ制御装置、方法及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20121004

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20131106

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20131112

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20131122

R150 Certificate of patent or registration of utility model

Ref document number: 5421877

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees