JP5235226B2 - エコー消去装置及びそのプログラム - Google Patents

エコー消去装置及びそのプログラム Download PDF

Info

Publication number
JP5235226B2
JP5235226B2 JP2011143121A JP2011143121A JP5235226B2 JP 5235226 B2 JP5235226 B2 JP 5235226B2 JP 2011143121 A JP2011143121 A JP 2011143121A JP 2011143121 A JP2011143121 A JP 2011143121A JP 5235226 B2 JP5235226 B2 JP 5235226B2
Authority
JP
Japan
Prior art keywords
signal
delay
correlation value
echo
frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2011143121A
Other languages
English (en)
Other versions
JP2013012841A (ja
Inventor
翔一郎 齊藤
末廣 島内
澄宇 阪内
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2011143121A priority Critical patent/JP5235226B2/ja
Publication of JP2013012841A publication Critical patent/JP2013012841A/ja
Application granted granted Critical
Publication of JP5235226B2 publication Critical patent/JP5235226B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Circuit For Audible Band Transducer (AREA)
  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
  • Telephone Function (AREA)

Description

本発明は、収音信号に含まれる反響信号を用いて再生信号の遅延量を推定し、反響信号を消去する技術に関する。
ハンズフリーによる双方向通話を行う際に、エコー消去装置が通常用いられる。エコー消去装置では、スピーカへ出力する再生信号を参照信号として用い、部屋の反響特性を模擬したフィルタリングを行い、疑似反響信号を生成し、疑似反響信号をマイクロホンの収音信号から差し引くことでエコーを消去する。
フィルタリングを行う際に用いる適応フィルタの更新アルゴリズムの一つとしてNormalized Least Mean Square(NLMS)アルゴリズムが知られている(非特許文献1参照)。このアルゴリズムはエコー消去装置においても最も頻繁に使われるものの一つである。
Simon Haykin, "Adaptive Filter Theory", Prentice Hall Internation al Inc, 1996, third edition, p.432-437.
通常は、このNLMSアルゴリズムによってエコー消去が可能である。しかし、スピーカの再生信号からマイクロホンの収音信号までの遅延が長大である場合、反響信号の到達時間が適応フィルタのタップ長よりも長くなり、適応フィルタは反響路を模擬できず、エコー消去量が大幅に低下することがある。また、長大な遅延に対応するために適応フィルタのタップ長を長大に設定する方法も考えられるが、その場合、適応フィルタにおける演算量が非常に大きくなってしまう。
遅延が長大となる例として、家庭用ディジタルTVを用いてTV会議システムを構築する場合等がある。家庭用ディジタルTVにおいて、入力された映像と音声の同期を取る必要があるため、映像の表示にかかる時間だけ音声の出力が遅くなることがある。こういった機器にエコー消去装置を接続してハンズフリー通話を行う場合、スピーカの再生信号からマイクロホンの収音信号に含まれる反響信号の間の遅延がかなり大きなものになる。
そのため、部屋の残響に対応するための短いサイズのメモリしか持たない一般のエコー消去装置では、エコーを全く消去することができない、または、エコーの消去量が不十分となる。また、メモリサイズを大きくすればエコーを消去することが可能にはなるが、非常に長いフィルタの計算をしなければならず、演算量が非常に多くかかりフィルタの推定速度も著しく低下する。加えて、製品毎に遅延量は様々なため、予め固定値を指定しておくことができない。
本発明は、反響信号を用いて再生信号の遅延量を推定し、反響信号を消去する技術を提供することを目的とする。
上記の課題を解決するために、本発明の第一の態様によれば、時間領域のディジタル再生信号のある離散時刻tから始まる連続するr個(但し、rは複数)のサンプルによる列をフレーム再生信号として求め、時間領域のディジタル収音信号の離散時刻tを含む互いに異なる複数の時刻それぞれから始まる連続するr個のサンプルによる列それぞれをフレーム収音信号として求め、フレーム再生信号を周波数領域信号に変換して周波数領域再生信号として求め、複数のフレーム収音信号それぞれを周波数領域信号に変換して複数の周波数領域収音信号として求め、周波数領域再生信号と複数の周波数領域収音信号それぞれとの類似性の指標を算出し、算出した類似性の指標が周波数領域再生信号と周波数領域収音信号との類似性が最も高くなることを示す、周波数領域再生信号と周波数領域収音信号が対応する時刻の差を遅延値として求め、遅延値に基づき再生信号を遅延させ、遅延された再生信号を用いて、収音信号から反響信号を消去する。
上記の課題を解決するために、本発明の第一の態様によれば、時間領域のディジタル収音信号のある離散時刻tから始まる連続するr個(但し、rは複数)のサンプルによる列をフレーム収音信号として求め、時間領域のディジタル再生信号の離散時刻tを含む互いに異なる複数の時刻それぞれから始まる連続するr個のサンプルによる列それぞれをフレーム再生信号として求め、フレーム収音信号を周波数領域信号に変換して周波数領域収音信号として求め、複数のフレーム再生信号それぞれを周波数領域信号に変換して複数の周波数領域再生信号として求め、周波数領域収音信号と複数の周波数領域再生信号それぞれとの類似性の指標を算出し、算出した類似性の指標が周波数領域収音信号と周波数領域再生信号との類似性が最も高くなることを示す、周波数領域収音信号と周波数領域再生信号が対応する時刻の差を遅延値として求め、遅延値に基づき再生信号を遅延させ、遅延された再生信号を用いて、再生信号から反響信号を消去する。
上記の課題を解決するために、本発明の第三の態様によれば、時間領域のディジタル再生信号のある離散時刻tから始まる連続するr個(rは複数)のサンプルによる列をフレーム再生信号として求め、時間領域のディジタル収音信号の離散時刻tを含む互いに異なる複数の時刻それぞれから始まる連続するr個のサンプルによる列それぞれをフレーム収音信号として求め、フレーム再生信号と複数のフレーム収音信号それぞれとの類似性の指標を算出し、算出した類似性の指標がフレーム再生信号とフレーム収音信号との類似性が最も高くなることを示す、フレーム再生信号とフレーム収音信号が対応する時刻の差を遅延値として求め、遅延値に基づき再生信号を遅延させ、遅延された再生信号を用いて、収音信号から反響信号を消去する。
上記の課題を解決するために、本発明の第四の態様によれば、収音信号に含まれる反響信号を用いて再生信号の遅延量を推定する。時間領域の再生信号と時間領域の収音信号との相関値を、収音信号のフレーム番号とサンプル番号を変化させながら各フレームの各サンプルに対して求め、相関値が最大となるときの収音信号のフレーム番号とサンプル番号を用いて、遅延値を算出し遅延値に基づき再生信号を遅延させ、遅延された再生信号を用いて、収音信号から反響信号を消去する。
上記の課題を解決するために、本発明の第五の態様によれば、収音信号に含まれる反響信号を用いて再生信号の遅延量を推定する。周波数領域の再生信号と周波数領域の収音信号とを用いて、収音信号のフレーム番号を変化させながら、各フレームの各サンプルに対して相関値を求め、相関値が最大となるときの収音信号のフレーム番号とサンプル番号を用いて、遅延値を算出し遅延値に基づき再生信号を遅延させ、遅延された再生信号を用いて、収音信号から反響信号を消去する。
本発明は、反響信号を用いて再生信号の遅延量を推定することができ、メモリサイズ及び演算量の増加させることなく、反響信号を消去できるという効果を奏する。
第一、二、六、七、八、十実施形態の遅延推定装置の機能ブロック図。 第一、二、六、七、八、十実施形態の遅延推定装置の処理フロー図。 第一、二、六実施形態の遅延推定部の機能ブロック図。 第一、二実施形態の遅延推定部の処理フロー図。 相関値算出部115の処理フロー図。 相関値算出部の処理内容を説明するための図。 相関値が最大となるときの収音信号のフレーム番号とサンプル番号を求める方法を説明するための図。 信号蓄積部180の機能ブロック図。 信号蓄積部180の処理フロー図。 エコー消去部90の機能ブロック図。 相関値算出部215の処理フロー図。 相関値算出部215の合算処理、エリア相関値算出処理の処理フロー図。 第三、九実施形態の遅延推定装置の機能ブロック図。 第三、九実施形態の遅延推定装置の処理フロー図。 第三、九実施形態の遅延推定部の機能ブロック図。 遅延推定部310の処理フロー図。 エコー消去部94の機能ブロック図。 第四、五実施形態の遅延推定装置の機能ブロック図。 第四、五実施形態の遅延推定装置の処理フロー図。 信号蓄積部480の機能ブロック図。 第四、五実施形態の遅延推定装置の機能ブロック図。 第四実施形態の遅延推定装置の機能ブロック図。 相関値算出部415の処理フロー図。 相関値算出部415において相関値を求める方法を説明するための図。 相関値算出部515の処理フロー図。 相関値算出部415において相関値を求める方法を説明するための図。 遅延推定部610の処理フロー図。 遅延推定部710の機能ブロック図。 遅延推定部710の処理フロー図。 遅延推定部810の機能ブロック図。 第八、十実施形態の遅延推定装置の処理フロー図。 第九実施形態の遅延推定装置の処理フロー図。 第十実施形態においてγ=1.0のシミュレーション結果を示す図。 図33の各時刻で最大である相関から現在の遅延値を計算した図。 第十実施形態においてγ=5.0のシミュレーション結果を示す図。 図35の各時刻で最大である相関から現在の遅延値を計算した図。
以下、本発明の実施形態について、説明する。
<第一実施形態に係る遅延推定装置100>
第一実施形態に係るエコー消去装置は、遅延推定装置100とエコー消去部90とを含む。エコー消去部90は従来技術を用いてエコーを消去すればよいので、主に、図1及び図2を用いて第一実施形態に係る遅延推定装置100を説明する。遅延推定装置100は遅延推定部110と信号蓄積部180とを含む。
遅延推定部110は、時間領域のディジタル収音信号(以下、単に「収音信号」という)y(n)と時間領域のディジタル再生信号(以下、単に「再生信号」または「受話信号」という)x(n)とを受け取り、収音信号y(n)に含まれる反響信号を用いて再生信号x(n)の遅延量を推定する(s110)。ここで、nはディジタル信号のサンプル番号を表し、例えばサンプリング周波数が48000Hzの信号の場合、nは48000分の1秒ごとに1増える値である。
信号蓄積部180は、推定された遅延量(以下「遅延推定値」destに応じて、再生信号x(n)を遅延させて、出力する(s180)。
エコー消去部90は、遅延された再生信号を用いて、収音信号y(n)から反響信号を消去し(s90)、送話信号e(n)を送話端4に出力する。
ここで、収音信号y(n)はマイクロホン3により収音されるディジタル信号であり、再生信号x(n)はスピーカ22で再生されるディジタル信号である。nはサンプル番号またはそのサンプルに対応する時刻を示す。
同一空間内にスピーカ22とマイクロホン3とが存在する場合、スピーカ22とマイクロホン3との間には音響的な伝達経路である反響路h(n)が生じる。再生音がこの反響路h(n)を介してマイクロホン3により収音される。マイクロホン3で収音される音の内、スピーカ22の再生音に起因する音を反響音といい、反響音に起因する信号を反響信号という。よって、収音信号には反響信号が含まれる。遅延推定装置100は、この反響信号を利用して遅延量を推定する。
遅延推定装置100は、受話端1を介して、再生信号x(n)を受信する。なお、再生装置2も再生信号x(n)を受信する。再生装置2は、例えば、家庭用ディジタルTVであり、図示しない映像データも受信する。遅延部21において、再生信号と映像データとの同期を取る。その際、映像データの表示にかかる時間だけ再生信号の出力を遅くする。スピーカ22は、同期後の再生信号を受信し、再生する。再生音は、反響路h(t)を介してマイクロホン3により収音される。マイクロホン3は収音信号y(n)を遅延推定装置100及びエコー消去部90に出力する。なお、同期後の映像データは図示しない表示部に表示される。
以下、各部の詳細を説明する。
<遅延推定部110>
図3及び図4を用いて遅延推定部110を説明する。遅延推定部110は、フレーム化部111と、ベクトル化部112と、無音区間判定部113と、相関値算出部115と、遅延値算出部117と、遅延出力部119とを含む。
(フレーム化部111)
フレーム化部111は、時間領域のディジタル再生信号x(n)を受け取り、ある離散時刻tから始まる連続するr個(rは複数)のサンプルによる列をフレーム化し(s111)、フレーム単位の再生信号xをベクトル化部112に出力する。以下ではr=2L(Lは正の整数)として説明する。なお、mはフレーム番号及びそのフレーム番号に対応する時刻(以下「フレーム時刻」という)を表す。
同様に、フレーム化部111は、時間領域のディジタル収音信号y(n)を受け取り、前記離散時刻tを含む互いに異なる複数の時刻それぞれから始まる連続するr個のサンプルによる列をフレーム化し、フレーム単位の収音信号yを無音区間判定部113に出力する。以下では、L個のサンプルに相当する時刻ずつずらした複数の時刻それぞれから始まる連続する2L個のサンプルによる列をフレーム化するものとして説明する。例えば以下のようにフレーム化する。
xm=[x(mL-2L+1),x(mL-2L+2),…,x(mL)]T
ym=[y(mL-2L+1),y(mL-2L+2),…,y(mL)]T
なお、・は行列・の転置行列を表す。
(ベクトル化部112)
ベクトル化部112は、フレーム単位の再生信号xを受け取り、再生信号xの前半L個を切り出して、ベクトル
x'm T=[x(mL-2L+1),x(mL-2L+2),…,x(mL-L)]
を生成し(s112)、無音区間判定部113と相関値算出部115に出力する。
(無音区間判定部113)
無音区間判定部113は、再生信号xを用いて、再生信号xが無音区間か否かを判定する(s113a)。例えば、無音区間判定部113は、再生信号xから得られるベクトルx’を受け取り、ベクトルx’のパワー||x’||を算出し、閾値T以上か否かを判定する。なお、||・||は・のL2ノルムを表す。閾値T以上の場合には、無音区間ではないと判定し、閾値T未満の場合には、無音区間であると判定する。無音区間判定部113は、パワー||x’||が閾値T以上の場合、そのときのmをmとして相関値算出部115に出力する(s113b)。閾値Tは再生信号に含まれるノイズの影響を小さくするために用いる。無音か小さな声では閾値Tを下回り、通常の音量の音声で閾値Tを超えるように閾値Tを設定する。
なお、閾値T未満の場合には、次の再生信号x(n)と収音信号y(n)を受け取り、フレーム化処理(s111)、ベクトル化処理(s112)、無音区間判定処理(s113a)を繰り返す。
受け取った全ての再生信号x(n)と収音信号y(n)に対して、相関値算出部115以降の処理を行ってもよいが、通常反響音はある程度大きな再生音の場合に生じるので、そのような場合にのみ遅延量を推定すれば十分効果を得ることができる。よって、このように無音区間判定部113において、無音区間でないと判定されたフレームに対してのみ、以降の処理を行うことで、演算量を減らすことができる。
(相関値算出部115)
相関値算出部115は、再生信号x’ と収音信号yとを受け取り、その相関値c(n)を、収音信号yのフレーム番号とサンプル番号を変化させながら、各フレームmの各サンプルnに対して算出する(s115)。
図5を用いて相関値算出部115の処理内容をより詳細に説明する。例えば、相関値算出部115は、無音区間ではないと判定したフレーム番号mを受け取り、以下のベクトル
Figure 0005235226
を定義する(s115a)。ここで0はn個の0が並んだベクトルを表す。さらに、以下の式により、フレームmのn番目のサンプルの相関値c(n)を算出する(s115c)。
Figure 0005235226
但し、Dを想定する最大遅延をフレーム数で表したものとし、m≦m≦m+D−1とし、f=m−mとする(s115b)。よって、0≦f≦D−1である。なお、x^(i)、y^(i)はそれぞれベクトルx^、y^のi番目の要素を表し、記号^は直前の文字の頭上に附されるものとする。図6に示すように、式(3)において、nの値を0からL−1に変化させ(s115b、s115d,s115e)、ベクトルx^=[x’m0 ](但し、下付き文字m0はmを表す)と収音信号y^=[y(1+n),…,y(L+n)]の相関値を算出する(s115c)。さらにフレーム番号mを、mからm+D−1まで変化させ(図4のs113b、図5のs115f、s115g)、各フレームmの各サンプルn毎の相関値c(n)を算出する。言い換えると、フレーム時刻が1フレーム進む毎に、つまりmが1増えるごとに、x^は一定の値(式(1)及び図6参照、x^はmのときの値から変化しない)を保持するのに対し、y^は値が変化するため(式(2)及び図6参照、y^はフレーム時刻mに応じて変化し、さらにサンプル番号nも変化する)、その時間差の異なる信号との相関を順に取っていく。想定する最大遅延をDサンプル(例えば、サンプリング周波数を16kHzとし、最大遅延を200msと想定したとき、D=3200である)としたとき、(m−m)L>Dとなるm=m=m+D-1までcを計算する(つまり、m≦m≦m=m+D-1)。
相関値算出部115は、式(3)を用いて、D×L個の相関値c(n)を算出し、算出した相関値の中で最大の相関値となるときのフレーム番号をfmaxとし、最大の相関値となるときのサンプル番号をnmaxとして遅延値算出部117に出力する(図7参照)。
上記では、式(3)の相関値で説明を行ったが、相関値に限らず再生信号からなるサンプル列と収音信号からなるサンプル列との類似性の指標を表すものであればよい。この観点から相関値算出部を類似性算出部と呼んでもよい。
(遅延値算出部117)
遅延値算出部117は、相関値が最大となるときの収音信号のフレーム番号fmaxとサンプル番号nmaxを受け取り、これを用いて、例えば以下の式により遅延値dmaxを算出し、遅延出力部119へ出力する(s117)。
Figure 0005235226
言い換えると、遅延値算出部117は、相関値算出部115で算出した類似性の指標が最も高くなることを示す、再生信号からなるサンプル列と収音信号からなるサンプル列が対応する時刻の差を遅延値として求める。
(遅延出力部119)
遅延出力部119は、所定数の遅延値を受け取り、最も頻度の高い遅延値を遅延推定値として出力する(s119e)。
例えば、遅延出力部119は、Dの長さを持つ配列dを用意し、0で初期化する(s119a)。遅延出力部119は、遅延値dmaxを受け取ると、配列dのインデックスがdmax番目の要素の数を1増やす(s119b)。Tsum個の遅延値dmaxを取得するまで、上記処理(s111〜s117、s119b)を繰り返す(s119c、s119d)。このような処理を行うことで、配列dは遅延推定値の候補のヒストグラムとなる。そして、Tsum個の遅延値dmaxを取得したとき(言い換えると、配列dの要素の合計がTsumとなったとき)に、配列dの全要素の中で一番大きな値をとる配列の要素を探索し、その要素のインデックスを遅延推定値destとして出力する(s119e)。Tsumはヒストグラムの最頻値が常に真値となるために必要な計算回数を表し、推定値のばらつき方によって数回から数十回分の計算を行うように設定する。このような構成とすることで、誤差によって遅延推定値がばらつくことを大幅に軽減できる。
<信号蓄積部180>
信号蓄積部180は、遅延推定値destに応じて、再生信号x(n)を遅延させて、遅延再生信号x(n’)を出力する。例えば、信号蓄積部180は、信号格納部181と信号バッファ183と第一信号出力部185とを含む(図8、図9参照)。
信号バッファ183は長さDのサンプルを保持できるバッファである(D≧Dであればよく、通常D=Dとすればよい)。信号格納部181は、再生信号x(n)を受け取り、信号バッファ183上の古いサンプルから順に上書きする形で保存する(s181)。第一信号出力部185は、遅延推定値destを受け取り、この遅延推定値destに基づいて、現在のサンプルx(n)から数えてdest+2L-1サンプル古いものからdestサンプル古いものまで計2L個出力する(s185)。つまり、2L個の遅延再生信号x(n’)(但し、n−dest−2L+1)≦n’≦n−dest)を出力する。
<エコー消去部90>
エコー消去部90は、例えば、従来技術を用いてエコーを消去すればよい。エコー消去部90は、遅延再生信号x(n’)を用いて、収音信号y(n)から反響信号を消去し、送話信号e(n)を送話端4に出力する。再生信号x(n)ではなく、遅延再生信号x(n’)を用いる点が従来技術と異なるが、その他の点は従来技術と同様である。例えば、図10のようにエコー推定部を用い、非特許文献1記載の適応フィルタによって収音信号から疑似エコー信号を差し引いてエコー消去をする方法や、特許3420705号公報のように収音信号にエコー抑圧ゲインをかけてエコーを抑圧する方法がある。
例えば、図10に示すように、エコー消去部90は、エコー推定部91と減算部93を含む構成であってもよい。エコー推定部91において、非特許文献1記載の適応フィルタを用いて、遅延再生信号x(n’)により疑似反響信号y’(n)を生成する。次に、減算部93において収音信号y(n)から疑似反響信号y’(n)を差し引いてエコーを消去した送話信号e(n)を求め、出力する。なお、エコー推定部91は送話信号e(n)を受け取り、適応フィルタのフィルタ係数の更新の際に利用する。
<効果>
本実施形態は、遅延推定部において、反響信号を用いて再生信号の遅延量を推定することができる。さらに、信号蓄積部では、推定した遅延量に基づき、再生信号と遅延させて出力することができる。
エコー消去部において、遅延再生信号を用いて、エコーを消去することで、遅延の影響によるエコー消去部の性能劣化を、フィルタタップ長を増やさずに防ぐことができる。フィルタタップ長を増やさないので、演算量の増加を防ぐことができる。加えて、製品毎の遅延量を推定することができるため、製品毎に適切な遅延量を推定し、エコーを消去することができる。さらに、フレーム毎の処理のため、IP電話のようなパケット単位で処理するアプリケーションへの適用が容易である。
なお、エコー消去装置の内部に上述した遅延推定装置を組込み、遅延再生信号を出力するのではなく、適応フィルタの開始位置を調整する構成としてもよい。遅延再生信号を出力する場合と同様に、必要な演算量を増加させることなく、エコー消去性能を維持することができる。なお、本実施形態では、一定長のフレーム単位でスピーカの再生信号とマイクロホンの収音信号の相関を計算し、各フレームの相関値の大小によって遅延量を柔軟に決定することができる。
<その他の変形例>
遅延推定装置100が受信する再生信号及び収音信号がアナログ信号の場合には、図示しないAD変換部において、アナログ再生信号x(t)及びアナログ収音信号y(t)(tは時刻を表す)を、それぞれ所定のサンプリング周波数(例えば16kHz)でサンプリングし、各サンプルを量子化し、ディジタル受話信号サンプルx(n)及びディジタル収音信号y(n)に変換する構成としてもよい。
遅延推定装置100はベクトル化部112を含まなくともよい。その場合には、x’に代えてxを用いて無音区間判定処理(s113a)、相関値算出処理(s115)を行えばよい。
遅延推定装置100は遅延出力部119を含まず、遅延値算出部117の出力値であるdmaxをそのまま遅延推定部110の遅延推定値destとして出力する構成としてもよい。遅延推定値が不安定になるが、推定速度が速くなるという効果がある。なお、以下に説明する実施形態においても同様である。
<第二実施形態に係る遅延推定装置200>
第一実施形態と異なる部分についてのみ説明する。図1及び図2を用いて第二実施形態に係る遅延推定装置200を説明する。
遅延推定装置200は、遅延推定部210と信号蓄積部180とを含む。遅延推定部210の構成及び処理内容が第一実施形態と異なる。遅延推定部210は、収音信号y(n)と再生信号x(n)とを受け取り、収音信号y(n)に含まれる反響信号を用いて再生信号x(n)の遅延量を推定する(s210)。遅延推定部210内の相関値算出部215の構成及び処理内容(s215)が第一実施形態と異なる(図3及び図4参照)。以下、図11及び図12を用いて詳細を説明する。
<相関値算出部215>
相関値算出部215は、無音区間判定部113において無音区間でないと判定された再生信号x’ を所定の範囲I毎に合算し、収音信号yを所定の範囲I毎に合算する(s215b)。例えば、以下の式により合算する(x^、y^については式(1)、式(2)参照)。
Figure 0005235226
min{・}は集合・の最小値を返す関数である。つまり、再生信号x^及び収音信号y^をそれぞれ、L’個またはL’+1個のエリアに区切り、エリア毎に合算する(s215b−1〜s215b−4)。
さらに、相関値算出部215は、合算された再生信号x (n)と合算された収音信号y (n)とのエリア相関値を、各フレームの各所定の範囲に対して求める(s215c)。なお、記号は直前の文字の頭上に附されるものとする。例えば、以下の式によりエリア相関値c’を求める。
Figure 0005235226
つまり、合算された再生信号x =[x m0(1),…,x m0(L)]と合算された収音信号y =[y m0(1+n),…,y m0(L+n)](但し、nは変化し、0≦n≦L−1である。また、式(2)より収音信号はフレーム時刻mの変化に応じて信号が変化する)までのエリア相関値を算出する(s215c−1〜s215c−4)。
相関値算出部215は、式(10)を用いて、D×L個の相関値c’(n)を算出し、フレーム毎に算出した相関値の中で最大の相関値となるときのサンプル番号をn’maxとして求める。フレーム毎にn’maxを求めるため、D個のサンプル番号n’maxを求める。
次に相関値算出部215は、再生信号xと収音信号yとの相関値cを求める(s215e)。その際、収音信号のフレーム番号mを変化させる。さらに、エリア相関値c’が最大となるときの所定の範囲(この例では、サンプル番号n’maxから始まるI個のサンプル)を中心とする前後数サンプルの範囲内でサンプル番号を変化させながら、各フレームの各サンプルに対して相関値cを求める。例えば、nlow=n’max−M(但し、nlow<1のときnlow=1とする)からnhigh=n’max+M(但し、nhigh>Lのときnhigh=Lとする)の範囲で再生信号x^と収音信号y^との相関値を求める(s215d〜s215g)。例えば以下の式により求める。
Figure 0005235226
Mはn’maxの周辺で相関の最大値があると思われる範囲を示す。つまり、エリア相関値c’を用いて遅延のおおよその値を計算し、その後、相関値cから正確な遅延値を求める。
<効果>
このような構成とすることで、第一実施形態と同様の効果を得ることができる。さらに、1フレームあたり第一実施形態ではLタップの相関計算がL回必要だったのが、Lタップの相関計算がL回(式(10)参照)とLタップの相関計算が2M+1回(式(3)参照)で済むようになる。例えばL=320、I=10、M=50のとき、その計算量はおおよそ1/3となる。
<第三実施形態に係る遅延推定装置300>
第一実施形態と異なる部分のみ説明する。第三実施形態に係るエコー消去装置は、遅延推定装置100とエコー消去部94とを含む。エコー消去部94は従来技術を用いてエコーを消去すればよいので、主に、図13及び図14を用いて第三実施形態に係る遅延推定装置300を説明する。遅延推定装置300は遅延推定部310と信号蓄積部380とを含む。遅延推定装置300は、周波数領域変換部81及び82、エコー消去部94、時間領域変換部83を備えるエコー消去装置の内部に組込まれているものとする。
周波数領域変換部81及び82は、それぞれ時間領域の再生信号x(n)及び収音信号y(n)を周波数領域の再生信号X及び収音信号Yに変換し(s81、s82)、再生信号Xを遅延推定部310と信号蓄積部380とに出力し、収音信号Yを遅延推定部310とエコー消去部94とに出力する。例えば、以下の式により変換する。
Figure 0005235226
wは長さ2Lのハミング窓等である。
遅延推定部310は、周波数領域の再生信号Xと収音信号Yとを受け取り、収音信号y(n)に含まれる反響信号を用いて再生信号x(n)の遅延量を推定する(s310)。
信号蓄積部380は、遅延推定値destに応じて、再生信号Xを遅延させて、出力する(s380)。
エコー消去部94は、遅延された再生信号を用いて、収音信号Yから反響信号を消去し(s94)、送話信号Eを時間領域変換部83に出力する。
時間領域変換部83は、周波数領域の送話信号Eを時間領域の送話信号e(n)に変換し、送話端4に出力する。例えば、以下の式により変換する。
Figure 0005235226
以下、各部の詳細を説明する。
<遅延推定部310>
図15及び図16を用いて遅延推定部310を説明する。遅延推定部310は、無音区間判定部313と相関値算出部315と遅延値算出部117と遅延出力部319とを含む。
(無音区間判定部313)
無音区間判定部313は、再生信号Xを受け取り、再生信号Xが無音区間か否かを判定する(s313a)。例えば、無音区間判定部313は、再生信号Xのパワー||X||を算出し、閾値T以上か否かを判定する。無音区間判定部313は、パワー||X||が閾値T以上の場合、そのときのフレーム番号mをmとし、再生信号XをXm0として相関値算出部315に出力する(s313b)。
(相関値算出部315)
相関値算出部315は、無音区間判定部において無音区間でないと判定された再生信号Xm0と収音信号Yと受け取り、これらの値を用いて、相関値を求める(s315)。その際、収音信号のフレーム番号を変化させながら相関値を求めることで、各フレームの各サンプルに対して相関値を求める。例えば以下の式により相関値を求める。
Figure 0005235226
但し、*は複素共役を表し、m≦m≦m+D−1である。
(但し、記号は直前の文字の頭上に附されるものとする)の前半L個を
Figure 0005235226
と定義する。相関値算出部315は、式(14)を用いて、D×2L個の相関値c (n)を算出し、式(15)により、D×L個の相関値c(n)を取得する(s315a〜s315c)。取得した相関値c(n)の中で最大の相関値となるときのフレーム番号をfmaxとし、最大の相関値となるときのサンプル番号をnmaxとして遅延値算出部117に出力する。
1フレームあたり第一実施形態の場合、式(3)において、Lタップの相関計算がL回必要であったが、本実施形態では、式(14)において要素数の2L回の計算を行うだけでよい。
なお上記では、式(14)及び式(15)の相関値で説明を行ったが、第一実施形態の場合と同様に、相関値に限らず周波数領域の再生信号と収音信号との類似性の指標を表すものであればよい。
(遅延出力部319)
遅延出力部319は、遅延値算出部117から所定数の遅延値を受け取り、遅延出力部119と同様の方法により、最も頻度の高い遅延値を遅延推定値destとして求める(s119a〜s119e)。
さらに、遅延出力部319は、以下のd’estを求める。
Figure 0005235226
遅延出力部319は、d’estを改めてdestとし(つまり、destにd’estを代入し)、信号蓄積部380に出力する(s319f)。信号蓄積部380には、Lサンプル毎の周波数領域の再生信号が蓄積されているが、このような構成とすることで、Lの倍数の遅延を再現することができる。
<信号蓄積部380>
信号蓄積部380は、遅延推定値destに応じて、再生信号Xを遅延させて、周波数領域の遅延再生信号Xm’(但し、m’=m−dest/L)を出力する(s380)。再生信号x(n)に代えて再生信号Xを用いる以外は、信号蓄積部180と同様である。
<エコー消去部94>
エコー消去部94は、遅延された再生信号を用いて、収音信号Yから反響信号を消去し(s94)、送話信号Eを時間領域変換部83に出力する。例えば、図17に示すように、エコー消去部94は、エコー抑圧ゲイン計算部95と乗算部97を含む構成であってもよい。エコー抑圧ゲイン計算部95において、特許3420705号公報記載の従来技術を用いて、遅延再生信号Xm’と収音信号Yによりエコー抑圧ゲインGを求める。次に乗算部97において収音信号Yにエコー抑圧ゲインGを乗じてエコーを抑圧し、抑圧後の送話信号Eを出力する。
<効果>
このような構成とすることで、第一実施形態と同様の効果を得ることができる。さらに、エコー消去装置で用いる周波数領域の再生信号及び収音信号を利用することで、遅延推定時の相関計算の演算量を低く抑えることができる。
<その他の変形例>
周波数領域変換部81及び82において、式(1)、式(2)を用いて、以下の式により、得られる周波数領域の再生信号及び収音信号であってもよい。
Figure 0005235226
この信号であっても遅延推定装置300は、同様の効果を奏する。さらに、式(14)において、L回の計算を行うだけでよく、cを定義しなおす必要がなくなる。なお、以下に説明する第四実施形態においても同様である。
本実施形態では、遅延推定装置がエコー消去装置の内部に組込まれているものとしたが、組込みでなくともよい。その場合には、遅延推定装置内部に周波数領域変換部と時間領域変換部を含む構成とすればよい。
<第四実施形態に係る遅延推定装置400>
第三実施形態と異なる部分についてのみ説明する。図18及び図19を用いて第四実施形態に係る遅延推定装置400を説明する。
遅延推定装置400は、遅延推定部410と信号蓄積部480を含む。遅延推定部410及び信号蓄積部480の構成及び処理内容がそれぞれ第三実施形態と異なる。遅延推定部410は、収音信号YとD個の再生信号X,Xm-1,…,Xm-DF+1とを受け取り、収音信号Yに含まれる反響信号を用いて再生信号Xの遅延量を推定する(s410)。但し、下付き文字DFは、Dを表す。
<信号蓄積部480>
信号蓄積部480は、遅延推定値destに応じて、再生信号Xを遅延させて、出力する(s480)。信号蓄積部480は、例えば、信号格納部481と信号バッファ483と第一信号出力部485と第二信号出力部487とを含む(図20参照)。
信号バッファ483はD個の周波数領域の再生信号を保持できるバッファである(D≧DFであればよく、通常D=DFとすればよい)。信号格納部481は、再生信号Xを受け取り、信号バッファ483上の古い再生信号から順に上書きする形で保存する。
第二信号出力部487は、現フレームmを含めてD個の再生信号X,Xm-1,…,Xm-DF+1を信号バッファ483から取得し、遅延推定部410に出力する。
また、信号蓄積部480の第一信号出力部485は、遅延推定値destに応じて、再生信号Xを遅延させて、周波数領域の遅延再生信号Xm’(但し、m’=m−dest/L)を出力する。
<遅延推定部410>
遅延推定部410は、相関値算出部415と遅延値算出部117と遅延出力部319とを含む。相関値算出部415の構成及び処理内容(図22のs415)が第三実施形態と異なる。
(相関値算出部415)
相関値算出部415は、過去D個の再生信号X,Xm-1,…,Xm-DF+1と収音信号Yとを用いて、D個の再生信号X,Xm-1,…,Xm-DF+1のフレーム番号と収音信号Yのフレーム番号を変化させながら、各再生信号と各収音信号の各組合せの各サンプルに対して相関値を求める(s415)。相関値算出部415は、図23に示す各処理を行う。
相関値算出部415において各値に初期値を設定する(s415a、s415b)。
収音信号YとD個の再生信号X,Xm-1,…,Xm-DF+1とを受け取る。但し、mがD未満の場合には(s415c)、取得可能な再生信号のみ受け取る。
mがD未満の場合には(s415c)、取得した再生信号と収音信号Yとの相関値を算出する(s415d−1〜s415d−3)。相関値の算出方法は第三実施形態と同様である。
Figure 0005235226
但し、0≦f≦m−1である。
取得した再生信号と同数の相関値を算出し、以下の処理を行う(s415e、s415f、s415g−1〜s415g−5)。
i=m-f
for f=0〜m-1
if cf(nf)>ctmp(i)
ctmp(i)=cf(nf)
ntemp(i)=nf
ftemp(i)=f
end
end
mがD以上となるまで上記の処理を繰り返す(s415p)。
mがD以上の場合には(s415c)、D個の再生信号X,Xm-1,…,Xm-DF+1と収音信号Yとの相関値cを算出する(s415h−1〜s415h−3)。
Figure 0005235226
但し、0≦f≦D−1である。
mがD以上の場合には(s415f)、mをDで割ったあまりをrとし(s415i)、iを以下のように設定する(s415j−1〜s415j−3)。
Figure 0005235226
さらに、以下の処理を行う(s415j−1〜s415j−3、s415k−1〜s415k−4)。
for f=0〜DF-1
if cf(nf)>ctmp(i)
ctmp(i)=cf(nf)
ntemp(i)=nf
ftemp(i)=f
end
end
過去D回の相関計算と比較が終了したインデックスr+1を用いて、
nmax=ntemp(r+1)
fmax=ftemp(r+1) (19)
として、遅延値算出部117に出力する(s415m)。図24は、m=D(r=0)のときのctmpのc、ctmp(i)、ntemp(i)、ftemp(i)を記憶する記憶部の状態を示す。このとき、cとctmp(0)とを比較し、cとctmp(D−1)とを比較し、cとctmp(D−2)とを比較し、…、cDF−1とctmp(1)とを比較する。比較の結果、cのほうが大きい場合には、ctmpを更新する。全ての比較、更新を終えると、r+1に対応するntemp(i)、ftemp(i)を出力する。この例では、r=0なので、ntemp(1)、ftemp(1)をnmax、fmaxとして出力する。本実施形態ではD回の比較処理を行ったctmpに対応するfmaxとnmaxを出力したいので、r+1のときのctmp(i)に対応するntemp(i)、ftemp(i)を出力する。次のフレームを受け取った場合には、上記処理を行い、ntemp(2)、ftemp(2)をnmax、fmaxとして出力する。
計算が終了したctmp(i)、ntmp(i)、ftmp(i)は0で初期化し(s415n)、ctmp(i)には次フレームに入力される新たな再生信号Xm+1と各収音信号Ym+1の相関値を格納していく。相関値算出部415は、s415b〜s415pの処理を繰り返す(s415p)。
言い換えると、相関値算出部415では、周波数領域収音信号Yと複数の周波数領域再生信号X,Xm-1,…,Xm-DF+1それぞれとの類似性の指標を算出する。
<効果>
このような構成とすることで、第三実施形態と同様の効果を得ることができる。ctmpの各要素は一つのXに対応しており、あるXm”を固定したままYm”,Ym”+1,…,Ym”+DF-1との相関を計算する、という第三実施形態の演算を同時並行でD回行うことができる。よって、第三実施形態よりも高速に遅延推定値が得られる。
<その他の変形例>
第四実施形態において、遅延推定装置400は、無音区間判定部413(図21において破線で示す)を含んでもよい。無音区間判定部413は、D個の再生信号X,Xm-1,…,Xm-DF+1を受け取り、再生信号Xのパワーが閾値以下か否かを判定し、閾値以上の再生信号のみ遅延推定部410に出力する(s413、図22において破線で示す)。再生信号Xのパワーが小さい、つまり再生信号が無音もしくはある閾値以下のパワーしかない場合に、対応する相関値cの計算を行わない構成となる。Xのパワーが小さい場合は相関値cがノイズの影響を受けやすくなるが、このような構成とすることで、頑強な推定が可能となる。閾値は例えば信号の定格レベルの−10dBなどと設定する。
<第五実施形態に係る遅延推定装置500>
第四実施形態と異なる部分についてのみ説明する。第五実施形態に係る遅延推定装置500を説明する。遅延推定部510内の相関値算出部515の処理内容が遅延推定装置400とは異なる(s510、s515、図18、図19、図21、図22参照)。図25のs515h−2、s515d−2に示すように、相関を計算するXをA(Aは2以上の整数)フレーム毎にしか用いない。例えばA=3の時、m番目のフレームの時刻においてXとYの相関、Xm-AとYの相関、Xm-2AとYの相関というように計算し、m+1番目のフレームの時刻においてはXとYm+1の相関、Xm-AとYm+1の相関、Xm-2AとYm+1の相関というように計算する。このようにしても、相関計算に用いられるXは間引かれるが、同一のXに対する異なる遅延に対応する相関値は間引かれない(図26参照)。
<効果>
このような構成とすることで、第四実施形態と同様の効果を得ることができる。なお、Aフレームに1回しかdmaxの計算がされないため、第四実施形態に比べてTsum個の遅延値を推定するためにA倍の時間がかかるが(言い換えると、遅延推定値destの推定速度が1/Aに減少する)、その分演算量も相関計算部分に関しては1/Aに減少する。遅延推定装置の処理能力に応じて適宜設定すればよい。
<第六実施形態に係る遅延推定装置600>
第一実施形態と異なる部分についてのみ説明する。図1、図2、図3、図27を用いて第六実施形態に係る遅延推定装置600を説明する。遅延推定装置600内の遅延推定部610の構成及び処理内容(s610)が第一実施形態とは異なる。さらに詳しくいうと、遅延推定部610内の遅延出力部619の処理内容(s619)が異なる。
遅延出力部619は入力されたdmaxを用いて
dest=(1-α)dmax+αd’est (20)
として出力する(図27のs619)。なお、d’estは前回推定したdestの値である。αは減衰係数で、0.9程度の値を用いる。
<効果>
このような構成により第一実施形態と同様の効果を得ることができる。なお、この場合、遅延出力部119のようにTsum回の推定が行われるまで待たずに、真値に近い値を維持することができる。第二〜五実施形態の遅延出力部を同様の構成としてもよい。
<第七実施形態に係る遅延推定装置700>
第一実施形態と異なる部分についてのみ説明する。図1、図2、図28、図29を用いて第七実施形態に係る遅延推定装置700を説明する。遅延推定装置700内の遅延推定部710の構成及び処理内容(s710)が第一実施形態とは異なる。さらに詳しくいうと、遅延推定部710内の遅延値算出部717と遅延出力部719の処理内容(図29のs717、s719a、s719e)が異なる。
遅延値算出部717はdmaxの代わりにfmaxを遅延値として出力する。
遅延出力部719は、Dの長さを持つ配列dを用意し、0で初期化する(s719a)。遅延出力部119は、遅延値fmaxを受け取ると、配列dのインデックスがfmax番目の要素の数を1増やす(s719b)。Tsum個の遅延値dmaxを取得するまで、処理を繰り返す。Tsum回の推定を終了したところで、全要素の中で一番大きな値をとるインデックスimax(0≦imax≦D−1)に対し、
dest=imaxL (21)
を出力する。
<効果>
このような構成とすることで第一実施形態と同様の効果を得ることができる。なお、遅延推定値の正確な値は求まらないが、フレーム内の細かい誤差を無視してフレームごとに集約することで、推定が安定するメリットがある。第二〜六実施形態の遅延値算出部、遅延出力部を同様の構成としてもよい。
<第八実施形態に係る遅延推定装置800>
第一実施形態と異なる部分についてのみ説明する。図1、図2、図30、図31を用いて第八実施形態に係る遅延推定装置800を説明する。遅延推定装置800内の遅延推定部810の構成及び処理内容(s810)が第一実施形態とは異なる。さらに詳しくいうと、遅延推定部810は相関蓄積部816をさらに含み、遅延値算出部817の処理内容(図31のs817)が異なる。相関蓄積部816は、前回算出した相関値c f oldを蓄積する。
遅延値算出部817は、求めた相関値cからそのままdmaxを計算するのではなく、定数β(0≦β≦1)を用いてcの時間変化を平滑化したc を用いてfmaxおよびdmaxを計算する。具体的には、遅延値算出部817は、相関蓄積部816から蓄積された(前回計算された)平滑化した相関値c f oldを取得し、これを用いて、以下の式により平滑化した相関値c を求める(s817)。
Figure 0005235226
但し、0≦f≦D−1とする。
さらに、遅延値算出部817は、平滑化した相関値c を用いて、以下の式により、fmaxを計算する。さらにfmaxを用いてdmaxを計算し、dmaxを出力する。
Figure 0005235226
<効果>
このような構成とすることによって、第一実施形態と同様の効果を得ることができる。さらに、時間平滑化によって外乱音声等によるcの値の一時的な乱れを防ぐことができる。第二〜七実施形態の遅延値算出部を同様の構成としてもよい。なお、第四実施形態のように相関値を毎時刻計算する場合には、平滑化した相関値c foldは1フレーム前の値であるが、そうでない場合は、数フレーム前の値となることもある。
<第九実施形態に係る遅延推定装置900>
第三実施形態に係る遅延推定装置300と異なる部分についてのみ説明する。遅延推定部910の相関値算出部915の処理内容が異なる(図13、図14のs910、図15及び図32参照)。
相関値算出部915は、再生信号Xm0と収音信号Yを受け取り、再生信号Xm0の大きさに応じてゲインGm0を求める(s915a)。例えば、以下のようにして求める。
Figure 0005235226
但し、閾値Tg1>Tg2の正の値であり、0≦γ<1である。Tg1は通常会話において最も大きな周波数成分の値付近に設定し、Tg2は通常会話においてスペクトルの谷に当たる部分の値付近に設定する。
相関値算出部915は、受け取った再生信号Xm0と収音信号Yと、求めたゲインGm0を用いて、相関を以下のように求める(s915b)。
Figure 0005235226
<効果>
このような構成とすることで第三実施形態と同様の効果を得ることができる。さらに、あまり大きすぎる再生信号の周波数成分に関しては、時間領域へ戻したときの相関値に影響が大きすぎるため低減し、小さい再生信号の周波数成分に関してもSN比が悪く外乱の影響を受けやすいため、寄与を低くすることができ、より精度の高い推定が可能となる。第四実施形態の遅延値算出部を同様の構成としてもよい。
<その他の変形例>
なお、時間領域で相関を計算する場合でも、x(n)の周波数領域の値を求め、ゲインGm0を設計した後、同様の特性を持つ時間領域のフィルタを求めてxをフィルタリングすることで同様の効果が得られる。
<第十実施形態に係る遅延推定装置>
第八実施形態に係る遅延推定装置800と異なる部分についてのみ説明する。本実施形態では、第八実施形態の遅延値算出部で用いていたβの値を可変とする。図1、図2、図30、図31を用いて第十実施形態に係る遅延推定装置1000を説明する。遅延推定装置1000内の遅延推定部1010の構成及び処理内容(s1010)が第八実施形態とは異なる。さらに詳しくいうと、遅延推定部1010内部の遅延値算出部1017の処理内容(s1017)が第八実施形態と異なる。遅延値算出部1017は図示しない相関差分計算部と平滑係数切替部とを含む。
のあるフレームmでの値をc (m)とし、相関差分計算部は、相関蓄積部からc (m)とc (m−1)を受け取り、
Figure 0005235226
を計算する。Δc (m)は遅延が変動していない場合は、それぞれの遅延において(各fにおいて)おおよそ同じ挙動をする。それに対し、遅延が変動した場合、今まで遅延の真値に近いfに対応するc は急激に値が減少し、新しい遅延の真値に近いfに対応するc は急激に値が上昇する。つまり、Δc (m)の正負がfによって、異なり、かつ、大きさが大きくなる。
また、相関差分計算部は、細やかな時間変動の影響を除くため、以下の式を計算し、Δc (m)を定義しなおす。
Figure 0005235226
なお、Iは正の整数でc を加算するフレーム幅である。例えばIは10程度の値とする。相関差分計算部は、Δc (m)を平滑係数切替部に送信する。
平滑係数切替部は、
Figure 0005235226
という値を求める。なお、sgn(・)は・の符号(1もしくは−1)を表す。そして、
Figure 0005235226
という条件判定を行う。Tは相関が大きく変動していることを判定する閾値、Tは相関の時間差分の正負がそろっていないことを判定する閾値である。例えば、I=10、D=20程度のときにT=10程度の値とする。また、−D≦SΔ≦Dであり、D=20のときに、T=10程度とする。
平滑係数切替部は、式(35)の条件を満たしたときのみ、第八実施形態のβを以下の式によりβに置き換える。
β2=1-γ(1-β) (36)
γは1以上の実数で、βの値が小さくなることで平滑化の効果が小さくなり、遅延変動への追随が速くなる。例えば、γ=5.0とする。なお、平滑係数切替部は、βをβに置き換えた後に、上記条件を満たさなくなった場合には、βをβに戻す。遅延値算出部817は、βまたはβを用いて、式(22)を計算し、c を求める。他の処理は第八実施形態と同様である。
<効果>
このような構成とすることで第八実施形態と同様の効果を得ることができる。なお、第八実施形態において、cの時間変化を平滑化すると述べているが、平滑化をかければかけるほど遅延変動に対して追随が遅くなるというデメリットがあるが、本実施形態であれば、遅延が変動した際に追随を速くし、遅延が変動していない場合は平滑化を強めにして外乱に強くするという処理を遅延値算出部に追加している。
[シミュレーション結果]
図33、図34に第五、七、八、十実施形態を組み合わせた構成の遅延推定装置(但し、γ=1.0とし、第四実施形態の変形例で説明した無音区間判定部413を備える)の計算機上のシミュレーション結果を示す。再生信号は16kHzサンプリングの音声データで、L=160(=10ms)、D=20、A=5(第五実施形態の間引き)、Tsum=6、β=0.95(平滑係数)とした。遅延を12.5秒と42秒の位置で変動させ、相関の変化と推定遅延の推移をプロットした。図34の推定遅延のグラフは、図33の各時刻で最大である相関から現在の遅延値を計算したものである。図33は3通りの遅延に対応する相関値の変動を表し、c、c、c11、はそれぞれ10ms、60ms、110msの遅延に対応する相関値の変動を表す。0秒から12.5秒までは遅延は10ms程度であり、c1の値(太線)が最大になれば正しい遅延が推定されることになる。図33のプロットもそのようになっている。また図34プロットも遅延真値と推定遅延値が一致している。同様に、12.5秒から42秒は遅延が110ms程度、42秒から60秒までは遅延が60ms程度であり、それぞれ正しい遅延(極太線、太点線)が推定されている。ただし、推定遅延値が遅延の推定値になるには10秒程度の推定時間がかかっている。
同様の実験を、第十実施形態のγ=5.0として実験を行った。図35、図36に結果を示す。遅延が変動した際の相関値の増加・減少の傾斜が大きくなっており、遅延の変動にすばやく追従している。そのため、図36の推定遅延値も、実際の遅延変動から2秒程度で推定が行えている。追従を大きくするには、βの値をもともと小さくしておけばよいが、そうすると遅延変動が起きていない部分の推定値の変動まで大きくなってしまう。この実験では、2回の遅延変動の周辺以外は安定した相関の計算が行われているため、推定速度と安定性の両立が行えている。
<プログラム及び記録媒体>
上述した遅延推定装置は、コンピュータにより機能させることもできる。この場合はコンピュータに、目的とする装置(各種実施例で図に示した機能構成をもつ装置)として機能させるためのプログラム、またはその処理手順(各実施例で示したもの)の各過程をコンピュータに実行させるためのプログラムを、CD−ROM、磁気ディスク、半導体記憶装置などの記録媒体から、あるいは通信回線を介してそのコンピュータ内にダウンロードし、そのプログラムを実行させればよい。
<その他の変形例>
本発明は上記の実施形態及び変形例に限定されるものではない。例えば、上述の各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。その他、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。

Claims (10)

  1. 収音信号に含まれる反響信号を用いて再生信号の遅延量を推定するエコー消去装置であって、
    時間領域の前記再生信号と時間領域の前記収音信号との相関値を、前記収音信号のフレーム番号とサンプル番号を変化させながら各フレームの各サンプルに対して求める相関値算出部と、
    前記相関値が最大となるときの収音信号のフレーム番号とサンプル番号を用いて、遅延値を算出する遅延値算出部と、
    前記遅延値に基づき前記再生信号を遅延させる信号蓄積部と、
    前記遅延された再生信号を用いて、前記収音信号から反響信号を消去するエコー消去部と、
    を含み、
    前記相関値算出部は、
    時間領域の前記再生信号を所定の範囲毎に合算し、時間領域の前記収音信号を前記所定の範囲毎に合算し、
    合算した前記再生信号と合算した前記収音信号とのエリア相関値を、各フレームの各前記所定の範囲に対して求め、
    時間領域の前記再生信号と時間領域の前記収音信号との相関値を、前記収音信号のフレーム番号を変化させ、かつ、前記エリア相関値が最大となるときの所定の範囲を中心とする前後数サンプルの範囲内でサンプル番号を変化させながら、各フレームの各サンプルに対して求める、
    エコー消去装置。
  2. 収音信号に含まれる反響信号を用いて再生信号の遅延量を推定するエコー消去装置であって、
    周波数領域の前記再生信号と周波数領域の前記収音信号とを用いて、前記収音信号のフレーム番号を変化させながら、各フレームの各サンプルに対して相関値を求める相関値算出部と、
    前記相関値が最大となるときの収音信号のフレーム番号とサンプル番号を用いて、遅延値を算出する遅延値算出部と、
    前記遅延値に基づき前記再生信号を遅延させる信号蓄積部と、
    前記遅延された再生信号を用いて、前記収音信号から反響信号を消去するエコー消去部と、
    信号バッファに蓄積されている前記再生信号の内、現フレームを含めて過去数フレームを出力する第二信号出力部と、を含み、
    前記相関値算出部は、過去数フレームの前記再生信号と前記収音信号とを用いて、過去数フレームの前記再生信号のフレーム番号と前記収音信号のフレーム番号を変化させながら、各再生信号と各収音信号の各組合せの各サンプルに対して相関値を求める、
    エコー消去装置。
  3. 収音信号に含まれる反響信号を用いて再生信号の遅延量を推定するエコー消去装置であって、
    周波数領域の前記再生信号と周波数領域の前記収音信号とを用いて、前記収音信号のフレーム番号を変化させながら、各フレームの各サンプルに対して相関値を求める相関値算出部と、
    前記相関値が最大となるときの収音信号のフレーム番号とサンプル番号を用いて、遅延値を算出する遅延値算出部と、
    前記遅延値に基づき前記再生信号を遅延させる信号蓄積部と、
    前記遅延された再生信号を用いて、前記収音信号から反響信号を消去するエコー消去部と、
    信号バッファに蓄積されている前記再生信号の内、現フレームを含めて過去数フレームを出力する第二信号出力部と、
    前記相関値を蓄積する相関蓄積部とを含み、
    前記相関値算出部は、過去数フレームの前記再生信号と前記収音信号とを用いて、過去数フレームの前記再生信号のフレーム番号と前記収音信号のフレーム番号を変化させながら、各再生信号と各収音信号の各組合せの各サンプルに対して相関値を求め、
    βを0以上1以下の実数とし、前記遅延値算出部は、前記相関値が最大となるときの収音信号のサンプル番号nmaxと蓄積された相関値c foldを用いて、前記相関値c
    Figure 0005235226
    として平滑化し、平滑化した相関値c と当該相関値c が最大となるときの収音信号のフレーム番号を用いて、遅延値を算出する、
    エコー消去装置。
  4. 収音信号に含まれる反響信号を用いて再生信号の遅延量を推定するエコー消去装置であって、
    周波数領域の前記再生信号と周波数領域の前記収音信号とを用いて、前記収音信号のフレーム番号を変化させながら、各フレームの各サンプルに対して相関値を求める相関値算出部と、
    前記相関値が最大となるときの収音信号のフレーム番号とサンプル番号を用いて、遅延値を算出する遅延値算出部と、
    前記遅延値に基づき前記再生信号を遅延させる信号蓄積部と、
    前記遅延された再生信号を用いて、前記収音信号から反響信号を消去するエコー消去部と、を含み、
    前記相関値算出部は、周波数領域の前記再生信号Xの大きさに応じて、ゲインを生成し、当該ゲインと前記再生信号Xと前記収音信号とを用いて、前記収音信号のフレーム番号を変化させながら、各フレームの各サンプルに対して相関値を求める、
    エコー消去装置。
  5. 収音信号に含まれる反響信号を用いて再生信号の遅延量を推定するエコー消去装置であって、
    周波数領域の前記再生信号と周波数領域の前記収音信号とを用いて、前記収音信号のフレーム番号を変化させながら、各フレームの各サンプルに対して相関値を求める相関値算出部と、
    前記相関値が最大となるときの収音信号のフレーム番号とサンプル番号を用いて、遅延値を算出する遅延値算出部と、
    前記遅延値に基づき前記再生信号を遅延させる信号蓄積部と、
    前記遅延された再生信号を用いて、前記収音信号から反響信号を消去するエコー消去部と、
    信号バッファに蓄積されている前記再生信号の内、現フレームを含めて過去数フレームを出力する第二信号出力部と、を含み、
    前記相関値算出部は、過去数フレームの前記再生信号と前記収音信号とを用いて、過去数フレームの前記再生信号のフレーム番号と前記収音信号のフレーム番号を変化させながら、各再生信号と各収音信号の各組合せの各サンプルに対して相関値を求め、
    さらに、前記相関値算出部は、周波数領域の前記再生信号Xの大きさに応じて、ゲインを生成し、当該ゲインと前記再生信号Xと前記収音信号とを用いて、前記収音信号のフレーム番号を変化させながら、各フレームの各サンプルに対して相関値を求める、
    エコー消去装置。
  6. 収音信号に含まれる反響信号を用いて再生信号の遅延量を推定するエコー消去装置であって、
    周波数領域の前記再生信号と周波数領域の前記収音信号とを用いて、前記収音信号のフレーム番号を変化させながら、各フレームの各サンプルに対して相関値を求める相関値算出部と、
    前記相関値が最大となるときの収音信号のフレーム番号とサンプル番号を用いて、遅延値を算出する遅延値算出部と、
    前記遅延値に基づき前記再生信号を遅延させる信号蓄積部と、
    前記遅延された再生信号を用いて、前記収音信号から反響信号を消去するエコー消去部と、
    信号バッファに蓄積されている前記再生信号の内、現フレームを含めて過去数フレームを出力する第二信号出力部と、を含み、
    前記相関値算出部は、過去数フレームの前記再生信号と前記収音信号とを用いて、過去数フレームの前記再生信号のフレーム番号と前記収音信号のフレーム番号を変化させながら、各再生信号と各収音信号の各組合せの各サンプルに対して相関値を求め、
    前記第二信号出力部は、信号バッファに蓄積されている前記再生信号の内、現フレームを含めて過去数フレームを出力する際に、Aフレーム毎の過去のフレームを出力する、
    エコー消去装置。
  7. 請求項からの何れかに記載のエコー消去装置であって、
    所定数の前記遅延値を受け取り、最も頻度の高い遅延値を遅延推定値として出力する遅延出力部をさらに含み、
    前記信号蓄積部は、前記遅延値に基づき得られる前記遅延推定値に応じて前記再生信号を遅延させる、
    エコー消去装置。
  8. 請求項からの何れかに記載のエコー消去装置であって、
    αを減衰係数とし、前記遅延値dmaxと前回推定した遅延推定値d’estとを用いて、今回の遅延推定値dest
    dest=(1-α)dmax+αd’est (20)
    として出力する遅延出力部をさらに含む、
    エコー消去装置。
  9. 請求項記載のエコー消去装置であって、
    前記遅延値算出部は、前記相関値が最大となるときの収音信号のフレーム番号を遅延値として算出する、
    エコー消去装置。
  10. 請求項1からの何れかに記載のエコー消去装置としてコンピュータを機能させるためのプログラム。
JP2011143121A 2011-06-28 2011-06-28 エコー消去装置及びそのプログラム Active JP5235226B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011143121A JP5235226B2 (ja) 2011-06-28 2011-06-28 エコー消去装置及びそのプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011143121A JP5235226B2 (ja) 2011-06-28 2011-06-28 エコー消去装置及びそのプログラム

Publications (2)

Publication Number Publication Date
JP2013012841A JP2013012841A (ja) 2013-01-17
JP5235226B2 true JP5235226B2 (ja) 2013-07-10

Family

ID=47686371

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011143121A Active JP5235226B2 (ja) 2011-06-28 2011-06-28 エコー消去装置及びそのプログラム

Country Status (1)

Country Link
JP (1) JP5235226B2 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6295722B2 (ja) * 2014-02-28 2018-03-20 沖電気工業株式会社 エコー抑圧装置、プログラム及び方法
JP6369192B2 (ja) * 2014-07-18 2018-08-08 沖電気工業株式会社 エコー抑圧装置、エコー抑圧プログラム、エコー抑圧方法及び通信端末
JP6432384B2 (ja) * 2015-02-16 2018-12-05 沖電気工業株式会社 エコー抑圧装置、エコー抑圧プログラム及びエコー抑圧方法
CN105872156B (zh) * 2016-05-25 2019-02-12 腾讯科技(深圳)有限公司 一种回声时延跟踪方法及装置
CN107610713B (zh) 2017-10-23 2022-02-01 科大讯飞股份有限公司 基于时延估计的回声消除方法及装置
CN112534800B (zh) * 2018-07-18 2021-10-15 谷歌有限责任公司 一种回波检测的方法和系统

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SE516143C2 (sv) * 1999-05-10 2001-11-26 Ericsson Telefon Ab L M Skattning av ren fördröjning
JP3727258B2 (ja) * 2001-08-13 2005-12-14 富士通株式会社 エコー抑制処理システム
JP2004297236A (ja) * 2003-03-26 2004-10-21 Hitachi Communication Technologies Ltd 通信装置、および、それに用いるエコーキャンセラ
RU2427077C2 (ru) * 2005-12-05 2011-08-20 Телефонактиеболагет Лм Эрикссон (Пабл) Обнаружение эхосигнала
EP2043278B1 (en) * 2007-09-26 2013-03-20 Psytechnics Ltd Signal processing
JP5167871B2 (ja) * 2008-03-05 2013-03-21 沖電気工業株式会社 伝搬遅延時間推定器、プログラム及び方法、並びにエコーキャンセラ
JP4621266B2 (ja) * 2008-03-25 2011-01-26 富士通株式会社 測定方法、エコー発生箇所特定方法、測定装置、およびエコー発生箇所特定装置

Also Published As

Publication number Publication date
JP2013012841A (ja) 2013-01-17

Similar Documents

Publication Publication Date Title
CN109727604B (zh) 用于语音识别前端的频域回声消除方法及计算机储存介质
JP5235226B2 (ja) エコー消去装置及びそのプログラム
JP5671147B2 (ja) 後期残響成分のモデリングを含むエコー抑制
JP4210521B2 (ja) 雑音低減法および装置
WO2018119470A1 (en) Online dereverberation algorithm based on weighted prediction error for noisy time-varying environments
US9866792B2 (en) Display apparatus and echo cancellation method thereof
CN108172231A (zh) 一种基于卡尔曼滤波的去混响方法及系统
WO2014181330A1 (en) A method and apparatus for suppression of unwanted audio signals
JP2003534570A (ja) 適応ビームフォーマーにおいてノイズを抑制する方法
CN111213359B (zh) 回声消除器和用于回声消除器的方法
JP2013068809A (ja) 残響抑制装置および残響抑制方法並びに残響抑制プログラム
WO2017160294A1 (en) Spectral estimation of room acoustic parameters
JP2011509008A (ja) 雑音抑圧方法及び装置
KR102190833B1 (ko) 에코 억제
JP4834046B2 (ja) エコー消去装置、エコー消去方法、エコー消去プログラム、記録媒体
JP2016090799A (ja) 雑音抑圧装置、その方法及びプログラム
JP5662232B2 (ja) エコー消去装置、その方法及びプログラム
JP3673727B2 (ja) 反響消去方法、その装置、そのプログラム及びその記録媒体
CN111989934A (zh) 回声消除装置、回声消除方法、信号处理芯片及电子设备
CN115604627A (zh) 音频信号处理方法、装置、电子设备及可读存储介质
JP6143702B2 (ja) エコー消去装置、その方法及びプログラム
KR102045953B1 (ko) 칼만필터 기반의 다채널 입출력 음향학적 반향 제거 방법
KR100754558B1 (ko) 주기 신호 향상 시스템
KR100545832B1 (ko) 간섭신호에 강인한 음향 반향 제거장치
KR20220157475A (ko) 반향 잔류 억제

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20121225

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130218

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130319

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130325

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 5235226

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160405

Year of fee payment: 3

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350