JP2007060644A - 信号処理装置 - Google Patents
信号処理装置 Download PDFInfo
- Publication number
- JP2007060644A JP2007060644A JP2006203418A JP2006203418A JP2007060644A JP 2007060644 A JP2007060644 A JP 2007060644A JP 2006203418 A JP2006203418 A JP 2006203418A JP 2006203418 A JP2006203418 A JP 2006203418A JP 2007060644 A JP2007060644 A JP 2007060644A
- Authority
- JP
- Japan
- Prior art keywords
- echo
- signal
- unit
- amount
- suppression
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
- Telephone Function (AREA)
Abstract
スの変動を含むエコーパス変動に対する頑健性を高めた信号処理装置を提供する。
【解決手段】 送話入力信号に対して少なくともエコーを抑圧しエコー低減信号を出力す
るエコーキャンセラ部(EC)110と、上記送話入力信号と上記エコー低減信号を入力
し、エコー及びノイズの少なくとも一方を抑圧するエコーリダクション部(ER)111
と、を備え、エコーリダクション部(ER)111は、上記送話入力信号と上記エコー低
減信号のどちらか一方を選択して出力するスペクトル選択部111Lを備え、スペクトル
選択部111Lで選択された上記送話入力信号及びエコー低減信号のいずれかについてエ
コー及びノイズの少なくとも一方を抑圧する。
【選択図】 図1
Description
号以外の信号、すなわち音響エコーなどを抑圧する処理が種々知られている。また、この
処理を、前段の処理と後段の処理との2段階に分けて行うことにより、高い性能が得られ
ることが知られている。
が抑圧された送話出力信号を用いた短時間スペクトラル振幅推定を行い、その推定値に基
づいてエコー抑圧を行う技術が知られている(例えば、特許文献1参照。)。
まれるエコーを抑圧する処理を行い、後段では、前段で生じた擬似エコー信号に基づいて
エコーまたはノイズの抑圧を行う技術が知られている(例えば、特許文献2参照。)。
処理(適応フィルタ)と後段の非線形エコー抑圧処理とを結合させた場合、ダブルトーク
かつエコーパス変動時に、エコー経路の音響結合量(エコーパスロス)は大幅に変化しな
いものと仮定して適応フィルタのフィルタ係数を転用する。このため、ダブルトーク中の
エコーパスロスの変動時など適応フィルタが追従できない場合、充分にエコー抑圧できな
い問題点があった。
フィルタによる前段のエコーパス追従性に、最終の出力である送話出力信号のエコーパス
追従性が依存することになる問題点があった。つまり、前段で、適応フィルタによるエコ
ー推定が精度よくできる前提となっており、急激なエコーパス変動やダブルトーク中のエ
コーパスロスの変動では後段の出力である送話出力信号にエコーが残留しやすい問題点が
あった。
急激なエコーパス変動時に、線形処理であるか非線形処理であるかを問わず、前段で行わ
れるエコー抑圧の性能が充分でない場合、後段で行われるエコー抑圧処理、またはノイズ
抑圧処理、更には、それらを組み合わせた処理において、前段の出力信号中の残留エコー
により、エコー量推定及びノイズ量推定の精度が劣化する。この劣化のため、後段で行わ
れるエコー抑圧処理の性能、及びノイズ抑圧処理の性能が充分でないという問題があった
。この問題点は、後段で行われるボイススイッチにおけるエコーサプレス処理においても
顕著である。
またはノイズ抑圧性能を向上させ、エコーパスロスの変動を含むエコーパス変動に対する
頑健性を高めた信号処理装置を提供することを目的とする。
エコーを抑圧してエコー低減信号を出力する第1の信号処理手段と、前記入力信号と前記
エコー低減信号とを入力し、エコー及びノイズの少なくとも一方を抑圧する第2の信号処
理手段と、を備え、前記第2の信号処理手段は、前記入力信号と前記エコー低減信号との
どちらか一方を選択する選択手段を有し、前記選択手段によって選択された前記入力信号
及び前記エコー低減信号のいずれか一方の前記エコー及び前記ノイズの少なくとも一方を
抑圧することを特徴とする。
ーパスロスの変動を含むエコーパス変動に対する頑健性を高めた信号処理装置を提供する
ことができる。
図1は、本発明の第1の実施形態に係る信号処理装置の構成を示すブロック図である。
この信号処理装置は、通信部(COM)101と、遅延処理部(DELAY)102と、
D/A変換器(D/A)103と、受話増幅器104と、スピーカ105と、マイクロホ
ン106と、送話増幅器107と、A/D変換器(A/D)108と、ハイパスフィルタ
部(HPF)109と、エコーキャンセラ部(EC)110と、エコーリダクション部(
ER)111とからなる。
ーキャンセラ部(EC)110は、遅延処理部(DELAY)102と接続される適応フ
ィルタ部(ADF)110aと、ハイパスフィルタ部(HPF)109と接続され、また
、後述するエコーリダクション部(ER)111の周波数領域変換処理部(FT)111
cと接続される信号減算処理部110bと、遅延処理部(DELAY)102と接続され
、後述するエコーリダクション部(ER)111の周波数領域変換処理部(FT)111
c及び制御部(CTRL)111kと接続されるダブルトーク検出部(DTD)110c
とからなる。
コーリダクション部(ER)111は、遅延処理部(DELAY)102と接続される周
波数領域変換処理部(FT)111aと、ハイパスフィルタ部(HPF)109と接続さ
れる周波数領域変換処理部(FT)111bと、エコーキャンセラ部(EC)110の信
号減算処理部110bと接続される周波数領域変換処理部(FT)111cと、受話パワ
ー算出部(POW)111dと、送話パワー算出部(POW)111eと、残差パワー算
出部(POW)111fと、音響結合量推定部(ACLE)111gと、エコー量推定部
(ELE)111hと、エコー抑圧量推定部(ECLE)111iと、周波数領域ダブル
トーク検出部(FDTD)111jと、エコーキャンセラ部(EC)110のダブルトー
ク検出部(DTD)110cと接続される制御部(CTRL)111kと、スペクトル選
択部111Lと、ゲイン格納部(GTBL)111mと、エコー抑圧ゲイン算出部(GC
AL)111nと、信号抑圧部(SS)111oと、通信部(COM)101と接続され
る周波数領域逆変換処理部(IFT)111pとからなる。
、図1〜図4を参照して説明する。
られた処理時間の単位、つまり1フレーム(Nサンプル)ごとにディジタル信号に復号化
する。但し、このサンプリング周波数をfS[Hz]とする。そして、通信部(COM)
101はこの復号化されたディジタル信号を1フレームごとに受話入力信号x[n](n
=0,1,・・・,N−1)として出力する。
力された送話信号s’[n](n=0,1,・・・,N−1)を入力とし、符号化して、
送信データとして通信相手に出力する。
力された受話入力信号x[n]を入力とし、一時的に格納して、事前に決められた時間分
(Dサンプル)ディジタル処理によって遅延させる処理を行い出力する。
号x[n]を入力とし、アナログ信号に変換して出力する。
力とし、増幅して出力する。
、音響空間へ信号x(t)として出力する。
号x(t)と、送話音声信号s(t)とが音響結合した信号z(t)を収音し、アナログ
信号に変換して出力する。
、増幅して出力する。
グ信号を入力とし、1フレームごとにディジタル信号に変換して出力する。
たディジタル信号を入力とし、オフセット(直流成分)除去をし、送話入力信号z[n]
(n=0,1,・・・,N−1)として出力する。
された送話入力信号z[n]と、遅延処理部(DELAY)102から出力された遅延し
た受話入力信号x[n−D]を入力とし、送話入力信号z[n]からエコー成分を抑圧し
、そのエコー抑圧後の信号を残差信号e[n](n=0,1,・・・,N−1)として出
力する。更に、ダブルトーク情報ECstate[n]を出力する。
・・・,L−1)が可変のトランスバーサルフィルタ(Transversal Filter)で構成され
る適応フィルタである。
遅延した受話入力信号x[n−D]と、信号減算処理部110bから出力されたエコー抑
圧後の1サンプル前の残差信号e[n−1]と、ダブルトーク検出部(DTD)110c
から出力されたダブルトーク情報ECstate[n]とを入力とし、ダブルトーク情報
ECstate[n]がダブルトーク状態でなかった場合はフィルタ係数h[i]をサン
プルnごとに適応学習し、ダブルトーク情報ECstate[n]がダブルトーク状態で
あった場合は、適応学習を行わない。
力された遅延した受話入力信号x[n−D]とフィルタ係数h[i]を用いて擬似エコー
信号y’[n](n=0,1,・・・,N−1)を算出して出力する。
あるいは可変のステップサイズμT[n](n=0,1,・・・,N−1)を用いて適応
学習を行う。
ルゴリズム、NLMS(Normalized-Least-Mean-Square)アルゴリズム、学習同定法、ア
フィン射影(AP:Affine-Projection)アルゴリズム、逐次最小二乗(RLS:Recursi
ve-Least-Squares)アルゴリズムなどの線形適応アルゴリズムに基づく適応フィルタや勾
配制限型学習同定法(Gradient-limited Normalized-Least-Mean-Square)、適応ボルテ
ラフィルタ(Adaptive Volterra Filter)などの非線形適応アルゴリズムに基づく適応フ
ィルタで構成される。また、本実施形態では時間領域型適応フィルタの例を示しているが
、サブバンド型(帯域分割型)・周波数領域型で用いる適応フィルタで構成してもよい。
入力信号z[n]と、適応フィルタ部(ADF)110aから出力された擬似エコー信号
y’[n]を入力とし、送話入力信号z[n]から擬似エコー信号y’[n]をサンプル
nごとに減算することでエコー成分を抑圧し、そのエコー抑圧後の信号である残差信号e
[n]を出力する。
出力された送話入力信号z[n]と、遅延処理部(DELAY)102から出力された遅
延した受話入力信号x[n−D]と、信号減算処理部110bから出力された1サンプル
前の残差信号e[n−1]を入力とし、サンプルnごとにダブルトーク状態か否かを判定
する。
ー特性(パワー値またはピーク値。以下、「パワー特性」と称する。)PZ[n](n=
0,1,・・・,N−1)と遅延した受話入力信号x[n−D]のパワー特性PX[n]
(n=0,1,・・・,N−1)と残差信号e[n]のパワー特性PE[n](n=0,
1,・・・,N−1)とをサンプルnごとに算出し、PE[n]>λ[n]・PX[n]
またはPZ[n]>δ・PX[n]となる場合にダブルトーク状態と判定する。ここで、
λ[n](n=0,1,・・・,N−1)はエコーパスロスの推定値であり、フィルタ係
数h[i](i=0,1,・・・,L−1)を適応学習したサンプルnごとに算出し、適
応学習が進めば小さくなり、適応学習が間違っていれば大きくなる可変量である。また、
δは動作開始前に外部から予め設定可能な固定値である。そして、ダブルトーク検出部(
DTD)110cは、ダブルトーク状態か否かの情報であるダブルトーク情報ECsta
te[n]を出力する。
,・・・,L−1)、ステップサイズμT[n]、エコーパスロスの推定値λ[n]、ダ
ブルトーク情報ECstate[n]、受話入力信号のパワー特性PX[n]、送話入力
信号のパワー特性PZ[n]、残差信号のパワー特性PE[n](n=0,1,・・・,
N−1)を内部状態としてメモリに保持している。ここで、内部状態とは少なくとも時間
に従って変化する変数の集合を指し、これ以降説明を省略する。
であっても構わない。この場合、適応フィルタ部(ADF)110aと制御部(CTRL
)111kは、ダブルトーク情報ECstate[n]がダブルトーク状態でないことを
示す場合の動作をする。
れた遅延した受話入力信号x[n−D]と、ハイパスフィルタ部(HPF)109から出
力された送話入力信号z[n]と、信号減算処理部110bから出力された残差信号e[
n]と、ダブルトーク検出部(DTD)110cから出力されたダブルトーク情報ECs
tate[n]とを入力とし、送話入力信号z[n]あるいは残差信号e[n]の少なく
とも一方からエコー成分を抑圧し、そのエコー抑圧後の信号を送話出力信号s’[n](
n=0,1,・・・,N−1)として1フレームごとに出力する。
された遅延した受話入力信号x[n−D]を入力として、FFT(Fast Fourier Transfo
rm)などの処理によって周波数領域に変換して、受話入力信号の周波数スペクトルX[f
,ω]を算出して出力する。
出力された送話入力信号z[n]をFFTなどによって周波数領域に変換して、送話入力
信号の周波数スペクトルZ[f,ω]を算出して出力する。
差信号e[n]をFFTなどによって周波数領域に変換して、残差信号の周波数スペクト
ルE[f,ω]を算出して出力する。
周波数領域変換処理部(FT)111cは、適宜、ハミング窓などによる窓掛けや、過去
のフレームを用いたり零補間したりオーバーラップを行う。例えば、過去1フレーム分と
当該フレームからFFT点数分の信号を取り出し、ハミング窓による窓掛けを行い、FF
Tを行う。
出力された受話入力信号の周波数スペクトルX[f,ω]を入力とし、そのパワースペク
トルである受話パワースペクトル|X[f,ω]|2を算出して出力する。そして、音響
結合量は通常時間的に急に変化しないので、瞬時値を用いるよりもスムージングした値を
用いた方が音響結合量を精度良く推定できるため、受話パワー算出部(POW)111d
は、例えば、式1に示すように1フレーム前の値|XS[f−1,ω]|2を用いてスム
ージングした受話パワースペクトル|XS[f,ω]|2を算出して出力する。ただし、
αX[ω]は、0.75〜0.999程度が望ましい。
出力された送話入力信号の周波数スペクトルZ[f,ω]を入力とし、そのパワースペク
トルである送話パワースペクトル|Z[f,ω]|2を算出して出力する。そして、音響
結合量は通常時間的に急に変化しないので、瞬時値を用いるよりもスムージングした値を
用いた方が音響結合量を精度良く推定できるため、送話パワー算出部(POW)111e
は、例えば、式2に示すように1フレーム前の値|ZS[f−1,ω]|2を用いてスム
ージングした送話パワースペクトル|ZS[f,ω]|2を算出して出力する。ただし、
αZ[ω]は、0.75〜0.999程度が望ましい。
出力された残差信号の周波数スペクトルE[f,ω]を入力とし、そのパワースペクトル
である残差パワースペクトル|E[f,ω]|2を算出して出力する。そして、音響結合
量は通常時間的に急に変化しないので、瞬時値を用いるよりもスムージングした値を用い
た方が音響結合量を精度良く推定できるため、残差パワー算出部(POW)111fは、
例えば、式3に示すのように1フレーム前の値|ES[f−1,ω]|2を用いてスムー
ジングした残差パワースペクトル|ES[f,ω]|2を算出して出力する。ただし、α
E[ω]は、0.75〜0.999程度が望ましい。
出力されたスムージングされた受話パワースペクトル|XS[f,ω]|2と、送話パワ
ー算出部(POW)111eから出力されたスムージングされた送話パワースペクトル|
ZS[f,ω]|2と、周波数領域ダブルトーク検出部(FDTD)111jから出力さ
れる周波数領域ダブルトーク情報ERstate[f,ω]とを入力とし、エコーキャン
セラ部(EC)110の性能の影響を受けないように残差信号に基づく|ES[f,ω]
|2を用いずに送話入力信号に基づく|ZS[f,ω]|2を用いて、周波数帯域ω毎に
音響結合量|H[f,ω]|2を例えば、以下の式4によって算出する。このようにする
ことで、後述する第5の実施形態に係る信号処理装置と比較して、計算量を少なくするこ
とができ、各パラメータの格納に必要なメモリ量も少なくすることができる。
の値を用いてスムージングした音響結合量|HS[f,ω]|2を算出して出力する。た
だし、αH[ω]は、0.03〜0.99程度が望ましい。
とで音響結合量|HS[f,ω]|2の更新を速めておく。このようにすることで通話開
始初期時は音響結合量が初期化されているので、通話開始初期時に抑圧量が少なくなって
しまうのを防止することができる。
域ダブルトーク情報ERstate[f,ω]がダブルトーク状態である場合、あるいは
音響結合量が急激に変化する場合、即ち、|HS[f,ω]|2>βH[ω]・|HS[
f−1,ω]|2が満たされる場合、あるいは受話入力信号が十分に大きくない場合、即
ち、|XS[f,ω]|2<βX[ω]が満たされる場合には、エコーパス変動への高速
な追従性を保ちつつ、ダブルトークとなる周波数帯域での音響結合量の算出を行わないよ
うにするため、音響結合量推定部(ACLE)111gは、音響結合量を更新しないで1
フレーム前の過去の音響結合量|HS[f−1,ω]|2を用いる。極端な音響結合量の
変化はダブルトークの可能性があるので、このように音響結合量を更新しないでおくこと
で送話音質劣化を防止することができる。ただし、βH[ω]は0.9〜30程度が望ま
しい。βX[ω]は30dB〜40dB程度が望ましい。
されたスムージングされた受話パワースペクトル|XS[f,ω]|2と、音響結合量推
定部(ACLE)111gから出力された音響結合量|HS[f,ω]|2とを入力とし
、送話入力信号の周波数スペクトルZ[f,ω]に含まれるエコー量|Y[f,ω]|2
を以下の式6のように周波数帯域ω毎に推定して出力する。
用いるよりもスムージングした値を用いた方がエコー抑圧後の信号をより自然な信号にで
きるため、以下の式7のように1フレーム前の値を用いてスムージングしたエコー量|Y
S[f,ω]|2を周波数帯域ω毎に算出して出力する。ただし、αY[ω]は0.7〜
0.99程度が望ましい。
ら出力された送話パワースペクトル|Z[f,ω]|2と、残差パワー算出部(POW)
111fから出力された残差パワースペクトル|E[f,ω]|2とを入力とし、それら
のパワースペクトル間の相違を示す量を計算することによって、エコーキャンセラ部(E
C)110で抑圧されたエコー抑圧量ECL[f,ω]を周波数帯域ω毎に推定して出力
する。具体的には、以下に示す式8に示すように算出する。もちろん、これら2つのパワ
ースペクトルの差などを用いてもよい。
111dから出力されたスムージングされた受話パワースペクトル|XS[f,ω]|2
と、残差パワー算出部(POW)111fから出力されたスムージングされた残差パワー
スペクトル|ES[f,ω]|2と、エコー量推定部(ELE)111hから出力された
1フレーム前のエコー量|Y[f−1,ω]|2とを入力とし、周波数帯域ω毎に以下に
示す式9が満たされるか否かの判定を行う。
ルを残差パワースペクトルとエコー量の距離で代用し、それが十分に受話パワースペクト
ルよりも小さくなっているか否かを判定に用いる。そして、閾値βY[ω]よりも大きけ
れば、即ち、式9が満たされる場合、ダブルトーク状態と判定し、式9が満たされない場
合、ダブルトーク状態でないと判定して、ダブルトーク状態か否かの情報を周波数領域ダ
ブルトーク情報ERstate[f,ω]として出力する。これにより、計算量が小さい
周波数領域DTDが実現できる。
クション部(ER)111であっても構わない。この場合、音響結合量推定部(ACLE
)111gと制御部(CTRL)111kは、周波数領域ダブルトーク情報ERstat
e[f,ω]がダブルトーク状態でないことを示す場合の動作をする。ただし、βY[ω
]は1.0〜20程度が望ましい。
れたエコー抑圧量ECL[f,ω]と、ダブルトーク検出部(DTD)110cから出力
されたダブルトーク情報ECstate[n]と、周波数領域ダブルトーク検出部(FD
TD)111jから出力される周波数領域ダブルトーク情報ERstate[f,ω]と
を入力とし、周波数帯域ω毎にダブルトーク状態かつエコーキャンセラ部(EC)110
のエコー抑圧量が十分でない周波数帯域を検出して、ダブルトーク状態かつエコーキャン
セラ部(EC)110のエコー抑圧量が十分でない周波数帯域であるか否かの情報である
制御情報ERcontrol1[f,ω]及びERcontrol2[f,ω]を出力す
る。
f,ω]を用いて周波数帯域ω毎に周波数領域ダブルトーク検出部(FDTD)111j
でダブルトーク状態と判定されているか否か、ダブルトーク情報ECstate[n]を
用いてエコーキャンセラ部(EC)110のダブルトーク検出部(DTD)110cが当
該フレームでダブルトーク状態と1サンプルでも判定されているか否か、によって周波数
帯域ω毎にダブルトーク状態であるか否かを判定する。
ク情報ECstate[n]のいずれか1つ、または双方がダブルトーク状態であること
を示していれば、制御部(CTRL)111kは周波数帯域ω毎にダブルトーク状態であ
ると判定する。
cから出力されたダブルトーク情報ECstate[n]を用いれば、エコーキャンセラ
部(EC)110のエコー抑圧量が十分でない状況は、ダブルトーク中のエコーパス変動
で生じやすいため、ダブルトーク状態かつエコーキャンセラ部(EC)110のエコー抑
圧量が十分でない周波数帯域を精度よく検出することできる。
ω]を満たした周波数帯域をエコーキャンセラ部(EC)110のエコー抑圧量が十分で
ないと判定する。ただし、βZ1[ω]は+8dB〜−15dB程度が望ましい。本実施
形態では以下、βZ1[ω]を0dBとして説明する。
いうことはありえにくい、つまりエコーキャンセラ部(EC)110の性能は時間領域で
切り替わると考えられるため、制御部(CTRL)111kは、エコーキャンセラ部(E
C)110のエコー抑圧量が十分でない周波数帯域を精度よく検出するために、併せて、
1フレーム当りの不等式ECL[f,ω]>βZ1[ω]が成立した帯域数countも
加味してエコー抑圧量が少ないと判定する。
抑圧量が少ないと判定する。ただし、βC1は全周波数帯域数の10%〜40%程度が望
ましい。このようにすることで周波数帯域毎だけで判定するよりも受話入力信号と送話入
力信号の音量差に対して頑健になりエコー抑圧量が十分でないフレームを精度よく検出す
ることができる。そして、先の周波数帯域ω毎にダブルトーク状態の判定と併せて、制御
部(CTRL)111kは、ダブルトーク状態かつエコーキャンセラ部(EC)110の
エコー抑圧量が十分でない周波数帯域を検出して制御情報ERcontrol1[f,ω
]を出力する。
βZ2[ω]が成立した帯域数countも加味して、ECL[f,ω]>βZ2[ω]
かつcount>βC2、となる場合にエコー抑圧量が少ないと判定して、先の周波数帯
域ω毎にダブルトーク状態の判定と併せて、制御情報ERcontrol2[f,ω]を
出力する。ただし、βZ2[ω]は+8dB〜−15dB程度、βC2は全周波数帯域数
の10%〜40%程度が望ましい。
送話入力信号の周波数スペクトルZ[f,ω]と、周波数領域変換処理部(FT)111
cから出力された残差信号の周波数スペクトルE[f,ω]と、制御部(CTRL)11
1kから出力されたダブルトーク状態かつエコーキャンセラ部(EC)110のエコー抑
圧量が十分でない周波数帯域であるか否かの情報である制御情報ERcontrol1[
f,ω]とを入力とし、送話入力信号の周波数スペクトルZ[f,ω]あるいは残差信号
の周波数スペクトルE[f,ω]のいずれか一方を周波数スペクトルとして選択して出力
する。
キャンセラ部(EC)110のエコー抑圧量が十分でないと検出された周波数帯域であっ
た場合は、スペクトル選択部111Lは、周波数スペクトルとして送話入力信号の周波数
スペクトルZ[f,ω]を選択する。それ以外の周波数帯域は周波数スペクトルとして残
差信号の周波数スペクトルE[f,ω]を選択する。
抑圧量が十分でない場合、つまりエコーキャンセラ部(EC)110の推定精度が十分と
れない場合はエコーリダクション部(ER)111を単体で動作させることができる。
るパラメータγ[ω]を格納して出力する。ただし、γ[ω]は1.0〜2.0程度が望
ましい。
eから出力されたスムージングされた送話パワースペクトル|ZS[f,ω]|2と、エ
コー量推定部(ELE)111hから出力されたスムージングしたエコー量|YS[f,
ω]|2と、ゲイン格納部(GTBL)111mから出力されたパラメータγ[ω]と、
エコー抑圧量推定部(ECLE)111iから出力されたエコー抑圧量ECL[f,ω]
と、制御部(CTRL)111kから出力されたダブルトーク状態かつエコーキャンセラ
部(EC)110のエコー抑圧量が十分でない周波数帯域であるか否かの情報である制御
情報ERcontrol2[f,ω]とを入力とし、エコー抑圧ゲインG[f,ω]を算
出して出力する。
ーキャンセラ部(EC)110のエコー抑圧量が十分でないと検出された周波数帯域につ
いては、エコー抑圧ゲイン算出部(GCAL)111nは、エコー抑圧ゲインG[f,ω
]をウィナー・フィルタ(Wiener Filter)法を用いて、式10によって算出する。この
ように算出することで、ダブルトーク状態かつエコーキャンセラ部(EC)110のエコ
ー抑圧量が十分でないと検出された周波数帯域については、エコーリダクション部(ER
)111単体でエコー抑圧することができる。
キャンセラ部(EC)110のエコー抑圧量が十分であり、エコーキャンセラ部(EC)
110が正常に機能していると見なして、エコーリダクション(ER)111のエコー抑
圧量を多くするように、エコーキャンセラ部(EC)110のエコー抑圧量ECL[f,
ω]を用いて補正し、エコー抑圧ゲインG[f,ω]を以下の式11が示すように算出す
る。
音声の品質が劣化するのを防止し、背景雑音の断続的な抑圧を防止するため、エコー抑圧
ゲインG[f,ω]が所定の下限値以下にならないように制御する。
の下限値を帯域別にバスタブ曲線状、即ち、最低域(0からfS/16[Hz])側及び
最高域(7・fS/16からfS/2[Hz])側を0.04から0.12程度に大きく
し、中域(fS/8から3・fS/8[Hz])付近を0.01から0.05程度に小さ
くするように設定する。なぜなら、最低域側や最高域側に抑圧できなかったエコー成分が
残ると耳障りであるので、そのエコー成分を抑圧しやすくすることができて送話音声を聴
感上よくすることができる。勿論、図4の点線が示すようにバスタブ曲線を段階的に変化
する一定値として設定してもかまわない。
話音声の品質が劣化するのを防止するため、送話入力信号z[n]あるいは残差信号e[
n]の有音区間ではない区間の信号レベルを用いて周波数帯域ごとに背景雑音レベルを算
出しておき、背景雑音レベルよりも抑圧しないようにエコー抑圧ゲインを制御しても構わ
ない。
を防止するために、エコー抑圧ゲインG[f,ω]を以下の式12−1あるいは式12−
2が示すように周波数方向にスムージングして出力してもよい。例えば、εjは、[0.
1、0.2、0.4、0.2、0.1]、ηjは、[0.1、0.2、0.4、0.8、
0.4、0.2、0.1]のようにしてよい。
クトルと、エコー抑圧ゲイン算出部(GCAL)111nから出力されたエコー抑圧ゲイ
ンG[f,ω]とを入力として、スペクトル選択部111Lから出力された周波数スペク
トルのエコーを抑圧し、以下の式13−1あるいは式13−2が示すように送話出力信号
のスペクトルS’[f,ω]として出力する。
ルE[f,ω]とのどちらの周波数スペクトルがスペクトル選択部111Lで選択されて
も、エコーキャンセラ部(EC)110は時間領域での処理であるから、位相スペクトル
に差がないため、出力された送話出力信号は聴感上滑らかにつなぐことができる。
control1[f,ω]と、制御部(CTRL)111kからエコー抑圧ゲイン算出
部(GCAL)111nへ出力される制御情報ERcontrol2[f,ω]とは異な
っていても構わない。例えば、制御部(CTRL)111kのパラメータβZ1[ω]及
びβC1の値とβZ2[ω]及びβC2を異なる値にすることで、制御情報ERcont
rol1[f,ω]のダブルトーク状態かつエコー抑圧量が十分でないと検出される条件
を包含するように、制御情報ERcontrol2[f,ω]のダブルトーク状態かつエ
コー抑圧量が十分でないと検出される条件を広く設定する。こうするに、2つの制御情報
を用いることによって、エコー抑圧ゲインをスムージングした場合に、送話音声の品質劣
化を防止できる。
された周波数スペクトルS’[f,ω]を入力とし、IFFT(Inverse Fast Fourier T
ransform)などによって送話出力信号s’[n](n=0,1,・・・,N−1)を算出
して出力する。このとき適宜、周波数領域変換処理部(FT)111b及び周波数領域変
換処理部(FT)111cの窓掛けを考慮して、過去のフレームのs’[n]を用いてオ
ーバーラップを戻す処理を行う。
図7を参照して説明する。図5は、全体の処理の流れを示すフローチャートであり、図6
はエコーキャンセラ部(EC)110における処理の流れを示すフローチャートであり、
図7はエコーリダクション部(ER)111における処理の流れを示すフローチャートで
ある。
る処理を行い、また各パラメータや各バッファの初期化などの初期設定処理を行う(ステ
ップS1001)。通信リンクが確立することにより、通信相手と双方向通話が可能な状
態となり、双方向の通話が開始されると、通信部(COM)101にあり図示されないデ
コーダは1フレームごとに復号化され受話入力信号x[n]として読み込む。また、マイ
クロホン106を介して送話入力信号z[n]が読み込まれる(ステップS1002)。
除去処理を行う(ステップS1003)。また、遅延処理部(DELAY)102は受話
入力信号x[n]を一時的に蓄えて遅延させる処理を行う(ステップS1004)。これ
ら遅延した受話入力信号x[n−D]とオフセット除去された送話入力信号z[n]を入
力として、エコーキャンセラ部(EC)110はエコーキャンセラ処理を行う(ステップ
S1005)。
[n]と、エコーキャンセラ部(EC)110から出力されたエラーキャンセラ処理後の
信号である残差信号e[n]を入力として、エコーリダクション部(ER)111は非線
形エコー抑圧処理であるエコーリダクション処理を行う(ステップS1006)。そして
、ステップS1002からステップS1006の処理を、通話が終了するまで行う(ステ
ップS1007)。
ダブルトーク検出部(DTD)110cがダブルトーク検出処理を行う(ステップS11
01)。次に、適応フィルタ部(ADF)110aはダブルトーク情報ECstate[
n]の制御を受けながら、適応フィルタ処理を行う(ステップS1102)。そして、信
号減算処理部110bは、送話入力信号z[n]から、適応フィルタ部(ADF)110
aから出力された擬似エコー信号y’[n]を減算し、残差信号e[n]を算出して出力
し、エコーキャンセラ処理が終了する。
、周波数領域変換処理部(FT)111a、周波数領域変換処理部(FT)111b、周
波数領域変換処理部(FT)111cは、それぞれ周波数領域に変換するためのバッファ
である受話フレーム、送話フレーム、残差フレームを更新する(ステップS1201r、
S1201s、S1201e)。
周波数領域に変換して、受話入力信号の周波数スペクトルX[f,ω]を算出して(ステ
ップS1202r)、受話パワー算出部(POW)111dは受話パワースペクトル|X
[f,ω]|2及びスムージングされた受話パワースペクトル|XS[f,ω]|2を算
出する(ステップS1203r)。
に変換して、送話入力信号の周波数スペクトルZ[f,ω]を算出して(ステップS12
02s)、送話パワー算出部(POW)111eは送話パワースペクトル|Z[f,ω]
|2及びスムージングされた送話パワースペクトル|ZS[f,ω]|2を算出する(ス
テップS1203s)。
域に変換して、残差信号の周波数スペクトルE[f,ω]を算出して(ステップS120
2e)、残差パワー算出部(POW)111fは残差パワースペクトル|E[f,ω]|
2及びスムージングされた残差パワースペクトル|ES[f,ω]|2を算出する(ステ
ップS1203e)。
ク情報ERstate[f,ω]を出力し、音響結合量推定部(ACLE)111gは、
スムージングされた受話パワースペクトル|XS[f,ω]|2とスムージングされた送
話パワースペクトル|ZS[f,ω]|2と、周波数領域ダブルトーク情報ERstat
e[f,ω]とを入力として音響結合量|HS[f,ω]|2を算出する(ステップS1
204)。エコー量推定部(ELE)111hは、音響結合量|Hs[f,ω]|2とス
ムージングした受話パワースペクトル|XS[f,ω]|2とを入力として送話入力信号
に含まれるエコー量|YS[f,ω]|2を推定する(ステップS1205)。
ω]|2と残差パワースペクトル|E[f,ω]|2とを入力として、エコーキャンセラ
部(EC)110で抑圧されたエコー抑圧量ECL[f,ω]を推定する(ステップS1
206)。そして、制御部(CTRL)111kは、ダブルトーク状態であるか否か、及
びエコーキャンセラ部(EC)110のエコー抑圧量が十分であるか否かの判定処理を行
い、制御情報ERcontrol1[f,ω]及びERcontrol2[f,ω]を出
力する(ステップS1207)。
eから出力されたスムージングされた送話パワースペクトル|ZS[f,ω]|2と、エ
コー量推定部(ELE)111hから出力されたスムージングしたエコー量|YS[f,
ω]|2と、ゲイン格納部(GTBL)111mから出力されたパラメータγ[ω]と、
エコー抑圧量推定部(ECLE)111iから出力されたエコー抑圧量ECL[f,ω]
と、制御部(CTRL)111kから出力された制御情報ERcontrol2[f,ω
]とを入力として、ダブルトーク状態かつエコー抑圧量が十分でないと検出された周波数
帯域と、それ以外の周波数帯域とで、それぞれ異なる計算によってエコー抑圧ゲインG[
f,ω]を算出する。また、エコー抑圧ゲイン算出部(GCAL)111nはエコー抑圧
ゲインG[f,ω]を所定の下限値以下にならないように制御する(ステップS1208
)。
情報ERcontrol1[f,ω]を入力として、ダブルトーク状態かつエコー抑圧量
が十分でないと検出された周波数帯域では、周波数スペクトルとして送話入力信号の周波
数スペクトルZ[f,ω]を選択し、それ以外の周波数帯域では周波数スペクトルとして
残差信号の周波数スペクトルE[f,ω]を選択する(ステップS1209)。
数スペクトルと、エコー抑圧ゲイン算出部(GCAL)111nで算出されたエコー抑圧
ゲインG[f,ω]を入力として、選択された周波数スペクトルのエコーを抑圧する(ス
テップS1210)。最終的に、周波数領域逆変換処理部(IFT)111pは、信号抑
圧部(SS)111oから出力された周波数スペクトルS’[f,ω]を周波数逆変換処
理することによって(ステップS1211)、エコーリダクション処理が終了する。
[n]は、通信部(COM)101にあり図示しないエンコーダによって1フレームごと
に符号化され、この符号化によって得られたデータは、通信部(COM)101を通じて
、送信データとして通信相手に送信される。
帯域毎に処理する方式として動作するものとして説明した。FFTによる周波数帯域をグ
ループでまとめて周波数帯域グループ毎に処理する方式や、フィルタバンクなどの帯域分
割フィルタなどの周波数領域型を実現してもよい。
0の処理によって送話入力信号z[n]よりも残差信号e[n]が大きくなってしまい、
エコーキャンセラ部(EC)110の処理によるエコー抑圧量が十分でない場合がある。
0の処理によるエコー抑圧量が十分でない周波数領域をエコー抑圧量推定部(ECLE)
111iと制御部(CTRL)111kで判定して、スペクトル選択部111Lとエコー
抑圧ゲイン算出部(GCAL)111nにおいて周波数帯域毎にエコーキャンセラ部(E
C)110の処理とエコーリダクション部(ER)111の処理の重みを変化させるよう
に制御することができるので、エコーパスロス変動に対して頑健にすることが可能であり
、高品質な送話出力信号を出力することが可能である。
本発明の第1の実施形態の変形例に係る信号処理装置が第1の実施形態に係る信号処理
装置と異なる点は、エコーリダクション部(ER)111に代えて、エコーリダクション
部(ER)1112を有する点である。図8に、本発明の第1の実施形態の変形例に係る
信号処理装置のエコーリダクション部(ER)1112の構成を示すブロック図を示す。
る点は、音響結合量推定部(ACLE)111gに代えて音響結合量推定部(ACLE)
111g2を有し、エコー抑圧ゲイン算出部(GCAL)111nに代えてエコー抑圧ゲ
イン算出部(GCAL)111n2を有する点にある。
111eの出力をエコー抑圧量推定部(ECLE)111iのみに入力させ、残差パワー
算出部(POW)111fの出力をエコー抑圧量推定部(ECLE)111iと周波数領
域ダブルトーク検出部(FDTD)111jに加えて、音響結合量推定部(ACLE)1
11g2とエコー抑圧ゲイン算出部(GCAL)111n2にも入力させた点にあり、そ
の他の部分は同じである。そこで、このエコーリダクション部(ER)1112で、エコ
ーリダクション部(ER)111と同じ部分については、同じ符号を付してその説明を省
略する。
ら出力されたスムージングされた受話パワースペクトル|XS[f,ω]|2と、残差パ
ワー算出部(POW)111fから出力されたスムージングされた残差パワースペクトル
|ES[f,ω]|2と、周波数領域ダブルトーク検出部(FDTD)111jから出力
される周波数領域ダブルトーク情報ERstate[f,ω]とを入力とし、周波数帯域
ω毎に音響結合量|H[f,ω]|2を、|ES[f,ω]|2を用いて以下の式14に
よって算出する。
ム前の値を用いてスムージングした音響結合量|HS[f,ω]|2を算出して出力する
。ただし、αH[ω]は、0.03〜0.99程度が望ましい。
1fから出力されたスムージングされた残差パワースペクトル|ES[f,ω]|2と、
エコー量推定部(ELE)111hから出力されたスムージングしたエコー量|YS[f
,ω]|2と、ゲイン格納部(GTBL)111mから出力されたパラメータγ[ω]と
、エコー抑圧量推定部(ECLE)111iから出力されたエコー抑圧量ECL[f,ω
]と、制御部(CTRL)111kから出力されたダブルトーク状態かつエコーキャンセ
ラ部(EC)110のエコー抑圧量が十分でない周波数帯域であるか否かの情報である制
御情報ERcontrol2[f,ω]とを入力とし、エコー抑圧ゲインG[f,ω]を
算出して出力する。
111kから出力された制御情報ERcontrol2[f,ω]からダブルトーク状態
かつエコーキャンセラ部(EC)110のエコー抑圧量が十分でないと検出された周波数
帯域については、エコーキャンセラ部(EC)110のエコー抑圧量の分を増した抑圧量
をエコーリダクション(ER)1112のエコー抑圧量にするため、エコー抑圧ゲインG
[f,ω]をエコーキャンセラ部(EC)110のエコー抑圧量ECL[f,ω]を用い
て抑圧量を補正し以下の式16のように算出する。
ー抑圧ゲインG[f,ω]をウィナー・フィルタ(Wiener Filter)法を用いて、式17
−1によって算出する。あるいは、エコーキャンセラ部(EC)110が正常に機能して
いると見なして、エコーリダクション(ER)111のエコー抑圧量を多くするように、
エコーキャンセラ部(EC)110のエコー抑圧量ECL[f,ω]を用いて補正し、エ
コー抑圧ゲインG[f,ω]を以下の式17−2が示すように算出する。
動はほとんどなく、エコーキャンセラ部(EC)110の抑圧性能が安定していることが
多い用途では、エコーキャンセラ部(EC)110とエコーリダクション(ER)111
2の直列接続が選択されやすくなるので、過剰なエコー抑圧を防ぐことができ、送話音質
が劣化するのを防止することが可能である。
第2の実施形態に係る信号処理装置が第1の実施形態に係る信号処理装置と異なる点は
、図9に示すようにエコーリダクション部(ER)111を有さず、ノイズリダクション
部(NR)211を有する点にあり、その他の部分は同じである。そこで、同じ部分につ
いては、同じ符号を付してその説明を省略し、図面を参照して第2の実施形態に係るノイ
ズリダクション部(NR)211を説明する。なお、このノイズリダクション部(NR)
211で、第1の実施形態に係るエコーリダクション部(ER)111と同じ部分につい
ては、同じ符号を付してその説明を省略する。
の構成を示すブロック図である。このノイズリダクション部(NR)211は、周波数領
域変換処理部(FT)111bと、周波数領域変換処理部(FT)111cと、送話パワ
ー算出部(POW)111eと、残差パワー算出部(POW)111fと、エコー抑圧量
推定部(ECLE)111iと、制御部(CTRL)211kと、スペクトル選択部21
1Lと、ノイズ抑圧ゲイン算出部(GCAL)211nと、信号抑圧部(SS)211o
と、周波数領域逆変換処理部(IFT)111pと、雑音レベル推定部(NLE)211
qとからなる。
力された送話入力信号z[n]と、信号減算処理部110bから出力された残差信号e[
n]とを入力とし、送話入力信号z[n]あるいは残差信号e[n]の少なくとも一方か
らノイズ成分を抑圧し、そのノイズ抑圧後の信号を送話出力信号s’[n](n=0,1
,・・・,N−1)として1フレームごとに出力する。
出力された送話スペクトルZ[f,ω]と、周波数領域変換処理部(FT)111cから
出力された残差スペクトルE[f,ω]とを入力とし、有音ではない区間のスペクトルを
測定し、周波数帯域ω毎に送話スペクトルZ[f,ω]に含まれる雑音レベル|NZ[f
,ω]|2と残差スペクトルE[f,ω]に含まれる雑音レベル|NE[f,ω]|2と
を算出して出力する。
れたエコー抑圧量ECL[f,ω]を入力とし、周波数帯域ω毎にエコーキャンセラ部(
EC)110のエコー抑圧量が十分でない周波数帯域を検出して、エコーキャンセラ部(
EC)110のエコー抑圧量が十分でない周波数帯域であるか否かの情報である制御情報
NRcontrol[f,ω]を出力する。
]>βZ[ω]を満たした周波数帯域であり、かつ1フレーム当りの不等式ECL[f,
ω]>βZ[ω]が成立した帯域数countがβCより大きい場合にエコー抑圧量が少
ないと判定する。ただし、βZ[ω]は+8dB〜−15dB程度、βCは全周波数帯域
数の10%〜40%程度が望ましい。本実施形態では以下、βZ[ω]を0dBとして説
明する。
送話入力信号の周波数スペクトルZ[f,ω]と、周波数領域変換処理部(FT)111
cから出力された残差信号の周波数スペクトルE[f,ω]と、制御部(CTRL)21
1kから出力されたエコーキャンセラ部(EC)110のエコー抑圧量が十分でない周波
数帯域であるか否かの情報である制御情報NRcontrol[f,ω]とを入力とし、
送話入力信号の周波数スペクトルZ[f,ω]あるいは残差信号の周波数スペクトルE[
f,ω]のいずれか一方を周波数スペクトルとして選択して出力する。
10のエコー抑圧量が十分でないと検出された周波数帯域であった場合は、周波数スペク
トルとして送話入力信号の周波数スペクトルZ[f,ω]を選択する。それ以外の周波数
帯域であった場合は周波数スペクトルとして残差信号の周波数スペクトルE[f,ω]を
選択する。
抑圧量が十分でない場合は、ノイズリダクション部(NR)211を単体で動作させ、雑
音レベルの推定がエコーの影響を受けないようにすることができる。
qから出力された雑音レベル|NZ[f,ω]|2及び|NE[f,ω]|2と、送話パ
ワー算出部(POW)111eから出力された送話パワースペクトル|Z[f,ω]|2
と、制御部(CTRL)211kから出力された制御情報NRcontrol[f,ω]
と、信号抑圧部(SS)111oから出力された1フレーム前の送話出力信号のスペクト
ルS’[f−1,ω]を入力とし、ノイズ抑圧ゲインG[f,ω]を算出して出力する。
L)211kから出力された制御情報NRcontrol[f,ω]によってエコー抑圧
量が十分でないと検出された周波数帯域については、エコーキャンセラ部(EC)110
の処理後の残留エコーの影響で雑音推定の精度が取れていないと判定して、雑音レベルと
して|NZ[f,ω]|2を選択する。それ以外の周波数帯域では雑音レベルとして|N
E[f,ω]|2を選択する。
はそれらの組み合わせでノイズ抑圧ゲインG[f,ω]を算出する。即ち、一般のノイズ
リダクションであるスペクトル・サブトラクション(Spectral Subtraction)法(S. F.
Boll, “Suppression of acoustic noise in speech using spectral subtraction”, IE
EE Trans. Acoustics, Speech, and Signal Processing, vol.ASSP-29, pp.113-120 (197
9).)、ウィナー・フィルター(Wiener Filter)法(J. S. Lim, A. V. Oppenheim, “En
hancement and bandwidth compression of noisy speech”, Proc. IEEE Vol.67, No.12,
pp.1586-1604, Dec.1979.)及び最尤推定(Maximum Likelihood)法(R. J. McAulay, M
. L. Malpass, “Speech enhancement using a soft-decision noise suppression filte
r”, IEEE Trans. on Acoustics, Speech, and Signal Processing, vol.ASSP-28, no.2,
pp.137-145, Apr.1980.)などである。
前SN比SNRPRIO[f,ω]及び事後SN比SNRPOST[f,ω]を推定算出
してノイズ抑圧ゲインを精度よく推定する手法(例えば、P. Scalart, J. V. Filho, ”S
peech enhancement based on a priori signal to noise estimation”, Proc. ICASSP96
, pp.629-632, May 1996.)、MMSE−STSA(Minimum Mean-Square Error Short-T
ime Spectral Amplitude estimator)法(Y. Ephraim, D. Malah, “Speech enhancement
using a minimum mean-square error short-time spectral amplitude estimator”, IE
EE Trans. on Acoustics, Speech, and Signal Processing, vol.ASSP-32, no.6, pp.110
9-1121, Dec.1984.)及びJoint MAP法(T. Lotter, P. Vary, “Noise reduction by max
imum a posteriori spectral amplitude estimation with super Gaussian speech model
ing”, Proc. IWAENC, pp.83-86, Sep.2003.)などである。
して、事前SN比SNRPRIO[f,ω]及び事後SN比SNRPOST[f,ω]は
、それぞれ、以下の式18−1、式18−2により求められ、この場合ウィナー・フィル
ター法を用いるとノイズ抑圧ゲインG[f,ω]は、以下の式18−3により算出される
。但し、μ[ω]は0.9〜0.999程度の忘却係数である。一方、雑音レベル|NE
[f,ω]|2が選択されたときは、同様にして以下の式18−1、式18−2における
|NZ[f,ω]|2を|NE[f,ω]|2に置き換えてノイズ抑圧ゲインG[f,ω
]を以下の式18−3により算出する。
音質が劣化するのを防止し、背景雑音の断続的な抑圧を防止するため、ノイズ抑圧ゲイン
G[f,ω]が所定の下限値以下にならないように制御する。即ち、図4を参照して説明
したエコー抑圧ゲインの下限値の帯域別の設定が、ノイズ抑圧ゲインの下限値の帯域別の
設定にも適用される。
z[n]あるいは残差信号e[n]の有音区間ではない区間の信号レベルを用いて周波数
帯域ごとに背景雑音レベルを算出しておき、背景雑音レベルよりも抑圧しないようにノイ
ズ抑圧ゲインを制御しても構わない。
クトルと、ノイズ抑圧ゲイン算出部(GCAL)211nから出力されたノイズ抑圧ゲイ
ンG[f,ω]とを入力として、スペクトル選択部211Lから出力された周波数スペク
トルのノイズを抑圧し、以下の式19−1あるいは式19−2が示すようにして送話出力
信号のスペクトルS’[f,ω]として出力する。
ルE[f,ω]のどちらの周波数スペクトルがスペクトル選択部211Lで選択されても
、エコーキャンセラ部(EC)110は時間領域での処理であるから、位相スペクトルに
差がないため、出力された送話出力信号は聴感上滑らかにつなぐことができる。
する。図11は、第2の実施形態に係る信号処理装置の全体の処理の流れを示すフローチ
ャートである。なお、図5を参照して説明した第1の実施形態に係る信号処理装置の動作
と同じ動作ステップについては、同じ符号を付してその部分の説明を省略する。
おいてはステップS1006でエコーリダクション処理を行ったのに代えて、第2の実施
形態においては、ステップS1005で得られたエコーキャンセラ処理後の信号を用いて
ノイズリダクション処理を行う(ステップS2006)。そして、ステップS1007の
終話か否かの判断に移る。
コーキャンセル部(EC)110と同じであるので、それぞれの実施形態における処理の
流れは、当然に同じであり説明を省略する。
流れを示すフローチャートである。なお、図7を参照して説明した第1の実施形態に係る
エコーリダクション部(ER)111における動作と同じ動作ステップについては、同じ
符号を付してその部分の説明を省略する。
の受話フレーム更新処理、ステップS1202rの受話周波数変換処理、ステップS12
03rの受話パワースペクトル算出処理、ステップS1204の音響結合量算出処理、ス
テップS1205のエコーレベル算出処理、ステップS1207の判定処理からステップ
S1210の送話信号抑圧処理までの動作はない。
ョン処理を開始して、ステップS1203sの送話パワースペクトル算出処理、及びステ
ップS1203eの残差パワースペクトル算出処理の後、雑音レベル推定部(NLE)2
11qは、有音区間でない区間のスペクトルを測定することにより、周波数帯域ω毎に送
話入力信号の周波数スペクトルに含まれる雑音レベルと、残差信号の周波数スペクトルに
含まれる雑音レベルをそれぞれ算出する(ステップS2205)。その後、ステップS1
206のエコー抑圧量算出処理を行い、制御部(CTRL)211kは、エコーキャンセ
ラ部(EC)110のエコー抑圧量が十分であるか否かの判定処理を行い、制御情報NR
control[f,ω]を出力する(ステップS2207)。
)111eから出力された送話パワースペクトル|Z[f,ω]|2と、制御部(CTR
L)211kから出力された制御情報NRcontrol[f,ω]を入力として、エコ
ー抑圧量が十分でないと検出された周波数帯域と、それ以外の周波数帯域とで、それぞれ
異なる計算によってノイズ抑圧ゲインG[f,ω]を算出する。また、ノイズ抑圧ゲイン
算出部(GCAL)211nはノイズ抑圧ゲインG[f,ω]を所定の下限値以下になら
ないように制御する(ステップS2208)。
御情報NRcontrol[f,ω]を入力として、エコー抑圧量が十分でないと検出さ
れた周波数帯域について、周波数スペクトルとして送話入力信号の周波数スペクトルZ[
f,ω]を選択し、それ以外の周波数帯域では周波数スペクトルとして残差信号の周波数
スペクトルE[f,ω]を選択する(ステップS2209)。
数スペクトルとノイズ抑圧ゲイン算出部(GCAL)211nで算出されたノイズ抑圧ゲ
インG[f,ω]を入力として、選択された周波数スペクトルのノイズを抑圧する(ステ
ップS2210)。そして、ステップS1211の周波数逆変換処理に移って、ノイズリ
ダクション処理が終了する。
毎に処理する方式として動作するものとして説明した。FFTによる周波数帯域をグルー
プでまとめて周波数帯域グループ毎に処理する方式や、フィルタバンクなどの帯域分割フ
ィルタなどの周波数領域型を実現してもよい。
理によって送話入力信号z[n]よりも残差信号e[n]が大きくなってしまい、エコー
キャンセラ部(EC)110の処理によるエコー抑圧量が十分でない場合がある。
EC)110の処理によるエコー抑圧量が十分でない周波数領域をエコー抑圧量推定部(
ECLE)111iと制御部(CTRL)211kで検出して、周波数帯域毎にノイズリ
ダクション部(NR)211の雑音レベル推定部(NLE)211qとスペクトル選択部
211Lとノイズ抑圧ゲイン算出部(GCAL)211nによって雑音レベルの推定がエ
コーの影響を受けないようにすることができるので、エコーパスロス変動に対して頑健に
することが可能であり、高品質な信号を出力することが可能である。
図13は、第3の実施形態に係る信号処理装置の構成を示すブロック図である。この信
号処理装置が第1の実施形態に係る信号処理装置と異なる点は、エコーリダクション部(
ER)111を有さず、エコーノイズリダクション部(ENR)311を有する点にあり
、その他の部分は同じである。そこで、同じ部分については、同じ符号を付してその説明
を省略し、図面を参照して第3の実施形態に係るエコーノイズリダクション部(ENR)
311を説明する。なお、このエコーノイズリダクション部(ENR)311で、第1の
実施形態に係るエコーリダクション部(ER)111及び第2の実施形態に係るノイズリ
ダクション部(NR)211と同じ部分については、同じ符号を付してその説明を省略す
る。
)311の構成を示すブロック図である。このエコーノイズリダクション部(ENR)3
11は、周波数領域変換処理部(FT)111aと、周波数領域変換処理部(FT)11
1bと、周波数領域変換処理部(FT)111cと、受話パワー算出部(POW)111
dと、送話パワー算出部(POW)111eと、残差パワー算出部(POW)111fと
、音響結合量推定部(ACLE)111gと、エコー量推定部(ELE)111h、エコ
ー抑圧量推定部(ECLE)111iと、制御部(CTRL)211kと、スペクトル選
択部211Lと、ゲイン格納部(GTBL)111mと、エコーノイズ抑圧ゲイン算出部
(GCAL)311nと、信号抑圧部(SS)311oと、周波数領域逆変換処理部(I
FT)111pと、雑音レベル推定部(NLE)311qとからなる。
9から出力された送話入力信号z[n]と、信号減算処理部110bから出力された残差
信号e[n]とを入力とし、送話入力信号z[n]あるいは残差信号e[n]の少なくと
も一方からエコー成分及びノイズ成分を抑圧し、そのエコー抑圧及びノイズ抑圧後の信号
を送話出力信号s’[n](n=0,1,・・・,N−1)として1フレームごとに出力
する。
波数スペクトル(送話スペクトルZ[f,ω]あるいは残差スペクトルE[f,ω])を
入力とし、有音ではない区間のスペクトルを測定し、周波数帯域ω毎に周波数スペクトル
に含まれる雑音レベル|N[f,ω]|2を算出して出力する。
11hから出力されたスムージングしたエコー量|YS[f,ω]|2と、ゲイン格納部
(GTBL)111mから出力されたパラメータγ[ω]と、送話パワー算出部(POW
)111eから出力されたスムージングされた送話パワースペクトル|ZS[f,ω]|
2と、雑音レベル推定部(NLE)311qから出力された雑音レベル|N[f,ω]|
2と、制御部(CTRL)211kから出力された制御情報NRcontrol[f,ω
]とを入力とし、エコーノイズ抑圧ゲインG[f,ω]を算出して出力する。
CTRL)211kから出力された制御情報NRcontrol[f,ω]によってエコ
ー抑圧量が十分でないと検出された周波数帯域については、過剰なエコー抑圧により送話
音質が劣化するのを防止するため、スムージングされた送話パワースペクトル|ZS[f
,ω]|2から雑音レベル|N[f,ω]|2を除去して、エコー抑圧ゲインGER[f
,ω]を式20によって算出する。
であり、エコーキャンセラ部(EC)110が正常に機能していると見なして、エコーノ
イズ抑圧ゲイン算出部(GCAL)311nは、エコーノイズリダクション部(ENR)
311のエコー抑圧量を多くするように、エコーキャンセラ部(EC)110のエコー抑
圧量ECL[f,ω]を用いて補正し、エコー抑圧ゲインGER[f,ω]を以下の式2
1が示すように算出する。
された雑音レベル|N[f,ω]|2に基づいて、前述した一般のノイズリダクションで
あるスペクトル・サブトラクション(Spectral Subtraction)法やウィナー・フィルター
(Wiener Filter)法や最尤推定(Maximum Likelihood)法などのアルゴリズムでノイズ
抑圧ゲインGNR[f,ω]を算出する。
圧ゲイン算出部(GCAL)311nは、エコーノイズ抑圧ゲインG[f,ω]は所定の
下限値以下にならないように制御する。即ち、図4を参照して説明したエコー抑圧ゲイン
の下限値の帯域別の設定が、エコーノイズ抑圧ゲインの下限値の帯域別の設定にも適用さ
れる。
コーノイズ抑圧ゲイン算出部(GCAL)311nは、送話入力信号z[n]あるいは残
差信号e[n]の有音区間ではない区間の信号レベルを用いて周波数帯域ごとに背景雑音
レベルを算出しておき、背景雑音レベルよりも抑圧しないようにエコーノイズ抑圧ゲイン
を制御しても構わない。
するのを防止するために、エコーノイズ抑圧ゲインG[f,ω]を以下の式23−1ある
いは式23−2が示すように周波数方向にスムージングして出力してもよい。例えば、ε
jは、[0.1、0.2、0.4、0.2、0.1]、ηjは、[0.1、0.2、0.
4、0.8、0.4、0.2、0.1]のようにしてよい。
クトルと、エコーノイズ抑圧ゲイン算出部(GCAL)311nから出力されたエコーノ
イズ抑圧ゲインG[f,ω]とを入力として、スペクトル選択部211Lから出力された
周波数スペクトルのエコー及びノイズを抑圧し、以下の式24−1または式24−2のよ
うに送話出力信号のスペクトルS’[f,ω]を算出して出力する。
ルE[f,ω]のどちらの周波数スペクトルがスペクトル選択部211Lで選択されても
、エコーキャンセラ部(EC)110は時間領域での処理であるから、位相スペクトルに
差がないため、出力された送話出力信号は聴感上滑らかにつなぐことができる。
する。図15は、第3の実施形態に係る信号処理装置の全体の処理の流れを示すフローチ
ャートである。なお、図5を参照して説明した第1の実施形態に係る信号処理装置の動作
と同じ動作ステップについては、同じ符号を付してその部分の説明を省略する。
おいてはステップS1006でエコーリダクション処理を行ったのに代えて、第3の実施
形態においては、ステップS1005で得られたエコーキャンセラ処理後の信号を用いて
エコーノイズリダクション処理を行う(ステップS3006)。そして、ステップS10
07の終話か否かの判断に移る。
コーキャンセル部(EC)110と同じであるので、それぞれの実施形態における処理の
流れは、当然に同じであり説明を省略する。
る処理の流れを示すフローチャートである。なお、図7を参照して説明した第1の実施形
態に係るエコーリダクション部(ER)111及び図12を参照して説明した第2の実施
形態に係るノイズリダクション部(NR)211における動作と同じ動作ステップについ
ては、同じ符号を付してその部分の説明を省略する。
リダクション処理を開始して、ステップS1201r〜S1203r、S1201s〜S
1203s及びS1201e〜S1203eの受話、送話、残差の各信号に対するフレー
ム更新処理、周波数変換処理、パワースペクトル算出処理、ステップS1204の音響結
合量算出処理、ステップS1205のエコーレベル算出処理、ステップS1206のエコ
ー抑圧量算出処理を行う。
理の後、雑音レベル推定部(NLE)311qから出力された雑音レベル|N[f,ω]
|2を算出する(ステップS3205)。
NLE)311qから出力された雑音レベル|N[f,ω]|2と、制御部(CTRL)
211kから出力された制御情報NRcontrol[f,ω]とを入力として、エコー
抑圧量が十分でないと検出された周波数帯域と、それ以外の周波数帯域とで、それぞれ異
なる計算によってエコーノイズ抑圧ゲインG[f,ω]を算出する。また、エコーノイズ
抑圧ゲイン算出部(GCAL)311nはエコーノイズ抑圧ゲインG[f,ω]を所定の
下限値以下にならないように制御する(ステップS3208)。
数スペクトルとエコーノイズ抑圧ゲイン算出部(GCAL)311nで算出されたエコー
ノイズ抑圧ゲインG[f,ω]を入力として、選択された周波数スペクトルのエコー及び
ノイズを抑圧する(ステップS3210)。そして、ステップS1211の周波数逆変換
処理に移って、エコーノイズリダクション処理が終了する。
波数帯域毎に処理する方式として動作するものとして説明した。FFTによる周波数帯域
をグループでまとめて周波数帯域グループ毎に処理する方式や、フィルタバンクなどの帯
域分割フィルタなどの周波数領域型を実現してもよい。
理によって送話入力信号z[n]よりも残差信号e[n]が大きくなってしまい、エコー
キャンセラ部(EC)110の処理によるエコー抑圧量が十分でない場合がある。
EC)110の処理によるエコー抑圧量が十分でない周波数領域をエコー抑圧量推定部(
ECLE)111iと制御部(CTRL)211kで判定して、スペクトル選択部211
Lとエコーノイズ抑圧ゲイン算出部(GCAL)311nにおいて周波数帯域毎にエコー
キャンセラ部(EC)110の処理とエコーノイズリダクション部(ENR)311の処
理の重みを変化させるように制御することができるので、エコーパスロス変動に対して頑
健にすることが可能であり、高品質な信号を出力することが可能である。
リダクションをエコーノイズ抑圧ゲイン算出部(GCAL)311nと信号抑圧部(SS
)311oで共通化してエコーノイズリダクション部(ENR)311とすることで、計
算量が少なくすることができ、エコーリダクションとノイズリダクションを直列接続して
処理するよりも送話音質の劣化が防止できる。
図17は、第4の実施形態に係る信号処理装置の構成を示すブロック図である。この信
号処理装置が第1の実施形態に係る信号処理装置と異なる点は、図17に示すようにエコ
ーリダクション部(ER)111を有さず、エコーサプレッサ部(ES)411を有する
点と、遅延処理部(DELAY)102に代えて遅延処理部(DELAY)402を有す
る点、及びD/A変換器(D/A)103に代えてD/A変換器(D/A)403を有す
る点であり、その他の部分は同じである。そこで、同じ部分については、同じ符号を付し
てその説明を省略する。
ーサプレッサ部(ES)411から出力される受話出力信号x’[n]を入力とすること
が異なるものの、それぞれ遅延処理部(DELAY)102と、D/A変換器(D/A)
103との動作を同じ動作をするので、それらの説明を省略し、図面を参照して第4の実
施形態に係るエコーサプレッサ部(ES)411を説明する。
構成を示すブロック図である。このエコーサプレッサ部(ES)411は、受話パワー算
出部(POW)411dと、送話パワー算出部(POW)411eと、残差パワー算出部
(POW)411fと、エコー抑圧量推定部(ECLE)411iと、制御部(CTRL
)411kと、信号選択部411Lと、ゲイン格納部(GTBL)411mと、エコー抑
圧ゲイン算出部(GCAL)411nと、送話信号抑圧部(SS)411oと、受話信号
抑圧部(SS)411rとからなる。
力信号x[n]と、ハイパスフィルタ部(HPF)109から出力された送話入力信号z
[n]と、信号減算処理部110bから出力された残差信号e[n]とを入力とし、受話
出力信号x’[n]及び送話出力信号s’[n](n=0,1,・・・,N−1)を1フ
レームごとに出力する。ここで、受話入力信号x[n]あるいは送話信号(送話入力信号
z[n]または残差信号e[n])の少なくとも一方に抑圧処理を施し、そのエコー抑圧
後の信号を出力する。
入力信号x[n]を入力とし、受話パワーPX[f]を以下の式25−1が示すようにフ
レーム単位で算出して出力する。受話パワーPX[f]は以下の式25−2が示すように
1フレーム前の値PSX[f−1]を用いてスムージングした値PSX[f]を用いても
よい。ただし、αXは、0.375〜0.999程度が望ましい。
力された送話入力信号z[n]を入力とし、送話パワーPZ[f]を以下の式26−1が
示すようにフレーム単位で算出して出力する。送話パワーPZ[f]は以下の式26−2
が示すように1フレーム前の値PSZ[f−1]を用いてスムージングした値PSZ[f
]を用いてもよい。ただし、αZは、0.375〜0.999程度が望ましい。
信号e[n]を入力とし、残差パワーPE[f]を以下の式27−1が示すようにフレー
ム単位で算出して出力する。残差パワーPE[f]は以下の式27−2が示すように1フ
レーム前の値PSE[f−1]を用いてスムージングした値PSE[f]を用いてもよい
。ただし、αEは、0.375〜0.999程度が望ましい。
ら出力された送話パワーPZ[f]と、残差パワー算出部(POW)411fから出力さ
れた残差パワーPE[f]とを入力とし、エコーキャンセラ部(EC)110で抑圧され
たエコー抑圧量ECL[f]を推定して出力する。具体的には、以下に示す式28によっ
て算出する。もちろん、これら2つのパワーの差などを用いてもよい。
れたECL[f]を入力とし、エコーキャンセラ部(EC)110のエコー抑圧量が十分
でないフレームであるか否かを判定し、その判定結果情報である制御情報EScontr
ol[f]を出力する。具体的には、ECL[f]>βZを満たしたフレームはエコーキ
ャンセラ部(EC)110のエコー抑圧量が少ないと判定する。ただし、βZは+8dB
〜−15dB程度が望ましい。本実施形態では以下、βZを0dBとして説明する。
された受話パワーPX[f]と、送話パワー算出部(POW)411eから出力された送
話パワーPZ[f]とを入力とし、受話信号抑圧部(SS)411rによって受話入力信
号x[n]を抑圧するか、送話信号抑圧部(SS)411oによって送話信号(送話入力
信号z[n]または残差信号e[n])を抑圧するか否かを判定し、その判定結果情報で
ある状態情報ESstate[f]を出力する。
が有音であるか否か検出し、送話パワーPZ[f]と送話側の雑音レベルを表す可変閾値
とを用いて送話側が有音であるか否かを検出し、受話側が有音であれば送話信号を抑圧す
るように状態情報ESstate[f]を設定し、送話側が有音であれば受話信号を抑圧
するように状態情報ESstate[f]を設定し、そして受話パワーPX[f]と送話
パワーPZ[f]の差が大きくなるまで以前の状態情報ESstate[f]を継続する
ように設定する。
エコー抑圧量が十分でないと判定されたフレームについてはPZ[f]を用い、エコー抑
圧量が十分であると判定されたフレームではPE[f]を用いてもよい。
信号z[n]と、信号減算処理部110bから出力された残差信号e[n]と、制御部(
CTRL)411kから出力された制御情報EScontrol[f]とを入力とし、送
話入力信号z[n]あるいは残差信号e[n]のいずれか一方をフレーム単位で出力する
。具体的には、制御情報EScontrol[f]がエコーキャンセラ部(EC)110
のエコー抑圧量が十分でないと検出されたフレームであった場合は、信号として送話入力
信号Z[n]を選択する。それ以外のフレームでは信号として残差信号e[n]を選択す
る。
キャンセラ部(EC)110の推定精度が十分とれない場合はエコーサプレッサ部(ES
)411を単体で動作させることができる。
だし、γは通話開始前に事前にアナログフロントエンド(D/A変換器(D/A)403
、受話増幅器104、スピーカ105、音響空間、マイクロホン106、送話増幅器10
7、A/D変換器(A/D)108)のエコーリターンロスに基づいて設定されているこ
とが望ましい。
から出力されたゲインγと、エコー抑圧量推定部(ECLE)411iから出力されたE
CL[f]と、制御部(CTRL)411kから出力された制御情報EScontrol
[f]及び状態情報ESstate[f]とを入力とし、エコー抑圧ゲインG[f]を算
出して出力する。
e[f]が送話信号(送話入力信号z[n]または残差信号e[n])を抑圧すると判定
されたことを示す場合は次のようにする。まず、制御情報EScontrol[f]がエ
コーキャンセラ部(EC)110のエコー抑圧量が十分でないと検出されたフレームであ
った場合は、エコー抑圧ゲインG[f]をG[f]=γとする。
10で十分にできているため、抑圧量を強めてもよいと判定し、G[f]=γ・ECL[
f]と算出する。あるいは、過剰な抑圧を防止するためエコーキャンセラ部(EC)11
0のエコー抑圧量分を低減した抑圧量にするようにG[f]=γ/ECL[f]と算出す
る。一方、状態情報ESstate[f]が受話入力信号を抑圧すると判定されたことを
示す場合は、エコー抑圧ゲインG[f]をG[f]=γとする。
z[n]あるいは残差信号e[n]の有音区間ではない区間の信号レベルを用いて背景雑
音レベルを算出しておき、背景雑音レベルよりも抑圧しないようにエコー抑圧ゲインを制
御してもよい。
情報ESstate[f]と、エコー抑圧ゲイン算出部(GCAL)411nから出力さ
れたエコー抑圧ゲインG[f]と、信号選択部411Lで選択された送話信号(送話入力
信号z[n]または残差信号e[n])とを入力とし、状態情報ESstate[f]に
よって送話信号(送話入力信号z[n]または残差信号e[n])を抑圧すると判定され
たことを示す場合、信号選択部411Lで選択された信号とエコー抑圧ゲイン算出部(G
CAL)411nで算出された抑圧ゲインG[f]を用いて以下の式29−1または式2
9−2が示すように信号を抑圧し、送話出力信号s’[n]を算出して出力する。
残差信号e[n])を抑圧しないと判定された場合は、以下の式29−3または式29−
4が示すように送話信号をそのまま送話出力信号s’[n]として出力する。
力信号s’[n]が聴感上滑らかに繋がるように、時間方向にスムージングしたエコー抑圧
ゲインG[f]を乗じてもよい。
情報ESstate[f]と、エコー抑圧ゲイン算出部(GCAL)411nから出力さ
れたエコー抑圧ゲインG[f]と、通信部(COM)101から出力された受話入力信号
x[n]とを入力とし、状態情報ESstate[f]によって受話入力信号x[n]を
抑圧すると判定された場合、受話信号x[n]に対してエコー抑圧ゲイン算出部(GCA
L)411nで算出されたエコー抑圧ゲインG[f]を用いて、以下の式30−1が示す
ように信号を抑圧し、受話出力信号x’[n]を算出して出力する。
する。図19は、第4の実施形態に係る信号処理装置の全体の処理の流れを示すフローチ
ャートである。なお、図5を参照して説明した第1の実施形態に係る信号処理装置の動作
と同じ動作ステップについては、同じ符号を付してその部分の説明を省略する。
話信号抑圧部(SS)411rから出力された受話出力信号x’[n]を一時的に蓄えて
遅延させる処理を行う(ステップS4004)。そしてステップS1005のエコーキャ
ンセラ処理に移る。ステップS1005のエコーキャンセラ処理の後、信号処理装置は、
第1の実施形態においてはステップS1006でエコーリダクション処理を行ったのに代
えて、第4の実施形態においては、ステップS1005で得られたエコーキャンセラ処理
後の信号を用いてエコーサプレッサ処理を行う(ステップS4006)。そして、ステッ
プS1007の終話か否かの判断に移る。
コーキャンセル部(EC)110と同じであるので、それぞれの実施形態における処理の
流れは、当然に同じであり説明を省略する。
れを示すフローチャートである。まず、受話パワー算出部(POW)411dは、受話入
力信号x[n]から受話パワーPX[f]を算出し(ステップS4201r)、送話パワ
ー算出部(POW)411eは、送話入力信号z[n]から送話パワーPZ[f]を算出
し(ステップS4201s)、残差パワー算出部(POW)411fは、残差信号e[n
]から残差パワーPE[f]を算出する(ステップS4201e)。
[f]を入力として、エコーキャンセラ部(EC)110で抑圧されたエコー抑圧量EC
L[f]を推定する(ステップS4202)。
エコー抑圧量が十分であるか否かを判定し、制御情報EScontrol[f]を出力す
る。また、制御部(CTRL)411kは、受話パワーPX[f]と送話パワーPZ[f
]に基づいて、受話信号抑圧部(SS)411rによって受話入力信号x[n]を抑圧す
るか、送話信号抑圧部(SS)411oによって送話信号(送話入力信号z[n]または
残差信号e[n])を抑圧するか判定し、状態情報ESstate[f]を出力する。(
ステップS4203)。
コー抑圧量が十分でないと判定されたフレームについて、信号としてz[n]を選択して
出力し、エコー抑圧量が十分であると判定されたフレームでは信号としてe[n]を選択
して出力する(ステップS4204)。
とエコー抑圧量ECL[f]を入力として、エコー抑圧量が十分でないと検出されたフレ
ームと、それ以外のフレームとで、それぞれ異なる計算によってエコー抑圧ゲインG[f
]を算出して出力する(ステップS4205)。
te[f]を入力として、送話信号(送話入力信号z[n]または残差信号e[n])を
抑圧すると判定された場合に、信号選択部411Lで選択された信号とエコー抑圧ゲイン
算出部(GCAL)411nで算出されたエコー抑圧ゲインG[f]を用いて、信号を抑
圧して送話出力信号s’[n]として出力する。あるいは、送話信号を抑圧しないと判定
された場合は、信号選択部411Lで選択された信号を送話出力信号s’[n]として出
力する(ステップS4206s)。一方、受話信号抑圧部(SS)411rは、エコー抑
圧ゲインG[f]と状態情報ESstate[f]を入力として、受話入力信号x[n]
を抑圧すると判定された場合、受話信号x[n]に対してエコー抑圧ゲイン算出部(GC
AL)411nで算出されたエコー抑圧ゲインG[f]を用いて、信号を抑圧して受話出
力信号x’[n]として出力する。あるいは、受話入力信号x[n]を抑圧しないと判定
された場合は、受話信号x[n]を受話出力信号x’[n]として出力する(ステップS
4206r)。これにより、エコーサプレッサ処理が終了する。
として動作するものとして説明した。FFTやフィルタバンクなどの帯域分割フィルタな
どを用いて周波数領域型に処理する方式で実現してもよい。
理によって送話入力信号z[n]よりも残差信号e[n]が大きくなってしまい、エコー
キャンセラ部(EC)110の処理によるエコー抑圧量が十分でない場合がある。
よるエコー抑圧量が十分でない場合をエコー抑圧量推定部(ECLE)411iと制御部
(CTRL)411kで検出して、エコー抑圧ゲイン算出部(GCAL)411nと送話
信号抑圧部(SS)411oにおいてエコーキャンセラ部(EC)110のエコー抑圧量
を考慮することにより過剰な送話音声に対する抑圧を避けることができるので、エコーパ
スロス変動に対して頑健で高品質な信号を出力することができる。
第5の実施形態に係る信号処理装置が第1の実施形態に係る信号処理装置と異なる点は
、エコーリダクション部(ER)111を有さず、エコーリダクション部(ER)511
を有する点にある。一方、その他の部分は同じである。そこで、同じ部分については、同
じ符号を付してその説明を省略する。
)511の構成を示すブロック図を示す。本発明の第5の実施形態に係る信号処理装置の
エコーリダクション部(ER)511が第1の実施形態に係る信号処理装置のエコーリダ
クション部(ER)111と異なる点を以下に説明する。なお、第1の実施形態に係るエ
コーリダクション部(ER)111及び第2の実施形態に係るノイズリダクション部(N
R)211と同じ部分については、同じ符号を付してその説明を省略する。
周波数領域変換処理部(FT)111bと、周波数領域変換処理部(FT)111cと、
受話パワー算出部(POW)111dと、送話パワー算出部(POW)111eと、残差
パワー算出部(POW)111fと、音響結合量推定部(ACLE)511gと、エコー
量推定部(ELE)511hと、エコー抑圧量推定部(ECLE)111iと、制御部(
CTRL)511kと、スペクトル選択部511Lと、ゲイン格納部(GTBL)111
m、エコー抑圧ゲイン算出部(GCAL)511nと、周波数領域逆変換処理部(IFT
)111pと、送話信号抑圧部(SS)511sと、残差信号抑圧部(ES)511tと
からなる。
れた遅延した受話入力信号x[n−D]と、ハイパスフィルタ部(HPF)109から出
力された送話入力信号z[n]と、信号減算処理部110bから出力された残差信号e[
n]とを入力とし、送話入力信号z[n]あるいは残差信号e[n]の少なくとも一方か
らエコー成分を抑圧し、そのエコー抑圧後の信号を送話出力信号s’[n](n=0,1
,・・・,N−1)として1フレームごとに出力する。
出力されたスムージングされた受話パワースペクトル|XS[f,ω]|2と、送話パワ
ー算出部(POW)111eから出力されたスムージングされた送話パワースペクトル|
Zs[f,ω]|2と、残差パワー算出部(POW)111fから出力されたスムージン
グされた残差パワースペクトル|Es[f,ω]|2とを入力とし、音響結合量|HZ[f
,ω]|2及び|HE[f,ω]|2を、それぞれ式31−1、式31−2よって算出す
る。
が示すように1フレーム前の値を用いてスムージングした音響結合量|HZS[f,ω]
|2及び|HES[f,ω]|2を算出して出力する。ただし、αHZ[ω]及びαHE
[ω]は、0.03〜0.99程度が望ましい。
ω]を大きくすることで音響結合量|HZS[f,ω]|2及び|HES[f,ω]|2
の更新を速めておく。このようにすることで通話開始初期時は音響結合量が初期化されて
いるので、通話開始初期時に抑圧量が少なくなってしまうのを防止することができる。
H[ω]・|HZS[f−1,ω]|2及び|HE[f,ω]|2>βEH[ω]・|H
ES[f−1,ω]|2が成り立つ場合、及び受話入力信号が十分に大きくない場合、即
ち、不等式|XS[f,ω]|2<βX[ω]が成り立つ場合には、エコーパス変動への
高速な追従性を保ちつつ、ダブルトークとなる周波数帯域での音響結合量の算出を行わな
いようにするため、音響結合量を更新しないで1フレーム前の過去の音響結合量|HZS
[f−1,ω]|2及び|HES[f−1,ω]|2を用いる。
更新しないでおくことで送話音質劣化を防止することができる。ただし、βZH[ω]及
びβEH[ω]は0.9〜30程度が望ましい。βX[ω]は30dB〜40dB程度が
望ましい。
されたスムージングされた受話パワースペクトル|XS[f,ω]|2と、音響結合量推
定部(ACLE)511gから出力された音響結合量|HZS[f,ω]|2及び|HE
S[f,ω]|2とを入力とし、送話入力信号の周波数スペクトルZ[f,ω]に含まれ
る送話エコー量|YZ[f,ω]|2及び残差信号の周波数スペクトルE[f,ω]に含
まれる残差エコー量|YE[f,ω]|2を、それぞれ以下の式33−1及び式33−2
が示すように周波数帯域ω毎に推定する。
及び|YE[f,ω]|2を用いるよりもスムージングした値を用いた方がエコー抑圧後
の信号をより自然な信号にできるため、以下の式34−1及び式34−2が示すように1
フレーム前の値を用いてスムージングしたエコー量|YZS[f,ω]|2及び|YES
[f,ω]|2を周波数帯域ω毎に算出して出力する。ただし、αZY[ω]及びαEY
[ω]は0.7〜0.99程度が望ましい。
れたエコー抑圧量ECL[f,ω]を入力とし、エコーキャンセラ部(EC)110のエ
コー抑圧量が十分でない周波数帯域であるか否かの情報である制御情報ERcontro
l[f,ω]を出力する。具体的には、制御部(CTRL)511kは、周波数帯域ω毎
にECL[f,ω]>βZ[ω]を満たした周波数帯域であり、かつ1フレーム当りの式
ECL[f,ω]>βZ[ω]が成立した帯域数countがβCより大きい場合にエコ
ー抑圧量が少ないと判定する。ただし、βZ[ω]は+8dB〜−15dB程度、βCは
全周波数帯域数の10%〜40%程度が望ましい。本実施形態では以下、βZ[ω]を0
dBとして説明する。
eから出力されたスムージングされた送話パワースペクトル|ZS[f,ω]|2と、残
差パワー算出部(POW)111fから出力されたスムージングされた残差パワースペク
トル|ES[f,ω]|2と、エコー量推定部(ELE)511hから出力されたスムー
ジングした送話エコー量|YZS[f,ω]|2及びスムージングした残差エコー量|Y
ES[f,ω]|2と、ゲイン格納部(GTBL)111mから出力されたパラメータγ
[ω]とを入力とし、送話エコー抑圧ゲインGZ[f,ω]及び残差エコー抑圧ゲインG
E[f,ω]を算出して出力する。
GZ[f,ω]及び残差エコー抑圧ゲインGE[f,ω]をウィナー・フィルタ(Wiener
Filter)法を用いて、以下に示す式35−1及び式35−2によって算出する。
音質が劣化するのを防止し、背景雑音の断続的な抑圧を防止するため、送話エコー抑圧ゲ
インGZ[f,ω]及び残差エコー抑圧ゲインGE[f,ω]が所定の下限値以下になら
ないように制御する。
話音質が劣化するのを防止するため、送話入力信号z[n]あるいは残差信号e[n]の
有音区間ではない区間の信号レベルを用いて周波数帯域ごとに背景雑音レベルを算出して
おき、背景雑音レベルよりも抑圧しないように送話エコー抑圧ゲインGZ[f,ω]及び
残差エコー抑圧ゲインGE[f,ω]を制御しても構わない。
を防止するために、エコー抑圧ゲインGZ[f,ω]を以下の式36−1あるいは式36
−2に示すように、そして、GE[f,ω]を以下の式36−3あるいは式36−4に示
すように周波数方向にスムージングして出力してもよい。例えば、εjは、[0.1、0
.2、0.4、0.2、0.1]、ηjは、[0.1、0.2、0.4、0.8、0.4
、0.2、0.1]のようにしてよい。
された送話入力信号の周波数スペクトルZ[f,ω]と、エコー抑圧ゲイン算出部(GC
AL)511nから出力された送話エコー抑圧ゲインGZ[f,ω]とを入力として、送
話入力信号の周波数スペクトルのエコーを抑圧し、以下の式37が示すようにスペクトル
SZ’[f,ω]を出力する。
された残差信号の周波数スペクトルE[f,ω]と、エコー抑圧ゲイン算出部(GCAL
)511nから出力された残差エコー抑圧ゲインGE[f,ω]とを入力として、残差信
号の周波数スペクトルのエコーを抑圧し、以下のようにスペクトルSE’[f,ω]を出
力する。
抑圧された送話入力信号の周波数スペクトルSZ’[f,ω]と、残差信号抑圧部(ES
)511tから出力されたエコー抑圧された残差信号の周波数スペクトルSE’[f,ω
]と、制御部(CTRL)511kから出力されたエコーキャンセラ部(EC)110の
エコー抑圧量が十分でない周波数帯域であるか否かを示す情報である制御情報ERcon
trol[f,ω]とを入力とし、エコー抑圧された送話入力信号の周波数スペクトルS
Z’[f,ω]か、エコー抑圧された残差信号の周波数スペクトルSE’[f,ω]のい
ずれか一方を周波数スペクトルとして選択して出力する。
10のエコー抑圧量が十分でないと検出された周波数帯域であった場合は、スペクトル選
択部511Lは、周波数スペクトルとしてS’Z[f,ω]を選択する。それ以外の周波
数帯域は周波数スペクトルとしてS’E[f,ω]を選択する。
抑圧量が十分でない場合、つまりエコーキャンセラ部(EC)110の推定精度が十分と
れない場合はエコーリダクション部(ER)511を単体で動作させることができる。
する。図22は、第5の実施形態に係る信号処理装置の全体の処理の流れを示すフローチ
ャートである。なお、図5を参照して説明した第1の実施形態に係る信号処理装置の動作
と同じ動作ステップについては、同じ符号を付してその部分の説明を省略する。
おいてはステップS1006でエコーリダクション処理を行ったのに代えて、第5の実施
形態においては、ステップS1005で得られたエコーキャンセラ処理後の信号を用いて
エコーリダクション処理を行う(ステップS5006)。そして、ステップS1007の
終話か否かの判断に移る。
コーキャンセル部(EC)110と同じであるので、それぞれの実施形態における処理の
流れは、当然に同じであり説明を省略する。
流れを示すフローチャートである。なお、図7を参照して説明した第1の実施形態に係る
エコーリダクション部(ER)111及び図12を参照して説明した第2の実施形態に係
るノイズリダクション部(NR)211における動作と同じ動作ステップについては、同
じ符号を付してその部分の説明を省略する。
理を開始して、ステップS1203rの受話パワースペクトル算出処理、ステップS12
03sの送話パワースペクトル算出処理、及びステップS1203eの残差パワースペク
トル算出処理の後、音響結合量推定部(ACLE)511gは、スムージングされた受話
パワースペクトル|XS[f,ω]|2とスムージングされた送話パワースペクトル|Z
S[f,ω]|2を入力として音響結合量|HZS[f,ω]|2を算出する(ステップ
S5204s)。同様に、音響結合量推定部(ACLE)511gは、スムージングされ
た受話パワースペクトル|XS[f,ω]|2とスムージングされた残差パワースペクト
ル|ES[f,ω]|2を入力として音響結合量|HES[f,ω]|2を算出する(ス
テップS5204e)。
ムージングした受話パワースペクトル|XS[f,ω]|2とを入力として送話エコー量
|YZS[f,ω]|2を推定する(ステップS5205s)。同様に、エコー量推定部
(ELE)511hは、音響結合量|HES[f,ω]|2とスムージングした受話パワ
ースペクトル|XS[f,ω]|2とを入力として残差エコー量|YES[f,ω]|2
を推定する(ステップS5205e)。
511hから出力された送話エコー量|YZS[f,ω]|2と、送話パワー算出部(P
OW)111eから出力されたスムージングされた送話パワースペクトル|ZS[f,ω
]|2とを入力として、送話エコー抑圧ゲインGZ[f,ω]を算出し、所定の下限値以
下にならないように制御する(ステップS1208s)。
511hから出力された残差エコー量|YES[f,ω]|2と、残差パワー算出部(P
OW)111fから出力されたスムージングされた残差パワースペクトル|ES[f,ω
]|2とを入力として、残差エコー抑圧ゲインGE[f,ω]を算出し、所定の下限値以
下にならないように制御する(ステップS1208e)。
から出力された送話入力信号の周波数スペクトルZ[f,ω]と、エコー抑圧ゲイン算出
部(GCAL)511nで算出された送話エコー抑圧ゲインGZ[f,ω]を入力として
、送話入力信号の周波数スペクトルのエコーを抑圧する(ステップS5210s)。
から出力された残差信号の周波数スペクトルE[f,ω]と、エコー抑圧ゲイン算出部(
GCAL)511nで算出された残差エコー抑圧ゲインGE[f,ω]を入力として、残
差信号の周波数スペクトルのエコーを抑圧する(ステップS5210e)。
の後、スペクトル選択部511Lは、送話信号抑圧部(SS)511sから出力されたエ
コー抑圧された送話入力信号の周波数スペクトルSZ’[f,ω]と、残差信号抑圧部(
ES)511tから出力されたエコー抑圧された残差信号の周波数スペクトルSE’[f
,ω]と、制御部(CTRL)511kから出力された制御情報ERcontrol[f
,ω]とを入力とし、エコー抑圧量が十分でないと検出された周波数帯域では、エコー抑
圧された送話入力信号の周波数スペクトルSZ’[f,ω]を周波数スペクトルとして選
択して出力し、それ以外の周波数帯域ではエコー抑圧された残差信号の周波数スペクトル
SE’[f,ω]を周波数スペクトルとして選択して出力する(ステップS5209)。
終了する。
毎に処理する方式として動作するものとして説明した。FFTによる周波数帯域をグルー
プでまとめて周波数帯域グループ毎に処理する方式や、フィルタバンクなどの帯域分割フ
ィルタなどの周波数領域型を実現してもよい。
理によって送話入力信号z[n]よりも残差信号e[n]が大きくなってしまい、エコー
キャンセラ部(EC)110の処理によるエコー抑圧量が十分でない場合がある。
よるエコー抑圧量が十分でない周波数領域をエコー抑圧量推定部(ECLE)111iと
制御部(CTRL)511kで判定して、スペクトル選択部511Lとエコー抑圧ゲイン
算出部(GCAL)511nにおいて周波数帯域毎にエコーキャンセラ部(EC)110
の処理とエコーリダクション部(ER)511の処理の重みを変化させるように制御する
ことができるので、エコーパスロス変動に対して頑健にすることが可能であり、高品質な
信号を出力することが可能である。
とエコー量推定部(ELE)511hにおいて、送話入力信号z[n]に含まれるエコー
量と残差信号e[n]に含まれるエコー量を別々に推定し、エコー抑圧ゲイン算出部(G
CAL)511nにおいて別々にエコー抑圧ゲインを算出し、送話信号抑圧部(SS)5
11s及び残差信号抑圧部(ES)511tにおいて別々に抑圧しているため、過剰なエ
コー抑圧を防止し送話音質が劣化するのを防止することが可能である。
図24は、第6の実施形態に係る信号処理装置の構成を示すブロック図である。この信
号処理装置が第1の実施形態に係る信号処理装置と異なる点は、図24に示すようにエコ
ーキャンセラ部(EC)110とエコーリダクション部(ER)111を有さず、エコー
キャンセラ部(EC)610とエコーリダクション部(ER)611を有し、エコーリダ
クション部(ER)611の外部にエコー抑圧量推定部(ECLE)612を有する点に
あり、その他の部分は同じである。
その説明を省略する。なお、このエコーリダクション部(ER)611で、第1の実施形
態に係るエコーリダクション部(ER)111と同じ部分については、同じ符号を付して
その説明を省略する。
コーキャンセラ部(EC)610は、周波数領域変換処理部(FT)610d、周波数領
域適応フィルタ部(FDADF)610e、周波数領域逆変換処理部(IFT)610f
、信号減算処理部610g、周波数領域変換処理部(FT)610h、周波数領域ダブル
トーク検出部(FDDTD)610iからなる。
エコーリダクション部(ER)611は、周波数領域変換処理部(FT)111aと、周
波数領域変換処理部(FT)111bと、周波数領域変換処理部(FT)111cと、受
話パワー算出部(POW)111dと、送話パワー算出部(POW)111eと、音響結
合量推定部(ACLE)611gと、エコー量推定部(ELE)111hと、周波数領域
ダブルトーク検出部(FDTD)611jと、制御部(CTRL)611kと、スペクト
ル選択部111Lと、ゲイン格納部(GTBL)111mと、エコー抑圧ゲイン算出部(
GCAL)611nと、信号抑圧部(SS)111oと、周波数領域逆変換処理部(IF
T)111pと、送話出力パワー算出部(POW)611uとからなる。
の音響結合量推定部(ACLE)611gは、音響結合量推定部(CACL)611g1
と、音響結合量補正部(ADJ)611g2と、音響結合量平滑部(SMACL)611
g3とからなる。
、図24〜図27を参照して説明する。
された送話入力信号z[n]と、遅延処理部(DELAY)102から出力された遅延し
た受話入力信号x[n−D]を入力とし、オーバーラップ保存法(Overlap-Save Method
)、あるいはオーバーラップ加算法(Overlap-Add Method)に基づき、送話入力信号z[
n]からエコー成分を抑圧し、そのエコー抑圧後の信号を残差信号e[n](n=0,1
,・・・,N−1)として出力し、またフィルタ係数HFDAF[f,ω]及びエコーパ
スロスの推定値λFDAF[f,ω]を出力する。
された遅延した受話入力信号x[n−D]を入力とし、FFT(Fast Fourier Transform
)などによって周波数領域に変換して、受話入力信号の周波数スペクトルXFDAF[f
,ω]を算出して出力する。このとき適宜、オーバーラップ保存法(Overlap-Save Metho
d)、あるいはオーバーラップ加算法(Overlap-Add Method)に基づき、ハミング窓など
による窓掛けや、過去のフレームを用いたり零補間したりオーバーラップを行う。
ω]が可変のトランスバーサルフィルタ(Transversal Filter)で構成される周波数領域
の適応フィルタである。また、周波数領域適応フィルタ部(FDADF)610eは、周
波数領域変換処理部(FT)610dから出力された受話入力信号の周波数スペクトルX
FDAF[f,ω]と、周波数領域変換処理部(FT)610hから出力された1フレー
ム前の残差信号の周波数スペクトルEFDAF[f−1,ω]と、周波数領域ダブルトー
ク検出部(FDDTD)610iから出力されたダブルトーク情報ECstate[f,
ω]とを入力とし、ダブルトーク情報ECstate[f,ω]がダブルトーク状態でな
かった場合はフィルタ係数HFDAF[f,ω]をフレームf及び周波数帯域ωごとに適
応学習し、ダブルトーク情報ECstate[f,ω]がダブルトーク状態であった場合
は適応学習を行わない。このようにしてフィルタ係数HFDAF[f,ω]を算出して出
力する。
FT)610dから出力された受話入力信号の周波数スペクトルXFDAF[f,ω]と
、フィルタ係数HFDAF[f,ω]とを用いて擬似エコー信号の周波数スペクトルY’
FDAF[f,ω]をY’FDAF[f,ω]=HFDAF[f,ω]・XFDAF[f
,ω]として算出して出力する。
ω]の更新幅を制御する固定あるいは可変のステップサイズμF[f,ω]を用いて、適
応学習を行う。
an-Square)アルゴリズム、NLMS(Normalized-Least-Mean-Square)アルゴリズム、
学習同定法、アフィン射影(AP:Affine-Projection)アルゴリズム、逐次最小二乗(
RLS:Recursive-Least-Squares)アルゴリズムなどの線形適応アルゴリズムに基づく
適応フィルタや勾配制限型学習同定法(Gradient-limited Normalized-Least-Mean-Squar
e)、適応ボルテラフィルタ(Adaptive Volterra Filter)などの非線形適応アルゴリズ
ムに基づく適応フィルタで構成される。また、本実施形態では勾配拘束のない(gradient
unconstrained)周波数領域型適応フィルタの例を示しているが、勾配拘束のある(grad
ient constrained)周波数領域型適応フィルタで構成してもよい。
F)610eから出力された擬似エコー信号の周波数スペクトルY’FDAF[f,ω]
を入力とし、IFFT(Inverse Fast Fourier Transform)などによって擬似エコー信号
y’FDAF[n](n=0,1,・・・,N−1)を算出して出力する。このとき適宜
、オーバーラップ保存法(Overlap-Save Method)あるいはオーバーラップ加算法(Overl
ap-Add Method)に基づき、過去のフレームを用いたり零補間したりオーバーラップを戻
したりする処理を行う。
入力信号z[n]と、周波数領域逆変換処理部(IFT)610fから出力された擬似エ
コー信号y’FDAF[n]とを入力とし、送話入力信号z[n]から擬似エコー信号y
’FDAF[n]をサンプルnごとに減算し、エコー成分を抑圧し、そのエコー抑圧後の
信号である残差信号e[n]を算出して出力する。
間領域の残差信号e[n]を入力として、FFT(Fast Fourier Transform)などによっ
て周波数領域に変換して、残差信号の周波数スペクトルEFDAF[f,ω]を算出して
出力する。このとき適宜、オーバーラップ保存法(Overlap-Save Method)、あるいはオ
ーバーラップ加算法(Overlap-Add Method)に基づき、ハミング窓などによる窓掛けや、
過去のフレームを用いたり零補間したりオーバーラップを行う。
T)610dから出力された受話信号の周波数スペクトルXFDAF[f,ω]と、周波
数領域変換処理部(FT)610hから出力された1フレーム前の残差信号の周波数スペ
クトルEFDAF[f−1,ω]とを、入力とし、フレームf及び周波数帯域ωごとにダ
ブルトーク状態か否かを判定し、ダブルトーク状態か否かを示す情報であるダブルトーク
情報ECstate[f,ω]と、エコーパスロスの推定値であるλFDAF[f,ω]
を算出して出力する。
のパワースペクトル|XFDAF[f,ω]|2と1フレーム前の残差信号のパワースペ
クトル|EFDAF[f−1,ω]|2とをフレームf及び周波数帯域ωごとに算出する
。そして、不等式|EFDAF[f−1,ω]|2>λFDAF[f,ω]・|XFDA
F[f,ω]|2が成り立つ場合にダブルトーク状態と判定する。ここでλFDAF[f
,ω]は、エコーパスロスの推定値であり、適応学習が進めば小さくなり、適応学習が間
違っていれば大きくなる可変量である。また、λFDAF[f,ω]は、フィルタ係数H
FDAF[f,ω]を適応学習したフレームf及び周波数帯域ωごとに更新して算出する
。
、ステップサイズμF[f,ω]、エコーパスロスの推定値λFDAF[f,ω]、ダブ
ルトーク情報ECstate[f,ω]、受話信号のパワースペクトル|XFDAF[f
,ω]|2、残差信号のパワースペクトル|EFDAF[f,ω]|2を内部状態として
メモリに保持している。
610eから出力されるフィルタ係数HFDAF[f,ω]と、周波数領域ダブルトーク
検出部(FDDTD)610iから出力されるエコーパスロスの推定値λFDAF[f,
ω]とを入力とし、エコーキャンセラ部(EC)610で抑圧されたエコー抑圧量ECL
[f,ω]を周波数帯域ω毎に推定して出力する。具体的には、ダブルトーク状態でない
場合に|EFDAF[f,ω]|2を|EFDAF[f,ω]|2=λFDAF[f,ω
]・|XFDAF[f,ω]|2のように近似し、送話入力信号のパワースペクトル|Y
’FDAF[f,ω]+EFDAF[f,ω]|2との比をエコー抑圧量ECL[f,ω
]として、以下に示す式39のように算出する。
及び残差信号e[n]に基づいてエコー成分を抑圧するものであって、そのエコー抑圧後
の信号を送話出力信号s’[n](n=0,1,・・・,N−1)として出力する。
出力されたスムージングされた受話パワースペクトル|XS[f,ω]|2と、送話パワ
ー算出部(POW)111eから出力されたスムージングされた送話パワースペクトル|
ZS[f,ω]|2と、エコー抑圧量推定部(ECLE)612から出力されたエコー抑
圧量ECL[f,ω]と、周波数領域ダブルトーク検出部(FDTD)611jから出力
された周波数領域ダブルトーク情報ERstate[f,ω]と、エコー量推定部(EL
E)111hから出力された1フレーム前のエコー量|YS[f−1,ω]|2とを入力
とし、スムージングした補正音響結合量|HS[f,ω]|2を算出して出力する。
ら出力されたスムージングされた受話パワースペクトル|XS[f,ω]|2と、送話パ
ワー算出部(POW)111eから出力されたスムージングされた送話パワースペクトル
|ZS[f,ω]|2とを入力とし、エコーキャンセラ部(EC)610の性能の影響を
受けないように残差信号に基づく|ES[f,ω]|2を用いずに送話入力信号に基づく
|ZS[f,ω]|2を用いて、周波数帯域ω毎に音響結合量|H[f,ω]|2を以下
に示す式40のように算出して出力する。
から出力された音響結合量|H[f,ω]|2と、エコー抑圧量推定部(ECLE)61
2から出力されたエコー抑圧量ECL[f,ω]と、送話パワー算出部(POW)111
eから出力されたスムージングされた送話パワースペクトル|ZS[f,ω]|2と、エ
コー量推定部(ELE)111hから出力された1フレーム前のエコー量|YS[f−1
,ω]|2とを入力とし、エコー抑圧量ECL[f,ω]に基づいて音響結合量|H[f
,ω]|2を補正した補正音響結合量|H’[f,ω]|2を算出して出力する。
ンセラ部(EC)610で抑圧されたエコー抑圧量が十分であるか判定を行う。周波数帯
域ω毎に、不等式ECL[f,ω]>βACL[ω]が成立した1フレーム当りの帯域数
countも加味し、ECL[f,ω]>βACL[ω]かつcount>βCACLと
なる周波数帯域をエコーキャンセラ部(EC)610のエコー抑圧量が十分でないと判定
する。ただし、βACL[ω]は+8dB〜−35dB程度が、βCACLは全周波数帯
域数の10%〜40%程度が望ましい。本実施形態では以下、βACL[ω]を0dBと
して説明する。
J)611g2は、1フレーム前のエコー量|YS[f−1,ω]|2よりも送話パワー
スペクトル|ZS[f,ω]|2が大きい場合にのみ、以下に示す式41のように音響結
合量|H[f,ω]|2を補正し、補正音響結合量|H’[f,ω]|2を算出する。
量が十分でないと判定された周波数帯域では、音響結合量補正部(ADJ)611g2は
、|H’[f,ω]|2=|H[f,ω]|2として補正を行わない。
2から出力された補正音響結合量|H’[f,ω]|2と、周波数領域ダブルトーク検出
部(FDTD)611jから出力された周波数領域ダブルトーク情報ERstate[f
,ω]とを入力として、以下に示す式42のように1フレーム前の値を用いてスムージン
グした|HS[f,ω]|2を算出して出力する。ただし、αH[ω]は、0.03〜0
.99程度が望ましい。
開始から5秒間程度はαH[ω]を大きくすることで音響結合量|HS[f,ω]|2の
更新を速めておく。このようにすることで通話開始初期時は音響結合量が初期化されてい
るので、通話開始初期時に抑圧量が少なくなってしまうのを防止することができる。
域ダブルトーク情報ERstate[f,ω]によりダブルトーク状態であると判定され
る場合、音響結合量が急激に変化する場合、即ち、不等式|HS[f,ω]|2>βH[
ω]・|HS[f−1,ω]|2が成り立つ場合、及び受話信号が十分に大きくない場合
、即ち、不等式|XS[f,ω]|2<βX[ω]が成り立つ場合には、エコーパス変動
への高速な追従性を保ちつつ、ダブルトークとなる周波数帯域での音響結合量の算出を行
わないようにするため、音響結合量平滑部(SMACL)611g3は、音響結合量を更
新しないで1フレーム前の過去の音響結合量|HS[f−1,ω]|2を用いる。
更新しないでおくことで送話音質劣化を防止することができる。ただし、βH[ω]は0
.9〜30程度が望ましい。βX[ω]は30dB〜40dB程度が望ましい。
111dから出力されたスムージングされた受話パワースペクトル|XS[f,ω]|2
と、送話出力パワー算出部(POW)611uから出力された1フレーム前のスムージン
グされた送話出力パワースペクトル|S’S[f−1,ω]|2とを入力とし、ダブルト
ーク状態か否かを示す情報を周波数領域ダブルトーク情報ERstate[f,ω]を算
出して出力する。具体的には、周波数領域ダブルトーク検出部(FDTD)611jは、
不等式|S’S[f−1,ω]|2>λER[f,ω]・|XS[f,ω]|2が成り立つ
場合にダブルトーク状態と判定する。
]|2を更新したフレームf及び周波数帯域ωごとに更新し、音響結合量|HS[f,ω
]|2の更新が進めば小さくなり、音響結合量|HS[f,ω]|2の更新が進まなけれ
ば大きくなる可変量である。
たエコー抑圧量ECL[f,ω]と、周波数領域ダブルトーク検出部(FDTD)611
jから出力された周波数領域ダブルトーク情報ERstate[f,ω]とを入力とし、
周波数帯域ω毎にダブルトーク状態かつエコーキャンセラ部(EC)610のエコー抑圧
量が十分でない周波数帯域を検出して、ダブルトーク状態かつエコーキャンセラ部(EC
)610のエコー抑圧量が十分でない周波数帯域であるか否かを示す情報である制御情報
ERcontrol[f,ω]を出力する。
部(FDTD)611jでダブルトーク状態であると判定されているか否かによって周波
数帯域ω毎にダブルトーク状態であるか否かを判定する。
Z[ω]が成り立ち、かつ不等式count>βCが成り立つ場合に周波数帯域をエコー
キャンセラ部(EC)610のエコー抑圧量が少ないと判定する。ただし、countは
1フレーム当りの式ECL[f,ω]>βZ[ω]が成立した帯域数であり、βZ[ω]
は+8dB〜−15dB程度、βCは全周波数帯域数の10%〜40%程度が望ましい。
本実施形態では以下、βZ[ω]=2.5(+8dB)として説明する。
eから出力されたスムージングされた送話パワースペクトル|ZS[f,ω]|2と、エ
コー量推定部(ELE)111hから出力されたスムージングしたエコー量|YS[f,
ω]|2と、エコー抑圧量推定部(ECLE)612から出力されたエコー抑圧量ECL
[f,ω]と、制御部(CTRL)611kから出力された制御情報ERcontrol
[f,ω]と、ゲイン格納部(GTBL)111mから出力されたパラメータγ[ω]と
を入力とし、スムージングされたエコー抑圧ゲインGS[f,ω]を算出して出力する。
rol[f,ω]からダブルトーク状態かつエコーキャンセラ部(EC)610のエコー
抑圧量が十分でないと検出された周波数帯域については、エコー抑圧ゲインG[f,ω]
をウィナー・フィルタ(Wiener Filter)法を用いて、式43によって算出する。
であり、エコーキャンセラ部(EC)610が正常に機能していると見なして、エコー抑
圧ゲイン算出部(GCAL)611nは、エコーリダクション部(ER)611のエコー
抑圧量を多くするように、エコーキャンセラ部(EC)610のエコー抑圧量ECL[f
,ω]を引数とした不等式0≦F(ECL[f,ω])≦1を満たす関数F(ECL[f
,ω])を用いて補正し、エコー抑圧ゲインG[f,ω]を以下に示す式44のように算
出する。
数を考慮した正値にしておくことが望ましい。
0≦ECL[f,ω]≦1のとき 式45−1により、
1≦ECL[f,ω]≦βZ[ω]のとき 式45−2により、
βZ[ω]≦ECL[f,ω]のとき 式45−3あるいは式45−4による。
F(ECL[f,ω])≦1を満たすように設定することで、補正後の抑圧ゲインが不自
然な値になることを防ぐことができ、送話音質の劣化を防ぐことができる。また、このよ
うに関数F(ECL[f,ω])を非線形な関数にすることで、エコーキャンセラ部(E
C)610のエコー抑圧量が十分でない場合(βZ[ω]≦ECL[f,ω])に抑圧量
が大きくなるようにゲインを補正することができる。
音質が劣化するのを防止し、背景雑音の断続抑圧を防止するため、抑圧ゲインG[f,ω
]は所定の下限値以下にならないように制御する。
イン算出部(GCAL)611nは、送話入力信号z[n]あるいは残差信号e[n]の
有音区間ではない区間の信号レベルを用いて周波数帯域ごとに背景雑音レベルを算出して
おき、背景雑音レベルよりも抑圧しないようにエコー抑圧ゲインを制御しても構わない。
を防止するために、エコー抑圧ゲインG[f,ω]を以下の式46−1あるいは式46−
2が示すように周波数方向にスムージングして出力してもよい。例えば、εjは、[0.
1,0.2,0.4,0.2,0.1]、ηjは、[0.1,0.2,0.4,0.8,
0.4,0.2,0.1]のようにしてよい。
れた送話出力信号の周波数スペクトルS’[f,ω]を入力とし、そのパワースペクトル
である送話出力パワースペクトル|S’[f,ω]|2を算出し、以下に示す式47のよ
うに1フレーム前の値|S’S[f−1,ω]|2を用いてスムージングした送話出力パ
ワースペクトル|S’S[f,ω]|2を算出して出力する。ただし、αS[ω]は、0
.75〜0.999程度が望ましい。
する。図28は、第6の実施形態に係る信号処理装置の全体の処理の流れを示すフローチ
ャートである。なお、図5を参照して説明した第1の実施形態に係る信号処理装置の動作
と同じ動作ステップについては、同じ符号を付してその部分の説明を省略する。
除去された送話入力信号z[n]を入力として、エコーキャンセラ部(EC)610はエ
コーキャンセラ処理を行う(ステップS6005)。
DF)610eから出力されるフィルタ係数HFDAF[f,ω]と、周波数領域ダブル
トーク検出部(FDDTD)610iから出力されるエコーパスロスの推定値λFDAF
[f,ω]とを入力とし、エコーキャンセラ部(EC)610で抑圧されたエコー抑圧量
ECL[f,ω]を推定する(ステップS6008)。
[n]と、エコーキャンセラ部(EC)610から出力されたエラーキャンセラ処理後の
信号である残差信号e[n]を入力として、エコーリダクション部(ER)611は非線
形エコー抑圧処理であるエコーリダクション処理を行う(ステップS6006)。そして
、ステップS1007の終話か否かの判断に移る。
れを示すフローチャートである。
号x[n−D]を周波数領域に変換して、受話入力信号の周波数スペクトルXFDAF[
f,ω]を算出し、残差信号e[n]を周波数領域に変換して、残差信号の周波数スペク
トルEFDAF[f,ω]を算出する。次に、周波数領域ダブルトーク検出部(FDDT
D)610iが受話信号の周波数スペクトルXFDAF[f,ω]と、1フレーム前の残
差信号の周波数スペクトルEFDAF[f−1,ω]とを用いて、周波数領域ダブルトー
ク検出処理を行う(ステップS6101)。そして、周波数領域適応フィルタ部(FDA
DF)610eはダブルトーク情報ECstate[f,ω]の制御を受けながら、受話
信号の周波数スペクトルXFDAF[f,ω]と、1フレーム前の残差信号の周波数スペ
クトルEFDAF[f−1,ω]とを用いて周波数領域適応フィルタ処理を行う(ステッ
プS6102)。次に、擬似エコー信号の周波数スペクトルY’FDAF[f,ω]を周
波数領域逆変換して、擬似エコー信号y’FDAF[n]を算出する。そして、信号減算
処理部610gは、送話入力信号z[n]から、周波数領域適応フィルタ部(FDADF
)610eから出力された擬似エコー信号y’FDAF[n]を減算し、残差信号e[n
]を算出して出力、エコーキャンセラ処理が終了する。
流れを示すフローチャートである。なお、図7を参照して説明した第1の実施形態に係る
エコーリダクション部(ER)111における動作と同じ動作ステップについては、同じ
符号を付してその部分の説明を省略する。
の残差パワースペクトル算出処理の動作はない。
ョン処理を開始して、ステップS1203rの受話パワースペクトル算出処理、ステップ
S1203sの送話パワースペクトル算出処理、及びステップS1202eの残差周波数
変換処理の後、周波数領域ダブルトーク検出部(FDTD)611jは、ダブルトーク状
態か否かの情報である周波数領域ダブルトーク情報ERstate[f,ω]を算出して
出力し、音響結合量推定部(ACLE)611gは、スムージングされた受話パワースペ
クトル|XS[f,ω]|2と、スムージングされた送話パワースペクトル|ZS[f,
ω]|2と、エコー抑圧量推定部(ECLE)612から出力されたエコー抑圧量ECL
[f,ω]と、周波数領域ダブルトーク情報ERstate[f,ω]とに基づいてスム
ージングした補正音響結合量|HS[f,ω]|2を算出する(ステップS6204)。
11kは、エコー抑圧量ECL[f,ω]と、周波数領域ダブルトーク情報ERstat
e[f,ω]とを入力とし、周波数帯域ω毎にダブルトーク状態かつエコーキャンセラ部
(EC)110のエコー抑圧量が十分でない周波数帯域を検出して、制御情報ERcon
trol[f,ω]を出力する(ステップS6207)。
ースペクトル|ZS[f,ω]|2と、エコー量|YS[f,ω]|2と、エコー抑圧量
ECL[f,ω]と、制御情報ERcontrol[f,ω]と、パラメータγ[ω]と
を入力とし、エコー抑圧ゲインG[f,ω]を算出して出力する(ステップS6208)
。
処理を行った後、送話出力パワー算出部(POW)611uは、送話出力パワースペクト
ルを算出する(ステップS6203ss)。そして、ステップS1211の周波数逆変換
処理に移って、エコーリダクション処理が終了する。
法(Overlap-Save Method)、あるいはオーバーラップ加算法(Overlap-Add Method)に
基づいた周波数領域型適応フィルタの例を示しているが、巡回畳み込み法(Circular-Con
volution Method)に基づいた周波数領域型適応フィルタで構成してもよい。
波数帯域毎に処理する方式として動作するものとして説明した。FFTによる周波数帯域
をグループでまとめて周波数帯域グループ毎に処理する方式や、フィルタバンクなどの帯
域分割フィルタなどの周波数領域型を実現してもよい。
よるエコー抑圧量が十分でない周波数領域をエコー抑圧量推定部(ECLE)612と制
御部(CTRL)611kで判定して、スペクトル選択部111Lとエコー抑圧ゲイン算
出部(GCAL)611nにおいて周波数帯域毎にエコーキャンセラ部(EC)610の
処理とエコーリダクション部(ER)611の処理の重みを変化させるように制御するこ
とができるので、エコーパスロス変動に対して頑健にすることが可能であり、高品質な信
号を出力することが可能である。
図31は、本発明の第6の実施形態の変形例に係る信号処理装置のエコーリダクション
部(ER)6112の構成を示すブロック図である。この第6の実施形態に係るエコーリ
ダクション部(ER)6112が第6の実施形態に係るエコーリダクション部(ER)6
11と異なる点は、音響結合量推定部(ACLE)611gを有さず、音響結合量推定部
(ACLE)611g−2を有する点にあり、その他の部分は同じである。そこで、同じ
部分については、同じ符号を付してその説明を省略する。
の構成を示すブロック図である。この音響結合量推定部(ACLE)611g−2は、音
響結合量推定部(CACL)611g1−2と、音響結合量平滑部(SMACL)611
g3−2と、音響結合量補正部(ADJ)611g2−2とからなる。
dから出力されたスムージングされた受話パワースペクトル|XS[f,ω]|2と、送
話パワー算出部(POW)111eから出力されたスムージングされた送話パワースペク
トル|ZS[f,ω]|2と、周波数領域ダブルトーク検出部(FDTD)611jから
出力された周波数領域ダブルトーク情報ERstate[f,ω]とを入力とし、エコー
キャンセラ部(EC)610の性能の影響を受けないように残差信号に基づく|ES[f
,ω]|2を用いずに送話入力信号に基づく|ZS[f,ω]|2を用いて、周波数帯域
ω毎に音響結合量|H[f,ω]|2を以下に示す式48のように算出して出力する。
域ダブルトーク情報ERstate[f,ω]によりダブルトーク状態であると判定され
たことが示されている場合や、音響結合量が急激に変化する場合、即ち、不等式|H[f
,ω]|2>βH[ω]・|H[f−1,ω]|2が成り立つ場合、及び受話信号が十分
に大きくない場合、即ち、不等式|XS[f,ω]|2<βX[ω]が成り立つ場合には
、エコーパス変動への高速な追従性を保ちつつ、ダブルトークとなる周波数帯域での音響
結合量の算出を行わないようにするため、音響結合量推定部(CACL)611g1−2
は、音響結合量を更新しないで1フレーム前の過去の音響結合量|H[f−1,ω]|2
を用いる。
更新しないでおくことで送話音質劣化を防止することができる。ただし、βH[ω]は0
.9〜30程度が望ましい。βX[ω]は30dB〜40dB程度が望ましい。
11g1−2から出力された音響結合量|H[f,ω]|2と、エコー抑圧量推定部(E
CLE)612から出力されたエコー抑圧量ECL[f,ω]とを入力とし、以下に示す
式49のように1フレーム前の値を用いてスムージングした音響結合量|HS’[f,ω
]|2を算出して出力する。
セラ部(EC)610で抑圧されたエコー抑圧量ECL[f,ω]に基づいて、周波数帯
域ω毎にαH[ω]を可変にする。つまり、エコー抑圧量ECL[f,ω]が十分ある程
、αH[ω]を0に近づけ、エコー抑圧量ECL[f,ω]が十分ではない程αH[ω]
を1に近づける。
1g3−2から出力されたスムージングした音響結合量|HS’[f,ω]|2と、エコ
ー抑圧量推定部(ECLE)612から出力されたエコー抑圧量ECL[f,ω]とを入
力とし、補正音響結合量|HS[f,ω]|2を算出して出力する。
ーキャンセラ部(EC)610で抑圧されたエコー抑圧量ECL[f,ω]が十分である
か否かを判定する。そして、エコーキャンセラ部(EC)610で抑圧されたエコー抑圧
量ECL[f,ω]が十分であると判定された周波数帯域では、0<βHACL[ω]≦
1なる係数βHACL[ω]を用いて以下に示す式50のようにスムージングされた音響
結合量|HS’[f,ω]|2を補正し、補正音響結合量|HS[f,ω]|2を算出し
て出力する。
いと判定された周波数帯域では、音響結合量補正部(ADJ)611g2−2は、|HS
[f,ω]|2=|HS’[f,ω]|2としてスムージングされた音響結合量|Hs’
[f,ω]|2の補正を行わない。このようにすることで、エコーパス変動がそれほど起
きない場合に送話音質が劣化することを防げる。
図33は、第7の実施形態に係る信号処理装置の構成を示すブロック図である。この信
号処理装置が第6の実施形態に係る信号処理装置と異なる点は、図33に示すようにエコ
ーキャンセラ部(EC)610とエコーリダクション部(ER)611とエコー抑圧量推
定部(ECLE)612を有さず、エコーキャンセラ部(EC)710とエコーリダクシ
ョン部(ER)711とエコー抑圧量推定部(ECLE)712とを有する点にあり、そ
の他の部分は同じである。そこで、第6の実施形態に係る信号処理装置と同じ部分につい
ては、同じ符号を付してその説明を省略する。
に係るエコーリダクション部(ER)111及び第6の実施形態に係るエコーリダクショ
ン部(ER)611と同じ部分については、同じ符号を付してその説明を省略する。
コーキャンセラ部(EC)710は、時間領域エコーキャンセラ部(TDAF)と周波数
領域型エコーキャンセラ部(FDAF)からなり、これらを直列接続したものである。す
なわち、時間領域エコーキャンセラ部(TDAF)での処理後の信号を用いて周波数領域
型エコーキャンセラ部(FDAF)の処理を行う。
部(EC)110と同じであり、周波数領域型エコーキャンセラ部(FDAF)は、第6
の実施形態に係るエコーキャンセラ部(EC)610と同じである。
−D]を、エコーキャンセラ部(EC)110及びエコーキャンセラ部(EC)610に
入力させる。更に、エコーキャンセラ部(EC)110によって出力された残差信号e[
n]を、エコーキャンセラ部(EC)610に送話入力信号z[n]として入力させて、
直列接続する。この場合、エコーキャンセラ部(EC)710は、エコーキャンセラ部(
EC)110の内部状態とエコーキャンセラ部(EC)610の内部状態を併せて、内部
状態としてメモリに保持している。
に係るエコーキャンセラ部(EC)610と同じ符号を付して、エコーキャンセラ部(E
C)710の説明を省略する。
エコーリダクション部(ER)711は、周波数領域変換処理部(FT)111aと、周
波数領域変換処理部(FT)111bと、周波数領域変換処理部(FT)111cと、受
話パワー算出部(POW)111dと、送話パワー算出部(POW)111eと、残差パ
ワー算出部(POW)111fと、エコー量推定部(ELE)711hと、周波数領域ダ
ブルトーク検出部(FDTD)711jと、制御部(CTRL)611kと、スペクトル
選択部111Lと、ゲイン格納部(GTBL)111mと、エコー抑圧ゲイン算出部(G
CAL)611nと、信号抑圧部(SS)111oと、周波数領域逆変換処理部(IFT
)111pとからなる。
このエコー量推定部(ELE)711hは、信号減算処理部711h1、エコー量推定制
御部(ELECTRL)711h2、可変ゲイン711h3、711h4、信号加算処理
部711h5からなる。
、図33〜図36を参照して説明する。
9から出力された送話入力信号z[n]と、エコーキャンセラ部(EC)710の信号減
算処理部610gから出力された時間領域の残差信号e[n]を入力とし、エコーキャン
セラ部(EC)610で抑圧されたエコー抑圧量ECL[f,ω]を周波数帯域ω毎に推
定して出力する。
窓掛け及びオーバーラップして、FFTによって周波数領域に変換し、送話パワースペク
トル|Z’[f,ω]|2を算出する。次に、残差信号e[n]を窓掛け及びオーバーラ
ップして、FFTによって周波数領域に変換し、残差パワースペクトル|E’[f,ω]
|2を算出する。そして、以下に示す式51のように送話パワースペクトル|Z’[f,
ω]|2と残差パワースペクトル|E’[f,ω]|2の比をエコーキャンセラ部(EC
)710で抑圧されたエコー抑圧量ECL[f,ω]として算出して出力する。
)711の動作を説明する。
及び残差信号e[n]に基づいてエコー成分を抑圧するものであって、そのエコー抑圧後
の信号を送話出力信号s’[n](n=0,1,・・・,N−1)として出力する。
されたスムージングされた受話パワースペクトル|XS[f,ω]|2と、送話パワー算
出部(POW)111eから出力されたスムージングされた送話パワースペクトル|ZS
[f,ω]|2と、残差パワー算出部(POW)111fから出力されたスムージングさ
れた残差パワースペクトル|ES[f,ω]|2と、エコー抑圧量推定部(ECLE)7
12から出力されたエコー抑圧量ECL[f,ω]と、周波数領域ダブルトーク検出部(
FDTD)711jから出力された周波数領域ダブルトーク情報ERstate[f,ω
]とを入力とし、スムージングしたエコー量|YS[f,ω]|2を算出して出力する。
話パワースペクトル|ZS[f,ω]|2と、残差パワー算出部(POW)111fから
出力された残差パワースペクトル|ES[f,ω]|2とを入力とし、送話パワースペク
トル|ZS[f,ω]|2から残差パワースペクトル|ES[f,ω]|2をフレームf
及び周波数帯域ω毎に減算して、減算した信号|ZS[f,ω]|2−|ES[f,ω]
|2を出力する。
11dから出力されたスムージングされた受話パワースペクトル|XS[f,ω]|2と
、送話パワー算出部(POW)111eから出力されたスムージングされた送話パワース
ペクトル|ZS[f,ω]|2と、残差パワー算出部(POW)111fから出力された
スムージングされた残差パワースペクトル|ES[f,ω]|2と、エコー抑圧量推定部
(ECLE)712から出力されたエコー抑圧量ECL[f,ω]と、周波数領域ダブル
トーク検出部(FDTD)711jから出力された周波数領域ダブルトーク情報ERst
ate[f,ω]とを入力とし、2つの可変ゲインG1[f,ω]及びG2[f,ω]を
算出して出力する。
ク状態であると判定されたことを示している場合を除いたシングルトーク状態時に、エコ
ー量推定制御部(ELECTRL)711h2は、エコー量|YS[f,ω]|2を精度
よく推定するために以下に示す式52−1、式52−2、式52−3のようにGHZ、G
HE、GHZEの3つのゲインをそれぞれ算出する。
,ω]を引数とし値域が0以上1以下である3つの関数FHZ(ECL[f,ω])、F
HE(ECL[f,ω])、及びFHZE(ECL[f,ω])を以下のように制御する
。エコー抑圧量ECL[f,ω]が十分ではない場合、残差パワースペクトル|ES[f
,ω]|2の影響を少なくするために、FHE(ECL[f,ω])及びFHZE(EC
L[f,ω])を0に近づけるかあるいは小さい値に設定し、FHZ(ECL[f,ω]
)を1に近づける。
[f,ω]|2を信頼して用いるように、FHZ(ECL[f,ω])を0に近づけるか
あるいは小さい値に設定し、FHE(ECL[f,ω])及びFHZE(ECL[f,ω
])を1に近づける。このとき、エコー抑圧量ECL[f,ω]が十分であるか否かの判
定条件として、制御部(CTRL)611kと同様の判定条件を用いてもよい。そして、
2つの可変ゲインG1[f,ω]及びG2[f,ω]を、それぞれ以下に示す式53−1
、式53−2のように算出する。
ジングされた受話パワースペクトル|XS[f,ω]|2と、エコー量推定制御部(EL
ECTRL)711h2から出力された可変ゲインG1[f,ω]とを入力とし、|XS
[f,ω]|2にG1[f,ω]を乗じて、受話パワースペクトル|XS[f,ω]|2
を増幅あるいは減衰させて出力する。
ω]|2−|ES[f,ω]|2と、エコー量推定制御部(ELECTRL)711h2
から出力された可変ゲインG2[f,ω]とを入力とし、|ZS[f,ω]|2−|ES
[f,ω]|2にG2[f,ω]を乗じて、増幅あるいは減衰させて出力する。
乗じた|XS[f,ω]|2と、可変ゲイン711h4から出力されたG2[f,ω]を
乗じた|ZS[f,ω]|2−|ES[f,ω]|2とを入力とし、スムージングされた
エコー量|YS[f,ω]|2を算出して出力する。具体的には、以下に示す式54−1
のようにフレームf及び周波数帯域ω毎に、G1[f,ω]を乗じた|XS[f,ω]|
2とG2[f,ω]を乗じた|ZS[f,ω]|2−|ES[f,ω]|2を加算してエ
コー量|Y[f,ω]|2を算出する。
たエコー量|Ys[f,ω]|2を算出して出力する。ただし、αY[ω]は0.7〜0
.99程度が望ましい。勿論、スムージングしないエコー量|Y[f,ω]|2を出力し
てもよい。
111dから出力されたスムージングされた受話パワースペクトル|XS[f,ω]|2
と、エコー量推定部(ELE)711hから出力された1フレーム前のスムージングした
エコー量|YS[f−1,ω]|2と、残差パワー算出部(POW)111fから出力さ
れたスムージングされた残差パワースペクトル|ES[f,ω]|2とを入力とし、ダブ
ルトーク状態か否かを示す情報である周波数領域ダブルトーク情報ERstate[f,
ω]を算出して出力する。
に以下のように閾値よりも大きい、即ち、以下に示す不等式55が成り立てば、ダブルト
ーク状態と判定する。ただし、βY[ω]は1.0〜20程度が望ましい。
する。図37は、第7の実施形態に係る信号処理装置の全体の処理の流れを示すフローチ
ャートである。なお、図5を参照して説明した第1の実施形態に係る信号処理装置の動作
と同じ動作ステップについては、同じ符号を付してその部分の説明を省略する。
除去された送話入力信号z[n]を入力として、エコーキャンセラ部(EC)710はエ
コーキャンセラ処理を行う(ステップS7005)。
9から出力された送話入力信号z[n]と信号減算処理部610gから出力された時間領
域の残差信号e[n]を入力とし、エコーキャンセラ部(EC)710で抑圧されたエコ
ー抑圧量ECL[f,ω]を推定する(ステップS7008)。
[n]と、エコーキャンセラ部(EC)710から出力されたエラーキャンセラ処理後の
信号である残差信号e[n]を入力として、エコーリダクション部(ER)711は非線
形エコー抑圧処理であるエコーリダクション処理を行う(ステップS7006)。そして
、ステップS1007の終話か否かの判断に移る。
れを示すフローチャートである。なお、図6を参照して説明した第1の実施形態に係るエ
コーキャンセラ部(EC)110の動作と同じ動作ステップについては、同じ符号を付し
てその部分の説明を省略する。
ク検出処理を行った後、ステップS1102で適応フィルタ処理を行い、信号減算処理部
110bは、送話入力信号z[n]から、適応フィルタ部(ADF)110aから出力さ
れた擬似エコー信号y’[n]を減算し、残差信号eTDAF[n]を算出する。次に、周波
数領域ダブルトーク検出処理を行い(ステップS6101)、周波数領域適応フィルタ処
理を行い、信号減算処理部610gは、残差信号eTDAF[n]から、周波数領域適応フィ
ルタ部(FDADF)610eから出力された擬似エコー信号y’FDAF[n]を減算
し、残差信号e[n]を算出して出力し(ステップS6102)、エコーキャンセラ処理
が終了する。
流れを示すフローチャートである。なお、図7を参照して説明した第1の実施形態に係る
エコーリダクション部(ER)111及び図30を参照して説明した第6の実施形態に係
るエコーリダクション部(ER)611における動作と同じ動作ステップについては、同
じ符号を付してその部分の説明を省略する。
理を開始して、ステップS1203rの受話パワースペクトル算出処理、ステップS12
03sの送話パワースペクトル算出処理、及びステップS1203eの残差パワースペク
トル算出処理の後、周波数領域ダブルトーク検出部(FDTD)711jは、ダブルトー
ク状態か否かを示す情報である周波数領域ダブルトーク情報ERstate[f,ω]出
力し、エコー量推定部(ELE)711hは、受話パワースペクトル|XS[f,ω]|
2と、送話パワースペクトル|ZS[f,ω]|2と、残差パワースペクトル|ES[f
,ω]|2と、エコー抑圧量ECL[f,ω]と、周波数領域ダブルトーク情報ERst
ate[f,ω]とを入力とし、スムージングしたエコー量|YS[f,ω]|2を算出
して出力する(ステップS7205)。
処理、ステップS1209でスペクトル選択処理、ステップS1210で送話信号抑圧処
理を行った後、ステップS1211の周波数逆変換処理に移って、エコーリダクション処
理が終了する。
帯域毎に処理する方式として動作するものとして説明した。FFTによる周波数帯域をグ
ループでまとめて周波数帯域グループ毎に処理する方式や、フィルタバンクなどの帯域分
割フィルタなどの周波数領域型を実現してもよい。
よるエコー抑圧量が十分でない周波数領域をエコー抑圧量推定部(ECLE)712と制
御部(CTRL)611kで判定して、スペクトル選択部111Lとエコー抑圧ゲイン算
出部(GCAL)611nにおいて周波数帯域毎にエコーキャンセラ部(EC)710の
処理とエコーリダクション部(ER)711の処理の重みを変化させるように制御するこ
とができるので、エコーパスロス変動に対して頑健にすることが可能であり、高品質な信
号を出力することが可能である。
図40は、本発明の第7の実施形態の変形例に係る信号処理装置の構成を示すブロック
図である。この第7の実施形態の変形例に係る信号処理装置が第7の実施形態に係る信号
処理装置と異なる点は、エコーキャンセラ部(EC)710、エコーリダクション部(E
R)711、エコー抑圧量推定部(ECLE)712に代えて、エコーキャンセラ部(E
C)710r及びエコーリダクション部(ER)711r及びエコー抑圧量推定部(EC
LE)712rを有することである。そして、送話入力信号格納部(BUFF)713と
受話入力信号格納部(BUFF)714と、遅延処理部(DELAY)702rを有する
ことである。
信号に回り込み音響結合することで発生していたエコーを受話入力信号を参照として送話
入力信号から抑圧する構成であったのに対し、この第7の実施形態の変形例に係る信号処
理装置では送話出力信号が図示しない遠端において回り込んで音響結合したエコーを送話
出力信号を参照として受話入力信号から抑圧する構成になっている点であり、その他の部
分は同じである。そこで、同じ部分については、同じ符号を付してその説明を省略する。
、例えば、特開2005−142886号公報に記載の技術、あるいは送話入力信号と受
話入力信号の相互相関を用いる遅延時間推定技術によって、図示しない遠端において発生
していたエコーについて遅延などの処理を用いて同期が合う構成になっている。
ダクション部(ER)711r及びエコー抑圧量推定部(ECLE)712rは、入力さ
れる信号が異なるが、第7の実施形態に係る遅延処理部(DELAY)102、エコーキ
ャンセラ部(EC)710、エコーリダクション部(ER)711及びエコー抑圧量推定
部(ECLE)712と同様の処理を行う。
抑圧することができる。
置全般をいい、例えば、ハンズフリー通話機能を有するハンズフリー通話装置や、電話機
、インターフォン、携帯電話、PHS、VoIPソフトウェア、VoIPシステム、TV
会議システムなどを含む。
ダクション、エコーサプレッサ、エコーノイズリダクションを、少なくともノイズ成分を
低減させる信号処理の例として、ノイズリダクション、エコーノイズリダクションを挙げ
て説明した。このように記載したのは一般的な呼称であるからであり、本発明はこれら呼
称に限定されるものではない。また、本発明の要旨を逸脱しない範囲でこれらの信号処理
の組み合わせにおいても実施し得ることが可能である。
ない範囲で種々の変形を実施し得ることが可能である。さらに、上記各実施形態には、種
々の段階の発明が含まれており、開示される複数の構成要件における適宜な組合せにより
種々の発明が抽出され得る。
発明が解決しようとする課題の欄で述べた課題が解決でき、発明の効果で述べられている
効果が得られる場合には、この構成要件が削除された構成が発明として抽出され得る。本
発明は装置のみならず、当該装置の機能を実現する方法やプログラムとしても成立する。
110a 適応フィルタ部(ADF)
110b、610g、711h1 信号減算処理部
110c ダブルトーク検出部(DTD)
111、511、611、711、711r、1112 エコーリダクション部(ER)
111a、111b、111c、610d、610h 周波数領域変換処理部(FT)
111d、411d 受話パワー算出部(POW)
111e、411e 送話パワー算出部(POW)
111f、411f 残差パワー算出部(POW)
111g、111g2、511g、611g、611g−2 音響結合量推定部(ACL
E)
111h、511h、711h エコー量推定部(ELE)
111i、411i、612、712、712r エコー抑圧量推定部(ECLE)
111j、611j、711j 周波数領域ダブルトーク検出部(FDTD)
111k、211k、411k、511k、611k 制御部(CTRL)
111L、211L、511L スペクトル選択部
111m、411m ゲイン格納部(GTBL)
111n、111n2、411n、511n、611n エコー抑圧ゲイン算出部(GC
AL)
111o、211o、311o 信号抑圧部(SS)
111p、610f 周波数領域逆変換処理部(IFT)
211 ノイズリダクション部(NR)
211n ノイズ抑圧ゲイン算出部(GCAL)
211q、311q 雑音レベル推定部(NLE)
311 エコーノイズリダクション部(ENR)
311n エコーノイズ抑圧ゲイン算出部(GCAL)
411 エコーサプレッサ部(ES)
411L 信号選択部
411o、511s 送話信号抑圧部(SS)
411r 受話信号抑圧部(SS)
511t 残差信号抑圧部(ES)
610e 周波数領域適応フィルタ部(FDADF)
610i 周波数領域ダブルトーク検出部(FDDTD)
611g1、611g1−2 音響結合量推定部(CACL)
611g2、611g2−2 音響結合量補正部(ADJ)
611g3、611g3−2 音響結合量平滑部(SMACL)
611u 送話出力パワー算出部(POW)
711h2 エコー量推定制御部(ELECTRL)
711h3、711h4 可変ゲイン
711h5 信号加算処理部
Claims (19)
- 入力信号に含まれる少なくともエコーを抑圧してエコー低減信号を出力する第1の信号
処理手段と、
前記入力信号と前記エコー低減信号とを入力し、エコー及びノイズの少なくとも一方を抑
圧する第2の信号処理手段と、を備え、
前記第2の信号処理手段は、前記入力信号と前記エコー低減信号とのどちらか一方を選択
する選択手段を有し、
前記選択手段によって選択された前記入力信号及び前記エコー低減信号のいずれか一方の
前記エコー及び前記ノイズの少なくとも一方を抑圧する
ことを特徴とする信号処理装置。 - 前記第1の信号処理手段の内部状態、前記入力信号及び前記エコー低減信号の少なくと
も1つを用いて前記第1の信号処理手段のエコー抑圧量を算出するエコー抑圧量算出手段
を更に備え、
前記選択手段は、前記エコー抑圧量算出手段によって算出された前記エコー抑圧量に基づ
いて、前記入力信号と前記エコー低減信号とのどちらか一方を選択する
ことを特徴とする請求項1に記載の信号処理装置。 - 前記第2の信号処理手段は、前記入力信号及び前記エコー低減信号の少なくとも1つに
含まれる前記エコー及び前記ノイズの少なくとも一方を推定して算出した抑圧量と、前記
エコー抑圧量算出手段によって算出されたエコー抑圧量との少なくとも1つに基づいて、
前記選択手段によって選択された信号の抑圧量を設定する抑圧量設定手段を有し、
前記抑圧量設定手段によって設定された抑圧量で抑圧する
ことを特徴とする請求項2に記載の信号処理装置。 - 前記第2の信号処理手段は、前記エコー抑圧量算出手段によって算出されたエコー抑圧
量に基づいて第1の抑圧量及び第2の抑圧量のどちらか一方の抑圧量を選択する抑圧量設
定手段を有し、
前記入力信号に含まれる前記エコー及び前記ノイズの少なくとも一方を推定して前記第1
の抑圧量を算出し、前記エコー低減信号に含まれる前記エコー及び前記ノイズの少なくと
も一方を推定して前記第2の抑圧量を算出し、前記抑圧量設定手段によって選択された前
記第1の抑圧量及び前記第2の抑圧量のどちらか一方の抑圧量で抑圧する
ことを特徴とする請求項2に記載の信号処理装置。 - 前記第2の信号処理手段は、前記入力信号に含まれる前記エコーあるいは前記ノイズを
推定して第1の抑圧量を算出し、前記エコー低減信号に含まれる前記エコーあるいは前記
ノイズを推定して第2の抑圧量を算出し、前記選択手段によって前記入力信号が選択され
た場合は前記第1の抑圧量を選択し、前記選択手段によって前記エコー低減信号が選択さ
れた場合は前記第2の抑圧量を選択する抑圧量設定手段を有し、
前記抑圧量設定手段によって選択された抑圧量で抑圧する
ことを特徴とする請求項1または請求項2に記載の信号処理装置。 - 入力信号に対して少なくともエコーを抑圧してエコー低減信号を出力する第1の信号処
理手段と、
前記入力信号と前記エコー低減信号を入力し、エコー及びノイズの少なくとも一方を抑圧
して出力する第2の信号処理手段と、を備え、
前記第2の信号処理手段は、前記入力信号に含まれる前記エコー及び前記ノイズの少なく
とも一方を推定して第1の抑圧量を算出する第1の抑圧量設定手段と、前記エコー低減信
号に含まれる前記エコー及び前記ノイズの少なくとも一方を推定して第2の抑圧量を算出
する第2の抑圧量設定手段と、前記入力信号に含まれる前記エコー及び前記ノイズの少な
くとも一方を前記第1の抑圧量設定手段によって推定された第1の抑圧量で抑圧した信号
と、前記エコー低減信号に含まれる前記エコー及び前記ノイズの少なくとも一方を前記第
2の抑圧量設定手段によって推定された第2の抑圧量で抑圧した信号とのどちらか一方を
選択する選択手段とを有し、
前記選択手段によって選択された信号を出力する
ことを特徴とする信号処理装置。 - 前記第1の信号処理手段の内部状態、前記第1の入力信号及び前記エコー低減信号の少
なくとも1つを用いて前記第1の信号処理手段のエコー抑圧量を算出するエコー抑圧量算
出手段を更に備え、
前記選択手段は、前記エコー抑圧量算出手段によって算出された前記エコー抑圧量に基づ
いて、前記入力信号を前記第1の抑圧量で抑圧した信号と、前記エコー低減信号を前記第
2の抑圧量で抑圧した信号とのどちらか一方を選択する
ことを特徴とする請求項6に記載の信号処理装置。 - 前記抑圧量設定手段は、前記エコー抑圧量算出手段によって算出された前記エコー抑圧
量に基づいてエコー量を推定するエコー量推定手段を有し、
前記エコー量推定手段によって推定されたエコー量を用いて前記第2の信号処理手段の抑
圧量を設定する
ことを特徴とする請求項3乃至請求項5及び請求項7のいずれか1項に記載の信号処理装
置。 - 前記抑圧量設定手段は、前記第2の信号処理手段の抑圧量を周波数領域毎に設定し、
前記エコー量推定手段は、前記周波数領域毎にエコー量を推定する
ことを特徴とする請求項8に記載の信号処理装置。 - 前記抑圧量設定手段は、前記第2の信号処理手段の抑圧量を周波数領域毎に設定する
ことを特徴とする請求項3乃至請求項5及び請求項7のいずれか1項に記載の信号処理装
置。 - 前記エコー量推定手段は、音響結合量を推定する音響結合量推定手段と、前記音響結合
量推定手段によって推定された音響結合量を前記エコー抑圧量算出手段によって算出され
たエコー抑圧量に基づいて補正する音響結合量補正手段と、を有し、
前記音響結合量補正手段によって補正された音響結合量を用いて前記エコー量を推定する
ことを特徴とする請求項8に記載の信号処理装置。 - 前記エコー量推定手段は、周波数領域毎に前記エコー量を推定し、
前記音響結合量推定手段は、前記周波数領域毎に前記音響結合量を推定し、
前記音響結合量補正手段は、前記周波数領域毎に前記音響結合量を補正する
ことを特徴とする請求項11に記載の信号処理装置。 - 前記抑圧量設定手段は、エコー量を推定するエコー量推定手段と、前記エコー量推定手
段によって推定されたエコー量を用いて抑圧ゲインを算出する抑圧ゲイン算出手段と、前
記エコー抑圧量算出手段によって算出された前記エコー抑圧量に基づいて前記抑圧ゲイン
算出手段によって算出された抑圧ゲインを補正する抑圧ゲイン補正手段と、を有し、
前記抑圧ゲイン補正手段によって補正された抑圧ゲインを抑圧量として設定する
ことを特徴とする請求項3乃至請求項5及び請求項7のいずれか1項に記載の信号処理装
置。 - 前記エコー量推定手段は、周波数領域毎に前記エコー量を推定し、
前記抑圧ゲイン算出手段は、周波数領域毎に前記抑圧ゲインを算出し、
前記抑圧ゲイン補正手段は、周波数領域毎に前記抑圧ゲインを補正する
ことを特徴とする請求項13に記載の信号処理装置。 - 前記選択手段は、周波数領域毎に前記2つの信号のいずれか一方を選択する
ことを特徴とする請求項1乃至請求項14のいずれか1項に記載の信号処理装置。 - 前記エコー抑圧量算出手段は、前記第1の信号処理手段のエコー抑圧量を周波数領域毎
に算出する
ことを特徴とする請求項2乃至請求項5及び請求項7乃至請求項15のいずれか1項に記
載の信号処理装置。 - 前記入力信号はマイクから収音された送話信号である
ことを特徴とする請求項1乃至請求項16のいずれか1項に記載の信号処理装置。 - 前記入力信号は受話信号である
ことを特徴とする請求項1乃至請求項16のいずれか1項に記載の信号処理装置。 - 入力信号に対して少なくともエコーを抑圧してエコー低減信号を作成し、前記入力信号
に含まれる前記エコー及びノイズの少なくとも一方を推定して第1の抑圧量を算出し、前
記エコー低減信号に含まれる前記エコー及び前記ノイズの少なくとも一方を推定して第2
の抑圧量を算出し、前記入力信号を前記第1の抑圧量で抑圧した信号と、前記エコー低減
信号を前記第2の抑圧量で抑圧した信号とのどちらか一方を選択して出力する信号処理手
段を備える
ことを特徴とする信号処理装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006203418A JP4818014B2 (ja) | 2005-07-28 | 2006-07-26 | 信号処理装置 |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005219303 | 2005-07-28 | ||
JP2005219303 | 2005-07-28 | ||
JP2006203418A JP4818014B2 (ja) | 2005-07-28 | 2006-07-26 | 信号処理装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007060644A true JP2007060644A (ja) | 2007-03-08 |
JP4818014B2 JP4818014B2 (ja) | 2011-11-16 |
Family
ID=37923645
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006203418A Active JP4818014B2 (ja) | 2005-07-28 | 2006-07-26 | 信号処理装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4818014B2 (ja) |
Cited By (34)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009151062A1 (ja) * | 2008-06-10 | 2009-12-17 | ヤマハ株式会社 | 音響エコーキャンセラおよび音響エコーキャンセル方法 |
JP2010135936A (ja) * | 2008-12-02 | 2010-06-17 | Hitachi Ltd | エコーキャンセラおよびエコー消去方法 |
WO2012157785A1 (ja) * | 2011-05-19 | 2012-11-22 | 日本電気株式会社 | 音声処理装置、音声処理方法及び音声処理プログラムを記録した記録媒体 |
JP2013225747A (ja) * | 2012-04-20 | 2013-10-31 | Panasonic Corp | 通話装置 |
JP2014519758A (ja) * | 2011-06-03 | 2014-08-14 | シラス ロジック、インコーポレイテッド | パーソナルオーディオデバイスのための適合的ノイズキャンセリングアーキテクチャ |
US9179217B2 (en) | 2012-12-21 | 2015-11-03 | Kabushiki Kaisha Toshiba | Signal processing apparatus and signal processing method |
US9460701B2 (en) | 2013-04-17 | 2016-10-04 | Cirrus Logic, Inc. | Systems and methods for adaptive noise cancellation by biasing anti-noise level |
US9462376B2 (en) | 2013-04-16 | 2016-10-04 | Cirrus Logic, Inc. | Systems and methods for hybrid adaptive noise cancellation |
US9479860B2 (en) | 2014-03-07 | 2016-10-25 | Cirrus Logic, Inc. | Systems and methods for enhancing performance of audio transducer based on detection of transducer status |
US9478210B2 (en) | 2013-04-17 | 2016-10-25 | Cirrus Logic, Inc. | Systems and methods for hybrid adaptive noise cancellation |
US9497542B2 (en) | 2012-11-12 | 2016-11-15 | Yamaha Corporation | Signal processing system and signal processing method |
US9502020B1 (en) | 2013-03-15 | 2016-11-22 | Cirrus Logic, Inc. | Robust adaptive noise canceling (ANC) in a personal audio device |
US9532139B1 (en) | 2012-09-14 | 2016-12-27 | Cirrus Logic, Inc. | Dual-microphone frequency amplitude response self-calibration |
US9552805B2 (en) | 2014-12-19 | 2017-01-24 | Cirrus Logic, Inc. | Systems and methods for performance and stability control for feedback adaptive noise cancellation |
US9578432B1 (en) | 2013-04-24 | 2017-02-21 | Cirrus Logic, Inc. | Metric and tool to evaluate secondary path design in adaptive noise cancellation systems |
US9578415B1 (en) | 2015-08-21 | 2017-02-21 | Cirrus Logic, Inc. | Hybrid adaptive noise cancellation system with filtered error microphone signal |
US9620101B1 (en) | 2013-10-08 | 2017-04-11 | Cirrus Logic, Inc. | Systems and methods for maintaining playback fidelity in an audio system with adaptive noise cancellation |
US9633646B2 (en) | 2010-12-03 | 2017-04-25 | Cirrus Logic, Inc | Oversight control of an adaptive noise canceler in a personal audio device |
US9646595B2 (en) | 2010-12-03 | 2017-05-09 | Cirrus Logic, Inc. | Ear-coupling detection and adjustment of adaptive response in noise-canceling in personal audio devices |
US9666176B2 (en) | 2013-09-13 | 2017-05-30 | Cirrus Logic, Inc. | Systems and methods for adaptive noise cancellation by adaptively shaping internal white noise to train a secondary path |
US9704472B2 (en) | 2013-12-10 | 2017-07-11 | Cirrus Logic, Inc. | Systems and methods for sharing secondary path information between audio channels in an adaptive noise cancellation system |
US9721556B2 (en) | 2012-05-10 | 2017-08-01 | Cirrus Logic, Inc. | Downlink tone detection and adaptation of a secondary path response model in an adaptive noise canceling system |
US9773490B2 (en) | 2012-05-10 | 2017-09-26 | Cirrus Logic, Inc. | Source audio acoustic leakage detection and management in an adaptive noise canceling system |
US9807503B1 (en) | 2014-09-03 | 2017-10-31 | Cirrus Logic, Inc. | Systems and methods for use of adaptive secondary path estimate to control equalization in an audio device |
US9824677B2 (en) | 2011-06-03 | 2017-11-21 | Cirrus Logic, Inc. | Bandlimiting anti-noise in personal audio devices having adaptive noise cancellation (ANC) |
US9955250B2 (en) | 2013-03-14 | 2018-04-24 | Cirrus Logic, Inc. | Low-latency multi-driver adaptive noise canceling (ANC) system for a personal audio device |
US10013966B2 (en) | 2016-03-15 | 2018-07-03 | Cirrus Logic, Inc. | Systems and methods for adaptive active noise cancellation for multiple-driver personal audio device |
US10026388B2 (en) | 2015-08-20 | 2018-07-17 | Cirrus Logic, Inc. | Feedback adaptive noise cancellation (ANC) controller and method having a feedback response partially provided by a fixed-response filter |
CN109151237A (zh) * | 2018-08-23 | 2019-01-04 | 西南交通大学 | 基于零吸引的仿射投影自适应回声消除方法 |
US10181315B2 (en) | 2014-06-13 | 2019-01-15 | Cirrus Logic, Inc. | Systems and methods for selectively enabling and disabling adaptation of an adaptive noise cancellation system |
US10206032B2 (en) | 2013-04-10 | 2019-02-12 | Cirrus Logic, Inc. | Systems and methods for multi-mode adaptive noise cancellation for audio headsets |
US10219071B2 (en) | 2013-12-10 | 2019-02-26 | Cirrus Logic, Inc. | Systems and methods for bandlimiting anti-noise in personal audio devices having adaptive noise cancellation |
US10382864B2 (en) | 2013-12-10 | 2019-08-13 | Cirrus Logic, Inc. | Systems and methods for providing adaptive playback equalization in an audio device |
US10468048B2 (en) | 2011-06-03 | 2019-11-05 | Cirrus Logic, Inc. | Mic covering detection in personal audio devices |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6343451A (ja) * | 1986-08-11 | 1988-02-24 | Mitsubishi Electric Corp | 拡声通話回路 |
JPH07226697A (ja) * | 1994-02-10 | 1995-08-22 | Nippon Telegr & Teleph Corp <Ntt> | 反響消去装置、反響消去方法及び反響消去装置を有する送受話器 |
JPH088789A (ja) * | 1994-06-20 | 1996-01-12 | Toshiba Corp | 音声通信システム |
JPH09116614A (ja) * | 1995-10-18 | 1997-05-02 | Nippon Telegr & Teleph Corp <Ntt> | 反響消去装置 |
JPH10229354A (ja) * | 1997-02-14 | 1998-08-25 | Fujitsu Ltd | エコー制御装置 |
JPH10285083A (ja) * | 1997-04-04 | 1998-10-23 | Toshiba Corp | 音声通信装置 |
JPH11331046A (ja) * | 1998-03-16 | 1999-11-30 | Nippon Telegr & Teleph Corp <Ntt> | エコー抑圧方法及び装置並びにエコー抑圧プログラムが記憶されたコンピュータに読取り可能な記憶媒体 |
JP2000252891A (ja) * | 1999-02-26 | 2000-09-14 | Toshiba Corp | 信号処理装置 |
JP2004274412A (ja) * | 2003-03-10 | 2004-09-30 | Nippon Telegr & Teleph Corp <Ntt> | 反響消去装置、方法、及び反響消去プログラム |
JP2005159753A (ja) * | 2003-11-26 | 2005-06-16 | Sony Corp | エコーキャンセラ |
JP2005159941A (ja) * | 2003-11-28 | 2005-06-16 | Saxa Inc | エコーキャンセル制御装置および方法 |
-
2006
- 2006-07-26 JP JP2006203418A patent/JP4818014B2/ja active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6343451A (ja) * | 1986-08-11 | 1988-02-24 | Mitsubishi Electric Corp | 拡声通話回路 |
JPH07226697A (ja) * | 1994-02-10 | 1995-08-22 | Nippon Telegr & Teleph Corp <Ntt> | 反響消去装置、反響消去方法及び反響消去装置を有する送受話器 |
JPH088789A (ja) * | 1994-06-20 | 1996-01-12 | Toshiba Corp | 音声通信システム |
JPH09116614A (ja) * | 1995-10-18 | 1997-05-02 | Nippon Telegr & Teleph Corp <Ntt> | 反響消去装置 |
JPH10229354A (ja) * | 1997-02-14 | 1998-08-25 | Fujitsu Ltd | エコー制御装置 |
JPH10285083A (ja) * | 1997-04-04 | 1998-10-23 | Toshiba Corp | 音声通信装置 |
JPH11331046A (ja) * | 1998-03-16 | 1999-11-30 | Nippon Telegr & Teleph Corp <Ntt> | エコー抑圧方法及び装置並びにエコー抑圧プログラムが記憶されたコンピュータに読取り可能な記憶媒体 |
JP2000252891A (ja) * | 1999-02-26 | 2000-09-14 | Toshiba Corp | 信号処理装置 |
JP2004274412A (ja) * | 2003-03-10 | 2004-09-30 | Nippon Telegr & Teleph Corp <Ntt> | 反響消去装置、方法、及び反響消去プログラム |
JP2005159753A (ja) * | 2003-11-26 | 2005-06-16 | Sony Corp | エコーキャンセラ |
JP2005159941A (ja) * | 2003-11-28 | 2005-06-16 | Saxa Inc | エコーキャンセル制御装置および方法 |
Cited By (41)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009302599A (ja) * | 2008-06-10 | 2009-12-24 | Yamaha Corp | 音響エコーキャンセラ |
WO2009151062A1 (ja) * | 2008-06-10 | 2009-12-17 | ヤマハ株式会社 | 音響エコーキャンセラおよび音響エコーキャンセル方法 |
JP2010135936A (ja) * | 2008-12-02 | 2010-06-17 | Hitachi Ltd | エコーキャンセラおよびエコー消去方法 |
US9646595B2 (en) | 2010-12-03 | 2017-05-09 | Cirrus Logic, Inc. | Ear-coupling detection and adjustment of adaptive response in noise-canceling in personal audio devices |
US9633646B2 (en) | 2010-12-03 | 2017-04-25 | Cirrus Logic, Inc | Oversight control of an adaptive noise canceler in a personal audio device |
WO2012157785A1 (ja) * | 2011-05-19 | 2012-11-22 | 日本電気株式会社 | 音声処理装置、音声処理方法及び音声処理プログラムを記録した記録媒体 |
US9711130B2 (en) | 2011-06-03 | 2017-07-18 | Cirrus Logic, Inc. | Adaptive noise canceling architecture for a personal audio device |
JP2014519758A (ja) * | 2011-06-03 | 2014-08-14 | シラス ロジック、インコーポレイテッド | パーソナルオーディオデバイスのための適合的ノイズキャンセリングアーキテクチャ |
US9824677B2 (en) | 2011-06-03 | 2017-11-21 | Cirrus Logic, Inc. | Bandlimiting anti-noise in personal audio devices having adaptive noise cancellation (ANC) |
US10249284B2 (en) | 2011-06-03 | 2019-04-02 | Cirrus Logic, Inc. | Bandlimiting anti-noise in personal audio devices having adaptive noise cancellation (ANC) |
US10468048B2 (en) | 2011-06-03 | 2019-11-05 | Cirrus Logic, Inc. | Mic covering detection in personal audio devices |
JP2013225747A (ja) * | 2012-04-20 | 2013-10-31 | Panasonic Corp | 通話装置 |
US9721556B2 (en) | 2012-05-10 | 2017-08-01 | Cirrus Logic, Inc. | Downlink tone detection and adaptation of a secondary path response model in an adaptive noise canceling system |
US9773490B2 (en) | 2012-05-10 | 2017-09-26 | Cirrus Logic, Inc. | Source audio acoustic leakage detection and management in an adaptive noise canceling system |
US9532139B1 (en) | 2012-09-14 | 2016-12-27 | Cirrus Logic, Inc. | Dual-microphone frequency amplitude response self-calibration |
US9773493B1 (en) | 2012-09-14 | 2017-09-26 | Cirrus Logic, Inc. | Power management of adaptive noise cancellation (ANC) in a personal audio device |
US9497542B2 (en) | 2012-11-12 | 2016-11-15 | Yamaha Corporation | Signal processing system and signal processing method |
US11190872B2 (en) | 2012-11-12 | 2021-11-30 | Yamaha Corporation | Signal processing system and signal processing meihod |
US10250974B2 (en) | 2012-11-12 | 2019-04-02 | Yamaha Corporation | Signal processing system and signal processing method |
US9179217B2 (en) | 2012-12-21 | 2015-11-03 | Kabushiki Kaisha Toshiba | Signal processing apparatus and signal processing method |
US9955250B2 (en) | 2013-03-14 | 2018-04-24 | Cirrus Logic, Inc. | Low-latency multi-driver adaptive noise canceling (ANC) system for a personal audio device |
US9502020B1 (en) | 2013-03-15 | 2016-11-22 | Cirrus Logic, Inc. | Robust adaptive noise canceling (ANC) in a personal audio device |
US10206032B2 (en) | 2013-04-10 | 2019-02-12 | Cirrus Logic, Inc. | Systems and methods for multi-mode adaptive noise cancellation for audio headsets |
US9462376B2 (en) | 2013-04-16 | 2016-10-04 | Cirrus Logic, Inc. | Systems and methods for hybrid adaptive noise cancellation |
US9478210B2 (en) | 2013-04-17 | 2016-10-25 | Cirrus Logic, Inc. | Systems and methods for hybrid adaptive noise cancellation |
US9460701B2 (en) | 2013-04-17 | 2016-10-04 | Cirrus Logic, Inc. | Systems and methods for adaptive noise cancellation by biasing anti-noise level |
US9578432B1 (en) | 2013-04-24 | 2017-02-21 | Cirrus Logic, Inc. | Metric and tool to evaluate secondary path design in adaptive noise cancellation systems |
US9666176B2 (en) | 2013-09-13 | 2017-05-30 | Cirrus Logic, Inc. | Systems and methods for adaptive noise cancellation by adaptively shaping internal white noise to train a secondary path |
US9620101B1 (en) | 2013-10-08 | 2017-04-11 | Cirrus Logic, Inc. | Systems and methods for maintaining playback fidelity in an audio system with adaptive noise cancellation |
US10382864B2 (en) | 2013-12-10 | 2019-08-13 | Cirrus Logic, Inc. | Systems and methods for providing adaptive playback equalization in an audio device |
US9704472B2 (en) | 2013-12-10 | 2017-07-11 | Cirrus Logic, Inc. | Systems and methods for sharing secondary path information between audio channels in an adaptive noise cancellation system |
US10219071B2 (en) | 2013-12-10 | 2019-02-26 | Cirrus Logic, Inc. | Systems and methods for bandlimiting anti-noise in personal audio devices having adaptive noise cancellation |
US9479860B2 (en) | 2014-03-07 | 2016-10-25 | Cirrus Logic, Inc. | Systems and methods for enhancing performance of audio transducer based on detection of transducer status |
US10181315B2 (en) | 2014-06-13 | 2019-01-15 | Cirrus Logic, Inc. | Systems and methods for selectively enabling and disabling adaptation of an adaptive noise cancellation system |
US9807503B1 (en) | 2014-09-03 | 2017-10-31 | Cirrus Logic, Inc. | Systems and methods for use of adaptive secondary path estimate to control equalization in an audio device |
US9552805B2 (en) | 2014-12-19 | 2017-01-24 | Cirrus Logic, Inc. | Systems and methods for performance and stability control for feedback adaptive noise cancellation |
US10026388B2 (en) | 2015-08-20 | 2018-07-17 | Cirrus Logic, Inc. | Feedback adaptive noise cancellation (ANC) controller and method having a feedback response partially provided by a fixed-response filter |
US9578415B1 (en) | 2015-08-21 | 2017-02-21 | Cirrus Logic, Inc. | Hybrid adaptive noise cancellation system with filtered error microphone signal |
US10013966B2 (en) | 2016-03-15 | 2018-07-03 | Cirrus Logic, Inc. | Systems and methods for adaptive active noise cancellation for multiple-driver personal audio device |
CN109151237A (zh) * | 2018-08-23 | 2019-01-04 | 西南交通大学 | 基于零吸引的仿射投影自适应回声消除方法 |
CN109151237B (zh) * | 2018-08-23 | 2020-10-09 | 西南交通大学 | 基于零吸引的仿射投影自适应回声消除方法 |
Also Published As
Publication number | Publication date |
---|---|
JP4818014B2 (ja) | 2011-11-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4818014B2 (ja) | 信号処理装置 | |
KR101414688B1 (ko) | 에코 보상 방법 및 신호 처리 수단 | |
US8335311B2 (en) | Communication apparatus capable of echo cancellation | |
US8311234B2 (en) | Echo canceller and communication audio processing apparatus | |
US8306215B2 (en) | Echo canceller for eliminating echo without being affected by noise | |
JP5450567B2 (ja) | クリアな信号の取得のための方法及びシステム | |
US8675883B2 (en) | Apparatus and associated methodology for suppressing an acoustic echo | |
JP5032669B2 (ja) | 音声信号のエコーキャンセルのための方法及び装置 | |
US6694018B1 (en) | Echo canceling apparatus and method, and voice reproducing apparatus | |
JP5061853B2 (ja) | エコーキャンセラ及びエコーキャンセルプログラム | |
US9001994B1 (en) | Non-uniform adaptive echo cancellation | |
JP2003506924A (ja) | 送受信器ユニットにおけるエコーをキャンセルするためのエコーキャンセル装置 | |
JP2012501152A (ja) | 前白色化を伴うlmsアルゴリズムによって適応させられる適応フィルタの更新済みフィルタ係数を決定する方法 | |
JP5223576B2 (ja) | エコーキャンセラ、エコーキャンセル方法及びプログラム | |
JP4457639B2 (ja) | エコーキャンセラ | |
JP2003158476A (ja) | エコーキャンセラ | |
US8543390B2 (en) | Multi-channel periodic signal enhancement system | |
CN103460613A (zh) | 节省计算的用于宽带音频信号的回声消除器 | |
US9172791B1 (en) | Noise estimation algorithm for non-stationary environments | |
WO2005046076A1 (ja) | エコー抑圧装置 | |
JP2009094802A (ja) | 通信装置 | |
JP2005051744A (ja) | 通話装置 | |
JP6272590B2 (ja) | エコーキャンセラ装置及び通話装置 | |
JP2006113515A (ja) | ノイズサプレス装置、ノイズサプレス方法及び移動通信端末装置 | |
JP2009021859A (ja) | 通話状態判定装置および該通話状態判定装置を備えたエコーキャンセラ |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090716 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20110209 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110315 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110513 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110802 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110830 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140909 Year of fee payment: 3 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 4818014 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140909 Year of fee payment: 3 |