JP2007060644A - 信号処理装置 - Google Patents

信号処理装置 Download PDF

Info

Publication number
JP2007060644A
JP2007060644A JP2006203418A JP2006203418A JP2007060644A JP 2007060644 A JP2007060644 A JP 2007060644A JP 2006203418 A JP2006203418 A JP 2006203418A JP 2006203418 A JP2006203418 A JP 2006203418A JP 2007060644 A JP2007060644 A JP 2007060644A
Authority
JP
Japan
Prior art keywords
echo
signal
unit
amount
suppression
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2006203418A
Other languages
English (en)
Other versions
JP4818014B2 (ja
Inventor
Takashi Sudo
隆 須藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2006203418A priority Critical patent/JP4818014B2/ja
Publication of JP2007060644A publication Critical patent/JP2007060644A/ja
Application granted granted Critical
Publication of JP4818014B2 publication Critical patent/JP4818014B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
  • Telephone Function (AREA)

Abstract

【課題】 エコー抑圧性能を向上させ、またはノイズ抑圧性能を向上させ、エコーパスロ
スの変動を含むエコーパス変動に対する頑健性を高めた信号処理装置を提供する。
【解決手段】 送話入力信号に対して少なくともエコーを抑圧しエコー低減信号を出力す
るエコーキャンセラ部(EC)110と、上記送話入力信号と上記エコー低減信号を入力
し、エコー及びノイズの少なくとも一方を抑圧するエコーリダクション部(ER)111
と、を備え、エコーリダクション部(ER)111は、上記送話入力信号と上記エコー低
減信号のどちらか一方を選択して出力するスペクトル選択部111Lを備え、スペクトル
選択部111Lで選択された上記送話入力信号及びエコー低減信号のいずれかについてエ
コー及びノイズの少なくとも一方を抑圧する。
【選択図】 図1

Description

本発明は、信号処理装置に係り、音声信号の高品質化処理に関する。
音声信号の高品質化処理、例えば、通話装置などにおいて、通話を行うに際し、通話信
号以外の信号、すなわち音響エコーなどを抑圧する処理が種々知られている。また、この
処理を、前段の処理と後段の処理との2段階に分けて行うことにより、高い性能が得られ
ることが知られている。
例えば、前段では、エコー抑圧処理を行い、後段では、後段の出力である、エコーなど
が抑圧された送話出力信号を用いた短時間スペクトラル振幅推定を行い、その推定値に基
づいてエコー抑圧を行う技術が知られている(例えば、特許文献1参照。)。
また、前段では適応フィルタによって、マイクロホンから入力された送話入力信号に含
まれるエコーを抑圧する処理を行い、後段では、前段で生じた擬似エコー信号に基づいて
エコーまたはノイズの抑圧を行う技術が知られている(例えば、特許文献2参照。)。
特許第3420705号公報(第2−7頁、図1) 特開2004−56453号公報(第2−4頁、図1)
しかしながら、上述した特許文献1に開示されている方法では、前段の線形エコー抑圧
処理(適応フィルタ)と後段の非線形エコー抑圧処理とを結合させた場合、ダブルトーク
かつエコーパス変動時に、エコー経路の音響結合量(エコーパスロス)は大幅に変化しな
いものと仮定して適応フィルタのフィルタ係数を転用する。このため、ダブルトーク中の
エコーパスロスの変動時など適応フィルタが追従できない場合、充分にエコー抑圧できな
い問題点があった。
また、特許文献2に開示されている方法では、擬似エコー信号を必ず用いるため、適応
フィルタによる前段のエコーパス追従性に、最終の出力である送話出力信号のエコーパス
追従性が依存することになる問題点があった。つまり、前段で、適応フィルタによるエコ
ー推定が精度よくできる前提となっており、急激なエコーパス変動やダブルトーク中のエ
コーパスロスの変動では後段の出力である送話出力信号にエコーが残留しやすい問題点が
あった。
即ち、上記のような従来技術において、例えばダブルトーク中のエコーパスロス変動や
急激なエコーパス変動時に、線形処理であるか非線形処理であるかを問わず、前段で行わ
れるエコー抑圧の性能が充分でない場合、後段で行われるエコー抑圧処理、またはノイズ
抑圧処理、更には、それらを組み合わせた処理において、前段の出力信号中の残留エコー
により、エコー量推定及びノイズ量推定の精度が劣化する。この劣化のため、後段で行わ
れるエコー抑圧処理の性能、及びノイズ抑圧処理の性能が充分でないという問題があった
。この問題点は、後段で行われるボイススイッチにおけるエコーサプレス処理においても
顕著である。
本発明は、上記問題点を解決するためになされたもので、エコー抑圧性能を向上させ、
またはノイズ抑圧性能を向上させ、エコーパスロスの変動を含むエコーパス変動に対する
頑健性を高めた信号処理装置を提供することを目的とする。
上記目的を達成するために、本発明の信号処理装置は、入力信号に含まれる少なくとも
エコーを抑圧してエコー低減信号を出力する第1の信号処理手段と、前記入力信号と前記
エコー低減信号とを入力し、エコー及びノイズの少なくとも一方を抑圧する第2の信号処
理手段と、を備え、前記第2の信号処理手段は、前記入力信号と前記エコー低減信号との
どちらか一方を選択する選択手段を有し、前記選択手段によって選択された前記入力信号
及び前記エコー低減信号のいずれか一方の前記エコー及び前記ノイズの少なくとも一方を
抑圧することを特徴とする。
本発明によれば、エコー抑圧性能を向上させ、またはノイズ抑圧性能を向上させ、エコ
ーパスロスの変動を含むエコーパス変動に対する頑健性を高めた信号処理装置を提供する
ことができる。
以下に、本発明による信号処理装置の実施の形態を、図面を参照して説明する。
(第1の実施形態)
図1は、本発明の第1の実施形態に係る信号処理装置の構成を示すブロック図である。
この信号処理装置は、通信部(COM)101と、遅延処理部(DELAY)102と、
D/A変換器(D/A)103と、受話増幅器104と、スピーカ105と、マイクロホ
ン106と、送話増幅器107と、A/D変換器(A/D)108と、ハイパスフィルタ
部(HPF)109と、エコーキャンセラ部(EC)110と、エコーリダクション部(
ER)111とからなる。
図2は、エコーキャンセラ部(EC)110の構成を示すブロック図である。このエコ
ーキャンセラ部(EC)110は、遅延処理部(DELAY)102と接続される適応フ
ィルタ部(ADF)110aと、ハイパスフィルタ部(HPF)109と接続され、また
、後述するエコーリダクション部(ER)111の周波数領域変換処理部(FT)111
cと接続される信号減算処理部110bと、遅延処理部(DELAY)102と接続され
、後述するエコーリダクション部(ER)111の周波数領域変換処理部(FT)111
c及び制御部(CTRL)111kと接続されるダブルトーク検出部(DTD)110c
とからなる。
図3は、エコーリダクション部(ER)111の構成を示すブロック図である。このエ
コーリダクション部(ER)111は、遅延処理部(DELAY)102と接続される周
波数領域変換処理部(FT)111aと、ハイパスフィルタ部(HPF)109と接続さ
れる周波数領域変換処理部(FT)111bと、エコーキャンセラ部(EC)110の信
号減算処理部110bと接続される周波数領域変換処理部(FT)111cと、受話パワ
ー算出部(POW)111dと、送話パワー算出部(POW)111eと、残差パワー算
出部(POW)111fと、音響結合量推定部(ACLE)111gと、エコー量推定部
(ELE)111hと、エコー抑圧量推定部(ECLE)111iと、周波数領域ダブル
トーク検出部(FDTD)111jと、エコーキャンセラ部(EC)110のダブルトー
ク検出部(DTD)110cと接続される制御部(CTRL)111kと、スペクトル選
択部111Lと、ゲイン格納部(GTBL)111mと、エコー抑圧ゲイン算出部(GC
AL)111nと、信号抑圧部(SS)111oと、通信部(COM)101と接続され
る周波数領域逆変換処理部(IFT)111pとからなる。
上記のように構成された、本発明の第1の実施形態に係る信号処理装置の各部の動作を
、図1〜図4を参照して説明する。
通信部(COM)101は、通信相手から受信された受信データを入力し、事前に決め
られた処理時間の単位、つまり1フレーム(Nサンプル)ごとにディジタル信号に復号化
する。但し、このサンプリング周波数をf[Hz]とする。そして、通信部(COM)
101はこの復号化されたディジタル信号を1フレームごとに受話入力信号x[n](n
=0,1,・・・,N−1)として出力する。
また、通信部(COM)101は、周波数領域逆変換処理部(IFT)111pから出
力された送話信号s’[n](n=0,1,・・・,N−1)を入力とし、符号化して、
送信データとして通信相手に出力する。
遅延処理部(DELAY)102は、通信部(COM)101から1フレームごとに出
力された受話入力信号x[n]を入力とし、一時的に格納して、事前に決められた時間分
(Dサンプル)ディジタル処理によって遅延させる処理を行い出力する。
D/A変換器(D/A)103は、通信部(COM)101から出力された受話入力信
号x[n]を入力とし、アナログ信号に変換して出力する。
受話増幅器104は、D/A変換器(D/A)103から出力されたアナログ信号を入
力とし、増幅して出力する。
スピーカ105は、受話増幅器104から出力された増幅したアナログ信号を入力とし
、音響空間へ信号x(t)として出力する。
マイクロホン106は、上記のようにしてスピーカ105から音響空間に出力された信
号x(t)と、送話音声信号s(t)とが音響結合した信号z(t)を収音し、アナログ
信号に変換して出力する。
送話増幅器107は、マイクロホン106から出力されたこのアナログ信号を入力とし
、増幅して出力する。
A/D変換器(A/D)108は、送話増幅器107から出力された増幅されたアナロ
グ信号を入力とし、1フレームごとにディジタル信号に変換して出力する。
ハイパスフィルタ部(HPF)109は、A/D変換器(A/D)108から出力され
たディジタル信号を入力とし、オフセット(直流成分)除去をし、送話入力信号z[n]
(n=0,1,・・・,N−1)として出力する。
エコーキャンセラ部(EC)110は、ハイパスフィルタ部(HPF)109から出力
された送話入力信号z[n]と、遅延処理部(DELAY)102から出力された遅延し
た受話入力信号x[n−D]を入力とし、送話入力信号z[n]からエコー成分を抑圧し
、そのエコー抑圧後の信号を残差信号e[n](n=0,1,・・・,N−1)として出
力する。更に、ダブルトーク情報ECstate[n]を出力する。
適応フィルタ部(ADF)110aは、長さLのフィルタ係数h[i](i=0,1,
・・・,L−1)が可変のトランスバーサルフィルタ(Transversal Filter)で構成され
る適応フィルタである。
適応フィルタ部(ADF)110aは遅延処理部(DELAY)102から出力された
遅延した受話入力信号x[n−D]と、信号減算処理部110bから出力されたエコー抑
圧後の1サンプル前の残差信号e[n−1]と、ダブルトーク検出部(DTD)110c
から出力されたダブルトーク情報ECstate[n]とを入力とし、ダブルトーク情報
ECstate[n]がダブルトーク状態でなかった場合はフィルタ係数h[i]をサン
プルnごとに適応学習し、ダブルトーク情報ECstate[n]がダブルトーク状態で
あった場合は、適応学習を行わない。
また、適応フィルタ部(ADF)110aは、遅延処理部(DELAY)102から出
力された遅延した受話入力信号x[n−D]とフィルタ係数h[i]を用いて擬似エコー
信号y’[n](n=0,1,・・・,N−1)を算出して出力する。
適応フィルタ部(ADF)110aは、フィルタ係数h[i]の更新幅を制御する固定
あるいは可変のステップサイズμT[n](n=0,1,・・・,N−1)を用いて適応
学習を行う。
また、適応フィルタ部(ADF)110aは、例えばLMS(Least-Mean-Square)ア
ルゴリズム、NLMS(Normalized-Least-Mean-Square)アルゴリズム、学習同定法、ア
フィン射影(AP:Affine-Projection)アルゴリズム、逐次最小二乗(RLS:Recursi
ve-Least-Squares)アルゴリズムなどの線形適応アルゴリズムに基づく適応フィルタや勾
配制限型学習同定法(Gradient-limited Normalized-Least-Mean-Square)、適応ボルテ
ラフィルタ(Adaptive Volterra Filter)などの非線形適応アルゴリズムに基づく適応フ
ィルタで構成される。また、本実施形態では時間領域型適応フィルタの例を示しているが
、サブバンド型(帯域分割型)・周波数領域型で用いる適応フィルタで構成してもよい。
信号減算処理部110bは、ハイパスフィルタ部(HPF)109から出力された送話
入力信号z[n]と、適応フィルタ部(ADF)110aから出力された擬似エコー信号
y’[n]を入力とし、送話入力信号z[n]から擬似エコー信号y’[n]をサンプル
nごとに減算することでエコー成分を抑圧し、そのエコー抑圧後の信号である残差信号e
[n]を出力する。
ダブルトーク検出部(DTD)110cは、ハイパスフィルタ部(HPF)109から
出力された送話入力信号z[n]と、遅延処理部(DELAY)102から出力された遅
延した受話入力信号x[n−D]と、信号減算処理部110bから出力された1サンプル
前の残差信号e[n−1]を入力とし、サンプルnごとにダブルトーク状態か否かを判定
する。
具体的には、ダブルトーク検出部(DTD)110cは、送話入力信号z[n]のパワ
ー特性(パワー値またはピーク値。以下、「パワー特性」と称する。)P[n](n=
0,1,・・・,N−1)と遅延した受話入力信号x[n−D]のパワー特性P[n]
(n=0,1,・・・,N−1)と残差信号e[n]のパワー特性P[n](n=0,
1,・・・,N−1)とをサンプルnごとに算出し、P[n]>λ[n]・P[n]
またはP[n]>δ・P[n]となる場合にダブルトーク状態と判定する。ここで、
λ[n](n=0,1,・・・,N−1)はエコーパスロスの推定値であり、フィルタ係
数h[i](i=0,1,・・・,L−1)を適応学習したサンプルnごとに算出し、適
応学習が進めば小さくなり、適応学習が間違っていれば大きくなる可変量である。また、
δは動作開始前に外部から予め設定可能な固定値である。そして、ダブルトーク検出部(
DTD)110cは、ダブルトーク状態か否かの情報であるダブルトーク情報ECsta
te[n]を出力する。
この場合、エコーキャンセラ部(EC)110は、フィルタ係数h[i](i=0,1
,・・・,L−1)、ステップサイズμT[n]、エコーパスロスの推定値λ[n]、ダ
ブルトーク情報ECstate[n]、受話入力信号のパワー特性P[n]、送話入力
信号のパワー特性P[n]、残差信号のパワー特性P[n](n=0,1,・・・,
N−1)を内部状態としてメモリに保持している。ここで、内部状態とは少なくとも時間
に従って変化する変数の集合を指し、これ以降説明を省略する。
ダブルトーク検出部(DTD)110cを備えないエコーキャンセラ部(EC)110
であっても構わない。この場合、適応フィルタ部(ADF)110aと制御部(CTRL
)111kは、ダブルトーク情報ECstate[n]がダブルトーク状態でないことを
示す場合の動作をする。
エコーリダクション部(ER)111は、遅延処理部(DELAY)102から出力さ
れた遅延した受話入力信号x[n−D]と、ハイパスフィルタ部(HPF)109から出
力された送話入力信号z[n]と、信号減算処理部110bから出力された残差信号e[
n]と、ダブルトーク検出部(DTD)110cから出力されたダブルトーク情報ECs
tate[n]とを入力とし、送話入力信号z[n]あるいは残差信号e[n]の少なく
とも一方からエコー成分を抑圧し、そのエコー抑圧後の信号を送話出力信号s’[n](
n=0,1,・・・,N−1)として1フレームごとに出力する。
周波数領域変換処理部(FT)111aは、遅延処理部(DELAY)102から出力
された遅延した受話入力信号x[n−D]を入力として、FFT(Fast Fourier Transfo
rm)などの処理によって周波数領域に変換して、受話入力信号の周波数スペクトルX[f
,ω]を算出して出力する。
周波数領域変換処理部(FT)111bは、ハイパスフィルタ部(HPF)109から
出力された送話入力信号z[n]をFFTなどによって周波数領域に変換して、送話入力
信号の周波数スペクトルZ[f,ω]を算出して出力する。
周波数領域変換処理部(FT)111cは、信号減算処理部110bから出力された残
差信号e[n]をFFTなどによって周波数領域に変換して、残差信号の周波数スペクト
ルE[f,ω]を算出して出力する。
周波数領域変換処理部(FT)111a、周波数領域変換処理部(FT)111b及び
周波数領域変換処理部(FT)111cは、適宜、ハミング窓などによる窓掛けや、過去
のフレームを用いたり零補間したりオーバーラップを行う。例えば、過去1フレーム分と
当該フレームからFFT点数分の信号を取り出し、ハミング窓による窓掛けを行い、FF
Tを行う。
受話パワー算出部(POW)111dは、周波数領域変換処理部(FT)111aから
出力された受話入力信号の周波数スペクトルX[f,ω]を入力とし、そのパワースペク
トルである受話パワースペクトル|X[f,ω]|を算出して出力する。そして、音響
結合量は通常時間的に急に変化しないので、瞬時値を用いるよりもスムージングした値を
用いた方が音響結合量を精度良く推定できるため、受話パワー算出部(POW)111d
は、例えば、式1に示すように1フレーム前の値|X[f−1,ω]|を用いてスム
ージングした受話パワースペクトル|X[f,ω]|を算出して出力する。ただし、
α[ω]は、0.75〜0.999程度が望ましい。
Figure 2007060644
送話パワー算出部(POW)111eは、周波数領域変換処理部(FT)111bから
出力された送話入力信号の周波数スペクトルZ[f,ω]を入力とし、そのパワースペク
トルである送話パワースペクトル|Z[f,ω]|を算出して出力する。そして、音響
結合量は通常時間的に急に変化しないので、瞬時値を用いるよりもスムージングした値を
用いた方が音響結合量を精度良く推定できるため、送話パワー算出部(POW)111e
は、例えば、式2に示すように1フレーム前の値|Z[f−1,ω]|を用いてスム
ージングした送話パワースペクトル|Z[f,ω]|を算出して出力する。ただし、
α[ω]は、0.75〜0.999程度が望ましい。
Figure 2007060644
残差パワー算出部(POW)111fは、周波数領域変換処理部(FT)111cから
出力された残差信号の周波数スペクトルE[f,ω]を入力とし、そのパワースペクトル
である残差パワースペクトル|E[f,ω]|を算出して出力する。そして、音響結合
量は通常時間的に急に変化しないので、瞬時値を用いるよりもスムージングした値を用い
た方が音響結合量を精度良く推定できるため、残差パワー算出部(POW)111fは、
例えば、式3に示すのように1フレーム前の値|E[f−1,ω]|を用いてスムー
ジングした残差パワースペクトル|E[f,ω]|を算出して出力する。ただし、α
[ω]は、0.75〜0.999程度が望ましい。
Figure 2007060644
音響結合量推定部(ACLE)111gは、受話パワー算出部(POW)111dから
出力されたスムージングされた受話パワースペクトル|X[f,ω]|と、送話パワ
ー算出部(POW)111eから出力されたスムージングされた送話パワースペクトル|
[f,ω]|と、周波数領域ダブルトーク検出部(FDTD)111jから出力さ
れる周波数領域ダブルトーク情報ERstate[f,ω]とを入力とし、エコーキャン
セラ部(EC)110の性能の影響を受けないように残差信号に基づく|E[f,ω]
を用いずに送話入力信号に基づく|Z[f,ω]|を用いて、周波数帯域ω毎に
音響結合量|H[f,ω]|を例えば、以下の式4によって算出する。このようにする
ことで、後述する第5の実施形態に係る信号処理装置と比較して、計算量を少なくするこ
とができ、各パラメータの格納に必要なメモリ量も少なくすることができる。
Figure 2007060644
そして、音響結合量推定部(ACLE)111gは、以下の式5のように1フレーム前
の値を用いてスムージングした音響結合量|H[f,ω]|を算出して出力する。た
だし、α[ω]は、0.03〜0.99程度が望ましい。
Figure 2007060644
ここで、通話開始初期時、例えば通話開始から5秒間程度はα[ω]を大きくするこ
とで音響結合量|H[f,ω]|の更新を速めておく。このようにすることで通話開
始初期時は音響結合量が初期化されているので、通話開始初期時に抑圧量が少なくなって
しまうのを防止することができる。
ただし、周波数領域ダブルトーク検出部(FDTD)111jから出力される周波数領
域ダブルトーク情報ERstate[f,ω]がダブルトーク状態である場合、あるいは
音響結合量が急激に変化する場合、即ち、|H[f,ω]|>β[ω]・|H
f−1,ω]|が満たされる場合、あるいは受話入力信号が十分に大きくない場合、即
ち、|X[f,ω]|<β[ω]が満たされる場合には、エコーパス変動への高速
な追従性を保ちつつ、ダブルトークとなる周波数帯域での音響結合量の算出を行わないよ
うにするため、音響結合量推定部(ACLE)111gは、音響結合量を更新しないで1
フレーム前の過去の音響結合量|H[f−1,ω]|を用いる。極端な音響結合量の
変化はダブルトークの可能性があるので、このように音響結合量を更新しないでおくこと
で送話音質劣化を防止することができる。ただし、β[ω]は0.9〜30程度が望ま
しい。β[ω]は30dB〜40dB程度が望ましい。
エコー量推定部(ELE)111hは、受話パワー算出部(POW)111dから出力
されたスムージングされた受話パワースペクトル|X[f,ω]|と、音響結合量推
定部(ACLE)111gから出力された音響結合量|H[f,ω]|とを入力とし
、送話入力信号の周波数スペクトルZ[f,ω]に含まれるエコー量|Y[f,ω]|
を以下の式6のように周波数帯域ω毎に推定して出力する。
Figure 2007060644
そして、エコー量推定部(ELE)111hは、瞬時のエコー量|Y[f,ω]|
用いるよりもスムージングした値を用いた方がエコー抑圧後の信号をより自然な信号にで
きるため、以下の式7のように1フレーム前の値を用いてスムージングしたエコー量|Y
[f,ω]|を周波数帯域ω毎に算出して出力する。ただし、αY[ω]は0.7〜
0.99程度が望ましい。
Figure 2007060644
エコー抑圧量推定部(ECLE)111iは、送話パワー算出部(POW)111eか
ら出力された送話パワースペクトル|Z[f,ω]|と、残差パワー算出部(POW)
111fから出力された残差パワースペクトル|E[f,ω]|とを入力とし、それら
のパワースペクトル間の相違を示す量を計算することによって、エコーキャンセラ部(E
C)110で抑圧されたエコー抑圧量ECL[f,ω]を周波数帯域ω毎に推定して出力
する。具体的には、以下に示す式8に示すように算出する。もちろん、これら2つのパワ
ースペクトルの差などを用いてもよい。
Figure 2007060644
周波数領域ダブルトーク検出部(FDTD)111jは、受話パワー算出部(POW)
111dから出力されたスムージングされた受話パワースペクトル|X[f,ω]|
と、残差パワー算出部(POW)111fから出力されたスムージングされた残差パワー
スペクトル|E[f,ω]|と、エコー量推定部(ELE)111hから出力された
1フレーム前のエコー量|Y[f−1,ω]|とを入力とし、周波数帯域ω毎に以下に
示す式9が満たされるか否かの判定を行う。
ここでは、エコーリダクション部(ER)111のエコー抑圧処理後のパワースペクト
ルを残差パワースペクトルとエコー量の距離で代用し、それが十分に受話パワースペクト
ルよりも小さくなっているか否かを判定に用いる。そして、閾値β[ω]よりも大きけ
れば、即ち、式9が満たされる場合、ダブルトーク状態と判定し、式9が満たされない場
合、ダブルトーク状態でないと判定して、ダブルトーク状態か否かの情報を周波数領域ダ
ブルトーク情報ERstate[f,ω]として出力する。これにより、計算量が小さい
周波数領域DTDが実現できる。
もちろん、周波数領域ダブルトーク検出部(FDTD)111jを備えないエコーリダ
クション部(ER)111であっても構わない。この場合、音響結合量推定部(ACLE
)111gと制御部(CTRL)111kは、周波数領域ダブルトーク情報ERstat
e[f,ω]がダブルトーク状態でないことを示す場合の動作をする。ただし、β[ω
]は1.0〜20程度が望ましい。
Figure 2007060644
制御部(CTRL)111kは、エコー抑圧量推定部(ECLE)111iから出力さ
れたエコー抑圧量ECL[f,ω]と、ダブルトーク検出部(DTD)110cから出力
されたダブルトーク情報ECstate[n]と、周波数領域ダブルトーク検出部(FD
TD)111jから出力される周波数領域ダブルトーク情報ERstate[f,ω]と
を入力とし、周波数帯域ω毎にダブルトーク状態かつエコーキャンセラ部(EC)110
のエコー抑圧量が十分でない周波数帯域を検出して、ダブルトーク状態かつエコーキャン
セラ部(EC)110のエコー抑圧量が十分でない周波数帯域であるか否かの情報である
制御情報ERcontrol1[f,ω]及びERcontrol2[f,ω]を出力す
る。
まず、制御部(CTRL)111kは、周波数領域ダブルトーク情報ERstate[
f,ω]を用いて周波数帯域ω毎に周波数領域ダブルトーク検出部(FDTD)111j
でダブルトーク状態と判定されているか否か、ダブルトーク情報ECstate[n]を
用いてエコーキャンセラ部(EC)110のダブルトーク検出部(DTD)110cが当
該フレームでダブルトーク状態と1サンプルでも判定されているか否か、によって周波数
帯域ω毎にダブルトーク状態であるか否かを判定する。
ここでは、周波数領域ダブルトーク情報ERstate[f,ω]あるいはダブルトー
ク情報ECstate[n]のいずれか1つ、または双方がダブルトーク状態であること
を示していれば、制御部(CTRL)111kは周波数帯域ω毎にダブルトーク状態であ
ると判定する。
このようにエコーキャンセラ部(EC)110のダブルトーク検出部(DTD)110
cから出力されたダブルトーク情報ECstate[n]を用いれば、エコーキャンセラ
部(EC)110のエコー抑圧量が十分でない状況は、ダブルトーク中のエコーパス変動
で生じやすいため、ダブルトーク状態かつエコーキャンセラ部(EC)110のエコー抑
圧量が十分でない周波数帯域を精度よく検出することできる。
次に、制御部(CTRL)111kは、周波数帯域ω毎にECL[f,ω]>βZ1
ω]を満たした周波数帯域をエコーキャンセラ部(EC)110のエコー抑圧量が十分で
ないと判定する。ただし、βZ1[ω]は+8dB〜−15dB程度が望ましい。本実施
形態では以下、βZ1[ω]を0dBとして説明する。
1つの周波数帯域でのみエコーキャンセラ部(EC)110のエコー抑圧量が少ないと
いうことはありえにくい、つまりエコーキャンセラ部(EC)110の性能は時間領域で
切り替わると考えられるため、制御部(CTRL)111kは、エコーキャンセラ部(E
C)110のエコー抑圧量が十分でない周波数帯域を精度よく検出するために、併せて、
1フレーム当りの不等式ECL[f,ω]>βZ1[ω]が成立した帯域数countも
加味してエコー抑圧量が少ないと判定する。
つまり、ECL[f,ω]>βZ1[ω]かつcount>β、となる場合にエコー
抑圧量が少ないと判定する。ただし、βC1は全周波数帯域数の10%〜40%程度が望
ましい。このようにすることで周波数帯域毎だけで判定するよりも受話入力信号と送話入
力信号の音量差に対して頑健になりエコー抑圧量が十分でないフレームを精度よく検出す
ることができる。そして、先の周波数帯域ω毎にダブルトーク状態の判定と併せて、制御
部(CTRL)111kは、ダブルトーク状態かつエコーキャンセラ部(EC)110の
エコー抑圧量が十分でない周波数帯域を検出して制御情報ERcontrol1[f,ω
]を出力する。
同様にして、制御部(CTRL)111kは、1フレーム当りの式ECL[f,ω]>
βZ2[ω]が成立した帯域数countも加味して、ECL[f,ω]>βZ2[ω]
かつcount>βC2、となる場合にエコー抑圧量が少ないと判定して、先の周波数帯
域ω毎にダブルトーク状態の判定と併せて、制御情報ERcontrol2[f,ω]を
出力する。ただし、βZ2[ω]は+8dB〜−15dB程度、βC2は全周波数帯域数
の10%〜40%程度が望ましい。
スペクトル選択部111Lは、周波数領域変換処理部(FT)111bから出力された
送話入力信号の周波数スペクトルZ[f,ω]と、周波数領域変換処理部(FT)111
cから出力された残差信号の周波数スペクトルE[f,ω]と、制御部(CTRL)11
1kから出力されたダブルトーク状態かつエコーキャンセラ部(EC)110のエコー抑
圧量が十分でない周波数帯域であるか否かの情報である制御情報ERcontrol1[
f,ω]とを入力とし、送話入力信号の周波数スペクトルZ[f,ω]あるいは残差信号
の周波数スペクトルE[f,ω]のいずれか一方を周波数スペクトルとして選択して出力
する。
具体的には、制御情報ERcontrol1[f,ω]がダブルトーク状態かつエコー
キャンセラ部(EC)110のエコー抑圧量が十分でないと検出された周波数帯域であっ
た場合は、スペクトル選択部111Lは、周波数スペクトルとして送話入力信号の周波数
スペクトルZ[f,ω]を選択する。それ以外の周波数帯域は周波数スペクトルとして残
差信号の周波数スペクトルE[f,ω]を選択する。
このようにすることで周波数帯域ごとに、エコーキャンセラ部(EC)110のエコー
抑圧量が十分でない場合、つまりエコーキャンセラ部(EC)110の推定精度が十分と
れない場合はエコーリダクション部(ER)111を単体で動作させることができる。
ゲイン格納部(GTBL)111mは、事前に設定された非線形エコー抑圧量を制御す
るパラメータγ[ω]を格納して出力する。ただし、γ[ω]は1.0〜2.0程度が望
ましい。
エコー抑圧ゲイン算出部(GCAL)111nは、送話パワー算出部(POW)111
eから出力されたスムージングされた送話パワースペクトル|Z[f,ω]|と、エ
コー量推定部(ELE)111hから出力されたスムージングしたエコー量|Y[f,
ω]|と、ゲイン格納部(GTBL)111mから出力されたパラメータγ[ω]と、
エコー抑圧量推定部(ECLE)111iから出力されたエコー抑圧量ECL[f,ω]
と、制御部(CTRL)111kから出力されたダブルトーク状態かつエコーキャンセラ
部(EC)110のエコー抑圧量が十分でない周波数帯域であるか否かの情報である制御
情報ERcontrol2[f,ω]とを入力とし、エコー抑圧ゲインG[f,ω]を算
出して出力する。
具体的には、制御情報ERcontrol2[f,ω]からダブルトーク状態かつエコ
ーキャンセラ部(EC)110のエコー抑圧量が十分でないと検出された周波数帯域につ
いては、エコー抑圧ゲイン算出部(GCAL)111nは、エコー抑圧ゲインG[f,ω
]をウィナー・フィルタ(Wiener Filter)法を用いて、式10によって算出する。この
ように算出することで、ダブルトーク状態かつエコーキャンセラ部(EC)110のエコ
ー抑圧量が十分でないと検出された周波数帯域については、エコーリダクション部(ER
)111単体でエコー抑圧することができる。
Figure 2007060644
それ以外の周波数帯域では、エコー抑圧ゲイン算出部(GCAL)111nは、エコー
キャンセラ部(EC)110のエコー抑圧量が十分であり、エコーキャンセラ部(EC)
110が正常に機能していると見なして、エコーリダクション(ER)111のエコー抑
圧量を多くするように、エコーキャンセラ部(EC)110のエコー抑圧量ECL[f,
ω]を用いて補正し、エコー抑圧ゲインG[f,ω]を以下の式11が示すように算出す
る。
このように算出することで、後述する第5の実施形態に係る信号処理装置と比較して、
計算量を少なくすることができ、各パラメータの格納に必要なメモリ量も少なくすること
ができる。
Figure 2007060644
また、エコー抑圧ゲイン算出部(GCAL)111nは、過剰なエコー抑圧により送話
音声の品質が劣化するのを防止し、背景雑音の断続的な抑圧を防止するため、エコー抑圧
ゲインG[f,ω]が所定の下限値以下にならないように制御する。
図4は、その下限値の一例を示す。図4の実線、破線が示すように、エコー抑圧ゲイン
の下限値を帯域別にバスタブ曲線状、即ち、最低域(0からf/16[Hz])側及び
最高域(7・f/16からf/2[Hz])側を0.04から0.12程度に大きく
し、中域(f/8から3・f/8[Hz])付近を0.01から0.05程度に小さ
くするように設定する。なぜなら、最低域側や最高域側に抑圧できなかったエコー成分が
残ると耳障りであるので、そのエコー成分を抑圧しやすくすることができて送話音声を聴
感上よくすることができる。勿論、図4の点線が示すようにバスタブ曲線を段階的に変化
する一定値として設定してもかまわない。
さらに、エコー抑圧ゲイン算出部(GCAL)111nは、過剰なエコー抑圧により送
話音声の品質が劣化するのを防止するため、送話入力信号z[n]あるいは残差信号e[
n]の有音区間ではない区間の信号レベルを用いて周波数帯域ごとに背景雑音レベルを算
出しておき、背景雑音レベルよりも抑圧しないようにエコー抑圧ゲインを制御しても構わ
ない。
さらにまた、エコー抑圧ゲイン算出部(GCAL)111nは、送話音質が劣化するの
を防止するために、エコー抑圧ゲインG[f,ω]を以下の式12−1あるいは式12−
2が示すように周波数方向にスムージングして出力してもよい。例えば、εは、[0.
1、0.2、0.4、0.2、0.1]、ηは、[0.1、0.2、0.4、0.8、
0.4、0.2、0.1]のようにしてよい。
Figure 2007060644
信号抑圧部(SS)111oは、スペクトル選択部111Lから出力された周波数スペ
クトルと、エコー抑圧ゲイン算出部(GCAL)111nから出力されたエコー抑圧ゲイ
ンG[f,ω]とを入力として、スペクトル選択部111Lから出力された周波数スペク
トルのエコーを抑圧し、以下の式13−1あるいは式13−2が示すように送話出力信号
のスペクトルS’[f,ω]として出力する。
Figure 2007060644
このとき、送話入力信号の周波数スペクトルZ[f,ω]と残差信号の周波数スペクト
ルE[f,ω]とのどちらの周波数スペクトルがスペクトル選択部111Lで選択されて
も、エコーキャンセラ部(EC)110は時間領域での処理であるから、位相スペクトル
に差がないため、出力された送話出力信号は聴感上滑らかにつなぐことができる。
制御部(CTRL)111kからスペクトル選択部111Lへ出力される制御情報ER
control1[f,ω]と、制御部(CTRL)111kからエコー抑圧ゲイン算出
部(GCAL)111nへ出力される制御情報ERcontrol2[f,ω]とは異な
っていても構わない。例えば、制御部(CTRL)111kのパラメータβZ1[ω]及
びβC1の値とβZ2[ω]及びβC2を異なる値にすることで、制御情報ERcont
rol1[f,ω]のダブルトーク状態かつエコー抑圧量が十分でないと検出される条件
を包含するように、制御情報ERcontrol2[f,ω]のダブルトーク状態かつエ
コー抑圧量が十分でないと検出される条件を広く設定する。こうするに、2つの制御情報
を用いることによって、エコー抑圧ゲインをスムージングした場合に、送話音声の品質劣
化を防止できる。
周波数領域逆変換処理部(IFT)111pは、信号抑圧部(SS)111oから出力
された周波数スペクトルS’[f,ω]を入力とし、IFFT(Inverse Fast Fourier T
ransform)などによって送話出力信号s’[n](n=0,1,・・・,N−1)を算出
して出力する。このとき適宜、周波数領域変換処理部(FT)111b及び周波数領域変
換処理部(FT)111cの窓掛けを考慮して、過去のフレームのs’[n]を用いてオ
ーバーラップを戻す処理を行う。
上記のように構成された、第1の実施形態に係る信号処理装置の処理の流れを、図5〜
図7を参照して説明する。図5は、全体の処理の流れを示すフローチャートであり、図6
はエコーキャンセラ部(EC)110における処理の流れを示すフローチャートであり、
図7はエコーリダクション部(ER)111における処理の流れを示すフローチャートで
ある。
図5において、発呼又は着呼があると、通信部(COM)101は通信リンクを確立す
る処理を行い、また各パラメータや各バッファの初期化などの初期設定処理を行う(ステ
ップS1001)。通信リンクが確立することにより、通信相手と双方向通話が可能な状
態となり、双方向の通話が開始されると、通信部(COM)101にあり図示されないデ
コーダは1フレームごとに復号化され受話入力信号x[n]として読み込む。また、マイ
クロホン106を介して送話入力信号z[n]が読み込まれる(ステップS1002)。
そして、ハイパスフィルタ部(HPF)109は、送話入力信号z[n]のオフセット
除去処理を行う(ステップS1003)。また、遅延処理部(DELAY)102は受話
入力信号x[n]を一時的に蓄えて遅延させる処理を行う(ステップS1004)。これ
ら遅延した受話入力信号x[n−D]とオフセット除去された送話入力信号z[n]を入
力として、エコーキャンセラ部(EC)110はエコーキャンセラ処理を行う(ステップ
S1005)。
そして、遅延した受話入力信号x[n−D]と、オフセット除去された送話入力信号z
[n]と、エコーキャンセラ部(EC)110から出力されたエラーキャンセラ処理後の
信号である残差信号e[n]を入力として、エコーリダクション部(ER)111は非線
形エコー抑圧処理であるエコーリダクション処理を行う(ステップS1006)。そして
、ステップS1002からステップS1006の処理を、通話が終了するまで行う(ステ
ップS1007)。
図6に示すエコーキャンセラ部(EC)110の処理は、次のように行われる。まず、
ダブルトーク検出部(DTD)110cがダブルトーク検出処理を行う(ステップS11
01)。次に、適応フィルタ部(ADF)110aはダブルトーク情報ECstate[
n]の制御を受けながら、適応フィルタ処理を行う(ステップS1102)。そして、信
号減算処理部110bは、送話入力信号z[n]から、適応フィルタ部(ADF)110
aから出力された擬似エコー信号y’[n]を減算し、残差信号e[n]を算出して出力
し、エコーキャンセラ処理が終了する。
図7に示すエコーリダクション部(ER)111の処理は、次のように行われる。まず
、周波数領域変換処理部(FT)111a、周波数領域変換処理部(FT)111b、周
波数領域変換処理部(FT)111cは、それぞれ周波数領域に変換するためのバッファ
である受話フレーム、送話フレーム、残差フレームを更新する(ステップS1201r、
S1201s、S1201e)。
次に、周波数領域変換処理部(FT)111aは遅延した受話入力信号x[n−D]を
周波数領域に変換して、受話入力信号の周波数スペクトルX[f,ω]を算出して(ステ
ップS1202r)、受話パワー算出部(POW)111dは受話パワースペクトル|X
[f,ω]|及びスムージングされた受話パワースペクトル|X[f,ω]|を算
出する(ステップS1203r)。
同様に、周波数領域変換処理部(FT)111bは送話入力信号z[n]を周波数領域
に変換して、送話入力信号の周波数スペクトルZ[f,ω]を算出して(ステップS12
02s)、送話パワー算出部(POW)111eは送話パワースペクトル|Z[f,ω]
及びスムージングされた送話パワースペクトル|Z[f,ω]|を算出する(ス
テップS1203s)。
さらに同様に、周波数領域変換処理部(FT)111cは残差信号e[n]を周波数領
域に変換して、残差信号の周波数スペクトルE[f,ω]を算出して(ステップS120
2e)、残差パワー算出部(POW)111fは残差パワースペクトル|E[f,ω]|
及びスムージングされた残差パワースペクトル|E[f,ω]|を算出する(ステ
ップS1203e)。
そして、周波数領域ダブルトーク検出部(FDTD)111jは周波数領域ダブルトー
ク情報ERstate[f,ω]を出力し、音響結合量推定部(ACLE)111gは、
スムージングされた受話パワースペクトル|X[f,ω]|とスムージングされた送
話パワースペクトル|Z[f,ω]|と、周波数領域ダブルトーク情報ERstat
e[f,ω]とを入力として音響結合量|H[f,ω]|を算出する(ステップS1
204)。エコー量推定部(ELE)111hは、音響結合量|Hs[f,ω]|とス
ムージングした受話パワースペクトル|X[f,ω]|とを入力として送話入力信号
に含まれるエコー量|Y[f,ω]|を推定する(ステップS1205)。
次に、エコー抑圧量推定部(ECLE)111iは、送話パワースペクトル|Z[f,
ω]|と残差パワースペクトル|E[f,ω]|とを入力として、エコーキャンセラ
部(EC)110で抑圧されたエコー抑圧量ECL[f,ω]を推定する(ステップS1
206)。そして、制御部(CTRL)111kは、ダブルトーク状態であるか否か、及
びエコーキャンセラ部(EC)110のエコー抑圧量が十分であるか否かの判定処理を行
い、制御情報ERcontrol1[f,ω]及びERcontrol2[f,ω]を出
力する(ステップS1207)。
エコー抑圧ゲイン算出部(GCAL)111nは、送話パワー算出部(POW)111
eから出力されたスムージングされた送話パワースペクトル|Z[f,ω]|と、エ
コー量推定部(ELE)111hから出力されたスムージングしたエコー量|Y[f,
ω]|と、ゲイン格納部(GTBL)111mから出力されたパラメータγ[ω]と、
エコー抑圧量推定部(ECLE)111iから出力されたエコー抑圧量ECL[f,ω]
と、制御部(CTRL)111kから出力された制御情報ERcontrol2[f,ω
]とを入力として、ダブルトーク状態かつエコー抑圧量が十分でないと検出された周波数
帯域と、それ以外の周波数帯域とで、それぞれ異なる計算によってエコー抑圧ゲインG[
f,ω]を算出する。また、エコー抑圧ゲイン算出部(GCAL)111nはエコー抑圧
ゲインG[f,ω]を所定の下限値以下にならないように制御する(ステップS1208
)。
一方、スペクトル選択部111Lは、制御部(CTRL)111kから出力された制御
情報ERcontrol1[f,ω]を入力として、ダブルトーク状態かつエコー抑圧量
が十分でないと検出された周波数帯域では、周波数スペクトルとして送話入力信号の周波
数スペクトルZ[f,ω]を選択し、それ以外の周波数帯域では周波数スペクトルとして
残差信号の周波数スペクトルE[f,ω]を選択する(ステップS1209)。
そして、信号抑圧部(SS)111oは、スペクトル選択部111Lで選択された周波
数スペクトルと、エコー抑圧ゲイン算出部(GCAL)111nで算出されたエコー抑圧
ゲインG[f,ω]を入力として、選択された周波数スペクトルのエコーを抑圧する(ス
テップS1210)。最終的に、周波数領域逆変換処理部(IFT)111pは、信号抑
圧部(SS)111oから出力された周波数スペクトルS’[f,ω]を周波数逆変換処
理することによって(ステップS1211)、エコーリダクション処理が終了する。
このようにしてエコーリダクション部(ER)111から出力された送話出力信号s’
[n]は、通信部(COM)101にあり図示しないエンコーダによって1フレームごと
に符号化され、この符号化によって得られたデータは、通信部(COM)101を通じて
、送信データとして通信相手に送信される。
上記では、エコーリダクション部(ER)111はFFTによる周波数領域型で周波数
帯域毎に処理する方式として動作するものとして説明した。FFTによる周波数帯域をグ
ループでまとめて周波数帯域グループ毎に処理する方式や、フィルタバンクなどの帯域分
割フィルタなどの周波数領域型を実現してもよい。
なお、ダブルトーク中のエコーパスロス変動時では、エコーキャンセラ部(EC)11
0の処理によって送話入力信号z[n]よりも残差信号e[n]が大きくなってしまい、
エコーキャンセラ部(EC)110の処理によるエコー抑圧量が十分でない場合がある。
その場合、以上説明した信号処理装置の動作により、エコーキャンセラ部(EC)11
0の処理によるエコー抑圧量が十分でない周波数領域をエコー抑圧量推定部(ECLE)
111iと制御部(CTRL)111kで判定して、スペクトル選択部111Lとエコー
抑圧ゲイン算出部(GCAL)111nにおいて周波数帯域毎にエコーキャンセラ部(E
C)110の処理とエコーリダクション部(ER)111の処理の重みを変化させるよう
に制御することができるので、エコーパスロス変動に対して頑健にすることが可能であり
、高品質な送話出力信号を出力することが可能である。
(第1の実施形態の変形例)
本発明の第1の実施形態の変形例に係る信号処理装置が第1の実施形態に係る信号処理
装置と異なる点は、エコーリダクション部(ER)111に代えて、エコーリダクション
部(ER)1112を有する点である。図8に、本発明の第1の実施形態の変形例に係る
信号処理装置のエコーリダクション部(ER)1112の構成を示すブロック図を示す。
エコーリダクション部(ER)1112がエコーリダクション部(ER)111と異な
る点は、音響結合量推定部(ACLE)111gに代えて音響結合量推定部(ACLE)
111g2を有し、エコー抑圧ゲイン算出部(GCAL)111nに代えてエコー抑圧ゲ
イン算出部(GCAL)111n2を有する点にある。
更に、エコーリダクション部(ER)1112において、送話パワー算出部(POW)
111eの出力をエコー抑圧量推定部(ECLE)111iのみに入力させ、残差パワー
算出部(POW)111fの出力をエコー抑圧量推定部(ECLE)111iと周波数領
域ダブルトーク検出部(FDTD)111jに加えて、音響結合量推定部(ACLE)1
11g2とエコー抑圧ゲイン算出部(GCAL)111n2にも入力させた点にあり、そ
の他の部分は同じである。そこで、このエコーリダクション部(ER)1112で、エコ
ーリダクション部(ER)111と同じ部分については、同じ符号を付してその説明を省
略する。
音響結合量推定部(ACLE)111g2は、受話パワー算出部(POW)111dか
ら出力されたスムージングされた受話パワースペクトル|X[f,ω]|と、残差パ
ワー算出部(POW)111fから出力されたスムージングされた残差パワースペクトル
|E[f,ω]|と、周波数領域ダブルトーク検出部(FDTD)111jから出力
される周波数領域ダブルトーク情報ERstate[f,ω]とを入力とし、周波数帯域
ω毎に音響結合量|H[f,ω]|を、|E[f,ω]|を用いて以下の式14に
よって算出する。
Figure 2007060644
そして、音響結合量推定部(ACLE)111g2は、以下の式15のように1フレー
ム前の値を用いてスムージングした音響結合量|H[f,ω]|を算出して出力する
。ただし、α[ω]は、0.03〜0.99程度が望ましい。
Figure 2007060644
エコー抑圧ゲイン算出部(GCAL)111n2は、残差パワー算出部(POW)11
1fから出力されたスムージングされた残差パワースペクトル|E[f,ω]|と、
エコー量推定部(ELE)111hから出力されたスムージングしたエコー量|Y[f
,ω]|と、ゲイン格納部(GTBL)111mから出力されたパラメータγ[ω]と
、エコー抑圧量推定部(ECLE)111iから出力されたエコー抑圧量ECL[f,ω
]と、制御部(CTRL)111kから出力されたダブルトーク状態かつエコーキャンセ
ラ部(EC)110のエコー抑圧量が十分でない周波数帯域であるか否かの情報である制
御情報ERcontrol2[f,ω]とを入力とし、エコー抑圧ゲインG[f,ω]を
算出して出力する。
具体的には、エコー抑圧ゲイン算出部(GCAL)111n2は、制御部(CTRL)
111kから出力された制御情報ERcontrol2[f,ω]からダブルトーク状態
かつエコーキャンセラ部(EC)110のエコー抑圧量が十分でないと検出された周波数
帯域については、エコーキャンセラ部(EC)110のエコー抑圧量の分を増した抑圧量
をエコーリダクション(ER)1112のエコー抑圧量にするため、エコー抑圧ゲインG
[f,ω]をエコーキャンセラ部(EC)110のエコー抑圧量ECL[f,ω]を用い
て抑圧量を補正し以下の式16のように算出する。
Figure 2007060644
それ以外の周波数帯域では、エコー抑圧ゲイン算出部(GCAL)111n2は、エコ
ー抑圧ゲインG[f,ω]をウィナー・フィルタ(Wiener Filter)法を用いて、式17
−1によって算出する。あるいは、エコーキャンセラ部(EC)110が正常に機能して
いると見なして、エコーリダクション(ER)111のエコー抑圧量を多くするように、
エコーキャンセラ部(EC)110のエコー抑圧量ECL[f,ω]を用いて補正し、エ
コー抑圧ゲインG[f,ω]を以下の式17−2が示すように算出する。
Figure 2007060644
以上説明した第1の実施形態の変形例に係る信号処理装置の動作により、エコーパス変
動はほとんどなく、エコーキャンセラ部(EC)110の抑圧性能が安定していることが
多い用途では、エコーキャンセラ部(EC)110とエコーリダクション(ER)111
2の直列接続が選択されやすくなるので、過剰なエコー抑圧を防ぐことができ、送話音質
が劣化するのを防止することが可能である。
(第2の実施形態)
第2の実施形態に係る信号処理装置が第1の実施形態に係る信号処理装置と異なる点は
、図9に示すようにエコーリダクション部(ER)111を有さず、ノイズリダクション
部(NR)211を有する点にあり、その他の部分は同じである。そこで、同じ部分につ
いては、同じ符号を付してその説明を省略し、図面を参照して第2の実施形態に係るノイ
ズリダクション部(NR)211を説明する。なお、このノイズリダクション部(NR)
211で、第1の実施形態に係るエコーリダクション部(ER)111と同じ部分につい
ては、同じ符号を付してその説明を省略する。
図10は、第2の実施形態に係る信号処理装置のノイズリダクション部(NR)211
の構成を示すブロック図である。このノイズリダクション部(NR)211は、周波数領
域変換処理部(FT)111bと、周波数領域変換処理部(FT)111cと、送話パワ
ー算出部(POW)111eと、残差パワー算出部(POW)111fと、エコー抑圧量
推定部(ECLE)111iと、制御部(CTRL)211kと、スペクトル選択部21
1Lと、ノイズ抑圧ゲイン算出部(GCAL)211nと、信号抑圧部(SS)211o
と、周波数領域逆変換処理部(IFT)111pと、雑音レベル推定部(NLE)211
qとからなる。
ノイズリダクション部(NR)211は、ハイパスフィルタ部(HPF)109から出
力された送話入力信号z[n]と、信号減算処理部110bから出力された残差信号e[
n]とを入力とし、送話入力信号z[n]あるいは残差信号e[n]の少なくとも一方か
らノイズ成分を抑圧し、そのノイズ抑圧後の信号を送話出力信号s’[n](n=0,1
,・・・,N−1)として1フレームごとに出力する。
雑音レベル推定部(NLE)211qは、周波数領域変換処理部(FT)111bから
出力された送話スペクトルZ[f,ω]と、周波数領域変換処理部(FT)111cから
出力された残差スペクトルE[f,ω]とを入力とし、有音ではない区間のスペクトルを
測定し、周波数帯域ω毎に送話スペクトルZ[f,ω]に含まれる雑音レベル|N[f
,ω]|と残差スペクトルE[f,ω]に含まれる雑音レベル|N[f,ω]|
を算出して出力する。
制御部(CTRL)211kは、エコー抑圧量推定部(ECLE)111iから出力さ
れたエコー抑圧量ECL[f,ω]を入力とし、周波数帯域ω毎にエコーキャンセラ部(
EC)110のエコー抑圧量が十分でない周波数帯域を検出して、エコーキャンセラ部(
EC)110のエコー抑圧量が十分でない周波数帯域であるか否かの情報である制御情報
NRcontrol[f,ω]を出力する。
具体的には、制御部(CTRL)211kは、周波数帯域ω毎に不等式ECL[f,ω
]>β[ω]を満たした周波数帯域であり、かつ1フレーム当りの不等式ECL[f,
ω]>β[ω]が成立した帯域数countがβより大きい場合にエコー抑圧量が少
ないと判定する。ただし、β[ω]は+8dB〜−15dB程度、βは全周波数帯域
数の10%〜40%程度が望ましい。本実施形態では以下、β[ω]を0dBとして説
明する。
スペクトル選択部211Lは、周波数領域変換処理部(FT)111bから出力された
送話入力信号の周波数スペクトルZ[f,ω]と、周波数領域変換処理部(FT)111
cから出力された残差信号の周波数スペクトルE[f,ω]と、制御部(CTRL)21
1kから出力されたエコーキャンセラ部(EC)110のエコー抑圧量が十分でない周波
数帯域であるか否かの情報である制御情報NRcontrol[f,ω]とを入力とし、
送話入力信号の周波数スペクトルZ[f,ω]あるいは残差信号の周波数スペクトルE[
f,ω]のいずれか一方を周波数スペクトルとして選択して出力する。
具体的には、制御情報NRcontrol[f,ω]がエコーキャンセラ部(EC)1
10のエコー抑圧量が十分でないと検出された周波数帯域であった場合は、周波数スペク
トルとして送話入力信号の周波数スペクトルZ[f,ω]を選択する。それ以外の周波数
帯域であった場合は周波数スペクトルとして残差信号の周波数スペクトルE[f,ω]を
選択する。
このようにすることで周波数帯域ごとに、エコーキャンセラ部(EC)110のエコー
抑圧量が十分でない場合は、ノイズリダクション部(NR)211を単体で動作させ、雑
音レベルの推定がエコーの影響を受けないようにすることができる。
ノイズ抑圧ゲイン算出部(GCAL)211nは、雑音レベル推定部(NLE)211
qから出力された雑音レベル|N[f,ω]|及び|N[f,ω]|と、送話パ
ワー算出部(POW)111eから出力された送話パワースペクトル|Z[f,ω]|
と、制御部(CTRL)211kから出力された制御情報NRcontrol[f,ω]
と、信号抑圧部(SS)111oから出力された1フレーム前の送話出力信号のスペクト
ルS’[f−1,ω]を入力とし、ノイズ抑圧ゲインG[f,ω]を算出して出力する。
具体的には、ノイズ抑圧ゲイン算出部(GCAL)211nは、まず、制御部(CTR
L)211kから出力された制御情報NRcontrol[f,ω]によってエコー抑圧
量が十分でないと検出された周波数帯域については、エコーキャンセラ部(EC)110
の処理後の残留エコーの影響で雑音推定の精度が取れていないと判定して、雑音レベルと
して|N[f,ω]|を選択する。それ以外の周波数帯域では雑音レベルとして|N
[f,ω]|を選択する。
そして、周波数帯域ω毎に選択された雑音レベルに基づいて、以下のアルゴリズムまた
はそれらの組み合わせでノイズ抑圧ゲインG[f,ω]を算出する。即ち、一般のノイズ
リダクションであるスペクトル・サブトラクション(Spectral Subtraction)法(S. F.
Boll, “Suppression of acoustic noise in speech using spectral subtraction”, IE
EE Trans. Acoustics, Speech, and Signal Processing, vol.ASSP-29, pp.113-120 (197
9).)、ウィナー・フィルター(Wiener Filter)法(J. S. Lim, A. V. Oppenheim, “En
hancement and bandwidth compression of noisy speech”, Proc. IEEE Vol.67, No.12,
pp.1586-1604, Dec.1979.)及び最尤推定(Maximum Likelihood)法(R. J. McAulay, M
. L. Malpass, “Speech enhancement using a soft-decision noise suppression filte
r”, IEEE Trans. on Acoustics, Speech, and Signal Processing, vol.ASSP-28, no.2,
pp.137-145, Apr.1980.)などである。
また、送話出力信号の1フレーム前の周波数スペクトルS’[f−1,ω]を用いて事
前SN比SNRPRIO[f,ω]及び事後SN比SNRPOST[f,ω]を推定算出
してノイズ抑圧ゲインを精度よく推定する手法(例えば、P. Scalart, J. V. Filho, ”S
peech enhancement based on a priori signal to noise estimation”, Proc. ICASSP96
, pp.629-632, May 1996.)、MMSE−STSA(Minimum Mean-Square Error Short-T
ime Spectral Amplitude estimator)法(Y. Ephraim, D. Malah, “Speech enhancement
using a minimum mean-square error short-time spectral amplitude estimator”, IE
EE Trans. on Acoustics, Speech, and Signal Processing, vol.ASSP-32, no.6, pp.110
9-1121, Dec.1984.)及びJoint MAP法(T. Lotter, P. Vary, “Noise reduction by max
imum a posteriori spectral amplitude estimation with super Gaussian speech model
ing”, Proc. IWAENC, pp.83-86, Sep.2003.)などである。
例えば、雑音レベル|N[f,ω]|が選択されたときは、P[・]を半波整流と
して、事前SN比SNRPRIO[f,ω]及び事後SN比SNRPOST[f,ω]は
、それぞれ、以下の式18−1、式18−2により求められ、この場合ウィナー・フィル
ター法を用いるとノイズ抑圧ゲインG[f,ω]は、以下の式18−3により算出される
。但し、μ[ω]は0.9〜0.999程度の忘却係数である。一方、雑音レベル|N
[f,ω]|が選択されたときは、同様にして以下の式18−1、式18−2における
|N[f,ω]|を|N[f,ω]|に置き換えてノイズ抑圧ゲインG[f,ω
]を以下の式18−3により算出する。
Figure 2007060644
また、ノイズ抑圧ゲイン算出部(GCAL)211nは、過剰なノイズ抑圧により送話
音質が劣化するのを防止し、背景雑音の断続的な抑圧を防止するため、ノイズ抑圧ゲイン
G[f,ω]が所定の下限値以下にならないように制御する。即ち、図4を参照して説明
したエコー抑圧ゲインの下限値の帯域別の設定が、ノイズ抑圧ゲインの下限値の帯域別の
設定にも適用される。
さらに、過剰なノイズ抑圧により送話音質が劣化するのを防止するため、送話入力信号
z[n]あるいは残差信号e[n]の有音区間ではない区間の信号レベルを用いて周波数
帯域ごとに背景雑音レベルを算出しておき、背景雑音レベルよりも抑圧しないようにノイ
ズ抑圧ゲインを制御しても構わない。
信号抑圧部(SS)211oは、スペクトル選択部211Lから出力された周波数スペ
クトルと、ノイズ抑圧ゲイン算出部(GCAL)211nから出力されたノイズ抑圧ゲイ
ンG[f,ω]とを入力として、スペクトル選択部211Lから出力された周波数スペク
トルのノイズを抑圧し、以下の式19−1あるいは式19−2が示すようにして送話出力
信号のスペクトルS’[f,ω]として出力する。
Figure 2007060644
このとき、送話入力信号の周波数スペクトルZ[f,ω]と残差信号の周波数スペクト
ルE[f,ω]のどちらの周波数スペクトルがスペクトル選択部211Lで選択されても
、エコーキャンセラ部(EC)110は時間領域での処理であるから、位相スペクトルに
差がないため、出力された送話出力信号は聴感上滑らかにつなぐことができる。
次に、上記のように構成された第2の実施形態に係る信号処理装置の処理の流れを説明
する。図11は、第2の実施形態に係る信号処理装置の全体の処理の流れを示すフローチ
ャートである。なお、図5を参照して説明した第1の実施形態に係る信号処理装置の動作
と同じ動作ステップについては、同じ符号を付してその部分の説明を省略する。
ステップS1005のエコーキャンセラ処理の後、信号処理装置は、第1の実施形態に
おいてはステップS1006でエコーリダクション処理を行ったのに代えて、第2の実施
形態においては、ステップS1005で得られたエコーキャンセラ処理後の信号を用いて
ノイズリダクション処理を行う(ステップS2006)。そして、ステップS1007の
終話か否かの判断に移る。
第2の実施形態に係るエコーキャンセル部(EC)110は、第1の実施形態に係るエ
コーキャンセル部(EC)110と同じであるので、それぞれの実施形態における処理の
流れは、当然に同じであり説明を省略する。
図12は、第2の実施形態に係るノイズリダクション部(NR)211における処理の
流れを示すフローチャートである。なお、図7を参照して説明した第1の実施形態に係る
エコーリダクション部(ER)111における動作と同じ動作ステップについては、同じ
符号を付してその部分の説明を省略する。
第2の実施形態に係るノイズリダクション部(NR)211は、ステップS1201r
の受話フレーム更新処理、ステップS1202rの受話周波数変換処理、ステップS12
03rの受話パワースペクトル算出処理、ステップS1204の音響結合量算出処理、ス
テップS1205のエコーレベル算出処理、ステップS1207の判定処理からステップ
S1210の送話信号抑圧処理までの動作はない。
即ち、第2の実施形態に係るノイズリダクション部(NR)211は、ノイズリダクシ
ョン処理を開始して、ステップS1203sの送話パワースペクトル算出処理、及びステ
ップS1203eの残差パワースペクトル算出処理の後、雑音レベル推定部(NLE)2
11qは、有音区間でない区間のスペクトルを測定することにより、周波数帯域ω毎に送
話入力信号の周波数スペクトルに含まれる雑音レベルと、残差信号の周波数スペクトルに
含まれる雑音レベルをそれぞれ算出する(ステップS2205)。その後、ステップS1
206のエコー抑圧量算出処理を行い、制御部(CTRL)211kは、エコーキャンセ
ラ部(EC)110のエコー抑圧量が十分であるか否かの判定処理を行い、制御情報NR
control[f,ω]を出力する(ステップS2207)。
そして、ノイズ抑圧ゲイン算出部(GCAL)211nは、送話パワー算出部(POW
)111eから出力された送話パワースペクトル|Z[f,ω]|と、制御部(CTR
L)211kから出力された制御情報NRcontrol[f,ω]を入力として、エコ
ー抑圧量が十分でないと検出された周波数帯域と、それ以外の周波数帯域とで、それぞれ
異なる計算によってノイズ抑圧ゲインG[f,ω]を算出する。また、ノイズ抑圧ゲイン
算出部(GCAL)211nはノイズ抑圧ゲインG[f,ω]を所定の下限値以下になら
ないように制御する(ステップS2208)。
そして、スペクトル選択部211Lは、制御部(CTRL)211kから出力された制
御情報NRcontrol[f,ω]を入力として、エコー抑圧量が十分でないと検出さ
れた周波数帯域について、周波数スペクトルとして送話入力信号の周波数スペクトルZ[
f,ω]を選択し、それ以外の周波数帯域では周波数スペクトルとして残差信号の周波数
スペクトルE[f,ω]を選択する(ステップS2209)。
そして、信号抑圧部(SS)211oは、スペクトル選択部211Lで選択された周波
数スペクトルとノイズ抑圧ゲイン算出部(GCAL)211nで算出されたノイズ抑圧ゲ
インG[f,ω]を入力として、選択された周波数スペクトルのノイズを抑圧する(ステ
ップS2210)。そして、ステップS1211の周波数逆変換処理に移って、ノイズリ
ダクション処理が終了する。
以上、ノイズリダクション部(NR)211はFFTによる周波数領域型で周波数帯域
毎に処理する方式として動作するものとして説明した。FFTによる周波数帯域をグルー
プでまとめて周波数帯域グループ毎に処理する方式や、フィルタバンクなどの帯域分割フ
ィルタなどの周波数領域型を実現してもよい。
ダブルトーク中のエコーパスロス変動時では、エコーキャンセラ部(EC)110の処
理によって送話入力信号z[n]よりも残差信号e[n]が大きくなってしまい、エコー
キャンセラ部(EC)110の処理によるエコー抑圧量が十分でない場合がある。
以上説明した第2の実施形態に係る信号処理装置の動作により、エコーキャンセラ部(
EC)110の処理によるエコー抑圧量が十分でない周波数領域をエコー抑圧量推定部(
ECLE)111iと制御部(CTRL)211kで検出して、周波数帯域毎にノイズリ
ダクション部(NR)211の雑音レベル推定部(NLE)211qとスペクトル選択部
211Lとノイズ抑圧ゲイン算出部(GCAL)211nによって雑音レベルの推定がエ
コーの影響を受けないようにすることができるので、エコーパスロス変動に対して頑健に
することが可能であり、高品質な信号を出力することが可能である。
(第3の実施形態)
図13は、第3の実施形態に係る信号処理装置の構成を示すブロック図である。この信
号処理装置が第1の実施形態に係る信号処理装置と異なる点は、エコーリダクション部(
ER)111を有さず、エコーノイズリダクション部(ENR)311を有する点にあり
、その他の部分は同じである。そこで、同じ部分については、同じ符号を付してその説明
を省略し、図面を参照して第3の実施形態に係るエコーノイズリダクション部(ENR)
311を説明する。なお、このエコーノイズリダクション部(ENR)311で、第1の
実施形態に係るエコーリダクション部(ER)111及び第2の実施形態に係るノイズリ
ダクション部(NR)211と同じ部分については、同じ符号を付してその説明を省略す
る。
図14は、第3の実施形態に係る信号処理装置のエコーノイズリダクション部(ENR
)311の構成を示すブロック図である。このエコーノイズリダクション部(ENR)3
11は、周波数領域変換処理部(FT)111aと、周波数領域変換処理部(FT)11
1bと、周波数領域変換処理部(FT)111cと、受話パワー算出部(POW)111
dと、送話パワー算出部(POW)111eと、残差パワー算出部(POW)111fと
、音響結合量推定部(ACLE)111gと、エコー量推定部(ELE)111h、エコ
ー抑圧量推定部(ECLE)111iと、制御部(CTRL)211kと、スペクトル選
択部211Lと、ゲイン格納部(GTBL)111mと、エコーノイズ抑圧ゲイン算出部
(GCAL)311nと、信号抑圧部(SS)311oと、周波数領域逆変換処理部(I
FT)111pと、雑音レベル推定部(NLE)311qとからなる。
エコーノイズリダクション部(ENR)311は、ハイパスフィルタ部(HPF)10
9から出力された送話入力信号z[n]と、信号減算処理部110bから出力された残差
信号e[n]とを入力とし、送話入力信号z[n]あるいは残差信号e[n]の少なくと
も一方からエコー成分及びノイズ成分を抑圧し、そのエコー抑圧及びノイズ抑圧後の信号
を送話出力信号s’[n](n=0,1,・・・,N−1)として1フレームごとに出力
する。
雑音レベル推定部(NLE)311qは、スペクトル選択部211Lから出力された周
波数スペクトル(送話スペクトルZ[f,ω]あるいは残差スペクトルE[f,ω])を
入力とし、有音ではない区間のスペクトルを測定し、周波数帯域ω毎に周波数スペクトル
に含まれる雑音レベル|N[f,ω]|を算出して出力する。
エコーノイズ抑圧ゲイン算出部(GCAL)311nは、エコー量推定部(ELE)1
11hから出力されたスムージングしたエコー量|Y[f,ω]|と、ゲイン格納部
(GTBL)111mから出力されたパラメータγ[ω]と、送話パワー算出部(POW
)111eから出力されたスムージングされた送話パワースペクトル|Z[f,ω]|
と、雑音レベル推定部(NLE)311qから出力された雑音レベル|N[f,ω]|
と、制御部(CTRL)211kから出力された制御情報NRcontrol[f,ω
]とを入力とし、エコーノイズ抑圧ゲインG[f,ω]を算出して出力する。
具体的には、エコーノイズ抑圧ゲイン算出部(GCAL)311nは、まず、制御部(
CTRL)211kから出力された制御情報NRcontrol[f,ω]によってエコ
ー抑圧量が十分でないと検出された周波数帯域については、過剰なエコー抑圧により送話
音質が劣化するのを防止するため、スムージングされた送話パワースペクトル|Z[f
,ω]|から雑音レベル|N[f,ω]|を除去して、エコー抑圧ゲインGER[f
,ω]を式20によって算出する。
Figure 2007060644
それ以外の周波数帯域では、エコーキャンセラ部(EC)110のエコー抑圧量が十分
であり、エコーキャンセラ部(EC)110が正常に機能していると見なして、エコーノ
イズ抑圧ゲイン算出部(GCAL)311nは、エコーノイズリダクション部(ENR)
311のエコー抑圧量を多くするように、エコーキャンセラ部(EC)110のエコー抑
圧量ECL[f,ω]を用いて補正し、エコー抑圧ゲインGER[f,ω]を以下の式2
1が示すように算出する。
Figure 2007060644
また、エコーノイズ抑圧ゲイン算出部(GCAL)311nは、周波数帯域ω毎に選択
された雑音レベル|N[f,ω]|に基づいて、前述した一般のノイズリダクションで
あるスペクトル・サブトラクション(Spectral Subtraction)法やウィナー・フィルター
(Wiener Filter)法や最尤推定(Maximum Likelihood)法などのアルゴリズムでノイズ
抑圧ゲインGNR[f,ω]を算出する。
そして、式22に示すように、エコー抑圧ゲインGER[f,ω]とノイズ抑圧ゲイン
NR[f,ω]の積を算出し、エコーノイズ抑圧ゲインG[f,ω]とする。
Figure 2007060644
また、過剰なエコー抑圧により送話音質が劣化するのを防止するため、エコーノイズ抑
圧ゲイン算出部(GCAL)311nは、エコーノイズ抑圧ゲインG[f,ω]は所定の
下限値以下にならないように制御する。即ち、図4を参照して説明したエコー抑圧ゲイン
の下限値の帯域別の設定が、エコーノイズ抑圧ゲインの下限値の帯域別の設定にも適用さ
れる。
さらに、過剰なエコー及びノイズ抑圧により送話音質が劣化するのを防止するため、エ
コーノイズ抑圧ゲイン算出部(GCAL)311nは、送話入力信号z[n]あるいは残
差信号e[n]の有音区間ではない区間の信号レベルを用いて周波数帯域ごとに背景雑音
レベルを算出しておき、背景雑音レベルよりも抑圧しないようにエコーノイズ抑圧ゲイン
を制御しても構わない。
さらにまた、エコーノイズ抑圧ゲイン算出部(GCAL)311nは、送話音質が劣化
するのを防止するために、エコーノイズ抑圧ゲインG[f,ω]を以下の式23−1ある
いは式23−2が示すように周波数方向にスムージングして出力してもよい。例えば、ε
は、[0.1、0.2、0.4、0.2、0.1]、ηは、[0.1、0.2、0.
4、0.8、0.4、0.2、0.1]のようにしてよい。
Figure 2007060644
信号抑圧部(SS)311oは、スペクトル選択部211Lから出力された周波数スペ
クトルと、エコーノイズ抑圧ゲイン算出部(GCAL)311nから出力されたエコーノ
イズ抑圧ゲインG[f,ω]とを入力として、スペクトル選択部211Lから出力された
周波数スペクトルのエコー及びノイズを抑圧し、以下の式24−1または式24−2のよ
うに送話出力信号のスペクトルS’[f,ω]を算出して出力する。
Figure 2007060644
このとき、送話入力信号の周波数スペクトルZ[f,ω]と残差信号の周波数スペクト
ルE[f,ω]のどちらの周波数スペクトルがスペクトル選択部211Lで選択されても
、エコーキャンセラ部(EC)110は時間領域での処理であるから、位相スペクトルに
差がないため、出力された送話出力信号は聴感上滑らかにつなぐことができる。
次に、上記のように構成された第3の実施形態に係る信号処理装置の処理の流れを説明
する。図15は、第3の実施形態に係る信号処理装置の全体の処理の流れを示すフローチ
ャートである。なお、図5を参照して説明した第1の実施形態に係る信号処理装置の動作
と同じ動作ステップについては、同じ符号を付してその部分の説明を省略する。
ステップS1005のエコーキャンセラ処理の後、信号処理装置は、第1の実施形態に
おいてはステップS1006でエコーリダクション処理を行ったのに代えて、第3の実施
形態においては、ステップS1005で得られたエコーキャンセラ処理後の信号を用いて
エコーノイズリダクション処理を行う(ステップS3006)。そして、ステップS10
07の終話か否かの判断に移る。
第3の実施形態に係るエコーキャンセル部(EC)110は、第1の実施形態に係るエ
コーキャンセル部(EC)110と同じであるので、それぞれの実施形態における処理の
流れは、当然に同じであり説明を省略する。
図16は、第3の実施形態に係るエコーノイズリダクション部(ENR)311におけ
る処理の流れを示すフローチャートである。なお、図7を参照して説明した第1の実施形
態に係るエコーリダクション部(ER)111及び図12を参照して説明した第2の実施
形態に係るノイズリダクション部(NR)211における動作と同じ動作ステップについ
ては、同じ符号を付してその部分の説明を省略する。
第3の実施形態に係るエコーノイズリダクション部(ENR)311は、エコーノイズ
リダクション処理を開始して、ステップS1201r〜S1203r、S1201s〜S
1203s及びS1201e〜S1203eの受話、送話、残差の各信号に対するフレー
ム更新処理、周波数変換処理、パワースペクトル算出処理、ステップS1204の音響結
合量算出処理、ステップS1205のエコーレベル算出処理、ステップS1206のエコ
ー抑圧量算出処理を行う。
そして、ステップS2207の判定処理、及びステップS2209のスペクトル選択処
理の後、雑音レベル推定部(NLE)311qから出力された雑音レベル|N[f,ω]
を算出する(ステップS3205)。
そして、エコーノイズ抑圧ゲイン算出部(GCAL)311nは、雑音レベル推定部(
NLE)311qから出力された雑音レベル|N[f,ω]|と、制御部(CTRL)
211kから出力された制御情報NRcontrol[f,ω]とを入力として、エコー
抑圧量が十分でないと検出された周波数帯域と、それ以外の周波数帯域とで、それぞれ異
なる計算によってエコーノイズ抑圧ゲインG[f,ω]を算出する。また、エコーノイズ
抑圧ゲイン算出部(GCAL)311nはエコーノイズ抑圧ゲインG[f,ω]を所定の
下限値以下にならないように制御する(ステップS3208)。
そして、信号抑圧部(SS)311oは、スペクトル選択部211Lで選択された周波
数スペクトルとエコーノイズ抑圧ゲイン算出部(GCAL)311nで算出されたエコー
ノイズ抑圧ゲインG[f,ω]を入力として、選択された周波数スペクトルのエコー及び
ノイズを抑圧する(ステップS3210)。そして、ステップS1211の周波数逆変換
処理に移って、エコーノイズリダクション処理が終了する。
以上、エコーノイズリダクション部(ENR)311はFFTによる周波数領域型で周
波数帯域毎に処理する方式として動作するものとして説明した。FFTによる周波数帯域
をグループでまとめて周波数帯域グループ毎に処理する方式や、フィルタバンクなどの帯
域分割フィルタなどの周波数領域型を実現してもよい。
ダブルトーク中のエコーパスロス変動時では、エコーキャンセラ部(EC)110の処
理によって送話入力信号z[n]よりも残差信号e[n]が大きくなってしまい、エコー
キャンセラ部(EC)110の処理によるエコー抑圧量が十分でない場合がある。
以上説明した第3の実施形態に係る信号処理装置の動作により、エコーキャンセラ部(
EC)110の処理によるエコー抑圧量が十分でない周波数領域をエコー抑圧量推定部(
ECLE)111iと制御部(CTRL)211kで判定して、スペクトル選択部211
Lとエコーノイズ抑圧ゲイン算出部(GCAL)311nにおいて周波数帯域毎にエコー
キャンセラ部(EC)110の処理とエコーノイズリダクション部(ENR)311の処
理の重みを変化させるように制御することができるので、エコーパスロス変動に対して頑
健にすることが可能であり、高品質な信号を出力することが可能である。
また、非線形抑圧処理である周波数領域のエコーリダクションと周波数領域でのノイズ
リダクションをエコーノイズ抑圧ゲイン算出部(GCAL)311nと信号抑圧部(SS
)311oで共通化してエコーノイズリダクション部(ENR)311とすることで、計
算量が少なくすることができ、エコーリダクションとノイズリダクションを直列接続して
処理するよりも送話音質の劣化が防止できる。
(第4の実施形態)
図17は、第4の実施形態に係る信号処理装置の構成を示すブロック図である。この信
号処理装置が第1の実施形態に係る信号処理装置と異なる点は、図17に示すようにエコ
ーリダクション部(ER)111を有さず、エコーサプレッサ部(ES)411を有する
点と、遅延処理部(DELAY)102に代えて遅延処理部(DELAY)402を有す
る点、及びD/A変換器(D/A)103に代えてD/A変換器(D/A)403を有す
る点であり、その他の部分は同じである。そこで、同じ部分については、同じ符号を付し
てその説明を省略する。
また、遅延処理部(DELAY)402と、D/A変換器(D/A)403とは、エコ
ーサプレッサ部(ES)411から出力される受話出力信号x’[n]を入力とすること
が異なるものの、それぞれ遅延処理部(DELAY)102と、D/A変換器(D/A)
103との動作を同じ動作をするので、それらの説明を省略し、図面を参照して第4の実
施形態に係るエコーサプレッサ部(ES)411を説明する。
図18は、第4の実施形態に係る信号処理装置のエコーサプレッサ部(ES)411の
構成を示すブロック図である。このエコーサプレッサ部(ES)411は、受話パワー算
出部(POW)411dと、送話パワー算出部(POW)411eと、残差パワー算出部
(POW)411fと、エコー抑圧量推定部(ECLE)411iと、制御部(CTRL
)411kと、信号選択部411Lと、ゲイン格納部(GTBL)411mと、エコー抑
圧ゲイン算出部(GCAL)411nと、送話信号抑圧部(SS)411oと、受話信号
抑圧部(SS)411rとからなる。
エコーサプレッサ部(ES)411は、通信部(COM)101から出力された受話入
力信号x[n]と、ハイパスフィルタ部(HPF)109から出力された送話入力信号z
[n]と、信号減算処理部110bから出力された残差信号e[n]とを入力とし、受話
出力信号x’[n]及び送話出力信号s’[n](n=0,1,・・・,N−1)を1フ
レームごとに出力する。ここで、受話入力信号x[n]あるいは送話信号(送話入力信号
z[n]または残差信号e[n])の少なくとも一方に抑圧処理を施し、そのエコー抑圧
後の信号を出力する。
受話パワー算出部(POW)411dは、通信部(COM)101から出力された受話
入力信号x[n]を入力とし、受話パワーP[f]を以下の式25−1が示すようにフ
レーム単位で算出して出力する。受話パワーP[f]は以下の式25−2が示すように
1フレーム前の値PSX[f−1]を用いてスムージングした値PSX[f]を用いても
よい。ただし、αは、0.375〜0.999程度が望ましい。
Figure 2007060644
送話パワー算出部(POW)411eは、ハイパスフィルタ部(HPF)109から出
力された送話入力信号z[n]を入力とし、送話パワーP[f]を以下の式26−1が
示すようにフレーム単位で算出して出力する。送話パワーP[f]は以下の式26−2
が示すように1フレーム前の値PSZ[f−1]を用いてスムージングした値PSZ[f
]を用いてもよい。ただし、αは、0.375〜0.999程度が望ましい。
Figure 2007060644
残差パワー算出部(POW)411fは、信号減算処理部110bから出力された残差
信号e[n]を入力とし、残差パワーP[f]を以下の式27−1が示すようにフレー
ム単位で算出して出力する。残差パワーP[f]は以下の式27−2が示すように1フ
レーム前の値PSE[f−1]を用いてスムージングした値PSE[f]を用いてもよい
。ただし、αは、0.375〜0.999程度が望ましい。
Figure 2007060644
エコー抑圧量推定部(ECLE)411iは、送話パワー算出部(POW)411eか
ら出力された送話パワーP[f]と、残差パワー算出部(POW)411fから出力さ
れた残差パワーP[f]とを入力とし、エコーキャンセラ部(EC)110で抑圧され
たエコー抑圧量ECL[f]を推定して出力する。具体的には、以下に示す式28によっ
て算出する。もちろん、これら2つのパワーの差などを用いてもよい。
Figure 2007060644
制御部(CTRL)411kは、エコー抑圧量推定部(ECLE)411iから出力さ
れたECL[f]を入力とし、エコーキャンセラ部(EC)110のエコー抑圧量が十分
でないフレームであるか否かを判定し、その判定結果情報である制御情報EScontr
ol[f]を出力する。具体的には、ECL[f]>βを満たしたフレームはエコーキ
ャンセラ部(EC)110のエコー抑圧量が少ないと判定する。ただし、βは+8dB
〜−15dB程度が望ましい。本実施形態では以下、βを0dBとして説明する。
また、制御部(CTRL)411kは、受話パワー算出部(POW)411dから出力
された受話パワーP[f]と、送話パワー算出部(POW)411eから出力された送
話パワーP[f]とを入力とし、受話信号抑圧部(SS)411rによって受話入力信
号x[n]を抑圧するか、送話信号抑圧部(SS)411oによって送話信号(送話入力
信号z[n]または残差信号e[n])を抑圧するか否かを判定し、その判定結果情報で
ある状態情報ESstate[f]を出力する。
例えば、受話パワーP[f]と受話側の雑音レベルを表す可変閾値とを用いて受話側
が有音であるか否か検出し、送話パワーP[f]と送話側の雑音レベルを表す可変閾値
とを用いて送話側が有音であるか否かを検出し、受話側が有音であれば送話信号を抑圧す
るように状態情報ESstate[f]を設定し、送話側が有音であれば受話信号を抑圧
するように状態情報ESstate[f]を設定し、そして受話パワーP[f]と送話
パワーP[f]の差が大きくなるまで以前の状態情報ESstate[f]を継続する
ように設定する。
なおここで送話パワーP[f]として、制御情報EScontrol[f]によって
エコー抑圧量が十分でないと判定されたフレームについてはP[f]を用い、エコー抑
圧量が十分であると判定されたフレームではP[f]を用いてもよい。
信号選択部411Lは、ハイパスフィルタ部(HPF)109から出力された送話入力
信号z[n]と、信号減算処理部110bから出力された残差信号e[n]と、制御部(
CTRL)411kから出力された制御情報EScontrol[f]とを入力とし、送
話入力信号z[n]あるいは残差信号e[n]のいずれか一方をフレーム単位で出力する
。具体的には、制御情報EScontrol[f]がエコーキャンセラ部(EC)110
のエコー抑圧量が十分でないと検出されたフレームであった場合は、信号として送話入力
信号Z[n]を選択する。それ以外のフレームでは信号として残差信号e[n]を選択す
る。
このようにすることでフレームごとに、エコー抑圧量が十分でない場合、つまりエコー
キャンセラ部(EC)110の推定精度が十分とれない場合はエコーサプレッサ部(ES
)411を単体で動作させることができる。
ゲイン格納部(GTBL)411mは、事前に設定されたゲインγを格納しておく。た
だし、γは通話開始前に事前にアナログフロントエンド(D/A変換器(D/A)403
、受話増幅器104、スピーカ105、音響空間、マイクロホン106、送話増幅器10
7、A/D変換器(A/D)108)のエコーリターンロスに基づいて設定されているこ
とが望ましい。
エコー抑圧ゲイン算出部(GCAL)411nは、ゲイン格納部(GTBL)411m
から出力されたゲインγと、エコー抑圧量推定部(ECLE)411iから出力されたE
CL[f]と、制御部(CTRL)411kから出力された制御情報EScontrol
[f]及び状態情報ESstate[f]とを入力とし、エコー抑圧ゲインG[f]を算
出して出力する。
具体的には、エコー抑圧ゲイン算出部(GCAL)411nは、状態情報ESstat
e[f]が送話信号(送話入力信号z[n]または残差信号e[n])を抑圧すると判定
されたことを示す場合は次のようにする。まず、制御情報EScontrol[f]がエ
コーキャンセラ部(EC)110のエコー抑圧量が十分でないと検出されたフレームであ
った場合は、エコー抑圧ゲインG[f]をG[f]=γとする。
それ以外のフレームではエコー抑圧ゲインG[f]を、エコーキャンセラ部(EC)1
10で十分にできているため、抑圧量を強めてもよいと判定し、G[f]=γ・ECL[
f]と算出する。あるいは、過剰な抑圧を防止するためエコーキャンセラ部(EC)11
0のエコー抑圧量分を低減した抑圧量にするようにG[f]=γ/ECL[f]と算出す
る。一方、状態情報ESstate[f]が受話入力信号を抑圧すると判定されたことを
示す場合は、エコー抑圧ゲインG[f]をG[f]=γとする。
さらに、過剰なエコー抑圧により送話音質が劣化するのを防止するため、送話入力信号
z[n]あるいは残差信号e[n]の有音区間ではない区間の信号レベルを用いて背景雑
音レベルを算出しておき、背景雑音レベルよりも抑圧しないようにエコー抑圧ゲインを制
御してもよい。
送話信号抑圧部(SS)411oは、制御部(CTRL)411kから出力された状態
情報ESstate[f]と、エコー抑圧ゲイン算出部(GCAL)411nから出力さ
れたエコー抑圧ゲインG[f]と、信号選択部411Lで選択された送話信号(送話入力
信号z[n]または残差信号e[n])とを入力とし、状態情報ESstate[f]に
よって送話信号(送話入力信号z[n]または残差信号e[n])を抑圧すると判定され
たことを示す場合、信号選択部411Lで選択された信号とエコー抑圧ゲイン算出部(G
CAL)411nで算出された抑圧ゲインG[f]を用いて以下の式29−1または式2
9−2が示すように信号を抑圧し、送話出力信号s’[n]を算出して出力する。
また、状態情報ESstate[f]によって送話信号(送話入力信号z[n]または
残差信号e[n])を抑圧しないと判定された場合は、以下の式29−3または式29−
4が示すように送話信号をそのまま送話出力信号s’[n]として出力する。
Figure 2007060644
これらのとき、どちらの信号が信号選択部411Lで選択されても、出力された送話出
力信号s’[n]が聴感上滑らかに繋がるように、時間方向にスムージングしたエコー抑圧
ゲインG[f]を乗じてもよい。
受話信号抑圧部(SS)411rは、制御部(CTRL)411kから出力された状態
情報ESstate[f]と、エコー抑圧ゲイン算出部(GCAL)411nから出力さ
れたエコー抑圧ゲインG[f]と、通信部(COM)101から出力された受話入力信号
x[n]とを入力とし、状態情報ESstate[f]によって受話入力信号x[n]を
抑圧すると判定された場合、受話信号x[n]に対してエコー抑圧ゲイン算出部(GCA
L)411nで算出されたエコー抑圧ゲインG[f]を用いて、以下の式30−1が示す
ように信号を抑圧し、受話出力信号x’[n]を算出して出力する。
また、状態情報ESstate[f]によって受話入力信号x[n]を抑圧しないと判
定された場合は、以下の式30−2が示すように受話入力信号x[n]をそのまま受話出
力信号x’[n]として出力する。
Figure 2007060644
次に、上記のように構成された第4の実施形態に係る信号処理装置の処理の流れを説明
する。図19は、第4の実施形態に係る信号処理装置の全体の処理の流れを示すフローチ
ャートである。なお、図5を参照して説明した第1の実施形態に係る信号処理装置の動作
と同じ動作ステップについては、同じ符号を付してその部分の説明を省略する。
ステップS1003のオフセット除去処理の後、遅延処理部(DELAY)402は受
話信号抑圧部(SS)411rから出力された受話出力信号x’[n]を一時的に蓄えて
遅延させる処理を行う(ステップS4004)。そしてステップS1005のエコーキャ
ンセラ処理に移る。ステップS1005のエコーキャンセラ処理の後、信号処理装置は、
第1の実施形態においてはステップS1006でエコーリダクション処理を行ったのに代
えて、第4の実施形態においては、ステップS1005で得られたエコーキャンセラ処理
後の信号を用いてエコーサプレッサ処理を行う(ステップS4006)。そして、ステッ
プS1007の終話か否かの判断に移る。
第4の実施形態に係るエコーキャンセル部(EC)110は、第1の実施形態に係るエ
コーキャンセル部(EC)110と同じであるので、それぞれの実施形態における処理の
流れは、当然に同じであり説明を省略する。
図20は、第4の実施形態に係るエコーサプレッサ部(ES)411における処理の流
れを示すフローチャートである。まず、受話パワー算出部(POW)411dは、受話入
力信号x[n]から受話パワーP[f]を算出し(ステップS4201r)、送話パワ
ー算出部(POW)411eは、送話入力信号z[n]から送話パワーP[f]を算出
し(ステップS4201s)、残差パワー算出部(POW)411fは、残差信号e[n
]から残差パワーP[f]を算出する(ステップS4201e)。
エコー抑圧量推定部(ECLE)411iは、送話パワーP[f]と残差パワーP
[f]を入力として、エコーキャンセラ部(EC)110で抑圧されたエコー抑圧量EC
L[f]を推定する(ステップS4202)。
制御部(CTRL)411kは、エコー抑圧量ECL[f]を入力としてフレーム毎に
エコー抑圧量が十分であるか否かを判定し、制御情報EScontrol[f]を出力す
る。また、制御部(CTRL)411kは、受話パワーP[f]と送話パワーP[f
]に基づいて、受話信号抑圧部(SS)411rによって受話入力信号x[n]を抑圧す
るか、送話信号抑圧部(SS)411oによって送話信号(送話入力信号z[n]または
残差信号e[n])を抑圧するか判定し、状態情報ESstate[f]を出力する。(
ステップS4203)。
そして、信号選択部411Lは、制御情報EScontrol[f]を入力として、エ
コー抑圧量が十分でないと判定されたフレームについて、信号としてz[n]を選択して
出力し、エコー抑圧量が十分であると判定されたフレームでは信号としてe[n]を選択
して出力する(ステップS4204)。
エコー抑圧ゲイン算出部(GCAL)411nは、制御情報EScontrol[f]
とエコー抑圧量ECL[f]を入力として、エコー抑圧量が十分でないと検出されたフレ
ームと、それ以外のフレームとで、それぞれ異なる計算によってエコー抑圧ゲインG[f
]を算出して出力する(ステップS4205)。
送話信号抑圧部(SS)411oは、エコー抑圧ゲインG[f]と状態情報ESsta
te[f]を入力として、送話信号(送話入力信号z[n]または残差信号e[n])を
抑圧すると判定された場合に、信号選択部411Lで選択された信号とエコー抑圧ゲイン
算出部(GCAL)411nで算出されたエコー抑圧ゲインG[f]を用いて、信号を抑
圧して送話出力信号s’[n]として出力する。あるいは、送話信号を抑圧しないと判定
された場合は、信号選択部411Lで選択された信号を送話出力信号s’[n]として出
力する(ステップS4206s)。一方、受話信号抑圧部(SS)411rは、エコー抑
圧ゲインG[f]と状態情報ESstate[f]を入力として、受話入力信号x[n]
を抑圧すると判定された場合、受話信号x[n]に対してエコー抑圧ゲイン算出部(GC
AL)411nで算出されたエコー抑圧ゲインG[f]を用いて、信号を抑圧して受話出
力信号x’[n]として出力する。あるいは、受話入力信号x[n]を抑圧しないと判定
された場合は、受話信号x[n]を受話出力信号x’[n]として出力する(ステップS
4206r)。これにより、エコーサプレッサ処理が終了する。
以上、エコーサプレッサ部(ES)411は、時間領域型でフレーム毎に処理する方式
として動作するものとして説明した。FFTやフィルタバンクなどの帯域分割フィルタな
どを用いて周波数領域型に処理する方式で実現してもよい。
ダブルトーク中のエコーパスロス変動時では、エコーキャンセラ部(EC)110の処
理によって送話入力信号z[n]よりも残差信号e[n]が大きくなってしまい、エコー
キャンセラ部(EC)110の処理によるエコー抑圧量が十分でない場合がある。
以上説明した信号処理装置の動作により、エコーキャンセラ部(EC)110の処理に
よるエコー抑圧量が十分でない場合をエコー抑圧量推定部(ECLE)411iと制御部
(CTRL)411kで検出して、エコー抑圧ゲイン算出部(GCAL)411nと送話
信号抑圧部(SS)411oにおいてエコーキャンセラ部(EC)110のエコー抑圧量
を考慮することにより過剰な送話音声に対する抑圧を避けることができるので、エコーパ
スロス変動に対して頑健で高品質な信号を出力することができる。
(第5の実施形態)
第5の実施形態に係る信号処理装置が第1の実施形態に係る信号処理装置と異なる点は
、エコーリダクション部(ER)111を有さず、エコーリダクション部(ER)511
を有する点にある。一方、その他の部分は同じである。そこで、同じ部分については、同
じ符号を付してその説明を省略する。
図21に、本発明の第5の実施形態に係る信号処理装置のエコーリダクション部(ER
)511の構成を示すブロック図を示す。本発明の第5の実施形態に係る信号処理装置の
エコーリダクション部(ER)511が第1の実施形態に係る信号処理装置のエコーリダ
クション部(ER)111と異なる点を以下に説明する。なお、第1の実施形態に係るエ
コーリダクション部(ER)111及び第2の実施形態に係るノイズリダクション部(N
R)211と同じ部分については、同じ符号を付してその説明を省略する。
エコーリダクション部(NR)511は、周波数領域変換処理部(FT)111aと、
周波数領域変換処理部(FT)111bと、周波数領域変換処理部(FT)111cと、
受話パワー算出部(POW)111dと、送話パワー算出部(POW)111eと、残差
パワー算出部(POW)111fと、音響結合量推定部(ACLE)511gと、エコー
量推定部(ELE)511hと、エコー抑圧量推定部(ECLE)111iと、制御部(
CTRL)511kと、スペクトル選択部511Lと、ゲイン格納部(GTBL)111
m、エコー抑圧ゲイン算出部(GCAL)511nと、周波数領域逆変換処理部(IFT
)111pと、送話信号抑圧部(SS)511sと、残差信号抑圧部(ES)511tと
からなる。
エコーリダクション部(ER)511は、遅延処理部(DELAY)102から出力さ
れた遅延した受話入力信号x[n−D]と、ハイパスフィルタ部(HPF)109から出
力された送話入力信号z[n]と、信号減算処理部110bから出力された残差信号e[
n]とを入力とし、送話入力信号z[n]あるいは残差信号e[n]の少なくとも一方か
らエコー成分を抑圧し、そのエコー抑圧後の信号を送話出力信号s’[n](n=0,1
,・・・,N−1)として1フレームごとに出力する。
音響結合量推定部(ACLE)511gは、受話パワー算出部(POW)111dから
出力されたスムージングされた受話パワースペクトル|X[f,ω]|と、送話パワ
ー算出部(POW)111eから出力されたスムージングされた送話パワースペクトル|
s[f,ω]|と、残差パワー算出部(POW)111fから出力されたスムージン
グされた残差パワースペクトル|Es[f,ω]|とを入力とし、音響結合量|HZ[f
,ω]|及び|H[f,ω]|を、それぞれ式31−1、式31−2よって算出す
る。
Figure 2007060644
そして、音響結合量推定部(ACLE)511gは、以下の式32−1及び式32−2
が示すように1フレーム前の値を用いてスムージングした音響結合量|HZS[f,ω]
及び|HES[f,ω]|を算出して出力する。ただし、αHZ[ω]及びαHE
[ω]は、0.03〜0.99程度が望ましい。
Figure 2007060644
ここで、通話開始初期時、例えば通話開始から5秒間程度はαHZ[ω]及びαHE
ω]を大きくすることで音響結合量|HZS[f,ω]|及び|HES[f,ω]|
の更新を速めておく。このようにすることで通話開始初期時は音響結合量が初期化されて
いるので、通話開始初期時に抑圧量が少なくなってしまうのを防止することができる。
ただし、音響結合量が急激に変化する場合、即ち、不等式|HZ[f,ω]|>β
[ω]・|HZS[f−1,ω]|及び|H[f,ω]|>βEH[ω]・|H
ES[f−1,ω]|が成り立つ場合、及び受話入力信号が十分に大きくない場合、即
ち、不等式|X[f,ω]|<β[ω]が成り立つ場合には、エコーパス変動への
高速な追従性を保ちつつ、ダブルトークとなる周波数帯域での音響結合量の算出を行わな
いようにするため、音響結合量を更新しないで1フレーム前の過去の音響結合量|HZS
[f−1,ω]|及び|HES[f−1,ω]|を用いる。
極端な音響結合量の変化はダブルトークの可能性があるので、このように音響結合量を
更新しないでおくことで送話音質劣化を防止することができる。ただし、βZH[ω]及
びβEH[ω]は0.9〜30程度が望ましい。β[ω]は30dB〜40dB程度が
望ましい。
エコー量推定部(ELE)511hは、受話パワー算出部(POW)111dから出力
されたスムージングされた受話パワースペクトル|X[f,ω]|と、音響結合量推
定部(ACLE)511gから出力された音響結合量|HZS[f,ω]|及び|H
[f,ω]|とを入力とし、送話入力信号の周波数スペクトルZ[f,ω]に含まれ
る送話エコー量|Y[f,ω]|及び残差信号の周波数スペクトルE[f,ω]に含
まれる残差エコー量|Y[f,ω]|を、それぞれ以下の式33−1及び式33−2
が示すように周波数帯域ω毎に推定する。
Figure 2007060644
そして、エコー量推定部(ELE)511hは、瞬時のエコー量|Y[f,ω]|
及び|Y[f,ω]|を用いるよりもスムージングした値を用いた方がエコー抑圧後
の信号をより自然な信号にできるため、以下の式34−1及び式34−2が示すように1
フレーム前の値を用いてスムージングしたエコー量|YZS[f,ω]|及び|YES
[f,ω]|を周波数帯域ω毎に算出して出力する。ただし、αZY[ω]及びαEY
[ω]は0.7〜0.99程度が望ましい。
Figure 2007060644
制御部(CTRL)511kは、エコー抑圧量推定部(ECLE)111iから出力さ
れたエコー抑圧量ECL[f,ω]を入力とし、エコーキャンセラ部(EC)110のエ
コー抑圧量が十分でない周波数帯域であるか否かの情報である制御情報ERcontro
l[f,ω]を出力する。具体的には、制御部(CTRL)511kは、周波数帯域ω毎
にECL[f,ω]>β[ω]を満たした周波数帯域であり、かつ1フレーム当りの式
ECL[f,ω]>β[ω]が成立した帯域数countがβより大きい場合にエコ
ー抑圧量が少ないと判定する。ただし、β[ω]は+8dB〜−15dB程度、β
全周波数帯域数の10%〜40%程度が望ましい。本実施形態では以下、β[ω]を0
dBとして説明する。
エコー抑圧ゲイン算出部(GCAL)511nは、送話パワー算出部(POW)111
eから出力されたスムージングされた送話パワースペクトル|Z[f,ω]|と、残
差パワー算出部(POW)111fから出力されたスムージングされた残差パワースペク
トル|E[f,ω]|と、エコー量推定部(ELE)511hから出力されたスムー
ジングした送話エコー量|YZS[f,ω]|及びスムージングした残差エコー量|Y
ES[f,ω]|と、ゲイン格納部(GTBL)111mから出力されたパラメータγ
[ω]とを入力とし、送話エコー抑圧ゲインG[f,ω]及び残差エコー抑圧ゲインG
[f,ω]を算出して出力する。
具体的には、エコー抑圧ゲイン算出部(GCAL)511nは、送話エコー抑圧ゲイン
[f,ω]及び残差エコー抑圧ゲインG[f,ω]をウィナー・フィルタ(Wiener
Filter)法を用いて、以下に示す式35−1及び式35−2によって算出する。
Figure 2007060644
また、エコー抑圧ゲイン算出部(GCAL)511nは、過剰なエコー抑圧により送話
音質が劣化するのを防止し、背景雑音の断続的な抑圧を防止するため、送話エコー抑圧ゲ
インG[f,ω]及び残差エコー抑圧ゲインG[f,ω]が所定の下限値以下になら
ないように制御する。
さらに、エコー抑圧ゲイン算出部(GCAL)511nは、過剰なエコー抑圧により送
話音質が劣化するのを防止するため、送話入力信号z[n]あるいは残差信号e[n]の
有音区間ではない区間の信号レベルを用いて周波数帯域ごとに背景雑音レベルを算出して
おき、背景雑音レベルよりも抑圧しないように送話エコー抑圧ゲインG[f,ω]及び
残差エコー抑圧ゲインG[f,ω]を制御しても構わない。
さらにまた、エコー抑圧ゲイン算出部(GCAL)511nは、送話音質が劣化するの
を防止するために、エコー抑圧ゲインG[f,ω]を以下の式36−1あるいは式36
−2に示すように、そして、G[f,ω]を以下の式36−3あるいは式36−4に示
すように周波数方向にスムージングして出力してもよい。例えば、εは、[0.1、0
.2、0.4、0.2、0.1]、ηは、[0.1、0.2、0.4、0.8、0.4
、0.2、0.1]のようにしてよい。
Figure 2007060644
送話信号抑圧部(SS)511sは、周波数領域変換処理部(FT)111bから出力
された送話入力信号の周波数スペクトルZ[f,ω]と、エコー抑圧ゲイン算出部(GC
AL)511nから出力された送話エコー抑圧ゲインG[f,ω]とを入力として、送
話入力信号の周波数スペクトルのエコーを抑圧し、以下の式37が示すようにスペクトル
’[f,ω]を出力する。
Figure 2007060644
残差信号抑圧部(ES)511tは、周波数領域変換処理部(FT)111cから出力
された残差信号の周波数スペクトルE[f,ω]と、エコー抑圧ゲイン算出部(GCAL
)511nから出力された残差エコー抑圧ゲインG[f,ω]とを入力として、残差信
号の周波数スペクトルのエコーを抑圧し、以下のようにスペクトルS’[f,ω]を出
力する。
Figure 2007060644
スペクトル選択部511Lは、送話信号抑圧部(SS)511sから出力されたエコー
抑圧された送話入力信号の周波数スペクトルS’[f,ω]と、残差信号抑圧部(ES
)511tから出力されたエコー抑圧された残差信号の周波数スペクトルS’[f,ω
]と、制御部(CTRL)511kから出力されたエコーキャンセラ部(EC)110の
エコー抑圧量が十分でない周波数帯域であるか否かを示す情報である制御情報ERcon
trol[f,ω]とを入力とし、エコー抑圧された送話入力信号の周波数スペクトルS
’[f,ω]か、エコー抑圧された残差信号の周波数スペクトルS’[f,ω]のい
ずれか一方を周波数スペクトルとして選択して出力する。
具体的には、制御情報ERcontrol[f,ω]がエコーキャンセラ部(EC)1
10のエコー抑圧量が十分でないと検出された周波数帯域であった場合は、スペクトル選
択部511Lは、周波数スペクトルとしてS’[f,ω]を選択する。それ以外の周波
数帯域は周波数スペクトルとしてS’[f,ω]を選択する。
このようにすることで周波数帯域ごとに、エコーキャンセラ部(EC)110のエコー
抑圧量が十分でない場合、つまりエコーキャンセラ部(EC)110の推定精度が十分と
れない場合はエコーリダクション部(ER)511を単体で動作させることができる。
次に、上記のように構成された第5の実施形態に係る信号処理装置の処理の流れを説明
する。図22は、第5の実施形態に係る信号処理装置の全体の処理の流れを示すフローチ
ャートである。なお、図5を参照して説明した第1の実施形態に係る信号処理装置の動作
と同じ動作ステップについては、同じ符号を付してその部分の説明を省略する。
ステップS1005のエコーキャンセラ処理の後、信号処理装置は、第1の実施形態に
おいてはステップS1006でエコーリダクション処理を行ったのに代えて、第5の実施
形態においては、ステップS1005で得られたエコーキャンセラ処理後の信号を用いて
エコーリダクション処理を行う(ステップS5006)。そして、ステップS1007の
終話か否かの判断に移る。
第5の実施形態に係るエコーキャンセル部(EC)110は、第1の実施形態に係るエ
コーキャンセル部(EC)110と同じであるので、それぞれの実施形態における処理の
流れは、当然に同じであり説明を省略する。
図23は、第5の実施形態に係るエコーリダクション部(ER)511における処理の
流れを示すフローチャートである。なお、図7を参照して説明した第1の実施形態に係る
エコーリダクション部(ER)111及び図12を参照して説明した第2の実施形態に係
るノイズリダクション部(NR)211における動作と同じ動作ステップについては、同
じ符号を付してその部分の説明を省略する。
第5の実施形態に係るエコーリダクション部(ER)511は、エコーリダクション処
理を開始して、ステップS1203rの受話パワースペクトル算出処理、ステップS12
03sの送話パワースペクトル算出処理、及びステップS1203eの残差パワースペク
トル算出処理の後、音響結合量推定部(ACLE)511gは、スムージングされた受話
パワースペクトル|X[f,ω]|とスムージングされた送話パワースペクトル|Z
[f,ω]|を入力として音響結合量|HZS[f,ω]|を算出する(ステップ
S5204s)。同様に、音響結合量推定部(ACLE)511gは、スムージングされ
た受話パワースペクトル|X[f,ω]|とスムージングされた残差パワースペクト
ル|E[f,ω]|を入力として音響結合量|HES[f,ω]|を算出する(ス
テップS5204e)。
次に、エコー量推定部(ELE)511hは、音響結合量|HZS[f,ω]|とス
ムージングした受話パワースペクトル|X[f,ω]|とを入力として送話エコー量
|YZS[f,ω]|を推定する(ステップS5205s)。同様に、エコー量推定部
(ELE)511hは、音響結合量|HES[f,ω]|とスムージングした受話パワ
ースペクトル|X[f,ω]|とを入力として残差エコー量|YES[f,ω]|
を推定する(ステップS5205e)。
そして、エコー抑圧ゲイン算出部(GCAL)511nは、エコー量推定部(ELE)
511hから出力された送話エコー量|YZS[f,ω]|と、送話パワー算出部(P
OW)111eから出力されたスムージングされた送話パワースペクトル|Z[f,ω
]|とを入力として、送話エコー抑圧ゲインG[f,ω]を算出し、所定の下限値以
下にならないように制御する(ステップS1208s)。
同様に、エコー抑圧ゲイン算出部(GCAL)511nは、エコー量推定部(ELE)
511hから出力された残差エコー量|YES[f,ω]|と、残差パワー算出部(P
OW)111fから出力されたスムージングされた残差パワースペクトル|E[f,ω
]|とを入力として、残差エコー抑圧ゲインG[f,ω]を算出し、所定の下限値以
下にならないように制御する(ステップS1208e)。
その後、送話信号抑圧部(SS)511sは、周波数領域変換処理部(FT)111b
から出力された送話入力信号の周波数スペクトルZ[f,ω]と、エコー抑圧ゲイン算出
部(GCAL)511nで算出された送話エコー抑圧ゲインG[f,ω]を入力として
、送話入力信号の周波数スペクトルのエコーを抑圧する(ステップS5210s)。
同様に、残差信号抑圧部(ES)511tは、周波数領域変換処理部(FT)111c
から出力された残差信号の周波数スペクトルE[f,ω]と、エコー抑圧ゲイン算出部(
GCAL)511nで算出された残差エコー抑圧ゲインG[f,ω]を入力として、残
差信号の周波数スペクトルのエコーを抑圧する(ステップS5210e)。
次に、ステップS1206のエコー抑圧量算出処理及びステップS2207の判定処理
の後、スペクトル選択部511Lは、送話信号抑圧部(SS)511sから出力されたエ
コー抑圧された送話入力信号の周波数スペクトルS’[f,ω]と、残差信号抑圧部(
ES)511tから出力されたエコー抑圧された残差信号の周波数スペクトルS’[f
,ω]と、制御部(CTRL)511kから出力された制御情報ERcontrol[f
,ω]とを入力とし、エコー抑圧量が十分でないと検出された周波数帯域では、エコー抑
圧された送話入力信号の周波数スペクトルS’[f,ω]を周波数スペクトルとして選
択して出力し、それ以外の周波数帯域ではエコー抑圧された残差信号の周波数スペクトル
’[f,ω]を周波数スペクトルとして選択して出力する(ステップS5209)。
そして、ステップS1211の周波数逆変換処理に移って、エコーリダクション処理が
終了する。
以上、エコーリダクション部(ER)511はFFTによる周波数領域型で周波数帯域
毎に処理する方式として動作するものとして説明した。FFTによる周波数帯域をグルー
プでまとめて周波数帯域グループ毎に処理する方式や、フィルタバンクなどの帯域分割フ
ィルタなどの周波数領域型を実現してもよい。
ダブルトーク中のエコーパスロス変動時では、エコーキャンセラ部(EC)110の処
理によって送話入力信号z[n]よりも残差信号e[n]が大きくなってしまい、エコー
キャンセラ部(EC)110の処理によるエコー抑圧量が十分でない場合がある。
以上説明した信号処理装置の動作により、エコーキャンセラ部(EC)110の処理に
よるエコー抑圧量が十分でない周波数領域をエコー抑圧量推定部(ECLE)111iと
制御部(CTRL)511kで判定して、スペクトル選択部511Lとエコー抑圧ゲイン
算出部(GCAL)511nにおいて周波数帯域毎にエコーキャンセラ部(EC)110
の処理とエコーリダクション部(ER)511の処理の重みを変化させるように制御する
ことができるので、エコーパスロス変動に対して頑健にすることが可能であり、高品質な
信号を出力することが可能である。
また、エコーリダクション部(ER)511の音響結合量推定部(ACLE)511g
とエコー量推定部(ELE)511hにおいて、送話入力信号z[n]に含まれるエコー
量と残差信号e[n]に含まれるエコー量を別々に推定し、エコー抑圧ゲイン算出部(G
CAL)511nにおいて別々にエコー抑圧ゲインを算出し、送話信号抑圧部(SS)5
11s及び残差信号抑圧部(ES)511tにおいて別々に抑圧しているため、過剰なエ
コー抑圧を防止し送話音質が劣化するのを防止することが可能である。
(第6の実施形態)
図24は、第6の実施形態に係る信号処理装置の構成を示すブロック図である。この信
号処理装置が第1の実施形態に係る信号処理装置と異なる点は、図24に示すようにエコ
ーキャンセラ部(EC)110とエコーリダクション部(ER)111を有さず、エコー
キャンセラ部(EC)610とエコーリダクション部(ER)611を有し、エコーリダ
クション部(ER)611の外部にエコー抑圧量推定部(ECLE)612を有する点に
あり、その他の部分は同じである。
そこで、第1の実施形態に係る信号処理装置と同じ部分については、同じ符号を付して
その説明を省略する。なお、このエコーリダクション部(ER)611で、第1の実施形
態に係るエコーリダクション部(ER)111と同じ部分については、同じ符号を付して
その説明を省略する。
図25は、エコーキャンセラ部(EC)610の構成を示すブロック図である。このエ
コーキャンセラ部(EC)610は、周波数領域変換処理部(FT)610d、周波数領
域適応フィルタ部(FDADF)610e、周波数領域逆変換処理部(IFT)610f
、信号減算処理部610g、周波数領域変換処理部(FT)610h、周波数領域ダブル
トーク検出部(FDDTD)610iからなる。
図26は、エコーリダクション部(ER)611の構成を示すブロック図である。この
エコーリダクション部(ER)611は、周波数領域変換処理部(FT)111aと、周
波数領域変換処理部(FT)111bと、周波数領域変換処理部(FT)111cと、受
話パワー算出部(POW)111dと、送話パワー算出部(POW)111eと、音響結
合量推定部(ACLE)611gと、エコー量推定部(ELE)111hと、周波数領域
ダブルトーク検出部(FDTD)611jと、制御部(CTRL)611kと、スペクト
ル選択部111Lと、ゲイン格納部(GTBL)111mと、エコー抑圧ゲイン算出部(
GCAL)611nと、信号抑圧部(SS)111oと、周波数領域逆変換処理部(IF
T)111pと、送話出力パワー算出部(POW)611uとからなる。
図27は、音響結合量推定部(ACLE)611gの構成を示すブロック図である。こ
の音響結合量推定部(ACLE)611gは、音響結合量推定部(CACL)611g1
と、音響結合量補正部(ADJ)611g2と、音響結合量平滑部(SMACL)611
g3とからなる。
上記のように構成された、本発明の第6の実施形態に係る信号処理装置の各部の動作を
、図24〜図27を参照して説明する。
エコーキャンセラ部(EC)610は、ハイパスフィルタ部(HPF)109から出力
された送話入力信号z[n]と、遅延処理部(DELAY)102から出力された遅延し
た受話入力信号x[n−D]を入力とし、オーバーラップ保存法(Overlap-Save Method
)、あるいはオーバーラップ加算法(Overlap-Add Method)に基づき、送話入力信号z[
n]からエコー成分を抑圧し、そのエコー抑圧後の信号を残差信号e[n](n=0,1
,・・・,N−1)として出力し、またフィルタ係数HFDAF[f,ω]及びエコーパ
スロスの推定値λFDAF[f,ω]を出力する。
周波数領域変換処理部(FT)610dは、遅延処理部(DELAY)102から出力
された遅延した受話入力信号x[n−D]を入力とし、FFT(Fast Fourier Transform
)などによって周波数領域に変換して、受話入力信号の周波数スペクトルXFDAF[f
,ω]を算出して出力する。このとき適宜、オーバーラップ保存法(Overlap-Save Metho
d)、あるいはオーバーラップ加算法(Overlap-Add Method)に基づき、ハミング窓など
による窓掛けや、過去のフレームを用いたり零補間したりオーバーラップを行う。
周波数領域適応フィルタ部(FDADF)610eは、フィルタ係数HFDAF[f,
ω]が可変のトランスバーサルフィルタ(Transversal Filter)で構成される周波数領域
の適応フィルタである。また、周波数領域適応フィルタ部(FDADF)610eは、周
波数領域変換処理部(FT)610dから出力された受話入力信号の周波数スペクトルX
FDAF[f,ω]と、周波数領域変換処理部(FT)610hから出力された1フレー
ム前の残差信号の周波数スペクトルEFDAF[f−1,ω]と、周波数領域ダブルトー
ク検出部(FDDTD)610iから出力されたダブルトーク情報ECstate[f,
ω]とを入力とし、ダブルトーク情報ECstate[f,ω]がダブルトーク状態でな
かった場合はフィルタ係数HFDAF[f,ω]をフレームf及び周波数帯域ωごとに適
応学習し、ダブルトーク情報ECstate[f,ω]がダブルトーク状態であった場合
は適応学習を行わない。このようにしてフィルタ係数HFDAF[f,ω]を算出して出
力する。
また、周波数領域適応フィルタ部(FDADF)610eは、周波数領域変換処理部(
FT)610dから出力された受話入力信号の周波数スペクトルXFDAF[f,ω]と
、フィルタ係数HFDAF[f,ω]とを用いて擬似エコー信号の周波数スペクトルY’
FDAF[f,ω]をY’FDAF[f,ω]=HFDAF[f,ω]・XFDAF[f
,ω]として算出して出力する。
周波数領域適応フィルタ部(FDADF)610eは、フィルタ係数HFDAF[f,
ω]の更新幅を制御する固定あるいは可変のステップサイズμF[f,ω]を用いて、適
応学習を行う。
また、周波数領域適応フィルタ部(FDADF)610eは、例えばLMS(Least-Me
an-Square)アルゴリズム、NLMS(Normalized-Least-Mean-Square)アルゴリズム、
学習同定法、アフィン射影(AP:Affine-Projection)アルゴリズム、逐次最小二乗(
RLS:Recursive-Least-Squares)アルゴリズムなどの線形適応アルゴリズムに基づく
適応フィルタや勾配制限型学習同定法(Gradient-limited Normalized-Least-Mean-Squar
e)、適応ボルテラフィルタ(Adaptive Volterra Filter)などの非線形適応アルゴリズ
ムに基づく適応フィルタで構成される。また、本実施形態では勾配拘束のない(gradient
unconstrained)周波数領域型適応フィルタの例を示しているが、勾配拘束のある(grad
ient constrained)周波数領域型適応フィルタで構成してもよい。
周波数領域逆変換処理部(IFT)610fは、周波数領域適応フィルタ部(FDAD
F)610eから出力された擬似エコー信号の周波数スペクトルY’FDAF[f,ω]
を入力とし、IFFT(Inverse Fast Fourier Transform)などによって擬似エコー信号
y’FDAF[n](n=0,1,・・・,N−1)を算出して出力する。このとき適宜
、オーバーラップ保存法(Overlap-Save Method)あるいはオーバーラップ加算法(Overl
ap-Add Method)に基づき、過去のフレームを用いたり零補間したりオーバーラップを戻
したりする処理を行う。
信号減算処理部610gは、ハイパスフィルタ部(HPF)109から出力された送話
入力信号z[n]と、周波数領域逆変換処理部(IFT)610fから出力された擬似エ
コー信号y’FDAF[n]とを入力とし、送話入力信号z[n]から擬似エコー信号y
FDAF[n]をサンプルnごとに減算し、エコー成分を抑圧し、そのエコー抑圧後の
信号である残差信号e[n]を算出して出力する。
周波数領域変換処理部(FT)610hは、信号減算処理部610gから出力された時
間領域の残差信号e[n]を入力として、FFT(Fast Fourier Transform)などによっ
て周波数領域に変換して、残差信号の周波数スペクトルEFDAF[f,ω]を算出して
出力する。このとき適宜、オーバーラップ保存法(Overlap-Save Method)、あるいはオ
ーバーラップ加算法(Overlap-Add Method)に基づき、ハミング窓などによる窓掛けや、
過去のフレームを用いたり零補間したりオーバーラップを行う。
周波数領域ダブルトーク検出部(FDDTD)610iは、周波数領域変換処理部(F
T)610dから出力された受話信号の周波数スペクトルXFDAF[f,ω]と、周波
数領域変換処理部(FT)610hから出力された1フレーム前の残差信号の周波数スペ
クトルEFDAF[f−1,ω]とを、入力とし、フレームf及び周波数帯域ωごとにダ
ブルトーク状態か否かを判定し、ダブルトーク状態か否かを示す情報であるダブルトーク
情報ECstate[f,ω]と、エコーパスロスの推定値であるλFDAF[f,ω]
を算出して出力する。
具体的には、まず周波数領域ダブルトーク検出部(FDDTD)610iは、受話信号
のパワースペクトル|XFDAF[f,ω]|と1フレーム前の残差信号のパワースペ
クトル|EFDAF[f−1,ω]|とをフレームf及び周波数帯域ωごとに算出する
。そして、不等式|EFDAF[f−1,ω]|>λFDAF[f,ω]・|XFDA
[f,ω]|が成り立つ場合にダブルトーク状態と判定する。ここでλFDAF[f
,ω]は、エコーパスロスの推定値であり、適応学習が進めば小さくなり、適応学習が間
違っていれば大きくなる可変量である。また、λFDAF[f,ω]は、フィルタ係数H
FDAF[f,ω]を適応学習したフレームf及び周波数帯域ωごとに更新して算出する
この場合、エコーキャンセラ部(EC)610は、フィルタ係数HFDAF[f,ω]
、ステップサイズμF[f,ω]、エコーパスロスの推定値λFDAF[f,ω]、ダブ
ルトーク情報ECstate[f,ω]、受話信号のパワースペクトル|XFDAF[f
,ω]|、残差信号のパワースペクトル|EFDAF[f,ω]|を内部状態として
メモリに保持している。
エコー抑圧量推定部(ECLE)612は、周波数領域適応フィルタ部(FDADF)
610eから出力されるフィルタ係数HFDAF[f,ω]と、周波数領域ダブルトーク
検出部(FDDTD)610iから出力されるエコーパスロスの推定値λFDAF[f,
ω]とを入力とし、エコーキャンセラ部(EC)610で抑圧されたエコー抑圧量ECL
[f,ω]を周波数帯域ω毎に推定して出力する。具体的には、ダブルトーク状態でない
場合に|EFDAF[f,ω]|を|EFDAF[f,ω]|=λFDAF[f,ω
]・|XFDAF[f,ω]|のように近似し、送話入力信号のパワースペクトル|Y
FDAF[f,ω]+EFDAF[f,ω]|との比をエコー抑圧量ECL[f,ω
]として、以下に示す式39のように算出する。
Figure 2007060644
エコーリダクション部(ER)611は、受話信号x[n]及び送話入力信号z[n]
及び残差信号e[n]に基づいてエコー成分を抑圧するものであって、そのエコー抑圧後
の信号を送話出力信号s’[n](n=0,1,・・・,N−1)として出力する。
音響結合量推定部(ACLE)611gは、受話パワー算出部(POW)111dから
出力されたスムージングされた受話パワースペクトル|X[f,ω]|と、送話パワ
ー算出部(POW)111eから出力されたスムージングされた送話パワースペクトル|
[f,ω]|と、エコー抑圧量推定部(ECLE)612から出力されたエコー抑
圧量ECL[f,ω]と、周波数領域ダブルトーク検出部(FDTD)611jから出力
された周波数領域ダブルトーク情報ERstate[f,ω]と、エコー量推定部(EL
E)111hから出力された1フレーム前のエコー量|Y[f−1,ω]|とを入力
とし、スムージングした補正音響結合量|H[f,ω]|を算出して出力する。
音響結合量推定部(CACL)611g1は、受話パワー算出部(POW)111dか
ら出力されたスムージングされた受話パワースペクトル|X[f,ω]|と、送話パ
ワー算出部(POW)111eから出力されたスムージングされた送話パワースペクトル
|Z[f,ω]|とを入力とし、エコーキャンセラ部(EC)610の性能の影響を
受けないように残差信号に基づく|E[f,ω]|を用いずに送話入力信号に基づく
|Z[f,ω]|を用いて、周波数帯域ω毎に音響結合量|H[f,ω]|を以下
に示す式40のように算出して出力する。
Figure 2007060644
音響結合量補正部(ADJ)611g2は、音響結合量推定部(CACL)611g1
から出力された音響結合量|H[f,ω]|と、エコー抑圧量推定部(ECLE)61
2から出力されたエコー抑圧量ECL[f,ω]と、送話パワー算出部(POW)111
eから出力されたスムージングされた送話パワースペクトル|Z[f,ω]|と、エ
コー量推定部(ELE)111hから出力された1フレーム前のエコー量|Y[f−1
,ω]|とを入力とし、エコー抑圧量ECL[f,ω]に基づいて音響結合量|H[f
,ω]|を補正した補正音響結合量|H’[f,ω]|を算出して出力する。
具体的には、音響結合量補正部(ADJ)611g2は、まず以下のようにエコーキャ
ンセラ部(EC)610で抑圧されたエコー抑圧量が十分であるか判定を行う。周波数帯
域ω毎に、不等式ECL[f,ω]>βACL[ω]が成立した1フレーム当りの帯域数
countも加味し、ECL[f,ω]>βACL[ω]かつcount>βCACL
なる周波数帯域をエコーキャンセラ部(EC)610のエコー抑圧量が十分でないと判定
する。ただし、βACL[ω]は+8dB〜−35dB程度が、βCACLは全周波数帯
域数の10%〜40%程度が望ましい。本実施形態では以下、βACL[ω]を0dBと
して説明する。
エコー抑圧量が十分であると判定された周波数帯域について、音響結合量補正部(AD
J)611g2は、1フレーム前のエコー量|Y[f−1,ω]|よりも送話パワー
スペクトル|Z[f,ω]|が大きい場合にのみ、以下に示す式41のように音響結
合量|H[f,ω]|を補正し、補正音響結合量|H’[f,ω]|を算出する。
Figure 2007060644
上記の条件が満たされない場合、またエコーキャンセラ部(EC)610のエコー抑圧
量が十分でないと判定された周波数帯域では、音響結合量補正部(ADJ)611g2は
、|H’[f,ω]|=|H[f,ω]|として補正を行わない。
音響結合量平滑部(SMACL)611g3は、音響結合量補正部(ADJ)611g
2から出力された補正音響結合量|H’[f,ω]|と、周波数領域ダブルトーク検出
部(FDTD)611jから出力された周波数領域ダブルトーク情報ERstate[f
,ω]とを入力として、以下に示す式42のように1フレーム前の値を用いてスムージン
グした|H[f,ω]|を算出して出力する。ただし、α[ω]は、0.03〜0
.99程度が望ましい。
Figure 2007060644
ここで、音響結合量平滑部(SMACL)611g3は、通話開始初期時、例えば通話
開始から5秒間程度はα[ω]を大きくすることで音響結合量|H[f,ω]|
更新を速めておく。このようにすることで通話開始初期時は音響結合量が初期化されてい
るので、通話開始初期時に抑圧量が少なくなってしまうのを防止することができる。
ただし、周波数領域ダブルトーク検出部(FDTD)611jから出力された周波数領
域ダブルトーク情報ERstate[f,ω]によりダブルトーク状態であると判定され
る場合、音響結合量が急激に変化する場合、即ち、不等式|H[f,ω]|>β
ω]・|H[f−1,ω]|が成り立つ場合、及び受話信号が十分に大きくない場合
、即ち、不等式|X[f,ω]|<β[ω]が成り立つ場合には、エコーパス変動
への高速な追従性を保ちつつ、ダブルトークとなる周波数帯域での音響結合量の算出を行
わないようにするため、音響結合量平滑部(SMACL)611g3は、音響結合量を更
新しないで1フレーム前の過去の音響結合量|H[f−1,ω]|を用いる。
極端な音響結合量の変化はダブルトークの可能性があるので、このように音響結合量を
更新しないでおくことで送話音質劣化を防止することができる。ただし、β[ω]は0
.9〜30程度が望ましい。β[ω]は30dB〜40dB程度が望ましい。
周波数領域ダブルトーク検出部(FDTD)611jは、受話パワー算出部(POW)
111dから出力されたスムージングされた受話パワースペクトル|X[f,ω]|
と、送話出力パワー算出部(POW)611uから出力された1フレーム前のスムージン
グされた送話出力パワースペクトル|S’[f−1,ω]|とを入力とし、ダブルト
ーク状態か否かを示す情報を周波数領域ダブルトーク情報ERstate[f,ω]を算
出して出力する。具体的には、周波数領域ダブルトーク検出部(FDTD)611jは、
不等式|S’[f−1,ω]|>λER[f,ω]・|X[f,ω]|が成り立つ
場合にダブルトーク状態と判定する。
ここでλER[f,ω]は、エコーパスロスの推定値であり、音響結合量|H[f,ω
]|を更新したフレームf及び周波数帯域ωごとに更新し、音響結合量|H[f,ω
]|の更新が進めば小さくなり、音響結合量|H[f,ω]|の更新が進まなけれ
ば大きくなる可変量である。
制御部(CTRL)611kは、エコー抑圧量推定部(ECLE)612から出力され
たエコー抑圧量ECL[f,ω]と、周波数領域ダブルトーク検出部(FDTD)611
jから出力された周波数領域ダブルトーク情報ERstate[f,ω]とを入力とし、
周波数帯域ω毎にダブルトーク状態かつエコーキャンセラ部(EC)610のエコー抑圧
量が十分でない周波数帯域を検出して、ダブルトーク状態かつエコーキャンセラ部(EC
)610のエコー抑圧量が十分でない周波数帯域であるか否かを示す情報である制御情報
ERcontrol[f,ω]を出力する。
まず、制御部(CTRL)611kは、周波数帯域ω毎に周波数領域ダブルトーク検出
部(FDTD)611jでダブルトーク状態であると判定されているか否かによって周波
数帯域ω毎にダブルトーク状態であるか否かを判定する。
次に、制御部(CTRL)611kは、周波数帯域ω毎に不等式ECL[f,ω]>β
[ω]が成り立ち、かつ不等式count>βが成り立つ場合に周波数帯域をエコー
キャンセラ部(EC)610のエコー抑圧量が少ないと判定する。ただし、countは
1フレーム当りの式ECL[f,ω]>β[ω]が成立した帯域数であり、β[ω]
は+8dB〜−15dB程度、βは全周波数帯域数の10%〜40%程度が望ましい。
本実施形態では以下、β[ω]=2.5(+8dB)として説明する。
エコー抑圧ゲイン算出部(GCAL)611nは、送話パワー算出部(POW)111
eから出力されたスムージングされた送話パワースペクトル|Z[f,ω]|と、エ
コー量推定部(ELE)111hから出力されたスムージングしたエコー量|Y[f,
ω]|と、エコー抑圧量推定部(ECLE)612から出力されたエコー抑圧量ECL
[f,ω]と、制御部(CTRL)611kから出力された制御情報ERcontrol
[f,ω]と、ゲイン格納部(GTBL)111mから出力されたパラメータγ[ω]と
を入力とし、スムージングされたエコー抑圧ゲインG[f,ω]を算出して出力する。
具体的には、エコー抑圧ゲイン算出部(GCAL)611nは、制御情報ERcont
rol[f,ω]からダブルトーク状態かつエコーキャンセラ部(EC)610のエコー
抑圧量が十分でないと検出された周波数帯域については、エコー抑圧ゲインG[f,ω]
をウィナー・フィルタ(Wiener Filter)法を用いて、式43によって算出する。
Figure 2007060644
それ以外の周波数帯域では、エコーキャンセラ部(EC)610のエコー抑圧量が十分
であり、エコーキャンセラ部(EC)610が正常に機能していると見なして、エコー抑
圧ゲイン算出部(GCAL)611nは、エコーリダクション部(ER)611のエコー
抑圧量を多くするように、エコーキャンセラ部(EC)610のエコー抑圧量ECL[f
,ω]を引数とした不等式0≦F(ECL[f,ω])≦1を満たす関数F(ECL[f
,ω])を用いて補正し、エコー抑圧ゲインG[f,ω]を以下に示す式44のように算
出する。
Figure 2007060644
ここで関数F(ECL[f,ω])は、以下のようにする。ただし、δは周波数帯域
数を考慮した正値にしておくことが望ましい。
0≦ECL[f,ω]≦1のとき 式45−1により、
1≦ECL[f,ω]≦β[ω]のとき 式45−2により、
β[ω]≦ECL[f,ω]のとき 式45−3あるいは式45−4による。
Figure 2007060644
このように抑圧ゲインの補正ゲインとしての関数F(ECL[f,ω])を不等式0≦
F(ECL[f,ω])≦1を満たすように設定することで、補正後の抑圧ゲインが不自
然な値になることを防ぐことができ、送話音質の劣化を防ぐことができる。また、このよ
うに関数F(ECL[f,ω])を非線形な関数にすることで、エコーキャンセラ部(E
C)610のエコー抑圧量が十分でない場合(β[ω]≦ECL[f,ω])に抑圧量
が大きくなるようにゲインを補正することができる。
また、エコー抑圧ゲイン算出部(GCAL)611nは、過剰なエコー抑圧により送話
音質が劣化するのを防止し、背景雑音の断続抑圧を防止するため、抑圧ゲインG[f,ω
]は所定の下限値以下にならないように制御する。
さらに、過剰なエコー抑圧により送話音質が劣化するのを防止するため、エコー抑圧ゲ
イン算出部(GCAL)611nは、送話入力信号z[n]あるいは残差信号e[n]の
有音区間ではない区間の信号レベルを用いて周波数帯域ごとに背景雑音レベルを算出して
おき、背景雑音レベルよりも抑圧しないようにエコー抑圧ゲインを制御しても構わない。
さらにまた、エコー抑圧ゲイン算出部(GCAL)611nは、送話音質が劣化するの
を防止するために、エコー抑圧ゲインG[f,ω]を以下の式46−1あるいは式46−
2が示すように周波数方向にスムージングして出力してもよい。例えば、εは、[0.
1,0.2,0.4,0.2,0.1]、ηは、[0.1,0.2,0.4,0.8,
0.4,0.2,0.1]のようにしてよい。
Figure 2007060644
送話出力パワー算出部(POW)611uは、信号抑圧部(SS)111oから出力さ
れた送話出力信号の周波数スペクトルS’[f,ω]を入力とし、そのパワースペクトル
である送話出力パワースペクトル|S’[f,ω]|を算出し、以下に示す式47のよ
うに1フレーム前の値|S’[f−1,ω]|を用いてスムージングした送話出力パ
ワースペクトル|S’[f,ω]|を算出して出力する。ただし、α[ω]は、0
.75〜0.999程度が望ましい。
Figure 2007060644
次に、上記のように構成された第6の実施形態に係る信号処理装置の処理の流れを説明
する。図28は、第6の実施形態に係る信号処理装置の全体の処理の流れを示すフローチ
ャートである。なお、図5を参照して説明した第1の実施形態に係る信号処理装置の動作
と同じ動作ステップについては、同じ符号を付してその部分の説明を省略する。
ステップS1004の遅延処理の後、遅延した受話入力信号x[n−D]とオフセット
除去された送話入力信号z[n]を入力として、エコーキャンセラ部(EC)610はエ
コーキャンセラ処理を行う(ステップS6005)。
次に、エコー抑圧量推定部(ECLE)612は、周波数領域適応フィルタ部(FDA
DF)610eから出力されるフィルタ係数HFDAF[f,ω]と、周波数領域ダブル
トーク検出部(FDDTD)610iから出力されるエコーパスロスの推定値λFDAF
[f,ω]とを入力とし、エコーキャンセラ部(EC)610で抑圧されたエコー抑圧量
ECL[f,ω]を推定する(ステップS6008)。
そして、遅延した受話入力信号x[n−D]と、オフセット除去された送話入力信号z
[n]と、エコーキャンセラ部(EC)610から出力されたエラーキャンセラ処理後の
信号である残差信号e[n]を入力として、エコーリダクション部(ER)611は非線
形エコー抑圧処理であるエコーリダクション処理を行う(ステップS6006)。そして
、ステップS1007の終話か否かの判断に移る。
図29は、第6の実施形態に係るエコーキャンセラ部(EC)610における処理の流
れを示すフローチャートである。
エコーキャンセラ部(EC)610の処理は、次のように行われる。まず、受話入力信
号x[n−D]を周波数領域に変換して、受話入力信号の周波数スペクトルXFDAF
f,ω]を算出し、残差信号e[n]を周波数領域に変換して、残差信号の周波数スペク
トルEFDAF[f,ω]を算出する。次に、周波数領域ダブルトーク検出部(FDDT
D)610iが受話信号の周波数スペクトルXFDAF[f,ω]と、1フレーム前の残
差信号の周波数スペクトルEFDAF[f−1,ω]とを用いて、周波数領域ダブルトー
ク検出処理を行う(ステップS6101)。そして、周波数領域適応フィルタ部(FDA
DF)610eはダブルトーク情報ECstate[f,ω]の制御を受けながら、受話
信号の周波数スペクトルXFDAF[f,ω]と、1フレーム前の残差信号の周波数スペ
クトルEFDAF[f−1,ω]とを用いて周波数領域適応フィルタ処理を行う(ステッ
プS6102)。次に、擬似エコー信号の周波数スペクトルY’FDAF[f,ω]を周
波数領域逆変換して、擬似エコー信号y’FDAF[n]を算出する。そして、信号減算
処理部610gは、送話入力信号z[n]から、周波数領域適応フィルタ部(FDADF
)610eから出力された擬似エコー信号y’FDAF[n]を減算し、残差信号e[n
]を算出して出力、エコーキャンセラ処理が終了する。
図30は、第6の実施形態に係るエコーリダクション部(ER)611における処理の
流れを示すフローチャートである。なお、図7を参照して説明した第1の実施形態に係る
エコーリダクション部(ER)111における動作と同じ動作ステップについては、同じ
符号を付してその部分の説明を省略する。
第6の実施形態に係るエコーリダクション部(ER)611は、ステップS1203e
の残差パワースペクトル算出処理の動作はない。
即ち、第6の実施形態に係るエコーリダクション部(ER)611は、エコーリダクシ
ョン処理を開始して、ステップS1203rの受話パワースペクトル算出処理、ステップ
S1203sの送話パワースペクトル算出処理、及びステップS1202eの残差周波数
変換処理の後、周波数領域ダブルトーク検出部(FDTD)611jは、ダブルトーク状
態か否かの情報である周波数領域ダブルトーク情報ERstate[f,ω]を算出して
出力し、音響結合量推定部(ACLE)611gは、スムージングされた受話パワースペ
クトル|X[f,ω]|と、スムージングされた送話パワースペクトル|Z[f,
ω]|と、エコー抑圧量推定部(ECLE)612から出力されたエコー抑圧量ECL
[f,ω]と、周波数領域ダブルトーク情報ERstate[f,ω]とに基づいてスム
ージングした補正音響結合量|H[f,ω]|を算出する(ステップS6204)。
その後ステップS1205でエコーレベル算出処理を行った後、制御部(CTRL)6
11kは、エコー抑圧量ECL[f,ω]と、周波数領域ダブルトーク情報ERstat
e[f,ω]とを入力とし、周波数帯域ω毎にダブルトーク状態かつエコーキャンセラ部
(EC)110のエコー抑圧量が十分でない周波数帯域を検出して、制御情報ERcon
trol[f,ω]を出力する(ステップS6207)。
次に、エコー抑圧ゲイン算出部(GCAL)611nは、スムージングされた送話パワ
ースペクトル|Z[f,ω]|と、エコー量|Y[f,ω]|と、エコー抑圧量
ECL[f,ω]と、制御情報ERcontrol[f,ω]と、パラメータγ[ω]と
を入力とし、エコー抑圧ゲインG[f,ω]を算出して出力する(ステップS6208)
その後ステップS1209でスペクトル選択処理、ステップS1210で送話信号抑圧
処理を行った後、送話出力パワー算出部(POW)611uは、送話出力パワースペクト
ルを算出する(ステップS6203ss)。そして、ステップS1211の周波数逆変換
処理に移って、エコーリダクション処理が終了する。
上記では、エコーキャンセラ部(EC)610は、本実施形態ではオーバーラップ保存
法(Overlap-Save Method)、あるいはオーバーラップ加算法(Overlap-Add Method)に
基づいた周波数領域型適応フィルタの例を示しているが、巡回畳み込み法(Circular-Con
volution Method)に基づいた周波数領域型適応フィルタで構成してもよい。
また上記では、エコーリダクション部(ER)611はFFTによる周波数領域型で周
波数帯域毎に処理する方式として動作するものとして説明した。FFTによる周波数帯域
をグループでまとめて周波数帯域グループ毎に処理する方式や、フィルタバンクなどの帯
域分割フィルタなどの周波数領域型を実現してもよい。
以上説明した信号処理装置の動作により、エコーキャンセラ部(EC)610の処理に
よるエコー抑圧量が十分でない周波数領域をエコー抑圧量推定部(ECLE)612と制
御部(CTRL)611kで判定して、スペクトル選択部111Lとエコー抑圧ゲイン算
出部(GCAL)611nにおいて周波数帯域毎にエコーキャンセラ部(EC)610の
処理とエコーリダクション部(ER)611の処理の重みを変化させるように制御するこ
とができるので、エコーパスロス変動に対して頑健にすることが可能であり、高品質な信
号を出力することが可能である。
(第6の実施形態の変形例)
図31は、本発明の第6の実施形態の変形例に係る信号処理装置のエコーリダクション
部(ER)6112の構成を示すブロック図である。この第6の実施形態に係るエコーリ
ダクション部(ER)6112が第6の実施形態に係るエコーリダクション部(ER)6
11と異なる点は、音響結合量推定部(ACLE)611gを有さず、音響結合量推定部
(ACLE)611g−2を有する点にあり、その他の部分は同じである。そこで、同じ
部分については、同じ符号を付してその説明を省略する。
図32は、第6の実施形態の変形例に係る音響結合量推定部(ACLE)611g−2
の構成を示すブロック図である。この音響結合量推定部(ACLE)611g−2は、音
響結合量推定部(CACL)611g1−2と、音響結合量平滑部(SMACL)611
g3−2と、音響結合量補正部(ADJ)611g2−2とからなる。
音響結合量推定部(CACL)611g1−2は、受話パワー算出部(POW)111
dから出力されたスムージングされた受話パワースペクトル|X[f,ω]|と、送
話パワー算出部(POW)111eから出力されたスムージングされた送話パワースペク
トル|Z[f,ω]|と、周波数領域ダブルトーク検出部(FDTD)611jから
出力された周波数領域ダブルトーク情報ERstate[f,ω]とを入力とし、エコー
キャンセラ部(EC)610の性能の影響を受けないように残差信号に基づく|E[f
,ω]|を用いずに送話入力信号に基づく|Z[f,ω]|を用いて、周波数帯域
ω毎に音響結合量|H[f,ω]|を以下に示す式48のように算出して出力する。
Figure 2007060644
ただし、周波数領域ダブルトーク検出部(FDTD)611jから出力された周波数領
域ダブルトーク情報ERstate[f,ω]によりダブルトーク状態であると判定され
たことが示されている場合や、音響結合量が急激に変化する場合、即ち、不等式|H[f
,ω]|>β[ω]・|H[f−1,ω]|が成り立つ場合、及び受話信号が十分
に大きくない場合、即ち、不等式|X[f,ω]|<β[ω]が成り立つ場合には
、エコーパス変動への高速な追従性を保ちつつ、ダブルトークとなる周波数帯域での音響
結合量の算出を行わないようにするため、音響結合量推定部(CACL)611g1−2
は、音響結合量を更新しないで1フレーム前の過去の音響結合量|H[f−1,ω]|
を用いる。
極端な音響結合量の変化はダブルトークの可能性があるので、このように音響結合量を
更新しないでおくことで送話音質劣化を防止することができる。ただし、β[ω]は0
.9〜30程度が望ましい。β[ω]は30dB〜40dB程度が望ましい。
音響結合量平滑部(SMACL)611g3−2は、音響結合量推定部(CACL)6
11g1−2から出力された音響結合量|H[f,ω]|と、エコー抑圧量推定部(E
CLE)612から出力されたエコー抑圧量ECL[f,ω]とを入力とし、以下に示す
式49のように1フレーム前の値を用いてスムージングした音響結合量|H’[f,ω
]|を算出して出力する。
Figure 2007060644
ただし、α[ω]は、0.03〜0.99程度が望ましい。このとき、エコーキャン
セラ部(EC)610で抑圧されたエコー抑圧量ECL[f,ω]に基づいて、周波数帯
域ω毎にα[ω]を可変にする。つまり、エコー抑圧量ECL[f,ω]が十分ある程
、α[ω]を0に近づけ、エコー抑圧量ECL[f,ω]が十分ではない程α[ω]
を1に近づける。
音響結合量補正部(ADJ)611g2−2は、音響結合量平滑部(SMACL)61
1g3−2から出力されたスムージングした音響結合量|H’[f,ω]|と、エコ
ー抑圧量推定部(ECLE)612から出力されたエコー抑圧量ECL[f,ω]とを入
力とし、補正音響結合量|H[f,ω]|を算出して出力する。
具体的には、音響結合量補正部(ADJ)611g2−2は、まず周波数帯域毎にエコ
ーキャンセラ部(EC)610で抑圧されたエコー抑圧量ECL[f,ω]が十分である
か否かを判定する。そして、エコーキャンセラ部(EC)610で抑圧されたエコー抑圧
量ECL[f,ω]が十分であると判定された周波数帯域では、0<βHACL[ω]≦
1なる係数βHACL[ω]を用いて以下に示す式50のようにスムージングされた音響
結合量|H’[f,ω]|を補正し、補正音響結合量|H[f,ω]|を算出し
て出力する。
Figure 2007060644
一方、エコーキャンセラ部(EC)610のエコー抑圧量ECL[f,ω]が十分でな
いと判定された周波数帯域では、音響結合量補正部(ADJ)611g2−2は、|H
[f,ω]|=|H’[f,ω]|としてスムージングされた音響結合量|Hs
[f,ω]|の補正を行わない。このようにすることで、エコーパス変動がそれほど起
きない場合に送話音質が劣化することを防げる。
(第7の実施形態)
図33は、第7の実施形態に係る信号処理装置の構成を示すブロック図である。この信
号処理装置が第6の実施形態に係る信号処理装置と異なる点は、図33に示すようにエコ
ーキャンセラ部(EC)610とエコーリダクション部(ER)611とエコー抑圧量推
定部(ECLE)612を有さず、エコーキャンセラ部(EC)710とエコーリダクシ
ョン部(ER)711とエコー抑圧量推定部(ECLE)712とを有する点にあり、そ
の他の部分は同じである。そこで、第6の実施形態に係る信号処理装置と同じ部分につい
ては、同じ符号を付してその説明を省略する。
また、第7の実施形態に係るエコーリダクション部(ER)711で、第1の実施形態
に係るエコーリダクション部(ER)111及び第6の実施形態に係るエコーリダクショ
ン部(ER)611と同じ部分については、同じ符号を付してその説明を省略する。
図34は、エコーキャンセラ部(EC)710の構成を示すブロック図である。このエ
コーキャンセラ部(EC)710は、時間領域エコーキャンセラ部(TDAF)と周波数
領域型エコーキャンセラ部(FDAF)からなり、これらを直列接続したものである。す
なわち、時間領域エコーキャンセラ部(TDAF)での処理後の信号を用いて周波数領域
型エコーキャンセラ部(FDAF)の処理を行う。
時間領域エコーキャンセラ部(TDAF)は、第1の実施形態に係るエコーキャンセラ
部(EC)110と同じであり、周波数領域型エコーキャンセラ部(FDAF)は、第6
の実施形態に係るエコーキャンセラ部(EC)610と同じである。
そして、遅延処理部(DELAY)102から出力された遅延した受話入力信号x[n
−D]を、エコーキャンセラ部(EC)110及びエコーキャンセラ部(EC)610に
入力させる。更に、エコーキャンセラ部(EC)110によって出力された残差信号e[
n]を、エコーキャンセラ部(EC)610に送話入力信号z[n]として入力させて、
直列接続する。この場合、エコーキャンセラ部(EC)710は、エコーキャンセラ部(
EC)110の内部状態とエコーキャンセラ部(EC)610の内部状態を併せて、内部
状態としてメモリに保持している。
そこで、第1の実施形態に係るエコーキャンセラ部(EC)110及び第6の実施形態
に係るエコーキャンセラ部(EC)610と同じ符号を付して、エコーキャンセラ部(E
C)710の説明を省略する。
図35は、エコーリダクション部(ER)711の構成を示すブロック図である。この
エコーリダクション部(ER)711は、周波数領域変換処理部(FT)111aと、周
波数領域変換処理部(FT)111bと、周波数領域変換処理部(FT)111cと、受
話パワー算出部(POW)111dと、送話パワー算出部(POW)111eと、残差パ
ワー算出部(POW)111fと、エコー量推定部(ELE)711hと、周波数領域ダ
ブルトーク検出部(FDTD)711jと、制御部(CTRL)611kと、スペクトル
選択部111Lと、ゲイン格納部(GTBL)111mと、エコー抑圧ゲイン算出部(G
CAL)611nと、信号抑圧部(SS)111oと、周波数領域逆変換処理部(IFT
)111pとからなる。
図36は、エコー量推定部(ELE)711hの詳細な構成を示すブロック図である。
このエコー量推定部(ELE)711hは、信号減算処理部711h1、エコー量推定制
御部(ELECTRL)711h2、可変ゲイン711h3、711h4、信号加算処理
部711h5からなる。
上記のように構成された、本発明の第7の実施形態に係る信号処理装置の各部の動作を
、図33〜図36を参照して説明する。
まず、エコー抑圧量推定部(ECLE)712は、ハイパスフィルタ部(HPF)10
9から出力された送話入力信号z[n]と、エコーキャンセラ部(EC)710の信号減
算処理部610gから出力された時間領域の残差信号e[n]を入力とし、エコーキャン
セラ部(EC)610で抑圧されたエコー抑圧量ECL[f,ω]を周波数帯域ω毎に推
定して出力する。
具体的には、エコー抑圧量推定部(ECLE)712は、まず送話入力信号z[n]を
窓掛け及びオーバーラップして、FFTによって周波数領域に変換し、送話パワースペク
トル|Z’[f,ω]|を算出する。次に、残差信号e[n]を窓掛け及びオーバーラ
ップして、FFTによって周波数領域に変換し、残差パワースペクトル|E’[f,ω]
を算出する。そして、以下に示す式51のように送話パワースペクトル|Z’[f,
ω]|と残差パワースペクトル|E’[f,ω]|の比をエコーキャンセラ部(EC
)710で抑圧されたエコー抑圧量ECL[f,ω]として算出して出力する。
Figure 2007060644
次に、図35及び図36を参照して第7の実施形態に係るエコーリダクション部(ER
)711の動作を説明する。
エコーリダクション部(ER)711は、受話信号x[n]及び送話入力信号z[n]
及び残差信号e[n]に基づいてエコー成分を抑圧するものであって、そのエコー抑圧後
の信号を送話出力信号s’[n](n=0,1,・・・,N−1)として出力する。
エコー量推定部(ELE)711hは、受話パワー算出部(POW)111dから出力
されたスムージングされた受話パワースペクトル|X[f,ω]|と、送話パワー算
出部(POW)111eから出力されたスムージングされた送話パワースペクトル|Z
[f,ω]|と、残差パワー算出部(POW)111fから出力されたスムージングさ
れた残差パワースペクトル|E[f,ω]|と、エコー抑圧量推定部(ECLE)7
12から出力されたエコー抑圧量ECL[f,ω]と、周波数領域ダブルトーク検出部(
FDTD)711jから出力された周波数領域ダブルトーク情報ERstate[f,ω
]とを入力とし、スムージングしたエコー量|Y[f,ω]|を算出して出力する。
信号減算処理部711h1は、送話パワー算出部(POW)111eから出力された送
話パワースペクトル|Z[f,ω]|と、残差パワー算出部(POW)111fから
出力された残差パワースペクトル|E[f,ω]|とを入力とし、送話パワースペク
トル|Z[f,ω]|から残差パワースペクトル|E[f,ω]|をフレームf
及び周波数帯域ω毎に減算して、減算した信号|Z[f,ω]|−|E[f,ω]
を出力する。
エコー量推定制御部(ELECTRL)711h2は、受話パワー算出部(POW)1
11dから出力されたスムージングされた受話パワースペクトル|X[f,ω]|
、送話パワー算出部(POW)111eから出力されたスムージングされた送話パワース
ペクトル|Z[f,ω]|と、残差パワー算出部(POW)111fから出力された
スムージングされた残差パワースペクトル|E[f,ω]|と、エコー抑圧量推定部
(ECLE)712から出力されたエコー抑圧量ECL[f,ω]と、周波数領域ダブル
トーク検出部(FDTD)711jから出力された周波数領域ダブルトーク情報ERst
ate[f,ω]とを入力とし、2つの可変ゲインG[f,ω]及びG[f,ω]を
算出して出力する。
具体的には、まず周波数領域ダブルトーク情報ERstate[f,ω]がダブルトー
ク状態であると判定されたことを示している場合を除いたシングルトーク状態時に、エコ
ー量推定制御部(ELECTRL)711h2は、エコー量|Y[f,ω]|を精度
よく推定するために以下に示す式52−1、式52−2、式52−3のようにGHZ、G
HE、GHZEの3つのゲインをそれぞれ算出する。
Figure 2007060644
次に、エコー量推定制御部(ELECTRL)711h2は、エコー抑圧量ECL[f
,ω]を引数とし値域が0以上1以下である3つの関数FHZ(ECL[f,ω])、F
HE(ECL[f,ω])、及びFHZE(ECL[f,ω])を以下のように制御する
。エコー抑圧量ECL[f,ω]が十分ではない場合、残差パワースペクトル|E[f
,ω]|の影響を少なくするために、FHE(ECL[f,ω])及びFHZE(EC
L[f,ω])を0に近づけるかあるいは小さい値に設定し、FHZ(ECL[f,ω]
)を1に近づける。
一方、エコー抑圧量ECL[f,ω]が十分である場合、残差パワースペクトル|E
[f,ω]|を信頼して用いるように、FHZ(ECL[f,ω])を0に近づけるか
あるいは小さい値に設定し、FHE(ECL[f,ω])及びFHZE(ECL[f,ω
])を1に近づける。このとき、エコー抑圧量ECL[f,ω]が十分であるか否かの判
定条件として、制御部(CTRL)611kと同様の判定条件を用いてもよい。そして、
2つの可変ゲインG[f,ω]及びG[f,ω]を、それぞれ以下に示す式53−1
、式53−2のように算出する。
Figure 2007060644
可変ゲイン711h3は、受話パワー算出部(POW)111dから出力されたスムー
ジングされた受話パワースペクトル|X[f,ω]|と、エコー量推定制御部(EL
ECTRL)711h2から出力された可変ゲインG[f,ω]とを入力とし、|X
[f,ω]|にG[f,ω]を乗じて、受話パワースペクトル|X[f,ω]|
を増幅あるいは減衰させて出力する。
可変ゲイン711h4は、信号減算処理部711h1から出力された信号|Z[f,
ω]|−|E[f,ω]|と、エコー量推定制御部(ELECTRL)711h2
から出力された可変ゲインG[f,ω]とを入力とし、|Z[f,ω]|−|E
[f,ω]|にG[f,ω]を乗じて、増幅あるいは減衰させて出力する。
信号加算処理部711h5は、可変ゲイン711h3から出力されたG[f,ω]を
乗じた|X[f,ω]|と、可変ゲイン711h4から出力されたG[f,ω]を
乗じた|Z[f,ω]|−|E[f,ω]|とを入力とし、スムージングされた
エコー量|Y[f,ω]|を算出して出力する。具体的には、以下に示す式54−1
のようにフレームf及び周波数帯域ω毎に、G[f,ω]を乗じた|X[f,ω]|
とG[f,ω]を乗じた|Z[f,ω]|−|E[f,ω]|を加算してエ
コー量|Y[f,ω]|を算出する。
そして以下に示す式54−2のように、エコー量|Y[f,ω]|をスムージングし
たエコー量|Ys[f,ω]|を算出して出力する。ただし、αY[ω]は0.7〜0
.99程度が望ましい。勿論、スムージングしないエコー量|Y[f,ω]|を出力し
てもよい。
Figure 2007060644
周波数領域ダブルトーク検出部(FDTD)711jは、受話パワー算出部(POW)
111dから出力されたスムージングされた受話パワースペクトル|X[f,ω]|
と、エコー量推定部(ELE)711hから出力された1フレーム前のスムージングした
エコー量|Y[f−1,ω]|と、残差パワー算出部(POW)111fから出力さ
れたスムージングされた残差パワースペクトル|E[f,ω]|とを入力とし、ダブ
ルトーク状態か否かを示す情報である周波数領域ダブルトーク情報ERstate[f,
ω]を算出して出力する。
具体的には、周波数領域ダブルトーク検出部(FDTD)711jは、周波数帯域ω毎
に以下のように閾値よりも大きい、即ち、以下に示す不等式55が成り立てば、ダブルト
ーク状態と判定する。ただし、β[ω]は1.0〜20程度が望ましい。
Figure 2007060644
次に、上記のように構成された第7の実施形態に係る信号処理装置の処理の流れを説明
する。図37は、第7の実施形態に係る信号処理装置の全体の処理の流れを示すフローチ
ャートである。なお、図5を参照して説明した第1の実施形態に係る信号処理装置の動作
と同じ動作ステップについては、同じ符号を付してその部分の説明を省略する。
ステップS1004の遅延処理の後、遅延した受話入力信号x[n−D]とオフセット
除去された送話入力信号z[n]を入力として、エコーキャンセラ部(EC)710はエ
コーキャンセラ処理を行う(ステップS7005)。
次に、エコー抑圧量推定部(ECLE)712は、ハイパスフィルタ部(HPF)10
9から出力された送話入力信号z[n]と信号減算処理部610gから出力された時間領
域の残差信号e[n]を入力とし、エコーキャンセラ部(EC)710で抑圧されたエコ
ー抑圧量ECL[f,ω]を推定する(ステップS7008)。
そして、遅延した受話入力信号x[n−D]と、オフセット除去された送話入力信号z
[n]と、エコーキャンセラ部(EC)710から出力されたエラーキャンセラ処理後の
信号である残差信号e[n]を入力として、エコーリダクション部(ER)711は非線
形エコー抑圧処理であるエコーリダクション処理を行う(ステップS7006)。そして
、ステップS1007の終話か否かの判断に移る。
図38は、第7の実施形態に係るエコーキャンセラ部(EC)710における処理の流
れを示すフローチャートである。なお、図6を参照して説明した第1の実施形態に係るエ
コーキャンセラ部(EC)110の動作と同じ動作ステップについては、同じ符号を付し
てその部分の説明を省略する。
エコーキャンセラ部(EC)710の処理は、まず、ステップS1101でダブルトー
ク検出処理を行った後、ステップS1102で適応フィルタ処理を行い、信号減算処理部
110bは、送話入力信号z[n]から、適応フィルタ部(ADF)110aから出力さ
れた擬似エコー信号y’[n]を減算し、残差信号eTDAF[n]を算出する。次に、周波
数領域ダブルトーク検出処理を行い(ステップS6101)、周波数領域適応フィルタ処
理を行い、信号減算処理部610gは、残差信号eTDAF[n]から、周波数領域適応フィ
ルタ部(FDADF)610eから出力された擬似エコー信号y’FDAF[n]を減算
し、残差信号e[n]を算出して出力し(ステップS6102)、エコーキャンセラ処理
が終了する。
図39は、第7の実施形態に係るエコーリダクション部(ER)711における処理の
流れを示すフローチャートである。なお、図7を参照して説明した第1の実施形態に係る
エコーリダクション部(ER)111及び図30を参照して説明した第6の実施形態に係
るエコーリダクション部(ER)611における動作と同じ動作ステップについては、同
じ符号を付してその部分の説明を省略する。
第7の実施形態に係るエコーリダクション部(ER)711は、エコーリダクション処
理を開始して、ステップS1203rの受話パワースペクトル算出処理、ステップS12
03sの送話パワースペクトル算出処理、及びステップS1203eの残差パワースペク
トル算出処理の後、周波数領域ダブルトーク検出部(FDTD)711jは、ダブルトー
ク状態か否かを示す情報である周波数領域ダブルトーク情報ERstate[f,ω]出
力し、エコー量推定部(ELE)711hは、受話パワースペクトル|X[f,ω]|
と、送話パワースペクトル|Z[f,ω]|と、残差パワースペクトル|E[f
,ω]|と、エコー抑圧量ECL[f,ω]と、周波数領域ダブルトーク情報ERst
ate[f,ω]とを入力とし、スムージングしたエコー量|Y[f,ω]|を算出
して出力する(ステップS7205)。
その後、ステップS6207で判定処理、ステップS6208でエコー抑圧ゲイン算出
処理、ステップS1209でスペクトル選択処理、ステップS1210で送話信号抑圧処
理を行った後、ステップS1211の周波数逆変換処理に移って、エコーリダクション処
理が終了する。
上記では、エコーリダクション部(ER)711はFFTによる周波数領域型で周波数
帯域毎に処理する方式として動作するものとして説明した。FFTによる周波数帯域をグ
ループでまとめて周波数帯域グループ毎に処理する方式や、フィルタバンクなどの帯域分
割フィルタなどの周波数領域型を実現してもよい。
以上説明した信号処理装置の動作により、エコーキャンセラ部(EC)710の処理に
よるエコー抑圧量が十分でない周波数領域をエコー抑圧量推定部(ECLE)712と制
御部(CTRL)611kで判定して、スペクトル選択部111Lとエコー抑圧ゲイン算
出部(GCAL)611nにおいて周波数帯域毎にエコーキャンセラ部(EC)710の
処理とエコーリダクション部(ER)711の処理の重みを変化させるように制御するこ
とができるので、エコーパスロス変動に対して頑健にすることが可能であり、高品質な信
号を出力することが可能である。
(第7の実施形態の変形例)
図40は、本発明の第7の実施形態の変形例に係る信号処理装置の構成を示すブロック
図である。この第7の実施形態の変形例に係る信号処理装置が第7の実施形態に係る信号
処理装置と異なる点は、エコーキャンセラ部(EC)710、エコーリダクション部(E
R)711、エコー抑圧量推定部(ECLE)712に代えて、エコーキャンセラ部(E
C)710r及びエコーリダクション部(ER)711r及びエコー抑圧量推定部(EC
LE)712rを有することである。そして、送話入力信号格納部(BUFF)713と
受話入力信号格納部(BUFF)714と、遅延処理部(DELAY)702rを有する
ことである。
そして、図33に示す第7の実施形態に係る信号処理装置では受話出力信号が送話入力
信号に回り込み音響結合することで発生していたエコーを受話入力信号を参照として送話
入力信号から抑圧する構成であったのに対し、この第7の実施形態の変形例に係る信号処
理装置では送話出力信号が図示しない遠端において回り込んで音響結合したエコーを送話
出力信号を参照として受話入力信号から抑圧する構成になっている点であり、その他の部
分は同じである。そこで、同じ部分については、同じ符号を付してその説明を省略する。
送話入力信号格納部(BUFF)713と受話入力信号格納部(BUFF)714では
、例えば、特開2005−142886号公報に記載の技術、あるいは送話入力信号と受
話入力信号の相互相関を用いる遅延時間推定技術によって、図示しない遠端において発生
していたエコーについて遅延などの処理を用いて同期が合う構成になっている。
遅延処理部(DELAY)702r、エコーキャンセラ部(EC)710r、エコーリ
ダクション部(ER)711r及びエコー抑圧量推定部(ECLE)712rは、入力さ
れる信号が異なるが、第7の実施形態に係る遅延処理部(DELAY)102、エコーキ
ャンセラ部(EC)710、エコーリダクション部(ER)711及びエコー抑圧量推定
部(ECLE)712と同様の処理を行う。
このような構成にすることで、遠端において発生していた音響エコーについてもエコー
抑圧することができる。
なお、本発明は通話装置に適用されるものであって、通話装置は、通話機能を有する装
置全般をいい、例えば、ハンズフリー通話機能を有するハンズフリー通話装置や、電話機
、インターフォン、携帯電話、PHS、VoIPソフトウェア、VoIPシステム、TV
会議システムなどを含む。
少なくともエコー成分を低減させる信号処理の例として、エコーキャンセラ、エコーリ
ダクション、エコーサプレッサ、エコーノイズリダクションを、少なくともノイズ成分を
低減させる信号処理の例として、ノイズリダクション、エコーノイズリダクションを挙げ
て説明した。このように記載したのは一般的な呼称であるからであり、本発明はこれら呼
称に限定されるものではない。また、本発明の要旨を逸脱しない範囲でこれらの信号処理
の組み合わせにおいても実施し得ることが可能である。
本発明は、上記各実施の形態に限ることなく、その他、実施段階ではその要旨を逸脱し
ない範囲で種々の変形を実施し得ることが可能である。さらに、上記各実施形態には、種
々の段階の発明が含まれており、開示される複数の構成要件における適宜な組合せにより
種々の発明が抽出され得る。
また、例えば各実施形態に示される全構成要件から幾つかの構成要件が削除されても、
発明が解決しようとする課題の欄で述べた課題が解決でき、発明の効果で述べられている
効果が得られる場合には、この構成要件が削除された構成が発明として抽出され得る。本
発明は装置のみならず、当該装置の機能を実現する方法やプログラムとしても成立する。
本発明の第1の実施形態に係る信号処理装置の構成を示すブロック図。 本発明の第1の実施形態に係るエコーキャンセラ部(EC)の構成を示すブロック図。 本発明の第1の実施形態に係るエコーリダクション部(ER)の構成を示すブロック図。 本発明の実施形態に係る抑圧ゲインの下限値の一例を示す図。 本発明の第1の実施形態に係る信号処理装置の動作を示すフローチャート。 本発明の第1の実施形態に係るエコーキャンセラ部(EC)の動作を示すフローチャート。 本発明の第1の実施形態に係るエコーリダクション部(ER)の動作を示すフローチャート。 本発明の第1の実施形態の変形例に係るエコーリダクション部(ER)の構成を示すブロック図。 本発明の第2の実施形態に係る信号処理装置の構成を示すブロック図。 本発明の第2の実施形態に係るノイズリダクション部(NR)の構成を示すブロック図。 本発明の第2の実施形態に係る信号処理装置の動作を示すフローチャート。 本発明の第2の実施形態に係るノイズリダクション部(NR)の動作を示すフローチャート。 本発明の第3の実施形態に係る信号処理装置の構成を示すブロック図。 本発明の第3の実施形態に係るエコーノイズリダクション部(ENR)の構成を示すブロック図。 本発明の第3の実施形態に係る信号処理装置の動作を示すフローチャート。 本発明の第3の実施形態に係るエコーノイズリダクション部(ENR)の動作を示すフローチャート。 本発明の第4の実施形態に係る信号処理装置の構成を示すブロック図。 本発明の第4の実施形態に係るエコーサプレッサ部(ES)の構成を示すブロック図。 本発明の第4の実施形態に係る信号処理装置の動作を示すフローチャート。 本発明の第4の実施形態に係るエコーサプレッサ部(ES)の動作を示すフローチャート。 本発明の第5の実施形態に係るエコーリダクション部(ER)の構成を示すブロック図。 本発明の第5の実施形態に係る信号処理装置の動作を示すフローチャート。 本発明の第5の実施形態に係るエコーリダクション部(ER)の動作を示すフローチャート。 本発明の第6の実施形態に係る信号処理装置の構成を示すブロック図。 本発明の第6の実施形態に係るエコーキャンセラ部(EC)の構成を示すブロック図。 本発明の第6の実施形態に係るエコーリダクション部(ER)の構成を示すブロック図。 本発明の第6の実施形態に係る音響結合量推定部(ACLE)の構成を示すブロック図。 本発明の第6の実施形態に係る信号処理装置の動作を示すフローチャート。 本発明の第6の実施形態に係るエコーキャンセラ部(EC)の動作を示すフローチャート。 本発明の第6の実施形態に係るエコーリダクション部(ER)の動作を示すフローチャート。 本発明の第6の実施形態の変形例に係るエコーリダクション部(ER)の構成を示すブロック図。 本発明の第6の実施形態の変形例に係る音響結合量推定部(ACLE)の構成を示すブロック図。 本発明の第7の実施形態に係る信号処理装置の構成を示すブロック図。 本発明の第7の実施形態に係るエコーキャンセラ部(EC)の構成を示すブロック図。 本発明の第7の実施形態に係るエコーリダクション部(ER)の構成を示すブロック図。 本発明の第7の実施形態に係るエコー量推定部(ELE)の構成を示すブロック図。 本発明の第7の実施形態に係る信号処理装置の動作を示すフローチャート。 本発明の第7の実施形態に係るエコーキャンセラ部(EC)の動作を示すフローチャート。 本発明の第7の実施形態に係るエコーリダクション部(ER)の動作を示すフローチャート。 本発明の第7の実施形態の変形例に係る信号処理装置の構成を示すブロック図。
符号の説明
110、610、710、710r エコーキャンセラ部(EC)
110a 適応フィルタ部(ADF)
110b、610g、711h1 信号減算処理部
110c ダブルトーク検出部(DTD)
111、511、611、711、711r、1112 エコーリダクション部(ER)
111a、111b、111c、610d、610h 周波数領域変換処理部(FT)
111d、411d 受話パワー算出部(POW)
111e、411e 送話パワー算出部(POW)
111f、411f 残差パワー算出部(POW)
111g、111g2、511g、611g、611g−2 音響結合量推定部(ACL
E)
111h、511h、711h エコー量推定部(ELE)
111i、411i、612、712、712r エコー抑圧量推定部(ECLE)
111j、611j、711j 周波数領域ダブルトーク検出部(FDTD)
111k、211k、411k、511k、611k 制御部(CTRL)
111L、211L、511L スペクトル選択部
111m、411m ゲイン格納部(GTBL)
111n、111n2、411n、511n、611n エコー抑圧ゲイン算出部(GC
AL)
111o、211o、311o 信号抑圧部(SS)
111p、610f 周波数領域逆変換処理部(IFT)
211 ノイズリダクション部(NR)
211n ノイズ抑圧ゲイン算出部(GCAL)
211q、311q 雑音レベル推定部(NLE)
311 エコーノイズリダクション部(ENR)
311n エコーノイズ抑圧ゲイン算出部(GCAL)
411 エコーサプレッサ部(ES)
411L 信号選択部
411o、511s 送話信号抑圧部(SS)
411r 受話信号抑圧部(SS)
511t 残差信号抑圧部(ES)
610e 周波数領域適応フィルタ部(FDADF)
610i 周波数領域ダブルトーク検出部(FDDTD)
611g1、611g1−2 音響結合量推定部(CACL)
611g2、611g2−2 音響結合量補正部(ADJ)
611g3、611g3−2 音響結合量平滑部(SMACL)
611u 送話出力パワー算出部(POW)
711h2 エコー量推定制御部(ELECTRL)
711h3、711h4 可変ゲイン
711h5 信号加算処理部

Claims (19)

  1. 入力信号に含まれる少なくともエコーを抑圧してエコー低減信号を出力する第1の信号
    処理手段と、
    前記入力信号と前記エコー低減信号とを入力し、エコー及びノイズの少なくとも一方を抑
    圧する第2の信号処理手段と、を備え、
    前記第2の信号処理手段は、前記入力信号と前記エコー低減信号とのどちらか一方を選択
    する選択手段を有し、
    前記選択手段によって選択された前記入力信号及び前記エコー低減信号のいずれか一方の
    前記エコー及び前記ノイズの少なくとも一方を抑圧する
    ことを特徴とする信号処理装置。
  2. 前記第1の信号処理手段の内部状態、前記入力信号及び前記エコー低減信号の少なくと
    も1つを用いて前記第1の信号処理手段のエコー抑圧量を算出するエコー抑圧量算出手段
    を更に備え、
    前記選択手段は、前記エコー抑圧量算出手段によって算出された前記エコー抑圧量に基づ
    いて、前記入力信号と前記エコー低減信号とのどちらか一方を選択する
    ことを特徴とする請求項1に記載の信号処理装置。
  3. 前記第2の信号処理手段は、前記入力信号及び前記エコー低減信号の少なくとも1つに
    含まれる前記エコー及び前記ノイズの少なくとも一方を推定して算出した抑圧量と、前記
    エコー抑圧量算出手段によって算出されたエコー抑圧量との少なくとも1つに基づいて、
    前記選択手段によって選択された信号の抑圧量を設定する抑圧量設定手段を有し、
    前記抑圧量設定手段によって設定された抑圧量で抑圧する
    ことを特徴とする請求項2に記載の信号処理装置。
  4. 前記第2の信号処理手段は、前記エコー抑圧量算出手段によって算出されたエコー抑圧
    量に基づいて第1の抑圧量及び第2の抑圧量のどちらか一方の抑圧量を選択する抑圧量設
    定手段を有し、
    前記入力信号に含まれる前記エコー及び前記ノイズの少なくとも一方を推定して前記第1
    の抑圧量を算出し、前記エコー低減信号に含まれる前記エコー及び前記ノイズの少なくと
    も一方を推定して前記第2の抑圧量を算出し、前記抑圧量設定手段によって選択された前
    記第1の抑圧量及び前記第2の抑圧量のどちらか一方の抑圧量で抑圧する
    ことを特徴とする請求項2に記載の信号処理装置。
  5. 前記第2の信号処理手段は、前記入力信号に含まれる前記エコーあるいは前記ノイズを
    推定して第1の抑圧量を算出し、前記エコー低減信号に含まれる前記エコーあるいは前記
    ノイズを推定して第2の抑圧量を算出し、前記選択手段によって前記入力信号が選択され
    た場合は前記第1の抑圧量を選択し、前記選択手段によって前記エコー低減信号が選択さ
    れた場合は前記第2の抑圧量を選択する抑圧量設定手段を有し、
    前記抑圧量設定手段によって選択された抑圧量で抑圧する
    ことを特徴とする請求項1または請求項2に記載の信号処理装置。
  6. 入力信号に対して少なくともエコーを抑圧してエコー低減信号を出力する第1の信号処
    理手段と、
    前記入力信号と前記エコー低減信号を入力し、エコー及びノイズの少なくとも一方を抑圧
    して出力する第2の信号処理手段と、を備え、
    前記第2の信号処理手段は、前記入力信号に含まれる前記エコー及び前記ノイズの少なく
    とも一方を推定して第1の抑圧量を算出する第1の抑圧量設定手段と、前記エコー低減信
    号に含まれる前記エコー及び前記ノイズの少なくとも一方を推定して第2の抑圧量を算出
    する第2の抑圧量設定手段と、前記入力信号に含まれる前記エコー及び前記ノイズの少な
    くとも一方を前記第1の抑圧量設定手段によって推定された第1の抑圧量で抑圧した信号
    と、前記エコー低減信号に含まれる前記エコー及び前記ノイズの少なくとも一方を前記第
    2の抑圧量設定手段によって推定された第2の抑圧量で抑圧した信号とのどちらか一方を
    選択する選択手段とを有し、
    前記選択手段によって選択された信号を出力する
    ことを特徴とする信号処理装置。
  7. 前記第1の信号処理手段の内部状態、前記第1の入力信号及び前記エコー低減信号の少
    なくとも1つを用いて前記第1の信号処理手段のエコー抑圧量を算出するエコー抑圧量算
    出手段を更に備え、
    前記選択手段は、前記エコー抑圧量算出手段によって算出された前記エコー抑圧量に基づ
    いて、前記入力信号を前記第1の抑圧量で抑圧した信号と、前記エコー低減信号を前記第
    2の抑圧量で抑圧した信号とのどちらか一方を選択する
    ことを特徴とする請求項6に記載の信号処理装置。
  8. 前記抑圧量設定手段は、前記エコー抑圧量算出手段によって算出された前記エコー抑圧
    量に基づいてエコー量を推定するエコー量推定手段を有し、
    前記エコー量推定手段によって推定されたエコー量を用いて前記第2の信号処理手段の抑
    圧量を設定する
    ことを特徴とする請求項3乃至請求項5及び請求項7のいずれか1項に記載の信号処理装
    置。
  9. 前記抑圧量設定手段は、前記第2の信号処理手段の抑圧量を周波数領域毎に設定し、
    前記エコー量推定手段は、前記周波数領域毎にエコー量を推定する
    ことを特徴とする請求項8に記載の信号処理装置。
  10. 前記抑圧量設定手段は、前記第2の信号処理手段の抑圧量を周波数領域毎に設定する
    ことを特徴とする請求項3乃至請求項5及び請求項7のいずれか1項に記載の信号処理装
    置。
  11. 前記エコー量推定手段は、音響結合量を推定する音響結合量推定手段と、前記音響結合
    量推定手段によって推定された音響結合量を前記エコー抑圧量算出手段によって算出され
    たエコー抑圧量に基づいて補正する音響結合量補正手段と、を有し、
    前記音響結合量補正手段によって補正された音響結合量を用いて前記エコー量を推定する
    ことを特徴とする請求項8に記載の信号処理装置。
  12. 前記エコー量推定手段は、周波数領域毎に前記エコー量を推定し、
    前記音響結合量推定手段は、前記周波数領域毎に前記音響結合量を推定し、
    前記音響結合量補正手段は、前記周波数領域毎に前記音響結合量を補正する
    ことを特徴とする請求項11に記載の信号処理装置。
  13. 前記抑圧量設定手段は、エコー量を推定するエコー量推定手段と、前記エコー量推定手
    段によって推定されたエコー量を用いて抑圧ゲインを算出する抑圧ゲイン算出手段と、前
    記エコー抑圧量算出手段によって算出された前記エコー抑圧量に基づいて前記抑圧ゲイン
    算出手段によって算出された抑圧ゲインを補正する抑圧ゲイン補正手段と、を有し、
    前記抑圧ゲイン補正手段によって補正された抑圧ゲインを抑圧量として設定する
    ことを特徴とする請求項3乃至請求項5及び請求項7のいずれか1項に記載の信号処理装
    置。
  14. 前記エコー量推定手段は、周波数領域毎に前記エコー量を推定し、
    前記抑圧ゲイン算出手段は、周波数領域毎に前記抑圧ゲインを算出し、
    前記抑圧ゲイン補正手段は、周波数領域毎に前記抑圧ゲインを補正する
    ことを特徴とする請求項13に記載の信号処理装置。
  15. 前記選択手段は、周波数領域毎に前記2つの信号のいずれか一方を選択する
    ことを特徴とする請求項1乃至請求項14のいずれか1項に記載の信号処理装置。
  16. 前記エコー抑圧量算出手段は、前記第1の信号処理手段のエコー抑圧量を周波数領域毎
    に算出する
    ことを特徴とする請求項2乃至請求項5及び請求項7乃至請求項15のいずれか1項に記
    載の信号処理装置。
  17. 前記入力信号はマイクから収音された送話信号である
    ことを特徴とする請求項1乃至請求項16のいずれか1項に記載の信号処理装置。
  18. 前記入力信号は受話信号である
    ことを特徴とする請求項1乃至請求項16のいずれか1項に記載の信号処理装置。
  19. 入力信号に対して少なくともエコーを抑圧してエコー低減信号を作成し、前記入力信号
    に含まれる前記エコー及びノイズの少なくとも一方を推定して第1の抑圧量を算出し、前
    記エコー低減信号に含まれる前記エコー及び前記ノイズの少なくとも一方を推定して第2
    の抑圧量を算出し、前記入力信号を前記第1の抑圧量で抑圧した信号と、前記エコー低減
    信号を前記第2の抑圧量で抑圧した信号とのどちらか一方を選択して出力する信号処理手
    段を備える
    ことを特徴とする信号処理装置。
JP2006203418A 2005-07-28 2006-07-26 信号処理装置 Active JP4818014B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006203418A JP4818014B2 (ja) 2005-07-28 2006-07-26 信号処理装置

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2005219303 2005-07-28
JP2005219303 2005-07-28
JP2006203418A JP4818014B2 (ja) 2005-07-28 2006-07-26 信号処理装置

Publications (2)

Publication Number Publication Date
JP2007060644A true JP2007060644A (ja) 2007-03-08
JP4818014B2 JP4818014B2 (ja) 2011-11-16

Family

ID=37923645

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006203418A Active JP4818014B2 (ja) 2005-07-28 2006-07-26 信号処理装置

Country Status (1)

Country Link
JP (1) JP4818014B2 (ja)

Cited By (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009151062A1 (ja) * 2008-06-10 2009-12-17 ヤマハ株式会社 音響エコーキャンセラおよび音響エコーキャンセル方法
JP2010135936A (ja) * 2008-12-02 2010-06-17 Hitachi Ltd エコーキャンセラおよびエコー消去方法
WO2012157785A1 (ja) * 2011-05-19 2012-11-22 日本電気株式会社 音声処理装置、音声処理方法及び音声処理プログラムを記録した記録媒体
JP2013225747A (ja) * 2012-04-20 2013-10-31 Panasonic Corp 通話装置
JP2014519758A (ja) * 2011-06-03 2014-08-14 シラス ロジック、インコーポレイテッド パーソナルオーディオデバイスのための適合的ノイズキャンセリングアーキテクチャ
US9179217B2 (en) 2012-12-21 2015-11-03 Kabushiki Kaisha Toshiba Signal processing apparatus and signal processing method
US9460701B2 (en) 2013-04-17 2016-10-04 Cirrus Logic, Inc. Systems and methods for adaptive noise cancellation by biasing anti-noise level
US9462376B2 (en) 2013-04-16 2016-10-04 Cirrus Logic, Inc. Systems and methods for hybrid adaptive noise cancellation
US9479860B2 (en) 2014-03-07 2016-10-25 Cirrus Logic, Inc. Systems and methods for enhancing performance of audio transducer based on detection of transducer status
US9478210B2 (en) 2013-04-17 2016-10-25 Cirrus Logic, Inc. Systems and methods for hybrid adaptive noise cancellation
US9497542B2 (en) 2012-11-12 2016-11-15 Yamaha Corporation Signal processing system and signal processing method
US9502020B1 (en) 2013-03-15 2016-11-22 Cirrus Logic, Inc. Robust adaptive noise canceling (ANC) in a personal audio device
US9532139B1 (en) 2012-09-14 2016-12-27 Cirrus Logic, Inc. Dual-microphone frequency amplitude response self-calibration
US9552805B2 (en) 2014-12-19 2017-01-24 Cirrus Logic, Inc. Systems and methods for performance and stability control for feedback adaptive noise cancellation
US9578432B1 (en) 2013-04-24 2017-02-21 Cirrus Logic, Inc. Metric and tool to evaluate secondary path design in adaptive noise cancellation systems
US9578415B1 (en) 2015-08-21 2017-02-21 Cirrus Logic, Inc. Hybrid adaptive noise cancellation system with filtered error microphone signal
US9620101B1 (en) 2013-10-08 2017-04-11 Cirrus Logic, Inc. Systems and methods for maintaining playback fidelity in an audio system with adaptive noise cancellation
US9633646B2 (en) 2010-12-03 2017-04-25 Cirrus Logic, Inc Oversight control of an adaptive noise canceler in a personal audio device
US9646595B2 (en) 2010-12-03 2017-05-09 Cirrus Logic, Inc. Ear-coupling detection and adjustment of adaptive response in noise-canceling in personal audio devices
US9666176B2 (en) 2013-09-13 2017-05-30 Cirrus Logic, Inc. Systems and methods for adaptive noise cancellation by adaptively shaping internal white noise to train a secondary path
US9704472B2 (en) 2013-12-10 2017-07-11 Cirrus Logic, Inc. Systems and methods for sharing secondary path information between audio channels in an adaptive noise cancellation system
US9721556B2 (en) 2012-05-10 2017-08-01 Cirrus Logic, Inc. Downlink tone detection and adaptation of a secondary path response model in an adaptive noise canceling system
US9773490B2 (en) 2012-05-10 2017-09-26 Cirrus Logic, Inc. Source audio acoustic leakage detection and management in an adaptive noise canceling system
US9807503B1 (en) 2014-09-03 2017-10-31 Cirrus Logic, Inc. Systems and methods for use of adaptive secondary path estimate to control equalization in an audio device
US9824677B2 (en) 2011-06-03 2017-11-21 Cirrus Logic, Inc. Bandlimiting anti-noise in personal audio devices having adaptive noise cancellation (ANC)
US9955250B2 (en) 2013-03-14 2018-04-24 Cirrus Logic, Inc. Low-latency multi-driver adaptive noise canceling (ANC) system for a personal audio device
US10013966B2 (en) 2016-03-15 2018-07-03 Cirrus Logic, Inc. Systems and methods for adaptive active noise cancellation for multiple-driver personal audio device
US10026388B2 (en) 2015-08-20 2018-07-17 Cirrus Logic, Inc. Feedback adaptive noise cancellation (ANC) controller and method having a feedback response partially provided by a fixed-response filter
CN109151237A (zh) * 2018-08-23 2019-01-04 西南交通大学 基于零吸引的仿射投影自适应回声消除方法
US10181315B2 (en) 2014-06-13 2019-01-15 Cirrus Logic, Inc. Systems and methods for selectively enabling and disabling adaptation of an adaptive noise cancellation system
US10206032B2 (en) 2013-04-10 2019-02-12 Cirrus Logic, Inc. Systems and methods for multi-mode adaptive noise cancellation for audio headsets
US10219071B2 (en) 2013-12-10 2019-02-26 Cirrus Logic, Inc. Systems and methods for bandlimiting anti-noise in personal audio devices having adaptive noise cancellation
US10382864B2 (en) 2013-12-10 2019-08-13 Cirrus Logic, Inc. Systems and methods for providing adaptive playback equalization in an audio device
US10468048B2 (en) 2011-06-03 2019-11-05 Cirrus Logic, Inc. Mic covering detection in personal audio devices

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6343451A (ja) * 1986-08-11 1988-02-24 Mitsubishi Electric Corp 拡声通話回路
JPH07226697A (ja) * 1994-02-10 1995-08-22 Nippon Telegr & Teleph Corp <Ntt> 反響消去装置、反響消去方法及び反響消去装置を有する送受話器
JPH088789A (ja) * 1994-06-20 1996-01-12 Toshiba Corp 音声通信システム
JPH09116614A (ja) * 1995-10-18 1997-05-02 Nippon Telegr & Teleph Corp <Ntt> 反響消去装置
JPH10229354A (ja) * 1997-02-14 1998-08-25 Fujitsu Ltd エコー制御装置
JPH10285083A (ja) * 1997-04-04 1998-10-23 Toshiba Corp 音声通信装置
JPH11331046A (ja) * 1998-03-16 1999-11-30 Nippon Telegr & Teleph Corp <Ntt> エコー抑圧方法及び装置並びにエコー抑圧プログラムが記憶されたコンピュータに読取り可能な記憶媒体
JP2000252891A (ja) * 1999-02-26 2000-09-14 Toshiba Corp 信号処理装置
JP2004274412A (ja) * 2003-03-10 2004-09-30 Nippon Telegr & Teleph Corp <Ntt> 反響消去装置、方法、及び反響消去プログラム
JP2005159753A (ja) * 2003-11-26 2005-06-16 Sony Corp エコーキャンセラ
JP2005159941A (ja) * 2003-11-28 2005-06-16 Saxa Inc エコーキャンセル制御装置および方法

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6343451A (ja) * 1986-08-11 1988-02-24 Mitsubishi Electric Corp 拡声通話回路
JPH07226697A (ja) * 1994-02-10 1995-08-22 Nippon Telegr & Teleph Corp <Ntt> 反響消去装置、反響消去方法及び反響消去装置を有する送受話器
JPH088789A (ja) * 1994-06-20 1996-01-12 Toshiba Corp 音声通信システム
JPH09116614A (ja) * 1995-10-18 1997-05-02 Nippon Telegr & Teleph Corp <Ntt> 反響消去装置
JPH10229354A (ja) * 1997-02-14 1998-08-25 Fujitsu Ltd エコー制御装置
JPH10285083A (ja) * 1997-04-04 1998-10-23 Toshiba Corp 音声通信装置
JPH11331046A (ja) * 1998-03-16 1999-11-30 Nippon Telegr & Teleph Corp <Ntt> エコー抑圧方法及び装置並びにエコー抑圧プログラムが記憶されたコンピュータに読取り可能な記憶媒体
JP2000252891A (ja) * 1999-02-26 2000-09-14 Toshiba Corp 信号処理装置
JP2004274412A (ja) * 2003-03-10 2004-09-30 Nippon Telegr & Teleph Corp <Ntt> 反響消去装置、方法、及び反響消去プログラム
JP2005159753A (ja) * 2003-11-26 2005-06-16 Sony Corp エコーキャンセラ
JP2005159941A (ja) * 2003-11-28 2005-06-16 Saxa Inc エコーキャンセル制御装置および方法

Cited By (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009302599A (ja) * 2008-06-10 2009-12-24 Yamaha Corp 音響エコーキャンセラ
WO2009151062A1 (ja) * 2008-06-10 2009-12-17 ヤマハ株式会社 音響エコーキャンセラおよび音響エコーキャンセル方法
JP2010135936A (ja) * 2008-12-02 2010-06-17 Hitachi Ltd エコーキャンセラおよびエコー消去方法
US9646595B2 (en) 2010-12-03 2017-05-09 Cirrus Logic, Inc. Ear-coupling detection and adjustment of adaptive response in noise-canceling in personal audio devices
US9633646B2 (en) 2010-12-03 2017-04-25 Cirrus Logic, Inc Oversight control of an adaptive noise canceler in a personal audio device
WO2012157785A1 (ja) * 2011-05-19 2012-11-22 日本電気株式会社 音声処理装置、音声処理方法及び音声処理プログラムを記録した記録媒体
US9711130B2 (en) 2011-06-03 2017-07-18 Cirrus Logic, Inc. Adaptive noise canceling architecture for a personal audio device
JP2014519758A (ja) * 2011-06-03 2014-08-14 シラス ロジック、インコーポレイテッド パーソナルオーディオデバイスのための適合的ノイズキャンセリングアーキテクチャ
US9824677B2 (en) 2011-06-03 2017-11-21 Cirrus Logic, Inc. Bandlimiting anti-noise in personal audio devices having adaptive noise cancellation (ANC)
US10249284B2 (en) 2011-06-03 2019-04-02 Cirrus Logic, Inc. Bandlimiting anti-noise in personal audio devices having adaptive noise cancellation (ANC)
US10468048B2 (en) 2011-06-03 2019-11-05 Cirrus Logic, Inc. Mic covering detection in personal audio devices
JP2013225747A (ja) * 2012-04-20 2013-10-31 Panasonic Corp 通話装置
US9721556B2 (en) 2012-05-10 2017-08-01 Cirrus Logic, Inc. Downlink tone detection and adaptation of a secondary path response model in an adaptive noise canceling system
US9773490B2 (en) 2012-05-10 2017-09-26 Cirrus Logic, Inc. Source audio acoustic leakage detection and management in an adaptive noise canceling system
US9532139B1 (en) 2012-09-14 2016-12-27 Cirrus Logic, Inc. Dual-microphone frequency amplitude response self-calibration
US9773493B1 (en) 2012-09-14 2017-09-26 Cirrus Logic, Inc. Power management of adaptive noise cancellation (ANC) in a personal audio device
US9497542B2 (en) 2012-11-12 2016-11-15 Yamaha Corporation Signal processing system and signal processing method
US11190872B2 (en) 2012-11-12 2021-11-30 Yamaha Corporation Signal processing system and signal processing meihod
US10250974B2 (en) 2012-11-12 2019-04-02 Yamaha Corporation Signal processing system and signal processing method
US9179217B2 (en) 2012-12-21 2015-11-03 Kabushiki Kaisha Toshiba Signal processing apparatus and signal processing method
US9955250B2 (en) 2013-03-14 2018-04-24 Cirrus Logic, Inc. Low-latency multi-driver adaptive noise canceling (ANC) system for a personal audio device
US9502020B1 (en) 2013-03-15 2016-11-22 Cirrus Logic, Inc. Robust adaptive noise canceling (ANC) in a personal audio device
US10206032B2 (en) 2013-04-10 2019-02-12 Cirrus Logic, Inc. Systems and methods for multi-mode adaptive noise cancellation for audio headsets
US9462376B2 (en) 2013-04-16 2016-10-04 Cirrus Logic, Inc. Systems and methods for hybrid adaptive noise cancellation
US9478210B2 (en) 2013-04-17 2016-10-25 Cirrus Logic, Inc. Systems and methods for hybrid adaptive noise cancellation
US9460701B2 (en) 2013-04-17 2016-10-04 Cirrus Logic, Inc. Systems and methods for adaptive noise cancellation by biasing anti-noise level
US9578432B1 (en) 2013-04-24 2017-02-21 Cirrus Logic, Inc. Metric and tool to evaluate secondary path design in adaptive noise cancellation systems
US9666176B2 (en) 2013-09-13 2017-05-30 Cirrus Logic, Inc. Systems and methods for adaptive noise cancellation by adaptively shaping internal white noise to train a secondary path
US9620101B1 (en) 2013-10-08 2017-04-11 Cirrus Logic, Inc. Systems and methods for maintaining playback fidelity in an audio system with adaptive noise cancellation
US10382864B2 (en) 2013-12-10 2019-08-13 Cirrus Logic, Inc. Systems and methods for providing adaptive playback equalization in an audio device
US9704472B2 (en) 2013-12-10 2017-07-11 Cirrus Logic, Inc. Systems and methods for sharing secondary path information between audio channels in an adaptive noise cancellation system
US10219071B2 (en) 2013-12-10 2019-02-26 Cirrus Logic, Inc. Systems and methods for bandlimiting anti-noise in personal audio devices having adaptive noise cancellation
US9479860B2 (en) 2014-03-07 2016-10-25 Cirrus Logic, Inc. Systems and methods for enhancing performance of audio transducer based on detection of transducer status
US10181315B2 (en) 2014-06-13 2019-01-15 Cirrus Logic, Inc. Systems and methods for selectively enabling and disabling adaptation of an adaptive noise cancellation system
US9807503B1 (en) 2014-09-03 2017-10-31 Cirrus Logic, Inc. Systems and methods for use of adaptive secondary path estimate to control equalization in an audio device
US9552805B2 (en) 2014-12-19 2017-01-24 Cirrus Logic, Inc. Systems and methods for performance and stability control for feedback adaptive noise cancellation
US10026388B2 (en) 2015-08-20 2018-07-17 Cirrus Logic, Inc. Feedback adaptive noise cancellation (ANC) controller and method having a feedback response partially provided by a fixed-response filter
US9578415B1 (en) 2015-08-21 2017-02-21 Cirrus Logic, Inc. Hybrid adaptive noise cancellation system with filtered error microphone signal
US10013966B2 (en) 2016-03-15 2018-07-03 Cirrus Logic, Inc. Systems and methods for adaptive active noise cancellation for multiple-driver personal audio device
CN109151237A (zh) * 2018-08-23 2019-01-04 西南交通大学 基于零吸引的仿射投影自适应回声消除方法
CN109151237B (zh) * 2018-08-23 2020-10-09 西南交通大学 基于零吸引的仿射投影自适应回声消除方法

Also Published As

Publication number Publication date
JP4818014B2 (ja) 2011-11-16

Similar Documents

Publication Publication Date Title
JP4818014B2 (ja) 信号処理装置
KR101414688B1 (ko) 에코 보상 방법 및 신호 처리 수단
US8335311B2 (en) Communication apparatus capable of echo cancellation
US8311234B2 (en) Echo canceller and communication audio processing apparatus
US8306215B2 (en) Echo canceller for eliminating echo without being affected by noise
JP5450567B2 (ja) クリアな信号の取得のための方法及びシステム
US8675883B2 (en) Apparatus and associated methodology for suppressing an acoustic echo
JP5032669B2 (ja) 音声信号のエコーキャンセルのための方法及び装置
US6694018B1 (en) Echo canceling apparatus and method, and voice reproducing apparatus
JP5061853B2 (ja) エコーキャンセラ及びエコーキャンセルプログラム
US9001994B1 (en) Non-uniform adaptive echo cancellation
JP2003506924A (ja) 送受信器ユニットにおけるエコーをキャンセルするためのエコーキャンセル装置
JP2012501152A (ja) 前白色化を伴うlmsアルゴリズムによって適応させられる適応フィルタの更新済みフィルタ係数を決定する方法
JP5223576B2 (ja) エコーキャンセラ、エコーキャンセル方法及びプログラム
JP4457639B2 (ja) エコーキャンセラ
JP2003158476A (ja) エコーキャンセラ
US8543390B2 (en) Multi-channel periodic signal enhancement system
CN103460613A (zh) 节省计算的用于宽带音频信号的回声消除器
US9172791B1 (en) Noise estimation algorithm for non-stationary environments
WO2005046076A1 (ja) エコー抑圧装置
JP2009094802A (ja) 通信装置
JP2005051744A (ja) 通話装置
JP6272590B2 (ja) エコーキャンセラ装置及び通話装置
JP2006113515A (ja) ノイズサプレス装置、ノイズサプレス方法及び移動通信端末装置
JP2009021859A (ja) 通話状態判定装置および該通話状態判定装置を備えたエコーキャンセラ

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090716

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20110209

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110315

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110513

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110802

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110830

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140909

Year of fee payment: 3

R151 Written notification of patent or utility model registration

Ref document number: 4818014

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140909

Year of fee payment: 3