JP2007060644A

JP2007060644A - 信号処理装置

Info

Publication number: JP2007060644A
Application number: JP2006203418A
Authority: JP
Inventors: Takashi Sudo; 隆須藤
Original assignee: Toshiba Corp
Current assignee: Toshiba Corp
Priority date: 2005-07-28
Filing date: 2006-07-26
Publication date: 2007-03-08
Anticipated expiration: 2026-07-26
Also published as: JP4818014B2

Abstract

【課題】エコー抑圧性能を向上させ、またはノイズ抑圧性能を向上させ、エコーパスロ
スの変動を含むエコーパス変動に対する頑健性を高めた信号処理装置を提供する。
【解決手段】送話入力信号に対して少なくともエコーを抑圧しエコー低減信号を出力す
るエコーキャンセラ部（ＥＣ）１１０と、上記送話入力信号と上記エコー低減信号を入力
し、エコー及びノイズの少なくとも一方を抑圧するエコーリダクション部（ＥＲ）１１１
と、を備え、エコーリダクション部（ＥＲ）１１１は、上記送話入力信号と上記エコー低
減信号のどちらか一方を選択して出力するスペクトル選択部１１１Ｌを備え、スペクトル
選択部１１１Ｌで選択された上記送話入力信号及びエコー低減信号のいずれかについてエ
コー及びノイズの少なくとも一方を抑圧する。
【選択図】図１

Description

本発明は、信号処理装置に係り、音声信号の高品質化処理に関する。

音声信号の高品質化処理、例えば、通話装置などにおいて、通話を行うに際し、通話信
号以外の信号、すなわち音響エコーなどを抑圧する処理が種々知られている。また、この
処理を、前段の処理と後段の処理との２段階に分けて行うことにより、高い性能が得られ
ることが知られている。

例えば、前段では、エコー抑圧処理を行い、後段では、後段の出力である、エコーなど
が抑圧された送話出力信号を用いた短時間スペクトラル振幅推定を行い、その推定値に基
づいてエコー抑圧を行う技術が知られている（例えば、特許文献１参照。）。

また、前段では適応フィルタによって、マイクロホンから入力された送話入力信号に含
まれるエコーを抑圧する処理を行い、後段では、前段で生じた擬似エコー信号に基づいて
エコーまたはノイズの抑圧を行う技術が知られている（例えば、特許文献２参照。）。
特許第３４２０７０５号公報（第２−７頁、図１）特開２００４−５６４５３号公報（第２−４頁、図１）

しかしながら、上述した特許文献１に開示されている方法では、前段の線形エコー抑圧
処理（適応フィルタ）と後段の非線形エコー抑圧処理とを結合させた場合、ダブルトーク
かつエコーパス変動時に、エコー経路の音響結合量（エコーパスロス）は大幅に変化しな
いものと仮定して適応フィルタのフィルタ係数を転用する。このため、ダブルトーク中の
エコーパスロスの変動時など適応フィルタが追従できない場合、充分にエコー抑圧できな
い問題点があった。

また、特許文献２に開示されている方法では、擬似エコー信号を必ず用いるため、適応
フィルタによる前段のエコーパス追従性に、最終の出力である送話出力信号のエコーパス
追従性が依存することになる問題点があった。つまり、前段で、適応フィルタによるエコ
ー推定が精度よくできる前提となっており、急激なエコーパス変動やダブルトーク中のエ
コーパスロスの変動では後段の出力である送話出力信号にエコーが残留しやすい問題点が
あった。

即ち、上記のような従来技術において、例えばダブルトーク中のエコーパスロス変動や
急激なエコーパス変動時に、線形処理であるか非線形処理であるかを問わず、前段で行わ
れるエコー抑圧の性能が充分でない場合、後段で行われるエコー抑圧処理、またはノイズ
抑圧処理、更には、それらを組み合わせた処理において、前段の出力信号中の残留エコー
により、エコー量推定及びノイズ量推定の精度が劣化する。この劣化のため、後段で行わ
れるエコー抑圧処理の性能、及びノイズ抑圧処理の性能が充分でないという問題があった
。この問題点は、後段で行われるボイススイッチにおけるエコーサプレス処理においても
顕著である。

本発明は、上記問題点を解決するためになされたもので、エコー抑圧性能を向上させ、
またはノイズ抑圧性能を向上させ、エコーパスロスの変動を含むエコーパス変動に対する
頑健性を高めた信号処理装置を提供することを目的とする。

上記目的を達成するために、本発明の信号処理装置は、入力信号に含まれる少なくとも
エコーを抑圧してエコー低減信号を出力する第１の信号処理手段と、前記入力信号と前記
エコー低減信号とを入力し、エコー及びノイズの少なくとも一方を抑圧する第２の信号処
理手段と、を備え、前記第２の信号処理手段は、前記入力信号と前記エコー低減信号との
どちらか一方を選択する選択手段を有し、前記選択手段によって選択された前記入力信号
及び前記エコー低減信号のいずれか一方の前記エコー及び前記ノイズの少なくとも一方を
抑圧することを特徴とする。

本発明によれば、エコー抑圧性能を向上させ、またはノイズ抑圧性能を向上させ、エコ
ーパスロスの変動を含むエコーパス変動に対する頑健性を高めた信号処理装置を提供する
ことができる。

以下に、本発明による信号処理装置の実施の形態を、図面を参照して説明する。

（第１の実施形態）
図１は、本発明の第１の実施形態に係る信号処理装置の構成を示すブロック図である。
この信号処理装置は、通信部（ＣＯＭ）１０１と、遅延処理部（ＤＥＬＡＹ）１０２と、
Ｄ／Ａ変換器（Ｄ／Ａ）１０３と、受話増幅器１０４と、スピーカ１０５と、マイクロホ
ン１０６と、送話増幅器１０７と、Ａ／Ｄ変換器（Ａ／Ｄ）１０８と、ハイパスフィルタ
部（ＨＰＦ）１０９と、エコーキャンセラ部（ＥＣ）１１０と、エコーリダクション部（
ＥＲ）１１１とからなる。

図２は、エコーキャンセラ部（ＥＣ）１１０の構成を示すブロック図である。このエコ
ーキャンセラ部（ＥＣ）１１０は、遅延処理部（ＤＥＬＡＹ）１０２と接続される適応フ
ィルタ部（ＡＤＦ）１１０ａと、ハイパスフィルタ部（ＨＰＦ）１０９と接続され、また
、後述するエコーリダクション部（ＥＲ）１１１の周波数領域変換処理部（ＦＴ）１１１
ｃと接続される信号減算処理部１１０ｂと、遅延処理部（ＤＥＬＡＹ）１０２と接続され
、後述するエコーリダクション部（ＥＲ）１１１の周波数領域変換処理部（ＦＴ）１１１
ｃ及び制御部（ＣＴＲＬ）１１１ｋと接続されるダブルトーク検出部（ＤＴＤ）１１０ｃ
とからなる。

図３は、エコーリダクション部（ＥＲ）１１１の構成を示すブロック図である。このエ
コーリダクション部（ＥＲ）１１１は、遅延処理部（ＤＥＬＡＹ）１０２と接続される周
波数領域変換処理部（ＦＴ）１１１ａと、ハイパスフィルタ部（ＨＰＦ）１０９と接続さ
れる周波数領域変換処理部（ＦＴ）１１１ｂと、エコーキャンセラ部（ＥＣ）１１０の信
号減算処理部１１０ｂと接続される周波数領域変換処理部（ＦＴ）１１１ｃと、受話パワ
ー算出部（ＰＯＷ）１１１ｄと、送話パワー算出部（ＰＯＷ）１１１ｅと、残差パワー算
出部（ＰＯＷ）１１１ｆと、音響結合量推定部（ＡＣＬＥ）１１１ｇと、エコー量推定部
（ＥＬＥ）１１１ｈと、エコー抑圧量推定部（ＥＣＬＥ）１１１ｉと、周波数領域ダブル
トーク検出部（ＦＤＴＤ）１１１ｊと、エコーキャンセラ部（ＥＣ）１１０のダブルトー
ク検出部（ＤＴＤ）１１０ｃと接続される制御部（ＣＴＲＬ）１１１ｋと、スペクトル選
択部１１１Ｌと、ゲイン格納部（ＧＴＢＬ）１１１ｍと、エコー抑圧ゲイン算出部（ＧＣ
ＡＬ）１１１ｎと、信号抑圧部（ＳＳ）１１１ｏと、通信部（ＣＯＭ）１０１と接続され
る周波数領域逆変換処理部（ＩＦＴ）１１１ｐとからなる。

上記のように構成された、本発明の第１の実施形態に係る信号処理装置の各部の動作を
、図１〜図４を参照して説明する。

通信部（ＣＯＭ）１０１は、通信相手から受信された受信データを入力し、事前に決め
られた処理時間の単位、つまり１フレーム（Ｎサンプル）ごとにディジタル信号に復号化
する。但し、このサンプリング周波数をｆ_Ｓ［Ｈｚ］とする。そして、通信部（ＣＯＭ）
１０１はこの復号化されたディジタル信号を１フレームごとに受話入力信号ｘ［ｎ］（ｎ
＝０，１，・・・，Ｎ−１）として出力する。

また、通信部（ＣＯＭ）１０１は、周波数領域逆変換処理部（ＩＦＴ）１１１ｐから出
力された送話信号ｓ’［ｎ］（ｎ＝０，１，・・・，Ｎ−１）を入力とし、符号化して、
送信データとして通信相手に出力する。

遅延処理部（ＤＥＬＡＹ）１０２は、通信部（ＣＯＭ）１０１から１フレームごとに出
力された受話入力信号ｘ［ｎ］を入力とし、一時的に格納して、事前に決められた時間分
（Ｄサンプル）ディジタル処理によって遅延させる処理を行い出力する。

Ｄ／Ａ変換器（Ｄ／Ａ）１０３は、通信部（ＣＯＭ）１０１から出力された受話入力信
号ｘ［ｎ］を入力とし、アナログ信号に変換して出力する。

受話増幅器１０４は、Ｄ／Ａ変換器（Ｄ／Ａ）１０３から出力されたアナログ信号を入
力とし、増幅して出力する。

スピーカ１０５は、受話増幅器１０４から出力された増幅したアナログ信号を入力とし
、音響空間へ信号ｘ（ｔ）として出力する。

マイクロホン１０６は、上記のようにしてスピーカ１０５から音響空間に出力された信
号ｘ（ｔ）と、送話音声信号ｓ（ｔ）とが音響結合した信号ｚ（ｔ）を収音し、アナログ
信号に変換して出力する。

送話増幅器１０７は、マイクロホン１０６から出力されたこのアナログ信号を入力とし
、増幅して出力する。

Ａ／Ｄ変換器（Ａ／Ｄ）１０８は、送話増幅器１０７から出力された増幅されたアナロ
グ信号を入力とし、１フレームごとにディジタル信号に変換して出力する。

ハイパスフィルタ部（ＨＰＦ）１０９は、Ａ／Ｄ変換器（Ａ／Ｄ）１０８から出力され
たディジタル信号を入力とし、オフセット（直流成分）除去をし、送話入力信号ｚ［ｎ］
（ｎ＝０，１，・・・，Ｎ−１）として出力する。

エコーキャンセラ部（ＥＣ）１１０は、ハイパスフィルタ部（ＨＰＦ）１０９から出力
された送話入力信号ｚ［ｎ］と、遅延処理部（ＤＥＬＡＹ）１０２から出力された遅延し
た受話入力信号ｘ［ｎ−Ｄ］を入力とし、送話入力信号ｚ［ｎ］からエコー成分を抑圧し
、そのエコー抑圧後の信号を残差信号ｅ［ｎ］（ｎ＝０，１，・・・，Ｎ−１）として出
力する。更に、ダブルトーク情報ＥＣｓｔａｔｅ［ｎ］を出力する。

適応フィルタ部（ＡＤＦ）１１０ａは、長さLのフィルタ係数ｈ［ｉ］（ｉ＝０，１，
・・・，Ｌ−１）が可変のトランスバーサルフィルタ（Transversal Filter）で構成され
る適応フィルタである。

適応フィルタ部（ＡＤＦ）１１０ａは遅延処理部（ＤＥＬＡＹ）１０２から出力された
遅延した受話入力信号ｘ［ｎ−Ｄ］と、信号減算処理部１１０ｂから出力されたエコー抑
圧後の１サンプル前の残差信号ｅ［ｎ−１］と、ダブルトーク検出部（ＤＴＤ）１１０ｃ
から出力されたダブルトーク情報ＥＣｓｔａｔｅ［ｎ］とを入力とし、ダブルトーク情報
ＥＣｓｔａｔｅ［ｎ］がダブルトーク状態でなかった場合はフィルタ係数ｈ［ｉ］をサン
プルｎごとに適応学習し、ダブルトーク情報ＥＣｓｔａｔｅ［ｎ］がダブルトーク状態で
あった場合は、適応学習を行わない。

また、適応フィルタ部（ＡＤＦ）１１０ａは、遅延処理部（ＤＥＬＡＹ）１０２から出
力された遅延した受話入力信号ｘ［ｎ−Ｄ］とフィルタ係数ｈ［ｉ］を用いて擬似エコー
信号ｙ’［ｎ］（ｎ＝０，１，・・・，Ｎ−１）を算出して出力する。

適応フィルタ部（ＡＤＦ）１１０ａは、フィルタ係数ｈ［ｉ］の更新幅を制御する固定
あるいは可変のステップサイズμ_T［ｎ］（ｎ＝０，１，・・・，Ｎ−１）を用いて適応
学習を行う。

また、適応フィルタ部（ＡＤＦ）１１０ａは、例えばＬＭＳ（Least-Mean-Square）ア
ルゴリズム、ＮＬＭＳ（Normalized-Least-Mean-Square）アルゴリズム、学習同定法、ア
フィン射影（ＡＰ：Affine-Projection）アルゴリズム、逐次最小二乗（ＲＬＳ：Recursi
ve-Least-Squares）アルゴリズムなどの線形適応アルゴリズムに基づく適応フィルタや勾
配制限型学習同定法（Gradient-limited Normalized-Least-Mean-Square）、適応ボルテ
ラフィルタ（Adaptive Volterra Filter）などの非線形適応アルゴリズムに基づく適応フ
ィルタで構成される。また、本実施形態では時間領域型適応フィルタの例を示しているが
、サブバンド型（帯域分割型）・周波数領域型で用いる適応フィルタで構成してもよい。

信号減算処理部１１０ｂは、ハイパスフィルタ部（ＨＰＦ）１０９から出力された送話
入力信号ｚ［ｎ］と、適応フィルタ部（ＡＤＦ）１１０ａから出力された擬似エコー信号
ｙ’［ｎ］を入力とし、送話入力信号ｚ［ｎ］から擬似エコー信号ｙ’［ｎ］をサンプル
ｎごとに減算することでエコー成分を抑圧し、そのエコー抑圧後の信号である残差信号ｅ
［ｎ］を出力する。

ダブルトーク検出部（ＤＴＤ）１１０ｃは、ハイパスフィルタ部（ＨＰＦ）１０９から
出力された送話入力信号ｚ［ｎ］と、遅延処理部（ＤＥＬＡＹ）１０２から出力された遅
延した受話入力信号ｘ［ｎ−Ｄ］と、信号減算処理部１１０ｂから出力された１サンプル
前の残差信号ｅ［ｎ−１］を入力とし、サンプルｎごとにダブルトーク状態か否かを判定
する。

具体的には、ダブルトーク検出部（ＤＴＤ）１１０ｃは、送話入力信号ｚ［ｎ］のパワ
ー特性（パワー値またはピーク値。以下、「パワー特性」と称する。）Ｐ_Ｚ［ｎ］（ｎ＝
０，１，・・・，Ｎ−１）と遅延した受話入力信号ｘ［ｎ−Ｄ］のパワー特性Ｐ_Ｘ［ｎ］
（ｎ＝０，１，・・・，Ｎ−１）と残差信号ｅ［ｎ］のパワー特性Ｐ_Ｅ［ｎ］（ｎ＝０，
１，・・・，Ｎ−１）とをサンプルｎごとに算出し、Ｐ_Ｅ［ｎ］＞λ［ｎ］・Ｐ_Ｘ［ｎ］
またはＰ_Ｚ［ｎ］＞δ・Ｐ_Ｘ［ｎ］となる場合にダブルトーク状態と判定する。ここで、
λ［ｎ］（ｎ＝０，１，・・・，Ｎ−１）はエコーパスロスの推定値であり、フィルタ係
数ｈ［ｉ］（ｉ＝０，１，・・・，Ｌ−１）を適応学習したサンプルｎごとに算出し、適
応学習が進めば小さくなり、適応学習が間違っていれば大きくなる可変量である。また、
δは動作開始前に外部から予め設定可能な固定値である。そして、ダブルトーク検出部（
ＤＴＤ）１１０ｃは、ダブルトーク状態か否かの情報であるダブルトーク情報ＥＣｓｔａ
ｔｅ［ｎ］を出力する。

この場合、エコーキャンセラ部（ＥＣ）１１０は、フィルタ係数ｈ［ｉ］（ｉ＝０，１
，・・・，Ｌ−１）、ステップサイズμ_T［ｎ］、エコーパスロスの推定値λ［ｎ］、ダ
ブルトーク情報ＥＣｓｔａｔｅ［ｎ］、受話入力信号のパワー特性Ｐ_Ｘ［ｎ］、送話入力
信号のパワー特性Ｐ_Ｚ［ｎ］、残差信号のパワー特性Ｐ_Ｅ［ｎ］（ｎ＝０，１，・・・，
Ｎ−１）を内部状態としてメモリに保持している。ここで、内部状態とは少なくとも時間
に従って変化する変数の集合を指し、これ以降説明を省略する。

ダブルトーク検出部（ＤＴＤ）１１０ｃを備えないエコーキャンセラ部（ＥＣ）１１０
であっても構わない。この場合、適応フィルタ部（ＡＤＦ）１１０ａと制御部（ＣＴＲＬ
）１１１ｋは、ダブルトーク情報ＥＣｓｔａｔｅ［ｎ］がダブルトーク状態でないことを
示す場合の動作をする。

エコーリダクション部（ＥＲ）１１１は、遅延処理部（ＤＥＬＡＹ）１０２から出力さ
れた遅延した受話入力信号ｘ［ｎ−Ｄ］と、ハイパスフィルタ部（ＨＰＦ）１０９から出
力された送話入力信号ｚ［ｎ］と、信号減算処理部１１０ｂから出力された残差信号ｅ［
ｎ］と、ダブルトーク検出部（ＤＴＤ）１１０ｃから出力されたダブルトーク情報ＥＣｓ
ｔａｔｅ［ｎ］とを入力とし、送話入力信号ｚ［ｎ］あるいは残差信号ｅ［ｎ］の少なく
とも一方からエコー成分を抑圧し、そのエコー抑圧後の信号を送話出力信号ｓ’［ｎ］（
ｎ＝０，１，・・・，Ｎ−１）として１フレームごとに出力する。

周波数領域変換処理部（ＦＴ）１１１ａは、遅延処理部（ＤＥＬＡＹ）１０２から出力
された遅延した受話入力信号ｘ［ｎ−Ｄ］を入力として、ＦＦＴ（Fast Fourier Transfo
rm）などの処理によって周波数領域に変換して、受話入力信号の周波数スペクトルＸ［ｆ
，ω］を算出して出力する。

周波数領域変換処理部（ＦＴ）１１１ｂは、ハイパスフィルタ部（ＨＰＦ）１０９から
出力された送話入力信号ｚ［ｎ］をＦＦＴなどによって周波数領域に変換して、送話入力
信号の周波数スペクトルＺ［ｆ，ω］を算出して出力する。

周波数領域変換処理部（ＦＴ）１１１ｃは、信号減算処理部１１０ｂから出力された残
差信号ｅ［ｎ］をＦＦＴなどによって周波数領域に変換して、残差信号の周波数スペクト
ルＥ［ｆ，ω］を算出して出力する。

周波数領域変換処理部（ＦＴ）１１１ａ、周波数領域変換処理部（ＦＴ）１１１ｂ及び
周波数領域変換処理部（ＦＴ）１１１ｃは、適宜、ハミング窓などによる窓掛けや、過去
のフレームを用いたり零補間したりオーバーラップを行う。例えば、過去１フレーム分と
当該フレームからＦＦＴ点数分の信号を取り出し、ハミング窓による窓掛けを行い、ＦＦ
Ｔを行う。

受話パワー算出部（ＰＯＷ）１１１ｄは、周波数領域変換処理部（ＦＴ）１１１ａから
出力された受話入力信号の周波数スペクトルＸ［ｆ，ω］を入力とし、そのパワースペク
トルである受話パワースペクトル｜Ｘ［ｆ，ω］｜^２を算出して出力する。そして、音響
結合量は通常時間的に急に変化しないので、瞬時値を用いるよりもスムージングした値を
用いた方が音響結合量を精度良く推定できるため、受話パワー算出部（ＰＯＷ）１１１ｄ
は、例えば、式１に示すように１フレーム前の値｜Ｘ_Ｓ［ｆ−１，ω］｜^２を用いてスム
ージングした受話パワースペクトル｜Ｘ_Ｓ［ｆ，ω］｜^２を算出して出力する。ただし、
α_Ｘ［ω］は、０．７５〜０．９９９程度が望ましい。

送話パワー算出部（ＰＯＷ）１１１ｅは、周波数領域変換処理部（ＦＴ）１１１ｂから
出力された送話入力信号の周波数スペクトルＺ［ｆ，ω］を入力とし、そのパワースペク
トルである送話パワースペクトル｜Ｚ［ｆ，ω］｜^２を算出して出力する。そして、音響
結合量は通常時間的に急に変化しないので、瞬時値を用いるよりもスムージングした値を
用いた方が音響結合量を精度良く推定できるため、送話パワー算出部（ＰＯＷ）１１１ｅ
は、例えば、式２に示すように１フレーム前の値｜Ｚ_Ｓ［ｆ−１，ω］｜^２を用いてスム
ージングした送話パワースペクトル｜Ｚ_Ｓ［ｆ，ω］｜^２を算出して出力する。ただし、
α_Ｚ［ω］は、０．７５〜０．９９９程度が望ましい。

残差パワー算出部（ＰＯＷ）１１１ｆは、周波数領域変換処理部（ＦＴ）１１１ｃから
出力された残差信号の周波数スペクトルＥ［ｆ，ω］を入力とし、そのパワースペクトル
である残差パワースペクトル｜Ｅ［ｆ，ω］｜^２を算出して出力する。そして、音響結合
量は通常時間的に急に変化しないので、瞬時値を用いるよりもスムージングした値を用い
た方が音響結合量を精度良く推定できるため、残差パワー算出部（ＰＯＷ）１１１ｆは、
例えば、式３に示すのように１フレーム前の値｜Ｅ_Ｓ［ｆ−１，ω］｜^２を用いてスムー
ジングした残差パワースペクトル｜Ｅ_Ｓ［ｆ，ω］｜^２を算出して出力する。ただし、α
_Ｅ［ω］は、０．７５〜０．９９９程度が望ましい。

音響結合量推定部（ＡＣＬＥ）１１１ｇは、受話パワー算出部（ＰＯＷ）１１１ｄから
出力されたスムージングされた受話パワースペクトル｜Ｘ_Ｓ［ｆ，ω］｜^２と、送話パワ
ー算出部（ＰＯＷ）１１１ｅから出力されたスムージングされた送話パワースペクトル｜
Ｚ_Ｓ［ｆ，ω］｜^２と、周波数領域ダブルトーク検出部（ＦＤＴＤ）１１１ｊから出力さ
れる周波数領域ダブルトーク情報ＥＲｓｔａｔｅ［ｆ，ω］とを入力とし、エコーキャン
セラ部（ＥＣ）１１０の性能の影響を受けないように残差信号に基づく｜Ｅ_Ｓ［ｆ，ω］
｜^２を用いずに送話入力信号に基づく｜Ｚ_Ｓ［ｆ，ω］｜^２を用いて、周波数帯域ω毎に
音響結合量｜Ｈ［ｆ，ω］｜^２を例えば、以下の式４によって算出する。このようにする
ことで、後述する第５の実施形態に係る信号処理装置と比較して、計算量を少なくするこ
とができ、各パラメータの格納に必要なメモリ量も少なくすることができる。

そして、音響結合量推定部（ＡＣＬＥ）１１１ｇは、以下の式５のように１フレーム前
の値を用いてスムージングした音響結合量｜Ｈ_Ｓ［ｆ，ω］｜^２を算出して出力する。た
だし、α_Ｈ［ω］は、０．０３〜０．９９程度が望ましい。

ここで、通話開始初期時、例えば通話開始から５秒間程度はα_Ｈ［ω］を大きくするこ
とで音響結合量｜Ｈ_Ｓ［ｆ，ω］｜^２の更新を速めておく。このようにすることで通話開
始初期時は音響結合量が初期化されているので、通話開始初期時に抑圧量が少なくなって
しまうのを防止することができる。

ただし、周波数領域ダブルトーク検出部（ＦＤＴＤ）１１１ｊから出力される周波数領
域ダブルトーク情報ＥＲｓｔａｔｅ［ｆ，ω］がダブルトーク状態である場合、あるいは
音響結合量が急激に変化する場合、即ち、｜Ｈ_Ｓ［ｆ，ω］｜^２＞β_Ｈ［ω］・｜Ｈ_Ｓ［
ｆ−１，ω］｜^２が満たされる場合、あるいは受話入力信号が十分に大きくない場合、即
ち、｜Ｘ_Ｓ［ｆ，ω］｜^２＜β_Ｘ［ω］が満たされる場合には、エコーパス変動への高速
な追従性を保ちつつ、ダブルトークとなる周波数帯域での音響結合量の算出を行わないよ
うにするため、音響結合量推定部（ＡＣＬＥ）１１１ｇは、音響結合量を更新しないで１
フレーム前の過去の音響結合量｜Ｈ_Ｓ［ｆ−１，ω］｜^２を用いる。極端な音響結合量の
変化はダブルトークの可能性があるので、このように音響結合量を更新しないでおくこと
で送話音質劣化を防止することができる。ただし、β_Ｈ［ω］は０．９〜３０程度が望ま
しい。β_Ｘ［ω］は３０ｄＢ〜４０ｄＢ程度が望ましい。

エコー量推定部（ＥＬＥ）１１１ｈは、受話パワー算出部（ＰＯＷ）１１１ｄから出力
されたスムージングされた受話パワースペクトル｜Ｘ_Ｓ［ｆ，ω］｜^２と、音響結合量推
定部（ＡＣＬＥ）１１１ｇから出力された音響結合量｜Ｈ_Ｓ［ｆ，ω］｜^２とを入力とし
、送話入力信号の周波数スペクトルＺ［ｆ，ω］に含まれるエコー量｜Ｙ［ｆ，ω］｜^２
を以下の式６のように周波数帯域ω毎に推定して出力する。

そして、エコー量推定部（ＥＬＥ）１１１ｈは、瞬時のエコー量｜Ｙ［ｆ，ω］｜^２を
用いるよりもスムージングした値を用いた方がエコー抑圧後の信号をより自然な信号にで
きるため、以下の式７のように１フレーム前の値を用いてスムージングしたエコー量｜Ｙ
_Ｓ［ｆ，ω］｜^２を周波数帯域ω毎に算出して出力する。ただし、αＹ［ω］は０．７〜
０．９９程度が望ましい。

エコー抑圧量推定部（ＥＣＬＥ）１１１ｉは、送話パワー算出部（ＰＯＷ）１１１ｅか
ら出力された送話パワースペクトル｜Ｚ［ｆ，ω］｜^２と、残差パワー算出部（ＰＯＷ）
１１１ｆから出力された残差パワースペクトル｜Ｅ［ｆ，ω］｜^２とを入力とし、それら
のパワースペクトル間の相違を示す量を計算することによって、エコーキャンセラ部（Ｅ
Ｃ）１１０で抑圧されたエコー抑圧量ＥＣＬ［ｆ，ω］を周波数帯域ω毎に推定して出力
する。具体的には、以下に示す式８に示すように算出する。もちろん、これら２つのパワ
ースペクトルの差などを用いてもよい。

周波数領域ダブルトーク検出部（ＦＤＴＤ）１１１ｊは、受話パワー算出部（ＰＯＷ）
１１１ｄから出力されたスムージングされた受話パワースペクトル｜Ｘ_Ｓ［ｆ，ω］｜^２
と、残差パワー算出部（ＰＯＷ）１１１ｆから出力されたスムージングされた残差パワー
スペクトル｜Ｅ_Ｓ［ｆ，ω］｜^２と、エコー量推定部（ＥＬＥ）１１１ｈから出力された
１フレーム前のエコー量｜Ｙ［ｆ−１，ω］｜^２とを入力とし、周波数帯域ω毎に以下に
示す式９が満たされるか否かの判定を行う。

ここでは、エコーリダクション部（ＥＲ）１１１のエコー抑圧処理後のパワースペクト
ルを残差パワースペクトルとエコー量の距離で代用し、それが十分に受話パワースペクト
ルよりも小さくなっているか否かを判定に用いる。そして、閾値β_Ｙ［ω］よりも大きけ
れば、即ち、式９が満たされる場合、ダブルトーク状態と判定し、式９が満たされない場
合、ダブルトーク状態でないと判定して、ダブルトーク状態か否かの情報を周波数領域ダ
ブルトーク情報ＥＲｓｔａｔｅ［ｆ，ω］として出力する。これにより、計算量が小さい
周波数領域ＤＴＤが実現できる。

もちろん、周波数領域ダブルトーク検出部（ＦＤＴＤ）１１１ｊを備えないエコーリダ
クション部（ＥＲ）１１１であっても構わない。この場合、音響結合量推定部（ＡＣＬＥ
）１１１ｇと制御部（ＣＴＲＬ）１１１ｋは、周波数領域ダブルトーク情報ＥＲｓｔａｔ
ｅ［ｆ，ω］がダブルトーク状態でないことを示す場合の動作をする。ただし、β_Ｙ［ω
］は１．０〜２０程度が望ましい。

制御部（ＣＴＲＬ）１１１ｋは、エコー抑圧量推定部（ＥＣＬＥ）１１１ｉから出力さ
れたエコー抑圧量ＥＣＬ［ｆ，ω］と、ダブルトーク検出部（ＤＴＤ）１１０ｃから出力
されたダブルトーク情報ＥＣｓｔａｔｅ［ｎ］と、周波数領域ダブルトーク検出部（ＦＤ
ＴＤ）１１１ｊから出力される周波数領域ダブルトーク情報ＥＲｓｔａｔｅ［ｆ，ω］と
を入力とし、周波数帯域ω毎にダブルトーク状態かつエコーキャンセラ部（ＥＣ）１１０
のエコー抑圧量が十分でない周波数帯域を検出して、ダブルトーク状態かつエコーキャン
セラ部（ＥＣ）１１０のエコー抑圧量が十分でない周波数帯域であるか否かの情報である
制御情報ＥＲｃｏｎｔｒｏｌ１［ｆ，ω］及びＥＲｃｏｎｔｒｏｌ２［ｆ，ω］を出力す
る。

まず、制御部（ＣＴＲＬ）１１１ｋは、周波数領域ダブルトーク情報ＥＲｓｔａｔｅ［
ｆ，ω］を用いて周波数帯域ω毎に周波数領域ダブルトーク検出部（ＦＤＴＤ）１１１ｊ
でダブルトーク状態と判定されているか否か、ダブルトーク情報ＥＣｓｔａｔｅ［ｎ］を
用いてエコーキャンセラ部（ＥＣ）１１０のダブルトーク検出部（ＤＴＤ）１１０ｃが当
該フレームでダブルトーク状態と１サンプルでも判定されているか否か、によって周波数
帯域ω毎にダブルトーク状態であるか否かを判定する。

ここでは、周波数領域ダブルトーク情報ＥＲｓｔａｔｅ［ｆ，ω］あるいはダブルトー
ク情報ＥＣｓｔａｔｅ［ｎ］のいずれか１つ、または双方がダブルトーク状態であること
を示していれば、制御部（ＣＴＲＬ）１１１ｋは周波数帯域ω毎にダブルトーク状態であ
ると判定する。

このようにエコーキャンセラ部（ＥＣ）１１０のダブルトーク検出部（ＤＴＤ）１１０
ｃから出力されたダブルトーク情報ＥＣｓｔａｔｅ［ｎ］を用いれば、エコーキャンセラ
部（ＥＣ）１１０のエコー抑圧量が十分でない状況は、ダブルトーク中のエコーパス変動
で生じやすいため、ダブルトーク状態かつエコーキャンセラ部（ＥＣ）１１０のエコー抑
圧量が十分でない周波数帯域を精度よく検出することできる。

次に、制御部（ＣＴＲＬ）１１１ｋは、周波数帯域ω毎にＥＣＬ［ｆ，ω］＞β_Ｚ１［
ω］を満たした周波数帯域をエコーキャンセラ部（ＥＣ）１１０のエコー抑圧量が十分で
ないと判定する。ただし、β_Ｚ１［ω］は＋８ｄＢ〜−１５ｄＢ程度が望ましい。本実施
形態では以下、β_Ｚ１［ω］を０ｄＢとして説明する。

１つの周波数帯域でのみエコーキャンセラ部（ＥＣ）１１０のエコー抑圧量が少ないと
いうことはありえにくい、つまりエコーキャンセラ部（ＥＣ）１１０の性能は時間領域で
切り替わると考えられるため、制御部（ＣＴＲＬ）１１１ｋは、エコーキャンセラ部（Ｅ
Ｃ）１１０のエコー抑圧量が十分でない周波数帯域を精度よく検出するために、併せて、
１フレーム当りの不等式ＥＣＬ［ｆ，ω］＞β_Ｚ１［ω］が成立した帯域数ｃｏｕｎｔも
加味してエコー抑圧量が少ないと判定する。

つまり、ＥＣＬ［ｆ，ω］＞β_Ｚ１［ω］かつｃｏｕｎｔ＞β_Ｃ、となる場合にエコー
抑圧量が少ないと判定する。ただし、β_Ｃ１は全周波数帯域数の１０％〜４０％程度が望
ましい。このようにすることで周波数帯域毎だけで判定するよりも受話入力信号と送話入
力信号の音量差に対して頑健になりエコー抑圧量が十分でないフレームを精度よく検出す
ることができる。そして、先の周波数帯域ω毎にダブルトーク状態の判定と併せて、制御
部（ＣＴＲＬ）１１１ｋは、ダブルトーク状態かつエコーキャンセラ部（ＥＣ）１１０の
エコー抑圧量が十分でない周波数帯域を検出して制御情報ＥＲｃｏｎｔｒｏｌ１［ｆ，ω
］を出力する。

同様にして、制御部（ＣＴＲＬ）１１１ｋは、１フレーム当りの式ＥＣＬ［ｆ，ω］＞
β_Ｚ２［ω］が成立した帯域数ｃｏｕｎｔも加味して、ＥＣＬ［ｆ，ω］＞β_Ｚ２［ω］
かつｃｏｕｎｔ＞β_Ｃ２、となる場合にエコー抑圧量が少ないと判定して、先の周波数帯
域ω毎にダブルトーク状態の判定と併せて、制御情報ＥＲｃｏｎｔｒｏｌ２［ｆ，ω］を
出力する。ただし、β_Ｚ２［ω］は＋８ｄＢ〜−１５ｄＢ程度、β_Ｃ２は全周波数帯域数
の１０％〜４０％程度が望ましい。

スペクトル選択部１１１Ｌは、周波数領域変換処理部（ＦＴ）１１１ｂから出力された
送話入力信号の周波数スペクトルＺ［ｆ，ω］と、周波数領域変換処理部（ＦＴ）１１１
ｃから出力された残差信号の周波数スペクトルＥ［ｆ，ω］と、制御部（ＣＴＲＬ）１１
１ｋから出力されたダブルトーク状態かつエコーキャンセラ部（ＥＣ）１１０のエコー抑
圧量が十分でない周波数帯域であるか否かの情報である制御情報ＥＲｃｏｎｔｒｏｌ１［
ｆ，ω］とを入力とし、送話入力信号の周波数スペクトルＺ［ｆ，ω］あるいは残差信号
の周波数スペクトルＥ［ｆ，ω］のいずれか一方を周波数スペクトルとして選択して出力
する。

具体的には、制御情報ＥＲｃｏｎｔｒｏｌ１［ｆ，ω］がダブルトーク状態かつエコー
キャンセラ部（ＥＣ）１１０のエコー抑圧量が十分でないと検出された周波数帯域であっ
た場合は、スペクトル選択部１１１Ｌは、周波数スペクトルとして送話入力信号の周波数
スペクトルＺ［ｆ，ω］を選択する。それ以外の周波数帯域は周波数スペクトルとして残
差信号の周波数スペクトルＥ［ｆ，ω］を選択する。

このようにすることで周波数帯域ごとに、エコーキャンセラ部（ＥＣ）１１０のエコー
抑圧量が十分でない場合、つまりエコーキャンセラ部（ＥＣ）１１０の推定精度が十分と
れない場合はエコーリダクション部（ＥＲ）１１１を単体で動作させることができる。

ゲイン格納部（ＧＴＢＬ）１１１ｍは、事前に設定された非線形エコー抑圧量を制御す
るパラメータγ［ω］を格納して出力する。ただし、γ［ω］は１．０〜２．０程度が望
ましい。

エコー抑圧ゲイン算出部（ＧＣＡＬ）１１１ｎは、送話パワー算出部（ＰＯＷ）１１１
ｅから出力されたスムージングされた送話パワースペクトル｜Ｚ_Ｓ［ｆ，ω］｜^２と、エ
コー量推定部（ＥＬＥ）１１１ｈから出力されたスムージングしたエコー量｜Ｙ_Ｓ［ｆ，
ω］｜^２と、ゲイン格納部（ＧＴＢＬ）１１１ｍから出力されたパラメータγ［ω］と、
エコー抑圧量推定部（ＥＣＬＥ）１１１ｉから出力されたエコー抑圧量ＥＣＬ［ｆ，ω］
と、制御部（ＣＴＲＬ）１１１ｋから出力されたダブルトーク状態かつエコーキャンセラ
部（ＥＣ）１１０のエコー抑圧量が十分でない周波数帯域であるか否かの情報である制御
情報ＥＲｃｏｎｔｒｏｌ２［ｆ，ω］とを入力とし、エコー抑圧ゲインＧ［ｆ，ω］を算
出して出力する。

具体的には、制御情報ＥＲｃｏｎｔｒｏｌ２［ｆ，ω］からダブルトーク状態かつエコ
ーキャンセラ部（ＥＣ）１１０のエコー抑圧量が十分でないと検出された周波数帯域につ
いては、エコー抑圧ゲイン算出部（ＧＣＡＬ）１１１ｎは、エコー抑圧ゲインＧ［ｆ，ω
］をウィナー・フィルタ（Wiener Filter）法を用いて、式１０によって算出する。この
ように算出することで、ダブルトーク状態かつエコーキャンセラ部（ＥＣ）１１０のエコ
ー抑圧量が十分でないと検出された周波数帯域については、エコーリダクション部（ＥＲ
）１１１単体でエコー抑圧することができる。

それ以外の周波数帯域では、エコー抑圧ゲイン算出部（ＧＣＡＬ）１１１ｎは、エコー
キャンセラ部（ＥＣ）１１０のエコー抑圧量が十分であり、エコーキャンセラ部（ＥＣ）
１１０が正常に機能していると見なして、エコーリダクション（ＥＲ）１１１のエコー抑
圧量を多くするように、エコーキャンセラ部（ＥＣ）１１０のエコー抑圧量ＥＣＬ［ｆ，
ω］を用いて補正し、エコー抑圧ゲインＧ［ｆ，ω］を以下の式１１が示すように算出す
る。

このように算出することで、後述する第５の実施形態に係る信号処理装置と比較して、
計算量を少なくすることができ、各パラメータの格納に必要なメモリ量も少なくすること
ができる。

また、エコー抑圧ゲイン算出部（ＧＣＡＬ）１１１ｎは、過剰なエコー抑圧により送話
音声の品質が劣化するのを防止し、背景雑音の断続的な抑圧を防止するため、エコー抑圧
ゲインＧ［ｆ，ω］が所定の下限値以下にならないように制御する。

図４は、その下限値の一例を示す。図４の実線、破線が示すように、エコー抑圧ゲイン
の下限値を帯域別にバスタブ曲線状、即ち、最低域（０からｆ_Ｓ／１６［Ｈｚ］）側及び
最高域（７・ｆ_Ｓ／１６からｆ_Ｓ／２［Ｈｚ］）側を０．０４から０．１２程度に大きく
し、中域（ｆ_Ｓ／８から３・ｆ_Ｓ／８［Ｈｚ］）付近を０．０１から０．０５程度に小さ
くするように設定する。なぜなら、最低域側や最高域側に抑圧できなかったエコー成分が
残ると耳障りであるので、そのエコー成分を抑圧しやすくすることができて送話音声を聴
感上よくすることができる。勿論、図４の点線が示すようにバスタブ曲線を段階的に変化
する一定値として設定してもかまわない。

さらに、エコー抑圧ゲイン算出部（ＧＣＡＬ）１１１ｎは、過剰なエコー抑圧により送
話音声の品質が劣化するのを防止するため、送話入力信号ｚ［ｎ］あるいは残差信号ｅ［
ｎ］の有音区間ではない区間の信号レベルを用いて周波数帯域ごとに背景雑音レベルを算
出しておき、背景雑音レベルよりも抑圧しないようにエコー抑圧ゲインを制御しても構わ
ない。

さらにまた、エコー抑圧ゲイン算出部（ＧＣＡＬ）１１１ｎは、送話音質が劣化するの
を防止するために、エコー抑圧ゲインＧ［ｆ，ω］を以下の式１２−１あるいは式１２−
２が示すように周波数方向にスムージングして出力してもよい。例えば、ε_ｊは、［０．
１、０．２、０．４、０．２、０．１］、η_ｊは、［０．１、０．２、０．４、０．８、
０．４、０．２、０．１］のようにしてよい。

信号抑圧部（ＳＳ）１１１ｏは、スペクトル選択部１１１Ｌから出力された周波数スペ
クトルと、エコー抑圧ゲイン算出部（ＧＣＡＬ）１１１ｎから出力されたエコー抑圧ゲイ
ンＧ［ｆ，ω］とを入力として、スペクトル選択部１１１Ｌから出力された周波数スペク
トルのエコーを抑圧し、以下の式１３−１あるいは式１３−２が示すように送話出力信号
のスペクトルＳ’［ｆ，ω］として出力する。

このとき、送話入力信号の周波数スペクトルＺ［ｆ，ω］と残差信号の周波数スペクト
ルＥ［ｆ，ω］とのどちらの周波数スペクトルがスペクトル選択部１１１Ｌで選択されて
も、エコーキャンセラ部（ＥＣ）１１０は時間領域での処理であるから、位相スペクトル
に差がないため、出力された送話出力信号は聴感上滑らかにつなぐことができる。

制御部（ＣＴＲＬ）１１１ｋからスペクトル選択部１１１Ｌへ出力される制御情報ＥＲ
ｃｏｎｔｒｏｌ１［ｆ，ω］と、制御部（ＣＴＲＬ）１１１ｋからエコー抑圧ゲイン算出
部（ＧＣＡＬ）１１１ｎへ出力される制御情報ＥＲｃｏｎｔｒｏｌ２［ｆ，ω］とは異な
っていても構わない。例えば、制御部（ＣＴＲＬ）１１１ｋのパラメータβ_Ｚ１［ω］及
びβ_Ｃ１の値とβ_Ｚ２［ω］及びβ_Ｃ２を異なる値にすることで、制御情報ＥＲｃｏｎｔ
ｒｏｌ１［ｆ，ω］のダブルトーク状態かつエコー抑圧量が十分でないと検出される条件
を包含するように、制御情報ＥＲｃｏｎｔｒｏｌ２［ｆ，ω］のダブルトーク状態かつエ
コー抑圧量が十分でないと検出される条件を広く設定する。こうするに、２つの制御情報
を用いることによって、エコー抑圧ゲインをスムージングした場合に、送話音声の品質劣
化を防止できる。

周波数領域逆変換処理部（ＩＦＴ）１１１ｐは、信号抑圧部（ＳＳ）１１１ｏから出力
された周波数スペクトルＳ’［ｆ，ω］を入力とし、ＩＦＦＴ（Inverse Fast Fourier T
ransform）などによって送話出力信号ｓ’［ｎ］（ｎ＝０，１，・・・，Ｎ−１）を算出
して出力する。このとき適宜、周波数領域変換処理部（ＦＴ）１１１ｂ及び周波数領域変
換処理部（ＦＴ）１１１ｃの窓掛けを考慮して、過去のフレームのｓ’［ｎ］を用いてオ
ーバーラップを戻す処理を行う。

上記のように構成された、第１の実施形態に係る信号処理装置の処理の流れを、図５〜
図７を参照して説明する。図５は、全体の処理の流れを示すフローチャートであり、図６
はエコーキャンセラ部（ＥＣ）１１０における処理の流れを示すフローチャートであり、
図７はエコーリダクション部（ＥＲ）１１１における処理の流れを示すフローチャートで
ある。

図５において、発呼又は着呼があると、通信部（ＣＯＭ）１０１は通信リンクを確立す
る処理を行い、また各パラメータや各バッファの初期化などの初期設定処理を行う（ステ
ップＳ１００１）。通信リンクが確立することにより、通信相手と双方向通話が可能な状
態となり、双方向の通話が開始されると、通信部（ＣＯＭ）１０１にあり図示されないデ
コーダは１フレームごとに復号化され受話入力信号ｘ［ｎ］として読み込む。また、マイ
クロホン１０６を介して送話入力信号ｚ［ｎ］が読み込まれる（ステップＳ１００２）。

そして、ハイパスフィルタ部（ＨＰＦ）１０９は、送話入力信号ｚ［ｎ］のオフセット
除去処理を行う（ステップＳ１００３）。また、遅延処理部（ＤＥＬＡＹ）１０２は受話
入力信号ｘ［ｎ］を一時的に蓄えて遅延させる処理を行う（ステップＳ１００４）。これ
ら遅延した受話入力信号ｘ［ｎ−Ｄ］とオフセット除去された送話入力信号ｚ［ｎ］を入
力として、エコーキャンセラ部（ＥＣ）１１０はエコーキャンセラ処理を行う（ステップ
Ｓ１００５）。

そして、遅延した受話入力信号ｘ［ｎ−Ｄ］と、オフセット除去された送話入力信号ｚ
［ｎ］と、エコーキャンセラ部（ＥＣ）１１０から出力されたエラーキャンセラ処理後の
信号である残差信号ｅ［ｎ］を入力として、エコーリダクション部（ＥＲ）１１１は非線
形エコー抑圧処理であるエコーリダクション処理を行う（ステップＳ１００６）。そして
、ステップＳ１００２からステップＳ１００６の処理を、通話が終了するまで行う（ステ
ップＳ１００７）。

図６に示すエコーキャンセラ部（ＥＣ）１１０の処理は、次のように行われる。まず、
ダブルトーク検出部（ＤＴＤ）１１０ｃがダブルトーク検出処理を行う（ステップＳ１１
０１）。次に、適応フィルタ部（ＡＤＦ）１１０ａはダブルトーク情報ＥＣｓｔａｔｅ［
ｎ］の制御を受けながら、適応フィルタ処理を行う（ステップＳ１１０２）。そして、信
号減算処理部１１０ｂは、送話入力信号ｚ［ｎ］から、適応フィルタ部（ＡＤＦ）１１０
ａから出力された擬似エコー信号ｙ’［ｎ］を減算し、残差信号ｅ［ｎ］を算出して出力
し、エコーキャンセラ処理が終了する。

図７に示すエコーリダクション部（ＥＲ）１１１の処理は、次のように行われる。まず
、周波数領域変換処理部（ＦＴ）１１１ａ、周波数領域変換処理部（ＦＴ）１１１ｂ、周
波数領域変換処理部（ＦＴ）１１１ｃは、それぞれ周波数領域に変換するためのバッファ
である受話フレーム、送話フレーム、残差フレームを更新する（ステップＳ１２０１ｒ、
Ｓ１２０１ｓ、Ｓ１２０１ｅ）。

次に、周波数領域変換処理部（ＦＴ）１１１ａは遅延した受話入力信号ｘ［ｎ−Ｄ］を
周波数領域に変換して、受話入力信号の周波数スペクトルＸ［ｆ，ω］を算出して（ステ
ップＳ１２０２ｒ）、受話パワー算出部（ＰＯＷ）１１１ｄは受話パワースペクトル｜Ｘ
［ｆ，ω］｜^２及びスムージングされた受話パワースペクトル｜Ｘ_Ｓ［ｆ，ω］｜^２を算
出する（ステップＳ１２０３ｒ）。

同様に、周波数領域変換処理部（ＦＴ）１１１ｂは送話入力信号ｚ［ｎ］を周波数領域
に変換して、送話入力信号の周波数スペクトルＺ［ｆ，ω］を算出して（ステップＳ１２
０２ｓ）、送話パワー算出部（ＰＯＷ）１１１ｅは送話パワースペクトル｜Ｚ［ｆ，ω］
｜^２及びスムージングされた送話パワースペクトル｜Ｚ_Ｓ［ｆ，ω］｜^２を算出する（ス
テップＳ１２０３ｓ）。

さらに同様に、周波数領域変換処理部（ＦＴ）１１１ｃは残差信号ｅ［ｎ］を周波数領
域に変換して、残差信号の周波数スペクトルＥ［ｆ，ω］を算出して（ステップＳ１２０
２ｅ）、残差パワー算出部（ＰＯＷ）１１１ｆは残差パワースペクトル｜Ｅ［ｆ，ω］｜
^２及びスムージングされた残差パワースペクトル｜Ｅ_Ｓ［ｆ，ω］｜^２を算出する（ステ
ップＳ１２０３ｅ）。

そして、周波数領域ダブルトーク検出部（ＦＤＴＤ）１１１ｊは周波数領域ダブルトー
ク情報ＥＲｓｔａｔｅ［ｆ，ω］を出力し、音響結合量推定部（ＡＣＬＥ）１１１ｇは、
スムージングされた受話パワースペクトル｜Ｘ_Ｓ［ｆ，ω］｜^２とスムージングされた送
話パワースペクトル｜Ｚ_Ｓ［ｆ，ω］｜^２と、周波数領域ダブルトーク情報ＥＲｓｔａｔ
ｅ［ｆ，ω］とを入力として音響結合量｜Ｈ_Ｓ［ｆ，ω］｜^２を算出する（ステップＳ１
２０４）。エコー量推定部（ＥＬＥ）１１１ｈは、音響結合量｜Ｈ_s［ｆ，ω］｜^２とス
ムージングした受話パワースペクトル｜Ｘ_Ｓ［ｆ，ω］｜^２とを入力として送話入力信号
に含まれるエコー量｜Ｙ_Ｓ［ｆ，ω］｜^２を推定する（ステップＳ１２０５）。

次に、エコー抑圧量推定部（ＥＣＬＥ）１１１ｉは、送話パワースペクトル｜Ｚ［ｆ，
ω］｜^２と残差パワースペクトル｜Ｅ［ｆ，ω］｜^２とを入力として、エコーキャンセラ
部（ＥＣ）１１０で抑圧されたエコー抑圧量ＥＣＬ［ｆ，ω］を推定する（ステップＳ１
２０６）。そして、制御部（ＣＴＲＬ）１１１ｋは、ダブルトーク状態であるか否か、及
びエコーキャンセラ部（ＥＣ）１１０のエコー抑圧量が十分であるか否かの判定処理を行
い、制御情報ＥＲｃｏｎｔｒｏｌ１［ｆ，ω］及びＥＲｃｏｎｔｒｏｌ２［ｆ，ω］を出
力する（ステップＳ１２０７）。

エコー抑圧ゲイン算出部（ＧＣＡＬ）１１１ｎは、送話パワー算出部（ＰＯＷ）１１１
ｅから出力されたスムージングされた送話パワースペクトル｜Ｚ_Ｓ［ｆ，ω］｜^２と、エ
コー量推定部（ＥＬＥ）１１１ｈから出力されたスムージングしたエコー量｜Ｙ_Ｓ［ｆ，
ω］｜^２と、ゲイン格納部（ＧＴＢＬ）１１１ｍから出力されたパラメータγ［ω］と、
エコー抑圧量推定部（ＥＣＬＥ）１１１ｉから出力されたエコー抑圧量ＥＣＬ［ｆ，ω］
と、制御部（ＣＴＲＬ）１１１ｋから出力された制御情報ＥＲｃｏｎｔｒｏｌ２［ｆ，ω
］とを入力として、ダブルトーク状態かつエコー抑圧量が十分でないと検出された周波数
帯域と、それ以外の周波数帯域とで、それぞれ異なる計算によってエコー抑圧ゲインＧ［
ｆ，ω］を算出する。また、エコー抑圧ゲイン算出部（ＧＣＡＬ）１１１ｎはエコー抑圧
ゲインＧ［ｆ，ω］を所定の下限値以下にならないように制御する（ステップＳ１２０８
）。

一方、スペクトル選択部１１１Ｌは、制御部（ＣＴＲＬ）１１１ｋから出力された制御
情報ＥＲｃｏｎｔｒｏｌ１［ｆ，ω］を入力として、ダブルトーク状態かつエコー抑圧量
が十分でないと検出された周波数帯域では、周波数スペクトルとして送話入力信号の周波
数スペクトルＺ［ｆ，ω］を選択し、それ以外の周波数帯域では周波数スペクトルとして
残差信号の周波数スペクトルＥ［ｆ，ω］を選択する（ステップＳ１２０９）。

そして、信号抑圧部（ＳＳ）１１１ｏは、スペクトル選択部１１１Ｌで選択された周波
数スペクトルと、エコー抑圧ゲイン算出部（ＧＣＡＬ）１１１ｎで算出されたエコー抑圧
ゲインＧ［ｆ，ω］を入力として、選択された周波数スペクトルのエコーを抑圧する（ス
テップＳ１２１０）。最終的に、周波数領域逆変換処理部（ＩＦＴ）１１１ｐは、信号抑
圧部（ＳＳ）１１１ｏから出力された周波数スペクトルＳ’［ｆ，ω］を周波数逆変換処
理することによって（ステップＳ１２１１）、エコーリダクション処理が終了する。

このようにしてエコーリダクション部（ＥＲ）１１１から出力された送話出力信号ｓ’
［ｎ］は、通信部（ＣＯＭ）１０１にあり図示しないエンコーダによって１フレームごと
に符号化され、この符号化によって得られたデータは、通信部（ＣＯＭ）１０１を通じて
、送信データとして通信相手に送信される。

上記では、エコーリダクション部（ＥＲ）１１１はＦＦＴによる周波数領域型で周波数
帯域毎に処理する方式として動作するものとして説明した。ＦＦＴによる周波数帯域をグ
ループでまとめて周波数帯域グループ毎に処理する方式や、フィルタバンクなどの帯域分
割フィルタなどの周波数領域型を実現してもよい。

なお、ダブルトーク中のエコーパスロス変動時では、エコーキャンセラ部（ＥＣ）１１
０の処理によって送話入力信号ｚ［ｎ］よりも残差信号ｅ［ｎ］が大きくなってしまい、
エコーキャンセラ部（ＥＣ）１１０の処理によるエコー抑圧量が十分でない場合がある。

その場合、以上説明した信号処理装置の動作により、エコーキャンセラ部（ＥＣ）１１
０の処理によるエコー抑圧量が十分でない周波数領域をエコー抑圧量推定部（ＥＣＬＥ）
１１１ｉと制御部（ＣＴＲＬ）１１１ｋで判定して、スペクトル選択部１１１Ｌとエコー
抑圧ゲイン算出部（ＧＣＡＬ）１１１ｎにおいて周波数帯域毎にエコーキャンセラ部（Ｅ
Ｃ）１１０の処理とエコーリダクション部（ＥＲ）１１１の処理の重みを変化させるよう
に制御することができるので、エコーパスロス変動に対して頑健にすることが可能であり
、高品質な送話出力信号を出力することが可能である。

（第１の実施形態の変形例）
本発明の第１の実施形態の変形例に係る信号処理装置が第１の実施形態に係る信号処理
装置と異なる点は、エコーリダクション部（ＥＲ）１１１に代えて、エコーリダクション
部（ＥＲ）１１１２を有する点である。図８に、本発明の第１の実施形態の変形例に係る
信号処理装置のエコーリダクション部（ＥＲ）１１１２の構成を示すブロック図を示す。

エコーリダクション部（ＥＲ）１１１２がエコーリダクション部（ＥＲ）１１１と異な
る点は、音響結合量推定部（ＡＣＬＥ）１１１ｇに代えて音響結合量推定部（ＡＣＬＥ）
１１１ｇ２を有し、エコー抑圧ゲイン算出部（ＧＣＡＬ）１１１ｎに代えてエコー抑圧ゲ
イン算出部（ＧＣＡＬ）１１１ｎ２を有する点にある。

更に、エコーリダクション部（ＥＲ）１１１２において、送話パワー算出部（ＰＯＷ）
１１１ｅの出力をエコー抑圧量推定部（ＥＣＬＥ）１１１ｉのみに入力させ、残差パワー
算出部（ＰＯＷ）１１１ｆの出力をエコー抑圧量推定部（ＥＣＬＥ）１１１ｉと周波数領
域ダブルトーク検出部（ＦＤＴＤ）１１１ｊに加えて、音響結合量推定部（ＡＣＬＥ）１
１１ｇ２とエコー抑圧ゲイン算出部（ＧＣＡＬ）１１１ｎ２にも入力させた点にあり、そ
の他の部分は同じである。そこで、このエコーリダクション部（ＥＲ）１１１２で、エコ
ーリダクション部（ＥＲ）１１１と同じ部分については、同じ符号を付してその説明を省
略する。

音響結合量推定部（ＡＣＬＥ）１１１ｇ２は、受話パワー算出部（ＰＯＷ）１１１ｄか
ら出力されたスムージングされた受話パワースペクトル｜Ｘ_Ｓ［ｆ，ω］｜^２と、残差パ
ワー算出部（ＰＯＷ）１１１ｆから出力されたスムージングされた残差パワースペクトル
｜Ｅ_Ｓ［ｆ，ω］｜^２と、周波数領域ダブルトーク検出部（ＦＤＴＤ）１１１ｊから出力
される周波数領域ダブルトーク情報ＥＲｓｔａｔｅ［ｆ，ω］とを入力とし、周波数帯域
ω毎に音響結合量｜Ｈ［ｆ，ω］｜^２を、｜Ｅ_Ｓ［ｆ，ω］｜^２を用いて以下の式１４に
よって算出する。

そして、音響結合量推定部（ＡＣＬＥ）１１１ｇ２は、以下の式１５のように１フレー
ム前の値を用いてスムージングした音響結合量｜Ｈ_Ｓ［ｆ，ω］｜^２を算出して出力する
。ただし、α_Ｈ［ω］は、０．０３〜０．９９程度が望ましい。

エコー抑圧ゲイン算出部（ＧＣＡＬ）１１１ｎ２は、残差パワー算出部（ＰＯＷ）１１
１ｆから出力されたスムージングされた残差パワースペクトル｜Ｅ_Ｓ［ｆ，ω］｜^２と、
エコー量推定部（ＥＬＥ）１１１ｈから出力されたスムージングしたエコー量｜Ｙ_Ｓ［ｆ
，ω］｜^２と、ゲイン格納部（ＧＴＢＬ）１１１ｍから出力されたパラメータγ［ω］と
、エコー抑圧量推定部（ＥＣＬＥ）１１１ｉから出力されたエコー抑圧量ＥＣＬ［ｆ，ω
］と、制御部（ＣＴＲＬ）１１１ｋから出力されたダブルトーク状態かつエコーキャンセ
ラ部（ＥＣ）１１０のエコー抑圧量が十分でない周波数帯域であるか否かの情報である制
御情報ＥＲｃｏｎｔｒｏｌ２［ｆ，ω］とを入力とし、エコー抑圧ゲインＧ［ｆ，ω］を
算出して出力する。

具体的には、エコー抑圧ゲイン算出部（ＧＣＡＬ）１１１ｎ２は、制御部（ＣＴＲＬ）
１１１ｋから出力された制御情報ＥＲｃｏｎｔｒｏｌ２［ｆ，ω］からダブルトーク状態
かつエコーキャンセラ部（ＥＣ）１１０のエコー抑圧量が十分でないと検出された周波数
帯域については、エコーキャンセラ部（ＥＣ）１１０のエコー抑圧量の分を増した抑圧量
をエコーリダクション（ＥＲ）１１１２のエコー抑圧量にするため、エコー抑圧ゲインＧ
［ｆ，ω］をエコーキャンセラ部（ＥＣ）１１０のエコー抑圧量ＥＣＬ［ｆ，ω］を用い
て抑圧量を補正し以下の式１６のように算出する。

それ以外の周波数帯域では、エコー抑圧ゲイン算出部（ＧＣＡＬ）１１１ｎ２は、エコ
ー抑圧ゲインＧ［ｆ，ω］をウィナー・フィルタ（Wiener Filter）法を用いて、式１７
−１によって算出する。あるいは、エコーキャンセラ部（ＥＣ）１１０が正常に機能して
いると見なして、エコーリダクション（ＥＲ）１１１のエコー抑圧量を多くするように、
エコーキャンセラ部（ＥＣ）１１０のエコー抑圧量ＥＣＬ［ｆ，ω］を用いて補正し、エ
コー抑圧ゲインＧ［ｆ，ω］を以下の式１７−２が示すように算出する。

以上説明した第１の実施形態の変形例に係る信号処理装置の動作により、エコーパス変
動はほとんどなく、エコーキャンセラ部（ＥＣ）１１０の抑圧性能が安定していることが
多い用途では、エコーキャンセラ部（ＥＣ）１１０とエコーリダクション（ＥＲ）１１１
２の直列接続が選択されやすくなるので、過剰なエコー抑圧を防ぐことができ、送話音質
が劣化するのを防止することが可能である。

（第２の実施形態）
第２の実施形態に係る信号処理装置が第１の実施形態に係る信号処理装置と異なる点は
、図９に示すようにエコーリダクション部（ＥＲ）１１１を有さず、ノイズリダクション
部（ＮＲ）２１１を有する点にあり、その他の部分は同じである。そこで、同じ部分につ
いては、同じ符号を付してその説明を省略し、図面を参照して第２の実施形態に係るノイ
ズリダクション部（ＮＲ）２１１を説明する。なお、このノイズリダクション部（ＮＲ）
２１１で、第１の実施形態に係るエコーリダクション部（ＥＲ）１１１と同じ部分につい
ては、同じ符号を付してその説明を省略する。

図１０は、第２の実施形態に係る信号処理装置のノイズリダクション部（ＮＲ）２１１
の構成を示すブロック図である。このノイズリダクション部（ＮＲ）２１１は、周波数領
域変換処理部（ＦＴ）１１１ｂと、周波数領域変換処理部（ＦＴ）１１１ｃと、送話パワ
ー算出部（ＰＯＷ）１１１ｅと、残差パワー算出部（ＰＯＷ）１１１ｆと、エコー抑圧量
推定部（ＥＣＬＥ）１１１ｉと、制御部（ＣＴＲＬ）２１１ｋと、スペクトル選択部２１
１Ｌと、ノイズ抑圧ゲイン算出部（ＧＣＡＬ）２１１ｎと、信号抑圧部（ＳＳ）２１１ｏ
と、周波数領域逆変換処理部（ＩＦＴ）１１１ｐと、雑音レベル推定部（ＮＬＥ）２１１
ｑとからなる。

ノイズリダクション部（ＮＲ）２１１は、ハイパスフィルタ部（ＨＰＦ）１０９から出
力された送話入力信号ｚ［ｎ］と、信号減算処理部１１０ｂから出力された残差信号ｅ［
ｎ］とを入力とし、送話入力信号ｚ［ｎ］あるいは残差信号ｅ［ｎ］の少なくとも一方か
らノイズ成分を抑圧し、そのノイズ抑圧後の信号を送話出力信号ｓ’［ｎ］（ｎ＝０，１
，・・・，Ｎ−１）として１フレームごとに出力する。

雑音レベル推定部（ＮＬＥ）２１１ｑは、周波数領域変換処理部（ＦＴ）１１１ｂから
出力された送話スペクトルＺ［ｆ，ω］と、周波数領域変換処理部（ＦＴ）１１１ｃから
出力された残差スペクトルＥ［ｆ，ω］とを入力とし、有音ではない区間のスペクトルを
測定し、周波数帯域ω毎に送話スペクトルＺ［ｆ，ω］に含まれる雑音レベル｜Ｎ_Ｚ［ｆ
，ω］｜^２と残差スペクトルＥ［ｆ，ω］に含まれる雑音レベル｜Ｎ_Ｅ［ｆ，ω］｜^２と
を算出して出力する。

制御部（ＣＴＲＬ）２１１ｋは、エコー抑圧量推定部（ＥＣＬＥ）１１１ｉから出力さ
れたエコー抑圧量ＥＣＬ［ｆ，ω］を入力とし、周波数帯域ω毎にエコーキャンセラ部（
ＥＣ）１１０のエコー抑圧量が十分でない周波数帯域を検出して、エコーキャンセラ部（
ＥＣ）１１０のエコー抑圧量が十分でない周波数帯域であるか否かの情報である制御情報
ＮＲｃｏｎｔｒｏｌ［ｆ，ω］を出力する。

具体的には、制御部（ＣＴＲＬ）２１１ｋは、周波数帯域ω毎に不等式ＥＣＬ［ｆ，ω
］＞β_Ｚ［ω］を満たした周波数帯域であり、かつ１フレーム当りの不等式ＥＣＬ［ｆ，
ω］＞β_Ｚ［ω］が成立した帯域数ｃｏｕｎｔがβ_Ｃより大きい場合にエコー抑圧量が少
ないと判定する。ただし、β_Ｚ［ω］は＋８ｄＢ〜−１５ｄＢ程度、β_Ｃは全周波数帯域
数の１０％〜４０％程度が望ましい。本実施形態では以下、β_Ｚ［ω］を０ｄＢとして説
明する。

スペクトル選択部２１１Ｌは、周波数領域変換処理部（ＦＴ）１１１ｂから出力された
送話入力信号の周波数スペクトルＺ［ｆ，ω］と、周波数領域変換処理部（ＦＴ）１１１
ｃから出力された残差信号の周波数スペクトルＥ［ｆ，ω］と、制御部（ＣＴＲＬ）２１
１ｋから出力されたエコーキャンセラ部（ＥＣ）１１０のエコー抑圧量が十分でない周波
数帯域であるか否かの情報である制御情報ＮＲｃｏｎｔｒｏｌ［ｆ，ω］とを入力とし、
送話入力信号の周波数スペクトルＺ［ｆ，ω］あるいは残差信号の周波数スペクトルＥ［
ｆ，ω］のいずれか一方を周波数スペクトルとして選択して出力する。

具体的には、制御情報ＮＲｃｏｎｔｒｏｌ［ｆ，ω］がエコーキャンセラ部（ＥＣ）１
１０のエコー抑圧量が十分でないと検出された周波数帯域であった場合は、周波数スペク
トルとして送話入力信号の周波数スペクトルＺ［ｆ，ω］を選択する。それ以外の周波数
帯域であった場合は周波数スペクトルとして残差信号の周波数スペクトルＥ［ｆ，ω］を
選択する。

このようにすることで周波数帯域ごとに、エコーキャンセラ部（ＥＣ）１１０のエコー
抑圧量が十分でない場合は、ノイズリダクション部（ＮＲ）２１１を単体で動作させ、雑
音レベルの推定がエコーの影響を受けないようにすることができる。

ノイズ抑圧ゲイン算出部（ＧＣＡＬ）２１１ｎは、雑音レベル推定部（ＮＬＥ）２１１
ｑから出力された雑音レベル｜Ｎ_Ｚ［ｆ，ω］｜^２及び｜Ｎ_Ｅ［ｆ，ω］｜^２と、送話パ
ワー算出部（ＰＯＷ）１１１ｅから出力された送話パワースペクトル｜Ｚ［ｆ，ω］｜^２
と、制御部（ＣＴＲＬ）２１１ｋから出力された制御情報ＮＲｃｏｎｔｒｏｌ［ｆ，ω］
と、信号抑圧部（ＳＳ）１１１ｏから出力された１フレーム前の送話出力信号のスペクト
ルＳ’［ｆ−１，ω］を入力とし、ノイズ抑圧ゲインＧ［ｆ，ω］を算出して出力する。

具体的には、ノイズ抑圧ゲイン算出部（ＧＣＡＬ）２１１ｎは、まず、制御部（ＣＴＲ
Ｌ）２１１ｋから出力された制御情報ＮＲｃｏｎｔｒｏｌ［ｆ，ω］によってエコー抑圧
量が十分でないと検出された周波数帯域については、エコーキャンセラ部（ＥＣ）１１０
の処理後の残留エコーの影響で雑音推定の精度が取れていないと判定して、雑音レベルと
して｜Ｎ_Ｚ［ｆ，ω］｜^２を選択する。それ以外の周波数帯域では雑音レベルとして｜Ｎ
_Ｅ［ｆ，ω］｜^２を選択する。

そして、周波数帯域ω毎に選択された雑音レベルに基づいて、以下のアルゴリズムまた
はそれらの組み合わせでノイズ抑圧ゲインＧ［ｆ，ω］を算出する。即ち、一般のノイズ
リダクションであるスペクトル・サブトラクション（Spectral Subtraction）法（S. F.
Boll, “Suppression of acoustic noise in speech using spectral subtraction”, IE
EE Trans. Acoustics, Speech, and Signal Processing, vol.ASSP-29, pp.113-120 (197
9).）、ウィナー・フィルター（Wiener Filter）法（J. S. Lim, A. V. Oppenheim, “En
hancement and bandwidth compression of noisy speech”, Proc. IEEE Vol.67, No.12,
pp.1586-1604, Dec.1979.）及び最尤推定（Maximum Likelihood）法（R. J. McAulay, M
. L. Malpass, “Speech enhancement using a soft-decision noise suppression filte
r”, IEEE Trans. on Acoustics, Speech, and Signal Processing, vol.ASSP-28, no.2,
pp.137-145, Apr.1980.）などである。

また、送話出力信号の１フレーム前の周波数スペクトルＳ’［ｆ−１，ω］を用いて事
前ＳＮ比ＳＮＲ_ＰＲＩＯ［ｆ，ω］及び事後ＳＮ比ＳＮＲ_ＰＯＳＴ［ｆ，ω］を推定算出
してノイズ抑圧ゲインを精度よく推定する手法（例えば、P. Scalart, J. V. Filho, ”S
peech enhancement based on a priori signal to noise estimation”, Proc. ICASSP96
, pp.629-632, May 1996.）、ＭＭＳＥ−ＳＴＳＡ（Minimum Mean-Square Error Short-T
ime Spectral Amplitude estimator）法（Y. Ephraim, D. Malah, “Speech enhancement
using a minimum mean-square error short-time spectral amplitude estimator”, IE
EE Trans. on Acoustics, Speech, and Signal Processing, vol.ASSP-32, no.6, pp.110
9-1121, Dec.1984.）及びJoint MAP法（T. Lotter, P. Vary, “Noise reduction by max
imum a posteriori spectral amplitude estimation with super Gaussian speech model
ing”, Proc. IWAENC, pp.83-86, Sep.2003.）などである。

例えば、雑音レベル｜Ｎ_Ｚ［ｆ，ω］｜^２が選択されたときは、Ｐ［・］を半波整流と
して、事前ＳＮ比ＳＮＲ_ＰＲＩＯ［ｆ，ω］及び事後ＳＮ比ＳＮＲ_ＰＯＳＴ［ｆ，ω］は
、それぞれ、以下の式１８−１、式１８−２により求められ、この場合ウィナー・フィル
ター法を用いるとノイズ抑圧ゲインＧ［ｆ，ω］は、以下の式１８−３により算出される
。但し、μ［ω］は０．９〜０．９９９程度の忘却係数である。一方、雑音レベル｜Ｎ_Ｅ
［ｆ，ω］｜^２が選択されたときは、同様にして以下の式１８−１、式１８−２における
｜Ｎ_Ｚ［ｆ，ω］｜^２を｜Ｎ_Ｅ［ｆ，ω］｜^２に置き換えてノイズ抑圧ゲインＧ［ｆ，ω
］を以下の式１８−３により算出する。

また、ノイズ抑圧ゲイン算出部（ＧＣＡＬ）２１１ｎは、過剰なノイズ抑圧により送話
音質が劣化するのを防止し、背景雑音の断続的な抑圧を防止するため、ノイズ抑圧ゲイン
Ｇ［ｆ，ω］が所定の下限値以下にならないように制御する。即ち、図４を参照して説明
したエコー抑圧ゲインの下限値の帯域別の設定が、ノイズ抑圧ゲインの下限値の帯域別の
設定にも適用される。

さらに、過剰なノイズ抑圧により送話音質が劣化するのを防止するため、送話入力信号
ｚ［ｎ］あるいは残差信号ｅ［ｎ］の有音区間ではない区間の信号レベルを用いて周波数
帯域ごとに背景雑音レベルを算出しておき、背景雑音レベルよりも抑圧しないようにノイ
ズ抑圧ゲインを制御しても構わない。

信号抑圧部（ＳＳ）２１１ｏは、スペクトル選択部２１１Ｌから出力された周波数スペ
クトルと、ノイズ抑圧ゲイン算出部（ＧＣＡＬ）２１１ｎから出力されたノイズ抑圧ゲイ
ンＧ［ｆ，ω］とを入力として、スペクトル選択部２１１Ｌから出力された周波数スペク
トルのノイズを抑圧し、以下の式１９−１あるいは式１９−２が示すようにして送話出力
信号のスペクトルＳ’［ｆ，ω］として出力する。

このとき、送話入力信号の周波数スペクトルＺ［ｆ，ω］と残差信号の周波数スペクト
ルＥ［ｆ，ω］のどちらの周波数スペクトルがスペクトル選択部２１１Ｌで選択されても
、エコーキャンセラ部（ＥＣ）１１０は時間領域での処理であるから、位相スペクトルに
差がないため、出力された送話出力信号は聴感上滑らかにつなぐことができる。

次に、上記のように構成された第２の実施形態に係る信号処理装置の処理の流れを説明
する。図１１は、第２の実施形態に係る信号処理装置の全体の処理の流れを示すフローチ
ャートである。なお、図５を参照して説明した第１の実施形態に係る信号処理装置の動作
と同じ動作ステップについては、同じ符号を付してその部分の説明を省略する。

ステップＳ１００５のエコーキャンセラ処理の後、信号処理装置は、第１の実施形態に
おいてはステップＳ１００６でエコーリダクション処理を行ったのに代えて、第２の実施
形態においては、ステップＳ１００５で得られたエコーキャンセラ処理後の信号を用いて
ノイズリダクション処理を行う（ステップＳ２００６）。そして、ステップＳ１００７の
終話か否かの判断に移る。

第２の実施形態に係るエコーキャンセル部（ＥＣ）１１０は、第１の実施形態に係るエ
コーキャンセル部（ＥＣ）１１０と同じであるので、それぞれの実施形態における処理の
流れは、当然に同じであり説明を省略する。

図１２は、第２の実施形態に係るノイズリダクション部（ＮＲ）２１１における処理の
流れを示すフローチャートである。なお、図７を参照して説明した第１の実施形態に係る
エコーリダクション部（ＥＲ）１１１における動作と同じ動作ステップについては、同じ
符号を付してその部分の説明を省略する。

第２の実施形態に係るノイズリダクション部（ＮＲ）２１１は、ステップＳ１２０１ｒ
の受話フレーム更新処理、ステップＳ１２０２ｒの受話周波数変換処理、ステップＳ１２
０３ｒの受話パワースペクトル算出処理、ステップＳ１２０４の音響結合量算出処理、ス
テップＳ１２０５のエコーレベル算出処理、ステップＳ１２０７の判定処理からステップ
Ｓ１２１０の送話信号抑圧処理までの動作はない。

即ち、第２の実施形態に係るノイズリダクション部（ＮＲ）２１１は、ノイズリダクシ
ョン処理を開始して、ステップＳ１２０３ｓの送話パワースペクトル算出処理、及びステ
ップＳ１２０３ｅの残差パワースペクトル算出処理の後、雑音レベル推定部（ＮＬＥ）２
１１ｑは、有音区間でない区間のスペクトルを測定することにより、周波数帯域ω毎に送
話入力信号の周波数スペクトルに含まれる雑音レベルと、残差信号の周波数スペクトルに
含まれる雑音レベルをそれぞれ算出する（ステップＳ２２０５）。その後、ステップＳ１
２０６のエコー抑圧量算出処理を行い、制御部（ＣＴＲＬ）２１１ｋは、エコーキャンセ
ラ部（ＥＣ）１１０のエコー抑圧量が十分であるか否かの判定処理を行い、制御情報ＮＲ
ｃｏｎｔｒｏｌ［ｆ，ω］を出力する（ステップＳ２２０７）。

そして、ノイズ抑圧ゲイン算出部（ＧＣＡＬ）２１１ｎは、送話パワー算出部（ＰＯＷ
）１１１ｅから出力された送話パワースペクトル｜Ｚ［ｆ，ω］｜^２と、制御部（ＣＴＲ
Ｌ）２１１ｋから出力された制御情報ＮＲｃｏｎｔｒｏｌ［ｆ，ω］を入力として、エコ
ー抑圧量が十分でないと検出された周波数帯域と、それ以外の周波数帯域とで、それぞれ
異なる計算によってノイズ抑圧ゲインＧ［ｆ，ω］を算出する。また、ノイズ抑圧ゲイン
算出部（ＧＣＡＬ）２１１ｎはノイズ抑圧ゲインＧ［ｆ，ω］を所定の下限値以下になら
ないように制御する（ステップＳ２２０８）。

そして、スペクトル選択部２１１Ｌは、制御部（ＣＴＲＬ）２１１ｋから出力された制
御情報ＮＲｃｏｎｔｒｏｌ［ｆ，ω］を入力として、エコー抑圧量が十分でないと検出さ
れた周波数帯域について、周波数スペクトルとして送話入力信号の周波数スペクトルＺ［
ｆ，ω］を選択し、それ以外の周波数帯域では周波数スペクトルとして残差信号の周波数
スペクトルＥ［ｆ，ω］を選択する（ステップＳ２２０９）。

そして、信号抑圧部（ＳＳ）２１１ｏは、スペクトル選択部２１１Ｌで選択された周波
数スペクトルとノイズ抑圧ゲイン算出部（ＧＣＡＬ）２１１ｎで算出されたノイズ抑圧ゲ
インＧ［ｆ，ω］を入力として、選択された周波数スペクトルのノイズを抑圧する（ステ
ップＳ２２１０）。そして、ステップＳ１２１１の周波数逆変換処理に移って、ノイズリ
ダクション処理が終了する。

以上、ノイズリダクション部（ＮＲ）２１１はＦＦＴによる周波数領域型で周波数帯域
毎に処理する方式として動作するものとして説明した。ＦＦＴによる周波数帯域をグルー
プでまとめて周波数帯域グループ毎に処理する方式や、フィルタバンクなどの帯域分割フ
ィルタなどの周波数領域型を実現してもよい。

ダブルトーク中のエコーパスロス変動時では、エコーキャンセラ部（ＥＣ）１１０の処
理によって送話入力信号ｚ［ｎ］よりも残差信号ｅ［ｎ］が大きくなってしまい、エコー
キャンセラ部（ＥＣ）１１０の処理によるエコー抑圧量が十分でない場合がある。

以上説明した第２の実施形態に係る信号処理装置の動作により、エコーキャンセラ部（
ＥＣ）１１０の処理によるエコー抑圧量が十分でない周波数領域をエコー抑圧量推定部（
ＥＣＬＥ）１１１ｉと制御部（ＣＴＲＬ）２１１ｋで検出して、周波数帯域毎にノイズリ
ダクション部（ＮＲ）２１１の雑音レベル推定部（ＮＬＥ）２１１ｑとスペクトル選択部
２１１Ｌとノイズ抑圧ゲイン算出部（ＧＣＡＬ）２１１ｎによって雑音レベルの推定がエ
コーの影響を受けないようにすることができるので、エコーパスロス変動に対して頑健に
することが可能であり、高品質な信号を出力することが可能である。

（第３の実施形態）
図１３は、第３の実施形態に係る信号処理装置の構成を示すブロック図である。この信
号処理装置が第１の実施形態に係る信号処理装置と異なる点は、エコーリダクション部（
ＥＲ）１１１を有さず、エコーノイズリダクション部（ＥＮＲ）３１１を有する点にあり
、その他の部分は同じである。そこで、同じ部分については、同じ符号を付してその説明
を省略し、図面を参照して第３の実施形態に係るエコーノイズリダクション部（ＥＮＲ）
３１１を説明する。なお、このエコーノイズリダクション部（ＥＮＲ）３１１で、第１の
実施形態に係るエコーリダクション部（ＥＲ）１１１及び第２の実施形態に係るノイズリ
ダクション部（ＮＲ）２１１と同じ部分については、同じ符号を付してその説明を省略す
る。

図１４は、第３の実施形態に係る信号処理装置のエコーノイズリダクション部（ＥＮＲ
）３１１の構成を示すブロック図である。このエコーノイズリダクション部（ＥＮＲ）３
１１は、周波数領域変換処理部（ＦＴ）１１１ａと、周波数領域変換処理部（ＦＴ）１１
１ｂと、周波数領域変換処理部（ＦＴ）１１１ｃと、受話パワー算出部（ＰＯＷ）１１１
ｄと、送話パワー算出部（ＰＯＷ）１１１ｅと、残差パワー算出部（ＰＯＷ）１１１ｆと
、音響結合量推定部（ＡＣＬＥ）１１１ｇと、エコー量推定部（ＥＬＥ）１１１ｈ、エコ
ー抑圧量推定部（ＥＣＬＥ）１１１ｉと、制御部（ＣＴＲＬ）２１１ｋと、スペクトル選
択部２１１Ｌと、ゲイン格納部（ＧＴＢＬ）１１１ｍと、エコーノイズ抑圧ゲイン算出部
（ＧＣＡＬ）３１１ｎと、信号抑圧部（ＳＳ）３１１ｏと、周波数領域逆変換処理部（Ｉ
ＦＴ）１１１ｐと、雑音レベル推定部（ＮＬＥ）３１１ｑとからなる。

エコーノイズリダクション部（ＥＮＲ）３１１は、ハイパスフィルタ部（ＨＰＦ）１０
９から出力された送話入力信号ｚ［ｎ］と、信号減算処理部１１０ｂから出力された残差
信号ｅ［ｎ］とを入力とし、送話入力信号ｚ［ｎ］あるいは残差信号ｅ［ｎ］の少なくと
も一方からエコー成分及びノイズ成分を抑圧し、そのエコー抑圧及びノイズ抑圧後の信号
を送話出力信号ｓ’［ｎ］（ｎ＝０，１，・・・，Ｎ−１）として１フレームごとに出力
する。

雑音レベル推定部（ＮＬＥ）３１１ｑは、スペクトル選択部２１１Ｌから出力された周
波数スペクトル（送話スペクトルＺ［ｆ，ω］あるいは残差スペクトルＥ［ｆ，ω］）を
入力とし、有音ではない区間のスペクトルを測定し、周波数帯域ω毎に周波数スペクトル
に含まれる雑音レベル｜Ｎ［ｆ，ω］｜^２を算出して出力する。

エコーノイズ抑圧ゲイン算出部（ＧＣＡＬ）３１１ｎは、エコー量推定部（ＥＬＥ）１
１１ｈから出力されたスムージングしたエコー量｜Ｙ_Ｓ［ｆ，ω］｜^２と、ゲイン格納部
（ＧＴＢＬ）１１１ｍから出力されたパラメータγ［ω］と、送話パワー算出部（ＰＯＷ
）１１１ｅから出力されたスムージングされた送話パワースペクトル｜Ｚ_Ｓ［ｆ，ω］｜
^２と、雑音レベル推定部（ＮＬＥ）３１１ｑから出力された雑音レベル｜Ｎ［ｆ，ω］｜
^２と、制御部（ＣＴＲＬ）２１１ｋから出力された制御情報ＮＲｃｏｎｔｒｏｌ［ｆ，ω
］とを入力とし、エコーノイズ抑圧ゲインＧ［ｆ，ω］を算出して出力する。

具体的には、エコーノイズ抑圧ゲイン算出部（ＧＣＡＬ）３１１ｎは、まず、制御部（
ＣＴＲＬ）２１１ｋから出力された制御情報ＮＲｃｏｎｔｒｏｌ［ｆ，ω］によってエコ
ー抑圧量が十分でないと検出された周波数帯域については、過剰なエコー抑圧により送話
音質が劣化するのを防止するため、スムージングされた送話パワースペクトル｜Ｚ_Ｓ［ｆ
，ω］｜^２から雑音レベル｜Ｎ［ｆ，ω］｜^２を除去して、エコー抑圧ゲインＧ_ＥＲ［ｆ
，ω］を式２０によって算出する。

それ以外の周波数帯域では、エコーキャンセラ部（ＥＣ）１１０のエコー抑圧量が十分
であり、エコーキャンセラ部（ＥＣ）１１０が正常に機能していると見なして、エコーノ
イズ抑圧ゲイン算出部（ＧＣＡＬ）３１１ｎは、エコーノイズリダクション部（ＥＮＲ）
３１１のエコー抑圧量を多くするように、エコーキャンセラ部（ＥＣ）１１０のエコー抑
圧量ＥＣＬ［ｆ，ω］を用いて補正し、エコー抑圧ゲインＧ_ＥＲ［ｆ，ω］を以下の式２
１が示すように算出する。

また、エコーノイズ抑圧ゲイン算出部（ＧＣＡＬ）３１１ｎは、周波数帯域ω毎に選択
された雑音レベル｜Ｎ［ｆ，ω］｜^２に基づいて、前述した一般のノイズリダクションで
あるスペクトル・サブトラクション（Spectral Subtraction）法やウィナー・フィルター
（Wiener Filter）法や最尤推定（Maximum Likelihood）法などのアルゴリズムでノイズ
抑圧ゲインＧ_ＮＲ［ｆ，ω］を算出する。

そして、式２２に示すように、エコー抑圧ゲインＧ_ＥＲ［ｆ，ω］とノイズ抑圧ゲイン
Ｇ_ＮＲ［ｆ，ω］の積を算出し、エコーノイズ抑圧ゲインＧ［ｆ，ω］とする。

また、過剰なエコー抑圧により送話音質が劣化するのを防止するため、エコーノイズ抑
圧ゲイン算出部（ＧＣＡＬ）３１１ｎは、エコーノイズ抑圧ゲインＧ［ｆ，ω］は所定の
下限値以下にならないように制御する。即ち、図４を参照して説明したエコー抑圧ゲイン
の下限値の帯域別の設定が、エコーノイズ抑圧ゲインの下限値の帯域別の設定にも適用さ
れる。

さらに、過剰なエコー及びノイズ抑圧により送話音質が劣化するのを防止するため、エ
コーノイズ抑圧ゲイン算出部（ＧＣＡＬ）３１１ｎは、送話入力信号ｚ［ｎ］あるいは残
差信号ｅ［ｎ］の有音区間ではない区間の信号レベルを用いて周波数帯域ごとに背景雑音
レベルを算出しておき、背景雑音レベルよりも抑圧しないようにエコーノイズ抑圧ゲイン
を制御しても構わない。

さらにまた、エコーノイズ抑圧ゲイン算出部（ＧＣＡＬ）３１１ｎは、送話音質が劣化
するのを防止するために、エコーノイズ抑圧ゲインＧ［ｆ，ω］を以下の式２３−１ある
いは式２３−２が示すように周波数方向にスムージングして出力してもよい。例えば、ε
_ｊは、［０．１、０．２、０．４、０．２、０．１］、η_ｊは、［０．１、０．２、０．
４、０．８、０．４、０．２、０．１］のようにしてよい。

信号抑圧部（ＳＳ）３１１ｏは、スペクトル選択部２１１Ｌから出力された周波数スペ
クトルと、エコーノイズ抑圧ゲイン算出部（ＧＣＡＬ）３１１ｎから出力されたエコーノ
イズ抑圧ゲインＧ［ｆ，ω］とを入力として、スペクトル選択部２１１Ｌから出力された
周波数スペクトルのエコー及びノイズを抑圧し、以下の式２４−１または式２４−２のよ
うに送話出力信号のスペクトルＳ’［ｆ，ω］を算出して出力する。

次に、上記のように構成された第３の実施形態に係る信号処理装置の処理の流れを説明
する。図１５は、第３の実施形態に係る信号処理装置の全体の処理の流れを示すフローチ
ャートである。なお、図５を参照して説明した第１の実施形態に係る信号処理装置の動作
と同じ動作ステップについては、同じ符号を付してその部分の説明を省略する。

ステップＳ１００５のエコーキャンセラ処理の後、信号処理装置は、第１の実施形態に
おいてはステップＳ１００６でエコーリダクション処理を行ったのに代えて、第３の実施
形態においては、ステップＳ１００５で得られたエコーキャンセラ処理後の信号を用いて
エコーノイズリダクション処理を行う（ステップＳ３００６）。そして、ステップＳ１０
０７の終話か否かの判断に移る。

第３の実施形態に係るエコーキャンセル部（ＥＣ）１１０は、第１の実施形態に係るエ
コーキャンセル部（ＥＣ）１１０と同じであるので、それぞれの実施形態における処理の
流れは、当然に同じであり説明を省略する。

図１６は、第３の実施形態に係るエコーノイズリダクション部（ＥＮＲ）３１１におけ
る処理の流れを示すフローチャートである。なお、図７を参照して説明した第１の実施形
態に係るエコーリダクション部（ＥＲ）１１１及び図１２を参照して説明した第２の実施
形態に係るノイズリダクション部（ＮＲ）２１１における動作と同じ動作ステップについ
ては、同じ符号を付してその部分の説明を省略する。

第３の実施形態に係るエコーノイズリダクション部（ＥＮＲ）３１１は、エコーノイズ
リダクション処理を開始して、ステップＳ１２０１ｒ〜Ｓ１２０３ｒ、Ｓ１２０１ｓ〜Ｓ
１２０３ｓ及びＳ１２０１ｅ〜Ｓ１２０３ｅの受話、送話、残差の各信号に対するフレー
ム更新処理、周波数変換処理、パワースペクトル算出処理、ステップＳ１２０４の音響結
合量算出処理、ステップＳ１２０５のエコーレベル算出処理、ステップＳ１２０６のエコ
ー抑圧量算出処理を行う。

そして、ステップＳ２２０７の判定処理、及びステップＳ２２０９のスペクトル選択処
理の後、雑音レベル推定部（ＮＬＥ）３１１ｑから出力された雑音レベル｜Ｎ［ｆ，ω］
｜^２を算出する（ステップＳ３２０５）。

そして、エコーノイズ抑圧ゲイン算出部（ＧＣＡＬ）３１１ｎは、雑音レベル推定部（
ＮＬＥ）３１１ｑから出力された雑音レベル｜Ｎ［ｆ，ω］｜^２と、制御部（ＣＴＲＬ）
２１１ｋから出力された制御情報ＮＲｃｏｎｔｒｏｌ［ｆ，ω］とを入力として、エコー
抑圧量が十分でないと検出された周波数帯域と、それ以外の周波数帯域とで、それぞれ異
なる計算によってエコーノイズ抑圧ゲインＧ［ｆ，ω］を算出する。また、エコーノイズ
抑圧ゲイン算出部（ＧＣＡＬ）３１１ｎはエコーノイズ抑圧ゲインＧ［ｆ，ω］を所定の
下限値以下にならないように制御する（ステップＳ３２０８）。

そして、信号抑圧部（ＳＳ）３１１ｏは、スペクトル選択部２１１Ｌで選択された周波
数スペクトルとエコーノイズ抑圧ゲイン算出部（ＧＣＡＬ）３１１ｎで算出されたエコー
ノイズ抑圧ゲインＧ［ｆ，ω］を入力として、選択された周波数スペクトルのエコー及び
ノイズを抑圧する（ステップＳ３２１０）。そして、ステップＳ１２１１の周波数逆変換
処理に移って、エコーノイズリダクション処理が終了する。

以上、エコーノイズリダクション部（ＥＮＲ）３１１はＦＦＴによる周波数領域型で周
波数帯域毎に処理する方式として動作するものとして説明した。ＦＦＴによる周波数帯域
をグループでまとめて周波数帯域グループ毎に処理する方式や、フィルタバンクなどの帯
域分割フィルタなどの周波数領域型を実現してもよい。

以上説明した第３の実施形態に係る信号処理装置の動作により、エコーキャンセラ部（
ＥＣ）１１０の処理によるエコー抑圧量が十分でない周波数領域をエコー抑圧量推定部（
ＥＣＬＥ）１１１ｉと制御部（ＣＴＲＬ）２１１ｋで判定して、スペクトル選択部２１１
Ｌとエコーノイズ抑圧ゲイン算出部（ＧＣＡＬ）３１１ｎにおいて周波数帯域毎にエコー
キャンセラ部（ＥＣ）１１０の処理とエコーノイズリダクション部（ＥＮＲ）３１１の処
理の重みを変化させるように制御することができるので、エコーパスロス変動に対して頑
健にすることが可能であり、高品質な信号を出力することが可能である。

また、非線形抑圧処理である周波数領域のエコーリダクションと周波数領域でのノイズ
リダクションをエコーノイズ抑圧ゲイン算出部（ＧＣＡＬ）３１１ｎと信号抑圧部（ＳＳ
）３１１ｏで共通化してエコーノイズリダクション部（ＥＮＲ）３１１とすることで、計
算量が少なくすることができ、エコーリダクションとノイズリダクションを直列接続して
処理するよりも送話音質の劣化が防止できる。

（第４の実施形態）
図１７は、第４の実施形態に係る信号処理装置の構成を示すブロック図である。この信
号処理装置が第１の実施形態に係る信号処理装置と異なる点は、図１７に示すようにエコ
ーリダクション部（ＥＲ）１１１を有さず、エコーサプレッサ部（ＥＳ）４１１を有する
点と、遅延処理部（ＤＥＬＡＹ）１０２に代えて遅延処理部（ＤＥＬＡＹ）４０２を有す
る点、及びＤ／Ａ変換器（Ｄ／Ａ）１０３に代えてＤ／Ａ変換器（Ｄ／Ａ）４０３を有す
る点であり、その他の部分は同じである。そこで、同じ部分については、同じ符号を付し
てその説明を省略する。

また、遅延処理部（ＤＥＬＡＹ）４０２と、Ｄ／Ａ変換器（Ｄ／Ａ）４０３とは、エコ
ーサプレッサ部（ＥＳ）４１１から出力される受話出力信号ｘ’［ｎ］を入力とすること
が異なるものの、それぞれ遅延処理部（ＤＥＬＡＹ）１０２と、Ｄ／Ａ変換器（Ｄ／Ａ）
１０３との動作を同じ動作をするので、それらの説明を省略し、図面を参照して第４の実
施形態に係るエコーサプレッサ部（ＥＳ）４１１を説明する。

図１８は、第４の実施形態に係る信号処理装置のエコーサプレッサ部（ＥＳ）４１１の
構成を示すブロック図である。このエコーサプレッサ部（ＥＳ）４１１は、受話パワー算
出部（ＰＯＷ）４１１ｄと、送話パワー算出部（ＰＯＷ）４１１ｅと、残差パワー算出部
（ＰＯＷ）４１１ｆと、エコー抑圧量推定部（ＥＣＬＥ）４１１ｉと、制御部（ＣＴＲＬ
）４１１ｋと、信号選択部４１１Ｌと、ゲイン格納部（ＧＴＢＬ）４１１ｍと、エコー抑
圧ゲイン算出部（ＧＣＡＬ）４１１ｎと、送話信号抑圧部（ＳＳ）４１１ｏと、受話信号
抑圧部（ＳＳ）４１１ｒとからなる。

エコーサプレッサ部（ＥＳ）４１１は、通信部（ＣＯＭ）１０１から出力された受話入
力信号ｘ［ｎ］と、ハイパスフィルタ部（ＨＰＦ）１０９から出力された送話入力信号ｚ
［ｎ］と、信号減算処理部１１０ｂから出力された残差信号ｅ［ｎ］とを入力とし、受話
出力信号ｘ’［ｎ］及び送話出力信号ｓ’［ｎ］（ｎ＝０，１，・・・，Ｎ−１）を１フ
レームごとに出力する。ここで、受話入力信号ｘ［ｎ］あるいは送話信号（送話入力信号
ｚ［ｎ］または残差信号ｅ［ｎ］）の少なくとも一方に抑圧処理を施し、そのエコー抑圧
後の信号を出力する。

受話パワー算出部（ＰＯＷ）４１１ｄは、通信部（ＣＯＭ）１０１から出力された受話
入力信号ｘ［ｎ］を入力とし、受話パワーＰ_Ｘ［ｆ］を以下の式２５−１が示すようにフ
レーム単位で算出して出力する。受話パワーＰ_Ｘ［ｆ］は以下の式２５−２が示すように
１フレーム前の値Ｐ_ＳＸ［ｆ−１］を用いてスムージングした値Ｐ_ＳＸ［ｆ］を用いても
よい。ただし、α_Ｘは、０．３７５〜０．９９９程度が望ましい。

送話パワー算出部（ＰＯＷ）４１１ｅは、ハイパスフィルタ部（ＨＰＦ）１０９から出
力された送話入力信号ｚ［ｎ］を入力とし、送話パワーＰ_Ｚ［ｆ］を以下の式２６−１が
示すようにフレーム単位で算出して出力する。送話パワーＰ_Ｚ［ｆ］は以下の式２６−２
が示すように１フレーム前の値Ｐ_ＳＺ［ｆ−１］を用いてスムージングした値Ｐ_ＳＺ［ｆ
］を用いてもよい。ただし、α_Ｚは、０．３７５〜０．９９９程度が望ましい。

残差パワー算出部（ＰＯＷ）４１１ｆは、信号減算処理部１１０ｂから出力された残差
信号ｅ［ｎ］を入力とし、残差パワーＰ_Ｅ［ｆ］を以下の式２７−１が示すようにフレー
ム単位で算出して出力する。残差パワーＰ_Ｅ［ｆ］は以下の式２７−２が示すように１フ
レーム前の値Ｐ_ＳＥ［ｆ−１］を用いてスムージングした値Ｐ_ＳＥ［ｆ］を用いてもよい
。ただし、α_Ｅは、０．３７５〜０．９９９程度が望ましい。

エコー抑圧量推定部（ＥＣＬＥ）４１１ｉは、送話パワー算出部（ＰＯＷ）４１１ｅか
ら出力された送話パワーＰ_Ｚ［ｆ］と、残差パワー算出部（ＰＯＷ）４１１ｆから出力さ
れた残差パワーＰ_Ｅ［ｆ］とを入力とし、エコーキャンセラ部（ＥＣ）１１０で抑圧され
たエコー抑圧量ＥＣＬ［ｆ］を推定して出力する。具体的には、以下に示す式２８によっ
て算出する。もちろん、これら２つのパワーの差などを用いてもよい。

制御部（ＣＴＲＬ）４１１ｋは、エコー抑圧量推定部（ＥＣＬＥ）４１１ｉから出力さ
れたＥＣＬ［ｆ］を入力とし、エコーキャンセラ部（ＥＣ）１１０のエコー抑圧量が十分
でないフレームであるか否かを判定し、その判定結果情報である制御情報ＥＳｃｏｎｔｒ
ｏｌ［ｆ］を出力する。具体的には、ＥＣＬ［ｆ］＞β_Ｚを満たしたフレームはエコーキ
ャンセラ部（ＥＣ）１１０のエコー抑圧量が少ないと判定する。ただし、β_Ｚは＋８ｄＢ
〜−１５ｄＢ程度が望ましい。本実施形態では以下、β_Ｚを０ｄＢとして説明する。

また、制御部（ＣＴＲＬ）４１１ｋは、受話パワー算出部（ＰＯＷ）４１１ｄから出力
された受話パワーＰ_Ｘ［ｆ］と、送話パワー算出部（ＰＯＷ）４１１ｅから出力された送
話パワーＰ_Ｚ［ｆ］とを入力とし、受話信号抑圧部（ＳＳ）４１１ｒによって受話入力信
号ｘ［ｎ］を抑圧するか、送話信号抑圧部（ＳＳ）４１１ｏによって送話信号（送話入力
信号ｚ［ｎ］または残差信号ｅ［ｎ］）を抑圧するか否かを判定し、その判定結果情報で
ある状態情報ＥＳｓｔａｔｅ［ｆ］を出力する。

例えば、受話パワーＰ_Ｘ［ｆ］と受話側の雑音レベルを表す可変閾値とを用いて受話側
が有音であるか否か検出し、送話パワーＰ_Ｚ［ｆ］と送話側の雑音レベルを表す可変閾値
とを用いて送話側が有音であるか否かを検出し、受話側が有音であれば送話信号を抑圧す
るように状態情報ＥＳｓｔａｔｅ［ｆ］を設定し、送話側が有音であれば受話信号を抑圧
するように状態情報ＥＳｓｔａｔｅ［ｆ］を設定し、そして受話パワーＰ_Ｘ［ｆ］と送話
パワーＰ_Ｚ［ｆ］の差が大きくなるまで以前の状態情報ＥＳｓｔａｔｅ［ｆ］を継続する
ように設定する。

なおここで送話パワーＰ_Ｓ［ｆ］として、制御情報ＥＳｃｏｎｔｒｏｌ［ｆ］によって
エコー抑圧量が十分でないと判定されたフレームについてはＰ_Ｚ［ｆ］を用い、エコー抑
圧量が十分であると判定されたフレームではＰ_Ｅ［ｆ］を用いてもよい。

信号選択部４１１Ｌは、ハイパスフィルタ部（ＨＰＦ）１０９から出力された送話入力
信号ｚ［ｎ］と、信号減算処理部１１０ｂから出力された残差信号ｅ［ｎ］と、制御部（
ＣＴＲＬ）４１１ｋから出力された制御情報ＥＳｃｏｎｔｒｏｌ［ｆ］とを入力とし、送
話入力信号ｚ［ｎ］あるいは残差信号ｅ［ｎ］のいずれか一方をフレーム単位で出力する
。具体的には、制御情報ＥＳｃｏｎｔｒｏｌ［ｆ］がエコーキャンセラ部（ＥＣ）１１０
のエコー抑圧量が十分でないと検出されたフレームであった場合は、信号として送話入力
信号Ｚ［ｎ］を選択する。それ以外のフレームでは信号として残差信号ｅ［ｎ］を選択す
る。

このようにすることでフレームごとに、エコー抑圧量が十分でない場合、つまりエコー
キャンセラ部（ＥＣ）１１０の推定精度が十分とれない場合はエコーサプレッサ部（ＥＳ
）４１１を単体で動作させることができる。

ゲイン格納部（ＧＴＢＬ）４１１ｍは、事前に設定されたゲインγを格納しておく。た
だし、γは通話開始前に事前にアナログフロントエンド（Ｄ／Ａ変換器（Ｄ／Ａ）４０３
、受話増幅器１０４、スピーカ１０５、音響空間、マイクロホン１０６、送話増幅器１０
７、Ａ／Ｄ変換器（Ａ／Ｄ）１０８）のエコーリターンロスに基づいて設定されているこ
とが望ましい。

エコー抑圧ゲイン算出部（ＧＣＡＬ）４１１ｎは、ゲイン格納部（ＧＴＢＬ）４１１ｍ
から出力されたゲインγと、エコー抑圧量推定部（ＥＣＬＥ）４１１ｉから出力されたＥ
ＣＬ［ｆ］と、制御部（ＣＴＲＬ）４１１ｋから出力された制御情報ＥＳｃｏｎｔｒｏｌ
［ｆ］及び状態情報ＥＳｓｔａｔｅ［ｆ］とを入力とし、エコー抑圧ゲインＧ［ｆ］を算
出して出力する。

具体的には、エコー抑圧ゲイン算出部（ＧＣＡＬ）４１１ｎは、状態情報ＥＳｓｔａｔ
ｅ［ｆ］が送話信号（送話入力信号ｚ［ｎ］または残差信号ｅ［ｎ］）を抑圧すると判定
されたことを示す場合は次のようにする。まず、制御情報ＥＳｃｏｎｔｒｏｌ［ｆ］がエ
コーキャンセラ部（ＥＣ）１１０のエコー抑圧量が十分でないと検出されたフレームであ
った場合は、エコー抑圧ゲインＧ［ｆ］をＧ［ｆ］＝γとする。

それ以外のフレームではエコー抑圧ゲインＧ［ｆ］を、エコーキャンセラ部（ＥＣ）１
１０で十分にできているため、抑圧量を強めてもよいと判定し、Ｇ［ｆ］＝γ・ＥＣＬ［
ｆ］と算出する。あるいは、過剰な抑圧を防止するためエコーキャンセラ部（ＥＣ）１１
０のエコー抑圧量分を低減した抑圧量にするようにＧ［ｆ］＝γ／ＥＣＬ［ｆ］と算出す
る。一方、状態情報ＥＳｓｔａｔｅ［ｆ］が受話入力信号を抑圧すると判定されたことを
示す場合は、エコー抑圧ゲインＧ［ｆ］をＧ［ｆ］＝γとする。

さらに、過剰なエコー抑圧により送話音質が劣化するのを防止するため、送話入力信号
ｚ［ｎ］あるいは残差信号ｅ［ｎ］の有音区間ではない区間の信号レベルを用いて背景雑
音レベルを算出しておき、背景雑音レベルよりも抑圧しないようにエコー抑圧ゲインを制
御してもよい。

送話信号抑圧部（ＳＳ）４１１ｏは、制御部（ＣＴＲＬ）４１１ｋから出力された状態
情報ＥＳｓｔａｔｅ［ｆ］と、エコー抑圧ゲイン算出部（ＧＣＡＬ）４１１ｎから出力さ
れたエコー抑圧ゲインＧ［ｆ］と、信号選択部４１１Ｌで選択された送話信号（送話入力
信号ｚ［ｎ］または残差信号ｅ［ｎ］）とを入力とし、状態情報ＥＳｓｔａｔｅ［ｆ］に
よって送話信号（送話入力信号ｚ［ｎ］または残差信号ｅ［ｎ］）を抑圧すると判定され
たことを示す場合、信号選択部４１１Ｌで選択された信号とエコー抑圧ゲイン算出部（Ｇ
ＣＡＬ）４１１ｎで算出された抑圧ゲインＧ［ｆ］を用いて以下の式２９−１または式２
９−２が示すように信号を抑圧し、送話出力信号ｓ’［ｎ］を算出して出力する。

また、状態情報ＥＳｓｔａｔｅ［ｆ］によって送話信号（送話入力信号ｚ［ｎ］または
残差信号ｅ［ｎ］）を抑圧しないと判定された場合は、以下の式２９−３または式２９−
４が示すように送話信号をそのまま送話出力信号ｓ’［ｎ］として出力する。

これらのとき、どちらの信号が信号選択部４１１Ｌで選択されても、出力された送話出
力信号ｓ’[ｎ]が聴感上滑らかに繋がるように、時間方向にスムージングしたエコー抑圧
ゲインＧ［ｆ］を乗じてもよい。

受話信号抑圧部（ＳＳ）４１１ｒは、制御部（ＣＴＲＬ）４１１ｋから出力された状態
情報ＥＳｓｔａｔｅ［ｆ］と、エコー抑圧ゲイン算出部（ＧＣＡＬ）４１１ｎから出力さ
れたエコー抑圧ゲインＧ［ｆ］と、通信部（ＣＯＭ）１０１から出力された受話入力信号
ｘ［ｎ］とを入力とし、状態情報ＥＳｓｔａｔｅ［ｆ］によって受話入力信号ｘ［ｎ］を
抑圧すると判定された場合、受話信号ｘ［ｎ］に対してエコー抑圧ゲイン算出部（ＧＣＡ
Ｌ）４１１ｎで算出されたエコー抑圧ゲインＧ［ｆ］を用いて、以下の式３０−１が示す
ように信号を抑圧し、受話出力信号ｘ’［ｎ］を算出して出力する。

また、状態情報ＥＳｓｔａｔｅ［ｆ］によって受話入力信号ｘ［ｎ］を抑圧しないと判
定された場合は、以下の式３０−２が示すように受話入力信号ｘ［ｎ］をそのまま受話出
力信号ｘ’［ｎ］として出力する。

次に、上記のように構成された第４の実施形態に係る信号処理装置の処理の流れを説明
する。図１９は、第４の実施形態に係る信号処理装置の全体の処理の流れを示すフローチ
ャートである。なお、図５を参照して説明した第１の実施形態に係る信号処理装置の動作
と同じ動作ステップについては、同じ符号を付してその部分の説明を省略する。

ステップＳ１００３のオフセット除去処理の後、遅延処理部（ＤＥＬＡＹ）４０２は受
話信号抑圧部（ＳＳ）４１１ｒから出力された受話出力信号ｘ’［ｎ］を一時的に蓄えて
遅延させる処理を行う（ステップＳ４００４）。そしてステップＳ１００５のエコーキャ
ンセラ処理に移る。ステップＳ１００５のエコーキャンセラ処理の後、信号処理装置は、
第１の実施形態においてはステップＳ１００６でエコーリダクション処理を行ったのに代
えて、第４の実施形態においては、ステップＳ１００５で得られたエコーキャンセラ処理
後の信号を用いてエコーサプレッサ処理を行う（ステップＳ４００６）。そして、ステッ
プＳ１００７の終話か否かの判断に移る。

第４の実施形態に係るエコーキャンセル部（ＥＣ）１１０は、第１の実施形態に係るエ
コーキャンセル部（ＥＣ）１１０と同じであるので、それぞれの実施形態における処理の
流れは、当然に同じであり説明を省略する。

図２０は、第４の実施形態に係るエコーサプレッサ部（ＥＳ）４１１における処理の流
れを示すフローチャートである。まず、受話パワー算出部（ＰＯＷ）４１１ｄは、受話入
力信号ｘ［ｎ］から受話パワーＰ_Ｘ［ｆ］を算出し（ステップＳ４２０１ｒ）、送話パワ
ー算出部（ＰＯＷ）４１１ｅは、送話入力信号ｚ［ｎ］から送話パワーＰ_Ｚ［ｆ］を算出
し（ステップＳ４２０１ｓ）、残差パワー算出部（ＰＯＷ）４１１ｆは、残差信号ｅ［ｎ
］から残差パワーＰ_Ｅ［ｆ］を算出する（ステップＳ４２０１ｅ）。

エコー抑圧量推定部（ＥＣＬＥ）４１１ｉは、送話パワーＰ_Ｚ［ｆ］と残差パワーＰ_Ｅ
［ｆ］を入力として、エコーキャンセラ部（ＥＣ）１１０で抑圧されたエコー抑圧量ＥＣ
Ｌ［ｆ］を推定する（ステップＳ４２０２）。

制御部（ＣＴＲＬ）４１１ｋは、エコー抑圧量ＥＣＬ［ｆ］を入力としてフレーム毎に
エコー抑圧量が十分であるか否かを判定し、制御情報ＥＳｃｏｎｔｒｏｌ［ｆ］を出力す
る。また、制御部（ＣＴＲＬ）４１１ｋは、受話パワーＰ_Ｘ［ｆ］と送話パワーＰ_Ｚ［ｆ
］に基づいて、受話信号抑圧部（ＳＳ）４１１ｒによって受話入力信号ｘ［ｎ］を抑圧す
るか、送話信号抑圧部（ＳＳ）４１１ｏによって送話信号（送話入力信号ｚ［ｎ］または
残差信号ｅ［ｎ］）を抑圧するか判定し、状態情報ＥＳｓｔａｔｅ［ｆ］を出力する。（
ステップＳ４２０３）。

そして、信号選択部４１１Ｌは、制御情報ＥＳｃｏｎｔｒｏｌ［ｆ］を入力として、エ
コー抑圧量が十分でないと判定されたフレームについて、信号としてｚ［ｎ］を選択して
出力し、エコー抑圧量が十分であると判定されたフレームでは信号としてｅ［ｎ］を選択
して出力する（ステップＳ４２０４）。

エコー抑圧ゲイン算出部（ＧＣＡＬ）４１１ｎは、制御情報ＥＳｃｏｎｔｒｏｌ［ｆ］
とエコー抑圧量ＥＣＬ［ｆ］を入力として、エコー抑圧量が十分でないと検出されたフレ
ームと、それ以外のフレームとで、それぞれ異なる計算によってエコー抑圧ゲインＧ［ｆ
］を算出して出力する（ステップＳ４２０５）。

送話信号抑圧部（ＳＳ）４１１ｏは、エコー抑圧ゲインＧ［ｆ］と状態情報ＥＳｓｔａ
ｔｅ［ｆ］を入力として、送話信号（送話入力信号ｚ［ｎ］または残差信号ｅ［ｎ］）を
抑圧すると判定された場合に、信号選択部４１１Ｌで選択された信号とエコー抑圧ゲイン
算出部（ＧＣＡＬ）４１１ｎで算出されたエコー抑圧ゲインＧ［ｆ］を用いて、信号を抑
圧して送話出力信号ｓ’［ｎ］として出力する。あるいは、送話信号を抑圧しないと判定
された場合は、信号選択部４１１Ｌで選択された信号を送話出力信号ｓ’［ｎ］として出
力する（ステップＳ４２０６ｓ）。一方、受話信号抑圧部（ＳＳ）４１１ｒは、エコー抑
圧ゲインＧ［ｆ］と状態情報ＥＳｓｔａｔｅ［ｆ］を入力として、受話入力信号ｘ［ｎ］
を抑圧すると判定された場合、受話信号ｘ［ｎ］に対してエコー抑圧ゲイン算出部（ＧＣ
ＡＬ）４１１ｎで算出されたエコー抑圧ゲインＧ［ｆ］を用いて、信号を抑圧して受話出
力信号ｘ’［ｎ］として出力する。あるいは、受話入力信号ｘ［ｎ］を抑圧しないと判定
された場合は、受話信号ｘ［ｎ］を受話出力信号ｘ’［ｎ］として出力する（ステップＳ
４２０６ｒ）。これにより、エコーサプレッサ処理が終了する。

以上、エコーサプレッサ部（ＥＳ）４１１は、時間領域型でフレーム毎に処理する方式
として動作するものとして説明した。ＦＦＴやフィルタバンクなどの帯域分割フィルタな
どを用いて周波数領域型に処理する方式で実現してもよい。

以上説明した信号処理装置の動作により、エコーキャンセラ部（ＥＣ）１１０の処理に
よるエコー抑圧量が十分でない場合をエコー抑圧量推定部（ＥＣＬＥ）４１１ｉと制御部
（ＣＴＲＬ）４１１ｋで検出して、エコー抑圧ゲイン算出部（ＧＣＡＬ）４１１ｎと送話
信号抑圧部（ＳＳ）４１１ｏにおいてエコーキャンセラ部（ＥＣ）１１０のエコー抑圧量
を考慮することにより過剰な送話音声に対する抑圧を避けることができるので、エコーパ
スロス変動に対して頑健で高品質な信号を出力することができる。

（第５の実施形態）
第５の実施形態に係る信号処理装置が第１の実施形態に係る信号処理装置と異なる点は
、エコーリダクション部（ＥＲ）１１１を有さず、エコーリダクション部（ＥＲ）５１１
を有する点にある。一方、その他の部分は同じである。そこで、同じ部分については、同
じ符号を付してその説明を省略する。

図２１に、本発明の第５の実施形態に係る信号処理装置のエコーリダクション部（ＥＲ
）５１１の構成を示すブロック図を示す。本発明の第５の実施形態に係る信号処理装置の
エコーリダクション部（ＥＲ）５１１が第１の実施形態に係る信号処理装置のエコーリダ
クション部（ＥＲ）１１１と異なる点を以下に説明する。なお、第１の実施形態に係るエ
コーリダクション部（ＥＲ）１１１及び第２の実施形態に係るノイズリダクション部（Ｎ
Ｒ）２１１と同じ部分については、同じ符号を付してその説明を省略する。

エコーリダクション部（ＮＲ）５１１は、周波数領域変換処理部（ＦＴ）１１１ａと、
周波数領域変換処理部（ＦＴ）１１１ｂと、周波数領域変換処理部（ＦＴ）１１１ｃと、
受話パワー算出部（ＰＯＷ）１１１ｄと、送話パワー算出部（ＰＯＷ）１１１ｅと、残差
パワー算出部（ＰＯＷ）１１１ｆと、音響結合量推定部（ＡＣＬＥ）５１１ｇと、エコー
量推定部（ＥＬＥ）５１１ｈと、エコー抑圧量推定部（ＥＣＬＥ）１１１ｉと、制御部（
ＣＴＲＬ）５１１ｋと、スペクトル選択部５１１Ｌと、ゲイン格納部（ＧＴＢＬ）１１１
ｍ、エコー抑圧ゲイン算出部（ＧＣＡＬ）５１１ｎと、周波数領域逆変換処理部（ＩＦＴ
）１１１ｐと、送話信号抑圧部（ＳＳ）５１１ｓと、残差信号抑圧部（ＥＳ）５１１ｔと
からなる。

エコーリダクション部（ＥＲ）５１１は、遅延処理部（ＤＥＬＡＹ）１０２から出力さ
れた遅延した受話入力信号ｘ［ｎ−Ｄ］と、ハイパスフィルタ部（ＨＰＦ）１０９から出
力された送話入力信号ｚ［ｎ］と、信号減算処理部１１０ｂから出力された残差信号ｅ［
ｎ］とを入力とし、送話入力信号ｚ［ｎ］あるいは残差信号ｅ［ｎ］の少なくとも一方か
らエコー成分を抑圧し、そのエコー抑圧後の信号を送話出力信号ｓ’［ｎ］（ｎ＝０，１
，・・・，Ｎ−１）として１フレームごとに出力する。

音響結合量推定部（ＡＣＬＥ）５１１ｇは、受話パワー算出部（ＰＯＷ）１１１ｄから
出力されたスムージングされた受話パワースペクトル｜Ｘ_Ｓ［ｆ，ω］｜^２と、送話パワ
ー算出部（ＰＯＷ）１１１ｅから出力されたスムージングされた送話パワースペクトル｜
Ｚ_s［ｆ，ω］｜^２と、残差パワー算出部（ＰＯＷ）１１１ｆから出力されたスムージン
グされた残差パワースペクトル｜Ｅ_s［ｆ，ω］｜^２とを入力とし、音響結合量｜Ｈ_Z［ｆ
，ω］｜^２及び｜Ｈ_Ｅ［ｆ，ω］｜^２を、それぞれ式３１−１、式３１−２よって算出す
る。

そして、音響結合量推定部（ＡＣＬＥ）５１１ｇは、以下の式３２−１及び式３２−２
が示すように１フレーム前の値を用いてスムージングした音響結合量｜Ｈ_ＺＳ［ｆ，ω］
｜^２及び｜Ｈ_ＥＳ［ｆ，ω］｜^２を算出して出力する。ただし、α_ＨＺ［ω］及びα_ＨＥ
［ω］は、０．０３〜０．９９程度が望ましい。

ここで、通話開始初期時、例えば通話開始から５秒間程度はα_ＨＺ［ω］及びα_ＨＥ［
ω］を大きくすることで音響結合量｜Ｈ_ＺＳ［ｆ，ω］｜^２及び｜Ｈ_ＥＳ［ｆ，ω］｜^２
の更新を速めておく。このようにすることで通話開始初期時は音響結合量が初期化されて
いるので、通話開始初期時に抑圧量が少なくなってしまうのを防止することができる。

ただし、音響結合量が急激に変化する場合、即ち、不等式｜Ｈ_Z［ｆ，ω］｜^２＞β_Ｚ
_Ｈ［ω］・｜Ｈ_ＺＳ［ｆ−１，ω］｜^２及び｜Ｈ_Ｅ［ｆ，ω］｜^２＞β_ＥＨ［ω］・｜Ｈ
_ＥＳ［ｆ−１，ω］｜^２が成り立つ場合、及び受話入力信号が十分に大きくない場合、即
ち、不等式｜Ｘ_Ｓ［ｆ，ω］｜^２＜β_Ｘ［ω］が成り立つ場合には、エコーパス変動への
高速な追従性を保ちつつ、ダブルトークとなる周波数帯域での音響結合量の算出を行わな
いようにするため、音響結合量を更新しないで１フレーム前の過去の音響結合量｜Ｈ_ＺＳ
［ｆ−１，ω］｜^２及び｜Ｈ_ＥＳ［ｆ−１，ω］｜^２を用いる。

極端な音響結合量の変化はダブルトークの可能性があるので、このように音響結合量を
更新しないでおくことで送話音質劣化を防止することができる。ただし、β_ＺＨ［ω］及
びβ_ＥＨ［ω］は０．９〜３０程度が望ましい。β_Ｘ［ω］は３０ｄＢ〜４０ｄＢ程度が
望ましい。

エコー量推定部（ＥＬＥ）５１１ｈは、受話パワー算出部（ＰＯＷ）１１１ｄから出力
されたスムージングされた受話パワースペクトル｜Ｘ_Ｓ［ｆ，ω］｜^２と、音響結合量推
定部（ＡＣＬＥ）５１１ｇから出力された音響結合量｜Ｈ_ＺＳ［ｆ，ω］｜^２及び｜Ｈ_Ｅ
_Ｓ［ｆ，ω］｜^２とを入力とし、送話入力信号の周波数スペクトルＺ［ｆ，ω］に含まれ
る送話エコー量｜Ｙ_Ｚ［ｆ，ω］｜^２及び残差信号の周波数スペクトルＥ［ｆ，ω］に含
まれる残差エコー量｜Ｙ_Ｅ［ｆ，ω］｜^２を、それぞれ以下の式３３−１及び式３３−２
が示すように周波数帯域ω毎に推定する。

そして、エコー量推定部（ＥＬＥ）５１１ｈは、瞬時のエコー量｜Ｙ_Ｚ［ｆ，ω］｜^２
及び｜Ｙ_Ｅ［ｆ，ω］｜^２を用いるよりもスムージングした値を用いた方がエコー抑圧後
の信号をより自然な信号にできるため、以下の式３４−１及び式３４−２が示すように１
フレーム前の値を用いてスムージングしたエコー量｜Ｙ_ＺＳ［ｆ，ω］｜^２及び｜Ｙ_ＥＳ
［ｆ，ω］｜^２を周波数帯域ω毎に算出して出力する。ただし、α_ＺＹ［ω］及びα_ＥＹ
［ω］は０．７〜０．９９程度が望ましい。

制御部（ＣＴＲＬ）５１１ｋは、エコー抑圧量推定部（ＥＣＬＥ）１１１ｉから出力さ
れたエコー抑圧量ＥＣＬ［ｆ，ω］を入力とし、エコーキャンセラ部（ＥＣ）１１０のエ
コー抑圧量が十分でない周波数帯域であるか否かの情報である制御情報ＥＲｃｏｎｔｒｏ
ｌ［ｆ，ω］を出力する。具体的には、制御部（ＣＴＲＬ）５１１ｋは、周波数帯域ω毎
にＥＣＬ［ｆ，ω］＞β_Ｚ［ω］を満たした周波数帯域であり、かつ１フレーム当りの式
ＥＣＬ［ｆ，ω］＞β_Ｚ［ω］が成立した帯域数ｃｏｕｎｔがβ_Ｃより大きい場合にエコ
ー抑圧量が少ないと判定する。ただし、β_Ｚ［ω］は＋８ｄＢ〜−１５ｄＢ程度、β_Ｃは
全周波数帯域数の１０％〜４０％程度が望ましい。本実施形態では以下、β_Ｚ［ω］を０
ｄＢとして説明する。

エコー抑圧ゲイン算出部（ＧＣＡＬ）５１１ｎは、送話パワー算出部（ＰＯＷ）１１１
ｅから出力されたスムージングされた送話パワースペクトル｜Ｚ_Ｓ［ｆ，ω］｜^２と、残
差パワー算出部（ＰＯＷ）１１１ｆから出力されたスムージングされた残差パワースペク
トル｜Ｅ_Ｓ［ｆ，ω］｜^２と、エコー量推定部（ＥＬＥ）５１１ｈから出力されたスムー
ジングした送話エコー量｜Ｙ_ＺＳ［ｆ，ω］｜^２及びスムージングした残差エコー量｜Ｙ
_ＥＳ［ｆ，ω］｜^２と、ゲイン格納部（ＧＴＢＬ）１１１ｍから出力されたパラメータγ
［ω］とを入力とし、送話エコー抑圧ゲインＧ_Ｚ［ｆ，ω］及び残差エコー抑圧ゲインＧ
_Ｅ［ｆ，ω］を算出して出力する。

具体的には、エコー抑圧ゲイン算出部（ＧＣＡＬ）５１１ｎは、送話エコー抑圧ゲイン
Ｇ_Ｚ［ｆ，ω］及び残差エコー抑圧ゲインＧ_Ｅ［ｆ，ω］をウィナー・フィルタ（Wiener
Filter）法を用いて、以下に示す式３５−１及び式３５−２によって算出する。

また、エコー抑圧ゲイン算出部（ＧＣＡＬ）５１１ｎは、過剰なエコー抑圧により送話
音質が劣化するのを防止し、背景雑音の断続的な抑圧を防止するため、送話エコー抑圧ゲ
インＧ_Ｚ［ｆ，ω］及び残差エコー抑圧ゲインＧ_Ｅ［ｆ，ω］が所定の下限値以下になら
ないように制御する。

さらに、エコー抑圧ゲイン算出部（ＧＣＡＬ）５１１ｎは、過剰なエコー抑圧により送
話音質が劣化するのを防止するため、送話入力信号ｚ［ｎ］あるいは残差信号ｅ［ｎ］の
有音区間ではない区間の信号レベルを用いて周波数帯域ごとに背景雑音レベルを算出して
おき、背景雑音レベルよりも抑圧しないように送話エコー抑圧ゲインＧ_Ｚ［ｆ，ω］及び
残差エコー抑圧ゲインＧ_Ｅ［ｆ，ω］を制御しても構わない。

さらにまた、エコー抑圧ゲイン算出部（ＧＣＡＬ）５１１ｎは、送話音質が劣化するの
を防止するために、エコー抑圧ゲインＧ_Ｚ［ｆ，ω］を以下の式３６−１あるいは式３６
−２に示すように、そして、Ｇ_Ｅ［ｆ，ω］を以下の式３６−３あるいは式３６−４に示
すように周波数方向にスムージングして出力してもよい。例えば、ε_ｊは、［０．１、０
．２、０．４、０．２、０．１］、η_ｊは、［０．１、０．２、０．４、０．８、０．４
、０．２、０．１］のようにしてよい。

送話信号抑圧部（ＳＳ）５１１ｓは、周波数領域変換処理部（ＦＴ）１１１ｂから出力
された送話入力信号の周波数スペクトルＺ［ｆ，ω］と、エコー抑圧ゲイン算出部（ＧＣ
ＡＬ）５１１ｎから出力された送話エコー抑圧ゲインＧ_Ｚ［ｆ，ω］とを入力として、送
話入力信号の周波数スペクトルのエコーを抑圧し、以下の式３７が示すようにスペクトル
Ｓ_Ｚ’［ｆ，ω］を出力する。

残差信号抑圧部（ＥＳ）５１１ｔは、周波数領域変換処理部（ＦＴ）１１１ｃから出力
された残差信号の周波数スペクトルＥ［ｆ，ω］と、エコー抑圧ゲイン算出部（ＧＣＡＬ
）５１１ｎから出力された残差エコー抑圧ゲインＧ_Ｅ［ｆ，ω］とを入力として、残差信
号の周波数スペクトルのエコーを抑圧し、以下のようにスペクトルＳ_Ｅ’［ｆ，ω］を出
力する。

スペクトル選択部５１１Ｌは、送話信号抑圧部（ＳＳ）５１１ｓから出力されたエコー
抑圧された送話入力信号の周波数スペクトルＳ_Ｚ’［ｆ，ω］と、残差信号抑圧部（ＥＳ
）５１１ｔから出力されたエコー抑圧された残差信号の周波数スペクトルＳ_Ｅ’［ｆ，ω
］と、制御部（ＣＴＲＬ）５１１ｋから出力されたエコーキャンセラ部（ＥＣ）１１０の
エコー抑圧量が十分でない周波数帯域であるか否かを示す情報である制御情報ＥＲｃｏｎ
ｔｒｏｌ［ｆ，ω］とを入力とし、エコー抑圧された送話入力信号の周波数スペクトルＳ
_Ｚ’［ｆ，ω］か、エコー抑圧された残差信号の周波数スペクトルＳ_Ｅ’［ｆ，ω］のい
ずれか一方を周波数スペクトルとして選択して出力する。

具体的には、制御情報ＥＲｃｏｎｔｒｏｌ［ｆ，ω］がエコーキャンセラ部（ＥＣ）１
１０のエコー抑圧量が十分でないと検出された周波数帯域であった場合は、スペクトル選
択部５１１Ｌは、周波数スペクトルとしてＳ’_Ｚ［ｆ，ω］を選択する。それ以外の周波
数帯域は周波数スペクトルとしてＳ’_Ｅ［ｆ，ω］を選択する。

このようにすることで周波数帯域ごとに、エコーキャンセラ部（ＥＣ）１１０のエコー
抑圧量が十分でない場合、つまりエコーキャンセラ部（ＥＣ）１１０の推定精度が十分と
れない場合はエコーリダクション部（ＥＲ）５１１を単体で動作させることができる。

次に、上記のように構成された第５の実施形態に係る信号処理装置の処理の流れを説明
する。図２２は、第５の実施形態に係る信号処理装置の全体の処理の流れを示すフローチ
ャートである。なお、図５を参照して説明した第１の実施形態に係る信号処理装置の動作
と同じ動作ステップについては、同じ符号を付してその部分の説明を省略する。

ステップＳ１００５のエコーキャンセラ処理の後、信号処理装置は、第１の実施形態に
おいてはステップＳ１００６でエコーリダクション処理を行ったのに代えて、第５の実施
形態においては、ステップＳ１００５で得られたエコーキャンセラ処理後の信号を用いて
エコーリダクション処理を行う（ステップＳ５００６）。そして、ステップＳ１００７の
終話か否かの判断に移る。

第５の実施形態に係るエコーキャンセル部（ＥＣ）１１０は、第１の実施形態に係るエ
コーキャンセル部（ＥＣ）１１０と同じであるので、それぞれの実施形態における処理の
流れは、当然に同じであり説明を省略する。

図２３は、第５の実施形態に係るエコーリダクション部（ＥＲ）５１１における処理の
流れを示すフローチャートである。なお、図７を参照して説明した第１の実施形態に係る
エコーリダクション部（ＥＲ）１１１及び図１２を参照して説明した第２の実施形態に係
るノイズリダクション部（ＮＲ）２１１における動作と同じ動作ステップについては、同
じ符号を付してその部分の説明を省略する。

第５の実施形態に係るエコーリダクション部（ＥＲ）５１１は、エコーリダクション処
理を開始して、ステップＳ１２０３ｒの受話パワースペクトル算出処理、ステップＳ１２
０３ｓの送話パワースペクトル算出処理、及びステップＳ１２０３ｅの残差パワースペク
トル算出処理の後、音響結合量推定部（ＡＣＬＥ）５１１ｇは、スムージングされた受話
パワースペクトル｜Ｘ_Ｓ［ｆ，ω］｜^２とスムージングされた送話パワースペクトル｜Ｚ
_Ｓ［ｆ，ω］｜^２を入力として音響結合量｜Ｈ_ＺＳ［ｆ，ω］｜^２を算出する（ステップ
Ｓ５２０４ｓ）。同様に、音響結合量推定部（ＡＣＬＥ）５１１ｇは、スムージングされ
た受話パワースペクトル｜Ｘ_Ｓ［ｆ，ω］｜^２とスムージングされた残差パワースペクト
ル｜Ｅ_Ｓ［ｆ，ω］｜^２を入力として音響結合量｜Ｈ_ＥＳ［ｆ，ω］｜^２を算出する（ス
テップＳ５２０４ｅ）。

次に、エコー量推定部（ＥＬＥ）５１１ｈは、音響結合量｜Ｈ_ＺＳ［ｆ，ω］｜^２とス
ムージングした受話パワースペクトル｜Ｘ_Ｓ［ｆ，ω］｜^２とを入力として送話エコー量
｜Ｙ_ＺＳ［ｆ，ω］｜^２を推定する（ステップＳ５２０５ｓ）。同様に、エコー量推定部
（ＥＬＥ）５１１ｈは、音響結合量｜Ｈ_ＥＳ［ｆ，ω］｜^２とスムージングした受話パワ
ースペクトル｜Ｘ_Ｓ［ｆ，ω］｜^２とを入力として残差エコー量｜Ｙ_ＥＳ［ｆ，ω］｜^２
を推定する（ステップＳ５２０５ｅ）。

そして、エコー抑圧ゲイン算出部（ＧＣＡＬ）５１１ｎは、エコー量推定部（ＥＬＥ）
５１１ｈから出力された送話エコー量｜Ｙ_ＺＳ［ｆ，ω］｜^２と、送話パワー算出部（Ｐ
ＯＷ）１１１ｅから出力されたスムージングされた送話パワースペクトル｜Ｚ_Ｓ［ｆ，ω
］｜^２とを入力として、送話エコー抑圧ゲインＧ_Ｚ［ｆ，ω］を算出し、所定の下限値以
下にならないように制御する（ステップＳ１２０８ｓ）。

同様に、エコー抑圧ゲイン算出部（ＧＣＡＬ）５１１ｎは、エコー量推定部（ＥＬＥ）
５１１ｈから出力された残差エコー量｜Ｙ_ＥＳ［ｆ，ω］｜^２と、残差パワー算出部（Ｐ
ＯＷ）１１１ｆから出力されたスムージングされた残差パワースペクトル｜Ｅ_Ｓ［ｆ，ω
］｜^２とを入力として、残差エコー抑圧ゲインＧ_Ｅ［ｆ，ω］を算出し、所定の下限値以
下にならないように制御する（ステップＳ１２０８ｅ）。

その後、送話信号抑圧部（ＳＳ）５１１ｓは、周波数領域変換処理部（ＦＴ）１１１ｂ
から出力された送話入力信号の周波数スペクトルＺ［ｆ，ω］と、エコー抑圧ゲイン算出
部（ＧＣＡＬ）５１１ｎで算出された送話エコー抑圧ゲインＧ_Ｚ［ｆ，ω］を入力として
、送話入力信号の周波数スペクトルのエコーを抑圧する（ステップＳ５２１０ｓ）。

同様に、残差信号抑圧部（ＥＳ）５１１ｔは、周波数領域変換処理部（ＦＴ）１１１ｃ
から出力された残差信号の周波数スペクトルＥ［ｆ，ω］と、エコー抑圧ゲイン算出部（
ＧＣＡＬ）５１１ｎで算出された残差エコー抑圧ゲインＧ_Ｅ［ｆ，ω］を入力として、残
差信号の周波数スペクトルのエコーを抑圧する（ステップＳ５２１０ｅ）。

次に、ステップＳ１２０６のエコー抑圧量算出処理及びステップＳ２２０７の判定処理
の後、スペクトル選択部５１１Ｌは、送話信号抑圧部（ＳＳ）５１１ｓから出力されたエ
コー抑圧された送話入力信号の周波数スペクトルＳ_Ｚ’［ｆ，ω］と、残差信号抑圧部（
ＥＳ）５１１ｔから出力されたエコー抑圧された残差信号の周波数スペクトルＳ_Ｅ’［ｆ
，ω］と、制御部（ＣＴＲＬ）５１１ｋから出力された制御情報ＥＲｃｏｎｔｒｏｌ［ｆ
，ω］とを入力とし、エコー抑圧量が十分でないと検出された周波数帯域では、エコー抑
圧された送話入力信号の周波数スペクトルＳ_Ｚ’［ｆ，ω］を周波数スペクトルとして選
択して出力し、それ以外の周波数帯域ではエコー抑圧された残差信号の周波数スペクトル
Ｓ_Ｅ’［ｆ，ω］を周波数スペクトルとして選択して出力する（ステップＳ５２０９）。

そして、ステップＳ１２１１の周波数逆変換処理に移って、エコーリダクション処理が
終了する。

以上、エコーリダクション部（ＥＲ）５１１はＦＦＴによる周波数領域型で周波数帯域
毎に処理する方式として動作するものとして説明した。ＦＦＴによる周波数帯域をグルー
プでまとめて周波数帯域グループ毎に処理する方式や、フィルタバンクなどの帯域分割フ
ィルタなどの周波数領域型を実現してもよい。

以上説明した信号処理装置の動作により、エコーキャンセラ部（ＥＣ）１１０の処理に
よるエコー抑圧量が十分でない周波数領域をエコー抑圧量推定部（ＥＣＬＥ）１１１ｉと
制御部（ＣＴＲＬ）５１１ｋで判定して、スペクトル選択部５１１Ｌとエコー抑圧ゲイン
算出部（ＧＣＡＬ）５１１ｎにおいて周波数帯域毎にエコーキャンセラ部（ＥＣ）１１０
の処理とエコーリダクション部（ＥＲ）５１１の処理の重みを変化させるように制御する
ことができるので、エコーパスロス変動に対して頑健にすることが可能であり、高品質な
信号を出力することが可能である。

また、エコーリダクション部（ＥＲ）５１１の音響結合量推定部（ＡＣＬＥ）５１１ｇ
とエコー量推定部（ＥＬＥ）５１１ｈにおいて、送話入力信号ｚ［ｎ］に含まれるエコー
量と残差信号ｅ［ｎ］に含まれるエコー量を別々に推定し、エコー抑圧ゲイン算出部（Ｇ
ＣＡＬ）５１１ｎにおいて別々にエコー抑圧ゲインを算出し、送話信号抑圧部（ＳＳ）５
１１ｓ及び残差信号抑圧部（ＥＳ）５１１ｔにおいて別々に抑圧しているため、過剰なエ
コー抑圧を防止し送話音質が劣化するのを防止することが可能である。

（第６の実施形態）
図２４は、第６の実施形態に係る信号処理装置の構成を示すブロック図である。この信
号処理装置が第１の実施形態に係る信号処理装置と異なる点は、図２４に示すようにエコ
ーキャンセラ部（ＥＣ）１１０とエコーリダクション部（ＥＲ）１１１を有さず、エコー
キャンセラ部（ＥＣ）６１０とエコーリダクション部（ＥＲ）６１１を有し、エコーリダ
クション部（ＥＲ）６１１の外部にエコー抑圧量推定部（ＥＣＬＥ）６１２を有する点に
あり、その他の部分は同じである。

そこで、第１の実施形態に係る信号処理装置と同じ部分については、同じ符号を付して
その説明を省略する。なお、このエコーリダクション部（ＥＲ）６１１で、第１の実施形
態に係るエコーリダクション部（ＥＲ）１１１と同じ部分については、同じ符号を付して
その説明を省略する。

図２５は、エコーキャンセラ部（ＥＣ）６１０の構成を示すブロック図である。このエ
コーキャンセラ部（ＥＣ）６１０は、周波数領域変換処理部（ＦＴ）６１０ｄ、周波数領
域適応フィルタ部（ＦＤＡＤＦ）６１０ｅ、周波数領域逆変換処理部（ＩＦＴ）６１０ｆ
、信号減算処理部６１０ｇ、周波数領域変換処理部（ＦＴ）６１０ｈ、周波数領域ダブル
トーク検出部（ＦＤＤＴＤ）６１０ｉからなる。

図２６は、エコーリダクション部（ＥＲ）６１１の構成を示すブロック図である。この
エコーリダクション部（ＥＲ）６１１は、周波数領域変換処理部（ＦＴ）１１１ａと、周
波数領域変換処理部（ＦＴ）１１１ｂと、周波数領域変換処理部（ＦＴ）１１１ｃと、受
話パワー算出部（ＰＯＷ）１１１ｄと、送話パワー算出部（ＰＯＷ）１１１ｅと、音響結
合量推定部（ＡＣＬＥ）６１１ｇと、エコー量推定部（ＥＬＥ）１１１ｈと、周波数領域
ダブルトーク検出部（ＦＤＴＤ）６１１ｊと、制御部（ＣＴＲＬ）６１１ｋと、スペクト
ル選択部１１１Ｌと、ゲイン格納部（ＧＴＢＬ）１１１ｍと、エコー抑圧ゲイン算出部（
ＧＣＡＬ）６１１ｎと、信号抑圧部（ＳＳ）１１１ｏと、周波数領域逆変換処理部（ＩＦ
Ｔ）１１１ｐと、送話出力パワー算出部（ＰＯＷ）６１１ｕとからなる。

図２７は、音響結合量推定部（ＡＣＬＥ）６１１ｇの構成を示すブロック図である。こ
の音響結合量推定部（ＡＣＬＥ）６１１ｇは、音響結合量推定部（ＣＡＣＬ）６１１ｇ１
と、音響結合量補正部（ＡＤＪ）６１１ｇ２と、音響結合量平滑部（ＳＭＡＣＬ）６１１
ｇ３とからなる。

上記のように構成された、本発明の第６の実施形態に係る信号処理装置の各部の動作を
、図２４〜図２７を参照して説明する。

エコーキャンセラ部（ＥＣ）６１０は、ハイパスフィルタ部（ＨＰＦ）１０９から出力
された送話入力信号ｚ［ｎ］と、遅延処理部（ＤＥＬＡＹ）１０２から出力された遅延し
た受話入力信号ｘ［ｎ−Ｄ］を入力とし、オーバーラップ保存法（Overlap-Save Method
）、あるいはオーバーラップ加算法（Overlap-Add Method）に基づき、送話入力信号ｚ［
ｎ］からエコー成分を抑圧し、そのエコー抑圧後の信号を残差信号ｅ［ｎ］（ｎ＝０，１
，・・・，Ｎ−１）として出力し、またフィルタ係数Ｈ_ＦＤＡＦ［ｆ，ω］及びエコーパ
スロスの推定値λ_ＦＤＡＦ［ｆ，ω］を出力する。

周波数領域変換処理部（ＦＴ）６１０ｄは、遅延処理部（ＤＥＬＡＹ）１０２から出力
された遅延した受話入力信号ｘ［ｎ−Ｄ］を入力とし、ＦＦＴ（Fast Fourier Transform
）などによって周波数領域に変換して、受話入力信号の周波数スペクトルＸ_ＦＤＡＦ［ｆ
，ω］を算出して出力する。このとき適宜、オーバーラップ保存法（Overlap-Save Metho
d）、あるいはオーバーラップ加算法（Overlap-Add Method）に基づき、ハミング窓など
による窓掛けや、過去のフレームを用いたり零補間したりオーバーラップを行う。

周波数領域適応フィルタ部（ＦＤＡＤＦ）６１０ｅは、フィルタ係数Ｈ_ＦＤＡＦ［ｆ，
ω］が可変のトランスバーサルフィルタ（Transversal Filter）で構成される周波数領域
の適応フィルタである。また、周波数領域適応フィルタ部（ＦＤＡＤＦ）６１０ｅは、周
波数領域変換処理部（ＦＴ）６１０ｄから出力された受話入力信号の周波数スペクトルＸ
_ＦＤＡＦ［ｆ，ω］と、周波数領域変換処理部（ＦＴ）６１０ｈから出力された１フレー
ム前の残差信号の周波数スペクトルＥ_ＦＤＡＦ［ｆ−１，ω］と、周波数領域ダブルトー
ク検出部（ＦＤＤＴＤ）６１０ｉから出力されたダブルトーク情報ＥＣｓｔａｔｅ［ｆ，
ω］とを入力とし、ダブルトーク情報ＥＣｓｔａｔｅ［ｆ，ω］がダブルトーク状態でな
かった場合はフィルタ係数Ｈ_ＦＤＡＦ［ｆ，ω］をフレームf及び周波数帯域ωごとに適
応学習し、ダブルトーク情報ＥＣｓｔａｔｅ［ｆ，ω］がダブルトーク状態であった場合
は適応学習を行わない。このようにしてフィルタ係数Ｈ_ＦＤＡＦ［ｆ，ω］を算出して出
力する。

また、周波数領域適応フィルタ部（ＦＤＡＤＦ）６１０ｅは、周波数領域変換処理部（
ＦＴ）６１０ｄから出力された受話入力信号の周波数スペクトルＸ_ＦＤＡＦ［ｆ，ω］と
、フィルタ係数Ｈ_ＦＤＡＦ［ｆ，ω］とを用いて擬似エコー信号の周波数スペクトルＹ’
_ＦＤＡＦ［ｆ，ω］をＹ’_ＦＤＡＦ［ｆ，ω］＝Ｈ_ＦＤＡＦ［ｆ，ω］・Ｘ_ＦＤＡＦ［ｆ
，ω］として算出して出力する。

周波数領域適応フィルタ部（ＦＤＡＤＦ）６１０ｅは、フィルタ係数Ｈ_ＦＤＡＦ［ｆ，
ω］の更新幅を制御する固定あるいは可変のステップサイズμ_F［ｆ，ω］を用いて、適
応学習を行う。

また、周波数領域適応フィルタ部（ＦＤＡＤＦ）６１０ｅは、例えばＬＭＳ（Least-Me
an-Square）アルゴリズム、ＮＬＭＳ（Normalized-Least-Mean-Square）アルゴリズム、
学習同定法、アフィン射影（ＡＰ：Affine-Projection）アルゴリズム、逐次最小二乗（
ＲＬＳ：Recursive-Least-Squares）アルゴリズムなどの線形適応アルゴリズムに基づく
適応フィルタや勾配制限型学習同定法（Gradient-limited Normalized-Least-Mean-Squar
e）、適応ボルテラフィルタ（Adaptive Volterra Filter）などの非線形適応アルゴリズ
ムに基づく適応フィルタで構成される。また、本実施形態では勾配拘束のない（gradient
unconstrained）周波数領域型適応フィルタの例を示しているが、勾配拘束のある（grad
ient constrained）周波数領域型適応フィルタで構成してもよい。

周波数領域逆変換処理部（ＩＦＴ）６１０ｆは、周波数領域適応フィルタ部（ＦＤＡＤ
Ｆ）６１０ｅから出力された擬似エコー信号の周波数スペクトルＹ’_ＦＤＡＦ［ｆ，ω］
を入力とし、ＩＦＦＴ（Inverse Fast Fourier Transform）などによって擬似エコー信号
ｙ’_ＦＤＡＦ［ｎ］（ｎ＝０，１，・・・，Ｎ−１）を算出して出力する。このとき適宜
、オーバーラップ保存法（Overlap-Save Method）あるいはオーバーラップ加算法（Overl
ap-Add Method）に基づき、過去のフレームを用いたり零補間したりオーバーラップを戻
したりする処理を行う。

信号減算処理部６１０ｇは、ハイパスフィルタ部（ＨＰＦ）１０９から出力された送話
入力信号ｚ［ｎ］と、周波数領域逆変換処理部（ＩＦＴ）６１０ｆから出力された擬似エ
コー信号ｙ’_ＦＤＡＦ［ｎ］とを入力とし、送話入力信号ｚ［ｎ］から擬似エコー信号ｙ
’_ＦＤＡＦ［ｎ］をサンプルｎごとに減算し、エコー成分を抑圧し、そのエコー抑圧後の
信号である残差信号ｅ［ｎ］を算出して出力する。

周波数領域変換処理部（ＦＴ）６１０ｈは、信号減算処理部６１０ｇから出力された時
間領域の残差信号ｅ［ｎ］を入力として、ＦＦＴ（Fast Fourier Transform）などによっ
て周波数領域に変換して、残差信号の周波数スペクトルＥ_ＦＤＡＦ［ｆ，ω］を算出して
出力する。このとき適宜、オーバーラップ保存法（Overlap-Save Method）、あるいはオ
ーバーラップ加算法（Overlap-Add Method）に基づき、ハミング窓などによる窓掛けや、
過去のフレームを用いたり零補間したりオーバーラップを行う。

周波数領域ダブルトーク検出部（ＦＤＤＴＤ）６１０ｉは、周波数領域変換処理部（Ｆ
Ｔ）６１０ｄから出力された受話信号の周波数スペクトルＸ_ＦＤＡＦ［ｆ，ω］と、周波
数領域変換処理部（ＦＴ）６１０ｈから出力された１フレーム前の残差信号の周波数スペ
クトルＥ_ＦＤＡＦ［ｆ−１，ω］とを、入力とし、フレームf及び周波数帯域ωごとにダ
ブルトーク状態か否かを判定し、ダブルトーク状態か否かを示す情報であるダブルトーク
情報ＥＣｓｔａｔｅ［ｆ，ω］と、エコーパスロスの推定値であるλ_ＦＤＡＦ［ｆ，ω］
を算出して出力する。

具体的には、まず周波数領域ダブルトーク検出部（ＦＤＤＴＤ）６１０ｉは、受話信号
のパワースペクトル｜Ｘ_ＦＤＡＦ［ｆ，ω］｜^２と１フレーム前の残差信号のパワースペ
クトル｜Ｅ_ＦＤＡＦ［ｆ−１，ω］｜^２とをフレームf及び周波数帯域ωごとに算出する
。そして、不等式｜Ｅ_ＦＤＡＦ［ｆ−１，ω］｜^２＞λ_ＦＤＡＦ［ｆ，ω］・｜Ｘ_ＦＤＡ
_Ｆ［ｆ，ω］｜^２が成り立つ場合にダブルトーク状態と判定する。ここでλ_ＦＤＡＦ［ｆ
，ω］は、エコーパスロスの推定値であり、適応学習が進めば小さくなり、適応学習が間
違っていれば大きくなる可変量である。また、λ_ＦＤＡＦ［ｆ，ω］は、フィルタ係数Ｈ
_ＦＤＡＦ［ｆ，ω］を適応学習したフレームf及び周波数帯域ωごとに更新して算出する
。

この場合、エコーキャンセラ部（ＥＣ）６１０は、フィルタ係数Ｈ_ＦＤＡＦ［ｆ，ω］
、ステップサイズμ_F［ｆ，ω］、エコーパスロスの推定値λ_ＦＤＡＦ［ｆ，ω］、ダブ
ルトーク情報ＥＣｓｔａｔｅ［ｆ，ω］、受話信号のパワースペクトル｜Ｘ_ＦＤＡＦ［ｆ
，ω］｜^２、残差信号のパワースペクトル｜Ｅ_ＦＤＡＦ［ｆ，ω］｜^２を内部状態として
メモリに保持している。

エコー抑圧量推定部（ＥＣＬＥ）６１２は、周波数領域適応フィルタ部（ＦＤＡＤＦ）
６１０ｅから出力されるフィルタ係数Ｈ_ＦＤＡＦ［ｆ，ω］と、周波数領域ダブルトーク
検出部（ＦＤＤＴＤ）６１０ｉから出力されるエコーパスロスの推定値λ_ＦＤＡＦ［ｆ，
ω］とを入力とし、エコーキャンセラ部（ＥＣ）６１０で抑圧されたエコー抑圧量ＥＣＬ
［ｆ，ω］を周波数帯域ω毎に推定して出力する。具体的には、ダブルトーク状態でない
場合に｜Ｅ_ＦＤＡＦ［ｆ，ω］｜^２を｜Ｅ_ＦＤＡＦ［ｆ，ω］｜^２＝λ_ＦＤＡＦ［ｆ，ω
］・｜Ｘ_ＦＤＡＦ［ｆ，ω］｜^２のように近似し、送話入力信号のパワースペクトル｜Ｙ
’_ＦＤＡＦ［ｆ，ω］＋Ｅ_ＦＤＡＦ［ｆ，ω］｜^２との比をエコー抑圧量ＥＣＬ［ｆ，ω
］として、以下に示す式３９のように算出する。

エコーリダクション部（ＥＲ）６１１は、受話信号ｘ［ｎ］及び送話入力信号ｚ［ｎ］
及び残差信号ｅ［ｎ］に基づいてエコー成分を抑圧するものであって、そのエコー抑圧後
の信号を送話出力信号ｓ’［ｎ］（ｎ＝０，１，・・・，Ｎ−１）として出力する。

音響結合量推定部（ＡＣＬＥ）６１１ｇは、受話パワー算出部（ＰＯＷ）１１１ｄから
出力されたスムージングされた受話パワースペクトル｜Ｘ_Ｓ［ｆ，ω］｜^２と、送話パワ
ー算出部（ＰＯＷ）１１１ｅから出力されたスムージングされた送話パワースペクトル｜
Ｚ_Ｓ［ｆ，ω］｜^２と、エコー抑圧量推定部（ＥＣＬＥ）６１２から出力されたエコー抑
圧量ＥＣＬ［ｆ，ω］と、周波数領域ダブルトーク検出部（ＦＤＴＤ）６１１ｊから出力
された周波数領域ダブルトーク情報ＥＲｓｔａｔｅ［ｆ，ω］と、エコー量推定部（ＥＬ
Ｅ）１１１ｈから出力された１フレーム前のエコー量｜Ｙ_Ｓ［ｆ−１，ω］｜^２とを入力
とし、スムージングした補正音響結合量｜Ｈ_Ｓ［ｆ，ω］｜^２を算出して出力する。

音響結合量推定部（ＣＡＣＬ）６１１ｇ１は、受話パワー算出部（ＰＯＷ）１１１ｄか
ら出力されたスムージングされた受話パワースペクトル｜Ｘ_Ｓ［ｆ，ω］｜^２と、送話パ
ワー算出部（ＰＯＷ）１１１ｅから出力されたスムージングされた送話パワースペクトル
｜Ｚ_Ｓ［ｆ，ω］｜^２とを入力とし、エコーキャンセラ部（ＥＣ）６１０の性能の影響を
受けないように残差信号に基づく｜Ｅ_Ｓ［ｆ，ω］｜^２を用いずに送話入力信号に基づく
｜Ｚ_Ｓ［ｆ，ω］｜^２を用いて、周波数帯域ω毎に音響結合量｜Ｈ［ｆ，ω］｜^２を以下
に示す式４０のように算出して出力する。

音響結合量補正部（ＡＤＪ）６１１ｇ２は、音響結合量推定部（ＣＡＣＬ）６１１ｇ１
から出力された音響結合量｜Ｈ［ｆ，ω］｜^２と、エコー抑圧量推定部（ＥＣＬＥ）６１
２から出力されたエコー抑圧量ＥＣＬ［ｆ，ω］と、送話パワー算出部（ＰＯＷ）１１１
ｅから出力されたスムージングされた送話パワースペクトル｜Ｚ_Ｓ［ｆ，ω］｜^２と、エ
コー量推定部（ＥＬＥ）１１１ｈから出力された１フレーム前のエコー量｜Ｙ_Ｓ［ｆ−１
，ω］｜^２とを入力とし、エコー抑圧量ＥＣＬ［ｆ，ω］に基づいて音響結合量｜Ｈ［ｆ
，ω］｜^２を補正した補正音響結合量｜Ｈ’［ｆ，ω］｜^２を算出して出力する。

具体的には、音響結合量補正部（ＡＤＪ）６１１ｇ２は、まず以下のようにエコーキャ
ンセラ部（ＥＣ）６１０で抑圧されたエコー抑圧量が十分であるか判定を行う。周波数帯
域ω毎に、不等式ＥＣＬ［ｆ，ω］＞β_ＡＣＬ［ω］が成立した１フレーム当りの帯域数
ｃｏｕｎｔも加味し、ＥＣＬ［ｆ，ω］＞β_ＡＣＬ［ω］かつｃｏｕｎｔ＞β_ＣＡＣＬと
なる周波数帯域をエコーキャンセラ部（ＥＣ）６１０のエコー抑圧量が十分でないと判定
する。ただし、β_ＡＣＬ［ω］は＋８ｄＢ〜−３５ｄＢ程度が、β_ＣＡＣＬは全周波数帯
域数の１０％〜４０％程度が望ましい。本実施形態では以下、β_ＡＣＬ［ω］を０ｄＢと
して説明する。

エコー抑圧量が十分であると判定された周波数帯域について、音響結合量補正部（ＡＤ
Ｊ）６１１ｇ２は、１フレーム前のエコー量｜Ｙ_Ｓ［ｆ−１，ω］｜^２よりも送話パワー
スペクトル｜Ｚ_Ｓ［ｆ，ω］｜^２が大きい場合にのみ、以下に示す式４１のように音響結
合量｜Ｈ［ｆ，ω］｜^２を補正し、補正音響結合量｜Ｈ’［ｆ，ω］｜^２を算出する。

上記の条件が満たされない場合、またエコーキャンセラ部（ＥＣ）６１０のエコー抑圧
量が十分でないと判定された周波数帯域では、音響結合量補正部（ＡＤＪ）６１１ｇ２は
、｜Ｈ’［ｆ，ω］｜^２＝｜Ｈ［ｆ，ω］｜^２として補正を行わない。

音響結合量平滑部（ＳＭＡＣＬ）６１１ｇ３は、音響結合量補正部（ＡＤＪ）６１１ｇ
２から出力された補正音響結合量｜Ｈ’［ｆ，ω］｜^２と、周波数領域ダブルトーク検出
部（ＦＤＴＤ）６１１ｊから出力された周波数領域ダブルトーク情報ＥＲｓｔａｔｅ［ｆ
，ω］とを入力として、以下に示す式４２のように１フレーム前の値を用いてスムージン
グした｜Ｈ_Ｓ［ｆ，ω］｜^２を算出して出力する。ただし、α_Ｈ［ω］は、０．０３〜０
．９９程度が望ましい。

ここで、音響結合量平滑部（ＳＭＡＣＬ）６１１ｇ３は、通話開始初期時、例えば通話
開始から５秒間程度はα_Ｈ［ω］を大きくすることで音響結合量｜Ｈ_Ｓ［ｆ，ω］｜^２の
更新を速めておく。このようにすることで通話開始初期時は音響結合量が初期化されてい
るので、通話開始初期時に抑圧量が少なくなってしまうのを防止することができる。

ただし、周波数領域ダブルトーク検出部（ＦＤＴＤ）６１１ｊから出力された周波数領
域ダブルトーク情報ＥＲｓｔａｔｅ［ｆ，ω］によりダブルトーク状態であると判定され
る場合、音響結合量が急激に変化する場合、即ち、不等式｜Ｈ_Ｓ［ｆ，ω］｜^２＞β_Ｈ［
ω］・｜Ｈ_Ｓ［ｆ−１，ω］｜^２が成り立つ場合、及び受話信号が十分に大きくない場合
、即ち、不等式｜Ｘ_Ｓ［ｆ，ω］｜^２＜β_Ｘ［ω］が成り立つ場合には、エコーパス変動
への高速な追従性を保ちつつ、ダブルトークとなる周波数帯域での音響結合量の算出を行
わないようにするため、音響結合量平滑部（ＳＭＡＣＬ）６１１ｇ３は、音響結合量を更
新しないで１フレーム前の過去の音響結合量｜Ｈ_Ｓ［ｆ−１，ω］｜^２を用いる。

極端な音響結合量の変化はダブルトークの可能性があるので、このように音響結合量を
更新しないでおくことで送話音質劣化を防止することができる。ただし、β_Ｈ［ω］は０
．９〜３０程度が望ましい。β_Ｘ［ω］は３０ｄＢ〜４０ｄＢ程度が望ましい。

周波数領域ダブルトーク検出部（ＦＤＴＤ）６１１ｊは、受話パワー算出部（ＰＯＷ）
１１１ｄから出力されたスムージングされた受話パワースペクトル｜Ｘ_Ｓ［ｆ，ω］｜^２
と、送話出力パワー算出部（ＰＯＷ）６１１ｕから出力された１フレーム前のスムージン
グされた送話出力パワースペクトル｜Ｓ’_Ｓ［ｆ−１，ω］｜^２とを入力とし、ダブルト
ーク状態か否かを示す情報を周波数領域ダブルトーク情報ＥＲｓｔａｔｅ［ｆ，ω］を算
出して出力する。具体的には、周波数領域ダブルトーク検出部（ＦＤＴＤ）６１１ｊは、
不等式｜Ｓ’_Ｓ［ｆ−１，ω］｜^２＞λ_ER［ｆ，ω］・｜Ｘ_Ｓ［ｆ，ω］｜^２が成り立つ
場合にダブルトーク状態と判定する。

ここでλ_ER［ｆ，ω］は、エコーパスロスの推定値であり、音響結合量｜Ｈ_Ｓ［ｆ，ω
］｜^２を更新したフレームf及び周波数帯域ωごとに更新し、音響結合量｜Ｈ_Ｓ［ｆ，ω
］｜^２の更新が進めば小さくなり、音響結合量｜Ｈ_Ｓ［ｆ，ω］｜^２の更新が進まなけれ
ば大きくなる可変量である。

制御部（ＣＴＲＬ）６１１ｋは、エコー抑圧量推定部（ＥＣＬＥ）６１２から出力され
たエコー抑圧量ＥＣＬ［ｆ，ω］と、周波数領域ダブルトーク検出部（ＦＤＴＤ）６１１
ｊから出力された周波数領域ダブルトーク情報ＥＲｓｔａｔｅ［ｆ，ω］とを入力とし、
周波数帯域ω毎にダブルトーク状態かつエコーキャンセラ部（ＥＣ）６１０のエコー抑圧
量が十分でない周波数帯域を検出して、ダブルトーク状態かつエコーキャンセラ部（ＥＣ
）６１０のエコー抑圧量が十分でない周波数帯域であるか否かを示す情報である制御情報
ＥＲｃｏｎｔｒｏｌ［ｆ，ω］を出力する。

まず、制御部（ＣＴＲＬ）６１１ｋは、周波数帯域ω毎に周波数領域ダブルトーク検出
部（ＦＤＴＤ）６１１ｊでダブルトーク状態であると判定されているか否かによって周波
数帯域ω毎にダブルトーク状態であるか否かを判定する。

次に、制御部（ＣＴＲＬ）６１１ｋは、周波数帯域ω毎に不等式ＥＣＬ［ｆ，ω］＞β
_Ｚ［ω］が成り立ち、かつ不等式ｃｏｕｎｔ＞β_Ｃが成り立つ場合に周波数帯域をエコー
キャンセラ部（ＥＣ）６１０のエコー抑圧量が少ないと判定する。ただし、ｃｏｕｎｔは
１フレーム当りの式ＥＣＬ［ｆ，ω］＞β_Ｚ［ω］が成立した帯域数であり、β_Ｚ［ω］
は＋８ｄＢ〜−１５ｄＢ程度、β_Ｃは全周波数帯域数の１０％〜４０％程度が望ましい。
本実施形態では以下、β_Ｚ［ω］＝２．５（＋８ｄＢ）として説明する。

エコー抑圧ゲイン算出部（ＧＣＡＬ）６１１ｎは、送話パワー算出部（ＰＯＷ）１１１
ｅから出力されたスムージングされた送話パワースペクトル｜Ｚ_Ｓ［ｆ，ω］｜^２と、エ
コー量推定部（ＥＬＥ）１１１ｈから出力されたスムージングしたエコー量｜Ｙ_Ｓ［ｆ，
ω］｜^２と、エコー抑圧量推定部（ＥＣＬＥ）６１２から出力されたエコー抑圧量ＥＣＬ
［ｆ，ω］と、制御部（ＣＴＲＬ）６１１ｋから出力された制御情報ＥＲｃｏｎｔｒｏｌ
［ｆ，ω］と、ゲイン格納部（ＧＴＢＬ）１１１ｍから出力されたパラメータγ［ω］と
を入力とし、スムージングされたエコー抑圧ゲインＧ_Ｓ［ｆ，ω］を算出して出力する。

具体的には、エコー抑圧ゲイン算出部（ＧＣＡＬ）６１１ｎは、制御情報ＥＲｃｏｎｔ
ｒｏｌ［ｆ，ω］からダブルトーク状態かつエコーキャンセラ部（ＥＣ）６１０のエコー
抑圧量が十分でないと検出された周波数帯域については、エコー抑圧ゲインＧ［ｆ，ω］
をウィナー・フィルタ（Wiener Filter）法を用いて、式４３によって算出する。

それ以外の周波数帯域では、エコーキャンセラ部（ＥＣ）６１０のエコー抑圧量が十分
であり、エコーキャンセラ部（ＥＣ）６１０が正常に機能していると見なして、エコー抑
圧ゲイン算出部（ＧＣＡＬ）６１１ｎは、エコーリダクション部（ＥＲ）６１１のエコー
抑圧量を多くするように、エコーキャンセラ部（ＥＣ）６１０のエコー抑圧量ＥＣＬ［ｆ
，ω］を引数とした不等式０≦Ｆ（ＥＣＬ［ｆ，ω］）≦１を満たす関数Ｆ（ＥＣＬ［ｆ
，ω］）を用いて補正し、エコー抑圧ゲインＧ［ｆ，ω］を以下に示す式４４のように算
出する。

ここで関数Ｆ（ＥＣＬ［ｆ，ω］）は、以下のようにする。ただし、δ_Ｃは周波数帯域
数を考慮した正値にしておくことが望ましい。
０≦ＥＣＬ［ｆ，ω］≦１のとき式４５−１により、
１≦ＥＣＬ［ｆ，ω］≦β_Ｚ［ω］のとき式４５−２により、
β_Ｚ［ω］≦ＥＣＬ［ｆ，ω］のとき式４５−３あるいは式４５−４による。

このように抑圧ゲインの補正ゲインとしての関数Ｆ（ＥＣＬ［ｆ，ω］）を不等式０≦
Ｆ（ＥＣＬ［ｆ，ω］）≦１を満たすように設定することで、補正後の抑圧ゲインが不自
然な値になることを防ぐことができ、送話音質の劣化を防ぐことができる。また、このよ
うに関数Ｆ（ＥＣＬ［ｆ，ω］）を非線形な関数にすることで、エコーキャンセラ部（Ｅ
Ｃ）６１０のエコー抑圧量が十分でない場合（β_Ｚ［ω］≦ＥＣＬ［ｆ，ω］）に抑圧量
が大きくなるようにゲインを補正することができる。

また、エコー抑圧ゲイン算出部（ＧＣＡＬ）６１１ｎは、過剰なエコー抑圧により送話
音質が劣化するのを防止し、背景雑音の断続抑圧を防止するため、抑圧ゲインＧ［ｆ，ω
］は所定の下限値以下にならないように制御する。

さらに、過剰なエコー抑圧により送話音質が劣化するのを防止するため、エコー抑圧ゲ
イン算出部（ＧＣＡＬ）６１１ｎは、送話入力信号ｚ［ｎ］あるいは残差信号ｅ［ｎ］の
有音区間ではない区間の信号レベルを用いて周波数帯域ごとに背景雑音レベルを算出して
おき、背景雑音レベルよりも抑圧しないようにエコー抑圧ゲインを制御しても構わない。

さらにまた、エコー抑圧ゲイン算出部（ＧＣＡＬ）６１１ｎは、送話音質が劣化するの
を防止するために、エコー抑圧ゲインＧ［ｆ，ω］を以下の式４６−１あるいは式４６−
２が示すように周波数方向にスムージングして出力してもよい。例えば、ε_ｊは、［０．
１，０．２，０．４，０．２，０．１］、η_ｊは、［０．１，０．２，０．４，０．８，
０．４，０．２，０．１］のようにしてよい。

送話出力パワー算出部（ＰＯＷ）６１１ｕは、信号抑圧部（ＳＳ）１１１ｏから出力さ
れた送話出力信号の周波数スペクトルＳ’［ｆ，ω］を入力とし、そのパワースペクトル
である送話出力パワースペクトル｜Ｓ’［ｆ，ω］｜^２を算出し、以下に示す式４７のよ
うに１フレーム前の値｜Ｓ’_Ｓ［ｆ−１，ω］｜^２を用いてスムージングした送話出力パ
ワースペクトル｜Ｓ’_Ｓ［ｆ，ω］｜^２を算出して出力する。ただし、α_Ｓ［ω］は、０
．７５〜０．９９９程度が望ましい。

次に、上記のように構成された第６の実施形態に係る信号処理装置の処理の流れを説明
する。図２８は、第６の実施形態に係る信号処理装置の全体の処理の流れを示すフローチ
ャートである。なお、図５を参照して説明した第１の実施形態に係る信号処理装置の動作
と同じ動作ステップについては、同じ符号を付してその部分の説明を省略する。

ステップＳ１００４の遅延処理の後、遅延した受話入力信号ｘ［ｎ−Ｄ］とオフセット
除去された送話入力信号ｚ［ｎ］を入力として、エコーキャンセラ部（ＥＣ）６１０はエ
コーキャンセラ処理を行う（ステップＳ６００５）。

次に、エコー抑圧量推定部（ＥＣＬＥ）６１２は、周波数領域適応フィルタ部（ＦＤＡ
ＤＦ）６１０ｅから出力されるフィルタ係数Ｈ_ＦＤＡＦ［ｆ，ω］と、周波数領域ダブル
トーク検出部（ＦＤＤＴＤ）６１０ｉから出力されるエコーパスロスの推定値λ_ＦＤＡＦ
［ｆ，ω］とを入力とし、エコーキャンセラ部（ＥＣ）６１０で抑圧されたエコー抑圧量
ＥＣＬ［ｆ，ω］を推定する（ステップＳ６００８）。

そして、遅延した受話入力信号ｘ［ｎ−Ｄ］と、オフセット除去された送話入力信号ｚ
［ｎ］と、エコーキャンセラ部（ＥＣ）６１０から出力されたエラーキャンセラ処理後の
信号である残差信号ｅ［ｎ］を入力として、エコーリダクション部（ＥＲ）６１１は非線
形エコー抑圧処理であるエコーリダクション処理を行う（ステップＳ６００６）。そして
、ステップＳ１００７の終話か否かの判断に移る。

図２９は、第６の実施形態に係るエコーキャンセラ部（ＥＣ）６１０における処理の流
れを示すフローチャートである。

エコーキャンセラ部（ＥＣ）６１０の処理は、次のように行われる。まず、受話入力信
号ｘ［ｎ−Ｄ］を周波数領域に変換して、受話入力信号の周波数スペクトルＸ_ＦＤＡＦ［
ｆ，ω］を算出し、残差信号ｅ［ｎ］を周波数領域に変換して、残差信号の周波数スペク
トルＥ_ＦＤＡＦ［ｆ，ω］を算出する。次に、周波数領域ダブルトーク検出部（ＦＤＤＴ
Ｄ）６１０ｉが受話信号の周波数スペクトルＸ_ＦＤＡＦ［ｆ，ω］と、１フレーム前の残
差信号の周波数スペクトルＥ_ＦＤＡＦ［ｆ−１，ω］とを用いて、周波数領域ダブルトー
ク検出処理を行う（ステップＳ６１０１）。そして、周波数領域適応フィルタ部（ＦＤＡ
ＤＦ）６１０ｅはダブルトーク情報ＥＣｓｔａｔｅ［ｆ，ω］の制御を受けながら、受話
信号の周波数スペクトルＸ_ＦＤＡＦ［ｆ，ω］と、１フレーム前の残差信号の周波数スペ
クトルＥ_ＦＤＡＦ［ｆ−１，ω］とを用いて周波数領域適応フィルタ処理を行う（ステッ
プＳ６１０２）。次に、擬似エコー信号の周波数スペクトルＹ’_ＦＤＡＦ［ｆ，ω］を周
波数領域逆変換して、擬似エコー信号ｙ’_ＦＤＡＦ［ｎ］を算出する。そして、信号減算
処理部６１０ｇは、送話入力信号ｚ［ｎ］から、周波数領域適応フィルタ部（ＦＤＡＤＦ
）６１０ｅから出力された擬似エコー信号ｙ’_ＦＤＡＦ［ｎ］を減算し、残差信号ｅ［ｎ
］を算出して出力、エコーキャンセラ処理が終了する。

図３０は、第６の実施形態に係るエコーリダクション部（ＥＲ）６１１における処理の
流れを示すフローチャートである。なお、図７を参照して説明した第１の実施形態に係る
エコーリダクション部（ＥＲ）１１１における動作と同じ動作ステップについては、同じ
符号を付してその部分の説明を省略する。

第６の実施形態に係るエコーリダクション部（ＥＲ）６１１は、ステップＳ１２０３ｅ
の残差パワースペクトル算出処理の動作はない。

即ち、第６の実施形態に係るエコーリダクション部（ＥＲ）６１１は、エコーリダクシ
ョン処理を開始して、ステップＳ１２０３ｒの受話パワースペクトル算出処理、ステップ
Ｓ１２０３ｓの送話パワースペクトル算出処理、及びステップＳ１２０２ｅの残差周波数
変換処理の後、周波数領域ダブルトーク検出部（ＦＤＴＤ）６１１ｊは、ダブルトーク状
態か否かの情報である周波数領域ダブルトーク情報ＥＲｓｔａｔｅ［ｆ，ω］を算出して
出力し、音響結合量推定部（ＡＣＬＥ）６１１ｇは、スムージングされた受話パワースペ
クトル｜Ｘ_Ｓ［ｆ，ω］｜^２と、スムージングされた送話パワースペクトル｜Ｚ_Ｓ［ｆ，
ω］｜^２と、エコー抑圧量推定部（ＥＣＬＥ）６１２から出力されたエコー抑圧量ＥＣＬ
［ｆ，ω］と、周波数領域ダブルトーク情報ＥＲｓｔａｔｅ［ｆ，ω］とに基づいてスム
ージングした補正音響結合量｜Ｈ_Ｓ［ｆ，ω］｜^２を算出する（ステップＳ６２０４）。

その後ステップＳ１２０５でエコーレベル算出処理を行った後、制御部（ＣＴＲＬ）６
１１ｋは、エコー抑圧量ＥＣＬ［ｆ，ω］と、周波数領域ダブルトーク情報ＥＲｓｔａｔ
ｅ［ｆ，ω］とを入力とし、周波数帯域ω毎にダブルトーク状態かつエコーキャンセラ部
（ＥＣ）１１０のエコー抑圧量が十分でない周波数帯域を検出して、制御情報ＥＲｃｏｎ
ｔｒｏｌ［ｆ，ω］を出力する（ステップＳ６２０７）。

次に、エコー抑圧ゲイン算出部（ＧＣＡＬ）６１１ｎは、スムージングされた送話パワ
ースペクトル｜Ｚ_Ｓ［ｆ，ω］｜^２と、エコー量｜Ｙ_Ｓ［ｆ，ω］｜^２と、エコー抑圧量
ＥＣＬ［ｆ，ω］と、制御情報ＥＲｃｏｎｔｒｏｌ［ｆ，ω］と、パラメータγ［ω］と
を入力とし、エコー抑圧ゲインＧ［ｆ，ω］を算出して出力する（ステップＳ６２０８）
。

その後ステップＳ１２０９でスペクトル選択処理、ステップＳ１２１０で送話信号抑圧
処理を行った後、送話出力パワー算出部（ＰＯＷ）６１１ｕは、送話出力パワースペクト
ルを算出する（ステップＳ６２０３ｓｓ）。そして、ステップＳ１２１１の周波数逆変換
処理に移って、エコーリダクション処理が終了する。

上記では、エコーキャンセラ部（ＥＣ）６１０は、本実施形態ではオーバーラップ保存
法（Overlap-Save Method）、あるいはオーバーラップ加算法（Overlap-Add Method）に
基づいた周波数領域型適応フィルタの例を示しているが、巡回畳み込み法（Circular-Con
volution Method）に基づいた周波数領域型適応フィルタで構成してもよい。

また上記では、エコーリダクション部（ＥＲ）６１１はＦＦＴによる周波数領域型で周
波数帯域毎に処理する方式として動作するものとして説明した。ＦＦＴによる周波数帯域
をグループでまとめて周波数帯域グループ毎に処理する方式や、フィルタバンクなどの帯
域分割フィルタなどの周波数領域型を実現してもよい。

以上説明した信号処理装置の動作により、エコーキャンセラ部（ＥＣ）６１０の処理に
よるエコー抑圧量が十分でない周波数領域をエコー抑圧量推定部（ＥＣＬＥ）６１２と制
御部（ＣＴＲＬ）６１１ｋで判定して、スペクトル選択部１１１Ｌとエコー抑圧ゲイン算
出部（ＧＣＡＬ）６１１ｎにおいて周波数帯域毎にエコーキャンセラ部（ＥＣ）６１０の
処理とエコーリダクション部（ＥＲ）６１１の処理の重みを変化させるように制御するこ
とができるので、エコーパスロス変動に対して頑健にすることが可能であり、高品質な信
号を出力することが可能である。

（第６の実施形態の変形例）
図３１は、本発明の第６の実施形態の変形例に係る信号処理装置のエコーリダクション
部（ＥＲ）６１１２の構成を示すブロック図である。この第６の実施形態に係るエコーリ
ダクション部（ＥＲ）６１１２が第６の実施形態に係るエコーリダクション部（ＥＲ）６
１１と異なる点は、音響結合量推定部（ＡＣＬＥ）６１１ｇを有さず、音響結合量推定部
（ＡＣＬＥ）６１１ｇ−２を有する点にあり、その他の部分は同じである。そこで、同じ
部分については、同じ符号を付してその説明を省略する。

図３２は、第６の実施形態の変形例に係る音響結合量推定部（ＡＣＬＥ）６１１ｇ−２
の構成を示すブロック図である。この音響結合量推定部（ＡＣＬＥ）６１１ｇ−２は、音
響結合量推定部（ＣＡＣＬ）６１１ｇ１−２と、音響結合量平滑部（ＳＭＡＣＬ）６１１
ｇ３−２と、音響結合量補正部（ＡＤＪ）６１１ｇ２−２とからなる。

音響結合量推定部（ＣＡＣＬ）６１１ｇ１−２は、受話パワー算出部（ＰＯＷ）１１１
ｄから出力されたスムージングされた受話パワースペクトル｜Ｘ_Ｓ［ｆ，ω］｜^２と、送
話パワー算出部（ＰＯＷ）１１１ｅから出力されたスムージングされた送話パワースペク
トル｜Ｚ_Ｓ［ｆ，ω］｜^２と、周波数領域ダブルトーク検出部（ＦＤＴＤ）６１１ｊから
出力された周波数領域ダブルトーク情報ＥＲｓｔａｔｅ［ｆ，ω］とを入力とし、エコー
キャンセラ部（ＥＣ）６１０の性能の影響を受けないように残差信号に基づく｜Ｅ_Ｓ［ｆ
，ω］｜^２を用いずに送話入力信号に基づく｜Ｚ_Ｓ［ｆ，ω］｜^２を用いて、周波数帯域
ω毎に音響結合量｜Ｈ［ｆ，ω］｜^２を以下に示す式４８のように算出して出力する。

ただし、周波数領域ダブルトーク検出部（ＦＤＴＤ）６１１ｊから出力された周波数領
域ダブルトーク情報ＥＲｓｔａｔｅ［ｆ，ω］によりダブルトーク状態であると判定され
たことが示されている場合や、音響結合量が急激に変化する場合、即ち、不等式｜Ｈ［ｆ
，ω］｜^２＞β_Ｈ［ω］・｜Ｈ［ｆ−１，ω］｜^２が成り立つ場合、及び受話信号が十分
に大きくない場合、即ち、不等式｜Ｘ_Ｓ［ｆ，ω］｜^２＜β_Ｘ［ω］が成り立つ場合には
、エコーパス変動への高速な追従性を保ちつつ、ダブルトークとなる周波数帯域での音響
結合量の算出を行わないようにするため、音響結合量推定部（ＣＡＣＬ）６１１ｇ１−２
は、音響結合量を更新しないで１フレーム前の過去の音響結合量｜Ｈ［ｆ−１，ω］｜^２
を用いる。

音響結合量平滑部（ＳＭＡＣＬ）６１１ｇ３−２は、音響結合量推定部（ＣＡＣＬ）６
１１ｇ１−２から出力された音響結合量｜Ｈ［ｆ，ω］｜^２と、エコー抑圧量推定部（Ｅ
ＣＬＥ）６１２から出力されたエコー抑圧量ＥＣＬ［ｆ，ω］とを入力とし、以下に示す
式４９のように１フレーム前の値を用いてスムージングした音響結合量｜Ｈ_Ｓ’［ｆ，ω
］｜^２を算出して出力する。

ただし、α_Ｈ［ω］は、０．０３〜０．９９程度が望ましい。このとき、エコーキャン
セラ部（ＥＣ）６１０で抑圧されたエコー抑圧量ＥＣＬ［ｆ，ω］に基づいて、周波数帯
域ω毎にα_Ｈ［ω］を可変にする。つまり、エコー抑圧量ＥＣＬ［ｆ，ω］が十分ある程
、α_Ｈ［ω］を０に近づけ、エコー抑圧量ＥＣＬ［ｆ，ω］が十分ではない程α_Ｈ［ω］
を１に近づける。

音響結合量補正部（ＡＤＪ）６１１ｇ２−２は、音響結合量平滑部（ＳＭＡＣＬ）６１
１ｇ３−２から出力されたスムージングした音響結合量｜Ｈ_Ｓ’［ｆ，ω］｜^２と、エコ
ー抑圧量推定部（ＥＣＬＥ）６１２から出力されたエコー抑圧量ＥＣＬ［ｆ，ω］とを入
力とし、補正音響結合量｜Ｈ_Ｓ［ｆ，ω］｜^２を算出して出力する。

具体的には、音響結合量補正部（ＡＤＪ）６１１ｇ２−２は、まず周波数帯域毎にエコ
ーキャンセラ部（ＥＣ）６１０で抑圧されたエコー抑圧量ＥＣＬ［ｆ，ω］が十分である
か否かを判定する。そして、エコーキャンセラ部（ＥＣ）６１０で抑圧されたエコー抑圧
量ＥＣＬ［ｆ，ω］が十分であると判定された周波数帯域では、０＜β_ＨＡＣＬ［ω］≦
１なる係数β_ＨＡＣＬ［ω］を用いて以下に示す式５０のようにスムージングされた音響
結合量｜Ｈ_Ｓ’［ｆ，ω］｜^２を補正し、補正音響結合量｜Ｈ_Ｓ［ｆ，ω］｜^２を算出し
て出力する。

一方、エコーキャンセラ部（ＥＣ）６１０のエコー抑圧量ＥＣＬ［ｆ，ω］が十分でな
いと判定された周波数帯域では、音響結合量補正部（ＡＤＪ）６１１ｇ２−２は、｜Ｈ_Ｓ
［ｆ，ω］｜^２＝｜Ｈ_Ｓ’［ｆ，ω］｜^２としてスムージングされた音響結合量｜Ｈ_s’
［ｆ，ω］｜^２の補正を行わない。このようにすることで、エコーパス変動がそれほど起
きない場合に送話音質が劣化することを防げる。

（第７の実施形態）
図３３は、第７の実施形態に係る信号処理装置の構成を示すブロック図である。この信
号処理装置が第６の実施形態に係る信号処理装置と異なる点は、図３３に示すようにエコ
ーキャンセラ部（ＥＣ）６１０とエコーリダクション部（ＥＲ）６１１とエコー抑圧量推
定部（ＥＣＬＥ）６１２を有さず、エコーキャンセラ部（ＥＣ）７１０とエコーリダクシ
ョン部（ＥＲ）７１１とエコー抑圧量推定部（ＥＣＬＥ）７１２とを有する点にあり、そ
の他の部分は同じである。そこで、第６の実施形態に係る信号処理装置と同じ部分につい
ては、同じ符号を付してその説明を省略する。

また、第７の実施形態に係るエコーリダクション部（ＥＲ）７１１で、第１の実施形態
に係るエコーリダクション部（ＥＲ）１１１及び第６の実施形態に係るエコーリダクショ
ン部（ＥＲ）６１１と同じ部分については、同じ符号を付してその説明を省略する。

図３４は、エコーキャンセラ部（ＥＣ）７１０の構成を示すブロック図である。このエ
コーキャンセラ部（ＥＣ）７１０は、時間領域エコーキャンセラ部（ＴＤＡＦ）と周波数
領域型エコーキャンセラ部（ＦＤＡＦ）からなり、これらを直列接続したものである。す
なわち、時間領域エコーキャンセラ部（ＴＤＡＦ）での処理後の信号を用いて周波数領域
型エコーキャンセラ部（ＦＤＡＦ）の処理を行う。

時間領域エコーキャンセラ部（ＴＤＡＦ）は、第１の実施形態に係るエコーキャンセラ
部（ＥＣ）１１０と同じであり、周波数領域型エコーキャンセラ部（ＦＤＡＦ）は、第６
の実施形態に係るエコーキャンセラ部（ＥＣ）６１０と同じである。

そして、遅延処理部（ＤＥＬＡＹ）１０２から出力された遅延した受話入力信号ｘ［ｎ
−Ｄ］を、エコーキャンセラ部（ＥＣ）１１０及びエコーキャンセラ部（ＥＣ）６１０に
入力させる。更に、エコーキャンセラ部（ＥＣ）１１０によって出力された残差信号ｅ［
ｎ］を、エコーキャンセラ部（ＥＣ）６１０に送話入力信号ｚ［ｎ］として入力させて、
直列接続する。この場合、エコーキャンセラ部（ＥＣ）７１０は、エコーキャンセラ部（
ＥＣ）１１０の内部状態とエコーキャンセラ部（ＥＣ）６１０の内部状態を併せて、内部
状態としてメモリに保持している。

そこで、第１の実施形態に係るエコーキャンセラ部（ＥＣ）１１０及び第６の実施形態
に係るエコーキャンセラ部（ＥＣ）６１０と同じ符号を付して、エコーキャンセラ部（Ｅ
Ｃ）７１０の説明を省略する。

図３５は、エコーリダクション部（ＥＲ）７１１の構成を示すブロック図である。この
エコーリダクション部（ＥＲ）７１１は、周波数領域変換処理部（ＦＴ）１１１ａと、周
波数領域変換処理部（ＦＴ）１１１ｂと、周波数領域変換処理部（ＦＴ）１１１ｃと、受
話パワー算出部（ＰＯＷ）１１１ｄと、送話パワー算出部（ＰＯＷ）１１１ｅと、残差パ
ワー算出部（ＰＯＷ）１１１ｆと、エコー量推定部（ＥＬＥ）７１１ｈと、周波数領域ダ
ブルトーク検出部（ＦＤＴＤ）７１１ｊと、制御部（ＣＴＲＬ）６１１ｋと、スペクトル
選択部１１１Ｌと、ゲイン格納部（ＧＴＢＬ）１１１ｍと、エコー抑圧ゲイン算出部（Ｇ
ＣＡＬ）６１１ｎと、信号抑圧部（ＳＳ）１１１ｏと、周波数領域逆変換処理部（ＩＦＴ
）１１１ｐとからなる。

図３６は、エコー量推定部（ＥＬＥ）７１１ｈの詳細な構成を示すブロック図である。
このエコー量推定部（ＥＬＥ）７１１ｈは、信号減算処理部７１１ｈ１、エコー量推定制
御部（ＥＬＥＣＴＲＬ）７１１ｈ２、可変ゲイン７１１ｈ３、７１１ｈ４、信号加算処理
部７１１ｈ５からなる。

上記のように構成された、本発明の第７の実施形態に係る信号処理装置の各部の動作を
、図３３〜図３６を参照して説明する。

まず、エコー抑圧量推定部（ＥＣＬＥ）７１２は、ハイパスフィルタ部（ＨＰＦ）１０
９から出力された送話入力信号ｚ［ｎ］と、エコーキャンセラ部（ＥＣ）７１０の信号減
算処理部６１０ｇから出力された時間領域の残差信号ｅ［ｎ］を入力とし、エコーキャン
セラ部（ＥＣ）６１０で抑圧されたエコー抑圧量ＥＣＬ［ｆ，ω］を周波数帯域ω毎に推
定して出力する。

具体的には、エコー抑圧量推定部（ＥＣＬＥ）７１２は、まず送話入力信号ｚ［ｎ］を
窓掛け及びオーバーラップして、ＦＦＴによって周波数領域に変換し、送話パワースペク
トル｜Ｚ’［ｆ，ω］｜^２を算出する。次に、残差信号ｅ［ｎ］を窓掛け及びオーバーラ
ップして、ＦＦＴによって周波数領域に変換し、残差パワースペクトル｜Ｅ’［ｆ，ω］
｜^２を算出する。そして、以下に示す式５１のように送話パワースペクトル｜Ｚ’［ｆ，
ω］｜^２と残差パワースペクトル｜Ｅ’［ｆ，ω］｜^２の比をエコーキャンセラ部（ＥＣ
）７１０で抑圧されたエコー抑圧量ＥＣＬ［ｆ，ω］として算出して出力する。

次に、図３５及び図３６を参照して第７の実施形態に係るエコーリダクション部（ＥＲ
）７１１の動作を説明する。

エコーリダクション部（ＥＲ）７１１は、受話信号ｘ［ｎ］及び送話入力信号ｚ［ｎ］
及び残差信号ｅ［ｎ］に基づいてエコー成分を抑圧するものであって、そのエコー抑圧後
の信号を送話出力信号ｓ’［ｎ］（ｎ＝０，１，・・・，Ｎ−１）として出力する。

エコー量推定部（ＥＬＥ）７１１ｈは、受話パワー算出部（ＰＯＷ）１１１ｄから出力
されたスムージングされた受話パワースペクトル｜Ｘ_Ｓ［ｆ，ω］｜^２と、送話パワー算
出部（ＰＯＷ）１１１ｅから出力されたスムージングされた送話パワースペクトル｜Ｚ_Ｓ
［ｆ，ω］｜^２と、残差パワー算出部（ＰＯＷ）１１１ｆから出力されたスムージングさ
れた残差パワースペクトル｜Ｅ_Ｓ［ｆ，ω］｜^２と、エコー抑圧量推定部（ＥＣＬＥ）７
１２から出力されたエコー抑圧量ＥＣＬ［ｆ，ω］と、周波数領域ダブルトーク検出部（
ＦＤＴＤ）７１１ｊから出力された周波数領域ダブルトーク情報ＥＲｓｔａｔｅ［ｆ，ω
］とを入力とし、スムージングしたエコー量｜Ｙ_Ｓ［ｆ，ω］｜^２を算出して出力する。

信号減算処理部７１１ｈ１は、送話パワー算出部（ＰＯＷ）１１１ｅから出力された送
話パワースペクトル｜Ｚ_Ｓ［ｆ，ω］｜^２と、残差パワー算出部（ＰＯＷ）１１１ｆから
出力された残差パワースペクトル｜Ｅ_Ｓ［ｆ，ω］｜^２とを入力とし、送話パワースペク
トル｜Ｚ_Ｓ［ｆ，ω］｜^２から残差パワースペクトル｜Ｅ_Ｓ［ｆ，ω］｜^２をフレームf
及び周波数帯域ω毎に減算して、減算した信号｜Ｚ_Ｓ［ｆ，ω］｜^２−｜Ｅ_Ｓ［ｆ，ω］
｜^２を出力する。

エコー量推定制御部（ＥＬＥＣＴＲＬ）７１１ｈ２は、受話パワー算出部（ＰＯＷ）１
１１ｄから出力されたスムージングされた受話パワースペクトル｜Ｘ_Ｓ［ｆ，ω］｜^２と
、送話パワー算出部（ＰＯＷ）１１１ｅから出力されたスムージングされた送話パワース
ペクトル｜Ｚ_Ｓ［ｆ，ω］｜^２と、残差パワー算出部（ＰＯＷ）１１１ｆから出力された
スムージングされた残差パワースペクトル｜Ｅ_Ｓ［ｆ，ω］｜^２と、エコー抑圧量推定部
（ＥＣＬＥ）７１２から出力されたエコー抑圧量ＥＣＬ［ｆ，ω］と、周波数領域ダブル
トーク検出部（ＦＤＴＤ）７１１ｊから出力された周波数領域ダブルトーク情報ＥＲｓｔ
ａｔｅ［ｆ，ω］とを入力とし、２つの可変ゲインＧ_１［ｆ，ω］及びＧ_２［ｆ，ω］を
算出して出力する。

具体的には、まず周波数領域ダブルトーク情報ＥＲｓｔａｔｅ［ｆ，ω］がダブルトー
ク状態であると判定されたことを示している場合を除いたシングルトーク状態時に、エコ
ー量推定制御部（ＥＬＥＣＴＲＬ）７１１ｈ２は、エコー量｜Ｙ_Ｓ［ｆ，ω］｜^２を精度
よく推定するために以下に示す式５２−１、式５２−２、式５２−３のようにＧ_ＨＺ、Ｇ
_ＨＥ、Ｇ_ＨＺＥの３つのゲインをそれぞれ算出する。

次に、エコー量推定制御部（ＥＬＥＣＴＲＬ）７１１ｈ２は、エコー抑圧量ＥＣＬ［ｆ
，ω］を引数とし値域が０以上１以下である３つの関数Ｆ_ＨＺ（ＥＣＬ［ｆ，ω］）、Ｆ
_ＨＥ（ＥＣＬ［ｆ，ω］）、及びＦ_ＨＺＥ（ＥＣＬ［ｆ，ω］）を以下のように制御する
。エコー抑圧量ＥＣＬ［ｆ，ω］が十分ではない場合、残差パワースペクトル｜Ｅ_Ｓ［ｆ
，ω］｜^２の影響を少なくするために、Ｆ_ＨＥ（ＥＣＬ［ｆ，ω］）及びＦ_ＨＺＥ（ＥＣ
Ｌ［ｆ，ω］）を０に近づけるかあるいは小さい値に設定し、Ｆ_ＨＺ（ＥＣＬ［ｆ，ω］
）を１に近づける。

一方、エコー抑圧量ＥＣＬ［ｆ，ω］が十分である場合、残差パワースペクトル｜Ｅ_Ｓ
［ｆ，ω］｜^２を信頼して用いるように、Ｆ_ＨＺ（ＥＣＬ［ｆ，ω］）を０に近づけるか
あるいは小さい値に設定し、Ｆ_ＨＥ（ＥＣＬ［ｆ，ω］）及びＦ_ＨＺＥ（ＥＣＬ［ｆ，ω
］）を１に近づける。このとき、エコー抑圧量ＥＣＬ［ｆ，ω］が十分であるか否かの判
定条件として、制御部（ＣＴＲＬ）６１１ｋと同様の判定条件を用いてもよい。そして、
２つの可変ゲインＧ_１［ｆ，ω］及びＧ_２［ｆ，ω］を、それぞれ以下に示す式５３−１
、式５３−２のように算出する。

可変ゲイン７１１ｈ３は、受話パワー算出部（ＰＯＷ）１１１ｄから出力されたスムー
ジングされた受話パワースペクトル｜Ｘ_Ｓ［ｆ，ω］｜^２と、エコー量推定制御部（ＥＬ
ＥＣＴＲＬ）７１１ｈ２から出力された可変ゲインＧ_１［ｆ，ω］とを入力とし、｜Ｘ_Ｓ
［ｆ，ω］｜^２にＧ_１［ｆ，ω］を乗じて、受話パワースペクトル｜Ｘ_Ｓ［ｆ，ω］｜^２
を増幅あるいは減衰させて出力する。

可変ゲイン７１１ｈ４は、信号減算処理部７１１ｈ１から出力された信号｜Ｚ_Ｓ［ｆ，
ω］｜^２−｜Ｅ_Ｓ［ｆ，ω］｜^２と、エコー量推定制御部（ＥＬＥＣＴＲＬ）７１１ｈ２
から出力された可変ゲインＧ_２［ｆ，ω］とを入力とし、｜Ｚ_Ｓ［ｆ，ω］｜^２−｜Ｅ_Ｓ
［ｆ，ω］｜^２にＧ_２［ｆ，ω］を乗じて、増幅あるいは減衰させて出力する。

信号加算処理部７１１ｈ５は、可変ゲイン７１１ｈ３から出力されたＧ_１［ｆ，ω］を
乗じた｜Ｘ_Ｓ［ｆ，ω］｜^２と、可変ゲイン７１１ｈ４から出力されたＧ_２［ｆ，ω］を
乗じた｜Ｚ_Ｓ［ｆ，ω］｜^２−｜Ｅ_Ｓ［ｆ，ω］｜^２とを入力とし、スムージングされた
エコー量｜Ｙ_Ｓ［ｆ，ω］｜^２を算出して出力する。具体的には、以下に示す式５４−１
のようにフレームf及び周波数帯域ω毎に、Ｇ_１［ｆ，ω］を乗じた｜Ｘ_Ｓ［ｆ，ω］｜
^２とＧ_２［ｆ，ω］を乗じた｜Ｚ_Ｓ［ｆ，ω］｜^２−｜Ｅ_Ｓ［ｆ，ω］｜^２を加算してエ
コー量｜Ｙ［ｆ，ω］｜^２を算出する。

そして以下に示す式５４−２のように、エコー量｜Ｙ［ｆ，ω］｜^２をスムージングし
たエコー量｜Ｙ_s［ｆ，ω］｜^２を算出して出力する。ただし、αＹ［ω］は０．７〜０
．９９程度が望ましい。勿論、スムージングしないエコー量｜Ｙ［ｆ，ω］｜^２を出力し
てもよい。

周波数領域ダブルトーク検出部（ＦＤＴＤ）７１１ｊは、受話パワー算出部（ＰＯＷ）
１１１ｄから出力されたスムージングされた受話パワースペクトル｜Ｘ_Ｓ［ｆ，ω］｜^２
と、エコー量推定部（ＥＬＥ）７１１ｈから出力された１フレーム前のスムージングした
エコー量｜Ｙ_Ｓ［ｆ−１，ω］｜^２と、残差パワー算出部（ＰＯＷ）１１１ｆから出力さ
れたスムージングされた残差パワースペクトル｜Ｅ_Ｓ［ｆ，ω］｜^２とを入力とし、ダブ
ルトーク状態か否かを示す情報である周波数領域ダブルトーク情報ＥＲｓｔａｔｅ［ｆ，
ω］を算出して出力する。

具体的には、周波数領域ダブルトーク検出部（ＦＤＴＤ）７１１ｊは、周波数帯域ω毎
に以下のように閾値よりも大きい、即ち、以下に示す不等式５５が成り立てば、ダブルト
ーク状態と判定する。ただし、β_Ｙ［ω］は１．０〜２０程度が望ましい。

次に、上記のように構成された第７の実施形態に係る信号処理装置の処理の流れを説明
する。図３７は、第７の実施形態に係る信号処理装置の全体の処理の流れを示すフローチ
ャートである。なお、図５を参照して説明した第１の実施形態に係る信号処理装置の動作
と同じ動作ステップについては、同じ符号を付してその部分の説明を省略する。

ステップＳ１００４の遅延処理の後、遅延した受話入力信号ｘ［ｎ−Ｄ］とオフセット
除去された送話入力信号ｚ［ｎ］を入力として、エコーキャンセラ部（ＥＣ）７１０はエ
コーキャンセラ処理を行う（ステップＳ７００５）。

次に、エコー抑圧量推定部（ＥＣＬＥ）７１２は、ハイパスフィルタ部（ＨＰＦ）１０
９から出力された送話入力信号ｚ［ｎ］と信号減算処理部６１０ｇから出力された時間領
域の残差信号ｅ［ｎ］を入力とし、エコーキャンセラ部（ＥＣ）７１０で抑圧されたエコ
ー抑圧量ＥＣＬ［ｆ，ω］を推定する（ステップＳ７００８）。

そして、遅延した受話入力信号ｘ［ｎ−Ｄ］と、オフセット除去された送話入力信号ｚ
［ｎ］と、エコーキャンセラ部（ＥＣ）７１０から出力されたエラーキャンセラ処理後の
信号である残差信号ｅ［ｎ］を入力として、エコーリダクション部（ＥＲ）７１１は非線
形エコー抑圧処理であるエコーリダクション処理を行う（ステップＳ７００６）。そして
、ステップＳ１００７の終話か否かの判断に移る。

図３８は、第７の実施形態に係るエコーキャンセラ部（ＥＣ）７１０における処理の流
れを示すフローチャートである。なお、図６を参照して説明した第１の実施形態に係るエ
コーキャンセラ部（ＥＣ）１１０の動作と同じ動作ステップについては、同じ符号を付し
てその部分の説明を省略する。

エコーキャンセラ部（ＥＣ）７１０の処理は、まず、ステップＳ１１０１でダブルトー
ク検出処理を行った後、ステップＳ１１０２で適応フィルタ処理を行い、信号減算処理部
１１０ｂは、送話入力信号ｚ［ｎ］から、適応フィルタ部（ＡＤＦ）１１０ａから出力さ
れた擬似エコー信号ｙ’［ｎ］を減算し、残差信号ｅ_TDAF［ｎ］を算出する。次に、周波
数領域ダブルトーク検出処理を行い（ステップＳ６１０１）、周波数領域適応フィルタ処
理を行い、信号減算処理部６１０ｇは、残差信号ｅ_TDAF［ｎ］から、周波数領域適応フィ
ルタ部（ＦＤＡＤＦ）６１０ｅから出力された擬似エコー信号ｙ’_ＦＤＡＦ［ｎ］を減算
し、残差信号ｅ［ｎ］を算出して出力し（ステップＳ６１０２）、エコーキャンセラ処理
が終了する。

図３９は、第７の実施形態に係るエコーリダクション部（ＥＲ）７１１における処理の
流れを示すフローチャートである。なお、図７を参照して説明した第１の実施形態に係る
エコーリダクション部（ＥＲ）１１１及び図３０を参照して説明した第６の実施形態に係
るエコーリダクション部（ＥＲ）６１１における動作と同じ動作ステップについては、同
じ符号を付してその部分の説明を省略する。

第７の実施形態に係るエコーリダクション部（ＥＲ）７１１は、エコーリダクション処
理を開始して、ステップＳ１２０３ｒの受話パワースペクトル算出処理、ステップＳ１２
０３ｓの送話パワースペクトル算出処理、及びステップＳ１２０３ｅの残差パワースペク
トル算出処理の後、周波数領域ダブルトーク検出部（ＦＤＴＤ）７１１ｊは、ダブルトー
ク状態か否かを示す情報である周波数領域ダブルトーク情報ＥＲｓｔａｔｅ［ｆ，ω］出
力し、エコー量推定部（ＥＬＥ）７１１ｈは、受話パワースペクトル｜Ｘ_Ｓ［ｆ，ω］｜
^２と、送話パワースペクトル｜Ｚ_Ｓ［ｆ，ω］｜^２と、残差パワースペクトル｜Ｅ_Ｓ［ｆ
，ω］｜^２と、エコー抑圧量ＥＣＬ［ｆ，ω］と、周波数領域ダブルトーク情報ＥＲｓｔ
ａｔｅ［ｆ，ω］とを入力とし、スムージングしたエコー量｜Ｙ_Ｓ［ｆ，ω］｜^２を算出
して出力する（ステップＳ７２０５）。

その後、ステップＳ６２０７で判定処理、ステップＳ６２０８でエコー抑圧ゲイン算出
処理、ステップＳ１２０９でスペクトル選択処理、ステップＳ１２１０で送話信号抑圧処
理を行った後、ステップＳ１２１１の周波数逆変換処理に移って、エコーリダクション処
理が終了する。

上記では、エコーリダクション部（ＥＲ）７１１はＦＦＴによる周波数領域型で周波数
帯域毎に処理する方式として動作するものとして説明した。ＦＦＴによる周波数帯域をグ
ループでまとめて周波数帯域グループ毎に処理する方式や、フィルタバンクなどの帯域分
割フィルタなどの周波数領域型を実現してもよい。

以上説明した信号処理装置の動作により、エコーキャンセラ部（ＥＣ）７１０の処理に
よるエコー抑圧量が十分でない周波数領域をエコー抑圧量推定部（ＥＣＬＥ）７１２と制
御部（ＣＴＲＬ）６１１ｋで判定して、スペクトル選択部１１１Ｌとエコー抑圧ゲイン算
出部（ＧＣＡＬ）６１１ｎにおいて周波数帯域毎にエコーキャンセラ部（ＥＣ）７１０の
処理とエコーリダクション部（ＥＲ）７１１の処理の重みを変化させるように制御するこ
とができるので、エコーパスロス変動に対して頑健にすることが可能であり、高品質な信
号を出力することが可能である。

（第７の実施形態の変形例）
図４０は、本発明の第７の実施形態の変形例に係る信号処理装置の構成を示すブロック
図である。この第７の実施形態の変形例に係る信号処理装置が第７の実施形態に係る信号
処理装置と異なる点は、エコーキャンセラ部（ＥＣ）７１０、エコーリダクション部（Ｅ
Ｒ）７１１、エコー抑圧量推定部（ＥＣＬＥ）７１２に代えて、エコーキャンセラ部（Ｅ
Ｃ）７１０ｒ及びエコーリダクション部（ＥＲ）７１１ｒ及びエコー抑圧量推定部（ＥＣ
ＬＥ）７１２ｒを有することである。そして、送話入力信号格納部（ＢＵＦＦ）７１３と
受話入力信号格納部（ＢＵＦＦ）７１４と、遅延処理部（ＤＥＬＡＹ）７０２ｒを有する
ことである。

そして、図３３に示す第７の実施形態に係る信号処理装置では受話出力信号が送話入力
信号に回り込み音響結合することで発生していたエコーを受話入力信号を参照として送話
入力信号から抑圧する構成であったのに対し、この第７の実施形態の変形例に係る信号処
理装置では送話出力信号が図示しない遠端において回り込んで音響結合したエコーを送話
出力信号を参照として受話入力信号から抑圧する構成になっている点であり、その他の部
分は同じである。そこで、同じ部分については、同じ符号を付してその説明を省略する。

送話入力信号格納部（ＢＵＦＦ）７１３と受話入力信号格納部（ＢＵＦＦ）７１４では
、例えば、特開２００５−１４２８８６号公報に記載の技術、あるいは送話入力信号と受
話入力信号の相互相関を用いる遅延時間推定技術によって、図示しない遠端において発生
していたエコーについて遅延などの処理を用いて同期が合う構成になっている。

遅延処理部（ＤＥＬＡＹ）７０２ｒ、エコーキャンセラ部（ＥＣ）７１０ｒ、エコーリ
ダクション部（ＥＲ）７１１ｒ及びエコー抑圧量推定部（ＥＣＬＥ）７１２ｒは、入力さ
れる信号が異なるが、第７の実施形態に係る遅延処理部（ＤＥＬＡＹ）１０２、エコーキ
ャンセラ部（ＥＣ）７１０、エコーリダクション部（ＥＲ）７１１及びエコー抑圧量推定
部（ＥＣＬＥ）７１２と同様の処理を行う。

このような構成にすることで、遠端において発生していた音響エコーについてもエコー
抑圧することができる。

なお、本発明は通話装置に適用されるものであって、通話装置は、通話機能を有する装
置全般をいい、例えば、ハンズフリー通話機能を有するハンズフリー通話装置や、電話機
、インターフォン、携帯電話、ＰＨＳ、ＶｏＩＰソフトウェア、ＶｏＩＰシステム、ＴＶ
会議システムなどを含む。

少なくともエコー成分を低減させる信号処理の例として、エコーキャンセラ、エコーリ
ダクション、エコーサプレッサ、エコーノイズリダクションを、少なくともノイズ成分を
低減させる信号処理の例として、ノイズリダクション、エコーノイズリダクションを挙げ
て説明した。このように記載したのは一般的な呼称であるからであり、本発明はこれら呼
称に限定されるものではない。また、本発明の要旨を逸脱しない範囲でこれらの信号処理
の組み合わせにおいても実施し得ることが可能である。

本発明は、上記各実施の形態に限ることなく、その他、実施段階ではその要旨を逸脱し
ない範囲で種々の変形を実施し得ることが可能である。さらに、上記各実施形態には、種
々の段階の発明が含まれており、開示される複数の構成要件における適宜な組合せにより
種々の発明が抽出され得る。

また、例えば各実施形態に示される全構成要件から幾つかの構成要件が削除されても、
発明が解決しようとする課題の欄で述べた課題が解決でき、発明の効果で述べられている
効果が得られる場合には、この構成要件が削除された構成が発明として抽出され得る。本
発明は装置のみならず、当該装置の機能を実現する方法やプログラムとしても成立する。

本発明の第１の実施形態に係る信号処理装置の構成を示すブロック図。本発明の第１の実施形態に係るエコーキャンセラ部（ＥＣ）の構成を示すブロック図。本発明の第１の実施形態に係るエコーリダクション部（ＥＲ）の構成を示すブロック図。本発明の実施形態に係る抑圧ゲインの下限値の一例を示す図。本発明の第１の実施形態に係る信号処理装置の動作を示すフローチャート。本発明の第１の実施形態に係るエコーキャンセラ部（ＥＣ）の動作を示すフローチャート。本発明の第１の実施形態に係るエコーリダクション部（ＥＲ）の動作を示すフローチャート。本発明の第１の実施形態の変形例に係るエコーリダクション部（ＥＲ）の構成を示すブロック図。本発明の第２の実施形態に係る信号処理装置の構成を示すブロック図。本発明の第２の実施形態に係るノイズリダクション部（ＮＲ）の構成を示すブロック図。本発明の第２の実施形態に係る信号処理装置の動作を示すフローチャート。本発明の第２の実施形態に係るノイズリダクション部（ＮＲ）の動作を示すフローチャート。本発明の第３の実施形態に係る信号処理装置の構成を示すブロック図。本発明の第３の実施形態に係るエコーノイズリダクション部（ＥＮＲ）の構成を示すブロック図。本発明の第３の実施形態に係る信号処理装置の動作を示すフローチャート。本発明の第３の実施形態に係るエコーノイズリダクション部（ＥＮＲ）の動作を示すフローチャート。本発明の第４の実施形態に係る信号処理装置の構成を示すブロック図。本発明の第４の実施形態に係るエコーサプレッサ部（ＥＳ）の構成を示すブロック図。本発明の第４の実施形態に係る信号処理装置の動作を示すフローチャート。本発明の第４の実施形態に係るエコーサプレッサ部（ＥＳ）の動作を示すフローチャート。本発明の第５の実施形態に係るエコーリダクション部（ＥＲ）の構成を示すブロック図。本発明の第５の実施形態に係る信号処理装置の動作を示すフローチャート。本発明の第５の実施形態に係るエコーリダクション部（ＥＲ）の動作を示すフローチャート。本発明の第６の実施形態に係る信号処理装置の構成を示すブロック図。本発明の第６の実施形態に係るエコーキャンセラ部（ＥＣ）の構成を示すブロック図。本発明の第６の実施形態に係るエコーリダクション部（ＥＲ）の構成を示すブロック図。本発明の第６の実施形態に係る音響結合量推定部（ＡＣＬＥ）の構成を示すブロック図。本発明の第６の実施形態に係る信号処理装置の動作を示すフローチャート。本発明の第６の実施形態に係るエコーキャンセラ部（ＥＣ）の動作を示すフローチャート。本発明の第６の実施形態に係るエコーリダクション部（ＥＲ）の動作を示すフローチャート。本発明の第６の実施形態の変形例に係るエコーリダクション部（ＥＲ）の構成を示すブロック図。本発明の第６の実施形態の変形例に係る音響結合量推定部（ＡＣＬＥ）の構成を示すブロック図。本発明の第７の実施形態に係る信号処理装置の構成を示すブロック図。本発明の第７の実施形態に係るエコーキャンセラ部（ＥＣ）の構成を示すブロック図。本発明の第７の実施形態に係るエコーリダクション部（ＥＲ）の構成を示すブロック図。本発明の第７の実施形態に係るエコー量推定部（ＥＬＥ）の構成を示すブロック図。本発明の第７の実施形態に係る信号処理装置の動作を示すフローチャート。本発明の第７の実施形態に係るエコーキャンセラ部（ＥＣ）の動作を示すフローチャート。本発明の第７の実施形態に係るエコーリダクション部（ＥＲ）の動作を示すフローチャート。本発明の第７の実施形態の変形例に係る信号処理装置の構成を示すブロック図。

符号の説明

１１０、６１０、７１０、７１０ｒエコーキャンセラ部（ＥＣ）
１１０ａ適応フィルタ部（ＡＤＦ）
１１０ｂ、６１０ｇ、７１１ｈ１信号減算処理部
１１０ｃダブルトーク検出部（ＤＴＤ）
１１１、５１１、６１１、７１１、７１１ｒ、１１１２エコーリダクション部（ＥＲ）
１１１ａ、１１１ｂ、１１１ｃ、６１０ｄ、６１０ｈ周波数領域変換処理部（ＦＴ）
１１１ｄ、４１１ｄ受話パワー算出部（ＰＯＷ）
１１１ｅ、４１１ｅ送話パワー算出部（ＰＯＷ）
１１１ｆ、４１１ｆ残差パワー算出部（ＰＯＷ）
１１１ｇ、１１１ｇ２、５１１ｇ、６１１ｇ、６１１ｇ−２音響結合量推定部（ＡＣＬ
Ｅ）
１１１ｈ、５１１ｈ、７１１ｈエコー量推定部（ＥＬＥ）
１１１ｉ、４１１ｉ、６１２、７１２、７１２ｒエコー抑圧量推定部（ＥＣＬＥ）
１１１ｊ、６１１ｊ、７１１ｊ周波数領域ダブルトーク検出部（ＦＤＴＤ）
１１１ｋ、２１１ｋ、４１１ｋ、５１１ｋ、６１１ｋ制御部（ＣＴＲＬ）
１１１Ｌ、２１１Ｌ、５１１Ｌスペクトル選択部
１１１ｍ、４１１ｍゲイン格納部（ＧＴＢＬ）
１１１ｎ、１１１ｎ２、４１１ｎ、５１１ｎ、６１１ｎエコー抑圧ゲイン算出部（ＧＣ
ＡＬ）
１１１ｏ、２１１ｏ、３１１ｏ信号抑圧部（ＳＳ）
１１１ｐ、６１０ｆ周波数領域逆変換処理部（ＩＦＴ）
２１１ノイズリダクション部（ＮＲ）
２１１ｎノイズ抑圧ゲイン算出部（ＧＣＡＬ）
２１１ｑ、３１１ｑ雑音レベル推定部（ＮＬＥ）
３１１エコーノイズリダクション部（ＥＮＲ）
３１１ｎエコーノイズ抑圧ゲイン算出部（ＧＣＡＬ）
４１１エコーサプレッサ部（ＥＳ）
４１１Ｌ信号選択部
４１１ｏ、５１１ｓ送話信号抑圧部（ＳＳ）
４１１ｒ受話信号抑圧部（ＳＳ）
５１１ｔ残差信号抑圧部（ＥＳ）
６１０ｅ周波数領域適応フィルタ部（ＦＤＡＤＦ）
６１０ｉ周波数領域ダブルトーク検出部（ＦＤＤＴＤ）
６１１ｇ１、６１１ｇ１−２音響結合量推定部（ＣＡＣＬ）
６１１ｇ２、６１１ｇ２−２音響結合量補正部（ＡＤＪ）
６１１ｇ３、６１１ｇ３−２音響結合量平滑部（ＳＭＡＣＬ）
６１１ｕ送話出力パワー算出部（ＰＯＷ）
７１１ｈ２エコー量推定制御部（ＥＬＥＣＴＲＬ）
７１１ｈ３、７１１ｈ４可変ゲイン
７１１ｈ５信号加算処理部

Claims

入力信号に含まれる少なくともエコーを抑圧してエコー低減信号を出力する第１の信号
処理手段と、
前記入力信号と前記エコー低減信号とを入力し、エコー及びノイズの少なくとも一方を抑
圧する第２の信号処理手段と、を備え、
前記第２の信号処理手段は、前記入力信号と前記エコー低減信号とのどちらか一方を選択
する選択手段を有し、
前記選択手段によって選択された前記入力信号及び前記エコー低減信号のいずれか一方の
前記エコー及び前記ノイズの少なくとも一方を抑圧する
ことを特徴とする信号処理装置。
前記第１の信号処理手段の内部状態、前記入力信号及び前記エコー低減信号の少なくと
も１つを用いて前記第１の信号処理手段のエコー抑圧量を算出するエコー抑圧量算出手段
を更に備え、
前記選択手段は、前記エコー抑圧量算出手段によって算出された前記エコー抑圧量に基づ
いて、前記入力信号と前記エコー低減信号とのどちらか一方を選択する
ことを特徴とする請求項１に記載の信号処理装置。
前記第２の信号処理手段は、前記入力信号及び前記エコー低減信号の少なくとも１つに
含まれる前記エコー及び前記ノイズの少なくとも一方を推定して算出した抑圧量と、前記
エコー抑圧量算出手段によって算出されたエコー抑圧量との少なくとも１つに基づいて、
前記選択手段によって選択された信号の抑圧量を設定する抑圧量設定手段を有し、
前記抑圧量設定手段によって設定された抑圧量で抑圧する
ことを特徴とする請求項２に記載の信号処理装置。
前記第２の信号処理手段は、前記エコー抑圧量算出手段によって算出されたエコー抑圧
量に基づいて第１の抑圧量及び第２の抑圧量のどちらか一方の抑圧量を選択する抑圧量設
定手段を有し、
前記入力信号に含まれる前記エコー及び前記ノイズの少なくとも一方を推定して前記第１
の抑圧量を算出し、前記エコー低減信号に含まれる前記エコー及び前記ノイズの少なくと
も一方を推定して前記第２の抑圧量を算出し、前記抑圧量設定手段によって選択された前
記第１の抑圧量及び前記第２の抑圧量のどちらか一方の抑圧量で抑圧する
ことを特徴とする請求項２に記載の信号処理装置。
前記第２の信号処理手段は、前記入力信号に含まれる前記エコーあるいは前記ノイズを
推定して第１の抑圧量を算出し、前記エコー低減信号に含まれる前記エコーあるいは前記
ノイズを推定して第２の抑圧量を算出し、前記選択手段によって前記入力信号が選択され
た場合は前記第１の抑圧量を選択し、前記選択手段によって前記エコー低減信号が選択さ
れた場合は前記第２の抑圧量を選択する抑圧量設定手段を有し、
前記抑圧量設定手段によって選択された抑圧量で抑圧する
ことを特徴とする請求項１または請求項２に記載の信号処理装置。
入力信号に対して少なくともエコーを抑圧してエコー低減信号を出力する第１の信号処
理手段と、
前記入力信号と前記エコー低減信号を入力し、エコー及びノイズの少なくとも一方を抑圧
して出力する第２の信号処理手段と、を備え、
前記第２の信号処理手段は、前記入力信号に含まれる前記エコー及び前記ノイズの少なく
とも一方を推定して第１の抑圧量を算出する第１の抑圧量設定手段と、前記エコー低減信
号に含まれる前記エコー及び前記ノイズの少なくとも一方を推定して第２の抑圧量を算出
する第２の抑圧量設定手段と、前記入力信号に含まれる前記エコー及び前記ノイズの少な
くとも一方を前記第１の抑圧量設定手段によって推定された第１の抑圧量で抑圧した信号
と、前記エコー低減信号に含まれる前記エコー及び前記ノイズの少なくとも一方を前記第
２の抑圧量設定手段によって推定された第２の抑圧量で抑圧した信号とのどちらか一方を
選択する選択手段とを有し、
前記選択手段によって選択された信号を出力する
ことを特徴とする信号処理装置。
前記第１の信号処理手段の内部状態、前記第１の入力信号及び前記エコー低減信号の少
なくとも１つを用いて前記第１の信号処理手段のエコー抑圧量を算出するエコー抑圧量算
出手段を更に備え、
前記選択手段は、前記エコー抑圧量算出手段によって算出された前記エコー抑圧量に基づ
いて、前記入力信号を前記第１の抑圧量で抑圧した信号と、前記エコー低減信号を前記第
２の抑圧量で抑圧した信号とのどちらか一方を選択する
ことを特徴とする請求項６に記載の信号処理装置。
前記抑圧量設定手段は、前記エコー抑圧量算出手段によって算出された前記エコー抑圧
量に基づいてエコー量を推定するエコー量推定手段を有し、
前記エコー量推定手段によって推定されたエコー量を用いて前記第２の信号処理手段の抑
圧量を設定する
ことを特徴とする請求項３乃至請求項５及び請求項７のいずれか１項に記載の信号処理装
置。
前記抑圧量設定手段は、前記第２の信号処理手段の抑圧量を周波数領域毎に設定し、
前記エコー量推定手段は、前記周波数領域毎にエコー量を推定する
ことを特徴とする請求項８に記載の信号処理装置。
前記抑圧量設定手段は、前記第２の信号処理手段の抑圧量を周波数領域毎に設定する
ことを特徴とする請求項３乃至請求項５及び請求項７のいずれか１項に記載の信号処理装
置。
前記エコー量推定手段は、音響結合量を推定する音響結合量推定手段と、前記音響結合
量推定手段によって推定された音響結合量を前記エコー抑圧量算出手段によって算出され
たエコー抑圧量に基づいて補正する音響結合量補正手段と、を有し、
前記音響結合量補正手段によって補正された音響結合量を用いて前記エコー量を推定する
ことを特徴とする請求項８に記載の信号処理装置。
前記エコー量推定手段は、周波数領域毎に前記エコー量を推定し、
前記音響結合量推定手段は、前記周波数領域毎に前記音響結合量を推定し、
前記音響結合量補正手段は、前記周波数領域毎に前記音響結合量を補正する
ことを特徴とする請求項１１に記載の信号処理装置。
前記抑圧量設定手段は、エコー量を推定するエコー量推定手段と、前記エコー量推定手
段によって推定されたエコー量を用いて抑圧ゲインを算出する抑圧ゲイン算出手段と、前
記エコー抑圧量算出手段によって算出された前記エコー抑圧量に基づいて前記抑圧ゲイン
算出手段によって算出された抑圧ゲインを補正する抑圧ゲイン補正手段と、を有し、
前記抑圧ゲイン補正手段によって補正された抑圧ゲインを抑圧量として設定する
ことを特徴とする請求項３乃至請求項５及び請求項７のいずれか１項に記載の信号処理装
置。
前記エコー量推定手段は、周波数領域毎に前記エコー量を推定し、
前記抑圧ゲイン算出手段は、周波数領域毎に前記抑圧ゲインを算出し、
前記抑圧ゲイン補正手段は、周波数領域毎に前記抑圧ゲインを補正する
ことを特徴とする請求項１３に記載の信号処理装置。
前記選択手段は、周波数領域毎に前記２つの信号のいずれか一方を選択する
ことを特徴とする請求項１乃至請求項１４のいずれか１項に記載の信号処理装置。
前記エコー抑圧量算出手段は、前記第１の信号処理手段のエコー抑圧量を周波数領域毎
に算出する
ことを特徴とする請求項２乃至請求項５及び請求項７乃至請求項１５のいずれか１項に記
載の信号処理装置。
前記入力信号はマイクから収音された送話信号である
ことを特徴とする請求項１乃至請求項１６のいずれか１項に記載の信号処理装置。
前記入力信号は受話信号である
ことを特徴とする請求項１乃至請求項１６のいずれか１項に記載の信号処理装置。
入力信号に対して少なくともエコーを抑圧してエコー低減信号を作成し、前記入力信号
に含まれる前記エコー及びノイズの少なくとも一方を推定して第１の抑圧量を算出し、前
記エコー低減信号に含まれる前記エコー及び前記ノイズの少なくとも一方を推定して第２
の抑圧量を算出し、前記入力信号を前記第１の抑圧量で抑圧した信号と、前記エコー低減
信号を前記第２の抑圧量で抑圧した信号とのどちらか一方を選択して出力する信号処理手
段を備える
ことを特徴とする信号処理装置。