JP3568922B2 - エコー処理装置 - Google Patents

エコー処理装置 Download PDF

Info

Publication number
JP3568922B2
JP3568922B2 JP2001287438A JP2001287438A JP3568922B2 JP 3568922 B2 JP3568922 B2 JP 3568922B2 JP 2001287438 A JP2001287438 A JP 2001287438A JP 2001287438 A JP2001287438 A JP 2001287438A JP 3568922 B2 JP3568922 B2 JP 3568922B2
Authority
JP
Japan
Prior art keywords
spectrum
noise
amplitude
echo
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2001287438A
Other languages
English (en)
Other versions
JP2003101445A (ja
Inventor
訓 古田
真哉 高橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP2001287438A priority Critical patent/JP3568922B2/ja
Priority to DE60234746T priority patent/DE60234746D1/de
Priority to EP02020233A priority patent/EP1298815B1/en
Priority to US10/245,578 priority patent/US7092516B2/en
Priority to CN02142858.1A priority patent/CN1224187C/zh
Publication of JP2003101445A publication Critical patent/JP2003101445A/ja
Application granted granted Critical
Publication of JP3568922B2 publication Critical patent/JP3568922B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M9/00Arrangements for interconnection not involving centralised switching
    • H04M9/08Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic
    • H04M9/082Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic using echo cancellers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B3/00Line transmission systems
    • H04B3/02Details
    • H04B3/20Reducing echo effects or singing; Opening or closing transmitting path; Conditioning for transmission in one direction or the other
    • H04B3/23Reducing echo effects or singing; Opening or closing transmitting path; Conditioning for transmission in one direction or the other using a replica of transmitted signal in the time domain, e.g. echo cancellers

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
  • Telephone Function (AREA)

Description

【0001】
【発明の属する技術分野】
この発明は、音声通信システムやテレビ会議装置等において、通信路やスピーカとマイク間の反響路で生じる、送信音声信号に含まれるエコーを低減するエコー処理装置に関するものである。
【0002】
【従来の技術】
一般に、テレビ会議装置や自動車の車内でのハンズフリー通話、または通信回線で生じる音響・回線エコー消去のためにエコー処理装置(エコーキャンセラ)が用いられる。このエコーキャンセラは、エコー成分を消去する適応フィルタと、残留エコー成分を抑圧するエコーサプレッサを備え、適応フィルタによりエコー成分を消去した後、消去しきれなかったエコー成分(残留エコー成分)の振幅をエコーサプレッサにより抑圧処理する。ところが、エコーサプレッサは残留エコー成分以外の音響的な背景雑音信号をも抑圧してしまうため、通話信号中の背景雑音の断続感が生じて通話品質の劣化が生じる。そこで、擬似背景雑音を生成して出力信号に重畳することで断続感の軽減を行う。
【0003】
このエコー処理装置の一例が、例えば特開2000−224081号公報「エコーキャンセラ装置」中に開示されている。
【0004】
図12は上記特開2000−224081号公報に開示されている従来のエコー処理装置の構成を示すブロック図である。図12において、100は適応フィルタ、120は擬似背景雑音発生器、131はAFB(Analysis Filter Bank)、132は第1の抑圧部、133は加算器、134はSFB(Synthesis Filter Bank)、135は第2の抑圧部、136は第1のレベル推定部、137は第2のレベル推定部、138は検出部である。
【0005】
次に動作について説明する。
適応フィルタ100は、エコー信号が混入した入力信号S[t]からエコーを部分的に消去し、エコー消去後の信号U[t]を出力する。ただし、適応フィルタ100では完全にエコーを消去することができないので、このエコー消去後の入力信号U[t]は残留エコー信号を含んでいる。
【0006】
残留エコー信号を含む入力信号U[t]をAFB131は周波数帯域により分割して各帯域の入力信号U[t,j]を生成し、第1の抑圧部132および擬似背景雑音発生器120にこれらを供給する。ここでjは各帯域の番号を表す。各帯域の残留エコーについて、第1の抑圧部132は、残留エコー信号に損失(Loss1)を与えて減衰させエコー信号を抑圧して消去する。損失Loss1の算出方法は以下の通りである。
【0007】
まず、遠端話者音声信号Rinの平均パワーPow(Rin)と、入力信号U[t,j]の平均パワーPow(S[j])とを比較し、前者が後者よりも大きければ、式(1)に従って既存の損失Loss1からμを差し引く。
Loss1[j]=Loss1[j]−μ (1)
ここで、μは抑圧量のステップ値であり定数である。
【0008】
一方、平均パワーPow(Rin)が、平均パワーPow(S[j])以下であれば、式(2)に従って既存の損失Loss1にμを加える。
Loss1[j]=Loss1[j]+μ (2)
【0009】
ただし、いずれの場合にも、式(3)に示された範囲に入るように損失Loss1を調整する。
Loss(max)≦Loss1[j]≦0(dB) (3)
ここで、Loss(max)は第1の抑圧部132が与えることの可能な最大の損失量である。
【0010】
以上の比較と調整を繰り返すことにより、損失Loss1を収束させるとともに、残留エコーのレベルに従って損失Loss1を制御することができる。
この過程で残留エコー信号は、第1の抑圧部132により抑圧されて大部分のエコー信号は消去されるが、エコー信号に重畳した音響的な背景雑音信号も抑圧され、このままでは通話の断続感の原因となる。
【0011】
一方、擬似背景雑音発生器120は、AFB131によって帯域分割された信号U[t,j]の背景雑音のレベルを推定して、背景雑音レベルと同一レベルの擬似背景雑音N[t,j]を生成する。生成された擬似背景雑音N[t,j]は加算器133に供給され、第1の抑圧部132でエコーが低減された信号に擬似背景雑音N[t,j]が、この加算器133により加算される。このときには、加算後の背景雑音レベルが、擬似背景雑音レベルと同一となるようにされる。
【0012】
加算器133の出力信号O[t,j]は、各帯域ごとに分離されているが、これらはSFB134に供給され、SFB134により合成されて出力信号O[t]として出力され、さらに第2の抑圧部135に入力される。
【0013】
また、加算器133が出力した各帯域の出力信号O[t,j]の瞬時レベルは、第2のレベル推定部137で測定される。さらに、擬似背景雑音発生器120が出力した各帯域の擬似背景雑音N[t,j]の瞬時レベルは第1のレベル推定部136で測定される。レベル推定部136,137の両者の測定結果を比較することにより、近端話者の音声が実際に存在したか否かを判断することができる。
【0014】
両方のレベル推定部136,137の測定結果は、検出部138に供給され、これらに基づいて検出部138は各帯域毎の有音・無音の検出(近端話者の音声が実際に存在したか否かの判断)を行う。さらに、各帯域の有音・無音結果を合成して、1つ以上の帯域で有音が検出されると有音を示すディジタル信号「1」、すべての周波数帯域で無音が検出された場合は無音を示すディジタル信号「0」を出力する。
【0015】
検出部138の出力結果は第2の抑圧部135に入力され、これに基づいて第2の抑圧部135は抑圧量Loss2を以下のように決定し、信号O[t]に損失Loss2を与えて減衰させる。
【0016】
まず、検出部138の検出結果が0(無音)の場合には、式(4)に従って既存の損失Loss2にμ’を加える。
Loss2=Loss2+μ’ (4)
ここで、μ’は抑圧量のステップ値であり、絶対値が十分小さい正の定数(例えば0.1dB〜0.01dB)である。
【0017】
一方、検出部138の検出結果が1(有音)の場合には、式(5)に従って損失Loss2をゼロにする。
Loss2=0(dB) (5)
【0018】
式(4)より明らかなように、無音の場合には段階的に抑圧量(Loss2)が増加して背景雑音のみ抑圧することができる。逆に有音の場合には、式(5)より明らかなように、瞬時的に抑圧量(Loss2)を0(dB)に設定することにより音声信号の抑圧を防止する。
【0019】
以上に述べた従来のエコー処理装置は、エコー消去後の入力信号を帯域分割フィルタにより帯域別の時間信号に分割し、背景雑音の各帯域毎のレベルを推定して背景雑音と同じ振幅スペクトルを持つ擬似的な背景雑音信号を生成し、NLP(non−linear process)処理により抑圧された信号に対し擬似背景雑音信号を重畳処理することにより、背景雑音の断続感を軽減する。
【0020】
【発明が解決しようとする課題】
しかし、従来のエコー処理装置は以上のように構成されているので、後から混入する擬似背景雑音は各小帯域毎に入力信号の背景雑音レベルを推定することで入力信号の背景雑音と同様の振幅スペクトルを得ているが、その位相スペクトルは入力信号の位相スペクトルとは違うものであり、疑似背景雑音が混合された最終的な出力信号は依然として不自然感・違和感を招くなどの課題があった。
【0021】
この発明は、送信しようとする入力信号のスペクトルに従った、自然性の高い擬似背景雑音を生成できるエコー処理装置を得ることを目的とする。
【0022】
【課題を解決するための手段】
この発明に係るエコー処理装置は、エコー信号が混入した送信しようとする送信入力信号と、受信した受信入力信号の状態を比較し、この比較に基づいてエコー抑圧量を算出するエコー抑圧量算出部と、送信入力信号を時間領域の表現形式から周波数領域の表現形式に変換して、振幅スペクトルと位相スペクトルを生成する時間・周波数変換部と、振幅スペクトルから雑音スペクトルを推定する雑音スペクトル推定部と、振幅スペクトルにエコー抑圧量に応じて雑音スペクトルを混合する混合部と、混合部により雑音スペクトルが混合された振幅スペクトルと、位相スペクトルに基づいて、時間領域の表現形式の雑音が混合された送信出力信号を生成して、送信出力信号を出力する周波数・時間変換部とを備えたものである。
【0023】
この発明に係るエコー処理装置は、混合部が、エコー抑圧量に応じて振幅スペクトルのスペクトル振幅の調整を行う振幅調整部を具備するものである。
【0024】
この発明に係るエコー処理装置は、振幅スペクトルから、雑音スペクトルにスペクトル減算率を乗じたスペクトルを減算して雑音除去スペクトルを生成し、雑音除去スペクトルを振幅スペクトルの代わりに混合部に供給するスペクトル減算部を具備するものである。
【0025】
この発明に係るエコー処理装置は、エコー信号が混入した送信しようとする送信入力信号と、受信した受信入力信号の状態を比較し、この比較に基づいてエコー抑圧量を算出するエコー抑圧量算出部と、送信入力信号を時間領域の表現形式から周波数領域の表現形式に変換して、振幅スペクトルと位相スペクトルを生成する時間・周波数変換部と、振幅スペクトルから雑音スペクトルを推定する雑音スペクトル推定部と、振幅スペクトルに雑音スペクトルを混合する混合部と、エコー抑圧量に応じて位相スペクトルの位相を擾乱する位相ランダム化部と、混合部により雑音スペクトルが混合された振幅スペクトルと、位相ランダム化部により位相が擾乱された位相スペクトルに基づいて、時間領域の表現形式の雑音が混合された送信出力信号を生成して、送信出力信号を出力する周波数・時間変換部とを備えたものである。
【0026】
この発明に係るエコー処理装置は、エコー抑圧量算出部が算出するエコー抑圧量が所定の値より小さい場合には、位相ランダム化部は、送信しようとする送信入力信号の位相スペクトルのうち高周波領域の位相を擾乱し、エコー抑圧量が大きくなるに従って、位相ランダム化部は高周波領域だけでなく低周波領域の位相を擾乱するようにしたものである。
【0027】
この発明に係るエコー処理装置は、エコー信号が混入した送信しようとする送信入力信号と、受信した受信入力信号の状態を比較し、この比較に基づいてエコー抑圧量を算出するエコー抑圧量算出部と、送信入力信号を時間領域の表現形式から周波数領域の表現形式に変換して、振幅スペクトルと位相スペクトルを生成する時間・周波数変換部と、振幅スペクトルから雑音スペクトルを推定する雑音スペクトル推定部と、振幅スペクトルに雑音スペクトルを混合する混合部と、エコー抑圧量に応じて振幅スペクトルの振幅を擾乱する振幅ランダム化部と、振幅ランダム化部により振幅が擾乱されて混合部により雑音スペクトルが混合された振幅スペクトルと、位相スペクトルに基づいて、時間領域の表現形式の雑音が混合された送信出力信号を生成して、送信出力信号を出力する周波数・時間変換部とを備えたものである。
【0028】
この発明に係るエコー処理装置は、エコー抑圧量算出部が算出するエコー抑圧量が所定の値より小さい場合には、振幅ランダム化部は、送信しようとする送信入力信号の振幅スペクトルのうち高周波領域の振幅を擾乱し、エコー抑圧量が大きくなるに従って、振幅ランダム化部は高周波領域だけでなく低周波領域の振幅を擾乱するようにしたものである。
【0029】
この発明に係るエコー処理装置は、エコー信号が混入した送信しようとする送信入力信号を時間領域の表現形式から周波数領域の表現形式に変換して、振幅スペクトルと位相スペクトルを生成する時間・周波数変換部と、振幅スペクトルから雑音スペクトルを推定する雑音スペクトル推定部と、送信入力信号の背景雑音レベルに応じて、雑音スペクトルの振幅を擾乱する雑音振幅ランダム化部と、雑音振幅ランダム化部で振幅が擾乱された雑音スペクトルを振幅スペクトルに混合する混合部と、混合部により雑音スペクトルが混合された振幅スペクトルと、位相スペクトルに基づいて、時間領域の表現形式の雑音が混合された送信出力信号を生成して、送信出力信号を出力する周波数・時間変換部とを備えたものである。
【0030】
この発明に係るエコー処理装置は、送信しようとする送信入力信号の背景雑音レベルが所定の値より小さい場合には、雑音振幅ランダム化部は、雑音スペクトルのうち高周波領域の振幅を擾乱し、背景雑音レベルが大きくなるに従って、雑音振幅ランダム化部は高周波領域だけでなく低周波領域の振幅を擾乱するようにしたものである。
【0031】
この発明に係るエコー処理装置は、エコー抑圧量算出部が算出するエコー抑圧量が所定の値より大きい場合には、混合部は大きな割合の雑音スペクトルを振幅スペクトルに混合し、エコー抑圧量が所定の値より小さい場合には、混合部は小さな割合の雑音スペクトルを振幅スペクトルに混合するものである。
【0032】
この発明に係るエコー処理装置は、エコー抑圧量算出部が算出するエコー抑圧量が所定の値よりも大きい場合には、混合部が振幅スペクトルに雑音スペクトルを混合する代わりに、振幅スペクトルを雑音スペクトルで置換するものである。
【0033】
この発明に係るエコー処理装置は、受信した受信入力信号と、通信路伝達特性あるいはマイクとスピーカ間の音響伝達特性に基づいてフィルタ係数を推定し、擬似エコー信号を生成する適応フィルタと、エコー信号が混入した送信しようとする送信入力信号から擬似エコー信号を減算することによりエコー信号を除去する減算部とを具備し、適応フィルタのフィルタ係数が収束するまでの間、他の場合より大きな割合の雑音スペクトルを混合部が振幅スペクトルに混合するか、あるいは振幅スペクトルに雑音スペクトルを混合する代わりに、振幅スペクトルを雑音スペクトルで置換するものである。
【0034】
この発明に係るエコー処理装置は、混合部は、送信しようとする送信入力信号の振幅スペクトルのうち低周波領域の振幅スペクトル成分に所定の値より大きな割合の雑音スペクトル成分を混合し、高周波数領域になるに従ってより小さい割合の雑音スペクトル成分を振幅スペクトル成分に混合するようにしたものである。
【0035】
この発明に係るエコー処理装置は、雑音スペクトル推定部が、複数の推定雑音スペクトルを算出し、そのうちのいずれか1つの推定雑音スペクトルをランダムに選択して、雑音スペクトルとして出力するものである。
【0036】
この発明に係るエコー処理装置は、雑音スペクトル推定部が、遅い更新速度を用いて第1の推定雑音スペクトルを算出し、早い更新速度を用いて第2の推定雑音スペクトルを算出し、そのうちのいずれか1つの推定雑音スペクトルをランダムに選択して、雑音スペクトルとして出力するものである。
【0037】
この発明に係るエコー処理装置は、雑音スペクトル推定部が、複数の推定雑音スペクトルを算出し、これらの複数の推定雑音スペクトルの重みつき加算を行って得られる重みつき平均雑音スペクトルを雑音スペクトルとして出力するものである。
【0038】
この発明に係るエコー処理装置は、雑音スペクトル推定部が、遅い更新速度を用いて第1の推定雑音スペクトルを算出し、早い更新速度を用いて第2の推定雑音スペクトルを算出し、これらの複数の推定雑音スペクトルの重みつき加算を行って得られる重みつき平均雑音スペクトルを雑音スペクトルとして出力するものである。
【0039】
この発明に係るエコー処理装置は、雑音スペクトル推定部における重み付き加算に用いる重み係数を、雑音スペクトル推定部が、雑音スペクトルのスペクトル成分毎に一定の範囲内でランダムに設定するものである。
【0040】
【発明の実施の形態】
以下、この発明の実施の一形態を説明する。
実施の形態1.
図1はこの発明の実施の形態1によるエコー処理装置の構成を示すブロック図である。図1において、1はエコーキャンセル部、2は適応フィルタ、3は減算器(減算部)、4はエコー抑圧量算出部、5は時間・周波数変換部、6は有音・雑音判定部、7は雑音スペクトル推定部、8は雑音振幅ランダム化部、9は混合部、10は位相ランダム化部、11は周波数・時間変換部、12は平滑化部、30は擬似背景雑音生成部、40はマイク、41はスピーカ、42は送信回路、43は受信回路、44は分割部である。図1に示すように、エコー処理装置は、エコーキャンセル部1、擬似背景雑音生成部30、エコー抑圧量算出部4、マイク40、スピーカ41、送信回路42および受信回路43を備える。
【0041】
また、図2は図1に示された混合部9の内部構成を示すブロック図であり、13は第1の振幅調整部、14は第2の振幅調整部、15は加算器、16は選択部、17は正規化部である。
【0042】
次に動作について説明する。
マイク40は近端話者音声と背景雑音とエコーが含まれる周囲の音に従って、送信入力信号Sd[t]を発生させ、これをエコーキャンセル部1に供給する。
【0043】
受信回路43は、遠端話者音声に起因する遠端話者音声信号Rinを受信し、これに基づいて受信入力信号Rd[t]を生成する。受信入力信号Rd[t]はスピーカ41に供給され、これに基づいてスピーカ41は音声を発する。また、受信入力信号Rd[t]はエコーキャンセル部1およびエコー抑圧量算出部4にも供給される。
【0044】
エコーキャンセル部1は、適応フィルタ2と減算器3と分割部44を備える。エコーキャンセル部1の減算器3には送信入力信号Sd[t]が供給される。減算器3は、送信入力信号Sd[t]から、擬似エコーSE[t]を減算することにより、エコーが部分的に消去されたエコー消去後送信入力信号U[t]を生成してこれを出力する。
【0045】
このエコー消去後送信入力信号U[t]は、適応フィルタ2に供給される。また、エコー消去後送信入力信号U[t]は、分割部44により、一定の長さのフレーム長(例えば20ms)を有するフレームに分割され、分割されたフレームが擬似背景雑音生成部30およびエコー抑圧量算出部4に供給される。
【0046】
上述のように、適応フィルタ2には、エコー消去後送信入力信号U[t]と遠端話者音声に係る受信入力信号Rd[t]が供給される。適応フィルタ2は、受信入力信号Rd[t]とエコー消去後送信入力信号U[t]を用いて、スピーカ41とマイク40間の音響反響特性、あるいは通信回線反響特性を推定してフィルタ係数h[n]を逐次求めると共に、受信入力信号Rd[t]とフィルタ係数h[n]により擬似エコーSE[t]を生成する。ただし、上記フィルタ係数h[n]の推定が収束しない初期状態では、適応フィルタ2は擬似エコーSE[t]を生成せず、フィルタ初期状態フラグEC_initをオンして、これを混合部9に出力する。初期状態の終了後では、適応フィルタ2はフィルタ初期状態フラグEC_initをオフする。
【0047】
エコー消去後送信入力信号U[t]には、エコーのうちの消去し切れなかった成分(残留エコー)が混入している。エコー抑圧量算出部4は、フレームとして分割されたエコー消去後送信入力信号U[t]と受信入力信号Rd[t]のレベルを求めて、これらをある閾値とそれぞれ比較することにより、残留エコー抑圧量eg(dB)を算出してこれを出力する。但し、初期状態では、エコー抑圧量算出部4は残留エコー抑圧量egの算出を行わず、24dBより大きい残留エコー抑圧量egを出力する。
【0048】
残留エコー抑圧量egは、エコー消去後送信入力信号U[t]中の残留エコー信号の振幅を抑圧するために用いられる情報であって、これが高いほど残留エコーを排除する性能が高いことを意味する。エコー抑圧量算出部4が出力する残留エコー抑圧量egは、例えば表1のように場合(ケース)により異なる。
【0049】
【表1】
Figure 0003568922
【0050】
表1のケース1のように、エコー消去後送信入力信号U[t]と受信入力信号Rd[t]の両方のレベルが高い(ある閾値を越えている)場合には、近端話者と遠端話者の両方が話しているダブルトーク状態である。この場合(ケース1)には、近端話者の装置の残留エコーの存在は遠端話者にはさほど気にならないので、エコー抑圧量算出部4は、残留エコー抑圧量egをゼロではないがあまり高くない6dBに決定する。
【0051】
一方、ケース2のように、エコー消去後送信入力信号U[t]が高く、受信入力信号Rd[t]が低い場合には、近端話者だけが話している状態である。この場合には、残留エコーの存在は遠端話者にはほとんど気にならないので、エコー抑圧量算出部4は、残留エコー抑圧量egを0dBに決定する。
【0052】
ケース4のように、エコー消去後送信入力信号U[t]も受信入力信号Rd[t]も低い場合には、近端話者も遠端話者も話していない状態である。この場合にも、残留エコーの存在は会話の支障にならないので、エコー抑圧量算出部4は、残留エコー抑圧量egを0dBに決定する。
【0053】
しかし、表1のケース3のように、エコー消去後送信入力信号U[t]が低く、受信入力信号Rd[t]が高い場合には、遠端話者だけが話している状態であり、遠端話者の話し声のエコーがマイク40に検出され、遠端話者の耳に入る可能性が高い。このような場合には、エコー抑圧量算出部4は、背景雑音のレベルに応じて、12dBより大きく24dB以下の範囲で残留エコー抑圧量egを決定する。即ち、背景雑音のレベルが高い場合(SN比が低い)には、残留エコー抑圧量egを小さくし、背景雑音のレベルが低くなるにつれて残留エコー抑圧量egの値を大きくする。これは背景雑音のレベルが低くなるにつれて、送信入力信号中の残留エコーが目立つようになるので振幅抑圧量を大きくする必要があるためである。逆に、背景雑音レベルが高い場合には残留エコーは背景雑音によりマスクされて目立たなくなるため抑圧量を大きくする必要はない。
【0054】
上記の背景雑音レベルの算出は、エコー抑圧量算出部4のみで行うことが可能である。例えば、エコー抑圧量算出部4は、エコー消去後送信入力信号U[t]の各フレームを受けるたびに、そのパワーを計測し、現フレーム以前の過去50フレーム分のパワー計測結果を保存する。そして、過去のフレーム中の最低のパワーレベルを背景雑音レベルとする。
【0055】
フレームに分割されたエコー消去後送信入力信号U[t]は擬似背景雑音生成部30の時間・周波数変換部5にも供給される。時間・周波数変換部5は、エコー消去後送信入力信号U[t]の各フレームに対して、例えば256点のFFT(高速フーリエ変換)処理を行い、エコー消去後送信入力信号U[t]を振幅スペクトルS[f]と位相スペクトルP[f]に変換する。振幅スペクトルS[f]は、有音・雑音判定部6および混合部9に供給される一方、位相スペクトルP[f]は位相ランダム化部10に供給される。
【0056】
有音・雑音判定部6は、振幅スペクトルS[f]と雑音スペクトル[f]とに基づき、現フレームのエコー消去後送信入力信号U[t]が有音(近端話者の音声があること)に起因するか、ほとんど背景雑音に起因するかどうかの判定を行い、この判定結果を表す有音・雑音判定情報VADを生成し、これを雑音スペクトル推定部7に供給する。この有音・雑音判定部6の好適な実施の形態として、例えば特開2000−347688号公報「雑音抑圧装置」中に開示されている雑音らしさ判定手段の雑音らしさレベル(LEVELnoise)を、表2に示すように有音・雑音判定情報VADと対応付けることができるものが挙げられる。
【0057】
この有音・雑音判定部6(雑音らしさ判定手段)の動作説明を以下に行う。上述の公報中で供給されるローパス残差信号の自己相関係数最大値RACmaxと、ローパス残差パワーPOWresと、フレームパワーPOWfrと、それぞれの係数に対応する所定の閾値TH_RACmax.h、TH_RACmax.l、TH_POWres、TH_POWfrを用いて、次のようにして、LEVELnoiseの成分L1,L2,L3を求める。
【0058】
まず成分L1は、自己相関係数最大値RACmaxの値に応じて次のように求められる。RACmax>TH_RACmax.hの場合、L1は2である。TH_RACmax.h≧RACmax>TH_RACmax.lの場合、L1は1である。TH_RACmax.l≧RACmaxの場合、L1は0である。
【0059】
成分L2は、ローパス残差パワーPOWresの値に応じて次のように求められる。POWres>TH_POWresの場合、L2は1である。それ以外の場合には、L2は0である。
【0060】
成分L3は、フレームパワーPOWfrの値に応じて次のように求められる。POWfr>TH_POWfrの場合、L3は1である。それ以外の場合には、L3は0である。
【0061】
LEVELnoiseは、これらの成分L1,L2,L3の合計である。すなわち、LEVELnoise=L1+L2+L3である。なお、これらの3つの係数の算出方法に関しては、上述の公報を参照することとし説明は省略する。
【0062】
【表2】
Figure 0003568922
【0063】
有音・雑音判定部6は、表2に従い、LEVELnoiseに応じて有音・雑音判定情報VADを出力する。雑音スペクトル推定部7には、有音・雑音判定部6が出力する有音・雑音判定情報VADと、振幅スペクトルS[f]が供給される。有音・雑音判定情報VADが0(ほとんど雑音)である場合には、雑音スペクトル推定部7は式(6)に従って入力信号中に存在する背景雑音の平均的なスペクトルである雑音スペクトルN[f]を推定する。
N[f]=(1−C)・S[f]+C・Nold [f] (6)
ここで、Nold [f]は過去に雑音と判定されたフレームから推定された雑音スペクトルの平均であり、雑音スペクトル推定部7の内部のメモリに蓄えられている。また、Cは適切に定められた定数(例えば0.9)であって、雑音スペクトルN[f]の更新速度を決定する係数である。
【0064】
一方、有音・雑音判定情報VADが1(有音)である場合には、雑音スペクトル推定部7は式(7)に従って入力信号中に存在する背景雑音の平均的なスペクトルである雑音スペクトルN[f]を推定する。即ち、過去の雑音スペクトルNold [f]をそのまま現在の雑音スペクトルN[f]とみなす。
N[f]=Nold [f] (7)
【0065】
そして、雑音スペクトル推定部7は、式(8)に示されるように、内部メモリに蓄えられている過去の雑音スペクトルNold [f]の内容を、推定した現フレームの雑音スペクトルN[f]に置き換える(更新する)。
old [f]=N[f] (8)
【0066】
このようにして得られた雑音スペクトルN[f]は、有音・雑音判定部6および雑音振幅ランダム化部8に供給される。
有音・雑音判定部6は、式(8)に示されるように、内部メモリに蓄えられている過去の雑音スペクトルNold [f]の内容を、推定した現フレームの雑音スペクトルN[f]に置き換える(更新する)。
【0067】
雑音振幅ランダム化部8は、擬似背景雑音に対して時間に関するランダム性を加えるため、式(9)に従って雑音スペクトル推定部7が出力する雑音スペクトルN[f]の各スペクトル成分に所定の小振幅のランダムゲインrand[f]を乗じ、各フレームに応じて少しづつ形状が異なる振幅擾乱された雑音スペクトルNr[f]を得て、これを混合部9に供給する。
Nr[f]=rand[f]・N[f] (9)
【0068】
この計算は雑音スペクトルN[f]の各スペクトル成分について行う。即ち、周波数ゼロからfcまでにわたる各スペクトル成分にランダムゲインを乗ずる。なお、fcはこのエコー処理装置が扱うナイキスト周波数である。
【0069】
混合部9には、時間・周波数変換部5が出力する振幅スペクトルS[f]と、雑音振幅ランダム化部8が出力する振幅擾乱した雑音スペクトルNr[f]と、残留エコー抑圧量egと、フィルタ初期状態フラグEC_initが供給される。混合部9は、後述するように各種の処理を行うとともに、フィルタ初期状態フラグEC_initと残留エコー抑圧量egに基づいた振幅スペクトルSNo[f]を周波数・時間変換部11に供給する。以降、図2を用いて混合部9の動作を詳しく説明する。
【0070】
図2の第1の振幅調整部13には、時間・周波数変換部5が出力する振幅スペクトルS[f]と、エコー抑圧量算出部4が出力する残留エコー抑圧量egが供給され、これらに基づいて第1の振幅調整部13は振幅スペクトルS[f]のスペクトル成分の振幅調整、特に残留エコーの振幅の抑圧を行う。
【0071】
具体的には、第1の振幅調整部13は、まず式(10)に従って、残留エコー抑圧量egに第1の周波数重み付け係数W1[f](dB)を用いて、周波数に応じた重み付けを行い、第1の残留エコー抑圧量g1[f]を算出する。第1の周波数重み付け係数W1[f]については後述する。
g1[f]=eg+W1[f](dB) (10)
【0072】
次に、第1の振幅調整部13は、式(10)で得られた第1の残留エコー抑圧量g1[f]を用いて、式(11)に従って振幅スペクトルS[f]の振幅調整を行い、振幅調整した振幅スペクトルSs[f]を出力する。
Ss[f]=10g1[f]/20・S[f] (11)
【0073】
これらの計算は振幅スペクトルS[f]の各スペクトル成分について行う。即ち、周波数ゼロからfcまでにわたる各スペクトル成分に式(10)および式(11)を適用する。
【0074】
周波数と第1の周波数重み付け係数W1[f]の相関関係を図3に示す。図3に示すように、振幅スペクトルS[f]は低周波数領域では重み付けが大きく(振幅抑圧を強める)、高周波数領域では重み付けが小さくされている(振幅抑圧を弱める)。残留エコー信号の成分は主に音声信号であり、低域に残留エコー信号のパワーが偏っているので、低域で振幅の抑圧を大きくし高域で振幅抑圧を小さくすることで、高域の抑圧感を増加させず効果的に残留エコー信号の振幅を抑圧することができる。
【0075】
図2に戻り、混合部9の第2の振幅調整部14には、雑音振幅ランダム化部8が出力する振幅擾乱された雑音スペクトルNr[f]と、エコー抑圧量算出部4が出力する残留エコー抑圧量egが供給される。第2の振幅調整部14は、これらに基づいて、振幅擾乱された雑音スペクトルNr[f]のスペクトル成分の振幅調整を行う。
【0076】
具体的には、第2の振幅調整部14は、まず、式(12)に従って、残留エコー抑圧量egに第2の周波数重み付け係数W2[f](dB)を用いて周波数に応じた重み付けを行い、第2の残留エコー抑圧量g2[f]を算出する。第2の周波数重み付け係数W2[f]については後述する。
g2[f]=eg+W2[f](dB) (12)
【0077】
次に、第2の振幅調整部14は、式(12)で得られた第2の残留エコー抑圧量g2[f]を用いて、式(13)に従って、振幅擾乱された雑音スペクトルNr[f]の振幅調整を行い、振幅調整した雑音スペクトルNs[f]を出力する。
Ns[f]=10g2[f]/20・Nr[f] (13)
【0078】
第1の振幅調整部13が出力する振幅スペクトルSs[f]と、第2の振幅調整部14が出力する振幅調整した雑音スペクトルNs[f]は、加算器15に供給される。加算器15は、式(14)に従って、振幅調整した振幅スペクトルSs[f]と振幅調整した雑音スペクトルNs[f]との加算を行い、雑音を混合した振幅スペクトルSN[f]を出力する。
SN[f]=Ss[f]+Ns[f] (14)
【0079】
周波数と第2の周波数重み付け係数W2[f]の相関関係を図4に示す。図4に示すように、雑音スペクトルNs[f]は低周波数領域では重み付けが小さく(雑音スペクトルの振幅抑圧強度を弱める)、高周波数領域では重み付けが大きくされているので(雑音スペクトルの振幅抑圧強度を強める)、低周波数領域での擬似背景雑音の混入量を大きくし、高周波数領域では擬似背景雑音の混入量を小さくできる。従って、低域に多い残留エコー成分を擬似背景雑音によって大きくマスクすることができ、更に残留エコー感を軽減することができる。
【0080】
また、図2に示される混合部9の選択部16には、残留エコー抑圧量egのレベルとフィルタ初期状態フラグEC_initが供給される。これらの条件に従って、選択部16は、表3に示すように、場合に応じた振幅スペクトルSNo[f]を場合に応じた端子から出力する。
【0081】
【表3】
Figure 0003568922
【0082】
図2の選択部16は3つの端子16A,16B,16Cを有しており、上記の条件に応じて端子16A,16B,16Cのうち、信号を出力する端子を選択し、選択した端子にスイッチ16Dを合わせる。
具体的には、表3に示されるように、端子16Aが選択される場合は、送信入力信号Sd[t]中に近端話者音声が無くエコーのみが有る場合であり(前述の表1のケース3に相当する)、背景雑音を混合した振幅スペクトルSN[f]を振幅スペクトルSNo[f]として選択部16は出力する。
【0083】
端子16Bが選択される場合は、フィルタ初期状態フラグEC_initがオンの場合、即ち初期状態の場合であり、適応フィルタ2のフィルタ係数h[n]が収束していないので、振幅調整した雑音スペクトルNs[f]を混合した振幅スペクトルSN[f]を出力せずに、選択部16は、振幅擾乱した雑音スペクトルNr[f]を振幅スペクトルSNo[f]として出力する。この処理は、振幅擾乱した雑音スペクトルNr[f]で振幅スペクトルSN[f]を置き換えることに相当する。
【0084】
端子16Cが選択される場合は、残留エコー抑圧量egが所定値(6dB)である場合である。表1によれば、これは、送信入力信号Sd[t]に近端話者音声があり、かつ受信入力信号Rd[t]に遠端話者音声がある状態(表1のケース1、つまりダブルトーク状態)である。この場合には、選択部16は、雑音混入を行わず、第1の振幅調整部13の振幅調整により残留エコーの振幅が抑圧されただけの振幅スペクトルSs[f]を振幅スペクトルSNo[f]として出力する。
【0085】
但し、残留エコー抑圧量egが0dBである場合には、選択部16は端子16A,16B,16Cのいずれも選択せず、振幅スペクトルSNo[f]を出力しない。これは、送信入力信号Sd[t]に近端話者音声があるが、受信入力信号Rd[t]に遠端話者音声がない状態(表1のケース2)、または両方に音声がない場合(表1のケース4、つまり無入力状態)である。
【0086】
正規化部17には、混合部9に入力された元々の振幅スペクトルS[f]が供給され、混合部9が振幅スペクトルSNo[f]を出力する場合には、振幅スペクトルSNo[f]も正規化部17に供給される。混合部9が振幅スペクトルSNo[f]を出力しない場合(残留エコー抑圧量egが0dBである場合)には、正規化部17は混合部9に入力された元々の振幅スペクトルS[f]をそのまま振幅スペクトルSNo[f]として出力する。
【0087】
一方、混合部9が振幅スペクトルSNo[f]を出力する場合には、正規化部17は、混合部9から出力されるべき振幅スペクトルSNo[f]のパワーが、混合部9に入力された元々の振幅スペクトルS[f]のパワーと同じになるように正規化を行う。
以上のように、混合部9は、送信入力信号Sd[t]中に近端話者音声が無くエコーのみが有る場合には、背景雑音を混合した振幅スペクトルを出力する。一方、初期状態には、振幅擾乱した雑音スペクトルを出力する。また、ダブルトーク状態では、背景雑音の混入のない振幅調整した振幅スペクトルを出力する。さらに、近端話者だけが話している状態、または無入力状態では、背景雑音の混入がなく振幅調整もしていない振幅スペクトルを出力する。
【0088】
図1に戻り、位相ランダム化部10には、時間・周波数変換部5が出力する位相スペクトルP[f]と、エコー抑圧量算出部4が出力する残留エコー抑圧量egが供給される。位相ランダム化部10は、式(15)ないし式(17)のいずれかに従い、残留エコー抑圧量egの大きさに応じて各フレームの位相スペクトルP[f]の位相擾乱を行い、位相擾乱された位相スペクトルPr[f]を出力する。
【0089】
ただし、残留エコー抑圧量egが所定値(12dB)以下の場合、即ちダブルトーク時または無入力状態または近端話者音声のみがある場合(表1のケース1、2、4に相当)には、位相擾乱を行わない。つまりPr[f]=P[f]である。これは音声無入力状態では、位相を擾乱する意味がないからであり、少なくとも近端話者音声がある場合には、位相を擾乱することは遠端話者に違和感を与える結果に帰するからである。
【0090】
結局、位相ランダム化部10が位相を擾乱するのは、表1に示されていない初期状態の場合か、表1のケース3の場合、つまり近端話者の音声がなく、遠端話者の音声がある場合である。位相ランダム化部10は残留エコー抑圧量egの大きさに応じて式(15)ないし式(17)のいずれかに従って、位相擾乱された位相スペクトルPr[f]を求める。上述の通り、初期状態では、残留エコー抑圧量egは24dBより大きい。この場合には式(15)が適用される。
Pr[f]=P[f]・sin(π/4*RND(x)) (15)
ここで、RND(x)は−1.0≦RND(x)<1.0の範囲の一様乱数を発生する関数である。この計算は位相スペクトルP[f]の各スペクトル成分について行う。具体的には、周波数fc/2からfcまでにわたる各スペクトル成分に式(15)を適用する。なお、fcはこのエコー処理装置が扱うナイキスト周波数である。
【0091】
ケース3において、エコー抑圧量算出部4からの残留エコー抑圧量egは12dBより大きく、24dB以下である。18dB<eg≦24dBの場合には式(16)が適用される。
Pr[f]=P[f]・sin(π/8*RND(x)) (16)
この計算は位相スペクトルP[f]の周波数fc/4からfcまでにわたる各スペクトル成分について行う。
【0092】
一方、12dB<eg≦18dBの場合には式(17)が適用される。
Pr[f]=P[f]・sin(π/16*RND(x)) (17)
この計算は位相スペクトルP[f]の周波数fc/8からfcまでにわたる各スペクトル成分について行う。
なお、式(15)ないし式(17)を使い分ける閾値は、24,18,12dBに限定されず、エコー処理装置の使用環境その他の条件に基づいて任意の値に設定可能である。
【0093】
表1に関連した上記の説明から明らかなように、残留エコー抑圧量egが大きいということは、抑圧されるべきエコーのレベルが背景雑音に相対して大きいということであり、その結果位相スペクトルP[f]の成分にはエコー信号成分が大きく占めることとなる。逆に、残留エコー抑圧量egが小さいならば、位相スペクトルP[f]の成分には背景雑音の成分が大きく占めることとなる。位相スペクトルに残留エコー信号成分が大きく混入することは擬似背景雑音の自然性を損なうので、式(15)ないし式(17)に従って、残留エコー抑圧量egの大きさに応じて位相スペクトルの位相擾乱を行い、擬似背景雑音のランダム化調整を行う。その結果、残留エコー抑圧量egが大きい場合には、擬似背景雑音の位相スペクトルに混入する残留エコー成分を白色化できるので、聴感上残留エコーを軽減することができる。
【0094】
一方、残留エコー抑圧量egが小さい場合には、位相ランダム化部10は位相スペクトルP[f]の位相擾乱を行わずに送信入力信号の位相を維持するので、擬似背景雑音の自然性を保つことができる。
【0095】
上述のように、送信入力信号の振幅スペクトルS[f]については、雑音スペクトルN[f]を推定し、振幅スペクトルS[f]に雑音スペクトルN[f]を混合するが、位相スペクトルP[f]については雑音混合処理を行わずにそのまま出力する。従って、送信入力信号の位相スペクトルは維持され、自然性の高い擬似背景雑音を生成できる。
【0096】
周波数・時間変換部11には、混合部9が出力する(場合により疑似背景雑音が混入された)振幅スペクトルSNo[f]と、位相ランダム化部10が出力する位相擾乱された位相スペクトルPr[f]が供給される。そして、周波数・時間変換部11は、これらの周波数領域の表現形式のスペクトルから時間領域の表現形式の送信出力信号So[t]へ変換し、これを出力する。
【0097】
平滑化部12は、周波数・時間変換部11が出力する送信出力信号So[t]のフレーム間の不連続感の軽減のために、式(18)および図5に示す三角波形状の窓関数Wines[t]を用いて送信出力信号So[t]のフレーム間平滑を行い、その結果得られる出力信号Sout[t]を出力する。
Figure 0003568922
ここで、Soold [t]は直前のフレームの送信出力信号So[t]であり、Nはフレーム長に相当するサンプル時間tの最大値である。即ち、サンプル時間はゼロからNまでである。
【0098】
図6は、近端から送信しようとする送信信号および遠端から受信した受信信号の状態と、残留エコー抑圧量egの変化に対する擬似背景雑音生成部30の動作を示すタイムチャートである。図6より上記の動作に関する説明がさらに容易に理解されるであろう。送信信号中にエコーのみの場合は振幅抑圧と雑音混合処理が行われ、送信信号に近端話者音声とエコーが含まれている場合(ダブルトーク時)には振幅抑圧のみが行われる。また、フィルタ初期状態(フィルタ初期状態フラグEC_initがオンのとき)では雑音置換処理が行われる。
【0099】
この実施の形態では、フィルタ初期状態フラグEC_initがオンのときだけ、表3に示すように端子16Bを選択して、選択部16から出力される振幅スペクトルSNo[f]をNr[f]、即ち振幅擾乱してあるが振幅調整していない雑音スペクトルNr[f]にしたが、他の場合に端子16Bを選択することも可能である。例えば、残留エコー抑圧量egが所定値(例えば20dB)より大きい場合、端子16Bを選択して雑音置換処理を行ってもよい。上述の通り、残留エコー抑圧量egが大きい場合には、背景雑音のレベルが低く、送信入力信号中の残留エコーが目立つので振幅抑圧量を大きくするのが望ましいためである。また、残留エコー抑圧量egが大きい場合には、遠端話者の音声はあっても近端話者の音声はないので、会話に支障はない。
【0100】
また、フィルタ初期状態フラグEC_initがオンの時(つまり初期状態で)、あるいは残留エコー抑圧量egが所定値(例えば20dB)より大きい場合に、式(12)で算出される第2の残留エコー抑圧量g2からある値を減算(雑音スペクトルの振幅抑圧を更に弱める)して、雑音スペクトルの混合の割合を更に増加させることにより、擬似背景雑音を大きく混合することも可能である。
【0101】
この実施の形態に係るエコー処理装置は、エコーキャンセル部1を含んでいるが、エコーキャンセル部1が無く、送信入力信号Sd[t]が直接時間・周波数変換部5に入力される構成としてもよい。その場合、フィルタ初期状態フラグEC_initに関する処理は選択部16で行われない。
【0102】
以上のように、この実施の形態1によれば、送信入力信号の振幅スペクトルS[f]については、雑音スペクトルN[f]を推定し、振幅スペクトルS[f]に雑音スペクトルN[f]を混合するが、位相スペクトルP[f]については雑音混合処理を行わずにそのまま出力する。従って、送信入力信号の位相スペクトルは維持され、自然性の高い擬似背景雑音を生成でき、聴感上良好なエコー処理装置を提供することができるなどの効果が得られる。
【0103】
また、有音・雑音判定部6が送信入力信号の有音・雑音判定を行い、雑音と判定されたフレームから雑音スペクトルを雑音スペクトル推定部7が推定し、雑音振幅ランダム化部8が平均化することにより、時間・周波数に関して安定した雑音スペクトルを生成できる。従って、場合に応じて適切で自然性の高い擬似背景雑音を生成でき、聴感上良好なエコー処理装置を提供することができる。
【0104】
さらに、残留エコー抑圧量egが大きくなるにつれて、送信入力信号の位相スペクトルのランダム化の程度が大きくなり、さらに位相擾乱する周波数領域が低域までおよぶために送信出力信号So[t]は白色雑音に近くなる。その結果、送信入力信号中に残留するエコー信号がランダム化されて背景雑音に近くなるので、聴感上残留エコーを聞こえ難くする効果がある。一方、残留エコー抑圧量egが小さい場合には、位相スペクトルの位相擾乱を行わずに、送信入力信号の位相を維持するので、擬似背景雑音の自然性を保つことができる。
【0105】
また、残留エコー抑圧量egが所定の閾値より大きい場合に、雑音スペクトルを大きく混合するか、あるいは雑音スペクトルを混入する代わりに振幅スペクトルを雑音スペクトルで置き換えるようにしたので、エコー消去量が不充分な場合においても残留エコー成分を消去して擬似背景雑音を挿入することができるので、聴感上良好なエコー処理装置を提供することができる。
【0106】
さらに、適応フィルタのフィルタ係数が収束するまでの間、適応フィルタが強制的に雑音置換処理を行うようにするフィルタ初期状態フラグEC_initを出力し、擬似背景雑音生成部30で雑音スペクトル置換処理を行うようにしたので、適応フィルタ2に代わって、あるいはこれに加えて残留エコーを消去して、擬似背景雑音を挿入することができるので、聴感上良好なエコー処理装置を提供することができる。
【0107】
さらに、混合部9における送信入力信号の振幅スペクトルに雑音スペクトルを混合する割合を、残留エコー抑圧量egが大きい場合には大きくし、残留エコー抑圧量egが小さい場合には小さくするように調整できるので、残留エコーレベルと送信・受信入力信号の状態に応じた擬似背景雑音を混入することができ、聴感上良好なエコー処理装置を提供することができる。
【0108】
また、低周波数領域での擬似背景雑音の混入量を大きくし、高周波数領域では擬似背景雑音の混入量を小さくするようにしたので、高域の雑音感を増加させず、低域にパワーが偏る残留エコー信号を効果的に抑圧することができ、聴感上良好なエコー処理装置を提供することができる。
【0109】
実施の形態2.
上記の実施の形態1においては、位相ランダム化部10で送信入力信号の位相スペクトルのランダム化を行う。しかし、この代わりに、以下に述べるこの発明の実施の形態2のように、送信入力信号の振幅スペクトルの振幅ランダム化を行っても同様の効果がある。
図7はこの発明の実施の形態2によるエコー処理装置の構成を示すブロック図である。図において、18は振幅ランダム化部を示す。図1の構成と異なり、このエコー処理装置には、位相ランダム化部10が無く、代わりに振幅ランダム化部18が設けられている。その他の構成については図1と同様であるので、詳細には説明しない。
【0110】
次に動作について説明する。
実施の形態1と異なり、時間・周波数変換部5が出力した振幅スペクトルS[f]は、混合部9に直接供給されるのではなく、振幅ランダム化部18に供給される。また、振幅ランダム化部18には、エコー抑圧量算出部4が出力する残留エコー抑圧量egが供給される。振幅ランダム化部18は、式(19)ないし式(21)のいずれかに従い、残留エコー抑圧量egの大きさに応じて各フレームの振幅スペクトルS[f]の振幅成分に擾乱を与え、振幅擾乱された振幅スペクトルSr[f]を出力する。
【0111】
ただし、残留エコー抑圧量egが所定値(12dB)以下の場合、即ちダブルトーク時または無入力状態または近端話者音声のみがある場合(表1のケース1、2、4に相当)には、振幅擾乱を行わない。つまり、Sr[f]=S[f]である。これは音声無入力状態では、振幅を擾乱する意味がないからであり、少なくとも近端話者音声がある場合には、振幅を擾乱することは遠端話者に違和感を与える結果に帰するからである。
【0112】
結局、振幅ランダム化部18が振幅を擾乱するのは、表1に示されていない初期状態の場合か、表1のケース3の場合、つまり近端話者の音声がなく、遠端話者の音声がある場合である。振幅ランダム化部18は残留エコー抑圧量egの大きさに応じて式(19)ないし式(21)のいずれかに従って、振幅擾乱された振幅スペクトルSr[f]を求める。上述の通り、初期状態では、残留エコー抑圧量egは24dBより大きい。この場合には式(19)が適用される。
Figure 0003568922
ここで、gr1[f]はランダムなゲインであり、RND(x)は−1.0≦RND(x)<1.0の範囲の一様乱数を発生する関数である。この計算は振幅スペクトルS[f]の各スペクトル成分について行う。具体的には、周波数fc/2からfcまでにわたる各スペクトル成分に式(19)を適用する。なお、fcはこのエコー処理装置が扱うナイキスト周波数である。
【0113】
表1のケース3において、エコー抑圧量算出部4からの残留エコー抑圧量egは12dBより大きく、24dB以下である。18dB<eg≦24dBの場合には式(20)が適用される。
Figure 0003568922
この計算は振幅スペクトルS[f]の周波数fc・(3/4)からfcまでにわたる各スペクトル成分について行う。
【0114】
一方、12dB<eg≦18dBの場合には式(21)が適用される。
Figure 0003568922
この計算は振幅スペクトルS[f]の周波数fc・(7/8)からfcまでにわたる各スペクトル成分について行う。
【0115】
式(19)ないし式(21)から明らかなように、残留エコー抑圧量egが18dBより小さい場合には高域のスペクトル成分のみをランダム化し、またそのランダム化の程度は小さい。一方、残留エコー抑圧量egが18dBより大きい場合には、振幅のランダム化の程度が大きく、低域の周波数範囲までランダム化される。
なお、式(19)ないし式(21)を使い分ける閾値は、24,18,12dBに限定されず、エコー処理装置の使用環境その他の条件に基づいて任意の値に設定可能である。
【0116】
表1に関連した上記の説明から明らかなように、残留エコー抑圧量egが大きいということは、抑圧されるべきエコーのレベルが背景雑音に相対して大きいということであり、その結果振幅スペクトルS[f]の成分にはエコー信号成分が大きく占めることとなる。逆に、残留エコー抑圧量egが小さいならば、振幅スペクトルS[f]の成分には背景雑音の成分が大きく占めることとなる。振幅スペクトルに残留エコー信号成分が大きく混入することは擬似背景雑音の自然性を損なうので、式(19)ないし式(21)に従って、残留エコー抑圧量egの大きさに応じて振幅スペクトルの振幅擾乱を行い、擬似背景雑音のランダム化調整を行う。その結果、残留エコー抑圧量egが大きい場合には、擬似背景雑音の振幅スペクトルに混入する残留エコー成分を白色化できるので、聴感上残留エコーを軽減することができる。
【0117】
一方、残留エコー抑圧量egが小さい場合には、振幅ランダム化部18は振幅スペクトルS[f]の振幅擾乱を行わずに送信入力信号の振幅を維持するので、擬似背景雑音の自然性を保つことができる。
【0118】
このようにして振幅擾乱された振幅スペクトルSr[f]は混合部9に供給される。また、混合部9には、雑音振幅ランダム化部8から出力された雑音スペクトルNr[f]、適応フィルタ2から出力されたフィルタ初期状態フラグEC_initおよびエコー抑圧量算出部4から出力された残留エコー抑圧量egが供給される。混合部9の構造および機能は、実施の形態1における混合部9の構造および機能と実質的に同様である。換言すれば、実施の形態1における混合部9に関する説明のうち、振幅スペクトルS[f]を振幅擾乱された振幅スペクトルSr[f]と読み替えれば、実施の形態2における混合部9の構造および機能は理解される。
【0119】
従って、混合部9においては、送信入力信号Sd[t]中に近端話者音声が無くエコーのみが有る場合には、選択部16が端子16Aを選択し(図2参照)、背景雑音を混合した振幅スペクトルSN[f]を振幅スペクトルSNo[f]として出力する。一方、初期状態には、選択部16が端子16Bを選択し、振幅擾乱された雑音スペクトルNr[f]を振幅スペクトルSNo[f]として出力する。また、ダブルトーク状態では、選択部16が端子16Cを選択し、背景雑音の混入のない振幅調整した振幅スペクトルSs[f]を振幅スペクトルSNo[f]として出力する。さらに、近端話者だけが話している状態、または無入力状態では、背景雑音の混入がなく振幅調整もしていないが振幅擾乱された振幅スペクトルSr[f]を振幅スペクトルSNo[f]として出力する。
【0120】
このようにして、混合部9から、場合により雑音が混合された振幅スペクトルSNo[f]が周波数・時間変換部11に供給される。実施の形態1と異なり、この実施の形態2には位相ランダム化部10(図1参照)が設けられておらず、時間・周波数変換部5が出力した位相スペクトルP[f]はそのまま周波数・時間変換部11に供給される。そして、周波数・時間変換部11は、これらの周波数領域の表現形式のスペクトルから時間領域の表現形式の送信出力信号So[t]へ変換し、これを出力する。
他の構成要素の動作は実施の形態1のそれと同じである。
【0121】
以上のように、この実施の形態2によれば、送信入力信号の振幅スペクトルS[f]については、雑音スペクトルN[f]を推定し、振幅スペクトルS[f]に雑音スペクトルN[f]を混合するが、位相スペクトルP[f]については雑音混合処理を行わずにそのまま出力する。従って、送信入力信号の位相スペクトルは維持され、自然性の高い擬似背景雑音を生成でき、聴感上良好なエコー処理装置を提供することができるなどの効果が得られる。
【0122】
また、有音・雑音判定部6が送信入力信号の有音・雑音判定を行い、雑音と判定されたフレームから雑音スペクトルを雑音スペクトル推定部7が推定し、雑音振幅ランダム化部8が平均化することにより、時間・周波数に関して安定した雑音スペクトルを生成できる。従って、場合に応じて適切で自然性の高い擬似背景雑音を生成でき、聴感上良好なエコー処理装置を提供することができる。
【0123】
さらに、残留エコー抑圧量egが大きくなるにつれて、送信入力信号の振幅スペクトルSr[f]のランダム化の程度が大きくなり、さらに位相擾乱する周波数領域が低域までおよぶために送信出力信号So[t]は白色雑音に近くなる。その結果、送信入力信号中に残留するエコー信号がランダム化されて背景雑音に近くなるので、聴感上残留エコーを聞こえ難くする効果がある。一方、残留エコー抑圧量egが小さい場合には、振幅スペクトルS[f]の振幅擾乱を行わないので、擬似背景雑音の自然性を保つことができる。
【0124】
実施の形態3.
上記の実施の形態1または2では、図2の第1の振幅調整部13での振幅スペクトルS[f]または振幅擾乱された振幅スペクトルSr[f]の振幅抑圧、および図2の第2の振幅調整部14での雑音スペクトルN[f]の振幅抑圧を全周波数帯域にわたって行っている。しかし、これらを変形したこの発明の実施の形態3として、例えば3kHz以下の中〜低域成分だけ振幅抑圧するなど一部帯域についてだけ振幅の抑圧を行うことも可能である。
【0125】
送信入力信号中の中〜低域成分だけ振幅抑圧を行うことで、高域の背景雑音の自然性を損なわずに、音声のために低域にパワーが偏っている残留エコーだけを効果的に振幅抑圧できるので、良好なエコー処理装置を提供することができる。
【0126】
実施の形態4.
実施の形態1〜3の別の形態として、雑音振幅ランダム化部8が出力する一様の乱数で振幅擾乱した雑音スペクトルNr[f]に、背景雑音レベルに応じた大きさの振幅擾乱を与えることも可能である。
図8はこの発明の実施の形態4によるエコー処理装置の構成を示すブロック図である。図において19は第2の雑音振幅ランダム化部を示す。図1の構成と比較して、新たな要素として、このエコー処理装置には、第2の雑音振幅ランダム化部19が設けられている。その他の構成については図1と同様であるので、詳細には説明しない。
【0127】
次に動作について説明する。
雑音振幅ランダム化部8が出力した振幅擾乱した雑音スペクトルNr[f]は第2の雑音振幅ランダム化部19に供給される。第2の雑音振幅ランダム化部19は、まず供給された振幅擾乱した雑音スペクトルNr[f]のパワーNpow(dB)を計測する。あるいは、エコー抑圧量算出部4が背景雑音レベルを算出するために各フレームのパワーを計測した計測結果が第2の雑音振幅ランダム化部19に供給されるようになっていてもよい。
【0128】
パワーNpowに基づいて、第2雑音振幅ランダム化部19は、式(22)ないし式(24)のいずれかを用いて、雑音振幅ランダム化部8が出力する一様の乱数で振幅擾乱された雑音スペクトルNr[f]のうちのある周波数領域における振幅をさらに擾乱して、雑音スペクトルNr2[f]を生成する。パワーNpowが60dBより小さいときは、式(22)が適用される。
Figure 0003568922
ここで、gr11[f]はランダムなゲインであり、RND(x)は−1.0≦RND(x)<1.0の範囲の一様乱数を発生する関数である。この計算は振幅スペクトルS[f]の各スペクトル成分について行う。具体的には、周波数fc/2からfcまでにわたる各スペクトル成分に式(22)を適用する。なお、fcはこのエコー処理装置が扱うナイキスト周波数である。
【0129】
パワーNpowが40dBより大きく、60dB以下の場合には、式(23)が適用される。
Figure 0003568922
この計算は振幅スペクトルS[f]の周波数fc・(3/4)からfcまでにわたる各スペクトル成分について行う。
【0130】
パワーNpowが30dBより大きく、40dB以下の場合には、式(24)が適用される。
Figure 0003568922
この計算は振幅スペクトルS[f]の周波数fc・(7/8)からfcまでにわたる各スペクトル成分について行う。
【0131】
式(22)ないし式(24)から明らかなように、雑音スペクトルのパワーNpowが小さい場合には、高域のスペクトル成分のみをランダム化し、またそのランダム化の程度は小さい。一方、雑音スペクトルのパワーが大きい場合には、振幅のランダム化の程度が大きく、低域の周波数範囲までランダム化される。なお、式(22)ないし式(24)を使い分ける閾値は、30,40,60dBに限定されず、エコー処理装置の使用環境その他の条件に基づいて任意の値に設定可能である。
【0132】
背景雑音レベル、即ち雑音スペクトルのパワーが大きくなるにつれて、送信入力信号のSN比は小さくなり、その結果有音・雑音判定部6での有音・雑音判定精度は劣化する(有音を雑音として誤判定する比率が高くなる)。しかし、この実施の形態のように、背景雑音レベルが高くなるにつれて、雑音スペクトルの振幅のランダム化の程度とランダム化する周波数範囲を大きくすることで、背景雑音が白色雑音に近くなる。このため、例えば有音・雑音判定部6の誤判定が原因で誤って雑音スペクトルに残留エコー成分が混入した場合でも、残留エコー成分を白色化することができる。
このようにして、振幅がランダム化された雑音スペクトルNr2[f]は第2の雑音振幅ランダム化部19から混合部9に供給される。
【0133】
以上のように、この実施の形態4によれば、背景雑音レベルに応じて、雑音スペクトルの振幅のランダム化の程度とランダム化する周波数範囲を調整できるようにしたので、例えば、背景雑音が大きい場合には背景雑音が白色雑音に近くなるので、誤って雑音スペクトルに残留エコー成分が混入した場合でも、残留エコー成分を白色化することができるなどの効果が得られる。
【0134】
実施の形態5.
図9はこの発明の実施の形態5によるエコー処理装置の構成を示すブロック図である。図において、20はランダム選択部を示す。図1の構成と比較して、このエコー処理装置には、雑音振幅ランダム化部8の代わりにランダム選択部20が設けられている。その他の構成については図1と同様であるので、詳細には説明しない。
【0135】
次に動作について説明する。
この実施の形態において、雑音スペクトル推定部7は、2種類の雑音スペクトルN1[f]とN2[f]を出力する。
雑音スペクトル推定部7には、有音・雑音判定部6が出力する有音・雑音判定情報VADと、振幅スペクトルS[f]が供給され、有音・雑音判定情報VADが0(ほとんど雑音)である場合には、雑音スペクトル推定部7は式(25)に従って入力信号中に存在する背景雑音の平均的なスペクトルである第1の雑音スペクトルN1[f]を推定する。
N1[f]=(1−C1)・S[f]+C1・N1old [f] (25)
ここで、N1old [f]は過去に雑音と判定されたフレームから推定された第1の雑音スペクトルの平均であり、雑音スペクトル推定部7の内部のメモリに蓄えられている。また、C1は適切に定められた定数(例えば0.9)であって、第1の雑音スペクトルN1[f]の更新速度を決定する係数である。
【0136】
一方、有音・雑音判定情報VADが1(有音)である場合には、雑音スペクトル推定部7は式(26)に従って第1の雑音スペクトルN1[f]を推定する。即ち、過去の第1の雑音スペクトルN1old [f]をそのまま現在の第1の雑音スペクトルN1[f]とみなす。
N1[f]=N1old [f] (26)
【0137】
そして、雑音スペクトル推定部7は、式(27)に示されるように、内部メモリに蓄えられている過去の第1の雑音スペクトルN1old [f]の内容を、推定した現フレームの第1の雑音スペクトルN1[f]に置き換える(更新する)。
N1old [f]=N1[f] (27)
このようにして得られた第1の雑音スペクトルN1[f]は、有音・雑音判定部6およびランダム選択部20に供給される。
有音・雑音判定部6は、式(27)に示されるように、内部メモリに蓄えられている過去の第1の雑音スペクトルN1old [f]の内容を、推定した現フレームの第1の雑音スペクトルN1[f]に置き換える(更新する)。
【0138】
また、雑音スペクトル推定部7は、第1の雑音スペクトルN1[f]に加えて、第2の雑音スペクトルN2[f]を出力する。具体的には、有音・雑音判定情報VADが0(ほとんど雑音)である場合には、雑音スペクトル推定部7は式(28)に従って、第2の雑音スペクトルN2[f]を推定する。
N2[f]=(1−C2)・S[f]+C2・N2old [f] (28)
ここで、N2old [f]は過去に雑音と判定されたフレームから推定された第2の雑音スペクトルの平均であり、雑音スペクトル推定部7の内部のメモリに蓄えられている。また、C2は適切に定められた定数(例えば0.8)であって、第2の雑音スペクトルN2[f]の更新速度を決定する係数である。従って、第1の雑音スペクトルN1[f]に比べて第2の雑音スペクトルN2[f]の更新速度は大きい。また、第2の雑音スペクトルN2[f]の振幅は、第1の雑音スペクトルN1[f]のそれとは異なる。
【0139】
一方、有音・雑音判定情報VADが1(有音)である場合には、雑音スペクトル推定部7は式(29)に従って第2の雑音スペクトルN2[f]を推定する。即ち、過去の第2の雑音スペクトルN2old [f]をそのまま現在の第2の雑音スペクトルN2[f]とみなす。
N2[f]=N2old [f] (29)
【0140】
そして、雑音スペクトル推定部7は、式(30)に示されるように、内部メモリに蓄えられている過去の第2の雑音スペクトルN2old [f]の内容を、推定した現フレームの第2の雑音スペクトルN2[f]に置き換える(更新する)。
N2old [f]=N2[f] (30)
このようにして得られた第2の雑音スペクトルN2[f]は、ランダム選択部20に供給される。
【0141】
ランダム選択部20は、雑音スペクトル推定部7が出力する第1の雑音スペクトルN1[f]と、第2の雑音スペクトルN2[f]に基づいて、フレーム毎にスペクトル形状が異なる(振幅擾乱された)雑音スペクトルNr[f]を決定してこれを出力する。また、ランダム選択部20は、1を出力する確率がx(%)のランダム関数Prob(x)を演算する機能を有しており、雑音スペクトルNr[f]の決定にあたって、ランダム選択部20は、1を出力する確率が50%となるランダム関数Prob(50)を実行し、その実行結果を利用する。
【0142】
具体的には、ランダム関数Prob(50)の実行結果が1であれば、第1の雑音スペクトルN1[f]をランダム選択部20は出力する。他の場合には、第2の雑音スペクトルN2[f]をランダム選択部20は出力する。このようにして振幅が擾乱された雑音スペクトルNr[f]は混合部9に供給される。
他の構成要素の動作は実施の形態1のそれと同じである。
【0143】
以上のように、この実施の形態5によれば、フレーム毎に複数の異なる更新速度で推定した雑音スペクトルN1[f]およびN2[f]からランダムにいずれか一つを選択することによって、振幅擾乱された雑音スペクトルNr[f]を求めるようにしたので、雑音スペクトルの自然性を維持することができながらも、振幅スペクトルに混入する雑音スペクトルの時間に関するランダム性が高くなるので擬似背景雑音の自然性が向上し、聴感上良好なエコー処理装置を提供することができるなどの効果が得られる。
【0144】
実施の形態6.
図10はこの発明の実施の形態6によるエコー処理装置の構成を示すブロック図である。この実施の形態6は、図9に示された実施の形態5の改良である。図において、21は重み付け加算部を示す。図9の構成と異なり、このエコー処理装置には、ランダム選択部20が無く、代わりに重み付け加算部21が設けられている。その他の構成については図9と同様であるので、詳細には説明しない。
【0145】
重み付け加算部21には、雑音スペクトル推定部7が出力する第1の雑音スペクトルN1[f]と、第2の雑音スペクトルN2[f]が供給される。実施の形態5に関連して説明したように、第1の雑音スペクトルN1[f]に比べて、第2の雑音スペクトルN2[f]は高い推定速度を有する。これらの雑音スペクトルN1[f]とN2[f]を重み付け加算部21は、重み付けして加算し、その結果の振幅が擾乱された雑音スペクトルNr[f]を出力する。重み付け加算部21は、1を出力する確率がx(%)のランダム関数Prob(x)を演算する機能を有しており、雑音スペクトルNr[f]の決定にあたって、重み付け加算部21は、1を出力する確率が50%となるランダム関数Prob(50)を実行し、その実行結果を利用する。
【0146】
具体的には、ランダム関数Prob(50)の実行結果が1であれば、0からナイキスト周波数fcまでの周波数領域にわたって、式(31)を適用する。
Nr[f]=C3・N1[f]+(1−C3)・N2[f] (31)
【0147】
但し、C3は重み係数であり、式(32)により求められるランダムな変数である。
C3=0.7+0.1*RND(x) (32)
ここで、RND(x)は−1.0≦RND(x)<1.0の範囲の一様乱数を発生する関数である。式(32)から明らかなように、重み係数C3は0.6以上、0.8以下の範囲内で変化する。但し、第1項の0.7は他の定数で置換してもよい。
【0148】
一方、ランダム関数Prob(50)の実行結果が1以外であれば、0からナイキスト周波数fcまでの周波数領域にわたって、式(33)を適用する。
Nr[f]=(1−C3)・N1[f]+C3・N2[f] (33)
【0149】
このようにして、重み付け加算部21は、フレーム毎にスペクトル形状が異なる(振幅が擾乱された)雑音スペクトルNr[f]を出力する。このようにして振幅が擾乱された雑音スペクトルNr[f]は混合部9に供給される。他の構成要素の動作は実施の形態5のそれと同じである。
【0150】
以上のように、この実施の形態6によれば、振幅スペクトルS[f]に混入する雑音スペクトルNr[f]を、複数の異なる更新速度の雑音スペクトルN1[f]およびN2[f]の重み付き加算により算出するようにしたので、雑音スペクトルNr[f]の周波数特性(スペクトル形状)の概形を保ちながらも、時間に関して雑音スペクトルNr[f]の振幅をランダム化できるので、聴感上良好なエコー処理装置を提供することができるなどの効果が得られる。
【0151】
また、振幅スペクトルS[f]に混入する雑音スペクトルNr[f]を、各周波数について、雑音スペクトルN1[f]およびN2[f]のスペクトル成分の重み付き加算により算出するようにしたので、雑音スペクトルの周波数特性(スペクトル形状)の概形を保ちながらも、周波数に関して振幅をランダム化できるので擬似背景雑音の自然性が向上し、聴感上良好なエコー処理装置を提供することができる。
【0152】
実施の形態7.
図11はこの発明の実施の形態7によるエコー処理装置の構成を示すブロック図である。この実施の形態7は、図1に示された実施の形態1の改良である。図において、22はスペクトル減算部、31は雑音抑圧部を示す。図1の構成と比較して、新たな要素として、このエコー処理装置には、スペクトル減算部22が設けられている。雑音抑圧部31は、時間・周波数変換部5、有音・雑音判定部6、雑音スペクトル推定部7およびスペクトル減算部22を有する。その他の構成については図1と同様であるので、詳細には説明しない。
【0153】
この実施の形態7では、エコー消去後送信入力信号U[t]を時間・周波数変換部5で振幅スペクトルS[f]に変換した後、スペクトル減算部22が公知のスペクトルサブトラクション法を用いて振幅スペクトルS[f]に対して雑音抑圧処理を行う。
【0154】
次に動作について説明する。
エコーキャンセル部1でエコー消去された送信入力信号U[t]が時間・周波数変換部5に入力され、時間・周波数変換部5により振幅スペクトルS[f]と位相スペクトルP[f]に変換される。有音・雑音判定部6は、例えば前述の実施の形態1の方法を用い、現フレームの入力信号が有音に起因するか、ほとんど背景雑音に起因するかどうかの判定を行い、その結果を用いて雑音スペクトル推定部7が、雑音スペクトルN[f]を推定する。
【0155】
スペクトル減算部22には、時間・周波数変換部5が出力する振幅スペクトルS[f]と、雑音スペクトル推定部7が出力する雑音スペクトルN[f]が供給される。このスペクトル減算部22には、あるスペクトル減算率α(例えば1.2)とある定数A[f]があらかじめ入力されている。定数Aは1.0未満である。スペクトル減算部22は、振幅スペクトルS[f]と雑音スペクトルN[f]とスペクトル減算率αに基づいて式(34)に従って、スペクトル減算結果S’[f]を算出する。
S’[f]=S[f]−α・N[f] (34)
【0156】
このようにして、振幅スペクトルS[f]から減算率αを乗じた雑音スペクトルN[f]の減算を行うことにより雑音抑圧を行う。但し、式(34)に従ったスペクトル減算結果S’[f]が0以下である場合には、スペクトル減算結果S’[f]を廃棄し、あらためて式(35)によりスペクトル減算結果S’[f]を算出する。
S’[f]=A[f]・S[f] (35)
【0157】
このようにして得られたスペクトル減算結果S’[f]をスペクトル減算部22は混合部9に供給する。また、混合部9には、雑音振幅ランダム化部8から出力された雑音スペクトルNr[f]、適応フィルタ2から出力されたフィルタ初期状態フラグEC_initおよびエコー抑圧量算出部4から出力された残留エコー抑圧量egが供給される。混合部9の構造および機能は、実施の形態1における混合部9の構造および機能と実質的に同様である。換言すれば、実施の形態1における混合部9に関する説明のうち、振幅スペクトルS[f]をスペクトル減算結果S’[f]と読み替えれば、この実施の形態7における混合部9の構造および機能は理解される。
他の構成要素の動作は実施の形態1のそれと同じである。
【0158】
この実施の形態に係るエコー処理装置は、エコーキャンセル部1を含んでいるが、エコーキャンセル部1が無く、送信入力信号Sd[t]が直接時間・周波数変換部5に入力される構成としてもよい。その場合、フィルタ初期状態フラグEC_initに関する処理は選択部16で行われない。
【0159】
以上のように、この実施の形態7によれば、スペクトルサブトラクション法による雑音抑圧部31と、このエコー処理装置の一部の要素を共有できるので、簡便な構成で雑音抑圧と擬似背景雑音生成を実現することができるなどの効果が得られる。
【0160】
この実施の形態7では、雑音抑制にスペクトルサブトラクション法を用いるが、この発明をこの形態に限定する意図ではない。他の適当な雑音抑制方法を利用することも可能であり、そのような形態もこの発明の範囲内にある。例えば、前述の特開2000−347688号公報「雑音抑圧装置」で用いられているスペクトル減算とスペクトル振幅抑圧を組み合わせた雑音抑圧の方法を雑音抑圧部31が実行してもよい。
【0161】
以上、この発明をその好適な複数の実施の形態を参照しながら詳細に図示して説明したが、請求の範囲に記載されたこの発明の趣旨および範囲の区域内で、形式および細部に関する様々な変更が可能であることは当業者であれば理解できることだろう。かかる変更、代替、修正もこの発明の範囲に含まれるものであると意図する。例えば、上述した複数の実施の形態は、相互に組み合わせることが可能であり、そのような組み合わせもこの発明の範囲にある。
【0162】
【発明の効果】
以上のように、この発明によれば、エコー信号が混入した送信しようとする送信入力信号と、受信した受信入力信号の状態を比較し、この比較に基づいてエコー抑圧量を算出するエコー抑圧量算出部と、送信入力信号を時間領域の表現形式から周波数領域の表現形式に変換して、振幅スペクトルと位相スペクトルを生成する時間・周波数変換部と、振幅スペクトルから雑音スペクトルを推定する雑音スペクトル推定部と、振幅スペクトルにエコー抑圧量に応じて雑音スペクトルを混合する混合部と、混合部により雑音スペクトルが混合された振幅スペクトルと、位相スペクトルに基づいて、時間領域の表現形式の雑音が混合された送信出力信号を生成して、送信出力信号を出力する周波数・時間変換部とを備えるように構成したので、時間領域の表現形式の信号を直接的に修正する場合に比べて、自然性の高い疑似背景雑音を生成することが可能であるなどの効果がある。また、送信入力信号と受信入力信号の比較に基づいてエコー抑圧量算出部により算出されたエコー抑圧量に応じて雑音スペクトルを混合部が混合するので、場合に応じて適切で自然性の高い擬似背景雑音を生成でき、聴感上良好なエコー処理装置を提供することができるなどの効果がある。
【0163】
この発明によれば、混合部が、エコー抑圧量に応じて振幅スペクトルのスペクトル振幅の調整を行う振幅調整部を具備するように構成したので、送信入力信号中のエコー成分を効果的に抑圧することができるなどの効果がある。しかも、時間領域の表現形式の信号を直接的に修正する場合に比べて、最終的に送信される信号の自然性を高めることが可能であるなどの効果がある。
【0164】
この発明によれば、振幅スペクトルから、雑音スペクトルにスペクトル減算率を乗じたスペクトルを減算して雑音除去スペクトルを生成し、雑音除去スペクトルを振幅スペクトルの代わりに混合部に供給するスペクトル減算部を具備するように構成したので、送信入力信号中の雑音成分を効果的に抑圧した後に、背景雑音を混合することができるなどの効果がある。しかも、雑音スペクトル推定部の推定結果たる雑音スペクトルをスペクトル減算部で利用できるので、構成要素の数の増加を最小限に抑えることが可能であるなどの効果がある。
【0165】
この発明によれば、エコー信号が混入した送信しようとする送信入力信号と、受信した受信入力信号の状態を比較し、この比較に基づいてエコー抑圧量を算出するエコー抑圧量算出部と、送信入力信号を時間領域の表現形式から周波数領域の表現形式に変換して、振幅スペクトルと位相スペクトルを生成する時間・周波数変換部と、振幅スペクトルから雑音スペクトルを推定する雑音スペクトル推定部と、振幅スペクトルに雑音スペクトルを混合する混合部と、エコー抑圧量に応じて位相スペクトルの位相を擾乱する位相ランダム化部と、混合部により雑音スペクトルが混合された振幅スペクトルと、位相ランダム化部により位相が擾乱された位相スペクトルに基づいて、時間領域の表現形式の雑音が混合された送信出力信号を生成して、送信出力信号を出力する周波数・時間変換部とを備えるように構成したので、エコー抑圧量が高い場合には、位相スペクトルの位相の擾乱の程度を大きくしてエコーを聞こえ難くし、エコー抑圧量が低い場合には、位相スペクトルの位相の擾乱の程度を小さくして音声の自然性を維持することが可能であるなどの効果がある。
【0166】
この発明によれば、エコー抑圧量算出部が算出するエコー抑圧量が所定の値より小さい場合には、位相ランダム化部は、送信しようとする送信入力信号の位相スペクトルのうち高周波領域の位相を擾乱し、エコー抑圧量が大きくなるに従って、位相ランダム化部は高周波領域だけでなく低周波領域の位相を擾乱するように構成したので、遠端話者の音声に起因する低周波領域のエコーを必要な時に効果的に抑制することができるなどの効果がある。
【0167】
この発明によれば、エコー信号が混入した送信しようとする送信入力信号と、受信した受信入力信号の状態を比較し、この比較に基づいてエコー抑圧量を算出するエコー抑圧量算出部と、送信入力信号を時間領域の表現形式から周波数領域の表現形式に変換して、振幅スペクトルと位相スペクトルを生成する時間・周波数変換部と、振幅スペクトルから雑音スペクトルを推定する雑音スペクトル推定部と、振幅スペクトルに雑音スペクトルを混合する混合部と、エコー抑圧量に応じて振幅スペクトルの振幅を擾乱する振幅ランダム化部と、振幅ランダム化部により振幅が擾乱されて混合部により雑音スペクトルが混合された振幅スペクトルと、位相スペクトルに基づいて、時間領域の表現形式の雑音が混合された送信出力信号を生成して、送信出力信号を出力する周波数・時間変換部とを備えるように構成したので、エコー抑圧量が高い場合には、振幅スペクトルの振幅の擾乱の程度を大きくしてエコーを聞こえ難くし、エコー抑圧量が低い場合には、振幅スペクトルの振幅の擾乱の程度を小さくして音声の自然性を維持することが可能であるなどの効果がある。
【0168】
この発明によれば、エコー抑圧量算出部が算出するエコー抑圧量が所定の値より小さい場合には、振幅ランダム化部は、送信しようとする送信入力信号の振幅スペクトルのうち高周波領域の振幅を擾乱し、エコー抑圧量が大きくなるに従って、振幅ランダム化部は高周波領域だけでなく低周波領域の振幅を擾乱するように構成したので、遠端話者の音声に起因する低周波領域のエコーを必要な時に効果的に抑制することができるなどの効果がある。
【0169】
この発明によれば、エコー信号が混入した送信しようとする送信入力信号を時間領域の表現形式から周波数領域の表現形式に変換して、振幅スペクトルと位相スペクトルを生成する時間・周波数変換部と、振幅スペクトルから雑音スペクトルを推定する雑音スペクトル推定部と、送信入力信号の背景雑音レベルに応じて、雑音スペクトルの振幅を擾乱する雑音振幅ランダム化部と、雑音振幅ランダム化部で振幅が擾乱された雑音スペクトルを振幅スペクトルに混合する混合部と、混合部により雑音スペクトルが混合された振幅スペクトルと、位相スペクトルに基づいて、時間領域の表現形式の雑音が混合された送信出力信号を生成して、送信出力信号を出力する周波数・時間変換部とを備えるように構成したので、背景雑音レベルが所定の値より大きい場合には雑音スペクトルの振幅のランダム化の程度が大きくなり、仮に雑音スペクトルに残留エコー成分が混入した場合でも、残留エコー成分を白色化することができるなどの効果がある。
【0170】
この発明によれば、送信しようとする送信入力信号の背景雑音レベルが所定の値より小さい場合には、雑音振幅ランダム化部は、雑音スペクトルのうち高周波領域の振幅を擾乱し、背景雑音レベルが大きくなるに従って、雑音振幅ランダム化部は高周波領域だけでなく低周波領域の振幅を擾乱するように構成したので、背景雑音レベルが所定の値より大きい場合には、ランダム化の周波数範囲が低域まで及んで白色雑音に近くなるので、仮に雑音スペクトルに残留エコー成分が混入した場合でも、残留エコー成分を白色化することができるなどの効果がある。
【0171】
この発明によれば、エコー抑圧量算出部が算出するエコー抑圧量が所定の値より大きい場合には、混合部は大きな割合の雑音スペクトルを振幅スペクトルに混合し、エコー抑圧量が所定の値より小さい場合には、混合部は小さな割合の雑音スペクトルを振幅スペクトルに混合するように構成したので、残留エコーレベルと送信入力信号および受信入力信号の状態に応じた擬似背景雑音を混入することができ、聴感上良好なエコー処理装置を提供することができるなどの効果がある。
【0172】
この発明によれば、エコー抑圧量算出部が算出するエコー抑圧量が所定の値よりも大きい場合には、混合部が振幅スペクトルに雑音スペクトルを混合する代わりに、振幅スペクトルを雑音スペクトルで置換するように構成したので、残留エコーが大きい場合でも残留エコー成分を消去して擬似背景雑音を挿入することができるので、聴感上良好なエコー処理装置を提供することができるなどの効果がある。
【0173】
この発明によれば、受信した受信入力信号と、通信路伝達特性あるいはマイクとスピーカ間の音響伝達特性に基づいてフィルタ係数を推定し、擬似エコー信号を生成する適応フィルタと、エコー信号が混入した送信しようとする送信入力信号から擬似エコー信号を減算することによりエコー信号を除去する減算部とを具備し、適応フィルタのフィルタ係数が収束するまでの間、他の場合より大きな割合の雑音スペクトルを混合部が振幅スペクトルに混合するか、あるいは振幅スペクトルに雑音スペクトルを混合する代わりに、振幅スペクトルを雑音スペクトルで置換するように構成したので、フィルタ係数が収束するまでの間、適応フィルタに代わって混合部が残留エコーを消去して擬似背景雑音を挿入することができるので、聴感上良好なエコー処理装置を提供することができるなどの効果がある。
【0174】
この発明によれば、混合部は、送信しようとする送信入力信号の振幅スペクトルのうち低周波領域の振幅スペクトル成分に所定の値より大きな割合の雑音スペクトル成分を混合し、高周波数領域になるに従ってより小さい割合の雑音スペクトル成分を振幅スペクトル成分に混合するように構成したので、高域の雑音感を増加させず低域にパワーが偏る残留エコー信号を抑圧することができ、聴感上良好なエコー処理装置を提供することができるなどの効果がある。
【0175】
この発明によれば、雑音スペクトル推定部が、複数の推定雑音スペクトルを算出し、そのうちのいずれか1つの推定雑音スペクトルをランダムに選択して、雑音スペクトルとして出力するように構成したので、雑音スペクトルの自然性を維持することができながらも、振幅スペクトルに混入する雑音スペクトルの時間に関するランダム性が高くなるので擬似背景雑音の自然性が向上し、聴感上良好なエコー処理装置を提供することができるなどの効果がある。
【0176】
この発明によれば、雑音スペクトル推定部が、遅い更新速度を用いて第1の推定雑音スペクトルを算出し、早い更新速度を用いて第2の推定雑音スペクトルを算出し、そのうちのいずれか1つの推定雑音スペクトルをランダムに選択して、雑音スペクトルとして出力するように構成したので、雑音スペクトルの自然性を維持することができながらも、振幅スペクトルに混入する雑音スペクトルの時間に関するランダム性が高くなるので擬似背景雑音の自然性が向上し、聴感上良好なエコー処理装置を提供することができるなどの効果がある。
【0177】
この発明によれば、雑音スペクトル推定部が、複数の推定雑音スペクトルを算出し、これらの複数の推定雑音スペクトルの重みつき加算を行って得られる重みつき平均雑音スペクトルを雑音スペクトルとして出力するように構成したので、出力される雑音スペクトルの周波数特性(スペクトル形状)の概形を維持することができながらも、時間に関して雑音スペクトルの振幅をランダム化できるので、聴感上良好なエコー処理装置を提供することができるなどの効果がある。
【0178】
この発明によれば、雑音スペクトル推定部が、遅い更新速度を用いて第1の推定雑音スペクトルを算出し、早い更新速度を用いて第2の推定雑音スペクトルを算出し、これらの複数の推定雑音スペクトルの重みつき加算を行って得られる重みつき平均雑音スペクトルを雑音スペクトルとして出力するように構成したので、出力される雑音スペクトルの周波数特性(スペクトル形状)の概形を維持することができながらも、時間に関して振幅をランダム化できるので擬似背景雑音の自然性が向上し、聴感上良好なエコー処理装置を提供することができるなどの効果がある。
【0179】
この発明によれば、雑音スペクトル推定部における重み付き加算に用いる重み係数を、雑音スペクトル推定部が、雑音スペクトルのスペクトル成分毎に一定の範囲内でランダムに設定するように構成したので、雑音スペクトルの周波数特性(スペクトル形状)の概形を保ちながらも、周波数に関して振幅をランダム化できるので擬似背景雑音の自然性が向上し、聴感上良好なエコー処理装置を提供することができるなどの効果がある。
【図面の簡単な説明】
【図1】この発明の実施の形態1によるエコー処理装置の構成を示すブロック図である。
【図2】図1に示されたエコー処理装置の混合部の詳細を示すブロック図である。
【図3】図2に示された混合部の第1の振幅調整部で使われる第1の周波数重み付け係数W1[f]と周波数の相関関係を示す図である。
【図4】図2に示された混合部の第2の振幅調整部で使われる第2の周波数重み付け係数W2[f]と周波数の相関関係を示す図である。
【図5】図1に示されたエコー処理装置の平滑化部で使われる三角波形状の窓関数Wines[t]を説明するために参照される図である。
【図6】図1に示されたエコー処理装置における送信信号と受信信号の状態と、これらに基づいて生成された残留エコー抑圧量と、残留エコー抑圧量に基づくこの装置の擬似背景雑音生成部の動作を示すタイムチャートである。
【図7】この発明の実施の形態2によるエコー処理装置の構成を示すブロック図である。
【図8】この発明の実施の形態4によるエコー処理装置の構成を示すブロック図である。
【図9】この発明の実施の形態5によるエコー処理装置の構成を示すブロック図である。
【図10】この発明の実施の形態6によるエコー処理装置の構成を示すブロック図である。
【図11】この発明の実施の形態7によるエコー処理装置の構成を示すブロック図である。
【図12】従来のエコー処理装置の構成を示すブロック図である。
【符号の説明】
1 エコーキャンセル部、2 適応フィルタ、3 減算器(減算部)、4 エコー抑圧量算出部、5 時間・周波数変換部、6 有音・雑音判定部、7 雑音スペクトル推定部、8 雑音振幅ランダム化部、9 混合部、10 位相ランダム化部、11 周波数・時間変換部、12 平滑化部、13 第1の振幅調整部、14 第2の振幅調整部、15 加算器、16 選択部、16A,16B,16C 端子、16D スイッチ、17 正規化部、18 振幅ランダム化部、19 第2の雑音振幅ランダム化部、20 ランダム選択部、21 重み付け加算部、22 スペクトル減算部、30 擬似背景雑音生成部、31 雑音抑圧部、40 マイク、41 スピーカ、42 送信回路、43 受信回路、44 分割部。

Claims (18)

  1. エコー信号が混入した送信しようとする送信入力信号と、受信した受信入力信号の状態を比較し、この比較に基づいてエコー抑圧量を算出するエコー抑圧量算出部と、
    前記送信入力信号を時間領域の表現形式から周波数領域の表現形式に変換して、振幅スペクトルと位相スペクトルを生成する時間・周波数変換部と、
    前記振幅スペクトルから雑音スペクトルを推定する雑音スペクトル推定部と、前記振幅スペクトルに前記エコー抑圧量に応じて前記雑音スペクトルを混合する混合部と、
    前記混合部により前記雑音スペクトルが混合された振幅スペクトルと、前記位相スペクトルに基づいて、時間領域の表現形式の雑音が混合された送信出力信号を生成して、前記送信出力信号を出力する周波数・時間変換部とを備えたエコー処理装置。
  2. 混合部が、エコー抑圧量に応じて振幅スペクトルのスペクトル振幅の調整を行う振幅調整部を具備することを特徴とする請求項1記載のエコー処理装置。
  3. 振幅スペクトルから、雑音スペクトルにスペクトル減算率を乗じたスペクトルを減算して雑音除去スペクトルを生成し、前記雑音除去スペクトルを振幅スペクトルの代わりに混合部に供給するスペクトル減算部を具備することを特徴とする請求項1または請求項2記載のエコー処理装置。
  4. エコー信号が混入した送信しようとする送信入力信号と、受信した受信入力信号の状態を比較し、この比較に基づいてエコー抑圧量を算出するエコー抑圧量算出部と、
    前記送信入力信号を時間領域の表現形式から周波数領域の表現形式に変換して、振幅スペクトルと位相スペクトルを生成する時間・周波数変換部と、
    前記振幅スペクトルから雑音スペクトルを推定する雑音スペクトル推定部と、
    前記振幅スペクトルに前記雑音スペクトルを混合する混合部と、
    前記エコー抑圧量に応じて前記位相スペクトルの位相を擾乱する位相ランダム化部と、
    前記混合部により前記雑音スペクトルが混合された振幅スペクトルと、前記位相ランダム化部により位相が擾乱された前記位相スペクトルに基づいて、時間領域の表現形式の雑音が混合された送信出力信号を生成して、前記送信出力信号を出力する周波数・時間変換部とを備えたエコー処理装置。
  5. エコー抑圧量算出部が算出するエコー抑圧量が所定の値より小さい場合には、位相ランダム化部は、送信しようとする送信入力信号の位相スペクトルのうち高周波領域の位相を擾乱し、前記エコー抑圧量が大きくなるに従って、位相ランダム化部は高周波領域だけでなく低周波領域の位相を擾乱するようにしたことを特徴とする請求項4記載のエコー処理装置。
  6. エコー信号が混入した送信しようとする送信入力信号と、受信した受信入力信号の状態を比較し、この比較に基づいてエコー抑圧量を算出するエコー抑圧量算出部と、
    前記送信入力信号を時間領域の表現形式から周波数領域の表現形式に変換して、振幅スペクトルと位相スペクトルを生成する時間・周波数変換部と、
    前記振幅スペクトルから雑音スペクトルを推定する雑音スペクトル推定部と、
    前記振幅スペクトルに前記雑音スペクトルを混合する混合部と、
    前記エコー抑圧量に応じて前記振幅スペクトルの振幅を擾乱する振幅ランダム化部と、
    前記振幅ランダム化部により振幅が擾乱されて前記混合部により前記雑音スペクトルが混合された振幅スペクトルと、前記位相スペクトルに基づいて、時間領域の表現形式の雑音が混合された送信出力信号を生成して、前記送信出力信号を出力する周波数・時間変換部とを備えたエコー処理装置。
  7. エコー抑圧量算出部が算出するエコー抑圧量が所定の値より小さい場合には、振幅ランダム化部は、送信しようとする送信入力信号の振幅スペクトルのうち高周波領域の振幅を擾乱し、前記エコー抑圧量が大きくなるに従って、振幅ランダム化部は高周波領域だけでなく低周波領域の振幅を擾乱するようにしたことを特徴とする請求項6記載のエコー処理装置。
  8. エコー信号が混入した送信しようとする送信入力信号を時間領域の表現形式から周波数領域の表現形式に変換して、振幅スペクトルと位相スペクトルを生成する時間・周波数変換部と、
    前記振幅スペクトルから雑音スペクトルを推定する雑音スペクトル推定部と、
    前記送信入力信号の背景雑音レベルに応じて、前記雑音スペクトルの振幅を擾乱する雑音振幅ランダム化部と、
    前記雑音振幅ランダム化部で振幅が擾乱された前記雑音スペクトルを前記振幅スペクトルに混合する混合部と、
    前記混合部により前記雑音スペクトルが混合された振幅スペクトルと、前記位相スペクトルに基づいて、時間領域の表現形式の雑音が混合された送信出力信号を生成して、前記送信出力信号を出力する周波数・時間変換部とを備えたエコー処理装置。
  9. 送信しようとする送信入力信号の背景雑音レベルが所定の値より小さい場合には、雑音振幅ランダム化部は、雑音スペクトルのうち高周波領域の振幅を擾乱し、前記背景雑音レベルが大きくなるに従って、雑音振幅ランダム化部は高周波領域だけでなく低周波領域の振幅を擾乱するようにしたことを特徴とする請求項8記載のエコー処理装置。
  10. エコー抑圧量算出部が算出するエコー抑圧量が所定の値より大きい場合には、混合部は大きな割合の雑音スペクトルを振幅スペクトルに混合し、前記エコー抑圧量が所定の値より小さい場合には、混合部は小さな割合の雑音スペクトルを振幅スペクトルに混合することを特徴とする請求項1から請求項9のうちのいずれか1項記載のエコー処理装置。
  11. エコー抑圧量算出部が算出するエコー抑圧量が所定の値よりも大きい場合には、混合部が振幅スペクトルに雑音スペクトルを混合する代わりに、振幅スペクトルを雑音スペクトルで置換することを特徴とする請求項1から請求項10のうちのいずれか1項記載のエコー処理装置。
  12. 受信した受信入力信号と、通信路伝達特性あるいはマイクとスピーカ間の音響伝達特性に基づいてフィルタ係数を推定し、擬似エコー信号を生成する適応フィルタと、
    エコー信号が混入した送信しようとする送信入力信号から前記擬似エコー信号を減算することによりエコー信号を除去する減算部とを具備し、
    前記適応フィルタのフィルタ係数が収束するまでの間、他の場合より大きな割合の雑音スペクトルを混合部が振幅スペクトルに混合するか、あるいは振幅スペクトルに雑音スペクトルを混合する代わりに、振幅スペクトルを雑音スペクトルで置換することを特徴とする請求項1から請求項11のうちのいずれか1項記載のエコー処理装置。
  13. 混合部は、送信しようとする送信入力信号の振幅スペクトルのうち低周波領域の振幅スペクトル成分に所定の値より大きな割合の雑音スペクトル成分を混合し、高周波数領域になるに従ってより小さい割合の雑音スペクトル成分を振幅スペクトル成分に混合するようにしたことを特徴とする請求項1から請求項12のうちのいずれか1項記載のエコー処理装置。
  14. 雑音スペクトル推定部が、複数の推定雑音スペクトルを算出し、そのうちのいずれか1つの推定雑音スペクトルをランダムに選択して、雑音スペクトルとして出力することを特徴とする請求項1から請求項13のうちのいずれか1項記載のエコー処理装置。
  15. 雑音スペクトル推定部が、遅い更新速度を用いて第1の推定雑音スペクトルを算出し、早い更新速度を用いて第2の推定雑音スペクトルを算出し、そのうちのいずれか1つの推定雑音スペクトルをランダムに選択して、雑音スペクトルとして出力することを特徴とする請求項14記載のエコー処理装置。
  16. 雑音スペクトル推定部が、複数の推定雑音スペクトルを算出し、これらの複数の推定雑音スペクトルの重みつき加算を行って得られる重みつき平均雑音スペクトルを雑音スペクトルとして出力することを特徴とする請求項1から請求項13のうちのいずれか1項記載のエコー処理装置。
  17. 雑音スペクトル推定部が、遅い更新速度を用いて第1の推定雑音スペクトルを算出し、早い更新速度を用いて第2の推定雑音スペクトルを算出し、これらの複数の推定雑音スペクトルの重みつき加算を行って得られる重みつき平均雑音スペクトルを雑音スペクトルとして出力することを特徴とする請求項16記載のエコー処理装置。
  18. 雑音スペクトル推定部における重み付き加算に用いる重み係数を、前記雑音スペクトル推定部が、雑音スペクトルのスペクトル成分毎に一定の範囲内でランダムに設定することを特徴とする請求項16または請求項17記載のエコー処理装置。
JP2001287438A 2001-09-20 2001-09-20 エコー処理装置 Expired - Lifetime JP3568922B2 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP2001287438A JP3568922B2 (ja) 2001-09-20 2001-09-20 エコー処理装置
DE60234746T DE60234746D1 (de) 2001-09-20 2002-09-10 Echoprozessor mit einem Pseudo-Hintergrundrauschengenerator
EP02020233A EP1298815B1 (en) 2001-09-20 2002-09-10 Echo processor generating pseudo background noise with high naturalness
US10/245,578 US7092516B2 (en) 2001-09-20 2002-09-18 Echo processor generating pseudo background noise with high naturalness
CN02142858.1A CN1224187C (zh) 2001-09-20 2002-09-19 回声处理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001287438A JP3568922B2 (ja) 2001-09-20 2001-09-20 エコー処理装置

Publications (2)

Publication Number Publication Date
JP2003101445A JP2003101445A (ja) 2003-04-04
JP3568922B2 true JP3568922B2 (ja) 2004-09-22

Family

ID=19110249

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001287438A Expired - Lifetime JP3568922B2 (ja) 2001-09-20 2001-09-20 エコー処理装置

Country Status (5)

Country Link
US (1) US7092516B2 (ja)
EP (1) EP1298815B1 (ja)
JP (1) JP3568922B2 (ja)
CN (1) CN1224187C (ja)
DE (1) DE60234746D1 (ja)

Families Citing this family (58)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050132406A1 (en) * 2003-12-12 2005-06-16 Yuriy Nesterov Echo channel for home entertainment systems
US7760887B2 (en) * 2004-10-15 2010-07-20 Lifesize Communications, Inc. Updating modeling information based on online data gathering
JP4697465B2 (ja) * 2004-11-08 2011-06-08 日本電気株式会社 信号処理の方法、信号処理の装置および信号処理用プログラム
US7957964B2 (en) 2004-12-28 2011-06-07 Pioneer Corporation Apparatus and methods for noise suppression in sound signals
US8457614B2 (en) 2005-04-07 2013-06-04 Clearone Communications, Inc. Wireless multi-unit conference phone
JP4696776B2 (ja) * 2005-08-17 2011-06-08 ソニー株式会社 音声処理装置及びマイク装置
WO2007058121A1 (ja) * 2005-11-15 2007-05-24 Nec Corporation 残響抑圧の方法、装置及び残響抑圧用プログラム
CN101322183B (zh) * 2006-02-16 2011-09-28 日本电信电话株式会社 信号失真消除装置、方法
JP4569618B2 (ja) 2006-11-10 2010-10-27 ソニー株式会社 エコーキャンセラ及び通話音声処理装置
US8369511B2 (en) * 2006-12-26 2013-02-05 Huawei Technologies Co., Ltd. Robust method of echo suppressor
US7912211B1 (en) 2007-03-14 2011-03-22 Clearone Communications, Inc. Portable speakerphone device and subsystem
US8406415B1 (en) 2007-03-14 2013-03-26 Clearone Communications, Inc. Privacy modes in an open-air multi-port conferencing device
US8077857B1 (en) * 2007-03-14 2011-12-13 Clearone Communications, Inc. Portable speakerphone device with selective mixing
US8654955B1 (en) 2007-03-14 2014-02-18 Clearone Communications, Inc. Portable conferencing device with videoconferencing option
JP4916394B2 (ja) * 2007-07-03 2012-04-11 富士通株式会社 エコー抑圧装置、エコー抑圧方法及びコンピュータプログラム
US8199927B1 (en) 2007-10-31 2012-06-12 ClearOnce Communications, Inc. Conferencing system implementing echo cancellation and push-to-talk microphone detection using two-stage frequency filter
JP2009207021A (ja) * 2008-02-29 2009-09-10 Yamaha Corp 音響エコーキャンセラ
JP2009290825A (ja) * 2008-06-02 2009-12-10 Yamaha Corp 音響エコーキャンセラ
JP5292931B2 (ja) * 2008-06-10 2013-09-18 ヤマハ株式会社 音響エコーキャンセラおよびエコーキャンセル装置
WO2010035658A1 (ja) 2008-09-26 2010-04-01 日本電気株式会社 信号処理方法、信号処理装置、および信号処理プログラム
EP2346032B1 (en) * 2008-10-24 2014-05-07 Mitsubishi Electric Corporation Noise suppressor and voice decoder
JP5640393B2 (ja) * 2010-02-22 2014-12-17 沖電気工業株式会社 エコー除去装置、方法及びプログラム
RU2011103938A (ru) * 2011-02-03 2012-08-10 ЭлЭсАй Корпорейшн (US) Управление акустическими эхо-сигналами на основе временной области
WO2012157785A1 (ja) * 2011-05-19 2012-11-22 日本電気株式会社 音声処理装置、音声処理方法及び音声処理プログラムを記録した記録媒体
FR2976111B1 (fr) * 2011-06-01 2013-07-05 Parrot Equipement audio comprenant des moyens de debruitage d'un signal de parole par filtrage a delai fractionnaire, notamment pour un systeme de telephonie "mains libres"
CN103489452B (zh) * 2013-09-24 2017-02-08 小米科技有限责任公司 一种通话噪声消除方法、装置及终端设备
US10129410B2 (en) 2014-12-15 2018-11-13 Mistubishi Electric Corporation Echo canceller device and echo cancel method
US9565493B2 (en) 2015-04-30 2017-02-07 Shure Acquisition Holdings, Inc. Array microphone system and method of assembling the same
US9554207B2 (en) 2015-04-30 2017-01-24 Shure Acquisition Holdings, Inc. Offset cartridge microphones
CN106849976A (zh) * 2016-12-28 2017-06-13 深圳天珑无线科技有限公司 一种免提通话时回声消除方法及通信终端
US10367948B2 (en) 2017-01-13 2019-07-30 Shure Acquisition Holdings, Inc. Post-mixing acoustic echo cancellation systems and methods
US10192567B1 (en) * 2017-10-18 2019-01-29 Motorola Mobility Llc Echo cancellation and suppression in electronic device
US11523212B2 (en) 2018-06-01 2022-12-06 Shure Acquisition Holdings, Inc. Pattern-forming microphone array
US11297423B2 (en) 2018-06-15 2022-04-05 Shure Acquisition Holdings, Inc. Endfire linear array microphone
US11310596B2 (en) 2018-09-20 2022-04-19 Shure Acquisition Holdings, Inc. Adjustable lobe shape for array microphones
EP3667662B1 (en) * 2018-12-12 2022-08-10 Panasonic Intellectual Property Corporation of America Acoustic echo cancellation device, acoustic echo cancellation method and acoustic echo cancellation program
CN109788399A (zh) * 2019-01-30 2019-05-21 珠海迈科智能科技股份有限公司 一种音箱的回声消除方法及系统
CN113841419B (zh) 2019-03-21 2024-11-12 舒尔获得控股公司 天花板阵列麦克风的外壳及相关联设计特征
CN118803494B (zh) 2019-03-21 2025-09-19 舒尔获得控股公司 具有抑制功能的波束形成麦克风瓣的自动对焦、区域内自动对焦、及自动配置
US11558693B2 (en) 2019-03-21 2023-01-17 Shure Acquisition Holdings, Inc. Auto focus, auto focus within regions, and auto placement of beamformed microphone lobes with inhibition and voice activity detection functionality
CN114051738B (zh) 2019-05-23 2024-10-01 舒尔获得控股公司 可操纵扬声器阵列、系统及其方法
CN114051637B (zh) 2019-05-31 2025-10-28 舒尔获得控股公司 集成语音及噪声活动检测的低延时自动混波器
CN114467312A (zh) 2019-08-23 2022-05-10 舒尔获得控股公司 具有改进方向性的二维麦克风阵列
CN110648679B (zh) * 2019-09-25 2023-07-14 腾讯科技(深圳)有限公司 回声抑制参数的确定方法和装置、存储介质及电子装置
US12028678B2 (en) 2019-11-01 2024-07-02 Shure Acquisition Holdings, Inc. Proximity microphone
US11552611B2 (en) 2020-02-07 2023-01-10 Shure Acquisition Holdings, Inc. System and method for automatic adjustment of reference gain
USD944776S1 (en) 2020-05-05 2022-03-01 Shure Acquisition Holdings, Inc. Audio device
WO2021243368A2 (en) 2020-05-29 2021-12-02 Shure Acquisition Holdings, Inc. Transducer steering and configuration systems and methods using a local positioning system
CN116158090B (zh) * 2020-12-28 2025-08-15 深圳市韶音科技有限公司 用于抑制回声的音频信号处理方法和系统
CN116918351A (zh) 2021-01-28 2023-10-20 舒尔获得控股公司 混合音频波束成形系统
US12452584B2 (en) 2021-01-29 2025-10-21 Shure Acquisition Holdings, Inc. Scalable conferencing systems and methods
US12542123B2 (en) 2021-08-31 2026-02-03 Shure Acquisition Holdings, Inc. Mask non-linear processor for acoustic echo cancellation
WO2023059655A1 (en) 2021-10-04 2023-04-13 Shure Acquisition Holdings, Inc. Networked automixer systems and methods
EP4427465A1 (en) 2021-11-05 2024-09-11 Shure Acquisition Holdings, Inc. Distributed algorithm for automixing speech over wireless networks
WO2023133513A1 (en) 2022-01-07 2023-07-13 Shure Acquisition Holdings, Inc. Audio beamforming with nulling control system and methods
US11902757B2 (en) * 2022-06-14 2024-02-13 Tencent America LLC Techniques for unified acoustic echo suppression using a recurrent neural network
CN115218252B (zh) * 2022-07-11 2023-03-21 朴瑞(北京)企业管理有限公司 用于城市节能供热的智能高效换热系统
CN119541447B (zh) * 2025-01-23 2025-06-03 海星科技(深圳)有限公司 一种破壁机降噪方法及破壁机

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5561668A (en) * 1995-07-06 1996-10-01 Coherent Communications Systems Corp. Echo canceler with subband attenuation and noise injection control
US5920834A (en) * 1997-01-31 1999-07-06 Qualcomm Incorporated Echo canceller with talk state determination to control speech processor functional elements in a digital telephone system
DE19729521B4 (de) 1997-07-10 2004-04-01 Deutsche Telekom Ag Verfahren und Vorrichtung zur Störgeräusch- und Echounterdrückung
CN1192358C (zh) 1997-12-08 2005-03-09 三菱电机株式会社 声音信号加工方法和声音信号加工装置
US6163608A (en) 1998-01-09 2000-12-19 Ericsson Inc. Methods and apparatus for providing comfort noise in communications systems
US6658107B1 (en) 1998-10-23 2003-12-02 Telefonaktiebolaget Lm Ericsson (Publ) Methods and apparatus for providing echo suppression using frequency domain nonlinear processing
JP2000224081A (ja) 1999-02-04 2000-08-11 Nec Corp エコーキャンセラ装置
US7062039B1 (en) * 1999-05-27 2006-06-13 Telefonaktiebolaget Lm Ericsson Methods and apparatus for improving adaptive filter performance by inclusion of inaudible information
JP3454190B2 (ja) 1999-06-09 2003-10-06 三菱電機株式会社 雑音抑圧装置および方法
DE19935808A1 (de) 1999-07-29 2001-02-08 Ericsson Telefon Ab L M Echounterdrückungseinrichtung zum Unterdrücken von Echos in einer Sender/Empfänger-Einheit
US6526140B1 (en) * 1999-11-03 2003-02-25 Tellabs Operations, Inc. Consolidated voice activity detection and noise estimation

Also Published As

Publication number Publication date
US20030076947A1 (en) 2003-04-24
EP1298815A2 (en) 2003-04-02
EP1298815A3 (en) 2004-07-28
CN1405991A (zh) 2003-03-26
US7092516B2 (en) 2006-08-15
JP2003101445A (ja) 2003-04-04
DE60234746D1 (de) 2010-01-28
CN1224187C (zh) 2005-10-19
EP1298815B1 (en) 2009-12-16

Similar Documents

Publication Publication Date Title
JP3568922B2 (ja) エコー処理装置
US9461702B2 (en) Systems and methods of echo and noise cancellation in voice communication
Gustafsson et al. A psychoacoustic approach to combined acoustic echo cancellation and noise reduction
CN101964670B (zh) 回声抑制方法及回声抑制设备
KR100860805B1 (ko) 음성 강화 시스템
EP2008379B1 (en) Adjustable noise suppression system
EP1046273B1 (en) Methods and apparatus for providing comfort noise in communications systems
US7454010B1 (en) Noise reduction and comfort noise gain control using bark band weiner filter and linear attenuation
JP4423300B2 (ja) 雑音抑圧装置
HUP0101288A2 (hu) Zajcsökkentési eljárás a távközlésben akusztikus hasznos jelek, különösen beszéd továbbításához
KR20100133365A (ko) 에코 억제 필터를 위한 제어 정보를 계산하는 장치 및 방법 및 지연 값을 계산하는 장치 및 방법
JPWO2010035308A1 (ja) エコー消去装置
JP2011514706A (ja) エコー抑制のためのフィルタ係数を演算する装置および方法
JPWO2002095975A1 (ja) エコー処理装置
JP7696676B2 (ja) エコー抑圧装置、エコー抑圧方法及びエコー抑圧プログラム
JP2003500936A (ja) エコー抑止システムにおけるニアエンド音声信号の改善
US6999920B1 (en) Exponential echo and noise reduction in silence intervals
JP4607015B2 (ja) エコー抑圧装置
JP2009094802A (ja) 通信装置
US8406430B2 (en) Simulated background noise enabled echo canceller
US8369511B2 (en) Robust method of echo suppressor
JP4317222B2 (ja) ネットワークにおける通信リンクの送話品質の測定
JP5161838B2 (ja) エコーキャンセラおよび音響エコー消去方法
JP2024139278A (ja) 自動利得制御装置、エコー除去装置、自動利得制御方法及び自動利得制御プログラム
HK1034836A (en) Methods and apparatus for providing comfort noise in communications systems

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040518

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040616

R150 Certificate of patent or registration of utility model

Ref document number: 3568922

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080625

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080625

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090625

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100625

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100625

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110625

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120625

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130625

Year of fee payment: 9

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term