JP5292931B2 - 音響エコーキャンセラおよびエコーキャンセル装置 - Google Patents

音響エコーキャンセラおよびエコーキャンセル装置 Download PDF

Info

Publication number
JP5292931B2
JP5292931B2 JP2008151199A JP2008151199A JP5292931B2 JP 5292931 B2 JP5292931 B2 JP 5292931B2 JP 2008151199 A JP2008151199 A JP 2008151199A JP 2008151199 A JP2008151199 A JP 2008151199A JP 5292931 B2 JP5292931 B2 JP 5292931B2
Authority
JP
Japan
Prior art keywords
echo
spectrum
sound
reverberation
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008151199A
Other languages
English (en)
Other versions
JP2009302599A (ja
Inventor
利晃 石橋
田中  良
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yamaha Corp
Original Assignee
Yamaha Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yamaha Corp filed Critical Yamaha Corp
Priority to JP2008151199A priority Critical patent/JP5292931B2/ja
Priority to PCT/JP2009/060556 priority patent/WO2009151062A1/ja
Publication of JP2009302599A publication Critical patent/JP2009302599A/ja
Application granted granted Critical
Publication of JP5292931B2 publication Critical patent/JP5292931B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M9/00Arrangements for interconnection not involving centralised switching
    • H04M9/08Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic
    • H04M9/082Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic using echo cancellers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/02Circuits for transducers, loudspeakers or microphones for preventing acoustic reaction, i.e. acoustic oscillatory feedback

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
  • Telephone Function (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Telephonic Communication Services (AREA)

Description

この発明は、設置環境等に基づく残響エコーや定常ノイズを含む音響エコーを、収音音声信号から除去する音響エコーキャンセラに関するものである。
従来、スピーカとマイクとが1つの筐体に設置される音声会議装置などでは、スピーカとマイクとが近接する等の理由により音響エコーが発生し易い。このため、このような音響エコーを除去するエコーキャンセル装置が各種考案されている。例えば、特許文献1では、適応型フィルタを有するエコーキャンセラと、周波数領域による演算でエコーを抑圧するエコー抑圧部とを備えたエコーキャンセル装置が開示されている。
特許第3420705号公報
ところで、元々低音域の音声の方が高音域の音声よりも信号レベルが高く、且つ回り込む音声レベルも高くなるため、特許文献1のようなエコー抑圧部では、当該回り込み音声に基づいて推定されるエコースペクトルでは、低音域のレベルの方が高くなる。
一方で、人の発する声すなわち発声音は、低音域が主成分となる。このため、相手側装置からの放音用音声信号による放音が行われるのと同時に自装置の話者の発声音を収音している、所謂Wトーク状態では、話者の発声音の低音域までも、エコー抑圧部で抑圧されてしまう。これにより、相手側装置で放音される自装置側の話者の声が裏返ったような声になってしまう。
したがって、本発明の目的は、適応型フィルタを用いたエコーキャンセラのみでは除去しきれないエコーやノイズも効果的に除去しながら、低音域を不要に抑圧することのない音響エコーキャンセラを実現することにある。
この発明は、収音音声信号に含まれる目的音声以外の音を除去する音響エコーキャンセラに関するものである。この音響エコーキャンセラは、適応型フィルタ、第1差分手段、残響エコースペクトル推定手段、および第2差分手段を備える。適応型フィルタは、放音用音声信号に基づいて擬似反響音信号を生成する。第1差分手段は、収音音声信号から擬似反響音信号を差分して第1補正音声信号を生成する。残響エコースペクトル推定手段は、第1補正音声信号に含まれる残響エコースペクトルを擬似反響音信号のスペクトルを用いて推定し、該残響エコースペクトルのそれぞれの周波数成分毎に異なる重み付けをすることで補正残響エコースペクトルを設定する。第2差分手段は、第1補正音声信号の周波数スペクトルに対して補正残響エコースペクトルを差分して出力する。
この構成では、適応型フィルタにより擬似反響音信号が生成されるとともに、適応型フィルタでは対応しきれない残響エコーの周波数スペクトルが推定される。そして、この発明の音響エコーキャンセラは、収音手段による収音音声信号に対して、まず擬似反響音信号を差分することで線形成分の第一段のエコーキャンセルを行い、さらに、第一段のエコーキャンセルが行われた後の第1補正音声信号の周波数スペクトルに対して、残響エコーの周波数スペクトルを差分することで更なる第二段のエコー除去を行う。この際、残響エコーの周波数スペクトルは周波数成分毎に異なる重み付けが行われる。これにより、周波数成分毎に異なるエコー除去レベルが設定される。
また、この発明の音響エコーキャンセラは、さらに、放音用音声信号と第1補正音声信号とに基づいて放収音の状態判定を行い、残響エコースペクトル推定手段に対して状態判定結果を与える状態判定手段を備える。そして、音響エコーキャンセラの残響エコースペクトル推定手段は、状態判定結果に応じて重み付けを変更する。
この構成では、放音や収音の状況に応じて適した重み付けが設定される。
また、この発明の音響エコーキャンセラの状態判定手段は、放音のみ有り状態と放収音有り状態とを判定する。残響エコースペクトル推定手段は、周波数の低い低音域の推定レベルが放音のみ有り状態よりも放収音有り状態の方で低くなるように推定する。
この構成では、Wトーク時のように話者の発声音が収音音声信号に含まれている場合に、発声音の主成分の音域に対応する残響エコースペクトルの低音域成分のレベルが低く抑えられるので、話者音声の低音域成分が余剰に差し引かれない。
また、この発明の音響エコーキャンセラは、さらに、収音音声信号を低音域成分と高音域成分とに分離し、収音音声信号低音域成分を第1差分手段へ出力する帯域分割手段と、該帯域分割手段から出力される収音音声信号高音域成分を、状態判定の結果に応じて減衰する減衰器と、を備える。
この構成では、収音音声信号の低音域成分と高音域成分とを分離し、低音域成分のみで上述の処理を行うことで、エコーキャンセル処理およびエコー除去処理の演算負荷が低減され、高速化も可能となる。この際、人間の発声する音声信号の高音域成分のレベルは、低音域成分のレベルに比べて小さい。さらに、元々反響してマイクに回り込んで収音される高音域成分のレベルは、低音域成分のレベルに対して小さい。したがって、高音域成分を単なる減衰器による減衰処理のみとしても、音質への影響が少ない。また、状態判定結果に応じて処理を変更することで、高音域についても放収音状態に応じた適切なエコー除去が可能になる。この際、所定の音質を保ちながら、上述のような効果的なエコーキャンセルおよびエコー除去が効率的に行われる。
また、この発明の音響エコーキャンセラの残響エコースペクトル推定手段は、擬似反響音信号のスペクトルに対して、設置環境に基づく音響環境パラメータに準じた補正演算を行うことで残響エコースペクトルを推定する。
この構成では、上述の低音域成分に対する補正による残響エコースペクトルの最適化とともに、音響環境に応じた残響エコースペクトルの補正が行われる。これにより、設置された部屋の大きさ等に起因する音響環境の違いに応じて、より適切な残響エコースペクトルが推定される。
また、この発明の音響エコーキャンセラは、さらに、第1補正音声信号の周波数スペクトルに基づいて定常ノイズスペクトルを推定するノイズスペクトル推定手段を備える。
この構成では、上述の残響エコースペクトルとともに存在する暗騒音等の定常ノイズスペクトルが推定される。これにより、より効果的なエコー除去処理が実行される。
この発明によれば、適応型フィルタを用いたエコーキャンセラのみでは除去しきれない残響エコーを高精度に除去することができるとともに、当該残響エコーの除去における特定周波数成分の余剰な削除を防止することができる。これにより、適応型フィルタによる第1の補正と残響エコー除去による第2の補正とを行う際に、自装置側の発話者の音声の特定周波数成分を削除し過ぎることなく、より原音に近い状態で出力することができる。
本発明の第1の実施形態に係る音響エコーキャンセラについて図を参照して説明する。なお、以下の説明では、時間領域の信号は末端の記号をtで示し、周波数領域の信号は末端の記号をnで示す。
図1は本実施形態の音響エコーキャンセラの主要要素の概略構成を示すブロック図である。
図1に示すように、音響エコーキャンセラ1は、スピーカSP、マイクMIC、状態判定部10、適応型フィルタ20、外乱スペクトル推定部30、本発明の第1差分手段に相当する加算器60、および本発明の第2差分手段に相当する加算器70を備える。
状態判定部10は、放音用音声信号FEt、収音音声信号NEt、第1補正音声信号NE’tの信号レベルに基づいて、「放音、収音ともに有り状態(Wトーク状態)」、「放音用音声信号の放音のみ有り状態」、「放音が無く収音音声信号が有り状態」、「放音、収音ともに無し状態(無音状態)」のいずれかであることを検出して、検出状態を適応型フィルタ20、外乱スペクトル推定部30へ与える。図2は図1に示した状態判定部10の状態判定、学習処理および周波数補正パターンの判断概念を示した図である。
具体的には、状態判定部10は、放音用音声信号FEt、収音音声信号NEt、第1補正音声信号NE’tの全てが予め設定した閾値以上のレベルであることを検出すると、放音、話者発話の双方が行われていると判断し、「Wトーク」状態と判定する。また、状態判定部10は、放音用音声信号FEtが前記閾値以上のレベルであり、第1補正音声信号NE’tが前記閾値未満であれば、「放音用音声信号の放音のみが有る」状態と判定する。また、状態判定部10は、収音音声信号NEtおよび第1補正音声信号NE’tが前記閾値以上のレベルであり、放音用音声信号FEtが前記閾値未満であれば、「放音が無く収音音声信号が有る」状態と判定する。さらに、状態判定部10は、放音用音声信号FEt、収音音声信号NEt、第1補正音声信号NE’tの全てが前記閾値未満であることを検出すると、「無音」状態と判定する。
スピーカSPは、外部から入力された放音用音声信号FEtに基づいて放音する。この放音用音声信号(遠端信号)FEtは、FFT911へも入力される。
FFT911は、高速フーリエ変換回路であり、時間領域の関数である放音用音声信号FEtを周波数領域の関数である放音用音声信号FEnへ変換して、適応型フィルタ20へ与える。
適応型フィルタ20は、擬似反響音信号生成部201と擬似反響音信号推定部202とを備える。擬似反響音信号生成部201は、例えば、所定のタップ数からなるFIRフィルタであり、擬似反響音信号推定部202から与えられた係数により設定される。擬似反響音信号生成部201は、放音用音声信号FEnに基づいて擬似反響音信号FE’nを生成する。生成された擬似反響音信号FE’nは、IFFT921および外乱スペクトル推定部30のエコースペクトル推定部301へ入力される。
擬似反響音信号推定部202は、LMS等の適応アルゴリズムを用いて、後述するエコーキャンセル後の第1補正信号NE’nの周波数スペクトルS(NE’n)から、擬似反響音信号FE’nを推定する。擬似反響音信号推定部202は、当該擬似反響音信号FE’nを擬似反響音信号生成部201に生成させるための係数を推定して、これら係数を擬似反響音信号生成部201へ与える。この際、擬似反響音信号推定部202は、状態判定部10から「放音用音声信号の放音のみ有り」状態の情報を取得した場合にのみ、上述の推定による学習を行う。なお、このような推定、擬似反響音信号FE’nの生成、学習は、音響エコーキャンセラ1の動作中に繰り返し行われる。
IFFT921は、逆高速フーリエ変換回路であり、周波数領域の関数である擬似反響音信号FE’nを時間領域の関数である擬似反響音信号FE’tに変換して、加算器60へ出力する。
マイクMICは、当該音響エコーキャンセラ1が設置された周囲から収音して、収音音声信号(近端信号)NEtを生成する。この収音音声信号NEtには、スピーカSPからの放音があれば、当該放音音声が設置環境に基づいて反響されてなる反響音の成分(残響エコー)が含まれる。また、マイクMIC周囲の話者が発話すれば、収音音声信号NEtに話者音声の成分が含まれる。また、スピーカSPからの放音と自装置側話者の発生音がともにあるWトーク状態であれば、話者音声成分と残響エコーとがともに含まれる。さらに、会議室等の設置環境によって当該環境に特有の定常的なノイズが存在すると、収音音声信号NEtには、この定常ノイズの成分も含まれる。
加算器60は、収音音声信号NEtから擬似反響音信号FE’tを差分することで、第1補正音声信号NE’tを生成して出力する。これにより、第一段の補正として、擬似反響音信号による適応型のエコーキャンセル処理が実行される。
FFT912は、高速フーリエ変換回路であり、時間領域の関数である第1補正音声信号NE’tを周波数領域の関数である第1補正音声信号NE’nへ変換して出力する。第1補正音声信号NE’nの周波数スペクトルS(NE’n)は、上述の擬似反響音信号推定部202および外乱スペクトル推定部30のノイズスペクトル推定部302へ入力される。
外乱スペクトル推定部30は、エコースペクトル推定部301とノイズスペクトル推定部302とを備える。簡単には、エコースペクトル推定部301は、擬似反響音信号FE’nのみで除去しきれない残響エコーを推定する演算部であり、ノイズスペクトル推定部302は、定常ノイズを推定する演算部である。
エコースペクトル推定部301は、擬似反響音信号FE’nの周波数スペクトルS(FE’n)をサンプリングタイミング毎に順次取得するとともに、一時記憶する。エコースペクトル推定部301は、この取得および一時記憶した擬似反響音信号FE’nの周波数スペクトルS(FE’n)と、前回推定した残響エコースペクトルS(FE”n)と、予め設定された更新係数βとに基づいて、今回の残響エコースペクトルS(FE”n)を推定するとともに、この推定した残響エコースペクトルS(FE”n)を記憶する。
例えば、或るサンプリングタイミングNでの残響エコースペクトルをS(FE”n(N))とし、同サンプリングタイミングNでの擬似反響音信号の周波数スペクトルをS(FE’n(N))とし、直前のサンプリングタイミングN−1での残響エコースペクトルをS(FE”n(N−1))とする。また、βを更新係数とする。
そして、この設定において、残響エコースペクトルS(FE”n(N))は次式で表される。この式に基づいて、エコースペクトル推定部301は、残響エコースペクトルS(FE”n(N))を算出する。
S(FE”n(N))=(1−β)S(FE”n(N−1))+βS(FE’n(N))
−−−演算式(1)
エコースペクトル推定部301は、算出した残響エコースペクトルの各周波数成分に対して補正係数Fを乗算することで、補正残響エコースペクトルS(FECn(N))を算出する。
S(FECn(N))=F・S(FE”n(N))
ここで、補正係数Fは、それぞれに異なる周波数特性を有する複数の補正関数Fk(ω)により表される。なお、kは各補正関数の固有識別子である。
すなわち、エコースペクトル推定部301は、残響エコースペクトルS(FE”n(N))の各周波数成分をFE”n,ω(N)とし、補正残響エコースペクトルS(FECn(N))の各周波数成分をFECn,ω(N)として、
FECn,ω(N)=Fk(ω)・FE”n,ω(N)
からなる演算を各周波数成分に対して実行する。これにより、補正残響エコースペクトルS(FECn(N))が算出される。
この際、エコースペクトル推定部301は、状態判定結果に基づいて補正関数Fk(ω)を選択する。例えば、図2に示すように、エコースペクトル推定部301は、状態判定結果「Wトーク」を取得すると補正関数F1(ω)を選択し、状態判定結果「放音音声信号の放音のみ」を取得すると補正関数F2(ω)を選択する。
図3は、補正関数Fk(ω)の一例としてF1(ω)、F2(ω)の周波数特性を示した図である。図3に示すように、補正関数F1(ω)は、補正関数F2(ω)よりも低音域での補正係数F値が低く設定されている。また、補正関数F1(ω)は、補正関数F2(ω)よりも補正係数Fが「1」まで達する周波数が高く設定されている。
このような設定を行うことで、「Wトーク」時には低音域成分のレベルが抑圧された補正残響エコースペクトルS(FECn)が算出され、「放音音声信号の放音のみ」時には低音域成分のレベルがあまり抑圧されていない補正残響エコースペクトルS(FECn)が算出される。エコースペクトル推定部301は、算出した補正残響エコースペクトルS(FECn)を加算器70へ出力する。
このように、擬似反響音信号FE’nの周波数スペクトルS(FE’n)に基づいて残響エコースペクトルS(FE”n)を推定することで、適応型フィルタ20で除去しきれない残響エコーの周波数スペクトルを取得することができる。すなわち、適応型フィルタ20は、FIRフィルタ等からなり、タップ数等の仕様により表現可能な擬似反響音信号FE’nが制限される。これにより、時間軸上に復元した場合に擬似反響音信号FE’tと現実の回り込み音とで差が生じる。しかしながら、周波数領域で擬似反響音信号FE’nから残響エコーを推定することで、この時間軸上の制限を取り除くことができ、擬似反響音信号FE’tでは除去しきれない残響エコーを推定することができる。
さらに、補正係数Fを用いることで、状態判定結果に応じた周波数特性からなる補正残響エコースペクトルS(FECn)を設定することができる。すなわち、自装置側の話者音声が収音音声信号に含まれる「Wトーク」時には、第1補正音声信号から減算すべき推定された残響エコーの低音域成分を抑圧することができる。これにより、「Wトーク」時に話者音声の主成分となる低音域成分が余剰に除去されることなく、原音に近い話者音声を出力することができる。一方で、自装置側の話者音声が無く、相手装置側からの放音用音声信号のみが放音されている「放音音声信号の放音のみ」時には、第1補正音声信号から減算すべき推定された残響エコーの低音域成分をあまり抑圧しないでおくことができる。これにより、「放音音声信号の放音のみ」時に回り込み音声の低音域成分を効果的に除去することができる。
なお、エコースペクトル推定部301は、「Wトーク」時と「放音音声信号の放音のみ」時との切り替え時や適応型フィルタ20の擬似反響音信号推定部202に応じたタイミングで上述の推定学習を繰り返す。
また、本実施形態では、「収音音声信号のみ」時や「無音」時についての補正係数Fについては特に指定していない。これは、「収音音声信号のみ」時や「無音」時には回り込み音声が存在しないので、擬似反響音信号FE’tが略0となって残響エコーも略0となるため、補正係数Fの影響を殆ど受けないからである。したがって、例えば、「収音音声信号のみ」時や「無音」時には、直前の補正係数Fを維持する等の処理を行うようにしておけばよい。
ノイズスペクトル推定部302は、第1補正音声信号NE’nの周波数スペクトルS(NE’n)を順次取得するとともに、一時記憶する。ノイズスペクトル推定部302は、この取得および記憶した複数回の第1補正音声信号NE’nの周波数スペクトルS(NE’n)に基づいて、ノイズスペクトルS(NE”n)を推定する。
例えば、或るサンプリングタイミングNでのノイズスペクトルをS(NE”n(N))とし、同サンプリングタイミングNでの第1補正音声信号の周波数スペクトルをS(NE’n(N))とし、直前のサンプリングタイミングN−1での第1補正音声信号の周波数スペクトルをS(NE’n(N−1))とする。また、α,γを定数とする。
そして、この設定において、ノイズスペクトルS(NE”n(N))を次式で表し、算出する。
S(NE”n(N))=αS(NE’n(N−1))+γS(NE’n(N))
このように、エコーキャンセル後の信号である第1補正音声信号NE’nの周波数スペクトルS(NE’n)に基づいてノイズスペクトルS(NE”n)を推定することで、エコーとは別の暗騒音等の定常ノイズを算出することができる。この際、ノイズスペクトル推定部302は、状態判定部10から「無音」状態の情報を取得した場合にのみ、上述の推定による学習を行う。なお、このような推定、学習も、音響エコーキャンセラ1の動作中に繰り返し行われる。
加算器70は、周波数領域で演算を行う加算器であり、第1補正音声信号NE’nの周波数スペクトルS(NE’n)から、補正残響エコースペクトルS(FECn)およびノイズスペクトルS(NE”n)を減算することで、第2補正音声信号S(NOn)を生成して出力する。なお、この処理は各スペクトルが同期するようにして行われる。すなわち、ここで言う同期とは、同じサンプリングタイミングに形成された各スペクトルを用いて演算することであり、例えば、サンプリングタイミングNの場合、
S(NOn(N))=S(NE’n(N))−S(FECn(N))−S(NE”n(N))
の演算処理を行うことを意味する。これにより、第二段の補正として、適応型のエコーキャンセルとは別方式で、残響エコーや定常ノイズの除去が行われる。
IFFT922は、逆高速フーリエ変換回路であり、周波数領域の関数である第2補正音声信号NOnを時間領域の関数である第2補正音声信号NOtへ変換して出力する。
以上のような構成および処理を行うことで、放収音の状態に応じたエコー除去処理を行うことができる。具体的には、「Wトーク」時には、話者音声の低音域成分の余剰な除去を防いで、話者音声の音質を変化させることなく出力することができ、「放音音声信号による放音のみ」時には、回り込み音声を効果的に除去することができる。
次に、第2の実施形態に係る音響エコーキャンセラについて図を参照して説明する。
図4は本実施形態の音響エコーキャンセラ1’の主要構成を示すブロック図である。
本実施形態の音響エコーキャンセラ1’は、第1の実施形態に示した音響エコーキャンセラ1に対して、設置環境等の音響環境に応じて残響エコーを推定する構成および処理を追加したものである。したがって、以下の説明では、第1の実施形態の音響エコーキャンセラ1と異なる部分のみを説明する。
音響エコーキャンセラ1’は、第1の実施形態の図1に示した音響エコーキャンセラ1に対して、さらに、音響環境更新部11、操作部12、表示部13、音響環境検出部14を備えたものである。また、状態判定部10は状態判定結果を音響環境検出部14へも与える。また、本実施形態では、更新係数βは一定値ではなく、音響環境に応じて選択される。
音響環境更新部11は、操作部12または音響環境検出部14から音響環境パラメータ設定指示を受け付けると、指定された音響環境パラメータに対応した更新係数βを外乱スペクトル推定部30のエコースペクトル推定部301へ与える。図5は、更新係数βの設定パラメータの概念の一例を示す図である。例えば、図5に示すように、音響環境更新部11は、音響環境パラメータとして「反響極小」の情報を得るとエコースペクトル推定部301へβ=1を与える。また、音響環境更新部11は、音響環境パラメータとして「反響中」の情報を得るとエコースペクトル推定部301へβ=0.6を与える。さらに、音響環境更新部11は、音響環境パラメータとして「反響大」の情報を得るとエコースペクトル推定部301へβ=0.2を与える。なお、ここに示す更新係数βの設定値は一例であり、装置仕様や環境により適宜設定するとよく、さらに多段で更新係数βを設定してもよい。
操作部12は、発話者を含む使用者とのユーザインタフェースであり、各種の操作子(図示せず)を有する。操作部12は、使用者から音響環境設定の操作入力を受け付けると、音響環境更新部11へ操作入力された音響環境に対応する音響環境パラメータ設定指示を出力する。
表示部13は、液晶ディスプレイ等の表示素子を備え、音響環境更新部11からの表示制御に従い操作メニュー等を表示する。
使用者は、これら操作部12と表示部13とにより、音響環境パラメータを手入力で設定する。すなわち、使用者により操作部12から音響環境パラメータの設定変更指示を受けると、音響環境パラメータ設定用の画面、例えば、図5に示す「ルームサイズ」と、大きさを示す「大」、「中」、「小」が表示部13に表示される。使用者は、この表示画面に従って、当該音響エコーキャンセラ1’を有する装置の設置される部屋の大きさ等を入力する。操作部12は、この操作入力結果に基づく音響環境パラメータ設定指示(例えば図5の「反響極小」、「反響中」、「反響大」)を音響環境更新部11へ与える。音響環境更新部11は、上述のように音響環境パラメータに応じた更新係数βをエコースペクトル推定部301へ与える。
音響環境検出部14は、擬似反響音信号推定部202の各タップ係数に応じたインパルス応答をIFFT141で逆フーリエ変換してなるインパルス応答信号を取得し、エンベロープ特性を検出する。音響環境検出部14は、エンベロープ波形の振幅および減衰特性を検出することで残響エコー時間を取得し、当該残響エコー時間に基づいて音響環境パラメータ設定指示を音響環境更新部11へ与える。例えば、エンベロープ波形の時定数が極短くエコー時間が「略無し」であれば音響環境パラメータ「反響極小」を音響環境更新部11へ与える。エンベロープ波形の時定数が短くエコー時間が「短」であれば音響環境パラメータ「反響中」を音響環境更新部11へ与える。エンベロープ波形の時定数が長くエコー時間が「長」であれば音響環境パラメータ「反響大」を音響環境更新部11へ与える。このような処理を行うことで、音響環境パラメータを手入力することなく自動で設定することができる。さらに、この処理を、無音状態の検出毎に行うことで、例えば使用者数が変化したり、使用者の位置が変化することによる音響環境変化をも加味して音響環境パラメータを動的に変化させることができる。
エコースペクトル推定部301は、与えられた更新係数βを用いて、演算式(1)により残響エコースペクトルを算出する。そして、第1の実施形態と同様に放収音状態に応じた補正を行う。
このように、更新係数βを用いることで、当該音響エコーキャンセラ1が備えられた装置の設置環境に応じて推定アルゴリズム(上述の演算式(1))をより最適に調整することができる。これにより、音響環境に応じて残響エコースペクトルS(FE”n(N))を精度良く推定することができる。
以上のように、本実施形態の構成および処理を用いることで、音響環境と放収音状態との双方を考慮した上で適応型フィルタでは除去しきれない最適な残響エコーを推定することができ、より効果的にエコー除去を行うことができる。
次に、第3の実施形態に係る音響エコーキャンセラ1”について、図を参照して説明する。
図6は本実施形態の音響エコーキャンセラ1”の主要構成を示すブロック図である。
本実施形態の音響エコーキャンセラ1”は、第2の実施形態の図4に示した音響エコーキャンセラ1’に対して、さらにエコーサプレッサ40、帯域分割部50、加算器80を備えたものである。また、状態判定部10は状態判定結果をエコーサプレッサ40へも与える。なお、他の構成は、第2の実施形態と同じであるが、第1の実施形態および第2の実施形態と信号処理内容が異なるので、異なる部分のみを以下で説明する。
音響エコーキャンセラ1”の状態判定部10は、放音用音声信号FEt、後述する収音音声信号低音域成分NLEt、低音域成分第1補正音声信号NLE’tの信号レベルに基づいて、第1、第2の実施形態の場合と同様に、「放音、収音ともに有り状態(Wトーク状態)」、「放音用音声信号の放音のみ有り状態」、「放音が無く収音信号が有り状態」、「放音、収音ともに無し状態(無音状態)」のいずれかであることを検出して、検出状態を適応型フィルタ20、外乱スペクトル推定部30、音響環境検出部14およびエコーサプレッサ40へ与える。この際、本実施形態の収音音声信号低音域成分NLEt(NLEn)が第1、第2の実施形態における収音音声信号NEt(NEn)に相当し、本実施形態の低音域成分第1補正音声信号NLE’t(NLE’n)が第1、第2の実施形態における第1補正音声信号NE’t(NE’n)に相当する。
音響エコーキャンセラ1”の適応型フィルタ20は、低音域成分第1補正音声信号NLE’nの周波数スペクトルから上述の適応アルゴリズムを用いて擬似反響音信号FE’nを生成する。
マイクMICと加算器60との間には帯域分割部50が設置されている。帯域分割部50は、収音音声信号NEtを、低音域成分NLEtと高音域成分NHEtとに分離する。ここで、低音域と高音域とを区分する閾値周波数は、例えば8kHzに設定されており、人の音声の主たる成分となる8kHz以下の低音域成分が、加算器60へ与えられ、8kHzよりも高い高音域成分が、エコーサプレッサ40へ与えられる。
加算器60は、収音音声信号低音域成分NLEtから擬似反射音信号FE’tを差分することで、低音域成分第1補正音声信号NLE’tを生成して出力する。
FFT912は、高速フーリエ変換回路であり、時間領域の関数である低音域成分第1補正音声信号NLE’tを周波数領域の関数である低音域成分第1補正音声信号NLE’nへ変換して出力する。低音域成分第1補正音声信号NLE’nの周波数スペクトルS(NLE’n)は、上述の擬似反響音信号推定部202および外乱スペクトル推定部30のノイズスペクトル推定部302へ入力される。
外乱スペクトル推定部30のノイズスペクトル推定部302は、低音域成分第1補正音声信号NLE’nの周波数スペクトルS(NLE’n)を順次取得するとともに、一時記憶する。ノイズスペクトル推定部302は、この取得および記憶した複数回の低音域成分第1補正音声信号NLE’nの周波数スペクトルS(NLE’n)に基づいて、ノイズスペクトルS(NLE”n)を推定する。
加算器70は、周波数領域で演算を行う加算器であり、低音域成分第1補正音声信号NLE’nの周波数スペクトルS(NLE’n)から、補正残響エコースペクトルS(FECn)およびノイズスペクトルS(NLE”n)を減算することで、低音域成分第2補正音声信号NLOnを生成して出力する。なお、この処理は各スペクトルが同期するようにして行われる。この加算器70による同期処理は、第1、第2の実施形態で行った同期処理と同じである。
IFFT922は、逆高速フーリエ変換回路であり、周波数領域の関数である低音域成分第2補正音声信号NLOnを時間領域の関数である低音域成分第2補正音声信号NLOtへ変換して、加算器80へ与える。
エコーサプレッサ40は、減衰器401とディレイ回路402とからなる。減衰器401は、状態判定部10からの状態判定結果に基づいて、収音音声信号NEtの高音域成分NHEtの減衰量を調整し、減衰処理済高音域成分NHE’tを出力する。
図7はエコーサプレッサ40の減衰器401の減衰量を示す図である。
減衰器401は、「放音用音声信号の放音のみ有り」状態または「無音」状態の情報を取得すると、減衰量を無限大、すなわち、高音域成分NHEtを遮断する(NHE’t=0)。これは、放音用音声信号のみの場合や無音状態の場合、話者音声が含まれていないので、高音域成分を遮断することで、エコーや定常ノイズをより確実に除去することができるからである。
また、減衰器401は、「放音が無く収音音声信号が有り」状態の情報を取得すると、減衰量を「0」、すなわち、高音域成分NHEtを減衰することなく通過させる(NHE’t=NHEt)。このように収音音声信号のみの場合、高音域成分が話者音声に支配されるので、この高音域成分を減衰させないことにより、話者音声をより正確に出力することができるからである。
さらに、減衰器401は、「Wトーク」状態の情報を取得すると、減衰量を予め設定した所定値に設定する。これは、Wトーク時には、除去したい放音用音声信号FEtの成分と、話者音声成分とが混在しているために、或程度の減衰量に設定する。このように設定した場合、高音域では話者音声が若干減衰される。しかし、元々回り込み量が少なくレベルの低い放音用音声信号FEtによる高音域のエコー成分と比較して、直接的にマイクに収音される話者音声の高音域の方が信号レベルが高いので、若干の減衰による影響を殆ど受けない。したがって、話者音声を若干犠牲にしながらも、放音用音声信号FEtによるエコー成分を減衰させることができる。
減衰器401から出力された減衰処理済高音域成分NHE’tは、ディレイ回路402へ入力される。ディレイ回路402は、処理演算が容易で高速な高音域成分NHEt(NHE’t)と、上述のエコーキャンセルおよびエコー除去処理を行った低音域成分第2補正音声信号NLOtとを時間同期して加算するためのディレイ処理を行う。このディレイ処理により、遅延減衰処理済高音域成分NHE”tが生成され、加算器80へ与えられる。
加算器80は、低音域成分第2補正音声信号NLOtとこれに時間同期する遅延減衰処理済高音域成分NHE”tとを加算して、出力音声信号NO’tを生成し、外部へ出力する。
以上のように、低音域成分のみをエコーキャンセルおよびエコー除去処理して、高音域成分を減衰処理することで処理演算量を低減することができる。この際、高音域成分に上述のエコーキャンセルおよびエコー除去処理を行わなくても、人の音声の主成分が低音域成分側にあるとともに、高音域成分は低音域成分と比較して反射回り込み量が少ないので、音質の劣化を抑制することができる。さらに、上述のように放収音状態毎に減衰量を変化させることで、上述の実施形態に示した低音域とともに、より効果的に高音域のエコーを除去し、且つ話者音声の音質の劣化を抑制することができる。
なお、上述の説明では、外乱スペクトル推定部に、エコースペクトル推定部とノイズスペクトル推定部とを備えた例を示したが、エコースペクトル推定部のみであっても、残響エコーを高精度に除去することができる。
また、上述の説明では、適応型フィルタを周波数領域演算で実現する例を示したが、時間領域による適応型フィルタを用いてもよい。
さらに、上述の説明では、状態判定部10において信号レベルのみで状態判定を行う例を示したが、各信号の相関に基づいて状態判定を行ってもよい。
また、上述の説明では、スピーカとマイクとを備える音響エコーキャンセラを例に示したが、スピーカ等の放音素子への出力端子と、マイク等の収音素子からの入力端子とを備え、放音素子や収音素子を別体にしたものであってもよい。
また、上述の説明では、状態判定部10から各部へ状態判定結果を与える例を示したが、状態判定部10が各部の学習タイミングの条件を記憶しておき、状態判定部10から各部へ学習タイミングを与えてもよい。
第1の実施形態の音響エコーキャンセラの主要構成を示すブロック図である。 図1に示した音響エコーキャンセラの状態判定、学習処理および周波数補正パターンの判断概念を示した図である。 補正関数Fk(ω)の一例としてF1(ω)、F2(ω)の周波数特性を示した図である。 第2の実施形態の音響エコーキャンセラの主要構成を示すブロック図である。 更新係数βの設定パラメータの概念の一例を示す図である。 第3の実施形態の音響エコーキャンセラの主要構成を示すブロック図である。 エコーサプレッサ40の減衰器401の減衰量を示す図である。
符号の説明
1−音響エコーキャンセラ、10−状態判定部、11−音響環境更新部、12−操作部、13−表示部、14−音響環境検出部、20−適応型フィルタ、201−擬似反響音信号生成部、202−擬似反響音信号推定部、30−外乱スペクトル推定部、301−エコースペクトル推定部、302−ノイズスペクトル推定部、40−エコーサプレッサ、401−減衰器、402−ディレイ回路、50−帯域分割部、60,70,80−加算器、900−周波数領域演算部、911,912−FFT演算部、921,922−IFFT演算部、SP−スピーカ、MIC−マイク

Claims (5)

  1. 収音音声信号に含まれる目的音声以外の音を除去する音響エコーキャンセラであって、
    放音用音声信号に基づいて擬似反響音信号を生成する適応型フィルタと、
    前記収音音声信号から前記擬似反響音信号を差分して第1補正音声信号を生成する第1差分手段と、
    前記第1補正音声信号に含まれる残響エコースペクトルを前記擬似反響音信号のスペクトルを用いて推定し、該残響エコースペクトルのそれぞれの周波数成分毎に異なる重み付けをすることで補正残響エコースペクトルを設定する残響エコースペクトル推定手段と、
    前記第1補正音声信号の周波数スペクトルに対して前記補正残響エコースペクトルを差分して出力する第2差分手段と、
    前記放音用音声信号と前記第1補正音声信号とに基づいて放収音の状態判定を行い、前記残響エコースペクトル推定手段に対して状態判定結果を与える状態判定手段と、を備え、
    前記状態判定手段は、放音のみ有り状態と放収音有り状態とを判定し、
    前記残響エコースペクトル推定手段は、周波数の低い低音域の推定レベルが放音のみ有り状態よりも放収音有り状態の方で低くなるように重み付けを設定する、
    音響エコーキャンセラ。
  2. 前記収音音声信号を低音域成分と高音域成分とに分離し、収音音声信号低音域成分を前記第1差分手段へ出力する帯域分割手段と、
    該帯域分割手段から出力される収音音声信号高音域成分を、前記状態判定の結果に応じて減衰する減衰器と、を備えた請求項に記載の音響エコーキャンセラ。
  3. 前記残響エコースペクトル推定手段は、前記擬似反響音信号のスペクトルに対して、設置環境に基づく音響環境パラメータに準じた補正演算を行うことで前記残響エコースペクトルを推定する、請求項1または2に記載の音響エコーキャンセラ。
  4. 前記第1補正音声信号の周波数スペクトルに基づいて定常ノイズスペクトルを推定するノイズスペクトル推定手段を備える、請求項1〜請求項のいずれかに記載の音響エコーキャンセラ。
  5. 請求項3に記載の音響エコーキャンセラを備え、
    音響環境パラメータ設定用の画面を表示する表示部と、
    使用者から音響環境パラメータの操作入力を受け付ける操作部と、を備え、
    前記表示部は、装置が設置される部屋の大きさの選択肢を表示し、
    前記残響エコースペクトル推定手段は、使用者が前記操作部によって選択した部屋の大きさに応じた前記残響エコースペクトルを推定する、
    エコーキャンセル装置。
JP2008151199A 2008-06-10 2008-06-10 音響エコーキャンセラおよびエコーキャンセル装置 Expired - Fee Related JP5292931B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2008151199A JP5292931B2 (ja) 2008-06-10 2008-06-10 音響エコーキャンセラおよびエコーキャンセル装置
PCT/JP2009/060556 WO2009151062A1 (ja) 2008-06-10 2009-06-09 音響エコーキャンセラおよび音響エコーキャンセル方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008151199A JP5292931B2 (ja) 2008-06-10 2008-06-10 音響エコーキャンセラおよびエコーキャンセル装置

Publications (2)

Publication Number Publication Date
JP2009302599A JP2009302599A (ja) 2009-12-24
JP5292931B2 true JP5292931B2 (ja) 2013-09-18

Family

ID=41416768

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008151199A Expired - Fee Related JP5292931B2 (ja) 2008-06-10 2008-06-10 音響エコーキャンセラおよびエコーキャンセル装置

Country Status (2)

Country Link
JP (1) JP5292931B2 (ja)
WO (1) WO2009151062A1 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103730125B (zh) 2012-10-12 2016-12-21 华为技术有限公司 一种回声抵消方法和设备
JP6164015B2 (ja) * 2013-09-30 2017-07-19 沖電気工業株式会社 エコー抑圧装置、及びエコー抑圧プログラム
CN108986832B (zh) * 2018-07-12 2020-12-15 北京大学深圳研究生院 基于语音出现概率和一致性的双耳语音去混响方法和装置
CN115665642B (zh) * 2022-12-12 2023-03-17 杭州兆华电子股份有限公司 一种噪声消除方法及系统

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE69738288T2 (de) * 1996-05-31 2008-09-25 Koninklijke Philips Electronics N.V. Einrichtung zur unterdrückung einer störenden komponente eines eingangssignals
JP3568922B2 (ja) * 2001-09-20 2004-09-22 三菱電機株式会社 エコー処理装置
JP3972921B2 (ja) * 2004-05-11 2007-09-05 ソニー株式会社 音声集音装置とエコーキャンセル処理方法
JP4818014B2 (ja) * 2005-07-28 2011-11-16 株式会社東芝 信号処理装置
JP4696776B2 (ja) * 2005-08-17 2011-06-08 ソニー株式会社 音声処理装置及びマイク装置
JP2007189536A (ja) * 2006-01-13 2007-07-26 Matsushita Electric Ind Co Ltd 音響エコーキャンセラ装置、音響エコーキャンセル方法及び通話装置

Also Published As

Publication number Publication date
WO2009151062A1 (ja) 2009-12-17
JP2009302599A (ja) 2009-12-24

Similar Documents

Publication Publication Date Title
WO2009148049A1 (ja) 音響エコーキャンセラ及び音響エコーキャンセル方法
EP3568854B1 (en) Post-mixing acoustic echo cancellation systems and methods
JP5347794B2 (ja) エコー抑圧方法およびその装置
US9461702B2 (en) Systems and methods of echo and noise cancellation in voice communication
JP4913155B2 (ja) 音響エコーキャンセラ
JP3568922B2 (ja) エコー処理装置
EP1080463B1 (en) Signal noise reduction by spectral subtraction using spectrum dependent exponential gain function averaging
AU4664499A (en) Signal noise reduction by spectral subtraction using linear convolution and causal filtering
JPWO2009104252A1 (ja) 音処理装置、音処理方法及び音処理プログラム
JP2009021741A (ja) エコーキャンセラ
JP2005142659A (ja) エコーキャンセラ
JP5292931B2 (ja) 音響エコーキャンセラおよびエコーキャンセル装置
RU2725017C1 (ru) Устройство и способ для обработки аудиосигнала
JP2009105620A (ja) エコーキャンセラ
US11380312B1 (en) Residual echo suppression for keyword detection
US8406430B2 (en) Simulated background noise enabled echo canceller
EP2490218B1 (en) Method for interference suppression
JP4690243B2 (ja) デジタルフィルタ、周期性騒音低減装置および騒音低減装置
WO2009107750A1 (ja) 音響エコーキャンセラ
JP2008005094A (ja) エコー抑圧方法、装置、エコー抑圧プログラム、記録媒体
Ykhlef et al. A post-filter for acoustic echo cancellation in frequency domain
JP2010011272A (ja) 音響エコーキャンセラ
JP2000224081A (ja) エコーキャンセラ装置
JP5640393B2 (ja) エコー除去装置、方法及びプログラム
WO2018087855A1 (ja) エコーキャンセラ装置、エコー消去方法、及びエコー消去プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110420

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130129

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130401

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20130401

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130514

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130527

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees