JP7235117B2 - エコー消去装置、エコー消去方法、プログラム - Google Patents

エコー消去装置、エコー消去方法、プログラム Download PDF

Info

Publication number
JP7235117B2
JP7235117B2 JP2021538582A JP2021538582A JP7235117B2 JP 7235117 B2 JP7235117 B2 JP 7235117B2 JP 2021538582 A JP2021538582 A JP 2021538582A JP 2021538582 A JP2021538582 A JP 2021538582A JP 7235117 B2 JP7235117 B2 JP 7235117B2
Authority
JP
Japan
Prior art keywords
echo
components
signal
acoustic coupling
amount
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021538582A
Other languages
English (en)
Other versions
JPWO2021024373A1 (ja
Inventor
勝宏 福井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Publication of JPWO2021024373A1 publication Critical patent/JPWO2021024373A1/ja
Application granted granted Critical
Publication of JP7235117B2 publication Critical patent/JP7235117B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/02Circuits for transducers, loudspeakers or microphones for preventing acoustic reaction, i.e. acoustic oscillatory feedback
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2430/00Signal processing covered by H04R, not provided for in its groups
    • H04R2430/03Synergistic effects of band splitting and sub-band processing

Landscapes

  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)

Description

この発明は、音響再生系を有する例えば通信会議システムにおいて用いられる、ハウリングの原因及び聴覚上の障害となる音響エコーを消去するエコー消去装置、エコー消去方法、プログラムに関する。
短時間スペクトル振幅(STSA:Short-Time Spectral Amplitude)推定に基づくエコー抑圧処理は、人間の聴覚特性が位相に鈍感である性質及び、エコーの統計的な性質を利用して周波数領域でエコーの振幅成分を減算することで実現される。例えば特許文献1及び非特許文献1に、周波数領域でエコーを抑圧する従来のエコー消去装置100が開示されている。
図1にエコー消去装置100の機能構成例を示し、その動作を説明する。エコー消去装置100は、受話端1に入力され、スピーカ2によって音響信号に変換される再生信号x(n)と、マイクロホン3が出力する収音信号y(n)とを入力信号とする。収音信号y(n)は、音響信号に変換された再生信号x(n)に図示しない屋内のインパルス応答(伝達関数)の影響を受けたエコー成分を重畳してなる。
エコー消去装置100の送話端4に出力される出力信号s^(n)は、収音信号y(n)のエコー成分が抑圧され、近端話者信号s(n)が強調された信号である。なお、受話端1は遠端より送信された信号を受信し、送話端4はエコー成分が抑圧された信号を遠端に送信する。受話端1、送話端4、スピーカ2、マイクロホン3はいずれも近端に設置されている。
エコー消去装置100は、第1周波数分析部101、第2周波数分析部102、音響結合量計算部103、エコーパワー計算部104、ゲイン計算部105、積算部106、周波数合成部107を含む。
第1周波数分析部101は、再生信号x(n)を入力として周波数分析を実行し、再生信号スペクトルXi(ω)を出力する(S101)。
第2周波数分析部102は、収音信号y(n)を入力として周波数分析を実行し、収音信号スペクトルYi(ω)を出力する(S102)。ここでnは、所定間隔の離散時間を示すサンプル点の番号であり、再生信号x(n)と収音信号y(n)はディジタル信号である。図1において、スピーカ2への入力及び、マイクロホン3の出力するアナログ信号をディジタル信号に変換するA/D変換器は省略している。
再生信号スペクトルXi(ω)と収音信号スペクトルYi(ω)のωは、周波数値であり、所定の周波数間隔で求めたスペクトルの周波数の番号である。また、iはフレーム番号である。フレームの時間長は、例えばサンプリング周波数を16kHz、周波数分析のデータ量を256点とした場合、16msである。
音響結合量計算部103は、再生信号スペクトルXi(ω)と収音信号スペクトルYi(ω)を入力として、音響結合量の推定値|H^m,i(ω)|2(以下、第1音響結合量推定値と呼称する)を出力する(S103)。音響結合量とは、スピーカ2からマイクロホン3に回り込むエコー経路の音響的な大きさを表す値である。第1音響結合量推定値|H^m,i(ω)|2は式(1)で計算される。
Figure 0007235117000001
ここで*は共役複素数を表す。添え字mはエコー経路のインパルス応答長に応じたフレームに対応し、m=0,1,…,M-1の整数値をとる。Mはエコー経路のインパルス応答長に応じたフレーム数を表す。<,>と||・||2はそれぞれ内積とノルム二乗を表す。音響結合量計算部103は、再生信号スペクトルと収音信号スペクトルの内積<X* i-m(ω),Yi(ω)>を例えば式(2)で、再生信号スペクトルのノルム値||Xi-m(ω)||2を例えば式(3)で、それぞれ計算する。
Figure 0007235117000002
ここで、εは0<ε≦1を満たす忘却係数であり、指数関数的な減衰の時定数を決定する。例えばε=0.01とする。εが1に近づくほど現在の再生信号スペクトルXi(ω)と収音信号スペクトルYi(ω)に依存した(重み付けされた)それぞれの値になる。
エコーパワー計算部104は、再生信号スペクトルXi(ω)と音響結合量の推定値|H^m,i(ω)|2を入力として、エコーパワー推定値|D^i(ω)|2(以下、第1エコーパワー推定値と呼称する)を式(4)で計算する(S104)。
Figure 0007235117000003
ゲイン計算部105は、第1エコーパワー推定値|D^i(ω)|2と収音信号スペクトルYi(ω)を入力として、ゲイン係数Gi(ω)(以下、第1ゲイン係数と呼称する)を式(5)で計算する(S105)。
Figure 0007235117000004
第1ゲイン係数Gi(ω)は、0~1の実数値をとり、収音信号スペクトルYi(ω)にエコー成分が多い場合には小さな値に、エコー成分以外の成分が多い場合には大きな値になる。
積算部106は、収音信号スペクトルYi(ω)に第1ゲイン係数Gi(ω)を積算してエコー消去信号スペクトルS^i(ω)(以下、第1エコー消去信号スペクトルと呼称する)を出力する(S106)。
周波数合成部107は、周波数値ωに対応する第1エコー消去信号スペクトルS^i(ω)から時間領域の出力信号s^(n)を再合成して出力する(S107)。
特許第5087024号公報
A-4-18音響エコー抑圧のための高精度エコーパワー推定(A-4.信号処理,一般セッション)、電子情報通信学会総合大会講演論文集、掲載ページ122、出版年月日2009-03-04
エコー消去装置100は、収音信号スペクトルに対する再生信号スペクトルを過去にずらして求めた結合量を第1音響結合量推定値として求めることで、エコー経路のインパルス応答長に応じた音響結合量を推定することができる。つまり、或るフレームの再生信号とそれ以外のフレームの再生信号は統計的に無相関であることから、過去の時刻の再生信号と現在時刻のフレームの収音信号とのクロススペクトル加算値から、無相関成分を除去した過去フレームのエコー経路の音響結合量を抽出する。しかし、収音信号スペクトルにエコー成分だけでなく近端話者成分が含まれるときの影響は式(1)の中で加味されていない。そのため、従来のエコー消去装置では、音響結合量の誤推定が生じ易かった。その結果、遠端側と近端側の同時通話(ダブルトーク)時において、正確にエコーパワーを推定することが出来ず、それが、ミュージカルノイズ発生の原因の一つになっていた。
ダブルトーク状態であるかどうかを検出するダブルトーク検出器を用いて、ダブルトークが検出されたときにその区間において音響結合量の推定を停止することも考えられる。しかしながら、一般的に音響結合量推定にダブルトーク検出を採用することは望ましくない場合が多い。なぜならば、多くのダブルトーク検出器は、収音信号に含まれる近端話者成分を検出するためにエコー成分を推定する必要があるからである。エコー成分の推定には音響結合量推定が必要であるため、音響結合量推定においてダブルトーク検出器を採用すると、ダブルトーク検出と音響結合量推定のお互いがお互いを待っている状況となりデッドロックに陥ってしまうことがある。
そこで本発明では、ダブルトーク検出器を用いることなく、近端話者成分の大きさに関わらず高精度に音響結合量を算出できるエコー消去装置を提供することを目的とする。
本発明のエコー消去装置は、近端に設置されたマイクロホンにより収音される収音信号に含まれるエコーを消去するエコー消去装置であって、音響結合量計算部と、ゲイン計算部と、積算部を含む。
音響結合量計算部は、収音信号に含まれる、遠端に設置されたマイクロホンにより収音された信号である再生信号の成分の音響結合量推定値を、収音信号におけるエコー成分以外の成分の大きさが大きいほど更新量を小さくするように更新して計算する。ゲイン計算部は、音響結合量推定値に基づきゲイン係数を計算する。積算部は、収音信号にゲイン係数を積算してエコー消去信号を生成する。
本発明のエコー消去装置によれば、ダブルトーク検出器を用いることなく、近端話者成分の大きさに関わらず高精度に音響結合量を算出できる。
従来技術のエコー消去装置の構成を示すブロック図。 実施例1のエコー消去装置の構成を示すブロック図。 実施例1のエコー消去装置の動作を示すフローチャート。 従来の方法と実施例1の方法におけるダブルトーク時の音声歪み量を比較するグラフ。 コンピュータの機能構成例を示す図。
以下、本発明の実施の形態について、詳細に説明する。なお、同じ機能を有する構成部には同じ番号を付し、重複説明を省略する。
以下、図2を参照して実施例1のエコー消去装置の構成を説明する。同図に示すように、本実施例のエコー消去装置200は、第1周波数分析部101と、第2周波数分析部102と、第1音響結合量計算部103と、第1エコーパワー計算部104と、第1ゲイン計算部105と、第1積算部106と、第2音響結合量計算部203と、第2エコーパワー計算部204と、第2ゲイン計算部205と、第2積算部206と、周波数合成部207を含む。エコー消去装置200は、例えばROM、RAM、CPU等で構成されるコンピュータに所定のプログラムが読み込まれて、CPUがそのプログラムを実行することで実現されるものである。
第2音響結合量計算部203と、第2エコーパワー計算部204と、第2ゲイン計算部205と、第2積算部206と、周波数合成部207は新しい構成要件である。その他の構成である、第1周波数分析部101、第2周波数分析部102、第1音響結合量計算部103、第1エコーパワー計算部104、第1ゲイン計算部105、第1積算部106はそれぞれ、従来のエコー消去装置100における、第1周波数分析部101、第2周波数分析部102、音響結合量計算部103、エコーパワー計算部104、ゲイン計算部105、積算部106と同じ機能を備える。
以下、従来技術に含まれない新しい構成要件の動作について詳細に説明する。
<第2音響結合量計算部203>
第2音響結合量計算部203は、収音信号スペクトルYi(ω)に含まれる、遠端に設置されたマイクロホンにより収音された信号である再生信号の成分の音響結合量推定値(第2音響結合量推定値|H~m,i(ω)|2、詳細は後述)を、収音信号スペクトルYi(ω)におけるエコー成分以外の成分の大きさが大きいほど更新量を小さくするように更新して計算する(S203)。なお、エコー成分以外の成分とは、近端の外乱(定常性雑音、非定常性雑音)を指し、特に近端の外乱のうち非定常性雑音を指す。これは、図示しないノイズリダクションなどにより定常性雑音は予め消去されていることを考慮したものである。ただし、エコー成分以外の成分として、非定常性雑音と、定常性雑音の消し漏れの成分の双方を考慮してもよい。
式(1)に示される従来の音響結合量推定式の式展開を式(6)に示す。
Figure 0007235117000005
式(6)に示すように、従来の音響結合量推定式の中から1フレーム過去の音響結合量推定値をくくりだすことで、音響結合量推定式をステップサイズを持つ更新式に置き換えることができる。式(6)中のステップサイズμi-m,ωは式(7)で表される。
Figure 0007235117000006
式(6)の式展開によって得られた音響結合量推定式の形であれば、フレームごとの更新量を可変とするステップサイズ制御が可能となる。第2音響結合量計算部203は、ステップサイズを制御することで更新量を決定することができる。なお、従来技術では、更新をし続けなければならなかったところ、ステップサイズを制御する形にすることで、更新を止めることも可能となった。

第2音響結合量計算部203は、再生信号スペクトルXi(ω)と、収音信号スペクトルYi(ω)と、エコー消去信号スペクトルS^i(ω)とを入力として、第2音響結合量推定値|H~m,i(ω)|2を例えば式(8)で計算する(S203)。
Figure 0007235117000007
ここで、σ[S^i(ω)]は現時刻のフレームに含まれる近端話者成分や外乱などのエコー成分以外の成分の大きさが大きいほど大きな値をとるパラメータで、例えば式(9)で定義できる。
Figure 0007235117000008
ここで、υ1とυ2はそれぞれ閾値を示し、信号の量子化ビット数が16ビットであれば例えばυ12=1000と、固定パラメータを用いてもよいし、再生信号スペクトルXi(ω)や収音信号スペクトルYi(ω)やエコー消去信号スペクトルS^i(ω)などの入力の大きさに応じて、大きさが大きいほど大きな値となる変動パラメータであってもよい。
Figure 0007235117000009
は、エコー消去信号スペクトルの絶対値|S^i(ω)|を周波数方向で平均化する処理を意味する。
式(9)は、エコー成分以外の成分|S^i(ω)|の割合が所定の閾値υ1より大きく、エコー成分以外の成分|S^i(ω)|の周波数成分の平均値
Figure 0007235117000010
が所定の閾値υ2より大きい場合のみ、音響結合量を更新する量を決定する際、エコー成分以外の成分|S^i(ω)|の割合が大きいほど、音響結合量の更新量を小さくする制御を表している。また式(9)は、エコー成分以外の成分|S^i(ω)|の割合が所定の閾値υ1以下である場合、またはエコー成分以外の成分|S^i(ω)|の周波数成分の平均値
Figure 0007235117000011
が所定の閾値υ2以下である場合、エコー成分以外の成分|S^i(ω)|の割合を用いずに音響結合量の更新量を決定する制御を表している。
なお、式(9)をand(or)、すなわちand条件またはor条件のいずれかを選択することができるようにした。ステップサイズを小さくすると更新に多大な時間を要するため、多少外乱がある程度であれば、通常通り更新させたほうが効率が良いことを考慮し、外乱の影響を考慮させるかどうかの閾値υ1,υ2を設け、さらに条件を緩めるためにor条件による判断も可とした。
<第2エコーパワー計算部204>
入力の一部が、第1音響結合量推定値|H^m,i(ω)|2から第2音響結合量推定値|H~m,i(ω)|2に置き換わり、出力が第1エコーパワー推定値|D^i(ω)|2から第2エコーパワー推定値|D~i(ω)|2に置き換わったこと以外は、第1エコーパワー計算部104と同じである。すなわち、第2エコーパワー計算部204は、再生信号スペクトルXi(ω)と第2音響結合量推定値|H~m,i(ω)|2を入力として、第2エコーパワー推定値|D~i(ω)|2を式(10)で計算する(S204)。
Figure 0007235117000012
<第2ゲイン計算部205>
入力の一部が、第1エコーパワー推定値|D^i(ω)|2から第2エコーパワー推定値|D~i(ω)|2に置き換わり、出力が第1ゲイン係数Gi(ω)から第2ゲイン係数G~i(ω)に置き換わったこと以外は、第1ゲイン計算部105と同じである。すなわち、第2ゲイン計算部205は、第2エコーパワー推定値|D~i(ω)|2と収音信号スペクトルYi(ω)を入力として、第2ゲイン係数G~i(ω)を式(11)で計算する(S205)。
Figure 0007235117000013
<第2積算部206>
入力の一部が、第1ゲイン係数Gi(ω)から第2ゲイン係数G^i(ω)に置き換わり、出力が第1エコー消去信号スペクトルS^i(ω)から第2エコー消去信号スペクトルS~i(ω)に置き換わった以外、第1積算部106と同じである。すなわち、第2積算部206は、収音信号スペクトルYi(ω)に第2ゲイン係数G^i(ω)を積算して第2エコー消去信号スペクトルS~i(ω)を生成して出力する(S206)。
<周波数合成部207>
入力が第1エコー消去信号スペクトルS^i(ω)から第2エコー消去信号スペクトルS~i(ω)に置き換わった以外、周波数合成部107と同じである。すなわち、周波数合成部207は、周波数値ωに対応する第2エコー消去信号スペクトルS~i(ω)から時間領域の出力信号s^(n)を再合成して出力する(S207)。
<実施例1のエコー消去装置200の効果>
実施例1のエコー消去装置200によれば、収音信号スペクトルに対する再生信号スペクトルを過去にずらして音響結合量を求める際に、現時刻のフレームに含まれる近端話者成分(エコー消去信号スペクトル)の大きさが大きいほど、音響結合量推定の更新量を決定するステップサイズが小さくなる。したがって、ダブルトーク時において、ダブルトーク検出器を用いることなく音響結合量の誤推定を防止することが可能である。よって、ダブルトーク時でも音響結合量の誤推定を軽減し、エコーパワーを高精度に推定できる。
<シミュレーション実験の結果>
実施例1に記載のエコー消去装置(エコー消去方法)と従来の方法とを比較する。従来の方法として非特許文献1の方法を用いた。実施例1に記載のエコー消去装置(エコー消去方法)の有効性を確認するため、実施例1に記載のエコー消去装置(エコー消去方法)と従来の方法をER処理にそれぞれ適用し、性能比較を行った。スピーカとマイクの配置はITU-T勧告P.340に従った。残響時間は約300ms、標本化周波数は16kHz、周波数帯域は100Hz~7kHzである。
本実験では、遠端側のみの通話(受話シングルトーク)とダブルトークを別の尺度で評価している.受話シングルトーク時は,ERLE(Echo Return Loss Enhancement)を用いエコー抑圧量を評価した。実験の結果、実施例1に記載のエコー消去装置(エコー消去方法)と従来の方法であるERLEは共に26.32dBであった。本結果は、実施例1に記載のエコー消去装置(エコー消去方法)において受話シングルトーク時にσ[S^i(ω)]=1となり,エコー経路パワスペクトル推定値が従来法と一致したためである。
ダブルトーク時は、LPC(Linear Predictive Coding)ケプストラム距離を用い送話音声の歪み量を評価した。図4はその比較結果である。これらの結果から、実施例1に記載のエコー消去装置(エコー消去方法)によれば、受話シングルトーク時のエコー抑圧量を劣化させることなく、ダブルトーク時の音声歪み量を低減できることがわかった。
<補記>
本発明の装置は、例えば単一のハードウェアエンティティとして、キーボードなどが接続可能な入力部、液晶ディスプレイなどが接続可能な出力部、ハードウェアエンティティの外部に通信可能な通信装置(例えば通信ケーブル)が接続可能な通信部、CPU(Central Processing Unit、キャッシュメモリやレジスタなどを備えていてもよい)、メモリであるRAMやROM、ハードディスクである外部記憶装置並びにこれらの入力部、出力部、通信部、CPU、RAM、ROM、外部記憶装置の間のデータのやり取りが可能なように接続するバスを有している。また必要に応じて、ハードウェアエンティティに、CD-ROMなどの記録媒体を読み書きできる装置(ドライブ)などを設けることとしてもよい。このようなハードウェア資源を備えた物理的実体としては、汎用コンピュータなどがある。
ハードウェアエンティティの外部記憶装置には、上述の機能を実現するために必要となるプログラムおよびこのプログラムの処理において必要となるデータなどが記憶されている(外部記憶装置に限らず、例えばプログラムを読み出し専用記憶装置であるROMに記憶させておくこととしてもよい)。また、これらのプログラムの処理によって得られるデータなどは、RAMや外部記憶装置などに適宜に記憶される。
ハードウェアエンティティでは、外部記憶装置(あるいはROMなど)に記憶された各プログラムとこの各プログラムの処理に必要なデータが必要に応じてメモリに読み込まれて、適宜にCPUで解釈実行・処理される。その結果、CPUが所定の機能(上記、…部、…手段などと表した各構成要件)を実現する。
本発明は上述の実施形態に限定されるものではなく、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。また、上記実施形態において説明した処理は、記載の順に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されるとしてもよい。
既述のように、上記実施形態において説明したハードウェアエンティティ(本発明の装置)における処理機能をコンピュータによって実現する場合、ハードウェアエンティティが有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記ハードウェアエンティティにおける処理機能がコンピュータ上で実現される。
上述の各種の処理は、図5に示すコンピュータの記録部10020に、上記方法の各ステップを実行させるプログラムを読み込ませ、制御部10010、入力部10030、出力部10040などに動作させることで実施できる。
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。具体的には、例えば、磁気記録装置として、ハードディスク装置、フレキシブルディスク、磁気テープ等を、光ディスクとして、DVD(Digital Versatile Disc)、DVD-RAM(Random Access Memory)、CD-ROM(Compact Disc Read Only Memory)、CD-R(Recordable)/RW(ReWritable)等を、光磁気記録媒体として、MO(Magneto-Optical disc)等を、半導体メモリとしてEEP-ROM(Electrically Erasable and Programmable-Read Only Memory)等を用いることができる。
また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD-ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。
このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。そして、処理の実行時、このコンピュータは、自己の記録媒体に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。なお、本形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの(コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等)を含むものとする。
また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、ハードウェアエンティティを構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。

Claims (5)

  1. 近端に設置されたマイクロホンにより収音される収音信号に含まれるエコーを消去するエコー消去装置であって、
    前記収音信号に含まれる、遠端に設置されたマイクロホンにより収音された信号である再生信号の成分の音響結合量推定値を、前記収音信号におけるエコー成分以外の成分の大きさが大きいほど更新量を小さくするように更新して計算する音響結合量計算部と、
    前記音響結合量推定値に基づきゲイン係数を計算するゲイン計算部と、
    前記収音信号に前記ゲイン係数を積算してエコー消去信号を生成する積算部を含み、
    前記音響結合量計算部は、
    iをフレーム番号、mをエコー経路のインパルス応答長に応じたフレーム、ωを周波数値、μをステップサイズ、S^(ω)をエコー消去信号スペクトル、σ[S^(ω)]を現時刻のフレームに含まれるエコー成分以外の成分の大きさが大きいほど大きな値をとるパラメータ、Y(ω)を収音信号スペクトル、X(ω)を再生信号スペクトル、|H~(ω)|2を前記音響結合量推定値として、
    前記音響結合量推定値を求める式が前記ステップサイズμを持つ更新式
    Figure 0007235117000014

    で表される場合に、前記ステップサイズμを制御することで更新量を決定する
    エコー消去装置。
  2. 近端に設置されたマイクロホンにより収音される収音信号に含まれるエコーを消去するエコー消去装置であって、
    前記収音信号に含まれる、遠端に設置されたマイクロホンにより収音された信号である再生信号の成分の音響結合量推定値を、前記収音信号におけるエコー成分以外の成分の大きさが大きいほど更新量を小さくするように更新して計算する音響結合量計算部と、
    前記音響結合量推定値に基づきゲイン係数を計算するゲイン計算部と、
    前記収音信号に前記ゲイン係数を積算してエコー消去信号を生成する積算部を含み、
    前記音響結合量計算部は、
    前記エコー成分以外の成分の割合が所定の閾値より大きく、かつ、前記エコー成分以外の成分の周波数成分の平均値が所定の閾値より大きい場合のみ、前記音響結合量を更新する量を決定する際、前記エコー成分以外の成分の割合が大きいほど、前記音響結合量の更新量を小さくし、
    前記エコー成分以外の成分の割合が所定の閾値以下である場合、または前記エコー成分以外の成分の周波数成分の平均値が所定の閾値以下である場合、前記エコー成分以外の成分の割合を用いずに前記音響結合量の更新量を決定する
    エコー消去装置。
  3. 近端に設置されたマイクロホンにより収音される収音信号に含まれるエコーを消去するエコー消去方法であって、
    前記収音信号に含まれる、遠端に設置されたマイクロホンにより収音された信号である再生信号の成分の音響結合量推定値を、前記収音信号におけるエコー成分以外の成分の大きさが大きいほど更新量を小さくするように更新して計算するステップと、
    前記音響結合量推定値に基づきゲイン係数を計算するステップと、
    前記収音信号に前記ゲイン係数を積算してエコー消去信号を生成するステップを含み、
    iをフレーム番号、mをエコー経路のインパルス応答長に応じたフレーム、ωを周波数値、μをステップサイズ、S^(ω)をエコー消去信号スペクトル、σ[S^(ω)]を現時刻のフレームに含まれるエコー成分以外の成分の大きさが大きいほど大きな値をとるパラメータ、Y(ω)を収音信号スペクトル、X(ω)を再生信号スペクトル、|H~(ω)| 2 を前記音響結合量推定値として、
    前記音響結合量推定値を求める式が前記ステップサイズμを持つ更新式、
    Figure 0007235117000015

    で表される場合に、前記ステップサイズμを制御することで更新量を決定する
    エコー消去方法。
  4. 近端に設置されたマイクロホンにより収音される収音信号に含まれるエコーを消去するエコー消去方法であって、
    前記収音信号に含まれる、遠端に設置されたマイクロホンにより収音された信号である再生信号の成分の音響結合量推定値を、前記収音信号におけるエコー成分以外の成分の大きさが大きいほど更新量を小さくするように更新して計算するステップと、
    前記音響結合量推定値に基づきゲイン係数を計算するステップと、
    前記収音信号に前記ゲイン係数を積算してエコー消去信号を生成するステップを含み、
    前記エコー成分以外の成分の割合が所定の閾値より大きく、かつ、前記エコー成分以外の成分の周波数成分の平均値が所定の閾値より大きい場合のみ、前記音響結合量を更新する量を決定する際、前記エコー成分以外の成分の割合が大きいほど、前記音響結合量の更新量を小さくし、
    前記エコー成分以外の成分の割合が所定の閾値以下である場合、または前記エコー成分以外の成分の周波数成分の平均値が所定の閾値以下である場合、前記エコー成分以外の成分の割合を用いずに前記音響結合量の更新量を決定する
    エコー消去方法。
  5. コンピュータを請求項1または2に記載のエコー消去装置として機能させるプログラム。
JP2021538582A 2019-08-06 2019-08-06 エコー消去装置、エコー消去方法、プログラム Active JP7235117B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2019/030866 WO2021024373A1 (ja) 2019-08-06 2019-08-06 エコー消去装置、エコー消去方法、プログラム

Publications (2)

Publication Number Publication Date
JPWO2021024373A1 JPWO2021024373A1 (ja) 2021-02-11
JP7235117B2 true JP7235117B2 (ja) 2023-03-08

Family

ID=74502836

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021538582A Active JP7235117B2 (ja) 2019-08-06 2019-08-06 エコー消去装置、エコー消去方法、プログラム

Country Status (3)

Country Link
US (1) US20220329940A1 (ja)
JP (1) JP7235117B2 (ja)
WO (1) WO2021024373A1 (ja)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5087024B2 (ja) 2009-02-10 2012-11-28 日本電信電話株式会社 エコー消去装置とその方法と、プログラム
JP2014150368A (ja) 2013-01-31 2014-08-21 Nippon Telegr & Teleph Corp <Ntt> エコー抑圧ゲイン推定方法とそれを用いたエコー消去装置とプログラム
US20140334620A1 (en) 2013-05-13 2014-11-13 Christelle Yemdji Method for processing an audio signal and audio receiving circuit
WO2019044176A1 (ja) 2017-08-28 2019-03-07 ソニー株式会社 音声処理装置及び音声処理方法、並びに情報処理装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8792649B2 (en) * 2008-09-24 2014-07-29 Mitsubishi Electric Corporation Echo canceller used for voice communication
US8447595B2 (en) * 2010-06-03 2013-05-21 Apple Inc. Echo-related decisions on automatic gain control of uplink speech signal in a communications device
US8804977B2 (en) * 2011-03-18 2014-08-12 Dolby Laboratories Licensing Corporation Nonlinear reference signal processing for echo suppression

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5087024B2 (ja) 2009-02-10 2012-11-28 日本電信電話株式会社 エコー消去装置とその方法と、プログラム
JP2014150368A (ja) 2013-01-31 2014-08-21 Nippon Telegr & Teleph Corp <Ntt> エコー抑圧ゲイン推定方法とそれを用いたエコー消去装置とプログラム
US20140334620A1 (en) 2013-05-13 2014-11-13 Christelle Yemdji Method for processing an audio signal and audio receiving circuit
WO2019044176A1 (ja) 2017-08-28 2019-03-07 ソニー株式会社 音声処理装置及び音声処理方法、並びに情報処理装置

Also Published As

Publication number Publication date
WO2021024373A1 (ja) 2021-02-11
US20220329940A1 (en) 2022-10-13
JPWO2021024373A1 (ja) 2021-02-11

Similar Documents

Publication Publication Date Title
JP4954334B2 (ja) エコー抑制のためのフィルタ係数を演算する装置および方法
JP5751110B2 (ja) 残響抑制装置および残響抑制方法並びに残響抑制プログラム
JP5087024B2 (ja) エコー消去装置とその方法と、プログラム
JP2016503263A (ja) エコー抑圧
JP6422885B2 (ja) エコー抑圧
EP2987313B1 (en) Echo removal
JP2011166484A (ja) 多チャネルエコー消去方法、多チャネルエコー消去装置、多チャネルエコー消去プログラム及びその記録媒体
JP2009188724A (ja) エコー抑圧ゲイン推定方法とそれを用いたエコー消去装置と、装置プログラムと記録媒体
JP5161157B2 (ja) 周波数領域エコー除去装置、周波数領域エコー除去方法、プログラム
JP7235117B2 (ja) エコー消去装置、エコー消去方法、プログラム
JP2003250193A (ja) 反響消去方法、この方法を実施する装置、プログラムおよびその記録媒体
Cohen et al. An online algorithm for echo cancellation, dereverberation and noise reduction based on a Kalman-EM Method
JP6537997B2 (ja) エコー抑圧装置、その方法、プログラム、及び記録媒体
JP2014150368A (ja) エコー抑圧ゲイン推定方法とそれを用いたエコー消去装置とプログラム
JP5044594B2 (ja) 多チャネルエコー消去装置とその方法、そのプログラム
JP2014017696A (ja) エコー抑圧ゲイン推定方法とそれを用いたエコー消去装置とプログラム
JP5583181B2 (ja) 縦続接続型伝達系パラメータ推定方法、縦続接続型伝達系パラメータ推定装置、プログラム
JP5925149B2 (ja) 音響結合量推定装置、エコー消去装置、その方法及びプログラム
JP3583998B2 (ja) 多チャネルエコー消去方法、その装置及びプログラム記録媒体
JP4094523B2 (ja) 反響消去装置、方法、及び反響消去プログラム、そのプログラムを記録した記録媒体
JP4094522B2 (ja) 反響消去装置、方法、及び反響消去プログラム、そのプログラムを記録した記録媒体
JP5346350B2 (ja) 反響消去装置とその方法とプログラム
CN113724722B (zh) 回声延迟估计方法、装置、存储介质和计算设备
JP2008098929A (ja) エコーキャンセラ装置、その方法、そのプログラム、およびその記録媒体
JP2007259202A (ja) エコー抑圧方法、装置、エコー抑圧プログラム、記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20211124

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20221004

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221028

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230124

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230206

R150 Certificate of patent or registration of utility model

Ref document number: 7235117

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150