JP6356087B2 - Echo canceling apparatus, method and program - Google Patents
Echo canceling apparatus, method and program Download PDFInfo
- Publication number
- JP6356087B2 JP6356087B2 JP2015068888A JP2015068888A JP6356087B2 JP 6356087 B2 JP6356087 B2 JP 6356087B2 JP 2015068888 A JP2015068888 A JP 2015068888A JP 2015068888 A JP2015068888 A JP 2015068888A JP 6356087 B2 JP6356087 B2 JP 6356087B2
- Authority
- JP
- Japan
- Prior art keywords
- signal
- echo
- frequency domain
- residual echo
- collected
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Circuit For Audible Band Transducer (AREA)
- Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
- Telephone Function (AREA)
Description
本発明は、M(但し、Mは1以上の整数)個のスピーカと1個以上のマイクロホンが共通の音場に配置され、スピーカから受話信号を再生した際に、エコー経路を介してマイクロホンに回り込む音響エコー(以下、単に「エコー」という)を消去する技術、特にテレビ会議システム等の拡声通話系におけるエコーを消去する技術に関する。 In the present invention, M (where M is an integer of 1 or more) speakers and one or more microphones are arranged in a common sound field, and when a received signal is reproduced from the speakers, the microphones are connected to the microphones via an echo path. The present invention relates to a technique for canceling an acoustic echo that wraps around (hereinafter simply referred to as “echo”), and more particularly to a technique for canceling an echo in a loudspeaker communication system such as a video conference system.
スピーカで受話信号が再生され、その音声がマイクロホンで収音されてエコーが生じる。そのまま送信されると通話の障害や不快感等の問題が生じる。さらに、スピーカやマイクロホンの音量が大きい場合にはハウリングが生じ、通話が不可能になる。特に拡声通話系では、このような問題が顕著となる。 The received signal is reproduced by the speaker, and the sound is picked up by the microphone to generate an echo. If it is transmitted as it is, problems such as trouble of telephone conversation and discomfort arise. Further, howling occurs when the volume of the speaker or microphone is high, making it impossible to make a call. In particular, such a problem becomes conspicuous in the voice call system.
この問題を解決するために、従来技術として、適応フィルタを用いてエコーを消去するエコー消去装置がある。非特許文献1が従来技術の多チャネルエコー消去方法として知られている。図1を用いて従来の多チャネルエコー消去装置80を説明する。
In order to solve this problem, there is an echo canceller that cancels echoes using an adaptive filter as a prior art. Non-Patent
スピーカ21,…,2Mとマイクロホン31,…,3Nが共通の音場に配置され、スピーカ21,…,2Mからそれぞれ受話信号x1(k),…,xM(k)を再生した場合に、多チャネルエコー消去装置80内のエコー消去部8nは、マイクロホン3nにM本のエコー経路hmn(k)を介して回り込む再生音を消去する。但し、Mは1以上の整数であり、Nは1以上の整数であり、m=1,…,Mであり、n=1,…,Nである。多チャネルエコー消去装置80は、受話端子11,…,1Mと、送話端子41,…,4Nと、マイクロホン31,…,3Nとが接続されており、受話信号x1(k),…,xM(k)及び収音信号y1(k),…,yN(k)が入力され、送話信号u1(k),…,uN(k)をそれぞれ送話端子41,…,4Nに出力する。多チャネルエコー消去装置80は、N個のエコー消去部81,…,8Nを含み、エコー消去部8nは、エコー予測部81と、減算部82と、エコー経路推定部83とを有する。図1において、yn(k)をy(k)とし、un(k)をu(k)とし、h1n(k),…,hMn(k)をそれぞれh1(k),…,hM(k)として表す。他のマイクロホンからの収音信号についても同様の処理を行うことができ、図1のエコー消去部8nの構成を並列に並べるだけでよいため、以下では図1を用いて説明する。
エコー消去部8nは、エコー予測部81において、受話信号x1(k),…,xM(k)を適応フィルタでフィルタリングし、予測エコー信号y’(k)を生成する。減算部82において、収音信号y(k)と予測エコー信号y’(k)との差分(以下「誤差信号」という)u(k)を求め、これを送話信号として出力する。また、エコー経路推定部83において、誤差信号u(k)と受話信号x1(k),…,xM(k)とからエコー経路を逐次推定し、この推定結果(適応フィルタのフィルタ係数h’(k))をエコー予測部81にコピーする。エコー経路推定が精度よく行われた状態では、収音信号y(k)に含まれるエコー成分と予測エコー信号y’(k)がほぼ等しくなり、誤差信号u(k)中にエコーは殆ど含まれなくなる。
In the echo canceling unit 8 n , the
しかし実際に多チャネルエコー消去装置が使用される状況では、いつも十分にエコー消去できるとは限らず、残留エコーが生じて通話品質が劣化しうる。それは、人の動き等によりエコー経路は絶えず変動しているからであり、適応フィルタによるエコー経路推定が瞬時には完了しないためである。またダブルトーク状態でエコー経路の推定が若干乱れうるからである。 However, in a situation where a multi-channel echo canceller is actually used, it is not always possible to sufficiently cancel the echo, and a residual echo may occur, resulting in a deterioration in the speech quality. This is because the echo path is constantly fluctuating due to human movement and the like, and the echo path estimation by the adaptive filter is not completed instantaneously. This is because the estimation of the echo path can be slightly disturbed in the double talk state.
さらに受話信号が多チャネルの場合には、受話信号間の相関が高いために、エコーが消去されている状態であっても推定されたエコー経路と真のエコー経路は必ずしも一致しない場合がある。そのため、話者が交代して受話信号間の相互相関が変化すると突然残留エコーが大きくなりうる(非特許文献1参照)。 Further, when the received signal is multi-channel, since the correlation between the received signals is high, the estimated echo path may not always match the true echo path even if the echo is canceled. Therefore, when the speaker changes and the cross-correlation between the received signals changes, the residual echo can suddenly increase (see Non-Patent Document 1).
快適な拡声通話を実現するには、適応フィルタによるエコー経路推定及び消去が十分でない状態において、受話信号のチャネル数や会話状態によらず、迅速に残留エコーを低減する必要がある。チャネル数や会話状態によらず残留エコーを低減させるために、受話信号から残留エコーへの伝達特性を高速に推定し、誤差信号から残留エコーを差し引く方法として非特許文献2が知られている。この方法において、伝達特性の推定では、周波数毎に受話信号と誤差信号の相関を利用することで、推定が高速化され、残留エコー以外の信号による推定揺らぎが抑えられる。伝達特性と残留エコーに関して振幅と位相を推定するため、チャネル数によらず適用可能である。また引き算により残留エコーの消去をはかるため、ダブルトーク時でも送話音質の歪みを小さくできる。
In order to realize a comfortable loud voice call, it is necessary to quickly reduce the residual echo regardless of the number of channels of the received signal and the conversation state in a state where the echo path estimation and cancellation by the adaptive filter is not sufficient. Non-Patent
非特許文献2では、残留エコーが精度良く求められている必要がある。しかし残留エコーを限られた時間長(短時間区間)の受話信号と誤差信号とから推定するために、時間長を十分長くとる場合と比較すると推定のばらつきが大きくなり、残留エコーを大きめに推定してしまう場合がある。
In
送話の品質を高くするには、上記のような状況でも残留エコーの推定精度を高める必要がある。そのために、残留エコー推定値を補正する方法が、特許文献1で提案されている。
In order to improve the quality of transmission, it is necessary to improve the estimation accuracy of residual echo even in the above situation. For this purpose,
しかし推定された残留エコー(推定値)のパワーと適応フィルタが出力する誤差信号のパワーが同等であっても、残留エコー消去処理の効果が薄いことがある。それは、補正した残留エコー推定値の位相誤差が小さくないために、適応フィルタ出力信号から残留エコー推定値を引いても、差信号のパワー小さくならないときである。その一つの理由は、残留エコー消去処理のモデルが想定する残響時間が数十msであり、実際の部屋の残響時間(数百ms)よりもかなり短く設定されることである。また、適応フィルタの学習が進み、上記の数十msに対応する部分が適応フィルタにより良好に消去されると、上記の想定残響時間の相違の影響がより顕著になることが、もう一つの理由である。 However, even if the power of the estimated residual echo (estimated value) is equal to the power of the error signal output from the adaptive filter, the effect of the residual echo cancellation process may be weak. This is when the phase error of the corrected residual echo estimation value is not small, so that the difference signal power does not decrease even if the residual echo estimation value is subtracted from the adaptive filter output signal. One reason is that the reverberation time assumed by the model of the residual echo cancellation processing is several tens of ms, which is set to be considerably shorter than the reverberation time of the actual room (several hundred ms). Another reason is that when the adaptive filter learning progresses and the part corresponding to the above several tens of ms is well erased by the adaptive filter, the influence of the difference in the assumed reverberation time becomes more prominent. It is.
本発明の目的は、このような状態(残留エコー推定値の位相誤差が小さくないために残留エコー消去処理の効果が薄い状況)において、従来よりも残留エコーを減らすことができるエコー消去技術を提供することである。なお、本発明において、残留エコーとは、収音信号中に含まれるエコー成分全般を意味し、収音信号に対して適応フィルタによるエコー消去を行った後に誤差信号中に残るエコー成分を意味するだけではなく、適応フィルタによるエコー消去行わない場合の収音信号中に含まれるエコー成分全てをも意味する概念である。 The object of the present invention is to provide an echo cancellation technique that can reduce the residual echo in the state (the situation where the residual echo cancellation processing is less effective because the phase error of the residual echo estimation value is not small). It is to be. In the present invention, the residual echo means all echo components included in the collected sound signal, and means an echo component remaining in the error signal after performing echo cancellation by an adaptive filter on the collected sound signal. It is a concept that means not only the echo component but also all echo components included in the collected sound signal when the echo cancellation by the adaptive filter is not performed.
上記の課題を解決するために、本発明の一形態によれば、エコー消去装置は、1個以上のスピーカと1個以上のマイクロホンが共通の音場に配置され、スピーカから受話信号を再生した際に、エコー経路を介してマイクロホンに回り込むエコーを消去する。エコー消去装置は、マイクロホンで収音した第一収音信号から得られる信号である周波数領域収音信号と、受話信号から得られる周波数領域の信号である周波数領域受話信号とを用いて、周波数領域収音信号に含まれる残留エコーの位相と振幅とを考慮し、残留エコー推定値を求める残留エコー推定部と、周波数領域収音信号から残留エコー推定値を消去し、抑圧する残留エコー消去抑圧部とを含み、残留エコー消去抑圧部は、周波数領域収音信号から残留エコー推定値を引いて差を求め、その差が小さいほど、周波数領域収音信号から残留エコーを抑圧する割合を増やし、残留エコーを消去する割合を減らす。 In order to solve the above problems, according to one aspect of the present invention, an echo canceller reproduces a received signal from a speaker, in which one or more speakers and one or more microphones are arranged in a common sound field. In this case, the echo that goes around the microphone via the echo path is eliminated. The echo canceller uses a frequency domain sound pickup signal that is a signal obtained from the first sound pickup signal picked up by the microphone and a frequency domain reception signal that is a frequency domain signal obtained from the reception signal. A residual echo estimator that calculates the residual echo estimate in consideration of the phase and amplitude of the residual echo contained in the collected sound signal, and a residual echo cancellation suppressor that eliminates and suppresses the residual echo estimate from the frequency domain collected signal The residual echo cancellation suppression unit subtracts the residual echo estimate from the frequency domain collected signal to obtain a difference, and the smaller the difference, the higher the ratio of suppressing the residual echo from the frequency domain collected signal. Reduce the rate of echo cancellation.
上記の課題を解決するために、本発明の他の形態によれば、エコー消去方法は、1個以上のスピーカと1個以上のマイクロホンが共通の音場に配置され、スピーカから受話信号を再生した際に、エコー経路を介してマイクロホンに回り込むエコーを消去する。エコー消去方法は、マイクロホンで収音した第一収音信号から得られる信号である周波数領域収音信号と、受話信号から得られる周波数領域の信号である周波数領域受話信号とを用いて、周波数領域収音信号に含まれる残留エコーの位相と振幅とを考慮し、残留エコー推定値を求める残留エコー推定ステップと、周波数領域収音信号から残留エコー推定値を消去し、抑圧する残留エコー消去抑圧ステップとを含み、残留エコー消去抑圧ステップは、周波数領域収音信号から残留エコー推定値を引いて差を求め、その差が小さいほど、周波数領域収音信号から残留エコーを抑圧する割合を増やし、残留エコーを消去する割合を減らす。 In order to solve the above problems, according to another aspect of the present invention, an echo canceling method reproduces a received signal from a speaker by arranging one or more speakers and one or more microphones in a common sound field. When this occurs, the echo that goes around the microphone via the echo path is eliminated. The echo canceling method uses a frequency domain sound pickup signal that is a signal obtained from the first sound pickup signal picked up by the microphone and a frequency domain reception signal that is a frequency domain signal obtained from the reception signal. Considering the phase and amplitude of the residual echo contained in the collected sound signal, a residual echo estimation step for obtaining a residual echo estimate value, and a residual echo cancellation suppression step for eliminating and suppressing the residual echo estimate value from the frequency domain collected signal In the residual echo cancellation suppression step, the residual echo estimation value is subtracted from the frequency domain collected signal to obtain a difference, and the smaller the difference, the higher the ratio of suppressing the residual echo from the frequency domain collected signal. Reduce the rate of echo cancellation.
本発明に係るエコー消去技術では、残留エコー推定値の位相誤差が小さくないために残留エコー消去処理の効果が薄い状況において、従来よりも残留エコーを減らすことができるという効果を奏する。 The echo cancellation technique according to the present invention has an effect that the residual echo can be reduced as compared with the conventional technique in a situation where the effect of the residual echo cancellation process is weak because the phase error of the residual echo estimation value is not small.
以下、本発明の実施形態について、説明する。なお、以下の説明に用いる図面では、同じ機能を持つ構成部や同じ処理を行うステップには同一の符号を記し、重複説明を省略する。以下の説明において、テキスト中で使用する記号「^」等は、本来直前の文字の真上に記載されるべきものであるが、テキスト記法の制限により、当該文字の直後に記載する。式中においてはこれらの記号は本来の位置に記述している。また、ベクトルや行列の各要素単位で行われる処理は、特に断りが無い限り、そのベクトルやその行列の全ての要素に対して適用されるものとする。 Hereinafter, embodiments of the present invention will be described. In the drawings used for the following description, constituent parts having the same function and steps for performing the same process are denoted by the same reference numerals, and redundant description is omitted. In the following description, the symbol “^” or the like used in the text should be described immediately above the character immediately before, but it is described immediately after the character due to restrictions on text notation. In the formula, these symbols are written in their original positions. Further, the processing performed for each element of a vector or matrix is applied to all elements of the vector or matrix unless otherwise specified.
<第一実施形態のポイント>
特許文献1の残留エコー消去は、残留エコーの位相と振幅を推定し、引き算により残留エコーの消去をはかる。一方、残留エコーの振幅のみを推定し、その振幅相当分だけ各周波数において信号を掛け算で減衰させるエコー抑圧という手法がある(参考文献1)。
(参考文献1)特開平11−331046号公報
<Points of first embodiment>
In the residual echo cancellation of
(Reference 1) Japanese Patent Laid-Open No. 11-331046
本実施形態では、この引き算による残留エコー消去と、掛け算によるエコー抑圧を組み合わせる。具体的には、収音信号のパワーと残留エコー推定値のパワーの差分が小さいときに、エコー消去及び抑圧の混合モードに入る。前述の通り、パワーの差分が小さい場合、位相誤差が小さくない可能性が高く、位相誤差が小さくないときに残留エコー消去により残留エコー推定値を引いても、残留エコーがほとんど減少しないことが多い。。一方、パワーの差分が小さい場合、ダブルトーク状態である可能性は低く、エコー抑圧による送話音質の歪みの可能性は低い。そこで、混合モードではパワーの差分が小さいほど、エコー消去の配分を引き下げ、エコー抑圧の配分を引き上げることで、従来よりも残留エコーを減らす。 In the present embodiment, residual echo cancellation by this subtraction is combined with echo suppression by multiplication. Specifically, when the difference between the power of the collected sound signal and the power of the residual echo estimation value is small, the mixed mode of echo cancellation and suppression is entered. As described above, when the power difference is small, there is a high possibility that the phase error is not small, and even if the residual echo estimation value is subtracted by canceling the residual echo when the phase error is not small, the residual echo is often hardly reduced. . . On the other hand, when the power difference is small, the possibility of being in the double talk state is low, and the possibility of distortion of the transmission sound quality due to echo suppression is low. Therefore, in the mixed mode, the smaller the power difference, the lower the echo cancellation distribution and the higher the echo suppression distribution, thereby reducing the residual echo than before.
この処理の一例を図2をもちいて説明する。図2の横軸は周波数領域収音信号Y(f,j)のパワーY(f,j)2と残留エコー推定値Y^2(f,j)のパワーY^2(f,j)2の差分を周波数領域収音信号Y(f,j)のパワーY(f,j)2で割った値を表し、縦軸は残留エコー消去の分担比Rmxc(f,j)を表す。周波数領域収音信号Y(f,j)のパワーY(f,j)2と残留エコー推定値Y^2(f,j)のパワーY^2(f,j)2の差分が小さい状況を An example of this process will be described with reference to FIG. Power Y (f, j) 2 and the residual echo estimate Y ^ 2 (f, j) power Y ^ 2 (f, j) of the horizontal axis in FIG. 2 is a frequency domain sound pickup signal Y (f, j) 2 Is divided by the power Y (f, j) 2 of the frequency domain collected signal Y (f, j), and the vertical axis represents the share ratio R mxc (f, j) of residual echo cancellation. Frequency domain sound collection signal Y (f, j) power Y (f, j) 2 and residual echo estimate Y ^ 2 (f, j) power Y ^ 2 (f, j) of the second difference is smaller situation
で検出する。ただし Detect with. However,
である。ここでp_hyb_range_upperは検出用の閾値であり、−20〜−10dBの範囲で値を設定する。また、MAX(a,b)はaとbで大きい方の値を返す関数であり、残留エコーが大きめに推定されるとき(残留エコー推定値Y^2(f,j)のパワーY^2(f,j)2が周波数領域収音信号Y(f,j)のパワーY(f,j)2以上のとき)、関数Jは0を返す。 It is. Here, p_hyb_range_upper is a threshold value for detection, and a value is set in a range of −20 to −10 dB. MAX (a, b) is a function that returns the larger value of a and b. When the residual echo is estimated to be larger (the power Y ^ 2 of the residual echo estimate Y ^ 2 (f, j) (f, j) power Y (f, j) of 2 frequency domain sound pickup signal Y (f, j) 2 or more time), function J returns 0.
差分が小さい状況では、残留エコー消去の分担比Rmxc(f,j)を In situations where the difference is small, the residual echo cancellation share ratio R mxc (f, j) is
で計算する。ここで、パラメータp_cancel_allotted_minは、残留エコー消去の分担が最小になるときの比率であり、0から1の範囲の値を設定する。 Calculate with Here, the parameter p_cancel_allotted_min is a ratio when the share of residual echo cancellation is minimized, and a value in the range of 0 to 1 is set.
残りの(1-Rmxc(f,j))を、残留エコー抑圧が分担する。抑圧量は振幅換算で Residual echo suppression shares the remaining (1-R mxc (f, j)). The amount of suppression is converted to amplitude
になり、エコー抑圧ゲインGmxs(f,j)として、例えば、 Echo suppression gain G mxs (f, j)
をもちいることができる。 Can be used.
以下、上述の処理を実現するための構成について説明する。 Hereinafter, a configuration for realizing the above-described processing will be described.
<第一実施形態>
<エコー消去装置100>
図3は第一実施形態に係るエコー消去装置100の機能ブロック図の例を、図4はその処理フローを示す。図3及び図4を用いて第一実施形態に係るエコー消去装置100を説明する。M個のスピーカ21,…,2MとN個のマイクロホン31,…,3Nが共通の音場に配置され、スピーカ21,…,2Mからそれぞれ受話信号x1(k),…,xM(k)を再生した場合に、エコー消去装置100は、M×N本のエコー経路hmn(k)を介してマイクロホンに回り込む再生音(エコー)を消去する。より詳しく説明すると、エコー消去装置100内の残留エコー消去部16nは、マイクロホン3nにM本のエコー経路hmn(k)を介して回り込む再生音(エコー)を消去する。エコー消去装置100は、受話側の全Mチャネルの受話端子11,…,1Mと、送話側の全Nチャネルの送話端子41,…,4Nと、マイクロホン31,…,3Nとが接続されており、受話信号x1(k),…,xM(k)及び収音信号y1(k),…,yN(k)が入力され、送話信号v1(k),…,vN(k)をそれぞれ送話端子41,…,4Nに出力する。
<First embodiment>
<
FIG. 3 shows an example of a functional block diagram of the
エコー消去装置100は、N個の残留エコー消去部161,…,16Nを含む。
The
<残留エコー消去部16n>
残留エコー消去部16nは、受話側の全Mチャネルの受話端子11,…,1Mと、送話側の1チャネルの送話端子4nと、マイクロホン3nとが接続されており、Mチャネルの受話信号x1(k),…,xM(k)及び1チャネルの収音信号yn(k)が入力され、1チャネルの送話信号vn(k)を送話端子4nに出力する。なお、各図において、yn(k)をy(k)とし、vn(k)をv(k)とし、h1n(k),…,hMn(k)をそれぞれh1(k),…,hM(k)として表す。また、各図において、第nチャネルの処理部についてのみ説明する。他のマイクロホンからの収音信号についても同様の処理を行うことができ、第nチャネルの処理部の構成を並列に並べるだけでよいため、説明を省略する。
<Residual echo canceller 16n >
The residual
残留エコー消去部16nは、M個の周波数領域変換部1611,…,161Mと、周波数領域変換部162と、残留エコー推定部16Aと、残留エコー消去抑圧部169と、時間領域変換部168とを含む。
The residual
残留エコー推定部16Aは、入出力相関係数算出部163と、入出力伝達特性推定部164と、残留エコー予測部165と、残留エコー補正部166とを含む(図5参照)。
The residual
残留エコー消去抑圧部169は、消去抑圧配分制御部1691と、消去配分設定部1692と、減算部1693と、抑圧部1694とを含む(図6参照)。
The residual echo
<周波数領域変換部1611,…,161Mと周波数領域変換部162>
図3及び図4に示すように、周波数領域変換部1611,…,161Mは、それぞれ受話信号x1(k),…,xM(k)を入力とし、これを短時間区間毎に周波数領域の信号である周波数領域受話信号X1(f,j),…,XM(f,j)に変換し、出力する(s161)。同様に、周波数領域変換部162は、マイクロホン3nで収音した収音信号y(k)を入力とし、短時間区間毎に周波数領域の信号である周波数領域収音信号Y(f,j)に変換し出力する(s162)。なお、以下において、収音信号y(k)のことを、後述する第二収音信号u(k)と区別するために第一収音信号y(k)ともいう。
<
As shown in FIGS. 3 and 4, the
各信号を1フレーム=2Lサンプルとし、L/Dサンプル毎にブロック化し、L/Dサンプルずつずらして、フレームを作成する場合について説明する。但し、Lは1以上の整数であり、DはLを割り切ることができる整数であり、jはフレーム番号を表し、時刻k=jL/Dである。fは周波数番号を表し、例えば、fはサンプリング周波数fsの半分をL等分した離散点(周波数ビン)に対応し、f=0,1,…,L-1であり、f=0は周波数0に対応し、f=1は周波数(1/L)fs/2に対応し、…、f=L-1は((L-1)/L)fs/2に対応する。
A case will be described in which each signal is set to 1 frame = 2 L samples, the L / D samples are blocked, and the L / D samples are shifted to create a frame. However, L is an integer greater than or equal to 1, D is an integer which can divide L, j represents a frame number, and is time k = jL / D. f represents a frequency number. For example, f corresponds to a discrete point (frequency bin) obtained by dividing half of the sampling frequency f s into L equal parts, and f = 0, 1,..., L−1, and f = 0 is Corresponding to
周波数領域への変換は例えば、FFT(Fast Fourier transform)やDFT(discrete Fourier transform)により行い、計算を簡略化・高速化するために、Lを2のべき乗にとることが好ましい。例えば、L=64〜1024、D=2〜8等とする。フレーム長(1フレームに含まれるサンプル数)を10ms〜20msに対応するように設定すればよい。 The conversion to the frequency domain is performed by, for example, FFT (Fast Fourier transform) or DFT (discrete Fourier transform), and it is preferable to set L to a power of 2 in order to simplify and speed up the calculation. For example, L = 64 to 1024, D = 2 to 8 and the like. The frame length (number of samples included in one frame) may be set so as to correspond to 10 ms to 20 ms.
<残留エコー推定部16A>
残留エコー推定部16Aは、周波数領域収音信号Y(f,j)と周波数領域受話信号X1(f,j),…,XM(f,j)とを受け取り、これらの値を用いて、周波数領域収音信号Y(f,j)に含まれる残留エコーの位相と振幅とを考慮し、残留エコーの推定値(以下、残留エコー推定値ともいう)Y^2(f,j)を求め(s16A)、出力する。図7は残留エコー推定部16Aの処理フローの例を示す。図5及び図7を用いて、残留エコー推定部16Aの処理を説明する。
<Residual
The residual
<入出力相関係数算出部163>
入出力相関係数算出部163は、周波数領域受話信号X1(f,j),…,XM(f,j)と周波数領域収音信号Y(f,j)とを入力とし、これらの値を用いて、第mチャネルの周波数領域受話信号Xm(f,j)のパワースペクトルPmm(f,j)と、第mチャネルの周波数領域受話信号Xm(f,j)と第m’(但し、m’=1,…,Mであり、m≠m’である)チャネルの周波数領域受話信号Xm’(f,j)とのクロススペクトルPm’m(f,j)と、第m’チャネルの周波数領域受話信号Xm’(f,j)と周波数領域収音信号Y(f,j)とのクロススペクトルQm’(f,j)とを求め、出力する(s163)。
<Input / output correlation
The input / output correlation
なお、各クロススペクトル及びパワースペクトルは、時刻k=jL/Dにおける値である。パワースペクトルPmm(f,j)は入力信号(第mチャネルの周波数領域受話信号Xm(f,j))の自己相関係数を表し、クロススペクトルPm’m(f,j)は入力信号(第mチャネルの周波数領域受話信号Xm(f,j)と第m’チャネルの周波数領域受話信号Xm’(f,j))間の相関係数を表す。上述のパワースペクトルPmm(f,j)とクロススペクトルPm’m(f,j)からなる行列を入力信号の相関係数P(f,j)として、以下のように表す。 Each cross spectrum and power spectrum are values at time k = jL / D. The power spectrum P mm (f, j) represents the autocorrelation coefficient of the input signal (frequency domain received signal X m (f, j) of the m-th channel), and the cross spectrum P m'm (f, j) is the input The correlation coefficient between the signals (the frequency domain received signal X m (f, j) of the m-th channel and the frequency domain received signal X m ′ (f, j) of the m-th channel) is represented. The matrix composed of the power spectrum P mm (f, j) and the cross spectrum P m′m (f, j) described above is represented as the correlation coefficient P (f, j) of the input signal as follows.
一方、クロススペクトルQm’(f,j)は、入力信号(第m’チャネルの周波数領域受話信号Xm’(f,j))と出力信号(周波数領域収音信号Y(f,j))との間の相関係数を表し、入出力間の相関係数Q(f,j)を On the other hand, the cross spectrum Q m ′ (f, j) includes an input signal (frequency domain received signal X m ′ (f, j) of the mth channel) and an output signal (frequency domain collected signal Y (f, j)). ) And the correlation coefficient between input and output Q (f, j)
と表す。図8を用いて入出力相関係数算出部163を説明する。例えば、入出力相関係数算出部163はパワースペクトル算出部163aと、受話信号間クロススペクトル算出部163bと、入出力信号間クロススペクトル算出部163cを有する。
It expresses. The input / output correlation
パワースペクトル算出部163aは、第mチャネルの周波数領域受話信号Xm(f,j)を用いて、パワースペクトルPmm(f,j)を算出する。
The power
受話信号間クロススペクトル算出部163bは、M個の周波数領域受話信号X1(f,j),…,XM(f,j)を用いて、第mチャネルの周波数領域受話信号Xm(f,j)と第m’チャネルの周波数領域受話信号Xm’(f,j)間のクロススペクトルPm’m(f,j)を算出する。
The inter-received signal cross
入出力信号間クロススペクトル算出部163cは、M個の周波数領域受話信号X1(f,j),…,XM(f,j)と周波数領域収音信号Y(f,j)とを用いて、M個の周波数領域受話信号X1(f,j),…,XM(f,j)と周波数領域収音信号Y(f,j)間のクロススペクトルQm’(f,j)を算出する。
The input / output signal cross
例えば、Pmm(f,j),Pm’m(f,j),Qm’(f,j)は、時刻k=jL/Dにおける第mチャネルの周波数領域受話信号Xm(f,j)と周波数領域収音信号Y(f,j)からそれぞれ以下の式(3)、(4)、(5)により算出する。 For example, P mm (f, j), P m′m (f, j), Q m ′ (f, j) is the frequency domain received signal X m (f, j) of the m-th channel at time k = jL / D. It is calculated from the following equations (3), (4), and (5) from j) and the frequency domain sound pickup signal Y (f, j), respectively.
X*はXの複素共役を、E[ ]は平均をとることを意味する。平均処理の一例としては、 X * means the complex conjugate of X, and E [] means the average. As an example of the averaging process,
のように、1フレーム前の処理結果と0〜1の値をとる平滑化定数βを用いる方法や過去の数フレームに時定数を乗じて求める方法等が考えられる。Pmm(f,j)及びQm’(f,j)についても同様の方法により求めることができる。 As described above, a method using a smoothing constant β which takes a processing result of one frame before and a value of 0 to 1, a method of multiplying several past frames by a time constant, and the like can be considered. P mm (f, j) and Q m ′ (f, j) can also be obtained by the same method.
<入出力伝達特性推定部164>
入出力伝達特性推定部164は、パワースペクトルPmm(f,j)とクロススペクトルPm’m(f,j)、Qm’(f,j)とを入力とし、これらの値を用いて、M個の周波数領域受話信号X1(f,j),…,XM(f,j)と周波数領域収音信号Y(f,j)との入出力伝達特性の推定値G(f,j)=[G1(f,j),…,GM(f,j)]Tを周波数毎に推定し、出力する(s164)。
<Input / output transfer
The input / output transfer
例えば、入出力伝達特性推定部164は、入出力伝達特性の推定値G(f,j)を以下の式(7)により推定する。
For example, the input / output transfer
なお上記パワースペクトルとクロススペクトルからなる行列について、逆行列計算を安定化するために、対角成分に微小定数δを加えて、 For the matrix composed of the power spectrum and cross spectrum, in order to stabilize the inverse matrix calculation, a small constant δ is added to the diagonal component,
としてもよい。 It is good.
<残留エコー予測部165>
残留エコー予測部165は、M個の周波数領域受話信号X1(f,j),…,XM(f,j)と入出力伝達特性の推定値G(f,j)とを入力とし、これらの値から、周波数領域収音信号Y(f,j)に含まれる残留エコー成分を予測し、推定値Y^(f,j)を出力する(s165)。
<Residual
The residual
例えば、残留エコー推定値Y^(f,j)を、 For example, the residual echo estimate Y ^ (f, j)
として予測する。 To predict.
なお、式(3)〜(5)により入出力相関係数P(f,j)、Q(f,j)を求める際に、残留エコー成分の位相が考慮されている。さらに、式(7)または(7’)により、入出力相関係数P(f,j)、Q(f,j)から入出力伝達特性の推定値G(f,j)を求める際に、残留エコー成分の位相及び振幅が考慮されており、残留エコー推定部16Aは、残留エコーの位相及び振幅を考慮し、残留エコー推定値Y^(f,j)を求めていると言える。
It should be noted that the phase of the residual echo component is taken into account when obtaining the input / output correlation coefficients P (f, j) and Q (f, j) by the equations (3) to (5). Furthermore, when obtaining the estimated value G (f, j) of the input / output transfer characteristic from the input / output correlation coefficient P (f, j), Q (f, j) by the equation (7) or (7 ′), The phase and amplitude of the residual echo component are taken into account, and it can be said that the residual
<残留エコー補正部166>
残留エコー補正部166は、周波数領域収音信号Y(f,j)と残留エコー推定値Y^(f,j)とを入力とし、これを用いて、残留エコー推定値Y^(f,j)を補正して補正後の残留エコー推定値Y2^(f,j)を求め、出力する(s166)。補正後の残留エコー推定値Y2^(f,j)は例えば、以下の式により、求めることができる。
<Residual
The residual
但し、Tは各スペクトルの推定の自由度の数であり、入出力相関係数算出部163において、パワースペクトルPmm(f,j)及びクロススペクトルPm’m(f,j)、Qm’(f,j)を算出するときのフレーム数が、これに該当する。T-2M>0になるように、利用に先立ち、または、受話信号のチャネル数Mを設定後に、Tに適切な値が設定される。なお、式(11)の結果、比率η(f,j)<0となる場合には、式(12)において、η(f)=0を代わりに用いる。
However, T is the number of degrees of freedom of estimation of each spectrum, and in the input / output correlation
なお、図示しない記憶部にコヒーレンスの推定値γ^2(f)と式(11)により定義される比率η(f)との対応付けを記憶しておいてもよい。このような構成により、式(11)の計算時間を短縮できる。つまり、残留エコー補正部166は、周波数領域収音信号Y(f,j)と残留エコー推定値Y^(f,j)とを用いて、式(9)、(10)を計算し、コヒーレンスの推定値γ^2(f)を求め、図示しない記憶部から求めた推定値γ^2(f)に対応する比率η(f)を取り出し、残留エコー推定値Y^(f,j)に乗じて(式(12)参照)、補正後の残留エコー推定値Y2^(f,j)を求め、出力すればよい。別の言い方をすると、MおよびTは事前に分かっている定数であり、比率η(f)は、0から1の間をとる推定値γ^2(f)の関数とみなせる。すなわち比率η(f)を推定値γ^2(f)の関数とみて、事前に計算して表を作成できる。実際の信号処理では、この表を引いて比率η(f)を求めることで、√を計算することなくη(f)を効率良く求められる。
A storage unit (not shown) may store a correspondence between the estimated coherence value γ ^ 2 (f) and the ratio η (f) defined by the equation (11). With such a configuration, the calculation time of Expression (11) can be shortened. That is, the residual
<残留エコー消去抑圧部169>
残留エコー消去抑圧部169は、補正後の残留エコー推定値Y2^(f,j)と周波数領域収音信号Y(f,j)とを受け取り、周波数領域収音信号Y(f,j)から補正後の残留エコー推定値Y2^(f,j)を消去し、抑圧し(s169)、周波数領域の送話信号V(f,j)を求め、出力する。なお、周波数領域収音信号Y(f,j)から補正後の残留エコー推定値Y2^(f,j)を引いて差を求め、その差が小さいほど、周波数領域収音信号Y(f,j)から残留エコーを抑圧する割合を増やし、残留エコーを消去する割合を減らす。例えば、エコー抑圧ゲインをGmxs(f,j)とし、残留エコーを消去する割合を分担比Rmxc(f,j)とし、送話信号V(f,j)を
<Residual
The residual echo
として求める。このような構成により、エコー消去とエコー抑圧との配分を、残留エコーを消去するために適切に設定することができる。なお、エコー抑圧ゲインGmxs(f,j)、分担比Rmxc(f,j)の設定例については、後述する消去抑圧配分制御部1691において説明する。図9は残留エコー消去抑圧部169の処理フローの例を示す。図6及び図9を用いて、残留エコー消去抑圧部169の処理を説明する。
Asking. With such a configuration, the distribution of echo cancellation and echo suppression can be set appropriately in order to cancel the residual echo. An example of setting the echo suppression gain G mxs (f, j) and the sharing ratio R mxc (f, j) will be described in the erasure suppression
<消去抑圧配分制御部1691>
周波数領域収音信号Y(f,j)のパワーと推定した残留エコー推定値Y2^(f,j)のパワーとの差分が小さいときに、エコー消去及び抑圧の混合モードに入る。混合モードでは差分が小さいほど、エコー消去の配分を引き下げ、エコー抑圧の配分を引き上げる。
<Erasure Suppression
When the difference between the power of the frequency domain collected signal Y (f, j) and the estimated residual echo estimated value Y 2 ^ (f, j) is small, the mixed mode of echo cancellation and suppression is entered. In the mixed mode, the smaller the difference, the lower the echo cancellation distribution and the higher the echo suppression distribution.
この処理の一例を図2をもちいて説明する。周波数領域収音信号Y(f,j)のパワーY(f,j)2と残留エコー推定値Y2^(f,j)のパワーY2^(f,j)2の差分が小さい状況を An example of this process will be described with reference to FIG. Frequency domain sound collection signal Y (f, j) power Y (f, j) 2 and residual echo estimate Y 2 ^ (f, j) power Y 2 ^ (f, j) of the second difference is smaller situation
で検出する。ただしp_hyb_range_upperは検出用の閾値であり、−20〜−10dBの範囲で値を設定する。またMAX(a,b)はaとbで大きい方の値を返す関数であり、残留エコーが収音信号より大きく推定されるとき、関数Jは0を返す。 Detect with. However, p_hyb_range_upper is a threshold value for detection, and a value is set in the range of -20 to -10 dB. MAX (a, b) is a function that returns the larger value of a and b. When the residual echo is estimated larger than the collected sound signal, the function J returns 0.
残留エコー消去の分担比 Rmxc(f,j)は
The share ratio of residual echo cancellation R mxc (f, j) is
で計算され、消去配分設定部1692に設定される。残りの(1-Rmxc(f,j))が残留エコー抑圧の適用分になり、抑圧量は振幅換算で|Y2^(f,j)|(1-Rmxc(f,j))になる。エコー抑圧ゲインの一例として、
And is set in the erasure
をもちいることができ、これが抑圧部1694に設定される。
This is set in the
なおパラメータp_cancel_allotted_minは、残留エコーを消去する最小の割合であり、0から1の範囲の値を設定する。 The parameter p_cancel_allotted_min is the minimum ratio for canceling the residual echo, and a value in the range of 0 to 1 is set.
また収音信号パワーと残留エコー信号パワーの差分が小さくないとき、すなわち、p_cancel_allotted_min≦J(Y(f,j),Y^2(f,j))のとき、Rmxc(f,j)=1に設定する。このときGmxs(f,j)=1となり、残留エコー消去のみが有効になる。 Also, when the difference between the collected signal power and the residual echo signal power is not small, that is, p_cancel_allotted_min ≦ J (Y (f, j), Y ^ 2 (f, j)), R mxc (f, j) = Set to 1. At this time, G mxs (f, j) = 1, and only residual echo cancellation is valid.
つまり、消去抑圧配分制御部1691は、周波数領域収音信号Y(f,j)と、残留エコー推定値Y^2(f,j)とを受け取り、それぞれのパワーを求め、周波数領域収音信号Y(f,j)のパワーY(f,j)2から残留エコー推定値Y^2(f,j)のパワーY^2(f,j)2を引いて差(Y(f,j)2-Y^2(f,j)2)を求め、差(Y(f,j)2-Y^2(f,j)2)が所定の閾値p_hyb_range_upperより小さいときは、分担比Rmxc(f,j)を
That is, the erasure suppression
とし、差(Y(f,j)2-Y^2(f,j)2)が所定の閾値p_hyb_range_upper以上のときは、分担比Rmxc(f,j)を1とし、分担比Rmxc(f,j)を消去配分設定部1692に出力する(s1691)。さらに、消去抑圧配分制御部1691は、式(13)により、周波数領域収音信号Y(f,j)と、残留エコー推定値Y^2(f,j)と分担比Rmxc(f,j)とからエコー抑圧ゲインGmxs(f,j)を求め、抑圧部1694に出力する。
When the difference (Y (f, j) 2 -Y ^ 2 (f, j) 2 ) is greater than or equal to a predetermined threshold p_hyb_range_upper, the sharing ratio R mxc (f, j) is set to 1, and the sharing ratio R mxc ( f, j) is output to the erasure distribution setting unit 1692 (s1691). Further, the erasure suppression
<消去配分設定部1692>
消去配分設定部1692は、残留エコー推定値Y^2(f,j)と分担比Rmxc(f,j)とを受け取り、これらの積Y^2(f,j)Rmxc(f,j)を求め(s1692)、出力する。なお、この処理が、残留エコー消去の割合を設定する処理に相当する。
<Erase
The erasure
<減算部1693>
減算部1693は、周波数領域収音信号Y(f,j)と積Y^2(f,j)Rmxc(f,j)とを受け取り、周波数領域収音信号Y(f,j)から積Y^2(f,j)Rmxc(f,j)を引き、差{Y(f,j)-Y^2(f,j)Rmxc(f,j)}を求め(s1693)、出力する。なお、この処理が、残留エコー消去処理に相当する。
<
The
<抑圧部1694>
抑圧部1694は、差{Y(f,j)-Y^2(f,j)Rmxc(f,j)}とエコー抑圧ゲインGmxs(f,j)とを受け取り、積Gmxs(f,j){Y(f,j)-Y^2(f,j)Rmxc(f,j)}を求め(s1694)、この積を周波数量器の送話信号V(f,j)として、出力する。なお、この処理が、残留エコー抑圧処理に相当する。
<
The
よって、残留エコー消去抑圧部169は、例えば、以下の式(14)により、送話信号V(f,j)を求める。
Therefore, the residual echo
<時間領域変換部168>
図3及び図4に示すように、時間領域変換部168は、周波数領域の送話信号V(f,j)を入力とし、この信号を時間領域の信号v(k)に変換し、これをエコー消去装置100の出力値として出力する(s168)。なお、時間領域変換部168では、周波数領域変換部161m及び162において用いた周波数領域変換方法に対応する時間領域変換方法を用いればよい。
<Time
As shown in FIG. 3 and FIG. 4, the time
<効果>
このような構成によって、残留エコーパワーと収音信号パワーが同等だが、補正した残留エコー推定値の位相誤差が小さくないために残留エコー消去処理の効果が薄い状況でも、従来よりも残留エコーを抑えることができる。
<Effect>
With such a configuration, the residual echo power is equal to the collected signal power, but the residual echo is suppressed more than before even in the situation where the residual echo cancellation processing is less effective because the phase error of the corrected residual echo estimate is not small. be able to.
<変形例>
第一実施形態では、主にM>1のときについて説明しているが、M=1であってもよい。この場合、入出力相関係数算出部163では、第mチャネルの周波数領域受話信号Xm(f,j)と第m’チャネルの周波数領域受話信号Xm’(f,j)とのクロススペクトルPm’m(f,j)を求める必要はなくなる。入出力伝達特性推定部164では、パワースペクトルP11(f,j)とクロススペクトルQ1(f,j)とを用いて、周波数領域受話信号X1(f,j)と周波数領域収音信号Y(f,j)との入出力伝達特性の推定値G(f,j)を周波数毎に推定し、出力する。
<Modification>
In the first embodiment, the case where M> 1 is mainly described. However, M = 1 may be used. In this case, the input / output correlation
残留エコー推定部16Aは、周波数領域収音信号Y(f,j)に含まれる残留エコーの位相と振幅とを考慮し、残留エコー推定値を求めるものであれば他の構成であってもよい。例えば、残留エコー推定部16Aは、残留エコー補正部166を含まず、残留エコー予測部165の出力値(推定値Y^(f,j))を残留エコー推定部16Aの出力値として用いてもよい。
The
また、本実施形態のポイントは、残留エコー推定値の位相誤差が小さくないために残留エコー消去処理の効果が薄い状況においても、残留エコー消去と、エコー抑圧を組み合わせることで残留エコーを抑える点である。そのため、残留エコー消去部16nは、少なくとも、残留エコー推定部16Aと残留エコー消去抑圧部169とを含めばよく、他の構成(例えば、M個の周波数領域変換部1611,…,161M、周波数領域変換部162及び時間領域変換部168)は必ずしも含まなくともよい。
The point of this embodiment is that the residual echo can be suppressed by combining residual echo cancellation and echo suppression even in a situation where the effect of residual echo cancellation is weak because the phase error of the residual echo estimation value is not small. is there. Therefore, the residual echo cancellation unit 16n may include at least the residual
<第二実施形態>
第一実施形態と異なる部分を中心に説明する。
<Second embodiment>
A description will be given centering on differences from the first embodiment.
<エコー消去装置200>
図10及び図11を用いて第二実施形態に係るエコー消去装置200を説明する。エコー消去装置200は、N個のエコー消去部281,…,28NとN個の残留エコー消去部261,…,26Nを含み、残留エコー消去部26nの前段にエコー消去部28nを設ける。
<
An
<エコー消去部28n>
エコー消去部28nには、受話端子11,…,1Mと、残留エコー消去部26nと、マイクロホン3nとが接続されており、受話信号x1(k),…,xM(k)及び第一収音信号yn(k)が入力され、1チャネルの第二収音信号un(k)を残留エコー消去部26nに出力する。なお、第一収音信号からエコー成分を消去した誤差信号を便宜的に第二収音信号と呼ぶ。
<Echo canceling
The
エコー消去部28nは、受話信号x1(k),…,xM(k)を適応フィルタでフィルタリングし、予測エコー信号y’(k)を生成し、さらに、マイクロホン3nで収音した第一収音信号y(k)と予測エコー信号y’(k)との差分を第二収音信号u(k)として求め、第二収音信号u(k)と受話信号x1(k),…,xM(k)とに基づき、適応フィルタのフィルタ係数h’(k)を更新する(s28)。
The
以下、図12及び図13を用いて、詳細を説明する。エコー消去部28nは、エコー予測部281と減算部282とエコー経路推定部283とを有する。
Details will be described below with reference to FIGS. 12 and 13. The
エコー消去部28nの処理内容を説明するために、まず、受話信号と第一収音信号との関係を説明する。スピーカ21,…,2Mからマイクロホン3nまでのエコー経路のインパルス応答をh1,…,hM(k)とし、その長さをL1とすると、受話信号x1(k),…,xM(k)と第一収音信号y(k)の間には次の関係がある。
To illustrate the processing of the
第mチャネルのインパルス応答hmと受話信号xmを
hm=[hm(0)…hm(L1-1)]T (22)
xm=[xm(0)…xm(L1-1)]T (23)
として、ベクトル化すると、受話信号x1(k),…,xM(k)と第一収音信号y(k)の関係は次のように記述される。
M-th channel impulse response h m and received signal x m
h m = [h m (0)… h m (L 1 -1)] T (22)
x m = [x m (0)… x m (L 1 -1)] T (23)
As a vector, the relationship between the received signal x 1 (k),..., X M (k) and the first collected signal y (k) is described as follows.
y(k)=h1 Tx1(k)+…+hM TxM(k) (24)
但し、Tは転置を表す。
y (k) = h 1 T x 1 (k) +… + h M T x M (k) (24)
However, T represents transposition.
<エコー予測部281>
エコー予測部281は、適応フィルタによる予測エコー経路に受話信号x1(k),…,xM(k)を入力して予測エコー信号y’(k)を生成し、出力する(s281)。エコー予測部281は適応フィルタによって構成され、受話状態における減算部282の誤差信号が最小となるように後述するエコー経路推定部283で適応フィルタの特性が制御される。
<
The
例えば、第mチャネルの適応フィルタのフィルタ係数を
h'm=[h'm(0)…h'm(LE-1)]T (25)
とし、予測エコー信号
y'(k)=h'1 Tx1(k)+…+h'M TxM(k) (26)
を生成する。但し、LEは適応フィルタのタップ長を表す。エコー予測部281は、生成した予測エコー信号y’(k)を減算部282に出力する。なお、例えば、適応フィルタのタップ長は100〜300ms程度に設定されることが多い。
For example, the filter coefficient of the adaptive filter of the mth channel is
h ' m = [h' m (0)… h ' m (L E -1)] T (25)
And the predicted echo signal
y '(k) = h' 1 T x 1 (k) +… + h ' M T x M (k) (26)
Is generated. However, L E represents a tap length of the adaptive filter. The
<減算部282>
減算部282は、第一収音信号y(k)と予測エコー信号y’(k)を入力とし、第一収音信号y(k)から予測エコー信号y’(k)を差し引き、第二収音信号u(k)を求める(s282)。
<
The
u(k)=y(k)-y'(k) (27)
求めた第二収音信号u(k)をエコー経路推定部283と残留エコー消去部26n内の周波数領域変換部262に出力する。
u (k) = y (k) -y '(k) (27)
And it outputs the obtained second sound pickup signal u (k) of the frequency
<エコー経路推定部283>
エコー経路推定部283は、第二収音信号u(k)と受話信号x1(k),…,xM(k)を入力とし、これらを用いて、適応フィルタのフィルタ係数h’(k)を更新し、出力する(s283)。適応フィルタの係数修正法としてNormalized Least Mean Squareアルゴリズム(NLMSアルゴリズム)を用いた場合を、以下の式(28)により、フィルタ係数を更新する。
<Echo
The echo
h'm(k+1)=h'm(k)+μu(k)xm(k) (28)
但し、μはステップサイズであり、
h ' m (k + 1) = h' m (k) + μu (k) x m (k) (28)
Where μ is the step size,
により決定される。なお、μ0は入力信号のパワーに基づいて制御され、安定した推定を行うために、予め0〜1の値に設定されるパラメータである。エコー経路推定部283は、更新したフィルタ係数h’(k+1)をコピーして、エコー予測部281に出力する。なお、フィルタ係数の更新方法は上述の方法に限定されるものではなく、他の更新方法を用いてもよい。
Determined by. Note that μ 0 is a parameter that is controlled based on the power of the input signal and is preset to a value of 0 to 1 in order to perform stable estimation. The echo
<残留エコー消去部26n>
第一実施形態の残留エコー消去部16nにおいて第一収音信号yn(k)を用いて行っていた処理を、残留エコー消去部26nにおいて上述の第二収音信号un(k)を用いて行う。例えば、周波数領域変換部262において、第二収音信号u(k)を周波数領域の信号U(f,j)に変換し、この信号を用いて残留エコー推定部26Aと残留エコー消去抑圧部269において各処理を行う。また、残留エコー推定部26Aで行われる処理は、第一実施形態と同様であるが、推定する残留エコー推定値U^2(f,j)は、第一収音信号yn(k)に含まれる残留エコー推定値ではなく、第二収音信号un(k)に含まれる残留エコー推定値である。残留エコー消去部26nは、第一収音信号yn(k)に含まれる残留エコー成分ではなく、第二収音信号un(k)に含まれる残留エコー成分を消去する。
<
The processing performed using the first collected sound signal y n (k) in the residual
<効果>
このような構成により、第一実施形態と同様の効果を得ることができる。エコー経路に大きな変動がない場合には、前段のエコー消去部28nにおいて、精度の高いエコー経路の推定が可能となるため、送話品質が向上する。また、エコー経路が大きく変動した場合には、エコー消去部28nにおいて行われるエコー経路の推定が安定するまで、後段の残留エコー消去部26nにおいて、残留エコー成分を消去することができる。よって、適応フィルタのみを用いてエコー消去を行う装置(例えば、図1の多チャネルエコー消去装置80)に比べ、エコー経路安定時及び変動時を通じて、高い送話品質を維持することができる。
<Effect>
With such a configuration, the same effect as that of the first embodiment can be obtained. When there is no large fluctuation in the echo path, the
<変形例>
本実施形態では、時間領域の信号(受話信号x1(k),…,xM(k)及び第二収音信号un(k))を用いて適応フィルタを更新しているが、周波数領域または波数領域の信号を用いて適応フィルタを更新してもよい(参考文献2参照)。
(参考文献2)特開2013−255155号公報
<Modification>
In this embodiment, the adaptive filter is updated using signals in the time domain (received signals x 1 (k),..., X M (k) and the second collected sound signal u n (k)). The adaptive filter may be updated using a signal in the domain or wave number domain (see Reference 2).
(Reference document 2) JP2013-255155A
その場合、エコー消去部28nの計算過程で得られる周波数領域の信号(X1(f,j),…,XM(f,j)及びUn(f,j)を時間領域の信号に変換せずにそのまま残留エコー消去部26nに出力する構成としてもよい。その場合、残留エコー消去部26nは、周波数領域変換部1611,…,161M及び周波数領域変換部262を含まなくともよい。また、適応フィルタの計算コストは大きいので、エコー消去部28nのエコー消去処理については、一部の周波数(例えば、聴覚的な影響の強い周波数300Hz〜3.4kHzや100Hz〜7kHz)においてのみ行い、残留エコー消去部26nの残留エコー消去処理については、全ての周波数で行う構成としてもよい。このような構成とすることで、効率よく、送話品質を向上させることができる。
In this case, the frequency domain signals (X 1 (f, j),..., X M (f, j) and U n (f, j)) obtained in the calculation process of the
<プログラム及び記録媒体>
また、上記の実施形態及び変形例で説明した各装置における各種の処理機能をコンピュータによって実現してもよい。その場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記各装置における各種の処理機能がコンピュータ上で実現される。
<Program and recording medium>
In addition, various processing functions in each device described in the above embodiments and modifications may be realized by a computer. In that case, the processing contents of the functions that each device should have are described by a program. Then, by executing this program on a computer, various processing functions in each of the above devices are realized on the computer.
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。 The program describing the processing contents can be recorded on a computer-readable recording medium. As the computer-readable recording medium, for example, any recording medium such as a magnetic recording device, an optical disk, a magneto-optical recording medium, and a semiconductor memory may be used.
また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD−ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させてもよい。 The program is distributed by selling, transferring, or lending a portable recording medium such as a DVD or CD-ROM in which the program is recorded. Further, the program may be distributed by storing the program in a storage device of the server computer and transferring the program from the server computer to another computer via a network.
このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶部に格納する。そして、処理の実行時、このコンピュータは、自己の記憶部に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実施形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよい。さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。なお、プログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの(コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等)を含むものとする。 A computer that executes such a program first stores, for example, a program recorded on a portable recording medium or a program transferred from a server computer in its storage unit. When executing the process, this computer reads the program stored in its own storage unit and executes the process according to the read program. As another embodiment of this program, a computer may read a program directly from a portable recording medium and execute processing according to the program. Further, each time a program is transferred from the server computer to the computer, processing according to the received program may be executed sequentially. Also, the program is not transferred from the server computer to the computer, and the above-described processing is executed by a so-called ASP (Application Service Provider) type service that realizes the processing function only by the execution instruction and result acquisition. It is good. Note that the program includes information provided for processing by the electronic computer and equivalent to the program (data that is not a direct command to the computer but has a property that defines the processing of the computer).
また、コンピュータ上で所定のプログラムを実行させることにより、各装置を構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。 In addition, although each device is configured by executing a predetermined program on a computer, at least a part of these processing contents may be realized by hardware.
<その他の変形例>
本発明は上記の実施形態及び変形例に限定されるものではない。例えば、上述の各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。その他、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。
<Other variations>
The present invention is not limited to the above-described embodiments and modifications. For example, the various processes described above are not only executed in time series according to the description, but may also be executed in parallel or individually as required by the processing capability of the apparatus that executes the processes. In addition, it can change suitably in the range which does not deviate from the meaning of this invention.
なお、請求項における周波数領域収音信号とは、マイクロホンで収音した第一収音信号から得られる周波数領域の信号であり、マイクロホンで収音した第一収音信号自体や、第一収音信号と予測エコー信号との差分として求められる第二収音信号を含む概念である。ただし、第一収音信号自体や第二収音信号が時間領域の信号の場合には、その信号を周波数領域の信号に変換したものである。さらに、第一または第二収音信号に対し多チャネルの受話信号の相互相関が変化するような工夫を施された信号(例えば、ノイズが負荷された信号、半波整流、遅延変動、レベル変動等の処理を施された信号)であってもよいし、第一収音信号に対し上述の工夫が施された信号と予測エコー信号との差分として求められる第二収音信号であってもよい。 The frequency domain collected signal in the claims is a signal in the frequency domain obtained from the first collected signal collected by the microphone, and the first collected signal itself collected by the microphone or the first collected sound signal. This is a concept including a second sound collection signal obtained as a difference between the signal and the predicted echo signal. However, when the first sound pickup signal itself or the second sound pickup signal is a signal in the time domain, the signal is converted into a signal in the frequency domain. Furthermore, a signal that has been devised so that the cross-correlation of the multi-channel received signal changes with respect to the first or second collected sound signal (for example, a signal loaded with noise, half-wave rectification, delay variation, level variation) Or a second sound pickup signal obtained as a difference between the signal obtained by performing the above-described contrivance on the first sound pickup signal and the predicted echo signal. Good.
Claims (8)
前記マイクロホンで収音した第一収音信号から得られる信号である周波数領域収音信号と、前記受話信号から得られる周波数領域の信号である周波数領域受話信号とを用いて、前記周波数領域収音信号に含まれる残留エコーの位相と振幅とを考慮し、残留エコー推定値を求める残留エコー推定部と、
前記周波数領域収音信号から前記残留エコー推定値を消去し、抑圧する残留エコー消去抑圧部とを含み、
前記残留エコー消去抑圧部は、前記周波数領域収音信号から前記残留エコー推定値を引いて差を求め、その差が小さいほど、前記周波数領域収音信号から残留エコーを抑圧する割合を増やし、残留エコーを消去する割合を減らす、
エコー消去装置。 One or more speakers and one or more microphones are arranged in a common sound field, and when an incoming signal is reproduced from the speakers, an echo canceller that cancels echoes that enter the microphone via an echo path. ,
Using the frequency domain collected signal that is a signal obtained from the first collected signal collected by the microphone and the frequency domain received signal that is a frequency domain signal obtained from the received signal, the frequency domain collected signal is used. Considering the phase and amplitude of the residual echo contained in the signal, a residual echo estimation unit for obtaining a residual echo estimate,
Canceling the residual echo estimation value from the frequency domain collected signal, including a residual echo cancellation suppression unit to suppress,
The residual echo cancellation suppression unit obtains a difference by subtracting the residual echo estimation value from the frequency domain collected signal, and increases the ratio of suppressing the residual echo from the frequency domain collected signal as the difference is smaller. Reduce the rate of echo cancellation,
Echo canceler.
前記残留エコー消去抑圧部は、
周波数のインデックスをfとし、フレームのインデックスをjとし、周波数領域収音信号をY(f,j)とし、残留エコー推定値をY^2(f,j)とし、残留エコーを消去する最小の割合をp_cancel_allotted_minとし、前記周波数領域収音信号のパワーY(f,j)2から前記残留エコー推定値のパワーY^2(f,j)2を引いて差を求め、前記差が所定の閾値p_hyb_range_upperより小さいときは、分担比Rmxc(f,j)を
とし、前記差が所定の閾値p_hyb_range_upper以上のときは、分担比Rmxc(f,j)を1とする消去抑圧配分制御部を含む、
エコー消去装置。 The echo canceller of claim 1 ,
The residual echo cancellation suppressor is
The frequency index is f, the frame index is j, the frequency domain collected signal is Y (f, j), the residual echo estimate is Y ^ 2 (f, j), and the smallest residual echo is eliminated. The ratio is p_cancel_allotted_min, and the difference Y is obtained by subtracting the power Y ^ 2 (f, j) 2 of the residual echo estimated value from the power Y (f, j) 2 of the frequency domain collected signal. If it is smaller than p_hyb_range_upper, set the sharing ratio R mxc (f, j)
And when the difference is equal to or greater than a predetermined threshold p_hyb_range_upper, an erasure suppression distribution control unit that sets the sharing ratio R mxc (f, j) to 1 is included
Echo canceler.
前記残留エコー消去抑圧部は、
周波数のインデックスをfとし、フレームのインデックスをjとし、エコー抑圧ゲインをGmxs(f,j)とし、周波数領域収音信号をY(f,j)とし、残留エコー推定値をY^2(f,j)とし、
残留エコーを消去する割合を分担比Rmxc(f,j)とし、送話信号V(f,j)を
として求める、
エコー消去装置。 The echo canceller of claim 1 or claim 2 ,
The residual echo cancellation suppressor is
The frequency index is f, the frame index is j, the echo suppression gain is G mxs (f, j), the frequency domain collected signal is Y (f, j), and the residual echo estimate is Y ^ 2 ( f, j),
The ratio of canceling the residual echo is the sharing ratio R mxc (f, j), and the transmission signal V (f, j) is
Asking,
Echo canceler.
前記エコー抑圧ゲインGmxs(f,j)は、
である、
エコー消去装置。 A echo canceller of 請 Motomeko 3,
The echo suppression gain G mxs (f, j) is
Is,
Echo canceler.
前記受話信号を適応フィルタでフィルタリングし、予測エコー信号を生成し、前記マイクロホンで収音した前記第一収音信号と前記予測エコー信号との差分を第二収音信号として求め、この第二収音信号と前記受話信号とに基づき適応フィルタのフィルタ係数を更新するエコー消去部と、をさらに含み、
前記周波数領域収音信号として周波数領域の前記第二収音信号を用いる、
エコー消去装置。 The echo canceller according to any one of claims 1 to 4,
The received signal is filtered by an adaptive filter to generate a predicted echo signal, and a difference between the first collected sound signal collected by the microphone and the predicted echo signal is obtained as a second collected sound signal. An echo canceler that updates a filter coefficient of the adaptive filter based on the sound signal and the received signal, and
Using the second sound collection signal in the frequency domain as the frequency domain sound collection signal,
Echo canceler.
前記マイクロホンで収音した第一収音信号から得られる信号である周波数領域収音信号と、前記受話信号から得られる周波数領域の信号である周波数領域受話信号とを用いて、前記周波数領域収音信号に含まれる残留エコーの位相と振幅とを考慮し、残留エコー推定値を求める残留エコー推定ステップと、
前記周波数領域収音信号から前記残留エコー推定値を消去し、抑圧する残留エコー消去抑圧ステップとを含み、
前記残留エコー消去抑圧ステップは、前記周波数領域収音信号から前記残留エコー推定値を引いて差を求め、その差が小さいほど、前記周波数領域収音信号から残留エコーを抑圧する割合を増やし、残留エコーを消去する割合を減らす、
エコー消去方法。 An echo canceling method in which one or more speakers and one or more microphones are arranged in a common sound field, and when an incoming signal is reproduced from the speakers, an echo that goes around the microphone via an echo path is canceled. ,
Using the frequency domain collected signal that is a signal obtained from the first collected signal collected by the microphone and the frequency domain received signal that is a frequency domain signal obtained from the received signal, the frequency domain collected signal is used. A residual echo estimation step for obtaining a residual echo estimate in consideration of the phase and amplitude of the residual echo contained in the signal;
Canceling the residual echo estimate from the frequency domain collected signal, and a residual echo cancellation suppressing step of suppressing,
The residual echo cancellation suppression step obtains a difference by subtracting the residual echo estimation value from the frequency domain collected signal, and the smaller the difference, the higher the ratio of suppressing the residual echo from the frequency domain collected signal. Reduce the rate of echo cancellation,
Echo cancellation method.
前記受話信号を適応フィルタでフィルタリングし、予測エコー信号を生成し、前記マイクロホンで収音した前記第一収音信号と前記予測エコー信号との差分を第二収音信号として求め、この第二収音信号と前記受話信号とに基づき適応フィルタのフィルタ係数を更新するエコー消去ステップと、をさらに含み、
前記周波数領域収音信号として周波数領域の前記第二収音信号を用いる、
エコー消去方法。 The echo cancellation method of claim 6,
The received signal is filtered by an adaptive filter to generate a predicted echo signal, and a difference between the first collected sound signal collected by the microphone and the predicted echo signal is obtained as a second collected sound signal. An echo cancellation step of updating a filter coefficient of an adaptive filter based on the sound signal and the received signal, and
Using the second sound collection signal in the frequency domain as the frequency domain sound collection signal,
Echo cancellation method.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015068888A JP6356087B2 (en) | 2015-03-30 | 2015-03-30 | Echo canceling apparatus, method and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015068888A JP6356087B2 (en) | 2015-03-30 | 2015-03-30 | Echo canceling apparatus, method and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016189548A JP2016189548A (en) | 2016-11-04 |
JP6356087B2 true JP6356087B2 (en) | 2018-07-11 |
Family
ID=57239972
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015068888A Active JP6356087B2 (en) | 2015-03-30 | 2015-03-30 | Echo canceling apparatus, method and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6356087B2 (en) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117135536B (en) * | 2023-03-29 | 2024-09-06 | 荣耀终端有限公司 | Echo cancellation method and electronic equipment |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3507020B2 (en) * | 2000-09-08 | 2004-03-15 | 日本電信電話株式会社 | Echo suppression method, echo suppression device, and echo suppression program storage medium |
US6925176B2 (en) * | 2003-06-27 | 2005-08-02 | Nokia Corporation | Method for enhancing the acoustic echo cancellation system using residual echo filter |
JP5036874B2 (en) * | 2008-09-24 | 2012-09-26 | 三菱電機株式会社 | Echo canceller |
JP5087024B2 (en) * | 2009-02-10 | 2012-11-28 | 日本電信電話株式会社 | Echo canceling apparatus, method and program |
JP5391103B2 (en) * | 2010-02-10 | 2014-01-15 | 日本電信電話株式会社 | Multi-channel echo canceling method, multi-channel echo canceling apparatus, multi-channel echo canceling program and recording medium therefor |
JP5662232B2 (en) * | 2011-04-14 | 2015-01-28 | 日本電信電話株式会社 | Echo canceling apparatus, method and program |
-
2015
- 2015-03-30 JP JP2015068888A patent/JP6356087B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2016189548A (en) | 2016-11-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5391103B2 (en) | Multi-channel echo canceling method, multi-channel echo canceling apparatus, multi-channel echo canceling program and recording medium therefor | |
JP5671147B2 (en) | Echo suppression including modeling of late reverberation components | |
JP4702372B2 (en) | Echo suppression method and apparatus | |
CN109727604A (en) | Frequency domain echo cancel method and computer storage media for speech recognition front-ends | |
JP5501527B2 (en) | Echo canceller and echo detector | |
JP4957810B2 (en) | Sound processing apparatus, sound processing method, and sound processing program | |
JPH09139696A (en) | Method and device for both adaptive identification and related adaptive echo canceler thereto | |
JP5662232B2 (en) | Echo canceling apparatus, method and program | |
JP2004349806A (en) | Multichannel acoustic echo canceling method, apparatus thereof, program thereof, and recording medium thereof | |
JP5469564B2 (en) | Multi-channel echo cancellation method, multi-channel echo cancellation apparatus and program thereof | |
CN112863532A (en) | Echo suppressing device, echo suppressing method, and storage medium | |
US20170310360A1 (en) | Echo removal device, echo removal method, and non-transitory storage medium | |
JP5762479B2 (en) | Voice switch device, voice switch method, and program thereof | |
JP2003188776A (en) | Acoustic echo erasing method and device, and acoustic echo erasure program | |
JP4413205B2 (en) | Echo suppression method, apparatus, echo suppression program, recording medium | |
JP3756828B2 (en) | Reverberation elimination method, apparatus for implementing this method, program, and recording medium therefor | |
JP2003309493A (en) | Method, device and program for reducing echo | |
JP6356087B2 (en) | Echo canceling apparatus, method and program | |
JP6143702B2 (en) | Echo canceling apparatus, method and program | |
JP2008060715A (en) | Echo canceller, method thereof, program thereof, and recording medium therefor | |
KR102045953B1 (en) | Method for cancellating mimo acoustic echo based on kalman filtering | |
JP2002223182A (en) | Echo canceling method, its device, its program and its recording medium | |
JP2014023110A (en) | Echo canceler, echo cancellation method, and program | |
JP2004349796A (en) | Sound echo canceling method, apparatus thereof, program and recording medium thereof | |
JP2011160429A (en) | Echo elimination device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170210 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20171027 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20171121 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20171211 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180612 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180613 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6356087 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |