JP2009021859A - Talk state judging apparatus and echo canceler with the talk state judging apparatus - Google Patents

Talk state judging apparatus and echo canceler with the talk state judging apparatus Download PDF

Info

Publication number
JP2009021859A
JP2009021859A JP2007183369A JP2007183369A JP2009021859A JP 2009021859 A JP2009021859 A JP 2009021859A JP 2007183369 A JP2007183369 A JP 2007183369A JP 2007183369 A JP2007183369 A JP 2007183369A JP 2009021859 A JP2009021859 A JP 2009021859A
Authority
JP
Japan
Prior art keywords
far
correlation coefficient
call
signal
microphone
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2007183369A
Other languages
Japanese (ja)
Other versions
JP4888262B2 (en
Inventor
Satoshi Sekine
聡 関根
Tsukasa Suenaga
司 末永
Takayasu Kondo
高康 近藤
Hiroshi Okumura
啓 奥村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yamaha Corp
Original Assignee
Yamaha Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yamaha Corp filed Critical Yamaha Corp
Priority to JP2007183369A priority Critical patent/JP4888262B2/en
Publication of JP2009021859A publication Critical patent/JP2009021859A/en
Application granted granted Critical
Publication of JP4888262B2 publication Critical patent/JP4888262B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
  • Telephone Function (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To accurately judge a talk state and to enable an echo canceler to speedily operate in accordance with a new talk state even when a received voice signal from a far end side suddenly rises. <P>SOLUTION: A correlation coefficient calculating section 212 calculates a cross-correlation coefficient of an output signal from a microphone 103 and a pseudo echo signal r(n). A state judging section 214 is adapted to judge a talk state by comparing the cross-correlation coefficient with a threshold. When a voice signal from a far end side suddenly rises, a far end threshold is reduced which is a lower limit of a range for the cross-correlation coefficient judging a far end single-talk, and then gradually returned to the original value. <P>COPYRIGHT: (C)2009,JPO&INPIT

Description

この発明は、電話会議システムの通話端末やハンズフリー機能を備えた携帯電話機等に好適な通話状態判定装置およびエコーキャンセラに関する。   The present invention relates to a call state determination device and an echo canceller suitable for a call terminal of a conference call system, a mobile phone having a hands-free function, and the like.

従来より、電話会議システムの通話端末やハンズフリー機能を備えた携帯電話機等の通話端末は、スピーカとマイクロホンを同一空間に向けて使用するため、遠端側からの受信音声信号がスピーカから放音されるとき、スピーカからマイクロホンへの音の回り込みが発生する。そこで、この種の端末では、マイクロホンによって収音される回り込み音の音声信号がエコーとして遠端側に送信されるのを防止するため、エコーキャンセラが一般的に用いられる。このエコーキャンセラとしては、適応フィルタを利用したものが一般的であるが、この適応フィルタのみではエコーを完全にキャンセルすることが困難であり、残留エコーがどうしても発生する。このため、適応フィルタに加えて、遠端側に送信される残留エコーを抑圧するエコーサプレッサを備えたエコーキャンセラが提案されている。   Conventionally, a telephone terminal such as a telephone terminal of a conference call system or a mobile phone equipped with a hands-free function uses a speaker and a microphone facing the same space, so that a received voice signal from the far end is emitted from the speaker. When this is done, sound wraps around from the speaker to the microphone. Therefore, in this type of terminal, an echo canceller is generally used in order to prevent a wraparound sound signal collected by a microphone from being transmitted as an echo to the far end side. As this echo canceller, one using an adaptive filter is generally used, but it is difficult to cancel the echo completely with this adaptive filter alone, and a residual echo is inevitably generated. For this reason, an echo canceller having an echo suppressor that suppresses residual echo transmitted to the far end side in addition to the adaptive filter has been proposed.

図4はこの種のエコーキャンセラの構成例を示すブロック図である。この例において、エコーキャンセラは、電話会議の通話端末に設けられており、大別して適応フィルタ1と、エコーサプレッサ2とにより構成されている。   FIG. 4 is a block diagram showing a configuration example of this type of echo canceller. In this example, the echo canceller is provided in a telephone terminal for a conference call, and is roughly composed of an adaptive filter 1 and an echo suppressor 2.

図4において、通話相手である遠端側の通話端末からの音声信号は、受信端子101により受信され、スピーカ102から音声として放音される。マイクロホン103は、近端側の空間内の音声を収音し、音声信号を出力する。このマイクロホン103が収音する音声は、近端側の話者が発声したものである場合もあるが、スピーカ102からマイクロホン103への回り込み音である場合もある。適応フィルタ1は、遠端側から受信される音声信号にフィルタ処理を施し、後者の回り込み音を模擬した擬似エコー信号r(n)を生成し、マイクロホン103の出力信号との逆相加算を行う回路である。また、適応フィルタ1は、逆相加算により得られる誤差信号e(n)が最小になるようにフィルタ処理のフィルタ係数列を更新する適応制御を行う。この適応制御により、擬似エコー信号r(n)がスピーカ102からマイクロホン103への回り込み音の成分に近似したものとなり、適応フィルタ1から出力される誤差信号e(n)は回り込み音の成分が除去された音声信号となる。   In FIG. 4, the audio signal from the far-end call terminal that is the call partner is received by the receiving terminal 101 and emitted from the speaker 102 as sound. The microphone 103 picks up sound in the near-end space and outputs a sound signal. The sound collected by the microphone 103 may be uttered by a speaker on the near end side, or may be a wraparound sound from the speaker 102 to the microphone 103. The adaptive filter 1 performs a filtering process on the audio signal received from the far-end side, generates a pseudo echo signal r (n) that simulates the latter wraparound sound, and performs reverse-phase addition with the output signal of the microphone 103. Circuit. The adaptive filter 1 performs adaptive control for updating the filter coefficient sequence for the filter processing so that the error signal e (n) obtained by the reverse phase addition is minimized. By this adaptive control, the pseudo echo signal r (n) approximates the sneak component from the speaker 102 to the microphone 103, and the error signal e (n) output from the adaptive filter 1 removes the sneak component. Audio signal.

以上説明した適応フィルタ1によりマイクロホン103の出力信号から回り込み音の成分をある程度キャンセルすることができるが、回り込み成分に完全に一致した擬似エコー信号r(n)を発生するのは困難であるため、どうしてもキャンセルしきれない残留エコーの成分が誤差信号e(n)に発生する。エコーサプレッサ2は、このような残留エコーを含んだ誤差信号e(n)が遠端側に送信されるのを防止する装置である。   Although the adaptive filter 1 described above can cancel the wraparound sound component from the output signal of the microphone 103 to some extent, it is difficult to generate the pseudo echo signal r (n) that completely matches the wraparound component. A residual echo component that cannot be completely canceled occurs in the error signal e (n). The echo suppressor 2 is a device that prevents the error signal e (n) including such residual echoes from being transmitted to the far end side.

図示のように、エコーサプレッサ2は、通話状態判定装置21と、ゲインコントロール部22とを含む。通話状態判定装置21は、近端側の話者および遠端側の話者の通話状態を判定する装置である。この通話状態には、遠端側の話者のみが発声している遠端シングルトーク、近端側の話者のみが発声している近端シングルトーク、近端側の話者および遠端側の話者の両方が発声しているダブルトーク、近端側の話者および遠端側の話者の両方が発声していない無音の各状態がある。通話状態判定装置21は、近端側の話者および遠端側の話者の通話状態がこれらの各状態のいずれであるかを判定し、判定結果をゲインコントロール部22に与える。   As illustrated, the echo suppressor 2 includes a call state determination device 21 and a gain control unit 22. The call state determination device 21 is a device that determines the call state of a near-end speaker and a far-end speaker. In this call state, the far-end single talk that only the far-end speaker speaks, the near-end single talk that only the near-end speaker speaks, the near-end speaker and the far-end side There is a double-talk state where both speakers are speaking, and a silent state where both the near-end speaker and the far-end speaker are not speaking. The call state determination device 21 determines which of these states the call state of the near-end speaker and the far-end speaker and gives the determination result to the gain control unit 22.

ゲインコントロール部22は、上記誤差信号e(n)を増幅して、遠端側に送る音声信号を発生する回路である。その際、ゲインコントロール部22は、通話状態判定装置21の判定結果に基づき、例えば誤差信号e(n)に残留エコーが含まれている可能性の高い遠端シングルトークの状態では誤差信号e(n)の増幅時のゲインを下げる、という具合に通話状態に応じたゲイン調整を行い、遠端側に送信される残留エコーを抑圧する。   The gain control unit 22 is a circuit that amplifies the error signal e (n) and generates an audio signal to be sent to the far end side. At this time, the gain control unit 22 determines, based on the determination result of the call state determination device 21, for example, the error signal e (n) in the far-end single talk state where the residual signal is likely to be included in the error signal e (n). n) The gain at the time of amplification is lowered, etc., and the gain is adjusted according to the call state to suppress the residual echo transmitted to the far end side.

通話状態判定装置21における通話状態の判定方法としては、従来、2種類の方法があった。第1の通話状態判定方法は、遠端側からの受信音声信号とマイクロホン103の出力信号とのレベル差を閾値と比較することにより通話状態を判定する方法である。第2の通話状態判定方法は、遠端側からの受信音声信号とマイクロホン103の出力信号との相互相関係数を算出し、この相互相関係数を閾値と比較することにより通話状態を判定する方法である。なお、エコーキャンセラにおける通話状態の判定技術に関しては例えば特許文献1に開示されている。
特開2003−324370号公報
Conventionally, there are two types of methods for determining the call state in the call state determination device 21. The first call state determination method is a method for determining the call state by comparing the level difference between the received voice signal from the far end side and the output signal of the microphone 103 with a threshold value. The second call state determination method calculates a cross-correlation coefficient between a voice signal received from the far end and the output signal of the microphone 103, and determines the call state by comparing the cross-correlation coefficient with a threshold value. Is the method. For example, Patent Document 1 discloses a technique for determining a call state in an echo canceller.
JP 2003-324370 A

上述した第1の通話状態判定方法は、判定を高速に実行することができるという利点を有する。しかし、第1の通話状態判定方法は、遠端シングルトークとダブルトークの判別が難しく、また、通話端末の設置環境や使用条件により通話状態の判定を行うのに適切な閾値が大きく変動する欠点がある。一方、第2の通話状態判定方法は、このような欠点はなく、正確に通話状態を判定することができる。しかし、第2の通話状態判定方法は、通話状態を判定するために、遠端側からの受信音声信号とマイクロホン103の出力信号との相互相関係数を算出する必要がある。ここで、相互相関係数は、過去一定期間内に発生した遠端側からの受信音声信号とマイクロホン103の出力信号のサンプルを用いて算出するので、算出に用いる音声信号が変化したとしても、その影響が相互相関係数に現れるまでには時間が掛かる。このため、第2の通話状態判定方法は、遠端側からの受信音声信号が突発的(パルシブ)に立ち上がった場合に、相互相関係数がこのパルシブな立ち上がりに追従せずに、ゲインコントロール部22のゲインを低下させる動作が遅れ、遠端側に残留エコーが送られる欠点がある。   The first call state determination method described above has the advantage that the determination can be performed at high speed. However, in the first call state determination method, it is difficult to distinguish between far-end single talk and double talk, and the threshold value suitable for determining the call state greatly varies depending on the installation environment and use conditions of the call terminal. There is. On the other hand, the second call state determination method does not have such a drawback and can accurately determine the call state. However, in the second call state determination method, it is necessary to calculate a cross-correlation coefficient between the received voice signal from the far end and the output signal of the microphone 103 in order to determine the call state. Here, since the cross-correlation coefficient is calculated using a sample of the received audio signal from the far end generated in the past fixed period and the output signal of the microphone 103, even if the audio signal used for the calculation changes, It takes time for the influence to appear in the cross-correlation coefficient. For this reason, the second call state determination method is such that when the received voice signal from the far-end side suddenly rises (pulsive), the cross-correlation coefficient does not follow this pulsating rise, and the gain control unit The operation of lowering the gain of 22 is delayed, and the residual echo is sent to the far end side.

この発明は、以上説明した事情に鑑みてなされたものであり、通話状態の判定を正確に行うことができ、かつ、遠端側からの受信音声信号が突発的に立ち上がる場合においても、新たな通話状態に対応した動作を迅速にエコーキャンセラに行わせることができる通話状態判定装置およびエコーキャンセラを提供することを目的としている。   The present invention has been made in view of the circumstances described above, and it is possible to accurately determine the call state, and even when a received voice signal from the far end suddenly rises, a new It is an object of the present invention to provide a call state determination device and an echo canceller that can cause an echo canceller to quickly perform an operation corresponding to a call state.

この発明は、適応フィルタにより、通話端末のスピーカからマイクロホンへの回り込み音を模擬した擬似エコー信号を発生し、前記マイクロホンの出力信号から除去するエコーキャンセラに設けられ、前記通話端末の利用者である近端側の話者と通話相手端末の利用者である遠端側の話者の通話状態を判定し、判定結果に基づいて前記エコーキャンセラを制御する通話状態判定装置において、前記マイクロホンの出力信号と前記擬似エコー信号との相互相関係数または前記通話相手端末から受信される音声信号と前記マイクロホンの出力信号との相互相関係数を算出する相関係数計算部と、前記相関係数計算部が算出した相互相関係数と閾値との比較により前記通話状態を判定する手段であって、前記通話相手端末から前記通話端末が受信する遠端側からの音声信号が突発的に立ち上がったとき、前記遠端側の話者のみが発声している状態である遠端シングルトークと判定する前記相互相関係数の範囲の下限である遠端閾値を低下させ、その後、徐々に元の値に戻す状態判定部とを具備することを特徴とする通話状態判定装置を提供する。また、この発明は、この通話状態判定装置を備えたエコーキャンセラを提供する。   The present invention is a user of the call terminal provided in an echo canceller that generates a pseudo echo signal simulating a wraparound sound from a speaker of a call terminal to a microphone by an adaptive filter and removes it from the output signal of the microphone. An output signal of the microphone in a call state determination device that determines a call state between a near-end speaker and a far-end speaker who is a user of a communication partner terminal and controls the echo canceller based on a determination result And a correlation coefficient calculation unit for calculating a cross correlation coefficient between a voice signal received from the communication partner terminal and an output signal of the microphone, and the correlation coefficient calculation unit Is a means for determining the call state by comparing the cross-correlation coefficient calculated by the threshold and the threshold, and the call terminal receives from the call partner terminal When the voice signal from the far end suddenly rises, the far end which is the lower limit of the range of the cross-correlation coefficient for determining that the far end single talk is in a state where only the far end speaker is speaking. There is provided a call state determination device comprising a state determination unit that lowers an end threshold value and then gradually returns to an original value. The present invention also provides an echo canceller including the call state determination device.

かかる発明によれば、上記第2の通話状態判定方法と同様な相互相関係数に基づく通話状態の判定を行うので、通話状態を正確に判定することができる。また、この通話状態判定装置によれば、状態判定部は、遠端側からの受信音声信号が突発的に立ち上がったとき、遠端側の話者のみが発声している遠端シングルトークと判定する相互相関係数の範囲の下限である遠端閾値を低下させ、その後、徐々に元の値に戻す。このため、遠端側からの受信音声信号が突発的に立ち上がった直後は、相互相関係数の上昇が遅れたとしても、通話状態が遠端シングルトークであると判定され易くなり、新たな通話状態への切り換わりが迅速に判定される。従って、新たな通話状態に対応した動作を迅速にエコーキャンセラに行わせることができることができる。   According to this invention, since the call state is determined based on the cross-correlation coefficient similar to the second call state determination method, the call state can be accurately determined. Further, according to the call state determination device, the state determination unit determines that the far-end single talk is made only by the far-end speaker when the received voice signal from the far-end side suddenly rises. The far-end threshold value, which is the lower limit of the range of cross-correlation coefficients, is lowered, and then gradually returned to the original value. For this reason, immediately after the voice signal received from the far-end side suddenly rises, even if the increase in the cross-correlation coefficient is delayed, it is easy to determine that the call state is far-end single talk, and a new call Switching to the state is quickly determined. Therefore, the operation corresponding to the new call state can be promptly performed by the echo canceller.

以下、図面を参照し、この発明の実施の形態を説明する。
図1は、この発明の一実施形態である通話状態判定装置210を備えたエコーキャンセラの構成を示すブロック図である。図1に示すように、このエコーキャンセラは、適応フィルタ1と、エコーサプレッサ2Aとにより構成されている。適応フィルタ1は、前掲図4のものと同様な構成である。本実施形態の特徴は、エコーサプレッサ2A、特に同エコーサプレッサ2Aに設けられた通話状態判定装置210にある。
Embodiments of the present invention will be described below with reference to the drawings.
FIG. 1 is a block diagram showing a configuration of an echo canceller including a call state determination device 210 according to an embodiment of the present invention. As shown in FIG. 1, the echo canceller includes an adaptive filter 1 and an echo suppressor 2A. The adaptive filter 1 has the same configuration as that shown in FIG. A feature of the present embodiment is the echo suppressor 2A, particularly the call state determination device 210 provided in the echo suppressor 2A.

通話状態判定装置210は、無音判定部211と、相関係数計算部212と、アタック検出部213と、状態判定部214とを有する。無音判定部211は、マイクロホン103の出力信号のレベルを監視し、近端側が無音状態か否かを判定する。そして、マイクロホン103の出力信号のレベルが所定の閾値に満たない状態が過去一定時間以上に亙って持続している場合に近端側が無音状態であることを示す無音信号を出力する。   The call state determination device 210 includes a silence determination unit 211, a correlation coefficient calculation unit 212, an attack detection unit 213, and a state determination unit 214. The silence determination unit 211 monitors the level of the output signal of the microphone 103 and determines whether or not the near end side is in the silence state. Then, when the state where the level of the output signal of the microphone 103 does not satisfy the predetermined threshold has been maintained for a past certain time or longer, a silence signal indicating that the near-end side is silent is output.

相関係数計算部212は、所定の時間長のサンプリング周期毎に、過去一定時間内のマイクロホン103の出力信号のサンプルと擬似エコー信号r(n)のサンプルとを用いて、両信号間の相互相関係数を算出する。ここで、遠端シングルトークの場合は、マイクロホン103の出力信号と擬似エコー信号r(n)との類似度が上がり、相互相関係数は高くなる。これに対し、近端シングルトークの場合には、マイクロホン103の出力信号と擬似エコー信号r(n)との関係は完全に無相関となり、相互相関係数は0になる。ダブルトークの場合の相互相関係数は、遠端シングルトークの場合の相互相関係数と近端シングルトークの場合の相互相関係数の中間の値となる。   The correlation coefficient calculation unit 212 uses a sample of the output signal of the microphone 103 and a sample of the pseudo echo signal r (n) within a certain past time for each predetermined sampling period of a predetermined length of time, so that mutual correlation between the two signals is achieved. A correlation coefficient is calculated. Here, in the case of far-end single talk, the similarity between the output signal of the microphone 103 and the pseudo echo signal r (n) increases, and the cross-correlation coefficient increases. On the other hand, in the case of near-end single talk, the relationship between the output signal of the microphone 103 and the pseudo echo signal r (n) is completely uncorrelated and the cross-correlation coefficient is zero. The cross correlation coefficient in the case of double talk is an intermediate value between the cross correlation coefficient in the case of far end single talk and the cross correlation coefficient in the case of near end single talk.

アタック検出部213は、遠端側から受信される音声信号の立ち上がりを検出する回路である。図2は、このアタック検出部213の構成例を示すブロック図である。この構成例において、パワー計算部31は、遠端側から受信される音声信号の各サンプルについて、パワーの瞬時値Pを算出する。移動平均部32は、このパワーの瞬時値Pの移動平均値Pma、すなわち、過去一定時間内のパワーの瞬時値Pの平均値を算出する。比率計算部33は、パワーの瞬時値Pと移動平均値Pmaとの比率P/Pmaを算出する。閾値比較部34は、比率P/Pmaを所定の閾値thpと比較し、P/Pma>thpであるときに、アタック検出信号を出力する。   The attack detection unit 213 is a circuit that detects the rising edge of the audio signal received from the far end side. FIG. 2 is a block diagram illustrating a configuration example of the attack detection unit 213. In this configuration example, the power calculator 31 calculates an instantaneous power value P for each sample of the audio signal received from the far end. The moving average unit 32 calculates the moving average value Pma of the instantaneous value P of power, that is, the average value of the instantaneous value P of power within a certain past time. The ratio calculator 33 calculates a ratio P / Pma between the instantaneous value P of power and the moving average value Pma. The threshold comparison unit 34 compares the ratio P / Pma with a predetermined threshold thp, and outputs an attack detection signal when P / Pma> thp.

図1において、状態判定部214は、無音判定部211、相関係数計算部212およびアタック検出部213の各出力情報に基づき、遠端側の話者および近端側の話者の通話状態が、遠端シングルトーク、近端シングルトーク、ダブルトーク、無音の各状態のいずれであるかを判定する装置である。通話状態の判定の態様は、遠端側から受信される音声信号の突発的な立ち上がり(以下、便宜上、遠端パルシブ入力という)が検出されない定常状態と、遠端パルシブ入力が検出された直後の状態とで異なる。   In FIG. 1, the state determination unit 214 determines whether the far-end speaker and the near-end speaker are in a call state based on output information from the silence determination unit 211, the correlation coefficient calculation unit 212, and the attack detection unit 213. It is a device that determines whether the state is far-end single talk, near-end single talk, double talk, or silence. The state of the call state is determined by a steady state in which a sudden rise of an audio signal received from the far end side (hereinafter referred to as a far end pulsive input) is not detected, and immediately after a far end pulsive input is detected. It depends on the state.

定常状態において、状態判定部214は、遠端閾値th1(1>th1>0)とこの遠端閾値th1よりも低い近端閾値th2(th1>th2>0)とを用いて、相関係数計算部212が出力する相互相関係数の大きさの判定を行う。そして、相互相関係数が遠端閾値th1より大きいときは遠端シングルトーク、遠端閾値th1以下であり、かつ、近端閾値th2より大きいときはダブルトーク、近端閾値th2以下であるときは近端シングルトークと判定する。また、十分に低い閾値th3(例えばth2>th3>0)を用い、相関係数計算部212が出力する相互相関係数が閾値th3以下であり、かつ、無音判定部211が無音信号を出力しているときは、無音状態と判定する。以上の判定において閾値th1〜th3は、エコーサプレッサ2A内の閾値・ゲインテーブル221に予め格納されたものが用いられる。   In the steady state, the state determination unit 214 calculates a correlation coefficient using the far end threshold th1 (1> th1> 0) and the near end threshold th2 (th1> th2> 0) lower than the far end threshold th1. The magnitude of the cross-correlation coefficient output from the unit 212 is determined. When the cross-correlation coefficient is greater than the far-end threshold th1, the far-end single talk is less than the far-end threshold th1, and when it is greater than the near-end threshold th2, the double-talk is less than the near-end threshold th2. Judged as near-end single talk. Also, a sufficiently low threshold th3 (for example, th2> th3> 0) is used, the cross-correlation coefficient output by the correlation coefficient calculation unit 212 is equal to or less than the threshold th3, and the silence determination unit 211 outputs a silence signal. If it is, it is determined that there is no sound. In the above determination, threshold values th1 to th3 are stored in advance in the threshold value / gain table 221 in the echo suppressor 2A.

状態判定部214は、アタック検出部213がアタック検出信号を出力し、かつ、その直前に無音判定部211が無音信号を出力していた場合に、遠端パルシブ入力があったと判定する。図3は、この遠端パルシブ入力を検出したときの状態判定部214の動作を示す波形図である。この図3に示すように、状態判定部214は、遠端パルシブ入力を検出したとき、遠端シングルトークであると判定する相互相関係数の範囲の下限である遠端閾値th1を低下させ、その後、一定時間を要して、遠端閾値th1を徐々に元の値まで増加させる。すなわち、遠端パルシブ入力を検出した直後は、遠端シングルトークと判定され易くなるように遠端閾値th1を制御するのである。なお、他の閾値th2〜th3は、遠端パルシブ入力を検出したときに、例えば遠端閾値th1に対する比が同一値を維持するように、遠端閾値th1に連動させて低下させ、徐々に元の値に戻してもよいが、これらの閾値を遠端閾値th1に比べて十分に低くする場合には、変化させなくてもよい。   The state determination unit 214 determines that there is a far-end pulsive input when the attack detection unit 213 outputs an attack detection signal and the silence determination unit 211 outputs a silence signal immediately before the attack detection signal. FIG. 3 is a waveform diagram showing the operation of the state determination unit 214 when this far-end pulsive input is detected. As shown in FIG. 3, when the state determination unit 214 detects the far-end pulsive input, the state determination unit 214 decreases the far-end threshold th1 that is the lower limit of the range of the cross-correlation coefficient that is determined to be far-end single talk. Thereafter, taking a certain time, the far end threshold th1 is gradually increased to the original value. That is, immediately after the far-end pulsive input is detected, the far-end threshold th1 is controlled so that the far-end single talk is easily determined. The other thresholds th2 to th3 are decreased in conjunction with the far-end threshold th1 so that, for example, the ratio to the far-end threshold th1 maintains the same value when the far-end pulsive input is detected. However, when these threshold values are sufficiently lower than the far-end threshold value th1, it is not necessary to change them.

エコーサプレッサ2Aは、以上説明した通話状態判定装置210に加えて、閾値・ゲインテーブル221と、ゲイン計算部222と、ゲインコントロール部223とを有する。ここで、ゲインコントロール部223は、ゲイン可変の増幅器であり、適応フィルタ1から出力される誤差信号e(n)を与えられたゲインで増幅して、送信端子104から遠端側に送信する。閾値・ゲインテーブル221は、状態判定部214が通話状態の判定において用いる閾値th1〜th3を記憶するとともに、各種の通話状態に対応付けてゲインコントロール部223に与えるゲインを記憶している。この閾値・ゲインテーブル221において、ゲインコントロール部223に与えるゲインは、近端シングルトークの場合が最大になっており、ダブルトークの場合には中庸、遠端シングルトークの場合は最低の値になっている。ゲイン計算部222は、これらの各種の通話状態に対応したゲインのうち状態判定部214により判定された通話状態に対応したものを閾値・ゲインテーブル221から読み出し、この読み出したゲインでの増幅動作をゲインコントロール部223に行わせる。
以上が本実施形態による通話状態判定装置210を備えたエコーキャンセラの詳細である。
The echo suppressor 2 </ b> A includes a threshold / gain table 221, a gain calculation unit 222, and a gain control unit 223 in addition to the call state determination device 210 described above. Here, the gain control unit 223 is a variable gain amplifier, amplifies the error signal e (n) output from the adaptive filter 1 with a given gain, and transmits the amplified signal from the transmission terminal 104 to the far end side. The threshold / gain table 221 stores thresholds th1 to th3 used by the state determination unit 214 in determining the call state, and stores gains to be given to the gain control unit 223 in association with various call states. In this threshold value / gain table 221, the gain given to the gain control unit 223 is the maximum in the case of near-end single talk, is the middle value in the case of double talk, and the lowest value in the case of far-end single talk. ing. The gain calculation unit 222 reads out the gain corresponding to the call state determined by the state determination unit 214 from the gains corresponding to the various call states from the threshold / gain table 221 and performs the amplification operation with the read gain. Let the gain control unit 223 perform this.
The above is the details of the echo canceller including the call state determination device 210 according to the present embodiment.

本実施形態によれば、通話状態判定装置210の状態判定部214は、マイクロホン103の出力信号と擬似エコー信号r(n)との相互相関係数に基づいて、通話状態の判定を行う。従って、遠端パルシブ入力のない定常状態において、状態判定部214は、正確に通話状態の判定を行うことができる。   According to the present embodiment, the state determination unit 214 of the call state determination device 210 determines the call state based on the cross-correlation coefficient between the output signal of the microphone 103 and the pseudo echo signal r (n). Therefore, in a steady state where there is no far-end pulsive input, the state determination unit 214 can accurately determine the call state.

ここで、相互相関係数の算出には、過去一定時間内に発生したマイクロホン103の出力信号のサンプルと擬似エコー信号r(n)のサンプルが用いられる。従って、遠端の話者が発声を開始し、突発的に遠端シングルトークの状態になったとしても、その効果が相互相関係数の上昇となって現れるのには時間が掛かる。このため、何ら策を講じないとすると、遠端シングルトークを検出してゲインコントロール部223のゲインを低下させる動作が遅れ、残留エコーを多く含んだ適応フィルタ1の出力信号e(n)が抑圧されることなく遠端側に送信される。   Here, for the calculation of the cross-correlation coefficient, a sample of the output signal of the microphone 103 and a sample of the pseudo echo signal r (n) generated within the past fixed time are used. Therefore, even if the far-end speaker starts speaking and suddenly enters the far-end single talk state, it takes time for the effect to appear as an increase in the cross-correlation coefficient. Therefore, if no measures are taken, the operation of detecting the far-end single talk and reducing the gain of the gain control unit 223 is delayed, and the output signal e (n) of the adaptive filter 1 containing a large amount of residual echo is suppressed. Without being transmitted to the far end.

しかしながら、本実施形態における通話状態判定装置210の状態判定部214は、遠端の話者が発声を開始し、遠端パルシブ入力があったとき、遠端シングルトークであると判定する相互相関係数の範囲の下限である遠端閾値th1を低下させ、その後、一定時間を要して、遠端閾値th1を徐々に元の値まで増加させる。従って、本実施形態による通話状態判定装置210は、遠端シングルトークが開始されたときに、迅速にこれを検知して、ゲインコントロール部223のゲインを遠端シングルトーク時に適したゲインに低下させ、大きなレベルの残留エコーが遠端側に送られるのを防止することができる。   However, the state determination unit 214 of the call state determination apparatus 210 according to the present embodiment determines the far-end single talk when the far-end speaker starts speaking and receives a far-end pulsating input. The far end threshold th1 which is the lower limit of the numerical range is lowered, and then the far end threshold th1 is gradually increased to the original value over a certain time. Therefore, when the far-end single talk is started, the call state determination device 210 according to the present embodiment quickly detects this and reduces the gain of the gain control unit 223 to a gain suitable for the far-end single talk. Therefore, it is possible to prevent a large level of residual echo from being sent to the far end side.

また、本実施形態では、遠端パルシブ入力があったとき、ゲインコントロール部223のゲインを直接低下させるのではなく、遠端閾値th1を低下させることにより間接的にゲインを低下させるようにしている。このため、例えば遠端パルシブ入力があった直後に、近端側の話者が発声を開始し、ダブルトークの状態になった場合に、状態判定部214の判定結果は、例えば、最初は遠端シングルトークとなり、その後、ダブルトークに切り換わり、ゲインコントロール部223のゲインは、遠端シングルトークに対応したものからダブルトークに対応したものへスムーズに移行する。このように本実施形態によれば、通話状態の急激な変化に対応して、ゲインコントロール部223のゲインをスムーズに切り換えることができる。   In the present embodiment, when there is a far-end pulsive input, the gain of the gain control unit 223 is not lowered directly, but the gain is indirectly lowered by lowering the far-end threshold th1. . For this reason, for example, when the near-end speaker starts speaking immediately after the far-end pulsating input, and enters the double-talk state, the determination result of the state determination unit 214 is, for example, the first It becomes end single talk and then switches to double talk, and the gain of the gain control unit 223 smoothly shifts from that corresponding to far end single talk to that corresponding to double talk. As described above, according to the present embodiment, the gain of the gain control unit 223 can be smoothly switched in response to a sudden change in the call state.

以上、この発明の一実施形態について説明したが、この発明には他にも実施形態が考えられる。例えば次の通りである。   Although one embodiment of the present invention has been described above, other embodiments are conceivable for the present invention. For example:

(1)上記実施形態において、適応フィルタ1およびエコーサプレッサ2Aは、上記実施形態において述べた通りの処理を実行する専用の電子回路でもよく、同様な処理を通話端末等に搭載されたコンピュータに実行させるコンピュータプログラムであってもよい。 (1) In the above embodiment, the adaptive filter 1 and the echo suppressor 2A may be a dedicated electronic circuit that executes the processing as described in the above embodiment, and the same processing is executed in a computer mounted on a call terminal or the like. It may be a computer program.

(2)上記実施形態では、通話状態判定装置210の判定結果をエコーサプレッサの制御に用いたが、適応フィルタ1においてフィルタ係数の更新を行うか否かの制御に用いてもよい。例えば遠端シングルトークでは適応フィルタ1にフィルタ係数の更新を行わせるが、ダブルトークではフィルタ係数の更新の際のステップを小さくし、近端シングルトークおよび無音状態ではフィルタ係数の更新を行わせない、といった制御の態様が考えられる。 (2) In the above embodiment, the determination result of the call state determination device 210 is used for controlling the echo suppressor. However, the determination result may be used for controlling whether or not the adaptive filter 1 updates the filter coefficient. For example, in the far-end single talk, the adaptive filter 1 updates the filter coefficient, but in double talk, the filter coefficient update step is reduced, and the filter coefficient is not updated in the near-end single talk and silent state. A control mode such as is conceivable.

(3)相関係数計算部212は、遠端側から受信される音声信号とマイクロホン103の出力信号との相互相関係数を算出して状態判定部214に送り、状態判定部214はこの相互相関係数を用いて通話状態の判定を行ってもよい。 (3) The correlation coefficient calculation unit 212 calculates a cross-correlation coefficient between the audio signal received from the far end and the output signal of the microphone 103 and sends it to the state determination unit 214. The state determination unit 214 The call state may be determined using the correlation coefficient.

この発明の一実施形態である通話状態判定装置210を備えたエコーキャンセラの構成を示すブロック図である。It is a block diagram which shows the structure of the echo canceller provided with the call state determination apparatus 210 which is one Embodiment of this invention. 同通話状態判定装置210におけるアタック検出部213の構成例を示すブロック図である。3 is a block diagram illustrating a configuration example of an attack detection unit 213 in the call state determination device 210. FIG. 同通話状態判定装置210の動作例を示す波形図である。6 is a waveform diagram showing an operation example of the call state determination apparatus 210. FIG. 従来のエコーキャンセラの構成を示すブロック図である。It is a block diagram which shows the structure of the conventional echo canceller.

符号の説明Explanation of symbols

1……適応フィルタ、2A……エコーサプレッサ、102……スピーカ、103……マイクロホン、210……通話状態判定装置、211……無音判定部、212……相関係数計算部、213……アタック検出部、214……状態判定部、221……閾値・ゲインテーブル、222……ゲイン計算部、223……ゲインコントロール部。 DESCRIPTION OF SYMBOLS 1 ... Adaptive filter, 2A ... Echo suppressor, 102 ... Speaker, 103 ... Microphone, 210 ... Call state determination device, 211 ... Silence determination unit, 212 ... Correlation coefficient calculation unit, 213 ... Attack Detection unit, 214... State determination unit, 221... Threshold / gain table, 222... Gain calculation unit, 223.

Claims (2)

適応フィルタにより、通話端末のスピーカからマイクロホンへの回り込み音を模擬した擬似エコー信号を発生し、前記マイクロホンの出力信号から除去するエコーキャンセラに設けられ、前記通話端末の利用者である近端側の話者と通話相手端末の利用者である遠端側の話者の通話状態を判定し、判定結果に基づいて前記エコーキャンセラを制御する通話状態判定装置において、
前記マイクロホンの出力信号と前記擬似エコー信号との相互相関係数または前記通話相手端末から受信される音声信号と前記マイクロホンの出力信号との相互相関係数を算出する相関係数計算部と、
前記相関係数計算部が算出した相互相関係数と閾値との比較により前記通話状態を判定する手段であって、前記通話相手端末から前記通話端末が受信する遠端側からの音声信号が突発的に立ち上がったとき、前記遠端側の話者のみが発声している状態である遠端シングルトークと判定する前記相互相関係数の範囲の下限である遠端閾値を低下させ、その後、徐々に元の値に戻す状態判定部と
を具備することを特徴とする通話状態判定装置。
The adaptive filter generates a pseudo echo signal that simulates the sneak sound from the speaker of the call terminal to the microphone, and is provided in an echo canceller that removes it from the output signal of the microphone. In the call state determination device that determines the call state of the far-end speaker who is the user of the speaker and the other party terminal, and controls the echo canceller based on the determination result,
A correlation coefficient calculation unit for calculating a cross-correlation coefficient between the output signal of the microphone and the pseudo echo signal or a cross-correlation coefficient between the voice signal received from the communication partner terminal and the output signal of the microphone;
A means for determining the call state by comparing the cross-correlation coefficient calculated by the correlation coefficient calculation unit with a threshold value, and a voice signal from the far end received by the call terminal from the call partner terminal is suddenly generated. The far-end threshold, which is the lower limit of the range of the cross-correlation coefficient, determined to be far-end single talk, in which only the far-end speaker is speaking, And a state determination unit for returning to the original value.
適応フィルタにより、通話端末のスピーカからマイクロホンへの回り込み音を模擬した擬似エコー信号を発生し、前記マイクロホンの出力信号から除去し、通話相手端末に送信する音声信号を発生するエコーキャンセラにおいて、
与えられたゲインに従って、前記マイクロホンの出力信号から前記擬似エコー信号を除去した信号を増幅して、前記通話相手端末に送信するゲインコントロール部と、
前記通話端末の利用者である近端側の話者と前記通話相手端末の利用者である遠端側の話者の通話状態を判定し、判定結果に基づいて、前記ゲインコントロール部に与えるゲインを制御する信号を出力する通話状態判定装置とを具備し、
前記通話状態判定装置は、
前記マイクロホンの出力信号と前記擬似エコー信号との相互相関係数または前記通話相手端末から受信される音声信号と前記マイクロホンの出力信号との相互相関係数を算出する相関係数計算部と、
前記相関係数計算部が算出した相互相関係数と閾値との比較により前記通話状態を判定する手段であって、前記通話相手端末から前記通話端末が受信する遠端側からの音声信号が突発的に立ち上がったとき、前記遠端側の話者のみが発声している状態である遠端シングルトークと判定する前記相互相関係数の範囲の下限である遠端閾値を低下させ、その後、徐々に元の値に戻す状態判定部と
を具備することを特徴とするエコーキャンセラ。
In an echo canceller that generates a pseudo echo signal that simulates a sneak sound from a speaker of a call terminal to a microphone by an adaptive filter, removes it from the output signal of the microphone, and generates an audio signal to be transmitted to the call partner terminal.
A gain control unit that amplifies a signal obtained by removing the pseudo echo signal from the output signal of the microphone according to a given gain, and transmits the amplified signal to the communication partner terminal;
A gain to be given to the gain control unit based on a determination result of determining a call state between a near-end speaker who is a user of the call terminal and a far-end speaker who is a user of the call partner terminal A call state determination device that outputs a signal for controlling
The call state determination device includes:
A correlation coefficient calculation unit for calculating a cross-correlation coefficient between the output signal of the microphone and the pseudo echo signal or a cross-correlation coefficient between the voice signal received from the communication partner terminal and the output signal of the microphone;
A means for determining the call state by comparing the cross-correlation coefficient calculated by the correlation coefficient calculation unit with a threshold value, and a voice signal from the far end received by the call terminal from the call partner terminal is suddenly generated. The far-end threshold, which is the lower limit of the range of the cross-correlation coefficient, determined to be far-end single talk, in which only the far-end speaker is speaking, An echo canceller comprising: a state determination unit that returns to the original value.
JP2007183369A 2007-07-12 2007-07-12 Call state determination device and echo canceller having the call state determination device Expired - Fee Related JP4888262B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007183369A JP4888262B2 (en) 2007-07-12 2007-07-12 Call state determination device and echo canceller having the call state determination device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007183369A JP4888262B2 (en) 2007-07-12 2007-07-12 Call state determination device and echo canceller having the call state determination device

Publications (2)

Publication Number Publication Date
JP2009021859A true JP2009021859A (en) 2009-01-29
JP4888262B2 JP4888262B2 (en) 2012-02-29

Family

ID=40361083

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007183369A Expired - Fee Related JP4888262B2 (en) 2007-07-12 2007-07-12 Call state determination device and echo canceller having the call state determination device

Country Status (1)

Country Link
JP (1) JP4888262B2 (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9437179B2 (en) 2012-01-30 2016-09-06 Mitsubishi Electric Corporation Reverberation suppression device
US10320967B2 (en) 2016-09-15 2019-06-11 Oki Electric Industry Co., Ltd. Signal processing device, non-transitory computer-readable storage medium, signal processing method, and telephone apparatus
JP2020122835A (en) * 2019-01-29 2020-08-13 パナソニックIpマネジメント株式会社 Voice processor and voice processing method
CN113156373A (en) * 2021-04-25 2021-07-23 北京华捷艾米科技有限公司 Sound source positioning method, digital signal processing device and audio system

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003051879A (en) * 2001-08-08 2003-02-21 Fujitsu Ltd Speech device
JP2003324370A (en) * 2002-04-26 2003-11-14 Matsushita Electric Works Ltd Echo canceler
JP2006033682A (en) * 2004-07-21 2006-02-02 Matsushita Electric Ind Co Ltd Echo canceller, and telephone set using the same
JP2008187680A (en) * 2007-01-31 2008-08-14 Oki Electric Ind Co Ltd Signal state detection apparatus, echo canceler, and signal state detection program

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003051879A (en) * 2001-08-08 2003-02-21 Fujitsu Ltd Speech device
JP2003324370A (en) * 2002-04-26 2003-11-14 Matsushita Electric Works Ltd Echo canceler
JP2006033682A (en) * 2004-07-21 2006-02-02 Matsushita Electric Ind Co Ltd Echo canceller, and telephone set using the same
JP2008187680A (en) * 2007-01-31 2008-08-14 Oki Electric Ind Co Ltd Signal state detection apparatus, echo canceler, and signal state detection program

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9437179B2 (en) 2012-01-30 2016-09-06 Mitsubishi Electric Corporation Reverberation suppression device
US10320967B2 (en) 2016-09-15 2019-06-11 Oki Electric Industry Co., Ltd. Signal processing device, non-transitory computer-readable storage medium, signal processing method, and telephone apparatus
JP2020122835A (en) * 2019-01-29 2020-08-13 パナソニックIpマネジメント株式会社 Voice processor and voice processing method
US11089404B2 (en) 2019-01-29 2021-08-10 Panasonic Intellectual Property Management Co., Ltd. Sound processing apparatus and sound processing method
CN113156373A (en) * 2021-04-25 2021-07-23 北京华捷艾米科技有限公司 Sound source positioning method, digital signal processing device and audio system
CN113156373B (en) * 2021-04-25 2023-06-02 北京华捷艾米科技有限公司 Sound source positioning method, digital signal processing device and audio system

Also Published As

Publication number Publication date
JP4888262B2 (en) 2012-02-29

Similar Documents

Publication Publication Date Title
JP4282260B2 (en) Echo canceller
CN110225214B (en) Method, attenuation unit, system and medium for attenuating a signal
US7856097B2 (en) Echo canceling apparatus, telephone set using the same, and echo canceling method
KR100519001B1 (en) Methods and apparatus for controlling echo suppression in communications systems
CN106713570B (en) Echo cancellation method and device
US8811602B2 (en) Full duplex speakerphone design using acoustically compensated speaker distortion
JP5125690B2 (en) Acoustic echo canceller
JPH06338827A (en) Echo controller
JP4678349B2 (en) Call determination device
JPWO2002095975A1 (en) Echo processing device
WO2008011319A2 (en) Method and system for near-end detection
US20120295562A1 (en) Processing Audio Signals
JP2009105620A (en) Echo canceler
JP4888262B2 (en) Call state determination device and echo canceller having the call state determination device
JP2009094802A (en) Telecommunication apparatus
JP2003324370A (en) Echo canceler
JP4887181B2 (en) Echo prevention device and program
JP2006279191A (en) Echo canceller
WO2020203258A1 (en) Echo suppression device, echo suppression method, and echo suppression program
JP4403491B2 (en) Echo canceller, echo cancellation method and echo cancellation program
JP5288500B2 (en) Hands-free telephone device, hands-free calling method, and hands-free calling program
JP4735419B2 (en) Voice communication device
JP2004297791A (en) Echo cancellation apparatus, echo cancellation method, program and recording medium
JP2013005106A (en) In-house sound amplification system, in-house sound amplification method, and program therefor
JP2007068223A (en) Telephone set

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100520

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110819

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110823

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111024

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111115

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111128

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141222

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees