JP2008160420A - Echo noise canceller and echo noise canceling method - Google Patents

Echo noise canceller and echo noise canceling method Download PDF

Info

Publication number
JP2008160420A
JP2008160420A JP2006346242A JP2006346242A JP2008160420A JP 2008160420 A JP2008160420 A JP 2008160420A JP 2006346242 A JP2006346242 A JP 2006346242A JP 2006346242 A JP2006346242 A JP 2006346242A JP 2008160420 A JP2008160420 A JP 2008160420A
Authority
JP
Japan
Prior art keywords
filter
echo
filter coefficient
coefficient value
semi
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006346242A
Other languages
Japanese (ja)
Inventor
Yohei Sakuraba
洋平 櫻庭
Yasuhiko Kato
靖彦 加藤
Nobuyuki Kihara
信之 木原
Hideki Kishi
秀樹 岸
Yasuhiro Kodama
康広 小玉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2006346242A priority Critical patent/JP2008160420A/en
Publication of JP2008160420A publication Critical patent/JP2008160420A/en
Pending legal-status Critical Current

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To allow a coefficient value of a half fixed filter to be appropriately set when providing an adaptive filter and the half fixed filter to remove echo. <P>SOLUTION: An echo noise canceller removes echo noise of a sound signal picked up by a microphone and is provided with the adaptive filter and the half fixed filter. The adaptive filter is a filter which detects an echo component of digital sound data and performs echo canceling processing of removing the detected echo component and has a filter coefficient for echo component detection updated successively. The half fixed filter saves the filter coefficient value set by the adaptive filter, and the half fixed filter sets the saved filter coefficient value to perform echo canceling processing in the case that it has been detected continuously a prescribed number of times that the saved filter coefficient value set by the adaptive filter is appropriate. Thus, echo canceling is performed with a use of the half fixed filter whose filter coefficient is set. <P>COPYRIGHT: (C)2008,JPO&INPIT

Description

本発明は、電話におけるハンズフリー通話を行うシステムやテレビ会議システムなどの拡声通話系で全二重通話を行うものに適用して好適なエコーノイズキャンセル装置及びエコーノイズキャンセル方法に関する。   The present invention relates to an echo noise canceling apparatus and an echo noise canceling method that are suitable for use in a system that performs a full duplex call in a loudspeaker call system such as a hands-free call in a telephone or a video conference system.

従来、テレビ会議システムなどの拡声通話系では、遠端装置のマイクロフォンで集音された音声が、近端装置に送られ、近端装置のスピーカから放音される。近端装置についてもマイクロフォンを備えて、そのマイクロフォンで集音された音声が、遠端装置に送られ、遠端装置のスピーカから放音される。   Conventionally, in a voice call system such as a video conference system, sound collected by a microphone of a far-end device is transmitted to the near-end device and emitted from a speaker of the near-end device. The near-end device also includes a microphone, and the sound collected by the microphone is sent to the far-end device and emitted from the speaker of the far-end device.

このような拡声通話系で全二重通話を行うシステム構成の場合、遠端装置と近端装置のそれぞれで、スピーカから放音される音声が、マイクロフォンに入力してしまう。何も処理を行わない場合には、この音声が再び相手側の装置に送られるため、自分の発声がこだまのように少し遅れてスピーカから出力される「エコー」という現象を引き起こす。エコー音のレベルが大きい場合には、さらにそのエコー音がマイクロフォンで集音されて、系をループして、ハウリングと称する現象を引き起こしてしまう。   In the case of a system configuration in which a full-duplex call is performed in such a loudspeaker call system, the sound emitted from the speaker at each of the far-end device and the near-end device is input to the microphone. When no processing is performed, this sound is sent again to the device on the other side, causing a phenomenon called “echo” in which one's utterance is output from the speaker with a slight delay as if it is a piece. When the level of the echo sound is high, the echo sound is further collected by the microphone, and the system loops to cause a phenomenon called howling.

このようなエコーやハウリングを防止するための装置として、エコーキャンセル装置(エコーキャンセラ)が知られている。従来の一般的なエコーキャンセラとしては、適応フィルタを使用してスピーカとマイクロフォンとの間のインパルスレスポンスを測定する。そして、マイクロフォンに入力されるスピーカからの音声を、スピーカから放音されるリファレンス信号に前述のインパルスレスポンスを畳み込んだ擬似エコー信号を生成し、これを差し引くことで除去している。   An echo canceling device (echo canceller) is known as a device for preventing such echo and howling. As a conventional general echo canceller, an impulse response between a speaker and a microphone is measured using an adaptive filter. Then, the sound from the speaker input to the microphone is removed by generating a pseudo echo signal obtained by convolving the aforementioned impulse response with the reference signal emitted from the speaker, and subtracting this.

特許文献1には、適応フィルタを使用したエコーキャンセル装置の一例についての開示がある。
特開2000−151474号公報
Patent Document 1 discloses an example of an echo cancellation device using an adaptive filter.
JP 2000-151474 A

ところが、近端装置側の話者と遠端装置側の話者とが同時に発声している、いわゆるダブルトーク状態である場合には、スピーカから出た音に遠端装置側の話者の声が加わっており、そのような状態の音声がマイクロフォンに入力される。このような状態では、適応フィルタにとって、遠端装置側の話者の音声が外乱としてマイクロフォン入力信号に加わることになり、学習を続けて行くと、適応フィルタの係数が正しいものから遠い係数値に悪化してしまう。このようにフィルタ係数が悪化した状態で処理されると、結果的にエコーの除去ができない状態になってしまう。   However, in a so-called double talk state where a speaker on the near-end device side and a speaker on the far-end device side are simultaneously speaking, the voice of the speaker on the far-end device side is added to the sound emitted from the speaker. Is added, and the sound in such a state is input to the microphone. In such a state, the speech of the far-end device side speaker is added to the microphone input signal as a disturbance for the adaptive filter, and if the learning is continued, the coefficient of the adaptive filter becomes a coefficient value far from the correct one. It will get worse. If processing is performed in such a state where the filter coefficient is deteriorated, echoes cannot be removed as a result.

このダブルトークの対策としては、例えば、適応フィルタとは別に、FIR(Finite Impulse Responce) 形のフィルタで構成される半固定フィルタを用意して、適応フィルタの係数の条件が良くなった段階で、その適応フィルタに設定されている係数値を半固定フィルタにコピーし、そのコピーした係数値を使用して、半固定フィルタでエコーキャンセルを除去することが行われている。通常、半固定フィルタの係数を用いて擬似エコーを生成し、エコーを除去する処理を行う。   As a countermeasure against this double talk, for example, apart from the adaptive filter, a semi-fixed filter composed of a FIR (Finite Impulse Response) type filter is prepared, and when the condition of the coefficient of the adaptive filter is improved, Coefficient values set in the adaptive filter are copied to a semi-fixed filter, and echo cancellation is removed by the semi-fixed filter using the copied coefficient value. Usually, a pseudo echo is generated using a coefficient of the semi-fixed filter, and a process of removing the echo is performed.

ところが、このように適応フィルタの係数値を半固定フィルタに移す構成とした場合、適応フィルタの係数が半固定フィルタの係数よりも良いと複数回判断された場合に、適応フィルタの係数値を半固定フィルタに移すことが行われるが、その複数回の判断が行われている係数が全て正しい係数であるとは限らず、適切な係数値が半固定フィルタにコピーされるとは限らない問題があった。特に、適応フィルタの係数は絶えず更新されるために、複数回の判断の内の最後の判断時の係数値が誤ったものである可能性があるが、そのような場合には、半固定フィルタに誤った係数値がコピーされてしまい、結果としてエコーが発生してしまう問題があった。   However, when the configuration is such that the coefficient value of the adaptive filter is transferred to the semi-fixed filter in this way, the coefficient value of the adaptive filter is changed to a half when it is determined that the coefficient of the adaptive filter is better than the coefficient of the semi-fixed filter. Although it is transferred to the fixed filter, the coefficients that have been determined multiple times are not all correct coefficients, and the appropriate coefficient values are not always copied to the semi-fixed filter. there were. In particular, since the coefficient of the adaptive filter is constantly updated, there is a possibility that the coefficient value at the time of the last judgment among a plurality of judgments may be incorrect. In such a case, the semi-fixed filter There is a problem that an incorrect coefficient value is copied to the signal, resulting in an echo.

本発明はかかる点に鑑みてなされたものであり、適応フィルタと半固定フィルタとを設けてエコー除去を行う場合に、半固定フィルタの係数値を適切に設定できるようにすることを目的とする。   The present invention has been made in view of such a point, and an object of the present invention is to make it possible to appropriately set the coefficient value of a semi-fixed filter when echo cancellation is performed by providing an adaptive filter and a semi-fixed filter. .

本発明は、マイクロフォンが拾った音声信号を送信及び/又は受信する際のエコーノイズの除去を行うものに適用される。適応フィルタと半固定フィルタとを備える。
適応フィルタは、音声信号をデジタル化したデジタル音声データのエコー成分を検出して、その検出したエコー成分を除去するエコーキャンセル処理を行い、エコー成分を検出するフィルタ係数が逐次更新されるフィルタである。
半固定フィルタは、適応フィルタで設定されたフィルタ係数値を退避し、その退避した状態で適応フィルタで設定されたフィルタ係数値が、所定の複数回連続して適正であると検出された場合に、退避したフィルタ係数値を設定して、エコーキャンセル処理を行うフィルタである。
そして、このように構成された半固定フィルタで送信及び/又は受信する際のエコーノイズの除去処理を行うものである。
The present invention is applied to an apparatus that removes echo noise when transmitting and / or receiving an audio signal picked up by a microphone. An adaptive filter and a semi-fixed filter are provided.
The adaptive filter is a filter in which an echo component of digital audio data obtained by digitizing an audio signal is detected, an echo cancellation process is performed to remove the detected echo component, and filter coefficients for detecting the echo component are sequentially updated. .
The semi-fixed filter saves the filter coefficient value set by the adaptive filter, and when it is detected that the filter coefficient value set by the adaptive filter is appropriate for a predetermined number of times in succession. This is a filter that sets an evacuated filter coefficient value and performs echo cancellation processing.
And the echo noise removal process at the time of transmission and / or reception is performed by the semi-fixed filter configured as described above.

このようにしたことで、係数値が逐次更新される適応フィルタの係数が、半固定フィルタよりも複数回優れていた場合に、その複数回の最初の係数を半固定フィルタに退避するので、既に連続して正しい係数である可能性が高いと判断されたものが半固定フィルタに設定されるようになる。従って、1回の誤りの判断の影響を小さくした、適正なフィルタ係数の設定が可能となる。   By doing in this way, when the coefficient of the adaptive filter whose coefficient value is sequentially updated is better than the semi-fixed filter multiple times, the first coefficient of the multiple times is saved in the semi-fixed filter. Those determined to be highly likely to be correct coefficients continuously are set in the semi-fixed filter. Accordingly, it is possible to set an appropriate filter coefficient that reduces the influence of a single error determination.

本発明によると、フィルタ係数の1回の誤りの判断があっても、半固定フィルタに設定される係数には影響しなくなり、半固定フィルタに適正なフィルタ係数が設定される可能性が高くなり、誤りの少ない適正なエコーキャンセル処理が行えるようになり、精度の高いエコーキャンセルが行える。従って、拡声通話系で全二重通話を行う場合のエコーやハウリングを効果的に防止できる。   According to the present invention, even if there is a single determination of an error in the filter coefficient, the coefficient set in the semi-fixed filter is not affected, and there is a high possibility that an appropriate filter coefficient is set in the semi-fixed filter. Thus, it is possible to perform an appropriate echo cancellation process with few errors, and to perform highly accurate echo cancellation. Accordingly, it is possible to effectively prevent echo and howling when a full-duplex call is made in a loudspeaker call system.

以下、本発明の一実施の形態を、添付図面を参照して説明する。   Hereinafter, an embodiment of the present invention will be described with reference to the accompanying drawings.

図1は、本実施の形態による全体構成例を示した図である。図1に示すように、近端装置10と遠端装置20とを通信回線30で接続したシステム構成としてある。本例の近端装置10と遠端装置20とは、テレビ会議システム用の装置であり、全二重通話を行う構成である。基本的には、近端装置10と遠端装置20とで同一の構成としてある。映像系の伝送構成については省略してある。それぞれの装置10,20は、スピーカ11,21から音声を拡声させて出力させ、マイクロフォン12,22で音声を拾う、いわゆる拡声通話を行う通信装置として構成され、各装置のスピーカ11,21から出力された音声がマイクロフォン12,22でも拾われる構成である。   FIG. 1 is a diagram showing an example of the overall configuration according to the present embodiment. As shown in FIG. 1, the system configuration is such that a near-end device 10 and a far-end device 20 are connected by a communication line 30. The near-end device 10 and the far-end device 20 in this example are devices for a video conference system, and are configured to perform full duplex calls. Basically, the near-end device 10 and the far-end device 20 have the same configuration. The video transmission configuration is omitted. Each of the devices 10 and 20 is configured as a communication device that performs a so-called loudspeaking call in which sound is amplified and output from the speakers 11 and 21 and picked up by the microphones 12 and 22, and is output from the speakers 11 and 21 of each device. The voice is picked up by the microphones 12 and 22 as well.

それぞれの装置10,20は、通信回線30は、近端装置10と遠端装置20との間で双方向にデジタルデータのデータ伝送が可能であれば、どのような通信回線でもよい。例えば、イーサーネット(登録商標)により接続された通信回線、電話回線などの通信事業者により提供される通信回線、インターネットを経由した回線などが適用可能である。以下の説明では、近端装置10の構成について説明するが、遠端装置20の構成についても同一であり、それぞれの装置で後述するエコーキャンセル処理が行われる。   Each of the devices 10 and 20 may be any communication line as long as the communication line 30 can transmit digital data in both directions between the near-end device 10 and the far-end device 20. For example, a communication line provided by a communication provider such as a communication line connected by Ethernet (registered trademark) or a telephone line, a line via the Internet, or the like is applicable. In the following description, the configuration of the near-end device 10 will be described, but the configuration of the far-end device 20 is also the same, and echo cancellation processing described later is performed in each device.

図1に示すように、近端装置10のマイクロフォン12が拾って出力する音声信号は、アナログ/デジタル変換器14でデジタル音声データに変換され、その変換されたデジタル音声データを、信号処理部15に送る。本例の信号処理部15は、デジタルシグナルプロセッサー(DSP)で構成され、入力及び出力の音声データを所望のデータへ変換する処理を行う。その信号処理部15で行われる処理の1つとして、マイクロフォン12側から入力した信号に対してエコーノイズをキャンセルするノイズ除去処理が行われる。ノイズ除去処理のための構成については、後述する図2で説明する。   As shown in FIG. 1, an audio signal picked up and output by the microphone 12 of the near-end device 10 is converted into digital audio data by an analog / digital converter 14, and the converted digital audio data is converted into a signal processing unit 15. Send to. The signal processing unit 15 of this example is configured by a digital signal processor (DSP), and performs processing for converting input and output audio data into desired data. As one of the processes performed by the signal processing unit 15, a noise removal process for canceling echo noise is performed on the signal input from the microphone 12 side. A configuration for noise removal processing will be described later with reference to FIG.

信号処理部15で処理された音声データは、音声コーデック部16に送り、伝送用にコーデック処理を行う。ここでは、音声データをテレビ会議システムの通信で標準的に定められている符号へ変換を行う。変換された音声データは通信部17に送り、通信回線30を介して遠端装置20に送信させる。   The audio data processed by the signal processing unit 15 is sent to the audio codec unit 16 to perform codec processing for transmission. Here, the audio data is converted into a code that is standardized by communication of the video conference system. The converted voice data is sent to the communication unit 17 and transmitted to the far end device 20 via the communication line 30.

遠端装置20から通信回線30を介して近端装置10の通信部17で受信した音声データは、音声コーデック部16でデコーデック処理を行った後、信号処理部15に送る。信号処理部15では、供給される受信音声データを、後述するエコーノイズをキャンセルするために必要なデータとして扱う。信号処理部15が出力する音声データは、デジタル/アナログ変換器13でアナログ音声信号に変換し、変換された音声信号をスピーカ11から出力させる。なお、図1ではアンプや帯域フィルタなどのアナログ音声信号処理に必要な回路については省略してある。   The audio data received by the communication unit 17 of the near-end device 10 from the far-end device 20 via the communication line 30 is subjected to decodec processing by the audio codec unit 16 and then sent to the signal processing unit 15. The signal processing unit 15 handles the supplied reception audio data as data necessary for canceling echo noise described later. The audio data output from the signal processing unit 15 is converted into an analog audio signal by the digital / analog converter 13, and the converted audio signal is output from the speaker 11. In FIG. 1, circuits necessary for analog audio signal processing such as an amplifier and a band filter are omitted.

図2は、信号処理部15の構成例を示した図である。図2では、エコーノイズキャンセル処理のための構成を中心とし示してあり、その他の信号処理の構成については省略してある。
マイクロフォン12で拾って、アナログ/デジタル変換器14で変換されたデジタル音声データは、適応フィルタ51と半固定フィルタ53とに供給される。適応フィルタ51と半固定フィルタ53は、それぞれ、FIR(Finite Impulse Responce)形のフィルタで構成してある。FIR形のフィルタで構成される各フィルタ51,53は、フィルタ係数の設定により、入力信号から遅れてくるエコーノイズ成分を除去する処理が行われる。この場合、適応フィルタ51は係数値が随時更新されるフィルタであり、そのときの信号状態に応じて最適と思われる係数値を推定して、その推定した係数値に随時更新される。
半固定フィルタ53は、フィルタ比較器54での比較に基づいた制御で、フィルタ係数が所定時に更新されるフィルタである。適応フィルタ51で設定されるフィルタ係数値は、所定の際に、退避フィルタにコピーされて退避される。その退避フィルタ52に退避されたフィルタ係数値を、半固定フィルタ53に設定する構成としてある。具体的なフィルタ係数の更新処理については、図3のフローチャートを参照して後述する。
FIG. 2 is a diagram illustrating a configuration example of the signal processing unit 15. In FIG. 2, the configuration for echo noise cancellation processing is mainly shown, and the configuration of other signal processing is omitted.
The digital audio data picked up by the microphone 12 and converted by the analog / digital converter 14 is supplied to the adaptive filter 51 and the semi-fixed filter 53. Each of the adaptive filter 51 and the semi-fixed filter 53 is configured by an FIR (Finite Impulse Response) type filter. Each of the filters 51 and 53 composed of FIR type filters is subjected to processing for removing echo noise components delayed from the input signal by setting the filter coefficient. In this case, the adaptive filter 51 is a filter whose coefficient values are updated at any time. The coefficient value which seems to be optimal is estimated according to the signal state at that time, and is updated as needed with the estimated coefficient value.
The semi-fixed filter 53 is a filter whose filter coefficient is updated at a predetermined time by control based on the comparison in the filter comparator 54. The filter coefficient value set by the adaptive filter 51 is copied and saved to the save filter at a predetermined time. The filter coefficient value saved in the save filter 52 is set in the semi-fixed filter 53. A specific filter coefficient update process will be described later with reference to the flowchart of FIG.

次に、図3のフローチャートを参照して、近端装置10での音声データの処理例について説明する。
まず、近端装置10では、通信回線30を介して遠端装置20からの符号化された音声データが通信部17で受信される(ステップS11)。その受信音声データは、音声コーデックブロック16でデコードされる。例えば、サンプリング周波数が32KHzで、1サンプルが16ビットのストレートPCMのデジタル音声データにデコードされる。そのデコードされた音声データは、DSPとして構成された信号処理部15に参照信号として送られると同時に、デジタル/アナログ変換器13にも送られる(ステップS12)。デジタル/アナログ変換器13で変換して得たアナログ音声信号は、スピーカ11に供給し(ステップS13)、そのスピーカ11から放音させる(ステップS14)。このスピーカ11からの放音時には、図示しないアンプで増幅処理を行い、拡声通話を行う上で十分な音量で出力させる。
Next, a processing example of audio data in the near-end device 10 will be described with reference to the flowchart of FIG.
First, in the near-end device 10, the encoded voice data from the far-end device 20 is received by the communication unit 17 via the communication line 30 (step S11). The received audio data is decoded by the audio codec block 16. For example, the sampling frequency is 32 KHz, and one sample is decoded into 16-bit straight PCM digital audio data. The decoded audio data is sent as a reference signal to the signal processing unit 15 configured as a DSP and simultaneously sent to the digital / analog converter 13 (step S12). The analog audio signal obtained by the conversion by the digital / analog converter 13 is supplied to the speaker 11 (step S13) and emitted from the speaker 11 (step S14). At the time of sound emission from the speaker 11, amplification processing is performed by an amplifier (not shown), and the sound is output at a sufficient volume for making a loud call.

ステップS11及びS12での受信処理と並行して、マイクロフォン12で拾われて(ステップS15)、アナログ/デジタル変換器14で変換されたデジタル音声データについても、DSPとして構成された信号処理部15に、マイク入力信号として送られる(ステップS16)。ステップS12での参照信号の信号処理部15への入力と、ステップS16でのマイク入力信号の信号処理部15への供給は、常に1サンプルずつ同じタイミングで信号処理部15に与えられるものとしてある。   In parallel with the reception processing in steps S11 and S12, the digital audio data picked up by the microphone 12 (step S15) and converted by the analog / digital converter 14 is also sent to the signal processing unit 15 configured as a DSP. Are sent as microphone input signals (step S16). The input of the reference signal to the signal processing unit 15 in step S12 and the supply of the microphone input signal to the signal processing unit 15 in step S16 are always given to the signal processing unit 15 one sample at a time. .

そして、信号処理部15では、半固定フィルタ53に設定された係数を用いて、以下の[数1]式によりエコーキャンセリング処理の対象となる時刻tのマイク入力信号に含まれるエコー成分の推定値y(t)を算出し、その値をマイク入力信号の値から減算(エコーキャンセリング)して音声コーデック部16へと送る(ステップS17)。   Then, the signal processing unit 15 uses the coefficient set in the semi-fixed filter 53 to estimate the echo component included in the microphone input signal at the time t that is the target of the echo canceling process according to the following [Equation 1]. The value y (t) is calculated, and the value is subtracted (echo canceling) from the value of the microphone input signal and sent to the voice codec unit 16 (step S17).

Figure 2008160420
Figure 2008160420

ここでw(n)は、{w0,w1,…,wp−1}の順で配列されたn回目のエコーキャンセリング処理での適応フィルタの係数ベクトル(p次元)、x(n)は、{x,xt−1,xt−2,…,xt−(p−1)}の順で配列された参照信号の時間領域データのベクトルを表す。 Here, w (n) is a coefficient vector (p dimension) of the adaptive filter in the n-th echo canceling processing arranged in the order of {w 0 , w 1 ,..., W p−1 }, x (n ) Represents a vector of time domain data of reference signals arranged in the order of {x t , x t−1 , x t−2 ,..., X t− (p−1) }.

次に、信号処理部15内の適応フィルタ51(図2)において、[数1]式によりエコーキャンセリング処理の対象となる時刻tのマイク入力信号に含まれるエコー成分の推定値y(t)を算出する(ステップS18)。そして、推定されたy(t)をマイク入力信号の値から減算した値をエラーe(n)として、例えば、次の[数2]式の更新式を用いて、n+1ターン目の係数ベクトルw(n+1)を決定する。[数2]式のμは、更新のステップサイズである。   Next, in the adaptive filter 51 (FIG. 2) in the signal processing unit 15, the estimated value y (t) of the echo component included in the microphone input signal at the time t that is the target of the echo canceling process according to the equation [1] Is calculated (step S18). Then, a value obtained by subtracting the estimated y (t) from the value of the microphone input signal is used as an error e (n), and the coefficient of the (n + 1) th turn is calculated using, for example, the update equation of the following [Equation 2]. The vector w (n + 1) is determined. In the formula 2, μ is an update step size.

Figure 2008160420
Figure 2008160420

図2に示した比較器54は、適応フィルタ51と半固定フィルタ53とで、どちらがエコーを消去するのに優れているかを判断するが、その判断用にカウンタを保有しており、そのカウンタを使用した処理が行われる。即ち、まずカウンタのカウント値が0か否か判断する(ステップS19)。この判断でカウント値が0の場合には、適応フィルタ51の係数を退避フィルタ52へコピーする(ステップS20)。その後、比較器54で、適応フィルタ51の係数値より半固定フィルタ53の係数値の方がエコーを消去するのに適しているか否かを判断する(ステップS21)。この判断で、適応フィルタ51の係数値の方が適していると判断した場合には、比較器54内のカウンタを0にリセットする(ステップS23)。また、半固定フィルタ53の係数値の方が適していると判断した場合には、比較器54内のカウンタのカウント値に1を加算する(ステップS22)。   The comparator 54 shown in FIG. 2 determines which of the adaptive filter 51 and the semi-fixed filter 53 is superior in canceling echo, and has a counter for the determination. Used processing is performed. That is, first, it is determined whether or not the count value of the counter is 0 (step S19). If the count value is 0 in this determination, the coefficient of the adaptive filter 51 is copied to the save filter 52 (step S20). Thereafter, the comparator 54 determines whether or not the coefficient value of the semi-fixed filter 53 is more suitable for canceling the echo than the coefficient value of the adaptive filter 51 (step S21). If it is determined by this determination that the coefficient value of the adaptive filter 51 is more suitable, the counter in the comparator 54 is reset to 0 (step S23). When it is determined that the coefficient value of the semi-fixed filter 53 is more suitable, 1 is added to the count value of the counter in the comparator 54 (step S22).

その後、比較器54内のカウンタのカウント値を判断し(ステップS24)、そのカウント値が予め設定された閾値以上であるか否か判断する。ここでの閾値としては、例えば40を設定する。この判断でカウント値が閾値以上であると判断した場合には、退避フィルタ52が保持しているフィルタ係数値を、半固定フィルタ53にコピーして設定させる(ステップS25)。このときには、カウンタのカウント値を0にリセットする(ステップS26)。   Thereafter, the count value of the counter in the comparator 54 is determined (step S24), and it is determined whether or not the count value is equal to or greater than a preset threshold value. For example, 40 is set as the threshold here. If it is determined that the count value is greater than or equal to the threshold value, the filter coefficient value held by the evacuation filter 52 is copied and set to the semi-fixed filter 53 (step S25). At this time, the count value of the counter is reset to 0 (step S26).

ここまでがノイズキャンセル処理であり、このようにしてノイズキャンセル処理が行われた音声データを、近端装置10の通信部17から通信回線30を介して遠端装置20に送る(ステップS27)。このような図3のフローチャートに示すノイズキャンセル処理が、近端装置10と遠端装置20の双方で行われることで、エコーノイズのない全二重通話が行えるようになる。この図3のフローチャートに示した係数値の更新処理は、双方向の通信を行っている限り、絶えず実行されて、そのときの状態に応じた最適な係数値が設定される。   Up to this point is the noise cancellation processing, and the audio data subjected to the noise cancellation processing in this way is sent from the communication unit 17 of the near-end device 10 to the far-end device 20 via the communication line 30 (step S27). Such a noise cancellation process shown in the flowchart of FIG. 3 is performed by both the near-end device 10 and the far-end device 20, so that a full-duplex call without echo noise can be performed. The coefficient value update process shown in the flowchart of FIG. 3 is continuously executed as long as bidirectional communication is performed, and an optimum coefficient value corresponding to the state at that time is set.

ここで、図3のフローチャートに示した処理が行われる状態の概要を、図4に示す。図4(a)は、本実施の形態による処理状態であり、図4(b)は、比較のために従来の処理状態を示してある。
ここではステップS24で判断される閾値として「40」を設定した場合の例である。図4(a)に示すように、本実施の形態の場合には、適応フィルタ51で適正な係数が設定されていると判断され始めたとき、その係数値が退避フィルタ52に退避される。その上で、適応フィルタ51の係数値については逐次更新されるが、その後、40回連続して正しい係数値であると比較器54で判断された場合には、少なくともその退避フィルタ52に退避された40回前の係数値が、適正にエコーノイズを除去できる正しいフィルタ係数である可能性が高いと判断する。その判断に基づいて、退避フィルタ52に退避された40回前の係数値を半固定フィルタ53に設定する。従って、半固定フィルタ53に設定された係数値は、ある程度評価が定まった係数値であると見なすことができ、誤った係数値が設定されることを良好に阻止することができる。
Here, FIG. 4 shows an outline of a state in which the processing shown in the flowchart of FIG. 3 is performed. FIG. 4A shows a processing state according to this embodiment, and FIG. 4B shows a conventional processing state for comparison.
In this example, “40” is set as the threshold value determined in step S24. As shown in FIG. 4A, in the case of the present embodiment, when the adaptive filter 51 starts to determine that an appropriate coefficient is set, the coefficient value is saved in the save filter 52. After that, the coefficient value of the adaptive filter 51 is sequentially updated. Thereafter, when the comparator 54 determines that the coefficient value is the correct coefficient value 40 times in succession, the coefficient value is saved in at least the save filter 52. It is determined that there is a high possibility that the coefficient value 40 times before is a correct filter coefficient that can properly remove the echo noise. Based on this determination, the coefficient value 40 times before saved in the save filter 52 is set in the semi-fixed filter 53. Therefore, the coefficient value set in the semi-fixed filter 53 can be regarded as a coefficient value that has been evaluated to some extent, and it is possible to satisfactorily prevent an incorrect coefficient value from being set.

これに対して、図4(b)に示した従来処理状態では、ある程度の回数(例えば40回)連続して適応フィルタの係数値が正しいと判断した場合に、その40回目に適応フィルタに設定されていた係数値を半固定フィルタにコピーする処理である。この従来処理では、もし、40回目の係数値が誤った係数値であると、その誤った係数値がそのまま半固定フィルタに設定されてしまい、次に半固定フィルタの係数値が更新されるまで、誤った処理が継続することになり、好ましくない状態となってしまう。   On the other hand, in the conventional processing state shown in FIG. 4B, when it is determined that the coefficient value of the adaptive filter is correct for a certain number of times (for example, 40 times) continuously, the adaptive filter is set to the 40th time. This is a process of copying the coefficient value that has been made to the semi-fixed filter. In this conventional process, if the 40th coefficient value is an incorrect coefficient value, the incorrect coefficient value is set as it is in the semi-fixed filter, and then the coefficient value of the semi-fixed filter is updated. Incorrect processing will continue, which is not preferable.

このように、図4(a)の本実施の形態の処理例と、図4(b)の従来処理例とを比較すると判るように、本実施の形態の処理を行うことで、一時的な判断の誤りの影響を排除した良好なエコーノイズ除去処理が可能となる。   As described above, the processing of the present embodiment shown in FIG. 4A is compared with the conventional processing example of FIG. Good echo noise removal processing that eliminates the influence of judgment errors is possible.

なお、上述した実施の形態では、比較器54内のカウンタのカウント値を判断する閾値として、「40」を設定した例としたが、この値「40」は一例であり、その他の値を閾値として設定するようにしてもよい。この判断する値として大きな値を設定することで、それだけ連続して正しいと判断された場合の係数値が設定されるので、正しい係数値が設定される可能性が高くなるが、あまり大きな値であると、逆に一時的な判断の誤りなどで、その値連続して正しいと判断される可能性が低くなり、半固定フィルタの係数値の更新が行われる頻度が低くなってしまうので、適正な値を設定するのが好ましい。   In the embodiment described above, “40” is set as the threshold value for determining the count value of the counter in the comparator 54. However, this value “40” is an example, and other values are set as threshold values. You may make it set as. By setting a large value as the value to be determined, the coefficient value when it is determined that it is continuously correct is set, so there is a high possibility that the correct coefficient value will be set. If there is, the possibility that the value is continuously determined to be correct is reduced due to a temporary determination error and the coefficient value of the semi-fixed filter is updated less frequently. It is preferable to set a correct value.

また、ここまで説明した実施の形態では、テレビ会議システム用の装置において、エコーノイズキャンセルを行う構成としたが、拡声通話系で全二重通話を行うものであれば、ハンズフリー通話を行う電話機(有線回線用の電話機又は無線電話機)などのその他の各種通信機器にも適用可能である。また、上述したエコーノイズキャンセル処理を行うコンピュータ用のプログラムを作成して、コンピュータ装置とその周辺機器で同様の全二重通話を行う通信機器として組んだ上で、そのコンピュータ装置に、作成した処理プログラムを実装させて、同様のノイズキャンセル処理が行える通信装置として機能するようにしてもよい。この場合、近端装置として構成されたコンピュータ装置と、遠端装置としてコンピュータ装置との間は、例えばインターネットを介して双方向にデータ伝送可能に接続させればよい。   Further, in the embodiment described so far, the apparatus for the video conference system is configured to cancel the echo noise. However, if the full-duplex call is performed in the voice call system, the telephone that performs the hands-free call. The present invention can also be applied to other various communication devices such as (wired line telephones or wireless telephones). In addition, a computer program for performing the above-described echo noise canceling process is created, and the computer apparatus and its peripheral devices are assembled as a communication device for performing a similar full-duplex call. You may make it function as a communication apparatus which can implement a program and can perform the same noise cancellation process. In this case, a computer device configured as a near-end device and a computer device as a far-end device may be connected so as to be able to transmit data in both directions via the Internet, for example.

本発明の一実施の形態による全体構成例を示す構成図である。It is a block diagram which shows the example of whole structure by one embodiment of this invention. 本発明の一実施の形態による要部の構成例を示すブロック図である。It is a block diagram which shows the structural example of the principal part by one embodiment of this invention. 本発明の一実施の形態による処理例を示すフローチャートである。It is a flowchart which shows the process example by one embodiment of this invention. 本発明の一実施の形態による処理状態の概要を従来例と比較して示す説明図であり、(a)は一実施の形態による処理例、(b)は従来例による処理例である。It is explanatory drawing which shows the outline | summary of the processing state by one Embodiment of this invention compared with a prior art example, (a) is a processing example by one Embodiment, (b) is a processing example by a prior art example.

符号の説明Explanation of symbols

10…近端装置、11…スピーカ、12…マイクロフォン、13…デジタル/アナログ変換器、14…アナログ/デジタル変換器、15…信号処理部、16…音声コーデック部、17…通信部、20…遠端装置、21…スピーカ、22…マイクロフォン、30…通信回線、51…適応フィルタ、52…退避フィルタ、53…半固定フィルタ、54…フィルタ比較器   DESCRIPTION OF SYMBOLS 10 ... Near-end device, 11 ... Speaker, 12 ... Microphone, 13 ... Digital / analog converter, 14 ... Analog / digital converter, 15 ... Signal processing part, 16 ... Voice codec part, 17 ... Communication part, 20 ... Far End device, 21 ... Speaker, 22 ... Microphone, 30 ... Communication line, 51 ... Adaptive filter, 52 ... Retraction filter, 53 ... Semi-fixed filter, 54 ... Filter comparator

Claims (3)

マイクロフォンが拾った音声信号を送信及び/又は受信する際のエコーノイズの除去を行うエコーノイズキャンセル装置において、
前記音声信号をデジタル化したデジタル音声データのエコー成分を検出して、その検出したエコー成分を除去するエコーキャンセル処理を行い、前記エコー成分を検出するフィルタ係数が逐次更新される適応フィルタと、
前記適応フィルタで設定されたフィルタ係数値を退避し、その退避した状態で前記適応フィルタで設定されたフィルタ係数値が、所定の複数回連続して適正であると検出された場合に、前記退避したフィルタ係数値を設定して、前記エコーキャンセル処理を行う半固定フィルタとを備え、
前記半固定フィルタで前記送信及び/又は受信する際のエコーノイズの除去処理を行うことを特徴とする
エコーノイズキャンセル装置。
In an echo noise canceling device for removing echo noise when transmitting and / or receiving an audio signal picked up by a microphone,
Detecting an echo component of digital audio data obtained by digitizing the audio signal, performing echo cancellation processing to remove the detected echo component, and an adaptive filter in which filter coefficients for detecting the echo component are sequentially updated;
The filter coefficient value set by the adaptive filter is saved, and when the filter coefficient value set by the adaptive filter is detected to be appropriate for a predetermined number of times in the saved state, the saving is performed. A semi-fixed filter that performs the echo cancellation processing,
An echo noise canceling apparatus, wherein the semi-fixed filter performs an echo noise removal process when transmitting and / or receiving.
請求項1記載のエコーノイズキャンセル装置において、
前記退避されたフィルタ係数値を一時記憶するフィルタ係数一時記憶部を備え、
前記所定の複数回連続して適正であると検出された場合に、前記フィルタ係数一時記憶部に記憶されたフィルタ係数値を前記半固定フィルタに設定することを特徴とする
エコーノイズキャンセル装置。
The echo noise canceling device according to claim 1,
A filter coefficient temporary storage unit for temporarily storing the saved filter coefficient value;
An echo noise canceling apparatus, wherein when it is detected that the predetermined number of times is appropriate, the filter coefficient value stored in the filter coefficient temporary storage unit is set in the semi-fixed filter.
マイクロフォンが拾った音声信号を送信及び/又は受信する際のエコーノイズの除去を行うエコーノイズキャンセル方法において、
前記音声信号をデジタル化したデジタル音声データのエコー成分を検出して、その検出したエコー成分を除去するエコーキャンセル処理を行う適応フィルタに対して、適正なフィルタ係数を第1のフィルタに対して逐次設定する第1のフィルタ係数設定処理と、
前記フィルタ係数設定処理で行ったエコーキャンセル処理が適正であるか否か判断する判断処理と、
前記判断処理で、所定の複数回連続して適正である場合に、その連続した回数の最初の判断時に第1のフィルタに設定されていたフィルタ係数値を第2のフィルタに設定させる第2のフィルタ係数設定処理とを行い、
前記第2のフィルタ係数設定処理でフィルタ係数が設定された第2のフィルタを、前記送信及び/又は受信する際のエコーノイズの除去処理に使用することを特徴とする
エコーノイズキャンセル方法。
In an echo noise canceling method for removing echo noise when transmitting and / or receiving an audio signal picked up by a microphone,
An appropriate filter coefficient is sequentially applied to the first filter for an adaptive filter that performs echo cancellation processing for detecting an echo component of digital audio data obtained by digitizing the audio signal and removing the detected echo component. A first filter coefficient setting process to be set;
A determination process for determining whether or not the echo cancellation process performed in the filter coefficient setting process is appropriate;
In the determination process, when it is appropriate for a predetermined number of consecutive times, a second filter coefficient value set in the first filter at the first determination of the consecutive number of times is set in the second filter. Perform filter coefficient setting processing,
An echo noise canceling method, wherein the second filter whose filter coefficient is set in the second filter coefficient setting process is used for an echo noise removal process in the transmission and / or reception.
JP2006346242A 2006-12-22 2006-12-22 Echo noise canceller and echo noise canceling method Pending JP2008160420A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006346242A JP2008160420A (en) 2006-12-22 2006-12-22 Echo noise canceller and echo noise canceling method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006346242A JP2008160420A (en) 2006-12-22 2006-12-22 Echo noise canceller and echo noise canceling method

Publications (1)

Publication Number Publication Date
JP2008160420A true JP2008160420A (en) 2008-07-10

Family

ID=39660842

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006346242A Pending JP2008160420A (en) 2006-12-22 2006-12-22 Echo noise canceller and echo noise canceling method

Country Status (1)

Country Link
JP (1) JP2008160420A (en)

Similar Documents

Publication Publication Date Title
JP4569618B2 (en) Echo canceller and speech processing apparatus
CN103748865B (en) Utilize the clock deskew of the acoustic echo arrester of not audible tone
US20090046866A1 (en) Apparatus capable of performing acoustic echo cancellation and a method thereof
US8160239B2 (en) Echo canceller and speech processing apparatus
JP2018535602A (en) Double talk detection for acoustic echo cancellation
US6650701B1 (en) Apparatus and method for controlling an acoustic echo canceler
JPH09172396A (en) System and method for removing influence of acoustic coupling
JP4678349B2 (en) Call determination device
JP2009118139A (en) Echo canceler, and echo canceling program
JP2005142659A (en) Echo canceller
JP2009094802A (en) Telecommunication apparatus
JP4432916B2 (en) Audio processing device
JP2009017029A (en) Device and method for processing sound signal
JP2005142756A (en) Echo canceller
JP4887181B2 (en) Echo prevention device and program
JP2008131378A (en) Echo processing method and apparatus
US20100002866A1 (en) Voice communication apparatus
JP2008160420A (en) Echo noise canceller and echo noise canceling method
JP5963077B2 (en) Telephone device
JP2006067127A (en) Method and apparatus of reducing reverberation
JP2974504B2 (en) Echo canceller
JP2004297791A (en) Echo cancellation apparatus, echo cancellation method, program and recording medium
JP2000353989A (en) Echo canceller
WO2024009892A1 (en) Echo suppressing device, echo suppressing method, and echo suppressing program
JP3321411B2 (en) Echo canceler