JP4395195B1 - Echo canceller - Google Patents
Echo canceller Download PDFInfo
- Publication number
- JP4395195B1 JP4395195B1 JP2009052680A JP2009052680A JP4395195B1 JP 4395195 B1 JP4395195 B1 JP 4395195B1 JP 2009052680 A JP2009052680 A JP 2009052680A JP 2009052680 A JP2009052680 A JP 2009052680A JP 4395195 B1 JP4395195 B1 JP 4395195B1
- Authority
- JP
- Japan
- Prior art keywords
- filter
- linear prediction
- signal
- whitened
- echo
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
- Telephone Function (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
【課題】擬似エコー生成用フィルタの演算量を削減すること。
【解決手段】適応フィルタ106aは、有限個の非零の音源パルス列である線形予測残差ベクトルε(t)をタップ係数H(t)で演算して白色化擬似エコーrw(t)を生成する。逆フィルタ106bは、ディジタル送信音声信号y(t)を白色化する。加算器106cは、白色化送信音声信号yw(t)から白色化擬似エコーrw(t)を減算して白色化残差信号ew(t)を得る。擬似エコー生成用フィルタ106dは、適応フィルタ106aから出力されたタップ係数H(t)で線形予測残差ベクトルε(t)を演算して白色化擬似エコーrw’(t)を生成する。合成フィルタ106eは、白色化擬似エコーrw’(t)を、線形予測係数L(t)を用いて合成し、擬似エコーr(t)を生成する。加算器106fは、ディジタル送信音声信号y(t)から擬似エコーr(t)を減算して残差信号e(t)を得る。
【選択図】図1A calculation amount of a filter for generating a pseudo echo is reduced.
An adaptive filter 106a generates a whitened pseudo echo rw (t) by calculating a linear prediction residual vector ε (t), which is a finite number of non-zero excitation pulse trains, with a tap coefficient H (t). . The inverse filter 106b whitens the digital transmission audio signal y (t). The adder 106c subtracts the whitened pseudo echo rw (t) from the whitened transmission audio signal yw (t) to obtain a whitened residual signal ew (t). The pseudo echo generation filter 106d calculates a linear prediction residual vector ε (t) using the tap coefficient H (t) output from the adaptive filter 106a to generate a whitened pseudo echo rw ′ (t). The synthesis filter 106e synthesizes the whitened pseudo echo rw ′ (t) using the linear prediction coefficient L (t) to generate the pseudo echo r (t). The adder 106f subtracts the pseudo echo r (t) from the digital transmission voice signal y (t) to obtain a residual signal e (t).
[Selection] Figure 1
Description
本発明は、スピーカから出力された音声がマイクロホンに帰還されることによって発生するエコーを消去するためのエコーキャンセラに関する。 The present invention relates to an echo canceller for canceling an echo generated when a sound output from a speaker is fed back to a microphone.
図1は、従来のエコーキャンセラの構成を示すブロック図である。図1において、符号化ディジタル信号(受信信号)は、音声復号回路(SPDEC)11でディジタル受信音声信号x(t)に復号され、ディジタル・アナログ変換器(DAC)12でアナログ受信音声信号に変換され、スピーカ13から音声として出力される。また、マイクロホン14に入力されたアナログ送信音声信号は、アナログ・ディジタル変換器(ADC)15でディジタル送信音声信号y(t)に変換され、音声符号化回路(SPCOD)17で符号化ディジタル信号(送信信号)に変換される。その際、スピーカ13から出力された音声がマイクロホン14に帰還されると、エコーが発生する。エコーが発生すると、自分の話した声がスピーカから遅れて聞こえるので、大変耳障りである。また、ハンズフリー電話等においては、エコーの中の特定の周波数成分が増幅されて、ハウリング(発振現象)が起きることもある。
FIG. 1 is a block diagram showing a configuration of a conventional echo canceller. In FIG. 1, an encoded digital signal (received signal) is decoded into a digital received voice signal x (t) by a voice decoding circuit (SPDEC) 11 and converted into an analog received voice signal by a digital / analog converter (DAC) 12. Then, it is output as sound from the
エコーキャンセラ16は、エコー及びハウリングを防止するための回路であり、離散時刻tにおけるディジタル受信音声信号x(t)をタップ係数H(t)で演算して擬似エコーr(t)を生成する適応フィルタ16aと、アナログ・ディジタル変換器15から出力されるディジタル送信音声信号y(t)から擬似エコーr(t)を差し引いて残差信号e(t)を出力する加算器16bで構成される。残差信号e(t)は、送信回線に出力されると共に、適応フィルタ16aにタップ係数更新用の信号として与えられる。
The
マイクロホン14には、音声s(t)の他、背景雑音n(t)やスピーカ13からのエコーd(t)が入力され、これらがアナログ・ディジタル変換器15でディジタル送信音声信号y(t)に変換される。ここで、エコーd(t)のエコー経路のインパルス応答をm次のFIR(有限インパルス応答)フィルタで近似できると仮定すると、離散時刻tにおける適応フィルタ16aのタップ係数H(t)と、適応フィルタ16aに入力されるディジタル受信音声信号x(t)は、それぞれ次の式(1)、(2)のように表される。但し、Tはベクトルの転置を表す。
H(t)=[h1(t),h2(t),…,hm(t)]T・・・(1)
x(t)=[x(t),x(t−1),…,x(t−m+1)]T・・・(2)
In addition to the sound s (t), the background noise n (t) and the echo d (t) from the
H (t) = [h1 (t), h2 (t),..., Hm (t)] T (1)
x (t) = [x (t), x (t−1),..., x (t−m + 1)] T (2)
これにより、擬似エコーr(t)と残差信号e(t)は、次の(3)、(4)のように表される。
r(t)=H(t)TX(t)・・・(3)
e(t)=y(t)−r(t)・・・(4)
Thereby, the pseudo echo r (t) and the residual signal e (t) are expressed as the following (3) and (4).
r (t) = H (t) TX (t) (3)
e (t) = y (t) -r (t) (4)
即ち、残差信号e(t)は、ディジタル送信音声信号y(t)から擬似エコーr(t)を差し引いて、ディジタル送信音声信号y(t)に含まれるエコー成分を抑圧した信号である。 That is, the residual signal e (t) is a signal obtained by subtracting the pseudo echo r (t) from the digital transmission voice signal y (t) and suppressing the echo component included in the digital transmission voice signal y (t).
タップ係数H(t)の更新は、一般に次の式(5)のように表される。なお、式(5)中のμはタップ係数の収束速度を調整するステップサイズであり、更新ベクトルΔH(t)は適応アルゴリズムの種類によって異なる。
H(t+1)=H(t)+μΔH(t)・・・(5)
The update of the tap coefficient H (t) is generally expressed as the following equation (5). Note that μ in the equation (5) is a step size for adjusting the convergence speed of the tap coefficient, and the update vector ΔH (t) varies depending on the type of the adaptive algorithm.
H (t + 1) = H (t) + μΔH (t) (5)
ところが、図1に示したエコーキャンセラでは、適応フィルタ16aに入力されるディジタル受信音声信号x(t)が、音声のような有色信号(スペクトル分布が一様でない信号)の場合、収束速度が著しく低下するという課題がある。
However, in the echo canceller shown in FIG. 1, when the digital received speech signal x (t) input to the
その解決策として、逆フィルタによって入力信号を白色信号(スペクトル分布が一様な信号)に変換して収束速度を高める方法が提案されている(特許文献1)。 As a solution, a method has been proposed in which an input signal is converted into a white signal (a signal having a uniform spectral distribution) by an inverse filter to increase the convergence speed (Patent Document 1).
特許文献1のエコーキャンセラは、マイクロホンに入力された自己の音声を白色化する第1の逆フィルタと、スピーカから再生される相手の音声を白色化する第2の逆フィルタとを有し、適応フィルタが、2つの逆フィルタから出力された白色信号を用いて擬似エコーを生成する。 The echo canceller of Patent Document 1 includes a first inverse filter that whitens the voice of its own input to the microphone, and a second inverse filter that whitens the voice of the other party reproduced from the speaker. The filter generates a pseudo echo using the white signal output from the two inverse filters.
また、非特許文献1には、音声復号回路を備えたディジタル通信装置に設けられるエコーキャンセラにおいて、音声符号化技術として線形予測係数及び線形予測残差ベクトルを利用する残差励振線形予測(「Residual Excited Linear Predictive (RELP)」)を用い、受信音声信号を白色化した信号を利用してフィルタのタップ係数を求めること(Figure 1 参照)に代えて、線形予測残差ベクトルに基づいて擬似エコー生成用フィルタによりフィルタのタップ係数を求めること(Figure 2 参照)が示されている(第1334頁、「III. ECHO CANCELLATION」及び「IV. VOICE CODEC AND ECHO CANCELLER INTEGRATION」参照)。 Further, Non-Patent Document 1 discloses a residual excitation linear prediction (“Residual” using a linear prediction coefficient and a linear prediction residual vector as a speech encoding technique in an echo canceller provided in a digital communication apparatus including a speech decoding circuit. Excited Linear Predictive (RELP) ”), instead of obtaining the tap coefficient of the filter using the whitened signal of the received speech signal (see Figure 1), pseudo echo generation based on the linear prediction residual vector (See Figure 2 on page 1334, "III. ECHO CANCELLATION" and "IV. VOICE CODEC AND ECHO CANCELLER INTEGRATION").
非特許文献1のエコーキャンセラは、白色化された線形予測合成音源信号が適応フィルタの入力になるので、受信音声信号を白色化するための逆フィルタを追加する必要がなくなり、特許文献1のエコーキャンセラに比べて、構成を簡略化することができ、収束速度を大幅に向上させることができる。また、非特許文献1のエコーキャンセラは、マルチパルス符号化等を用いて音源の情報圧縮を行った場合、適応フィルタへの入力信号が疎なパルス列となり、値0のサンプルに対する演算を省略することができるため、特許文献1のエコーキャンセラに比べて、適応フィルタの演算量を削減することができる。 The echo canceller of Non-Patent Document 1 eliminates the need to add an inverse filter for whitening the received speech signal because the whitened linear prediction synthesized sound source signal is input to the adaptive filter. Compared to a canceller, the configuration can be simplified and the convergence speed can be greatly improved. Further, the echo canceller of Non-Patent Document 1 omits the calculation for the sample of the value 0 when the input signal to the adaptive filter becomes a sparse pulse train when the information compression of the sound source is performed using multi-pulse encoding or the like. Therefore, the calculation amount of the adaptive filter can be reduced as compared with the echo canceller disclosed in Patent Document 1.
しかしながら、上記非特許文献1に開示された従来のエコーキャンセラは、擬似エコー生成用フィルタへの入力信号が合成音声であるので擬似エコー生成用フィルタの演算量を削減することができない。 However, the conventional echo canceller disclosed in Non-Patent Document 1 cannot reduce the calculation amount of the pseudo echo generation filter because the input signal to the pseudo echo generation filter is synthesized speech.
本発明はかかる点に鑑みてなされたものであり、フィルタの演算量を削減することができるエコーキャンセラを提供することを目的とする。 The present invention has been made in view of such a point, and an object thereof is to provide an echo canceller capable of reducing the amount of calculation of a filter.
本発明のエコーキャンセラは、線形予測分析によって得られた線形予測係数および線形予測残差ベクトルを受信し、前記線形予測係数により合成フィルタを駆動し、前記線形予測残差ベクトルを合成して受信音声信号を得る音声復号回路を備えたディジタル通信装置に設けられるエコーキャンセラであって、送信音声信号を白色化した信号と前記線形予測残差ベクトルとに基づいてフィルタのタップ係数を求めるタップ係数設定手段と、前記タップ係数、前記線形予測係数および前記線形予測残差ベクトルを用いて擬似エコーを生成し、前記擬似エコーを用いて前記送信音声信号に含まれるエコーを抑圧するエコー除去手段と、を具備する構成を採る。 The echo canceller of the present invention receives a linear prediction coefficient and a linear prediction residual vector obtained by linear prediction analysis, drives a synthesis filter with the linear prediction coefficient, synthesizes the linear prediction residual vector, and receives received speech. An echo canceller provided in a digital communication apparatus having a speech decoding circuit for obtaining a signal, wherein the tap coefficient setting means obtains a filter tap coefficient based on a signal obtained by whitening a transmission speech signal and the linear prediction residual vector And echo removing means for generating a pseudo echo using the tap coefficient, the linear prediction coefficient, and the linear prediction residual vector, and suppressing an echo included in the transmission voice signal using the pseudo echo. The structure to do is taken.
本発明によれば、マルチパルス符号化等を用いて音源の情報圧縮を行った場合、擬似エコー生成用フィルタへの入力信号も疎なパルス列となり、値0のサンプルに対する演算を省略することができるため、従来のエコーキャンセラに比べて、フィルタの演算量を削減することができる。 According to the present invention, when sound source information compression is performed using multi-pulse coding or the like, the input signal to the pseudo-echo generation filter is also a sparse pulse train, and the calculation for the sample of value 0 can be omitted. Therefore, the calculation amount of the filter can be reduced as compared with the conventional echo canceller.
以下、本発明の実施の形態について図面を参照して詳細に説明する。 Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.
(実施の形態1)
図2は、本発明の実施の形態1に係るエコーキャンセラを含むディジタル通信装置の構成を示すブロック図である。
(Embodiment 1)
FIG. 2 is a block diagram showing a configuration of the digital communication apparatus including the echo canceller according to Embodiment 1 of the present invention.
図2に示すように、ディジタル通信装置は、音声復号回路101と、ディジタル・アナログ変換器(DAC)102と、スピーカ103と、マイクロホン104と、アナログ・ディジタル変換器(ADC)105と、エコーキャンセラ106と、音声符号化回路107と、から主に構成される。
As shown in FIG. 2, the digital communication apparatus includes a speech decoding circuit 101, a digital / analog converter (DAC) 102, a
音声復号回路101は、デマルチプレクサ101aと、音源信号発生回路101bと、合成フィルタ101cと、を有する。エコーキャンセラ106は、適応フィルタ106aと、逆フィルタ106bと、加算器106cと、擬似エコー生成用フィルタ106dと、合成フィルタ106eと、加算器106fと、を有する。音声符号化回路107は、分析フィルタ107aと、音源特性分析回路107bと、マルチプレクサ107cと、を有する。
The audio decoding circuit 101 includes a
ここで、携帯電話システムや、テレビ電話システムでは、データ伝送量を削減するために、音源の情報量を圧縮する音源符号化処理および圧縮された音源の情報量を伸長する音源復号処理が必ず行われる。音源符号化処理は、ディジタル送信音声信号を10〜20ms程度のフレームに区切り、フレーム毎に線形予測分析を行い、線形予測係数(LPC)と線形予測残差信号を求め、線形予測係数と線形予測残差信号とを個別に符号化する処理である。また、音源復号処理は、線形予測係数により合成フィルタを駆動し、線形予測残差ベクトルを合成してディジタル受信音声信号を得る処理である。なお、線形予測係数は、音声のスペクトラム包絡を表すパラメータである。また、線形予測残差ベクトルとは、線形予測残差信号を区分化して伝送した信号を元の連続したデータストリームに戻したものである。 Here, in a cellular phone system or a videophone system, in order to reduce the amount of data transmission, excitation encoding processing for compressing the information amount of the excitation and excitation decoding processing for expanding the information amount of the compressed excitation are always performed. Is called. In the sound source encoding process, the digital transmission speech signal is divided into frames of about 10 to 20 ms, linear prediction analysis is performed for each frame, linear prediction coefficients (LPC) and linear prediction residual signals are obtained, and linear prediction coefficients and linear prediction are calculated. This is a process of individually encoding the residual signal. The sound source decoding process is a process of obtaining a digital received speech signal by driving a synthesis filter with a linear prediction coefficient and synthesizing a linear prediction residual vector. Note that the linear prediction coefficient is a parameter representing the spectrum envelope of speech. The linear prediction residual vector is a signal obtained by segmenting and transmitting a linear prediction residual signal and returning it to the original continuous data stream.
通信相手の装置から送信された符号化ディジタル信号(受信信号)は、線形予測残差ベクトルを符号化した音源特性パラメータと、線形予測係数とから構成され、音声復号回路101に入力される。 An encoded digital signal (received signal) transmitted from a communication partner apparatus is composed of a sound source characteristic parameter obtained by encoding a linear prediction residual vector and a linear prediction coefficient, and is input to the speech decoding circuit 101.
音声復号回路101は、符号化ディジタル信号(受信信号)を復号し、ディジタル受信音声信号x(t)を得る。デマルチプレクサ101aは、符号化ディジタル信号(受信信号)を、線形予測係数L(t)と音源特性パラメータとに分離する。音源信号発生回路101bは、音源特性パラメータを復号し、線形予測残差ベクトルε(t)を得る。合成フィルタ101cは、線形予測残差ベクトルε(t)を、線形予測係数L(t)を用いて合成し、ディジタル受信音声信号x(t)を得る。なお、合成フィルタ101cには、通常、PARCOR(partial auto-correlation coefficient)係数を用いた全極型の格子型フィルタまたはLSP(line spectrum pair)パラメータを用いたLSP合成フィルタが用いられる。
The voice decoding circuit 101 decodes the encoded digital signal (received signal) to obtain a digital received voice signal x (t). The
ディジタル・アナログ変換器102は、音声復号回路101から出力されたディジタル受信音声信号x(t)をアナログ受信音声信号に変換する。アナログ受信音声信号は、スピーカ103から音声として出力される。
The digital /
アナログ・ディジタル変換器105は、マイクロホン104に入力されたアナログ送信音声信号を、ディジタル送信音声信号y(t)に変換する。なお、マイクロホン104には、音声s(t)の他、背景雑音n(t)やスピーカ103からのエコーd(t)が入力される。
The analog /
エコーキャンセラ106は、アナログ・ディジタル変換器105から出力されたディジタル送信音声信号y(t)から擬似エコーr(t)を減算して残差信号e(t)を得る。なお、エコーキャンセラ106内部の各構成の詳細な説明は後述する。
The
音声符号化回路107は、エコーキャンセラ106から出力された残差信号e(t)を符号化ディジタル信号(送信信号)に変換する。分析フィルタ107aは、残差信号e(t)に対して線形予測分析を行ない、線形予測係数と線形予測残差信号を得る。音源特性分析回路107bは、ピッチ抽出処理とマルチパス符号化、または、ベクトル量子化等を行うことにより、線形予測残差信号を符号化して音源特性パラメータを得る。線形予測残差信号を符号化することにより、データ伝送量を圧縮することができる。マルチプレクサ107cは、線形予測係数と音源特性パラメータを多重して符号化ディジタル信号(送信信号)を得る。なお、分析フィルタ107aには、通常、全零型の格子型フィルタが用いられる。
The voice encoding circuit 107 converts the residual signal e (t) output from the
符号化ディジタル信号(送信信号)は、通信相手の装置に送信され、通信相手の装置において音声合成に用いられる。 The encoded digital signal (transmission signal) is transmitted to the communication partner device and used for speech synthesis in the communication partner device.
なお、図2中のデマルチプレクサ101a、音源信号発生回路101b、合成フィルタ101c、分析フィルタ107a、音源特性分析回路107bおよびマルチプレクサ107cは、音声圧縮伸長処理のために必要なものであり、本実施の形態のエコーキャンセラを用いるか否かにかかわらず、元々、ディジタル通信装置に備えられているものである。
It should be noted that the
次に、エコーキャンセラ106内部の各構成について、詳細に説明する。
Next, each component inside the
適応フィルタ106a及び擬似エコー生成用フィルタ106dには、音源信号発生回路101bから出力された線形予測残差ベクトルε(t)が入力される。マルチパス符号化等を用いて音源情報を圧縮した場合、線形予測残差ベクトルε(t)は、有限個の非零の音源パルス列(ごく少数のサンプルのみが0以外の値を有する音源パルス列)となる。
The linear prediction residual vector ε (t) output from the sound source
適応フィルタ106aは、離散時刻tにおける線形予測残差ベクトルε(t)をタップ係数H(t)で演算して白色化擬似エコーrw(t)を生成する。また、適応フィルタ106aは、加算器106cから出力された白色化残差信号ew(t)を最適値にするようにタップ係数H(t)の更新を行い、更新後のタップ係数H(t)を擬似エコー生成用フィルタ106dに出力する。
The
このように、適応フィルタ106aの入力信号を、有限個の非零の音源パルス列である線形予測残差ベクトルε(t)とすることにより、値0のサンプルについての演算を省略することができるので、白色化された受信音声信号を適応フィルタの入力信号とする場合(特許文献1)に比べて、適応フィルタ106aの演算量を低減することができる。
As described above, by using the linear prediction residual vector ε (t), which is a finite number of non-zero excitation pulse trains, as the input signal of the
例えば、サンプリング周波数10kHz、有声音の基本周波数100Hz/基本周期10ms(基本周期内のサンプル数100)、一周期分の音源信号を10個の非零のパルスの組み合わせとした場合を考える。この場合、フィルタのタップ長Nに対してNのオーダーの演算量を必要とする適応アルゴリズム用いた時と比較して、演算量が10/100=1/10に削減される。また、N2のオーダーの演算量を必要とする適応アルゴリズムでは、演算量が(10/100)2=1/100に削減される。 For example, consider a case where the sampling frequency is 10 kHz, the basic frequency of voiced sound is 100 Hz / the basic period is 10 ms (the number of samples in the basic period is 100), and the sound source signal for one period is a combination of ten non-zero pulses. In this case, the amount of calculation is reduced to 10/100 = 1/10 compared to when an adaptive algorithm that requires an amount of calculation in the order of N with respect to the tap length N of the filter is used. Further, in the adaptive algorithm which requires the calculation amount of the order of N 2, the amount of computation is reduced to (10/100) 2 = 1/100.
なお、適応フィルタ106aの適応アルゴリズムには、一般的にLMS(最小平均二乗)アルゴリズム、NLMS(Normalized LMS)アルゴリズム、射影法、RLS(逐次最小二乗)アルゴリズム等が用いられる。これらは、新たな信号のサンプル値が入力されるたびに逐次演算を行って徐々にタップ係数が最適値に収束していく適応アルゴリズムである。また、上記のように演算量を大幅に削減することができるので、適応フィルタ106aの適応アルゴリズムに、有限長の入出力信号を用いたブロック処理を行い、一度の演算で最適なタップ係数を求める最小二乗法を用いることができる。
In general, an LMS (Minimum Mean Square) algorithm, an NLMS (Normalized LMS) algorithm, a projection method, an RLS (Sequential Least Square) algorithm, or the like is used as an adaptive algorithm of the
逆フィルタ106bは、合成フィルタ101cの逆特性を有し、アナログ・ディジタル変換器105から出力されたディジタル送信音声信号y(t)を、線形予測係数L(t)を用いて白色化し、白色化送信音声信号yw(t)を得る。なお、逆フィルタ106bには、合成フィルタ101cが全零型の格子型フィルタである場合には全極型の格子型フィルタが用いられ、合成フィルタ101cがLSP合成フィルタである場合には全極型のLSPパラメータを用いたフィルタが用いられる。
The
加算器106cは、逆フィルタ106bから出力された白色化送信音声信号yw(t)から、適応フィルタ106aから出力された白色化擬似エコーrw(t)を減算して白色化残差信号ew(t)を得る。
The
擬似エコー生成用フィルタ106dは、単純なFIRフィルタであり、音源信号発生回路101bから出力された線形予測残差ベクトルε(t)を、適応フィルタ106aから出力されたタップ係数H(t)で演算して白色化擬似エコーrw’(t)を生成する。
The pseudo
合成フィルタ106eは、白色化擬似エコーrw’(t)を、線形予測係数L(t)を用いて合成し、擬似エコーr(t)を生成する。
The
加算器106fは、アナログ・ディジタル変換器105から出力されたディジタル送信音声信号y(t)から、合成フィルタ106eから出力された擬似エコーr(t)を減算して残差信号e(t)を得る。これにより、ディジタル送信音声信号y(t)に含まれるエコー成分を抑圧することができる。
The
次に、合成フィルタ101cおよび逆フィルタ106bの一例について説明する。
Next, an example of the
図3は、合成フィルタ101cがLSPパラメータを用いたLSP合成フィルタである場合の一例を示す図であり、図4は、合成フィルタ101cに図3に示すLSP合成フィルタを用いた場合の逆フィルタ106bを示す図である。
FIG. 3 is a diagram illustrating an example when the
図3および図4は、次数が6次の例である。図3および図4中のz−1は、サンプル遅延を表し、Ciは、以下の式(6)によりLSPパラメータωiから求めたフィルタ係数である。
図3に示す合成フィルタ101cは、以下の式(7)の伝達係数HS(z)を有する。また、図4に示す逆フィルタ106bは、以下の式(8)の伝達係数HA(z)を有する。なお、式(7)、(8)の定数Pはフィルタの次数であり、式(7)、(8)は次数Pが偶数の場合を示す。
合成フィルタ101cの伝達係数HS(z)と逆フィルタ106bの伝達係数HA(z)とは、以下の式(9)の関係を有する。
次に、図5を用いて、本発明の実施の形態1に係るエコーキャンセラの各フィルタの入力信号の状態について、従来技術と対比して説明する。 Next, the state of the input signal of each filter of the echo canceller according to Embodiment 1 of the present invention will be described using FIG. 5 in comparison with the prior art.
図5Aは、従来(非特許文献1)のエコーキャンセラの各フィルタの入力信号の状態を示す図である。図5Bは、本実施の形態に係るエコーキャンセラの各フィルタの入力信号の状態を示す図である。 FIG. 5A is a diagram illustrating a state of an input signal of each filter of a conventional echo canceller (Non-Patent Document 1). FIG. 5B is a diagram showing a state of an input signal of each filter of the echo canceller according to the present embodiment.
図5A及び図5Bに示すように、音源信号発生回路にて、情報量が圧縮された音源特性パラメータを復号すると線形予測残差ベクトルが得られる。この線形予測残差ベクトルは、白色信号であり、かつ、ごく少数のサンプルのみが0以外の値を有する音源パルス列(疎なパルス列)である。また、線形予測係数により合成フィルタを駆動して線形予測残差ベクトルを合成すると、合成音声(受信音声信号)が得られる。 As shown in FIGS. 5A and 5B, when a sound source characteristic parameter whose information amount is compressed is decoded by the sound source signal generation circuit, a linear prediction residual vector is obtained. This linear prediction residual vector is a white signal and a sound source pulse train (sparse pulse train) in which only a small number of samples have a value other than 0. Further, when a synthesis filter is driven by a linear prediction coefficient to synthesize a linear prediction residual vector, synthesized speech (received speech signal) is obtained.
図5Aに示すように、非特許文献1のエコーキャンセラでは、適応フィルタへの入力信号が疎なパルス列であるので適応フィルタの演算量を削減することができる。しかしながら、非特許文献1のエコーキャンセラでは、擬似エコー生成用フィルタへの入力信号が合成音声であるので擬似エコー生成用フィルタの演算量を削減することができない。 As shown in FIG. 5A, in the echo canceller of Non-Patent Document 1, since the input signal to the adaptive filter is a sparse pulse train, the calculation amount of the adaptive filter can be reduced. However, in the echo canceller of Non-Patent Document 1, since the input signal to the pseudo echo generation filter is synthesized speech, the amount of calculation of the pseudo echo generation filter cannot be reduced.
一方、図5Bに示すように、本実施の形態に係るエコーキャンセラでは、適応フィルタ106a及び擬似エコー生成用フィルタ106dのいずれの入力信号も疎なパルス列であり、次数が大きい(タップ長が長い)擬似エコー生成用フィルタ106dの処理の後に、次数が小さい(タップ長が短い)合成フィルタ106eの処理を行っている。したがって、本実施の形態に係るエコーキャンセラでは、適応フィルタ106a及び擬似エコー生成用フィルタ106dの演算量を削減することができる。
On the other hand, as shown in FIG. 5B, in the echo canceller according to the present embodiment, both the input signals of the
なお、本実施の形態のエコーキャンセラは、非特許文献1のエコーキャンセラに対して合成フィルタ106eが増えることになるが、合成フィルタ106eが追加されたことによる演算量の増加よりも、擬似エコー生成用フィルタ106dにおいて低減される演算量の方がはるかに大きい。これは、通常、消去すべきエコーの継続時間、すなわち擬似エコー生成用フィルタ106dのタップ長が非常に大きいので、擬似エコー生成用フィルタ106dのフィルタ次数は合成フィルタ106eのものに比べて非常に大きくなるからである。例えば、サンプリング周波数が10kHzであれば、エコー長が50msの擬似エコー生成用フィルタ106dのフィルタ次数は500次であるのに対し、合成フィルタ106eのフィルタ次数は10〜18次程度である。
Note that the echo canceller of the present embodiment has an increased number of
このように、本実施の形態によれば、マルチパルス符号化等を用いて音源の情報圧縮を行った場合、擬似エコー生成用フィルタへの入力信号も疎なパルス列となり、擬似エコー生成用フィルタにおいて値0のサンプルに対する演算を省略することができるため、従来のエコーキャンセラに比べてフィルタの演算量を削減することができる。 Thus, according to the present embodiment, when sound source information compression is performed using multi-pulse encoding or the like, the input signal to the pseudo echo generation filter also becomes a sparse pulse train, and in the pseudo echo generation filter Since the calculation for the sample having the value 0 can be omitted, the calculation amount of the filter can be reduced as compared with the conventional echo canceller.
(実施の形態2)
図6は、本発明の実施の形態2に係るエコーキャンセラを含むディジタル通信装置の構成を示すブロック図である。なお、図6において、図2と共通する構成部分には、図2と同一符号を付し、その詳しい説明を省略する。
(Embodiment 2)
FIG. 6 is a block diagram showing a configuration of a digital communication apparatus including an echo canceller according to Embodiment 2 of the present invention. In FIG. 6, the same components as those in FIG. 2 are denoted by the same reference numerals as those in FIG. 2, and detailed description thereof is omitted.
図6に示すディジタル通信装置は、エコーキャンセラ206の内部構成が、図2のディジタル通信装置のエコーキャンセラ106のものと異なる。エコーキャンセラ206は、エコーキャンセラ106に対して、擬似エコー生成用フィルタ106d及び合成フィルタ106eを削除し、合成フィルタ206aを追加した構成を採る。
In the digital communication apparatus shown in FIG. 6, the internal configuration of the
合成フィルタ206aは、適応フィルタ106aで生成された白色化擬似エコーrw(t)を、線形予測係数L(t)を用いて合成し、擬似エコーr(t)を生成する。
The
図7は、本実施の形態に係るエコーキャンセラの各フィルタの入力信号の状態を示す図である。 FIG. 7 is a diagram showing the state of the input signal of each filter of the echo canceller according to the present embodiment.
図7に示すように、本実施の形態に係るエコーキャンセラでは、適応フィルタ106aへの入力信号が疎なパルス列であるので適応フィルタ106aの演算量を削減することができる。また、本実施の形態に係るエコーキャンセラでは、次数が小さい(タップ長が短い)合成フィルタ206aにより、適応フィルタ106aから出力された白色化擬似エコーを用いて擬似エコーを生成するので、非特許文献1のエコーキャンセラに対してフィルタの演算量を削減することができる。
As shown in FIG. 7, in the echo canceller according to the present embodiment, since the input signal to the
このように、本実施の形態によれば、マルチパルス符号化等を用いて音源の情報圧縮を行った場合、適応フィルタにおいて疎なパルス列を用いたフィルタ演算により得られた白色化擬似エコーを用いて擬似エコーを生成することができるので、従来のエコーキャンセラに比べてフィルタの演算量を削減することができる。 Thus, according to the present embodiment, when sound source information compression is performed using multi-pulse coding or the like, the whitened pseudo echo obtained by the filter operation using a sparse pulse train is used in the adaptive filter. Therefore, the amount of calculation of the filter can be reduced as compared with the conventional echo canceller.
なお、実施の形態1と実施の形態2とは、次数が小さい合成フィルタを追加することにより、次数が大きいすべてのフィルタ(適応フィルタ、擬似エコー生成用フィルタ)への入力信号を線形予測残差ベクトルとすることができ、マルチパス符号化等を用いて音源情報を圧縮する場合に、フィルタの演算量を削減することができるという共通の効果を有する。 In the first and second embodiments, a synthesis filter having a small order is added, so that input signals to all the filters (adaptive filter and pseudo echo generation filter) having a large order are converted into linear prediction residuals. It can be a vector, and has a common effect that the amount of calculation of the filter can be reduced when the sound source information is compressed using multi-pass coding or the like.
以下、非特許文献1、実施の形態1及び実施の形態2の各方式について、エコーキャンセラの演算量の比較を行う。ここで、適応フィルタおよび擬似エコー生成用フィルタのタップ長をN,線形予測分析合成次数をP次とする。また、適応フィルタの演算量はタップ長のk倍(すなわちkN)、擬似エコー生成用フィルタの演算量はタップ長と等しいN、線形予測合成フィルタ及び逆フィルタの演算量は次数と等しいPとする。また、マルチパルス符号化により線形予測合成音源の情報圧縮をした場合の圧縮比をαとする。なお、一周期Mサンプル分の音声を合成する時の合成音源信号のパルス数はαM個となる。 Hereinafter, the calculation amount of the echo canceller is compared for each method of Non-Patent Document 1, Embodiment 1 and Embodiment 2. Here, the tap length of the adaptive filter and the pseudo echo generation filter is N, and the linear prediction analysis synthesis order is P order. The calculation amount of the adaptive filter is k times the tap length (ie, kN), the calculation amount of the pseudo echo generation filter is N equal to the tap length, and the calculation amounts of the linear prediction synthesis filter and the inverse filter are P equal to the order. . In addition, the compression ratio when the information compression of the linear predictive synthesized sound source is performed by multipulse coding is α. Note that the number of pulses of the synthesized sound source signal when synthesizing speech for one period of M samples is αM.
<非特許文献1>
適応フィルタ αkN
擬似エコー生成用フィルタ N
逆フィルタ P
−−−−−−−−−−−−−−−−−−−−−−−−−−
合計 (αk+1)N+P
<Non-Patent Document 1>
Adaptive filter αkN
Pseudo echo generation filter N
Inverse filter P
-------------------------
Total (αk + 1) N + P
<実施の形態1>
適応フィルタ106a αkN
擬似エコー生成用フィルタ106d αN
逆フィルタ106b P
合成フィルタ106e P
−−−−−−−−−−−−−−−−−−−−−−−−−−
合計 (αk+α)N+2P
<Embodiment 1>
Pseudo echo
-------------------------
Total (αk + α) N + 2P
<実施の形態2>
適応フィルタ106a αkN
逆フィルタ106b P
合成フィルタ206a P
−−−−−−−−−−−−−−−−−−−−−−−−−−
合計 αkN+2P
<Embodiment 2>
-------------------------
Total αkN + 2P
例えば、タップ長N=500,次数P=16,音源情報圧縮比α=0.1,係数k=3とすると、演算量は以下の結果となる。なお、kの値は、使用する適応アルゴリズムにより異なる。k=3はNLSMアルゴリズムを使用した場合の値である。 For example, when the tap length N = 500, the order P = 16, the sound source information compression ratio α = 0.1, and the coefficient k = 3, the calculation amount is as follows. Note that the value of k varies depending on the adaptive algorithm used. k = 3 is a value when the NLSM algorithm is used.
<非特許文献1>
演算量=(αk+1)N+P
=(0.1×3+1)×500+16
=666
<Non-Patent Document 1>
Calculation amount = (αk + 1) N + P
= (0.1 × 3 + 1) × 500 + 16
= 666
<実施の形態1>
演算量=(αk+α)N+2P
=(0.1×3+0.1)×500+2×16
=232
<Embodiment 1>
Calculation amount = (αk + α) N + 2P
= (0.1 × 3 + 0.1) × 500 + 2 × 16
= 232
<実施の形態2>
演算量=αkN+2P
=0.1×3×500+2×16
=182
<Embodiment 2>
Calculation amount = αkN + 2P
= 0.1 × 3 × 500 + 2 × 16
= 182
上記の結果から明らかなように、実施の形態1及び実施の形態2の方式の方が、非特許文献1よりも演算量を大幅に削減することができる。また、実施の形態2の方式が最も演算量が少ないことが分かる。 As is clear from the above results, the amount of calculation can be significantly reduced in the methods of the first and second embodiments than in the non-patent document 1. It can also be seen that the method of Embodiment 2 has the least amount of computation.
なお、本発明は、図2における分析フィルタ107aの線形予測係数出力と合成フィルタ101cの線形予測係数入力とを短絡し、音源特性分析回路107bの音源特性パラメータ出力と音源信号発生回路101bの音源特性パラメータ入力とを短絡した構成の拡声装置のハウリングキャンセラにも適用することができる。
In the present invention, the linear prediction coefficient output of the
本発明は、双方向通信システム(無線電話、有線電話、インターホン、TV会議システム等)のエコーキャンセラ、ハウリングキャンセラ、拡声装置のハウリングキャンセラ、補聴器のハウリングキャンセラ等に用いるに好適である。 The present invention is suitable for use in an echo canceller, a howling canceller, a howling canceller for a loudspeaker, a howling canceller for a hearing aid, etc. in a bidirectional communication system (wireless telephone, wired telephone, interphone, video conference system, etc.).
101 音声復号回路
101a デマルチプレクサ
101b 音源信号発生回路
101c 合成フィルタ
102 ディジタル・アナログ変換器
103 スピーカ
104 マイクロホン
105 アナログ・ディジタル変換器
106、206 エコーキャンセラ
106a 適応フィルタ
106b 逆フィルタ
106c 加算器
106d 擬似エコー生成用フィルタ
106e、206a 合成フィルタ
106f 加算器
107 音声符号化回路
107a 分析フィルタ
107b 音源特性分析回路
107c マルチプレクサ
206a 合成フィルタ
DESCRIPTION OF SYMBOLS 101
Claims (3)
前記線形予測残差ベクトルをタップ係数で演算して第1白色化擬似エコーを生成し、与えられた白色化残差信号に従って前記タップ係数を更新する適応フィルタと、
前記第1合成フィルタと逆特性を有し、前記線形予測係数を用いて、送信音声信号を白色化し、白色化送信音声信号を得る逆フィルタと、
前記白色化送信音声信号から前記第1白色化擬似エコーを減算して白色化残差信号を得る第1の加算器と、
前記線形予測残差ベクトルを、前記適応フィルタで更新された前記タップ係数で演算して第2白色化擬似エコーを生成する擬似エコー生成用フィルタと、
前記第2白色化擬似エコーを、前記線形予測係数を用いて合成し、擬似エコーを生成する第2合成フィルタと、
前記送信音声信号から前記擬似エコーを減算して残差信号を得る第2の加算器と、
を具備するエコーキャンセラ。 Speech decoding that receives a linear prediction coefficient and a linear prediction residual vector obtained by linear prediction analysis, drives a first synthesis filter with the linear prediction coefficient, and synthesizes the linear prediction residual vector to obtain a received speech signal An echo canceller provided in a digital communication device provided with a circuit,
An adaptive filter that computes the linear prediction residual vector with a tap coefficient to generate a first whitened pseudo echo, and updates the tap coefficient according to a given whitened residual signal;
An inverse filter having a reverse characteristic to the first synthesis filter and using the linear prediction coefficient to whiten a transmission voice signal and obtain a whitened transmission voice signal;
A first adder for subtracting the first whitened pseudo echo from the whitened transmission audio signal to obtain a whitened residual signal;
A pseudo-echo generation filter that calculates the linear prediction residual vector using the tap coefficient updated by the adaptive filter to generate a second whitened pseudo-echo;
A second synthesis filter for synthesizing the second whitened pseudo echo using the linear prediction coefficient to generate a pseudo echo;
A second adder that subtracts the pseudo echo from the transmission voice signal to obtain a residual signal;
An echo canceller comprising:
前記線形予測残差ベクトルをタップ係数で演算して白色化擬似エコーを生成し、与えられた白色化残差信号に従って前記タップ係数を更新する適応フィルタと、
前記第1合成フィルタと逆特性を有し、前記線形予測係数を用いて、送信音声信号を白色化し、白色化送信音声信号を得る逆フィルタと、
前記白色化送信音声信号から前記白色化擬似エコーを減算して白色化残差信号を得る第1の加算器と、
前記第1合成フィルタと同一特性を有し、前記白色化擬似エコーを、前記線形予測係数を用いて合成し、擬似エコーを生成する第2合成フィルタと、
前記送信音声信号から前記擬似エコーを減算して残差信号を得る第2の加算器と、
を具備するエコーキャンセラ。 Speech decoding that receives a linear prediction coefficient and a linear prediction residual vector obtained by linear prediction analysis, drives a first synthesis filter with the linear prediction coefficient, and synthesizes the linear prediction residual vector to obtain a received speech signal An echo canceller provided in a digital communication device provided with a circuit,
An adaptive filter that computes the linear prediction residual vector with a tap coefficient to generate a whitened pseudo echo, and updates the tap coefficient according to a given whitened residual signal;
An inverse filter having a reverse characteristic to the first synthesis filter and using the linear prediction coefficient to whiten a transmission voice signal and obtain a whitened transmission voice signal;
A first adder that subtracts the whitened pseudo echo from the whitened transmission audio signal to obtain a whitened residual signal;
A second synthesis filter that has the same characteristics as the first synthesis filter, synthesizes the whitened pseudo echo using the linear prediction coefficient, and generates a pseudo echo;
A second adder that subtracts the pseudo echo from the transmission voice signal to obtain a residual signal;
An echo canceller comprising:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009052680A JP4395195B1 (en) | 2009-03-05 | 2009-03-05 | Echo canceller |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009052680A JP4395195B1 (en) | 2009-03-05 | 2009-03-05 | Echo canceller |
Publications (2)
Publication Number | Publication Date |
---|---|
JP4395195B1 true JP4395195B1 (en) | 2010-01-06 |
JP2010206731A JP2010206731A (en) | 2010-09-16 |
Family
ID=41591551
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009052680A Expired - Fee Related JP4395195B1 (en) | 2009-03-05 | 2009-03-05 | Echo canceller |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4395195B1 (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107886965A (en) * | 2017-11-28 | 2018-04-06 | 游密科技(深圳)有限公司 | The echo cancel method of game background sound |
-
2009
- 2009-03-05 JP JP2009052680A patent/JP4395195B1/en not_active Expired - Fee Related
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107886965A (en) * | 2017-11-28 | 2018-04-06 | 游密科技(深圳)有限公司 | The echo cancel method of game background sound |
CN107886965B (en) * | 2017-11-28 | 2021-04-20 | 游密科技(深圳)有限公司 | Echo cancellation method for game background sound |
Also Published As
Publication number | Publication date |
---|---|
JP2010206731A (en) | 2010-09-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9082389B2 (en) | Pre-shaping series filter for active noise cancellation adaptive filter | |
CN1451225A (en) | Echo cancellation device for cancelling echos in a transceiver unit | |
CN1504042A (en) | Audio signal quality enhancement in a digital network | |
US5857167A (en) | Combined speech coder and echo canceler | |
EP1109154B1 (en) | Linear predictive coding based acoustic echo cancellation | |
KR100842590B1 (en) | Method and apparatus for eliminating acoustic echo in mobile terminal | |
US20030065507A1 (en) | Network unit and a method for modifying a digital signal in the coded domain | |
JP2003533902A5 (en) | ||
WO2001003316A1 (en) | Coded domain echo control | |
JP2003501894A (en) | Method and apparatus for improving adaptive filter performance by including inaudible information | |
JP3753996B2 (en) | Echo suppression device, echo suppression method and program | |
JP4395195B1 (en) | Echo canceller | |
US6141639A (en) | Method and apparatus for coding of signals containing speech and background noise | |
JP3724705B2 (en) | Echo suppression method / Echo suppression device | |
EP1521241A1 (en) | Transmission of speech coding parameters with echo cancellation | |
JP4373693B2 (en) | Hierarchical encoding method and hierarchical decoding method for acoustic signals | |
EP1944761A1 (en) | Disturbance reduction in digital signal processing | |
JP3353257B2 (en) | Echo canceller with speech coding and decoding | |
JP2002149198A (en) | Voice encoder and decoder | |
JP5014493B2 (en) | Encoding method, encoding device, and program | |
JP3946074B2 (en) | Audio processing device | |
JPH0766757A (en) | Method for canceling echo | |
Juang | Ubiquitous speech communication interface | |
JP2000101683A (en) | Voice communication equipment | |
Kulakcherla | Non linear adaptive filters for echo cancellation of speech coded signals |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090924 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20091016 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121023 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131023 Year of fee payment: 4 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |