JP2003284184A - Echo canceller and echo canceling method - Google Patents

Echo canceller and echo canceling method

Info

Publication number
JP2003284184A
JP2003284184A JP2002083632A JP2002083632A JP2003284184A JP 2003284184 A JP2003284184 A JP 2003284184A JP 2002083632 A JP2002083632 A JP 2002083632A JP 2002083632 A JP2002083632 A JP 2002083632A JP 2003284184 A JP2003284184 A JP 2003284184A
Authority
JP
Japan
Prior art keywords
band
signal
audio signal
frequency
component
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2002083632A
Other languages
Japanese (ja)
Other versions
JP4192483B2 (en
Inventor
Takao Fukui
隆郎 福井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2002083632A priority Critical patent/JP4192483B2/en
Publication of JP2003284184A publication Critical patent/JP2003284184A/en
Application granted granted Critical
Publication of JP4192483B2 publication Critical patent/JP4192483B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
  • Telephone Function (AREA)
  • Stereophonic System (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide a small-sized echo canceller for canceling an echo at low cost while ensuring a maximum echo path length longer than a prescribed length in a two-way communication system for transceiving a stereophonic signal with a high sampling frequency. <P>SOLUTION: First and second band split means 4, 6 apply band division to a sound signal with a mid-component adopting the M-S (mid-side) system among stereophonic signals with a prescribed sampling frequency, first and second frequency conversion means 8, 10 decrease the sampling frequency of the mid-component sound signal at a low frequency band, an adaptive filter 13 processes the processed sound signal, and third frequency conversion means 20, 21 increase the frequency of an error signal outputted from the adaptive filter 13 to have the original sampling frequency. <P>COPYRIGHT: (C)2004,JPO

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【発明の属する技術分野】本発明は、音声信号用のエコ
ーキャンセラ及びエコーキャンセリング方法に関し、特
に、サンプリング周波数の高いステレオ音声信号を処理
するのに適したものに関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an echo canceller and an echo canceling method for an audio signal, and more particularly to a method suitable for processing a stereo audio signal having a high sampling frequency.

【0002】[0002]

【従来の技術】互いに離れた地点にいる人同士が、ネッ
トワーク経由で双方向に音声等によってコミュニケーシ
ョンを行えるようにしたシステムが普及しつつある。そ
うした双方向コミュニケーションシステムの例として
は、テレビ会議システムが挙げられる。
2. Description of the Related Art A system is becoming widespread in which persons who are located far from each other can communicate with each other bidirectionally by voice through a network. An example of such an interactive communication system is a video conference system.

【0003】図1は、既存のテレビ会議システムで用い
られる音声送受信用の機器を示す。地点Aに、モノラル
方式のマイクロホン101, スピーカ102, ADコン
バータ103, DAコンバータ104, エコーキャンセ
ラ105, 音声コーデック106及びネットワークイン
タフェース107が設けられる。
FIG. 1 shows a device for voice transmission / reception used in an existing video conference system. At the point A, a monaural microphone 101, a speaker 102, an AD converter 103, a DA converter 104, an echo canceller 105, a voice codec 106, and a network interface 107 are provided.

【0004】地点Aとは離れた地点Bにも、同じくマイ
クロホン101, スピーカ102,ADコンバータ10
3, DAコンバータ104, エコーキャンセラ105,
音声コーデック106及びネットワークインタフェース
107が設けられる。
A microphone 101, a speaker 102, and an AD converter 10 are also provided at a point B apart from the point A.
3, DA converter 104, echo canceller 105,
An audio codec 106 and a network interface 107 are provided.

【0005】ADコンバータ103のサンプリング周波
数は、16kHzという比較的低い周波数(日常会話の
音声信号の必要帯域である8kHzの2倍)になってい
る。
The sampling frequency of the AD converter 103 is a relatively low frequency of 16 kHz (twice the necessary frequency band of 8 kHz, which is the required band of the voice signal for everyday conversation).

【0006】地点Aのネットワークインタフェース10
7と地点Bのネットワークインタフェース107とは、
電話回線等を用いたネットワーク108で結ばれてい
る。
Network interface 10 at point A
7 and the network interface 107 at the point B,
It is connected by a network 108 using a telephone line or the like.

【0007】地点Aにおいて、会議出席者の話し声は、
マイクロホン101に入力し、ADコンバータ103に
よりサンプリング周波数16kHzでデジタル変換され
た後、エコーキャンセラ105を経て音声コーデック1
06で符号化(圧縮)され、ネットワークインタフェー
ス107から通信ネットワーク108経由で地点Bのネ
ットワークインタフェース107に送られる。そして、
地点Bにおいて、音声コーデック106で復号(伸長)
され、エコーキャンセラ105を経てDAコンバータ1
04でアナログ変換されて、スピーカ102から出力す
る。
At point A, the speech of the conference attendees is
The audio codec 1 is input to the microphone 101, digitally converted by the AD converter 103 at a sampling frequency of 16 kHz, and then passed through the echo canceller 105.
It is encoded (compressed) in 06 and sent from the network interface 107 to the network interface 107 at the point B via the communication network 108. And
At the point B, the audio codec 106 decodes (decompresses)
Then, after passing through the echo canceller 105, the DA converter 1
The analog conversion is performed at 04, and the analog output is output from the speaker 102.

【0008】地点Bにおいても、会議出席者の話し声
は、マイクロホン101に入力し、ADコンバータ10
3によりサンプリング周波数16kHzでデジタル変換
された後、エコーキャンセラ105を経て音声コーデッ
ク106で符号化され、ネットワークインタフェース1
07から通信ネットワーク108経由で地点Aのネット
ワークインタフェース107に送られる。そして、地点
Aにおいて、音声コーデック106で復号され、エコー
キャンセラ105を経てDAコンバータ104でアナロ
グ変換されて、スピーカ102から出力する。
At point B as well, the voices of participants in the conference are input to the microphone 101 and the AD converter 10 is used.
3 is digitally converted at a sampling frequency of 16 kHz and then encoded by the voice codec 106 through the echo canceller 105, and then the network interface 1
07 to the network interface 107 at the point A via the communication network 108. Then, at the point A, it is decoded by the audio codec 106, passed through the echo canceller 105, converted into analog by the DA converter 104, and output from the speaker 102.

【0009】図2は、こうしたテレビ会議システムにお
ける従来のエコーキャンセラ105の構成を示す。エコ
ーキャンセラ105は、適応フィルタで構成されてお
り、デジタルフィルタ111と、加減算器112と、コ
ントローラ113とを含んでいる。
FIG. 2 shows the configuration of a conventional echo canceller 105 in such a video conference system. The echo canceller 105 is composed of an adaptive filter and includes a digital filter 111, an adder / subtractor 112, and a controller 113.

【0010】エコーは、相手方の地点から送られた音声
が、自分の地点において、スピーカ102から出力した
後、室内の空間や部屋の壁等を含む未知の系(エコー経
路)114を経由してマイクロホン101に飛び込んで
相手方の地点に戻されてしまう現象である。
The echo is a sound sent from the other party's point, output from the speaker 102 at his / her own point, and then passes through an unknown system (echo path) 114 including the room space and the room wall. This is a phenomenon in which the user jumps into the microphone 101 and is returned to the other party's point.

【0011】デジタルフィルタ111は、このエコー経
路114の伝達関数Hk(z)を推定する。そして、相
手方の地点から自分の地点に送られるサンプリング周波
数16kHzの音声信号x(k)をリファレンス信号と
し、この伝達関数Hk(z)とこのリファレンス信号x
(k)の時系列ベクトル[ x(k), x(k−1),…
x(k−N−1)] とを畳み込むことにより、目標信号
であるマイクロホン101からの入力音声信号のレプリ
カy’(k)を作成する。
The digital filter 111 estimates the transfer function Hk (z) of the echo path 114. Then, the audio signal x (k) with a sampling frequency of 16 kHz sent from the other party's point to the own point is used as a reference signal, and this transfer function Hk (z) and this reference signal x
(K) time series vector [x (k), x (k−1), ...
x (k−N−1)] is convoluted with a target signal to generate a replica y ′ (k) of the input audio signal from the microphone 101.

【0012】加減算器112は、マイクロホン101か
らADコンバータ103を経てエコーキャンセラ105
に入力したサンプリング周波数16kHzの音声信号
(目標信号)y(k)からこのレプリカy’(k)を差
し引くことにより、エコーをキャンセルする。
The adder / subtractor 112 passes through the microphone 101, the AD converter 103, and the echo canceller 105.
The echo is canceled by subtracting the replica y '(k) from the audio signal (target signal) y (k) having the sampling frequency of 16 kHz input to the.

【0013】コントローラ113は、加減算器112か
ら出力する誤差信号e(k)(目標信号y(k)からレ
プリカy’(k)を差し引いた残りの信号)の大きさに
応じて、学習同定法, アフィン射影法または最小二乗法
といった数学的手法でデジタルフィルタ111のタップ
係数を更新することにより、伝達関数Hk(z)の推定
精度を高める。
The controller 113 uses the learning identification method according to the magnitude of the error signal e (k) output from the adder / subtractor 112 (the remaining signal obtained by subtracting the replica y '(k) from the target signal y (k)). By updating the tap coefficient of the digital filter 111 by a mathematical method such as the affine projection method or the least square method, the estimation accuracy of the transfer function Hk (z) is improved.

【0014】デジタルフィルタ111のタップ数は、サ
ンプリング周波数16kHzのモノラル音声信号に対す
る最大エコーパス長(スピーカから出力した後最大何ミ
リ秒遅れてマイクロホンに飛び込んだ音声をエコーとし
てキャンセルできるかを表すもの)に対応した数になっ
ている。
The number of taps of the digital filter 111 is set to the maximum echo path length for a monaural audio signal having a sampling frequency of 16 kHz (which indicates how many milliseconds after the output from the speaker, the audio jumped into the microphone can be canceled as an echo). It corresponds to the number.

【0015】エコーキャンセラ105は、実際のハード
ウェアとしては、適応フィルタとして動作させるための
ソフトウェアをインストールしたDSP(デジタルシグ
ナルプロセッサ)と、RAMとを用いて構成されてい
る。
The echo canceller 105 is constructed by using, as actual hardware, a DSP (digital signal processor) in which software for operating as an adaptive filter is installed, and a RAM.

【0016】エコーキャンセラ105のようにサンプリ
ング周波数16kHzのモノラル音声信号に対する最大
エコーパス長に対応したタップ数の適応フィルタとして
は、具体的には、DSP, RAMをそれぞれ2個, 6個
用いたものが存在している。
As the adaptive filter having the number of taps corresponding to the maximum echo path length for a monaural voice signal having a sampling frequency of 16 kHz like the echo canceller 105, specifically, those using two DSPs and six RAMs respectively. Existing.

【0017】[0017]

【発明が解決しようとする課題】ところで、従来のテレ
ビ会議システムは、図1に示したように音声信号のサン
プリング周波数が低く且つモノラル音声信号を送受信す
るものであるが、今後は、テレビ会議システムでも、音
質を向上させるために音声信号のサンプリング周波数を
高めたり、臨場感を得るためにステレオ音声信号を送受
信したりするようになることが考えられる。
By the way, the conventional video conference system has a low sampling frequency of an audio signal and transmits and receives a monaural audio signal as shown in FIG. 1. In the future, the video conference system will be described. However, it is conceivable that the sampling frequency of the audio signal will be increased in order to improve the sound quality, and that the stereo audio signal will be transmitted and received in order to obtain a realistic sensation.

【0018】さらに、今後は、エンターテイメント系の
新しい形態の双方向コミュニケーションシステムとし
て、例えば、コンサート会場と家庭とをネットワークで
結び、楽器の演奏音やボーカリストの歌声をコンサート
会場から家庭に送り、家庭からも拍手や声援の音声をコ
ンサート会場に送るという双方向コミュニケーションシ
ステムが登場する可能性がある。
Further, in the future, as a new type of interactive communication system for entertainment system, for example, a concert venue and a home will be connected by a network, and the performance sound of a musical instrument or the voice of a vocalist will be sent from the concert venue to the home. There is a possibility that a two-way communication system will appear that sends applause and cheering voices to the concert venue.

【0019】あるいはまた、複数の地点をネットワーク
で結び、それらの地点にいる人々が1つのグループとし
て同じバーチャル空間(例えば探検すべきジャングル
等)を体験し、各地点から残りの全ての地点に音声を送
ることにより、そのバーチャル空間内で各人が意思の疎
通をとれるようにした双方向コミュニケーションシステ
ムが登場する可能性もある。
Alternatively, a plurality of points are connected by a network, and people at those points experience the same virtual space (for example, the jungle to be explored) as a group, and voices are sent from each point to all the remaining points. There is a possibility that a two-way communication system that allows each person to communicate with each other in the virtual space will appear.

【0020】こうした新しい形態の双方向コミュニケー
ションシステムでは、音声信号の必要帯域をハイファイ
用の音響信号の必要帯域と同じ20kHzと考えると、
音声信号のサンプリング周波数をその2倍の40kHz
以上にする必要があり、且つ、臨場感を得るために、ス
テレオ音声信号を送受信することが必要になる。
In such a new type of interactive communication system, considering that the required band of the voice signal is 20 kHz which is the same as the required band of the acoustic signal for hi-fi,
Double the sampling frequency of the audio signal, 40 kHz
It is necessary to do the above, and it is necessary to transmit and receive a stereo audio signal in order to obtain a realistic sensation.

【0021】しかし、このようにサンプリング周波数の
高いステレオ音声信号を送受信する双方向コミュニケー
ションシステムにおいて、図2に示したような構成のエ
コーキャンセラ105を用いようとすると、エコーキャ
ンセラの大型化及び高コスト化を招いてしまうという不
都合が生じる。
However, when the echo canceller 105 having the structure shown in FIG. 2 is used in the two-way communication system for transmitting and receiving the stereo audio signal having the high sampling frequency, the echo canceller becomes large in size and high in cost. There is an inconvenience that it causes

【0022】その理由は2つある。すなわち、第1の理
由として、図2のエコーキャンセラ105のような適応
フィルタを用いるエコーキャンセラでは、一般にデジタ
ルフィルタとしてFIRフィルタを用いて系の同定を行
うため、この最大エコーパス長は、図3に示すように、
[ タップ数(デジタルフィルタのタップ数を上限とし
て、個々のサンプル信号について実際に乗算を行うこと
のできるタップ数)] ×[ 1/FS] (FSは音声信号
のサンプリング周波数)になる。
There are two reasons. That is, as a first reason, in an echo canceller using an adaptive filter such as the echo canceller 105 in FIG. 2, since a FIR filter is generally used as a digital filter to identify the system, the maximum echo path length is shown in FIG. As shown
[The number of taps (the number of taps that can actually perform multiplication on each sample signal with the number of taps of the digital filter being the upper limit)] x [1 / FS] (FS is the sampling frequency of the audio signal).

【0023】そして、適応フィルタとして用いるDSP
やRAMの処理速度には限界があるので、エコーキャン
セラ105がリアルタイム処理を行う場合、サンプリン
グ周波数FSが高くなると、[ 個々のサンプル信号につ
いて実際に乗算を行うことのできるタップ数] はそれに
比例して減少する。
A DSP used as an adaptive filter
Since the processing speed of RAM and RAM is limited, when the echo canceller 105 performs real-time processing, when the sampling frequency FS becomes high, [the number of taps that can actually multiply each sample signal] is proportional to it. Decrease.

【0024】また、サンプリング周波数FSが高くなる
と、[ 1/FS] もそれに比例して小さくなる。
Further, as the sampling frequency FS increases, [1 / FS] also decreases in proportion thereto.

【0025】したがって、同じ処理能力の(同じ仕様の
DSPやRAMを同じ数だけ用いた)適応フィルタで
は、サンプリング周波数FSが高くなると、最大エコー
パス長はその2乗に比例して短くなる(例えばサンプリ
ング周波数FSが16kHzから3倍の48kHzにな
った場合には、最大エコーパス長は9分の1の短さにな
る)。
Therefore, in an adaptive filter having the same processing capacity (using the same number of DSPs and RAMs having the same specifications), the maximum echo path length decreases in proportion to the square of the sampling frequency FS (for example, sampling). When the frequency FS is increased from 16 kHz to 48 kHz, which is three times, the maximum echo path length becomes 1/9 short).

【0026】しかし、最大エコーパス長が短くなると、
スピーカから出力した後僅かの時間遅れてマイクロホン
に飛び込んだ音声しかエコーとしてキャンセルできなく
なるので、少し広い部屋になるとエコーをキャンセルで
きなくなってしまう。そのため、製品としてのエコーキ
ャンセラでは、最大エコーパス長が或る一定の長さ(対
応する部屋のエコーパス長、例えば300ミリ秒)以上
でなければならない。
However, when the maximum echo path length becomes short,
Only the sound that jumps into the microphone after a short time after being output from the speaker can be canceled as an echo, so that the echo cannot be canceled in a slightly wider room. Therefore, in the echo canceller as a product, the maximum echo path length must be a certain length (echo path length of the corresponding room, for example, 300 milliseconds) or more.

【0027】このようにサンプリング周波数FSが高く
なった場合にも一定の長さ以上の最大エコーパス長を確
保するためには、エコーキャンセラ105の処理能力を
高めなければならない。例えばサンプリング周波数FS
が16kHzから3倍の48kHzになった場合にも同
じ長さの最大エコーパス長を確保しようとすると、エコ
ーキャンセラ105の処理能力を9倍に高める(同じ仕
様のDSPやRAMを用いる場合にはDSPやRAMの
個数を9倍にする)ことが必要になる。
Even if the sampling frequency FS becomes high as described above, the processing capacity of the echo canceller 105 must be increased in order to secure the maximum echo path length of a certain length or more. For example, sampling frequency FS
If the maximum echo path length of the same length is to be secured even when the frequency is increased from 16 kHz to 48 kHz, the processing capacity of the echo canceller 105 is increased by 9 times (when a DSP or RAM of the same specifications is used, It is necessary to increase the number of RAMs and RAM 9 times).

【0028】次に、第2の理由として、図2のエコーキ
ャンセラ105でステレオ音声信号を処理する場合に
は、図4に示すように、左チャンネル用スピーカ122
Lから出力した音声Lが左右2チャンネル方式のステレ
オマイクロホン内の左チャンネル用マイクロホンカプセ
ル121Lに飛び込む現象, 左チャンネル用スピーカ1
22Lから出力した音声Lがこのステレオマイクロホン
内の右チャンネル用マイクロホンカプセル121Rに飛
び込む現象, 右チャンネル用スピーカ122Rから出力
した音声Rがこの左チャンネル用マイクロホンカプセル
121Lに飛び込む現象, 右チャンネル用スピーカ12
2Rから出力した音声Rがこの右チャンネル用マイクロ
ホンカプセル121Rに飛び込む現象の合計4つの現象
をそれぞれエコーとして扱うことが必要になる。
Next, as a second reason, when processing the stereo audio signal with the echo canceller 105 of FIG. 2, as shown in FIG. 4, the left channel speaker 122 is used.
The phenomenon that the sound L output from L jumps into the left channel microphone capsule 121L in the left and right two-channel stereo microphone, left channel speaker 1
The phenomenon that the sound L output from 22L jumps into the right channel microphone capsule 121R in this stereo microphone, the phenomenon that the sound R output from the right channel speaker 122R jumps into this left channel microphone capsule 121L, the right channel speaker 12
It is necessary to treat a total of four phenomena in which the sound R output from 2R jumps into the right channel microphone capsule 121R as echoes.

【0029】したがって、1個のスピーカから出力した
音声が1個のモノラルマイクロホンに飛び込む現象だけ
をエコーとして扱う場合に対して、エコーキャンセラ1
05の処理能力を4倍に高める(同じ仕様のDSPやR
AMを用いる場合にはDSPやRAMの数を4倍にす
る)ことが必要になる。
Therefore, in contrast to the case where only the phenomenon in which the sound output from one speaker jumps into one monaural microphone is treated as an echo, the echo canceller 1
4 times the processing capacity of 05 (DSP and R of the same specification)
When AM is used, the number of DSPs and RAMs needs to be quadrupled.

【0030】さらに、左チャンネル用マイクロホンカプ
セル121Lに飛び込んだ音声のうち左チャンネル用ス
ピーカ122Lからの音声Lと右チャンネル用スピーカ
122Rからの音声Rとを判別する処理や、右チャンネ
ル用マイクロホンカプセル121Rに飛び込んだ音声の
うち左チャンネル用スピーカ122Lからの音声Lと右
チャンネル用スピーカ122Rからの音声Rとを判別す
る処理も必要になる。
Further, the processing for discriminating between the sound L from the left channel speaker 122L and the sound R from the right channel speaker 122R among the sounds jumped into the left channel microphone capsule 121L, and the right channel microphone capsule 121R are processed. It is also necessary to perform a process of distinguishing the sound L from the left channel speaker 122L and the sound R from the right channel speaker 122R among the jumped sounds.

【0031】この判別を行うための技術は、例えば特開
平10−190848号公報に開示されているが、エコ
ーキャンセラ105にさらに多くの回路を追加すること
が必要とされている。
A technique for making this determination is disclosed in, for example, Japanese Patent Laid-Open No. 10-190848, but it is necessary to add more circuits to the echo canceller 105.

【0032】この2つの理由から、例えばエコーキャン
セラ105でサンプリング周波数48kHzのステレオ
音声信号を処理する場合には、サンプリング周波数16
kHzのモノラル音声信号を処理する場合に対して、エ
コーキャンセラ105の処理能力を9×4=36倍以上
に高める(同じ仕様のDSPやRAMを用いる場合には
DSPやRAMの個数を36倍以上にする)ことが必要
になる。
For these two reasons, when processing a stereo audio signal with a sampling frequency of 48 kHz by the echo canceller 105, for example, the sampling frequency 16
The processing capacity of the echo canceller 105 is increased to 9 × 4 = 36 times or more compared to the case of processing a kHz monaural audio signal (when using DSPs or RAMs of the same specifications, the number of DSPs or RAMs is 36 times or more). Will be required).

【0033】具体的には、サンプリング周波数16kH
zのモノラル音声信号を処理するエコーキャンセラ10
5としては前述のようにDSP, RAMをそれぞれ2
個, 6個設けたものが存在しているので、サンプリング
周波数48kHzのステレオ音声信号を処理する場合に
は、同じ仕様のDSP, RAMをそれぞれ2×36=7
2個, 6×36=216個以上という多数個用いること
が必要になる。したがって、エコーキャンセラの非常な
大型化及び高コスト化を招いてしまう。
Specifically, the sampling frequency is 16 kHz.
Echo canceller 10 for processing z monaural audio signal
As described above, 5 and 2 are used for DSP and RAM respectively.
There are 6 and 6 units, so when processing a stereo audio signal with a sampling frequency of 48 kHz, 2 × 36 = 7 DSPs and RAMs with the same specifications are used.
It is necessary to use a large number of two, 6 × 36 = 216 or more. Therefore, the echo canceller becomes very large and expensive.

【0034】本発明は、上述の点に鑑み、サンプリング
周波数の高いステレオ音声信号を送受信する双方向コミ
ュニケーションシステムにおいて、一定以上の長い最大
エコーパス長を確保しつつ、小型且つ低コストにエコー
をキャンセルすることのできるエコーキャンセラ及びエ
コーキャンセリング方法を提供することを課題としてな
されたものである。
In view of the above points, the present invention is a two-way communication system for transmitting and receiving a stereo audio signal with a high sampling frequency, while canceling echoes at a small size and at low cost while ensuring a long maximum echo path length of a certain length or more. It is an object of the present invention to provide an echo canceller and an echo canceling method that can be performed.

【0035】[0035]

【課題を解決するための手段】本発明では、適応フィル
タをエコーキャンセラに用いるに際し、音声やエコーの
次のような2つの特徴に着目した。
In the present invention, when an adaptive filter is used in an echo canceller, attention is paid to the following two characteristics of voice and echo.

【0036】第1の特徴として、音声は、周波帯域が高
くなるにつれて、伝播における減衰係数が大きくなると
ともに、部屋の壁等での反射の際の吸収係数も大きくな
る。そのため、スピーカから出力した後ある程度の時間
(例えば100ミリ秒)以上遅れてマイクロホンに飛び
込む音声は、低周波帯域成分が大部分である。
As a first characteristic, as the frequency band becomes higher, the sound has a larger attenuation coefficient in propagation and also a larger absorption coefficient when reflected on a wall of a room or the like. Therefore, most of the low-frequency band component is contained in the sound that is output from the speaker and is delayed by a certain time (for example, 100 milliseconds) and then jumps into the microphone.

【0037】この第1の特徴からは、例えば300ミリ
秒というような長い最大エコーパス長は、全ての周波数
帯域の音声について確保する必要はなく、少なくとも低
周波帯域の音声について確保すればよいことになる。
From the first feature, it is not necessary to secure a long maximum echo path length of, for example, 300 milliseconds for voices in all frequency bands, but at least for voices in a low frequency band. Become.

【0038】第2の特徴として、左右2チャンネルのス
ピーカから出力してステレオマイクロホンに飛び込む音
声は、それらのスピーカとステレオマイクロホンとの間
のエコー経路の距離が長くなるにつれて、左チャンネル
の音声と右チャンネルの音声との差が少なくなる。その
ため、それらのスピーカから出力した後部屋の壁等で反
射してステレオマイクロホンに飛び込む音声は、ステレ
オ音声よりもむしろモノラル音声に近くなる。マイクロ
ホンのステレオ方式でいえば、このようなモノラル音声
に近い音声は、M−S(ミッド−サイド)方式における
マイク正面方向の成分であるミッド成分の音声に相当す
る。
As a second feature, the sound output from the left and right two-channel speakers and jumping into the stereo microphones becomes different from the left-channel sound and the right channel as the distance of the echo path between those speakers and the stereo microphone becomes longer. The difference from the channel sound is reduced. Therefore, the sound that is output from those speakers and then reflected by the wall of the room and jumps into the stereo microphone is closer to monaural sound rather than stereo sound. In the case of the stereo system of the microphone, such a sound close to a monaural sound corresponds to a sound of a mid component which is a component in the front direction of the microphone in the MS (mid-side) system.

【0039】この第2の特徴からは、ステレオ音声信号
を送受信する双方向コミュニケーションシステムでも、
エコーキャンセラでの処理は、左右2チャンネル方式に
おける各チャンネルの音声信号について行う必要はな
く、M−S方式におけるミッド成分の音声信号を中心に
行えばよいことになる。
From the second characteristic, even in a two-way communication system for transmitting and receiving a stereo audio signal,
The processing in the echo canceller does not need to be performed for the audio signals of the respective channels in the left and right two-channel system, but may be performed mainly for the audio signal of the mid component in the MS system.

【0040】そこで、本発明に係るエコーキャンセラ
は、スピーカに送られる所定のサンプリング周波数のス
テレオ音声信号のうち、M−S方式のミッド成分の音声
信号を、低周波帯域の音声信号と高周波帯域の音声信号
とに帯域分割する第1の帯域分割手段と、この第1の帯
域分割手段で帯域分割された低周波帯域のミッド成分の
音声信号のサンプリング周波数を所定レートで下げる第
1の周波数変換手段と、マイクロホンから入力するこの
所定のサンプリング周波数のステレオ音声信号のうち、
M−S方式のミッド成分の音声信号を、この低周波帯域
の音声信号とこの高周波帯域の音声信号とに帯域分割す
る第2の帯域分割手段と、この第2の帯域分割手段で帯
域分割された低周波帯域のミッド成分の音声信号のサン
プリング周波数をこの所定レートで下げる第2の周波数
変換手段と、この第1の周波数変換手段から出力した低
周波帯域のミッド成分の音声信号がリファレンス信号と
して供給されるとともに、この第2の周波数変換手段か
ら出力した低周波帯域のミッド成分の音声信号が目標信
号として供給され、このリファレンス信号からこの目標
信号のレプリカを作成し、この目標信号からこのレプリ
カを差し引いた誤差信号を出力する適応フィルタと、こ
の適応フィルタから出力した誤差信号のサンプリング周
波数をこの所定のサンプリング周波数に上げる第3の周
波数変換手段とを備えるようにした。
Therefore, in the echo canceller according to the present invention, of the stereo audio signals of the predetermined sampling frequency sent to the speaker, the audio signal of the MS mid component is converted into the audio signal of the low frequency band and the audio signal of the high frequency band. First band dividing means for band-dividing into an audio signal and first frequency converting means for lowering a sampling frequency of a mid-component audio signal of a low frequency band, which is band-divided by the first band dividing means, at a predetermined rate. And, of the stereo audio signal of this predetermined sampling frequency input from the microphone,
Second band division means for band-dividing the M-S system mid-component voice signal into the low-frequency band voice signal and the high-frequency band voice signal, and the second band division means. The second frequency conversion means for lowering the sampling frequency of the low frequency band mid component audio signal at the predetermined rate, and the low frequency band mid component audio signal output from the first frequency conversion means as reference signals. While being supplied, the low-frequency band mid-component audio signal output from the second frequency conversion means is supplied as a target signal, a replica of this target signal is created from this reference signal, and this replica is created from this target signal. The adaptive filter that outputs the error signal after subtracting and the sampling frequency of the error signal output from this adaptive filter are And so and a third frequency converting means for increasing the sampling frequency.

【0041】このエコーキャンセラでは、スピーカに送
られる所定のサンプリング周波数のステレオ音声信号の
うち、M−S方式のミッド成分の音声信号が、第1の帯
域分割手段で低周波帯域の音声信号と高周波帯域の音声
信号とに帯域分割される。そして、この低周波帯域のミ
ッド成分の音声信号が、第1の周波数変換手段でサンプ
リング周波数を下げられた後、適応フィルタにリファレ
ンス信号として入力する。
In this echo canceller, of the stereo audio signals of a predetermined sampling frequency sent to the speaker, the audio signal of the M-S mid component is mixed with the audio signal of the low frequency band and the high frequency by the first band dividing means. The band is divided into a band voice signal and a band voice signal. Then, the audio signal of the low frequency band mid component is input to the adaptive filter as a reference signal after the sampling frequency is lowered by the first frequency conversion means.

【0042】また、マイクロホンから入力するこの所定
のサンプリング周波数のステレオ音声信号のうち、M−
S方式のミッド成分の音声信号が、第2の帯域分割手段
で第1の帯域分割手段と同じく低周波帯域の音声信号と
高周波帯域の音声信号とに帯域分割される。そして、こ
の低周波帯域のミッド成分の音声信号が、第2の周波数
変換手段で第1の周波数変換手段と同じレートでサンプ
リング周波数を下げられた後、適応フィルタに目標信号
として入力する。
Of the stereo audio signals of this predetermined sampling frequency input from the microphone, M-
The S-system mid-component audio signal is band-divided into a low-frequency band audio signal and a high-frequency band audio signal by the second band-dividing means, as in the first band-dividing means. Then, the audio signal of the mid component in the low frequency band is input to the adaptive filter as a target signal after the sampling frequency is lowered by the second frequency converting means at the same rate as that of the first frequency converting means.

【0043】適応フィルタでは、図2のエコーキャンセ
ラ105について説明したのと同様にして、このリファ
レンス信号からこの目標信号のレプリカが作成され、こ
の目標信号からこのレプリカを差し引いた誤差信号が出
力される。
In the adaptive filter, a replica of this target signal is created from this reference signal and an error signal obtained by subtracting this replica from this target signal is output in the same manner as described for the echo canceller 105 in FIG. .

【0044】その際、一定の最大エコーパス長を確保す
るために必要なこの適応フィルタの処理能力は、前述の
第1の理由から、サンプリング周波数の低下の度合いの
2乗に比例して低くなっている。
At this time, the processing capacity of this adaptive filter required to secure a constant maximum echo path length becomes lower in proportion to the square of the degree of decrease in the sampling frequency for the above-mentioned first reason. There is.

【0045】また、低周波帯域のミッド成分の音声信号
だけを処理するので、前述の第2の理由として述べたよ
うにこの適応フィルタの処理能力を4倍に高める必要は
ない。
Further, since only the audio signal of the low frequency band mid component is processed, it is not necessary to increase the processing capacity of this adaptive filter by four times as described above as the second reason.

【0046】この適応フィルタから出力した誤差信号
は、第3の周波数変換手段でサンプリング周波数をエコ
ーキャンセラへの入力音声信号と同じサンプリング周波
数に上げられた後、このエコーキャンセラから出力す
る。
The error signal output from this adaptive filter is output from this echo canceller after the sampling frequency is raised to the same sampling frequency as the input audio signal to the echo canceller by the third frequency conversion means.

【0047】このエコーキャンセラによれば、ステレオ
音声信号を処理するにもかかわらず、またこのステレオ
音声信号のサンプリング周波数が高くても、それほど処
理能力の高くない適応フィルタを用いたまま、一定以上
の(例えば300ミリ秒というような)長い最大エコー
パス長を確保できるようになる。
According to this echo canceller, even if the stereo audio signal is processed, and even if the sampling frequency of the stereo audio signal is high, the echo canceller maintains a certain level or more while using an adaptive filter having a low processing capability. A long maximum echo path length (for example, 300 milliseconds) can be secured.

【0048】したがって、サンプリング周波数の高いス
テレオ音声信号を送受信する双方向コミュニケーション
システムにおいて、一定以上の長い最大エコーパス長を
確保しつつ、小型且つ低コストにエコーをキャンセルす
ることができるようになる。
Therefore, in a two-way communication system for transmitting and receiving a stereo audio signal having a high sampling frequency, it is possible to cancel an echo at a small size and at low cost while ensuring a long maximum echo path length of a certain value or more.

【0049】なお、このエコーキャンセラにおいて、一
例として、スピーカに送られるこの所定のサンプリング
周波数のステレオ音声信号のうち、M−S方式のサイド
成分の音声信号を、低周波帯域の音声信号と高周波帯域
の音声信号とに帯域分割する第3の帯域分割手段と、こ
の第3の帯域分割手段で帯域分割された低周波帯域のサ
イド成分の音声信号のサンプリング周波数を所定レート
で下げる第4の周波数変換手段と、マイクロホンから入
力するこの所定のサンプリング周波数のステレオ音声信
号のうち、M−S方式のサイド成分の音声信号を、この
低周波帯域の音声信号とこの高周波帯域の音声信号とに
帯域分割する第4の帯域分割手段と、この第4の帯域分
割手段で帯域分割された低周波帯域のサイド成分の音声
信号のサンプリング周波数をこの所定レートで下げる第
5の周波数変換手段と、この第4の周波数変換手段から
出力した低周波帯域のサイド成分の音声信号がリファレ
ンス信号として供給されるとともに、この第5の周波数
変換手段から出力した低周波帯域のサイド成分の音声信
号が目標信号として供給され、このリファレンス信号か
らこの目標信号のレプリカを作成し、この目標信号から
このレプリカを差し引いた誤差信号を出力する第2の適
応フィルタと、この第2の適応フィルタから出力した誤
差信号のサンプリング周波数をこの所定のサンプリング
周波数に上げる第6の周波数変換手段と、この第6の周
波数変換手段から出力した誤差信号と第3の周波数変換
手段から出力した誤差信号とを加算する加算手段とをさ
らに備えることが好適である。
In this echo canceller, as an example, of the stereo audio signals of the predetermined sampling frequency sent to the speaker, the audio signal of the MS side component is converted into the audio signal of the low frequency band and the audio signal of the high frequency band. Third band dividing means for band-dividing the audio signal into the audio signal of the second audio signal, and fourth frequency conversion for lowering the sampling frequency of the audio signal of the side component of the low frequency band divided by the third band dividing means at a predetermined rate. Means, and of the stereo audio signals of the predetermined sampling frequency input from the microphone, the audio signal of the MS side component is band-divided into the audio signal of the low frequency band and the audio signal of the high frequency band. Fourth band dividing means and sampler of the side signal audio signal of the low frequency band band-divided by the fourth band dividing means Fifth frequency conversion means for reducing the frequency at this predetermined rate, and the audio signal of the side component of the low frequency band output from the fourth frequency conversion means are supplied as a reference signal and the fifth frequency conversion means. The second adaptation which outputs the error signal obtained by subtracting this replica from the target signal by supplying the side signal audio signal of the low frequency band output from the target signal as the target signal. A filter, a sixth frequency conversion means for increasing the sampling frequency of the error signal output from the second adaptive filter to the predetermined sampling frequency, an error signal output from the sixth frequency conversion means, and a third frequency It is preferable to further include addition means for adding the error signal output from the conversion means.

【0050】あるいはまた、第1の帯域分割手段で帯域
分割された高周波帯域のミッド成分の音声信号がリファ
レンス信号として供給されるとともに、第2の帯域分割
手段で帯域分割された高周波帯域のミッド成分の音声信
号が目標信号として供給され、このリファレンス信号か
らこの目標信号のレプリカを作成し、この目標信号から
このレプリカを差し引いた誤差信号を出力する第3の適
応フィルタと、この第3の適応フィルタから出力した誤
差信号と第3の周波数変換手段から出力した誤差信号と
を加算する加算手段とをさらに備えることも好適であ
る。
Alternatively, the audio signal of the mid component of the high frequency band which is band-divided by the first band dividing means is supplied as a reference signal, and the mid component of the high frequency band which is band-divided by the second band dividing means. Audio signal is supplied as a target signal, a replica of this target signal is created from this reference signal, and an error signal obtained by subtracting this replica from this target signal is output, and this third adaptive filter It is also preferable to further include an adding unit that adds the error signal output from the third frequency converting unit and the error signal output from the third frequency converting unit.

【0051】このように、低周波帯域のミッド成分の音
声信号以外の、低周波帯域のサイド成分の音声信号, 高
周波帯域のミッド成分の音声信号を処理する第2, 第3
の適応フィルタをいわば補助的に設けることにより、そ
うした音声信号についてもエコーがキャンセルされるの
で、一層よくエコーをキャンセルすることができるよう
になる。
As described above, the second and third audio signals for processing the side component audio signal of the low frequency band and the mid component audio signal of the high frequency band other than the audio signal of the low frequency band mid component are processed.
By providing the adaptive filter of (2) so to speak, the echo can be canceled even for such a voice signal, so that the echo can be canceled even better.

【0052】そして、こうした低周波帯域のサイド成分
の音声や高周波帯域のミッド成分の音声について確保す
べき最大エコーパス長は、前述した音声やエコーの特徴
から、低周波帯域のミッド成分の音声について確保すべ
き最大エコーパス長よりも短くてよい。
The maximum echo path length that should be ensured for such a side component voice in the low frequency band and a mid component voice in the high frequency band is secured for the mid component voice in the low frequency band from the characteristics of the voice and echo described above. It may be shorter than the maximum echo path length to be used.

【0053】したがって、これらの補助的な適応フィル
タの処理能力も低くて済むので、やはり小型且つ低コス
トにエコーをキャンセルすることができる。
Therefore, since the processing capacity of these auxiliary adaptive filters is low, echo can be canceled in a small size and at low cost.

【0054】また、このエコーキャンセラにおいて、一
例として、スピーカに送られる左右2チャンネルのステ
レオ音声信号を、M−S方式のステレオ音声信号に変換
する第1のステレオ方式変換手段と、マイクロホンから
入力する左右2チャンネルのステレオ音声信号を、M−
S方式のステレオ音声信号に変換する第2のステレオ方
式変換手段とをさらに備え、この第1のステレオ方式変
換手段から出力したミッド成分の音声信号が第1の帯域
分割手段で帯域分割され、この第2のステレオ方式変換
手段から出力したミッド成分の音声信号が第2の帯域分
割手段で帯域分割されるようにすることが好適である。
In this echo canceller, as an example, the left and right two-channel stereo audio signals sent to the speaker are input from the first stereo system conversion means for converting into a stereo system audio signal of the MS system and the microphone. Left and right two-channel stereo audio signal, M-
A second stereo method converting means for converting to an S method stereo audio signal is further provided, and the mid-component audio signal outputted from the first stereo method converting means is band-divided by the first band dividing means. It is preferable that the mid-component audio signal output from the second stereo conversion unit is band-divided by the second band-dividing unit.

【0055】それにより、M−S方式ではなく通常の方
式(左右2チャンネル方式)のステレオマイクロホンを
設けた双方向コミュニケーションシステムでも、小型且
つ低コストにエコーをキャンセルすることができるよう
になる。
As a result, even in a two-way communication system provided with a stereo microphone of an ordinary method (2-channel left / right method) instead of the MS method, the echo can be canceled in a small size and at low cost.

【0056】また、このエコーキャンセラにおいて、一
例として、適応フィルタに、リファレンス信号, 目標信
号, 誤差信号の時間平均エネルギーをそれぞれ算出する
手段と、この時間平均エネルギーの大きさに応じてタッ
プ係数の更新を制御する手段とを含めることが好適であ
る。
Further, in this echo canceller, as an example, the adaptive filter calculates the time average energy of the reference signal, the target signal and the error signal, and the tap coefficient is updated according to the magnitude of the time average energy. Is preferably included.

【0057】このように、リファレンス信号, 目標信
号, 誤差信号のそれぞれの時間平均エネルギーの大きさ
に応じてタップ係数の更新を制御することにより、エコ
ー経路の変化(例えばステレオマイクロホンを向ける方
向の変化)や瞬間的なノイズ音(例えばドアの開閉音)
の発生にも適確に対応してエコーをキャンセルすること
ができるようになる。
In this way, by controlling the update of the tap coefficient according to the magnitude of the time-averaged energy of each of the reference signal, the target signal, and the error signal, the change in the echo path (for example, the change in the direction in which the stereo microphone is directed). ) Or a momentary noise sound (eg door opening / closing sound)
It is possible to cancel the echo by appropriately responding to the occurrence of.

【0058】また、このエコーキャンセラにおいて、一
例として、適応フィルタから出力した所定の閾値以下の
誤差信号を減衰させる減衰手段をさらに備え、この減衰
手段の出力信号のサンプリング周波数を第3の周波数変
換手段で上げることが好適である。
The echo canceller further includes, as an example, an attenuator for attenuating an error signal output from the adaptive filter and equal to or less than a predetermined threshold, and the sampling frequency of the output signal of the attenuator is the third frequency converter. It is preferable to raise by.

【0059】それにより、適応フィルタではキャンセル
しきれない微小レベルの誤差信号が減衰するので、一層
よくエコーをキャンセルすることができるようになる。
As a result, the error signal of a minute level which cannot be canceled by the adaptive filter is attenuated, so that the echo can be canceled more effectively.

【0060】次に、本発明に係るエコーキャンセリング
方法は、スピーカに送られる所定のサンプリング周波数
のステレオ音声信号のうち、M−S方式のミッド成分の
音声信号を、低周波帯域の音声信号と高周波帯域の音声
信号とに帯域分割する第1ステップと、この第1ステッ
プで帯域分割した低周波帯域のミッド成分の音声信号
を、サンプリング周波数を所定レートで下げて、適応フ
ィルタにリファレンス信号として供給する第2ステップ
と、マイクロホンから入力するこの所定のサンプリング
周波数のステレオ音声信号のうち、M−S方式のミッド
成分の音声信号を、この低周波帯域の音声信号とこの高
周波帯域の音声信号とに帯域分割する第3ステップと、
この第3ステップで帯域分割した低周波帯域のミッド成
分の音声信号を、サンプリング周波数をこの所定レート
で下げて、この適応フィルタに目標信号として供給する
第4ステップと、この適応フィルタにおいて、このリフ
ァレンス信号からこの目標信号のレプリカを作成し、こ
の目標信号からこのレプリカを差し引いた誤差信号を出
力する第5ステップと、この適応フィルタから出力した
誤差信号のサンプリング周波数をこの所定のサンプリン
グ周波数に上げる第6ステップとを有するようにした。
Next, in the echo canceling method according to the present invention, of the stereo audio signals of a predetermined sampling frequency sent to the speaker, the audio signal of the MS mid component is converted into the audio signal of the low frequency band. The first step of band-dividing into a high-frequency band audio signal and the low-frequency band mid-component audio signal band-divided in this first step are reduced in sampling frequency at a predetermined rate and supplied to the adaptive filter as a reference signal. Of the stereo audio signal of the predetermined sampling frequency input from the microphone, the audio signal of the MS mid component is converted into the audio signal of the low frequency band and the audio signal of the high frequency band. A third step of band splitting,
In the fourth step of lowering the sampling frequency at the predetermined rate and supplying the target signal to the adaptive filter, the reference signal is used in the reference filter in the low frequency band mid-component audio signal band-divided in the third step. A fifth step of creating a replica of this target signal from the signal and outputting an error signal obtained by subtracting this replica from this target signal, and raising the sampling frequency of the error signal output from this adaptive filter to this predetermined sampling frequency. And 6 steps.

【0061】このエコーキャンセリング方法によれば、
前述の本発明に係るエコーキャンセラと全く同様にし
て、音声信号のサンプリング周波数が高く且つステレオ
音声信号を送受信する双方向コミュニケーションシステ
ムにおいて、一定以上の長い最大エコーパス長を確保し
つつ、小型且つ低コストにエコーをキャンセルすること
ができるようになる。
According to this echo canceling method,
Just as the echo canceller according to the present invention described above, in a two-way communication system in which the sampling frequency of a voice signal is high and a stereo voice signal is transmitted and received, a small maximum size and low cost are ensured while ensuring a long maximum echo path length above a certain level. You will be able to cancel the echo.

【0062】なお、このエコーキャンセリング方法にお
いても、一例として、スピーカに送られるこの所定のサ
ンプリング周波数のステレオ音声信号のうち、M−S方
式のサイド成分の音声信号を、低周波帯域の音声信号と
高周波帯域の音声信号とに帯域分割するステップと、帯
域分割したこの低周波帯域のサイド成分の音声信号を、
サンプリング周波数を所定レートで下げて、別の適応フ
ィルタにリファレンス信号として供給するステップと、
マイクロホンから入力するこの所定のサンプリング周波
数のステレオ音声信号のうち、M−S方式のサイド成分
の音声信号を、この低周波帯域の音声信号とこの高周波
帯域の音声信号とに帯域分割するステップと、帯域分割
したこの低周波帯域のサイド成分の音声信号を、サンプ
リング周波数をこの所定レートで下げて、この別の適応
フィルタに目標信号として供給するステップと、この別
の適応フィルタにおいて、このリファレンス信号からこ
の目標信号のレプリカを作成し、この目標信号からこの
レプリカを差し引いた誤差信号を出力するステップと、
この別の適応フィルタから出力した誤差信号と第6ステ
ップでサンプリング周波数を上げた誤差信号とを加算す
るステップとをさらに有することが好適である。
Also in this echo canceling method, as an example, of the stereo audio signals of the predetermined sampling frequency sent to the speaker, the audio signal of the MS side component is converted into the audio signal of the low frequency band. And a step of band-dividing into a high-frequency band audio signal, and the band-divided low-frequency band side component audio signal,
Lowering the sampling frequency at a predetermined rate and supplying it as a reference signal to another adaptive filter,
Of the stereo audio signal of the predetermined sampling frequency inputted from the microphone, a step of band-dividing the audio signal of the MS side component into the audio signal of the low frequency band and the audio signal of the high frequency band, The step of supplying the audio signal of the side component of the band-divided low frequency band to the other adaptive filter as a target signal by lowering the sampling frequency at the predetermined rate and from the reference signal in the other adaptive filter. Creating a replica of this target signal and outputting an error signal obtained by subtracting this replica from this target signal;
It is preferable to further include a step of adding the error signal output from the other adaptive filter and the error signal whose sampling frequency is increased in the sixth step.

【0063】あるいはまた、第1ステップで帯域分割し
た高周波帯域のミッド成分の音声信号を別の適応フィル
タにリファレンス信号として供給するとともに、第3ス
テップで帯域分割した高周波帯域のミッド成分の音声信
号をこの別の適応フィルタに目標信号として供給するス
テップと、この別の適応フィルタにおいて、このリファ
レンス信号からこの目標信号のレプリカを作成し、この
目標信号からこのレプリカを差し引いた誤差信号を出力
するステップと、この別の適応フィルタから出力した誤
差信号と第6ステップでサンプリング周波数を上げた誤
差信号とを加算するステップとをさらに有することも好
適である。
Alternatively, the mid-component audio signal of the high frequency band which is band-divided in the first step is supplied to another adaptive filter as a reference signal, and the mid-component audio signal of the high frequency band which is band-divided in the third step is supplied. The step of supplying this other adaptive filter as a target signal, and the step of creating a replica of this target signal from this reference signal in this another adaptive filter and outputting an error signal obtained by subtracting this replica from this target signal, It is also preferable to further include a step of adding the error signal output from the other adaptive filter and the error signal whose sampling frequency is increased in the sixth step.

【0064】それにより、前述の本発明に係るエコーキ
ャンセラと全く同様にして、低周波帯域のサイド成分の
音声信号や高周波帯域のミッド成分の音声信号について
もエコーがキャンセルされるので一層よくエコーをキャ
ンセルできるとともに、これらの別の適応フィルタ(補
助的な適応フィルタ)の処理能力は低くて済むのでやは
り小型且つ低コストにエコーをキャンセルすることがで
きるようになる。
As a result, in the same manner as the above-described echo canceller according to the present invention, the echo is canceled even for the audio signal of the side component in the low frequency band and the audio signal of the mid component in the high frequency band. In addition to being cancelable, the processing capacity of these other adaptive filters (auxiliary adaptive filters) is low, so that echoes can be canceled in a small size and at low cost.

【0065】[0065]

【発明の実施の形態】以下、本発明を、サンプリング周
波数48kHzのステレオ音声信号を送受信する双方向
コミュニケーションシステムに適用した例について、図
面を用いて説明する。
BEST MODE FOR CARRYING OUT THE INVENTION An example in which the present invention is applied to a two-way communication system for transmitting and receiving a stereo audio signal having a sampling frequency of 48 kHz will be described below with reference to the drawings.

【0066】図5は、本発明を適用した双方向コミュニ
ケーションシステムで使用される音声送受信用の機器を
示しており、図1, 図4と共通する機器には同一の符号
を付している。
FIG. 5 shows a device for voice transmission / reception used in a two-way communication system to which the present invention is applied, and devices common to FIGS. 1 and 4 are designated by the same reference numerals.

【0067】地点Aに、左右2チャンネル方式のステレ
オマイクロホン121, スピーカ122L, 122R,
ADコンバータ51, DAコンバータ52, エコーキャ
ンセラ1, 音声コーデック106及びネットワークイン
タフェース107が設けられている。
At point A, left and right two-channel stereo microphones 121, speakers 122L, 122R,
An AD converter 51, a DA converter 52, an echo canceller 1, a voice codec 106 and a network interface 107 are provided.

【0068】地点Aとは離れた地点Bにも、同じくステ
レオマイクロホン121, スピーカ122L, 122
R, ADコンバータ51, DAコンバータ52, エコー
キャンセラ1, 音声コーデック106及びネットワーク
インタフェース107が設けられている。
A stereo microphone 121, speakers 122L, 122 are also provided at a point B apart from the point A.
An R / AD converter 51, a DA converter 52, an echo canceller 1, a voice codec 106 and a network interface 107 are provided.

【0069】ADコンバータ51のサンプリング周波数
は、48kHz(ハイファイ用の音響信号の必要帯域で
ある20kHzの2倍以上)になっている。
The sampling frequency of the AD converter 51 is 48 kHz (twice or more of 20 kHz which is the necessary band of the acoustic signal for hi-fi).

【0070】地点Aのネットワークインタフェース10
7と地点Bのネットワークインタフェース107とは、
電話回線等を用いたネットワーク108で結ばれてい
る。
Network interface 10 at point A
7 and the network interface 107 at the point B,
It is connected by a network 108 using a telephone line or the like.

【0071】地点Aにおいて、ステレオマイクロホン1
21に音声が入力すると、ステレオマイクロホン121
からの左右2チャンネルの音声信号が、ADコンバータ
51によりサンプリング周波数48kHzでデジタル変
換された後、エコーキャンセラ1を経て音声コーデック
106で符号化(圧縮)され、ネットワークインタフェ
ース107から通信ネットワーク108経由で地点Bの
ネットワークインタフェース107に送られる。そし
て、地点Bにおいて、音声コーデック106で復号(伸
長)され、エコーキャンセラ1を経てDAコンバータ5
2でアナログ変換されて、スピーカ122L, 122R
から出力する。
At the point A, the stereo microphone 1
When voice is input to 21, the stereo microphone 121
The left and right two-channel audio signals from are digitally converted by the AD converter 51 at a sampling frequency of 48 kHz, then encoded (compressed) by the audio codec 106 via the echo canceller 1, and then transmitted from the network interface 107 to the point via the communication network 108. B network interface 107. Then, at the point B, it is decoded (decompressed) by the audio codec 106, passes through the echo canceller 1, and then the DA converter 5
Analog converted by 2 and speaker 122L, 122R
Output from.

【0072】地点Bにおいても、ステレオマイクロホン
121に音声が入力すると、ステレオマイクロホン12
1からの左右2チャンネルの音声信号が、ADコンバー
タ51によりサンプリング周波数48kHzでデジタル
変換された後、エコーキャンセラ1を経て音声コーデッ
ク106で符号化され、ネットワークインタフェース1
07から通信ネットワーク108経由で地点Aのネット
ワークインタフェース107に送られる。そして、地点
Aにおいて、音声コーデック106で復号され、エコー
キャンセラ1を経てDAコンバータ52でアナログ変換
されて、スピーカ122L, 122Rから出力する。
Also at the point B, when voice is input to the stereo microphone 121, the stereo microphone 12
The left and right two-channel audio signals from 1 are digitally converted by the AD converter 51 at a sampling frequency of 48 kHz, and then coded by the audio codec 106 via the echo canceller 1 to obtain the network interface 1
07 to the network interface 107 at the point A via the communication network 108. Then, at the point A, it is decoded by the audio codec 106, passed through the echo canceller 1, converted into analog by the DA converter 52, and output from the speakers 122L, 122R.

【0073】図6は、エコーキャンセラ1の構成を示
す。エコーキャンセラ1は、MSコンバータ2, 3と、
帯域分割フィルタ4〜7と、デシメータ8〜11と、エ
コーキャンセルブロック12〜15と、エキスパンダ/
ゲート回路16〜19と、インターポレータ20, 21
と、加算器22, 23と、LRコンバータ24とで構成
されている。
FIG. 6 shows the configuration of the echo canceller 1. The echo canceller 1 includes the MS converters 2 and 3,
Band division filters 4 to 7, decimators 8 to 11, echo cancellation blocks 12 to 15, and expander /
Gate circuits 16 to 19 and interpolators 20 and 21
And an adder 22, 23 and an LR converter 24.

【0074】相手方の地点から自分の地点に送られて音
声コーデック106(図5)からエコーキャンセラ1に
入力するサンプリング周波数48kHzの左右2チャン
ネルの音声信号xL, xRが、MSコンバータ2に供給
されるとともに、そのままエコーキャンセラ1から出力
してDAコンバータ52(図5)に送られる。
The left and right two-channel audio signals xL and xR having a sampling frequency of 48 kHz, which are sent from the other party's point to the own point and are input from the audio codec 106 (FIG. 5) to the echo canceller 1, are supplied to the MS converter 2. Together with this, it is output from the echo canceller 1 as it is and sent to the DA converter 52 (FIG. 5).

【0075】また、自分の地点のステレオマイクロホン
121(図5)からADコンバータ51(図5)を経て
エコーキャンセラ1に入力したサンプリング周波数48
kHzの左右2チャンネルの音声信号yL, yRが、M
Sコンバータ3に供給される。
The sampling frequency 48 input to the echo canceller 1 from the stereo microphone 121 (FIG. 5) at the user's point via the AD converter 51 (FIG. 5).
The left and right channel audio signals yL and yR of kHz are M
It is supplied to the S converter 3.

【0076】MSコンバータ2, 3は、それぞれ次の式
(1) , (2) の演算を行うことにより、左右2チャンネル
の音声信号L, R(ここでは音声信号xL, yL, x
R, yR)を、M−S(ミッド−サイド)ステレオ方式
のミッド成分, サイド成分の音声信号M, Sに変換する
回路である。 M=(L+R)/2 …(1) S=(L−R)/2α (但し0<α<1) …(2)
The MS converters 2 and 3 have the following equations, respectively.
By performing the operations of (1) and (2), the left and right channel audio signals L, R (here, audio signals xL, yL, x
R, yR) is a circuit for converting an audio signal M, S of a mid component and a side component of the MS (mid-side) stereo system. M = (L + R) / 2 (1) S = (LR) / 2α (where 0 <α <1) (2)

【0077】MSコンバータ2で変換された音声信号x
M, xSは、それぞれ帯域分割フィルタ4, 5に供給さ
れる。また、MSコンバータ3で変換された音声信号y
M,ySは、それぞれ帯域分割フィルタ6, 7に供給さ
れる。
Audio signal x converted by the MS converter 2
M and xS are supplied to the band division filters 4 and 5, respectively. Also, the audio signal y converted by the MS converter 3
M and yS are supplied to the band division filters 6 and 7, respectively.

【0078】帯域分割フィルタ4〜7は、それぞれ音声
信号を3kHz未満の低周波帯域の音声信号と3kHz
以上の高周波帯域の音声信号とに分割する。
The band division filters 4 to 7 respectively convert the audio signal into the low frequency band audio signal of less than 3 kHz and the audio signal of 3 kHz.
The audio signal of the above high frequency band is divided.

【0079】図7は、帯域分割フィルタ4〜7の構成を
示す。帯域分割フィルタ4〜7では、直線位相型のFI
RフィルタでLPF(ローパスフィルタ)31を構成
し、このLPF31によって入力音声信号から低周波帯
域の音声信号を得ている。
FIG. 7 shows the configuration of the band division filters 4 to 7. In the band division filters 4 to 7, the linear phase type FI is used.
An LP filter (low-pass filter) 31 is composed of an R filter, and the LPF 31 obtains an audio signal in a low frequency band from an input audio signal.

【0080】また、入力音声信号を遅延回路32でLP
F31での処理時間分だけ遅延させ、加減算器33で遅
延回路32の出力信号からLPF31の出力信号を差し
引くことにより、高周波帯域の音声信号を得ている。
Also, the input voice signal is delayed by the delay circuit 32 to LP.
By delaying the processing time in F31 and subtracting the output signal of the LPF 31 from the output signal of the delay circuit 32 in the adder / subtractor 33, an audio signal in a high frequency band is obtained.

【0081】帯域分割フィルタ4〜7を、IIRフィル
タで構成したLPFやHPF(ハイパスフィルタ)を用
いて帯域分割を行う構成ではなく図7のような構成にし
たのは、帯域分割した低周波帯域の音声信号と高周波帯
域の音声信号とを後述のように加算器22, 23で再び
合成してもとの音声信号を再現することを考慮して、忠
実にもとの音声信号を再現できるようにするためであ
る。
The band-dividing filters 4 to 7 are not configured to perform band-dividing by using LPFs or HPFs (high-pass filters) configured by IIR filters, but are configured as shown in FIG. In order to faithfully reproduce the original audio signal in consideration of reproducing the original audio signal by re-synthesizing the audio signal and the high frequency band audio signal with adders 22 and 23 as described later. This is because

【0082】図6に示すように、帯域分割フィルタ4で
帯域分割された高周波帯域のミッド成分の音声信号xM
Hは、エコーキャンセルブロック12, 14にそれぞれ
リファレンス信号x(k)として送られる。
As shown in FIG. 6, the audio signal xM of the mid component of the high frequency band which is band-divided by the band-division filter 4.
H is sent as a reference signal x (k) to the echo cancellation blocks 12 and 14, respectively.

【0083】帯域分割フィルタ4で帯域分割された低周
波帯域のミッド成分の音声信号xMLは、デシメータ8
に送られる。
The low-frequency band mid-component audio signal xML band-divided by the band-division filter 4 is decimator 8
Sent to.

【0084】帯域分割フィルタ5で帯域分割された高周
波帯域のサイド成分の音声信号xSHは、エコーキャン
セルブロック12, 14にそれぞれリファレンス信号x
(k)として送られる。
The sound signal xSH of the side component of the high frequency band, which has been band-divided by the band-division filter 5, is supplied to the echo cancel blocks 12 and 14 respectively as the reference signal x
Sent as (k).

【0085】帯域分割フィルタ5で帯域分割された低周
波帯域のサイド成分の音声信号xSLは、デシメータ9
に送られる。
The audio signal xSL of the side component of the low frequency band, which has been band-divided by the band-division filter 5, is decimator 9
Sent to.

【0086】帯域分割フィルタ6で帯域分割された高周
波帯域のミッド成分の音声信号yMHは、エコーキャン
セルブロック12に目標信号y(k)として送られる。
The mid-component audio signal yMH in the high frequency band, which has been band-divided by the band-division filter 6, is sent to the echo cancellation block 12 as the target signal y (k).

【0087】帯域分割フィルタ6で帯域分割された低周
波帯域のミッド成分の音声信号yMLは、デシメータ1
0に送られる。
The low-frequency band mid-component audio signal yML band-divided by the band-division filter 6 is decimator 1
Sent to 0.

【0088】帯域分割フィルタ7で帯域分割された高周
波帯域のサイド成分の音声信号ySHは、エコーキャン
セルブロック14に目標信号y(k)として送られる。
The side component audio signal ySH of the high frequency band, which has been band-divided by the band-division filter 7, is sent to the echo cancellation block 14 as the target signal y (k).

【0089】帯域分割フィルタ7で帯域分割された低周
波帯域のサイド成分の音声信号ySLは、デシメータ1
1に送られる。
The audio signal ySL of the side component of the low frequency band, which has been band-divided by the band-division filter 7, is the decimator 1
Sent to 1.

【0090】デシメータ8〜11は、それぞれデジタル
信号のサンプリング周波数を1/8のレートで下げる回
路である。
The decimators 8 to 11 are circuits that reduce the sampling frequency of the digital signal at a rate of 1/8.

【0091】デシメータ8でサンプリング周波数を48
kHzの1/8の6kHz(低周波帯域と高周波帯域と
の境界である3kHzの2倍)に下げられた低周波帯域
のミッド成分の音声信号xMLは、エコーキャンセルブ
ロック13, 15にそれぞれリファレンス信号x(k)
として送られる。
Set the sampling frequency to 48 with the decimator 8.
The low-frequency band mid-component audio signal xML lowered to 1/8 of 6 kHz (2 times 3 kHz, which is the boundary between the low-frequency band and the high-frequency band) is supplied to the echo cancellation blocks 13 and 15 as reference signals. x (k)
Sent as.

【0092】デシメータ9でサンプリング周波数を6k
Hzに下げられた低周波帯域のサイド成分の音声信号x
SLは、エコーキャンセルブロック13, 15にそれぞ
れリファレンス信号x(k)として送られる。
The sampling frequency is set to 6k by the decimator 9.
Audio signal of side component of low frequency band lowered to Hz x
SL is sent to the echo cancellation blocks 13 and 15 as a reference signal x (k), respectively.

【0093】デシメータ10でサンプリング周波数を6
kHzに下げられた低周波帯域のミッド成分の音声信号
yMLは、エコーキャンセルブロック13に目標信号y
(k)として送られる。
The decimator 10 sets the sampling frequency to 6
The low-frequency band mid-component audio signal yML lowered to kHz is sent to the echo cancel block 13 as the target signal yML.
Sent as (k).

【0094】デシメータ11でサンプリング周波数を6
kHzに下げられた低周波帯域のサイド成分の音声信号
ySLは、エコーキャンセルブロック15に目標信号y
(k)として送られる。
The decimator 11 sets the sampling frequency to 6
The audio signal ySL of the side component of the low frequency band lowered to kHz is sent to the echo cancellation block 15 by the target signal ySL.
Sent as (k).

【0095】図8は、エコーキャンセルブロック12〜
15の構成を示す。エコーキャンセルブロック12〜1
5は、図2のエコーキャンセラ105と同様に、適応フ
ィルタで構成されており、デジタルフィルタ41と、加
減算器42と、コントローラ43とを含んでいる。
FIG. 8 shows the echo cancel block 12-.
The structure of 15 is shown. Echo cancellation block 12-1
5 is an adaptive filter, like the echo canceller 105 of FIG. 2, and includes a digital filter 41, an adder / subtractor 42, and a controller 43.

【0096】デジタルフィルタ41は、図2のデジタル
フィルタ111について述べたのと同様にして、エコー
経路の伝達関数Hk(z)を推定し、伝達関数Hk
(z)とリファレンス信号x(k)の時系列ベクトル[
x(k), x(k−1), …x(k−N−1)] とを
畳み込むことにより、目標信号y(k)のレプリカy’
(k)を作成する。
The digital filter 41 estimates the transfer function Hk (z) of the echo path in the same manner as described for the digital filter 111 of FIG.
(Z) and reference signal x (k) time series vector [
x (k), x (k−1), ... X (k−N−1)] and the replica y ′ of the target signal y (k).
Create (k).

【0097】その際、ミッド成分の音声信号をリファレ
ンス信号x(k)としてレプリカy’(k)を作成する
割合を、サイド成分の音声信号をリファレンス信号x
(k)としてレプリカy’(k)を作成する割合よりも
大きくする。
At this time, the ratio of creating the replica y '(k) using the mid-component audio signal as the reference signal x (k) and the side-component audio signal as the reference signal x
As (k), it is made larger than the ratio of creating the replica y ′ (k).

【0098】具体的には、エコーキャンセルブロック1
3では、例えば低周波帯域のミッド成分の音声信号xM
Lをリファレンス信号x(k)とするレプリカy’
(k)の作成と、低周波帯域のサイド成分の音声信号x
SLをリファレンス信号x(k)とするレプリカy’
(k)の作成とを10対1程度の割合で行う。
Specifically, the echo cancellation block 1
3, the audio signal xM of the low frequency band mid component
Replica y'where L is the reference signal x (k)
Creation of (k) and audio signal x of side component of low frequency band
Replica y ′ with SL as reference signal x (k)
(K) is created at a ratio of about 10: 1.

【0099】加減算器42は、目標信号y(k)からレ
プリカy’(k)を差し引くことにより、エコーをキャ
ンセルする。
The adder / subtractor 42 cancels the echo by subtracting the replica y '(k) from the target signal y (k).

【0100】コントローラ43は、加減算器42から出
力する誤差信号e(k)(目標信号y(k)からレプリ
カy’(k)を差し引いた残りの信号)の大きさに応じ
て、以下に述べるように、ESアフィン射影法を基礎と
しつつ、リファレンス信号x(k), 目標信号y(k)
及び誤差信号e(k)のエネルギーを監視する手法で、
デジタルフィルタ41のタップ係数を更新する。
The controller 43 will be described below according to the magnitude of the error signal e (k) (the remaining signal obtained by subtracting the replica y '(k) from the target signal y (k)) output from the adder / subtractor 42. As described above, the reference signal x (k) and the target signal y (k) are based on the ES affine projection method.
And a method of monitoring the energy of the error signal e (k),
The tap coefficient of the digital filter 41 is updated.

【0101】一般的なアフィン射影法では、デジタルフ
ィルタ41のタップ係数Bk(z)は、次の式(3) のよ
うにして更新される。
In the general affine projection method, the tap coefficient Bk (z) of the digital filter 41 is updated as in the following equation (3).

【0102】[0102]

【数1】 [Equation 1]

【0103】ESアフィン射影法では、このアフィン射
影法においてエコーの音響的性質の係数a(z)をさら
に考慮することにより、タップ係数Bk(z)が次の式
(4)のようにして更新される。
In the ES affine projection method, by further considering the coefficient a (z) of the acoustic property of the echo in this affine projection method, the tap coefficient Bk (z) becomes
It is updated as in (4).

【0104】[0104]

【数2】 [Equation 2]

【0105】この係数a(z)は、一般的にzが大きく
なるにつれて指数関数的に小さくなる。すなわち、遅延
量の大きい信号ほどタップ係数Bk(z)の更新量が小
さくなる。
This coefficient a (z) generally decreases exponentially as z increases. That is, the larger the delay amount, the smaller the update amount of the tap coefficient Bk (z).

【0106】コントローラ43による更新アルゴリズム
では、このESアフィン射影法を基礎としつつ、リファ
レンス信号x(k), 目標信号y(k)及び誤差信号e
(k)のエネルギーを監視することによって可変設定さ
れる係数である係数b(k)(0≦b(k)≦1)が導
入される。
In the updating algorithm by the controller 43, the reference signal x (k), the target signal y (k) and the error signal e are based on the ES affine projection method.
A coefficient b (k) (0 ≦ b (k) ≦ 1), which is a coefficient that is variably set by monitoring the energy of (k), is introduced.

【0107】そして、この係数b(k)を用いて、デジ
タルフィルタ41のタップ係数Bk(z)が次の式(5)
のようにして更新される。
Then, using this coefficient b (k), the tap coefficient Bk (z) of the digital filter 41 is expressed by the following equation (5).
It is updated like this.

【0108】[0108]

【数3】 [Equation 3]

【0109】図9は、コントローラ43が各サンプリン
グ周期毎に実行する係数b(k)の設定処理を示す。
FIG. 9 shows the setting process of the coefficient b (k) executed by the controller 43 in each sampling cycle.

【0110】この処理では、最初に、リファレンス信号
x(k), 目標信号y(k), 誤差信号e(k)の時間
平均エネルギーXe(k), Ye(k), Ee(k)を
それぞれ算出する(ステップS1)。
In this processing, first, the reference signal x (k), the target signal y (k), the time average energy Xe (k), Ye (k), and Ee (k) of the error signal e (k) are respectively obtained. Calculate (step S1).

【0111】なお、ここでは、タップ数とサンプリング
周期との積を平均時間として、指数関数的な(現在の時
点の信号をその後の時点の信号よりも大きく重み付けし
た)時間平均エネルギーを算出する。
Here, the exponential time-averaged energy (the signal at the current time point is weighted more than the signal at the subsequent time point) is calculated with the product of the number of taps and the sampling period as the average time.

【0112】しかし、この時間平均エネルギーの算出方
法としては、これ以外に、タップ数とサンプリング周期
との積以外を平均時間とする方法や、均等な(重み付け
をしない)時間平均エネルギーを算出する方法も挙げら
れる。
However, other than this, as a method of calculating the time average energy, a method of using an average time other than the product of the number of taps and the sampling period, and a method of calculating an even (non-weighted) time average energy Can also be mentioned.

【0113】これらのうちのどの算出方法をとるかは、
本発明を適用する個々の双方向コミュニケーションシス
テム毎に、そのシステム全体(音声信号の周波数帯域,
音声信号のサンプリング周期, マイクロホンやスピーカ
の特性等)を考慮して決めればよい。
Which of these calculation methods is used is
For each individual two-way communication system to which the present invention is applied, the entire system (frequency band of voice signal,
It may be determined in consideration of the sampling period of the audio signal, the characteristics of the microphone and the speaker, etc.).

【0114】ステップS1に続き、リファレンス信号x
(k)の時間平均エネルギーXe(k)が、閾値Xth
(但しXthは−20dBから−6dBの間の値)より
も大きいか否かを判断する(ステップS2)。
Following step S1, the reference signal x
The time average energy Xe (k) of (k) is the threshold Xth.
It is determined whether or not (however, Xth is a value between −20 dB and −6 dB) (step S2).

【0115】相手方の地点から自分の地点に送られる音
声信号(図5では音声信号xL, xR)のレベルが低い
場合には、スピーカ122L, 122Rから出力してス
テレオマイクロホン121に飛び込む音量が小さくなる
ので、ステレオマイクロホン121への入力音声は、ス
ピーカ122L, 122Rから飛び込む音声以外の音声
の割合が支配的となる。
When the level of the audio signals (audio signals xL, xR in FIG. 5) sent from the other party's point to the own point is low, the volume output from the speakers 122L, 122R and jumping into the stereo microphone 121 is reduced. Therefore, in the input sound to the stereo microphone 121, the ratio of the sound other than the sound jumping from the speakers 122L and 122R is dominant.

【0116】そうした状態でデジタルフィルタ41のタ
ップ係数Bk(z)を更新すると、デジタルフィルタ4
1が正常な値に収束しなくなってしまう。
When the tap coefficient Bk (z) of the digital filter 41 is updated in such a state, the digital filter 4
1 will not converge to a normal value.

【0117】そこで、ステップS2では、Xe(k)>
Xthであるか否かを判断することにより、スピーカ1
22L, 122Rからステレオマイクロホン121に飛
び込む音量がある程度以上の大きさになるか否かを判断
する。
Therefore, in step S2, Xe (k)>
By determining whether or not Xth, the speaker 1
It is determined whether or not the sound volume jumping into the stereo microphone 121 from the 22L and 122R becomes a certain level or more.

【0118】ここではXthを−20dBから−6dB
の間の値にしているが、このXthの値も前述の時間平
均エネルギーの算出方法と同様にシステム全体を考慮し
て決めればよい。
Here, Xth is changed from -20 dB to -6 dB.
The value of Xth may be determined in consideration of the entire system as in the method of calculating the time average energy described above.

【0119】ステップS2でノーであれば、当該サンプ
リング周期でのb(k)の値を0に設定するとともに、
コントローラ43の内部カウンタのカウント値CCを0
にセットする(ステップS7)。そして処理を終了す
る。
If NO in step S2, the value of b (k) in the sampling period is set to 0, and
Set the count value CC of the internal counter of the controller 43 to 0
(Step S7). Then, the process ends.

【0120】このようにb(k)の値を0に決定するこ
とにより、前述の式(5) から、当該サンプリング周期で
はタップ係数Bk(z)が更新されなくなる。
By determining the value of b (k) to 0 in this way, the tap coefficient Bk (z) is not updated in the sampling period from the above equation (5).

【0121】他方、ステップS2でイエスであれば、続
いて、リファレンス信号x(k)の時間平均エネルギー
Xe(k)と所定の係数k1との積が, 目標信号y
(k)の時間平均エネルギーYe(k)よりも大きいか
否かを判断する(ステップS3)。
On the other hand, if YES in step S2, then the product of the time average energy Xe (k) of the reference signal x (k) and the predetermined coefficient k1 is the target signal y.
It is determined whether or not it is larger than the time average energy Ye (k) of (k) (step S3).

【0122】スピーカ122L, 122Rからステレオ
マイクロホン121に飛び込む音量がある程度以上の大
きさであっても、自分の地点で発生したそれ以上の音量
が同時にステレオマイクロホン121に入力している
(例えば、自分の地点で人がステレオマイクロホン12
1に向かって話していたり、自分の地点で大きな雑音が
発生していたりする)ことがある。
Even if the volume jumping into the stereo microphone 121 from the speakers 122L and 122R is more than a certain level, the volume higher than that generated at the user's point is input to the stereo microphone 121 at the same time (for example, his own). At the point, a person uses a stereo microphone 12
1 or you may be making a lot of noise at your point).

【0123】そうしたダブルトークの状態でデジタルフ
ィルタ41のタップ係数Bk(z)を更新すると、やは
りデジタルフィルタ41が正常な値に収束しなくなって
しまう。
When the tap coefficient Bk (z) of the digital filter 41 is updated in such a double talk state, the digital filter 41 also does not converge to a normal value.

【0124】そこで、ステップS3では、k1・Xe
(k)>Ye(k)であるか否かを判断することによ
り、スピーカ122L, 122Rからステレオマイクロ
ホン121に飛び込む音量が、自分の地点で発生してス
テレオマイクロホン121に入力している音量よりも大
きいか否かを判断する。
Therefore, in step S3, k1.Xe
By determining whether or not (k)> Ye (k), the volume jumping into the stereo microphone 121 from the speakers 122L and 122R is higher than the volume generated at the user's point and being input to the stereo microphone 121. Judge whether it is large or not.

【0125】k1は、スピーカ122L, 122Rから
出力した音声がステレオマイクロホン121に飛び込む
までに減衰する量に対応する係数であり、ここでは−1
0dBから−3dBの間の値にしている(このk1の値
もシステム全体を考慮して決めればよい)。
K1 is a coefficient corresponding to the amount by which the sound output from the speakers 122L and 122R is attenuated by the time it jumps into the stereo microphone 121.
The value is set to a value between 0 dB and -3 dB (the value of k1 may be determined in consideration of the entire system).

【0126】ステップS3でノーであれば、ステップS
7に進む。これにより、前述の式(5) から、当該サンプ
リング周期ではタップ係数Bk(z)が更新されなくな
る。
If NO in step S3, step S3
Proceed to 7. As a result, the tap coefficient Bk (z) is not updated in the sampling period from the above equation (5).

【0127】他方、ステップS3でイエスであれば、続
いて、誤差信号e(k)の時間平均エネルギーEe
(k)が、所定の閾値Ethよりも大きいか否かを判断
する(ステップS4)。
On the other hand, if Yes in step S3, then the time average energy Ee of the error signal e (k)
It is determined whether (k) is larger than a predetermined threshold Eth (step S4).

【0128】Ee(k)の値が一定以下である場合に
は、デジタルフィルタ41が最適化(ロック)されてい
るとみなしてよい。ステップS4では、Ee(k)>E
thであるか否かを判断することにより、デジタルフィ
ルタ41がロックされているか否かを判断する。
When the value of Ee (k) is equal to or less than a certain value, it may be considered that the digital filter 41 is optimized (locked). In step S4, Ee (k)> E
By determining whether or not th, it is determined whether or not the digital filter 41 is locked.

【0129】ステップS4でノーであれば(デジタルフ
ィルタ41がロックされていれば)、当該サンプリング
周期でのb(k)の値をk3(但しk3は0.3から
0.7の間の値)に設定する(ステップS10)。そし
て処理を終了する。
If NO in step S4 (if the digital filter 41 is locked), the value of b (k) in the sampling cycle is set to k3 (where k3 is a value between 0.3 and 0.7). ) Is set (step S10). Then, the process ends.

【0130】デジタルフィルタ41がロックされている
ときには、一般的に、タップ係数の更新量を小さくした
ほうが誤差信号e(k)が小さくなる。
When the digital filter 41 is locked, the error signal e (k) generally becomes smaller as the update amount of the tap coefficient is made smaller.

【0131】そこで、ステップS10では、b(k)の
値を小さくしている。これにより、前述の式(5) から、
当該サンプリング周期ではタップ係数Bk(z)の更新
量が小さくなる。
Therefore, in step S10, the value of b (k) is reduced. Thus, from equation (5) above,
In the sampling cycle, the update amount of the tap coefficient Bk (z) becomes small.

【0132】ここではk3を0.3から0.7の間の値
にしているが、このk3の値もシステム全体を考慮して
決めればよい。
Although k3 is set to a value between 0.3 and 0.7 here, the value of k3 may be determined in consideration of the entire system.

【0133】他方、ステップS4でイエスであれば、内
部カウンタのカウント値CCが閾値CCth(但しCC
thは256から512の間の値)未満であることを条
件として、このカウント値CCを1だけインクリメント
する(ステップS5)。
On the other hand, if YES in step S4, the count value CC of the internal counter is the threshold value CCth (however, CC
This count value CC is incremented by 1 on condition that th is less than 256 to 512) (step S5).

【0134】続いて、内部カウンタのカウント値CCが
この閾値CCthに達したか否かを判断する(ステップ
S6)。
Subsequently, it is determined whether or not the count value CC of the internal counter has reached this threshold value CCth (step S6).

【0135】誤差信号e(k)の時間平均エネルギーE
e(k)が一定の値よりも大きい場合(デジタルフィル
タ41がロックされていない場合)、その原因として
は、エコー経路が変化した(例えばステレオマイクロホ
ン121の向きが変化した)ことと、瞬間的なノイズ音
(例えばドアの開閉音)が発生したこととの2通りが考
えられる。
Time average energy E of error signal e (k)
When e (k) is larger than a certain value (when the digital filter 41 is not locked), the cause is that the echo path has changed (for example, the orientation of the stereo microphone 121 has changed), and the momentary change. There are two types of noise noises (for example, door opening / closing noise).

【0136】しかし、このうちのいずれの原因によるも
のであるかは、一定以上の期間(サンプリング周期より
もかなり長い期間)に亘ってEe(k)の値を監視しな
ければ区別がつかない。
However, which of these causes is not distinguishable unless the value of Ee (k) is monitored over a certain period (a period considerably longer than the sampling period).

【0137】そこで、ステップS5, S6では、内部カ
ウンタを用いて、デジタルフィルタ41がロックされて
いない状態が一定以上の期間に亘って続いているか否か
を判断する。
Therefore, in steps S5 and S6, an internal counter is used to determine whether or not the digital filter 41 remains unlocked for a certain period or longer.

【0138】ステップS6でノーであれば、当該サンプ
リング周期でのb(k)の値を0に設定する(ステップ
S9)。そして処理を終了する。
If NO in step S6, the value of b (k) in the sampling cycle is set to 0 (step S9). Then, the process ends.

【0139】これにより、デジタルフィルタ41がロッ
クされていない状態が一定以上の期間に亘って続くまで
は、前述の式(5) から、タップ係数Bk(z)の更新が
停止される。
As a result, the updating of the tap coefficient Bk (z) is stopped from the above equation (5) until the digital filter 41 remains unlocked for a certain period or longer.

【0140】他方、ステップS6でイエスであれば、当
該サンプリング周期でのb(k)の値をk2・b(k−
1)+(1−k2)(但しk2は0.1から0.001
の間の値)に設定する(ステップS8)。そして処理を
終了する。
On the other hand, if the result of step S6 is YES, the value of b (k) in the sampling cycle is k2 · b (k-
1) + (1-k2) (where k2 is 0.1 to 0.001)
(Value between) (step S8). Then, the process ends.

【0141】すなわち、デジタルフィルタ41がロック
されていない状態が一定以上の期間に亘って続くと、エ
コー経路が変化したと判断し、デジタルフィルタ41が
ロックされるまで、k2を時定数として各サンプリング
周期でのb(k)の値を指数関数的に1に近づける。
That is, if the digital filter 41 remains unlocked for a certain period or longer, it is determined that the echo path has changed, and each sampling is performed with k2 as a time constant until the digital filter 41 is locked. The value of b (k) in the cycle is exponentially approximated to 1.

【0142】これにより、前述の式(5) から、デジタル
フィルタ41がロックされるまで、各サンプリング周期
でのタップ係数Bk(z)の更新量が徐々に大きくな
る。
As a result, from the above equation (5), the update amount of the tap coefficient Bk (z) in each sampling cycle gradually increases until the digital filter 41 is locked.

【0143】このようにして、エコー経路が変化した場
合には、最初は緩やかにタップ係数Bk(z)が更新さ
れるが、それでもデジタルフィルタ41がロックされな
い場合には、速やかにデジタルフィルタ41をロックさ
せるために、タップ係数Bk(z)の更新量が大きくさ
れる。
In this way, when the echo path changes, the tap coefficient Bk (z) is gently updated at first, but if the digital filter 41 is still not locked, the digital filter 41 is promptly changed. In order to lock, the update amount of the tap coefficient Bk (z) is increased.

【0144】ここではCCth, k2をそれぞれ256
から512の間の値, 0.1から0.001の間の値に
しているが、これらの値もシステム全体を考慮して決め
ればよい。
Here, CCth and k2 are 256 respectively.
The values are between 512 and 512 and between 0.1 and 0.001, but these values may be determined in consideration of the entire system.

【0145】エコーキャンセルブロック12では、デジ
タルフィルタ41のタップ数は、サンプリング周波数4
8kHzのモノラル音声信号に対する最大エコーパス長
を約数十ミリ秒にする数になっている。
In the echo cancel block 12, the tap number of the digital filter 41 is set to the sampling frequency 4
The maximum echo path length for a monaural audio signal of 8 kHz is set to about several tens of milliseconds.

【0146】エコーキャンセルブロック13では、デジ
タルフィルタ41のタップ数は、サンプリング周波数6
kHzのモノラル音声信号に対する最大エコーパス長を
約300ミリ秒にする数になっている。
In the echo cancel block 13, the tap number of the digital filter 41 is set to the sampling frequency 6
The maximum echo path length for a monaural audio signal of kHz is set to about 300 milliseconds.

【0147】エコーキャンセルブロック14では、デジ
タルフィルタ41のタップ数は、サンプリング周波数4
8kHzのモノラル音声信号に対する最大エコーパス長
を約数十ミリ秒にする数になっている。
In the echo cancel block 14, the tap number of the digital filter 41 is set to the sampling frequency 4
The maximum echo path length for a monaural audio signal of 8 kHz is set to about several tens of milliseconds.

【0148】エコーキャンセルブロック15では、デジ
タルフィルタ41のタップ数は、サンプリング周波数6
kHzのモノラル音声信号に対する最大エコーパス長を
約50ミリ秒にする数になっている。
In the echo cancel block 15, the tap number of the digital filter 41 is set to the sampling frequency 6
The maximum echo path length for a monaural audio signal of kHz is about 50 milliseconds.

【0149】エコーキャンセルブロック12〜15は、
実際のハードウェアとしては、適応フィルタとして動作
させるためのソフトウェアをインストールしたDSP
と、RAMとを用いて構成されている。
The echo cancel blocks 12 to 15 are
As the actual hardware, a DSP installed with software for operating as an adaptive filter
And RAM.

【0150】図6に示すように、エコーキャンセルブロ
ック12の出力信号(加減算器42から出力した高周波
帯域のミッド成分についてのサンプリング周波数48k
Hzの誤差信号e(k))は、エキスパンダ/ゲート回
路16に送られる。
As shown in FIG. 6, the output signal of the echo cancel block 12 (sampling frequency 48 k for the mid component of the high frequency band output from the adder / subtractor 42)
The Hz error signal e (k)) is sent to the expander / gate circuit 16.

【0151】エコーキャンセルブロック13の出力信号
(加減算器42から出力した低周波帯域のミッド成分に
ついてのサンプリング周波数6kHzの誤差信号e
(k))は、エキスパンダ/ゲート回路17に送られ
る。
Output signal of the echo cancel block 13 (error signal e having a sampling frequency of 6 kHz for the low frequency band mid component output from the adder / subtractor 42)
(K)) is sent to the expander / gate circuit 17.

【0152】エコーキャンセルブロック14の出力信号
(加減算器42から出力した高周波帯域のサイド成分に
ついてのサンプリング周波数48kHzの誤差信号e
(k))は、エキスパンダ/ゲート回路18に送られ
る。
Output signal of the echo cancel block 14 (error signal e having a sampling frequency of 48 kHz for the side component of the high frequency band output from the adder / subtractor 42)
(K)) is sent to the expander / gate circuit 18.

【0153】エコーキャンセルブロック15の出力信号
(加減算器42から出力した低周波帯域のサイド成分に
ついてのサンプリング周波数6kHzの誤差信号e
(k))は、エキスパンダ/ゲート回路19に送られ
る。
Output signal of the echo cancel block 15 (error signal e having a sampling frequency of 6 kHz for the side component of the low frequency band output from the adder / subtractor 42)
(K)) is sent to the expander / gate circuit 19.

【0154】エキスパンダ/ゲート回路16〜19は、
業務用の音響機器等において残留ノイズを減少させてダ
イナミックレンジを上げるために用いられている回路で
あり、図10に示すように、閾値th以下の入力信号を
減衰させて出力する非直線な入出力特性を有している。
同図において、Dはゲインリダクション量である。
The expander / gate circuits 16 to 19 are
This is a circuit used to reduce residual noise and increase the dynamic range in professional audio equipment, and as shown in FIG. 10, it is a nonlinear input that attenuates and outputs an input signal equal to or less than a threshold th. It has output characteristics.
In the figure, D is the amount of gain reduction.

【0155】エキスパンダ/ゲート回路16〜19は、
瞬時にゲインを変更するのではなく、次の式(6) のよう
に、時定数を持たせて徐々にゲインを変更する(G
(t)はゲイン、Aは設定値、kは時定数である)。す
なわち、前出の図9のステップS8での係数b(k)と
同じく、設定値に対して指数関数的にゲインを変更す
る。G(t)=A×k+G(t−1)×(1−k) …
(6)
The expander / gate circuits 16 to 19 are
Instead of changing the gain instantaneously, the gain is gradually changed with a time constant as shown in the following equation (6) (G
(T) is a gain, A is a set value, and k is a time constant). That is, the gain is exponentially changed with respect to the set value, like the coefficient b (k) in step S8 of FIG. 9 described above. G (t) = A * k + G (t-1) * (1-k) ...
(6)

【0156】ここでは、ゲインを下げる場合(エキスパ
ンダ/ゲート回路をオンにする場合)の設定値は約10
0ミリ秒、ゲインを上げる場合(信号レベルが閾値th
を超えたのでリニアな入出力特性に戻す場合)の設定値
は約5ミリ秒にしており、ゲインリダクション量は6d
Bから12dBの間の値にしているが、これらもシステ
ム全体を考慮して決めればよい。
Here, the set value when the gain is lowered (when the expander / gate circuit is turned on) is about 10
When gain is increased for 0 ms (signal level is threshold th
(When it returns to the linear input / output characteristic because it exceeds the limit), the setting value is about 5 milliseconds, and the gain reduction amount is 6d.
Although it is set to a value between B and 12 dB, these may be determined in consideration of the entire system.

【0157】なお、帯域分割フィルタ4で帯域分割され
た高周波帯域のミッド成分の音声信号xMHと、帯域分
割フィルタ5で帯域分割された高周波帯域のサイド成分
の音声信号xSHとは、エキスパンダ/ゲート回路1
6, 18にもそれぞれ制御信号として与えられる。
The high-frequency band mid-component audio signal xMH band-divided by the band-division filter 4 and the high-frequency side component audio signal xSH band-divided by the band-division filter 5 are expanded / gated. Circuit 1
The signals 6 and 18 are also given as control signals.

【0158】また、デシメータ8でサンプリング周波数
を6kHzに下げられた低周波帯域のミッド成分の音声
信号xMLと、デシメータ9でサンプリング周波数を6
kHzに下げられた低周波帯域のサイド成分の音声信号
xSLとは、エキスパンダ/ゲート回路17, 19にも
それぞれ制御信号として与えられる。
The decimator 8 lowers the sampling frequency to 6 kHz, and the low frequency band mid-component audio signal xML, and the decimator 9 changes the sampling frequency to 6 kHz.
The audio signal xSL of the side component of the low frequency band lowered to kHz is also given as a control signal to the expander / gate circuits 17 and 19, respectively.

【0159】エキスパンダ/ゲート回路16〜19で
は、これらの制御信号に基づき、例えば、相手方の地点
から自分の地点に音声信号が送られている場合(エコー
が発生しない場合)には入力信号をそのまま出力し、他
方相手方の地点から自分の地点に音声信号が送られてい
る場合(エコーが発生する場合)には入力信号を図9の
入出力特性で減衰させて出力するという切り替え動作を
行う。
In the expander / gate circuits 16 to 19, based on these control signals, for example, when an audio signal is being sent from the other party's point to his / her own point (when no echo occurs), the input signal is input. When the voice signal is output as it is from the other party's point to the other party's point (when an echo is generated), the input signal is attenuated by the input / output characteristic of FIG. 9 and then output. .

【0160】図6に示すように、エキスパンダ/ゲート
回路16の出力信号(高周波帯域のミッド成分について
のサンプリング周波数48kHzの誤差信号)は、加算
器22に送られる。
As shown in FIG. 6, the output signal of the expander / gate circuit 16 (error signal having a sampling frequency of 48 kHz for the mid component of the high frequency band) is sent to the adder 22.

【0161】エキスパンダ/ゲート回路17の出力信号
(低周波帯域のミッド成分についてのサンプリング周波
数6kHzの誤差信号)は、インターポレータ20に送
られる。
The output signal of the expander / gate circuit 17 (error signal having a sampling frequency of 6 kHz for the low frequency band mid component) is sent to the interpolator 20.

【0162】エキスパンダ/ゲート回路18の出力信号
(高周波帯域のサイド成分についてのサンプリング周波
数48kHzの誤差信号)は、加算器23に送られる。
The output signal of the expander / gate circuit 18 (error signal having a sampling frequency of 48 kHz for the side component in the high frequency band) is sent to the adder 23.

【0163】エキスパンダ/ゲート回路19の出力信号
(低周波帯域のサイド成分についてのサンプリング周波
数6kHzの誤差信号)は、インターポレータ21に送
られる。
The output signal of the expander / gate circuit 19 (error signal having a sampling frequency of 6 kHz for the side component in the low frequency band) is sent to the interpolator 21.

【0164】インターポレータ20, 21は、それぞれ
デジタル信号のサンプリング周波数を8倍のレートで上
げる回路である。
The interpolators 20 and 21 are circuits for increasing the sampling frequency of the digital signal at a rate of 8 times.

【0165】インターポレータ20でサンプリング周波
数を6kHzの8倍の48kHzに上げられた低周波帯
域のミッド成分についての誤差信号は、加算器22に送
られて、高周波帯域のミッド成分についての誤差信号と
加算される。
The error signal for the low frequency band mid component whose sampling frequency is raised to 48 kHz, which is 8 times the 6 kHz frequency, by the interpolator 20 is sent to the adder 22 and the error signal for the high frequency band mid component is sent. Is added.

【0166】インターポレータ21でサンプリング周波
数を48kHzに上げられた低周波帯域のサイド成分に
ついての誤差信号は、加算器23に送られて、高周波帯
域のサイド成分についての誤差信号と加算される。
The error signal for the side component in the low frequency band whose sampling frequency has been raised to 48 kHz by the interpolator 21 is sent to the adder 23 and added to the error signal for the side component in the high frequency band.

【0167】加算器22の出力信号(ミッド成分につい
ての誤差信号)と、加算器23の出力信号(サイド成分
についての誤差信号)とは、LSコンバータ24に送ら
れる。
The output signal of the adder 22 (error signal for the mid component) and the output signal of the adder 23 (error signal for the side component) are sent to the LS converter 24.

【0168】LSコンバータ24は、次の式(7) , (8)
の演算を行うことにより、M−Sステレオ方式のミッド
成分, サイド成分の音声信号M, S(ここでは誤差信
号)を、左右2チャンネルステレオ方式の左チャンネ
ル, 右チャンネルの音声信号L,Rに変換する回路であ
る。 L=M+αS (但し0<α<1) …(7) R=M−αS …(8)
The LS converter 24 uses the following equations (7), (8)
By performing the calculation of, the audio signals M and S (here, error signals) of the mid and side components of the MS stereo system are converted into the left and right audio signals L and R of the left and right two-channel stereo system. It is a circuit to convert. L = M + αS (where 0 <α <1) (7) R = M-αS (8)

【0169】LSコンバータ24で変換された左チャン
ネル, 右チャンネルについての誤差信号eL, eRは、
エコーキャンセラ1から出力して音声コーデック106
(図5)に送られる。
The error signals eL and eR for the left and right channels converted by the LS converter 24 are
The audio codec 106 is output from the echo canceller 1.
(Fig. 5).

【0170】次に、このエコーキャンセラ1でエコーが
キャンセルされる様子について説明する。
Next, how the echo canceller 1 cancels the echo will be described.

【0171】相手方の地点から自分の地点に送られ、音
声コーデック106からエコーキャンセラ1に入力する
サンプリング周波数48kHzの左右2チャンネルの音
声信号xL, xRが、MSコンバータ2でM−Sステレ
オ方式のミッド成分, サイド成分の音声信号xM, xS
に変換される。
[0171] The left and right two-channel audio signals xL and xR with a sampling frequency of 48 kHz, which are sent from the other party's point to their own point and are input from the audio codec 106 to the echo canceller 1, are transmitted by the MS converter 2 to the MS stereo system mid signal. Component, side component audio signal xM, xS
Is converted to.

【0172】このうち、ミッド成分の音声信号xMは、
帯域分割フィルタ4で3kHz未満の低周波帯域の音声
信号xMLと3kHz以上の高周波帯域の音声信号xM
Hとに帯域分割される。そして、この低周波帯域のミッ
ド成分の音声信号xMLが、デシメータ8でサンプリン
グ周波数を6kHzに下げられた後、エコーキャンセル
ブロック13にリファレンス信号x(k)として入力す
る。
Of these, the mid component audio signal xM is
Audio signal xML in the low frequency band of less than 3 kHz and audio signal xM in the high frequency band of 3 kHz or more by the band division filter 4.
The band is divided into H and H. The low frequency band mid-component audio signal xML is input to the echo cancellation block 13 as the reference signal x (k) after the sampling frequency is lowered to 6 kHz by the decimator 8.

【0173】また、自分の地点のステレオマイクロホン
121から入力するサンプリング周波数48kHzの左
右2チャンネルの音声信号yL, yRが、MSコンバー
タ3でM−Sステレオ方式のミッド成分, サイド成分の
音声信号yM, ySに変換される。
Also, the left and right two-channel audio signals yL and yR having a sampling frequency of 48 kHz input from the stereo microphone 121 at the user's point are converted by the MS converter 3 into the mid-side audio signal yM of the MS stereo system and the side-audio signals yM and yR. converted to yS.

【0174】このうち、ミッド成分の音声信号yMは、
帯域分割フィルタ6で3kHz未満の低周波帯域の音声
信号yMLと3kHz以上の高周波帯域の音声信号yM
Hとに帯域分割される。そして、この低周波帯域のミッ
ド成分の音声信号yMLが、デシメータ10でサンプリ
ング周波数を6kHzに下げられた後、エコーキャンセ
ルブロック13に目標信号y(k)として入力する。
Of these, the mid-component audio signal yM is
Audio signal yML in the low frequency band of less than 3 kHz and audio signal yM in the high frequency band of 3 kHz or more by the band division filter 6.
The band is divided into H and H. Then, the audio signal yML of the mid component in the low frequency band is input to the echo cancel block 13 as the target signal y (k) after the sampling frequency is lowered to 6 kHz by the decimator 10.

【0175】エコーキャンセルブロック13では、この
リファレンス信号x(k)からこの目標信号y(k)の
レプリカy’(k)が作成され、目標信号y(k)から
このレプリカy’(k)を差し引くことにより、低周波
帯域のミッド成分の音声信号について、約300ミリ秒
の最大エコーパス長でエコーがキャンセルされる。
In the echo cancel block 13, a replica y '(k) of this target signal y (k) is created from this reference signal x (k), and this replica y' (k) is created from the target signal y (k). By subtracting, the echo is canceled at the maximum echo path length of about 300 milliseconds for the low frequency band mid-component audio signal.

【0176】ここで、音声やエコーには次のような2つ
の特徴がある。まず、第1の特徴として、音声は、周波
帯域が高くなるにつれて、伝播における減衰係数が大き
くなるとともに、部屋の壁等での反射の際の吸収係数も
大きくなる。そのため、スピーカ122L, 122Rか
ら出力した後ある程度の時間(例えば100ミリ秒)以
上遅れてステレオマイクロホン121に飛び込む音声
は、低周波帯域成分が大部分である。
Here, voice and echo have the following two characteristics. First, as a first feature, as the frequency band of a sound increases, the attenuation coefficient in propagation increases and the absorption coefficient in reflection on a wall of a room also increases. Therefore, most of the low-frequency band component of the sound that is output from the speakers 122L and 122R and that is delayed by a certain time (for example, 100 milliseconds) or more and then jumps into the stereo microphone 121.

【0177】この第1の特徴からは、例えば300ミリ
秒というような長い最大エコーパス長は、全ての周波数
帯域の音声について確保する必要はなく、少なくとも低
周波帯域の音声について確保すればよいことになる。
From the first feature, it is not necessary to secure a long maximum echo path length of, for example, 300 milliseconds for voices in all frequency bands, but at least for voices in a low frequency band. Become.

【0178】また、第2の特徴として、スピーカ122
L, 122Rから出力してステレオマイクロホン121
に飛び込む音声は、スピーカ122L, 122Rとステ
レオマイクロホン121との間のエコー経路の距離が長
くなるにつれて、左チャンネルの音声と右チャンネルの
音声との差が少なくなる。そのため、スピーカ122
L, 122Rから出力した後部屋の壁等で反射してステ
レオマイクロホン121に飛び込む音声は、ステレオ音
声よりもむしろモノラル音声に近くなる。マイクロホン
のステレオ方式でいえば、このようなモノラル音声に近
い音声は、図11に示すように、M−S(ミッド−サイ
ド)方式におけるマイク正面方向の成分であるミッド成
分の音声に相当する。
As a second feature, the speaker 122
L, 122R output from stereo microphone 121
The difference between the left-channel sound and the right-channel sound in the sound that jumps in becomes smaller as the distance of the echo path between the speakers 122L and 122R and the stereo microphone 121 becomes longer. Therefore, the speaker 122
The sound output from L and 122R and reflected by the wall of the room and jumping into the stereo microphone 121 is closer to monaural sound rather than stereo sound. In the case of the stereo system of the microphone, such a sound close to a monaural sound corresponds to a mid-component sound which is a front component of the microphone in the MS (mid-side) system, as shown in FIG.

【0179】この第2の特徴からは、ステレオ音声信号
を送受信する双方向コミュニケーションシステムでも、
エコーキャンセラでの処理は、左右2チャンネル方式に
おける各チャンネルの音声信号について行う必要はな
く、M−S方式におけるミッド成分の音声信号を中心に
行えばよいことになる。
From the second feature, even in a two-way communication system for transmitting and receiving a stereo audio signal,
The processing in the echo canceller does not need to be performed for the audio signals of the respective channels in the left and right two-channel system, but may be performed mainly for the audio signal of the mid component in the MS system.

【0180】エコーキャンセラ1では、音声やエコーの
こうした特徴に着目して、低周波帯域のミッド成分の音
声信号については、エコーキャンセルブロック13によ
って約300ミリ秒の最大エコーパス長でエコーがキャ
ンセルされるようにしている。
In the echo canceller 1, paying attention to these characteristics of voice and echo, the echo cancel block 13 cancels the echo of the voice signal of the mid component in the low frequency band with the maximum echo path length of about 300 milliseconds. I am trying.

【0181】その際、前述のようにコントローラ43が
リファレンス信号x(k), 目標信号y(k), 誤差信
号e(k)のそれぞれの時間平均エネルギーXe
(k), Ye(k), Ee(k)の大きさに応じてタッ
プ係数Bk(z)の更新を制御することにより、エコー
経路の変化や瞬間的なノイズ音の発生にも適確に対応し
てエコーをキャンセルすることができるようになってい
る。
At this time, as described above, the controller 43 causes the time average energy Xe of each of the reference signal x (k), the target signal y (k), and the error signal e (k).
By controlling the update of the tap coefficient Bk (z) according to the magnitudes of (k), Ye (k), and Ee (k), it is possible to accurately change the echo path and generate a momentary noise sound. Correspondingly, the echo can be canceled.

【0182】また、前述のように低周波帯域のサイド成
分の音声信号xSLをリファレンス信号x(k)とする
レプリカy’(k)の作成をも1/10程度の割合で行
うことにより、ミッド成分のエコーだけをキャンセルし
た際に残ってしまうサイド成分のエコーも或る程度キャ
ンセルされるようになっている。
Further, as described above, the replica y '(k) having the audio signal xSL of the side component of the low frequency band as the reference signal x (k) is also created at a ratio of about 1/10, so that the mid The side component echo, which remains when only the component echo is canceled, is also canceled to some extent.

【0183】また、前述のようにエコーキャンセルブロ
ック13から出力した閾値th以下の誤差信号がエキス
パンダ/ゲート回路17で減衰されるので、適応フィル
タではキャンセルしきれない微小レベルの誤差信号が減
衰することにより、一層よくエコーをキャンセルできる
ようになっている。
Further, as described above, the error signal output from the echo cancellation block 13 that is equal to or less than the threshold value th is attenuated by the expander / gate circuit 17, so that the minute level error signal that cannot be canceled by the adaptive filter is attenuated. This makes it possible to cancel the echo better.

【0184】さらに、低周波帯域のミッド成分の音声信
号以外の、高周波帯域のミッド成分の音声信号, 低周波
帯域のサイド成分の音声信号, 高周波帯域のサイド成分
の音声信号についても、いわば補助的に設けたエコーキ
ャンセルブロック12, 14, 15によってそれぞれ約
数十ミリ秒, 数十ミリ秒, 50ミリ秒の最大エコーパス
長でエコーがキャンセルされた後、それぞれエキスパン
ダ/ゲート回路16,18, 19によって微小レベルの
誤差信号が減衰するので、その点からも一層よくエコー
をキャンセルできるようになっている。
Further, in addition to the low-frequency mid-component audio signal, the high-frequency mid-component audio signal, the low-frequency side component audio signal, and the high-frequency side component audio signal are, so to speak, auxiliary. The echo canceling blocks 12, 14 and 15 provided in the above cancel the echoes with the maximum echo path lengths of about tens of milliseconds, tens of milliseconds and 50 milliseconds, respectively, and then expander / gate circuits 16, 18, 19 respectively. Since the minute level error signal is attenuated by this, the echo can be canceled more effectively from that point as well.

【0185】そして、エキスパンダ/ゲート回路17か
ら出力した低周波帯域のミッド成分についての誤差信号
が、インターポレータ20でサンプリング周波数を48
kHzに上げられ、加算器22に送られて、高周波帯域
のミッド成分についての誤差信号と加算され、LSコン
バータ24でサイド成分についての誤差信号とともに左
チャンネル, 右チャンネルについての誤差信号に変換さ
れて、エコーキャンセラ1から出力する。
The error signal for the mid component of the low frequency band output from the expander / gate circuit 17 has a sampling frequency of 48 at the interpolator 20.
The frequency is raised to kHz, sent to the adder 22, added with the error signal for the mid component of the high frequency band, and converted to the error signal for the left channel and the right channel together with the error signal for the side component by the LS converter 24. , Output from the echo canceller 1.

【0186】このようにして、このエコーキャンセラ1
では、サンプリング周波数48kHzのステレオ音声信
号を送受信する双方向コミュニケーションシステム(マ
イクロホンとしては左右2チャンネル方式のステレオマ
イクロホン121を設けた双方向コミュニケーションシ
ステム)において、低周波帯域のミッド成分の音声信号
を中心として、約300ミリ秒の最大エコーパス長でエ
コーがキャンセルされる。
In this way, this echo canceller 1
Then, in a two-way communication system that transmits and receives a stereo sound signal with a sampling frequency of 48 kHz (a two-way stereo microphone 121 is provided as a microphone, a two-way communication system), a low frequency band mid-component sound signal is mainly used. , The echo is canceled at the maximum echo path length of about 300 milliseconds.

【0187】次に、このエコーキャンセラ1のハードウ
ェアの規模やコストを、サンプリング周波数48kHz
のステレオ音声信号を送受信する双方向コミュニケーシ
ョンシステムにおいて前出の図2のようなエコーキャン
セラ105を用いる場合と比較して説明する。
Next, the scale and cost of the hardware of the echo canceller 1 are set to the sampling frequency of 48 kHz.
The description will be made in comparison with the case where the echo canceller 105 as shown in FIG.

【0188】[発明が解決しようとする課題]欄で第1
の理由として述べたように、一定の最大エコーパス長を
確保するために必要な適応フィルタの処理能力は、サン
プリング周波数が低くなると、その2乗に比例した低さ
で済む。
The first item in the [Problems to be solved by the invention] column
As described above, the processing capacity of the adaptive filter required to secure a constant maximum echo path length is low in proportion to its square when the sampling frequency is low.

【0189】エコーキャンセルブロック13とエコーキ
ャンセラ105とを比較すると、最大エコーパス長はと
もに約300ミリ秒であるが、エコーキャンセルブロッ
ク13ではサンプリング周波数が6kHzであるのに対
しエコーキャンセラ105ではサンプリング周波数が1
6kHzなので、エコーキャンセルブロック13のほう
がサンプリング周波数が6/16の低さになっている。
Comparing the echo cancel block 13 and the echo canceller 105, the maximum echo path lengths are both about 300 milliseconds, but the echo cancel block 13 has a sampling frequency of 6 kHz, while the echo canceller 105 has a sampling frequency of about 6 ms. 1
Since it is 6 kHz, the sampling frequency of the echo cancellation block 13 is lower by 6/16.

【0190】また、エコーキャンセルブロック13は低
周波帯域のミッド成分の音声信号だけを処理するので、
[発明が解決しようとする課題]欄で第2の理由として
述べたようにエコーキャンセルブロック13の処理能力
を4倍に高める必要はない。
Further, since the echo cancellation block 13 processes only the audio signal of the low frequency band mid component,
As described as the second reason in the [Problems to be solved by the invention] column, it is not necessary to increase the processing capacity of the echo cancellation block 13 four times.

【0191】したがって、エコーキャンセルブロック1
3は、エコーキャンセラ105と比較して36/256
という低い処理能力で済むので、少数のDSP及びRA
Mを用いて小型且つ低コストに構成される。
Therefore, the echo cancel block 1
3 is 36/256 compared with the echo canceller 105
Since it requires only a low processing capacity, a small number of DSP and RA
It is made compact and low cost by using M.

【0192】また、エコーキャンセルブロック15は、
最大エコーパス長がエコーキャンセルブロック13の1
/6の約50ミリ秒なので、エコーキャンセルブロック
13よりもさらに処理能力が低くて済み、したがってエ
コーキャンセルブロック13よりもさらに小型且つ低コ
ストに構成される。
Also, the echo cancel block 15 is
The maximum echo path length is 1 in echo cancel block 13.
Since it is about 50 milliseconds of / 6, the processing capacity is further lower than that of the echo cancellation block 13, and therefore the size and cost of the echo cancellation block 13 are further reduced.

【0193】また、エコーキャンセルブロック12, 1
4は、サンプリング周波数は48kHzなのでエコーキ
ャンセラ105の3倍の高さになっている。したがっ
て、仮にエコーキャンセラ105と同じ長さの最大エコ
ーパス長を確保する場合には、エコーキャンセルブロッ
ク12, 14の処理能力はエコーキャンセラ105より
も9倍高くなければならない。
Also, the echo cancel block 12, 1
The sample No. 4 has a sampling frequency of 48 kHz and is three times as high as the echo canceller 105. Therefore, if the maximum echo path length that is the same as that of the echo canceller 105 is secured, the processing capacity of the echo cancel blocks 12 and 14 must be 9 times higher than that of the echo canceller 105.

【0194】しかし、エコーキャンセルブロック12,
14の最大エコーパス長は、それぞれ数十ミリ秒という
ようにエコーキャンセラ105の1/10〜数分の1程
度である。したがって、エコーキャンセルブロック1
2, 14も、エコーキャンセラ105と同等またはそれ
よりも低い処理能力で済むので、やはり少数のDSP及
びRAMを用いて小型且つ低コストに構成される。
However, the echo cancel block 12,
The maximum echo path lengths of 14 are several tens of milliseconds, which is about 1/10 to a fraction of the echo canceller 105. Therefore, the echo cancellation block 1
Since 2 and 14 also require processing power equal to or lower than that of the echo canceller 105, they are also small in size and low in cost using a small number of DSPs and RAMs.

【0195】これに対し、サンプリング周波数48kH
zのステレオ音声信号を送受信する双方向コミュニケー
ションシステムにおいてエコーキャンセラ105を用い
る場合には、[発明が解決しようとする課題]欄で第2
の理由として述べたように、エコーキャンセラ105の
処理能力を36倍以上に高める(同じ仕様のDSPやR
AMを用いる場合にはDSPやRAMの個数を36倍以
上にする)ことが必要になるので、非常な大型化及び高
コスト化を招いてしまう。
On the other hand, the sampling frequency is 48 kHz.
When the echo canceller 105 is used in a two-way communication system for transmitting and receiving a stereo audio signal of z, the second problem is set in the [Problems to be solved by the invention] column.
As mentioned above, the processing capacity of the echo canceller 105 is increased to 36 times or more (a DSP or R having the same specifications).
When AM is used, the number of DSPs and RAMs needs to be 36 times or more), resulting in extremely large size and high cost.

【0196】したがって、このエコーキャンセラ1は、
エコーキャンセルブロック12〜15以外の部分を含め
ても、サンプリング周波数48kHzのステレオ音声信
号を送受信する双方向コミュニケーションシステムにお
いてエコーキャンセラ105を用いる場合と比較して、
はるかに小型且つ低コストに構成される。
Therefore, this echo canceller 1
Compared with the case where the echo canceller 105 is used in a two-way communication system that transmits and receives a stereo audio signal having a sampling frequency of 48 kHz, even if the portions other than the echo cancellation blocks 12 to 15 are included,
Much smaller and less expensive to construct.

【0197】以上のように、このエコーキャンセラ1に
よれば、サンプリング周波数48kHzのステレオ音声
信号を送受信する双方向コミュニケーションシステムに
おいて、約300ミリ秒という長い最大エコーパス長を
確保しつつ、小型且つ低コストにエコーをキャンセルす
ることができるようになっている。
As described above, according to the echo canceller 1, in a two-way communication system for transmitting and receiving a stereo audio signal having a sampling frequency of 48 kHz, a long maximum echo path length of about 300 milliseconds is ensured, and the size and cost are low. You can cancel the echo.

【0198】したがって、例えばこの双方向コミュニケ
ーションシステムをテレビ会議システムとして構築した
場合(テレビ会議システムにおいて、音質を向上させる
ために音声信号のサンプリング周波数を高めるとともに
臨場感を得るためにステレオ音声信号を送受信するよう
にした場合)に、長い最大エコーパス長を確保しつつ、
小型且つ低コストにエコーをキャンセルすることができ
る。
Therefore, for example, when the two-way communication system is constructed as a video conference system (in the video conference system, the sampling frequency of the audio signal is increased to improve the sound quality, and the stereo audio signal is transmitted / received in order to obtain a sense of presence. In this case, while ensuring a long maximum echo path length,
The echo can be canceled in a small size and at low cost.

【0199】あるいはまた、この双方向コミュニケーシ
ョンシステムを[発明が解決しようとする課題]欄で述
べたようなエンターテイメント系の新しい形態の双方向
コミュニケーションシステムとして構築した場合にも、
長い最大エコーパス長を確保しつつ、小型且つ低コスト
にエコーをキャンセルすることができる。
Alternatively, when this interactive communication system is constructed as a new interactive communication system of entertainment type as described in the section [Problems to be solved by the invention],
It is possible to cancel the echo at a small size and at low cost while ensuring a long maximum echo path length.

【0200】なお、以上の例ではエコーキャンセラ1内
にMSコンバータ2, 3を設けているが、M−S方式の
ステレオマイクロホンを設けた双方向コミュニケーショ
ンシステムにエコーキャンセラ1を用いる場合には、M
Sコンバータ2, 3を省略してよい。
In the above example, the MS converters 2 and 3 are provided in the echo canceller 1. However, when the echo canceller 1 is used in a two-way communication system provided with an MS stereo microphone, M
The S converters 2 and 3 may be omitted.

【0201】また、以上の例では音声信号を3kHz未
満の低周波帯域と3kHz以上の高周波帯域とに分割し
ているが、3kHz以外の周波数を境界として低周波帯
域と高周波帯域とに分割してもよい。
In the above example, the audio signal is divided into a low frequency band of less than 3 kHz and a high frequency band of 3 kHz or more. However, it is divided into a low frequency band and a high frequency band with a frequency other than 3 kHz as a boundary. Good.

【0202】あるいはまた、音声信号を3以上の帯域
(例えば、12kHz以上の帯域, 6kHz以上12k
Hz未満の帯域, 3kHz以上6kHz未満の帯域, 3
kHz未満の帯域の合計4つの帯域)に分割し、周波数
の低い帯域ほどサンプリング周波数を大きく下げるとと
もに最大エコーパス長を長くしてエコーをキャンセルす
るようにしてもい。
Alternatively, the audio signal may be transmitted in three or more bands (for example, a band of 12 kHz or more, a band of 6 kHz or more and 12 k).
Band below 3 Hz, band above 3 kHz and below 6 kHz, 3
The frequency band may be divided into four bands of less than kHz), and the lower the frequency band, the larger the sampling frequency and the longer the maximum echo path length to cancel the echo.

【0203】そのようにすることにより、一層きめ細か
にエコーをキャンセルすることができるようになる。
By doing so, it becomes possible to cancel the echo more finely.

【0204】また、以上の例では双方向コミュニケーシ
ョンシステムに本発明を適用しているが、例えばコンサ
ート会場等においてハウリングをキャンセルするために
も本発明を適用してよい。
Further, although the present invention is applied to the two-way communication system in the above example, the present invention may be applied to cancel howling at a concert hall or the like.

【0205】また、本発明は、以上の例に限らず、本発
明の要旨を逸脱することなく、その他様々の構成をとり
うることはもちろんである。
Further, the present invention is not limited to the above examples, and it goes without saying that various other configurations can be adopted without departing from the gist of the present invention.

【0206】[0206]

【発明の効果】以上のように、本発明によれば、サンプ
リング周波数の高いステレオ音声信号を送受信する双方
向コミュニケーションシステムにおいて、一定以上の長
い最大エコーパス長を確保しつつ、小型且つ低コストに
エコーをキャンセルすることができるという効果が得ら
れる。
As described above, according to the present invention, in a two-way communication system for transmitting and receiving a stereo audio signal having a high sampling frequency, a small maximum size and low cost echo can be ensured while ensuring a certain maximum long echo path length. The effect of being able to cancel is obtained.

【0207】また、低周波帯域のサイド成分の音声信号
や高周波帯域のミッド成分の音声信号についても補助的
な適応フィルタでエコーをキャンセルすることにより、
一層よくエコーをキャンセルすることができるととも
に、やはり小型且つ低コストにエコーをキャンセルする
ことができるという効果が得られる。
Further, by canceling the echoes of the side component audio signal of the low frequency band and the audio signal of the mid component of the high frequency band by the auxiliary adaptive filter,
There is an effect that the echo can be canceled better and the echo can be canceled more compactly and at low cost.

【0208】また、左右2チャンネル方式のステレオ音
声信号をM−S方式のステレオ音声信号に変換すること
により、通常の方式(左右2チャンネル方式)のステレ
オマイクロホンを設けた双方向コミュニケーションシス
テムでも、小型且つ低コストにエコーをキャンセルする
ことができるという効果が得られる。
Also, by converting the stereo audio signal of the left and right two-channel system into the stereo audio signal of the M-S system, the two-way communication system provided with the stereo microphone of the normal system (two-channel system of the left and right) is small. Moreover, the effect that the echo can be canceled at low cost can be obtained.

【0209】また、リファレンス信号, 目標信号, 誤差
信号のそれぞれの時間平均エネルギーの大きさに応じて
タップ係数の更新を制御することにより、エコー経路の
変化や瞬間的なノイズ音の発生にも適確に対応してエコ
ーをキャンセルすることができるという効果が得られ
る。
Further, by controlling the updating of the tap coefficient according to the magnitude of the time average energy of each of the reference signal, the target signal and the error signal, it is also suitable for the change of the echo path and the generation of a momentary noise sound. It is possible to obtain the effect that the echo can be canceled in a reliable manner.

【0210】また、適応フィルタから出力した所定の閾
値以下の誤差信号を減衰させることにより、一層よくエ
コーをキャンセルすることができるという効果が得られ
る。
Further, by attenuating the error signal output from the adaptive filter, which is equal to or less than the predetermined threshold value, the effect that the echo can be canceled more effectively can be obtained.

【図面の簡単な説明】[Brief description of drawings]

【図1】既存のテレビ会議システムで用いられる音声送
受信用の機器を示す図である。
FIG. 1 is a diagram showing a device for voice transmission / reception used in an existing video conference system.

【図2】従来のエコーキャンセラの構成を示す図であ
る。
FIG. 2 is a diagram showing a configuration of a conventional echo canceller.

【図3】適応フィルタを用いるエコーキャンセラの最大
エコーパス長を示す図である。
FIG. 3 is a diagram showing a maximum echo path length of an echo canceller using an adaptive filter.

【図4】従来のエコーキャンセラでステレオ音声信号を
処理する場合にエコーとして扱う必要のある現象を示す
図である。
FIG. 4 is a diagram showing a phenomenon that needs to be treated as an echo when a stereo audio signal is processed by a conventional echo canceller.

【図5】本発明を適用した双方向コミュニケーションシ
ステムで使用される音声送受信用の機器を示す図であ
る。
FIG. 5 is a diagram showing a device for voice transmission / reception used in a two-way communication system to which the present invention is applied.

【図6】図5のエコーキャンセラの構成を示す図であ
る。
6 is a diagram showing a configuration of the echo canceller of FIG.

【図7】図6の帯域分割フィルタの構成を示す図であ
る。
7 is a diagram showing a configuration of the band division filter of FIG.

【図8】図6のエコーキャンセルブロックの構成を示す
図である。
8 is a diagram showing a configuration of an echo cancel block of FIG.

【図9】図6のエコーキャンセルブロック内のコントロ
ーラが実行する処理を示すフローチャートである。
9 is a flowchart showing a process executed by a controller in the echo cancel block of FIG.

【図10】図6のエキスパンダ/ゲート回路の入出力特
性を示す図である。
10 is a diagram showing input / output characteristics of the expander / gate circuit of FIG.

【図11】ステレオマイクロホンのM−S方式を示す図
である。
FIG. 11 is a diagram showing an MS method of a stereo microphone.

【符号の説明】[Explanation of symbols]

1 エコーキャンセラ、 2, 3 MSコンバータ、
4〜7 帯域分割フィルタ、 8〜11 デシメータ、
12〜15 エコーキャンセルブロック、16〜19
エキスパンダ/ゲート回路、 20, 21 インター
ポレータ、22, 23 加算器、 24 LRコンバー
タ、 41 デジタルフィルタ、42 加減算器、 4
3 コントローラ、 51 ADコンバータ、 52
DAコンバータ、 105 音声コーデック、 107
ネットワークインタフェース、 108 ネットワー
ク、 121 ステレオマイクロホン、 122L, 1
22R スピーカ
1 Echo canceller, 2, 3 MS converter,
4 to 7 band division filter, 8 to 11 decimator,
12-15 Echo cancellation block, 16-19
Expander / gate circuit, 20, 21 interpolator, 22, 23 adder, 24 LR converter, 41 digital filter, 42 adder / subtractor, 4
3 controller, 51 AD converter, 52
DA converter, 105 audio codec, 107
Network interface, 108 network, 121 stereo microphone, 122L, 1
22R speaker

Claims (9)

【特許請求の範囲】[Claims] 【請求項1】 スピーカに送られる所定のサンプリング
周波数のステレオ音声信号のうち、M−S(ミッド−サ
イド)方式のミッド成分の音声信号を、低周波帯域の音
声信号と高周波帯域の音声信号とに帯域分割する第1の
帯域分割手段と、 前記第1の帯域分割手段で帯域分割された低周波帯域の
ミッド成分の音声信号のサンプリング周波数を所定レー
トで下げる第1の周波数変換手段と、 マイクロホンから入力する前記所定のサンプリング周波
数のステレオ音声信号のうち、M−S方式のミッド成分
の音声信号を、前記低周波帯域の音声信号と前記高周波
帯域の音声信号とに帯域分割する第2の帯域分割手段
と、 前記第2の帯域分割手段で帯域分割された低周波帯域の
ミッド成分の音声信号のサンプリング周波数を前記所定
レートで下げる第2の周波数変換手段と、 前記第1の周波数変換手段から出力した低周波帯域のミ
ッド成分の音声信号がリファレンス信号として供給され
るとともに、前記第2の周波数変換手段から出力した低
周波帯域のミッド成分の音声信号が目標信号として供給
され、前記リファレンス信号から前記目標信号のレプリ
カを作成し、前記目標信号から前記レプリカを差し引い
た誤差信号を出力する適応フィルタと、 前記適応フィルタから出力した前記誤差信号のサンプリ
ング周波数を前記所定のサンプリング周波数に上げる第
3の周波数変換手段とを備えたことを特徴とするエコー
キャンセラ。
1. A stereo audio signal of a predetermined sampling frequency sent to a speaker, an audio signal of a mid component of the MS (mid-side) system, an audio signal of a low frequency band and an audio signal of a high frequency band. A first band-dividing means for band-dividing into a plurality of bands, first frequency-converting means for lowering a sampling frequency of a mid-component audio signal of a low-frequency band band-divided by the first band-dividing means at a predetermined rate, Of the stereo audio signal of the predetermined sampling frequency input from the second band for dividing the audio signal of the M-S mid component into the audio signal of the low frequency band and the audio signal of the high frequency band. Dividing means and the sampling frequency of the audio signal of the mid component of the low frequency band divided by the second band dividing means at the predetermined rate. The second frequency conversion unit and the low-frequency band mid-component audio signal output from the first frequency conversion unit are supplied as a reference signal, and the low-frequency band output signal from the second frequency conversion unit is supplied. An audio signal of a mid component is supplied as a target signal, a replica of the target signal is created from the reference signal, an adaptive filter that outputs an error signal obtained by subtracting the replica from the target signal, and the adaptive filter output from the adaptive filter. An echo canceller, comprising: a third frequency conversion means for increasing the sampling frequency of the error signal to the predetermined sampling frequency.
【請求項2】 請求項1に記載のエコーキャンセラにお
いて、 前記スピーカに送られる所定のサンプリング周波数のス
テレオ音声信号のうち、M−S方式のサイド成分の音声
信号を、低周波帯域の音声信号と高周波帯域の音声信号
とに帯域分割する第3の帯域分割手段と、 前記第3の帯域分割手段で帯域分割された低周波帯域の
サイド成分の音声信号のサンプリング周波数を所定レー
トで下げる第4の周波数変換手段と、 前記マイクロホンから入力する前記所定のサンプリング
周波数のステレオ音声信号のうち、M−S方式のサイド
成分の音声信号を、前記低周波帯域の音声信号と前記高
周波帯域の音声信号とに帯域分割する第4の帯域分割手
段と、 前記第4の帯域分割手段で帯域分割された低周波帯域の
サイド成分の音声信号のサンプリング周波数を前記所定
レートで下げる第5の周波数変換手段と、 前記第4の周波数変換手段から出力した低周波帯域のサ
イド成分の音声信号がリファレンス信号として供給され
るとともに、前記第5の周波数変換手段から出力した低
周波帯域のサイド成分の音声信号が目標信号として供給
され、前記リファレンス信号から前記目標信号のレプリ
カを作成し、前記目標信号から前記レプリカを差し引い
た誤差信号を出力する第2の適応フィルタと、 前記第2の適応フィルタから出力した前記誤差信号のサ
ンプリング周波数を前記所定のサンプリング周波数に上
げる第6の周波数変換手段と、 前記第6の周波数変換手段から出力した前記誤差信号
と、前記第3の周波数変換手段から出力した前記誤差信
号とを加算する加算手段とをさらに備えたことを特徴と
するエコーキャンセラ。
2. The echo canceller according to claim 1, wherein among the stereo audio signals of a predetermined sampling frequency sent to the speaker, an audio signal of a side component of the MS system is used as an audio signal of a low frequency band. Third band division means for performing band division into an audio signal of a high frequency band, and a fourth frequency reduction means for lowering a sampling frequency of the side component audio signal of the low frequency band divided by the third band division means at a predetermined rate. Of the stereo audio signals of the predetermined sampling frequency input from the microphone, the audio signal of the side component of the MS system is converted into the audio signal of the low frequency band and the audio signal of the high frequency band. Fourth band dividing means for band-dividing, and a sample of the audio signal of the side component of the low frequency band band-divided by the fourth band dividing means Fifth frequency conversion means for lowering the frequency at a predetermined rate, an audio signal of a side component of a low frequency band output from the fourth frequency conversion means is supplied as a reference signal, and the fifth frequency conversion means is provided. A second frequency component side audio signal output from the means is supplied as a target signal, a replica of the target signal is created from the reference signal, and an error signal obtained by subtracting the replica from the target signal is output. An adaptive filter; sixth frequency conversion means for increasing the sampling frequency of the error signal output from the second adaptive filter to the predetermined sampling frequency; and the error signal output from the sixth frequency conversion means, And an adder that adds the error signal output from the third frequency converter. And an echo canceller.
【請求項3】 請求項1に記載のエコーキャンセラにお
いて、 前記第1の帯域分割手段で帯域分割された高周波帯域の
ミッド成分の音声信号がリファレンス信号として供給さ
れるとともに、前記第2の帯域分割手段で帯域分割され
た高周波帯域のミッド成分の音声信号が目標信号として
供給され、前記リファレンス信号から前記目標信号のレ
プリカを作成し、前記目標信号から前記レプリカを差し
引いた誤差信号を出力する第3の適応フィルタと、 前記第3の適応フィルタから出力した前記誤差信号と、
前記第3の周波数変換手段から出力した前記誤差信号と
を加算する加算手段とをさらに備えたことを特徴とする
エコーキャンセラ。
3. The echo canceller according to claim 1, wherein the audio signal of the mid component of the high frequency band, which is band-divided by the first band-dividing means, is supplied as a reference signal, and the second band-division is performed. A high-frequency mid-component audio signal band-divided by the means is supplied as a target signal, creates a replica of the target signal from the reference signal, and outputs an error signal obtained by subtracting the replica from the target signal; And the error signal output from the third adaptive filter,
An echo canceller further comprising: an addition unit that adds the error signal output from the third frequency conversion unit.
【請求項4】 請求項1に記載のエコーキャンセラにお
いて、 前記スピーカに送られる左右2チャンネルのステレオ音
声信号を、M−S方式のステレオ音声信号に変換する第
1のステレオ方式変換手段と、 前記マイクロホンから入力する左右2チャンネルのステ
レオ音声信号を、M−S方式のステレオ音声信号に変換
する第2のステレオ方式変換手段とをさらに備え、 前記第1のステレオ方式変換手段から出力したミッド成
分の音声信号が前記第1の帯域分割手段で帯域分割さ
れ、 前記第2のステレオ方式変換手段から出力したミッド成
分の音声信号が前記第2の帯域分割手段で帯域分割され
ることを特徴とするエコーキャンセラ。
4. The echo canceller according to claim 1, further comprising: first stereo system conversion means for converting left and right two-channel stereo sound signals sent to the speaker into M-S system stereo sound signals. It further comprises a second stereo method converting means for converting the left and right two-channel stereo audio signals inputted from the microphone into a M-S method stereo audio signal, and the mid component of the mid component outputted from the first stereo method converting means. An echo characterized in that an audio signal is band-divided by the first band-dividing means, and a mid-component audio signal output from the second stereo-system converting means is band-divided by the second band-dividing means. Canceller.
【請求項5】 請求項1に記載のエコーキャンセラにお
いて、 前記適応フィルタは、 前記リファレンス信号, 前記目標信号, 前記誤差信号の
時間平均エネルギーをそれぞれ算出する手段と、 前記時間平均エネルギーの大きさに応じてタップ係数の
更新を制御する手段とを含むことを特徴とするエコーキ
ャンセラ。
5. The echo canceller according to claim 1, wherein the adaptive filter calculates a time average energy of each of the reference signal, the target signal, and the error signal, and has a magnitude of the time average energy. Echo canceller according to the present invention.
【請求項6】 請求項1に記載のエコーキャンセラにお
いて、 前記適応フィルタから出力した所定の閾値以下の前記誤
差信号を減衰させる減衰手段をさらに備え、 前記減衰手段の出力信号のサンプリング周波数が前記第
3の周波数変換手段で上げられることを特徴とするエコ
ーキャンセラ。
6. The echo canceller according to claim 1, further comprising an attenuator for attenuating the error signal output from the adaptive filter and having a predetermined threshold value or less, wherein the sampling frequency of the output signal of the attenuator is the first An echo canceller characterized by being raised by the frequency conversion means of 3.
【請求項7】 スピーカに送られる所定のサンプリング
周波数のステレオ音声信号のうち、M−S(ミッド−サ
イド)方式のミッド成分の音声信号を、低周波帯域の音
声信号と高周波帯域の音声信号とに帯域分割する第1ス
テップと、 前記第1ステップで帯域分割した低周波帯域のミッド成
分の音声信号を、サンプリング周波数を所定レートで下
げて、適応フィルタにリファレンス信号として供給する
第2ステップと、 マイクロホンから入力する前記所定のサンプリング周波
数のステレオ音声信号のうち、M−S方式のミッド成分
の音声信号を、前記低周波帯域の音声信号と前記高周波
帯域の音声信号とに帯域分割する第3ステップと、 前記第3ステップで帯域分割した低周波帯域のミッド成
分の音声信号を、サンプリング周波数を前記所定レート
で下げて、前記適応フィルタに目標信号として供給する
第4ステップと、 前記適応フィルタにおいて、前記リファレンス信号から
前記目標信号のレプリカを作成し、前記目標信号から前
記レプリカを差し引いた誤差信号を出力する第5ステッ
プと、前記適応フィルタから出力した前記誤差信号のサ
ンプリング周波数を前記所定のサンプリング周波数に上
げる第6ステップとを有することを特徴とするエコーキ
ャンセリング方法。
7. A stereo audio signal of a predetermined sampling frequency sent to a speaker, an audio signal of a mid component of the MS (mid-side) system, an audio signal of a low frequency band and an audio signal of a high frequency band. A first step of band-dividing into a band, and a second step of lowering the sampling frequency of the low-frequency band mid-component audio signal band-divided in the first step at a predetermined rate and supplying it to the adaptive filter as a reference signal, A third step of band-dividing an audio signal of a mid component of the MS system from the stereo audio signal of the predetermined sampling frequency inputted from the microphone into the audio signal of the low frequency band and the audio signal of the high frequency band. And a sampling frequency of the low-frequency mid-component audio signal band-divided in the third step A fourth step of reducing the rate and supplying it as a target signal to the adaptive filter; and, in the adaptive filter, creating a replica of the target signal from the reference signal and outputting an error signal obtained by subtracting the replica from the target signal. And a sixth step of increasing the sampling frequency of the error signal output from the adaptive filter to the predetermined sampling frequency.
【請求項8】 請求項7に記載のエコーキャンセリング
方法において、 前記スピーカに送られる所定のサンプリング周波数のス
テレオ音声信号のうち、M−S方式のサイド成分の音声
信号を、低周波帯域の音声信号と高周波帯域の音声信号
とに帯域分割するステップと、 前記帯域分割した低周波帯域のサイド成分の音声信号
を、サンプリング周波数を所定レートで下げて、前記適
応フィルタとは別の適応フィルタにリファレンス信号と
して供給するステップと、 前記マイクロホンから入力する前記所定のサンプリング
周波数のステレオ音声信号のうち、M−S方式のサイド
成分の音声信号を、前記低周波帯域の音声信号と前記高
周波帯域の音声信号とに帯域分割するステップと、 前記帯域分割した低周波帯域のサイド成分の音声信号
を、サンプリング周波数を前記所定レートで下げて、前
記別の適応フィルタに目標信号として供給するステップ
と、 前記別の適応フィルタにおいて、前記リファレンス信号
から前記目標信号のレプリカを作成し、前記目標信号か
ら前記レプリカを差し引いた誤差信号を出力するステッ
プと、 前記別の適応フィルタから出力した前記誤差信号と、前
記第6ステップでサンプリング周波数を上げた前記誤差
信号とを加算するステップとをさらに有することを特徴
とするエコーキャンセリング方法。
8. The echo canceling method according to claim 7, wherein among the stereo audio signals having a predetermined sampling frequency sent to the speaker, an audio signal of a side component of the MS method is used as an audio signal in a low frequency band. A step of band-splitting the signal into a high-frequency band audio signal, and lowering the sampling frequency of the band-divided low-frequency band side component audio signal at a predetermined rate, and referring to an adaptive filter different from the adaptive filter. Supplying as a signal, of the stereo audio signals of the predetermined sampling frequency input from the microphone, the audio signal of the side component of the MS system, the audio signal of the low frequency band and the audio signal of the high frequency band. Band-dividing the audio signal of the side component of the low frequency band Lowering the pulling frequency at the predetermined rate and supplying it as a target signal to the another adaptive filter; and in the other adaptive filter, creating a replica of the target signal from the reference signal, and replicating the target signal from the target signal. And a step of adding the error signal output from the another adaptive filter and the error signal whose sampling frequency has been increased in the sixth step. Echo canceling method.
【請求項9】 請求項7に記載のエコーキャンセリング
方法において、 前記第1ステップで帯域分割した高周波帯域のミッド成
分の音声信号を、前記適応フィルタとは別の適応フィル
タにリファレンス信号として供給するとともに、前記第
3ステップで帯域分割した高周波帯域のミッド成分の音
声信号を、前記別の適応フィルタに目標信号として供給
するステップと、 前記別の適応フィルタにおいて、前記リファレンス信号
から前記目標信号のレプリカを作成し、前記目標信号か
ら前記レプリカを差し引いた誤差信号を出力するステッ
プと、 前記別の適応フィルタから出力した前記誤差信号と、前
記第6ステップでサンプリング周波数を上げた前記誤差
信号とを加算するステップとをさらに備えたことを特徴
とするエコーキャンセリング方法。
9. The echo canceling method according to claim 7, wherein the audio signal of the mid component of the high frequency band, which is band-divided in the first step, is supplied to an adaptive filter different from the adaptive filter as a reference signal. Together with the step of supplying, as a target signal, the mid-component audio signal of the high frequency band that has been band-divided in the third step, in the another adaptive filter, a replica of the target signal from the reference signal. And outputting an error signal obtained by subtracting the replica from the target signal, adding the error signal output from the another adaptive filter, and the error signal increased in sampling frequency in the sixth step. Echo canceling method, further comprising: .
JP2002083632A 2002-03-25 2002-03-25 Echo canceller and echo canceling method Expired - Fee Related JP4192483B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002083632A JP4192483B2 (en) 2002-03-25 2002-03-25 Echo canceller and echo canceling method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002083632A JP4192483B2 (en) 2002-03-25 2002-03-25 Echo canceller and echo canceling method

Publications (2)

Publication Number Publication Date
JP2003284184A true JP2003284184A (en) 2003-10-03
JP4192483B2 JP4192483B2 (en) 2008-12-10

Family

ID=29231327

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002083632A Expired - Fee Related JP4192483B2 (en) 2002-03-25 2002-03-25 Echo canceller and echo canceling method

Country Status (1)

Country Link
JP (1) JP4192483B2 (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009147654A (en) * 2007-12-13 2009-07-02 Sony Corp Sound processor, sound processing system, and sound processing program
WO2014056328A1 (en) * 2012-10-12 2014-04-17 华为技术有限公司 Echo cancellation method and device
CN111402910A (en) * 2018-12-17 2020-07-10 华为技术有限公司 Method and equipment for eliminating echo
CN112562709A (en) * 2020-11-18 2021-03-26 珠海全志科技股份有限公司 Echo cancellation signal processing method and medium

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009147654A (en) * 2007-12-13 2009-07-02 Sony Corp Sound processor, sound processing system, and sound processing program
WO2014056328A1 (en) * 2012-10-12 2014-04-17 华为技术有限公司 Echo cancellation method and device
US8811624B2 (en) 2012-10-12 2014-08-19 Huawei Technologies Co., Ltd. Echo cancellation method and device
CN111402910A (en) * 2018-12-17 2020-07-10 华为技术有限公司 Method and equipment for eliminating echo
CN111402910B (en) * 2018-12-17 2023-09-01 华为技术有限公司 Method and equipment for eliminating echo
CN112562709A (en) * 2020-11-18 2021-03-26 珠海全志科技股份有限公司 Echo cancellation signal processing method and medium
CN112562709B (en) * 2020-11-18 2024-04-19 珠海全志科技股份有限公司 Echo cancellation signal processing method and medium

Also Published As

Publication number Publication date
JP4192483B2 (en) 2008-12-10

Similar Documents

Publication Publication Date Title
US9491561B2 (en) Acoustic echo cancellation with internal upmixing
JP3405512B2 (en) Acoustic echo cancellation method and system
US11297178B2 (en) Method, apparatus, and computer-readable media utilizing residual echo estimate information to derive secondary echo reduction parameters
JP2842607B2 (en) Echo canceller, communication device including the same, and signal processing method
WO2006017993A1 (en) A background noise eliminate device and method for speech communication terminal
US20080031469A1 (en) Multi-channel echo compensation system
EP1700465B1 (en) System and method for enchanced subjective stereo audio
US9532149B2 (en) Method of signal processing in a hearing aid system and a hearing aid system
KR20160015317A (en) An audio scene apparatus
JP3420705B2 (en) Echo suppression method and apparatus, and computer-readable storage medium storing echo suppression program
JPH04506141A (en) polyphonic coding
CN106448691A (en) Speech enhancement method used for loudspeaking communication system
JP2014523174A (en) Method and apparatus for decomposing stereo recordings using frequency domain processing using a spectral weight generator
JP5034607B2 (en) Acoustic echo canceller system
JP2003501894A (en) Method and apparatus for improving adaptive filter performance by including inaudible information
JP4192483B2 (en) Echo canceller and echo canceling method
JP3486140B2 (en) Multi-channel acoustic coupling gain reduction device
JPH09307651A (en) Simple stereo transmission system
JP2005141121A (en) Audio reproducing device
JP3090416B2 (en) Sound image control device and sound image control method
JP2007124163A (en) Call apparatus
JPH08125761A (en) Voice receiver
JP2000049948A (en) Speech communication device and speech communication system
JPH1032638A (en) Video conference system
JPS61114622A (en) Echo canceller

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20041118

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080221

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080304

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080502

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080826

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080908

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111003

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees