JP2013255155A - Multichannel echo cancellation device and multichannel echo cancellation method and program - Google Patents

Multichannel echo cancellation device and multichannel echo cancellation method and program Download PDF

Info

Publication number
JP2013255155A
JP2013255155A JP2012130581A JP2012130581A JP2013255155A JP 2013255155 A JP2013255155 A JP 2013255155A JP 2012130581 A JP2012130581 A JP 2012130581A JP 2012130581 A JP2012130581 A JP 2012130581A JP 2013255155 A JP2013255155 A JP 2013255155A
Authority
JP
Japan
Prior art keywords
domain
frequency
wave number
echo
wavenumber
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2012130581A
Other languages
Japanese (ja)
Other versions
JP5826712B2 (en
Inventor
Akira Emura
暁 江村
Yoichi Haneda
陽一 羽田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2012130581A priority Critical patent/JP5826712B2/en
Publication of JP2013255155A publication Critical patent/JP2013255155A/en
Application granted granted Critical
Publication of JP5826712B2 publication Critical patent/JP5826712B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Circuit For Audible Band Transducer (AREA)
  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
  • Telephonic Communication Services (AREA)

Abstract

PROBLEM TO BE SOLVED: To reduce the amount of arithmetic operation necessary to cancel an acoustic echo.SOLUTION: A frequency conversion unit 11 converts a reproduction signal to a frequency domain. A wavenumber conversion unit 12 converts the reproduction signal in frequency domain to a wavenumber domain. An echo replica generation unit 22 multiplies the reproduction signal in wavenumber domain by an adaptive filter coefficient within the effective range of wavenumbers to generate an echo replica in wavenumber domain. An inverse wavenumber conversion unit 31 converts the echo replica in wavenumber domain to a time domain. An inverse frequency conversion unit 32 converts the echo replica in frequency domain to a time domain. An echo cancellation unit 33 subtracts the echo replica in time domain from a sound pickup signal to generate an error signal. An error frequency conversion unit 41 converts the error signal to a frequency domain. An error wavenumber conversion unit 42 converts the error signal in frequency domain to a wavenumber domain. The echo replica generation unit 22 updates the adaptive filter coefficient in wavenumber domain by using a correction amount calculated within the effective range of wavenumbers from the reproduction signal in wavenumber domain and the error signal.

Description

この発明は、マルチチャネル拡声通話系において音響エコーを消去するマルチチャネルエコー消去技術に関する。   The present invention relates to a multi-channel echo cancellation technique for canceling acoustic echo in a multi-channel loudspeaker communication system.

近年、IP通信の高速化・大容量化を背景に、より自然な通話環境を提供できるマルチチャネル拡声型の双方向通信会議システムの開発が進展している。マルチチャネル再生技術は、ステレオから5.1チャネルへとチャネル数を拡大する方向に進んでいる。しかし、音が高い立体感を持って再生されるリスニングエリアは限られていて、スィートスポット化しており、スィートスポットの外では音の立体感が大幅に低減してしまう。そのため、参加者全員に均しく音の立体感を提供可能な、リスニングエリアの広いマルチチャネル再生技術が求められている。   In recent years, the development of a multi-channel loudspeaker type two-way communication conference system that can provide a more natural calling environment has been progressing against the background of speeding up and capacity increase of IP communication. Multi-channel playback technology is progressing in the direction of expanding the number of channels from stereo to 5.1 channels. However, the listening area where the sound is reproduced with a high three-dimensional effect is limited, and it has become a sweet spot, and the three-dimensional sound is greatly reduced outside the sweet spot. Therefore, there is a need for multi-channel playback technology with a wide listening area that can provide all participants with a three-dimensional sound.

このようなマルチチャネル再生技術として、近年、Wave Field Synthesis(以下、WFSと略す)の研究が進められている(非特許文献1参照)。WFSは、ある地点で取得した音波面を別の地点で再合成するために、数十以上のマイクロホンと数十以上のスピーカを必要とする。   In recent years, research on Wave Field Synthesis (hereinafter abbreviated as WFS) has been advanced as such a multi-channel reproduction technique (see Non-Patent Document 1). WFS requires several tens of microphones and several tens of speakers to re-synthesize a sound wave surface acquired at one point at another point.

WFSを双方向映像音声通信会議システムに適用しようとする場合、快適な通話環境を実現するためには、数十〜数百のスピーカから数十〜数百のマイクロホンに音響的に回り込む信号成分を収音信号から消去する必要がある。この処理を効率的に行う音響エコーキャンセラアルゴリズムとして、波数領域適応アルゴリズムが提案されている(非特許文献2参照)。   When applying WFS to a two-way video / audio communication conference system, in order to realize a comfortable call environment, signal components that sneak into tens to hundreds of microphones acoustically from tens to hundreds of speakers are used. It is necessary to erase from the collected sound signal. A wave number domain adaptive algorithm has been proposed as an acoustic echo canceller algorithm that efficiently performs this processing (see Non-Patent Document 2).

非特許文献2に記載のアルゴリズムでは、適応フィルタのフィルタ係数を波数領域に持つ。このアルゴリズムを適用したマルチチャネル通信会議システムは、Pチャネル再生系とPチャネル収音系とからなる。ただし、Pは2以上の整数である。Pチャネル再生信号はスピーカで音響信号として再生され、音響エコー経路を経てマイクロホンに回り込む。再生信号は、周波数領域に変換され、さらに周波数ごとに波数領域に変換される。この波数領域に変換された再生信号と波数領域の適応フィルタ係数からエコーレプリカを生成する。エコーレプリカは、周波数領域に変換され、さらに時間領域のPチャネル時間信号に変換される。そして、マイクロホン収音信号から時間領域に変換されたエコーレプリカを減算することでエコーを消去する。収音信号からエコーを消去した誤差信号は、周波数領域に変換され、さらに波数領域に変換される。そして、波数領域のPチャネル分の再生信号ベクトルと誤差信号から適応フィルタ係数を更新する。   The algorithm described in Non-Patent Document 2 has a filter coefficient of an adaptive filter in the wave number domain. A multi-channel communication conference system to which this algorithm is applied comprises a P-channel playback system and a P-channel sound collection system. However, P is an integer of 2 or more. The P channel reproduction signal is reproduced as an acoustic signal by a speaker, and goes around the microphone through an acoustic echo path. The reproduction signal is converted into the frequency domain, and further converted into the wave number domain for each frequency. An echo replica is generated from the reproduced signal converted into the wave number domain and the adaptive filter coefficient in the wave number domain. The echo replica is converted into the frequency domain and further converted into a P-channel time signal in the time domain. Then, the echo is eliminated by subtracting the echo replica converted to the time domain from the microphone sound pickup signal. The error signal from which the echo is eliminated from the collected sound signal is converted to the frequency domain and further converted to the wave number domain. Then, the adaptive filter coefficient is updated from the reproduction signal vector and the error signal for the P channel in the wave number domain.

A. J. Berkhout, D. de Vries, and P. Vogel, “Acoustic Control by wave field synthesis”, Journal of Acoustic Society of America, vol.93, no.5, pp.2764-2778, 1993.A. J. Berkhout, D. de Vries, and P. Vogel, “Acoustic Control by wave field synthesis”, Journal of Acoustic Society of America, vol.93, no.5, pp.2764-2778, 1993. M. Schneider, W. Kellermann, “A Wave-domain model for acoustic MIMO systems with reduced complexity”, 2011 Joint Workshop on Hands-free Speech Communication and Microphone arrays, pp.133-138, 2012.M. Schneider, W. Kellermann, “A Wave-domain model for acoustic MIMO systems with reduced complexity”, 2011 Joint Workshop on Hands-free Speech Communication and Microphone arrays, pp.133-138, 2012.

マルチチャネル拡声通話系における音響エコーキャンセラでは、適応フィルタにおけるエコー経路数はチャネル数の二乗に比例する。非特許文献2に記載の波数領域適応アルゴリズムを用いても、モノラルエコーキャンセラの演算量と比較すると、チャネル数に比例する演算量が必要となり、その演算量は膨大となる。   In an acoustic echo canceller in a multi-channel loudspeaker communication system, the number of echo paths in the adaptive filter is proportional to the square of the number of channels. Even if the wavenumber domain adaptive algorithm described in Non-Patent Document 2 is used, the amount of calculation proportional to the number of channels is required as compared with the amount of calculation of the monaural echo canceller, and the amount of calculation becomes enormous.

この発明はこのような点に鑑みてなされたものであり、マルチチャネル拡声通話系において音響エコーを消去するための演算量を削減することを目的とする。   The present invention has been made in view of these points, and an object thereof is to reduce the amount of calculation for eliminating acoustic echoes in a multi-channel loudspeaker communication system.

上記の課題を解決するために、この発明のマルチチャネルエコー消去装置は、P個のスピーカとP個のマイクロホンと周波数変換部と波数変換部と波数限定部と乗算部と波数0詰め部と逆波数変換部と逆周波数変換部とエコー消去部と誤差周波数変換部と誤差波数変換部と誤差波数限定部と修正量算出部とフィルタ係数更新部とを備える。P個のスピーカは、直線上に等間隔に配列される。P個のマイクロホンは、直線上に等間隔に配列される。周波数変換部は、スピーカから出力されるPチャネルの再生信号を周波数領域再生信号に変換する。波数変換部は、周波数領域再生信号を波数領域再生信号に変換する。波数限定部は、周波数ごとに、波数の有効範囲を算出し、波数領域再生信号を有効範囲に限定する。乗算部は、有効範囲内で波数領域有効再生信号に波数領域適応フィルタ係数を乗算し、波数領域エコーレプリカを生成する。波数0詰め部は、有効範囲外の波数におけるエコーレプリカを0とする。逆波数変換部は、波数領域エコーレプリカを周波数領域エコーレプリカに変換する。逆周波数変換部は、周波数領域エコーレプリカを時間領域エコーレプリカに変換する。エコー消去部は、マイクロホンから収音されるPチャネルの収音信号から時間領域エコーレプリカを減算し、誤差信号を生成する。誤差周波数変換部は、誤差信号を周波数領域誤差信号に変換する。誤差波数変換部は、周波数領域誤差信号を波数領域誤差信号に変換する。誤差波数限定部は、波数領域誤差信号を、周波数ごとに算出済みの有効範囲に限定する。修正量算出部は、有効範囲内で波数領域再生信号と波数領域誤差信号を用いて、波数領域適応フィルタ係数の修正量を算出する。フィルタ係数更新部は、修正量を用いて、波数領域適応フィルタ係数を更新する。   In order to solve the above problems, the multi-channel echo canceller of the present invention includes P speakers, P microphones, a frequency converter, a wave number converter, a wave number limiter, a multiplier, and a wave number zero padding unit. A wave number conversion unit, an inverse frequency conversion unit, an echo cancellation unit, an error frequency conversion unit, an error wave number conversion unit, an error wave number limitation unit, a correction amount calculation unit, and a filter coefficient update unit are provided. The P speakers are arranged at equal intervals on a straight line. P microphones are arranged at equal intervals on a straight line. The frequency conversion unit converts the P channel reproduction signal output from the speaker into a frequency domain reproduction signal. The wave number conversion unit converts the frequency domain reproduction signal into a wave number domain reproduction signal. The wave number limiting unit calculates the effective range of the wave number for each frequency, and limits the wave number domain reproduction signal to the effective range. The multiplication unit multiplies the wave number domain effective reproduction signal within the effective range by the wave number domain adaptive filter coefficient to generate a wave number domain echo replica. The wave number zero padding unit sets an echo replica at a wave number outside the effective range to zero. The inverse wave number conversion unit converts the wave number domain echo replica into a frequency domain echo replica. The inverse frequency transform unit transforms the frequency domain echo replica into a time domain echo replica. The echo canceller subtracts the time domain echo replica from the P-channel sound pickup signal picked up from the microphone to generate an error signal. The error frequency conversion unit converts the error signal into a frequency domain error signal. The error wave number converter converts the frequency domain error signal into a wave number domain error signal. The error wavenumber limiting unit limits the wavenumber domain error signal to the effective range calculated for each frequency. The correction amount calculation unit calculates the correction amount of the wave number domain adaptive filter coefficient using the wave number domain reproduction signal and the wave number domain error signal within the effective range. The filter coefficient updating unit updates the wave number domain adaptive filter coefficient using the correction amount.

この発明のマルチチャネルエコー消去技術によれば、マルチチャネル拡声通話系において、エコー消去性能を維持しながら、音響エコーを消去するための演算量を削減することができる。   According to the multi-channel echo cancellation technique of the present invention, it is possible to reduce the amount of calculation for canceling the acoustic echo while maintaining the echo cancellation performance in the multi-channel loudspeaker communication system.

従来のマルチチャネルエコー消去装置の機能構成を例示する図。The figure which illustrates the function structure of the conventional multichannel echo cancellation apparatus. 従来のエコーレプリカ生成部の機能構成を例示する図。The figure which illustrates the function structure of the conventional echo replica production | generation part. 従来のマルチチャネルエコー消去装置の処理フローを例示する図。The figure which illustrates the processing flow of the conventional multichannel echo cancellation apparatus. 従来のエコーレプリカ生成部の処理フローを例示する図。The figure which illustrates the processing flow of the conventional echo replica production | generation part. 誤差信号の合成方法を説明するための図。The figure for demonstrating the synthetic | combination method of an error signal. 単一周波数の平面波のサンプリングを説明するための図。The figure for demonstrating sampling of the plane wave of a single frequency. 周波数−波数領域で信号成分が存在する範囲を説明するための図。The figure for demonstrating the range where a signal component exists in a frequency-wavenumber area | region. 第1実施形態に係るマルチチャネルエコー消去装置の機能構成を例示する図。The figure which illustrates the function structure of the multichannel echo cancellation apparatus which concerns on 1st Embodiment. 第1実施形態に係るエコーレプリカ生成部の機能構成を例示する図。The figure which illustrates the functional composition of the echo replica generation part concerning a 1st embodiment. 第1実施形態に係るエコーレプリカ生成部の処理フローを例示する図。The figure which illustrates the processing flow of the echo replica production | generation part which concerns on 1st Embodiment. 空間エリアシングの発生とマイクロホン間隔との関係を説明するための図。The figure for demonstrating the relationship between generation | occurrence | production of space aliasing and a microphone space | interval. 第1実施形態に係るマルチチャネルエコー消去装置のエコー消去量をシミュレーションした結果を示す図。The figure which shows the result of having simulated the echo cancellation amount of the multichannel echo cancellation apparatus which concerns on 1st Embodiment. 第1実施形態に係るマルチチャネルエコー消去装置のエコー消去量をシミュレーションした結果を示す図。The figure which shows the result of having simulated the echo cancellation amount of the multichannel echo cancellation apparatus which concerns on 1st Embodiment. 第1実施形態に係るマルチチャネルエコー消去装置の演算量削減効果を示す図。The figure which shows the calculation amount reduction effect of the multichannel echo cancellation apparatus which concerns on 1st Embodiment. 第2実施形態に係るマルチチャネルエコー消去装置の機能構成を例示する図。The figure which illustrates the function structure of the multichannel echo cancellation apparatus which concerns on 2nd Embodiment. 第2実施形態に係るエコーレプリカ生成部の機能構成を例示する図。The figure which illustrates the function structure of the echo replica production | generation part which concerns on 2nd Embodiment. 第2実施形態に係るエコーレプリカ生成部の処理フローを例示する図。The figure which illustrates the processing flow of the echo replica production | generation part which concerns on 2nd Embodiment. 第2実施形態に係るマルチチャネルエコー消去装置のエコー消去量をシミュレーションした結果を示す図。The figure which shows the result of having simulated the echo cancellation amount of the multichannel echo cancellation apparatus which concerns on 2nd Embodiment. 第2実施形態に係るマルチチャネルエコー消去装置のエコー消去量をシミュレーションした結果を示す図。The figure which shows the result of having simulated the echo cancellation amount of the multichannel echo cancellation apparatus which concerns on 2nd Embodiment. 第2実施形態に係るマルチチャネルエコー消去装置の演算量削減効果を示す図。The figure which shows the calculation amount reduction effect of the multichannel echo cancellation apparatus which concerns on 2nd Embodiment.

以下、この発明の実施の形態について詳細に説明する。なお、図面中において同じ機能を有する構成部には同じ番号を付し、重複説明を省略する。   Hereinafter, embodiments of the present invention will be described in detail. In addition, the same number is attached | subjected to the component which has the same function in drawing, and duplication description is abbreviate | omitted.

なお、この明細書の表記においては、_Aは、

Figure 2013255155

を表すものとする。また、A^は、
Figure 2013255155

を表すものとする。 In this description, _A is
Figure 2013255155

. A ^ is
Figure 2013255155

.

[従来のマルチチャネルエコー消去装置]
<概要>
実施形態の説明に先立ち、従来のマルチチャネルエコー消去装置の処理について詳細に説明する。このマルチチャネルエコー消去装置は、非特許文献2に記載されている波数領域適応アルゴリズムにより収音信号から音響エコーを消去する。
[Conventional multi-channel echo canceller]
<Overview>
Prior to the description of the embodiment, the processing of the conventional multi-channel echo canceller will be described in detail. This multi-channel echo canceller cancels acoustic echoes from the collected sound signal by a wavenumber domain adaptive algorithm described in Non-Patent Document 2.

<構成>
図1に従来のマルチチャネルエコー消去装置9の構成例を示す。従来のマルチチャネルエコー消去装置9は、P(≧2)個の入力端子11,…,1PとP個のスピーカ21,…,2PとP個のマイクロホン31,…,3PとP個の出力端子41,…,4PとP個の周波数変換部111,…,11Pと波数変換部12とP個のエコーレプリカ生成部211,…,21Pと逆波数変換部31とP個の逆周波数変換部321,…,32Pとエコー消去部33とP個の誤差周波数変換部411,…,41Pと誤差波数変換部42とフレーム合成部91とを備える。P個のマイクロホン31,…,3Pは直線上に等間隔に配列されている。
<Configuration>
FIG. 1 shows a configuration example of a conventional multi-channel echo canceller 9. Conventional multi-channel echo canceller 9, P (≧ 2) pieces of input terminals 1 1, ..., 1 P and P number of the speaker 2 1, ..., 2 P and P number of microphones 3 1, ..., 3 P P outputs terminals 4 1, ..., 4 P and P number of the frequency converting unit 11 1, ..., 11 P and the wave number converter 12 and the P number of echo replica generation unit 21 1, ..., 21 P opposite wavenumber converter 31 and the P number of inverse frequency transform unit 32 1, ..., 32 P and the echo canceling portion 33 and the P number of error frequency converter 41 1, ..., 41 P and the error-wavenumber conversion portion 42 and the frame synthesizing portion 91 Is provided. P microphones 3 1 ,..., 3 P are arranged at equal intervals on a straight line.

図2にマルチチャネルエコー消去装置9が備えるエコーレプリカ生成部21p(1≦p≦P)の構成例を示す。エコーレプリカ生成部21pは、修正量算出部211とフィルタ係数更新部213と乗算部215とを備える。 FIG. 2 shows a configuration example of the echo replica generation unit 21 p (1 ≦ p ≦ P) provided in the multi-channel echo canceller 9. The echo replica generation unit 21 p includes a correction amount calculation unit 211, a filter coefficient update unit 213, and a multiplication unit 215.

<動作>
図3,4を参照して、マルチチャネルエコー消去装置9の動作例を、実際に行われる手続きの順に従って詳細に説明する。以下の説明では、各信号を、1フレーム2Fサンプル、シフト量F/Dサンプルでブロック化する。ただし、Fは自然数であり、DはFを割り切る自然数である。FFT計算を簡略化・高速化するために、Fを2のべき乗とすることが一般的である。この例では、D≧2であるものとして説明する。また、nを時刻、iをフレーム番号とする。
<Operation>
With reference to FIGS. 3 and 4, an example of the operation of the multi-channel echo canceller 9 will be described in detail according to the order of procedures actually performed. In the following description, each signal is blocked by 1 frame 2F samples and shift amount F / D samples. However, F is a natural number and D is a natural number that divides F. In order to simplify and speed up the FFT calculation, F is generally a power of 2. In this example, it is assumed that D ≧ 2. Also, n is the time and i is the frame number.

周波数変換部11p(1≦p≦P)は、Pチャネル再生信号x(p,n)の1フレーム分(2Fサンプル)を、式(1)に従ってブロック化して、再生信号ベクトルx(p,i)を生成する。 The frequency converter 11 p (1 ≦ p ≦ P) blocks one frame (2F samples) of the P channel reproduction signal x (p, n) into blocks according to the equation (1), and reproduces the reproduction signal vector x (p, p, p). i).

Figure 2013255155
Figure 2013255155

続いて、再生信号ベクトルx(p,i)を、式(2)に従って周波数領域に変換して、周波数領域の再生信号ベクトルX(p,i)を生成する(S11)。   Subsequently, the reproduction signal vector x (p, i) is converted into the frequency domain according to the equation (2) to generate the reproduction signal vector X (p, i) in the frequency domain (S11).

Figure 2013255155
Figure 2013255155

ここで、fは周波数のインデックスである。再生信号のサンプリング周波数をfsとすると、式(2)のXf(p,i)は周波数fsf/2F[Hz]の成分となる。 Here, f is a frequency index. Assuming that the sampling frequency of the reproduction signal is f s , X f (p, i) in equation (2) is a component of frequency f s f / 2F [Hz].

波数変換部12は、周波数インデックスfごとに、周波数領域の再生信号Xf(p,i)を波数領域の再生信号_Xf(k,i)に変換する(S12)。再生信号のチャネル数Pが偶数である場合には、式(3)に従って波数領域に変換する。ここでは、P=2Kとする。 The wave number conversion unit 12 converts the reproduction signal X f (p, i) in the frequency domain into a reproduction signal _X f (k, i) in the wave number domain for each frequency index f (S12). When the number of channels P of the reproduction signal is an even number, it is converted into the wave number domain according to the equation (3). Here, P = 2K.

Figure 2013255155
Figure 2013255155

一方、再生信号のチャネル数Pが奇数である場合には、式(4)により波数領域に変換する。ここでは、P=2K+1とする。   On the other hand, when the number of channels P of the reproduction signal is an odd number, it is converted into the wave number domain by Expression (4). Here, P = 2K + 1.

Figure 2013255155
Figure 2013255155

周波数領域から波数領域への変換は、通常2のべき乗の点数を持つ高速フーリエ変換で高速に行う。以下の説明では、チャネル数Pが偶数である場合を例として説明する。   The conversion from the frequency domain to the wave number domain is usually performed at high speed by a fast Fourier transform having a power of two. In the following description, a case where the number of channels P is an even number will be described as an example.

エコーレプリカ生成部21p(1≦p≦P)の備える乗算部215は、f≦Fである周波数インデックスfについて、全波数インデックス、すなわち-K≦k<Kにおいて、波数領域の再生信号_Xf(k,i)に適応フィルタ係数_Hf(k,k,i)を乗算し、波数領域のエコーレプリカ_Y^f(k,i)を生成する(S215)。この複素数乗算は式(5)のように表すことができる。 The multiplication unit 215 included in the echo replica generation unit 21 p (1 ≦ p ≦ P) has the full wavenumber index, ie, −K ≦ k <K, for the frequency index f satisfying f ≦ F, the reproduction signal _X of the wavenumber domain Multiply f (k, i) by the adaptive filter coefficient _H f (k, k, i) to generate an echo replica _Y ^ f (k, i) in the wave number domain (S215). This complex multiplication can be expressed as Equation (5).

Figure 2013255155
Figure 2013255155

この際、式(6)のように隣接する空間周波数成分を含めてもよい。なお、非特許文献2では、δとして1もしくは2が推奨されている。   At this time, adjacent spatial frequency components may be included as in Expression (6). In Non-Patent Document 2, 1 or 2 is recommended as δ.

Figure 2013255155
Figure 2013255155

逆波数変換部31は、波数領域のエコーレプリカ_Y^f(k,i)を、式(7)に従って周波数領域に変換し、周波数領域エコーレプリカY^f(p,i)を生成する(S31)。 The inverse wave number transforming unit 31 transforms the echo replica_Y ^ f (k, i) in the wave number domain into the frequency domain according to the equation (7) to generate the frequency domain echo replica Y ^ f (p, i) ( S31).

Figure 2013255155
Figure 2013255155

なお、f>Fである周波数インデックスfについては、実数信号のフーリエ変換結果に関する対称性を利用して、式(8)に従って周波数領域のエコーレプリカY^f(p,i)を生成する。ここで、conj(・)は、・の複素共役をとることを意味する。 For the frequency index f where f> F, a frequency domain echo replica Y ^ f (p, i) is generated according to equation (8) using the symmetry of the Fourier transform result of the real signal. Here, conj (·) means taking a complex conjugate of •.

Figure 2013255155
Figure 2013255155

逆周波数変換部32p(1≦p≦P)は、周波数領域のエコーレプリカY^f(p,i)を、式(9)に従って逆高速フーリエ変換し、時間領域のエコーレプリカ信号ベクトルy^(p,i)に変換する(S32)。ここで、0FはF×Fのゼロ行列であり、IFはF×Fの単位行列である。 The inverse frequency transform unit 32 p (1 ≦ p ≦ P) performs an inverse fast Fourier transform on the frequency domain echo replica Y ^ f (p, i) according to the equation (9), and the time domain echo replica signal vector y ^ Conversion into (p, i) is performed (S32). Here, 0 F is an F × F zero matrix, and IF is an F × F unit matrix.

Figure 2013255155
Figure 2013255155

エコー消去部33は、Pチャネル収音信号y(p,n)の1フレーム分(2Fサンプル)を、式(10)に従ってブロック化して、収音信号ベクトルy(p,i)を生成する。   The echo canceller 33 blocks one frame (2F samples) of the P channel sound pickup signal y (p, n) according to the equation (10) to generate a sound pickup signal vector y (p, i).

Figure 2013255155
Figure 2013255155

続いて、式(11)に従って、収音信号ベクトルy(p,i)からエコーレプリカ信号ベクトルy^(p,i)を減算し、誤差信号ベクトルe(p,i)を生成する(S33)。   Subsequently, according to the equation (11), the echo replica signal vector y ^ (p, i) is subtracted from the collected sound signal vector y (p, i) to generate an error signal vector e (p, i) (S33). .

Figure 2013255155
Figure 2013255155

式(1)および式(10)において、各信号をフレーム化する際にD≧2とする場合には、フレーム合成部91によりフレーム番号iで求めた誤差信号とそれ以前のフレーム番号で求めた誤差信号を窓かけ処理を経て合成する必要がある(S91)。図5を参照して窓かけ処理について説明する。D=2の場合、長さF/2の窓WHを使用して、式(12)に従って合成後の誤差信号ベクトルe'(p,i)を算出する。ここで、0F/2は(F/2)×(F/2)のゼロ行列であり、IF/2は(F/2)×(F/2)の単位行列である。窓WHは、例えばハニング窓である。 In Equation (1) and Equation (10), when D ≧ 2 when each signal is framed, the frame synthesis unit 91 obtains the error signal obtained by frame number i and the previous frame number. It is necessary to synthesize the error signals through a windowing process (S91). The windowing process will be described with reference to FIG. When D = 2, the combined error signal vector e ′ (p, i) is calculated according to the equation (12) using the window W H having the length F / 2. Here, 0 F / 2 is a zero matrix of (F / 2) × (F / 2), and I F / 2 is a unit matrix of (F / 2) × (F / 2). The window W H is, for example, a Hanning window.

Figure 2013255155
Figure 2013255155

誤差周波数変換部41p(1≦p≦P)は、誤差信号ベクトルe(p,i)を、式(13)に従って周波数領域に変換して、周波数領域の誤差信号ベクトルE(p,i)を生成する(S41)。 The error frequency conversion unit 41 p (1 ≦ p ≦ P) converts the error signal vector e (p, i) into the frequency domain according to the equation (13), and the frequency domain error signal vector E (p, i). Is generated (S41).

Figure 2013255155
Figure 2013255155

誤差波数変換部42は、周波数領域の誤差信号Ef(p,i)を、式(14)に従って波数領域に変換して、波数領域の誤差信号_Ef(k,i)を生成する(S42)。 The error wave number converter 42 converts the error signal E f (p, i) in the frequency domain into the wave number domain according to the equation (14) to generate the error signal _E f (k, i) in the wave number domain ( S42).

Figure 2013255155
Figure 2013255155

エコーレプリカ生成部21p(1≦p≦P)の備える修正量算出部211は、f≦Fである周波数インデックスfについて、全波数インデックス(-K≦k<K)において、式(15)に従って適応フィルタ係数の修正量d_Hf(k,k+dk,i)を算出する(S211)。ただし、dkは-δ≦df≦δである。 The correction amount calculation unit 211 included in the echo replica generation unit 21 p (1 ≦ p ≦ P) has the frequency index f satisfying f ≦ F according to the equation (15) in the full wave number index (−K ≦ k <K). The correction amount d_H f (k, k + dk, i) of the adaptive filter coefficient is calculated (S211). However, dk is −δ ≦ df ≦ δ.

Figure 2013255155
Figure 2013255155

ただし、conj(・)は、・の複素共役をとることを意味する。ρは、分母が0になることを防止するための微小な正の定数である。_Zf(k,i)は、周波数成分ごとの波数インデックスが(k-δ)〜(k+δ)である再生信号_X(k,i)のパワー総和であり、修正量d_H(k,k+dk,i)を補正している。_Zf(k,i)は、式(16)で求められる。ただし、βはパワー計算で短時間平均をとるための平滑化定数であり、0から1までの値をとる。 However, conj (•) means taking a complex conjugate of •. ρ is a minute positive constant for preventing the denominator from becoming zero. _Z f (k, i) is the total power of the reproduction signal _X (k, i) whose wave number index for each frequency component is (k-δ) to (k + δ), and the correction amount d_H (k, k + dk, i) is corrected. _Z f (k, i) is obtained by Expression (16). However, β is a smoothing constant for taking a short time average in power calculation, and takes a value from 0 to 1.

Figure 2013255155
Figure 2013255155

エコーレプリカ生成部21p(1≦p≦P)の備えるフィルタ係数更新部213は、式(17)に従って修正量d_Hf(k,k+dk,i)を用いて適応フィルタ係数_Hf(k,k,i)を更新する(S213)。ただし、μはステップサイズであり、0から1までの値をとる。 The filter coefficient update unit 213 included in the echo replica generation unit 21 p (1 ≦ p ≦ P) uses the correction amount d_H f (k, k + dk, i) according to the equation (17) to apply the adaptive filter coefficient _H f ( k, k, i) is updated (S213). However, μ is a step size and takes a value from 0 to 1.

Figure 2013255155
Figure 2013255155

このように、従来のマルチチャネルエコー消去装置では、例えば、スピーカおよびマイクロホンの数Pが100であるとして、δ=0と設定した場合、適応フィルタにおけるエコー経路数は100チャネル分、すなわちモノラルエコーキャンセラの100倍になる。さらにδ=2と設定した場合、100×(1+2×δ(=2))=500チャネル分にも達し、その演算量は膨大なものとなる。この発明の課題は、エコー経路数が多いマルチチャネル拡声通話系において、音響エコーを消去するための演算量を削減することである。   Thus, in the conventional multi-channel echo canceller, for example, when the number P of speakers and microphones is 100 and δ = 0 is set, the number of echo paths in the adaptive filter is 100 channels, that is, a monaural echo canceller. It becomes 100 times. Furthermore, when δ = 2 is set, the amount reaches 100 × (1 + 2 × δ (= 2)) = 500 channels, and the amount of calculation becomes enormous. An object of the present invention is to reduce the amount of calculation for eliminating acoustic echo in a multi-channel loudspeaker communication system having a large number of echo paths.

[発明のポイント]
この発明の動作原理について説明する。まず、単一周波数の平面波が波数領域でどのように表現されるかを考える。周波数−波数空間で見ると、波の存在範囲は周波数に応じて限定されることが知られている(詳細は「T. Ajdler, L. Sbaiz, and M. Vetterli, “Dynamic measurement of room impulse responses using a moving microphone”, J. Acoust. Soc. Am., 122 (3), 2007, 1636-1645.(参考文献1)」参照)。図6を参照して、角度αで入射する単一周波数f0[Hz]の平面波を考える。この例では、マイクロホン素子が直線上に間隔dで等間隔に配列されている。マイクロホン素子列をu軸上にとると、u軸上での音圧の時間変動は、tを時刻として式(18)で表すことができる。
[Points of Invention]
The operation principle of the present invention will be described. First, consider how a single-frequency plane wave is represented in the wave number domain. When viewed in the frequency-wavenumber space, it is known that the existence range of waves is limited depending on the frequency (for details, see “T. Ajdler, L. Sbaiz, and M. Vetterli,“ Dynamic measurement of room impulse responses ”. using a moving microphone ", J. Acoust. Soc. Am., 122 (3), 2007, 1636-1645. (reference 1)"). With reference to FIG. 6, a plane wave having a single frequency f 0 [Hz] incident at an angle α is considered. In this example, microphone elements are arranged on a straight line at equal intervals d. When the microphone element array is taken on the u-axis, the time variation of the sound pressure on the u-axis can be expressed by Expression (18), where t is the time.

Figure 2013255155
Figure 2013255155

ただし、角周波数ω0と波数φ0は、音速をvelocとして、式(19)の関係となる。 However, the angular frequency ω 0 and the wave number φ 0 have the relationship of Equation (19), where the velocity of sound is veloc.

Figure 2013255155
Figure 2013255155

u-t軸上の音圧を周波数−波数領域に変換すると、式(20)で表すことができる。   When the sound pressure on the u-t axis is converted into the frequency-wave number domain, it can be expressed by equation (20).

Figure 2013255155
Figure 2013255155

式(20)によれば、時間−空間領域で単一周波数の平面波は、周波数−波数領域では1点で表されることがわかる。   According to Expression (20), it can be seen that a plane wave having a single frequency in the time-space domain is represented by one point in the frequency-wave number domain.

全周波数で同一の周波数成分を持ち、時間−空間領域において式(21)で表される平面波は、周波数−波数領域においては式(22)であり、直線で表される。   A plane wave having the same frequency component at all frequencies and represented by Expression (21) in the time-space domain is represented by Expression (22) in the frequency-wave number domain and is represented by a straight line.

Figure 2013255155
Figure 2013255155

平面波の入射角αは0〜180度の範囲をとるため、周波数−波数領域でみると、平面波の存在範囲は式(23)を満たす範囲に限定される。   Since the incident angle α of the plane wave is in the range of 0 to 180 degrees, the existence range of the plane wave is limited to a range satisfying the expression (23) in the frequency-wave number region.

Figure 2013255155
Figure 2013255155

ただしf’は角周波数ωに対応する周波数[Hz]である。 Here, f ′ is a frequency [Hz] corresponding to the angular frequency ω.

図7に周波数−波数領域における波の存在範囲を図示する。縦軸が波数φであり、横軸が角周波数ωである。この場合、波は、傾き1/velocの直線と傾き-1/velocの直線により囲われた範囲のみに存在することになる。   FIG. 7 illustrates the existence range of waves in the frequency-wave number region. The vertical axis is the wave number φ, and the horizontal axis is the angular frequency ω. In this case, the wave exists only in a range surrounded by a straight line having a slope of 1 / veloc and a straight line having a slope of -1 / veloc.

実際のマイクロホン列によるサンプリングは離散的である。時間方向について、サンプリング周波数をfs、フレーム長を2Fとして2F点-FFTを使用し、空間方向について、マイクロホン間隔をd、マイクロホン数を2Kとして2K点-FFTを使用する場合、対象となる周波数の範囲は0〜fs/2[Hz]であり、波数φの範囲は-π/d〜π/dになる。 Sampling by the actual microphone array is discrete. For the time direction, use the 2F point-FFT with a sampling frequency of f s and a frame length of 2F, and for the spatial direction, use the 2K point-FFT with a microphone interval of d and the number of microphones of 2K. Is in the range of 0 to f s / 2 [Hz], and the range of the wave number φ is from −π / d to π / d.

非特許文献2に記載の波数領域適応アルゴリズムでは、波数領域でエコーレプリカを求める処理および適応フィルタ係数を更新する処理において、全波数φの範囲-π/d〜π/dに対応する-K≦k<Kの範囲で処理を行なっている。しかし上記の知見によれば、周波数−波数領域で信号成分の存在する範囲は音波の周波数が低いほど狭くなる。この発明は、この周波数と波数範囲の関係に基づいて、信号成分の存在する範囲においてのみエコーレプリカの算出処理と適応フィルタ係数の更新処理を行う。これらの処理を信号成分の存在範囲に絞り込むことで、演算量を削減することができる。   In the wavenumber domain adaptive algorithm described in Non-Patent Document 2, in the process of obtaining an echo replica in the wavenumber domain and the process of updating the adaptive filter coefficient, −K ≦ corresponding to the range −π / d to π / d of the total wavenumber φ. Processing is performed in the range of k <K. However, according to the above knowledge, the range in which the signal component exists in the frequency-wavenumber region becomes narrower as the frequency of the sound wave is lower. In the present invention, based on the relationship between the frequency and the wave number range, the echo replica calculation process and the adaptive filter coefficient update process are performed only in the range where the signal component exists. The amount of calculation can be reduced by narrowing down these processes to the signal component existence range.

[第1実施形態]
<構成>
図8に第1実施形態のマルチチャネルエコー消去装置10の構成例を示す。マルチチャネルエコー消去装置10は、P(≧2)個の入力端子11,…,1PとP個のスピーカ21,…,2PとP個のマイクロホン31,…,3PとP個の出力端子41,…,4PとP個の周波数変換部111,…,11Pと波数変換部12とP個のエコーレプリカ生成部221,…,22Pと逆波数変換部31とP個の逆周波数変換部321,…,32Pとエコー消去部33とP個の誤差周波数変換部411,…,41Pと誤差波数変換部42とフレーム合成部91とを備える。P個のスピーカ21,…,2Pは直線上に等間隔に配列されている。P個のマイクロホン31,…,3Pは直線上に等間隔に配列されている。
[First Embodiment]
<Configuration>
FIG. 8 shows a configuration example of the multi-channel echo cancellation apparatus 10 of the first embodiment. Multi-channel echo canceller 10, P (≧ 2) pieces of input terminals 1 1, ..., 1 P and P number of the speaker 2 1, ..., 2 P and P number of microphones 3 1, ..., 3 P and P number of output terminals 4 1, ..., 4 P and P number of the frequency converting unit 11 1, ..., 11 P and the wave number converter 12 and the P number of echo replica generation unit 22 1, ..., 22 P and the inverse-wavenumber conversion portion 31 and P number of the inverse frequency transformation unit 32 1, ..., 32 P and the echo canceling portion 33 and the P number of error frequency converter 41 1, ..., and a 41 P and error-wavenumber conversion portion 42 and the frame synthesizing portion 91 . P speakers 2 1 ,..., 2 P are arranged at equal intervals on a straight line. P microphones 3 1 ,..., 3 P are arranged at equal intervals on a straight line.

周波数変換部11、逆周波数変換部32、誤差周波数変換部41は従来のマルチチャネルエコー消去装置9と同様に周波数変換または逆周波数変換を実行する。上記ではFFT処理または逆FFT処理を用いる例を説明したが、FFT以外の処理により周波数変換または逆周波数変換を行うことも可能である。   The frequency conversion unit 11, the inverse frequency conversion unit 32, and the error frequency conversion unit 41 perform frequency conversion or inverse frequency conversion in the same manner as the conventional multichannel echo canceller 9. Although the example using the FFT process or the inverse FFT process has been described above, the frequency conversion or the inverse frequency conversion can be performed by a process other than the FFT.

図9にマルチチャネルエコー消去装置10が備えるエコーレプリカ生成部22p(1≦p≦P)の構成例を示す。エコーレプリカ生成部22pは、修正量算出部211とフィルタ係数更新部213と乗算部215と波数限定部216と誤差波数限定部217と波数0詰め部218とを備える。 FIG. 9 shows a configuration example of the echo replica generation unit 22 p (1 ≦ p ≦ P) included in the multi-channel echo cancellation apparatus 10. The echo replica generation unit 22 p includes a correction amount calculation unit 211, a filter coefficient update unit 213, a multiplication unit 215, a wave number limiting unit 216, an error wave number limiting unit 217, and a wave number zero padding unit 218.

従来のマルチチャネルエコー消去装置9と第1実施形態のマルチチャネルエコー消去装置10との相違点は、エコーレプリカ生成部の構成が異なることのみである。マルチチャネルエコー消去装置9が備えるエコーレプリカ生成部21pとマルチチャネルエコー消去装置10が備えるエコーレプリカ生成部22pとの相違点は、波数限定部216と誤差波数限定部217と波数0詰め部218を備える点である。 The only difference between the conventional multi-channel echo canceller 9 and the multi-channel echo canceller 10 of the first embodiment is that the configuration of the echo replica generator is different. The difference between the echo replica generation unit 21 p included in the multichannel echo cancellation apparatus 9 and the echo replica generation unit 22 p included in the multichannel echo cancellation apparatus 10 is that the wave number limiting unit 216, the error wave number limiting unit 217, and the wave number 0 filling unit It is a point provided with 218.

<動作>
図10を参照して、エコーレプリカ生成部22pの動作例を、実際に行われる手続きの順に従って詳細に説明する。
<Operation>
With reference to FIG. 10, an example of the operation of the echo replica generation unit 22 p will be described in detail according to the order of procedures actually performed.

エコーレプリカ生成部22pの備える波数限定部216は、周波数インデックスfごとに、有効波数インデックスmax_k(f)を算出する。そして、波数領域の再生信号_Xf(k,i)を-max_k(f)≦k≦max_k(f)の範囲に限定して、波数領域の有効再生信号_Xf(k,i)を生成する(S216)。 The wave number limiting unit 216 included in the echo replica generation unit 22 p calculates an effective wave number index max_k (f) for each frequency index f. Then, the reproduction signal _X f (k, i) in the wavenumber domain is limited to the range of −max_k (f) ≦ k ≦ max_k (f), and the effective reproduction signal _X f (k, i) in the wavenumber domain is Generate (S216).

周波数インデックスfの波は、周波数fsf/2F[Hz]の波に対応する。この波の角周波数ωは式(24)で表すことができるため、この波の波数の上限は式(25)で表すことができる。 The wave with the frequency index f corresponds to the wave with the frequency f s f / 2F [Hz]. Since the angular frequency ω of this wave can be expressed by equation (24), the upper limit of the wave number of this wave can be expressed by equation (25).

Figure 2013255155
Figure 2013255155

波数インデックスKがπ/dに対応することから、対応する波数インデックスの上限max_k(f)は、式(26)で表すことができる。ただし、ceil(・)は、・を整数へ切り上げる関数である。   Since the wave number index K corresponds to π / d, the upper limit max_k (f) of the corresponding wave number index can be expressed by Expression (26). However, ceil (•) is a function that rounds up • to an integer.

Figure 2013255155
Figure 2013255155

以上より、周波数インデックスfについての有効な波数インデックスの範囲は-max_k(f)≦k≦max_k(f)となる。   As described above, the effective wave number index range for the frequency index f is −max_k (f) ≦ k ≦ max_k (f).

エコーレプリカ生成部22pの備える乗算部215は、上記の式(5)に従って、-max_k(f)≦k≦max_k(f)の範囲で、波数領域の有効再生信号_Xf(k,i)に適応フィルタ係数_Hf(k,k,i)を乗算することで、波数領域のエコーレプリカ_Y^f(k,i)を生成する(S215)。隣接する空間周波数成分を含める場合には、上記の式(6)に従って、-max_k(f)≦k≦max_k(f)の範囲で、波数領域の有効再生信号_Xf(k,i)に適応フィルタ係数_Hf(k,k,i)を乗算することで、波数領域エコーレプリカ_Y^f(k,i)を生成すればよい。 The multiplier 215 included in the echo replica generator 22 p has an effective reproduction signal _X f (k, i in the wavenumber domain in the range of −max_k (f) ≦ k ≦ max_k (f) according to the above equation (5). ) Is multiplied by an adaptive filter coefficient _H f (k, k, i) to generate an echo replica _Y ^ f (k, i) in the wave number domain (S215). When including adjacent spatial frequency components, the effective reproduction signal _X f (k, i) in the wavenumber domain is in the range of −max_k (f) ≦ k ≦ max_k (f) according to the above equation (6). By multiplying the adaptive filter coefficient _H f (k, k, i), the wave number domain echo replica _Y ^ f (k, i) may be generated.

エコーレプリカ生成部22pの備える波数0詰め部218は、波数領域のエコーレプリカ_Y^f(k,i)について、k<-max_k(f)およびk>max_k(f)の範囲について、_Y^f(k,i)=0とする(S218)。 The wave number zero padding unit 218 included in the echo replica generation unit 22 p is _Y for the range of k <−max_k (f) and k> max_k (f) for the echo replica_Y ^ f (k, i) in the wave number domain. ^ f (k, i) = 0 is set (S218).

エコーレプリカ生成部22pの備える誤差波数限定部217は、周波数インデックスfごとに、波数領域の誤差信号_Ef(k,i)を-max_k(f)≦k≦max_k(f)の範囲に限定して、波数領域の有効誤差信号_Ef(k,i)を生成する(S217)。有効波数インデックスmax_k(f)は、波数限定部216が求めた値を用いることができる。 The error wave number limiting unit 217 included in the echo replica generation unit 22 p sets the error signal _E f (k, i) in the wave number domain to a range of −max_k (f) ≦ k ≦ max_k (f) for each frequency index f. In a limited manner, an effective error signal _E f (k, i) in the wave number domain is generated (S217). As the effective wave number index max_k (f), the value obtained by the wave number limiting unit 216 can be used.

エコーレプリカ生成部22pの備える修正量算出部211は、f≦Fである周波数インデックスfについて、波数インデックスkが-max_k(f)≦k≦max_k(f)である範囲において、上記の式(15)に従って、修正量d_Hf(k,k+dk,i)(-δ≦dk≦δ)を算出する(S211)。 The correction amount calculation unit 211 included in the echo replica generation unit 22 p has the above-described formula (with respect to the frequency index f satisfying f ≦ F) within the range where the wave number index k is −max_k (f) ≦ k ≦ max_k (f) ( According to 15), the correction amount d_H f (k, k + dk, i) (−δ ≦ dk ≦ δ) is calculated (S211).

エコーレプリカ生成部22pの備えるフィルタ係数更新部213は、上記の式(16)(17)に従って、適応フィルタ係数の修正量d_Hf(k,k+dk,i)を用いて適応フィルタ係数_Hf(k,k,i)を更新する(S213)。 The filter coefficient update unit 213 included in the echo replica generation unit 22 p uses the adaptive filter coefficient correction amount d_H f (k, k + dk, i) according to the above formulas (16) and (17). H f (k, k, i) is updated (S213).

図11を参照して、空間エリアシングの発生とマイクロホン間隔の関係について説明する。サンプリング周波数fsのとき、時間サンプリングの上限である周波数fs/2[Hz]の波では、波数がπfs/velocになる。マイクロホン間隔dが十分小さくπ/dがこの値より大きいときには空間エリアシングは生じない。しかし、マイクロホン間隔dが相対的に長くπ/dがこの値より小さい場合には空間エリアシングが生じる。マイクロホン間隔dとサンプリング周波数fsは、空間エリアシングが発生しない値に設定しなければならない。 The relationship between the occurrence of spatial aliasing and the microphone interval will be described with reference to FIG. When the sampling frequency is f s , the wave number is πf s / veloc for a wave having a frequency f s / 2 [Hz] that is the upper limit of time sampling. Spatial aliasing does not occur when the microphone spacing d is sufficiently small and π / d is greater than this value. However, spatial aliasing occurs when the microphone interval d is relatively long and π / d is smaller than this value. The microphone interval d and the sampling frequency f s must be set to values that do not cause spatial aliasing.

<シミュレーション結果>
第1実施形態の効果を確認するために、エコー消去量のシミュレーションを行った。残響時間250ミリ秒の部屋で、32個のスピーカ素子を間隔2cmで直線上に配列したスピーカアレーと、32個のマイクロホン素子を間隔2cmで直線上に配列したマイクロホンアレーとを、40cm離して平行に配置した。サンプリング周波数は16kHzに設定し、フレーム長を2F=2048に設定した。再生信号は別途ピンクノイズを音源として、32マイクロホンによる収音を模擬して生成した。この環境において、スピーカ・マイクロホン間の全エコー経路についてインパルス応答を測定した。
<Simulation results>
In order to confirm the effect of the first embodiment, an echo cancellation amount was simulated. In a room with a reverberation time of 250 milliseconds, a speaker array in which 32 speaker elements are arranged in a straight line with a spacing of 2 cm and a microphone array in which 32 microphone elements are arranged in a straight line with a spacing of 2 cm are parallel by 40 cm. Arranged. The sampling frequency was set to 16 kHz, and the frame length was set to 2F = 2048. The reproduction signal was generated by separately simulating the sound picked up by 32 microphones using pink noise as the sound source. In this environment, impulse responses were measured for all echo paths between the speaker and microphone.

図12,13は残響エコーの消去結果である。図12(A1)は、32チャネル中の第1チャネルについて、従来のマルチチャネルエコー消去方法を用いてエコー消去処理を行った場合の収音信号レベルとエコー消去処理後の信号レベルをプロットした図である。点線が収音信号レベルであり、実線がエコー消去処理後の信号レベルである。図12(A2)は、第1チャネルについて、第1実施形態のマルチチャネルエコー消去方法を用いてエコー消去処理を行った場合の収音信号レベルとエコー消去処理後の信号レベルをプロットした図である。図12(B1)は第3チャネルについて従来の方法を用いてエコーを消去した結果であり、図12(B2)は第3チャネルについて第1実施形態の方法を用いてエコーを消去した結果である。図12(C1)は第5チャネルについて従来の方法を用いてエコーを消去した結果であり、図12(C2)は第5チャネルについて第1実施形態の方法を用いてエコーを消去した結果である。図13(D1)は第7チャネルについて従来の方法を用いてエコーを消去した結果であり、図13(D2)は第7チャネルについて第1実施形態の方法を用いてエコーを消去した結果である。図13(E1)は第9チャネルについて従来の方法を用いてエコーを消去した結果であり、図13(E2)は第9チャネルについて第1実施形態の方法を用いてエコーを消去した結果である。   12 and 13 show the reverberation echo cancellation results. FIG. 12 (A1) is a graph plotting the collected sound signal level and the signal level after the echo cancellation process when the echo cancellation process is performed using the conventional multi-channel echo cancellation method for the first channel among the 32 channels. It is. The dotted line is the collected sound signal level, and the solid line is the signal level after the echo cancellation processing. FIG. 12 (A2) is a diagram in which the collected sound signal level and the signal level after echo cancellation processing are plotted for the first channel when echo cancellation processing is performed using the multi-channel echo cancellation method of the first embodiment. is there. FIG. 12B1 shows the result of canceling echo for the third channel using the conventional method, and FIG. 12B2 shows the result of canceling echo for the third channel using the method of the first embodiment. . FIG. 12C1 shows the result of canceling echo for the fifth channel using the conventional method, and FIG. 12C2 shows the result of canceling echo for the fifth channel using the method of the first embodiment. . FIG. 13D1 shows the result of canceling echo for the seventh channel using the conventional method, and FIG. 13D2 shows the result of canceling echo for the seventh channel using the method of the first embodiment. . FIG. 13E1 shows the result of canceling echo for the ninth channel using the conventional method, and FIG. 13E2 shows the result of canceling echo for the ninth channel using the method of the first embodiment. .

この発明は、エコー消去性能を維持しつつエコー消去の演算量を低減することが目的であるので、いずれのチャネルにおいても従来の方法によるエコー消去量と第1実施形態の方法によるエコー消去量が同等であること、すなわち実線でプロットされたエコー消去処理後の信号レベルが同等のpower[dB]であることが望ましい。   The object of the present invention is to reduce the amount of computation of echo cancellation while maintaining the echo cancellation performance. Therefore, in any channel, the amount of echo cancellation by the conventional method and the amount of echo cancellation by the method of the first embodiment are reduced. It is desirable that the signal levels after the echo cancellation processing plotted with a solid line are equivalent power [dB].

第3,5,7,9チャネルでは第1実施形態の方法は従来の方法と同等にエコーを消去できていることがわかる。第1チャネルでは第1実施形態の方法によるエコー消去量が従来の方法によるエコー消去量よりも劣化しているが、劣化幅は2dBにとどまっている。   In the third, fifth, seventh and ninth channels, it can be seen that the method of the first embodiment can cancel the echo in the same manner as the conventional method. In the first channel, the echo cancellation amount by the method of the first embodiment is deteriorated more than the echo cancellation amount by the conventional method, but the deterioration width is only 2 dB.

図14に第1実施形態のマルチチャネルエコー消去方法による演算量の削減効果を示す。演算量は1フレーム分の信号処理に必要な複素数乗算のカウントである。従来の方法による各処理部の演算量は、以下のようになる。   FIG. 14 shows the calculation amount reduction effect by the multi-channel echo cancellation method of the first embodiment. The calculation amount is a complex multiplication count necessary for signal processing for one frame. The calculation amount of each processing unit according to the conventional method is as follows.

・周波数変換部11(S11):2F点-FFT×Pチャネル
・波数変換部12(S12):P点-FFT×Fバンド
・エコーレプリカ生成部21(S21A):Pチャネル×(1+2δ)×Fバンド×Cブロック
・逆波数変換部31(S31):P点-逆FFT×Fバンド
・逆周波数変換部32(S32):2P点-逆FFT×Pチャネル
・誤差周波数変換部41(S41):2F点-FFT×Pチャネル
・誤差波数変換部42(S42):P点-FFT×Fバンド
・エコーレプリカ生成部21(S21B):{Pチャネル×(1+2δ)+2}×Fバンド×Cブロック
第1実施形態のマルチチャネルエコー消去装置によれば、エコーレプリカ生成部21(S21A、S21B)の演算量がそれぞれ半減する。
Frequency converter 11 (S11): 2F point-FFT × P channel Wave number converter 12 (S12): P point-FFT × F band Echo replica generator 21 (S21A): P channel × (1 + 2δ) × F band × C block / inverse wave number conversion unit 31 (S31): P point-inverse FFT × F band / inverse frequency conversion unit 32 (S32): 2P point-inverse FFT × P channel / error frequency conversion unit 41 (S41) ): 2F point−FFT × P channel / error wave number converting unit 42 (S42): P point−FFT × F band echo replica generating unit 21 (S21B): {P channel × (1 + 2δ) +2} × F According to the multi-channel echo canceller of the band × C block first embodiment, the calculation amount of the echo replica generation unit 21 (S21A, S21B) is halved.

図14は、第1実施形態の方法による演算量削減効果を示す図である。縦軸を複素数乗算数、横軸をチャネル数として、1フレーム分の信号処理に必要な複素数乗算のカウント数を、マイクロホン数P=32,64,128,256、δ=1、フレーム長2F=2048の場合について、従来の方法による演算量を点線で、第1実施形態の方法による演算量を実線でプロットしている。なお、2F点-FFTの乗算量をFlog2(2F)として算出した。いずれのチャネル数においても、第1実施形態の方法による演算量の方が、従来の方法による演算量よりも15%強削減できていることがわかる。   FIG. 14 is a diagram illustrating the calculation amount reduction effect by the method of the first embodiment. When the vertical axis is the complex number of multiplications and the horizontal axis is the number of channels, the number of complex multiplications necessary for signal processing for one frame is the number of microphones P = 32, 64, 128, 256, δ = 1, and the frame length is 2F = 2048. The calculation amount by the conventional method is plotted by a dotted line, and the calculation amount by the method of the first embodiment is plotted by a solid line. The multiplication amount of 2F point-FFT was calculated as Flog2 (2F). It can be seen that for any number of channels, the amount of computation by the method of the first embodiment can be reduced by more than 15% than the amount of computation by the conventional method.

<効果>
このように、この発明のマルチチャネルエコー消去装置は、周波数−波数領域では、周波数が低いほど有効な波数領域が限定されることに着目して、エコーレプリカの生成処理と適応フィルタ係数の更新処理を有効な波数領域に限定する。その結果、エコー消去性能を維持しながら、多数のスピーカとマイクロホンからなるマルチチャネル拡声通話系において全体としての演算量を削減することができる。
<Effect>
As described above, the multi-channel echo canceller of the present invention focuses on the fact that the effective wave number region is limited as the frequency is lower in the frequency-wave number region. Is limited to an effective wavenumber region. As a result, it is possible to reduce the overall calculation amount in a multi-channel loudspeaker communication system composed of a large number of speakers and microphones while maintaining the echo cancellation performance.

[第2実施形態]
<概要>
この発明の第2実施形態は、波数領域の適応フィルタに、周波数領域適応アルゴリズムの考え方を組み合わせた場合である。周波数領域適応アルゴリズムについての詳細は「E. Moulines, O. A. Amrane, and Y. Grenier, “The Generalized Multidelay Adaptive Filter: Structure and Convergence Analysis”, IEEE Trans. on SP, vol. 43, no. 1, 1995.(参考文献2)」を参照されたい。参考文献2は、適応フィルタを時間方向に分割する方法を示している。この分割により、処理遅延を抑えつつ適応フィルタ長を伸ばして、処理対象とするインパルス応答の長さに合わせることができるため、エコーキャンセラをより残響の長い部屋に対応させることができるようになる。
[Second Embodiment]
<Overview>
The second embodiment of the present invention is a case where the concept of the frequency domain adaptive algorithm is combined with the adaptive filter in the wave number domain. For details on frequency domain adaptation algorithms, see “E. Moulines, OA Amrane, and Y. Grenier,“ The Generalized Multidelay Adaptive Filter: Structure and Convergence Analysis ”, IEEE Trans. On SP, vol. 43, no. 1, 1995. (Reference 2). Reference 2 shows a method of dividing the adaptive filter in the time direction. By this division, the adaptive filter length can be extended while suppressing the processing delay to match the length of the impulse response to be processed, so that the echo canceller can be adapted to a room with longer reverberation.

<構成>
図15に第2実施形態のマルチチャネルエコー消去装置10’の構成例を示す。マルチチャネルエコー消去装置10’は、第1実施形態のマルチチャネルエコー消去装置10と同様に、P(≧2)個の入力端子11,…,1PとP個のスピーカ21,…,2PとP個のマイクロホン31,…,3PとP個の出力端子41,…,4PとP個の周波数変換部111,…,11Pと波数変換部12と逆波数変換部31とP個の逆周波数変換部321,…,32Pとエコー消去部33とP個の誤差周波数変換部411,…,41Pと誤差波数変換部42とフレーム合成部91とを備える。P個のエコーレプリカ生成部221,…,22Pの替わりに、P個のエコーレプリカ生成部231,…,23Pを備える。
<Configuration>
FIG. 15 shows a configuration example of the multi-channel echo canceling apparatus 10 ′ of the second embodiment. The multi-channel echo canceling apparatus 10 ′ is similar to the multi-channel echo canceling apparatus 10 of the first embodiment in that P (≧ 2) input terminals 1 1 ,..., 1 P and P speakers 2 1 ,. 2 P and P microphones 3 1 , ..., 3 P and P output terminals 4 1 , ..., 4 P and P frequency converters 11 1 , ..., 11 P , wave number converter 12 and inverse wave number converter parts 31 and P number of the inverse frequency transformation unit 32 1, ..., 32 P and the echo canceling portion 33 and the P number of error frequency converter 41 1, ..., 41 P and the error-wavenumber conversion portion 42 and the frame synthesizing portion 91 Prepare. P number of echo replica generation unit 22 1, ..., provided in place of 22 P, P number of echo replica generation unit 23 1, ..., a 23 P.

図16にマルチチャネルエコー消去装置10’が備えるエコーレプリカ生成部23p(1≦p≦P)の構成例を示す。エコーレプリカ生成部23pは、第1実施形態のエコーレプリカ生成部22pと同様に、波数限定部216と誤差波数限定部217と波数0詰め部218とを備える。修正量算出部211の替わりに修正量算出部221を備え、フィルタ係数更新部213の替わりにフィルタ係数更新部223を備え、乗算部215の替わりに乗算部225を備える。さらに、受話蓄積部219を備える。 FIG. 16 shows a configuration example of the echo replica generation unit 23 p (1 ≦ p ≦ P) included in the multichannel echo canceller 10 ′. Similar to the echo replica generation unit 22 p of the first embodiment, the echo replica generation unit 23 p includes a wave number limiting unit 216, an error wave number limiting unit 217, and a wave number zero padding unit 218. A correction amount calculation unit 221 is provided instead of the correction amount calculation unit 211, a filter coefficient update unit 223 is provided instead of the filter coefficient update unit 213, and a multiplication unit 225 is provided instead of the multiplication unit 215. Furthermore, a reception storage unit 219 is provided.

第1実施形態のマルチチャネルエコー消去装置10と第2実施形態のマルチチャネルエコー消去装置10’との相違点は、エコーレプリカ生成部の構成が異なることのみである。マルチチャネルエコー消去装置10が備えるエコーレプリカ生成部22pとマルチチャネルエコー消去装置10’が備えるエコーレプリカ生成部23pとの相違点は、受話蓄積部219をさらに備える点と、修正量算出部とフィルタ係数更新部と乗算部の処理が異なる点である。 The only difference between the multi-channel echo cancellation apparatus 10 of the first embodiment and the multi-channel echo cancellation apparatus 10 'of the second embodiment is that the configuration of the echo replica generation unit is different. The difference between the echo replica generation unit 22 p included in the multichannel echo cancellation apparatus 10 and the echo replica generation unit 23 p included in the multichannel echo cancellation apparatus 10 ′ is that it further includes a reception accumulation unit 219, and a correction amount calculation unit The processing of the filter coefficient updating unit and the multiplication unit is different.

<動作>
図17を参照して、エコーレプリカ生成部23pの動作例を、実際に行われる手続きの順に従って詳細に説明する。この実施形態では、適応フィルタ係数は_Hf(k,k,i,c)(0≦c≦C-1)のように、時間方向にC個に分割されている。
<Operation>
With reference to FIG. 17, an operation example of the echo replica generation unit 23 p will be described in detail according to the order of procedures actually performed. In this embodiment, the adaptive filter coefficient is divided into C pieces in the time direction as _H f (k, k, i, c) (0 ≦ c ≦ C−1).

エコーレプリカ生成部23pの備える受話蓄積部219には、波数限定部216の生成する波数領域の有効再生信号_Xf(p,i)のうち、直近の2C-1個である_Xf(p,i)〜_Xf(p,i-2(C-1))が蓄積される(S219)。 The receiver storage section 219 included in the echo replica generator 23 p, an effective reproduced signal _X f (p, i) of the frequency domain to produce a wavenumber limiting portion 216 of the most recent 2C-1 or a is _X f (p, i) to _X f (p, i-2 (C-1)) are accumulated (S219).

エコーレプリカ生成部23pの備える乗算部225は、下記の式(27)に従って、-max_k(f)≦k≦max_k(f)の範囲で、時間方向に分割された適応フィルタ係数_Hf(k,k,i,c)(0≦c≦C-1)に対応する波数領域の有効再生信号を乗算して和をとることで、波数領域のエコーレプリカ_Y^f(k,i)を生成する(S225)。ここでは、フレームのシフト量をF/2(D=2)に設定している。 The multiplication unit 225 included in the echo replica generation unit 23 p has an adaptive filter coefficient _H f (divided in the time direction in the range of −max_k (f) ≦ k ≦ max_k (f) according to the following equation (27). k, k, i, c) (equivalent to wave number domain echo replica_Y ^ f (k, i) Is generated (S225). Here, the frame shift amount is set to F / 2 (D = 2).

Figure 2013255155
Figure 2013255155

隣接する空間周波数成分を含める場合には、下記の式(28)に従って、-max_k(f)≦k≦max_k(f)の範囲で、時間方向に分割された適応フィルタ係数_Hf(k,k,i,c)(0≦c≦C-1) に対応する波数領域の有効再生信号を乗算して和をとることで、波数領域エコーレプリカ_Y^f(k,i)を生成すればよい。 When including adjacent spatial frequency components, the adaptive filter coefficient _H f (k, k, f) divided in the time direction in the range of −max_k (f) ≦ k ≦ max_k (f) according to the following equation (28): k, i, c) (0≤c≤C-1) is multiplied by the effective reproduction signal in the wavenumber domain and summed to generate a wavenumber domain echo replica_Y ^ f (k, i). That's fine.

Figure 2013255155
Figure 2013255155

エコーレプリカ生成部23pの備える修正量算出部221は、f≦Fである周波数インデックスfについて、波数インデックスkが-max_k(f)≦k≦max_k(f)である範囲において、下記の式(29)に従って、適応フィルタの修正量d_Hf(k,k+dk,i,c)を算出する(S221)。 The correction amount calculation unit 221 included in the echo replica generation unit 23 p has the following expression (in the range where the wave number index k is −max_k (f) ≦ k ≦ max_k (f) for the frequency index f where f ≦ F: According to 29), the correction amount d_H f (k, k + dk, i, c) of the adaptive filter is calculated (S221).

Figure 2013255155
Figure 2013255155

ただし、conj(・)は、・の複素共役をとることを意味する。ρは、分母が0になることを防止するための微小な正の定数である。_Zf(k,i)は、周波数成分ごとの波数インデックスが(k-δ)〜(k+δ)である再生信号_X(k,i)のパワー総和であり、修正量d_H(k,k+dk,i)を補正している。_Zf(k,i)は、式(30)で求められる。ただし、βは、パワー計算で短時間平均をとるための平滑化定数であり、0から1までの値をとる。 However, conj (•) means taking a complex conjugate of •. ρ is a minute positive constant for preventing the denominator from becoming zero. _Z f (k, i) is the total power of the reproduction signal _X (k, i) whose wave number index for each frequency component is (k-δ) to (k + δ), and the correction amount d_H (k, k + dk, i) is corrected. _Z f (k, i) is obtained by Expression (30). However, β is a smoothing constant for taking a short-time average in power calculation, and takes a value from 0 to 1.

Figure 2013255155
Figure 2013255155

エコーレプリカ生成部23p(1≦p≦P)の備えるフィルタ係数更新部223は、下記の式(31)に従って、修正量d_Hf(k,k+dk,i,c)を用いて適応フィルタ係数_Hf(k,k,i,c)を更新する(S223)。ただし、μは、ステップサイズであり、0から1までの値をとる。 The filter coefficient updating unit 223 included in the echo replica generation unit 23 p (1 ≦ p ≦ P) uses the correction amount d_H f (k, k + dk, i, c) in accordance with the following equation (31). The coefficient _H f (k, k, i, c) is updated (S223). However, μ is a step size and takes a value from 0 to 1.

Figure 2013255155
Figure 2013255155

<シミュレーション結果>
第2実施形態の効果を確認するために、エコー消去量のシミュレーションを行った。残響時間250ミリ秒の部屋で、32個のスピーカ素子を間隔2cmで直線上に配列したスピーカアレーと、32個のマイクロホン素子を間隔2cmで直線上に配列したマイクロホンアレーとを、40cm離して平行に配置した。サンプリング周波数は16kHzに設定し、フレーム長を2F=512に、適応フィルタの分割数をC=4に設定した。再生信号は別途ピンクノイズを音源として、32マイクロホンによる収音を模擬して生成した。この環境において、スピーカ・マイクロホン間の全エコー経路についてインパルス応答を測定した。
<Simulation results>
In order to confirm the effect of the second embodiment, an echo cancellation amount was simulated. In a room with a reverberation time of 250 milliseconds, a speaker array in which 32 speaker elements are arranged in a straight line with a spacing of 2 cm and a microphone array in which 32 microphone elements are arranged in a straight line with a spacing of 2 cm are parallel by 40 cm. Arranged. The sampling frequency was set to 16 kHz, the frame length was set to 2F = 512, and the adaptive filter division number was set to C = 4. The reproduction signal was generated by separately simulating the sound picked up by 32 microphones using pink noise as the sound source. In this environment, impulse responses were measured for all echo paths between the speaker and microphone.

図18,19は残響エコーの消去結果である。図18(A1)は、32チャネル中の第1チャネルについて、従来のマルチチャネルエコー消去方法を用いてエコー消去処理を行った場合の収音信号レベルとエコー消去処理後の信号レベルをプロットした図である。点線が収音信号レベルであり、実線がエコー消去処理後の信号レベルである。図18(A2)は、第1チャネルについて、第2実施形態のマルチチャネルエコー消去方法を用いてエコー消去処理を行った場合の収音信号レベルとエコー消去処理後の信号レベルをプロットした図である。図18(B1)は第3チャネルについて従来の方法を用いてエコーを消去した結果であり、図18(B2)は第3チャネルについて第2実施形態の方法を用いてエコーを消去した結果である。図18(C1)は第5チャネルについて従来の方法を用いてエコーを消去した結果であり、図18(C2)は第5チャネルについて第2実施形態の方法を用いてエコーを消去した結果である。図19(D1)は第7チャネルについて従来の方法を用いてエコーを消去した結果であり、図19(D2)は第7チャネルについて第2実施形態の方法を用いてエコーを消去した結果である。図19(E1)は第9チャネルについて従来の方法を用いてエコーを消去した結果であり、図19(E2)は第9チャネルについて第2実施形態の方法を用いてエコーを消去した結果である。   18 and 19 show the reverberation echo cancellation results. FIG. 18A1 is a diagram in which the collected sound signal level and the signal level after echo cancellation processing are plotted for the first channel of 32 channels when echo cancellation processing is performed using the conventional multi-channel echo cancellation method. It is. The dotted line is the collected sound signal level, and the solid line is the signal level after the echo cancellation processing. FIG. 18A2 is a diagram in which the collected sound signal level and the signal level after the echo cancellation process are plotted for the first channel when the echo cancellation process is performed using the multi-channel echo cancellation method of the second embodiment. is there. FIG. 18B1 shows the result of canceling echo for the third channel using the conventional method, and FIG. 18B2 shows the result of canceling echo for the third channel using the method of the second embodiment. . FIG. 18C1 shows the result of canceling echo for the fifth channel using the conventional method, and FIG. 18C2 shows the result of canceling echo for the fifth channel using the method of the second embodiment. . FIG. 19D1 shows the result of canceling echo for the seventh channel using the conventional method, and FIG. 19D2 shows the result of canceling echo for the seventh channel using the method of the second embodiment. . FIG. 19E1 shows the result of canceling echo for the ninth channel using the conventional method, and FIG. 19E2 shows the result of canceling echo for the ninth channel using the method of the second embodiment. .

第1実施形態と同様に、いずれのチャネルにおいても従来の方法によるエコー消去量と第2実施形態の方法によるエコー消去量が同等であること、すなわち実線でプロットされたエコー消去処理後の信号レベルが、同一のチャネルにおいて従来の方法と第2実施形態の方法とで同等のpower[dB]であることが望ましい。   Similar to the first embodiment, the echo cancellation amount by the conventional method and the echo cancellation amount by the method of the second embodiment are equal in any channel, that is, the signal level after the echo cancellation process plotted by the solid line However, it is desirable that the power [dB] is the same between the conventional method and the method of the second embodiment in the same channel.

第3,5,7,9チャネルでは第2実施形態の方法は従来の方法と同等にエコーを消去できていることがわかる。第1チャネルでは第2実施形態の方法によるエコー消去量が従来の方法によるエコー消去量よりも劣化しているが、劣化幅は2dBにとどまっている。つまり、第2実施形態の方法によっても、第1実施形態の方法による場合と同等のエコー消去性能を有していることがわかる。   In the third, fifth, seventh and ninth channels, it can be seen that the method of the second embodiment can cancel the echo in the same manner as the conventional method. In the first channel, the echo cancellation amount by the method of the second embodiment is deteriorated more than the echo cancellation amount by the conventional method, but the deterioration width is only 2 dB. That is, it can be seen that the method of the second embodiment has the same echo cancellation performance as that of the method of the first embodiment.

図20は、第2実施形態の方法による演算量削減効果を示す図である。縦軸を複素数乗算数、横軸をチャネル数として、1フレーム分の信号処理に必要な複素数乗算のカウント数を、マイクロホン数P=32,64,128,256、δ=1、フレーム長2F=512、分割数C=4の場合について、従来の方法による演算量を点線で、第2実施形態の方法による演算量を実線でプロットしている。いずれのチャネル数においても、第2実施形態の方法による演算量の方が、従来の方法による演算量よりも35%削減できていることがわかる。   FIG. 20 is a diagram illustrating the calculation amount reduction effect by the method of the second embodiment. The number of complex multiplications required for signal processing for one frame, the number of microphones P = 32, 64, 128, 256, δ = 1, frame length 2F = 512, number of divisions, where the vertical axis is the number of complex multiplications and the horizontal axis is the number of channels In the case of C = 4, the calculation amount by the conventional method is plotted by a dotted line, and the calculation amount by the method of the second embodiment is plotted by a solid line. It can be seen that, regardless of the number of channels, the amount of computation by the method of the second embodiment can be reduced by 35% compared to the amount of computation by the conventional method.

<効果>
このようにこの発明によれば、第2実施形態のマルチチャネルエコー消去装置のように波数領域適応フィルタを時間方向に分割した場合であっても、第1実施形態のマルチチャネルエコー消去装置と同様に、エコー消去性能を維持しながら、多数のスピーカとマイクロホンからなるマルチチャネル拡声通話系において全体としての演算量を削減することができる。
<Effect>
Thus, according to the present invention, even when the wavenumber domain adaptive filter is divided in the time direction as in the multichannel echo canceller of the second embodiment, the same as the multichannel echo canceller of the first embodiment. In addition, it is possible to reduce the overall calculation amount in a multi-channel loudspeaker communication system composed of a large number of speakers and microphones while maintaining the echo cancellation performance.

[プログラム、記録媒体]
この発明は上述の実施形態に限定されるものではなく、この発明の趣旨を逸脱しない範囲で適宜変更が可能であることはいうまでもない。上記実施例において説明した各種の処理は、記載の順に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。
[Program, recording medium]
The present invention is not limited to the above-described embodiment, and it goes without saying that modifications can be made as appropriate without departing from the spirit of the present invention. The various processes described in the above-described embodiments are not only executed in time series according to the order described, but may be executed in parallel or individually as required by the processing capability of the apparatus that executes the processes.

また、上記実施形態で説明した各装置における各種の処理機能をコンピュータによって実現する場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記各装置における各種の処理機能がコンピュータ上で実現される。   When various processing functions in each device described in the above embodiment are realized by a computer, the processing contents of the functions that each device should have are described by a program. Then, by executing this program on a computer, various processing functions in each of the above devices are realized on the computer.

この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。   The program describing the processing contents can be recorded on a computer-readable recording medium. As the computer-readable recording medium, for example, any recording medium such as a magnetic recording device, an optical disk, a magneto-optical recording medium, and a semiconductor memory may be used.

また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD−ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。   The program is distributed by selling, transferring, or lending a portable recording medium such as a DVD or CD-ROM in which the program is recorded. Furthermore, the program may be distributed by storing the program in a storage device of the server computer and transferring the program from the server computer to another computer via a network.

このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。そして、処理の実行時、このコンピュータは、自己の記録媒体に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。なお、本形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの(コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等)を含むものとする。   A computer that executes such a program first stores, for example, a program recorded on a portable recording medium or a program transferred from a server computer in its own storage device. When executing the process, the computer reads a program stored in its own recording medium and executes a process according to the read program. As another execution form of the program, the computer may directly read the program from a portable recording medium and execute processing according to the program, and the program is transferred from the server computer to the computer. Each time, the processing according to the received program may be executed sequentially. Also, the program is not transferred from the server computer to the computer, and the above-described processing is executed by a so-called ASP (Application Service Provider) type service that realizes the processing function only by the execution instruction and result acquisition. It is good. Note that the program in this embodiment includes information that is used for processing by an electronic computer and that conforms to the program (data that is not a direct command to the computer but has a property that defines the processing of the computer).

また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、本装置を構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。   In this embodiment, the present apparatus is configured by executing a predetermined program on a computer. However, at least a part of these processing contents may be realized by hardware.

9,10,10’ マルチチャネルエコー消去装置
1 入力端子
2 スピーカ
3 マイクロホン
4 出力端子
11 周波数変換部
12 波数変換部
21,22,23 エコーレプリカ生成部
31 逆波数変換部
32 逆周波数変換部
33 エコー消去部
41 誤差周波数変換部
42 誤差波数変換部
91 フレーム合成部
211,221 修正量算出部
213,223 フィルタ係数更新部
215,225 乗算部
216 波数限定部
217 誤差波数限定部
218 波数0詰め部
219 受話蓄積部
9, 10, 10 ′ Multi-channel echo canceling device 1 Input terminal 2 Speaker 3 Microphone 4 Output terminal 11 Frequency conversion unit 12 Wave number conversion unit 21, 22, 23 Echo replica generation unit 31 Inverse wave number conversion unit 32 Inverse frequency conversion unit 33 Echo Erasing unit 41 Error frequency converting unit 42 Error wave number converting unit 91 Frame synthesizing unit 211, 221 Correction amount calculating unit 213, 223 Filter coefficient updating unit 215, 225 Multiplying unit 216 Wave number limiting unit 217 Error wave number limiting unit 218 Wave number zero padding unit 219 Earphone storage unit

Claims (6)

直線上に等間隔に配列されたP(P≧2)個のスピーカと、
直線上に等間隔に配列されたP個のマイクロホンと、
前記スピーカから出力されるPチャネルの再生信号を周波数領域再生信号に変換する周波数変換部と、
前記周波数領域再生信号を波数領域再生信号に変換する波数変換部と、
前記周波数ごとに波数の有効範囲を算出し、前記波数領域再生信号を前記有効範囲に限定する波数限定部と、
前記有効範囲内で前記波数領域再生信号に波数領域適応フィルタ係数を乗算し、波数領域エコーレプリカを生成する乗算部と、
前記有効範囲外の波数におけるエコーレプリカを0とする波数0詰め部と、
前記波数領域エコーレプリカを周波数領域エコーレプリカに変換する逆波数変換部と、
前記周波数領域エコーレプリカを時間領域エコーレプリカに変換する逆周波数変換部と、
前記マイクロホンから収音されるPチャネルの収音信号から前記時間領域エコーレプリカを減算し、誤差信号を生成するエコー消去部と、
前記誤差信号を周波数領域誤差信号に変換する誤差周波数変換部と、
前記周波数領域誤差信号を波数領域誤差信号に変換する誤差波数変換部と、
前記波数領域誤差信号を、周波数ごとに算出済みの前記有効範囲に限定する誤差波数限定部と、
前記有効範囲内で前記波数領域再生信号と前記波数領域誤差信号を用いて、前記波数領域適応フィルタ係数の修正量を算出する修正量算出部と、
前記修正量を用いて、前記波数領域適応フィルタ係数を更新するフィルタ係数更新部と、
を備えるマルチチャネルエコー消去装置。
P (P ≧ 2) speakers arranged at equal intervals on a straight line,
P microphones arranged at equal intervals on a straight line,
A frequency conversion unit for converting a reproduction signal of the P channel output from the speaker into a frequency domain reproduction signal;
A wave number converter for converting the frequency domain reproduction signal into a wave number domain reproduction signal;
Calculating a wave number effective range for each frequency, and limiting the wave number domain reproduction signal to the effective range; and
A multiplier that multiplies the wavenumber domain reproduction signal within the effective range by a wavenumber domain adaptive filter coefficient to generate a wavenumber domain echo replica;
A wave number zero padding part that sets an echo replica at a wave number outside the effective range to zero;
An inverse wavenumber converter for converting the wavenumber domain echo replica into a frequency domain echo replica;
An inverse frequency transform unit for transforming the frequency domain echo replica into a time domain echo replica;
An echo canceler that subtracts the time-domain echo replica from the collected sound signal of the P channel collected from the microphone, and generates an error signal;
An error frequency converter for converting the error signal into a frequency domain error signal;
An error wavenumber converter for converting the frequency domain error signal into a wavenumber domain error signal;
An error wavenumber limiting unit that limits the wavenumber domain error signal to the effective range calculated for each frequency;
A correction amount calculation unit for calculating a correction amount of the wave number domain adaptive filter coefficient using the wave number domain reproduction signal and the wave number domain error signal within the effective range;
A filter coefficient updating unit that updates the wavenumber domain adaptive filter coefficient using the correction amount;
A multi-channel echo canceller comprising:
請求項1に記載のマルチチャネルエコー消去装置であって、
前記再生信号を所定時間ごとに分割して周波数領域を経由して波数領域に変換し、前記有効範囲内にある前記波数領域再生信号を過去複数個分蓄積する受話蓄積部を備え、
前記乗算部は、蓄積した波数領域再生信号に対応する適応フィルタ係数を乗算し、その総和をとることで前記波数領域エコーレプリカを生成する
ことを特徴とするマルチチャネルエコー消去装置。
The multi-channel echo canceller according to claim 1,
A reception storage unit that divides the reproduction signal at predetermined time intervals and converts the reproduction signal to a wave number domain through a frequency domain, and accumulates a plurality of past wave number domain reproduction signals within the effective range;
The multi-channel echo cancellation apparatus, wherein the multiplication unit multiplies an adaptive filter coefficient corresponding to the accumulated wave number domain reproduction signal, and generates the wave number domain echo replica by taking the sum.
請求項1または2に記載のマルチチャネルエコー消去装置であって、
周波数ごとの波数の有効範囲の上限と下限を、周波数の一次関数として算出する
ことを特徴とするマルチチャネルエコー消去装置。
The multi-channel echo canceller according to claim 1 or 2,
A multi-channel echo canceller that calculates the upper and lower limits of the effective range of wave numbers for each frequency as a linear function of frequency.
請求項3に記載のマルチチャネルエコー消去装置であって、
周波数がf[Hz]のときの波数の有効範囲を
Figure 2013255155

で求める
ことを特徴とするマルチチャネルエコー消去装置。
The multi-channel echo canceller according to claim 3,
The effective range of wave numbers when the frequency is f [Hz]
Figure 2013255155

A multi-channel echo canceller characterized by:
直線上に等間隔に配列されたP(P≧2)個のスピーカから出力されるPチャネルの再生信号を周波数領域再生信号に変換する周波数変換ステップと、
前記周波数領域再生信号を波数領域再生信号に変換する波数変換ステップと、
前記周波数ごとに波数の有効範囲を算出し、前記波数領域再生信号を前記有効範囲に限定する波数限定ステップと、
前記有効範囲内で前記波数領域再生信号に波数領域適応フィルタ係数を乗算し、波数領域エコーレプリカを生成する乗算ステップと、
前記有効範囲外の波数におけるエコーレプリカを0とする波数0詰めステップと、
前記波数領域エコーレプリカを周波数領域エコーレプリカに変換する逆波数変換ステップと、
前記周波数領域エコーレプリカを時間領域エコーレプリカに変換する逆周波数変換ステップと、
直線上に等間隔に配列されたP個のマイクロホンから収音されるPチャネルの収音信号から前記時間領域エコーレプリカを減算し、誤差信号を生成するエコー消去ステップと、
前記誤差信号を周波数領域誤差信号に変換する誤差周波数変換ステップと、
前記周波数領域誤差信号を波数領域誤差信号に変換する誤差波数変換ステップと、
前記波数領域誤差信号を、周波数ごとに算出済みの前記有効範囲に限定する誤差波数限定ステップと、
前記有効範囲内で前記波数領域再生信号と前記波数領域誤差信号を用いて、前記波数領域適応フィルタ係数の修正量を算出する修正量算出ステップと、
前記修正量を用いて、前記波数領域適応フィルタ係数を更新するフィルタ係数更新ステップと、
を含むマルチチャネルエコー消去方法。
A frequency conversion step of converting a reproduction signal of P channel output from P (P ≧ 2) speakers arranged at equal intervals on a straight line into a frequency domain reproduction signal;
A wave number conversion step for converting the frequency domain reproduction signal into a wave number domain reproduction signal;
Calculating a wave number effective range for each frequency, and limiting the wave number domain reproduction signal to the effective range;
A multiplication step of multiplying the wavenumber domain reproduction signal within the effective range by a wavenumber domain adaptive filter coefficient to generate a wavenumber domain echo replica;
A wave number zero filling step in which an echo replica at a wave number outside the effective range is zero;
An inverse wavenumber conversion step for converting the wavenumber domain echo replica into a frequency domain echo replica;
An inverse frequency transform step for transforming the frequency domain echo replica into a time domain echo replica;
An echo cancellation step of subtracting the time domain echo replica from the P channel sound pickup signal picked up from P microphones arranged at equal intervals on a straight line to generate an error signal;
An error frequency conversion step for converting the error signal into a frequency domain error signal;
An error wavenumber converting step of converting the frequency domain error signal into a wavenumber domain error signal;
An error wavenumber limiting step for limiting the wavenumber domain error signal to the effective range calculated for each frequency;
A correction amount calculating step of calculating a correction amount of the wave number domain adaptive filter coefficient using the wave number domain reproduction signal and the wave number domain error signal within the effective range;
A filter coefficient update step of updating the wavenumber domain adaptive filter coefficient using the correction amount;
A multi-channel echo cancellation method including:
請求項1から4のいずれかに記載のマルチチャネルエコー消去装置としてコンピュータを機能させるためのプログラム。   A program for causing a computer to function as the multi-channel echo canceling device according to claim 1.
JP2012130581A 2012-06-08 2012-06-08 Multi-channel echo canceling apparatus, multi-channel echo canceling method, and program Expired - Fee Related JP5826712B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012130581A JP5826712B2 (en) 2012-06-08 2012-06-08 Multi-channel echo canceling apparatus, multi-channel echo canceling method, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012130581A JP5826712B2 (en) 2012-06-08 2012-06-08 Multi-channel echo canceling apparatus, multi-channel echo canceling method, and program

Publications (2)

Publication Number Publication Date
JP2013255155A true JP2013255155A (en) 2013-12-19
JP5826712B2 JP5826712B2 (en) 2015-12-02

Family

ID=49952313

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012130581A Expired - Fee Related JP5826712B2 (en) 2012-06-08 2012-06-08 Multi-channel echo canceling apparatus, multi-channel echo canceling method, and program

Country Status (1)

Country Link
JP (1) JP5826712B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7452334B2 (en) 2020-08-31 2024-03-19 沖電気工業株式会社 Dereverberation device, dereverberation system, dereverberation method and program

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3667662B1 (en) 2018-12-12 2022-08-10 Panasonic Intellectual Property Corporation of America Acoustic echo cancellation device, acoustic echo cancellation method and acoustic echo cancellation program

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7452334B2 (en) 2020-08-31 2024-03-19 沖電気工業株式会社 Dereverberation device, dereverberation system, dereverberation method and program

Also Published As

Publication number Publication date
JP5826712B2 (en) 2015-12-02

Similar Documents

Publication Publication Date Title
JP6030660B2 (en) Method and apparatus for processing a spherical microphone array signal on a hard sphere used to generate an ambisonic representation of a sound field
US9420372B2 (en) Method and apparatus for processing signals of a spherical microphone array on a rigid sphere used for generating an ambisonics representation of the sound field
JP6485711B2 (en) Sound field reproduction apparatus and method, and program
JP6604331B2 (en) Audio processing apparatus and method, and program
JP7370415B2 (en) Spectral defect compensation for crosstalk processing of spatial audio signals
Møller et al. A moving horizon framework for sound zones
JP5762479B2 (en) Voice switch device, voice switch method, and program thereof
JP5826712B2 (en) Multi-channel echo canceling apparatus, multi-channel echo canceling method, and program
JP5937451B2 (en) Echo canceling apparatus, echo canceling method and program
JP4886616B2 (en) Sound collection device, sound collection method, sound collection program using the method, and recording medium
JP4928376B2 (en) Sound collection device, sound collection method, sound collection program using the method, and recording medium
JP5603307B2 (en) Sound field recording / reproducing apparatus, method, and program
JP5774062B2 (en) Echo canceling apparatus, echo canceling method, and program thereof
JP5762478B2 (en) Noise suppression device, noise suppression method, and program thereof
JP2006066988A (en) Sound collecting method, device and program, and medium recording sound collecting program
JP6087760B2 (en) Sound field recording / reproducing apparatus, method, and program
JP5713964B2 (en) Sound field recording / reproducing apparatus, method, and program
JP6075783B2 (en) Echo canceling apparatus, echo canceling method and program
JP4504891B2 (en) Echo canceling method, echo canceling apparatus, program, recording medium
JP5698110B2 (en) Multi-channel echo cancellation method, multi-channel echo cancellation apparatus, and program
JP5325134B2 (en) Echo canceling method, echo canceling apparatus, program thereof, and recording medium
JP4504892B2 (en) Echo canceling method, echo canceling apparatus, program, recording medium
JP5907488B2 (en) Reproduction signal generation method, sound collection reproduction method, reproduction signal generation apparatus, sound collection reproduction system, and program thereof
CN115665606A (en) Sound reception method and sound reception device based on four microphones
CN116320908A (en) Virtual stereo generation method and electronic equipment

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140710

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150515

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150825

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150907

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20151006

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20151014

R150 Certificate of patent or registration of utility model

Ref document number: 5826712

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees