JP2012205123A - Acoustic echo canceller - Google Patents
Acoustic echo canceller Download PDFInfo
- Publication number
- JP2012205123A JP2012205123A JP2011068480A JP2011068480A JP2012205123A JP 2012205123 A JP2012205123 A JP 2012205123A JP 2011068480 A JP2011068480 A JP 2011068480A JP 2011068480 A JP2011068480 A JP 2011068480A JP 2012205123 A JP2012205123 A JP 2012205123A
- Authority
- JP
- Japan
- Prior art keywords
- stereo
- echo
- acoustic echo
- echo canceller
- acoustic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M9/00—Arrangements for interconnection not involving centralised switching
- H04M9/08—Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic
- H04M9/082—Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic using echo cancellers
Abstract
Description
本発明の実施形態は、音響エコーキャンセラに関する。 Embodiments described herein relate generally to an acoustic echo canceller.
テレビやカーナビゲーションシステムなどの情報家電機器では、デジタル化されたステレオ・オーディオ信号を復号してステレオ・スピーカーで受聴する方式が一般化されている。 In information home appliances such as a TV and a car navigation system, a method of decoding a digitized stereo audio signal and listening to it with a stereo speaker is generalized.
国際標準方式の多くのステレオ・オーディオ復号器は、左右のチャンネル信号間の相関を利用してステレオパラメタを生成、利用することで効率的に帯域圧縮を行っている。例えば、MPEGで規定するオーディオ符号化モードの一つであるインテンシティ・ステレオ方式は、周波数領域のオーディオ信号から、モノラルの信号と、左右のステレオのレベル比をステレオパラメタとして抽出して符号化することにより、帯域圧縮を効率的に行っている。 Many stereo audio decoders of the international standard system efficiently perform band compression by generating and using stereo parameters using the correlation between left and right channel signals. For example, the intensity stereo system, which is one of the audio encoding modes defined by MPEG, extracts and encodes a monaural signal and a left / right stereo level ratio as a stereo parameter from an audio signal in a frequency domain. Thus, band compression is efficiently performed.
近年、このような機器にマイクロフォンを接続し、音声認識や電話・テレビ電話などを可能とする新たな機能が注目されている。例えば、テレビにマイクロフォンを接続し、マイクロフォンを通じて音声ボリュームを調整したり、テレビ電話を使用したりする機能が開発されている。また、例えば、カーナビゲーションシステムにマイクロフォンを接続し、ナビゲーションシステムの制御を音声で行う機能が開発されている。 In recent years, attention has been paid to a new function that enables a microphone to be connected to such a device and enables voice recognition, telephone / videophone, and the like. For example, functions have been developed in which a microphone is connected to a television and the sound volume is adjusted through the microphone or a videophone is used. In addition, for example, a function has been developed in which a microphone is connected to a car navigation system and the navigation system is controlled by voice.
一方、ステレオ・オーディオ再生時にハンズフリー会話や音声認識などを行おうとすると、ステレオ・オーディオ信号のエコーがマイクロフォンに回り込み、音響エコーによる通話障害や音声認識性能の劣化、音声品質の劣化などを引き起こすという問題がある。 On the other hand, if you try to do hands-free conversation or voice recognition during stereo audio playback, the echo of the stereo audio signal wraps around the microphone, causing call failure, voice recognition performance degradation, voice quality degradation, etc. due to acoustic echo There's a problem.
このような障害・劣化を防ぐために、通常は、ステレオ音響エコーキャンセラを用いることにより、マイクロフォンで収音した信号からマイクロフォンに回り込んだステレオ・オーディオ信号を除去している。 In order to prevent such obstacles / deterioration, a stereo audio echo canceller is usually used to remove a stereo audio signal that has sneak into the microphone from a signal collected by the microphone.
一般的なステレオ音響エコーキャンセラは、システム同定を用いてスピーカーとマイクロフォンとの間のエコーパス特性を推定する。このシステム同定には、一般的に適応フィルタが用いられる。 A typical stereo acoustic echo canceller estimates the echo path characteristics between a speaker and a microphone using system identification. An adaptive filter is generally used for this system identification.
しかし、従来の構成の音響エコーキャンセラでは、適応フィルタに入力される左右のステレオ・オーディオ信号の間に相関があると、正しいステレオエコーパス特性が推定できず、相関が変化したときにエコーキャンセル能力が著しく劣化するという問題があった。特に、ステレオ・オーディオ信号に本質的にモノラル信号である単独発言がある場合にこの問題は顕著となっていた。 However, with a conventional acoustic echo canceller, if there is a correlation between the left and right stereo audio signals that are input to the adaptive filter, the correct stereo echo path characteristics cannot be estimated, and the echo cancellation capability when the correlation changes There has been a problem that the material deteriorates significantly. This problem is particularly noticeable when the stereo audio signal has a single statement that is essentially a monaural signal.
この問題を解決するために、左右のステレオ・オーディオ信号間の相関を低減すべく、各チャンネルに独立な歪みを与える方法が提案されているが、ステレオ・オーディオ信号自体を歪めてしまうために、音声品質の劣化などを引き起こすといった大きな問題が生じてしまう。 In order to solve this problem, in order to reduce the correlation between the left and right stereo audio signals, a method of giving independent distortion to each channel has been proposed, but in order to distort the stereo audio signal itself, A big problem of causing degradation of voice quality occurs.
本実施形態が解決しようとする課題は、効率的に安定したエコーキャンセル能力を実現することができる音響エコーキャンセラを提供することである。 The problem to be solved by the present embodiment is to provide an acoustic echo canceller that can realize an efficient and stable echo cancellation capability.
本実施形態の音響エコーキャンセラは、入力された左右のステレオ・オーディオ信号の間の相関に基づき生成されたステレオパラメタを用いて、前記ステレオ・オーディオ信号を復号するオーディオ信号復号部と、前記復号されたステレオ・オーディオ信号に起因する音響エコーを推定するステレオエコー推定器を備え、入力された音声信号から前記推定された音響エコーを除去する音響エコーキャンセル部とを具備している。前記音響エコーキャンセル部は、前記ステレオパラメタに基づき、前記ステレオエコー推定器における前記音響エコーの推定動作を制御するステレオエコーキャンセラ制御器をさらに備えていることを特徴とする。 The acoustic echo canceller of the present embodiment includes an audio signal decoding unit that decodes the stereo audio signal using a stereo parameter generated based on a correlation between the input left and right stereo audio signals, and the decoded A stereo echo estimator for estimating the acoustic echo caused by the stereo audio signal, and an acoustic echo canceling unit for removing the estimated acoustic echo from the input voice signal. The acoustic echo cancellation unit further includes a stereo echo canceller controller that controls an estimation operation of the acoustic echo in the stereo echo estimator based on the stereo parameter.
以下、図面を参照して実施形態を説明する。 Hereinafter, embodiments will be described with reference to the drawings.
(第1の実施形態)
始めに、図1を参照して、本発明の第1の実施形態に係わる音響エコーキャンセラの構成を説明する。図1は、本発明の第1及び第2の実施形態に係わる音響エコーキャンセラの構成の一例を説明する概略ブロック図である。なお、図1には、音響エコーキャンセラと接続して使用される周辺機器も図示している。
(First embodiment)
First, the configuration of an acoustic echo canceller according to the first embodiment of the present invention will be described with reference to FIG. FIG. 1 is a schematic block diagram for explaining an example of the configuration of an acoustic echo canceller according to the first and second embodiments of the present invention. FIG. 1 also shows peripheral devices used in connection with an acoustic echo canceller.
図1に示すように、本発明の第1の実施形態に係わる音響エコーキャンセラは、チューナ等からステレオ・オーディオ信号を受信して符号化する受信器1と、符号化された信号を復号してデジタルオーディオ信号を出力するオーディオ信号復号部2と、マイクロフォン5などから入力された音声信号から音響エコーを除去する音響エコーキャンセル部6とを備えている。
As shown in FIG. 1, an acoustic echo canceller according to the first embodiment of the present invention receives a stereo audio signal from a tuner or the like and encodes it, and decodes the encoded signal. An audio
オーディオ信号復号部2には、符号化された信号を複数の帯域に分割するデータ分解器21と、割り当てられた帯域について、符号化された信号を復号して左右のステレオ・オーディオ信号を再生するステレオ信号復号部22と、全帯域の再生されたステレオ・オーディオ信号を合成する帯域合成器23とを備えている。
The audio
ステレオ信号復号部22は、データ分解器21によって分割される帯域の数Tと同数のステレオ信号復号器220、221、…、22T−1で構成されている。例えば、データ分解器21によって符号化された信号が16個の帯域に分割される場合、ステレオ信号復号部22には16個のステレオ信号復号器220、221、…、2215が配置される。各ステレオ信号復号器220、221、…、22T−1は、それぞれ帯域分割モノラルオーディオデコーダ24と、相関生成器25とを備えている。
The stereo
一方、音響エコーキャンセル部6は、左右のステレオ・オーディオ信号からスピーカー3、4とマイクロフォン5との間のエコーパス特性を推定して疑似エコー信号を生成する、ステレオエコー推定器としてのステレオ適応フィルタ62と、左右のステレオ・オーディオ信号のどちらか一方の信号であるモノラル信号に基づきスピーカー3、4とマイクロフォン5との間のエコーパス特性を推定するモノラル適応フィルタ63とを備えている。モノラル適応フィルタ63には、切り替えスイッチ67を介して左右のステレオ・オーディオ信号のいずれかが入力される。ステレオ適応フィルタ62とモノラル適応フィルタ63とはステレオエコーパス推定制御器64で接続されている。
On the other hand, the acoustic
ステレオ適応フィルタ62で推定され生成された疑似エコー信号は、加算器65によってマイクロフォン5から入力された音声信号から減ぜられる。疑似エコー信号が減ぜられてエコーが除去された音声信号は、外部機器に出力されると同時にステレオ適応フィルタ62にフィードバックされ、エコーパス特性を推定する学習に用いられる。
The pseudo echo signal estimated and generated by the stereo
また、モノラル適応フィルタ63で推定され生成された疑似エコー信号は、加算器66によってマイクロフォン5から入力された音声信号から減ぜられる。モノラル適応フィルタ63で生成された疑似エコー信号が減ぜられた音声信号は、モノラル適応フィルタ63にフィードバックされ、エコーパス特性を推定する学習に用いられる。
Further, the pseudo echo signal estimated and generated by the monaural
また、音響エコーキャンセル部6は、音響エコーキャンセル部6全体の制御を行うステレオエコーキャンセラ制御器61を備えている。ステレオエコーキャンセル部6は、ステレオエコーパス推定制御器64を介して、ステレオ適応フィルタ62におけるエコーパス特性の推定に用いられる係数などを制御する。また、ステレオエコーキャンセラ制御器61は、切り替えスイッチ67を制御して、モノラル適応フィルタ63に入力する信号を選択・切り替えさせる。
The acoustic
受信器1は、チューナ等からステレオ・オーディオ信号を受信し、帯域圧縮を施して符号化してオーディオ信号復号部2に出力する。
The
例えば、最近標準化されたステレオ対応のオーディオ復号方式では、DCT(Discrete Cosine Transform、離散コサイン変換)や帯域分割フィルタを用い、ステレオ・オーディオ信号を複数の帯域成分に分割して効率的に符号化する。その際、ステレオ・オーディオ信号には、各チャンネル間に相関があることが多い。そこで、フレーム区間i、帯域jごとに、以下のような直交化処理を施してチャンネル間の相関を除去した後に、モノラルの符号化方式を各チャンネルに施す。 For example, in a recently standardized audio decoding method for stereo, a DCT (Discrete Cosine Transform) or a band division filter is used to efficiently divide a stereo audio signal into a plurality of band components. . In that case, the stereo audio signal often has a correlation between the channels. Therefore, after performing orthogonalization processing as described below for each frame section i and band j to remove the correlation between channels, a monaural encoding method is applied to each channel.
例えば、j番目の帯域におけるi番目のフレームについて、左右のチャンネルのステレオ・オーディオ信号をそれぞれXLij(z)、XRij(z)とし、チャンネル間相関によるチャンネル間伝達関数をGRRij(z)、GRLij(z)、GLRij(z)、GLLij(z)とすると、左右のチャンネルのステレオ・オーディオ信号の和信号と差信号をそれぞれチルダXMij(z)、チルダXSij(z)は以下の式(1)で表すことができる。
例えば、左チャンネル信号と右チャンネル信号との間に以下の式(2)のような関係がある場合、
(ただし、ELij(z)はチャンネル間の非相関成分を表す。)
式(1)右辺におけるチャンネル間伝達関数の共役複素数のマトリクスは、以下の式(3)のように表される。
A matrix of conjugate complex numbers of the transfer function between channels on the right side of Expression (1) is expressed as Expression (3) below.
式(2)と式(3)とを式(1)に代入すると、式(4)が得られる。
すなわち、チルダXMij(z)、チルダXSij(z)は、相関成分と非相関成分とに分離することができる。このとき、非相関成分ELij(z)が無視できるとすると、チルダXSij(z)はゼロとなるので、チルダXMij(z)とチャンネル間の相関情報を符号化し、オーディオ信号復号部2に出力すればよいことになる。
That is, tilde X Mij (z) and tilde X Sij (z) can be separated into a correlated component and a non-correlated component. At this time, if the non-correlation component E Lij (z) can be ignored, the tilde X Sij (z) becomes zero. Therefore, the correlation information between the tilde X Mij (z) and the channel is encoded, and the audio
より具体的な実現例であるMPEG1やMPEG2のインテンシティ・ステレオ方式では、ステレオ・オーディオ信号XRij(z)、XLij(z)をそれぞれ式(5)、(6)のように仮定する。
なお、式(5)、式(6)において、lRijとlLijとは信号のレベル値を表す。すると、式(1)の右辺におけるチャンネル間伝達関数の共役複素数のマトリクスは、以下の式(7)のように表される。
式(5)、式(6)、式(7)を、式(1)に挿入すると、式(8)の関係が得られる。
すなわち、式(8)の関係に基づき、ステレオ・オーディオ信号に直交化を行って、左右のチャンネルの和信号チルダXMij(z)と、レベル情報lRijとlLijとを符号化する。これらの符号化方式は非相関成分がゼロとなるように処理を行うので、符号化するのはステレオ・オーディオ信号の主成分と、左右のチャンネルの相関を生成するためのチャンネル間相関情報(伝達関数)もしくはその近似であるレベル値である。 That is, based on the relationship of Expression (8), the stereo audio signal is orthogonalized to encode the left and right channel sum signal tilde X Mij (z) and the level information l Rij and l Lij . Since these encoding methods perform processing so that the uncorrelated component becomes zero, the main component of the stereo audio signal and the inter-channel correlation information (transmission) for generating the correlation between the left and right channels are encoded. Function) or an approximate level value.
符号化された信号は、オーディオ信号復号部2のデータ分解器21に入力される。データ分解器21では、受信した信号をあらかじめ設定された個数T(例えば16個)の帯域に分割する。この分割処理により、具体的には、i番目のフレームのj番目の帯域については、ステレオ・オーディオ信号の主成分の符号化コードIMijと、チャンネル間相関情報の符号化コードであるステレオパラメタ信号pijが分割される。
The encoded signal is input to the
ステレオ・オーディオ信号の主成分の符号化コードIMijは、それぞれの帯域に対応したステレオ信号復号器22jの帯域分割モノラルオーディオ復号器24に入力され、復号処理される。また、ステレオパラメタ信号pijは、それぞれの帯域に対応したステレオ信号復号器22jの相関生成器25に入力される。
The encoded code I Mij as the main component of the stereo audio signal is input to the band division
帯域分割モノラルオーディオ復号器24に入力された符号化コードIMijは、復号処理されることで各帯域のオーディオ主信号XMij(z´)となる。モノラル信号であるオーディオ主信号XMij(z´)は、同じステレオ信号復号器22jに配置された相関生成器25に出力される。
The encoded code I Mij input to the band division
相関生成器25では、データ分解器21から入力されたステレオパラメタ信号pijをもとに、チャンネル間伝達関数GRij(z´)、GLij(z´)が生成される。チャンネル間伝達関数GRij(z´)、GLij(z´)と、帯域分割モノラルオーディオ復号器24から入力されたオーディオ主信号XMij(z´)とを用い、以下の式(9)、式(10)に基づく演算処理を行って、部分帯域ごとに左右のステレオ・オーディオ信号XLij(z´)、XRij(z´)を生成する。
ステレオ信号復号器22jで生成された、部分帯域ごと左右のステレオ・オーディオ信号XLij(z´)、XRij(z´)は、帯域合成器23に出力される。帯域合成器23では、部分帯域の信号から全帯域の信号を復元する関数太字Fを用い、すべてのステレオ復号器220、221、…、22T−1から入力されたステレオ・オーディオ信号が、式(11)、式(12)に従って合成される。
合成された右側のステレオ・オーディオ信号チルダXRi(z)は、右側のスピーカー3に出力されて再生される。同様に、左側のステレオ・オーディオ信号チルダXLi(z)は、左側のスピーカー4に出力されて再生される。
The synthesized right stereo audio signal tilde X Ri (z) is output to the
帯域合成器23で合成された左右のステレオ・オーディオ信号チルダXRi(z)、XLi(z)は、音響エコーキャンセル部6のステレオ適応フィルタ62にも出力される。ステレオ適応フィルタ62は、システム同定を用いてスピーカー3、4とマイクロフォン5との間のエコーパス特性(疑似ステレオエコーパス特性)を推定し、疑似エコー信号ハットYi(z)を生成する。
The left and right stereo audio signals tilde X Ri (z) and X Li (z) synthesized by the band synthesizer 23 are also output to the stereo
左右のスピーカーとマイクロフォンとの間のステレオエコーパス特性をそれぞれHLi(z)、HRi(z)とし、送話音声と室雑音との合成信号をNi(z)とすると、i番目のフレームにおけるマイクロフォンに入力される音声信号Yi(z)は式(13)のように表すことができる。
一方、適応フィルタは、左右のスピーカーとマイクロフォンとの間のステレオエコーパス特性を推定し、左右の疑似ステレオエコーパス特性ハットHLi(z)、ハットHRi(z)として内部に保持しており、これらと左右のスピーカーから出力されるステレオ・オーディオ信号であるチルダXLi(z)、チルダXRi(z)とを用いて式(14)に表す疑似エコー信号を生成する。
なお、疑似ステレオエコーパス特性は、左右のスピーカーから出力されるステレオ・オーディオ信号とそれ自身とを用いてサンプリングの時間領域で学習され修正される。式(13)で表される音声信号Yi(z)から式(14)で表される疑似エコー信号ハットYi(z)を差し引くことにより、マイクロフォンに回り込んだステレオ・オーディオ信号を除去し、出力信号Ei(z)を得る。(式(15)参照。)
ここで、適応フィルタが収束していれば、下記の式(16)、式(17)のように推定した疑似ステレオエコーパス特性ハットHLi(z)、ハットHRi(z)が、真のステレオエコーパス特性HLi(z)、HRi(z)と一致する。
従って、式(18)に示すように出力信号Ei(z)と送話音声と室雑音との合成信号Ni(z)とが一致する。すなわち、適応フィルタを収束させることによってエコーを抑制することができる。
音響エコーの抑制効果を向上させるためには、上述した(16)式、(17)式に示されるように、疑似ステレオエコーパス特性ハットHLi(z)、ハットHRi(z)を、真のステレオエコーパス特性HLi(z)、HRi(z)と一致させることが重要になる。疑似ステレオエコーパス特性は、左右のスピーカー3、4から出力されるステレオ・オーディオ信号とそれ自身とを用いてサンプリングの時間領域で学習され修正される。
In order to improve the acoustic echo suppression effect, the pseudo stereo echo path characteristics hat H Li (z) and hat H Ri (z) are set to true as shown in the above equations (16) and (17). It is important to match the stereo echo path characteristics H Li (z) and H Ri (z). The pseudo stereo echo path characteristic is learned and corrected in the sampling time domain using the stereo audio signal output from the left and
ステレオ適応フィルタ62における疑似ステレオエコーパス特性ハットHLi(z)、ハットHRi(z)の学習は、実際にはサンプリングの時間領域で行われる。例えば、よく知られたNLMS法(Normalized Least Mean Square、正規化最小平均二乗)では、次の式(19)、及び式(20)で与えられる。
式(19)及び式(20)において、太字ハットHL(k)、太字ハットHR(k)、太字XL(k)、及び、太字XR(k)は、Nタップの適応FIRフィルタの係数からなるN次元ベクトルである。また、e(k)はエコー除去の残差信号、αは収束速度を決めるステップゲインと呼ばれる制御パラメータである。 In Expression (19) and Expression (20), the bold hat H L (k), the bold hat H R (k), the bold XL (k), and the bold X R (k) are N-tap adaptive FIR filters. It is an N-dimensional vector composed of the coefficients of Further, e (k) is a residual signal for echo cancellation, and α is a control parameter called step gain that determines the convergence speed.
太字XL(k)、及び、太字XR(k)には、それぞれ帯域合成器23で合成された左右のステレオ・オーディオ信号チルダXLi(z)、XRi(z)が適用され、e(k)は、加算器65を経て音響エコーが除去された後の音声信号が適用される。ステップゲインであるαの値は、ステレオエコーパス推定制御器64によって設定される。
The left and right stereo audio signal tildes X Li (z) and X Ri (z) synthesized by the band synthesizer 23 are applied to the bold letters X L (k) and the bold letters X R (k), respectively, e For (k), the sound signal after the acoustic echo is removed through the
なお、モノラル適応フィルタ63も、システム同定を用いてスピーカー3、4のいずれか片方とマイクロフォン5との間のエコーパス特性(疑似モノラルエコーパス特性)ハットHi(z)を推定する。また、疑似モノラルエコーパス特性ハットHi(z)は、左右のスピーカー3、4から出力される信号のうちスイッチ67によって選択された一方のステレオ・オーディオ信号(モノラル信号)とそれ自身などを用い、ステレオ適応フィルタ62と同様にサンプリングの時間領域で学習され修正される。
The monaural
ステレオエコーパス推定制御器64は、ステレオ適応フィルタ62における疑似ステレオエコーパス特性の学習に用いられるステップゲインαの値を、ステレオエコーキャンセラ制御器61からの指示に従って制御する。また、モノラル適応フィルタ63における疑似モノラルエコーパス特性の学習に用いられるステップゲインα´の値も、ステレオエコーキャンセラ制御器61からの指示に従って制御する。また、疑似モノラルエコーパス特性と疑似ステレオエコーパス特性との間の相互変換も行う。
The stereo echo
ステレオエコーキャンセラ制御器61は、チャンネル間相関情報の符号化コードであるステレオパラメタ信号pijないしは、ステレオパラメタ信号pijから生成されたチャンネル間伝達関数GRij(z´)、GLij(z´)の変化を監視し、監視結果に基づきステップゲインα、α´の値を制御する。
The stereo
例えば、チャンネル間伝達関数GRij(z´)、GLij(z´)をレベル値のみで以下の式(21)、(22)のように近似する場合、
左右のチャンネル間伝達関数の比率変化指標μiを式(23)によって求める。
この比率変化指標μiの監視結果に基づくステップゲインαの値の制御方法を、図2を用いて説明する。図2は、第1の実施形態に係わるステレオエコーキャンセラ制御器61による制御手順を説明するフローチャートである。
A method of controlling the value of the step gain α based on the monitoring result of the ratio change index μ i will be described with reference to FIG. FIG. 2 is a flowchart for explaining a control procedure by the stereo
まず、ステップS1において、当該フレームにおける左右のチャンネル間伝達関数の比率変化指標μiを式(23)によって求める。次に、μiと予め設定された比率変化指標の閾値μTHとを比較する(ステップS2)。 First, in step S1, the ratio change index μ i of the transfer function between the left and right channels in the frame is obtained by Expression (23). Next, μ i is compared with a preset ratio change index threshold value μ TH (step S2).
ステップS2においてμiが閾値μTHを下回った場合、左右のステレオ・オーディオ信号の相関が強いと判定してステップS4に進み、ステップゲインαの値を0にセットするようステレオエコーパス推定制御器64を介してステレオ適応フィルタ62を制御する。同時にステップゲインα´の値を1にセットするようステレオエコーパス推定制御器64を介してモノラル適応フィルタ63を制御する。
If μ i falls below the threshold μ TH in step S2, the stereo echo path estimation controller determines that the correlation between the left and right stereo audio signals is strong and proceeds to step S4, and sets the value of step gain α to 0. The stereo
なお、ステレオエコーキャンセラ制御器61は、ステップS4においてステップゲインα´の値を1にセットするとともに、左右のステレオ・オーディオ信号のうちレベル値の高い一方とモノラル適用フィルタ63とを接続するように切り替えスイッチ67を制御する。また、ステレオエコーパス推定制御器64に対し、それまでに学習した疑似ステレオエコーパス特性ハットHLi(z)、ハットHRi(z)から周知の変換式を用いて疑似モノラルエコーパス特性ハットHi(z)を算出し、モノラル適応フィルタ63にセットするよう制御指示を与える。
The stereo
一方、ステップS2においてμiが閾値μTH以上である場合、左右のステレオ・オーディオ信号の相関が弱いと判定してステップS3に進み、ステップゲインαの値を1にセットするようステレオエコーパス推定制御器64を介してステレオ適応フィルタ62を制御する。同時にステップゲインα´の値を0にセットするようステレオエコーパス推定制御器64を介してモノラル適応フィルタ63を制御する。
On the other hand, if μ i is greater than or equal to the threshold μ TH in step S2, it is determined that the correlation between the left and right stereo audio signals is weak, the process proceeds to step S3, and the stereo echo path estimation is performed so that the value of step gain α is set to 1. The stereo
ステップS3、S4が終了すると、共にステップS5に進み、監視対象のフレームを次のフレームに進めてステップS1に戻る。このようにして、時系列に送信されてくるステレオパラメタ信号pijないしは、ステレオパラメタ信号pijから生成されたチャンネル間伝達関数GRij(z´)、GLij(z´)の監視を繰り返す。 When steps S3 and S4 are completed, the process proceeds to step S5, advances the frame to be monitored to the next frame, and returns to step S1. In this way, the monitoring of the inter-channel transfer functions G Rij (z ′) and G Lij (z ′) generated from the stereo parameter signal p ij or the stereo parameter signal p ij transmitted in time series is repeated.
左右のステレオ・オーディオ信号間に強い相関がある場合には、ステレオ適応フィルタ62での疑似ステレオエコーパス特性の学習を続けても正しい方向に収束せずに誤推定を招くために、音響エコーキャンセル効果が著しく低下する問題を招いていた。しかしながら、本実施形態の音響エコーキャンセラでは、左右のステレオ・オーディオ信号間に強い相関がある場合にはステレオ適応フィルタ62での疑似ステレオエコーパス特性の学習を停止して、相関が弱くなると学習を再開させるため、安定した音響エコーキャンセル効果を実現できる。
When there is a strong correlation between the left and right stereo audio signals, acoustic echo cancellation is not possible because the stereo
このように、本実施の形態の音響エコーキャンセラでは、左右のステレオ・オーディオ信号間に強い相関がある場合には、ステレオ適応フィルタ62での疑似ステレオエコーパス特性の学習を停止させて誤推定を防ぐため、音響エコーキャンセル能力の低下を防ぐことができる。
As described above, in the acoustic echo canceller according to the present embodiment, when there is a strong correlation between the left and right stereo audio signals, the pseudo adaptive echo path characteristic learning in the stereo
また、オーディオ信号復号部2で用いられているチャンネル間相関情報の符号化コードであるステレオパラメタ信号pijないしは、ステレオパラメタ信号pijから生成されたチャンネル間伝達関数GRij(z´)、GLij(z´)を利用して左右のステレオ・オーディオ信号間の相関の強さを判定するため、新たな相関検出手段を必要としない。従って、経済的に安定的なキャンセル能力を有する音響エコーキャンセラを実現することができる。
Further, the stereo parameter signal p ij which is the encoded code of the inter-channel correlation information used in the audio
なお、左右のステレオ・オーディオ信号間の相関が強い場合に、ステップゲインαの値はゼロに固定的に制御される必要はなく、各種特性などに応じてゼロに近い所定の値に制御するようにしてもよい。 Note that when the correlation between the left and right stereo audio signals is strong, the value of the step gain α does not need to be fixedly controlled to zero, and is controlled to a predetermined value close to zero according to various characteristics. It may be.
(第2の実施形態)
上述した実施形態においては、左右のステレオ・オーディオ信号間の相関が強い区間が1区間出現した場合において、疑似ステレオエコーパス特性の学習を停止させることで誤推定を防ぎエコーキャンセル能力の低下を防ぐよう制御されていた。一方、本実施形態の音響エコーキャンセラでは、左右のステレオ・オーディオ信号間の相関が強い区間が複数区間出現した場合に、同区間の間に学習した疑似モノラルエコーパス特性を用いて疑似ステレオエコーパス特性を推定することで、エコーキャンセル能力をさらに向上させる点が異なっている。
(Second Embodiment)
In the above-described embodiment, when one section having a strong correlation between the left and right stereo audio signals appears, the false stereo echo path characteristic learning is stopped to prevent erroneous estimation and prevent the echo canceling ability from deteriorating. It was controlled as such. On the other hand, in the acoustic echo canceller according to the present embodiment, when a plurality of sections having a strong correlation between the left and right stereo audio signals appear, the pseudo stereo echo path using the pseudo monaural echo path characteristics learned during the section is used. The point that the echo cancellation capability is further improved by estimating the characteristics is different.
本実施形態の音響エコーキャンセラの構成は、図1用いて説明した第1の実施形態と同様であるので説明を省略する。 The configuration of the acoustic echo canceller of this embodiment is the same as that of the first embodiment described with reference to FIG.
本実施形態の音響エコーキャンセラも、第1の実施形態と同様に、ステレオエコーキャンセラ制御器61において左右のチャンネル間伝達関数の比率変化指標μiを定常的に監視する。フレームiからフレームi―vi+1の区間において比率変化指標が閾値μTHを下回り、また、フレームi―κiからフレームi―κi―vi―κi+1の区間においても比率変化指標がμTHを下回り、さらに、これらの区間におけるチャンネル間相関情報であるステレオパラメタ信号pijとpi―κijとが異なる場合、これらの区間の間に学習した疑似モノラルエコーパス特性を用いて疑似ステレオエコーパス特性を推定する。
Similarly to the first embodiment, the acoustic echo canceller of the present embodiment also regularly monitors the ratio change index μ i of the transfer function between the left and right channels in the stereo
具体的には、フレームiの疑似モノラルエコーパス特性ハットHi(z)、フレームi―κiの疑似モノラルエコーパス特性ハットHi―κi(z)、及び、式(24)に定義された、各々に対応するステレオ生成伝達関数GRLi(z)、GRLi−κi(z)を用いて、周知の式(25)の変換式に従い、左右の疑似ステレオエコーパス特性ハットHLi(z)、ハットHRi(z)を推定する。
上記のように二区間の疑似モノラルエコーパス特性を用いた疑似ステレオエコーパス特性の推定は、ステレオエコーキャンセラ制御器61からの制御指示に基づきステレオエコーパス推定制御器64で行われる。推定された疑似ステレオエコーパス特性HLi(z)、ハットHRi(z)は、ステレオ適応フィルタ62にセットされ、引き続き行われる疑似ステレオエコーパス特性の学習に用いられる。
As described above, the estimation of the pseudo stereo echo path characteristic using the two-section pseudo monaural echo path characteristic is performed by the stereo echo
このように、本実施の形態の音響エコーキャンセラでは、左右のステレオ・オーディオ信号間に強い相関がある区間が複数区間出現した場合に、同区間で推定された疑似モノラルエコーパス特性を用いて、左右の疑似ステレオエコーパス特性を推定する。これにより、音響エコーキャンセル能力がさらに向上する。なお、出現する強い相関がある複数区間は、連続していてもかまわない。 Thus, in the acoustic echo canceller of the present embodiment, when a plurality of sections having a strong correlation between the left and right stereo audio signals appear, using the pseudo monaural echo path characteristic estimated in the same section, Estimate the left and right pseudo stereo echo path characteristics. Thereby, the acoustic echo cancellation capability is further improved. Note that a plurality of sections having a strong correlation that appear may be continuous.
本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。 Although several embodiments of the present invention have been described, these embodiments are presented by way of example and are not intended to limit the scope of the invention. These novel embodiments can be implemented in various other forms, and various omissions, replacements, and changes can be made without departing from the scope of the invention. These embodiments and modifications thereof are included in the scope and gist of the invention, and are included in the invention described in the claims and the equivalents thereof.
2…オーディオ信号復号部、6…音響エコーキャンセル部、62…ステレオ適応フィルタ、 2 ... audio signal decoding unit, 6 ... acoustic echo canceling unit, 62 ... stereo adaptive filter,
Claims (5)
前記復号されたステレオ・オーディオ信号に起因する音響エコーを推定するステレオエコー推定器を備え、入力された音声信号から前記推定された音響エコーを除去する音響エコーキャンセル部と、
を具備した音響エコーキャンセラであって、
前記音響エコーキャンセル部は、前記ステレオパラメタに基づき、前記ステレオエコー推定器における前記音響エコーの推定動作を制御するステレオエコーキャンセラ制御器をさらに備えることを特徴とする、
音響エコーキャンセラ。 An audio signal decoding unit that decodes the stereo audio signal using a stereo parameter generated based on a correlation between the input left and right stereo audio signals;
A stereo echo estimator for estimating an acoustic echo caused by the decoded stereo audio signal; and an acoustic echo canceling unit for removing the estimated acoustic echo from the input speech signal;
An acoustic echo canceller comprising:
The acoustic echo cancellation unit further includes a stereo echo canceller controller that controls an estimation operation of the acoustic echo in the stereo echo estimator based on the stereo parameter.
Acoustic echo canceller.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011068480A JP2012205123A (en) | 2011-03-25 | 2011-03-25 | Acoustic echo canceller |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011068480A JP2012205123A (en) | 2011-03-25 | 2011-03-25 | Acoustic echo canceller |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2012205123A true JP2012205123A (en) | 2012-10-22 |
Family
ID=47185611
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011068480A Withdrawn JP2012205123A (en) | 2011-03-25 | 2011-03-25 | Acoustic echo canceller |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2012205123A (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014099940A1 (en) * | 2012-12-17 | 2014-06-26 | Microsoft Corporation | Correlation based filter adaptation |
JP2016048847A (en) * | 2014-08-27 | 2016-04-07 | 沖電気工業株式会社 | Stereo echo suppression device, echo suppression device, stereo echo suppression method, and stereo echo suppression program |
-
2011
- 2011-03-25 JP JP2011068480A patent/JP2012205123A/en not_active Withdrawn
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014099940A1 (en) * | 2012-12-17 | 2014-06-26 | Microsoft Corporation | Correlation based filter adaptation |
US9143862B2 (en) | 2012-12-17 | 2015-09-22 | Microsoft Corporation | Correlation based filter adaptation |
JP2016048847A (en) * | 2014-08-27 | 2016-04-07 | 沖電気工業株式会社 | Stereo echo suppression device, echo suppression device, stereo echo suppression method, and stereo echo suppression program |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5384721B2 (en) | Acoustic echo suppression unit and conference front end | |
JP3676825B2 (en) | Multi-channel acoustic echo canceling method and multi-channel acoustic echo canceling apparatus | |
Gilloire et al. | Using auditory properties to improve the behaviour of stereophonic acoustic echo cancellers | |
JP3405512B2 (en) | Acoustic echo cancellation method and system | |
JP4644715B2 (en) | Audio system and method for acoustic echo cancellation | |
US9313573B2 (en) | Method and device for microphone selection | |
KR20120128542A (en) | Method and apparatus for processing multi-channel de-correlation for cancelling multi-channel acoustic echo | |
AU2017405291B2 (en) | Method and apparatus for processing speech signal adaptive to noise environment | |
WO2011105006A1 (en) | Communication terminal and communication method | |
JP5906312B2 (en) | Method and apparatus for decomposing stereo recordings using frequency domain processing using a spectral weight generator | |
CN1902901A (en) | System and method for enhanced subjective stereo audio | |
KR101926209B1 (en) | Processing stereophonic audio signals | |
CN106448691A (en) | Speech enhancement method used for loudspeaking communication system | |
EP1515307B1 (en) | Method and apparatus for audio coding with noise suppression | |
KR102112018B1 (en) | Apparatus and method for cancelling acoustic echo in teleconference system | |
JP5668923B2 (en) | Signal analysis control system and method, signal control apparatus and method, and program | |
JP5960128B2 (en) | Telephone | |
CN112929506B (en) | Audio signal processing method and device, computer storage medium and electronic equipment | |
KR101833380B1 (en) | Concept for generating a downmix signal | |
JP2012205123A (en) | Acoustic echo canceller | |
EP2779161B1 (en) | Spectral and spatial modification of noise captured during teleconferencing | |
JP5359744B2 (en) | Sound processing apparatus and program | |
JPS62239631A (en) | Stereo sound transmission storage system | |
JP3207281B2 (en) | Stereo speech encoding / decoding system, stereo speech decoding device, and single speech / multiple simultaneous speech discrimination device | |
JP2007151038A (en) | Sound processing apparatus |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Withdrawal of application because of no request for examination |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20140603 |