RU2485607C2 - Apparatus and method for computing filter coefficients for echo suppression - Google Patents
Apparatus and method for computing filter coefficients for echo suppression Download PDFInfo
- Publication number
- RU2485607C2 RU2485607C2 RU2010132161A RU2010132161A RU2485607C2 RU 2485607 C2 RU2485607 C2 RU 2485607C2 RU 2010132161 A RU2010132161 A RU 2010132161A RU 2010132161 A RU2010132161 A RU 2010132161A RU 2485607 C2 RU2485607 C2 RU 2485607C2
- Authority
- RU
- Russia
- Prior art keywords
- signal
- echo
- filter
- stationary
- component
- Prior art date
Links
- 238000002592 echocardiography Methods 0.000 title claims abstract description 298
- 230000001629 suppression Effects 0.000 title abstract description 26
- 230000003044 adaptive Effects 0.000 claims abstract description 53
- 238000005516 engineering process Methods 0.000 claims abstract 2
- 238000001228 spectrum Methods 0.000 claims description 74
- 238000004458 analytical method Methods 0.000 claims description 63
- 230000003595 spectral Effects 0.000 claims description 41
- 238000002834 transmittance Methods 0.000 claims description 33
- 238000001914 filtration Methods 0.000 claims description 31
- 238000004364 calculation method Methods 0.000 claims description 10
- 230000005540 biological transmission Effects 0.000 claims description 7
- 230000001702 transmitter Effects 0.000 claims description 7
- 239000000284 extract Substances 0.000 claims 1
- 239000000203 mixture Substances 0.000 claims 1
- 230000000694 effects Effects 0.000 abstract description 15
- 239000000126 substance Substances 0.000 abstract 1
- 230000000875 corresponding Effects 0.000 description 48
- 238000010586 diagram Methods 0.000 description 24
- 238000004891 communication Methods 0.000 description 12
- 238000000034 method Methods 0.000 description 12
- 238000009499 grossing Methods 0.000 description 10
- 238000000926 separation method Methods 0.000 description 9
- 238000005070 sampling Methods 0.000 description 8
- 230000003111 delayed Effects 0.000 description 7
- 238000004422 calculation algorithm Methods 0.000 description 6
- 230000004048 modification Effects 0.000 description 6
- 238000006011 modification reaction Methods 0.000 description 6
- 238000011045 prefiltration Methods 0.000 description 6
- 230000018109 developmental process Effects 0.000 description 5
- 230000004044 response Effects 0.000 description 5
- 238000003379 elimination reaction Methods 0.000 description 4
- 238000011156 evaluation Methods 0.000 description 4
- 230000002452 interceptive Effects 0.000 description 4
- 230000000051 modifying Effects 0.000 description 4
- 230000003321 amplification Effects 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 3
- 238000005755 formation reaction Methods 0.000 description 3
- 238000003199 nucleic acid amplification method Methods 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 206010001488 Aggression Diseases 0.000 description 2
- 241001417495 Serranidae Species 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 230000002596 correlated Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 229920002574 CR-39 Polymers 0.000 description 1
- 210000000538 Tail Anatomy 0.000 description 1
- 230000000903 blocking Effects 0.000 description 1
- 230000003139 buffering Effects 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000001419 dependent Effects 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 230000002708 enhancing Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 230000004301 light adaptation Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000003071 parasitic Effects 0.000 description 1
- 230000035479 physiological effects, processes and functions Effects 0.000 description 1
Images
Abstract
Description
Конструктивные решения предлагаемого изобретения относятся к устройству и способам расчета коэффициентов пропускания адаптивного фильтра, предназначенного для подавления эха микрофонного сигнала, возбуждаемого сигналом громкоговорителя, и могут быть применены, например, в системах конференцсвязи. К системам конференцсвязи здесь отнесены телефонные, видео- и другие разновидности сетей интерактивной дуплексной связи.The constructive solutions of the present invention relate to a device and methods for calculating the transmittance of an adaptive filter designed to suppress the echo of a microphone signal excited by a loudspeaker signal, and can be applied, for example, in conference communication systems. Conferencing systems here include telephone, video and other types of interactive duplex networks.
Акустическое эхо возникает, когда тональные сигналы, звуки и шумы от громкоговорителя улавливаются микрофоном, установленным в том же помещении или в той же акустической среде. В телекоммуникационных сетях такой акустический сигнал возвращается абоненту на дальнем конце линии в виде его собственной речи, звучащей с запозданием. В подобных ситуациях отраженные сигналы являются отвлекающим и раздражающим фактором и могут быть причиной нарушения полноценной интерактивной дуплексной связи. Кроме того, акустическое эхо может генерировать паразитный гул и другие проявления нестабильных состояний акустического контура обратной связи.An acoustic echo occurs when tones, sounds and noise from a speaker are picked up by a microphone installed in the same room or in the same acoustic environment. In telecommunication networks, such an acoustic signal is returned to the subscriber at the far end of the line in the form of his own speech, sounding belatedly. In such situations, the reflected signals are distracting and annoying and can cause a violation of the full interactive duplex communication. In addition, an acoustic echo can generate a parasitic hum and other manifestations of unstable states of the acoustic feedback loop.
В публикации WO 2006/111370 А1 авторы описывают устройство и способ устранения эха многоканального аудиосигнала. Контроль над акустическим эхо-сигналом и подавление помех является существенной частью любой управляемой „без рук" сети дальней связи, например, системы телефонной или аудио- и видеоконференции. Описанный в издании способ обработки многоканальных звуковых сигналов громкоговорителя и, по меньшей мере, одного микрофонного сигнала включает в себя операции преобразования входного сигнала микрофона в его крактовременные спектры, расчета на основе сигналов громкоговорителя кратковременного спектра комбинированного сигнала громкоговорителя, расчета на основе входного сигнала микрофона кратковременного спектра комбинированного сигнала микрофона, оценки спектра амплитуды или спектра мощности эхо-сигнала в комбинированном кратковременном спектре сигнала микрофона, расчета фильтра усиления для коррекции амплитуды кратковременного спектра входного сигнала микрофона, применения фильтра усиления, по крайней мере, к одному спектру входного сигнала микрофона и преобразования отфильтрованного входного спектра микрофона во временную область.In WO 2006/111370 A1, the authors describe a device and method for eliminating the echo of a multi-channel audio signal. Control of the acoustic echo signal and suppression of interference is an essential part of any “hands-free” long-distance communications network, for example, telephone or audio and video conferencing systems. The method described in the publication for processing multichannel audio signals from a speaker and at least one microphone signal includes the operations of converting the microphone input signal into its short-term spectra, calculating, based on the loudspeaker signals, the short-term spectrum of the combined loudspeaker signal by calculating, based on the microphone input signal, the short-term spectrum of the combined microphone signal, estimating the amplitude spectrum or the power spectrum of the echo signal in the combined short-term spectrum of the microphone signal, calculating the gain filter to correct the amplitude of the short-term spectrum of the microphone input signal, applying at least to one spectrum of the microphone input signal and converting the filtered microphone input spectrum to the time domain.
Применяемые сегодня системы эхоподавления и эхокомпенсации, называемые также системами устранения эха, часто бывают неэффективными для многих видовThe echo cancellation and echo cancellation systems used today, also called echo cancellation systems, are often ineffective for many types of
звуков, тонов и шумов, несмотря на используемые в них адаптивные фильтры. Например, в коммуникационной системе преобладание одного элемента над другим может привести к неоптимальной компенсации эхо-сигнала громкоговорителя в составе сигнала микрофона. С другой стороны, в случае искажений при совмещении компонент из разных источников вследствие использования средств подавления или компенсации эха могут возникать тональные артефакты, которые также воспринимаются как крайне раздражающий фактор.sounds, tones and noise, despite the adaptive filters used in them. For example, in a communication system, the predominance of one element over another may lead to non-optimal compensation of the loudspeaker echo in the microphone signal. On the other hand, in the case of distortions when combining components from different sources due to the use of means of suppressing or compensating for the echo, tonal artifacts can occur, which are also perceived as an extremely annoying factor.
Таким образом, на базе известного уровня техники в настоящем изобретении ставится задача улучшить качество звука в системах подавления или компенсации эхо-сигнала.Thus, based on the prior art, the present invention seeks to improve the sound quality in echo cancellation or compensation systems.
Эта задача решается с использованием устройства по пункту 1, способа по п.23, 25 или программы по п.26 патентной формулы.This problem is solved using the device according to
В техническом исполнении вычислитель коэффициентов пропускания адаптивного фильтра сигнала микрофона, предназначенного для подавления эха, возбуждаемого сигналом громкоговорителя, включает в себя экстрактор стационарной или нестационарной составляющей сигнала громкоговорителя или производной сигнала громкоговорителя. Кроме того, в конструкцию включен вычислитель коэффициентов пропускания адаптивного фильтра на базе экстрагированных стационарных или нестационарных компонент сигнала.In a technical embodiment, the transmitter of the transmittance of an adaptive filter of a microphone signal designed to suppress the echo excited by a speaker signal includes an extractor of the stationary or non-stationary component of the speaker signal or derivative of the speaker signal. In addition, the transmitter includes an adaptive filter transmittance calculator based on extracted stationary or non-stationary signal components.
При данной конфигурации осуществление способа расчета коэффициентов пропускания адаптивного фильтра микрофонного сигнала для подавления эха, возбуждаемого сигналом громкоговорителя, состоит в выборе стационарной или нестационарной составляющей сигнала громкоговорителя или производной сигнала громкоговорителя и вычислении коэффициентов пропускания адаптивного фильтра на основе селектированной стационарной или нестационарной компоненты сигнала.With this configuration, the implementation of the method for calculating the transmittance of the adaptive filter of the microphone signal to suppress the echo excited by the speaker signal consists in selecting the stationary or non-stationary component of the speaker signal or derivative of the speaker signal and calculating the transmittance of the adaptive filter based on the selected stationary or non-stationary signal component.
Реализация предлагаемого изобретения основана на заключении, что улучшение качества звука может быть достигнуто за счет улучшения статистических свойств сигнала громкоговорителя или производной сигнала громкоговорителя, анализ которых выполняется при вычислении коэффициентов адаптивной фильтрации для подавления эха. С этой целью сигнал громкоговорителя или производную от сигнала громкоговорителя анализируют для выделения одной или нескольких соответствующих стационарных и/или нестационарных составляющих сигнала. Затем, на базе выявленной стационарной или нестационарной компоненты сигнала выполняют расчет коэффициентов пропускания адаптивного фильтра.The implementation of the invention is based on the conclusion that an improvement in sound quality can be achieved by improving the statistical properties of the speaker signal or a derivative of the speaker signal, the analysis of which is performed when calculating the adaptive filtering coefficients to suppress the echo. To this end, the loudspeaker signal or derivative of the loudspeaker signal is analyzed to extract one or more corresponding stationary and / or non-stationary signal components. Then, based on the identified stationary or non-stationary signal components, the transmission coefficients of the adaptive filter are calculated.
Стационарная компонента сигнала или производной сигнала, например громкоговорителя, может отображать, скажем, в частотной области, значение энергии, которое только незначительно изменяется во времени, или может образовывать соответствующую стационарную составляющую. Таким образом, стационарная составляющая подобного сигнала может быть определена, например, в частотной области при одновременном определении энергопоказателя для соответствующего полосового сигнала и усреднении во времени. Усреднение может быть плавающим и выполняться с различными расчетными характеристиками. Такое вычисление может быть выполнено рекурсивно с использованием конструкции типа фильтра с БИХ (БИХ = бесконечная импульсная характеристика). Аналогично, соответствующее усреднение может быть выполнено с использованием конструкции типа фильтра с КИХ (КИХ = конечная импульсная характеристика).The stationary component of a signal or derivative of a signal, such as a loudspeaker, can display, say, in the frequency domain, an energy value that only changes slightly over time, or can form a corresponding stationary component. Thus, the stationary component of such a signal can be determined, for example, in the frequency domain while simultaneously determining the energy index for the corresponding band signal and averaging over time. Averaging can be floating and performed with different design characteristics. Such a calculation can be performed recursively using a filter type construction with IIR (IIR = infinite impulse response). Similarly, appropriate averaging can be performed using a FIR type filter design (FIR = finite impulse response).
Следовательно, нестационарная компонента сигнала или производного сигнала громкоговорителя может быть определена на базе соответствующего полосового сигнала. В реализациях настоящего изобретения соотносимая нестационарная компонента может быть определена с помощью стационарной компоненты сигнала и фильтра усиления. Фильтр усиления может зависеть, по меньшей мере, от одного управляющего параметра, который при осуществлении настоящего изобретения определяют, например, на базе функции когерентности, которая учитывает сигнал громкоговорителя и сигнал микрофона или сигналы, производные от них.Therefore, the non-stationary component of the signal or derivative of the speaker signal can be determined based on the corresponding band signal. In implementations of the present invention, the associated non-stationary component can be determined using the stationary signal component and a gain filter. The gain filter may depend on at least one control parameter, which in the implementation of the present invention is determined, for example, on the basis of the coherence function, which takes into account the loudspeaker signal and the microphone signal or signals derived from them.
Согласно данному изобретению коэффициенты пропускания первого фильтра вычисляют, исходя из стационарной составляющей сигнала, коэффициенты пропускания второго фильтра, на базе которых в итоге определяются коэффициенты пропускания для адаптивного фильтра, вычисляют, исходя из нестационарной компоненты. При этом коэффициенты пропускания адаптивного фильтра могут соответствовать последовательному соединению первого фильтра, который базируется на коэффициентах пропускания первого фильтра, со вторым фильтром, который базируется на коэффициентах пропускания второго фильтра. Реализация данного изобретения позволяет также определять коэффициенты фильтрации как на основе коэффициентов пропускания первого фильтра, так и на основе коэффициентов пропускания второго фильтра.According to this invention, the transmittance of the first filter is calculated based on the stationary component of the signal, the transmittance of the second filter, based on which the transmittance for the adaptive filter is determined, is calculated based on the non-stationary component. In this case, the transmittance of the adaptive filter may correspond to the serial connection of the first filter, which is based on the transmittance of the first filter, with the second filter, which is based on the transmittance of the second filter. The implementation of this invention also allows you to determine the filter coefficients both on the basis of the transmittance of the first filter, and on the basis of the transmittance of the second filter.
Далее будут описаны варианты конструктивных решений и функциональные возможности предлагаемого изобретения. В зависимости от версии исполнения как стационарные, так и нестационарные составляющие могут оцениваться, исходя из соответствующих сигналов. Далее, конструкция, реализуемая в соответствии с настоящим изобретением, может включать в себя устройство фильтрации шумов микрофонного сигнала, выполненное на основе коэффициентов фильтрации.Next will be described options for structural solutions and functionality of the invention. Depending on the version of execution, both stationary and non-stationary components can be estimated based on the corresponding signals. Further, the structure implemented in accordance with the present invention may include a microphone noise filtering device based on filter coefficients.
Варианты осуществления предлагаемого изобретения будут более подробно рассмотрены и графически проиллюстрированы ниже. Таким образом, более предметным обсуждение настоящего изобретения будет в сопровождении следующих фигур:Embodiments of the invention will be discussed in more detail and graphically illustrated below. Thus, a more substantive discussion of the present invention will be accompanied by the following figures:
на фиг.1 показана типичная ситуация, при которой требуется устранение акустического эха;figure 1 shows a typical situation in which the elimination of acoustic echo is required;
на фиг.2 дана принципиальная блочная схема вычислителя коэффициентов фильтрации согласно подходу настоящего изобретения;figure 2 is a schematic block diagram of a calculator of filter coefficients according to the approach of the present invention;
на фиг. с 3A по 3С даны принципиальные блочные схемы вариантов экстрактора согласно подходу настоящего изобретения;in FIG. 3A to 3C are schematic block diagrams of extractor options according to the approach of the present invention;
на фиг.4А и 4B даны принципиальные блочные схемы дополнительного фильтра предварительного анализа эхо-сигнала согласно подходу настоящего изобретения;on figa and 4B are schematic block diagrams of an additional filter preliminary analysis of the echo signal according to the approach of the present invention;
на фиг. с 5А по 5Е даны принципиальные блочные схемы вариантов вычислителя в реализациях настоящего изобретения;in FIG. 5A to 5E are schematic block diagrams of embodiments of a calculator in implementations of the present invention;
на фиг.6 дана принципиальная блочная схема модификации предлагаемого изобретения;Fig.6 is a schematic block diagram of a modification of the invention;
на фиг.7 дана принципиальная блочная схема осуществления изобретения в конфигурации вычислителя коэффициентов фильтрации;Fig.7 is a schematic block diagram of an embodiment of the invention in a configuration of a filter coefficient calculator;
фиг. с 8а по 8с графически отображают разделение стационарной и нестационарной компонент сигнала громкоговорителя;FIG. 8a to 8c graphically show the separation of the stationary and non-stationary components of the speaker signal;
на фиг.9а графически отображает функцию фильтра эхоподавления для нестационарной компоненты сигнала на частоте 1 кГц;on figa graphically displays the function of the echo cancellation filter for non-stationary components of the signal at a frequency of 1 kHz;
на фиг.9b графически отображает функцию коррелирующего фильтра эхоподавления для нестационарной компоненты этого сигнала;Fig. 9b graphically displays the function of a correlation echo cancellation filter for the non-stationary component of this signal;
на фиг. с 10а по 10с показано соотношение уровней стационарной и нестационарной составляющих, усиления предсказания и речевой активности канала громкоговорителя;in FIG. 10a to 10c show the ratio of the levels of the stationary and non-stationary components, amplification of the prediction and speech activity of the loudspeaker channel;
на фиг.11 дана принципиальная блочная схема варианта реализации предлагаемого изобретения;figure 11 is a schematic block diagram of an embodiment of the invention;
на фиг.12 дана принципиальная блочная схема варианта реализации предлагаемого изобретения;Fig.12 is a schematic block diagram of an embodiment of the invention;
на фиг.13 представлена принципиальная блочная схема многоканального решения данного изобретения;on Fig presents a schematic block diagram of a multi-channel solution of the present invention;
на фиг.14 приведен пример группирования спектра равномерного кратковременного преобразования Фурье для моделирования неравномерного частотного разрешения слуха человека;on Fig shows an example of grouping the spectrum of a uniform short-term Fourier transform for modeling uneven frequency resolution of human hearing;
на фиг.15а показан график применения интерполирующих фильтров Ханна для частотного сглаживания фильтра усиления;on figa shows a graph of the use of Hannah interpolating filters for frequency smoothing of the gain filter;
на фиг.15b показана кривая интерполяции коэффициентов фильтра усиления.15b shows an interpolation curve of the gain filter coefficients.
В начале подробного описания на базе фигур со 2 по 15 вариантов реализации настоящего изобретения, решающих задачу подавления акустического эха за счет разделения стационарных и нестационарных составляющих сигнала, на фиг.1 проиллюстрирована типичная ситуация, в которой требуется устранение акустического эха.At the beginning of the detailed description based on figures 2 through 15 of the embodiments of the present invention that solve the problem of suppressing acoustic echo by separating the stationary and non-stationary components of the signal, figure 1 illustrates a typical situation in which the elimination of acoustic echo is required.
На чертежах приняты следующие обозначения:In the drawings, the following notation:
100 громкоговоритель;100 loudspeaker;
110 микрофон;110 microphone;
120 акустическая среда;120 acoustic environment;
130 сигнал громкоговорителя;130 speaker signal;
140 сигнал микрофона;140 microphone signal;
150 блок устранения эха;150 block elimination of the echo;
160 сигнал с блокированным эхом;160 signal with blocked echo;
170 прямой путь;170 direct way;
180 непрямой путь;180 indirect way;
200 устройство (расчета коэффициентов фильтрации);200 device (calculation of filtration coefficients);
210 адаптивный фильтр;210 adaptive filter;
220 вход;220 entrance;
230 времячастотный преобразователь (ВЧП);230 time-frequency converter (VChP);
240 фильтр предварительного анализа эхо-сигнала;240 filter preliminary analysis of the echo signal;
250 экстрактор;250 extractor;
260 фильтр предварительного анализа эхо-сигнала;260 filter preliminary analysis of the echo signal;
270 вычислитель;270 calculator;
280 вход;280 entrance;
290 времячастотный преобразователь (ВЧП);290 time-frequency converter (VCHP);
300 частотно-временной преобразователь (ЧВП);300 time-frequency converter (CVP);
310 выход;310 exit;
320 усреднитель;320 averager;
330 фильтр усиления;330 gain filter;
340 вычислитель параметров;340 parameter calculator;
350 распределитель;350 dispenser;
360 звено фильтра;360 filter link;
370 вычислитель параметров фильтрации;370 filter parameters calculator;
380 комбинатор;380 combinator;
390 селектор;390 selector;
400 определитель параметров;400 parameter identifier;
410 распределитель;410 dispenser;
420 кривая графика;420 curve graphics;
430 кривая графика;430 curve graphics;
440 фигурная скобка;440 brace;
450 фигурная скобка;450 braces;
460 стрелка;460 arrows;
470 фильтр предварительного анализа эхо-сигнала;470 filter preliminary analysis of the echo signal;
480 устройство задержки;480 delay device;
490 вычислитель величины энергии;490 energy calculator;
500 вычислитель величины энергии;500 energy calculator;
510 вычислитель величины энергии;510 energy magnitude calculator;
520 дополнительный вычислитель;520 additional computer;
530 группиратор;530 grouping machine;
540 дополнительный группиратор.540 additional grouping device.
Акустическое эхо возникает, когда микрофон улавливает тоны, звуки или шумы, исходящие от громкоговорителя, расположенного в том же помещении или в той же акустической среде. В телекоммуникационных системах акустические сигналы обратной связи ретранслируются собеседнику на дальнем конце линии, который воспринимает их как эхо собственной речи. В подобной ситуации эхо-сигналы могут быть сильным отвлекающим фактором и даже нарушать ход интерактивной полнодуплексной связи. Кроме того, акустическое эхо может генерировать паразитный свист и другие нестабильные состояния акустического контура обратной связи. Естественно, что системы дистанционной связи с управлением без использования рук, обеспечивающие полноценную двухстороннюю коммуникацию, требуют контроля за эхо-сигналом для устранения взаимодействия между громкоговорителем и микрофоном. Фиг.1 иллюстрирует ситуацию возникновения акустического эха.An acoustic echo occurs when a microphone picks up tones, sounds, or noise coming from a speaker located in the same room or in the same acoustic environment. In telecommunication systems, acoustic feedback signals are relayed to the interlocutor at the far end of the line, who perceives them as an echo of their own speech. In such a situation, echoes can be a strong distraction and even disrupt interactive full-duplex communication. In addition, the acoustic echo can generate spurious whistles and other unstable states of the acoustic feedback loop. Naturally, hands-free remote control systems that provide full two-way communication require echo control to eliminate the interaction between the speaker and the microphone. Figure 1 illustrates the situation of the occurrence of acoustic echo.
На фиг.1 показаны громкоговоритель 100 и микрофон 110, расположенные в одной акустической среде 120, которая может, например, сформироваться в помещении. Аналогично акустическая среда 120 может быть образована внутренним объемом салона автомобиля.1 shows a
На фиг.1 сигнал громкоговорителя 130, или x[n], где временной показатель n - целое число, поступает на громкоговоритель 100. Микрофон 110 ловит шумы, звуки и тональные сигналы общего звукового окружения 120 и генерирует микрофонный сигнал 140 или y[n]. Согласно фиг.1 сигнал громкоговорителя 130 и сигнал микрофона 140 в виде входных сигналов поступают в эхокомпенсатор 150, который на выходе формирует из микрофонного сигнала 140 очищенный от эха сигнал 160, или e[n].In figure 1, the signal of the speaker 130, or x [n], where the time indicator n is an integer, is fed to the
Таким образом, фиг.1 иллюстрирует проблему возникновения и борьбы с акустическим эхом в системах двухсторонней связи. Сигнал с дальнего конца телекоммуникационной линии, преобразованный громкоговорителем в звук, поступает в микрофон прямым путем 170 и по отраженным траекториям 180-1, 180-2, которые называют также косвенными каналами. Вследствие этого микрофон 110 воспринимает не только голос, звучащий локально на передающем конце линии, но улавливает также и эхо, которое сразу же ретранслируется обратно на принимающий конец линии.Thus, FIG. 1 illustrates the problem of the occurrence and control of acoustic echo in two-way communication systems. The signal from the far end of the telecommunication line, converted by the loudspeaker into sound, enters the microphone directly through 170 and along the reflected paths 180-1, 180-2, which are also called indirect channels. As a result, the
Иначе говоря, сигнал громкоговорителя x[n] вновь смешивается с сигналом микрофона y[n]. В идеале, с помощью блока эхокомпенсации 150 такое эхо должно быть полностью устранено, в то время как исходящий голосовой сигнал на ближнем конце телекоммуникационной системы должен быть пропущен.In other words, the speaker signal x [n] is again mixed with the microphone signal y [n]. Ideally, using the echo cancellation unit 150, such an echo should be completely eliminated, while the outgoing voice signal at the near end of the telecommunication system should be skipped.
Стандартным способом борьбы с отраженным сигналом является параллельное включение в канал распространения эхо-сигнала акустического эхоподавителя (АЭП), как описано в [1]. Такой акустический эхоподавитель анализирует цифровую реплику эхо-сигнала, вычитая ее впоследствии из измеренного или фактического микрофонного сигнала. Стандартные подходы к проблеме удаления акустического эха базируются на заключении, что прохождение эхо-сигнала может быть смоделировано с помощью фильтра с КИХ (с конечной импульсной характеристикой), после чего применяются соответствующие подавители акустического эха, что также описано в [С.Breining, P.Dreiseitel, E.Hänsler, A.Mader, В.Nitsch, H.Puder, Т.Schertler, G.Schmidt, and J. Tilp. Acoustic echo control. IEEE Signal Processing Magazine, 16(4): 42-69, July 1999]. В силу того, что путь формирования эха, как правило, неизвестен и, более того, может изменяться в ходе рабочего процесса, линейный фильтр такого акустического эхозаградителя обычно реализуется как адаптивный. Для моделирования типичных путей формирования эха применяются КИХ-фильтры с длительностью, не превышающей несколько сотен миллисекунд, что соответствует частоте дискретизации, что, в свою очередь, предполагает высокий уровень вычислительной сложности.The standard way to combat the reflected signal is the parallel inclusion of an acoustic echo canceller (AED) into the echo propagation channel, as described in [1]. Such an acoustic echo canceller analyzes a digital replica of the echo signal, subtracting it subsequently from the measured or actual microphone signal. Standard approaches to the problem of acoustic echo removal are based on the conclusion that the passage of the echo signal can be modeled using a FIR filter (with a finite impulse response), after which the corresponding acoustic echo cancellers are used, which is also described in [C. Breining, P. Dreiseitel, E. Hänsler, A. Mader, B. Nitsch, H. Puder, T. Schertler, G. Schmidt, and J. Tilp. Acoustic echo control. IEEE Signal Processing Magazine, 16 (4): 42-69, July 1999]. Due to the fact that the path of echo formation is usually unknown and, moreover, may change during the working process, the linear filter of such an acoustic echo suppressor is usually implemented as adaptive. FIR filters with a duration not exceeding several hundred milliseconds, which corresponds to a sampling frequency, which, in turn, assumes a high level of computational complexity, are used to simulate typical echo formation paths.
Уровни затухания эха, достигаемые при практическом использовании традиционных подходов, по различным причинам часто бывают недостаточными. Такими причинами могут быть, в частности, слишком продолжительная реверберация (эффект хвоста эха), которая приводит к погрешностям моделирования путей прохождения эхо-сигнала, нелинейные составляющие эхо-сигнала, вызванные, например, вибрациями или нелинейными отклонениями в недорогом аудиооборудовании, и конвергенция в случае высокой нестабильности каналов прохождения эха, что рассмотрено в [А.N.Birkett and R.A.Goubran. Limitations of handsfree acoustic echo cancellers due to nonlinear loudspeaker distortion and enclosure vibration effects. In Proc. IEEE Workshop on Applications of Signal Processing to Audio and Acoustics, p.13 - 16, New Paltz, Oct. 1995]. Поэтому для ликвидации остаточного эха и его составляющих, которые не были устранены с помощью компенсатора акустического эха, эхокомпенсаторы комбинируют с нелинейными постпроцессорами, как описано в [G.Schmidt and E.Hänsler. Acoustic echo and noise control: a practical approach. Hoboken: Wiley, 2004]. В большинстве случаев остаточное эхо гасят частотно-избирательным способом, как описывается в [W.L.В.Jeannes, P.Scalart, G.Faucon, and С.Beaugeant. Combined noise and echo reduction in hands-free systems: a survey. IEEE Transactions on Speech and Audio Processing, 9(8): 808-820, Nov. 2001]. Фактически, все акустические эхокомпенсаторы дооснащают постпроцессорами, поскольку слишком часто они не глушат эхо полностью, чтобы его не было слышно.The echo attenuation levels achieved with the practical use of traditional approaches are often insufficient for various reasons. Such reasons may be, in particular, too long reverberation (echo tail effect), which leads to errors in modeling the paths of the echo signal, nonlinear components of the echo signal, caused, for example, by vibrations or nonlinear deviations in inexpensive audio equipment, and convergence in the case of the high instability of the echo paths, as discussed in [A.N. Birkett and RAGoubran. Limitations of handsfree acoustic echo cancellers due to nonlinear loudspeaker distortion and enclosure vibration effects. In Proc. IEEE Workshop on Applications of Signal Processing to Audio and Acoustics, p.13 - 16, New Paltz, Oct. 1995]. Therefore, to eliminate the residual echo and its components, which were not eliminated using the acoustic echo canceller, echo cancellers are combined with non-linear post-processors, as described in [G. Schmidt and E. Hänsler. Acoustic echo and noise control: a practical approach. Hoboken: Wiley, 2004]. In most cases, the residual echo is quenched by a frequency-selective method, as described in [W.L. B. Jeannes, P. Scalart, G. Faucon, and C. Beaugeant. Combined noise and echo reduction in hands-free systems: a survey. IEEE Transactions on Speech and Audio Processing, 9 (8): 808-820, Nov. 2001]. In fact, all acoustic echo cancellers are equipped with postprocessors, because too often they do not completely suppress the echo so that it cannot be heard.
Недавно в [С.Faller and J.Chen. Suppressing acoustic echo in a sampled auditory envelope space. IEEE Trans. on Speech and Audio Proc., 13(5): 1.048-1.062, Sept. 20055, и С.Faller and С.Toumery. Estimating the delay and coloration effect of the acoustic echo path for low complexity echo suppression. In Proc. Intl. Works, on Acoust. Echo and Noise Control (IWAENC), Sept. 2005] было предложено несколько устройств подавления акустических эхо-сигналов в подполосовой области, которые сходны с вышеупомянутыми нелинейными постпроцессорами, но не нуждаются в компенсаторе акустического эха и в оценке импульсной характеристики траектории эха. В публикациях сообщается, что эти системы характеризуются низкой вычислительной сложностью, надежностью и высокими дуплексными характеристиками.Recently in [C. Faller and J. Chen. Suppressing acoustic echo in a sampled auditory envelope space. IEEE Trans. on Speech and Audio Proc., 13 (5): 1.048-1.062, Sept. 20055, and C. Faller and C. Toumery. Estimating the delay and coloration effect of the acoustic echo path for low complexity echo suppression. In Proc. Intl. Works, on Acoust. Echo and Noise Control (IWAENC), Sept. 2005], several sub-band acoustic echo cancellation devices have been proposed that are similar to the aforementioned non-linear post-processors, but do not need an acoustic echo canceller and an assessment of the impulse response of the echo path. It is reported in publications that these systems are characterized by low computational complexity, reliability, and high duplex characteristics.
В разработке [С.Faller and С.Toumery. Estimating the delay and coloration effect of the acoustic echo path for low complexity echo suppression. In Proc. Intl. Works, on Acoust. Echo and Noise Control (IWAENC), Sept. 2005] устройства подавления акустического эха для вычисления спектров сигналов громкоговорителя и микрофона предлагается алгоритм с использованием оконного (кратковременного) преобразования Фурье (ОПФ). К соответствующему сигналу громкоговорителя применяют величину задержки d между двумя сигналами, преобразованными с помощью ОПФ, которую выбирают учитывая наибольшее воздействие импульсной характеристики канала прохождения эха.In development [C. Faller and C. Toumery. Estimating the delay and coloration effect of the acoustic echo path for low complexity echo suppression. In Proc. Intl. Works, on Acoust. Echo and Noise Control (IWAENC), Sept. 2005] acoustic echo cancellation devices for calculating the spectra of the loudspeaker and microphone signals, an algorithm using the window (short-term) Fourier transform (OPF) is proposed. To the corresponding loudspeaker signal, the delay value d is applied between two signals converted using an OPF, which is selected taking into account the greatest effect of the impulse response of the echo channel.
Затем оценивают фильтр анализа действительного эхо-сигнала, который имитирует начальный путь прохождения эха. Для получения амплитудной спектральной характеристики эхо-сигнала к спектру сигнала громкоговорителя применяется расчетная величина задержки и фильтр предварительного анализа эхо-сигнала. С использованием полученной амплитудной спектральной характеристики эхо-сигнала рассчитывается действительный фильтр эхоподавления и применяется к спектру микрофонного сигнала для гашения эха.Then evaluate the filter analysis of the actual echo signal, which simulates the initial path of the echo. To obtain the amplitude spectral characteristic of the echo signal, a calculated delay value and a filter of preliminary analysis of the echo signal are applied to the spectrum of the loudspeaker signal. Using the obtained amplitude spectral characteristic of the echo signal, the actual echo cancellation filter is calculated and applied to the spectrum of the microphone signal for echo cancellation.
Недостаток вышеупомянутых систем подавления акустического эхо-сигнала состоит в том, что они не в полной мере выполняют свои функции в отношении смешанных сигналов громкоговорителя, содержащих как стационарные, так и нестационарные составляющие. Это может иметь место, например, когда речь на дальнем конце линии звучит в условиях высокого уровня шума. В такой ситуации сигнал громкоговорителя и эхо-сигнал содержат нестационарную составляющую в форме речи на дальнем конце и стационарную составляющую в виде шумового фона на том же дальнем конце линии связи.A disadvantage of the aforementioned acoustic echo cancellation systems is that they do not fully perform their functions with respect to mixed speaker signals containing both stationary and non-stationary components. This may be the case, for example, when speech at the far end of the line sounds in a high noise environment. In such a situation, the loudspeaker signal and the echo signal comprise a non-stationary component in the form of speech at the far end and a stationary component in the form of a noise background at the same far end of the communication line.
Действующие системы акустического эхоподавления задают только один эхогасящий фильтр для сигнала громкоговорителя. Отсюда следует, что в указанных подходах не учитывается, что компоненты эха с различными характеристиками возбуждают в сигналах передающего конца различные типы искажений, которые впоследствии требуют разных видов обработки.Existing acoustic echo cancellation systems define only one echo cancellation filter for the loudspeaker signal. It follows that these approaches do not take into account that echo components with different characteristics excite various types of distortions in the signals of the transmitting end, which subsequently require different types of processing.
На фиг.2 показан первый из вариантов реализации устройства 200 для расчета коэффициентов пропускания адаптивного фильтра 210, в котором, как и в сопутствующем способе, применено разделение стационарного и нестационарного сигналов для совершенствования эхоподавления и, следовательно, для улучшения качества воспринимаемого звука. Таким образом, технические решения по настоящему изобретению предполагают применение разнообразных методов компенсации сигналов в зависимости от их статистических свойств и особенностей, что обеспечивает более эффективное эхоподавление, в меньшей степени подверженное проявлению артефактов.Figure 2 shows the first embodiment of a
Подробное описание вариантов исполнения данного изобретения, представленных на фиг.3-5, предваряет рассмотрение принципиальной блочной схемы устройства 200. Здесь необходимо обратить внимание на то, что иллюстрации и описания принципиальных схем устройств, предлагаемых в изобретении, являются одновременно блок-схемами соответствующих способов. Иначе говоря, принципиальные блочные схемы рассматриваемых конструкций устройства соответствуют блок-схемам алгоритмов предлагаемого способа, где отображена последовательность операций, выполняемых компонентами оборудования.A detailed description of the embodiments of the present invention shown in FIGS. 3-5 is preceded by a consideration of the block diagram of the
При этом следует учитывать, что в рамках данного описания для устройств, блоков и схем, одинаковых или сходных по своим функциям, используются одинаковые или похожие номера ссылок. Одновременно, устройства, блоки и схемы, обозначенные совпадающими или похожими номерами ссылок, содержат идентичные или подобные структурные и функциональные характеристики. Другими словами, в предлагаемом описании одинаковые номера ссылок служат для обозначения устройств, блоков и схем, имеющих одинаковые или сходные функции, назначение или конструкцию. Это позволяет сжато изложить материалы представляемого изобретения, используя описание одного технического решения для пояснения другого варианта реализации, если однозначно не определено иное.It should be borne in mind that in the framework of this description, for devices, blocks and circuits, identical or similar in their functions, the same or similar reference numbers are used. At the same time, devices, blocks and circuits denoted by matching or similar reference numbers contain identical or similar structural and functional characteristics. In other words, in the proposed description, the same reference numbers are used to refer to devices, blocks and circuits having the same or similar functions, purpose or design. This allows you to succinctly present the materials of the present invention, using the description of one technical solution to explain another implementation option, unless clearly defined otherwise.
Кроме того, при описании изобретения для неоднократного обозначения устройств, блоков и схем на одной фигуре используются номера обобщающих ссылок. В частности, для двух непрямых траекторий 180-1, 180-2 на фиг.1 определены разные номера ссылок, но, если непрямые траектории упоминаются как таковые или если рассматриваются их общие отличительные свойства, применяется только номер обобщающей ссылки 180. Это также способствует краткости изложения и лучшему пониманию предлагаемого описания. Устройство 200 на фиг.2 имеет входной терминал 220 для ввода сигнала громкоговорителя, не показанного на фиг.2. Через входной терминал 220 сигнал вводится во времячастотный преобразователь 230, показанный на фиг.2 пунктиром как опция устройства 200. Из времячастотного преобразователя 230 сигнал может быть подан на первый фильтр анализа эхо-сигнала 240, который как опция тоже не обязателен в конструкции устройства 200. Выход фильтра предварительного анализа эхо-сигнала 240 соединен с входом 250а экстрактора 250, который, в свою очередь, через первый выход 250с и второй выход 250d может быть подключен к произвольно устанавливаемому второму фильтру предварительного анализа эхо-сигнала 260 через его первый вход 260а и второй вход 260b. Наличие этого фильтра преданализа эхо-сигнала также необязательно и зависит от конкретной реализации. Скажем, устройство 200, предлагаемое в настоящем изобретении, может быть конструктивно решено как с введением первого 240 и второго 260 фильтра предварительного анализа эхо-сигнала вместе или по отдельности, так и без любого из них или обоих. Безусловно, возможен вариант, где используется только один из двух фильтров предварительного анализа эхо-сигнала 240, 260. Осуществимы также технические решения с задействованием других элементов схемы.In addition, when describing the invention, the numbers of generalizing references are used to repeatedly denote devices, blocks and circuits in the same figure. In particular, for two indirect paths 180-1, 180-2 in FIG. 1, different reference numbers are defined, but if indirect paths are referred to as such or if their general distinguishing features are considered, only generalizing reference number 180 is applied. This also contributes to brevity presentation and better understanding of the proposed description. The
При наличии второго фильтра предварительного анализа эхо-сигнала 260 его первый выход 260с и второй выход 260d подсоединяются к первому входу 270а и второму входу 270b вычислителя 270 коэффициентов пропускания адаптивного фильтра 210. Вычислитель 270 через выход 270d соединен с входом адаптивного фильтра 210.With a second
На другой вход адаптивного фильтра 210 через дополнительный времячастотный преобразователь 290 от входного терминала 280 может подаваться сигнал микрофона. Выход адаптивного фильтра 210 может быть соединен через дополнительный частотно-временной преобразователь 300 с терминалом вывода микрофонного сигнала 310. Одновременно входной терминал 280 произвольно подключается через времячастотный преобразователь 290 к второму входу 250b экстрактора 250 и к третьему входу 270 с вычислителя 270. При этом оба ввода - 250b экстрактора 250 и 270с вычислителя 270 - играют роль вспомогательных и могут быть введены независимо друг от друга в различные аппаратные версии настоящего изобретения.A microphone signal may be provided to the other input of the
Например, устройство 200 может быть включено в блок устранения эха 150, показанный на фиг.1.For example, the
Перед более детальным рассмотрением функций устройства 200 в варианте на фиг.2 следует отметить, что, в целом, конструкция предлагаемого изобретения может быть решена на базе как дискретных, так и интегральных, или иных, более сложных, схем. В частности, данное изобретение может быть встроено в средства обработки данных, такие как процессоры, интегрированные системы (SOC = системы на кристалле), прикладные интегральные схемы (ASIC) или иные интегральные микросхемы и специализированные процессоры. В таких конфигурациях идентичные элементы контуров обработки данных могут задействоваться поочередно для различных устройств. Например, один и тот же логический вентиль арифметического логического устройства (АЛУ) микропроцессора может быть использован, во-первых, для управления экстрактором 250, и, во-вторых, вычислителем 270. Тем не менее, устройства могут значительно отличаться друг от друга, как, например, в вышеупомянутом случае они требуют разные управляющие команды, в совокупности определяющие каждое из устройств. В силу этого допустимо частичное или полное перекрывание элементов схемотехники, реализуемых в различных версиях устройств.Before a more detailed consideration of the functions of the
Во многом по этой причине здесь в описании сопряженные устройства, блоки и схемы понимаются как прямо или опосредованно взаимосвязанные. К примеру, если реализация базируется на средствах обработки данных, взаимодействие может осуществляться через ячейку памяти, содержащую промежуточный результат в форме защелкнутого в ней сигнала.Largely for this reason, here in the description, paired devices, blocks and circuits are understood as directly or indirectly interconnected. For example, if the implementation is based on data processing tools, interaction can be carried out through a memory cell containing an intermediate result in the form of a signal latched in it.
Более того, однако, конструктивные решения настоящего изобретения не ограничиваются цифровыми устройствами, хотя, в дальнейшем будут описываться преимущественно цифровые средства. Изобретение принципиально предусматривает возможность его аналогового и смешанного аналого-цифрового исполнения. В такие конфигурации дополнительно вводятся АЦП или ЦАП (аналого-цифровые или цифроаналоговые преобразователи) для трансформации одного вида сигналов в другой.Moreover, however, the constructive solutions of the present invention are not limited to digital devices, although mainly digital means will be described hereinafter. The invention basically provides for the possibility of its analog and mixed analog-to-digital performance. In such configurations, an ADC or DAC (analog-to-digital or digital-to-analog converters) is additionally introduced to transform one type of signal into another.
В зависимости от назначения устройства 200, изображенного на фиг.2, сигнал громкоговорителя, поступающий на вход 220, может быть преобразован в частотную область с помощью времячастотного преобразователя 230, который показан как опция. Времячастотный преобразователь 230 обеспечивает на выходе адекватное спектральное представление блоков данных (фреймов) из временной области. В зависимости от конкретной реализации изобретения в конфигурацию времячастотного преобразователя 230 могут быть введены преобразователь Фурье, подполосный преобразователь или КЗФ-преобразователь (на базе КЗФ = квадратурно-зеркального фильтра). Независимо от конкретного приложения времячастотный преобразователь 230 трансформирует принимаемый им сигнал (из временной области) в множество полосовых сигналов. Каждый полосовой сигнал имеет характеристическую частоту, которая может быть средней частотой, нижней частотой среза или верхней частотой среза соответствующей полосы. В зависимости от особенностей технического решения разные полосовые сигналы могут иметь больше одной характеристической частоты или характеризоваться другими параметрами.Depending on the purpose of the
Первый фильтр предварительного анализа эхо-сигнала 240 дает возможность модуляции акустической среды 120 (на фиг.1), которая обеспечила бы на его выходе сигнал, содержащий расчетную амплитудную спектральную характеристику, соответствующую сигналу, который будет сформирован наложением на сигнал микрофона сигнала громкоговорителя. Тем не менее, как уже пояснялось выше, первый фильтр предварительного анализа эхо-сигнала 240 является вспомогательным и не обязателен к монтажу.The first pre-analysis filter of the
Далее, сигнал громкоговорителя или сигнал, производный от него, полученный в результате преобразования и фильтрации соответствующими дополнительными инструментами 230 и 240, поступает на первый вход экстрактора 250. Экстрактор 250 селектирует из сигнала громкоговорителя или из его деривата стационарную и нестационарную компоненты. В частности, стационарная компонента может быть рассчитана через усреднение входного сигнала, что описано ниже.Further, the loudspeaker signal or a signal derived from it, obtained by converting and filtering with the corresponding
В зависимости от выбранного технического решения сигнал может представлять собой вычисленный сигнал, имеющий отклонения от „реальной" стационарной составляющей. Соответственно, нестационарная составляющая может быть определена из стационарной составляющей сигнала, например, при задействовании фильтра усиления, который не показан на фиг.2.Depending on the technical solution chosen, the signal may be a calculated signal deviating from the “real” stationary component. Accordingly, the non-stationary component can be determined from the stationary component of the signal, for example, by using a gain filter, which is not shown in FIG.
В других реализациях экстрактор 250 может использовать другой метод оценки устойчивости.In other implementations,
Нестационарная компонента также может быть определена, например, путем сравнения временного изменения во входном сигнале. Кроме того, в случае встраивания в конфигурацию или в среду устройства 200 голосового кодека можно прибегнуть к методу предсказания с использованием экстрактора 250 для экстракции, по меньшей мере, одного из двух упомянутых сигналов. Подобный метод предсказания может представить, например, сигнал ошибки кодека LPC (LPC = кодирование с линейным предсказанием).The non-stationary component can also be determined, for example, by comparing the temporal change in the input signal. In addition, if embedding a voice codec in the configuration or in the medium of the
Экстрактор 250 имеет два выхода, обозначенных выше, на которые в зависимости от требований могут подаваться различные сигналы. В частности, как правило, по меньшей мере, стационарная или нестационарная компонента поступает на первый выход экстрактора 250. На второй выход поступает вторая из двух компонент или сигнал, содержащий информацию о выходном сигнале на первом выходе. Это могут быть, предположительно, параметры дальнейшей обработки вычислителем 270 соответствующего сигнала, или это может быть простой управляющий сигнал, указывающий, какая из двух составляющих передается.The
По выполняемым функциям произвольный второй фильтр предварительного анализа эхо-сигнала 260, как правило, соответствует первому фильтру предварительного анализа эхо-сигнала 240. Обычно второй фильтр предварительного анализа эхо-сигнала 260, если он рассчитан на выполнение подобной оценки эха, может оценивать сигнал громкоговорителя на входном терминале 220, чтобы в результате получить сигнал, который соответствовал бы сигналу, воспринимаемому микрофоном при условии отсутствия других источников шума. Первый фильтр предварительного анализа эхо-сигнала 240, как и второй фильтр предварительного анализа эхо-сигнала 260, может факультативно включать в себя устройство задержки, учитывающее задержку эха громкоговорителя, улавливаемого микрофоном. Говоря иначе, фильтры 240, 260 могут быть применены также для задержки сигнала громкоговорителя, или производного от него, как с помощью дополнительно смонтированного устройства задержки, так и за счет внутренней схемотехники. В большинстве случаев разделение функций оценки эха, с одной стороны, и задержки, с другой, также возможно, если, например, первый фильтр предварительного анализа эхо-сигнала 240 будет использован только для задержки соответствующего сигнала, а второй фильтр предварительного анализа эхо-сигнала 260 - для анализа реального эха.According to the functions performed, an arbitrary second
Затем сигналы от второго фильтра предварительного анализа эха 260 поступают на вычислитель 270, который, в свою очередь, вычисляет или определяет коэффициенты пропускания адаптивного фильтра 210, исходя из экстрагированной стационарной или нестационарной компоненты. В зависимости от конкретного приложения вычислитель 270 может, кроме того, обращаться к сигналу микрофона, поступающему на входной терминал 280, или к микрофонным сигналам, преобразуемым в частотную область. Этот сигнал доступен также для экстрактора 250, о чем подробнее говорится ниже.Then the signals from the second filter of the preliminary analysis of the
Далее, адаптивный фильтр 210, получающий от вычислителя 270 коэффициенты фильтрации, корректирует спектр микрофонного сигнала с формированием на выходе, по меньшей мере, частично эхокомпенсированного варианта этого сигнала, который пересылается для последующей обработки. В зависимости от специфики технического исполнения микрофонный сигнал, прошедший эхокомпенсацию или описанную выше модификацию спектра, может быть реконвертирован во временную область с помощью частотно-временного преобразователя 300 или выведен напрямую на выходной терминал 310. Однако необходимости в обратном преобразовании во временную область с помощью преобразователя 300 может не быть, если, например, микрофонный сигнал закодирован в частотной или связанной с ней области.Further, the
Здесь, перед тем, как приступить к подробному рассмотрению в сопровождении фиг.3А-5Е элементов принципиальной схемы устройства 200 на фиг.2, следует обратить внимание на то, что преобразование сигнала громкоговорителя или его производного может большей частью выполняться в частотной области, причем обработке подлежат, соответственно, одиночный ассоциированный полосовой сигнал, совокупность полосовых сигналов, множество полосовых сигналов или все полосовые сигналы.Here, before proceeding to a detailed discussion, accompanied by FIGS. 3A-5E, of the circuit elements of the
Также следует отметить, что отдельные устройства и фильтры могут работать, например, используя энергопоказатели, что зависит от индивидуального конструктивного решения. Энергетический показатель представляет собой результат возведения действительной величины-основания в степень с четным показателем или результат возведения модуля (абсолютной величины) в степень с любым показателем. Например, обрабабываемые с помощью отдельных фильтров или отдельных устройств кратковременные спектры могут использовать энергопоказатели, в частности, - значения энергии, образованные как квадраты модулей соответствующих спектральных коэффициентов. Аналогично этому модульные спектры, то есть абсолютные величины соответствующих спектральных коэффициентов, могут быть использованы с показателем 1. Формулируя иначе, величины, пропорциональные SzSm, где m - положительное, скажем, натуральное, число, могут быть использованы в качестве энергетических показателей, начиная с любого значения z, являющегося действительной или комплексной величиной. При z, являющемся действительной величиной, величины, пропорциональные z2m, могут дополнительно использоваться как энергопоказатели.It should also be noted that individual devices and filters can work, for example, using energy indicators, which depends on the individual design solution. The energy indicator is the result of raising the actual value of the base to a power with an even indicator or the result of raising a module (absolute value) to a power with any indicator. For example, short-term spectra that are processed using separate filters or separate devices can use energy indicators, in particular, energy values formed as squares of modules of the corresponding spectral coefficients. Similarly, modular spectra, that is, the absolute values of the corresponding spectral coefficients, can be used with
На фиг.3A дана принципиальная схема экстрактора 250, реализованного в соответствии с настоящим изобретением как возможный компонент устройства 200. Экстрактор 250 имеет только один первый вход 250а, произвольно соединенный с выходом первого фильтра предварительного анализа эхо-сигнала 240, показанного на фиг.2 как опция. Экстрактор 250 на фиг.3A не имеет второй вход (вход 250b на фиг.2).FIG. 3A is a schematic diagram of an
К первому входу 250а экстрактора 250 подсоединен усреднитель 320, предназначенный для определения среднего значения сигнала на входе 250а. Термин „сигнал” обозначает здесь не только сигналы во временной области (временные сигналы), но и сигналы в частотной области, где соответствующие сигналы являются спектральным представлением сигналов временной области. Аналогично, сигналы могут включать в себя и транслировать информацию, полученную из вышеназванных сигналов, такую как величина амплитуды в частотной области (энергетический спектр), величины энергии (квадраты амплитуды), спектры и другие выведенные значения и показатели.An
Внутри контура экстрактора 250 на фиг.3A сигнал, поступивший от входа 250а на усреднитель 320, выводится из него в виде стационарной составляющей сигнала через первый выход 250с. Как показано на фиг.2, первый выход 250с соединен с произвольным вторым фильтром предварительного анализа эхо-сигнала 260 и/или с вычислителем 270.Inside the circuit of the
В рамках контура экстрактора 250 сигнал, принятый на первом входе 250а, далее поступает вместе со стационарной составляющей сигнала от усреднителя 320 на фильтр усиления 330, который формирует нестационарную составляющую сигнала и подает ее на второй выход 250d. Фильтр усиления 330 определяет нестационарную составляющую сигнала на базе принимаемого на первый вход 250а сигнала громкоговорителя или производного от него и на базе стационарной составляющей сигнала. Более подробно функции усреднителя 320 и фильтра усиления 330 будут рассмотрены далее в контексте описания фиг.2.Within the
На фиг.3B показана возможная модификация экстрактора 250 в составе устройства 200. Экстрактор 250 на фиг.3B отличается от экстрактора на фиг.3A наличием вычислителя параметров 340, вход которого тоже соединен с первым входом 250а. С выхода вычислителя параметров 340 сгенерированные им параметры управления выводятся на фильтр усиления 330 для расчета нестационарной компоненты сигнала. Особенности функционирования рассматриваются далее.FIG. 3B shows a possible modification of the
Являющийся опцией экстрактор 250, изображенный на фиг.3B, имеет второй вход 250b, уже показанный на фиг.2, который может быть не напрямую соединен, с одной стороны, с дополнительным входом вычислителя параметров 340 и, с другой стороны, с входным терминалом 280 для микрофонного сигнала, что также показано на фиг.2. В данном случае непрямое соединение может быть установлено через времячастотный преобразователь 290. Ниже также рассматриваются особенности работы вычислителя параметров 340.The
На фиг.3С показан возможный вариант встраивания экстрактора 250 в конфигурацию устройства 200 на фиг.2. Компоновка экстрактора 250 на фиг.3С базируется на конструкции фиг.3B с привязкой вычислителя параметров 340 в качестве опции с соответствующими соединениями. В отличие от экстрактора 250 на фиг.3B экстрактор 250 на фиг.3С содержит распределитель 350, имеющий два входа, один из которых соединен с выходом усреднителя, а второй - с выходом фильтра усиления 330. Распределитель 350 принимает стационарную компоненту от усреднителя 320 и нестационарную компоненту от фильтра усиления 330.On figs shows a possible option of embedding the
Два выхода распределителя 350 соединены с первым выходом 250с и со вторым выходом 250d экстрактора 250. Распределитель 350 определяет, какая из двух принятых им компонент будет передана через выход 250 с для последующей обработки. В зависимости от выбора одной из двух компонент распределитель 350 генерирует и выводит на второй выход 250d экстрактора 250 управляющий сигнал, который может содержать, например, информацию о том, которая из двух компонент сигнала поступила на первый выход 250с, или параметры, необходимые для дальнейшей обработки компоненты. Далее будут рассмотрены параметры, которые могут содержаться в выходном управляющем сигнале.Two outputs of the
В зависимости от индивидуального конструктивного решения распределитель 350 может передавать компонентный сигнал на первый выход 250с, что подразумевает более высокий уровень громкости, более высокий уровень энергии или большую величину энергии по сравнению с другим компонентным сигналом. При необходимости разные компоненты могут выводиться для разных полосовых сигналов.Depending on the individual design solution, the
Следовательно, экстрактор 250 на фиг.3С отличается от версий, представленных на фиг.3A и 3B, в основном, тем, что формирует на первом выходе 250с только один из двух компонентных сигналов. Как уже пояснялось в связи с фиг.2, экстрактор 250 на фиг.3С генерирует на выходе только управляющий сигнал, который содержит информацию о компонентном сигнале на первом выходе 250с.Therefore, the
На фиг.4А показан первый вариант реализации второго фильтра предварительного анализа эхо-сигнала 260, представленного на фиг.2 также в виде опции. Произвольно устанавливаемый второй фильтр предварительного анализа эхо-сигнала 260 включает в себя два звена фильтра 360-1, 360-2, вход каждого из которых раздельно соединен с входами 260а, 260b соответственно. Оба звена фильтра 360-1, 360-2 выведены раздельно на два выхода 260с, 260d, соответственно, второго фильтра предварительного анализа эхо-сигнала 260.On figa shows a first embodiment of a second filter preliminary analysis of the
Второй фильтр предварительного анализа эхо-сигнала 260, показанный как опция на фиг.4А, может использоваться в сочетании с экстрактором 250, изображенном на фиг.3A и 3B. Говоря конкретнее, на фиг.4А второй фильтр предварительного анализа эхо-сигнала 260 обеспечивает одновременную обработку стационарной составляющей сигнала с помощью подфильтра 360-1 и нестационарной составляющей сигнала с помощью подфильтра 360-2. Конструкция двух звеньев фильтра 360-1, 360-2 может быть одинаковой или разной в зависимости от идентичности или различия фильтров анализа эхо-сигнала, используемых при модуляции акустической среды 120 (на фиг.1) для стационарных и нестационарных компонент сигнала. Оба звена фильтра 360-1, 360-2 могут быть реализованы на идентичной элементной базе для выполнения защелкивания или буферизации одного сигнала.A second
При обсуждении фиг.2 уже говорилось о возможности двоякого применения фильтров анализа эхо-сигнала 240, 260, аналогично этому звенья фильтра 360 могут использоваться, например, только для обеспечения задержки. Естественно, что при реализации второго фильтра предварительного анализа эхо-сигнала 260 предусматривается задействование звеньев фильтрации, отличных от описанных ранее. Например, в звене фильтра 360 предусмотрен дополнительный ввод сигнала управляющего воздействия на процесс фильтрации,In the discussion of FIG. 2, it was already mentioned that there is a dual use of echo analysis filters 240, 260, similarly filter
На фиг.4B изображен вариант конструктивного решения второго фильтра анализа эхо-сигнала 260, отличающийся от версии на фиг.4А тем, что в нем реализовано только одно звено фильтра 360, смонтированное между первым входом 260а и первым выходом 260с. В техническом исполнении, представленном на фиг.4, сигнал, принятый на втором входе 260b, поступает на второй выход 260d.FIG. 4B illustrates an embodiment of the second filter for
Таким образом, второй фильтр предварительного анализа эхо-сигнала 260, показанный на фиг.4b, может быть функционально встроен, например, в конструкцию экстрактора 250, как представлено на фиг.3С. В этом случае управляющий сигнал, который содержит информацию о компоненте сигнала на первом входе 260а, не модифицируется фильтром анализа эхо-сигнала 260.Thus, the second pre-filter analysis of the
Естественно, предусматривается вариант интегрирования фильтра предварительного анализа эхо-сигнала на фиг.4B с экстрактором 250 на фиг.3a и 3B, когда, к примеру, на стадии фильтрации 360 должен быть модифицирован только один из двух компонентных сигналов. Здесь может быть использован зеркальный вариант фильтра анализа эхо-сигнала 260, фильтрующего входной сигнал на втором входе 260b.Naturally, an option is provided for integrating the pre-analysis filter of the echo signal in FIG. 4B with the
На фиг.5А изображен вьяислитель 270, реализованный согласно данному изобретению в комбинации с устройством 200 на фиг.2. В данном случае вычислитель 270 также имеет первый вход 270а и второй вход 270b. Вычислитель 270 далее включает в себя первый и второй вычислители параметров фильтрации 370-1, 370-2, входы которых подключены, соответственно, к входам 270а, 270b. Говоря конкретнее, вход вычислителя фильтра 370-1 соединен с первым входом 270а, чтобы принимать, предположим, стационарную составляющую сигнала. Соответственно, второй вычислитель фильтра 370-2 сопряжен со вторым входом 270b, чтобы принимать нестационарную составляющую сигнала, например, от экстрактора 250, как изображено на фиг.3A или 3b. В случае, если второй фильтр анализа эхо-сигнала 260 смонтирован между экстрактором 250 и вычислителем 270, сигнал, производный от соответствующих компонентных сигналов, передается на оба вычислителя параметров фильтрации 370.FIG. 5A shows a
Выходы обоих вычислителей параметров фильтрации 370 подключены к комбинатору 380, чей выход, в свою очередь, соединен с выходом 270d. Вычислитель 270, показанный на фиг.5А как произвольный компонент, имеет третий вход 270с, который внутри контура вычислителя 270 соединен с обоими вычислителями параметров фильтрации 370, и, как также показано на фиг.2, прямо или опосредованно соединен с входным терминалом 280 для микрофонного сигнала.The outputs of both
Принимая во внимание режим работы вычислителя 270, оба вычислителя характеристик фильтра 370 предназначаются для вычисления на базе полученных компонентных сигналов и, возможно, с учетом снятого с входного терминала 280 сигнала микрофона, соответствующих коэффициентов фильтрации, которые позже передаются на комбинатор 380. Оба вычислителя параметров фильтрации 370 производят соответствующие расчеты на основе принятых производных от соответствующих компонентных сигналов, которые могли быть скорректированы вторым фильтром предварительного анализа эхо-сигнала 260. Тем не менее, независимо от этого вычислители характеристик фильтра 370 предназначены для расчета коэффициентов пропускания первого и второго фильтров, соответственно, на базе составляющих сигналов, принятых от экстрактора 250.Taking into account the operating mode of
Затем, рассчитанные подобным образом коэффициенты пропускания первого и второго фильтров объединяются с помощью комбинатора 380 в набор коэффициентов фильтрации, после чего в качестве входных данных вводятся в адаптивный фильтр 210 через выход 270d вычислителя 270. Такое комбинирование может выполняться с помощью последовательности различных операций. От индивидуального технического решения фильтра, а также, в значительной степени, от задействованных времячастотных преобразователей 230, 290 и взаимодействующего с ними частотно-временного преобразователя 300 зависит комбинаторность коэффициентов пропускания первого и второго фильтров, благодаря чему возможен расчет коэффициентов пропускания адаптивного фильтра 210. Далее будут приведены соответствующие примеры.Then, the transmittances of the first and second filters calculated in this way are combined using a
На фиг.5B изображен второй вычислитель 270, аналогичный вычислителю на фиг.5A. Он отличается от вычислителя 270 на фиг.5А тем, что комбинатор 380 на фиг.5А замещен селектором 390, который предназначен для вывода на выход 270d набора коэффициентов фильтрации, сформированного на базе коэффициентов пропускания первого и второго фильтров, который основывается или на коэффициентах пропускания первого фильтра первого вычислителя фильтра 370-1 или на коэффициентах пропускания второго фильтра второго вычислителя фильтра 370-2. Формулируя иначе, селектор 390 предназначен для определения коэффициентов пропускания адаптивного фильтра 210 на базе или стационарного, или нестационарного компонентного сигнала.On figv depicted the
При такой архитектуре селектор 390 может реализовывать более сложные математические зависимости, основываясь на соответствующем наборе коэффициентов фильтрации вычислителя 370. Однако он отличается от комбинатора 380 в составе вычислителя 270 на фиг.5А тем, что учитывает совокупность из двух наборов коэффициентов фильтрации, выдаваемых вычислителем параметров фильтра 370.With this architecture, the
На фиг.5C показан еще один вариант вычислителя 270, который отличается от вычислителя 270 на фиг.5А тем, что в нем вычислитель параметров фильтрации 370 соединен только с первым входом 270а. Дополнительно вычислитель параметров фильтра 370 в структуре вычислителя 270 на фиг.5С подключен ко второму входу 270b для получения через него параметров, необходимых для определения коэффициентов фильтрации. Кроме того, в качестве опции вычислитель параметров фильтра 370 на фиг.5C может быть соединен с третьим входом 270 с для обеспечения возможности расчета коэффициентов фильтрации с учетом микрофонного сигнала.FIG. 5C shows yet another embodiment of the
Таким образом, вычислитель 270 на фиг.5C может работать в сочетании с экстрактором 250, показанным на фиг.3С, и вторым фильтром предварительного анализа эхо-сигнала 260, показанным на фиг.4B. Через второй выход 250d экстрактора 250 параметры, необходимые для расчетов соответствующего вычислителя характеристик фильтра 370, передаются на него непосредственно через второй вход 270b вычислителя 270. Для этого второй вход 270b соединен с терминалом ввода параметров вычислителя характеристик фильтрации 370, через который могут вводиться вспомогательные параметры для вычисления коэффициентов фильтрации.Thus, the
В силу того, что в контур вычислителя 270 включен только одиночный вычислитель параметров фильтрации 370, комбинатор и селектор могут не использоваться.Due to the fact that only a single
На фиг.5D изображена версия вычислителя 270, по конфигурации и выполняемым функциям сходная с аналогом на фиг.5C. В отличие от вычислителя 270 на фиг.5C конструкция вычислителя на фиг.5D дополнена определителем параметров 400, смонтированным между вторым входом 270b и соответствующим разъемом для ввода параметров вычислителя характеристик фильтра 370.On fig.5D shows the version of the
В отличие от вычислителя 270 на фиг.5C вычислитель 270 на фиг.5D может функционировать в составе устройства 200, где экстрактор 250 выдает через второй выход 250d управляющий сигнал, который содержит сведения о том, какой из двух компонентных сигналов он передает через соответствующий первый выход 250с. При расхождении параметров, требуемых вычислителю параметров фильтра 370 для расчета коэффициентов фильтрации для указанных двух компонент сигнала, или при различии сгенерированных на их основании сигналов, соответствующие параметры могут быть рассчитаны с учетом переданного определителем параметров 400 компонентного сигнала при одновременном использовании вычислителя 270, как показано на фиг.5D. В силу этого определитель параметров 400 может быть выполнен, например, в виде блока памяти или вычислительного устройства. Реализация как средства хранения информации возможна в форме постоянного запоминающего устройства (ROM/ПЗУ), энергонезависимого запоминающего устройства (NVM/ЭНЗУ) или оперативного запоминающего устройства (RAM/ОЗУ).In contrast to the
На фиг.5E представлен очередной вариант осуществления вычислителя 270, который имеет в своем составе два вычислителя параметров фильтрации 370-1 и 370-2, чье функционирование зависит от компонентного сигнала, на основе которого должны быть рассчитаны коэффициенты пропускания адаптивного фильтра 210. Здесь входы обоих вычислителей параметров фильтрации 370 подключены к первому входу 270а. Кроме этого, каждый из обоих вычислителей параметров фильтрации 370 может быть произвольно подсоединен к третьему входу 270с, а также - на вход распределителя 410, выход которого сопряжен с выходом вычислителя 270. Распределительный блок 410 имеет дополнительный ввод для управляющего сигнала, соединенный с вторым входом 270b вычислителя 270.FIG. 5E shows another embodiment of a
Таким образом, вычислитель 270 на фиг.5E позволяет рассчитывать первый набор коэффициентов фильтрации, используя вычислитель параметров фильтрации 370-1, и второй набор коэффициентов фильтрации, используя второй вычислитель параметров фильтрации 370-2 на основе сигналов, принятых на первом входе 270а. Выбор одного из двух коэффициентов фильтрации, рассчитанных вычислителем параметров фильтрации 370, который в конечном счете должен быть отправлен на выходу 270d, зависит от управляющего сигнала, принятого на входе для команд задающего воздействия распределителя 410 через второй вход 270b. В зависимости от управляющего сигнала, полученного на входе для сигналов управления, распределитель 410 соединяет один из двух входов с выходом 270d.Thus, the
Таким образом, вычислитель 270 на фиг.5E может действовать, например, в сочетании с экстрактором 250, как показано на фиг.3С, где через второй выход 250d подается управляющая команда, содержащая данные компонентного сигнала, переданного через первый выход 250с. Следовательно, конструкция вычислителя 270, представленная на фиг.5C, может быть применена, например, в тех случаях, когда исходные данные для двух составляющих сигналов, рассчитываемых с помощью вычислителя параметров фильтрации 370, имеют такие расхождения, что не могут быть эффективно преобразованы внесением в параметры простых изменений.Thus, the
Здесь логично было бы отметить, что разновидности экстрактора 250, показанные на фиг.3А-3С, варианты фильтра предварительного анализа эхо-сигнала 260, представленные на фиг.4A-4B, и модификации вычислителя 270, приведенные на фиг.5A-5E, могут быть взаимно интегрированы в соответствии с конкретным приложением. Предположим, если устройство выбора вычислителя параметров фильтрации 370 с последующим выводом на выход 270d выполняет дальнейшие манипуляции, скажем, вычисления, с опорой на коэффициенты фильтрации, то оно может быть задействовано, к примеру, в модели вычислителя на фиг.5E вместо распределителя 410.It would be logical to note here that the types of
Конструктивные решения по предлагаемому изобретению, представленные выше в описании и на фиг. с 2 по 5, являются новейшими разработками, обеспечивающими раздельное подавление стационарных и нестационарных компонент акустического эха. Это достигается благодаря оценке эхо-сигнала отдельно от неустойчивых и устойчивых составляющих сигнала громкоговорителя. Далее, конструкция согласно данной разработке предусматривает расчет характеристик двух соответствующих фильтров эхокомпенсации для сигналов обоих типов. Эхокомпенсирующие фильтры могут быть оптимизированы индивидуально для максимального улучшения эхоподавления и минимизации артефактов и искажений сигнала на передающем конце.The design solutions of the invention presented above in the description and in FIG. 2 to 5 are the latest developments providing separate suppression of stationary and non-stationary components of the acoustic echo. This is achieved by evaluating the echo separately from the unstable and stable components of the loudspeaker signal. Further, the design according to this development provides for calculating the characteristics of two respective echo cancellation filters for both types of signals. Echo cancellation filters can be individually optimized to maximize echo cancellation and minimize artifacts and signal distortion at the transmitting end.
Дальнейший процесс построен следующим образом. Сначала моделируют сигнал громкоговорителя. Затем, в соответствии с этой моделью разделяют стационарные и нестационарные составляющие, что может быть выполнено на основе оценки стационарных составляющих. После этого спектры мощности стационарных и нестационарных составляющих эха оценивают с помощью фильтров предварительного анализа эхо-сигнала. В силу этого, в некоторых реализациях данного изобретения предусматривается расчет параметров двух эхокомпенсирующих фильтров. Впоследствии процесс разделения стационарных и нестационарных компонент может быть отрегулирован, исходя из практики применения фильтров эхокомпенсации.The further process is structured as follows. First, a speaker signal is modeled. Then, in accordance with this model, stationary and non-stationary components are separated, which can be done based on the assessment of stationary components. After that, the power spectra of the stationary and non-stationary components of the echo are evaluated using filters of preliminary analysis of the echo signal. Because of this, in some implementations of the present invention provides for the calculation of the parameters of two echo canceller filters. Subsequently, the process of separation of stationary and non-stationary components can be adjusted based on the practice of using echo cancellation filters.
Говоря о моделировании сигнала, следует учитывать, что оценка спектра вносимого эха или спектра плотности мощности эхо-сигнала с помощью фильтра предварительного анализа эхо-сигнала на практике, как правило, не очень точна, поскольку для рассмотрения доступна только часть истинной длины траектории эха. С целью предупреждения остаточного эха из-за высокой степени погрешности фильтры эхокомпенсации настраивают на агрессивный режим подавления эхо-сигналов, при котором остаточное эхо полностью удаляется. Такая настройка достигается путем завышения оценки спектра плотности мощности эхо-сигнала и сглаживания по времени, что способствует поддержанию низких значений фильтра усиления.Speaking about signal modeling, it should be taken into account that the estimation of the spectrum of the introduced echo or the power density spectrum of the echo signal using the preliminary echo analysis filter in practice, as a rule, is not very accurate, since only a part of the true length of the echo path is available for consideration. In order to prevent residual echo due to a high degree of error, echo cancellation filters are set to an aggressive echo cancellation mode, in which the residual echo is completely removed. This tuning is achieved by overestimating the spectrum of the power density of the echo signal and smoothing over time, which helps to maintain a low gain filter.
Когда сигнал громкоговорителя содержит стационарный шум, эхозаградитель пытается блокировать эхо. Применение названных выше фильтров агрессивного эхоподавления часто ведет к глушению не только стационарных эхошумов, но и к ослаблению стационарного шума и речи на ближнем конце.When the loudspeaker signal contains stationary noise, the echo suppressor attempts to block the echo. The use of the above filters of aggressive echo cancellation often leads to jamming not only stationary echo noises, but also to weaken stationary noise and speech at the near end.
Здесь предлагается смягчить проблему посредством двух разных путей подавления эха стационарных и нестационарных сигналов, что проиллюстрировано на фиг.6.It is proposed here to mitigate the problem by means of two different ways of suppressing the echo of stationary and non-stationary signals, as illustrated in FIG. 6.
На фиг.6 дана принципиальная блочная схема устройства 200 в соответствии с настоящим изобретением, в состав которого входят громкоговоритель 100 и микрофон 110. На громкоговоритель 100 поступает сигнал x[n], который поступает также на экстрактор 250. Другое название экстрактора 250 - дискриминатор устойчивого состояния (селектор стабильности). Как пояснялось в связи с фиг.2, экстрактор 250 снабжен двумя выходами, соединенными с вычислителем 270. В дополнение к этому на вычислитель 270 поступает сигнал y[n] микрофона 110.6 is a schematic block diagram of a
В контексте фиг.5А уже был показан вычислитель 270, который включает в себя первый вычислитель параметров фильтрации 370-1 для стационарной составляющей сигнала и второй вычислитель параметров фильтрации 370-2 для нестационарной составляющей сигнала, которые формируются на выходе экстрактора 250. Дополнительно оба вычислителя параметров фильтрации 370 принимают сигнал микрофона.In the context of FIG. 5A, a
На основании принятых сигналов вычислитель параметров фильтрации 370 рассчитывает коэффициенты фильтрации Hw и Hs, которые передаются на комбинатор 380. С этой целью выход каждого из обоих вычислителей параметров фильтрации 370 соединен с комбинатором 380. Комбинатор 380, в свою очередь, выводит на адаптивный фильтр 210 коэффициенты фильтрации, рассчитанные или заданные на базе двух наборов коэффициентов фильтрации Hw и Hs.Based on the received signals, the
Чтобы в результате из микрофонного сигнала y[n] получить сигнал с блокированным эхом e[n], на вход адаптивного фильтра 210 дополнительно напрямую поступает сигнал микрофона. На выходе адаптивного фильтра 210 формируется сигнал с блокированным эхом e[n].In order to obtain a signal with a blocked echo e [n] from the microphone signal y [n], the microphone signal is additionally directly input to the
Таким образом, адаптивный фильтр 210 осуществляет эхоподавление, в котором участвуют два вычислителя параметров фильтрации 370, каждый из которых рассчитывает фильтры эхокомпенсации в виде соответствующих коэффициентов пропускания фильтра, которые затем комбинатора 380 интегрирует в эффективный фильтр эхокомпенсации.Thus,
Обращаясь к фиг.6, следует иметь в виду, что представленная на ней принципиальная схема является упрощенной блочной схемой, где не показаны, например, реализованные времячастотный преобразователь или фильтры предварительного анализа эхо-сигнала.Turning to Fig.6, it should be borne in mind that the schematic diagram presented on it is a simplified block diagram, where, for example, implemented time-frequency converter or filters for preliminary analysis of the echo signal are not shown.
Подавление нестационарного (речевого) эхо-сигнала должно выполняться в агрессивном режиме во избежание остаточного эха, являющегося раздражающим фактором. Однако стационарные эхо-сигналы, которые могут являться следствием стационарных помех в сигналах громкоговорителя, обычно подавляют менее агрессивно, чтобы предупредить возникновение таких артефактов, как, например, тональные искажения. Чтобы сгенерировать надлежащую модель, сигнал x[n], исходящий от громкоговорителя, может быть разбит на составляющие в соответствии с выражениемSuppression of unsteady (speech) echo should be performed aggressively to avoid residual echo, which is an annoying factor. However, stationary echoes, which may result from stationary interference in the loudspeaker signals, are usually suppressed less aggressively in order to prevent the occurrence of artifacts such as tonal distortions. In order to generate a proper model, the signal x [n] coming from the speaker can be broken down into components according to the expression
где xs[n] моделирует нестационарную составляющую речевого сигнала, a xw[n] имитирует стационарные помехи. Дискретное время обозначено переменным показателем n.where x s [n] models the non-stationary component of the speech signal, ax w [n] simulates stationary interference. Discrete time is indicated by a variable exponent n.
Сначала над обеими частями модели, выраженной уравнением (1), выполняется кратковременное преобразование Фурье с учетом разделения стационарных и нестационарных составляющих, из чего получаемFirst, on both sides of the model, expressed by equation (1), a short-term Fourier transform is performed taking into account the separation of stationary and non-stationary components, from which we obtain
где m, показатель частоты, и k, временной показатель блока данных, - целые числа. В уравнении (2) нестационарные и стационарные составляющие спектральной плотности мощности сигнала громкоговорителя |X[k,m]|2 выражены какwhere m, the frequency indicator, and k, the time indicator of the data block, are integers. In equation (2), the non-stationary and stationary components of the power spectral density of the loudspeaker signal | X [k, m] | 2 expressed as
|Xs[k,m]|2 и |Xw[k,m]|2.| X s [k, m] | 2 and | X w [k, m] | 2 .
Логично допустить, что xs[n] и xw[n] не коррелируют и имеют среднее значение, приближающееся к нулю. Из этого следует, что |X[k,m]|2 выводится изIt is logical to assume that x s [n] and x w [n] do not correlate and have an average value approaching zero. It follows that | X [k, m] | 2 is derived from
В силу этого мгновенная спектральная плотность мощности нестационарной составляющей сигнала громкоговорителя xs[n] может быть восстановлена путем вычитания оценочного спектра мощности стационарной компоненты сигнала из спектра мощности сигнала громкоговорителя |X[k,m]|2 согласно уравнениюBecause of this, the instantaneous spectral power density of non-stationary the loudspeaker signal component x s [n] can be restored by subtracting the estimated power spectrum of the stationary signal component from the power spectrum of the loudspeaker signal | X [k, m] | 2 according to the equation
В действительности оценивается посредством фильтрации спектральной плотности мощности сигнала громкоговорителя |X[k,m]|2, следуя выражениюIn fact estimated by filtering the spectral power density of the speaker signal | X [k, m] | 2 , following the expression
Фильтр Fx[k,m], называемый также фильтром усиления, может быть записан в своей исходной форме согласно [W.Etter and G.S.Moschytz. Noise reduction by noise-adaptive spectral magnitude expansion. J. Audio Eng. Soc., 42: 341-349, May 1994] в следующем виде:The filter F x [k, m], also called the gain filter, can be written in its original form according to [W.Etter and GSMoschytz. Noise reduction by noise-adaptive spectral magnitude expansion. J. Audio Eng. Soc., 42: 341-349, May 1994] as follows:
где γх - экспонент, а βx - управляющий параметр или параметр настройки интенсивности подавления составляющих стационарного сигнала на случай, если ожидаемое значение этой характеристики было занижено или завышено. Разделение стационарных и нестационарных компонент будет продемонстрировано в контексте фиг.8 при показателе частоты 1 кГц.where γ x is the exponent, and β x is the control parameter or the parameter for adjusting the intensity of suppression of the components of the stationary signal in case the expected value of this characteristic was underestimated or overestimated. The separation of stationary and non-stationary components will be demonstrated in the context of Fig. 8 at a frequency index of 1 kHz.
Уравнения (5) и (6) описывают функциональные возможности фильтра усиления 330 в составе экстрактора 250, представленные в контексте фиг.2-6.Equations (5) and (6) describe the functionality of the
Оценка стационарных помех может быть выполнена путем корректировки ожидаемой кратковременной спектральной плотность мощности шума времени. В каждом блоке данных (фрейме) k энергетический спектр шума корректируется путем однополюсного усреднения при двух постоянных времени с целью дискриминации речи и шума. Короткий период атаки показывает, что текущий блок данных содержит шум.Estimation of stationary interference can be performed by adjusting the expected short-term noise power spectral density time. In each data block (frame) k, the noise energy spectrum is corrected by unipolar averaging at two time constants in order to discriminate between speech and noise. A short attack period indicates that the current data block contains noise.
Продолжительная постоянная времени ослабления показывает, что текущий блок данных содержит речь.A long damping time constant indicates that the current data block contains speech.
Практически это реализуется в соответствии сIn practice, this is implemented in accordance with
где µ1 - постоянная времени атаки и µ2 - постоянная времени спада. Следует пояснить, что µ1 и µ2 в уравнении (7) являются безразмерными параметрами, для которых действует условие µ1<µ2. Однако, принимая во внимание частоту дискретизации, эти параметры можно интерпретировать и воспринимать как, например, вышеозначенные временные константы. Как в дальнейшем подтвердит отношение пропорциональности (16), фактические постоянные времени и эти параметры обратно пропорциональны друг другу. Постоянная времени атаки µ1 может иметь, например, величину 10000 мс=10 сек., тогда как постоянная времени ослабления, учитывая период дискретизации, может составлять величину 10 мс.where µ 1 is the attack time constant and µ 2 is the decay time constant. It should be clarified that μ 1 and μ 2 in equation (7) are dimensionless parameters for which the condition μ 1 <μ 2 is valid. However, taking into account the sampling rate, these parameters can be interpreted and perceived as, for example, the aforementioned time constants. As subsequently confirms the proportionality relation (16), the actual time constants and these parameters are inversely proportional to each other. The attack time constant µ 1 can, for example, be 10,000 ms = 10 seconds, while the attenuation time constant, taking into account the sampling period, can be 10 ms.
При реализации настоящего изобретения, отображенной на фиг.2-6, функции, описываемые уравнением (7), выполняет усреднитель 320 в составе экстрактора 250.When implementing the present invention, shown in Fig.2-6, the functions described by equation (7), performs
При определении мощности эхо-сигнала оценку спектра эха можно выполнить применив фильтр предварительного анализа эхо-сигнала G[k,m] к отсроченному по времени спектру мощности сигнала громкоговорителя согласно уравнению:When determining the power of the echo signal, the evaluation of the echo spectrum can be performed by applying the filter of preliminary analysis of the echo signal G [k, m] to the time-delayed power spectrum of the loudspeaker signal according to the equation:
где |Ŷ[k, m]|2 выражает оценку спектральной плотности мощности эха в сигнале микрофона. Из примененного уравнения (3) следует, что эхо, образующееся из нестационарной составляющей сигнала громкоговорителя, определяется изwhere | Ŷ [k, m] | 2 expresses an estimate of the spectral density of an echo power in a microphone signal. It follows from the applied equation (3) that the echo generated from the non-stationary component of the loudspeaker signal is determined from
а эхо, формирующееся из стационарной составляющей сигнала громкоговорителя, определяется изand the echo formed from the stationary component of the loudspeaker signal is determined from
В зависимости от одного из конструктивных решений по настоящему изобретению, варианты которых показаны, к примеру, в контексте фиг.2-5, рабочие функции, описываемые уравнением (8), могут быть выполнены, скажем, первым фильтром предварительного анализа эхо-сигнала 240. Техническими возможностями, выраженными уравнениями (9) и (10), может обладать второй фильтр предварительного анализа эхо-сигнала 260, содержащий в себе два звена фильтра 360-1 и 360-2.Depending on one of the constructive solutions of the present invention, the variants of which are shown, for example, in the context of FIGS. 2-5, the working functions described by equation (8) can be performed, say, by the first filter of preliminary analysis of the
Как уже говорилось выше, реализовывать задержку сигналов на величину d, используемую в уравнениях (8)-(10), также могут фильтры предварительного анализа эхо-сигнала 240, 260. Вместо них задержку может обеспечивать времячастотный преобразователь 230, если эта функция не возложена на другое целевое автономное устройство.As already mentioned above, the delay of signals by the value of d used in equations (8) - (10) can also be realized by filters for preliminary analysis of the
Для компенсации эха рассчитываются взаимодействующие фильтры эхоподавления Hs[k,m] и Hw[k,m] и применяются для устранения эха микрофонного сигнала на основании оценок нестационарных и стационарных эхо-сигналов и .To compensate for the echo, the interacting echo cancellation filters H s [k, m] and H w [k, m] are calculated and used to eliminate the echo of the microphone signal based on estimates of non-stationary and stationary echo signals and .
Конструкция, включающая в себя вычислитель 270, показанный, в частности, на фиг.5A, практически может быть осуществлена в соответствии сA structure including a
В этом случае умножение соответствующих коэффициентов пропускания эхокомпенсирующих фильтров Hs[k,m] и Hw[k,m] выполняет комбинатор 380, замещающий последовательное соединение соответствующих фильтров эхокомпенсации. Умножение нужных коэффициентов фильтрации в частотной области соответствует свертке соответствующих импульсных характеристик во временной области.In this case, the multiplication of the respective transmission coefficients of the echo canceller filters H s [k, m] and H w [k, m] is performed by a
Реализуя фильтры эхокомпенсации путем разложения на множители согласно уравнению (II), можно вводить разные коэффициенты усиления в качестве параметров различных составляющих эха. Компоненты нестационарного фильтра эхокомпенсации можно вычислить, например, следуя уравнению:By implementing echo cancellation filters by factoring according to equation (II), different gain factors can be introduced as parameters of the various echo components. The components of a non-stationary echo cancellation filter can be calculated, for example, by following the equation:
а составляющие стационарного эхокомпенсирующего фильтра могут быть вычислены в соответствии сand the components of the stationary echo cancellation filter can be calculated in accordance with
Расчетные показатели βs, γs, βw и γw могут быть использованы для управления планируемым режимом работы каждого из эхокомпенсирующих фильтров. В зависимости от специфики осуществления предлагаемой разработки названные расчетные показатели могут быть отобраны и зафиксированы, предварительно заданы в любой требуемой адаптируемой, программируемой или модифицируемой форме. Стандартным набором экспоненциальных параметров является, в частности, γs=γw=2.The calculated parameters β s , γ s , β w and γ w can be used to control the planned mode of operation of each of the echo canceling filters. Depending on the specifics of the implementation of the proposed development, the named calculated indicators can be selected and fixed, predefined in any required adaptable, programmable or modifiable form. The standard set of exponential parameters is, in particular, γ s = γ w = 2.
Так называемые коэффициенты избыточности оценки βs и βw служат для контроля степени агрессивности глушения эха. Скажем, интенсивность некоторого эхокомпенсирующего фильтра может быть усилена за счет увеличения коэффициента избыточности оценки. Поэтому обычно фильтр компенсации стационарного эхо-сигнала Hw[k,m] подбирается с учетом показателя βw=2, благодаря чему достигается умеренное ослабление эха.The so-called redundancy ratios β s and β w are used to control the degree of aggressiveness of echo jamming. Say, the intensity of some echo cancellation filter can be enhanced by increasing the redundancy coefficient of the estimate. Therefore, usually the compensation filter for the stationary echo signal H w [k, m] is selected taking into account the parameter β w = 2, due to which a moderate attenuation of the echo is achieved.
С другой стороны, эхокомпенсирующий фильтр, отвечающий за подавление нестационарных составляющих эха, подразумевает агрессивный режим подавления для эффективного ослабления шумовых составляющих речи в эхо-сигнале. В силу этого, расчетный коэффициент избыточности оценки βs часто превышает βw, и, соответственно, βs>βw. Например, при выборе βw=2, βs может иметь значения в диапазоне 20>βs>2=βw, (предположим, βs=4). В большинстве случаев βw и βs относятся к одному порядку величины.On the other hand, an echo cancellation filter responsible for suppressing the non-stationary components of an echo implies an aggressive suppression mode to effectively attenuate the noise components of speech in the echo signal. Due to this, the estimated redundancy coefficient of the estimate β s often exceeds β w , and, accordingly, β s > β w . For example, when choosing β w = 2, β s can have values in the
Пороговые величины Ls и Lw устанавливают максимальный предел затухания эха в децибелах (дБ). Номинальным значением для фильтра компенсации стационарного эхо-сигнала является Lw=-10 дБ или -15 дБ, которое оптимально ограничивает ослабление стационарных эхо-сигналов, снижая вероятность возникновения случайных артефактов. При наличии нестационарного голосового сигнала на дальнем конце линии связи помеховые эхокомпоненты должны быть полностью устранены, что осуществляется за счет установления предельного значения Ls около -60 дБ для нестационарного компонентного сигнала.The threshold values L s and L w set the maximum decay limit of the echo in decibels (dB). The nominal value for the stationary echo cancellation filter is L w = -10 dB or -15 dB, which optimally limits the attenuation of stationary echoes, reducing the likelihood of random artifacts. In the presence of an unsteady voice signal at the far end of the communication line, the interfering echo components must be completely eliminated, which is achieved by setting the limit value L s of about -60 dB for the unsteady component signal.
Конструктивные возможности, описанные уравнениями (12) и (13), могут быть реализованы в вычислителе параметров фильтрации 370, входящем в конструкции, описанные с помощью фиг.2-6.The design capabilities described by equations (12) and (13) can be implemented in the
Иногда практическое назначение предлагаемой разработки требует не прямого эхоподавления с помощью эхокомпенсирующих фильтров, как описывают уравнения (12) и (13), а, скорее - компенсации эхо-сигнала на базе сопоставимой сглаженной по времени интерпретации. Как и рассмотренные выше расчетные параметры, параметры временного сглаживания обычно требуют подстройки вручную и оптимизации подавления отдельно нестационарного и стационарного эха. Благодаря этому повышается качество воспринимаемого звука, так как специфика подавления стационарных шумовых компонент отличается от особенностей компенсации нестационарных составляющих голосового сигнала.Sometimes the practical purpose of the proposed development does not require direct echo cancellation using echo cancellation filters, as equations (12) and (13) describe, but rather, compensation of the echo signal based on a comparable time-smoothed interpretation. Like the calculated parameters discussed above, the parameters of temporary smoothing usually require manual tuning and optimization of the suppression of separately non-stationary and stationary echoes. This improves the quality of perceived sound, since the specifics of suppressing stationary noise components differ from the features of compensation for non-stationary components of a voice signal.
Эти функциональные возможности могут быть реализованы, например, собственно вычислителем параметров фильтрации 370 или любым устройством с питающей стороны от них, например, комбинатором 380, селектором 390 или распределителем 410. В случае необходимости такое сглаживание по времени может выполняться напрямую с помощью адаптивного фильтра 210.These functionalities can be implemented, for example, by the
Говоря об улучшении качества звучания, следует вспомнить, например, что сглаживание должно усиливаться при глушении стационарных составляющих сигнала во избежание так называемых тональных искажений, что описано в [О.Capp'e. Elimination of the musical noise phenomenon with the ephrain and malah noise suppressor. IEEE Trans. Speech and Audio Processing, 2(2): 345-349, April 1994.]. Вместе с тем, при аттенюации следует обеспечить низкие пропускные характеристики фильтров компенсации нестационарного эха, чтобы поддерживать достаточно высокую степень ослабления эхо-сигнала, поскольку названной аттенюации способствует отражение траектории эха. Тем не менее, это не должно снижать адаптируемость адаптивного фильтра 210 в случаях быстрого изменения уровней эхо-сигнала. Обсуждение аспектов качества ясно показывает необходимость индивидуального подхода к отладке и оптимизации эхокомпенсирующих фильтров, определяемых уравнениями (12) и (13).Speaking about improving sound quality, it should be remembered, for example, that smoothing should be enhanced when the stationary components of the signal are suppressed in order to avoid the so-called tonal distortions, which is described in [O. Capp'e. Elimination of the musical noise phenomenon with the ephrain and malah noise suppressor. IEEE Trans. Speech and Audio Processing, 2 (2): 345-349, April 1994.]. At the same time, during attenuation, low throughput characteristics of non-stationary echo compensation filters should be ensured in order to maintain a sufficiently high degree of attenuation of the echo signal, since the reflection of the echo path contributes to this attenuation. However, this should not reduce the adaptability of the
На фиг.7 представлена расширенная, более полная, принципиальная схема процесса или блок-схема алгоритма аттенюации акустического эха, которая рассматривается дальше. Отображенное на фиг.7 конструктивное решение во многом аналогично варианту исполнения на фиг.2. Здесь также в устройство 200 введен времячастотный преобразователь 230 в конфигурации оконного преобразователя Фурье (ОПФ), принимающий сигнал громкоговорителя x[n].Figure 7 presents an expanded, more complete, basic diagram of the process or a block diagram of the attenuation algorithm of the acoustic echo, which is discussed further. The design solution shown in Fig. 7 is in many respects similar to the embodiment in Fig. 2. Here, a time-
В верхней части фиг.7 в качестве примера показана кривая 420 сигнала громкоговорителя x[n] как функции времени, проходящая по значениям времени n.At the top of FIG. 7, an example is a
Кроме конвертации сигнала x[n] из временной области в частотную область время-частотный преобразователь 230 выполняет задержку на величину d, о которой говорилось выше. В результате, на выходе времячастотного преобразователя 230 формируется спектр X[k-d,m], являющийся, как правило, комплекснозначным. Данный спектр X[k-d,m] передается на экстрактор 250, обозначенный на фиг.7 буквами SD [ДС] (stationary discrimination [=дискриминатор по стабильности]). В отношении технических решений по изобретению, представленных на фиг.2-5, уже пояснялось, что экстрактор 250 способен также формировать, как показано на фиг.7, в частотной области стационарный компонентный сигнал Xw[k,m,] и нестационарный компонентный сигнал Xs[k,m]. Эти компонентные сигналы поступают на вычислитель 270.In addition to converting the signal x [n] from the time domain to the frequency domain, the time-to-
В дополнение к этому, конструкция устройства 200 на фиг.7 имеет в своем составе времячастотный преобразователь 290, также реализованный в форме оконного преобразователя Фурье (ОПФ). В верхней части фиг.7 в качестве примера показано, что времячастотный преобразователь 290 принимает на входе микрофонный сигнал y[n], отображенный кривой 430. Времячастотный преобразователь 290, кроме того, преобразует сигнал микрофона Y[k,m] в соответствующее частотное представление, при этом показатель k по-прежнему обозначает блок данных, а показатель m обозначает полосу частот или значение частоты или коэффициент трансформанты. Указанный спектр Y[k,m] также обычно является комплекснозначным.In addition, the design of the
Тем не менее, в отличие от времячастотного преобразователя 230 времячастотный преобразователь 290 не выполняет дополнительную функцию задержки. В основном - в силу того, что в этом нет необходимости, так как скорость распространения звуковых волн (скорость звука) заметно ниже скорости прохождения электрических сигналов в цепях и схемотехнических элементах, что вызывает запаздывание улавливаемого микрофоном сигнала y[n] относительно соотнесенного сигнала громкоговорителя x[n].However, unlike the time-
Для наглядности этот аспект выделен первой фигурной скобой 440 как фрагмент сигнала громкоговорителя x[n] при сопоставлении кривых графиков 420 и 430 в верху фиг.7. В той же части фиг.7 в сигнале микрофона y[n] участок, соответствующий фрагменту сигнала громкоговорителя x[n], обозначенного скобой 440, показан второй фигурной скобой 450. Таким образом, сигнал громкоговорителя x[n] и микрофонный сигнал y[n] смещены относительно друг друга на величину задержки d, что на фиг.7 обозначено стрелкой 460.For clarity, this aspect is highlighted by the first
В соответствии с алгоритмом на фиг.7 спектры сигналов громкоговорителя и микрофона поступают на фильтр предварительного анализа эхо-сигнала 470, который на базе получаемых сигналов определяет параметры фильтра предварительного анализа эхо-сигнала или его элементов . Эти коэффициенты фильтрации также передаются на вычислитель 270.In accordance with the algorithm of Fig. 7, the spectra of the loudspeaker and microphone signals are sent to the preliminary analysis filter of the
Вычислитель 270 на фиг.7, в свою очередь, состоит из двух вычислителей параметров фильтрации стационарной и нестационарной компонент сигнала, 370-1 и 370-2, каждый из которых получает на своем входе спектр сигнала микрофона иThe
коэффициенты пропускания фильтра предварительного анализа эхо-сигнала . Таким образом, функциональные возможности, заложенные в обоих вычислителях параметров фильтрации 370, предусматривают не только расчет параметров фильтрации, о чем говорилось в описании к фиг.2-5, но и выполнение операций второго фильтра предварительного анализа эхо-сигнала 260.transmission coefficients of the filter of the preliminary analysis of the echo signal . Thus, the functionality embedded in both calculators of the
Оба вычислителя параметров фильтрации 370, обозначенные на фиг.7 как ERF (фильтр эхокомпенсации), как и на фиг.5A, соединены с комбинатором 380, который обозначен на фиг.7 как FC (комбинация параметров фильтрации). Комбинатор 380 комбинирует коэффициенты фильтрации, полученные от обоих вычислителей параметров фильтрации, для выработки коэффициентов пропускания адаптивного фильтра 210.Both
Далее, как уже говорилось в описании к Фиг.2 и 5, комбинатор 380 соединен с адаптивным фильтром 210, который на фиг.7 обозначен как SM (спектральная модификация). Адаптивный фильтр 210 осуществляет корректировку спектра на базе принятого им спектрального представления Y[k,m] сигнала микрофона y[n] для ослабления или подавления эхокомпоненты микрофонного сигнала.Further, as already mentioned in the description of FIGS. 2 and 5, the
Наконец, адаптивный фильтр 210 сопряжен с частотно-временным преобразователем 300, который представляет собой обратный оконный преобразователь Фурье (ООПФ). Этот преобразователь формирует на выходе сигнал е[n] во временной области, очищенный от эха. Варианты реализации настоящего изобретения в форме соответствующих способов или устройств 200, как показано, например, на фиг.7, позволяют устранять артефакты, вносимые при модификации спектра адаптивным фильтром 210. Определяя иначе, предлагаемые конструктивные решения в соответствии с изобретением обеспечивают адаптивное регулирование мощности. При наличии речи только на дальнем конце процесс эхоподавления должен протекать в достаточно агрессивном режиме, чтобы не допускать прохождение любого сигнала, поскольку в такой ситуации может быть не желательно разделение нестационарных и стационарных сигналов и составляющих сигналов. По этой причине при распознании такой ситуации может потребоваться адаптация управляющего параметра βx из уравнения (6), который регулирует или, по меньшей мере, воздействует именно на амплитуду стационарного компонентного сигнала, вычтенного из сигнала громкоговорителя.Finally, the
Для распознавания ситуации, в которой выходной сигнал громкоговорителя содержит только речь дальнего конца линии связи, вычисляют два разных параметра. Первый из них - это значение так называемого выигрыша от предсказания (усиления предсказания), соответствующее полнополосному усреднению функций когерентности между каналом громкоговорителя и каналом микрофона. В качестве второго параметра используют показатель речевой активности канала громкоговорителя, который может быть получен, например, при сравнении разных по времени уровней сигнала громкоговорителя или выбран из специальных параметров голосового кодека, используемого в передаче речи. Слово „кодек" составлено из двух сокращенных английских слов - кодер и декодер, и такие кодеки могут строиться, например, на основе LPC (кодирования с линейным предсказанием) или CELP (линейного предсказания с мультикодовым управлением).To distinguish a situation in which the output signal of the speaker contains only speech at the far end of the communication line, two different parameters are calculated. The first of these is the value of the so-called prediction gain (prediction gain) corresponding to full-band averaging of the coherence functions between the loudspeaker channel and the microphone channel. As a second parameter, an indicator of the speech activity of the loudspeaker channel is used, which can be obtained, for example, by comparing the speaker signal levels different in time or selected from special parameters of the voice codec used in voice transmission. The word "codec" is composed of two abbreviated English words - an encoder and a decoder, and such codecs can be built, for example, on the basis of LPC (linear prediction coding) or CELP (linear prediction with multi-code control).
Показатель выигрыша от предсказания или усиление предсказания эха ω[k], описывает уровень сходства между сигналом микрофона и задержанным сигналом громкоговорителя. Выигрыш от предсказания ω[k] рассчитывается на базе квадратичной функции когерентности между задержанным спектром мощности сигнала громкоговорителя |Xd[k,m]|2 и спектром мощности сигнала микрофона в соответствии с уравнениемThe prediction gain or echo prediction gain ω [k] describes the level of similarity between the microphone signal and the delayed speaker signal. The prediction gain ω [k] is calculated based on the quadratic coherence function between the delayed power spectrum of the speaker signal | X d [k, m] | 2 and the power spectrum of the microphone signal in accordance with the equation
где Е{…} обозначает математическое ожидание. Названное ожидаемое математическое значение может быть получено с помощью кратковременной оценки функции когерентности Гd[k,m] путем вычисления или аппроксимации ожидаемого значения согласно уравнениюwhere E {...} stands for mathematical expectation. The named expected mathematical value can be obtained using a short-term estimate of the coherence function Г d [k, m] by calculating or approximating the expected value according to the equation
Показатель α определяет степень сглаживания оценки во времени. Этот показатель связан с временной константой, так как равенство (15) приблизительно соответствует экспоненциальному затуханию.Index α determines the degree of smoothing of the estimate over time. This indicator is related to the time constant, since equality (15) approximately corresponds to exponential attenuation.
Постоянная времени Тα экспоненциального затухания в секундах представляет собой приблизительноThe time constant Tα of the exponential decay in seconds is approximately
где fs обозначает частоту дискретизации. Другими словами, отношение пропорциональности (16) показывает, как коэффициенты, фактически являющиеся безразмерными (здесь - α), относящиеся к частоте дискретизации fs, могут быть представлены в виде постоянной времени (здесь - Тα).where f s denotes the sampling rate. In other words, the proportionality relation (16) shows how coefficients that are actually dimensionless (here, α), related to the sampling frequency f s , can be represented as a time constant (here, T α ).
После этого выигрыш от предсказания ω[k] рассчитывают как среднее значение функций когерентности Гd[k,m] по частотам, обозначенным индексами m=0,…, М-1, в соответствии сAfter that, the gain from the prediction ω [k] is calculated as the average value of the coherence functions Г d [k, m] at the frequencies indicated by the indices m = 0, ..., M-1, in accordance with
где М показывает количество частотных полос. Коэффициент усиления эхо-сигнала, близкий к 1, показывает, что микрофонный сигнал может быть (почти) полностью предсказан, исходя из задержанного сигнала громкоговорителя. Вследствие этого вероятность того, что микрофонный сигнал содержит только речь на приемном конце, стремится к 1. Задающий параметр βx при этом можно настраивать в зависимости от значения выигрыша от предсказания ω. Высокое значение выигрыша от предсказания служит показателем наличия голосового сигнала только на дальнем конце, и аттенюация эха должна быть достаточно агрессивной, чтобы устранить все (эхо-)сигналы. Таким образом, помехи удерживаются в пределах нестационарного тракта и устраняются при низшем предельном значении Ls в децибелах (дБ), поскольку задающий параметр выбран как βx=βw=0. Низкое значение выигрыша от предсказания указывает на возможное наличие речевого сигнала как на ближнем, так и на дальнем конце, и эхоподавление должно быть менее агрессивным во избежание артефактов. В этом случае помехи компенсируют по стационарному тракту и устраняют при предельном значении Lw в децибелах (дБ). Здесь применяется параметр βx=βw.where M shows the number of frequency bands. An echo gain close to 1 indicates that the microphone signal can be (almost) completely predicted based on the delayed speaker signal. As a result, the probability that the microphone signal contains only speech at the receiving end tends to 1. In this case, the setting parameter β x can be adjusted depending on the value of the gain from the prediction ω. A high prediction gain is an indication of the presence of a voice signal only at the far end, and echo attenuation should be aggressive enough to eliminate all (echo) signals. Thus, the interference is kept within the non-stationary path and is eliminated at the lowest limit value L s in decibels (dB), since the setting parameter is chosen as β x = β w = 0. A low prediction gain indicates a possible presence of a speech signal at both the near and far ends, and echo cancellation should be less aggressive to avoid artifacts. In this case, the interference is compensated through the stationary path and eliminated at the limiting value of L w in decibels (dB). Here, the parameter β x = β w is applied.
При этом, однако, необходимо отметить, что выигрыш от предсказания также может быть высоким, если сигнал громкоговорителя содержит только шум, улавливаемый микрофоном в отсутствии голосового сигнала. Во избежание выбора завышенного значения управляющего параметра βx, что может привести к избыточному подавлению, применяют второй управляющий параметр - показатель активности речи в канале громкоговорителя. В силу этого, приведенные выше правила вычисления управляющего параметра βx как функции усиления предсказания ω на практике применяют только при наличии в канале громкоговорителя речевой активности.In this case, however, it should be noted that the gain from the prediction can also be high if the loudspeaker signal contains only the noise picked up by the microphone in the absence of a voice signal. To avoid choosing an overestimated value of the control parameter β x , which can lead to excessive suppression, a second control parameter is used - an indicator of speech activity in the loudspeaker channel. Because of this, the above rules for calculating the control parameter β x as a function of enhancing the prediction ω in practice are applied only if there is speech activity in the loudspeaker channel.
В варианте конструкции на фиг.7 технологические операции, описываемые уравнениями с (14) по (17), выполняются вычислителем 270, включая два вычислителя параметров фильтрации 370, и комбинатором 380. Различные варианты конструкции, отображенные на фиг.2-5, предусматривают возможность использования вычислителем 270 не только принимаемого им через вход 280 микрофонного сигнала, который в виде опции показан на фиг.2, но и немодифицированного сигнала громкоговорителя, поступающего через вход 220.In the embodiment of FIG. 7, the technological operations described by equations (14) through (17) are performed by a
Далее будет графически детально проиллюстрирован принцип обработки сигналов с помощью конструкций, реализованных в соответствии с настоящим изобретением и представленных на фигурах с 8 по 10.Next, the principle of signal processing using structures implemented in accordance with the present invention and shown in figures 8 to 10 will be graphically illustrated in detail.
На фиг.8 показан процесс разделения или экстракции стационарной и нестационарной составляющих сигнала громкоговорителя. В разделе (а) фиг.8 дан график спектральной плотности мощности сигнала громкоговорителя на частоте 1 кГц как функции времени в диапазоне приблизительно от 5 до 7,5 сек. Абсцисса графика в разделе (с) фигуры 8 относится ко всем трем разделам (а)-(с). На графике (b) дан график спектральной плотности мощности нестационарной составляющей, а на графике (с) отражена соответствующая спектральная плотность мощности стационарной составляющей сигнала.On Fig shows the process of separation or extraction of stationary and non-stationary components of the loudspeaker signal. Section (a) of FIG. 8 is a graph of the spectral power density of a speaker signal at a frequency of 1 kHz as a function of time in the range of about 5 to 7.5 seconds. The abscissa of the graph in section (c) of figure 8 applies to all three sections (a) - (c). Graph (b) gives a graph of the power spectral density of the non-stationary component, and graph (c) shows the corresponding power spectral density of the stationary component of the signal.
Нестационарная составляющая или сопряженный нестационарный компонентный сигнал, отображенный на графике 8(b), содержит верхние значения, соответствующие каждому случаю роста величины спектральной плотности мощности на графике 8(а). Следует обратить внимание, что в промежутках между этими диапазонами нестационарная компонента почти полностью исчезает.The non-stationary component or the conjugated non-stationary component signal displayed on the graph 8 (b) contains the upper values corresponding to each case of the increase in the power spectral density on the graph 8 (a). It should be noted that in the intervals between these ranges the unsteady component almost completely disappears.
В противоположность нестационарной составляющей на фиг.8(b) стационарная составляющая на фиг.8(с), определяемая с помощью плавающего рекурсивного усреднения по уравнению (7), графически отображает очевидно меньшие амплитуды и в силу плавающего усреднения представляет собой очевидно более пологую кривую. В частности, стационарная составляющая на фиг.8(с), и/или соответствующий стационарный компонентный сигнал в период времени около 6,4 сек имеют экспоненциальное или подобное экспоненциальному понижение, о чем упоминалось в связи с отношением пропорциональности (16). Такой спад является следствием отсутствия в спектре мощности в этом диапазоне на фиг.8(а) больших величин, которые соответствуют голосовым сигналам. Спектральные составляющие, выходящие за пределы стационарной составляющей, соответственно, удаляются.In contrast to the non-stationary component in Fig. 8 (b), the stationary component in Fig. 8 (c), determined using floating recursive averaging according to equation (7), graphically displays obviously lower amplitudes and, due to floating averaging, is an obviously more gentle curve. In particular, the stationary component in Fig. 8 (c) and / or the corresponding stationary component signal have an exponential or similar exponential decrease over a period of about 6.4 seconds, as mentioned in connection with the proportionality relation (16). Such a decline is a consequence of the absence in the power spectrum in this range of Fig. 8 (a) of large quantities that correspond to voice signals. Spectral components that go beyond the stationary component, respectively, are removed.
Основываясь на данных фиг.8, фиг.9 отображает соответствующие эхокомпенсирующие фильтры. Говоря конкретнее, на фиг.9 даны две соотносящиеся кривые двух взаимосвязанных фильтров эхокомпенсации Hs и Hw на частоте 1 кГц, рассчитанные на базе уравнений (12) и (13). Так, на фиг.9(а) отображена функция фильтра эхокомпенсации Hs, рассчитанного по уравнению (12), для нестационарной составляющей на частоте 1 кГц. В разделе (b) дан график функции соответствующего эхокомпенсирующего фильтра Hw для стационарной составляющей, построенный в соответствии с уравнением (13).Based on the data of FIG. 8, FIG. 9 displays respective echo cancellation filters. More specifically, Fig. 9 shows two correlating curves of two interconnected echo cancellation filters H s and H w at a frequency of 1 kHz, calculated on the basis of equations (12) and (13). So, FIG. 9 (a) shows the function of the echo cancellation filter H s calculated according to equation (12) for the non-stationary component at a frequency of 1 kHz. Section (b) gives a graph of the function of the corresponding echo canceller filter H w for the stationary component, constructed in accordance with equation (13).
Фиг.10 графически представляет идентичные параметры в расширенном масштабе времени, отображенном на абсциссе графика 10(с) и относящемся одновременно к фигурам 10(а) и 10(b). На фиг.10 показана зависимость от величины управляющего параметра βx - на графике 10(а) - процесса сепарации стационарной/нестационарной составляющих и - на графике 10(b) - выигрыша от предсказания ω на фоне речевой активности канала громкоговорителя, отображенной на графике 10(с).Figure 10 graphically represents identical parameters in an extended time scale displayed on the abscissa of the graph 10 (c) and relating simultaneously to figures 10 (a) and 10 (b). Figure 10 shows the dependence on the value of the control parameter β x - in graph 10 (a) - the process of separation of stationary / non-stationary components and - in graph 10 (b) - gain from the prediction ω against the background of the speech activity of the loudspeaker channel displayed in graph 10 (from).
Определяя точнее, фиг.10 наглядно демонстрирует взаимозависимость между управляющим параметром βx и двумя другими параметрами управления - ω и речевой активности, введенными и описанными ранее. Первая треть процесса, смоделированного на фиг.10, протекает в условиях, характеризуемых наличием речевого сигнала только на дальнем конце и высоким выигрышем от предсказания. В этом случае управляющему параметру βx задано значение βx=βw=0, соответствующее агрессивному режиму подавления нестационарной составляющей и полному подавлению стационарной составляющей.Determining more precisely, figure 10 clearly demonstrates the interdependence between the control parameter β x and two other control parameters - ω and speech activity, introduced and described earlier. The first third of the process modeled in FIG. 10 proceeds under conditions characterized by the presence of a speech signal only at the far end and a high gain from the prediction. In this case, the control parameter β x is set to β x = β w = 0, which corresponds to the aggressive mode of suppressing the non-stationary component and the complete suppression of the stationary component.
Вторая треть модели отображает ситуацию, характеризуемую наличием речевого сигнала только на дальнем конце и возможностью его распознания при низком коэффициенте усиления предсказания ω и отсутствием речевой активности в сигнале громкоговорителя. При этом величина управляющего параметра βx задается так, чтобы обеспечить прохождение всех стационарных составляющих по стационарному тракту и их устранение на низком уровне агрессивности, предупреждающем внесение артефактов. Последняя треть модели воспроизводит режим диалога, при котором управляющий параметр βx варьируется между низкими значениями при наличии речевой активности в канале громкоговорителя и более высокими значениями, когда речевая активность не распознается.The second third of the model displays a situation characterized by the presence of a speech signal only at the far end and the possibility of its recognition with a low prediction gain ω and the absence of speech activity in the speaker signal. In this case, the value of the control parameter β x is set so as to ensure that all stationary components pass along the stationary path and eliminate them at a low level of aggressiveness, preventing artifacts from being introduced. The last third of the model reproduces a dialogue mode in which the control parameter β x varies between low values when there is speech activity in the speaker channel and higher values when speech activity is not recognized.
В описанных выше вариантах реализации предлагаемого изобретения, включая фиг.6, также представляющую собой общую блок-схему соответствующего алгоритма, раздельное подавление стационарных и нестационарных составляющих эха осуществляется не за счет разделения соответствующих сигналов громкоговорителя, а за счет оценки эхо-сигнала в целом.In the embodiments of the invention described above, including FIG. 6, which is also a general block diagram of the corresponding algorithm, the separate suppression of the stationary and non-stationary components of the echo is carried out not by separating the corresponding loudspeaker signals, but by evaluating the echo signal as a whole.
Во всех рассмотренных версиях осуществления изобретения оценка спектральной плотности мощности эхо-сигнала выполнялась посредством применения фильтра предварительного анализа эхо-сигнала G[k,m] или G[k,m]2 к задержанному варианту спектра мощности сигнала громкоговорителя согласно уравнению (8), гдеIn all considered versions of the invention, the evaluation of the spectral density of the power of the echo signal was performed by applying the filter of preliminary analysis of the echo signal G [k, m] or G [k, m] 2 to the delayed version of the power spectrum of the signal of the speaker according to equation (8), where
оценка спектра мощности эха, содержащаяся в сигнале микрофона. В результате разделения спектра мощности сигнала громкоговорителя в соответствии с уравнением (3) на стационарные |Xw[k,m]|2 и нестационарные |Xs[k,m]|2 составляющие эхо-сигнал, возникающий из нестационарной компоненты сигнала громкоговорителя, рассчитывается с помощью уравнения (10), а эхо-сигнал, возникающий из стационарных компонент сигнала громкоговорителя, получается из уравнения (9).an estimate of the echo power spectrum contained in the microphone signal. As a result of dividing the power spectrum of the loudspeaker signal in accordance with equation (3) into stationary | X w [k, m] | 2 and non-stationary | X s [k, m] | The 2 components of the echo arising from the non-stationary component of the loudspeaker signal are calculated using equation (10), and the echo signal arising from the stationary components of the loudspeaker signal is obtained from equation (9).
Используя оценки нестационарныхUsing estimates of non-stationary
и стационарныхand stationary
эхо-сигналов, можно рассчитать соответствующие фильтры эхокомпенсации Hs[k,m] и Hw[k,m]. Затем эти фильтры эхокомпенсации объединяются и используются для подавления эха в сигнале микрофона в соответствии с уравнениемecho signals, the corresponding echo cancellation filters H s [k, m] and H w [k, m] can be calculated. These echo cancellation filters are then combined and used to suppress the echo in the microphone signal in accordance with the equation
где H[k,m] выводится изwhere H [k, m] is derived from
Один из возможных способов объединения разных эхокомпенсирующих фильтров Hs[k,m] и Hw[k,m] состоит в использовании их выходных данных в соответствии с уравнением (11), что аналогично последовательному соединению двух фильтров.One possible way to combine different echo cancellation filters H s [k, m] and H w [k, m] is to use their output in accordance with equation (11), which is similar to connecting two filters in series.
Другой возможный способ заключается в использовании соответствующего минимума эхокомпенсирующих фильтров согласноAnother possible way is to use an appropriate minimum of echo cancellation filters according to
где функция min(…) представляет минимум соответствующих величин. Другими словами, в данном случае применено соответствие (…)=min(…).where the function min (...) represents the minimum of the corresponding quantities. In other words, in this case, the correspondence (...) = min (...) is applied.
Как пояснялось выше, эти вычисления могут быть выполнены, в частности, комбинатором 380, а кроме того, селектором 390 или распределителем 410. В дополнение к этому отдельные устройства способны осуществлять более сложные операции комбинирования и расчета индивидуальных заграждающих фильтров, базирующихся, например, на линейных построениях или нелинейных уравнениях. Также, предусмотрена возможность комбинирования не только полосовых сигналов, но и групп полосовых сигналов или всей совокупности полосовых сигналов.As explained above, these calculations can be performed, in particular, by
Благодаря комбинированию эхокомпенсирующих фильтров для разных составляющих эха могут быть введены различные коэффициенты усиления. Фильтр компенсации нестационарного эха рассчитывается по уравнению (12), а фильтр компенсации стационарного эхо-сигнала вычисляется согласно уравнению (13).By combining echo cancellation filters for different echo components, different gain factors can be introduced. The non-stationary echo cancellation filter is calculated according to equation (12), and the stationary echo cancellation filter is calculated according to equation (13).
Часто на практике эхоподавление осуществляется не на базе прямого приложения фильтров эхокомпенсации в соответствии с уравнениями (12) и (13), а на базе соответствующих сглаженных по времени версий. Подобно вышеописанным расчетным параметрам параметры временного сглаживания также могут быть откорректированы вручную отдельно для подавления нестационарного и стационарного эхо-сигналов. Таким образом, качество воспринимаемого звука может быть улучшено, поскольку требования к подавлению стационарных шумовых составляющих отличаются от требований к компенсации нестационарных составляющих голосового сигнала.Often, in practice, echo cancellation is not based on the direct application of echo cancellation filters in accordance with equations (12) and (13), but on the basis of the corresponding time-smoothed versions. Like the calculation parameters described above, the temporal smoothing parameters can also be manually adjusted separately to suppress non-stationary and stationary echo signals. Thus, the quality of the perceived sound can be improved, since the requirements for suppressing stationary noise components are different from the requirements for compensating for non-stationary components of a voice signal.
Скажем, хорошо известно, что для подавления стационарных составляющих сигнала требуется более интенсивное сглаживание во избежание так называемых музыкальных тонов. С другой стороны, сглаживание, задаваемое фильтрам компенсации нестационарного эха, должно поддерживать более низкие значения, чтобы в достаточной мере подавлять эхо-сигналы, вносимые длительными составляющими пути эха, или длинными хвостами пути эха. Тем не менее, при этом не должен нарушаться порядок прохождения быстро изменяющихся уровней эха. Обсуждение качества восприятия ясно показывает необходимость индивидуальной адаптации и оптимизации двух разновидностей фильтров эхокомпенсации в соответствии с уравнениями (12) и (13).Say, it is well known that to suppress the stationary components of a signal, more intensive smoothing is required to avoid the so-called musical tones. On the other hand, the anti-aliasing given to the non-stationary echo compensation filters should maintain lower values to sufficiently suppress the echoes introduced by the long components of the echo path, or the long tails of the echo path. However, this should not interfere with the passage of rapidly changing echo levels. The discussion of the quality of perception clearly shows the need for individual adaptation and optimization of two types of echo cancellation filters in accordance with equations (12) and (13).
Описываемый далее подход к реализации предлагаемого способа и/или устройства заключается в раздельном применении эхокомпенсирующих фильтров к стационарным и нестационарным составляющим сигнала.The following approach to the implementation of the proposed method and / or device consists in the separate application of echo cancellation filters to the stationary and non-stationary components of the signal.
На фиг.11 дана принципиальная блочная схема устройства 200, включающего в себя адаптивный фильтр 210. Однотипность конструкций позволяет в дальнейшем ссылаться на конструктивные решения, представленные на фиг.2-5, 6 и 7.Figure 11 is a schematic block diagram of a
Устройство 200 согласно изобретению включает в себя громкоговоритель 100 или терминал для подключения громкоговорителя 100, или вход для сигнала громкоговорителя x[n]. Времячастотный преобразователь (ВЧП) 230, обозначенный на схеме как ДПФ (дискретное преобразование Фурье), конвертирует сигнал громкоговорителя x[n] в трансформанту в виде X[k,m]. Затем, сигнал громкоговорителя поступает на устройство задержки 480, которое формирует задержанный сигнал X[k-d(k,m),m] с величиной задержки d(k,m).The
От устройства задержки 480 задержанный сигнал передается на первый фильтр предварительного анализа эхо-сигнала 240, который на базе коэффициентов фильтрацииFrom the
G[k,m] генерирует оценочный сигнал эхаG [k, m] generates an estimated echo signal
Оценочный сигнал эхаEcho Evaluation
посылается на экстрактор 250, который, исходя из спектральных коэффициентов такого оцененного эхо-сигнала, генерирует нестационарные и стационарные спектры мощности этого сигнала как (производные) составляющие сигнала громкоговорителя.sent to the
После этого сигналыAfter that signals
и and
выводятся из экстрактора 250 на вычислитель 270.output from the
Сигнал y[n] микрофона 110 вводится во времячастотный преобразователь (ВЧП) 290, сокращенно обозначенный ДПФ, который преобразует его из временной области в спектральное представление Y[k,m]. Преобразованный сигнал поступает в вычислитель уровня энергии 490, который, учитывая спектральные компоненты сигнала микрофона, рассчитывает их спектральную плотность мощности путем возведения в квадрат (абсолютной) величины каждого показателя. Полученный таким образом спектр мощности также вводится в вычислитель 270, который параллельно с вышеописанными спектрами мощности рассчитывает два фильтра эхокомпенсации Hs[k,m] и Hw[k,m], коэффициенты пропускания действующего адаптивного фильтра H[k,m] и передает их на адаптивный фильтр 210.The signal y [n] of the
Адаптивный фильтр 210 одновременно сопряжен с выходом времячастотного преобразователя 290 и, следовательно, тоже получает спектральные компоненты Y[k,m] микрофонного сигнала y[n], из которого он вырабатывает сигнал с блокированным эхом в частотной области H[k,m], учитывая коэффициенты фильтрации H[k,m]. Затем данный сигнал с компенсированным эхом передается на частотно-временной преобразователь (ЧВП) 300, обозначенный на схеме как ОДПФ (обратное ДПФ), который в завершение преобразует этот сигнал назад во временную область.The
С целью установления величины задержки d(k, m) для устройства задержки 480 и для определения коэффициентов фильтра предварительного анализа эхо-сигнала 240 представления в области спектра сигнала громкоговорителя X[k,m] и сигнала микрофона Y[k,m] вводятся в соответствующий вычислитель энергии 500, 510, каждый из которых соединен с выходом времячастотного преобразователя 230, 290, соответственно. Вычислитель уровня энергии 500 соединен с выходом времячастотного преобразователя 230, вычислитель уровня энергии 510 соединен с выходом частотно-временного преобразователя 300.In order to establish the delay value d (k, m) for the
Каждый из двух вычислителей величины энергии 500 и 510 вычисляет, как и вычислитель уровня энергии 490, спектральные плотности мощности, возводя в квадрат величины соответствующих спектральных компонент, и выводит на следующий вычислитель 520. На основе введенных в него величин вычислитель 520 оценивает величину задержки d(k,m) и коэффициенты пропускания G[k,m] фильтра предварительного анализа эхо-сигнала 240. Параллельно вычислитель 520 сопряжен с устройством задержки 480 и с фильтром предварительного анализа эхо-сигнала 240, на которые пересылаются полученные им соответствующие показатели.Each of the two
Как следует из варианта решения на фиг.11, соответствующие компонентные сигналыAs follows from the solution in FIG. 11, the corresponding component signals
( и ),( and ),
таким образом, могут быть разделены на базе оценки спектра эхо-сигналаthus can be divided based on the evaluation of the spectrum of the echo
которая делается в соответствии с уравнениемwhich is done in accordance with the equation
Указанное вычисление выполняется фильтром предварительного анализа эхо-сигнала 240.The specified calculation is performed by the filter preliminary analysis of the
Определение двух фильтров эхокомпенсации Hs[k,m] и Hw[k,m] согласно уравнениям (12) и (13) остается неизменным. То же применимо к определению объединенного эхокомпенсирующего фильтра H[k,m]. Следовательно, дополнительный способ и соотнесенное с ним устройство 200, представленные на фиг.11, основаны на заключении, что стационарные и нестационарные составляющие эха спрогнозированных эхо-сигналов некоррелированы, так чтоThe determination of the two echo cancellation filters H s [k, m] and H w [k, m] according to equations (12) and (13) remains unchanged. The same applies to the definition of the combined echo canceller filter H [k, m]. Therefore, the additional method and associated
Тогда, оценочные спектры мощности стационарных составляющих эха могут быть определены путем вычитания оценки стационарной составляющей эха из спектральной плотности мощности оценочного эхо-сигнала.Then, the estimated power spectra of the stationary components of the echo can be determined by subtracting the estimates of the stationary component of the echo from the power spectral density of the estimated echo signal.
Таким образом,In this way,
На практике сигнал |Ŷs[k,m]|2 оценивается путем фильтрации спектра мощности эхо-сигнала, рассчитенного, следуяIn practice, the signal | Ŷ s [k, m] | 2 is estimated by filtering the power spectrum of the echo signal calculated by following
Поскольку используемый фильтр усиления Fy[k,m] или квадрат его значения Fy[k,m]2 определяется по аналогии с фильтром усиления Fx[k,m] или Fx[k,m]2, этот компонент здесь подробно не истолковывается. Подобные функции выполняет также экстрактор 250, используя полученные сигналы.Since the used gain filter F y [k, m] or the square of its value F y [k, m] 2 is determined by analogy with the gain filter F x [k, m] or F x [k, m] 2 , this component is detailed here not construed. The
Здесь следует отметить, что конструктивное решение, показанное на фиг.11, относится к тому случаю, когда оцененный спектр эхо-сигнала уже известен. Безусловно, подобный способ применим также, когда известен только сигнал расчетной мощности эхо-сигнала , оцененного с применением уравнения (8). Подобный вариант рассмотрен подробно при описании технического решения, отображенного на фиг.12.It should be noted here that the constructive solution shown in FIG. 11 relates to the case where the estimated echo spectrum already known. Of course, this method is also applicable when only the signal of the estimated power of the echo signal is known. estimated using equation (8). A similar option is considered in detail in the description of the technical solution shown in Fig. 12.
Блок-схема на фиг.12 иллюстрирует подход, аналогичный представленному на фиг.11 алгоритму аттенюации акустического эха способом сепарации стационарных и нестационарных составляющих эха на основе ожидаемого спектра эха Тем не менее, способ на фиг.12 отличается тем, что при нем аттенюация акустического эха построена на разделении стационарных и нестационарных составляющих эха на базе оценки спектральной плотности мощности эхо-сигнала The flowchart of FIG. 12 illustrates an approach similar to that presented in FIG. 11 for an acoustic echo attenuation algorithm for separating stationary and non-stationary echo components based on the expected echo spectrum. However, the method of FIG. 12 is characterized in that, with it, attenuation of the acoustic echo is based on the separation of stationary and non-stationary components of the echo based on an estimate of the spectral power density of the echo signal
Из следующего ниже описания очевидно, что реализации на фигурах 11 и 12 аналогичны между собой не только по своим функциям, но и по конструкции.From the following description, it is obvious that the implementations in figures 11 and 12 are similar to each other not only in their functions, but also in design.
Говоря конкретнее, существенным отличием версии на фиг.12 от фиг.11 является то, что вычислитель уровня энергии 500, принимающий и обрабатывающий преобразованный в частотную область сигнал громкоговорителя x[n], смонтирован не строго перед вычислителем 520, а подключен напрямую к выходу времячастотного преобразователя 230 в конфигурации ДПФ. При подобной компоновке, как на вычислитель 520, так и на устройство задержки 480 на фильтр предварительного анализа эхо-сигнала 240 и на экстрактор 250 больше не поступают собственно спектральные составляющие, а их спектры мощности.More specifically, a significant difference between the version of FIG. 12 and FIG. 11 is that the
В остальном, две разновидности одной конструкции на фиг.11 и 12 различаются только тем, что аналогичные вычисления выполняются в них разными элементами и устройствами несколько по-разному. В частности, экстрактор 250 не выполняет вычисление энергопоказателей отдельных компонент спектра, поскольку это было предварительно сделано вычислителем величины энергии 500.Otherwise, the two varieties of the same design in FIGS. 11 and 12 differ only in that similar calculations are performed in them by different elements and devices in slightly different ways. In particular, the
На фиг.13 показан вариант технического исполнения изобретения, в котором, например, на устройство 200 поступает больше одного сигнала громкоговорителя или больше одного сигнала микрофона. Формулируя иначе, на фиг.13 представлена реализация многоканального устройства.FIG. 13 shows an embodiment of the invention in which, for example, more than one loudspeaker signal or more than one microphone signal is supplied to the
Ранее были описаны и обсуждены конструктивные решения данного изобретения с раздельными каналами или с одиночным каналом для передачи только одного сигнала громкоговорителя и одного сигнала микрофона, однако данное изобретение не ограничивается лишь одноканальным исполнением, что и будет рассмотрено далее. Предшествующие варианты конструкции по аналогии могут быть применены в многоканальных системах глушения акустического эха.Previously, structural solutions of the present invention with separate channels or with a single channel for transmitting only one loudspeaker signal and one microphone signal have been described and discussed, however, this invention is not limited to a single-channel execution, which will be discussed later. The previous design options by analogy can be applied in multichannel acoustic echo jamming systems.
Поскольку версия устройства 200 на фиг.13 в целом аналогична конструкции на фиг.2, ниже при описании режимов работы, соединений и других аспектов будут даваться ссылки на описание фиг.2-5.Since the version of the
Отображенный на фиг.13 многоканальный вариант устройства 200 имеет неограниченное количество входов 220-1, 220-2, …, через которые на него может поступать множество сигналов громкоговорителя. Соответственно, устройство 200 может включать в свой состав опцию в виде необходимого количества времячастотных преобразователей 230-1, 230-2, … для перевода или преобразования сигналов громкоговорителя из временной области в частотную область, о чем подробно говорилось в связи с фиг.2.The multichannel embodiment of the
Все времячастотные преобразователи 230 сопряжены с соответствующим количеством входов группиратора 530, который объединяет входящие сигналы громкоговорителя в производный сигнал громкоговорителя, который затем пересылается на первый фильтр предварительного анализа эхо-сигнала 240 или на экстрактор 250 в зависимости от того, смонтирован ли произвольный первый фильтр предварительного анализа эхо-сигнала 240. В контексте фиг.2 уже говорилось, что экстрактор 250 может быть соединен с произвольным вторым фильтром предварительного анализа эхо-сигнала 260 или непосредственно с вычислителем 270. Названный вычислитель формирует на выходе рассчитанные коэффициенты фильтрации.All time-
В отличие от варианта на фиг.2 многоканальное устройство 200 на фиг.13, кроме того, содержит в своей конструкции группиратор 540, входные каналы которого подключены к соответствующему количеству входных терминалов 280-1, 280-2, … для микрофонных сигналов, возможно, через посредство времячастотных преобразователей 290-1, 290-2, …, также являющихся опцией. Группиратор 540, подобно группиратору 530, формирует на основании принятых микрофонных сигналов во временном или в частотном представлении производный - эффективный или общий - сигнал микрофона, который может факультативно быть передан на экстрактор 250 или вычислитель 270.In contrast to the variant in FIG. 2, the
Далее, устройство 200 в многоканальном исполнении, как показано на фиг.13, содержит адаптивные фильтры 210-1, 210-2, … для каждого микрофонного сигнала или каждого терминала ввода микрофонного сигнала 280, причем подключение адаптивных фильтров 210-1, 210-2, … к соответствующим входам 280-1, 280-2 … произвольно возможно через времячастотные преобразователи 290-1, 290-2,… Так же, адаптивные фильтры 210-1, 210-2, … соединены с соответствующими выходными терминалами 310-1, 310-2…, при необходимости - через соответствующее количество частотно-временных преобразователей 300-1, 300-2, … На выходе адаптивных фильтров 210 сигналы, очищенные от эха или спектрально модифицированные, поступают на терминалы вывода 310 из устройства 200.Further, the
Все адаптивные фильтры 210-1, 210-2,… параллельно соединены с выходом вычислителя 270, с которого они получают коэффициенты фильтрации. Другими словами, в варианте реализации на фиг.13 все множество микрофонных сигналов фильтруется, с функциональной точки зрения, одним и тем же адаптивным фильтром, то есть базируясь на одних и тех же коэффициентах фильтрации, с целью получения спектрально модифицированных или эхокомпенсированных интерпретаций соответствующих микрофонных сигналов.All adaptive filters 210-1, 210-2, ... in parallel are connected to the output of the
Следовательно, если x1[n] - сигналы громкоговорителя 1, где 1 - целое число в пределах от 0 до L - 1 и где L обозначает количество громкоговорителей или сигналов громкоговорителя, то та же самая модель может быть введена по аналогии с уравнением (1) в соответствии сTherefore, if x 1 [n] are
где xs,1[n] модулирует составляющую нестационарной речи, a xw,1[n] модулирует составляющую стационарного шума, которые содержатся в сигнале громкоговорителя 1. В соответствии с уравнением (2) ОПФ-представление уравнения (25) выводят изwhere x s, 1 [n] modulates the component of non-stationary speech, ax w, 1 [n] modulates the component of stationary noise contained in the signal of
Затем с помощью группиратора 530, который можно видеть на фиг.13, вычисляют общий, групповой спектр мощности всех каналов громкоговорителя, полученный путем объединения индивидуальных спектров сигналов громкоговорителя в соответствии сThen, using the
где L обозначает количество каналов громкоговорителя. После этого нестационарные и стационарные компоненты сигнала сепарируют согласно уравнениям (5) и (7) с учетом общей или сгруппированной спектральной плотности мощности, следуя уравнению (27).where L denotes the number of speaker channels. After that, non-stationary and stationary signal components are separated according to equations (5) and (7) taking into account the total or grouped power spectral density, following equation (27).
По аналогии с этим вычисляют общий или объединенный спектр мощности каналов микрофона в соответствии сBy analogy with this, the total or combined power spectrum of the microphone channels is calculated in accordance with
где Yp[k,m] определяет сигнал микрофона 110 p, а P отображает количество микрофонов. Показатель p - также целое число в пределах от 0 до Р - 1. В версии на фиг.13 этот расчет может быть выполнен вторым группиратором 540.where Y p [k, m] determines the microphone signal 110 p, and P displays the number of microphones. The exponent p is also an integer ranging from 0 to P - 1. In the version of FIG. 13, this calculation can be performed by the
Для определения двух фильтров эхокомпенсации в соответствии с уравнениями (12) и (13) в качестве следующих шагов алгоритма используют спектры (мощности) громкоговорителя |X[k,m]|2 в соответствии с уравнением (27) и спектр (мощности) микрофона |Y[k,m]|2 в соответствии с уравнением (28), как уже описывалось выше. Задание управляющего параметра βx согласно уравнениям с (14) по (17), описанное выше в контексте контроля рабочих процессов, может быть выполнено также на базе общих или групповых спектров согласно уравнениям (27) и (28).To determine the two echo cancellation filters in accordance with equations (12) and (13), the spectra (powers) of the loudspeaker | X [k, m] | 2 in accordance with equation (27) and the spectrum (power) of the microphone | Y [k, m] | 2 in accordance with equation (28), as already described above. The setting of the control parameter β x according to equations (14) to (17), described above in the context of monitoring work processes, can also be performed on the basis of general or group spectra according to equations (27) and (28).
Собственно эхоподавление в рамках модификации спектра выполняют затем для каждого сигнала микрофона индивидуально, но с использование одного фильтра эхокомпенсации 210 для каждого микрофонного канала, следуя уравнениюActually, the echo cancellation as part of the spectrum modification is then performed individually for each microphone signal, but using one
при p=0, 1,…,P-1.at p = 0, 1, ..., P-1.
Но, как говорилось выше, эхокомпенсирующие фильтры 210 могут быть реализованы по-другому, скажем, в соответствии с уравнением (19).But, as mentioned above, echo cancellation filters 210 can be implemented differently, say, in accordance with equation (19).
Здесь следует отметить, что при многоканальном исполнении устройства 200, как, например, на фиг.13, количество сигналов громкоговорителя L и количество сигналов микрофона Р может быть и одинаковым, и различным. В принципе, количество входных сигналов громкоговорителя и микрофона может быть любым. Более того, не обязательно применение обоих группираторов 530, 540 для множества входных сигналов громкоговорителя и микрофона. Изобретение допускает ввод только множества сигналов громкоговорителя с помощью группиратора 530 без использования группиратора 540 для множества микрофонных сигналов. Такая система применима, когда один микрофонный сигнал от одного абонента на дальнем конце линии связи поступает на несколько громкоговорителей, например, при диспетчерской связи с автомобилями.It should be noted here that with the multi-channel design of the
Естественно, нет необходимости задействовать многоканальный группиратор 530 для ввода одного сигнала громкоговорителя, например, центрального в системе конференцсвязи, где каждый из множества участников диалога имеет персональный микрофон. В такой ситуации рекомендуется введение группиратора 540.Naturally, there is no need to use
Следует дополнить, что конструкции с группираторами 530 и 540 могут быть рассчитаны на большее число сигналов громкоговорителя или микрофона, чем на них поступает в конкретный момент. Естественно, что в устройстве 200 может быть предусмотрено большее количество входов 220, 280, чем используется практически. В подобных случаях предшествующие по схеме контуры, например произвольные времячастотные преобразователи 230, 290 или группираторы 530, 540, способны самостоятельно определять количество рабочих каналов и выбирать соответствующие показатели L и Р. Естественно, также предусмотрен ввод показателей количества каналов и ожидаемого количества сигналов микрофонов и громкоговорителей извне.It should be added that designs with
Кроме того, конструктивное решение, представленное на фиг.13, конечно, может работать с одиночными сигналами громкоговорителя и микрофона, в группиратор 530 введены соответствующие показатели L и Р. В принципе, уравнения (27) и (28) применимы при Р=1 и/или L=1. Таким образом, конструктивное решение, показанное на фиг.13, представляет собой совместимое „сверху вниз” расширение версии реализации на фиг.2.In addition, the constructive solution presented in Fig. 13, of course, can work with single signals of the loudspeaker and microphone, the corresponding indicators L and P are introduced into the
Частотное разрешение рекомендуется в форме производного от ОПФ. Равномерность ОПФ по спектральному разрешению не очень хорошо соотносится с физиологией человеческого слуха. В силу этого предпочтительно следует перегруппировать равномерно распределенные коэффициенты |X[k,m]|2 и |Y[k,m]|2 в порядок непересекающихся секторов или групп, как показано в [С.Faller and F.Baumgarte. Binaural Cue Coding - Part II: Schemes and applications. IEEE Trans. on Speech and Audio Proc., 11(6): 520-531, Nov. 2003], содержащих полосы частот, соотносимых по частотной разрешающей способности со слуховой системой человека, как представлено, в частности, в [10].Frequency resolution is recommended in the form of a derivative of OPF. The uniformity of OPF in spectral resolution does not correlate very well with the physiology of human hearing. Therefore, it is preferable to rearrange the uniformly distributed coefficients | X [k, m] | 2 and | Y [k, m] | 2 into the order of disjoint sectors or groups, as shown in [C. Faller and F. Baumgarte. Binaural Cue Coding - Part II: Schemes and applications. IEEE Trans. on Speech and Audio Proc., 11 (6): 520-531, Nov. 2003], containing frequency bands correlated in frequency resolution with the human auditory system, as presented, in particular, in [10].
Частоте дискретизации 16 кГц при кратковременном преобразовании Фурье нормально соответствует длина блока ДПФ в 512 отсчетов и 15 групп, или сегментов, каждый из которых имеет полосу пропускания, примерно соответствующую двойной ширине эквивалентной прямоугольной полосы пропускания (ERB/ЭППП), о чем говорится в [В.R.Glasberg and В. С.J.Moore. Derivation of auditory filter shapes from notched-noise data. Hear. Res., 47: 103-138, 1990]. Полосы пропускания соответствуют сегментам, как показано на фиг.14.The sampling frequency of 16 kHz during the short-term Fourier transform normally corresponds to the length of the DFT block of 512 samples and 15 groups or segments, each of which has a passband that approximately corresponds to the double width of the equivalent rectangular passband (ERB / EPT), as described in [B .R. Glasberg and B.C. J. Moore. Derivation of auditory filter shapes from notched-noise data. Hear. Res., 47: 103-138, 1990]. The bandwidths correspond to segments, as shown in FIG.
На фиг.14 показано, как коэффициенты равномерного спектра ОПФ могут быть сгруппированы или разложены с целью имитации неравномерного частотного разрешения слуховой системы человека. Как видно на фиг.14, ось частоты проходит от 0 Гц примерно до 8000 Гц, что соответствует эффективной полосе пропускания, основанной на частоте дискретизации 16 кГц.On Fig shows how the coefficients of the uniform spectrum of OPF can be grouped or decomposed in order to simulate the uneven frequency resolution of the human auditory system. As can be seen in FIG. 14, the frequency axis extends from 0 Hz to about 8000 Hz, which corresponds to an effective bandwidth based on a sampling frequency of 16 kHz.
Фильтры усиления рассчитываются только для центральной частоты каждой группы. Дополнительно это снижает вычислительную сложность по сравнению с полным спектральным разрешением равномерного ОПФ. Перед применением фильтра усиления последнего сегмента или группы к равномерному сигналу спектра ОПФ последний интерполируется фильтрами-интерполяторами Ханна.Gain filters are only calculated for the center frequency of each group. Additionally, this reduces computational complexity compared to the full spectral resolution of uniform OPF. Before applying the gain filter of the last segment or group to a uniform signal of the OPF spectrum, the latter is interpolated by Hann interpolator filters.
На фиг.15(а) показаны интерполирующие фильтры Ханна, применимые для сглаживания фильтров усиления в зависимости от частоты. На фиг.15(b) в виде сплошной линии показаны коэффициенты фильтров усиления, интерполированные из значений фильтров усиления в отдельных сегментах, отмеченных, в свою очередь, жирными точками.FIG. 15 (a) shows Hann interpolation filters useful for smoothing frequency-dependent gain filters. On Fig (b) in a solid line shows the coefficients of the gain filters, interpolated from the values of the gain filters in individual segments, marked, in turn, by thick dots.
Изображение (а) на фиг.15 подробно представляет фильтры Ханна, изображение (b) приводит пример значений фильтра усиления до и после интерполяции. Точки на фиг.15b обозначают величины до интерполяции, в то время как сплошная линия соответствует значениям, полученным в результате интерполяции. Сглаживание фильтров усиления по частоте дает в результате сглаженный вариант спектра как функции частоты и, таким образом, компенсирует музыкальные тоны и другие артефакты.Image (a) in Fig. 15 represents Hann filters in detail, image (b) gives an example of gain filter values before and after interpolation. The points in FIG. 15b indicate the values before interpolation, while the solid line corresponds to the values obtained by interpolation. Smoothing the frequency gain filters results in a smoothed version of the spectrum as a function of frequency and thus compensates for musical tones and other artifacts.
Предшествующее описание вариантов конструктивных решений показало, что данное изобретение реализуется за счет введения в предлагаемую конструкцию различных функциональных блоков, которые выполняют определенную последовательность операций, составляющих заданный алгоритм, обобщенно представленный ниже. Осуществление предлагаемого изобретения включает в себя следующий порядок действий: прием, по меньшей мере, одного сигнала громкоговорителя, прием, по меньшей мере, одного сигнала микрофона, преобразование сигнала громкоговорителя и сигнала микрофона в кратковременные спектры, вычисление спектральной плотности мощности сигналов громкоговорителя и микрофона, выделение или разложение спектральной плотности мощности на стационарную и нестационарную составляющие, расчет фильтра усиления эхокомпенсации с использованием стационарных спектров мощности громкоговорителя, расчет фильтра усиления эхокомпенсации с использованием нестационарного спектра мощности громкоговорителя, применение фильтра усиления к спектру микрофона для подавления эхо-сигнала, обратное преобразование эхокомпенсированного спектра микрофона во временную область.The previous description of the options for constructive solutions showed that this invention is implemented by introducing into the proposed design various functional units that perform a certain sequence of operations that make up a given algorithm, summarized below. The implementation of the invention includes the following procedure: receiving at least one loudspeaker signal, receiving at least one microphone signal, converting the loudspeaker signal and the microphone signal into short-term spectra, calculating the power spectral density of the loudspeaker and microphone signals, highlighting or decomposition of the power spectral density into stationary and non-stationary components, calculation of an echo cancellation amplification filter using stationary loudspeaker power spectra, calculating an echo cancellation gain filter using an unsteady loudspeaker power spectrum, applying an amplification filter to the microphone spectrum to suppress the echo signal, inverting the echo-compensated microphone spectrum to the time domain.
В зависимости от условий способ, составляющий настоящее изобретение, может быть осуществлен как в виде аппаратных средств, так и в виде программного обеспечения. Изобретение может быть реализовано на любом цифровом накопителе, в частности на гибком диске, CD или DVD, несущем электронно-считываемые управляющие сигналы, которые могут взаимодействовать с программируемой компьютерной системой таким образом, чтобы мог быть осуществлен изобретенный способ. Реализация настоящего изобретения, в основном, представляет собой программное обеспечение или компьютерную программу, или программный продукт с кодом программы, хранящиеся на машиночитаемом носителе, предназначенные для осуществления предлагаемого способа при условии выполнения программы на компьютере или микропроцессоре. Другими словами, данное изобретение может быть реализовано в виде компьютерной программы или программного обеспечения, или программы, имеющих код программы, для осуществления предлагаемого в изобретении способа при выполнении программы с использованием процессора. Процессор может быть схемотехническим элементом компьютера, чип-карты (интеллектуальной карты), интегрированной системы SOC (SOC = система на кристалле), прикладной интегральной схемы (ASIC) или какой-либо иной интегральной микросхемы (ИС).Depending on the conditions, the method constituting the present invention can be implemented both in hardware and in software. The invention can be implemented on any digital storage device, in particular a floppy disk, CD or DVD, carrying electronically readable control signals that can interact with a programmable computer system so that the inventive method can be implemented. The implementation of the present invention, basically, is a software or computer program, or software product with program code stored on a machine-readable medium, designed to implement the proposed method, provided that the program is executed on a computer or microprocessor. In other words, the present invention can be implemented as a computer program or software, or a program having program code, for implementing the method of the invention when executing a program using a processor. The processor may be a circuitry element of a computer, a chip card (smart card), an integrated SOC system (SOC = system on a chip), an application integrated circuit (ASIC), or some other integrated circuit (IC).
Claims (24)
- (1) исходя из стационарной составляющей сигнала или нестационарной составляющей сигнала, выведенных из сигнала громкоговорителя, и исходя из оцененного спектра эхо-составляющей или энергетического спектра эха в сигнале микрофона; или
- (2) исходя из стационарной составляющей сигнала и нестационарной составляющей сигнала, выведенных из производного сигнала.23. The method of calculating the transmittance of the adaptive filter (210) of the microphone signal, including: estimating the spectrum of the echo component or the spectral density of the echo power in the microphone signal; extracting the stationary component of the signal or the non-stationary component of the signal (1) from the speaker signal or (2) from the signal derived from the speaker signal based on the estimated spectrum of the echo component or spectral density of the echo power in the microphone signal; and calculating the transmittances of the adaptive filter,
- (1) based on the stationary component of the signal or the non-stationary component of the signal derived from the loudspeaker signal, and on the basis of the estimated spectrum of the echo component or the energy spectrum of the echo in the microphone signal; or
- (2) based on the stationary component of the signal and the non-stationary component of the signal derived from the derived signal.
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US2500608P | 2008-01-31 | 2008-01-31 | |
US61/025006 | 2008-01-31 | ||
DE102008039330A DE102008039330A1 (en) | 2008-01-31 | 2008-08-22 | Apparatus and method for calculating filter coefficients for echo cancellation |
DE102008039330.4 | 2008-08-22 |
Publications (2)
Publication Number | Publication Date |
---|---|
RU2010132161A RU2010132161A (en) | 2012-02-10 |
RU2485607C2 true RU2485607C2 (en) | 2013-06-20 |
Family
ID=
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2732362C1 (en) * | 2017-05-29 | 2020-09-16 | Транстрон Инк. | Echo cancellation device, echo cancellation method and echo cancellation program |
RU2767297C1 (en) * | 2018-06-14 | 2022-03-17 | Транстрон Инк. | Echo cancellation device, echo cancellation method and echo cancellation program |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2732362C1 (en) * | 2017-05-29 | 2020-09-16 | Транстрон Инк. | Echo cancellation device, echo cancellation method and echo cancellation program |
RU2767297C1 (en) * | 2018-06-14 | 2022-03-17 | Транстрон Инк. | Echo cancellation device, echo cancellation method and echo cancellation program |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI388190B (en) | Apparatus and method for computing filter coefficients for echo suppression | |
KR101573121B1 (en) | Echo suppression comprising modeling of late reverberation components | |
RU2495506C2 (en) | Apparatus and method of calculating control parameters of echo suppression filter and apparatus and method of calculating delay value | |
Gustafsson et al. | A psychoacoustic approach to combined acoustic echo cancellation and noise reduction | |
US9992572B2 (en) | Dereverberation system for use in a signal processing apparatus | |
US8229106B2 (en) | Apparatus and methods for enhancement of speech | |
US8521530B1 (en) | System and method for enhancing a monaural audio signal | |
EP3080975B1 (en) | Echo cancellation | |
EP1855456B1 (en) | Echo reduction in time-variant systems | |
US7869587B2 (en) | Method and apparatus for canceling acoustic echo in a mobile terminal | |
RU2485607C2 (en) | Apparatus and method for computing filter coefficients for echo suppression | |
Yemdji et al. | Efficient low delay filtering for residual echo suppression | |
Eneroth | Stereophonic acoustic echo cancellation: Theory and implementation | |
AU2011322792B9 (en) | Echo suppression comprising modeling of late reverberation components | |
Benesty et al. | Some Practical Aspects of Stereo Teleconferencing System Implementation |