CN108010536A - 回声消除方法、装置、系统及存储介质 - Google Patents
回声消除方法、装置、系统及存储介质 Download PDFInfo
- Publication number
- CN108010536A CN108010536A CN201711267227.2A CN201711267227A CN108010536A CN 108010536 A CN108010536 A CN 108010536A CN 201711267227 A CN201711267227 A CN 201711267227A CN 108010536 A CN108010536 A CN 108010536A
- Authority
- CN
- China
- Prior art keywords
- signal
- local signal
- frequency domain
- variance
- local
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 38
- 230000003044 adaptive effect Effects 0.000 claims abstract description 31
- 238000006243 chemical reaction Methods 0.000 claims abstract description 4
- 238000004422 calculation algorithm Methods 0.000 claims description 11
- 238000012545 processing Methods 0.000 claims description 11
- 238000004364 calculation method Methods 0.000 claims description 10
- 238000004590 computer program Methods 0.000 claims description 5
- 238000005457 optimization Methods 0.000 claims description 3
- 238000010606 normalization Methods 0.000 claims 1
- 230000000694 effects Effects 0.000 abstract description 6
- 238000004891 communication Methods 0.000 description 13
- 238000010586 diagram Methods 0.000 description 11
- 230000003993 interaction Effects 0.000 description 5
- 230000000644 propagated effect Effects 0.000 description 4
- 238000012805 post-processing Methods 0.000 description 3
- 238000005070 sampling Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000002592 echocardiography Methods 0.000 description 1
- 238000004134 energy conservation Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000008014 freezing Effects 0.000 description 1
- 238000007710 freezing Methods 0.000 description 1
- 239000010977 jade Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- ZLIBICFPKPWGIZ-UHFFFAOYSA-N pyrimethanil Chemical compound CC1=CC(C)=NC(NC=2C=CC=CC=2)=N1 ZLIBICFPKPWGIZ-UHFFFAOYSA-N 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 230000017105 transposition Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/06—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L2021/02082—Noise filtering the noise being echo, reverberation of the speech
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
本发明涉及一种回声消除方法、装置、系统及计算机可读存储介质,该方法包括获取估计本地信号的特征参数;其中,所述特征参数包括发音装置发出的当前帧参考信号、当前帧麦克风接收的信号以及上一帧自适应滤波器系数;将所述特征参数分别转换为频域信号;根据转化后的频域信号估计本地信号;计算本地信号的方差;根据本地信号的方差更新自适应滤波器的步长因子和规则化因子,可以通过对获取到的用于估计本地信号的特征参数作FFT(Fast Fourier Transform,快速傅里叶变换),从时域信号转化为频域信号,利用频域信号的稀疏性和易区分性,使得通过频域信号估计的本地信号,计算的本地信号的方差更加准确,有助于增强回声消除效果。
Description
技术领域
本发明涉及通信、语音交互领域,特别是涉及一种回声消除方法、装置、系统及存储介质。
背景技术
在实时通信和语音交互等领域中,通常需要在设备安装麦克风和喇叭。喇叭负责播放音乐、故事、合成人声或者是通信对端发送过来的声音,麦克风则用来采集声音。在实时通信和语音交互中,喇叭播放出来的声音被麦克风重新采集,这些声音称为回声。回声会严重干扰机器后续的识别以及影响通信对端的主观感受,所以过滤回声是必不可少的步骤。
传统的回声消除装置通常包括自适应滤波器、双讲检测器以及后处理模块,其中,1)自适应滤波器用于拟合真实的回声;2)双讲检测器用于检测喇叭播放的声音与本地的声音是否同时发出,在同时存在时及时将自适应滤波器系数冻结更新,避免自适应滤波器发散;3)后处理模块用于处理剩余的回声。另外,自适应滤波器的收敛与否,对回声消除干净与否的影响最大。在语音交互和不少实时通信场景中,由于目标信号往往离设备比较远,而设备的尺寸限制使得回声离麦克风非常近,信号-回声比值远低于传统的应用场景,从而使得双讲检测很难准确。此外,由于信号-回声比非常低,使得非线性的后处理模快非常容易误伤目标信号,所以,在这种场景下,基本上只能依赖自适应滤波器的回声消除能力。
自适应滤波器通常需要动态调节步长因子和规则化因子,该动态调节步长因子和规则化因子通过依赖于近端信号的方差估计。然而,目前提供的技术中对近端信号的方差的估计往往不够准确,从而无法准确的调节步长因子和规则化因子,造成回声消除效果差。
发明内容
基于此,有必要针对对近端信号方差的估计不够准确,造成回声消除效果差的问题,提供一种回声消除方法、装置、系统及存储介质。
根据本发明实施例提供的第一方面,提供一种回声消除方法,包括以下步骤:
获取估计本地信号的特征参数;其中,所述特征参数包括发音装置发出的当前帧参考信号和当前帧麦克风接收的信号;
将所述特征参数分别转换为频域信号;
根据转化后的频域信号估计本地信号;
计算本地信号的方差;
根据所述本地信号的方差动态调节自适应滤波器的步长因子和规则化因子。
在其中一个实施例中,所述根据转化后的频域信号估计本地信号包括:
采用以下公式中的至少之一估计本地信号:
和
其中,表示频域本地信号,D(k)表示转换到频域中麦克风接收的信号,X(k)表示频域参考信号,表示转换到频域中的自适应滤波器系数。
在其中一个实施例中,所述计算本地信号的方差包括:
根据帕塞瓦尔定理计算所述本地信号的方差。
在其中一个实施例中,所述根据所述本地信号的方差动态调节自适应滤波器的步长因子和规则化因子,包括:
根据JO-NLMS(Joint Optimized-NLMS,联合优化归一化最小均方算法)计算步长因子。
在其中一个实施例中,还包括:
在根据转化后的频域信号估计本地信号之后,对本地信号进行非线性处理。
在其中一个实施例中,所述对本地信号进行非线性处理包括:
强制去掉幅值小于预设幅值阈值的频点。
在其中一个实施例中,所述对本地信号进行非线性处理包括:
计算转换到频域中麦克风接收的信号和频域参考信号的相干性;
剔除所述相干性大于预设相干阈值的频点。
根据本发明实施例的第二方面,提供一种回声消除装置,包括:
获取模块,用于获取估计本地信号的特征参数;其中,所述特征参数包括发音装置发出的当前帧参考信号和当前帧麦克风接收的信号;
转换模块,用于将所述特征参数分别转换为频域信号;
第一计算模块,根据转化后的频域信号估计本地信号;
第二计算模块,计算本地信号的方差;
更新模块,根据所述本地信号的方差动态调节自适应滤波器的步长因子和规则化因子。
根据本发明实施例的第三方面,提供一种回声消除系统,包括:处理器和如上述实施例中任一所述的回声消除装置。
根据本发明实施例的第四方面,提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时可用于执行上述实施例中任一所述的方法。
相较于现有技术,本发明提供的回声消除方法通过对获取到的用于估计本地信号的特征参数作FFT(Fast Fourier Transform,快速傅里叶变换),从时域信号转化为频域信号,利用频域信号的稀疏性和易区分性,通过频域信号估计的本地信号之后再利用帕塞瓦尔定理估计参数使得计算的本地信号的方差更加准确,有助于增强回声消除效果。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
图1为本发明一示例性实施例示出的一种回声消除原理图;
图2为本发明一示例性实施例示出的一种回声消除方法流程图;
图3为本发明一示例性实施例示出的一种回声消除方法流程图;
图4为本发明一示例性实施例示出的一种样本采集图;
图5为本发明一示例性实施例示出的一种PVSS算法和本发明提供的方法估计处理效果对比图;
图6为本发明一示例性实施例示出的一种回声消除装置框图;
图7为本发明一示例性实施例示出的一种回声消除系统架构图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。
图1为本发明一示例性实施例示出的一种回声消除原理图,如图1所示,远端信号如扬声器播放信号x(n)经过声学传播(可建模为回声路径h(n)),得到回声信号y(n),其中,n是指时间索引,该信号y(n)被添加上本地信号v(n),得到麦克风信号d(n)。回声消除则是通过一个自适应滤波器来拟合真实的h(n),假设自适应滤波器足够收敛,使用参考信号x(n)就可以得到一个对回声信号y(n)的估计用公式估计本地信号v(n),即本地信号其中:h(n)=[h0(n)h1(n)...hL-1(n)]T,上标T表示转置,L表示自适应滤波器的长度,实际坏境中L通常会高达几千阶,考虑到实际系统的运算能力,自适应滤波器的阶数不会超过500。自适应滤波器系数通常采用基于NLMS(Normalized Least Mean Square,归一化最小均方)的滤波器更新方法,采用的公式如下:
故本地信号一般是由近端语音信号和近端噪声信号组成。
步长因子μ可以调节收敛的速度,μ值越大,收敛速度越快,但更容易发散。μ值越小,收敛速度越慢,但越稳定。δ是一个规则化因子,主要影响自适应滤波器的稳定性,通常在NLMS算法中使用经验值,例如取
在双讲时(存在本地信号),需要减小步长或者冻结更新,避免滤波器系数发散而消除掉本地信号。变步长因子、变规则化因子算法通常假设已知本地信号的方差通过方差调节步长的大小。但是现有相关技术中对方差估计往往不够准确,导致回声消除不干净,或者本地信号也被消除掉。
本发明提供了一种新的基于频域的本地信号方差估计方法。
图2为本发明一示例性实施例示出的一种回声消除方法流程图,如图2所示,该回声消除方法包括以下步骤:
在步骤201中,获取估计本地信号的特征参数。
在本实施例中,可以分别获取发音装置发出的当前帧参考信号x(n)和当前帧麦克风接收的信号d(n),其中,n为时刻,k为频点。
在步骤202中,将所述特征参数分别转换为频域信号。
在本实施例中,分别对发音装置发出的当前帧参考信号x(n)、当前帧麦克风接收的信号d(n)以及上一帧自适应滤波器系数作FFT(Fast FourierTransform,快速傅里叶变换),得到频率信号X(k)、D(k)和其中,D(k)表示转换到频域中麦克风接收的信号,X(k)表示频域参考信号,表示转换到频域中的自适应滤波器系数,另外,初始化为0,进行迭代更新后仍然存储在算法内部。
在步骤203中,根据转化后的频域信号估计本地信号。
在本实施例中,可以采用以下公式中的至少之一估计本地信号:
和其中,表示频域本地信号,D(k)表示转换到频域中麦克风接收的信号,X(k)表示频域参考信号,表示转换到频域中的自适应滤波器系数。
在步骤204中,计算本地信号的方差。
在本实施例中,可以根据帕塞瓦尔定理的公式计算本地信号的方差
在本实施例中,可以在根据转化后的频域信号估计本地信号之后,对本地信号进行非线性处理,具体地,可以强制去掉幅值小于预设幅值阈值的频点,还可以计算D(k)和X(k)的相干性,剔除所述相干性大于预设相干阈值的频点。
在步骤205中,根据本地信号的方差动态调节自适应滤波器的步长因子和规则化因子。
在本实施例中,可以根据JO-NLMS(Joint Optimized NLMS,联合优化归一化最小均方算法)计算步长因子。
图3为本发明一示例性实施例示出的另一种回声消除方法流程图,如图3所示,回声消除方法包括以下步骤:
在步骤301中,获取发音装置发出的当前帧参考信号和当前帧麦克风接收的信号。
在本实施例中,在获取发音装置发出的当前帧参考信号x(n)和当前帧麦克风接收的信号d(n)之前,可以对各个变量进行初始化。
如前述对回声消除原理的分析可知,因所以为了求出本地信号v(n),首先要获取发音装置发出的当前帧参考信号x(n)和当前帧麦克风接收的信号d(n)。
在步骤302中,对上述获取到的时域信号作FFT(Fast Fourier Transform,快速傅里叶变换),转换为频域信号。
在本实施例中,上述步骤301中获取的当前帧参考信号x(n)和当前帧麦克风接收的信号d(n)以及自适应滤波器系数均为时域信号,可以通过分别对x(n)、d(n)以及作FFT(Fast Fourier Transform,快速傅里叶变换),转换成频域信号X(k)、D(k)和具体地通过以下公式转换:
其中,N表示采样点,k表示频点,初始化为0,进行迭代更新后仍然存储在算法内部。
在步骤303中,根据频域信号估计本地信号。
在本实施例中,可以根据在步骤301中得出的公式推导出时域信号转换为频域信号后估计本地频域信号的公式:
在其他的实施方式中,还可以根据下述公式来估计本地频域信号
在步骤304中,对估计得到的本地信号进行非线性处理。
在本实施例中,经过上述步骤303,由于估计到的本地信号是频域信号,可以通过强制去掉幅值小于预设幅值阈值∈的频点来去除稳态噪声的干扰,其中,∈是根据具体实际情况预先设定的一个临界幅值,当时,则可以认为
在其他的实施方式中,由于回声信号往往和参考信号具有强相干性,还可以通过计算D(k)和X(k)的相干性,剔除D(k)和X(k)的相干性大的频点来去除回声的影响,进一步保证准确估计具体相干性的计算公式可参考相关现有技术,在此不再赘述,其中,D(k)表示转换到频域中麦克风接收的信号,X(k)表示频域参考信号。
在步骤305中,计算本地信号的方差。
在本实施例中,可以根据帕塞瓦尔定理描述的能量守恒原理,即时域能量与频域能量相等,计算本地信号的方差具体采用下述公式:
其中,表示范数。
在步骤306中,根据JO-NLMS(Joint Optimized NLMS,联合优化归一化最小均方算法)分别计算各情况下步长因子μJONLMS,l(i),并更新步长因子和规则化因子。
在本实施例中,可以根据JO-NLMS算法中的以下公式,循环计算各帧内步长因子μJONLMS,l(i)并更新步长因子和规则化因子:
举例而言,图4为本发明一示例性实施例示出的一种样本采集图,其中,扬声器距离麦克风大约10厘米,目标人声距离麦克风约3米,声音信号采样率为16kHz,从图上可以看出,采集到的信号信噪比(图中的信号-回声比)非常低,基本淹没在回声里。图5是分别采用PVSS(parametric variable step size,参数变步长算法)和本发明提供的方法来估计处理效果图,其中,除去估计参数的方法不同外,其他参数均相同,例如,在进行快速傅里叶变换时,采样点N取512,自适应滤波器的长度取L=320,m(0)=1e-5,从图中可知,相较于PVSS(parametric variable step size,参数变步长算法),本发明提供的估计方法的更加准确,进行回声消除后回声残留更少。
由上述实施例可知,本发明提供的回声消除方法具有以下优点:
1)由于参考信号和回声相干性较大,加上本地信号往往是稀疏的信号,只占少数的频点,可以利用频域的相关性和稀疏性,使得估计更加准确;
2)在时域里估计参数时,需要对每一点都进行计算,计算量巨大,而在频域里估计参数时,可以分块进行,一帧信号内参数保持不变,大大减少计算量,提高工作效率;
3)在进行循环迭代时,无需对内部循环继续迭代,只需在外部循环迭代更新,大大减小计算量。
与上述本发明实施例提供的回声消除方法相对应,本发明还提供了一种回声消除装置,如图6所示,该回声消除装置包括:获取模块601、转换模块602、第一计算模块603、第二计算模块604以及更新模块605,其中:
获取模块601,获取估计本地信号的特征参数;其中,所述特征参数包括发音装置发出的当前帧参考信号和当前帧麦克风接收的信号;
转换模块602,将所述特征参数分别转换为频域信号;
第一计算模块603,根据转化后的频域信号估计本地信号
第二计算模块604,计算本地信号的方差;
更新模块605,根据所述本地信号的方差动态调节自适应滤波器的步长因子和规则化因子。
本发明还提供一种回声消除系统,包括:计算机500和上述实施例中任一所述的回声消除装置600。
计算机500可以被用于实现实施本发明一些实施例中披露的特定方法和装置。本实施例中的特定装置利用功能框图展示了一个包含显示模块的硬件平台。
在一些实施例中,计算机500可以通过其他硬件设备、软件程序、固件以及他们的组合来实现本发明的一些实施例的具体实施。在其他实施例中,计算机500可以是一个通用目的的计算机,或一个有特定目的的计算机。
图7是本发明示例性实施例提出的一种回声消除系统框图,如图7所示,计算机500可以包括内部通信总线501,处理器502,只读存储器(ROM)503,随机存取存储器(RAM)504,通信端口505、输入/输出组件506、硬盘507以及用户界面508。内部通信总线501可以实现计算机500组件间的通信。处理器502可以进行判断和发出提示。
在一些实施例中,处理器502可以由一个或多个处理器组成。通信端口505可以实现计算机500与其他部件(图未示)。
在一些实施例中,计算机500可以通过通信端口505从网络发送和接受信息及数据。输入/输出组件505支持计算机500与其他部件之间的输入/输出数据流。用户界面508可以实现计算机500和用户之间的交互和信息交换。计算机500还包括不同形式的程序存储单元以及数据存储单元,例如硬盘507、只读存储器(ROM)508、随机存取存储器(RAM)504,能够存储计算机处理和/或通信使用的各种数据文件,以及处理器502所执行的可能的程序指令。
所述处理器502执行程序时可用于执行一种回声消除方法,所述方法包括:
获取估计本地信号的特征参数;其中,所述特征参数包括发音装置发出的当前帧参考信号和当前帧麦克风接收的信号;
将所述特征参数分别转换为频域信号;
根据转化后的频域信号估计本地信号;
计算本地信号的方差;
根据所述本地信号的方差动态调节自适应滤波器的步长因子和规则化因子。
本发明实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本申请所有发明实施例提供的回声消除方法。所述方法包括:
获取估计本地信号的特征参数;其中,所述特征参数包括发音装置发出的当前帧参考信号和当前帧麦克风接收的信号;
将所述特征参数分别转换为频域信号;
根据转化后的频域信号估计本地信号;
计算本地信号的方差;
根据所述本地信号的方差动态调节自适应滤波器的步长因子和规则化因子。
计算机可读信号介质可能包括一个内含计算机程序编码的传播数据信号,例如在基带上或作为载波的一部分。该传播信号可能有多种表现形式,包括电磁形式、光形式等。计算机可读信号介质可以是除计算机可读信号介质之外的任何计算机可读介质,该介质可以通过连接至一个指令执行系统、装置或设备以实现通讯、传播或传输供使用的程序。位于计算机可读信号介质上的程序编码可以通过任何合适的介质进行传播,包括无线电、电缆、光纤电缆、射频信号或类似介质、或任何上述介质的组合。
本发明的实施例中各部分操作所需的计算机程序编码可以用任意一种或多种程序语言编写,包括面向对象编程语言如JAVA、Scala、Smalltalk、Eiffel、JADE、Emerald、C++、C#、VB、.NET、Python等,常规程序化编程语言如C语言、Visual Basic、Fortran 2003、PHP等或其他编程语言。该程序编码可以完全运行在用户计算机上、或作为独立的软件包在用户计算机上运行、或部分在用户计算机上运行部分在远程计算机上运行、或完全在远程计算机或服务器上运行。在后面的情况下,远程计算机可以通过任何网络形式与用户计算机连接,比如局域网(LAN)或广域网(WAN),或连接至外部计算机(例如通过因特网),或在云计算环境中,或作为服务使用如软件。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
Claims (10)
1.一种回声消除方法,其特征在于,包括以下步骤:
获取估计本地信号的特征参数;其中,所述特征参数包括发音装置发出的当前帧参考信号和当前帧麦克风接收的信号;
将所述特征参数分别转换为频域信号;
根据转化后的频域信号估计本地信号;
计算本地信号的方差;
根据所述本地信号的方差动态调节自适应滤波器的步长因子和规则化因子。
2.根据权利要求1所述的回声消除方法,其特征在于,所述根据转化后的频域信号估计本地信号包括:
采用以下公式中的至少之一估计本地信号:
和
其中,表示频域本地信号,D(k)表示转换到频域中麦克风接收的信号,X(k)表示频域参考信号,表示转换到频域中的自适应滤波器系数。
3.根据权利要求1所述的回声消除方法,其特征在于,所述计算本地信号的方差包括:
根据帕塞瓦尔定理计算所述本地信号的方差。
4.根据权利要求1所述的回声消除方法,其特征在于,所述根据所述本地信号的方差动态调节自适应滤波器的步长因子和规则化因子,包括:
根据联合优化归一化最小均方算法计算步长因子。
5.根据权利要求1所述的回声消除方法,其特征在于,还包括:
在根据转化后的频域信号估计本地信号之后,对本地信号进行非线性处理。
6.根据权利要求5所述的回声消除方法,其特征在于,所述对本地信号进行非线性处理包括:
强制去掉幅值小于预设幅值阈值的频点。
7.根据权利要求5所述的回声消除方法,其特征在于,所述对本地信号进行非线性处理包括:
计算转换到频域中麦克风接收的信号和频域参考信号的相干性;
剔除所述相干性大于预设相干阈值的频点。
8.一种回声消除装置,其特征在于,包括:
获取模块,用于获取估计本地信号的特征参数;其中,所述特征参数包括发音装置发出的当前帧参考信号和当前帧麦克风接收的信号;
转换模块,用于将所述特征参数分别转换为频域信号;
第一计算模块,根据转化后的频域信号估计本地信号;
第二计算模块,计算本地信号的方差;
更新模块,根据所述本地信号的方差动态调节自适应滤波器的步长因子和规则化因子。
9.一种回声消除系统,其特征在于,包括:处理器和如权利要求8中任一所述的回声消除装置。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时可用于执行权利要求1-7任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711267227.2A CN108010536B (zh) | 2017-12-05 | 2017-12-05 | 回声消除方法、装置、系统及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711267227.2A CN108010536B (zh) | 2017-12-05 | 2017-12-05 | 回声消除方法、装置、系统及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108010536A true CN108010536A (zh) | 2018-05-08 |
CN108010536B CN108010536B (zh) | 2020-07-14 |
Family
ID=62056362
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711267227.2A Active CN108010536B (zh) | 2017-12-05 | 2017-12-05 | 回声消除方法、装置、系统及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108010536B (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109584898A (zh) * | 2018-12-29 | 2019-04-05 | 上海瑾盛通信科技有限公司 | 一种语音信号的处理方法、装置、存储介质及电子设备 |
CN110335618A (zh) * | 2019-06-06 | 2019-10-15 | 福建星网智慧软件有限公司 | 一种改善非线性抑制的方法及计算机设备 |
CN112017679A (zh) * | 2020-08-05 | 2020-12-01 | 海尔优家智能科技(北京)有限公司 | 用于自适应滤波器系数更新的方法及装置、设备 |
CN112687285A (zh) * | 2020-12-22 | 2021-04-20 | 珠海市杰理科技股份有限公司 | 回声消除方法和装置 |
CN113421579A (zh) * | 2021-06-30 | 2021-09-21 | 北京小米移动软件有限公司 | 声音处理方法、装置、电子设备和存储介质 |
CN114071220A (zh) * | 2021-11-04 | 2022-02-18 | 深圳Tcl新技术有限公司 | 音效调节方法、装置、存储介质及电子设备 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1317194A (zh) * | 1998-07-13 | 2001-10-10 | 艾利森电话股份有限公司 | 数字自适应滤波器和利用这一设备的声音回波消除器 |
CN101461257A (zh) * | 2006-05-30 | 2009-06-17 | 微软公司 | 自适应声学回声消除 |
CN101888455A (zh) * | 2010-04-09 | 2010-11-17 | 熔点网讯(北京)科技有限公司 | 一种频域自适应回声抵消方法 |
CN103885044A (zh) * | 2014-03-31 | 2014-06-25 | 西安电子科技大学 | 一种基于clean算法的窄带雷达回波杂噪抑制方法 |
CN105371945A (zh) * | 2015-10-10 | 2016-03-02 | 同济大学 | 去除厅堂脉冲响应测量声信号中噪声的方法及装置 |
CN105472191A (zh) * | 2015-11-18 | 2016-04-06 | 百度在线网络技术(北京)有限公司 | 一种跟踪回声时延的方法和装置 |
WO2017099728A1 (en) * | 2015-12-08 | 2017-06-15 | Nuance Communications, Inc. | System and method for suppression of non-linear acoustic echoes |
US9854101B2 (en) * | 2011-06-11 | 2017-12-26 | ClearOne Inc. | Methods and apparatuses for echo cancellation with beamforming microphone arrays |
-
2017
- 2017-12-05 CN CN201711267227.2A patent/CN108010536B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1317194A (zh) * | 1998-07-13 | 2001-10-10 | 艾利森电话股份有限公司 | 数字自适应滤波器和利用这一设备的声音回波消除器 |
CN101461257A (zh) * | 2006-05-30 | 2009-06-17 | 微软公司 | 自适应声学回声消除 |
CN101888455A (zh) * | 2010-04-09 | 2010-11-17 | 熔点网讯(北京)科技有限公司 | 一种频域自适应回声抵消方法 |
US9854101B2 (en) * | 2011-06-11 | 2017-12-26 | ClearOne Inc. | Methods and apparatuses for echo cancellation with beamforming microphone arrays |
CN103885044A (zh) * | 2014-03-31 | 2014-06-25 | 西安电子科技大学 | 一种基于clean算法的窄带雷达回波杂噪抑制方法 |
CN105371945A (zh) * | 2015-10-10 | 2016-03-02 | 同济大学 | 去除厅堂脉冲响应测量声信号中噪声的方法及装置 |
CN105472191A (zh) * | 2015-11-18 | 2016-04-06 | 百度在线网络技术(北京)有限公司 | 一种跟踪回声时延的方法和装置 |
WO2017099728A1 (en) * | 2015-12-08 | 2017-06-15 | Nuance Communications, Inc. | System and method for suppression of non-linear acoustic echoes |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109584898A (zh) * | 2018-12-29 | 2019-04-05 | 上海瑾盛通信科技有限公司 | 一种语音信号的处理方法、装置、存储介质及电子设备 |
CN110335618A (zh) * | 2019-06-06 | 2019-10-15 | 福建星网智慧软件有限公司 | 一种改善非线性抑制的方法及计算机设备 |
CN110335618B (zh) * | 2019-06-06 | 2021-07-30 | 福建星网智慧软件有限公司 | 一种改善非线性回声抑制的方法及计算机设备 |
CN112017679A (zh) * | 2020-08-05 | 2020-12-01 | 海尔优家智能科技(北京)有限公司 | 用于自适应滤波器系数更新的方法及装置、设备 |
CN112017679B (zh) * | 2020-08-05 | 2024-01-26 | 海尔优家智能科技(北京)有限公司 | 用于自适应滤波器系数更新的方法及装置、设备 |
CN112687285A (zh) * | 2020-12-22 | 2021-04-20 | 珠海市杰理科技股份有限公司 | 回声消除方法和装置 |
CN112687285B (zh) * | 2020-12-22 | 2023-09-29 | 珠海市杰理科技股份有限公司 | 回声消除方法和装置 |
CN113421579A (zh) * | 2021-06-30 | 2021-09-21 | 北京小米移动软件有限公司 | 声音处理方法、装置、电子设备和存储介质 |
CN113421579B (zh) * | 2021-06-30 | 2024-06-07 | 北京小米移动软件有限公司 | 声音处理方法、装置、电子设备和存储介质 |
CN114071220A (zh) * | 2021-11-04 | 2022-02-18 | 深圳Tcl新技术有限公司 | 音效调节方法、装置、存储介质及电子设备 |
CN114071220B (zh) * | 2021-11-04 | 2024-01-19 | 深圳Tcl新技术有限公司 | 音效调节方法、装置、存储介质及电子设备 |
Also Published As
Publication number | Publication date |
---|---|
CN108010536B (zh) | 2020-07-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109727604B (zh) | 用于语音识别前端的频域回声消除方法及计算机储存介质 | |
CN108010536B (zh) | 回声消除方法、装置、系统及存储介质 | |
KR101934636B1 (ko) | 심화신경망 기반의 잡음 및 에코의 통합 제거 방법 및 장치 | |
US9386373B2 (en) | System and method for estimating a reverberation time | |
CN106898359A (zh) | 音频信号处理方法、系统、音频交互装置及计算机设备 | |
CN106161751B (zh) | 一种噪声抑制方法及装置 | |
CN110211602B (zh) | 智能语音增强通信方法及装置 | |
CN102739886A (zh) | 基于回声频谱估计和语音存在概率的立体声回声抵消方法 | |
KR102076760B1 (ko) | 다채널 마이크를 이용한 칼만필터 기반의 다채널 입출력 비선형 음향학적 반향 제거 방법 | |
EP2987314B1 (en) | Echo suppression | |
KR101581885B1 (ko) | 복소 스펙트럼 잡음 제거 장치 및 방법 | |
WO2020124325A1 (zh) | 一种回声消除中的自适应滤波方法、装置、设备及存储介质 | |
CN112201273B (zh) | 一种噪声功率谱密度计算方法、系统、设备及介质 | |
WO2022218254A1 (zh) | 语音信号增强方法、装置及电子设备 | |
CN111951818B (zh) | 一种基于改进功率差噪声估计算法的双麦克风语音增强方法 | |
CN113744748A (zh) | 一种网络模型的训练方法、回声消除方法及设备 | |
EP2716023B1 (en) | Control of adaptation step size and suppression gain in acoustic echo control | |
US9570088B2 (en) | Signal processor and method therefor | |
CN107045874A (zh) | 一种基于相关性的非线性语音增强方法 | |
CN113257267A (zh) | 干扰信号消除模型的训练方法和干扰信号消除方法及设备 | |
WO2024012868A1 (en) | Audio signal processing method and system for echo suppression using an mmse-lsa estimator | |
CN115620737A (zh) | 语音信号处理装置、方法、电子设备和扩音系统 | |
JPWO2012157783A1 (ja) | 音声処理装置、音声処理方法および音声処理プログラムを記録した記録媒体 | |
KR101558397B1 (ko) | 반향필터 추정방법, 반향제거필터 추정방법 및 이를 이용한 단일채널 반향제거방법 | |
KR102685400B1 (ko) | 에코 제거 방법、 장치 및 전자 장비 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right | ||
TR01 | Transfer of patent right |
Effective date of registration: 20230713 Address after: 518000 Room 201, building A, 1 front Bay Road, Shenzhen Qianhai cooperation zone, Shenzhen, Guangdong Patentee after: VOICEAI TECHNOLOGIES Co.,Ltd. Patentee after: Shenzhen Digital Miracle Technology Co.,Ltd. Address before: 518000 Room 201, building A, 1 front Bay Road, Shenzhen Qianhai cooperation zone, Shenzhen, Guangdong Patentee before: VOICEAI TECHNOLOGIES Co.,Ltd. |