CN108010536B - 回声消除方法、装置、系统及存储介质 - Google Patents

回声消除方法、装置、系统及存储介质 Download PDF

Info

Publication number
CN108010536B
CN108010536B CN201711267227.2A CN201711267227A CN108010536B CN 108010536 B CN108010536 B CN 108010536B CN 201711267227 A CN201711267227 A CN 201711267227A CN 108010536 B CN108010536 B CN 108010536B
Authority
CN
China
Prior art keywords
signal
frequency domain
local signal
local
echo cancellation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711267227.2A
Other languages
English (en)
Other versions
CN108010536A (zh
Inventor
张伟彬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Digital Miracle Technology Co ltd
Voiceai Technologies Co ltd
Original Assignee
Voiceai Technologies Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Voiceai Technologies Co ltd filed Critical Voiceai Technologies Co ltd
Priority to CN201711267227.2A priority Critical patent/CN108010536B/zh
Publication of CN108010536A publication Critical patent/CN108010536A/zh
Application granted granted Critical
Publication of CN108010536B publication Critical patent/CN108010536B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/06Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L2021/02082Noise filtering the noise being echo, reverberation of the speech

Abstract

本发明涉及一种回声消除方法、装置、系统及计算机可读存储介质,该方法包括获取估计本地信号的特征参数;其中,所述特征参数包括发音装置发出的当前帧参考信号、当前帧麦克风接收的信号以及上一帧自适应滤波器系数;将所述特征参数分别转换为频域信号;根据转化后的频域信号估计本地信号;计算本地信号的方差;根据本地信号的方差更新自适应滤波器的步长因子和规则化因子,可以通过对获取到的用于估计本地信号的特征参数作FFT(Fast Fourier Transform,快速傅里叶变换),从时域信号转化为频域信号,利用频域信号的稀疏性和易区分性,使得通过频域信号估计的本地信号
Figure DDA0001494799730000011
,计算的本地信号的方差
Figure DDA0001494799730000012
更加准确,有助于增强回声消除效果。

Description

回声消除方法、装置、系统及存储介质
技术领域
本发明涉及通信、语音交互领域,特别是涉及一种回声消除方法、装置、系统及存储介质。
背景技术
在实时通信和语音交互等领域中,通常需要在设备安装麦克风和喇叭。喇叭负责播放音乐、故事、合成人声或者是通信对端发送过来的声音,麦克风则用来采集声音。在实时通信和语音交互中,喇叭播放出来的声音被麦克风重新采集,这些声音称为回声。回声会严重干扰机器后续的识别以及影响通信对端的主观感受,所以过滤回声是必不可少的步骤。
传统的回声消除装置通常包括自适应滤波器、双讲检测器以及后处理模块,其中,1)自适应滤波器用于拟合真实的回声;2)双讲检测器用于检测喇叭播放的声音与本地的声音是否同时发出,在同时存在时及时将自适应滤波器系数冻结更新,避免自适应滤波器发散;3)后处理模块用于处理剩余的回声。另外,自适应滤波器的收敛与否,对回声消除干净与否的影响最大。在语音交互和不少实时通信场景中,由于目标信号往往离设备比较远,而设备的尺寸限制使得回声离麦克风非常近,信号-回声比值远低于传统的应用场景,从而使得双讲检测很难准确。此外,由于信号-回声比非常低,使得非线性的后处理模快非常容易误伤目标信号,所以,在这种场景下,基本上只能依赖自适应滤波器的回声消除能力。
自适应滤波器通常需要动态调节步长因子和规则化因子,该动态调节步长因子和规则化因子通过依赖于近端信号的方差估计。然而,目前提供的技术中对近端信号的方差的估计往往不够准确,从而无法准确的调节步长因子和规则化因子,造成回声消除效果差。
发明内容
基于此,有必要针对对近端信号方差的估计不够准确,造成回声消除效果差的问题,提供一种回声消除方法、装置、系统及存储介质。
根据本发明实施例提供的第一方面,提供一种回声消除方法,包括以下步骤:
获取估计本地信号的特征参数;其中,所述特征参数包括发音装置发出的当前帧参考信号和当前帧麦克风接收的信号;
将所述特征参数分别转换为频域信号;
根据转化后的频域信号估计本地信号;
计算本地信号的方差;
根据所述本地信号的方差动态调节自适应滤波器的步长因子和规则化因子。
在其中一个实施例中,所述根据转化后的频域信号估计本地信号包括:
采用以下公式中的至少之一估计本地信号:
Figure BDA0001494799710000021
Figure BDA0001494799710000022
其中,
Figure BDA0001494799710000023
表示频域本地信号,D(k)表示转换到频域中麦克风接收的信号,X(k)表示频域参考信号,
Figure BDA0001494799710000024
表示转换到频域中的自适应滤波器系数。
在其中一个实施例中,所述计算本地信号的方差包括:
根据帕塞瓦尔定理
Figure BDA0001494799710000025
计算所述本地信号的方差。
在其中一个实施例中,所述根据所述本地信号的方差动态调节自适应滤波器的步长因子和规则化因子,包括:
根据JO-NLMS(Joint Optimized-NLMS,联合优化归一化最小均方算法)计算步长因子。
在其中一个实施例中,还包括:
在根据转化后的频域信号估计本地信号之后,对本地信号进行非线性处理。
在其中一个实施例中,所述对本地信号进行非线性处理包括:
强制去掉幅值小于预设幅值阈值的频点。
在其中一个实施例中,所述对本地信号进行非线性处理包括:
计算转换到频域中麦克风接收的信号和频域参考信号的相干性;
剔除所述相干性大于预设相干阈值的频点。
根据本发明实施例的第二方面,提供一种回声消除装置,包括:
获取模块,用于获取估计本地信号的特征参数;其中,所述特征参数包括发音装置发出的当前帧参考信号和当前帧麦克风接收的信号;
转换模块,用于将所述特征参数分别转换为频域信号;
第一计算模块,根据转化后的频域信号估计本地信号;
第二计算模块,计算本地信号的方差;
更新模块,根据所述本地信号的方差动态调节自适应滤波器的步长因子和规则化因子。
根据本发明实施例的第三方面,提供一种回声消除系统,包括:处理器和如上述实施例中任一所述的回声消除装置。
根据本发明实施例的第四方面,提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时可用于执行上述实施例中任一所述的方法。
相较于现有技术,本发明提供的回声消除方法通过对获取到的用于估计本地信号的特征参数作FFT(Fast Fourier Transform,快速傅里叶变换),从时域信号转化为频域信号,利用频域信号的稀疏性和易区分性,通过频域信号估计的本地信号
Figure BDA0001494799710000031
之后再利用帕塞瓦尔定理估计参数
Figure BDA0001494799710000032
使得计算的本地信号的方差
Figure BDA0001494799710000034
更加准确,有助于增强回声消除效果。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
图1为本发明一示例性实施例示出的一种回声消除原理图;
图2为本发明一示例性实施例示出的一种回声消除方法流程图;
图3为本发明一示例性实施例示出的一种回声消除方法流程图;
图4为本发明一示例性实施例示出的一种样本采集图;
图5为本发明一示例性实施例示出的一种PVSS算法和本发明提供的方法估计
Figure BDA0001494799710000033
处理效果对比图;
图6为本发明一示例性实施例示出的一种回声消除装置框图;
图7为本发明一示例性实施例示出的一种回声消除系统架构图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。
图1为本发明一示例性实施例示出的一种回声消除原理图,如图1所示,远端信号如扬声器播放信号x(n)经过声学传播(可建模为回声路径h(n)),得到回声信号y(n),其中,n是指时间索引,该信号y(n)被添加上本地信号v(n),得到麦克风信号d(n)。回声消除则是通过一个自适应滤波器
Figure BDA0001494799710000041
来拟合真实的h(n),假设自适应滤波器
Figure BDA0001494799710000042
足够收敛,使用参考信号x(n)就可以得到一个对回声信号y(n)的估计
Figure BDA0001494799710000043
用公式
Figure BDA0001494799710000044
估计本地信号v(n),即本地信号
Figure BDA0001494799710000045
其中:h(n)=[h0(n)h1(n)...hL-1(n)]T
Figure BDA0001494799710000046
上标T表示转置,L表示自适应滤波器的长度,实际坏境中L通常会高达几千阶,考虑到实际系统的运算能力,自适应滤波器的阶数不会超过500。自适应滤波器系数
Figure BDA0001494799710000047
通常采用基于NLMS(Normalized Least Mean Square,归一化最小均方)的滤波器更新方法,采用的公式如下:
Figure BDA0001494799710000048
Figure BDA0001494799710000049
Figure BDA00014947997100000410
故本地信号
Figure BDA00014947997100000411
一般是由近端语音信号和近端噪声信号组成。
步长因子μ可以调节收敛的速度,μ值越大,收敛速度越快,但更容易发散。μ值越小,收敛速度越慢,但越稳定。δ是一个规则化因子,主要影响自适应滤波器的稳定性,通常在NLMS算法中使用经验值,例如取
Figure BDA0001494799710000051
在双讲时(存在本地信号),需要减小步长或者冻结更新,避免滤波器系数发散而消除掉本地信号。变步长因子、变规则化因子算法通常假设已知本地信号的方差
Figure BDA0001494799710000052
通过方差
Figure BDA0001494799710000053
调节步长的大小。但是现有相关技术中对方差
Figure BDA0001494799710000054
估计往往不够准确,导致回声消除不干净,或者本地信号也被消除掉。
本发明提供了一种新的基于频域的本地信号方差
Figure BDA0001494799710000055
估计方法。
图2为本发明一示例性实施例示出的一种回声消除方法流程图,如图2所示,该回声消除方法包括以下步骤:
在步骤201中,获取估计本地信号的特征参数。
在本实施例中,可以分别获取发音装置发出的当前帧参考信号x(n)和当前帧麦克风接收的信号d(n),其中,n为时刻,k为频点。
在步骤202中,将所述特征参数分别转换为频域信号。
在本实施例中,分别对发音装置发出的当前帧参考信号x(n)、当前帧麦克风接收的信号d(n)以及上一帧自适应滤波器系数
Figure BDA0001494799710000056
作FFT(Fast FourierTransform,快速傅里叶变换),得到频率信号X(k)、D(k)和
Figure BDA0001494799710000057
其中,D(k)表示转换到频域中麦克风接收的信号,X(k)表示频域参考信号,
Figure BDA0001494799710000058
表示转换到频域中的自适应滤波器系数,另外,
Figure BDA0001494799710000059
初始化为0,进行迭代更新后仍然存储在算法内部。
在步骤203中,根据转化后的频域信号估计本地信号。
在本实施例中,可以采用以下公式中的至少之一估计本地信号:
Figure BDA00014947997100000510
Figure BDA00014947997100000511
其中,
Figure BDA00014947997100000512
表示频域本地信号,D(k)表示转换到频域中麦克风接收的信号,X(k)表示频域参考信号,
Figure BDA00014947997100000513
表示转换到频域中的自适应滤波器系数。
在步骤204中,计算本地信号的方差。
在本实施例中,可以根据帕塞瓦尔定理的公式
Figure BDA00014947997100000514
计算本地信号的方差
Figure BDA0001494799710000061
在本实施例中,可以在根据转化后的频域信号估计本地信号
Figure BDA0001494799710000062
之后,对本地信号
Figure BDA0001494799710000063
进行非线性处理,具体地,可以强制去掉幅值小于预设幅值阈值的频点,还可以计算D(k)和X(k)的相干性,剔除所述相干性大于预设相干阈值的频点。
在步骤205中,根据本地信号的方差动态调节自适应滤波器的步长因子和规则化因子。
在本实施例中,可以根据JO-NLMS(Joint Optimized NLMS,联合优化归一化最小均方算法)计算步长因子。
图3为本发明一示例性实施例示出的另一种回声消除方法流程图,如图3所示,回声消除方法包括以下步骤:
在步骤301中,获取发音装置发出的当前帧参考信号和当前帧麦克风接收的信号。
在本实施例中,在获取发音装置发出的当前帧参考信号x(n)和当前帧麦克风接收的信号d(n)之前,可以对各个变量进行初始化。
如前述对回声消除原理的分析可知,因
Figure BDA0001494799710000064
所以为了求出本地信号v(n),首先要获取发音装置发出的当前帧参考信号x(n)和当前帧麦克风接收的信号d(n)。
在步骤302中,对上述获取到的时域信号作FFT(Fast Fourier Transform,快速傅里叶变换),转换为频域信号。
在本实施例中,上述步骤301中获取的当前帧参考信号x(n)和当前帧麦克风接收的信号d(n)以及自适应滤波器系数
Figure BDA0001494799710000065
均为时域信号,可以通过分别对x(n)、d(n)以及
Figure BDA0001494799710000066
作FFT(Fast Fourier Transform,快速傅里叶变换),转换成频域信号X(k)、D(k)和
Figure BDA0001494799710000067
具体地通过以下公式转换:
Figure BDA0001494799710000068
Figure BDA0001494799710000069
Figure BDA0001494799710000071
其中,N表示采样点,k表示频点,
Figure BDA0001494799710000072
初始化为0,进行迭代更新后仍然存储在算法内部。
在步骤303中,根据频域信号估计本地信号。
在本实施例中,可以根据在步骤301中得出的公式
Figure BDA0001494799710000073
推导出时域信号转换为频域信号后估计本地频域信号的公式:
Figure BDA0001494799710000074
在其他的实施方式中,还可以根据下述公式来估计本地频域信号
Figure BDA0001494799710000075
Figure BDA0001494799710000076
Figure BDA0001494799710000077
在步骤304中,对估计得到的本地信号进行非线性处理。
在本实施例中,经过上述步骤303,由于估计到的本地信号
Figure BDA0001494799710000078
是频域信号,可以通过强制去掉幅值小于预设幅值阈值∈的频点来去除稳态噪声的干扰,其中,∈是根据具体实际情况预先设定的一个临界幅值,当
Figure BDA0001494799710000079
时,则可以认为
Figure BDA00014947997100000710
在其他的实施方式中,由于回声信号往往和参考信号具有强相干性,还可以通过计算D(k)和X(k)的相干性,剔除D(k)和X(k)的相干性大的频点来去除回声的影响,进一步保证准确估计
Figure BDA00014947997100000711
具体相干性的计算公式可参考相关现有技术,在此不再赘述,其中,D(k)表示转换到频域中麦克风接收的信号,X(k)表示频域参考信号。
在步骤305中,计算本地信号的方差。
在本实施例中,可以根据帕塞瓦尔定理描述的能量守恒原理,即时域能量与频域能量相等,计算本地信号
Figure BDA00014947997100000712
的方差
Figure BDA00014947997100000713
具体采用下述公式:
Figure BDA00014947997100000714
其中,
Figure BDA00014947997100000715
表示
Figure BDA00014947997100000716
范数。
在步骤306中,根据JO-NLMS(Joint Optimized NLMS,联合优化归一化最小均方算法)分别计算各情况下步长因子μJONLMS,l(i),并更新步长因子和规则化因子。
在本实施例中,可以根据JO-NLMS算法中的以下公式,循环计算各帧内步长因子μJONLMS,l(i)并更新步长因子和规则化因子:
Figure BDA0001494799710000081
Figure BDA0001494799710000082
Figure BDA0001494799710000083
Figure BDA0001494799710000084
举例而言,图4为本发明一示例性实施例示出的一种样本采集图,其中,扬声器距离麦克风大约10厘米,目标人声距离麦克风约3米,声音信号采样率为16kHz,从图上可以看出,采集到的信号信噪比(图中的信号-回声比)非常低,基本淹没在回声里。图5是分别采用PVSS(parametric variable step size,参数变步长算法)和本发明提供的方法来估计
Figure BDA0001494799710000085
处理效果图,其中,除去估计参数
Figure BDA0001494799710000086
的方法不同外,其他参数均相同,例如,在进行快速傅里叶变换时,采样点N取512,自适应滤波器的长度取L=320,m(0)=1e-5
Figure BDA0001494799710000087
从图中可知,相较于PVSS(parametric variable step size,参数变步长算法),本发明提供的估计
Figure BDA0001494799710000088
方法的更加准确,进行回声消除后回声残留更少。
由上述实施例可知,本发明提供的回声消除方法具有以下优点:
1)由于参考信号和回声相干性较大,加上本地信号往往是稀疏的信号,只占少数的频点,可以利用频域的相关性和稀疏性,使得
Figure BDA0001494799710000089
估计更加准确;
2)在时域里估计参数
Figure BDA00014947997100000810
时,需要对每一点都进行计算,计算量巨大,而在频域里估计参数
Figure BDA00014947997100000811
时,可以分块进行,一帧信号内参数
Figure BDA00014947997100000812
保持不变,大大减少计算量,提高工作效率;
3)在进行循环迭代时,无需对内部循环继续迭代,只需在外部循环迭代更新,大大减小计算量。
与上述本发明实施例提供的回声消除方法相对应,本发明还提供了一种回声消除装置,如图6所示,该回声消除装置包括:获取模块601、转换模块602、第一计算模块603、第二计算模块604以及更新模块605,其中:
获取模块601,获取估计本地信号的特征参数;其中,所述特征参数包括发音装置发出的当前帧参考信号和当前帧麦克风接收的信号;
转换模块602,将所述特征参数分别转换为频域信号;
第一计算模块603,根据转化后的频域信号估计本地信号
Figure BDA0001494799710000091
第二计算模块604,计算本地信号的方差;
更新模块605,根据所述本地信号的方差动态调节自适应滤波器的步长因子和规则化因子。
本发明还提供一种回声消除系统,包括:计算机500和上述实施例中任一所述的回声消除装置600。
计算机500可以被用于实现实施本发明一些实施例中披露的特定方法和装置。本实施例中的特定装置利用功能框图展示了一个包含显示模块的硬件平台。
在一些实施例中,计算机500可以通过其他硬件设备、软件程序、固件以及他们的组合来实现本发明的一些实施例的具体实施。在其他实施例中,计算机500可以是一个通用目的的计算机,或一个有特定目的的计算机。
图7是本发明示例性实施例提出的一种回声消除系统框图,如图7所示,计算机500可以包括内部通信总线501,处理器502,只读存储器(ROM)503,随机存取存储器(RAM)504,通信端口505、输入/输出组件506、硬盘507以及用户界面508。内部通信总线501可以实现计算机500组件间的通信。处理器502可以进行判断和发出提示。
在一些实施例中,处理器502可以由一个或多个处理器组成。通信端口505可以实现计算机500与其他部件(图未示)。
在一些实施例中,计算机500可以通过通信端口505从网络发送和接受信息及数据。输入/输出组件505支持计算机500与其他部件之间的输入/输出数据流。用户界面508可以实现计算机500和用户之间的交互和信息交换。计算机500还包括不同形式的程序存储单元以及数据存储单元,例如硬盘507、只读存储器(ROM)508、随机存取存储器(RAM)504,能够存储计算机处理和/或通信使用的各种数据文件,以及处理器502所执行的可能的程序指令。
所述处理器502执行程序时可用于执行一种回声消除方法,所述方法包括:
获取估计本地信号的特征参数;其中,所述特征参数包括发音装置发出的当前帧参考信号和当前帧麦克风接收的信号;
将所述特征参数分别转换为频域信号;
根据转化后的频域信号估计本地信号;
计算本地信号的方差;
根据所述本地信号的方差动态调节自适应滤波器的步长因子和规则化因子。
本发明实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本申请所有发明实施例提供的回声消除方法。所述方法包括:
获取估计本地信号的特征参数;其中,所述特征参数包括发音装置发出的当前帧参考信号和当前帧麦克风接收的信号;
将所述特征参数分别转换为频域信号;
根据转化后的频域信号估计本地信号;
计算本地信号的方差;
根据所述本地信号的方差动态调节自适应滤波器的步长因子和规则化因子。
计算机可读信号介质可能包括一个内含计算机程序编码的传播数据信号,例如在基带上或作为载波的一部分。该传播信号可能有多种表现形式,包括电磁形式、光形式等。计算机可读信号介质可以是除计算机可读信号介质之外的任何计算机可读介质,该介质可以通过连接至一个指令执行系统、装置或设备以实现通讯、传播或传输供使用的程序。位于计算机可读信号介质上的程序编码可以通过任何合适的介质进行传播,包括无线电、电缆、光纤电缆、射频信号或类似介质、或任何上述介质的组合。
本发明的实施例中各部分操作所需的计算机程序编码可以用任意一种或多种程序语言编写,包括面向对象编程语言如JAVA、Scala、Smalltalk、Eiffel、JADE、Emerald、C++、C#、VB、.NET、Python等,常规程序化编程语言如C语言、Visual Basic、Fortran 2003、PHP等或其他编程语言。该程序编码可以完全运行在用户计算机上、或作为独立的软件包在用户计算机上运行、或部分在用户计算机上运行部分在远程计算机上运行、或完全在远程计算机或服务器上运行。在后面的情况下,远程计算机可以通过任何网络形式与用户计算机连接,比如局域网(LAN)或广域网(WAN),或连接至外部计算机(例如通过因特网),或在云计算环境中,或作为服务使用如软件。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种回声消除方法,其特征在于,包括以下步骤:
获取估计本地信号的特征参数;其中,所述特征参数包括发音装置发出的当前帧参考信号和当前帧麦克风接收的信号;
将所述特征参数分别转换为频域信号;
根据转化后的频域信号估计本地信号;
计算本地信号的方差;
根据所述本地信号的方差动态调节自适应滤波器的步长因子和规则化因子,包括:根据JO-NLMS(Joint Optimized NLMS,联合优化归一化最小均方算法)计算步长因子;
在根据转化后的频域信号估计本地信号之后,对本地信号进行非线性处理,包括:计算转换到频域中麦克风接收的信号和频域参考信号的相干性;剔除所述相干性大于预设相干阈值的频点。
2.根据权利要求1所述的回声消除方法,其特征在于,所述根据转化后的频域信号估计本地信号包括:
采用以下公式中的至少之一估计本地信号:
Figure FDA0002484803550000011
Figure FDA0002484803550000012
其中,
Figure FDA0002484803550000013
表示频域本地信号,D(k)表示转换到频域中麦克风接收的信号,X(k)表示频域参考信号,
Figure FDA0002484803550000014
表示转换到频域中的自适应滤波器系数。
3.根据权利要求1所述的回声消除方法,其特征在于,所述计算本地信号的方差包括:
根据帕塞瓦尔定理
Figure FDA0002484803550000015
计算所述本地信号的方差。
4.根据权利要求1所述的回声消除方法,其特征在于,所述对本地信号进行非线性处理包括:
强制去掉幅值小于预设幅值阈值的频点。
5.根据权利要求1所述的回声消除方法,其特征在于,所述对本地信号进行非线性处理包括:
当本地信号的幅值的绝对值小于预设幅值阈值时,则本地信号的幅值的绝对值为零。
6.一种回声消除装置,其特征在于,包括:
获取模块,用于获取估计本地信号的特征参数;其中,所述特征参数包括发音装置发出的当前帧参考信号和当前帧麦克风接收的信号;
转换模块,用于将所述特征参数分别转换为频域信号;
第一计算模块,根据转化后的频域信号估计本地信号;
第二计算模块,计算本地信号的方差;
更新模块,根据所述本地信号的方差动态调节自适应滤波器的步长因子和规则化因子;根据JO-NLMS(Joint Optimized NLMS,联合优化归一化最小均方算法)计算步长因子;
非线性处理模块,用于在根据转化后的频域信号估计本地信号之后,对本地信号进行非线性处理,包括:计算转换到频域中麦克风接收的信号和频域参考信号的相干性;剔除所述相干性大于预设相干阈值的频点。
7.根据权利要求6所述的装置,其特征在于,所述非线性处理模块还用于强制去掉幅值小于预设幅值阈值的频点。
8.一种回声消除系统,其特征在于,包括:处理器和如权利要求6所述的回声消除装置。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时可用于执行权利要求1-5任一所述的方法。
10.一种计算机设备,包括存储器和处理器,所述存储器存储有可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1-5中任一项所述的方法的步骤。
CN201711267227.2A 2017-12-05 2017-12-05 回声消除方法、装置、系统及存储介质 Active CN108010536B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711267227.2A CN108010536B (zh) 2017-12-05 2017-12-05 回声消除方法、装置、系统及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711267227.2A CN108010536B (zh) 2017-12-05 2017-12-05 回声消除方法、装置、系统及存储介质

Publications (2)

Publication Number Publication Date
CN108010536A CN108010536A (zh) 2018-05-08
CN108010536B true CN108010536B (zh) 2020-07-14

Family

ID=62056362

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711267227.2A Active CN108010536B (zh) 2017-12-05 2017-12-05 回声消除方法、装置、系统及存储介质

Country Status (1)

Country Link
CN (1) CN108010536B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109584898B (zh) * 2018-12-29 2022-05-31 上海瑾盛通信科技有限公司 一种语音信号的处理方法、装置、存储介质及电子设备
CN110335618B (zh) * 2019-06-06 2021-07-30 福建星网智慧软件有限公司 一种改善非线性回声抑制的方法及计算机设备
CN112017679B (zh) * 2020-08-05 2024-01-26 海尔优家智能科技(北京)有限公司 用于自适应滤波器系数更新的方法及装置、设备
CN112687285B (zh) * 2020-12-22 2023-09-29 珠海市杰理科技股份有限公司 回声消除方法和装置
CN113421579A (zh) * 2021-06-30 2021-09-21 北京小米移动软件有限公司 声音处理方法、装置、电子设备和存储介质
CN114071220B (zh) * 2021-11-04 2024-01-19 深圳Tcl新技术有限公司 音效调节方法、装置、存储介质及电子设备

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19831320A1 (de) * 1998-07-13 2000-01-27 Ericsson Telefon Ab L M Digitales adaptives Filter und akustischer Echokompensator
US8275120B2 (en) * 2006-05-30 2012-09-25 Microsoft Corp. Adaptive acoustic echo cancellation
CN101888455B (zh) * 2010-04-09 2013-07-03 熔点网讯(北京)科技有限公司 一种频域自适应回声抵消方法
US9264553B2 (en) * 2011-06-11 2016-02-16 Clearone Communications, Inc. Methods and apparatuses for echo cancelation with beamforming microphone arrays
CN103885044B (zh) * 2014-03-31 2016-08-24 西安电子科技大学 一种基于clean算法的窄带雷达回波杂噪抑制方法
CN105371945B (zh) * 2015-10-10 2019-01-25 同济大学 去除厅堂脉冲响应测量声信号中噪声的方法及装置
CN105472191B (zh) * 2015-11-18 2019-09-20 百度在线网络技术(北京)有限公司 一种跟踪回声时延的方法和装置
US10477031B2 (en) * 2015-12-08 2019-11-12 Nuance Communications, Inc. System and method for suppression of non-linear acoustic echoes

Also Published As

Publication number Publication date
CN108010536A (zh) 2018-05-08

Similar Documents

Publication Publication Date Title
CN108010536B (zh) 回声消除方法、装置、系统及存储介质
CN109727604B (zh) 用于语音识别前端的频域回声消除方法及计算机储存介质
KR101934636B1 (ko) 심화신경망 기반의 잡음 및 에코의 통합 제거 방법 및 장치
CN106898359B (zh) 音频信号处理方法、系统、音频交互装置及计算机设备
KR101331388B1 (ko) 음향 에코를 제거하기 위한 컴퓨터 구현 프로세스 및 시스템
US9386373B2 (en) System and method for estimating a reverberation time
CN108172231A (zh) 一种基于卡尔曼滤波的去混响方法及系统
JP2004056453A (ja) エコー抑圧方法及び装置
KR101581885B1 (ko) 복소 스펙트럼 잡음 제거 장치 및 방법
EP2987314B1 (en) Echo suppression
CN104835503A (zh) 一种改进gsc自适应语音增强方法
CN110211602B (zh) 智能语音增强通信方法及装置
CN112201273A (zh) 一种噪声功率谱密度计算方法、系统、设备及介质
CN111951818B (zh) 一种基于改进功率差噪声估计算法的双麦克风语音增强方法
WO2012166092A1 (en) Control of adaptation step size and suppression gain in acoustic echo control
CN113744748A (zh) 一种网络模型的训练方法、回声消除方法及设备
US9570088B2 (en) Signal processor and method therefor
US20160005418A1 (en) Signal processor and method therefor
JP4964267B2 (ja) 適応フィルタ及びこれを有するエコーキャンセラ
Dhubkarya et al. Comparative Performance Analysis of Adaptive Algorithms for Simulation & Hardware Implementation of an ECG Signal
KR101558397B1 (ko) 반향필터 추정방법, 반향제거필터 추정방법 및 이를 이용한 단일채널 반향제거방법
US11984107B2 (en) Audio signal processing method and system for echo suppression using an MMSE-LSA estimator
JPWO2012157783A1 (ja) 音声処理装置、音声処理方法および音声処理プログラムを記録した記録媒体
JP7380361B2 (ja) 雑音推定装置、雑音推定プログラム、雑音推定方法、及び収音装置
US20240021184A1 (en) Audio signal processing method and system for echo supression using an mmse-lsa estimator

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20230713

Address after: 518000 Room 201, building A, 1 front Bay Road, Shenzhen Qianhai cooperation zone, Shenzhen, Guangdong

Patentee after: VOICEAI TECHNOLOGIES Co.,Ltd.

Patentee after: Shenzhen Digital Miracle Technology Co.,Ltd.

Address before: 518000 Room 201, building A, 1 front Bay Road, Shenzhen Qianhai cooperation zone, Shenzhen, Guangdong

Patentee before: VOICEAI TECHNOLOGIES Co.,Ltd.