CN109920444B - 回声时延的检测方法、装置以及计算机可读存储介质 - Google Patents

回声时延的检测方法、装置以及计算机可读存储介质 Download PDF

Info

Publication number
CN109920444B
CN109920444B CN201711323838.4A CN201711323838A CN109920444B CN 109920444 B CN109920444 B CN 109920444B CN 201711323838 A CN201711323838 A CN 201711323838A CN 109920444 B CN109920444 B CN 109920444B
Authority
CN
China
Prior art keywords
end signal
far
delay detection
cross
time delay
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711323838.4A
Other languages
English (en)
Other versions
CN109920444A (zh
Inventor
屈振华
龙显军
江洪
齐洁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Telecom Corp Ltd
Original Assignee
China Telecom Corp Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Telecom Corp Ltd filed Critical China Telecom Corp Ltd
Priority to CN201711323838.4A priority Critical patent/CN109920444B/zh
Publication of CN109920444A publication Critical patent/CN109920444A/zh
Application granted granted Critical
Publication of CN109920444B publication Critical patent/CN109920444B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)

Abstract

本公开涉及一种回声时延的检测方法、装置以及计算机可读存储介质,涉及通信技术领域。本公开的方法包括:获取近端信号和远端信号的各帧信号;根据本次回声时延检测的稀疏度因子随机选取远端信号和近端信号对应帧中的部分或全部数据,确定远端信号和近端信号的互相关系数序列,其中,本次回声时延检测的稀疏度因子是根据上一次回声时延检测的可靠性确定的,稀疏度因子表示远端信号和近端信号中每个数据被选取的概率;根据互相关系数序列确定本次回声时延检测的可靠性,在本次回声时延检测的可靠性达到阈值的情况下,根据互相关系数序列的峰值,确定回声时延。本公开的方法能够在保证回声时延检测的可靠性尽量减少计算量,提高计算效率。

Description

回声时延的检测方法、装置以及计算机可读存储介质
技术领域
本公开涉及通信技术领域,特别涉及一种回声时延的检测方法、装置以及计算机可读存储介质。
背景技术
扩音系统或者语音通信系统会存在声学回声问题,影响用户体验。例如语音通信设备的放音被麦克风再次采集,传回对端,而干扰正常通话。声学回声消除技术就是针对这类情况,利用原始远端信号和自适应滤波器技术,从近端信号中消除掉远端成分。
考虑到算法收敛性以及计算复杂度影响,自适应滤波器的窗口长度通常较短,而系统的回声传播时延可能会远大于这一长度。此时运用回声消除算法,首先需要获得回声的时延参数信息,即将远端和近端信号在时间上大致对齐。因此一般必须在启动回声消除功能之前,先进行时延参数估计,而且在实际系统运行过程中,回声时延可能因为说话人移动、系统卡顿情况、免提切换等因素发生变化,因此需要实时地对时延参数进行跟踪估计。
回声时延估计方法可以通过计算远端声音从播放,到重新被麦克风采集的时间间隔获得。通常可以使用基于信号相关性检测的算法在近端采集信号中检测相关峰值获得时延估计。对近端信号和远端信号进行相关性检测可以采用分块FFT(Fast FourierTransformation,快速傅氏变换)算法或者利用信号的短时幅度谱特征以帧为单位进行相关计算,加速计算过程。
发明内容
发明人发现:采用分块FFT算法或者利用信号的短时幅度谱特征以帧为单位进行相关计算等方法,具有较为固定的计算复杂度,例如在远端声音较为响亮,而近端较安静的情况下,此时过高的时延估计精度造成计算量的浪费,反之如果遇到近端场景较为吵杂的情况又可能出现无法准确检测的情况。
本公开所要解决的一个技术问题是:如何提出一种回声时延的检测方法能够根据检测可靠性动态调整其计算复杂度。
根据本公开的一些实施例,提供的一种回声时延的检测方法,包括:获取近端信号和远端信号的各帧信号;根据本次回声时延检测的稀疏度因子随机选取远端信号和近端信号对应帧中的部分或全部数据,确定本次回声时延检测的远端信号和近端信号的互相关系数序列,其中,本次回声时延检测的稀疏度因子是根据上一次回声时延检测的可靠性确定的,稀疏度因子表示远端信号和近端信号中每个数据被选取的概率;根据互相关系数序列确定本次回声时延检测的可靠性,在本次回声时延检测的可靠性达到阈值的情况下,根据互相关系数序列的峰值,确定回声时延。
在一些实施例中,回声时延检测的可靠性采用以下方法确定:确定远端信号与近端信号的互相关系数序列的最大值;确定以该最大值为中心的预设长度的窗口内的所有正相关系数的中位数;将最大值与中位数的比值作为回声时延检测的可靠性。
在一些实施例中,在上一次回声时延检测的可靠性小于阈值的情况下,将上一次回声时延检测时的稀疏度因子与预设步长的和作为本次回声时延检测的稀疏度因子。
在一些实施例中,根据本次回声时延检测的稀疏度因子随机选取远端信号和近端信号对应帧中的部分或全部数据,确定本次回声时延检测的远端信号和近端信号的互相关系数序列包括:将预设步长作为稀疏度因子增量,根据稀疏度因子增量随机选取远端信号和近端信号对应帧中的部分或全部数据,确定本次回声时延检测的远端信号和近端信号的增量互相关系数序列;将增量互相关系数序列的各项与上一次回声时延检测的远端信号和近端信号的互相关系数序列的各项分别进行相加,得到本次回声时延检测的远端信号和近端信号的互相关系数序列。
在一些实施例中,在上一次回声时延检测的可靠性大于阈值的情况下,上一次回声时延检测时的稀疏度因子与预设步长的差值作为本次回声时延检测的稀疏度因子。
在一些实施例中,采用以下方法确定本次回声时延检测的远端信号和近端信号的互相关系数序列:获取远端信号和近端信号各帧的傅氏变换;根据本次回声时延检测的稀疏度因子随机选取远端信号和近端信号对应帧的部分或全部傅氏变换系数,确定远端信号和近端信号的互谱;根据互谱确定本次回声时延检测的远端信号和近端信号的互相关系数序列。
在一些实施例中,根据以下公式确定远端信号和近端信号的互谱:
Figure BDA0001505246830000031
其中,
Figure BDA0001505246830000032
为远端信号第m帧的第k个傅氏变换系数,
Figure BDA0001505246830000033
为近端信号第m+i帧的第k个傅氏变换系数,0≤i≤N-M-1,i为整数,0≤k≤2L-1,k为整数,表示远端信号和近端信号每帧中第k个傅氏变换系数的编号,远端信号和近端信号每帧中的采样点个数为2L,conj表示求共轭,0≤m≤M-1,m为整数,M为远端信号的帧数,N为近端信号的帧数,M≤N,rnd(k,m)∈{0,1},为二值随机数,并以稀疏度因子所表示的概率为1。
在一些实施例中,根据互相关系数序列的峰值,确定回声时延包括:确定互相关系数序列中的最大值对应的采样位置;将采样位置与采样率之比作为回声时延。
根据本公开的另一些实施例,提供的一种回声时延的检测装置,包括:信号获取模块,用于获取近端信号和远端信号的各帧信号;相关性检测模块,用于根据本次回声时延检测的稀疏度因子随机选取远端信号和近端信号对应帧中的部分或全部数据,确定本次回声时延检测的远端信号和近端信号的互相关系数序列,其中,本次回声时延检测的稀疏度因子是根据上一次回声时延检测的可靠性确定的,稀疏度因子表示远端信号和近端信号中每个数据被选取的概率;时延确定模块,用于根据互相关系数序列确定本次回声时延检测的可靠性,在本次回声时延检测的可靠性达到阈值的情况下,根据互相关系数序列的峰值,确定回声时延。
在一些实施例中,时延确定模块用于确定远端信号与近端信号的互相关系数序列的最大值,确定以该最大值为中心的预设长度的窗口内的所有正相关系数的中位数,将最大值与中位数的比值作为回声时延检测的可靠性。
在一些实施例中,在上一次回声时延检测的可靠性小于阈值的情况下,将上一次回声时延检测时的稀疏度因子与预设步长的和作为本次回声时延检测的稀疏度因子。
在一些实施例中,相关性检测模块用于将预设步长作为稀疏度因子增量,根据稀疏度因子增量随机选取远端信号和近端信号对应帧中的部分或全部数据,确定本次回声时延检测的远端信号和近端信号的增量互相关系数序列,将增量互相关系数序列的各项与上一次回声时延检测的远端信号和近端信号的互相关系数序列的各项分别进行相加,得到本次回声时延检测的远端信号和近端信号的互相关系数序列。
在一些实施例中,在上一次回声时延检测的可靠性大于阈值的情况下,上一次回声时延检测时的稀疏度因子与预设步长的差值作为本次回声时延检测的稀疏度因子。
在一些实施例中,相关性检测模块用于获取远端信号和近端信号各帧的傅氏变换,根据本次回声时延检测的稀疏度因子随机选取远端信号和近端信号对应帧的部分或全部傅氏变换系数,确定远端信号和近端信号的互谱,根据互谱确定本次回声时延检测的远端信号和近端信号的互相关系数序列。
在一些实施例中,相关性检测模块用于根据以下公式确定远端信号和近端信号的互谱:
Figure BDA0001505246830000041
其中,
Figure BDA0001505246830000042
为远端信号第m帧的第k个傅氏变换系数,
Figure BDA0001505246830000051
为近端信号第m+i帧的第k个傅氏变换系数,0≤i≤N-M-1,i为整数,0≤k≤2L-1,k为整数,表示远端信号和近端信号每帧中第k个傅氏变换系数的编号,远端信号和近端信号每帧中的采样点个数为2L,conj表示求共轭,0≤m≤M-1,m为整数,M为远端信号的帧数,N为近端信号的帧数,M≤N,rnd(k,m)∈{0,1},为二值随机数,并以稀疏度因子所表示的概率为1。
在一些实施例中,时延确定模块用于确定互相关系数序列中的最大值对应的采样位置,将采样位置与采样率之比作为回声时延。
根据本公开的又一些实施例,提供的一种回声时延的检测装置,包括:存储器;以及耦接至存储器的处理器,处理器被配置为基于存储在存储器设备中的指令,执行如前述任一个实施例的回声时延的检测方法。
根据本公开的再一些实施例,提供的一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现前述任一个实施例的回声时延的检测方法的步骤。
本公开在一次回声时延检测中进行近端信号和远端信号相关计算时,根据上一次回声时延检测的可靠性调整稀疏度因子,从而调整本次回声时延检测中选取的远端信号的帧和对应的近端信号的帧的数量,选取部分或全部远端信号和近端信号的帧进行相关性计算。因此,本公开的方法可以根据回声时延检测的可靠性和准确性灵活的调整计算复杂度,能够在保证回声时延检测的可靠性的前提下,尽量减少计算量,提高计算效率。
通过以下参照附图对本公开的示例性实施例的详细描述,本公开的其它特征及其优点将会变得清楚。
附图说明
为了更清楚地说明本公开实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出本公开的一些实施例的回声时延的检测方法的流程示意图。
图2A示出本公开的一些实施例的远端信号和近端信号相关性检测的示意图。
图2B示出本公开的另一些实施例的回声时延的检测方法的流程示意图。
图3示出本公开的一些实施例的回声时延的检测装置的结构示意图。
图4示出本公开的另一些实施例的回声时延的检测装置的结构示意图。
图5示出本公开的又一些实施例的回声时延的检测装置的结构示意图。
具体实施方式
下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本公开一部分实施例,而不是全部的实施例。以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本公开及其应用或使用的任何限制。基于本公开中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本公开保护的范围。
本公开提出一种回声时延的检测方法,能够根据回声时延检测可靠性动态调整近端信号和远端信号相关性的计算复杂度,保证回声时延检测的可靠性的前提下,尽量减少计算量,提高计算效率。下面结合图1描述本公开的回声时延的检测方法。对于回声时延的检测可以每隔预设周期执行一次,一个周期内采集远端信号和近端信号,并通过两者的相关性检测得到回声时延。本公开的方案为一个预设周期内的检测方案,在一个预设周期内采集的远端信号和近端信号是不变的。
图1为本公开回声时延的检测方法一些实施例的流程图。如图1所示,该实施例的方法包括:步骤S102~S106。
步骤S102,获取远端信号和近端端信号的各帧信号。
可以首先对近端信号和远端信号进行缓冲。建立两个缓冲区,长度分别为L*M、L*N,0<M≤N,分别用于缓冲播出的远端信号和采集到的近端信号。其中,L表示一帧中采样点个数,M和N分别表示待缓冲的远端信号和近端信号的帧数。由于远端信号和近端信号的相关性检测是在近端信号中找到与远端信号相关性最大的一段信号的位置,因此近端信号缓冲的帧数较多。
可以使用语音活动检测(Voice Activity Detection,VAD)模块持续检测远端信号,当检测到远端语音处于激活态时,开始执行缓冲操作,将后续远端信号和近端信号分别放入上述两个缓冲区中。其中语音检测模块可以基于信号的短时强度以及过零率的经典算法或其他算法实现,在此不再赘述。
当缓冲区域填满后,利用缓冲的近端信号和远端信号执行回声时延检测。可以首先采用预加重滤波器对缓冲的近端信号和远端信号进行增强。常用预加重滤波器有IIR(Infinite Impulse Response,无限脉冲响应)滤波器参数可以采用,H(z)=1/(1+b0z-1),b0=0.9。
进一步,本公开以采用分块FFT计算近端信号和远端信号的相关性为例。首先,对远端信号以帧长为L进行非重叠分帧后,每帧后端补零到2L长度,其中,L表示一帧中采样点个数,每帧中的采样点用k编号,k=0,…,2L-1,每帧的编号为m,m=0,…,M-1。对近端信号以帧长为2L进行重叠分帧,帧间重叠长度为L,其中,2L表示一帧中采样点总个数,每帧中的采样点用k编号,每帧的编号为n,n=0,…,N-1。获取远端信号和近端信号的各帧信号即为分帧后的各帧信号。
步骤S104,根据本次回声时延检测的稀疏度因子随机选取远端信号和近端信号对应帧中的部分或全部数据,确定本次回声时延检测的远端信号和近端信号的互相关系数序列。
本公开设置稀疏度因子用于随机远端和近端信号对应帧中的部分或全部数据来计算远端信号和近端信号相关性。稀疏度因子表示远端信号和近端信号中每个数据被选取的概率,本次回声时延检测的稀疏度因子是根据上一次回声时延检测的可靠性确定的。
在一些实施例中,可以采用以下方法计算远端信号和近端信号相关性:获取远端信号和近端信号各帧的傅氏变换;根据本次回声时延检测的稀疏度因子随机选取远端信号和近端信号对应帧傅氏变换后部分或全部傅氏变换系数频率分量来确定远端信号和近端信号的互谱;根据互谱确定本次回声时延检测的远端信号和近端信号的互相关系数序列。
具体的,可以对远端信号的每一帧进行FFT变换,得到X(k,m),k表示每一帧中第k个频率分量即第k个傅氏变换系数的编号,k=0,…,2L-1,m表示每帧的编号,m=0,…,M-1,M为远端信号的帧数。对近端信号的每一帧进行FFT变换,得到Y(k,n),k表示每一帧中第k个频率分量即第k个傅氏变换系数的编号,k=0,…,2L-1,m表示每帧的编号,n=0,…,N-1,N为近端信号的帧数。
进一步,可以直接利用远端信号傅氏变换系数X(k,m)和近端信号的傅氏变换系数Y(k,n)进行相关性计算,即
Figure BDA0001505246830000081
Figure BDA0001505246830000082
也可以对远端信号的傅氏变换和近端信号的傅氏变换系数进行归一化,利用归一化后的傅氏变换系数进行相关性计算。远端信号归一化后的傅氏变换系数
Figure BDA0001505246830000083
近端信号归一化后的傅氏变换系数
Figure BDA0001505246830000084
其中,abs()表示对复数取幅度谱。
然后根据以下公式计算远端信号和近端信号的互谱:
Figure BDA0001505246830000085
其中,Z(k,i)为互谱系数,
Figure BDA0001505246830000086
为远端信号第m帧的第k个傅氏变换系数或归一化傅氏变换系数,
Figure BDA0001505246830000087
为近端信号第m+i帧的第k个傅氏变换系数或归一化傅氏变换系数,0≤i≤N-M-1,i为整数,0≤k≤2L-1,k为整数,表示远端信号和近端信号每帧中的采样点的编号,远端信号和近端信号每帧中的采样点个数为2L,conj表示求共轭,0≤m≤M-1,m为整数,M为远端信号的帧数,N为近端信号的帧数,M≤N。
通常情况下,远端信号和近端信号的互谱可以根据
Figure BDA0001505246830000091
计算,本公开增加了随机项rnd(k,m)∈{0,1},为二值随机数,根据稀疏度因子S,0<S≤1控制,即以稀疏度因子S所表示的概率为1。根据公式(1),当rnd(k,m)=1时,远端信号第m帧的傅氏变换或归一化傅氏变换的第k个傅氏变换系数
Figure BDA0001505246830000092
和对应的近端信号第m+i帧的傅氏变换或归一化傅氏变换的第k个傅氏变换系数
Figure BDA0001505246830000093
参与相关性计算,否则,
Figure BDA0001505246830000094
和对应的
Figure BDA0001505246830000095
不参与相关性计算。
远端信号和对应近端信号得到的互谱为pi=[Z(0,i),……,Z(2L-1,i)]T,对pi进行逆快速傅里叶变换(IFFT),得到vi=IFFT(pi),取vi前半段即得到的前L个相关系数组合成互相关系数,得到c(i*L+l)=vi(l),其中,0≤l≤L-1。l为整数。进而可得到远端信号和近端信号的互相关系数序列c=[c(0),……,c((N-M)L-1)]。如图2A所示,远端信号与近端缓冲近端信号对应帧进行相关性计算的示意图。通过调整i将远端信号逐次后移1帧与近端信号进行相关性计算,得到对应的c(i*L)~c(i*L+L-1)。0≤i≤N-M-1,则互相关系数序列中有(N-M)L个互相关系数。
每次回声时延检测抽取的远端信号和近端信号的傅氏变换系数可以根据稀疏度因子S动态进行调整。稀疏度因子S可以根据上一次和本次回声时延检测的可靠性确定。
在一些实施例中,回声时延检测的可靠性采用以下方法确定:确定远端信号与近端信号的互相关系数序列的最大值cmax;确定以该最大值为中心的预设长度W的窗口内的所有正相关系数的中位数cmedian_w;将最大值与中位数的比值作为回声时延检测的可靠性,即Q=cmax/cmedian_w,同时易知0≤Q≤1。
可以通过设置回声时延检测的可靠性的阈值Th1,通过将计算的回声时延检测的可靠性与阈值进行比对,确定如何调整稀疏度因子。
在上一次回声时延检测的可靠性小于阈值的情况下,需要增大稀疏度因子,使S(j)=min(S(j-1)+α,Smax),S(j)表示第j次回声时延检测的稀疏度因子,S(j-1)表示第j-1次回声时延检测的稀疏度因子,α为预设步长,为正数,Smax≤1,为预定义的稀疏度因子的最大值。可以直接利用上一次回声时延检测时的稀疏度因子与预设步长的和S(j-1)+α作为本次回声时延检测的稀疏度因子S(j),重新随机选取部分或全部远端信号的帧和对应近端的信号的帧,根据前述方法确定本次回声时延检测的远端信号和近端信号的互相关系数序列。
为进一步节省计算量,在一些实施例中,可以采用增量方式对原有上一次得到的互相关系数序列进行更新。在回声时延检测的可靠性小于阈值的情况下,将预设步长作为稀疏度因子增量,根据稀疏度因子增量随机选取远端信号和近端信号对应帧中的部分或全部数据,确定本次回声时延检测的远端信号和近端信号的增量互相关系数序列;将增量互相关系数序列的各项与上一次回声时延检测的远端信号和近端信号的互相关系数序列的各项分别进行相加,得到本次回声时延检测的远端信号和近端信号的互相关系数序列。
也就是,本次回声时延检测仅利用稀疏度因子增量随机选取部分远端信号的帧和对应的近端信号对应帧中的数据计算增量互相关系数序列,再与前一次的互相关系数序列进行累加即可。
在上一次回声时延检测的可靠性大于阈值Th2的情况下,可以适当减小稀疏度因子,本次回声时延检测的稀疏度因子可以是上一次回声时延检测时的稀疏度因子与预设步长的差值。为了避免S频繁调整,可规定Th2必须明显大于Th1。S(j)=max(S(j-1)-α,Smin),0<Smin<Smax≤1,Smin为预定义的稀疏度因子的最小值。直接利根据S(j),随机选取部分或全部远端信号的帧和对应近端的信号的帧,根据前述方法确定本次回声时延检测的远端信号和近端信号的互相关系数序列。
步骤S106,根据互相关系数序列确定本次回声时延检测的可靠性,在本次回声时延检测的可靠性达到阈值的情况下,根据互相关系数序列的峰值,确定回声时延。
只要本次回声时延检测的可靠性达到阈值,则可以确定回声时延。在一些实施例中,确定互相关系数序列中的最大值对应的采样位置idx,将采样位置与采样率之比作为回声时延,即回声延迟时间T=idx/nSample。
在本次回声时延检测的可靠性没有达到阈值的情况下,则根据步骤S104中的方法对稀疏度因子进行调整,进入下一次回声时延检测,直至回声时延检测的可靠性达到阈值,再计算回声时延。
需要说明的是,上述实施例的方法为回声时延检测一个预设周期内的检测方法,也就是上述各次回声时延检测时采集的原始远端信号和近端信号是不变的,直至确定回声时延则一个预设周期的回声时延检测结束。等待下一个预设周期的到来再重复执行上述实施例的方法直至确定回声时延。
上述实施例的方法在一次回声时延检测中进行近端信号和远端信号相关计算时,根据上一次回声时延检测的可靠性调整稀疏度因子,从而调整本次回声时延检测中选取的远端信和近端信号对应帧的数据的数量,选取远端信号和近端信号对应帧中部分或全部数据进行相关性计算。因此,上述实施例的方法可以根据回声时延检测的可靠性和准确性灵活的调整计算复杂度,在近端较安静的情况下,上一次回声时延检测的可靠性高,可以通过减少选取的数据的数量,降低计算精度,节省计算资源,提高效率。在近端场景较为吵杂的情况下,上一次回声时延检测的可靠性差,可以通过增加选取远端信号和近端信号的数据数量,提高计算精度,能够在保证回声时延检测的可靠性的前提下,尽量减少计算量,提高计算效率。
下面结合图2B描述本公开回声时延的检测方法的另一些实施例。图2B为本公开回声时延的检测方法另一些实施例的流程图。如图2B所示,该实施例的方法包括:步骤S202~S220。
步骤S202,获取远端信号和近端端信号。
步骤S204,对远端信号和近端信号分别进行分帧。
步骤S206,对远端信号和近端信号分别逐帧进行傅氏变换。
步骤S208,根据本次回声时延检测的稀疏度因子随机选取远端信号和近端信号对应帧的部分或全部傅氏变换系数,确定远端信号和近端信号的互谱。
步骤S210,根据互谱确定本次回声时延检测的远端信号和近端信号的互相关系数序列。
步骤S212,根据互相关系数序列确定本次回声时延检测的可靠性。
步骤S214,判断本次回声时延检测的可靠性是否大于阈值,如果大于,则执行步骤S216,否则,执行步骤S220。
步骤S216,根据互相关系数序列的峰值,确定回声时延。
步骤S218,将本次回声时延检测时的稀疏度因子与预设步长的差值作为下一周期回声时延检测的稀疏度因子,进入下一周期回声时延检测,返回步骤S202重新开始执行。
步骤S220,将本次回声时延检测时的稀疏度因子与预设步长的和作为下一次回声时延检测的稀疏度因子,返回步骤S208重新开始执行。
本公开还提供一种回声时延的检测装置,下面结合图3进行描述。
图3为本公开回声时延的检测装置的一些实施例的结构图。如图3所示,该实施例的装置30包括:信号获取模块302,相关性检测模块304,时延确定模块306。
信号获取模块302,用于获取近端信号和远端信号的各帧信号。例如,信号获取模块302可以实现步骤S102中的方法。
相关性检测模块304,用于根根据本次回声时延检测的稀疏度因子随机选取远端信号和近端信号对应帧中的部分或全部数据,确定本次回声时延检测的远端信号和近端信号的互相关系数序列。
本次回声时延检测的稀疏度因子是根据上一次回声时延检测的可靠性确定的,稀疏度因子表示远端信号和近端信号中每个数据被选取的概率。例如,相关性检测模块304可以实现步骤S104中的方法。
在一些实施例中,在上一次回声时延检测的可靠性小于阈值的情况下,将上一次回声时延检测时的稀疏度因子与预设步长的和作为本次回声时延检测的稀疏度因子。进一步,相关性检测模块304用于将预设步长作为稀疏度因子增量,根据稀疏度因子增量随机选取远端信号和近端信号对应帧中的部分或全部数据,确定本次回声时延检测的远端信号和近端信号的增量互相关系数序列,将增量互相关系数序列的各项与上一次回声时延检测的远端信号和近端信号的互相关系数序列的各项分别进行相加,得到本次回声时延检测的远端信号和近端信号的互相关系数序列。
在一些实施例中,在上一次回声时延检测的可靠性大于阈值的情况下,上一次回声时延检测时的稀疏度因子与预设步长的差值作为本次回声时延检测的稀疏度因子。
在一些实施例中,相关性检测模块304用于相关性检测模块用于获取远端信号和近端信号各帧的傅氏变换,根据本次回声时延检测的稀疏度因子随机选取远端信号和近端信号对应帧的部分或全部傅氏变换系数,确定远端信号和近端信号的互谱,根据互谱确定本次回声时延检测的远端信号和近端信号的互相关系数序列。
进一步,相关性检测模块304用于根据以下公式确定远端信号和近端信号的互谱:
Figure BDA0001505246830000131
其中,
Figure BDA0001505246830000132
为远端信号第m帧的第k个傅氏变换系数,
Figure BDA0001505246830000133
为近端信号第m+i帧的第k个傅氏变换系数,0≤i≤N-M-1,i为整数,0≤k≤2L-1,k为整数,表示远端信号和近端信号每帧中第k个傅氏变换系数的编号,远端信号和近端信号每帧中的采样点个数为2L,conj表示求共轭,0≤m≤M-1,m为整数,M为远端信号的帧数,N为近端信号的帧数,M≤N,rnd(k,m)∈{0,1},为二值随机数,并以稀疏度因子所表示的概率为1。
时延确定模块306,用于根据互相关系数序列确定本次回声时延检测的可靠性,在本次回声时延检测的可靠性达到阈值的情况下,根据互相关系数序列的峰值,确定回声时延。例如,时延确定模块306可以实现步骤S106中的方法。
在一些实施例中,时延确定模块306用于确定远端信号与近端信号的互相关系数序列的最大值,确定以该最大值为中心的预设长度的窗口内的所有正相关系数的中位数,将最大值与中位数的比值作为回声时延检测的可靠性。
在一些实施例中,时延确定模块306用于确定互相关系数序列中的最大值对应的采样位置,将采样位置与采样率之比作为回声时延。
本公开的实施例中的回声时延的检测装置可各由各种计算设备或计算机系统来实现,下面结合图4以及图5进行描述。
图4为本公开回声时延的检测装置的一些实施例的结构图。如图4所示,该实施例的装置40包括:存储器410以及耦接至该存储器410的处理器420,处理器420被配置为基于存储在存储器410中的指令,执行本公开中任意一些实施例中的回声时延的检测方法。
其中,存储器410例如可以包括系统存储器、固定非易失性存储介质等。系统存储器例如存储有操作系统、应用程序、引导装载程序(Boot Loader)、数据库以及其他程序等。
图5为本公开回声时延的检测装置的另一些实施例的结构图。如图5所示,该实施例的装置50包括:存储器510以及处理器520,分别与存储器410以及处理器420类似。还可以包括输入输出接口530、网络接口540、存储接口550等。这些接口530,540,550以及存储器510和处理器520之间例如可以通过总线560连接。其中,输入输出接口530为显示器、鼠标、键盘、触摸屏等输入输出设备提供连接接口。网络接口540为各种联网设备提供连接接口,例如可以连接到数据库服务器或者云端存储服务器等。存储接口550为SD卡、U盘等外置存储设备提供连接接口。
本领域内的技术人员应当明白,本公开的实施例可提供为方法、系统、或计算机程序产品。因此,本公开可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本公开可采用在一个或多个其中包含有计算机可用程序代码的计算机可用非瞬时性存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本公开是参照根据本公开实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解为可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述仅为本公开的较佳实施例,并不用以限制本公开,凡在本公开的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本公开的保护范围之内。

Claims (18)

1.一种回声时延的检测方法,包括:
获取近端信号和远端信号的各帧信号;
根据本次回声时延检测的稀疏度因子随机选取远端信号和近端信号对应帧中的部分或全部数据,确定本次回声时延检测的远端信号和近端信号的互相关系数序列,其中,所述本次回声时延检测的稀疏度因子是根据上一次回声时延检测的可靠性确定的,稀疏度因子表示远端信号和近端信号中每个数据被选取的概率;
根据所述互相关系数序列确定本次回声时延检测的可靠性,在本次回声时延检测的可靠性达到阈值的情况下,根据所述互相关系数序列的峰值,确定回声时延。
2.根据权利要求1所述的检测方法,其中,
所述回声时延检测的可靠性采用以下方法确定:
确定所述远端信号与近端信号的互相关系数序列的最大值;
确定以该最大值为中心的预设长度的窗口内的所有正相关系数的中位数;
将所述最大值与所述中位数的比值作为所述回声时延检测的可靠性。
3.根据权利要求1所述的检测方法,其中,
在所述上一次回声时延检测的可靠性小于阈值的情况下,将上一次回声时延检测时的稀疏度因子与预设步长的和作为本次回声时延检测的稀疏度因子。
4.根据权利要求3所述的检测方法,其中,
所述根据本次回声时延检测的稀疏度因子随机选取远端信号和近端信号对应帧中的部分或全部数据,确定本次回声时延检测的远端信号和近端信号的互相关系数序列包括:
将所述预设步长作为稀疏度因子增量,根据所述稀疏度因子增量随机选取远端信号和近端信号对应帧中的部分或全部数据,确定本次回声时延检测的远端信号和近端信号的增量互相关系数序列;
将所述增量互相关系数序列的各项与上一次回声时延检测的远端信号和近端信号的互相关系数序列的各项分别进行相加,得到本次回声时延检测的远端信号和近端信号的互相关系数序列。
5.根据权利要求1所述的检测方法,其中,
在所述上一次回声时延检测的可靠性大于阈值的情况下,上一次回声时延检测时的稀疏度因子与预设步长的差值作为本次回声时延检测的稀疏度因子。
6.根据权利要求1所述的检测方法,其中,采用以下方法确定本次回声时延检测的远端信号和近端信号的互相关系数序列:
获取所述远端信号和近端信号各帧的傅氏变换;
根据本次回声时延检测的稀疏度因子随机选取远端信号和近端信号对应帧的部分或全部傅氏变换系数,确定所述远端信号和近端信号的互谱;
根据所述互谱确定本次回声时延检测的远端信号和近端信号的互相关系数序列。
7.根据权利要求5所述的检测方法,其中,
根据以下公式确定所述远端信号和近端信号的互谱:
Figure FDA0002926869730000021
其中,
Figure FDA0002926869730000022
为远端信号第m帧的第k个傅氏变换系数,
Figure FDA0002926869730000023
Figure FDA0002926869730000024
为近端信号第m+i帧的第k个傅氏变换系数,0≤i≤N-M-1,i为整数,0≤k≤2L-1,k为整数,表示远端信号和近端信号每帧中第k个傅氏变换系数的编号,远端信号和近端信号每帧中的采样点个数为2L,conj表示求共轭,0≤m≤M-1,m为整数,M为远端信号的帧数,N为近端信号的帧数,M≤N,rnd(k,m)∈{0,1},为二值随机数,并以稀疏度因子所表示的概率为1。
8.根据权利要求1-7任一项所述的检测方法,其中,所述根据所述互相关系数序列的峰值,确定回声时延包括:
确定所述互相关系数序列中的最大值对应的采样位置;
将所述采样位置与采样率之比作为回声时延。
9.一种回声时延的检测装置,包括:
信号获取模块,用于获取近端信号和远端信号的各帧信号;
相关性检测模块,用于根据本次回声时延检测的稀疏度因子随机选取远端信号和近端信号对应帧中的部分或全部数据,确定本次回声时延检测的远端信号和近端信号的互相关系数序列,其中,所述本次回声时延检测的稀疏度因子是根据上一次回声时延检测的可靠性确定的,稀疏度因子表示远端信号和近端信号中每个数据被选取的概率;
时延确定模块,用于根据所述互相关系数序列确定本次回声时延检测的可靠性,在本次回声时延检测的可靠性达到阈值的情况下,根据所述互相关系数序列的峰值,确定回声时延。
10.根据权利要求9所述的检测装置,其中,
所述时延确定模块用于确定所述远端信号与近端信号的互相关系数序列的最大值,确定以该最大值为中心的预设长度的窗口内的所有正相关系数的中位数,将所述最大值与所述中位数的比值作为所述回声时延检测的可靠性。
11.根据权利要求9所述的检测装置,其中,
在所述上一次回声时延检测的可靠性小于阈值的情况下,将上一次回声时延检测时的稀疏度因子与预设步长的和作为本次回声时延检测的稀疏度因子。
12.根据权利要求11所述的检测装置,其中,
所述相关性检测模块用于将所述预设步长作为稀疏度因子增量,根据所述稀疏度因子增量随机选取远端信号和近端信号对应帧中的部分或全部数据,确定本次回声时延检测的远端信号和近端信号的增量互相关系数序列,将所述增量互相关系数序列的各项与上一次回声时延检测的远端信号和近端信号的互相关系数序列的各项分别进行相加,得到本次回声时延检测的远端信号和近端信号的互相关系数序列。
13.根据权利要求9所述的检测装置,其中,
在所述上一次回声时延检测的可靠性大于阈值的情况下,上一次回声时延检测时的稀疏度因子与预设步长的差值作为本次回声时延检测的稀疏度因子。
14.根据权利要求9所述的检测装置,其中,
所述相关性检测模块用于获取所述远端信号和近端信号各帧的傅氏变换,根据本次回声时延检测的稀疏度因子随机选取远端信号和近端信号对应帧的部分或全部傅氏变换系数,确定所述远端信号和近端信号的互谱,根据所述互谱确定本次回声时延检测的远端信号和近端信号的互相关系数序列。
15.根据权利要求14所述的检测装置,其中,
所述相关性检测模块用于根据以下公式确定所述远端信号和近端信号的互谱:
Figure FDA0002926869730000041
其中,
Figure FDA0002926869730000042
为远端信号第m帧的第k个傅氏变换系数,
Figure FDA0002926869730000043
Figure FDA0002926869730000044
为近端信号第m+i帧的第k个傅氏变换系数,0≤i≤N-M-1,i为整数,0≤k≤2L-1,k为整数,表示远端信号和近端信号每帧中第k个傅氏变换系数的编号,远端信号和近端信号每帧中的采样点个数为2L,conj表示求共轭,0≤m≤M-1,m为整数,M为远端信号的帧数,N为近端信号的帧数,M≤N,rnd(k,m)∈{0,1},为二值随机数,并以稀疏度因子所表示的概率为1。
16.根据权利要求9-15任一项所述的检测装置,其中,
所述时延确定模块用于确定所述互相关系数序列中的最大值对应的采样位置,将所述采样位置与采样率之比作为回声时延。
17.一种回声时延的检测装置,包括:
存储器;以及
耦接至所述存储器的处理器,所述处理器被配置为基于存储在所述存储器设备中的指令,执行如权利要求1-8任一项所述的回声时延的检测方法。
18.一种计算机可读存储介质,其上存储有计算机程序,其中,该程序被处理器执行时实现权利要求1-8任一项所述方法的步骤。
CN201711323838.4A 2017-12-13 2017-12-13 回声时延的检测方法、装置以及计算机可读存储介质 Active CN109920444B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711323838.4A CN109920444B (zh) 2017-12-13 2017-12-13 回声时延的检测方法、装置以及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711323838.4A CN109920444B (zh) 2017-12-13 2017-12-13 回声时延的检测方法、装置以及计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN109920444A CN109920444A (zh) 2019-06-21
CN109920444B true CN109920444B (zh) 2021-04-27

Family

ID=66958235

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711323838.4A Active CN109920444B (zh) 2017-12-13 2017-12-13 回声时延的检测方法、装置以及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN109920444B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112379859B (zh) * 2020-11-13 2023-08-18 北京灵汐科技有限公司 二值采样的处理方法及装置、对抗样本的生成方法及装置
CN112397082B (zh) * 2020-11-17 2024-05-14 北京达佳互联信息技术有限公司 估计回声延迟的方法、装置、电子设备和存储介质
CN113724722B (zh) * 2021-08-18 2023-12-26 杭州网易智企科技有限公司 回声延迟估计方法、装置、存储介质和计算设备
CN114900730B (zh) * 2022-05-31 2024-06-21 广州方硅信息技术有限公司 延时估计稳态值的获取方法、装置、电子设备和存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1139501A (zh) * 1993-12-23 1997-01-01 诺基亚电信公司 确定回声消除器中回声区间的方法
CN101026659A (zh) * 2006-02-23 2007-08-29 中兴通讯股份有限公司 一种回声延时定位的实现方法
CN101106405A (zh) * 2006-07-12 2008-01-16 北京大学深圳研究生院 回声消除器、回声消除方法及其双端通话检测系统
US7627026B2 (en) * 2004-07-01 2009-12-01 Broadcom Corporation Threshold setting using piecewise linear approximation for channel diagnostic systems
CN105403860A (zh) * 2014-08-19 2016-03-16 中国科学院声学研究所 一种基于支配相关的多稀疏声源定位方法
CN105794226A (zh) * 2013-12-05 2016-07-20 微软技术许可有限责任公司 用于声学回声消除的房间脉冲响应估计
CN107333018A (zh) * 2017-05-24 2017-11-07 华南理工大学 一种回声时延估计及追踪方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9264553B2 (en) * 2011-06-11 2016-02-16 Clearone Communications, Inc. Methods and apparatuses for echo cancelation with beamforming microphone arrays

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1139501A (zh) * 1993-12-23 1997-01-01 诺基亚电信公司 确定回声消除器中回声区间的方法
US7627026B2 (en) * 2004-07-01 2009-12-01 Broadcom Corporation Threshold setting using piecewise linear approximation for channel diagnostic systems
CN101026659A (zh) * 2006-02-23 2007-08-29 中兴通讯股份有限公司 一种回声延时定位的实现方法
CN101106405A (zh) * 2006-07-12 2008-01-16 北京大学深圳研究生院 回声消除器、回声消除方法及其双端通话检测系统
CN105794226A (zh) * 2013-12-05 2016-07-20 微软技术许可有限责任公司 用于声学回声消除的房间脉冲响应估计
CN105403860A (zh) * 2014-08-19 2016-03-16 中国科学院声学研究所 一种基于支配相关的多稀疏声源定位方法
CN107333018A (zh) * 2017-05-24 2017-11-07 华南理工大学 一种回声时延估计及追踪方法

Also Published As

Publication number Publication date
CN109920444A (zh) 2019-06-21

Similar Documents

Publication Publication Date Title
CN109767783B (zh) 语音增强方法、装置、设备及存储介质
CN109920444B (zh) 回声时延的检测方法、装置以及计算机可读存储介质
US9799318B2 (en) Methods and systems for far-field denoise and dereverberation
CN111149370B (zh) 会议系统中的啸叫检测
CN1122970C (zh) 由时域频谱减法减少信号噪声的降噪处理器、方法和电话
JP5817366B2 (ja) 音声信号処理装置、方法及びプログラム
US20140025374A1 (en) Speech enhancement to improve speech intelligibility and automatic speech recognition
CN103632677B (zh) 带噪语音信号处理方法、装置及服务器
WO2013189199A1 (zh) 一种单通道语音去混响的方法和装置
RU2684194C1 (ru) Способ получения кадра модификации речевой активности, устройство и способ обнаружения речевой активности
CN112017679B (zh) 用于自适应滤波器系数更新的方法及装置、设备
US10269371B2 (en) Techniques for decreasing echo and transmission periods for audio communication sessions
CN111429932A (zh) 语音降噪方法、装置、设备及介质
US11483651B2 (en) Processing audio signals
US20200286501A1 (en) Apparatus and a method for signal enhancement
US20230267947A1 (en) Noise reduction using machine learning
CN111223492A (zh) 一种回声路径延迟估计方法及装置
CN112602150A (zh) 噪声估计方法、噪声估计装置、语音处理芯片以及电子设备
CN110148421B (zh) 一种残余回声检测方法、终端和装置
WO2022068440A1 (zh) 啸叫抑制方法、装置、计算机设备和存储介质
US20160019906A1 (en) Signal processor and method therefor
KR20160116440A (ko) 음성인식 시스템의 신호대잡음비 추정 장치 및 방법
CN116312621A (zh) 时延估计方法、回声消除方法、训练方法和相关设备
CN109994122B (zh) 语音数据的处理方法、装置、设备、介质和系统
JP6314475B2 (ja) 音声信号処理装置及びプログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant