CN110349592B - 用于输出信息的方法和装置 - Google Patents

用于输出信息的方法和装置 Download PDF

Info

Publication number
CN110349592B
CN110349592B CN201910645518.3A CN201910645518A CN110349592B CN 110349592 B CN110349592 B CN 110349592B CN 201910645518 A CN201910645518 A CN 201910645518A CN 110349592 B CN110349592 B CN 110349592B
Authority
CN
China
Prior art keywords
correlation
time
sampling
time delay
back tone
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910645518.3A
Other languages
English (en)
Other versions
CN110349592A (zh
Inventor
刘子祥
许云飞
陈果果
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Shanghai Xiaodu Technology Co Ltd
Original Assignee
Baidu Online Network Technology Beijing Co Ltd
Shanghai Xiaodu Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Baidu Online Network Technology Beijing Co Ltd, Shanghai Xiaodu Technology Co Ltd filed Critical Baidu Online Network Technology Beijing Co Ltd
Priority to CN201910645518.3A priority Critical patent/CN110349592B/zh
Publication of CN110349592A publication Critical patent/CN110349592A/zh
Application granted granted Critical
Publication of CN110349592B publication Critical patent/CN110349592B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L2021/02082Noise filtering the noise being echo, reverberation of the speech

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)

Abstract

本公开的实施例公开了用于输出信息的方法和装置。该方法的一具体实施方式包括:获取预定开始时间和结束时间范围内的参考信号和麦克信号并分别进行采样;在预设的时延区间范围内枚举候选时延计算从开始时间到当前采样时刻的参考信号的采样值和麦克信号的采样值的相关性;基于同一采样时刻相关性的最大值绘制相关性的变化曲线和最佳时延曲线;若检测到相关性的最大值达到预定第一相关性阈值且检测到在达到预定第一相关性阈值之后预定时间内相关性的最大值不再增长,则结束时延估计并将时延估计结束时相关性的最大值对应的候选时延作为目标时延进行输出;该实施方式能够在线动态地估计时延,从而提高回声消除的时效性。

Description

用于输出信息的方法和装置
技术领域
本公开的实施例涉及通信技术领域,具体涉及用于输出信息的方法和装置。
背景技术
在语音通信中,有一个很影响通话质量的因素就是回声。回声就是指说话者通过通信设备发送给其他人的语音又重新又回到自己的听筒里的现象。回声会对说话者产生严重的干扰,必须想办法消除。一般,回声分为两种,即“电路回声”和“声学回声”。“电路回声”可以通过硬件设备的合理设计而消除,在此不作讨论。最复杂和最难消除的应该是所谓的“声学回声”。“声学回声”是指远端用户的声音从听筒出来以后,经过空气或其他的传播媒介传到近端用户的话筒,再通过话筒录音后又重新传到远端用户的听筒中形成的回声。当近端用户的放音音量比较大而录音设备和放音设备距离比较近时回声尤其明显。“声学回声”受近端用户环境的影响,可能产生多路回声,包括直接回声和反射回声,各个回声的路径不同,延迟也就不同,因而难以消除。
声学回声消除器(AEC,Acoustic Echo Canceler)是对扬声器信号与由它产生的多路径回声的相关性为基础,建立远端信号的语音模型,利用它对回声进行估计,并不断地修改滤波器的系数,使得估计值更加逼近真实的回声。然后,将回声估计值从话筒的输入信号中减去,从而达到消除回声的目的。但集成AEC到前端处理后,发现存在一个矛盾:AEC中的滤波长度如果设置太长,会导致刚接通电话时,收敛速度很慢;如果设置较短,可能无法涵盖一些应用场景下的时延(例如不同车型的通话时延相差十几采样点到上千采样点(0~0.1秒)不等)。因此非常需要一个合适有效的时延估计算法。
发明内容
本公开的实施例提出了用于输出信息的方法和装置。
第一方面,本公开的实施例提供了一种用于输出信息的方法,包括:获取预定开始时间和结束时间范围内的参考信号和麦克信号;以预定的采集间隔对参考信号和麦克信号分别进行采样;按照采样时刻先后顺序依次执行如下第一时延估计步骤:在预设的时延区间范围内枚举候选时延计算从开始时间到当前采样时刻的参考信号的采样值和麦克信号的采样值的相关性,得到同一采样时刻不同候选时延对应的相关性;基于同一采样时刻相关性的最大值绘制相关性的变化曲线和最佳时延曲线;若检测到相关性的最大值达到预定第一相关性阈值且检测到在达到预定第一相关性阈值之后预定时间内相关性的最大值不再增长,则结束时延估计并将时延估计结束时相关性的最大值对应的候选时延作为目标时延进行输出;否则,在预定时间内选取下一采样时刻作为当前采样时刻继续执行上述第一时延估计步骤。
在一些实施例中,该方法还包括:通过预定的带通滤波器从参考信号和麦克信号中分别过滤出回铃音;以预定的采集间隔对参考信号中的回铃音和麦克信号中的回铃音分别进行采样;按照采样时刻先后顺序依次执行如下第二时延估计步骤:在预设的时延区间范围内枚举候选时延计算从开始时间到当前采样时刻的参考信号中的回铃音的采样值和麦克信号中的回铃音的采样值的相关性,得到同一采样时刻不同候选时延对应的回铃音相关性;基于同一采样时刻回铃音相关性的最大值绘制回铃音相关性的变化曲线和回铃音最佳时延曲线;若检测到回铃音相关性的最大值达到预定第二相关性阈值且检测到在达到预定第二相关性阈值之后预定时间内回铃音相关性的最大值不再增长,则结束时延估计并将时延估计结束时回铃音相关性的最大值对应的候选时延作为目标时延进行输出;否则,在预定时间内选取下一采样时刻作为当前采样时刻继续执行上述第二时延估计步骤。
在一些实施例中,候选时延为采样间隔的预定倍数。
在一些实施例中,该方法还包括:使用长度为时延区间范围内采样点的数目的循环队列缓存参考信号。
在一些实施例中,该方法还包括:使用长度为半个时延区间范围内采样点的数目的循环队列缓存麦克信号。
在一些实施例中,第二相关性阈值大于第一相关性阈值。
第二方面,本公开的实施例提供了一种用于输出信息的装置,包括:获取单元,被配置成获取预定开始时间和结束时间范围内的参考信号和麦克信号;第一采样单元,被配置成以预定的采集间隔对参考信号和麦克信号分别进行采样;第一估计单元,被配置成按照采样时刻先后顺序依次执行如下第一时延估计步骤:在预设的时延区间范围内枚举候选时延计算从开始时间到当前采样时刻的参考信号的采样值和麦克信号的采样值的相关性,得到同一采样时刻不同候选时延对应的相关性;基于同一采样时刻相关性的最大值绘制相关性的变化曲线和最佳时延曲线;若检测到相关性的最大值达到预定第一相关性阈值且检测到在达到预定第一相关性阈值之后预定时间内相关性的最大值不再增长,则结束时延估计并将时延估计结束时相关性的最大值对应的候选时延作为目标时延进行输出;第一循环单元,被配置成若未结束时延估计,则在预定时间内选取下一采样时刻作为当前采样时刻继续执行上述第一时延估计步骤。
在一些实施例中,该装置还包括:回铃滤波单元,被配置成通过预定的带通滤波器从参考信号和麦克信号中分别过滤出回铃音;第二采样单元,被配置成以预定的采集间隔对参考信号中的回铃音和麦克信号中的回铃音分别进行采样;第二估计单元,被配置成按照采样时刻先后顺序依次执行如下第二时延估计步骤:在预设的时延区间范围内枚举候选时延计算从开始时间到当前采样时刻的参考信号中的回铃音的采样值和麦克信号中的回铃音的采样值的相关性,得到同一采样时刻不同候选时延对应的回铃音相关性;基于同一采样时刻回铃音相关性的最大值绘制回铃音相关性的变化曲线和回铃音最佳时延曲线;若检测到回铃音相关性的最大值达到预定第二相关性阈值且检测到在达到预定第二相关性阈值之后预定时间内回铃音相关性的最大值不再增长,则结束时延估计并将时延估计结束时回铃音相关性的最大值对应的候选时延作为目标时延进行输出;第二循环单元,被配置成若未结束时延估计,则在预定时间内选取下一采样时刻作为当前采样时刻继续执行上述第二时延估计步骤。
在一些实施例中,候选时延为采样间隔的预定倍数。
在一些实施例中,该装置还包括:参考信号缓存单元,被配置成使用长度为时延区间范围内采样点的数目的循环队列缓存参考信号。
在一些实施例中,该装置还包括:麦克信号缓存单元,被配置成使用长度为半个时延区间范围内采样点的数目的循环队列缓存麦克信号。
在一些实施例中,第二相关性阈值大于第一相关性阈值。
第三方面,本公开的实施例提供了一种用于输出信息的电子设备,包括:一个或多个处理器;存储装置,其上存储有一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如第一方面中任一的方法。
第四方面,本公开的实施例提供了一种计算机可读介质,其上存储有计算机程序,其中,程序被处理器执行时实现如第一方面中任一的方法。
本公开的实施例提供的用于输出信息的方法和装置,通过枚举时延,在线进行时延预估,不需要遍历所有采样点进行不同时延下参考信号和麦克信号相关性计算,只需要在部分采样点下计算出符合预期的相关性即可停止时延估计。因此提高了时延估计速度,节省时间开销,从而可应用于在线时延估计。根据每次通话动态地估计时延,从而提高回声消除的效果。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本公开的其它特征、目的和优点将会变得更明显:
图1是本公开的一个实施例可以应用于其中的示例性系统架构图;
图2是根据本公开的用于输出信息的方法的一个实施例的流程图;
图3a-3c是根据本公开的用于输出信息的方法的缓存信号的示意图;
图4是根据本公开的用于输出信息的方法的相关性的变化曲线和最佳时延曲线;
图5是根据本公开的用于输出信息的方法的又一个实施例的流程图;
图6是根据本公开的用于输出信息的方法的又一个实施例的相关性的变化曲线和最佳时延曲线;
图7是根据本公开的用于输出信息的装置的一个实施例的结构示意图;
图8是适于用来实现本公开的实施例的电子设备的计算机系统的结构示意图。
具体实施方式
下面结合附图和实施例对本公开作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
需要说明的是,在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本公开。
图1示出了可以应用本公开的用于输出信息的方法或用于输出信息的装置的实施例的示例性系统架构100。
如图1所示,系统架构100可以包括扬声器101、102、103、104,终端设备106、终端设备106的麦克风105。
用户可以使用终端设备106接打电话。开启免提时,扬声器101、102、103、104会播放对方的声音,麦克风105接收用户的语音的同时会将对方的语音的回声一起接收,从而导致回声干扰。
终端设备106可根据参考信号和麦克信号估算出时延,然后设置AEC中的滤波长度,从而实现回声消除。
需要说明的是,本公开的实施例所提供的用于输出信息的方法一般由终端设备106执行,相应地,用于输出信息的装置一般设置于终端设备106。
应该理解,图1中的扬声器、麦克风、终端设备的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
继续参考图2,示出了根据本公开的用于输出信息的方法的一个实施例的流程200。该用于输出信息的方法,包括以下步骤:
步骤201,获取预定开始时间和结束时间范围内的参考信号和麦克信号。
在本实施例中,用于输出信息的方法的执行主体(例如图1所示的终端设备)可通过信号接收装置接收来自声源的音频信号,即参考信号,下文中用ref信号表示。还可通过麦克风接收麦克信号,下文中用mic信号表示。麦克信号,表示信号从声源传播到麦克后,麦克采集到的信号。从声源到麦克需要经历一段传播时间,mic信号相较ref信号滞后的时间,即为时延,下文中用delay表示,可用采样点来表示时延。
步骤202,以预定的采集间隔对参考信号和麦克信号分别进行采样。
在本实施例中,由于要计算两种信号的相关性,需要进行采样。可采用16Khz的采样频率,即采集间隔为0.0000625秒。
对于已知的两个音频信号,可以通过NCC(Normalized Cross Corelation,归一化互相关)来计算两个信号的相关性。
Figure BDA0002133460930000061
其中,I1、I2表示两个信号归一化(减各自均值)的结果。将上式套用于时延估计即为下式:
Figure BDA0002133460930000062
γu(f,t):待估计的时延
f(x):mic信号在x点的数值
t(x):ref信号在x点的数值
Figure BDA0002133460930000071
mic信号均值
Figure BDA0002133460930000072
ref信号均值
u:时延
采用传统方式,通过枚举时延,并选择mic信号与ref信号相关性最大时的时延即可。实验显示,估计结果与实际时延偏差在±200采样点(0.0125秒)。此时AEC的滤波长度设置在400采样点即可有效消除回声。但传统的方式仅能用于离线时延估计,因为需要遍历所有的采样点和所有的时延。而本公开提供的估计时延的方法仅通过部分采样点的相关性计算即可结束时延估计,因此可用于在线时延估计。
在本实施例的一些可选的实现方式中,使用长度为半个时延区间范围内采样点的数目的循环队列缓存麦克信号。如图3a所示,对于一般情况,f(i)表示mic信号在i点的采样值。在枚举时延[-delay,delay]时,需要遍历t[i–delay,i+delay]。因此使用长度为(2*delay+1)的循环队列缓存ref信号。随着指针从i->i+1的移动,循环队列首、尾的指针一同前进,把旧缓存的位置腾给新缓存。实现存储空间最大效率使用。
在本实施例的一些可选的实现方式中,使用长度为时延区间范围内采样点的数目的循环队列缓存参考信号。比较特别的是,在线处理为即时过程(如图3b)。mic和ref信号在postion处同步到达,因此mic信号在f(i)之后的部分需要一个delay大小的循环队列存储,缓存方式同ref信号。
上述结构是考虑到算法的鲁棒性,对于通常情况,如果能确保ref信号在mic信号之前,可以变为图3c结构,节省存储空间,同时也可减少运算消耗。
步骤203,在预设的时延区间范围内枚举候选时延计算从开始时间到当前采样时刻的参考信号的采样值和麦克信号的采样值的相关性,得到同一采样时刻不同候选时延对应的相关性。
在本实施例中,针对每个采样时刻,用不同的候选时延试探计算从开始时间到当前采样时刻的参考信号的采样值和麦克信号的采样值的相关性。计算过程如上式所示。试探过程中依次枚举时延。在时延区间范围(-delay,delay)之间的采样时间间隔即为用于枚举的候选时延。枚举时延时可按采样时间间隔枚举,例如,从1(对应于0.0000625秒)开始枚举,每次增加1个采样间隔。
在本实施例的一些可选的实现方式中,候选时延为采样间隔的预定倍数。由于互相关函数中乘、除、开根运算较为耗时,所以当枚举的delay范围较大时可通过设置枚举的步长来节省时间开销。对于4秒的音频,枚举2500次的时延,运算耗时3秒。设置10为步长,可减少到0.3秒。(10采样点约为0.0006秒,这个偏差在可接受范围)。
步骤204,基于同一采样时刻相关性的最大值绘制相关性的变化曲线和最佳时延曲线。
在本实施例中,同一采样时刻,不同候选时延得到的相关性不同,将最大值(最佳时延计算出的相关性)用来绘制相关性的变化曲线,如图4中所示,图4的下半部分为相关性的变化曲线,其中,横坐标为采样点、纵坐标为该采样时刻根据多个候选时延计算出的相关性的最大值。图4的上半部分为最佳时延曲线,用于表示相关性最大时的候选时延,即最佳时延,其中,横坐标为采样点、纵坐标为该采样时刻的最佳时延。
步骤205,若检测到相关性的最大值达到预定第一相关性阈值且检测到在达到预定第一相关性阈值之后预定时间内相关性的最大值不再增长,则结束时延估计并将时延估计结束时相关性的最大值对应的候选时延作为目标时延进行输出。
在本实施例中,通过大量实验发现,使用如上所述的在线时延估计算法,在ref信号出现3~4秒后,估计结果基本趋向于稳定,两个信号的相关性也会出现回落并趋于稳定。基于这个结论,我们通过实验结果设定了第一相关性阈值(例如,0.6)。当相关性达到0.6后,先打一个标记。这之后每一时刻估计的相关性与上一时刻进行对比,当相关性不再增长后,持续观察1s(16000个点)的音频信号,如果仍为持续下降或趋于平稳,则结束时延估计。将时延估计结束时相关性的最大值对应的候选时延作为目标时延进行输出。可输出到AEC中用于设备滤波长度,从而消除回声。
实验显示,在线时延估计的结果与整个音频进行时延估计的结果相近,与实际时延偏差也在±200采样点(0.0125秒)范围内。
步骤206,若未结束时延估计,则在预定时间内选取下一采样时刻作为当前采样时刻继续执行上述第一时延估计步骤。
在本实施例中,若未检测到相关性的最大值达到预定第一相关性阈值,或者在达到预定第一相关性阈值之后预定时间内相关性的最大值仍增长,即未结束时延估计,则在预定时间内选取下一采样时刻作为当前采样时刻继续执行步骤203-205。
本公开的上述实施例提供的方法,通过设置阈值等手段,提前结束时延估计,从而提高了时延估计速度,因此可用于在线时延估计。
进一步参考图5,其示出了用于输出信息的方法的又一个实施例的流程500。该用于输出信息的方法的流程500,包括以下步骤:
步骤501,获取预定开始时间和结束时间范围内的参考信号和麦克信号。
步骤501与步骤201基本相同,因此不再赘述。
步骤502,通过预定的带通滤波器从参考信号和麦克信号中分别过滤出回铃音,并以预定的采集间隔对参考信号的回铃音和麦克信号的回铃音分别进行采样。
在本实施例中,由于通话场景比较特殊,在拨打电话一开始,会有运营商「嘀」的回铃音(Ring-back Signaling),调研显示「滴」音均在400~500Hz。因此在上面全频段的时延估计的基础上,增加[400,500]Hz带通滤波后的时延估计进行辅助的双重时延估计。取最先完成估计的结果作为最终时延(以防非「滴」铃声导致该方案失效)。
步骤503,在预设的时延区间范围内枚举候选时延计算从开始时间到当前采样时刻的参考信号中的回铃音的采样值和麦克信号中的回铃音的采样值的相关性,得到同一采样时刻不同候选时延对应的回铃音相关性。
在本实施例中,相关性计算的具体过程与步骤203基本相同,因此不再赘述。由于是计算经过带通滤波后回铃音的相关性,因此与直接用原始ref信号和mic信号计算相比,运算量大大降低,从而提高了时延估计速度。
步骤504,基于同一采样时刻回铃音相关性的最大值绘制回铃音相关性的变化曲线和回铃音最佳时延曲线。
在本实施例中,绘制曲线的步骤与步骤204基本相同,因此不再赘述。如图6所示,分析实验结果发现,「嘀」声估计时延,互相关可达到十分接近1.0,此时时延也更准确,更稳定。所以对于「嘀」声估计的阈值,可设定到0.8~0.9。即第二相关性阈值大于所述第一相关性阈值。
步骤505,若检测到回铃音相关性的最大值达到预定第二相关性阈值且检测到在达到预定第二相关性阈值之后预定时间内回铃音相关性的最大值不再增长,则结束时延估计并将时延估计结束时回铃音相关性的最大值对应的候选时延作为目标时延进行输出。
在本实施例中,结束时延估计的过程与步骤205基本相同,因此不再赘述。实验显示对于有「嘀」音的音频,在滤波后时延估计偏差可降到±100采样点(0.00625秒)。
步骤506,若未结束时延估计,则在预定时间内选取下一采样时刻作为当前采样时刻继续执行上述第二时延估计步骤。
在本实施例中,若未检测到相关性的最大值达到预定第一相关性阈值,或者在达到预定第一相关性阈值之后预定时间内相关性的最大值仍增长,即未结束时延估计,则在预定时间内选取下一采样时刻作为当前采样时刻继续执行步骤503-505。
从图5中可以看出,与图2对应的实施例相比,本实施例中的用于输出信息的方法的流程500体现了利用回铃音进行时延估计的步骤。由此,本实施例描述的方案可以进一步提高预测准确性和速度。实验显示对于有「嘀」音的音频,在滤波后时延估计偏差可降到±100采样点(0.00625秒)。
进一步参考图7,作为对上述各图所示方法的实现,本公开提供了一种用于输出信息的装置的一个实施例,该装置实施例与图2所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。
如图7所示,本实施例的用于输出信息的装置700包括:获取单元701、第一采样单元702、第一估计单元703和第一循环单元704。获取单元701,被配置成获取预定开始时间和结束时间范围内的参考信号和麦克信号;第一采样单元702,被配置成以预定的采集间隔对参考信号和麦克信号分别进行采样;第一估计单元703,被配置成按照采样时刻先后顺序依次执行如下第一时延估计步骤:在预设的时延区间范围内枚举候选时延计算从开始时间到当前采样时刻的参考信号的采样值和麦克信号的采样值的相关性,得到同一采样时刻不同候选时延对应的相关性;基于同一采样时刻相关性的最大值绘制相关性的变化曲线和最佳时延曲线;若检测到相关性的最大值达到预定第一相关性阈值且检测到在达到预定第一相关性阈值之后预定时间内相关性的最大值不再增长,则结束时延估计并将时延估计结束时相关性的最大值对应的候选时延作为目标时延进行输出;第一循环单元704,被配置成若未结束时延估计,则在预定时间内选取下一采样时刻作为当前采样时刻继续执行上述第一时延估计步骤。
在本实施例中,用于输出信息的装置700获取单元701、第一采样单元702、第一估计单元703和第一循环单元704的具体处理可以参考图2对应实施例中的步骤201-206。
在本实施例的一些可选的实现方式中,装置700还包括:回铃滤波单元705,被配置成通过预定的带通滤波器从参考信号和麦克信号中分别过滤出回铃音;第二采样单元706,被配置成以预定的采集间隔对参考信号的回铃音和麦克信号的回铃音分别进行采样;第二估计单元707,被配置成按照采样时刻先后顺序依次执行如下第二时延估计步骤:在预设的时延区间范围内枚举候选时延计算从开始时间到当前采样时刻的参考信号中的回铃音的采样值和麦克信号中的回铃音的采样值的相关性,得到同一采样时刻不同候选时延对应的回铃音相关性;基于同一采样时刻回铃音相关性的最大值绘制回铃音相关性的变化曲线和回铃音最佳时延曲线;若检测到回铃音相关性的最大值达到预定第二相关性阈值且检测到在达到预定第二相关性阈值之后预定时间内回铃音相关性的最大值不再增长,则结束时延估计并将时延估计结束时回铃音相关性的最大值对应的候选时延作为目标时延进行输出;第二循环单元708,被配置成若未结束时延估计,则在预定时间内选取下一采样时刻作为当前采样时刻继续执行上述第二时延估计步骤。
在本实施例的一些可选的实现方式中,候选时延为采样间隔的预定倍数。
在本实施例的一些可选的实现方式中,装置700还包括:参考信号缓存单元(附图中未示出),被配置成使用长度为时延区间范围内采样点的数目的循环队列缓存参考信号。
在本实施例的一些可选的实现方式中,装置700还包括:麦克信号缓存单元(附图中未示出),被配置成使用长度为半个时延区间范围内采样点的数目的循环队列缓存麦克信号。
在本实施例的一些可选的实现方式中,第二相关性阈值大于第一相关性阈值。
下面参考图8,其示出了适于用来实现本公开的实施例的电子设备(例如图1中的终端设备)800的结构示意图。本公开的实施例中的终端设备可以包括但不限于诸如终端设备、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。图8示出的终端设备仅仅是一个示例,不应对本公开的实施例的功能和使用范围带来任何限制。
如图8所示,电子设备800可以包括处理装置(例如中央处理器、图形处理器等)801,其可以根据存储在只读存储器(ROM)802中的程序或者从存储装置808加载到随机访问存储器(RAM)803中的程序而执行各种适当的动作和处理。在RAM 803中,还存储有电子设备800操作所需的各种程序和数据。处理装置801、ROM 802以及RAM803通过总线804彼此相连。输入/输出(I/O)接口805也连接至总线804。
通常,以下装置可以连接至I/O接口805:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置806;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置807;包括例如磁带、硬盘等的存储装置808;以及通信装置809。通信装置809可以允许电子设备800与其他设备进行无线或有线通信以交换数据。虽然图8示出了具有各种装置的电子设备800,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。图8中示出的每个方框可以代表一个装置,也可以根据需要代表多个装置。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置809从网络上被下载和安装,或者从存储装置808被安装,或者从ROM 802被安装。在该计算机程序被处理装置801执行时,执行本公开的实施例的方法中限定的上述功能。需要说明的是,本公开的实施例所述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开的实施例中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开的实施例中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:获取预定开始时间和结束时间范围内的参考信号和麦克信号;以预定的采集间隔对参考信号和麦克信号分别进行采样;按照采样时刻先后顺序依次执行如下第一时延估计步骤:在预设的时延区间范围内枚举候选时延计算从开始时间到当前采样时刻的参考信号的采样值和麦克信号的采样值的相关性,得到同一采样时刻不同候选时延对应的相关性;基于同一采样时刻相关性的最大值绘制相关性的变化曲线和最佳时延曲线;若检测到相关性的最大值达到预定第一相关性阈值且检测到在达到预定第一相关性阈值之后预定时间内相关性的最大值不再增长,则结束时延估计并将时延估计结束时相关性的最大值对应的候选时延作为目标时延进行输出;否则,在预定时间内选取下一采样时刻作为当前采样时刻继续执行上述第一时延估计步骤。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的实施例的操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开的实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中,例如,可以描述为:一种处理器包括获取单元、第一采样单元、第一估计单元和第一循环单元。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定,例如,获取单元还可以被描述为“获取预定开始时间和结束时间范围内的参考信号和麦克信号的单元”。
以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离所述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims (14)

1.一种用于输出信息的方法,包括:
获取预定开始时间和结束时间范围内的参考信号和麦克信号;
以预定的采集间隔对所述参考信号和所述麦克信号分别进行采样;
按照采样时刻先后顺序依次执行如下第一时延估计步骤:在预设的时延区间范围内枚举候选时延计算从所述开始时间到当前采样时刻的所述参考信号的归一化的采样值和所述麦克信号的归一化的采样值的相关性,得到同一采样时刻不同候选时延对应的相关性;基于同一采样时刻相关性的最大值绘制相关性的变化曲线和最佳时延曲线;若检测到相关性的最大值达到预定第一相关性阈值且检测到在达到预定第一相关性阈值之后预定时间内相关性的最大值不再增长,则结束时延估计并将时延估计结束时相关性的最大值对应的候选时延作为目标时延进行输出;
否则,在所述预定时间内选取下一采样时刻作为当前采样时刻继续执行上述第一时延估计步骤。
2.根据权利要求1所述的方法,所述方法还包括:
通过预定的带通滤波器从所述参考信号和所述麦克信号中分别过滤出回铃音;
以预定的采集间隔对所述参考信号的回铃音和所述麦克信号的回铃音分别进行采样;
按照采样时刻先后顺序依次执行如下第二时延估计步骤:在预设的时延区间范围内枚举候选时延计算从所述开始时间到当前采样时刻的所述参考信号中的回铃音的采样值和所述麦克信号中的回铃音的采样值的相关性,得到同一采样时刻不同候选时延对应的回铃音相关性;基于同一采样时刻回铃音相关性的最大值绘制回铃音相关性的变化曲线和回铃音最佳时延曲线;若检测到回铃音相关性的最大值达到预定第二相关性阈值且检测到在达到预定第二相关性阈值之后预定时间内回铃音相关性的最大值不再增长,则结束时延估计并将时延估计结束时回铃音相关性的最大值对应的候选时延作为目标时延进行输出;
否则,在所述预定时间内选取下一采样时刻作为当前采样时刻继续执行上述第二时延估计步骤。
3.根据权利要求1所述的方法,所述候选时延为采样间隔的预定倍数。
4.根据权利要求1所述的方法,所述方法还包括:
使用长度为所述时延区间范围内采样点的数目的循环队列缓存所述参考信号。
5.根据权利要求1所述的方法,所述方法还包括:
使用长度为半个时延区间范围内采样点的数目的循环队列缓存所述麦克信号。
6.根据权利要求2所述的方法,所述第二相关性阈值大于所述第一相关性阈值。
7.一种用于输出信息的装置,包括:
获取单元,被配置成获取预定开始时间和结束时间范围内的参考信号和麦克信号;
第一采样单元,被配置成以预定的采集间隔对所述参考信号和所述麦克信号分别进行采样;
第一估计单元,被配置成按照采样时刻先后顺序依次执行如下第一时延估计步骤:在预设的时延区间范围内枚举候选时延计算从所述开始时间到当前采样时刻的所述参考信号的归一化的采样值和所述麦克信号的归一化的采样值的相关性,得到同一采样时刻不同候选时延对应的相关性;基于同一采样时刻相关性的最大值绘制相关性的变化曲线和最佳时延曲线;若检测到相关性的最大值达到预定第一相关性阈值且检测到在达到预定第一相关性阈值之后预定时间内相关性的最大值不再增长,则结束时延估计并将时延估计结束时相关性的最大值对应的候选时延作为目标时延进行输出;
第一循环单元,被配置成若未结束时延估计,则在所述预定时间内选取下一采样时刻作为当前采样时刻继续执行上述第一时延估计步骤。
8.根据权利要求7所述的装置,所述装置还包括:
回铃滤波单元,被配置成通过预定的带通滤波器从所述参考信号和所述麦克信号中分别过滤出回铃音;
第二采样单元,被配置成以预定的采集间隔对所述参考信号的回铃音和所述麦克信号的回铃音分别进行采样;
第二估计单元,被配置成按照采样时刻先后顺序依次执行如下第二时延估计步骤:在预设的时延区间范围内枚举候选时延计算从所述开始时间到当前采样时刻的所述参考信号中的回铃音的采样值和所述麦克信号中的回铃音的采样值的相关性,得到同一采样时刻不同候选时延对应的回铃音相关性;基于同一采样时刻回铃音相关性的最大值绘制回铃音相关性的变化曲线和回铃音最佳时延曲线;若检测到回铃音相关性的最大值达到预定第二相关性阈值且检测到在达到预定第二相关性阈值之后预定时间内回铃音相关性的最大值不再增长,则结束时延估计并将时延估计结束时回铃音相关性的最大值对应的候选时延作为目标时延进行输出;
第二循环单元,被配置成若未结束时延估计,则在所述预定时间内选取下一采样时刻作为当前采样时刻继续执行上述第二时延估计步骤。
9.根据权利要求7所述的装置,所述候选时延为采样间隔的预定倍数。
10.根据权利要求7所述的装置,所述装置还包括:
参考信号缓存单元,被配置成使用长度为所述时延区间范围内采样点的数目的循环队列缓存所述参考信号。
11.根据权利要求7所述的装置,所述装置还包括:
麦克信号缓存单元,被配置成使用长度为半个时延区间范围内采样点的数目的循环队列缓存所述麦克信号。
12.根据权利要求8所述的装置,所述第二相关性阈值大于所述第一相关性阈值。
13.一种用于输出信息的电子设备,包括:
一个或多个处理器;
存储装置,其上存储有一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-6中任一所述的方法。
14.一种计算机可读介质,其上存储有计算机程序,其中,所述程序被处理器执行时实现如权利要求1-6中任一所述的方法。
CN201910645518.3A 2019-07-17 2019-07-17 用于输出信息的方法和装置 Active CN110349592B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910645518.3A CN110349592B (zh) 2019-07-17 2019-07-17 用于输出信息的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910645518.3A CN110349592B (zh) 2019-07-17 2019-07-17 用于输出信息的方法和装置

Publications (2)

Publication Number Publication Date
CN110349592A CN110349592A (zh) 2019-10-18
CN110349592B true CN110349592B (zh) 2021-09-28

Family

ID=68175523

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910645518.3A Active CN110349592B (zh) 2019-07-17 2019-07-17 用于输出信息的方法和装置

Country Status (1)

Country Link
CN (1) CN110349592B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112397082B (zh) * 2020-11-17 2024-05-14 北京达佳互联信息技术有限公司 估计回声延迟的方法、装置、电子设备和存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000194400A (ja) * 1998-12-21 2000-07-14 Max Planck Ges Foerderung Wissenschaft Ev 雑音の多い音響信号を処理する方法および装置
WO2001022404A1 (en) * 1999-09-23 2001-03-29 Koninklijke Philips Electronics N.V. Speech recognition apparatus and consumer electronics system
CN105872156A (zh) * 2016-05-25 2016-08-17 腾讯科技(深圳)有限公司 一种回声时延跟踪方法及装置
CN106231145A (zh) * 2016-08-31 2016-12-14 广州市百果园网络科技有限公司 一种回声延时处理方法及回声延时处理装置
CN107610713A (zh) * 2017-10-23 2018-01-19 科大讯飞股份有限公司 基于时延估计的回声消除方法及装置
CN108962263A (zh) * 2018-06-04 2018-12-07 百度在线网络技术(北京)有限公司 一种智能设备控制方法及系统
TW201905900A (zh) * 2017-06-29 2019-02-01 大陸商華為技術有限公司 時延估計方法及裝置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109102821B (zh) * 2018-09-10 2021-05-25 思必驰科技股份有限公司 时延估计方法、系统、存储介质及电子设备

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000194400A (ja) * 1998-12-21 2000-07-14 Max Planck Ges Foerderung Wissenschaft Ev 雑音の多い音響信号を処理する方法および装置
WO2001022404A1 (en) * 1999-09-23 2001-03-29 Koninklijke Philips Electronics N.V. Speech recognition apparatus and consumer electronics system
CN105872156A (zh) * 2016-05-25 2016-08-17 腾讯科技(深圳)有限公司 一种回声时延跟踪方法及装置
CN106231145A (zh) * 2016-08-31 2016-12-14 广州市百果园网络科技有限公司 一种回声延时处理方法及回声延时处理装置
TW201905900A (zh) * 2017-06-29 2019-02-01 大陸商華為技術有限公司 時延估計方法及裝置
CN107610713A (zh) * 2017-10-23 2018-01-19 科大讯飞股份有限公司 基于时延估计的回声消除方法及装置
CN108962263A (zh) * 2018-06-04 2018-12-07 百度在线网络技术(北京)有限公司 一种智能设备控制方法及系统

Also Published As

Publication number Publication date
CN110349592A (zh) 2019-10-18

Similar Documents

Publication Publication Date Title
CN111341336B (zh) 一种回声消除方法、装置、终端设备及介质
RU2495506C2 (ru) Устройство и способ расчета параметров управления фильтра эхоподавления и устройство и способ расчета величины задержки
KR100316116B1 (ko) 잡음감소시스템및장치와,이동무선국
KR102170172B1 (ko) 에코 억제
US9386373B2 (en) System and method for estimating a reverberation time
CN111951819A (zh) 回声消除方法、装置及存储介质
US9866792B2 (en) Display apparatus and echo cancellation method thereof
WO2020097828A1 (zh) 回声消除方法、延时估计方法、装置、存储介质及设备
WO2015184893A1 (zh) 移动终端通话语音降噪方法及装置
US8761386B2 (en) Sound processing apparatus, method, and program
JP6303340B2 (ja) 音声処理装置、音声処理方法及び音声処理用コンピュータプログラム
JP6422885B2 (ja) エコー抑圧
KR102190833B1 (ko) 에코 억제
EP2710591B1 (en) Reducing noise pumping due to noise suppression and echo control interaction
JP6422884B2 (ja) エコー抑圧
CN112750452A (zh) 语音处理方法、装置、系统、智能终端以及电子设备
CN109215672B (zh) 一种声音信息的处理方法、装置及设备
CN113744748A (zh) 一种网络模型的训练方法、回声消除方法及设备
EP2716023B1 (en) Control of adaptation step size and suppression gain in acoustic echo control
CN110349592B (zh) 用于输出信息的方法和装置
CN113113038B (zh) 回声消除方法、装置及电子设备
CN113035223B (zh) 音频处理方法、装置、设备及存储介质
US8406430B2 (en) Simulated background noise enabled echo canceller
CN113382119B (zh) 消除回声的方法、装置、可读介质和电子设备
KR20090122802A (ko) 스펙트럼 차감을 이용한 음향학적 반향 제거 방법 및 장치

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20210510

Address after: 100085 Baidu Building, 10 Shangdi Tenth Street, Haidian District, Beijing

Applicant after: BEIJING BAIDU NETCOM SCIENCE AND TECHNOLOGY Co.,Ltd.

Applicant after: Shanghai Xiaodu Technology Co.,Ltd.

Address before: 100085 Baidu Building, 10 Shangdi Tenth Street, Haidian District, Beijing

Applicant before: BEIJING BAIDU NETCOM SCIENCE AND TECHNOLOGY Co.,Ltd.

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant