CN108831491B - 回声延迟估计方法及装置、存储介质、电子设备 - Google Patents
回声延迟估计方法及装置、存储介质、电子设备 Download PDFInfo
- Publication number
- CN108831491B CN108831491B CN201710307758.3A CN201710307758A CN108831491B CN 108831491 B CN108831491 B CN 108831491B CN 201710307758 A CN201710307758 A CN 201710307758A CN 108831491 B CN108831491 B CN 108831491B
- Authority
- CN
- China
- Prior art keywords
- frequency band
- echo
- interest
- signal
- pass filter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 39
- 238000005070 sampling Methods 0.000 claims abstract description 53
- 230000009467 reduction Effects 0.000 claims description 31
- 230000006870 function Effects 0.000 claims description 25
- 238000012546 transfer Methods 0.000 claims description 25
- 230000004044 response Effects 0.000 claims description 10
- 238000000605 extraction Methods 0.000 claims description 7
- 238000001698 laser desorption ionisation Methods 0.000 claims description 6
- 239000000126 substance Substances 0.000 claims description 6
- 238000004891 communication Methods 0.000 description 21
- 238000010586 diagram Methods 0.000 description 18
- 230000003044 adaptive effect Effects 0.000 description 13
- 238000012545 processing Methods 0.000 description 13
- 238000006243 chemical reaction Methods 0.000 description 12
- 230000003111 delayed effect Effects 0.000 description 5
- 238000001914 filtration Methods 0.000 description 4
- 230000001934 delay Effects 0.000 description 3
- 238000002592 echocardiography Methods 0.000 description 3
- 238000009432 framing Methods 0.000 description 2
- 238000002370 liquid polymer infiltration Methods 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000005562 fading Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0264—Noise filtering characterised by the type of parameter measurement, e.g. correlation techniques, zero crossing techniques or predictive techniques
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M9/00—Arrangements for interconnection not involving centralised switching
- H04M9/08—Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic
- H04M9/082—Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic using echo cancellers
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L2021/02082—Noise filtering the noise being echo, reverberation of the speech
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
Abstract
一种回声延迟估计方法及装置,所述方法包括:分别在回声信号和参考信号中,截取预设频段内的回声信号作为兴趣频段回声信号,并截取所述预设频段内的参考信号作为兴趣频段参考信号;所述预设频段为:所述回声信号的增益与所述参考信号的增益之差大于预设值的连续频段;分别对所述兴趣频段回声信号和所述兴趣频段参考信号进行降速率采样,得到降速率兴趣频段回声信号和降速率兴趣频段参考信号;采用所述降速率兴趣频段参考信号,对所述降速率兴趣频段回声信号进行延迟估计,得到回声延迟。上述方案能够提高回声延迟估计的准确性,并降低复杂度。
Description
技术领域
本发明涉及语音处理领域,尤其涉及一种回声延迟估计方法及装置、存储介质、电子设备。
背景技术
在音频通讯系统中,因为信号反馈途径的存在,导致无法避免回声干扰。音频通讯系统中的回声包括电学回声和声学回声。电学回声是由阻抗失配产生的信号能量反射引起,声学回声是指在受话端由扬声器播出的声音被传声器拾取并传回给讲话端。声学回声具有多路径和时变的特点,经过信道延迟后传回被讲话者听到,会降低讲话端的音频清晰度,严重影响音频通讯的质量。
为去除回声对音频通讯的影响,20世纪60年代,贝尔实验室的Sondhi提出采用自适应滤波方法实现回声抵消。然而,声回声抵消(Acoustic Echo Cancellation,AEC)对自适应滤波器的性能要求较为苛刻,自适应滤波器的设计面临着一系列的问题,这其中,长延迟对回声抵消的开销和性能有着最直接的影响。
回声的延迟是指输入信号经过一系列处理之后被延迟的时间,诸如经过数模转换、电学转换、声学回声、电学回声、声电转换、模数转换以及数据处理通路等处理后被延迟的时间,其中,数据处理通路会对数字音频信号进行组帧、解帧、增强处理等操作,会对回声信号产生几十毫秒乃至几百毫秒的延迟。若回声抵消系统所使用的自适应滤波器能够适应这么长时间的回声延迟,那么需要处理能力达数百毫秒长的自适应滤波器,所需的计算量以及存储量几何增加,而且会使得自适应滤波器收敛较慢且不稳定,回声抵消性能较差。
现有的回声抵消系统中,若数据链路的回声延迟严格稳定,则可以通过对参考信号延迟一个常数时间作为预处理,这样就可以使用较短的自适应滤波器。但若回声延迟不稳定,则需要能够实时估计回声延迟。现有的延迟估计方法的复杂度较高,且准确性较差。
发明内容
本发明实施例解决的技术问题是如何提高回声延迟估计准确性的同时,降低复杂度。
为解决上述技术问题,本发明实施例提供一种回声延迟估计方法,包括:分别在回声信号和参考信号中,截取预设频段内的回声信号作为兴趣频段回声信号,并截取所述预设频段内的参考信号作为兴趣频段参考信号;所述预设频段为:所述回声信号的增益与所述参考信号的增益之差大于预设值的连续频段;分别对所述兴趣频段回声信号和所述兴趣频段参考信号进行降速率采样,得到降速率兴趣频段回声信号和降速率兴趣频段参考信号;采用所述降速率兴趣频段参考信号,对所述降速率兴趣频段回声信号进行延迟估计,得到回声延迟。
可选的,所述截取预设频段内的回声信号作为兴趣频段回声信号,并截取所述预设频段内的参考信号作为兴趣频段参考信号,包括:采用预设的带通滤波器,在所述回声信号中截取所述预设频段内的回声信号作为所述兴趣频段回声信号,在所述参考信号中截取所述预设频段内的参考信号作为所述兴趣频段参考信号;其中,所述预设频段的中心频率为fc,带宽为fω。
可选的,以截止频率为fω/2的低通滤波器为原型,经过向正半周调制的单边带调制得到所述带通滤波器。
可选的,所述带通滤波器的传递函数为:
可选的,以截止频率为fω/2的低通滤波器为原型,经过向负半周调制的单边带调制得到所述带通滤波器。
可选的,所述带通滤波器的传递函数为:
可选的,以截止频率为fω/2的低通滤波器为原型,经过双边带调制得到所述带通滤波器。
可选的,所述带通滤波器的传递函数为:
可选的,采用如下公式在所述回声信号中截取所述预设频段内的回声信号作为兴趣频段回声信号:其中,dBP(t)为所述兴趣频段回声信号,hBP为所述带通滤波器的传递函数,d(t)为所述回声信号,t为离散时间索引;采用如下公式在所述参考信号中截取所述预设频段内的参考信号作为兴趣频段参考信号:其中,xBP(t)为所述兴趣频段参考信号,x(t)为所述参考信号。
可选的,所述分别对所述兴趣频段回声信号和所述兴趣频段参考信号进行降速率采样,包括:采用如下公式对所述兴趣频段回声信号进行降速率采样:dBPD(td)=dBP(tdM);其中,dBPD(td)为所述降速率兴趣频段回声信号,td为降速率之后的离散时间索引,M为抽取因子,且1<M≤fs/fω/2,fs为所述回声信号的采样频率;采用如下公式对所述兴趣频段参考信号进行降速率采样:xBPD(td)=xBP(tdM);其中,xBPD(td)为所述降速率兴趣频段参考信号。
可选的,所述采用所述降速率兴趣频段参考信号对所述降速率兴趣频段回声信号进行延迟估计,得到回声延迟,包括:采用如下公式得到所述回声延迟的值:TLD=Mkmax;其中,TLD为所述回声延迟的值,kmax满足:h(kmax)为子带冲激响应h(k)的最大绝对值,且h(k)在td时刻的值为:其中,为h(k)在td时刻的值,K为估计到的最大回声延迟数为KM个采样。
本发明实施例还提供了一种回声延迟估计装置,包括:截取单元,用于分别在回声信号和参考信号中,截取预设频段内的回声信号作为兴趣频段回声信号,并截取预设频段内的参考信号作为兴趣频段参考信号;降速率采样单元,用于分别对所述兴趣频段回声信号和所述兴趣频段参考信号进行降速率采样,得到降速率兴趣频段回声信号和降速率兴趣频段参考信号;延迟估计单元,用于采用所述降速率兴趣频段回声信号,对所述降速率兴趣频段回声信号进行延迟估计,得到回声延迟。
可选的,所述截取单元,用于采用预设的带通滤波器,在所述回声信号中截取所述预设频段内的回声信号作为所述兴趣频段回声信号,在所述参考信号中截取所述预设频段内的参考信号作为所述兴趣频段参考信号;其中,所述预设频段的中心频率为fc,带宽为fω。
可选的,所述截取单元,用于采用如下公式在所述回声信号中截取所述预设频段内的回声信号作为兴趣频段回声信号:其中,dBP(t)为所述兴趣频段回声信号,hBP为所述带通滤波器的传递函数,d(t)为所述回声信号,t为离散时间索引;采用如下公式在所述参考信号中截取所述预设频段内的参考信号作为兴趣频段参考信号:其中,xBP(t)为所述兴趣频段参考信号,x(t)为所述参考信号。
可选的,所述降速率采样单元,用于采用如下公式对所述兴趣频段回声信号进行降速率采样:dBPD(td)=dBP(tdM);其中,dBPD(td)为所述降速率兴趣频段回声信号,td为降速率之后的离散时间索引,M为抽取因子,且1<M≤fs/fω/2,fs为所述回声信号的采样频率;采用如下公式对所述兴趣频段参考信号进行降速率采样:xBPD(td)=xBP(tdM);其中,xBPD(td)为所述降速率兴趣频段参考信号。
可选的,所述延迟估计单元,用于采用如下公式得到所述回声延迟的值:TLD=Mkmax;其中,TLD为所述回声延迟的值,kmax满足:h(kmax)为子带冲激响应h(k)的最大绝对值,且h(k)在td时刻的值为:其中,为h(k)在td时刻的值,K为估计到的最大回声延迟数为KM个采样。
本发明实施例提供了一种计算机可读存储介质,其上存储有计算机指令,所述计算机指令运行时执行上述任一种所述的回声延迟估计方法的步骤。
本发明实施例提供了一种电子设备,包括存储器和处理器,所述存储器上存储有可在所述处理器上运行的计算机指令,所述处理器运行所述计算机指令时执行上述任一种所述的回声延迟估计方法的步骤。
与现有技术相比,本发明实施例的技术方案具有以下有益效果:
在回声信号和参考信号中,分别截取预设频段内的回声信号和参考信号作为兴趣频段回声信号和兴趣频段参考信号,分别对兴趣频段回声信号和兴趣频段参考信号进行降速率采样,采用降速率兴趣频段参考信号对降速率兴趣频段回声信号进行延迟估计。由于只选取预设频段内的参考信号和回声信号,因此可以相应地选取长度较短的滤波器,故可以提高回声延迟估计的稳定性和准确性。并且,通过对兴趣频段参考信号和兴趣频段回声信号进行降速率采样,降低了回声延迟估计时的计算量,故降低了回声延迟估计的计算复杂度。
附图说明
图1是本发明实施例中的一种回声延迟估计方法的流程图;
图2是当通话设备处于手持通话模式时的回声信号与参考信号的示意图;
图3是当通话设备处于免提通话模式时的回声信号与参考信号的示意图;
图4是当通话设备处于蓝牙耳机通话模式时的回声信号与参考信号的示意图;
图5是本发明实施例中的一种低通滤波器的冲激响应示意图;
图6是本发明实施例中的一种低通滤波器的频率响应示意图;
图7是本发明实施例中的一种参考信号的波形图;
图8是本发明实施例中的一种回声信号的波形图;
图9是本发明实施例中的一种降采样兴趣频段参考信号的波形图;
图10是本发明实施例中的一种降采样兴趣频段回声信号的波形图;
图11是采用本发明实施例中提供的回升延迟估计方法得到的一种回声估计延迟的波形图;
图12是采用本发明实施例中提供的回声延迟估计方法得到的另一种回声估计延迟的波形图;
图13是本发明实施例中的一种回升延迟估计装置的结构示意图。
具体实施方式
回声的延迟是指输入信号经过一系列处理之后被延迟的时间,诸如经过数模转换、电学转换、声学回声、电学回声、声电转换、模数转换以及数据处理通路等处理后被延迟的时间。这其中,经过数模转换、电学换换、声学回路、电学回路、声电转换和模数转换的延迟时间均很短,总计数个毫秒。如果没有声学回路慢衰落的影响,回声抵消系统所采用的自适应滤波器只需要几十毫秒的处理能力即可。
回声延迟中,数据处理通路需要对数字音频信号进行组帧、解帧、增强处理等操作,会对回声信号产生几十毫秒乃至几百毫秒的延迟。同时,通讯系统会频繁切换连接方式,例如手机语音通讯中,可能会从手柄模式切换到扬声器模式、车载电话模式、蓝牙耳机模式、数字耳机模式等,不同的数据链路会产生不同的回声延迟。经实际测量,手机语音通讯中的回声延迟会从40ms剧变至250ms。
若回声抵消系统所使用的自适应滤波器能够适应这么长时间的回声延迟,那么需要处理能力为数百毫秒长的自适应滤波器,所需的计算量以及存储量大大增加,而且会使得自适应滤波器收敛较慢且不稳定,回声抵消性能较差。
现有的回声抵消系统中,若数据链路的回声延迟严格稳定,则可以对参考信号延迟一个常数时间作为预处理,这样就可以使用较短的自适应滤波器。但若回声延迟不稳定,则需要能够实时进行回声延迟估计。现有的延迟估计方法的复杂度较高。此外,在实际的回声抵消系统中,回声信号中会混入大量噪声,严重影响到回声延迟估计的稳定性,若回声延迟估计准确率较差,则可能会导致回声抵消系统的性能崩溃。
本发明实施例中,在回声信号和参考信号中,分别截取预设频段内的回声信号和参考信号作为兴趣频段回声信号和兴趣频段参考信号,分别对兴趣频段回声信号和兴趣频段参考信号进行降速率采样,采用降速率兴趣频段参考信号对降速率兴趣频段回声信号进行延迟估计。由于只选取预设频段内的参考信号和回声信号,因此可以选取长度较短的滤波器,故可以提高回声延迟估计的稳定性和准确性。通过对兴趣频段参考信号和兴趣频段回声信号进行降速率采样,降低了回声延迟估计时的计算量,故降低了回声延迟估计的计算复杂度。
为使本发明的上述目的、特征和有益效果能够更为明显易懂,下面结合附图对本发明的具体实施例做详细的说明。
参照图1,给出了本发明实施例中的一种回声延迟估计方法,以下通过具体步骤进行详细说明。
步骤S101,分别在回声信号和参考信号中,截取预设频段内的回声信号作为兴趣频段回声信号,并截取所述预设频段内的参考信号作为兴趣频段参考信号。
在本发明实施例中,预设频段可以为:回声信号的增益与参考信号的增益之差大于预设值的连续频段,也即在回声通路中增益较大而导致回声较大的频段。通常而言,预设频段可以视作为回声信号对参考信号的影响较大的连续频段。
在实际应用中可知,针对不同的通话设备,其对应的预设频段可能不同。针对同一通话设备,当其处于不同的通话模式时,其对应的预设频段也可能不同。因此,可以预先根据不同的通话设备以及其所处的不同的通话模式,来分别设定对应的预设频段。
参照图2~图4,分别给出了同一通话设备在不同的通话模式下的预设频段。
参照图2,给出了通话设备处于手持通话模式时的回声信号与参考信号的示意图。从图2中可以得知,在频段201,也即频率为2600Hz~3200Hz的频段中,回声信号的增益与参考信号的增益之差大于预设值,因此,可以将频率范围为2600Hz~3200Hz的频段,作为通话设备处于手持通话模式时的预设频段。
参照图3,给出了通话设备处于免提通话模式时的回声信号与参考信号的示意图。从图3中可以得知,在频段301,也即频率为2600Hz~3400Hz的频段中,回声信号的增益与参考信号的增益之差大于预设值,因此,可以将频率范围为2600Hz~3400Hz的频段作为通话设备处于免提通话模式时的预设频段。
参照图4,给出了通话设备处于蓝牙耳机通话模式时的回声信号与参考信号的示意图。从图4中可以得知,在频段401,也即频率为2800Hz~3100Hz的频段中,回声信号的增益与参考信号的增益之差大于预设值,因此,可以将频率范围为2800Hz~3100Hz的频段作为通话设备处于蓝牙耳机通话模式时的预设频段。
在具体实施中,可以采用预设的带通滤波器,在回声信号中截取预设频段内的回声信号作为兴趣频段回声信号,在参考信号中截取预设频段内的参考信号作为兴趣频段参考信号。可以设定预设频段的中心频率为fc,带宽为fω。
在实际应用中,可以预先设定不同的带通滤波器,带通滤波器与通话终端的通话模式一一对应,且带通滤波器的中心频率与带宽可以与预设频段相同,也即:带通滤波器的中心频率为fc,带宽为fω。
继续以图2~图4为例,通话设备中可以预先设定3个带通滤波器,带通滤波器1为通话终端处于手持通话模式时对应的带通滤波器,中心频率为2900Hz,带宽为300Hz;带通滤波器2为通话设备处于免提通话模式时对应的带通滤波器,中心频率为3000Hz,带宽为400Hz;带通滤波器3为通话设备处于蓝牙耳机通话模式时对应的带通滤波器,中心频率为2950Hz,带宽为150Hz。
在具体实施中,可以采用如下式(1)在回声信号中截取预设频段内的回声信号作为兴趣频段回声信号:
其中,dBP(t)为兴趣频段回声信号,hBP为带通滤波器的传递函数,d(t)为回声信号,t为离散时间索引。
可以采用如下式(2)在参考信号中截取预设频段内的参考信号作为兴趣频段参考信号:
其中,xBP(t)为兴趣频段参考信号,x(t)为参考信号。
在具体实施中,带通滤波器可以采用如下方式生成:以截至频率为fω/2的低通滤波器为原型,经过向正半周调制的单边带调制得到。所得到的带通滤波器的传递函数为:
在具体实施中,带通滤波器也可以采用如下方式生成:以截止频率为fω/2的低通滤波器为原型,经过向负半周调制的单边带调制得到。所得到的带通滤波器的传递函数为:
在具体实施中,带通滤波器还可以采用如下方式生成:以截止频率为fω/2的低通滤波器为原型,经过双边带调制得到。所得到的带通滤波器的传递函数为:
步骤S102,分别对所述兴趣频段回声信号和所述兴趣频段参考信号进行降速率采样。
在具体实施中,对兴趣频段回声信号进行降速率采样,得到降速率兴趣频段回声信号。对兴趣频段参考信号进行降速率采样,得到降速率兴趣频段参考信号。
在实际应用中可知,降采样是降低特定信号的采样率的过程,通常用于降低数据传输速率或者数据大小。抽取因子M一般为大于1的整数或有理数,表示降采样之后的采样周期变成特定信号的采样周期的M倍,或者等价地表示为降采样之后的采样速率为特定信号的采样速率的1/M。
在具体应用中,可以根据实际的应用需求来设定抽取因子。例如,设定抽取因子M=5。又如,设定抽取因子M=8。
对上式(1)中的兴趣频段回声信号进行降速率采样,得到的降速率兴趣频段回声信号参照下式(3):
dBPD(td)=dBP(tdM); (3)
其中,dBPD(td)为降速率兴趣频段回声信号,td为降速率之后的离散时间索引,M为抽取因子,且1<M≤fs/fω/2。
对上式(2)中的兴趣频段参考信号进行降速率采样,得到的降速率兴趣频段参考信号参照下式(4):
xBPD(td)=xBP(tdM); (4)
其中,xBPD(td)为所述降速率兴趣频段参考信号。
步骤S103,采用降速率兴趣频段参考信号,对所述降速率兴趣频段回声信号进行延迟估计,得到回声延迟。
在具体实施中,可以采用信号处理理论中的自相关方法,根据降速率兴趣频段参考信号,对降速率兴趣频段回声信号进行延迟估计,得到回声延迟。也可以采用信号处理理论中的自适应滤波器方法,根据降速率兴趣频段参考信号,对降速率兴趣频段回声进行延迟估计,得到回声延迟。
可以理解的是,还可以采用其他的方法,来根据降速率兴趣频段参考信号,对降速率兴趣频段回声信号进行延迟估计,得到回声延迟,此处不做赘述。
下面以采用自适应滤波器方法为例进行说明。
采用如下公式(5)计算得到回声延迟的值为:
TLD=Mkmax; (5)其中,TLD为所述回声延迟的值,kmax满足:h(kmax)为子带冲激响应h(k)的最大绝对值,且h(k)在td时刻的值为:
回声延迟估计得到的回声延迟与实际的回声延迟的误差值为:
下面通过举例对本发明上述实施例中提供的回声延迟估计方法进行说明。
将一个截止频率为62.5Hz的低通滤波器,通过双边带调制搬移到2875Hz,生成带宽为125Hz的带通滤波器。低通滤波器的冲激响应如图5所示,频率响应如图6所示。
参照图7,给出了一种参考信号的波形图。参照图8,给出了一种回声信号的波形图。
将参考信号经过带通滤波器进行滤波,得到兴趣频段参考信号。对兴趣频段参考信号进行M=32的降采样,得到降采样兴趣频段参考信号,降采样兴趣频段参考信号的波形图参照图9。
将回声信号经过带通滤波器进行滤波,得到兴趣频段回声信号。对兴趣频段回声信号进行M=32的降采样,得到降采样兴趣频段回声信号,降采样兴趣频段回声信号的波形图参照图10。
采用本发明上述实施例中提供的回声延迟估计方法,当通话设备处于蓝牙耳机通话模式下使用蓝牙耳机1时,得到的回声延迟估计的波形图如图11所示;当通话设备处于蓝牙耳机通话模式下使用蓝牙耳机2时,得到的回声延迟估计的波形图如图12所示。
从图11中可知,采用本发明上述实施例中提供的回声延迟估计方法,估计得到的回声延迟的值稳定在96ms。从图12中可知,采用本发明上述实施例中提供的回声延迟估计方法,估计得到的回声延迟的值稳定在188ms。
参照图13,给出了本发明实施例中的一种回声延迟估计装置130,包括:截取单元131、降速率采样单元132以及延迟估计单元133,其中:
截取单元131,用于分别在回声信号和参考信号中,截取预设频段内的回声信号作为兴趣频段回声信号,并截取预设频段内的参考信号作为兴趣频段参考信号;
降速率采样单元132,用于分别对所述兴趣频段回声信号和所述兴趣频段参考信号进行降速率采样,得到降速率兴趣频段回声信号和降速率兴趣频段参考信号;
延迟估计单元133,用于采用所述降速率兴趣频段回声信号,对所述降速率兴趣频段回声信号进行延迟估计,得到回声延迟。
在具体实施中,所述截取单元131,可以用于采用预设的带通滤波器,在所述回声信号中截取所述预设频段内的回声信号作为所述兴趣频段回声信号,在所述参考信号中截取所述预设频段内的参考信号作为所述兴趣频段参考信号;其中,所述预设频段的中心频率为fc,带宽为fω。
在具体实施中,所述截取单元131,可以用于采用如下公式在所述回声信号中截取所述预设频段内的回声信号作为兴趣频段回声信号:其中,dBP(t)为所述兴趣频段回声信号,hBP为所述带通滤波器的传递函数,d(t)为所述回声信号,t为离散时间索引;采用如下公式在所述参考信号中截取所述预设频段内的参考信号作为兴趣频段参考信号:其中,xBP(t)为所述兴趣频段参考信号,x(t)为所述参考信号。
在具体实施中,所述降速率采样单元132,可以用于采用如下公式对所述兴趣频段回声信号进行降速率采样:dBPD(td)=dBP(tdM);其中,dBPD(td)为所述降速率兴趣频段回声信号,td为降速率之后的离散时间索引,M为抽取因子,且1<M≤fs/fω/2,fs为所述回声信号的采样频率;采用如下公式对所述兴趣频段参考信号进行降速率采样:xBPD(td)=xBP(tdM);其中,xBPD(td)为所述降速率兴趣频段参考信号。
在具体实施中,所述延迟估计单元133,可以用于采用如下公式得到所述回声延迟的值:TLD=Mkmax;其中,TLD为所述回声延迟的值,kmax满足:h(kmax)为子带冲激响应h(k)的最大绝对值,且h(k)在td时刻的值为:
本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机指令,所述计算机指令运行时执行本发明上述实施例中提供的回声延迟估计方法的步骤。
本发明实施例还提供了一种电子设备,包括存储器和处理器,所述存储器上存储有可在所述处理器上运行的计算机指令,所述处理器运行所述计算机指令时执行本发明上述实施例中提供的回声延迟估计方法的步骤。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:ROM、RAM、磁盘或光盘等。
虽然本发明披露如上,但本发明并非限定于此。任何本领域技术人员,在不脱离本发明的精神和范围内,均可作各种更动与修改,因此本发明的保护范围应当以权利要求所限定的范围为准。
Claims (14)
1.一种回声延迟估计方法,其特征在于,包括:
分别在回声信号和参考信号中,截取预设频段内的回声信号作为兴趣频段回声信号,并截取所述预设频段内的参考信号作为兴趣频段参考信号;所述预设频段为:所述回声信号的增益与所述参考信号的增益之差大于预设值的连续频段;所述截取预设频段内的回声信号作为兴趣频段回声信号,并截取所述预设频段内的参考信号作为兴趣频段参考信号,包括:采用预设的带通滤波器,在所述回声信号中截取所述预设频段内的回声信号作为所述兴趣频段回声信号,在所述参考信号中截取所述预设频段内的参考信号作为所述兴趣频段参考信号;其中,所述预设频段的中心频率为fc,带宽为fω;所述预设的带通滤波器是以截止频率为fω/2的低通滤波器为原型,经过向正半周调制的单边带调制得到,且所述带通滤波器的传递函数为:
分别对所述兴趣频段回声信号和所述兴趣频段参考信号进行降速率采样,得到降速率兴趣频段回声信号和降速率兴趣频段参考信号;
采用所述降速率兴趣频段参考信号,对所述降速率兴趣频段回声信号进行延迟估计,得到回声延迟。
2.如权利要求1所述的回声延迟估计方法,其特征在于,以截止频率为fω/2的低通滤波器为原型,经过向负半周调制的单边带调制得到所述带通滤波器。
4.如权利要求1所述的回声延迟估计方法,其特征在于,以截止频率为fω/2的低通滤波器为原型,经过双边带调制得到所述带通滤波器。
7.如权利要求6所述的回声延迟估计方法,其特征在于,所述分别对所述兴趣频段回声信号和所述兴趣频段参考信号进行降速率采样,包括:
采用如下公式对所述兴趣频段回声信号进行降速率采样:
dBPD(td)=dBP(tdM);
其中,dBPD(td)为所述降速率兴趣频段回声信号,td为降速率之后的离散时间索引,M为抽取因子,且1<M≤fs/fω/2;
采用如下公式对所述兴趣频段参考信号进行降速率采样:
xBPD(td)=xBP(tdM);
其中,xBPD(td)为所述降速率兴趣频段参考信号。
9.一种回声延迟估计装置,其特征在于,包括:
截取单元,用于分别在回声信号和参考信号中,截取预设频段内的回声信号作为兴趣频段回声信号,并截取预设频段内的参考信号作为兴趣频段参考信号;所述截取预设频段内的回声信号作为兴趣频段回声信号,并截取所述预设频段内的参考信号作为兴趣频段参考信号,包括:采用预设的带通滤波器,在所述回声信号中截取所述预设频段内的回声信号作为所述兴趣频段回声信号,在所述参考信号中截取所述预设频段内的参考信号作为所述兴趣频段参考信号;其中,所述预设频段的中心频率为fc,带宽为fω;所述预设的带通滤波器是以截止频率为fω/2的低通滤波器为原型,经过向正半周调制的单边带调制得到,且所述带通滤波器的传递函数为:
降速率采样单元,用于分别对所述兴趣频段回声信号和所述兴趣频段参考信号进行降速率采样,得到降速率兴趣频段回声信号和降速率兴趣频段参考信号;
延迟估计单元,用于采用所述降速率兴趣频段回声信号,对所述降速率兴趣频段回声信号进行延迟估计,得到回声延迟。
11.如权利要求10所述的回声延迟估计装置,其特征在于,所述降速率采样单元,用于采用如下公式对所述兴趣频段回声信号进行降速率采样:
dBPD(td)=dBP(tdM);
其中,dBPD(td)为所述降速率兴趣频段回声信号,td为降速率之后的离散时间索引,M为抽取因子,且1<M≤fs/fω/2;
采用如下公式对所述兴趣频段参考信号进行降速率采样:
xBPD(td)=xBP(tdM);
其中,xBPD(td)为所述降速率兴趣频段参考信号。
13.一种计算机可读存储介质,其上存储有计算机指令,其特征在于,所述计算机指令运行时执行权利要求1~8任一项所述的回声延迟估计方法的步骤。
14.一种电子设备,其特征在于,包括存储器和处理器,所述存储器上存储有可在所述处理器上运行的计算机指令,其特征在于,所述处理器运行所述计算机指令时执行权利要求1~8任一项所述的回声延迟估计方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710307758.3A CN108831491B (zh) | 2017-05-04 | 2017-05-04 | 回声延迟估计方法及装置、存储介质、电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710307758.3A CN108831491B (zh) | 2017-05-04 | 2017-05-04 | 回声延迟估计方法及装置、存储介质、电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108831491A CN108831491A (zh) | 2018-11-16 |
CN108831491B true CN108831491B (zh) | 2020-07-17 |
Family
ID=64154064
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710307758.3A Active CN108831491B (zh) | 2017-05-04 | 2017-05-04 | 回声延迟估计方法及装置、存储介质、电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108831491B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111246036A (zh) * | 2020-02-17 | 2020-06-05 | 上海推乐信息技术服务有限公司 | 一种回声估计方法和装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1499809A (zh) * | 2002-11-04 | 2004-05-26 | 华为技术有限公司 | 一种回声消除器及回声估计方法 |
CN101026659A (zh) * | 2006-02-23 | 2007-08-29 | 中兴通讯股份有限公司 | 一种回声延时定位的实现方法 |
CN101888455A (zh) * | 2010-04-09 | 2010-11-17 | 熔点网讯(北京)科技有限公司 | 一种频域自适应回声抵消方法 |
CN102855881A (zh) * | 2011-06-27 | 2013-01-02 | 华为技术有限公司 | 一种回声抑制方法和装置 |
CN103391381A (zh) * | 2012-05-10 | 2013-11-13 | 中兴通讯股份有限公司 | 回声消除方法及装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20130070903A (ko) * | 2011-12-20 | 2013-06-28 | 한국전자통신연구원 | 임베디드 시스템에 탑재된 적응형 테일 길이를 갖는 광대역 어커스틱 에코 제거 장치 및 방법 |
-
2017
- 2017-05-04 CN CN201710307758.3A patent/CN108831491B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1499809A (zh) * | 2002-11-04 | 2004-05-26 | 华为技术有限公司 | 一种回声消除器及回声估计方法 |
CN101026659A (zh) * | 2006-02-23 | 2007-08-29 | 中兴通讯股份有限公司 | 一种回声延时定位的实现方法 |
CN101888455A (zh) * | 2010-04-09 | 2010-11-17 | 熔点网讯(北京)科技有限公司 | 一种频域自适应回声抵消方法 |
CN102855881A (zh) * | 2011-06-27 | 2013-01-02 | 华为技术有限公司 | 一种回声抑制方法和装置 |
CN103391381A (zh) * | 2012-05-10 | 2013-11-13 | 中兴通讯股份有限公司 | 回声消除方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN108831491A (zh) | 2018-11-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9697846B2 (en) | Method and apparatus for reducing echo | |
EP3348047B1 (en) | Audio signal processing | |
EP2845189B1 (en) | A universal reconfigurable echo cancellation system | |
US8098813B2 (en) | Communication system | |
CN111341336B (zh) | 一种回声消除方法、装置、终端设备及介质 | |
CN105825864B (zh) | 基于过零率指标的双端说话检测与回声消除方法 | |
JP4377952B1 (ja) | 適応フィルタ及びこれを有するエコーキャンセラ | |
KR101422984B1 (ko) | 잔류 에코를 억제하는 방법 및 장치 | |
TWI682672B (zh) | 減少殘餘回聲的回聲消除系統和方法 | |
US20110137646A1 (en) | Noise Suppression Method and Apparatus | |
CN110956975B (zh) | 回声消除方法及装置 | |
CN1367977A (zh) | 在回波消除系统中用于改进子频带自适应滤波的方法和装置 | |
US9020144B1 (en) | Cross-domain processing for noise and echo suppression | |
KR20040030817A (ko) | 통신 시스템, 에코 제거 수단 및 에코 제거 방법 | |
US20130287203A1 (en) | Reduction of Loudspeaker Distortion for Improved Acoustic Echo Cancellation | |
CN109215672B (zh) | 一种声音信息的处理方法、装置及设备 | |
WO2019239977A1 (ja) | エコー抑圧装置、エコー抑圧方法およびエコー抑圧プログラム | |
CN108831491B (zh) | 回声延迟估计方法及装置、存储介质、电子设备 | |
GB2490092A (en) | Reducing howling by applying a noise attenuation factor to a frequency which has above average gain | |
EP4243019A1 (en) | Voice processing method, apparatus and system, smart terminal and electronic device | |
KR20220157475A (ko) | 반향 잔류 억제 | |
JP4903843B2 (ja) | 適応フィルタ及びこれを有するエコーキャンセラ | |
JP4456594B2 (ja) | 音響結合量算出装置、音響結合量算出装置を用いたエコー消去装置及びボイススイッチ装置、通話状態判定装置、これらの方法、これらのプログラム及びその記録媒体 | |
Fukui et al. | Acoustic echo canceller software for VoIP hands-free application on smartphone and tablet devices | |
US9749475B2 (en) | Method and apparatus for reducing distortion echo |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |