CN108134863A - 一种基于双统计量的改进型双端检测装置及检测方法 - Google Patents

一种基于双统计量的改进型双端检测装置及检测方法 Download PDF

Info

Publication number
CN108134863A
CN108134863A CN201711434761.8A CN201711434761A CN108134863A CN 108134863 A CN108134863 A CN 108134863A CN 201711434761 A CN201711434761 A CN 201711434761A CN 108134863 A CN108134863 A CN 108134863A
Authority
CN
China
Prior art keywords
double
module
signal
detection
statistic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201711434761.8A
Other languages
English (en)
Other versions
CN108134863B (zh
Inventor
徐永键
陆许明
殷宇冰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SYSU HUADU INDUSTRIAL SCIENCE AND TECHNOLOGY INSTITUTE
Sun Yat Sen University
Original Assignee
SYSU HUADU INDUSTRIAL SCIENCE AND TECHNOLOGY INSTITUTE
Sun Yat Sen University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SYSU HUADU INDUSTRIAL SCIENCE AND TECHNOLOGY INSTITUTE, Sun Yat Sen University filed Critical SYSU HUADU INDUSTRIAL SCIENCE AND TECHNOLOGY INSTITUTE
Priority to CN201711434761.8A priority Critical patent/CN108134863B/zh
Publication of CN108134863A publication Critical patent/CN108134863A/zh
Application granted granted Critical
Publication of CN108134863B publication Critical patent/CN108134863B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/24Arrangements for testing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0264Noise filtering characterised by the type of parameter measurement, e.g. correlation techniques, zero crossing techniques or predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L2021/02082Noise filtering the noise being echo, reverberation of the speech

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
  • Filters That Use Time-Delay Elements (AREA)

Abstract

本发明公开了一种基于双统计量的改进型双端检测装置及检测方法,属音频处理技术领域,检测装置包括麦克风、双端检测模块、自适应滤波模块、回声估计回路模块以及信号处理模块,双端检测模块信号输入端分别与麦克风的信号输出端及远端语音信号输出端连接,双端检测模块信号输出端分别与自适应滤波模块的信号输入端及信号处理模块的输出端连接,双端检测模块连接回声估计回路模块,回声估计回路模块的输入端连接远端语音信号输出端;本发明的检测方法能够显著提高DTD算法的检测灵敏度,具有计算复杂度低、系统鲁棒性好的特点。

Description

一种基于双统计量的改进型双端检测装置及检测方法
技术领域
本发明涉及一种通讯音频的检测装置,更具体地说,尤其涉及一种基于双统计量的改进型双端检测装置;本发明还涉及该检测装置的检测方法。
背景技术
在实际通信的多数场合中,当远端语音信号传递到近端后,远端语音信号直接或者经过反射与近端通话者的有效语音信号一起被近端的麦克风采集然后又传递到远端,如果这个反射后的语音信号延迟超过了50ms或者其损耗低于45dB,处于远端的通话者就会听到自己的声音,从而产生声学回声现象。因此,为了保证通话过程中较好的通信质量,在语音通信系统中必须使用自适应回声抵消器(Acoustic Echo Canceller,以下简称“AEC”)。
AEC主要是解决声学回声现象,该技术的基本思想是利用远端信号与回声信号所具有的相关性,从而产生对回声信号的估计值,并从近端语音信号中将估计值减去,得到的这个差值信号(即误差),再通过一定的准则更新自适应滤波器的系数从而得到最优解。由于滤波器只针对回声信号,因此当存在近端有效语音信号时,自适应滤波器的滤波输出与估计信号相减得到的差值信号并不是回声信号与回声估计信号的差值信号,在这种情况下如果对自适应滤波器系数进行更新,反而会使得滤波效果变差。因此,在存在近端通信的状态下,滤波器应该停止更新系数。
一般可以将通话状态分为三种情况:近端讲话状态、远端讲话状态和双端讲话状态,根据通话状态的不同来确定滤波器的工作模式。在近端讲话状态时,滤波器不进行滤波也不进行系数更新操作;在双端讲话状态时,滤波器只进行滤波;在远端讲话状态时,滤波器既需要滤波也需要对系数进行更新。而近端讲话状态对于实际的回声消除是没有意义的,因此可以只考虑区分双端讲话状态和非双端讲话状态这两种,此时就需要使用双端检测器(以下简称“DTD”)。
DTD的工作原理主要是在近端语音信号存在的情况下暂停滤波器的系数更新,保存该系数为前一状态时的值,这样就可以将近端语音信号从回声信号中区分出来。常见的双端发声检测算法有:能量比较法、双滤波器法、相关比较法等。这些算法的基本工作流程是:
(1)利用AEC系统中的各种信号,如误差信号,远端信号等,构造一个检测统计量ξ。
(2)将检测统计量ξ跟一个预设好的阈值T进行比较,根据比较结果判断语音通话状态。例如可以设置当ξ<T时则认为该状态是双端通话。
(3)若检测结果为双端通话,双端检测将会在一个时间段t内停止工作,同时滤波器在这个时段内也将停止系数更新操作。
(4)如果检测统计量ξ在超过t的时间段内都满足ξ≥T,则自适应滤波器持续更新,直到又检测到ξ<T。
一般的DTD的双端发声检测算法基本上都符合上述流程,区别点就在检测统计量ξ的构造方式以及判断阈值的设置上有所不同。能量比较法计算量比较小,但是很难选择合理的阈值T,一般只适用于相对固定的信道环境中;双滤波器法和相关比较法在性能上进行了一定的优化,但是计算量也相应的提高了。因此,亟待设计出一种能够有效检测出双端语音信号的检测方法,以降低计算复杂度、提高算法的灵敏度和系统的鲁棒性。
发明内容
本发明的前一目的在于提供一种基于双统计量的改进型双端检测装置,该检测装置能够有效检测出双端语音信号。本发明的后一目的在于提供该种装置的检测方法,该检测方法能够显著提高DTD算法的检测灵敏度,具有计算复杂度低、系统鲁棒性好的特点。
本发明前一技术方案如下:
一种基于双统计量的改进型双端检测装置,其中,包括麦克风、双端检测模块、自适应滤波模块、回声估计回路模块以及信号处理模块,
所述的麦克风,用于接收近端语音信号;
所述的双端检测模块,用于接收麦克风的输出信号及远端的语音信号后进行处理;
所述的自适应滤波模块,用于接收双端检测模块的处理输出信号及误差信号后进行处理;
所述的回声估计回路模块,用于接收自适应滤波模块的处理输出信号及远端的语音信号后进行处理;
所述的信号处理模块,用于将接收到的麦克风的输出信号与回声估计回路模块处理输出信号相减获得误差信号;
所述的双端检测模块信号输入端分别与麦克风的信号输出端及远端语音信号输出端连接,所述双端检测模块信号输出端分别与自适应滤波模块的信号输入端及信号处理模块的输出端连接,所述双端检测模块连接回声估计回路模块,所述的回声估计回路模块的输入端连接远端语音信号输出端。
进一步的,还包括与远端语音信号输出端连接的扬声器,所述扬声器的信号输出端经过一回声路径模块与麦克风的信号输出端连接。
进一步的,所述的双端检测模块中设有滤波器系数缓存装置。
本发明后一技术方案如下:
一种基于双统计量的改进型双端检测装置的检测方法,包括以下检测步骤:
(1)初始化各种变量;
(2)计算用于双端检测模块检测算法的检测统计量;
(3)按照NLMS算法对自适应滤波模块进行更新;
(4)计算自适应滤波模块的滤波结果;
(5)每次选择n个语音样本点进行操作,若k不等于n的整数倍时跳转至步骤(8);
(6)双端检测模块根据所选择的n个语音样本点的误差信号e(n)和麦克风输出信号y(n)构建统计量ξ3,由统计量ξ3与阈值T比较判断自适应滤波模块收敛效果;
(7)双端检测模块根据麦克风输出信号y(n)进行检测计算,并判断是否为双端通话状态,若是双端通话状态,则将滤波器系数缓存装置中的系数取出替代当前自适应滤波模块的工作系数,同时自适应滤波模块在一定时间内停止更新;若不是双端通话状态,双端检测模块和自适应滤波模块正常工作,从信号处理模块输出误差信号;
(8)k=k+1,跳转步骤(2)。
进一步的,在步骤(1)中,初始化各种变量时,包括将变量k设为1,将变量kpeak、ξpeak、t0置零;
其中,k为位置记录变量,kpeak为记录出现峰值位置的变量,ξpeak为检测统计量ξ1的峰值,t0为峰值最多维持的有效时间。
进一步的,在步骤(2)中,所述的检测统计量包括检测统计量ξ1和检测统计量ξ2,所述检测统计量ξ1的计算公式为:
其中,h为回声路径,h^(n)为回声估计路径,Rxx为远端语音信号x(n)的自相关矩阵,是近端语音信号的能量;
所述自相关矩阵Rxx的计算公式为:
Rxx=E[x(n)xT(n)];
所述检测统计量ξ2的计算公式为:
其中,h为回声路径。
进一步的,在步骤(6)中,所述检测统计量ξ3的计算公式为:
其中,
ke(n)=λke(n-1)+(1-λ)|e(n)|;
ky(n)=λky(n-1)+(1-λ)|y(n)|;
其中,λ为指数加权因子。
进一步的,在步骤(7)中,双端检测模块根据麦克风输出信号y(n)进行检测计算时,先将检测统计量ξ1与上限阈值T1作比较,若ξ1≥T1时,判定v(n)存在,无需计算ξ2;若是ξ1≤T1,则计算ξ2,当满足ξ2≥T2,判定v(n)存在,否则判定v(n)不存在。
进一步的,在步骤(7)中,在不是双端通话状态时,信号处理模块输出的误差信号
与现有技术相比,本发明具有的有益效果为:
1.本发明的基于双统计量的改进型双端检测装置,包括麦克风、双端检测模块、自适应滤波模块、回声估计回路模块以及信号处理模块,所述的双端检测模块信号输入端分别与麦克风的信号输出端及远端语音信号输出端连接,所述双端检测模块信号输出端分别与自适应滤波模块的信号输入端及信号处理模块的输出端连接,所述双端检测模块连接回声估计回路模块,所述的回声估计回路模块的输入端连接远端语音信号输出端。该检测装置能够有效检测出双端语音信号。
2.本发明的一种基于双统计量的改进型双端检测装置的检测方法,通过计算用于双端检测模块检测算法的检测统计量;按照NLMS算法对自适应滤波模块进行更新;计算自适应滤波模块的滤波结果;每次选择n个语音样本点进行操作,双端检测模块根据所选择的n个语音样本点的误差信号e(n)和麦克风输出信号y(n)构建统计量ξ3,由统计量ξ3与阈值T比较判断自适应滤波模块收敛效果;双端检测模块根据麦克风输出信号y(n)进行检测计算,并判断是否为双端通话状态,若是双端通话状态,则将滤波器系数缓存装置中的系数取出替代当前自适应滤波模块的工作系数,同时自适应滤波模块在一定时间内停止更新;若不是双端通话状态,双端检测模块和自适应滤波模块正常工作,从信号处理模块输出误差信号;选择下一段n个语音样本点进行操作。采用基于双检测统计量的DTD算法能够显著的提高算法的检测灵敏度,减少误判、漏判的情况,具有计算复杂度低、系统鲁棒性好的特点。
附图说明
图1是本发明的一种基于双统计量的改进型双端检测装置的系统框图;
图2是本发明的一种基于双统计量的改进型双端检测装置的检测方法流程图;
图3是本发明的一种基于双统计量的改进型双端检测装置的检测方法中双检测统计量的检测范围示意图;
图4是本发明的一种基于双统计量的改进型双端检测装置的检测方法中双检测统计量的检测算法流程图;
图5是本发明的一种基于双统计量的改进型双端检测装置的检测方法中滤波器系数缓存装置的系数缓存加载示意图。
具体实施方式
下面结合具体实施方式,对本发明的技术方案作进一步的详细说明,但不构成对本发明的任何限制。
参照图1所示,本发明的一种基于双统计量的改进型双端检测装置,其中,包括麦克风1、双端检测模块2、自适应滤波模块3、回声估计回路模块4以及信号处理模块5,
所述的麦克风1,用于接收近端语音信号;
所述的双端检测模块2,用于接收麦克风1的输出信号及远端的语音信号后进行处理;
所述的自适应滤波模块3,用于接收双端检测模块2的处理输出信号及误差信号后进行处理;
所述的回声估计回路模块4,用于接收自适应滤波模块3的处理输出信号及远端的语音信号后进行处理;
所述的信号处理模块5,用于将接收到的麦克风1的输出信号与回声估计回路模块4处理输出信号相减获得误差信号;
所述的双端检测模块2信号输入端分别与麦克风1的信号输出端及远端语音信号输出端连接,所述双端检测模块2信号输出端分别与自适应滤波模块3的信号输入端及信号处理模块5的输出端连接,所述双端检测模块2连接回声估计回路模块4,所述的回声估计回路模块4的输入端连接远端语音信号输出端,该检测装置能够有效检测出双端语音信号。
还包括与远端语音信号输出端连接的扬声器6,所述扬声器6的信号输出端经过一回声路径模块与麦克风1的信号输出端连接,远端语音信号经过扬声器6扩音。
所述的双端检测模块2中设有滤波器系数缓存装置21。为了提高系统的鲁棒性和维护滤波器的自适应功能,本发明使用滤波器缓存机制,基本原理是当自适应滤波模块3工作在较好的状态时,将其系数保存到滤波器系数缓存装置21中且该系数也处于持续更新过程中,一旦检测到双端通话的情况,则用滤波器系数缓存装置21中的系数取代当前自适应滤波模块3的系数,从而可以避免滤波器发散。
图中各信号的定义如下:
(1)远端语音信号向量:x(n)=[x(n),x(n-1),x(n-2),…,x(n-L+1)]T
(2)回声路径:h=[h0,h1,h2,…,hL-1];
(3)回声信号:d(n)=hTx(n)=xT(n)h;
(4)近端语音信号:v(n);
(5)近端麦克风输入信号:y(n)=d(n)+v(n);
(6)回声估计路径:
(7)回声估计信号:
(8)误差信号:
其中,L表示自适应滤波器的长度。
参照图2所示,本发明的一种基于双统计量的改进型双端检测装置的检测方法,包括以下检测步骤:
(1)初始化各种变量,其中,初始化各种变量时,包括将变量k设为1,将变量kpeak、ξpeak、t0置零;其中,k为位置记录变量,kpeak为记录出现峰值位置的变量,ξpeak为检测统计量ξ1的峰值,t0为峰值最多维持的有效时间。
(2)计算用于双端检测模块2检测算法的检测统计量,所述的检测统计量包括检测统计量ξ1和检测统计量ξ2
根据文献[1,Benesty J,Morgan D R,Cho J H.A new class of doubletalkdetectors based on cross-correlation[J].IEEE Transactions on Speech and AudioProcessing,2000,8(2):168-172.]所提出的改进型归一化互相关DTD算法,文章中利用远端信号x(n)与麦克风最终输入信号y(n)之间的互相关向量来构建检测统计量:
在[公式1]中,rxy=E[x(n)y(n)]=Rxxh,其中是麦克风最终输入信号的方差:
在[公式2]中,是近端语音信号的能量,将[公式2]代入到[公式1]中可以得到:
本发明中采用的检测统计量ξ1是利用近端输入信号y(n)与回声信号的估计d^(n)构建:
在[公式4]中
将[公式2]、[公式5]代入[公式4],最终可以得到所述检测统计量ξ1的计算公式为:
其中,h为回声路径,h^(n)为回声估计路径,Rxx为远端语音信号x(n)的自相关矩阵,是近端语音信号的能量;
所述自相关矩阵Rxx的计算公式为:
Rxx=E[x(n)xT(n)]
当近端语音信号v(n)=0时,近端输入信号y(n)就只包含回声部分即d(n),从理论来分析回声信号的估计d^(n)应该跟d(n)的相关度很大(接近于1);[公式6]中也可以看到当v(n)=0时,则有而h^(n)是h的估计,因此ξ1≈1。从而证明了该检测统计量能够反映出实际情况。
另一个检测统计量ξ2是利用近端输入信号y(n)与误差信号e(n)构建:
在[公式7]中:
将[公式2]、[公式8]代入[公式7],最终得到所述检测统计量ξ2的计算公式为:
其中,h为回声路径,h^(n)为回声估计路径,Rxx为远端语音信号x(n)的自相关矩阵:
Rxx=E[x(n)xT(n)],是近端语音信号的能量。
当近端语音信号v(n)=0时,自适应滤波器应该处于最佳工作状态,即e(n)=0;这时y(n)与e(n)相关度很小,接近于0;从[公式9]中可以看到,当v(n)=0时,h^(n)是h的估计,因此ξ2的分子接近为0,从而ξ2≈0;该检测统计量也是与实际相符合的。
为了降低计算复杂度,本发明采用指数递归算法来近似计算rey
式子中β为指数加权因子。
为了提高双端检测模块2检测算法的灵敏度,本发明中同时采用两个检测统计量,一个检测统计量ξ1由近端输入信号y(n)与回声信号的估计d^(n)构建;另一个检测统计量ξ2是基于误差信号e(n)与麦克风最终采集到的近端输入信号y(n)之间的归一化互相关函数构建而成。
(3)按照NLMS算法对自适应滤波模块3进行更新。
(4)计算自适应滤波模块3的滤波结果,即对回声信号的估计d^(n)。
(5)每次选择n个语音样本点进行操作,若k不等于n的整数倍时跳转至步骤(8)。
(6)双端检测模块2根据所选择的n个语音样本点的误差信号e(n)和麦克风1输出信号y(n)构建统计量ξ3,由统计量ξ3与阈值T比较判断自适应滤波模块3收敛效果。
所述检测统计量ξ3的计算公式为:
ke(n)=λke(n-1)+(1-λ)|e(n)| [公式14]
ky(n)=λky(n-1)+(1-λ)|y(n)| [公式15]
其中,λ为指数加权因子。同时设置一个阈值T,若是滤波器收敛的较好,则误差信号e(n)应该接近于0,从而ξ3也应该接近于0。因此可以认为在一段时间内若一直有ξ3<T,此时滤波器收敛情况较好,同时将ξ1与上次保存系数所对应的ξpeak、kpeak相比较。若ξ1peak或者k>k+t0,则将此时的滤波器系数存入缓存,同时令ξpeak=ξ1,kpeak=k,这样可以保证缓存的系数也处于不断更新之中,体现自适应性。
(7)双端检测模块2根据麦克风1输出信号y(n)进行检测计算,并判断是否为双端通话状态,若是双端通话状态,则将滤波器系数缓存装置21中的系数取出替代当前自适应滤波模块3的工作系数,同时自适应滤波模块3在一定时间内停止更新;若不是双端通话状态,双端检测模块2和自适应滤波模块3正常工作,从信号处理模块5输出误差信号。
双端检测模块2根据麦克风1输出信号y(n)进行检测计算时,先将检测统计量ξ1与上限阈值T1作比较,若ξ1≥T1时,判定v(n)存在,无需计算ξ2;若是ξ1≤T1,则计算ξ2,当满足ξ2≥T2,判定v(n)存在,否则判定v(n)不存在。
当近端语音信号v(n)不存在时,统计量ξ1接近于1,因此可以设置一个较大的门限T1作为上限阈值;而此时统计量ξ2接近于0,从而可以设置一个较小的门限T2作为下限阈值,具体示意图如图3所示。
考虑到计算复杂度的问题,实际运用该算法时,不必每次将两个检测统计量均计算出来。一般可以首先计算ξ1然后与T1做比较,当ξ1≥T1时,则直接认为v(n)存在,无需计算ξ2;若是ξ1≤T1,则需计算ξ2,当满足ξ2≥T2,才能断定v(n)存在,具体流程图如图4所示。
双端检测的目的就是要准确的检测出近端语音信号v(n)的存在,在上述的检测统计量中主要计算的是v(n)的能量由于为了防止双端检测模块2的DTD算法过于敏感,将一些背景噪声误判为近端语音,需要设置了一定的上限阈值T1和下限阈值T2,从而使得只有当达到一定的大小时,才能通过检测。而语音信号具有连续性,能量的增长是一个渐进的过程,所以当近端语音出现的初期,由于其能量太小,这个阶段我们无法检测出正确的通话状态,但是滤波器一直都处于工作状态中,当逐渐增长到能够被检测出为双端通话状态,滤波器已经偏离了实际的回声路径,从而使得以后的回声消除效果很差、滤波器甚至发散。
为了解决这一问题,本发明采用滤波器系数缓存装置21,基本原理是:当自适应滤波模块3收敛较好的时候,将其系数存入一个滤波器系数缓存装置21中。当检测到双端通话的时候,则丢弃自适应滤波模块3此时的系数,因为这些系数可能会导致滤波器发散,并用滤波器系数缓存装置21中保存的系数来重置自适应滤波模块3,前提是滤波器系数缓存装置21中的系数也需要持续更新,从而保证算法的自适应性,随时跟踪回声路径的变化,示意图如图5所示。
在不是双端通话状态时,信号处理模块(5)输出的误差信号
(8)k=k+1,跳转步骤(2)。
本发明提出的基于双检测统计量的双端检测模块2的DTD算法能够对双端通话的出现与消失做出准确快速的判断,同时结合滤波器系数缓存装置21系数缓存机制,当检测到双端通话的时候能够从滤波器系数缓存装置21中取出之前使自适应滤波模块3收敛的系数,从而避免了自适应滤波模块3的发散,所以当双端通话过程结束后,自适应滤波模块3也能够继续保持良好的回声消除效果,保证了系统的鲁棒性。
以上所述仅为本发明的较佳实施方案,凡在本发明的精神和原则范围内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (9)

1.一种基于双统计量的改进型双端检测装置,其特征在于,包括麦克风(1)、双端检测模块(2)、自适应滤波模块(3)、回声估计回路模块(4)以及信号处理模块(5),
所述的麦克风(1),用于接收近端语音信号;
所述的双端检测模块(2),用于接收麦克风(1)的输出信号及远端的语音信号后进行处理;
所述的自适应滤波模块(3),用于接收双端检测模块(2)的处理输出信号及误差信号后进行处理;
所述的回声估计回路模块(4),用于接收自适应滤波模块(3)的处理输出信号及远端的语音信号后进行处理;
所述的信号处理模块(5),用于将接收到的麦克风(1)的输出信号与回声估计回路模块(4)处理输出信号相减获得误差信号;
所述的双端检测模块(2)信号输入端分别与麦克风(1)的信号输出端及远端语音信号输出端连接,所述双端检测模块(2)信号输出端分别与自适应滤波模块(3)的信号输入端及信号处理模块(5)的输出端连接,所述双端检测模块(2)连接回声估计回路模块(4),所述的回声估计回路模块(4)的输入端连接远端语音信号输出端。
2.根据权利要求1所述的一种基于双统计量的改进型双端检测装置,其特征在于,还包括与远端语音信号输出端连接的扬声器(6),所述扬声器(6)的信号输出端经过一回声路径模块与麦克风(1)的信号输出端连接。
3.根据权利要求1所述的一种基于双统计量的改进型双端检测装置,其特征在于,所述的双端检测模块(2)中设有滤波器系数缓存装置(21)。
4.根据权利要求1所述的一种基于双统计量的改进型双端检测装置的检测方法,其特征在于,包括以下检测步骤:
(1)初始化各种变量;
(2)计算用于双端检测模块(2)检测算法的检测统计量;
(3)按照NLMS算法对自适应滤波模块(3)进行更新;
(4)计算自适应滤波模块(3)的滤波结果;
(5)每次选择n个语音样本点进行操作,若k不等于n的整数倍时跳转至步骤(8);
(6)双端检测模块(2)根据所选择的n个语音样本点的误差信号e(n)和麦克风(1)输出信号y(n)构建统计量ξ3,由统计量ξ3与阈值T比较判断自适应滤波模块(3)收敛效果;
(7)双端检测模块(2)根据麦克风(1)输出信号y(n)进行检测计算,并判断是否为双端通话状态,若是双端通话状态,则将滤波器系数缓存装置(21)中的系数取出替代当前自适应滤波模块(3)的工作系数,同时自适应滤波模块(3)在一定时间内停止更新;若不是双端通话状态,双端检测模块(2)和自适应滤波模块(3)正常工作,从信号处理模块(5)输出误差信号;
(8)k=k+1,跳转步骤(2)。
5.根据权利要求4所述的一种基于双统计量的改进型双端检测装置的检测方法,其特征在于,在步骤(1)中,初始化各种变量时,包括将变量k设为1,将变量kpeak、ξpeak、t0置零;
其中,k为位置记录变量,kpeak为记录出现峰值位置的变量,ξpeak为检测统计量ξ1的峰值,t0为峰值最多维持的有效时间。
6.根据权利要求4所述的一种基于双统计量的改进型双端检测装置的检测方法,其特征在于,在步骤(2)中,所述的检测统计量包括检测统计量ξ1和检测统计量ξ2,所述检测统计量ξ1的计算公式为:
其中,h为回声路径,h^(n)为回声估计路径,Rxx为远端语音信号x(n)的自相关矩阵,是近端语音信号的能量;
所述自相关矩阵Rxx的计算公式为:
Rxx=E[x(n)xT(n)];
所述检测统计量ξ2的计算公式为:
其中,h为回声路径。
7.根据权利要求4所述的一种基于双统计量的改进型双端检测装置的检测方法,其特征在于,在步骤(6)中,所述检测统计量ξ3的计算公式为:
其中,
ke(n)=λke(n-1)+(1-λ)|e(n)|;
ky(n)=λky(n-1)+(1-λ)|y(n)|;
其中,λ为指数加权因子。
8.根据权利要求6所述的一种基于双统计量的改进型双端检测装置的检测方法,其特征在于,在步骤(7)中,双端检测模块(2)根据麦克风(1)输出信号y(n)进行检测计算时,先将检测统计量ξ1与上限阈值T1作比较,若ξ1≥T1时,判定v(n)存在,无需计算ξ2;若是ξ1≤T1,则计算ξ2,当满足ξ2≥T2,判定v(n)存在,否则判定v(n)不存在。
9.根据权利要求4所述的一种基于双统计量的改进型双端检测装置的检测方法,其特征在于,在步骤(7)中,在不是双端通话状态时,信号处理模块(5)输出的误差信号
CN201711434761.8A 2017-12-26 2017-12-26 一种基于双统计量的改进型双端检测装置及检测方法 Active CN108134863B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711434761.8A CN108134863B (zh) 2017-12-26 2017-12-26 一种基于双统计量的改进型双端检测装置及检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711434761.8A CN108134863B (zh) 2017-12-26 2017-12-26 一种基于双统计量的改进型双端检测装置及检测方法

Publications (2)

Publication Number Publication Date
CN108134863A true CN108134863A (zh) 2018-06-08
CN108134863B CN108134863B (zh) 2020-06-19

Family

ID=62392744

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711434761.8A Active CN108134863B (zh) 2017-12-26 2017-12-26 一种基于双统计量的改进型双端检测装置及检测方法

Country Status (1)

Country Link
CN (1) CN108134863B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109348072A (zh) * 2018-08-30 2019-02-15 湖北工业大学 一种应用于回声抵消系统的双端通话检测方法
CN109871122A (zh) * 2019-01-18 2019-06-11 深圳大学 一种智能电子设备的水下操控系统及其操控方法
CN109994104A (zh) * 2019-01-14 2019-07-09 珠海慧联科技有限公司 一种自适应通话音量控制方法及装置
CN110971769A (zh) * 2019-11-19 2020-04-07 百度在线网络技术(北京)有限公司 通话信号的处理方法、装置、电子设备及存储介质
CN110995951A (zh) * 2019-12-13 2020-04-10 展讯通信(上海)有限公司 基于双端发声检测的回声消除方法、装置及系统
CN111131645A (zh) * 2019-12-24 2020-05-08 河南华启思创智能科技有限公司 改进型的nlms消回声算法
CN111277718A (zh) * 2020-01-21 2020-06-12 上海推乐信息技术服务有限公司 一种回声消除系统及其方法
CN114650238A (zh) * 2022-03-03 2022-06-21 随锐科技集团股份有限公司 用于检测通话状态的方法、装置、设备及可读存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1917038A (zh) * 2005-08-19 2007-02-21 北京信威通信技术股份有限公司 一种在scdma手机中识别并消除远端语音产生的回声的方法
CN101106405A (zh) * 2006-07-12 2008-01-16 北京大学深圳研究生院 回声消除器、回声消除方法及其双端通话检测系统
US20110181452A1 (en) * 2010-01-28 2011-07-28 Dsp Group, Ltd. Usage of Speaker Microphone for Sound Enhancement
CN102300014A (zh) * 2011-09-09 2011-12-28 南京大学 一种适用于有噪声环境下的声回声抵消系统双端说话检测方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1917038A (zh) * 2005-08-19 2007-02-21 北京信威通信技术股份有限公司 一种在scdma手机中识别并消除远端语音产生的回声的方法
CN101106405A (zh) * 2006-07-12 2008-01-16 北京大学深圳研究生院 回声消除器、回声消除方法及其双端通话检测系统
US20110181452A1 (en) * 2010-01-28 2011-07-28 Dsp Group, Ltd. Usage of Speaker Microphone for Sound Enhancement
CN102300014A (zh) * 2011-09-09 2011-12-28 南京大学 一种适用于有噪声环境下的声回声抵消系统双端说话检测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
谢鹏,刘如: "子带仿射投影及子带双端检测算法的回声消除系统", 《通信技术》 *

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109348072A (zh) * 2018-08-30 2019-02-15 湖北工业大学 一种应用于回声抵消系统的双端通话检测方法
CN109348072B (zh) * 2018-08-30 2021-03-02 湖北工业大学 一种应用于回声抵消系统的双端通话检测方法
CN109994104A (zh) * 2019-01-14 2019-07-09 珠海慧联科技有限公司 一种自适应通话音量控制方法及装置
CN109994104B (zh) * 2019-01-14 2021-05-14 珠海慧联科技有限公司 一种自适应通话音量控制方法及装置
CN109871122A (zh) * 2019-01-18 2019-06-11 深圳大学 一种智能电子设备的水下操控系统及其操控方法
CN110971769A (zh) * 2019-11-19 2020-04-07 百度在线网络技术(北京)有限公司 通话信号的处理方法、装置、电子设备及存储介质
CN110971769B (zh) * 2019-11-19 2022-05-03 百度在线网络技术(北京)有限公司 通话信号的处理方法、装置、电子设备及存储介质
CN110995951A (zh) * 2019-12-13 2020-04-10 展讯通信(上海)有限公司 基于双端发声检测的回声消除方法、装置及系统
CN110995951B (zh) * 2019-12-13 2021-09-03 展讯通信(上海)有限公司 基于双端发声检测的回声消除方法、装置及系统
CN111131645B (zh) * 2019-12-24 2021-07-09 河南华启思创智能科技有限公司 改进型的nlms消回声算法
CN111131645A (zh) * 2019-12-24 2020-05-08 河南华启思创智能科技有限公司 改进型的nlms消回声算法
CN111277718A (zh) * 2020-01-21 2020-06-12 上海推乐信息技术服务有限公司 一种回声消除系统及其方法
CN114650238A (zh) * 2022-03-03 2022-06-21 随锐科技集团股份有限公司 用于检测通话状态的方法、装置、设备及可读存储介质

Also Published As

Publication number Publication date
CN108134863B (zh) 2020-06-19

Similar Documents

Publication Publication Date Title
CN108134863B (zh) 一种基于双统计量的改进型双端检测装置及检测方法
US11601554B2 (en) Detection of acoustic echo cancellation
US10250740B2 (en) Echo path change detector
EP0901267B1 (en) The detection of the speech activity of a source
US8014519B2 (en) Cross-correlation based echo canceller controllers
US6775653B1 (en) Method and apparatus for performing double-talk detection with an adaptive decision threshold
US10009478B2 (en) Nearend speech detector
US9544422B2 (en) Acoustic echo suppression
US11245788B2 (en) Acoustic echo cancellation based sub band domain active speaker detection for audio and video conferencing applications
CN110995951B (zh) 基于双端发声检测的回声消除方法、装置及系统
US10367949B2 (en) Echo canceller device and voice telecommunications device
US10009477B2 (en) Pure delay estimation
US8019075B2 (en) Hybrid echo canceller controllers
US8081753B2 (en) Hybrid echo canceller controllers
KR101083710B1 (ko) 적응 필터의 수렴을 이용한 음향 반향 제거 장치 및 방법
Hamidia et al. Double-talk detector based on speech feature extraction for acoustic echo cancellation
JP2010011265A (ja) エコーキャンセラ装置及びその方法
JP2006279191A (ja) エコーキャンセラ
KR100414911B1 (ko) 이동통신시스템에서 반향 제거장치 및 방법
JPH04127721A (ja) 音響エコーキャンセラ

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant