CN112292844B - 双端通话检测方法、双端通话检测装置以及回声消除系统 - Google Patents

双端通话检测方法、双端通话检测装置以及回声消除系统 Download PDF

Info

Publication number
CN112292844B
CN112292844B CN201980000966.6A CN201980000966A CN112292844B CN 112292844 B CN112292844 B CN 112292844B CN 201980000966 A CN201980000966 A CN 201980000966A CN 112292844 B CN112292844 B CN 112292844B
Authority
CN
China
Prior art keywords
voice signal
digital voice
end digital
far
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201980000966.6A
Other languages
English (en)
Other versions
CN112292844A (zh
Inventor
韩文凯
李国梁
王鑫山
郭红敬
朱虎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Goodix Technology Co Ltd
Original Assignee
Shenzhen Goodix Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Goodix Technology Co Ltd filed Critical Shenzhen Goodix Technology Co Ltd
Publication of CN112292844A publication Critical patent/CN112292844A/zh
Application granted granted Critical
Publication of CN112292844B publication Critical patent/CN112292844B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B3/00Line transmission systems
    • H04B3/02Details
    • H04B3/32Reducing cross-talk, e.g. by compensating
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/22Arrangements for supervision, monitoring or testing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M9/00Arrangements for interconnection not involving centralised switching
    • H04M9/08Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M9/00Arrangements for interconnection not involving centralised switching
    • H04M9/08Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic
    • H04M9/082Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic using echo cancellers

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Telephone Function (AREA)
  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)

Abstract

一种双端通话检测方法、双端通话检测装置以及回声消除系统,双端通话检测方法包括:根据远端数字语音信号与近端数字语音信号之间的能量比,以及所述近端数字语音信号与所述远端数字语音信号之间的频率相干值,判断所述近端数字语音信号中是否还存在近端说话者的数字语音信号。双端通话检测方法避免了漏检和误检情形,提高了双端通话检测的精度,当应用于回声消除领域的时候,较为彻底地消除了近端语音信号中的回声,提高了通话双方的通讯体验。

Description

双端通话检测方法、双端通话检测装置以及回声消除系统
技术领域
本申请实施例涉及信号处理技术领域,尤其涉及一种双端通话检测方法、双端通话检测装置以及回声消除系统。
背景技术
回声消除目前是业内一大难题,从回声产生的途径有来看,除了环境原因产生的回声比如在免提通信系统中,由于扬声器的声音反馈到麦克风导致了回声,还包括网络传输延时所带来的回声。另外,还包括远端声音经过一重或者多重反射以后产生的间接回声。从回声消除的影响因素来看,不仅和通信系统终端设备的外部环境有关,还和运行通信系统的主机性能以及网络状况密切相关。而对于外部环境来说,其具体可以包括:麦克风和扬声器之间的相对距离、相对方向,扬声器与扬声器之间的相对距离以及方向,房间大小和房间墙壁材质等等。
回声的存在会影响到语音的清晰度,因此通过声学回声消除(AEC,Acoustic EchoCancellation)来改善语音通信质量。回声消除算法(AEC)是使用一个自适应滤波器模拟回声路径,通过自适应算法不断调整滤波器的系数,使其冲击响应和真实回声路径相逼近。再结合远端语音信号和滤波器得到估计的回声信号。然后,从麦克风的输入信号中减去估计的回声信号,从而达到消除回声的目的。
但是,近端说话者语音信号的存在,会导致滤波器系数发散,从而影响回声消除的效果。因此,在现有技术的回声消除算法中必须要有双端通话检测(Double TalkDetection,DTD)。所谓双端通话是指麦克风采集的信号中既包括远端语音信号导致的回音,又包括近端说话者的语音信号。
现有双端通话检测方案中,通常存在漏检和误检情形,导致检测的精度较低,如果出现漏检由此导致后续的自适应滤波器系数发散;而如果出现误检,将单端通话(SingleTalk,ST)误当做双端通话(Double Talk,DT)处理,则会减缓甚至停止自适应滤波器系数的更新,由此最终导致回声消除算法输出的语音信号中存在较大的残留回声,影响通话双方的通讯体验。
发明内容
有鉴于此,本申请实施例所解决的技术问题之一在于提供一种双端通话检测方法、双端通话检测装置以及回声消除系统,用以克服现有技术中的上述缺陷。
本申请实施例提供一种双端通话检测方法,其包括:根据远端数字语音信号与近端数字语音信号之间的能量比,以及所述近端数字语音信号与所述远端数字语音信号之间的频率相干值,判断所述近端数字语音信号中是否还存在近端说话者的数字语音信号。
本申请实施例提供一种双端通话检测装置,其包括:双端通话检测器,所述双端通话检测器用于根据远端数字语音信号与近端数字语音信号之间的能量比,以及所述近端数字语音信号与所述远端数字语音信号之间的频率相干值,判断所述近端数字语音信号中是否还存在近端说话者的数字语音信号。
本申请实施例提供一种回声消除系统,其包括双端通话检测装置以及自适应滤波器,所述双端通话检测装置包括:双端通话检测器,所述双端通话检测器用于根据远端数字语音信号与近端数字语音信号之间的能量比,以及所述近端数字语音信号与所述远端数字语音信号之间的频率相干值,判断所述近端数字语音信号中是否还存在近端说话者的数字语音信号。
本申请实施例中,通过根据远端数字语音信号与近端数字语音信号之间的能量比,以及所述近端数字语音信号与所述远端数字语音信号之间的频率相干值,判断所述近端数字语音信号中是否还存在近端说话者的数字语音信号。由此可见,由于同时基于能量比和频率相干值,从而避免了漏检和误检情形,提高了双端通话检测的精度,当应用于回声消除领域的时候,较为彻底地消除了近端语音信号中的回声,提高了通话双方的通讯体验。
附图说明
后文将参照附图以示例性而非限制性的方式详细描述本申请实施例的一些具体实施例。附图中相同的附图标记标示了相同或类似的部件或部分。本领域技术人员应该理解,这些附图未必是按比例绘制的。附图中:
图1为本申请实施例一中应用回声消除系统的结构示意图;
图2为本申请实施例二中回声消除系统消除回声的工作流程示意图;
图3为本申请实施例三中双端通话检测方法的流程示意图;
图4为本申请实施例四中双端通话检测装置进行双端通话检测的流程示意图。
具体实施方式
实施本申请实施例的任一技术方案必不一定需要同时达到以上的所有优点。
下面结合本申请实施例附图进一步说明本申请实施例具体实现。
本申请实施例中,通过根据远端数字语音信号与近端数字语音信号之间的能量比,以及所述近端数字语音信号与所述远端数字语音信号之间的频率相干值,判断所述近端数字语音信号中是否还存在近端说话者的数字语音信号。由此可见,由于同时基于能量比和频率相干值,从而避免了漏检和误检情形,提高了双端通话检测的精度,当应用于回声消除领域的时候,较为彻底地消除了近端语音信号中的回声,提高了通话双方的通讯体验。另外,双端通话检测模块只与所述近端数字语音信号y(n)和远端数字语音信号x(n)有技术关系,而与自适应滤波器无关,因此,实际上本申请实施例的双端通话检测方案,并非仅仅局限于回声消除应用场景中,也可以应用于其他场景中。
图1为本申请实施例一中应用回声消除系统的结构示意图;如图1所示,回声消除系统100具体包括语音端点检测模块106、双端通话检测器108、自适应滤波器110,除此之外,该回声消除系统还可以包括:语音采集模块102、语音播放模块104、加法模块112,其中,语音采集模块102分别与语音端点检测模块106、双端通话检测器108、加法模块112通讯连接,语音播放模块104分别与语音端点检测模块106、自适应滤波器110通讯连接,语音端点检测模块106与双端通话检测器108通讯连接,双端通话检测器108分别与自适应滤波器110、加法模块112通讯连接。
其中,语音采集模块102用于采集近端模拟语音信号y(t),以生成所述近端数字语音信号y(n);本实施例中,语音采集模块具体可以为麦克风,其采集的近端模拟语音信号y(t)可能包括近端说话者的语音信号s(t),也可能包括语音播放模块104播放远端模拟语音信号而导致的回声模拟语音信号d(t)。
其中,语音播放模块104,用于播放接收到的远端数字语音信号x(n)对应的远端模拟语音信号;本实施例中,语音播放模块104可以具体为扬声器。
其中,语音端点检测模块106,用于检测近端数字语音信号y(n)中是否存在回声数字语音信号d(n);本实施例中,语音端点检测模块106又可以称之为语音端点检测器(VoiceActivity Detector,简称VAD)。
若所述近端数字语音信号y(n)中存在回声数字语音信号d(n),则所述双端通话检测器启动以根据远端数字语音信号x(n)与所述近端数字语音信号y(n)之间的能量比,以及所述近端数字语音信号y(n)与所述远端数字语音信号x(n)之间的频率相干值,判断所述近端数字语音信号y(n)中是否还存在近端说话者的数字语音信号s(n),以控制滤波器系数的更新;
自适应滤波器110,用于根据滤波器系数以及所述远端数字语音信号x(n)生成估计的回声数字语音信号
Figure BDA0002114456390000031
以消除所述近端数字语音信号y(n)中存在的回声数字语音信号d(n)。本实施例中,所述自适应滤波器110比如为多时延块频域自适应滤波器。
其中,加法模块112,用于通过从所述近端数字语音信号y(n)中减去估计的回声数字语音信号
Figure BDA0002114456390000032
得到所述误差数字语音信号e(n),以消除所述近端数字语音信号y(n)中存在的回声数字语音信号d(n)。本实施例中,加法模块112可以具体为加法器。所述估计的回声数字语音信号
Figure BDA0002114456390000033
越准确,即越接近实际的所述回声数字语音信号d(n),则语音的清晰度越高。
进一步地,本实施例中,所述语音端点检测模块106用于根据所述远端数字语音信号x(n)与所述近端数字语音信号y(n)对应的功率检测所述近端数字语音信号y(n)中是否存在回声数字语音信号d(n)。比如若所述近端数字语音信号y(n)和远端数字语音信号x(n)的功率均大于对应的预设门限,则判定所述近端数字语音信号y(n)中存在回声数字语音信号d(n)。
进一步地,本实施例中,若所述近端数字语音信号y(n)中实际不存在回声数字语音信号d(n)时,双端通话检测器108不启动,使得所述滤波器系数按照历史步长更新。
本实施例中,由图1可见,双端通话检测模块只与所述近端数字语音信号y(n)和远端数字语音信号x(n)有技术关系,而与估计的回声数字语音信号
Figure BDA0002114456390000042
以及所述误差数字语音信号e(n)无关,因此,实现了双端通话检测模块和自适应滤波器的解耦。
以下结合回声消除方法的实施例对回声消除的工作原理进行示例性说明。
图2为本申请实施例二中回声消除系统消除回声的工作流程示意图;对应上述图1,其包括:
S202、语音播放模块播放接收到的远端模拟语音信号x(t);
本实施例中,近端模拟语音信号y(t)中包括的回声模拟语音信号d(t)具体由远端模拟语音信号x(t)引起。因此,对于语音采集模块102来说,其输入的近端模拟语音信号y(t)可能包括说话者的模拟语音信号s(t)以及回声模拟语音信号d(t)。此处需要说明的是,如果存在远端模拟语音信号x(t)则播放,否则,不播放。
S204、语音采集模块采集近端模拟语音信号y(t),以生成所述近端数字语音信号y(n);
S206、语音端点检测模块检测所述近端数字语音信号y(n)中是否存在回声数字语音信号d(n);
本实施例中,如前所述,若语音端点检测模块106为语音端点检测器VAD,则具体可以通过短时能量法、时域平均过零率法和短时相关性法等来检测远端数字语音信号x(n)和近端数字语音信号y(n),进而判断是否存在回声数字语音信号d(n)。进一步地,如果采取短时能量法,则所述语音端点检测模块可以根据所述远端数字语音信号x(n)与所述近端数字语音信号y(n)对应的功率检测所述近端数字语音信号y(n)中是否存在回声数字语音信号d(n)。比如若所述近端数字语音信号y(n)和远端数字语音信号x(n)的功率均大于对应的预设门限,则判定所述近端数字语音信号y(n)中存在回声数字语音信号d(n),由于回声数字语音信号d(n)是因远端数字语音信号x(n)而产生,因此,可以理解为当存在远端数字语音信号x(n)时,也即存在回声数字语音信号d(n),更为直观的请参见如下公式(1)。
Figure BDA0002114456390000041
上述公式(1)中,VAD表示语音端点检测模块的输出信号,该输出信号VAD的值为1,即表示所述近端数字语音信号y(n)中存在回声数字语音信号d(n),否则在其他情形下,该输出信号VAD的值为0,即表示所述近端数字语音信号y(n)中实际不存在回声数字语音信号d(n)。
S208、若所述近端数字语音信号y(n)中存在回声数字语音信号d(n)时则双端通话检测器启动,以判断所述近端数字语音信号y(n)中是否还存在近端说话者的数字语音信号s(n)以控制滤波器系数的更新;
本实施例中,所述双端通话检测器进一步用于所述根据远端数字语音信号x(n)与所述近端数字语音信号y(n)之间的能量比,以及所述近端数字语音信号y(n)与所述远端数字语音信号x(n)之间的频率相干值,判断所述近端数字语音信号y(n)中是否还存在近端说话者的数字语音信号s(n)。
本实施例中,如前所述,若所述近端数字语音信号y(n)中实际不存在回声数字语音信号d(n)时双端通话检测器不启动,使得所述滤波器系数按照历史步长更新滤波器系数,比如当以帧为单位进行回声消除时,则此时可以按照上一帧近端数字语音信号的更新步长更新滤波器系数;若所述近端数字语音信号y(n)中存在回声数字语音信号d(n)时双端通话检测器启动以判断所述近端数字语音信号y(n)中是否还存在近端说话者的数字语音信号s(n)。
具体地,本实施例中,若所述近端数字语音信号y(n)中同时存在近端说话者的数字语音信号s(n)和所述存在的回声数字语音信号d(n),则所述滤波器系数的更新步长减小,控制滤波器系数更新变慢,或者直接停止滤波器系数的更新,此处之所以要使滤波器系数更新变慢甚至停止更新,主要考虑到近端说话者的数字语音信号s(n)的存在会导致滤波器系数发散,无法生成准确地估计的回声数字语音信号
Figure BDA0002114456390000051
从而影响回声消除的有效性;若所述近端数字语音信号y(n)中不存在近端说话者的数字语音信号s(n)而只存在所述存在的回声数字语音信号d(n),则更新步长增加以更新滤波器系数。
此处,如前所述,可以在双端通话检测器和自适应滤波器之间单独增加一更新步长确定模块,具体用于计算更新步长,或者也可以由双端通话检测器来计算更新步长。
S210、自适应滤波器根据所述滤波器系数以及远端数字语音信号x(n)生成估计的回声数字语音信号;
本实施例中,如前所述,该自适应滤波器110为多时延块频域自适应滤波器,即其包括若干块自适应滤波器,比如自适应滤波器块的数量为D,从而实现更短的块延时、更快的收敛速度和更小的存储要求。
S212、加法模块从所述近端数字语音信号y(n)中减去估计的回声数字语音信号得到误差数字语音信号e(n)以消除所述近端数字语音信号y(n)中存在的回声数字语音信号d(n)。
在具体应用上述回声消除的方案时,对近端语音数字语音信号、远端数字语音信号、回声数字语音信号是以帧为单位进行处理的,即参照自适应滤波器的频点的数量M进行帧的划分,即分别把回声数字语音信号d(n)、近端说话者的数字语音信号s(n)以及近端数字语音信号y(n)中每M个数据点记为1帧,针对回声数字语音信号d(n)、近端说话者的数字语音信号s(n)以及近端数字语音信号y(n)中的每一帧应用上述回声消除方案。对应地,在进行双端通话检测时,实质上也是针对回声数字语音信号d(n)、近端说话者的数字语音信号s(n)以及近端数字语音信号y(n)中的每一帧进行处理。
如前所述,存在回声数字语音信号d(n)情形实际上可以具体区分为:
(1)不存在近端说话者的数字语音信号s(n)而只存在回声数字语音信号d(n),此种情形又称之单端通话(或又称之为single talk)
(2)既存在近端说话者的数字语音信号s(n)又存在回声数字语音信号d(n),此种情形又称之为双端通话(或又称之double talk);
下述实施例中,将着重以双端通话检测装置如何实现双端通话检测为例进行说明。
图3为本申请实施例三中双端通话检测方法的流程示意图;如图3所示,其包括:
S218A、获取远端数字语音信号;
本实施例中,步骤S218A具体为:获取远端数字语音信号x(n)中第i帧信号;
S218B、获取近端数字语音信号;
本实施例中,步骤S218B具体为:获取近端数字语音信号y(n)中第i帧信号;
本实施例中,具体通过模数转换器对远端模拟语音信号x(t)进行模数转换得到远端数字语音信号x(n)、对近端模拟语音信号y(t)进行模数转换得到近端数字语音信号y(n),并直接发送给双端通话检测装置。
如前所述,若参照自适应滤波器的频点的数量M进行帧的划分,即分别把回声数字语音信号d(n)、近端说话者的数字语音信号s(n)以及近端数字语音信号y(n)中每M个数据点记为1帧,在进行双端通话检测时,实质上也是针对近端说话者的数字语音信号s(n)以及近端数字语音信号y(n)中的每一帧信号进行处理,或者,换言之,是以帧为单位应用双端通话检测方案。
因此,在步骤S218A、S218B中,若当前时刻针对远端数字语音信号x(n)中第i帧信号,以及近端数字语音信号y(n)中第i帧信号的话,则可针对性地从模数转换器获取远端数字语音信号x(n)中第i帧信号,以及近端数字语音信号y(n)中第i帧信号应用双端通话检测方案即可,即通过后续步骤最终判断近端数字语音信号y(n)中第i帧信号是否还存在近端说话者的数字语音信号。
S228A、远端数字语音信号重叠存储
本实施例中,步骤S228A具体为:对获取到的远端数字语音信号x(n)中第i帧信号与第i-1帧信号进行时域重叠存储;
S228B、近端数字语音信号重叠存储
本实施例中,步骤S228B具体为:对获取到近端数字语音信号y(n)中第i帧信号与第i-1帧信号进行时域重叠存储;
本实施例中,当在频域上应用上述回声消除方案,尤其考虑到后续自适应滤波器为频域自适应滤波器的话,均可以是基于远端数字语音信号x(n)中每一帧信号对应频域信号,以及近端数字语音信号y(n)中每一帧信号对应频域信号,而在本实施例中,在后续步骤中,计算功率的处理也可以是在频域,通过计算功率,可以得到信号功率在频域的分布状况,获取信号功率随着频率的变化关系。为了减少资源消耗,在步骤S228A和S228B中对获取到的远端数字语音信号x(n)中第i帧信号与第i-1帧信号进行时域重叠存储,后续在步骤S238A、步骤S238B中将其转换到频域上得到对应频域信号。
S238A、近端数字语音信号的频域转换
本实施例中,步骤S238A具体为:频域转换模块将重叠存储的近端数字语音信号y(n)中第i帧信号与第i-1帧信号转换为对应频域信号;
S238B、远端数字语音信号的频域转换
本实施例中,步骤S238B具体为:所述频域转换模块将远端数字语音信号x(n)中第i帧信号与第i-1帧信号转换为对应频域信号;
本实施例中,通过离散傅里叶变换分别将近端数字语音信号y(n)中按照时域重叠存储的第i帧信号与第i-1帧信号转换为对应的频域信号,以及将远端数字语音信号x(n)中按照时域重叠存储的第i帧信号与第i-1帧信号转换为对应的频域信号。具体地,通过频域转换模块进行时域到频域转换的具体处理如公式(2)所示。
Figure BDA0002114456390000071
上述公式(2)中,i大于等于1:
远端数字语音信号x(n)中第i帧信号记为x(i)
x(i)=[x((i-1)M)…x(iM-1)]T
远端数字语音信号x(n)中第i-1帧信号记为x(i-1)
x(i-1)=[x(((i-1)-1)M)…x((i-1)M-1)]T
近端数字语音信号y(n)中第i帧信号记为y(i)
y(i)=[y((i-1)M)…y(iM-1)]T
近端数字语音信号y(n)中第i-1帧信号记为y(i-1)
y(i-1)=[y(((i-1)-1)M)...y((i-1)M-1)]T
F为离散傅里叶变换矩阵,其维度为2M×2M;
X(i)为远端数字语音信号x(n)中时域重叠存储的第i帧与第i-1帧对应频域信号;
Y(i)为近端数字语音信号y(n)中时域重叠存储的第i帧与第i-1帧对应频域信号。
由上述公式(2)可见,考虑到应用到回声消除的应用场景中,为了实现后续自适应滤波的快速卷积运算,上述采用了第i帧与第i-1帧信号进行时域重叠存储,从而降低资源消耗。
S248A、计算远端数字语音信号功率
本实施例中,步骤S248A具体为:功率计算模块计算远端数字语音信号x(n)中第i帧和第i-1帧信号重叠存储对应频域信号的功率;实际上,对于本领域普通技术人员来说,从整个技术方案上来看,此处的功率可以由功率谱得到,也可以以查表的方式获得频点对应的功率。
S248B、计算近端数字语音信号功率
本实施例中,步骤S248B具体为:所述功率计算模块计算近端数字语音信号y(n)中第i帧和第i-1帧信号重叠存储对应频域信号的功率;
S248C、计算远端数字语音信号与近端数字语音信号功率之间的关联功率;
本实施例中,步骤S248C具体为:所述功率计算模块计算远端数字语音信号x(n)中第i帧和第i-1帧信号重叠存储对应频域信号与近端数字语音信号y(n)中第i帧和第i-1帧信号重叠存储对应频域信号之间的关联功率;
本实施例中,具体通过功率计算模块执行上述步骤S248A、S248B、S248C,其详细计算步骤S248A、S248B、S248C中功率的处理详见下述公式(3)。
Figure BDA0002114456390000081
上述公式(3)中,i大于等于2:
远端数字语音信号x(n)中第i帧和第i-1帧信号重叠存储对应频域信号的功率记为
Figure BDA0002114456390000082
近端数字语音信号y(n)中第i帧和第i-1帧信号重叠存储对应频域信号的功率记为
Figure BDA0002114456390000083
远端数字语音信号x(n)中第i帧和第i-1帧信号重叠存储对应频域信号与近端数字语音信号y(n)中第i帧和第i-1帧信号重叠存储对应频域信号之间的关联功率记为
Figure BDA0002114456390000084
远端数字语音信号x(n)中第i-1帧和第i-2帧信号重叠存储对应频域信号的功率记为
Figure BDA0002114456390000085
近端数字语音信号y(n)中第i-1帧和第i-2帧信号重叠存储对应频域信号的功率记为
Figure BDA0002114456390000086
远端数字语音信号x(n)中第i-1帧和第i-2帧信号重叠存储与近端数字语音信号y(n)中第i-1帧和第i-2帧信号重叠存储对应频域信号之间的关联功率记为
Figure BDA0002114456390000087
λ为平滑参数,根据不同的应用场景选取不同的值,防止远端数字语音信号x(n)和近端数字语音信号y(n)中连续两帧信号之间的关联功率发生突变,对应平滑参数的大小根据不同的应用场景凭经验值设置。针对功率记为
Figure BDA0002114456390000091
功率记为
Figure BDA0002114456390000092
关联功率记为
Figure BDA0002114456390000093
分别设置的平滑参数又可以称之为第一平滑参数、第二平滑参数以第三平滑参数,这三个平滑参数值若完全相同,则统一称之为平滑参数。
Figure BDA0002114456390000094
表示矩阵元素乘积,“*”表示复数共轭。
具体地,比如,i=2时,上述公式(3)具体为:
Figure BDA0002114456390000095
由上述公式(3)可见,根据所述近端数字语音信号y(n)对应频域信号以及第一平滑参数计算所述近端数字语音信号y(n)对应的功率,以及根据所述远端数字语音信号x(n)对应频域信号以及第二平滑参数计算所述远端数字语音信号x(n)对应的功率。以及根据所述近端数字语音信号y(n)和所述远端数字语音信号x(n)以及第三平滑参数确定所述近端数字语音信号y(n)与所述远端数字语音信号x(n)之间的关联功率。
S258、回声检测
本实施例中,步骤S258具体为:所述语音端点检测模块根据远端数字语音信号x(n)中第i帧和第i-1帧信号重叠存储对应频域信号的功率,以及近端数字语音信号y(n)中第i帧和第i-1帧信号重叠存储对应频域信号的功率,检测所述近端数字语音信号y(n)中是否存在回声数字语音信号d(n);
若存在,则执行S268,否则跳转到步骤S218A、S218B,以分别获取远端数字语音信号x(n)中第i+1帧信号,以及获取近端数字语音信号y(n)中第i+1帧信号,并在S228A中对远端数字语音信号x(n)中第i+1帧信号与第i帧信号进行时域重叠存储,以及在S228B中对近端数字语音信号y(n)中第i+1帧信号与第i帧信号进行时域重叠存储;
本实施例中,如前所述,若基于能量法检测所述近端数字语音信号y(n)中是否存在回声数字语音信号d(n)的话,则远端数字语音信号x(n)中第i帧和第i-1帧信号重叠存储对应频域信号的功率,以及近端数字语音信号y(n)中第i帧和第i-1帧信号重叠存储对应频域信号的功率分别与对应的功率门限比较,若远端数字语音信号x(n)中第i帧和第i-1帧信号重叠存储对应频域信号的功率,以及近端数字语音信号y(n)中第i帧和第i-1帧信号重叠存储对应频域信号的功率分别均大于对应的功率门限,则判定所述近端数字语音信号y(n)中存在回声数字语音信号d(n)。
S268、双端通话检测
本实施例中,步骤S268具体为:双端通话检测器启动,以判断所述近端数字语音信号y(n)中是否还存在近端说话者的数字语音信号s(n)。
本实施例中,有关步骤S268的示例性技术描述详见下述图3。
图4为本申请实施例四中双端通话检测装置进行双端通话检测的流程示意图;如图4所示,其包括:
S268A’、计算能量比
本实施例中,步骤S268A’具体为:所述双端通话检测器中的能量比计算模块根据远端数字语音信号x(n)中第i帧和第i-1帧信号重叠存储对应频域信号的功率以及近端数字语音信号y(n)中第i帧和第i-1帧信号重叠存储对应频域信号的功率确定所述能量比;
本实施例中,具体采用如下公式(4)计算所述能量比:
Figure BDA0002114456390000102
公式(4)中,能量比记为
Figure BDA0002114456390000103
δ为能量比计算的控制因子,避免了公式(4)中
Figure BDA0002114456390000105
为0导致的分母无群大,一般情况下,δ的数值相对
Figure BDA0002114456390000104
较小。
由上述公式可见,所述能量比正比于所述远端数字语音信号x(n)第i帧和第i-1帧信号重叠存储对应频域信号的功率,反比于所述近端数字语音信号y(n)第i帧和第i-1帧信号重叠存储对应频域信号的对应的功率。
本实施例中,具体通过能量比计算模块来确定所述能量比,但是,实际上,也可以将确定所述能量比的技术处理集成到其他模块上,并非要特别增加一个能量比计算模块。
S268B’、确定预设频段
本实施例中,步骤S268B’具体为:所述双端通话检测器中的能量比计算模块根据所述近端说话者的数字语音信号s(n)的频率确定所述预设频段;
S268C’、初步筛选能量比
本实施例中,步骤S268C’具体为:所述能量比计算模块确定在预设频段内所述近端数字语音信号y(n)和所述远端数字语音信号x(n)的第i帧和第i-1帧信号重叠存储分别对应频域信号之间的能量比;
本实施例中,为了进一步避免漏检以及误检,根据所述近端说话者的数字语音信号s(n)的频率设定所述预设频段并从步骤S268A’计算得到的能量比中筛选出一部分,比如,人类的数字语音信号的频率段通常在300Hz~3400Hz,因此,通过下述公式(5)进行能量比的筛选。
Figure BDA0002114456390000101
公式(5)中,fL表示频率的下限,fH表示频率的上限,fs为各数字语音信号采样频率,对于所述近端数字语音信号y(n)和所述远端数字语音信号x(n)的第i帧信号来说,n0表示近端说话者的数字语音信号s(n)的频率的下限在频域上对应的频点,n1表示近端说话者的数字语音信号s(n)的频率的上限在频域上对应的频点,此处,需要说明的是,由于确定出上述频率的上限、下限在频域上分别对应的频点,由此,针对所述近端数字语音信号y(n)和所述远端数字语音信号x(n)的第i帧信号分别对应频域信号有多个,则对应得到多个能量比,上述频率的上限、下限在频域上分别对应的频点限定了按照频率筛选出来的能量比在所述多个能量比中的位置。
具体地,如果人类的数字语音信号的频率段通常在300Hz~3400Hz,则确定出300HZ为频率的下限,该频率的下限在频域的上存在对应的频点n0,确定出3400Hz为频率的上限,该频率的上限在频域的上存在对应的频点n1
S268D’、能量比的分位数处理
本实施例中,步骤S268D’具体为:所述能量比计算模块对预设频段内所述近端数字语音信号y(n)和所述远端数字语音信号x(n)分别对应频域信号之间的能量比进行分位数处理;
本实施例中,为了防止语音通话中刚开始以及即将结束时语音信号比较弱导致的漏检以及误检,进行分位数处理,对步骤根据频率筛选出来的能量比由小到大进行排序再进一步从中筛选出一部分能量比,以基于进一步筛选出来的能量比进行双端通话的检测。具体地,可以采用四分位数处理,则第一分位数为0.25,第二分位数为0.5,第三分位数为0.75,第四分位数为1,则选取第二分位数为0.5和第三分位数为0.75之间的能量比,即得到分位数处理后的能量比,或者又称之为分位数处理后的判决量,作为有效的能量比,详细计算方式如公式(6)所示。
Figure BDA0002114456390000111
公式(6)中,0.5和0.75分别表示第二分位数和第三分位数,nL表示分位数处理后的上述频率的下限在频域上对应的频点,nH表示分位数处理后的上述频率的上限在频域上对应的频点,分位数处理后的上述频率的上限、下限分别在频域上对应频点限定了在经过分位处理后筛选了部分能量比,记为
Figure BDA0002114456390000114
此处,上述四分位数处理时也可以从小到大排序。另外,也可以选择第一分位和第三分位之间的能量比。实际上,对于具体选择那两个或超过两个分位数之间的能量比,根据应用场景的需求灵活确定。
在其他实施例中,也可以采用其他具体的分位数处理,详细不再赘述。S268E’、计算能量比的平均值;
本实施例中,步骤S268E’具体为:所述能量比计算模块确定所述分位数处理后的所述能量比的平均值;
进一步地,本实施例中,为了增加双端通话检测准确性,通过步骤S268’计算所述分位数处理后的所述能量比的平均值,详细如下述公式(7)。
Figure BDA0002114456390000112
上述公式(7)中,能量比的平均值记为
Figure BDA0002114456390000113
nH-nL+1表示所述分位数处理后的所述能量比所处的频点数,其他参数的含义请参见前述记载。
S268A”、计算频率相干值
本实施例中,步骤S268A”具体为:所述双端通话检测器中的相干计算模块根据所述近端数字语音信号y(n)和所述远端数字语音信号x(n)分别对应的功率,以及所述近端数字语音信号y(n)与所述远端数字语音信号x(n)之间的关联功率,确定所述近端数字语音信号y(n)与所述远端数字语音信号x(n)之间的频率相干值;
本实施例中,按照如下公式(8)计算步骤S 268A”中的频率相干值。
Figure BDA0002114456390000121
公式(8)中,
Figure BDA0002114456390000123
表示矩阵元素乘积,“*”表示复数共轭。
由上述公式(8)可见,所述频率相干值正比于所述近端数字语音信号y(n)与所述远端数字语音信号x(n)中第i帧和第i-1帧信号重叠存储对应频域信号之间的关联功率,且反比于所述近端数字语音信号y(n)和所述远端数字语音信号x(n)中第i帧和第i-1帧信号重叠存储对应频域信号分别对应的功率。
当然,其他实施例中,如果只是粗略估计,所述双端通话检测器进一步用于根据所述近端数字语音信号y(n)和所述远端数字语音信号x(n)分别对应的功率确定所述近端数字语音信号y(n)以及远端数字语音信号x(n)之间的频率相干值。
S268B”、确定预设频段
本实施例中,步骤S268B”具体为:所述双端通话检测器进一步用于根据所述近端说话者的数字语音信号s(n)的频率确定所述预设频段;
S268C”、初步筛选频率相干值
本实施例中,步骤S268C”具体为:确定在所述预设频段内所述近端数字语音信号y(n)与所述远端数字语音信号x(n)的第i帧与第i-1帧信号重叠存储分别对应频域信号之间的频率相干值;
本实施例中,有关频率的相关描述请参见针对上述步骤SS268B’、S268C’的说明,得到频率的下限在频域上对应的频点、频率的上限在频域上对应的频点。此处,需要说明的是,由于确定出频率的上限、下限在频域上分别对应的频点,由此,针对所述近端数字语音信号y(n)和所述远端数字语音信号x(n)的第i帧与第i-1帧信号重叠存储分别对应频域信号有多个,则对应得到多个频率相干值,频率的上限、下限在频域上分别对应的频点限定了按照频率筛选出来的频率相干值在所述多个频率相干值中的位置。
S268D”、频率相干值的分位数处理
本实施例中,步骤S268D”具体为:对预设频段内所述近端数字语音信号y(n)和所述远端数字语音信号x(n)分别对应频域信号之间的频率相干值进行分位数处理;
此处,与上述步骤S268’类似,分位数处理的目的同样是进一步避免漏检以及误检,具体的分位数处理方式也为四分位数处理,从而得到频率的下限在频域上对应的频点nL,分位数处理后的频率的下限在频域上对应频点nH。分位数处理后,分位数处理后的频率的上限、下限分别在频域上对应频点限定了在经过分位处理后筛选了部分频率相干值,记为
Figure BDA0002114456390000122
S268E”、计算频率相干值的平均值;
本实施例中,步骤S268E”具体为:确定所述分位数处理后的所述频率相干值的平均值;
本实施例中,具体计算所述分位数处理后的所述频率相干值的平均值如公式(9)所示。
Figure BDA0002114456390000131
所述分位数处理后的所述频率相干值的平均值记为
Figure BDA0002114456390000133
其他参数的含义请参见前述记载。
S268F、双端通话检测
本实施例中,步骤S268具体为:根据所述分位数处理后的所述能量比的平均值与能量门限的比对结果,以及所述分位数处理后的所述频率相干值的平均值与相干值门限比对的结果,判断所述近端数字语音信号y(n)的第i帧信号中是否存在所述近端说话者的数字语音信号s(n);
若所述分位数处理后的所述能量比的平均值大于所述能量门限,或者,若所述分位数处理后的所述能量比的平均值小于所述能量门限且所述分位数处理后的所述频率相干值的平均值小于所述相干值门限,执行步骤S268G,否则执行S268H。
本实施例中,具体通过如下公式(10)来判断是否存在所述近端说话者的数字语音信号。
Figure BDA0002114456390000132
公式(10)中,所述能量门限记为ρT,所述相干值门限记为cT,DTD为代表判断结果的变量,若所述分位数处理后的所述能量比的平均值大于所述能量门限,或者,若所述分位数处理后的所述能量比的平均值小于所述能量门限且所述分位数处理后的所述频率相干值的平均值小于所述相干值门限,则DTD的值为1;除此之外其他情形时,DTD的值为0。
S268G、为双端通话;
本实施例中,步骤S268G具体为:所述双端通话检测器判定所述近端数字语音信号y(n)中还存在所述近端说话者的数字语音信号s(n);
如前所述,若DTD的值为1,则判定所述近端数字语音信号y(n)中还存在所述近端说话者的数字语音信号s(n),即为双端通话状态;
S268H、为单端通话;
本实施例中,步骤S268H具体为:所述双端通话检测器判定所述近端数字语音信号y(n)中不存在所述近端说话者的数字语音信号s(n);
如前所述,若DTD的值为0,则判定所述近端数字语音信号y(n)中不存在所述近端说话者的数字语音信号s(n),即为单端通话状态。
S268I、输出判定结果
本实施例中,步骤S268I中的判定结果或为双端通话状态或为单端通话状态,根据不同的判定结果控制滤波器系数的更新,以使得所述自适应滤波器根据所述滤波器系数以及所述远端数字语音信号x(n)生成估计的回声数字语音信号
Figure BDA0002114456390000141
以消除所述近端数字语音信号y(n)中存在的回声数字语音信号d(n)。
需要说明的是,本实施例中,根据所述近端说话者的数字语音信号s(n)的频率确定所述预设频段,但是此处并非唯一性限定,实际上,根据双端通话检测方案的应用场景,可以根据场景的需求确定所述预设频段,进而进行能量比和频率相干值的筛选。
另外,本实施例中,具体采用分位数处理法从根据所述预设频段筛选出的多个能量比和频率相干值中进一步进行能量比和频率相干值的筛选,但是此处并非唯一性限定,实际上,根据双端通话检测方案的应用场景,可以根据场景的需求从根据所述预设频段筛选出的多个能量比和频率相干值中进一步进行能量比和频率相干值的筛选。
再者,本实施例中,具体判断所述近端数字语音信号y(n)中是否还存在近端说话者的数字语音信号s(n)的方法,并非唯一性限定,实际上,根据双端通话检测方案的应用场景,可以根据场景的需求设定更加精确的判断方式。
上述实施例中,主要以在频域实现为例进行说明的。但是,在上述实施例的启发下,本领域普通技术人员也可以在不偏离本申请思想的前提下,在时域上实现。
另外,上述实施例中记载的具体公式,仅仅是示例并非唯一性限定,在不偏离本申请思想的前提下,本领域普通技术人员可对其进行变形。
另外,在上述实施例中,是以需要确定所述远端数字语音信号与所述近端数字语音信号之间的所述能量比,以及所述近端数字语音信号与所述远端数字语音信号之间的所述频率相干值为例进行说明。但是,对于本领域普通技术人员来说,如果在该方案执行时,已经确定好了所述能量比和所述频率相干值的话,则可以直接省略确定所述能量比和所述频率相干值。且如果需要确定所述能量比和所述频率相干值,上述实施例以根据远端数字语音信号与近端数字语音信号对应的功率来分别确定所述远端数字语音信号与所述近端数字语音信号之间的所述能量比,以及所述近端数字语音信号与所述远端数字语音信号之间的所述频率相干值的方式为例。该功率具体可以从功率谱中可获得为例进行说明。实际上,对于本领域普通技术人员来说,从整个技术方案上来看,从功率谱去获得所述功率仅仅是举例,可替代地,也可以以查表的方式获得功率。
本申请实施例的上述技术方案可以具体用的各种类型的电子设备上,该电子设备以多种形式存在,包括但不限于:
(1)移动通信设备:这类设备的特点是具备移动通信功能,并且以提供话音、数据通信为主要目标。这类终端包括:智能手机(例如iPhone)、多媒体手机、功能性手机,以及低端手机等。
(2)超移动个人计算机设备:这类设备属于个人计算机的范畴,有计算和处理功能,一般也具备移动上网特性。这类终端包括:PDA、MID和UMPC设备等,例如iPad。
(3)便携式娱乐设备:这类设备可以显示和播放多媒体内容。该类设备包括:音频、视频播放器(例如iPod),掌上游戏机,电子书,以及智能玩具和便携式车载导航设备。
(4)其他具有数据交互功能的电子装置。
至此,已经对本主题的特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作可以按照不同的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序,以实现期望的结果。在某些实施方式中,多任务处理和并行处理可以是有利的。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定事务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行事务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
以上所述仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (37)

1.一种双端通话检测方法,其特征在于,包括:
根据远端数字语音信号与近端数字语音信号之间的能量比的平均值与能量门限的比对结果,以及所述近端数字语音信号与所述远端数字语音信号之间的频率相干值的平均值与相干值门限的比对结果,判断所述近端数字语音信号中是否还存在近端说话者的数字语音信号;
若所述能量比的平均值大于所述能量门限,或者,若所述能量比的平均值小于所述能量门限且所述频率相干值的平均值小于所述相干值门限,则判定所述近端数字语音信号中存在所述近端说话者的数字语音信号;否则,判定所述近端数字语音信号中不存在所述近端说话者的数字语音信号。
2.根据权利要求1所述的双端通话检测方法,其特征在于,还包括:确定所述远端数字语音信号与所述近端数字语音信号之间的所述能量比,以及所述近端数字语音信号与所述远端数字语音信号之间的所述频率相干值。
3.根据权利要求2所述的双端通话检测方法,其特征在于,确定所述远端数字语音信号与所述近端数字语音信号之间的所述能量比,以及所述近端数字语音信号与所述远端数字语音信号之间的所述频率相干值,包括:根据远端数字语音信号与近端数字语音信号对应的功率分别确定所述远端数字语音信号与所述近端数字语音信号之间的所述能量比,以及所述近端数字语音信号与所述远端数字语音信号之间的所述频率相干值。
4.根据权利要求1所述的双端通话检测方法,其特征在于,还包括:根据所述远端数字语音信号与所述近端数字语音信号对应的功率检测所述近端数字语音信号中是否存在回声数字语音信号,若存在,则判断所述近端数字语音信号中是否还存在近端说话者的数字语音信号。
5.根据权利要求1所述的双端通话检测方法,其特征在于,所述能量比正比于所述远端数字语音信号第i帧和第i-1帧信号重叠存储对应频域信号的功率,反比于所述近端数字语音信号第i帧和第i-1帧信号重叠存储对应频域信号的对应的功率。
6.根据权利要求3所述的双端通话检测方法,其特征在于,所述根据远端数字语音信号与近端数字语音信号对应的功率确定所述近端数字语音信号与所述远端数字语音信号之间的所述频率相干值,包括:根据所述近端数字语音信号和所述远端数字语音信号分别对应的功率,以及所述近端数字语音信号与所述远端数字语音信号之间的关联功率,确定所述近端数字语音信号与所述远端数字语音信号之间的所述频率相干值。
7.根据权利要求6所述的双端通话检测方法,其特征在于,所述频率相干值正比于所述近端数字语音信号与所述远端数字语音信号中第i帧和第i-1帧信号重叠存储对应频域信号之间的关联功率,且反比于所述近端数字语音信号和所述远端数字语音信号中第i帧和第i-1帧信号重叠存储对应频域信号分别对应的功率。
8.根据权利要求1所述的双端通话检测方法,其特征在于,还包括:根据所述近端数字语音信号对应频域信号计算所述近端数字语音信号对应的功率,以及根据所述远端数字语音信号对应频域信号计算所述远端数字语音信号对应的功率。
9.根据权利要求8所述的双端通话检测方法,其特征在于,所述据所述近端数字语音信号对应频域信号计算所述近端数字语音信号对应的功率,包括:根据所述近端数字语音信号对应频域信号以及第一平滑参数计算所述近端数字语音信号对应的功率;根据所述远端数字语音信号对应频域信号计算所述远端数字语音信号对应的功率,包括:根据所述远端数字语音信号对应频域信号以及第二平滑参数计算所述远端数字语音信号对应的功率。
10.根据权利要求6所述的双端通话检测方法,其特征在于,还包括:根据所述近端数字语音信号和所述远端数字语音信号以及第三平滑参数确定所述近端数字语音信号与所述远端数字语音信号之间的所述关联功率。
11.根据权利要求1-10任一项所述的双端通话检测方法,其特征在于,根据所述远端数字语音信号与所述近端数字语音信号之间的能量比的平均值与能量门限的比对结果,以及所述近端数字语音信号与所述远端数字语音信号之间的频率相干值的平均值与相干值门限的比对结果,判断所述近端数字语音信号中是否还存在近端说话者的数字语音信号,包括:根据在预设频段内的所述近端数字语音信号和所述远端数字语音信号之间的所述能量比,以及在所述预设频段内的所述近端数字语音信号与所述远端数字语音信号之间的所述频率相干值,判断所述近端数字语音信号中是否还存在近端说话者的数字语音信号。
12.根据权利要求11所述的双端通话检测方法,其特征在于,还包括:根据所述近端说话者的数字语音信号的频率确定所述预设频段。
13.根据权利要求11所述的双端通话检测方法,其特征在于,11还包括:对预设频段内所述近端数字语音信号和所述远端数字语音信号之间的所述能量比和所述频率相干值进行分位数处理,以根据所述分位数处理后的所述能量比,以及所述分位数处理后的所述频率相干值判断所述近端数字语音信号中是否存在所述近端说话者的数字语音信号。
14.根据权利要求13所述的双端通话检测方法,其特征在于,还包括:确定所述分位数处理后的所述能量比的平均值,以及所述分位数处理后的所述频率相干值的平均值,以根据所述分位数处理后的所述能量比的平均值,以及所述分位数处理后的所述频率相干值的平均值判断所述近端数字语音信号中是否存在所述近端说话者的数字语音信号。
15.根据权利要求14所述的双端通话检测方法,其特征在于,所述根据所述分位数处理后的所述能量比的平均值,以及所述分位数处理后的所述频率相干值的平均值判断所述近端数字语音信号中是否存在所述近端说话者的数字语音信号,包括:根据所述分位数处理后的所述能量比的平均值与能量门限的比对结果,以及所述分位数处理后的所述频率相干值的平均值与相干值门限比对的结果,判断所述近端数字语音信号中是否存在所述近端说话者的数字语音信号。
16.根据权利要求15所述的双端通话检测方法,其特征在于,若所述分位数处理后的所述能量比的平均值小于所述能量门限且所述分位数处理后的所述频率相干值的平均值小于所述相干值门限,则判定所述近端数字语音信号中存在所述近端说话者的数字语音信号;否则,判定所述近端数字语音信号中不存在所述近端说话者的数字语音信号。
17.一种双端通话检测装置,其特征在于,包括:双端通话检测器,所述双端通话检测器用于根据远端数字语音信号与近端数字语音信号之间的能量比的平均值与能量门限的比对结果,以及所述近端数字语音信号与所述远端数字语音信号之间的频率相干值的平均值与相干值门限的比对结果,判断所述近端数字语音信号中是否还存在近端说话者的数字语音信号;
若所述能量比的平均值大于所述能量门限,或者,若所述能量比的平均值小于所述能量门限且所述频率相干值的平均值小于所述相干值门限,则判定所述近端数字语音信号中存在所述近端说话者的数字语音信号;否则,判定所述近端数字语音信号中不存在所述近端说话者的数字语音信号。
18.根据权利要求17所述的双端通话检测装置,其特征在于,所述双端通话检测器进一步用于确定所述远端数字语音信号与所述近端数字语音信号之间的所述能量比,以及所述近端数字语音信号与所述远端数字语音信号之间的所述频率相干值。
19.根据权利要求18所述的双端通话检测装置,其特征在于,所述双端通话检测器进一步用于根据所述远端数字语音信号与所述近端数字语音信号对应的功率分别确定所述远端数字语音信号与所述近端数字语音信号之间的所述能量比,以及所述近端数字语音信号与所述远端数字语音信号之间的所述频率相干值。
20.根据权利要求17所述的双端通话检测装置,其特征在于,还包括:语音端点检测模块,用于根据所述远端数字语音信号与所述近端数字语音信号对应的功率检测所述近端数字语音信号中是否存在回声数字语音信号,若存在,则所述双端通话检测器判断所述近端数字语音信号中是否还存在近端说话者的数字语音信号。
21.根据权利要求17所述的双端通话检测装置,其特征在于,所述双端通话检测器包括:能量比计算模块,用于根据所述远端数字语音信号与所述近端数字语音信号对应的功率确定所述能量比。
22.根据权利要求17所述的双端通话检测装置,其特征在于,所述能量比正比于所述远端数字语音信号第i帧和第i-1帧信号重叠存储对应频域信号的功率,反比于所述近端数字语音信号第i帧和第i-1帧信号重叠存储对应频域信号的对应的功率。
23.根据权利要求17所述的双端通话检测装置,其特征在于,所述双端通话检测器进一步用于根据所述近端数字语音信号和所述远端数字语音信号分别对应的功率,以及所述近端数字语音信号与所述远端数字语音信号之间的关联功率,确定所述近端数字语音信号与所述远端数字语音信号之间的所述频率相干值。
24.根据权利要求23所述的双端通话检测装置,其特征在于,所述双端通话检测器进一步用于根据所述近端数字语音信号和所述远端数字语音信号确定所述近端数字语音信号与所述远端数字语音信号之间的所述关联功率。
25.根据权利要求24所述的双端通话检测装置,其特征在于,所述频率相干值正比于所述近端数字语音信号与所述远端数字语音信号中第i帧和第i-1帧信号重叠存储对应频域信号之间的关联功率,且反比于所述近端数字语音信号和所述远端数字语音信号中第i帧和第i-1帧信号重叠存储对应频域信号分别对应的功率。
26.根据权利要求17所述的双端通话检测装置,其特征在于,所述双端通话检测器包括:相干计算模块,所述相干计算模块进一步用于确定所述近端数字语音信号与所述远端数字语音信号之间的所述频率相干值。
27.根据权利要求17所述的双端通话检测装置,其特征在于,还包括:功率计算模块,用于计算所述近端数字语音信号和所述远端数字语音信号分别对应的功率。
28.根据权利要求27所述的双端通话检测装置,其特征在于,所述功率计算模块进一步用于根据所述近端数字语音信号对应频域信号计算所述近端数字语音信号对应的功率,以及根据所述远端数字语音信号对应频域信号计算所述远端数字语音信号对应的功率。
29.根据权利要求28所述的双端通话检测装置,其特征在于,所述功率计算模块进一步用于根据所述近端数字语音信号对应频域信号以及第一平滑参数计算所述近端数字语音信号对应的功率,以及根据所述远端数字语音信号对应频域信号以及第二平滑参数计算所述远端数字语音信号对应的功率。
30.根据权利要求21所述的双端通话检测装置,其特征在于,还包括:功率计算模块,用于根据所述近端数字语音信号和所述远端数字语音信号以及第三平滑参数确定所述近端数字语音信号与所述远端数字语音信号之间的关联功率。
31.根据权利要求17-30任一项所述的双端通话检测装置,其特征在于,所述双端通话检测器进一步用于根据在预设频段内的所述近端数字语音信号和所述远端数字语音信号之间的所述能量比,以及在所述预设频段的所述近端数字语音信号与所述远端数字语音信号之间的所述频率相干值,判断所述近端数字语音信号中是否还存在近端说话者的数字语音信号。
32.根据权利要求31所述的双端通话检测装置,其特征在于,所述双端通话检测器进一步用于根据所述近端说话者的数字语音信号的频率确定所述预设频段。
33.根据权利要求31所述的双端通话检测装置,其特征在于,所述双端通话检测器进一步用于对预设频段内所述近端数字语音信号和所述远端数字语音信号的所述能量比和所述频率相干值进行分位数处理,以根据所述分位数处理后的所述能量比,以及所述分位数处理后的所述频率相干值判断所述近端数字语音信号中是否存在所述近端说话者的数字语音信号。
34.根据权利要求33所述的双端通话检测装置,其特征在于,所述双端通话检测器进一步用于确定所述分位数处理后的所述能量比的平均值,以及所述分位数处理后的所述频率相干值的平均值,以根据所述分位数处理后的所述能量比的平均值,以及所述分位数处理后的所述频率相干值的平均值判断所述近端数字语音信号中是否存在所述近端说话者的数字语音信号。
35.根据权利要求34所述的双端通话检测装置,其特征在于,所述双端通话检测器进一步用于根据所述分位数处理后的所述能量比的平均值与能量门限的比对结果,以及所述分位数处理后的所述频率相干值的平均值与相干值门限比对的结果,判断所述近端数字语音信号中是否存在所述近端说话者的数字语音信号。
36.根据权利要求35所述的双端通话检测装置,其特征在于,若所述分位数处理后的所述能量比的平均值小于所述能量门限且所述分位数处理后的所述频率相干值的平均值小于所述相干值门限,则判定所述近端数字语音信号中存在所述近端说话者的数字语音信号;否则,判定所述近端数字语音信号中不存在所述近端说话者的数字语音信号。
37.一种回声消除系统,其特征在于,包括双端通话检测装置以及自适应滤波器,所述双端通话检测装置包括:双端通话检测器,所述双端通话检测器用于根据远端数字语音信号与近端数字语音信号之间的能量比的平均值与能量门限的比对结果,以及所述近端数字语音信号与所述远端数字语音信号之间的频率相干值的平均值与相干值门限的比对结果,判断所述近端数字语音信号中是否还存在近端说话者的数字语音信号;
若所述能量比的平均值大于所述能量门限,或者,若所述能量比的平均值小于所述能量门限且所述频率相干值的平均值小于所述相干值门限,则判定所述近端数字语音信号中存在所述近端说话者的数字语音信号;否则,判定所述近端数字语音信号中不存在所述近端说话者的数字语音信号。
CN201980000966.6A 2019-05-22 2019-05-22 双端通话检测方法、双端通话检测装置以及回声消除系统 Active CN112292844B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2019/087907 WO2020232659A1 (zh) 2019-05-22 2019-05-22 双端通话检测方法、双端通话检测装置以及回声消除系统

Publications (2)

Publication Number Publication Date
CN112292844A CN112292844A (zh) 2021-01-29
CN112292844B true CN112292844B (zh) 2022-04-15

Family

ID=73459040

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201980000966.6A Active CN112292844B (zh) 2019-05-22 2019-05-22 双端通话检测方法、双端通话检测装置以及回声消除系统

Country Status (4)

Country Link
US (1) US11349525B2 (zh)
EP (1) EP3796629B1 (zh)
CN (1) CN112292844B (zh)
WO (1) WO2020232659A1 (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111161748B (zh) * 2020-02-20 2022-09-23 百度在线网络技术(北京)有限公司 一种双讲状态检测方法、装置以及电子设备
CN113223547B (zh) * 2021-04-30 2024-05-24 杭州网易智企科技有限公司 双讲检测方法、装置、设备和介质
CN113345459B (zh) * 2021-07-16 2023-02-21 北京融讯科创技术有限公司 一种双讲状态的检测方法、装置、计算机设备及存储介质
CN113689872A (zh) * 2021-08-16 2021-11-23 广州朗国电子科技股份有限公司 一种声学回声消除装置
CN113949776B (zh) * 2021-10-19 2024-04-16 随锐科技集团股份有限公司 一种基于双步长快速回声消除的双端讲话检测方法和装置
CN114401399B (zh) * 2022-03-28 2022-08-09 广州迈聆信息科技有限公司 一种音频双向延时估计方法、装置、会议终端及存储介质

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000072557A2 (en) * 1999-05-24 2000-11-30 Motorola Inc. Advanced double-talk detector
CN101106405A (zh) * 2006-07-12 2008-01-16 北京大学深圳研究生院 回声消除器、回声消除方法及其双端通话检测系统
CN101179294A (zh) * 2006-11-09 2008-05-14 爱普拉斯通信技术(北京)有限公司 自适应回声消除器及其回声消除方法
CN101964670A (zh) * 2009-07-21 2011-02-02 雅马哈株式会社 回声抑制方法及回声抑制设备
CN102984406A (zh) * 2012-10-01 2013-03-20 美商威睿电通公司 用于检测双端通话情况的方法及其系统
CN103325379A (zh) * 2012-03-23 2013-09-25 杜比实验室特许公司 用于声学回声控制的方法与装置
CN103718538A (zh) * 2011-05-17 2014-04-09 谷歌公司 用于实现声学回声消除的非线性后期处理
CN105391879A (zh) * 2015-12-09 2016-03-09 天津大学 一种无回声残留双端通话鲁棒的声学回声消除方法
US10115411B1 (en) * 2017-11-27 2018-10-30 Amazon Technologies, Inc. Methods for suppressing residual echo
CN109068012A (zh) * 2018-07-06 2018-12-21 南京时保联信息科技有限公司 一种用于音频会议系统的双端通话检测方法
CN109215672A (zh) * 2017-07-05 2019-01-15 上海谦问万答吧云计算科技有限公司 一种声音信息的处理方法、装置及设备
CN109348072A (zh) * 2018-08-30 2019-02-15 湖北工业大学 一种应用于回声抵消系统的双端通话检测方法

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0847180A1 (en) * 1996-11-27 1998-06-10 Nokia Mobile Phones Ltd. Double talk detector
CN101179635B (zh) * 2006-11-06 2011-05-25 黄山好视达通信技术有限公司 对免提电话进行回声控制的装置、方法和系统
DE102008039330A1 (de) * 2008-01-31 2009-08-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Berechnen von Filterkoeffizienten zur Echounterdrückung
US8625776B2 (en) * 2009-09-23 2014-01-07 Polycom, Inc. Detection and suppression of returned audio at near-end
EP2822263B1 (en) * 2013-07-05 2019-03-27 Sennheiser Communications A/S Communication device with echo suppression
US10863269B2 (en) * 2017-10-03 2020-12-08 Bose Corporation Spatial double-talk detector
GB2572650A (en) * 2018-04-06 2019-10-09 Nokia Technologies Oy Spatial audio parameters and associated spatial audio playback
WO2021056115A1 (en) * 2019-09-26 2021-04-01 Quantum Benchmark, Inc. Systems and methods for cancellation of crosstalk
CN111161748B (zh) * 2020-02-20 2022-09-23 百度在线网络技术(北京)有限公司 一种双讲状态检测方法、装置以及电子设备

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000072557A2 (en) * 1999-05-24 2000-11-30 Motorola Inc. Advanced double-talk detector
CN101106405A (zh) * 2006-07-12 2008-01-16 北京大学深圳研究生院 回声消除器、回声消除方法及其双端通话检测系统
CN101179294A (zh) * 2006-11-09 2008-05-14 爱普拉斯通信技术(北京)有限公司 自适应回声消除器及其回声消除方法
CN101964670A (zh) * 2009-07-21 2011-02-02 雅马哈株式会社 回声抑制方法及回声抑制设备
CN103718538A (zh) * 2011-05-17 2014-04-09 谷歌公司 用于实现声学回声消除的非线性后期处理
CN103325379A (zh) * 2012-03-23 2013-09-25 杜比实验室特许公司 用于声学回声控制的方法与装置
CN102984406A (zh) * 2012-10-01 2013-03-20 美商威睿电通公司 用于检测双端通话情况的方法及其系统
CN105391879A (zh) * 2015-12-09 2016-03-09 天津大学 一种无回声残留双端通话鲁棒的声学回声消除方法
CN109215672A (zh) * 2017-07-05 2019-01-15 上海谦问万答吧云计算科技有限公司 一种声音信息的处理方法、装置及设备
US10115411B1 (en) * 2017-11-27 2018-10-30 Amazon Technologies, Inc. Methods for suppressing residual echo
CN109068012A (zh) * 2018-07-06 2018-12-21 南京时保联信息科技有限公司 一种用于音频会议系统的双端通话检测方法
CN109348072A (zh) * 2018-08-30 2019-02-15 湖北工业大学 一种应用于回声抵消系统的双端通话检测方法

Also Published As

Publication number Publication date
EP3796629B1 (en) 2022-08-31
CN112292844A (zh) 2021-01-29
US20210013927A1 (en) 2021-01-14
EP3796629A1 (en) 2021-03-24
US11349525B2 (en) 2022-05-31
WO2020232659A1 (zh) 2020-11-26
EP3796629A4 (en) 2021-06-30

Similar Documents

Publication Publication Date Title
CN112292844B (zh) 双端通话检测方法、双端通话检测装置以及回声消除系统
JP4377952B1 (ja) 適応フィルタ及びこれを有するエコーキャンセラ
US8199907B2 (en) Echo canceller and echo cancelling method and program
CN105432062B (zh) 用于回波去除的方法、设备及介质
JP6545419B2 (ja) 音響信号処理装置、音響信号処理方法、及びハンズフリー通話装置
US20090185674A1 (en) Communication system
CN109102821B (zh) 时延估计方法、系统、存储介质及电子设备
CN110431624B (zh) 残余回声检测方法、残余回声检测装置、语音处理芯片及电子设备
US9185506B1 (en) Comfort noise generation based on noise estimation
CN105324981B (zh) 回波抑制的方法、设备、介质及装置
CN111742541B (zh) 声学回波抵消方法、装置、存储介质
JP2003500936A (ja) エコー抑止システムにおけるニアエンド音声信号の改善
US20120158401A1 (en) Music detection using spectral peak analysis
CN105409191B (zh) 一种回波去除的方法、设备和计算机可读存储介质
CN101213764A (zh) 回波抵消器
CN112602150A (zh) 噪声估计方法、噪声估计装置、语音处理芯片以及电子设备
CN109215672B (zh) 一种声音信息的处理方法、装置及设备
CN111989934B (zh) 回声消除装置、回声消除方法、信号处理芯片及电子设备
US8406430B2 (en) Simulated background noise enabled echo canceller
CN111917926B (zh) 一种通信终端中的回声消除方法、装置及终端设备
CN111355855A (zh) 回声处理方法、装置、设备及存储介质
CN115620737A (zh) 语音信号处理装置、方法、电子设备和扩音系统
JP4903843B2 (ja) 適応フィルタ及びこれを有するエコーキャンセラ
JP2006126841A (ja) 周期信号増強システム
CN113223547B (zh) 双讲检测方法、装置、设备和介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant