CN109068012A - 一种用于音频会议系统的双端通话检测方法 - Google Patents

一种用于音频会议系统的双端通话检测方法 Download PDF

Info

Publication number
CN109068012A
CN109068012A CN201810733912.8A CN201810733912A CN109068012A CN 109068012 A CN109068012 A CN 109068012A CN 201810733912 A CN201810733912 A CN 201810733912A CN 109068012 A CN109068012 A CN 109068012A
Authority
CN
China
Prior art keywords
conference system
audio conference
state
near end
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810733912.8A
Other languages
English (en)
Other versions
CN109068012B (zh
Inventor
梁瑞宇
王青云
何超
丁帆
徐飞
陶宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Shibaolian Information Technology Co Ltd
Original Assignee
Nanjing Shibaolian Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Shibaolian Information Technology Co Ltd filed Critical Nanjing Shibaolian Information Technology Co Ltd
Priority to CN201810733912.8A priority Critical patent/CN109068012B/zh
Publication of CN109068012A publication Critical patent/CN109068012A/zh
Application granted granted Critical
Publication of CN109068012B publication Critical patent/CN109068012B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/56Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities
    • H04M3/568Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities audio processing specific to telephonic conferencing, e.g. spatial distribution, mixing of participants
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/21Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/22Arrangements for supervision, monitoring or testing
    • H04M3/2236Quality of speech transmission monitoring
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L2021/02082Noise filtering the noise being echo, reverberation of the speech

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Telephonic Communication Services (AREA)
  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
  • Telephone Function (AREA)

Abstract

本发明公开了一种用于音频会议系统的双端通话检测方法,包括步骤(A),对音频会议系统的近端信号d(n)和远端参考信号x(n)进行语音活性检测;步骤(B),根据语音活性检测结果,判断该音频会议系统处于静默状态、单近状态或者远端有语音状态;步骤(C),若该音频会议系统为远端有语音状态,根据功率谱计算结果,判断是单远状态或者是双端通话状态。本发明的用于音频会议系统的双端通话检测方法,通过语音活性检测、功率谱计算,来区别音频会议系统的静默状态、单近状态、单远状态或者双端通话状态四种状态,提高双端状态判断的准确度,进而可以改善后端非线性回声抑制能力,具有良好的应用前景。

Description

一种用于音频会议系统的双端通话检测方法
技术领域
本发明涉及语音信号处理技术领域,具体涉及一种用于音频会议系统的双端通话检测方法。
背景技术
回声是指扬声器播出的声音在被受话方听到的同时,也通过多种路径被麦克风拾取到。多路径反射的结果产生了不同延时的回声,包括直接回声和间接回声,其中直接回声是指由扬声器播出的声音未经任何反射直接进入麦克风,这种回声的延时最短,它同远端说话者的语音能量、扬声器与麦克风之间的距离、角度、扬声器的播放音量、麦克风的拾取灵敏度等因素直接相关;而间接回声是指由扬声器播出的声音经过不同的路径的一次或多次反射后进入麦克风所产生的回声的集合,房屋内的任何物体的任何变动都会改变回声的通道,因此,这种回声的特点是多路径的、时变的。
如果在不做任何回声处理的情况下,回声会不断叠加形成啸叫,用户体验会变得很差。回声消除就是将输入给麦克风的信号中的回声成分消除,比较常见的算法有归一化最小均方算法、分块频域自适应滤波算法。但是,这些算法只能线性消除回声,对于非线性的残留回声只能采用非线性的方法来消除。
但是,对于非线性的回声消除方法,常常依赖于双端通话状态检测的精度,所谓双端是指音频会议系统两端的说话人同时说话。在实际应用中,双端通话的持续时间虽然低于单端讲话,但是如果不检测出双端通话,会严重干扰回声消除滤波器的性能,从而严重影响非线性回声消除算法效果。当前,基于相关性系数的双端通话检测是常用的方法之一。但是,该方法通过对比每帧的相关性系数来决定是否为双端通话状态,其精度易受设定阈值限制,通常会发生误判。
如何克服上述问题,是当前需要解决的问题。
发明内容
本发明的目的是解决传统的非线性回声消除方法中双端通话状态检测度不高的问题。本发明的用于音频会议系统的双端通话检测方法,通过语音活性检测、功率谱估计,来区别音频会议系统的静默状态、单近状态、单远状态或者双端通话状态四种状态,提高双端通话状态判断的准确度,进而为改善后端非线性回声抑制能力提供依据,具有良好的应用前景。
为了达到上述目的,本发明所采用的技术方案是:
一种用于音频会议系统的双端通话检测方法,包括以下步骤,
步骤(A),对音频会议系统的近端信号d(n)和远端参考信号x(n)进行语音活性检测;
步骤(B),根据语音活性检测结果,判断该音频会议系统为静默状态、单近状态或者远端有语音状态,
(B1)若近端信号d(n)和远端参考信号x(n)都无语音时,则该音频会议系统的状态为静默状态;
(B2),若近端信号d(n)有语音,而远端参考信号x(n)无语音时,则该音频会议系统的状态为单近状态;
(B3),若远端参考信号x(n)有语音,则该音频会议系统的状态为远端有语音状态;
步骤(C),若该音频会议系统为远端有语音状态,根据功率谱计算结果,判断是单远状态或者是双端通话状态。
前述的一种用于音频会议系统的双端通话检测方法,步骤(C),若该音频会议系统为远端有语音状态,根据功率谱计算结果,判断是单远状态或者是双端通话状态,包括以下步骤,
(C1),计算近端信号d(n)、远端参考信号x(n)和残差信号e(n)的功率谱能量Sd(k)、Sx(k)和Se(k),如公式(1)所示,
其中,D(k)、X(k)和E(k)分别是近端信号d(n)、远端参考信号x(n)和残差信号e(n)的傅里叶变换;α为功率谱平滑系数;
(C2),计算近端信号d(n)和远端参考信号x(n),近端信号d(n)和残差信号 e(n)的互功率谱能量Sxd(k)和Sde(k),如公式(2)所示,
(C3),计算近端信号d(n)和远端参考信号x(n),近端信号d(n)和残差信号 e(n)的第一组相关性指标Pde1和Pxd1,如公式(3)所示,
其中,N为傅里叶变换长度的一半;
(C4),计算近端信号d(n)和远端参考信号x(n),近端信号d(n)和残差信号 e(n)的第二组相关性指标Pde2和Pxd2,如公式(4)所示,
其中,Sd(k)、Sx(k)和Se(k)分别为近端信号d(n)、远端参考信号x(n)和残差信号e(n)的功率谱能量;cov函数为协方差函数;δSx、δSd、δSe分别为Sd(k)、Sx(k) 和Se(k)的方差;
(C5),计算第一组相关性指标Pde1和Pxd1、第二组相关性指标Pde2和Pxd2联合相关性指标Pde、Pxd,如公式(5)所示,
其中,β为联合相关性指标系数;
(C6),当Pde大于T1且Pxd大于T2时,则该音频会议系统为双端通话状态;否则为单远状态,其中,T1为表征近端信号d(n)和残差信号e(n)相关性阈值,T2 为表征近端信号d(n)和远端参考信号x(n)相关性阈值。
前述的用于音频会议系统的双端通话检测方法,(C1),所述α为功率谱平滑系数,且取值范围在0-1之间。
前述的用于音频会议系统的双端通话检测方法,(C5),所述β为联合相关性指标系数,且取值范围在0-1之间。
前述的用于音频会议系统的双端通话检测方法,(C6),T1、T2的取值范围均在0-1之间。
前述的用于音频会议系统的双端通话检测方法,步骤(A),对音频会议系统的近端信号d(n)和远端参考信号x(n)进行语音活性检测,是采用高斯混合模型进行处理。
本发明的有益效果是:本发明的用于音频会议系统的双端通话检测方法,通过语音活性检测、功率谱估计,来区别音频会议系统的静默状态、单近状态、单远状态或者双端通话状态四种状态,提高双端通话状态判断的准确度,进而为改善后端非线性回声抑制能力提供依据,具有良好的应用前景。
附图说明
图1是本发明的用于音频会议系统的双端通话检测方法的流程图。
具体实施方式
下面将结合说明书附图,对本发明作进一步的说明。
如图1所示,本发明的用于音频会议系统的双端通话检测方法,包括以下步骤,
步骤(A),对音频会议系统的近端信号d(n)和远端参考信号x(n)进行语音活性检测,该计算过程是采用高斯混合模型进行处理,高斯分布又称为正态分布,若随机变量X服从一个数学期望为μ,标准差为σ2的高斯分布,则X~N(μ,σ2),其概率密度函数为:
在进行语音活性检测时,定义函数
x_k是六个子带的能量(子带是80~250Hz,250~500Hz,500Hz~1K,1~2K, 2~3K,3~4KHz),r_k是均值u_z和方差σ2的参数结合,这两个参数决定了高斯分布的概率Z,Z=0情况是计算噪声的概率,Z=1是计算是语音的概率,噪声和语音的频谱差异以一个个波峰和波谷的形式呈现。基于这一假设,算法将频谱分成了6个子带。它们是:80Hz~250Hz,250Hz~500Hz,500Hz~1K,1K~2K,2K~3K,3K~4K。以1KHz为分界,向下500HZ,250Hz以及80HZ三个段,向上也有三个段,每个段是1KHz,这一频段涵盖了语音中绝大部分的信号能量,且能量越大的子带的区分度越细致。我国交流电标准是220V~50Hz,电源50Hz 的干扰会混入麦克风采集到的数据中且物理震动也会带来影响,所以取了80Hz 以上的信号。为减小计算量,将不同输入采样率(48KHz,32HKz,16KHz)都下采样到8KHz,这样根据莱奎斯特频率定理,有用的频谱就是4KHz以下,六个子带的上限频率为4KHz。如果采用8KHz截止频率就需要重新训练和修改高斯模型的参数,其中,VAD(语音激活检测)算法中,用到了两个聚类,一个类是语音,一个类是噪声。对每帧信号都求其语音和噪声的概率,根据概率进行聚类,当然为了避免一帧带来的误差,会有延时统计判决;
步骤(B),根据语音活性检测结果,判断该音频会议系统的静默状态、单近状态或者远端有语音状态,
(B1)若近端信号d(n)和远端参考信号x(n)都无语音时,则该音频会议系统的状态为静默状态;
(B2),若近端信号d(n)有语音,而远端参考信号x(n)无语音时,则该音频会议系统的状态为单近状态;
(B3),若远端参考信号x(n)有语音,则该音频会议系统的状态为远端有语音状态;
步骤(C),若该音频会议系统为远端有语音状态,根据功率谱计算结果,判断是单远状态或者是双端通话状态,包括以下步骤,
(C1),计算近端信号d(n)、远端参考信号x(n)和残差信号e(n)的功率谱能量Sd(k)、Sx(k)和Se(k),如公式(1)所示,
其中,D(k)、X(k)和E(k)分别是近端信号d(n)、远端参考信号x(n)和残差信号e(n)的傅里叶变换;α为功率谱平滑系数;
(C2),计算近端信号d(n)和远端参考信号x(n),近端信号d(n)和残差信号 e(n)的互功率谱能量Sxd(k)和Sde(k),如公式(2)所示,
(C3),计算近端信号d(n)和远端参考信号x(n),近端信号d(n)和残差信号 e(n)的第一组相关性指标Pde1和Pxd1,如公式(3)所示,
其中,N为傅里叶变换长度的一半;
(C4),计算近端信号d(n)和远端参考信号x(n),近端信号d(n)和残差信号 e(n)的第二组相关性指标Pde2和Pxd2,如公式(4)所示,
其中,Sd(k)、Sx(k)和Se(k)分别为近端信号d(n)、远端参考信号x(n)和残差信号e(n)的功率谱能量;cov函数为协方差函数;δSx、δSd、δSe分别为Sd(k)、Sx(k) 和Se(k)的方差;
(C5),计算第一组相关性指标Pde1和Pxd1、第二组相关性指标Pde2和Pxd2联合相关性指标Pde、Pxd,如公式(5)所示,
其中,β为联合相关性指标系数;
(C6),当Pde大于T1且Pxd大于T2时,则该音频会议系统为双端通话状态;否则为单远状态,其中,T1为表征近端信号d(n)和残差信号e(n)相关性阈值,T2 为表征近端信号d(n)和远端参考信号x(n)相关性阈值。
优选的,(C1)所述α为功率谱平滑系数,且取值范围在0-1之间。
优选的,(C5)所述β为联合相关性指标系数,且取值范围在0-1之间。
优选的,(C6)T1、T2的取值范围均在0-1之间。
综上所述,本发明的用于音频会议系统的双端通话检测方法,通过语音活性检测、功率谱估计,来区别音频会议系统的静默状态、单近状态、单远状态或者双端通话状态四种状态,提高双端状态判断的准确度,进而为改善后端非线性回声抑制能力,提供依据,具有良好的应用前景。
以上内容描述了本发明的基本原理、主要特征及优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。

Claims (6)

1.一种用于音频会议系统的双端通话检测方法,其特征在于:包括以下步骤,
步骤(A),对音频会议系统的近端信号d(n)和远端参考信号x(n)进行语音活性检测;
步骤(B),根据语音活性检测结果,判断该音频会议系统为静默状态、单近状态或者远端有语音状态,
(B1)若近端信号d(n)和远端参考信号x(n)都无语音时,则该音频会议系统的状态为静默状态;
(B2),若近端信号d(n)有语音,而远端参考信号x(n)无语音时,则该音频会议系统的状态为单近状态;
(B3),若远端参考信号x(n)有语音,则该音频会议系统的状态为远端有语音状态;
步骤(C),若该音频会议系统为远端有语音状态,根据功率谱计算结果,判断是单远状态或者是双端通话状态。
2.根据权利要求1所述的一种用于音频会议系统的双端通话检测方法,其特征在于:步骤(C),若该音频会议系统为远端有语音状态,根据功率谱计算结果,判断是单远状态或者是双端通话状态,包括以下步骤,
(C1),计算近端信号d(n)、远端参考信号x(n)和残差信号e(n)的功率谱能量Sd(k)、Sx(k)和Se(k),如公式(1)所示,
其中,D(k)、X(k)和E(k)分别是近端信号d(n)、远端参考信号x(n)和残差信号e(n)的傅里叶变换;α为功率谱平滑系数;
(C2),计算近端信号d(n)和远端参考信号x(n),近端信号d(n)和残差信号e(n)的互功率谱能量Sxd(k)和Sde(k),如公式(2)所示,
(C3),计算近端信号d(n)和远端参考信号x(n),近端信号d(n)和残差信号e(n)的第一组相关性指标Pde1和Pxd1,如公式(3)所示,
其中,N为傅里叶变换长度的一半;
(C4),计算近端信号d(n)和远端参考信号x(n),近端信号d(n)和残差信号e(n)的第二组相关性指标Pde2和Pxd2,如公式(4)所示,
其中,Sd(k)、Sx(k)和Se(k)分别为近端信号d(n)、远端参考信号x(n)和残差信号e(n)的功率谱能量;cov函数为协方差函数;δSx、δSd、δSe分别为Sd(k)、Sx(k)和Se(k)的方差;
(C5),计算第一组相关性指标Pde1和Pxd1、第二组相关性指标Pde2和Pxd2联合相关性指标Pde、Pxd,如公式(5)所示,
其中,β为联合相关性指标系数;
(C6),当Pde大于T1且Pxd大于T2时,则该音频会议系统为双端通话状态;否则为单远状态,其中,T1为表征近端信号d(n)和残差信号e(n)相关性阈值,T2为表征近端信号d(n)和远端参考信号x(n)相关性阈值。
3.根据权利要求2所述的用于音频会议系统的双端通话检测方法,其特征在于:(C1),所述α为功率谱平滑系数,且取值范围在0-1之间。
4.根据权利要求2所述的用于音频会议系统的双端通话检测方法,其特征在于:(C5),所述β为联合相关性指标系数,且取值范围在0-1之间。
5.根据权利要求2所述的用于音频会议系统的双端通话检测方法,其特征在于:(C6),T1、T2的取值范围均在0-1之间。
6.根据权利要求1所述的用于音频会议系统的双端通话检测方法,其特征在于:步骤(A),对音频会议系统的近端信号d(n)和远端参考信号x(n)进行语音活性检测,是采用高斯混合模型进行处理。
CN201810733912.8A 2018-07-06 2018-07-06 一种用于音频会议系统的双端通话检测方法 Active CN109068012B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810733912.8A CN109068012B (zh) 2018-07-06 2018-07-06 一种用于音频会议系统的双端通话检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810733912.8A CN109068012B (zh) 2018-07-06 2018-07-06 一种用于音频会议系统的双端通话检测方法

Publications (2)

Publication Number Publication Date
CN109068012A true CN109068012A (zh) 2018-12-21
CN109068012B CN109068012B (zh) 2021-04-27

Family

ID=64818808

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810733912.8A Active CN109068012B (zh) 2018-07-06 2018-07-06 一种用于音频会议系统的双端通话检测方法

Country Status (1)

Country Link
CN (1) CN109068012B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109547655A (zh) * 2018-12-30 2019-03-29 广东大仓机器人科技有限公司 一种网络语音通话的回声消除处理的方法
CN111462771A (zh) * 2020-04-03 2020-07-28 宁波菊风系统软件有限公司 一种啸叫处理方法
CN111724808A (zh) * 2019-03-18 2020-09-29 Oppo广东移动通信有限公司 音频信号处理方法、装置、终端及存储介质
WO2020220625A1 (zh) * 2019-04-29 2020-11-05 北京声智科技有限公司 自动增益控制方法、装置及可读存储介质
WO2020232659A1 (zh) * 2019-05-22 2020-11-26 深圳市汇顶科技股份有限公司 双端通话检测方法、双端通话检测装置以及回声消除系统
CN112185404A (zh) * 2019-07-05 2021-01-05 南京工程学院 一种基于子带信噪比估计的低复杂度双端检测方法
CN113113035A (zh) * 2020-01-10 2021-07-13 阿里巴巴集团控股有限公司 一种音频信号处理方法、装置、系统以及电子设备

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105321528A (zh) * 2014-06-27 2016-02-10 中兴通讯股份有限公司 一种麦克风阵列语音检测方法及装置
CN105513596A (zh) * 2013-05-29 2016-04-20 华为技术有限公司 一种语音控制方法和控制设备
US20160127535A1 (en) * 2014-11-04 2016-05-05 Apple Inc. System and method of double talk detection with acoustic echo and noise control
US20160232920A1 (en) * 2013-09-27 2016-08-11 Nuance Communications, Inc. Methods and Apparatus for Robust Speaker Activity Detection
CN105957520A (zh) * 2016-07-04 2016-09-21 北京邮电大学 一种适用于回声消除系统的语音状态检测方法
CN106506872A (zh) * 2016-11-02 2017-03-15 腾讯科技(深圳)有限公司 通话状态检测方法及装置
CN107195313A (zh) * 2012-08-31 2017-09-22 瑞典爱立信有限公司 用于语音活动性检测的方法和设备
CN107635082A (zh) * 2016-07-18 2018-01-26 深圳市有信网络技术有限公司 一种双端发声端检测系统
CN107770683A (zh) * 2017-10-12 2018-03-06 北京小鱼在家科技有限公司 一种回声场景下音频采集状态的检测方法及装置

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107195313A (zh) * 2012-08-31 2017-09-22 瑞典爱立信有限公司 用于语音活动性检测的方法和设备
CN105513596A (zh) * 2013-05-29 2016-04-20 华为技术有限公司 一种语音控制方法和控制设备
US20160232920A1 (en) * 2013-09-27 2016-08-11 Nuance Communications, Inc. Methods and Apparatus for Robust Speaker Activity Detection
CN105321528A (zh) * 2014-06-27 2016-02-10 中兴通讯股份有限公司 一种麦克风阵列语音检测方法及装置
US20160127535A1 (en) * 2014-11-04 2016-05-05 Apple Inc. System and method of double talk detection with acoustic echo and noise control
CN105957520A (zh) * 2016-07-04 2016-09-21 北京邮电大学 一种适用于回声消除系统的语音状态检测方法
CN107635082A (zh) * 2016-07-18 2018-01-26 深圳市有信网络技术有限公司 一种双端发声端检测系统
CN106506872A (zh) * 2016-11-02 2017-03-15 腾讯科技(深圳)有限公司 通话状态检测方法及装置
CN107770683A (zh) * 2017-10-12 2018-03-06 北京小鱼在家科技有限公司 一种回声场景下音频采集状态的检测方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
蒙淑艳,赵晓晖,顾海军: "《一种自适应回声抵消和噪声消除算法》", 《吉林大学学报(工学版)》 *

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109547655A (zh) * 2018-12-30 2019-03-29 广东大仓机器人科技有限公司 一种网络语音通话的回声消除处理的方法
CN111724808A (zh) * 2019-03-18 2020-09-29 Oppo广东移动通信有限公司 音频信号处理方法、装置、终端及存储介质
WO2020220625A1 (zh) * 2019-04-29 2020-11-05 北京声智科技有限公司 自动增益控制方法、装置及可读存储介质
WO2020232659A1 (zh) * 2019-05-22 2020-11-26 深圳市汇顶科技股份有限公司 双端通话检测方法、双端通话检测装置以及回声消除系统
CN112292844A (zh) * 2019-05-22 2021-01-29 深圳市汇顶科技股份有限公司 双端通话检测方法、双端通话检测装置以及回声消除系统
CN112292844B (zh) * 2019-05-22 2022-04-15 深圳市汇顶科技股份有限公司 双端通话检测方法、双端通话检测装置以及回声消除系统
US11349525B2 (en) 2019-05-22 2022-05-31 Shenzhen GOODIX Technology Co., Ltd. Double talk detection method, double talk detection apparatus and echo cancellation system
CN112185404A (zh) * 2019-07-05 2021-01-05 南京工程学院 一种基于子带信噪比估计的低复杂度双端检测方法
CN112185404B (zh) * 2019-07-05 2023-09-19 南京工程学院 一种基于子带信噪比估计的低复杂度双端检测方法
CN113113035A (zh) * 2020-01-10 2021-07-13 阿里巴巴集团控股有限公司 一种音频信号处理方法、装置、系统以及电子设备
CN111462771A (zh) * 2020-04-03 2020-07-28 宁波菊风系统软件有限公司 一种啸叫处理方法
CN111462771B (zh) * 2020-04-03 2022-04-12 宁波菊风系统软件有限公司 一种啸叫处理方法

Also Published As

Publication number Publication date
CN109068012B (zh) 2021-04-27

Similar Documents

Publication Publication Date Title
CN109068012A (zh) 一种用于音频会议系统的双端通话检测方法
CN105957520B (zh) 一种适用于回声消除系统的语音状态检测方法
Tanyer et al. Voice activity detection in nonstationary noise
CN105469785B (zh) 通信终端双麦克风消噪系统中的语音活动检测方法及装置
EP1998539B1 (en) Double talk detection method based on spectral acoustic properties
Carbajal et al. Multiple-input neural network-based residual echo suppression
CN105261359B (zh) 手机麦克风的消噪系统和消噪方法
US11315586B2 (en) Apparatus and method for multiple-microphone speech enhancement
US8103011B2 (en) Signal detection using multiple detectors
CN103238182A (zh) 具有远程噪声检测器的降噪系统
CN109637552A (zh) 一种抑制音频设备啸叫的语音处理方法
CN107635082A (zh) 一种双端发声端检测系统
CN108986832A (zh) 基于语音出现概率和一致性的双耳语音去混响方法和装置
US20080240415A1 (en) Hybrid echo canceller controllers
US20080240414A1 (en) Hybrid echo canceller controllers
Jayakumar et al. An integrated acoustic echo and noise cancellation system using cross-band adaptive filters and wavelet thresholding of multitaper spectrum
CN106161820B (zh) 一种用于立体声声学回声抵消的通道间去相关方法
Martín-Doñas et al. Dual-channel DNN-based speech enhancement for smartphones
Zhang et al. Noise estimation based on an adaptive smoothing factor for improving speech quality in a dual-microphone noise suppression system
CN112165558B (zh) 一种双讲状态检测方法、装置、存储介质及终端设备
Varela et al. Combining pulse-based features for rejecting far-field speech in a HMM-based voice activity detector
CN111161753A (zh) 基于智能终端的安全语音交互方法及系统
CN102300014A (zh) 一种适用于有噪声环境下的声回声抵消系统双端说话检测方法
Marinescu et al. Fast accurate time delay estimation based on enhanced accumulated cross-power spectrum phase
Tong et al. Acoustic echo suppression based on speech presence probability

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant