CN109068012B - 一种用于音频会议系统的双端通话检测方法 - Google Patents

一种用于音频会议系统的双端通话检测方法 Download PDF

Info

Publication number
CN109068012B
CN109068012B CN201810733912.8A CN201810733912A CN109068012B CN 109068012 B CN109068012 B CN 109068012B CN 201810733912 A CN201810733912 A CN 201810733912A CN 109068012 B CN109068012 B CN 109068012B
Authority
CN
China
Prior art keywords
state
far
signal
conference system
audio conference
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810733912.8A
Other languages
English (en)
Other versions
CN109068012A (zh
Inventor
梁瑞宇
王青云
何超
丁帆
徐飞
陶宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Shibaolian Information Technology Co ltd
Original Assignee
Nanjing Shibaolian Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Shibaolian Information Technology Co ltd filed Critical Nanjing Shibaolian Information Technology Co ltd
Priority to CN201810733912.8A priority Critical patent/CN109068012B/zh
Publication of CN109068012A publication Critical patent/CN109068012A/zh
Application granted granted Critical
Publication of CN109068012B publication Critical patent/CN109068012B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/56Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities
    • H04M3/568Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities audio processing specific to telephonic conferencing, e.g. spatial distribution, mixing of participants
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/21Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/22Arrangements for supervision, monitoring or testing
    • H04M3/2236Quality of speech transmission monitoring
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L2021/02082Noise filtering the noise being echo, reverberation of the speech

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Telephonic Communication Services (AREA)
  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
  • Telephone Function (AREA)

Abstract

本发明公开了一种用于音频会议系统的双端通话检测方法,包括步骤(A),对音频会议系统的近端信号d(n)和远端参考信号x(n)进行语音活性检测;步骤(B),根据语音活性检测结果,判断该音频会议系统处于静默状态、单近状态或者远端有语音状态;步骤(C),若该音频会议系统为远端有语音状态,根据功率谱计算结果,判断是单远状态或者是双端通话状态。本发明的用于音频会议系统的双端通话检测方法,通过语音活性检测、功率谱计算,来区别音频会议系统的静默状态、单近状态、单远状态或者双端通话状态四种状态,提高双端状态判断的准确度,进而可以改善后端非线性回声抑制能力,具有良好的应用前景。

Description

一种用于音频会议系统的双端通话检测方法
技术领域
本发明涉及语音信号处理技术领域,具体涉及一种用于音频会议系统的双端通话检测方法。
背景技术
回声是指扬声器播出的声音在被受话方听到的同时,也通过多种路径被麦克风拾取到。多路径反射的结果产生了不同延时的回声,包括直接回声和间接回声,其中直接回声是指由扬声器播出的声音未经任何反射直接进入麦克风,这种回声的延时最短,它同远端说话者的语音能量、扬声器与麦克风之间的距离、角度、扬声器的播放音量、麦克风的拾取灵敏度等因素直接相关;而间接回声是指由扬声器播出的声音经过不同的路径的一次或多次反射后进入麦克风所产生的回声的集合,房屋内的任何物体的任何变动都会改变回声的通道,因此,这种回声的特点是多路径的、时变的。
如果在不做任何回声处理的情况下,回声会不断叠加形成啸叫,用户体验会变得很差。回声消除就是将输入给麦克风的信号中的回声成分消除,比较常见的算法有归一化最小均方算法、分块频域自适应滤波算法。但是,这些算法只能线性消除回声,对于非线性的残留回声只能采用非线性的方法来消除。
但是,对于非线性的回声消除方法,常常依赖于双端通话状态检测的精度,所谓双端是指音频会议系统两端的说话人同时说话。在实际应用中,双端通话的持续时间虽然低于单端讲话,但是如果不检测出双端通话,会严重干扰回声消除滤波器的性能,从而严重影响非线性回声消除算法效果。当前,基于相关性系数的双端通话检测是常用的方法之一。但是,该方法通过对比每帧的相关性系数来决定是否为双端通话状态,其精度易受设定阈值限制,通常会发生误判。
如何克服上述问题,是当前需要解决的问题。
发明内容
本发明的目的是解决传统的非线性回声消除方法中双端通话状态检测度不高的问题。本发明的用于音频会议系统的双端通话检测方法,通过语音活性检测、功率谱估计,来区别音频会议系统的静默状态、单近状态、单远状态或者双端通话状态四种状态,提高双端通话状态判断的准确度,进而为改善后端非线性回声抑制能力提供依据,具有良好的应用前景。
为了达到上述目的,本发明所采用的技术方案是:
一种用于音频会议系统的双端通话检测方法,包括以下步骤,
步骤(A),对音频会议系统的近端信号d(n)和远端参考信号x(n)进行语音活性检测;
步骤(B),根据语音活性检测结果,判断该音频会议系统为静默状态、单近状态或者远端有语音状态,
(B1)若近端信号d(n)和远端参考信号x(n)都无语音时,则该音频会议系统的状态为静默状态;
(B2),若近端信号d(n)有语音,而远端参考信号x(n)无语音时,则该音频会议系统的状态为单近状态;
(B3),若远端参考信号x(n)有语音,则该音频会议系统的状态为远端有语音状态;
步骤(C),若该音频会议系统为远端有语音状态,根据功率谱计算结果,判断是单远状态或者是双端通话状态。
前述的一种用于音频会议系统的双端通话检测方法,步骤(C),若该音频会议系统为远端有语音状态,根据功率谱计算结果,判断是单远状态或者是双端通话状态,包括以下步骤,
(C1),计算近端信号d(n)、远端参考信号x(n)和残差信号e(n)的功率谱能量Sd(k)、Sx(k)和Se(k),如公式(1)所示,
Figure GDA0001825570110000031
其中,D(k)、X(k)和E(k)分别是近端信号d(n)、远端参考信号x(n)和残差信号e(n)的傅里叶变换;α为功率谱平滑系数;
(C2),计算近端信号d(n)和远端参考信号x(n),近端信号d(n)和残差信号e(n)的互功率谱能量Sxd(k)和Sde(k),如公式(2)所示,
Figure GDA0001825570110000032
(C3),计算近端信号d(n)和远端参考信号x(n),近端信号d(n)和残差信号e(n)的第一组相关性指标Pde1和Pxd1,如公式(3)所示,
Figure GDA0001825570110000033
其中,N为傅里叶变换长度的一半;
(C4),计算近端信号d(n)和远端参考信号x(n),近端信号d(n)和残差信号e(n)的第二组相关性指标Pde2和Pxd2,如公式(4)所示,
Figure GDA0001825570110000041
其中,Sd(k)、Sx(k)和Se(k)分别为近端信号d(n)、远端参考信号x(n)和残差信号e(n)的功率谱能量;cov函数为协方差函数;δSx、δSd、δSe分别为Sd(k)、Sx(k)和Se(k)的方差;
(C5),计算第一组相关性指标Pde1和Pxd1、第二组相关性指标Pde2和Pxd2联合相关性指标Pde、Pxd,如公式(5)所示,
Figure GDA0001825570110000042
其中,β为联合相关性指标系数;
(C6),当Pde大于T1且Pxd大于T2时,则该音频会议系统为双端通话状态;否则为单远状态,其中,T1为表征近端信号d(n)和残差信号e(n)相关性阈值,T2为表征近端信号d(n)和远端参考信号x(n)相关性阈值。
前述的用于音频会议系统的双端通话检测方法,(C1),所述α为功率谱平滑系数,且取值范围在0-1之间。
前述的用于音频会议系统的双端通话检测方法,(C5),所述β为联合相关性指标系数,且取值范围在0-1之间。
前述的用于音频会议系统的双端通话检测方法,(C6),T1、T2的取值范围均在0-1之间。
前述的用于音频会议系统的双端通话检测方法,步骤(A),对音频会议系统的近端信号d(n)和远端参考信号x(n)进行语音活性检测,是采用高斯混合模型进行处理。
本发明的有益效果是:本发明的用于音频会议系统的双端通话检测方法,通过语音活性检测、功率谱估计,来区别音频会议系统的静默状态、单近状态、单远状态或者双端通话状态四种状态,提高双端通话状态判断的准确度,进而为改善后端非线性回声抑制能力提供依据,具有良好的应用前景。
附图说明
图1是本发明的用于音频会议系统的双端通话检测方法的流程图。
具体实施方式
下面将结合说明书附图,对本发明作进一步的说明。
如图1所示,本发明的用于音频会议系统的双端通话检测方法,包括以下步骤,
步骤(A),对音频会议系统的近端信号d(n)和远端参考信号x(n)进行语音活性检测,该计算过程是采用高斯混合模型进行处理,高斯分布又称为正态分布,若随机变量X服从一个数学期望为μ,标准差为σ2的高斯分布,则X~N(μ,σ2),其概率密度函数为:
Figure GDA0001825570110000051
在进行语音活性检测时,定义函数
Figure GDA0001825570110000052
x_k是六个子带的能量(子带是80~250Hz,250~500Hz,500Hz~1K,1~2K,2~3K,3~4KHz),r_k是均值u_z和方差σ2的参数结合,这两个参数决定了高斯分布的概率Z,Z=0情况是计算噪声的概率,Z=1是计算是语音的概率,噪声和语音的频谱差异以一个个波峰和波谷的形式呈现。基于这一假设,算法将频谱分成了6个子带。它们是:80Hz~250Hz,250Hz~500Hz,500Hz~1K,1K~2K,2K~3K,3K~4K。以1KHz为分界,向下500HZ,250Hz以及80HZ三个段,向上也有三个段,每个段是1KHz,这一频段涵盖了语音中绝大部分的信号能量,且能量越大的子带的区分度越细致。我国交流电标准是220V~50Hz,电源50Hz的干扰会混入麦克风采集到的数据中且物理震动也会带来影响,所以取了80Hz以上的信号。为减小计算量,将不同输入采样率(48KHz,32HKz,16KHz)都下采样到8KHz,这样根据莱奎斯特频率定理,有用的频谱就是4KHz以下,六个子带的上限频率为4KHz。如果采用8KHz截止频率就需要重新训练和修改高斯模型的参数,其中,VAD(语音激活检测)算法中,用到了两个聚类,一个类是语音,一个类是噪声。对每帧信号都求其语音和噪声的概率,根据概率进行聚类,当然为了避免一帧带来的误差,会有延时统计判决;
步骤(B),根据语音活性检测结果,判断该音频会议系统的静默状态、单近状态或者远端有语音状态,
(B1)若近端信号d(n)和远端参考信号x(n)都无语音时,则该音频会议系统的状态为静默状态;
(B2),若近端信号d(n)有语音,而远端参考信号x(n)无语音时,则该音频会议系统的状态为单近状态;
(B3),若远端参考信号x(n)有语音,则该音频会议系统的状态为远端有语音状态;
步骤(C),若该音频会议系统为远端有语音状态,根据功率谱计算结果,判断是单远状态或者是双端通话状态,包括以下步骤,
(C1),计算近端信号d(n)、远端参考信号x(n)和残差信号e(n)的功率谱能量Sd(k)、Sx(k)和Se(k),如公式(1)所示,
Figure GDA0001825570110000071
其中,D(k)、X(k)和E(k)分别是近端信号d(n)、远端参考信号x(n)和残差信号e(n)的傅里叶变换;α为功率谱平滑系数;
(C2),计算近端信号d(n)和远端参考信号x(n),近端信号d(n)和残差信号e(n)的互功率谱能量Sxd(k)和Sde(k),如公式(2)所示,
Figure GDA0001825570110000072
(C3),计算近端信号d(n)和远端参考信号x(n),近端信号d(n)和残差信号e(n)的第一组相关性指标Pde1和Pxd1,如公式(3)所示,
Figure GDA0001825570110000073
其中,N为傅里叶变换长度的一半;
(C4),计算近端信号d(n)和远端参考信号x(n),近端信号d(n)和残差信号e(n)的第二组相关性指标Pde2和Pxd2,如公式(4)所示,
Figure GDA0001825570110000074
其中,Sd(k)、Sx(k)和Se(k)分别为近端信号d(n)、远端参考信号x(n)和残差信号e(n)的功率谱能量;cov函数为协方差函数;δSx、δSd、δSe分别为Sd(k)、Sx(k)和Se(k)的方差;
(C5),计算第一组相关性指标Pde1和Pxd1、第二组相关性指标Pde2和Pxd2联合相关性指标Pde、Pxd,如公式(5)所示,
Figure GDA0001825570110000081
其中,β为联合相关性指标系数;
(C6),当Pde大于T1且Pxd大于T2时,则该音频会议系统为双端通话状态;否则为单远状态,其中,T1为表征近端信号d(n)和残差信号e(n)相关性阈值,T2为表征近端信号d(n)和远端参考信号x(n)相关性阈值。
优选的,(C1)所述α为功率谱平滑系数,且取值范围在0-1之间。
优选的,(C5)所述β为联合相关性指标系数,且取值范围在0-1之间。
优选的,(C6)T1、T2的取值范围均在0-1之间。
综上所述,本发明的用于音频会议系统的双端通话检测方法,通过语音活性检测、功率谱估计,来区别音频会议系统的静默状态、单近状态、单远状态或者双端通话状态四种状态,提高双端状态判断的准确度,进而为改善后端非线性回声抑制能力,提供依据,具有良好的应用前景。
以上内容描述了本发明的基本原理、主要特征及优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。

Claims (5)

1.一种用于音频会议系统的双端通话检测方法,其特征在于:包括以下步骤,
步骤(A),对音频会议系统的近端信号d(n)和远端参考信号x(n)进行语音活性检测;
步骤(B),根据语音活性检测结果,判断该音频会议系统为静默状态、单近状态或者远端有语音状态,
(B1)若近端信号d(n)和远端参考信号x(n)都无语音时,则该音频会议系统的状态为静默状态;
(B2),若近端信号d(n)有语音,而远端参考信号x(n)无语音时,则该音频会议系统的状态为单近状态;
(B3),若远端参考信号x(n)有语音,则该音频会议系统的状态为远端有语音状态;
步骤(C),若该音频会议系统为远端有语音状态,根据功率谱计算结果,判断是单远状态或者是双端通话状态;
步骤(C),若该音频会议系统为远端有语音状态,根据功率谱计算结果,判断是单远状态或者是双端通话状态,包括以下步骤,
(C1),计算近端信号d(n)、远端参考信号x(n)和残差信号e(n)的功率谱能量Sd(k)、Sx(k)和Se(k),如公式(1)所示,
Figure FDA0002919658360000011
其中,D(k)、X(k)和E(k)分别是近端信号d(n)、远端参考信号x(n)和残差信号e(n)的傅里叶变换;α为功率谱平滑系数;
(C2),计算近端信号d(n)和远端参考信号x(n),近端信号d(n)和残差信号e(n)的互功率谱能量Sxd(k)和Sde(k),如公式(2)所示,
Figure FDA0002919658360000021
(C3),计算近端信号d(n)和远端参考信号x(n),近端信号d(n)和残差信号e(n)的第一组相关性指标Pde1和Pxd1,如公式(3)所示,
Figure FDA0002919658360000022
其中,N为傅里叶变换长度的一半;
(C4),计算近端信号d(n)和远端参考信号x(n),近端信号d(n)和残差信号e(n)的第二组相关性指标Pde2和Pxd2,如公式(4)所示,
Figure FDA0002919658360000023
其中,Sd(k)、Sx(k)和Se(k)分别为近端信号d(n)、远端参考信号x(n)和残差信号e(n)的功率谱能量;cov函数为协方差函数;δSx、δSd、δSe分别为Sd(k)、Sx(k)和Se(k)的方差;
(C5),计算第一组相关性指标Pde1和Pxd1、第二组相关性指标Pde2和Pxd2联合相关性指标Pde、Pxd,如公式(5)所示,
Figure FDA0002919658360000024
其中,β为联合相关性指标系数;
(C6),当Pde大于T1且Pxd大于T2时,则该音频会议系统为双端通话状态;否则为单远状态,其中,T1为表征近端信号d(n)和残差信号e(n)相关性阈值,T2为表征近端信号d(n)和远端参考信号x(n)相关性阈值。
2.根据权利要求1所述的用于音频会议系统的双端通话检测方法,其特征在于:(C1),所述α的取值范围在0-1之间。
3.根据权利要求2所述的用于音频会议系统的双端通话检测方法,其特征在于:(C5),所述β的取值范围在0-1之间。
4.根据权利要求2所述的用于音频会议系统的双端通话检测方法,其特征在于:(C6),T1、T2的取值范围均在0-1之间。
5.根据权利要求1所述的用于音频会议系统的双端通话检测方法,其特征在于:步骤(A),对音频会议系统的近端信号d(n)和远端参考信号x(n)进行语音活性检测,是采用高斯混合模型进行处理。
CN201810733912.8A 2018-07-06 2018-07-06 一种用于音频会议系统的双端通话检测方法 Active CN109068012B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810733912.8A CN109068012B (zh) 2018-07-06 2018-07-06 一种用于音频会议系统的双端通话检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810733912.8A CN109068012B (zh) 2018-07-06 2018-07-06 一种用于音频会议系统的双端通话检测方法

Publications (2)

Publication Number Publication Date
CN109068012A CN109068012A (zh) 2018-12-21
CN109068012B true CN109068012B (zh) 2021-04-27

Family

ID=64818808

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810733912.8A Active CN109068012B (zh) 2018-07-06 2018-07-06 一种用于音频会议系统的双端通话检测方法

Country Status (1)

Country Link
CN (1) CN109068012B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109547655A (zh) * 2018-12-30 2019-03-29 广东大仓机器人科技有限公司 一种网络语音通话的回声消除处理的方法
CN111724808A (zh) * 2019-03-18 2020-09-29 Oppo广东移动通信有限公司 音频信号处理方法、装置、终端及存储介质
CN110111805B (zh) * 2019-04-29 2021-10-29 北京声智科技有限公司 远场语音交互中的自动增益控制方法、装置及可读存储介质
CN112292844B (zh) * 2019-05-22 2022-04-15 深圳市汇顶科技股份有限公司 双端通话检测方法、双端通话检测装置以及回声消除系统
CN112185404B (zh) * 2019-07-05 2023-09-19 南京工程学院 一种基于子带信噪比估计的低复杂度双端检测方法
CN113113035A (zh) * 2020-01-10 2021-07-13 阿里巴巴集团控股有限公司 一种音频信号处理方法、装置、系统以及电子设备
CN111462771B (zh) * 2020-04-03 2022-04-12 宁波菊风系统软件有限公司 一种啸叫处理方法

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9472208B2 (en) * 2012-08-31 2016-10-18 Telefonaktiebolaget Lm Ericsson (Publ) Method and device for voice activity detection
CN105513596B (zh) * 2013-05-29 2020-03-27 华为技术有限公司 一种语音控制方法和控制设备
WO2015047308A1 (en) * 2013-09-27 2015-04-02 Nuance Communications, Inc. Methods and apparatus for robust speaker activity detection
CN105321528B (zh) * 2014-06-27 2019-11-05 中兴通讯股份有限公司 一种麦克风阵列语音检测方法及装置
US9516159B2 (en) * 2014-11-04 2016-12-06 Apple Inc. System and method of double talk detection with acoustic echo and noise control
CN105957520B (zh) * 2016-07-04 2019-10-11 北京邮电大学 一种适用于回声消除系统的语音状态检测方法
CN107635082A (zh) * 2016-07-18 2018-01-26 深圳市有信网络技术有限公司 一种双端发声端检测系统
CN106506872B (zh) * 2016-11-02 2019-05-24 腾讯科技(深圳)有限公司 通话状态检测方法及装置
CN107770683B (zh) * 2017-10-12 2019-10-11 北京小鱼在家科技有限公司 一种回声场景下音频采集状态的检测方法及装置

Also Published As

Publication number Publication date
CN109068012A (zh) 2018-12-21

Similar Documents

Publication Publication Date Title
CN109068012B (zh) 一种用于音频会议系统的双端通话检测方法
Zhang et al. Deep Learning for Joint Acoustic Echo and Noise Cancellation with Nonlinear Distortions.
TWI392322B (zh) 基於頻譜聲學特性之雙邊發話檢測方法
KR101905234B1 (ko) 풍 잡음 검출을 위한 방법 및 장치
US9343056B1 (en) Wind noise detection and suppression
US7464029B2 (en) Robust separation of speech signals in a noisy environment
CN105825864B (zh) 基于过零率指标的双端说话检测与回声消除方法
CN111161751A (zh) 复杂场景下的分布式麦克风拾音系统及方法
TWI720314B (zh) 基於相關性之近場偵測器
US20150371659A1 (en) Post Tone Suppression for Speech Enhancement
WO2019140755A1 (zh) 一种基于麦克风阵列的回声消除方法与系统
TWI738532B (zh) 具多麥克風之語音增強裝置及方法
CN108447496B (zh) 一种基于麦克风阵列的语音增强方法及装置
EP2441273A1 (en) Systems, methods, apparatus, and computer-readable media for phase-based processing of multichannel signal
CN101933088A (zh) 用于回声抑制的滤波器系数的计算设备和方法
KR20130108063A (ko) 다중 마이크로폰의 견고한 잡음 억제
EP2633519A1 (en) Systems, methods, and apparatus for voice activity detection
CN108986832B (zh) 基于语音出现概率和一致性的双耳语音去混响方法和装置
CN110211602B (zh) 智能语音增强通信方法及装置
CN106486135A (zh) 近端语音检测器
EP3757993A1 (en) Pre-processing for automatic speech recognition
CN110148421B (zh) 一种残余回声检测方法、终端和装置
Yang Multilayer adaptation based complex echo cancellation and voice enhancement
CN111225317B (zh) 一种回声消除方法
CN112165558B (zh) 一种双讲状态检测方法、装置、存储介质及终端设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant