CN110120226A

CN110120226A - 一种专网集群终端语音尾噪消除方法和设备

Info

Publication number: CN110120226A
Application number: CN201810116797.XA
Authority: CN
Inventors: 李琳; 徐本凤
Original assignee: TD Tech Ltd
Current assignee: TD Tech Ltd; TD Tech Chengdu Co Ltd
Priority date: 2018-02-06
Filing date: 2018-02-06
Publication date: 2019-08-13
Anticipated expiration: 2038-02-06
Also published as: CN110120226B

Abstract

本申请公开了一种专网集群终端语音尾噪消除方法，包括：根据输入语音信号的幅度判断语音的开始和结束；在语音结束时按照设置的启动时间启动尾音消除操作；在语音开始时按照设置的释放时间停止尾音消除操作。本申请还提供了一种专网集群终端语音尾噪消除设备。应用本申请公开的技术方案，能够对专网集群终端的语音尾噪进行平滑的消除。

Description

一种专网集群终端语音尾噪消除方法和设备

技术领域

本申请涉及通信技术领域，特别涉及一种专网集群终端语音尾噪消除方法和设备。

背景技术

在专网集群终端需要使用半双工业务，即：一方主讲一方监听(类似对讲机)。在终端处于监听状态时，由于喇叭功率大，在对方发起主讲时，本终端会听到“沙沙”响的尾噪，需要对尾噪进行消除。

通常对于喇叭功率较小的终端而言，听觉可以忽略这部分感受，而当使用大功率的终端时，沙沙的声响较为明显，导致用户感受较差。

产生尾噪的原因是：模块模拟器件在射频发射结束时，需要在最后一段很短暂的时间内判断声音是否结束，从而导致一部分尾噪泄露。由于尾噪和语音掺杂一起、且短暂，现有的降噪算法对尾噪的抑制效果有限，无法完全消除，对于用户而言，听觉上没有太大改善。

发明内容

本申请提供了一种专网集群终端语音尾噪消除方法和设备，以对专网集群终端的语音尾噪进行平滑的消除。

本申请公开了一种专网集群终端语音尾噪消除方法，包括：

根据输入语音信号的幅度判断语音的开始和结束；

在语音结束时按照设置的启动时间启动尾音消除操作；

在语音开始时按照设置的释放时间停止尾音消除操作。

较佳的，所述启动时间是指启动尾音消除操作的时间；

所述释放时间是指暂停或停止尾音消除操作的时间。

较佳的，按照以下流程执行：

A、比较输入语音信号x(n)与xPEAK(n-1)的大小，如果x(n)<xPEAK(n-1)，采用式(1)更新xPEAK(n)，否则，采用式(2)更新xPEAK(n)：

xPEAK(n)＝(1-A)·xPEAK(n-1)+A·|x(n)|(1)

xPEAK(n)＝(1-R)·xPEAK(n-1)(2)

其中，xPEAK(n)为信号平稳的幅度；

A＝1-exp(-2.2Ts/(Ta/1000))，R＝1-exp(-2.2Ts/(Tr/1000))；

Ta为启动时间，Tr为释放时间，Ts为采样时间；

B、将xPEAK(n)与Limit进行比较，得到增益更新系数f：

如果xPEAK(n)<Limit，则令f＝0；

否则，令f＝1；

其中，Limit为消除底噪的目标值，根据所需消除的噪声大小决定，为常数；

f为更新g(n)的系数值；

C、将g(n)与f进行比较，得出收敛速度更新系数coeff_g：

如果f<g(n-1),则令coeff_g＝A；

否则,令coeff_g＝R；

D、通过f和coeff_g，计算g(n)：

g(n)＝(1-coeff_g)*g(n-1)+(coeff_g)*f

E、通过g(n)计算输出值y(n)＝x(n)*g(n)；

F、保存每次计算得到的xPEAK(n)和g(n)，用作下一次计算。

本申请还公开了一种专网集群终端语音尾噪消除设备，包括：

用于根据输入语音信号的幅度判断语音的开始和结束的模块；

用于在语音结束时按照设置的启动时间启动尾音消除操作的模块；

用于在语音开始时按照设置的释放时间停止尾音消除操作的模块。

较佳的，所述启动时间是指启动尾音消除操作的时间；

所述释放时间是指暂停或停止尾音消除操作的时间。

由上述技术方案可见，本申请提供的专网集群终端语音尾噪消除方法和设备通过语音语调特点检测语音，保证只消除尾部噪音，并防止由于消除中间语音而造成的语音不连续，并且，本申请对尾噪消除采用平滑处理，使得能够对语音尾噪进行平滑的消除。

附图说明

图1为本申请专网集群终端语音尾噪消除方法示意图；

图2为本申请专网集群终端语音尾噪消除方法的仿真效果示意图。

具体实施方式

为使本申请的目的、技术方案及优点更加清楚明白，以下参照附图并举实施例，对本申请作进一步详细说明。

为解决现有技术所述存在的问题，本申请提供了一种专网集群终端语音尾噪消除方法。

本申请的原理是：根据语音信号的幅度判断语音的开始和结束，在语音结束时按照本发明设置的启动时间及时启动尾音消除操作，在语音开始时按照本发明设置的释放时间及时停止尾音消除操作，从而避免对用户语音错误地进行消除尾音。其中：

启动时间(attack time)是指启动尾音消除操作的时间，其值影响语音结束时尾音消除算法生效的速度；

释放时间(release time)是指暂停或停止尾音消除操作的时间，其值影响语音出现时，尾音消除算法退出的速度。

如果尾音消除操作(即：尾音消除算法)的启动时间过短或释放时间过长，则可能会导致语音突变，这是因为：尾音消除算法本身是通过信号幅度来区分噪声和语音的，不能保证完全无失真。特别快的收敛，将误伤语音；启动时间参数过长会导致收敛慢，算法生效时间慢，消除底噪效果不理想。释放时间过短，也会导致算法过早退出影响噪声消除效果。

其中，启动时间和释放时间的取值需要结合所要消除的信号大小与语音信号大小的比例关系进行仿真得到。在进行仿真时，以保证正好可以消除底噪，且没有明显的语音断续和失真的情况下对应的值作为启动时间和释放时间的取值。例如：启动时间Ta可以取10ms，释放时间Tr可以取20ms。

本发明根据声音发生原理，通过启动时间和释放时间对信号运行幅度进行仿真，可以计算得到一段时间内信号平稳的幅度，防止信号区域消除所导致的断续，从而避免引起不必要的噪音。

具体而言，通过公式(1)和公式(2)计算幅度：

xPEAK(n)＝(1-A)·xPEAK(n-1)+A·|x(n)| (1)

xPEAK(n)＝(1-R)·xPEAK(n-1) (2)

根据实际输入信号(即：语音信号)与xPEAK的不同比值，分别采用两种不同的计算方法更新xPEAK，以得到平稳的幅度值。具体的，用实际信号输入的幅度x(n)与xPEAK(n-1)进行比较，如果x(n)小于xPEAK(n-1)，则使用公式(1)更新xPEAK(n-1)得到当前的xPEAK(n)，否则，使用公式(2)。其中，xPEAK(n-1)是时刻n-1的信号平稳的幅度，xPEAK(n)是当前时刻，即时刻n的信号平稳的幅度。

公式(1)和公式(2)中的两个系数A和R通过本发明采用传递函数H(Z)，通过启动时间、释放时间和一系列的z变换、逆变换得到，其中：

A＝1-exp(-2.2Ts/(Ta/1000))；

R＝1-exp(-2.2Ts/(Tr/1000))；

其中：Ta为attack time，Tr为release time，Ts为采样时间。

下面结合图1，通过一个较佳实施例对本申请方法进行详细说明。

第1步：通过比较输入信号x(n)与xPEAK(n-1)的大小，判断是否执行消除噪声的操作：

如果x(n)<xPEAK(n-1)，采用式(1)更新xPEAK(n)(消除尾音生效)；

否则，采用式(2)更新xPEAK(n)(消除尾音不生效)。

实际上是通过输入信号x(n)与上一次xPEAK(n-1)值之间的比较，来判断是使用系数A还是R。

xPEAK(n)＝(1-A)·xPEAK(n-1)+A·|x(n)| (1)

xPEAK(n)＝(1-R)·xPEAK(n-1) (2)

本发明所述的启动时间和释放时间主要用于传递函数H(Z)中，通过一系列的z变换、逆变换，求得两个系数A＝1-exp(-2.2Ts/(Ta/1000))，R＝1-exp(-2.2Ts/(Tr/1000))，其中：Ta为attack time，Tr为release time，Ts为采样时间。

第2步：将xPEAK(n)与Limit进行比较，得到增益更新系数f。

如果xPEAK(n)<Limit，则令f＝0；(消除噪声生效)

否则，令f＝1；(消除噪声不生效)

其中，Limit为消除底噪的目标值，根据所需要消除的噪声大小决定，为常数。

f为更新g(n)的系数值。如果xPEAK(n)≥Limit，认为是正常语音，尽量不衰减；否则，进行大幅度衰减。

第3步：将g(n)与f进行比较，得出收敛速度更新系数coeff_g。

如果f<g(n-1),coeff_g＝A,(消除噪声生效)

否则,coeff_g＝R；(消除噪声不生效)

计算得到coeff_g后，为后续更新g(n)使用。

第4步：通过f和coeff_g，计算g(n)。

g(n)＝(1-coeff_g)*g(n-1)+(coeff_g)*f

第5步：通过g(n)计算输出值y(n)＝x(n)*g(n)，消除无用的尾音，保留正常的语音信号。

第6步：将每次的xPEAK(n)和g(n)保留，用作下一次计算。

通过本发明提供的上述方法进行尾音检测和消除后，将以逼近0值且平滑的方法消除噪音。如图2所示，黑色为普通语音，灰色为消除掉的底噪，与语音掺杂一起，处理过后，不再听到沙沙的声响。根据图2的处理结果可以看到，本发明不是一次性斩断尾音，而是选择性的消除语音里面的杂音，不影响正常的语音信号。

对于专网终端，本发明提供的方法可以用于大功率的监听端，经过处理后，使用起来不再伴有杂音。当然小功率的终端在比较安静的场景下，也会有此类声音，也可以使用本发明提供的方法进行处理。

对应于上述方法，本申请还提供了一种专网集群终端语音尾噪消除设备，包括：

以上所述仅为本申请的较佳实施例而已，并不用以限制本申请，凡在本申请的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本申请保护的范围之内。

Claims

1.一种专网集群终端语音尾噪消除方法，其特征在于，包括：

根据输入语音信号的幅度判断语音的开始和结束；

在语音结束时按照设置的启动时间启动尾音消除操作；

在语音开始时按照设置的释放时间停止尾音消除操作。

2.根据权利要求1所述的方法，其特征在于：

所述启动时间是指启动尾音消除操作的时间；

所述释放时间是指暂停或停止尾音消除操作的时间。

3.根据权利要求1或2所述的方法，其特征在于，按照以下流程执行：

xPEAK(n)＝(1-A)·xPEAK(n-1)+A·|x(n)| (1)

xPEAK(n)＝(1-R)·xPEAK(n-1) (2)

其中，xPEAK(n)为信号平稳的幅度；

A＝1-exp(-2.2Ts/(Ta/1000))，R＝1-exp(-2.2Ts/(Tr/1000))；

Ta为启动时间，Tr为释放时间，Ts为采样时间；

B、将xPEAK(n)与Limit进行比较，得到增益更新系数f：

如果xPEAK(n)<Limit，则令f＝0；

否则，令f＝1；

f为更新g(n)的系数值；

C、将g(n)与f进行比较，得出收敛速度更新系数coeff_g：如果f<g(n-1),则令coeff_g＝A；

否则,令coeff_g＝R；

D、通过f和coeff_g，计算g(n)：

g(n)＝(1-coeff_g)*g(n-1)+(coeff_g)*f

E、通过g(n)计算输出值y(n)＝x(n)*g(n)；

F、保存每次计算得到的xPEAK(n)和g(n)，用作下一次计算。

4.一种专网集群终端语音尾噪消除设备，其特征在于，包括：用于根据输入语音信号的幅度判断语音的开始和结束的模块；

用于在语音结束时按照设置的启动时间启动尾音消除操作的模块；用于在语音开始时按照设置的释放时间停止尾音消除操作的模块。

5.根据权利要求4所述的设备，其特征在于：

所述启动时间是指启动尾音消除操作的时间；

所述释放时间是指暂停或停止尾音消除操作的时间。