WO2015085946A1

WO2015085946A1 - 语音信号处理方法、装置及服务器

Info

Publication number: WO2015085946A1
Application number: PCT/CN2014/093656
Authority: WO
Inventors: 马跃; 胡建强; 张帆; 刘丽; 成家雄; 宋思超
Original assignee: 广州华多网络科技有限公司
Priority date: 2013-12-13
Filing date: 2014-12-12
Publication date: 2015-06-18
Also published as: CN103680513A; CN103680513B

Abstract

提供了一种语音信号处理方法、装置及服务器，属于通信技术领域。所述方法包括：获取多个通道的原始语音信号，该原始语音信号为数字语音信号（101）；对每一个通道的原始语音信号进行滤波，得到每一个通道的第一语音信号，该第一语音信号的频率属于预设频率范围（102）；对于每一个通道的第一语音信号，获取该第一语音信号中每段子信号的响度（103）；根据该第一语音信号中每段子信号的响度以及该多个通道的同一段子信号的响度和，获取该第一语音信号中每段子信号的第一权重（104）；按照该多个通道的第一语音信号中每段子信号的第一权重和该多个通道的第一语音信号，得到处理后的语音信号（105）。该语音信号处理方法通过信号的权重对信号进行处理，提高了语音辨识度。

Description

语音信号处理方法、装置及服务器

本申请要求于2013年12月13日提交中国专利局、申请号为201310681217.9、发明名称为“语音信号处理方法、装置及服务器”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本发明实施例涉及通信技术领域，特别涉及一种语音信号处理方法、装置及服务器。

背景技术

随着通信技术的日益发展，在即时通讯应用中常常会遇到多个用户同时进行语音通话的情况，而在进行多方语音通信时，需要将来自多个通道的语音信号进行混音处理。

在对多个通道的语音信号进行混音处理时，一般直接将多个通道的语音信号进行简单叠加。

在对多个通道的语音信号进行直接叠加时，语音信号中所包含的无用信号也被叠加起来，使得叠加后的语音噪声较大，造成语音信号的辨识度较低，用户很难从叠加后的语音中进行辨识。

发明内容

为了解决在对多个通道的语音信号进行直接叠加时，语音信号中所包含的无用信号也被叠加起来，使得叠加后的语音噪声较大，造成语音信号的辨识度较低的问题，本发明实施例提供了一种语音信号处理方法、装置及服务器。所述技术方案如下：

第一方面，提供了一种语音信号处理方法，所述方法包括：

获取多个通道的原始语音信号，所述原始语音信号为数字语音信号；

对每一个通道的原始语音信号进行滤波，得到每一个通道的第一语音信号，所述第一语音信号的频率属于预设频率范围；

对于每一个通道的第一语音信号，获取所述第一语音信号中每段子信号的响度；

根据所述第一语音信号中每段子信号的响度以及所述多个通道的同一段子信号的响度和，获取所述第一语音信号中每段子信号的第一权重；

按照所述多个通道的第一语音信号中每段子信号的第一权重和所述多个通道的第一语音信号，得到处理后的语音信号。

可选地，按照所述多个通道的第一语音信号中每段子信号的第一权重和所述多个通道的第一语音信号，得到处理后的语音信号，包括：

根据所述多个第一权重的最大值，确定指定阈值；

对于每一个通道的第一语音信号，将第一权重小于所述指定阈值的子信号的第二权重设置为0，根据所述第一语音信号中每段子信号的响度和预定响度和，获取所述第一语音信号中第一权重不小于所述指定阈值的子信号的第二权重；其中，所述预定响度和是所述多个通道的第一语音信号中同一段子信号中除去已经将第二权重设置为0的子信号以外的子信号的响度和；

对于每一个通道的第一语音信号，根据所述第一语音信号中每段子信号的第二权重，获取所述第一语音信号中每段子信号的第三权重；

对于每一个通道的原始语音信号，根据所述第一语音信号中每段子信号的第三权重调整所述原始语音信号中对应的子信号；

将所述多个通道中调整后的每段子信号对应叠加，得到处理后的语音信号。

可选地，对于每一个通道的原始语音信号，根据所述第一语音信号中每段子信号的第三权重调整所述原始语音信号中对应的子信号，包括：

对于每一段子信号，将所述子信号的第三权重与所述原始语音信号中所述子信号的幅值相乘，得到调整后的子信号。

可选地，根据所述第一语音信号中每段子信号的第二权重，获取所述第一语音信号中每段子信号的第三权重包括：

对于每一个通道的第一语音信号，根据所述第一语音信号中每段子信号的第二权重，对所述第一语音信号中每段子信号的权重进行平滑处理，得到所述第一语音信号中每段子信号的第三权重。

可选地，所述按照所述多个通道的第一语音信号中每段子信号的第一权重和所述多个通道的第一语音信号，得到处理后的语音信号，包括：

对于所述多个通道的第一语音信号中的每一段子信号，将所述子信号的第一权重与所述原始语音信号中所述子信号的幅值相乘，得到调整后的子信号。

根据所述多个第一权重的最大值，确定指定阈值；

对于每一个通道的第一语音信号，将第一权重小于所述指定阈值的子信号的第二权重设置为0，根据所述第一语音信号中每段子信号的响度以及预定响度和，获取所述第一语音信号中第一权重不小于所述指定阈值的子信号的第二权重；其中，所述预定响度和是所述多个通道的第一语音信号中同一段子信号中除去已经将第二权重设置为0的子信号以外的子信号的响度和；

对于所述多个通道的第一语音信号中的每一段子信号，将所述子信号的第二权重与所述原始语音信号中所述子信号的幅值相乘，得到调整后的子信号。

对于每一个通道的第一语音信号，根据所述第一语音信号中每段子信号的第一权重，对所述第一语音信号中每段子信号的权重进行平滑处理，得到所述第一语音信号中每段子信号的第四权重；

对于每一个通道的原始语音信号，根据所述第一语音信号中每段子信号的第四权重与所述原始语音信号中所述子信号的幅值相乘，得到调整后的子信号；

可选地，将所述多个通道中调整后的每段子信号叠加，得到处理后的语音信号之后，所述方法还包括：

当所述处理后的语音信号的幅值大于预设阈值时，对所述处理后的语音信号进行非线性映射，得到输出语音信号。

第二方面，提供了一种语音信号处理装置，所述装置包括：

原始语音信号获取模块，用于获取多个通道的原始语音信号，所述原始语音信号为数字语音信号；

滤波模块，用于对每一个通道的原始语音信号进行滤波，得到每一个通道的第一语音信号，所述第一语音信号的频率属于预设频率范围；

响度获取模块，用于对于每一个通道的第一语音信号，获取所述第一语音信号中每段子信号的响度；

权重获取模块，用于根据所述第一语音信号中每段子信号的响度以及所述多个通道的同一段子信号的响度和，获取所述第一语音信号中每段子信号的第一权重；

语音信号处理模块，用于按照所述多个通道的第一语音信号中每段子信号的第一权重和所述多个通道的第一语音信号，得到处理后的语音信号。

可选地，所述语音信号处理模块包括：

指定阈值确定单元，用于根据所述多个通道的第一权重的最大值，确定指定阈值；

权重获取单元，用于对于每一个通道的第一语音信号，将第一权重小于所述指定阈值的子信号的第二权重设置为0，根据所述第一语音信号中每段子信号的响度和所述多个通道的第一语音信号中同一段子信号中除已将第二权重设置为0的子信号以外子信号的响度和，获取所述第一语音信号中第一权重不小于所述指定阈值的子信号的第二权重；

所述权重获取单元还用于对于每一个通道的第一语音信号，根据所述第一语音信号中每段子信号的第二权重，获取所述第一语音信号中每段子信号的第三权重；

所述语音信号处理模块还包括：调整单元，用于对于每一个通道的原始语音信号，根据所述第一语音信号中每段子信号的第三权重调整所述原始语音信号中对应的子信号；

语音信号处理单元，用于将所述多个通道中调整后的每段子信号对应叠加，得到处理后的语音信号。

可选地，所述调整单元还用于对于每一段子信号，将所述子信号的第三权重与所述原始语音信号中所述子信号的幅值相乘，得到调整后的子信号。

可选地，所述权重获取单元还用于对于每一个通道的第一语音信号，根据所述第一语音信号中每段子信号的第二权重，对所述第一语音信号中每段子信号的权重进行平滑处理，得到所述第一语音信号中每段子信号的第三权重。

可选地，所述语音信号处理模块，包括：

第一调整单元，用于对于所述多个通道的第一语音信号中的每一段子信号，将所述子信号的第一权重与所述原始语音信号中所述子信号的幅值相乘，得到调整后的子信号。

第一处理单元，用于将所述多个通道中调整后的每段子信号对应叠加，得到处理后的语音信号。

可选地，所述语音信号处理模块，包括：

指定阈值确定单元，用于根据所述多个第一权重的最大值，确定指定阈值；

第二权重单元，用于对于每一个通道的第一语音信号，将第一权重小于所述指定阈值的子信号的第二权重设置为0，根据所述第一语音信号中每段子信号的响度以及预定响度和，获取所述第一语音信号中第一权重不小于所述指定阈值的子信号的第二权重；其中，所述预定响度和是所述多个通道的第一语音信号中同一段子信号中除去已经将第二权重设置为0的子信号以外的子信号的响度和；

第二调整单元，用于对于所述多个通道的第一语音信号中的每一段子信号，将所述子信号的第二权重与所述原始语音信号中所述子信号的幅值相乘，得到调整后的子信号。

第二处理单元，用于将所述多个通道中调整后的每段子信号对应叠加，得到处理后的语音信号。

可选地，所述语音信号处理模块，包括:

第四权重单元，用于对于每一个通道的第一语音信号，根据所述第一语音信号中每段子信号的第一权重，对所述第一语音信号中每段子信号的权重进行平滑处理，得到所述第一语音信号中每段子信号的第四权重；

第四调整单元，用于对于每一个通道的原始语音信号，根据所述第一语音信号中每段子信号的第四权重与所述原始语音信号中所述子信号的幅值相乘，得到调整后的子信号；

第四处理单元，用于将所述多个通道中调整后的每段子信号对应叠加，得到处理后的语音信号。

可选地，所述装置还包括：

语音信号输出模块，用于当所述处理后的语音信号的幅值大于预设阈值时，对所述处理后的语音信号进行非线性映射，得到输出语音信号。

第三方面，提供了一种服务器，所述服务器包括：处理器和存储器，所述处理器与所述存储器相连接，

所述处理器，用于获取多个通道的原始语音信号，所述原始语音信号为数字语音信号；

所述处理器，还用于对每一个通道的原始语音信号进行滤波，得到每一个通道的第一语音信号，所述第一语音信号的频率属于预设频率范围；

所述处理器，还用于对于每一个通道的第一语音信号，获取所述第一语音信号中每段子信号的响度；

所述处理器，还用于根据所述第一语音信号中每段子信号的响度以及所述多个通道的同一段子信号的响度和，获取所述第一语音信号中每段子信号的第一权重；

所述处理器，还用于按照所述多个通道的第一语音信号中每段子信号的第一权重和所述多个通道的第一语音信号，得到处理后的语音信号。

可选地，所述处理器，还用于根据所述多个第一权重的最大值，确定指定阈值；

所述处理器，还用于对于每一个通道的第一语音信号，将第一权重小于所述指定阈值的子信号的第二权重设置为0，根据所述第一语音信号中每段子信号的响度和预定响度和，获取所述第一语音信号中第一权重不小于所述指定阈值的子信号的第二权重；其中，所述预定响度和是所述多个通道的第一语音信号中同一段子信号中除去已经将第二权重设置为0的子信号以外的子信号的响度和；

所述处理器，还用于对于每一个通道的第一语音信号，根据所述第一语音信号中每段子信号的第二权重，获取所述第一语音信号中每段子信号的第三权重；

所述处理器，还用于对于每一个通道的原始语音信号，根据所述第一语音信号中每段子信号的第三权重调整所述原始语音信号中对应的子信号；

所述处理器，还用于将所述多个通道中调整后的每段子信号对应叠加，得到处理后的语音信号。

可选地，所述处理器，还用于对于每一段子信号，将所述子信号的第三权重与所述原始语音信号中所述子信号的幅值相乘，得到调整后的子信号。

可选地，所述处理器，还用于对于每一个通道的第一语音信号，根据所述第一语音信号中每段子信号的第二权重，对所述第一语音信号中每段子信号的权重进行平滑处理，得到所述第一语音信号中每段子信号的第三权重。

可选地，所述处理器，还用于对于所述多个通道的第一语音信号中的每一段子信号，将所述子信号的第一权重与所述原始语音信号中所述子信号的幅值相乘，得到调整后的子信号。

所述处理器，还用于对于每一个通道的第一语音信号，将第一权重小于所述指定阈值的子信号的第二权重设置为0，根据所述第一语音信号中每段子信号的响度以及预定响度和，获取所述第一语音信号中第一权重不小于所述指定阈值的子信号的第二权重；其中，所述预定响度和是所述多个通道的第一语音信号中同一段子信号中除去已经将第二权重设置为0的子信号以外的子信号的响度和；

所述处理器，还用于对于所述多个通道的第一语音信号中的每一段子信号，将所述子信号的第二权重与所述原始语音信号中所述子信号的幅值相乘，得到调整后的子信号。

所述处理器，还用于对于每一个通道的第一语音信号，根据所述第一语音信号中每段子信号的第一权重，对所述第一语音信号中每段子信号的权重进行平滑处理，得到所述第一语音信号中每段子信号的第四权重；

所述处理器，还用于对于每一个通道的原始语音信号，根据所述第一语音信号中每段子信号的第四权重与所述原始语音信号中所述子信号的幅值相乘，得到调整后的子信号；

可选地，所述处理器，还用于当所述处理后的语音信号的幅值大于预设阈值时，对所述处理后的语音信号进行非线性映射，得到输出语音信号。

本发明实施例提供的技术方案带来的有益效果是：

通过对多个通道的数字语音信号进行滤波，去掉不包含人正常发声的语音信号，得到每一个通道的第一语音信号，并根据该第一语音信号中每段子信号的响度，对该多个通道的第一语音信号进行处理，得到处理后的语音信号，有效的去除了语音信号中响度较低的无用信号，使得处理后的语音噪声减少，语音信号的辨识度提高，便于用户从处理后的语音信号中辨识有用信号。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的一种语音信号处理方法的流程图；

图2是本发明实施例提供的另一种语音信号处理方法的流程图；

图3是本发明实施例提供的另一种语音信号处理方法的流程图；

图4是本发明实施例提供的另一种语音信号处理方法的流程图；

图5是本发明实施例提供的另一种语音信号处理方法的流程图；

图6是本发明实施例提供的一种语音信号处理装置的结构示意图；

图7是本发明实施例提供的一种服务器的结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面将结合附图对本发明实施方式作进一步地详细描述。

图1是本发明实施例提供的一种语音信号处理方法的流程图。参见图1，本实施例以执行主体为服务器为例来举例说明，该方法包括：

101、获取多个通道的原始语音信号，该原始语音信号为数字语音信号。

102、对每一个通道的原始语音信号进行滤波，得到每一个通道的第一语音信号，该第一语音信号的频率属于预设频率范围。

103、对于每一个通道的第一语音信号，获取该第一语音信号中每段子信号的响度。

104、根据该第一语音信号中每段子信号的响度以及该多个通道的同一段子信号的响度和，获取该第一语音信号中每段子信号的第一权重。

105、按照该多个通道的第一语音信号中每段子信号的第一权重和该多个通道的第一语音信号，得到处理后的语音信号。

本发明实施例提供的方法，通过对多个通道的数字语音信号进行滤波，去掉不包含人正常发声的语音信号，得到每一个通道的第一语音信号，并根据该第一语音信号中每段子信号的响度，对该多个通道的第一语音信号进行处理，得到处理后的语音信号，有效的去除了语音信号中响度较低的无用信号，使得处理后的语音噪声减少，语音信号的辨识度提高，便于用于从处理后的语音信号中辨识有用信号。

图2是本发明实施例提供的另一种语音信号处理方法的流程图。参见图2，本实施例以执行主体为服务器为例来举例说明，该方法包括：

201、获取多个通道的原始语音信号，该原始语音信号为数字语音信号。

以服务器是即时通讯应用的服务器为例，当用户通过即时通讯应用与多个联系人进行语音通信，或用户在即时通信应用的群组中进行语音通信时，服务器在同一时间段内可能会接收到来自多个用户的语音信号，服务器以每个用户的语音信号作为一个通道的原始语音信号。

服务器接收多个通道发送的原始语音信号，该原始语音信号的传输为一帧一帧进行，也即原始语音信号中包括多个在时间上连续的帧。为了便于描述和理解，本发明实施例的后续步骤中仅以子信号来代替帧。其中，原始语音信号为数字语音信号。

202、对每一个通道的原始语音信号进行滤波，得到每一个通道的第一语音信号，该第一语音信号的频率属于预设频率范围。

由于该多个通道的数字语音信号中不仅包含用户需要的语音信号，还包含大量无用信号，如噪声等。服务器需要从该多个通道的原始语音信号中过滤出有用信号，该有用信号可以是属于人正常发声的频率范围内的语音信号。

其中，预设频率范围可以由技术人员在开发时设置，也可以由用户在使用的过程中调整，本发明实施例对此不做限定。该预设频率范围具体可以为 100Hz～4KHz，也可以为其他频率范围。

203、对于每一个通道的第一语音信号，获取该第一语音信号中每段子信号的响度。

进一步地，服务器还可以根据响度来区分第一语音信号中的有用信号和无用信号，用户的声音一般要比背景音的响度大。

服务器可以根据预设响度算法，计算每一个通道的第一语音信号中每段子信号的响度。其中，预设响度算法可以由技术人员在开发时设置，也可以由用户在使用的过程中调整，本发明实施例对此不做限定。该预设响度算法具体可以为Zwicker响度量测模型，当然也可以是其它响度算法。

204、根据该第一语音信号中每段子信号的响度以及该多个通道的同一段子信号的响度和，获取该第一语音信号中每段子信号的第一权重。

一个子信号的响度在同一段子信号的响度和中所占的比例可以直接影响到该子信号在叠加后的语音信号中的辨识度，因此，服务器可以通过步骤204确定所有通道中每段子信号的第一权重。同一段子信号是指多个通道的第一语音信号中，在时间维度上属于同一时间片的子信号。

具体地，服务器将多个通道的第一语音信号中的同一段子信号的响度进行相加，得到该多个通道的同一段子信号的响度和。

可选地，服务器将该第一语音信号中每段子信号的响度与该多个通道的同一段子信号的响度和相除，得到该第一语音信号中每段子信号的第一权重。

例如，如果接收语音信号的通道数为2，分别为通道1和通道2，每一个通道的第一语音信号包括3段子信号，分别为子信号1、子信号2和子信号3，且通道1中的子信号1的响度为1、子信号2的响度为3、子信号3的响度为4，通道2中的子信号1的响度为2、子信号2的响度为5、子信号3的响度为7，则两个通道的第一语音信号中第一段子信号的响度和为1+2＝3、第二段子信号的响度和为3+5＝8、第三段子信号的响度和为4+7＝11。

对应地，通道1中的子信号1的第一权重为1/3、子信号2的第一权重为3/8、子信号3的第一权重为4/11，通道2中的子信号1的第一权重为2/3，子信号2的第一权重为5/8，子信号3的第一权重为7/11。也即，如下表所示：

	子信号1	子信号2	子信号3
	子信号1	子信号2	子信号3	通道1(响度)	1	3	4
通道2(响度)	2	5	7	通道1(响度)	1	3	4

同一段子信号的响度和	3	8	11
同一段子信号的响度和	3	8	11	通道1(第一权重)	1/3	3/8	4/11
通道2(第一权重)	2/3	5/8	7/11	通道1(第一权重)	1/3	3/8	4/11

205、对于多个通道的第一语音信号中的每一段子信号，将子信号的第一权重与原始语音信号中子信号的幅值相乘，得到调整后的子信号。

其中，幅值可以用于表示原始语音信号的频率或信号强度，根据模数转换时所采用的采样参数不同而变化。当然，该幅值还可以由其它参数表示，本发明实施例对此不做限定。

比如，将通道1中的子信号1的幅值与第一权重1/3相乘，得到调整后的子信号11；又比如，将通道2中的子信号的幅值与第一权重2/3相乘，得到调整后的子信号21。

206、将多个通道中调整后的每段子信号对应叠加，得到处理后的语音信号。

对于调整后的每段子信号，服务器将多个通道中属于同一时间片的子信号对应叠加，得到处理后的语音信号。

比如，将调整后的子信号11与调整后的子信号21相加，得到处理后的语音信号的子信号1。

进一步地，本发明实施例提供的方法，通过根据响度来得到第一权重，并根据第一权重来调整原始语音信号后叠加，得到处理后的语音信号；能够有效地减少语音信号中响度较低的无用信号，使得处理后的语音信号中的噪声减少。

作为可选的实现方式，在图2所示实施例的基础上，还可以将响度低于指定阈值的子信号完全去掉。换句话说，作为步骤205和步骤206的一种可替代实现方式，如图3所示，该语音信号处理方法可以包括：

205a、根据多个第一权重的最大值，确定指定阈值。

第一权重较小的子信号通常为噪声信号，为了过滤掉第一权重较小的子信号，服务器需要根据多个第一权重来确定指定阈值。

比如，该指定阈值可以为该多个第一权重的最大值的0.1倍等，当然该指定阈值也可以是其他表示方式，本发明实施例对此不做限定。

206a、对于每一个通道的第一语音信号，将第一权重小于指定阈值的子信号的第二权重设置为0，根据第一语音信号中每段子信号的响度以及预定响度和，获取第一语音信号中第一权重不小于指定阈值的子信号的第二权重。

其中，预定响度和是多个通道的第一语音信号中同一段子信号中除去已经将第二权重设置为0的子信号以外的子信号的响度和。

具体地，服务器将第一权重小于指定阈值的子信号的第二权重设置为0，并计算多个通道的第一语音信号中的同一段子信号中除去已经将第二权重设置为0的子信号以外的子信号的响度和作为预定响度和。

服务器可以利用第一语音信号中每段子信号的响度与预定响度和相除，得到该第一语音信号中第一权重不小于指定阈值的子信号的第二权重。

比如，基于步骤204的示例，两个通道的第一权重的最大值为2/3，如果指定阈值为0.35，则通道1中的子信号1的第一权重1/3小于指定阈值，服务器将通道1中的子信号1的第二权重设置为0。

又比如，通道2中的子信号1的第一权重为2/3大于指定阈值，则服务器先将通道1中的子信号1的响度去除，然后计算第一段子信号的响度和等于通道2中的子信号1的响度2，再计算得到通道2中的子信号1的第二权重为2/2＝1。

207a、对于多个通道的第一语音信号中的每一段子信号，将子信号的第二权重与原始语音信号中该子信号的幅值相乘，得到调整后的子信号。

比如，将通道1中的子信号1的幅值与第二权重0相乘，得到调整后的子信号11；又比如，将通道2中的子信号1的幅值与第二权重1相乘，得到调整后的子信号21。

208a、将多个通道中调整后的每段子信号对应叠加，得到处理后的语音信号。

综上所述，本实施例提供的语音信号处理方法，通过计算每段子信号的第二权重，对第一权重小于指定阈值的子信号完全去除，更进一步地减少语音信号中响度较低的无用信号，使得处理后的语音信号中的噪声减少。

作为可选的实现方式，在图2所示实施例的基础上，还可以将第一权重进行平滑处理，避免处理后的声音信号出现声音忽大忽小的现象。换句话说，作为步骤205和步骤206的一种可替代实现方式，如图4所示，该语音信号处理方法可以包括：

205b，对于每一个通道的第一语音信号，根据第一语音信号中每段子信号的第一权重，对第一语音信号中每段子信号的权重进行平滑处理，得到第一语音信号中每段子信号的第四权重。

为了均衡子信号的声音效果，对于一段子信号来说，当获取到该段子信号的第一权重时，可以通过服务器中的二阶低通滤波模块对该段子信号的第一权重进行平滑处理。

该步骤205b可以包括：对于每一个通道的第一语音信号中第m段子信号，服务器根据该第一语音信号中第m段子信号的第一权重和第m-1段子信号的第二权重，对该第一语音信号中第m段子信号的权重进行平滑处理，得到该第一语音信号中第m段子信号的第四权重。另外，服务器还将该第m段子信号的第四权重作为该通道中第m+1段子信号的第四权重初值，并根据该第一语音信号中第m+1段子信号的第一权重，对该第m+1段子信号的权重进行平滑处理，得到该第m+1段子信号的第四权重。依据上述过程进行迭代，得到该第一语音信号中每段子信号的第四权重。

其中，平滑处理可以是将较大的权重和较小的权重中和，得到一个中间值，该中间值可以通过插值等算法获取。

需要说明的是，对于每一个通道的第1段子信号，服务器根据该第1段子信号的第一权重，获取该第1段子信号的第四权重的过程可以为：服务器根据该第1段子信号的第一权重和预设初值，对该第1段子信号的权重进行平滑处理，得到该第1段子信号的第四权重。相应地，该第1段子信号的第四权重作为第2段子信号的第四权重初值，并根据第2段子信号的第一权重，以此获取该第2段子信号的第四权重。该预设初值可以由技术人员在开发时设置，也可以由用户在使用的过程中调整，本发明实施例对此不做限定。

基于步骤204的示例，通道2中的子信号1的第一权重为2/3，服务器中的二阶低通滤波模块的配置参数可以为0.7和0.3，预设初值为0.6，则根据通道2中的子信号1的第一权重和该预设初值对通道2中的子信号1的权重进行平滑处理，具体可以为：首先，服务器将该预设初值乘以0.7，该第一权重乘以0.3，并将两个结果相加，将得到的结果作为通道2中的子信号1的第四权重，该第四权重为0.62。然后，服务器将该通道2中的子信号1的第四权重0.62作为该通道2中的子信号2的第四权重初值，服务器根据该通道2中的子信号2的第一权重5/8，计算得到该通道2中的子信号2的第四权重为0.62*0.7+5/8*0.3＝0.6215。最后，服务器将通道2中的子信号2的第四权重0.6215作为该通道2中的子信号3的第四权重初值，通过上述过程，得到该通道2中的子信号3的第四权重。

206b，对于每一个通道的原始语音信号，根据第一语音信号中每段子信号的第四权重与原始语音信号中该子信号的幅值相乘，得到调整后的子信号。

比如，将通道2中的子信号1的幅值与第四权重0.62相乘，得到调整后的子信号21；又比如，将通道2中的子信号2的幅值与第四权重0.6215相乘，得到调整后的子信号22。

207b，将多个通道中调整后的每段子信号对应叠加，得到处理后的语音信号。

综上所述，本实施例提供的语音信号处理方法，通过对第一权重平滑后，得到每段子信号的第四权重，可以避免处理后的语音信号中出现声音忽大忽小的现象。

上述几种实施例还可以综合实现成为图5所示的实施例。

图5是本发明实施例提供的一种语音信号处理方法的流程图。参见图5，本实施例以执行主体为服务器为例来举例说明，该方法包括：

501、服务器获取多个通道的原始语音信号，该原始语音信号为数字语音信号。

该服务器用于对多个通道的原始语音信号进行处理，该服务器可以为即时通讯应用的服务器、会议服务器等。

以即时通讯应用的服务器为例，当用户通过即时通讯应用与多个联系人进行语音通信，或用户在即时通信应用的群组中进行语音通信时，服务器在同一时间段内可能会接收到来自多个用户的语音信号，以每个用户的语音信号作为一个通道的原始语音信号，为了得到最终的输出语音信号，服务器需要将多个通道的原始语音信号进行步骤501至步骤511所示出的叠加过程。

502、服务器对每一个通道的原始语音信号进行滤波，得到每一个通道的第一语音信号，该第一语音信号的频率属于预设频率范围。

由于该多个通道的数字语音信号中不仅包含用户需要的语音信号，还包含大量无用信号，如噪声等，为了简化后续的语音处理过程，服务器需要从该多个通道的原始语音信号中过滤出有用信号，该有用信号可以是属于人正常发声的频率范围内的语音信号。

该步骤502可以具体包括：服务器根据预设频率范围，对每一个通道中的数字信号进行滤波，过滤掉频率不在预设频率范围内的数字语音信号，得到处于预设频率范围内的数字语音信号，服务器将该处于预设频率范围内的数字语音信号作为第一语音信号。

其中，预设频率范围可以由技术人员在开发时设置，也可以由用户在使用的过程中调整，本发明实施例对此不做限定。该预设频率范围具体可以为100Hz～4KHz，也可以为其他频率范围。而且，本发明实施例中是以人正常发声时的声音频率来确定预设频率范围来举例说明，当然，还可以是以其他声音的频率来确定该预设频率范围，本发明实施例对如何确定预设频率范围不做限定。

503、服务器对于每一个通道的第一语音信号，获取该第一语音信号中每段子信号的响度。

在语音通信过程中，还可以根据响度区分有用信号和无用信号，用户的声音一般要比背景音的响度大。因此，服务器可以通过响度确定第一语音信号中需要去除的部分。

该步骤203可以具体包括：服务器根据预设响度算法，计算每一个通道的第一语音信号中每段子信号的响度。其中，预设响度算法可以由技术人员在开发时设置，也可以由用户在使用的过程中调整，本发明实施例对此不做限定。该预设响度算法具体可以为Zwicker响度量测模型，当然也可以是其它响度算法，本发明实施例中以适用于人声的Zwicker响度量测模型为例来进行说明。

504、服务器根据该第一语音信号中每段子信号的响度以及该多个通道的同一段子信号的响度和，获取该第一语音信号中每段子信号的第一权重。

子信号的响度在同一段子信号的响度和中所占的比例可以直接影响到该子信号在叠加后的语音信号中的辨识度，因此，服务器可以通过步骤204确定所有通道中每段子信号的第一权重。同一段子信号是指多个通道的第一语音信号中，在时间维度上属于同一时间段的子信号。

例如，如果接收语音信号的通道数为2，分别为通道1和通道2，每一个通道的第一语音信号包括3段子信号，分别为子信号1、子信号2和子信号3，且通道1中的子信号1的响度为1、子信号2的响度为3、子信号3的响度为4，通道2中的子信号1的响度为2、子信号2的响度为5、子信号3的响度为7，则两个通道的第一语音信号中第一段子信号的响度和为1+2＝3、第二段子信号的响度和为3+5＝8、第三段子信号的响度和为4+7＝11。对应地，通道1中的子信号1的第一权重为1/3、子信号2的第一权重为3/8、子信号3的第一权重为4/11，通道2中的子信号1的第一权重为2/3，子信号2的第一权重为5/8，子信号3的第一权重为7/11。

505、服务器根据该多个第一权重的最大值，确定指定阈值。

该步骤205具体为：服务器通过对比该第一语音信号中每段子信号的第一权重，得到该多个第一权重中的最大值，根据人耳听觉能够清晰分辨的语音信号权重、该多个第一权重的最大值以及通道环境，确定指定阈值。

需要说明的是，该指定阈值具体可以为该多个第一权重的最大值的0.1倍等，当然该指定阈值也可以是其他表示方式，本发明实施例对此不做限定。

506、对于每一个通道的第一语音信号，服务器将第一权重小于该指定阈值的子信号的第二权重设置为0，根据该第一语音信号中每段子信号的响度和预定响度和，获取该第一语音信号中第一权重不小于该指定阈值的子信号的第二权重。

预定响度和是指该多个通道的第一语音信号中同一段子信号中除去已经将第二权重设置为0的子信号以外的子信号的响度和。

服务器利用第一语音信号中每段子信号的响度与预定响度和相除，得到该第一语音信号中第一权重不小于指定阈值的子信号的第二权重。

需要说明的是，上述步骤206的过程，作为一种可替代的实现方式：服务器将该第一权重小于指定阈值的子信号的响度设置为0，根据该第一语音信号中每段子信号的响度和多个通道的同一段子信号的响度和，获取该第一语音信号中每段子信号的第二权重。其中，对于第一权重小于指定阈值的子信号，由于该子信号的响度为0，因此在最终计算结果中，第一权重小于指定阈值的子信号的第二权重也为0。

其中，为了简化响度的计算过程，服务器在得到第一语音信号中每段子信号的响度后，可以将第一语音信号中每段子信号设置信号标识，并将每段子信号的信号标识与该段子信号的响度对应存储，当服务器执行步骤206的过程时，服务器获取该第一语音信号中每段子信号的信号标识，并根据该段子信号的信号标识从已存储的响度中得到该段子信号的响度。其中，信号标识可以根据通道标号和子信号的标号进行表示，基于步骤204的示例，通道1中的子信号2的信号标识可以表示为12，通道2中的子信号3的信号标识可以表示为23等，当然，该信号标识还可以通过其他方式表示，本发明实施例对此不做限定。

507、对于每一个通道的第一语音信号，服务器根据该第一语音信号中每段子信号的第二权重，获取该第一语音信号中每段子信号的第三权重。

为了均衡子信号的声音效果，对于一段子信号来说，当获取到该段子信号的第二权重时，可以通过服务器中的二阶低通滤波模块对该段子信号的第二权重进行处理。

该步骤507可以具体包括：对于每一个通道的第一语音信号中第m段子信号，服务器根据该第一语音信号中第m段子信号的第二权重和第m-1段子信号的第三权重，对该第一语音信号中第m段子信号的权重进行平滑处理，得到该第一语音信号中第m段子信号的第三权重，该第m段子信号的第三权重作为该通道中第m+1段子信号的第三权重初值，并根据该第一语音信号中第m+1段子信号的第二权重，对该第m+1段子信号的权重进行平滑处理，得到该第m+1段子信号的第三权重。依据上述过程进行迭代，得到该第一语音信号中每段子信号的第三权重。

需要说明的是，对于每一个通道的第1段子信号，服务器根据该第1段子信号的第二权重，获取该第1段子信号的第三权重的过程可以为：服务器根据该第1段子信号的第二权重和预设初值，对该第1段子信号的权重进行平滑处理，得到该第1段子信号的第三权重。相应地，该第1段子信号的第三权重作为第2段子信号的第三权重初值，并根据第2段子信号的第二权重，以此获取该第2段子信号的第三权重。该预设初值可以由技术人员在开发时设置，也可以由用户在使用的过程中调整，本发明实施例对此不做限定。

基于步骤504的示例，通道2中的子信号1的第一权重为2/3，当经过步骤206后，通道2中的子信号1的第二权重为1，服务器中的二阶低通滤波模块的配置参数可以为0.7和0.3，预设初值为0.6，则根据通道2中的子信号1预设初值和该第二权重对通道2中的子信号1的权重进行平滑处理，具体可以为该预设初值乘以0.7，该第二权重乘以0.3，并将两个结果相加，将得到的结果作为通道2中的子信号1的第三权重，该第三权重为0.72。该通道2中的子信号1的第三权重0.72作为该通道2中的子信号2的第三权重初值，服务器根据该通道2中的子信号2的第二权重5/8，计算得到该通道2中的子信号2的第三权重为0.6915，并将通道2中的子信号2的第三权重0.6915作为该通道2中的子信号3的第三权重初值，通过上述过程，得到该通道2中的子信号3的第三权重。

当然，服务器对该第一语音信号中每段子信号的权重进行平滑处理的方式，还可以是除上述方式以外的其它方式，本发明实施例对服务器使用何种方式对子信号的权重进行平滑处理不做限定。

508、对于每一个通道的原始语音信号，服务器根据该第一语音信号中每段子信号的第三权重调整该原始语音信号中对应的子信号。

由于原始语音信号中每段子信号为数字语音信号，对于每一段子信号，将该子信号的第三权重与该原始语音信号中该子信号的幅值相乘，得到调整后的子信号。

其中，幅值可以用于表示原始语音信号的频率或信号强度，根据模数转换时所采用的采样参数不同而变化，当然，该幅值还可以由其它参数表示，本发明实施例对此不做限定。

如果接收原始语音信号的通道数为2，分别为通道1和通道2，每一个通道的第一语音信号包括3段子信号，分别为子信号1、子信号2和子信号3，通道1中的子信号2包含100个数据，其中第51个数据为10，若通道1中的子信号2的第三权重为0.2，则将通道1中子信号2的第51个数据10乘以0.2，得到调整后的子信号2的第51个数据为2。

509、服务器将该多个通道中调整后的每段子信号对应叠加，得到处理后的语音信号。

具体地，服务器将多个通道中同一时间段接收到的经过第三权重调整的原始语音信号进行叠加。

也即，同一时间段中多个通道的每段子信号根据接收时间对应叠加，得到处理后的语音信号。

当该处理后的语音信号的幅值超过了数字域所能表征的幅值时，服务器需要对该处理后的语音信号进行进一步处理，防止该处理后的语音中出现破音的现象，则服务器还可以执行如下步骤510：

510、当该处理后的语音信号的幅值大于预设阈值时，服务器对该处理后的语音信号进行非线性映射，得到输出语音信号。

具体地，服务器根据处理后的语音信号的幅值，确定该处理后的语音信号的幅值是否大于预设阈值，当该处理后的语音信号的幅值大于预设阈值时，服务器将该处理后的语音信号的幅值大于预设阈值的语音信号映射到指定范围内，使得输出语音信号的最大幅值不会超出数字域所能表征的范围。

例如，数字域的16比特能表示的范围是-32768～32767，如果预设阈值为27000，处理后的语音信号的幅值范围为-40000～40000，服务器需要将幅值范围在-40000～-27000及27000～40000的语音信号进行非线性映射，服务器将语音信号根据预设规则映射到指定区域-32768～32767内。

比如，将-40000～-27000的语音信号非线性映射至-32768～-27000；将27000～40000的语音信号非线性映射至27000～32767内。

其中，预设规则可以是某一个函数，也可以是其它方法，本发明实施例对此不做限定。

其中，该预设阈值没有处于数字域能表征的范围内，该预设阈值可以由技术人员在开发时设置，也可以由用户在使用的过程中调整，本发明实施例对此不做限定。

本发明实施例是以执行主体为服务器为例进行说明，当然，该过程还可以在终端设备上执行。

本发明实施例提供的方法，通过对多个通道的数字语音信号进行滤波，去掉不包含人正常发声的语音信号，得到每一个通道的第一语音信号，并根据该第一语音信号中每段子信号的响度，对该多个通道的第一语音信号进行处理，得到处理后的语音信号，有效的去除了语音信号中响度较低的无用信号，使得处理后的语音噪声减少，语音信号的辨识度提高，便于用户从处理后的语音信号中辨识有用信号。

进一步地，通过计算每段子信号的第二权重，并根据每段子信号的第二权重，得到每段子信号的第三权重，从而根据该第三权重对原始语音信号进行叠加，大大降低了处理后语音信号中所包含的噪音信号，语音信号的辨识度大大提高。

进一步地，对处理后的语音信号进行非线性映射，防止了输出语音信号出现破音现象。

图6是本发明实施例提供的一种语音信号处理装置的结构示意图。参见图6，该装置包括：原始语音信号获取模块601、滤波模块602、响度获取模块603、权重获取模块604和语音信号处理模块605。

其中，原始语音信号获取模块601，用于获取多个通道的原始语音信号，该原始语音信号为数字语音信号；模数转换模块601与滤波模块602相连接，该滤波模块602，用于对每一个通道的原始语音信号进行滤波，得到每一个通道的第一语音信号，该第一语音信号的频率属于预设频率范围；滤波模块602与响度获取模块603相连接，该响度获取模块603，用于对于每一个通道的第一语音信号，获取该第一语音信号中每段子信号的响度；响度获取模块603与权重获取模块604相连接，该权重获取模块604，用于根据该第一语音信号中每段子信号的响度以及该多个通道的同一段子信号的响度和，获取该第一语音信号中每段子信号的第一权重；权重获取模块604与语音信号处理模块605相连接，该语音信号处理模块605，用于按照该多个通道的第一语音信号中每段子信号的第一权重和该多个通道的第一语音信号，得到处理后的语音信号。

可选地，该语音信号处理模块605包括：

指定阈值确定单元，用于根据该多个通道的第一权重的最大值，确定指定阈值；

权重获取单元，用于对于每一个通道的第一语音信号，将第一权重小于该指定阈值的子信号的第二权重设置为0，根据该第一语音信号中每段子信号的响度和预定响度和，获取该第一语音信号中第一权重不小于该指定阈值的子信号的第二权重；该预定响度和是指该多个通道的第一语音信号中同一段子信号中除去已经将第二权重设置为0的子信号以外的子信号的响度和。

该权重获取单元，还用于对于每一个通道的第一语音信号，根据该第一语音信号中每段子信号的第二权重，获取该第一语音信号中每段子信号的第三权重；

该语音信号处理模块还包括：调整单元，用于对于每一个通道的原始语音信号，根据该第一语音信号中每段子信号的第三权重调整该原始语音信号中对应的子信号；

语音信号处理单元，用于将该多个通道中调整后的每段子信号对应叠加，得到处理后的语音信号。

可选地，该调整单元还用于对于每一段子信号，将该子信号的第三权重与该原始语音信号中该子信号的幅值相乘，得到调整后的子信号。

可选地，该权重获取单元还用于对于每一个通道的第一语音信号，根据该第一语音信号中每段子信号的第二权重，对该第一语音信号中每段子信号的权重进行平滑处理，得到该第一语音信号中每段子信号的第三权重。

可选地，该装置还包括：

语音信号输出模块，用于当该处理后的语音信号的幅值大于预设阈值时，对该处理后的语音信号进行非线性映射，得到输出语音信号。

综上所述，本发明实施例提供的装置，通过对多个通道的数字语音信号进行滤波，去掉不包含人正常发声的语音信号，得到每一个通道的第一语音信号，并根据该第一语音信号中每段子信号的响度，对该多个通道的第一语音信号进行处理，得到处理后的语音信号，有效的去除了语音信号中响度较低的无用信号，使得处理后的语音噪声减少，语音信号的辨识度提高，便于用户从处理后的语音信号中辨识有用信号。

需要说明的是：上述实施例提供的语音信号处理装置在对语音信号处理时，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将服务器的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。另外，上述实施例提供的语音信号处理装置与语音信号处理方法实施例属于同一构思，其具体实现过程详见方法实施例，这里不再赘述。

作为另外一种可能的实施方式，语音信号处理模块605，包括：

作为另外一种可能的实施方式，语音信号处理模块605，包括:

图7是本发明实施例提供的一种服务器的结构示意图。参见图7，该服务器包括：处理器701和存储器702，该处理器701与该存储器702相连接。

该处理器701，用于获取多个通道的原始语音信号，该原始语音信号为数字语音信号；

该处理器701，还用于对每一个通道的原始语音信号进行滤波，得到每一个通道的第一语音信号，该第一语音信号的频率属于预设频率范围；

该处理器701，还用于对于每一个通道的第一语音信号，获取该第一语音信号中每段子信号的响度；

该处理器701，还用于根据该第一语音信号中每段子信号的响度以及该多个通道的同一段子信号的响度和，获取该第一语音信号中每段子信号的第一权重；

该处理器701，还用于按照该多个通道的第一语音信号中每段子信号的第一权重和该多个通道的第一语音信号，得到处理后的语音信号。

在基于图7所示实施例的第一种可能的实现方式中，该处理器701还用于按照该多个第一权重的最大值，确定指定阈值；

该处理器701，还用于对于每一个通道的第一语音信号，将第一权重小于该指定阈值的子信号的第二权重设置为0，根据该第一语音信号中每段子信号的响度和预定响度和，获取该第一语音信号中第一权重不小于该指定阈值的子信号的第二权重；其中，预定响度和是指该多个通道的第一语音信号中同一段子信号中除去已经将第二权重设置为0的子信号以外的子信号的响度和。

该处理器701，还用于对于每一个通道的第一语音信号，根据该第一语音信号中每段子信号的第二权重，获取该第一语音信号中每段子信号的第三权重。

该处理器701，还用于对于每一个通道的原始语音信号，根据该第一语音信号中每段子信号的第三权重调整该原始语音信号中对应的子信号。

该处理器701，还用于将该多个通道中调整后的每段子信号对应叠加，得到处理后的语音信号。

可选地，该处理器701还用于对于每一段子信号，将该子信号的第三权重与该原始语音信号中该子信号的幅值相乘，得到调整后的子信号。

可选地，该处理器701还用于对于每一个通道的第一语音信号，根据该第一语音信号中每段子信号的第二权重，对该第一语音信号中每段子信号的权重进行平滑处理，得到该第一语音信号中每段子信号的第三权重。

在基于图7所示实施例的第二种可能的实现方式中，所述处理器，还用于对于所述多个通道的第一语音信号中的每一段子信号，将所述子信号的第一权重与所述原始语音信号中所述子信号的幅值相乘，得到调整后的子信号。

在基于图7所示实施例的第三种可能的实现方式中，所述处理器，还用于根据所述多个第一权重的最大值，确定指定阈值；

在基于图7所示实施例的第四种可能的实现方式中，所述处理器，还用于对于每一个通道的第一语音信号，根据所述第一语音信号中每段子信号的第一权重，对所述第一语音信号中每段子信号的权重进行平滑处理，得到所述第一语音信号中每段子信号的第四权重；

结合基于图7所示实施例的第一种可能的实现方式，或第二种可能的实现方式，或第三种可能的实现方式，或第四种可能的实现方式，在第五种可能的实施方式中，该处理器701还用于当该处理后的语音信号的幅值大于预设阈值时，对该处理后的语音信号进行非线性映射，得到输出语音信号。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成，也可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，上述提到的存储介质可以是只读存储器，磁盘或光盘等。

以上所述仅为本发明的较佳实施例，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

一种语音信号处理方法，其特征在于，所述方法包括：

获取多个通道的原始语音信号，所述原始语音信号为数字语音信号；

对每一个通道的原始语音信号进行滤波，得到每一个通道的第一语音信号，所述第一语音信号的频率属于预设频率范围；

对于每一个通道的第一语音信号，获取所述第一语音信号中每段子信号的响度；

根据所述第一语音信号中每段子信号的响度以及所述多个通道的同一段子信号的响度和，获取所述第一语音信号中每段子信号的第一权重；

按照所述多个通道的第一语音信号中每段子信号的第一权重和所述多个通道的第一语音信号，得到处理后的语音信号。
根据权利要求1所述的方法，其特征在于，所述按照所述多个通道的第一语音信号中每段子信号的第一权重和所述多个通道的第一语音信号，得到处理后的语音信号，包括：

根据所述多个第一权重的最大值，确定指定阈值；

对于每一个通道的第一语音信号，将第一权重小于所述指定阈值的子信号的第二权重设置为0，根据所述第一语音信号中每段子信号的响度和预定响度和，获取所述第一语音信号中第一权重不小于所述指定阈值的子信号的第二权重；其中，所述预定响度和是所述多个通道的第一语音信号中同一段子信号中除去已经将第二权重设置为0的子信号以外的子信号的响度和；

对于每一个通道的第一语音信号，根据所述第一语音信号中每段子信号的第二权重，获取所述第一语音信号中每段子信号的第三权重；

对于每一个通道的原始语音信号，根据所述第一语音信号中每段子信号的第三权重调整所述原始语音信号中对应的子信号；

将所述多个通道中调整后的每段子信号对应叠加，得到处理后的语音信号。
根据权利要求2所述的方法，其特征在于，所述对于每一个通道的原始语音信号，根据所述第一语音信号中每段子信号的第三权重调整所述原始语音信号中对应的子信号，包括：

对于每一段子信号，将所述子信号的第三权重与所述原始语音信号中所述子信号的幅值相乘，得到调整后的子信号。
根据权利要求2所述的方法，其特征在于，所述根据所述第一语音信号中每段子信号的第二权重，获取所述第一语音信号中每段子信号的第三权重，包括：

对于每一个通道的第一语音信号，根据所述第一语音信号中每段子信号的第二权重，对所述第一语音信号中每段子信号的权重进行平滑处理，得到所述第一语音信号中每段子信号的第三权重。
根据权利要求1所述的方法，其特征在于，所述按照所述多个通道的第一语音信号中每段子信号的第一权重和所述多个通道的第一语音信号，得到处理后的语音信号，包括：

对于所述多个通道的第一语音信号中的每一段子信号，将所述子信号的第一权重与所述原始语音信号中所述子信号的幅值相乘，得到调整后的子信号；

将所述多个通道中调整后的每段子信号对应叠加，得到处理后的语音信号。
根据权利要求1所述的方法，其特征在于，所述按照所述多个通道的第一语音信号中每段子信号的第一权重和所述多个通道的第一语音信号，得到处理后的语音信号，包括：

根据所述多个第一权重的最大值，确定指定阈值；

对于每一个通道的第一语音信号，将第一权重小于所述指定阈值的子信号的第二权重设置为0，根据所述第一语音信号中每段子信号的响度以及预定响度和，获取所述第一语音信号中第一权重不小于所述指定阈值的子信号的第二权重；其中，所述预定响度和是所述多个通道的第一语音信号中同一段子信号中除去已经将第二权重设置为0的子信号以外的子信号的响度和；

对于所述多个通道的第一语音信号中的每一段子信号，将所述子信号的第二权重与所述原始语音信号中所述子信号的幅值相乘，得到调整后的子信号；

将所述多个通道中调整后的每段子信号对应叠加，得到处理后的语音信号。
根据权利要求1所述的方法，其特征在于，所述按照所述多个通道的第一语音信号中每段子信号的第一权重和所述多个通道的第一语音信号，得到处理后的语音信号，包括：

对于每一个通道的第一语音信号，根据所述第一语音信号中每段子信号的第一权重，对所述第一语音信号中每段子信号的权重进行平滑处理，得到所述第一语音信号中每段子信号的第四权重；

对于每一个通道的原始语音信号，根据所述第一语音信号中每段子信号的第四权重与所述原始语音信号中所述子信号的幅值相乘，得到调整后的子信号；

将所述多个通道中调整后的每段子信号对应叠加，得到处理后的语音信号。
根据权利要求2至7任一所述的方法，其特征在于，所述将所述多个通道中调整后的每段子信号叠加，得到处理后的语音信号之后，所述方法还包括：

当所述处理后的语音信号的幅值大于预设阈值时，对所述处理后的语音信号进行非线性映射，得到输出语音信号。
一种语音信号处理装置，其特征在于，所述装置包括：

原始语音信号获取模块，用于获取多个通道的原始语音信号，所述原始语音信号为数字语音信号；

滤波模块，用于对每一个通道的原始语音信号进行滤波，得到每一个通道的第一语音信号，所述第一语音信号的频率属于预设频率范围；

响度获取模块，用于对于每一个通道的第一语音信号，获取所述第一语音信号中每段子信号的响度；

权重获取模块，用于根据所述第一语音信号中每段子信号的响度以及所述多个通道的同一段子信号的响度和，获取所述第一语音信号中每段子信号的第一权重；

语音信号处理模块，用于按照所述多个通道的第一语音信号中每段子信号的第一权重和所述多个通道的第一语音信号，得到处理后的语音信号。
根据权利要求9所述的装置，其特征在于，所述语音信号处理模块包括：

指定阈值确定单元，用于根据所述多个通道的第一权重的最大值，确定指定阈值；

权重获取单元，用于对于每一个通道的第一语音信号，将第一权重小于所述指定阈值的子信号的第二权重设置为0，根据所述第一语音信号中每段子信号的响度和所述多个通道的第一语音信号中同一段子信号中除已将第二权重设置为0的子信号以外子信号的响度和，获取所述第一语音信号中第一权重不小于所述指定阈值的子信号的第二权重；

所述权重获取单元还用于对于每一个通道的第一语音信号，根据所述第一语音信号中每段子信号的第二权重，获取所述第一语音信号中每段子信号的第三权重；

所述语音信号处理模块还包括：调整单元，用于对于每一个通道的原始语音信号，根据所述第一语音信号中每段子信号的第三权重调整所述原始语音信号中对应的子信号；

语音信号处理单元，用于将所述多个通道中调整后的每段子信号对应叠加，得到处理后的语音信号。
根据权利要求10所述的装置，其特征在于，所述调整单元还用于对于每一段子信号，将所述子信号的第三权重与所述原始语音信号中所述子信号的幅值相乘，得到调整后的子信号。
根据权利要求10所述的装置，其特征在于，所述权重获取单元还用于对于每一个通道的第一语音信号，根据所述第一语音信号中每段子信号的第二权重，对所述第一语音信号中每段子信号的权重进行平滑处理，得到所述第一语音信号中每段子信号的第三权重。
根据权利要求9所述的装置，其特征在于，所述语音信号处理模块，包括：

第一调整单元，用于对于所述多个通道的第一语音信号中的每一段子信号，将所述子信号的第一权重与所述原始语音信号中所述子信号的幅值相乘，得到调整后的子信号；

第一处理单元，用于将所述多个通道中调整后的每段子信号对应叠加，得到处理后的语音信号。
根据权利要求9所述的装置，其特征在于，所述语音信号处理模块，包括：

指定阈值确定单元，用于根据所述多个第一权重的最大值，确定指定阈值；

第二权重单元，用于对于每一个通道的第一语音信号，将第一权重小于所述指定阈值的子信号的第二权重设置为0，根据所述第一语音信号中每段子信号的响度以及预定响度和，获取所述第一语音信号中第一权重不小于所述指定阈值的子信号的第二权重；其中，所述预定响度和是所述多个通道的第一语音信号中同一段子信号中除去已经将第二权重设置为0的子信号以外的子信号的响度和；

第二调整单元，用于对于所述多个通道的第一语音信号中的每一段子信号，将所述子信号的第二权重与所述原始语音信号中所述子信号的幅值相乘，得到调整后的子信号；

第二处理单元，用于将所述多个通道中调整后的每段子信号对应叠加，得到处理后的语音信号。
根据权利要求9所述的装置，其特征在于，所述语音信号处理模块，包括:

第四权重单元，用于对于每一个通道的第一语音信号，根据所述第一语音信号中每段子信号的第一权重，对所述第一语音信号中每段子信号的权重进行平滑处理，得到所述第一语音信号中每段子信号的第四权重；

第四调整单元，用于对于每一个通道的原始语音信号，根据所述第一语音信号中每段子信号的第四权重与所述原始语音信号中所述子信号的幅值相乘，得到调整后的子信号；

第四处理单元，用于将所述多个通道中调整后的每段子信号对应叠加，得到处理后的语音信号。
根据权利要求10至15任一所述的装置，其特征在于，所述装置还包括：

语音信号输出模块，用于当所述处理后的语音信号的幅值大于预设阈值时，对所述处理后的语音信号进行非线性映射，得到输出语音信号。
一种服务器，其特征在于，所述服务器包括：处理器和存储器，所述处理器与所述存储器相连接，

所述处理器，用于获取多个通道的原始语音信号，所述原始语音信号为数字语音信号；

所述处理器，还用于对每一个通道的原始语音信号进行滤波，得到每一个通道的第一语音信号，所述第一语音信号的频率属于预设频率范围；

所述处理器，还用于对于每一个通道的第一语音信号，获取所述第一语音信号中每段子信号的响度；

所述处理器，还用于根据所述第一语音信号中每段子信号的响度以及所述多个通道的同一段子信号的响度和，获取所述第一语音信号中每段子信号的第一权重；

所述处理器，还用于按照所述多个通道的第一语音信号中每段子信号的第一权重和所述多个通道的第一语音信号，得到处理后的语音信号。
根据权利要求17所述的服务器，其特征在于，

所述处理器，还用于根据所述多个第一权重的最大值，确定指定阈值；

所述处理器，还用于对于每一个通道的第一语音信号，将第一权重小于所述指定阈值的子信号的第二权重设置为0，根据所述第一语音信号中每段子信号的响度和预定响度和，获取所述第一语音信号中第一权重不小于所述指定阈值的子信号的第二权重；其中，所述预定响度和是所述多个通道的第一语音信号中同一段子信号中除去已经将第二权重设置为0的子信号以外的子信号的响度和；

所述处理器，还用于对于每一个通道的第一语音信号，根据所述第一语音信号中每段子信号的第二权重，获取所述第一语音信号中每段子信号的第三权重；

所述处理器，还用于对于每一个通道的原始语音信号，根据所述第一语音信号中每段子信号的第三权重调整所述原始语音信号中对应的子信号；

所述处理器，还用于将所述多个通道中调整后的每段子信号对应叠加，得到处理后的语音信号。
根据权利要求18所述的服务器，其特征在于，

所述处理器，还用于对于每一段子信号，将所述子信号的第三权重与所述原始语音信号中所述子信号的幅值相乘，得到调整后的子信号。
根据权利要求18所述的服务器，其特征在于，

所述处理器，还用于对于每一个通道的第一语音信号，根据所述第一语音信号中每段子信号的第二权重，对所述第一语音信号中每段子信号的权重进行平滑处理，得到所述第一语音信号中每段子信号的第三权重。
根据权利要求17所述的服务器，其特征在于，

所述处理器，还用于对于所述多个通道的第一语音信号中的每一段子信号，将所述子信号的第一权重与所述原始语音信号中所述子信号的幅值相乘，得到调整后的子信号；

所述处理器，还用于将所述多个通道中调整后的每段子信号对应叠加，得到处理后的语音信号。
根据权利要求17所述的服务器，其特征在于，

所述处理器，还用于根据所述多个第一权重的最大值，确定指定阈值；

所述处理器，还用于对于每一个通道的第一语音信号，将第一权重小于所述指定阈值的子信号的第二权重设置为0，根据所述第一语音信号中每段子信号的响度以及预定响度和，获取所述第一语音信号中第一权重不小于所述指定阈值的子信号的第二权重；其中，所述预定响度和是所述多个通道的第一语音信号中同一段子信号中除去已经将第二权重设置为0的子信号以外的子信号的响度和；

所述处理器，还用于对于所述多个通道的第一语音信号中的每一段子信号，将所述子信号的第二权重与所述原始语音信号中所述子信号的幅值相乘，得到调整后的子信号；

所述处理器，还用于将所述多个通道中调整后的每段子信号对应叠加，得到处理后的语音信号。
根据权利要求17所述的服务器，其特征在于，

所述处理器，还用于对于每一个通道的第一语音信号，根据所述第一语音信号中每段子信号的第一权重，对所述第一语音信号中每段子信号的权重进行平滑处理，得到所述第一语音信号中每段子信号的第四权重；

所述处理器，还用于对于每一个通道的原始语音信号，根据所述第一语音信号中每段子信号的第四权重与所述原始语音信号中所述子信号的幅值相乘，得到调整后的子信号；

所述处理器，还用于将所述多个通道中调整后的每段子信号对应叠加，得到处理后的语音信号。
根据权利要求17至23任一所述的服务器，其特征在于，

所述处理器，还用于当所述处理后的语音信号的幅值大于预设阈值时，对所述处理后的语音信号进行非线性映射，得到输出语音信号。