WO2014161388A1

WO2014161388A1 - 一种提高语音质量的方法及装置

Info

Publication number: WO2014161388A1
Application number: PCT/CN2014/071868
Authority: WO
Inventors: 孙焘; 梁超
Original assignee: 中兴通讯股份有限公司
Priority date: 2013-10-23
Filing date: 2014-02-07
Publication date: 2014-10-09
Also published as: CN104575515A

Abstract

一种提高语音质量的方法及装置，对从待处理语音信号中提取特征语音信号（S101）；然后对提取出的特征语音信号的幅值按照预设的规则进行调整（S102）使其在预设的幅值范围内，以保证更好的语音质量；然后将调整后的特征语音信号和待处理语音信号中其他语音信号进行重建得到处理后语音质量更好的语音信号（S103）。

Description

一种提高语音质量的方法及装置

技术领域

本发明涉及语音信号处理领域，尤其涉及一种提高语音质量的方法及装置。

背景技术

目前由于手机等移动终端体积及功率限制，其所釆用的扬声器小，而且给扬声器预留的所需的音腔体积也很小；另外，目前手机通话绝大多数均是建立在 CS域的，受限于核心网的交换电路的带宽，语音编码算法往往只釆用 300Hz-3400Hz的语音，即使宽带语音信号也最多扩展到 6000Hz左右，而根据相关技术制造的扬声器及相匹配的音腔设计，为了提高音量往往会使语音信号传递到扬声器发声系统时破音，而且清晰度不够。目前为了改善终端扬声器接收语音质量及响度最长釆用的方式是从硬件上提升音质和响度。这种做法一方面需要增加扬声器的体积，扬声器的特点是随着体积的增大，有效声辐射功率也会增大，从而弥补小体积扬声器声辐射功率比较小，在传输途中的衰减大的问题，保证有更多的声音信号进入人耳，从而来提高通话时的清晰度和可辨性。另一方面是提高电路输入到扬声器的电功率，这样可以使扬声器以更高的功率工作，从而弥补声音在传输途中的衰减，保证有更多的声音信号进入人耳，这样也可以提高通话时的清晰度和可辨性。然而这些方式均存在很大缺陷，扬声器体积的增加不但自身会对终端上的空间有更大要求，而且相应的音腔也要增加，否则音质和音量仍然会受影响，而对于相关趋向于超薄化发展的手机等移动终端来说，如此的增加体积要求是无法满足的；因此在扬声器体积有限的情况下，只能通过提高输入扬声器的电功率来提升音量和音质，但这样很容易出现扬声器功率过载、破音甚至损坏扬声器的情况。

发明内容本发明实施例提供一种提高语音质量的方法及装置，解决相关提高语音质量需增加扬声器体积以及提高输入扬声器的电功率的问题。

本发明实施例提供一种提高语音质量的方法，包括：

从待处理语音信号中提取特征语音信号；

对提取出的特征语音信号的幅值按照预设规则进行调整；以及

将调整后的特征语音信号和所述待处理语音信号包括的其他语音信号进行重建得到处理后的语音信号。

在本发明的一种实施例中，所述特征语音信号包括语音基音信号和 /或语音清音信号。

在本发明的一种实施例中，所述特征语音信号包括语音基音信号时，所述预设规则包括：

当语音基音信号的幅值小于最低基音信号幅值阔值时，将所述语音基音信号调整为等于或大于所述最低基音信号幅值阔值；当语音基音信号的幅值大于最高基音信号幅值阔值时，将所述语音基音信号调整为小于或等于所述最高基音信号幅值阔值；以及

所述特征语音信号包括语音清音信号时，所述预设规则包括：

当语音清音信号的幅值小于最低清音信号幅值阔值时，将所述语音清音信号调整为等于或大于所述最低清音信号幅值阔值；语音清音信号的幅值大于最高清音信号幅值阔值时，将所述语音清音信号调整为小于或等于所述最高清音信号幅值阔值。

在本发明的一种实施例中，对所述特征语音信号的幅值进行调整后，基于调整后的特征语音信号进行重建前，还包括：判断调整后的特征语音信号与之前提取出的原始特征语音信号的一致性是否满足预设要求；如否，则对所述特征语音信号的幅值重新调整。

在本发明的一种实施例中，将调整后的特征语音信号和所述待处理语音信号包括的其他语音信号进行重建得到处理后的语音信号后，还包括：

根据调整后的所述特征语音信号的幅值对处理后的所述语音信号进行扩展处理。本发明实施例还提供了一种提高语音质量的装置，包括：语音提取模块，其设置成从待处理语音信号中提取特征语音信号；语音处理模块，其设置成对提取出的特征语音信号的幅值按照预设规则进行调整；以及

语音重建模块，其设置成将调整后的特征语音信号和所述待处理语音信号包括的其他语音信号进行重建得到处理后的语音信号。

在本发明的一种实施例中，所述装置还包括判断模块，所述判断模块设置成在所述语音处理模块对所述特征语音信号的幅值进行调整后，所述语音重建模块基于调整后的特征语音信号进行重建前，判断调整后的特征语音信号与所述语音提取模块之前提取出的原始特征语音信号的一致性是否满足预设要求；如否，则通知所述语音处理模块对所述特征语音信号的幅值重新调整。

在本发明的一种实施例中，所述装置还包括语音扩展模块，其设置成在所述语音重建模块将调整后的特征语音信号和所述待处理语音信号包括的其他语音信号进行重建得到处理后的语音信号后，根据所述语音处理模块调整后的所述特征语音信号的幅值对处理后的所述语音信号进行扩展处理。

本发明实施例的有益效果是：

本发明实施例提供的提高语音质量的方法及装置，对从待处理语音信号 (例如，输入扬声器的语音信号）中提取特征语音信号；然后对提取出的特征语音信号的幅值按照预设的规则进行调整使其在预设的幅值范围内，以保证更好的语音质量；然后将调整后的特征语音信号和待处理语音信号中其他语音信号进行重建得到处理后得到语音质量更好的语音信号；因此该提高语音质量的方法及装置可在既不需要增加扬声器体积，也不需要提高扬声器输入的电功率的情况下提高语音信号的质量，可避免增加扬声器体积以及提高输入电功率导致的各种问题，可带给用户更好的体验。

附图概述

图 1为本发明实施例 -中提高语 '量的方法的流程示意图

图 2为本发明实施例 .中提高语音 '量的装置的结构示意图

图 3为本发明实施例 .中提高语音 '量的装置的结构示意图.

图 4为本发明实施例 .中提高语音 '量的装置的结构示意图.

图 5为本发明实施例 .中提高语音 '量的方法的流程示意图

本发明的较佳实施方式

下面通过具体实施方式结合附图对本发明作详细说明。需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。

本发明实施例对从待处理语音信号中提取特征语音信号；然后对提取出的特征语音信号的幅值按照预设的规则进行调整使其在预设的幅值范围内；然后将调整后的特征语音信号和待处理语音信号中其他语音信号进行重建得到处理后得到语音质量更好的语音信号。为了更好的理解本发明实施例，下面结合附图和各实施例做说明。

实施例一：请参考图 1 , 本实施例提供的提高语音质量的方法包括：

步骤 101 : 从待处理语音信号中提取特征语音信号；

该步骤中提取哪种特征语音信号可根据输入的语音信号情况以及相应的应用场景选择设置，只要该特征语音信号具有一定的代表性以及可满足后续语音重建的要求即可；

步骤 102: 对提取出的特征语音信号的幅值按照预设规则进行调整；该步骤主要对提取出的特征语音信号的幅值按照一定的预设规则进行调整，使其在最佳的幅值范围内；该最佳的幅值范围需根据相应的应用场景以及当前处理的语音信号的幅值分布情况选定设置；

步骤 103 : 将调整后的特征语音信号和待处理语音信号包括的其他语音信号进行重建得到处理后的语音信号。

该步骤处理后的语音信号与未处理过的语音信号相比，其包含的特征语音信号中的至少一种经幅值调整，因此重建后的语音信号的质量比处理前的语音信号的质量好；且这种处理方式并不需要增加扬声器的体积，也不需要增加扬声器的输入电功率，因此也不会导致扬声器功率过载、破音甚至损坏扬声器的情况发生。

在本实施例中，所提取的特征语音信号可以是语音基音信号，也可以是语音清音信号，或者是语音基音信号和语音清音信号；相应提取哪些特征语音可根据相应的情况选择设置；例如，当待处理的语音信号中，其包括的语音清音信号较少，或者其包括的语音清音信号的幅值都非常低，而其包括的语音基音信号则比较多，此时则可只提取语音基音信号进行上述处理，这在一定程度上也能提高语音质量；相反，当语音基音信号所占比例较少，而语音清音信号所占比例比所述语音基音信号多很多时，则可只提取语音清音信号进行上述处理，也能在一定程度上提高语音质量；当语音基音信号和语音清音信号所占比例差不多时，则可提取语音基音信号和语音清音信号进行上述处理。当然，提取特征信号的依据并不仅限于上述情况，此处只是作为一个解释性的说明。

在本实施例中，当提取的特征语音信号包括语音基音信号时，釆用的预设规则包括：

当语音基音信号的幅值小于最低基音信号幅值阔值时，将其调整为等于或大于最低基音信号幅值阔值；当语音基音信号的幅值大于最高基音信号幅值阔值时，将其调整为小于或等于所述最高基音信号幅值阔值。

本实施例中，当提取的特征语音信号包括语音清音信号时，釆用的预设规则包括：

语音清音信号的幅值小于最低清音信号幅值阔值时，将其调整为等于或大于最低清音信号幅值阔值；语音清音信号的幅值大于最高清音信号幅值阔值时，将其调整为小于或等于最高清音信号幅值阔值。

在本实施例中，为了保证语音质量，防止对特征语音信号的幅值进行调整后导致其失真，在对特征语音信号的幅值进行调整后，基于调整后的特征语音信号进行语音信号的重建前，还包括：判断调整后的特征语音信号与之前提取出的原始特征语音信号的一致性是否满足预设要求；如否，则对待处理的特征语音信号的幅值重新调整。

在本实施例中，在上述步骤 103之后，将调整后的特征语音信号和待处理语音信号包括的其他语音信号进行重建得到处理后的语音信号后，为了保证和提高其语音信号的饱和度，还可包括以下步骤：

根据调整后的特征语音信号的幅值对处理后的语音信号进行扩展处理；例如，原语音信号的频率分布范围为 200Hz-3400Hz; 根据调整后的特征语音信号的幅值对处理后的语音信号进行扩展处理后得到的频率分布范围可能为 50Hz-5000Hz; 以提高该语音信号的饱和度。

实施例二：

请参考图 2, 本实施例提供的提高语音质量的装置包括：

语音提取模块 201 , 其设置成从待处理语音信号中提取特征语音信号；其提取哪种特征语音信号可根据输入的语音信号情况以及相应的应用场景选择设置，只要该特征语音信号具有一定的代表性以及可满足后续语音重建的要求即可；语音处理模块 202 , 其设置成对提取出的特征语音信号的幅值按照预设规则进行调整；进行调整的目的是使特征语音信号的幅值在最佳的幅值范围内；该最佳的幅值范围需根据相应的应用场景以及当前处理的语音信号的幅值分布情况选定设置；

语音重建模块 203 , 其设置成将调整后的特征语音信号和待处理语音信号包括的其他语音信号进行重建得到处理后的语音信号。

在本实施例中，所提取的特征语音信号可以是语音基音信号，也可以是语音清音信号，或者是语音基音信号和语音清音信号；提取哪些特征语音可根据相应的情况选择设置；例如，当待处理的语音信号中，其包括的语音清音信号较少，或者其包括的语音清音信号的幅值都非常低，而其包括的语音基音信号则比较多，此时则可只提取语音基音信号进行上述处理，这在一定程度上也能提高语音质量；相反，当语音基音信号所占比例较少，而语音清音信号所占比例比所述语音基音信号多很多时，则可只提取语音清音信号进行上述处理，也能在一定程度上提高语音质量；当语音基音信号和语音清音信号所占比例差不多时，则可提取语音基音信号和语音清音信号进行上述处理。当然，提取特征信号的依据并不仅限于上述情况，此处只是作为一个解释性的说明。

在本实施例中，为了保证语音质量，防止对特征语音信号的幅值进行调整后导致其失真，请参见图 3所示，本实施例中的装置还可包括判断模块 204, 其设置成在语音处理模块对特征语音信号的幅值进行调整后，语音重建模块基于调整后的特征语音信号进行重建前，判断调整后的特征语音信号与语音提取模块之前提取出的原始特征语音信号的一致性是否满足预设要求；如否，通知语音处理模块 202对待处理的特征语音信号的幅值重新调整。

在本实施例中，为了保证和提高其语音信号的饱和度，请参见图 4所示，该装置还可包括语音扩展模块 205: 其设置成在语音重建模块 203将调整后的特征语音信号和待处理语音信号包括的其他语音信号进行重建得到处理后的语音信号后，根据语音处理模块 202调整后的特征语音信号的幅值对处理后的语特征语音信号的幅值对处理后的语音信号进行扩展处理；例如，原语音信号的频率分布范围为 200Hz-3400Hz; 根据整后的特征语音信号的幅值对处理后的语音信号进行扩展处理后得到的频率分布范围可能为 50Hz-5000Hz; 以提高该语音信号的饱和度。

实施例三：

为了更好的理解本发明实施例，下面结合一个具体的应用场景为例进行说明。

本实施例以手机为例，手机的脉冲编码调制（PCM )数据模块从手机的标准 PCM接口获取手机下行的 PCM数据格式的语音信号作为待处理语音信号为例进行说明。在本实施例，所提取的特征语音信号为语音清音信号和语音基音信号。值得注意的是，当提取的特征语音信号为语音清音信号和语音基音信号时，对语音清音信号和语音基音信号幅值的调整过程可同时进行，也可先对语音基音信号幅值调整后再对语音清音信号幅值进行调整，或者先对语音清音信号的幅值调整后，再对语音基音信号幅值进行调整。对语音重建时，也可先对调整后的语音基音信号和语音清音信号合成后，在结合原语音信号中的其他语音信号进行重建。

请参见图 5所示，该处理过程包括：

步骤 501 : 获取 PCM数据格式的语音信号作为待处理语音信号；步骤 502: 获取该待处理语音信号的频谱特征；

步骤 503 : 从步骤 502 中的语音信号频谱中提取出语音基音信号和语音清音信号；

步骤 504: 对提取出的语音基音信号的幅值按照设定的规则进行调整控制，调整值可根据经验值确定；

步骤 505 : 判断调整后的语音基音信号与原始提取出的语音基音信号的一致性是否满足要求，如满足，转至步骤 508 , 否则，转至步骤 504;

步骤 506: 对提取出的语音清音信号的幅值按照设定的规则进行调整控制，调整值也可根据经验值确定；

步骤 507 : 判断调整后的语音清音信号与原始提取出的语音清音信号的一致性是否满足要求，如满足，转至步骤 508 , 否则，转至步骤 506;

步骤 508: 当调整后的语音基音信号和调整后的语音清音信号的一致性都满足要求时，将调整后的语音基音信号和调整后的语音清音信号合成；步骤 509: 基于合成后的语音基音信号和语音清音信号和原语音信号中除语音基音信号和语音清音信号外的其他语音信号进行重建、扩展处理；步骤 510: 将最终得到的 PCM数据格式的语音信号输出。

可见，本发明实施例通过从待处理语音信号中提取特征语音信号，对其幅值按照预设的规则进行调整使其在预设的幅值范围内后；再将其与原待处理语音信号中其他语音信号进行重建、甚至扩展可得到语音质量更好的语音信号。

本领域普通技术人员可以理解上述方法中的全部或部分步骤可通过程序来指令相关硬件完成，所述程序可以存储于计算机可读存储介质中，如只读存储器、磁盘或光盘等。可选地，上述实施例的全部或部分步骤也可以使用一个或多个集成电路来实现。相应地，上述实施例中的各模块 /单元可以釆用硬件的形式实现，也可以釆用软件功能模块的形式实现。本发明不限制于任何特定形式的硬件和软件的结合。

以上内容是结合具体的实施方式对本发明所作的详细说明，不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干简单推演或替换，都应当视为属于本发明的保护范围。

工业实用性本发明实施例提供的提高语音质量的方法及装置可在既不需要增加扬声器体积，也不需要提高扬声器输入的电功率的情况下提高语音信号的质量，可避免增加扬声器体积以及提高输入电功率导致的各种问题，可带给用户更好的体验。

Claims

权利要求书

1、一种提高语音质量的方法，包括：

从待处理语音信号中提取特征语音信号；

2、如权利要求 1所述的提高语音质量的方法，其中，所述特征语音信号包括语音基音信号和 /或语音清音信号。

3、如权利要求 2所述的提高语音质量的方法，其中，所述特征语音信号包括语音基音信号时，所述预设规则包括：

当语音清音信号的幅值小于最低清音信号幅值阔值时，将所述语音清音信号调整为等于或大于所述最低清音信号幅值阔值；当语音清音信号的幅值大于最高清音信号幅值阔值时，将所述语音清音信号调整为小于或等于所述最高清音信号幅值阔值。

4、如权利要求 1-3任一项所述的提高语音质量的方法，其中，对所述特征语音信号的幅值进行调整后，基于调整后的特征语音信号进行重建前，还包括：判断调整后的特征语音信号与之前提取出的原始特征语音信号的一致性是否满足预设要求；如否，则对所述特征语音信号的幅值重新调整。

5、如权利要求 1-3任一项所述的提高语音质量的方法，其中，将调整后的特征语音信号和所述待处理语音信号包括的其他语音信号进行重建得到处理后的语音信号后，还包括：

根据调整后的所述特征语音信号的幅值对处理后的所述语音信号进行扩展处理。

6、一种提高语音质量的装置，包括：语音提取模块，其设置成从待处理语音信号中提取特征语音信号；语音处理模块，其设置成对提取出的特征语音信号的幅值按照预设规则进行调整；以及

7、如权利要求 6所述的提高语音质量的装置，其中，所述特征语音信号包括语音基音信号和 /或语音清音信号。

8、如权利要求 7所述的提高语音质量的装置，其中，

所述特征语音信号包括语音基音信号时，所述预设规则包括：

9、如权利要求 6-8任一项所述的提高语音质量的装置，其中，所述装置还包括判断模块，所述判断模块设置成在所述语音处理模块对所述特征语音信号的幅值进行调整后，所述语音重建模块基于调整后的特征语音信号进行重建前，判断调整后的特征语音信号与所述语音提取模块之前提取出的原始特征语音信号的一致性是否满足预设要求；如否，则通知所述语音处理模块对所述特征语音信号的幅值重新调整。

10、如权利要求 6-8任一项所述的提高语音质量的装置，其中，所述装置还包括语音扩展模块，其设置成在所述语音重建模块将调整后的特征语音信号和所述待处理语音信号包括的其他语音信号进行重建得到处理后的语音信号后，根据所述语音处理模块调整后的所述特征语音信号的幅值对处理后的所述语音信号进行扩展处理。