WO2014161299A1

WO2014161299A1 - 一种语音质量处理的方法及装置

Info

Publication number: WO2014161299A1
Application number: PCT/CN2013/086095
Authority: WO
Inventors: 刘宝刚; 吕文化
Original assignee: 中兴通讯股份有限公司
Priority date: 2013-08-15
Filing date: 2013-10-28
Publication date: 2014-10-09
Also published as: CN104378774A

Abstract

一种语音质量处理的方法及装置，所述方法包括：通过对待处理的语音信号进行噪声检测，得到所述语音信号的当前噪声环境（S1）；根据所述当前噪声环境和用户选择的语音质量模式，得到适配的语音处理参数（S2）；利用所述语音处理参数对所述语音信号进行语音处理，使处理后的语音信号的语音质量与当前噪声环境和用户选择的语音质量模式相适应（S3）。

Description

一种语音庸量处理的方法及装置技术领域

本发明涉及通信技术领域，特别涉及一种不同环境下语音通话质量处理的方法及装置。背景技术

当前，随着智能终端的普及，许多终端都采用了带有消噪功能的算法或芯片。而在当前的终端中，在手持模式下，即使用户处于不同的环境，终端均采用一套语音软件算法参数来对噪声、回音等进行消除。

随着终端越来越智能、适用的场景越来越多，采用一套语音软件算法参数的局限性就越来越大，而且不能满足不同用户在不同环境下的主观听觉要求。在不同的环境下，不同身份的人对语音质量也有不同的要求，在公共场所或会议室内参加电话会议，不同的人会有不同的需求，有人需要高保真度来区分发言的人，有的人对噪声大小更敏感，而有的人对噪声不敏感，但对声音的大小要求强烈；在某些特定的场所或者是特定身份的人，手机通话双方希望两者谈话如同窃窃私语，防止被他人听到 ... ...，这就需要对硬件的不同模块进行差异性的参数调节来对语音的保真度、噪声、回音等进行相应的处理，从而满足在不同场景下用户的个性化需求。发明内容

有鉴于此，本发明实施例的目的在于提供一种语音质量处理的方法及装置，能够更好的解决只能采用一套语音软件算法参数不能满足用户对不同环境下的个性化需求的局限性问题。

为达到上述目的，本发明实施例的技术方案是这样实现的：本发明实施例提供了一种语音质量处理的方法，所述方法包括：通过对待处理的语音信号进行噪声检测，得到所述语音信号的当前噪声环境；

根据所述当前噪声环境和用户选择的语音质量模式，得到适配的语音处理参数；

利用所述语音处理参数对所述语音信号进行语音处理，使处理后的语音信号的语音质量与当前噪声环境和用户选择的语音质量模式相适应。

优选地，所述通过对待处理的语音信号进行噪声检测，得到所述语音信号的当前噪声环境包括：

通过对麦克风拾取的模拟语音信号进行模数转换，得到数字语音信号；通过对所述数字语音信号进行噪声检测，得到当前噪声环境参数；利用预置的噪声环境参数与噪声环境的关系表，得到与当前噪声环境参数相对应的（发送方）当前噪声环境。

优选地，所述通过对待处理的语音信号进行噪声检测，得到所述语音信号的当前噪声环境还包括：

通过对天线接收的编码的数字语音信号进行解码处理，得到解码的数字语音信号；

通过对所述解码的数字语音信号进行噪声检测，得到当前对方的噪声环境参数；

利用预置的噪声环境参数与噪声环境的关系表，得到与当前对方的噪声环境参数相对应的（接收方）当前噪声环境。

优选地，所述根据所述当前噪声环境和用户选择的语音质量模式，得到适配的语音处理参数，包括：

从保存的多个参数分组中查找与当前噪声环境和用户选择的语音质量模式相适应的参数分组；将已查找到的参数分组中的参数配置选作所述语音处理参数。

优选地，所述利用语音处理参数对所述语音信号进行语音处理，包括：利用消噪参数对所述语音信号进行消噪处理，以消除所述语音信号中的噪声；

利用均衡参数对进行消噪处理的语音信号进行均衡处理，以调整所述语音信号的失真度。

优选地，所述利用语音处理参数对所述语音信号进行语音处理，还包括：

利用消噪参数对所述语音信号进行消噪处理，以消除所述语音信号中的噪声。

利用消噪参数对所述语音信号进行消噪处理，以消除所述语音信号中的噪声；

利用滤波参数对进行消噪处理的语音信号进行滤波处理，以滤除所述语音信号中频带以外的噪声。

利用滤波参数对进行消噪处理的语音信号进行滤波处理，以滤除所述语音信号中频带以外的噪声；

利用消回音参数对进行滤波处理的语音信号进行消回音处理，以消除所述语音信号中的回音；

利用增益参数对进行消回音处理的语音信号进行增益放大处理，以放大所述语音信号的增益；

利用均衡参数对进行增益放大的语音信号进行均衡处理，以调整所述语音信号的失真度。

本发明实施例还提供了一种语音质量处理的装置，所述装置包括：噪声环境模块，配置为通过对待处理的语音信号进行噪声检测，得到所述语音信号的当前噪声环境；

主处理器模块，配置为根据所述当前噪声环境和用户选择的语音质量模式，得到适配的语音处理参数；

语音处理模块，配置为利用所述语音处理参数对所述语音信号进行语音处理，使处理后的语音信号的语音质量与当前噪声环境和用户选择的语音质量模式相适应。

优选地，所述语音处理模块包括：

消噪子模块，配置为利用消噪参数对所述语音信号进行消噪处理，以消除所述语音信号中的噪声；

均衡子模块，配置为利用均衡参数对所述语音信号进行均衡处理，以调整所述语音信号的失真度；

滤波子模块，配置为利用滤波参数对所述语音信号进行滤波处理，以消除所述语音信号中的噪声；

消回音子模块，配置为利用消回音参数对所述语音信号进行消回音处理，以消除所述语音信号中的回音；

增益子模块，配置为利用增益参数对所述语音信号进行增益放大处理，以放大所述语音信号的增益。

本发明实施例提供的语音质量处理的方法及装置能够根据用户在特定环境下的不同需求，选择所需要的语音质量模式，并通过不同噪声环境以及不同用户对语音质量的需求，得到适配的语音处理参数的方法，实现不同用户在不同的环境下对语音质量的个性化需求。附图说明

图 1是本发明实施例提供的语音质量处理的方法流程图；

图 2是本发明实施例提供的语音质量处理的装置结构图；

图 3是本发明实施例提供的语音质量处理的模块间相互协作的发送方的流程示意图；

图 4是本发明实施例提供的语音质量处理的模块间相互协作的接收方的流程示意图。具体实施方式

以下结合附图对本发明的优选实施例进行详细说明，应当理解，以下所说明的优选实施例仅用于说明和解释本发明，并不用于限定本发明。

图 1是本发明实施例提供的语音质量处理的方法流程图，如图 1所示，所述方法包括：

步骤 S1 : 通过对待处理的语音信号进行噪声检测，得到所述语音信号的当前噪声环境。

步骤 S2: 根据所述当前噪声环境和用户选择的语音质量模式，得到适配的语音处理参数。

步骤 S3 : 利用所述语音处理参数对所述语音信号进行语音处理，使处理后的语音信号的语音质量与当前噪声环境和用户选择的语音质量模式相适应。

所述步骤 S1中，通过对麦克风拾取的模拟语音信号进行模数转换，得到数字语音信号；

通过对所述数字语音信号进行噪声检测，得到当前噪声环境参数；利用预置的噪声环境参数与噪声环境的关系表，得到与当前噪声环境参数相对应的（发送方）当前噪声环境。

所述步骤 S2中，从保存的多个参数分组中查找与当前噪声环境和用户选择的语音质量模式相适应的参数分组；

将已查找到的参数分组中的参数配置选作所述语音处理参数。

所述步骤 S3中，利用消噪参数对所述语音信号进行消噪处理，以消除所述语音信号中的噪声。

本发明实施例提供了一种解决在不同噪声环境下实现某一语音质量一一高保真模式的方法。图 2是本发明实施例提供的语音质量处理的装置结构图，如图 2所示，包括：上层应用模块 21，数据收集 /播放及数模 /模数转换模块 22，语音处理模块 23，参数分组模块 24，主处理器模块 25。

所述主处理器模块中的语音处理参数模块，配置为根据所述当前噪声环境和用户选择的语音质量模式，得到适配的语音处理参数。

所述语音处理模块 23中的语音质量模块，配置为利用所述语音处理参数对所述语音信号进行语音处理，使处理后的语音信号的语音质量与当前噪声环境和用户选择的语音质量模式相适应。其中，所述语音质量模块中的消噪子模块，配置为利用消噪参数对所述语音信号进行消噪处理，以消除所述语音信号中的噪声；所述语音质量模块中的均衡子模块，配置为利用均衡参数对所述语音信号进行均衡处理，以调整所述语音信号的失真度；所述语音质量模块中的滤波子模块，配置为利用滤波参数对所述语音信号进行滤波处理，以消除所述语音信号中的噪声。所述语音质量模块中的消回音子模块，配置为利用消回音参数对所述语音信号进行消回音处理，以消除所述语音信号中的回音；所述语音质量模块中的增益子模块，配置为利用增益参数对所述语音信号进行增益放大处理，以放大所述语音信号的增益。其中语音处理模块不局限于具体的实现，可以使用软件的处理算法，也可以使用硬件的数字信号处理器（DSP， Digital Signal Processor ) 芯片。

所述数据收集 /播放及数模 /模数转换模块 22、语音处理模块 23和主处理器模块 25实现了噪声环境模块的功能，配置为通过所述数据收集 /播放及数模 /模数转换模块 22和语音处理模块 23对待处理的语音信号进行噪声检测，并在所述主处理器模块 25中得到所述语音信号的当前噪声环境。

其中，所述语音质量处理的装置在实际应用中，可设置于具有语音功能的电子设备中，例如手机、电脑等；所述装置中的上层应用模块 21、数据收集 /播放及数模 /模数转换模块 22、语音处理模块 23及其子模块：语音质量模块、消噪子模块、均衡子模块、滤波子模块、消回音子模块、增益子模块、参数分组模块 24和主处理器模块 25，在实际应用中，均可由装置中的中央处理器（Central Processing Unit, CPU ), 数字信号处理器（DSP， Digital Signal Processor )、或可编程门阵歹 'J ( Field-Programmable Gate Array, FPGA ) 实现。

所述装置的工作原理如下，分别对发送方和接收方进行说明：步骤 201 : 发送方向通路，数据收集 /播放及数模 /模数转换模块将麦克风拾取到的模拟语音信号进行模数转换，转换成数字语音信号。

步骤 202: 将数字语音信号通过数字接口送入语音处理模块，语音处理模块首先对所述数字语音信号进行噪声检测，获得当前的噪声环境参数，并将其送入主处理器模块来确定当前用户所处的噪声环境。

步骤 203:主处理器模块在获得上层应用模块下发的用户需要的高保真模式的参数后，将所述高保真模式参数和当前的噪声环境参数作为相关判断条件，通过相关接口查询参数分组模块中的各个参数分组。

步骤 204: 从参数分组中得到满足两者条件的参数配置后，通过相关读接口，读取所述参数配置，并通过相关写接口将所述参数配置写入语音处理模块。

步骤 205:语音处理模块按照写入的参数配置对噪声语音信号进行相应处理，在高保真模式下，通过写入的频谱参数，调节均衡滤波器和相关高低通滤波器，对语音信号进行频谱调节，通过对失真的语音信号频段进行调节，使其达到无失真的效果。

步骤 206: 通过写入的噪声、回音参数，调用相关消噪、消回音子模块，对当前的噪声进行消噪消回音处理，最终达到用户需要的效果。

步骤 207: 处理完成后，将处理后的数字语音信号送入主处理器模块进行后续处理。

步骤 208: 接收方向通路，主处理器模块将解码后的数字语音信号通过数字接口送入语音处理模块。

步骤 209: 语音处理模块对解码后的数字语音信号进行噪声检测，获得当前的噪声环境参数，并将其送入主处理器模块来确定当前对方所处的噪声环境。

步骤 210:主处理器模块在获得上层应用模块下发的用户需要的高保真模式的参数后，将所述高保真模式参数和当前的噪声环境参数作为相关判断条件，通过相关接口查询分组模块中的各个参数分组。

步骤 211 : 从参数分组中得到满足两者条件的参数配置后，通过相关读接口，读取所述参数配置。并通过相关写接口将所述配置参数写入语音处理模块.

步骤 212: 语音处理模块按照写入的对噪声语音信号进行相应处理，在高保真模式下，通过写入的频谱参数，调节均衡滤波器和相关高低通滤波器，对解码后的语音信号进行频谱调节，通过对失真的语音信号频段进行调节，使其达到无失真的效果。

步骤 213: 通过写入的噪声、回音参数，调用相关消噪、消回音子模块，对当前的噪声进行消噪消回音处理，最终达到用户需要的效果。

步骤 214: 处理完成后，将处理后的数字语音信号通过数字接口送入数据收集 /播放及数模 /模数转换模块，将数字语音信号转换成模拟语音信号，送入扬声器等器件播放出来即可。

在上述的基本原理中，参数分组模块基于用户当前所处的环境以及上层应用模块中用户需求的语音质量模式进行分组，那么在各实施例中，将当前用户所处的环境按照噪声强度分为：安静环境、轻微噪声环境、中度噪声环境、强噪声环境等。其中约定每一种环境的噪声强度处于一个范围内，例如典型的中度噪声环境（如办公环境）内，噪声强度是一定的，那么增大此环境内的噪声强度，当达到一定程度后成为强噪声环境。所以当用户当前所处环境的噪声强度处于某一个噪声环境的噪声范围内时，我们就以此噪声环境的典型值进行处理。当然对于噪声情况的分类不拘泥于具体的上述形式，它可以有其它的分类形式，如每种噪声环境设置噪声范围内的最大值进行噪声处理等，具体的实现形式可以依据用户的需求及具体的设计来实现。

在高保真模式下，基于噪声环境的不同，高保真模式的参数按照噪声强度的不同或者噪声类型的不同分为多个参数分组，并将高保真模式的参数按照不同的噪声环境进行调节，重新写入各个参数分组。其中事先写入的高保真模式的参数是基于人的声音的标准曲线进行调节的，在不同的噪声环境下，基于实际的语音信号频谱，调节的效果会不同，从而得到的参数配置也不一样。例如在较安静环境下，噪声强度较小，不需要使用高低通滤波器对语音信号进行较强的滤除，只需要消噪子模块进行一定强度的处理就能消除噪声，并通过调节频谱调节子模块中的均衡滤波器来对失真的语音信号进行调节修复即可；如果所处的噪声环境比较恶劣，为了使需要的语音信号达到高保真的程度，不能通过均衡滤波器对噪声语音信号进行较强的滤除，只能通过消噪子模块对噪声语音信号进行一定程度的滤除，此时高保真的信号中会混有轻微的噪声语音信号，即以噪声为代价换取语音信号的不失真，从而达到高保真的效果。本发明实施例只是以上层应用模块中的高保真模式来进行说明，在通话的过程中，如果用户选用舒适度模式，步骤同本发明实施例类似，即在不同的噪声环境下，主处理器模块会读取参数分组模块中舒适度模式下相应噪声强度中的参数配置。通过此参数配置，写入语音处理模块，语音处理模块会对当前噪声环境下的失真语音信号进行调节修复，并通过消噪子模块滤除其中的噪声，通过消回音子模块消除其中的回音。最后对语音信号进行整体的处理后，保证语音信号几乎不失真与几乎没有噪声，使得语音音质达到主观比较舒适的效果。

如果用户选用低噪声模式，其他步骤同本发明实施例类似，不同点在于基于不同的噪声环境，对低噪声模式的参数会进行特定的调节，得到分别适用于不同噪声环境的低噪声模式的参数配置。例如当环境强度为安静环境时，对于需要调节的低噪声模式的消噪参数，使其达到处理能力不是很强的效果；而当环境强度为强噪声环境时，需要调节低噪声模式的消噪参数，使得消噪子模块的噪声处理能力比较强，滤波器等子模块能够对噪声语音信号进行滤除。在此种情况下，以牺牲部分失真度来换取对非稳态噪声的全部消除，从而达到用户需要的低噪声语音质量模式，此模式适用于环境较恶劣，同时对声音失真度不敏感的用户。

如果用户选用私密模式，因为在此模式下，输入的不含噪声的语音信号能量较小，噪声语音信号较强，故需要对语音信号进行特定的处理。对发送方来说，通过模拟增益放大后，经过数据收集 /播放及数模 /模数转换模块进行模数转换。其中经过模拟增益放大后，较弱的语音信号被放大，同时放大的还有噪声语音信号。此时将含有较强噪声语音信号的语音信号送入语音处理模块，得到当前的噪声环境参数，主处理器模块根据当前的噪声环境参数和私密模式的参数，读取参数分组模块中私密模式下相应噪声强度中的参数配置，语音处理模块按照读取的参数配置对夹杂在语音信号中的噪声语音信号进行滤除。因为噪声语音信号较强，所以需要先调用滤波器子模块滤除语音信号频带外的噪声语音信号，调用消噪子模块对频带内的噪声语音信号进行滤除，同时调用消回音子模块滤除语音信号中的回音语音信号，最后经过数字增益放大，将能量较小的语音信号放大到合适的增益值，经过均衡滤波器，调节语音信号的频谱，使其达到较好的保真度。

图 3是本发明实施例提供的语音质量处理的模块间相互协作的发送方流程示意图。如图 3 所示，通过具体实施例对本发明提供的发送方流程进行详细描述，步骤如下：

步骤 301 : 用户发起呼叫请求或接受被叫请求。

步骤 302: 上层应用程序调用底层的相关流程，完成相关初始化工作，并调用启动硬件流程。

步骤 303 :上层应用程序会把用户选择的语音质量模式的参数发送给主处理程序，并将所述参数记录在主处理程序中。

步骤 304: 启动硬件流程，通过对硬件进行上电、分配时钟等操作，实现对软件的初始化操作，使得硬件能够正常工作。

步骤 305 : 麦克风将拾取的含有噪声的模拟语音信号发送给数据收集 / 播放及数模 /模数转换模块进行模数转换。

步骤 306: 数据收集 /播放及数模 /模数转换模块对收到的模拟语音信号转换成数字语音信号后，通过数字接口发送给语音处理模块进行语音处理。

步骤 307:经语音处理模块进行语音检测后，得到当前的噪声环境参数，并将当前的噪声环境参数通过相关接口送入主处理程序。

步骤 308:主处理程序将步骤 303和步骤 307中的相关参数作为查询条件，在参数分组模块中进行参数分组查询，查询到满足条件的参数配置后，读取相关参数配置，将读取到的相关参数配置通过相关接口写入语音处理模块。

步骤 309: 语音处理模块按照写入的相关参数配置，对含有噪声回音的数字语音信号进行相应的功能处理，并将功能处理后的数字语音信号再次发送给主处理程序。

步骤 310:主处理程序对经过噪声回音功能处理后的数字语音信号进行编码等工作后，将编码后的数字语音信号发送给后续处理模块进行后续处理。

步骤 311 : 后续处理模块对编码后的数字语音信号进行协议、物理等处理，通过天线将编码后的数字语音信号发送出去。

图 4是本发明实施例提供的语音质量处理的模块间相互协作的接收方软件流程示意图。如图 4所示，通过具体实施例对本发明提供的接收方软件流程进行详细描述，步骤如下：

步骤 401 : 用户发起呼叫请求或接受被叫请求。

步骤 402: 天线将数字语音信号接收下来，并进行相应的处理，将处理完的数字语音信号送入主处理程序，进行解码等工作。

步骤 403：上层应用程序将用户选择的语音质量模式的参数发送给主处理程序，并将所述参数记录在主处理程序中。

步骤 404: 主处理程序将数字语音信号送入语音处理模块进行语音检测，得到相应的噪声环境参数。

步骤 405:将得到的相应的噪声环境参数通过相关接口发送给主处理程序。

步骤 406:主处理程序按照步骤 404和步骤 405中的相关参数作为查询条件在参数分组模块中进行参数分组查询，查询到满足条件的参数配置后，读取相关参数配置，将读取到的相关参数配置通过相关接口写入语音处理模块。步骤 407: 语音处理模块按照写入的相关参数配置，对含有噪声回音的数字语音信号进行相应的功能处理，并将功能处理后的数字语音信号发送给数据收集 /播放及数模 /模数转换模块。

步骤 408: 将功能处理后的数字语音信号进行数模转换，转换成模拟语音信号，播放出来即可。

本发明另一优选实施例提供了一种在本发明实施例基础上的扩充方法，所述扩充方法相比较于本发明实施例的区别如下：

配合移动终端中的加速传感器等器件，可以检测到当外部环境安静时，且用户处于非运动状态。在此种情况下，通过调节相关语音质量模式的参数，在不损害语音质量的前提下，由主处理器模块控制语音处理器模块来关闭相关子模块，如关闭自动增益控制（ AGC， Automatic Generation Control ) 或动态范围控制（DRC， Dynamic Range Control )功能等。这样，在长时间通话的过程中，可以减小相关子模块的负载，减小发热耗电问题；也可以在此种情况下，不必每次都对含有噪声的语音信号进行查询参数配置并读取参数配置的工作，可以通过每 2秒（s )或更长时间对含有噪声的语音信号的噪声环境参数进行一次检测，达到减小主处理器模块负载的目的。此扩充方案也不仅仅局限于此一类应用，还可以配合其他器件，实现其他一类的功能。

本发明又一优选实施例提供了一种在本发明实施例基础上的扩充方法，所述扩充方法相比较于本发明实施例的区别如下：

本发明实施例进行查询参数配置的条件是由用户选择的语音质量模式与噪声环境共同决定的。在本发明实施例的基础上，如果用户没有进行语音质量模式的选择，移动终端会根据噪声环境及默认的语音质量模式进行查询参数配置。具体的操作实现不局限于上述几种情况，取决于用户的实际需求及设计的实现。综上所述，本发明实施例具有以下技术效果：通过用户选择的语音质量模式与当前的噪声环境得到适配的语音处理参数的方法，实现用户在特定环境下的不同需求，通过选择所需要的语音质量模式，满足用户的个性化需求。

尽管上文对本发明实施例进行了详细说明，但是本发明实施例不限于按照本发明实施例原理所作的修改，都应当理解为落入本发明实施例的保护范围。工业实用性

本发明实施例能够根据用户在特定环境下的不同需求，选择所需要的语音质量模式，并通过不同噪声环境以及不同用户对语音质量的需求，得到适配的语音处理参数的方法，实现不同用户在不同的环境下对语音质量的个性化需求。

Claims

权利要求书

1、一种语音质量处理的方法，所述方法包括：

通过对待处理的语音信号进行噪声检测，得到所述语音信号的当前噪声环境；

2、根据权利要求 1所述的方法，其中，所述通过对待处理的语音信号进行噪声检测，得到所述语音信号的当前噪声环境包括：

通过对麦克风拾取的模拟语音信号进行模数转换，得到数字语音信号；通过对所述数字语音信号进行噪声检测，得到当前噪声环境参数；利用预置的噪声环境参数与噪声环境的关系表，得到与当前噪声环境参数相对应的当前噪声环境。

3、根据权利要求 1或 2所述的方法，其中，所述通过对待处理的语音信号进行噪声检测，得到所述语音信号的当前噪声环境还包括：

利用预置的噪声环境参数与噪声环境的关系表，得到与当前对方的噪声环境参数相对应的当前噪声环境。

4、根据权利要求 1所述的方法，其中，所述根据所述当前噪声环境和用户选择的语音质量模式，得到适配的语音处理参数，包括：

从保存的多个参数分组中查找与当前噪声环境和用户选择的语音质量模式相适应的参数分组；

5、根据权利要求 1所述的方法，其中，所述利用语音处理参数对所述语音信号进行语音处理，包括：

6、根据权利要求 1所述的方法，其中，所述利用语音处理参数对所述语音信号进行语音处理，包括：

7、根据权利要求 1所述的方法，其中，所述利用语音处理参数对所述语音信号进行语音处理，包括：

8、根据权利要求 1所述的方法，其中，所述利用语音处理参数对所述语音信号进行语音处理，包括：

9、一种语音质量处理的装置，所述装置包括：

噪声环境模块，配置为通过对待处理的语音信号进行噪声检测，得到所述语音信号的当前噪声环境；

语音处理参数模块，配置为根据所述当前噪声环境和用户选择的语音质量模式，得到适配的语音处理参数；

语音质量模块，配置为利用所述语音处理参数对所述语音信号进行语音处理，使处理后的语音信号的语音质量与当前噪声环境和用户选择的语音质量模式相适应。

10、根据权利要求 9所述的装置，其中，所述语音质量模块包括：消噪子模块，配置为利用消噪参数对所述语音信号进行消噪处理，以消除所述语音信号中的噪声；