CN110769111A

CN110769111A - 一种降噪方法、系统、存储介质以及终端

Info

Publication number: CN110769111A
Application number: CN201911048675.2A
Authority: CN
Inventors: 高杰
Original assignee: Gree Electric Appliances Inc of Zhuhai
Current assignee: Gree Electric Appliances Inc of Zhuhai
Priority date: 2019-10-28
Filing date: 2019-10-28
Publication date: 2020-02-07

Abstract

本发明公开了一种降噪方法、系统、存储介质以及终端，涉及语音降噪技术领域，该方法包括：确定终端所处的通话场景；根据所述通话场景，从预设的数据库中获取与所述通话场景的类型相匹配的降噪模型；利用所述降噪模型对终端发送和/或接收的语音信号进行降噪处理。本发明的有益效果是：不仅能够根据不同的通话场景进行对应的降噪处理，而且能够对上行语音和/或下行语音进行分别降噪，可以使得终端的用户在通话时不被外界噪音影响，使得对端接收到的语音信息清晰、没有噪声，从而提高用户体验。

Description

一种降噪方法、系统、存储介质以及终端

技术领域

本发明涉及语音降噪技术领域，尤其涉及一种降噪方法、系统、存储介质以及终端。

背景技术

目前，市面上的手机内部基本都适配了一套针对各种场景进行优化的降噪参数。但是，在复杂的噪声场景下，该通用的模式无法完全兼容各种复杂的噪声场景，导致用户只能通过调大手机音量来提升通话体验。这就使得在某些特殊的噪声场景下，给用户的语音通话带来不好的用户体验。

发明内容

本发明正是基于上述技术问题，提出了一种能够根据终端所处的通话场景确定相匹配的降噪模型的降噪方法、系统、存储介质以及终端，以提高用户体验。

第一方面，本发明实施例提供了一种降噪方法，包括：

确定终端所处的通话场景；

根据所述通话场景，从预设的数据库中获取与所述通话场景的类型相匹配的降噪模型；

利用所述降噪模型对终端发送和/或接收的语音信号进行降噪处理。

进一步，确定终端所处的通话场景，包括：

获取所述终端所处的环境的环境噪音；

根据所述环境噪音，确定所述终端所处的通话场景。

进一步，根据所述环境噪音，确定所述终端所处的通话场景，包括：

对所述环境噪音的波形进行分段，并从各段波形上分别提取至少一个特征点，以根据所述特征点获得所述环境的噪声信号特征向量；

将所述噪声信号特征向量与预设的数据库中的通话场景对应的噪声信号特征向量进行匹配，并根据匹配结果确定所述终端所处的通话场景。

进一步，确定终端所处的通话场景，包括：

获取语音信息；

对所述语音信息进行语义分析，以获得反映通话场景的关键词；

根据所述关键词，确定终端所处的通话场景。

进一步，所述降噪模型包括上行降噪模型和/或下行降噪模型，其中，所述上行降噪模型用于对终端发送的语音信号进行降噪处理，所述下行降噪模型用于对终端接收的语音信号进行降噪处理。

进一步，所述降噪模型通过以下步骤构建：

确定一噪声滤波模型，其中，所述噪声滤波模型用于对语音信号进行降噪处理；

根据不同类型的通话场景的环境噪音的信号特征，对所述噪声滤波模型的降噪参数的数值进行调整，以得到不同类型的通话场景对应的降噪模型；其中，所述降噪参数包括噪声门限参数、噪声抑制参数以及噪声参数的收敛程度中的至少一种。

进一步，根据所述降噪模型对所述终端接收到的语音进行降噪处理之后，还包括：

再次确定终端所处的通话场景；

当再次确定到的通话场景与当前使用的降噪模型对应的通话场景不一致时，获取与所述再次确定到的通话场景对应的降噪模型。

第二方面，本发明实施例还提供了一种降噪系统，包括：

确定模块，其用于确定终端所处的通话场景；

匹配模块，其用于根据所述通话场景，从预设的数据库中获取与所述通话场景的类型相匹配的降噪模型；

降噪模块，其用于根据所述降噪模型对终端发送和/或接收语音信号进行降噪处理。

第三方面，本发明实施例还提供了一种存储介质，所述存储介质上存储有程序代码，所述程序代码被处理器执行时，实现如上述实施例任一项所述的降噪方法。

第四方面，本发明实施例还提供了一种终端，所述终端包括存储器、处理器，所述存储器上存储有可在所述处理器上运行的程序代码，所述程序代码被所述处理器执行时，实现如上述实施例任一项所述的降噪方法。

在本发明实施例提供的一种降噪方法，通过确定通话场景，并匹配与该通话场景对应的降噪模型，以利用所述降噪模型对终端发送和/或接收的语音信号进行降噪处理。使得终端能够根据不同的通话场景进行对应的降噪处理，而且可以分别对上行语音和/或者下行语音进行降噪处理。可见，本发明实施例提供的降噪方法，不仅能够根据不同的通话场景进行对应的降噪处理，而且能够对上行语音和 /或下行语音进行分别降噪，可以使得终端的用户在通话时不被外界噪音影响，使得对端接收到的语音信息清晰、没有噪声，从而提高用户体验。

附图说明

通过结合附图阅读下文示例性实施例的详细描述可更好地理解本公开的范围。其中所包括的附图是：

图1示出了本发明实施例一提出的一种降噪方法的流程示意图；

图2示出了本发明实施例二提出的一种降噪方法的流程示意图；

图3示出了图2所示的步骤220的具体流程示意图；

图4示出了本发明实施例三提出的一种降噪方法的流程示意图；

图5示出了本发明实施例四提出的一种降噪方法的流程示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，以下将结合附图及实施例来详细说明本发明的实施方法，借此对本发明如何应用技术手段来解决技术问题，并达成技术效果的实现过程能充分理解并据以实施。

在下面的描述中阐述了很多具体细节以便于充分理解本发明，但是，本发明还可以采用其他不同于在此描述的其他方式来实施，因此，本发明的保护范围并不受下面公开的具体实施例的限制。

实施例一

根据本发明的实施例，提供了一种降噪方法，图1示出了本发明实施例一提出的一种降噪方法的流程示意图，如图1所示，该降噪方法可以包括：步骤110 至步骤130。

在步骤110中，确定终端所处的通话场景。

这里，终端所处的通话场景指的是终端建立通话时所处的场景。例如，用户在车站建立通话，则终端所处的通话场景是车站；若用户在商场建立通话，则终端所处的通话场景是商场。

在步骤120中，根据所述通话场景，从预设的数据库中获取与所述通话场景的类型相匹配的降噪模型。

这里，通过获取与所述通话场景的类型相匹配的降噪模型，可以在用户使用终端建立通话时，使用与用户建立通话时终端所处的通话场景对应的降噪模型对通话的语音信息进行降噪。

在步骤130中，利用所述降噪模型对终端发送和/或接收的语音信号进行降噪处理。

这里，终端发送和/或接收的语音信号，终端发送的上行语音和/或终端接收到的下行语音。其中，上行语音指的是本端发送到对端的链路，包括本端麦克风采集的语音信息，并通过本端发送到基站的语音信号；下行语音指的是本端接收到对端的链路，包括本端设备接收到基站发送的对端的语音信号，并将该语音信号传输至本端的听筒。

由此，通过利用所述降噪模型对终端发送和/或接收的语音信号进行降噪处理。可以实现对上行语音和/或下行语音进行降噪，可以使得终端的用户在通话时不被外界噪音影响，同时也能够对上行语音进行降噪，使得对端接收到的语音信息清晰、没有噪声。

在本实施例中，通过确定通话场景，并匹配与该通话场景对应的降噪模型。使得终端能够根据不同的通话场景进行对应的降噪处理，从而提高用户的通话体验。

实施例二

在上述实施例的基础上，本发明的实施例二还可以提供一种降噪方法。图2 示出了本发明实施例二提出的一种降噪方法的流程示意图，如图2所示，该降噪方法可以包括：步骤210至步骤240。

在步骤210中，获取所述终端所处的环境的环境噪音。

这里，获取终端所处的环境的环境噪音，可以是通过设置在终端上的语音采集装置来采集所述环境噪音，例如听筒。其中，获取终端所处的环境的环境噪音的过程，在用户即将建立通话或成功建立通话之后进行。

在步骤220中，根据所述环境噪音，确定所述终端所处的通话场景。

这里，由于特定的场景会有不同的环境噪音，例如车站这一通话场景会有车站这一场景下独特的环境噪声类型，商场会有商场这一场景下独特的环境噪声类型。因此，根据所述环境噪音，即可确定所述终端所处的通话场景。

在步骤230中，根据所述通话场景，从预设的数据库中获取与所述通话场景的类型相匹配的降噪模型。

值得说明的是，从预设的数据库中获取与所述通话场景的类型相匹配的降噪模型。所述数据库中预设有不同类型的通话场景及对应的降噪模型。

在一个可选的实施方式中，所述降噪模型通过以下步骤构建：

这里，确定一噪声滤波模型，噪声滤波模型的类型以及使用的算法根据对应的环境噪音的信号特征确定。再根据该环境噪音的信号特征，对所述噪声滤波模型的降噪参数的数值进行调整，以得到不同类型的通话场景对应的降噪模型。

以饭店噪声为例，饭店噪声为典型的非稳态噪声。因此，可以通过降低噪声滤波器的噪声门限参数，以提升噪声检测的灵敏度，同时将噪声抑制参数加强，噪声参数使能部分的收敛程度同步加强，提升噪声消除效果，从而得到一个对应饭店通话场景的降噪模型。

在步骤240中，利用所述降噪模型对终端发送和/或接收的语音信号进行降噪处理。

值得说明的是，所述降噪模型包括上行降噪模型和/或下行降噪模型，其中，所述上行降噪模型用于对终端发送的语音信号进行降噪处理，所述下行降噪模型用于对终端接收的语音信号进行降噪处理。

这里，由于采集上行语音和下行语音的装置存在区别，导致针对同一通话场景，对上行语音和/或下行语音进行降噪，使用的降噪模型会有区别。通过所述上行降噪模型对终端发送的上行语音进行降噪处理，通过所述下行降噪模型对终端接收到的下行语音进行降噪处理。可以实现对上行语音和/或下行语音进行分别降噪处理，可以使得终端的用户在通话时不被外界噪音影响，同时也能够对上行语音进行降噪，使得对端接收到的语音信息清晰、没有噪声。

在一个可选的实施方式中，图3示出了图2所示的步骤220的具体流程示意图，如图3所示，步骤220中，根据所述环境噪音，确定所述终端所处的通话场景，可以包括：步骤221至步骤222。

在步骤221中，对所述环境噪音的波形进行分段，并从各段波形上分别提取至少一个特征点，以根据所述特征点获得所述环境的噪声信号特征向量。

这里，首先对环境噪音的波形进行分段，该分段可以是均匀间隔分段，也可以是根据波形的特征进行特定分段。分段的目的是要提取每一段波形上的特征点，从而反映整个波形的特征类型。通过环境噪音的波形上提取多个特征点，并根据多个特征点得到噪声信号特征向量，从而将该噪声信号特征向量作为反映通话场景的类型的依据。

在步骤222中，将所述噪声信号特征向量与预设的数据库中的通话场景对应的噪声信号特征向量进行匹配，并根据匹配结果确定所述终端所处的通话场景。

这里，在数据库中存储有不同类型的通话场景及对应的噪声信号特征向量，通过将提取到的噪声信号特征向量与数据库中的噪声信号特征向量进行对比，即可获得提取到的噪声信号特征向量对应的通话场景，从而确定终端所处的通话场景。例如，提取到的噪声信号特征向量是A，数据库中存在噪声信号特征向量A 对应通话场景B，则根据提取到的噪声信号特征向量A，确定到的通话场景为B。

在一个可选的实施方式中，在步骤230之后，还可以包括：

再次确定终端所处的通话场景；

当再次确定到的通话场景与当前使用的降噪模型对应的通话场景不一致时，则获取与所述再次确定到的通话场景对应的降噪模型。

这里，由于在通话过程中，通话场景会发生变化，因此当再次确定到的通话场景与当前使用的降噪模型对应的通话场景不一致时，则获取与所述再次确定到的通话场景对应的降噪模型。其中，再次确定终端所处的通话场景的操作可以是间隔预设时间之后执行。

由此，通过实时判断通话场景是否发生变化，以实时对降噪模型进行调整，可以提高通话质量，以提高用户体验。

实施例三

在上述实施例的基础上，本发明的实施例三还可以提供一种降噪方法。图4 示出了本发明实施例三提出的一种降噪方法的流程示意图，如图4所示，该降噪方法可以包括：步骤310至步骤350。

在步骤310中，获取语音信息。

这里，所述语音信息可以是用户输入的语音控制命令。例如，当用户处在车站时，其在通话前可以输入语音控制命令，以获得对应的降噪模型。

在步骤320中，对所述语音信息进行语义分析，以获得反映通话场景的关键词。

在步骤330中，根据所述关键词，确定终端所处的通话场景。

这里，对所述语音信息进行语义分析，包括提取用户的语音信息中能反映通话场景的关键词，进而判断该反映通话场景的关键词能否作为食品的品类信息。例如，用户输入的语音信息是调用车站降噪模型，从“调用车站降噪模型”的语音信息中获得的关键词包括“调用”、“车站”“降噪模型”，则“车站”能够作为反映通话场景。因此，通过用户输入语音信息，可以确定用户需要调用的是车站这一通话场景对应的降噪模型。

在步骤340中，根据所述通话场景，从预设的数据库中获取与所述通话场景的类型相匹配的降噪模型。

在步骤350中，利用所述降噪模型对终端发送和/或接收的语音信号进行降噪处理。

实施例四

在上述实施例的基础上，本发明的实施例四还可以提供一种降噪方法。图5 示出了本发明实施例四提出的一种降噪方法的流程示意图，如图5所示，该降噪方法包括以下步骤：

获取环境噪音；

这里，所述环境噪音是指终端建立通话时所处的环境的环境噪音。可以是通过设置在终端上的语音采集装置来采集所述环境噪音，例如听筒。其中，获取终端所处的环境的环境噪音的过程，在用户即将建立通话或成功建立通话之后进行。

对环境噪音进行分析；

这里，对所述环境噪音进行分析，包括对所述环境噪音的波形进行分段，并分别从各段波形上提取至少一个特征点，以根据所述特征点获得噪声信号特征向量。其中，在数据库中存储有不同类型的通话场景及对应的噪声信号特征向量，通过将提取到的噪声信号特征向量与数据库中的噪声信号特征向量进行对比，即可获得提取到的噪声信号特征向量对应的通话场景，从而确定终端所处的通话场景。例如，提取到的噪声信号特征向量是A，数据库中存在噪声信号特征向量A 对应通话场景B，则根据提取到的噪声信号特征向量A，确定到的通话场景为B。

确定通话场景；

这里，确定通话场景包括将所述噪声信号特征向量与预设的通话场景对应的噪声信号特征向量进行匹配，并根据匹配结果确定所述终端所处的通话场景。其中，在数据库中存储有不同类型的通话场景及对应的噪声信号特征向量，通过将提取到的噪声信号特征向量与数据库中的噪声信号特征向量进行对比，即可获得提取到的噪声信号特征向量对应的通话场景，从而确定终端所处的通话场景。例如，提取到的噪声信号特征向量是A，数据库中存在噪声信号特征向量A对应通话场景B，则根据提取到的噪声信号特征向量A，确定到的通话场景为B。

匹配降噪模型；

这里，匹配降噪模型包括根据所述通话场景，从预设的数据库中获取与所述通话场景的类型相匹配的降噪模型。例如，当通话场景为车站时，则匹配到降噪模型1，当通话场景为饭店时，则匹配到降噪模型2。

值得说明的是，当无法匹配到对应的降噪模型，则使用默认参数进行降噪。所述默认参数是指任意通话场景都适用的降噪参数。

如图5所示，在另一个实施例中，该降噪方法包括以下步骤：

获取语音信息；

对语音信息进行分析；

这里，对语音信息进行分析，包括对所述语音信息进行语义分析，以获得反映通话场景的关键词。

确定通话场景；

这里，根据所述关键词，确定终端所处的通话场景。其中，对所述语音信息进行语义分析，包括提取用户的语音信息中能反映通话场景的关键词，进而判断该反映通话场景的关键词能否作为食品的品类信息。例如，用户输入的语音信息是调用车站降噪模型，从“调用车站降噪模型”的语音信息中获得的关键词包括 “调用”、“车站”“降噪模型”，则“车站”能够作为反映通话场景。因此，通过用户输入语音信息，可以确定用户需要调用的是车站这一通话场景对应的降噪模型。

匹配降噪模型；

实施例五

根据本发明的实施例，还提供了一种降噪系统，包括：

确定模块，其用于确定终端所处的通话场景；

实施例六

根据本发明的实施例，还提供了一种存储介质，所述存储介质上存储有程序代码，所述程序代码被处理器执行时，实现如上述实施例任一项所述的降噪方法。

实施例七

根据本发明的实施例，还提供了一种终端，所述终端包括存储器、处理器，所述存储器上存储有可在所述处理器上运行的程序代码，所述程序代码被所述处理器执行时，实现如上述实施例任一项所述的降噪方法。

以上结合附图详细说明了本发明的技术方案，考虑到相关技术中，在复杂的噪声场景下，该通用的模式无法完全兼容各种复杂的噪声场景，导致用户只能通过调大手机音量来提升通话体验。本发明提供一种降噪方法、系统、存储介质以及终端，通过确定通话场景，并匹配与该通话场景对应的降噪模型。使得终端能够根据不同的通话场景进行对应的降噪处理，而且可以分别对上行语音和/或者下行语音进行降噪处理。不仅能够根据不同的通话场景进行对应的降噪处理，而且能够对上行语音和/或下行语音进行分别降噪，可以使得终端的用户在通话时不被外界噪音影响，使得对端接收到的语音信息清晰、没有噪声，从而提高用户体验。

在本申请所提供的几个实施例中，应该理解到，所揭露的装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。

作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本发明实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分，或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台终端(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM， Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

虽然本发明所公开的实施方式如上，但所述的内容只是为了便于理解本发明而采用的实施方式，并非用以限定本发明。任何本发明所属技术领域内的技术人员，在不脱离本发明所公开的精神和范围的前提下，可以在实施的形式上及细节上作任何的修改与变化，但本发明的保护范围，仍须以所附的权利要求书所界定的范围为准。

Claims

1.一种降噪方法，其特征在于，包括：

确定终端所处的通话场景；

2.根据权利要求1所述的降噪方法，其特征在于，确定终端所处的通话场景，包括：

获取所述终端所处的环境的环境噪音；

根据所述环境噪音，确定所述终端所处的通话场景。

3.根据权利要求2所述的降噪方法，其特征在于，根据所述环境噪音，确定所述终端所处的通话场景，包括：

4.根据权利要求1所述的降噪方法，其特征在于，确定终端所处的通话场景，包括：

获取语音信息；

根据所述关键词，确定终端所处的通话场景。

5.根据权利要求1所述的降噪方法，其特征在于，所述降噪模型包括上行降噪模型和/或下行降噪模型，其中，所述上行降噪模型用于对终端发送的语音信号进行降噪处理，所述下行降噪模型用于对终端接收的语音信号进行降噪处理。

6.根据权利要求1所述的降噪方法，其特征在于，所述降噪模型通过以下步骤构建：

7.根据权利要求1所述的降噪方法，其特征在于，根据所述降噪模型对所述终端接收到的语音进行降噪处理之后，还包括：

再次确定终端所处的通话场景；

8.一种降噪系统，其特征在于，包括：

确定模块，其用于确定终端所处的通话场景；

9.一种存储介质，所述存储介质上存储有程序代码，其特征在于，所述程序代码被处理器执行时，实现如权利要求1至7中任一项所述的降噪方法。

10.一种终端，其特征在于，所述终端包括存储器、处理器，所述存储器上存储有可在所述处理器上运行的程序代码，所述程序代码被所述处理器执行时，实现如权利要求1至7中任一项所述的降噪方法。