CN109785850A

CN109785850A - 一种噪声检测方法、装置和存储介质

Info

Publication number: CN109785850A
Application number: CN201910048103.8A
Authority: CN
Inventors: 徐东; 王征韬; 赵伟峰
Original assignee: Tencent Music Entertainment Technology Shenzhen Co Ltd
Current assignee: Tencent Music Entertainment Technology Shenzhen Co Ltd
Priority date: 2019-01-18
Filing date: 2019-01-18
Publication date: 2019-05-21

Abstract

本申请实施例公开了一种噪声检测方法、装置和存储介质，该方法包括：获取待检测音频的多个音频特征，基于分类树模型获取多个音频特征与正负样本标签的关联度，根据关联度生成待检测音频存在噪声的概率，当概率大于预设概率阈值时，确定待检测音频存在噪声。该方案通过提取音频的多个音频特征，根据分类树模型和音频的多个音频特征获取待检测音频存在噪声的概率，确定待检测音频中是否存在噪声，该方案提高了检测音频中噪声的效率和准确性。

Description

一种噪声检测方法、装置和存储介质

技术领域

本申请涉及信号处理领域，具体涉及一种噪声检测方法、装置和存储介质。

背景技术

由于科技水平的不断提高，人们可以通过多种渠道收听音乐，对于音乐质量的要求也在不断提高，但是由于录制设备或者录制环境等等的限制，会导致音乐中存在噪声，这些噪声的存在会严重影响音频的质量和用户体验。而现有技术中并无对音乐文件中噪声进行检测的技术方案，因此，采用技术手段高效准确地检测音频中噪声的存在是非常有必要的。

发明内容

本申请实施例提供一种噪声检测方法、装置和存储介质，可以提高检测音频中噪声的效率和准确性。

本申请实施例提供一种噪声检测方法，包括：

获取待检测音频的多个音频特征；

基于所述分类树模型获取所述多个音频特征与正负样本标签的关联度；

根据所述关联度生成所述待检测音频存在噪声的概率；

当所述概率大于预设概率阈值时，确定所述待检测音频存在噪声。

相应的，本申请实施例还提供一种噪声检测装置，包括：

特征获取模块，用于获取待检测音频的多个音频特征；

关联度获取模块，用于基于所述分类树模型获取所述多个音频特征与正负样本标签的关联度；

概率生成模块，用于根据所述关联度生成所述待检测音频存在噪声的概率；

确定模块，用于当所述概率大于预设概率阈值时，确定所述待检测音频存在噪声。

此外，本申请实施例还提供一种存储介质，所述存储介质存储有多条指令，所述指令适于处理器进行加载，以执行本申请实施例提供的任一种噪声检测方法中的步骤。

本申请实施例公开了一种噪声检测方法、装置和存储介质，该方法包括：获取待检测音频的多个音频特征，基于分类树模型获取多个音频特征与正负样本标签的关联度，根据关联度生成待检测音频存在噪声的概率，当概率大于预设概率阈值时，确定待检测音频存在噪声。该方案提高了检测音频中噪声的效率和准确性。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本申请实施例提供的噪声检测系统的场景示意图；

图2是本申请实施例提供的噪声检测方法的第一流程图；

图3是本申请实施例提供的噪声检测方法的第二流程图；

图4是本申请实施例提供的噪声检测方法的第三流程图；

图5是本申请实施例提供的存在噪声音频的时频特性图；

图6是本申请实施例提供的不存在噪声音频的时频特性图；

图7是本申请实施例提供的噪声检测装置的第一种结构示意图；

图8是本申请实施例提供的噪声检测装置的第二种结构示意图；

图9是本申请实施例提供的噪声检测装置的第三种结构示意图；

图10是本申请实施例提供的网络设备的结构示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

本申请实施例提供一种噪声检测方法、装置和存储介质。

本噪声检测装置具体可以集成在网络设备，比如终端或服务器等设备中。

例如，参见图1，当用户需要对待检测音频中噪声进行检测时，网络设备可以获取待检测音频的多个音频特征，基于分类树模型获取多个音频特征与正负样本标签的关联度，根据关联度生成待检测音频存在噪声的概率，当概率大于预设概率阈值时，确定待检测音频存在噪声。

以下分别进行详细说明。需说明的是，以下实施例的顺序不作为对实施例优选顺序的限定。

在本实施例中，将从噪声检测装置的角度进行描述，该噪声检测装置具体可以集成在网络设备，比如终端或服务器等设备中。

本申请实施例提供一种噪声检测方法，包括：获取待检测音频的多个音频特征，基于分类树模型获取多个音频特征与正负样本标签的关联度，根据关联度生成待检测音频存在噪声的概率，当概率大于预设概率阈值时，确定待检测音频存在噪声。

如图2所示，该噪声检测方法的具体流程可以如下：

201、获取待检测音频的多个音频特征。

其中，音频是人类能够听到的所有声音，音频中可能包括噪音等。音频文件为存储声音内容的文件。

在本申请实施例中，待检测音频可以为未经噪声检测的音频文件，未经噪声检测的音频文件不包括音频的多个音频特征。

其中，待检测音频的格式、大小不限，比如，待检测音频的文件格式可以为MP3、WAV、FLAC等等。

其中，待检测音频的音频文件数量没有上限，从而可以实现对海量音频文件进行噪声检测，提高音频噪声检测的效率。

其中，获取待检测音频的方式可以有多种，比如，可以接收用户触发的获取待检测音频请求，具体可以基于获取待检测音频请求从本地存储中获取待检测音频，或者从网络侧设备获取待检测音频，或者可以通过录制的音频文件获取待检测音频，等等。

其中，音频特征可以为音频的特征信息，比如，特征信息可以为对音频的特性进行描述的信息。

比如，音频特征可以包括：各帧能量滚降差值中的最大值、高频带内频谱对比度的均值、高频带内频谱对比度的方差、频谱在时间上平坦度的平方和、频谱在时间上平坦度的最大值、音频能量归一化后小能量区的均值、音频各帧能量归一化后在时间上的均值、音频各帧能量归一化后在时间上的方差、音频各帧的包络幅度的峰值占比等等。

通过这些音频特征可以对音频中是否存在噪声进行检测。同时通过提取音频的多种音频特征信息，相比于只提取音频的单一音频特征信息，可以提升检测音频是否存在噪声的准确性。

其中，音频特征可以通过音频信号处理的方式进行获取。比如，可以利用音频处理中的一些常用工具进行音频特征的获取，Python库中的librosa工具包，等等。

比如，各帧能量滚降差值中的最大值，可以通过分别计算每帧信号的能量下降90％和99％时对应的频率差，帧长为4096，取每帧的频率差值中的最大值进行获取。

高频带内频谱对比度的均值和方差，可以通过对高频宽带信号进行特征提取，比如可以通过提取7kHz-14kHz信号频谱对比度的均值和方差进行获取。

频谱在时间上的平坦度的平方和以及最大值。在实际应用中，当对7kHz以上的高频信号在时间上计算平坦度时，该特征值对于噪声来说偏大，对于信号来说偏小。

音频能量归一化后小能量区的均值。在实际应用中，对于音频信号而言，在人声或者乐器发声较小的时域区间，当存在噪声时，背景噪声能量会偏大。

音频各帧能量归一化后在时间上的均值和方差，该特征值可以用于区分连续高振幅的音乐和时间上有能量间歇分布的音乐。

音频各帧的包络幅度的峰值占比，该特征值可以用于区分连续高振幅音频和能量间歇分布的音频，等等。

在实际应用中，获取到待检测音频后，可以从待检测音频中提取待检测音频的多个音频特征，即对各个待检测音频提取待检测音频对应的多个音频特征。

在一实施例中，可以通过并行处理方法，从待检测音频中并行提取待检测音频的多个音频特征。

其中，并行处理方法是系统中能同时执行两个或多个处理的一种计算方法。通过并行处理可以节省大型问题以及复杂问题的解决时间。通过并行处理方法，同时提取待检测音频的多个音频特征可以提高提取音频特征的效率。

其中，噪声可以为Hiss噪声，Hiss噪声是由老式的录制设备或简化的录制环境造成的一种音频背景噪声，听感为嘶嘶声。待检测音频中可能包括噪声。

请参阅图5，图5为本申请实施例提供的存在噪声音频的时频特性图，其中，可以将时频特性图中的横轴定义为时间轴，纵轴定义为频率轴，可以见得，在时间轴方向和频率轴方向上始终存在阴影区域，该阴影区域即为存在噪声的能量，比如，如图5所示，频率轴中8kHz-16kHz的频段在时间上的连续区域存在阴影，表示该音频存在噪声，这些存在阴影的区域在播放时，听感上会有嘶嘶的声音，影响了音频的质量以及用户的体验。

请参阅图6，图6为本申请不存在噪声音频的时频特性图，其中，可以将时频特性图的横轴定义为时间轴，纵轴定义为频率轴，可以见得，如图6所示，在人声或者乐器发声能量小的时候，频率轴中的高频区域处呈现阴影区域，该阴影区域即为不存在噪声的能量。这样的音频在播放时，听感上没有嘶嘶声的影响，音频的质量较高，用户的体验较好。

在一实施例中，获取到待检测音频的多个音频特征后，还可以建立待检测音频和其对应的多个音频特征之间的映射关系。

比如，可以通过列表的形式显示待检测音频和其对应的多个音频特征之间的对应关系。比如，可以通过列表的形式，用str-name表示待检测音频，用character表示音频特征，列表可以如下：

List-Return＝[str-name,character1,character2,…character9]

比如，当有100万个待检测音频时，则对应100万个List-Return，每个List-Return都代表一个待检测音频和其对应的多个音频特征。通过列表的形式，可以清晰直观的表明待检测音频和其对应的多个音频特征之间的关系，有利于后续的检测工作，提高了噪声检测的效率。

在一实施例中，还可以将该映射关系进行保存。

202、基于分类树模型获取多个音频特征与正负样本标签的关联度。

其中，分类树模型为可以对音频进行噪声检测的网络模型。比如，分类树模型可以为基于机器学习的分类树，分类树属于一种监管学习，监管学习就是根据事先给定属性和类别的样本，经过学习得到分类器，该分类器可以对待检测的对象进行正确的分类。

比如，为了提高噪声检测的准确性，可以采用高效、灵活的XGboost(ExtremeGradient Boosting，极端梯度提升)作为分类树模型。

其中，XGboost是一种以集成思想为基础，将分类回归树(CART树)进行组合的网络模型。分类回归树是决策树的一种，并且是非常重要的决策树，是一颗二叉树，且每个非叶子节点都有两个叶子，所以对于第一棵子树其叶子节点数比非叶子节点数多1。决策树是一种依托决策而建立起来的一种树。在机器学习中，决策树是一种预测模型，代表的是一种对象属性与对象值之间的一种映射关系，每一个节点代表某个对象，树中的每一个分叉路径代表某个可能的属性值，而每一个叶子节点则对应从根节点到该叶子节点所经历的路径所表示的对象的值。决策树仅有单一输出，如果有多个输出，可以分别建立独立的决策树以处理不同的输出。

其中，样本可以为对已经标记的音频文件，比如，已经标记是否含有噪声的音频文件。样本中可以包括正样本和负样本。比如，正样本可以为包括噪声的音频文件，负样本可以为不包括噪声的音频文件，等等。

其中，正负样本标签可以为表示该样本是否包括噪声的标签。比如，正样本标签可以为包括噪声的标注，负样本标签可以为不包括噪声的标注。

在实际应用中，将多个音频特征输入分类树模型中，可以得到多个音频特征与正负样本标签的关联度，比如，可以为该音频特征对应的音频更倾向于包括噪声，还是更倾向于不包括噪声，等等。

通过分类树模型对待检测音频是否存在噪声进行检测，免除了人工判别的步骤，节约了人工成本和时间成本，具有经济价值和技术优势，提高了噪声检测的准确性和效率。

203、根据关联度生成待检测音频存在噪声的概率。

其中，该概率可以为经过分类树模型检测后，得到的待检测音频中存在噪声的可能性。根据该待检测音频存在噪声的概率的数值，可以对待检测音频是否存在噪声进行检测。

通过对待检测音频的多个音频特征进行综合检测分析，生成待检测音频存在噪声的概率，并根据该待检测音频存在噪声的概率，得到唯一的待检测音频是否存在噪声的结果。通过对多个音频特征的分析，可以提高该噪声检测方案的准确性。

204、当概率大于预设概率阈值时，确定待检测音频存在噪声。

其中，预设概率阈值为根据生成的待检测音频存在噪声的概率，判断经过检测的待检测音频是否存在噪声的阈值。

在实际应用中，可以根据待检测音频存在噪声的概率，确定该待检测音频是否存在噪声。

在一实施例中，比如，当待检测音频存在噪声的概率大于预设概率阈值时，可以将该待检测音频检测为存在噪声的音频，当待检测音频存在噪声的概率不大于预设概率阈值时，可以将该待检测音频检测为不存在噪声的音频，等等。

在一实施例中，该噪声检测方法还可以包括分类树模型的训练过程。如图3所示，该噪声检测方法还可以包括如下流程：

301、获取多个训练样本。

其中，该训练样本为样本音频的多个样本音频特征。

其中，样本音频的获取方式可以借鉴待检测音频的获取方式，样本音频的多个样本音频特征的获取方式可以借鉴待检测音频的多个音频特征的获取方式，此处不再赘述。

在一实施例中，还可以建立样本音频和其对应的多个样本音频特征之间的映射关系。

比如，可以通过列表的形式显示样本音频和其对应的多个样本音频特征之间的对应关系。比如，可以通过列表的形式，用str-name表示样本音频，用character表示样本音频特征，列表可以如下：

List-Return＝[str-name,character1,character2,…character9]

比如，当有100万个样本音频时，则对应100万个List-Return，每个List-Return都代表一个样本音频和其对应的多个样本音频特征。通过列表的形式，可以清晰直观的表明样本音频和其对应的多个样本音频特征之间的关系，有利于后续的检测工作，提高了噪声检测的效率。

在一实施例中，还可以将该映射关系进行保存。

在一实施例中，为了提高分类树模型检测噪声的准确性，还可以通过训练样本对分类树模型进行训练。

具体地，步骤“获取多个训练样本”可以包括：

从样本音频中并行地提取多个样本音频特征；

根据所述多个样本音频特征构建训练样本。

在实际应用中，可以通过从样本音频中并行提取多个样本音频特征，并根据多个样本音频特征构建训练样本。比如，可以通过并行处理方法，从样本音频中提取多个样本音频特征，之后，根据多个样本音频特征构建训练样本。

在一实施例中，训练样本还可以包括正样本和负样本。训练样本中包括正样本和负样本，可以减少由于训练样本种类单一造成的误差，使得模型训练结果更准确。

其中，比如，正样本可以为存在噪声的样本音频的多个样本音频特征，负样本可以为不存在噪声的样本音频的多个样本音频特征，等等。

在一实施例中，获取到样本音频后，还可以通过人工检测样本音频，得到人工检测结果，并根据该人工检测结果，对训练样本中的每个样本进行标记，得到每个样本对应的样本标签。比如，正样本可以包括正样本标签，负样本可以包括负样本标签。

由于本实施例要实现的是检测音频中是否存在噪声，因此，所标记的样本标签可以包括正样本标签和负样本标签。比如正样本标签可以为存在噪声的标签，负样本标签可以为不存在噪声的标签，也即样本类别可以包括存在噪声的类别和不存在噪声的类别。

在一实施例中，为了提高模型训练的准确性，还可以控制正负样本之间的比例，通过将正负样本比例调整为最佳比例，使得训练结果更加准确。

具体地，该噪声检测方法还可以包括：

当所述正样本和所述负样本的数量比例不为预设比例时，对所述训练样本数量进行调整，使得所述正样本和所述负样本的数量比例为预设比例；

当所述正样本和所述负样本的数量比例为预设比例时，执行根据训练样本对分类树模型进行训练，更新所述分类树模型的步骤。

其中，预设比例为使得训练结果最准确的正样本和负样本的数量比例，比如，可以通过预先的设置，使得预设比例为1：1，即正样本和负样本的数量相同时为预设比例。当正样本和负样本的数量比例不是预设比例时，可以对正样本的数量和负样本的数量进行调整，使得正样本和负样本的数量比例达到预设比例，从而使得模型训练更加准确。当正样本和负样本的数量比例是预设比例时，就无需对正样本的数量和负样本的数量进行调整。

在一实施例中，预设比例也可以根据实际情况进行调整，比如，当训练后模型检测的准确率和召回率不满足要求时，可以通过对预设比例的调整，使得模型检测的准确率和召回率满足要求。

302、根据训练样本对分类树模型进行训练，更新分类树模型。

在实际应用中，可以根据训练样本对分类树模型进行训练，得到训练后的分类树模型，并根据该训练后的分类树模型，更新分类树模型。

在一实施例中，为了提高模型训练的准确率，可以通过根据分类树模型的评价指标，对不满足条件的分类树模型进行继续的训练。

具体地，步骤“根据训练样本对分类树模型进行训练，更新所述分类树模型”之后，还可以包括：

计算所述分类树模型的评价指标，所述评价指标包括召回率和/或精确率；

将所述评价指标和预设评价指标进行对比，得到指标对比结果；

当所述指标对比结果不满足预设指标条件时，根据所述指标对比结果对训练样本进行调整，更新所述训练样本；

返回执行根据训练样本对分类树模型进行训练，更新所述分类树模型的步骤；

所述获取待检测音频的多个音频特征的步骤包括：

当所述指标对比结果满足预设指标条件时，获取待检测音频的多个音频特征。

其中，该评价指标可以包括召回率和/或精确率。

其中，召回率在机器学习中是一种对于覆盖面的度量，计算经过网络模型的检测后，有多少正样本被分类成为正样本。

准确率在机器学习中是对网络模型分类能力的度量，计算经过网络模型的检测后，分类正确的样本占总样本的比例。准确率越高，网络模型的分类能力越强。

在实际应用中，可以对分类树模型的评价指标进行计算，该评价指标可以包括召回率和/或精确率。比如，正样本的数量为P，即P个正样本的音频文件存在噪声，使得正样本和负样本的数量比例达到预设比例，正样本和负样本的数量比例可以为1：1，即负样本的数量为P，将训练样本输入分类树模型中，若检测出正样本中存在噪声的音频数量为A，检测出负样本中存在噪声的音频数量为B，则该训练后分类树模型的召回率为A/P，精确率为A/(A+B)。

通过对分类树模型的评价指标进行计算，可以对分类树模型的检测情况进行评价，并对没有达到标准的分类树模型进行继续训练，以提高分类树模型检测的准确率。

其中，预设评价指标为评判该分类树模型的检测情况是否达到标准的指标。比如，该预设评价指标可以包括预设召回率和预设精确率，等等。

其中，指标对比结果为评价指标和预设评价指标对比后得到的结果。比如，该指标对比结果可以为召回率和预设召回率相比的数值比较结果，精确率和预设精确率相比的数值比较结果，等等。

其中，预设指标条件可以为评判分类树模型的检测情况是否达到标准的条件。比如，当召回率和预设召回率之间的偏差在预设召回率偏差范围内，并且精确率和预设精确率之间的偏差在预设精确率偏差范围内时，可以判定该分类树模型的检测情况达到标准，即可以利用该分类树模型对待检测音频进行检测。

在一实施例中，当指标对比结果满足预设指标条件时，可以执行获取待检测音频的多个音频特征的步骤。

在一实施例中，当指标对比结果不满足预设指标条件时，可以根据指标对比结果对训练样本进行调整，并根据调整后的训练样本对分类树模型进行继续训练，从而提高分类树模型的准确率。

在一实施例中，为了提高分类树模型的准确率，可以通过对训练样本数量或者样本音频特征进行调整，并对分类树模型继续进行训练。

具体地，步骤“根据所述指标对比结果对训练样本进行调整”可以包括：

根据所述指标对比结果对训练样本数量进行调整，或者；

根据所述指标对比结果对样本音频特征进行调整。

在实际应用中，通过调整训练样本，对分类树模型进行继续训练以提高分类树模型的准确性，可以对训练样本数量或者样本音频特征进行调整。

在一实施例中，还可以通过对训练样本总数量或者正样本和负样本的数量比例进行调整，以提高分类树模型的准确率。

具体地，步骤“根据所述指标对比结果对训练样本数量进行调整”可以包括：

根据所述指标对比结果对训练样本总数量进行调整；

根据所述指标对比结果对所述正样本和所述负样本的数量比例进行调整。

在实际应用中，当指标对比结果不满足预设指标条件时，可以根据指标对比结果对训练样本数量进行调整。比如，可以根据指标对比结果增加训练样本的数量，通过使用更多的训练样本对分类树模型进行训练，可以使得分类树模型的检测结果更加准确。

还可以根据指标对比结果对正样本和负样本的数量比例进行调整，比如，可以根据指标对比结果对预设比例进行调整，使得利用更新比例后的正样本和负样本，训练出分类树模型的检测情况达到标准。

在一实施例中，为了提高分类树模型的准确率，还可以对样本音频特征进行调整。

具体地，步骤“根据所述指标对比结果对样本音频特征进行调整”可以包括：

根据所述指标对比结果对样本音频特征数量参数进行调整；

根据调整后样本音频特征数量参数，从样本音频中并行地提取多个样本音频特征。

在实际应用中，可以根据指标对比结果对样本音频特征数量参数进行调整。比如，之前提取每个训练样本对应的九种样本音频特征，进行样本音频特征数量参数调整后，可以提取每个训练样本多于九种样本音频特征。通过增加样本音频特征的种类，提高分类树模型噪声检测的准确性。

在实际应用中，调整训练样本后，可以返回执行根据训练样本对分类树模型进行训练，更新分类树模型的步骤，并进行循环，直至指标对比结果满足预设指标条件。

在一实施例中，当指标对比结果不满足预设指标条件时，还可以根据指标对比结果对预设概率阈值进行调整。

其中，预设概率阈值为评判待检测音频中是否存在噪声的标准。

在实际应用中，还可以对预设概率阈值进行调整，并根据调整后的预设概率阈值，更新训练样本，之后返回执行根据训练样本对分类树模型进行训练，更新分类树模型的步骤。

由上可知，本申请实施例获取待检测音频的多个音频特征，基于分类树模型获取多个音频特征与正负样本标签的关联度，根据关联度生成待检测音频存在噪声的概率，当概率大于预设概率阈值时，确定待检测音频存在噪声。该方案通过提取音频的多个音频特征，根据分类树模型和音频的多个音频特征获取待检测音频存在噪声的概率，确定待检测音频中是否存在噪声，该方案提高了检测音频中噪声的效率和准确性。

下面将在上述实施例描述的方法基础上，对本申请的噪声检测方法做进一步介绍。参考图4，该噪声检测方法可以包括：

401、网络设备获取待检测音频的多个音频特征。

在一实施例中，可以通过并行处理方法，从待检测音频中同时提取待检测音频的多个音频特征。

List-Return＝[str-name,character1,character2,…character9]

在一实施例中，还可以将该映射关系进行保存。

402、网络设备基于分类树模型获取多个音频特征与正负样本标签的关联度。

403、网络设备根据关联度生成待检测音频存在噪声的概率。

404、当概率大于预设概率阈值时，网络设备确定待检测音频存在噪声。

在一实施例中，该噪声检测方法还可以包括分类树模型的训练过程。该噪声检测方法还可以包括如下流程：

(a)网络设备获取多个训练样本。

其中，该训练样本为样本音频的多个样本音频特征。

List-Return＝[str-name,character1,character2,…character9]

在一实施例中，还可以将该映射关系进行保存。

在实际应用中，可以通过从样本音频中并行地提取多个样本音频特征，并根据多个样本音频特征构建训练样本。比如，可以通过并行处理方法，从样本音频中提取多个样本音频特征，之后，根据多个样本音频特征构建训练样本。

(b)网络设备根据训练样本对分类树模型进行训练，更新分类树模型。

由上可知，本申请实施例通过网络设备获取待检测音频的多个音频特征，基于分类树模型获取多个音频特征与正负样本标签的关联度，根据关联度生成待检测音频存在噪声的概率，当概率大于预设概率阈值时，确定待检测音频存在噪声。该方案通过提取音频的多个音频特征，根据分类树模型和音频的多个音频特征获取待检测音频存在噪声的概率，确定待检测音频中是否存在噪声，该方案提高了检测音频中噪声的效率和准确性。

为了更好地实施以上方法，本申请实施例还可以提供一种噪声检测装置，该噪声检测装置具体可以集成在终端中，该终端可以包括：手机、平板电脑、笔记本电脑或个人计算机(PC，Personal Computer)等。

例如，如图7所示，该噪声检测装置可以包括特征获取模块71、关联度获取模块72、概率生成模块73和确定模块74，如下：

特征获取模块71，用于获取待检测音频的多个音频特征；

关联度获取模块72，用于基于所述分类树模型获取所述多个音频特征与正负样本标签的关联度；

概率生成模块73，用于根据所述关联度生成所述待检测音频存在噪声的概率；

确定模块74，用于当所述概率大于预设概率阈值时，确定所述待检测音频存在噪声。

在一实施例中，参考图8，该噪声检测装置还可以包括：

训练样本获取模块75，用于获取多个训练样本，所述训练样本包括样本音频的多个样本音频特征；

训练模块76，用于根据训练样本对分类树模型进行训练，更新所述分类树模型。

在一实施例中，参考图9，所述训练样本获取模块75，可以包括：

特征提取子模块751，用于从样本音频中并行地提取多个样本音频特征；

构建模块752，用于根据所述多个样本音频特征构建训练样本。

在一实施例中，该噪声检测装置还可以包括：

所述获取待检测音频的多个音频特征的步骤包括：

具体实施时，以上各个单元可以作为独立的实体来实现，也可以进行任意组合，作为同一或若干个实体来实现，以上各个单元的具体实施可参见前面的方法实施例，在此不再赘述。

由上可知，本申请实施例通过特征获取模块71获取待检测音频的多个音频特征，通过关联度获取模块72基于分类树模型获取多个音频特征与正负样本标签的关联度，通过概率生成模块73根据关联度生成待检测音频存在噪声的概率，当概率大于预设概率阈值时，通过确定模块74确定待检测音频存在噪声。该方案通过提取音频的多个音频特征，根据分类树模型和音频的多个音频特征获取待检测音频存在噪声的概率，确定待检测音频中是否存在噪声，该方案提高了检测音频中噪声的效率和准确性。

本申请实施例还提供一种终端，该终端可以集成本申请实施例所提供的任一种噪声检测装置。

例如，如图10所示，其示出了本申请实施例所涉及的终端的结构示意图，具体来讲：

该终端可以包括一个或者一个以上处理核心的处理器101、一个或一个以上计算机可读存储介质的存储器102、电源103和输入单元104等部件。本领域技术人员可以理解，图10中示出的终端结构并不构成对终端的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。其中：

处理器101是该终端的控制中心，利用各种接口和线路连接整个终端的各个部分，通过运行或执行存储在存储器102内的软件程序和/或模块，以及调用存储在存储器102内的数据，执行终端的各种功能和处理数据，从而对终端进行整体监控。可选的，处理器101可包括一个或多个处理核心；优选的，处理器101可集成应用处理器和调制解调处理器，其中，应用处理器主要处理操作系统、用户界面和应用程序等，调制解调处理器主要处理无线通信。可以理解的是，上述调制解调处理器也可以不集成到处理器101中。

存储器102可用于存储软件程序以及模块，处理器101通过运行存储在存储器102的软件程序以及模块，从而执行各种功能应用以及数据处理。存储器102可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等；存储数据区可存储根据终端的使用所创建的数据等。此外，存储器102可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地，存储器102还可以包括存储器控制器，以提供处理器101对存储器102的访问。

终端还包括给各个部件供电的电源103，优选的，电源103可以通过电源管理系统与处理器101逻辑相连，从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源103还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。

该终端还可包括输入单元104，该输入单元104可用于接收输入的数字或字符信息，以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。

尽管未示出，终端还可以包括显示单元等，在此不再赘述。具体在本实施例中，终端中的处理器101会按照如下的指令，将一个或一个以上的应用程序的进程对应的可执行文件加载到存储器102中，并由处理器101来运行存储在存储器102中的应用程序，从而实现各种功能，如下：

获取待检测音频的多个音频特征，基于分类树模型获取多个音频特征与正负样本标签的关联度，根据关联度生成待检测音频存在噪声的概率，当概率大于预设概率阈值时，确定待检测音频存在噪声。

以上各个操作的具体实施可参见前面的实施例，在此不再赘述。

本领域普通技术人员可以理解，上述实施例的各种方法中的全部或部分步骤可以通过指令来完成，或通过指令控制相关的硬件来完成，该指令可以存储于一计算机可读存储介质中，并由处理器进行加载和执行。

为此，本申请实施例提供一种存储介质，其中存储有多条指令，该指令能够被处理器进行加载，以执行本申请实施例所提供的任一种噪声检测方法中的步骤。例如，该指令可以执行如下步骤：

其中，该存储介质可以包括：只读存储器(ROM，Read Only Memory)、随机存取记忆体(RAM，Random Access Memory)、磁盘或光盘等。

由于该存储介质中所存储的指令，可以执行本申请实施例所提供的任一种噪声检测方法中的步骤，因此，可以实现本申请实施例所提供的任一种噪声检测方法所能实现的有益效果，详见前面的实施例，在此不再赘述。

以上对本申请实施例所提供的一种噪声检测方法、装置和存储介质进行了详细介绍，本文中应用了具体个例对本申请的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本申请的方法及其核心思想；同时，对于本领域的技术人员，依据本申请的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本申请的限制。

Claims

1.一种噪声检测方法，所述方法应用分类树模型，其特征在于，包括：

获取待检测音频的多个音频特征；

根据所述关联度生成所述待检测音频存在噪声的概率；

2.根据权利要求1所述的噪声检测方法，其特征在于，所述方法还包括：

获取多个训练样本，所述训练样本包括样本音频的多个样本音频特征；

根据训练样本对分类树模型进行训练，更新所述分类树模型。

3.根据权利要求2所述的噪声检测方法，其特征在于，获取多个训练样本，包括：

从样本音频中并行地提取多个样本音频特征；

根据所述多个样本音频特征构建训练样本。

4.根据权利要求2所述的噪声检测方法，其特征在于，根据训练样本对分类树模型进行训练，更新所述分类树模型之后，所述方法还包括：

所述获取待检测音频的多个音频特征的步骤包括：

5.根据权利要求4所述的噪声检测方法，其特征在于，根据所述指标对比结果对训练样本进行调整，包括：

根据所述指标对比结果对训练样本数量进行调整，或者；

根据所述指标对比结果对样本音频特征进行调整。

6.根据权利要求5所述的噪声检测方法，其特征在于，所述训练样本包括正样本或负样本；

根据所述指标对比结果对训练样本数量进行调整，包括：

根据所述指标对比结果对训练样本总数量进行调整；

7.根据权利要求5所述的噪声检测方法，其特征在于，根据所述指标对比结果对样本音频特征进行调整，包括：

根据所述指标对比结果对样本音频特征数量参数进行调整；

8.根据权利要求2所述的噪声检测方法，其特征在于，所述训练样本包括正样本和负样本；

所述方法还包括：

9.一种噪声检测装置，其特征在于，包括：

特征获取模块，用于获取待检测音频的多个音频特征；

10.一种存储介质，其特征在于，所述存储介质存储有多条指令，所述指令适于处理器进行加载，以执行权利要求1至8任一项所述的噪声检测方法中的步骤。