CN114186581A

CN114186581A - 基于mfcc和扩散化高斯混合模型的电缆隐患识别方法及装置

Info

Publication number: CN114186581A
Application number: CN202111345410.6A
Authority: CN
Inventors: 周宝柱; 董政鑫; 郝泽琪; 刘玉珩; 谢宇; 王君鹏; 孟醒; 孟健; 邵强; 乐坤; 苏旭
Original assignee: State Grid Corp of China SGCC; State Grid Tianjin Electric Power Co Ltd
Current assignee: State Grid Corp of China SGCC; State Grid Tianjin Electric Power Co Ltd
Priority date: 2021-11-15
Filing date: 2021-11-15
Publication date: 2022-03-15

Abstract

本发明提供了一种基于MFCC和扩散化高斯混合模型的电缆隐患识别方法及装置，涉及电缆隐患识别技术领域，方法包括：获取第一声音数据，第一声音数据经低通滤波降噪后进行预处理以获取第二声音数据；对第二声音数据进行频域变换以获取第三声音数据；将第三声音数据分为第三声音数据测试集以及第三声音数据训练集，构建扩散化的高斯混合模型分类器，利用第三声音数据测试集对构建好的扩散化的高斯混合模型分类器进行训练以对扩散化的高斯混合模型分类器参数进行优化；利用第三声音数据训练集对参数优化好的扩散化的高斯混合模型分类器进行测试。通过本发明可以缓解现有技术中难以检测到外破因素的发声时刻或是采集到大量无效的声音数据的技术问题。

Description

基于MFCC和扩散化高斯混合模型的电缆隐患识别方法及装置

技术领域

本发明涉及电缆隐患识别技术领域，尤其是涉及一种基于MFCC和扩散化高斯混合模型的电缆隐患识别方法及装置。

背景技术

随着城市建设的飞速发展，城市建设不断扩张加速，各大市政工程也随之铺开，主要涉及市政重点工程、地铁、桥梁、道路、房地产开发及城市配套管网供水、热力、燃气、通信施工等，时刻威胁到地下电缆的安全。传统电缆防外破方式采取人员定期巡视，现场看护等方式，该方式不仅效率极低，而且由于巡视周期的存在，并不能及时发现隐患进而开展应对工作。因此现阶段，地下电缆随时暴露在外破隐患风险中，为供电系统的安全稳定性运行埋下了无数个不稳定因素。

随着互联网及新媒体平台的迅猛发展，音频数据总量变得越来越庞大。在大数据及人工智能的背景下，音频场景识别技术可应用的领域越来越广泛，其重要性不言而喻。音频场景识别本质上是对声音信号中包含的声音特征及声学事件进行感知，并加以处理和分析，从而对音频信号进行分类。近年来对于人工智能的研究渐渐成熟，深度学习技术飞速发展，在模式识别、机器学习等领域取得了革命性的突破，使得越来越多的人投身有关深度学习的研究。

虽然围绕挖掘机、拉管机等外破隐患声音的时频特征已经开展了许多研究，并取得了大量分类算法。但由于挖掘机、拉管机发声具有随机性、响度较小，并且电缆通道大多建于路边，汽车等背景干扰大，使得实际工作中难以检测到外破因素的发声时刻或是采集到大量无效的声音数据。

发明内容

有鉴于此，本发明的目的在于提供一种基于MFCC和扩散化高斯混合模型的电缆隐患识别方法及装置，以缓解现有技术中难以检测到外破因素的发声时刻或是采集到大量无效的声音数据的技术问题。

获取第一声音数据，所述第一声音数据包括背景声音数据、拉管机声音数据以及挖掘机声音数据，所述第一声音数据经低通滤波降噪后进行预处理以获取第二声音数据；

对所述第二声音数据进行频域变换以获取第三声音数据；

将所述第三声音数据分为第三声音数据测试集以及第三声音数据训练集，构建扩散化的高斯混合模型分类器，利用所述第三声音数据训练集对构建好的扩散化的高斯混合模型分类器进行训练以对所述扩散化的高斯混合模型分类器参数进行优化；

利用所述第三声音数据测试集对参数优化好的扩散化的高斯混合模型分类器进行测试。

优选的，所述获取第一声音数据，所述第一声音数据包括背景声音数据、拉管机声音数据以及挖掘机声音数据，所述第一声音数据经低通滤波降噪后进行预处理以获取第二声音数据的步骤包括：

采用如下步骤获取所述第一声音数据中的有效数据所述第二声音数据：

将所述获取第一声音数据进行切分以获取第一声音数据片段；

对所述第一声音片段进行低通滤波以及分帧处理；

获取所述第一声音片段中的有效声音片段以获取第二声音数据。

优选的，所述获取所述第一声音片段中的有效声音片段以获取第二声音数据的步骤包括：

获取每一个所述第一声音片段的能量并获取所有所述第一声音片段中声音能量最大的第一声音片段；

判定所述第一声音片段的能量是否超过能量最大的所述第一声音片段的能量的50％；

若是，则判定为所述第一声音片段中的有效声音片段；

若否，则判定为所述第一声音片段中的无效声音片段。

优选的，采用如下公式获取每一个所述第一声音片段的能量

P(n)—第n帧音频信号的平均声压；

P—第n帧音频信号的瞬时声压。

优选的，所述对所述第二声音数据进行频域变换以获取第三声音数据的步骤包括：

所述第二声音数据进行傅里叶变换并获取所述第二声音数据的MFCC 参数；

计算所述第二声音数据的MFCC参数的一阶差分以获取第三声音数据。

优选的，所述第二声音数据进行傅里叶变换并获取所述第二声音数据的MFCC参数的步骤包括：

采用如下公式获取所述第二声音数据的MFCC参数：

C_t(n)—第t帧的第n个MFCC参数；、

S_t(m)—音频信号的对数功率谱；

M—三角滤波器的个数。

优选的，采用如下公式计算所述第二声音数据的MFCC参数的一阶差分：

i—取一阶差分的窗口宽度；

D_t—在时域第t帧的一阶差分。

优选的，所述利用所述第三声音数据测试集对构建好的扩散化的高斯混合模型分类器进行训练以对所述扩散化的高斯混合模型分类器参数进行优化的步骤包括：

初始化模型参数，获取第三声音数据训练集集的平均值和方差并求取概率密度函数；

p(D_t)—数据集中某一数据计算得到的概率值；

n为数据集中数据个数；

μ—为数据集的平均值；

D_t—数据集中每个声音数据的MFCC参数一阶差分；

Σ—数据集的协方差矩阵。

优选的，所述利用所述第三声音数据测试集对参数优化好的扩散化的高斯混合模型分类器进行测试的步骤包括：

获取阈值，并将第三声音数据训练集代至入概率密度函数得到的p(x)，判定p(x)与阈值的大小关系，如果p(x)大于阈值则得到的声音数据有效，并获取第三声音数据训练集的声音数据的有效率以获取训练好的扩散化的高斯混合模型分类器训练结果。

p(D_t)—数据集中某一数据计算得到的概率值；

n—数据集中数据个数；

μ—数据集的平均值；

D_t—数据集中每个声音数据的MFCC参数一阶差分

Σ—数据集的协方差矩阵。

另一方面.本发明提供了一种基于MFCC和扩散化高斯混合模型的电缆隐患识别装置，包括：

音频处理模块：用于获取第一声音数据，所述第一声音数据包括背景声音数据、拉管机声音数据以及挖掘机声音数据，所述第一声音数据经低通滤波降噪后进行预处理以获取第二声音数据；

频域转换模块：用于对所述第二声音数据进行频域变换以获取第三声音数据；

训练模块：用于将所述第三声音数据分为第三声音数据测试集以及第三声音数据训练集，构建扩散化的高斯混合模型分类器，利用所述第三声音数据测试集对构建好的扩散化的高斯混合模型分类器进行训练以对所述扩散化的高斯混合模型分类器参数进行优化；

测试模块：利用所述第三声音数据训练集对参数优化好的扩散化的高斯混合模型分类器进行测试。

本发明实施例带来了以下有益效果：本发明提供了一种基于MFCC和扩散化高斯混合模型的电缆隐患识别方法，所述方法包括：获取第一声音数据，第一声音数据包括背景声音数据、拉管机声音数据以及挖掘机声音数据，第一声音数据经低通滤波降噪后进行预处理以获取第二声音数据；对第二声音数据进行频域变换以获取第三声音数据；将第三声音数据分为第三声音数据测试集以及第三声音数据训练集，构建扩散化的高斯混合模型分类器，利用第三声音数据测试集对构建好的扩散化的高斯混合模型分类器进行训练以对扩散化的高斯混合模型分类器参数进行优化；利用第三声音数据训练集对参数优化好的扩散化的高斯混合模型分类器进行测试。通过本发明提供的方法可以缓解现有技术中难以检测到外破因素的发声时刻或是采集到大量无效的声音数据的技术问题，减少了电网的隐患。

本发明的其他特征和优点将在随后的说明书中阐述，并且，部分地从说明书中变得显而易见，或者通过实施本发明而了解。本发明的目的和其他优点在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。

为使本发明的上述目的、特征和优点能更明显易懂，下文特举较佳实施例，并配合所附附图，作详细说明如下。

附图说明

为了更清楚地说明本发明具体实施方式或现有技术中的技术方案，下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施方式，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的一种基于MFCC和扩散化高斯混合模型的电缆隐患识别方法流程图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合附图对本发明的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

目前，虽然围绕挖掘机、拉管机等外破隐患声音的时频特征已经开展了许多研究，并取得了大量分类算法。但由于挖掘机、拉管机发声具有随机性、响度较小，并且电缆通道大多建于路边，汽车等背景干扰大，基于此，本发明实施例提供的一种基于MFCC和扩散化高斯混合模型的电缆隐患识别方法及装置，可以缓解现有技术中难以检测到外破因素的发声时刻或是采集到大量无效的声音数据的技术问题。

为便于对本实施例进行理解，首先对本发明实施例所公开的一种基于 MFCC和扩散化高斯混合模型的电缆隐患识别方法进行详细介绍。

实施例一：

本发明实施例一提供了一种基于MFCC和扩散化高斯混合模型的电缆隐患识别方法，具体按照如下步骤进行：

对所述第二声音数据进行频域变换以获取第三声音数据；

将所述第三声音数据分为第三声音数据测试集以及第三声音数据训练集，构建扩散化的高斯混合模型分类器，利用所述第三声音数据测试集对构建好的扩散化的高斯混合模型分类器进行训练以对所述扩散化的高斯混合模型分类器参数进行优化；

利用所述第三声音数据训练集对参数优化好的扩散化的高斯混合模型分类器进行测试。

对所述第一声音片段进行低通滤波以及分帧处理；

若是，则判定为所述第一声音片段中的有效声音片段；

若否，则判定为所述第一声音片段中的无效声音片段。

优选的，采用如下公式获取每一个所述第一声音片段的能量

P(n)—第n帧音频信号的平均声压；

P—第n帧音频信号的瞬时声压。

采用如下公式获取所述第二声音数据的MFCC参数：

C_t(n)—第t帧的第n个MFCC参数；、

S_t(m)—音频信号的对数功率谱；

M—三角滤波器的个数。

i—取一阶差分的窗口宽度；

D_t—在时域第t帧的一阶差分。

p(D_t)—数据集中某一数据计算得到的概率值；

n为数据集中数据个数；

μ—为数据集的平均值；

D_t—数据集中每个声音数据的MFCC参数一阶差分；

Σ—数据集的协方差矩阵。

p(D_t)—数据集中某一数据计算得到的概率值；

n—数据集中数据个数；

μ—数据集的平均值；

D_t—数据集中每个声音数据的MFCC参数一阶差分

Σ—数据集的协方差矩阵。

实施例二：

本发明实施例二提供了一种基于MFCC和扩散化高斯混合模型的电缆隐患识别装置，包括：

除非另外具体说明，否则在这些实施例中阐述的部件和步骤的相对步骤、数字表达式和数值并不限制本发明的范围。

附图中的流程图和框图显示了根据本发明的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分，所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个连续的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/ 或流程图中的方框的组合，可以用执行规定的功能或动作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统和装置的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

另外，在本发明实施例的描述中，除非另有明确的规定和限定，术语“安装”、“相连”、“连接”应做广义理解，例如，可以是固定连接，也可以是可拆卸连接，或一体地连接；可以是机械连接，也可以是电连接；可以是直接相连，也可以通过中间媒介间接相连，可以是两个元件内部的连通。对于本领域的普通技术人员而言，可以具体情况理解上述术语在本发明中的具体含义。

在本发明的描述中，需要说明的是，术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本发明和简化描述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本发明的限制。此外，术语“第一”、“第二”、“第三”仅用于描述目的，而不能理解为指示或暗示相对重要性。

最后应说明的是：以上所述实施例，仅为本发明的具体实施方式，用以说明本发明的技术方案，而非对其限制，本发明的保护范围并不局限于此，尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化，或者对其中部分技术特征进行等同替换；而这些修改、变化或者替换，并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应所述以权利要求的保护范围为准。

Claims

1.一种基于MFCC和扩散化高斯混合模型的电缆隐患识别方法，其特征在于，具体按照如下步骤进行：

对所述第二声音数据进行频域变换以获取第三声音数据；

2.根据权利要求1所述的方法，其特征在于，所述获取第一声音数据，所述第一声音数据包括背景声音数据、拉管机声音数据以及挖掘机声音数据，所述第一声音数据经低通滤波降噪后进行预处理以获取第二声音数据的步骤包括：

对所述第一声音片段进行低通滤波以及分帧处理；

3.根据权利要求1所述的方法，其特征在于，所述获取所述第一声音片段中的有效声音片段以获取第二声音数据的步骤包括：

若是，则判定为所述第一声音片段中的有效声音片段；

若否，则判定为所述第一声音片段中的无效声音片段。

4.根据权利要求1所述的方法，其特征在于，

采用如下公式获取每一个所述第一声音片段的能量

P(n)—第n帧音频信号的平均声压；

P—第n帧音频信号的瞬时声压。

5.根据权利要求1所述的方法，其特征在于，所述对所述第二声音数据进行频域变换以获取第三声音数据的步骤包括：

所述第二声音数据进行傅里叶变换并获取所述第二声音数据的MFCC参数；

6.根据权利要求5所述的方法，其特征在于，所述第二声音数据进行傅里叶变换并获取所述第二声音数据的MFCC参数的步骤包括：

采用如下公式获取所述第二声音数据的MFCC参数：

C_t(n)—第t帧的第n个MFCC参数；、

S_t(m)—音频信号的对数功率谱；

M—三角滤波器的个数。

7.根据权利要求5所述的方法，其特征在于，采用如下公式计算所述第二声音数据的MFCC参数的一阶差分：

i—取一阶差分的窗口宽度；

D_t—在时域第t帧的一阶差分。

8.根据权利要求1所述的方法，其特征在于，所述利用所述第三声音数据测试集对构建好的扩散化的高斯混合模型分类器进行训练以对所述扩散化的高斯混合模型分类器参数进行优化的步骤包括：

p(D_t)—数据集中某一数据计算得到的概率值；

n为数据集中数据个数；

μ—为数据集的平均值；

D_t—数据集中每个声音数据的MFCC参数一阶差分；

Σ—数据集的协方差矩阵。

9.根据权利要求1所述的方法，其特征在于，所述利用所述第三声音数据测试集对参数优化好的扩散化的高斯混合模型分类器进行测试的步骤包括：

p(D_t)—数据集中某一数据计算得到的概率值；

n—数据集中数据个数；

μ—数据集的平均值；

D_t—数据集中每个声音数据的MFCC参数一阶差分

Σ—数据集的协方差矩阵。

10.一种基于MFCC和扩散化高斯混合模型的电缆隐患识别装置，其特征在于，包括：