CN114186581A - 基于mfcc和扩散化高斯混合模型的电缆隐患识别方法及装置 - Google Patents

基于mfcc和扩散化高斯混合模型的电缆隐患识别方法及装置 Download PDF

Info

Publication number
CN114186581A
CN114186581A CN202111345410.6A CN202111345410A CN114186581A CN 114186581 A CN114186581 A CN 114186581A CN 202111345410 A CN202111345410 A CN 202111345410A CN 114186581 A CN114186581 A CN 114186581A
Authority
CN
China
Prior art keywords
sound data
data
sound
gaussian mixture
mixture model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111345410.6A
Other languages
English (en)
Inventor
周宝柱
董政鑫
郝泽琪
刘玉珩
谢宇
王君鹏
孟醒
孟健
邵强
乐坤
苏旭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Corp of China SGCC
State Grid Tianjin Electric Power Co Ltd
Original Assignee
State Grid Corp of China SGCC
State Grid Tianjin Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Corp of China SGCC, State Grid Tianjin Electric Power Co Ltd filed Critical State Grid Corp of China SGCC
Priority to CN202111345410.6A priority Critical patent/CN114186581A/zh
Publication of CN114186581A publication Critical patent/CN114186581A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/12Classification; Matching
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01RMEASURING ELECTRIC VARIABLES; MEASURING MAGNETIC VARIABLES
    • G01R31/00Arrangements for testing electric properties; Arrangements for locating electric faults; Arrangements for electrical testing characterised by what is being tested not provided for elsewhere
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/02Preprocessing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Abstract

本发明提供了一种基于MFCC和扩散化高斯混合模型的电缆隐患识别方法及装置,涉及电缆隐患识别技术领域,方法包括:获取第一声音数据,第一声音数据经低通滤波降噪后进行预处理以获取第二声音数据;对第二声音数据进行频域变换以获取第三声音数据;将第三声音数据分为第三声音数据测试集以及第三声音数据训练集,构建扩散化的高斯混合模型分类器,利用第三声音数据测试集对构建好的扩散化的高斯混合模型分类器进行训练以对扩散化的高斯混合模型分类器参数进行优化;利用第三声音数据训练集对参数优化好的扩散化的高斯混合模型分类器进行测试。通过本发明可以缓解现有技术中难以检测到外破因素的发声时刻或是采集到大量无效的声音数据的技术问题。

Description

基于MFCC和扩散化高斯混合模型的电缆隐患识别方法及装置
技术领域
本发明涉及电缆隐患识别技术领域,尤其是涉及一种基于MFCC和扩散化高斯混合模型的电缆隐患识别方法及装置。
背景技术
随着城市建设的飞速发展,城市建设不断扩张加速,各大市政工程也随之铺开,主要涉及市政重点工程、地铁、桥梁、道路、房地产开发及城市配套管网供水、热力、燃气、通信施工等,时刻威胁到地下电缆的安全。传统电缆防外破方式采取人员定期巡视,现场看护等方式,该方式不仅效率极低,而且由于巡视周期的存在,并不能及时发现隐患进而开展应对工作。因此现阶段,地下电缆随时暴露在外破隐患风险中,为供电系统的安全稳定性运行埋下了无数个不稳定因素。
随着互联网及新媒体平台的迅猛发展,音频数据总量变得越来越庞大。在大数据及人工智能的背景下,音频场景识别技术可应用的领域越来越广泛,其重要性不言而喻。音频场景识别本质上是对声音信号中包含的声音特征及声学事件进行感知,并加以处理和分析,从而对音频信号进行分类。近年来对于人工智能的研究渐渐成熟,深度学习技术飞速发展,在模式识别、机器学习等领域取得了革命性的突破,使得越来越多的人投身有关深度学习的研究。
虽然围绕挖掘机、拉管机等外破隐患声音的时频特征已经开展了许多研究,并取得了大量分类算法。但由于挖掘机、拉管机发声具有随机性、响度较小,并且电缆通道大多建于路边,汽车等背景干扰大,使得实际工作中难以检测到外破因素的发声时刻或是采集到大量无效的声音数据。
发明内容
有鉴于此,本发明的目的在于提供一种基于MFCC和扩散化高斯混合模型的电缆隐患识别方法及装置,以缓解现有技术中难以检测到外破因素的发声时刻或是采集到大量无效的声音数据的技术问题。
获取第一声音数据,所述第一声音数据包括背景声音数据、拉管机声音数据以及挖掘机声音数据,所述第一声音数据经低通滤波降噪后进行预处理以获取第二声音数据;
对所述第二声音数据进行频域变换以获取第三声音数据;
将所述第三声音数据分为第三声音数据测试集以及第三声音数据训练集,构建扩散化的高斯混合模型分类器,利用所述第三声音数据训练集对构建好的扩散化的高斯混合模型分类器进行训练以对所述扩散化的高斯混合模型分类器参数进行优化;
利用所述第三声音数据测试集对参数优化好的扩散化的高斯混合模型分类器进行测试。
优选的,所述获取第一声音数据,所述第一声音数据包括背景声音数据、拉管机声音数据以及挖掘机声音数据,所述第一声音数据经低通滤波降噪后进行预处理以获取第二声音数据的步骤包括:
采用如下步骤获取所述第一声音数据中的有效数据所述第二声音数据:
将所述获取第一声音数据进行切分以获取第一声音数据片段;
对所述第一声音片段进行低通滤波以及分帧处理;
获取所述第一声音片段中的有效声音片段以获取第二声音数据。
优选的,所述获取所述第一声音片段中的有效声音片段以获取第二声音数据的步骤包括:
获取每一个所述第一声音片段的能量并获取所有所述第一声音片段中声音能量最大的第一声音片段;
判定所述第一声音片段的能量是否超过能量最大的所述第一声音片段的能量的50%;
若是,则判定为所述第一声音片段中的有效声音片段;
若否,则判定为所述第一声音片段中的无效声音片段。
优选的,采用如下公式获取每一个所述第一声音片段的能量
Figure BDA0003353891490000031
P(n)—第n帧音频信号的平均声压;
P—第n帧音频信号的瞬时声压。
优选的,所述对所述第二声音数据进行频域变换以获取第三声音数据的步骤包括:
所述第二声音数据进行傅里叶变换并获取所述第二声音数据的MFCC 参数;
计算所述第二声音数据的MFCC参数的一阶差分以获取第三声音数据。
优选的,所述第二声音数据进行傅里叶变换并获取所述第二声音数据的MFCC参数的步骤包括:
采用如下公式获取所述第二声音数据的MFCC参数:
Figure BDA0003353891490000032
Ct(n)—第t帧的第n个MFCC参数;、
St(m)—音频信号的对数功率谱;
M—三角滤波器的个数。
优选的,采用如下公式计算所述第二声音数据的MFCC参数的一阶差分:
Figure BDA0003353891490000041
i—取一阶差分的窗口宽度;
Dt—在时域第t帧的一阶差分。
优选的,所述利用所述第三声音数据测试集对构建好的扩散化的高斯混合模型分类器进行训练以对所述扩散化的高斯混合模型分类器参数进行优化的步骤包括:
初始化模型参数,获取第三声音数据训练集集的平均值和方差并求取概率密度函数;
Figure BDA0003353891490000042
p(Dt)—数据集中某一数据计算得到的概率值;
n为数据集中数据个数;
μ—为数据集的平均值;
Dt—数据集中每个声音数据的MFCC参数一阶差分;
Σ—数据集的协方差矩阵。
优选的,所述利用所述第三声音数据测试集对参数优化好的扩散化的高斯混合模型分类器进行测试的步骤包括:
获取阈值,并将第三声音数据训练集代至入概率密度函数得到的p(x),判定p(x)与阈值的大小关系,如果p(x)大于阈值则得到的声音数据有效,并获取第三声音数据训练集的声音数据的有效率以获取训练好的扩散化的高斯混合模型分类器训练结果。
Figure BDA0003353891490000051
p(Dt)—数据集中某一数据计算得到的概率值;
n—数据集中数据个数;
μ—数据集的平均值;
Dt—数据集中每个声音数据的MFCC参数一阶差分
Σ—数据集的协方差矩阵。
另一方面.本发明提供了一种基于MFCC和扩散化高斯混合模型的电缆隐患识别装置,包括:
音频处理模块:用于获取第一声音数据,所述第一声音数据包括背景声音数据、拉管机声音数据以及挖掘机声音数据,所述第一声音数据经低通滤波降噪后进行预处理以获取第二声音数据;
频域转换模块:用于对所述第二声音数据进行频域变换以获取第三声音数据;
训练模块:用于将所述第三声音数据分为第三声音数据测试集以及第三声音数据训练集,构建扩散化的高斯混合模型分类器,利用所述第三声音数据测试集对构建好的扩散化的高斯混合模型分类器进行训练以对所述扩散化的高斯混合模型分类器参数进行优化;
测试模块:利用所述第三声音数据训练集对参数优化好的扩散化的高斯混合模型分类器进行测试。
本发明实施例带来了以下有益效果:本发明提供了一种基于MFCC和扩散化高斯混合模型的电缆隐患识别方法,所述方法包括:获取第一声音数据,第一声音数据包括背景声音数据、拉管机声音数据以及挖掘机声音数据,第一声音数据经低通滤波降噪后进行预处理以获取第二声音数据;对第二声音数据进行频域变换以获取第三声音数据;将第三声音数据分为第三声音数据测试集以及第三声音数据训练集,构建扩散化的高斯混合模型分类器,利用第三声音数据测试集对构建好的扩散化的高斯混合模型分类器进行训练以对扩散化的高斯混合模型分类器参数进行优化;利用第三声音数据训练集对参数优化好的扩散化的高斯混合模型分类器进行测试。通过本发明提供的方法可以缓解现有技术中难以检测到外破因素的发声时刻或是采集到大量无效的声音数据的技术问题,减少了电网的隐患。
本发明的其他特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种基于MFCC和扩散化高斯混合模型的电缆隐患识别方法流程图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
目前,虽然围绕挖掘机、拉管机等外破隐患声音的时频特征已经开展了许多研究,并取得了大量分类算法。但由于挖掘机、拉管机发声具有随机性、响度较小,并且电缆通道大多建于路边,汽车等背景干扰大,基于此,本发明实施例提供的一种基于MFCC和扩散化高斯混合模型的电缆隐患识别方法及装置,可以缓解现有技术中难以检测到外破因素的发声时刻或是采集到大量无效的声音数据的技术问题。
为便于对本实施例进行理解,首先对本发明实施例所公开的一种基于 MFCC和扩散化高斯混合模型的电缆隐患识别方法进行详细介绍。
实施例一:
本发明实施例一提供了一种基于MFCC和扩散化高斯混合模型的电缆隐患识别方法,具体按照如下步骤进行:
获取第一声音数据,所述第一声音数据包括背景声音数据、拉管机声音数据以及挖掘机声音数据,所述第一声音数据经低通滤波降噪后进行预处理以获取第二声音数据;
对所述第二声音数据进行频域变换以获取第三声音数据;
将所述第三声音数据分为第三声音数据测试集以及第三声音数据训练集,构建扩散化的高斯混合模型分类器,利用所述第三声音数据测试集对构建好的扩散化的高斯混合模型分类器进行训练以对所述扩散化的高斯混合模型分类器参数进行优化;
利用所述第三声音数据训练集对参数优化好的扩散化的高斯混合模型分类器进行测试。
优选的,所述获取第一声音数据,所述第一声音数据包括背景声音数据、拉管机声音数据以及挖掘机声音数据,所述第一声音数据经低通滤波降噪后进行预处理以获取第二声音数据的步骤包括:
采用如下步骤获取所述第一声音数据中的有效数据所述第二声音数据:
将所述获取第一声音数据进行切分以获取第一声音数据片段;
对所述第一声音片段进行低通滤波以及分帧处理;
获取所述第一声音片段中的有效声音片段以获取第二声音数据。
优选的,所述获取所述第一声音片段中的有效声音片段以获取第二声音数据的步骤包括:
获取每一个所述第一声音片段的能量并获取所有所述第一声音片段中声音能量最大的第一声音片段;
判定所述第一声音片段的能量是否超过能量最大的所述第一声音片段的能量的50%;
若是,则判定为所述第一声音片段中的有效声音片段;
若否,则判定为所述第一声音片段中的无效声音片段。
优选的,采用如下公式获取每一个所述第一声音片段的能量
Figure BDA0003353891490000081
P(n)—第n帧音频信号的平均声压;
P—第n帧音频信号的瞬时声压。
优选的,所述对所述第二声音数据进行频域变换以获取第三声音数据的步骤包括:
所述第二声音数据进行傅里叶变换并获取所述第二声音数据的MFCC 参数;
计算所述第二声音数据的MFCC参数的一阶差分以获取第三声音数据。
优选的,所述第二声音数据进行傅里叶变换并获取所述第二声音数据的MFCC参数的步骤包括:
采用如下公式获取所述第二声音数据的MFCC参数:
Figure BDA0003353891490000091
Ct(n)—第t帧的第n个MFCC参数;、
St(m)—音频信号的对数功率谱;
M—三角滤波器的个数。
优选的,采用如下公式计算所述第二声音数据的MFCC参数的一阶差分:
Figure BDA0003353891490000092
i—取一阶差分的窗口宽度;
Dt—在时域第t帧的一阶差分。
优选的,所述利用所述第三声音数据测试集对构建好的扩散化的高斯混合模型分类器进行训练以对所述扩散化的高斯混合模型分类器参数进行优化的步骤包括:
初始化模型参数,获取第三声音数据训练集集的平均值和方差并求取概率密度函数;
Figure BDA0003353891490000101
p(Dt)—数据集中某一数据计算得到的概率值;
n为数据集中数据个数;
μ—为数据集的平均值;
Dt—数据集中每个声音数据的MFCC参数一阶差分;
Σ—数据集的协方差矩阵。
优选的,所述利用所述第三声音数据测试集对参数优化好的扩散化的高斯混合模型分类器进行测试的步骤包括:
获取阈值,并将第三声音数据训练集代至入概率密度函数得到的p(x),判定p(x)与阈值的大小关系,如果p(x)大于阈值则得到的声音数据有效,并获取第三声音数据训练集的声音数据的有效率以获取训练好的扩散化的高斯混合模型分类器训练结果。
Figure BDA0003353891490000102
p(Dt)—数据集中某一数据计算得到的概率值;
n—数据集中数据个数;
μ—数据集的平均值;
Dt—数据集中每个声音数据的MFCC参数一阶差分
Σ—数据集的协方差矩阵。
实施例二:
本发明实施例二提供了一种基于MFCC和扩散化高斯混合模型的电缆隐患识别装置,包括:
音频处理模块:用于获取第一声音数据,所述第一声音数据包括背景声音数据、拉管机声音数据以及挖掘机声音数据,所述第一声音数据经低通滤波降噪后进行预处理以获取第二声音数据;
频域转换模块:用于对所述第二声音数据进行频域变换以获取第三声音数据;
训练模块:用于将所述第三声音数据分为第三声音数据测试集以及第三声音数据训练集,构建扩散化的高斯混合模型分类器,利用所述第三声音数据测试集对构建好的扩散化的高斯混合模型分类器进行训练以对所述扩散化的高斯混合模型分类器参数进行优化;
测试模块:利用所述第三声音数据训练集对参数优化好的扩散化的高斯混合模型分类器进行测试。
除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对步骤、数字表达式和数值并不限制本发明的范围。
附图中的流程图和框图显示了根据本发明的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/ 或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统和装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
另外,在本发明实施例的描述中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
在本发明的描述中,需要说明的是,术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
最后应说明的是:以上所述实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

Claims (10)

1.一种基于MFCC和扩散化高斯混合模型的电缆隐患识别方法,其特征在于,具体按照如下步骤进行:
获取第一声音数据,所述第一声音数据包括背景声音数据、拉管机声音数据以及挖掘机声音数据,所述第一声音数据经低通滤波降噪后进行预处理以获取第二声音数据;
对所述第二声音数据进行频域变换以获取第三声音数据;
将所述第三声音数据分为第三声音数据测试集以及第三声音数据训练集,构建扩散化的高斯混合模型分类器,利用所述第三声音数据训练集对构建好的扩散化的高斯混合模型分类器进行训练以对所述扩散化的高斯混合模型分类器参数进行优化;
利用所述第三声音数据测试集对参数优化好的扩散化的高斯混合模型分类器进行测试。
2.根据权利要求1所述的方法,其特征在于,所述获取第一声音数据,所述第一声音数据包括背景声音数据、拉管机声音数据以及挖掘机声音数据,所述第一声音数据经低通滤波降噪后进行预处理以获取第二声音数据的步骤包括:
采用如下步骤获取所述第一声音数据中的有效数据所述第二声音数据:
将所述获取第一声音数据进行切分以获取第一声音数据片段;
对所述第一声音片段进行低通滤波以及分帧处理;
获取所述第一声音片段中的有效声音片段以获取第二声音数据。
3.根据权利要求1所述的方法,其特征在于,所述获取所述第一声音片段中的有效声音片段以获取第二声音数据的步骤包括:
获取每一个所述第一声音片段的能量并获取所有所述第一声音片段中声音能量最大的第一声音片段;
判定所述第一声音片段的能量是否超过能量最大的所述第一声音片段的能量的50%;
若是,则判定为所述第一声音片段中的有效声音片段;
若否,则判定为所述第一声音片段中的无效声音片段。
4.根据权利要求1所述的方法,其特征在于,
采用如下公式获取每一个所述第一声音片段的能量
Figure FDA0003353891480000021
P(n)—第n帧音频信号的平均声压;
P—第n帧音频信号的瞬时声压。
5.根据权利要求1所述的方法,其特征在于,所述对所述第二声音数据进行频域变换以获取第三声音数据的步骤包括:
所述第二声音数据进行傅里叶变换并获取所述第二声音数据的MFCC参数;
计算所述第二声音数据的MFCC参数的一阶差分以获取第三声音数据。
6.根据权利要求5所述的方法,其特征在于,所述第二声音数据进行傅里叶变换并获取所述第二声音数据的MFCC参数的步骤包括:
采用如下公式获取所述第二声音数据的MFCC参数:
Figure FDA0003353891480000022
Ct(n)—第t帧的第n个MFCC参数;、
St(m)—音频信号的对数功率谱;
M—三角滤波器的个数。
7.根据权利要求5所述的方法,其特征在于,采用如下公式计算所述第二声音数据的MFCC参数的一阶差分:
Figure FDA0003353891480000031
i—取一阶差分的窗口宽度;
Dt—在时域第t帧的一阶差分。
8.根据权利要求1所述的方法,其特征在于,所述利用所述第三声音数据测试集对构建好的扩散化的高斯混合模型分类器进行训练以对所述扩散化的高斯混合模型分类器参数进行优化的步骤包括:
初始化模型参数,获取第三声音数据训练集集的平均值和方差并求取概率密度函数;
Figure FDA0003353891480000032
p(Dt)—数据集中某一数据计算得到的概率值;
n为数据集中数据个数;
μ—为数据集的平均值;
Dt—数据集中每个声音数据的MFCC参数一阶差分;
Σ—数据集的协方差矩阵。
9.根据权利要求1所述的方法,其特征在于,所述利用所述第三声音数据测试集对参数优化好的扩散化的高斯混合模型分类器进行测试的步骤包括:
获取阈值,并将第三声音数据训练集代至入概率密度函数得到的p(x),判定p(x)与阈值的大小关系,如果p(x)大于阈值则得到的声音数据有效,并获取第三声音数据训练集的声音数据的有效率以获取训练好的扩散化的高斯混合模型分类器训练结果。
Figure FDA0003353891480000041
p(Dt)—数据集中某一数据计算得到的概率值;
n—数据集中数据个数;
μ—数据集的平均值;
Dt—数据集中每个声音数据的MFCC参数一阶差分
Σ—数据集的协方差矩阵。
10.一种基于MFCC和扩散化高斯混合模型的电缆隐患识别装置,其特征在于,包括:
音频处理模块:用于获取第一声音数据,所述第一声音数据包括背景声音数据、拉管机声音数据以及挖掘机声音数据,所述第一声音数据经低通滤波降噪后进行预处理以获取第二声音数据;
频域转换模块:用于对所述第二声音数据进行频域变换以获取第三声音数据;
训练模块:用于将所述第三声音数据分为第三声音数据测试集以及第三声音数据训练集,构建扩散化的高斯混合模型分类器,利用所述第三声音数据测试集对构建好的扩散化的高斯混合模型分类器进行训练以对所述扩散化的高斯混合模型分类器参数进行优化;
测试模块:利用所述第三声音数据训练集对参数优化好的扩散化的高斯混合模型分类器进行测试。
CN202111345410.6A 2021-11-15 2021-11-15 基于mfcc和扩散化高斯混合模型的电缆隐患识别方法及装置 Pending CN114186581A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111345410.6A CN114186581A (zh) 2021-11-15 2021-11-15 基于mfcc和扩散化高斯混合模型的电缆隐患识别方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111345410.6A CN114186581A (zh) 2021-11-15 2021-11-15 基于mfcc和扩散化高斯混合模型的电缆隐患识别方法及装置

Publications (1)

Publication Number Publication Date
CN114186581A true CN114186581A (zh) 2022-03-15

Family

ID=80540038

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111345410.6A Pending CN114186581A (zh) 2021-11-15 2021-11-15 基于mfcc和扩散化高斯混合模型的电缆隐患识别方法及装置

Country Status (1)

Country Link
CN (1) CN114186581A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114626418A (zh) * 2022-03-18 2022-06-14 中国人民解放军32802部队 一种基于多中心复残差网络的辐射源识别方法及装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015124006A1 (zh) * 2014-02-19 2015-08-27 清华大学 一种具有自定义功能的音频检测分类方法
CN106782505A (zh) * 2017-02-21 2017-05-31 南京工程学院 一种基于放电声音识别高压开关柜状态的方法
CN108847244A (zh) * 2018-08-22 2018-11-20 华东计算技术研究所(中国电子科技集团公司第三十二研究所) 基于mfcc和改进bp神经网络的声纹识别方法及系统
CN110570880A (zh) * 2019-09-04 2019-12-13 杭州深蓝睡眠科技有限公司 一种鼾声信号识别方法
CN111627453A (zh) * 2020-05-13 2020-09-04 广州国音智能科技有限公司 公安语音信息管理方法、装置、设备及计算机存储介质
CN111684522A (zh) * 2019-05-15 2020-09-18 深圳市大疆创新科技有限公司 声音识别方法、交互方法、声音识别系统、计算机可读存储介质及可移动平台

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015124006A1 (zh) * 2014-02-19 2015-08-27 清华大学 一种具有自定义功能的音频检测分类方法
CN106782505A (zh) * 2017-02-21 2017-05-31 南京工程学院 一种基于放电声音识别高压开关柜状态的方法
CN108847244A (zh) * 2018-08-22 2018-11-20 华东计算技术研究所(中国电子科技集团公司第三十二研究所) 基于mfcc和改进bp神经网络的声纹识别方法及系统
CN111684522A (zh) * 2019-05-15 2020-09-18 深圳市大疆创新科技有限公司 声音识别方法、交互方法、声音识别系统、计算机可读存储介质及可移动平台
CN110570880A (zh) * 2019-09-04 2019-12-13 杭州深蓝睡眠科技有限公司 一种鼾声信号识别方法
CN111627453A (zh) * 2020-05-13 2020-09-04 广州国音智能科技有限公司 公安语音信息管理方法、装置、设备及计算机存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114626418A (zh) * 2022-03-18 2022-06-14 中国人民解放军32802部队 一种基于多中心复残差网络的辐射源识别方法及装置

Similar Documents

Publication Publication Date Title
CN109065030B (zh) 基于卷积神经网络的环境声音识别方法及系统
CN102664006B (zh) 基于时频域分析的异常人声检测方法
CN102163427B (zh) 一种基于环境模型的音频异常事件检测方法
CN107527617A (zh) 基于声音识别的监控方法、装置及系统
CN101494049A (zh) 一种用于音频监控系统中的音频特征参数的提取方法
CN110310666B (zh) 一种基于se卷积网络的乐器识别方法及系统
CN110398647B (zh) 变压器状态监测方法
CN101980336A (zh) 一种基于隐马尔可夫模型的汽车声音识别方法
CN112857767B (zh) 基于卷积神经网络的水轮发电机组转子故障声学判别方法
EP2817800A1 (en) Modified mel filter bank structure using spectral characteristics for sound analysis
CN114186581A (zh) 基于mfcc和扩散化高斯混合模型的电缆隐患识别方法及装置
Junkai et al. Coal-rock interface recognition based on MFCC and neural network
CN115510909A (zh) 一种dbscan进行异常声音特征的无监督算法
CN105352541B (zh) 一种基于电网防灾减灾系统的变压器运行辅助监测系统及其监测方法
CN114234061A (zh) 一种基于神经网络的带压运行供水管道漏水音智能判别方法
CN110022313A (zh) 基于机器学习的多态蠕虫特征提取及多态蠕虫辨识方法
CN110909827A (zh) 一种适用于风机叶片声音信号的降噪方法
CN116386664A (zh) 一种语音伪造检测方法、装置、系统及存储介质
CN114898778A (zh) 基于注意力时频网络的语音情感识别方法及系统
CN115238738A (zh) 构建水声目标识别模型的方法和装置
CN114724584A (zh) 异常声音识别模型构建方法、异常声音检测方法及系统
CN114708885A (zh) 一种基于声音信号的风机故障预警方法
CN114093385A (zh) 一种无人机检测方法及装置
CN105245497A (zh) 一种身份认证方法及装置
CN112542033A (zh) 一种基于声音识别的消防声光报警器故障检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination