CN111723683A - 一种基于改进mfcc和k近邻的变压器故障声音识别方法 - Google Patents

一种基于改进mfcc和k近邻的变压器故障声音识别方法 Download PDF

Info

Publication number
CN111723683A
CN111723683A CN202010475216.9A CN202010475216A CN111723683A CN 111723683 A CN111723683 A CN 111723683A CN 202010475216 A CN202010475216 A CN 202010475216A CN 111723683 A CN111723683 A CN 111723683A
Authority
CN
China
Prior art keywords
mfcc
improved
characteristic parameter
parameter matrix
matrix
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010475216.9A
Other languages
English (en)
Inventor
陈洪岗
王劭菁
孙汉文
刘君华
曹培
李喆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Jiaotong University
State Grid Shanghai Electric Power Co Ltd
Original Assignee
Shanghai Jiaotong University
State Grid Shanghai Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Jiaotong University, State Grid Shanghai Electric Power Co Ltd filed Critical Shanghai Jiaotong University
Priority to CN202010475216.9A priority Critical patent/CN111723683A/zh
Publication of CN111723683A publication Critical patent/CN111723683A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/08Feature extraction
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01HMEASUREMENT OF MECHANICAL VIBRATIONS OR ULTRASONIC, SONIC OR INFRASONIC WAVES
    • G01H17/00Measuring mechanical vibrations or ultrasonic, sonic or infrasonic waves, not provided for in the preceding groups
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2135Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24133Distances to prototypes
    • G06F18/24143Distances to neighbourhood prototypes, e.g. restricted Coulomb energy networks [RCEN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/12Classification; Matching

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Human Resources & Organizations (AREA)
  • Data Mining & Analysis (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Educational Administration (AREA)
  • Tourism & Hospitality (AREA)
  • Evolutionary Computation (AREA)
  • Development Economics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Game Theory and Decision Science (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Complex Calculations (AREA)

Abstract

本发明公开了一种基于改进MFCC和K近邻的变压器故障声音识别方法。首先使用Z‑score标准化等手段对音频进行预处理;然后提取MFCC特征参数矩阵;接着使用PCA进行数据降维,减少特征数;再对MFCC特征参数矩阵沿时轴做平均将其降为特征向量;最后使用K近邻算法识别改进的MFCC特征向量得到识别结果。本发明能够实现对变压器故障声音的在线监测,同时相比传统MFCC其数据量与运算量大幅度缩小,而识别率小幅度提升。

Description

一种基于改进MFCC和K近邻的变压器故障声音识别方法
技术领域
本发明涉及的是一种基于改进MFCC和K近邻的变压器故障声音识别方法,属于变压器故障在线监测领域。
背景技术
近年来,对变压器的故障识别从线下检修向在线监测逐渐转变。相比传统的电气设备故障识别方式,声音识别具有非接触式,体积小,成本低廉,传声器安装便捷等天然优点。随着科大讯飞、云知声等独角兽企业的崛起以及人工智能语音识别技术的不断发展,该技术在工业监测领域应用具备可行性。在电力设备常规巡检过程中,一些有经验的巡检人员可以通过设备的可听声来辨别其运行工况及异常和故障。使用声音识别技术,采用人工智能的方法替代人工巡检中的巡检“老员工”将是泛在电力物联网的发展方向。通过对放电声音识别的研究,也有将技术成果推广至部件松动和过负荷等其他伴随声信号发射的电气设备故障类型的可能,具有相当的社会经济效益。
目前对电气设备故障声音的识别主要采用MFCC特征提取算法加上支持向量机等辨识算法的模式。然而传统的MFCC特征参数提取方法提取的特征数目庞大,容易在算法训练中造成过拟合,也对样本数量,硬件运算能力等提出了比较高的要求。因此提出了一种基于改进MFCC和K近邻的变压器故障声音识别方法,通过将声音信号预处理后提取MFCC特征构成声谱图,再对MFCC特征参数矩阵进行PCA降维和时轴平均处理,最后使用K近邻算法辨识,可以很大程度上减少对样本数量的要求并降低运算量。
发明内容
为解决上述问题,本发明提出一种基于改进MFCC和K近邻的变压器故障声音识别方法。
本发明是通过以下技术方案实现的:
首先使用Z-score标准化等手段对音频进行预处理;然后提取MFCC特征参数矩阵;接着使用PCA进行数据降维,减少特征数;再对MFCC特征参数矩阵沿时轴做平均将其降为特征向量;最后使用K近邻算法识别改进的MFCC特征向量得到识别结果。
具体实现如下:
一种基于改进MFCC和K近邻的变压器故障声音识别方法,其特点在于:该方法包括如下步骤:
步骤1:通过Z-score标准化对采样音频进行标准化预处理;
步骤2:提取MFCC特征参数矩阵,具体步骤如下:
步骤2.1:将音频信号通过高通滤波器,进行高频预加重,突出高频共振峰,高通滤波器的传递函数H(z)如下
H(z)=1-μz-1,0.9<μ<1.0 (6)
式中,z是z变换后的信号,μ为每一帧的均值;
步骤2.2:进行内部分帧加窗处理,对每一帧通过快速傅里叶变换,得到音频各短时片段的频谱,对其取模的平方后即为功率谱;
步骤2.3:将功率谱通过三角滤波器组,三角滤波器组的传递函数Hm(z)如下:
Figure BDA0002515623130000021
式中,f(m)表示第m个三角滤波器的中心频率,z是z变换后的信号;
步骤2.4:对滤波器组输出的取对数并进行离散余弦变换得到MFCC系数矩阵A,其纵轴指示时间,横轴指示频率,各元素分别代表对应时间点的频谱能量,公式如下:
Figure BDA0002515623130000022
步骤3:通过PCA进行数据降维,减少特征数,具体步骤如下:
步骤3.1:对于MFCC系数A,将A各元素减去所在行列的列平均值后计算协方差矩阵C,公式如下:
Figure BDA0002515623130000023
步骤3.2:找出协方差矩C的所有特征向量,并从大到小排列,
E=[e1 e2 ... en]
(10)
步骤3.3:取ET的前k行构成矩阵P,(P*AT)T就是降至k维后的MFCC特征参数矩阵,其形状为m*k;
步骤4:将MFCC特征参数矩阵沿纵轴方向做平均,化为特征向量,形状1*k;
步骤5:利用K近邻算法识别改进的MFCC特征向量得到识别结果。
与现有技术相比,本发明具有的有益效果是:
1)可以做到以在线监测代替传统电力巡检或线下检测,降低人工成本,可以做到全时段监测;
2)减少特征数,降低算法训练中的过拟合风险,小幅度提升识别效果。
3)大幅度减少数据量,降低对硬件计算能力的要求。
附图说明
图1为本发明基于改进MFCC和K近邻的变压器故障声音识别方法的流程图。
具体实施方式
下面结合实施例和附图对本发明作详细说明:本实施例在以本发明方案为前提下进行实施,给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于下述的实施例。
请参阅图1,图1为基于改进MFCC和K近邻的变压器故障声音识别方法流程图,如图所示,一种基于改进MFCC和K近邻的变压器故障声音识别方法,包括如下步骤:
使用录音设备收录变压器声音,对其进行Z-score标准化预处理:
Figure BDA0002515623130000031
其中:μ为每一帧的均值,σ为每一帧的方差,x表示各个采样点的原始值,经标准化后变为x*。
提取MFCC特征参数矩阵,分帧采用20000采样点一帧长,2000采样点帧移,再对每一帧进行MFCC提取特征参数,一帧可以得到一个形状为(44,13)的特征矩阵。
对特征矩阵进行PCA主成分分析降维,选取k为6,得到降维后的MFCC特征参数矩阵形状为44*6。再对MFCC特征参数矩阵进行时轴平均得到MFCC特征向量,其形状为1*6,数据量减少约99%。
将变压器故障声音和其他环境噪声经过上述处理后送入K近邻算法作训练,录制要识别的声音后使用相同的处理方式处理,再送入训练完成的K近邻算法得到识别结果。结果表明改进的MFCC特征提取方式将训练时长降低超过90%,而识别准确率有0.5-1%的提升。
尽管本发明的内容已经通过上述优选实施例作了详细介绍,但应当认识到上述的描述不应被认为是对本发明的限制。在本领域技术人员阅读了上述内容后,对于本发明的多种修改和替代都将是显而易见的。因此,本发明的保护范围应由所附的权利要求来限定。
Figure BDA0002515623130000041
式中,f(m)表示第m个三角滤波器的中心频率,z是z变换后的信号;
步骤2.4:对滤波器组输出的取对数并进行离散余弦变换得到MFCC系数矩阵A,其纵轴指示时间,横轴指示频率,各元素分别代表对应时间点的频谱能量,公式如下:
Figure BDA0002515623130000042
步骤3:通过PCA进行数据降维,减少特征数,具体步骤如下:
步骤3.1:对于MFCC系数A,将A各元素减去所在行列的列平均值后计算协方差矩阵C,公式如下:
Figure BDA0002515623130000043
步骤3.2:找出协方差矩C的所有特征向量,并从大到小排列,
E=[e1 e2 ... en]
(10)
步骤3.3:取ET的前k行构成矩阵P,(P*AT)T就是降至k维后的MFCC特征参数矩阵,其形状为m*k;
步骤4:将MFCC特征参数矩阵沿纵轴方向做平均,化为特征向量,形状1*k;
步骤5:利用K近邻算法识别改进的MFCC特征向量得到识别结果。
与现有技术相比,本发明具有的有益效果是:
1)可以做到以在线监测代替传统电力巡检或线下检测,降低人工成本,可以做到全时段监测;
2)减少特征数,降低算法训练中的过拟合风险,小幅度提升识别效果。
3)大幅度减少数据量,降低对硬件计算能力的要求。
附图说明
图1为本发明基于改进MFCC和K近邻的变压器故障声音识别方法的流程图。
具体实施方式
下面结合实施例和附图对本发明作详细说明:本实施例在以本发明方案为前提下进行实施,给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于下述的实施例。
请参阅图1,图1为基于改进MFCC和K近邻的变压器故障声音识别方法流程图,如图所示,一种基于改进MFCC和K近邻的变压器故障声音识别方法,包括如下步骤:
使用录音设备收录变压器声音,对其进行Z-score标准化预处理:
Figure BDA0002515623130000051
其中:μ为每一帧的均值,σ为每一帧的方差,x表示各个采样点的原始值,经标准化后变为x*。
提取MFCC特征参数矩阵,分帧采用20000采样点一帧长,2000采样点帧移,再对每一帧进行MFCC提取特征参数,一帧可以得到一个形状为(44,13)的特征矩阵。
对特征矩阵进行PCA主成分分析降维,选取k为6,得到降维后的MFCC特征参数矩阵形状为44*6。再对MFCC特征参数矩阵进行时轴平均得到MFCC特征向量,其形状为1*6,数据量减少约99%。
将变压器故障声音和其他环境噪声经过上述处理后送入K近邻算法作训练,录制要识别的声音后使用相同的处理方式处理,再送入训练完成的K近邻算法得到识别结果。结果表明改进的MFCC特征提取方式将训练时长降低超过90%,而识别准确率有0.5-1%的提升。
尽管本发明的内容已经通过上述优选实施例作了详细介绍,但应当认识到上述的描述不应被认为是对本发明的限制。在本领域技术人员阅读了上述内容后,对于本发明的多种修改和替代都将是显而易见的。因此,本发明的保护范围应由所附的权利要求来限定。

Claims (4)

1.一种基于改进MFCC和K近邻的变压器故障声音识别方法,其特征在于:该方法包括如下步骤:
步骤1:通过Z-score标准化对采样音频进行标准化预处理;
步骤2:提取MFCC特征参数矩阵;
步骤3:通过PCA进行数据降维,减少特征数;
步骤4:沿时轴做平均;
步骤5:利用K近邻算法识别改进的MFCC特征向量得到识别结果。
2.根据权利要求1所述的基于改进MFCC和K近邻的变压器故障声音识别方法,其特征在于:所述的步骤2:提取MFCC特征参数矩阵,具体包括:
步骤2.1:将音频信号通过高通滤波器,进行高频预加重,突出高频共振峰,高通滤波器的传递函数H(z)如下
H(z)=1-μz-1,0.9<μ<1.0 (1)
式中,z是z变换后的信号,μ为每一帧的均值;
步骤2.2:进行内部分帧加窗处理,对每一帧通过快速傅里叶变换,得到音频各短时片段的频谱,对其取模的平方后即为功率谱;
步骤2.3:将功率谱通过三角滤波器组,三角滤波器组的传递函数Hm(z)如下:
Figure FDA0002515623120000011
式中,f(m)表示第m个三角滤波器的中心频率,z是z变换后的信号;
步骤2.4:对滤波器组输出的取对数并进行离散余弦变换得到MFCC系数矩阵A,其纵轴指示时间,横轴指示频率,各元素分别代表对应时间点的频谱能量,公式如下:
Figure FDA0002515623120000012
3.根据权利要求1所述的基于改进MFCC和K近邻的变压器故障声音识别方法,其特征在于:所述的步骤3:通过PCA进行数据降维,具体步骤如下:
步骤3.1:对于MFCC系数A,将A各元素减去所在行列的列平均值后计算协方差矩阵C,公式如下:
Figure FDA0002515623120000013
步骤3.2:找出协方差矩C的所有特征向量,并从大到小排列,
E=[e1 e2...en] (5)
步骤3.3:取ET的前k行构成矩阵P,(P*AT)T就是降至k维后的MFCC特征参数矩阵,其形状为m*k。
4.根据权利要求1所述的基于改进MFCC和K近邻的变压器故障声音识别方法,其特征在于:所述的步骤4沿时轴做平均,具体是将MFCC特征参数矩阵沿纵轴方向做平均,化为特征向量,形状1*k。
CN202010475216.9A 2020-05-29 2020-05-29 一种基于改进mfcc和k近邻的变压器故障声音识别方法 Pending CN111723683A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010475216.9A CN111723683A (zh) 2020-05-29 2020-05-29 一种基于改进mfcc和k近邻的变压器故障声音识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010475216.9A CN111723683A (zh) 2020-05-29 2020-05-29 一种基于改进mfcc和k近邻的变压器故障声音识别方法

Publications (1)

Publication Number Publication Date
CN111723683A true CN111723683A (zh) 2020-09-29

Family

ID=72565413

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010475216.9A Pending CN111723683A (zh) 2020-05-29 2020-05-29 一种基于改进mfcc和k近邻的变压器故障声音识别方法

Country Status (1)

Country Link
CN (1) CN111723683A (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101829689A (zh) * 2010-03-31 2010-09-15 北京科技大学 一种基于声信号的热轧带钢甩尾故障识别方法
CN104887263A (zh) * 2015-05-21 2015-09-09 东南大学 一种基于心音多维特征提取的身份识别算法及其系统
CN109599126A (zh) * 2018-12-29 2019-04-09 广州丰石科技有限公司 一种基于mel能量谱和卷积神经网络的声音故障识别方法
CN110322896A (zh) * 2019-06-26 2019-10-11 上海交通大学 一种基于卷积神经网络的变压器故障声音识别方法
CN110490071A (zh) * 2019-07-12 2019-11-22 国网上海市电力公司 一种基于mfcc的变电站声信号特征提取方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101829689A (zh) * 2010-03-31 2010-09-15 北京科技大学 一种基于声信号的热轧带钢甩尾故障识别方法
CN104887263A (zh) * 2015-05-21 2015-09-09 东南大学 一种基于心音多维特征提取的身份识别算法及其系统
CN109599126A (zh) * 2018-12-29 2019-04-09 广州丰石科技有限公司 一种基于mel能量谱和卷积神经网络的声音故障识别方法
CN110322896A (zh) * 2019-06-26 2019-10-11 上海交通大学 一种基于卷积神经网络的变压器故障声音识别方法
CN110490071A (zh) * 2019-07-12 2019-11-22 国网上海市电力公司 一种基于mfcc的变电站声信号特征提取方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
曾番: "小波包分析与能量算子结合的声目标特征参数", 《探测与控制学报》, vol. 32, no. 6, pages 54 - 58 *
李兰村: "基于声音识别技术的设备监测系统的设计与实现", 《中国优秀硕士学位论文全文数据库 信息科技辑》, no. 9, pages 15 - 24 *

Similar Documents

Publication Publication Date Title
CN109034046B (zh) 一种基于声学检测的电能表内异物自动识别方法
WO2022088643A1 (zh) 地埋式变电站的故障诊断方法、装置及电子设备
CN108305639B (zh) 语音情感识别方法、计算机可读存储介质、终端
CN105206270A (zh) 一种组合pca和rbm的孤立数字语音识别分类系统及方法
CN108682432B (zh) 语音情感识别装置
CN111797708A (zh) 气流杂音检测方法、装置、终端及存储介质
CN111489763B (zh) 一种基于gmm模型的复杂环境下说话人识别自适应方法
CN114295195B (zh) 基于特征提取的光纤传感振动信号的异常判断方法和系统
CN115510909A (zh) 一种dbscan进行异常声音特征的无监督算法
Riazati Seresht et al. Spectro-temporal power spectrum features for noise robust ASR
CN113555038B (zh) 基于无监督领域对抗学习的说话人无关语音情感识别方法及系统
CN114023353A (zh) 基于聚类分析和相似度计算的变压器故障分类方法及系统
CN112151067B (zh) 一种基于卷积神经网络的数字音频篡改被动检测方法
CN111723683A (zh) 一种基于改进mfcc和k近邻的变压器故障声音识别方法
CN114664311B (zh) 一种记忆网络增强的变分推断无声攻击检测方法
CN114970695B (zh) 一种基于非参贝叶斯模型的说话人分割聚类方法
CN115452378A (zh) 基于功率正则化倒谱系数的滚动轴承故障声纹识别方法
CN115171730A (zh) 基于lpp与全局方差最大的语音数据处理方法和系统
CN114121025A (zh) 一种面向变电站设备的声纹故障智能检测方法及装置
CN110689875A (zh) 一种语种识别方法、装置及可读存储介质
Zhang et al. Feature Extraction of Speech Signal Based on MFCC (Mel cepstrum coefficient)
CN116230012B (zh) 一种基于元数据对比学习预训练的两阶段异音检测方法
Xu et al. Study of discharge sound diagnosis using convolutional neural networks
CN115132227A (zh) 一种基于声音的电容器故障检测方法及相关装置
CN117316178A (zh) 电力设备声纹识别方法、装置、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination