CN113314144A - 声音识别及电力设备故障预警方法、系统、终端及介质 - Google Patents

声音识别及电力设备故障预警方法、系统、终端及介质 Download PDF

Info

Publication number
CN113314144A
CN113314144A CN202110545819.6A CN202110545819A CN113314144A CN 113314144 A CN113314144 A CN 113314144A CN 202110545819 A CN202110545819 A CN 202110545819A CN 113314144 A CN113314144 A CN 113314144A
Authority
CN
China
Prior art keywords
sound
fault
data
power equipment
sound data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110545819.6A
Other languages
English (en)
Inventor
江��一
王荣昊
洪乐洲
严伟
许浩强
袁海
石延辉
叶志良
黄家豪
李凯协
陆国生
高雪飞
李喆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Jiaotong University
Guangzhou Bureau of Extra High Voltage Power Transmission Co
Original Assignee
Shanghai Jiaotong University
Guangzhou Bureau of Extra High Voltage Power Transmission Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Jiaotong University, Guangzhou Bureau of Extra High Voltage Power Transmission Co filed Critical Shanghai Jiaotong University
Priority to CN202110545819.6A priority Critical patent/CN113314144A/zh
Publication of CN113314144A publication Critical patent/CN113314144A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/24Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being the cepstrum
    • GPHYSICS
    • G08SIGNALLING
    • G08BSIGNALLING OR CALLING SYSTEMS; ORDER TELEGRAPHS; ALARM SYSTEMS
    • G08B21/00Alarms responsive to a single specified undesired or abnormal condition and not otherwise provided for
    • G08B21/18Status alarms
    • G08B21/185Electrical failure alarms
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/063Training
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Quality & Reliability (AREA)
  • Business, Economics & Management (AREA)
  • Emergency Management (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Abstract

本发明提供了一种声音识别方法及系统,对声音数据集中的声音数据进行标注,得到标注音频信息;对声音数据集中的声音数据依次通过数字信号处理和卡尔曼滤波去噪后,提取声音数据的频谱特征;构建机器学习分类模型,采用标注音频信息和声音数据的频谱特征对机器学习模型进行训练后,得到基于机器学习的声音识别模型;获取待识别音频数据,并将待识别音频数据依次通过数字信号处理和卡尔曼滤波去噪后,输入至声音识别模型,得到相应的分类结果,实现对声音的识别。同时提供了一种基于该声音识别方法的电力设备故障预警方法及系统,根据声音识别结果对电力设备故障进行预警。本发明提高了声音识别的准确率,进而提高了电力设备故障检测的准确率。

Description

声音识别及电力设备故障预警方法、系统、终端及介质
技术领域
本发明涉及声音检测技术领域,具体地,涉及一种基于卡尔曼滤波和机器学习的声音识别及电力设备故障预警方法、系统、终端及介质。
背景技术
在电力行业中,电力设备的检测存在检测过程影响设备正常工作、故障分析困难等问题;同时,由于电力设备的运行环境复杂,在其运行时录制的音频存在着许多杂音,影响最后的识别效率,且影响对故障预测的准确度。因此,如何对获取的声音信号进行预处理和去噪成为了本领域中的一个技术难题。本发明采用了利用卡尔曼滤波器进行信号增强从而降低环境噪音对待检测音频的影响,通过对电力设备的声学特征进行建模构造卡尔曼滤波器中的转移模型和观测模型,实现了对特定电力设备采集声音的环境噪音去除。
在计算机领域,基于机器学习的声音检测、分类技术是人工智能的一个重要部分。声音检测技术的研究目标是根据采集的声音,提取其有效特征,根据特征对音频进行分类。现有的电气设备声音检测技术,通常采用振动检测法的方法,这种方法一般存在如下技术问题:
声音的产生由质点的振动引起,变压器的噪声主要来源是油箱、绕组、铁芯及冷却装置风扇等发生振动,由此可通过检测变压器箱体的振动来判断变压器内部的绝缘状况。振动检测法所得到的数据通常不能明显的表征电气设备的故障信息,而且振动参量比较难以检测,且得到的信号强度较弱和杂乱,很难即使判断设备的故障类型以及信息。许多电气设备发生故障时其振动参量的变化很小,给后续数据处理以及算法分类工作造成了许多麻烦。
目前没有发现同本发明类似技术的说明或报道,也尚未收集到国内外类似的资料。
发明内容
本发明针对现有技术中存在的上述不足,提供了一种基于卡尔曼滤波和机器学习的声音识别及电力设备故障预警方法、系统、终端及介质。
根据本发明的第一个方面,提供了一种声音识别方法,包括:
获取声音数据集,对所述声音数据集中的声音数据进行标注,得到标注音频信息;
对所述声音数据集中的声音数据依次通过数字信号处理和卡尔曼滤波去噪后,提取声音数据的频谱特征;
构建机器学习分类模型,采用所述标注音频信息和所述声音数据的频谱特征对所述机器学习模型进行训练后,得到基于机器学习的声音识别模型;
获取待识别音频数据,并将所述待识别音频数据依次通过数字信号处理和卡尔曼滤波去噪后,输入至所述声音识别模型,得到相应的分类结果,实现对声音的识别。
优选地,所述声音数据集中的声音数据进行标注,得到标注音频信息,包括:
采集音频文件,构建声音数据集,并对所述音频文件对应的故障类型进行标注。
优选地,所述构建声音数据集,包括:
通过采集和/或实验室模拟的方式收集变电站中线圈类电气设备典型缺陷的音频信息;
通过采集和/或实验室模拟的方式收集变电站中开关类电气设备不同工作状态下的音频信息;
将所述线圈类电气设备和/或所述开关类电气设备的音频信息进行整理归类,构建相应的声音数据集。
优选地,所述数字信号处理,包括:预加重、分帧、加窗、快速傅里叶变换(FFT)、梅尔滤波器组和离散余弦变换。
优选地,所述卡尔曼滤波,包括:
通过电力设备本身的机械特征和放电模型特征构建其故障时的声学模型,并从中抽象出电力设备噪声离散域内的状态转移方程和观测方程,利用卡尔曼滤波器进行电力设备声音的最优估计;考虑电力设备所处的环境噪声为加性环境噪声和瞬时冲击噪声叠加构成的噪声信号,适当选择卡尔曼滤波器模型中的自递归模型阶数可以对电力设备噪声进行声增强,从而从较复杂的环境噪声背景中提取出电力设备噪声,提高后续识别的准确率。
优选地,所述提取声音数据的频谱特征,包括:
根据人耳听觉特性提出基于梅尔倒谱系数MFCC的声音信号特征;声音信号经过卡尔曼滤波进行增强去噪处理和预加重后,经过若干个梅尔(Mel)滤波器组,将信号转变为梅尔尺度下的功率谱,从而从音频信号中提取出便于进行分类的一系列特征。
根据本发明的第二个方面,提供了一种声音识别系统,包括:
数据获取模块,该模块获取声音数据集以及待识别音频数据;
标注音频信息获取模块,该模块对所述声音数据集中的声音数据进行标注,得到标注音频信息;
数据处理模块,该模块对输入的数据进行数字信号处理和卡尔曼滤波去噪;
频谱特征获取模块,该模块针对所述数据处理模块处理后的声音数据集中的声音数据提取声音数据的频谱特征;
声音识别模型模块,该模块构建机器学习分类模型,采用所述标注音频信息和所述声音数据的频谱特征对所述机器学习模型进行训练后,得到基于机器学习的声音识别模型;将所述数据处理模块处理后的待识别音频数据输入至所述声音识别模型,得到相应的分类结果,实现对声音的识别。
根据本发明的第三个方面,提供了一种电力设备故障预警方法,包括:
获取电力设备故障声音数据集,对所述故障声音数据集中的声音数据进行标注,得到标注音频信息;
对所述故障声音数据集中的声音数据依次通过数字信号处理和卡尔曼滤波去噪后,提取声音数据的频谱特征;
构建机器学习分类模型,采用所述标注音频信息和所述声音数据的频谱特征对所述机器学习模型进行训练后,得到基于机器学习的故障声音识别模型;
获取待识别音频数据,并将所述待识别音频数据依次通过数字信号处理和卡尔曼滤波去噪后,输入至所述故障声音识别模型,得到相应的分类结果,实现对电力设备故障声音的识别,进而根据声音识别结果对电力设备故障进行预警。
优选地,所述根据声音识别结果对电力设备故障进行检测,包括:
对得到的声音识别结果进行判断,得到相应的设备故障信号,并发出预警信号。
优选地,所述方法还包括:
将所述待识别音频数据的分类结果输入至所述故障声音识别模型,对所述故障声音识别模型进行更新。
根据本发明的第四个方面,提供了一种电力设备故障预警系统,包括:
数据获取模块,该模块电力设备故障声音数据集以及待识别音频数据;
标注音频信息获取模块,该模块对所述故障声音数据集中的声音数据进行标注,得到标注音频信息;
数据处理模块,该模块对输入的数据进行数字信号处理和卡尔曼滤波去噪;
频谱特征获取模块,该模块针对所述数据处理模块处理后的故障声音数据集中的声音数据提取声音数据的频谱特征;
声音识别模型模块,该模块构建机器学习分类模型,采用所述标注音频信息和所述声音数据的频谱特征对所述机器学习模型进行训练后,得到基于机器学习的故障声音识别模型;将所述数据处理模块处理后的待识别音频数据输入至所述故障声音识别模型,得到相应的分类结果,实现对故障声音的识别;
电力设备故障预警模块,该模块根据声音识别结果对电力设备故障进行预警。
优选地,所述系统还包括如下任意一个或任意多个模块:
-用户界面显示模块,该模块对所述声音识别结果和/或所述电力设备故障预警信息进行显示;
-模型更新模块,该模块将所述待识别音频数据的分类结果输入至所述故障声音识别模型,对所述故障声音识别模型进行更新。
根据本发明的第五个方面,提供了一种终端,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时可用于执行上述任一项所述的方法,或,运行上述任一项所述的系统。
根据本发明的第六个方面,提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时可用于执行上述任一项所述的方法,或,运行上述任一项所述的系统。
由于采用了上述技术方案,本发明与现有技术相比,具有如下至少一项的有益效果:
本发明基于卡尔曼滤波和机器学习,结合了去噪和识别算法,很大程度上提高了声音识别的准确率;同时,可以通过历史数据对声音识别模型进行迭代以及更新,进一步提高准确率。
本发明通过对已采集的声音信号进行数字信号处理、声音信号的特征提取、利用卡尔曼滤波算法进行降噪和声增强等步骤,训练得到的声音识别模型,为电力设备声音频谱图和声谱图的绘制以及电力设备的故障预测等提供了辅助支持。
本发明将卡尔曼滤波算法和机器学习中的SVM等模型进行结合,能很大程度上降低输入音频的噪声,提高了声音识别模型的识别率。
本发明利用预加重、分帧、加窗、快速傅里叶变换(FFT)、梅尔滤波器组、离散余弦变换(DCT)等技术,将声音信号转化为频谱信号,方便后续的声音识别模型从音频中提取特征。
本发明采用训练的声音识别模型对新输入的音频进行预测,新输入的音频同样会经过数字信号处理、特征提取以及卡尔曼滤波等步骤,提高了声音识别的准确率。同时,用户还可以通过输入正确标记后的音频对声音识别模型继续进行训练,从而提高后续识别的准确率。
本发明通过卡尔曼滤波器对训练音频和输入音频进行降噪处理,提高了识别的准确性,为电力设备的故障预测提供了一种可靠的识别方法。
附图说明
通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1为本发明一实施例中声音识别方法流程图。
图2为本发明一优选实施例中声音识别方法中的声音识别模型构建方法流程图。
图3为本发明一实施例中声音识别系统的组成模块示意图。
图4为本发明一实施例中电力设备故障预警方法流程图。
图5为本发明一实施例中电力设备故障预警系统的组成模块示意图。
图6为本发明一优选实施例中电力设备故障预警系统的工作流程图。
具体实施方式
下面对本发明的实施例作详细说明:本实施例在以本发明技术方案为前提下进行实施,给出了详细的实施方式和具体的操作过程。应当指出的是,对本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。
图1为本发明一实施例提供的声音识别方法流程图。
如图1所示,该实施例提供的声音识别方法,可以包括如下步骤:
S100,获取声音数据集,对声音数据集中的声音数据进行标注,得到标注音频信息;
S200,对声音数据集中的声音数据依次通过数字信号处理和卡尔曼滤波去噪后,提取声音数据的频谱特征;
S300,构建机器学习分类模型,采用标注音频信息和声音数据的频谱特征对机器学习模型进行训练后,得到基于机器学习的声音识别模型;
S400,获取待识别音频数据,并将待识别音频数据依次通过数字信号处理和卡尔曼滤波去噪后,输入至声音识别模型,得到相应的分类结果,实现对声音的识别。
在该实施例的S100中,作为一优选实施例,对声音数据集中的声音数据进行标注,得到标注音频信息,可以包括如下步骤:
采集音频文件,构建声音数据集,并对音频文件对应的故障类型进行标注。
进一步地,构建声音数据集,包括:
通过采集和/或实验室模拟的方式收集变电站中线圈类电气设备典型缺陷的音频信息;
通过采集和/或实验室模拟的方式收集变电站中开关类电气设备不同工作状态下的音频信息;
将线圈类电气设备和/或开关类电气设备的音频信息进行整理归类,构建相应的声音数据集。
在该实施例的S100中,作为一具体应用实例,对声音数据集中的声音数据进行标注,得到标注音频信息,可以包括如下步骤:
S101,按照不同的故障类型对数据集中的故障声音进行分类,将故障声音分为线圈类故障、铁芯类故障、松动类故障等等故障类型;
S102,将可以进行梯度分级的故障类型进行分级,以5%或10%的比例进行分级,将励磁、负荷、紧固件压力等故障类型梯度化;
S103,根据以上故障类型对声音数据集中的数据进行标注分类,得到标注的音频信息。
在该实施例的S200中,作为一优选实施例,数字信号处理,可以包括:预加重、分帧、加窗、快速傅里叶变换(FFT)、梅尔滤波器组和离散余弦变换。
在该实施例的S200中,作为一优选实施例,卡尔曼滤波,可以包括如下步骤:
通过电力设备本身的机械特征和放电模型特征构建其故障时的声学模型,并从中抽象出电力设备噪声离散域内的状态转移方程和观测方程,利用卡尔曼滤波器进行电力设备声音的最优估计。考虑电力设备所处的环境噪声为加性环境噪声和瞬时冲击噪声叠加构成的噪声信号,适当选择卡尔曼滤波器模型中的自递归模型阶数可以对电力设备噪声进行声增强,从而从较复杂的环境噪声背景中提取出电力设备噪声,提高后续识别的准确率。
在该实施例的S200中,作为一具体应用实例,卡尔曼滤波,可以包括如下步骤:
S201,根据电力设备的物理模型和发声方式,构造电力设备的声音转移矩阵和观测矩阵模型。
S202,根据检测现场的环境特征,选择可能存在噪音的种类(环境白噪声、冲激噪声、人声等),优化滤波器模型中的误差矩阵。
S203,根据所采集声音的时间特征,选择合适的自递归模型阶数。
S204,根据所得到的卡尔曼滤波器进行电力设备噪声的最优估计,从而对音频进行信号增强和降噪。
在该实施例的S200中,作为一优选实施例,提取声音数据的频谱特征,可以包括如下步骤:
根据人耳听觉特性提出的基于梅尔倒谱系数MFCC的声音信号特征。人耳的听觉特性就是声音频率的高低与听到的声音高低不是现象关系,而这种用Mel频率尺度的参数分析更加符合人耳的听觉特性。声音信号经过卡尔曼滤波进行增强去噪处理和预加重后,提取出的特征会更加容易分类。将处理后的声音信号经过若干个Mel滤波器组,可以将信号转变为Mel尺度下的功率谱,从而从音频信号中提取出便于进行分类的一系列特征。
在该实施例的S200中,作为一具体应用实例,提取声音数据的频谱特征,可以包括如下步骤:
s201,对输入的声音信号进行分帧和加窗等操作;
s202,对每帧声音信号进行FFT变换,获得其离散功率谱S(n);
s203,通过滤波器组得到M个参数P_m,m=0,1,……,M-1;
s204,计算P_m的自然对数,得到L_m,m=0,1,……,M-1;
s205,计算L_m的DCT,获得D_m,m=0,1,……,M-1,去掉D_0,取D_1,D_2,……, D_k作为MFCC的参数。
该实施例提供的声音识别方法,基于卡尔曼滤波和机器学习,利用数字信号处理技术提取音频特征,利用卡尔曼滤波算法进行降噪和声增强,并利用SVM等机器学习模型来分类声音,具有相应的图形化界面以及时频分析功能。
在本发明部分实施例中,通过录音等手段取得大量的预训练声音数据,通过卡尔曼滤波对声音信号进行降噪和声增强,通过数字信号处理方法以及音频信号的特征提取方法得到音频信号的MFCC频谱,最后送入SVM算法中进行训练,最终得到训练好的模型用于音频预测。
在本发明部分实施例中,卡尔曼滤波算法是卡尔曼滤波是一种利用线性系统状态方程,通过系统输入输出观测数据,对系统状态进行最优估计的算法。由于声音数据中包括系统中的噪声和干扰的影响,所以最优估计也可看作是滤波过程。
在本发明部分实施例中,数字信号处理采用了经典的音频处理手段,包括预加重、分帧、加窗、快速傅里叶变换(FFT)、梅尔滤波器组、离散余弦变换(DCT)等,从而得到音频的频谱特征。
在本发明部分实施例中,采用SVM作为初始分类模型,SVM是经典的机器学习算法,用于对音频信号进行分类处理。SVM的模型先使用实验室的数据来进行预训练,之后根据实际数据来不断更新。
如图2所示,为本发明一优选实施例提供的声音识别方法中的声音识别模型构建方法流程图。
如图2所示,该声音识别模型构建方法,首先,先采集在不同状态下的声音数据,并标注他们的种类,得到标注数据;之后,将声音数据进行数字信号处理和去噪处理后成为频谱图,和标注数据一起训练初始的分类模型,得到声音识别模型。
图3为本发明一实施例提供的声音识别系统的组成模块示意图。
如图3所示,该实施例提供的声音识别系统,可以包括:数据获取模块、标注音频信息获取模块、数据处理模块、频谱特征获取模块以及声音识别模型模块。其中:
数据获取模块,该模块获取声音数据集以及待识别音频数据;
标注音频信息获取模块,该模块对声音数据集中的声音数据进行标注,得到标注音频信息;
数据处理模块,该模块对输入的数据进行数字信号处理和卡尔曼滤波去噪;
频谱特征获取模块,该模块针对数据处理模块处理后的声音数据集中的声音数据提取声音数据的频谱特征;
声音识别模型模块,该模块构建机器学习分类模型,采用标注音频信息和声音数据的频谱特征对机器学习模型进行训练后,得到基于机器学习的声音识别模型;将数据处理模块处理后的待识别音频数据输入至声音识别模型,得到相应的分类结果,实现对声音的识别。
图4为本发明一实施例提供的电力设备故障预警方法流程图。
如图4所示,该实施例提供的电力设备故障预警方法,可以包括如下步骤:
S1,获取电力设备故障声音数据集,对故障声音数据集中的声音数据进行标注,得到标注音频信息;
S2,对故障声音数据集中的声音数据依次通过数字信号处理和卡尔曼滤波去噪后,提取声音数据的频谱特征;
S3,构建机器学习分类模型,采用标注音频信息和声音数据的频谱特征对机器学习模型进行训练后,得到基于机器学习的故障声音识别模型;
S4,获取待识别音频数据,并将待识别音频数据依次通过数字信号处理和卡尔曼滤波去噪后,输入至故障声音识别模型,得到相应的分类结果,实现对电力设备故障声音的识别,进而根据声音识别结果对电力设备故障进行预警。
在该实施例中,作为一优选实施例,该方法还可以包括如下步骤:
S5,将待识别音频数据的分类结果输入至故障声音识别模型,对故障声音识别模型进行更新。
在该实施例的S4中,作为一优选实施例,根据声音识别结果对电力设备故障进行检测,可以包括如下步骤:
对得到的声音识别结果进行判断,得到相应的设备故障信号,并发出预警信号。
该实施例提供的电力设备故障预警方法,基于卡尔曼滤波以及机器学习,通过识别设备的声音信号对设备故障进行判断并预警,提高了故障检测的准确率。
图5为本发明一实施例提供的电力设备故障预警系统的组成模块示意图。
如图5所示,该实施例提供的电力设备故障预警系统,可以包括:数据获取模块、标注音频信息获取模块、数据处理模块、频谱特征获取模块、声音识别模型模块以及电力设备故障预警模块。其中:
数据获取模块,该模块电力设备故障声音数据集以及待识别音频数据;
标注音频信息获取模块,该模块对故障声音数据集中的声音数据进行标注,得到标注音频信息;
数据处理模块,该模块对输入的数据进行数字信号处理和卡尔曼滤波去噪;
频谱特征获取模块,该模块针对数据处理模块处理后的故障声音数据集中的声音数据提取声音数据的频谱特征;
声音识别模型模块,该模块构建机器学习分类模型,采用标注音频信息和声音数据的频谱特征对机器学习模型进行训练后,得到基于机器学习的故障声音识别模型;将数据处理模块处理后的待识别音频数据输入至故障声音识别模型,得到相应的分类结果,实现对故障声音的识别;
电力设备故障预警模块,该模块根据声音识别结果对电力设备故障进行预警。
在该实施例中,作为一优选实施例,该系统还可以包括如下任意一个或任意多个模块:
-用户界面显示模块,该模块对声音识别结果和/或电力设备故障预警信息进行显示;
-模型更新模块,该模块将待识别音频数据的分类结果输入至故障声音识别模型,对故障声音识别模型进行更新。
在本发明部分实施例中,用户界面显示模块为用户操作和查看提供了可视化的界面,方便用户与设备的交互。
图6为该实施例提供的电力设备故障预警系统的工作流程图。
如图6所示,该实施例提供的电力设备故障预警系统,通过声音识别模型,对故障声音进行识别,进而得到相应的故障信息并预警。
如图6所示,该电力设备故障预警系统:
首先,用户可以通过系统输入待检测电力设备的音频文件,系统会自动对音频进行卡尔曼滤波处理。
之后,将音频文件进行数字信号处理,如预加重,分帧,加窗,快速傅里叶变换(FFT),梅尔滤波器组,离散余弦变换(DCT)等,从而得到音频的频谱特征。
然后,将声音的频谱特征输入声音识别模型中,得到相应的分类结果。
最后,对得到的分类结果进行判断,假如是设备的故障信号,则发出预警信号,通知相应的人员。
此外,用户还可以通过自行输入音频对声音识别模型进行训练,提高系统预测的准确率。
本发明一实施例提供了一种终端,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行程序时可用于执行上述实施例中任一项的方法,或,运行上述实施例中任一项的系统。
可选地,存储器,用于存储程序;存储器,可以包括易失性存储器(英文:volatilememory),例如随机存取存储器(英文:random-access memory,缩写:RAM),如静态随机存取存储器(英文:static random-access memory,缩写:SRAM),双倍数据率同步动态随机存取存储器(英文:Double Data Rate Synchronous Dynamic Random Access Memory,缩写:DDR SDRAM)等;存储器也可以包括非易失性存储器(英文:non-volatile memory),例如快闪存储器(英文:flash memory)。存储器用于存储计算机程序(如实现上述方法的应用程序、功能模块等)、计算机指令等,上述的计算机程序、计算机指令等可以分区存储在一个或多个存储器中。并且上述的计算机程序、计算机指令、数据等可以被处理器调用。
上述的计算机程序、计算机指令等可以分区存储在一个或多个存储器中。并且上述的计算机程序、计算机指令、数据等可以被处理器调用。
处理器,用于执行存储器存储的计算机程序,以实现上述实施例涉及的方法中的各个步骤。具体可以参见前面方法实施例中的相关描述。
处理器和存储器可以是独立结构,也可以是集成在一起的集成结构。当处理器和存储器是独立结构时,存储器、处理器可以通过总线耦合连接。
本发明一实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时可用于执行上述实施例中任一项的方法,或,运行上述实施例中任一项的系统。
本发明上述实施例提供的声音识别及电力设备故障预警方法、系统、终端及介质,首先,通过SVM等机器学习算法利用已有的故障声音数据库对算法进行预训练,通过数字信号处理技术以及MFCC算法进行特征提取,将所得特征频谱送入卡尔曼滤波器进行降噪,从而得到比常规机器学习算法更加精确的声音识别模型。同时,基于这个声音识别模型,将用户操作与电力设备故障预警进行了整合,得到电力设备声音的频谱图、声谱图等信息,还可以通过卡尔曼滤波算法对电力设备声音信号进行降噪和声增强后进行识别,从而得到电力设备的故障类型。
以上对本发明的具体实施例进行了描述。需要理解的是,本发明并不局限于上述特定实施方式,本领域技术人员可以在权利要求的范围内做出各种变形或修改,这并不影响本发明的实质内容。

Claims (12)

1.一种声音识别方法,其特征在于,包括:
获取声音数据集,对所述声音数据集中的声音数据进行标注,得到标注音频信息;
对所述声音数据集中的声音数据依次通过数字信号处理和卡尔曼滤波去噪后,提取声音数据的频谱特征;
构建机器学习分类模型,采用所述标注音频信息和所述声音数据的频谱特征对所述机器学习模型进行训练后,得到基于机器学习的声音识别模型;
获取待识别音频数据,并将所述待识别音频数据依次通过数字信号处理和卡尔曼滤波去噪后,输入至所述声音识别模型,得到相应的分类结果,实现对声音的识别。
2.根据权利要求1所述的声音识别方法,其特征在于,所述对所述声音数据集中的声音数据进行标注,得到标注音频信息,采用如下方法:
采集音频文件,构建声音数据集,并对所述音频文件对应的故障类型进行标注。
3.根据权利要求2所述的声音识别方法,其特征在于,所述构建声音数据集,包括:
通过采集和/或实验室模拟的方式收集变电站中线圈类电气设备典型缺陷的音频信息;
通过采集和/或实验室模拟的方式收集变电站中开关类电气设备不同工作状态下的音频信息;
将所述线圈类电气设备和/或所述开关类电气设备的音频信息进行整理归类,构建相应的声音数据集。
4.根据权利要求1所述的声音识别方法,其特征在于,所述对所述声音数据集中的声音数据依次通过数字信号处理和卡尔曼滤波去噪后,提取声音数据的频谱特征,还包括如下任意一项或任意多项:
-所述数字信号处理,包括:预加重、分帧、加窗、快速傅里叶变换、梅尔滤波器组和离散余弦变换;
-所述卡尔曼滤波,包括:
通过电力设备本身的机械特征和放电模型特征构建其故障时的声学模型,并从中抽象出电力设备噪声离散域内的状态转移方程和观测方程,利用卡尔曼滤波器进行电力设备声音的最优估计;考虑电力设备所处的环境噪声为加性环境噪声和瞬时冲击噪声叠加构成的噪声信号,选择卡尔曼滤波器模型中的自递归模型阶数对电力设备噪声进行声增强,从而从环境噪声背景中提取出电力设备噪声,提高后续识别的准确率;-所述提取声音数据的频谱特征,包括:
根据人耳听觉特性提出基于梅尔倒谱系数MFCC的声音信号特征;声音信号经过卡尔曼滤波进行增强去噪处理和预加重后,经过若干个梅尔滤波器组,将声音信号转变为梅尔尺度下的功率谱,从而从音频信号中提取出便于进行分类的一系列特征。
5.一种声音识别系统,其特征在于,包括:
数据获取模块,该模块获取声音数据集以及待识别音频数据;
标注音频信息获取模块,该模块对所述声音数据集中的声音数据进行标注,得到标注音频信息;
数据处理模块,该模块对输入的数据进行数字信号处理和卡尔曼滤波去噪;
频谱特征获取模块,该模块针对所述数据处理模块处理后的声音数据集中的声音数据提取声音数据的频谱特征;
声音识别模型模块,该模块构建机器学习分类模型,采用所述标注音频信息和所述声音数据的频谱特征对所述机器学习模型进行训练后,得到基于机器学习的声音识别模型;将所述数据处理模块处理后的待识别音频数据输入至所述声音识别模型,得到相应的分类结果,实现对声音的识别。
6.一种电力设备故障预警方法,其特征在于,包括:
获取电力设备故障声音数据集,对所述故障声音数据集中的声音数据进行标注,得到标注音频信息;
对所述故障声音数据集中的声音数据依次通过数字信号处理和卡尔曼滤波去噪后,提取声音数据的频谱特征;
构建机器学习分类模型,采用所述标注音频信息和所述声音数据的频谱特征对所述机器学习模型进行训练后,得到基于机器学习的故障声音识别模型;
获取待识别音频数据,并将所述待识别音频数据依次通过数字信号处理和卡尔曼滤波去噪后,输入至所述故障声音识别模型,得到相应的分类结果,实现对电力设备故障声音的识别,进而根据声音识别结果对电力设备故障进行预警。
7.根据权利要求6所述的电力设备故障预警方法,其特征在于,所述根据声音识别结果对电力设备故障进行检测,包括:
对得到的声音识别结果进行判断,得到相应的设备故障信号,并发出预警信号。
8.根据权利要求6或7所述的电力设备故障预警方法,其特征在于,还包括:
将所述待识别音频数据的分类结果输入至所述故障声音识别模型,对所述故障声音识别模型进行更新。
9.一种电力设备故障预警系统,其特征在于,包括:
数据获取模块,该模块电力设备故障声音数据集以及待识别音频数据;
标注音频信息获取模块,该模块对所述故障声音数据集中的声音数据进行标注,得到标注音频信息;
数据处理模块,该模块对输入的数据进行数字信号处理和卡尔曼滤波去噪;
频谱特征获取模块,该模块针对所述数据处理模块处理后的故障声音数据集中的声音数据提取声音数据的频谱特征;
声音识别模型模块,该模块构建机器学习分类模型,采用所述标注音频信息和所述声音数据的频谱特征对所述机器学习模型进行训练后,得到基于机器学习的故障声音识别模型;将所述数据处理模块处理后的待识别音频数据输入至所述故障声音识别模型,得到相应的分类结果,实现对故障声音的识别;
电力设备故障预警模块,该模块根据声音识别结果对电力设备故障进行预警。
10.根据权利要求9所述的电力设备故障预警系统,其特征在于,还包括如下任意一个或任意多个模块:
-用户界面显示模块,该模块对所述声音识别结果和/或所述电力设备故障预警信息进行显示;
-模型更新模块,该模块将所述待识别音频数据的分类结果输入至所述故障声音识别模型,对所述故障声音识别模型进行更新。
11.一种终端,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时可用于执行权利要求1-4或6-8中任一项所述的方法,或,运行权利要求5或9-10中任一项所述的系统。
12.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时可用于执行权利要求1-4或6-8中任一项所述的方法,或,运行权利要求5或9-10中任一项所述的系统。
CN202110545819.6A 2021-05-19 2021-05-19 声音识别及电力设备故障预警方法、系统、终端及介质 Pending CN113314144A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110545819.6A CN113314144A (zh) 2021-05-19 2021-05-19 声音识别及电力设备故障预警方法、系统、终端及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110545819.6A CN113314144A (zh) 2021-05-19 2021-05-19 声音识别及电力设备故障预警方法、系统、终端及介质

Publications (1)

Publication Number Publication Date
CN113314144A true CN113314144A (zh) 2021-08-27

Family

ID=77373871

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110545819.6A Pending CN113314144A (zh) 2021-05-19 2021-05-19 声音识别及电力设备故障预警方法、系统、终端及介质

Country Status (1)

Country Link
CN (1) CN113314144A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114067829A (zh) * 2021-10-21 2022-02-18 佳源科技股份有限公司 一种电抗器故障诊断方法、装置、计算机设备及存储介质
CN114783152A (zh) * 2022-03-30 2022-07-22 郑州熙禾智能科技有限公司 基于气声信息融合的储能电站火灾告警方法及系统
CN115392293A (zh) * 2022-08-01 2022-11-25 中国南方电网有限责任公司超高压输电公司昆明局 变压器故障的监测方法、装置、计算机设备和存储介质
CN116189711A (zh) * 2023-04-26 2023-05-30 四川省机场集团有限公司 基于声波信号监测的变压器故障识别方法及装置
CN117033983A (zh) * 2023-10-10 2023-11-10 山东科技大学 一种无人船自噪声检测识别方法及系统
CN117554798A (zh) * 2023-11-14 2024-02-13 中国南方电网有限责任公司超高压输电公司广州局 高压断路器异常监测模型训练方法、装置和设备

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109102818A (zh) * 2018-08-29 2018-12-28 昆明理工大学 一种基于信号频率概率密度函数分布的去噪音频采样算法
CN110473566A (zh) * 2019-07-25 2019-11-19 深圳壹账通智能科技有限公司 音频分离方法、装置、电子设备及计算机可读存储介质
CN111948487A (zh) * 2020-07-17 2020-11-17 国网上海市电力公司 一种基于人工智能的高压电力设备故障诊断方法及系统
CN112053694A (zh) * 2020-07-23 2020-12-08 哈尔滨理工大学 一种基于cnn与gru网络融合的声纹识别方法
CN112435686A (zh) * 2020-11-19 2021-03-02 中国南方电网有限责任公司超高压输电公司 一种基于数据增强的电力设备故障声音识别方法
CN112599148A (zh) * 2020-12-31 2021-04-02 北京声智科技有限公司 一种语音识别方法及装置
US10978093B1 (en) * 2019-12-18 2021-04-13 Audio Analytic Ltd Computer apparatus and method implementing sound detection to recognize an activity
CN112686110A (zh) * 2020-12-23 2021-04-20 武汉理工大学 一种离心泵故障诊断方法、装置、设备及存储介质

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109102818A (zh) * 2018-08-29 2018-12-28 昆明理工大学 一种基于信号频率概率密度函数分布的去噪音频采样算法
CN110473566A (zh) * 2019-07-25 2019-11-19 深圳壹账通智能科技有限公司 音频分离方法、装置、电子设备及计算机可读存储介质
US10978093B1 (en) * 2019-12-18 2021-04-13 Audio Analytic Ltd Computer apparatus and method implementing sound detection to recognize an activity
CN111948487A (zh) * 2020-07-17 2020-11-17 国网上海市电力公司 一种基于人工智能的高压电力设备故障诊断方法及系统
CN112053694A (zh) * 2020-07-23 2020-12-08 哈尔滨理工大学 一种基于cnn与gru网络融合的声纹识别方法
CN112435686A (zh) * 2020-11-19 2021-03-02 中国南方电网有限责任公司超高压输电公司 一种基于数据增强的电力设备故障声音识别方法
CN112686110A (zh) * 2020-12-23 2021-04-20 武汉理工大学 一种离心泵故障诊断方法、装置、设备及存储介质
CN112599148A (zh) * 2020-12-31 2021-04-02 北京声智科技有限公司 一种语音识别方法及装置

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114067829A (zh) * 2021-10-21 2022-02-18 佳源科技股份有限公司 一种电抗器故障诊断方法、装置、计算机设备及存储介质
CN114783152A (zh) * 2022-03-30 2022-07-22 郑州熙禾智能科技有限公司 基于气声信息融合的储能电站火灾告警方法及系统
CN115392293A (zh) * 2022-08-01 2022-11-25 中国南方电网有限责任公司超高压输电公司昆明局 变压器故障的监测方法、装置、计算机设备和存储介质
CN116189711A (zh) * 2023-04-26 2023-05-30 四川省机场集团有限公司 基于声波信号监测的变压器故障识别方法及装置
CN116189711B (zh) * 2023-04-26 2023-06-30 四川省机场集团有限公司 基于声波信号监测的变压器故障识别方法及装置
CN117033983A (zh) * 2023-10-10 2023-11-10 山东科技大学 一种无人船自噪声检测识别方法及系统
CN117033983B (zh) * 2023-10-10 2024-01-30 山东科技大学 一种无人船自噪声检测识别方法及系统
CN117554798A (zh) * 2023-11-14 2024-02-13 中国南方电网有限责任公司超高压输电公司广州局 高压断路器异常监测模型训练方法、装置和设备

Similar Documents

Publication Publication Date Title
CN113314144A (zh) 声音识别及电力设备故障预警方法、系统、终端及介质
CN104819846B (zh) 一种基于短时傅里叶变换和稀疏层叠自动编码器的滚动轴承声音信号故障诊断方法
Ittichaichareon et al. Speech recognition using MFCC
CN110135492B (zh) 基于多高斯模型的设备故障诊断与异常检测方法及系统
CN112885372B (zh) 电力设备故障声音智能诊断方法、系统、终端及介质
CN111081279A (zh) 语音情绪波动分析方法及装置
CN111048071B (zh) 语音数据处理方法、装置、计算机设备和存储介质
CN109034046A (zh) 一种基于声学检测的电能表内异物自动识别方法
CN109360554A (zh) 一种基于语深度神经网络的语言识别方法
Islam et al. Motor bearing fault diagnosis using deep convolutional neural networks with 2d analysis of vibration signal
CN112329914A (zh) 地埋式变电站的故障诊断方法、装置及电子设备
CN111933148A (zh) 基于卷神经网络的年龄识别方法、装置及终端
CN116012681A (zh) 基于声振信号融合的管道机器人电机故障诊断方法及系统
Rahman et al. Dynamic time warping assisted svm classifier for bangla speech recognition
CN116106013A (zh) 轴承故障特征识别方法及系统、电子设备、存储介质
CN116741148A (zh) 一种基于数字孪生的语音识别系统
CN109979482B (zh) 一种针对音频的评测方法及装置
CN116741200A (zh) 一种机车风机故障检测方法及装置
CN116168727A (zh) 一种变压器异常声音检测方法、系统、设备及存储介质
CN115758237A (zh) 基于智能巡检机器人的轴承故障分类方法及系统
CN112735477B (zh) 语音情感分析方法和装置
CN113488027A (zh) 一种层级分类的生成音频溯源方法及存储介质、计算机设备
Malfante et al. Machine learning for automatic classification of volcano-seismic signatures
Reddy et al. Glottal Closure Instants Detection from Speech Signal by Deep Features Extracted from Raw Speech and Linear Prediction Residual.
CN111862931A (zh) 一种语音生成方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination