CN117113234A - 一种基于机器学习的输电线路故障检测方法及系统 - Google Patents
一种基于机器学习的输电线路故障检测方法及系统 Download PDFInfo
- Publication number
- CN117113234A CN117113234A CN202311319053.5A CN202311319053A CN117113234A CN 117113234 A CN117113234 A CN 117113234A CN 202311319053 A CN202311319053 A CN 202311319053A CN 117113234 A CN117113234 A CN 117113234A
- Authority
- CN
- China
- Prior art keywords
- transmission line
- data set
- power transmission
- fault detection
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000005540 biological transmission Effects 0.000 title claims abstract description 178
- 238000001514 detection method Methods 0.000 title claims abstract description 80
- 238000010801 machine learning Methods 0.000 title claims abstract description 20
- 238000000034 method Methods 0.000 claims abstract description 33
- 238000011156 evaluation Methods 0.000 claims abstract description 28
- 238000007781 pre-processing Methods 0.000 claims abstract description 23
- 238000000605 extraction Methods 0.000 claims abstract description 20
- 238000012549 training Methods 0.000 claims description 75
- 238000012544 monitoring process Methods 0.000 claims description 45
- 239000011159 matrix material Substances 0.000 claims description 37
- 238000003066 decision tree Methods 0.000 claims description 23
- 238000012360 testing method Methods 0.000 claims description 18
- 230000002159 abnormal effect Effects 0.000 claims description 15
- 238000013528 artificial neural network Methods 0.000 claims description 14
- 230000004913 activation Effects 0.000 claims description 9
- 230000008569 process Effects 0.000 claims description 9
- 230000006870 function Effects 0.000 claims description 6
- 238000012217 deletion Methods 0.000 claims description 3
- 230000037430 deletion Effects 0.000 claims description 3
- 238000012806 monitoring device Methods 0.000 claims description 3
- 230000009471 action Effects 0.000 description 3
- 238000010606 normalization Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01R—MEASURING ELECTRIC VARIABLES; MEASURING MAGNETIC VARIABLES
- G01R31/00—Arrangements for testing electric properties; Arrangements for locating electric faults; Arrangements for electrical testing characterised by what is being tested not provided for elsewhere
- G01R31/08—Locating faults in cables, transmission lines, or networks
- G01R31/088—Aspects of digital computing
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01R—MEASURING ELECTRIC VARIABLES; MEASURING MAGNETIC VARIABLES
- G01R31/00—Arrangements for testing electric properties; Arrangements for locating electric faults; Arrangements for electrical testing characterised by what is being tested not provided for elsewhere
- G01R31/08—Locating faults in cables, transmission lines, or networks
- G01R31/081—Locating faults in cables, transmission lines, or networks according to type of conductors
- G01R31/085—Locating faults in cables, transmission lines, or networks according to type of conductors in power transmission or distribution lines, e.g. overhead
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/10—Pre-processing; Data cleansing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
- Y04S10/52—Outage or fault management, e.g. fault detection or location
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Supply And Distribution Of Alternating Current (AREA)
Abstract
本发明公开了一种基于机器学习的输电线路故障检测方法及系统,方法包括:数据采集、数据预处理、特征提取、输电线路故障检测和模型评估。本发明涉及故障检测技术领域,具体是指一种基于机器学习的输电线路故障检测方法及系统,本方案采用基于神经网络和多层感知器插补的混合模型进行缺失值插补,提高了缺失值插补的准确率,本方案在构建决策树模型进行特征划分时采用最大信息增益率进行划分,在信息增益的基础上计算信息拆分率和信息增益率,公平选择属性节点,全面评估特征的重要性,选择更准确的特征进行划分,提高了决策树模型的准确率。
Description
技术领域
本发明涉及故障检测技术领域,具体是指一种基于机器学习的输电线路故障检测方法及系统。
背景技术
输电线路故障检测是电力系统运行和维护中的重要任务,输电线路连接电源和用户,输送电能,但在运行过程中,可能会出现各种故障,因此需要对输电线路进行故障检测。现有的一种基于机器学习的输电线路故障检测方法及系统存在着对采集的输电线路实时监测数据中的缺失值进行插补时,插补方法单一,插补精度低的问题;构建决策树模型进行特征划分时存在着属性节点选择不公平,导致构建的决策树模型陷入局部最优解而非全局最优解的问题。
发明内容
针对上述情况,为克服现有技术的缺陷,本发明提供一种基于机器学习的输电线路故障检测方法及系统,针对采集的输电线路实时监测数据中的缺失值进行插补时,插补方法单一,插补精度低的问题,本方案采用基于神经网络和多层感知器插补的混合模型进行缺失值插补,将采集的输电线路实时数据集以矩阵的形式作为模型的输入,对矩阵非缺失元素进行归一化处理,并计算L层中每个节点的输出数据集,得到多重插补后的输电线路预处理数据集,提高了缺失值插补的准确率;针对构建决策树模型进行特征划分时属性节点选择不公平,导致构建的决策树模型陷入局部最优解而非全局最优解的问题,本方案在构建决策树模型进行特征划分时采用最大信息增益率进行划分,在信息增益的基础上计算信息拆分率和信息增益率,公平选择属性节点,全面评估特征的重要性,选择更准确的特征进行划分,提高了决策树模型的准确率。
本发明采用的技术方法如下:本发明提供的一种基于机器学习的输电线路故障检测方法,该方法包括以下步骤:
步骤S1:数据采集,具体为采集输电线路的历史数据和实时监测数据;
步骤S2:数据预处理,具体为通过基于神经网络和多层感知器插补的混合模型进行缺失值插补,采集的输电线路实时数据集以矩阵的形式作为模型的输入,对矩阵非缺失元素进行归一化处理,并计算L层中每个节点的输出数据集,得到输电线路预处理数据集;
步骤S3:特征提取,具体为对输电线路预处理数据集中的电流、电压和功率的相关特征进行特征提取,得到输电线路特征值数据集;
步骤S4:输电线路故障检测,具体为在构建决策树模型进行特征划分时采用最大信息增益率进行划分,在信息增益的基础上计算信息拆分率和信息增益率,得到输电线路故障检测结果;
步骤S5:模型评估,具体为通过对比输电线路历史数据集和输电线路故障检测结果,得到模型评估结果。
进一步地,在步骤S1中,所述数据采集,具体为采集输电线路的历史数据和对应标签,所述对应标签为正常状态和异常状态,得到输电线路历史数据集Ta,并设置时间间隔和监测位置,通过传感器和监控设备采集输电线路的实时监测数据,得到输电线路实时数据集Tb。
进一步地,在步骤S2中,所述数据预处理,具体为通过基于神经网络和多层感知器插补的混合模型进行缺失值插补,得到输电线路预处理数据集Tc,具体包括以下步骤:
步骤S21:构建基于神经网络和多层感知器插补的混合模型,具体为将输电线路实时数据集以M×q矩阵的形式输入模型,所用公式如下:
;
式中D表示模型的输入,dt+e,n表示监测位置n处时间间隔e的监测量,M表示模型的时间间隔数,q表示监测位置的数量,t表示监测数据进行插补的起始时间,e表示时间间隔的索引,n表示监测位置的索引;
步骤S22:预设dt+m,n中缺失N个元素,其中m表示缺失数据的起始时间间隔,n表示监测位置的索引,M=m+N;
步骤S23:归一化,具体为对矩阵非缺失元素进行归一化处理,得到归一化矩阵,所用公式如下:
;
式中,表示归一化矩阵,du,v表示去除缺失元素后的矩阵,M表示模型的时间间隔数,q表示监测位置的数量,t表示监测数据的起始时间;
步骤S24:计算L层中每个节点的输出数据集,具体为设置权重矩阵为W,偏差项矩阵为B,所用公示如下:
;
式中,z[L]表示L层中每个节点的输出数据集,表示权重矩阵W中的元素,/>表示偏差项矩阵B中的元素,m表示缺失数据的起始时间间隔,n表示监测位置的索引;
步骤S25:设置输入到层L的数据为,采用激活函数tanh进行激活,所用公示如下:
;
式中,表示输入到层L的数据,tanh()表示激活函数,z[L]表示层L中每个节点的输出数据集;;
步骤S26:输出插补后的数据集,具体为通过计算L层中每个节点的输出数据集,得到输电线路预处理数据集Tc。
进一步地,在步骤S3中,所述特征提取,具体为通过对输电线路预处理数据集中的电流、电压和功率的相关特征进行特征提取,得到输电线路特征值数据集Td。
进一步地,在步骤S4中,所述输电线路故障检测,具体为通过构建决策树模型进行数据分类,得到输电线路故障检测结果,具体包含以下步骤:
步骤S41:划分数据集,具体为通过将输电线路特征值数据集和对应标签作为样本数据集,所述对应标签为异常状态和正常状态,划分70%的样本数据作为训练数据集,其余30%样本数据作为测试数据集;
步骤S42:构建决策树模型,具体包含以下步骤:
步骤S421:以训练数据集被特征C划分为例,训练数据集表示为X={x1,x2,…,xn},特征C包含各种特征值;
步骤S422:计算训练数据集的信息熵,所用公式如下:
;
式中,Info(X)表示训练数据集的信息熵,i表示分类标签数目,pi表示分类标签数目i的占比;
步骤S423:计算特征C对训练数据集的条件熵,具体为通过特征C对训练数据集进行划分,按照属性a划分成m份,得到特征C对训练数据集的条件熵,所用公式如下:
;
式中,Infoa(X)表示特征C对训练数据集的条件熵,X表示训练数据集,Xj表示任一样本数据,j表示样本数据的索引;
步骤S424:计算训练数据集的信息增益,所用公式如下:
;
式中,Gain(a)表示训练数据集的信息增益,Info(X)表示训练数据集的信息熵,Infoa(X)表示特征C对训练数据集的条件熵;
步骤S425:计算训练数据集的信息拆分率,所用公式如下:
;
式中,spInfoa(X)表示训练数据集的信息拆分率,X表示训练数据集,Xj表示任一样本数据,j表示样本数据的索引;
步骤S426:计算训练数据集的信息增益率,通过选择具有最大信息增益率的特征值及阈值进行划分操作,并不断对训练子集进行拆分,直至所有训练子集数据属于同一类别或无法再进行划分,所用公式如下:
;
式中,spGain(a)表示训练数据集的信息增益率,Gain(a)表示训练数据集的信息增益,spInfoa(X)表示训练数据集的信息拆分率;
步骤S43:决策树判定,预先设定测试阈值,利用决策树对测试数据集分类,分类时忽略标签维度,分类后将标签与分类结果对照,判定分类是否正确,若测试数据集的分类正确率高于测试阈值,则分类完成转至步骤S44;否则重新划分训练数据集和测试数据集并转至步骤S42;
步骤S44:具体运行,通过步骤S3得到的输电线路特征值数据集作为样本数据集进行分类,得到分类结果,输出输电线路故障检测结果。
进一步地,在步骤S5中,所述模型评估,具体为通过对比输电线路历史数据集和输电线路故障检测结果,得到模型评估结果,具体包含以下步骤:
步骤S51:计算模型的准确率,所用公式如下:
;
式中,Q表示模型的准确率,TP表示检测结果正确的样本数据,FP表示检测结果异常的样本数据;
步骤S52:计算模型的召回率,所用公式如下:
;
式中,K表示模型的召回率,TP表示检测结果正确的数据,FN表示检测结果正确但是被判断异常的样本数据;
步骤S53:计算模型的F1得分,所用公式如下:
;
式中,F1表示模型的F1得分,Q表示模型的准确率,K表示模型的召回率。
本发明提供的一种基于机器学习的输电线路故障检测系统,包含数据采集模块、数据预处理模块、特征提取模块、输电线路故障检测模块和模型评估模块;
所述数据采集模块采集输电线路的历史数据和对应标签,所述对应标签为正常状态和异常状态,得到输电线路历史数据集,并设置时间间隔和监测位置,通过传感器和监控设备采集输电线路的实时监测数据,得到输电线路实时数据集,并将输电线路历史数据集发送至模型评估模块,将输电线路实时数据集发送至数据预处理模块;
所述数据预处理模块接收来自数据采集模块的输电线路实时数据集,采用基于神经网络和多层感知器插补的混合模型进行缺失值插补,得到输电线路预处理数据集,并将输电线路预处理数据集发送至特征提取模块;
所述特征提取模块接收来自数据预处理模块的输电线路预处理数据集,对输电线路预处理数据集中的电流、电压和功率的相关特征进行特征提取,得到输电线路特征值数据集,并将输电线路特征值数据集发送至输电线路故障检测模块;
所述输电线路故障检测模块接收来自特征提取模块的输电线路特征值数据集,通过构建决策树模型进行数据分类,得到输电线路故障检测结果,并将输电线路故障检测结果发送至模型评估模块;
所述模型评估模块接收来自数据采集模块的输电线路历史数据集和输电线路故障检测模块的输电线路故障检测结果,通过对比输电线路历史数据集和输电线路故障检测结果,得到模型评估结果。
采用上述方案本发明取得的有益效果如下:
(1)针对采集的输电线路实时监测数据中的缺失值进行插补时,插补方法单一,插补精度低的问题,本方案采用基于神经网络和多层感知器插补的混合模型进行缺失值插补,将采集的输电线路实时数据集以矩阵的形式作为模型的输入,对矩阵非缺失元素进行归一化处理,并计算L层中每个节点的输出数据集,得到多重插补后的输电线路预处理数据集,提高了缺失值插补的准确率。
(2)针对构建决策树模型进行特征划分时属性节点选择不公平,导致构建的决策树模型陷入局部最优解而非全局最优解的问题,本方案在构建决策树模型进行特征划分时采用最大信息增益率进行划分,在信息增益的基础上计算信息拆分率和信息增益率,公平选择属性节点,全面评估特征的重要性,选择更准确的特征进行划分,提高了决策树模型的准确率。
附图说明
图1为本发明提供的一种基于机器学习的输电线路故障检测方法的流程示意图;
图2为本发明提供的一种基于机器学习的输电线路故障检测系统的结构框图;
图3为步骤S2的流程示意图;
图4为步骤S4的流程示意图。
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例;基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本发明的描述中,需要理解的是,术语“上”、“下”、“前”、“后”、“左”、“右”、“顶”、“底”、“内”、“外”等指示方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
实施例一,参阅图1,本发明提供的一种基于机器学习的输电线路故障检测方法,该方法包括以下步骤:
步骤S1:数据采集,具体为采集输电线路的历史数据和实时监测数据;
步骤S2:数据预处理,具体为通过基于神经网络和多层感知器插补的混合模型进行缺失值插补,采集的输电线路实时数据集以矩阵的形式作为模型的输入,对矩阵非缺失元素进行归一化处理,并计算L层中每个节点的输出数据集,得到输电线路预处理数据集;
步骤S3:特征提取,具体为对输电线路预处理数据集中的电流、电压和功率的相关特征进行特征提取,得到输电线路特征值数据集;
步骤S4:输电线路故障检测,具体为在构建决策树模型进行特征划分时采用最大信息增益率进行划分,在信息增益的基础上计算信息拆分率和信息增益率,得到输电线路故障检测结果;
步骤S5:模型评估,具体为通过对比输电线路历史数据集和输电线路故障检测结果,得到模型评估结果。
实施例二,参阅图1,该实施例基于上述实施例,在步骤S1中,所述数据采集,具体为采集输电线路的历史数据和对应标签,所述对应标签为正常状态和异常状态,得到输电线路历史数据集Ta,并设置时间间隔和监测位置,通过传感器和监控设备采集输电线路的实时监测数据,得到输电线路实时数据集Tb。
实施例三,参阅图1和图3,该实施例基于上述实施例,在步骤S2中,所述数据预处理,具体为通过基于神经网络和多层感知器插补的混合模型进行缺失值插补,得到输电线路预处理数据集Tc,具体包括以下步骤:
步骤S21:构建基于神经网络和多层感知器插补的混合模型,具体为将输电线路实时数据集以M×q矩阵的形式输入模型,所用公式如下:
;
式中D表示模型的输入,dt+e,n表示监测位置n处时间间隔e的监测量,M表示模型的时间间隔数,q表示监测位置的数量,t表示监测数据进行插补的起始时间,e表示时间间隔的索引,n表示监测位置的索引;
步骤S22:预设dt+m,n中缺失N个元素,其中m表示缺失数据的起始时间间隔,n表示监测位置的索引,M=m+N;
步骤S23:归一化,具体为对矩阵非缺失元素进行归一化处理,得到归一化矩阵,所用公式如下:
;
式中,表示归一化矩阵,du,v表示去除缺失元素后的矩阵,M表示模型的时间间隔数,q表示监测位置的数量,t表示监测数据的起始时间;
步骤S24:计算L层中每个节点的输出数据集,具体为设置权重矩阵为W,偏差项矩阵为B,所用公示如下:
;
式中,z[L]表示L层中每个节点的输出数据集,表示权重矩阵W中的元素,/>表示偏差项矩阵B中的元素,m表示缺失数据的起始时间间隔,n表示监测位置的索引;
步骤S25:设置输入到层L的数据为,采用激活函数tanh进行激活,所用公示如下:
;
式中,表示输入到层L的数据,tanh()表示激活函数,z[L]表示层L中每个节点的输出数据集;
步骤S26:输出插补后的数据集,具体为通过计算L层中每个节点的输出数据集,得到输电线路预处理数据集Tc。
通过执行上述操作,针对采集的输电线路实时监测数据中的缺失值进行插补时,插补方法单一,插补精度低的问题,本方案采用基于神经网络和多层感知器插补的混合模型进行缺失值插补,将采集的输电线路实时数据集以矩阵的形式作为模型的输入,对矩阵非缺失元素进行归一化处理,并计算L层中每个节点的输出数据集,得到多重插补后的输电线路预处理数据集,提高了缺失值插补的准确率。
实施例四,参阅图1,该实施例基于上述实施例,在步骤S3中,所述特征提取,具体为通过对输电线路预处理数据集中的电流、电压和功率的相关特征进行特征提取,得到输电线路特征值数据集Td。
实施例五,参阅图1和图4,该实施例基于上述实施例,在步骤S4中,所述输电线路故障检测,具体为通过构建决策树模型进行数据分类,得到输电线路故障检测结果,具体包含以下步骤:
步骤S41:划分数据集,具体为通过将输电线路特征值数据集和对应标签作为样本数据集,所述对应标签为异常状态和正常状态,划分70%的样本数据作为训练数据集,其余30%样本数据作为测试数据集;
步骤S42:构建决策树模型,具体包含以下步骤:
步骤S421:以训练数据集被特征C划分为例,训练数据集表示为X={x1,x2,…,xn},特征C包含各种特征值;
步骤S422:计算训练数据集的信息熵,所用公式如下:
;
式中,Info(X)表示训练数据集的信息熵,i表示分类标签数目,pi表示分类标签数目i的占比;
步骤S423:计算特征C对训练数据集的条件熵,具体为通过特征C对训练数据集进行划分,按照属性a划分成m份,得到特征C对训练数据集的条件熵,所用公式如下:
;
式中,Infoa(X)表示特征C对训练数据集的条件熵,X表示训练数据集,Xj表示任一样本数据,j表示样本数据的索引;
步骤S424:计算训练数据集的信息增益,所用公式如下:
;
式中,Gain(a)表示训练数据集的信息增益,Info(X)表示训练数据集的信息熵,Infoa(X)表示特征C对训练数据集的条件熵;
步骤S425:计算训练数据集的信息拆分率,所用公式如下:
;
式中,spInfoa(X)表示训练数据集的信息拆分率,X表示训练数据集,Xj表示任一样本数据,j表示样本数据的索引;
步骤S426:计算训练数据集的信息增益率,通过选择具有最大信息增益率的特征值及阈值进行划分操作,并不断对训练子集进行拆分,直至所有训练子集数据属于同一类别或无法再进行划分,所用公式如下:
;
式中,spGain(a)表示训练数据集的信息增益率,Gain(a)表示训练数据集的信息增益,spInfoa(X)表示训练数据集的信息拆分率;
步骤S43:决策树判定,预先设定测试阈值,利用决策树对测试数据集分类,分类时忽略标签维度,分类后将标签与分类结果对照,判定分类是否正确,若测试数据集的分类正确率高于测试阈值,则分类完成转至步骤S44;否则重新划分训练数据集和测试数据集并转至步骤S42;
步骤S44:具体运行,通过步骤S3得到的输电线路特征值数据集作为样本数据集进行分类,得到分类结果,输出输电线路故障检测结果。
通过执行上述操作,针对构建决策树模型进行特征划分时属性节点选择不公平,导致构建的决策树模型陷入局部最优解而非全局最优解的问题,本方案在构建决策树模型进行特征划分时采用最大信息增益率进行划分,在信息增益的基础上计算信息拆分率和信息增益率,公平选择属性节点,全面评估特征的重要性,选择更准确的特征进行划分,提高了决策树模型的准确率。
实施例六,参阅图1,该实施例基于上述实施例,在步骤S5中,所述模型评估,具体为通过对比输电线路历史数据集和输电线路故障检测结果,得到模型评估结果,具体包含以下步骤:
步骤S51:计算模型的准确率,所用公式如下:
;
式中,Q表示模型的准确率,TP表示检测结果正确的样本数据,FP表示检测结果异常的样本数据;
步骤S52:计算模型的召回率,所用公式如下:
;
式中,K表示模型的召回率,TP表示检测结果正确的数据,FN表示检测结果正确但是被判断异常的样本数据;
步骤S53:计算模型的F1得分,所用公式如下:
;
式中,F1表示模型的F1得分,Q表示模型的准确率,K表示模型的召回率。
实施例七,参阅图2,该实施例基于上述实施例,本发明提供的一种基于机器学习的输电线路故障检测系统,包含数据采集模块、数据预处理模块、特征提取模块、输电线路故障检测模块和模型评估模块;
所述数据采集模块采集输电线路的历史数据和对应标签,所述对应标签为正常状态和异常状态,得到输电线路历史数据集,并设置时间间隔和监测位置,通过传感器和监控设备采集输电线路的实时监测数据,得到输电线路实时数据集,并将输电线路历史数据集发送至模型评估模块,将输电线路实时数据集发送至数据预处理模块;
所述数据预处理模块接收来自数据采集模块的输电线路实时数据集,采用基于神经网络和多层感知器插补的混合模型进行缺失值插补,得到输电线路预处理数据集,并将输电线路预处理数据集发送至特征提取模块;
所述特征提取模块接收来自数据预处理模块的输电线路预处理数据集,对输电线路预处理数据集中的电流、电压和功率的相关特征进行特征提取,得到输电线路特征值数据集,并将输电线路特征值数据集发送至输电线路故障检测模块;
所述输电线路故障检测模块接收来自特征提取模块的输电线路特征值数据集,通过构建决策树模型进行数据分类,得到输电线路故障检测结果,并将输电线路故障检测结果发送至模型评估模块;
所述模型评估模块接收来自数据采集模块的输电线路历史数据集和输电线路故障检测模块的输电线路故障检测结果,通过对比输电线路历史数据集和输电线路故障检测结果,得到模型评估结果。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。
以上对本发明及其实施方式进行了描述,这种描述没有限制性,附图中所示的也只是本发明的实施方式之一,实际的结构并不局限于此。总而言之如果本领域的普通技术人员受其启示,在不脱离本发明创造宗旨的情况下,不经创造性的设计出与该技术方案相似的结构方式及实施例,均应属于本发明的保护范围。
Claims (8)
1.一种基于机器学习的输电线路故障检测方法,其特征在于:该方法包括以下步骤:
步骤S1:数据采集,具体为采集输电线路的历史数据和实时监测数据;
步骤S2:数据预处理,具体为通过基于神经网络和多层感知器插补的混合模型进行缺失值插补,采集的输电线路实时数据集以矩阵的形式作为模型的输入,对矩阵非缺失元素进行归一化处理,并计算L层中每个节点的输出数据集,得到输电线路预处理数据集;
步骤S3:特征提取,具体为对输电线路预处理数据集中的电流、电压和功率的相关特征进行特征提取,得到输电线路特征值数据集;
步骤S4:输电线路故障检测,具体为在构建决策树模型进行特征划分时采用最大信息增益率进行划分,在信息增益的基础上计算信息拆分率和信息增益率,得到输电线路故障检测结果;
步骤S5:模型评估,具体为通过对比输电线路历史数据集和输电线路故障检测结果,得到模型评估结果。
2.根据权利要求1所述的一种基于机器学习的输电线路故障检测方法,其特征在于:在步骤S2中,所述数据预处理,具体为通过基于神经网络和多层感知器插补的混合模型进行缺失值插补,得到输电线路预处理数据集Tc,具体包括以下步骤:
步骤S21:构建基于神经网络和多层感知器插补的混合模型,具体为将输电线路实时数据集以M×q矩阵的形式输入模型,所用公式如下:
;
式中D表示模型的输入,dt+e,n表示监测位置n处时间间隔e的监测量,M表示模型的时间间隔数,q表示监测位置的数量,t表示监测数据进行插补的起始时间,e表示时间间隔的索引,n表示监测位置的索引;
步骤S22:预设dt+m,n中缺失N个元素,其中m表示缺失数据的起始时间间隔,n表示监测位置的索引,M=m+N;
步骤S23:归一化,具体为对矩阵非缺失元素进行归一化处理,得到归一化矩阵,所用公式如下:
;
式中,表示归一化矩阵,du,v表示去除缺失元素后的矩阵,M表示模型的时间间隔数,q表示监测位置的数量,t表示监测数据的起始时间;
步骤S24:计算L层中每个节点的输出数据集,具体为设置权重矩阵为W,偏差项矩阵为B,所用公式如下:
;
式中,z[L]表示L层中每个节点的输出数据集,表示权重矩阵W中的元素,/>表示偏差项矩阵B中的元素,m表示缺失数据的起始时间间隔,n表示监测位置的索引;
步骤S25:设置输入到层L的数据为,采用激活函数tanh进行激活,所用公式如下:
;
式中,表示输入到层L的数据,tanh()表示激活函数,z[L]表示层L中每个节点的输出数据集;
步骤S26:输出插补后的数据集,具体为通过计算L层中每个节点的输出数据集,得到输电线路预处理数据集Tc。
3.根据权利要求1所述的一种基于机器学习的输电线路故障检测方法,其特征在于:在步骤S4中,所述输电线路故障检测,具体为通过构建决策树模型进行数据分类,得到输电线路故障检测结果,具体包含以下步骤:
步骤S41:划分数据集,具体为通过将输电线路特征值数据集和对应标签作为样本数据集,所述对应标签为异常状态和正常状态,划分70%的样本数据作为训练数据集,其余30%样本数据作为测试数据集;
步骤S42:构建决策树模型,具体包含以下步骤:
步骤S421:训练数据集被特征C划分,训练数据集表示为X={x1,x2,…,xn},特征C包含各种特征值;
步骤S422:计算训练数据集的信息熵,所用公式如下:
;
式中,Info(X)表示训练数据集的信息熵,i表示分类标签数目,pi表示分类标签数目i的占比;
步骤S423:计算特征C对训练数据集的条件熵,具体为通过特征C对训练数据集进行划分,按照属性a划分成m份,得到特征C对训练数据集的条件熵,所用公式如下:
;
式中,Infoa(X)表示特征C对训练数据集的条件熵,X表示训练数据集,Xj表示任一样本数据,j表示样本数据的索引;
步骤S424:计算训练数据集的信息增益,所用公式如下:
;
式中,Gain(a)表示训练数据集的信息增益,Info(X)表示训练数据集的信息熵,Infoa(X)表示特征C对训练数据集的条件熵;
步骤S425:计算训练数据集的信息拆分率,所用公式如下:
;
式中,spInfoa(X)表示训练数据集的信息拆分率,X表示训练数据集,Xj表示任一样本数据,j表示样本数据的索引;
步骤S426:计算训练数据集的信息增益率,通过选择具有最大信息增益率的特征值及阈值进行划分操作,并不断对训练子集进行拆分,直至所有训练子集数据属于同一类别或无法再进行划分,所用公式如下:
;
式中,spGain(a)表示训练数据集的信息增益率,Gain(a)表示训练数据集的信息增益,spInfoa(X)表示训练数据集的信息拆分率;
步骤S43:决策树判定,预先设定测试阈值,利用决策树对测试数据集分类,分类时忽略标签维度,分类后将标签与分类结果对照,判定分类是否正确,若测试数据集的分类正确率高于测试阈值,则分类完成转至步骤S44;否则重新划分训练数据集和测试数据集并转至步骤S42;
步骤S44:具体运行,通过步骤S3得到的输电线路特征值数据集作为样本数据集进行分类,得到分类结果,输出输电线路故障检测结果。
4.根据权利要求1所述的一种基于机器学习的输电线路故障检测方法,其特征在于:在步骤S5中,所述模型评估,具体为通过对比输电线路历史数据集和输电线路故障检测结果,得到模型评估结果,具体包含以下步骤:
步骤S51:计算模型的准确率,所用公式如下:
;
式中,Q表示模型的准确率,TP表示检测结果正确的样本数据,FP表示检测结果异常的样本数据;
步骤S52:计算模型的召回率,所用公式如下:
;
式中,K表示模型的召回率,TP表示检测结果正确的数据,FN表示检测结果正确但是被判断异常的样本数据;
步骤S53:计算模型的F1得分,所用公式如下:
;
式中,F1表示模型的F1得分,Q表示模型的准确率,K表示模型的召回率。
5.根据权利要求1所述的一种基于机器学习的输电线路故障检测方法,其特征在于:在步骤S3中,所述特征提取,具体为通过对输电线路预处理数据集中的电流、电压和功率的相关特征进行特征提取,得到输电线路特征值数据集Td。
6.根据权利要求1所述的一种基于机器学习的输电线路故障检测方法,其特征在于:在步骤S1中,所述数据采集,具体为采集输电线路的历史数据和对应标签,所述对应标签为正常状态和异常状态,得到输电线路历史数据集Ta,并设置时间间隔和监测位置,通过传感器和监控设备采集输电线路的实时监测数据,得到输电线路实时数据集Tb。
7.一种基于机器学习的输电线路故障检测系统,用于实现如权利要求1-6中任一项所述的一种基于机器学习的输电线路故障检测方法,其特征在于:包含数据采集模块、数据预处理模块、特征提取模块、输电线路故障检测模块和模型评估模块。
8.根据权利要求7所述的一种基于机器学习的输电线路故障检测系统,其特征在于:所述数据采集模块采集输电线路的历史数据和对应标签,所述对应标签为正常状态和异常状态,得到输电线路历史数据集,并设置时间间隔和监测位置,通过传感器和监控设备采集输电线路的实时监测数据,得到输电线路实时数据集,并将输电线路历史数据集发送至模型评估模块,将输电线路实时数据集发送至数据预处理模块;
所述数据预处理模块接收来自数据采集模块的输电线路实时数据集,采用基于神经网络和多层感知器插补的混合模型进行缺失值插补,得到输电线路预处理数据集,并将输电线路预处理数据集发送至特征提取模块;
所述特征提取模块接收来自数据预处理模块的输电线路预处理数据集,对输电线路预处理数据集中的电流、电压和功率的相关特征进行特征提取,得到输电线路特征值数据集,并将输电线路特征值数据集发送至输电线路故障检测模块;
所述输电线路故障检测模块接收来自特征提取模块的输电线路特征值数据集,通过构建决策树模型进行数据分类,得到输电线路故障检测结果,并将输电线路故障检测结果发送至模型评估模块;
所述模型评估模块接收来自数据采集模块的输电线路历史数据集和输电线路故障检测模块的输电线路故障检测结果,通过对比输电线路历史数据集和输电线路故障检测结果,得到模型评估结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311319053.5A CN117113234A (zh) | 2023-10-12 | 2023-10-12 | 一种基于机器学习的输电线路故障检测方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311319053.5A CN117113234A (zh) | 2023-10-12 | 2023-10-12 | 一种基于机器学习的输电线路故障检测方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117113234A true CN117113234A (zh) | 2023-11-24 |
Family
ID=88813037
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311319053.5A Pending CN117113234A (zh) | 2023-10-12 | 2023-10-12 | 一种基于机器学习的输电线路故障检测方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117113234A (zh) |
Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106709566A (zh) * | 2016-12-07 | 2017-05-24 | 广东工业大学 | 一种基于深度学习的数据缺失值回填方法 |
CN109218114A (zh) * | 2018-11-12 | 2019-01-15 | 西安微电子技术研究所 | 一种基于决策树的服务器故障自动检测系统及检测方法 |
CN111507504A (zh) * | 2020-03-18 | 2020-08-07 | 中国南方电网有限责任公司 | 基于数据重采样的Adaboost集成学习电网故障诊断系统及方法 |
CN111597080A (zh) * | 2020-05-22 | 2020-08-28 | 广东省生态环境技术研究所 | 基于地统计和神经网络的地下水位缺失数据的修复方法 |
CN112508429A (zh) * | 2020-12-16 | 2021-03-16 | 常州大学 | 一种基于卷积神经网络的埋地管道阴极保护系统故障诊断方法 |
CN113011481A (zh) * | 2021-03-10 | 2021-06-22 | 广东电网有限责任公司计量中心 | 一种基于决策树算法的电能表功能异常评估方法及系统 |
CN113538063A (zh) * | 2021-07-28 | 2021-10-22 | 广东电网有限责任公司 | 基于决策树的电费异常数据分析方法、装置、设备及介质 |
CN114580525A (zh) * | 2022-02-25 | 2022-06-03 | 华南理工大学 | 一种面向含缺失数据的手势动作分类方法 |
CN114629103A (zh) * | 2020-12-09 | 2022-06-14 | 国网上海市电力公司 | 一种基于inception结构负荷分解模型的楼宇负荷分解方法 |
CN114648060A (zh) * | 2022-03-04 | 2022-06-21 | 贵州电网有限责任公司 | 基于机器学习的故障信号规范化处理及分类方法 |
CN115510042A (zh) * | 2022-08-30 | 2022-12-23 | 北京邮电大学 | 基于生成对抗网络的电力系统负荷数据填补方法及装置 |
US20230075453A1 (en) * | 2021-09-08 | 2023-03-09 | Humana Inc. | Generating machine learning based models for time series forecasting |
CN115878603A (zh) * | 2022-12-27 | 2023-03-31 | 大连大学 | 基于k近邻算法与gan网络的水质缺失数据插补算法 |
CN116680567A (zh) * | 2023-06-09 | 2023-09-01 | 中国船舶重工集团海装风电股份有限公司 | 一种风力发电机的缺失状态变量填补方法及装置 |
CN116793666A (zh) * | 2023-04-23 | 2023-09-22 | 国网河南省电力公司安阳供电公司 | 一种基于lstm-mlp-lsgan模型的风电机组齿轮箱故障诊断方法 |
-
2023
- 2023-10-12 CN CN202311319053.5A patent/CN117113234A/zh active Pending
Patent Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106709566A (zh) * | 2016-12-07 | 2017-05-24 | 广东工业大学 | 一种基于深度学习的数据缺失值回填方法 |
CN109218114A (zh) * | 2018-11-12 | 2019-01-15 | 西安微电子技术研究所 | 一种基于决策树的服务器故障自动检测系统及检测方法 |
CN111507504A (zh) * | 2020-03-18 | 2020-08-07 | 中国南方电网有限责任公司 | 基于数据重采样的Adaboost集成学习电网故障诊断系统及方法 |
CN111597080A (zh) * | 2020-05-22 | 2020-08-28 | 广东省生态环境技术研究所 | 基于地统计和神经网络的地下水位缺失数据的修复方法 |
CN114629103A (zh) * | 2020-12-09 | 2022-06-14 | 国网上海市电力公司 | 一种基于inception结构负荷分解模型的楼宇负荷分解方法 |
CN112508429A (zh) * | 2020-12-16 | 2021-03-16 | 常州大学 | 一种基于卷积神经网络的埋地管道阴极保护系统故障诊断方法 |
CN113011481A (zh) * | 2021-03-10 | 2021-06-22 | 广东电网有限责任公司计量中心 | 一种基于决策树算法的电能表功能异常评估方法及系统 |
CN113538063A (zh) * | 2021-07-28 | 2021-10-22 | 广东电网有限责任公司 | 基于决策树的电费异常数据分析方法、装置、设备及介质 |
US20230075453A1 (en) * | 2021-09-08 | 2023-03-09 | Humana Inc. | Generating machine learning based models for time series forecasting |
CN114580525A (zh) * | 2022-02-25 | 2022-06-03 | 华南理工大学 | 一种面向含缺失数据的手势动作分类方法 |
CN114648060A (zh) * | 2022-03-04 | 2022-06-21 | 贵州电网有限责任公司 | 基于机器学习的故障信号规范化处理及分类方法 |
CN115510042A (zh) * | 2022-08-30 | 2022-12-23 | 北京邮电大学 | 基于生成对抗网络的电力系统负荷数据填补方法及装置 |
CN115878603A (zh) * | 2022-12-27 | 2023-03-31 | 大连大学 | 基于k近邻算法与gan网络的水质缺失数据插补算法 |
CN116793666A (zh) * | 2023-04-23 | 2023-09-22 | 国网河南省电力公司安阳供电公司 | 一种基于lstm-mlp-lsgan模型的风电机组齿轮箱故障诊断方法 |
CN116680567A (zh) * | 2023-06-09 | 2023-09-01 | 中国船舶重工集团海装风电股份有限公司 | 一种风力发电机的缺失状态变量填补方法及装置 |
Non-Patent Citations (4)
Title |
---|
ESTHER-LYDIA SILVA-RAMÍREZ等: "Missing value imputation on missing completely at random data using multilayer perceptrons", NEURAL NETWORKS, vol. 24, pages 121 - 129, XP027533181 * |
张楷卉;李鹏;: "一种基于模糊C均值聚类的稀疏数据缺失值填充方法", 黑龙江大学自然科学学报, no. 06, pages 750 - 756 * |
张楷卉等: "基于状态监控数据的民机系统故障诊断与预测方法研究", 中国博士学位论文全文数据库 工程科技II辑, vol. 36, no. 6, pages 031 - 84 * |
董学思;林丽娟;赵杨;魏永越;戴俊程;陈峰;: "多组学联合缺失数据填补方法的评价", 中国卫生统计, no. 04, pages 558 - 566 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111914873B (zh) | 一种两阶段云服务器无监督异常预测方法 | |
CN107992968B (zh) | 基于集成时间序列分析技术的电能表计量误差预测方法 | |
EP3552067B1 (en) | Methods and systems for discovery of prognostic subsequences in time series | |
CN111311059B (zh) | 基于知识图谱的水车室故障诊断方法 | |
CN111858231A (zh) | 一种基于运维监控的单指标异常检测方法 | |
CN110596506A (zh) | 基于时间卷积网络的变换器故障诊断方法 | |
CN117474357B (zh) | 基于深度学习的配电房运维管理方法及系统 | |
CN111176953B (zh) | 一种异常检测及其模型训练方法、计算机设备和存储介质 | |
CN110738255A (zh) | 一种基于聚类算法的设备状态监测方法 | |
CN112650660B (zh) | 一种数据中心动力系统预警方法及装置 | |
CN117131110B (zh) | 一种基于关联分析的容性设备介质损耗监测方法及系统 | |
CN114600087A (zh) | 异常设备迹线检测和分类 | |
CN109146708B (zh) | 供电报修的抢修方法及装置 | |
CN112416662A (zh) | 多时间序列数据异常检测方法与装置 | |
CN114842371B (zh) | 一种无监督视频异常检测方法 | |
CN117277566B (zh) | 基于大数据的电网数据分析电力调度系统及方法 | |
CN116910680B (zh) | 一种健身器材的远程故障检测方法及系统 | |
CN117113234A (zh) | 一种基于机器学习的输电线路故障检测方法及系统 | |
CN116089820A (zh) | 基于用户协同的负荷辨识方法及系统、电子设备、介质 | |
CN115047313B (zh) | 基于oc-svm和dnn的zpw-2000r轨道电路故障诊断方法及装置 | |
CN115904916A (zh) | 一种硬盘故障预测的方法、装置、电子设备以及存储介质 | |
CN115184734A (zh) | 一种电网线路故障检测方法和系统 | |
CN116956089A (zh) | 电器设备温度异常检测模型训练方法以及检测方法 | |
KR102486463B1 (ko) | 열화에 따른 시계열 데이터를 이용한 실시간 이상 감지 방법 및 그를 위한 장치 | |
Karanikolas et al. | Multi-kernel change detection for dynamic functional connectivity graphs |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20231124 |
|
RJ01 | Rejection of invention patent application after publication |