CN110929918B - 一种基于CNN和LightGBM的10kV馈线故障预测方法 - Google Patents
一种基于CNN和LightGBM的10kV馈线故障预测方法 Download PDFInfo
- Publication number
- CN110929918B CN110929918B CN201911038911.2A CN201911038911A CN110929918B CN 110929918 B CN110929918 B CN 110929918B CN 201911038911 A CN201911038911 A CN 201911038911A CN 110929918 B CN110929918 B CN 110929918B
- Authority
- CN
- China
- Prior art keywords
- distribution network
- power distribution
- elements
- fault prediction
- fault
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
- G06Q50/06—Electricity, gas or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Abstract
本发明公开一种基于CNN和LightGBM的10kV馈线故障预测方法,主要步骤为:1)获取配电网原始数据,对配电网原始数据进行预处理;2)从配电网原始数据中提取特征,构建特征集f{f1,f2…f15,f16,L};L为标签,表示馈线是否发生故障;其中,元素f1、元素f2、元素f3、元素f4、元素f5、元素f6为固有属性特征。元素f7、元素f8、元素f9、元素f10、元素f11、元素f12、元素f13为统计分析特征。元素f14、元素f15、元素f16为卷积神经网络CNN提取的深度时序特征。3)建立配电网故障预测模型;4)将配电网10kV馈线实时数据输入配电网故障预测模型,得到馈线故障预测结果。本发明具有较好的快速性和时效性,预测结果能在满足准确性要求的前提下为配电网运维管理人员提供辅助决策支撑。
Description
技术领域
本发明涉及智能配电网领域,具体是一种基于CNN和LightGBM的10kV馈线故障预测方法。
背景技术
随着现代社会工业化、信息化和智能化水平的不断提高,电能作为二次能源的重要组成部分,不仅在社会发展起着关键作用,也在人民生活中不可替代。电力系统集发电、输电、配电和用电五个环节于一体,网络结构复杂、运行环境多变,近年来分布式电源和充电桩等的接入,也给电力系统带来了不小的压力,电网任何环节发生故障都将对用户造成影响,轻则造成经济损失,重则威胁生命安全。配电网位于电力系统的末端,与用户紧密相连,直接向用户配电和供电,配电网的运行状态将直接影响用户的用电质量。统计结果表明,用户故障停电事件80%以上是由配电网故障导致的。及时准确的掌握配电网的运行状态,实现对配电网故障风险的计算和预测,可以减少配电网故障、提高配电网的供电可靠性和精益化运维水平,对于促进国民经济稳定发展、保障用户的用电质量及提升全社会满意度有着重要意义。
以往,专家学者们对配电网故障风险预测方法的研究多聚焦于风险评估、历史数据分析,以及基于机理建模或智能算法的故障预测等。这些研究成果能在一定程度上预测配电网的故障风险,找出配电网的薄弱环节,提高配电网的供电可靠性,但仍然存在一些不足。配电网的风险评估需要建立风险指标,指标多依赖于专家经验和故障相关静态数据,且量化规则往往采用层次分析法、德菲尔法及模糊评价法等,这导致该法的客观性和实时性较差;配电网历史故障相关数据分析一般使用统计分析、关联分析及多维分析等方法,这些方法能够统计故障发生规律,挖掘故障原因的相关性和自相关性,但快速性、灵活性和可预测性不够;配电网结构复杂,基于机理建模对配电网进行故障预测十分困难,常见机理建模有电力设备的温升模型和油气分析模型等,相对于机理建模,基于数据处理技术运用智能算法对配电网进行故障预测则较为容易,比如回归算法、聚类算法、支持向量机和人工神经网络等,但目前这些算法往往是分别对配电网中单一连续时间变量及多元离散时间变量进行建模,缺乏对配电网时间序列特征和非时间序列特征的融合处理,也缺少对配电网时间序列变量的特征提取方法研究,且随着配电网数据的逐年累积,一些算法已不再适应大规模数据场景。
发明内容
本发明的目的是解决现有技术中存在的问题。
为实现本发明目的而采用的技术方案是这样的,一种基于CNN和LightGBM的10kV馈线故障预测方法,主要包括以下步骤:
1)获取配电网原始数据,并对配电网原始数据进行预处理。
进一步,所述配电网原始数据包括气象数据和配电网信息数据。将配电网原始数据以馈线故障为标准,分为三类,分别表示不同类型馈线故障下xi年yi条馈线的原始数据。所述馈线故障包括运行因素引发的故障、设备故障引发的故障和天气因素引发的故障。
进一步,对配电网原始数据进行预处理的步骤如下:
1.1)利用临插补法对配电网原始数据进行补全。
1.2)对配电网原始数据降噪。
2)从配电网原始数据中提取特征,并构建特征集f{f1,f2…f15,f16,L}。L为标签,表示馈线是否发生故障。其中,元素f1、元素f2、元素f3、元素f4、元素f5、元素f6为固有属性特征。元素f7、元素f8、元素f9、元素f10、元素f11、元素f12、元素f13为统计分析特征。元素f14、元素f15、元素f16为卷积神经网络CNN提取的深度时序特征。
进一步,配电网原始数据集特征参数包括固有属性特征、统计分析特征和深度时序特征。
所述固有属性特征包括线路性质f1、线路长度f2、所属变电站f3、线路投运时间f4、线路设备数量f5和线路设备厂商f6。
所述统计分析特征包括时间统计特征、气象统计特征和故障自相关性统计特征,其中时间统计特征包括夏季表征参数f7和周末表征参数f8。气象统计特征包括一天中气温的最大值f9、一天中气温最小值f10、湿度的最大值f11和风速最大值f12。故障的自相关特征包括馈线前一周发生故障的次数f13。
进一步,获取深度时序特征的主要步骤如下:
2.1)构建深度时序特征样本集,主要步骤如下:
2.1.1)建立配电网馈线故障时序数据特征集F{A,V,T,H,W}。A为电流,V为电压,T为气温,H为湿度,W为风速。
2.1.2)以滑动窗口方式构建三个深度时序特征样本集,滑动窗口步长分别为d1、d2和d3。
2.2)将滑动窗口内前n天的深度时序特征样本集归一化,建立故障画像。所述故障画像包括不存在故障的正常画像和存在故障的异常画像。正常画像记为0,异常画像记为1。
2.3)建立卷积神经网络CNN。所述卷积神经网络CNN包括输入层、若干隐含层和输出层。
2.4)将三个深度时序特征样本集分别输入到卷积神经网络CNN中,对卷积神经网络CNN进行训练,得到故障画像类别预测概率P1、故障画像类别预测概率P2和故障画像类别预测概率P3。故障画像类别预测概率P1、故障画像类别预测概率P2和故障画像类别预测概率P3分别记为深度时序特征f14、深度时序特征f15和深度时序特征f16。
3)利用LightGBM算法建立配电网故障预测模型。
进一步,建立配电网故障预测模型的主要步骤如下:
3.1)对特征集f进行样本均衡处理,并将均衡样本后的特征集f,将数据集划分为训练样本集和测试样本集,其中,馈线正常为负样本,馈线故障为正样本。
对特征集f进行样本平衡处理的方法为:
3.1.1)确定正样本和负样本的数量。
3.1.2)利用上采样方法对数量少的样本进行随机采样,使正样本和负样本数据均衡。
3.2)利用LightGBM算法建立配电网故障预测模型,并设置配电网故障预测模型参数,包括最大深度max_depth、叶子节点书num_leaves、步长learning_rate、迭代次数n_estimators和早停条件early_stopping_rounds。early_stopping_rounds表示连续n次迭代后配电网故障预测模型误差没有减小,提前终止训练。
3.3)将训练样本集输入到配电网故障预测模型中,完成配电网故障预测模型的训练。
3.4)将测试样本集输入到训练后的配电网故障预测模型中,输出配电网故障预测概率P。
3.5)基于配电网故障预测概率P建立受试者工作特征曲线ROC,并计算特征曲线ROC和坐标轴所围成的面积AUC。判断AUC≥阈值ε是否成立,若成立,则结束迭代,若不成立,则重新设置配电网故障预测模型参数,并返回步骤3.3。
进一步,获取受试者工作特征曲线ROC的主要步骤如下:
3.5.1)建立坐标轴,其中横坐标为误报率FPR,纵坐标为查全率TPR。
误报率FPR如下所示:
式中,TP表示预测概率和真实值均为1。FP表示预测概率为0,真实值为1。FN表示预测概率为1,真实值为0。TN表示预测概率和真实值均为0。
查全率TPR如下所示:
3.5.2)将不同界限值δ输入到配电网故障预测模型中,得到配电网故障预测概率P,δ∈(0,1)。配电网故障预测概率P≥δ时预测结果视为正样本的预测结果,反之,则视为负样本的预测结果;
3.5.3)匹配配电网故障预测结果和验证集真实结果,得到参数TP、参数FP、参数FN和参数TN,并计算得到误报率FPR和查全率TPR,从而得到受试者工作特征曲线ROC的点值。
4)将配电网10kV馈线实时数据输入到配电网故障预测模型中,得到馈线故障预测结果。
本发明的技术效果是毋庸置疑的。在配电网大数据背景下,本发明提出一种基于CNN和LightGBM的10kV馈线故障预测方法。该方法具有较好的快速性和时效性,预测结果能在满足准确性要求的前提下为配电网运维管理人员提供辅助决策支撑。
附图说明
图1为技术路线流程图;
图2为stacking原理图;
图3为时序特征样本集构建流程图;
图4为“故障画像”构建流程图;
图5为卷积神经网络结构;
图6为深度时序特征提取流程图;
图7为故障预测流程图;
图8为Boosting原理图;
图9为三个模型的预测结果。
具体实施方式
下面结合实施例对本发明作进一步说明,但不应该理解为本发明上述主题范围仅限于下述实施例。在不脱离本发明上述技术思想的情况下,根据本领域普通技术知识和惯用手段,做出各种替换和变更,均应包括在本发明的保护范围内。
实施例1:
参见图1至图8,一种基于CNN和LightGBM的10kV馈线故障预测方法,主要包括以下步骤:
1)获取配电网原始数据,并对配电网原始数据进行预处理。
进一步,所述配电网原始数据包括气象数据和配电网信息数据。将配电网原始数据以馈线故障为标准,分为三类,分别表示不同类型馈线故障下xi年yi条馈线的原始数据。所述馈线故障包括运行因素引发的故障、设备故障引发的故障和天气因素引发的故障。本实施例所述馈线均为10kV馈线。
进一步,对配电网原始数据进行预处理的步骤如下:
1.1)利用临插补法对配电网原始数据进行补全。
1.2)对配电网原始数据降噪。
2)从配电网原始数据中提取特征,并构建特征集f{f1,f2…f15,f16,L}。L为标签,表示馈线是否发生故障。对每类因素引发的故障进行数据预处理和特征集构建,得到某类因素引发的故障样本集大小为xi*yi*365-60。其中,元素f1、元素f2、元素f3、元素f4、元素f5、元素f6为固有属性特征。元素f7、元素f8、元素f9、元素f10、元素f11、元素f12、元素f13为统计分析特征。元素f14、元素f15、元素f16为卷积神经网络CNN提取的深度时序特征。
进一步,配电网原始数据集特征参数包括固有属性特征、统计分析特征和深度时序特征。
所述固有属性特征包括线路性质f1、线路长度f2、所属变电站f3、线路投运时间f4、线路设备数量f5和线路设备厂商f6。
所述统计分析特征包括时间统计特征、气象统计特征和故障自相关性统计特征,其中时间统计特征包括夏季表征参数f7和周末表征参数f8。气象统计特征包括一天中气温的最大值f9、一天中气温最小值f10、湿度的最大值f11和风速最大值f12。故障的自相关特征包括馈线前一周发生故障的次数f13。
进一步,获取深度时序特征的主要步骤如下:
2.1)构建深度时序特征样本集,主要步骤如下:
2.1.1)建立配电网馈线故障时序数据特征集F{A,V,T,H,W}。A为电流,V为电压,T为气温,H为湿度,W为风速。
2.1.2)以滑动窗口方式构建三个深度时序特征样本集,滑动窗口步长分别为d1、d2和d3。
2.2)将滑动窗口内前n天的深度时序特征样本集归一化,建立故障画像。所述故障画像包括不存在故障的正常画像和存在故障的异常画像。正常画像记为0,异常画像记为1。
2.3)建立卷积神经网络CNN(Convolutional Neural Networks)。所述卷积神经网络CNN包括输入层、若干隐含层和输出层。
进一步,隐含层包括卷积层、池化层和全连接层。
卷积层的功能是对输入数据进行特征提取。
在卷积层进行特征提取后,输出的特征图会被传递至池化层进行特征选择和信息过滤。池化层包含预设定的池化函数,其功能是将特征图中单个点的结果替换为其相邻区域的特征图统计量。
卷积神经网络中的全连接层等价于传统前馈神经网络中的隐含层。全连接层位于卷积神经网络隐含层的最后部分,并只向其它全连接层传递信号。
2.4)将三个深度时序特征样本集分别输入到卷积神经网络CNN中,对卷积神经网络CNN进行训练,得到故障画像类别预测概率P1、故障画像类别预测概率P2和故障画像类别预测概率P3。故障画像类别预测概率P1、故障画像类别预测概率P2和故障画像类别预测概率P3分别记为深度时序特征f14、深度时序特征f15和深度时序特征f16。
3)利用LightGBM(Light Gradient Boosting Machine,LightGBM,轻量级梯度提升树)算法建立配电网故障预测模型。
进一步,建立配电网故障预测模型的主要步骤如下:
3.1)对特征集f进行样本均衡处理,并将均衡样本后的特征集f,将数据集划分为训练样本集和测试样本集。其中,馈线正常为负样本,馈线故障为正样本。
对特征集f进行样本均衡处理的方法为:
3.1.1)确定正样本和负样本的数量。
3.1.2)利用上采样方法对数量少的样本进行随机采样,使正样本和负样本数据均衡。
3.2)利用LightGBM算法建立配电网故障预测模型,并设置配电网故障预测模型参数,包括最大深度max_depth、叶子节点书num_leaves、步长learning_rate、迭代次数n_estimators和早停条件early_stopping_rounds。early_stopping_rounds表示连续n次迭代后配电网故障预测模型误差没有减小,提前终止训练。
3.3)将训练样本集输入到配电网故障预测模型中,完成配电网故障预测模型的训练。
3.4)将测试样本集输入到训练后的配电网故障预测模型中,输出配电网故障预测概率P。
3.5)基于配电网故障预测概率P建立受试者工作特征曲线ROC,并计算特征曲线ROC和坐标轴所围成的面积AUC。判断AUC≥阈值ε是否成立,若成立,则结束迭代,若不成立,则重新设置配电网故障预测模型参数,并返回步骤3.3。
ROC曲线下方的面积大小(Area Under Curve,AUC)度量了算法的好坏,曲线越靠近左上角,AUC越大,分类效果越好。对于一个二分类任务,将样本分为正样本和负样本,其混淆矩阵如表1所示。
表1二分类任务混淆矩阵
查准率(Precision)是正确预测为正例的样本数占全部预测为正例的样本数的比例,即:
进一步,获取受试者工作特征曲线ROC的主要步骤如下:
3.5.1)建立坐标轴,其中横坐标为误报率FPR,纵坐标为查全率TPR。
表示预测为正但实际为负的样本占所有负例样本的比例的误报率FPR如下所示:
式中,TP表示预测概率和真实值均为1。FP表示预测概率为0,真实值为1。FN表示预测概率为1,真实值为0。TN表示预测概率和真实值均为0。
表示正确预测为正例的样本数占实际全部正样本数的比例的查全率TPR如下所示:
3.5.2)将不同界限值δ输入到配电网故障预测模型中,得到配电网故障预测概率P,δ∈(0,1)。配电网故障预测概率P≥δ时预测结果视为正样本的预测结果,反之,则视为负样本的预测结果;
3.5.3)匹配配电网故障预测结果和验证集真实结果,得到参数TP、参数FP、参数FN和参数TN,并计算得到误报率FPR和查全率TPR,从而得到受试者工作特征曲线ROC的点值。配电网故障预测概率P≥δ时视预测结果为正例,反之,则视为负例。
ROC曲线上最靠近左上角的点是分类错误最少的位置,该处的界限值即为最好阈值,ROC曲线下方的面积大小AUC度量了算法的好坏,曲线越靠近左上角,AUC越大,分类效果越好。
4)将配电网10kV馈线实时数据输入到配电网故障预测模型中,得到馈线故障预测结果。
实施例2:
一种基于CNN和LightGBM的10kV馈线故障预测方法,主要包括以下步骤:
1)获取配电网原始数据,并对配电网原始数据进行预处理。
2)从配电网原始数据中提取特征,并构建特征集f{f1,f2…f15,f16,L};L为标签,表示馈线是否发生故障。其中,元素f1、元素f2、元素f3、元素f4、元素f5、元素f6为固有属性特征。元素f7、元素f8、元素f9、元素f10、元素f11、元素f12、元素f13为统计分析特征。元素f14、元素f15、元素f16为卷积神经网络CNN提取的深度时序特征。
3)利用LightGBM算法建立配电网故障预测模型。
4)将配电网10kV馈线实时数据输入到配电网故障预测模型中,得到馈线故障预测结果。
实施例3:
一种基于CNN和LightGBM的10kV馈线故障预测方法,主要步骤见实施例2,其中,配电网原始数据集特征参数包括固有属性特征、统计分析特征和深度时序特征。
所述固有属性特征包括线路性质f1、线路长度f2、所属变电站f3、线路投运时间f4、线路设备数量f5和线路设备厂商f6。
所述统计分析特征包括时间统计特征、气象统计特征和故障自相关性统计特征,其中时间统计特征包括夏季表征参数f7和周末表征参数f8。气象统计特征包括一天中气温的最大值f9、一天中气温最小值f10、湿度的最大值f11和风速最大值f12。故障的自相关特征包括馈线前一周发生故障的次数f13。
进一步,获取深度时序特征的主要步骤如下:
1)构建深度时序特征样本集,主要步骤如下:
1.1)建立配电网馈线故障时序数据特征集F{A,V,T,H,W}。A为电流,V为电压,T为气温,H为湿度,W为风速。
1.2)以滑动窗口方式构建三个深度时序特征样本集,滑动窗口步长分别为d1、d2和d3。
2)将滑动窗口内前n天的深度时序特征样本集归一化,建立故障画像。所述故障画像包括不存在故障的正常画像和存在故障的异常画像。正常画像记为0,异常画像记为1。
3)建立卷积神经网络CNN。所述卷积神经网络CNN包括输入层、若干隐含层和输出层。
4)将三个深度时序特征样本集分别输入到卷积神经网络CNN中,对卷积神经网络CNN进行训练,得到故障画像类别预测概率P1、故障画像类别预测概率P2和故障画像类别预测概率P3。故障画像类别预测概率P1、故障画像类别预测概率P2和故障画像类别预测概率P3分别记为深度时序特征f14、深度时序特征f15和深度时序特征f16。
实施例4:
一种基于CNN和LightGBM的10kV馈线故障预测方法,主要步骤见实施例2,其中,建立配电网故障预测模型的主要步骤如下:
1)对特征集f进行样本均衡处理,并将均衡样本后的特征集f划分为训练样本集和测试样本集。其中,馈线正常为负样本,馈线故障为正样本。
对特征集f进行样本均衡处理的方法为:
1.1)确定正样本和负样本的数量。
1.2)利用上采样方法对数量少的样本进行随机采样,使正样本和负样本数据均衡。
2)利用LightGBM算法建立配电网故障预测模型,并设置配电网故障预测模型参数,包括最大深度max_depth、叶子节点书num_leaves、步长learning_rate、迭代次数n_estimators和early_stopping_rounds。early_stopping_rounds表示连续n次迭代后配电网故障预测模型误差没有减小,提前终止训练。
3)将训练样本集输入到配电网故障预测模型中,完成配电网故障预测模型的训练。
4)将测试样本集输入到训练后的配电网故障预测模型中,输出配电网故障预测概率P。
5)基于配电网故障预测概率P建立受试者工作特征曲线ROC,并计算特征曲线ROC和坐标轴所围成的面积AUC。判断AUC≥阈值ε是否成立,若成立,则结束迭代,若不成立,则重新设置配电网故障预测模型参数,并返回步骤3。
进一步,获取受试者工作特征曲线ROC的主要步骤如下:
5.1)建立坐标轴,其中横坐标为误报率FPR,纵坐标为查全率TPR。
误报率FPR如下所示:
式中,TP表示预测概率和真实值均为1。FP表示预测概率为0,真实值为1。FN表示预测概率为1,真实值为0。TN表示预测概率和真实值均为0。
查全率TPR如下所示:
5.2)将不同界限值δ输入到配电网故障预测模型中,得到配电网故障预测概率P,δ∈(0,1)。配电网故障预测概率P≥δ时视预测结果为正样本的预测结果,反之,则视为负样本的预测结果;
5.3)匹配配电网故障预测结果和验证集真实结果,得到参数TP、参数FP、参数FN和参数TN,并计算得到误报率FPR和查全率TPR,从而得到受试者工作特征曲线ROC的点值。配电网故障预测概率P≥δ时视预测结果为正例,反之,则视为负例。
实施例5:
参见图9,一种验证基于CNN和LightGBM的10kV馈线故障预测方法的实验,主要步骤如下:
1)数据获取,从配电网内部的各信息管理系统和外部的气象系统中获取本发明建模所需要的数据,由于本发明方法是基于数据驱动的建模,数据量越大将有助于模型的精度提升,则实际中可视情况多获取几年数据。本发明以某地区供电局2016.1.1-2018.12.31共3年353条馈线为例,采集上述线路主要由设备因素引发的配电网故障相关数据进行说明,具体数据如表2所示。
表2数据详细情况
2)数据预处理,由于配电网时序数据一般不突变,具有较为稳定的变化趋势,而一些固定数据则无规律可循,因此在本发明中采用最近临插补法对时序数据缺失值进行补全,即根据在缺失数据在时间前后位置的值对缺失部分进行插补,插补的值为前后数据的中值。对于固定数据的缺失值则不作处理,视为一种特殊类型的值。
3)特征工程,本发明将10kV馈线的特征归纳为固有属性特征、统计分析特征和深度时序特征,将这些特征进行融合构造特征集。
3.1)固有属性特征,馈线的固有属性主要有线路性质f1、线路长度f2、所属变电站f3、线路投运时间f4、线路主要设备数量f5和线路主要设备厂商f6。
3.2)统计分析特征,馈线的统计特征是由与故障发生相关的其他因素经统计分析得到,包括时间统计特征、气象统计特征和故障自相关性统计特征。主要特征为是否为夏季f7,是否为周末f8;气象统计特征是一天中气温的最大值f9,一天中气温最小值f10、湿度的最大值f11和风速最大值f12;故障的自相关特征是馈线前一周发生故障的次数f13。
3.3)深度时序特征,基于stacking思想,如图2所示,将时序数据按不同时间步长(n=7,30,60天)设计不同的样本集,然后搭建CNN,进行有监督学习,将CNN的输出结果作为提取到的故障时序特征,用于训练故障预测模型。图2中,data set表示数据集,classifier表示分类器。
3.3.1)深度时序特征的样本构建,配电网10kV馈线故障的时序数据有电流A、电压V、气温T、湿度H和风速W,共五维数据构成特征集F{A,V,T,H,W},根据故障的统计特征分析和时序数据对故障的作用规律,在时间上按照短期(n=7天)、中长期(n=30天)和长期(n=60天)以滑动窗口的形式方式对时序特征样本集进行构建,样本构建过程如图3所示。
3.3.2)“故障画像”构建,五维数据构成特征集F{A,V,T,H,W}以每天24个整点进行保存,将滑动窗口内前n(n=7,30,60天)天的24个整点的五维时序数据归一化之后用于构建对应于考察日的“故障画像”。本发明以n为7为例进行说明,Ad0代表d天0点时刻的电流值,Ad23代表d天23时刻的电流值,对其进行最大最小归一化处理:
其中Adxnorm代表d天x时刻归一化后的电流值,Adx代表d天x时刻的电流值,Admin代表d天电流最小值,Admax代表d天电流最大值,A(d+1)0代表d+1天0时刻的电流值,以此类推对V,T,H,W进行归一化处理,构造的故障画像如图4所示,每个故障画像大小为35*24。“故障画像”有两种,一种是对应于不发生故障的正常画像即d+n+1天未发生故障,标记为0;另一种是对应于发生故障的异常画像即d+n+1天发生故障,标记为1。数据为2016.1.1-2018.12.31共3年353条线路的时序数据,经过处理后得到时间步长为7的共3*365*353-7个故障画像。
3.3.3)特征学习,根据上步构建的3个不同时间步长(n=7,30,60天)的样本集,每个样本集分别搭建图5所示卷积神经网络进行训练训练的目的是使CNN网络能比较正确的识别两类“故障画像”,并给出预测概率值(概率值∈[0,1]),将这些概率作为所提取的深度时序特征,分别为f14,f15,f16提取流程图如图6所示。同样以n为7为例进行说明,共3*365*353-7个样本,每个样本为35*24大小,第一个卷积层和池化层含有32个特征面,第二个卷积层和池化层含有64个特征面,卷积层的滑动窗口大小为3*3,步长设置为1*1,卷积层的滑动窗口大小为2*2,步长设置为2*1。根池化方式均采用最大值池化。根据二分类任务特点,CNN的全连接层采用Sigmoid函,输出结果为配电网某馈线某日发生故障的概率,作为n=7时所提取的深度时序特征。
3.4样本构建,配电网馈线的固有属性特征、统计分析特征和深度时序特征构成了故障样本的特征集,馈线是否故障作为样本的标签,与特征集一起构成了配电网故障的样本集。所有数据特征构成一条数据样本为f{f1,f2…f15,f16,L},其中L为标签,表示馈线是否发生故障,最终的样本集为大小为3*353*365-60。
4)模型构建与训练,将构造好的特征集采用LightGBM模型进行训练,得到最终的线路故障概率。
4.1)样本集构建与划分,将样本集划分为训练集和测试集,训练集占总样本集的80%,其余为测试集。对训练集样出现正负样本不平衡的情况,采用上采样从少数类的样本中进行随机采样来增加新的样本,形成正负样本平衡的样本集,最终正负样本比例控制在50:1,再将测试集按4:1划分为训练集和验证集用于训练和验证模型的性能。
4.2)模型构建与训练,本发明采用LightGBM建立配电网10kV馈线故障预测模型的流程如图7所示,LightGBM是基于提升思想(Boosting)的决策树梯度提升集成算法,其算法过程如图8所示根据权重向量Di得到子集Si,Di由上一个弱分类器hi-1的训练结果决,各弱分类器顺序生成、相互依赖,通过提高错分样本的权重来减少误差。对LightGBM主要参数max_depth、num_leaves、learning_rate、n_estimators和early_stopping_rounds进行设置,P为故障预测模型最终的输出值。
4.3)模型验证与评价,使用事先划分好的测试集验证模型效果,评价效果使用ROC曲线,ROC曲线下方的面积AUC度量了算法的好坏,曲线越靠近左上角,AUC越大,分类效果越好。
4.4)模型优化,采用网格搜索算法对各LightGBM的主要参数进行最优搜索,选择最优参数组合,使ROC曲线下AUC的面积尽可能达到最大值,达到对模型进行优化的效果,并选择最优区别正负例预测概率阈值。由设备因素引发的馈线故障预测模型参数设置如表3所示。
表3设备因素故障LightGBM预测模型主要参数设置情况
根据ROC曲线上最靠近左上角的点是分类错误最少的位置,选择该模型判断是否发生故障的预测概率阈值为0.69,即若预测概率大于等于0.69则视为该线路将发生故障,若预测值小于0.69则视为该线路不会发生故障,至此,由设备因素引发的馈线故障预测模型建立完备。
将某地区天气因素引发的故障共3年210条馈线的故障相关数据,运行因素引发的故障共3年32条馈线故障相关的数据分别代入上述步骤,得到各自的预测模型,其模型参数设置如表4所示,并用划分的测试集验证模型效果。三个模型阈值选择情况与模型TPR,FPR,Percision如表5所示,最终预测结果如图9所示。图9中蓝色虚线为对角线。
表4 LightGBM的主要参数设置情况
表5模型最好阈值及该处的查全率率、误报率和查准率
Claims (6)
1.一种基于CNN和LightGBM的10kV馈线故障预测方法,其特征在于,主要包括以下步骤:
1)获取配电网原始数据,并对配电网原始数据进行预处理;
2)从配电网原始数据中提取特征,并构建特征集f{f 1,f 2…f 15, f 16,L};L为标签,表示馈线是否发生故障;其中,元素f 1、元素f 2、元素f 3、元素f 4、元素f 5、元素f 6为固有属性特征;元素f 7、元素f 8、元素f 9、元素f 10、元素f 11、元素f 12、元素f 13为统计分析特征;元素f 14、元素f 15、元素f 16为卷积神经网络CNN提取的深度时序特征;
配电网原始数据集特征参数包括固有属性特征、统计分析特征和深度时序特征;
所述固有属性特征包括线路性质f 1、线路长度f 2、所属变电站f 3、线路投运时间f 4、线路设备数量f 5和线路设备厂商f 6;
所述统计分析特征包括时间统计特征、气象统计特征和故障自相关性统计特征,其中时间统计特征包括夏季表征参数f 7和周末表征参数f 8;气象统计特征包括一天中气温的最大值f 9、一天中气温最小值f 10、湿度的最大值f 11和风速最大值f 12;故障的自相关特征包括馈线前一周发生故障的次数f 13;
获取深度时序特征的主要步骤如下:
2.1)构建深度时序特征样本集,主要步骤如下:
2.1.1)建立配电网馈线故障时序数据特征集F{A,V,T,H,W};A为电流,V为电压,T为气温,H为湿度,W为风速;
2.1.2)在时间上按照短期、中长期和长期以滑动窗口方式构建三个深度时序特征样本集,滑动窗口步长分别为d 1 、d 2 和d 3 ;
2.2)将滑动窗口内前n天的深度时序特征样本集归一化,建立故障画像;所述故障画像包括不存在故障的正常画像和存在故障的异常画像;正常画像记为0,异常画像记为1;
2.3)建立卷积神经网络CNN;所述卷积神经网络CNN包括输入层、若干隐含层和输出层;
2.4)将三个深度时序特征样本集分别输入到卷积神经网络CNN中,对卷积神经网络CNN进行训练,得到故障画像类别预测概率P 1、故障画像类别预测概率P 2和故障画像类别预测概率P 3;故障画像类别预测概率P 1、故障画像类别预测概率P 2和故障画像类别预测概率P 3分别记为深度时序特征f 14、深度时序特征f 15和深度时序特征f 16;
3)利用LightGBM算法建立配电网故障预测模型;
4)将配电网10kV馈线实时数据输入到配电网故障预测模型中,得到馈线故障预测结果。
2.根据权利要求1所述的一种基于CNN和LightGBM的10kV馈线故障预测方法,其特征在于:所述配电网原始数据包括气象数据和配电网信息数据;将配电网原始数据以馈线故障为标准,分为三类,分别表示不同类型馈线故障下x i年y i条馈线的原始数据;所述馈线故障包括运行因素引发的故障、设备故障引发的故障和天气因素引发的故障。
3.根据权利要求1所述的一种基于CNN和LightGBM的10kV馈线故障预测方法,其特征在于,对配电网原始数据进行预处理的步骤如下:
1.1)利用临插补法对配电网原始数据进行补全;
1.2)对配电网原始数据降噪。
4.根据权利要求1所述的一种基于CNN和LightGBM的10kV馈线故障预测方法,其特征在于:建立配电网故障预测模型的主要步骤如下:
3.1)对特征集f进行样本均衡处理,并将均衡样本后的特征集f划分为训练样本集和测试样本集;其中,馈线正常为负样本,馈线故障为正样本;正样本结果记为1,负样本结果记为0;
3.2)利用LightGBM算法建立配电网故障预测模型,并设置配电网故障预测模型参数,包括最大深度max_depth、叶子节点书num_leaves、步长learning_rate、迭代次数n_ estimators和early_stopping_rounds;early_stopping_rounds表示连续n次迭代后配电网故障预测模型误差没有减小,提前终止训练;
3.3)将训练样本集输入到配电网故障预测模型中,完成配电网故障预测模型的训练;
3.4)将测试样本集输入到训练后的配电网故障预测模型中,输出配电网故障预测概率P;
3.5)基于配电网故障预测概率P建立受试者工作特征曲线ROC,并计算特征曲线ROC和坐标轴所围成的面积AUC;判断AUC≥阈值是否成立,若成立,则结束迭代,若不成立,则重新设置配电网故障预测模型参数,并返回步骤3.3)。
5.根据权利要求4所述的一种基于CNN和LightGBM的10kV馈线故障预测方法,其特征在于,获取受试者工作特征曲线ROC的主要步骤如下:
3.5.1)建立坐标轴,其中横坐标为误报率FPR,纵坐标为查全率TPR;
误报率FPR如下所示:
(1)
式中,TP表示预测结果和真实值均为1;FP表示预测概率为0,真实值为1;FN表示预测概率为1,真实值为0;TN表示预测概率和真实值均为0;
查全率TPR如下所示:
(2)
3.5.2)将不同界限值δ输入到配电网故障预测模型中,得到配电网故障预测概率P;δϵ(0,1);配电网故障预测概率P≥δ时视预测结果为正样本的预测结果,反之,则视为负样本的预测结果;
3.5.3)匹配配电网故障预测结果和验证集真实结果,得到参数TP、参数FP、参数FN和参数TN的值,并计算得到误报率FPR和查全率TPR,从而得到受试者工作特征曲线ROC的点值。
6.根据权利要求4所述的一种基于CNN和LightGBM的10kV馈线故障预测方法,其特征在于,对特征集f进行样本均衡处理的方法为:
3.1.1)确定正样本和负样本的数量;
3.1.2)利用上采样方法对数量少的样本进行随机采样,使正样本和负样本数据均衡。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911038911.2A CN110929918B (zh) | 2019-10-29 | 2019-10-29 | 一种基于CNN和LightGBM的10kV馈线故障预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911038911.2A CN110929918B (zh) | 2019-10-29 | 2019-10-29 | 一种基于CNN和LightGBM的10kV馈线故障预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110929918A CN110929918A (zh) | 2020-03-27 |
CN110929918B true CN110929918B (zh) | 2023-05-02 |
Family
ID=69849750
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911038911.2A Active CN110929918B (zh) | 2019-10-29 | 2019-10-29 | 一种基于CNN和LightGBM的10kV馈线故障预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110929918B (zh) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111489034B (zh) * | 2020-04-10 | 2022-04-22 | 华中科技大学 | 一种油气储层渗透率预测模型的构建方法及其应用 |
CN111814870B (zh) * | 2020-07-06 | 2021-05-11 | 北京航空航天大学 | 一种基于卷积神经网络的cps模糊测试方法 |
CN112329973A (zh) * | 2020-08-20 | 2021-02-05 | 国网湖北省电力有限公司襄阳供电公司 | 一种基于图神经网络和区域网格化的时空负荷预测方法 |
CN112098760A (zh) * | 2020-09-21 | 2020-12-18 | 广东电网有限责任公司佛山供电局 | 基于卷积神经网络的电力故障信号检测方法 |
CN113066544B (zh) * | 2021-04-22 | 2022-04-15 | 重庆师范大学 | 基于CAA-Net与LightGBM的FVEP特征点检测方法 |
CN113033845B (zh) * | 2021-04-25 | 2023-01-24 | 广东电网有限责任公司江门供电局 | 一种电力传输资源共建共享的建设方法及装置 |
CN113901448A (zh) * | 2021-09-03 | 2022-01-07 | 燕山大学 | 基于卷积神经网络和轻量级梯度提升机的入侵检测方法 |
CN113591334A (zh) * | 2021-09-30 | 2021-11-02 | 深圳市景星天成科技有限公司 | 基于潮流调整的自愈电路馈线负荷率提高算法 |
CN114723078B (zh) * | 2022-03-17 | 2023-05-12 | 中核检修有限公司 | 故障诊断方法、装置、终端设备及存储介质 |
CN114925938B (zh) * | 2022-07-18 | 2022-10-04 | 武汉格蓝若智能技术有限公司 | 一种基于自适应svm模型的电能表运行状态预测方法、装置 |
WO2024039302A2 (en) * | 2022-08-18 | 2024-02-22 | Nanyang Technological University | Method and system for estimating a failure probability associated with objects |
CN117270482A (zh) * | 2023-11-22 | 2023-12-22 | 博世汽车部件(苏州)有限公司 | 基于数字孪生的汽车工厂控制系统 |
CN117471227B (zh) * | 2023-12-27 | 2024-03-15 | 深圳信测标准技术服务股份有限公司 | 汽车线束参数性能测试方法及测试系统 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102832970A (zh) * | 2012-08-06 | 2012-12-19 | 清华大学 | 一种电力线状态监测的方法及其装置 |
CN107992888A (zh) * | 2017-11-29 | 2018-05-04 | 深圳市智物联网络有限公司 | 工业设备运行状态的识别方法及服务器 |
CN109263271A (zh) * | 2018-08-15 | 2019-01-25 | 同济大学 | 一种基于大数据的印刷设备检测分析方法 |
CN109460004A (zh) * | 2018-10-26 | 2019-03-12 | 国网天津市电力公司 | 基于大数据的配电网故障预测方法及系统 |
CN109840690A (zh) * | 2018-12-29 | 2019-06-04 | 国网山东省电力公司日照供电公司 | 一种基于大数据的人工智能电力抢修系统及方法 |
CN110084424A (zh) * | 2019-04-25 | 2019-08-02 | 国网浙江省电力有限公司 | 一种基于lstm与lgbm的电力负荷预测方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10989838B2 (en) * | 2015-04-14 | 2021-04-27 | Utopus Insights, Inc. | Weather-driven multi-category infrastructure impact forecasting |
US10418811B2 (en) * | 2017-09-12 | 2019-09-17 | Sas Institute Inc. | Electric power grid supply and load prediction using cleansed time series data |
US10404362B1 (en) * | 2018-02-22 | 2019-09-03 | Subcom, Llc | Fault detection and reporting in line monitoring systems |
-
2019
- 2019-10-29 CN CN201911038911.2A patent/CN110929918B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102832970A (zh) * | 2012-08-06 | 2012-12-19 | 清华大学 | 一种电力线状态监测的方法及其装置 |
CN107992888A (zh) * | 2017-11-29 | 2018-05-04 | 深圳市智物联网络有限公司 | 工业设备运行状态的识别方法及服务器 |
CN109263271A (zh) * | 2018-08-15 | 2019-01-25 | 同济大学 | 一种基于大数据的印刷设备检测分析方法 |
CN109460004A (zh) * | 2018-10-26 | 2019-03-12 | 国网天津市电力公司 | 基于大数据的配电网故障预测方法及系统 |
CN109840690A (zh) * | 2018-12-29 | 2019-06-04 | 国网山东省电力公司日照供电公司 | 一种基于大数据的人工智能电力抢修系统及方法 |
CN110084424A (zh) * | 2019-04-25 | 2019-08-02 | 国网浙江省电力有限公司 | 一种基于lstm与lgbm的电力负荷预测方法 |
Non-Patent Citations (2)
Title |
---|
刘亚玲.基于深度学习的10kV馈线故障预测方法研究.中国优秀硕士学位论文全文数据库.2021,(第第1期期),C042-2111. * |
张小易等.利用气象等影响要素的电力系统故障元件识别与故障原因分析.华北电力大学学报(自然科学版).2014,第41卷(第06期),第14-21页. * |
Also Published As
Publication number | Publication date |
---|---|
CN110929918A (zh) | 2020-03-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110929918B (zh) | 一种基于CNN和LightGBM的10kV馈线故障预测方法 | |
CN111237134B (zh) | 一种基于GRA-LSTM-stacking模型的海上双馈风力发电机故障诊断方法 | |
CN110766212B (zh) | 用于历史数据缺失电场的超短期光伏功率预测方法 | |
CN110245745B (zh) | 基于集成双向循环神经网络的设备剩余使用寿命预测方法 | |
WO2015158198A1 (zh) | 一种基于神经网络自学习的故障识别方法及系统 | |
CN111476435B (zh) | 基于密度峰值的充电桩负荷预测方法 | |
CN110909802A (zh) | 一种基于改进的pso优化pnn平滑因子的故障分类方法 | |
CN112039687A (zh) | 一种面向小样本特征的基于改进生成对抗网络的故障诊断方法 | |
CN111178585A (zh) | 基于多算法模型融合的故障接报量预测方法 | |
CN114580706A (zh) | 基于gru-lstm神经网络的电力金融业务风控方法及系统 | |
CN111126820A (zh) | 反窃电方法及系统 | |
CN111179576B (zh) | 一种具有归纳学习的用电信息采集故障诊断方法及系统 | |
CN115758151A (zh) | 联合诊断模型建立方法、光伏组件故障诊断方法 | |
CN115859099A (zh) | 样本生成方法、装置、电子设备和存储介质 | |
CN104218571A (zh) | 一种风力发电设备的运行状态评估方法 | |
CN110794254A (zh) | 一种基于强化学习的配电网故障预测方法及系统 | |
CN115481726A (zh) | 一种工业机器人整机健康评估方法及系统 | |
US20220360084A1 (en) | Transient stability assessment method for an electric power system | |
CN110991689A (zh) | 基于LSTM-Morlet模型的分布式光伏发电系统短期预测方法 | |
CN117394529A (zh) | 基于scada的主配网合环倒供电控制条件辅助决策方法及系统 | |
CN112183877A (zh) | 一种基于迁移学习的光伏电站故障智能诊断方法 | |
CN116842337A (zh) | 基于LightGBM优选特征与COA-CNN模型的变压器故障诊断方法 | |
CN113902222B (zh) | 一种新能源智慧运维系统 | |
CN115293249A (zh) | 一种基于动态时序预测的电力系统典型场景概率预测方法 | |
CN114358116A (zh) | 油浸式变压器故障诊断方法、系统及可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |