CN111612149A - 一种基于决策树的主网线路状态检测方法、系统及介质 - Google Patents

一种基于决策树的主网线路状态检测方法、系统及介质 Download PDF

Info

Publication number
CN111612149A
CN111612149A CN202010435922.0A CN202010435922A CN111612149A CN 111612149 A CN111612149 A CN 111612149A CN 202010435922 A CN202010435922 A CN 202010435922A CN 111612149 A CN111612149 A CN 111612149A
Authority
CN
China
Prior art keywords
decision tree
main network
network line
input data
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010435922.0A
Other languages
English (en)
Inventor
李恺
谭海波
王海元
解玉满
黄红桥
卜文彬
谈丛
彭潇
郭光�
刘谋海
陈浩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Corp of China SGCC
State Grid Hunan Electric Power Co Ltd
Metering Center of State Grid Hunan Electric Power Co Ltd
Original Assignee
State Grid Corp of China SGCC
State Grid Hunan Electric Power Co Ltd
Metering Center of State Grid Hunan Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Corp of China SGCC, State Grid Hunan Electric Power Co Ltd, Metering Center of State Grid Hunan Electric Power Co Ltd filed Critical State Grid Corp of China SGCC
Priority to CN202010435922.0A priority Critical patent/CN111612149A/zh
Publication of CN111612149A publication Critical patent/CN111612149A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/01Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01RMEASURING ELECTRIC VARIABLES; MEASURING MAGNETIC VARIABLES
    • G01R31/00Arrangements for testing electric properties; Arrangements for locating electric faults; Arrangements for electrical testing characterised by what is being tested not provided for elsewhere
    • G01R31/08Locating faults in cables, transmission lines, or networks
    • G01R31/088Aspects of digital computing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/06Electricity, gas or water supply

Abstract

本发明公开了一种基于决策树的主网线路状态检测方法、系统及介质,本发明的方法包括获取被测主网线路的N种输入数据,包括主网线路的线损率、关口计量表计走字、电流、电压、功率因数;将N种输入数据输入预先训练好的决策树分类模型得到对应的主网线路状态,主网线路状态包括正常、线损异常、负荷过低三类状态;本发明的系统及介质与本发明的方法完全对应。本发明能够自动、实时监控并准确识别主网线路状态,可用于主网线路线损异常、负荷过低的状态预警,能有效减少人工监控分析的工作,能够大大提高线损分析水平和线路管理工作效率,具有效率高、部署方便、投入成本低的优点。

Description

一种基于决策树的主网线路状态检测方法、系统及介质
技术领域
本发明涉及电网中的主网(输电网)的高压输电线路状态监测预警分析技术,具体涉及一种基于决策树的主网线路状态检测方法、系统及介质。
背景技术
近年来,在电网线路建设规模的不断增大、输电网线路日趋老化、国网公司总体降本增效的背景下,对主网线路进行状态监测预警是一项越来越重要的工作,同时主网线路具有又点多面广,涉及变电站与电厂,变电站与变电站和多个部门、多个区域等特点,同时各类输电网络潮流方向随机多变、不可预测,导致异常数据和正常数据的可区分度低,异常状态案例数据量相比正常用电数据少很多,造成数异常数据和正常数据严重不平衡等等,这给主网线路异常分析管理带来了很大的难度。
目前主网线路状态监控是采用人工监控手段,通过简单的逻辑判断实现对线路异常状态监控分析的常规方法。这种常规的数据分析方法严重依赖人工方式进行特征建模,不仅效率低下,无法快速适应异常用电行为的变化,导致对异常状态识别的准确率不高。同时常规的数据分析方法存在误判,仍需投入大量人工加以复核,导致异常状态识别的工作效率较低。此外,人工判别是否准确依赖工作人员对专业熟悉程度,对人员专业要求高,而目前电网各个公司对线路管理的专业能力参差不齐。因此,传统的人工监控手段采用简单的逻辑判断已不能满足对输电网异常分析,工作效率低、重复性高。为实现对主网线路状态进行自动、高效精准分类预警,考虑引入先进的人工智能算法以提高主网高压输电线路状态检测的准确度,已经成为一项亟待解决的关键技术问题。
发明内容
本发明要解决的技术问题:针对现有技术的上述问题,提供一种基于决策树的主网线路状态检测方法、系统及介质,本发明能够自动、实时监控并准确识别主网线路状态,可用于主网线路线损异常、负荷过低的状态预警,能有效减少人工监控分析的工作,能够大大提高线损分析水平和线路管理工作效率,具有效率高、部署方便、投入成本低的优点。
为了解决上述技术问题,本发明采用的技术方案为:
一种基于决策树的主网线路状态检测方法,实施步骤包括:
1)获取被测主网线路的N种输入数据,所述N种输入数据包括主网线路的线损率、关口计量表计走字、电流、电压、功率因数;
2)将N种输入数据输入预先训练好的决策树分类模型得到对应的主网线路状态,所述决策树分类模型被预先训练建立了N种输入数据、主网线路状态之间的映射关系,所述主网线路状态包括正常、线损异常、负荷过低三类状态。
可选地,所述线损率的计算函数表达式如下:
Figure BDA0002502262640000021
上式中,σ为线损率,α为供电量,β为售电量。
可选地,所述关口计量表计走字的计算函数表达式如下:
Figure BDA0002502262640000022
上式中,ω为关口计量表计走字,α为供电量,φ为互感器综合倍率。
可选地,步骤2)之前包括预先训练决策树分类模型的步骤,该步骤包括:
S1)构建训练样本集和测试样本集;
S2)将训练样本集作为当前样本集D,计算当前样本集D中各项属性的信息增益率;
S3)选取信息增益率最大的属性作为决策树的根节点的分裂属性,将当前样本集D中的分裂属性取值相同的样本形成决策树分支;
S4)判断决策树层级数是否达到预定阈值,如果尚未达到预设阈值则针对得到的每一个决策树分支,将决策树分支中的训练样本作为当前样本集合D,计算当前样本集D中各项属性的信息增益率,选取信息增益率最带的属性作为新的子节点的分裂属性,将当前样本集D中的分裂属性取值相同的样本形成新的决策树分支,跳转步骤S4);否则跳转步骤S5);
S5)利用测试样本集对决策树分类模型进行性能验证,如果性能验证通过,则判定决策树分类模型训练完成,否则跳转执行步骤S1)。
可选地,步骤S1)中构建训练样本集和测试样本集的详细步骤包括:
S1.1)获取被测主网线路的原始数据样本,所述原始数据样本包括被测主网线路在指定时间段内的电参量数据,包括供电量、售电量、电压、电流、功率因数、综合倍率;
S1.2)对原始数据样本剔除异常值、剔除冗余值、补全缺失值;
S1.3)根据原始数据样本进行属性构造计算出线损率、关口计量表计走字两种输入数据,对输入数据的数据样本进行数据规范化;
S1.4)进行属性规约以剔除多余的输入数据,得到包括主网线路的线损率、关口计量表计走字、电流、电压、功率因数的N种输入数据,针对每一种输入数据的数值,通过函数拟合得到的拟合函数来对输入数据中不符合拟合函数规约的数值进行数值修正;
S1.5)将输入数据和预设的人工推演异常数据进行综合,然后对所有的输入数据附加主网线路状态标签,并划分为训练样本集和测试样本集。
可选地,步骤S1.2)中剔除异常值时的异常值判定的函数表达式如下式所示:
Figure BDA0002502262640000031
上式中,X为输入数据,p表示异常值概率,μ表示输入数据X的期望值,n表示经交叉验证得到的超参数值,α表示概率分布函数系数且大于0;步骤S1.2)中补全缺失值具体是指针对某一天的丢失值按前一天、后一天同一小时的采样数据的平均值进行插值,且其函数表达式如下式所示:
Figure BDA0002502262640000032
上式中,
Figure BDA0002502262640000033
表示插值结果,xk表示待插值相邻的数据,k表示待插值数据相邻前后天数,k≠0。
可选地,步骤S2)中信息增益率的计算函数表达式如下:
Figure BDA0002502262640000034
上式中,Gainratio(A)表示属性A的信息增益率,Gain(A)为属性A的信息增益,Gain(D,a)为特征a对训练数据集D的信息增益;其中Gain(D,a)的计算函数表达式如下:
Figure BDA0002502262640000035
上式中,Ent(D)表示训练数据集D的信息熵,V表示训练数据集D上的V个不同特征值,|D|表示样本集合D的样本数,|Dt j|表示第j个特征值的样本集合,Ent(|Dt j|)表示第j个特征值的信息熵,Ent(D)的计算函数表达式如下:
Figure BDA0002502262640000036
上式中,p(k)表示当前样本集合D中选择分类k的概率,N为当前样本集合D中的属性类别个数。
此外,本发明还提供一种基于决策树的主网线路状态检测系统,包括:
数据输入程序单元,用于获取被测主网线路的N种输入数据,所述N种输入数据包括主网线路的线损率、关口计量表计走字、电流、电压、功率因数;
数据分析程序单元,用于将N种输入数据输入预先训练好的决策树分类模型得到对应的主网线路状态,所述决策树分类模型被预先训练建立了N种输入数据、主网线路状态之间的映射关系,所述主网线路状态包括正常、线损异常、负荷过低三类状态。
此外,本发明还提供一种基于决策树的主网线路状态检测系统,包括计算机设备,该计算机设备被编程或配置以执行所述基于决策树的主网线路状态检测方法的步骤,或者该计算机设备的存储器中存储有被编程或配置以执行所述基于决策树的主网线路状态检测方法的计算机程序。
此外,本发明还提供一种计算机可读存储介质,该计算机可读存储介质上存储有被编程或配置以执行所述基于决策树的主网线路状态检测方法的计算机程序。
和现有技术相比,本发明具有下述优点:
1、本发明基于决策树的主网线路状态检测方法通过获取被测主网线路的N种输入数据(主网线路的线损率、关口计量表计走字、电流、电压、功率因数),并将N种输入数据输入预先训练好的决策树分类模型得到对应的主网线路状态(正常、线损异常、负荷过低三类状态),能够自动、实时监控并准确识别主网线路状态,可用于主网线路线损异常、负荷过低的状态预警,能有效减少人工监控分析的工作,能够大大提高线损分析水平和线路管理工作效率,具有效率高、部署方便、投入成本低的优点。
2、本发明获取的被测主网线路的N种输入数据(主网线路的线损率、关口计量表计走字、电流、电压、功率因数)均可以从通过国家电网公司的营销系统中直接获取或根据获取的数据计算得到,数据来源易于获取,实施方便快捷,且便于集成。
附图说明
图1为本发明实施例方法的基本流程示意图。
图2为本发明实施例中训练决策树分类模型的流程示意图。
图3为本发明实施例中训练决策树分类模型的原理示意图。
图4为本发明实施例中构建训练样本集和测试样本集的流程示意图。
图5为本发明实施例中构建的为未优化的线路状态判别的决策树分类模型。
图6为本发明实施例中剪枝后的线路状态判别的决策树分类模型。
图7为根据本发明实例中决策树分类模型的混淆矩阵图。
图8为根据本发明实例中决策树分类模型的ROC曲线图。
具体实施方式
如图1所示,本实施例基于决策树的主网线路状态检测方法的实施步骤包括:
1)获取被测主网线路的N种输入数据,N种输入数据包括主网线路的线损率、关口计量表计走字、电流、电压、功率因数;
2)将N种输入数据输入预先训练好的决策树分类模型得到对应的主网线路状态,决策树分类模型被预先训练建立了N种输入数据、主网线路状态之间的映射关系,主网线路状态包括正常、线损异常、负荷过低三类状态。
本实施例中,线损率的计算函数表达式如下:
Figure BDA0002502262640000051
上式中,σ为线损率,α为供电量,β为售电量。
本实施例中,关口计量表计走字的计算函数表达式如下:
Figure BDA0002502262640000052
上式中,ω为关口计量表计走字,α为供电量,φ为互感器综合倍率。
如图2所示,本实施例步骤2)之前包括预先训练决策树分类模型的步骤,该步骤包括:
S1)构建训练样本集和测试样本集;
S2)将训练样本集作为当前样本集D,计算当前样本集D中各项属性的信息增益率;
S3)选取信息增益率最大的属性作为决策树的根节点的分裂属性,将当前样本集D中的分裂属性取值相同的样本形成决策树分支;
S4)判断决策树层级数是否达到预定阈值,如果尚未达到预设阈值则针对得到的每一个决策树分支,将决策树分支中的训练样本作为当前样本集合D,计算当前样本集D中各项属性的信息增益率,选取信息增益率最带的属性作为新的子节点的分裂属性,将当前样本集D中的分裂属性取值相同的样本形成新的决策树分支,跳转步骤S4);否则跳转步骤S5);
S5)利用测试样本集对决策树分类模型进行性能验证,如果性能验证通过,则判定决策树分类模型训练完成,否则跳转执行步骤S1)。
如图3和图4所示,本实施例步骤S1)中构建训练样本集和测试样本集的详细步骤包括:
S1.1)获取被测主网线路的原始数据样本,原始数据样本包括被测主网线路在指定时间段内的电参量数据,包括供电量、售电量、电压、电流、功率因数、综合倍率;作为一种示例,指定时间段内可为连续一个月、两个月或者三个月的数据,主要视数据量大小,数据越多对模型预测精度越有帮助;
S1.2)对原始数据样本剔除异常值、剔除冗余值、补全缺失值;
S1.3)根据原始数据样本进行属性构造计算出线损率、关口计量表计走字两种输入数据,对输入数据的数据样本进行数据规范化;
S1.4)进行属性规约以剔除多余的输入数据,得到包括主网线路的线损率、关口计量表计走字、电流、电压、功率因数的N种输入数据,针对每一种输入数据的数值,通过函数拟合得到的拟合函数(例如对数线性模型、线性回归等)来对输入数据中不符合拟合函数规约的数值进行数值修正;
S1.5)将输入数据和预设的人工推演异常数据进行综合,然后将输入数据和预设的人工推演异常数据进行综合,然后对所有的输入数据附加主网线路状态标签,并划分为训练样本集和测试样本集。通过将输入数据和预设的人工推演异常数据进行综合,可以利用专家经验构成推演得到的异常数据,解决数据不平衡的问题。本实施例中将所有的输入数据分为两部分,一部分作为训练数据,一部分模型验证数据,作为模型交叉验证用,两者比例为10:2,分别作为训练样本集和测试样本集。
本实施例中,步骤S1.2)中剔除异常值时的异常值判定的函数表达式如下式所示:
Figure BDA0002502262640000061
上式中,X为某一种输入数据,p表示异常值概率,μ表示输入数据X的期望值,n表示经交叉验证得到的超参数值,α表示概率分布函数系数且大于0;步骤S1.2)中补全缺失值具体是指针对某一天的丢失值按前一天、后一天同一小时的采样数据的平均值进行插值,且其函数表达式如下式所示:
Figure BDA0002502262640000062
上式中,
Figure BDA0002502262640000063
表示插值结果,xk表示待插值相邻的数据,k表示待插值数据相邻前后天数,k≠0。步骤S1.3)中数据规范化即归一化,本实施案例中电压、电流、关口走字、供售电量的值都进行如下式进行归一化。电力数据中存在相关性的维度用相同的归一化尺度,如上下网侧电量、供售电量,电流和电压。本实施例中数据规范化的幻术表达式如下:
Figure BDA0002502262640000064
上式中,X为某一种输入数据,max表示最大值,min表示最小值。需要说明的是,本实施例中部分电力特征数据如电压、功率因数有国家电力标准作为参考,这部分数据max和min为国家电力标准的上、下限。此外,部分属性也可以根据需要选择最小值min为零值,而不是该属性下的样本最小值。
本实施例中,步骤S2)中信息增益率的计算函数表达式如下:
Figure BDA0002502262640000065
上式中,Gainratio(A)表示属性A的信息增益率,Gain(A)为属性A的信息增益,Gain(D,a)为特征a对训练数据集D的信息增益;其中Gain(D,a)的计算函数表达式如下:
Figure BDA0002502262640000066
上式中,Ent(D)表示训练数据集D的信息熵,V表示训练数据集D上的V个不同特征值,|D|表示样本集合D的样本数,|Dt j|表示第j个特征值的样本集合,Ent(|Dt j|)表示第j个特征值的信息熵,Ent(D)的计算函数表达式如下:
Figure BDA0002502262640000071
上式中,p(k)表示当前样本集合D中选择分类k的概率,N为当前样本集合D中的属性类别个数。
如图4所示,构建训练样本集和测试样本集的过程中,为了针对主网线路状态中的异常(线损异常、负荷过低),在N种输入数据采集不足的情况下也可以根据需要进行模拟生成,然后利用采集的N种输入数据以及模拟生成的N种输入数据一起,然后对所有的输入数据附加主网线路状态标签,并划分为训练样本集和测试样本集。然后即可利用训练样本集进行决策树分类模型的建立和训练,训练完成后即可利用测试样本集(和训练样本集不同的新数据)对决策树分类模型进行试验验证,在准确率达到阈值后即可完成训练。否则,需要继续模拟生成异常数据(异常数据库)并进行迭代训练。通过结合异常数据和线路异常案例数据归纳推演得到更多的异常数据,即模拟生成异常数据,保障各类别的数据之间的平衡性。
本实施例中当前样本集D中的所有属性构成的未优化的线路状态判别的决策树分类模型如图5所示,树中的符号为线路三种状态,G为正常,L为负荷偏低,B为线损异常。通过步骤S4)剪枝处理优化后得出最优决策树层级数),最终得到的决策树分类模型如图6所示,通过剪枝处理优化能够提高决策树分类模型的效率和分类准确率。图7为本实施例中决策树分类模型的混淆矩阵图,从图可知,决策树模型对线路正常、负荷过低、线损异常三类预测正确率是88%,92%,84%;图8为本实施例中决策树分类模型的ROC曲线图,其中_曲线以下面积越大,说明模型性能越好,即AUC(area under curve)值越大,线损分析越准确,图中AUC值达到了0.93,说明该模型对状态分类分析的准确性。
综上所述,本实施例基于决策树的主网线路状态检测方法通过国家电网公司的营销系统获取主网线路负荷、电量、电气信息等数据,作为机器学习的训练数据,并对原始数据进行特征提取和异常数据预处理,包括剔除异常值数据以及模拟生成异常数据,解决被训练数据不平衡的问题。同时对训练数据进行状态分类,包括正常、线损异常、负荷过低三类状态。根据预处理之后的数据使用机器学习进行训练、迭代,并利用剪枝对决策树进行优化,直到决策树分类模型准确率达到预设阈值以上,最终输出决策树线路状态分类模型。通过实施本实施例基于决策树的主网线路状态检测方法能够自动、实时监控主网线路状态,实现高效预警,迅速判断线路状态,减少人工监控分析,大大提高线损分析水平和线路管理工作效率。
此外,本实施例还提供一种基于决策树的主网线路状态检测系统,包括:
数据输入程序单元,用于获取被测主网线路的N种输入数据,N种输入数据包括主网线路的线损率、关口计量表计走字、电流、电压、功率因数;
数据分析程序单元,用于将N种输入数据输入预先训练好的决策树分类模型得到对应的主网线路状态,决策树分类模型被预先训练建立了N种输入数据、主网线路状态之间的映射关系,主网线路状态包括正常、线损异常、负荷过低三类状态。
此外,本实施例还提供一种基于决策树的主网线路状态检测系统,包括计算机设备,其特征在于,该计算机设备被编程或配置以执行前述基于决策树的主网线路状态检测方法的步骤,或者该计算机设备的存储器中存储有被编程或配置以执行前述基于决策树的主网线路状态检测方法的计算机程序。
此外,本实施例还提供一种计算机可读存储介质,其特征在于,该计算机可读存储介质上存储有被编程或配置以执行前述基于决策树的主网线路状态检测方法的计算机程序。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上仅是本发明的优选实施方式,本发明的保护范围并不仅局限于上述实施例,凡属于本发明思路下的技术方案均属于本发明的保护范围。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理前提下的若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (10)

1.一种基于决策树的主网线路状态检测方法,其特征在于实施步骤包括:
1)获取被测主网线路的N种输入数据,所述N种输入数据包括主网线路的线损率、关口计量表计走字、电流、电压、功率因数;
2)将N种输入数据输入预先训练好的决策树分类模型得到对应的主网线路状态,所述决策树分类模型被预先训练建立了N种输入数据、主网线路状态之间的映射关系,所述主网线路状态包括正常、线损异常、负荷过低三类状态。
2.根据权利要求1所述的基于决策树的主网线路状态检测方法,其特征在于,所述线损率的计算函数表达式如下:
Figure FDA0002502262630000011
上式中,σ为线损率,α为供电量,β为售电量。
3.根据权利要求1所述的基于决策树的主网线路状态检测方法,其特征在于,所述关口计量表计走字的计算函数表达式如下:
Figure FDA0002502262630000012
上式中,ω为关口计量表计走字,α为供电量,φ为互感器综合倍率。
4.根据权利要求1所述的基于决策树的主网线路状态检测方法,其特征在于,步骤2)之前包括预先训练决策树分类模型的步骤,该步骤包括:
S1)构建训练样本集和测试样本集;
S2)将训练样本集作为当前样本集D,计算当前样本集D中各项属性的信息增益率;
S3)选取信息增益率最大的属性作为决策树的根节点的分裂属性,将当前样本集D中的分裂属性取值相同的样本形成决策树分支;
S4)判断决策树层级数是否达到预定阈值,如果尚未达到预设阈值则针对得到的每一个决策树分支,将决策树分支中的训练样本作为当前样本集合D,计算当前样本集D中各项属性的信息增益率,选取信息增益率最带的属性作为新的子节点的分裂属性,将当前样本集D中的分裂属性取值相同的样本形成新的决策树分支,跳转步骤S4);否则跳转步骤S5);
S5)利用测试样本集对决策树分类模型进行性能验证,如果性能验证通过,则判定决策树分类模型训练完成,否则跳转执行步骤S1)。
5.根据权利要求4所述的基于决策树的主网线路状态检测方法,其特征在于,步骤S1)中构建训练样本集和测试样本集的详细步骤包括:
S1.1)获取被测主网线路的原始数据样本,所述原始数据样本包括被测主网线路在指定时间段内的电参量数据,包括供电量、售电量、电压、电流、功率因数、综合倍率;
S1.2)对原始数据样本剔除异常值、剔除冗余值、补全缺失值;
S1.3)根据原始数据样本进行属性构造计算出线损率、关口计量表计走字两种输入数据,对输入数据的数据样本进行数据规范化;
S1.4)进行属性规约以剔除多余的输入数据,得到包括主网线路的线损率、关口计量表计走字、电流、电压、功率因数的N种输入数据,针对每一种输入数据的数值,通过函数拟合得到的拟合函数来对输入数据中不符合拟合函数规约的数值进行数值修正;
S1.5)将输入数据和预设的人工推演异常数据进行综合,然后对所有的输入数据附加主网线路状态标签,并划分为训练样本集和测试样本集。
6.根据权利要求5所述的基于决策树的主网线路状态检测方法,其特征在于,步骤S1.2)中剔除异常值时的异常值判定的函数表达式如下式所示:
Figure FDA0002502262630000021
上式中,X为输入数据,p表示异常值概率,μ表示输入数据X的期望值,n表示经交叉验证得到的超参数值,α表示概率分布函数系数且大于0;步骤S1.2)中补全缺失值具体是指针对某一天的丢失值按前一天、后一天同一小时的采样数据的平均值进行插值,且其函数表达式如下式所示:
Figure FDA0002502262630000022
上式中,
Figure FDA0002502262630000023
表示插值结果,xk表示待插值相邻的数据,k表示待插值数据相邻前后天数。
7.根据权利要求4所述的基于决策树的主网线路状态检测方法,其特征在于,步骤S2)中信息增益率的计算函数表达式如下:
Figure FDA0002502262630000024
上式中,Gainratio(A)表示属性A的信息增益率,Gain(A)为属性A的信息增益,Gain(D,a)为特征a对训练数据集D的信息增益;其中Gain(D,a)的计算函数表达式如下:
Figure FDA0002502262630000025
上式中,Ent(D)表示训练数据集D的信息熵,V表示训练数据集D上的V个不同特征值,|D|表示样本集合D的样本数,|Dt j|表示第j个特征值的样本集合,Ent(|Dt j|)表示第j个特征值的信息熵,Ent(D)的计算函数表达式如下:
Figure FDA0002502262630000031
上式中,p(k)表示当前样本集合D中选择分类k的概率,N为当前样本集合D中的属性类别个数。
8.一种基于决策树的主网线路状态检测系统,其特征在于包括:
数据输入程序单元,用于获取被测主网线路的N种输入数据,所述N种输入数据包括主网线路的线损率、关口计量表计走字、电流、电压、功率因数;
数据分析程序单元,用于将N种输入数据输入预先训练好的决策树分类模型得到对应的主网线路状态,所述决策树分类模型被预先训练建立了N种输入数据、主网线路状态之间的映射关系,所述主网线路状态包括正常、线损异常、负荷过低三类状态。
9.一种基于决策树的主网线路状态检测系统,包括计算机设备,其特征在于,该计算机设备被编程或配置以执行权利要求1~7中任意一项所述基于决策树的主网线路状态检测方法的步骤,或者该计算机设备的存储器中存储有被编程或配置以执行权利要求1~7中任意一项所述基于决策树的主网线路状态检测方法的计算机程序。
10.一种计算机可读存储介质,其特征在于,该计算机可读存储介质上存储有被编程或配置以执行权利要求1~7中任意一项所述基于决策树的主网线路状态检测方法的计算机程序。
CN202010435922.0A 2020-05-21 2020-05-21 一种基于决策树的主网线路状态检测方法、系统及介质 Pending CN111612149A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010435922.0A CN111612149A (zh) 2020-05-21 2020-05-21 一种基于决策树的主网线路状态检测方法、系统及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010435922.0A CN111612149A (zh) 2020-05-21 2020-05-21 一种基于决策树的主网线路状态检测方法、系统及介质

Publications (1)

Publication Number Publication Date
CN111612149A true CN111612149A (zh) 2020-09-01

Family

ID=72198798

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010435922.0A Pending CN111612149A (zh) 2020-05-21 2020-05-21 一种基于决策树的主网线路状态检测方法、系统及介质

Country Status (1)

Country Link
CN (1) CN111612149A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113033845A (zh) * 2021-04-25 2021-06-25 广东电网有限责任公司江门供电局 一种电力传输资源共建共享的建设方法及装置
CN113591393A (zh) * 2021-08-10 2021-11-02 国网河北省电力有限公司电力科学研究院 智能变电站的故障诊断方法、装置、设备和存储介质
CN114070707A (zh) * 2020-11-10 2022-02-18 北京市天元网络技术股份有限公司 一种互联网性能监控方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108733966A (zh) * 2017-04-14 2018-11-02 国网重庆市电力公司 一种基于决策树群的多维电能表现场状态检验方法
CN109614997A (zh) * 2018-11-29 2019-04-12 武汉大学 一种基于深度学习的窃电风险预测方法及装置
CN109977535A (zh) * 2019-03-22 2019-07-05 南方电网科学研究院有限责任公司 一种线损异常诊断方法、装置、设备及可读存储介质
CN110569867A (zh) * 2019-07-15 2019-12-13 山东电工电气集团有限公司 基于决策树算法的输电线路故障原因判别方法、介质及设备

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108733966A (zh) * 2017-04-14 2018-11-02 国网重庆市电力公司 一种基于决策树群的多维电能表现场状态检验方法
CN109614997A (zh) * 2018-11-29 2019-04-12 武汉大学 一种基于深度学习的窃电风险预测方法及装置
CN109977535A (zh) * 2019-03-22 2019-07-05 南方电网科学研究院有限责任公司 一种线损异常诊断方法、装置、设备及可读存储介质
CN110569867A (zh) * 2019-07-15 2019-12-13 山东电工电气集团有限公司 基于决策树算法的输电线路故障原因判别方法、介质及设备

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
HAIPING YU ET AL.: "Study on Distribution Network Line Level Evaluation Model Based on Dynamic Classification Combination", pages 159 - 163 *
李坤等: "基于SPSS Modeler的高损耗线路模式识别体系的研究", vol. 47, no. 11, pages 228 - 103 *
苗培仁等: "《"全能型"乡镇供电所标准化作业》", 合肥工业大学出版社, pages: 233 - 236 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114070707A (zh) * 2020-11-10 2022-02-18 北京市天元网络技术股份有限公司 一种互联网性能监控方法及系统
CN113033845A (zh) * 2021-04-25 2021-06-25 广东电网有限责任公司江门供电局 一种电力传输资源共建共享的建设方法及装置
CN113591393A (zh) * 2021-08-10 2021-11-02 国网河北省电力有限公司电力科学研究院 智能变电站的故障诊断方法、装置、设备和存储介质

Similar Documents

Publication Publication Date Title
CN108520357B (zh) 一种线损异常原因的判别方法、装置及服务器
CN111459700B (zh) 设备故障的诊断方法、诊断装置、诊断设备及存储介质
CN110097297A (zh) 一种多维度窃电态势智能感知方法、系统、设备及介质
CN111612149A (zh) 一种基于决策树的主网线路状态检测方法、系统及介质
CN109193650B (zh) 一种基于高维随机矩阵理论的电网薄弱点评估方法
CN116976682B (zh) 一种基于模糊算法的用电信息采集系统运行状态评估方法
CN109033513A (zh) 电力变压器故障诊断方法与电力变压器故障诊断装置
CN111610407A (zh) 基于朴素贝叶斯的电缆老化状态评估方法和装置
CN111931334A (zh) 一种用于评估电缆设备运行可靠性的方法及系统
CN110968703B (zh) 基于lstm端到端抽取算法的异常计量点知识库构建方法及系统
CN111612371A (zh) 一种基于层次分析法的智能电表质量评估方法
CN115438726A (zh) 一种基于数字孪生技术的设备寿命与故障类型预测方法及系统
CN115293257A (zh) 一种针对异常用电用户的检测方法及系统
CN116933010A (zh) 一种基于多源数据融合与深度学习的负载率分析评价方法和系统
CN113868948A (zh) 一种面向用户的动态阈值模型训练系统及方法
CN112926686B (zh) 基于brb和lstm模型的电力大数据用电异常检测方法及装置
CN114548493A (zh) 一种电能表电流过载预测方法与系统
CN113516192A (zh) 一种用户用电异动识别方法、系统、装置及存储介质
CN113538063A (zh) 基于决策树的电费异常数据分析方法、装置、设备及介质
CN112595918A (zh) 一种低压集抄故障的检测方法及装置
CN113554229A (zh) 三相电压不平衡异常检测方法及装置
CN110781206A (zh) 一种学习拆回表故障特征规则预测在运电能表是否故障的方法
CN115987692A (zh) 一种基于流量回溯分析的安全防护系统及方法
CN115146715A (zh) 用电安全隐患诊断方法、装置、设备及存储介质
CN115357764A (zh) 一种异常数据检测方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination