CN112257784A - 一种基于梯度提升决策树的窃电检测方法 - Google Patents
一种基于梯度提升决策树的窃电检测方法 Download PDFInfo
- Publication number
- CN112257784A CN112257784A CN202011141946.1A CN202011141946A CN112257784A CN 112257784 A CN112257784 A CN 112257784A CN 202011141946 A CN202011141946 A CN 202011141946A CN 112257784 A CN112257784 A CN 112257784A
- Authority
- CN
- China
- Prior art keywords
- data
- electricity stealing
- electricity
- labels
- missing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000005611 electricity Effects 0.000 title claims abstract description 106
- 238000001514 detection method Methods 0.000 title claims abstract description 64
- 238000003066 decision tree Methods 0.000 title claims abstract description 20
- 238000012549 training Methods 0.000 claims abstract description 30
- 238000005457 optimization Methods 0.000 claims abstract description 11
- 230000011218 segmentation Effects 0.000 claims abstract description 10
- 238000012360 testing method Methods 0.000 claims description 31
- 238000000034 method Methods 0.000 claims description 29
- 238000002790 cross-validation Methods 0.000 claims description 23
- 208000025174 PANDAS Diseases 0.000 claims description 12
- 208000021155 Paediatric autoimmune neuropsychiatric disorders associated with streptococcal infection Diseases 0.000 claims description 12
- 240000004718 Panda Species 0.000 claims description 12
- 235000016496 Panda oleosa Nutrition 0.000 claims description 12
- 238000011156 evaluation Methods 0.000 claims description 10
- 230000006870 function Effects 0.000 claims description 5
- 238000010276 construction Methods 0.000 claims description 3
- 238000007689 inspection Methods 0.000 claims description 3
- 230000006399 behavior Effects 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000001351 cycling effect Effects 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Economics (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Biology (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及一种基于梯度提升决策树的窃电检测方法。将用户的历史日用电量作为样本特征,让单一树模型根据优化目标自动筛选最优分割特征和分割阈值,并根据迭代次数构建多个树模型组成强分类器,完成窃电检测模型训练,而后通过训练后的窃电检测模型实现窃电检测。本发明能够实现正常用户和窃电用户的分类。
Description
技术领域
本发明涉及一种基于梯度提升决策树的窃电检测方法。
背景技术
窃电行为不仅会给电网公司带来较大的经济损失,而且会影响电网的安全稳定运行,因此,研究高准确率的窃电检测方法具有十分重要的意义。
传统的窃电检测主要依靠技术人员定期巡检或无人机拍摄等方式监测电表不仅效率低下,而且及时性差。随着硬件反窃电技术日趋完善,现在电表的安全性已极大提升,但在上传用户电表计量数据的通信环节仍存在篡改数据的可能。
现有的基于数据挖掘的窃电检测方法主要有三类:基于回归、基于聚类、基于分类。
基于回归的窃电检测方法主要结合负荷预测算法,利用历史用电数据训练回归模型,并预测未来一段时期的用电数据,此后通过实际用电数据和预测用电数据之间的偏差判断用户是否异常用电,该类方法受用户用电随机性影响较大。
基于聚类的窃电检测方法属于无监督学习,通过计算样本之间的距离将样本聚为多个类别,并根据样本与类簇之间的距离判断样本是否异常。该类方法不需要带有标签的样本,在样本标签缺乏的情况下,适用性较强。但聚类方法的参数设置主观性强,算法复杂程度高,且用户用电行为多样化,可能存在多个少数类群,使得基于聚类的窃电检测方法难以准确识别窃电用户。
窃电检测本质上是一个二元分类问题,但现有的基于分类的窃电检测方法大多没有考虑用电数据的缺失问题,对用电数据填充较敏感,会使检测结果出现较大差异,而电网中的用电数据缺失问题仍然比较严重,因此,现有方法难以应用于电网中的用户窃电检测。此外,一些基于分类的窃电检测方法受样本类别不平衡影响大,检测精度难以达到较高水平。
为了从数据层面鉴别窃电用户,本发明提出一种基于梯度提升决策树的窃电检测方法。该方法以树模型作为基分类器,基于所有样本特征和标签的对应关系,选择最优分割特征和分割阈值,并形成样本划分规则。此后通过集成学习的方式,将多个单一树模型依次迭代,构成强分类器实现正常用户和窃电用户的分类。
发明内容
本发明的目的在于提供一种基于梯度提升决策树的窃电检测方法,能够实现正常用户和窃电用户的分类。
为实现上述目的,本发明的技术方案是:一种基于梯度提升决策树的窃电检测方法,将用户的历史日用电量作为样本特征,让单一树模型根据优化目标自动筛选最优分割特征和分割阈值,并根据迭代次数构建多个树模型组成强分类器,完成窃电检测模型训练,而后通过训练后的窃电检测模型实现窃电检测。
在本发明一实施例中,若用户的历史日用电量存在缺失,则通过日用电量的缺失值填充方法,根据缺失电量前后数据的缺失情况填补缺失电量。
在本发明一实施例中,窃电检测模型训练过程中,采用网格搜索和K折交叉验证实现窃电检测模型的参数寻优。
在本发明一实施例中,该方法具体实现如下:
步骤S1、利用pandas库中read_csv操作读取原始数据集,其表示为(Name,X,Y),其中,Name表示用户名,由于Name不参与窃电检测模型训练,因此利用pandas库提供的drop操作,删除该列特征;X代表用电特征,其数值即为用户用电数据;Y代表标签,共有两类,1对应窃电用户,0对应正常用户;而后,分别划分用电特征和标签,并存储为变量名pd_features和pd_labels;
步骤S2、对pd_features进行缺失值填充;填充规则为:(1)若缺失值前后均有数据,则以缺失值前后均值填充;(2)若缺失值的前一天有数据,而缺失值的后一天没有数据,则以缺失值前一天的数据填充该缺失值;(3)若缺失值的前一天没有数据,而缺失值的后一天有数据,则以0值填充该缺失值;
步骤S3、划分训练集和测试集,训练集用于寻找最优参数,测试集用于最终检验;利用features=pd_features.values和labels=pd_labels.values分别将pd类型的特征和标签转化为数组类型,并通过数组提供的reshape(-1,1)操作,将labels的行数变为和features的行数一样,再通过numpy库提供的concatenate操作,将features和labels拼接,形成新的数组new_data,而后通过numpy库提供的random.shuffle操作,随机打乱数组的行顺序,使得正常样本和窃电样本基于各自比例均匀分布;最后通过数组的切片操作,取前80%的样本作为训练集train_data,后20%的样本作为测试集test_data;
步骤S4、通过网格搜索和K折交叉验证寻找窃电检测模型最优参数;对于训练集train_data,通过pandas库提供的DataFrame操作,将数组train_data转化为DataFrame类型的数据,存储为变量名pd_train_data;而后从sklearn库中导入KFold函数实现K折交叉验证,寻找窃电检测模型最优参数;
步骤S5、训练基于梯度提升决策树的窃电检测模型model;根据步骤S4寻找的最优参数,调用sklearn库中的GradientBoostingClassifier,并设置相应参数,完成窃电检测模型构建;然后划分训练集train_data的特征和标签分别为train_features、train_labels,并通过model.fit进行拟合,完成窃电检测模型的训练;
步骤S6、测试模型;划分测试集test_data的特征和标签分别为test_features、test_labels,并通过model.predict(test_features),输出预测标签pred;从sklearn库中的metrics模块调用f1_score,并应用于真实标签test_labels和预测标签pred,输出F1得分作为最终评价结果。
在本发明一实施例中,步骤S2中,缺失值填充公式具体如下:
在本发明一实施例中,步骤S2中,缺失值填充通过pandas库中的interpolate、fillna分别完成平均值和固定值填充。
在本发明一实施例中,步骤S4中,从sklearn库中导入KFold函数实现K折交叉验证,寻找窃电检测模型最优参数的具体实现过程如下:
首先,使用评价指标为F1得分,公式如下:
其中,TP是将正常用户分类正确的数目;FN是将正常用户分类错误的数目;FP是将窃电用户分类错误的数目;TN是将窃电用户分类正确的数目;fMetric1是召回率或检出率,表示所有窃电用户中实际被模型检出的比重;fMetric2是精确率,表示被模型检出的窃电用户占模型认为是窃电用户的比重;而F1是检出率和精确率的调和平均值,其值越大越好;
而后,调用sklearn库中的GradientBoostingClassifier,选择三个参数分别为迭代次数n_estimators、最大树深度max_depth、学习率learning_rate;参数寻优范围如下:
n_estimators=[2,5,10,20,30,40,50,60,70,80,90,100,120,140,160,180,200]
max_depth=[2,3,4,5,6,7,8,9,10]
learning_rate=[0.02,0.04,0.06,0.08,0.1,0.12,0.14,0.16,0.18,0.2]
最后,进行K折交叉验证寻找最优参数,具体如下:
1)通过循环使用K折交叉验证遍历n_estimators,以K次F1得分的平均值作为评估结果,选择最优的迭代次数;2)根据已选择的迭代次数,再次使用K折交叉验证遍历max_depth,选择最优树深度;3)根据已选择的迭代次数和最大树深度,再次使用K折交叉验证遍历learning_rate,选择最优学习率。
相较于现有技术,本发明具有以下有益效果:
本发明方法,适用于含有缺失值的样本以及不平衡样本的窃电检测;其主要优点如下:
梯度提升决策树以特征划分的方式完成分类,而不考虑单个样本的分布情况,有效降低样本缺失值填充对检测结果的影响,检测结果稳定。
梯度提升决策树以树模型作为弱分类器,通过生成多个分支将样本集合依次划分,分类规则多样化,能够适应不平衡样本的模型训练,检测精度高。
梯度提升决策树由多棵决策树依次迭代而成,通过网格搜索参数优化的方式,能够在保证窃电检出率不减小的前提下,设置较小的迭代次数,使得模型拟合程度更小,对于多数类正常样本的判断力加强,能够进一步降低模型的误检率。
附图说明
图1为本发明一种基于梯度提升树的窃电用户检测方法流程图。
具体实施方式
下面结合附图,对本发明的技术方案进行具体说明。
如图1所示,本发明提供了一种基于梯度提升决策树的窃电检测方法,将用户的历史日用电量作为样本特征,让单一树模型根据优化目标自动筛选最优分割特征和分割阈值,并根据迭代次数构建多个树模型组成强分类器,完成窃电检测模型训练,而后通过训练后的窃电检测模型实现窃电检测。若用户的历史日用电量存在缺失,则通过日用电量的缺失值填充方法,根据缺失电量前后数据的缺失情况填补缺失电量。窃电检测模型训练过程中,采用网格搜索和K折交叉验证实现窃电检测模型的参数寻优。
本发明一种基于梯度提升决策树的窃电检测方法,具体实现步骤如下:
第一步:利用pandas库中read_csv操作读取原始数据集,其表示为(Name,X,Y)。
其中,Name表示用户名,由于其不参与模型训练,利用pandas库提供的drop操作,删除该列特征。X代表用电特征,其数值即为用户用电数据。Y代表标签,共有两类,1对应窃电用户,0对应正常用户。然后,分别划分用电特征和标签,并存储为变量名pd_features、pd_labels。
第二步:对pd_features进行缺失值填充。填充规则为:(1)若缺失值前后均有数据,则以缺失值前后均值填充;(2)若缺失值的前一天有数据,而缺失值的后一天没有数据,则以缺失值前一天的数据填充该缺失值;(3)若缺失值的前一天没有数据,而缺失值的后一天有数据,则以0值填充该缺失值;
缺失值填充具体公式如下:
缺失值填充通过pandas库中的interpolate、fillna分别完成平均值和固定值填充。
第三步:划分训练集和测试集,训练集用于寻找最优参数,测试集用于最终检验。利用features=pd_features.values和labels=pd_labels.values分别将pd类型的特征和标签转化为数组类型,并通过数组提供的reshape(-1,1)操作,将labels的行数变为和features的行数一样,再通过numpy库提供的concatenate操作,将features和labels拼接,形成新的数组new_data。
对于new_data,通过numpy库提供的random.shuffle操作,随机打乱数组的行顺序,使得正常样本和窃电样本基于各自比例均匀分布。然后通过数组的切片操作,取前80%的样本作为训练集train_data,后20%的样本作为测试集test_data。
第四步:网格搜索和K折交叉验证寻找模型最优参数。对于训练集train_data,通过pandas库提供的DataFrame操作,将数组train_data转化为DataFrame类型的数据,存储为变量名pd_train_data。
然后从sklearn库中导入KFold函数实现K折交叉验证,本方法通过设置其参数n_splits=5,实现5折交叉验证。即该操作自动将训练集pd_train_data均匀分为5份,每次取其中4份用于训练模型,另1份用于测试模型,总共实现5次,输出5次评价指标结果。
本发明方法使用的评价指标为F1得分。公式如下所示:
其中,TP是将正常用户分类正确的数目;FN是将正常用户分类错误的数目;FP是将窃电用户分类错误的数目;TN是将窃电用户分类正确的数目;fMetric1是召回率或检出率,表示所有窃电用户中实际被模型检出的比重;fMetric2是精确率,表示被模型检出的窃电用户占模型认为是窃电用户的比重;而F1是检出率和精确率的调和平均值,其值越大越好;
而后,调用sklearn库中的GradientBoostingClassifier,选择三个参数分别为迭代次数n_estimators、最大树深度max_depth、学习率learning_rate;参数寻优范围如下:
n_estimators=[2,5,10,20,30,40,50,60,70,80,90,100,120,140,160,180,200]
max_depth=[2,3,4,5,6,7,8,9,10]
learning_rate=[0.02,0.04,0.06,0.08,0.1,0.12,0.14,0.16,0.18,0.2]
首先,通过循环使用5折交叉验证遍历n_estimators,其余参数默认,以5次F1得分的平均值作为评估结果,选择最优的迭代次数。然后,根据已选择的迭代次数,再次使用5折交叉验证遍历max_depth,其余参数默认,选择最优树深度。最后,根据已选择的迭代次数和最大树深度,再次使用5折交叉验证遍历learning_rate,其余参数默认,选择最优学习率。
本方法拟合的最优参数分别为n_estimators=20,max_depth=3,learning_rate=0.1。
第五步:训练基于梯度提升决策树的窃电检测模型model。根据第四步选择的最优参数,直接调用sklearn库中的GradientBoostingClassifier,并设置相应参数,完成模型构建。然后划分训练集train_data的特征和标签分别为train_features、train_labels,并通过model.fit进行拟合,完成模型的训练。
第六步:测试模型。划分测试集test_data的特征和标签分别为test_features、test_labels,并通过model.predict(test_features),输出预测标签pred。从sklearn库中的metrics模块调用f1_score,并应用于真实标签test_labels和预测标签pred,输出F1得分作为最终评价结果。
以上是本发明的较佳实施例,凡依本发明技术方案所作的改变,所产生的功能作用未超出本发明技术方案的范围时,均属于本发明的保护范围。
Claims (7)
1.一种基于梯度提升决策树的窃电检测方法,其特征在于,将用户的历史日用电量作为样本特征,让单一树模型根据优化目标自动筛选最优分割特征和分割阈值,并根据迭代次数构建多个树模型组成强分类器,完成窃电检测模型训练,而后通过训练后的窃电检测模型实现窃电检测。
2.根据权利要求1所述的一种基于梯度提升决策树的窃电检测方法,其特征在于,若用户的历史日用电量存在缺失,则通过日用电量的缺失值填充方法,根据缺失电量前后数据的缺失情况填补缺失电量。
3.根据权利要求1所述的一种基于梯度提升决策树的窃电检测方法,其特征在于,窃电检测模型训练过程中,采用网格搜索和K折交叉验证实现窃电检测模型的参数寻优。
4.根据权利要求1所述的一种基于梯度提升决策树的窃电检测方法,其特征在于,该方法具体实现如下:
步骤S1、利用pandas库中read_csv操作读取原始数据集,其表示为(Name,X,Y),其中,Name表示用户名,由于Name不参与窃电检测模型训练,因此利用pandas库提供的drop操作,删除该列特征;X代表用电特征,其数值即为用户用电数据;Y代表标签,共有两类,1对应窃电用户,0对应正常用户;而后,分别划分用电特征和标签,并存储为变量名pd_features和pd_labels;
步骤S2、对pd_features进行缺失值填充;填充规则为:(1)若缺失值前后均有数据,则以缺失值前后均值填充;(2)若缺失值的前一天有数据,而缺失值的后一天没有数据,则以缺失值前一天的数据填充该缺失值;(3)若缺失值的前一天没有数据,而缺失值的后一天有数据,则以0值填充该缺失值;
步骤S3、划分训练集和测试集,训练集用于寻找最优参数,测试集用于最终检验;利用features=pd_features.values和labels=pd_labels.values分别将pd类型的特征和标签转化为数组类型,并通过数组提供的reshape(-1,1)操作,将labels的行数变为和features的行数一样,再通过numpy库提供的concatenate操作,将features和labels拼接,形成新的数组new_data,而后通过numpy库提供的random.shuffle操作,随机打乱数组的行顺序,使得正常样本和窃电样本基于各自比例均匀分布;最后通过数组的切片操作,取前80%的样本作为训练集train_data,后20%的样本作为测试集test_data;
步骤S4、通过网格搜索和K折交叉验证寻找窃电检测模型最优参数;对于训练集train_data,通过pandas库提供的DataFrame操作,将数组train_data转化为DataFrame类型的数据,存储为变量名pd_train_data;而后从sklearn库中导入KFold函数实现K折交叉验证,寻找窃电检测模型最优参数;
步骤S5、训练基于梯度提升决策树的窃电检测模型model;根据步骤S4寻找的最优参数,调用sklearn库中的GradientBoostingClassifier,并设置相应参数,完成窃电检测模型构建;然后划分训练集train_data的特征和标签分别为train_features、train_labels,并通过model.fit进行拟合,完成窃电检测模型的训练;
步骤S6、测试模型;划分测试集test_data的特征和标签分别为test_features、test_labels,并通过model.predict(test_features),输出预测标签pred;从sklearn库中的metrics模块调用f1_score,并应用于真实标签test_labels和预测标签pred,输出F1得分作为最终评价结果。
6.根据权利要求4或5所述的一种基于梯度提升决策树的窃电检测方法,其特征在于,步骤S2中,缺失值填充通过pandas库中的interpolate、fillna分别完成平均值和固定值填充。
7.根据权利要求4所述的一种基于梯度提升决策树的窃电检测方法,其特征在于,步骤S4中,从sklearn库中导入KFold函数实现K折交叉验证,寻找窃电检测模型最优参数的具体实现过程如下:
首先,使用评价指标为F1得分,公式如下:
其中,TP是将正常用户分类正确的数目;FN是将正常用户分类错误的数目;FP是将窃电用户分类错误的数目;TN是将窃电用户分类正确的数目;fMetric1是召回率或检出率,表示所有窃电用户中实际被模型检出的比重;fMetric2是精确率,表示被模型检出的窃电用户占模型认为是窃电用户的比重;而F1是检出率和精确率的调和平均值,其值越大越好;
而后,调用sklearn库中的GradientBoostingClassifier,选择三个参数分别为迭代次数n_estimators、最大树深度max_depth、学习率learning_rate;参数寻优范围如下:
n_estimators=[2,5,10,20,30,40,50,60,70,80,90,100,120,140,160,180,200]
max_depth=[2,3,4,5,6,7,8,9,10]
learning_rate=[0.02,0.04,0.06,0.08,0.1,0.12,0.14,0.16,0.18,0.2]
最后,进行K折交叉验证寻找最优参数,具体如下:
1)通过循环使用K折交叉验证遍历n_estimators,以K次F1得分的平均值作为评估结果,选择最优的迭代次数;2)根据已选择的迭代次数,再次使用K折交叉验证遍历max_depth,选择最优树深度;3)根据已选择的迭代次数和最大树深度,再次使用K折交叉验证遍历learning_rate,选择最优学习率。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011141946.1A CN112257784A (zh) | 2020-10-22 | 2020-10-22 | 一种基于梯度提升决策树的窃电检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011141946.1A CN112257784A (zh) | 2020-10-22 | 2020-10-22 | 一种基于梯度提升决策树的窃电检测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112257784A true CN112257784A (zh) | 2021-01-22 |
Family
ID=74264808
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011141946.1A Pending CN112257784A (zh) | 2020-10-22 | 2020-10-22 | 一种基于梯度提升决策树的窃电检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112257784A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113011997A (zh) * | 2021-02-20 | 2021-06-22 | 上海电机学院 | 电网用户用电异常行为检测方法 |
CN113408676A (zh) * | 2021-08-23 | 2021-09-17 | 国网江西综合能源服务有限公司 | 一种结合云端与边端的窃电用户识别方法及装置 |
CN113673587A (zh) * | 2021-08-12 | 2021-11-19 | 国网湖北省电力有限公司电力科学研究院 | 一种家庭基础日用电量计算方法 |
CN114006735A (zh) * | 2021-10-19 | 2022-02-01 | 广州木链云科技有限公司 | 一种数据保护方法、装置、计算机设备和存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109345013A (zh) * | 2018-09-25 | 2019-02-15 | 广西电网有限责任公司电力科学研究院 | 一种配电用户用电行为预测方法 |
CN110458725A (zh) * | 2019-08-20 | 2019-11-15 | 国网福建省电力有限公司 | 一种基于xgBoost模型和Hadoop架构的窃电识别分析方法及终端 |
CN111160791A (zh) * | 2019-12-31 | 2020-05-15 | 国网北京市电力公司 | 一种基于gbdt算法及因素融合的异常用户识别方法 |
AU2020100630A4 (en) * | 2020-04-24 | 2020-06-04 | Kaplan, Umit Emrah MR | System and method for grade estimation using gradient boosted decesion tree based machine learning algorithims |
-
2020
- 2020-10-22 CN CN202011141946.1A patent/CN112257784A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109345013A (zh) * | 2018-09-25 | 2019-02-15 | 广西电网有限责任公司电力科学研究院 | 一种配电用户用电行为预测方法 |
CN110458725A (zh) * | 2019-08-20 | 2019-11-15 | 国网福建省电力有限公司 | 一种基于xgBoost模型和Hadoop架构的窃电识别分析方法及终端 |
CN111160791A (zh) * | 2019-12-31 | 2020-05-15 | 国网北京市电力公司 | 一种基于gbdt算法及因素融合的异常用户识别方法 |
AU2020100630A4 (en) * | 2020-04-24 | 2020-06-04 | Kaplan, Umit Emrah MR | System and method for grade estimation using gradient boosted decesion tree based machine learning algorithims |
Non-Patent Citations (4)
Title |
---|
于洪涛: "《网络行为分析与网络智慧管理》", 31 August 2020, 西安电子科技大学出版社 * |
何龙: "《深入理解XGBoost高效机器学习算法与进阶》", 31 January 2020, 机械工业出版社 * |
张玉蕾: "基于机器学习的非侵入式电力负荷监测及用户行为研究", 《中国优秀博硕士学位论文全文数据库(硕士)工程科技Ⅱ辑》 * |
段大高等: "《社交媒体内容安全挖掘技术研究》", 31 December 2019, 北京邮电大学出版社 * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113011997A (zh) * | 2021-02-20 | 2021-06-22 | 上海电机学院 | 电网用户用电异常行为检测方法 |
CN113673587A (zh) * | 2021-08-12 | 2021-11-19 | 国网湖北省电力有限公司电力科学研究院 | 一种家庭基础日用电量计算方法 |
CN113673587B (zh) * | 2021-08-12 | 2024-02-02 | 国网湖北省电力有限公司电力科学研究院 | 一种家庭基础日用电量计算方法 |
CN113408676A (zh) * | 2021-08-23 | 2021-09-17 | 国网江西综合能源服务有限公司 | 一种结合云端与边端的窃电用户识别方法及装置 |
CN114006735A (zh) * | 2021-10-19 | 2022-02-01 | 广州木链云科技有限公司 | 一种数据保护方法、装置、计算机设备和存储介质 |
CN114006735B (zh) * | 2021-10-19 | 2024-03-08 | 广州木链云科技有限公司 | 一种数据保护方法、装置、计算机设备和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112257784A (zh) | 一种基于梯度提升决策树的窃电检测方法 | |
CN113887616B (zh) | 一种epg连接数的实时异常检测方法 | |
CN105677791B (zh) | 用于分析风力发电机组的运行数据的方法和系统 | |
CN111507376B (zh) | 一种基于多种无监督方法融合的单指标异常检测方法 | |
CN106845717B (zh) | 一种基于多模型融合策略的能源效率评价方法 | |
CN111967512B (zh) | 一种异常用电检测方法、系统和存储介质 | |
CN111614491B (zh) | 一种面向电力监控系统安全态势评估指标选取方法及系统 | |
CN111738462B (zh) | 电力计量装置故障抢修主动服务预警方法 | |
CN111612651A (zh) | 一种基于长短期记忆网络的异常电量数据检测方法 | |
CN114090396A (zh) | 一种云环境多指标无监督异常检测和根因分析方法 | |
CN105471647B (zh) | 一种电力通信网故障定位方法 | |
CN113452018B (zh) | 一种电力系统备用不足风险场景辨识方法 | |
CN113112188B (zh) | 一种基于预筛选动态集成的电力调度监控数据异常检测方法 | |
CN112001409A (zh) | 一种基于K-means聚类算法的配电网线损异常诊断方法和系统 | |
CN113125903A (zh) | 线损异常检测方法、装置、设备及计算机可读存储介质 | |
CN111126445A (zh) | 一种面向智能电表海量数据的多步聚合负荷预测方法 | |
CN115758151A (zh) | 联合诊断模型建立方法、光伏组件故障诊断方法 | |
CN109543083A (zh) | 一种多元电网实时数据中异常数据的检测方法 | |
CN117674119A (zh) | 电网运行风险评估方法、装置、计算机设备和存储介质 | |
CN115617784A (zh) | 一种信息化配电的数据处理系统及其处理方法 | |
CN114021425A (zh) | 电力系统运行数据建模与特征选择方法、装置、电子设备和存储介质 | |
CN113191409A (zh) | 标签数据扩充与深度学习的居民异常用电行为检测方法 | |
CN114330440B (zh) | 基于模拟学习判别的分布式电源负荷异常识别方法及系统 | |
CN110349050A (zh) | 一种基于电网参数关键特征抽取的智能窃电判据方法及装置 | |
CN112256735B (zh) | 一种用电监测方法、装置、计算机设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210122 |