CN110321934B - 一种检测用户用电异常数据的方法及系统 - Google Patents

一种检测用户用电异常数据的方法及系统 Download PDF

Info

Publication number
CN110321934B
CN110321934B CN201910507590.XA CN201910507590A CN110321934B CN 110321934 B CN110321934 B CN 110321934B CN 201910507590 A CN201910507590 A CN 201910507590A CN 110321934 B CN110321934 B CN 110321934B
Authority
CN
China
Prior art keywords
data
electricity
user
normalized
noise
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910507590.XA
Other languages
English (en)
Other versions
CN110321934A (zh
Inventor
高强
曹易
高易年
周雨涛
王曦
保剑
周瑾瑜
黄儒雅
田志峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Power Supply Bureau Co Ltd
Original Assignee
Shenzhen Power Supply Bureau Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Power Supply Bureau Co Ltd filed Critical Shenzhen Power Supply Bureau Co Ltd
Priority to CN201910507590.XA priority Critical patent/CN110321934B/zh
Publication of CN110321934A publication Critical patent/CN110321934A/zh
Application granted granted Critical
Publication of CN110321934B publication Critical patent/CN110321934B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Economics (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Public Health (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Evolutionary Biology (AREA)
  • Water Supply & Treatment (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Remote Monitoring And Control Of Power-Distribution Networks (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供一种检测用户用电异常数据的方法,包括获取一段时间范围内的用户用电数据;将用户用电数据处理成符合正态分布曲线的数据点,并采用最小二乘法对数据点进行曲线拟合来设置距离阈值;将用户用电数据处理成规范化用电数据后形成用户数据集,并采用K‑means算法聚类计算,且进一步通过满足与聚类中心之间的欧氏距离大于等于所设置的距离阈值的规范化用电数据作为噪声点对聚类计算中的聚类中心进行优化调整,直至聚类中心不发生变化为止;将满足噪声点数量大于预设限值的聚类中心的数据集合均作为异常用电数据集并输出。实施本发明,解决现有智能配用电大数据中数据质量差导致用电异常分析结果不准确的问题,提高检测的准确率,降低漏警率。

Description

一种检测用户用电异常数据的方法及系统
技术领域
本发明涉及电力数据检测技术领域,尤其涉及一种检测用户用电异常数据的方法及系统。
背景技术
随着云计算、大数据、人工智能等技术的快速发展,智能电网的建设速度逐渐加快。在此背景下,通过智能电网的配用电系统收集到的数据量爆发式增长,这些数据的有效使用,将非常有助于智能电网业务的精细化关联。
针对这个问题,当前已有较多的研究,并在电网业务的预测、分析中取得了较多的研究成果。如,文献【Zhang J,Zheng Y,Qi D.Deep spatio-temporal residual networksfor citywide crowd flows prediction[C]//AAAI,2017.】采用深度学习算法,将电网用电数据建模为循环神经网络,实现了电网用电量的预测和分析;又如,文献【赵腾,张焰,张东霞.智能配电网大数据应用技术与前景分析[J].电网技术,2014,38(12):3305-3312.】针对当前研究对用电量的预测不准确问题,将互信息技术引入到算法中,有效提升了随机森林算法对用电量的预测效果;又如,文献【盛立锃,曾喆昭,李莎.基于代数多项式模型的用电量预测研究[J].电力科学与技术学报,2015(1):34-40.】针对已有基于神经网络的电力需求预测模型效率低的问题,将多项式拟合技术引入到现有模型中,有效提升了模型的预测效果;又如,文献【李婉华,陈宏,郭昆,等.基于随机森林算法的用电负荷预测研究[J].计算机工程与应用,2016,52(23):236-243.】采用随机森林算法预测的未来的电力需求,有效解决了电力公司的电量规划问题;又如,文献【刘洋均,王清心,丁家满.电网规划指标的相关性分析及融合算法[J].计算机工程与应用,2017,53(6):241-245.】针对电网建设规划不准确的难题,采用概率推理模型,实现了电网建设的预测和规划;又如,文献【Bianco V,Manca O,Nardini S.Linear regression models to forecast electricityconsumption in Italy[J].Energy Sources Part B Economics Planning&Policy,2013,8(1):86-93.】采用线性回归理论,解决了电量使用预测不准确的问题。文献【Arisoy I,Ozturk I.Estimating industrial and residential electricity demand in Turkey:atime varying parameter approach[J].Energy,2014,66(4):959-964.】采用时间序列理论,挖掘了电量消费之间的关联关系,有效提升了算法的效率;又如,文献【Pappas S S,Ekonomou L,Karamousantas D C,etal.Electricity demand loads modeling usingAutoRegressive Moving Average(ARMA)models[J].Energy,2008,33(9):1353-1360.】采用自回归综合移动平均模型,对传统的时间序列理论进行了有效的改进,成果应用到电量使用预测问题中;又如,文献【Wang Y,Wang J,Zhao G,et al.Application of residualmodification approach in seasonal ARIMAfor electricity demand forecasting:acase study of China[J].Energy Policy,2012,48(3):284-294.】将ARIMA应用到中国的季节性电量使用预测问题中,取得了较好的效果。
通过对上述已有研究文献分析可知,虽然已有研究在电力数据的预测、分析方面,已经取得了较多的研究成果,但是由于各个配电网系统采集的电量数据存在噪声,导致数据分析结果容易受到异常数据的影响,使数据分析结果的准确率不高。
因此,亟需一种检测用户用电异常数据的方法,能够解决现有智能配用电大数据中数据质量差导致用电异常分析结果不准确的问题,提高了异常数据检测的准确率,降低了异常数据的漏警率。
发明内容
本发明实施例所要解决的技术问题在于,提供一种检测用户用电异常数据的方法及系统,能够解决现有智能配用电大数据中数据质量差导致用电异常分析结果不准确的问题,提高了异常数据检测的准确率,降低了异常数据的漏警率。
为了解决上述技术问题,本发明实施例提供了一种检测用户用电异常数据的方法,所述方法包括以下步骤:
步骤S1、获取一段时间范围内的用户用电数据;
步骤S2、将所获取到的用户用电数据处理成符合正态分布曲线的数据点,并采用最小二乘法对所述符合正态分布曲线的数据点进行曲线拟合来设置距离阈值;
步骤S3、将所获取到的用户用电数据处理成规范化用电数据后形成用户数据集,并采用K-means算法对所述用户数据集进行聚类计算,且进一步通过所述用户数据集中满足预定条件的规范化用电数据作为噪声点对所述用户数据集聚类计算中的聚类中心进行优化调整,直至每一噪声点所对应优化调整后的聚类中心不发生变化为止;其中,所述满足预定条件的规范化用电数据为规范化用电数据与聚类中心之间的欧氏距离大于等于所设置的距离阈值;
步骤S4、将满足噪声点数量大于预设限值的聚类中心的数据集合均作为已检测出的异常用电数据集并输出;
其中,所述步骤S2具体包括:
将所获取到的用户用电数据处理成符合正态分布曲线的数据点{xi,yi};其中,xi为所述用户用电数据对应的用电日期,yi为所述用户用电数据对应相邻两日用电量的变化值;i=1,2,3,...,N,N为数据点的数量,取正整数;
将最小二乘法对所述符合正态分布曲线的数据点{xi,yi}进行曲线拟合转换为求解基于最小二乘法的准则函数;其中,所述基于最小二乘法的准则函数表示为
Figure GDA0004066562210000041
μ为正态分布的随机变量的均值;A为每个数据点的权重系数;δ为标准差;
将求解所述基于最小二乘法的准则函数转换成求解一元二次最小二乘拟合函数;其中,所述一元二次最小二乘拟合函数表示为
Figure GDA0004066562210000042
即可对应表示为
Figure GDA0004066562210000043
采用仿真软件MATLAB中的多项式拟合函数命令polyfit求解出α1、α2、α3的值,并根据求解出α1、α2、α3的值,得到所述基于最小二乘法的准则函数J0的求解值,且进一步将所述基于最小二乘法的准则函数J0的求解值除以数量N,所得的商设置为距离阈值。
其中,所述步骤S3具体包括:
确定用电特征数据项,并根据所述用电特征数据项对所获取到的用户用电数据进行提取,且进一步以所述用电特征数据项组成为一行向量来表示每一个用户用电数据X=[x1,x2,...,xp];其中,p为所述用电特征数据项的总数;x1,x2,...,xp为从1至p个用电特征数据项所对应的数据;
将行向量表示的每一个用户用电数据X=[x1,x2,...,xp]均进行归一化处理成规范化用电数据输出,且进一步将每一个规范化用电数据均作为用户数据来形成用户数据集T={X1,X2,...,Xm};其中,每一个用户用电数据所形成的规范化用电数据中行向量表示用电特征数据项的每个用电特征数据的值均位于预定区间[0,1]内;X1,X2,...,Xm为1至m个用户用电数据归一化处理后所得的1至m个规范化用电数据;m为正整数;
从所述用户数据集T={X1,X2,...,Xm}中随机选择k条数据,作为K-means算法的初始聚类中心{C1,C2,...,Ck};k为正整数;
令S={S1,S2,...,Sk}的聚类为空,求解所述用电数据集T={X1,X2,...,Xm}中数据点Xi和其对应的聚类中心Cj的欧氏距离dij,并判定出数据点Xi和聚类中心Cj的欧氏距离dij大于等于所述距离阈值,则将数据点Xi判断为噪声点并加入到噪声集Xnoise中;反之,则将数据点Xi划分到dij最小的簇Sk中;
根据公式
Figure GDA0004066562210000051
计算新聚类中心C′i;其中,Si为S={S1,S2,...,Sk}中的第i个聚类集合,i=1,2,3,...,k;|Si|为聚类集合Si中数据点的数量;Xm为聚类集合Si中的数据点;
将所述噪声集Xnoise中的噪声点加入到距离最近的新聚类中心Ci',若新聚类中心Ci'发生变化,则继续执行优化;反之,则若新聚类中心Ci'不发生变化,算法结束。
其中,所述用电特征数据项包括:用户ID、日期、当天用电总量、当天上午8:00-12:00高峰时段的用电量、当天下午2:00-4:00高峰时段的用电量、当天晚间5:00-8:00高峰时段的用电量、当天晚间9:00-次日凌晨6:00低谷时段的用电量。
本发明实施例还提供了一种检测用户用电异常数据的系统,包括:
获取单元,用于获取一段时间范围内的用户用电数据;
设置单元,用于将所获取到的用户用电数据处理成符合正态分布曲线的数据点,并采用最小二乘法对所述符合正态分布曲线的数据点进行曲线拟合来设置距离阈值;
优化单元,用于将所获取到的用户用电数据处理成规范化用电数据后形成用户数据集,并采用K-means算法对所述用户数据集进行聚类计算,且进一步通过所述用户数据集中满足预定条件的规范化用电数据作为噪声点对所述用户数据集聚类计算中的聚类中心进行优化调整,直至每一噪声点所对应优化调整后的聚类中心不发生变化为止;其中,所述满足预定条件的规范化用电数据为规范化用电数据与聚类中心之间的欧氏距离大于等于所设置的距离阈值;
结果输出单元,用于将满足噪声点数量大于预设限值的聚类中心的数据集合均作为已检测出的异常用电数据集并输出;
其中,所述设置单元包括:
第一处理模块,用于将所获取到的用户用电数据处理成符合正态分布曲线的数据点{xi,yi};其中,xi为所述用户用电数据对应的用电日期,yi为所述用户用电数据对应相邻两日用电量的变化值;i=1,2,3,...,N,N为数据点的数量,取正整数;
第一拟合变换模块,用于将最小二乘法对所述符合正态分布曲线的数据点{xi,yi}进行曲线拟合转换为求解基于最小二乘法的准则函数;其中,所述基于最小二乘法的准则函数表示为
Figure GDA0004066562210000061
μ为正态分布的随机变量的均值;A为每个数据点的权重系数;δ为标准差;
第二拟合变换模块,用于将求解所述基于最小二乘法的准则函数转换成求解一元二次最小二乘拟合函数;其中,所述一元二次最小二乘拟合函数表示为
Figure GDA0004066562210000062
即可对应表示为
Figure GDA0004066562210000063
设置模块,用于采用仿真软件MATLAB中的多项式拟合函数命令polyfit求解出α1、α2、α3的值,并根据求解出α1、α2、α3的值,得到所述基于最小二乘法的准则函数J0的求解值,且进一步将所述基于最小二乘法的准则函数J0的求解值除以数量N,所得的商设置为距离阈值。
其中,所述优化单元包括:
提取模块,用于确定用电特征数据项,并根据所述用电特征数据项对所获取到的用户用电数据进行提取,且进一步以所述用电特征数据项组成为一行向量来表示每一个用户用电数据X=[x1,x2,...,xp];其中,p为所述用电特征数据项的总数;x1,x2,...,xp为从1至p个用电特征数据项所对应的数据;
第二处理模块,用于将行向量表示的每一个用户用电数据X=[x1,x2,...,xp]均进行归一化处理成规范化用电数据输出,且进一步将每一个规范化用电数据均作为用户数据来形成用户数据集T={X1,X2,...,Xm};其中,每一个用户用电数据所形成的规范化用电数据中行向量表示用电特征数据项的每个用电特征数据的值均位于预定区间[0,1]内;X1,X2,...,Xm为1至m个用户用电数据归一化处理后所得的1至m个规范化用电数据;m为正整数;
聚类计算模块,用于从所述用户数据集T={X1,X2,...,Xm}中随机选择k条数据,作为K-means算法的初始聚类中心{C1,C2,...,Ck};k为正整数;
划分模块,用于令S={S1,S2,...,Sk}的聚类为空,求解所述用电数据集T={X1,X2,...,Xm}中数据点Xi和其对应的聚类中心Cj的欧氏距离dij,并判定出数据点Xi和聚类中心Cj的欧氏距离dij大于等于所述距离阈值,则将数据点Xi判断为噪声点并加入到噪声集Xnoise中;反之,则将数据点Xi划分到dij最小的簇Sk中;
重新聚类模块,用于根据公式
Figure GDA0004066562210000071
计算新聚类中心C′i;其中,Si为S={S1,S2,...,Sk}中的第i个聚类集合,i=1,2,3,...,k;|Si|为聚类集合Si中数据点的数量;Xm为聚类集合Si中的数据点;
优化模块,用于将所述噪声集Xnoise中的噪声点加入到距离最近的新聚类中心C′i,若新聚类中心C′i发生变化,则继续执行优化;反之,则若新聚类中心C′i不发生变化,算法结束。
其中,所述用电特征数据项包括:用户ID、日期、当天用电总量、当天上午8:00-12:00高峰时段的用电量、当天下午2:00-4:00高峰时段的用电量、当天晚间5:00-8:00高峰时段的用电量、当天晚间9:00-次日凌晨6:00低谷时段的用电量。
实施本发明实施例,具有如下有益效果:
本发明基于K-means算法对分析数据的质量要求较高的基础上,采用最小二乘法技术设置阈值对用户数据集进行划分来降低异常取值对K-means算法数据分析的影响,将噪声点数量大于预设限值的聚类中心的数据集合(即异常数据多的簇)均作为已检测出的异常用电数据集,从而能够解决现有智能配用电大数据中数据质量差导致用电异常分析结果不准确的问题,提高了异常数据检测的准确率,降低了异常数据的漏警率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,根据这些附图获得其他的附图仍属于本发明的范畴。
图1为本发明实施例提供的一种检测用户用电异常数据的方法的流程图;
图2为本发明实施例提供的一种检测用户用电异常数据的方法与基于传统K-means算法来检测用户用电异常数据的方法应用于场景中的准确率对比图;
图3为本发明实施例提供的一种检测用户用电异常数据的方法与基于传统K-means算法来检测用户用电异常数据的方法应用于场景中的漏警率对比图
图4为本发明实施例提供的一种检测用户用电异常数据的系统的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述。
如图1所示,为本发明实施例中,提供的一种检测用户用电异常数据的方法,所述方法包括以下步骤:
步骤S1、获取一段时间范围内的用户用电数据;
具体过程为,从用户用电数据库中,获取某年某月连续多天的用户用电数据,或者其它时间内的用户用电数据。可以理解的是,所阐述的一段时间范围内,可以根据实际需要在用户用电数据库中进行截取。
步骤S2、将所获取到的用户用电数据处理成符合正态分布曲线的数据点,并采用最小二乘法对所述符合正态分布曲线的数据点进行曲线拟合来设置距离阈值;
具体过程为,考虑到所有的聚类算法模型中,K-means算法具有线性计算复杂度,运算效率较高,已成为聚类算法中使用最广泛的算法之一,已成功应用到图像识别和数据挖掘的相关研究工作中。当数据量较大时,K-means算法相对于其它非线性计算复杂度的算法,仍然具有较好的可扩展性和执行效率。
虽然K-means算法具有上述优点,但是K-means算法对分析数据的质量要求较高。如果数据质量差,将严重影响K-means算法的执行效果。由于用户用电数据与经济环境和气候环境关联性较大,必然会存在一些异常取值。这些异常取值虽然不属于窃电行为,但却对K-means算法的数据聚类产生较大的影响。为了解决这个问题,拟采用最小二乘法技术设置阈值来降低异常取值对K-means算法数据分析的影响。
最小二乘法是一种数学优化技术。通过计算最小误差的平方和,最小二乘法可以得到数据集最佳匹配的函数。采用最小二乘法技术拟合用户用电数据曲线,从而获得用户用电量的变化情况。为了求解异常用电数据集,设置距离阈值ε=MSE;其中,MSE是指均方误差,计算方法如公式(1)所示,MSE的值越小,表示计算模型得到的结果越精确。
Figure GDA0004066562210000091
公式(1)中,N为数据点的数量,其中SSE是指误差平方和,计算方法如公式(2),该参数计算的是拟合数据
Figure GDA0004066562210000101
与原始数据yi对应点的误差平方和,其中,wi>0,SSE的取值越接近于0,说明模型选择和拟合的越好。
Figure GDA0004066562210000102
由公式(2)可知,如果计算SSE的取值,需要计算拟合数据
Figure GDA0004066562210000103
与原始数据yi对应点的误差的平方和,这一计算过程首先需要求解预测函数,之后基于预测函数值,求解拟合数据
Figure GDA0004066562210000104
另外,在大数据背景下,用户用电数据集比较大,如果逐个计算SSE,工作量较大,不便于实现。
因此,为了克服SSE计算工作量较大的问题,发明人提出采用曲线拟合技术求解MSE值,从而避免SSE的求解问题。
在本发明实施例中,采用曲线拟合技术求解MSE值,即采用基于正态分布的拟合曲线求解均方误差的具体步骤如下:
首先,将用户用电数据处理成符合正态分布曲线的数据点{xi,yi};其中,xi为用户用电数据对应的用电日期,yi为户用电数据对应相邻两日用电量的变化值;i=1,2,3,...,N,N为数据点的数量,取正整数;即在绘制二维曲线时,以用电日期作为横坐标,以相邻两日用电量的变化值作为纵坐标;
其次,将最小二乘法对符合正态分布曲线的数据点{xi,yi}进行曲线拟合转换为求解基于最小二乘法的准则函数;其中,基于最小二乘法的准则函数表示为
Figure GDA0004066562210000105
μ为正态分布的随机变量的均值;A为每个数据点的权重系数;δ为标准差;
然后,将求解基于最小二乘法的准则函数转换成求解一元二次最小二乘拟合函数;其中,令ex→y,则x→lny,使得基于最小二乘法的准则函数J0转换为一元二次最小二乘拟合函数
Figure GDA0004066562210000111
即可对应表示为
Figure GDA0004066562210000112
最后,采用仿真软件MATLAB中的多项式拟合函数命令polyfit求解出α1、α2、α3的值,并根据求解出α1、α2、α3的值,得到基于最小二乘法的准则函数J0的求解值,且进一步将基于最小二乘法的准则函数J0的求解值除以数量N,所得的商设置为距离阈值。
例如:已有数据:x=[0、0.3000、0.6000、0.9000、1.2000、1.5000、1.8000、2.1000、2.4000、2.7000、3.0000];y=[2.0000、2.3780、3.9440、7.3460、13.2320、22.2500、35.0480、52.2740、74.5760、102.6020、137.0000],在MATLAB主窗口中输入y1=polyfit(x,y,2)回车后,就可以得到一元二次函数系数α1、α2、α3的值;
根据α1、α2、α3的值对应求出一元二次最小二乘拟合函数J1的值,再得到基于最小二乘法的准则函数J0的值,最后将基于最小二乘法的准则函数J0的求解值除以数量N,即采用公式(1),所得的商设置为距离阈值ε。
步骤S3、将所获取到的用户用电数据处理成规范化用电数据后形成用户数据集,并采用K-means算法对所述用户数据集进行聚类计算,且进一步通过所述用户数据集中满足预定条件的规范化用电数据作为噪声点对所述用户数据集聚类计算中的聚类中心进行优化调整,直至每一噪声点所对应优化调整后的聚类中心不发生变化为止;其中,所述满足预定条件的规范化用电数据为规范化用电数据与聚类中心之间的欧氏距离大于等于所设置的距离阈值;
具体过程为,第一步,确定用电特征数据项,并根据用电特征数据项对所获取到的用户用电数据进行提取,且进一步以用电特征数据项组成为一行向量来表示每一个用户用电数据X=[x1,x2,...,xp];其中,p为用电特征数据项的总数;x1,x2,...,xp为从1至p个用电特征数据项所对应的数据;
在一个例子中,用电特征数据项包括用户ID、日期、当天用电总量、当天上午8:00-12:00高峰时段的用电量、当天下午2:00-4:00高峰时段的用电量、当天晚间5:00-8:00高峰时段的用电量、当天晚间9:00-次日凌晨6:00低谷时段的用电量。
第二步,因为用户用电特征数据的字段类别不同,导致各个数据字段的取值范围不同。如果不对数据进行规范化处理,容易导致取值范围较大的数据对模型的分析产生较大的影响,而取值范围较小的数据对模型的分析产生较小的影响,所以,这样的数据不能直接应用到聚类算法中。
因此,将行向量表示的每一个用户用电数据X=[x1,x2,...,xp]均进行归一化处理成规范化用电数据输出,且进一步将每一个规范化用电数据均作为用户数据来形成用户数据集T={X1,X2,...,Xm};其中,每一个用户用电数据所形成的规范化用电数据中行向量表示用电特征数据项的每个用电特征数据的值均位于预定区间[0,1]内;X1,X2,...,Xm为1至m个用户用电数据归一化处理后所得的1至m个规范化用电数据;m为正整数;
在一个例子中,基于各个用户用电特征数据项的特点,求解出各个用户用电特征数据项所对应数据的最大值max(xi)和最小值min(xi),使用公式(3),将每个特征数据的值域范围规范化到[0,1]区间,从而计算出便于进行聚类分析的规范化用电数据。公式(3)中,
Figure GDA0004066562210000121
所以,规范化用电数据X=[x1,x2,...,xp]之后,得到的用户用电数据表示为
Figure GDA0004066562210000122
Figure GDA0004066562210000123
第三步、从用户数据集T={X1,X2,...,Xm}中随机选择k条数据,作为K-means算法的初始聚类中心{C1,C2,...,Ck};k为正整数;
第四步、令S={S1,S2,...,Sk}的聚类为空,求解用电数据集T={X1,X2,...,Xm}中数据点Xi和其对应的聚类中心Cj的欧氏距离dij,并判定出数据点Xi和聚类中心Cj的欧氏距离dij大于等于距离阈值ε,则将数据点Xi判断为噪声点并加入到噪声集Xnoise中;反之,则将数据点Xi划分到dij最小的簇Sk中;其中,dij=||Xi-Cj||2
第五步、根据公式
Figure GDA0004066562210000131
计算新聚类中心C′i;其中,Si为S={S1,S2,...,Sk}中的第i个聚类集合,i=1,2,3,...,k;|Si|为聚类集合Si中数据点的数量;Xm为聚类集合Si中的数据点;
第六步、将噪声集Xnoise中的噪声点加入到距离最近的新聚类中心C′i,若新聚类中心C′i发生变化,则继续执行优化;反之,则若新聚类中心C′i不发生变化,算法结束。
步骤S4、将满足噪声点数量大于预设限值的聚类中心的数据集合均作为已检测出的异常用电数据集并输出。
具体过程为,如果聚类计算中某个簇内的异常数据较多,正常数据必定较少。反之,如果某个簇内的正常数据较多,异常数据较少。所以,进行性能分析时,将异常数据多(如噪声点数量大于预设限值3或其它数字)的簇,都设置为异常数据集。将正常数据多的簇,都设置为正常数据集。
对本发明实施例提供的检测用户用电异常数据的方法与基于传统K-means算法来检测用户用电异常数据的方法应用于场景中的准确率和漏警率进行对比,具体如下:
使用的数据来自某省电力公司的实际用电数据记录,该数据为835288个用户一个月的用电数据,其中28629条为异常数据,其余为正常的数据。
考虑到正常数据和异常数据数量相差较大,本发明采取分类型采样的思路,构建三个数据集进行实验。其中,对于正常数据类型的数据,采用欠采样技术,降低数据集规模,对于异常数据类型的数据,采用过采样技术,提高数据集规模。基于此,构造用电异常检测训练集和测试集,如下表1所示。
表1:
Figure GDA0004066562210000132
Figure GDA0004066562210000141
采用准确率、漏警率两个维度的指标进行性能分析。其中,准确率是指分类正确的数量占整个异常数据集数量的比例,漏警率是指没有被检测出来的异常数据占总的异常数据的比例。
考虑到K-means中参数K的取值不能太小,选择K的取值分别为4、5、6进行验证。在执行算法后,通过对分类结果数据进行分析可知,各个簇内的数据特征比较相似。如果某个簇内的异常数据较多,正常数据必定较少。反之,如果某个簇内的正常数据较多,异常数据较少。所以,进行性能分析时,本发明将异常数据多的簇,都设置为异常数据集。将正常数据多的簇,都设置为正常数据集。性能取值为K取不同值时的平均值。
算法的执行结果如图2和图3所示,通过分析实验结果可知,本发明算法相比于传统算法,提高了异常数据检测的准确率,降低了异常数据的漏警率。
如图4所示,为本发明实施例中,提供的一种检测用户用电异常数据的系统,包括:
获取单元10,用于获取一段时间范围内的用户用电数据;
设置单元20,用于将所获取到的用户用电数据处理成符合正态分布曲线的数据点,并采用最小二乘法对所述符合正态分布曲线的数据点进行曲线拟合来设置距离阈值;
优化单元30,用于将所获取到的用户用电数据处理成规范化用电数据后形成用户数据集,并采用K-means算法对所述用户数据集进行聚类计算,且进一步通过所述用户数据集中满足预定条件的规范化用电数据作为噪声点对所述用户数据集聚类计算中的聚类中心进行优化调整,直至每一噪声点所对应优化调整后的聚类中心不发生变化为止;其中,所述满足预定条件的规范化用电数据为规范化用电数据与聚类中心之间的欧氏距离大于等于所设置的距离阈值;
结果输出单元40,用于将满足噪声点数量大于预设限值的聚类中心的数据集合均作为已检测出的异常用电数据集并输出。
其中,所述设置单元20包括:
第一处理模块201,用于将所获取到的用户用电数据处理成符合正态分布曲线的数据点{xi,yi};其中,xi为所述用户用电数据对应的用电日期,yi为所述用户用电数据对应相邻两日用电量的变化值;i=1,2,3,...,N,N为数据点的数量,取正整数;
第一拟合变换模块202,用于将最小二乘法对所述符合正态分布曲线的数据点{xi,yi}进行曲线拟合转换为求解基于最小二乘法的准则函数;其中,所述基于最小二乘法的准则函数表示为
Figure GDA0004066562210000151
μ为正态分布的随机变量的均值;A为每个数据点的权重系数;δ为标准差;
第二拟合变换模块203,用于将求解所述基于最小二乘法的准则函数转换成求解一元二次最小二乘拟合函数;其中,所述一元二次最小二乘拟合函数表示为
Figure GDA0004066562210000152
即可对应表示为
Figure GDA0004066562210000153
设置模块204,用于采用仿真软件MATLAB中的多项式拟合函数命令polyfit求解出α1、α2、α3的值,并根据求解出α1、α2、α3的值,得到所述基于最小二乘法的准则函数J0的求解值,且进一步将所述基于最小二乘法的准则函数J0的求解值除以数量N,所得的商设置为距离阈值。
其中,所述优化单元30包括:
提取模块301,用于确定用电特征数据项,并根据所述用电特征数据项对所获取到的用户用电数据进行提取,且进一步以所述用电特征数据项组成为一行向量来表示每一个用户用电数据X=[x1,x2,...,xp];其中,p为所述用电特征数据项的总数;x1,x2,...,xp为从1至p个用电特征数据项所对应的数据;
第二处理模块302,用于将行向量表示的每一个用户用电数据X=[x1,x2,...,xp]均进行归一化处理成规范化用电数据输出,且进一步将每一个规范化用电数据均作为用户数据来形成用户数据集T={X1,X2,...,Xm};其中,每一个用户用电数据所形成的规范化用电数据中行向量表示用电特征数据项的每个用电特征数据的值均位于预定区间[0,1]内;X1,X2,...,Xm为1至m个用户用电数据归一化处理后所得的1至m个规范化用电数据;m为正整数;
聚类计算模块303,用于从所述用户数据集T={X1,X2,...,Xm}中随机选择k条数据,作为K-means算法的初始聚类中心{C1,C2,...,Ck};k为正整数;
划分模块304,用于令S={S1,S2,...,Sk}的聚类为空,求解所述用电数据集T={X1,X2,...,Xm}中数据点Xi和其对应的聚类中心Cj的欧氏距离dij,并判定出数据点Xi和聚类中心Cj的欧氏距离dij大于等于所述距离阈值,则将数据点Xi判断为噪声点并加入到噪声集Xnoise中;反之,则将数据点Xi划分到dij最小的簇Sk中;
重新聚类模块305,用于根据公式
Figure GDA0004066562210000161
计算新聚类中心C′i;其中,Si为S={S1,S2,...,Sk}中的第i个聚类集合,i=1,2,3,...,k;|Si|为聚类集合Si中数据点的数量;Xm为聚类集合Si中的数据点;
优化模块306,用于将所述噪声集Xnoise中的噪声点加入到距离最近的新聚类中心C′i,若新聚类中心C′i发生变化,则继续执行优化;反之,则若新聚类中心C′i不发生变化,算法结束。
其中,用电特征数据项包括:用户ID、日期、当天用电总量、当天上午8:00-12:00高峰时段的用电量、当天下午2:00-4:00高峰时段的用电量、当天晚间5:00-8:00高峰时段的用电量、当天晚间9:00-次日凌晨6:00低谷时段的用电量。
实施本发明实施例,具有如下有益效果:
本发明基于K-means算法对分析数据的质量要求较高的基础上,采用最小二乘法技术设置阈值对用户数据集进行划分来降低异常取值对K-means算法数据分析的影响,将噪声点数量大于预设限值的聚类中心的数据集合(即异常数据多的簇)均作为已检测出的异常用电数据集,从而能够解决现有智能配用电大数据中数据质量差导致用电异常分析结果不准确的问题,提高了异常数据检测的准确率,降低了异常数据的漏警率。
值得注意的是,上述系统实施例中,所包括的各个单元只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,所述的程序可以存储于一计算机可读取存储介质中,所述的存储介质,如ROM/RAM、磁盘、光盘等。
以上所揭露的仅为本发明较佳实施例而已,当然不能以此来限定本发明之权利范围,因此依本发明权利要求所作的等同变化,仍属本发明所涵盖的范围。

Claims (6)

1.一种检测用户用电异常数据的方法,其特征在于,所述方法包括以下步骤:
步骤S1、获取一段时间范围内的用户用电数据;
步骤S2、将所获取到的用户用电数据处理成符合正态分布曲线的数据点,并采用最小二乘法对所述符合正态分布曲线的数据点进行曲线拟合来设置距离阈值;
步骤S3、将所获取到的用户用电数据处理成规范化用电数据后形成用户数据集,并采用K-means算法对所述用户数据集进行聚类计算,且进一步通过所述用户数据集中满足预定条件的规范化用电数据作为噪声点对所述用户数据集聚类计算中的聚类中心进行优化调整,直至每一噪声点所对应优化调整后的聚类中心不发生变化为止;其中,所述满足预定条件的规范化用电数据为规范化用电数据与聚类中心之间的欧氏距离大于等于所设置的距离阈值;
步骤S4、将满足噪声点数量大于预设限值的聚类中心的数据集合均作为已检测出的异常用电数据集并输出;
其中,所述步骤S2具体包括:
将所获取到的用户用电数据处理成符合正态分布曲线的数据点{xi,yi};其中,xi为所述用户用电数据对应的用电日期,yi为所述用户用电数据对应相邻两日用电量的变化值;i=1,2,3,...,N,N为数据点的数量,取正整数;
将最小二乘法对所述符合正态分布曲线的数据点{xi,yi}进行曲线拟合转换为求解基于最小二乘法的准则函数;其中,所述基于最小二乘法的准则函数表示为
Figure FDA0004066562200000011
μ为正态分布的随机变量的均值;A为每个数据点的权重系数;δ为标准差;
将求解所述基于最小二乘法的准则函数转换成求解一元二次最小二乘拟合函数;其中,所述一元二次最小二乘拟合函数表示为
Figure FDA0004066562200000021
即可对应表示为
Figure FDA0004066562200000022
采用仿真软件MATLAB中的多项式拟合函数命令polyfit求解出α1、α2、α3的值,并根据求解出α1、α2、α3的值,得到所述基于最小二乘法的准则函数J0的求解值,且进一步将所述基于最小二乘法的准则函数J0的求解值除以数量N,所得的商设置为距离阈值。
2.如权利要求1所述的检测用户用电异常数据的方法,其特征在于,所述步骤S3具体包括:
确定用电特征数据项,并根据所述用电特征数据项对所获取到的用户用电数据进行提取,且进一步以所述用电特征数据项组成为一行向量来表示每一个用户用电数据X=[x1,x2,...,xp];其中,p为所述用电特征数据项的总数;x1,x2,...,xp为从1至p个用电特征数据项所对应的数据;
将行向量表示的每一个用户用电数据X=[x1,x2,...,xp]均进行归一化处理成规范化用电数据输出,且进一步将每一个规范化用电数据均作为用户数据来形成用户数据集T={X1,X2,...,Xm};其中,每一个用户用电数据所形成的规范化用电数据中行向量表示用电特征数据项的每个用电特征数据的值均位于预定区间[0,1]内;X1,X2,...,Xm为1至m个用户用电数据归一化处理后所得的1至m个规范化用电数据;m为正整数;
从所述用户数据集T={X1,X2,...,Xm}中随机选择k条数据,作为K-means算法的初始聚类中心{C1,C2,...,Ck};k为正整数;
令S={S1,S2,...,Sk}的聚类为空,求解所述用电数据集T={X1,X2,...,Xm}中数据点Xi和其对应的聚类中心Cj的欧氏距离dij,并判定出数据点Xi和聚类中心Cj的欧氏距离dij大于等于所述距离阈值,则将数据点Xi判断为噪声点并加入到噪声集Xnoise中;反之,则将数据点Xi划分到dij最小的簇Sk中;
根据公式
Figure FDA0004066562200000031
计算新聚类中心C′i;其中,Si为S={S1,S2,...,Sk}中的第i个聚类集合,i=1,2,3,...,k;|Si|为聚类集合Si中数据点的数量;Xm为聚类集合Si中的数据点;
将所述噪声集Xnoise中的噪声点加入到距离最近的新聚类中心C′i,若新聚类中心C′i发生变化,则继续执行优化;反之,则若新聚类中心C′i不发生变化,算法结束。
3.如权利要求2所述的检测用户用电异常数据的方法,其特征在于,所述用电特征数据项包括:用户ID、日期、当天用电总量、当天上午8:00-12:00高峰时段的用电量、当天下午2:00-4:00高峰时段的用电量、当天晚间5:00-8:00高峰时段的用电量、当天晚间9:00-次日凌晨6:00低谷时段的用电量。
4.一种检测用户用电异常数据的系统,其特征在于,包括:
获取单元,用于获取一段时间范围内的用户用电数据;
设置单元,用于将所获取到的用户用电数据处理成符合正态分布曲线的数据点,并采用最小二乘法对所述符合正态分布曲线的数据点进行曲线拟合来设置距离阈值;
优化单元,用于将所获取到的用户用电数据处理成规范化用电数据后形成用户数据集,并采用K-means算法对所述用户数据集进行聚类计算,且进一步通过所述用户数据集中满足预定条件的规范化用电数据作为噪声点对所述用户数据集聚类计算中的聚类中心进行优化调整,直至每一噪声点所对应优化调整后的聚类中心不发生变化为止;其中,所述满足预定条件的规范化用电数据为规范化用电数据与聚类中心之间的欧氏距离大于等于所设置的距离阈值;
结果输出单元,用于将满足噪声点数量大于预设限值的聚类中心的数据集合均作为已检测出的异常用电数据集并输出;
其中,所述设置单元包括:
第一处理模块,用于将所获取到的用户用电数据处理成符合正态分布曲线的数据点{xi,yi};其中,xi为所述用户用电数据对应的用电日期,yi为所述用户用电数据对应相邻两日用电量的变化值;i=1,2,3,...,N,N为数据点的数量,取正整数;
第一拟合变换模块,用于将最小二乘法对所述符合正态分布曲线的数据点{xi,yi}进行曲线拟合转换为求解基于最小二乘法的准则函数;其中,所述基于最小二乘法的准则函数表示为
Figure FDA0004066562200000041
μ为正态分布的随机变量的均值;A为每个数据点的权重系数;δ为标准差;
第二拟合变换模块,用于将求解所述基于最小二乘法的准则函数转换成求解一元二次最小二乘拟合函数;其中,所述一元二次最小二乘拟合函数表示为
Figure FDA0004066562200000042
即可对应表示为
Figure FDA0004066562200000043
设置模块,用于采用仿真软件MATLAB中的多项式拟合函数命令polyfit求解出α1、α2、α3的值,并根据求解出α1、α2、α3的值,得到所述基于最小二乘法的准则函数J0的求解值,且进一步将所述基于最小二乘法的准则函数J0的求解值除以数量N,所得的商设置为距离阈值。
5.如权利要求4所述的检测用户用电异常数据的系统,其特征在于,所述优化单元包括:
提取模块,用于确定用电特征数据项,并根据所述用电特征数据项对所获取到的用户用电数据进行提取,且进一步以所述用电特征数据项组成为一行向量来表示每一个用户用电数据X=[x1,x2,...,xp];其中,p为所述用电特征数据项的总数;x1,x2,...,xp为从1至p个用电特征数据项所对应的数据;
第二处理模块,用于将行向量表示的每一个用户用电数据X=[x1,x2,...,xp]均进行归一化处理成规范化用电数据输出,且进一步将每一个规范化用电数据均作为用户数据来形成用户数据集T={X1,X2,...,Xm};其中,每一个用户用电数据所形成的规范化用电数据中行向量表示用电特征数据项的每个用电特征数据的值均位于预定区间[0,1]内;X1,X2,...,Xm为1至m个用户用电数据归一化处理后所得的1至m个规范化用电数据;m为正整数;
聚类计算模块,用于从所述用户数据集T={X1,X2,...,Xm}中随机选择k条数据,作为K-means算法的初始聚类中心{C1,C2,...,Ck};k为正整数;
划分模块,用于令S={S1,S2,...,Sk}的聚类为空,求解所述用电数据集T={X1,X2,...,Xm}中数据点Xi和其对应的聚类中心Cj的欧氏距离dij,并判定出数据点Xi和聚类中心Cj的欧氏距离dij大于等于所述距离阈值,则将数据点Xi判断为噪声点并加入到噪声集Xnoise中;反之,则将数据点Xi划分到dij最小的簇Sk中;
重新聚类模块,用于根据公式
Figure FDA0004066562200000051
计算新聚类中心Ci';其中,Si为S={S1,S2,...,Sk}中的第i个聚类集合,i=1,2,3,...,k;|Si|为聚类集合Si中数据点的数量;Xm为聚类集合Si中的数据点;
优化模块,用于将所述噪声集Xnoise中的噪声点加入到距离最近的新聚类中”'心Ci,若新聚类中心Ci发生变化,则继续执行优化;反之,则若新聚类中心Ci不发生变化,算法结束。
6.如权利要求5所述的检测用户用电异常数据的系统,其特征在于,所述用电特征数据项包括:用户ID、日期、当天用电总量、当天上午8:00-12:00高峰时段的用电量、当天下午2:00-4:00高峰时段的用电量、当天晚间5:00-8:00高峰时段的用电量、当天晚间9:00-次日凌晨6:00低谷时段的用电量。
CN201910507590.XA 2019-06-12 2019-06-12 一种检测用户用电异常数据的方法及系统 Active CN110321934B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910507590.XA CN110321934B (zh) 2019-06-12 2019-06-12 一种检测用户用电异常数据的方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910507590.XA CN110321934B (zh) 2019-06-12 2019-06-12 一种检测用户用电异常数据的方法及系统

Publications (2)

Publication Number Publication Date
CN110321934A CN110321934A (zh) 2019-10-11
CN110321934B true CN110321934B (zh) 2023-05-12

Family

ID=68120931

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910507590.XA Active CN110321934B (zh) 2019-06-12 2019-06-12 一种检测用户用电异常数据的方法及系统

Country Status (1)

Country Link
CN (1) CN110321934B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111738364B (zh) * 2020-08-05 2021-05-25 国网江西省电力有限公司供电服务管理中心 一种基于用户负荷与用电参量相结合的窃电检测方法
CN112541016A (zh) * 2020-11-26 2021-03-23 南方电网数字电网研究院有限公司 用电异常检测方法、装置、计算机设备和存储介质
CN112765826B (zh) * 2021-01-27 2022-05-06 长沙理工大学 基于用电功率频率分布相对熵的室内大麻种植识别方法
CN113125903A (zh) * 2021-04-20 2021-07-16 广东电网有限责任公司汕尾供电局 线损异常检测方法、装置、设备及计算机可读存储介质
CN113343056A (zh) * 2021-05-21 2021-09-03 北京市燃气集团有限责任公司 一种用户用气量异常检测方法及装置
CN113449793A (zh) * 2021-06-28 2021-09-28 国网北京市电力公司 用电状态的确定方法及装置
CN117076991B (zh) * 2023-10-16 2024-01-02 云境商务智能研究院南京有限公司 治污设备用电异常监测方法、装置及计算机设备

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9595006B2 (en) * 2013-06-04 2017-03-14 International Business Machines Corporation Detecting electricity theft via meter tampering using statistical methods
CN104573713B (zh) * 2014-12-31 2017-12-26 天津弘源慧能科技有限公司 一种基于图像纹理特征的互感器红外图像识别方法
CN106131959B (zh) * 2016-08-11 2019-05-14 电子科技大学 一种基于Wi-Fi信号空间划分的两级定位方法
CN106649579A (zh) * 2016-11-17 2017-05-10 苏州航天系统工程有限公司 一种用于管网建模的时序数据清洗方法
CN106682079B (zh) * 2016-11-21 2020-06-05 云南电网有限责任公司电力科学研究院 一种基于聚类分析的用户用电行为检测方法
CN107220906B (zh) * 2017-05-31 2019-10-11 国网上海市电力公司 基于用电采集系统的多时间尺度用电异常分析方法
CN107249000B (zh) * 2017-07-06 2020-02-25 河南科技大学 一种移动用户异常行为检测方法
CN108664990B (zh) * 2018-03-29 2020-09-18 清华大学 综合熵方法和密度聚类方法的窃电检测方法及装置
CN109684673B (zh) * 2018-12-03 2023-03-24 三峡大学 一种电力系统暂态稳定结果的特征提取和聚类分析方法
CN109636667A (zh) * 2018-12-07 2019-04-16 国网江苏省电力有限公司扬州供电分公司 一种基于用户周用电特征的低压用户用电异常检测方法
CN109800801B (zh) * 2019-01-10 2020-12-01 浙江工业大学 基于高斯回归算法的K-Means聚类分析车道流量方法

Also Published As

Publication number Publication date
CN110321934A (zh) 2019-10-11

Similar Documents

Publication Publication Date Title
CN110321934B (zh) 一种检测用户用电异常数据的方法及系统
Fan et al. Forecasting short-term electricity load using hybrid support vector regression with grey catastrophe and random forest modeling
Bedi et al. Deep learning framework to forecast electricity demand
Wang et al. Clustering of electricity consumption behavior dynamics toward big data applications
Ge et al. Parameter estimation of a Gaussian mixture model for wind power forecast error by Riemann L-BFGS optimization
CN109255728B (zh) 混沌相空间优化重构的光伏发电功率神经网络预测法
Ding et al. Predicting short wind speed with a hybrid model based on a piecewise error correction method and Elman neural network
CN111460001B (zh) 一种配电网理论线损率评估方法及系统
CN112418476A (zh) 一种超短期电力负荷预测方法
CN111723982A (zh) 基于灰色-马尔可夫链的中长期电力负荷组合预测方法
CN116169670A (zh) 一种基于改进神经网络的短期非居民负荷预测方法及系统
CN110837934A (zh) 一种基于深度学习的智能电网短期住宅负荷预测方法
CN114594398A (zh) 储能锂离子电池数据预处理方法
CN108879656B (zh) 一种基于子抽样svr集成的短期电力负荷预测方法
Wang et al. Evsense: A robust and scalable approach to non-intrusive ev charging detection
Majidpour Time series prediction for electric vehicle charging load and solar power generation in the context of smart grid
CN111026741A (zh) 基于时间序列相似性的数据清洗方法及装置
Liu et al. Enhancing Short-Term Power Load Forecasting for Industrial and Commercial Buildings: A Hybrid Approach Using TimeGAN, CNN, and LSTM
CN116628488A (zh) 风电功率预测模型的训练方法、风电功率预测方法及设备
CN116401561A (zh) 一种基于局部时域特征的设备级运行状态序列的时间关联聚类方法
CN114676931A (zh) 一种基于数据中台技术的电量预测系统
Xu et al. NWP feature selection and GCN-based ultra-short-term wind farm cluster power forecasting method
Zhu et al. Wind Speed Short-Term Prediction Based on Empirical Wavelet Transform, Recurrent Neural Network and Error Correction
Dong et al. Image-based with peak load ensemble prediction system for demand response in smart grid
Hu et al. Short-term power load forecasting based on VMD-SSA-LSTM

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant