CN111461921B - 一种基于机器学习的负荷建模典型用户数据库更新方法 - Google Patents
一种基于机器学习的负荷建模典型用户数据库更新方法 Download PDFInfo
- Publication number
- CN111461921B CN111461921B CN202010240264.XA CN202010240264A CN111461921B CN 111461921 B CN111461921 B CN 111461921B CN 202010240264 A CN202010240264 A CN 202010240264A CN 111461921 B CN111461921 B CN 111461921B
- Authority
- CN
- China
- Prior art keywords
- typical
- user
- data
- load
- new
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 60
- 238000010801 machine learning Methods 0.000 title claims abstract description 46
- 238000004364 calculation method Methods 0.000 claims abstract description 16
- 230000002159 abnormal effect Effects 0.000 claims description 33
- 239000011159 matrix material Substances 0.000 claims description 26
- 238000012549 training Methods 0.000 claims description 18
- 238000012545 processing Methods 0.000 claims description 16
- 230000005611 electricity Effects 0.000 claims description 15
- 239000006185 dispersion Substances 0.000 claims description 12
- 230000006870 function Effects 0.000 claims description 10
- 102100039133 Integrator complex subunit 6 Human genes 0.000 claims description 9
- 101150014481 Ints6 gene Proteins 0.000 claims description 9
- 238000007781 pre-processing Methods 0.000 claims description 6
- 238000012706 support-vector machine Methods 0.000 claims description 6
- 238000010606 normalization Methods 0.000 claims description 5
- 238000012216 screening Methods 0.000 claims description 5
- 239000013642 negative control Substances 0.000 claims description 3
- 238000005070 sampling Methods 0.000 claims description 3
- 238000005516 engineering process Methods 0.000 abstract description 3
- 238000011835 investigation Methods 0.000 abstract description 3
- 238000004458 analytical method Methods 0.000 description 3
- 238000010276 construction Methods 0.000 description 3
- 238000007405 data analysis Methods 0.000 description 3
- 230000007547 defect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 230000006399 behavior Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000010248 power generation Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000001308 synthesis method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
- G06Q50/06—Electricity, gas or water supply
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Abstract
本发明公开了一种基于机器学习的负荷建模典型用户数据库更新方法,首先通过将多年调查统计和负荷控制系统总结归纳得到的负荷建模典型用户数据作为历史数据,运用机器学习的思路和方法,搭建机器学习模型;然后将获得的新用户数据输入机器学习模型,得到新用户所属行业分类:接着,运用历史数据及各典型用电行业聚类中心曲线,得到历史DB指标;最后将新用户数据引入计算,对历史负荷建模典型用户数据库进行更新优化。本方法在原有负荷建模技术的基础上引入机器学习方法,能够实现对典型用户数据库更新优化,且优化后典型用户数据库DB指标得到明显改善,具有良好的工程价值。
Description
技术领域
本发明属于电力系统分析与控制技术领域,特别涉及一种基于机器学习的负荷建模典型用户数据库更新方法。
背景技术
电力系统负荷模型对电网的运行、分析与控制有着重要的影响,但是建立准确的负荷模型一直以来就是电力系统分析控制领域公认的世界性难题,其关键的障碍就在于负荷特性自身的复杂性,这种复杂性的最突出表现则在于负荷特性的地域分散性和随机时变性,在线实时负荷建模则是解决负荷特性时变性的有效途径。
近年来,电网调度、配电自动化的快速建设与发展为负荷建模提供了丰富的基础数据信息,负荷建模已朝着工程实用化的方向发展。以湖南大学、河海大学为首的高校已经相继迈开负荷建模工程实用化的步伐,经过不断研究,结合多种软硬件技术和综合负荷建模方法理论诞生了诸多的负荷建模系统平台,如:负荷特性数据采集平台、变电站SCADA数据解析处理平台、故障录波数据解析处理平台、PMU数据解析平台、变电站综合负荷建模平台等。但相关平台或多或少存在建模功能单一、建模数据的来源不具备实时性、建模平台自动化程度低、操作步骤繁琐等诸多缺陷与不足:
随着智能配电网建设的快速推进,覆盖全电网范围、直达电网最末端(0.4kV低压端)电力用户和发电电源的新一代电力信息量测/采集系统为实现上述目标奠定了优越的基础条件,电力大数据和云计算/云终端技术则为实现上述目标提供了根本的技术支持。基于已建立的负荷建模理论方法、模型结构和实现技术体系,广域、完备、实时的负荷信息使得实现在线实时负荷建模目标成为可能。
发明内容
本发明所解决的技术问题是,针对现有技术的不足,提出一种基于机器学习的负荷建模典型用户数据库更新方法,可以有效实现建模数据库的自动更新和优化,建立更为准确的负荷建模平台。
为了实现上述技术目的,本发明的技术方案是,1、一种基于机器学习的负荷建模典型用户数据库更新方法,包括以下步骤:
1)利用调查统计和负荷控制系统,总结归纳出负荷建模典型用户数据库,得到用于负荷建模的典型用户相关负荷数据;
2)将负荷建模典型用户数据库中各用户数据作为历史数据,通过机器学习,得到用于用户行业分类的机器学习模型;
3)将获得的新用户数据输入机器学习模型,对新用户进行适用于负荷建模的用户行业分类,得到该用户所属行业类别;
4)运用历史数据及各典型用电行业聚类中心曲线,得到历史DBI(Davies-Bouldin指数)指标;再将新用户数据引入计算,结合其所属行业类别,得到新的DBI指标;根据得到历史DBI指标及新的DBI指标,判别新用户是否典型,对负荷建模典型用户数据库进行更新。
所述的基于机器学习的负荷建模典型用户数据库更新方法,所述步骤1)中,总结归纳出负荷建模典型用户数据库的过程包括:
1-1)从负荷控制系统中筛选用电容量较大且用电特性较稳定的用户作为典型用户;
1-2)从负荷控制系统中获得各典型用户日负荷功率曲线并进行预处理:对日负荷功率曲线中的异常数据进行识别并修正,对修正后的日负荷功率曲线数据进行标幺化处理;
1-3)采用模糊C均值方法对标幺化处理后的数据样本进行典型用电行业分类,得到n类典型用电行业聚类中心曲线,将典型用户相关负荷数据及典型用电行业聚类中心曲线入库,搭建负荷建模典型用户数据库。
所述的基于机器学习的负荷建模典型用户数据库更新方法,所述步骤1-2)中,对日负荷功率曲线进行预处理的过程为:
计算日负荷功率曲线中各采样时刻点的负荷功率的变化率并与预设阈值比较,若超出阈值范围则视为异常数据;对异常数据进行进行修正,是首先判断负荷曲线的数据缺失量和异常量是否小于10%,若是,则先将异常量置为0即置为缺失量,再以一元三点抛物线插值算法对缺失量进行插值拟合,否则直接删除该条负荷曲线;
然后取用户的功率最大值pkmax为基准值,根据公式一对原始数据样本进行标幺化处理,
p'ki=pki/pkmax 公式一
其中,pki为经过筛选和异常数据处理后第k条用户日负荷功率曲线第i个数据点的功率数据;p'ki为对pki进行归一化处理后第k条用户日负荷功率曲线第i个数据点的功率数据;
从而得到归一化的用户有功功率标幺值矩阵P'k=[p'k1,p'k2,...,p'ki,...,p'km]∈R1×m和变电站下属典型用户的有功功率标幺值矩阵P'=[P'1,P'2,...,P'k,...,P'N]T∈RN ×m,其中R为实数,R的上标表示相应矩阵的行、列数。
所述的基于机器学习的负荷建模典型用户数据库更新方法,所述步骤1-3)包括以下过程:
设定初始聚类中心矩阵Pu (0)=[Pu1 (0),L,Puj (0),L,Pun (0)]T∈Rn×m,为n类典型用户的m点有功功率标幺值的初始值;
通过公式二计算或更新隶属度矩阵:
其中,h∈[0,2]为加权指数;
得到第b轮迭代时,变电站下属第k个用户对于n类的隶属度Vk (b)=[vk1 (b),L,vkj (b),L,vkn (b)]∈R1×n和变电站下属N个用户对于n类的隶属度矩阵V(b)=[V1 (b),L,Vk (b),L,VN (b)]T∈RN×n;
通过公式三更新聚类中心:
得到第b+1轮迭代得到的n类典型用户的聚类中心矩阵Pu (b+1)=[Pu1 (b+1),L,Puj (b+1),L,Pun (b+1]T∈Rn×m直至则停止迭代;
根据各个用户相对于各个类的隶属度大小,进行典型用户分类,综合得到n类典型用户所包含的用户,以及n类典型行业等效日负荷功率曲线Cn=[Pu1 b,L,Puj b,L,Pum b]∈R1×m,以及最优聚类中心矩阵C=[C1,L,Cj,L,Cn]T∈Rn×m。
所述的基于机器学习的负荷建模典型用户数据库更新方法,步骤2)包括以下过程:
2-1)将典型用户基本负荷信息作为模型输入,包括用户名Mk、电压等级Uk、总变容量Sk及日负荷功率曲线数据P'k=[p'k1,p'k2,...,p'ki,...,p'km]∈R1×m;其中p'ki为经过预处理后第k条用户日负荷功率曲线第i个数据点的功率数据;,i=1,2,3,...,m,m为负控系统采集的数据点数目;得到归一化的用户xi=[Mk,Uk,Sk,P'k]∈R1×(m+3),即变电站下属第k个典型用户典型用户基本负荷信息,及变电站下属所有典型用户基本负荷信息x=[M,U,S,P']∈RN×(m+3);
2-2)从步骤1)中得到的典型用户相关负荷数据,包括n类典型行业等效日负荷功率曲线Cn=[Pu1 b,L,Puj b,L,Pum b]∈R1×m,以及最优聚类中心矩阵C=[C1,L,Cj,L,Cn]T∈Rn×m,作为模型输出;
2-3)以负荷建模典型用户数据库中历史数据作为训练样本,将典型用户基本负荷信息x作为模型输入,将该典型用户所对应的典型行业聚类中心曲线C作为模型输出,对机器学习算法模型进行训练,机器学习模型选用支持向量机模型
选用公式四作为回归函数:
式中,y=f(x)是新用户所对应的典型行业聚类中心曲线,x为新用户的输入向量,即新用户基本负荷信息,其中包括用户名Mk、电压等级Uk、总变容量Sk及日负荷功率曲线数据P'k=[p'k1,p'k2,...,p'ki,...,p'km]∈R1×m;s为训练样本个数;xi是第i个训练样本对应的输入向量,即第i个典型用户基本负荷信息;β为偏置值,是常数;K(xi,x)为核函数,采用公式五所示的满足Mercer条件的径向基函数,σ是核参数,表示覆盖宽度;
αi,为拉格朗日乘子,满足/>且αi≥0,/>αi,/>的取值满足:
yi是第i个训练样本对应的输出值,即典型用户所对应的典型行业聚类中心曲线Cn=[Pu1 b,L,Puj b,L,Pum b]∈R1×m;ε为惩罚因子,c为期望最大绝对误差;ε、c和σ的取值根据经验值确定,αi,b的取值通过传统SMO算法来优化确定;在确定αi,/>b参数后,代入公式四即得到分类表达式y=f(x)。
所述的基于机器学习的负荷建模典型用户数据库更新方法,所述步骤3)中,对新用户进行分类的方法是:
将新用户基本负荷信息,包括用户名Ml、电压等级Ul、总变容量Sl及日负荷功率曲线数据P'l=[p'l1,p'l2,...,p'li,...,p'lm]∈R1×m进行归整,得到归一化的用户xl=[Ml,Ul,Sl,P'l]∈R1×(m+3),将xl输入用于用户行业分类的机器学习模型中,形成新用户的模糊分类标记,即新用户的输入向量后,代入公式四得到的预测表达式,计算得到新用户所属的典型行业类别,即得到新用户所对应的典型行业聚类中心曲线yl=f(xl)。
所述的基于机器学习的负荷建模典型用户数据库更新方法,所述步骤3)中,在对新用户的数据输入机器学习模型前,还包括对数据进行预处理的步骤:
对新用户日负荷功率曲线中的异常数据进行识别,对异常数据进行修正,对修正后的日负荷功率曲线数据进行标幺化处理:首先判断负荷曲线的数据缺失量和异常量是否小于10%,若是,则先将异常量置为0即置为缺失量,再以一元三点抛物线插值算法对缺失量进行插值拟合,得到处理后的新用户日负荷功率曲线P'l=[p'l1,p'l2,...,p'li,...,p'lm]∈R1×m;否则认为新用户不具有代表性,直接删除该条负荷曲线。
所述的基于机器学习的负荷建模典型用户数据库更新方法,所述步骤4)中,对负荷建模典型用户数据库进行更新的方法如下:
通过DBI指标来判别新用户典型程度,即新用户的引入是否能够优化典型负荷数据库,以DBI指标越小为越好,计算公式如下:
其中,n表示聚类数目,DBI1、DBI2分别用来衡量历史DBI指标和引入新用户数据后的DBI指标,R1i、R2i分别用来衡量引入新用户数据前后第i类与第j类的相似度,计算公式如下:
其中,Mij为第i类中心与第j类中心的距离,计算公式如下:
其中Mij为第i类中心与第j类中心的距离;Ci为第i类的中心;adi为第i类的中心点Ci的第d个属性的值;p取1时表示1-范数,p取2时表示2-范数,即两个类中心的欧式距离。
其中,S1i、S2i分别用来衡量引入新用户数据前后第i个类中数据点的分散程度,计算公式如下:
其中,X1l、X2l分别为引入新用户数据前后第i类中第l个数据点;Ci为第i典型行业的聚类中心;T1i、T2i分别为引入新用户数据前后第i类中数据点的个数;q取1时Si为各点到中心的距离的均值,q取2时Si为各点到中心的距离的标准差,它们都可以用来衡量类内分散程度;
同时通过对比公式八所得历史DBI指标DBI1和引入新用户后新的DB指标DBI2,来判别新用户典型程度,即新用户的引入是否能够优化典型负荷数据库:若新DB指标DBI2小于历史DB指标DBI1,则说明新用户的引入将减小原典型行业聚类中心曲线的分散程度,即新数据具有代表性,将新用户加入负荷建模典型用户数据库;否则,则说明新用户的引入将增大原典型行业聚类中心曲线的分散程度,即新数据不具有代表性,则将新数据舍弃,从而实现对负荷建模典型用户数据库的更新。
本发明的技术效果在于,依托调查统计和负荷控制系统总结归纳出的负荷建模典型用户数据库,在大数据背景下引入机器学习模型,实现数据库的更新优化。优化结果与工程实际相符,能够为电网公司分析用户用电行为,建立更加准确完备的典型用户数据库支撑。具有良好的应用前景。
附图说明
图1为本发明流程示意图。
图2为典型用户数据库搭建流程图。
图3为机器学习模型训练流程图。
图4为新用户分类方法流程图。
图5为典型用户数据库更新方法流程图。
具体实施方式
下面结合附图对本发明作进一步说明:
本实施例的总体思路框图如图1所示,包括以下步骤:
1)利用调查统计和负荷控制系统,总结归纳出负荷建模典型用户数据库,得到用于负荷建模的典型用户相关负荷数据。
2)结合1)得到的负荷建模典型用户数据库,将其中各用户数据作为历史数据,运用机器学习的思路和方法,得到用于用户行业分类的机器学习模型,将获得的新用户数据输入机器学习模型,对新用户进行适用于负荷建模的用户行业分类,得到该用户所属行业类别。
3)运用历史数据及各典型用电行业聚类中心曲线,得到历史DBI(Davies-Bouldin指数)指标;再将新用户数据引入计算,结合其所属行业类别,得到新的DBI指标。
4)结合3)得到历史DB指标及新的DBI指标,判别新用户是否典型,对负荷建模典型用户数据库进行更新。
其中步骤1)包括以下步骤:
1-1)利用实地调查和统计综合的方法,从负荷控制系统中的各用户信息中筛选用电容量较大且用电特性较稳定的用户作为典型用户。一般来说,用电容量较大的用户可选择用电容量排在当地前列的用户,比方说按用电量排序,取前30%的用户为用电容量较大的用户。而用电特性较稳定是指没有出现长时间断电现象的用户,也可根据实际情况进行选择。
1-2)从负荷控制系统中获得各典型用户日负荷功率曲线,对日负荷功率曲线中的异常数据进行识别,对异常数据进行修正,对修正后的日负荷功率曲线数据进行标幺化处理;
计算日负荷功率曲线中各采样时刻点的负荷功率的变化率并与预设阈值比较,若超出阈值范围则视为异常数据;对异常数据进行进行修正,是首先判断负荷曲线的数据缺失量和异常量是否小于10%,若是,则先将异常量置为0即置为缺失量,再以一元三点抛物线插值算法对缺失量进行插值拟合,否则直接删除该条负荷曲线。
取用户的功率最大值pkmax为基准值,根据公式一对原始数据样本进行标幺化处理,
p'ki=pki/pkmax 公式一
得到归一化的用户有功功率标幺值矩阵P'k=[p'k1,p'k2,...,p'ki,...,p'km]∈R1 ×m和变电站下属典型用户的有功功率标幺值矩阵P'=[P'1,P'2,…,P'k,…,P'N]T∈RN×m。
1-3)采用模糊C均值方法对标幺化处理后的数据样本进行典型用电行业分类,得到n类典型用电行业聚类中心曲线,将典型用户相关负荷数据及典型用电行业聚类中心曲线入库,搭建负荷建模典型用户数据库。
设定初始聚类中心矩阵Pu (0)=[Pu1 (0),L,Puj (0),L,Pun (0)]T∈Rn×m,为n类典型用户的m点有功功率标幺值的初始值。
通过下式计算或更新隶属度矩阵:
得到第b轮迭代时,变电站下属第k个用户对于n类的隶属度Vk (b)=[vk1 (b),L,vkj (b),L,vkn (b)]∈R1×n和变电站下属N个用户对于n类的隶属度矩阵V(b)=[V1 (b),L,Vk (b),L,VN (b)]T∈RN×n;
通过下式更新聚类中心:
得到第b+1轮迭代得到的n类典型用户的聚类中心矩阵Pu (b+1)=[Pu1 (b+1),L,Puj (b+1),L,Pun (b+1]T∈Rn×m直至则停止迭代。
根据各个用户相对于各个类的隶属度大小,进行典型用户分类,综合得到n类典型用户所包含的用户,以及n类典型行业等效日负荷功率曲线Cn=[Pu1 b,L,Puj b,L,Pum b]∈R1×m,以及最优聚类中心矩阵C=[C1,L,Cj,L,Cn]T∈Rn×m。
如图3所示,所述步骤2)的过程为:
以负荷建模典型用户数据库中历史数据作为训练样本,将典型用户基本负荷信息作为模型输入,将该典型用户所对应的典型行业聚类中心曲线作为模型输出,对机器学习算法模型进行训练,采用支持向量机模型对新用户数据进行典型行业分类,具体为:
2-1)典型用户基本负荷信息包括用户名Mk、电压等级Uk、总变容量Sk及日负荷功率曲线数据P'k=[p'k1,p'k2,…,p'ki,…,p'km]∈R1×m,共同作为模型输入。其中pki为变电站下属第k个典型用户的第i点原始有功功率,i=1,2,3,...,m,m为负控系统采集的数据点数目;得到归一化的用户xi=[Mk,Uk,Sk,P'k]∈R1×(m+3),即变电站下属第k个典型用户典型用户基本负荷信息,以及变电站下属所有典型用户基本负荷信息x=[M,U,S,P']∈RN×(m+3)。
2-2)典型用户所对应的典型行业聚类中心曲线通过对标幺化处理后的典型用户日负荷功率曲线采用1-3)中模糊C均值聚类方法得到,包括n类典型行业等效日负荷功率曲线Cn=[Pu1 b,L,Puj b,L,Pum b]∈R1×m,以及最优聚类中心矩阵C=[C1,L,Cj,L,Cn]T∈Rn×m,作为模型输出。
2-3)本专利机器学习模型选用支持向量机(SVM)模型选用下式作为回归函数:
式中,y=f(x)是新用户所对应的典型行业聚类中心曲线,x为新用户的输入向量,即新用户基本负荷信息(包括用户名Mk、电压等级Uk、总变容量Sk及日负荷功率曲线数据P'k=[p'k1,p'k2,…,p'ki,…,p'km]∈R1×m);s为训练样本个数;xi是第i个训练样本对应的输入向量,即第i个典型用户基本负荷信息;b为偏置值,是常数;K(xi,x)为核函数,采用如式(8)所示的径向基函数(满足Mercer条件),σ是核参数,表示覆盖宽度;
αi,为拉格朗日乘子,满足/>且αi≥0,/>αi,/>的取值要满足:
yi是第i个训练样本对应的输出值,即典型用户所对应的典型行业聚类中心曲线Cn=[Pu1 b,L,Puj b,L,Pum b]∈R1×m;ε为惩罚因子,c为期望最大绝对误差;ε、c和σ的取值根据经验值确定,αi,b的取值通过SMO算法来优化确定;在确定αi,/>b参数后,代入公式四即得到分类表达式y=f(x)。
如图4所示,所述步骤3)的过程为:
对新用户日负荷功率曲线中的异常数据进行识别,对异常数据进行修正,对修正后的日负荷功率曲线数据进行标幺化处理;该过程中处理方法与典型用户负荷数据库搭建时曲线处理方式类似,判断负荷曲线的数据缺失量和异常量是否小于10%,若是,则先将异常量置为0即置为缺失量,再以一元三点抛物线插值算法对缺失量进行插值拟合,得到处理后的新用户日负荷功率曲线P'l=[p'l1,p'l2,…,p'li,…,p'lm]∈R1×m;否则认为新用户不具有代表性,直接删除该条负荷曲线。
将新用户基本负荷信息(包括用户名Ml、电压等级Ul、总变容量Sl及日负荷功率曲线数据P'l=[p'l1,p'l2,…,p'li,…,p'lm]∈R1×m)归整,得到归一化的用户xl=[Ml,Ul,Sl,P'l]∈R1×(m+3),将xl输入3)中搭建的机器学习模型中,形成新用户的模糊分类标记,即新用户的输入向量后,代入公式四得到的预测表达式,计算得到新用户所属的典型行业类别,即得到新用户所对应的典型行业聚类中心曲线yl=f(xl)。
如图5所示,所述步骤4)的过程为:
DBI是类内距离之和与类外距离的比值。类内对象距离越小,类间距离越大,DBI指标也越小,聚类效果越好。该指标用于评价聚类质量,使用该指标可用于判别新用户典型程度,即新用户的引入是否能够优化典型负荷数据库。其计算公式如下:
其中,n表示聚类数目,DBI1、DBI2分别用来衡量历史DBI指标和引入新用户数据后的DBI指标,R1i、R2i分别用来衡量引入新用户数据前后第i类与第j类的相似度,其计算公式如下:
其中,Mij为第i类中心与第j类中心的距离,其计算公式如下:
其中Mij为第i类中心与第j类中心的距离;Ci为第i类的中心;adi为第i类的中心点Ci的第d个属性的值;p取1时表示1-范数,p取2时表示2-范数(即两个类中心的欧式距离)。
其中,S1i、S2i分别用来衡量引入新用户数据前后第i个类中数据点的分散程度,计算公式如下:
其中,X1l、X2l分别为引入新用户数据前后第i类中第l个数据点;Ci为第i典型行业的聚类中心;T1i、T2i分别为引入新用户数据前后第i类中数据点的个数;q取1时Si为各点到中心的距离的均值,q取2时Si为各点到中心的距离的标准差,它们都可以用来衡量类内分散程度。
通过对比公式八所得历史DBI指标DBI1和引入新用户后新的DB指标DBI2,可判别新用户典型程度,即新用户的引入是否能够优化典型负荷数据库。若新DB指标DBI2小于历史DB指标DBI1,则说明新用户的引入将减小原典型行业聚类中心曲线的分散程度,即新数据具有代表性,将新用户加入负荷建模典型用户数据库;否则,则说明新用户的引入将增大原典型行业聚类中心曲线的分散程度,即新数据不具有代表性,则将新数据舍弃。从而实现了对负荷建模典型用户数据库的更新。
本发明采用的数据来源于湖南省电网公司在线实时负荷建模平台SQL2012数据库,并对其中负荷建模典型用户数据库中负荷曲线进行识别、筛选之后进行归一化处理;采用模糊C均值方法对标幺化处理后的数据样本进行典型用电行业分类,得到n类典型用电行业聚类中心曲线历史数据作为训练样本;将典型用户基本负荷信息(包括用户名、电压等级、总变容量及日负荷功率曲线标幺值数据)作为模型输入,将该典型用户所对应的典型行业聚类中心曲线作为模型输出,对机器学习算法模型进行训练,采用支持向量机模型对新用户数据进行典型行业分类,得到历史DB指标及引入新用户后的DB指标,判别新用户是否典型,实现对负荷建模典型用户数据库进行更新。
Claims (7)
1.一种基于机器学习的负荷建模典型用户数据库更新方法,其特征在于,包括以下步骤:
1)利用调查统计和负荷控制系统,总结归纳出负荷建模典型用户数据库,得到用于负荷建模的典型用户相关负荷数据;
2)将负荷建模典型用户数据库中各用户数据作为历史数据,通过机器学习,得到用于用户行业分类的机器学习模型;
3)将获得的新用户数据输入机器学习模型,对新用户进行适用于负荷建模的用户行业分类,得到该用户所属行业类别;
4)运用历史数据及各典型用电行业聚类中心曲线,得到历史DBI指标;再将新用户数据引入计算,结合其所属行业类别,得到新的DBI指标;根据得到历史DBI指标及新的DBI指标,判别新用户是否典型,对负荷建模典型用户数据库进行更新;
所述步骤4)中,对负荷建模典型用户数据库进行更新的方法如下:
通过DBI指标来判别新用户典型程度,即新用户的引入是否能够优化典型负荷数据库,以DBI指标越小为越好,计算公式如下:
其中,n表示聚类数目,DBI1、DBI2分别用来衡量历史DBI指标和引入新用户数据后的DBI指标,R1i、R2i分别用来衡量引入新用户数据前后第i类与第j类的相似度,计算公式如下:
其中,Mij为第i类中心与第j类中心的距离,计算公式如下:
其中Mij为第i类中心与第j类中心的距离;Ci为第i类的中心;adi为第i类的中心点Ci的第d个属性的值;p取1时表示1-范数,p取2时表示2-范数,即两个类中心的欧式距离;
其中,S1i、S2i分别用来衡量引入新用户数据前后第i个类中数据点的分散程度,计算公式如下:
其中,X1l、X2l分别为引入新用户数据前后第i类中第l个数据点;Ci为第i典型行业的聚类中心;T1i、T2i分别为引入新用户数据前后第i类中数据点的个数;q取1时Si为各点到中心的距离的均值,q取2时Si为各点到中心的距离的标准差,它们都可以用来衡量类内分散程度;
同时通过对比公式八所得历史DBI指标DBI1和引入新用户后新的DB指标DBI2,来判别新用户典型程度,即新用户的引入是否能够优化典型负荷数据库:若新DB指标DBI2小于历史DB指标DBI1,则说明新用户的引入将减小原典型行业聚类中心曲线的分散程度,即新数据具有代表性,将新用户加入负荷建模典型用户数据库;否则,则说明新用户的引入将增大原典型行业聚类中心曲线的分散程度,即新数据不具有代表性,则将新数据舍弃,从而实现对负荷建模典型用户数据库的更新。
2.根据权利要求1所述的基于机器学习的负荷建模典型用户数据库更新方法,其特征在于,所述步骤1)中,总结归纳出负荷建模典型用户数据库的过程包括:
1-1)从负荷控制系统中筛选用电容量较大且用电特性较稳定的用户作为典型用户;
1-2)从负荷控制系统中获得各典型用户日负荷功率曲线并进行预处理:对日负荷功率曲线中的异常数据进行识别并修正,对修正后的日负荷功率曲线数据进行标幺化处理;
1-3)采用模糊C均值方法对标幺化处理后的数据样本进行典型用电行业分类,得到n类典型用电行业聚类中心曲线,将典型用户相关负荷数据及典型用电行业聚类中心曲线入库,搭建负荷建模典型用户数据库。
3.根据权利要求2所述的基于机器学习的负荷建模典型用户数据库更新方法,其特征在于,所述步骤1-2)中,对日负荷功率曲线进行预处理的过程为:
计算日负荷功率曲线中各采样时刻点的负荷功率的变化率并与预设阈值比较,若超出阈值范围则视为异常数据;对异常数据进行进行修正,是首先判断负荷曲线的数据缺失量和异常量是否小于10%,若是,则先将异常量置为0即置为缺失量,再以一元三点抛物线插值算法对缺失量进行插值拟合,否则直接删除该条负荷曲线;
然后取用户的功率最大值pkmax为基准值,根据公式一对原始数据样本进行标幺化处理,
p'ki=pki/pkmax 公式一
其中,pki为经过筛选和异常数据处理后第k条用户日负荷功率曲线第i个数据点的功率数据;p'ki为对pki进行归一化处理后第k条用户日负荷功率曲线第i个数据点的功率数据;
从而得到归一化的用户有功功率标幺值矩阵P'k=[p'k1,p'k2,…,p'ki,...,p'km]∈R1×m和变电站下属典型用户的有功功率标幺值矩阵P'=[P'1,P'2,...,P'k,...,P'N]T∈RN×m,其中R为实数,R的上标表示相应矩阵的行、列数。
4.根据权利要求2所述的基于机器学习的负荷建模典型用户数据库更新方法,其特征在于,所述步骤1-3)包括以下过程:
设定初始聚类中心矩阵Pu (0)=[Pu1 (0),…,Puj (0),…,Pun (0)]T∈Rn×m,为n类典型用户的m点有功功率标幺值的初始值;
通过公式二计算或更新隶属度矩阵:
其中,h∈[0,2]为加权指数;
得到第b轮迭代时,变电站下属第k个用户对于n类的隶属度Vk (b)=[vk1 (b),…,vkj (b),…,vkn (b)]∈R1×n和变电站下属N个用户对于n类的隶属度矩阵V(b)=[V1 (b),…,Vk (b),…,VN (b)]T∈RN×n;
通过公式三更新聚类中心:
得到第b+1轮迭代得到的n类典型用户的聚类中心矩阵Pu (b+1)=[Pu1 (b+1),…,Puj (b+1),…,Pun (b+1)]T∈Rn×m直至则停止迭代;
根据各个用户相对于各个类的隶属度大小,进行典型用户分类,综合得到n类典型用户所包含的用户,以及n类典型行业等效日负荷功率曲线Cn=[Pu1 b,…,Puj b,…,Pum b]∈R1×m,以及最优聚类中心矩阵C=[C1,…,Cj,…,Cn]T∈Rn×m。
5.根据权利要求2所述的基于机器学习的负荷建模典型用户数据库更新方法,其特征在于,步骤2)包括以下过程:
2-1)将典型用户基本负荷信息作为模型输入,包括用户名Mk、电压等级Uk、总变容量Sk及日负荷功率曲线数据P'k=[p'k1,p'k2,…,p'ki,…,p'km]∈R1×m;其中p'ki为经过预处理后第k条用户日负荷功率曲线第i个数据点的功率数据,i=1,2,3,...,m,m为负控系统采集的数据点数目;得到归一化的用户xi=[Mk,Uk,Sk,P'k]∈R1×(m+3),即变电站下属第k个典型用户典型用户基本负荷信息,及变电站下属所有典型用户基本负荷信息x=[M,U,S,P']∈RN ×(m+3);
2-2)从步骤1)中得到的典型用户相关负荷数据,包括n类典型行业等效日负荷功率曲线Cn=[Pu1 b,…,Puj b,…,Pum b]∈R1×m,以及最优聚类中心矩阵C=[C1,…,Cj,…,Cn]T∈Rn×m,作为模型输出;
2-3)以负荷建模典型用户数据库中历史数据作为训练样本,将典型用户基本负荷信息x作为模型输入,将该典型用户所对应的典型行业聚类中心曲线C作为模型输出,对机器学习算法模型进行训练,机器学习模型选用支持向量机模型
选用公式四作为回归函数:
式中,y=f(x)是新用户所对应的典型行业聚类中心曲线,x为新用户的输入向量,即新用户基本负荷信息,其中包括用户名Mk、电压等级Uk、总变容量Sk及日负荷功率曲线数据P'k=[p'k1,p'k2,...,p'ki,…,p'km]∈R1×m;s为训练样本个数;xi是第i个训练样本对应的输入向量,即第i个典型用户基本负荷信息;β为偏置值,是常数;K(xi,x)为核函数,采用公式五所示的满足Mercer条件的径向基函数,σ是核参数,表示覆盖宽度;
αi,为拉格朗日乘子,满足/>且αi≥0,/>αi,/>的取值满足:
yi是第i个训练样本对应的输出值,即典型用户所对应的典型行业聚类中心曲线Cn=[Pu1 b,…,Puj b,…,Pum b]∈R1×m;ε为惩罚因子,c为期望最大绝对误差;ε、c和σ的取值根据经验值确定,αi,b的取值通过传统SMO算法来优化确定;在确定αi,/>b参数后,代入公式四即得到分类表达式y=f(x)。
6.根据权利要求5所述的基于机器学习的负荷建模典型用户数据库更新方法,其特征在于,所述步骤3)中,对新用户进行分类的方法是:
将新用户基本负荷信息,包括用户名Ml、电压等级Ul、总变容量Sl及日负荷功率曲线数据P'l=[p'l1,p'l2,...,p'li,…,p'lm]∈R1×m进行归整,得到归一化的用户xl=[Ml,Ul,Sl,P'l]∈R1×(m+3),将xl输入用于用户行业分类的机器学习模型中,形成新用户的模糊分类标记,即新用户的输入向量后,代入公式四得到的预测表达式,计算得到新用户所属的典型行业类别,即得到新用户所对应的典型行业聚类中心曲线yl=f(xl)。
7.根据权利要求1所述的基于机器学习的负荷建模典型用户数据库更新方法,其特征在于,所述步骤3)中,在对新用户的数据输入机器学习模型前,还包括对数据进行预处理的步骤:
对新用户日负荷功率曲线中的异常数据进行识别,对异常数据进行修正,对修正后的日负荷功率曲线数据进行标幺化处理:首先判断负荷曲线的数据缺失量和异常量是否小于10%,若是,则先将异常量置为0即置为缺失量,再以一元三点抛物线插值算法对缺失量进行插值拟合,得到处理后的新用户日负荷功率曲线P'l=[p'l1,p'l2,...,p'li,...,p'lm]∈R1×m;否则认为新用户不具有代表性,直接删除该条负荷曲线。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010240264.XA CN111461921B (zh) | 2020-03-31 | 2020-03-31 | 一种基于机器学习的负荷建模典型用户数据库更新方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010240264.XA CN111461921B (zh) | 2020-03-31 | 2020-03-31 | 一种基于机器学习的负荷建模典型用户数据库更新方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111461921A CN111461921A (zh) | 2020-07-28 |
CN111461921B true CN111461921B (zh) | 2023-11-24 |
Family
ID=71683370
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010240264.XA Active CN111461921B (zh) | 2020-03-31 | 2020-03-31 | 一种基于机器学习的负荷建模典型用户数据库更新方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111461921B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112183809A (zh) * | 2020-08-12 | 2021-01-05 | 国网江西省电力有限公司经济技术研究院 | 一种基于时空推演法的电力负荷特性指标测算方法 |
CN112016755A (zh) * | 2020-08-31 | 2020-12-01 | 国网甘肃省电力公司建设分公司 | 输变电工程施工图通用设计造价标准化技术模块构建方法 |
CN113239619A (zh) * | 2021-05-08 | 2021-08-10 | 国网江西省电力有限公司萍乡供电分公司 | 一种基于机器学习混合模型的专变用户异常用电行为检测方法 |
CN116526496B (zh) * | 2023-06-16 | 2023-09-08 | 国网山西省电力公司晋城供电公司 | 一种新型电力系统负荷控制的辅助决策方法 |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012244897A (ja) * | 2011-05-13 | 2012-12-10 | Fujitsu Ltd | 短期電力負荷を予測する方法及び装置 |
CN104268402A (zh) * | 2014-09-25 | 2015-01-07 | 国家电网公司 | 一种基于模糊c均值的电力系统负荷聚类方法 |
CN104638636A (zh) * | 2014-11-25 | 2015-05-20 | 中国能源建设集团广东省电力设计研究院 | 一种电力日负荷特性指标预测方法 |
GB201522769D0 (en) * | 2014-12-23 | 2016-02-03 | Rovi Guides Inc | Systems and methods for determining whether a negation statement applies to a current or past query |
CN105528660A (zh) * | 2016-03-09 | 2016-04-27 | 湖南大学 | 一种基于日负荷曲线的变电站负荷模型参数预测方法 |
CN105678314A (zh) * | 2015-10-15 | 2016-06-15 | 东南大学 | 一种基于模糊c聚类的典型需求侧用户筛选方法 |
WO2018082523A1 (zh) * | 2016-11-02 | 2018-05-11 | 中国电力科学研究院有限公司 | 一种负荷周期的模式识别方法 |
CN108280479A (zh) * | 2018-01-25 | 2018-07-13 | 重庆大学 | 一种基于负荷特性指标加权聚类算法的电网用户分类方法 |
CN108492043A (zh) * | 2018-03-29 | 2018-09-04 | 南京财经大学 | 一种基于聚类算法的电力用户负荷测算方法 |
CN109902868A (zh) * | 2019-02-25 | 2019-06-18 | 国网河南省电力公司电力科学研究院 | 一种基于负荷特性的大用户业扩辅助分析方法和装置 |
WO2019174040A1 (zh) * | 2018-03-16 | 2019-09-19 | 大连理工大学 | 一种耦合聚类分析和决策树的梯级水电站群短期发电调度方法 |
CN110717619A (zh) * | 2019-09-11 | 2020-01-21 | 国网浙江省电力有限公司经济技术研究院 | 一种自下而上配电网多尺度时空负荷预测方法及系统 |
-
2020
- 2020-03-31 CN CN202010240264.XA patent/CN111461921B/zh active Active
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012244897A (ja) * | 2011-05-13 | 2012-12-10 | Fujitsu Ltd | 短期電力負荷を予測する方法及び装置 |
CN104268402A (zh) * | 2014-09-25 | 2015-01-07 | 国家电网公司 | 一种基于模糊c均值的电力系统负荷聚类方法 |
CN104638636A (zh) * | 2014-11-25 | 2015-05-20 | 中国能源建设集团广东省电力设计研究院 | 一种电力日负荷特性指标预测方法 |
GB201522769D0 (en) * | 2014-12-23 | 2016-02-03 | Rovi Guides Inc | Systems and methods for determining whether a negation statement applies to a current or past query |
CN105678314A (zh) * | 2015-10-15 | 2016-06-15 | 东南大学 | 一种基于模糊c聚类的典型需求侧用户筛选方法 |
CN105528660A (zh) * | 2016-03-09 | 2016-04-27 | 湖南大学 | 一种基于日负荷曲线的变电站负荷模型参数预测方法 |
WO2018082523A1 (zh) * | 2016-11-02 | 2018-05-11 | 中国电力科学研究院有限公司 | 一种负荷周期的模式识别方法 |
CN108280479A (zh) * | 2018-01-25 | 2018-07-13 | 重庆大学 | 一种基于负荷特性指标加权聚类算法的电网用户分类方法 |
WO2019174040A1 (zh) * | 2018-03-16 | 2019-09-19 | 大连理工大学 | 一种耦合聚类分析和决策树的梯级水电站群短期发电调度方法 |
CN108492043A (zh) * | 2018-03-29 | 2018-09-04 | 南京财经大学 | 一种基于聚类算法的电力用户负荷测算方法 |
CN109902868A (zh) * | 2019-02-25 | 2019-06-18 | 国网河南省电力公司电力科学研究院 | 一种基于负荷特性的大用户业扩辅助分析方法和装置 |
CN110717619A (zh) * | 2019-09-11 | 2020-01-21 | 国网浙江省电力有限公司经济技术研究院 | 一种自下而上配电网多尺度时空负荷预测方法及系统 |
Non-Patent Citations (6)
Title |
---|
基于负荷特征库的大用户供电接入决策方法;骆柏锋;穆云飞;贾宏杰;余晓丹;戚艳;王旭东;;电力系统自动化(第06期);全文 * |
彭勃 ; 张逸 ; 熊军 ; 董树锋 ; 李永杰 ; .结合负荷形态指标的电力负荷曲线两步聚类算法.电力建设.2016,(第06期),全文. * |
李培强 ; 李欣然 ; 唐外文 ; 刘艳阳 ; .模糊C均值聚类在电力负荷建模中的应用研究.湖南大学学报(自然科学版).2006,(第03期),全文. * |
模糊聚类方法在负荷曲线分析中的应用;林雄;邢诒杏;;信息技术(第02期);全文 * |
王鹏.监管视角下的电力市场用户分类指标体系及算法研究.《中国电力》.2018,全文. * |
骆柏锋 ; 穆云飞 ; 贾宏杰 ; 余晓丹 ; 戚艳 ; 王旭东 ; .基于负荷特征库的大用户供电接入决策方法.电力系统自动化.2018,(第06期),全文. * |
Also Published As
Publication number | Publication date |
---|---|
CN111461921A (zh) | 2020-07-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111461921B (zh) | 一种基于机器学习的负荷建模典型用户数据库更新方法 | |
CN111199016B (zh) | 一种基于DTW的改进K-means的日负荷曲线聚类方法 | |
CN113962364B (zh) | 一种基于深度学习的多因素用电负荷预测方法 | |
CN110909912B (zh) | 基于自适应误差反馈的园区电力系统净负荷组合预测方法 | |
CN109461025B (zh) | 一种基于机器学习的电能替代潜在客户预测方法 | |
CN104809658B (zh) | 一种低压配网台区线损的快速分析方法 | |
CN110674999A (zh) | 基于改进聚类和长短期记忆深度学习的小区负荷预测方法 | |
CN103049651A (zh) | 一种用于电力负荷聚类的方法及装置 | |
CN111191854A (zh) | 一种基于线性回归及神经网络的光伏发电预测模型和方法 | |
CN111539657B (zh) | 结合用户日用电量曲线的典型用电行业负荷特性分类与综合方法 | |
CN112288157A (zh) | 一种基于模糊聚类与深度强化学习的风电场功率预测方法 | |
CN108694475B (zh) | 基于混合模型的短时间尺度光伏电池发电量预测方法 | |
CN110991689A (zh) | 基于LSTM-Morlet模型的分布式光伏发电系统短期预测方法 | |
CN110570091A (zh) | 基于改进F-score特征选择及粒子群BP神经网络的负荷辨识方法 | |
CN112508254B (zh) | 变电站工程项目投资预测数据的确定方法 | |
CN111737924B (zh) | 一种基于多源数据选取典型负荷特性变电站的方法 | |
Chen et al. | Graph neural network-based wind farm cluster speed prediction | |
CN116485582A (zh) | 一种基于深度学习的供热优化调控方法及装置 | |
CN113762591B (zh) | 一种基于gru和多核svm对抗学习的短期电量预测方法及系统 | |
CN110852628B (zh) | 考虑发展模式影响的农村中长期负荷预测方法 | |
CN113689227A (zh) | 基于纵横交叉算法和深度学习模型的日前电价预测方法 | |
CN113822473B (zh) | 一种基于多维数据的牵引力能耗合理区间预测方法 | |
Chen et al. | Power Consumption Prediction via Improved Gaussian Mixture Clustering Model for Automatically Clustering | |
CN113837486B (zh) | 一种基于rnn-rbm的配网馈线长期负荷预测方法 | |
Zhu et al. | Morphological clustering algorithm of daily output curve of wind farm based on multi-scale and entropy weight method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |