CN109242174A - 一种基于决策树的季节性负荷自适应划分方法 - Google Patents
一种基于决策树的季节性负荷自适应划分方法 Download PDFInfo
- Publication number
- CN109242174A CN109242174A CN201810994168.7A CN201810994168A CN109242174A CN 109242174 A CN109242174 A CN 109242174A CN 201810994168 A CN201810994168 A CN 201810994168A CN 109242174 A CN109242174 A CN 109242174A
- Authority
- CN
- China
- Prior art keywords
- load
- cluster
- data
- value
- layers
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003066 decision tree Methods 0.000 title claims abstract description 21
- 230000003044 adaptive effect Effects 0.000 title claims abstract description 14
- 238000000034 method Methods 0.000 title claims abstract description 13
- 238000004364 calculation method Methods 0.000 claims description 10
- 239000011159 matrix material Substances 0.000 claims description 9
- 241001269238 Data Species 0.000 claims description 8
- 239000012141 concentrate Substances 0.000 claims description 5
- 238000011156 evaluation Methods 0.000 claims description 5
- 238000013480 data collection Methods 0.000 claims description 4
- 241000196324 Embryophyta Species 0.000 claims description 3
- 235000006508 Nelumbo nucifera Nutrition 0.000 claims description 2
- 240000002853 Nelumbo nucifera Species 0.000 claims description 2
- 235000006510 Nelumbo pentapetala Nutrition 0.000 claims description 2
- RDYMFSUJUZBWLH-UHFFFAOYSA-N endosulfan Chemical compound C12COS(=O)OCC2C2(Cl)C(Cl)=C(Cl)C1(Cl)C2(Cl)Cl RDYMFSUJUZBWLH-UHFFFAOYSA-N 0.000 claims description 2
- 238000003064 k means clustering Methods 0.000 claims description 2
- 230000001932 seasonal effect Effects 0.000 description 6
- 238000012360 testing method Methods 0.000 description 4
- 238000012549 training Methods 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 230000005611 electricity Effects 0.000 description 3
- 230000003542 behavioural effect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02E—REDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
- Y02E40/00—Technologies for an efficient electrical power generation, transmission or distribution
- Y02E40/70—Smart grids as climate change mitigation technology in the energy generation sector
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Human Resources & Organizations (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Marketing (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Development Economics (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Entrepreneurship & Innovation (AREA)
- Probability & Statistics with Applications (AREA)
- Game Theory and Decision Science (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于决策树的季节性负荷自适应划分方法,能根据地区历史负荷数据,通过聚类确定该地区各季节性负荷的曲线形态,并根据聚类结果结合CART决策树生成各季划分阈值,以达到各地区季节性负荷自适应分类、生成相应划分规则的目的。
Description
技术领域
本发明涉及电力数据预测领域,更具体地,涉及一种基于决策树的季节性负荷自适应划分方法。
背景技术
随着智能配电网、高级量测体系的不断发展,电力负荷数据逐渐呈现出体量大、类型多、增速快等大数据特征。在进行负荷错峰潜力评估、实施需求响应以及负荷预测等方面均需对地区或用户负荷数据进行用电行为分析。电力负荷数据具有强季节特性,各季负荷用电情况差异较大。因此为保证在海量数据的情况下快速高效的进行负荷错峰潜力评估、需求响应计划制定以及负荷预测,需对电力负荷进行季节性划分以进行用电行为分析。
发明内容
本发明的目的是解决上述一个或多个缺陷,提出一种基于决策树的季节性负荷自适应划分方法。
为实现以上发明目的,采用的技术方案是:
一种基于决策树的季节性负荷自适应划分方法,包括以下步骤:
S1:采集地区历史负荷数据、历史温度数据;
S2:根据聚类评判指标确定最优聚类个数;
S3:对历史负荷数据进行基于余弦相似度的k-means聚类分析;
S4:以候温作为CART树的分类特征量、聚类个数与决策树叶节点个数相一致作为分类目标建立CART决策树;
S5:记录Gini系数增益最小的候温值作为季节性负荷划分阈值。
优选的是,步骤S1具体包括采集地区历史负荷数据,设xi=[xi1,xi2,L,xin]T与xj=[xj1,xj2,L,xjn]T为某区域电网第i日与第j日的负荷数据,X=(x1,x2,K,xi,K,xn)为共n个历史日负荷数据的集合。
优选的是,步骤S2包括以下步骤:
S2.1:设定余弦相似度表达式为:
其中xi=[xi1,xi2,L,xin]T与xj=[xj1,xj2,L,xjn]T为某区域电网第i日与第j日的负荷数据,X=(x1,x2,K,xi,K,xn)为共n个历史日负荷数据的集合;
S2.2:设定最大相似度阈值αcos,聚类数目k的范围,kmin≤k≤kmax;
S2.3:根据步骤S2.1中余弦相似度表达式生成余弦相似度矩阵Dcos,选出Dcos中余弦相似度最高的两条负荷曲线,并取其平均值作为第一个初始聚类中心c1;
S2.4:根据步骤S2.2中的最大相似度阈值,剔除掉在余弦相似度矩阵Dcos中与步骤S2.3所选取的为确定第一个初始聚类中心的两条负荷曲线余弦相似度大于αcos的日负荷数据;
S2.5:在余弦相似度矩阵Dcos余下的数据中重复步骤S2.3到步骤S2.4,直到获得与所选择聚类数目k相同数量的初始聚类中心l=1,K,k;
S2.6:获得k类聚类中心后分别计算历史日负荷序列数据集X=(x1,x2,K,xi,K,xn)中各历史日负荷序列曲线到初始聚类中心的余弦相似度dcos,将日负荷序列曲线归类到余弦相似度dcos取值最大的一类当中;
S2.7:根据步骤S2.6中获得各类负荷数据分类集合Pl,l=1,K,k;
S2.8:选取步骤S2.7中各类负荷数据的均值作为新的聚类中心;
S2.9:重复步骤S2.6到步骤S2.8直到聚类中心不再变化为止,停止迭代;
S2.10:设定并计算评价指标:
式中,k为聚类数目;nk为当前类k所包含的样本数目。V随着聚类数目的递增而增大,当V的值增大趋势不再明显时,定义k为最优聚类数目;
S2.11:重复步骤S2.1至步骤S2.10,对在聚类数k不同时计算所得的评价指标V进行判断,V指标随聚类数k增大而增大,当V增大趋势不再明显时,定义k为合适的聚类数目并记录此时聚类中心位置以及历史日负荷序列数据集中各日负荷曲线所归属的类别;其中最优聚类个数下各类日负荷曲线数据集表示为m=1,K,k,记录该类日负荷曲线数据集个数为Cm,并记录下最优聚类个数kbest。
优选的是,步骤S4包括以下步骤:
S4.1:采集历史日平均温度数据,设Ti为第i日的平均温度;
S4.2:设定候温THi的计算公式为:
式中,THi为第i日的候温;Ti为第i日的平均气温;
S4.3:选取候温THs作为CART决策树的分类特征量(根节点),则THs的取值范围为THs∈[ceil(THs.min),floor(THs.max)],其中,THs.min为历史候温最小值;THs.man为历史候温最大值,ceil为向下取整符,floor为向上取整符。
进一步的,步骤S5包括以下步骤:
S5.1:以Gini系数作为损失函数,设Gini系数的计算公式为:
式中,Tm为第m层总样本集,pm是样本集T中第m类数据的相对频率;初始分裂样本集由所有参与聚类的历史日负荷曲线集X=(x1,x2,K,xi,K xn)构成,设第m层样本集为Tm,其中cm为所有参与聚类的历史负荷曲线中属于第m类负荷曲线的个数,S为样本集T中元素的个数;
S5.2:则第m层各候温值的左右子节点Gini系数为:
式中,THs为分裂节点的候温值;Tlm为第m层左子节点中包含的历史负荷曲线集;Trm为第m层右子节点中包含的历史负荷曲线集;Ginim(Tlm,THs)为左子节点的Gini系数;Ginim(Trm,THs)为右子节点的Gini系数;Slm为样本集Tlm中元素的个数;Srm为样本集Trm中元素的个数;clm、crm分别为左子节点与右子节点中属于第k类负荷曲线的个数;分别为左子节点与右子节点中不属于第m类负荷曲线的个数;
S5.3:根据步骤S5.2所得Gini系数,计算第m层在候温THs下的Gini系数增益,其计算公式为:
S5.4:根据步骤S4.3所得候温THs的取值范围,对连续的候温值进行离散化,设定步长为0.5,则离散点个数为:
2×(floor(THs.max)-ceil(THs.min))+1 (7)
重复步骤S5.1至步骤S5.3,计算第m层各离散化后的候温THs的Gini系数增益,选取增益系数最小的候温值作为第m层最优分裂点;
S5.5:对比第m层左右子节点Gini系数Ginim(Tlm,THs)以及Ginim(Trm,THs)的大小,将系数较大的节点所包含的历史负荷曲线作为第m-1层总样本集,系数较小的节点所包含的历史负荷曲线作为叶节点;
S5.6:重复步骤S5.2至步骤S5.5直至叶节点个数与最优聚类个数kbest相等;
S5.7:记录下各分裂点候温阈值,以此根据地区历史负荷数据,自适应的生成季节性负荷划分规则。
与现有技术相比,本发明的有益效果是:
1)使用负荷聚类分析技术,对当地历史负荷数据进行类别划分,并以聚类结果以及最优聚类个数分别作为决策树的分类目标和决策树分裂终止条件,有效解决以往根据固定候温值以及南北半球固定月份进行季节性负荷划分所带来的划分结果不精确的问题;
2)使用聚类结合决策树进行季节性负荷划分的阈值确定,以制定分类标准,相较于基于欧氏距离的曲线形态进行划分,有效提高了分类效率。
附图说明
图1为本发明的流程图;
图2为不同聚类数目下聚类指标值效果图;
图3为训练集负荷曲线聚类结果图;
图4为季节性负荷分类CART树图;
图5为测试集负荷曲线划分结果图。
具体实施方式
附图仅用于示例性说明,不能理解为对本专利的限制;
以下结合附图和实施例对本发明做进一步的阐述。
实施例1
一种基于决策树的季节性负荷自适应划分方法,请参考图1。
1)采集地区历史负荷数据(本方案采集频率为每日48点),设xi=[xi1,xi2,L,xin]T与xj=[xj1,xj2,L,xjn]T为某区域电网第i日与第j日的负荷数据,X=(x1,x2,K,xi,K,xn)为共n个历史日负荷数据的集合;
2)设定余弦相似度表达式为:
3)设定最大相似度阈值αcos,聚类数目k的范围,kmin≤k≤kmax;
4)根据步骤2)中余弦相似度表达式生成余弦相似度矩阵Dcos,选出Dcos中余弦相似度最高的两条负荷曲线,并取其平均值作为第一个初始聚类中心c1;
5)根据步骤3)中的最大相似度阈值,剔除掉在余弦相似度矩阵Dcos中与步骤4)所选取的为确定第一个初始聚类中心的两条负荷曲线余弦相似度大于αcos的日负荷数据;
6)在余弦相似度矩阵Dcos余下的数据中重复步骤4)到步骤5),直到获得与所选择聚类数目k相同数量的初始聚类中心l=1,K,k;
7)获得k类聚类中心后分别计算历史日负荷序列数据集X=(x1,x2,K,xi,K,xn)中各历史日负荷序列曲线到初始聚类中心的余弦相似度dcos,将日负荷序列曲线归类到余弦相似度dcos取值最大的一类当中;
8)根据步骤7)中获得各类负荷数据分类集合Pl,l=1,K,k;
9)选取步骤8)中各类负荷数据的均值作为新的聚类中心;
10)重复步骤7)到步骤9)直到聚类中心不再变化为止,停止迭代;
11)设定并计算评价指标:
式中,k为聚类数目;nk为当前类k所包含的样本数目。V随着聚类数目的递增而增大,当V的值增大趋势不再明显时,定义k为最优聚类数目。
12)重复步骤4)至步骤11),对在聚类数k不同时计算所得的评价指标V进行判断,V指标随聚类数k增大而增大,当V增大趋势不再明显时,定义k为合适的聚类数目并记录此时聚类中心位置以及历史日负荷序列数据集中各日负荷曲线所归属的类别。最优聚类个数下各类日负荷曲线数据集表示为m=1,K,k,记录该类日负荷曲线数据集个数为Cm,并记录下最优聚类个数kbest;
13)采集历史日平均温度数据,设Ti为第i日的平均温度;
14)设定候温THi的计算公式为:
15)选取候温THs作为CART决策树的分类特征量(根节点),则THs的取值范围为THs∈[ceil(THs.min),floor(THs.max)],其中,THs.min为历史候温最小值;THs.man为历史候温最大值,ceil为向下取整符,floor为向上取整符。
16)以Gini系数作为损失函数,设Gini系数的计算公式为:
式中,Tm为第m层总样本集,pm是样本集T中第m类数据的相对频率。在本方案中初始分裂样本集由所有参与聚类的历史日负荷曲线集X=(x1,x2,K,xi,K xn)构成,设第m层样本集为Tm,其中cm为所有参与聚类的历史负荷曲线中属于第m类负荷曲线的个数,S为样本集T中元素的个数。
17)则第m层各候温值的左右子节点Gini系数为:
式中,THs为分裂节点的候温值;Tlm为第m层左子节点中包含的历史负荷曲线集;Trm为第m层右子节点中包含的历史负荷曲线集;Ginim(Tlm,THs)为左子节点的Gini系数;Ginim(Trm,THs)为右子节点的Gini系数;Slm为样本集Tlm中元素的个数;Srm为样本集Trm中元素的个数;clm、crm分别为左子节点与右子节点中属于第k类负荷曲线的个数;分别为左子节点与右子节点中不属于第m类负荷曲线的个数。
18)根据步骤17)所得Gini系数,计算第m层在候温THs下的Gini系数增益,其计算公式为:
19)根据步骤15)所得候温THs的取值范围,对连续的候温值进行离散化,设定步长为0.5,则离散点个数为:
2×(floor(THs.max)-ceil(THs.min))+1 (7)
重复步骤16)至步骤18),计算第m层各离散化后的候温THs的Gini系数增益,选取增益系数最小的候温值作为第m层最优分裂点。
20)对比第m层左右子节点Gini系数Ginim(Tlm,THs)以及Ginim(Trm,THs)的大小,将系数较大的节点所包含的历史负荷曲线作为第m-1层总样本集,系数较小的节点所包含的历史负荷曲线作为叶节点。
21)重复步骤17)至20)直至叶节点个数与最优聚类个数kbest相等。
22)记录下各分裂点候温阈值,以此根据地区历史负荷数据,自适应的生成季节性负荷划分规则。
实施例2
1)本实例选取实验数据集为澳大利亚AEMO电力公司提供的新南威尔士州悉尼市2006年1月1日至2010年12月31日的实时负荷数据和实时温度数据。数据采样频率为每日48点;
2)将2006年1月1日-2009年12月31日共4年954个工作日数据作为训练集进行模型搭建,2010年全年共243个工作日数据作为测试集以验证模型效果。
3)设定最大相似度阈值为αcos=0.99,聚类数目k的取值范围为2≤k≤6。
4)根据式(2)计算评价指标V,当聚类数目超过3个后,随着聚类数目k的增大,聚类指标值增大趋于明显变弱,因此确定最优聚类个数kbest=3,详解结果如图2所示:
5)训练集负荷曲线聚类结果如图3所示:
对负荷数据进行分析可以发现第一类负荷曲线簇集中于同年10月中下旬至次年3月中下旬,第二类负荷曲线簇集中于同年5月中旬至同年9月中旬,第三类负荷曲线簇集中于同年3月中下旬至同年5月中旬、同年9月中旬至同年10月中下旬。考虑到悉尼位于南半球,则定义第一类为夏季负荷曲线,第二类为冬季负荷曲线,第三类为春秋季负荷曲线。这是由于悉尼春秋季季节特性差异不明显,春秋季负荷曲线形态较为相似,因此将两季曲线归为同一类。
6)根据式(3)计算训练集以及测试集每日候温值。
7)以上述负荷曲线聚类结果作为分类目标,候温作为分裂属性,建立CART树。由于Gini系数作为分裂规则只能用于离散型数据,因此根据本实验所使用的历史气象数据,设定ceil(THs.min)为10℃,floor(THs.max)为26℃,步长为0.5,则离散点个数为33。
8)计算CART树各层Gini数增益,确定候温分裂点的候温值直至叶节点个数与最优聚类个数kbest相等。季节性负荷分类CART树如图4所示:
9)使用测试集负荷数据对上述所建模型进行验证。以计算所得候温分类阈值对测试集负荷曲线进行分类,分类结果如图5所示。
显然,本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。
Claims (5)
1.一种基于决策树的季节性负荷自适应划分方法,其特征在于,包括以下步骤:
S1:采集地区历史负荷数据、历史温度数据;
S2:根据聚类评判指标确定最优聚类个数;
S3:对历史负荷数据进行基于余弦相似度的k-means聚类分析;
S4:以候温作为CART树的分类特征量、聚类个数与决策树叶节点个数相一致作为分类目标建立CART决策树;
S5:记录Gini系数增益最小的候温值作为季节性负荷划分阈值。
2.根据权利要求1所述的一种基于决策树的季节性负荷自适应划分方法,其特征在于,步骤S1具体包括采集地区历史负荷数据,设xi=[xi1,xi2,L,xin]T与xj=[xj1,xj2,L,xjn]T为某区域电网第i日与第j日的负荷数据,X=(x1,x2,K,xi,K,xn)为共n个历史日负荷数据的集合。
3.根据权利要求1所述的一种基于决策树的季节性负荷自适应划分方法,其特征在于,步骤S2包括以下步骤:
S2.1:设定余弦相似度表达式为:
其中xi=[xi1,xi2,L,xin]T与xj=[xj1,xj2,L,xjn]T为某区域电网第i日与第j日的负荷数据,X=(x1,x2,K,xi,K,xn)为共n个历史日负荷数据的集合;
S2.2:设定最大相似度阈值αcos,聚类数目k的范围,kmin≤k≤kmax;
S2.3:根据步骤S2.1中余弦相似度表达式生成余弦相似度矩阵Dcos,选出Dcos中余弦相似度最高的两条负荷曲线,并取其平均值作为第一个初始聚类中心c1;
S2.4:根据步骤S2.2中的最大相似度阈值,剔除掉在余弦相似度矩阵Dcos中与步骤S2.3所选取的为确定第一个初始聚类中心的两条负荷曲线余弦相似度大于αcos的日负荷数据;
S2.5:在余弦相似度矩阵Dcos余下的数据中重复步骤S2.3到步骤S2.4,直到获得与所选择聚类数目k相同数量的初始聚类中心xcl,l=1,K,k;
S2.6:获得k类聚类中心后分别计算历史日负荷序列数据集X=(x1,x2,K,xi,K,xn)中各历史日负荷序列曲线到初始聚类中心的余弦相似度dcos,将日负荷序列曲线归类到余弦相似度dcos取值最大的一类当中;
S2.7:根据步骤S2.6中获得各类负荷数据分类集合Pl,l=1,K,k;
S2.8:选取步骤S2.7中各类负荷数据的均值作为新的聚类中心;
S2.9:重复步骤S2.6到步骤S2.8直到聚类中心不再变化为止,停止迭代;
S2.10:设定并计算评价指标:
式中,k为聚类数目;nk为当前类k所包含的样本数目。V随着聚类数目的递增而增大,当V的值增大趋势不再明显时,定义k为最优聚类数目;
S2.11:重复步骤S2.1至步骤S2.10,对在聚类数k不同时计算所得的评价指标V进行判断,V指标随聚类数k增大而增大,当V增大趋势不再明显时,定义k为合适的聚类数目并记录此时聚类中心位置以及历史日负荷序列数据集中各日负荷曲线所归属的类别;其中最优聚类个数下各类日负荷曲线数据集表示为m=1,K,k,记录该类日负荷曲线数据集个数为Cm,并记录下最优聚类个数kbest。
4.根据权利要求1所述的一种基于决策树的季节性负荷自适应划分方法,其特征在于,步骤S4包括以下步骤:
S4.1:采集历史日平均温度数据,设Ti为第i日的平均温度;
S4.2:设定候温THi的计算公式为:
式中,THi为第i日的候温;Ti为第i日的平均气温;
S4.3:选取候温THs作为CART决策树的分类特征量(根节点),则THs的取值范围为THs∈[ceil(THs.min),floor(THs.max)],其中,THs.min为历史候温最小值;THs.man为历史候温最大值,ceil为向下取整符,floor为向上取整符。
5.根据权利要求1、4所述的一种基于决策树的季节性负荷自适应划分方法,其特征在于,步骤S5包括以下步骤:
S5.1:以Gini系数作为损失函数,设Gini系数的计算公式为:
式中,Tm为第m层总样本集,pm是样本集T中第m类数据的相对频率;初始分裂样本集由所有参与聚类的历史日负荷曲线集X=(x1,x2,K,xi,K xn)构成,设第m层样本集为Tm,其中cm为所有参与聚类的历史负荷曲线中属于第m类负荷曲线的个数,S为样本集T中元素的个数;
S5.2:则第m层各候温值的左右子节点Gini系数为:
式中,THs为分裂节点的候温值;Tlm为第m层左子节点中包含的历史负荷曲线集;Trm为第m层右子节点中包含的历史负荷曲线集;Ginim(Tlm,THs)为左子节点的Gini系数;Ginim(Trm,THs)为右子节点的Gini系数;Slm为样本集Tlm中元素的个数;Srm为样本集Trm中元素的个数;clm、crm分别为左子节点与右子节点中属于第k类负荷曲线的个数;分别为左子节点与右子节点中不属于第m类负荷曲线的个数;
S5.3:根据步骤S5.2所得Gini系数,计算第m层在候温THs下的Gini系数增益,其计算公式为:
S5.4:根据步骤S4.3所得候温THs的取值范围,对连续的候温值进行离散化,设定步长为0.5,则离散点个数为:
2×(floor(THs.max)-ceil(THs.min))+1 (7)
重复步骤S5.1至步骤S5.3,计算第m层各离散化后的候温THs的Gini系数增益,选取增益系数最小的候温值作为第m层最优分裂点;
S5.5:对比第m层左右子节点Gini系数Ginim(Tlm,THs)以及Ginim(Trm,THs)的大小,将系数较大的节点所包含的历史负荷曲线作为第m-1层总样本集,系数较小的节点所包含的历史负荷曲线作为叶节点;
S5.6:重复步骤S5.2至步骤S5.5直至叶节点个数与最优聚类个数kbest相等;
S5.7:记录下各分裂点候温阈值,以此根据地区历史负荷数据,自适应的生成季节性负荷划分规则。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810994168.7A CN109242174A (zh) | 2018-08-27 | 2018-08-27 | 一种基于决策树的季节性负荷自适应划分方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810994168.7A CN109242174A (zh) | 2018-08-27 | 2018-08-27 | 一种基于决策树的季节性负荷自适应划分方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109242174A true CN109242174A (zh) | 2019-01-18 |
Family
ID=65068767
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810994168.7A Pending CN109242174A (zh) | 2018-08-27 | 2018-08-27 | 一种基于决策树的季节性负荷自适应划分方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109242174A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111163075A (zh) * | 2019-12-25 | 2020-05-15 | 北京科东电力控制系统有限责任公司 | 电力监控系统设备性能指标阈值动态调整方法 |
CN111476435A (zh) * | 2020-04-30 | 2020-07-31 | 国核电力规划设计研究院有限公司 | 基于密度峰值的充电桩负荷预测方法 |
CN111898694A (zh) * | 2020-08-07 | 2020-11-06 | 广东电网有限责任公司计量中心 | 一种基于随机树分类的非入侵式负荷识别方法及装置 |
CN112801193A (zh) * | 2021-02-03 | 2021-05-14 | 拉扎斯网络科技(上海)有限公司 | 定位数据处理方法、装置、电子设备、介质及程序产品 |
CN113361785A (zh) * | 2021-06-10 | 2021-09-07 | 国网河北省电力有限公司经济技术研究院 | 配电网短期负荷预测方法、装置、终端及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102129470A (zh) * | 2011-03-28 | 2011-07-20 | 中国科学技术大学 | 标签聚类方法和系统 |
CN104881706A (zh) * | 2014-12-31 | 2015-09-02 | 天津弘源慧能科技有限公司 | 一种基于大数据技术的电力系统短期负荷预测方法 |
CN105469219A (zh) * | 2015-12-31 | 2016-04-06 | 国家电网公司 | 一种基于决策树的电力负荷数据处理方法 |
CN107194600A (zh) * | 2017-06-01 | 2017-09-22 | 国网山东省电力公司济南市历城区供电公司 | 一种电力负荷季节特性分类方法 |
-
2018
- 2018-08-27 CN CN201810994168.7A patent/CN109242174A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102129470A (zh) * | 2011-03-28 | 2011-07-20 | 中国科学技术大学 | 标签聚类方法和系统 |
CN104881706A (zh) * | 2014-12-31 | 2015-09-02 | 天津弘源慧能科技有限公司 | 一种基于大数据技术的电力系统短期负荷预测方法 |
CN105469219A (zh) * | 2015-12-31 | 2016-04-06 | 国家电网公司 | 一种基于决策树的电力负荷数据处理方法 |
CN107194600A (zh) * | 2017-06-01 | 2017-09-22 | 国网山东省电力公司济南市历城区供电公司 | 一种电力负荷季节特性分类方法 |
Non-Patent Citations (2)
Title |
---|
张志军: "《大数据技术在高校中的应用研究》", 30 September 2017, 北京邮电大学出版社 * |
陈暄: "《智能算法在云计算资源中的相关研究》", 30 June 2018, 中国原子能出版社 * |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111163075A (zh) * | 2019-12-25 | 2020-05-15 | 北京科东电力控制系统有限责任公司 | 电力监控系统设备性能指标阈值动态调整方法 |
CN111476435A (zh) * | 2020-04-30 | 2020-07-31 | 国核电力规划设计研究院有限公司 | 基于密度峰值的充电桩负荷预测方法 |
CN111476435B (zh) * | 2020-04-30 | 2024-02-09 | 国核电力规划设计研究院有限公司 | 基于密度峰值的充电桩负荷预测方法 |
CN111898694A (zh) * | 2020-08-07 | 2020-11-06 | 广东电网有限责任公司计量中心 | 一种基于随机树分类的非入侵式负荷识别方法及装置 |
CN112801193A (zh) * | 2021-02-03 | 2021-05-14 | 拉扎斯网络科技(上海)有限公司 | 定位数据处理方法、装置、电子设备、介质及程序产品 |
CN112801193B (zh) * | 2021-02-03 | 2023-04-07 | 拉扎斯网络科技(上海)有限公司 | 定位数据处理方法、装置、电子设备、介质 |
CN113361785A (zh) * | 2021-06-10 | 2021-09-07 | 国网河北省电力有限公司经济技术研究院 | 配电网短期负荷预测方法、装置、终端及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109242174A (zh) | 一种基于决策树的季节性负荷自适应划分方法 | |
CN106529707A (zh) | 一种负荷用电模式识别方法 | |
CN106650767B (zh) | 基于聚类分析和实时校正的洪水预报方法 | |
Wang et al. | Comparison of seven methods for determining the optimal statistical distribution parameters: A case study of wind energy assessment in the large-scale wind farms of China | |
CN106022509B (zh) | 考虑地域和负荷性质双重差异的配电网空间负荷预测方法 | |
CN108564192A (zh) | 一种基于气象因子权重相似日的短期光伏功率预测方法 | |
CN111754026B (zh) | 光伏电站群功率预测方法、装置、计算机设备及存储介质 | |
CN109165774A (zh) | 一种短期光伏功率预测方法 | |
CN106251001A (zh) | 一种基于改进模糊聚类算法的光伏功率预测方法 | |
CN103049651A (zh) | 一种用于电力负荷聚类的方法及装置 | |
CN103324980A (zh) | 一种风电场风速预测方法 | |
CN108345908A (zh) | 电网数据的分类方法、分类设备及存储介质 | |
CN109146063B (zh) | 一种基于重要点分割的多分段短期负荷预测方法 | |
CN109146252A (zh) | 基于调节潜力指标的用户用电行为聚类分析方法和系统 | |
CN108376262A (zh) | 一种风电出力典型特性的分析模型构建方法 | |
CN108647425B (zh) | 基于粒子群优化的K-means径流丰枯年份预报方法 | |
CN107679687A (zh) | 一种光伏出力建模方法以及发电系统可靠性评估方法 | |
CN112149873A (zh) | 一种基于深度学习的低压台区线损合理区间预测方法 | |
CN108960488A (zh) | 一种基于深度学习与多源信息融合的饱和负荷空间分布精准预测方法 | |
CN110738232A (zh) | 一种基于数据挖掘技术的电网电压越限成因诊断方法 | |
CN109902340A (zh) | 一种计及复杂气象耦合特性的多源-荷联合场景生成方法 | |
CN108428055A (zh) | 一种考虑负荷纵向特性的负荷聚类方法 | |
CN109558467A (zh) | 用电用户类别识别方法及系统 | |
CN112396152A (zh) | 一种基于cs-lstm的洪水预报方法 | |
CN107248031B (zh) | 一种针对负荷曲线峰谷差的快速电力用户分类方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190118 |