CN116526479B - 一种供电量预测方法、装置、设备及介质 - Google Patents
一种供电量预测方法、装置、设备及介质 Download PDFInfo
- Publication number
- CN116526479B CN116526479B CN202310803984.6A CN202310803984A CN116526479B CN 116526479 B CN116526479 B CN 116526479B CN 202310803984 A CN202310803984 A CN 202310803984A CN 116526479 B CN116526479 B CN 116526479B
- Authority
- CN
- China
- Prior art keywords
- prediction model
- sample data
- data
- sub
- training
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 53
- 238000012549 training Methods 0.000 claims abstract description 98
- 238000012360 testing method Methods 0.000 claims abstract description 80
- 230000005611 electricity Effects 0.000 claims description 61
- 230000035945 sensitivity Effects 0.000 claims description 23
- 238000004590 computer program Methods 0.000 claims description 16
- 238000010276 construction Methods 0.000 claims description 6
- 238000003860 storage Methods 0.000 claims description 6
- 238000012163 sequencing technique Methods 0.000 claims description 4
- 230000008569 process Effects 0.000 abstract description 7
- 238000001556 precipitation Methods 0.000 description 20
- 238000007620 mathematical function Methods 0.000 description 17
- 230000006870 function Effects 0.000 description 11
- 238000009826 distribution Methods 0.000 description 10
- 238000004364 calculation method Methods 0.000 description 8
- 230000004044 response Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 238000012545 processing Methods 0.000 description 4
- 230000008859 change Effects 0.000 description 2
- 238000005485 electric heating Methods 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 230000001105 regulatory effect Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- H—ELECTRICITY
- H02—GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
- H02J—CIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
- H02J3/00—Circuit arrangements for ac mains or ac distribution networks
- H02J3/004—Generation forecast, e.g. methods or systems for forecasting future energy generation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2113/00—Details relating to the application field
- G06F2113/04—Power grid distribution networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2119/00—Details relating to the type or aim of the analysis or the optimisation
- G06F2119/08—Thermal analysis or thermal optimisation
-
- H—ELECTRICITY
- H02—GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
- H02J—CIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
- H02J2203/00—Indexing scheme relating to details of circuit arrangements for AC mains or AC distribution networks
- H02J2203/20—Simulating, e g planning, reliability check, modelling or computer assisted design [CAD]
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Economics (AREA)
- General Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Tourism & Hospitality (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Evolutionary Computation (AREA)
- Game Theory and Decision Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Operations Research (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Development Economics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Entrepreneurship & Innovation (AREA)
- Quality & Reliability (AREA)
- Computer Hardware Design (AREA)
- Geometry (AREA)
- Power Engineering (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明属于供电量预测技术领域,具体公开了一种供电量预测方法,包括以下步骤:获取样本数据集合,并依据样本数据的总偏差,将样本数据集合划分为测试集和训练集;根据样本数据集合,构建若干子函数;根据若干子函数构建基准预测模型;通过训练集对基准预测模型进行训练,训练完成后输出第一预测模型,通过测试集对第一预测模型进行测试,若测试通过则输出预测模型,若测试未通过则重新获取样本数据建立新的基准预测模型;获取待预测数据输入预测模型获得预测供电量并输出。通过建立若干子函数从多角度综合对供电量进行预测,提高预测精度,且预测过程自动化完成,提高了预测速度。
Description
技术领域
本发明属于供电量预测技术领域,具体涉及一种供电量预测方法、装置、设备及介质。
背景技术
随着电力市场化改革的进行和电力市场的发展,对供电量预测的重要性日益凸显,对预测的准确性、实时性、可靠性及智能性都提出了更高的要求。精准可靠的对中短期的供电量进行有效预测,才能更加适应高比例可再生能源、高比例电力电子设备为背景的新型电力系统建设要求,降低由于电量预测不准确造成的差异金额。在代理购电模式下,供电量预测准确性直接影响到发电计划和购电计划的安排。
传统的预测手段是线下通过EXCEL表进行,通过人工收集历史数据选取对供电量预测准确度影响较大的因素,归纳总结供电量对各因素的敏感度,然后根据影响因素的预测结果逐日对供电量开展未来中短期的预测。目前人工进行供电量预测不仅费时费力,预测中考虑的影响因素也不够全面,已经不能满足降低预测购电量与实际购电量需求差异的要求。
发明内容
本发明的目的在于提供一种供电量预测方法、装置、设备及介质,以解决现有供电量预测不准确,预测速度慢的技术问题。
为实现上述目的,本发明采用如下技术方案予以实现:
第一方面,一种供电量预测方法,包括以下步骤:
获取样本数据集合,并依据样本数据的总偏差,将样本数据集合划分为测试集和训练集;根据样本数据集合,构建若干子函数;根据若干子函数构建基准预测模型;通过训练集对基准预测模型进行训练,训练完成后输出第一预测模型,通过测试集对第一预测模型进行测试,若测试通过则输出预测模型,若测试未通过则重新获取样本数据建立新的基准预测模型;
获取待预测数据输入预测模型获得预测供电量并输出。
本发明的进一步改进在于:所述样本数据集合中包括气温项数据、湿度项数据、风况项数据、时间项数据和突发事件数据。
本发明的进一步改进在于:所述获取样本数据集合,并依据样本数据的总偏差,将样本数据集合划分为测试集和训练集的步骤中,具体包括:
分别计算每一类型的样本项的平均值;
根据每一类型的样本项的平均值,分别计算每一样本数据中所包含的每个样本项的项偏差;
根据每个样本项的项偏差计算每一样本数据的总偏差;
根据每一样本数据的总偏差,划分测试集和训练集。
本发明的进一步改进在于:所述若干子函数包括气温子函数、湿度子函数、风况子函数、时间子函数、地区子函数和突发子函数。
本发明的进一步改进在于:所述根据若干子函数构建基准预测模型,具体包括以下步骤:
获取历史用电数据和用户基本信息;
根据历史用电数据和用户基本信息对若干子函数进行组合生成基准预测模型。
本发明的进一步改进在于:所述通过训练集对基准预测模型进行训练时,具体包括以下步骤:
将训练集作为输入量带入不同的基准预测模型,并输出第一预测模型;
将训练集作为输入量带入第一预测模型,以训练集实际供电量作为输出结果计算模型训练值;
将若干模型训练值代入第一预测模型,完成训练。
本发明的进一步改进在于:所述通过测试集对第一预测模型进行测试时,具体包括以下步骤:
将测试集作为第一预测模型的输入量,得到输出值;
计算输出值与测试集对应实际供电量之间的偏差值,若偏差值小于等于预设值则输出第一预测模型作为预测模型,若偏差值大于预设值则重新进行新的训练周期的训练,引入新的样本数据或重复训练原有样本数据。
第二方面,一种供电量预测装置,包括:
数据获取模块:用于获取样本数据集合,并依据样本数据的总偏差,将样本数据集合划分为测试集和训练集;
子函数构建模块:用于根据样本数据集合,构建若干子函数;
预测模型输出模块:用于根据若干子函数构建基准预测模型;通过训练集对基准预测模型进行训练,训练完成后输出第一预测模型,通过测试集对第一预测模型进行测试,若测试通过则输出预测模型,若测试未通过则重新获取样本数据建立新的基准预测模型;
预测模块:用于获取待预测数据输入预测模型获得预测供电量并输出。
第三方面,一种计算机设备,包括存储器、处理器以及存储在存储器中并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述的一种供电量预测方法。
第四方面,一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被处理器执行时实现上述的一种供电量预测方法。
与现有技术相比,本发明至少包括以下有益效果:
1、本发明通过建立若干子函数从多角度综合对供电量进行预测,提高预测精度,且预测过程自动化完成,提高了预测速度;
2、本发明通过气温项数据、湿度项数据、风况项数据、时间项数据和突发事件数据作为样本数据,考虑的角度全面,且数据获取难度低,提高了实用性。
附图说明
构成本发明的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1为本发明一种供电量预测方法的流程图;
图2为本发明一种供电量预测装置的结构框图。
具体实施方式
下面将参考附图并结合实施例来详细说明本发明。需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
以下详细说明均是示例性的说明,旨在对本发明提供进一步的详细说明。除非另有指明,本发明所采用的所有技术术语与本发明所属领域的一般技术人员的通常理解的含义相同。本发明所使用的术语仅是为了描述具体实施方式,而并非意图限制根据本发明的示例性实施方式。
实施例1
一种供电量预测方法,如图1所示,包括以下步骤:
S1、获取样本数据集合,并依据样本数据的总偏差,将样本数据集合划分为测试集和训练集;
具体的,对于样本数据集合中的一样本数据,其包括若干个类型的样本项,每个类型样本项均为对供电量产生影响的数据,样本项的类型j例如:气温项数据、湿度项数据、风况项数据、地区项数据、时间项数据和突发事件数据等;
具体的,在S1中包括以下步骤:
S11、分别计算每一类型的样本项的平均值;
例如,气温项数据的均值即所有样本数据的气温项数据的平均值;
S12、根据每一类型的样本项的平均值,计算每一样本数据中所包含的每个样本项的项偏差;
例如,对于气温项数据,计算得到气温项数据的平均值之后,利用气温项数据的平均值,对样本数据集合中每一个样本数据所包含的气温项数据计算项偏差。
具体的,计算每个样本项的项偏差sij的公式可以如下所示:
sij=|aij-△aj|/(dj-dw);
式中,sij为项偏差,aij为样本数据中样本项的数值,△aj为类型为j的样本项的平均值,dj为预设的类型为j的样本项的基本偏差,dw为预设的偏差阈值,其中i表示第i个样本数据,j表示样本项的类型为j。
S13、根据每个样本项的项偏差计算每一样本数据的总偏差;
具体的,计算每一样本数据的总偏差Si的公式:
Si=α1si1+α2si2+…αnsin;
式中,Si表示每一样本数据的总偏差;α1,α2…αn表示每一样本项对应的调参变量,初始状态下,调参变量可以相同为1/n,其中n为样本项的数量;si1,si2…sin为第i个样本数据中,每个样本项的项偏差。
S14、根据每一样本数据的总偏差,划分测试集和训练集;
具体的,划分测试集和训练集时,包括以下步骤:
先预设测试集的数量,然后根据每一样本数据的总偏差对所有的样本数据进行排序,并按照预设顺序将样本数据加入测试集,直至满足预设测试集的数量,预设测试集的数量优选根据样本数据的总数量的比例,比例的取值可以为0.02-0.1之间;
为了保证测试集中数据的多样性,还配置有调参值修正调参变量,当一样本数据被加入测试集时,确定样本数据中样本项的项偏差最高的样本项,并减小该样本项对应的调参变量,并重新计算所有的总偏差。
S2、根据样本数据集合,构建若干子函数;
子函数有若干种,根据样本数据集合中样本项的的种类确定;
具体的,子函数包括气温子函数、湿度子函数、风况子函数、时间子函数、地区子函数和突发子函数等;
作为示例,气温子函数f1(x1)可以表示如下:
f1(x1)=β1X1;
式中,X1为气温区间对应的气温用电量取值;β1为第一模型训练值;x1为气温值;
f1(x1)表示对应气温耗电预测值和气温值x1的关系;
具体的,气温子函数为分段函数,在中间温度下对于用电量的响应会不敏感,在高温或者低温条件下,对用电量的响应会出现明显变化,所以对应不同的气温区间,用电量对气温的响应也不同;
f1(x1)通过气温项数据和用电量的关系分布,以离散值的方法构建函数区间;
作为示例,设置20-25度,25-27度,27-30度,30-32度等气温区间,并对每个气温区间赋予不同的取值,通过带入历史用电数据以及历史用电数据对应的气温项数据,得到具体气温区间的分布以及气温区间的数量,然后通过分类器进行运算,满足预设的约束关系,则增加一簇,簇数就决定了气温区间的数量,而对应每簇的均值就决定的对应的气温用电量的取值。
作为示例,湿度子函数f2(x2)可以表示如下:
f2(x2)=β2X2;
式中,X2为湿度区间对应的湿度用电量取值;β2为第二模型训练值;x2为湿度。
作为示例,风况子函数可以表示 如下:
;
式中,为该地区对风向的基准向量,/>为风向;β3为第三模型训练值;x3为风力等级;/>根据风力等级和风向的有效值关系计算获得。
作为示例,时间子函数g1(y1)可以表示如下:
g1(y1)=C1(t1+t2);
式中,t1为工作日用电值;t2为节气关联值;C1为第四模型训练值;y1为日期;
t1通过外部数据确定该日期是否为工作日或节假日,并根据有效工作因素确定对应的取值,例如,如果周日,取值为2,周六则取值为1.5,而如果是节假日则取值为2.5,具体取值根据实际用电和节假日之间的关系计算获得;
t2为y1对应的节气,t2计算时根据:a=365.242 * (y - 1900) + 6.2 + 15.22 * x- 1.9 * math.sin(0.262 * x)(该公式适用于1900-2100年)计算出a的值并取整,其中y为年份,x表示该年份的第x个节气,然后通过datetime方法将(1899,12,31)这一天数据加上取整后的a值,便可得到第y年第x个节气具体的日期,再将一年的24节气进行映射,列空值采用向下填充ffill便得到新的节气字段。
作为示例,地区子函数g2(y2)可以表示如下:
g2(y2)=C2d1d2;
式中,d1为该地区的配电规模等级,d1取值在1~1.2之间,根据该地区实际配电设备的情况通过查询预先设置的配电规模等级表得出;d2为该地区最低平均用电值,取每个时段的最低用电值的平均值;C2为第五模型训练值;y2为地区;
作为示例,突发子函数g3(y3)可以表示如下:
g3(y3)=C3p;
式中,p为突发事件对应的影响值;C3为第六模型训练值;y3表示突发事件;
p通过突发事件表进行查询,例如8级台风,对应有影响值为-4,例如雪灾对应的影响值为-3,高温酷暑对应的影响值为2。
优选的,突发事件还可以包括:低温指数、干旱指数、连阴雨指数;
低温指数:该时期日最低3天的最低温平均值的倒数
;
其中,t为某地区该时期日最低3天的温度。
干旱指数:该时期无降水(降水量<1mm)天数除以该时期降水量
Dry=Dnull/P;
其中,Dnull表示某地区该时期无降水(降水量<1mm)天数,P为某地区该时期降水量。
连阴雨指数:该时期连续三天及以上降水天数除以该时期无降水天数;
Run=Drun3/Dnull;
其中,Drun3表示某地区该时期连续三天及以上降水天数,Dnull表示某地区该时期无降水天数。
S3、根据若干子函数构建基准预测模型;
具体的,在S3中包括以下步骤:
S31、获取历史用电数据和用户基本信息;
S32、根据历史用电数据和用户基本信息对若干子函数进行组合生成基准预测模型;
基准预测模型将用户基本信息和历史用电数据作为输入,输出预测数学函数;
由于历史用电数据和湿度、气温、风况、事件等对应的子函数之间的关联性并不是独立的,例如对北部地区的用电量对低温的敏感度较高,因为北部地区会在电热上增加较多的用电量,且北部地区电热设备的配置较为完善,而相比而言,南部地区由于没有这么多的电热设备,所以即使温度较低,其用电量变化也不会如北方用电量高,而针对这种情况,就需要配置不同的预测数学函数,也就是配置不同的子函数之间的运算逻辑以及函数关系。
例如,预测数学函数有:
需要说明的是以上函数仅仅为举例,主要体现本发明通过预测决策逻辑可以生成不同的预测数学函数的组合。
对预测数学函数进行组合时,先根据输入的用户基本信息和历史用电数据判断不同子函数的敏感程度和关联度,敏感度对应每个子函数的逻辑具有平方、乘、加、减、除、开方等不同的运算方式,关联度对应每个子函数的逻辑具有乘、加、减、除不同的运算方式;
例如某地区对温度非常敏感,那么对于子函数f1(x1)可以采用平方的运算方式,而如果同时这个地区对于温度调节设备的普及率又很高,则可以通过g2(y2)和f1(x1)相乘的方式。而用户基本信息和历史用电情况分析敏感程度和关联度的策略为通过配置数据库,并设置触发条件,每一触发条件对应有关联度和敏感程度的数值,例如触发条件为区域,那么基本信息确定的区域位于区域内,就可以得到对应的敏感程度数值,通过该地区的平均每户用电量,就可以得到用电设备普及率,或历史数据中对高温或低温情况的响应特别敏感,也可以获取到气温和地区或节气的关系。
S4、通过训练集对基准预测模型进行训练,训练完成后输出第一预测模型,通过测试集对第一预测模型进行测试,若测试通过则输出预测模型,若测试未通过则重新获取样本数据建立新的基准预测模型;
具体的,在S4中包括以下步骤:
S41、将训练集作为输入量带入不同的基准预测模型,并输出第一预测模型;
S3中根据历史用电情况或者用户基本信息确定函数的组合关系,但是敏感程度和关联度对应组合关系的范围是需要通过样本不断训练的,由于样本数据中实际用电量已知,且对应的环境变量也是已知的,就可以通过将同样的输入变量带入不同的组合关系的预测数学函数中,如果计算结果与实际的计算结果越接近,则该敏感程度和关联度落入对应的范围是更准确的,就扩大对应的预测数学函数调度的敏感程度和关联度的阈值范围,从而使预测结果更接近的预测范围对应的预测数学函数更容易被选择。
例如,由于样本数据中获得的温度项数据的敏感程度是4,而温度项数据和地区的关联度是3,那么理论上应该落入[3-5][2-7]的范围内,组成对应的数学函数,而训练时,不仅找到该数学函数,也确定相近范围的数学函数,例如[1-3][2-7]以及[3-5][0-2]如果得到对应[3-5][0-2]的数学函数的预测用电值与样本实际用电值最接近,则适当扩大关联度范围,从[0-2]扩展到[0-3],使得这个组合关系更容易被调度。
S42、将训练集作为输入量带入第一预测模型,以训练集实际供电量作为输出结果计算模型训练值;
模型训练值包括S3中提到的β1、β2、β3、C1、C2和C3,由于输入量和输出量都为已知数,输入不同的样本数据进行训练,并在训练过程中调整模型训练值的大小,以使结果更趋近于实际结果。
S43、将确定好的模型训练值代入第一预测模型,以测试集作为输入量,若输出结果的偏差值小于预设值,则通过测试输出第一预测模型作为预测模型,若偏差值大于预设值,则说明测试不通过,重新进行新的训练周期的训练,引入新的样本数据或重复训练原有样本数据。
S5、获取待预测数据输入预测模型获得预测供电量并输出。
实施例2
一种供电量预测装置,根据实施例1中的一种供电量预测方法,如图2所示,包括:
数据获取模块:用于获取样本数据集合,并依据样本数据的总偏差,将样本数据集合划分为测试集和训练集;
子函数构建模块:用于根据样本数据集合,构建若干子函数;
预测模型输出模块:用于根据若干子函数构建基准预测模型;通过训练集对基准预测模型进行训练,训练完成后输出第一预测模型,通过测试集对第一预测模型进行测试,若测试通过则输出预测模型,若测试未通过则重新获取样本数据建立新的基准预测模型;
预测模块:用于获取待预测数据输入预测模型获得预测供电量并输出。
在数据获取模块中包括:
S11、分别计算每一类型的样本项的平均值;
例如,气温项数据的均值即所有样本数据的气温项数据的平均值;
S12、根据每一类型的样本项的平均值,分别计算每一样本数据中所包含的每个样本项的项偏差;
例如,对于气温项数据,计算得到气温项数据的平均值之后,利用气温项数据的平均值,对样本数据集合中每一个样本数据所包含的气温项数据计算项偏差。
具体的,计算每个样本项的项偏差sij的公式可以如下所示:
sij=|aij-△aj|/(dj-dw);
式中,sij为项偏差,aij为样本数据中样本项的数值,△aj为类型为j的样本项的平均值,dj为预设的类型为j的样本项的基本偏差,dw为预设的偏差阈值,其中i表示第i个样本数据,j表示样本项的类型为j。
S13、根据每个样本项的项偏差计算每一样本数据的总偏差;
具体的,计算每一样本数据的总偏差Si的公式:
Si=α1si1+α2si2+…αnsin;
式中,Si表示每一样本数据的总偏差;α1,α2…αn表示每一样本项对应调参变量,初始状态下,调参变量可以相同为1/n,其中n为样本项的数量;si1,si2+…sin为第i个样本数据中,每个样本项的项偏差。
S14、根据每一样本数据的总偏差,划分测试集和训练集;
具体的,划分测试集和训练集时,包括以下步骤:
先预设测试集的数量,然后根据每一样本数据的总偏差进行排序,并按照预设顺序将样本数据加入测试集,直至满足预设测试集的数量,预设测试集的数量优选根据样本数据的总数量的比例,比例的取值可以为0.02-0.1之间,为了保证测试集中数据的多样性,还配置有调参值修正调参变量,当一样本数据被加入测试集时,确定样本数据中样本项的项偏差最高的样本项,并减小该样本项对应的调参变量,并重新计算所有的总偏差。
子函数有若干种,根据样本数据集合中样本项的的种类确定;
具体的,子函数包括气温子函数、湿度子函数、风况子函数、时间子函数、地区子函数和突发子函数等;
作为示例,气温子函数f1(x1)可以表示如下:
f1(x1)=β1X1;
式中,X1为对应气温区间对应的气温用电量的取值;β1为第一模型训练值;x1为气温值;
f1(x1)表示对应气温耗电预测值和气温值x1的关系;
具体的,气温子函数为分段函数,在中间温度下对于用电量的响应会不敏感,在高温或者低温条件下,对用电量的响应会出现明显变化,所以对应不同的气温区间,用电量对气温的响应也不同;
f1(x1)通过气温项数据和用电量的关系分布,以离散值的方法构建函数区间;
作为示例,设置20-25度,25-27度,27-30度,30-32度等气温区间,并对每个气温区间赋予不同的取值,通过带入历史用电数据以及历史用电数据对应的气温项数据,得到具体气温区间的分布以及气温区间的数量,然后通过分类器进行运算,满足预设的约束关系,则增加一簇,簇数就决定了气温区间的数量,而对应每簇的均值就决定的对应的气温用电量的取值。
作为示例,湿度子函数f2(x2)可以表示如下:
f2(x2)=β2X2;
式中,X2为对应湿度区间对应的湿度用电量的取值;β2为第二模型训练值;x2为湿度。
作为示例,风况子函数可以表示如下:
;
式中,为该地区对风向的基准向量,/>为风向;β3为第三模型训练值;x3为风力等级;/>根据风力等级和风向的有效值关系计算获得。
作为示例,时间子函数g1(y1)可以表示如下:
g1(y1)=C1(t1+t2);
式中,t1为工作日用电值;t2为节气关联值;C1为第四模型训练值;y1为日期;
t1通过外部数据确定该日期是否为工作日或节假日,并根据有效工作因素确定对应的取值,例如,如果周日,取值为2,周六则取值为1.5,而如果是节假日则取值为2.5,具体取值根据实际用电和节假日之间的关系计算获得;
t2为y1对应的节气,t2计算时根据:a=365.242 * (y - 1900) + 6.2 + 15.22 * x- 1.9 * math.sin(0.262 * x)(该公式适用于1900-2100年)计算出a的值并取整,其中y为年份,x表示该年份的第x个节气,然后通过datetime方法将(1899,12,31)这一天数据加上取整后的a值,便可得到第y年第x个节气具体的日期,再将一年的24节气进行映射,列空值采用向下填充ffill便得到新的节气字段。
作为示例,地区子函数g2(y2)可以表示如下:
g2(y2)=C2d1d2;
式中,d1为该地区的配电规模等级,d1取值在1~1.2之间,根据该地区实际配电设备的情况通过查询预先设置的配电规模等级表得出;d2为该地区最低平均用电值,取每个时段的最低用电值的平均值;C2为第五模型训练值;y2为地区;
作为示例,突发子函数g3(y3)可以表示如下:
g3(y3)=C3p;
式中,p为突发事件对应的影响值;C3为第六模型训练值;y3表示突发事件;
p通过突发事件表进行查询,例如8级台风,对应有影响值为-4,例如雪灾对应的影响值为-3,高温酷暑对应的影响值为2。
优选的,突发事件还可以包括:低温指数、干旱指数、连阴雨指数;
低温指数:该时期日最低3天的最低温平均值的倒数
;
其中,t为某地区该时期日最低3天的温度。
干旱指数:该时期无降水(降水量<1mm)天数除以该时期降水量
Dry=Dnull/P;
其中,Dnull表示某地区该时期无降水(降水量<1mm)天数,P为某地区该时期降水量。
连阴雨指数:该时期连续三天及以上降水天数除以该时期无降水天数;
Run=Drun3/Dnull;
其中,Drun3表示某地区该时期连续三天及以上降水天数,Dnull表示某地区该时期无降水天数。
基准预测模型构建模块中包括:
S31、获取历史用电数据和用户基本信息;
S32、根据历史用电数据和用户基本信息对若干子函数进行组合生成基准预测模型;
基准预测模型将用户基本信息和历史用电数据作为输入,输出预测数学函数;
由于历史用电数据和湿度、气温、风况、事件等对应的子函数之间的关联性并不是独立的,例如对北部地区的用电量对低温的敏感度较高,因为北部地区会在电热上增加较多的用电量,且北部地区电热设备的配置较为完善,而相比而言,南部地区由于没有这么多的电热设备,所以即使温度较低,其用电量变化也不会如北方用电量高,而针对这种情况,就需要配置不同的预测数学函数,也就是配置不同的子函数之间的运算逻辑以及函数关系。
例如,预测数学函数有:
需要说明的是以上函数仅仅为举例,主要体现本发明通过预测决策逻辑可以生成不同的预测数学函数的组合。
对预测数学函数进行组合时,先根据输入的用户基本信息和历史用电数据判断不同子函数的敏感程度和关联度,敏感度对应每个子函数的逻辑具有平方、乘、加、减、除、开方等不同的运算方式,关联度对应每个子函数的逻辑具有乘、加、减、除不同的运算方式;
例如某地区对温度非常敏感,那么对于子函数f1(x1)可以采用平方的运算方式,而如果同时这个地区对于温度调节设备的普及率又很高,则可以通过g2(y2)和f1(x1)相乘的方式。而用户基本信息和历史用电情况分析敏感程度和关联度的策略为通过配置数据库,并设置触发条件,每一触发条件对应有关联度和敏感程度的数值,例如触发条件为区域,那么基本信息确定的区域位于区域内,就可以得到对应的敏感程度数值,通过该地区的平均每户用电量,就可以得到用电设备普及率,或历史数据中对高温或低温情况的响应特别敏感,也可以获取到气温和地区或节气的关系。
预测模型输出模块中包括:
S41、将训练集作为输入量带入不同的基准预测模型,并输出第一预测模型;
S42、将训练集作为输入量带入第一预测模型,以训练集实际供电量作为输出结果计算模型训练值;
模型训练值包括S3中提到的β1、β2、β3、C1、C2和C3,由于输入量和输出量都为已知数,输入不同的样本数据进行训练,并在训练过程中调整模型训练值的大小,以使结果更趋近于实际结果。
S43、将确定好的模型训练值代入第一预测模型,以测试集作为输入量,若输出结果的偏差值小于预设值,则通过测试输出第一预测模型作为预测模型,若偏差值大于预设值,则说明测试不通过,重新进行新的训练周期的训练,引入新的样本数据或重复训练原有样本数据。
实施例3
一种计算机设备,包括存储器、处理器以及存储在存储器中并可在处理器上运行的计算机程序,处理器执行计算机程序时把包括以下步骤:
获取样本数据集合,并依据样本数据的总偏差,将样本数据集合划分为测试集和训练集;根据样本数据集合,构建若干子函数;根据若干子函数构建基准预测模型;通过训练集对基准预测模型进行训练,训练完成后输出第一预测模型,通过测试集对第一预测模型进行测试,若测试通过则输出预测模型,若测试未通过则重新获取样本数据建立新的基准预测模型;
获取待预测数据输入预测模型获得预测供电量并输出。
实施例4
一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被处理器执行时实现上述的一种供电量预测方法。
由技术常识可知,本发明可以通过其它的不脱离其精神实质或必要特征的实施方案来实现。因此,上述公开的实施方案,就各方面而言,都只是举例说明,并不是仅有的。所有在本发明范围内或在等同于本发明的范围内的改变均被本发明包含。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本发明的具体实施方式进行修改或者等同替换,而未脱离本发明精神和范围的任何修改或者等同替换,其均应涵盖在本发明的权利要求保护范围之内。
Claims (9)
1.一种供电量预测方法,其特征在于,包括以下步骤:
获取样本数据集合,并依据样本数据的总偏差,将样本数据集合划分为测试集和训练集;根据样本数据集合,构建若干子函数;
根据若干子函数构建基准预测模型;
通过训练集对基准预测模型进行训练,训练完成后输出第一预测模型,通过测试集对第一预测模型进行测试,若测试通过则输出预测模型,若测试未通过则重新获取样本数据建立新的基准预测模型;
获取待预测数据输入预测模型获得预测供电量并输出;
所述获取样本数据集合,并依据样本数据的总偏差,将样本数据集合划分为测试集和训练集的步骤中,具体包括:
分别计算每一类型的样本项的平均值;
根据每一类型的样本项的平均值,分别计算每一样本数据中所包含的每个样本项的项偏差;
根据每个样本项的项偏差计算每一样本数据的总偏差;
根据每一样本数据的总偏差,划分测试集和训练集;
先预设测试集的数量,然后根据每一样本数据的总偏差进行排序,并按照预设顺序将样本数据加入测试集,直至满足预设测试集的数量;
所述根据若干子函数构建基准预测模型的步骤中具体包括:
获取历史用电数据和用户信息;
根据用户信息和历史用电数据判断若干子函数之间的敏感程度和关联度;
所述敏感程度对应子函数之间的平方、乘、加、减、除或开方;
所述关联度对应每个子函数的乘、加、减或除;
根据关联度和敏感程度得到若干子函数之间的运算关系,从而得到基准预测模型。
2.根据权利要求1所述的一种供电量预测方法,其特征在于,所述样本数据集合中包括气温项数据、湿度项数据、风况项数据、时间项数据、地区项数据和突发事件数据。
3.根据权利要求1所述的一种供电量预测方法,其特征在于,所述若干子函数包括气温子函数、湿度子函数、风况子函数、时间子函数、地区子函数和突发子函数。
4.根据权利要求1所述的一种供电量预测方法,其特征在于,所述根据若干子函数构建基准预测模型,具体包括以下步骤:
获取历史用电数据和用户基本信息;
根据历史用电数据和用户基本信息对若干子函数进行组合生成基准预测模型。
5.根据权利要求1所述的一种供电量预测方法,其特征在于,所述通过训练集对基准预测模型进行训练时,具体包括以下步骤:
将训练集作为输入量带入不同的基准预测模型,并输出第一预测模型;
将训练集作为输入量带入第一预测模型,以训练集实际供电量作为输出结果计算模型训练值;
将若干模型训练值代入第一预测模型,完成训练。
6.根据权利要求1所述的一种供电量预测方法,其特征在于,所述通过测试集对第一预测模型进行测试时,具体包括以下步骤:
将测试集作为第一预测模型的输入量,得到输出值;
计算输出值与测试集对应实际供电量之间的偏差值,若偏差值小于等于预设值则输出第一预测模型作为预测模型,若偏差值大于预设值则重新进行新的训练周期的训练,引入新的样本数据或重复训练原有样本数据。
7.一种供电量预测装置,其特征在于,包括:
数据获取模块:用于获取样本数据集合,并依据样本数据的总偏差,将样本数据集合划分为测试集和训练集;
子函数构建模块:用于根据样本数据集合,构建若干子函数;
预测模型输出模块:用于根据若干子函数构建基准预测模型;通过训练集对基准预测模型进行训练,训练完成后输出第一预测模型,通过测试集对第一预测模型进行测试,若测试通过则输出预测模型,若测试未通过则重新获取样本数据建立新的基准预测模型;
预测模块:用于获取待预测数据输入预测模型获得预测供电量并输出;
所述获取样本数据集合,并依据样本数据的总偏差,将样本数据集合划分为测试集和训练集的步骤中,具体包括:
分别计算每一类型的样本项的平均值;
根据每一类型的样本项的平均值,分别计算每一样本数据中所包含的每个样本项的项偏差;
根据每个样本项的项偏差计算每一样本数据的总偏差;
根据每一样本数据的总偏差,划分测试集和训练集;
先预设测试集的数量,然后根据每一样本数据的总偏差进行排序,并按照预设顺序将样本数据加入测试集,直至满足预设测试集的数量;
所述根据若干子函数构建基准预测模型的步骤中具体包括:
获取历史用电数据和用户信息;
根据用户信息和历史用电数据判断若干子函数之间的敏感程度和关联度;
所述敏感程度对应子函数之间的平方、乘、加、减、除或开方;
所述关联度对应每个子函数的乘、加、减或除;
根据关联度和敏感程度得到若干子函数之间的运算关系,从而得到基准预测模型。
8.一种计算机设备,包括存储器、处理器以及存储在存储器中并可在处理器上运行的计算机程序,其特征在于,处理器执行计算机程序时实现权利要求1-6中任一项所述的一种供电量预测方法。
9.一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被处理器执行时实现权利要求1-6中任一项所述的一种供电量预测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310803984.6A CN116526479B (zh) | 2023-07-03 | 2023-07-03 | 一种供电量预测方法、装置、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310803984.6A CN116526479B (zh) | 2023-07-03 | 2023-07-03 | 一种供电量预测方法、装置、设备及介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116526479A CN116526479A (zh) | 2023-08-01 |
CN116526479B true CN116526479B (zh) | 2023-10-13 |
Family
ID=87405121
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310803984.6A Active CN116526479B (zh) | 2023-07-03 | 2023-07-03 | 一种供电量预测方法、装置、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116526479B (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105260803A (zh) * | 2015-11-06 | 2016-01-20 | 国家电网公司 | 一种系统用电量预测方法 |
CN111899123A (zh) * | 2020-07-28 | 2020-11-06 | 深圳江行联加智能科技有限公司 | 电量预测方法、装置以及计算机可读存储介质 |
CN112183849A (zh) * | 2020-09-25 | 2021-01-05 | 贵州乌江水电开发有限责任公司 | 一种基于人工神经网络的短期电力电量预测方法 |
CN112215442A (zh) * | 2020-11-27 | 2021-01-12 | 中国电力科学研究院有限公司 | 电力系统短期负荷预测方法、系统、设备及介质 |
CN112465256A (zh) * | 2020-12-08 | 2021-03-09 | 华中科技大学 | 一种基于Stacking模型融合的楼宇用电量预测方法和系统 |
CN115130741A (zh) * | 2022-06-20 | 2022-09-30 | 北京工业大学 | 基于多模型融合的多因素电力需求中短期预测方法 |
CN115796404A (zh) * | 2022-11-10 | 2023-03-14 | 国网江苏省电力有限公司营销服务中心 | 一种面向代理购电用户的用电预测方法及系统 |
-
2023
- 2023-07-03 CN CN202310803984.6A patent/CN116526479B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105260803A (zh) * | 2015-11-06 | 2016-01-20 | 国家电网公司 | 一种系统用电量预测方法 |
CN111899123A (zh) * | 2020-07-28 | 2020-11-06 | 深圳江行联加智能科技有限公司 | 电量预测方法、装置以及计算机可读存储介质 |
CN112183849A (zh) * | 2020-09-25 | 2021-01-05 | 贵州乌江水电开发有限责任公司 | 一种基于人工神经网络的短期电力电量预测方法 |
CN112215442A (zh) * | 2020-11-27 | 2021-01-12 | 中国电力科学研究院有限公司 | 电力系统短期负荷预测方法、系统、设备及介质 |
CN112465256A (zh) * | 2020-12-08 | 2021-03-09 | 华中科技大学 | 一种基于Stacking模型融合的楼宇用电量预测方法和系统 |
CN115130741A (zh) * | 2022-06-20 | 2022-09-30 | 北京工业大学 | 基于多模型融合的多因素电力需求中短期预测方法 |
CN115796404A (zh) * | 2022-11-10 | 2023-03-14 | 国网江苏省电力有限公司营销服务中心 | 一种面向代理购电用户的用电预测方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN116526479A (zh) | 2023-08-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102855343B (zh) | 负荷量预测装置、负荷量预测方法以及负荷量预测程序 | |
CN111932402B (zh) | 一种基于相似日和lstm的短期电力负荷双向组合预测方法 | |
CN102426674A (zh) | 一种基于马尔科夫链的电力系统负荷预测方法 | |
CN111091196B (zh) | 客流数据确定方法、装置、计算机设备和存储介质 | |
CN114330935B (zh) | 基于多种结合策略集成学习的新能源功率预测方法和系统 | |
CN103854068A (zh) | 一种居民小区短期负荷预测方法 | |
CN102509173A (zh) | 一种基于马尔科夫链的电力系统负荷准确预测方法 | |
CN107730097B (zh) | 一种母线负荷预测方法、装置及计算设备 | |
CN105701570A (zh) | 一种基于全过程技术提升的短期电力需求分析方法 | |
CN108196317B (zh) | 一种用于微电网系统的气象预测方法 | |
CN106600037B (zh) | 一种基于主成分分析的多参量辅助负荷预测方法 | |
JP2014157457A (ja) | 予測装置および予測方法 | |
CN113255973A (zh) | 电力负荷预测方法、装置、计算机设备和存储介质 | |
US20190138913A1 (en) | Prediction model generation device, prediction model generation method, and recording medium | |
CN109784594A (zh) | 一种售电商可调负荷决策方法及系统 | |
WO2020118586A1 (zh) | 一种能源消耗预测方法及装置 | |
CN106600029A (zh) | 一种基于电力数据的宏观经济预测量化修正方法 | |
CN103268526A (zh) | 基于区间泰勒模型的电力系统短期负荷预测系统及方法 | |
CN112288139A (zh) | 基于混沌时间序列的空调能耗预测方法、系统及存储介质 | |
CN112036598A (zh) | 一种基于多信息耦合的充电桩使用信息预测方法 | |
CN111754029A (zh) | 一种社区负荷预测系统 | |
CN116526479B (zh) | 一种供电量预测方法、装置、设备及介质 | |
CN113053536A (zh) | 一种基于隐马尔科夫模型的传染病预测方法、系统和介质 | |
CN110795698A (zh) | 一种夏季电量分析方法及可读存储介质 | |
JPH0922402A (ja) | 日最大電力需要量予測方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |