CN117498313A - 充电站负荷预测方法、装置、存储介质及计算机设备 - Google Patents
充电站负荷预测方法、装置、存储介质及计算机设备 Download PDFInfo
- Publication number
- CN117498313A CN117498313A CN202311435186.9A CN202311435186A CN117498313A CN 117498313 A CN117498313 A CN 117498313A CN 202311435186 A CN202311435186 A CN 202311435186A CN 117498313 A CN117498313 A CN 117498313A
- Authority
- CN
- China
- Prior art keywords
- load
- data
- charging station
- load data
- regression tree
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 67
- 238000003860 storage Methods 0.000 title claims abstract description 14
- 239000013598 vector Substances 0.000 claims abstract description 59
- 238000007781 pre-processing Methods 0.000 claims abstract description 14
- 238000012544 monitoring process Methods 0.000 claims abstract description 12
- 238000012549 training Methods 0.000 claims description 42
- 230000011218 segmentation Effects 0.000 claims description 31
- 238000002790 cross-validation Methods 0.000 claims description 15
- 238000012545 processing Methods 0.000 claims description 10
- 238000010276 construction Methods 0.000 claims description 9
- 230000000694 effects Effects 0.000 claims description 9
- 238000011156 evaluation Methods 0.000 claims description 9
- 238000004590 computer program Methods 0.000 claims description 7
- 238000004422 calculation algorithm Methods 0.000 claims description 6
- 238000006243 chemical reaction Methods 0.000 claims description 4
- 230000006870 function Effects 0.000 claims description 4
- 238000005259 measurement Methods 0.000 claims description 3
- 238000012806 monitoring device Methods 0.000 claims description 3
- 230000009467 reduction Effects 0.000 claims description 3
- 238000010187 selection method Methods 0.000 claims description 3
- 238000000638 solvent extraction Methods 0.000 claims 1
- 230000009286 beneficial effect Effects 0.000 abstract description 7
- 230000008859 change Effects 0.000 description 20
- 230000008569 process Effects 0.000 description 13
- 238000004891 communication Methods 0.000 description 8
- 238000007726 management method Methods 0.000 description 7
- 238000010606 normalization Methods 0.000 description 7
- 238000005457 optimization Methods 0.000 description 5
- 238000012360 testing method Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000002159 abnormal effect Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 230000002349 favourable effect Effects 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 238000012795 verification Methods 0.000 description 3
- 238000013499 data model Methods 0.000 description 2
- 230000005611 electricity Effects 0.000 description 2
- 230000010365 information processing Effects 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 230000006399 behavior Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 238000003032 molecular docking Methods 0.000 description 1
- 238000013486 operation strategy Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000001932 seasonal effect Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H02—GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
- H02J—CIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
- H02J3/00—Circuit arrangements for ac mains or ac distribution networks
- H02J3/003—Load forecast, e.g. methods or systems for forecasting future load demand
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0637—Strategic management or analysis, e.g. setting a goal or target of an organisation; Planning actions based on goals; Analysis or evaluation of effectiveness of goals
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
- G06Q50/06—Electricity, gas or water supply
-
- H—ELECTRICITY
- H02—GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
- H02J—CIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
- H02J2203/00—Indexing scheme relating to details of circuit arrangements for AC mains or AC distribution networks
- H02J2203/20—Simulating, e g planning, reliability check, modelling or computer assisted design [CAD]
Abstract
本发明涉及新能源充电技术领域,并公开了一种充电站负荷预测方法、装置、存储介质及计算机设备,其中方法包括基于监测设备获取充电站的历史负荷数据,对历史负荷数据进行预处理,得到指定负荷数据,然后基于指定负荷数据选取负荷影响因素,并根据负荷影响因素构建特征向量,之后基于特征向量构建回归树模型,最终采用回归树模型对预设时段内的充电站的负荷进行预测。上述方法利用回归树模型对充电站负荷进行预测带来了精确预测负荷、挖掘负荷影响因素、具有很强的解释性,且能快速预测,有助于优化充电站的运营管理,提高充电服务的质量和效率。
Description
技术领域
本发明涉及新能源充电技术领域,尤其是涉及一种充电站负荷预测方法、装置、存储介质及计算机设备。
背景技术
随着电动汽车的普及,对于充电站的需求也在不断增长。充电站在对电动汽车进行充电的过程中会对电网产生较大负荷,尤其是在高峰期达到顶峰。因此,准确预测充电站的负荷可以帮助电力公司有效规划电网,避免负荷过载,提高供电可靠性。此外,充电站的负荷预测也可以帮助充电站管理者更好地安排充电桩的使用,提高充电效率和用户体验。因此,对于充电站负荷预测是电力和交通领域重要的研究方向之一。
然而,具体到实际应用场景中,充电站的负荷受到多种因素的影响,例如充电桩数量、充电速率、用户行为等等,上述因素都会使得负荷波动产生不确定性,进而导致对于负荷预测的结果准确性降低,影响后续供电规划以及供电稳定性。
发明内容
有鉴于此,本申请提供了一种充电站负荷预测方法、装置、存储介质及计算机设备,主要目的在于解决现有技术中充电站的负荷受到多种因素的影响,导致对于负荷预测不准确的技术问题。
根据本发明的第一个方面,提供了一种充电站负荷预测方法,该方法包括:
基于监测设备获取充电站的历史负荷数据,对所述历史负荷数据进行预处理,得到指定负荷数据;
基于所述指定负荷数据选取负荷影响因素,并根据所述负荷影响因素构建特征向量;
基于所述特征向量构建回归树模型;
采用所述回归树模型对预设时段内的所述充电站的负荷进行预测。
根据本发明的第二个方面,提供了一种充电站负荷预测装置,该装置包括:
数据获取模块,用于基于监测设备获取充电站的历史负荷数据,对所述历史负荷数据进行预处理,得到指定负荷数据;
向量构建模块,用于基于所述指定负荷数据选取负荷影响因素,并根据所述负荷影响因素构建特征向量;
模型构建模块,用于基于所述特征向量构建回归树模型;
模型预测模块,用于采用所述回归树模型对预设时段内的所述充电站的负荷进行预测。
根据本发明的第三个方面,提供了一种存储介质,其上存储有计算机程序,程序被处理器执行时实现上述充电站负荷预测方法。
根据本发明的第四个方面,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行程序时实现上述充电站负荷预测方法。
本发明提供的一种充电站负荷预测方法、装置、存储介质及计算机设备,首先基于监测设备获取充电站的历史负荷数据,对历史负荷数据进行预处理,得到指定负荷数据,然后基于指定负荷数据选取负荷影响因素,并根据负荷影响因素构建特征向量,之后基于特征向量构建回归树模型,最终采用回归树模型对预设时段内的充电站的负荷进行预测。在上述方法中,通过构建回归树模型,利用历史负荷数据和选取的负荷影响因素来预测充电站的负荷情况,能够准确地预测负荷变化,有助于提前做出相应的调整和决策,保障充电站的正常运行;并且通过选取负荷影响因素,可以深入了解影响充电站负荷的因素,有助于掌握负荷波动规律,调整充电设备的使用策略,从而更好地满足充电需求;而回归树模型可以直观地展示不同负荷影响因素对负荷变化的贡献程度,有助于分析和理解负荷变化的原因,并且回归树模型的训练和预测速度较快,能够迅速对充电站的负荷进行预测和调整,提高充电站的运行效率和服务质量。上述方法利用回归树模型对充电站负荷进行预测带来了精确预测负荷、挖掘负荷影响因素、具有很强的解释性,且能快速预测,有助于优化充电站的运营管理,提高充电服务的质量和效率。
上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,而可依照说明书的内容予以实施,并且为了让本申请的上述和其它目的、特征和优点能够更明显易懂,以下特举本申请的具体实施方式。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1示出了本发明实施例提供的一种充电站负荷预测方法的流程示意图;
图2示出了本发明实施例提供的一种充电站负荷预测方法的详细流程示意图;
图3示出了本发明实施例提供的一种充电站负荷预测方法中回归树模型建立的流程示意图;
图4示出了本发明实施例提供的一种充电站负荷预测方法中日均负荷影响因素的相关性热力图;
图5示出了本发明实施例提供的一种充电站负荷预测装置的结构示意图;
图6示出了本发明实施例提供的一种计算机设备的装置结构示意图。
具体实施方式
下面将参照附图更详细地描述本申请的示例性实施例。虽然附图中显示了本申请的示例性实施例,然而应当理解,可以以各种形式实现本申请而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本申请,并且能够将本申请的范围完整的传达给本领域的技术人员。
本申请实施例提供了一种充电站负荷预测方法,如图1所示,该方法包括以下步骤:
101、基于监测设备获取充电站的历史负荷数据,对历史负荷数据进行预处理,得到指定负荷数据。
具体地,充电站中具有多种监测设备来获取充电站的历史负荷数据,例如电能表,通常安装在充电站的电源输入处或每个充电桩上,用于测量和记录充电站的负荷数据,包括实时负荷、累计用电量、功率因数等信息;还有数据记录仪,可以连接到电能表或充电桩的通讯接口,定期获取并记录充电站的负荷数据,包括不同时间段的负荷曲线、负荷峰值、负荷波动等信息;而部分充电桩或充电站的管理系统具备监测和记录负荷数据的功能,可以通过相关接口或协议与充电器通信,获取历史负荷数据;还存在一些充电站采用云平台或能源管理系统进行数据监测和管理,可以通过对接云平台或能源管理系统,获取历史负荷数据。
在本申请实施例中,通过监测设备获取到的历史负荷数据通常包含一些异常值、缺失值或噪声数据,通过预处理可以进行数据清洗和过滤,去除不可靠的数据,提高数据的质量和可靠性,并且历史负荷数据往往存在较大的波动和峰谷差异,通过预处理可以进行数据平滑和平衡,降低峰谷的影响,使数据更加稳定和可靠。具体在预处理过程中,可以对历史负荷数据进行特征提取和选择,选取与负荷变化相关的特征,例如时间、季节、天气等因素,从而更好地反映负荷变化的规律,获取到的指定负荷数据的预处理可以为后续的负荷预测和优化提供数据基础。
102、基于指定负荷数据选取负荷影响因素,并根据负荷影响因素构建特征向量。
具体地,充电站的负荷通常会受到多种因素的影响,具体影响因素的选取可能会根据不同的场景和需求而有所不同,常见的影响因素包括时间因素、季节因素、天气因素、节假日因素、电价因素和用户习惯因素等,不同因素对于充电站负荷的影响程度不同,具体需要结合不同的应用场景进行分析。
在本申请实施例中,通过分析指定负荷数据,可以识别和选取对充电站负荷变化有重要影响的因素,有助于掌握负荷波动的原因和规律,有针对性地采取措施来调整充电策略,提高充电设施的利用率;本申请具体提供通过构建特征向量的方式,将负荷影响因素整合,对充电负荷的关键影响因素进行可视化分析,有助于充电站管理者更直观地理解负荷的变化规律和趋势,发现潜在的模式或异常,方便进行进一步的决策和优化;并且通过构建特征向量,可以更好地对充电站资源进行优化和调度,合理分配充电功率,提高能源利用效率。而基于选取的负荷影响因素构建特征向量,进而能够建立负荷预测或负荷优化的数学模型,用于预测未来的负荷变化趋势,
103、基于特征向量构建回归树模型。
具体地,回归树模型是一种用于解决回归问题的机器学习模型,是基于决策树的一种变体,将输入特征空间按照特征的取值范围进行划分,并在每个划分区域中拟合一个局部回归模型,从而得到对目标变量的预测。回归树模型通过递归地将特征空间划分为不同的区域来建立模型,具体划分依据是根据特征的取值进行的,以最小化每个划分区域内目标变量的方差或均方误差,在每个划分区域中,回归树模型会拟合一个常数值,此常数值通常是该区域内目标变量的均值或中位数,在预测时能够根据输入特征的取值,使得回归树模型给出相应的目标变量预测值。
在本申请实施例中,基于特征向量构建回归树模型,与其他传统的线性回归模型相比,回归树模型能够处理非线性关系,具体在每个划分区域内可以采用不同的回归模型,从而适应不同的数据模式;而回归树模型的构建过程类似于决策过程,每个划分区域代表一个决策条件,因此回归树模型得到的预测结果具有直观的解释性;并且回归树模型的预测是基于局部的回归模型,对异常点和噪声有一定的容忍度,能够减少异常点对整体模型的影响。
104、采用回归树模型对预设时段内的充电站的负荷进行预测。
在本申请实施例中,回归树模型可以根据充电站的历史数据和其他相关特征,对预设时段内的负荷进行准确的预测,通过分析特征与负荷之间的非线性关系,能够较好地捕捉到负荷的变化趋势,通过特征的选择和分裂过程来评估特征的重要性,更好地理解哪些因素对充电站负荷的影响较大,从而指导优化方案的制定和改进运营策略,并且对负荷预测结果具有很好的解释性。其中,回归树模型可以快速构建和更新,一旦模型建立完成,预测过程可以在很短的时间内完成,实现实时性的负荷预测,使得运营人员能够根据预测结果及时做出调度和优化决策。
本发明提供的一种充电站负荷预测方法、装置、存储介质及计算机设备,首先基于监测设备获取充电站的历史负荷数据,对历史负荷数据进行预处理,得到指定负荷数据,然后基于指定负荷数据选取负荷影响因素,并根据负荷影响因素构建特征向量,之后基于特征向量构建回归树模型,最终采用回归树模型对预设时段内的充电站的负荷进行预测。在上述方法中,通过构建回归树模型,利用历史负荷数据和选取的负荷影响因素来预测充电站的负荷情况,能够准确地预测负荷变化,有助于提前做出相应的调整和决策,保障充电站的正常运行;并且通过选取负荷影响因素,可以深入了解影响充电站负荷的因素,有助于掌握负荷波动规律,调整充电设备的使用策略,从而更好地满足充电需求;而回归树模型可以直观地展示不同负荷影响因素对负荷变化的贡献程度,有助于分析和理解负荷变化的原因,并且回归树模型的训练和预测速度较快,能够迅速对充电站的负荷进行预测和调整,提高充电站的运行效率和服务质量。上述方法利用回归树模型对充电站负荷进行预测带来了精确预测负荷、挖掘负荷影响因素、具有很强的解释性,且能快速预测,有助于优化充电站的运营管理,提高充电服务的质量和效率。
本申请实施例提供了一种充电站负荷预测方法,如图2所示,该方法包括以下步骤:
201、基于监测设备获取充电站的历史负荷数据,对历史负荷数据进行预处理,得到指定负荷数据。
具体地,首先从充电站的后台数据库中获取历史负荷数据,历史负荷数据包括充电站下不同充电桩内不同充电枪的详细数据,然后基于预设处理规则指示的待删除数据,删除历史负荷数据中与待删除数据匹配的数据,剩余的历史负荷数据作为指定负荷数据,其中,指定负荷数据包括历史负荷、气温和节假日信息。
在本申请实施例中,从充电站的后台数据库中获取的历史负荷数据包括了不同充电桩内不同充电枪的详细数据,通过提取以上详细数据,并将详细数据与其他相关信息,例如气温以及节假日信息等数据结合在一起,可以得到更完整的指定负荷数据集,为后续的预测建模提供更丰富的特征。在获取历史负荷数据之后,将历史负荷数据保存到指定负荷数据集中,便于访问及使用这些数据,以进行负荷预测、分析和其他相关任务,提高了数据的可用性,便于后续的数据处理和模型训练。其中,对历史负荷数据进行预处理的方式具体包括删除与预设处理规则匹配的待删除数据,以清洗历史负荷数据,去除不符合要求或者错误的数据,进而提高数据的准确性,确保后续建模和分析的可靠性。再然后通过得到指定负荷数据,来训练负荷预测模型,进而能够基于历史负荷、气温和节假日等特征,建立模型来预测未来充电站的负荷情况,对于充电站的调度及优化决策非常有益,以达到合理安排充电桩资源和提高充电效率的效果。
202、基于指定负荷数据选取负荷影响因素,并根据负荷影响因素构建特征向量。
具体地,首先设定预测负荷值为输出值,设定预设负荷影响因素作为输入向量,其中,负荷影响因素包括用户充电习惯因素、工作日判定因素、气象因素,然后按照负荷影响因素对指定负荷数据进行特征提取,选取每个输入样本数据的六维输入向量,其中,指定负荷数据包括多个输入样本数据,六维输入向量包括当日负荷极值、当日气温极值、天气类型、工作日信息、前五日的平均负荷和前一天的气温极值,具体对天气类型进行定性特征哑编码,将天气类型从文本类型转变为数值型。
其中,哑编码是一种把分类变量转换成二进制向量表示的编码方法,在机器学习和统计分析中,由于很多数据模型只能处理数值型的变量,而不能直接处理分类变量,因此为了能够在数据模型中使用分类变量,需要将分类变量转换为数值型的变量,而哑编码就是一种常用的转换方法。哑编码的基本思想是为每个分类变量的每个取值创建一个新的二进制变量,当观测值所属的分类变量取值为某一特定取值时,相应的二进制变量取值为1,其他二进制变量取值为0,这样,通过哑编码,使得每个分类变量的每个取值都可以被表示成一个独立的二进制变量。
在本申请实施例中,通过将用户充电习惯因素、工作日判定因素和气象因素作为输入向量,综合考虑以上因素对负荷的影响,有助于更全面地理解和分析负荷变化的原因,提高负荷预测的准确性。进一步对指定负荷数据进行特征提取,并选取每个输入样本数据的六维输入向量,能够聚焦于关键特征,并降低输入的维度,提高模型的计算效率,并避免冗余特征对预测结果的干扰。而将前五日的平均负荷和前一天的气温极值作为输入向量的一部分,可以利用历史负荷和气温的信息来捕捉负荷的趋势和季节性变化,进一步提高模型对负荷在不同时间段的预测准确性。而其中的天气类型为文本类型,对天气类型进行哑编码,将天气类型从文本类型转换为数值型,进而将天气类型作为定性特征纳入到模型中,有助于捕捉不同天气类型对负荷的影响,并提升模型对气象因素的预测能力。
203、对数据进行归一化操作,把数据集各个维度的属性值进行归一化处理,所有属性值的取值范围缩放到[0,1]区间。
具体地,根据指定负荷数据,确定训练样本集,对训练样本集中的输入样本数据进行归一化处理,将输入样本数据的六维输入向量的每一维归一化到[0,1]区间内,公式如下:
其中,X为转换前的输入向量值,Xnorm为转换后的输入向量值,Xmax为样本最大值,Xmin为样本最小值;
归一化后的训练样本集D={(x1,y1),(x2,y2),…,(xi,yi),…(xn,yn)},其中xi是一个m维的向量,具有m个特征,yi为指定负荷数据,根据归一化后的训练样本集和已有的特征进行特征选择以及样本集划分,递归构建回归树模型。
在本申请实施例中,由于在很多机器学习算法中,输入数据的值域范围对训练效率和最终模型的质量影响很大,而对不同的特征进行了归一化使得特征权重之间可以平等地相互比较,提高了算法的训练速度以及迭代优化的效率。利用数据归一化处理能够解决特征间尺度差异问题,避免模型过分关注某些尺度较大的特征,从而使得模型更具泛化能力,并且由于数据的各个维度之间具有不同的尺度或者数量级,采用归一化处理能够减少误差的传播,从而提高模型精度,还能避免部分过大或过小的数据值产生过拟合,达到一定的正则化的效果,降低模型的过拟合风险。
204、根据归一化后的训练样本集和已有的特征进行特征选择以及样本集划分,然后递归构建回归树模型。
具体地,使用基于均方差减少的特征选择方法,选择最优切分变量j与切分点s,均方差公式如下:
其中c1,c2为父节点被划分后得到的两个样本集的均值,yi为所述指定负荷数据,R1(j,s)和R2(j,s)为将父节点的输入空间一分为二后得到的两个数据集;
遍历变量j,利用所述均方差公式对固定的切分变量j进行计算,得到使均方差最小的切分变量与切分点对(j,s);
用选定的所述切分变量与切分点对(j,s)划分区域并决定相应的输出值,具体公式如下:
R1{j,s}={x|x(f)≤s}
R2{j,s}={x x(f)>s}
其中,x(f)为特征向量中的第f个特征,cm为对应数据集的均值,Nm为对应数据集中数据个数,s为训练样本集的最优切分点;
对两个子区域重复进行以上步骤,直至无法再找到能够减少均方差的划分;
将所述训练样本集划分为M个区域R1,R2,…,RM,生成所述回归树模型,生成公式如下:
其中,Rm为所述训练样本集划分出的子集,x为Rm中的负荷数据,cm为对应数据集的均值,I为指示函数,具体表示为:
本申请构建回归树模型的过程具体包括从训练样本集中选择最优划分变量与切分点,在回归树模型中,通过计算划分过后每个区域的均方差来评估划分的质量,均方差衡量了各个样本点的输出值与区域内样本输出均值的差异程度,通过遍历所有特征变量,并针对每个变量的所有可能切分点,计算对应的均方差,最后选择能够使均方差最小的切分变量与切分点对。再根据选定的切分变量与切分点对,将训练样本集划分为两个子区域:一个满足切分变量小于等于切分点条件的子区域,另一个满足切分变量大于切分点条件的子区域,然后,为每个子区域确定相应的输出值。一种常见的选择方式是,以子区域内样本输出值的均值作为输出值。对于两个子区域,重复以上步骤,即进行特征选择,具体选择最优划分变量与切分点,和区域划分与输出值确定,不断地递归操作,直到无法再找到能够减少均方差的划分,或者达到了预定的停止条件,进而生成了回归树模型。
在本实施方式中,通过计算不同切分变量与切分点组合的均方差,能够选择对于回归问题最相关的切分变量与切分点,进而优先选择对回归模型影响最大的特征,提高模型的预测能力,而通过区域划分,能够更好地捕捉数据的局部特征和非线性关系,提高模型的拟合能力;递归地进行特征选择、区域划分与输出值确定,生成的回归树模型可以灵活地适应不同数据集的复杂关系,并可以处理多种变量类型,并且由于树状结构的特性,模型可以快速进行预测,适合于大规模数据集和高维特征。最后,回归树模型可以提供可解释性的结果,通过观察树的结构和划分规则,可以理解特征的重要性和影响程度,有助于对问题的理解和解释,为决策提供参考,同时,回归树模型在处理噪声和异常值方面具有一定的鲁棒性。通过进行区域划分,异常值和噪声对整个模型的影响被限制在划分的局部区域,减小了异常值对整体模型的干扰。
205、进行v折交叉验证。
具体地,利用交叉验证算法将数据集平均分成v份;利用v-1个子集去训练,用训练得到的模型去预测最后一个v子集,通过计算交叉验证的准确率取得合理的参数,其中,交叉验证的准确率指示正确划分数据占数据集的百分比。
在本申请实施例中,通过将数据集平均分成v份,并使用v-1个子集进行模型训练和最后一个子集的预测,可以得到多个模型性能评估结果,进而准确地评估模型的泛化能力,避免因为单一的训练-测试集划分而引入偏差,交叉验证通过对多个子集的综合评估,提供了对模型性能的更全面和准确的评估,并且能够调节模型的复杂度、避免过拟合或欠拟合,得到更优的模型。在数据有限的情况下,交叉验证可以更好地利用可用的数据,通过将样本划分为不同的训练和测试集,可以最大限度地使用数据,提供更可靠的模型评估,避免过多地依赖单个数据集划分带来的偏差。而通过交叉验证得到多个模型性能评估结果,可以比较不同模型或算法的性能,从而选择最合适的模型,同时还能够提供模型的稳定性评估,通过对不同训练和测试集组合进行多次实验,得到交叉验证的准确率的方差,可以量化模型的稳定性,较小的方差表示模型对数据集的变化更加稳定,提高了模型的可靠性。
206、确定模型参数是否负荷评判标准,如果不符合,则继续对模型进行交叉验证。
具体地,回归树模型的预测效果评判标准分别为回归树模型的平均相对误差、均方根误差和决定系数;
平均相对误差的公式为:
均方根误差的公式为:
决定系数的公式为:
其中,n为样本数量;yi为预测值;为实测值;/>为实测值的均值。
在本申请实施例中,回归树模型中预测效果最佳的条件是在给定数据集上相对误差最小、均方根误差最小和决定系数最大的情况。其中,平均相对误差衡量预测值相对于真实值的平均百分比误差,预测效果最佳的情况下,MAE的值应该接近于零或非常小;均方根误差用于衡量预测值与真实值之间的差异程度,在预测效果最佳的情况下,RMSE的值应该接近于零或非常小。较小的RMSE值意味着回归树模型的预测能力更好;决定系数衡量模型对观测数据的解释能力,预测效果最佳的情况下,决定系数的值应该接近于1,接近1的决定系数意味着模型能够更好地解释数据的变化。
207、结合预测负荷值和测试负荷值对充电站进行负荷预测。
具体地,获取满足所述平均相对误差最小,且所述均方根误差最小,且所述决定系数最大的回归树模型对预设时段内的所述充电站的负荷进行预测。
在本申请实施例中,回归树模型预测效果最佳的条件是平均相对误差接近于零或非常小、均方根误差接近于零或非常小,以及决定系数接近于1,满足以上参数标准的回归树模型能够在数据集上准确预测并解释数据的变化。
本发明提供的一种充电站负荷预测方法、装置、存储介质及计算机设备,其中回归树模型的训练方法如图3所示,具体包括:首先对数据进行归一化操作,把数据集各个维度的属性值进行归一化处理,所有属性值的取值范围缩放到[0,1]区间,然后根据归一化后的训练样本集和已有的特征进行特征选择以及样本集划分,然后递归构建回归树模型,之后进行v-折交叉验证;再判断训练后的模型的参数是否符合标准,如果符合标准,则进行负荷预测,如果不符合,则继续对模型进行交叉验证,最终结合预测负荷值和测试负荷值对充电站进行负荷预测。上述方法中,采用归一化、特征选择、回归树模型和交叉验证进行负荷预测的过程可以提高模型的预测能力、提供合理的参数选择、减少冗余特征和干扰、处理非线性关系,以及支持负荷预测和资源管理的决策,有助于改善负荷预测的准确性和实用性。
具体地,如图4所示,为本发明实施例提供的一种充电站负荷预测方法得到的日均负荷影响因素的相关性热力图,其中,数据项包括当日最大最小功率、当日最大最小气温、是否工作日、月份、前五日平均功率和前一日的最大最小气温,而数据项之间正值为正相关,负值为负相关,值越大相关性越强。
进一步地,作为图1方法的具体实现,本申请实施例提供了一种充电站负荷预测装置,如图5所示,装置包括:数据获取模块301、向量构建模块302、模型构建模块303和模型预测模块304。
数据获取模块301,用于基于监测设备获取充电站的历史负荷数据,对所述历史负荷数据进行预处理,得到指定负荷数据;
向量构建模块302,用于基于所述指定负荷数据选取负荷影响因素,并根据所述负荷影响因素构建特征向量;
模型构建模块303,用于基于所述特征向量构建回归树模型;
模型预测模块304,用于采用所述回归树模型对预设时段内的所述充电站的负荷进行预测。
在具体的应用场景中,数据获取模块301具体可用于从所述充电站的后台数据库中获取所述历史负荷数据,所述历史负荷数据包括所述充电站下不同充电桩内不同充电枪的详细数据;基于预设处理规则指示的待删除数据,删除所述历史负荷数据中与所述待删除数据匹配的数据,剩余的历史负荷数据作为所述指定负荷数据,其中,所述指定负荷数据包括历史负荷、气温和节假日信息
在具体的应用场景中,向量构建模块302,具体可用于设定预测负荷值为输出值,设定预设负荷影响因素作为输入向量,其中,所述负荷影响因素包括用户充电习惯因素、工作日判定因素、气象因素;按照所述负荷影响因素对所述指定负荷数据进行特征提取,选取每个输入样本数据的六维输入向量,其中,所述指定负荷数据包括多个输入样本数据,所述六维输入向量包括当日负荷极值、当日气温极值、天气类型、工作日信息、前五日的平均负荷和前一天的气温极值;对所述天气类型进行定性特征哑编码,将所述天气类型从文本类型转变为数值型。
在具体的应用场景中,模型构建模块303,具体可用于根据所述指定负荷数据,确定训练样本集,对所述训练样本集中的输入样本数据进行归一化处理,将所述输入样本数据的六维输入向量的每一维归一化到[0,1]区间内,公式如下:
其中,X为转换前的输入向量值,Xnorm为转换后的输入向量值,Xmax为样本最大值,Xmin为样本最小值;
归一化后的训练样本集D={(x1,y1),(x2,y2),…,(xi,yi),…(xn,yn)},其中xi是一个m维的向量,具有m个特征,yi为所述指定负荷数据。
根据所述归一化后的训练样本集和已有的特征进行特征选择以及样本集划分,递归构建所述回归树模型。
在具体的应用场景中,模型构建模块303,具体可用于使用基于均方差减少的特征选择方法,选择最优切分变量j与切分点s,均方差公式如下:
其中c1,c2为父节点被划分后得到的两个样本集的均值,yi为所述指定负荷数据,R1(j,s)和R2(j,s)为将父节点的输入空间一分为二后得到的两个数据集;
遍历变量j,利用所述均方差公式对固定的切分变量j进行计算,得到使均方差最小的切分变量与切分点对(j,s);
用选定的所述切分变量与切分点对(j,s)划分区域并决定相应的输出值,具体公式如下:
R1{j,s}={x|x(f)≤s}
R2{j,s}={x|x(f)>s}
其中,x(f)为特征向量中的第f个特征,cm为对应数据集的均值,Nm为对应数据集中数据个数,s为训练样本集的最优切分点;
对两个子区域重复进行以上步骤,直至无法再找到能够减少均方差的划分;
将所述训练样本集划分为M个区域R1,R2,…,RM,生成所述回归树模型,生成公式如下:
其中,Rm为所述训练样本集划分出的子集,x为Rm中的负荷数据,cm为对应数据集的均值,I为指示函数,具体表示为:
利用交叉验证算法将数据集平均分成v份;利用v-1个子集去训练,用训练得到的模型去预测最后一个v子集,通过计算交叉验证的准确率取得合理的参数,其中,所述交叉验证的准确率指示正确划分数据占数据集的百分比。
在具体的应用场景中,模型构建模块303,具体可用于回归树模型的预测效果评判标准分别为所述回归树模型的平均相对误差、均方根误差和决定系数;
所述平均相对误差的公式为:
所述均方根误差的公式为:
所述决定系数的公式为:
其中,n为样本数量;yi为预测值;为实测值;/>为实测值的均值。
需要说明的是,本实施例提供的一种充电站负荷预测装置所涉及各功能单元的其它相应描述,可以参考图2和图3中的对应描述,在此不再赘述。
在具体的应用场景中,模型预测模块304,具体可用于获取满足所述平均相对误差最小,且所述均方根误差最小,且所述决定系数最大的回归树模型对预设时段内的所述充电站的负荷进行预测。
基于上述如图1所示方法,相应的,本实施例还提供了一种存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述充电站负荷预测方法。
基于这样的理解,本申请的技术方案可以以软件产品的形式体现出来,该待识别软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施场景充电站负荷预测方法。
基于上述如图1和图2所示的方法,以及图5所示的充电站负荷预测装置实施例,为了实现上述目的,如图6所示,本实施例还提供了充电站负荷预测的实体设备,该设备包括通信总线、处理器、存储器和通信接口,还可以包括输入输出接口和显示设备,其中,各个功能单元之间可以通过总线完成相互间的通信。该存储器存储有计算机程序,处理器,用于执行存储器上所存放的程序,执行上述实施例中充电站负荷预测方法。
可选的,该实体设备还可以包括用户接口、网络接口、摄像头、射频(RadioFrequency,RF)电路,传感器、音频电路、WI-FI模块等等。用户接口可以包括显示屏(Display)、输入单元比如键盘(Keyboard)等,可选用户接口还可以包括USB接口、读卡器接口等。网络接口可选的可以包括标准的有线接口、无线接口(如WI-FI接口)等。
本领域技术人员可以理解,本实施例提供的一种充电站负荷预测实体设备结构并不构成对该实体设备的限定,可以包括更多或更少的部件,或者组合某些部件,或者不同的部件布置。
存储介质中还可以包括操作系统、网络通信模块。操作系统是管理上述实体设备硬件和待识别软件资源的程序,支持信息处理程序以及其它待识别软件和/或程序的运行。网络通信模块用于实现存储介质内部各组件之间的通信,以及与信息处理实体设备中其它硬件和软件之间通信。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本申请可以借助软件加必要的通用硬件平台的方式来实现,也可以通过硬件实现。通过应用本申请的技术方案,首先基于监测设备获取充电站的历史负荷数据,对历史负荷数据进行预处理,得到指定负荷数据,然后基于指定负荷数据选取负荷影响因素,并根据负荷影响因素构建特征向量,之后基于特征向量构建回归树模型,最终采用回归树模型对预设时段内的充电站的负荷进行预测。在上述方法中,通过构建回归树模型,利用历史负荷数据和选取的负荷影响因素来预测充电站的负荷情况,能够准确地预测负荷变化,有助于提前做出相应的调整和决策,保障充电站的正常运行;并且通过选取负荷影响因素,可以深入了解影响充电站负荷的因素,有助于掌握负荷波动规律,调整充电设备的使用策略,从而更好地满足充电需求;而回归树模型可以直观地展示不同负荷影响因素对负荷变化的贡献程度,有助于分析和理解负荷变化的原因,并且回归树模型的训练和预测速度较快,能够迅速对充电站的负荷进行预测和调整,提高充电站的运行效率和服务质量。上述方法利用回归树模型对充电站负荷进行预测带来了精确预测负荷、挖掘负荷影响因素、具有很强的解释性,且能快速预测,有助于优化充电站的运营管理,提高充电服务的质量和效率。
本领域技术人员可以理解附图只是一个优选实施场景的示意图,附图中的模块或流程并不一定是实施本申请所必须的。本领域技术人员可以理解实施场景中的装置中的模块可以按照实施场景描述进行分布于实施场景的装置中,也可以进行相应变化位于不同于本实施场景的一个或多个装置中。上述实施场景的模块可以合并为一个模块,也可以进一步拆分成多个子模块。
上述本申请序号仅仅为了描述,不代表实施场景的优劣。以上公开的仅为本申请的几个具体实施场景,但是,本申请并非局限于此,任何本领域的技术人员能思之的变化都应落入本申请的保护范围。
Claims (10)
1.一种充电站负荷预测方法,其特征在于,所述方法包括:
基于监测设备获取充电站的历史负荷数据,对所述历史负荷数据进行预处理,得到指定负荷数据;
基于所述指定负荷数据选取负荷影响因素,并根据所述负荷影响因素构建特征向量;
基于所述特征向量构建回归树模型;
采用所述回归树模型对预设时段内的所述充电站的负荷进行预测。
2.根据权利要求1所述的方法,其特征在于,所述基于监测设备获取充电站的历史负荷数据,对所述历史负荷数据进行预处理,得到指定负荷数据,包括:
从所述充电站的后台数据库中获取所述历史负荷数据,所述历史负荷数据包括所述充电站下不同充电桩内不同充电枪的详细数据;
基于预设处理规则指示的待删除数据,删除所述历史负荷数据中与所述待删除数据匹配的数据,剩余的历史负荷数据作为所述指定负荷数据,其中,所述指定负荷数据包括历史负荷、气温和节假日信息。
3.根据权利要求2所述的方法,其特征在于,所述基于所述指定负荷数据选取负荷影响因素,并根据所述负荷影响因素构建特征向量,包括:
设定预测负荷值为输出值,设定预设负荷影响因素作为输入向量,其中,所述负荷影响因素包括用户充电习惯因素、工作日判定因素、气象因素;
按照所述负荷影响因素对所述指定负荷数据进行特征提取,选取每个输入样本数据的六维输入向量,其中,所述指定负荷数据包括多个输入样本数据,所述六维输入向量包括当日负荷极值、当日气温极值、天气类型、工作日信息、前五日的平均负荷和前一天的气温极值;
对所述天气类型进行定性特征哑编码,将所述天气类型从文本类型转变为数值型。
4.根据权利要求3所述的方法,其特征在于,所述基于所述特征向量构建回归树模型,包括:
根据所述指定负荷数据,确定训练样本集,对所述训练样本集中的输入样本数据进行归一化处理,将所述输入样本数据的六维输入向量的每一维归一化到[0,1]区间内,公式如下:
其中,X为转换前的输入向量值,Xnorm为转换后的输入向量值,Xmax为样本最大值,Xmin为样本最小值;
归一化后的训练样本集D={(x1,y1),(x2,y2),…,(xi,yi),…(xn,yn)},其中xi是一个m维的向量,具有m个特征,yi为所述指定负荷数据。
根据所述归一化后的训练样本集和已有的特征进行特征选择以及样本集划分,递归构建所述回归树模型。
5.根据权利要求4所述的方法,其特征在于,所述根据所述归一化后的训练样本集和已有的特征进行特征选择以及样本集划分,递归构建所述回归树模型,包括:
使用基于均方差减少的特征选择方法,选择最优切分变量j与切分点s,均方差公式如下:
其中c1,c2为父节点被划分后得到的两个样本集的均值,yi为所述指定负荷数据,R1(j,s)和R2(j,s)为将父节点的输入空间一分为二后得到的两个数据集;
遍历变量j,利用所述均方差公式对固定的切分变量j进行计算,得到使均方差最小的切分变量与切分点对(j,s);
用选定的所述切分变量与切分点对(j,s)划分区域并决定相应的输出值,具体公式如下:
R1{j,s}={x|x(f)≤s}
R2{j,s}={x|x(f)>s}
其中,x(f)为特征向量中的第f个特征,cm为对应数据集的均值,Nm为对应数据集中数据个数,s为训练样本集的最优切分点;
对两个子区域重复进行以上步骤,直至无法再找到能够减少均方差的划分;
将所述训练样本集划分为M个区域R1,R2,…,RM,生成所述回归树模型,生成公式如下:
其中,Rm为所述训练样本集划分出的子集,x为Rm中的负荷数据,cm为对应数据集的均值,I为指示函数,具体表示为:
利用交叉验证算法将数据集平均分成v份;利用v-1个子集去训练,用训练得到的模型去预测最后一个v子集,通过计算交叉验证的准确率取得合理的参数,其中,所述交叉验证的准确率指示正确划分数据占数据集的百分比。
6.根据权利要求5所述的方法,其特征在于,所述回归树模型的预测效果评判标准分别为所述回归树模型的平均相对误差、均方根误差和决定系数;
所述平均相对误差的公式为:
所述均方根误差的公式为:
所述决定系数的公式为:
其中,n为样本数量;yi为预测值;为实测值;/>为实测值的均值。
7.根据权利要求6所述的方法,其特征在于,所述采用所述回归树模型对预设时段内的所述充电站的负荷进行预测,包括:
获取满足所述平均相对误差最小,且所述均方根误差最小,且所述决定系数最大的回归树模型对预设时段内的所述充电站的负荷进行预测。
8.一种充电站负荷预测装置,其特征在于,所述装置包括:
数据获取模块,用于基于监测设备获取充电站的历史负荷数据,对所述历史负荷数据进行预处理,得到指定负荷数据;
向量构建模块,用于基于所述指定负荷数据选取负荷影响因素,并根据所述负荷影响因素构建特征向量;
模型构建模块,用于基于所述特征向量构建回归树模型;
模型预测模块,用于采用所述回归树模型对预设时段内的所述充电站的负荷进行预测。
9.一种存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
10.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311435186.9A CN117498313A (zh) | 2023-10-31 | 2023-10-31 | 充电站负荷预测方法、装置、存储介质及计算机设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311435186.9A CN117498313A (zh) | 2023-10-31 | 2023-10-31 | 充电站负荷预测方法、装置、存储介质及计算机设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117498313A true CN117498313A (zh) | 2024-02-02 |
Family
ID=89684048
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311435186.9A Pending CN117498313A (zh) | 2023-10-31 | 2023-10-31 | 充电站负荷预测方法、装置、存储介质及计算机设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117498313A (zh) |
-
2023
- 2023-10-31 CN CN202311435186.9A patent/CN117498313A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110610280B (zh) | 一种电力负荷短期预测方法、模型、装置及系统 | |
Hu et al. | A hybrid forecasting approach applied to wind speed time series | |
US9047559B2 (en) | Computer-implemented systems and methods for testing large scale automatic forecast combinations | |
CN109886430A (zh) | 一种基于工业大数据的设备健康状态评估与预测方法 | |
CN112182720B (zh) | 一种基于建筑能源管理应用场景的建筑能耗模型评价方法 | |
EP1851571A2 (en) | System and method for enhanced measure-correlate-predict for a wind farm location | |
CN110930198A (zh) | 基于随机森林的电能替代潜力预测方法、系统、存储介质及计算机设备 | |
CN111738331A (zh) | 用户分类方法及装置、计算机可读存储介质、电子设备 | |
CN114583767B (zh) | 一种数据驱动的风电场调频响应特性建模方法及系统 | |
KR20190004605A (ko) | 에너지 시뮬레이션 모델 생성 장치 및 방법 | |
Mishra et al. | Performance evaluation of prophet and STL-ETS methods for load forecasting | |
CN117113159A (zh) | 基于深度学习的电力用户侧负荷分类方法及系统 | |
CN111199493A (zh) | 一种基于客户缴费信息及征信信息的欠费风险识别方法 | |
CN117595391A (zh) | 一种电网系统的协调控制方法 | |
CN107590747A (zh) | 基于综合能源大数据分析的电网资产周转率计算方法 | |
CN116308883A (zh) | 一种基于大数据的区域电网数据统筹管理系统 | |
CN117498313A (zh) | 充电站负荷预测方法、装置、存储介质及计算机设备 | |
CN113610225A (zh) | 质量评估模型训练方法、装置、电子设备及存储介质 | |
Ceresa et al. | Verification and upgrades of an advanced technique to model forecast uncertainties in large power systems | |
CN113487080B (zh) | 一种基于风速分类的风速动态场景生成方法、系统及终端 | |
FOLORUNSO | Empirical Comparison of Time Series Data Mining Algorithms | |
Sinitsyna et al. | Some practical aspects of electric power consumption time series analysis | |
CN116957306B (zh) | 基于资源协同互动的用户侧响应潜力评估方法及系统 | |
Sinitsyna et al. | Identification of Electric Power Consumption Patterns in Relation to Standard Load Profiles | |
Wu et al. | Unveiling bidding uncertainties in electricity markets: A Bayesian deep learning framework based on accurate variational inference |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |