CN115423201A - 发电量数据预测方法、装置、设备及计算机可读存储介质 - Google Patents
发电量数据预测方法、装置、设备及计算机可读存储介质 Download PDFInfo
- Publication number
- CN115423201A CN115423201A CN202211137513.8A CN202211137513A CN115423201A CN 115423201 A CN115423201 A CN 115423201A CN 202211137513 A CN202211137513 A CN 202211137513A CN 115423201 A CN115423201 A CN 115423201A
- Authority
- CN
- China
- Prior art keywords
- power station
- design scheme
- station design
- power generation
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000010248 power generation Methods 0.000 title claims abstract description 268
- 238000000034 method Methods 0.000 title claims abstract description 112
- 238000013461 design Methods 0.000 claims abstract description 686
- 238000012360 testing method Methods 0.000 claims description 68
- 238000012549 training Methods 0.000 claims description 28
- 238000004088 simulation Methods 0.000 claims description 17
- 238000004364 calculation method Methods 0.000 claims description 11
- 238000000513 principal component analysis Methods 0.000 claims description 11
- 238000003064 k means clustering Methods 0.000 claims description 8
- 238000001514 detection method Methods 0.000 claims description 3
- 238000004891 communication Methods 0.000 description 6
- 239000011159 matrix material Substances 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 4
- 238000012938 design process Methods 0.000 description 4
- 238000005457 optimization Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 238000012935 Averaging Methods 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- H—ELECTRICITY
- H02—GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
- H02J—CIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
- H02J3/00—Circuit arrangements for ac mains or ac distribution networks
- H02J3/004—Generation forecast, e.g. methods or systems for forecasting future energy generation
-
- H—ELECTRICITY
- H02—GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
- H02J—CIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
- H02J2203/00—Indexing scheme relating to details of circuit arrangements for AC mains or AC distribution networks
- H02J2203/20—Simulating, e g planning, reliability check, modelling or computer assisted design [CAD]
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Health & Medical Sciences (AREA)
- Marketing (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Tourism & Hospitality (AREA)
- Quality & Reliability (AREA)
- Development Economics (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Power Engineering (AREA)
- Entrepreneurship & Innovation (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Supply And Distribution Of Alternating Current (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种发电量数据预测方法、装置、设备及计算机可读存储介质,所述方法包括:获取目标电站设计方案的第一关键设计参数值;根据所述第一关键设计参数值,检测在预设数据库内的各个现有电站设计方案中,是否存在与所述目标电站设计方案相匹配的目标现有电站设计方案;若是,则将所述目标现有电站设计方案对应的第一发电量数据,确定为所述目标电站设计方案对应的第二发电量数据;若否,则根据所述第一关键设计参数值、所述现有电站设计方案和K最邻近法,预测所述目标电站设计方案对应的第二发电量数据。本发明有效缩短了确定目标电站设计方案对应的第二发电量数据的时间,进而有效提高了电站的目标电站设计方案寻优的效率。
Description
技术领域
本发明涉及光伏电站技术领域,尤其涉及一种发电量数据预测方法、装置、设备及计算机可读存储介质。
背景技术
在光伏电站设计流程中,电站主体方案的设计作为流程中的重要环节,电站主体方案的优劣直接影响光伏电站生命周期的投资收益,目前,主要采用人工方式进行电站主体方案设计。为了节约人力成本,降低人为操作产生的误差,也可以基于遍历全部电站设计方案的方式自动进行方案寻优,从众多电站设计方案中确定最优的目标电站设计方案,然而,遍历全部电站设计方案的方式需要确定每一个电站设计方案对应的发电量数据,进而基于发电量数据计算投资成本和投资收益,目前是通过PVsyst软件仿真发电量数据进行确定的然而,PVsyst软件仿真发电量数据的耗时较长,随着电站设计方案数量的增加,获取全部电站设计方案的发电量数据往往需要数小时乃至数十小时以上。
发明内容
本发明的主要目的在于提供一种发电量数据预测方法、装置、设备及计算机可读存储介质,旨在解决通过仿真的方式确定发电量数据的耗时较长的技术问题。
为实现上述目的,本发明提供一种发电量数据预测方法,所述发电量数据预测方法包括以下步骤:
获取目标电站设计方案的第一关键设计参数值;
根据所述第一关键设计参数值,检测在预设数据库内的各个现有电站设计方案中,是否存在与所述目标电站设计方案相匹配的目标现有电站设计方案;
若是,则将所述目标现有电站设计方案对应的第一发电量数据,确定为所述目标电站设计方案对应的第二发电量数据;
若否,则根据所述第一关键设计参数值、所述现有电站设计方案和K最邻近法,预测所述目标电站设计方案对应的第二发电量数据。
可选地,所述根据所述第一关键设计参数值、所述现有电站设计方案和K最邻近法,预测所述目标电站设计方案对应的第二发电量数据的步骤包括:
根据所述第一关键设计参数值,从所述现有电站设计方案中,确定所述目标电站设计方案对应的K组最邻近现有电站设计方案;
根据所述最邻近现有电站设计方案对应的第三发电量数据,确定所述目标电站设计方案对应的第二发电量数据。
可选地,所述第一关键设计参数值包括第一经纬度,所述根据所述第一关键设计参数值,从所述现有电站设计方案中,确定所述目标电站设计方案对应的K组最邻近现有电站设计方案的步骤包括:
根据所述第一经纬度以及所述现有电站设计方案的第二经纬度,从各所述现有电站设计方案中,确定与所述目标电站设计方案距离最近的K组最邻近现有电站设计方案,其中,属于同一组的各个最邻近现有电站设计方案的经纬度相同。
可选地,所述根据所述第一经纬度以及所述现有电站设计方案的第二经纬度,从各所述现有电站设计方案中,确定与所述目标电站设计方案距离最近的K组最邻近现有电站设计方案的步骤包括:
根据经纬度对所述预设数据库中的现有电站设计方案进行分组,具有相同经纬度的现有电站设计方案组成一组现有电站设计方案组;
从所述预设数据库中获取K组现有电站设计方案组,组成现有电站设计方案集;
根据所述现有电站设计方案组对应的第三经纬度以及所述第一经纬度,确定所述现有电站设计方案集中的各所述现有电站设计方案组与目标电站设计方案之间的第一距离;
从所述预设数据库中获取待比对现有电站设计方案组;
根据所述待比对现有电站设计方案组对应的第四经纬度以及所述第一经纬度,确定所述待比对现有电站设计方案组与目标电站设计方案之间的第二距离;
若确定所述第二距离小于所述第一距离中的最大第一距离,则将所述最大第一距离对应的现有电站设计方案组从所述现有电站设计方案集中删除,并将所述待比对现有电站设计方案组添加至所述现有电站设计方案集中;
若确定所述预设数据库中存在待比对现有电站设计方案组,则返回执行所述从所述预设数据库中获取待比对现有电站设计方案组的步骤;
若确定所述预设数据库中不存在待比对现有电站设计方案组,则将所述现有电站设计方案集中的现有电站设计方案确定为最邻近现有电站设计方案。
可选地,所述根据所述最邻近现有电站设计方案对应的第三发电量数据,确定所述目标电站设计方案对应的第二发电量数据的步骤包括:
对所述目标电站设计方案和各所述最邻近现有电站设计方案进行K均值聚类,从各所述最邻近现有电站设计方案中,确定与所述目标电站设计方案属于相同分类的目标最邻近现有电站设计方案;
根据所述目标最邻近现有电站设计方案对应的第四发电量数据,确定所述目标电站设计方案对应的第二发电量数据。
可选地,所述第一关键设计参数值包括第一经纬度,所述根据所述目标最邻近现有电站设计方案对应的第四发电量数据,确定所述目标电站设计方案对应的第二发电量数据的步骤包括:
根据所述第四发电量数据对应的第五经纬度与所述第一经纬度之间的第三距离,确定各所述第四发电量数据各自对应的权重;
基于各所述第四发电量数据各自对应的权重,对各所述第四发电量数据进行加权平均计算,得到所述目标电站设计方案对应的第二发电量数据。
可选地,所述获取目标电站设计方案的第一关键设计参数值的步骤包括:
获取所述目标电站设计方案的初始设计参数值;
通过主成分分析,从所述初始设计参数值中确定第一关键设计参数值。
可选地,所述根据所述第一关键设计参数值、所述现有电站设计方案和K最邻近法,预测所述目标电站设计方案对应的第二发电量数据的步骤之前,还包括:
获取训练集和测试集,所述训练集包括仿真发电量数据和/或真实发电量数据,所述测试集包括真实发电量数据;
根据所述训练集和所述测试集,确定K最邻近法的K值。
可选地,所述根据所述训练集和所述测试集,确定K最邻近法的K值的步骤包括:
将预设初始值作为K最邻近法的K值;
通过所述K最邻近法,确定所述测试集中的测试样本各自对应的发电量数据预测值;
根据所述测试样本对应的发电量数据预测值和发电量数据实际值,确定所述K值对应的预测误差;
若所述预测误差满足预设误差要求,则执行所述根据所述第一关键设计参数值、所述现有电站设计方案和K最邻近法,预测所述目标电站设计方案对应的第二发电量数据的步骤;
若所述预测误差不满足预设误差要求,则将预设初始值作为K最邻近法的K值与预设增加量的和值,并返回执行所述通过所述K最邻近法,确定所述测试集中的测试样本各自对应的发电量数据预测值的步骤。
为实现上述目的,本发明还提供一种发电量数据预测装置,所述发电量数据预测装置包括:
第一获取模块,用于获取目标电站设计方案的第一关键设计参数值;
检测模块,用于根据所述第一关键设计参数值,检测在预设数据库内的各个现有电站设计方案中,是否存在与所述目标电站设计方案相匹配的目标现有电站设计方案;
确定模块,用于若是,则将所述目标现有电站设计方案对应的第一发电量数据,确定为所述目标电站设计方案对应的第二发电量数据;
预测模块,用于若否,则根据所述第一关键设计参数值、所述现有电站设计方案和K最邻近法,预测所述目标电站设计方案对应的第二发电量数据。
为实现上述目的,本发明还提供一种发电量数据预测设备,所述发电量数据预测设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的发电量数据预测程序,所述发电量数据预测程序被所述处理器执行时实现如上所述的发电量数据预测方法的步骤。
此外,为实现上述目的,本发明还提出一种计算机可读存储介质,所述计算机可读存储介质上存储有发电量数据预测程序,所述发电量数据预测程序被处理器执行时实现如上所述的发电量数据预测方法的步骤。
本发明中,获取目标电站设计方案的第一关键设计参数值,通过第一关键设计参数值在预设数据库内的各个现有电站设计方案中进行查找,若查找到与所述目标电站设计方案相匹配的目标现有电站设计方案,则直接将所述目标现有电站设计方案对应的第一发电量数据作为所述目标电站设计方案对应的第二发电量数据,若无法查找到与所述目标电站设计方案相匹配的目标现有电站设计方案,则根据所述第一关键设计参数值、所述现有电站设计方案和K最邻近法预测所述目标电站设计方案对应的第二发电量数据。可以理解的是,现有电站的数量较多,故而可以获知到的现有电站设计方案的真实发电量数据或仿真发电量数据的数量也较多,若能够通过第一关键设计参数值找到与所述目标电站设计方案的相匹配的现有电站设计方案,由于现有电站设计方案的第一发电量数据已知,则无需再进行发电量数据仿真,而从数据库中查找发电量数据的时间远小于通过PVsyst软件仿真发电量数据的时间,故而可以大大缩短确定目标电站设计方案对应的第二发电量数据的时间,若无法通过第一关键设计参数值找到与所述目标电站设计方案的相匹配的现有电站设计方案,则根据所述第一关键设计参数值、所述现有电站设计方案和K最邻近法,预测所述目标电站设计方案对应的第二发电量数据,相比于通过PVsyst软件仿真发电量数据,K最邻近法预测的时间更短,也即,本发明不论是直接从预设数据库中获取第一发电量数据的方式,还是K最邻近法进行预测的方式,都可以有效缩短确定目标电站设计方案对应的第二发电量数据的时间,进而有效提高了电站的目标电站设计方案寻优的效率。
附图说明
图1为本发明实施例方案涉及的硬件运行环境的结构示意图;
图2为本发明发电量数据预测方法第一实施例的流程示意图;
图3为本发明发电量数据预测装置较佳实施例的功能模块示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
如图1所示,图1是本发明实施例方案涉及的硬件运行环境的设备结构示意图。
需要说明的是,本发明实施例发电量数据预测设备,所述发电量数据预测设备可以是智能手机、个人计算机、服务器等设备,在此不做具体限制。
如图1所示,该发电量数据预测设备可以包括:处理器1001,例如CPU,网络接口1004,用户接口1003,存储器1005,通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
本领域技术人员可以理解,图1中示出的设备结构并不构成对发电量数据预测设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及发电量数据预测程序。操作系统是管理和控制设备硬件和软件资源的程序,支持发电量数据预测程序以及其它软件或程序的运行。在图1所示的设备中,用户接口1003主要用于与客户端进行数据通信;网络接口1004主要用于与服务器建立通信连接;而处理器1001可以用于调用存储器1005中存储的发电量数据预测程序,并执行以下操作:
获取目标电站设计方案的第一关键设计参数值;
根据所述第一关键设计参数值,检测在预设数据库内的各个现有电站设计方案中,是否存在与所述目标电站设计方案相匹配的目标现有电站设计方案;
若是,则将所述目标现有电站设计方案对应的第一发电量数据,确定为所述目标电站设计方案对应的第二发电量数据;
若否,则根据所述第一关键设计参数值、所述现有电站设计方案和K最邻近法,预测所述目标电站设计方案对应的第二发电量数据。
进一步地,所述根据所述第一关键设计参数值、所述现有电站设计方案和K最邻近法,预测所述目标电站设计方案对应的第二发电量数据的操作包括:
根据所述第一关键设计参数值,从所述现有电站设计方案中,确定所述目标电站设计方案对应的K组最邻近现有电站设计方案;
根据所述最邻近现有电站设计方案对应的第三发电量数据,确定所述目标电站设计方案对应的第二发电量数据。
进一步地,所述根据所述第一关键设计参数值,从所述现有电站设计方案中,确定所述目标电站设计方案对应的K组最邻近现有电站设计方案的操作包括:
根据所述第一经纬度以及所述现有电站设计方案的第二经纬度,从各所述现有电站设计方案中,确定与所述目标电站设计方案距离最近的K组最邻近现有电站设计方案,其中,属于同一组的各个最邻近现有电站设计方案的经纬度相同。
进一步地,所述根据所述第一经纬度以及所述现有电站设计方案的第二经纬度,从各所述现有电站设计方案中,确定与所述目标电站设计方案距离最近的K组最邻近现有电站设计方案的操作包括:
根据经纬度对所述预设数据库中的现有电站设计方案进行分组,具有相同经纬度的现有电站设计方案组成一组现有电站设计方案组;
从所述预设数据库中获取K组现有电站设计方案组,组成现有电站设计方案集;
根据所述现有电站设计方案组对应的第三经纬度以及所述第一经纬度,确定所述现有电站设计方案集中的各所述现有电站设计方案组与目标电站设计方案之间的第一距离;
从所述预设数据库中获取待比对现有电站设计方案组;
根据所述待比对现有电站设计方案组对应的第四经纬度以及所述第一经纬度,确定所述待比对现有电站设计方案组与目标电站设计方案之间的第二距离;
若确定所述第二距离小于所述第一距离中的最大第一距离,则将所述最大第一距离对应的现有电站设计方案组从所述现有电站设计方案集中删除,并将所述待比对现有电站设计方案组添加至所述现有电站设计方案集中;
若确定所述预设数据库中存在待比对现有电站设计方案组,则返回执行所述从所述预设数据库中获取待比对现有电站设计方案组的步骤;
若确定所述预设数据库中不存在待比对现有电站设计方案组,则将所述现有电站设计方案集中的现有电站设计方案确定为最邻近现有电站设计方案。
进一步地,所述根据所述最邻近现有电站设计方案对应的第三发电量数据,确定所述目标电站设计方案对应的第二发电量数据的操作包括:
对所述目标电站设计方案和各所述最邻近现有电站设计方案进行K均值聚类,从各所述最邻近现有电站设计方案中,确定与所述目标电站设计方案属于相同分类的目标最邻近现有电站设计方案;
根据所述目标最邻近现有电站设计方案对应的第四发电量数据,确定所述目标电站设计方案对应的第二发电量数据。
进一步地,所述根据所述目标最邻近现有电站设计方案对应的第四发电量数据,确定所述目标电站设计方案对应的第二发电量数据的操作包括:
根据所述第四发电量数据对应的第五经纬度与所述第一经纬度之间的第三距离,确定各所述第四发电量数据各自对应的权重;
基于各所述第四发电量数据各自对应的权重,对各所述第四发电量数据进行加权平均计算,得到所述目标电站设计方案对应的第二发电量数据。
进一步地,所述获取目标电站设计方案的第一关键设计参数值的操作包括:
获取所述目标电站设计方案的初始设计参数值;
通过主成分分析,从所述初始设计参数值中确定第一关键设计参数。
进一步地,所述根据所述第一关键设计参数值、所述现有电站设计方案和K最邻近法,预测所述目标电站设计方案对应的第二发电量数据的步骤之前,处理器1001还可以用于调用存储器1005中存储的发电量数据预测程序,执行以下操作:
获取训练集和测试集,所述训练集包括仿真发电量数据和/或真实发电量数据,所述测试集包括真实发电量数据;
根据所述训练集和所述测试集,确定K最邻近法的K值。
进一步地,所述根据所述训练集和所述测试集,确定K最邻近法的K值的操作包括:
将预设初始值作为K最邻近法的K值;
通过所述K最邻近法,确定所述测试集中的测试样本各自对应的发电量数据预测值;
根据所述测试样本对应的发电量数据预测值和发电量数据实际值,确定所述K值对应的预测误差;
若所述预测误差满足预设误差要求,则执行所述根据所述第一关键设计参数值、所述现有电站设计方案和K最邻近法,预测所述目标电站设计方案对应的第二发电量数据的步骤;
若所述预测误差不满足预设误差要求,则将预设初始值作为K最邻近法的K值与预设增加量的和值,并返回执行所述通过所述K最邻近法,确定所述测试集中的测试样本各自对应的发电量数据预测值的步骤。
基于上述的结构,提出发电量数据预测方法的各个实施例。
参照图2,图2为本发明发电量数据预测方法第一实施例的流程示意图。
本发明实施例提供了发电量数据预测方法的实施例,需要说明的是,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。在本实施例中,发电量数据预测方法的执行主体可以是个人电脑、智能手机等设备,在本实施例中并不做限制,以下为便于描述,省略执行主体进行各实施例的阐述。在本实施例中,所述发电量数据预测方法包括:
步骤S10,获取目标电站设计方案的第一关键设计参数值;
本实施例中,电站设计方案是指光伏电站主体的设计方案,在光伏电站设计流程中,电站主体的设计作为流程中的重要环节,电站设计方案的优劣直接影响光伏电站生命周期的投资收益,目前,主要采用人工方式进行电站设计方案设计。为了节约人力成本,降低人为操作产生的误差,也可以基于遍历全部电站设计方案的方式自动进行方案寻优,从众多电站设计方案中确定最优的电站主体方,遍历全部电站设计方案的方式需要确定每一个电站设计方案对应的发电量数据,进而基于发电量数据计算投资成本和投资收益,所述目标电站设计方案即是指待确定发电量数据的电站设计方案,所述目标电站设计方案的发电量数据目前是通过PVsyst软件仿真得到的,然而,每个目标电站设计方案进行发电量数据仿真的时间约为8秒左右,方案寻优的总时长由确定每个目标电站设计方案的发电量数据的时间和目标电站设计方案的总量共同决定,对于不同的目标电站设计方案,设计参数值为变量,即每个目标电站设计方案对应于不同的设计参数值的组合,目标电站设计方案的数量由变量的数量决定,且随变量数量的增加指数级增加,故而会使得方案寻优的时长也呈指数级增加,以组件倾角(取值范围:0~60°,最小单位为1°)、组件间距(取值范围:5~10m,最小单位为:0.2m)、组件离地高度(取值范围:0.5~3m,最小单位为:0.2m)3个变量为例,通过排列组合可以确定61×25×13=19825个目标电站设计方案,若要仿真确定这些目标电站设计方案的发电量数据,总共需要仿真的时间约为44个小时,耗时很长,不能满足用户对方案寻优的需求,使得遍历全部电站设计方案的方式难以真正执行。
电站设计过程中需要确定多个设计参数的设计参数值,任何一个设计参数值的改变,都会形成一个新的电站设计方案,所述设计参数包括组件离地高度、组件间距、组件倾角、容配比、温度、湿度、方位角、辐照度、经纬度等。所述第二发电量数据是未知的,需要通过模型、算法、仿真等方式确定其具体数值,且电站建成后的发电量数据会受到电站设计方案的设计参数值的影响,故而可以根据目标电站设计方案的设计参数值,通过直接获取、预测或仿真的方式确定所述目标电站设计方案对应的第二发电量数据。所述第一关键设计参数值为第一关键设计参数的数值,所述第一关键设计参数为对所述目标电站设计方案对应的第二发电量数据具有较重要影响的设计参数,可以为所述目标电站设计方案的全部或部分设计参数,所述第一关键设计参数的具体选择可以根据大数据、实际测试结果、主成分分析等方式进行确定,本实施例对此不加以限制。
在光伏电站设计过程中,不同的目标电站设计方案的设计参数值也不同,不同设计参数值对发电量数据的影响不同,故而可以从每个目标电站设计方案的设计参数值中选取全部或部分设计参数值,作为所述目标电站设计方案对应的第一关键设计参数值。
步骤S20,根据所述第一关键设计参数值,检测在预设数据库内的各个现有电站设计方案中,是否存在与所述目标电站设计方案相匹配的目标现有电站设计方案;
本实施例中,所述预设数据库是存储有现有电站设计方案的已知发电量数据的数据库,所述已知发电量数据可以为现有电站产生的实际发电量数据,也可以为仿真发电量数据,所述仿真发电量数据可以为其他电站在设计过程中通过仿真得到的,容易理解的是,所述已知发电量数据对应的第三关键设计参数值也为已知,所述第三关键设计参数值为第三关键设计参数的数值,所述第三关键设计参数至少包括所述第一关键设计参数,故而可以与第一关键设计参数值进行匹配识别,例如,所述第一关键设计参数包括组件倾角、组件间距和组件离地高度,所述第三关键设计参数至少包括组件倾角、组件间距和组件离地高度,还可以包括经纬度、容配比、温度、湿度等。
具体地,基于所述第一关键设计参数值,对预设数据库内的各个现有电站设计方案进行匹配查询,检测在预设数据库内的各个现有电站设计方案中,是否存在与所述目标电站设计方案相匹配的目标现有电站设计方案,其中,所述与所述目标电站设计方案相匹配的目标现有电站设计方案,是指同一个的关键设计参数在目标现有电站设计方案中的数值大小和在所述目标电站设计方案中的数值大小相同或相差小于预设偏差值范围,例如,所述第一关键设计参数值为组件倾角a°、组件间距b m、组件离地高度c m,则与所述目标电站设计方案相匹配的目标现有电站设计方案的第三关键设计参数值可以为组件倾角a°、组件间距b m、组件离地高度c m,也可以为组件倾角a°、组件间距b m、组件离地高度c m、温度d℃,也可以为组件倾角处于a±a1°范围内的任意数值,组件间距处于b±b1 m范围内的任意数值,组件离地高度处于c±c1 m范围内的任意数值,其中,a1、b1、c1为预设的偏差值范围。
步骤S30,若是,则将所述目标现有电站设计方案对应的第一发电量数据,确定为所述目标电站设计方案对应的第二发电量数据;
本实施例中,若基于所述第一关键设计参数值,对预设数据库内的各个现有电站设计方案进行匹配查询之后,检测到在预设数据库内的各个现有电站设计方案中,存在与所述目标电站设计方案相匹配的目标现有电站设计方案,则获取所述目标现有电站设计方案对应的第一发电量数据,将所述第一发电量数据确定为所述目标电站设计方案对应的第二发电量数据。
若所述目标现有电站设计方案与所述目标电站设计方案相匹配,则说明目前已经存在或设计过与所述目标电站设计方案相同或相似的电站,故而无需再重复进行发电量数据的预测或仿真,大大缩短了重复仿真所需占用的时间和资源。
步骤S40,若否,则根据所述第一关键设计参数值、所述现有电站设计方案和K最邻近法,预测所述目标电站设计方案对应的第二发电量数据。
本实施例中,若基于所述第一关键设计参数值,对预设数据库内的各个现有电站设计方案进行匹配查询之后,检测确定预设数据库内的各个现有电站设计方案中,不存在与所述目标电站设计方案相匹配的目标现有电站设计方案,则通过K最邻近法,根据全部或部分第一关键设计参数值进行现有电站设计方案与目标电站设计方案之间的距离的计算,确定K个或K组目标已知发电量数据,根据各所述目标已知发电量数据确定所述目标电站设计方案对应的第二发电量数据。
本申实施例中,获取目标电站设计方案的第一关键设计参数值,通过第一关键设计参数值在预设数据库内的各个现有电站设计方案中进行查找,若查找到与所述目标电站设计方案相匹配的目标现有电站设计方案,则直接将所述目标现有电站设计方案对应的第一发电量数据作为所述目标电站设计方案对应的第二发电量数据,若无法查找到与所述目标电站设计方案相匹配的目标现有电站设计方案,则根据所述第一关键设计参数值、所述现有电站设计方案和K最邻近法预测所述目标电站设计方案对应的第二发电量数据。可以理解的是,现有电站的数量较多,故而可以获知的目标电站设计方案的真实发电量数据或仿真发电量数据的数量也较多,若能够通过第一关键设计参数值找到与所述目标电站设计方案的相匹配的现有电站设计方案,由于现有电站设计方案的第一发电量数据已知,则无需再进行发电量数据仿真,而从数据库中查找发电量数据的时间远小于通过PVsyst软件仿真发电量数据的时间,故而可以大大缩短确定目标电站设计方案对应的第二发电量数据的时间,若无法通过第一关键设计参数值找到与所述目标电站设计方案的相匹配的现有电站设计方案,则根据所述第一关键设计参数值、所述现有电站设计方案和K最邻近法,预测所述目标电站设计方案对应的第二发电量数据,相比于通过PVsyst软件仿真发电量数据,K最邻近法预测的时间更短,也即,本发明不论是直接从预设数据库中获取第一发电量数据的方式,还是K最邻近法进行预测的方式,都可以有效缩短确定目标电站设计方案对应的第二发电量数据的时间,进而有效提高了电站的目标电站设计方案寻优的效率。
进一步地,基于上述第一实施例,提出本发明发电量数据预测方法第二实施例,在本实施例中,所述步骤S40包括:
步骤S41,根据所述第一关键设计参数值,从所述现有电站设计方案中,确定所述目标电站设计方案对应的K组最邻近现有电站设计方案;
本实施例中,若基于所述第一关键设计参数值,对预设数据库内的各个现有电站设计方案进行匹配查询之后,检测确定预设数据库内的各个现有电站设计方案中,不存在与所述目标电站设计方案相匹配的目标现有电站设计方案,则将所述目标电站设计方案作为待预测数据,通过K最邻近法,从所述预设数据库的现有电站设计方案中确定距离所述目标电站设计方案最近的K组最邻近现有电站设计方案,其中,K表示最邻近现有电站设计方案的数量,可以预先根据大数据、实际测试结果或实际需要等进行确定。
进一步地,在一实施方式中,所述步骤S41包括:
步骤S411,根据所述第一经纬度以及所述现有电站设计方案的第二经纬度,从各所述现有电站设计方案中,确定与所述目标电站设计方案距离最近的K组最邻近现有电站设计方案,其中,属于同一组的各个最邻近现有电站设计方案的经纬度相同。
本实施例中,所述第一关键设计参数值包括第一经纬度,本实施例中的经纬度是指电站主体的经纬度,经纬度是影响电站的发电量数据的重要因素,经纬度越接近,地理环境也较为接近,其对应的发电量数据则更接近,也更具有参考意义,而在预设数据库中,同一个经纬度,往往对应于多个现有电站设计方案,即一组现有电站设计方案,也即,K各经纬度对应于K组现有电站设计方案,例如,第一关键设计参数值包括经纬度、组件倾角和组件离地高度,确定了经纬度为(d1,d2)之后,组件倾角的取值范围为0~60°,最小单位为1°,组件离地高度的取值范围为0.5~3m,最小单位为0.2m,则(d1,d2)对应于61×13=793个现有电站设计方案,这793个现有电站设计方案为(d1,d2)对应的一组现有电站设计方案。
具体地,若基于所述第一关键设计参数值,对预设数据库内的各个现有电站设计方案进行匹配查询之后,检测确定预设数据库内的各个现有电站设计方案中,不存在与所述目标电站设计方案相匹配的目标现有电站设计方案,则根据所述第一经纬度以及所述现有电站设计方案的第二经纬度,计算各所述现有电站设计方案与所述目标电站设计方案之间的距离,并根据计算得到的距离,从各所述现有电站设计方案中,确定与所述目标电站设计方案距离最近的K组最邻近现有电站设计方案,其中,其中,属于同一组的各个最邻近现有电站设计方案的经纬度相同。
进一步地,在一实施方式中,所述步骤S411包括:
步骤S4111,根据经纬度对所述预设数据库中的现有电站设计方案进行分组,具有相同经纬度的现有电站设计方案组成一组现有电站设计方案组;
本实施例中,根据经纬度对所述预设数据库中的现有电站设计方案进行分组,将经纬度相同的现有电站设计方案分为同一组,得到至少一组现有电站设计方案组,每一组现有电站设计方案组中的现有电站设计方案的经纬度相同。
步骤S4112,从所述预设数据库中获取K组现有电站设计方案组,组成现有电站设计方案集;
本实施例中,从预设数据库中随机获取K组现有电站设计方案组组成现有电站设计方案集。
步骤S4113,根据所述现有电站设计方案组对应的第三经纬度以及所述第一经纬度,确定所述现有电站设计方案集中的各所述现有电站设计方案组与目标电站设计方案之间的第一距离;
本实施例中,确定各所述现有电站设计方案组对应的第三经纬度,根据各所述第三经纬度和所述第一经纬度,计算得到各所述现有电站设计方案组与目标电站设计方案之间的第一距离,需要说明的是,由于所述现有电站设计方案组的数量为K个,则所述第一距离的数量也为K个,各所述第一距离可能相同或不同。
步骤S4114,从所述预设数据库中获取待比对现有电站设计方案组;
本实施例中,从所述预设数据库中随机获取待比对现有电站设计方案组,其中,所述待比对现有电站设计方案组为所述预设数据库中除所述现有电站设计方案集中的现有电站设计方案组之外的,未进行距离比对过的现有电站设计方案组,也即,为了避免重复比对,所述预设数据库中的每一个现有电站设计方案组均只获取一次进行距离比对,不论后续是否添加至所述现有电站设计方案集中,都不再重复获取。
步骤S4115,根据所述待比对现有电站设计方案组对应的第四经纬度以及所述第一经纬度,确定所述待比对现有电站设计方案组与目标电站设计方案之间的第二距离;
本实施例中,确定所述待比对现有电站设计方案组对应的第四经纬度,根据所述第四经纬度以及所述第一经纬度,确定所述待比对现有电站设计方案组与目标电站设计方案之间的第二距离,比较所述第二距离和所述第一距离中的最大第一距离的大小。
步骤S4115,若确定所述第二距离小于所述第一距离中的最大第一距离,则将所述最大第一距离对应的现有电站设计方案组从所述现有电站设计方案集中删除,并将所述待比对现有电站设计方案组添加至所述现有电站设计方案集中;
本实施例中,若确定所述第二距离小于所述第一距离中的最大第一距离,则将所述最大第一距离对应的现有电站设计方案组从所述现有电站设计方案集中删除,并将所述待比对现有电站设计方案组添加至所述现有电站设计方案集中,实现了现有电站设计方案集的更新,此时,由于所述现有电站设计方案集中最大第一距离对应的现有电站设计方案组已经发生了改变,故而可以重新确定所述第一距离中的最大第一距离,在下一次距离比对时,可以将下一个待比对现有电站设计方案组对应的第二距离与新的最大第一距离进行比较。
若确定所述第二距离大于或等于所述第一距离中的最大第一距离,则无需对所述现有电站设计方案集进行调整,检测所述预设数据库中是否存在待比对现有电站设计方案组,若所述预设数据库中存在待比对现有电站设计方案组,则返回执行所述从所述预设数据库中获取待比对现有电站设计方案组的步骤,若所述预设数据库中不存在待比对现有电站设计方案组,则将所述现有电站设计方案集中的现有电站设计方案确定为最邻近现有电站设计方案。
步骤S4116,若确定所述预设数据库中存在待比对现有电站设计方案组,则返回执行所述从所述预设数据库中获取待比对现有电站设计方案组的步骤。
本实施例中,检测所述预设数据库中是否存在待比对现有电站设计方案组,若确定所述预设数据库中存在待比对现有电站设计方案组,则返回执行所述从所述预设数据库中获取待比对现有电站设计方案组的步骤。
步骤S4117,若确定所述预设数据库中不存在待比对现有电站设计方案组,则将所述现有电站设计方案集中的现有电站设计方案确定为最邻近现有电站设计方案。
本实施例中,检测所述预设数据库中是否存在待比对现有电站设计方案组,若确定所述预设数据库中不存在待比对现有电站设计方案组,则将当前形成的所述现有电站设计方案集中的现有电站设计方案确定为最邻近现有电站设计方案。
步骤S42,根据所述最邻近现有电站设计方案对应的第三发电量数据,确定所述目标电站设计方案对应的第二发电量数据。
本实施例中,基于全部或部分的所述最邻近现有电站设计方案对应的第三发电量数据,进行求平均值、加权平均值等计算,确定所述目标电站设计方案对应的第二发电量数据。
所述第三发电量数据在计算第二发电量数据之前可以进行预处理,对偏差较大或存在错误的第三发电量数据进行剔除或修正,例如,由于所述预设数据库中的现有电站设计方案均与所述目标电站设计方案相差较大,进而使得K个最邻近现有电站设计方案中,存在与所述目标电站设计方案之间的距离超过了预设的距离阈值的异常数据,此时可以将所述异常的最邻近现有电站设计方案对应的第三发电量数据舍弃,或者,也可以中止所述发电量数据预测的过程,并返回错误提示信息,或者,也可以,将所述第一关键设计参数值输入PVsyst软件,得到仿真发电量数据,将所述仿真发电量数据作为所述目标电站设计方案对应的第二发电量数据。由于直接从预设数据库中获取已知发电量数据的时间、通过K最邻近法进行发电量数据预测的时间以及通过PVsyst软件仿真发电量数据的时间,是依次增加的,故而,相比于直接将大批量的电站设计方案通过PVsyst软件仿真发电量数据的方式,本实施例中,会有一部分电站设计方案可以快速地从预设数据库中获取已知发电量数据进行确定,一部分电站设计方案可以通过K最邻近法快速进行发电量数据预测,仅有部分电站设计方案,可能由于与预设数据库中的已知发电量数据存在较大差异,为了保证发电量数据的准确性,则需要通过PVsyst软件仿真发电量数据,从整体上看,可以在保证发电量数据的准确性的前提下,有效提高电站的目标电站设计方案寻优的效率。
进一步地,在一实施方式中,所述步骤S42包括:
步骤S421,对所述目标电站设计方案和各所述最邻近现有电站设计方案进行K均值聚类,从各所述最邻近现有电站设计方案中,确定与所述目标电站设计方案属于相同分类的目标最邻近现有电站设计方案;
在本实施例中,将各所述最邻近现有电站设计方案各自对应的第二关键设计参数值和所述目标电站设计方案的第一关键设计参数值输入预设的K均值聚类算法中,对各所述最邻近现有电站设计方案和所述目标电站设计方案进行聚类,根据聚类结果,从所述最邻近现有电站设计方案中,确定与所述目标电站设计方案属于相同分类的目标最邻近现有电站设计方案,其中,所述K均值聚类算法与现有技术类似,在此不过多赘述。
通过K均值聚类算法可以进一步快速地筛除与所述目标电站设计方案相似度较低的最邻近现有电站设计方案,使得最终计算确定的发电量数据的准确性更高,特别对于先通过经纬度确定最邻近现有电站设计方案的情况,先通过经纬度进行初筛,可以快速剔除一部分相关性较低的现有电站设计方案,进一步通过除经纬度之外的其他的第一关键设计参数值和第二关键设计参数值,从数量较少的最邻近现有电站设计方案中,精筛出与所述目标电站设计方案相关性更高的目标最邻近现有电站设计方案,进行发电量数据的计算,一方面可以保证发电量数据预测的效率,另一方面也可以保证发电量数据预测的准确性。
步骤S422,根据所述目标最邻近现有电站设计方案对应的第四发电量数据,确定所述目标电站设计方案对应的第二发电量数据。
在本实施例中,基于所述目标最邻近现有电站设计方案对应的第四发电量数据,进行求平均值、加权平均值等计算,确定所述目标电站设计方案对应的第二发电量数据。
进一步地,在一实施方式中,所述步骤S422包括:
步骤S4221,根据所述第四发电量数据对应的第五经纬度与所述第一经纬度之间的第三距离,确定各所述第四发电量数据各自对应的权重;
在本实施例中,确定各所述第四发电量数据对应的第五经纬度,根据所述第五经纬度和所述第一经纬度,计算各所述第四发电量数据与所述发电量数据之间的第三距离,根据计算确定的各所述第四发电量数据各自对应第三距离,确定各所述第四发电量数据各自对应的权重,其中,所述权重与所述第三距离呈反比,即,所述第三距离越小,对应的权重则越大。
步骤S4222,基于各所述第四发电量数据各自对应的权重,对各所述第四发电量数据进行加权平均计算,得到所述目标电站设计方案对应的第二发电量数据。
在本实施例中,基于各所述第四发电量数据各自对应的权重,对各所述第四发电量数据进行加权平均计算,将计算得到的加权平均值确定为所述目标电站设计方案对应的第二发电量数据。
在本实施例中,通过的K最邻近法,可以从预设数据库的已知发电量数据中,快速地确定与所述目标电站设计方案对应的第二发电量数据距离最近的K个最邻近现有电站设计方案,进而基于所述最邻近现有电站设计方案进行计算,即可简单且快速地确定所述目标电站设计方案对应的第二发电量数据,相比于通过PVsyst软件仿真发电量数据,耗时更短,效率更高。
进一步地,基于上述第一和/或第二实施例,提出本发明发电量数据预测方法第三实施例。在本实施例中,所述步骤S10包括:
步骤S11,获取所述目标电站设计方案的初始设计参数值;
本实施例中,在光伏电站设计过程中,不同的设计参数值可以组成不同的目标电站设计方案,进而可以获取每个目标电站设计方案中的全部或部分设计参数值,作为所述目标电站设计方案对应的初始设计参数值。
步骤S12,通过主成分分析,从所述初始设计参数值中确定第一关键设计参数值。
本实施例中,所述初始设计参数值的参数数量较多,通过主成分分析,对所述初始设计参数值进行降维,从所述初始设计参数值中确定第一关键设计参数值,其中,所述主成分分析的方法与现有技术相似,再次不过多赘述。
在一种可实施的方式中,所述通过主成分分析,对所述初始设计参数值进行降维的步骤包括:对所述初始设计参数值进行零均值归一化处理,得到标准化设计参数值;计算确定所述标准化设计参数值的协方差矩阵;将所述协方差矩阵对角化,计算得到所述协方差矩阵的特征值和特征向量;将所述特征值按从大到小的顺序排列,获取最大的预设数量的特征值对应的特征向量,构成投影矩阵;将所述初始设计参数值转换到上述投影矩阵构建的新空间中,确定第一关键设计参数值,达到降维的目的。
需要说明的是,所述步骤S11至步骤S12可以无需在每次发电量数据预测的过程中都执行,通过一次或多次的主成分分析,即可确定设计参数中的关键设计参数,在确定了关键设计参数之后,即可根据所述关键设计参数直接从所述目标电站设计方案的初始设计参数值中获取对应的第一关键设计参数值,而无需每次都进行主成分分析。
在一种可实施的方式中,在确定了关键设计参数之后,可以基于所述关键设计参数建立预设数据库,即,所述预设数据库中只保存已知发电量数据的关键设计参数的相关信息,进而减少数据库的数据量。
在本实施例中,通过主成分分析可以有效缩减设计参数值的类别,使得所述发电量数据预测方法中的数据量大大减少,提高发电量数据预测的效率。
进一步地,基于上述第一、第二和/或第三实施例,提出本发明发电量数据预测方法第四实施例。在本实施例中,所述步骤S40之前,还包括:
步骤A10,获取训练集和测试集,所述训练集包括仿真发电量数据和/或真实发电量数据,所述测试集包括真实发电量数据;
在本实施例中,从预设数据库或其他数据来源中获取发电量数据及其对应的关键设计参数值,形成训练集和测试集,其中,所述训练集中的训练样本的关键设计参数值应为已知的,所述训练集中的训练样本的发电量数据可以为实际电站产生的实际发电量数据和仿真发电量数据等,所述测试集中的测试样本的关键设计参数值和发电量数据真实值均应为已知的,所述测试集中的测试样本的发电量数据可以为实际电站产生的实际发电量数据等
步骤A20,根据所述训练集和所述测试集,确定K最邻近法的K值。
在本实施例中,以所述测试集中的任意一个测试样本作为待预测数据,通过对K最邻近法设置不同的K值后,根据所述训练集中的训练样本,对各所述待预测数据对应的发电量数据进行预测,得到不同K值对应的发电量数据预测值,并将发电量数据预测值与对应的发电量数据真实值进行比较,确定不同K值对应的预测误差,根据预测误差确定K最邻近法的K值。
在一种可实施的方式中,所述步骤A20包括:确定至少一个预设初始K值,通过所述K最邻近法,基于所述初始K值,确定所述测试集中各个测试样本对应的发电量数据预测值,将所述发电量数据预测值与各自对应的发电量数据真实值进行比较,计算样本预测误差,计算所述样本预测误差的平均值作为各所述初始K值对应的平均预测误差,将各所述平均预测误差中的最小平均误差对应的初始K值,确定为所述K最邻近法的K值。
进一步地,在一实施方式中,所述步骤A20包括:
步骤A21,将预设初始值作为K最邻近法的K值;
在本实施例中,将K最邻近法的K值确定为预设初始值,其中,所述预设初始值可以为一个较小的数值,例如3、5等,后续逐渐增加。
步骤A22,通过所述K最邻近法,确定所述测试集中的测试样本各自对应的发电量数据预测值;
在本实施例中,将所述训练集和所述测试集输入所述K最邻近法,根据所述训练集中的训练样本对所述测试集中的测试样本的发电量数据进行预测,得到所述测试集中的测试样本各自对应的发电量数据预测值。
步骤A23,根据所述测试样本对应的发电量数据预测值和发电量数据实际值,确定所述K值对应的预测误差;
在本实施例中,确定各所述测试样本各自对应的发电量数据预测值和发电量数据实际值,根据各所述测试样本各自对应的发电量数据预测值和发电量数据实际值,计算各所述测试样本各自对应的样本预测误差,遍历所述测试集,得到当前K值对应的全部样本预测误差,进而将所述样本预测误差的平均值或和值等统计数值,确定为所述K值对应的预测误差,检测所述预测误差是否满足预设误差要求,其中,所述预设误差要求可以根据测试结果、实际情况等进行设定,本实施例对此不加以限制。例如,所述预设误差要求可以为预设的误差阈值,即,若所述预测误差小于所述误差阈值,则满足预设误差要求,若所述预测误差大于或等于所述误差阈值,则不满足预设误差要求,在一种可实施的方式中,所述误差阈值可以根据发电量数据精度要求进行确定。又例如,所述预设误差要求也可以为最小预测误差,即,若所述预测误差为最小预测误差,则满足预设误差要求,若所述预测误差不为最小预测误差,则不满足预设误差要求。
步骤A24,若所述预测误差满足预设误差要求,则执行所述根据所述第一关键设计参数值、所述现有电站设计方案和K最邻近法,预测所述目标电站设计方案对应的第二发电量数据的步骤;
在本实施例中,若所述预测误差满足预设误差要求,则执行所述根据所述第一关键设计参数值、所述现有电站设计方案和K最邻近法,预测所述目标电站设计方案对应的第二发电量数据的步骤。
步骤A25,若所述预测误差不满足预设误差要求,则将预设初始值作为K最邻近法的K值与预设增加量的和值,并返回所述通过所述K最邻近法,确定所述测试集中的测试样本各自对应的发电量数据预测值的步骤。
在本实施例中,若所述预测误差不满足预设误差要求,则将预设初始值作为K最邻近法的K值与预设增加量的和值,重新确定K值,并返回所述通过所述K最邻近法,确定所述测试集中的测试样本各自对应的发电量数据预测值的步骤,直至确定满足预设误差要求的K值。
在本实施例中,通过对已知发电量数据真实值的测试样本进行预测,比较得到的发电量数据预测值和发电量数据真实值,即可确定预测误差,根据预测误差确定最合适的K值,可以有效提高K最邻近法的预测准确性。
此外,本发明实施例还提出一种发电量数据预测装置,参照图3,所述发电量数据预测装置包括:
第一获取模块,用于获取目标电站设计方案的第一关键设计参数值;
检测模块,用于根据所述第一关键设计参数值,检测在预设数据库内的各个现有电站设计方案中,是否存在与所述目标电站设计方案相匹配的目标现有电站设计方案;
确定模块,用于若是,则将所述目标现有电站设计方案对应的第一发电量数据,确定为所述目标电站设计方案对应的第二发电量数据;
预测模块,用于若否,则根据所述第一关键设计参数值、所述现有电站设计方案和K最邻近法,预测所述目标电站设计方案对应的第二发电量数据。
进一步地,所述预测模块,还用于:
根据所述第一关键设计参数值,从所述现有电站设计方案中,确定所述目标电站设计方案对应的K组最邻近现有电站设计方案;
根据所述最邻近现有电站设计方案对应的第三发电量数据,确定所述目标电站设计方案对应的第二发电量数据。
进一步地,所述预测模块,还用于:
根据所述第一经纬度以及所述现有电站设计方案的第二经纬度,从各所述现有电站设计方案中,确定与所述目标电站设计方案距离最近的K组最邻近现有电站设计方案,其中,属于同一组的各个最邻近现有电站设计方案的经纬度相同。
进一步地,所述预测模块,还用于:
根据经纬度对所述预设数据库中的现有电站设计方案进行分组,具有相同经纬度的现有电站设计方案组成一组现有电站设计方案组;
从所述预设数据库中获取K组现有电站设计方案组,组成现有电站设计方案集;
根据所述现有电站设计方案组对应的第三经纬度以及所述第一经纬度,确定所述现有电站设计方案集中的各所述现有电站设计方案组与目标电站设计方案之间的第一距离;
从所述预设数据库中获取待比对现有电站设计方案组;
根据所述待比对现有电站设计方案组对应的第四经纬度以及所述第一经纬度,确定所述待比对现有电站设计方案组与目标电站设计方案之间的第二距离;
若确定所述第二距离小于所述第一距离中的最大第一距离,则将所述最大第一距离对应的现有电站设计方案组从所述现有电站设计方案集中删除,并将所述待比对现有电站设计方案组添加至所述现有电站设计方案集中;
若确定所述预设数据库中存在待比对现有电站设计方案组,则返回执行所述从所述预设数据库中获取待比对现有电站设计方案组的步骤;
若确定所述预设数据库中不存在待比对现有电站设计方案组,则将所述现有电站设计方案集中的现有电站设计方案确定为最邻近现有电站设计方案。
进一步地,所述预测模块,还用于:
对所述目标电站设计方案和各所述最邻近现有电站设计方案进行K均值聚类,从各所述最邻近现有电站设计方案中,确定与所述目标电站设计方案属于相同分类的目标最邻近现有电站设计方案;
根据所述目标最邻近现有电站设计方案对应的第四发电量数据,确定所述目标电站设计方案对应的第二发电量数据。
进一步地,所述预测模块,还用于:
根据所述第四发电量数据对应的第五经纬度与所述第一经纬度之间的第三距离,确定各所述第四发电量数据各自对应的权重;
基于各所述第四发电量数据各自对应的权重,对各所述第四发电量数据进行加权平均计算,得到所述目标电站设计方案对应的第二发电量数据。
进一步地,所述第一获取模块,还用于:
获取所述目标电站设计方案的初始设计参数值;
通过主成分分析,从所述初始设计参数值中确定第一关键设计参数值。
进一步地,所述发电量数据预测装置,还包括:
第二获取模块,用于获取训练集和测试集,所述训练集包括仿真发电量数据和/或真实发电量数据,所述测试集包括真实发电量数据;
K值确定模块,用于根据所述训练集和所述测试集,确定K最邻近法的K值。
进一步地,K值确定模块,还用于:
将预设初始值作为K最邻近法的K值;
通过所述K最邻近法,确定所述测试集中的测试样本各自对应的发电量数据预测值;
根据所述测试样本对应的发电量数据预测值和发电量数据实际值,确定所述K值对应的预测误差;
若所述预测误差满足预设误差要求,则执行所述根据所述第一关键设计参数值、所述现有电站设计方案和K最邻近法,预测所述目标电站设计方案对应的第二发电量数据的步骤;
若所述预测误差不满足预设误差要求,则将预设初始值作为K最邻近法的K值与预设增加量的和值,并返回执行所述通过所述K最邻近法,确定所述测试集中的测试样本各自对应的发电量数据预测值的步骤。
本发明发电量数据预测装置的具体实施方式的拓展内容与上述发电量数据预测方法各实施例基本相同,在此不做赘述。
此外,本发明实施例还提出一种计算机可读存储介质,所述存储介质上存储有发电量数据预测程序,所述发电量数据预测程序被处理器执行时实现如下所述的发电量数据预测方法的步骤。
本发明发电量数据预测设备和计算机可读存储介质各实施例,均可参照本发明发电量数据预测方法各个实施例,此处不再赘述。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (12)
1.一种发电量数据预测方法,其特征在于,所述发电量数据预测方法包括以下步骤:
获取目标电站设计方案的第一关键设计参数值;
根据所述第一关键设计参数值,检测在预设数据库内的各个现有电站设计方案中,是否存在与所述目标电站设计方案相匹配的目标现有电站设计方案;
若是,则将所述目标现有电站设计方案对应的第一发电量数据,确定为所述目标电站设计方案对应的第二发电量数据;
若否,则根据所述第一关键设计参数值、所述现有电站设计方案和K最邻近法,预测所述目标电站设计方案对应的第二发电量数据。
2.如权利要求1所述的发电量数据预测方法,其特征在于,所述根据所述第一关键设计参数值、所述现有电站设计方案和K最邻近法,预测所述目标电站设计方案对应的第二发电量数据的步骤包括:
根据所述第一关键设计参数值,从所述现有电站设计方案中,确定所述目标电站设计方案对应的K组最邻近现有电站设计方案;
根据所述最邻近现有电站设计方案对应的第三发电量数据,确定所述目标电站设计方案对应的第二发电量数据。
3.如权利要求2所述的发电量数据预测方法,其特征在于,所述第一关键设计参数值包括第一经纬度,所述根据所述第一关键设计参数值,从所述现有电站设计方案中,确定所述目标电站设计方案对应的K组最邻近现有电站设计方案的步骤包括:
根据所述第一经纬度以及所述现有电站设计方案的第二经纬度,从各所述现有电站设计方案中,确定与所述目标电站设计方案距离最近的K组最邻近现有电站设计方案,其中,属于同一组的各个最邻近现有电站设计方案的经纬度相同。
4.如权利要求3所述的发电量数据预测方法,其特征在于,所述根据所述第一经纬度以及所述现有电站设计方案的第二经纬度,从各所述现有电站设计方案中,确定与所述目标电站设计方案距离最近的K组最邻近现有电站设计方案的步骤包括:
根据经纬度对所述预设数据库中的现有电站设计方案进行分组,具有相同经纬度的现有电站设计方案组成一组现有电站设计方案组;
从所述预设数据库中获取K组现有电站设计方案组,组成现有电站设计方案集;
根据所述现有电站设计方案组对应的第三经纬度以及所述第一经纬度,确定所述现有电站设计方案集中的各所述现有电站设计方案组与目标电站设计方案之间的第一距离;
从所述预设数据库中获取待比对现有电站设计方案组;
根据所述待比对现有电站设计方案组对应的第四经纬度以及所述第一经纬度,确定所述待比对现有电站设计方案组与目标电站设计方案之间的第二距离;
若确定所述第二距离小于所述第一距离中的最大第一距离,则将所述最大第一距离对应的现有电站设计方案组从所述现有电站设计方案集中删除,并将所述待比对现有电站设计方案组添加至所述现有电站设计方案集中;
若确定所述预设数据库中存在待比对现有电站设计方案组,则返回执行所述从所述预设数据库中获取待比对现有电站设计方案组的步骤;
若确定所述预设数据库中不存在待比对现有电站设计方案组,则将所述现有电站设计方案集中的现有电站设计方案确定为最邻近现有电站设计方案。
5.如权利要求2所述的发电量数据预测方法,其特征在于,所述根据所述最邻近现有电站设计方案对应的第三发电量数据,确定所述目标电站设计方案对应的第二发电量数据的步骤包括:
对所述目标电站设计方案和各所述最邻近现有电站设计方案进行K均值聚类,从各所述最邻近现有电站设计方案中,确定与所述目标电站设计方案属于相同分类的目标最邻近现有电站设计方案;
根据所述目标最邻近现有电站设计方案对应的第四发电量数据,确定所述目标电站设计方案对应的第二发电量数据。
6.如权利要求5所述的发电量数据预测方法,其特征在于,所述第一关键设计参数值包括第一经纬度,所述根据所述目标最邻近现有电站设计方案对应的第四发电量数据,确定所述目标电站设计方案对应的第二发电量数据的步骤包括:
根据所述第四发电量数据对应的第五经纬度与所述第一经纬度之间的第三距离,确定各所述第四发电量数据各自对应的权重;
基于各所述第四发电量数据各自对应的权重,对各所述第四发电量数据进行加权平均计算,得到所述目标电站设计方案对应的第二发电量数据。
7.如权利要求1至6任一项所述的发电量数据预测方法,其特征在于,所述获取目标电站设计方案的第一关键设计参数值的步骤包括:
获取所述目标电站设计方案的初始设计参数值;
通过主成分分析,从所述初始设计参数值中确定第一关键设计参数值。
8.如权利要求1至6任一项所述的发电量数据预测方法,其特征在于,所述根据所述第一关键设计参数值、所述现有电站设计方案和K最邻近法,预测所述目标电站设计方案对应的第二发电量数据的步骤之前,还包括:
获取训练集和测试集,所述训练集包括仿真发电量数据和/或真实发电量数据,所述测试集包括真实发电量数据;
根据所述训练集和所述测试集,确定K最邻近法的K值。
9.如权利要求8所述的发电量数据预测方法,其特征在于,所述根据所述训练集和所述测试集,确定K最邻近法的K值的步骤包括:
将预设初始值作为K最邻近法的K值;
通过所述K最邻近法,确定所述测试集中的测试样本各自对应的发电量数据预测值;
根据所述测试样本对应的发电量数据预测值和发电量数据实际值,确定所述K值对应的预测误差;
若所述预测误差满足预设误差要求,则执行所述根据所述第一关键设计参数值、所述现有电站设计方案和K最邻近法,预测所述目标电站设计方案对应的第二发电量数据的步骤;
若所述预测误差不满足预设误差要求,则将预设初始值作为K最邻近法的K值与预设增加量的和值,并返回执行所述通过所述K最邻近法,确定所述测试集中的测试样本各自对应的发电量数据预测值的步骤。
10.一种发电量数据预测装置,其特征在于,所述发电量数据预测装置包括:
第一获取模块,用于获取目标电站设计方案的第一关键设计参数值;
检测模块,用于根据所述第一关键设计参数值,检测在预设数据库内的各个现有电站设计方案中,是否存在与所述目标电站设计方案相匹配的目标现有电站设计方案;
确定模块,用于若是,则将所述目标现有电站设计方案对应的第一发电量数据,确定为所述目标电站设计方案对应的第二发电量数据;
预测模块,用于若否,则根据所述第一关键设计参数值、所述现有电站设计方案和K最邻近法,预测所述目标电站设计方案对应的第二发电量数据。
11.一种发电量数据预测设备,其特征在于,所述发电量数据预测设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的发电量数据预测程序,所述发电量数据预测程序被所述处理器执行时实现如权利要求1至9中任一项所述的发电量数据预测方法的步骤。
12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有发电量数据预测程序,所述发电量数据预测程序被处理器执行时实现如权利要求1至9中任一项所述的发电量数据预测方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211137513.8A CN115423201A (zh) | 2022-09-19 | 2022-09-19 | 发电量数据预测方法、装置、设备及计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211137513.8A CN115423201A (zh) | 2022-09-19 | 2022-09-19 | 发电量数据预测方法、装置、设备及计算机可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115423201A true CN115423201A (zh) | 2022-12-02 |
Family
ID=84204052
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211137513.8A Pending CN115423201A (zh) | 2022-09-19 | 2022-09-19 | 发电量数据预测方法、装置、设备及计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115423201A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116227249A (zh) * | 2023-05-10 | 2023-06-06 | 南方电网数字电网研究院有限公司 | 功率气象数据智能迁移的新能源长期电量预测方法与系统 |
-
2022
- 2022-09-19 CN CN202211137513.8A patent/CN115423201A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116227249A (zh) * | 2023-05-10 | 2023-06-06 | 南方电网数字电网研究院有限公司 | 功率气象数据智能迁移的新能源长期电量预测方法与系统 |
CN116227249B (zh) * | 2023-05-10 | 2023-09-15 | 南方电网数字电网研究院有限公司 | 功率气象数据智能迁移的新能源长期电量预测方法与系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11526799B2 (en) | Identification and application of hyperparameters for machine learning | |
US20170109431A1 (en) | Method and apparatus for grouping network service users | |
CN110827924B (zh) | 基因表达数据的聚类方法、装置、计算机设备及存储介质 | |
CN111757464B (zh) | 一种区域轮廓提取方法及装置 | |
CN115688760B (zh) | 一种智能化导诊方法、装置、设备及存储介质 | |
CN112765003B (zh) | 一种基于app行为日志的风险预测方法 | |
CN115423201A (zh) | 发电量数据预测方法、装置、设备及计算机可读存储介质 | |
CN115860836A (zh) | 一种基于用户行为大数据分析的电商服务推送方法及系统 | |
CN110147493B (zh) | 活跃因子的确定方法、装置、计算机设备及存储介质 | |
CN111768247A (zh) | 下单率预测方法、设备及可读存储介质 | |
CN111626346A (zh) | 数据分类方法、设备、存储介质及装置 | |
CN113254250B (zh) | 数据库服务器异常成因检测方法、装置、设备和存储介质 | |
CN116992294A (zh) | 卫星测控训练评估方法、装置、设备及存储介质 | |
CN112966965A (zh) | 进出口大数据的分析和决策方法、装置、设备及存储介质 | |
CN113268328A (zh) | 批处理方法、装置、计算机设备和存储介质 | |
CN110704614B (zh) | 对应用中的用户群类型进行预测的信息处理方法及装置 | |
CN108520178B (zh) | 一种基于CFSFDP聚类的Android平台入侵检测方法 | |
CN116070149A (zh) | 基于人工智能的数据分析方法、系统及云平台 | |
CN115952078A (zh) | 一种测试用例排序方法、装置、系统及存储介质 | |
CN115190587A (zh) | Wifi位置确定方法、装置、电子设备及存储介质 | |
CN110502715B (zh) | 点击概率的预测方法及装置 | |
CN114610953A (zh) | 一种数据分类方法、装置、设备及存储介质 | |
CN112257856A (zh) | 深度学习框架确定方法、设备及可读存储介质 | |
CN113301648B (zh) | 指纹定位评估方法、装置、设备及存储介质 | |
CN112801489B (zh) | 诉讼案件风险检测方法、装置、设备和可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |