CN114037184A - 收益评价指标的预测方法、装置、介质、设备及程序产品 - Google Patents
收益评价指标的预测方法、装置、介质、设备及程序产品 Download PDFInfo
- Publication number
- CN114037184A CN114037184A CN202111456275.2A CN202111456275A CN114037184A CN 114037184 A CN114037184 A CN 114037184A CN 202111456275 A CN202111456275 A CN 202111456275A CN 114037184 A CN114037184 A CN 114037184A
- Authority
- CN
- China
- Prior art keywords
- power transmission
- sample data
- project
- historical
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000011156 evaluation Methods 0.000 title claims abstract description 103
- 238000000034 method Methods 0.000 title claims abstract description 92
- 230000005540 biological transmission Effects 0.000 claims abstract description 136
- 230000009466 transformation Effects 0.000 claims abstract description 136
- 230000001419 dependent effect Effects 0.000 claims abstract description 81
- 238000012549 training Methods 0.000 claims abstract description 77
- 238000007781 pre-processing Methods 0.000 claims abstract description 19
- 238000012545 processing Methods 0.000 claims abstract description 13
- 238000012360 testing method Methods 0.000 claims description 53
- 230000015654 memory Effects 0.000 claims description 33
- 238000012706 support-vector machine Methods 0.000 claims description 33
- 238000002790 cross-validation Methods 0.000 claims description 31
- 238000012795 verification Methods 0.000 claims description 25
- 230000006870 function Effects 0.000 claims description 17
- 238000004590 computer program Methods 0.000 claims description 14
- 230000008569 process Effects 0.000 description 15
- 238000004891 communication Methods 0.000 description 10
- 238000010606 normalization Methods 0.000 description 8
- 230000001360 synchronised effect Effects 0.000 description 7
- 230000000694 effects Effects 0.000 description 6
- 238000012417 linear regression Methods 0.000 description 6
- 238000004422 calculation algorithm Methods 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 5
- 238000010276 construction Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000003068 static effect Effects 0.000 description 4
- 238000010200 validation analysis Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 230000005611 electricity Effects 0.000 description 2
- 238000003062 neural network model Methods 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000013100 final test Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000007477 logistic regression Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000002759 z-score normalization Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- General Physics & Mathematics (AREA)
- Entrepreneurship & Innovation (AREA)
- Development Economics (AREA)
- Health & Medical Sciences (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Marketing (AREA)
- Data Mining & Analysis (AREA)
- Quality & Reliability (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Game Theory and Decision Science (AREA)
- General Health & Medical Sciences (AREA)
- Educational Administration (AREA)
- Operations Research (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- Molecular Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- Primary Health Care (AREA)
- Supply And Distribution Of Alternating Current (AREA)
Abstract
本申请公开一种收益评价指标的预测方法、装置、介质、设备及程序产品。该方法包括:获取历史时段内已建设的历史输变电工程对应的样本数据,样本数据包括历史收益评价指标和历史工程投资数据;确定基础模型的自变量和因变量,将每一输变电工程对应的工程投资数据选定为自变量,将每一输变电工程对应的收益评价指标选定为因变量;对样本数据中每一历史输变电工程对应的自变量和因变量进行预处理;根据预处理后的样本数据对基础模型进行训练,对因变量和自变量之间的函数关系进行拟合,得到目标预测模型;基于目标预测模型对目标输变电工程的工程投资数据进行处理,得到目标输变电工程在目标运营年度的收益评价指标的预测值,提高预测结果的准确性。
Description
技术领域
本申请涉及输变电工程技术领域,具体涉及一种收益评价指标的预测方法、装置、介质、设备及程序产品。
背景技术
近年来,科技的发展和人民生活水平的提高导致用电需求不断攀升,电力公司必须投资建设更多的输变电工程,提高电能的配送效率,以满足各行各业的电力需求。输变电工程的投资巨大,工程的稳定运营受多种因素的影响,因此选择一种有效的方法在工程投入前对工程运营后的收益情况进行预测,将会提高电力公司的工程建设效率。
然而,国内的电力公司输变电工程建设周期长、需要投入的本金巨大,工程收益回本周期较长,且还需要考虑地区人口、天气、经济以及其他电力公司同类型工程的市场竞争等相关因素的影响,导致工程建成投入运营后获得收益与预期收益差异较大,工程的投入参数与工程运营后所获得的收益之间建立显式的函数关系及其困难,因此现阶段电力公司对于计划建设的输变电工程在未来具体收益的预测难度较大。
国内目前的电力公司所投资建设的输变电工程,仍大部分是由人工统计数据,并根据以往经验或者使用简单的统计学理论进行计算,以获得工程收益评价指标的预测值。也有少数电力公司基于较为复杂的统计学理论对居民售电收益情况进行简单的预测,但是却缺少对具体输变电工程的收益评价指标的预测,且由于预测结果的主观性较强,使得预测结果的准确率不高,且占用了一定的人力成本。
发明内容
本申请实施例提供一种收益评价指标的预测方法、装置、介质、设备及程序产品,可以有效降低人工计算的成本,提高预测结果的准确性。
一方面,提供一种收益评价指标的预测方法,所述方法包括:获取历史时段内已建设的历史输变电工程对应的样本数据,所述样本数据包括每一所述历史输变电工程对应的历史收益评价指标和历史工程投资数据;确定基础模型的自变量和因变量,其中,将每一输变电工程对应的工程投资数据选定为所述自变量,将每一输变电工程对应的收益评价指标选定为所述因变量;对所述样本数据中每一所述历史输变电工程对应的所述自变量和所述因变量进行预处理,以得到预处理后的样本数据;根据所述预处理后的样本数据对所述基础模型进行训练,以对所述因变量和所述自变量之间的函数关系进行拟合,得到目标预测模型;基于所述目标预测模型对目标输变电工程的工程投资数据进行处理,得到所述目标输变电工程在目标运营年度的收益评价指标的预测值。
可选的,所述根据所述预处理后的样本数据对所述基础模型进行训练,以对所述因变量和所述自变量之间的函数关系进行拟合,得到目标预测模型,包括:根据所述预处理后的样本数据,通过交叉验证来确定所述基础模型中的最佳的超参数,所述超参数包括惩罚参数和核函数参数;根据所述最佳的超参数构建所述目标预测模型,其中,所述最佳的超参数使得所述目标预测模型中的所述因变量和所述自变量之间的关系之间的函数关系拟合。
可选的,所述根据所述预处理后的样本数据,通过交叉验证来确定所述基础模型中的最佳的超参数,包括:将所述预处理后的样本数据划分为K组子集,并基于所述K组子集确定训练集和测试集,其中,K为正整数,且K>2;使用交叉验证的方法,根据所述训练集和所述测试集构建K个模型,所述K个模型分别为K组超参数对应的所述基础模型;将所述K个模型对应的所述测试集的回归均方差的均值作为所述基础模型的性能判断指标;基于所述性能判断指标,确定所述基础模型中的最佳的超参数。
可选的,所述基于所述K组子集确定训练集和测试集,包括:将每组子集的样本数据分别作为一次所述测试集,将所述K组子集中的其余K-1组子集的样本数据作为所述训练集,以得到K组训练集和K组测试集。
可选的,所述使用交叉验证的方法,根据所述训练集和所述测试集构建K个模型,包括:将所述K组训练集中的每一组训练集分别输入所述基础模型训练所述因变量和所述自变量之间的函数关系,以得到K组超参数对应的所述基础模型;将所述K组测试集中的每一组测试集分别输入所述K组超参数对应的所述基础模型进行验证,以验证每一组超参数对应的所述基础模型中的所述因变量和所述自变量之间的函数关系,以得到K个验证结果。
可选的,所述基于所述性能判断指标,确定所述基础模型中的最佳的超参数,包括:基于所述性能判断指标,从所述K个验证结果中确定出准确率最高的验证结果;将所述准确率最高的验证结果对应的超参数,确定为所述基础模型中的最佳的超参数。
可选的,所述对所述样本数据中每一所述历史输变电工程对应的所述自变量和所述因变量进行预处理,包括:对所述样本数据中每一所述历史输变电工程对应的所述自变量和所述因变量进行归一化处理,以将所述自变量和所述因变量归一化为0到1区间的数值。
可选的,所述基础模型包括支持向量机SVM回归模型。
另一方面,提供一种收益评价指标的预测装置,所述装置包括:
获取单元,用于获取历史时段内已建设的历史输变电工程对应的样本数据,所述样本数据包括每一所述历史输变电工程对应的历史收益评价指标和历史工程投资数据;
确定单元,用于确定基础模型的自变量和因变量,其中,将每一输变电工程对应的工程投资数据选定为所述自变量,将每一输变电工程对应的收益评价指标选定为所述因变量;
预处理单元,用于对所述样本数据中每一所述历史输变电工程对应的所述自变量和所述因变量进行预处理,以得到预处理后的样本数据;
训练单元,用于根据所述预处理后的样本数据对所述基础模型进行训练,以对所述因变量和所述自变量之间的函数关系进行拟合,得到目标预测模型;
预测单元,用于基于所述目标预测模型对目标输变电工程的工程投资数据进行处理,得到所述目标输变电工程在目标运营年度的收益评价指标的预测值。
另一方面,提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序适于处理器进行加载,以执行如上任一实施例所述的收益评价指标的预测方法中的步骤。
另一方面,提供一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有计算机程序,所述处理器通过调用所述存储器中存储的所述计算机程序,用于执行如上任一实施例所述的收益评价指标的预测方法中的步骤。
另一方面,提供一种计算机程序产品,包括计算机指令,所述计算机指令被处理器执行时实现如上任一实施例所述的收益评价指标的预测方法中的步骤。
本申请实施例通过获取历史时段内已建设的历史输变电工程对应的样本数据,样本数据包括每一历史输变电工程对应的历史收益评价指标和历史工程投资数据;确定基础模型的自变量和因变量,其中,将每一输变电工程对应的工程投资数据选定为自变量,将每一输变电工程对应的收益评价指标选定为因变量;对样本数据中每一历史输变电工程对应的自变量和因变量进行预处理,以得到预处理后的样本数据;根据预处理后的样本数据对基础模型进行训练,以对因变量和自变量之间的函数关系进行拟合,得到目标预测模型;基于目标预测模型对目标输变电工程的工程投资数据进行处理,得到目标输变电工程在目标运营年度的收益评价指标的预测值。本申请实施例通过基础对收益评价指标和工程投资数据之间的函数关系进行拟合,训练得出目标预测模型,并基于该目标预测模型对目标输变电工程在目标运营年度的收益评价指标进行预测,可以有效降低人工计算的成本,提高预测结果的准确性。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的收益评价指标的预测方法的应用场景示意图。
图2为本申请实施例提供的收益评价指标的预测方法的第一流程示意图。
图3为本申请实施例提供的收益评价指标的预测装置的结构示意图。
图4为本申请实施例提供的计算机设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请实施例提供一种收益评价指标的预测方法、装置、计算机设备和存储介质。具体地,本申请实施例的收益评价指标的预测方法可以由计算机设备执行,其中,该计算机设备可以为终端或者服务器等设备。该终端可以为智能手机、平板电脑、笔记本电脑、智能电视、智能音箱、穿戴式智能设备、个人计算机(Personal Computer,PC)等设备,终端还可以包括客户端,该客户端可以是视频客户端、浏览器客户端或即时通信客户端等。服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content Delivery Network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。
本申请实施例可以根据电力公司以往投资建设的输变电工程运营的历史数据,通过基础模型训练因变量和自变量的函数关系,得到用于对计划建设的目标输变电工程的收益评价指标进行预测的目标预测模型。然后将待预测的任意一运营年度的工程投资数据输入所述目标预测模型,便可得到该运营年度的收益评价指标的预测值。
具体的,通过算法基础模型对历史收益评价指标和历史工程投资数据之间的函数关系进行拟合,训练得出目标预测模型,并基于该目标预测模型对未来某运营年度电力公司的电力投资收益进行预测,得到更加客观准确的收益评价指标,为电力公司的大数据分析提供基础,并为未来的电力投资计划的制定提供基础。
可选的,该基础模型可以为支持向量机(Surport Vector Machine,SVM)回归模型,可以使用SVM回归模型实现输变电工程的收益评价指标预测。SVM是一种基于统计学习理论的机器学习方法,主要内容包含最优超平面理论、分类间隔理论及核函数理论三方面。SVM算法适用于小样本数据,而且有很强的泛化能力,同时SVM也是一个凸二次优化问题,可在有限样本空间内找出全局最优解。因此SVM算法在分类和回归预测方面有良好的性能,被广泛应用于图像模式的分类识别、线性与非线性回归估计等。概括来讲,SVM算法的主要优点为当样本量不是海量数据的时候,分类准确率高,泛化能力强。
请参阅图1,图1为本申请实施例提供的收益评价指标的预测方法的应用场景示意图。以收益评价指标的预测方法和预测方法由计算机设备执行为例,其中,该计算机设备可以为终端或者服务器等设备。在训练阶段时,计算机设备获取获取历史时段内已建设的历史输变电工程对应的样本数据,样本数据包括每一历史输变电工程对应的历史收益评价指标和历史工程投资数据;确定基础模型的自变量和因变量,其中,将每一输变电工程对应的工程投资数据选定为自变量,将每一输变电工程对应的收益评价指标选定为因变量;对样本数据中每一历史输变电工程对应的自变量和因变量进行预处理,以得到预处理后的样本数据;根据预处理后的样本数据对基础模型进行训练,以对因变量和自变量之间的函数关系进行拟合,得到目标预测模型。在预测阶段时,对象可以通过计算机设备中安装的客户端、浏览器客户端或即时通信客户端上传目标输变电工程的工程投资数据,计算机设备获取对象上传的目标输变电工程的工程投资数据后,进一步对目标输变电工程的工程投资数据进行预处理,以获取预处理后的目标输变电工程的工程投资数据,基于目标预测模型及预处理后的目标输变电工程的工程投资数据进行收益评价指标的预测,以得到目标输变电工程在目标运营年度的收益评价指标的预测值。
需要说明的是,目标预测模型的训练过程、实际预测过程可以在服务器中完成,也可以在终端中完成。当模型的训练过程、实际预测过程都在服务器中端完成时,需要使用目标预测模型时,可以将目标输变电工程的工程投资数据输入到服务器,服务器实际预测完成后,将得到的目标输变电工程在目标运营年度的收益评价指标的预测值发送至终端进行显示。当模型的训练过程、实际预测过程都在终端中完成时,需要使用目标预测模型时,可以将目标输变电工程的工程投资数据输入到终端,终端实际预测完成后,终端将目标输变电工程在目标运营年度的收益评价指标的预测值进行显示。当模型的训练过程在服务器中完成,模型的实际预测过程在终端中完成时,需要使用目标预测模型时,可以将目标输变电工程的工程投资数据输入到终端,终端实际预测完成后,终端将目标输变电工程在目标运营年度的收益评价指标的预测值进行显示。可选的,可以将服务器中训练好的模型文件(model文件)移植到终端上,若需要对输入目标输变电工程的工程投资数据进行预测,则将目标输变电工程的工程投资数据输入到训练好的模型文件(model文件),通过计算即可得到目标输变电工程在目标运营年度的收益评价指标的预测值。
以下分别进行详细说明。需说明的是,以下实施例的描述顺序不作为对实施例优先顺序的限定。
本申请各实施例提供了一种收益评价指标的预测方法,该方法可以由终端或服务器执行,也可以由终端和服务器共同执行;本申请实施例以收益评价指标的预测方法由服务器执行为例来进行说明。
请参阅图2,图2为本申请实施例提供的收益评价指标的预测方法的第一流程示意图。该方法包括:
步骤201,获取历史时段内已建设的历史输变电工程对应的样本数据,所述样本数据包括每一所述历史输变电工程对应的历史收益评价指标和历史工程投资数据。
例如,获取过去10年电力公司所投资建设的历史输变电工程的历史收益评价指标和历史工程投资数据。
例如,该历史时段可以为过去10年、过去5年、过去2年等。例如,可以选取某电力公司过去10年连续投资建设的预设数量(比如60个)的历史输变电工程的历史收益评价指标和历史工程投资数据作为样本数据,样本数据中的每一样本可以包括一个历史输变电工程对应的历史收益评价指标和历史工程投资数据。
例如,收益评价指标可以为总投资收益率、项目资本金净利润率、工程结算金额、静态投资回收期中的至少一项。其中,历史收益评价指标为历史时段内某个历史输变电工程对应的收益评价指标。
例如,工程投资数据可以为投资金额估算、批准金额概算、所属省公司名称、电压等级、工程分类、工程运营地区人口和经济水平、规划投运年、运营年度中的至少一项。其中,历史工程投资数据为历史时段内某个历史输变电工程对应的工程投资数据。
步骤202,确定基础模型的自变量和因变量,其中,将每一输变电工程对应的工程投资数据选定为所述自变量,将每一输变电工程对应的收益评价指标选定为所述因变量。
其中,在函数关系式中,能够影响其他变量的一个变量称为自变量,随自变量的变动而变动的量称为因变量。
例如,该基础模型可以为包括神经网络模型、线性回归模型和非线性回归模型中的任一种。例如,线性回归模型可以为逻辑回归模型。例如,非线性回归模型可以为SVM回归模型。
其中,在因变量和自变量之间的关系是非线性的情况下,带有核函数的SVM回归模型会得到更精确的结果。
可选的,所述基础模型包括支持向量机SVM回归模型。
例如,该基础模型以SVM回归模型为例,可以根据SVM回归模型假设选定自变量x和因变量y。
例如,自变量x为某个输变电工程的投资数据,因变量y为需要预测的某个输变电工程某一年度的收益评价指标。
例如,对于样本数据中的每一历史输变电工程对应的自变量和因变量,将每一历史输变电工程对应的历史工程投资数据选定为自变量,将每一历史输变电工程对应的历史收益评价指标选定为因变量。
步骤203,对所述样本数据中每一所述历史输变电工程对应的所述自变量和所述因变量进行预处理,以得到预处理后的样本数据。
可选的,所述对所述样本数据中每一所述历史输变电工程对应的所述自变量和所述因变量进行预处理,以得到预处理后的样本数据,包括:
对所述样本数据中每一所述历史输变电工程对应的所述自变量和所述因变量进行归一化处理,以将所述自变量和所述因变量归一化为0到1区间的数值。
例如,该基础模型以SVM回归模型为例,SVM回归模型建立之前,需要对样本数据进行归一化预处理,归一化的目的是使得预处理的样本数据被限定在一定的范围内(比如[0,1]或者[-1,1]),从而消除奇异样本数据导致的不良影响,同时也可以加快模型的训练速度。
例如,可以选取某电力公司过去10年连续投资建设的预设数量(比如60个)的历史输变电工程的历史收益评价指标和历史工程投资数据作为样本数据,样本数据中的每一样本可以包括一个历史输变电工程对应的历史收益评价指标和历史工程投资数据;然后在步骤202中确定样本数据中每一样本对应的自变量x和因变量y;然后对选取的样本数据中的预设数量(比如60个)的样本的自变量x和因变量y进行归一化处理。例如,本申请实施例采用的归一化映射如下:
其中,x,y∈Rn,xmin=min(x),xmax=max(x);x表示自变量,y表示因变量,Rn表示样本数据。
例如,归一化的效果是将选取的60个样本归一化于[0,1]范围内,即yi∈[0,1],i=1,2,……,n。i表示第i个输变电工程,n表示输变电工程的总数,比如过去10年某电力公司投资建设有60个输变电工程,则n=60。
需要注意的是,这里使用的是最值归一化方法,相应的也可以使用其他归一化处理方式如中值归一化、Z-score标准化、Sigmoid函数标准化等进行数据预处理。
在本申请实施例中,对对样本数据中每一历史输变电工程对应的自变量和因变量都要进行归一化处理,以得到预处理后的样本数据。
步骤204,根据所述预处理后的样本数据对所述基础模型进行训练,以对所述因变量和所述自变量之间的函数关系进行拟合,得到目标预测模型。
可选的,所述根据所述预处理后的样本数据对所述基础模型进行训练,以对所述因变量和所述自变量之间的函数关系进行拟合,得到目标预测模型,包括:
根据所述预处理后的样本数据,通过交叉验证来确定所述基础模型中的最佳的超参数,所述超参数包括惩罚参数和核函数参数;
根据所述最佳的超参数构建所述目标预测模型,其中,所述最佳的超参数使得所述目标预测模型中的所述因变量和所述自变量之间的关系之间的函数关系拟合。
例如,为了提高目标预测模型的预测准确性,可以使用交叉验证方法(CrossValidation,CV)选择最佳的超参数。
其中,CV是用来验证分类器性能的一种统计分析方法,其基本思想是在某种意义下将样本数据进行分组,一部分作为测试集,另一部分作为验证集;先用训练集对分类器进行训练,再利用验证集来测试训练得到的模型,以得到的分类准确率作为评价分类器的性能判断指标。
例如,通常为了评估模型的预测效果,可以将样本数据划分为训练集(trainingset)和测试集(test set),对比不同模型及参数设置在测试集上的表现,来选择较优的模型和参数。
例如,交叉验证的方法可以包括普通验证方法、2折交叉验证(2-fold CrossValidation)、K折交叉验证(k-fold Cross Validation)等。
普通验证方法:将样本数据分为训练集和测试集两部分,利用训练集训练基础模型,然后利用测试集验证基础模型,记录分类准确率为基础模型的性能判断指标。其中,普通验证方法得到验证结果的准确率高低与样本数据的划分有很大关系。
2折交叉验证方法:将数据集样本数据分为两个大小相等的子集,分别作为训练集和测试集进行分类器的训练。2折交叉验证方法这样做出训练样本相对整体数据集样本数据过小,不足以代表整个样本集样本数据。
K折交叉验证方法:将原始样本数据分为k组,将其中一个子集数据分别做为测试集,其余k-1组子集数据作为训练集,这样会得到k个模型,用采用这k个模型最终的测试集的分类准确率的平均数均方差作为此K折交叉验证K-CV下分类器基础模型的性能判断指标,可以有效的避免过拟合与欠拟合的发生。
可选的,所述根据所述预处理后的样本数据,通过交叉验证来确定所述基础模型中的最佳的超参数,包括:
将所述预处理后的样本数据划分为K组子集,并基于所述K组子集确定训练集和测试集,其中,K为正整数,且K>2;
使用交叉验证的方法,根据所述训练集和所述测试集构建K个模型,所述K个模型分别为K组超参数对应的所述基础模型;
将所述K个模型对应的所述测试集的回归均方差的均值作为所述基础模型的性能判断指标;
基于所述性能判断指标,确定所述基础模型中的最佳的超参数。
例如,均方差(Mean Squared Error,MSE)一般是用来检测模型的预测值和真实值之间的偏差。其中,均方差的值越大,表明预测效果越差;均方差的值越小,表明预测效果越好。
例如,每个模型对应的测试集的回归均方差的计算公式如下:
其中,xi表示测试集中第i个样本对应的历史工程投资数据,f(xi)表示基础模型基于测试集中第i个样本对应的历史工程投资数据进行预测输出的预测值,yi表示测试集中第i个样本对应的历史收益评价指标。N表示样本的总数。
其中,训练K个模型,每次都能得到一个MSE,将K个模型对应的测试集的回归均方差的均值作为基础模型的性能判断指标。
可选的,所述基于所述K组子集确定训练集和测试集,包括:
将每组子集的样本数据分别作为一次所述测试集,将所述K组子集中的其余K-1组子集的样本数据作为所述训练集,以得到K组训练集和K组测试集。
可选的,所述使用交叉验证的方法,根据所述训练集和所述测试集构建K个模型,包括:
将所述K组训练集中的每一组训练集分别输入所述基础模型训练所述因变量和所述自变量之间的函数关系,以得到K组超参数对应的所述基础模型;
将所述K组测试集中的每一组测试集分别输入所述K组超参数对应的所述基础模型进行验证,以验证每一组超参数对应的所述基础模型中的所述因变量和所述自变量之间的函数关系,以得到K个验证结果。
可选的,所述基于所述性能判断指标,确定所述基础模型中的最佳的超参数,包括:
基于所述性能判断指标,从所述K个验证结果中确定出准确率最高的验证结果;
将所述准确率最高的验证结果对应的超参数,确定为所述基础模型中的最佳的超参数。
例如,基础模型以SVM回归模型为例,交叉验证方法以K折交叉验证方法为例进行说明。例如,在步骤120将选定的包含有预设数量(比如60个)的样本的60个样本数据分成K组,将每组子集的样本数据分别作为一次测试集,而同时,将其余K-1组子集的样本数据作为训练集,使用这种交叉验证的方式(CV)最终可以获得K个模型,然后将这K个模型对应的测试集的回归均方差的均值作为SVM模型性能的判断指标。
例如,在交叉验证的过程中,需要设定SVM回归模型的惩罚参数c和核函数参数g,如果使用默认的惩罚参数c和核函数参数g进行拟合,得到的模型预测效果误差较大,准确度不高。因此,需要对惩罚参数c和核函数参数g在一定范围内进行取值。其中,使用交叉验证方法建立SVM回归模型,调节惩罚参数c和核函数参数g,验证SVM回归模型的准确率,最终基于性能判断指标,从K个验证结果中确定出准确率最高的验证结果,并取使得测试集验证SVM回归模型得到的验证结果的准确率最高的那组调节惩罚参数c和核函数参数g,作为最佳的超参数;使用得到的最佳的调节惩罚参数c和核函数参数g,构建目标预测模型。
步骤205,基于所述目标预测模型对目标输变电工程的工程投资数据进行处理,得到所述目标输变电工程在目标运营年度的收益评价指标的预测值。
例如,将目标输变电工程的工程投资数据输入目标预测模型,以得到目标输变电工程在目标运营年度的收益评价指标的预测值。
例如,在获取目标输变电工程的工程投资数据之后,可以进一步对目标输变电工程的工程投资数据进行预处理,以获取预处理后的目标输变电工程的工程投资数据,并基于目标预测模型及预处理后的目标输变电工程的工程投资数据进行收益评价指标的预测,以得到目标输变电工程在目标运营年度的收益评价指标的预测值。
其中,该预处理可以为归一化处理,通过对目标输变电工程的工程投资数据进行归一化处理,以消除程投资数据中的异常数据。
本申请实施例提供的目标预测模型可以为基于SVM回归模型训练得到的预测模型,可以通过SVM回归模型对历史收益评价指标和历史工程投资数据之间的函数关系进行拟合训练,以得到目标预测模型,可以基于目标预测模型,对未来某个运营年度的目标输变电工程的的工程收益进行预测,获得具体的收益评价指标,为电力公司提供分析数据基础,进而提高工程售电收益。
本申请实施例可以使用SVM回归模型实现收益预测,能够有效降低人工计算的成本。同时,SVM回归模型适用于小样本数据,对于电力输变电工程这种样本数量不高的收益预测效果更好,准确率更高。
本申请实施例主要以SVM回归预测模型实现输变电工程的收益预测来进行说明,基于本申请实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,包括使用多元线性回归模型、神经网络模型、局部加权线性回归模型等方法实现输变电工程的收益预测,都属于本申请保护的范围。
上述所有的技术方案,可以采用任意结合形成本申请的可选实施例,在此不再一一赘述。
本申请实施例通过获取历史时段内已建设的历史输变电工程对应的样本数据,样本数据包括每一历史输变电工程对应的历史收益评价指标和历史工程投资数据;确定基础模型的自变量和因变量,其中,将每一输变电工程对应的工程投资数据选定为自变量,将每一输变电工程对应的收益评价指标选定为因变量;对样本数据中每一历史输变电工程对应的自变量和因变量进行预处理,以得到预处理后的样本数据;根据预处理后的样本数据对基础模型进行训练,以对因变量和自变量之间的函数关系进行拟合,得到目标预测模型;基于目标预测模型对目标输变电工程的工程投资数据进行处理,得到目标输变电工程在目标运营年度的收益评价指标的预测值。本申请实施例通过基础对收益评价指标和工程投资数据之间的函数关系进行拟合,训练得出目标预测模型,并基于该目标预测模型对目标输变电工程在目标运营年度的收益评价指标进行预测,可以有效降低人工计算的成本,提高预测结果的准确性。
为便于更好的实施本申请实施例的收益评价指标的预测方法,本申请实施例还提供一种收益评价指标的预测装置。请参阅图3,图3为本申请实施例提供的收益评价指标的预测装置的结构示意图。其中,该收益评价指标的预测装置300可以包括:
获取单元301,用于获取历史时段内已建设的历史输变电工程对应的样本数据,所述样本数据包括每一所述历史输变电工程对应的历史收益评价指标和历史工程投资数据;
确定单元302,用于确定基础模型的自变量和因变量,其中,将每一输变电工程对应的工程投资数据选定为所述自变量,将每一输变电工程对应的收益评价指标选定为所述因变量;
预处理单元303,用于对所述样本数据中每一所述历史输变电工程对应的所述自变量和所述因变量进行预处理,以得到预处理后的样本数据;
训练单元304,用于根据所述预处理后的样本数据对所述基础模型进行训练,以对所述因变量和所述自变量之间的函数关系进行拟合,得到目标预测模型;
预测单元305,用于基于所述目标预测模型对目标输变电工程的工程投资数据进行处理,得到所述目标输变电工程在目标运营年度的收益评价指标的预测值。
可选的,所述训练单元304,可以用于:根据所述预处理后的样本数据,通过交叉验证来确定所述基础模型中的最佳的超参数,所述超参数包括惩罚参数和核函数参数;根据所述最佳的超参数构建所述目标预测模型,其中,所述最佳的超参数使得所述目标预测模型中的所述因变量和所述自变量之间的关系之间的函数关系拟合。
可选的,所述训练单元304在根据所述预处理后的样本数据,通过交叉验证来确定所述基础模型中的最佳的超参数时,包括:将所述预处理后的样本数据划分为K组子集,并基于所述K组子集确定训练集和测试集,其中,K为正整数,且K>2;使用交叉验证的方法,根据所述训练集和所述测试集构建K个模型,所述K个模型分别为K组超参数对应的所述基础模型;将所述K个模型对应的所述测试集的回归均方差的均值作为所述基础模型的性能判断指标;基于所述性能判断指标,确定所述基础模型中的最佳的超参数。
可选的,所述训练单元304在基于所述K组子集确定训练集和测试集时,可以用于:将每组子集的样本数据分别作为一次所述测试集,将所述K组子集中的其余K-1组子集的样本数据作为所述训练集,以得到K组训练集和K组测试集。
可选的,所述训练单元304在使用交叉验证的方法,根据所述训练集和所述测试集构建K个模型时,可以用于:将所述K组训练集中的每一组训练集分别输入所述基础模型训练所述因变量和所述自变量之间的函数关系,以得到K组超参数对应的所述基础模型;将所述K组测试集中的每一组测试集分别输入所述K组超参数对应的所述基础模型进行验证,以验证每一组超参数对应的所述基础模型中的所述因变量和所述自变量之间的函数关系,以得到K个验证结果。
可选的,所述训练单元304在基于所述性能判断指标,确定所述基础模型中的最佳的超参数时,可以用于:基于所述性能判断指标,从所述K个验证结果中确定出准确率最高的验证结果;将所述准确率最高的验证结果对应的超参数,确定为所述基础模型中的最佳的超参数。
可选的,所述预处理单元303,可以用于:对所述样本数据中每一所述历史输变电工程对应的所述自变量和所述因变量进行归一化处理,以将所述自变量和所述因变量归一化为0到1区间的数值。
可选的,所述基础模型包括支持向量机SVM回归模型。
需要说明的是,本申请实施例中的收益评价指标的预测装置300中各模块的功能可对应参考上述各方法实施例中任意实施例的具体实现方式,这里不再赘述。
上述收益评价指标的预测装置中的各个单元可全部或部分通过软件、硬件及其组合来实现。上述各个单元可以以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行上述各个单元对应的操作。
收益评价指标的预测装置300例如可以集成在具备储存器并安装有处理器而具有运算能力的终端或服务器中,或者该收益评价指标的预测装置300为该终端或服务器。
可选的,本申请还提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述各方法实施例中的步骤。
图4为本申请实施例提供的计算机设备的结构示意图,如图4所示,计算机设备400可以包括:通信接口401,存储器402,处理器403和通信总线404。通信接口401,存储器402,处理器403通过通信总线404实现相互间的通信。通信接口401用于装置400与外部设备进行数据通信。存储器402可用于存储软件程序以及模块,处理器403通过运行存储在存储器402的软件程序以及模块,例如前述方法实施例中的相应操作的软件程序。
可选的,该处理器403可以调用存储在存储器402的软件程序以及模块执行如下操作:获取历史时段内已建设的历史输变电工程对应的样本数据,所述样本数据包括每一所述历史输变电工程对应的历史收益评价指标和历史工程投资数据;确定基础模型的自变量和因变量,其中,将每一输变电工程对应的工程投资数据选定为所述自变量,将每一输变电工程对应的收益评价指标选定为所述因变量;对所述样本数据中每一所述历史输变电工程对应的所述自变量和所述因变量进行预处理,以得到预处理后的样本数据;根据所述预处理后的样本数据对所述基础模型进行训练,以对所述因变量和所述自变量之间的函数关系进行拟合,得到目标预测模型;基于所述目标预测模型对目标输变电工程的工程投资数据进行处理,得到所述目标输变电工程在目标运营年度的收益评价指标的预测值。
可选的,计算机设备400可以为该终端或服务器。该终端可以为智能手机、平板电脑、笔记本电脑、智能电视、智能音箱、穿戴式智能设备、个人计算机等设备。该服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器。
本申请还提供了一种计算机可读存储介质,用于存储计算机程序。该计算机可读存储介质可应用于计算机设备,并且该计算机程序使得计算机设备执行本申请实施例中的收益评价指标的预测方法中的相应流程,为了简洁,在此不再赘述。
本申请还提供了一种计算机程序产品,该计算机程序产品包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得计算机设备执行本申请实施例中的收益评价指标的预测方法中的相应流程,为了简洁,在此不再赘述。
本申请还提供了一种计算机程序,该计算机程序包括计算机指令,计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得计算机设备执行本申请实施例中的收益评价指标的预测方法中的相应流程,为了简洁,在此不再赘述。
应理解,本申请实施例的处理器可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法实施例的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器、数字信号处理器(Digital SignalProcessor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。
可以理解,本申请实施例中的存储器可以是易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(Read-Only Memory,ROM)、可编程只读存储器(Programmable ROM,PROM)、可擦除可编程只读存储器(Erasable PROM,EPROM)、电可擦除可编程只读存储器(Electrically EPROM,EEPROM)或闪存。易失性存储器可以是随机存取存储器(Random Access Memory,RAM),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的RAM可用,例如静态随机存取存储器(Static RAM,SRAM)、动态随机存取存储器(Dynamic RAM,DRAM)、同步动态随机存取存储器(Synchronous DRAM,SDRAM)、双倍数据速率同步动态随机存取存储器(Double Data RateSDRAM,DDR SDRAM)、增强型同步动态随机存取存储器(Enhanced SDRAM,ESDRAM)、同步连接动态随机存取存储器(Synchlink DRAM,SLDRAM)和直接内存总线随机存取存储器(DirectRambus RAM,DR RAM)。应注意,本文描述的系统和方法的存储器旨在包括但不限于这些和任意其它适合类型的存储器。
应理解,上述存储器为示例性但不是限制性说明,例如,本申请实施例中的存储器还可以是静态随机存取存储器(static RAM,SRAM)、动态随机存取存储器(dynamic RAM,DRAM)、同步动态随机存取存储器(synchronous DRAM,SDRAM)、双倍数据速率同步动态随机存取存储器(double data rate SDRAM,DDR SDRAM)、增强型同步动态随机存取存储器(enhanced SDRAM,ESDRAM)、同步连接动态随机存取存储器(synch link DRAM,SLDRAM)以及直接内存总线随机存取存储器(Direct Rambus RAM,DR RAM)等等。也就是说,本申请实施例中的存储器旨在包括但不限于这些和任意其它适合类型的存储器。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应所述以权利要求的保护范围为准。
Claims (12)
1.一种收益评价指标的预测方法,其特征在于,所述方法包括:
获取历史时段内已建设的历史输变电工程对应的样本数据,所述样本数据包括每一所述历史输变电工程对应的历史收益评价指标和历史工程投资数据;
确定基础模型的自变量和因变量,其中,将每一输变电工程对应的工程投资数据选定为所述自变量,将每一输变电工程对应的收益评价指标选定为所述因变量;
对所述样本数据中每一所述历史输变电工程对应的所述自变量和所述因变量进行预处理,以得到预处理后的样本数据;
根据所述预处理后的样本数据对所述基础模型进行训练,以对所述因变量和所述自变量之间的函数关系进行拟合,得到目标预测模型;
基于所述目标预测模型对目标输变电工程的工程投资数据进行处理,得到所述目标输变电工程在目标运营年度的收益评价指标的预测值。
2.如权利要求1所述的收益评价指标的预测方法,其特征在于,所述根据所述预处理后的样本数据对所述基础模型进行训练,以对所述因变量和所述自变量之间的函数关系进行拟合,得到目标预测模型,包括:
根据所述预处理后的样本数据,通过交叉验证来确定所述基础模型中的最佳的超参数,所述超参数包括惩罚参数和核函数参数;
根据所述最佳的超参数构建所述目标预测模型,其中,所述最佳的超参数使得所述目标预测模型中的所述因变量和所述自变量之间的关系之间的函数关系拟合。
3.如权利要求2所述的收益评价指标的预测方法,其特征在于,所述根据所述预处理后的样本数据,通过交叉验证来确定所述基础模型中的最佳的超参数,包括:
将所述预处理后的样本数据划分为K组子集,并基于所述K组子集确定训练集和测试集,其中,K为正整数,且K>2;
使用交叉验证的方法,根据所述训练集和所述测试集构建K个模型,所述K个模型分别为K组超参数对应的所述基础模型;
将所述K个模型对应的所述测试集的回归均方差的均值作为所述基础模型的性能判断指标;
基于所述性能判断指标,确定所述基础模型中的最佳的超参数。
4.如权利要求3所述的收益评价指标的预测方法,其特征在于,所述基于所述K组子集确定训练集和测试集,包括:
将每组子集的样本数据分别作为一次所述测试集,将所述K组子集中的其余K-1组子集的样本数据作为所述训练集,以得到K组训练集和K组测试集。
5.如权利要求4所述的收益评价指标的预测方法,其特征在于,所述使用交叉验证的方法,根据所述训练集和所述测试集构建K个模型,包括:
将所述K组训练集中的每一组训练集分别输入所述基础模型训练所述因变量和所述自变量之间的函数关系,以得到K组超参数对应的所述基础模型;
将所述K组测试集中的每一组测试集分别输入所述K组超参数对应的所述基础模型进行验证,以验证每一组超参数对应的所述基础模型中的所述因变量和所述自变量之间的函数关系,以得到K个验证结果。
6.如权利要求5所述的收益评价指标的预测方法,其特征在于,所述基于所述性能判断指标,确定所述基础模型中的最佳的超参数,包括:
基于所述性能判断指标,从所述K个验证结果中确定出准确率最高的验证结果;
将所述准确率最高的验证结果对应的超参数,确定为所述基础模型中的最佳的超参数。
7.如权利要求1所述的收益评价指标的预测方法,其特征在于,所述对所述样本数据中每一所述历史输变电工程对应的所述自变量和所述因变量进行预处理,包括:
对所述样本数据中每一所述历史输变电工程对应的所述自变量和所述因变量进行归一化处理,以将所述自变量和所述因变量归一化为0到1区间的数值。
8.如权利要求1所述的收益评价指标的预测方法,其特征在于,所述基础模型包括支持向量机SVM回归模型。
9.一种收益评价指标的预测装置,其特征在于,所述装置包括:
获取单元,用于获取历史时段内已建设的历史输变电工程对应的样本数据,所述样本数据包括每一所述历史输变电工程对应的历史收益评价指标和历史工程投资数据;
确定单元,用于确定基础模型的自变量和因变量,其中,将每一输变电工程对应的工程投资数据选定为所述自变量,将每一输变电工程对应的收益评价指标选定为所述因变量;
预处理单元,用于对所述样本数据中每一所述历史输变电工程对应的所述自变量和所述因变量进行预处理,以得到预处理后的样本数据;
训练单元,用于根据所述预处理后的样本数据对所述基础模型进行训练,以对所述因变量和所述自变量之间的函数关系进行拟合,得到目标预测模型;
预测单元,用于基于所述目标预测模型对目标输变电工程的工程投资数据进行处理,得到所述目标输变电工程在目标运营年度的收益评价指标的预测值。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序适于处理器进行加载,以执行如权利要求1-8任一项所述的收益评价指标的预测方法中的步骤。
11.一种计算机设备,其特征在于,所述计算机设备包括处理器和存储器,所述存储器中存储有计算机程序,所述处理器通过调用所述存储器中存储的所述计算机程序,用于执行权利要求1-8任一项所述的收益评价指标的预测方法中的步骤。
12.一种计算机程序产品,包括计算机指令,其特征在于,所述计算机指令被处理器执行时实现权利要求1-8任一项所述的收益评价指标的预测方法中的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111456275.2A CN114037184A (zh) | 2021-12-01 | 2021-12-01 | 收益评价指标的预测方法、装置、介质、设备及程序产品 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111456275.2A CN114037184A (zh) | 2021-12-01 | 2021-12-01 | 收益评价指标的预测方法、装置、介质、设备及程序产品 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114037184A true CN114037184A (zh) | 2022-02-11 |
Family
ID=80146061
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111456275.2A Pending CN114037184A (zh) | 2021-12-01 | 2021-12-01 | 收益评价指标的预测方法、装置、介质、设备及程序产品 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114037184A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115007634A (zh) * | 2022-06-22 | 2022-09-06 | 浙江大学 | 一种基于机器学习的修复有机污染土壤的方法 |
CN116629791A (zh) * | 2023-05-24 | 2023-08-22 | 内蒙古正志网络科技有限公司 | 一种基于大数据的信息预测分析系统及方法 |
CN116755978A (zh) * | 2023-08-21 | 2023-09-15 | 深圳惠科存储科技有限公司 | 内存运行状态评估方法、电子设备及可读存储介质 |
CN117611240A (zh) * | 2023-12-22 | 2024-02-27 | 河北建投智慧财务服务有限公司 | 多主体的利润预测方法、装置、电子设备及存储介质 |
-
2021
- 2021-12-01 CN CN202111456275.2A patent/CN114037184A/zh active Pending
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115007634A (zh) * | 2022-06-22 | 2022-09-06 | 浙江大学 | 一种基于机器学习的修复有机污染土壤的方法 |
CN115007634B (zh) * | 2022-06-22 | 2022-12-06 | 浙江大学 | 一种基于机器学习的修复有机污染土壤的方法 |
CN116629791A (zh) * | 2023-05-24 | 2023-08-22 | 内蒙古正志网络科技有限公司 | 一种基于大数据的信息预测分析系统及方法 |
CN116755978A (zh) * | 2023-08-21 | 2023-09-15 | 深圳惠科存储科技有限公司 | 内存运行状态评估方法、电子设备及可读存储介质 |
CN117611240A (zh) * | 2023-12-22 | 2024-02-27 | 河北建投智慧财务服务有限公司 | 多主体的利润预测方法、装置、电子设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114037184A (zh) | 收益评价指标的预测方法、装置、介质、设备及程序产品 | |
Singh et al. | Re-estimation and comparisons of alternative accounting based bankruptcy prediction models for Indian companies | |
Farboodi et al. | Where has all the big data gone? | |
CN113239314A (zh) | 用于碳排放量预测的方法、装置、终端及计算机可读存储介质 | |
US20220407352A1 (en) | Spatio-temporal probabilistic forecasting of wind power output | |
CN106355499A (zh) | 一种股票价格趋势预测及交易方法 | |
Hurn et al. | A smooth transition logit model of the effects of deregulation in the electricity market | |
CN111753461B (zh) | 潮汐水位修正方法、目标余水位获取方法、装置和设备 | |
Zhan et al. | Housing prices prediction with deep learning: an application for the real estate market in Taiwan | |
KR102330423B1 (ko) | 이미지 인식 딥러닝 알고리즘을 이용한 온라인 부도 예측 시스템 | |
CN113011895A (zh) | 关联账户样本筛选方法、装置和设备及计算机存储介质 | |
Wu et al. | Farm capital structure choice: theory and an empirical test | |
Kam et al. | Uncovering the hit list for small inflation targeters: A Bayesian structural analysis | |
CN114065653A (zh) | 电力负荷预测模型的构建方法与电力负荷预测方法 | |
CN113240153A (zh) | 光伏发电数据预测方法、装置、计算设备及存储介质 | |
CN114943565A (zh) | 基于智能算法的电力现货价格预测方法及装置 | |
CN118037440B (zh) | 一种综合信贷系统的授信数据处理方法及系统 | |
CN117314233A (zh) | 供应商评价方法、装置、终端设备及介质 | |
CN118333235A (zh) | 行为欺诈风险预测方法、装置及电子设备 | |
CN114970357A (zh) | 节能效果评价方法、系统、装置及存储介质 | |
CN118134046A (zh) | 一种基于机器学习的风电场功率预测方法及系统 | |
Wang et al. | Forecasting open-high-low-close data contained in candlestick chart | |
CN117372070A (zh) | 地产市场趋势的确定方法、装置、计算机设备及存储介质 | |
CN117557375A (zh) | 基于虚拟电厂的交易评估方法及相关装置 | |
CN117575773A (zh) | 业务数据的确定方法、装置、计算机设备、存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |