CN110992113A

CN110992113A - 基于神经网络智能算法的基建变电站项目造价预测方法

Info

Publication number: CN110992113A
Application number: CN201911334082.2A
Authority: CN
Inventors: 周明; 卢生炜; 武强; 李安; 马莉; 金莎; 明月; 孙利平; 周秋鹏; 王思聪; 桑子夏; 黄家祺; 王姝; 杨东俊; 方仍存; 赵红生; 许维明; 谢元俊; 李俊卿; 唐建
Original assignee: State Grid Hubei Electric Power Co Ltd; China Power Engineering Consultant Group Central Southern China Electric Power Design Institute Corp; Economic and Technological Research Institute of State Grid Hubei Electric Power Co Ltd
Current assignee: State Grid Hubei Electric Power Co Ltd; China Power Engineering Consultant Group Central Southern China Electric Power Design Institute Corp; Economic and Technological Research Institute of State Grid Hubei Electric Power Co Ltd
Priority date: 2019-12-23
Filing date: 2019-12-23
Publication date: 2020-04-10

Abstract

本发明提供了一种基于神经网络智能算法的基建变电站项目造价预测方法，其特征在于包括以下步骤：收集已有的输变电工程决算数据作为样本并对样本数据进行预处理形成数据集，从数据集的原始因素库筛选出关键因素集做进一步分析并提取特征参数，根据数据库的特征参数构建造价预测模型；将待预测输变电工程数据进行预处理并提取特征参数，将特征参数代入造价预测模型，获得工程造价。本发明保证投资计划安排的精准性和合理性，提升公司电网资产转资率，为公司输配电价稳定提供重要支撑。

Description

基于神经网络智能算法的基建变电站项目造价预测方法

技术领域

本发明涉及110kV及以上变电站工程造价预测领域，具体涉及一种基于神经网络智能算法的基建变电站项目造价预测方法。

背景技术

国外特别是欧美等一系列发达国家对于造价预测的研究起步较早，所使用的方法也比较传统经典。对于工程项目造价的研究最早起源于英国，以皇家测量师协会为背景的英国政府就提出了建筑成本信息服务系统。

20世纪90年代以来，随着计算机的发展，遗传算法、人工神经网络等人工智能技术，在建立工程造价估算模型方面，有着十分广泛的应用。专家系统也是人工智能的一种，它采用了人工智能和知识库技术，建立工程造价估算专家系统。比如：加拿大的Revay管理系统公司(ILMS)开发的CT-4软件，它将成本与工期管理集合在一起，能够及时、准确地反映信息，满足灵活、开放的管理需求。法国和意大利在工程造价估算方面也都有一套建立在对现有工程资料分析基础上的科学方法。英美等国的工程造价管理能够提供准确的工程造价估算和高效的造价控制，得益于他们对大量已完成的工程造价成果的搜集、汇总、整理、分析并在此基础上建立起了人工智能化的管理系统，采用数据挖掘等科学的数据分析手段，提供准确及时的信息指导工程建设过程。

中国各界学者对于新建项目造价预测的研究起始于1980年代，当今国内学术界主流的造价预测方法除了传统的清单计价法和定额计价法外，还引入了模糊数学、机器学习算法等方法将数学和计算机领域的知识引入到工程造价预测领域中，也取得了较好的学术成果。其中机器学习算法又分为了支持向量机、人工神经网络、粒子群等几大类主流的算法。近年来随着我国社会的发展和技术的进步，许多项目建筑公司在参与工程建设的项目过程中，累积了大量的工程建设造价记录和数据。但这些数据只是单纯地被储存在数据库中，而并未将其很好地利用起来并将其应用新输电工程的建设中，造成了企业数据资源的浪费。目前迫切需要一种技术方法去利用和分析企业的历史工程建设数据，并获得相应的规律和结论，为新输变电工程的建设和造价的管控提供有意义的信息。

发明内容

本发明的目的就是针对现有技术的缺陷，提供一种基于神经网络智能算法的基建变电站项目造价预测方法，通过对不同类型的项目投资造价水平科学的评估预测，提高项目在可研阶段的投资精准度，为投资计划决策提供数据支撑，保证投资计划安排的精准性和合理性，提升公司电网资产转资率，为公司输配电价稳定提供重要支撑。

本发明提供了一种基于神经网络智能算法的基建变电站项目造价预测方法，其特征在于包括以下步骤：收集已有的输变电工程决算数据作为样本并对样本数据进行预处理形成数据集，从数据集的原始因素库筛选出关键因素集做进一步分析并提取特征参数，根据数据库的特征参数构建造价预测模型；将待预测输变电工程数据进行预处理并提取特征参数，将特征参数代入造价预测模型，获得工程造价。

上述技术方案中，识别原始因素库中的电网工程造价因素并通过主成分分析法提取出关键因素，通过神经网络检验提取的关键因素，通过检验的关键因素并入关键因素集。

上述技术方案中，提取关键因素的过程包括以下步骤：将预处理过后的各工程特征数据按列组成矩阵X，使得每列数据代表同一个工程项目中的影响因素，每行数据代表一种影响因素；m个工程，n个影响因素的数据就可以转换成如下式所示矩阵X：

其中a_ij表示第j个项目第i个因素的数据值；

将每一行数据减去这一行所有数据的均值，进行零均值化得到下式：

求出协方差矩阵：

求出协方差矩阵的特征值及对应的特征向量，并将特征向量按对应特征值大小从上到下按行排列成矩阵，取前k行组成矩阵P，降维到k维后的数据X’即如下式所示：

X′＝PX

采用这种方式将数据转换到新的坐标系，每条坐标轴即为关键因素。

上述技术方案中，选择神经网络模型或支持向量回归模型或者神经网路模型和支持向量回归模型组合形成的组合预测模型作为最佳模型，将关键因素集作为测试样本代入最佳模型获得预测结果并与实际结果相比较，如果比较结果满足要求即判断最佳模型为造价预测模型，反之则重复上述步骤。

上述技术方案中，收集的样本数据包括基建项目的进度、科研、初设、结算、决算、转资业务数据，确定以上各项数据的来源，核对数据的完整性及颗粒度，开展数据清洗工作。

上述技术方案中，通过数据清洗、整合、转换、规约处理方法对样本数据进行预处理，最终得到可用于模型分析的数据集。其中数据清洗指对数据遗漏进行填充或者忽略，对杂质数据进行除噪，对不一致数据进行核对校正；

数据整合是指把多个原数据集成结合到一个数据存储中，进行数据冗余和数据冲突值的检查与处理。

数据转换包括平滑、聚集、数据泛化、规范化及属性构造手段，其中规范化的方式有最大最小规范化、0-1值规范化和小数定标规范化；

数据归约用于将数据集归约化，减少分析所需时间的同时又不失数据的完整性，保证归约前后结果的一致性。

上述技术方案中，对变电工程的样本集进行预处理，

其中变电工程样本集的预处理包括以下步骤：剔除重复信息，保留全站征地面积与全站及主控楼建筑面积；删除主变压器远期台数，以电力电缆和控制电缆总量作为因素，而不再细分统一量纲；对定性指标进行量化处理。

本发明不仅仅局限于传统的输变电工程造价预测方法，而引入时下较为热门的智能算法，克服了传统的输变电工程注重于实际实施而轻视事先预控的缺点，输变电工程造价预测中引入机器学习理论，能够提升分析效率和水平。机器学习算法相比传统算法具有更快的运行效率、更全面的参数设置，因此也往往具有更高的分析精度。输变电工程项目的规模大、投资多、周期长，通常不满足传统分析方法需要的规律分布，在输变电工程造价预测中引入智能分析方法恰好应了工程项目的特点并有效地利用了企业所累积的历史数据，并将其转化为企业的效益。本发明将输变电工程造价预测的理论与实际相结合，在提出了新型机器学习输变电工程造价预测算法的同时结合实际工程中的实际数据。以实际数据作为预测模型测试的基础，并不断修改不断完善。在充分考虑输变电建设工程实际情况和所能掌握的历史数据的情况下，提出了有较强实际意义的输变电工程造价预测模型。本发明模型的构建主要为辅助专业部门的造价管理，满足项目规划、可研、投资计划等专业的需求。根据不同阶段对投资的精度要求，研究模型预测值精度，构建满足不同需求的模型，使模型能够分阶段辅助预测，为投资在前期阶段的决策提供数据支撑。

附图说明

图1是本发明的流程示意图

图2是关键因素分析流程示意图

图3是造价预测模型构建流程示意图

图4是神经网络模型示意图

图5是神经网络示意图

图6是梯度下降示意图

图7是支持向量回归示意图

图8是变量重要性评分示意图

图9是变电站静态投资预测值与实际值对比示意图

图10是预测误差区间分析示意图

图11是单位容量造价预测神经网络拓扑结构图

图12是变电站训练损失值及趋势图

具体实施方式

下面结合附图和具体实施例对本发明作进一步的详细说明，便于清楚地了解本发明，但它们不对本发明构成限定。

如图1所示，本具体实施例1提供了一种基于神经网络智能算法的基建变电站项目造价预测方法，具体包括以下步骤：

1)样本搜集

重点调研2016年至2018年竣工投产的110kV及以上变电站工程(新建站、扩建站、扩建间隔等单项工程)电网基建项目。梳理基建项目的进度、可研、初设、结算、决算、转资等业务数据，确定以上各项数据的来源，核对数据的完整性及颗粒度，开展数据清洗工作。

本实施例收集的变电工程79项样本中，500kV变电站工程4个、220kV变电站工程21个、110kV变电站工程54个。

2)数据预处理

由于指标之间存在着相互关联和重叠，若将指标直接代入预测模型中，则会导致造价预测结果的失准，因此对初始指标进行预处理和简化处理是十分必要的。

输变电工程造价历史数据显示并不是所有的数据都是有用的，大多数数据是参差不齐、概念层次不清、数量级不同的，给后续的数据分析和数据挖掘带来较大麻烦，容易得出错误的结论。因此开展数据预处理工作思得尤为重要，本文采用数据清理、集成、变换和规约等四种手段进行数据预处理。

数据清理：对数据遗漏进行填充或者忽略，对杂质数据进行除噪，对不一致数据进行核对校正。

数据集成：把多个原数据集成结合到一个数据存储中，进行数据冗余和数据冲突值的检查与处理。

数据变换：数据变换主要有平滑、聚集、数据泛化、规范化及属性构造等手段。其中规范化的方式有最大最小规范化、0-1值规范化和小数定标规范化等方式。

数据归约：数据归约技术主要用于将数据集归约化，减少分析所需时间的同时又不失数据的完整性，保证归约前后结果的一致性。

考虑影响变电工程造的因素繁多且存在差异性，因此需要对样本集分开进行预处理。

其中变电工程数据预处理包括以下内容：

＂征地面积＂的指标分为全站与围墙内，＂建筑面积＂指标分为了全站与主控楼，剔除重复信息，保留全站征地面积与全站及主控楼建筑面积。

＂主变压器本期台数＂与＂远期台数＂相较而言，对造价初期投产具有直接的较大影响的是本期台数，因而删除远期台数。

电缆又分为控制电缆、1kV及以下电力电缆、光缆，分别以电力电缆和控制电缆总量作为因素，而不再细分，统一量纲。

在因素库当中，＂地形地貌＂、＂变电站型式＂等都属于定性指标，无法与定量指标之间进行精确计算，因而需要对这些指标进行量化处理。

3)关键影响因素分析

经过数据预处理后所选定的全部因素，对造价结果不一定都有显著性影响，有些因素在一定范围内的变化不会对整体造价水平造成大影响，因此可通过主成分分析法从原始因素库筛选出关键因素做进一步分析。

主成分分析法的具体做法是：将预处理过后的各工程特征数据按列组成矩阵X，使得每列数据代表同一个工程项目中的影响因素，每行数据代表一种影响因素。m个工程，n个影响因素的数据就可以转换成如(3-1)所示矩阵X。

其中a_ij表示第j个项目第i个因素的数据值。

将每一行数据减去这一行所有数据的均值，进行零均值化，见公式(3-2)。

求出协方差矩阵,见公式(3-3)。

求出协方差矩阵的特征值及对应的特征向量，并将特征向量按对应特征值大小从上到下按行排列成矩阵，取前k行组成矩阵P，降维到k维后的数据X’即如公式(3-4)所示。

X′＝PX (3-4)

采用这种方式将数据转换到新的坐标系，每条坐标轴即为主成分，减少了影响指标的个数，同时最大程度地保留了原影响因素所能解释的信息。

4)模型构建

将关键因素集作为训练样本分别代入选择神经网络模型或支持向量回归模型或者神经网路模型和支持向量回归模型组合形成的组合预测模型作为最佳模型，将关键因素集作为测试样本代入最佳模型获得预测结果并与实际结果相比较，如果比较结果满足要求即判断最佳模型为造价预测模型，反之则重复上述步骤。

其中，神经网络模型、支持向量回归模型和组合预测模型的计算过程如下：

(1)BP神经网络模型

主要采用人工神经网络技术，结合湖北省输变电工程的项目特点，构建输变电工程造价智能预测模型，并对预测结果开展对比分析，提高预测精度和预测效率，得到更加准确的预测结果。

人工神经网络是基于生物学中神经网络的基本原理，在理解和抽象了人脑结构和外界刺激响应机制后，以网络拓扑知识为理论基础，模拟人脑的神经系统对复杂信息的处理机制的一种数学模型。

如图4所示，其中z是在输入和权值的线性加权和叠加了一个函数g的值，一般地，g称为激活函数。

神经网络中，包括输入层，隐藏层，和输出层。每层中的一个圆代表一个处理神经单元，若干个神经处理单元组成了一个层，若干个层再组成了一个网络，也就是"神经网络"，如图5所示。

神经网络的计算方式包括以下：

1.前向传播

前向传播是从输入到输出，搭建完整的神经网络结构的过程。其中输入为训练集中的各样本特征值，输出为预测值。训练前，对神经网络的参数随机赋初值。训练前，对神经网络的参数随机赋初值。以下公式给出了神经网络结构加上激活函数和偏置项后的前向传播算法的数学定义：

由此可以得到隐藏层推导公式：

输出层推导公式：

由此可得：

2.反向传播

反向传播是对误差进行传播，是一个优化神经网络参数，提高模型准确率的过程。搭建好神经网络结构之后，用训练集训练神经网络。其中训练集中每一个样本由输入特征值与标签组成。在反向传播进行之前，定义一个损失函数，用来衡量预测值与真实值的差异，即误差。神经网络的训练以不断减小预测值与真实值之间的差异为目标来更新权重，从而使得模型能够更好地去拟合样本。

③损失函数

在迭代训练模型的过程中，采用梯度下降算法思想来更新网络模型权重，使损失函数不断逼近全局最优值，即损失函数的最小值。梯度下降更新权重如图5所示：

其中横坐标表示模型的权重的值，纵坐标表示损失函数的值。如图所示，模型的权重朝着损失函数最小值的方向更新。新权重的更新是由学习率λ以及权重更新的方向(偏导)确定的。

在训练过程中，损失函数的大体走向是随着迭代轮次的增加而逐渐减小。当迭代到一定轮次时，损失函数随着迭代轮次的增加不再呈下降趋势，说明此时模型参数已达到损失函数的最低点附近。

(2)支持向量回归(SVR)

对于样本(x,y),神经网络模型直接基于f(x)与真实输出y之间的差别来计算损失，当且仅当f(x)与y完全相同时，损失才为0。与此不同，支持向量回归假设能容忍f(x)与y之间最多有ε的偏差，即当f(x)与y之间的差别绝对值大于ε时才计算损失。如图7所示，这相当于以f(x)为中心，构建了一个宽度为2ε的间隔带(图中红色区域)，若训练样本落入此间隔带，则被认为是正确的。不同于其他回归方法，SVR容忍f(x)与y之间最多有ε的偏差，即仅当f(x)与y之间的差别绝对值大于ε时才计算损失。这相当于以f(x)为中心，构建了一个宽度为2ε的间隔带，若训练样本落入此间隔带，则不计算损失。于是SVR问题可形式化为

确定参数w,b，

其中C为正则化常数，l_ε是ε不敏感函数。通过引入松弛变量ε_i和

可将式4-1重写为

确定参数w,b,ε_i和

通过引入拉格朗日乘子

得到式4-2的拉格朗日函数，求偏导得到SVR的对偶问题,通过KKT条件得到SVR的解

能使式4-3中的

的样本即为SVR的支持向量，它们必然落在ε-间隔带外。SVR的支持向量仅是训练样本的一部分，其解具有稀疏性。

若考虑特征映射形式，则式4-3可表示为

其中к(x，x_i)＝Φ(x_i)^TΦ(x_j)为核函数。

在现阶段变电站、架空线路的数据样本比较少的情况下，支持向量回归也是一种较好的机器学习算法选择。支持向量回归使用一部分支持向量来做超平面的决策，而不是依赖全部的数据，学得的模型总能表示成核函数k(x,x_i)的线性组合。根据模式识别理论，低维空间线性不可分的模式通过非线性映射到高维特征空间则可能实现线性可分，但是如果直接采用这种技术在高维空间进行分类或回归，则存在确定非线性映射函数的形式和参数、特征空间维数等问题，而最大的障碍则是在高维特征空间运算时存在的“维数灾难”。核函数则是将高维空间的内积运算转化为低维输入空间的核函数计算，从而巧妙地解决了在高维特征空间中计算的“维数灾难”等问题。

(3)组合预测

目前项目采用的是神经网络单一模型对工程造价进行预测，单一模型预测的方法有一定的局限性，未来工作将通过加入支持向量回归等模型对工程的造价进行预测。另外，通过结合模型的各自的优势，可提高模型预测的准确性及应用的范围。

组合预测方法是对变电站或者其他类型的工程的造价，采用神经网络和支持向量回归组合方法进行的预测。它既可是两种定量方法的组合，也可是两种定性的方法的组合，但实践中更多的则是利用定性方法与定量方法的组合。

每一种单一预测模型都只是从某一个侧面去刻画数据序列的规律，都只反映序列的部分信息，都有其局限性。如果综合运用两种预测的理论进行组合预测，优势互补，最大程度地利用现有信息，就有望获得更好的预测效果。组合预测的核心问题在于如何求出加权平均系数，使得组合预测模型更加有效的提高预测精度。

组合预测最终的预测结果按如下公式(4-5)计算

Y_FINAL＝αY_DNN+βY_SVR (4-5)

其中Y_FINAL即为最终的预测结果，Y_DNN和Y_SVR分别为神经网络模型预测结果和SVR预测结果，α和β的选取则根据训练时两种模型误差的比例，按比例进行选取，如公式(4-6)所示。

其中E_SVR和E_DNN分别为SVR和神经网络模型在训练过程中的误差。

(5)造价预测模型测试

使用训练得到的造价预测模型对测试集中的样本数据进行预测，对比分析预测结果与实际结果之间的差异，如果预测结果与实际结果误差小于10％，则认为模型是合格的，则模型可用于造价预测；如果预测结果与实际结果误差大于10％，重新调整模型。

(6)代入待测数据

模型构建成功后，再基于待预测输变电工程数据，对数据进行预处理及特征提取之后，利用构建好的造价智能预测模型对待预测输变电工程的造价进行预测。

本发明的具体实施例，收集变电站工程静态投资、建设性质、变电总容量、高压侧出线回数、中压侧出线回数、低压侧出线回数、低压电容器、征地面积、主控楼面积、建设场地征用及清理费、主变单价、高压侧配电装置型式、高压侧断路器台数、高压侧断路器单价、中压侧配电装置型式、中压侧断路器台数、中压侧断路器单价、低压侧断路器台数、低压侧断路器单价、进站道路费用、地基处理费用、地基处理方法、场平费用、挡土墙及护坡、电力电缆、控制电缆等26个指标的数据。其中，静态投资为因变量，其他均为自变量。

由于在识别的25个影响因素中，建设性质、高压侧配电装置型式、中压侧配电装置型式、地基处理方法为描述性因素，分析前需要进行量化处理，处理方法如下：

数据样本中的变电站工程建设性质分为新建和扩建工程，在进行分析时将扩建工程定义为1，新建工程定义为2。

高压侧配电装置型式有AIS、GIS和不采用配电装置3种，数据处理时不采用配电装置定义为0，AIS定义为1，GIS定义为2；中压侧配电装置型式有AIS和不采用配电装置2种，数据处理时不采用配电装置定义为0，AIS定义为1；由于低压侧配电装置型式全部为开关柜式，变量属性唯一，分析时予以剔除。

地基处理方法主要分为不处理方式、灌注桩、毛石混凝土换土垫层法、搅拌桩法、强夯法等5种属性，这5种属性分别以0，1、2、3、4表示。

具体数据如表1所示：

表1变电站工程样本数据(一)

表1变电站工程样本数据(二)

表1变电站工程样本数据(三)

利用上文中的神经网络模型对上述属性进行筛选，选取静态投资作为决策变量，其余作为属性变量，形成初步数据集。利用R语言中的randomForest程序包进行分析，可得到各个属性的Gini指数，如图8所示。

图8中，IncNodePurity表示节点纯度，与Gini指数具有同样的意义，该值越大，说明该属性的重要程度越高，影响变电站工程属性因素中，IncNodePurity指数超过106的有建设性质、变电总容量、高压侧出线回数、中压侧出线回数、低压侧出线回数、低压电容器、征地面积、主控楼面积、建设场地征用及清理费、主变单价、高压侧配电装置型式、高压侧断路器台数、高压侧断路器单价、中压侧配电装置型式、中压侧断路器台数、中压侧断路器单价、低压侧断路器台数、低压侧断路器单价、进站道路费用、地基处理费用、地基处理方法、场平费用、挡土墙及护坡、电力电缆、控制电缆这18个指标。

利用上述筛选出来的18个重要指标，选取静态投资作为决策变量，纳入神经网络模型进行预测，得出的静态投资预测值及误差率如表3和图9所示。

表3变电站静态投资预测值与预测误差率

从图9中可以看出，选用18个主要指标得出的静态投资预测值曲线与所有指标对应的静态投资实际值曲线十分接近，表明利用这18个主要指标可以较为精准的预测出变电站的静态投资值。将预测误差率进行区间划分i汇总如图10所示，从图10可看出，所有测试数据的误差都在15％以内，而且预测误差在5％以内的测试数据达到了65％，进一步验证了筛选出的18个主要指标变量对全部指标所包含信息的解释程度。

本发明的具体实施例采用神经网络模型。变电110kV数据样本总计54条，随机选取10条作为验证样本集，剩下44条作为训练样本集，模型搭建含三层隐含层的神经网络，每层神经元个数分别为32、64、32，训练轮数10000轮，学习率使用0.01，单位容量造价预测神经网络拓扑结构见图11。首先对模型进行训练，训练过程中损失值和迭代轮次的关系如下图12所示

对10条数据进行验证，其中预测的静态投资和真实静态投资偏差在10％以内的有7条，10％以上的有3条。

神经网络预测具有一定的准确率，但是存在部分样本偏差较大，出现这种情况的原因在于样本容量过小，如部分扩建样本存在大量0，具有特殊性，导致预测偏差大。如果使用大量且丰富的可靠样本进行训练和预测，预计能得到更好的拟合效果。

神经网络模型构建后，预测样本将选用的2020年110kV及以上计划开工的某地区输变电工程数据。本次收集的输变电工程预测样本中，110kV变电站工程10个。根据搭建好的神经网络模型，将10条需预测的变电站工程的可研参数输入模型，输出的预测投资和偏差率结果。不同于验证样本的误差要求在10％以内，预测数据的预测结果与批复可研投资对比，预测误差控制在20％左右较为合理。从预测结果可以看出，其中预测误差在10％以内的有4条；预测误差在10％～20％以内的有4条，预测误差在20％～30％以内的有2条。10项预测工程的投资平均结余率为13.92％。

本说明书未作详细描述的内容属于本领域专业技术人员公知的现有技术。

Claims

1.一种基于神经网络智能算法的基建变电站项目造价预测方法，其特征在于包括以下步骤：收集已有的输变电工程决算数据作为样本并对样本数据进行预处理形成数据集，从数据集的原始因素库筛选出关键因素集做进一步分析并提取特征参数，根据数据库的特征参数构建造价预测模型；将待预测输变电工程数据进行预处理并提取特征参数，将特征参数代入造价预测模型，获得工程造价数据的分析结果。

2.根据权利要求1所述的基于神经网络智能算法的基建变电站项目造价预测方法，其特征在于识别原始因素库中的电网工程造价因素并通过主成分分析法提取出关键因素，通过神经网络检验提取的关键因素，通过检验的关键因素并入关键因素集。

3.根据权利要求2所述的基于神经网络智能算法的基建变电站项目造价预测方法，其特征在于提取关键因素的过程包括以下步骤：

将预处理过后的各工程特征数据按列组成矩阵X，使得每列数据代表同一个工程项目中的影响因素，每行数据代表一种影响因素；m个工程，n个影响因素的数据就可以转换成如下式所示矩阵X：

其中a_ij表示第j个项目第i个因素的数据值；

求出协方差矩阵：

X′＝PX

4.根据权利要求3所述的基于神经网络智能算法的基建变电站项目造价预测方法，其特征在于选择神经网络模型或支持向量回归模型或者神经网路模型和支持向量回归模型组合形成的组合预测模型作为最佳模型；将关键因素集作为测试样本代入最佳模型获得预测结果并与实际结果相比较，如果比较结果满足要求即判断最佳模型为造价预测模型，反之则重复上述步骤。

5.根据权利要求4所述的基于神经网络智能算法的基建变电站项目造价预测方法，其特征在于收集的样本数据包括基建项目的进度、科研、初设、结算、决算、转资业务数据，确定以上各项数据的来源，核对数据的完整性及颗粒度，开展数据清洗工作。

6.根据权利要求5所述的基于神经网络智能算法的基建变电站项目造价预测方法，其特征在于通过数据清洗、整合、转换、规约处理方法对样本数据进行预处理，最终得到可用于模型分析的数据集；

其中数据清洗指对数据遗漏进行填充或者忽略，对杂质数据进行除噪，对不一致数据进行核对校正；

7.根据权利要求6所述的基于神经网络智能算法的基建变电站项目造价预测方法，其特征在于对变电工程样本集进行预处理，