CN109214503B - 基于kpca-la-rbm的输变电工程造价预测方法 - Google Patents

基于kpca-la-rbm的输变电工程造价预测方法 Download PDF

Info

Publication number
CN109214503B
CN109214503B CN201810863513.3A CN201810863513A CN109214503B CN 109214503 B CN109214503 B CN 109214503B CN 201810863513 A CN201810863513 A CN 201810863513A CN 109214503 B CN109214503 B CN 109214503B
Authority
CN
China
Prior art keywords
lion
rbm
model
female
male
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810863513.3A
Other languages
English (en)
Other versions
CN109214503A (zh
Inventor
牛东晓
浦迪
康辉
戴舒羽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
North China Electric Power University
Original Assignee
North China Electric Power University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by North China Electric Power University filed Critical North China Electric Power University
Priority to CN201810863513.3A priority Critical patent/CN109214503B/zh
Publication of CN109214503A publication Critical patent/CN109214503A/zh
Application granted granted Critical
Publication of CN109214503B publication Critical patent/CN109214503B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/06Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biophysics (AREA)
  • Economics (AREA)
  • Biomedical Technology (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Marketing (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Public Health (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Primary Health Care (AREA)
  • Probability & Statistics with Applications (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Water Supply & Treatment (AREA)
  • Neurology (AREA)
  • Development Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了属于电数字数据处理技术领域的一种基于KPCA‑LA‑RBM的输变电工程造价预测方法。包括以下步骤:1对各样本数据进行数据选择与预处理,并获得关键影响因素集;2将若干组预处理后的样本数据组成训练集,并使用训练集训练KPCA‑LA‑RBM组合模型;3将剩余的数据作为测试集,根据训练好的组合模型,运用测试集对训练好的模型进行预测,得到最终的预测结果。本发明根据主成分累计方差贡献率选取前4个主成分作为组合模型的输入向量,在保证预测精度的情况下,提高了模型的计算效率。本发明提出的组合模型能够有效降低单一模型带来的误差,提高预测精度,使其提高泛化能力和鲁棒性,适用于输变电工程造价预测。

Description

基于KPCA-LA-RBM的输变电工程造价预测方法
技术领域
本发明属于电数字数据处理技术领域,具体为一种基于KPCA-LA-RBM的输变电工程造价预测方法。
背景技术
电力建设属于基础建设,相对于其他的消费性需求,基础设施建设的好坏对人们的生活水平和质量有很大的影响,可以说在一定的程度上电力建设也是一个城市发达水平的标志。近年来,随着我国GDP的增长,电网行业发展迅速,输变电工程建设规模不断增大,电网投资也随着变得越来越大。为了在电力实际建设过程中合理控制成本、优化资源配置并有效调整计划安排,最终为企业决策提供依据,需要运用工程造价预测的方法对项目进行投资估计,为工程施工和项目评审提供参考依据和衡量尺度。因此,输变电工程造价预测对于加强电力行业的建设、优化电力工程投资具有重要的意义。
目前,输变电工程造价预测模型主要分为两类:一类是传统预测模型,另一类是人工智能预测模型。传统的预测方法特点是原理简单,但是周期较长、速度较慢、误差较大,主要有:专家会议法、德尔菲法、移动平均法、指数平滑法等。建立在传统预测方法的基础上提出的智能算法,主要包括协整理论、灰色分析理论法、粒子群算法理论、模糊分析法和BP(Back Propagation)神经网络法等,因其较为智能的算法与个性化,在电力建设工程方面有较为广泛的应用。但是针对小样本特征的工程造价预测问题方面,支持向量机(SVM)方法预测效果相对较好。
在人工智能预测模型这一类别中,BP神经网络和支持向量机是两种较为常见的算法。神经网络在模式识别和数据拟合方面具有很大的优势,也在相关变量的回归与分类问题、函数拟合问题上达到有效的成果。
但是BP神经网络算法收敛速度慢、容易陷入局部最优解,针对该算法存在的不足,许多学者使用因子分析、模糊算法等与神经网络进行结合形成新的组合算法,或者使用遗传算法、粒子群算法等对其进行改进。
虽然BP神经网络算法在预测性能方面得到了较大的改善,并能取得较为精确的预测结果,但是BP神经网络不适用于小样本数据的预测。因此,支持向量机因其鲁棒性强、预测精度较好,适用于小样本数据得到许多学者的青睐。
除了以上算法,还有的学者使用了随机森林等方法进行输变电工程造价预测。
以上这些算法属于浅层学习算法,针对复杂的函数问题处理能力有限,并且这些算法是以先验知识为基础的,不能完全反应信息的特征,受限玻尔兹曼机算法能够将底层特征组合抽象为高层特征,从而更好的反应数据特征。目前,受限玻尔兹曼机在各个领域得到了广泛的应用,尤其是预测领域。
输变电工程周期长、工程量大,针对这样的特点,如果能对输变电工程造价进行预测,一定能够提高输变电工程建设效率。因此目前急需一种用于预测输变电工程造价的方法针以对输变电工程造价在预测过程中存在的问题。
发明内容
针对背景技术中所提到的问题,本发明公开了一种基于KPCA-LA-RBM的输变电工程造价预测方法,其特征在于,包括:
步骤1、对各样本数据进行数据选择与预处理,并获得关键影响因素集;
步骤2、将若干组预处理后的样本数据组成训练集,并使用训练集训练KPCA-LA-RBM组合模型;
步骤3、输变电工程造价预测:
将剩余的数据作为测试集,运用测试集对训练好的KPCA-LA-RBM组合模型进行预测,得到最终的预测结果。
所述步骤1具体为:
步骤11、收集若干组样本数据,将异常数据进行处理,根据GB/T18710-2002中规定的相关参数合理变化范围剔除异常数据,并用上一时刻与下一时刻的平均值替代;并进行无量纲化处理,使其标准化于[0,1]之间;
步骤12、使用各个自变量与因变量之间的相关系数R对影响因素进行剔除,把可以忽略的、对模型影响不大的影响因素从模型分析中去除,从而找到关键影响因素;相关系数R的计算公式如下:
Figure BDA0001750319650000021
其中,xi表示影响因素值,
Figure BDA0001750319650000037
表示该类影响因素的平均值;yi表示输出向量值,
Figure BDA0001750319650000038
表示输出向量平均值;
步骤13、获得带有各自相关系数R的关键影响因素集。
所述步骤2具体为:
步骤21、使用核主成分分析法KPCA提取若干组预处理后样本数据的主成分;
步骤22将前若干组样本数据集组成训练集,使用训练集并利用狮子算法对受限玻尔兹曼机模型的参数集
Figure BDA0001750319650000031
进行迭代优化,建立LA-RBM模型;
步骤23、随机设定狮子算法初始种群,以RBM模型最终结果作为本步骤的适应度值
Figure BDA0001750319650000032
重复使用步骤22对RBM模型参数不断优化,从而得到较优的RBM模型参数。
步骤24采用重构误差为误差条件的评估函数,在经过j次迭代的重构误差吉布斯块采样后,计算与原始数据的差值;当隐含层输出结果满足误差条件时,隐含层输出结果即为系统输出结果,否则返回步骤23继续计算;
第j次迭代的重构误差计算如下:
Figure BDA0001750319650000033
其中,m表示可见层节点数,k表示训练样本的数目;
当该误差条件满足时,隐含层输出结果即为系统输出结果。
所述步骤22具体为:
步骤221建立受限玻尔兹曼机算法RBM模型,并初始化RBM模型参数。对于RBM来说,其模型参数为
Figure BDA0001750319650000034
其中,αij,βi,γj分别表示可见层第i个节点和隐藏层第j个节点之间的权值、可见层第i个节点的偏置、隐藏层第i个节点的偏置;
步骤222、采用训练集对RBM模型进行训练,并计算RBM模型的最终结果。
所述步骤221具体分为:
步骤2211、RBM模型中可见变量和隐藏变量的联合配置的能量函数表示为:
Figure BDA0001750319650000035
其中,αij,βi,γj表示可见层第i个节点和隐藏层第j个节点之间的权值、可见层第i个节点的偏置、隐藏层第i个节点的偏置,
Figure BDA0001750319650000036
为模型的待定参数;n为可见层神经元个数,m为隐藏层,Vi,Hj分别表示可见层的第i个节点和隐藏层的第j个节点;
步骤2212、设置可见层和隐含层的节点数,并通过能量函数继而得到(V,H)的联合概率分布;
基于式(5)的能量函数,得到(V,H)的联合概率分布:
Figure BDA0001750319650000041
将公式(5)代入公式(6)可得:
Figure BDA0001750319650000042
其中,
Figure BDA0001750319650000043
为配分函数,以确保函数是标准化的;配分函数
Figure BDA0001750319650000044
表示为:
Figure BDA0001750319650000045
步骤2213、通过对相邻层间的神经元间的函数映射求出隐藏层和可视层的激活概率值,具体为:
RBM模型所描述的关于数据样本r的分布,即公式(6)的边缘分布:
Figure BDA0001750319650000046
由于根据二部图特征,可视层和隐藏层内部的神经元之间都没有互联,只有相邻层间的神经元有对称的连接,则同层神经元之间具有条件独立性,选定节点的激活函数为sigmoid函数,可计算出可视层已知时隐藏层第j个节点uj=1时的概率为:
Figure BDA0001750319650000047
其中
Figure BDA0001750319650000048
为sigmoid函数,该函数为:
Figure BDA0001750319650000049
通过sigmoid函数映射,隐藏层的激活概率值就会以S型的方式分布;
在给定隐藏层g,可视层第i个节点ki=1时的概率为:
Figure BDA0001750319650000051
步骤2214、根据隐藏层和可视层中每个节点的激活概率值,求出最大化似然函数
Figure BDA00017503196500000516
具体为:
假设样本数据训练集为
Figure BDA00017503196500000517
n1表示训练样本的数目;其中
Figure BDA0001750319650000052
i=1,2,...,n2,n2表示可见层节点数,也就是输入数据的维数;
在训练优化RBM的参数时,其目标是最大化似然函数
Figure BDA0001750319650000053
表示如下:
Figure BDA0001750319650000054
步骤2215、对最大化似然函数(训练目标)进行对数处理,并把结果作为目标函数的适应度值
Figure BDA0001750319650000055
Figure BDA0001750319650000056
进行对数处理,即对训练目标进行对数处理,得到目标函数的适应度值
Figure BDA0001750319650000057
Figure BDA0001750319650000058
所述步骤23具体为:
在步骤231之前,设目标函数,将适应度值
Figure BDA0001750319650000059
代入目标函数,目标函数为:
min f(x1,x2,...,xn) (15)
其中n≥1;
步骤231:生成种群
在算法的初始阶段,将狮群初始化为2n头狮子并将其平分为两组,得到一个候选种群;其中,公狮子结构为
Figure BDA00017503196500000510
母狮结构为
Figure BDA00017503196500000511
l为解向量的长度;
步骤232:交配
通过交配使生成的Amale和Afemale产生新的幼崽
Figure BDA00017503196500000512
通过
Figure BDA00017503196500000513
Figure BDA00017503196500000514
随机选择两个交叉点进行双概率交叉可以生成四只幼仔群
Figure BDA00017503196500000515
变异操作是使用概率p进行随机变异产生幼崽
Figure BDA0001750319650000061
交叉和变异均完成后,幼崽种类数为8个;
聚类就是使用K-means方法将已有的8个解集进行性别分组:雄性幼崽Am_cub雌性幼崽Af_cub
根据每个个体代表的可行解,杀死总数较多一组的瘦小个体以保证两组幼崽数量平衡,最终达到更新种群的目的;
步骤233:领土防御
在领土防御过程中,随机初始化游动狮子ψnomad,将其作为新的可行解,并使用新解决方案ψnomad攻击雄狮
Figure BDA0001750319650000066
如果新的解决方案更好,则将之与整个狮群的解进行比较;如果新方案仍然更好,则这套解决方案ψnomad将取代原来的雄狮
Figure BDA0001750319650000067
新的狮子将继续交配,并且原来的雄狮和幼仔将被杀死;否则原狮子继续领土防御,幼崽长大一岁,直到幼崽成年,并将其保留在种群中,继续交配产生下一代;在种群更新完成之后,将幼崽的年龄初始化为0;
设f(.)为目标函数,f(ψpride)是整个种群的值,计算公式如下:
Figure BDA0001750319650000062
其中,f(ψmale)和f(ψfemale)分别是雄狮和雌狮的值,
Figure BDA0001750319650000063
Figure BDA0001750319650000064
分别是雄性幼崽和雌性幼崽的值,||ψm_cub||代表种群中雄性幼崽的数量并且agemat是达到交配要求的年龄,agecub是幼崽的年龄;
步骤234:领土接管
在领土接管阶段,分别寻找雌狮和雄狮中的最佳解决方案,替代劣质解决方案,进行交配,替代过程如下:
按照以下标准:
Figure BDA0001750319650000065
Figure BDA0001750319650000071
选择最好的雄狮
Figure BDA0001750319650000072
和最好的雌狮
Figure BDA0001750319650000073
其中,
Figure BDA0001750319650000074
ψmale、ψm_cub分别表示雄狮群中的可行解,成年雄狮代表的可行解,雄狮中的幼崽代表的可行解,
Figure BDA0001750319650000075
ψfemale、ψf_cub分别表示雌狮群中的可行解,成年雌狮代表的可行解,雌狮中的幼崽代表的可行解;
设κ为
Figure BDA0001750319650000076
的育种数,κstrenth为雌狮最优育种能力,通常设定为5,并且,随着狮群的交配行为逐步加一;如果雌狮被替换,则κ初始化为0;如果原雌狮被替换回来,κ在原基础上继续累加;
步骤235、整个过程重复迭代直至达成终止条件;
完成步骤234后,如不符合终止条件,返回步骤232,终止条件为GEN≥GENmax;GEN为狮群的遗传代数,GENmax为整个过程重复迭代直到最大遗传代数;达成终止条件后,选择出的最优狮子作为较优的模型参数输出;最优狮子为整个过程重复种群中最好的狮子。
本发明的有益效果为:
(1)在数据进行无量纲化处理时,将原始数据标准化使其均处于[0,1]之间,将原始数据经过标准化后,能够消除数据量纲影响。
(2)本发明采用核主成分分析法(KPCA)将多个影响因素转化为几个代表重要信息的主成分,这些主成分既能反应原始变量的大部分信息,而且互不重叠。
(3)本发明根据主成分累计方差贡献率选取前4个主成分作为模型的输入向量,在保证预测精度的情况下,提高了模型的计算效率。
(4)为了解决浅层学习算法复杂的函数问题处理能力有限,并且这些算法是以先验知识为基础的,不能完全反应信息的特征这些问题,本发明采用受限玻尔兹曼机模型进行输变电工程造价预测。受限玻尔兹曼机算法能够将底层特征组合抽象为高层特征,从而更好的反应数据特征。但是,受限玻尔兹曼机算法存在泛化能力较低、且固定的训练率不利于网络跳出极小点等问题。狮子算法是一种基于狮子社会行为的仿生算法。相对于Gaussian-Bernoulli算法、遗传算法、模糊算法等,狮子算法在求解性能上,具有很强的鲁棒性和搜索较好解的能力,易于并行实现并且收敛速度快,因此本发明决定采用狮子算法对受限玻尔兹曼机算法的参数进行优化。
(5)本发明提出的KPCA-LA-RBM组合模型能够有效降低单一模型带来的误差,提高预测精度,使其提高泛化能力和鲁棒性,适用于输变电工程造价预测。
附图说明
图1为本发明一种基于KPCA-LA-RBM的输变电工程造价预测方法实施例的总流程图;
图2为本发明实施例中KPCA-LA-RBM组合模型的相对误差;
图3为本发明实施例中KPCA-LA-RBM组合模型的预测值和实际值对比;
图4为本发明实施例中各模型的预测值;
图5为本发明实施例中受限玻尔兹曼机模型的流程图;
图6为本发明实施例中的狮子防御图;
图7为本发明实施例中狮子算法的流程图;
图8为本发明实施例中LA-RBM模型的流程图。
具体实施方式
下面结合附图对本发明的实施例进行进一步的描述,在本发明中KPCA为核主成分分析,LA为狮子算法,RBM为受限玻尔兹曼机算法;
如图1所示,本实施例具体分为以下步骤;
步骤1、对各样本数据进行数据选择与预处理,并获得关键影响因素集;
收集若干组样本数据,识别架空线路工程造价的原始影响因素集={导线价格,线材量,线路长度,单根导线面积,塔材价格,塔材量,塔基数,基础钢材量,钢材价格,基础混凝土量,土石方量,海拔高度,地形分布,地质条件,建场费,建设管理费,建设技术服务费}。本发明的输入向量为影响因素集中的原始影响因素,输出向量为工程造价(用静态投资衡量)。然后,根据样本数据的具体情况对数据进行预处理,并根据相关系数进行数据筛选,获得带有各自相关系数R的关键影响因素集。在本实施例中步骤1具体为:
步骤11、收集若干组样本数据,将异常数据进行处理,根据GB/T18710-2002中规定的相关参数合理变化范围剔除异常数据,并用上一时刻与下一时刻的平均值替代;并进行无量纲化处理,使其标准化于[0,1]之间;
本实施例以线路工程为例,对工程造价预测模型进行实证分析。选取110kV输电线路工程的历史数据进行输变电工程造价预测。
在本实施例中首先进行数据选择:
总共取136个样本进行分析,首先取前100个样本为训练集建立KPCA-LA-RBM组合模型,再用得到的KPCA-LA-RBM组合模型对后36个样本进行预测,最后将后36个样本的实际值与预测值进行拟合比较,得出预测的效果,从而判断选取的模型是否合适。该地区某5个输变电工程样本造价影响因素以及造价的数据展示如表1所示。
表1.原始数据表
Figure BDA0001750319650000091
步骤12、并使用各个自变量与因变量之间的相关系数R对影响因素进行剔除,把可以忽略的、对模型影响不大的影响因素从模型分析中去除,从而找到关键影响因素,建立科学的造价预测模型。通过经验统计,一般情况下当R≥0.6时,就认为两个原始影响因素的相关性显著,反之当R<0.6,则说明这两个原始影响因素的相关性不显著。皮尔森相关系数计算公式如下:
Figure BDA0001750319650000101
其中,xi表示影响因素值,
Figure BDA0001750319650000103
表示该类影响因素的平均值;yi表示输出向量值,
Figure BDA0001750319650000104
表示输出向量平均值。
本实施例中,影响因素与工程造价之间的相关系数R如表2所示。
表2.相关系数表
Figure BDA0001750319650000102
由影响因素与工程造价相关系数表知,基础钢材量、导线价格、建设管理费、塔材价格、钢材价格、单根导线面积、海拔高度、地形分布、地质条件与工程造价的相关系数绝对值均小于0.6,可以认为这四种因素与工程造价的关系十分微弱,将其淘汰。最后,提取17种因素中的8种重要因素,分别为:线材量、线路长度、建设技术服务费、土石方量、塔基数、基础混凝土量、塔材量、建场费。
步骤13、根据各组样本数据中原始影响因素的相关系数R,获得带有各自相关系数R的关键影响因素集。
步骤2、将若干组预处理后的样本数据组成训练集,并使用训练集训练KPCA-LA-RBM组合模型;
步骤21、使用核主成分分析法(KPCA)提取若干组预处理后样本数据的主成分;
采用核主成分分析法(KPCA)将各组样本数据筛选出的关键影响因素转化为几个代表重要信息的主成分,并将其作为LA-RBM模型的输入向量。核主成分分析是将数据从特定空间非线性投影到高维特征空间的一种分析方法。其中,该分析方法中的非线性投影是通过核函数实现的。
该方法可以克服特征向量线性不可分的问题;在本实施例中步骤21具体为:
假定数据集T={t1,t2,...,tn},ti∈Rd,数据的非线性映射表示为:φ:T→Q,那么,空间Q的协方差矩阵就可以表示为:
Figure BDA0001750319650000111
其中,Rd为输入空间,d表示空间的维度,i=1,2,...,n
根据特征值与特征向量的求法,可计算得到矩阵C的特征值λ和特征向量V,设C的特征值为0≤λ1≤λ2≤...≤λd,对应的特征向量为v1,v2,...,vd。记:
Figure BDA0001750319650000112
其中,r∈d;
记核矩阵为K,其计算公式如下K=(kij)d×d=(φ(ti)·φ(tj))(i,j=1,2,...,d),由Kα=dλα知其特征值为dλi,特征向量为αi。根据累计方差贡献率,选取前m(m<d)个特征值对应的标准化特征向量αi,i=1.2,...,m。对φ(tj)在vr的投影:
yr(tj)=(φ(tj)·vr),(r=1,2,...,m) (4)
式中,yr(tj)为φ对应的第r个非线性主元分量。
将所有投影值y(tj)=(y1(tj),y2(tj),...,ym(tj))作为样本特征值。用核函数代替Q重的内积进行运算,然后按照计算规则计算主成分值。
将带有各自相关系数R的关键影响因素作为输入变量输入MATLAB的核主成分分析模型,根据累计方差贡献率,选取前四个主成分。这四个主成分包含了大部分信息,且这四个主成分为核主成分分析法的输出变量,并将其作为LA-RBM模型的输入向量。
本实施例中,使用KPCA算法对输变电工程造价影响因素进行转化,将其提取为包含大部分信息的主成分,并取前4个主成分作为LA-RBM的输入向量。
本实施例中对样本数据进行核主成分分析,得到协方差矩阵、方差贡献率和累计贡献率如表3所示。
表3.主成分特征值及方差贡献率
Figure BDA0001750319650000121
由上表分析可知,前四个主成分的累积方差贡献率已经达到了89.85%,能够代表影响因素的主要信息,因此选择前四个主成分作为KPCA-LA-RBM预测模型的输入量,假定xi,i=1,2,3,...,8分别代表八个影响因素,yi,i=1,2,3,4分别代表四个主成分
步骤22将前若干组样本数据集组成训练集,使用训练集并利用狮子算法对受限玻尔兹曼机模型的参数集
Figure BDA0001750319650000122
进行迭代优化,建立LA-RBM模型;
如图5所示,受限玻尔兹曼机(Restricted Boltzmann Machine,简称RBM)是由Hinton和Sejnowski于1986年提出的一种生成式随机神经网络,是玻尔兹曼机(BoltzmannMachine,BM)的一种,其网络可以看成是可视层和隐藏层组成的。可视层由观察数值构成,用于数据的输入,通常为二值型数据;隐藏层是一串随机生成的数据,用于特征的提取,通常也为二值型数据。在假定模型的每一个神经元节点都是二值型数据的情况下,即
Figure BDA0001750319650000131
当节点取值为1时,表示该神经元当前处于激活状态,0则表示该神经元为抑制状态。RBM是一种典型的基于能量函数的模型,定义了可视特征矢量和隐藏节点矢量的分布概率,能够将可视单元映射到随机的二值隐含层上,从而获得更多信息的特征向量。受限玻尔兹曼机模型结构是一个无向的二部图模型
为了增强受限玻尔兹曼机算法的性能,提高预测精度,本发明使用狮子算法对受限玻尔兹曼机的参数集
Figure BDA0001750319650000132
进行优化。本实施例在使用MATLAB进行模型仿真时,以样本数据的前100组数据(前4个主成分作为输入向量,输变电工程造价作为输出变量)作为训练集,输入MATLAB中的狮子算法优化的受限玻尔兹曼机模型中,进行模型训练。
如图8所示的LA-RBM模型;
步骤22具体为:
步骤221建立RBM(受限玻尔兹曼机算法)模型,并初始化RBM模型参数。对于RBM来说,其模型参数为
Figure BDA0001750319650000133
其中,αij,βi,γj分别表示可见层第i个节点和隐藏层第j个节点之间的权值、可见层第i个节点的偏置、隐藏层第i个节点的偏置。
RBM模型为一种基于能量的模型,
步骤221具体分为:
步骤2211、RBM模型中可见变量和隐藏变量的联合配置的能量函数表示为:
Figure BDA0001750319650000134
其中,αij,βi,γj表示可见层第i个节点和隐藏层第j个节点之间的权值、可见层第i个节点的偏置、隐藏层第i个节点的偏置,
Figure BDA0001750319650000135
为模型的待定参数;n为可见层神经元个数,m为隐藏层,Vi,Hj分别表示可见层的第i个节点和隐藏层的第j个节点
步骤2212、设置可见层和隐含层的节点数,并通过能量函数继而得到(V,H)的联合概率分布;
基于式(5)的能量函数,得到(V,H)的联合概率分布:
Figure BDA0001750319650000141
将公式(5)代入公式(6)可得:
Figure BDA0001750319650000142
其中,
Figure BDA0001750319650000143
为配分函数,以确保函数是标准化的;配分函数
Figure BDA0001750319650000144
表示为:
Figure BDA0001750319650000145
步骤2213、通过对相邻层间的神经元间的函数映射求出隐藏层和可视层的激活概率值,具体为:
RBM模型所描述的关于数据样本r的分布,即公式(6)的边缘分布:
Figure BDA0001750319650000146
由于根据二部图特征,可视层和隐藏层内部的神经元之间都没有互联,只有相邻层间的神经元有对称的连接,则同层神经元之间具有条件独立性,选定节点的激活函数为sigmoid函数,可计算出可视层已知时隐藏层第j个节点uj=1时的概率为:
Figure BDA0001750319650000147
其中
Figure BDA0001750319650000148
为sigmoid函数,该函数为:
Figure BDA0001750319650000149
通过sigmoid函数映射,隐藏层的激活概率值就会以S型的方式分布。
同理,在给定隐藏层g,可视层第i个节点ki=1时的概率为:
Figure BDA00017503196500001410
步骤2214、根据隐藏层和可视层中每个节点的激活概率值,求出最大化似然函数
Figure BDA00017503196500001411
具体为:
假设样本数据训练集为
Figure BDA0001750319650000151
n1表示训练样本的数目;其中
Figure BDA0001750319650000152
i=1,2,...,n2,n2表示可见层节点数,也就是输入数据的维数。
在训练优化RBM的参数时,其目标是最大化似然函数
Figure BDA0001750319650000153
表示如下:
Figure BDA0001750319650000154
步骤2215、对最大化似然函数(训练目标)进行对数处理,并把结果作为目标函数的适应度值
Figure BDA0001750319650000155
Figure BDA0001750319650000156
进行对数处理,即对训练目标进行对数处理,得到目标函数的适应度值
Figure BDA0001750319650000157
Figure BDA0001750319650000158
步骤222、采用训练集对RBM模型进行训练,并计算RBM模型的最终结果。
步骤23、随机设定狮子算法初始种群,以RBM模型最终结果作为本步骤的适应度值
Figure BDA00017503196500001512
重复使用步骤22对RBM模型参数不断优化,从而得到较优的RBM模型参数。
其中,步骤23中较优的RBM模型参数是通过狮子算法进行的,如图7所示,狮子算法模拟了狮子群的社会行为,主要步骤包括产生初始种群、交配变异、领土防卫、领土接管。该算法通过不断地迭代和搜索优化目标函数,最终得到最优解,该算法可加快模型的训练效率,提高模型的学习能力,具体为:
在步骤231之前,设目标函数,将适应度值
Figure BDA0001750319650000159
代入目标函数,目标函数为:
min f(x1,x2,...,xn) (15)
其中n≥1;
步骤231:生成种群
在算法的初始阶段,将狮群初始化为2n头狮子并将其平分为两组,得到一个候选种群;其中,公狮子结构为
Figure BDA00017503196500001510
母狮结构为
Figure BDA00017503196500001511
l为解向量的长度。
步骤232:交配
在迭代和搜索最优解的过程中,交配可以通过现有的解决方案产生新的解决方案,交配操作通过交叉,变异,集群,杀死生病、弱的幼崽等步骤达到更新狮群并维持狮群稳定的目的。
交配步骤引入了基于双概率的交叉方式(用两种不同的概率进行交叉)。
通过交配使生成的Amale和Afemale产生新的幼崽
Figure BDA0001750319650000161
通过
Figure BDA0001750319650000162
Figure BDA0001750319650000163
随机选择两个交叉点进行双概率交叉可以生成四只幼仔群
Figure BDA0001750319650000164
变异操作是使用概率p进行随机变异产生幼崽
Figure BDA0001750319650000165
交叉和变异均完成后,幼崽种类数为8个。
聚类就是使用K-means方法将已有的8个解集进行性别分组:雄性幼崽(Am_cub)雌性幼崽(Af_cub)。
最后,通过测试健康状况(或目标),根据每个个体代表的可行解,杀死总数较多一组的瘦小个体(即使可行解较小的个体)以保证两组幼崽数量平衡,最终达到更新种群的目的。
步骤233:领土防御
如图6所示,在狮群的繁殖过程中,会受到游动狮子的攻击。此时,雄狮为了保护幼崽,继续占有领土,会对游动狮子的攻击行为展开防御,
在领土防御过程中,随机初始化游动狮子ψnomad,将其作为新的可行解,并使用新解决方案(ψnomad)攻击雄狮
Figure BDA0001750319650000166
如果新的解决方案更好,则将之与整个狮群的解进行比较;如果新方案仍然更好,则这套解决方案(ψnomad)将取代原来的雄狮
Figure BDA0001750319650000167
新的狮子将继续交配,并且原来的雄狮和幼仔将被杀死;否则原狮子继续领土防御,幼崽长大一岁,直到幼崽成年,并将其保留在种群中,继续交配产生下一代。在种群更新完成之后,将幼崽的年龄初始化为0。此处种群更新指的是领土防御失败或者防御成功之后幼崽成年。
设f(.)为目标函数,f(ψpride)是整个种群的值,计算公式如下:
Figure BDA0001750319650000171
其中,f(ψmale)和f(ψfemale)分别是雄狮和雌狮的值,
Figure BDA0001750319650000172
Figure BDA0001750319650000173
分别是雄性幼崽和雌性幼崽的值,||ψm_cub||代表种群中雄性幼崽的数量并且agemat是达到交配要求的年龄,agecub是幼崽的年龄。
步骤234:领土接管
在领土接管阶段,分别寻找雌狮和雄狮中的最佳解决方案,替代劣质解决方案,进行交配,替代过程如下:
首先按照以下标准:
Figure BDA0001750319650000174
Figure BDA0001750319650000175
选择最好的雄狮
Figure BDA0001750319650000176
和最好的雌狮
Figure BDA0001750319650000177
其中,
Figure BDA0001750319650000178
ψmale、ψm_cub分别表示雄狮群中的可行解,成年雄狮代表的可行解,雄狮中的幼崽代表的可行解,
Figure BDA0001750319650000179
ψfemale、ψf_cub分别表示雌狮群中的可行解,成年雌狮代表的可行解,雌狮中的幼崽代表的可行解。
设κ为
Figure BDA00017503196500001710
的育种数,κstrenth为雌狮最优育种能力(新幼崽的数量),通常设定为5,并且,随着狮群的交配行为逐步加一(初始化狮群时,也设定为0);如果雌狮被替换,则κ初始化为0;如果原雌狮被替换回来,κ在原基础上继续累加。
步骤235、整个过程重复迭代直至达成终止条件;
完成步骤234后,如不符合终止条件,返回步骤232,终止条件为GEN≥GENmax;GEN为狮群的遗传代数,GENmax为整个过程重复迭代直到最大遗传代数;达成终止条件后,选择出的最优狮子作为较优的模型参数输出;最优狮子为整个过程重复种群中最好的狮子。
步骤24采用重构误差为误差条件的评估函数,在经过j次吉布斯块采样后,计算与原始数据的差值;当隐含层输出结果满足误差条件时,隐含层输出结果即为系统输出结果,否则返回步骤23继续计算;具体为:
考虑似然函数计算的复杂性,本文采用重构误差(reconstruction error)代替似然函数作为RBM的评估函数。重构误差以训练样本作为初始状态,经过若干次吉布斯块采样(block Gibbs Sample)后,计算与原始数据的差值。吉布斯块采样是MCMC采样算法中的一种,它交替的固定某一维度,然后通过其他维度的值来抽样该维度的值,并且该采样算法只对二维以上的空间有效。在RBM训练过程中,第j次迭代的重构误差计算如下:
Figure BDA0001750319650000181
其中,m表示可见层节点数,k表示训练样本的数目;
当该误差条件满足时,隐含层输出结果即为系统输出结果。
本实施例中,表3内各主成分所对应的特征向量如表4所示。
表4.前四个主成分特征值对应的特征向量
Figure BDA0001750319650000182
根据上表可写出前四个主成分的表达式如下所示:
y1=0.115787x1+0.117246x2+0.121396x3+0.004136x4+0.182637x5+0.331x6-0.90229x7+0.0298x8
y2=0.488516x1+0.289233x2-0.38349x3-0.28737x4-0.56235x5+0.124031x6-0.00965x7+0.341x8 (20)
y3=0.030807x1+0.021009x2+0.244522x3+0.579465x4-0.368x5-0.57124x6-0.232x7+0.29562x8
y4=0.434935x1+0.1636x2+0.007786x3+0.313366x4-0.18398x5+0.039846x6+0.03x7-0.80588x8
根据该表达式求出136组样本数据的前四个主成分的值,并以某地区输变电工程中的线路工程为例进行工程造价预测分析,使用这些值作为模型输入变量来获得预测结果。
本发明以前100个工程样本的样本数据进行训练,得出基于狮子算法优化受限玻尔兹曼机算法的输变电工程造价预测模型。
步骤3、输变电工程造价预测
将剩余的数据作为测试集,根据训练好的各KPCA-LA-RBM组合模型,运用测试集对训练好的KPCA-LA-RBM组合模型进行预测,得到最终的预测结果。
本实施例中,使用训练模型来预测剩余36个输电工程样本的造价。
首先,设定LA的参数如表5所示。
表5.LA参数表
Figure BDA0001750319650000191
然后,利用LA对RBM进行训练,优化RBM的参数。并基于优化模型对测试集的造价进行预测。KPCA-LA-RBM组合模型的预测结果和36个数据点的相对误差如图2所示。
结果表明,采用KPCA-LA-RBM组合模型预测输变电工程造价时,样本静态造价预测值与实际值基本吻合,拟合效果良好。该模型能为输变电工程造价预测提供准确的预测结果,是一种有效的预测方法。
如图2所示,误差率最高的样本是第23个样本,相对误差为8%,16个样本的相对误差的绝对值小于0.30%。同时,样本预测值相对误差绝对值的平均值为1.76%,小于2%,大多数点的相对误差的绝对值小于5%,均小于8%,表明所提出的模型具有很强的泛化能力以及鲁棒性。
如图4所示,为了证明本文提出的模型的优越性,本发明使用BP神经网络(BP)、支持向量机、受限玻尔兹曼机(RBM)和狮子算法优化的受限玻尔兹曼机(LA-RBM)对输变电工程造价进行预测,并将预测结果与KPCA-LA-RBM进行对比。KPCA-LA-RBM和其他4种模型之间的造价预测结果比较。
与BP神经网络、支持向量机、RBM和LA-RBM相比,KPCA-LA-RBM具有更好的性能。KPCA-LA-RBM组合模型预测值更接近实际值,与其它4种模型相比,预测精度更高。虽然五种模型都能达到预测目标,得到合理的结果,但BP神经网络预测曲线拟合不好,预测效果不好。在该预测情况下,SVM比BP神经网络具有更好的性能,但结果仍然不令人满意。RBM用于造价预测,其结果优于前两种模型。RBM优化后,造价预测精度得到提高。对36个测试点的预测结果和相对误差进行了分析,结果表明,KPCA-LA-RBM组合模型可以从所有影响因素中提取重要信息,并提取底层向量,从而获得良好的预测结果。
本实施例对之前得到的模型进行误差分析:
为了验证本文所提出的基于KPCA-LA-RBM的输变电工程造价预测模型的精确性和有效性,分别使用BP神经网络、SVM、RBM、LA-RBM等模型对同一组样本进行输变电工程造价预测,对比分析各个模型所得的预测结果。
随后对各个模型所得的预测结果进行对比分析:
本文采用平均绝对百分误差(MAPE)、均方根误差(RMSE)、平均绝对误差(MAE)和非线性函数拟合优度(R2)等四个指标来比较各个模型的预测精度,以期能够更加准确的评价各个模型的预测性能。各个指标的计算公式如下所示:
Figure BDA0001750319650000201
Figure BDA0001750319650000202
Figure BDA0001750319650000203
Figure BDA0001750319650000204
各个模型的指标计算结果如表6所示:
表6.指标计算结果表
Figure BDA0001750319650000205
从表6中可以看出,这五种模型都能实现输变电工程造价的预测,得到预测结果。本文提出的KPCA-LA-RBM组合模型的三个误差指标(MAPE,RMSE,MAE)在所有模型中最小,模型具有优良的拟合优度,达到93.06%。此时,KPCA-LA-RBM组合模型的三个误差指标符(MAPE,RMSE,MAE)分别为8.54%、45.81和36.134。同时,BP模型的三个误差指标最大,分别为21.70%、112.14和99.164,拟合优度也较差,为82.51%。KPCA-LA-RBM的预测精度优于BP、SVM、LA-RBM模型。
因此,四个指标在预测模型的评价结果上趋于一致。通过对四个指标的综合分析,得出输变电工程造价的预测准确度可以得出如下结论:KPCA-LA-RBM>LA-RBM>RBM>SVM>BP。

Claims (3)

1.一种基于KPCA-LA-RBM的输变电工程造价预测方法,其特征在于,包括:
步骤1、对各样本数据进行数据选择与预处理,并获得关键影响因素集;
步骤2、将若干组预处理后的样本数据组成训练集,并使用训练集训练KPCA-LA-RBM组合模型;
所述步骤2具体为:
步骤21、使用核主成分分析法KPCA提取若干组预处理后样本数据的主成分;
步骤22将前若干组样本数据集组成训练集,使用训练集并利用狮子算法对受限玻尔兹曼机模型的参数集
Figure FDA0003182750290000011
进行迭代优化,建立LA-RBM模型;
步骤23、随机设定狮子算法初始种群,以RBM模型最终结果作为本步骤的适应度值
Figure FDA0003182750290000012
重复使用步骤22对RBM模型参数不断优化,从而得到较优的RBM模型参数;
步骤24采用重构误差为误差条件的评估函数,在经过j次迭代的重构误差吉布斯块采样后,计算与原始数据的差值;当隐含层输出结果满足误差条件时,隐含层输出结果即为系统输出结果,否则返回步骤23继续计算;
第j次迭代的重构误差计算如下:
Figure FDA0003182750290000013
其中,m表示可见层节点数,k表示训练样本的数目;
当该误差条件满足时,隐含层输出结果即为系统输出结果;
所述步骤22具体为:
步骤221建立受限玻尔兹曼机算法RBM模型,并初始化RBM模型参数;对于RBM来说,其模型参数为
Figure FDA0003182750290000014
其中,αij,βi,γj分别表示可见层第i个节点和隐藏层第j个节点之间的权值、可见层第i个节点的偏置、隐藏层第i个节点的偏置;
步骤222、采用训练集对RBM模型进行训练,并计算RBM模型的最终结果;所述步骤23具体为:
在步骤231之前,设目标函数,将适应度值
Figure FDA0003182750290000015
代入目标函数,目标函数为:
min f(x1,x2,...,xn) (15)
其中n≥1;
步骤231:生成种群
在算法的初始阶段,将狮群初始化为2n头狮子并将其平分为两组,得到一个候选种群;其中,公狮子结构为
Figure FDA0003182750290000021
母狮结构为
Figure FDA0003182750290000022
l为解向量的长度;
步骤232:交配
通过交配使生成的Amale和Afemale产生新的幼崽
Figure FDA0003182750290000023
通过
Figure FDA0003182750290000024
Figure FDA0003182750290000025
随机选择两个交叉点进行双概率交叉可以生成四只幼仔群
Figure FDA0003182750290000026
变异操作是使用概率p进行随机变异产生幼崽
Figure FDA0003182750290000027
交叉和变异均完成后,幼崽种类数为8个;
聚类就是使用K-means方法将已有的8个解集进行性别分组:雄性幼崽Am_cub雌性幼崽Af _cub
根据每个个体代表的可行解,杀死总数较多一组的瘦小个体以保证两组幼崽数量平衡,最终达到更新种群的目的;
步骤233:领土防御
在领土防御过程中,随机初始化游动狮子ψnomad,将其作为新的可行解,并使用新解决方案ψnomad攻击雄狮
Figure FDA0003182750290000028
如果新的解决方案更好,则将之与整个狮群的解进行比较;如果新方案仍然更好,则这套解决方案ψnomad将取代原来的雄狮
Figure FDA0003182750290000029
新的狮子将继续交配,并且原来的雄狮和幼仔将被杀死;否则原狮子继续领土防御,幼崽长大一岁,直到幼崽成年,并将其保留在种群中,继续交配产生下一代;在种群更新完成之后,将幼崽的年龄初始化为0;
设f(.)为目标函数,f(ψpride)是整个种群的值,计算公式如下:
Figure FDA00031827502900000210
其中,f(ψmale)和f(ψfemale)分别是雄狮和雌狮的值,
Figure FDA00031827502900000211
Figure FDA00031827502900000212
分别是雄性幼崽和雌性幼崽的值,||ψm_cub||代表种群中雄性幼崽的数量并且agemat是达到交配要求的年龄,agecub是幼崽的年龄;
步骤234:领土接管
在领土接管阶段,分别寻找雌狮和雄狮中的最佳解决方案,替代劣质解决方案,进行交配,替代过程如下:
按照以下标准:
Figure FDA0003182750290000031
Figure FDA0003182750290000032
选择最好的雄狮
Figure FDA0003182750290000033
和最好的雌狮
Figure FDA0003182750290000034
其中,
Figure FDA0003182750290000035
ψmale、ψm_cub分别表示雄狮群中的可行解,成年雄狮代表的可行解,雄狮中的幼崽代表的可行解,
Figure FDA0003182750290000036
ψfemale、ψf_cub分别表示雌狮群中的可行解,成年雌狮代表的可行解,雌狮中的幼崽代表的可行解;
设κ为
Figure FDA0003182750290000037
的育种数,κstrenth为雌狮最优育种能力,通常设定为5,并且,随着狮群的交配行为逐步加一;如果雌狮被替换,则κ初始化为0;如果原雌狮被替换回来,κ在原基础上继续累加;
步骤235、整个过程重复迭代直至达成终止条件;
完成步骤234后,如不符合终止条件,返回步骤232,终止条件为GEN≥GENmax;GEN为狮群的遗传代数,GENmax为整个过程重复迭代直到最大遗传代数;达成终止条件后,选择出的最优狮子作为较优的模型参数输出;最优狮子为整个过程重复种群中最好的狮子;
步骤3、输变电工程造价预测:
将剩余的数据作为测试集,运用测试集对训练好的KPCA-LA-RBM组合模型进行预测,得到最终的预测结果。
2.根据权利要求1所述的一种基于KPCA-LA-RBM的输变电工程造价预测方法,其特征在于,所述步骤1具体为:
步骤11、收集若干组样本数据,将异常数据进行处理,根据GB/T18710-2002中规定的相关参数合理变化范围剔除异常数据,并用上一时刻与下一时刻的平均值替代;并进行无量纲化处理,使其标准化于[0,1]之间;
步骤12、使用各个自变量与因变量之间的相关系数R对影响因素进行剔除,把可以忽略的、对模型影响不大的影响因素从模型分析中去除,从而找到关键影响因素;相关系数R的计算公式如下:
Figure FDA0003182750290000041
其中,xi表示影响因素值,
Figure FDA0003182750290000042
表示该类影响因素的平均值;yi表示输出向量值,
Figure FDA0003182750290000043
表示输出向量平均值;
步骤13、获得带有各自相关系数R的关键影响因素集。
3.根据权利要求1所述的一种基于KPCA-LA-RBM的输变电工程造价预测方法,其特征在于,所述步骤221具体分为:
步骤2211、RBM模型中可见变量和隐藏变量的联合配置的能量函数表示为:
Figure FDA0003182750290000044
其中,αij,βi,γj表示可见层第i个节点和隐藏层第j个节点之间的权值、可见层第i个节点的偏置、隐藏层第i个节点的偏置,
Figure FDA0003182750290000045
为模型的待定参数;n为可见层神经元个数,m为隐藏层,Vi,Hj分别表示可见层的第i个节点和隐藏层的第j个节点;
步骤2212、设置可见层和隐含层的节点数,并通过能量函数继而得到(V,H)的联合概率分布;
基于式(5)的能量函数,得到(V,H)的联合概率分布:
Figure FDA0003182750290000046
将公式(5)代入公式(6)可得:
Figure FDA0003182750290000047
其中,
Figure FDA0003182750290000051
为配分函数,以确保函数是标准化的;配分函数
Figure FDA0003182750290000052
表示为:
Figure FDA0003182750290000053
步骤2213、通过对相邻层间的神经元间的函数映射求出隐藏层和可视层的激活概率值,具体为:
RBM模型所描述的关于数据样本r的分布,即公式(6)的边缘分布:
Figure FDA0003182750290000054
由于根据二部图特征,可视层和隐藏层内部的神经元之间都没有互联,只有相邻层间的神经元有对称的连接,则同层神经元之间具有条件独立性,选定节点的激活函数为sigmoid函数,可计算出可视层已知时隐藏层第j个节点uj=1时的概率为:
Figure FDA0003182750290000055
其中
Figure FDA0003182750290000056
为sigmoid函数,该函数为:
Figure FDA0003182750290000057
通过sigmoid函数映射,隐藏层的激活概率值就会以S型的方式分布;
在给定隐藏层g,可视层第i个节点ki=1时的概率为:
Figure FDA0003182750290000058
步骤2214、根据隐藏层和可视层中每个节点的激活概率值,求出最大化似然函数
Figure FDA0003182750290000059
具体为:
假设样本数据训练集为
Figure FDA00031827502900000510
n1表示训练样本的数目;其中
Figure FDA00031827502900000511
i=1,2,...,n2,n2表示可见层节点数,也就是输入数据的维数;
在训练优化RBM的参数时,其目标是最大化似然函数
Figure FDA00031827502900000512
表示如下:
Figure FDA00031827502900000513
步骤2215、对最大化似然函数进行对数处理,并把结果作为目标函数的适应度值
Figure FDA0003182750290000061
Figure FDA0003182750290000062
进行对数处理,即对训练目标进行对数处理,得到目标函数的适应度值
Figure FDA0003182750290000063
Figure FDA0003182750290000064
CN201810863513.3A 2018-08-01 2018-08-01 基于kpca-la-rbm的输变电工程造价预测方法 Active CN109214503B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810863513.3A CN109214503B (zh) 2018-08-01 2018-08-01 基于kpca-la-rbm的输变电工程造价预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810863513.3A CN109214503B (zh) 2018-08-01 2018-08-01 基于kpca-la-rbm的输变电工程造价预测方法

Publications (2)

Publication Number Publication Date
CN109214503A CN109214503A (zh) 2019-01-15
CN109214503B true CN109214503B (zh) 2021-09-10

Family

ID=64987826

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810863513.3A Active CN109214503B (zh) 2018-08-01 2018-08-01 基于kpca-la-rbm的输变电工程造价预测方法

Country Status (1)

Country Link
CN (1) CN109214503B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109919356B (zh) * 2019-01-27 2023-07-21 河北工程大学 一种基于bp神经网络区间需水预测方法
CN111144950B (zh) * 2019-12-30 2023-06-30 北京顺丰同城科技有限公司 模型筛选方法、装置、电子设备及存储介质
CN112508512B (zh) * 2020-11-26 2022-09-09 国网河北省电力有限公司经济技术研究院 电网工程造价数据管理方法、装置及终端设备
CN113762791B (zh) * 2021-09-13 2023-08-01 郑州铁路职业技术学院 一种铁路工程造价管理系统
CN115526393B (zh) * 2022-09-23 2023-09-29 国网冀北电力有限公司经济技术研究院 一种基于变电工程关键影响因素筛选的造价预测方法
CN115438035B (zh) * 2022-10-27 2023-04-07 江西师范大学 一种基于kpca和混合相似度的数据异常处理方法
CN116303687B (zh) * 2023-05-12 2023-08-01 烟台黄金职业学院 一种工程造价数据智能管理方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105303262A (zh) * 2015-11-12 2016-02-03 河海大学 一种基于核主成分分析和随机森林的短期负荷预测方法
CN105335818A (zh) * 2015-10-21 2016-02-17 江苏省电力公司 基于bp神经算法的输变电工程造价风险评估预测方法
CN105354371A (zh) * 2015-10-21 2016-02-24 江苏省电力公司 基于ga-wnn的输变电工程造价预测方法
CN106709820A (zh) * 2017-01-11 2017-05-24 中国南方电网有限责任公司电网技术研究中心 一种基于深度置信网络的电力系统负荷预测方法及装置
CN108229571A (zh) * 2018-01-15 2018-06-29 南京邮电大学 基于kpca算法与深度信念网络的苹果表面病变图像识别方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105335818A (zh) * 2015-10-21 2016-02-17 江苏省电力公司 基于bp神经算法的输变电工程造价风险评估预测方法
CN105354371A (zh) * 2015-10-21 2016-02-24 江苏省电力公司 基于ga-wnn的输变电工程造价预测方法
CN105303262A (zh) * 2015-11-12 2016-02-03 河海大学 一种基于核主成分分析和随机森林的短期负荷预测方法
CN106709820A (zh) * 2017-01-11 2017-05-24 中国南方电网有限责任公司电网技术研究中心 一种基于深度置信网络的电力系统负荷预测方法及装置
CN108229571A (zh) * 2018-01-15 2018-06-29 南京邮电大学 基于kpca算法与深度信念网络的苹果表面病变图像识别方法

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
Study on Cost Forecasting Modeling Framework Based on KPCA & SVM and a Joint Optimization Method by Particle Swarm Optimization;Jiang Tiejun等;《 Proceedings of the 2009 International Conference on Information Management, Innovation Management and Industrial Engineering 》;20091031;第375-378页 *
Ultra-Short-Term Wind-Power Forecasting Based on the Weighted Random Forest Optimized by the Niche Immune Lion Algorithm;Dongxiao Niu等;《energies》;20180429;第1-21页 *
Wind power forecasting model based on artificial bee colony algorithm and support vector machine under the influence of climate change;JunsongQin等;《Boletin Tecnico/Technical Bulletin 》;20170930;第55卷(第9期);第693-700页 *
一种群体智能算法———狮群算法;刘生建等;《模式识别与人工智能》;20180531;第31卷(第5期);第431-441页 *
基于支持向量机的输变电工程造价预测模型研究;孔军等;《现代电子技术》;20180228;第41卷(第4期);第127-130页 *
基于随机森林输变电线路工程造价估算研究;安磊等;《控制工程》;20161130;第23卷(第11期);第1841-1844页 *

Also Published As

Publication number Publication date
CN109214503A (zh) 2019-01-15

Similar Documents

Publication Publication Date Title
CN109214503B (zh) 基于kpca-la-rbm的输变电工程造价预测方法
Chen et al. Evolutionary artificial neural networks for hydrological systems forecasting
CN109492822B (zh) 空气污染物浓度时空域关联预测方法
Gu et al. GAN-based model for residential load generation considering typical consumption patterns
CN111785329B (zh) 基于对抗自动编码器的单细胞rna测序聚类方法
CN107992976B (zh) 热点话题早期发展趋势预测系统及预测方法
CN111104522A (zh) 一种基于知识图谱的区域产业关联效应趋势预测方法
CN113537600B (zh) 一种全过程耦合机器学习的中长期降水预报建模方法
CN110751318A (zh) 一种基于ipso-lstm的超短期电力负荷预测方法
CN115906954A (zh) 一种基于图神经网络的多变量时间序列预测方法及装置
CN112784913A (zh) 一种基于图神经网络融合多视图信息的miRNA-疾病关联预测方法及装置
CN110070116A (zh) 基于深度树状训练策略的分段式选择集成图像分类方法
CN116759100B (zh) 基于联邦学习构建慢性心血管疾病大模型方法
CN114580762A (zh) 一种基于XGBoost的水文预报误差校正方法
CN115952424A (zh) 一种基于多视图结构的图卷积神经网络聚类方法
CN116976529A (zh) 基于供需预测动态校正的跨流域调水方法和系统
Tian et al. Genetic algorithm based deep learning model selection for visual data classification
CN114880538A (zh) 基于自监督的属性图社团检测方法
CN110335160A (zh) 一种基于分组和注意力改进Bi-GRU的就医迁移行为预测方法及系统
CN110516792A (zh) 基于小波分解和浅层神经网络的非平稳时间序列预测方法
CN114037014A (zh) 基于图自编码器的引用网络聚类方法
Sánchez et al. Obtaining transparent models of chaotic systems with multi-objective simulated annealing algorithms
Zhao et al. A pipeline for fair comparison of graph neural networks in node classification tasks
CN105512249A (zh) 一种基于紧凑进化算法的本体匹配方法
CN115544307A (zh) 基于关联矩阵的有向图数据特征提取与表达方法和系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant