CN111832839B - 基于充分增量学习的能耗预测方法 - Google Patents

基于充分增量学习的能耗预测方法 Download PDF

Info

Publication number
CN111832839B
CN111832839B CN202010723405.3A CN202010723405A CN111832839B CN 111832839 B CN111832839 B CN 111832839B CN 202010723405 A CN202010723405 A CN 202010723405A CN 111832839 B CN111832839 B CN 111832839B
Authority
CN
China
Prior art keywords
data
value
incremental learning
energy consumption
similarity value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010723405.3A
Other languages
English (en)
Other versions
CN111832839A (zh
Inventor
刘晶
于兵
董瑶
赵佳
金玉蓉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hebei University of Technology
Original Assignee
Hebei University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hebei University of Technology filed Critical Hebei University of Technology
Priority to CN202010723405.3A priority Critical patent/CN111832839B/zh
Publication of CN111832839A publication Critical patent/CN111832839A/zh
Application granted granted Critical
Publication of CN111832839B publication Critical patent/CN111832839B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/10Machine learning using kernel methods, e.g. support vector machines [SVM]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/80Management or planning
    • Y02P90/82Energy audits or management systems therefor

Abstract

本发明公开了一种基于充分增量学习的能耗预测方法,包含以下内容:对能耗数据的多维参数进行整理,提取不同轮毂的型号并用于加权核主成分分析法对样本进行有效特征提取;然后对数据分组后通过在每一轮增量学习的过程中计算并判断相似度值,按照相似度值的不同程度进行多轮增量学习,同时不断动态调整判断阈值、数据样本及权重值;最后使用误差反向传播神经网络进行能耗预测,并使用均方根误差RMSE值对预测结果进行评价。本发明验证了预测方法的有效性,最终得到的RMSE值低至0.000112,相对于其他对比方法效果最优。

Description

基于充分增量学习的能耗预测方法
技术领域
本发明涉及能耗预测技术领域,尤其涉及一种基于充分增量学习的能耗预测方法。
背景技术
能源消耗与环境污染是伴随我国经济持续高速发展的一大严峻考验,其中工业能耗占我国社会总能耗比重近70%,所以在工业领域,提高能源使用效率、降低能源消耗是加快推进工业绿色转型的重点。随着车辆的全民化,车辆配件也越来越被大众所关注,为了满足顾客对车辆配件的个性化定制要求,且轮毂作为车辆配件的重要组成部分在外观上具有装饰性,所以个性化的轮毂也越来越受欢迎。但是在生产轮毂时,对能耗的使用无法得到有效的控制,而能耗数据会影响生产轮毂的成本,所以对轮毂产品的能耗进行研究具有重要意义。
目前在工业领域,对能耗的使用逐渐获得更多的关注。在工业4.0的变革时代,物联网、人工智能、工业互联网等先进技术的融合,工业生产过程中数据采集、数据管理、分析建模等方法的应用,均为能源需求的预测提供了支撑。目前主要采用时间序列预测、神经网络、灰色预测、极限学习机、支持向量机等方法进行预测,且均取得了较好的研究成果。文章[王茹等.改进鲸鱼算法构建混合模型的建筑能耗预测[J].计算机测量与控制,2020,28(02):197-201+205.]提出一种用于建筑能耗短期预测的新型混合模型,通过互补集合经验模态分解法和改进的鲸鱼优化算法优化的反馈型神经网络对数据进行处理并得到最终的能耗预测值,具有良好的预测性能。文章[邹伟东等.基于压缩动量项的增量型ELM虚拟机能耗预测[J].自动化学报,2019,45(07):1290-1297.]针对基于传统的增量型极限学习机的预测模型存在冗余节点的问题,加入了压缩动量项将网络训练误差反馈到隐含层的输出中,使得预测结果更贴近输出样本,不仅减少了冗余隐含层节点,同时加快了收敛速度。文章[刘家学等.基于LSTM的航空公司能耗序列预测[J].计算机应用与软件,2019,36(10):60-65.]提出了一种基于网格搜索算法优化的长短时记忆网络预测模型,提升了能耗预测的精度。文章[杨之俊等.大数据环境下区域建筑电力能耗快速预测仿真[J].计算机仿真,2019,36(04):432-435+473.]提出基于时间序列分析的区域建筑电力能耗快速预测方法,在预测电力能耗时具有准确性和有效性。文章[陈静杰等.基于两步分解法和SARIMA的非饱和机场能耗预测[J].计算机应用与软件,2019,36(04):46-50+78.]提出一种基于两步分解法和季节差分自回归滑动平均模型相结合的组合预测法,结合自适应噪声和变分模态分解法,采用季节差分自回归滑动平均模型对数据进行建模预测,大大提升了能耗预测的精度。文章[郭久俊.基于LSTM-Adaboost的多晶硅生产的能耗预测[J].计算机应用与软件,2018,35(12):71-75+117.]提出基于LSTM-Adaboost循环神经网络多晶硅生产过程的能耗预测模型,结合PCA算法,使用正则化方法优化LSTM的目标函数并引入Adaboost算法对LSTM模型进行优化得到预测模型,实现了有效的能耗预测。文章[丁飞鸿等.基于遗传优化决策树的建筑能耗短期预测模型[J].计算机工程,2019,45(06):280-289+296.]提出一种遗传优化决策树模型,通过遗传算法优化梯度来提升决策树的子树生成过程,得到了较高的预测精度。文章[高学金等.基于ISOA的LS-SVM地铁站空调系统能耗预测模型[J].计算机与现代化,2018(10):36-43.]提出一种从算法搜索步长和搜索方向两个方面进行改进的人群搜索算法对LS-SVM建模过程中的模型参数进行优化的方法,提升了预测的精度和速度。文章[王坤等.基于EMD与果蝇参数寻优的LSSVM的机场能耗预测[J].计算机时代,2017(04):35-40.]提出一种结合经验模式分解和果蝇参数寻优的最小二乘支持向量机的能耗预测方法,提高了预测的精度。
从上述文献可以看出,在进行能耗预测的过程中,虽然使用了降维和增量学习等方法,但是没有充分利用数据本身属性的信息,且增量学习的过程中只解决了冗余节点的问题,而针对日益增长的数据,选取有效的数据进行高效的能耗预测,是目前急需解决的问题。所以本发明针对降维过程中对标签的使用进行了改进,将轮毂的不同型号这一属性作为标签在权重中使用,以此实现数据信息的高效利用;在增量学习过程中,一方面在实现提高有效数据权重的同时,另一方面减少低效数据的权重,而一次筛选完毕对数据的利用并不充分,所以通过循环进行多层筛选增量学习,最终留下所有有效数据,最终实现更精准的能耗预测。
发明内容
本发明的目的在于:
本发明提供一种基于充分增量学习的能耗预测方法,结合轮毂的型号并使用加权核主成分分析法对样本进行有效特征提取,然后通过计算并判断相似度值,按照相似度值的不同程度进行多轮增量学习,并不断动态调整判断阈值,最后使用误差反向传播模型进行能耗预测。该方法与原始方法相比,通过对数据的特征提取,最大限度的保留了有效信息,通过多轮增量学习,有效解决了能耗数据之间包含的重要程度关系,实现了对能耗数据的动态调整,达到了高效利用数据信息的效果,最终实现了准确的能耗预测。
本发明所采取的技术方案为:
一种基于充分增量学习的能耗预测方法,包括下述步骤:
(1)对能耗数据的多维参数进行整理,并提取出不同轮毂的型号;
(2)对整理好的能耗数据采用加权核主成分分析法进行降维;
(3)将降维后的数据划分为训练数据和测试数据,对训练数据进行分组后赋予初始权重值;
(4)对第一组训练样本及权重值进行增量学习的首轮学习,并计算得到第一组训练数据的平均相似度值;
(5)将剩余数据不断输入到增量学习的模型中,通过分别与第一组训练数据比较判断相似度值进行不同操作;
(6)当样本之间的相似度大于平均相似度值时,增大现有样本权重值;当样本之间的相似度值小于平均相似度值时,减小现有样本的权重值,并统一存在一起用于下一轮的增量学习,通过多轮增量学习实现充分的增量学习;
(7)在进行上述操作的过程中,每一轮增量学习的阈值参数、数据样本及权重值都会随着数据的不同进行调整;
(8)当某次用于增量学习的数据平均相似度值小于初始平均相似度值的1/2时,增量学习结束,此时,删除所有权重值小于初始权重值1/2的数据;
(9)将得到的数据输入到误差反向传播模型中进行能耗预测;
(10)采用评价指标RMSE值对能耗预测结果进行评价。
其中,步骤(2)中的加权核主成分分析法的权重是以不同轮毂的型号作为样本的标签,加工为权值进行计算的,通过将标签的信息值融合在核矩阵中构造加权核矩阵,加权核矩阵中数据对应的权值为
Figure BDA0002600827230000041
其中ui表示第i个样本对应的权值向量。
步骤(5)中,将欧式距离用于计算多维数据的相似度值,相似度值计算公式如下:
Figure BDA0002600827230000042
其中dist(x,y)表示新增特征x和现有特征y两个不同故障特征的欧氏距离(现有特征包含初始特征和完成新增操作的新增特征),即
Figure BDA0002600827230000043
其中,xi和yi代表新增特征x的第i个值和现有特征y的第i个值,x和y之间的差异性越小,欧式距离越小,则相似度值越大,以此衡量新增特征与现有特征之间的相似度。
步骤(6)中充分增量学习的过程包括下述步骤:
在整个充分增量学习的过程中,首先赋予全部数据初始权重值,其次计算第一组数据之间的相似度值,计算得到平均相似度值,然后将其余新增数据分别与第一组数据计算相似度值,当大于已有平均相似度值时,增大现有样本的权重值;当小于已有平均相似度值时,减小现有样本的权重值并将所有数据存到一起,用于进行下一轮的增量学习。在下一轮的增量学习中,首先将已有数据分组,其次计算第一组数据之间的相似度值,计算得到平均相似度值,然后将其余新增数据分别与第一组数据计算相似度值,当大于该平均相似度值时,增大现有样本的权重值;当小于该平均相似度值时,减小现有样本的权重值并将所有数据存到一起,用于进行下一轮的增量学习,直到某次用于增量学习的数据平均相似度值小于初始平均相似度值的1/2时,增量学习结束,此时,删除所有权重值小于初始权重值1/2的数据,完成充分增量学习的全过程。
为了解决轮毂在生产过程中的能耗问题,本专利提出一种基于充分增量学习的能耗预测方法,使用加权核主成分分析法对样本进行有效特征提取,然后通过计算并判断相似度值,按照相似度值的不同条件采用充分增量学习对初始数据样本和新增数据样本的权重进行动态调整,最后使用误差反向传播模型对能耗进行预测,实现高效的增量学习和准确的能耗预测。
一、本发明方法的理论依据:
1、加权核主成分分析法:核主成分分析法虽然可以处理非线性问题,但是忽略了数据标签中的信息,所以本发明采用加权核主成分分析法(WKPCA)对能耗数据进行降维,尽可能多的保留有效信息,进而提高能耗预测的效率并减小能耗预测值的误差。
2、充分增量学习:在整个充分增量学习的过程中,首先赋予全部数据初始权重值,其次计算第一组数据之间的相似度值,计算得到平均相似度值,然后将其余新增数据分别与第一组数据计算相似度值,当大于已有平均相似度值时,增大现有样本的权重值;当小于已有平均相似度值时,减小现有样本的权重值并将所有数据存到一起,用于进行下一轮的增量学习。在下一轮的增量学习中,首先将已有数据分组,其次计算第一组数据之间的相似度值,计算得到平均相似度值,然后将其余新增数据分别与第一组数据计算相似度值,当大于该平均相似度值时,增大现有样本的权重值;当小于该平均相似度值时,减小现有样本的权重值并将所有数据存到一起,用于进行下一轮的增量学习,直到某次用于增量学习的数据平均相似度值小于初始平均相似度值的1/2时,增量学习结束,此时,删除所有权重值小于初始权重值1/2的数据,完成充分增量学习的全过程。
3、BP神经网络(BPNN):使用误差反向传播算法模型通过对数据的训练,实现对能耗的准确预测。
二、基于充分增量学习的能耗预测方法设计:
基于充分增量学习的能耗预测方法工作原理如下:对将多维参数进行整理后的数据采用加权核主成分分析法进行特征提取,使数据变得更加高效,同时提高数据处理的效率;将提取的特征进行多轮增量学习,在保留原始数据信息的基础上不断学习新的知识,实现充分的增量学习,在增量学习的过程中不断动态调整判断阈值、数据样本以及权重值;最终将训练得到的数据输入到误差反向传播算法中对能耗进行准确预测,方法的操作如图1所示。
1、基于充分增量学习的能耗预测方法结构
本发明中加权核主成分分析法通过特征提取以减少数据样本的维度,进而提高数据处理的效率。将得到的数据进行多轮增量学习,通过计算相似度值动态调整判断阈值、数据样本以及权重值,将得到的包含信息量最多的数据输入到误差反向传播算法中进行能耗预测。
2、算法具体实现
基于充分增量学习的能耗预测方法步骤描述如下,流程图如图2所示。
(1)对能耗数据的多维参数进行整理,并提取出不同轮毂的型号;
(2)对整理好的能耗数据采用加权核主成分分析法进行降维;
(3)将降维后的数据划分为训练数据和测试数据,对训练数据进行分组后赋予初始权重值;
(4)对第一组训练样本及权重值进行增量学习的首轮学习,并计算得到第一组训练数据的平均相似度值;
(5)将剩余数据不断输入到增量学习的模型中,通过分别与第一组训练数据比较判断相似度值进行不同操作;
(6)当样本之间的相似度大于平均相似度值时,增大现有样本权重值;当样本之间的相似度值小于平均相似度值时,减小现有样本的权重值,并统一存在一起用于下一轮的增量学习,通过多轮增量学习实现充分的增量学习;
(7)在进行上述操作的过程中,每一轮增量学习的阈值参数、数据样本及权重值都会随着数据的不同进行调整;
(8)当某次用于增量学习的数据平均相似度值小于初始平均相似度值的1/2时,增量学习结束,此时,删除所有权重值小于初始权重值1/2的数据;
(9)将得到的数据输入到BPNN中进行能耗预测;
(10)采用评价指标均方误差根RMSE值对能耗预测结果进行评价。
采用上述技术方案所产生的有益效果在于:
本发明提出了基于充分增量学习的能耗预测方法,对能耗数据特征提取、增量学习及能耗预测三个过程进行处理。该模型先使用加权核主成分分析法保留了带有标签信息的有效数据样本,然后通过计算相似度值并依据判断条件对数据进行多轮增量学习后进行能耗的预测,从而实现了高效的增量学习和准确的能耗预测。通过实验分析,将加权核主成分分析法、充分增量学习与误差反向传播模型结合在一起,能耗预测的RMSE值为0.000112,同时通过实验对比可知本发明的方法优于长短期记忆网络(LSTM)、支持向量回归机(SVR),原始误差反向传播模型(BP),能够实现准确的能耗预测。
附图说明
图1是本发明基于充分增量学习的能耗预测方法结构图;
图2是本发明基于充分增量学习的能耗预测方法流程图;
图3是本发明方法中BP算法的中间层输出维数为7时的训练数据集RMSE值和测试数据集RMSE值;
图4是本发明方法中BP算法的中间层输出维数为4时的训练数据集RMSE值和测试数据集RMSE值;
图5是本发明方法中迭代次数选取3000时的训练数据集RMSE值和测试数据集RMSE值;
具体实施方式
为更好的理解本发明的技术方案,下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。
本发明实施例中,一种基于充分增量学习的能耗预测方法,包括下述步骤:
(1)以预测轮毂单品耗电量为例,选取20种轮毂型号进行实验,由于可用数据量较少,故用Python仿真了部分数据,共得到2015年1月到2018年12月份的相关数据,对所有能耗数据的多维参数进行整理,并提取出不同轮毂的型号;
(2)对整理好的能耗数据采用加权核主成分分析法进行降维;
核主成分分析法虽然可以处理非线性问题,但是忽略了数据标签中的信息,所以本发明采用加权核主成分分析法(WKPCA)对能耗数据进行降维,尽可能多的保留有效信息,进而减小预测值的误差。假定一个高维数据集X=[x1,…,xi,…,xN],xi表示数据集X的第i个样本,N表示样本数,c表示样本类别。设样本的权值向量为[u1,…,ui,…,uN],其中ui表示第i个样本xi对应的权值向量。设样本的标签信息值为{l1,…,lj,…,lc},其中lj表示第j个标签信息值。样本xi的权值由类别信息确定,即样本xi属于第j类时,
ui=lj
其中,i=1,2,…,N,j=1,2,…,c。由于采用的是高斯核函数,所以核函数
Figure BDA0002600827230000091
其中,K(xi,xj)表示i行j列的核矩阵,σ表示函数的宽度参数,控制了函数的径向作用范围。根据样本的权值信息构造一个加权核矩阵
Figure BDA0002600827230000092
Figure BDA0002600827230000093
其中,Kw(xi,xj)表示i行j列的加权核矩阵,wij为权值矩阵中的第i行第j列的权值,且
Figure BDA0002600827230000094
以此构造权值矩阵W={wij}。
所以得到Kw(xi,xj)如下:
Figure BDA0002600827230000095
根据上式可知,当ui=uj时,样本xi与样本xj属于同一型号,wij=1,此时加权核矩阵就是原始核矩阵K(xi,xj);当ui≠uj时,样本xi与样本xj属于不同型号,此时wij是一个大于0的正数,并且样本间的类别信息被引入到加权核矩阵Kw(xi,xj)中。
运用Jacobi方法计算Kw的特征值λ1,…,λi,…,λN和特征向量α1,…,αi,…,αN,其中λi表示第i个特征值,αi表示第i个特征向量,i=1,2,…,N;其次将特征值λi进行降序排列,并调整与其对应的特征向量αi;然后利用Gram-Schmidt正交法单位正交化特征向量,得到正交特征向量βi,其中βi表示第i个正交特征向量。对上述得到的特征值计算其累计贡献率B1,…,Bi,…,Bn,其中Bi表示第i个累积贡献率,i=1,2,…,n,根据给定的贡献率值p,如果Bt≥p,则提取t个主成分β1,…,βi,…,βt,最后计算已标准化的样本X在提取出的特征向量上的投影Y,由Y=Kw(i,j)·β得到,其中β=(β1,…,βi,…,βt),所得投影Y即为从原始数据中使用WKPCA特征提取后得到的数据。
(3)将降维后的数据划分为训练数据和测试数据,对训练数据进行分组后赋予初始权重值;
(4)对第一组训练样本及权重值进行增量学习的首轮学习,并计算得到第一组训练数据的平均相似度值;
(5)将剩余数据不断输入到增量学习的模型中,通过分别与第一组训练数据比较判断相似度值进行不同操作;
计算新增特征与现有特征之间的相似度值时,采用欧式距离计算多维数据的相似度值Sim(x,y)
Figure BDA0002600827230000101
其中dist(x,y)表示新增特征x和现有特征y之间的欧式距离
Figure BDA0002600827230000102
其中,xi和yi代表新增特征x的第i个值和现有特征y的第i个值,x和y之间的差异性越小,欧式距离越小,则相似度值越大,以此衡量新增特征与现有特征之间的相似度。
(6)当样本之间的相似度大于平均相似度值时,增大该样本权重值;当样本之间的相似度值小于平均相似度值时,减小对应样本的权重值,并统一存在一起用于下一轮的增量学习,通过多轮增量学习实现充分的增量学习;
使用步骤(5)中的公式计算新增特征与现有特征的相似度,选取最大值Sim(x,y)作为该特征的相似度值,并根据以下原则判定如何处理特征的权重:
使用ai代表第i轮增量学习中两对比特征之间的相似度值,其取值为ai=aver Sim(x,y),代表现有特征中两两特征x与y之间相似度的平均值:
(1)若ai<Sim(x,y),则表示新增特征与现有特征高度相似,所以增大现有特征的权重值。
(2)若Sim(x,y)<ai,则表示新增特征与现有特征的相似度低于平均相似度值,代表该新增特征与现有特征的相似度不够高,故将满足该条件的数据存放到一起并相应的减小对应现有特征的权重值,然后进行下一轮的增量学习。
根据新增特征增量原则来计算特征的动态权重,用以衡量该特征随时间变化的重要性改变程度。由于新增特征与现有特征的相似度能够在一定程度上反映该新增特征对当前模型的重要性,所以对相似度值使用下式归一化处理,并计算其动态权重。
Figure BDA0002600827230000111
其中,Sim(x,y)norm表示归一化处理后的新增特征x与现有特征y的相似度值,minSim(x,y)表示新增特征x和现有特征y之间相似度的最小值,maxSim(x,y)表示新增特征x和现有特征y之间相似度的最大值。
对满足原则(1)中条件的特征,由于其具有较高的相似度值,所以增加其权重以增强并记住有效特征。其动态权重计算方法如下。
Wi+1=Wi+Sim(x,y)norm
其中,Wi+1表示第i+1次提高现有特征y的权重值,Wi表示第i次提高现有特征y的权重值,将Wi与新增特征x和现有特征y的相似度值相加得到Wi+1,初次合并时i=0,W0为初始权重值。
对满足原则(2)中条件的特征,说明其相似度较低,所以减小其权重值,待第一轮增量学习完毕后,用于第二轮增量学习,计算方法如下。
Wi+1=Wi-Sim(x,y)norm
其中,Wi+1表示第i+1次减少现有特征y的权重值,Wi表示第i次减少现有特征y的权重值,将Wi与新增特征x和现有特征y的相似度值做差得到Wi+1,新增特征x的权重值初次减少时i=0,W0为初始权重值。
(7)在进行上述操作的过程中,每一轮增量学习的阈值参数、数据样本及权重值都会随着数据的不同进行调整;
(8)当某次用于增量学习的数据平均相似度值小于初始平均相似度值的1/2时,增量学习结束,此时,删除所有权重值小于初始权重值1/2的数据;
(9)将得到的数据输入到BPNN中进行能耗预测;
(10)采用评价指标均方误差根RMSE值对能耗预测结果进行评价。
基于充分增量学习的能耗预测方法的试验验证:
1、数据描述
实验数据来源于某轮毂制造公司的轮毂特征参数和能耗数据,该公司在各生产线中均安装了智能仪器,用来获得生产过程中所消耗的电能、水以及天然气。本次实验以预测轮毂单品耗电量为例,选取20种轮毂型号进行实验,由于可用数据量较少,故用Python仿真了部分数据,共得到2015年1月到2018年12月份的相关数据。如下表1所示:
表1特征参数描述
Figure BDA0002600827230000121
2、实验过程
针对20种轮毂型号的能耗数据,首先将其参数“单品型号”提取出来作为数据的标签,然后使用加权核主成分分析法对剩下的10种参数进行降维,提取出最重要的参数。在进行降维的过程中,首先对所有的能耗数据进行标准化处理,排除因计量单位不同而导致的差异;然后将结合标签的能耗数据输入到降维模型中,计算出加权核矩阵、特征值和特征向量,并将特征向量单位化;累计贡献率设置为0.85,根据累计贡献率的值最终将特征降至二维。
接下来对降维后的数据进行充分增量学习的训练。首先进行第一轮增量学习:计算第一组数据之间的相似度值,取平均相似度值α,然后计算新增数据与第一组数据之间的相似度值,当相似度值大于已有平均相似度值时,增大现有样本的权重值;当相似度值小于已有平均相似度值时,减小现有样本的权重值并将所有数据存到一起,用于进行下一轮的增量学习。在下一轮的增量学习中:首先将已有数据分组,其次计算第一组数据之间的相似度值,计算得到平均相似度值α,然后计算其余新增数据与第一组数据之间的相似度值,当相似度值大于该平均相似度值时,增大现有样本的权重值;当相似度值小于该平均相似度值时,减小现有样本的权重值并将所有数据存到一起,用于进行下一轮的增量学习,直到某次用于增量学习的数据平均相似度值小于初始平均相似度值的1/2时,增量学习结束,此时,删除所有权重值小于初始权重值1/2的数据,完成充分增量学习的全过程。其中,每一轮的平均相似度值α、所有能耗数据及对应的权重值是不断动态调整。通过充分增量学习的训练,最终得到的数据分布如表2所示:
表2数据分布情况
Figure BDA0002600827230000131
Figure BDA0002600827230000141
然后将表2中通过充分增量学习得到的712个数据输入到误差反向传播模型(BP)中进行能耗预测。在进行能耗预测实验之前,需要通过实验选取中间层输出维数和迭代次数。首先对中间层的输出维数进行选取,我们采用均方根误差RMSE来衡量能耗预测的结果。所有的RMSE值和运行时间如表3所示。
表3 RMSE值和运行时间
Figure BDA0002600827230000142
从表3可知,当中间层输出维数为7时,RMSE值最小,为0.000431。相应的训练RMSE和测试RMSE值如图3所示。对比中间层输出维数为4时的RMSE值如图4所示。
中间层维数确定为7后,可以得到最小的RMSE值,接下来选取迭代次数。将迭代次数设置为3000,得到的结果如表4所示。可以看到RMSE值在测试样本上的差异非常小,通过对比不同迭代次数的RMSE值和运行时间,当迭代次数为1800次时,RMSE值最小,为0.000112,此时的运行时间为691.28秒。其中,当迭代次数为3000次时,训练数据和测试数据的RMSE值如图5所示。所以最终选取的中间层输出维数和迭代次数分别为7和1800。
表4 RMSE值和运行时间
Figure BDA0002600827230000151
Figure BDA0002600827230000161
将经过降维和充分增量学习的数据输入到LSTM模型和SVR模型中进行能耗预测,得到的RMSE值和运行时间如表5所示。
表5 RMSE值和运行时间
Figure BDA0002600827230000162
从表5可知,在改进的方法中,BP算法的RMSE值最小,比LSTM的RMSE值小0.07856,比SVR的RMSE值小0.240259。虽然运行时间不是最短的,但是相比LSTM预测方法来说大大的减少了训练时间,说明使用BP算法结合降维和充分增量学习进行能耗预测,效果最好。将BP算法结合降维和充分增量学习进行能耗预测的结果与使用原始BP、原始LSTM以及原始SVR方法进行能耗预测的结果相比,如表5所示,可以看到本发明所提方法的RMSE值远远小于使用原始方法进行能耗预测的RMSE值,其中本发明所使用的方法比原始BP的RMSE值小0.018945,比原始LSTM的RMSE值小2.491674,比原始SVR的RMSE值小1.047864,所以本发明使用的降维和充分增量学习的方法实现了对数据的高效利用。但是从运行时间来看,由于进行了充分的增量学习,所以相比原始BP方法进行能耗预测,所使用的时间较长,但整体来看,运行时间适中,因此,本发明所提的加权核主成分分析法和充分增量学习与BP算法的结合对能耗预测是有效的,满足数据不断更新的能耗预测的需求。
3、结论
为了避免轮毂在生产时对能耗的浪费,本发明将降维、增量学习和能耗预测的方法相结合,首先通过加权核主成分分析法在充分利用型号信息的同时,对其他参数进行降维,然后通过计算相似度值并判断进行循环多次的增量学习,最后使用BP算法对能耗进行预测,并使用RMSE作为评价指标进行评价,从而实现了高效的增量学习和准确的能耗预测。由实验结果分析可知,通过充分增量学习可以让数据更加高效地使用,同时与加权核主成分分析法以及BP算法相结合,能耗预测的RMSE值为0.000112,分别比结合加权核主成分分析法和充分增量学习的LSTM算法、结合加权核主成分分析法和充分增量学习的SVR算法、直接使用原始BP算法、直接使用LSTM算法以及直接使用SVR算法分别小0.07856、0.240259、0.018945、2.491674、1.047864。所以本发明的方法能够实现对轮毂准确的能耗预测。

Claims (3)

1.一种基于充分增量学习的能耗预测方法,其特征在于,包括下述步骤:
(1)对能耗数据的多维参数进行整理,并提取出不同轮毂的型号;
(2)对整理好的能耗数据采用加权核主成分分析法进行降维;
所述步骤(2)中,加权核主成分分析法的权重是以不同轮毂的型号作为标签用于权值进行计算的,通过将标签的信息值融合在核矩阵中构造加权核矩阵,加权核矩阵中数据对应的权值为
Figure FDA0002970654170000011
其中ui表示第i个样本对应的权值向量;
(3)将降维后的数据划分为训练数据和测试数据,对训练数据进行分组后赋予初始权重值;
(4)对第一组训练样本及权重值进行增量学习的首轮学习,并计算得到第一组训练数据的平均相似度值;
(5)将剩余数据不断输入到增量学习的模型中,通过分别与第一组训练数据比较判断相似度值进行不同操作;
(6)当样本之间的相似度大于平均相似度值时,增大现有样本权重值;当样本之间的相似度值小于平均相似度值时,减小现有样本的权重值,并统一存在一起用于下一轮的增量学习,通过多轮增量学习实现充分的增量学习;
(7)在进行上述操作的过程中,每一轮增量学习的阈值参数、数据样本及权重值都会随着数据的不同进行调整;
(8)当某次用于增量学习的数据平均相似度值小于初始平均相似度值的1/2时,增量学习结束,此时,删除所有权重值小于初始权重值1/2的数据;
(9)将得到的数据输入到BP神经网络中进行能耗预测;
(10)采用评价指标均方误差根RMSE对能耗预测结果进行评价。
2.根据权利要求1所述的基于充分增量学习的能耗预测方法,其特征在于:所述步骤(5)中,将欧式距离用于计算多维数据的相似度值,相似度值计算公式如下:
Figure FDA0002970654170000021
其中dist(x,y)表示新增特征x和现有特征y两个不同故障特征的欧氏距离,即
Figure FDA0002970654170000022
其中,xi和yi代表新增特征x的第i个值和现有特征y的第i个值,x和y之间的差异性越小,欧式距离越小,则相似度值越大,以此衡量新增特征与现有特征之间的相似度。
3.根据权利要求1所述的基于充分增量学习的能耗预测方法,其特征在于:所述步骤(6)中充分的增量学习的过程包括下述步骤:
首先赋予全部数据初始权重值,其次计算第一组数据之间的相似度值,计算得到平均相似度值,然后将其余新增数据分别与第一组数据计算相似度值,当大于已有平均相似度值时,增大现有样本的权重值;当小于已有平均相似度值时,减小现有样本的权重值并将所有数据存到一起,用于进行下一轮的增量学习;在下一轮的增量学习中,首先将已有数据分组,其次计算第一组数据之间的相似度值,计算得到平均相似度值,然后将其余新增数据分别与第一组数据计算相似度值,当大于该平均相似度值时,增大现有样本的权重值;当小于该平均相似度值时,减小现有样本的权重值并将所有数据存到一起,用于进行下一轮的增量学习,直到某次用于增量学习的数据平均相似度值小于初始平均相似度值的1/2时,增量学习结束,此时,删除所有权重值小于初始权重值1/2的数据,完成充分增量学习的全过程。
CN202010723405.3A 2020-07-24 2020-07-24 基于充分增量学习的能耗预测方法 Active CN111832839B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010723405.3A CN111832839B (zh) 2020-07-24 2020-07-24 基于充分增量学习的能耗预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010723405.3A CN111832839B (zh) 2020-07-24 2020-07-24 基于充分增量学习的能耗预测方法

Publications (2)

Publication Number Publication Date
CN111832839A CN111832839A (zh) 2020-10-27
CN111832839B true CN111832839B (zh) 2021-04-30

Family

ID=72924843

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010723405.3A Active CN111832839B (zh) 2020-07-24 2020-07-24 基于充分增量学习的能耗预测方法

Country Status (1)

Country Link
CN (1) CN111832839B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112613650B (zh) * 2020-12-14 2022-06-28 燕山大学 一种新型三阶段短期电力负荷预测方法
CN115032891B (zh) * 2022-08-11 2022-11-08 科大智能物联技术股份有限公司 一种基于时间序列预测的多晶硅还原炉控制方法
CN116996076B (zh) * 2023-09-27 2023-12-19 湖北华中电力科技开发有限责任公司 一种用于校园设备的电气能耗数据智能管理方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110901648A (zh) * 2018-09-13 2020-03-24 通用汽车环球科技运作有限责任公司 用于实时生态路线选择和自适应驱动控制的车辆、系统和逻辑
CN111260138A (zh) * 2020-01-18 2020-06-09 湖南大学 加权和自适应并行关联规则的火电机组能耗动态优化方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100763551B1 (ko) * 2006-11-15 2007-10-04 삼성전자주식회사 무선 근거리 네트워크의 pca 방식에서 경합 감소 장치및 그 방법
CN104462846B (zh) * 2014-12-22 2017-11-10 山东鲁能软件技术有限公司 一种基于支持向量机的设备故障智能诊断方法
CN104463381B (zh) * 2015-01-04 2017-12-08 福州大学 基于kpca与wlssvm的建筑能耗预测方法
CN106778795A (zh) * 2015-11-24 2017-05-31 华为技术有限公司 一种基于增量学习的分类方法及装置
CN107316046B (zh) * 2017-03-09 2020-08-25 河北工业大学 一种基于增量补偿动态自适应增强的故障诊断方法
CN107784325B (zh) * 2017-10-20 2020-06-23 河北工业大学 基于数据驱动增量融合的螺旋式故障诊断方法
CN110070145B (zh) * 2019-04-30 2021-04-27 天津开发区精诺瀚海数据科技有限公司 基于增量聚类的lstm轮毂单品能耗预测

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110901648A (zh) * 2018-09-13 2020-03-24 通用汽车环球科技运作有限责任公司 用于实时生态路线选择和自适应驱动控制的车辆、系统和逻辑
CN111260138A (zh) * 2020-01-18 2020-06-09 湖南大学 加权和自适应并行关联规则的火电机组能耗动态优化方法

Also Published As

Publication number Publication date
CN111832839A (zh) 2020-10-27

Similar Documents

Publication Publication Date Title
CN111738512B (zh) 一种基于cnn-ipso-gru混合模型的短期电力负荷预测方法
CN111832839B (zh) 基于充分增量学习的能耗预测方法
CN111027772B (zh) 基于pca-dbilstm的多因素短期负荷预测方法
CN109461025B (zh) 一种基于机器学习的电能替代潜在客户预测方法
CN111860982A (zh) 一种基于vmd-fcm-gru的风电场短期风电功率预测方法
CN111260136A (zh) 一种基于arima-lstm组合模型的楼宇短期负荷预测方法
Cui et al. Research on power load forecasting method based on LSTM model
CN113205207A (zh) 一种基于XGBoost算法的用电短期负荷波动预测方法及系统
CN102789539B (zh) 一种飞行器升力面结构优化设计方法
CN113762387B (zh) 一种基于混合模型预测的数据中心站多元负荷预测方法
CN111861013A (zh) 一种电力负荷预测方法及装置
CN116757057A (zh) 基于pso-ga-lstm模型的空气质量预测方法
CN113139596A (zh) 低压台区线损神经网络的优化算法
CN115759415A (zh) 基于lstm-svr的用电需求预测方法
CN112508286A (zh) 一种基于Kmeans-BiLSTM-DMD模型的短期负荷预测方法
CN115995810A (zh) 一种考虑气象波动自适应匹配的风电功率预测方法及系统
CN115358437A (zh) 基于卷积神经网络的供电负荷预测方法
CN114912195A (zh) 一种商用车空气动力学序列优化方法
CN110956304A (zh) 一种基于ga-rbm的分布式光伏发电量短期预测方法
CN115099461A (zh) 基于双分支特征提取的太阳辐射预测方法及系统
CN113033898A (zh) 基于k均值聚类与bi-lstm神经网络的电负荷预测方法及系统
CN112288187A (zh) 一种基于大数据的售电量预测方法
CN112330051A (zh) 一种基于Kmeans与FR-DBN的短期负荷预测方法
CN112232570A (zh) 一种正向有功总电量预测方法、装置及可读存储介质
Guo et al. Mobile user credit prediction based on lightgbm

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant