CN111639821A - 一种水泥炉窑生产能耗预测方法及系统 - Google Patents

一种水泥炉窑生产能耗预测方法及系统 Download PDF

Info

Publication number
CN111639821A
CN111639821A CN202010518391.1A CN202010518391A CN111639821A CN 111639821 A CN111639821 A CN 111639821A CN 202010518391 A CN202010518391 A CN 202010518391A CN 111639821 A CN111639821 A CN 111639821A
Authority
CN
China
Prior art keywords
energy consumption
value
sample
model
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010518391.1A
Other languages
English (en)
Inventor
丁志阳
丁孝华
谢丰
李延满
赵景涛
黄堃
杨文�
王海龙
梁加本
顾芳紫
魏小林
赵京
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Mechanics of CAS
Nari Technology Co Ltd
Original Assignee
Institute of Mechanics of CAS
Nari Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Mechanics of CAS, Nari Technology Co Ltd filed Critical Institute of Mechanics of CAS
Priority to CN202010518391.1A priority Critical patent/CN111639821A/zh
Publication of CN111639821A publication Critical patent/CN111639821A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/04Manufacturing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/30Noise filtering
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • General Engineering & Computer Science (AREA)
  • Marketing (AREA)
  • Software Systems (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Biology (AREA)
  • Development Economics (AREA)
  • Molecular Biology (AREA)
  • Game Theory and Decision Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Computing Systems (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Medical Informatics (AREA)
  • Computer Hardware Design (AREA)
  • Geometry (AREA)
  • Manufacturing & Machinery (AREA)
  • Primary Health Care (AREA)

Abstract

本发明公开了一种水泥炉窑生产能耗预测方法及系统,采用集成算法的思想组合神经网络,建立预测精度高于单个神经网络模型的水泥炉窑生产集成能耗模型。在用集成模型预测能耗时采用马尔科夫修正法,使模型的能耗预测值更加贴近实际值,为水泥生产过程的能耗监管提供了更精确的参考依据。

Description

一种水泥炉窑生产能耗预测方法及系统
技术领域
本发明属于水泥炉窑生产能耗建模技术领域,具体涉及一种水泥炉窑生产能耗预测方法,还涉及一种采用此预测方法的预测系统。
背景技术
目前,水泥生产已经成为我国国民经济的支柱产业之一,在基础设施建设中水泥起着不可替代的作用,水泥生产市场化竞争日益激烈,水泥生产工艺流程优化与节能环保需求日益突出。而建立水泥生产的能耗预测模型是减少电能消耗与污染物排放,提高水泥生产过程的品质和效率的前提条件。
当前国内外许多研究人员对水泥炉窑的能耗建模进行了深入研究,归纳起来,建模方法可分为基于机理建模和基于数据建模两类。在机理建模研究方面,主要是从分析炉窑内煅烧过程的化学物理反应出发,研究建立能消耗量与水泥炉窑主要参数之间的精确数学表达式。但是由于水泥炉窑煅烧涉及众多环节与设备,参数具有变量多,关联性强等特点,难以准确表达许多物理化学反应机理,建模时只能利用逼近假设等方法,无法准确地描述烧成系统主要参数与能耗的关系。在数据建模研究方面,相关学者主要是采用专家系统、模糊系统、人工神经网络等人工智能的方法对水泥炉窑的能耗建模进行研究,比如:现有发明专利201810910130.7提出了一种基于卷积神经网络的水泥烧成过程多能耗指标预测方法,建立的CNN模型,以能耗相关变量作为网络输入,对水泥烧成系统的单位电耗和吨煤耗进行联合预测,及时的为水泥烧成过程提供调度依据,同时避免了仅仅预测单一能耗不全面的问题,预测结果更贴近综合能耗实际情况。现有发明专利201710990534.7提出了一种隐含时间序列深度信念网络的水泥生产电耗预测方法,建立HTS-DBN模型,对模型进行无监督的前向训练,确定初始权值和偏置;采用BP反向误差修正算法对整个神经网络进行有监督的反向微调。解决了时变时延问题,能够精确的预测水泥生产电耗量,对水泥生产的科学生产调度和合理的能源规划提供依据。
目前在采用人工神经网络对水泥炉窑的能耗建模中,存在着单个人工神经网络模型精度不高,预测准确性不足的问题,不利于有效地实现节能减排和提高水泥生产的生产品质。
发明内容
本发明的目的在于克服现有技术中的不足,提供了一种水泥炉窑生产能耗预测方法及装置,采用集成算法的思想组合4个神经网络的能耗预测结果,并采用马尔科夫修正法修正预测值,获得更准确的能耗预测值。
为解决上述技术问题,本发明提供了一种水泥炉窑生产能耗预测方法,其特征是,包括以下过程:
获取水泥炉窑关键参数数据及对应的电能消耗数据作为样本数据集;
对样本数据集进行预处理;并将样本数据集分成训练样本集和测试样本集;
利用训练样本集训练集成能耗模型;利用测试样本集输入集成能耗模型得到对应的能耗预测值;
采用马尔科夫修正法修正能耗预测值得到修正后的最终预测值。
进一步的,所述预处理包括剔除缺失值、剔除噪声和降维处理。
进一步的,所述降维处理包括:
采用平均影响值法进行降维处理,具体包括以下过程:
1)将训练样本集P中的数据列Pj,j=1,2,3,.....n的每个数值在原来基础上分别加和减10%,形成两个新的数据列
Figure BDA0002531020470000031
Figure BDA0002531020470000032
即:
Figure BDA0002531020470000033
Figure BDA0002531020470000034
2)将由
Figure BDA0002531020470000035
Figure BDA0002531020470000036
组成的两个新的训练样本集进行预测,相应得到两组预测结果
Figure BDA0002531020470000037
Figure BDA0002531020470000038
二者求差后的差值表示变量Pj变化对输出结果产生的影响变化值IVj
Figure BDA0002531020470000039
并对m个样本输出差值IVj求和并取平均,得到第j个输入变量的平均影响值MIVj
Figure BDA00025310204700000310
由于预测的仅是水泥生产的能耗,所以输出结果仅包含能耗值一项,所以IVj=MIVj
3)对MIVj的绝对值按大小降序排列,若排序后的前k个MIV绝对值的累计贡献率满足下式:
Figure BDA00025310204700000311
则选择对应的这k个输入变量可以代表全部输入变量。
进一步的,所述集成能耗模型包括4个RBF神经网络,4个RBF神经网络的输出平均值作为集成能耗模型输出的能耗预测值。
进一步的,所述采用马尔科夫修正法修正能耗预测值得到修正后的最终预测值,包括:
1)按时间序列将测试样本集中的各样本能耗实际值Y1与网络输出预测值Y2比较,求出两者的相对残差值:
Figure BDA0002531020470000041
其中网络输出预测值Y2为四个能耗模型输出的均值。并将相对残差值归一化:
Figure BDA0002531020470000042
其中Zmin为序列中相对残差的最小值,Zmax为序列中相对残差的最大值,Z*为归一化的结果;
2)根据相对残差的大小分布,按需求确定划分区间的个数n,将相对残差值划分出n个状态:
E1,E2,E3,......,En(16)n个状态对应的残差区间为:
Qi∈(ai,bi),i=1,2,...,n (17)
3)求出状态Ei只经1步转移到特定状态Ej的概率:
Figure BDA0002531020470000043
mij为序列中状态Ei经一步转移到状态Ej的次数;
由Pij组合出1步状态转移概率矩阵:
Figure BDA0002531020470000044
由此求出k步状态转移概率矩阵:
Figure BDA0002531020470000051
4)建立马尔科夫链预测模型:
pk+1=p0Ak (21)
其中p0为初始时刻的概率分布,pk+1为k+1时刻的概率分布,由k+1时刻的概率分布可得该时刻对应的状态和残差区间Q∈(Q1,Q2),并根据修正公式:
X1=Y2/1-Q1 ;X2=Y2/1-Q2 (22)
式中:Y2为神经网络预测值,对应的残差区间的上限为Q1,下限为Q2
最后求X1与X2的平均值,即为经马尔科夫修正后的神经网络能耗预测值。
相应的,本发明还提供了一种水泥炉窑生产能耗预测系统,其特征是,包括样本获取模块、样本处理模块、模型预测模块和预测值修正模块,其中:
样本获取模块,用于获取水泥炉窑关键参数数据及对应的电能消耗数据作为样本数据集;
样本处理模块,用于对样本数据集进行预处理;并将样本数据集分成训练样本集和测试样本集;
模型预测模块,用于利用训练样本集训练集成能耗模型;利用测试样本集输入集成能耗模型得到对应的能耗预测值;
预测值修正模块,用于采用马尔科夫修正法修正能耗预测值得到修正后的最终预测值。
进一步的,所述预处理包括剔除缺失值、剔除噪声和降维处理。
进一步的,所述集成能耗模型包括4个RBF神经网络,4个RBF神经网络的输出平均值作为集成能耗模型输出的能耗预测值。
与现有技术相比,本发明所达到的有益效果是:本发明采用集成算法的思想组合神经网络,建立预测精度高于单个神经网络模型的水泥炉窑生产集成能耗模型。在用集成模型预测能耗时采用马尔科夫修正法,使模型的能耗预测值更加贴近实际值,为水泥生产过程的能耗监管提供了更精确的参考依据。
附图说明
图1为平均影响值法的算法流程图;
图2为集成神经网络建立能耗模型的过程示意图;
图3为RBF神经网络的训练过程流程图;
图4为马尔科夫修正法修正能耗预测值的过程示意图;
图5为本发明的整体流程图。
具体实施方式
下面结合附图对本发明作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本发明的保护范围。
本发明的发明构思是:在充分利用神经网络数据挖掘方面优势的同时,采用集成算法的思想组合神经网络,建立精度高于单个神经网络模型的集成能耗模型。在用集成模型预测能耗时采用马尔科夫修正法,即依据历史能耗预测值与实际值的残差,修正神经网络输出的能耗预测值。可以更好地挖掘水泥炉窑烧成系统电能耗变化与相关参数的规律,也为水泥生产过程的能耗监管提供了更精确的参考依据。
实施例
本发明的一种水泥炉窑生产能耗预测方法,具体参见如图5所示,包括以下步骤:
步骤1:获取水泥炉窑关键参数数据及对应的电能消耗数据,作为样本数据集;
采样间隔为5秒,从水泥炉窑分散控制系统(Distributed Control System,DCS)中随机收集4个时间段的关键参数数据及对应的电能消耗数据,每个时间段为2小时,时间段可交叉重叠,为建立包含有4个神经网络的集成模型提供数据集。
所述关键参数包括喂煤量、一氧化碳体积百分数、生料流量、冷却剂鼓风管道压力、入冷却机空气温度、熟料流量等变量值,关键参数数据及对应的电能消耗数据作为实验样本数据集。
步骤2:对样本数据集进行数据预处理,剔除噪声与缺失值,并降维,为建模提供更健全简洁的数据集;
本发明中,所述步骤2是通过下述方式实现的:
2-1)原始样本数据集中存在部分数据组缺失属性值的现象。对于样本集中的属性缺失值,本发明使用邻近数据中的该属性平均值代替,即:
Figure BDA0002531020470000071
其中,xk为k时刻数据组中缺失的属性值,xk-2,xk-1,xk+1,xk+2表示k时刻邻近数据中的该属性值。若缺失值对建模影响不大或数据样本充足,可直接删除含有缺失值的数据样本。
2-2)数据中存在一个变量因受外界干扰而产生随机错误或偏差的现象,即有噪声干扰,噪声的存在影响采集数据的质量。可以选择滑动平均滤波技术对噪声进行处理,滑动平均滤波技术是将连续M个采样值看做一个队列,队列长度固定为M,每次采样到一个新数据放入队尾,并扔掉原来队首的一个数据,并将队列中的M个数据进行算术平均运算,就可获得新的滤波结果,即:
Figure BDA0002531020470000081
xi+j为第i+j个数据的属性值,yi表示经滑动平均滤波技术处理后第i个数据的属性值。
2-3)原始数据具有强耦合性,变量众多等特点,一些对能耗影响不大的变量会增加模型的结构复杂度。可以选用平均影响值法筛选出对能耗输出影响较大的变量作为神经网络的输入变量。
参见图1所示,平均影响值法进行降维处理的具体实现步骤如下:
2-3-1)假设原始样本数据集P共有m个样本,每个样本包含n个变量,即样本集P={P1,P2,....Pn},Pj,j=1,2,3,.....n分别表示喂煤量、一氧化碳体积百分数、生料流量、冷却剂鼓风管道压力、入冷却机空气温度、熟料流量等变量。输出为一个变量Y=[y1,y2,.....ym]表示水泥生产的能耗值。
在RBF神经网络(径向基神经网络)训练结束后,将训练样本集P中的数据列Pj,j=1,2,3,.....n的每个数值在原来基础上分别加和减10%,形成两个新的数据列
Figure BDA0002531020470000082
Figure BDA0002531020470000083
即:
Figure BDA0002531020470000084
Figure BDA0002531020470000085
2-3-2)将由
Figure BDA0002531020470000086
Figure BDA0002531020470000087
组成的两个新的训练样本集利用已训练好的神经网络模型进行预测,相应得到两组预测结果
Figure BDA0002531020470000088
Figure BDA0002531020470000089
二者求差后的差值表示变量Pj变化对输出结果产生的影响变化值IVj
Figure BDA00025310204700000810
并对m个输出差值IVj求和并取平均,得到第j个输入变量的平均影响值MIVj
Figure BDA0002531020470000091
其正负号表示该输入变量与输出变量相关的方向,正号表示该输入变量与输出变量正相关,负号表示该输入变量与输出变量负相关,其绝对值大小表示该输入变量对输出变量的影响程度。本发明中预测的仅是水泥生产的能耗,所以神经网络的输出结果仅包含能耗值一项,所以IVj=MIVj
2-3-3)对MIVj的绝对值按大小降序排列,若排序后的前k个MIV绝对值的累计贡献率满足下式:
Figure BDA0002531020470000092
则选择对应的这k个输入变量可以代表全部输入变量重新构建RBF神经网络建模,其中取η0=85%。
步骤3:在经步骤2处理后的实验样本数据集的基础上,构建训练样本集和测试样本集。
采用五折交叉验证方式训练和验证模型,即:将预处理后重新建立的4组数据集分别均分为五份。每一组中轮流选择其中一份为测试样本集T,其他四份数据为训练样本集P。训练样本集含有m个数据样本。经处理后得到4个训练集P1,P2,P3,P4;4个测试集T1,T2,T3,T4
步骤4:基于步骤3的数据,利用RBF神经网络建立集成能耗模型;
参见图2所示,集成学习的基本思路是使用多个元学习器进行学习,并按照某种规则把多个学习结果进行组合,最终可得到比单个学习器更好的学习效果。本发明采用4个元学习器,采用求平均的方式组合学习结果。即分别用步骤3所得4个训练集与测试集分别训练4个RBF(径向基)神经网络,训练完成后得到4个能够反映不同能耗特征的能耗模型,再组合为集成模型。即所述集成能耗模型包括4个RBF神经网络,4个RBF神经网络的输出平均值作为集成能耗模型的最终输出值。
本发明中,所述步骤4是通过下述方式实现的:
本发明中每个神经网络隐藏层激活函数都选用高斯函数:
Figure BDA0002531020470000101
其中,X表示p个维度为h的输入向量,h是隐藏层中心点的个数,βj表示隐藏层的中心宽度,cj表示第j个径向基函数的中心点,||X-cj||2表示向量X-cj的欧几里德范数的平方,即为输入样本点与中心点的距离。
RBF神经网络的训练过程流程图参见图3所示,包括:
4-1)非监督学习阶段使用K-means聚类算法确定RBF的中心点。
具体包含以下步骤:
4-1-1:从输入样本集中随机选取N个样本作为初始的中心点:c1,c2,c3,......,cN
4-1-2:计算每一个输入样本与这N个中心点的欧式距离
dj=||X-cj||,j=1,2,3,4,......,N (9)
并将每一个样本逐个划分到与其距离dj最近的中心点所在的簇中。再计算各个簇中的样本点均值,并将均值作为新的中心点。
4-1-3:重复过程4-1-2,直至中心点不再有明显变化,即达到训练要求。
4-2)监督学习阶段使用梯度下降法修正隐藏层与输出层间的权重。
具体包含以下步骤:
4-2-1:初始化权值,并设定的准确率限值ε,
4-2-2:计算神经网络输出值:
Figure BDA0002531020470000111
其中y是输出单元,b表示隐藏层和输出层之间的偏置,wj表示隐藏层到输出层的权值。并求出误差目标函数的值:
Figure BDA0002531020470000112
其中,P表示输入训练样本的个数,ei为第i个样本输入后产生的误差量。为使总误差函数E达到最小值,权重修正量应和其负梯度成正比。
4-2-3:若误差小于准确率限值(E<ε,ε为准确率限值,E为误差目标函数的值),则训练结束;否则计算权值修正量Δw:
Figure BDA0002531020470000113
并更新权值wk+1=wk+Δw,然后转向4-2-2,其中的G为高斯函数。
4-3:将测试样本输入网络后,网络预测输出为Y,测试样本中采集到的实际能耗值为
Figure BDA0002531020470000115
本发明模型预测准确率为:
Figure BDA0002531020470000114
若p值偏离1较多,即准确率较低,可对RBF网络的隐层神经元个数适当调整。若p值接近1,即完成了4个神经网络的训练,得到4个能够反映不同能耗特征的能耗模型。
4-4:对四个能耗模型求平均得到集成能耗模型,即对四个模型的输出预测结果求平均值得到最终的网络输出。
步骤5:基于建立的集成能耗模型进行能耗预测,水泥生产过程的能耗值经采样后得到的是一组按时间序列的离散数据,本发明采用马尔科夫修正法,即依据时间序列中能耗预测值与实际值的残差,修正神经网络输出的能耗预测值。
本发明中,所述步骤5实现过程参见图4所示,是通过下述方式实现的:
5-1:按时间序列将测试样本集中的各样本能耗实际值Y1与网络输出预测值Y2比较,求出两者的相对残差值:
Figure BDA0002531020470000121
其中网络输出预测值Y2为四个能耗模型输出的均值。并将相对残差值归一化:
Figure BDA0002531020470000122
其中Zmin为序列中相对残差的最小值,Zmax为序列中相对残差的最大值,Z*为归一化的结果。
5-2:根据相对残差的大小分布,按需求确定划分区间的个数n,将相对残差值划分出n个状态:
E1,E2,E3,......,En (16)
n个状态对应的残差区间为:
Qi∈(ai,bi),i=1,2,...,n (17)
5-3:求出状态Ei只经1步转移到特定状态Ej的概率:
Figure BDA0002531020470000123
mij为序列中状态Ei经一步转移到状态Ej的次数。
由Pij组合出1步状态转移概率矩阵:
Figure BDA0002531020470000131
由此求出k步状态转移概率矩阵:
Figure BDA0002531020470000132
5-4:建立马尔科夫链预测模型:
pk+1=p0Ak (21)
其中p0为初始时刻的概率分布(例如,若p0时刻对应的残差状态为E1,概率分布表示为[1,0,0,...,0]。若p0时刻对应的残差状态为E2,概率分布表示为[0,1,0,...,0]。),pk+1为k+1时刻的概率分布,由k+1时刻的概率分布可得该时刻对应的状态和残差区间Q∈(Q1,Q2),并根据修正公式:
X1=Y2/1-Q1 ;X2=Y2/1-Q2 (22)
式中:Y2为神经网络预测值,对应的残差区间的上限为Q1,下限为Q2。最后求X1与X2的平均值,即为经马尔科夫修正后的神经网络能耗预测值。对预测值进行马尔科夫修正,可为水泥生产过程的能耗监管提供更精确的参考依据。
本发明提供一种水泥炉窑生产能耗预测方法,采用集成算法的思想组合神经网络,建立精度高于单个神经网络模型的水泥炉窑生产集成能耗模型。在用集成模型预测能耗时采用马尔科夫修正法,使模型的能耗预测值更加贴近实际值,为水泥生产过程的能耗监管提供了更精确的参考依据。
实施例
相应的,本发明还提供了一种水泥炉窑生产能耗预测系统,其特征是,包括样本获取模块、样本处理模块、模型预测模块和预测值修正模块,其中:
样本获取模块,用于获取水泥炉窑关键参数数据及对应的电能消耗数据作为样本数据集;
样本处理模块,用于对样本数据集进行预处理;并将样本数据集分成训练样本集和测试样本集;
模型预测模块,用于利用训练样本集训练集成能耗模型;利用测试样本集输入集成能耗模型得到对应的能耗预测值;
预测值修正模块,用于采用马尔科夫修正法修正能耗预测值得到修正后的最终预测值。
进一步的,所述预处理包括剔除缺失值、剔除噪声和降维处理。
进一步的,所述降维处理包括:
采用平均影响值法进行降维处理,具体包括以下过程:
1)将训练样本集P中的数据列Pj,j=1,2,3,.....n的每个数值在原来基础上分别加和减10%,形成两个新的数据列
Figure BDA0002531020470000141
Figure BDA0002531020470000142
即:
Figure BDA0002531020470000143
Figure BDA0002531020470000144
2)将由
Figure BDA0002531020470000145
Figure BDA0002531020470000146
组成的两个新的训练样本集进行预测,相应得到两组预测结果
Figure BDA0002531020470000147
Figure BDA0002531020470000148
二者求差后的差值表示变量Pj变化对输出结果产生的影响变化值IVj
Figure BDA0002531020470000149
并对m个样本输出差值IVj求和并取平均,得到第j个输入变量的平均影响值MIVj
Figure BDA0002531020470000151
由于预测的仅是水泥生产的能耗,所以输出结果仅包含能耗值一项,所以IVj=MIVj
3)对MIVj的绝对值按大小降序排列,若排序后的前k个MIV绝对值的累计贡献率满足下式:
Figure BDA0002531020470000152
则选择对应的这k个输入变量可以代表全部输入变量。
进一步的,所述集成能耗模型包括4个RBF神经网络,4个RBF神经网络的输出平均值作为集成能耗模型输出的能耗预测值。
进一步的,预测值修正模块中,所述采用马尔科夫修正法修正能耗预测值得到修正后的最终预测值,包括:
1)按时间序列将测试样本集中的各样本能耗实际值Y1与网络输出预测值Y2比较,求出两者的相对残差值:
Figure BDA0002531020470000153
其中网络输出预测值Y2为四个能耗模型输出的均值。并将相对残差值归一化:
Figure BDA0002531020470000154
其中Zmin为序列中相对残差的最小值,Zmax为序列中相对残差的最大值,Z*为归一化的结果;
2)根据相对残差的大小分布,按需求确定划分区间的个数n,将相对残差值划分出n个状态:
E1,E2,E3,......,En (16)
n个状态对应的残差区间为:
Qi∈(ai,bi),i=1,2,...,n (17)
3)求出状态Ei只经1步转移到特定状态Ej的概率:
Figure BDA0002531020470000161
mij为序列中状态Ei经一步转移到状态Ej的次数;
由Pij组合出1步状态转移概率矩阵:
Figure BDA0002531020470000162
由此求出k步状态转移概率矩阵:
Figure BDA0002531020470000163
4)建立马尔科夫链预测模型:
pk+1=p0Ak (21)
其中p0为初始时刻的概率分布,pk+1为k+1时刻的概率分布,由k+1时刻的概率分布可得该时刻对应的状态和残差区间Q∈(Q1,Q2),并根据修正公式:
X1=Y2/1-Q1 ;X2=Y2/1-Q2 (22)
式中:Y2为神经网络预测值,对应的残差区间的上限为Q1,下限为Q2
最后求X1与X2的平均值,即为经马尔科夫修正后的神经网络能耗预测值。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和变型,这些改进和变型也应视为本发明的保护范围。

Claims (8)

1.一种水泥炉窑生产能耗预测方法,其特征是,包括以下过程:
获取水泥炉窑关键参数数据及对应的电能消耗数据作为样本数据集;
对样本数据集进行预处理;并将样本数据集分成训练样本集和测试样本集;
利用训练样本集训练集成能耗模型;利用测试样本集输入集成能耗模型得到对应的能耗预测值;
采用马尔科夫修正法修正能耗预测值得到修正后的最终预测值。
2.根据权利要求1所述的一种水泥炉窑生产能耗预测方法,其特征是,所述预处理包括剔除缺失值、剔除噪声和降维处理。
3.根据权利要求1所述的一种水泥炉窑生产能耗预测方法,其特征是,所述降维处理包括:
采用平均影响值法进行降维处理,具体包括以下过程:
1)将训练样本集P中的数据列Pj,j=1,2,3,.....n的每个数值在原来基础上分别加和减10%,形成两个新的数据列
Figure FDA0002531020460000011
Figure FDA0002531020460000012
即:
Figure FDA0002531020460000013
Figure FDA0002531020460000014
2)将由
Figure FDA0002531020460000015
Figure FDA0002531020460000016
组成的两个新的训练样本集进行预测,相应得到两组预测结果
Figure FDA0002531020460000017
Figure FDA0002531020460000018
二者求差后的差值表示变量Pj变化对输出结果产生的影响变化值IVj
Figure FDA0002531020460000019
并对m个样本输出差值IVj求和并取平均,得到第j个输入变量的平均影响值MIVj
Figure FDA0002531020460000021
由于预测的仅是水泥生产的能耗,所以输出结果仅包含能耗值一项,所以IVj=MIVj
3)对MIVj的绝对值按大小降序排列,若排序后的前k个MIV绝对值的累计贡献率满足下式:
Figure FDA0002531020460000022
则选择对应的这k个输入变量可以代表全部输入变量。
4.根据权利要求1所述的一种水泥炉窑生产能耗预测方法,其特征是,所述集成能耗模型包括4个RBF神经网络,4个RBF神经网络的输出平均值作为集成能耗模型输出的能耗预测值。
5.根据权利要求1所述的一种水泥炉窑生产能耗预测方法,其特征是,所述采用马尔科夫修正法修正能耗预测值得到修正后的最终预测值,包括:
1)按时间序列将测试样本集中的各样本能耗实际值Y1与网络输出预测值Y2比较,求出两者的相对残差值:
Figure FDA0002531020460000023
其中网络输出预测值Y2为四个能耗模型输出的均值。并将相对残差值归一化:
Figure FDA0002531020460000024
其中Zmin为序列中相对残差的最小值,Zmax为序列中相对残差的最大值,Z*为归一化的结果;
2)根据相对残差的大小分布,按需求确定划分区间的个数n,将相对残差值划分出n个状态:
E1,E2,E3,......,En (16)
n个状态对应的残差区间为:
Qi∈(ai,bi),i=1,2,...,n (17)
3)求出状态Ei只经1步转移到特定状态Ej的概率:
Figure FDA0002531020460000031
mij为序列中状态Ei经一步转移到状态Ej的次数;
由Pij组合出1步状态转移概率矩阵:
Figure FDA0002531020460000032
由此求出k步状态转移概率矩阵:
Figure FDA0002531020460000033
4)建立马尔科夫链预测模型:
pk+1=p0Ak (21)
其中p0为初始时刻的概率分布,pk+1为k+1时刻的概率分布,由k+1时刻的概率分布可得该时刻对应的状态和残差区间Q∈(Q1,Q2),并根据修正公式:
X1=Y2/1-Q1;X2=Y2/1-Q2 (22)
式中:Y2为神经网络预测值,对应的残差区间的上限为Q1,下限为Q2
最后求X1与X2的平均值,即为经马尔科夫修正后的神经网络能耗预测值。
6.一种水泥炉窑生产能耗预测系统,其特征是,包括样本获取模块、样本处理模块、模型预测模块和预测值修正模块,其中:
样本获取模块,用于获取水泥炉窑关键参数数据及对应的电能消耗数据作为样本数据集;
样本处理模块,用于对样本数据集进行预处理;并将样本数据集分成训练样本集和测试样本集;
模型预测模块,用于利用训练样本集训练集成能耗模型;利用测试样本集输入集成能耗模型得到对应的能耗预测值;
预测值修正模块,用于采用马尔科夫修正法修正能耗预测值得到修正后的最终预测值。
7.根据权利要求6所述的一种水泥炉窑生产能耗预测系统,其特征是,所述预处理包括剔除缺失值、剔除噪声和降维处理。
8.根据权利要求6所述的一种水泥炉窑生产能耗预测系统,其特征是,所述集成能耗模型包括4个RBF神经网络,4个RBF神经网络的输出平均值作为集成能耗模型输出的能耗预测值。
CN202010518391.1A 2020-06-09 2020-06-09 一种水泥炉窑生产能耗预测方法及系统 Pending CN111639821A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010518391.1A CN111639821A (zh) 2020-06-09 2020-06-09 一种水泥炉窑生产能耗预测方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010518391.1A CN111639821A (zh) 2020-06-09 2020-06-09 一种水泥炉窑生产能耗预测方法及系统

Publications (1)

Publication Number Publication Date
CN111639821A true CN111639821A (zh) 2020-09-08

Family

ID=72329965

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010518391.1A Pending CN111639821A (zh) 2020-06-09 2020-06-09 一种水泥炉窑生产能耗预测方法及系统

Country Status (1)

Country Link
CN (1) CN111639821A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114545866A (zh) * 2020-11-11 2022-05-27 台泥资讯股份有限公司 控制煤耗系统的方法
CN117132170A (zh) * 2023-10-24 2023-11-28 苏州科尔珀恩机械科技有限公司 一种数字化窑炉生产能耗智能预测方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
吕鹏飞等: "船舶交通量的BP神经网络_马尔科夫预测模型", 《上海海事大学学报》 *
高倩: "基于大数据的能耗特性分析方法研究", 《中国优秀硕士学位论文全文数据库》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114545866A (zh) * 2020-11-11 2022-05-27 台泥资讯股份有限公司 控制煤耗系统的方法
CN117132170A (zh) * 2023-10-24 2023-11-28 苏州科尔珀恩机械科技有限公司 一种数字化窑炉生产能耗智能预测方法
CN117132170B (zh) * 2023-10-24 2024-01-26 苏州科尔珀恩机械科技有限公司 一种数字化窑炉生产能耗智能预测方法

Similar Documents

Publication Publication Date Title
CN110378044B (zh) 基于注意力机制的多时间尺度卷积神经网络软测量方法
Jiang et al. Abnormality monitoring in the blast furnace ironmaking process based on stacked dynamic target-driven denoising autoencoders
CN110245850B (zh) 一种考虑时序的烧结过程工况识别方法及系统
Zhang et al. Local parameter optimization of LSSVM for industrial soft sensing with big data and cloud implementation
CN112749840B (zh) 一种火电机组能效特征指标基准值的获取方法
CN111639821A (zh) 一种水泥炉窑生产能耗预测方法及系统
CN114678080B (zh) 转炉终点磷含量预测模型及构建方法、磷含量预测方法
CN113095550A (zh) 基于变分递归网络和自注意力机制的空气质量预测方法
CN113589693B (zh) 基于邻域优化的水泥工业分解炉温度模型预测控制方法
CN110674965A (zh) 基于动态特征选取的多时间步长风功率预测方法
CN110910277A (zh) 一种基于XGBoost的水泥磨系统电耗指标预测方法
CN113177358B (zh) 一种基于模糊细粒度特征提取的水泥质量软测量方法
CN111639820A (zh) 一种水泥炉窑生产的能耗参数优化方法及系统
CN114282443A (zh) 基于mlp-lstm有监督联合模型的剩余使用寿命预测方法
CN111008224A (zh) 一种基于深度多任务表示学习的时间序列分类和检索方法
CN111507365A (zh) 一种基于模糊聚类的置信规则自动生成方法
Yang et al. Forecasting of iron ore sintering quality index: A latent variable method with deep inner structure
CN112668234A (zh) 一种转炉炼钢终点智能控制方法
CN114218872A (zh) 基于dbn-lstm半监督联合模型的剩余使用寿命预测方法
Liu et al. Model fusion and multiscale feature learning for fault diagnosis of industrial processes
CN113204918B (zh) 水泥窑生产能耗的建模方法
CN115062528A (zh) 一种针对工业过程时序数据的预测方法
Hong et al. Convolutional neural network for control chart patterns recognition
Wang et al. A new input variable selection method for soft sensor based on stacked auto-encoders
WO2022059753A1 (ja) 溶解炉のエネルギー効率を予測する学習済み予測モデルを生成する方法、溶解炉のエネルギー効率を予測する方法、およびコンピュータプログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20200908