CN112949162B - 基于数据驱动的箱板纸机干燥部能量系统运行优化方法 - Google Patents
基于数据驱动的箱板纸机干燥部能量系统运行优化方法 Download PDFInfo
- Publication number
- CN112949162B CN112949162B CN202110095976.1A CN202110095976A CN112949162B CN 112949162 B CN112949162 B CN 112949162B CN 202110095976 A CN202110095976 A CN 202110095976A CN 112949162 B CN112949162 B CN 112949162B
- Authority
- CN
- China
- Prior art keywords
- paper
- data
- model
- exhaust
- correlation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 239000000123 paper Substances 0.000 title claims abstract description 82
- 238000001035 drying Methods 0.000 title claims abstract description 55
- 238000000034 method Methods 0.000 title claims abstract description 53
- 239000011111 cardboard Substances 0.000 title claims description 8
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 34
- 238000004519 manufacturing process Methods 0.000 claims abstract description 30
- 238000005265 energy consumption Methods 0.000 claims abstract description 25
- 238000005457 optimization Methods 0.000 claims abstract description 17
- 230000002068 genetic effect Effects 0.000 claims abstract description 11
- 238000010801 machine learning Methods 0.000 claims abstract description 7
- 239000011087 paperboard Substances 0.000 claims abstract description 7
- 238000007781 pre-processing Methods 0.000 claims abstract description 7
- 241000274582 Pycnanthus angolensis Species 0.000 claims abstract description 5
- 238000012795 verification Methods 0.000 claims abstract description 4
- 238000004364 calculation method Methods 0.000 claims description 21
- 229920006395 saturated elastomer Polymers 0.000 claims description 13
- 238000004513 sizing Methods 0.000 claims description 13
- 238000004458 analytical method Methods 0.000 claims description 5
- 238000011156 evaluation Methods 0.000 claims description 5
- 238000010219 correlation analysis Methods 0.000 claims description 3
- 230000005611 electricity Effects 0.000 claims description 3
- 238000005192 partition Methods 0.000 claims 3
- 238000012935 Averaging Methods 0.000 claims 1
- 238000010202 multivariate logistic regression analysis Methods 0.000 claims 1
- 230000008901 benefit Effects 0.000 abstract description 5
- 230000006870 function Effects 0.000 description 25
- 238000003066 decision tree Methods 0.000 description 8
- 238000005070 sampling Methods 0.000 description 8
- 238000012549 training Methods 0.000 description 8
- 239000010410 layer Substances 0.000 description 6
- 238000012417 linear regression Methods 0.000 description 4
- 239000002131 composite material Substances 0.000 description 3
- 239000007789 gas Substances 0.000 description 3
- 229920002430 Fibre-reinforced plastic Polymers 0.000 description 2
- 101001095088 Homo sapiens Melanoma antigen preferentially expressed in tumors Proteins 0.000 description 2
- 102100037020 Melanoma antigen preferentially expressed in tumors Human genes 0.000 description 2
- 238000001704 evaporation Methods 0.000 description 2
- 230000008020 evaporation Effects 0.000 description 2
- 239000011151 fibre-reinforced plastic Substances 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 238000000491 multivariate analysis Methods 0.000 description 2
- 238000003825 pressing Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000007637 random forest analysis Methods 0.000 description 2
- 238000011084 recovery Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 206010008469 Chest discomfort Diseases 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 238000013386 optimize process Methods 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 239000002344 surface layer Substances 0.000 description 1
- 238000009423 ventilation Methods 0.000 description 1
- 239000002912 waste gas Substances 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- D—TEXTILES; PAPER
- D21—PAPER-MAKING; PRODUCTION OF CELLULOSE
- D21G—CALENDERS; ACCESSORIES FOR PAPER-MAKING MACHINES
- D21G9/00—Other accessories for paper-making machines
- D21G9/0009—Paper-making control systems
- D21G9/0036—Paper-making control systems controlling the press or drying section
-
- D—TEXTILES; PAPER
- D21—PAPER-MAKING; PRODUCTION OF CELLULOSE
- D21G—CALENDERS; ACCESSORIES FOR PAPER-MAKING MACHINES
- D21G9/00—Other accessories for paper-making machines
- D21G9/0009—Paper-making control systems
- D21G9/0054—Paper-making control systems details of algorithms or programs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/12—Computing arrangements based on biological models using genetic models
- G06N3/126—Evolutionary algorithms, e.g. genetic algorithms or genetic programming
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2119/00—Details relating to the type or aim of the analysis or the optimisation
- G06F2119/08—Thermal analysis or thermal optimisation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Physics & Mathematics (AREA)
- Biophysics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Medical Informatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Mathematical Physics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Physiology (AREA)
- Genetics & Genomics (AREA)
- Computational Linguistics (AREA)
- Biomedical Technology (AREA)
- Computer Hardware Design (AREA)
- Geometry (AREA)
- Paper (AREA)
Abstract
本发明公开了一种基于数据驱动的箱板纸机干燥部能量系统运行优化方法,包括以下步骤:S1:数据采集和数据预处理;S2:特征变量选择分析;S3:建立纸页干燥过程关键参数预测模型;S4:基于遗传算法建立干燥部能耗优化模型;S5:模型验证。本发明利用机器学习算法结合历史生产数据建立模型,挖掘生产数据之间的关联性,更好的指导实际生产;通过模型优化干燥部工艺参数,平均蒸汽耗从19kg/s左右降至约17kg/s,平均吨纸成本从130元左右降至115元左右,降低了产品成本,提高了企业效益。
Description
技术领域
本发明涉及一种基于数据驱动的箱板纸机干燥部能量系统运行优化方法,通过优化纸机干燥部工艺参数达到节能降耗,提高效益的目的,属于能源管理技术领域。
背景技术
据中国造纸协会调查资料,2019年全国纸及纸板生产企业约2700家,全国纸及纸板生产量10765万吨,较上年增长3.16%。消费量10704万吨,较上年增长2.54%,人均年消费量为75千克(14.0亿人)。
造纸过程的干燥系统是整个造纸工艺中能耗最大的部分,约占整个纸机能耗的30%-60%,因此做好纸机干燥部的节能十分重要;干燥系统的主要作用是蒸发脱除湿纸幅中残留的水分,进一步完成纸页的纤维结合并提高其强度,是一个复杂的传热传质的过程,涉及的物料和能量传递复杂多样,包括蒸汽加热烘缸表面纸页的干燥、气罩通风、废气热量的回收以及烘缸冷凝水的回收和排放。干燥系统工艺参数的调整需考虑众多生产因素,既需要考虑干燥部前工段成形部、压榨部工艺变化的影响,又需保证干燥工段正常生产的前提条件下,满足后续生产的工艺要求;生产中纸页定量、纸机车速、网压部参数等变化影响干燥部的蒸发效率,通过调整各段蒸汽的进出烘缸压力满足蒸发效率,达到气罩良好通风不发生滴漏现象,出干燥部的纸页干度满足工艺要求。因此干燥工艺参数的调整是一个及其复杂的逻辑过程;当前生产工艺参数的设定和调整仅依赖生产总结和经验判断,缺乏技术理论的指导,部分参数设置不合理,存在能耗高的现象。
利用纸机干燥系统的生产数据与机器学习算法结合,首先建立干燥过程关键参数预测模型,再基于遗传算法建立干燥部能耗优化模型,将复杂的干燥过程通过生产数据建立起来,挖掘各参数之间的关联性,指导工艺参数的调整,达到满足工艺要求,节约成本的目的。
发明内容
为解决目前生产工艺调整存在的问题,本发明提供了一种基于数据驱动的箱板纸机干燥部能量系统运行优化方法,解决了生产中工艺参数调整依靠人工经验,缺乏理论技术指导的问题。
本发明采用的技术方案是,一种基于数据驱动的箱板纸机干燥部能量系统运行优化方法,包括以下步骤:
S1:数据采集和数据预处理;
S2:特征变量选择分析;
S3:建立纸页干燥过程关键参数预测模型;
S4:基于遗传算法建立干燥部能耗优化模型;
S5:模型验证。
模型中步骤S1具体步骤如下:
采集纸机干燥部生产数据,分析能耗状况,纸页干燥过程能耗主要是蒸汽和电,评估存在优化空间。运用箱型图法对数据预处理,将特征数据的四分之一分位值定为Q1,四分之三分位值定为Q3:
其中,IQR为四分位距,limitmax为异常值上限,limitmin为异常值下限。
步骤S2具体步骤如下:
S21.单变量特征选择,运用pearson相关系数法对采集的变量作单变量分析,分析纸机干燥部工艺约束变量、能耗变量与其它变量间的相关性;相关系数是反应两变量之间变化趋势的方向以及程度,用于两个变量之间的相关性分析,取值范围在[-1,1],其绝对值越大,相关性越强;相关系数越接近于1或-1,相关度越强,相关系数越接近于0,相关度越弱。其中,绝对值在0.8-1.0表示极强相关,在0.6-0.8表示强相关,在0.4-0.6表示中等程度相关,0.2-0.4表示弱相关,0-0.2表示极弱相关或无相关。相关系数的计算公式如下:
其中,Cov(X,Y)为X和Y的协方差,Var[X]、Var[Y]分别为X和Y的方差;
S22.多变量特征选择,GBDT算法中的重要性排序可做多变量分析,采用CART作为基学习器,采用基尼指数来选择划分属性(即节点特征),通过基尼系数来选择节点属性,能在候选特征中选择最优特征来划分节点,并使得划分后的误差最小,即得到最优特征。
假定数据集D,由CART决策树作为基学习器建立的组合模型GBT,基学习器个数为K,每个特征节点的基尼指数计算公式如下。
其中,Gini(D)为数据集D的基尼值,pj为样本值j所占的比例,v为样本取值总数,Gini_index(D,a)为属性a在样本集D上的基尼指数;
然后针对每个节点,计算候选特征集S中所有特征的基尼指数,选取使得划分后基尼指数最小的特征mmin作为节点特征。此时,由特征mmin造成的平均不纯度减少值ΔGini,即为该特征的贡献度:
按照上述方式,搜索单个基学习器上所有分裂节点i的贡献度,然后对所有基学习器进行平均,即得到该特征的总体贡献度:
步骤S3具体步骤如下:
S31.依据步骤S21、S22,确定各预测模型特征变量,其中约束变量预测模型7个,分别为:T1排风湿度(T1_EWH)、T1排风温度(T1_EWT)、T2排风湿度(T2_EWH)、T2排风温度(T2_EWT)、T3排风湿度(T3_EWH)、T3排风温度(T3_EWT)、施胶前水分(Hum);能耗变量预测模型1个:干燥部蒸汽流量(DSQ);运用机器学习算法结合生产数据,建立Ridge回归模型、ElasticNet回归模型、SVR回归模型、RF回归模型等。各算法原理如下:
(1)Ridge算法:在线性回归损失函数的基础上加入L2正则项,在不舍弃特征变量的情况下,缩小回归系数,使模型相对稳定,其原理公式如下:
(2)Elastic Net算法:结合使用了系数向量的L1范数和L2范数的线性回归模型,使的可学习类似于Lasso一样稀疏的模型,还保留了Ridge的正则化属性,结合了两者的优点,适用于有多个特征变量彼此相关的模型。其原理公式如下:
(3)SVR算法:支持向量回归算法能够通过将非线性问题以核函数的方式映射到高维空间,从而将非线性问题转变为线性问题,具有较好的非线性处理能力和泛化能力。其原理公式如下:
其中,ω为权重系数,x为输入变量,b为偏置项,αi为拉格朗日乘子,为核函数。核函数可将线性不可分的低维特征数据映射到高维空间,将非线性问题转换为线性问题。常用核函数有线性核函数(Linear)、多项式核函数(Poly)、径向基核函数(RBF)和sigmoid核函数,公式如下:
线性核函数:K(xi,x)=xixT
多项式核函数:K(xi,x)=(γxixT+r)p,γ>0
径向基核函数:K(xi,x)=exp(-γ||xi-x||2),γ>0
sigmoid核函数:K(xi,x)=tan h(γxixT+r),γ>0
其中,γ,r,p为各核函数参数。
(4)RF算法:随机森林由多个随机决策树组成,回归问题中,最终结果取决于各随机决策树的加权。RF算法流程如下:
a.输入训练样本D={(x1,y1),(x2,y2),……,(xm,ym)},弱学习器迭代次数K;
b.对于k=1,2,…K对训练集进行第k次采样,采用自助法(bootstrap)采样,即随机有放回采样,共采集m次,得到采样集本Dk(含m个样本);在采样集Dk上训练第k个决策树模型Gk(x)。在训练该模型时RF只需要在所有样本特征中选择部分特征,最后在所选部分特征中确定节点分裂特征;
c.输出集成模型f(x)。
S32.计算各模型的平均绝对误差(MAPE)、平均相对误差(MAE)、拟合优度(R2)等指标,其中:
步骤S4具体步骤如下:
S41.建立干燥部能耗公式:
Papertonprice=Spre*Psteam*6000/V*Qsbq*Ly
其中Papertonprice表示吨纸耗(yuan/t),Spre表示预测的干燥蒸汽流量(kg/s),V表示纸机车速(m/min),Qsbq施胶前定量(g/m2),Ly表示纸机幅宽(m);
排风机排风温度对应下的饱和湿度公式:
H=0.6228*(Ps/P-Ps)*1000
其式中,A,B,C为Antoine常数,可查数据表得,T表示排风机的排风温度,Ps表示在排风温度下的饱和蒸气压,H表示排风温度下空气的饱和湿度。为防止发生滴露,气罩内空气温度应该维持在露点温度以上,安全起见,气罩内的相对湿度一般不超过饱和湿度的80%,即Hact<0.8H;
S42.生产中纸机干燥部风机的排风温湿度及出干燥部纸页的干度有工艺约束,即要求这些指标在合理的工艺范围内,如下式所示:
T1排风机的排风温度范围:T1min≤T1temp≤T1max
T2排风机的排风温度范围:T2min≤T2temp≤T2max
T3排风机的排风温度范围:T3min≤T3temp≤T3max
H1排风机的排风湿度范围:H1min≤H1hum≤H1max
H2排风机的排风湿度范围:H2min≤H2hum≤H2max
H3排风机的排风湿度范围:H3min≤H3hum≤H3max
施胶前纸页的水分:Mmin≤Mact≤Mmax
其中T1min、T2min、T3min、H1min、H2min、H3min、Mmin表示工艺范围的最低值,T1max、T2max、T3max、H1max、H2max、H3max、Mmax表示工艺范围的最高值。
步骤S5具体步骤如下:
输入干燥部能量系统运行优化模型参数,包括:施胶前纸页定量Qsbq,车速V,底层上网浓度Bcon,面层流浆箱压力Spressure,底层流浆箱压力Bpressure。使用遗传算法进行工艺参数求解。遗传算法将问题模拟成一个生物进化的过程,通过复制、交叉、突变等操作产生下一代的解,逐代进化,直到满足终止条件。
本发明具有的技术效果:本发明利用机器学习算法结合历史生产数据建立模型,挖掘生产数据之间的关联性,更好的指导实际生产;通过模型优化干燥部工艺参数,平均蒸汽耗从19kg/s左右降至约17kg/s,平均吨纸成本从130元左右降至115元左右,降低了产品成本,提高了企业效益。
附图说明
图1是本发明的流程图;
图2是实际工况中蒸汽流量与本模型优化后的蒸汽流量结果对比图;
图3是实际工况中平均蒸汽流量与本模型优化后的平均蒸汽流量结果对比图;
图4是实际工况下吨纸成本与本模型优化后的吨纸成本结果对比图;
图5是实际工况下吨纸平均成本与本模型优化后的吨纸平均成本结果对比图;
图6是遗传算法流程图;
图7是实际工况下蒸汽流量与本模型优化后的蒸汽流量结果对比图;
图8是实际工况下平均蒸汽流量与本模型优化后的平均蒸汽流量结果对比图;
图9是实际工况下吨纸成本与本模型优化后的吨纸成本结果对比图;
图10是实际工况下吨纸平均成本与本模型优化后的吨纸平均成本结果对比图。
具体实施方式
下面对本发明的具体实施方式进行描述,以便于本技术领域的技术人员理解本发明,但应该清楚,本发明不限于具体实施方式的范围,对本技术领域的普通技术人员来讲,只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内,这些变化是显而易见的,一切利用本发明构思的发明创造均在保护之列。
如图1所示,一种基于数据驱动的箱板纸机干燥部能量系统运行优化方法,包括以下步骤:
S1:数据采集和数据预处理;
S2:特征变量选择分析;
S3:建立纸页干燥过程关键参数预测模型;
S4:基于遗传算法建立干燥部能耗优化模型;
S5:模型验证。
模型中步骤S1具体步骤如下:
采集纸机干燥部生产数据,分析能耗状况,纸页干燥过程能耗主要是蒸汽和电,评估存在优化空间。依据实际生产状况人工剔除不正常的数据,再结合箱型图法对数据预处理,将特征数据的四分之一分位值定为Q1,四分之三分位值定为Q3:
其中,IQR为四分位距,limitmax为异常值上限,limitmin为异常值下限。如图2、图3分别是数据预处理前、数据预处理后的4组蒸汽压力值。’
步骤S2具体步骤如下:
S21.单变量特征选择,运用pearson相关系数法对采集的变量作单变量分析,分析干燥部约束变量排风温湿度、能耗变量蒸汽流量与其它变量间的相关性;相关系数是反应两变量之间变化趋势的方向以及程度,用于两个变量之间的相关性分析,取值范围在[-1,1],其绝对值越大,相关性越强;相关系数越接近于1或-1,相关度越强,相关系数越接近于0,相关度越弱。其中,绝对值在0.8-1.0表示极强相关,在0.6-0.8表示强相关,在0.4-0.6表示中等程度相关,0.2-0.4表示弱相关,0-0.2表示极弱相关或无相关。相关系数的计算公式如下:
其中,Cov(X,Y)为X和Y的协方差,Var[X]、Var[Y]分别为X和Y的方差。
经分析,前干燥蒸汽流量与T2排风1风量的pearson相关系数为-0.84,表明两特征变量是极强负相关性,如图4所示;前干燥蒸汽流量与4组蒸汽压力的pearson相关系数为0.96,表明两特征变量是极强正相关性,如图5所示。
S22.多变量特征选择,GBDT算法中的重要性排序可做多变量分析,采用CART作为基学习器,采用基尼指数来选择划分属性(即节点特征),通过基尼系数来选择节点属性,能在候选特征中选择最优特征来划分节点,并使得划分后的误差最小,即得到最优特征。
假定数据集D,由CART决策树作为基学习器建立的组合模型GBT,基学习器个数为K,每个特征节点的基尼指数计算公式如下:
其中,Gini(D)为数据集D的基尼值,pj为样本值j所占的比例,v为样本取值总数,Gini_index(D,a)为属性a在样本集D上的基尼指数;
然后针对每个节点,计算候选特征集S中所有特征的基尼指数,选取使得划分后基尼指数最小的特征mmin作为节点特征。此时,由特征mmin造成的平均不纯度减少值ΔGini,即为该特征的贡献度:
按照上述方式,搜索单个基学习器上所有分裂节点i的贡献度,然后对所有基学习器进行平均,即得到该特征的总体贡献度:
根据分析,选择16个特征变量,分别是:4组蒸汽压力(4_CSP)、T1送风温度(T1_SWT)、T1送风风量(T1_SWC)‘、T1排风风量(T1_EWC)、T2送风风量(T2_SWC)、T2送风温度(T2_SWT)‘、、T2排风1风量(T21_EWC)、、T2排风2风量(T22_EWC)、T3送风温度(T3_SWT)、T3送风风量(T3_SWC)、T3排风风量(T3_EWC)、施胶前定量(Qsbq)、车速(V)、底层上网浓度(Bcon)、面层流浆箱压力(Spressure)、底层流浆箱压力(Bpressure)。
步骤S3具体步骤如下:
S31.依据步骤S2、S3,确定各预测模型特征变量,其中约束变量预测模型7个,分别为:T1排风湿度(T1_EWH)、T1排风温度(T1_EWT)、T2排风湿度(T2_EWH)、T2排风温度(T2_EWT)、T3排风湿度(T3_EWH)、T3排风温度(T3_EWT)、施胶前水分(Hum);能耗变量预测模型1个:干燥部蒸汽流量(DSQ);运用机器学习算法结合生产数据,建立Ridge回归模型、Elastic Net回归模型、SVR回归模型、RF回归模型等。各算法原理如下:
(1)Ridge算法:在线性回归损失函数的基础上加入L2正则项,在不舍弃特征变量的情况下,缩小回归系数,使模型相对稳定,其原理公式如下:
(2)Elastic Net算法:结合使用了系数向量的L1范数和L2范数的线性回归模型,使的可学习类似于Lasso一样稀疏的模型,还保留了Ridge的正则化属性,结合了两者的优点,适用于有多个特征变量彼此相关的模型。其原理公式如下:
(3)SVR算法:支持向量回归算法能够通过将非线性问题以核函数的方式映射到高维空间,从而将非线性问题转变为线性问题,具有较好的非线性处理能力和泛化能力。其原理公式如下:
其中,ω为权重系数,x为输入变量,b为偏置项,αi为拉格朗日乘子,为核函数。核函数可将线性不可分的低维特征数据映射到高维空间,将非线性问题转换为线性问题。常用核函数有线性核函数(Linear)、多项式核函数(Poly)、径向基核函数(RBF)和sigmoid核函数,公式如下:
线性核函数:K(xi,x)=xixT
多项式核函数:K(xi,x)=(γxixT+r)p,γ>0
径向基核函数:K(xi,x)=exp(-γ||xi-x||2),γ>0
sigmoid核函数:K(xi,x)=tan h(γxixT+r),γ>0
其中,γ,r,p为各核函数参数。
(4)RF算法:随机森林由多个随机决策树组成,回归问题中,最终结果取决于各随机决策树的加权。RF算法流程如下:
a.输入训练样本D={(x1,y1),(x2,y2),……,(xm,ym)}弱学习器迭代次数K;
b.对于k=1,2,…K对训练集进行第k次采样,采用自助法(bootstrap)采样,即随机有放回采样,共采集m次,得到采样集本Dk(含m个样本);在采样集Dk上训练第k个决策树模型Gk(x)。在训练该模型时RF只需要在所有样本特征中选择部分特征,最后在所选部分特征中确定节点分裂特征;
c.输出集成模型f(x)。
S32.计算各模型的平均绝对误差(MAPE)、平均相对误差(MAE)、拟合优度(R2)等指标,其中:
表1是不同机器学习算法建立的预测模型的各项评价指标,分析比较模型的评价指标,选综合选择最佳预测模型。
表1模型评价指标
步骤S4具体步骤如下:
S41.建立干燥部能耗公式:
Papertonprice=Spre*Psteam*6000/V*Qsbq*Ly
其中Papertonprice表示吨纸耗(yuan/t),Spre表示预测的干燥蒸汽流量(kg/s),V表示纸机车速(m/min),Qsbq施胶前定量(g/m2),Ly表示纸机幅宽(m);
排风机排风温度对应下的饱和湿度公式:
H=0.6228*(Ps/P-Ps)*1000
其式中,A,B,C为Antoine常数,可查数据表得,T表示排风机的排风温度,PS表示在排风温度下的饱和蒸气压,H表示排风温度下空气的饱和湿度。为防止发生滴露,气罩内空气温度应该维持在露点温度以上,安全起见,气罩内的相对湿度一般不超过饱和湿度的80%,即Hact<0.8H;
S42.生产中纸机干燥部风机的排风温湿度及出干燥部纸页的干度有工艺约束,即要求这些指标在合理的工艺范围内,如下式所示:
T1排风机的排风温度范围:T1min≤T1temp≤T1max
T2排风机的排风温度范围:T2min≤T2temp≤T2max
T3排风机的排风温度范围:T3min≤T3temp≤T3max
H1排风机的排风湿度范围:H1min≤H1hum≤H1max
H2排风机的排风湿度范围:H2min≤H2hum≤H2max
H3排风机的排风湿度范围:H3min≤H3hum≤H3max
施胶前纸页的水分:Mmin≤Mact≤Mmax
其中T1min、T2min、T3min、H1min、H2min、H3min、Mmin表示工艺范围的最低值,T1max、T2max、T3max、H1max、H2max、H3max、Mmax表示工艺范围的最高值。
步骤S5具体步骤如下:
输入干燥部能量系统运行优化模型参数,施胶前纸页定量108.66g/m2,车速1244.94m/s,底层上网浓度1.43%,面层流浆箱压力291.92kPa,底层流浆箱压力288.32kPa,如表2所示;运用遗传算法求解,各工艺参数的优化值如表3所示;实际工况下的蒸汽耗为19.28kg/s,吨纸成本约为129.90元,优化工艺参数下的蒸汽耗为17.53kg/s,吨纸成本为118.11元,每吨纸节约11.79元左右。遗传算法步骤如图6所示。
表2模型参数
表3工艺参数优化值
图7、图8是实际工况下蒸汽流量和平均蒸汽流量与本模型优化后的蒸汽流量和平均蒸汽流量结果对比图;
图9、图10是实际工况下吨纸成本和吨纸平均成本与本模型优化后的吨纸成本和吨纸平均成本结果对比图。
Claims (6)
1.基于数据驱动的箱板纸机干燥部能量系统运行优化方法,其特征在于,包括以下步骤:
S1:数据采集和数据预处理;
步骤S1具体步骤如下:
采集纸机干燥部生产数据,分析能耗状况,纸页干燥过程能耗是蒸汽和电,评估存在优化空间;运用箱型图法对数据预处理;
S2:特征变量选择分析;
步骤S2具体步骤如下:
S21.单变量特征选择,运用pearson相关系数法对采集的变量作单变量分析,分析干燥部工艺约束变量、能耗变量与其它变量间的相关性;
S22.多变量特征选择,GBDT算法中的重要性排序做多变量分析,采用CART作为基学习器,采用基尼指数来选择划分属性,通过基尼系数来选择节点属性,能在候选特征中选择最优特征来划分节点,并使得划分后的误差最小,即得到最优特征;
S3:建立纸页干燥过程关键参数预测模型;
步骤S3具体步骤如下:
S31.依据步骤S21、S22,确定各预测模型特征变量;
S32.计算各模型的平均绝对误差、平均相对误差、拟合优度指标;
S4:基于遗传算法建立干燥部能耗优化模型;
步骤S4具体步骤如下:
S41.建立干燥部能耗公式;
建立排风机排风温度对应下的饱和湿度公式;
S42.生产中纸机干燥部风机的排风温湿度及出干燥部纸页的干度有工艺约束,即要求这些指标在合理的工艺范围内;
S5:模型验证;
步骤S5具体步骤如下:
输入干燥部能量系统运行优化模型参数,使用遗传算法进行工艺参数求解。
3.根据权利要求1所述的基于数据驱动的箱板纸机干燥部能量系统运行优化方法,其特征在于,步骤S21.单变量特征选择中,相关系数是反应两变量之间变化趋势的方向以及程度,用于两个变量之间的相关性分析,取值范围在[-1,1],其绝对值越大,相关性越强;相关系数越接近于-1,相关度越强,相关系数越接近于0,相关度越弱;其中,绝对值在0.8-1.0表示极强相关,在0.6-0.8表示强相关,在0.4-0.6表示中等程度相关,0.2-0.4表示弱相关,0-0.2表示极弱相关或无相关;相关系数的计算公式如下:
其中,Cov(X,Y)为X和Y的协方差,Var[X]、Var[Y]分别为X和Y的方差;
S22.多变量特征选择,假定数据集D,由CART作为基学习器建立的组合模型GBT,基学习器个数为K,每个特征节点的基尼指数计算公式如下:
其中,Gini(D)为数据集D的基尼值,pj为样本值j所占的比例,v为样本取值总数,Gini_index(D,a)为属性a在样本集D上的基尼指数;然后针对每个节点,计算候选特征集S中所有特征的基尼指数,选取使得划分后基尼指数最小的特征mmin作为节点特征;此时,由特征mmin造成的平均不纯度减少值ΔGini,即为mmin的贡献度:
按照上面这两个公式,搜索单个基学习器上所有分裂节点i的贡献度,然后对所有基学习器进行平均,即得到mmin的总体贡献度:
5.根据权利要求1所述的基于数据驱动的箱板纸机干燥部能量系统运行优化方法,其特征在于:
S41.中干燥部能耗公式:
Papertonprice=Spre*Psteam*600/V*Qsbq*Ly
其中Papertonprice表示吨纸耗(yuan/t),Spre表示预测的干燥蒸汽流量(kg/s),V表示纸机车速(m/min),Qsbq施胶前纸页定量(g/m2),Ly表示纸机幅宽(m);
排风机排风温度对应下的饱和湿度公式:
H=0.6228*(Ps/P-Ps)*1000
其式中,A,B,C为Antoine常数,查数据表得,T表示排风机的排风温度,Ps表示在排风温度下的饱和蒸气压,H表示排风温度下空气的饱和湿度;为防止发生滴露,气罩内空气温度维持在露点温度以上,安全起见,气罩内的相对湿度不超过饱和湿度的80%,即Hact<0.8H;
S42.合理的工艺范围,如下式所示:
T1排风机的排风温度范围:T1min≤T1temp≤T1max
T2排风机的排风温度范围:T2min≤T2temp≤T2max
T3排风机的排风温度范围:T3min≤T3temp≤T3max
H1排风机的排风湿度范围:H1min≤H1hum≤H1max
H2排风机的排风湿度范围:H2min≤H2hum≤H2max
H3排风机的排风湿度范围:H3min≤H3hum≤H3max
施胶前纸页的水分:Mmin≤Mact≤Mmax
其中T1min、T2min、T3min、H1min、H2min、H3min、Mmin表示工艺范围的最低值,T1max、T2max、T3max、H1max、H2max、H3max、Mmax表示工艺范围的最高值。
6.根据权利要求1所述的基于数据驱动的箱板纸机干燥部能量系统运行优化方法,其特征在于,步骤S5中模型参数,包括:施胶前纸页定量Qsbq,纸机车速V,底层上网浓度Bcon,面层流浆箱压力Spressure,底层流浆箱压力Bpressure。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110095976.1A CN112949162B (zh) | 2021-01-25 | 2021-01-25 | 基于数据驱动的箱板纸机干燥部能量系统运行优化方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110095976.1A CN112949162B (zh) | 2021-01-25 | 2021-01-25 | 基于数据驱动的箱板纸机干燥部能量系统运行优化方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112949162A CN112949162A (zh) | 2021-06-11 |
CN112949162B true CN112949162B (zh) | 2023-06-23 |
Family
ID=76236343
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110095976.1A Active CN112949162B (zh) | 2021-01-25 | 2021-01-25 | 基于数据驱动的箱板纸机干燥部能量系统运行优化方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112949162B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113787759A (zh) * | 2021-11-16 | 2021-12-14 | 武汉市宏伟纸箱包装有限公司 | 一种瓦楞纸箱包装的生产工艺智能选择方法 |
CN114351496B (zh) * | 2021-12-17 | 2023-07-18 | 浙江华章科技有限公司 | 一种网压部真空系统压力自动整定方法及系统 |
CN115157481B (zh) * | 2022-06-20 | 2023-07-25 | 沈阳华控科技发展有限公司 | 一种pvc干燥装置的热量控制方法 |
CN117743772B (zh) * | 2023-12-29 | 2024-05-28 | 维达纸业(浙江)有限公司 | 基于人工智能模型的卫生纸干燥参数优化方法及系统 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE102009011217A1 (de) * | 2009-03-04 | 2010-09-09 | Siemens Aktiengesellschaft | Steuerung der erweiterten Trockenpartie einer Papiermaschine |
CN109577064B (zh) * | 2018-12-14 | 2020-06-19 | 华南理工大学 | 用于卫生纸机干燥部能耗与蒸发量预测的机理建模方法 |
CN111400832B (zh) * | 2020-03-11 | 2021-07-20 | 广州博依特智能信息科技有限公司 | 用于卫生纸机干燥部关键运行参数预测的混合建模方法 |
CN111241717A (zh) * | 2020-03-11 | 2020-06-05 | 广州博依特智能信息科技有限公司 | 基于机理模型的卫生纸机干燥部操作参数优化方法 |
CN111893791A (zh) * | 2020-07-17 | 2020-11-06 | 广州博依特智能信息科技有限公司 | 基于智能算法的生活用纸造纸机干燥部运行优化方法 |
-
2021
- 2021-01-25 CN CN202110095976.1A patent/CN112949162B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN112949162A (zh) | 2021-06-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112949162B (zh) | 基于数据驱动的箱板纸机干燥部能量系统运行优化方法 | |
CN103927412B (zh) | 基于高斯混合模型的即时学习脱丁烷塔软测量建模方法 | |
CN112613536A (zh) | 一种基于smote和深度学习的近红外光谱柴油牌号识别方法 | |
Witajewski-Baltvilks et al. | Induced technological change and energy efficiency improvements | |
CN113657452A (zh) | 基于主成分分析和超级学习的烟叶质量等级分类预测方法 | |
Soares et al. | Design and application of soft sensor using ensemble methods | |
Neto et al. | A superstructure-based methodology for simultaneously sizing and arranging additional evaporator bodies in multiple-effect evaporator plants | |
Ye et al. | Financial structure, technology, and economic growth: a structural matching perspective | |
CN115630332A (zh) | 一种小麦粉粉质特性预测方法 | |
CN115458078A (zh) | 一种基于多工况分布式输出过程补偿宽度迁移建模方法 | |
CN112464168B (zh) | 一种综合能源潜力用户靶向评估提取方法 | |
CN114330485A (zh) | 基于pls-svm-ga算法的电网投资能力预测方法 | |
CN111220565B (zh) | 一种基于cpls的红外光谱测量仪器标定迁移方法 | |
CN114740713A (zh) | 一种湿法烟气脱硫过程的多目标优化控制方法 | |
CN113033864A (zh) | 一种基于能源大数据的新建企业用能预测方法 | |
CN113379093A (zh) | 油气集输系统能耗分析与优化方法 | |
Aquino et al. | Prediction of Moisture Content of Chlorella Vulgaris Microalgae Using Hybrid Evolutionary Computing and Neural Network Variants for Biofuel Production | |
Tang et al. | Octane number prediction of blend gasoline based on improved particle swarm optimization | |
CN113488113B (zh) | 一种复烤片烟的工业使用价值识别方法 | |
Tan | Carbon Emission Prediction with Macroeconomic Variables and Machine Learning | |
WO2024077876A1 (zh) | 一种基于自适应的局部动态焦炭质量预测方法 | |
CN114295578B (zh) | 基于近红外光谱的烟叶常规化学成分通用模型建模方法 | |
CN117298826A (zh) | 基于在线学习融合算法的燃煤电厂脱硫自动控制方法 | |
Kartiwi et al. | Feature Selection for Financial Data Classification: Islamic Finance Application | |
CN117200188A (zh) | 一种长期负荷预测方法及终端 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |