CN112949162B - 基于数据驱动的箱板纸机干燥部能量系统运行优化方法 - Google Patents

基于数据驱动的箱板纸机干燥部能量系统运行优化方法 Download PDF

Info

Publication number
CN112949162B
CN112949162B CN202110095976.1A CN202110095976A CN112949162B CN 112949162 B CN112949162 B CN 112949162B CN 202110095976 A CN202110095976 A CN 202110095976A CN 112949162 B CN112949162 B CN 112949162B
Authority
CN
China
Prior art keywords
paper
data
model
exhaust
correlation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110095976.1A
Other languages
English (en)
Other versions
CN112949162A (zh
Inventor
洪蒙纳
满奕
马亚运
李继庚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Poi Intelligent Information Technology Co ltd
Original Assignee
Guangzhou Poi Intelligent Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Poi Intelligent Information Technology Co ltd filed Critical Guangzhou Poi Intelligent Information Technology Co ltd
Priority to CN202110095976.1A priority Critical patent/CN112949162B/zh
Publication of CN112949162A publication Critical patent/CN112949162A/zh
Application granted granted Critical
Publication of CN112949162B publication Critical patent/CN112949162B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • DTEXTILES; PAPER
    • D21PAPER-MAKING; PRODUCTION OF CELLULOSE
    • D21GCALENDERS; ACCESSORIES FOR PAPER-MAKING MACHINES
    • D21G9/00Other accessories for paper-making machines
    • D21G9/0009Paper-making control systems
    • D21G9/0036Paper-making control systems controlling the press or drying section
    • DTEXTILES; PAPER
    • D21PAPER-MAKING; PRODUCTION OF CELLULOSE
    • D21GCALENDERS; ACCESSORIES FOR PAPER-MAKING MACHINES
    • D21G9/00Other accessories for paper-making machines
    • D21G9/0009Paper-making control systems
    • D21G9/0054Paper-making control systems details of algorithms or programs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/12Computing arrangements based on biological models using genetic models
    • G06N3/126Evolutionary algorithms, e.g. genetic algorithms or genetic programming
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2119/00Details relating to the type or aim of the analysis or the optimisation
    • G06F2119/08Thermal analysis or thermal optimisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Mathematical Physics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Physiology (AREA)
  • Genetics & Genomics (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Computer Hardware Design (AREA)
  • Geometry (AREA)
  • Paper (AREA)

Abstract

本发明公开了一种基于数据驱动的箱板纸机干燥部能量系统运行优化方法,包括以下步骤:S1:数据采集和数据预处理;S2:特征变量选择分析;S3:建立纸页干燥过程关键参数预测模型;S4:基于遗传算法建立干燥部能耗优化模型;S5:模型验证。本发明利用机器学习算法结合历史生产数据建立模型,挖掘生产数据之间的关联性,更好的指导实际生产;通过模型优化干燥部工艺参数,平均蒸汽耗从19kg/s左右降至约17kg/s,平均吨纸成本从130元左右降至115元左右,降低了产品成本,提高了企业效益。

Description

基于数据驱动的箱板纸机干燥部能量系统运行优化方法
技术领域
本发明涉及一种基于数据驱动的箱板纸机干燥部能量系统运行优化方法,通过优化纸机干燥部工艺参数达到节能降耗,提高效益的目的,属于能源管理技术领域。
背景技术
据中国造纸协会调查资料,2019年全国纸及纸板生产企业约2700家,全国纸及纸板生产量10765万吨,较上年增长3.16%。消费量10704万吨,较上年增长2.54%,人均年消费量为75千克(14.0亿人)。
造纸过程的干燥系统是整个造纸工艺中能耗最大的部分,约占整个纸机能耗的30%-60%,因此做好纸机干燥部的节能十分重要;干燥系统的主要作用是蒸发脱除湿纸幅中残留的水分,进一步完成纸页的纤维结合并提高其强度,是一个复杂的传热传质的过程,涉及的物料和能量传递复杂多样,包括蒸汽加热烘缸表面纸页的干燥、气罩通风、废气热量的回收以及烘缸冷凝水的回收和排放。干燥系统工艺参数的调整需考虑众多生产因素,既需要考虑干燥部前工段成形部、压榨部工艺变化的影响,又需保证干燥工段正常生产的前提条件下,满足后续生产的工艺要求;生产中纸页定量、纸机车速、网压部参数等变化影响干燥部的蒸发效率,通过调整各段蒸汽的进出烘缸压力满足蒸发效率,达到气罩良好通风不发生滴漏现象,出干燥部的纸页干度满足工艺要求。因此干燥工艺参数的调整是一个及其复杂的逻辑过程;当前生产工艺参数的设定和调整仅依赖生产总结和经验判断,缺乏技术理论的指导,部分参数设置不合理,存在能耗高的现象。
利用纸机干燥系统的生产数据与机器学习算法结合,首先建立干燥过程关键参数预测模型,再基于遗传算法建立干燥部能耗优化模型,将复杂的干燥过程通过生产数据建立起来,挖掘各参数之间的关联性,指导工艺参数的调整,达到满足工艺要求,节约成本的目的。
发明内容
为解决目前生产工艺调整存在的问题,本发明提供了一种基于数据驱动的箱板纸机干燥部能量系统运行优化方法,解决了生产中工艺参数调整依靠人工经验,缺乏理论技术指导的问题。
本发明采用的技术方案是,一种基于数据驱动的箱板纸机干燥部能量系统运行优化方法,包括以下步骤:
S1:数据采集和数据预处理;
S2:特征变量选择分析;
S3:建立纸页干燥过程关键参数预测模型;
S4:基于遗传算法建立干燥部能耗优化模型;
S5:模型验证。
模型中步骤S1具体步骤如下:
采集纸机干燥部生产数据,分析能耗状况,纸页干燥过程能耗主要是蒸汽和电,评估存在优化空间。运用箱型图法对数据预处理,将特征数据的四分之一分位值定为Q1,四分之三分位值定为Q3
Figure BDA0002914258400000021
其中,IQR为四分位距,limitmax为异常值上限,limitmin为异常值下限。
步骤S2具体步骤如下:
S21.单变量特征选择,运用pearson相关系数法对采集的变量作单变量分析,分析纸机干燥部工艺约束变量、能耗变量与其它变量间的相关性;相关系数是反应两变量之间变化趋势的方向以及程度,用于两个变量之间的相关性分析,取值范围在[-1,1],其绝对值越大,相关性越强;相关系数越接近于1或-1,相关度越强,相关系数越接近于0,相关度越弱。其中,绝对值在0.8-1.0表示极强相关,在0.6-0.8表示强相关,在0.4-0.6表示中等程度相关,0.2-0.4表示弱相关,0-0.2表示极弱相关或无相关。相关系数的计算公式如下:
Figure BDA0002914258400000022
其中,Cov(X,Y)为X和Y的协方差,Var[X]、Var[Y]分别为X和Y的方差;
S22.多变量特征选择,GBDT算法中的重要性排序可做多变量分析,采用CART作为基学习器,采用基尼指数来选择划分属性(即节点特征),通过基尼系数来选择节点属性,能在候选特征中选择最优特征来划分节点,并使得划分后的误差最小,即得到最优特征。
假定数据集D,由CART决策树作为基学习器建立的组合模型GBT,基学习器个数为K,每个特征节点的基尼指数计算公式如下。
Figure BDA0002914258400000031
Figure BDA0002914258400000032
其中,Gini(D)为数据集D的基尼值,pj为样本值j所占的比例,v为样本取值总数,Gini_index(D,a)为属性a在样本集D上的基尼指数;
然后针对每个节点,计算候选特征集S中所有特征的基尼指数,选取使得划分后基尼指数最小的特征mmin作为节点特征。此时,由特征mmin造成的平均不纯度减少值ΔGini,即为该特征的贡献度:
Figure BDA0002914258400000033
Figure BDA0002914258400000034
按照上述方式,搜索单个基学习器上所有分裂节点i的贡献度,然后对所有基学习器进行平均,即得到该特征的总体贡献度:
Figure BDA0002914258400000035
Figure BDA0002914258400000036
其中,
Figure BDA0002914258400000037
为单个基学习器特征mmin的贡献度,/>
Figure BDA0002914258400000038
为该特征最终贡献度。
步骤S3具体步骤如下:
S31.依据步骤S21、S22,确定各预测模型特征变量,其中约束变量预测模型7个,分别为:T1排风湿度(T1_EWH)、T1排风温度(T1_EWT)、T2排风湿度(T2_EWH)、T2排风温度(T2_EWT)、T3排风湿度(T3_EWH)、T3排风温度(T3_EWT)、施胶前水分(Hum);能耗变量预测模型1个:干燥部蒸汽流量(DSQ);运用机器学习算法结合生产数据,建立Ridge回归模型、ElasticNet回归模型、SVR回归模型、RF回归模型等。各算法原理如下:
(1)Ridge算法:在线性回归损失函数的基础上加入L2正则项,在不舍弃特征变量的情况下,缩小回归系数,使模型相对稳定,其原理公式如下:
Figure BDA0002914258400000041
其中X=(x1,x2,x3,……,xn)是输入特征变量,Y=(y1,y2,y3,……,yn)是输出特征变量,θ=(θ1,θ2,θ3,……,θn)是输入特征变量系数,λ是惩罚项系数,
Figure BDA0002914258400000047
是惩罚项。
(2)Elastic Net算法:结合使用了系数向量的L1范数和L2范数的线性回归模型,使的可学习类似于Lasso一样稀疏的模型,还保留了Ridge的正则化属性,结合了两者的优点,适用于有多个特征变量彼此相关的模型。其原理公式如下:
Figure BDA0002914258400000042
其中X=(x1,x2,x3,……,xn)是输入特征变量,Y=(y1,y2,y3,……,yn)是输出特征变量,θ=(θ1,θ2,θ3,……,θn)是输入特征变量X系数,
Figure BDA0002914258400000043
是惩罚项。
(3)SVR算法:支持向量回归算法能够通过将非线性问题以核函数的方式映射到高维空间,从而将非线性问题转变为线性问题,具有较好的非线性处理能力和泛化能力。其原理公式如下:
Figure BDA0002914258400000044
其中,ω为权重系数,x为输入变量,b为偏置项,
Figure BDA0002914258400000045
αi为拉格朗日乘子,
Figure BDA0002914258400000046
为核函数。核函数可将线性不可分的低维特征数据映射到高维空间,将非线性问题转换为线性问题。常用核函数有线性核函数(Linear)、多项式核函数(Poly)、径向基核函数(RBF)和sigmoid核函数,公式如下:
线性核函数:K(xi,x)=xixT
多项式核函数:K(xi,x)=(γxixT+r)p,γ>0
径向基核函数:K(xi,x)=exp(-γ||xi-x||2),γ>0
sigmoid核函数:K(xi,x)=tan h(γxixT+r),γ>0
其中,γ,r,p为各核函数参数。
(4)RF算法:随机森林由多个随机决策树组成,回归问题中,最终结果取决于各随机决策树的加权。RF算法流程如下:
a.输入训练样本D={(x1,y1),(x2,y2),……,(xm,ym)},弱学习器迭代次数K;
b.对于k=1,2,…K对训练集进行第k次采样,采用自助法(bootstrap)采样,即随机有放回采样,共采集m次,得到采样集本Dk(含m个样本);在采样集Dk上训练第k个决策树模型Gk(x)。在训练该模型时RF只需要在所有样本特征中选择部分特征,最后在所选部分特征中确定节点分裂特征;
c.输出集成模型f(x)。
S32.计算各模型的平均绝对误差(MAPE)、平均相对误差(MAE)、拟合优度(R2)等指标,其中:
平均绝对误差计算公式:
Figure BDA0002914258400000051
平均相对误差计算公式:
Figure BDA0002914258400000052
拟合优度计算公式:
Figure BDA0002914258400000053
上述计算公式中,
Figure BDA0002914258400000054
是预测值,yi是实际值,/>
Figure BDA0002914258400000055
是平均值;分析比较模型评价指标,选择最佳预测模型。
步骤S4具体步骤如下:
S41.建立干燥部能耗公式:
Papertonprice=Spre*Psteam*6000/V*Qsbq*Ly
其中Papertonprice表示吨纸耗(yuan/t),Spre表示预测的干燥蒸汽流量(kg/s),V表示纸机车速(m/min),Qsbq施胶前定量(g/m2),Ly表示纸机幅宽(m);
排风机排风温度对应下的饱和湿度公式:
Figure BDA0002914258400000061
H=0.6228*(Ps/P-Ps)*1000
其式中,A,B,C为Antoine常数,可查数据表得,T表示排风机的排风温度,Ps表示在排风温度下的饱和蒸气压,H表示排风温度下空气的饱和湿度。为防止发生滴露,气罩内空气温度应该维持在露点温度以上,安全起见,气罩内的相对湿度一般不超过饱和湿度的80%,即Hact<0.8H;
S42.生产中纸机干燥部风机的排风温湿度及出干燥部纸页的干度有工艺约束,即要求这些指标在合理的工艺范围内,如下式所示:
T1排风机的排风温度范围:T1min≤T1temp≤T1max
T2排风机的排风温度范围:T2min≤T2temp≤T2max
T3排风机的排风温度范围:T3min≤T3temp≤T3max
H1排风机的排风湿度范围:H1min≤H1hum≤H1max
H2排风机的排风湿度范围:H2min≤H2hum≤H2max
H3排风机的排风湿度范围:H3min≤H3hum≤H3max
施胶前纸页的水分:Mmin≤Mact≤Mmax
其中T1min、T2min、T3min、H1min、H2min、H3min、Mmin表示工艺范围的最低值,T1max、T2max、T3max、H1max、H2max、H3max、Mmax表示工艺范围的最高值。
步骤S5具体步骤如下:
输入干燥部能量系统运行优化模型参数,包括:施胶前纸页定量Qsbq,车速V,底层上网浓度Bcon,面层流浆箱压力Spressure,底层流浆箱压力Bpressure。使用遗传算法进行工艺参数求解。遗传算法将问题模拟成一个生物进化的过程,通过复制、交叉、突变等操作产生下一代的解,逐代进化,直到满足终止条件。
本发明具有的技术效果:本发明利用机器学习算法结合历史生产数据建立模型,挖掘生产数据之间的关联性,更好的指导实际生产;通过模型优化干燥部工艺参数,平均蒸汽耗从19kg/s左右降至约17kg/s,平均吨纸成本从130元左右降至115元左右,降低了产品成本,提高了企业效益。
附图说明
图1是本发明的流程图;
图2是实际工况中蒸汽流量与本模型优化后的蒸汽流量结果对比图;
图3是实际工况中平均蒸汽流量与本模型优化后的平均蒸汽流量结果对比图;
图4是实际工况下吨纸成本与本模型优化后的吨纸成本结果对比图;
图5是实际工况下吨纸平均成本与本模型优化后的吨纸平均成本结果对比图;
图6是遗传算法流程图;
图7是实际工况下蒸汽流量与本模型优化后的蒸汽流量结果对比图;
图8是实际工况下平均蒸汽流量与本模型优化后的平均蒸汽流量结果对比图;
图9是实际工况下吨纸成本与本模型优化后的吨纸成本结果对比图;
图10是实际工况下吨纸平均成本与本模型优化后的吨纸平均成本结果对比图。
具体实施方式
下面对本发明的具体实施方式进行描述,以便于本技术领域的技术人员理解本发明,但应该清楚,本发明不限于具体实施方式的范围,对本技术领域的普通技术人员来讲,只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内,这些变化是显而易见的,一切利用本发明构思的发明创造均在保护之列。
如图1所示,一种基于数据驱动的箱板纸机干燥部能量系统运行优化方法,包括以下步骤:
S1:数据采集和数据预处理;
S2:特征变量选择分析;
S3:建立纸页干燥过程关键参数预测模型;
S4:基于遗传算法建立干燥部能耗优化模型;
S5:模型验证。
模型中步骤S1具体步骤如下:
采集纸机干燥部生产数据,分析能耗状况,纸页干燥过程能耗主要是蒸汽和电,评估存在优化空间。依据实际生产状况人工剔除不正常的数据,再结合箱型图法对数据预处理,将特征数据的四分之一分位值定为Q1,四分之三分位值定为Q3
Figure BDA0002914258400000071
其中,IQR为四分位距,limitmax为异常值上限,limitmin为异常值下限。如图2、图3分别是数据预处理前、数据预处理后的4组蒸汽压力值。’
步骤S2具体步骤如下:
S21.单变量特征选择,运用pearson相关系数法对采集的变量作单变量分析,分析干燥部约束变量排风温湿度、能耗变量蒸汽流量与其它变量间的相关性;相关系数是反应两变量之间变化趋势的方向以及程度,用于两个变量之间的相关性分析,取值范围在[-1,1],其绝对值越大,相关性越强;相关系数越接近于1或-1,相关度越强,相关系数越接近于0,相关度越弱。其中,绝对值在0.8-1.0表示极强相关,在0.6-0.8表示强相关,在0.4-0.6表示中等程度相关,0.2-0.4表示弱相关,0-0.2表示极弱相关或无相关。相关系数的计算公式如下:
Figure BDA0002914258400000081
其中,Cov(X,Y)为X和Y的协方差,Var[X]、Var[Y]分别为X和Y的方差。
经分析,前干燥蒸汽流量与T2排风1风量的pearson相关系数为-0.84,表明两特征变量是极强负相关性,如图4所示;前干燥蒸汽流量与4组蒸汽压力的pearson相关系数为0.96,表明两特征变量是极强正相关性,如图5所示。
S22.多变量特征选择,GBDT算法中的重要性排序可做多变量分析,采用CART作为基学习器,采用基尼指数来选择划分属性(即节点特征),通过基尼系数来选择节点属性,能在候选特征中选择最优特征来划分节点,并使得划分后的误差最小,即得到最优特征。
假定数据集D,由CART决策树作为基学习器建立的组合模型GBT,基学习器个数为K,每个特征节点的基尼指数计算公式如下:
Figure BDA0002914258400000082
Figure BDA0002914258400000083
其中,Gini(D)为数据集D的基尼值,pj为样本值j所占的比例,v为样本取值总数,Gini_index(D,a)为属性a在样本集D上的基尼指数;
然后针对每个节点,计算候选特征集S中所有特征的基尼指数,选取使得划分后基尼指数最小的特征mmin作为节点特征。此时,由特征mmin造成的平均不纯度减少值ΔGini,即为该特征的贡献度:
Figure BDA0002914258400000091
Figure BDA0002914258400000092
按照上述方式,搜索单个基学习器上所有分裂节点i的贡献度,然后对所有基学习器进行平均,即得到该特征的总体贡献度:
Figure BDA0002914258400000093
Figure BDA0002914258400000094
其中,
Figure BDA0002914258400000095
为单个基学习器特征mmin的贡献度,/>
Figure BDA0002914258400000096
为该特征最终贡献度。
根据分析,选择16个特征变量,分别是:4组蒸汽压力(4_CSP)、T1送风温度(T1_SWT)、T1送风风量(T1_SWC)‘、T1排风风量(T1_EWC)、T2送风风量(T2_SWC)、T2送风温度(T2_SWT)‘、、T2排风1风量(T21_EWC)、、T2排风2风量(T22_EWC)、T3送风温度(T3_SWT)、T3送风风量(T3_SWC)、T3排风风量(T3_EWC)、施胶前定量(Qsbq)、车速(V)、底层上网浓度(Bcon)、面层流浆箱压力(Spressure)、底层流浆箱压力(Bpressure)。
步骤S3具体步骤如下:
S31.依据步骤S2、S3,确定各预测模型特征变量,其中约束变量预测模型7个,分别为:T1排风湿度(T1_EWH)、T1排风温度(T1_EWT)、T2排风湿度(T2_EWH)、T2排风温度(T2_EWT)、T3排风湿度(T3_EWH)、T3排风温度(T3_EWT)、施胶前水分(Hum);能耗变量预测模型1个:干燥部蒸汽流量(DSQ);运用机器学习算法结合生产数据,建立Ridge回归模型、Elastic Net回归模型、SVR回归模型、RF回归模型等。各算法原理如下:
(1)Ridge算法:在线性回归损失函数的基础上加入L2正则项,在不舍弃特征变量的情况下,缩小回归系数,使模型相对稳定,其原理公式如下:
Figure BDA0002914258400000097
其中X=(x1,x2,x3,……,xn)是输入特征变量,Y=(y1,y2,y3,……,yn)是输出特征变量,θ=(θ1,θ2,θ3,……,θn)是输入特征变量系数,λ是惩罚项系数,
Figure BDA0002914258400000098
是惩罚项。
(2)Elastic Net算法:结合使用了系数向量的L1范数和L2范数的线性回归模型,使的可学习类似于Lasso一样稀疏的模型,还保留了Ridge的正则化属性,结合了两者的优点,适用于有多个特征变量彼此相关的模型。其原理公式如下:
Figure BDA0002914258400000101
其中X=(x1,x2,x3,……,xn)是输入特征变量,Y=(y1,y2,y3,……,yn)是输出特征变量,θ=(θ1,θ2,θ3,……,θn)是输入特征变量X系数,
Figure BDA0002914258400000102
是惩罚项。
(3)SVR算法:支持向量回归算法能够通过将非线性问题以核函数的方式映射到高维空间,从而将非线性问题转变为线性问题,具有较好的非线性处理能力和泛化能力。其原理公式如下:
Figure BDA0002914258400000103
其中,ω为权重系数,x为输入变量,b为偏置项,
Figure BDA0002914258400000104
αi为拉格朗日乘子,
Figure BDA0002914258400000105
为核函数。核函数可将线性不可分的低维特征数据映射到高维空间,将非线性问题转换为线性问题。常用核函数有线性核函数(Linear)、多项式核函数(Poly)、径向基核函数(RBF)和sigmoid核函数,公式如下:
线性核函数:K(xi,x)=xixT
多项式核函数:K(xi,x)=(γxixT+r)p,γ>0
径向基核函数:K(xi,x)=exp(-γ||xi-x||2),γ>0
sigmoid核函数:K(xi,x)=tan h(γxixT+r),γ>0
其中,γ,r,p为各核函数参数。
(4)RF算法:随机森林由多个随机决策树组成,回归问题中,最终结果取决于各随机决策树的加权。RF算法流程如下:
a.输入训练样本D={(x1,y1),(x2,y2),……,(xm,ym)}弱学习器迭代次数K;
b.对于k=1,2,…K对训练集进行第k次采样,采用自助法(bootstrap)采样,即随机有放回采样,共采集m次,得到采样集本Dk(含m个样本);在采样集Dk上训练第k个决策树模型Gk(x)。在训练该模型时RF只需要在所有样本特征中选择部分特征,最后在所选部分特征中确定节点分裂特征;
c.输出集成模型f(x)。
S32.计算各模型的平均绝对误差(MAPE)、平均相对误差(MAE)、拟合优度(R2)等指标,其中:
平均绝对误差计算公式:
Figure BDA0002914258400000111
平均相对误差计算公式:
Figure BDA0002914258400000112
拟合优度计算公式:
Figure BDA0002914258400000113
上述计算公式中,
Figure BDA0002914258400000114
是预测值,yi是实际值,/>
Figure BDA0002914258400000115
是平均值。
表1是不同机器学习算法建立的预测模型的各项评价指标,分析比较模型的评价指标,选综合选择最佳预测模型。
表1模型评价指标
Figure BDA0002914258400000116
步骤S4具体步骤如下:
S41.建立干燥部能耗公式:
Papertonprice=Spre*Psteam*6000/V*Qsbq*Ly
其中Papertonprice表示吨纸耗(yuan/t),Spre表示预测的干燥蒸汽流量(kg/s),V表示纸机车速(m/min),Qsbq施胶前定量(g/m2),Ly表示纸机幅宽(m);
排风机排风温度对应下的饱和湿度公式:
Figure BDA0002914258400000121
H=0.6228*(Ps/P-Ps)*1000
其式中,A,B,C为Antoine常数,可查数据表得,T表示排风机的排风温度,PS表示在排风温度下的饱和蒸气压,H表示排风温度下空气的饱和湿度。为防止发生滴露,气罩内空气温度应该维持在露点温度以上,安全起见,气罩内的相对湿度一般不超过饱和湿度的80%,即Hact<0.8H;
S42.生产中纸机干燥部风机的排风温湿度及出干燥部纸页的干度有工艺约束,即要求这些指标在合理的工艺范围内,如下式所示:
T1排风机的排风温度范围:T1min≤T1temp≤T1max
T2排风机的排风温度范围:T2min≤T2temp≤T2max
T3排风机的排风温度范围:T3min≤T3temp≤T3max
H1排风机的排风湿度范围:H1min≤H1hum≤H1max
H2排风机的排风湿度范围:H2min≤H2hum≤H2max
H3排风机的排风湿度范围:H3min≤H3hum≤H3max
施胶前纸页的水分:Mmin≤Mact≤Mmax
其中T1min、T2min、T3min、H1min、H2min、H3min、Mmin表示工艺范围的最低值,T1max、T2max、T3max、H1max、H2max、H3max、Mmax表示工艺范围的最高值。
步骤S5具体步骤如下:
输入干燥部能量系统运行优化模型参数,施胶前纸页定量108.66g/m2,车速1244.94m/s,底层上网浓度1.43%,面层流浆箱压力291.92kPa,底层流浆箱压力288.32kPa,如表2所示;运用遗传算法求解,各工艺参数的优化值如表3所示;实际工况下的蒸汽耗为19.28kg/s,吨纸成本约为129.90元,优化工艺参数下的蒸汽耗为17.53kg/s,吨纸成本为118.11元,每吨纸节约11.79元左右。遗传算法步骤如图6所示。
表2模型参数
Figure BDA0002914258400000131
表3工艺参数优化值
Figure BDA0002914258400000132
图7、图8是实际工况下蒸汽流量和平均蒸汽流量与本模型优化后的蒸汽流量和平均蒸汽流量结果对比图;
图9、图10是实际工况下吨纸成本和吨纸平均成本与本模型优化后的吨纸成本和吨纸平均成本结果对比图。

Claims (6)

1.基于数据驱动的箱板纸机干燥部能量系统运行优化方法,其特征在于,包括以下步骤:
S1:数据采集和数据预处理;
步骤S1具体步骤如下:
采集纸机干燥部生产数据,分析能耗状况,纸页干燥过程能耗是蒸汽和电,评估存在优化空间;运用箱型图法对数据预处理;
S2:特征变量选择分析;
步骤S2具体步骤如下:
S21.单变量特征选择,运用pearson相关系数法对采集的变量作单变量分析,分析干燥部工艺约束变量、能耗变量与其它变量间的相关性;
S22.多变量特征选择,GBDT算法中的重要性排序做多变量分析,采用CART作为基学习器,采用基尼指数来选择划分属性,通过基尼系数来选择节点属性,能在候选特征中选择最优特征来划分节点,并使得划分后的误差最小,即得到最优特征;
S3:建立纸页干燥过程关键参数预测模型;
步骤S3具体步骤如下:
S31.依据步骤S21、S22,确定各预测模型特征变量;
S32.计算各模型的平均绝对误差、平均相对误差、拟合优度指标;
S4:基于遗传算法建立干燥部能耗优化模型;
步骤S4具体步骤如下:
S41.建立干燥部能耗公式;
建立排风机排风温度对应下的饱和湿度公式;
S42.生产中纸机干燥部风机的排风温湿度及出干燥部纸页的干度有工艺约束,即要求这些指标在合理的工艺范围内;
S5:模型验证;
步骤S5具体步骤如下:
输入干燥部能量系统运行优化模型参数,使用遗传算法进行工艺参数求解。
2.根据权利要求1所述的基于数据驱动的箱板纸机干燥部能量系统运行优化方法,其特征在于,步骤S1运用箱型图法对数据预处理,将特征数据的四分之一分位值定为Q1,四分之三分位值定为Q3
Figure FDA0004223466820000011
其中,IQR为四分位距,limitmax为异常值上限,limitmin为异常值下限。
3.根据权利要求1所述的基于数据驱动的箱板纸机干燥部能量系统运行优化方法,其特征在于,步骤S21.单变量特征选择中,相关系数是反应两变量之间变化趋势的方向以及程度,用于两个变量之间的相关性分析,取值范围在[-1,1],其绝对值越大,相关性越强;相关系数越接近于-1,相关度越强,相关系数越接近于0,相关度越弱;其中,绝对值在0.8-1.0表示极强相关,在0.6-0.8表示强相关,在0.4-0.6表示中等程度相关,0.2-0.4表示弱相关,0-0.2表示极弱相关或无相关;相关系数的计算公式如下:
Figure FDA0004223466820000021
其中,Cov(X,Y)为X和Y的协方差,Var[X]、Var[Y]分别为X和Y的方差;
S22.多变量特征选择,假定数据集D,由CART作为基学习器建立的组合模型GBT,基学习器个数为K,每个特征节点的基尼指数计算公式如下:
Figure FDA0004223466820000022
Figure FDA0004223466820000023
其中,Gini(D)为数据集D的基尼值,pj为样本值j所占的比例,v为样本取值总数,Gini_index(D,a)为属性a在样本集D上的基尼指数;然后针对每个节点,计算候选特征集S中所有特征的基尼指数,选取使得划分后基尼指数最小的特征mmin作为节点特征;此时,由特征mmin造成的平均不纯度减少值ΔGini,即为mmin的贡献度:
Figure FDA0004223466820000024
Figure FDA0004223466820000025
按照上面这两个公式,搜索单个基学习器上所有分裂节点i的贡献度,然后对所有基学习器进行平均,即得到mmin的总体贡献度:
Figure FDA0004223466820000031
Figure FDA0004223466820000032
其中,
Figure FDA0004223466820000033
为单个基学习器特征mmin的贡献度,/>
Figure FDA0004223466820000034
为该特征最终贡献度。
4.根据权利要求1所述的基于数据驱动的箱板纸机干燥部能量系统运行优化方法,其特征在于:
S31步骤中预测模型特征变量7个,分别为:T1排风湿度、T1排风温度、T2排风湿度、T2排风温度、T3排风湿度、T3排风温度、施胶前纸页的水分;能耗变量预测模型1个:干燥部蒸汽流量即DSQ;运用机器学习算法结合生产数据,建立Ridge回归模型、Elastic Net回归模型、SVR回归模型、RF回归模型;
S32步骤中计算方法为:
平均绝对误差计算公式:
Figure FDA0004223466820000035
平均相对误差计算公式:
Figure FDA0004223466820000036
拟合优度计算公式:
Figure FDA0004223466820000037
上面三个计算公式中,
Figure FDA0004223466820000038
是预测值,yi是实际值,/>
Figure FDA0004223466820000039
是平均值;分析比较模型评价指标,选择最佳预测模型。
5.根据权利要求1所述的基于数据驱动的箱板纸机干燥部能量系统运行优化方法,其特征在于:
S41.中干燥部能耗公式:
Papertonprice=Spre*Psteam*600/V*Qsbq*Ly
其中Papertonprice表示吨纸耗(yuan/t),Spre表示预测的干燥蒸汽流量(kg/s),V表示纸机车速(m/min),Qsbq施胶前纸页定量(g/m2),Ly表示纸机幅宽(m);
排风机排风温度对应下的饱和湿度公式:
Figure FDA0004223466820000041
H=0.6228*(Ps/P-Ps)*1000
其式中,A,B,C为Antoine常数,查数据表得,T表示排风机的排风温度,Ps表示在排风温度下的饱和蒸气压,H表示排风温度下空气的饱和湿度;为防止发生滴露,气罩内空气温度维持在露点温度以上,安全起见,气罩内的相对湿度不超过饱和湿度的80%,即Hact<0.8H;
S42.合理的工艺范围,如下式所示:
T1排风机的排风温度范围:T1min≤T1temp≤T1max
T2排风机的排风温度范围:T2min≤T2temp≤T2max
T3排风机的排风温度范围:T3min≤T3temp≤T3max
H1排风机的排风湿度范围:H1min≤H1hum≤H1max
H2排风机的排风湿度范围:H2min≤H2hum≤H2max
H3排风机的排风湿度范围:H3min≤H3hum≤H3max
施胶前纸页的水分:Mmin≤Mact≤Mmax
其中T1min、T2min、T3min、H1min、H2min、H3min、Mmin表示工艺范围的最低值,T1max、T2max、T3max、H1max、H2max、H3max、Mmax表示工艺范围的最高值。
6.根据权利要求1所述的基于数据驱动的箱板纸机干燥部能量系统运行优化方法,其特征在于,步骤S5中模型参数,包括:施胶前纸页定量Qsbq,纸机车速V,底层上网浓度Bcon,面层流浆箱压力Spressure,底层流浆箱压力Bpressure
CN202110095976.1A 2021-01-25 2021-01-25 基于数据驱动的箱板纸机干燥部能量系统运行优化方法 Active CN112949162B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110095976.1A CN112949162B (zh) 2021-01-25 2021-01-25 基于数据驱动的箱板纸机干燥部能量系统运行优化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110095976.1A CN112949162B (zh) 2021-01-25 2021-01-25 基于数据驱动的箱板纸机干燥部能量系统运行优化方法

Publications (2)

Publication Number Publication Date
CN112949162A CN112949162A (zh) 2021-06-11
CN112949162B true CN112949162B (zh) 2023-06-23

Family

ID=76236343

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110095976.1A Active CN112949162B (zh) 2021-01-25 2021-01-25 基于数据驱动的箱板纸机干燥部能量系统运行优化方法

Country Status (1)

Country Link
CN (1) CN112949162B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113787759A (zh) * 2021-11-16 2021-12-14 武汉市宏伟纸箱包装有限公司 一种瓦楞纸箱包装的生产工艺智能选择方法
CN114351496B (zh) * 2021-12-17 2023-07-18 浙江华章科技有限公司 一种网压部真空系统压力自动整定方法及系统
CN115157481B (zh) * 2022-06-20 2023-07-25 沈阳华控科技发展有限公司 一种pvc干燥装置的热量控制方法
CN117743772B (zh) * 2023-12-29 2024-05-28 维达纸业(浙江)有限公司 基于人工智能模型的卫生纸干燥参数优化方法及系统

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102009011217A1 (de) * 2009-03-04 2010-09-09 Siemens Aktiengesellschaft Steuerung der erweiterten Trockenpartie einer Papiermaschine
CN109577064B (zh) * 2018-12-14 2020-06-19 华南理工大学 用于卫生纸机干燥部能耗与蒸发量预测的机理建模方法
CN111400832B (zh) * 2020-03-11 2021-07-20 广州博依特智能信息科技有限公司 用于卫生纸机干燥部关键运行参数预测的混合建模方法
CN111241717A (zh) * 2020-03-11 2020-06-05 广州博依特智能信息科技有限公司 基于机理模型的卫生纸机干燥部操作参数优化方法
CN111893791A (zh) * 2020-07-17 2020-11-06 广州博依特智能信息科技有限公司 基于智能算法的生活用纸造纸机干燥部运行优化方法

Also Published As

Publication number Publication date
CN112949162A (zh) 2021-06-11

Similar Documents

Publication Publication Date Title
CN112949162B (zh) 基于数据驱动的箱板纸机干燥部能量系统运行优化方法
CN103927412B (zh) 基于高斯混合模型的即时学习脱丁烷塔软测量建模方法
CN112613536A (zh) 一种基于smote和深度学习的近红外光谱柴油牌号识别方法
Witajewski-Baltvilks et al. Induced technological change and energy efficiency improvements
CN113657452A (zh) 基于主成分分析和超级学习的烟叶质量等级分类预测方法
Soares et al. Design and application of soft sensor using ensemble methods
Neto et al. A superstructure-based methodology for simultaneously sizing and arranging additional evaporator bodies in multiple-effect evaporator plants
Ye et al. Financial structure, technology, and economic growth: a structural matching perspective
CN115630332A (zh) 一种小麦粉粉质特性预测方法
CN115458078A (zh) 一种基于多工况分布式输出过程补偿宽度迁移建模方法
CN112464168B (zh) 一种综合能源潜力用户靶向评估提取方法
CN114330485A (zh) 基于pls-svm-ga算法的电网投资能力预测方法
CN111220565B (zh) 一种基于cpls的红外光谱测量仪器标定迁移方法
CN114740713A (zh) 一种湿法烟气脱硫过程的多目标优化控制方法
CN113033864A (zh) 一种基于能源大数据的新建企业用能预测方法
CN113379093A (zh) 油气集输系统能耗分析与优化方法
Aquino et al. Prediction of Moisture Content of Chlorella Vulgaris Microalgae Using Hybrid Evolutionary Computing and Neural Network Variants for Biofuel Production
Tang et al. Octane number prediction of blend gasoline based on improved particle swarm optimization
CN113488113B (zh) 一种复烤片烟的工业使用价值识别方法
Tan Carbon Emission Prediction with Macroeconomic Variables and Machine Learning
WO2024077876A1 (zh) 一种基于自适应的局部动态焦炭质量预测方法
CN114295578B (zh) 基于近红外光谱的烟叶常规化学成分通用模型建模方法
CN117298826A (zh) 基于在线学习融合算法的燃煤电厂脱硫自动控制方法
Kartiwi et al. Feature Selection for Financial Data Classification: Islamic Finance Application
CN117200188A (zh) 一种长期负荷预测方法及终端

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant