CN115115102A - 一种基于bp神经网络和条件生成对抗网络的汽油辛烷值损失预测及优化方法 - Google Patents

一种基于bp神经网络和条件生成对抗网络的汽油辛烷值损失预测及优化方法 Download PDF

Info

Publication number
CN115115102A
CN115115102A CN202210707808.8A CN202210707808A CN115115102A CN 115115102 A CN115115102 A CN 115115102A CN 202210707808 A CN202210707808 A CN 202210707808A CN 115115102 A CN115115102 A CN 115115102A
Authority
CN
China
Prior art keywords
data
value
octane number
gasoline
loss
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210707808.8A
Other languages
English (en)
Other versions
CN115115102B (zh
Inventor
王晗
刘佳丽
包银鑫
施佺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nantong University
Original Assignee
Nantong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nantong University filed Critical Nantong University
Priority to CN202210707808.8A priority Critical patent/CN115115102B/zh
Publication of CN115115102A publication Critical patent/CN115115102A/zh
Application granted granted Critical
Publication of CN115115102B publication Critical patent/CN115115102B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Computational Linguistics (AREA)
  • Development Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Game Theory and Decision Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于BP神经网络和条件生成对抗网络的汽油辛烷值损失预测与优化方法,包括以下步骤:采集催化裂化汽油历史数据,对历史数据进行预处理,降低冗余度和复杂度;对处理后的数据进行特征降维,筛选建模所需的主要数据成分,并建立筛选评价指标,评估筛选合理性;构建基于相对熵的BP神经网络预测模型,对汽油辛烷值损失进行预测;构建基于条件生成对抗网络的优化模型,以硫含量为约束条件,筛选规定损失幅度下的数据,并对筛选的数据的操作变量进行优化。本发明能够显著提高汽油辛烷值损失预测精度,降低汽油中硫和烯烃的含量,减少汽油燃烧后有害气体的排放,减轻汽车尾气引起的环境污染。

Description

一种基于BP神经网络和条件生成对抗网络的汽油辛烷值损失 预测及优化方法
技术领域
本发明属于机器学习领域和化学工业领域,具体涉及基于BP神经网络和条件生成对抗网络的汽油辛烷值损失预测及优化方法。
技术背景
汽油是小型车辆的主要燃料,世界各国都制定了日益严格的汽油质量标准。
我国石油消耗量大,原油对外依存度超过70%。2019年我国石油进口量达到5.06亿吨,同比增长9.55%。原油中大部分是中东地区的含硫和高硫原油,原油中的重油无法直接利用。以催化裂化为核心的重油轻质化工艺技术是将重油转化为汽油、柴油和低碳烯烃的一种方式。截止2020年第二季度,中国炼油厂6月原油加工量创历史新高,超过美国,成为了全球最大炼油中心。
成品汽油中硫和烯烃含量过高,无法满足汽油质量标准,因此必须要对催化裂化汽油进行精制处理。辛烷值(以RON表示)是反映汽油燃烧性能的最重要的指标。本发明设计的算法能够对辛烷值损失进行预测并分析每个样本的优化操作条件,以达到在保证汽油产品脱硫效果的前提下,尽量降低汽油辛烷值损失的效果,减少汽油燃烧后有害气体的排放。
发明内容
发明目的:针对上述问题,本发明引入一种基于BP神经网络和条件生成对抗网络的汽油辛烷值损失预测及优化方法。该方法针对成品汽油中硫和烯烃含量过高,无法满足汽油质量标准的问题,设计了一种新的算法对辛烷值损失进行预测并分析每个样本的优化操作条件,以达到在保证汽油产品脱硫效果的前提下,尽量降低汽油辛烷值损失的效果。
首先,将采集到的催化裂化汽油历史数据传输至后台服务器,对历史数据进行预处理来降低冗余度和复杂度。然后,对预处理完的数据进行特征降维,筛选出建模所需的主要变量,并建立筛选评价指标评估筛选合理性。接着,构建基于相对熵的BP神经网络预测模型,对汽油辛烷值损失进行预测。最后,构建基于条件生成对抗网络的优化模型,以硫含量为约束条件,筛选规定损失幅度下的数据,并对筛选的数据的操作变量进行优化。本发明有效利用机器学习方法对辛烷值损失进行预测和优化,提高汽油辛烷值损失预测的精度,降低汽油中硫和烯烃的含量,减少汽油燃烧后有害气体的排放,以此来减轻汽车尾气带来的环境污染问题。
技术方案:一种基于BP神经网络和条件生成对抗网络的汽油辛烷值损失预测及优化方法,包括如下步骤:
步骤1)采集催化裂化汽油历史数据,传输至后台服务器,对历史数据进行预处理来降低冗余度和复杂度;
步骤2)对预处理完的数据进行特征降维,筛选出建模所需的主要变量,并建立筛选评价指标,评估筛选合理性;
步骤3)构建基于相对熵的BP神经网络预测模型,对汽油辛烷值损失进行预测;
步骤4)构建基于条件生成对抗网络的优化模型,以硫含量为约束条件,筛选规定损失幅度下的数据,并对筛选的数据的操作变量进行优化。
进一步,所述步骤1中,采集催化裂化汽油历史数据,传输至后台服务器,对数据进行预处理,具体步骤如下:
首先,进行数据清晰与修复。设定超过20个缺失值的数据为失去修复价值的数据列。通过对样本数据进行分析,建立数据清洗模型,如式(1)所示。
Figure BDA0003706105410000031
其中,Find(Ti)是缺失值超过20个的列号,Vj是第j个数据列。利用建立的数据剔除模型对原始数据完成数据剔除工作。
然后,针对缺失少于20个数值的数据进行修复。利用数据清洗模型对需要数据修复的数据点位进行查询,确定缺失值的位置后,对缺失的数据进行修复,对空值处的数据采用前后两个小时的平均值来代替,如式(2)所示。
Figure BDA0003706105410000032
其中,Repair(i,j)表示对空值(i,j)处的数据进行修复。
接着,对原始数据的操作范围进行提取,采用最大-最小的限幅方法剔除一部分不在此范围内的数据。剔除超范围数值后,继续对样本数据采用拉依达准则进行坏值剔除。拉依达准则假设一组被测的数据只含有随机误差,通过贝塞尔公式计算得到标准差,若某个测量值xb的剩余误差vb(1<=b<=n),满足|vb|=|xb-x|>3σ,则认为xb是含有粗大误差值的坏值,应予剔除。贝塞尔公式如式(3)所示。
Figure BDA0003706105410000033
以辛烷值数据测定的时间点为基准时间,取其前2个小时的操作变量数据的平均值作为对应辛烷值的操作变量数据,计算出所需的操作变量数据。
进一步,所述步骤2中,对预处理完的数据进行特征降维,依据信息熵进行数据的第一轮筛选,具体步骤如下:
3-1信息熵是信息论中最重要的概念,其数值越大就代表其包含的信息量越大,求解方法如式(4)所示。
Figure BDA0003706105410000041
其中,i表示第i个样本,j表示第j个操作变量,Hj表示第j个操作变量的信息熵,p(Xi,j)表示第j个操作变量中第i个样本的数值在操作变量中出现的概率。以所有信息熵的平均值为阈值,对信息熵过低的变量进行删除。
3-2一轮筛选结束后,继续依据MIC进行二轮筛选。MIC是信息论里一种有用的信息度量,其实质是对蒙特卡洛法近似计算出的互信息归一化的结果,首先计算两个序列的互信息I(x:y),如式(5)所示。
Figure BDA0003706105410000042
其中p(x,y)是联合概率密度函数,p(x)p(y)为边缘概率密度函数。
采用类似于蒙特卡洛法的方案将序列x,y构成的散点图网格化。通过网格化后的散点分布估计其联合概率分布,估计的公式为:
Figure BDA0003706105410000043
MIC及对近似的互信息I(X:Y)的最大值归一化公式为:
Figure BDA0003706105410000044
式中X,Y分别表示散点图网格化后x方向与y方向划分的段数, |x||y|即整体的网格数。B为超参数其数值应设定为数据总量的0.6次方。
进一步,所述步骤3中,构建基于相对熵的BP神经网络预测模型,对汽油辛烷值损失进行预测。模型结构包含输入层、隐藏层和输出层,每一层由若干个神经元(即节点个数)组成,任意相邻的两层之间均为全连接层,具体步骤如下:
4-1采用自编码器添加稀疏性限制以此抑制过拟合的方法,对隐藏层进行稀疏性限制,在误差函数中加入KL散度作为额外的惩罚因子来限制隐藏层神经元的平均活跃度。设优化后的误差函数为
Figure BDA0003706105410000051
Figure BDA0003706105410000052
Figure BDA0003706105410000053
ρ为稀疏系数,通常情况下为一个接近于0的值。
Figure BDA0003706105410000054
为训练集中隐藏层输出值的平均函数。ypred为模型输出的预测值,ytrue为真实值。目标函数即为两者误差最小;
4-2设输入层变量矩阵为X,输入层到隐藏层之间的权重矩阵为 W1、偏置矩阵为b1,隐藏层到输出层之间的权重矩阵为W2、偏置矩阵为b2,则隐藏层的输出hidden=tanh(X·W1+b1),输出层为: output=tanh(Hidden·W2+b2);
4-3在经过一次前向计算时,得到一次输出值output,模型中输出值即为预测的辛烷值。将输出值ypred与辛烷值的实际值ytrue进行比较,确定误差。
4-4调整模型参数,重复训练直到得到模型最优解。
4-5使用RMSE(均方根误差)、MAE(平均绝对误差)、R2(决定系数)、MAPE(平均绝对百分比误差)作为评价指标测试模型训练效果。
进一步,所述步骤4中,构建基于条件生成对抗网络的优化模型,以硫含量为约束条件,筛选规定损失幅度下的数据,并对筛选的数据的操作变量进行优化,具体步骤如下:
5-1根据硫含量将预处理后的原始数据划分为正样本和负样本,通过对预处理后的样本数据进行分析,以硫含量不大于5ug/g为划分依据,对原始的样本数据进行样本集划分,样本标记公式为:
Figure BDA0003706105410000061
通过遍历操作,划分出正样本和负样本集。考虑到正负样本之间数量不平衡,会对后续实验结果产生影响,采用cross entropy(CE)loss 的改进版,实现对正、负样本数目不平衡的调整,公式为:
FL(pt)=-∝t(1-pt)γlog(pt) (12)
5-2搭建CGAN神经网络,将正、负样本结合条件变量输入判别器进行训练,具体步骤如下:
5-2-1搭建基于条件生成对抗网络(CGAN)的样本生成模型框架,CGAN是在GAN基础上做的一种改进,通过对原始的GAN的生成器和判别器的输入量添加额外的条件信息,实现条件生成模型。
5-2-2确定生成器和判别器网络结构,使用传统的全连接神经网络结构作为生成器和判别器的网络结构。
5-2-3确定损失函数,原始的GAN的损失函数为:
minG maxD V(D,G)=Ea~pdata(a)[logD(a)]+Ez~pdata(z)[log(1- D(G(z)))] (13)
CGAN在添加额外信息后需要和a与z进行合并,作为G和D 的输入,因此构建的CGAN损失函数公式为:
minG maxD V(D,G)=Ea~pdata(a)[log D(a|b)]+Ez~pdata(z)[log(1- D(G(z|b)))](14)
5-2-4组合辛烷值损失预测模型,通过辛烷值损失预测模型,寻找损失降幅大于规定值的样本对应的主要变量优化后的操作条件。
5-3将条件变量输入生成器生成操作变量,并利用判别器进行生成器的训练,利用训练好的CGAN神经网络输出每个样本的操作变量。使用正样本集和负样本集对判别器网络的进行训练,使用公式
FL(pt)=-∝t(1-pt)γlog(pt) (15)
对损失值进行调整,降低数据偏向性。将训练好的判别器模型参数放入CGAN网络中,输入为原料性质、产品性质、待生吸附剂性质、再生吸附剂性质筛选后的变量,训练完CGAN网络后,利用CGAN 网络生成器对条件变量的操作变量进行生成。
5-4利用步骤3)建立的辛烷值损失预测模型预测每个样本的操作变量相应的损失值,并计算辛烷值(RON)损失降幅大于规定值的样本对应的主要变量优化后的操作条件。
附图说明
图1为本发明的一种基于BP神经网络和条件生成对抗网络的汽油辛烷值损失预测及优化方法步骤示意图;
图2为本发明的一种基于BP神经网络和条件生成对抗网络的汽油辛烷值损失预测及优化方法数据处理思路流程图;
图3为本发明的一种基于BP神经网络和条件生成对抗网络的汽油辛烷值损失预测及优化方法数据降维思路流程图;
图4为本发明的一种基于BP神经网络和条件生成对抗网络的汽油辛烷值损失预测及优化方法基于相对熵的BP神经网络预测模型思路流程图;
图5为本发明的一种基于BP神经网络和条件生成对抗网络的汽油辛烷值损失预测及优化方法基于条件生成对抗网络的优化模型思路流程图;
图6为本发明的一种基于BP神经网络和条件生成对抗网络的汽油辛烷值损失预测及优化方法CGAN模型框架搭建图;
图7为本发明的一种基于BP神经网络和条件生成对抗网络的汽油辛烷值损失预测及优化方法组合辛烷值损失预测模型;
图8为本发明的一种基于BP神经网络和条件生成对抗网络的汽油辛烷值损失预测及优化方法判别器测试集拟合情况图;
图9为本发明的一种基于BP神经网络和条件生成对抗网络的汽油辛烷值损失预测及优化方法CGAN训练损失曲线图;
图10为本发明的一种基于BP神经网络和条件生成对抗网络的汽油辛烷值损失预测及优化方法优化前后辛烷值损失对比图。
具体实施步骤
下面将结合说明书附图对本发明的技术方法做进一步的详细说明。
如图1所示,一种基于BP神经网络和条件生成对抗网络的汽油辛烷值损失预测及优化方法,包括如下步骤:
步骤1)采集催化裂化汽油历史数据,传输至后台服务器,对历史数据进行预处理,降低冗余度和复杂度;
所述步骤1中,采集催化裂化汽油历史数据,传输至后台服务器,对数据进行预处理,流程如图2所示。
首先,进行数据清晰与修复。设定超过20个缺失值的数据为失去修复价值的数据列。通过对样本数据进行分析,建立数据清洗模型,如式(1)所示。
Figure BDA0003706105410000081
其中,Find(Ti)是缺失值超过20个的列号,Vj是第j个数据列。利用建立的数据剔除模型对原始数据完成数据剔除工作。
然后,针对缺失少于20个数值的数据进行修复。利用数据清洗模型对需要数据修复的数据点位进行查询,确定缺失值的位置后,对缺失的数据进行修复,对空值处的数据采用前后两个小时的平均值来代替,如式(2)所示。
Figure BDA0003706105410000091
其中,Repair(i,j)表示对空值(i,j)处的数据进行修复。
接着,对原始数据的操作范围进行提取,采用最大-最小的限幅方法剔除一部分不在此范围内的数据。剔除超范围数值后,继续对样本数据采用拉依达准则进行坏值剔除。拉依达准则假设一组被测的数据只含有随机误差,通过贝塞尔公式计算得到标准差,若某个测量值xb的剩余误差vb(1<=b<=n),满足|vb|=|xb-x|>3σ,则认为xb是含有粗大误差值的坏值,应予剔除。贝塞尔公式如式(3)所示。
Figure BDA0003706105410000092
以辛烷值数据测定的时间点为基准时间,取其前2个小时的操作变量数据的平均值作为对应辛烷值的操作变量数据,计算出所需的操作变量数据。
步骤2)对预处理后的数据进行特征降维,筛选出建模所需的主要变量,并建立筛选评价指标,评估筛选合理性;
所述步骤2中,对预处理完的数据进行特征降维,流程如图3所示。依据信息熵进行数据的第一轮筛选,具体步骤如下:
步骤2-1:信息熵是信息论中最重要的概念,其数值越大就代表其包含的信息量越大,求解方法如式(4)所示。
Figure BDA0003706105410000101
其中,i表示第i个样本,j表示第j个操作变量,Hj表示第j个操作变量的信息熵,p(Xi,j)表示第j个操作变量中第i个样本的数值在操作变量中出现的概率。以所有信息熵的平均值为阈值,对信息熵过低的变量进行删除。
步骤2-2:一轮筛选结束后,继续依据MIC进行二轮筛选。MIC 是信息论里一种有用的信息度量,其实质是对蒙特卡洛法近似计算出的互信息归一化的结果,首先计算两个序列的互信息I(x:y),如式(5) 所示。
Figure BDA0003706105410000102
其中p(x,y)是联合概率密度函数,p(x)p(y)为边缘概率密度函数。
采用类似于蒙特卡洛法的方案将序列x,y构成的散点图网格化。通过网格化后的散点分布估计其联合概率分布,估计的公式为:
Figure BDA0003706105410000103
MIC及对近似的互信息I(X:Y)的最大值归一化公式为:
Figure BDA0003706105410000104
式中X,Y分别表示散点图网格化后x方向与y方向划分的段数, |x||y|即整体的网格数。B为超参数其数值应设定为数据总量的0.6次方。
步骤3)构建基于相对熵的BP神经网络预测模型,对汽油辛烷值损失进行预测;
所述步骤3中,构建基于相对熵的BP神经网络预测模型,对汽油辛烷值损失进行预测,流程如图4所示。模型结构包含输入层、隐藏层和输出层,每一层由若干个神经元(即节点个数)组成,任意相邻的两层之间均为全连接层,具体步骤如下:
步骤3-1:采用自编码器添加稀疏性限制以此抑制过拟合的方法,对隐藏层进行稀疏性限制,在误差函数中加入KL散度作为额外的惩罚因子来限制隐藏层神经元的平均活跃度。设优化后的误差函数为
Figure BDA0003706105410000111
Figure BDA0003706105410000112
Figure BDA0003706105410000113
ρ为稀疏系数,通常情况下为一个接近于0的值。
Figure BDA0003706105410000114
为训练集中隐藏层输出值的平均函数。ypred为模型输出的预测值,ytrue为真实值。目标函数即为两者误差最小;
步骤3-2:设输入层变量矩阵为X,输入层到隐藏层之间的权重矩阵为W1、偏置矩阵为b1,隐藏层到输出层之间的权重矩阵为W2、偏置矩阵为b2,则隐藏层的输出hidden=tanh(X·W1+b1),输出层为:output=tanh(Hidden·W2+b2);
步骤3-3:在经过一次前向计算时,得到一次输出值output,模型中输出值即为预测的辛烷值。将输出值ypred与辛烷值的实际值ytrue进行比较,确定误差。
步骤3-4:调整模型参数,重复训练直到得到模型最优解。
步骤3-5:使用RMSE(均方根误差)、MAE(平均绝对误差)、 R2(决定系数)、MAPE(平均绝对百分比误差)作为评价指标测试模型训练效果。
步骤4)构建基于条件生成对抗网络的优化模型,以硫含量为约束条件,筛选规定损失幅度下的数据,并对筛选的数据的操作变量进行优化。
所述步骤4中,构建基于条件生成对抗网络的优化模型,以硫含量为约束条件,筛选规定损失幅度下的数据,并对筛选的数据的操作变量进行优化,思路流程如图5所示,具体步骤如下:
步骤4-1:根据硫含量将预处理后的原始数据划分为正样本和负样本,通过对预处理后的样本数据进行分析,以硫含量不大于5ug/g 为划分依据,对原始的样本数据进行样本集划分,样本标记公式为:
Figure BDA0003706105410000121
通过遍历操作,划分出正样本和负样本集。考虑到正负样本之间数量不平衡,会对后续实验结果产生影响,采用cross entropy(CE)loss 的改进版,实现对正、负样本数目不平衡的调整,公式为:
FL(pt)=-∝t(1-pt)γlog(pt) (12)
步骤4-2:搭建CGAN神经网络,将正、负样本结合条件变量输入判别器进行训练,具体步骤如下:
步骤4-2-1:搭建基于条件生成对抗网络(CGAN)的样本生成模型框架,CGAN是在GAN基础上做的一种改进,通过对原始的 GAN的生成器和判别器的输入量添加额外的条件信息,实现条件生成模型。
步骤4-2-2:确定生成器和判别器网络结构,使用传统的全连接神经网络结构作为生成器和判别器的网络结构。
步骤4-2-3:确定损失函数,原始的GAN的损失函数为:
minG maxD V(D,G)=Ea~pdata(a)[log D(a)]+Ez~pdata(z)[log(1- D(G(z)))] (13)
CGAN在添加额外信息后需要和a与z进行合并,作为G和D 的输入,因此构建的CGAN损失函数公式为:
minG maxD V(D,G)=Ea~pdata(a)[log D(a|b)]+Ez~pdata(z)[log(1- D(G(z|b)))](14)
步骤4-2-4:组合辛烷值损失预测模型,通过辛烷值损失预测模型,寻找损失降幅大于规定值的样本对应的主要变量优化后的操作条件。
步骤4-3:将条件变量输入生成器生成操作变量,并利用判别器进行生成器的训练,利用训练好的CGAN神经网络输出每个样本的操作变量。使用正样本集和负样本集对判别器网络的进行训练,使用公式
FL(pt)=-∝t(1-pt)γ log(pt) (15)
对损失值进行调整,降低数据偏向性。将训练好的判别器模型参数放入CGAN网络中,输入为原料性质、产品性质、待生吸附剂性质、再生吸附剂性质筛选后的变量,训练完CGAN网络后,利用CGAN 网络生成器对条件变量的操作变量进行生成。
步骤4-4:利用步骤3)建立的辛烷值损失预测模型预测每个样本的操作变量相应的损失值,并计算辛烷值(RON)损失降幅大于规定值的样本对应的主要变量优化后的操作条件。
本发明针对成品汽油中硫和烯烃含量过高,无法在保证汽油产品脱硫效果的前提下,降低汽油辛烷值损失的问题,首先,将采集到的催化裂化汽油历史数据传输至后台服务器,对历史数据进行预处理来降低冗余度和复杂度。然后,对预处理完的数据进行特征降维,筛选出建模所需的主要变量,并建立筛选评价指标评估筛选合理性。接着,构建基于相对熵的BP神经网络预测模型,对汽油辛烷值损失进行预测。最后,构建基于条件生成对抗网络的优化模型,以硫含量为约束条件,筛选规定损失幅度下的数据,并对筛选的数据的操作变量进行优化。本发明有效利用机器学习方法对辛烷值损失进行预测和优化,提高汽油辛烷值损失预测的精度,降低汽油中硫和烯烃的含量,减少汽油燃烧后有害气体的排放,以此来减轻汽车尾气带来的环境污染问题。
以上所述仅为本发明在开源历史数据集下较好的实施方式,本发明保护范围并不以上述实施方式为限制,但凡本领域普通技术人员根据本发明所揭示内容所作的等效修改和其他修饰变化,皆应纳入权利要求书记载的保护范围。

Claims (5)

1.一种基于BP神经网络和条件生成对抗网络的汽油辛烷值损失预测及优化方法,其特征在于:包括如下步骤:
步骤1)采集催化裂化汽油历史数据,传输至后台服务器,对历史数据进行预处理,降低冗余度和复杂度;
步骤2)对预处理后的数据进行特征降维,筛选出建模所需的主要变量,并建立筛选评价指标,评估筛选合理性;
步骤3)构建基于相对熵的BP神经网络预测模型,对汽油辛烷值损失进行预测;
步骤4)构建基于条件生成对抗网络的优化模型,以硫含量为约束条件,筛选规定损失幅度下的数据,并对筛选的数据的操作变量进行优化。
2.根据权利要求1所述的一种基于BP神经网络和条件生成对抗网络的汽油辛烷值损失预测及优化方法,其特征在于:所述步骤1中,采集催化裂化汽油历史数据,传输至后台服务器,对数据进行预处理,具体步骤如下:
首先,进行数据清晰与修复,设定超过20个缺失值的数据为失去修复价值的数据列,通过对样本数据进行分析,建立数据清洗模型,如式(1)所示:
Figure FDA0003706105400000011
其中,Find(Ti)是缺失值超过20个的列号,Vj是第j个数据列;利用建立的数据剔除模型对原始数据完成数据剔除工作;
然后,针对缺失少于20个数值的数据进行修复,利用数据清洗模型对需要数据修复的数据点位进行查询,确定缺失值的位置后,对缺失的数据进行修复,对空值处的数据采用前后两个小时的平均值来代替,如式(2)所示:
Figure FDA0003706105400000021
其中,Repair(i,j)表示对空值(i,j)处的数据进行修复;
接着,对原始数据的操作范围进行提取,采用最大-最小的限幅方法剔除一部分不在此范围内的数据;剔除超范围数值后,继续对样本数据采用拉依达准则进行坏值剔除,拉依达准则假设一组被测的数据只含有随机误差,通过贝塞尔公式计算得到标准差,若某个测量值xb的剩余误差vb(1<=b<=n),满足|vb|=|xb-x|>3σ,则认为xb是含有粗大误差值的坏值,应予剔除,贝塞尔公式如式(3)所示:
Figure FDA0003706105400000022
以辛烷值数据测定的时间点为基准时间,取其前2个小时的操作变量数据的平均值作为对应辛烷值的操作变量数据,计算出所需的操作变量数据。
3.根据权利要求1所述的一种基于BP神经网络和条件生成对抗网络的汽油辛烷值损失预测及优化方法,其特征在于:所述步骤2中,对预处理完的数据进行特征降维,依据信息熵进行数据的第一轮筛选,具体步骤如下:
3-1信息熵是信息论中最重要的概念,其数值越大就代表其包含的信息量越大,求解方法如式(4)所示:
Figure FDA0003706105400000023
其中,i表示第i个样本,j表示第j个操作变量,Hj表示第j个操作变量的信息熵,p(Xi,j)表示第j个操作变量中第i个样本的数值在操作变量中出现的概率,以所有信息熵的平均值为阈值,对信息熵过低的变量进行删除;
3-2一轮筛选结束后,继续依据MIC进行二轮筛选,MIC是信息论里一种有用的信息度量,其实质是对蒙特卡洛法近似计算出的互信息归一化的结果,首先计算两个序列的互信息I(x:y),如式(5)所示:
Figure FDA0003706105400000031
其中p(x,y)是联合概率密度函数,p(x)p(y)为边缘概率密度函数;
采用类似于蒙特卡洛法的方案将序列x,y构成的散点图网格化,通过网格化后的散点分布估计其联合概率分布,估计的公式为:
Figure FDA0003706105400000032
MIC及对近似的互信息I(X:Y)的最大值归一化公式为:
Figure FDA0003706105400000033
式中X,Y分别表示散点图网格化后x方向与y方向划分的段数,|x||y|即整体的网格数,B为超参数其数值应设定为数据总量的0.6次方。
4.根据权利要求1所述的一种基于BP神经网络和条件生成对抗网络的汽油辛烷值损失预测及优化方法,其特征在于:所述步骤3中,构建基于相对熵的BP神经网络预测模型,对汽油辛烷值损失进行预测,模型结构包含输入层、隐藏层和输出层,每一层由若干个神经元组成,任意相邻的两层之间均为全连接层,具体步骤如下:
4-1采用自编码器添加稀疏性限制以此抑制过拟合的方法,对隐藏层进行稀疏性限制,在误差函数中加入KL散度作为额外的惩罚因子来限制隐藏层神经元的平均活跃度,设优化后的误差函数为
Figure FDA0003706105400000034
Figure FDA0003706105400000035
Figure FDA0003706105400000041
ρ为稀疏系数,通常情况下为一个接近于0的值,
Figure FDA0003706105400000042
为训练集中隐藏层输出值的平均函数,ypred为模型输出的预测值,ytrue为真实值,目标函数即为两者误差最小;
4-2设输入层变量矩阵为X,输入层到隐藏层之间的权重矩阵为W1、偏置矩阵为b1,隐藏层到输出层之间的权重矩阵为W2、偏置矩阵为b2,则隐藏层的输出hidden=tanh(X·W1+b1),输出层为:output=tanh(Hidden·W2+b2);
4-3在经过一次前向计算时,得到一次输出值output,模型中输出值即为预测的辛烷值,将输出值ypred与辛烷值的实际值ytrue进行比较,确定误差;
4-4调整模型参数,重复训练直到得到模型最优解;
4-5使用RMSE(均方根误差)、MAE(平均绝对误差)、R2(决定系数)、MAPE(平均绝对百分比误差)作为评价指标测试模型训练效果。
5.根据权利要求1所述的一种基于BP神经网络和条件生成对抗网络的汽油辛烷值损失预测及优化方法,其特征在于:所述步骤4中,构建基于条件生成对抗网络的优化模型,以硫含量为约束条件,筛选规定损失幅度下的数据,并对筛选的数据的操作变量进行优化,具体步骤如下:
5-1根据硫含量将预处理后的原始数据划分为正样本和负样本,通过对预处理后的样本数据进行分析,以硫含量不大于5ug/g为划分依据,对原始的样本数据进行样本集划分,样本标记公式为:
Figure FDA0003706105400000043
通过遍历操作,划分出正样本和负样本集,考虑到正负样本之间数量不平衡,会对后续实验结果产生影响,采用cross entropy(CE)loss的改进版,实现对正、负样本数目不平衡的调整,公式为:
FL(pt)=-∝t(1-pt)γlog(pt) (12)
5-2搭建CGAN神经网络,将正、负样本结合条件变量输入判别器进行训练,具体步骤如下:
5-2-1搭建基于条件生成对抗网络(CGAN)的样本生成模型框架,CGAN是在GAN基础上做的一种改进,通过对原始的GAN的生成器和判别器的输入量添加额外的条件信息,实现条件生成模型;
5-2-2确定生成器和判别器网络结构,使用传统的全连接神经网络结构作为生成器和判别器的网络结构;
5-2-3确定损失函数,原始的GAN的损失函数为:
minG maxD V(D,G)=Ea~pdata(a)[2ogD(a)]+Ez~pdata(z)[log(1-D(G(z)))] (13)
CGAN在添加额外信息后需要和a与z进行合并,作为G和D的输入,因此构建的CGAN损失函数公式为:
minG maxD V(D,G)=Ea~pdata(a)[logD(a|b)]+Ez~pdata(z)[log(1-D(G(z|b)))] (14)
5-2-4组合辛烷值损失预测模型,通过辛烷值损失预测模型,寻找损失降幅大于规定值的样本对应的主要变量优化后的操作条件;
5-3将条件变量输入生成器生成操作变量,并利用判别器进行生成器的训练,利用训练好的CGAN神经网络输出每个样本的操作变量,使用正样本集和负样本集对判别器网络的进行训练,使用公式
FL(pt)=-∝t(1-pt)γlog(pt) (15)
对损失值进行调整,降低数据偏向性,将训练好的判别器模型参数放入CGAN网络中,输入为原料性质、产品性质、待生吸附剂性质、再生吸附剂性质筛选后的变量,训练完CGAN网络后,利用CGAN网络生成器对条件变量的操作变量进行生成;
5-4利用步骤3)建立的辛烷值损失预测模型预测每个样本的操作变量相应的损失值,并计算辛烷值(RON)损失降幅大于规定值的样本对应的主要变量优化后的操作条件。
CN202210707808.8A 2022-06-21 2022-06-21 一种基于bp神经网络和条件生成对抗网络的汽油辛烷值损失预测及优化方法 Active CN115115102B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210707808.8A CN115115102B (zh) 2022-06-21 2022-06-21 一种基于bp神经网络和条件生成对抗网络的汽油辛烷值损失预测及优化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210707808.8A CN115115102B (zh) 2022-06-21 2022-06-21 一种基于bp神经网络和条件生成对抗网络的汽油辛烷值损失预测及优化方法

Publications (2)

Publication Number Publication Date
CN115115102A true CN115115102A (zh) 2022-09-27
CN115115102B CN115115102B (zh) 2024-06-21

Family

ID=83327727

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210707808.8A Active CN115115102B (zh) 2022-06-21 2022-06-21 一种基于bp神经网络和条件生成对抗网络的汽油辛烷值损失预测及优化方法

Country Status (1)

Country Link
CN (1) CN115115102B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111882119A (zh) * 2020-07-10 2020-11-03 南通大学 基于sa-bp神经网络的电池soh预测优化方法
CN112307001A (zh) * 2020-11-02 2021-02-02 中南大学 基于da优化的汽油精炼过程中辛烷值损失预测方法与系统
CN112489733A (zh) * 2020-12-14 2021-03-12 郑州轻工业大学 基于粒子群算法和神经网络的辛烷值损失预测方法
EP3798917A1 (en) * 2019-09-24 2021-03-31 Naver Corporation Generative adversarial network (gan) for generating images
CN113362913A (zh) * 2021-05-27 2021-09-07 南通大学 一种基于随机森林回归的汽油辛烷值损失预测及优化方法
KR20220038907A (ko) * 2020-09-21 2022-03-29 삼성에스디에스 주식회사 생성적 대립 신경망(gan) 기반의 데이터 예측 방법, 그리고 이를 구현하기 위한 장치

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3798917A1 (en) * 2019-09-24 2021-03-31 Naver Corporation Generative adversarial network (gan) for generating images
CN111882119A (zh) * 2020-07-10 2020-11-03 南通大学 基于sa-bp神经网络的电池soh预测优化方法
KR20220038907A (ko) * 2020-09-21 2022-03-29 삼성에스디에스 주식회사 생성적 대립 신경망(gan) 기반의 데이터 예측 방법, 그리고 이를 구현하기 위한 장치
CN112307001A (zh) * 2020-11-02 2021-02-02 中南大学 基于da优化的汽油精炼过程中辛烷值损失预测方法与系统
CN112489733A (zh) * 2020-12-14 2021-03-12 郑州轻工业大学 基于粒子群算法和神经网络的辛烷值损失预测方法
CN113362913A (zh) * 2021-05-27 2021-09-07 南通大学 一种基于随机森林回归的汽油辛烷值损失预测及优化方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
李炜;王晓明;蒋栋年;李亚洁;梁成龙;: "基于SHPSO-GA-BP的成品汽油调和中加氢汽油组分辛烷值的预测", 化工学报, no. 07, 29 February 2020 (2020-02-29) *
赵健;刘展;: "基于灵敏度分析的海洋油气资源BP神经网络预测模型的优化", 海洋科学, no. 05, 15 May 2016 (2016-05-15) *

Also Published As

Publication number Publication date
CN115115102B (zh) 2024-06-21

Similar Documents

Publication Publication Date Title
CN112489733B (zh) 基于粒子群算法和神经网络的辛烷值损失预测方法
CN112687349A (zh) 一种降低辛烷值损失模型的构建方法
CN107292446B (zh) 一种基于考虑分量关联性小波分解的混合风速预测方法
CN113065771B (zh) 基于指标权值优化的化工企业事故风险评估方法及系统
CN112819225A (zh) 基于bp神经网络和arima模型的碳市场价格预测方法
CN115860173A (zh) 基于Stacking算法的碳排放预测模型的构建和预测方法及介质
CN111415008B (zh) 一种基于vmd-foa-grnn的船舶流量预测方法
CN117171546A (zh) 一种结合污染扩散指数的城市空气质量预测方法
CN113077271A (zh) 一种基于bp神经网络的企业信用评级方法及装置
CN115115102A (zh) 一种基于bp神经网络和条件生成对抗网络的汽油辛烷值损失预测及优化方法
CN110750848A (zh) 一种考虑软件运行的软-硬件退化系统剩余寿命估计的方法
Fu et al. An effective method based on multi-model fusion for research octane number prediction
CN115906669A (zh) 一种顾及负样本选取策略的密集残差网络滑坡易发性评价方法
CN115796665A (zh) 一种绿色能源发电项目多指标碳效分级评估方法及装置
CN114862531A (zh) 一种基于深度学习的企业财务风险预警方法及系统
Hidiyanto et al. Modeling Indonesian Motor Vehicle Tax Coefficients Based on Machine Learning Emission Data
Zhu et al. Multiple input self-organizing-map ResNet model for optimization of petroleum refinery conversion units
CN111160635A (zh) 一种基于ReliefF算法的区域物流需求影响因素预测方法
Tang et al. Octane number prediction of blend gasoline based on improved particle swarm optimization
CN110389948A (zh) 一种基于数据驱动的加氢裂化装置的尾油预测方法
CN117467464A (zh) 催化再生烟气二氧化硫排放浓度预测方法、装置及设备
Liu et al. Prediction of octane number loss based on Kernel-PCA and BP-MLP
Dai et al. Analysis and optimisation of RON loss via compound variable selection and BP neural network
Kayakus et al. European Union 2030 Carbon Emission Target: The Case of Turkey. Sustainability 2023, 15, 13025
CN117933425A (zh) 一种干散货码头自动化装卸系统全域性能评价方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant