CN115115102A - 一种基于bp神经网络和条件生成对抗网络的汽油辛烷值损失预测及优化方法 - Google Patents
一种基于bp神经网络和条件生成对抗网络的汽油辛烷值损失预测及优化方法 Download PDFInfo
- Publication number
- CN115115102A CN115115102A CN202210707808.8A CN202210707808A CN115115102A CN 115115102 A CN115115102 A CN 115115102A CN 202210707808 A CN202210707808 A CN 202210707808A CN 115115102 A CN115115102 A CN 115115102A
- Authority
- CN
- China
- Prior art keywords
- data
- value
- octane number
- gasoline
- loss
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- TVMXDCGIABBOFY-UHFFFAOYSA-N octane Chemical compound CCCCCCCC TVMXDCGIABBOFY-UHFFFAOYSA-N 0.000 title claims abstract description 68
- 239000003502 gasoline Substances 0.000 title claims abstract description 66
- 238000000034 method Methods 0.000 title claims abstract description 50
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 41
- 238000005457 optimization Methods 0.000 title claims abstract description 30
- 238000012216 screening Methods 0.000 claims abstract description 32
- NINIDFKCEFEMDL-UHFFFAOYSA-N Sulfur Chemical compound [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 claims abstract description 23
- 229910052717 sulfur Inorganic materials 0.000 claims abstract description 23
- 239000011593 sulfur Substances 0.000 claims abstract description 23
- 230000009467 reduction Effects 0.000 claims abstract description 16
- 238000004523 catalytic cracking Methods 0.000 claims abstract description 10
- 238000011156 evaluation Methods 0.000 claims abstract description 9
- 238000007781 pre-processing Methods 0.000 claims abstract description 5
- 238000012549 training Methods 0.000 claims description 19
- 239000011159 matrix material Substances 0.000 claims description 15
- 230000000694 effects Effects 0.000 claims description 9
- 238000004140 cleaning Methods 0.000 claims description 8
- 238000010586 diagram Methods 0.000 claims description 8
- 238000009826 distribution Methods 0.000 claims description 8
- 230000008030 elimination Effects 0.000 claims description 8
- 238000003379 elimination reaction Methods 0.000 claims description 8
- 230000008439 repair process Effects 0.000 claims description 7
- 238000000342 Monte Carlo simulation Methods 0.000 claims description 6
- 239000003463 adsorbent Substances 0.000 claims description 6
- 210000002569 neuron Anatomy 0.000 claims description 6
- 230000006872 improvement Effects 0.000 claims description 4
- 238000010606 normalization Methods 0.000 claims description 4
- 238000012360 testing method Methods 0.000 claims description 4
- 238000004364 calculation method Methods 0.000 claims description 3
- 238000005259 measurement Methods 0.000 claims 1
- 239000002994 raw material Substances 0.000 claims 1
- JRZJOMJEPLMPRA-UHFFFAOYSA-N olefin Natural products CCCCCCCC=C JRZJOMJEPLMPRA-UHFFFAOYSA-N 0.000 abstract description 7
- 150000001336 alkenes Chemical class 0.000 abstract description 6
- 238000003912 environmental pollution Methods 0.000 abstract description 3
- 230000006870 function Effects 0.000 description 18
- 239000010779 crude oil Substances 0.000 description 5
- 238000006477 desulfuration reaction Methods 0.000 description 3
- 230000023556 desulfurization Effects 0.000 description 3
- 239000000295 fuel oil Substances 0.000 description 3
- 239000007789 gas Substances 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 239000003921 oil Substances 0.000 description 3
- 230000008676 import Effects 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 239000003208 petroleum Substances 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 229910052799 carbon Inorganic materials 0.000 description 1
- 238000002485 combustion reaction Methods 0.000 description 1
- 239000002283 diesel fuel Substances 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000446 fuel Substances 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- Computational Linguistics (AREA)
- Development Economics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Game Theory and Decision Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Entrepreneurship & Innovation (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于BP神经网络和条件生成对抗网络的汽油辛烷值损失预测与优化方法,包括以下步骤:采集催化裂化汽油历史数据,对历史数据进行预处理,降低冗余度和复杂度;对处理后的数据进行特征降维,筛选建模所需的主要数据成分,并建立筛选评价指标,评估筛选合理性;构建基于相对熵的BP神经网络预测模型,对汽油辛烷值损失进行预测;构建基于条件生成对抗网络的优化模型,以硫含量为约束条件,筛选规定损失幅度下的数据,并对筛选的数据的操作变量进行优化。本发明能够显著提高汽油辛烷值损失预测精度,降低汽油中硫和烯烃的含量,减少汽油燃烧后有害气体的排放,减轻汽车尾气引起的环境污染。
Description
技术领域
本发明属于机器学习领域和化学工业领域,具体涉及基于BP神经网络和条件生成对抗网络的汽油辛烷值损失预测及优化方法。
技术背景
汽油是小型车辆的主要燃料,世界各国都制定了日益严格的汽油质量标准。
我国石油消耗量大,原油对外依存度超过70%。2019年我国石油进口量达到5.06亿吨,同比增长9.55%。原油中大部分是中东地区的含硫和高硫原油,原油中的重油无法直接利用。以催化裂化为核心的重油轻质化工艺技术是将重油转化为汽油、柴油和低碳烯烃的一种方式。截止2020年第二季度,中国炼油厂6月原油加工量创历史新高,超过美国,成为了全球最大炼油中心。
成品汽油中硫和烯烃含量过高,无法满足汽油质量标准,因此必须要对催化裂化汽油进行精制处理。辛烷值(以RON表示)是反映汽油燃烧性能的最重要的指标。本发明设计的算法能够对辛烷值损失进行预测并分析每个样本的优化操作条件,以达到在保证汽油产品脱硫效果的前提下,尽量降低汽油辛烷值损失的效果,减少汽油燃烧后有害气体的排放。
发明内容
发明目的:针对上述问题,本发明引入一种基于BP神经网络和条件生成对抗网络的汽油辛烷值损失预测及优化方法。该方法针对成品汽油中硫和烯烃含量过高,无法满足汽油质量标准的问题,设计了一种新的算法对辛烷值损失进行预测并分析每个样本的优化操作条件,以达到在保证汽油产品脱硫效果的前提下,尽量降低汽油辛烷值损失的效果。
首先,将采集到的催化裂化汽油历史数据传输至后台服务器,对历史数据进行预处理来降低冗余度和复杂度。然后,对预处理完的数据进行特征降维,筛选出建模所需的主要变量,并建立筛选评价指标评估筛选合理性。接着,构建基于相对熵的BP神经网络预测模型,对汽油辛烷值损失进行预测。最后,构建基于条件生成对抗网络的优化模型,以硫含量为约束条件,筛选规定损失幅度下的数据,并对筛选的数据的操作变量进行优化。本发明有效利用机器学习方法对辛烷值损失进行预测和优化,提高汽油辛烷值损失预测的精度,降低汽油中硫和烯烃的含量,减少汽油燃烧后有害气体的排放,以此来减轻汽车尾气带来的环境污染问题。
技术方案:一种基于BP神经网络和条件生成对抗网络的汽油辛烷值损失预测及优化方法,包括如下步骤:
步骤1)采集催化裂化汽油历史数据,传输至后台服务器,对历史数据进行预处理来降低冗余度和复杂度;
步骤2)对预处理完的数据进行特征降维,筛选出建模所需的主要变量,并建立筛选评价指标,评估筛选合理性;
步骤3)构建基于相对熵的BP神经网络预测模型,对汽油辛烷值损失进行预测;
步骤4)构建基于条件生成对抗网络的优化模型,以硫含量为约束条件,筛选规定损失幅度下的数据,并对筛选的数据的操作变量进行优化。
进一步,所述步骤1中,采集催化裂化汽油历史数据,传输至后台服务器,对数据进行预处理,具体步骤如下:
首先,进行数据清晰与修复。设定超过20个缺失值的数据为失去修复价值的数据列。通过对样本数据进行分析,建立数据清洗模型,如式(1)所示。
其中,Find(Ti)是缺失值超过20个的列号,Vj是第j个数据列。利用建立的数据剔除模型对原始数据完成数据剔除工作。
然后,针对缺失少于20个数值的数据进行修复。利用数据清洗模型对需要数据修复的数据点位进行查询,确定缺失值的位置后,对缺失的数据进行修复,对空值处的数据采用前后两个小时的平均值来代替,如式(2)所示。
其中,Repair(i,j)表示对空值(i,j)处的数据进行修复。
接着,对原始数据的操作范围进行提取,采用最大-最小的限幅方法剔除一部分不在此范围内的数据。剔除超范围数值后,继续对样本数据采用拉依达准则进行坏值剔除。拉依达准则假设一组被测的数据只含有随机误差,通过贝塞尔公式计算得到标准差,若某个测量值xb的剩余误差vb(1<=b<=n),满足|vb|=|xb-x|>3σ,则认为xb是含有粗大误差值的坏值,应予剔除。贝塞尔公式如式(3)所示。
以辛烷值数据测定的时间点为基准时间,取其前2个小时的操作变量数据的平均值作为对应辛烷值的操作变量数据,计算出所需的操作变量数据。
进一步,所述步骤2中,对预处理完的数据进行特征降维,依据信息熵进行数据的第一轮筛选,具体步骤如下:
3-1信息熵是信息论中最重要的概念,其数值越大就代表其包含的信息量越大,求解方法如式(4)所示。
其中,i表示第i个样本,j表示第j个操作变量,Hj表示第j个操作变量的信息熵,p(Xi,j)表示第j个操作变量中第i个样本的数值在操作变量中出现的概率。以所有信息熵的平均值为阈值,对信息熵过低的变量进行删除。
3-2一轮筛选结束后,继续依据MIC进行二轮筛选。MIC是信息论里一种有用的信息度量,其实质是对蒙特卡洛法近似计算出的互信息归一化的结果,首先计算两个序列的互信息I(x:y),如式(5)所示。
其中p(x,y)是联合概率密度函数,p(x)p(y)为边缘概率密度函数。
采用类似于蒙特卡洛法的方案将序列x,y构成的散点图网格化。通过网格化后的散点分布估计其联合概率分布,估计的公式为:
MIC及对近似的互信息I(X:Y)的最大值归一化公式为:
式中X,Y分别表示散点图网格化后x方向与y方向划分的段数, |x||y|即整体的网格数。B为超参数其数值应设定为数据总量的0.6次方。
进一步,所述步骤3中,构建基于相对熵的BP神经网络预测模型,对汽油辛烷值损失进行预测。模型结构包含输入层、隐藏层和输出层,每一层由若干个神经元(即节点个数)组成,任意相邻的两层之间均为全连接层,具体步骤如下:
4-1采用自编码器添加稀疏性限制以此抑制过拟合的方法,对隐藏层进行稀疏性限制,在误差函数中加入KL散度作为额外的惩罚因子来限制隐藏层神经元的平均活跃度。设优化后的误差函数为
4-2设输入层变量矩阵为X,输入层到隐藏层之间的权重矩阵为 W1、偏置矩阵为b1,隐藏层到输出层之间的权重矩阵为W2、偏置矩阵为b2,则隐藏层的输出hidden=tanh(X·W1+b1),输出层为: output=tanh(Hidden·W2+b2);
4-3在经过一次前向计算时,得到一次输出值output,模型中输出值即为预测的辛烷值。将输出值ypred与辛烷值的实际值ytrue进行比较,确定误差。
4-4调整模型参数,重复训练直到得到模型最优解。
4-5使用RMSE(均方根误差)、MAE(平均绝对误差)、R2(决定系数)、MAPE(平均绝对百分比误差)作为评价指标测试模型训练效果。
进一步,所述步骤4中,构建基于条件生成对抗网络的优化模型,以硫含量为约束条件,筛选规定损失幅度下的数据,并对筛选的数据的操作变量进行优化,具体步骤如下:
5-1根据硫含量将预处理后的原始数据划分为正样本和负样本,通过对预处理后的样本数据进行分析,以硫含量不大于5ug/g为划分依据,对原始的样本数据进行样本集划分,样本标记公式为:
通过遍历操作,划分出正样本和负样本集。考虑到正负样本之间数量不平衡,会对后续实验结果产生影响,采用cross entropy(CE)loss 的改进版,实现对正、负样本数目不平衡的调整,公式为:
FL(pt)=-∝t(1-pt)γlog(pt) (12)
5-2搭建CGAN神经网络,将正、负样本结合条件变量输入判别器进行训练,具体步骤如下:
5-2-1搭建基于条件生成对抗网络(CGAN)的样本生成模型框架,CGAN是在GAN基础上做的一种改进,通过对原始的GAN的生成器和判别器的输入量添加额外的条件信息,实现条件生成模型。
5-2-2确定生成器和判别器网络结构,使用传统的全连接神经网络结构作为生成器和判别器的网络结构。
5-2-3确定损失函数,原始的GAN的损失函数为:
minG maxD V(D,G)=Ea~pdata(a)[logD(a)]+Ez~pdata(z)[log(1- D(G(z)))] (13)
CGAN在添加额外信息后需要和a与z进行合并,作为G和D 的输入,因此构建的CGAN损失函数公式为:
minG maxD V(D,G)=Ea~pdata(a)[log D(a|b)]+Ez~pdata(z)[log(1- D(G(z|b)))](14)
5-2-4组合辛烷值损失预测模型,通过辛烷值损失预测模型,寻找损失降幅大于规定值的样本对应的主要变量优化后的操作条件。
5-3将条件变量输入生成器生成操作变量,并利用判别器进行生成器的训练,利用训练好的CGAN神经网络输出每个样本的操作变量。使用正样本集和负样本集对判别器网络的进行训练,使用公式
FL(pt)=-∝t(1-pt)γlog(pt) (15)
对损失值进行调整,降低数据偏向性。将训练好的判别器模型参数放入CGAN网络中,输入为原料性质、产品性质、待生吸附剂性质、再生吸附剂性质筛选后的变量,训练完CGAN网络后,利用CGAN 网络生成器对条件变量的操作变量进行生成。
5-4利用步骤3)建立的辛烷值损失预测模型预测每个样本的操作变量相应的损失值,并计算辛烷值(RON)损失降幅大于规定值的样本对应的主要变量优化后的操作条件。
附图说明
图1为本发明的一种基于BP神经网络和条件生成对抗网络的汽油辛烷值损失预测及优化方法步骤示意图;
图2为本发明的一种基于BP神经网络和条件生成对抗网络的汽油辛烷值损失预测及优化方法数据处理思路流程图;
图3为本发明的一种基于BP神经网络和条件生成对抗网络的汽油辛烷值损失预测及优化方法数据降维思路流程图;
图4为本发明的一种基于BP神经网络和条件生成对抗网络的汽油辛烷值损失预测及优化方法基于相对熵的BP神经网络预测模型思路流程图;
图5为本发明的一种基于BP神经网络和条件生成对抗网络的汽油辛烷值损失预测及优化方法基于条件生成对抗网络的优化模型思路流程图;
图6为本发明的一种基于BP神经网络和条件生成对抗网络的汽油辛烷值损失预测及优化方法CGAN模型框架搭建图;
图7为本发明的一种基于BP神经网络和条件生成对抗网络的汽油辛烷值损失预测及优化方法组合辛烷值损失预测模型;
图8为本发明的一种基于BP神经网络和条件生成对抗网络的汽油辛烷值损失预测及优化方法判别器测试集拟合情况图;
图9为本发明的一种基于BP神经网络和条件生成对抗网络的汽油辛烷值损失预测及优化方法CGAN训练损失曲线图;
图10为本发明的一种基于BP神经网络和条件生成对抗网络的汽油辛烷值损失预测及优化方法优化前后辛烷值损失对比图。
具体实施步骤
下面将结合说明书附图对本发明的技术方法做进一步的详细说明。
如图1所示,一种基于BP神经网络和条件生成对抗网络的汽油辛烷值损失预测及优化方法,包括如下步骤:
步骤1)采集催化裂化汽油历史数据,传输至后台服务器,对历史数据进行预处理,降低冗余度和复杂度;
所述步骤1中,采集催化裂化汽油历史数据,传输至后台服务器,对数据进行预处理,流程如图2所示。
首先,进行数据清晰与修复。设定超过20个缺失值的数据为失去修复价值的数据列。通过对样本数据进行分析,建立数据清洗模型,如式(1)所示。
其中,Find(Ti)是缺失值超过20个的列号,Vj是第j个数据列。利用建立的数据剔除模型对原始数据完成数据剔除工作。
然后,针对缺失少于20个数值的数据进行修复。利用数据清洗模型对需要数据修复的数据点位进行查询,确定缺失值的位置后,对缺失的数据进行修复,对空值处的数据采用前后两个小时的平均值来代替,如式(2)所示。
其中,Repair(i,j)表示对空值(i,j)处的数据进行修复。
接着,对原始数据的操作范围进行提取,采用最大-最小的限幅方法剔除一部分不在此范围内的数据。剔除超范围数值后,继续对样本数据采用拉依达准则进行坏值剔除。拉依达准则假设一组被测的数据只含有随机误差,通过贝塞尔公式计算得到标准差,若某个测量值xb的剩余误差vb(1<=b<=n),满足|vb|=|xb-x|>3σ,则认为xb是含有粗大误差值的坏值,应予剔除。贝塞尔公式如式(3)所示。
以辛烷值数据测定的时间点为基准时间,取其前2个小时的操作变量数据的平均值作为对应辛烷值的操作变量数据,计算出所需的操作变量数据。
步骤2)对预处理后的数据进行特征降维,筛选出建模所需的主要变量,并建立筛选评价指标,评估筛选合理性;
所述步骤2中,对预处理完的数据进行特征降维,流程如图3所示。依据信息熵进行数据的第一轮筛选,具体步骤如下:
步骤2-1:信息熵是信息论中最重要的概念,其数值越大就代表其包含的信息量越大,求解方法如式(4)所示。
其中,i表示第i个样本,j表示第j个操作变量,Hj表示第j个操作变量的信息熵,p(Xi,j)表示第j个操作变量中第i个样本的数值在操作变量中出现的概率。以所有信息熵的平均值为阈值,对信息熵过低的变量进行删除。
步骤2-2:一轮筛选结束后,继续依据MIC进行二轮筛选。MIC 是信息论里一种有用的信息度量,其实质是对蒙特卡洛法近似计算出的互信息归一化的结果,首先计算两个序列的互信息I(x:y),如式(5) 所示。
其中p(x,y)是联合概率密度函数,p(x)p(y)为边缘概率密度函数。
采用类似于蒙特卡洛法的方案将序列x,y构成的散点图网格化。通过网格化后的散点分布估计其联合概率分布,估计的公式为:
MIC及对近似的互信息I(X:Y)的最大值归一化公式为:
式中X,Y分别表示散点图网格化后x方向与y方向划分的段数, |x||y|即整体的网格数。B为超参数其数值应设定为数据总量的0.6次方。
步骤3)构建基于相对熵的BP神经网络预测模型,对汽油辛烷值损失进行预测;
所述步骤3中,构建基于相对熵的BP神经网络预测模型,对汽油辛烷值损失进行预测,流程如图4所示。模型结构包含输入层、隐藏层和输出层,每一层由若干个神经元(即节点个数)组成,任意相邻的两层之间均为全连接层,具体步骤如下:
步骤3-1:采用自编码器添加稀疏性限制以此抑制过拟合的方法,对隐藏层进行稀疏性限制,在误差函数中加入KL散度作为额外的惩罚因子来限制隐藏层神经元的平均活跃度。设优化后的误差函数为
步骤3-2:设输入层变量矩阵为X,输入层到隐藏层之间的权重矩阵为W1、偏置矩阵为b1,隐藏层到输出层之间的权重矩阵为W2、偏置矩阵为b2,则隐藏层的输出hidden=tanh(X·W1+b1),输出层为:output=tanh(Hidden·W2+b2);
步骤3-3:在经过一次前向计算时,得到一次输出值output,模型中输出值即为预测的辛烷值。将输出值ypred与辛烷值的实际值ytrue进行比较,确定误差。
步骤3-4:调整模型参数,重复训练直到得到模型最优解。
步骤3-5:使用RMSE(均方根误差)、MAE(平均绝对误差)、 R2(决定系数)、MAPE(平均绝对百分比误差)作为评价指标测试模型训练效果。
步骤4)构建基于条件生成对抗网络的优化模型,以硫含量为约束条件,筛选规定损失幅度下的数据,并对筛选的数据的操作变量进行优化。
所述步骤4中,构建基于条件生成对抗网络的优化模型,以硫含量为约束条件,筛选规定损失幅度下的数据,并对筛选的数据的操作变量进行优化,思路流程如图5所示,具体步骤如下:
步骤4-1:根据硫含量将预处理后的原始数据划分为正样本和负样本,通过对预处理后的样本数据进行分析,以硫含量不大于5ug/g 为划分依据,对原始的样本数据进行样本集划分,样本标记公式为:
通过遍历操作,划分出正样本和负样本集。考虑到正负样本之间数量不平衡,会对后续实验结果产生影响,采用cross entropy(CE)loss 的改进版,实现对正、负样本数目不平衡的调整,公式为:
FL(pt)=-∝t(1-pt)γlog(pt) (12)
步骤4-2:搭建CGAN神经网络,将正、负样本结合条件变量输入判别器进行训练,具体步骤如下:
步骤4-2-1:搭建基于条件生成对抗网络(CGAN)的样本生成模型框架,CGAN是在GAN基础上做的一种改进,通过对原始的 GAN的生成器和判别器的输入量添加额外的条件信息,实现条件生成模型。
步骤4-2-2:确定生成器和判别器网络结构,使用传统的全连接神经网络结构作为生成器和判别器的网络结构。
步骤4-2-3:确定损失函数,原始的GAN的损失函数为:
minG maxD V(D,G)=Ea~pdata(a)[log D(a)]+Ez~pdata(z)[log(1- D(G(z)))] (13)
CGAN在添加额外信息后需要和a与z进行合并,作为G和D 的输入,因此构建的CGAN损失函数公式为:
minG maxD V(D,G)=Ea~pdata(a)[log D(a|b)]+Ez~pdata(z)[log(1- D(G(z|b)))](14)
步骤4-2-4:组合辛烷值损失预测模型,通过辛烷值损失预测模型,寻找损失降幅大于规定值的样本对应的主要变量优化后的操作条件。
步骤4-3:将条件变量输入生成器生成操作变量,并利用判别器进行生成器的训练,利用训练好的CGAN神经网络输出每个样本的操作变量。使用正样本集和负样本集对判别器网络的进行训练,使用公式
FL(pt)=-∝t(1-pt)γ log(pt) (15)
对损失值进行调整,降低数据偏向性。将训练好的判别器模型参数放入CGAN网络中,输入为原料性质、产品性质、待生吸附剂性质、再生吸附剂性质筛选后的变量,训练完CGAN网络后,利用CGAN 网络生成器对条件变量的操作变量进行生成。
步骤4-4:利用步骤3)建立的辛烷值损失预测模型预测每个样本的操作变量相应的损失值,并计算辛烷值(RON)损失降幅大于规定值的样本对应的主要变量优化后的操作条件。
本发明针对成品汽油中硫和烯烃含量过高,无法在保证汽油产品脱硫效果的前提下,降低汽油辛烷值损失的问题,首先,将采集到的催化裂化汽油历史数据传输至后台服务器,对历史数据进行预处理来降低冗余度和复杂度。然后,对预处理完的数据进行特征降维,筛选出建模所需的主要变量,并建立筛选评价指标评估筛选合理性。接着,构建基于相对熵的BP神经网络预测模型,对汽油辛烷值损失进行预测。最后,构建基于条件生成对抗网络的优化模型,以硫含量为约束条件,筛选规定损失幅度下的数据,并对筛选的数据的操作变量进行优化。本发明有效利用机器学习方法对辛烷值损失进行预测和优化,提高汽油辛烷值损失预测的精度,降低汽油中硫和烯烃的含量,减少汽油燃烧后有害气体的排放,以此来减轻汽车尾气带来的环境污染问题。
以上所述仅为本发明在开源历史数据集下较好的实施方式,本发明保护范围并不以上述实施方式为限制,但凡本领域普通技术人员根据本发明所揭示内容所作的等效修改和其他修饰变化,皆应纳入权利要求书记载的保护范围。
Claims (5)
1.一种基于BP神经网络和条件生成对抗网络的汽油辛烷值损失预测及优化方法,其特征在于:包括如下步骤:
步骤1)采集催化裂化汽油历史数据,传输至后台服务器,对历史数据进行预处理,降低冗余度和复杂度;
步骤2)对预处理后的数据进行特征降维,筛选出建模所需的主要变量,并建立筛选评价指标,评估筛选合理性;
步骤3)构建基于相对熵的BP神经网络预测模型,对汽油辛烷值损失进行预测;
步骤4)构建基于条件生成对抗网络的优化模型,以硫含量为约束条件,筛选规定损失幅度下的数据,并对筛选的数据的操作变量进行优化。
2.根据权利要求1所述的一种基于BP神经网络和条件生成对抗网络的汽油辛烷值损失预测及优化方法,其特征在于:所述步骤1中,采集催化裂化汽油历史数据,传输至后台服务器,对数据进行预处理,具体步骤如下:
首先,进行数据清晰与修复,设定超过20个缺失值的数据为失去修复价值的数据列,通过对样本数据进行分析,建立数据清洗模型,如式(1)所示:
其中,Find(Ti)是缺失值超过20个的列号,Vj是第j个数据列;利用建立的数据剔除模型对原始数据完成数据剔除工作;
然后,针对缺失少于20个数值的数据进行修复,利用数据清洗模型对需要数据修复的数据点位进行查询,确定缺失值的位置后,对缺失的数据进行修复,对空值处的数据采用前后两个小时的平均值来代替,如式(2)所示:
其中,Repair(i,j)表示对空值(i,j)处的数据进行修复;
接着,对原始数据的操作范围进行提取,采用最大-最小的限幅方法剔除一部分不在此范围内的数据;剔除超范围数值后,继续对样本数据采用拉依达准则进行坏值剔除,拉依达准则假设一组被测的数据只含有随机误差,通过贝塞尔公式计算得到标准差,若某个测量值xb的剩余误差vb(1<=b<=n),满足|vb|=|xb-x|>3σ,则认为xb是含有粗大误差值的坏值,应予剔除,贝塞尔公式如式(3)所示:
以辛烷值数据测定的时间点为基准时间,取其前2个小时的操作变量数据的平均值作为对应辛烷值的操作变量数据,计算出所需的操作变量数据。
3.根据权利要求1所述的一种基于BP神经网络和条件生成对抗网络的汽油辛烷值损失预测及优化方法,其特征在于:所述步骤2中,对预处理完的数据进行特征降维,依据信息熵进行数据的第一轮筛选,具体步骤如下:
3-1信息熵是信息论中最重要的概念,其数值越大就代表其包含的信息量越大,求解方法如式(4)所示:
其中,i表示第i个样本,j表示第j个操作变量,Hj表示第j个操作变量的信息熵,p(Xi,j)表示第j个操作变量中第i个样本的数值在操作变量中出现的概率,以所有信息熵的平均值为阈值,对信息熵过低的变量进行删除;
3-2一轮筛选结束后,继续依据MIC进行二轮筛选,MIC是信息论里一种有用的信息度量,其实质是对蒙特卡洛法近似计算出的互信息归一化的结果,首先计算两个序列的互信息I(x:y),如式(5)所示:
其中p(x,y)是联合概率密度函数,p(x)p(y)为边缘概率密度函数;
采用类似于蒙特卡洛法的方案将序列x,y构成的散点图网格化,通过网格化后的散点分布估计其联合概率分布,估计的公式为:
MIC及对近似的互信息I(X:Y)的最大值归一化公式为:
式中X,Y分别表示散点图网格化后x方向与y方向划分的段数,|x||y|即整体的网格数,B为超参数其数值应设定为数据总量的0.6次方。
4.根据权利要求1所述的一种基于BP神经网络和条件生成对抗网络的汽油辛烷值损失预测及优化方法,其特征在于:所述步骤3中,构建基于相对熵的BP神经网络预测模型,对汽油辛烷值损失进行预测,模型结构包含输入层、隐藏层和输出层,每一层由若干个神经元组成,任意相邻的两层之间均为全连接层,具体步骤如下:
4-1采用自编码器添加稀疏性限制以此抑制过拟合的方法,对隐藏层进行稀疏性限制,在误差函数中加入KL散度作为额外的惩罚因子来限制隐藏层神经元的平均活跃度,设优化后的误差函数为
4-2设输入层变量矩阵为X,输入层到隐藏层之间的权重矩阵为W1、偏置矩阵为b1,隐藏层到输出层之间的权重矩阵为W2、偏置矩阵为b2,则隐藏层的输出hidden=tanh(X·W1+b1),输出层为:output=tanh(Hidden·W2+b2);
4-3在经过一次前向计算时,得到一次输出值output,模型中输出值即为预测的辛烷值,将输出值ypred与辛烷值的实际值ytrue进行比较,确定误差;
4-4调整模型参数,重复训练直到得到模型最优解;
4-5使用RMSE(均方根误差)、MAE(平均绝对误差)、R2(决定系数)、MAPE(平均绝对百分比误差)作为评价指标测试模型训练效果。
5.根据权利要求1所述的一种基于BP神经网络和条件生成对抗网络的汽油辛烷值损失预测及优化方法,其特征在于:所述步骤4中,构建基于条件生成对抗网络的优化模型,以硫含量为约束条件,筛选规定损失幅度下的数据,并对筛选的数据的操作变量进行优化,具体步骤如下:
5-1根据硫含量将预处理后的原始数据划分为正样本和负样本,通过对预处理后的样本数据进行分析,以硫含量不大于5ug/g为划分依据,对原始的样本数据进行样本集划分,样本标记公式为:
通过遍历操作,划分出正样本和负样本集,考虑到正负样本之间数量不平衡,会对后续实验结果产生影响,采用cross entropy(CE)loss的改进版,实现对正、负样本数目不平衡的调整,公式为:
FL(pt)=-∝t(1-pt)γlog(pt) (12)
5-2搭建CGAN神经网络,将正、负样本结合条件变量输入判别器进行训练,具体步骤如下:
5-2-1搭建基于条件生成对抗网络(CGAN)的样本生成模型框架,CGAN是在GAN基础上做的一种改进,通过对原始的GAN的生成器和判别器的输入量添加额外的条件信息,实现条件生成模型;
5-2-2确定生成器和判别器网络结构,使用传统的全连接神经网络结构作为生成器和判别器的网络结构;
5-2-3确定损失函数,原始的GAN的损失函数为:
minG maxD V(D,G)=Ea~pdata(a)[2ogD(a)]+Ez~pdata(z)[log(1-D(G(z)))] (13)
CGAN在添加额外信息后需要和a与z进行合并,作为G和D的输入,因此构建的CGAN损失函数公式为:
minG maxD V(D,G)=Ea~pdata(a)[logD(a|b)]+Ez~pdata(z)[log(1-D(G(z|b)))] (14)
5-2-4组合辛烷值损失预测模型,通过辛烷值损失预测模型,寻找损失降幅大于规定值的样本对应的主要变量优化后的操作条件;
5-3将条件变量输入生成器生成操作变量,并利用判别器进行生成器的训练,利用训练好的CGAN神经网络输出每个样本的操作变量,使用正样本集和负样本集对判别器网络的进行训练,使用公式
FL(pt)=-∝t(1-pt)γlog(pt) (15)
对损失值进行调整,降低数据偏向性,将训练好的判别器模型参数放入CGAN网络中,输入为原料性质、产品性质、待生吸附剂性质、再生吸附剂性质筛选后的变量,训练完CGAN网络后,利用CGAN网络生成器对条件变量的操作变量进行生成;
5-4利用步骤3)建立的辛烷值损失预测模型预测每个样本的操作变量相应的损失值,并计算辛烷值(RON)损失降幅大于规定值的样本对应的主要变量优化后的操作条件。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210707808.8A CN115115102B (zh) | 2022-06-21 | 2022-06-21 | 一种基于bp神经网络和条件生成对抗网络的汽油辛烷值损失预测及优化方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210707808.8A CN115115102B (zh) | 2022-06-21 | 2022-06-21 | 一种基于bp神经网络和条件生成对抗网络的汽油辛烷值损失预测及优化方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115115102A true CN115115102A (zh) | 2022-09-27 |
CN115115102B CN115115102B (zh) | 2024-06-21 |
Family
ID=83327727
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210707808.8A Active CN115115102B (zh) | 2022-06-21 | 2022-06-21 | 一种基于bp神经网络和条件生成对抗网络的汽油辛烷值损失预测及优化方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115115102B (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111882119A (zh) * | 2020-07-10 | 2020-11-03 | 南通大学 | 基于sa-bp神经网络的电池soh预测优化方法 |
CN112307001A (zh) * | 2020-11-02 | 2021-02-02 | 中南大学 | 基于da优化的汽油精炼过程中辛烷值损失预测方法与系统 |
CN112489733A (zh) * | 2020-12-14 | 2021-03-12 | 郑州轻工业大学 | 基于粒子群算法和神经网络的辛烷值损失预测方法 |
EP3798917A1 (en) * | 2019-09-24 | 2021-03-31 | Naver Corporation | Generative adversarial network (gan) for generating images |
CN113362913A (zh) * | 2021-05-27 | 2021-09-07 | 南通大学 | 一种基于随机森林回归的汽油辛烷值损失预测及优化方法 |
KR20220038907A (ko) * | 2020-09-21 | 2022-03-29 | 삼성에스디에스 주식회사 | 생성적 대립 신경망(gan) 기반의 데이터 예측 방법, 그리고 이를 구현하기 위한 장치 |
-
2022
- 2022-06-21 CN CN202210707808.8A patent/CN115115102B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3798917A1 (en) * | 2019-09-24 | 2021-03-31 | Naver Corporation | Generative adversarial network (gan) for generating images |
CN111882119A (zh) * | 2020-07-10 | 2020-11-03 | 南通大学 | 基于sa-bp神经网络的电池soh预测优化方法 |
KR20220038907A (ko) * | 2020-09-21 | 2022-03-29 | 삼성에스디에스 주식회사 | 생성적 대립 신경망(gan) 기반의 데이터 예측 방법, 그리고 이를 구현하기 위한 장치 |
CN112307001A (zh) * | 2020-11-02 | 2021-02-02 | 中南大学 | 基于da优化的汽油精炼过程中辛烷值损失预测方法与系统 |
CN112489733A (zh) * | 2020-12-14 | 2021-03-12 | 郑州轻工业大学 | 基于粒子群算法和神经网络的辛烷值损失预测方法 |
CN113362913A (zh) * | 2021-05-27 | 2021-09-07 | 南通大学 | 一种基于随机森林回归的汽油辛烷值损失预测及优化方法 |
Non-Patent Citations (2)
Title |
---|
李炜;王晓明;蒋栋年;李亚洁;梁成龙;: "基于SHPSO-GA-BP的成品汽油调和中加氢汽油组分辛烷值的预测", 化工学报, no. 07, 29 February 2020 (2020-02-29) * |
赵健;刘展;: "基于灵敏度分析的海洋油气资源BP神经网络预测模型的优化", 海洋科学, no. 05, 15 May 2016 (2016-05-15) * |
Also Published As
Publication number | Publication date |
---|---|
CN115115102B (zh) | 2024-06-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112489733B (zh) | 基于粒子群算法和神经网络的辛烷值损失预测方法 | |
CN112687349A (zh) | 一种降低辛烷值损失模型的构建方法 | |
CN107292446B (zh) | 一种基于考虑分量关联性小波分解的混合风速预测方法 | |
CN113065771B (zh) | 基于指标权值优化的化工企业事故风险评估方法及系统 | |
CN112819225A (zh) | 基于bp神经网络和arima模型的碳市场价格预测方法 | |
CN115860173A (zh) | 基于Stacking算法的碳排放预测模型的构建和预测方法及介质 | |
CN111415008B (zh) | 一种基于vmd-foa-grnn的船舶流量预测方法 | |
CN117171546A (zh) | 一种结合污染扩散指数的城市空气质量预测方法 | |
CN113077271A (zh) | 一种基于bp神经网络的企业信用评级方法及装置 | |
CN115115102A (zh) | 一种基于bp神经网络和条件生成对抗网络的汽油辛烷值损失预测及优化方法 | |
CN110750848A (zh) | 一种考虑软件运行的软-硬件退化系统剩余寿命估计的方法 | |
Fu et al. | An effective method based on multi-model fusion for research octane number prediction | |
CN115906669A (zh) | 一种顾及负样本选取策略的密集残差网络滑坡易发性评价方法 | |
CN115796665A (zh) | 一种绿色能源发电项目多指标碳效分级评估方法及装置 | |
CN114862531A (zh) | 一种基于深度学习的企业财务风险预警方法及系统 | |
Hidiyanto et al. | Modeling Indonesian Motor Vehicle Tax Coefficients Based on Machine Learning Emission Data | |
Zhu et al. | Multiple input self-organizing-map ResNet model for optimization of petroleum refinery conversion units | |
CN111160635A (zh) | 一种基于ReliefF算法的区域物流需求影响因素预测方法 | |
Tang et al. | Octane number prediction of blend gasoline based on improved particle swarm optimization | |
CN110389948A (zh) | 一种基于数据驱动的加氢裂化装置的尾油预测方法 | |
CN117467464A (zh) | 催化再生烟气二氧化硫排放浓度预测方法、装置及设备 | |
Liu et al. | Prediction of octane number loss based on Kernel-PCA and BP-MLP | |
Dai et al. | Analysis and optimisation of RON loss via compound variable selection and BP neural network | |
Kayakus et al. | European Union 2030 Carbon Emission Target: The Case of Turkey. Sustainability 2023, 15, 13025 | |
CN117933425A (zh) | 一种干散货码头自动化装卸系统全域性能评价方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant |