CN116453612A

CN116453612A - 汽油氢含量预测模型训练、氢含量预测方法及装置

Info

Publication number: CN116453612A
Application number: CN202210022856.3A
Authority: CN
Inventors: 王阳峰; 颜学峰; 林宸雨; 杨建东; 张英; 王红涛
Original assignee: China Petroleum and Chemical Corp; Sinopec Dalian Research Institute of Petroleum and Petrochemicals
Current assignee: Sinopec Dalian Petrochemical Research Institute Co ltd; China Petroleum and Chemical Corp
Priority date: 2022-01-10
Filing date: 2022-01-10
Publication date: 2023-07-18

Abstract

本发明提供一种汽油氢含量预测模型训练、氢含量预测方法及装置，所述方法包括：从数据仓库中确定影响汽油氢含量的关键参数；关键参数包括汽油的原料性质参数和催化裂化装置的操作参数；基于关键参数对应的汽油密度以及汽油终馏点，确定关键参数对应的汽油氢含量；基于关键参数以及关键参数对应的汽油氢含量，对初始模型进行训练，得到汽油氢含量预测模型。本发明在没有高精度的分析仪器的情况下，仍可以基于汽油氢含量预测模型快速且准确得到氢含量预测结果，而且本发明可以通过原料性质参数和操作参数确定氢含量预测结果，不需要采集汽油样品进行氢含量检测，效率较高。

Description

汽油氢含量预测模型训练、氢含量预测方法及装置

技术领域

本发明涉及计算机技术领域，尤其涉及一种汽油氢含量预测模型训练、氢含量预测方法及装置。

背景技术

石油加工过程主要是原油碳、氢等元素的再平衡过程，即包括脱碳和加氢两种情况，相应的技术路线则为脱碳技术路线和加氢技术路线。催化裂化技术是重要的原油脱碳加工技术之一，原料油经过裂化、氢转移、异构化等过程得到干气、液化气、汽油、轻循环油、油浆、焦炭等产物。

装置氢平衡计算分析可以评价催化裂化装置产物分布合理性、氢利用效率等。实际生产中，多通过仪器设备进行气态烃的全组成分析，从而可以根据组成分析计算得到氢含量；焦炭的氢含量可以通过烟气组成计算，而烟气组成分析也可以通过常规设备进行分析化验。然而，大多数炼油企业没有配备测定液相油品中氢含量的设备，需要送至专业机构检测，时效性差。

发明内容

本发明提供一种汽油氢含量预测模型训练、氢含量预测方法及装置，用以解决现有技术中汽油氢含量预测时效性较差的缺陷。

本发明提供一种汽油氢含量预测模型训练方法，包括：

从数据仓库中确定影响汽油氢含量的关键参数；所述关键参数包括汽油的原料性质参数和催化裂化装置的操作参数；

基于所述关键参数对应的汽油密度以及汽油终馏点，确定所述关键参数对应的汽油氢含量；

基于所述关键参数以及所述关键参数对应的汽油氢含量，对初始模型进行训练，得到汽油氢含量预测模型。

根据本发明提供的一种汽油氢含量预测模型训练方法，所述关键参数对应的汽油氢含量是基于线性模型确定的，所述线性模型为：

y＝27.726-0.001923a-0.06412b；

其中，y表示所述关键参数对应的汽油氢含量，a表示所述关键参数对应的汽油密度，b表示所述关键参数对应的汽油终馏点。

根据本发明提供的一种汽油氢含量预测模型训练方法，所述线性模型是基于如下步骤构建得到的：

获取历史汽油密度、历史汽油终馏点及其对应的历史汽油氢含量；

对所述历史汽油密度、所述历史汽油终馏点以及所述历史汽油氢含量进行线性拟合，得到所述线性模型。

根据本发明提供的一种汽油氢含量预测模型训练方法，所述数据仓库是基于如下步骤建立的：

获取汽油的历史原料性质参数和催化裂化装置的历史操作参数；

对所述历史原料性质参数和所述历史操作参数进行数据清洗，并将数据清洗后的历史原料性质参数和历史操作参数添加至所述数据仓库。

根据本发明提供的一种汽油氢含量预测模型训练方法，在得到汽油氢含量预测模型之后，还包括：

在所述汽油氢含量预测模型的精度小于精度阈值时，从所述数据仓库中确定补充参数，所述补充参数与汽油氢含量的相关度大于相关度阈值，所述补充参数与汽油氢含量的相关度是基于mRMR确定的；

基于所述补充参数对应的汽油密度以及汽油终馏点，并基于所述补充参数对应的汽油密度以及汽油终馏点确定所述补充参数对应的汽油氢含量；

基于所述补充参数，以及所述补充参数对应的汽油氢含量，更新所述汽油氢含量预测模型。

根据本发明提供的一种汽油氢含量预测模型训练方法，所述汽油氢含量预测模型的精度是基于如下步骤确定的：

从所述数据仓库中随机获取原料性质参数和操作参数作为验证参数，并获取所述验证参数对应的氢含量；

将所述验证参数输入至所述汽油氢含量预测模型，得到所述汽油氢含量预测模型输出的预测氢含量；

基于所述预测氢含量以及所述验证参数对应的氢含量，确定所述汽油氢含量预测模型的精度；所述汽油氢含量预测模型的精度包括均方根误差、平均绝对误差以及决定系数中的至少一种。

根据本发明提供的一种汽油氢含量预测模型训练方法，所述初始模型是基于GBDT模型构建得到的。

本发明还提供一种汽油氢含量预测方法，包括：

确定待预测汽油对应的原料性质参数和操作参数；

将所述待预测汽油对应的原料性质参数和操作参数输入至汽油氢含量预测模型，得到所述汽油氢含量预测模型输出的氢含量预测结果；

其中，所述汽油氢含量预测模型是基于如上所述的汽油氢含量预测模型训练方法训练得到的。

本发明还提供一种汽油氢含量预测模型训练装置，包括：

参数选取单元，用于从数据仓库中确定影响汽油氢含量的关键参数；所述关键参数包括汽油的原料性质参数和催化裂化装置的操作参数；

标签确定单元，用于基于所述关键参数对应的汽油密度以及汽油终馏点，确定所述关键参数对应的汽油氢含量；

模型训练单元，用于基于所述关键参数以及所述关键参数对应的汽油氢含量，对初始模型进行训练，得到汽油氢含量预测模型。

本发明还提供一种汽油氢含量预测装置，包括：

参数确定单元，用于确定待预测汽油对应的原料性质参数和操作参数；

含量预测单元，用于将所述待预测汽油对应的原料性质参数和操作参数输入至汽油氢含量预测模型，得到所述汽油氢含量预测模型输出的氢含量预测结果；

本发明还提供一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现如上述任一种所述汽油氢含量预测模型训练方法和/或汽油氢含量预测方法的步骤。

本发明还提供一种非暂态计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现如上述任一种所述汽油氢含量预测模型训练方法和/或汽油氢含量预测方法的步骤。

本发明还提供一种计算机程序产品，包括计算机程序，所述计算机程序被处理器执行时实现如上述任一种所述汽油氢含量预测模型训练方法和/或汽油氢含量预测方法的步骤。

本发明提供的汽油氢含量预测模型训练、氢含量预测方法及装置，基于关键参数以及关键参数对应的汽油氢含量，对初始模型进行训练，得到汽油氢含量预测模型，从而实现在没有高精度的分析仪器的情况下，仍可以基于汽油氢含量预测模型快速且准确得到氢含量预测结果，而且本发明实施例可以通过原料性质参数和操作参数确定氢含量预测结果，不需要采集汽油样品进行氢含量检测，效率较高。

附图说明

为了更清楚地说明本发明或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明提供的汽油氢含量预测模型训练方法的流程示意图；

图2是本发明提供的汽油氢含量预测方法的流程示意图；

图3是本发明提供的汽油氢含量预测系统的结构示意图；

图4是本发明提供的汽油氢含量预测模型训练装置的结构示意图；

图5是本发明提供的汽油氢含量预测装置的结构示意图；

图6是本发明提供的电子设备的结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面将结合本发明中的附图，对本发明中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

现有的汽油氢含量预测多通过仪器设备进行气态烃的全组成分析，从而可以根据组成分析计算得到氢含量；焦炭的氢含量可以通过烟气组成计算，而烟气组成分析也可以通过常规设备进行分析化验。然而，大多数炼油企业没有配备测定液相油品中氢含量的设备，需要送至专业机构检测，时效性差。

对此，本发明提供一种汽油氢含量预测模型训练方法。图1是本发明提供的汽油氢含量预测模型训练方法的流程示意图，如图1所示，该方法包括如下步骤：

步骤110、从数据仓库中确定影响汽油氢含量的关键参数；关键参数包括汽油的原料性质参数和催化裂化装置的操作参数。

具体地，关键参数指影响汽油氢含量的参数，其可以通过分析化工反应机理、研读操作手册、走访现场操作员、整理技术月报以及同相关研究院专家沟通确定，也可以通过对数据仓库中的各参数进行特征选择确定。

原料性质参数包括催化裂化装置进料混合原料油的流量、冷渣油进混合器管流量、渣油进混合器管流量、原料油密度、原料油蒸馏曲线(初馏点、10％蒸发温度、50％蒸发温度、90％蒸发温度、终馏点)、500℃馏出量、原料段进料温度等。操作参数包括催化裂化装置沉降器出口管温度、油出口管温度、稳定塔底温度、塔顶气相温度、油气入管温度、二中回流温度、分馏塔顶出口管温度、二反出口温度、冷却水进提升管流量、二中回流管流量、轻柴油进提升管流量、顶循环进提升管流量、稳定塔回流管温度、稳定塔回流管流量、分馏塔顶回流流量、补充吸收剂管流量、粗汽油泵出口流量等。

步骤120、基于关键参数对应的汽油密度以及汽油终馏点，确定关键参数对应的汽油氢含量。

需要说明的是，本发明实施例通过收集大量汽油性质参数验证各汽油性质参数与汽油氢含量之间的关系。其中，收集的汽油性质参数包括催化汽油密度、催化汽油蒸馏曲线(初馏点、10％蒸发温度、50％蒸发温度、90％蒸发温度、终馏点)、汽油硫含量、烯烃含量、RON值、MON值、全馏量、残留量、损失量、苯含量、蒸气压等，然后以各汽油性质参数作为x轴，并以氢含量为y轴绘制散点图，根据散点可以得到氢含量与汽油密度和汽油终馏点能够呈现较好的线性关系。

此外，基于皮尔逊相关系数得到的热力图也可以定量地展示各汽油性质参数和汽油氢含量的相关性。其中，汽油密度与氢含量的相关系数为0.91，汽油终馏点与氢含量的相关系数为0.98，都呈现非常良好的线性关系。

因此，本发明实施例可以基于氢含量与汽油密度以及汽油终馏点之间的线性关系，确定关键参数对应的汽油氢含量。

步骤130、基于关键参数以及关键参数对应的汽油氢含量，对初始模型进行训练，得到汽油氢含量预测模型。

具体地，在确定关键参数以及关键参数对应的汽油氢含量后，可以以关键参数作为样本，以关键参数对应的汽油氢含量作为样本标签，对初始模型进行训练，得到汽油氢含量预测模型。其中，初始模型可以是基于GDBT(Gradient Boosting Decision Tree)模型构建得到的，也可以是基于其它模型构建得到的，本发明实施例对此不作具体限定。

在得到汽油氢含量预测模型后，可以将待预测汽油对应的原料性质参数和操作参数输入至汽油氢含量预测模型中，从而可以快速且准确得到氢含量预测结果。由此可见，本发明实施例通过训练完成的汽油氢含量预测模型可以对汽油中的氢含量进行预测，从而可以避免传统方法中依赖仪器进行化学分析导致周期长且成本高的问题，而且本发明实施例在没有高精度的仪器的情况下，也能准确得到氢含量预测结果，即本发明实施例不需要依赖于分析仪器进行预测。同时，在得到氢含量预测结果后，若氢含量预测结果存在异常，还可以直接查询对应的原料性质参数以及操作参数，便于根据原料性质参数以及操作参数确定异常原因。

本发明实施例提供的汽油氢含量预测模型训练方法，基于关键参数以及关键参数对应的汽油氢含量，对初始模型进行训练，得到汽油氢含量预测模型，从而实现在没有高精度的分析仪器的情况下，仍可以基于汽油氢含量预测模型快速且准确得到氢含量预测结果，而且本发明实施例可以通过原料性质参数和操作参数确定氢含量预测结果，不需要采集汽油样品进行氢含量检测，效率较高。

基于上述实施例，关键参数对应的汽油氢含量是基于线性模型确定的，线性模型为：

y＝27.726-0.001923a-0.06412b

其中，y表示关键参数对应的汽油氢含量，a表示关键参数对应的汽油密度，b表示关键参数对应的汽油终馏点。

具体地，数据仓库中还可以存储有汽油性质参数，收集的汽油性质参数包括催化汽油密度、催化汽油蒸馏曲线(初馏点、10％蒸发温度、50％蒸发温度、90％蒸发温度、终馏点)、汽油硫含量、烯烃含量、RON值、MON值、全馏量、残留量、损失量、苯含量、蒸气压等，然后以各汽油性质参数作为x轴，并以氢含量为y轴绘制散点图，根据散点可以得到氢含量与汽油密度和汽油终馏点能够呈现较好的线性关系。

其中，本发明实施例采用二元一次解析式逼近离散数据建立回归模型，得到氢含量随密度、终馏点的变化关系的线性模型，具体为：假设建模数据有m组样本数据点，根据训练数据的离散分布情况，用连续曲线近似刻画离散点组所表示坐标之间的函数关系，用解析表达式逼近离散数据；以均方差作为衡量模型拟合程度的指标，反映拟合程度的好坏，均方差越小，说明模型预测结果精确性越好。

基于上述方法，本发明实例可以获取线性模型y＝27.726-0.001923a-0.06412b，用于表征汽油氢含量与汽油密度和汽油终馏点之间的关系，从而可以快速获取关键参数对应的汽油氢含量。其中，线性模型均方差为0.00956，说明曲线拟合良好。

基于上述任一实施例，线性模型是基于如下步骤构建得到的：

对历史汽油密度、历史汽油终馏点以及历史汽油氢含量进行线性拟合，得到线性模型。

具体地，数据仓库中可以存储有历史汽油密度、历史汽油终馏点及其对应的历史汽油氢含量。然后，采用二元一次解析式逼近离散数据建立回归模型，得到氢含量随密度、终馏点的变化关系的线性模型，具体为：假设建模数据有m组样本数据点，根据训练数据的离散分布情况，用连续曲线近似刻画离散点组所表示坐标之间的函数关系，用解析表达式逼近离散数据，从而可以得到线性模型；以均方差作为衡量模型拟合程度的指标，反映拟合程度的好坏，均方差越小，说明模型预测结果精确性越好。

基于上述任一实施例，数据仓库是基于如下步骤建立的：

对历史原料性质参数和历史操作参数进行数据清洗，并将数据清洗后的历史原料性质参数和历史操作参数添加至数据仓库。

具体地，历史原料性质参数和历史操作参数可以是根据需求清单获取的，提取需求清单中对应的文档，并经过处理后拼接成数据框，得到历史原料性质参数和历史操作参数。

由于获取的历史原料性质参数和历史操作参数中可能存在无效值，异常值等，因此本发明实施例对历史原料性质参数和历史操作参数进行数据清洗，并将数据清洗后的历史原料性质参数和历史操作参数添加至数据仓库。例如，可以对数据仓库中的各参数进行无效特征筛查、时间正则处理等。然而，在进行时间正则处理时，会给内存带来较大压力，所以可以采用分生产单元方式建立对应的MySQL数据库和数据表，并在底层对该生产单元对应表的时间列建立时间索引(B+树)，从而可以使得数据仓库对单次的联查请求的响应时间从3.7s下降到0.03s。

由于数据规模庞大，可以进行数据切片，从而避免频繁出现内存缺页中断(如系统盘高占用但是被写入盘没有占用，数据频繁地在内存中调入调出)。经过测试，本发明实施例中数据仓库数据持久化Python脚本中对应函树采样分5次写入数据库的方式，以控制每次数据规模不超过写入十万条，最终可以成功将数据完整存入MySQL数据库中。

此外，数据仓库可以实现基于CSV(Comma-Separated Values)的简要缓存机制，使得数据提取不必总访问数据仓库，提升了查询效率。

由此可见，本发明实施例提供的数据仓库能够基于Python设计的数据清洗脚本，实现去冗余，并能识别空位点(失效位点)、大量取值为单值的异常位点、存在零点漂移的流量位点等，对其进行删除或校正，之后按划分生产单元存入基于MySQL设计的数据库中，且每个生产单元可以维护一个时间标记位。其中，生产单元可以按反应流程进行划分，例如催化裂化可以划分为反应再生、分馏和吸收稳定三个生产单元。

基于上述任一，在得到汽油氢含量预测模型之后，还包括：

在汽油氢含量预测模型的精度小于精度阈值时，从数据仓库中确定补充参数，补充参数与汽油氢含量的相关度大于相关度阈值，补充参数与汽油氢含量的相关度是基于mRMR确定的；

获取补充参数对应的汽油密度以及汽油终馏点，并基于补充参数对应的汽油密度以及汽油终馏点确定补充参数对应的汽油氢含量；

基于补充参数，以及补充参数对应的汽油氢含量，更新汽油氢含量预测模型。

具体地，汽油氢含量预测模型的精度用于表征汽油氢含量预测模型的训练效果，精度越高，训练效果越好；精度越低，训练效果越差。在汽油氢含量预测模型的精度小于精度阈值时，表明汽油氢含量预测模型的训练效果较差，可能是所选取的关键参数与汽油氢含量的相关度较低，导致模型无法准确学习到影响氢含量参数与氢含量之间的关系。

对此，本发明实施例从数据仓库中选取补充参数，补充参数与汽油氢含量的相关度大于相关度阈值，且补充参数与汽油氢含量的相关度也大于关键参数与汽油氢含量的相关度。同时，获取补充参数对应的汽油密度以及汽油终馏点，从而可以进行各化学组分含量分析，得到补充参数对应的氢体积含量，然后基于理想状态方程将氢体积含量转换为补充参数对应的汽油氢含量。

在确定补充参数以及补充参数对应的汽油氢含量后，基于补充参数，以及补充参数对应的汽油氢含量对汽油氢含量预测模型进行训练，从而可以更新汽油氢含量预测模型，使得更新后的汽油氢含量模型能够准确得到氢含量预测结果。

在确定补充参数时，本发明实施例采用mRMR(Max-Relevance and Min-Redundancy)方法的从数据仓库中进行选取，即基于Lasso确定数据仓库中各参数与汽油氢含量的相关度，并在任一参数与汽油氢含量的相关度大于相关度阈值时，将对应参数作为补充参数。

其中，确定各参数与汽油氢含量的相关度的具体过程如下：

最大相关最小冗余(mRMR)是基于互信息的特征选择方法，它根据最大统计依赖性准则来选择特征，从特征空间中寻找与目标结果有最大相关性且相互之间具有最少冗余性的特征集合。

互信息可以度量两个变量x和y之间的相关关系：

假设S为特征集合，|S|为特征数，y为目标变量，I(f_i；y)表示特征f_i与目标变量y之间的互信息，I(f_i；f_j)表示特征f_i与f_j之间的互信息。mRMR追求：

最大相关：

最小冗余：

mRMR算法的计算式表示为：

mRMR特征选择算法综合考虑了相关性和冗余性的平衡，所选出的特征子集能有效提高预测模型的预测精度。

基于上述任一实施例，汽油氢含量预测模型的精度是基于如下步骤确定的：

从数据仓库中随机获取原料性质参数和操作参数作为验证参数，并获取验证参数对应的氢含量；

将验证参数输入至汽油氢含量预测模型，得到汽油氢含量预测模型输出的预测氢含量；

基于预测氢含量以及验证参数对应的氢含量，确定汽油氢含量预测模型的精度；汽油氢含量预测模型的精度包括均方根误差、平均绝对误差以及决定系数中的至少一种。

具体地，在得到训练完成的汽油氢含量预测模型后，需要对模型的性能进行评价，确定模型的精度，精度越高，表明模型的性能越好，精度越低表明模型的性能越差。

对此，在得到汽油氢含量预测模型后，从数据仓库中随机获取原理性质参数和操作参数作为验证参数，并获取验证参数对应的汽油密度以及汽油终馏点，对汽油密度以及汽油终馏点进行各化学组分含量分析，得到氢含量体积，并基于理想状态方程将氢体积含量转换为氢含量百分比，得到验证参数对应的氢含量。接着，将验证参数输入至汽油氢含量预测模型，由该模型进行氢含量预测，得到预测氢含量。

由于前面得到的验证参数对应的氢含量是验证参数的标签，基于验证参数对应的氢含量以及预测氢含量，可以确定模型输出的预测氢含量相对于验证参数对应的氢含量的偏差，进而得到模型的精度。若模型精度较低，则需要获取补充参数对模型进行进一步训练，提高模型的性能。

其中，汽油氢含量预测模型的精度包括均方根误差RMSE、平均绝对误差MSE以及决定系数R²中的至少一种。本发明实施例可以分别设置均方根误差RMSE、平均绝对误差MSE以及决定系数R²对应的阈值，如可以设置均方根误差RMSE对应的阈值为0.6，即在RMSE≤0.6时，表明汽油氢含量预测模型的精度满足要求，能够准确进行氢含量预测；又如可以设置决定系数R²对应的阈值为0.65，即在R²≥0.65时，表明汽油氢含量预测模型的精度满足要求，能够准确进行氢含量预测。

基于上述任一实施例，初始模型是基于GBDT模型构建得到的。

采用GBDT构建汽油氢含量预测模型，采用网格搜索法，以目标函数Obj最小化为原则,给每个待调整参数在一定范围内进行调整，采用先粗略调整再精细调整的原则确定最优模型参数。

基于Python设计的交叉验证脚本能将原始数据直接隔离20％作为测试集直接分离，模型选择和参数调整由训练集中再采用k折交叉验证的方式划分训练集和验证集。基于Python设计的模型评价脚本能根据模型在验证集上的效果评价模型的优劣，主要采用的模型评价指标包括但不限于：

均方根误差：

平均绝对误差：

决定系数：

在模型评价指标达到要求，才能输出最终的汽油氢含量预测模型，否则将重新对GBDT模型的超参数进行更新迭代，直到评价指标达到要求。

其中，GBDT模型的重要参数可以初始化设置如下：n_estimators＝30、learning_rate＝0.1、subsample＝0.6、loss＝'ls'、max_depth＝5、min_samples_split＝100、min_samples_leaf＝10、max_leaf_nodes＝None。本发明实施例可以通过交叉验证结果对GBDT的超参数进行调整，本例采用五折交叉验证，在参数初值附近采用网格搜索将各参数进行组合训练，根据实际计算结果，部分参数作了修改，调整后的重要参数如下：n_estimators＝38、learning_rate＝0.03、subsample＝0.7、max_depth＝8、min_samples_split＝80、min_samples_leaf＝15。

由此可见，本发明实施例通过炼油厂常规理化参数分析数据，就能实现氢含量的精确计算，避免了化学分析反馈周期长、成本高的不足。同时，本发明实施例提出的氢含量快速计算模型能够以很低的代价生成足够规模的汽油氢含量样本支持基于数据驱动的机器学习模型的训练，以实现将汽油氢含量同原料性质和生产关键参数挂钩的映射模型，起到对生产的启发和指导。

基于上述任一实施例，本发明还提供一种汽油氢含量预测方法，如图2所示，该方法包括：

步骤210、确定待预测汽油对应的原料性质参数和操作参数；

步骤220、将待预测汽油对应的原料性质参数和操作参数输入至汽油氢含量预测模型，得到汽油氢含量预测模型输出的氢含量预测结果；

其中，汽油氢含量预测模型是基于如上任一实施例所述的汽油氢含量预测模型训练方法训练得到的。

具体地，本发明实施例基于关键参数以及关键参数对应的汽油氢含量，对初始模型进行训练，得到汽油氢含量预测模型，从而实现在没有高精度的分析仪器的情况下，仍可以基于汽油氢含量预测模型快速且准确得到氢含量预测结果，而且本发明实施例可以通过原料性质参数和操作参数确定氢含量预测结果，不需要采集汽油样品进行氢含量检测，效率较高。

基于上述任一实施例，本发明还提供一种汽油氢含量预测系统，如图3所示，该系统包括：数据仓库模块，数据提取模块、特征选择模块、模型训练模块以及预测模块。

其中，数据仓库模块用于构建数据仓库，即从工厂原理化验物性和工程DCS监控数据中提取历史原料性质参数和历史操作参数，并对其进行数据清洗后，按各生产单元建立对应的MySQL数据库和数据表，并实现CSV缓存机制。然后，特征选择模块对数据仓库中的参数进行特征选择，选取影响氢含量的关键参数，并通过数据提取模块基于汽油密度与汽油终馏点之间的线性关系计算得到关键参数对应的汽油氢含量，从而模型训练模块可以基于关键参数以及关键参数对应的汽油氢含量训练得到汽油氢含量预测模型。在得到汽油氢含量预测模型后，预测模块可以基于汽油氢含量预测模型进行氢含量预测。

下面对本发明提供的汽油氢含量预测模型装置进行描述，下文描述的汽油氢含量预测模型装置与上文描述的汽油氢含量预测模型方法可相互对应参照。

基于上述任一实施例，本发明还提供一种汽油氢含量预测模型训练装置，如图4所示，该装置包括：

参数选取单元410，用于从数据仓库中确定影响汽油氢含量的关键参数；所述关键参数包括汽油的原料性质参数和催化裂化装置的操作参数；

标签确定单元420，用于基于所述关键参数对应的汽油密度以及汽油终馏点，确定所述关键参数对应的汽油氢含量；

模型训练单元430，用于基于所述关键参数以及所述关键参数对应的汽油氢含量，对初始模型进行训练，得到汽油氢含量预测模型。

基于上述任一实施例，所述关键参数对应的汽油氢含量是基于线性模型确定的，所述线性模型为：

y＝27.726-0.001923a-0.06412b；

基于上述任一实施例，所述装置还包括：

第一获取单元，用于获取历史汽油密度、历史汽油终馏点及其对应的历史汽油氢含量；

模型构建单元，用于对所述历史汽油密度、所述历史汽油终馏点以及所述历史汽油氢含量进行线性拟合，得到所述线性模型。

基于上述任一实施例，所述装置还包括：

第二获取单元，用于获取汽油的历史原料性质参数和催化裂化装置的历史操作参数；

数据清洗单元，用于对所述历史原料性质参数和所述历史操作参数进行数据清洗，并将数据清洗后的历史原料性质参数和历史操作参数添加至所述数据仓库。

基于上述任一实施例，所述装置还包括：

分析单元，用于在得到汽油氢含量预测模型之后，在所述汽油氢含量预测模型的精度小于精度阈值时，从所述数据仓库中确定补充参数，所述补充参数与汽油氢含量的相关度大于相关度阈值，所述补充参数与汽油氢含量的相关度是基于mRMR确定的；

氢含量确定单元，用于获取所述补充参数对应的汽油密度以及汽油终馏点，并基于所述补充参数对应的汽油密度以及汽油终馏点确定所述补充参数对应的汽油氢含量；

更新单元，用于基于所述补充参数，以及所述补充参数对应的汽油氢含量，更新所述汽油氢含量预测模型。

基于上述任一实施例，所述装置还包括：

验证参数获取单元，用于从所述数据仓库中随机获取原料性质参数和操作参数作为验证参数，并获取所述验证参数对应的氢含量；

验证单元，用于将所述验证参数输入至所述汽油氢含量预测模型，得到所述汽油氢含量预测模型输出的预测氢含量；

精度确定单元，用于基于所述预测氢含量以及所述验证参数对应的氢含量，确定所述汽油氢含量预测模型的精度；所述汽油氢含量预测模型的精度包括均方根误差、平均绝对误差以及决定系数中的至少一种。

基于上述任一实施例，所述初始模型是基于GBDT模型构建得到的。

基于上述任一实施例，本发明还提供一种汽油氢含量预测装置，如图5所示，该装置包括：

参数确定单元510，用于确定待预测汽油对应的原料性质参数和操作参数；

含量预测单元520，用于将所述待预测汽油对应的原料性质参数和操作参数输入至汽油氢含量预测模型，得到所述汽油氢含量预测模型输出的氢含量预测结果；

其中，所述汽油氢含量预测模型是基于如上任一实施例所述的汽油氢含量预测模型训练方法训练得到的。

图6是本发明提供的电子设备的结构示意图，如图6所示，该电子设备可以包括：处理器(processor)610、存储器(memory)620、通信接口(Communications Interface)630和通信总线640，其中，处理器610，存储器620，通信接口630通过通信总线640完成相互间的通信。处理器610可以调用存储器620中的逻辑指令，以执行汽油氢含量预测模型训练方法，该方法包括：从数据仓库中确定影响汽油氢含量的关键参数；所述关键参数包括汽油的原料性质参数和催化裂化装置的操作参数；基于所述关键参数对应的汽油密度以及汽油终馏点，确定所述关键参数对应的汽油氢含量；基于所述关键参数以及所述关键参数对应的汽油氢含量，对初始模型进行训练，得到汽油氢含量预测模型。

和/或，以执行汽油氢含量预测方法，该方法包括：确定待预测汽油对应的原料性质参数和操作参数；将所述待预测汽油对应的原料性质参数和操作参数输入至汽油氢含量预测模型，得到所述汽油氢含量预测模型输出的氢含量预测结果；其中，所述汽油氢含量预测模型是基于如上所述的汽油氢含量预测模型训练方法训练得到的。

此外，上述的存储器620中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

另一方面，本发明还提供一种计算机程序产品，所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序，所述计算机程序包括程序指令，当所述程序指令被计算机执行时，计算机能够执行上述各方法所提供的汽油氢含量预测模型训练方法，该方法包括：从数据仓库中确定影响汽油氢含量的关键参数；所述关键参数包括汽油的原料性质参数和催化裂化装置的操作参数；基于所述关键参数对应的汽油密度以及汽油终馏点，确定所述关键参数对应的汽油氢含量；基于所述关键参数以及所述关键参数对应的汽油氢含量，对初始模型进行训练，得到汽油氢含量预测模型。

又一方面，本发明还提供一种非暂态计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现以执行上述各提供的汽油氢含量预测模型训练方法，该方法包括：从数据仓库中确定影响汽油氢含量的关键参数；所述关键参数包括汽油的原料性质参数和催化裂化装置的操作参数；基于所述关键参数对应的汽油密度以及汽油终馏点，确定所述关键参数对应的汽油氢含量；基于所述关键参数以及所述关键参数对应的汽油氢含量，对初始模型进行训练，得到汽油氢含量预测模型。

以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下，即可以理解并实施。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件。基于这样的理解，上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。

最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种汽油氢含量预测模型训练方法，其特征在于，包括：

2.根据权利要求1所述的汽油氢含量预测模型训练方法，其特征在于，所述关键参数对应的汽油氢含量是基于线性模型确定的，所述线性模型为：

y＝27.726-0.001923a-0.06412b；

3.根据权利要求2所述的汽油氢含量预测模型训练方法，其特征在于，所述线性模型是基于如下步骤构建得到的：

4.根据权利要求1至3任一项所述的汽油氢含量预测模型训练方法，其特征在于，所述数据仓库是基于如下步骤建立的：

5.根据权利要求1至3任一项所述的汽油氢含量预测模型训练方法，其特征在于，在得到汽油氢含量预测模型之后，还包括：

6.根据权利要求5所述的汽油氢含量预测模型训练方法，其特征在于，所述汽油氢含量预测模型的精度是基于如下步骤确定的：

7.根据权利要求1至3任一项所述的汽油氢含量预测模型训练方法，其特征在于，所述初始模型是基于GBDT模型构建得到的。

8.一种汽油氢含量预测方法，其特征在于，包括：

确定待预测汽油对应的原料性质参数和操作参数；

其中，所述汽油氢含量预测模型是基于如权利要求1至7任一项所述的汽油氢含量预测模型训练方法训练得到的。

9.一种汽油氢含量预测模型训练装置，其特征在于，包括：

10.一种汽油氢含量预测装置，其特征在于，包括：