CN115290594A - 一种油品物性快评模型建立方法及装置 - Google Patents

一种油品物性快评模型建立方法及装置 Download PDF

Info

Publication number
CN115290594A
CN115290594A CN202210824507.3A CN202210824507A CN115290594A CN 115290594 A CN115290594 A CN 115290594A CN 202210824507 A CN202210824507 A CN 202210824507A CN 115290594 A CN115290594 A CN 115290594A
Authority
CN
China
Prior art keywords
data
viscosity
sample
model
treatment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210824507.3A
Other languages
English (en)
Inventor
刘阳
詹辉
何恺源
邓晓旭
颜廷江
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Xinfu Technology Co ltd
Original Assignee
Guangdong Xinfu Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Xinfu Technology Co ltd filed Critical Guangdong Xinfu Technology Co ltd
Priority to CN202210824507.3A priority Critical patent/CN115290594A/zh
Priority to PCT/CN2022/111025 priority patent/WO2024011687A1/zh
Publication of CN115290594A publication Critical patent/CN115290594A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • G01N21/31Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
    • G01N21/35Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
    • G01N21/3577Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light for analysing liquids, e.g. polluted water
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N11/00Investigating flow properties of materials, e.g. viscosity, plasticity; Analysing materials by determining flow properties
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/26Oils; viscous liquids; paints; inks
    • G01N33/28Oils, i.e. hydrocarbon liquids
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2201/00Features of devices classified in G01N21/00
    • G01N2201/12Circuits of general importance; Signal processing
    • G01N2201/129Using chemometrical methods

Abstract

本发明公开了一种油品物性快评模型建立方法及装置,该方法包括:获取待建模油品的样本数据并划分为校正集和验证集;所述待建模油品的样本数据包括每个样本的谱图数据、粘温曲线数据以及各样本对应的化验数据;通过多种数据处理方法,分别对校正集数据进行预处理,获得多个对应的预处理数据集;将所述各预处理数据集的谱图数据、粘温曲线数据分别合并形成多个对应的关联数据集,并通过多种关联算法,分别与各样本对应的化验数据集关联,构建多个对应的物性分析模型;用验证集数据分别对每个物性分析模型进行验证评估,筛选出最优模型作为所述待建模油品的物性快评模型。本方法构建的模型准确性高,可以准确预测油品的物料物性指标。

Description

一种油品物性快评模型建立方法及装置
技术领域
本发明涉及石油化工行业领域,尤其涉及一种油品物性快评模型建立方法及装置。
背景技术
现阶段,国内外大多数炼厂对生产过程中各类原料及中间产品进行分析时,主要通过传统的化验分析方法。传统的化验分析方法,每个指标都需相关人员采用单独的仪器或方法分别进行分析,因此人工成本和设备维护费用高,且很难满足安全环保的要求,缺乏有效的快评分析方法,导致化验分析人员工作强度大、效率低。
部分石油化工企业引入了一些快评分析技术,例如近红外光谱(NIR)、中红外光谱(MIR)和核磁共振波谱(NMR)等分析技术。这几种快评分析技术检测原理和应用领域有所差别,但谱图解析过程的技术路线基本相同。谱图解析主要包括两个过程:(1)分析模型的建立;(2)谱图的解析。各指标分析模型的质量,直接决定了快评分析数据的准确性。但在实际应用过程中,现行分析技术存在着一些通用性的弊端:几种谱图目前只能实现样品内部官能团层面的分析,信息量较少,对于一些复杂指标关联性不强,模型准确性不高,并且物料物性指标发生波动时模型很难预测到其变化趋势。
现行的快评分析技术至少存在以下的缺陷:模型准确性不高,难以准确预测样品的物料物性指标。
发明内容
本发明提供了一种油品物性快评模型建立方法及装置,以解决模型准确性不高,难以准确预测样品的物料物性指标的技术问题。
为了解决上述技术问题,本发明实施例提供了一种油品物性快评模型建立方法,包括:
获取待建模油品的样本数据并划分为校正集和验证集;其中,所述待建模油品的样本数据包括每个样本的谱图数据、粘温曲线数据以及各样本对应的化验数据;所述谱图数据为待建模油品的光谱数据或波谱数据;
通过多种数据处理方法,分别对校正集数据进行预处理,获得多个对应的预处理数据集;
将所述各预处理数据集的谱图数据、粘温曲线数据分别合并形成多个对应的关联数据集,并通过多种关联算法,分别与各样本对应的化验数据集关联,构建多个对应的物性分析模型;
用验证集数据分别对每个物性分析模型进行验证评估,筛选出最优模型作为所述待建模油品的物性快评模型。
本发明在现有技术的基础上,创造性地提出了谱图数据与黏温曲线数据结合的快评模型建立方法,进一步提高了快评模型的准确性。油品光谱或波谱主要反应了样品中各有机分子的基团特性,各温度点粘度信息有利于分析重质油的理化性质。因此,将谱图数据与粘温曲线数据结合,反映出来的油品信息将会更为详细、丰富且准确,在此基础上构建的物性分析模型准确性高,可以准确预测油品的物料物性指标。
进一步地,所述获取待建模油品的样本数据并划分为校正集和验证集,具体为:采用Kolmogorov-Smirnov算法将所有样本分为校正集和验证集两类。
进一步地,所述通过多种数据处理方法,分别对校正集数据进行预处理,获得多个对应的预处理数据集,具体为:
对校正集中各样本的谱图数据,分别选择多种第一数据处理方法进行预处理,并获得每个样本对应的预处理后的谱图数据,其中,所述第一数据处理方法包括:无处理、均值中心化处理、均值方差化处理、矢量归一化处理、最大值最小值归一化处理、标准正态变量变换处理、多元散射校正处理、Savitzky-Golay卷积平滑处理、一阶导数法处理、去趋势法处理、基线校正法处理中的至少两种或多种组合;
对校正集中各样本的粘温曲线数据,利用预设算法拟合出黏温曲线的经验公式,并根据预设的多个温度点,计算得到对应的粘度值,继而根据多种第二数据处理方法,分别对多个温度点及每个温度点对应的粘度值进行预处理,获得每个样本对应的预处理后的粘温曲线数据;其中,每个粘温曲线数据对应多个温度点及每个温度点对应的粘度值;所述第二数据处理方法包括:对数处理、均值化处理、均值方差化处理、最大值最小值归一化处理中的至少一种或多种组合。
各物性分析模型的质量,直接决定了物料物性指标预测的准确性。在建模前对谱图数据进行预处理,可以降低谱图扫谱过程中无法避免的数据噪音、基线漂移等负面影响,提高模型的质量;通过黏温曲线的经验公式可推算出任意温度点的粘度数值,弥补了单一温度点下粘度数据反应的结构信息不全面的缺陷;本发明采用多种数据处理方法对校正集数据进行预处理,形成多个对应的预处理数据集,用以构建多个对应的物性分析模型并从优选择,确保了模型的质量,从而可以准确预测样品的物料物性指标。
进一步地,在所述获得每个样本对应的预处理后的谱图数据之后,根据预设的降维方法,分别对各所述预处理后的谱图数据进行降维处理;其中,所述降维方法包括简易模型法或主成分分析法。
谱图数据往往都是高维度数据,伴随着众多不必要信息,因而在正式建模之前,先对谱图数据进行降维处理,采用简易模型法和主成分分析法可有效降低谱图数据点数,一方面提高了建模效率,另一方面,也可减少无用信息的干扰以提高模型的准确性,从而提高样品的物料物性指标预测的准确度。
进一步地,将所述各预处理数据集的谱图数据、粘温曲线数据分别合并形成多个对应的关联数据集,并通过多种关联算法,分别与各样本对应的化验数据集关联,构建多个对应的物性分析模型,所述多种关联算法包括:偏最小二乘法、人工神经网络、核偏最小二乘法中的至少一种或多种组合。
本发明采用多种关联算法构建多个对应的物性分析模型并从优选择,排除了单一物性分析模型质量不高导致的预测结果不准确的可能,确保了模型的准确性,提高了样品的物料物性指标预测的准确度。
进一步地,所述用验证集数据分别对每个物性分析模型进行验证评估,筛选出最优模型作为所述待建模油品的物性快评模型,具体为:
将验证集中各样本的谱图数据、粘温曲线数据合并形成待预测数据集,分别利用每个物性分析模型进行预测,获得多个对应的预测结果集;
将各预测结果集分别与验证集中各样本对应的化验数据集进行对比,筛选出验证集误差最小的模型作为所述待建模油品的物性快评模型。
验证集误差越小,说明模型准确性越高,因此,采用所有模型中验证集误差最小的模型,可以确保样品的物料物性指标预测的准确度。
一种油品物性快评模型建立装置,包括:获取模块、预处理模块、建模模块、筛选模块。
所述获取模块用于获取待建模油品的样本数据并划分为校正集和验证集;其中,所述待建模油品的样本数据包括每个样本的谱图数据、粘温曲线数据以及各样本对应的化验数据;所述谱图数据为待建模油品的光谱数据或波谱数据;
所述预处理模块用于通过多种数据处理方法,分别对校正集数据进行预处理,获得多个对应的预处理数据集;
所述建模模块用于将所述各预处理数据集的谱图数据、粘温曲线数据分别合并形成多个对应的关联数据集,并通过多种关联算法,分别与各样本对应的化验数据集关联,构建多个对应的物性分析模型;
所述筛选模块用于用验证集数据分别对每个物性分析模型进行验证评估,筛选出最优模型作为所述待建模油品的物性快评模型。
其中,所述预处理模块包括:谱图数据处理单元和粘温曲线数据处理单元;
所述谱图数据处理单元用于对谱图数据进行预处理,具体为:
对校正集中各样本的谱图数据,分别选择多种第一数据处理方法进行预处理,并获得每个样本对应的预处理后的谱图数据,其中,所述第一数据处理方法包括:无处理、均值中心化处理、均值方差化处理、矢量归一化处理、最大值最小值归一化处理、标准正态变量变换处理、多元散射校正处理、Savitzky-Golay卷积平滑处理、一阶导数法处理、去趋势法处理、基线校正法处理中的至少两种或多种组合;
在所述获得每个样本对应的预处理后的谱图数据之后,根据预设的降维方法,分别对各所述预处理后的谱图数据进行降维处理;其中,所述降维方法包括简易模型法或主成分分析法;
所述粘温曲线数据处理单元用于对粘温曲线数据进行预处理,具体为:
对校正集中各样本的粘温曲线数据,利用预设算法拟合出黏温曲线的经验公式,并根据预设的多个温度点,计算得到对应的粘度值,继而根据多种第二数据处理方法,分别对多个温度点及每个温度点对应的粘度值进行预处理,获得每个样本对应的预处理后的粘温曲线数据;其中,每个粘温曲线数据对应多个温度点及每个温度点对应的粘度值;所述第二数据处理方法包括:对数处理、均值化处理、均值方差化处理、最大值最小值归一化处理中的至少一种或多种组合。
所述建模模块预设多种关联算法用于建模,其中,多种关联算法包括:偏最小二乘法、人工神经网络、核偏最小二乘法中的至少一种或多种组合。
所述筛选模块用于用验证集数据分别对每个物性分析模型进行验证评估,筛选出最优模型作为所述待建模油品的物性快评模型,具体为:
将验证集中各样本的谱图数据、粘温曲线数据合并形成待预测数据集,分别利用每个物性分析模型进行预测,获得多个对应的预测结果集;
将各预测结果集分别与验证集中各样本对应的化验数据集进行对比,筛选出验证集误差最小的模型作为所述待建模油品的物性快评模型。
本发明提供的装置创造性地使用了谱图数据与黏温曲线数据结合的快评分析模式,进一步提高了快评模型的准确性。油品光谱或波谱主要反应了样品中各有机分子的基团特性,各温度点粘度信息有利于分析重质油的理化性质,因此,将谱图数据与粘温曲线数据结合,反映出来的油品信息将会更为详细、丰富且准确,在此基础上构建的物性分析模型准确性高,可以准确预测油品的物料物性指标。
附图说明
图1:为本发明提供的一种油品物性快评模型建立方法的一种流程示意图;
图2:为本发明实施例一不同方案下各建模方法所构建模型验证集误差变化趋势图;
图3:为本发明实施例二不同方案下各建模方法所构建模型验证集误差变化趋势图;
图4:为本发明实施例三提供的一种油品物性快评模型建立装置的一种结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例一
请参照图1是本发明提供的一种油品物性快评模型建立方法的一种流程示意图,本实施例利用该方法对某炼厂沥青组分进行评价分析,分析指标以针入度为例,包括步骤101至步骤104,各步骤具体方法如下:
在本实施例中,利用中红外光谱仪采集待建模油品样本的谱图数据,利用粘度仪采集待建模油品样本的粘温曲线数据,并根据预设算法拟合出的黏温曲线的经验公式推算出50℃、60℃、70℃、80℃、90℃、100℃六个温度点粘度数据,对应的化验数据为针入度化验数据。
步骤101:获取待建模油品的样本数据并划分为校正集和验证集。
其中,所述待建模油品的样本数据包括每个样本的谱图数据、粘温曲线数据以及各样本对应的化验数据;所述谱图数据为待建模油品的光谱数据或波谱数据;
先获取100个用于沥青调和的渣油样本,其针入度值变化范围为40~100,分别获取各渣油样本的中红外光谱数据、黏温曲线数据及各样本对应的针入度化验数据,并形成谱图数据集X1、黏温曲线数据集X2及各样本对应的化验数据集Y,其中,X1维度为100*4417,X2维度为100*6,Y维度为100*1,中红外光谱波段范围为600~4000cm-1,切割点数为4417,粘度值所取温度点数目为6,即50℃、60℃、70℃、80℃、90℃、100℃六个温度点,油品需要建立模型的物性指标数目为1,即针入度;
进一步地,所述获取待建模油品的样本数据并划分为校正集和验证集,具体为:采用Kolmogorov-Smirnov算法将所有样本分为校正集和验证集两类。
将建模所需的数据按照Kolmogorov-Smirnov算法将100个样本分为校正集和验证集两部分,校正集数据用于构建模型,验证集数据用于验证评估模型。在本实施例中,校正集样本比例设定为80%,即校正集含80个样本,验证集含20个样本,校正集数据分别记为X1c、X2c、Yc,,验证集数据分别记为X1v、X2v、Yv,其中,X1c为校正集的谱图数据,其维度为80*4417,X2c为校正集的黏温曲线数据,其维度为80*6,Yc为校正集的各样本对应的化验数据,其维度为80*1,X1v为验证集的谱图数据,其维度为20*4417,X2v为验证集的黏温曲线数据,其维度为20*6,Yv为验证集的各样本对应的化验数据,其维度为20*1。
步骤102:通过多种数据处理方法,分别对校正集数据进行预处理,获得多个对应的预处理数据集。
对校正集中各样本的谱图数据,分别选择多种第一数据处理方法进行预处理,并获得每个样本对应的预处理后的谱图数据,其中,所述第一数据处理方法包括:无处理、均值中心化处理、均值方差化处理、矢量归一化处理、最大值最小值归一化处理、标准正态变量变换处理、多元散射校正处理、Savitzky-Golay卷积平滑处理、一阶导数法处理、去趋势法处理、基线校正法处理中的至少两种或多种组合;
在本实施例中,将分类好的校正集数据X1c复制成11份,分别采用11种不同的第一数据处理方法进行预处理,形成11份不同的预处理数据集;所述第一数据处理方法包括:无处理、均值中心化处理、均值方差化处理、矢量归一化处理、最大值最小值归一化处理、标准正态变量变换处理、多元散射校正处理、Savitzky-Golay卷积平滑处理、一阶导数法处理、去趋势法处理、基线校正法处理;
进一步地,在所述获得每个样本对应的预处理后的谱图数据之后,根据预设的降维方法,分别对各所述预处理后的谱图数据进行降维处理;其中,所述降维方法包括简易模型法或主成分分析法;
在本实施例中,通过主成分分析法提取谱图数据40个主成分,将谱图维度从4417降低到40;
对校正集中各样本的粘温曲线数据,利用预设算法拟合出黏温曲线的经验公式,并根据预设的多个温度点,计算得到对应的粘度值,继而根据多种第二数据处理方法,分别对多个温度点及每个温度点对应的粘度值进行预处理,获得每个样本对应的预处理后的粘温曲线数据;其中,每个粘温曲线数据对应多个温度点及每个温度点对应的粘度值;所述第二数据处理方法包括:对数处理、均值化处理、均值方差化处理、最大值最小值归一化处理中的至少一种或多种组合;
在本实施例中,对校正集数据X2c利用预设算法拟合出的黏温曲线经验公式为:log(μ)=log(μ0)+L/(T/T0-1),并根据所述拟合后的黏温曲线经验公式推算出预设的50℃、60℃、70℃、80℃、90℃、100℃六个温度点对应的粘度值,采用1种第二数据处理方法,即对数处理进行预处理,获得每个样本对应的预处理后的粘温曲线数据。
其中,μ表示油品组分的粘度,μ0表示油品组分在温度无限高时的极限粘度,T表示温度,T0表示油品组分凝固成固体(粘度无限大)时的温度,L为相关参数,用于衡量粘温曲线与实测的粘度-温度数据的贴合程度。
表1为本实施例不同方案下谱图数据及黏温曲线数据处理方法。
表1不同方案下谱图数据及黏温曲线数据处理方法
方案序号 谱图数据处理方法 黏温曲线数据处理方法
方案1 无处理 对数处理
方案2 均值中心化处理 对数处理
方案3 均值方差化处理 对数处理
方案4 矢量归一化处理 对数处理
方案5 最大值最小值归一化处理 对数处理
方案6 标准正态变量变换处理 对数处理
方案7 多元散射校正处理 对数处理
方案8 Savitzky-Golay卷积平滑处理 对数处理
方案9 一阶导数法处理 对数处理
方案10 去趋势法处理 对数处理
方案11 基线校正法处理 对数处理
步骤103:将所述各预处理数据集的谱图数据、黏温曲线数据分别合并形成多个对应的关联数据集,并通过多种关联算法,分别与各样本对应的化验数据集关联,构建多个对应的物性分析模型。
所述多种关联算法包括:偏最小二乘法、人工神经网络、核偏最小二乘法中的至少一种或多种组合。
在本实施例中,将处理后的11组中红外光谱数据集X1c与黏温曲线数据集X2c分别合并形成11组对应的关联数据集Xc,Xc维度为80*46,并通过偏最小二乘法(PLS)、人工神经网络(ANN)、核偏最小二乘法(KPLS)三种预设算法,分别与各样本对应的化验数据集Yc进行关联,共构建33个针入度分析模型;
同时,将处理后的11组中红外光谱数据集X1c通过偏最小二乘法(PLS)、人工神经网络(ANN)、核偏最小二乘法(KPLS)三种预设算法,分别与各样本对应的化验数据集Yc进行关联,建立33个中红外光谱-针入度分析模型作为基础模型进行参照。
步骤104:用验证集数据分别对每个物性分析模型进行验证评估,筛选出最优模型作为所述待建模油品的物性快评模型。
将验证集中各样本的谱图数据、粘温曲线数据合并形成待预测数据集,分别利用每个物性分析模型进行预测,获得多个对应的预测结果集;
将各预测结果集分别与验证集中各样本对应的化验数据集进行对比,筛选出验证集误差最小的模型作为所述待建模油品的物性快评模型。
在本实施例中,将验证集数据X1v、X2v合并形成待预测数据集Xv,分别利用本方法构建的每个针入度分析模型进行预测,获得多个对应的预测结果集,记为Yp;将预测结果集Yp与验证集中各样本对应的化验数据集Yv进行对比,分别计算33个针入度分析模型验证集样品的平均误差,记为Ep1~Ep33
同时,分别利用33个中红外光谱-针入度分析模型作为基础模型进行预测,预测结果集记为Y1p;将预测结果集Y1p与验证集中各样本对应的化验数据集Yv进行对比,分别计算33个中红外光谱-针入度分析模型验证集样品的平均误差,记为Ep34~Ep66,作为基础数据进行参照;
请参照图2为本实施例不同方案下各建模方法所构建模型验证集误差变化趋势图;
从图2可以看出,与单独利用中红外谱图所建立的模型相比,结合黏温曲线数据后,不同预处理方案下各建模方法所建模型整体准确性都有较大提升。单独利用中红外谱图所建立的模型在采用最大值最小值归一化处理,即方案5,并利用KPLS算法进行建模时效果最好,验证集样品平均误差为3.02,而在结合黏温曲线数据后,该方案下所建模型预测结果平均误差降至0.95,准确性提升明显,因此可选取方案5条件下KPLS算法所建模型为最优模型作为所述待建模油品的针入度快评模型。
以上实施例通过使用谱图数据与粘温曲线数据联用的组合快评分析方法,大大提高了石油化工领域各类原料或中间产品物性指标快评分析结果的准确性。将光谱数据或波谱数据在结合黏温曲线数据后共同与各物性指标进行关联,利用各种建模方法所建模型的预测效果都远远优于单独利用谱图数据所建模型,其预测结果误差大幅度下降,准确性显著提升,因此在现有技术的基础上,将黏温曲线数据引入石化物料快评分析领域能够显著提高油品各物性指标的分析模型精度,极大地弥补现行建模方法对复杂物性预测结果准确性不高的缺陷,因而具有极高的应用价值。
本发明在现有技术的基础上,创造性地提出了谱图数据与黏温曲线数据结合的快评模型建立方法,进一步提高了快评模型的准确性。油品光谱或波谱主要反应了样品中各有机分子的基团特性,各温度点粘度信息有利于分析重质油的理化性质,因此,将谱图数据与黏温曲线数据结合,反映出来的油品信息将会更为详细、丰富且准确,在此基础上构建的物性分析模型准确性高,可以准确预测油品的物料物性指标。
实施例二
本实施例利用本发明提供的一种油品物性快评模型建立方法对某炼厂常三线物料(常减压装置直馏柴油)进行评价分析,分析指标以柴油95%馏出温度为例,包括步骤201至步骤204,各步骤具体方法如下:
在本实施例中,利用近红外光谱仪采集待建模油品样本的谱图数据,利用粘度仪采集待建模油品样本的粘温曲线数据,并根据预设算法拟合出的黏温曲线的经验公式推算出20℃、30℃、40℃、50℃、60℃五个温度点粘度数据,对应的化验数据为95%馏出温度化验数据。
步骤201:获取待建模油品的样本数据并划分为校正集和验证集。
其中,所述待建模油品的样本数据包括每个样本的谱图数据、黏温曲线数据以及各样本对应的化验数据;所述谱图数据为待建模油品的光谱数据或波谱数据;
先获取100个常三线柴油样品,其95%馏出温度变化范围约为340~380℃,分别获取各常三线柴油样本的近红外光谱数据、黏温曲线数据及各样品对应的95%馏出温度化验数据,并形成谱图数据集X1、黏温曲线数据集X2及各样本对应的化验数据集Y,其中,X1维度为100*4094,X2维度为100*5,Y维度为100*1,近红外光谱波段范围为4000~12000cm-1,切割点数为4094,粘度值所取温度点数目为5,即20℃、30℃、40℃、50℃、60℃五个温度点,油品需要建立模型的物性指标数目为1,即95%馏出温度。
进一步地,所述获取待建模油品的样本数据并划分为校正集和验证集,具体为:采用Kolmogorov-Smirnov算法将所有样本分为校正集和验证集两类。
将建模所需的数据按照Kolmogorov-Smirnov算法将100个样本分为校正集和验证集两部分,校正集数据用于构建模型,验证集数据用于验证评估模型。在本实施例中,校正集样本比例设定为80%,即校正集含80个样本,验证集含20个样本,校正集数据分别记为X1c、X2c、Yc,,验证集数据分别记为X1v、X2v、Yv,其中,X1c为校正集的谱图数据,其维度为80*4094,X2c为校正集的黏温曲线数据,其维度为80*5,Yc为校正集的各样本对应的化验数据,其维度为80*1,X1v为验证集的谱图数据,其维度为20*4094,X2v为验证集的黏温曲线数据,其维度为20*5,Yv为验证集的各样本对应的化验数据,其维度为20*1。
步骤202:通过多种数据处理方法,分别对校正集数据进行预处理,获得多个对应的预处理数据集。
对校正集中各样本的谱图数据,分别选择多种第一数据处理方法进行预处理,并获得每个样本对应的预处理后的谱图数据,其中,所述第一数据处理方法包括:无处理、均值中心化处理、均值方差化处理、矢量归一化处理、最大值最小值归一化处理、标准正态变量变换处理、多元散射校正处理、Savitzky-Golay卷积平滑处理、一阶导数法处理、去趋势法处理、基线校正法处理中的至少两种或多种组合;
在本实施例中,将分类好的校正集数据X1c复制成11份,分别采用11种不同的第一数据处理方法进行预处理,形成11份不同的预处理数据集;所述第一数据处理方法包括:无处理、均值中心化处理、均值方差化处理、矢量归一化处理、最大值最小值归一化处理、标准正态变量变换处理、多元散射校正处理、Savitzky-Golay卷积平滑处理、一阶导数法处理、去趋势法处理、基线校正法处理;
进一步地,在所述获得每个样本对应的预处理后的谱图数据之后,根据预设的降维方法,分别对各所述预处理后的谱图数据进行降维处理;其中,所述降维方法包括简易模型法或主成分分析法。
在本实施例中,通过主成分分析法提取谱图数据40个主成分,将谱图维度从4094降低到40。
对校正集中各样本的粘温曲线数据,利用预设算法拟合出黏温曲线的经验公式,并根据预设的多个温度点,计算得到对应的粘度值,继而根据多种第二数据处理方法,分别对多个温度点及每个温度点对应的粘度值进行预处理,获得每个样本对应的预处理后的粘温曲线数据;其中,每个粘温曲线数据对应多个温度点及每个温度点对应的粘度值;所述第二数据处理方法包括:对数处理、均值化处理、均值方差化处理、最大值最小值归一化处理中的至少一种或多种组合;
在本实施例中,对校正集数据X2c利用预设算法拟合出的黏温曲线经验公式为:log(μ)=log(μ0)+L/(T/T0-1),并根据所述拟合后的黏温曲线经验公式推算出预设的20℃、30℃、40℃、50℃、60℃五个温度点对应的粘度值,采用1种第二数据处理方法,即最大值最小值归一化处理进行预处理,获得每个样本对应的预处理后的粘温曲线数据。
其中,μ表示油品组分的粘度,μ0表示油品组分在温度无限高时的极限粘度,T表示温度,T0表示油品组分凝固成固体(粘度无限大)时的温度,L为相关参数,用于衡量粘温曲线与实测的粘度-温度数据的贴合程度。
表2为本实施例不同方案下谱图数据及黏温曲线数据处理方法。
表2不同方案下谱图数据及黏温曲线数据处理方法
方案序号 谱图数据处理方法 黏温曲线数据处理方法
方案1 无处理 最大值最小值归一化处理
方案2 均值中心化处理 最大值最小值归一化处理
方案3 均值方差化处理 最大值最小值归一化处理
方案4 矢量归一化处理 最大值最小值归一化处理
方案5 最大值最小值归一化处理 最大值最小值归一化处理
方案6 标准正态变量变换处理 最大值最小值归一化处理
方案7 多元散射校正处理 最大值最小值归一化处理
方案8 Savitzky-Golay卷积平滑处理 最大值最小值归一化处理
方案9 一阶导数法处理 最大值最小值归一化处理
方案10 去趋势法处理 最大值最小值归一化处理
方案11 基线校正法处理 最大值最小值归一化处理
步骤203:将所述各预处理数据集的谱图数据、黏温曲线数据分别合并形成多个对应的关联数据集,并通过多种关联算法,分别与各样本对应的化验数据集关联,构建多个对应的物性分析模型。
所述多种关联算法包括:偏最小二乘法、人工神经网络、核偏最小二乘法中的至少一种或多种组合。
在本实施例中,将处理后的11组近红外光谱数据集X1c与黏温曲线数据集X2c分别合并形成11组对应的关联数据集Xc,Xc维度为80*45,并通过偏最小二乘法(PLS)、人工神经网络(ANN)、核偏最小二乘法(KPLS)三种预设算法,分别与各样本对应的化验数据集Yc进行关联,共构建33个95%馏出温度分析模型;
同时,将处理后的11组近红外光谱数据集X1c通过偏最小二乘法(PLS)、人工神经网络(ANN)、核偏最小二乘法(KPLS)三种预设算法,分别与各样本对应的化验数据集Yc进行关联,建立33个近红外光谱-95%馏出温度分析模型作为基础模型进行参照。
步骤204:用验证集数据分别对每个物性分析模型进行验证评估,筛选出最优模型作为所述待建模油品的物性快评模型。
将验证集中各样本的谱图数据、黏温曲线数据合并形成待预测数据集,分别利用每个物性分析模型进行预测,获得多个对应的预测结果集;
将各预测结果集分别与验证集中各样本对应的化验数据集进行对比,筛选出验证集误差最小的模型作为所述待建模油品的物性快评模型。
在本实施例中,将验证集数据X1v、X2v合并形成待预测数据集Xv,分别利用本方法构建的每个95%馏出温度分析模型进行预测,获得多个对应的预测结果集,记为Yp;将预测结果集Yp与验证集中各样本对应的化验数据集Yv进行对比,分别计算33个95%馏出温度分析模型验证集样品的平均误差,记为Ep1~Ep33
同时,分别利用33个近红外光谱-95%馏出温度分析模型作为基础模型进行预测,预测结果集记为Y1p;将预测结果集Y1p与验证集中各样本对应的化验数据集Yv进行对比,分别计算33个近红外光谱-95%馏出温度分析模型验证集样品的平均误差,记为Ep34~Ep66,作为基础数据进行参照;
请参照图3为本实施例不同方案下各建模方法所构建模型验证集误差变化趋势图;
从图3可以看出,与单独利用近红外谱图所建立的模型相比,结合黏温曲线数据后,不同预处理方案下各建模方法所建模型整体准确性都有较大提升,单独利用近红外谱图所建立的模型在采用基线校正法处理,即方案11,并利用KPLS算法进行建模时效果最好,验证集样品平均误差为1.88,而在结合黏温曲线数据后,该方案下所建模型预测验证集结果平均误差降至0.68,准确性提升明显,因此可选取方案11条件下KPLS方法所建模型为最优模型作为所述待建模油品的95%馏出温度快评模型。
以上实施例通过使用谱图数据与粘温曲线数据联用的组合快评分析方法,大大提高了石油化工领域各类原料或中间产品物性指标快评分析结果的准确性。将光谱数据或波谱数据在结合黏温曲线数据后共同与各物性指标进行关联,利用各种建模方法所建模型的预测效果都远远优于单独利用谱图数据所建模型,其预测结果误差大幅度下降,准确性显著提升,因此在现有技术的基础上,将黏温曲线数据引入石化物料快评分析领域能够显著提高油品各物性指标的分析模型精度,极大地弥补现行建模方法对复杂物性预测结果准确性不高的缺陷,因而具有极高的应用价值。
本发明在现有技术的基础上,创造性地提出了谱图数据与黏温曲线数据结合的快评模型建立方法,进一步提高了快评模型的准确性。油品光谱或波谱主要反应了样品中各有机分子的基团特性,各温度点粘度信息有利于分析重质油的理化性质,因此,将谱图数据与黏温曲线数据结合,反映出来的油品信息将会更为详细、丰富且准确,在此基础上构建的物性分析模型准确性高,可以准确预测油品的物料物性指标。
实施例三
请参照图4是本发明实施例提供的一种油品物性快评模型建立装置的一种结构示意图。
本发明实施例提供了一种油品物性快评模型建立装置,包括:获取模块301、预处理模块302、建模模块303、筛选模块304。
在本实施例中,获取模块301用于获取待建模油品的样本数据并划分为校正集和验证集;其中,所述待建模油品的样本数据包括每个样本的谱图数据、粘温曲线数据以及各样本对应的化验数据;所述谱图数据为待建模油品的光谱数据或波谱数据;
所述获取模块采用Kolmogorov-Smirnov算法将所有样本分为校正集和验证集两类,其中,校正集数据用于构建模型,验证集数据用于验证评估模型。
预处理模块302用于通过多种数据处理方法,分别对校正集数据进行预处理,获得多个对应的预处理数据集;其中,所述预处理模块包括:谱图数据处理单元和粘温曲线数据处理单元。
所述谱图数据处理单元用于对谱图数据进行预处理,具体为:
对校正集中各样本的谱图数据,分别选择多种第一数据处理方法进行预处理,并获得每个样本对应的预处理后的谱图数据,其中,所述第一数据处理方法包括:无处理、均值中心化处理、均值方差化处理、矢量归一化处理、最大值最小值归一化处理、标准正态变量变换处理、多元散射校正处理、Savitzky-Golay卷积平滑处理、一阶导数法处理、去趋势法处理、基线校正法处理中的至少两种或多种组合;
在所述获得每个样本对应的预处理后的谱图数据之后,根据预设的降维方法,分别对各所述预处理后的谱图数据进行降维处理;其中,所述降维方法包括简易模型法或主成分分析法;
所述黏温曲线数据处理单元用于对黏温曲线数据进行预处理,具体为:
对校正集中各样本的粘温曲线数据,利用预设算法拟合出黏温曲线的经验公式,并根据预设的多个温度点,计算得到对应的粘度值,继而根据多种第二数据处理方法,分别对多个温度点及每个温度点对应的粘度值进行预处理,获得每个样本对应的预处理后的粘温曲线数据;其中,每个粘温曲线数据对应多个温度点及每个温度点对应的粘度值;所述第二数据处理方法包括:对数处理、均值化处理、均值方差化处理、最大值最小值归一化处理中的至少一种或多种组合。
建模模块303用于将所述各预处理数据集的谱图数据、粘温曲线数据分别合并形成多个对应的关联数据集,并通过多种关联算法,分别与各样本对应的化验数据集关联,构建多个对应的物性分析模型。
所述建模模块预设多种关联算法用于建模,其中,多种关联算法包括:偏最小二乘法、人工神经网络、核偏最小二乘法中的至少一种或多种组合。
筛选模块304用于用验证集数据分别对每个物性分析模型进行验证评估,筛选出最优模型作为所述待建模油品的物性快评模型。
所述筛选模块用于用验证集数据分别对每个物性分析模型进行验证评估,筛选出最优模型作为所述待建模油品的物性快评模型,具体为:
将验证集中各样本的谱图数据、粘温曲线数据合并形成待预测数据集,分别利用每个物性分析模型进行预测,获得多个对应的预测结果集;
将各预测结果集分别与验证集中各样本对应的化验数据集进行对比,筛选出验证集误差最小的模型作为所述待建模油品的物性快评模型。
本实施例提供的装置创造性地使用了谱图数据与黏温曲线数据结合的快评分析模式,进一步提高了快评模型的准确性。油品光谱或波谱主要反应了样品中各有机分子的基团特性,各温度点粘度信息有利于分析重质油的理化性质,因此,将谱图数据与黏温曲线数据结合,反映出来的油品信息将会更为详细、丰富且准确,在此基础上构建的物性分析模型准确性高,可以准确预测油品的物料物性指标。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步的详细说明,应当理解,以上所述仅为本发明的具体实施例而已,并不用于限定本发明的保护范围。特别指出,对于本领域技术人员来说,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种油品物性快评模型建立方法,其特征在于,包括:
获取待建模油品的样本数据并划分为校正集和验证集;其中,所述待建模油品的样本数据包括每个样本的谱图数据、粘温曲线数据以及各样本对应的化验数据;所述谱图数据为待建模油品的光谱数据或波谱数据;
通过多种数据处理方法,分别对校正集数据进行预处理,获得多个对应的预处理数据集;
将所述各预处理数据集的谱图数据、粘温曲线数据分别合并形成多个对应的关联数据集,并通过多种关联算法,分别与各样本对应的化验数据集关联,构建多个对应的物性分析模型;
用验证集数据分别对每个物性分析模型进行验证评估,筛选出最优模型作为所述待建模油品的物性快评模型。
2.如权利要求1所述的一种油品物性快评模型建立方法,其特征在于,所述获取待建模油品的样本数据并划分为校正集和验证集,具体为:采用Kolmogorov-Smirnov算法将所有样本分为校正集和验证集两类。
3.如权利要求1所述的一种油品物性快评模型建立方法,其特征在于,所述通过多种数据处理方法,分别对校正集数据进行预处理,获得多个对应的预处理数据集,具体为:
对校正集中各样本的谱图数据,分别选择多种第一数据处理方法进行预处理,并获得每个样本对应的预处理后的谱图数据,其中,所述第一数据处理方法包括:无处理、均值中心化处理、均值方差化处理、矢量归一化处理、最大值最小值归一化处理、标准正态变量变换处理、多元散射校正处理、Savitzky-Golay卷积平滑处理、一阶导数法处理、去趋势法处理、基线校正法处理中的至少两种或多种组合;
对校正集中各样本的粘温曲线数据,利用预设算法拟合出黏温曲线的经验公式,并根据预设的多个温度点,计算得到对应的粘度值,继而根据多种第二数据处理方法,分别对多个温度点及每个温度点对应的粘度值进行预处理,获得每个样本对应的预处理后的粘温曲线数据;其中,每个粘温曲线数据对应多个温度点及每个温度点对应的粘度值;所述第二数据处理方法包括:对数处理、均值化处理、均值方差化处理、最大值最小值归一化处理中的至少一种或多种组合。
4.如权利要求3所述的一种油品物性快评模型建立方法,其特征在于,在所述获得每个样本对应的预处理后的谱图数据之后,还包括:
根据预设的降维方法,分别对各所述预处理后的谱图数据进行降维处理;其中,所述降维方法包括简易模型法或主成分分析法。
5.如权利要求4所述的一种油品物性快评模型建立方法,其特征在于,所述多种关联算法包括:偏最小二乘法、人工神经网络、核偏最小二乘法中的至少一种或多种组合。
6.如权利要求5所述的一种油品物性快评模型建立方法,其特征在于,所述用验证集数据分别对每个物性分析模型进行验证评估,筛选出最优模型作为所述待建模油品的物性快评模型,具体为:
将验证集中各样本的谱图数据、粘温曲线数据合并形成待预测数据集,分别利用每个物性分析模型进行预测,获得多个对应的预测结果集;
将各预测结果集分别与验证集中各样本对应的化验数据集进行对比,筛选出验证集误差最小的模型作为所述待建模油品的物性快评模型。
7.一种油品物性快评模型建立装置,其特征在于,包括:获取模块、预处理模块、建模模块、筛选模块;
所述获取模块用于获取待建模油品的样本数据并划分为校正集和验证集;其中,所述待建模油品的样本数据包括每个样本的谱图数据、粘温曲线数据以及各样本对应的化验数据;所述谱图数据为待建模油品的光谱数据或波谱数据;
所述预处理模块用于通过多种数据处理方法,分别对校正集数据进行预处理,获得多个对应的预处理数据集;
所述建模模块用于将所述各预处理数据集的谱图数据、粘温曲线数据分别合并形成多个对应的关联数据集,并通过多种关联算法,分别与各样本对应的化验数据集关联,构建多个对应的物性分析模型;
所述筛选模块用于用验证集数据分别对每个物性分析模型进行验证评估,筛选出最优模型作为所述待建模油品的物性快评模型。
8.如权利要求7所述的一种油品物性快评模型建立装置,其特征在于,所述预处理模块包括:谱图数据处理单元和粘温曲线数据处理单元;
所述谱图数据处理单元用于对谱图数据进行预处理,具体为:
对校正集中各样本的谱图数据,分别选择多种第一数据处理方法进行预处理,并获得每个样本对应的预处理后的谱图数据,其中,所述第一数据处理方法包括:无处理、均值中心化处理、均值方差化处理、矢量归一化处理、最大值最小值归一化处理、标准正态变量变换处理、多元散射校正处理、Savitzky-Golay卷积平滑处理、一阶导数法处理、去趋势法处理、基线校正法处理中的至少两种或多种组合;
在所述获得每个样本对应的预处理后的谱图数据之后,根据预设的降维方法,分别对各所述预处理后的谱图数据进行降维处理;其中,所述降维方法包括简易模型法或主成分分析法;
所述粘温曲线数据处理单元用于对粘温曲线数据进行预处理,具体为:
对校正集中各样本的粘温曲线数据,利用预设算法拟合出黏温曲线的经验公式,并根据预设的多个温度点,计算得到对应的粘度值,继而根据多种第二数据处理方法,分别对多个温度点及每个温度点对应的粘度值进行预处理,获得每个样本对应的预处理后的粘温曲线数据;其中,每个粘温曲线数据对应多个温度点及每个温度点对应的粘度值;所述第二数据处理方法包括:对数处理、均值化处理、均值方差化处理、最大值最小值归一化处理中的至少一种或多种组合。
9.如权利要求7所述的一种油品物性快评模型建立装置,其特征在于,所述建模模块预设多种关联算法用于建模,其中,多种关联算法包括:偏最小二乘法、人工神经网络、核偏最小二乘法中的至少一种或多种组合。
10.如权利要求9所述的一种油品物性快评模型建立装置,其特征在于,所述筛选模块用于用验证集数据分别对每个物性分析模型进行验证评估,筛选出最优模型作为所述待建模油品的物性快评模型,具体为:
将验证集中各样本的谱图数据、粘温曲线数据合并形成待预测数据集,分别利用每个物性分析模型进行预测,获得多个对应的预测结果集;
将各预测结果集分别与验证集中各样本对应的化验数据集进行对比,筛选出验证集误差最小的模型作为所述待建模油品的物性快评模型。
CN202210824507.3A 2022-07-14 2022-07-14 一种油品物性快评模型建立方法及装置 Pending CN115290594A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202210824507.3A CN115290594A (zh) 2022-07-14 2022-07-14 一种油品物性快评模型建立方法及装置
PCT/CN2022/111025 WO2024011687A1 (zh) 2022-07-14 2022-08-09 一种油品物性快评模型建立方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210824507.3A CN115290594A (zh) 2022-07-14 2022-07-14 一种油品物性快评模型建立方法及装置

Publications (1)

Publication Number Publication Date
CN115290594A true CN115290594A (zh) 2022-11-04

Family

ID=83821669

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210824507.3A Pending CN115290594A (zh) 2022-07-14 2022-07-14 一种油品物性快评模型建立方法及装置

Country Status (2)

Country Link
CN (1) CN115290594A (zh)
WO (1) WO2024011687A1 (zh)

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105004745B (zh) * 2014-04-18 2019-02-01 中国石油化工股份有限公司 一种由核磁共振谱预测原油粘度的方法
CN107817223A (zh) * 2017-10-20 2018-03-20 华东理工大学 快速无损实时预测原油性质模型的构建方法及其应用
CN110687072B (zh) * 2019-10-17 2020-12-01 山东大学 一种基于光谱相似度的校正集和验证集的选择及建模方法
CN112285056B (zh) * 2020-10-14 2022-02-08 山东大学 一种用于光谱样品个性化校正集选择及建模方法
CN113793652A (zh) * 2021-09-16 2021-12-14 广东辛孚科技有限公司 一种基于分段智能优选的谱图化学计量学解析方法

Also Published As

Publication number Publication date
WO2024011687A1 (zh) 2024-01-18

Similar Documents

Publication Publication Date Title
CN101995389B (zh) 一种由近红外光谱快速识别原油种类的方法
CN107703097B (zh) 利用近红外光谱仪构建快速预测原油性质的模型的方法
CN109324013B (zh) 利用高斯过程回归模型构建原油性质近红外快速分析方法
CN105300923A (zh) 一种近红外光谱分析仪在线应用时无测点温度补偿模型修正方法
CN107976419B (zh) 一种由油品近红外光谱预测其性质的方法
CN109324014B (zh) 一种自适应的原油性质近红外快速预测方法
CN101893561A (zh) 一种润滑油新油质量近红外光谱快速测定方法
CN102841069B (zh) 一种由中红外光谱识别原油种类的方法
CN111537845A (zh) 基于拉曼光谱聚类分析的油纸绝缘设备老化状态识别方法
Yu et al. A novel integrated approach to characterization of petroleum naphtha properties from near-infrared spectroscopy
CN113158575A (zh) 一种假定标样的在线近红外光谱模型的转移方法
CN109283153B (zh) 一种酱油定量分析模型的建立方法
CN107966420B (zh) 一种由近红外光谱预测原油性质的方法
CN110987858A (zh) 一种利用神经网络数据模型进行油品快速检测的方法
CN105954228A (zh) 基于近红外光谱的油砂中金属钠含量的测量方法
CN115290594A (zh) 一种油品物性快评模型建立方法及装置
CN109709060B (zh) 一种沥青软化点、针入度和质量损失的测定方法
CN113793652A (zh) 一种基于分段智能优选的谱图化学计量学解析方法
CN106970042B (zh) 一种卡拉胶杂质、水分含量检测方法
CN116008248A (zh) 燃油拉曼光谱测定方法及系统
CN112198136A (zh) 一种基于中红外光谱的汽轮机油酸值无损检测方法
CN110823764A (zh) 预测基础油粘度的方法、装置
CN114018856A (zh) 光谱校正方法
CN115270611A (zh) 一种石油化工中样品非线性指标的模型建立方法及装置
CN111257265A (zh) 一种钢桥面铺装用沥青针入度指标的快速检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination