CN112149858A - 一种利用原油谱学信息预测渣油馏分sara组成的方法 - Google Patents
一种利用原油谱学信息预测渣油馏分sara组成的方法 Download PDFInfo
- Publication number
- CN112149858A CN112149858A CN201910566946.7A CN201910566946A CN112149858A CN 112149858 A CN112149858 A CN 112149858A CN 201910566946 A CN201910566946 A CN 201910566946A CN 112149858 A CN112149858 A CN 112149858A
- Authority
- CN
- China
- Prior art keywords
- spectral information
- residual
- correction model
- sara
- crude oil
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 93
- 230000003595 spectral effect Effects 0.000 title claims abstract description 92
- RZVAJINKPMORJF-UHFFFAOYSA-N Acetaminophen Chemical compound CC(=O)NC1=CC=C(O)C=C1 RZVAJINKPMORJF-UHFFFAOYSA-N 0.000 title claims abstract description 81
- 239000003921 oil Substances 0.000 title claims abstract description 69
- 239000000203 mixture Substances 0.000 title claims abstract description 63
- 239000010779 crude oil Substances 0.000 title claims abstract description 53
- 238000012937 correction Methods 0.000 claims abstract description 89
- 238000012545 processing Methods 0.000 claims abstract description 20
- 238000000611 regression analysis Methods 0.000 claims abstract description 5
- 238000001228 spectrum Methods 0.000 claims description 26
- 238000010561 standard procedure Methods 0.000 claims description 24
- 238000002329 infrared spectrum Methods 0.000 claims description 17
- 238000012706 support-vector machine Methods 0.000 claims description 17
- 238000000655 nuclear magnetic resonance spectrum Methods 0.000 claims description 9
- 238000012795 verification Methods 0.000 claims description 9
- 238000004476 mid-IR spectroscopy Methods 0.000 claims description 8
- 238000005481 NMR spectroscopy Methods 0.000 claims description 7
- 238000004422 calculation algorithm Methods 0.000 claims description 6
- 238000005259 measurement Methods 0.000 claims description 6
- 239000000126 substance Substances 0.000 claims description 5
- 238000004497 NIR spectroscopy Methods 0.000 claims description 4
- 238000013528 artificial neural network Methods 0.000 claims description 4
- 238000007637 random forest analysis Methods 0.000 claims description 4
- UFHFLCQGNIYNRP-UHFFFAOYSA-N Hydrogen Chemical compound [H][H] UFHFLCQGNIYNRP-UHFFFAOYSA-N 0.000 claims description 2
- 229910052739 hydrogen Inorganic materials 0.000 claims description 2
- 239000001257 hydrogen Substances 0.000 claims description 2
- 238000003672 processing method Methods 0.000 claims description 2
- 238000012314 multivariate regression analysis Methods 0.000 claims 1
- 238000004458 analytical method Methods 0.000 abstract description 8
- 238000012360 testing method Methods 0.000 abstract description 3
- 239000011159 matrix material Substances 0.000 description 28
- 238000002835 absorbance Methods 0.000 description 15
- 230000006870 function Effects 0.000 description 12
- 230000008569 process Effects 0.000 description 8
- 239000013598 vector Substances 0.000 description 7
- UHOVQNZJYSORNB-UHFFFAOYSA-N Benzene Chemical compound C1=CC=CC=C1 UHOVQNZJYSORNB-UHFFFAOYSA-N 0.000 description 6
- IMNFDUFMRHMDMM-UHFFFAOYSA-N N-Heptane Chemical compound CCCCCCC IMNFDUFMRHMDMM-UHFFFAOYSA-N 0.000 description 6
- 238000011156 evaluation Methods 0.000 description 5
- 239000003208 petroleum Substances 0.000 description 5
- XQCFHQBGMWUEMY-ZPUQHVIOSA-N Nitrovin Chemical compound C=1C=C([N+]([O-])=O)OC=1\C=C\C(=NNC(=N)N)\C=C\C1=CC=C([N+]([O-])=O)O1 XQCFHQBGMWUEMY-ZPUQHVIOSA-N 0.000 description 3
- 125000003118 aryl group Chemical group 0.000 description 3
- 238000000354 decomposition reaction Methods 0.000 description 3
- 239000000295 fuel oil Substances 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 238000000926 separation method Methods 0.000 description 3
- 238000004611 spectroscopical analysis Methods 0.000 description 3
- RTZKZFJDLAIYFH-UHFFFAOYSA-N Diethyl ether Chemical compound CCOCC RTZKZFJDLAIYFH-UHFFFAOYSA-N 0.000 description 2
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 2
- XEEYBQQBJWHFJM-UHFFFAOYSA-N Iron Chemical compound [Fe] XEEYBQQBJWHFJM-UHFFFAOYSA-N 0.000 description 2
- 238000003556 assay Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000009529 body temperature measurement Methods 0.000 description 2
- 238000009835 boiling Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000012417 linear regression Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000007670 refining Methods 0.000 description 2
- 239000002904 solvent Substances 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- 108010074864 Factor XI Proteins 0.000 description 1
- 230000005526 G1 to G0 transition Effects 0.000 description 1
- 239000003463 adsorbent Substances 0.000 description 1
- 238000005377 adsorption chromatography Methods 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 239000000084 colloidal system Substances 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000007598 dipping method Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 239000000446 fuel Substances 0.000 description 1
- 238000002290 gas chromatography-mass spectrometry Methods 0.000 description 1
- 239000003292 glue Substances 0.000 description 1
- 125000005842 heteroatom Chemical group 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 229910052742 iron Inorganic materials 0.000 description 1
- 238000012886 linear function Methods 0.000 description 1
- 238000004949 mass spectrometry Methods 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 235000010987 pectin Nutrition 0.000 description 1
- 229920001277 pectin Polymers 0.000 description 1
- 239000001814 pectin Substances 0.000 description 1
- 238000005504 petroleum refining Methods 0.000 description 1
- 230000000704 physical effect Effects 0.000 description 1
- 238000004886 process control Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 229920006395 saturated elastomer Polymers 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
- 229910003158 γ-Al2O3 Inorganic materials 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
- G01N21/31—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
- G01N21/35—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
- G01N21/3577—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light for analysing liquids, e.g. polluted water
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
- G01N21/31—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
- G01N21/35—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
- G01N21/359—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light using near infrared light
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N24/00—Investigating or analyzing materials by the use of nuclear magnetic resonance, electron paramagnetic resonance or other spin effects
- G01N24/08—Investigating or analyzing materials by the use of nuclear magnetic resonance, electron paramagnetic resonance or other spin effects by using nuclear magnetic resonance
- G01N24/081—Making measurements of geologic samples, e.g. measurements of moisture, pH, porosity, permeability, tortuosity or viscosity
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Chemical & Material Sciences (AREA)
- Immunology (AREA)
- Biochemistry (AREA)
- Analytical Chemistry (AREA)
- Pathology (AREA)
- Strategic Management (AREA)
- Theoretical Computer Science (AREA)
- General Business, Economics & Management (AREA)
- High Energy & Nuclear Physics (AREA)
- Marketing (AREA)
- Tourism & Hospitality (AREA)
- Entrepreneurship & Innovation (AREA)
- Public Health (AREA)
- Development Economics (AREA)
- Game Theory and Decision Science (AREA)
- Water Supply & Treatment (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Environmental & Geological Engineering (AREA)
- General Life Sciences & Earth Sciences (AREA)
- Geochemistry & Mineralogy (AREA)
- Geology (AREA)
- Primary Health Care (AREA)
- Investigating Or Analysing Materials By Optical Means (AREA)
Abstract
本发明提供了一种利用原油谱学信息预测渣油馏分SARA组成的方法,包括:(a)获取原油样本的渣油馏分SARA组成数据集和预设恒定温度下的谱学信息,对所述谱学信息中的特征变量进行微分处理,获得经微分处理后的谱学信息数据集;(b)将谱学信息数据集与渣油SARA组成数据集相关联,利用多元回归分析方法分别建立谱学信息主成分与渣油SARA组成的第一校正模型、谱学信息残差与渣油SARA组成残差的第二校正模型;(c)测定待测原油样本在预设恒定温度下的谱学信息,对其中的特征变量进行微分处理,将得到的谱学信息数据代入第一校正模型,谱学信息残差代入第二校正模型,两个模型预测结果相加得到渣油SARA组成。本发明方法分析速度快,测试准确、重复性好。
Description
技术领域
本发明涉及石油化工领域,特别涉及一种利用原油谱学信息预测渣油馏分SARA组成的方法。
背景技术
渣油是石油中相对分子质量最大、结构最复杂、含杂原子量最多、沸点最高的部分,具有结构复杂、相对分子质量大、沸点高的特点,随着石油的重质化以及对轻质油品需求的日益增加,如何有效地将重质油转化为轻质油品已经成为石油工业的重要课题之一。要充分、合理的利用渣油资源,就需要对其结构、组成有清楚的认识。经典的分析方法是对渣油先用正庚烷沉淀出正庚烷沥青质(Asp),然后再以含水1%的中性γ-Al2O3为吸附剂进行吸附色谱分离,用石油醚、苯和苯/乙醇(50/50,v/v)为溶剂顺次冲洗出饱和分(S)、芳香分(A)和胶质(R)。习惯上常将这四个组分的英文名称的第一个字母组合起来,称之为SARA分离法,该方法存在分离周期长、溶剂及固定相消耗多等缺点。显然,难以满足渣油加工过程控制对分析的快速要求,因此,建立快速和高效的渣油性质分析方法具有重要的实际意义。目前国内外大型石化企业都正在基于多种现代仪器分析手段开发建立原油快速评价技术,包括色-质联用(GC-MS)、核磁共振(NMR)、近红外光谱(NIR)和中红外光谱(MIR)等。
从原油评价以及分子炼油的角度出发,渣油馏分的四组分对从分子水平认识原油以及原油调和非常重要,单独建立渣油馏分的谱学信息数据库,通过标准方法采集SARA组成费时费力,成本高。
陈瀑在《近红外原油快速评价技术二次开发与工业应用》(石油炼制与化工,2014,45(8):97~101)一文中,利用近红外原油快速评价系统进行二次开发,该方法通过建立针对炼化企业的近红外原油光谱数据库,以库光谱信息拟合及识别相结合的方式建立了快速评价分析模型,可以得到原油的主要宏观物性。
Aske N等在“Determination of saturate,aromatic,resin,and asphaltenic(SARA)components in crude oils by means of infrared and near-infraredspectroscopy”{Energy Fuels,Issue 15,Pages 1304–1312(2001)}一文中,以近红外、中红外光谱结合偏最小二乘方法用于深色重质油品物化性质如渣油的四组分含量的快速测定。该方法通过渣油的红外/近红外光谱建立校正模型预测渣油的四组分含量,但该方法的进样与清洗过程较为繁琐,工作效率低。
发明内容
本发明提供了一种利用原油谱学信息预测渣油馏分SARA组成的方法。
本发明的预测渣油SARA组成的方法,包括如下步骤:
(a)获取原油样本的渣油SARA组成数据集和预设恒定温度下的谱学信息,对所述谱学信息中的特征变量进行微分处理,获得经微分处理后的谱学信息数据集;
(b)将谱学信息数据集与渣油SARA组成数据集相关联,利用多元回归分析方法分别建立谱学信息主成分与渣油SARA组成的第一校正模型、谱学信息残差与渣油SARA组成残差的第二校正模型;任选进一步对所述第一校正模型与所述第二校正模型进行验证的步骤;
(c)测定待测原油样本在预设恒定温度下的谱学信息,对其中的特征变量进行微分处理,将得到的谱学信息数据分别代入所述的第一校正模型与所述的第二校正模型,两个模型预测结果相加得到待测原油样本的渣油SARA组成。
在步骤(a)中,所述的原油样本优选经过脱盐脱水的原油样本;
所述预设恒定温度优选36~40℃,最优选38℃;优选采用标准方法测定原油样本的渣油SARA组成,更优选采用SH/T0266-1992石油沥青质含量测定法测定原油样本的渣油SARA组成;
所述的谱学信息包括近红外光谱、中红外光谱、核磁共振谱;
所述近红外谱区优选波数为5342~6011cm-1的谱区,所述中红外谱区优选波数为1012~1655cm-1的谱区,所述核磁共振谱区优选化学位移为1.0~7.1氢谱的谱区;
对所述谱学信息中的特征变量进行微分处理时,可以进行一阶微分处理或二阶微分处理;
在步骤(b)中,所述多元回归分析方法可以选用偏最小二乘法、人工神经网络、支持向量机和随机森林方法中的一种或多种;
优选地,将数据集划分为校正集和验证集,利用偏最小二乘法(PLS)得到的主成分建立谱学信息主成分与渣油SARA组成的第一校正模型,利用偏最小二乘法(PLS)得到的谱学信息残差和预测残差通过非线性校正方法建立谱学信息残差与渣油SARA组成残差的第二校正模型;所述非线性校正方法优选支持向量机方法、随机森林方法和人工神经网络方法中的一种或多种;其中所述的谱学信息残差是通过偏最小二乘法(PLS)提取其中的主成分后的剩余部分;所述预测残差是校正集样本的实测值与第一校正模型预测值的差值。
优选地,对所述谱学信息主成分与渣油SARA组成的第一校正模型和/或谱学信息残差与渣油SARA组成残差的第二校正模型进行验证,以得到更为准确的谱学信息主成分与渣油SARA组成的第一校正模型和/或谱学信息残差与渣油SARA组成残差的第二校正模型。验证的方法为使用所建立的模型对一组已知样本进行预测,对比实际值与预测值的偏差。一般来说,当对未知样本的预测标准偏差不超过校正标准偏差的1.2倍时,可以认为得到的所述第一校正模型和/或第二校正模型是可靠的。当对未知样本的预测标准偏差大于等于校正标准偏差的1.2倍时,可以调整建模参数重新建立谱学信息主成分与渣油SARA组成的第一校正模型、谱学信息残差与渣油SARA组成残差的第二校正模型,直至实际值与预测值的标准偏差不超过校正标准偏差的1.2倍。
在步骤(c)中,采用与步骤(a)相同的微分处理方法对待测原油样本的谱学信息中特征变量进行微分处理。
本发明方法采用操作较为简便的原油谱学信息测量其渣油SARA组成,通过选择近红外、中红外、核磁谱学信息的特征谱区,将谱图中的谱学信息数据进行微分处理,将该谱区对应的谱学信息数据与标准方法测得的渣油SARA组成相关联,通过多元回归分析方法分别建立谱学信息主成分与谱学信息残差的校正模型,然后将待测原油样品在所选特征谱区的谱学信息数据代入校正模型,即可预测原油样品的渣油SARA组成。
本发明方法分析速度快,测试准确、重复性好。
本发明还提出了一种机器可读存储介质,该机器可读存储介质上存储有指令,该指令用于使得机器执行前面任一方面所述的预测渣油SARA组成的方法。
附图说明
图1为本发明所用的建立近红外校正模型的流程示意图。
图2为饱和分近红外光谱预测值与SH/T 0266标准方法测定值的相关图。
图3为芳香分近红外光谱预测值与SH/T 0266标准方法测定值的相关图。
图4为胶质近红外光谱预测值与SH/T 0266标准方法测定值的相关图。
图5为沥青质近红外光谱预测值与SH/T 0266标准方法测定值的相关图。
图6为本发明所用的建立中红外校正模型的流程示意图。
图7为饱和分中红外光谱预测值与SH/T 0266标准方法测定值的相关图。
图8为芳香分中红外光谱预测值与SH/T 0266标准方法测定值的相关图。
图9为胶质中红外光谱预测值与SH/T 0266标准方法测定值的相关图。
图10为沥青质中红外光谱预测值与SH/T 0266标准方法测定值的相关图。
图11为本发明所用的建立核磁共振校正模型的流程示意图。
图12为饱和分核磁共振谱预测值与SH/T 0266标准方法测定值的相关图。
图13为芳香分核磁共振谱预测值与SH/T 0266标准方法测定值的相关图。
图14为胶质核磁共振谱预测值与SH/T 0266标准方法测定值的相关图。
图15为沥青质核磁共振谱预测值与SH/T 0266标准方法测定值的相关图。
具体实施方式
以下结合附图对本发明实施例的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本发明的实施例,而非构成对本发明的限制。
近红外光谱是由于分子的振动—转动能级跃迁而产生的。习惯上,往往把波长为2500~25000nm(波数4000~400cm-1)的谱区称为中红外(简称红外)区,把波长为780~2500nm(波数12820~4000cm-1)的谱区称为近红外区。
建立校正模型的方法优选先选定不同类型的原油样品,如不同产区、不同基属、不同粘度的原油,然后用标准方法测定样品的渣油SARA组成。本发明所用测定的渣油SARA组成的标准方法为SH/T0266-1992石油沥青质含量测定法。所选样品的数量越多,所建模型越准确、可靠。但实际操作中为减少工作量,一般选取适当数量且能涵盖所有可能预测值的样品,优选的不同类型的渣油样品数量为100-200个。
为验证模型的准确性,一般将用标准方法测定渣油SARA组成的样品分成校正集和验证集。校正集样品数量较多,并且具有代表性,即校正集样品的渣油SARA组成应涵盖所有预先测定的渣油SARA组成。而验证集则是随机抽取,将其样品当做未知样品,来验正校正模型的准确性,一般来说验证集样品数量较少,可以为测试样品总数量的1/3左右。
在用标准方法测定原油样品的渣油SARA组成后,分别用近红外光谱仪、中红外光谱仪、核磁共振仪测定其谱学信息,然后对所选波段的谱学信息进行一阶或二阶微分处理,以消除干扰。
本发明优选采用偏最小二乘法(PLS)建立第一校正模型、利用支持向量机(SVM)方法建立第二校正模型,然后用随机挑选的验证集中各原油样品在特征谱区对应的谱学信息随机代入校正模型,预测样品的渣油SARA组成,再与标准方法测定的数值进行比较,来验证模型的准确度。
结合图1和表1,说明建立校正模型的方法。
如图1所示,(a)为原油样本与SARA组成数据收集模块,通过分别采集原油样本的谱学信息与SARA组成数据建立数据集其中X为原油样本的谱学信息数据,Y为原油样本的SARA组成数据;(b)为建模模块,是将数据集划分为校正集与验证集利用校正集通过PLS算法得到谱学信息的主成分与谱学信息残差通过主成分建立谱学信息主成分与渣油SARA组成的第一校正模型;通过谱学信息残差建立谱学信息残差与渣油SARA组成残差的第二校正模型;(c)为预测模块,将待测样本的谱学信息数据代入第一校正模型与第二校正模型,二者结果的加和得到SARA组成的预测结果。
本发明方法适用于渣油SARA组成的预测分析。本发明方法预测精度高,简便快速。
下面通过实例详细说明本发明,但本发明并不限于此。
实例中收集的各原油样品,按照SH/T 0266方法测定其渣油SARA组成。
实例1
建立渣油SARA组成近红外光谱校正模型并进行验证。
(a)用标准方法测定渣油SARA组成:收集各个主要产区的原油样品300个,用SH/T0266方法测定其渣油SARA组成。从中选取样品200个组成校正集。
(b)用校正集样品建立校正模型:使用Thermo Antais II近红外光谱仪测量校正集样品的近红外光谱。
操作条件为:可控温测量附件,0.5mm比色皿,透射测量方式,恒温测量,光谱分辨率为8cm-1,累计扫描次数为64次,光谱采集范围为:3500~10000cm-1。
测量方法为:将比色皿置于比色皿架上,用小铁勺从容器中蘸取少量油样后移至比色皿口,让油样顺着比色皿一侧流入,反复几次直到注满比色皿60%容积以上后封口(粘稠样品需加热,同时加热比色皿),以空气为参比进行光谱扫描,扫描次数为64次。
将测得的上述光谱进行一阶微分处理,取波数为5342~6011cm-1波段内光谱变量经一阶微分处理后的吸光度值形成吸光度(X)矩阵,用相应样本的SH/T0266方法测定的渣油SARA组成形成浓度(Y)矩阵,然后X阵经偏最小二乘法(PLS)建立光谱主成分与渣油SARA组成的第一校正模型,X阵的残差阵经支持向量机方法(SVM)与Y阵的残差阵建立光谱残差的第二校正模型。建立模型所用的样本统计参数见表1。
所述偏最小二乘法(PLS)建立光谱主成分与渣油SARA组成的第一校正模型的具体过程为:
Step1,对于光谱矩阵X(n×m)和浓度矩阵Y(n×1)(本例为渣油SARA组成,对每个组分需逐次建模)进行如下分解,其中n为校正集的原油样本数,m为特征谱区吸光度波长点数,即特征谱区内吸光度的采样点数,
其中tk(n×1)为吸光度矩阵X的第k个主因子的得分;
pk(1×m)为吸光度矩阵X的第k个主因子的载荷;
uk(n×1)为浓度矩阵Y的第k个主因子的得分;
qk(1×1)为浓度矩阵Y的第k个主因子的载荷;f为主因子数;即T和U分别为X和Y矩阵的得分矩阵,P和Q分别为X和Y矩阵的载荷矩阵,EX和EY分别为X和Y的PLS拟合残差矩阵;
Step2,将T和U作线性回归:
U=TB
B=(TTT)-1TTY
在预测时,根据P求出未知原油样本(待测原油样本)光谱矩阵X未知的得分T未知,然后由下式得到浓度预测值:Y未知=T未知BQ。
在PLS算法中,也可以把矩阵分解和回归并为一步,即X和Y矩阵的分解同时进行,并且将Y的信息引入到X矩阵分解过程中,在计算每一个新主成分前,将X的得分T与Y的得分U进行交换,使得到的X主成分直接与Y关联。
PLS算法是由H Wold提出的非线性迭代偏最小二乘算法(NIPALS),其计算过程如下:
(1)求吸光度矩阵X的权重向量w
取浓度矩阵Y的某一列(在本实施例中只有一列)作为u的起始迭代值,以u代替t,计算w;
方程为:X=uwT,其解为:wT=uTX/uTu
(2)对权重向量w归一化
wT=wT/||wT||
(3)求吸光度矩阵X的因子得分t,由归一化后的w计算t
方程为:X=twT,其解为:t=Xw/wTw
(4)求浓度矩阵Y的载荷q值,以t代替u计算q
方程为:Y=tqT,左乘tT得其解为:qT=tTY/tTt
(5)对载荷q归一化
qT=qT/||qT||
(6)求浓度矩阵Y的因子得分u,根据qT计算u
方程为:Y=uqT,其解为:u=Yq/qTq
(7)再以此u代替t返回第(1)步计算wT,由wT计算t新,如此反复迭代,若t已收敛(‖t新-t旧‖≤10-6‖t新‖),转入步骤(8)运算,否则返回步骤(1);
(8)由收敛后的t求吸光度矩阵X的载荷向量p
方程为:X=tpT,左乘tT得其解为:pT=tTX/tTt
(9)对载荷p归一化
pT=pT/||pT||
(10)标准化X的因子得分t
t=t||p||
(11)标准化权重向量w
w=w||p||
(12)计算t与u之间的内在关系b
b=uTt/tTt
(13)计算残差矩阵E
EX=X-tpT
EY=Y-btqT
(14)以EX代替X,EY代替Y,返回步骤(1),以此类推,求出X、Y的诸主因子的w、t、p、u、q、b;用交互检验法确定最佳主因子数f,保存f对应的wf、pf、qf;
对待测原油样本的渣油SARA组成yun的预测过程具体如下:
xun为未知原油样本特征谱区吸光度
yun=bPLSxun,其中bPLS=wf T(pfwf T)-1qf;
将上步得到的EX、EY利用SVM方法建立第二校正模型:
对于线性回归体系,f(x)=aTx+b,其校正集样本(xi,yi),i=1,2,…,n,n为校正样本数,并假使所有校正数据都可以在精度ε下无误差地用线性函数拟合,ε为一正常数,即:
将问题转化为在以上约束条件下,求下列函数的最小值:
式中,第1项是使回归函数更为平坦,从而提高泛化能力,第2项则为减少误差,常数C为一个大于零的常数,称为惩罚因子或正则化系数,表示对超出误差ε的样本的惩罚程度;采用Lagrange优化方法可以得到其对偶问题,即在和约束条件下,对Lagrange因子αi和α* i最大化以下目标函数:
式中,只有少部分的不为零,它们对应的样本称为支持向量;若将拟合的数学模型表达为多维空间的某一曲线,则根据ε不敏感函数所得的结果是包含该曲线和训练点的“ε管道”;在所有样本中,只有分布在“管壁”上的那部分样本点决定“管道”的位置,这部分训练样本即为支持向量;
对于非线性问题,支持向量机回归方法的主要思想是将原问题通过非线性变换转化为某个高维空间的线性问题,并在高维空间中进行线性求解;与模式识别的SVM方法一样,只要用核函数K(xi,xj)代替回归函数中的点积xi Txj运算,就可以实现非线性回归;这样,非线性求解问题就变成在和0≤αi、α* i≤C的约束条件下,对Lagrange因子αi和α* i最大化以下目标函数:
支持向量机回归方法中也可采用多项式、径向基和S形等核函数。
在支持向量机回归方法中,参数C和ε的选择对构造回归函数是至关重要的;参数ε表明了对误差的期望(误差要求),ε越小,回归函数估计的精度越高,但支持向量越多;参数C是对误差大于ε样本数据的惩罚,C越大,惩罚越大;目前尚无较好的方法选取参数C和ε,需要采用尝试方法确定;本例中,C=20,ε=18。
(c)验证校正模型的可靠性:随机选取100个样品组成验证集,测量其在恒温下的近红外光谱,取波数为5342~6011cm-1波段内光谱变量经一阶微分处理后得到的吸光度矩阵,其主成分矩阵和残差矩阵分别代入第一和第二校正模型,将两个模型计算的结果加和得到原油样本的渣油SARA组成预测值。
预测值与实际值的对比见图2~图5。从表1和图2~图5中可以看出,预测值与实际值的相关性比较高,预测结果比较准确。
表1模型参数统计
实例2
建立渣油SARA组成中红外光谱校正模型并进行验证。
(a)用标准方法测定渣油SARA组成:收集各个主要产区的原油样品300个,用SH/T0266方法测定其渣油SARA组成。从中选取样品200个组成校正集。
(b)用校正集样品建立校正模型:使用Agilent A2中红外光谱仪测量校正集样品的近红外光谱。
操作条件为:光程100微米透射测量方式,室温测量,光谱分辨率为8cm-1,累计扫描次数为64次,光谱采集范围为:650~4000cm-1。
将测得的上述光谱进行一阶微分处理,取波数为1012~1655cm-1波段内光谱变量经一阶微分处理后的吸光度值形成吸光度(X)矩阵,用相应样本的SH/T0266方法测定的渣油SARA组成形成浓度(Y)矩阵,然后X阵经偏最小二乘法(PLS)建立光谱主成分与渣油SARA组成的第一校正模型,X阵的残差阵经支持向量机方法(SVM)与Y阵的残差阵建立光谱残差的第二校正模型,建模过程见图6。建立模型所用的样本统计参数见表2。
表2模型参数统计
实例3
建立渣油SARA组成核磁共振谱校正模型并进行验证。
(a)用标准方法测定渣油SARA组成:收集各个主要产区的原油样品300个,用SH/T0266方法测定其渣油SARA组成。从中选取样品200个组成校正集。
(b)用校正集样品建立校正模型:使用Qualion 58MHz NMRS230022核磁共振谱仪测量校正集样品的核磁共振谱。
操作条件为:工作频率为58±1MHz,最佳场强是1.35T,恒温42℃测量,循环扫描次数8次,化学位移范围为:-2~12ppm。
测量方法为:用刻度吸管取2~3mL左右样品,加入到核磁共振测样管,为了保持所有样品在同一温度下进行采谱,将所有样本在30℃恒温水浴预热10min。。
将测得的上述光谱进行一阶微分处理,取化学位移范围为1.0~7.1ppm内变量经一阶微分处理后的吸光度值形成吸光度(X)矩阵,用相应样本的SH/T 0266方法测定的渣油SARA组成形成浓度(Y)矩阵,然后X阵经偏最小二乘法(PLS)建立光谱主成分与渣油SARA组成的第一校正模型,X阵的残差阵经支持向量机方法(SVM)与Y阵的残差阵建立光谱残差的第二校正模型,建模过程见图6。建立模型所用的样本统计参数见表3。
表3模型参数统计
以上结合附图详细描述了本发明实施例的可选实施方式,但是,本发明实施例并不限于上述实施方式中的具体细节,在本发明实施例的技术构思范围内,可以对本发明实施例的技术方案进行多种简单变型,这些简单变型均属于本发明实施例的保护范围。
另外需要说明的是,在上述具体实施方式中所描述的各个具体技术特征,在不矛盾的情况下,可以通过任何合适的方式进行组合。为了避免不必要的重复,本发明实施例对各种可能的组合方式不再另行说明。
本领域技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序存储在一个存储介质中,包括若干指令用以使得单片机、芯片或处理器(processor)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
此外,本发明实施例的各种不同的实施方式之间也可以进行任意组合,只要其不违背本发明实施例的思想,其同样应当视为本发明实施例所公开的内容。
Claims (14)
1.一种原油谱学信息预测渣油馏分SARA组成的方法,包括如下步骤:
(a)获取原油样本的渣油馏分SARA组成数据集和预设恒定温度下的谱学信息,对所述谱学信息中的特征变量进行微分处理,获得经微分处理后的谱学信息数据集;
(b)将谱学信息数据集与渣油SARA组成数据集相关联,利用多元回归分析方法分别建立谱学信息主成分与渣油SARA组成的第一校正模型、谱学信息残差与渣油SARA组成残差的第二校正模型;任选进一步对所述的第一校正模型与所述的第二校正模型进行验证的步骤;
(c)测定待测原油样本在预设恒定温度下的谱学信息,对其中的特征变量进行微分处理,将得到的谱学信息数据代入第一校正模型,谱学信息残差代入第二校正模型,两个模型预测结果相加得到待测原油样本的渣油SARA组成。
2.按照权利要求1所述的方法,其特征在于,在步骤(a)中,所述的原油样本为经过脱盐脱水的原油样本。
3.按照权利要求1所述的方法,其特征在于,所述预设恒定温度为36~40℃。
4.按照权利要求1所述的方法,其特征在于,采用标准方法测定原油样本的渣油SARA组成。
5.按照权利要求1所述的方法,其特征在于,对所述谱学信息中的特征变量进行一阶微分处理或二阶微分处理。
6.按照权利要求1所述的方法,其特征在于,在步骤(b)中,所述多元回归分析方法选自偏最小二乘法、人工神经网络、支持向量机和随机森林方法中的一种或多种。
7.按照权利要求1所述的方法,其特征在于,利用偏最小二乘法(PLS)建立谱学信息主成分与渣油SARA组成的校正模型和谱学信息残差的校正模型,其方法是:利用偏最小二乘法(PLS)得到的主成分建立谱学信息主成分的校正模型,利用偏最小二乘法(PLS)得到的谱学信息残差和预测残差通过非线性校正方法建立谱学信息残差的校正模型。
8.按照权利要求8所述的方法,其特征在于,所述非线性校正方法选自支持向量机方法、随机森林方法或人工神经网络;其中所述的谱学信息残差是利用偏最小二乘法(PLS)提取其中的主成分后的剩余部分;所述预测残差是校正集样本的实测值与第一校正模型预测值的差值。
9.按照权利要求8所述的方法,其特征在于,将数据集划分为校正集和验证集,利用校正集通过PLS算法得到谱学信息的主成分与谱学信息残差,建立谱学信息主成分与渣油SARA组成的第一校正模型;建立谱学信息残差与渣油SARA组成残差的第二校正模型。
10.按照权利要求8所述的方法,其特征在于,对所述谱学信息主成分与渣油SARA组成的第一校正模型和/或谱学信息残差的第二校正模型进行验证,以得到更为准确的谱学信息主成分的第一校正模型和/或谱学信息残差与渣油SARA组成残差的第二校正模型。
11.按照权利要求1所述的方法,其特征在于,在步骤(c)中,采用与步骤(a)相同的微分处理方法对待测原油样本的谱学信息中特征变量进行微分处理。
12.按照权利要求1所述的方法,其特征在于所述的谱学信息包括核磁共振谱、近红外光谱、中红外光谱。
13.按照权利要求1所述的方法,其特征在于,所述近红外谱区是波数为5342~6011cm-1的谱区,所述中红外谱区是波数为1012~1655cm-1的谱区,所述核磁共振谱区是化学位移为1.0~7.1ppm,场强58MHz氢谱的谱区。
14.一种机器可读存储介质,该机器可读存储介质上存储有指令,该指令用于使得机器执行权利要求1~12之一所述的预测渣油SARA组成的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910566946.7A CN112149858A (zh) | 2019-06-27 | 2019-06-27 | 一种利用原油谱学信息预测渣油馏分sara组成的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910566946.7A CN112149858A (zh) | 2019-06-27 | 2019-06-27 | 一种利用原油谱学信息预测渣油馏分sara组成的方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112149858A true CN112149858A (zh) | 2020-12-29 |
Family
ID=73868704
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910566946.7A Pending CN112149858A (zh) | 2019-06-27 | 2019-06-27 | 一种利用原油谱学信息预测渣油馏分sara组成的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112149858A (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2000052433A1 (en) * | 1999-03-05 | 2000-09-08 | Sandia Corporation | Hybrid least squares multivariate spectral analysis methods |
CN1283791A (zh) * | 1999-07-06 | 2001-02-14 | 中国石油化工集团公司 | 一种测定渣油组分含量的方法 |
US20130185044A1 (en) * | 2012-01-13 | 2013-07-18 | Aspen Technology, Inc. | Method of Characterizing Chemical Composition Of Crude Oil For Petroleum Processing |
WO2016102883A1 (fr) * | 2014-12-22 | 2016-06-30 | P Plus I | Procédé de détermination de propriétés de coupes pétrolières et des procédés de raffinage pour l'optimisation de raffineries pétrolières |
CN107860743A (zh) * | 2017-10-20 | 2018-03-30 | 华东理工大学 | 利用反射式近红外光纤探头构建快速预测原油性质的模型的方法及其应用 |
CN109668856A (zh) * | 2017-10-17 | 2019-04-23 | 中国石油化工股份有限公司 | 预测lco加氢原料与产物的烃族组成的方法和装置 |
-
2019
- 2019-06-27 CN CN201910566946.7A patent/CN112149858A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2000052433A1 (en) * | 1999-03-05 | 2000-09-08 | Sandia Corporation | Hybrid least squares multivariate spectral analysis methods |
CN1283791A (zh) * | 1999-07-06 | 2001-02-14 | 中国石油化工集团公司 | 一种测定渣油组分含量的方法 |
US20130185044A1 (en) * | 2012-01-13 | 2013-07-18 | Aspen Technology, Inc. | Method of Characterizing Chemical Composition Of Crude Oil For Petroleum Processing |
WO2016102883A1 (fr) * | 2014-12-22 | 2016-06-30 | P Plus I | Procédé de détermination de propriétés de coupes pétrolières et des procédés de raffinage pour l'optimisation de raffineries pétrolières |
CN109668856A (zh) * | 2017-10-17 | 2019-04-23 | 中国石油化工股份有限公司 | 预测lco加氢原料与产物的烃族组成的方法和装置 |
CN107860743A (zh) * | 2017-10-20 | 2018-03-30 | 华东理工大学 | 利用反射式近红外光纤探头构建快速预测原油性质的模型的方法及其应用 |
Non-Patent Citations (1)
Title |
---|
李浩然: "多重衰减全反射红外光谱同时测定渣油多种性质的方法研究", 《中国硕士学位论文全文数据库工程科技Ⅰ辑》, no. 5, pages 4 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Gaydou et al. | Evaluation of multiblock NIR/MIR PLS predictive models to detect adulteration of diesel/biodiesel blends by vegetal oil | |
CN109324013B (zh) | 利用高斯过程回归模型构建原油性质近红外快速分析方法 | |
CN105158200B (zh) | 一种提高近红外光谱定性分析准确度的建模方法 | |
He et al. | Online updating of NIR model and its industrial application via adaptive wavelength selection and local regression strategy | |
CN109324014B (zh) | 一种自适应的原油性质近红外快速预测方法 | |
Yun-Ying et al. | Progress and applications of multivariate calibration model transfer methods | |
CN107966499B (zh) | 一种由近红外光谱预测原油碳数分布的方法 | |
CN105136682B (zh) | 一种燃油中芳烃含量快速、准确测定的新方法 | |
CN105319179B (zh) | 一种利用中红外光谱预测脱硫胺液中硫化氢含量的方法 | |
CN111563436A (zh) | 一种基于ct-cdd的红外光谱测量仪器标定迁移方法 | |
CN116559110A (zh) | 一种基于相关性和高斯曲线拟合的自适应近红外光谱变换方法 | |
Ju et al. | Rapid Identification of Atmospheric Gaseous Pollutants Using Fourier‐Transform Infrared Spectroscopy Combined with Independent Component Analysis | |
CN114646606A (zh) | 一种光谱水质检测方法 | |
EP3861320B1 (en) | Systems and methods for implicit chemical resolution of vacuum gas oils and fit quality determination | |
CN108120694B (zh) | 用于晒红烟化学成分分析的多元校正方法及系统 | |
Tian et al. | Application of nir spectral standardization based on principal component score evaluation in wheat flour crude protein model sharing | |
Huan et al. | A variable selection method of near infrared spectroscopy based on automatic weighting variable combination population analysis | |
CN112149858A (zh) | 一种利用原油谱学信息预测渣油馏分sara组成的方法 | |
JP3671241B2 (ja) | 非線形多変量赤外解析法 | |
Shan et al. | A nonlinear calibration transfer method based on joint kernel subspace | |
CN112147103A (zh) | 一种预测石油馏分组成的方法 | |
CN113324945A (zh) | 近红外光谱预测工业白油中芳烃含量的方法 | |
CN114166792A (zh) | 一种测定汽油中乙醇含量的方法 | |
Pavoni et al. | FT‐IR Spectroscopy and Chemometrics as a Useful Approach for Determining Chemical‐Physical Properties of Gasoline, by Minimizing Analytical Times and Sample Handling | |
CN111650179A (zh) | 一种薰衣草精油中三种特征组份的拉曼光谱定量分析方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |