CN114708930A - 一种基于层次基团构建的纯组分炼化性质的预测方法 - Google Patents
一种基于层次基团构建的纯组分炼化性质的预测方法 Download PDFInfo
- Publication number
- CN114708930A CN114708930A CN202210411133.2A CN202210411133A CN114708930A CN 114708930 A CN114708930 A CN 114708930A CN 202210411133 A CN202210411133 A CN 202210411133A CN 114708930 A CN114708930 A CN 114708930A
- Authority
- CN
- China
- Prior art keywords
- group
- component
- groups
- model
- hierarchical
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 45
- 238000007670 refining Methods 0.000 title claims abstract description 29
- 238000010276 construction Methods 0.000 title abstract description 11
- 238000009826 distribution Methods 0.000 claims abstract description 19
- CIWBSHSKHKDKBQ-JLAZNSOCSA-N Ascorbic acid Chemical compound OC[C@H](O)[C@H]1OC(=O)C(O)=C1O CIWBSHSKHKDKBQ-JLAZNSOCSA-N 0.000 claims abstract description 7
- TVMXDCGIABBOFY-UHFFFAOYSA-N octane Chemical compound CCCCCCCC TVMXDCGIABBOFY-UHFFFAOYSA-N 0.000 claims abstract description 7
- 230000008569 process Effects 0.000 claims description 20
- 238000012216 screening Methods 0.000 claims description 18
- 230000006870 function Effects 0.000 claims description 16
- 238000012549 training Methods 0.000 claims description 14
- 239000012634 fragment Substances 0.000 claims description 11
- 238000004364 calculation method Methods 0.000 claims description 9
- 238000005070 sampling Methods 0.000 claims description 9
- 238000007781 pre-processing Methods 0.000 claims description 8
- 238000009825 accumulation Methods 0.000 claims description 7
- 238000012795 verification Methods 0.000 claims description 7
- 238000005457 optimization Methods 0.000 claims description 6
- 238000006243 chemical reaction Methods 0.000 claims description 5
- 238000007619 statistical method Methods 0.000 claims description 5
- 238000007621 cluster analysis Methods 0.000 claims description 4
- 239000004215 Carbon black (E152) Substances 0.000 claims description 3
- 150000004945 aromatic hydrocarbons Chemical class 0.000 claims description 3
- 229930195733 hydrocarbon Natural products 0.000 claims description 3
- 150000002430 hydrocarbons Chemical class 0.000 claims description 3
- 238000010606 normalization Methods 0.000 claims description 3
- 239000012188 paraffin wax Substances 0.000 claims description 3
- 239000003209 petroleum derivative Substances 0.000 abstract description 4
- 238000002156 mixing Methods 0.000 abstract description 2
- 150000001875 compounds Chemical class 0.000 abstract 1
- 239000010779 crude oil Substances 0.000 abstract 1
- 239000012043 crude product Substances 0.000 abstract 1
- 238000005504 petroleum refining Methods 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 5
- 230000007246 mechanism Effects 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 238000013076 uncertainty analysis Methods 0.000 description 4
- 238000010801 machine learning Methods 0.000 description 3
- 238000000329 molecular dynamics simulation Methods 0.000 description 2
- 125000001997 phenyl group Chemical group [H]C1=C([H])C([H])=C(*)C([H])=C1[H] 0.000 description 2
- 239000002994 raw material Substances 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 125000003118 aryl group Chemical group 0.000 description 1
- 238000009835 boiling Methods 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 239000003054 catalyst Substances 0.000 description 1
- 238000004523 catalytic cracking Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 238000009776 industrial production Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000004451 qualitative analysis Methods 0.000 description 1
- 238000013441 quality evaluation Methods 0.000 description 1
- 238000004445 quantitative analysis Methods 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 238000002922 simulated annealing Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/30—Prediction of properties of chemical compounds, compositions or mixtures
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/70—Machine learning, data mining or chemometrics
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Theoretical Computer Science (AREA)
- Computing Systems (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Crystallography & Structural Chemistry (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- Medical Informatics (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Databases & Information Systems (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于层次基团构建的纯组分炼化性质的预测方法,该方法针对石油产物中纯组分化合物的辛烷值、十六烷值进行预测,通过组分特征集分层构建,引入层次基团构建,避免特征集出现冗余,在加入第三层次组分描述符进入特征集合时,引入贝叶斯规则,从而可以对特征集合进行后验概率分布估计,选择后验概率更高的特征的集合,而不只关注预测精度。在此基础上,再次引入贝叶斯规则,从而可对最终模型进行后验概率分布估计,避免最终预测模型的过拟合风险。该发明可应用于石化工业中的原油与产品调和单元,有效提高石油炼化精度。
Description
技术领域
本发明涉及炼化工业数据分析领域,特别涉及一种基于层次基团构建的纯组分炼化性质的预测方法。
背景技术
传统的炼化单元模型,碍于分析化学与计算机硬件的限制,多使用集总动力学模型,原料和产品常依据宏观性质如沸点或溶解度划分成集总。如催化裂化单元所广泛采用的十集总、十一集总模型。但基于宏观层次划分的集总天然具有多组分属性,无法详细表征组分信息,导致此类集总模型难以扩展到新的原料与催化剂体系。然而分子层次的集总模型可从纯组分层面计算原料的组成、性质,建立反应网络,进而精准预测炼化加工单元产物的性质。配合以纯组分性质预测模型与混合规则模型,分子动力学模型不但可预测炼化单元产物的分布即定性分析,更可实现定量预测产物相应的炼化性质。这一进展可使决策者定向地设计产物中纯组分的化学结构,优化单元操作条件,进而为炼化理论研究和工业生产指引方向。其中对于纯组分炼化性质预测的精度直接关系对产物质量评估的准确性,进而影响各操作单元的优化方向,是分子动力学模型的关键点,同时关系到分子管理技术能否顺利应用于炼厂优化。
发明内容
本发明要解决的技术问题,在于提供一种基于层次基团构建的纯组分炼化性质的预测方法,针对石油产物中纯组分的如汽油产物各组分的辛烷值、柴油产物中各组分的十六烷值进行预测,通过组分特征集分层构建,在加入组分描述符进行特征集合时,引入贝叶斯规则,从而可以对其进行后验概率分布估计,在此基础上,引入层次基团构建,对基团片段进行分层构建,避免最终预测的过拟合风险。
本发明具体包括如下步骤:
步骤10、采用可编码的简化组分表达方式SMILES,将复杂组分结构用二维编码表示,构建预定义基团片段组分库,包括一级基团、二级基团以及三级基团;所述一级基团为包含组分结构的基本基团;所述二级基团为基本基团的链接位置组合,用于区分芳烃与链烷烃以及相应的同分异构体;所述三级基团为描述组分拓扑结构的描述符;
步骤20、根据目标组分的分子结构从所述预定义基团片段组分库中筛选出一级基团和二级基团,再根据目标组分待预测的炼化性质利用与所述一级基团和二级基团保持最小的相关性,同时与待预测性质保持最大信息量的原则筛选得到多个三级基团,随机选取任意数量的三级基团与出的一级基团和二级基团构成多个组分特征集,然后筛选得到后验概率最大的组分特征集;
步骤30、采用线性累加函数将不同层次的基团结合进行建模然后通过训练集对系数求解,得到层级基团模型;
步骤40、根据所述后验概率最大的组分特征集生成多个候选模型,基于所述层级基团模型,通过再次使用贝叶斯规则,得到全部候选模型的置信区间,结合每一所述候选模型的精度,根据多目标优化的原则筛选出适用于炼化厂实际情况的辛烷值、十六烷值模型。
进一步地,所述步骤20中,筛选得到后验概率最大的组分特征集,具体包括:
单一模型m属于候选模型集合M每个模型服从已知数据集Y的分布,f(y|m,βm),其中参数向量βm∈Bm,Bm为模型m系数可能取值的集合,设模型m的先验概率为f(m),则后验概率为:
其中,f(y|m)为边缘相似性,由f(y|m)=∫f(y|m,βm)f(βm|m)dβm与f(βm|m)计算得到,用马尔科夫蒙特卡洛随机抽样法近似估计其值,抽样范围为(m,βm)所在空间:
进一步地,所述步骤30包括数据预处理过程与建模验证过程;
所述数据预处理过程为:通过概率统计方法将数据集进行正态化转换,然后采用无监督学习方法直接对数据集进行聚类分析,对数据集中特征空间的稀疏空洞进行近似估计,得到训练集;
所述建模验证过程中,层次基团的建模采用线性累加函数,公式如下:
其中,函数f(Y)为待预测性质的函数,Ci为一级基团中第i基团的贡献度,Ni为i基团出现次数,δ为一级基团系数;w为二级基团系数,Dj为二级基团中j基团的贡献度,Mj为其出现次数;λ为三级组分描述符基团系数,f(Y*)为三级描述符对给定性质的总贡献度;
计算层级基团系数δ,w,λ和基团贡献度Ci,Dj时,采用层次方法依次回归,通过训练集回归得到Ci;之后回归得到二级基团贡献度Dj;f(Y*)由组分描述符计算得到,不需回归计算,最后统一回归得到基团系数δ,w,λ,即权重的大小,代表所属层级基团片段对给定性质的影响力。
本发明具有如下优点:
基于机理挑选基团片段,并结合不依赖数据回归系数的组分描述符,减少了所需回归计算系数的数量,在相当程度上降低了对数据集规模的依赖性,同时给出了特征子集模型的后验分布概率,实现“软”约束,适用于数据量有限的纯组分炼化性质的预测研究;在此基础上,再次引入贝叶斯规则,从而可对最终模型进行后验概率分布估计,避免最终预测模型的过拟合风险。
附图说明
下面参照附图结合实施例对本发明作进一步的说明。
图1为本发明方法的流程示意图;
图2为本发明层次基团示意图;
图3为本发明组分特征集构建筛选流程示意图;
图4为本发明层次基团的建模流程示意图;
图5为本发明候选模型不确定性分析流程示意图之一;
图6为本方法候选模型不确定性分析流程示意图之二。
具体实施方式
本发明实施例通过提供一种基于层次基团构建的纯组分炼化性质的预测方法,针对石油产物中纯组分的如汽油产物各组分的辛烷值、柴油产物中各组分的十六烷值进行预测,通过组分特征集分层构建,在加入组分描述符进行特征集合时,引入贝叶斯规则,从而可以对其进行后验概率分布估计,在此基础上,引入层次基团构建,对基团片段进行分层构建,避免最终预测的过拟合风险。
如图1所示,本发明的总体思路如下:
S1:构建预定义基团片段组分库。
针对已有基团片段构建方法的缺陷,提出崭新的一套组分特征集,以表征石油产物中组分的炼化性质。此组分特征集结合机理的特征基团与机器学习筛选出的组分描述符,用以表征组分炼化性质。构建基团与描述符的同时,将其划分层次,越高层次的基团包含对组分更为细致的描述。
一级基团包含组分结构的基本基团如-CH,-CH3,-CO等,简单结构的组分如链烷烃可以通过该层次基团进行拆解表征。然而该层次基团只能代表组分的基本组成,不能表征基团在组分中的链接位置,而链接位置的不同对组分炼化性质具有举足轻重的影响。
因此,二级基团着重建立基团块,即基本基团的组合,以区分芳烃与链烷烃以及相应的同分异构体。如图2所示,一级基本基团中包括代表芳环A6基团与CH2的R基团。而其中的-CH2基团因其链接在苯环上,因此与其所连接的苯环上的碳组成新的基团块aC-CH,在二级基团块表示以表征该组分。
三级基团采用组分描述符,由于组分描述符数量众多,基于量子化学计算的描述符,其准确性在科学界还有一定争议,因此将着重关注描述组分拓扑结构的描述符,如连接性指数(connectivity index)。
S2、根据目标组分构建并筛选组分特征集。
如图3所示,当需要对目标组分的炼化性质进行预测时,采用可编码的,简化组分表达方式SMILES,将复杂组分结构用二维编码表示,将给定组分分子结构自动拆解成符合组分库中的基团片段,从而进行定量化分析。
先根据目标组分的分子结构从基团库里筛选一级基团和二级基团,可以采用模拟退火、遗传算法等全局优化算法进行筛选。接着向筛选出来的特征集合中加入三级基团,然而三级基团的加入难免会与一级,二级基团相重叠,从而造成特征集冗余。因此,结合信息理论与机器学习,引入最小相关度-最大信息量概念,保证加入三级基团与已有的低级别基团保持最小的相关性,同时与待预测性质保持最大信息量,即最大化表征待预测性质。
接着引入贝叶斯规则进行特征选择计算候选模型后验概率。单一模型m属于候选模型集合M每个模型服从已知数据集Y的分布,f(y|m,βm),其中参数向量βm∈Bm,Bm为模型m系数可能取值的集合。设模型m的先验概率为f(m),则后验概率为:
其中,f(y|m)为边缘相似性,可由f(y|m)=∫f(y|m,βm)f(βm|m)dβm与f(βm|m)计算得到。但此积分绝大多数情况下无法得到解析解,因此用马尔科夫蒙特卡洛(MCMC)随机抽样法近似估计其值。抽样范围为(m,βm)所在空间:
特征选择为模型选择的分支问题,即用二项分布表示候选模型,其中p为全体特征数量。由此得到每个特征子集所代表模型的基于已知数据集Y的后验分布概率,从而实现“软”约束。此基于贝叶斯规则特征选择方法的核心为MCMC抽样方法。
基于机理挑选基团片段,并结合不依赖数据回归系数的组分描述符,减少了所需回归计算系数的数量,在相当程度上降低了对数据集规模的依赖性,同时给出了特征子集模型的后验分布概率,实现“软”约束,适用于数据量有限的纯组分炼化性质的预测研究。
S3:进行层次基团建模及系数求解。
层级基团建模与系数求解过程如图4所示,总体可分为数据预处理与建模验证两部分。由于组分炼化性质已有数据集稀疏性强,因此在数据预处理阶段需引入先进的统计学与机器学习方法,力求提升小样本数据建模的精度。
数据库中组分的特征值与实验值的分布难以满足正态分布要求,在建模过程中将会影响模型效果,需通过概率统计方法即Box-Cox对数似然函数法,将其进行正态化转换。由于特征空间的稀疏性,随机选取的训练集难以涵盖测试集的特征空间,导致基于训练集模型过于外推,降低模型预测效果。因此第二步采用无监督学习方法,即只针对数据集的特征集而不通过对建模效果的评估,直接对数据集进行聚类分析,对数据集中特征空间的稀疏空洞进行近似估计,基于此选取的训练集,可在最大程度上涵盖测试集样本的特征空间,提高模型预测效果。
层次基团的建模优先考虑传统的线性累加函数,因其运算量较小,并能给出相应基团的贡献度系数,其在一定程度上提供更为丰富的机理信息。其公式形式如下式所示:
其中,函数f(Y)为待预测性质的函数,Ci为一级基团中第i基团的贡献度,Ni为i基团出现次数,δ为一级基团系数;w为二级基团系数,Dj为二级基团中j基团的贡献度,Mj为其出现次数;λ为三级组分描述符基团系数,f(Y*)为三级描述符对给定性质的总贡献度。
计算层级基团系数δ,w,λ和基团贡献度Ci,Dj时,采用层次方法依次回归。通过训练集回归得到Ci;之后回归得到二级基团贡献度Dj;由于f(Y*)由组分描述符计算得到,不需回归计算,从而大大减少对训练集规模的需求。最后统一回归得到基团系数δ,w,λ。计算得到的基团系数δ,w,λ,即权重的大小,可代表所属层级基团片段对给定性质的影响力。
S4:进行不确定性分析。
如图5和图6所示,预测值的不确定性分析即置信区间的估计,对模型的实际应用至关重要。由于层级基团模型具有显性的数学表达式,同时又包括各候选模型的概率分布,通过再次使用贝叶斯规则,可得全部候选模型的置信区间,结合各自模型的精度,综合考虑模型的精确性与实用性,得到更适用于炼厂实际情况的辛烷值、十六烷值模型。
需要说明的是,本领域的相关技术人员在进行良品率预测计算的过程中,可以根据相关的原理进行适当变形及相应的参数设置。以上所述实施例仅表达了本发明的一种实施方式,其描述已经较为具体和详细,但是不能因此理解为对发明专利范围的限制。
本发明一具体实施例如下:
步骤10、采用可编码的简化组分表达方式SMILES,将复杂组分结构用二维编码表示,构建预定义基团片段组分库,包括一级基团、二级基团以及三级基团;所述一级基团为包含组分结构的基本基团;所述二级基团为基本基团的链接位置组合,用于区分芳烃与链烷烃以及相应的同分异构体;所述三级基团为描述组分拓扑结构的描述符;
步骤20、根据目标组分的分子结构从所述预定义基团片段组分库中筛选出一级基团和二级基团,再根据目标组分待预测的炼化性质利用与所述一级基团和二级基团保持最小的相关性,同时与待预测性质保持最大信息量的原则筛选得到多个三级基团,随机选取任意数量的三级基团与出的一级基团和二级基团构成多个组分特征集,然后筛选得到后验概率最大的组分特征集;
步骤30、采用线性累加函数将不同层次的基团结合进行建模然后通过训练集对系数求解,得到层级基团模型;
步骤40、根据所述后验概率最大的组分特征集生成多个候选模型,基于所述层级基团模型,通过再次使用贝叶斯规则,得到全部候选模型的置信区间,结合每一所述候选模型的精度,根据多目标优化的原则筛选出适用于炼化厂实际情况的辛烷值、十六烷值模型。
所述步骤20中,筛选得到后验概率最大的组分特征集,具体包括:
单一模型m属于候选模型集合M每个模型服从已知数据集Y的分布,f(y|m,βm),其中参数向量βm∈Bm,Bm为模型m系数可能取值的集合,设模型m的先验概率为f(m),则后验概率为:
其中,f(y|m)为边缘相似性,由f(y|m)=∫f(y|m,βm)f(βm|m)dβm与f(βm|m)计算得到,用马尔科夫蒙特卡洛随机抽样法近似估计其值,抽样范围为(m,βm)所在空间:
所述步骤30包括数据预处理过程与建模验证过程;
所述数据预处理过程为:通过概率统计方法将数据集进行正态化转换,然后采用无监督学习方法直接对数据集进行聚类分析,对数据集中特征空间的稀疏空洞进行近似估计,得到训练集;
所述建模验证过程中,层次基团的建模采用线性累加函数,公式如下:
其中,函数f(Y)为待预测性质的函数,Ci为一级基团中第i基团的贡献度,Ni为i基团出现次数,δ为一级基团系数;w为二级基团系数,Dj为二级基团中j基团的贡献度,Mj为其出现次数;λ为三级组分描述符基团系数,f(Y*)为三级描述符对给定性质的总贡献度;
计算层级基团系数δ,w,λ和基团贡献度Ci,Dj时,采用层次方法依次回归,通过训练集回归得到Ci;之后回归得到二级基团贡献度Dj;f(Y*)由组分描述符计算得到,不需回归计算,最后统一回归得到基团系数δ,w,λ,即权重的大小,代表所属层级基团片段对给定性质的影响力。
本发明基于机理挑选基团片段,并结合不依赖数据回归系数的组分描述符,减少了所需回归计算系数的数量,在相当程度上降低了对数据集规模的依赖性,同时给出了特征子集模型的后验分布概率,实现“软”约束,适用于数据量有限的纯组分炼化性质的预测研究;在此基础上,再次引入贝叶斯规则,从而可对最终模型进行后验概率分布估计,避免最终预测模型的过拟合风险。
虽然以上描述了本发明的具体实施方式,但是熟悉本技术领域的技术人员应当理解,我们所描述的具体的实施例只是说明性的,而不是用于对本发明的范围的限定,熟悉本领域的技术人员在依照本发明的精神所作的等效的修饰以及变化,都应当涵盖在本发明的权利要求所保护的范围内。
Claims (3)
1.一种基于层次基团构建的纯组分炼化性质的预测方法,其特征在于,包括:
步骤10、采用可编码的简化组分表达方式SMILES,将复杂组分结构用二维编码表示,构建预定义基团片段组分库,包括一级基团、二级基团以及三级基团;所述一级基团为包含组分结构的基本基团;所述二级基团为基本基团的链接位置组合,用于区分芳烃与链烷烃以及相应的同分异构体;所述三级基团为描述组分拓扑结构的描述符;
步骤20、根据目标组分的分子结构从所述预定义基团片段组分库中筛选出一级基团和二级基团,再根据目标组分待预测的炼化性质利用与所述一级基团和二级基团保持最小的相关性,同时与待预测性质保持最大信息量的原则筛选得到多个三级基团,随机选取任意数量的三级基团与出的一级基团和二级基团构成多个组分特征集,然后筛选得到后验概率最大的组分特征集;
步骤30、采用线性累加函数将不同层次的基团结合进行建模然后通过训练集对系数求解,得到层级基团模型;
步骤40、根据所述后验概率最大的组分特征集生成多个候选模型,基于所述层级基团模型,通过再次使用贝叶斯规则,得到全部候选模型的置信区间,结合每一所述候选模型的精度,根据多目标优化的原则筛选出适用于炼化厂实际情况的辛烷值、十六烷值模型。
3.根据权利要求1所述的方法,其特征在于:所述步骤30包括数据预处理过程与建模验证过程;
所述数据预处理过程为:通过概率统计方法将数据集进行正态化转换,然后采用无监督学习方法直接对数据集进行聚类分析,对数据集中特征空间的稀疏空洞进行近似估计,得到训练集;
所述建模验证过程中,层次基团的建模采用线性累加函数,公式如下:
其中,函数f(Y)为待预测性质的函数,Ci为一级基团中第i基团的贡献度,Ni为i基团出现次数,δ为一级基团系数;w为二级基团系数,Dj为二级基团中j基团的贡献度,Mj为其出现次数;λ为三级组分描述符基团系数,f(Y*)为三级描述符对给定性质的总贡献度;
计算层级基团系数δ,w,λ和基团贡献度Ci,Dj时,采用层次方法依次回归,通过训练集回归得到Ci;之后回归得到二级基团贡献度Dj;f(Y*)由组分描述符计算得到,不需回归计算,最后统一回归得到基团系数δ,w,λ,即权重的大小,代表所属层级基团片段对给定性质的影响力。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210411133.2A CN114708930A (zh) | 2022-04-19 | 2022-04-19 | 一种基于层次基团构建的纯组分炼化性质的预测方法 |
PCT/CN2023/085001 WO2023202345A1 (zh) | 2022-04-19 | 2023-03-30 | 一种基于层次基团构建的纯组分炼化性质的预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210411133.2A CN114708930A (zh) | 2022-04-19 | 2022-04-19 | 一种基于层次基团构建的纯组分炼化性质的预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114708930A true CN114708930A (zh) | 2022-07-05 |
Family
ID=82174562
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210411133.2A Pending CN114708930A (zh) | 2022-04-19 | 2022-04-19 | 一种基于层次基团构建的纯组分炼化性质的预测方法 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN114708930A (zh) |
WO (1) | WO2023202345A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023202345A1 (zh) * | 2022-04-19 | 2023-10-26 | 泉州装备制造研究所 | 一种基于层次基团构建的纯组分炼化性质的预测方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090105167A1 (en) * | 2007-10-19 | 2009-04-23 | Duke University | Predicting responsiveness to cancer therapeutics |
CN106444672A (zh) * | 2016-10-12 | 2017-02-22 | 杭州辛孚能源科技有限公司 | 针对炼油和石化装置的分子水平的实时优化方法 |
CN108279251A (zh) * | 2018-01-26 | 2018-07-13 | 中国石油大学(北京) | 一种石油分子层次分离过程模拟的方法及其装置 |
CN108763855A (zh) * | 2018-05-18 | 2018-11-06 | 南京工业大学 | 一种确定生物柴油燃烧性能的方法 |
CN115831246A (zh) * | 2022-12-05 | 2023-03-21 | 北京科技大学 | 一种药物化学反应合成与转化率预测联合优化方法 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115668237A (zh) * | 2020-05-22 | 2023-01-31 | 巴斯夫涂料有限公司 | 化学混合物的特性预测 |
CN111899793B (zh) * | 2020-06-12 | 2024-04-30 | 中国石油天然气股份有限公司 | 一种分子级装置的实时优化方法、装置、系统及存储介质 |
CN111899795B (zh) * | 2020-06-12 | 2023-12-22 | 中国石油天然气股份有限公司 | 一种分子级炼油加工全流程优化方法、装置、系统及存储介质 |
CN113707240B (zh) * | 2021-07-30 | 2023-11-07 | 浙江大学 | 基于半监督非线性变分贝叶斯混合模型的成分参数鲁棒软测量方法 |
CN114708930A (zh) * | 2022-04-19 | 2022-07-05 | 泉州装备制造研究所 | 一种基于层次基团构建的纯组分炼化性质的预测方法 |
-
2022
- 2022-04-19 CN CN202210411133.2A patent/CN114708930A/zh active Pending
-
2023
- 2023-03-30 WO PCT/CN2023/085001 patent/WO2023202345A1/zh unknown
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090105167A1 (en) * | 2007-10-19 | 2009-04-23 | Duke University | Predicting responsiveness to cancer therapeutics |
CN106444672A (zh) * | 2016-10-12 | 2017-02-22 | 杭州辛孚能源科技有限公司 | 针对炼油和石化装置的分子水平的实时优化方法 |
CN108279251A (zh) * | 2018-01-26 | 2018-07-13 | 中国石油大学(北京) | 一种石油分子层次分离过程模拟的方法及其装置 |
CN108763855A (zh) * | 2018-05-18 | 2018-11-06 | 南京工业大学 | 一种确定生物柴油燃烧性能的方法 |
CN115831246A (zh) * | 2022-12-05 | 2023-03-21 | 北京科技大学 | 一种药物化学反应合成与转化率预测联合优化方法 |
Non-Patent Citations (1)
Title |
---|
万鑫: "高温高压气体爆炸极限预测理论、数值方法及实验", 《中国博士学位论文全文数据库工程科技Ⅰ辑》, no. 03, 15 March 2020 (2020-03-15) * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023202345A1 (zh) * | 2022-04-19 | 2023-10-26 | 泉州装备制造研究所 | 一种基于层次基团构建的纯组分炼化性质的预测方法 |
Also Published As
Publication number | Publication date |
---|---|
WO2023202345A1 (zh) | 2023-10-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Pyl et al. | Molecular reconstruction of complex hydrocarbon mixtures: An application of principal component analysis | |
Yang et al. | A hybrid deep learning and mechanistic kinetics model for the prediction of fluid catalytic cracking performance | |
Jiang et al. | Predicting drug− disease associations via sigmoid kernel-based convolutional neural networks | |
Song et al. | Modeling the hydrocracking process with deep neural networks | |
Gao et al. | Refinery scheduling with varying crude: A deep belief network classification and multimodel approach | |
CN116802741A (zh) | 逆合成系统和方法 | |
Yang et al. | Streaming parallel variational Bayesian supervised factor analysis for adaptive soft sensor modeling with big process data | |
Vukovic et al. | Methodology of aiQSAR: a group-specific approach to QSAR modelling | |
Ma et al. | MIDIA: exploring denoising autoencoders for missing data imputation | |
Tai et al. | Multi-objective optimisation with hybrid machine learning strategy for complex catalytic processes | |
Wang et al. | Layer-wise residual-guided feature learning with deep learning networks for industrial quality prediction | |
WO2023202345A1 (zh) | 一种基于层次基团构建的纯组分炼化性质的预测方法 | |
Mei et al. | Molecular-based bayesian regression model of petroleum fractions | |
Ristoski et al. | Expert-in-the-loop AI for polymer discovery | |
Mohanta et al. | Support vector regression modeling in recursive just-in-time learning framework for adaptive soft sensing of naphtha boiling point in crude distillation unit | |
Fontana et al. | Design of experiments and machine learning with application to industrial experiments | |
Yu et al. | A novel hybrid machine learning model for predicting rate constants of the reactions between alkane and CH3 radical | |
Luo et al. | Hybrid models for mixed variables in bayesian optimization | |
Kim et al. | Comparison of Derivative‐Free Optimization: Energy Optimization of Steam Methane Reforming Process | |
Lee et al. | Survival prediction and variable selection with simultaneous shrinkage and grouping priors | |
Wojtuch et al. | Extended study on atomic featurization in graph neural networks for molecular property prediction | |
Khajah et al. | Modeling and active constrained optimization of C5/C6 isomerization via Artificial Neural Networks | |
Iapteff et al. | Reducing the number of experiments required for modelling the hydrocracking process with kriging through Bayesian transfer learning | |
Shi et al. | Interpretable reconstruction of naphtha components using property-based extreme gradient boosting and compositional-weighted Shapley additive explanation values | |
Hong et al. | ClustPTF: Clustering-based parallel tensor factorization for the diverse multi-criteria recommendation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |