CN114429800A - 基于模型融合的甲烷水合物生成速率预测方法及系统 - Google Patents

基于模型融合的甲烷水合物生成速率预测方法及系统 Download PDF

Info

Publication number
CN114429800A
CN114429800A CN202011100237.9A CN202011100237A CN114429800A CN 114429800 A CN114429800 A CN 114429800A CN 202011100237 A CN202011100237 A CN 202011100237A CN 114429800 A CN114429800 A CN 114429800A
Authority
CN
China
Prior art keywords
methane hydrate
generation rate
hydrate generation
model
rate prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011100237.9A
Other languages
English (en)
Other versions
CN114429800B (zh
Inventor
陈旭东
张乐
贺甲元
王海波
杨丽红
岑学齐
柴国兴
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Petroleum and Chemical Corp
Sinopec Exploration and Production Research Institute
Original Assignee
China Petroleum and Chemical Corp
Sinopec Exploration and Production Research Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Petroleum and Chemical Corp, Sinopec Exploration and Production Research Institute filed Critical China Petroleum and Chemical Corp
Priority to CN202011100237.9A priority Critical patent/CN114429800B/zh
Publication of CN114429800A publication Critical patent/CN114429800A/zh
Application granted granted Critical
Publication of CN114429800B publication Critical patent/CN114429800B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/70Machine learning, data mining or chemometrics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Databases & Information Systems (AREA)
  • Medical Informatics (AREA)
  • Chemical & Material Sciences (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开一种基于模型融合的甲烷水合物生成速率预测方法及系统。本发明在获取包含有多个由甲烷水合物生成速率及其影响因素构成的数据组的样本集的之后,至少采用两种数学建模算法,分别基于样本集建立相应的甲烷水合物生成速率预测子模型,并基于模型融合方法对建立的所有甲烷水合物生成速率预测子模型进行融合,得到甲烷水合物生成速率预测模型,最后基于甲烷水合物生成速率预测模型实现对甲烷水合物生成速率的预测。根据本发明,能够有效地解决现有基于生成动力学和机器学习的甲烷水合物生成速率预测方法的预测准确度较低的问题。

Description

基于模型融合的甲烷水合物生成速率预测方法及系统
技术领域
本发明属于甲烷水合物生成研究技术领域,更具体地,涉及一种基于模型融合的甲烷水合物生成速率预测方法及系统。
背景技术
甲烷水合物,俗称“可燃冰”,是一种甲烷与水的非化学计量型笼形化合物。在甲烷水合物中,通过氢键的作用,水分子(主体分子)形成拥有一定大小空穴的晶格主体,空穴中则包含有较小的气体分子(客体分子,主要成分是CH4),由此形成外观像松散的冰或者雪花的固态化合物,其密度约为0.9g/cm3。甲烷水合物的分子式表示为CH4·nH2O,n为5.67~17。
甲烷水合物被发现已有一百多年的历史,最初是在实验室生成的,后来由于在西伯利亚等极地辅设的输气管道发生堵塞事故,通过调查发现在低温环境和输气压力下,有水和甲烷存在时就会生成固态的甲烷水合物。最初对甲烷水合物的研究就是为了抑制输气管道中水合物的生成而展开的。近年来,甲烷水合物作为自然界赋存的一种新的能源形态,受到了各国越来越多的关注。
目前,甲烷水合物生成速率是甲烷水合物研究领域的热门研究方向。对甲烷水合物生成速率的研究具有广泛的应用,例如天然气的储存和运输、海水淡化、二氧化碳的长期储存以及氢气与其他轻气体的分离问题等。
现有对甲烷水合物生成速率的研究以甲烷水合物生成速率预测为主,而现有甲烷水合物生成速率的预测方式以动力热力学与机器学习相结合的方式为主,该方式具体为:基于动力学、热力学或者两者相结合,确定甲烷水合物生成速率的内在因素,基于甲烷水合物生成速率的内在因素和机器学习算法建立甲烷水合物生成速率预测模型,进而通过甲烷水合物生成速率预测模型对甲烷水合物的生成速率进行预测。
然而,上述基于生成动力学和机器学习的甲烷水合物生成速率预测方法至少存在以下两方面问题:
一、在基于生成动力学确定影响甲烷水合物生成速率的内在因素时,涉及的因素变量较多,且因素变量之间的相关性过于复杂,难以掌握甲烷水合物生成的内在规律,难以真实且准确地确定甲烷水合物生成速率的内在影响因素,进而影响后续甲烷水合物生成速率预测的准确度。
二、基于单一机器学习算法建立甲烷水合物生成速率预测模型,导致甲烷水合物生成速率预测结果的准确度较低。
发明内容
本发明的目的在于解决现有基于生成动力学和机器学习的甲烷水合物生成速率预测方法的预测准确度较低的问题。
为了实现上述目的,本发明提供一种基于模型融合的甲烷水合物生成速率预测方法及系统。
根据本发明的第一方面,提供了一种基于模型融合的甲烷水合物生成速率预测方法,该基于模型融合的甲烷水合物生成速率预测方法包括以下步骤:
获取样本集,所述样本集包含有多个由甲烷水合物生成速率及其影响因素构成的数据组;
基于所述样本集,分别采用预定的每种数学建模算法建立相应的甲烷水合物生成速率预测子模型;
基于模型融合方法对建立的所有甲烷水合物生成速率预测子模型进行融合,得到甲烷水合物生成速率预测模型;
基于所述甲烷水合物生成速率预测模型对甲烷水合物生成速率进行预测。
作为优选的是,所述影响因素为环境条件,所述环境条件包括温度和压力。
作为优选的是,所述基于所述样本集,分别采用预定的每种数学建模算法建立相应的甲烷水合物生成速率预测子模型,包括:
将所述样本集划分为训练集和测试集;
基于所述训练集和目标数学建模算法建立待修正的甲烷水合物生成速率预测子模型;
基于所述测试集对所述待修正的甲烷水合物生成速率预测子模型进行修正,得到甲烷水合物生成速率预测子模型。
作为优选的是,所述将所述样本集划分为训练集和测试集,具体为:
在所述样本集中随机选取预定比例的所述数据组作为所述训练集,将所述样本集中余下的所述数据组作为所述测试集。
作为优选的是,所述基于所述训练集和目标数学建模算法建立待修正的甲烷水合物生成速率预测子模型,具体为:
将所述训练集中的每个所述数据组中的所述影响因素作为所述目标数学建模算法模型的输入变量,将该影响因素对应的甲烷水合物生成速率作为所述目标数学建模算法模型的输出变量,基于所述输入变量和所述输出变量对所述目标数学建模算法模型进行训练,得到所述待修正的甲烷水合物生成速率预测子模型。
作为优选的是,所述基于所述测试集对所述待修正的甲烷水合物生成速率预测子模型进行修正,得到甲烷水合物生成速率预测子模型,具体为:
将所述测试集中的每个所述数据组中的所述影响因素作为所述待修正的甲烷水合物生成速率预测子模型的输入变量,将该影响因素对应的甲烷水合物生成速率作为所述待修正的甲烷水合物生成速率预测子模型的输出变量参考值,基于所述输出变量参考值和所述输入变量对应的所述待修正的甲烷水合物生成速率预测子模型的输出变量真实值确定所述待修正的甲烷水合物生成速率预测子模型的输出变量的误差,基于所述输出变量的误差对所述待修正的甲烷水合物生成速率预测子模型进行修正,得到所述甲烷水合物生成速率预测子模型。
作为优选的是,预定的数学建模算法包括BP神经网络算法;
基于所述样本集,采用所述BP神经网络算法建立相应的甲烷水合物生成速率预测子模型的具体过程为:
将所述样本集中的每个所述数据组中的所述影响因素作为BP神经网络算法模型的输入数据,将该影响因素对应的甲烷水合物生成速率作为BP神经网络算法模型的输出变量;
初始化BP神经网络算法模型:
设定参数:输入数据为x,从输入层进入隐藏层的参数为w和b1,从隐藏层进入输出层的参数为v和b2,输入激活函数为g1,输出激活函数为g2
即,从输入层进入隐藏层模型为:
net1=wTx+b1,h=g1(net1)
上式中,h为net1有关的激活函数;
从隐藏层进入输出层模型为:
Figure BDA0002725064100000041
损失函数为:
Figure BDA0002725064100000042
上式中,y为实际结果,
Figure BDA0002725064100000043
为根据BP神经网络计算的预测结果;
初始化相关参数:将初始化的权值及偏执项分别记为w(0);b1 (0);v(0);b2 (0)
训练BP神经网络算法模型:
激活层推进计算:将激活层不断推进计算,得到每一个隐藏层的输出结果以及对应层的损失函数期望值;
其中,仅包括n个维度的一组解时,损失函数期望值为:
Figure BDA0002725064100000051
上式中,k为参数迭代的次数,η为伸缩因子;
计算输出单元误差项;
更新输出层参数:
Figure BDA0002725064100000052
更新隐藏层参数:
Figure BDA0002725064100000053
循环激活层推进计算至更新隐藏层参数的步骤,直至输出层参数和隐藏层参数的更新次数达到预定的更新次数。
作为优选的是,预定的数学建模算法包括极端梯度提升算法;
相应的极端梯度提升算法模型为:
Figure BDA0002725064100000054
Figure BDA0002725064100000055
其中,i是样本的序列,
Figure BDA0002725064100000056
是该样本的预测误差,k是树的数量,
Figure BDA0002725064100000057
代表树木的复杂性,T代表叶子数,
Figure BDA0002725064100000058
是叶子分数的L2范数。
作为优选的是,所述模型融合方法为Stacking算法。
根据本发明的第二方面,提供了一种基于模型融合的甲烷水合物生成速率预测系统,该基于模型融合的甲烷水合物生成速率预测系统包括:
样本集获取模块,用于获取样本集,所述样本集包含有多个由甲烷水合物生成速率及其影响因素构成的数据组;
甲烷水合物生成速率预测子模型建立模块,用于基于所述样本集,分别采用预定的每种数学建模算法建立相应的甲烷水合物生成速率预测子模型;
甲烷水合物生成速率预测模型获取模块,用于基于模型融合方法对建立的所有甲烷水合物生成速率预测子模型进行融合,得到甲烷水合物生成速率预测模型;
甲烷水合物生成速率预测模块,用于基于所述甲烷水合物生成速率预测模型对甲烷水合物生成速率进行预测。
本发明的有益效果在于:
本发明的基于模型融合的甲烷水合物生成速率预测方法,在获取包含有多个由甲烷水合物生成速率及其影响因素构成的数据组的样本集的之后,至少采用两种数学建模算法,分别基于样本集建立相应的甲烷水合物生成速率预测子模型,并基于模型融合方法对建立的所有甲烷水合物生成速率预测子模型进行融合,得到甲烷水合物生成速率预测模型,最后基于甲烷水合物生成速率预测模型实现对甲烷水合物生成速率的预测。
与现有基于生成动力学和机器学习的甲烷水合物生成速率预测方法采用单一模型对甲烷水合物生成速率进行预测的方式的不同,本发明的基于模型融合的甲烷水合物生成速率预测方法基于融合模型实现对甲烷水合物生成速率的预测。由于融合模型的精度高于单一模型的精度,与现有基于生成动力学和机器学习的甲烷水合物生成速率预测方法相比,本发明的基于模型融合的甲烷水合物生成速率预测方法的预测准确度相对较高。
本发明还提供了一种基于模型融合的甲烷水合物生成速率预测系统,与本发明的基于模型融合的甲烷水合物生成速率预测方法具有相同的有益效果。
本发明的其它特征和优点将在随后具体实施方式部分予以详细说明。
附图说明
通过结合附图对本发明示例性实施方式进行更详细的描述,本发明的上述以及其它目的、特征和优势将变得更加明显,其中,在本发明示例性实施方式中,相同的参考标号通常代表相同部件。
图1示出了根据本发明的实施例1和实施例2的基于模型融合的甲烷水合物生成速率预测方法的实现流程图。
图2示出了根据本发明的实施例2的甲烷水合物生成速率与压力和温度的相关性分析图。
图3示出了根据本发明的实施例2的基于BP神经网络算法的甲烷水合物生成速率预测子模型的预测结果与真实结果对比图。
图4示出了根据本发明的实施例2的基于极端梯度提升算法的甲烷水合物生成速率预测子模型的预测结果与真实结果对比图。
图5示出了根据本发明的实施例2的基于模型融合的甲烷水合物生成速率预测模型的预测结果与真实结果对比图。
图6示出了根据本发明的实施例3的基于模型融合的甲烷水合物生成速率预测系统的结构框图。
具体实施方式
下面将更详细地描述本发明的优选实施方式。虽然以下描述了本发明的优选实施方式,然而应该理解,可以以各种形式实现本发明而不应被这里阐述的实施方式所限制。相反,提供这些实施方式是为了使本发明更加透彻和完整,并且能够将本发明的范围完整地传达给本领域的技术人员。
实施例1:图1示出了本实施例的基于模型融合的甲烷水合物生成速率预测方法的实现流程图。参照图1,本实施例的基于模型融合的甲烷水合物生成速率预测方法包括以下步骤:
步骤S100、获取样本集,所述样本集包含有多个由甲烷水合物生成速率及其影响因素构成的数据组;
步骤S200、基于所述样本集,分别采用预定的每种数学建模算法建立相应的甲烷水合物生成速率预测子模型;
步骤S300、基于模型融合方法对建立的所有甲烷水合物生成速率预测子模型进行融合,得到甲烷水合物生成速率预测模型;
步骤S400、基于所述甲烷水合物生成速率预测模型对甲烷水合物生成速率进行预测。
本实施例的步骤S100中,甲烷水合物生成速率的影响因素为环境条件,所述环境条件包括温度和压力。
本实施例的步骤S200包括:
将所述样本集划分为训练集和测试集;
基于所述训练集和目标数学建模算法建立待修正的甲烷水合物生成速率预测子模型;
基于所述测试集对所述待修正的甲烷水合物生成速率预测子模型进行修正,得到甲烷水合物生成速率预测子模型。
上述步骤中,将所述样本集划分为训练集和测试集的具体方式为:
在所述样本集中随机选取预定比例的所述数据组作为所述训练集,将所述样本集中余下的所述数据组作为所述测试集。
上述步骤中,基于所述训练集和目标数学建模算法建立待修正的甲烷水合物生成速率预测子模型的具体方式为:
将所述训练集中的每个所述数据组中的所述影响因素作为所述目标数学建模算法模型的输入变量,将该影响因素对应的甲烷水合物生成速率作为所述目标数学建模算法模型的输出变量,基于所述输入变量和所述输出变量对所述目标数学建模算法模型进行训练,得到所述待修正的甲烷水合物生成速率预测子模型。
上述步骤中,基于所述测试集对所述待修正的甲烷水合物生成速率预测子模型进行修正,得到甲烷水合物生成速率预测子模型的具体方式为:
将所述测试集中的每个所述数据组中的所述影响因素作为所述待修正的甲烷水合物生成速率预测子模型的输入变量,将该影响因素对应的甲烷水合物生成速率作为所述待修正的甲烷水合物生成速率预测子模型的输出变量参考值,基于所述输出变量参考值和所述输入变量对应的所述待修正的甲烷水合物生成速率预测子模型的输出变量真实值确定所述待修正的甲烷水合物生成速率预测子模型的输出变量的误差,基于所述输出变量的误差对所述待修正的甲烷水合物生成速率预测子模型进行修正,得到所述甲烷水合物生成速率预测子模型。
本实施例的步骤S300所采用的模型融合方法为Stacking算法。
本实施例的步骤S400基于所述甲烷水合物生成速率预测模型和获取的温度和压力数据,得到甲烷水合物生成速率预测结果。
本实施例的基于模型融合的甲烷水合物生成速率预测方法,基于甲烷水合物生成速率的外在影响因素建立最终的预测模型,由于甲烷水合物生成速率的外在影响因素只包括温度和环境两个因素,且两者之间的相关性易于确定。因此,与现有基于生成动力学和机器学习的甲烷水合物生成速率预测方法基于甲烷水合物生成速率的内在因素建立预测模型的方式相比,本实施例用于训练和修正预测模型的输入变量更加可靠,相应地,预测模型的预测效果也更优。
基于本实施例的基于模型融合的甲烷水合物生成速率预测方法,能够实现不同温度和压力条件下的甲烷水合物生成速率的精准预测,并可分析甲烷水合物生成速率与温度、压力之间的关系,为天然气水合物的开采、二次生成和防治、天然气的储存和运输以及海水淡化等领域提供必要的理论支撑。
实施例2:图1示出了本实施例的基于模型融合的甲烷水合物生成速率预测方法的实现流程图。参照图1,本实施例的基于模型融合的甲烷水合物生成速率预测方法包括以下步骤:
步骤S100、获取样本集,所述样本集包含有多个由甲烷水合物生成速率及其影响因素构成的数据组;
步骤S200、基于所述样本集,分别采用预定的每种数学建模算法建立相应的甲烷水合物生成速率预测子模型;
步骤S300、基于模型融合方法对建立的所有甲烷水合物生成速率预测子模型进行融合,得到甲烷水合物生成速率预测模型;
步骤S400、基于所述甲烷水合物生成速率预测模型对甲烷水合物生成速率进行预测。
本实施例的步骤S100中,甲烷水合物生成速率的影响因素为环境条件,所述环境条件包括温度和压力。
本实施例的步骤S100中,获取的样本集包含247个数据组,每个数据组均包含甲烷水合物生成速率及该甲烷水合物生成速率对应的温度和压力,每个数据组包含的甲烷水合物生成速率均不相同。对样本集所包含的247个数据组进行统计,得到甲烷水合物生成速率、温度和压力数据的统计结果,如表1所示:
Figure BDA0002725064100000101
表1甲烷水合物生成速率、温度和压力数据的统计结果
根据表1可知,温度样本数据的范围为276.10K~282.60K,平均值结果和标准差结果表明温度样本数据的变化幅度不大。压力样本数据的范围为4.55Mpa~10.7Mpa,平均值结果和标准差结果表明压力样本数据基本均匀分布在这个范围。生成速率样本数据的范围为0.1mm2/s~3.89mm2/s,平均值结果表明变化幅度较大。
通过对甲烷水合物生成速率与压力和温度进行相关性分析,得到甲烷水合物生成速率与压力和温度的相关性分析图,如图2所示。根据图2可知,甲烷水合物生成速率与压力呈负相关,与温度呈正相关。甲烷水合物生成速率与温度的相关值为0.19,两者的相关程度较低。甲烷水合物生成速率与压力的相关性值为-0.62,两者的相关程度较高。然而,压力与温度的相关性值为0.5,两者的相关程度较高。因此,在预测甲烷水合物生成速率时,不仅应当考虑与甲烷水合物生成速率相关度较高的压力,同时也应当考虑与压力相关度较高的温度。
本实施例的步骤S200中,分别采用BP神经网络算法和极端梯度提升算法建立甲烷水合物生成速率预测子模型:
BP神经网络,即误差反向传播误差学习算法的学习过程,由两个过程组成:信息的正向传播和误差的反向传播。该方法的基本思想是梯度下降法,它使用梯度搜索技术将网络的实际输出值和预期输出值的均方误差最小化。
神经网络主要包括一个三层网络:一个是输入层,每个神经元负责接收来自外界的输入信息并将其传递给中间层的每个神经元。第二层是隐藏层,它也是内部信息处理层,负责信息转换。最后一个隐藏层将信息传输到输出层中的神经元。经过进一步处理后,它完成了学习前向传播过程。第三层是输出层,负责将信息处理结果输出到外界。当实际输出与预期输出不匹配时,它将进入错误的反向传播阶段。误差通过输出层,以误差梯度下降的方式校正每一层的权重,然后逐层返回隐藏层和输入层。重复信息正向传播和错误反向传播的过程是不断调整每一层权重的过程以及神经网络学习和训练的过程。进行此过程,直到网络输出的误差减小到可接受的水平,或预设为指定的研究次数为止。
BP神经网络在网络理论和性能方面都相对成熟。它的突出优点是具有强大的非线性映射能力和灵活的网络结构。网络的中间层数和每层神经元的数目可以根据具体情况任意设置,其性能随结构的不同而变化。
基于所述样本集,采用BP神经网络算法建立相应的甲烷水合物生成速率预测子模型的具体过程为:
将压力和温度作为BP神经网络算法模型的输入变量,将甲烷水合物生成速率作为BP神经网络算法模型的输出变量:
初始化BP神经网络算法模型:
设定参数:输入数据为x,从输入层进入隐藏层的参数为w和b1,从隐藏层进入输出层的参数为v和b2,输入激活函数为g1,输出激活函数为g2
即,从输入层进入隐藏层模型为:
net1=wTx+b1,h=g1(net1)
上式中,h为net1有关的激活函数;
从隐藏层进入输出层模型为:
Figure BDA0002725064100000121
损失函数为:
Figure BDA0002725064100000122
上式中,y为实际结果,
Figure BDA0002725064100000123
为根据BP神经网络计算的预测结果;
初始化相关参数:将初始化的权值及偏执项分别记为w(0);b1 (0);v(0);b2 (0)
训练BP神经网络算法模型:
激活层推进计算:将激活层不断推进计算,得到每一个隐藏层的输出结果以及对应层的损失函数期望值;
其中,仅包括n个维度的一组解时,损失函数期望值为:
Figure BDA0002725064100000124
上式中,k为参数迭代的次数,η为伸缩因子;
计算输出单元误差项;
更新输出层参数:
Figure BDA0002725064100000131
更新隐藏层参数:
Figure BDA0002725064100000132
循环激活层推进计算至更新隐藏层参数的步骤,直至输出层参数和隐藏层参数的更新次数达到预定的更新次数。
极端梯度提升算法,又称XGBoost。XGBoost是基于树梯度增强框架的开源软件包,预测值与实际值相比有误差并不少见。为了优化和构建更复杂的模型,梯度提升的主要原理是将拟合过程的目标循环调整为当前样本的残留误差。XGBoost是梯度提升决策树(GBDT)的升级算法,它也是梯度提升的一种实现。与GBDT相比,XGBoost同时使用一阶和二阶导数并执行损失函数的泰勒展开式,而GBDT仅应用一阶导数。XGBoost的模板表函数是:
Figure BDA0002725064100000133
Figure BDA0002725064100000134
其中,i是样本的序列,
Figure BDA0002725064100000135
是该样本的预测误差,k是树的数量,
Figure BDA0002725064100000136
代表树木的复杂性,T代表叶子数,
Figure BDA0002725064100000137
是叶子分数的L2范数。
XGboost可以灵活处理稀疏数据和缺失值,并且允许用户定义自定义优化目标和指标。此外,XGBoost所采用的L2范数可以帮助控制模型的复杂性,并降低过拟合的风险。在大多数情况下,XGboost通常可以产生出色的结果。
本实施例随机将样本集合中80%当作训练集,20%当作测试集,采用Python语言sklearn库实现BP神经网络模型,XGBoost库实现XGBoost模型。
本实施例的步骤S300所采用的模型融合方法为Stacking算法。模型融合是提高机器学习效果的有效途径。它是一种机器学习方法,通过根据特定方法训练多个子模型来集成一个模型。基本的理论假设是,不同的子模型对不同的数据具有不同的功能。通过优化和组合它们擅长的部分,它们可以获得在各个方面都“准确”的首选模型。一般而言,模型融合可以集成多个“弱”模型以获得“强”模型,从而提高了对有限数据的最终预测能力,并获得了更好的预测结果。本实施例借鉴了Stacking的思想,并合并了BP神经网络模型和XGBoost模型。其中,BP神经网络模型可以在存在大量特征的情况下创建简单而有效的强大模型。XGBoost是一种有效的梯度提升决策树,支持高效的并行训练。它具有更快的训练速度,更低的内存消耗,更好的准确性,可以快速处理海量数据。
在本实施例中,分别对基于BP神经网络算法的甲烷水合物生成速率预测子模型、基于极端梯度提升算法的甲烷水合物生成速率预测子模型和基于模型融合的甲烷水合物生成速率预测模型的预测效果进行评价,主要是看预测结果与实际结果的差别,具体评价指标包括误差平方和、平均绝对值误差。其中,误差平方和公式为:
R2=SSR/SST=1-SSE/SST
上式中,R2为误差平方和,SST为总平方和,SSR为回归平方和,SSE为残差平方和,SST=SSR+SSE。
基于BP神经网络算法的甲烷水合物生成速率预测子模型的预测结果与真实结果对比图、基于极端梯度提升算法的甲烷水合物生成速率预测子模型的预测结果与真实结果对比图和基于模型融合的甲烷水合物生成速率预测模型的预测结果与真实结果对比图分别如图3、图4和图5所示。根据图3~图5可知,基于模型融合的甲烷水合物生成速率预测模型的预测效果明显优于基于BP神经网络算法的甲烷水合物生成速率预测子模型和基于极端梯度提升算法的甲烷水合物生成速率预测子模型。
以上三种模型的预测效果评价表如表2所示:
Figure BDA0002725064100000151
表2三种模型的预测效果评价
根据表2可知,基于模型融合的甲烷水合物生成速率预测模型的误差平方和接近于1,平均绝对值误差最低。由此可知,基于模型融合的甲烷水合物生成速率预测模型的预测效果最优。
本实施例的基于模型融合的甲烷水合物生成速率预测方法,充分考虑到水合物生成的复杂性以及基于生成动力学确定甲烷水合物生成速率内在影响因素的弊端,基于甲烷水合物生成速率外在影响因素,即温度和压力,并结合BP神经网络算法和XGBoost算法获得融合模型,实现了对甲烷水合物生成速率的精准预测。
实施例3:图6示出了本实施例的基于模型融合的甲烷水合物生成速率预测系统的结构框图。参照图6,本实施例的基于模型融合的甲烷水合物生成速率预测系统包括:
样本集获取模块,用于获取样本集,所述样本集包含有多个由甲烷水合物生成速率及其影响因素构成的数据组;
甲烷水合物生成速率预测子模型建立模块,用于基于所述样本集,分别采用预定的每种数学建模算法建立相应的甲烷水合物生成速率预测子模型;
甲烷水合物生成速率预测模型获取模块,用于基于模型融合方法对建立的所有甲烷水合物生成速率预测子模型进行融合,得到甲烷水合物生成速率预测模型;
甲烷水合物生成速率预测模块,用于基于所述甲烷水合物生成速率预测模型对甲烷水合物生成速率进行预测。
以上已经描述了本发明的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。

Claims (10)

1.基于模型融合的甲烷水合物生成速率预测方法,其特征在于,包括:
获取样本集,所述样本集包含有多个由甲烷水合物生成速率及其影响因素构成的数据组;
基于所述样本集,分别采用预定的每种数学建模算法建立相应的甲烷水合物生成速率预测子模型;
基于模型融合方法对建立的所有甲烷水合物生成速率预测子模型进行融合,得到甲烷水合物生成速率预测模型;
基于所述甲烷水合物生成速率预测模型对甲烷水合物生成速率进行预测。
2.根据权利要求1所述的甲烷水合物生成速率预测方法,其特征在于,所述影响因素为环境条件,所述环境条件包括温度和压力。
3.根据权利要求1所述的甲烷水合物生成速率预测方法,其特征在于,所述基于所述样本集,分别采用预定的每种数学建模算法建立相应的甲烷水合物生成速率预测子模型,包括:
将所述样本集划分为训练集和测试集;
基于所述训练集和目标数学建模算法建立待修正的甲烷水合物生成速率预测子模型;
基于所述测试集对所述待修正的甲烷水合物生成速率预测子模型进行修正,得到甲烷水合物生成速率预测子模型。
4.根据权利要求3所述的甲烷水合物生成速率预测方法,其特征在于,所述将所述样本集划分为训练集和测试集,具体为:
在所述样本集中随机选取预定比例的所述数据组作为所述训练集,将所述样本集中余下的所述数据组作为所述测试集。
5.根据权利要求3所述的甲烷水合物生成速率预测方法,其特征在于,所述基于所述训练集和目标数学建模算法建立待修正的甲烷水合物生成速率预测子模型,具体为:
将所述训练集中的每个所述数据组中的所述影响因素作为所述目标数学建模算法模型的输入变量,将该影响因素对应的甲烷水合物生成速率作为所述目标数学建模算法模型的输出变量,基于所述输入变量和所述输出变量对所述目标数学建模算法模型进行训练,得到所述待修正的甲烷水合物生成速率预测子模型。
6.根据权利要求3所述的甲烷水合物生成速率预测方法,其特征在于,所述基于所述测试集对所述待修正的甲烷水合物生成速率预测子模型进行修正,得到甲烷水合物生成速率预测子模型,具体为:
将所述测试集中的每个所述数据组中的所述影响因素作为所述待修正的甲烷水合物生成速率预测子模型的输入变量,将该影响因素对应的甲烷水合物生成速率作为所述待修正的甲烷水合物生成速率预测子模型的输出变量参考值,基于所述输出变量参考值和所述输入变量对应的所述待修正的甲烷水合物生成速率预测子模型的输出变量真实值确定所述待修正的甲烷水合物生成速率预测子模型的输出变量的误差,基于所述输出变量的误差对所述待修正的甲烷水合物生成速率预测子模型进行修正,得到所述甲烷水合物生成速率预测子模型。
7.根据权利要求1所述的甲烷水合物生成速率预测方法,其特征在于,预定的数学建模算法包括BP神经网络算法;
基于所述样本集,采用所述BP神经网络算法建立相应的甲烷水合物生成速率预测子模型的具体过程为:
将所述样本集中的每个所述数据组中的所述影响因素作为BP神经网络算法模型的输入数据,将该影响因素对应的甲烷水合物生成速率作为BP神经网络算法模型的输出变量;
初始化BP神经网络算法模型:
设定参数:输入数据为x,从输入层进入隐藏层的参数为w和b1,从隐藏层进入输出层的参数为v和b2,输入激活函数为g1,输出激活函数为g2
即,从输入层进入隐藏层模型为:
net1=wTx+b1,h=g1(net1)
上式中,h为net1有关的激活函数;
从隐藏层进入输出层模型为:
net2=vTh+b2,
Figure FDA0002725064090000031
损失函数为:
Figure FDA0002725064090000032
上式中,y为实际结果,
Figure FDA0002725064090000036
为根据BP神经网络计算的预测结果;
初始化相关参数:将初始化的权值及偏执项分别记为w(0);b1 (0);v(0);b2 (0)
训练BP神经网络算法模型:
激活层推进计算:将激活层不断推进计算,得到每一个隐藏层的输出结果以及对应层的损失函数期望值;
其中,仅包括n个维度的一组解时,损失函数期望值为:
Figure FDA0002725064090000033
上式中,k为参数迭代的次数,η为伸缩因子;
计算输出单元误差项;
更新输出层参数:
Figure FDA0002725064090000034
更新隐藏层参数:
Figure FDA0002725064090000035
循环激活层推进计算至更新隐藏层参数的步骤,直至输出层参数和隐藏层参数的更新次数达到预定的更新次数。
8.根据权利要求1所述的甲烷水合物生成速率预测方法,其特征在于,预定的数学建模算法包括极端梯度提升算法;
相应的极端梯度提升算法模型为:
Figure FDA0002725064090000041
Figure FDA0002725064090000042
其中,i是样本的序列,
Figure FDA0002725064090000043
是该样本的预测误差,k是树的数量,
Figure FDA0002725064090000044
代表树木的复杂性,T代表叶子数,
Figure FDA0002725064090000045
是叶子分数的L2范数。
9.根据权利要求1所述的甲烷水合物生成速率预测方法,其特征在于,所述模型融合方法为Stacking算法。
10.基于模型融合的甲烷水合物生成速率预测系统,其特征在于,包括:
样本集获取模块,用于获取样本集,所述样本集包含有多个由甲烷水合物生成速率及其影响因素构成的数据组;
甲烷水合物生成速率预测子模型建立模块,用于基于所述样本集,分别采用预定的每种数学建模算法建立相应的甲烷水合物生成速率预测子模型;
甲烷水合物生成速率预测模型获取模块,用于基于模型融合方法对建立的所有甲烷水合物生成速率预测子模型进行融合,得到甲烷水合物生成速率预测模型;
甲烷水合物生成速率预测模块,用于基于所述甲烷水合物生成速率预测模型对甲烷水合物生成速率进行预测。
CN202011100237.9A 2020-10-15 2020-10-15 基于模型融合的甲烷水合物生成速率预测方法及系统 Active CN114429800B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011100237.9A CN114429800B (zh) 2020-10-15 2020-10-15 基于模型融合的甲烷水合物生成速率预测方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011100237.9A CN114429800B (zh) 2020-10-15 2020-10-15 基于模型融合的甲烷水合物生成速率预测方法及系统

Publications (2)

Publication Number Publication Date
CN114429800A true CN114429800A (zh) 2022-05-03
CN114429800B CN114429800B (zh) 2024-06-21

Family

ID=81310143

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011100237.9A Active CN114429800B (zh) 2020-10-15 2020-10-15 基于模型融合的甲烷水合物生成速率预测方法及系统

Country Status (1)

Country Link
CN (1) CN114429800B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115310357A (zh) * 2022-08-09 2022-11-08 大庆正方软件科技股份有限公司 一种基于数据驱动决策的压裂分析方法

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001095230A2 (en) * 2000-06-08 2001-12-13 Virco Bvba Method for predicting therapeutic agent resistance using neural networks
WO2014018673A2 (en) * 2012-07-24 2014-01-30 The Trustees Of Columbia University In The City Of New York Fusion proteins and methods thereof
KR20140127706A (ko) * 2013-04-25 2014-11-04 김재운 사차원 공기수력발전기 제조방법.
US20150081222A1 (en) * 2013-09-19 2015-03-19 Sas Institute Inc. Control variable determination to maximize a drilling rate of penetration
CN109214592A (zh) * 2018-10-17 2019-01-15 北京工商大学 一种多模型融合的深度学习的空气质量预测方法
CN110472778A (zh) * 2019-07-29 2019-11-19 上海电力大学 一种基于Blending集成学习的短期负荷预测方法
US10510002B1 (en) * 2019-02-14 2019-12-17 Capital One Services, Llc Stochastic gradient boosting for deep neural networks
CN111625953A (zh) * 2020-05-21 2020-09-04 中国石油大学(华东) 气体高压等温吸附曲线预测方法、系统、存储介质、终端
EP3712848A1 (en) * 2019-03-21 2020-09-23 United Technologies Corporation System for forecasting aircraft engine deterioration using recurrent neural networks

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001095230A2 (en) * 2000-06-08 2001-12-13 Virco Bvba Method for predicting therapeutic agent resistance using neural networks
WO2014018673A2 (en) * 2012-07-24 2014-01-30 The Trustees Of Columbia University In The City Of New York Fusion proteins and methods thereof
KR20140127706A (ko) * 2013-04-25 2014-11-04 김재운 사차원 공기수력발전기 제조방법.
US20150081222A1 (en) * 2013-09-19 2015-03-19 Sas Institute Inc. Control variable determination to maximize a drilling rate of penetration
CN109214592A (zh) * 2018-10-17 2019-01-15 北京工商大学 一种多模型融合的深度学习的空气质量预测方法
US10510002B1 (en) * 2019-02-14 2019-12-17 Capital One Services, Llc Stochastic gradient boosting for deep neural networks
EP3712848A1 (en) * 2019-03-21 2020-09-23 United Technologies Corporation System for forecasting aircraft engine deterioration using recurrent neural networks
CN110472778A (zh) * 2019-07-29 2019-11-19 上海电力大学 一种基于Blending集成学习的短期负荷预测方法
CN111625953A (zh) * 2020-05-21 2020-09-04 中国石油大学(华东) 气体高压等温吸附曲线预测方法、系统、存储介质、终端

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
ANTWI, P 等: "Estimation of biogas and methane yields in an UASB treating potato starch processing wastewater with backpropagation artificial neural network", 《BIORESOURCE TECHNOLOGY》, vol. 228, 1 March 2017 (2017-03-01), pages 106 - 115, XP029892630, DOI: 10.1016/j.biortech.2016.12.045 *
柴敬;王润沛;杜文刚;雷武林;朱旭宝;: "基于XGBoost的光纤监测矿压时序预测研究", 采矿与岩层控制工程学报, no. 04, 15 June 2017 (2017-06-15) *
魏松 等: "改进共轭梯度算法在矿井瓦斯含量预测中的应用", 《应用泛函分析学报》, vol. 19, no. 2, 15 June 2017 (2017-06-15), pages 224 - 230 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115310357A (zh) * 2022-08-09 2022-11-08 大庆正方软件科技股份有限公司 一种基于数据驱动决策的压裂分析方法

Also Published As

Publication number Publication date
CN114429800B (zh) 2024-06-21

Similar Documents

Publication Publication Date Title
US20210383041A1 (en) In-situ thermodynamic model training
CN111461463B (zh) 一种基于tcn-bp的短期负荷预测方法、系统及设备
Liu et al. A fault diagnosis intelligent algorithm based on improved BP neural network
CN102693451A (zh) 基于多参数的氨法烟气脱硫效率预测方法
CN110046378A (zh) 一种基于进化多目标优化的选择性分层集成高斯过程回归软测量建模方法
CN106650934B (zh) 采用改进的遗传优化算法精确辨识热工过程状态空间模型参数的方法
CN104865827B (zh) 一种基于多工况模型的抽油机采油优化方法
Jinhu et al. Applying principal component analysis and weighted support vector machine in building cooling load forecasting
CN113505477A (zh) 一种基于svae-wgan的过程工业软测量数据补充方法
CN113722980B (zh) 海洋浪高预测方法、系统、计算机设备、存储介质、终端
CN106600041A (zh) 基于受限玻尔兹曼机的光伏发电短期功率概率预测方法
CN114897144A (zh) 基于复值神经网络的复值时序信号预测方法
CN112163671A (zh) 一种新能源场景生成方法及系统
CN105608295A (zh) 焦化炉压力的多目标遗传算法与rbf神经网络优化建模方法
CN107729988B (zh) 基于动态深度置信网络的蓝藻水华预测方法
CN117174163A (zh) 病毒进化趋势预测方法和系统
CN114429800B (zh) 基于模型融合的甲烷水合物生成速率预测方法及系统
CN116822593A (zh) 一种基于硬件感知的大规模预训练语言模型压缩方法
CN106777466B (zh) 基于st-upfnn算法的高含硫天然气净化工艺的动态演化建模方法
CN113051828B (zh) 一种工艺参数驱动的天然气水露点在线预测方法
CN108537581B (zh) 基于gmdh选择性组合的能源消费量时间序列预测方法及装置
CN108509692B (zh) 一种基于MiUKFNN算法的高含硫天然气脱硫工艺建模方法
CN117709010A (zh) 基于ocssa-bp神经网络的变压器绝缘油溶解气体分析方法
CN116542882B (zh) 光伏发电平滑方法、系统和存储介质
CN117150898A (zh) 基于参数优化集成学习的输电断面极限传输容量评估方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant