CN116451812B - 基于多粒度级联森林和超参优化的润湿性预测方法及装置 - Google Patents
基于多粒度级联森林和超参优化的润湿性预测方法及装置 Download PDFInfo
- Publication number
- CN116451812B CN116451812B CN202310387482.XA CN202310387482A CN116451812B CN 116451812 B CN116451812 B CN 116451812B CN 202310387482 A CN202310387482 A CN 202310387482A CN 116451812 B CN116451812 B CN 116451812B
- Authority
- CN
- China
- Prior art keywords
- wettability
- model
- super
- prediction model
- prediction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000005457 optimization Methods 0.000 title claims abstract description 72
- 238000000034 method Methods 0.000 title claims abstract description 49
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 40
- 238000012549 training Methods 0.000 claims abstract description 28
- 238000007637 random forest analysis Methods 0.000 claims description 22
- 238000005070 sampling Methods 0.000 claims description 17
- 238000001514 detection method Methods 0.000 claims description 15
- 238000006467 substitution reaction Methods 0.000 claims description 13
- 239000013598 vector Substances 0.000 claims description 8
- 239000003795 chemical substances by application Substances 0.000 claims description 6
- 238000010276 construction Methods 0.000 claims description 6
- 230000004044 response Effects 0.000 abstract description 5
- 239000011435 rock Substances 0.000 abstract description 3
- 230000006870 function Effects 0.000 description 16
- 238000010801 machine learning Methods 0.000 description 10
- 238000003066 decision tree Methods 0.000 description 6
- 238000013507 mapping Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 229910052500 inorganic mineral Inorganic materials 0.000 description 5
- 230000015654 memory Effects 0.000 description 5
- 239000011707 mineral Substances 0.000 description 5
- 238000012545 processing Methods 0.000 description 4
- 230000004927 fusion Effects 0.000 description 3
- 238000000691 measurement method Methods 0.000 description 3
- 238000005065 mining Methods 0.000 description 3
- 229910021532 Calcite Inorganic materials 0.000 description 2
- CURLTUGMZLYLDI-UHFFFAOYSA-N Carbon dioxide Chemical compound O=C=O CURLTUGMZLYLDI-UHFFFAOYSA-N 0.000 description 2
- 238000005481 NMR spectroscopy Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 229910000514 dolomite Inorganic materials 0.000 description 2
- 239000010459 dolomite Substances 0.000 description 2
- 239000007789 gas Substances 0.000 description 2
- 229910052900 illite Inorganic materials 0.000 description 2
- 150000002500 ions Chemical class 0.000 description 2
- NLYAJNPCOHFWQQ-UHFFFAOYSA-N kaolin Chemical compound O.O.O=[Al]O[Si](=O)O[Si](=O)O[Al]=O NLYAJNPCOHFWQQ-UHFFFAOYSA-N 0.000 description 2
- 229910052622 kaolinite Inorganic materials 0.000 description 2
- VNWKTOKETHGBQD-UHFFFAOYSA-N methane Chemical compound C VNWKTOKETHGBQD-UHFFFAOYSA-N 0.000 description 2
- VGIBGUSAECPPNB-UHFFFAOYSA-L nonaaluminum;magnesium;tripotassium;1,3-dioxido-2,4,5-trioxa-1,3-disilabicyclo[1.1.1]pentane;iron(2+);oxygen(2-);fluoride;hydroxide Chemical compound [OH-].[O-2].[O-2].[O-2].[O-2].[O-2].[F-].[Mg+2].[Al+3].[Al+3].[Al+3].[Al+3].[Al+3].[Al+3].[Al+3].[Al+3].[Al+3].[K+].[K+].[K+].[Fe+2].O1[Si]2([O-])O[Si]1([O-])O2.O1[Si]2([O-])O[Si]1([O-])O2.O1[Si]2([O-])O[Si]1([O-])O2.O1[Si]2([O-])O[Si]1([O-])O2.O1[Si]2([O-])O[Si]1([O-])O2.O1[Si]2([O-])O[Si]1([O-])O2.O1[Si]2([O-])O[Si]1([O-])O2 VGIBGUSAECPPNB-UHFFFAOYSA-L 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 239000010453 quartz Substances 0.000 description 2
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N silicon dioxide Inorganic materials O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 2
- 239000000243 solution Substances 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000010200 validation analysis Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000012267 brine Substances 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 229910002092 carbon dioxide Inorganic materials 0.000 description 1
- 239000001569 carbon dioxide Substances 0.000 description 1
- 239000003245 coal Substances 0.000 description 1
- 238000002790 cross-validation Methods 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005315 distribution function Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000011545 laboratory measurement Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000003345 natural gas Substances 0.000 description 1
- 239000003208 petroleum Substances 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- HPALAKNZSZLMCH-UHFFFAOYSA-M sodium;chloride;hydrate Chemical compound O.[Na+].[Cl-] HPALAKNZSZLMCH-UHFFFAOYSA-M 0.000 description 1
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N13/00—Investigating surface or boundary effects, e.g. wetting power; Investigating diffusion effects; Analysing materials by determining surface, boundary, or diffusion effects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/217—Validation; Performance evaluation; Active pattern learning techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/20—Ensemble learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/01—Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T90/00—Enabling technologies or technologies with a potential or indirect contribution to GHG emissions mitigation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Analytical Chemistry (AREA)
- Medical Informatics (AREA)
- Chemical & Material Sciences (AREA)
- Pathology (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Immunology (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及岩石润湿性技术领域,特别是指一种基于多粒度级联森林和超参优化的润湿性预测方法及装置,一种基于多粒度级联森林和超参优化的润湿性预测方法包括:对实验样品进行检测,获得样品特征数据;基于多粒度级联森林算法进行建模操作,获得待训练预测模型;使用样品特征数据,对待训练预测模型进行训练,获得润湿性预测模型;根据样品特征数据、润湿性预测模型和预设的序列模型优化算法,获得优化润湿性预测模型;将待预测样品特征数据输入优化润湿性预测模型,获得润湿性预测结果。本发明是一种精准预测、响应迅速的页岩润湿性预测方法。
Description
技术领域
本发明涉及岩石润湿性技术领域,特别是指一种基于多粒度级联森林和超参优化的润湿性预测方法及装置。
背景技术
岩石的润湿性对二氧化碳储存能力有重要影响,对石油资源的勘探、资源评价和开发具有重要意义。目前主要通过各种实验手段,包括Amott-Harvey指数、USBM湿润性指数、原子力显微镜、接触角测量、核磁共振(NMR)等方法测量接触角,从而定量表征润湿性。但由于页岩的构造和成分复杂,非均质性强,实验室测量方法难以提取影响因素与润湿性之间的映射关系,且成本较高,有一定的局限性和不确定性。
近年来,在众多机器学习方法中,多粒度级联森林可以多维度多尺度地抓取数据特征,并可以通过森林模型充分学习特征参数的映射关系,从而精准预测目标值,适用于处理页岩非均质条件下润湿性与影响参数之间的复杂映射关系。机器学习(ML)算法在各个领域显示出良好的应用前景,在预测润湿性方面,一些研究人员应用不同的ML工具(如支持向量机(SVM)、人工神经网络(ANN)、随机森林(RF))来预测煤层等的接触角,但这些研究均未提供一套自动的超参数优化方案,导致调参过程严重依赖人工经验,十分耗时,精度也无法得到保证。
在现有技术中,缺乏一种精准预测、响应迅速的页岩润湿性预测方法。
发明内容
本发明实施例提供了一种基于多粒度级联森林和超参优化的润湿性预测方法及装置。所述技术方案如下:
一方面,提供了一种基于多粒度级联森林和超参优化的润湿性预测方法,该方法由电子设备实现,该方法包括:
S1、对实验样品进行检测,获得样品特征数据;
S2、基于多粒度级联森林算法进行建模操作,获得待训练预测模型;
S3、使用所述样品特征数据,对所述待训练预测模型进行训练,获得润湿性预测模型;
S4、根据所述样品特征数据、所述润湿性预测模型和预设的序列模型优化算法,获得优化润湿性预测模型;
S5、将待预测样品特征数据输入所述优化润湿性预测模型,获得润湿性预测结果。
可选地,所述对实验样品进行检测,获得样品特征数据,包括:
对实验样品进行检测,获得检测数据;所述检测数据包括实验样品的特征数据和标签数据;所述特征数据是实验样品中影响页岩润湿性的参数数据;所述标签数据是实验样品的接触角数据;
对所述检测数据进行划分操作,获得样品特征数据。
其中,所述待训练预测模型包括多粒度扫描模块和级联森林模块。
其中,所述多粒度扫描模块用于基于预设的采样粒度和预设的采样步长,将样品特征数据切分成多个特征向量。
其中,所述级联森林模块由多层森林网络串联组成;每层的森林网络由多个普通随机森林网络和完全随机森林网络组成。
可选地,所述使用所述样品特征数据,对所述待训练预测模型进行训练,获得润湿性预测模型,包括:
S31、使用所述样品特征数据,对所述待训练预测模型进行训练,获得训练后预测模型;
S32、基于所述训练后预测模型,通过k折交叉法进行验证,获得准确率;
S33、重复步骤S31-S32,当所述准确率不再提升时,获得润湿性预测模型。
可选地,所述根据所述样品特征数据、所述润湿性预测模型和预设的序列模型优化算法,获得优化润湿性预测模型,包括:
S41、基于所述样品特征数据和预设的参数数据进行模型构建,获得代理模型;
S42、基于所述润湿性预测模型,获得初始超参数;
S43、基于所述初始超参数和所述代理模型,通过预设的序列模型优化算法,获得最优超参数;
S44、基于所述最优超参数和所述润湿性预测模型,获得优化润湿性预测模型。
可选地,所述基于所述初始超参数和所述代理模型,通过预设的序列模型优化算法,获得最优超参数,包括:
S431、将所述初始超参数输入所述代理模型,通过所述预设的序列模型优化算法进行优化,获得优化超参数和超参数历史数据集;所述超参数历史数据集是由每一轮次的所述优化超参数组成的;
S432、基于所述超参数历史数据集进行函数拟合,获得替代模型函数;
S433、根据所述替代模型函数,获得新优化超参数;将所述新优化超参数替代初始超参数;
S434、重复步骤S431-S433,直到迭代结束,获得最优超参数。
另一方面,提供了一种基于多粒度级联森林和超参优化的润湿性预测装置,该装置应用于基于多粒度级联森林和超参优化的润湿性预测方法,该装置包括:
特征数据获取模块,用于对实验样品进行检测,获得样品特征数据;
模型建立模块,用于基于多粒度级联森林算法进行建模操作,获得待训练预测模型;
模型训练模块,用于使用所述样品特征数据,对所述待训练预测模型进行训练,获得润湿性预测模型;
模型优化模块,用于根据所述样品特征数据、所述润湿性预测模型和预设的序列模型优化算法,获得优化润湿性预测模型;
润湿性预测模块,用于将待预测样品特征数据输入所述优化润湿性预测模型,获得润湿性预测结果。
可选地,所述特征数据获取模块,进一步用于:
对实验样品进行检测,获得检测数据;所述检测数据包括实验样品的特征数据和标签数据;所述特征数据是实验样品中影响页岩润湿性的参数数据;所述标签数据是实验样品的接触角数据;
对所述检测数据进行划分操作,获得样品特征数据。
其中,所述待训练预测模型包括多粒度扫描模块和级联森林模块。
其中,所述多粒度扫描模块用于基于预设的采样粒度和预设的采样步长,将样品特征数据切分成多个特征向量。
其中,所述级联森林模块由多层森林网络串联组成;每层的森林网络由多个普通随机森林网络和完全随机森林网络组成。
可选地,所述模型训练模块,进一步用于:
S31、使用所述样品特征数据,对所述待训练预测模型进行训练,获得训练后预测模型;
S32、基于所述训练后预测模型,通过k折交叉法进行验证,获得准确率;
S33、重复步骤S31-S32,当所述准确率不再提升时,获得润湿性预测模型。
可选地,所述模型优化模块,进一步用于:
S41、基于所述样品特征数据和预设的参数数据进行模型构建,获得代理模型;
S42、基于所述润湿性预测模型,获得初始超参数;
S43、基于所述初始超参数和所述代理模型,通过预设的序列模型优化算法,获得最优超参数;
S44、基于所述最优超参数和所述润湿性预测模型,获得优化润湿性预测模型。
可选地,所述模型优化模块,进一步用于:
S431、将所述初始超参数输入所述代理模型,通过所述预设的序列模型优化算法进行优化,获得优化超参数和超参数历史数据集;所述超参数历史数据集是由每一轮次的所述优化超参数组成的;
S432、基于所述超参数历史数据集进行函数拟合,获得替代模型函数;
S433、根据所述替代模型函数,获得新优化超参数;将所述新优化超参数替代初始超参数;
S434、重复步骤S431-S433,直到迭代结束,获得最优超参数。
另一方面,提供了一种电子设备,所述电子设备包括处理器和存储器,所述存储器中存储有至少一条指令,所述至少一条指令由所述处理器加载并执行以实现上述一种基于多粒度级联森林和超参优化的润湿性预测方法。
另一方面,提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令,所述至少一条指令由处理器加载并执行以实现上述一种基于多粒度级联森林和超参优化的润湿性预测方法。
本发明实施例提供的技术方案带来的有益效果至少包括:
本发明提出一种基于多粒度级联森林和超参优化的润湿性预测方法,本发明基于多粒度级联森林机器学习模型与序列模型优化算法相融合,为小数据集的深度挖掘、多尺度特征映射和模型自动优化提供了一套高效的方法,相较于传统实验测量方法,该机器学习方法提高了页岩润湿性的预测速度和精度;通过序列模型优化算法自动对预测模型中的超参数进行调整,为高效预测页岩的润湿性提供了方法。本发明是一种精准预测、响应迅速的页岩润湿性预测方法。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种基于多粒度级联森林和超参优化的润湿性预测方法流程图;
图2是本发明实施例提供的一种页岩润湿性预测模型结果示意图。
图3是本发明实施例提供的一种基于多粒度级联森林和超参优化的润湿性预测装置框图;
图4是本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
为使本发明要解决的技术问题、技术方案和优点更加清楚,下面将结合附图及具体实施例进行详细描述。
本发明实施例提供了一种基于多粒度级联森林和超参优化的润湿性预测方法,该方法可以由电子设备实现,该电子设备可以是终端或服务器。如图1所示的一种基于多粒度级联森林和超参优化的润湿性预测方法流程图,该方法的处理流程可以包括如下的步骤:
S1、对实验样品进行检测,获得样品特征数据。
可选地,对实验样品进行检测,获得样品特征数据,包括:
对实验样品进行检测,获得检测数据;检测数据包括实验样品的特征数据和标签数据;特征数据是实验样品中影响页岩润湿性的参数数据;标签数据是实验样品的接触角数据;
对检测数据进行划分操作,获得样品特征数据。
一种可行的实施方式中,将不同天然气地质储存条件下的页岩样品数据作为实验样品数据来源。以实验样品中的总有机碳含量、气体类型、矿物占比、纯矿物接触角、离子浓度、温度和压力作为特征数据,页岩的接触角作为标签数据,共300组数据样本。
在实验样品中,石英、方解石、伊来石、白云石和高岭石为页岩的主要成分;矿物占比情况为:石英占比8%~59%,方解石占比0%~58%,白云石占比为0%~36,伊来石占比0%~57%,高岭石占比0%~20%;纯矿物接触角包括5种矿物的前进接触角和后退接触角;气体类型包括H2,CO2和CH4三种;离子浓度为盐水的离子浓度。
特征数据和标签数据以0.7:0.2:0.1的比例随机分为训练集、验证集和测试集。
S2、基于多粒度级联森林算法进行建模操作,获得待训练预测模型。
其中,待训练预测模型包括多粒度扫描模块和级联森林模块。
一种可行的实施方式中,本发明建立符合页岩润湿性预测的多粒度级联森林模型,将上述步骤中得到的样品特征数据输入模型进行训练。其中,多粒度级联森林包括多粒度扫描模块和级联森林模块。
其中,多粒度扫描模块用于基于预设的采样粒度和预设的采样步长,将样品特征数据切分成多个特征向量。
一种可行的实施方式中,多粒度扫描模块通过设置采样窗口(即粒度)和采样步长,将样品特征数据的润湿性相关数据切分成多个特征向量,多尺度抓取数据特征,充分挖掘页岩润湿性与其影响因素之间的数据信息;采样的滑动窗口的长度是可调节的,在本发明中,设置多粒度扫描模块中的采样窗口维数为100维,采样步长设置为1,将与润湿性相关的数据切分成多个特征向量,获得(P-K)/step+1个衍生样本,其中P为总样本数,step为采样步长,K为采样窗口维数,则原来的数据被划分为(300-100)/1+1=201个100维的特征子样本向量。
其中,级联森林模块由多层森林网络串联组成;每层的森林网络由多个普通随机森林网络和完全随机森林网络组成。
一种可行的实施方式中,级联森林模块由多层森林串联而成,每层的森林又由若干个普通随机森林和完全随机森林组成。
级联森林模块中的每棵树会根据样本所在的子空间中训练样本的类别占比生成一个类别的概率分布,然后对森林内所有树的各类比例取平均,输出整个森林对各类的比例。
每个样本数据在每棵树中都会找到一条路径去找到自己对应的叶节点,而同样在这个叶节点中的训练数据很可能是有不同类别的,级联森林模块对不同类别进行统计获取各类的比例,然后通过对所有树的比例进行求均值生成整个森林的概率分布。
S3、使用样品特征数据,对待训练预测模型进行训练,获得润湿性预测模型。
可选地,步骤S3可以进一步包括下述步骤S31-S34:
S31、使用样品特征数据,对待训练预测模型进行训练,获得训练后预测模型;
S32、基于训练后预测模型,通过k折交叉法进行验证,获得准确率;
S33、重复步骤S31-S32,当准确率不再提升时,获得润湿性预测模型。
一种可行的实施方式中,将多粒度扫描模块处理后的样品页岩润湿性数据特征信息(记为X)分别输入到级联森林的第一层,然后将输出结果再连接X输入到下一层,按照这种规则,每一级都接收前一级处理的数据,并将处理结果输出给下一级。在输出层将结果取平均值,得到最终的页岩润湿性预测结果。每个随机森林均采用k折交叉验证,当验证集的准确率不再提升时模型停止训练。
S4、根据样品特征数据、润湿性预测模型和预设的序列模型优化算法,获得优化润湿性预测模型。
可选地,步骤S4可以进一步包括下述步骤S41-S44:
S41、基于样品特征数据和预设的参数数据进行模型构建,获得代理模型;
S42、基于润湿性预测模型,获得初始超参数;
S43、基于初始超参数和代理模型,通过预设的序列模型优化算法,获得最优超参数;
S44、基于最优超参数和润湿性预测模型,获得优化润湿性预测模型。
一种可行的实施方式中,在本发明的技术应用背景中,超参数共有4个:包括多粒度扫描期间使用的窗口大小列表,参数取值空间为[50,150],取值为整数;切片数据时使用的滑动间隔,取值空间为[1,3],取值为整数;多粒度扫描时构建随机森林使用的决策树数量,取值空间为[30,50],取值为整数;每个级联层的随机森林中包含的决策树的数量,取值空间为[80,110],取值为整数。
基于页岩润湿性数据和其他影响参数数据构建代理模型f(x),本发明代理模型采用随机森林模型;设置超参数初始默认值:多粒度扫描期间使用的窗口大小=无;切片数据时使用的滑动间隔=1;多粒度扫描时构建随机森林使用的决策树数量=30;每个级联层的随机森林中包含的决策树的数量=101。
基于超参数初始默认值,使用选择函数EI(x)进行超参数的选取,计算公式如下式(1)、(2)、(3):
Φ(Z)=P(f(X)>f(xmax)) (2)
其中,xmax是当前迭代时获取函数的最大值;μ(x)是预测的润湿性数据的期望值;σ(x)是预测的润湿性数据的方差;Φ(·)是标准正态分布的累积分布函数;φ(·)是标准正态分布的概率密度函数。
可选地,步骤S43可以进一步包括下述步骤S431-S434:
S431、将初始超参数输入代理模型,通过预设的序列模型优化算法进行优化,获得优化超参数和超参数历史数据集;超参数历史数据集是由每一轮次的优化超参数组成的;
S432、基于超参数历史数据集进行函数拟合,获得替代模型函数;
S433、根据替代模型函数,获得新优化超参数;将新优化超参数替代初始超参数;
S434、重复步骤S431-S433,直到迭代结束,获得最优超参数。
一种可行的实施方式中,本发明进行优化迭代时,序列模型优化算法都将上一轮迭代得到的超参数数值加入到历史信息中,然后依照历史信息,不断拟合构建替代模型函数f(x),进而基于代理模型寻找到预测最优值进入下一轮迭代。如此反复,直到迭代结束,最终输出模型收敛图和最优超参数。
本发明代入实际样品数据,获得的最优超参数结果为:多粒度扫描期间使用的窗口大小为100;切片数据时使用的滑动间隔为1;多粒度扫描时构建随机森林使用的决策树数量为40;每个级联层的随机森林中包含的决策树的数量为90。
S5、将待预测样品特征数据输入优化润湿性预测模型,获得润湿性预测结果。
一种可行的实施方式中,将优化后的超参数数值设置到多粒度级联森林模型中,然后对待预测样品进行预测,获得对应的页岩润湿性结果,并通过决定系数R2衡量模型的预测精度。R2计算公式如下式(4)所示:
其中,n为润湿性测试集的样本数;为第i个样本的真实值,/>为第i个样本的预测值,/>为样本的平均值。
结果如图2所示。可以看出,该页岩润湿性预测模型的精度可达90%以上,可以准确预测页岩润湿性。
本发明提出一种基于多粒度级联森林和超参优化的润湿性预测方法,本发明基于多粒度级联森林机器学习模型与序列模型优化算法相融合,为小数据集的深度挖掘、多尺度特征映射和模型自动优化提供了一套高效的方法,相较于传统实验测量方法,该机器学习方法提高了页岩润湿性的预测速度和精度;通过序列模型优化算法自动对预测模型中的超参数进行调整,为高效预测页岩的润湿性提供了方法。本发明是一种精准预测、响应迅速的页岩润湿性预测方法。
图3是根据一示例性实施例示出的一种基于多粒度级联森林和超参优化的润湿性预测装置框图。参照图3,该装置包括:
特征数据获取模块310,用于对实验样品进行检测,获得样品特征数据;
模型建立模块320,用于基于多粒度级联森林算法进行建模操作,获得待训练预测模型;
模型训练模块330,用于使用样品特征数据,对待训练预测模型进行训练,获得润湿性预测模型;
模型优化模块340,用于根据样品特征数据、润湿性预测模型和预设的序列模型优化算法,获得优化润湿性预测模型;
润湿性预测模块350,用于将待预测样品特征数据输入优化润湿性预测模型,获得润湿性预测结果。
可选地,特征数据获取模块310,进一步用于:
对实验样品进行检测,获得检测数据;检测数据包括实验样品的特征数据和标签数据;特征数据是实验样品中影响页岩润湿性的参数数据;标签数据是实验样品的接触角数据;
对检测数据进行划分操作,获得样品特征数据。
其中,待训练预测模型包括多粒度扫描模块和级联森林模块。
其中,多粒度扫描模块用于基于预设的采样粒度和预设的采样步长,将样品特征数据切分成多个特征向量。
其中,级联森林模块由多层森林网络串联组成;每层的森林网络由多个普通随机森林网络和完全随机森林网络组成。
可选地,模型训练模块330,进一步用于:
S31、使用样品特征数据,对待训练预测模型进行训练,获得训练后预测模型;
S32、基于训练后预测模型,通过k折交叉法进行验证,获得准确率;
S33、重复步骤S31-S32,当准确率不再提升时,获得润湿性预测模型。
可选地,模型优化模块340,进一步用于:
S41、基于样品特征数据和预设的参数数据进行模型构建,获得代理模型;
S42、基于润湿性预测模型,获得初始超参数;
S43、基于初始超参数和代理模型,通过预设的序列模型优化算法,获得最优超参数;
S44、基于最优超参数和润湿性预测模型,获得优化润湿性预测模型。
可选地,模型优化模块340,进一步用于:
S431、将初始超参数输入代理模型,通过预设的序列模型优化算法进行优化,获得优化超参数和超参数历史数据集;超参数历史数据集是由每一轮次的优化超参数组成的;
S432、基于超参数历史数据集进行函数拟合,获得替代模型函数;
S433、根据替代模型函数,获得新优化超参数;将新优化超参数替代初始超参数;
S434、重复步骤S431-S433,直到迭代结束,获得最优超参数。
本发明提出一种基于多粒度级联森林和超参优化的润湿性预测方法,本发明基于多粒度级联森林机器学习模型与序列模型优化算法相融合,为小数据集的深度挖掘、多尺度特征映射和模型自动优化提供了一套高效的方法,相较于传统实验测量方法,该机器学习方法提高了页岩润湿性的预测速度和精度;通过序列模型优化算法自动对预测模型中的超参数进行调整,为高效预测页岩的润湿性提供了方法。本发明是一种精准预测、响应迅速的页岩润湿性预测方法。
图4是本发明实施例提供的一种电子设备400的结构示意图,该电子设备400可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(centralprocessing units,CPU)401和一个或一个以上的存储器402,其中,所述存储器402中存储有至少一条指令,所述至少一条指令由所述处理器401加载并执行以实现上述一种基于多粒度级联森林和超参优化的润湿性预测方法的步骤。
在示例性实施例中,还提供了一种计算机可读存储介质,例如包括指令的存储器,上述指令可由终端中的处理器执行以完成上述一种基于多粒度级联森林和超参优化的润湿性预测方法。例如,所述计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (7)
1.一种基于多粒度级联森林和超参优化的润湿性预测方法,其特征在于,所述方法包括:
S1、对实验样品进行检测,获得样品特征数据;
S2、基于多粒度级联森林算法进行建模操作,获得待训练预测模型;
S3、使用所述样品特征数据,对所述待训练预测模型进行训练,获得润湿性预测模型;
S4、根据所述样品特征数据、所述润湿性预测模型和预设的序列模型优化算法,获得优化润湿性预测模型;
其中,所述根据所述样品特征数据、所述润湿性预测模型和预设的序列模型优化算法,获得优化润湿性预测模型,包括:
S41、基于所述样品特征数据和预设的参数数据进行模型构建,获得代理模型;
S42、基于所述润湿性预测模型,获得初始超参数;
S43、基于所述初始超参数和所述代理模型,通过预设的序列模型优化算法,获得最优超参数;
S44、基于所述最优超参数和所述润湿性预测模型,获得优化润湿性预测模型;
其中,所述基于所述初始超参数和所述代理模型,通过预设的序列模型优化算法,获得最优超参数,包括:
S431、将所述初始超参数输入所述代理模型,通过所述预设的序列模型优化算法进行优化,获得优化超参数和超参数历史数据集;所述超参数历史数据集是由每一轮次的所述优化超参数组成的;
S432、基于所述超参数历史数据集进行函数拟合,获得替代模型函数;
S433、根据所述替代模型函数,获得新优化超参数;将所述新优化超参数替代初始超参数;
S434、重复步骤S431-S433,直到迭代结束,获得最优超参数;
S5、将待预测样品特征数据输入所述优化润湿性预测模型,获得润湿性预测结果。
2.根据权利要求1所述的一种基于多粒度级联森林和超参优化的润湿性预测方法,其特征在于,所述对实验样品进行检测,获得样品特征数据,包括:
对实验样品进行检测,获得检测数据;所述检测数据包括实验样品的特征数据和标签数据;所述特征数据是实验样品中影响页岩润湿性的参数数据;所述标签数据是实验样品的接触角数据;
对所述检测数据进行划分操作,获得样品特征数据。
3.根据权利要求1所述的一种基于多粒度级联森林和超参优化的润湿性预测方法,其特征在于,所述待训练预测模型包括多粒度扫描模块和级联森林模块。
4.根据权利要求3所述的一种基于多粒度级联森林和超参优化的润湿性预测方法,其特征在于,所述多粒度扫描模块用于基于预设的采样粒度和预设的采样步长,将样品特征数据切分成多个特征向量。
5.根据权利要求3所述的一种基于多粒度级联森林和超参优化的润湿性预测方法,其特征在于,所述级联森林模块由多层森林网络串联组成;每层的森林网络由多个普通随机森林网络和完全随机森林网络组成。
6.根据权利要求1所述的一种基于多粒度级联森林和超参优化的润湿性预测方法,其特征在于,所述使用所述样品特征数据,对所述待训练预测模型进行训练,获得润湿性预测模型,包括:
S31、使用所述样品特征数据,对所述待训练预测模型进行训练,获得训练后预测模型;
S32、基于所述训练后预测模型,通过k折交叉法进行验证,获得准确率;
S33、重复步骤S31-S32,当所述准确率不再提升时,获得润湿性预测模型。
7.一种基于多粒度级联森林和超参优化的润湿性预测装置,其特征在于,所述装置包括:
特征数据获取模块,用于对实验样品进行检测,获得样品特征数据;
模型建立模块,用于基于多粒度级联森林算法进行建模操作,获得待训练预测模型;
模型训练模块,用于使用所述样品特征数据,对所述待训练预测模型进行训练,获得润湿性预测模型;
模型优化模块,用于根据所述样品特征数据、所述润湿性预测模型和预设的序列模型优化算法,获得优化润湿性预测模型;
其中,所述根据所述样品特征数据、所述润湿性预测模型和预设的序列模型优化算法,获得优化润湿性预测模型,包括:
S41、基于所述样品特征数据和预设的参数数据进行模型构建,获得代理模型;
S42、基于所述润湿性预测模型,获得初始超参数;
S43、基于所述初始超参数和所述代理模型,通过预设的序列模型优化算法,获得最优超参数;
S44、基于所述最优超参数和所述润湿性预测模型,获得优化润湿性预测模型;
其中,所述基于所述初始超参数和所述代理模型,通过预设的序列模型优化算法,获得最优超参数,包括:
S431、将所述初始超参数输入所述代理模型,通过所述预设的序列模型优化算法进行优化,获得优化超参数和超参数历史数据集;所述超参数历史数据集是由每一轮次的所述优化超参数组成的;
S432、基于所述超参数历史数据集进行函数拟合,获得替代模型函数;
S433、根据所述替代模型函数,获得新优化超参数;将所述新优化超参数替代初始超参数;
S434、重复步骤S431-S433,直到迭代结束,获得最优超参数;
润湿性预测模块,用于将待预测样品特征数据输入所述优化润湿性预测模型,获得润湿性预测结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310387482.XA CN116451812B (zh) | 2023-04-12 | 2023-04-12 | 基于多粒度级联森林和超参优化的润湿性预测方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310387482.XA CN116451812B (zh) | 2023-04-12 | 2023-04-12 | 基于多粒度级联森林和超参优化的润湿性预测方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116451812A CN116451812A (zh) | 2023-07-18 |
CN116451812B true CN116451812B (zh) | 2024-02-09 |
Family
ID=87133204
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310387482.XA Active CN116451812B (zh) | 2023-04-12 | 2023-04-12 | 基于多粒度级联森林和超参优化的润湿性预测方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116451812B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020097037A1 (en) * | 2018-11-06 | 2020-05-14 | Saudi Arabian Oil Company | Nuclear magnetic resonance gas isotherm technique to evaluate reservoir rock wettability |
CN112116058A (zh) * | 2020-09-16 | 2020-12-22 | 昆明理工大学 | 一种基于粒子群算法优化多粒度级联森林模型的变压器故障诊断方法 |
WO2022111125A1 (zh) * | 2020-11-27 | 2022-06-02 | 深圳先进技术研究院 | 一种基于随机森林的图数据处理框架自动调优方法 |
CN115269247A (zh) * | 2022-07-28 | 2022-11-01 | 山东云海国创云计算装备产业创新中心有限公司 | 基于深度森林的闪存坏块预测方法、系统、介质及设备 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130325348A1 (en) * | 2012-05-31 | 2013-12-05 | Schlumberger Technology Corporation | Obtaining wettability from t1 and t2 measurements |
WO2016210151A1 (en) * | 2015-06-24 | 2016-12-29 | Conocophillips Company | Rock wettability determinations |
US11719849B2 (en) * | 2018-10-24 | 2023-08-08 | Baker Hughes Holdings Llc | Modeling textural parameters of a formation with downhole measurements |
-
2023
- 2023-04-12 CN CN202310387482.XA patent/CN116451812B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020097037A1 (en) * | 2018-11-06 | 2020-05-14 | Saudi Arabian Oil Company | Nuclear magnetic resonance gas isotherm technique to evaluate reservoir rock wettability |
CN112116058A (zh) * | 2020-09-16 | 2020-12-22 | 昆明理工大学 | 一种基于粒子群算法优化多粒度级联森林模型的变压器故障诊断方法 |
WO2022111125A1 (zh) * | 2020-11-27 | 2022-06-02 | 深圳先进技术研究院 | 一种基于随机森林的图数据处理框架自动调优方法 |
CN115269247A (zh) * | 2022-07-28 | 2022-11-01 | 山东云海国创云计算装备产业创新中心有限公司 | 基于深度森林的闪存坏块预测方法、系统、介质及设备 |
Non-Patent Citations (7)
Title |
---|
"油藏中矿物润湿性的测量方法综述";施砍园等;《特种油气藏》;全文 * |
Iglauer, S (Iglauer, Stefan) ."Role of fluid density on quartz wettability".《 Journal information JOURNAL OF PETROLEUM SCIENCE AND ENGINEERING》.2018,全文. * |
Pan, B (Pan, Bin) ; Gong, CP (Gong, Changping) * |
Pan, B (Pan, Bin) ; Li, YJ (Li, Yajun) ; Xie, LJ (Xie, Liujuan) ; Wang, XP (Wang, Xiaopu) ; He, QK (He, Qingkun) ; Li, YC (Li, Yanchao) ; Hejazi, SH (Hejazi, Seyed Hossein) * |
Wang, XP (Wang, Xiaopu) ; Li, YJ (Li, Yajun) ; Iglauer, S (Iglauer, Stefan) ."The interfacial properties of clay-coated quartz at reservoir conditions".《FUEL》.2019,全文. * |
冷采洗油剂在不同润湿性条件下的微观驱油实验研究;朱维耀;刘静文;宋智勇;李兵兵;王雪;;《当代化工》(第06期);全文 * |
考虑固液分子作用的多孔介质动态网络模型;王小锋;朱维耀;邓庆军;刘启鹏;隋新光;娄钰;高英;张雪龄;;《北京科技大学学报》(第02期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN116451812A (zh) | 2023-07-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110717249B (zh) | 页岩气储层测井孔隙度快速预测方法及系统 | |
Thanh et al. | Knowledge-based machine learning techniques for accurate prediction of CO2 storage performance in underground saline aquifers | |
CN108376295B (zh) | 一种油气甜点预测方法及存储介质 | |
GB2598979A (en) | Facilitating hydrocarbon exploration by applying a machine learning model to basin data | |
CN116305850A (zh) | 一种基于随机森林模型的地层热导率预测方法 | |
CN117010266A (zh) | 一种基于XGBoost模型的膏体屈服应力预测方法及装置 | |
CN116010884A (zh) | 基于主成分分析的SSA-LightGBM油浸式变压器的故障诊断方法 | |
Ye et al. | Drilling formation perception by supervised learning: Model evaluation and parameter analysis | |
CN114638300A (zh) | 一种识别页岩油气藏“甜点”的方法、装置及存储介质 | |
CN116451812B (zh) | 基于多粒度级联森林和超参优化的润湿性预测方法及装置 | |
Gao et al. | Machine Learning Models for Predicting Asphaltene Stability Based on Saturates-Aromatics-Resins-Asphaltenes | |
CN117473305A (zh) | 一种近邻信息增强的储层参数预测方法及系统 | |
CN112579777A (zh) | 一种未标注文本的半监督分类方法 | |
CN115809411A (zh) | 一种基于测井数据的改进型决策树岩性识别方法 | |
CN116467860A (zh) | 一种基于评估指标的仿真试验设计方法 | |
CN114818493A (zh) | 一种隧道岩体完整程度定量评价的方法 | |
US20200309978A1 (en) | Direct Hydrocarbon Indicators Analysis Informed by Machine Learning Processes | |
WO2022144565A1 (en) | Concentration prediction in produced water | |
Ashayeri et al. | Using the Adaptive Variable Structure Regression Approach in Data Selection and Data Preparation for Improving Machine Learning-Based Performance Prediction in Unconventional Plays | |
Deng et al. | Deep learning-based dynamic forecasting method and application for ultra-deep fractured reservoir production | |
Hou et al. | Identification of carbonate sedimentary facies from well logs with machine learning | |
CN115983088B (zh) | 一种基于集成学习建立的海相页岩原地气量预测模型 | |
CN117686442B (zh) | 一种氯离子扩散浓度检测方法、系统、介质及设备 | |
US20240229644A9 (en) | Concentration Prediction in Produced Water | |
CN117521860A (zh) | 一种数据采集成本预测模型训练方法和预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |