CN115732041A

CN115732041A - 二氧化碳捕获量预测模型构建方法、智能预测方法及装置

Info

Publication number: CN115732041A
Application number: CN202211561733.3A
Authority: CN
Inventors: 杨磊磊; 周子杰; 李帆; 姜福杰; 宋子扬; 王大为; 刘祎; 李小伟; 胡涛; 齐振国; 许数
Original assignee: China University of Petroleum Beijing
Current assignee: China University of Petroleum Beijing
Priority date: 2022-12-07
Filing date: 2022-12-07
Publication date: 2023-03-03
Anticipated expiration: 2042-12-07
Also published as: CN115732041B

Abstract

本文涉及二氧化碳捕获量预测模型构建方法、智能预测方法及装置，包括：利用第一训练样本数据集，训练第一初始模型，得到第一碳储量预测模型；第一训练样本数据集包括：地层参数样本集及某一时间节点对应的地层二氧化碳捕获量标签数据集；获取第一碳储量预测模型的输出数据，得到二氧化碳捕获量；根据地层参数样本集及二氧化碳捕获量，确定第二训练样本数据集；将第二训练样本数据集输入基于LSTM的第二初始模型，得到第二初始模型输出的二氧化碳捕获量初始预测值；根据损失函数、二氧化碳捕获量初始预测值及第二训练样本，训练第二初始模型，构建二氧化碳捕获量预测模型。本方案快速准确得到不同时间的地质二氧化碳捕获量，效率高、时效性强。

Description

二氧化碳捕获量预测模型构建方法、智能预测方法及装置

技术领域

本文涉及石油勘探领域，尤其是二氧化碳捕获量预测模型构建方法、智能预测方法及装置。

背景技术

目前常用的二氧化碳捕获量估算方法主要包括体积法、面积法、压缩法、溶解度法、封存机理法、数值模拟法等。这些计算方法大多停留在关于二氧化碳气相附着和液相溶解的捕获量，但矿物捕获是二氧化碳在地质封存过程中的最终去向，研究二氧化碳在地质封存过程中的矿物捕获量对于提高捕获量计算的精度和准确性意义深远。

近些年，逐渐有学者计算机数值模拟手段，聚焦于二氧化碳注入地层后的地球化学反应，考虑溶质运移、络合、阳离子交换、氧化还原等地球化学反应，建立多相流体运动以及气体扩散的数学模型，通过离散建立大量的线性或非线性方程组，最后利用计算机求解，定量分析矿物间所发生的矿物溶蚀、沉淀及转化关系，从而计算矿物捕获量。然而，二氧化碳矿物捕获是一个长时间尺度的研究，长达成千上万年，地层系统复杂、参数众多，模型计算困难、耗时长、计算精度不准确。

针对现有技术中存在的研究耗时长、模型计算不准确的问题，需要一种二氧化碳捕获量预测模型构建方法。

发明内容

为解决上述现有技术的问题，本文实施例提供了一种二氧化碳捕获量预测模型构建方法、智能预测方法及装置。

根据本文实施例的一个方面，所述二氧化碳捕获量预测模型基于XGBoost算法及LSTM训练得到，所述方法包括：利用至少一组第一训练样本数据集，训练基于XGBoost算法的第一初始模型，得到多个第一碳储量预测模型，其中，每一第一碳储量预测模型与每一时间节点对应；每组第一训练样本数据集包括：地层参数样本集及某一时间节点对应的地层二氧化碳捕获量标签数据集；获取多个第一碳储量预测模型的输出数据，得到对应多个时间节点的地层二氧化碳捕获量；根据所述地层参数样本集及对应多个时间节点的地层二氧化碳捕获量，确定第二训练样本数据集；将所述第二训练样本数据集输入至基于LSTM的第二初始模型，得到第二初始模型输出的地层二氧化碳捕获量初始预测值；根据第二初始模型的损失函数、地层二氧化碳捕获量初始预测值及第二训练样本数据，迭代训练第二初始模型，构建得到二氧化碳捕获量预测模型。

根据本文实施例的一个方面，确定第二训练样本数据集包括：将地层参数样本集与多个时间节点的地层二氧化碳捕获量进行笛卡尔积，得到初始训练样本集；对初始训练样本集进行n阶滞后操作，并进行分层抽样，得到第二训练样本集。

根据本文实施例的一个方面，所述确定第二训练样本集进一步包括：从第二训练样本集中确定0至m-1时间节点的地层二氧化碳捕获量，作为训练样本特征参数，将时间节点m的地层二氧化碳捕获量作为模型训练的标签数据。

根据本文实施例的一个方面，所述方法包括：利用如下公式确定第二初始模型输出的地层二氧化碳捕获量初始预测值：P_L＝LSTM_forward(X_p,C_p-1,H_p-1)，其中，P_L为第二初始模型中当前时刻隐藏层的输出，LSTM_forward为LSTM细胞前向计算方法，C_p-1和H_p-1分别为前一时刻隐藏层的细胞状态和隐藏状态，X_p为当前时刻的地层二氧化碳捕获量及当前地层参数；将地层二氧化碳捕获量初始预测值通过全连接神经网络进行处理，得到下一时间节点的地层二氧化碳捕获量。

根据本文实施例的一个方面，根据第二初始模型的损失函数、地层二氧化碳捕获量初始预测值及第二训练样本数据，迭代训练第二初始模型包括：利用如下公式确定地层二氧化碳捕获量预测模型的损失函数：

其中，p′_i表示地层二氧化碳捕获量的第i个预测值，y_i表示t时间节点的真实地层二氧化碳捕获量，k代表时间节点与地层参数个数的乘积。

根据本文实施例的一个方面，所述地层参数样本集包括各地层的温度、压强、岩石占比。

根据本文实施例的一个方面，所述方法包括：获取多个地层的真实地层参数集；将所述多个地层的真实地层参数集输入至上述所述的二氧化碳捕获量预测模型构建方法构建的二氧化碳捕获量预测模型，得到预测的未来时间节点的地层二氧化碳捕获量。

本文实施例提供了一种二氧化碳捕获量预测模型构建装置，所述装置包括：

第一训练单元，用于利用至少一组第一训练样本数据集，训练基于XGBoost算法的第一初始模型，得到多个第一碳储量预测模型，其中，每一第一碳储量预测模型与每一时间节点对应；每组第一训练样本数据集包括：地层参数样本集及某一时间节点对应的地层二氧化碳捕获量标签数据集；二氧化碳捕获量获取单元，用于获取多个第一碳储量预测模型的输出数据，得到对应多个时间节点的地层二氧化碳捕获量；第二训练样本数据集确定单元，用于根据所述地层参数样本集及对应多个时间节点的地层二氧化碳捕获量，确定第二训练样本数据集；初始预测值获取单元，用于将所述第二训练样本数据集输入至基于LSTM的第二初始模型，得到第二初始模型输出的地层二氧化碳捕获量初始预测值；预测模型构建单元，用于根据第二初始模型的损失函数、地层二氧化碳捕获量初始预测值及第二训练样本数据，迭代训练第二初始模型，构建得到二氧化碳捕获量预测模型。

本文实施例还提供了一种计算机设备，所述计算机设备包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现所述二氧化碳捕获量预测模型构建方法。

本文实施例还提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时实现所述二氧化碳捕获量预测模型构建方法。

本方案通过已有数据训练出二氧化碳捕获量智能预测的模型，针对现有商业化软件计算二氧化碳捕获量的时间过慢，且随着封存时间的增加预测计算时间成倍增加，且容易出现不拟合的问题，采用XGBoost算法和LSTM算法结合的网络模型可以快速准确得到不同时间的二氧化碳在地质中的捕获量；相比与传统的数值模拟技术，模拟的时间更短，通过数据进行预测，能减少预测过程中人为等相关因素的影响，在保证模型准确性的前提下，取得了更高的时间效率，增加在实际应用中的时效性。

附图说明

为了更清楚地说明本文实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本文的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1所示为本文实施例一种二氧化碳捕获量预测模型构建方法的流程图；

图2所示为本文实施例一种确定第二训练样本数据集的方法流程图；

图3所示为本文实施例一种预测地层二氧化碳捕获量的方法流程图；

图4所示为本文实施例一种预测二氧化碳捕获量的方法流程图；

图5所示为本文实施例一种二氧化碳捕获量预测模型构建装置的结构示意图；

图6所示为本文实施例二氧化碳捕获量预测模型构建装置的具体结构示意图；

图7所示为本文实施例一种二氧化碳捕获量预测模型的示意图；

图8所示为本文实施例一种计算机设备的结构示意图。

附图符号说明：

501、第一训练单元；

5011、第一训练样本数据集获取模块；

502、二氧化碳捕获量获取单元；

503、第二训练样本数据集确定单元；

5031、初始训练样本集确定模块；

504、初始预测值获取单元；

505、预测模型构建单元；

802、计算机设备；

804、处理器；

806、存储器；

808、驱动机构；

810、输入/输出模块；

812、输入设备；

814、输出设备；

816、呈现设备；

818、图形用户接口；

820、网络接口；

822、通信链路；

824、通信总线。

具体实施方式

为了使本技术领域的人员更好地理解本说明书中的技术方案，下面将结合本文实施例中的附图，对本文实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本文一部分实施例，而不是全部的实施例。基于本文中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本文保护的范围。

需要说明的是，本文的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本文的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、装置、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

本说明书提供了如实施例或流程图所述的方法操作步骤，但基于常规或者无创造性的劳动可以包括更多或者更少的操作步骤。实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种方式，不代表唯一的执行顺序。在实际中的系统或装置产品执行时，可以按照实施例或者附图所示的方法顺序执行或者并行执行。

需要说明的是，本文的二氧化碳捕获量预测模型构建方法可用于石油勘探领域，本文对二氧化碳捕获量预测模型构建方法及装置的应用领域不做限定。

图1所示为本文实施例一种二氧化碳捕获量预测模型构建方法的流程图，具体公开了如下步骤：

步骤101，利用至少一组第一训练样本数据集，训练基于XGBoost算法的第一初始模型，得到多个第一碳储量预测模型，其中，每一第一碳储量预测模型与每一时间节点对应；每组第一训练样本数据集包括：地层参数样本集及某一时间节点对应的地层二氧化碳捕获量标签数据集。在本步骤中，首先利用第一训练样本数据集训练基于XGBoost算法的第一初始模型。具体的，第一训练样本数据集中的地层参数样本集为多个地层的地层参数样本的集合。例如，研究某区域地层以下第1000米至第3000米深度区域的地层二氧化碳捕获量，则首先需要获取该深度区域不同地层的地层参数。在本申请中，对不同地层的地层参数进行稀疏采样，均匀选取能够代表该深度区域的地层形态及地层分布的地层的地层参数。例如，从地层以下第1000米开始每隔100米采集一次地层参数。其中，地层参数包括但不限于：矿石占比、矿物含量、地层温度、地层压强、离子浓度等。

进一步的，第一训练样本数据集中还包括某各时间节点对应的地层二氧化碳捕获量标签数据集。在本申请中，地层二氧化碳捕获量与每个时间节点对应。将采样得到的地层参数数据输入至模拟软件，设定若干固定的时间节点，等待一段时间后能够得到对应地层在各个时间节点的二氧化碳捕获量。另外，也可以通过已知的资料等得到各个时间节点的不同地层的二氧化碳捕获量。

例如，该区域未来100年的地层二氧化碳捕获量、该区域未来200年的地层二氧化碳捕获量、该区域未来300年的地层二氧化碳捕获量等。其中，每一个时间节点对应的地层二氧化碳捕获量与该区域的地层参数样本集相对应。若该区域有20个地层参数样本集，则未来100年的地层二氧化碳捕获量标签数据集包括20个地层的二氧化碳数据。

在本说明书中，第一训练样本数据集的样本数量可能较少，例如，包括20个地层参数样本集及3个时间节点对应的地层二氧化碳捕获量标签数据集。每一个地层参数样本集中包括地层温度、地层压强、地层岩石分布及岩石占比等几个地层参数，每个地层二氧化碳捕获量标签数据集中包括20个二氧化碳捕获量标签数据。

在本申请中，根据XGBoost模型的模型特征，使用一个时间节点对应的地层二氧化碳捕获量及对应的地层参数样本集，可以训练一个基于XGBoost算法的第一初始模型；使用两个时间节点对应的地层二氧化碳捕获量及对应的地层参数样本集，可以训练得到2个第一初始模型。以此类推，第一训练样本数据集中包含多少个时间节点对应的地层二氧化碳捕获量标签数据集，既可以训练得到多少个第一碳储量预测模型。

步骤102，获取多个第一碳储量预测模型的输出数据，得到对应多个时间节点的地层二氧化碳捕获量。在本申请中，基于XGBoost模型输出的地层二氧化碳捕获量相较于第一训练样本数据集中的地层二氧化碳捕获量标签数据，其具有更高的准确率。

本步骤中，多个第一碳储量预测模型输出的地层二氧化碳捕获量，可以形成时间序列形式的地层二氧化碳捕获量数据。例如，若第一训练样本数据集中包括3个不同时间节点的地层二氧化碳捕获量标签数据看，则利用第一训练样本数据集能够分别训练3个第一初始模型，得到3个第一碳储量预测模型。则本步骤中可以得到对应3个不同时间节点的地层二氧化碳捕获量。则这3个时间节点的地层二氧化碳捕获量在时间维度上可以形成地层二氧化碳捕获量时间序列。

步骤103，根据所述地层参数样本集及对应多个时间节点的二氧化碳捕获量，确定第二训练样本数据集。本步骤中，根据步骤101的第一训练样本数据集中的地层参数样本集，作为第二训练样本数据集中的样本数据，并利用第一碳储量预测模型的输出，作为第二样本数据集中的标签样本数据。例如，步骤102中得到地层二氧化碳捕获量时间序列形式的数据，则可以作为本步骤中的第二训练样本数据集，进一步用于后续步骤训练基于LSTM的第二初始模型。

步骤104，将所述第二训练样本数据集输入至基于LSTM的第二初始模型，得到第二初始模型输出的地层二氧化碳捕获量初始预测值。在本步骤中，基于长短期记忆时间循环神经网络LSTM和全连接神经网络，能够得到基于LSTM的第二初始模型。将第二训练样本数据集输入至第二初始模型，得到地层二氧化碳捕获量的初始预测值。

步骤105，根据第二初始模型的损失函数、二氧化碳捕获量初始预测值及第二训练样本数据，迭代训练第二初始模型，构建得到二氧化碳捕获量预测模型。本申请中利用第二初始模型的损失函数训练第二初始模型的过程将在图2详细描述，本步骤在此不做赘述。

图2所示为本文实施例一种确定第二训练样本数据集的方法流程图，具体包括如下步骤：

步骤201，将地层参数样本集与多个时间节点的地层二氧化碳捕获量进行笛卡尔积，得到初始训练样本集。在本说明书的一些实施例中，在确定第二训练样本集之前，需要将维度不同的地层参数样本集与多个时间节点的地层二氧化碳捕获量进行笛卡尔积。例如，地层参数样本集可以由F表示，F＝{f₁,f₂,...,f_n}，其中n表示地层数量，地层参数样本集中的每个元素均包括至少一个地层参数，包括但不限于：温度、压强、矿物含量等。例如，每个元素包括k个地层参数，则地层参数样本集的维度为n*k。

多个时间节点的地层二氧化碳捕获量可以表示为集合L，L＝{L₁,L₂,...L_n}，其中，n表示地层参数，其中，集合L中的每一个元素L_n为f_n对应的第n个地层中，多个时间节点所对应的第一碳储量预测模型所预测得到的碳储量集合。在本申请中，每个元素包括{t₁,t₂,...,t_m}m个时间节点对应的地层二氧化碳捕获量。也即，L_n＝{l₁,l₂,...,l_m}，其中，l_i表示第n个地层中第i个时间节点对应的地层二氧化碳捕获量。

在本步骤中，将F与L进行笛卡尔积，具体的，将n*k维度的F与n*m的L做笛卡尔积，将F与L中的L_n与f_m进行笛卡尔积，得到(n*m)*(k+1)维度的数据集D＝{d₁,d₂,...,d_n*m}，其中d_n*m＝f_n×L_n，×为笛卡尔积符号。本步骤中，从第二训练样本集中确定0至m-1的时间节点的地层二氧化碳捕获量，作为训练样本特征参数，将时间节点m的地层二氧化碳捕获量作为模型训练的标签数据，将时间序列的地层二氧化碳捕获量数据转化为有监督的数据，使第二训练样本集中的数据符合基于LSTM算法的第二初始模型的训练要求。在本说明书的一些实施例中，得到的长度为m×n的数据集D以大小m的倍数进行分层抽样，其中每层训练集占比为

最终得到第二训练样本数据集为：

得到测试集为

步骤202，对初始训练样本集进行n阶滞后操作，并进行分层抽样，得到第二训练样本集。将数据集D中每个d_m进行n阶滞后操作得到数据集D′＝{d₁′,d′₂,...,d′_m}。

在本说明书中，通过调整n阶滞后操作的n的数值大小，可以影响第二初始模型中LSTM的时间窗口步长，进一步影响模型输出的二氧化碳捕获量预测的时间。

图3所示为本文实施例一种预测地层二氧化碳捕获量的方法流程图，具体包括如下步骤：

步骤301，利用公式确定第二初始模型输出的二氧化碳捕获量初始预测值。

P_L＝LSTM_forward(X_p,C_p-1,H_p-1)，其中，P_L为第二初始模型中当前时刻隐藏层的输出。LSTM_forward为LSTM细胞前向计算方法，C_p-1和H_p-1分别为前一时刻隐藏层的细胞状态和隐藏状态，X_p为当前时刻的地层二氧化碳捕获量及当前地层参数；将地层二氧化碳捕获量初始预测值通过全连接神经网络进行处理，得到下一时间节点的地层二氧化碳捕获量。在本步骤中，C_p-1和H_p-1中的p可以理解为t，X_p为当前时刻隐藏层的输入，利用LSTM细胞向前计算方法，对前一时刻隐藏层的细胞状态、隐藏状态及当前时刻的地层二氧化碳捕获量进行计算，得到当前时刻隐藏层的输出。其中，当前时刻隐藏层的输出为一个时间窗口对应的地层二氧化碳捕获量。

步骤302，将二氧化碳捕获量初始预测值通过全连接神经网络进行处理，得到下一时间节点的地层二氧化碳捕获量。利用全连接神经网络，将第一个时间窗口的地层二氧化碳捕获量进行划分，得到单个时间节点对应的二氧化碳捕获量。

在本步骤中，可以利用如下公式确定第二初始模型的损失函数：

其中，p′_i表示地层二氧化碳捕获量的第i个预测值，y_i表示t时间节点的真实地层二氧化碳捕获量，k代表时间节点与地层参数个数的乘积。根据预测值与真实地层二氧化碳捕获量之间的差值，不断调整第二初始模型的损失函数，直到损失函数的值收敛到一定程度，完成对第二初始模型的训练，得到二氧化碳捕获量预测模型。

图4所示为本文实施例一种预测二氧化碳捕获量的方法流程图，包括如下步骤：

步骤401，获取多个地层的真实地层参数集。本步骤中的真实地层参数集用于使用构建得到的二氧化碳捕获量预测模型，进行实际预测。本步骤中获取的真实地层参数集属于测试集中的数据，相较于第一训练样本数据集中的地层参数样本集，数量更多，能够更加准确地预测二氧化碳捕获量。

步骤402，将所述多个地层的真实地层参数集输入至所述二氧化碳捕获量预测模型，得到预测的未来时间节点的二氧化碳捕获量。在本步骤中，将真实地层参数集输入至能预测未来不同时间的二氧化碳捕获量的预测模型，可以得到未来不同时间节点的二氧化碳捕获量。不同的二氧化碳捕获量预测模型，由模型训练确定第二训练样本数据集时，设置不同的n阶滞后的数值确定。

如图5所示为本文实施例一种二氧化碳捕获量预测模型构建装置的结构示意图，在本图中描述了二氧化碳捕获量预测模型构建装置的基本结构，其中的功能单元、模块可以采用软件方式实现，也可以采用通用芯片或者特定芯片实现二氧化碳捕获量预测模型构建，该装置具体包括：

第一训练单元501，用于利用至少一组第一训练样本数据集，训练基于XGBoost算法的第一初始模型，得到多个第一碳储量预测模型，其中，每一第一碳储量预测模型与每一时间节点对应；每组第一训练样本数据集包括：地层参数样本集及某一时间节点对应的地层二氧化碳捕获量标签数据集；

二氧化碳捕获量获取单元502，用于获取多个第一碳储量预测模型的输出数据，得到对应多个时间节点的地层二氧化碳捕获量；

第二训练样本数据集确定单元503，用于根据所述地层参数样本集及对应多个时间节点的二氧化碳捕获量，确定第二训练样本数据集；

初始预测值获取单元504，用于将所述第二训练样本数据集输入至基于LSTM的第二初始模型，得到第二初始模型输出的地层二氧化碳捕获量初始预测值；

预测模型构建单元505，用于根据第二初始模型的损失函数、二氧化碳捕获量初始预测值及第二训练样本数据，迭代训练第二初始模型，构建得到二氧化碳捕获量预测模型。

作为本文的一个实施例，还可以参考如图6所示为本实施例二氧化碳捕获量预测模型构建装置的具体结构示意图。

作为本文的一个实施例，所述第一训练单元501进一步包括：

第一训练样本数据集获取模块5011，用于获取第一训练样本数据集；

作为本文的一个实施例，所述第二训练样本数据集确定单元503进一步包括：

初始训练样本集确定模块5031，用于将地层参数样本集与多个时间节点的地层二氧化碳捕获量进行笛卡尔积，得到初始训练样本集。

图7所示为本文实施例一种二氧化碳捕获量预测模型的示意图。其中，二氧化碳捕获量预测模型基于XGBoost算法及LSTM算法构建得到。首先，将地层参数样本集及某一时间节点对应的地层二氧化碳捕获量标签数据输入至多个XGBoost模型，得到各XGBoost模型的输出数据，并将XGBoost模型的输出数据及地层参数样本数据集，作为基于LSTM的模型的输入，由LSTM进行处理。经过多个LSTM的输出，得到最终隐藏状态。各个LSTM的输出经过多层感知机MLP，最终输出得到下一时间节点的地层二氧化碳捕获量。

如图8所示，为本文实施例提供的一种计算机设备。本申请所述二氧化碳捕获量预测模型构建及预测方法可以应用于所述计算机设备。所述计算机设备802可以包括一个或多个处理器804，诸如一个或多个中央处理单元(CPU)，每个处理单元可以实现一个或多个硬件线程。计算机设备802还可以包括任何存储器806，其用于存储诸如代码、设置、数据等之类的任何种类的信息。非限制性的，比如，存储器806可以包括以下任一项或多种组合：任何类型的RAM，任何类型的ROM，闪存设备，硬盘，光盘等。更一般地，任何存储器都可以使用任何技术来存储信息。进一步地，任何存储器可以提供信息的易失性或非易失性保留。进一步地，任何存储器可以表示计算机设备802的固定或可移除部件。在一种情况下，当处理器804执行被存储在任何存储器或存储器的组合中的相关联的指令时，计算机设备802可以执行相关联指令的任一操作。计算机设备802还包括用于与任何存储器交互的一个或多个驱动机构808，诸如硬盘驱动机构、光盘驱动机构等。

计算机设备802还可以包括输入/输出模块810(I/O)，其用于接收各种输入(经由输入设备812)和用于提供各种输出(经由输出设备814)。一个具体输出机构可以包括呈现设备816和相关联的图形用户接口(GUI)818。在其他实施例中，还可以不包括输入/输出模块810(I/O)、输入设备812以及输出设备814，仅作为网络中的一台计算机设备。计算机设备802还可以包括一个或多个网络接口820，其用于经由一个或多个通信链路822与其他设备交换数据。一个或多个通信总线824将上文所描述的部件耦合在一起。

通信链路822可以以任何方式实现，例如，通过局域网、广域网(例如，因特网)、点对点连接等、或其任何组合。通信链路822可以包括由任何协议或协议组合支配的硬连线链路、无线链路、路由器、网关功能、名称服务器等的任何组合。

对应于图1至图4中的方法，本文实施例还提供了一种计算机可读存储介质，该计算机可读存储介质上存储有计算机程序，该计算机程序被处理器运行时执行上述方法的步骤。

本文实施例还提供一种计算机可读指令，其中当处理器执行所述指令时，其中的程序使得处理器执行如图1至图4所示的方法。

应理解，在本文的各种实施例中，上述各过程的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本文实施例的实施过程构成任何限定。

还应理解，在本文实施例中，术语“和/或”仅仅是一种描述关联对象的关联关系，表示可以存在三种关系。例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。另外，本文中字符“/”，一般表示前后关联对象是一种“或”的关系。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、计算机软件或者二者的结合来实现，为了清楚地说明硬件和软件的可互换性，在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本文的范围。

所属领域的技术人员可以清楚地了解到，为了描述的方便和简洁，上述描述的系统、装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本文所提供的几个实施例中，应该理解到，所揭露的系统、装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另外，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口、装置或单元的间接耦合或通信连接，也可以是电的，机械的或其它的形式连接。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本文实施例方案的目的。

另外，在本文各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本文的技术方案本质上或者说对现有技术做出贡献的部分，或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本文各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

本文中应用了具体实施例对本文的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本文的方法及其核心思想；同时，对于本领域的一般技术人员，依据本文的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本文的限制。

Claims

1.一种二氧化碳捕获量预测模型构建方法，其特征在于，所述二氧化碳捕获量预测模型基于XGBoost算法及LSTM训练得到，所述方法包括：

利用至少一组第一训练样本数据集，训练基于XGBoost算法的第一初始模型，得到多个第一碳储量预测模型，其中，每一第一碳储量预测模型与每一时间节点对应；每组第一训练样本数据集包括：地层参数样本集及某一时间节点对应的地层二氧化碳捕获量标签数据集；

获取多个第一碳储量预测模型的输出数据，得到对应多个时间节点的地层二氧化碳捕获量；

根据所述地层参数样本集及对应多个时间节点的地层二氧化碳捕获量，确定第二训练样本数据集；

将所述第二训练样本数据集输入至基于LSTM的第二初始模型，得到第二初始模型输出的地层二氧化碳捕获量初始预测值；

根据第二初始模型的损失函数、地层二氧化碳捕获量初始预测值及第二训练样本数据，迭代训练第二初始模型，构建得到二氧化碳捕获量预测模型。

2.根据权利要求1所述的二氧化碳捕获量预测模型构建方法，其特征在于，确定第二训练样本数据集包括：

将地层参数样本集与多个时间节点的地层二氧化碳捕获量进行笛卡尔积，得到初始训练样本集；

对初始训练样本集进行n阶滞后操作，并进行分层抽样，得到第二训练样本集。

3.根据权利要求2所述的二氧化碳捕获量预测模型构建方法，其特征在于，所述确定第二训练样本集进一步包括：

从第二训练样本集中确定0至m-1时间节点的地层二氧化碳捕获量，作为训练样本特征参数，将时间节点m的地层二氧化碳捕获量作为模型训练的标签数据。

4.根据权利要求3所述的二氧化碳捕获量预测模型构建方法，其特征在于，所述方法包括：

利用如下公式确定第二初始模型输出的地层二氧化碳捕获量初始预测值：

P_L＝LSTM_forward(X_p,C_p-1,H_p-1)，其中，P_L为第二初始模型中当前时刻隐藏层的输出，LSTM_forward为LSTM细胞前向计算方法，C_p-1和H_p-1分别为前一时刻隐藏层的细胞状态和隐藏状态，X_p为当前时刻的地层二氧化碳捕获量及当前地层参数；

将地层二氧化碳捕获量初始预测值通过全连接神经网络进行处理，得到下一时间节点的地层二氧化碳捕获量。

5.根据权利要求1所述的二氧化碳捕获量预测模型构建方法，其特征在于，根据第二初始模型的损失函数、地层二氧化碳捕获量初始预测值及第二训练样本数据，迭代训练第二初始模型包括：

利用如下公式确定第二初始模型的损失函数：

其中，p′_i表示地层二氧化碳捕获量的第i个预测值，y_i表示t时间节点的地层二氧化碳捕获量，k代表时间节点与地层参数个数的乘积。

6.根据权利要求1所述的二氧化碳捕获量预测模型构建方法，其特征在于，所述地层参数样本集包括各地层的温度、压强、岩石占比。

7.一种二氧化碳捕获量智能预测方法，其特征在于，所述方法包括：

获取多个地层的真实地层参数集；

将所述多个地层的真实地层参数集输入至根据权利要求1-6任意一项所述的二氧化碳捕获量预测模型构建方法构建的二氧化碳捕获量预测模型，得到预测的未来时间节点的地层二氧化碳捕获量。

8.一种二氧化碳捕获量预测模型构建装置，其特征在于，所述装置包括：

第一训练单元，用于利用至少一组第一训练样本数据集，训练基于XGBoost算法的第一初始模型，得到多个第一碳储量预测模型，其中，每一第一碳储量预测模型与每一时间节点对应；每组第一训练样本数据集包括：地层参数样本集及某一时间节点对应的地层二氧化碳捕获量标签数据集；

二氧化碳捕获量获取单元，用于获取多个第一碳储量预测模型的输出数据，得到对应多个时间节点的地层二氧化碳捕获量；

第二训练样本数据集确定单元，用于根据所述地层参数样本集及对应多个时间节点的地层二氧化碳捕获量，确定第二训练样本数据集；

初始预测值获取单元，用于将所述第二训练样本数据集输入至基于LSTM的第二初始模型，得到第二初始模型输出的地层二氧化碳捕获量初始预测值；

预测模型构建单元，用于根据第二初始模型的损失函数、地层二氧化碳捕获量初始预测值及第二训练样本数据，迭代训练第二初始模型，构建得到二氧化碳捕获量预测模型。

9.一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至7任意一项所述的方法。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时实现权利要求1至7任意一项所述的方法。