CN116882323B

CN116882323B - 一种考虑时序性及细分任务的自适应代理策略优化方法

Info

Publication number: CN116882323B
Application number: CN202311145958.5A
Authority: CN
Inventors: 张黎明; 蒋佩吟; 张凯; 严侠; 程丞; 蔺靖淇
Original assignee: China University of Petroleum East China
Current assignee: China University of Petroleum East China
Priority date: 2023-09-07
Filing date: 2023-09-07
Publication date: 2023-11-28
Anticipated expiration: 2043-09-07
Also published as: CN116882323A

Abstract

本发明公开了一种考虑时序性及细分任务的自适应代理策略优化方法，属于油藏生产优化技术领域，包括如下步骤：获取油田地质信息和油田生产信息，构建二氧化碳水气交替注入组分模型；依据油田生产实际，确定二氧化碳水气交替注入策略优化的决策变量和约束条件，生成约束下的初始决策变量种群；建立油田收益目标函数，确定需代理的细分任务；构建考虑时序性及细分任务的自适应多代理；基于建立的细分任务数据库，调整多代理模型参数；对目标函数执行差分进化算法，扩充数据库；给定代理更新条件，优选阶段性代理；优选结束后，保存二氧化碳水气交替注入的最佳策略方案及最佳策略方案的数模结果。本发明能输出最佳开发策略及油田收益，提高优化效率。

Description

一种考虑时序性及细分任务的自适应代理策略优化方法

技术领域

本发明属于油藏生产优化技术领域，具体涉及一种考虑时序性及细分任务的自适应代理策略优化方法。

背景技术

CO₂-WAG是一种用于二氧化碳水气交替注入强化驱油技术，通过交替注入水和二氧化碳可以解决气体覆盖和通道问题。碳捕获、利用和储存（CCUS）指出，二氧化碳强化驱油比直接储存二氧化碳具有更大的经济效益。CO₂-WAG的策略优化研究是油藏工程设计研究问题之一，常采用代理模型加优化算法解决。代理模型技术依赖于油藏模型的复杂性、解空间维度和数据集质量，常用于辅助优化研究。使用代理模型评估优化算法生成种群，可减少调用数值模拟次数，缩短数模时间，起到加速寻优的作用。因此，代理模型精确度直接影响评估准确性，进而影响算法寻优能力。

传统代理模型多针对简单的黑油油藏，代理复杂问题油藏效果差、精度低。针对CO₂-WAG这一复杂的组分油藏模型，传统代理模型存在代理精度低，辅助优化算法能力弱的缺点。

发明内容

为了解决上述问题，本发明提出了一种考虑时序性及细分任务的自适应代理策略优化方法，用于优化二氧化碳水气交替注入的周期和制度；该方法融合分而代理、时序性代理和阶段性代理，增加代理模型的学习信息，增强代理模型的灵活性和鲁棒性的同时提高了算法优化效率，提高复杂油藏代理模型精度，实现高效准确寻找最优CO₂-WAG策略方案。

本发明的技术方案如下：

一种考虑时序性及细分任务的自适应代理策略优化方法，包括如下步骤：

步骤1、获取油田地质信息，利用油藏地质建模软件建立油田的地质模型，获取油田生产信息，利用数值模拟软件建立油藏流体高压物性、油气水相渗曲线，结合地质建模和数值模拟建立二氧化碳水气交替注入组分模型；

步骤2、依据油田生产实际，确定二氧化碳水气交替注入策略优化的决策变量和约束条件，生成约束下的初始决策变量种群；

步骤3、建立油田收益目标函数，确定需代理的细分任务；

步骤4、构建考虑时序性及细分任务的自适应多代理；

步骤5、基于建立的细分任务数据库，调整多代理模型参数；

步骤6、对目标函数执行差分进化算法，扩充细分任务数据库；

步骤7、给定代理更新条件，优选阶段性代理；

步骤8、优选结束后，保存二氧化碳水气交替注入的最佳策略方案及最佳策略方案的数模结果。

进一步地，步骤2的具体过程如下：

步骤2.1、依据油田生产状况，确定注水、注气上下限，设置注水、注气周期；二氧化碳水气交替注入策略优化的决策变量包括时间序列的注采制度和强约束注采周期，每口生产井的优化决策变量包括注水、注气的速率和周期，每口注入井的优化决策变量为产液量或井底流压，决策变量的维度为，具体计算公式如下：

(1)；

式中，为周期循环次数的序号，/>为周期循环总次数；/>为注入井数量；/>为生产井数量；

二氧化碳水气交替注入策略优化的决策变量的约束条件表示为：

(2)；

(3)；

(4)；

(5)；

(6)；

或 /> (7)；

式中，为注入井注气周期，/>为注入井注水周期，/>为油田总生产周期；/>为注入井注水速率，/>为注水速率的下界，/>为注水速率的上界；/>为注入井注气速率，/>为注气速率的下界，/>为注气速率的上界；/>为周期下界；/>为周期上界；/>为生产井井底压力，/>为生产井井底压力的下界，/>为生产井井底压力的上界；/>为生产井产液量，/>为生产井产液量的下界，/>为生产井产液量的上界；

步骤2.2、确定初始决策变量种群大小，基于拉丁超立方采样生成满足约束条件的二氧化碳水气交替注入策略优化的决策变量样本。

进一步地，步骤3的具体过程如下：

步骤3.1、将二氧化碳埋存视为潜在收益，构建的油田收益表达式如下：

(8)；

其中，为油田收益；/>为油藏生产状态；/>为油藏生产时间；/>为时间步序号，/>为时间步数；/>为时间步长；/>为第/>个时间步原油产量；/>为每桶原油收益；/>为第/>个时间步二氧化碳注入量；/>为单位体积二氧化碳注入潜在收益；/>为第/>个时间步二氧化碳产出量；/>为单位体积二氧化碳处理成本；/>为第/>个时间步油田注水量；/>为每桶注水成本；/>为第/>个时间步油田产水量；/>为每桶产出水处理成本；/>为第/>个时间步累计生产时间；/>为资产折现率；/>为生产井数；/>为注入井数；/>为钻生产井成本；为钻注入井成本；

步骤3.2、根据油田收益组成，将油田收益划分为累计产油量模块、累计二氧化碳注入量模块、累计二氧化碳产出量模块、累计产水量模块和累计注水量模块共五个模块，针对五个模块分别生成需要代理学习的五个细分任务。

进一步地，步骤4具体包括建立考虑时序性的细分任务数据库、清洗数据样本和调用数值模拟软件；

建立考虑时序性的细分任务数据库的过程为：首先，设步骤2.2确定的初始决策变量种群为，其中/>为初始种群中包含的决策变量总数，/>为决策变量，/>为初始种群中第/>个决策变量；然后，基于步骤1建立的二氧化碳水气交替注入组分模型开展数值模拟，获取细分任务的时间序列矩阵，其中/>为任务总数量，/>的维度为/>，表示/>个种群任务/>的开发全周期序列数据，展开得，定义，表示任务/>第/>个决策变量/>对应的时间序列，/>为任务/>第/>个时间步对应的目标值；最后，划分不同任务的数据库，/>为任务/>的数据库，；

清洗数据样本的过程为：删除重复、缺失、异常的数据样本；

调用数值模拟软件的过程为：首先，将某一样本的注采制度按照格式要求写入制度文件，将优化周期按照要求写入周期文件；然后，调用组分模拟器加载模型，完成当前样本的数值模拟，获得当前样本的时间序列数据；最后，读取当前细分任务对应的时间序列数据，并将数据添加至当前细分任务的数据库。

进一步地，步骤5的具体过程如下：

步骤5.1、筛选多代理模型，选择决策树、随机森林、线性回归、支持向量机和梯度提升回归5种代理模型；

步骤5.2、设置代理模型可调节参数，划分多任务数据库为训练集和测试集，开展多代理参数调整实验；

步骤5.3、评估代理模型性能。

进一步地，步骤5.1中，决策树代理模型的公式为：

(9)；

(10)；

(11)；

式中，为决策变量/>对数据库/>的信息增益；/>为数据库/>的信息熵；/>为决策变量/>给定条件下的条件熵；/>为样本种类总数；/>为数据库中第/>类样本所占比例；/>为决策变量/>给定条件下第/>个分支节点样本数；/>为决策变量/>给定条件下第/>个分支节点处第/>类样本所占比例；

随机森林代理模型对数据进行有放回抽样来生成多个决策树，并将多个决策树的预测结果进行平均来得出最终的预测结果；

线性回归代理模型的公式为：

(12)；

(13)；

(14)；

式中，为样本/>的预测值；/>为样本数量；/>为决策变量的维度；/>为样本/>的第/>个决策变量的权重；/>为样本/>的第/>个决策变量；/>为截距；/>为权重；/>为回归问题常用的均方误差；/>为第/>个样本的预测值；/>为第/>个样本的真实值；/>为优化器，使用梯度下降算法；

支持向量机代理模型公式为：

(16)；

式中，为样本/>决策函数的输出；/>为样本数量；/>表示每个支持向量的权重；为第/>个样本的真实值；/>为高斯核函数的值，表示两个不同的输入样本/>和/>之间的相似度；/>为截距；

梯度提升回归代理模型包括初始化模型、迭代更新模型和最终模型；首先，初始化模型：

(17)；

式中，为样本/>的初始输出；/>为样本数量；/>为损失函数；/>为第/>个样本的真实值；/>为第/>个样本的预测值；/>为取最小值计算；

然后，依次计算负梯度、最佳拟合值，根据最佳拟合值更新模型；计算公式如下：

(18)；

(19)；

(20)；

式中，为当前循环迭代次数；/>为第/>个样本在第/>次循环的负梯度；/>为当前模型对于样本/>的预测值；/>为前/>次循环的模型预测值；/>为当前模型预测值；/>为第/>次循环损失函数对预测值的梯度；/>为第/>次循环计算的最佳拟合值；/>为最佳拟合值的候选值；/>为前/>次循环的模型对第/>个样本的预测值；/>为第/>次循环后训练的决策树回归模型对第/>个样本的预测值；为第/>次循环后模型的预测值；/>为第/>次循环后训练的决策树回归模型对输入样本/>的预测值；

最后，得到最终的梯度提升回归模型：

(21)；

式中，为最终模型对样本/>的输出；/>为循环迭代次数。

进一步地，步骤5.2中，决策树模型可调节参数包括：节点分裂所需的最小样本数、树的最大深度、叶节点所需的最小样本数；随机森林代理模型可调节参数包括：决策树的数量、决策树分裂时的评估标准、决策树的最大深度、一个节点在分裂之前所需的最小样本数、一个叶子节点所需的最小样本数；线性回归代理模型可调节参数包括：是否计算截距项、是否对特征进行归一化、是否在拟合过程中复制特征矩阵、在拟合和预测过程中要使用的CPU数量、是否要求系数为正；支持向量机代理模型可调节的参数包括：正则化参数、内核类型、核系数、多项式内核的阶数、求解器的最大迭代次数；梯度提升回归代理模型可调节的参数包括：最大迭代次数、学习率、每棵树中的最大叶节点数、每棵树的最大深度、指定损失函数。

进一步地，步骤5.3中，使用决策树、随机森林、线性回归、支持向量机和梯度提升回归共5个代理模型，针对每个细分任务，计算第个代理模型的综合决定系数/>，选择各细分任务基于当前数据库综合决定系数/>最高的代理模型，作为下一阶段该任务的代理模型，对每一细分任务，通过如下公式计算综合决定系数：

(22)；

式中，为二氧化碳水气交替注入策略优化的综合决定系数，/>为决策变量，/>为真实时间序列数据，/>为代理模型预测的时间序列数据，/>为代理模型真实时间序列数据的平均值；/>为样本时间序列数据拟合精度的决定系数/>的权重；/>为累计数据拟合精度的决定系数/>的权重；/>为数据样本数量；/>为时间步数；/>为样本/>第/>个时间步的预测值；/>为样本/>第/>个时间步的真实值；/>为样本/>第/>个时间步真实值的平均值；/>为样本/>第/>个时间步的预测值；/>为样本/>第/>个时间步的真实值；/>为样本/>第/>个时间步真实值的平均值。

进一步地，步骤6的具体过程如下：

步骤6.1、在第次寻优迭代中，从种群中随机选择最优个体/>和2个不同个体/>、/>，生成变异个体/>：

(23)；

式中，为缩放因子；

步骤6.2、对步骤6.1变异生成的种群进行交叉操作，获取交叉后种群：

(24)；

(25)；

式中，为交叉概率因子；/>为目标个体/>对应的变异个体，表示样本/>的变异值；/>为取随机数；/>是/>的目标函数值；/>为当前种群中最优个体的目标函数值；/>为当前种群中最差个体的目标函数值；/>是当前种群目标函数值的平均值；/>为交叉概率因子下限；/>为交叉概率因子上限；

步骤6.3、根据种群个体的目标函数值，从目标个体中选择最优进行数值模拟，并将数据添加到当前细分任务的数据库/>，更新细分任务数据库，循环进化直至迭代次数达到预定值：

(26)；

式中，为第/>次寻优迭代的第/>个样本；/>为第/>次寻优迭代的交叉后种群中第/>个样本；/>为第/>次寻优迭代的第/>个样本；/>为/>的目标函数值；/>为/>的目标函数值。

进一步地，步骤7的具体过程如下：

步骤7.1、定义最大迭代次数为，代理更新条件为/>，根据研究问题确定任务总数量/>，整合初始数据库，构建细分任务数据库；基于进化算法生成子代种群，使用当前阶段代理评估，择优数模，将数据添加到对应细分任务的数据库/>，并判断是否更新代理；每次代理更新均会比上次更新增加/>个数据样本，基于给定的最大迭代次数，则整个优化过程代理模型更新次数/>满足：

(27)；

式中，为向下取整计算；

步骤7.2、阶段性代理模型优选的标准与步骤5.3一致，基于当前数据库综合决定系数优选各任务下一阶段的代理模型，直至达到最大迭代次数/>，结束寻优。

本发明所带来的有益技术效果如下。

本发明的时序性代理，通过对历史时序数据建模，充分考虑滞后效应，更准确捕捉任务数据的时间动态变化和内在规律，提高预测精度，更准确的辅助进化算法寻优，降低数值模拟成本，利用有限的时间资源得到最优策略方案；

本发明的细分任务代理，对复杂的单一任务依据物理意义细分成多个任务，通过对细分任务的历史时序数据进行建模和分析，可以更准确地捕捉数据的变化规律，提高代理模型精度的同时增强代理问题的可解释性和鲁棒性，降低代理问题的复杂程度，兼有提高代理系统可扩展性和实现不同物理意义细分任务精确代理的优势；

本发明的阶段性自适应多代理，根据不同阶段任务数据库特点自动选择合适的代理模型，可以节约计算资源，避免模型在某个特定阶段过于复杂导致过拟合，提高模型解释性的同时增强整个系统的鲁棒性。且随着细分任务数据不断积累，阶段性自适应多代理还能更好地适应数据库的动态变化，不仅充分利用动态数据库的特点，提高了模型的灵活性，还增强了本发明方法的泛化能力，使本发明具有很大的价值和应用前景。

附图说明

图1为本发明一种考虑时序性及细分任务的自适应代理策略优化方法流程图。

图2为本发明基于综合决定系数优选细分任务代理模型的流程图。

图3为本发明阶段性自适应细分任务代理模型的流程图。

图4为本发明实施例寻优过程中油田效益随评估次数的变化曲线。

图5为本发明实施例寻优过程中真实评估数据样本。

图6为实施例最佳策略方案的累计产油量随生产时间变化曲线。

图7为实施例最佳策略方案的累计CO₂储量随生产时间变化曲线。

具体实施方式

下面结合附图以及具体实施方式对本发明作进一步详细说明：

本发明方法可优化二氧化碳水气交替注入的周期和制度，将收益细分为多个任务，构建研究区的油藏组分模型，基于带约束的拉丁超立方采样得到初始种群，利用油藏数值模拟器构建各任务的时间序列数据库，使用多个回归模型分别代理并计算时间序列曲线及终点的决定系数和/>，协调/>、/>比例获得综合决定系数/>，选取各细分任务/>最高的代理模型，构建阶段性自适应高精度代理模型，基于差分进化算法获取进化种群并使用细分任务代理筛选出最优样本，调用油藏数值模拟器计算优选样本并更新数据库，循环优化至预设次数，输出最佳开发策略及油田收益，提高优化效率。

如图1所示，本发明提出了一种考虑时序性及细分任务的自适应代理策略优化方法，用于优化二氧化碳水气交替注入的周期和制度，具体包括如下步骤：

步骤1、获取油田地质信息，利用油藏地质建模软件Petrol建立油田的地质模型，获取油田生产信息，利用数值模拟软件Eclipse建立油藏流体高压物性、油气水相渗曲线，结合地质建模和数值模拟建立二氧化碳水气交替注入组分模型。

步骤2、依据油田生产实际，确定二氧化碳水气交替注入策略优化的决策变量和约束条件，生成约束下的初始决策变量种群。具体过程如下：

步骤2.1、依据油田生产状况，确定合理的注水、注气上下限并设置符合逻辑的注水、注气周期；二氧化碳水气交替注入策略优化的决策变量包括时间序列的注采制度和强约束注采周期，每口生产井的优化决策变量包括注水、注气的速率和周期，每口注入井的优化决策变量为产液量或井底流压，决策变量的维度为，具体计算公式如下：

(1)；

二氧化碳水气交替注入策略优化的决策变量的约束条件可表示为：

(2)；

(3)；

(4)；

(5)；

(6)；

或 /> (7)；

式中，为注入井注气周期，/>为注入井注水周期，/>为油田总生产周期；/>为注入井注水速率，/>为注水速率的下界，/>为注水速率的上界；/>为注入井注气速率，/>为注气速率的下界，/>为注气速率的上界；/>为周期下界；/>为周期上界；/>为生产井井底压力，/>为生产井井底压力的下界，/>为生产井井底压力的上界；/>为生产井产液量，/>为生产井产液量的下界，/>为生产井产液量的上界。

步骤3、建立油田收益目标函数，确定需代理的细分任务。具体过程如下：

步骤3.1、将二氧化碳埋存视为潜在收益，分析得到油田收益的组成包括通过数值模拟计算的累计产油量、累计二氧化碳注入量、累计二氧化碳产出量、累计产水量和累计注水量，考虑开发成本后，油田收益的表达式如下：

(8)；

其中，为油田收益，USD；/>为油藏生产状态；/>为油藏生产时间；/>为时间步序号，/>为时间步数；/>为时间步长，D；/>为第/>个时间步原油产量，STB/D；/>为每桶原油收益，USD/STB；/>为第/>个时间步二氧化碳注入量，m³/D；/>为单位体积二氧化碳注入潜在收益，USD/m³；/>为第/>个时间步二氧化碳产出量，m³/D；/>为单位体积二氧化碳处理成本，USD/m³；/>为第/>个时间步油田注水量，STB/D；/>为每桶注水成本，USD/STB；/>为第/>个时间步油田产水量，STB/D；/>为每桶产出水处理成本，USD/STB；/>为第/>个时间步累计生产时间，年；/>为资产折现率；/>为生产井数，口；/>为注入井数，口；/>为钻生产井成本，USD/口；/>为钻注入井成本，USD/口。

步骤4、构建考虑时序性及细分任务的自适应多代理；具体包括建立考虑时序性的细分任务数据库、清洗数据样本和调用数值模拟软件。

建立考虑时序性的细分任务数据库的过程为：首先，设步骤2.2确定的初始决策变量种群为，其中/>为初始种群中包含的决策变量总数，/>为初始种群中第/>个决策变量；然后，基于步骤1建立的二氧化碳水气交替注入组分模型开展数值模拟，获取细分任务的时间序列矩阵/>，其中/>为任务总数量，/>的维度为/>，/>表示/>个种群任务/>的开发全周期序列数据，展开得，定义，表示任务/>第/>个决策变量/>对应的时间序列，/>为任务/>第/>个时间步对应的目标值。最后，划分不同任务的数据库，/>为任务/>的数据库，。

清洗数据样本的过程为：删除重复、缺失、异常的数据样本，提高数据质量。清洗数据样本部分通过编写Python清洗数据样本代码。

构建考虑时序性及细分任务的自适应多代理的过程使用Python编写考虑时序性及细分任务的自适应代理差分进化的优化代码。

步骤5、基于建立的细分任务数据库，调整多代理模型参数。具体过程如下：

步骤5.1、筛选多代理模型，选择决策树、随机森林、线性回归、支持向量机和梯度提升回归5种代理模型。

其中，决策树代理模型的划分依据是二氧化碳水气交替注入策略优化的决策变量对数据库/>的信息增益/>，满足公式：

(9)；

(10)；

(11)；

式中，为数据库/>的信息熵；/>为决策变量/>给定条件下的条件熵；/>为样本种类总数；/>为数据库/>中第/>类样本所占比例/>为决策变量/>给定条件下第/>个分支节点样本数；/>为决策变量/>给定条件下第/>个分支节点处第/>类样本所占比例。

随机森林代理模型属于集成学习模型，随机森林是一种Bagging算法的改进版本，通过对数据进行有放回抽样来生成多个决策树，并将这些决策树的预测结果进行平均来得出最终的预测结果。

线性回归算法模型、损失函数和优化器是线性回归代理模型的重要组成部分，公式为：

(12)；

(13)；

(14)；

式中，为样本/>的预测值；/>为样本数量；/>为决策变量的维度；/>为样本/>的第/>个决策变量的权重；/>为样本/>的第/>个决策变量；/>为截距；/>为权重；/>为回归问题常用的均方误差；/>为第/>个样本的预测值；/>为第/>个样本的真实值；/>为优化器，使用梯度下降算法。

常用的核函数包括线性核函数、多项式核函数、高斯核函数和sigmoid核函数，本发明支持向量机代理模型选用高斯核函数，对应公式为：

(15)；

式中，为高斯核函数的值，表示两个不同的输入样本/>和/>之间的相似度；表示欧氏距离，即/>和/>之间的距离；/>是高斯核函数的带宽参数，控制核函数的扩散程度。加入核函数后，对应的支持向量机代理模型/>可表示为：

(16)；

式中，为样本/>决策函数的输出；/>为样本数量；/>为支持向量的拉格朗日乘子，表示每个支持向量的权重；/>为第/>个样本的真实值；/>为高斯核函数的值，表示两个不同的输入样本/>和/>之间的相似度；/>为截距。

梯度提升回归代理模型，算法的实现包括初始化模型、迭代更新模型和最终模型，其中最关键的是迭代更新模型。

首先，按照如下公式初始化模型：

(17)；

式中，为样本/>的初始输出；/>为样本数量；/>为损失函数，使用平方损失；为第/>个样本的真实值；/>为第/>个样本的预测值；/>为取最小值计算；

(18)；/>

(19)；

(20)；

式中，为当前循环迭代次数；/>为第/>个样本在第/>次循环的负梯度；/>为当前模型对于样本/>的预测值；/>为前/>次循环的模型预测值；/>为当前模型预测值；/>为第/>次循环损失函数对预测值的梯度；/>为第/>次循环计算的最佳拟合值，用于调整新模型的影响程度；/>为最佳拟合值的候选值；/>为前/>次循环的模型对第/>个样本的预测值；/>为第/>次循环后训练的决策树回归模型对第/>个样本的预测值；/>为第/>次循环后模型的预测值；/>为第/>次循环后训练的决策树回归模型对输入样本/>的预测值；

最后，得到最终的梯度提升回归模型：

(21)；

式中，为最终模型对样本/>的输出；/>为循环迭代次数。

步骤5.2、设置代理模型可调节参数，划分多任务数据库为训练集和测试集，开展多代理参数调整实验。代理模型包括决策树、随机森林、线性回归、支持向量机和梯度提升回归5种，筛选出的可调整参数如下：

决策树代理模型可调节参数包括：节点分裂所需的最小样本数min_samples_split，默认为2；树的最大深度max_depth，默认为None，表示树会一直生长，直到每个叶节点的样本数小于min_samples_split；叶节点所需的最小样本数min_samples_leaf，默认为1。

随机森林代理模型可调节参数包括：决策树的数量n_estimators，默认为100；决策树分裂时的评估标准criterion，包括“mse”和“mae”，默认为“mse”；决策树的最大深度max_depth，默认为None，即不限制最大深度；一个节点在分裂之前所需的最小样本数min_samples_split，默认为2；一个叶子节点所需的最小样本数min_samples_leaf，默认为1。

线性回归代理模型可调节参数包括：指定是否计算截距项fit_intercept，默认为True；指定是否对特征进行归一化normalize，默认为False；指定是否在拟合过程中复制特征矩阵copy_X，默认为True；指定在拟合和预测过程中要使用的CPU数量n_jobs，默认为1；指定是否要求系数为正positive，默认为False。

支持向量机代理模型可调节的参数包括：正则化参数C，默认为1.0，较小的C值将导致较大的间隔，但可能会导致一些数据点被错误预测，较大的C值将导致较小的间隔，但训练成本会增加；指定支持向量机的内核类型kernel，可选的内核有“linear”、“poly”、“rbf”和“sigmoid”；指定径向基RBF、多项式和sigmoid内核的核系数gamma，默认为“scale”，可选的值包括“scale”和“auto”；指定多项式内核的阶数degree，默认为3，只有在kernel=“poly”时才会被使用；指定求解器的最大迭代次数max_iter，默认为-1，表示没有最大迭代次数限制。

梯度提升回归代理模型可调节的参数包括：最大迭代次数max_iter，默认为100；学习率learning_rate，默认为0.1，较小的学习率可以减缓训练过程，但需要更多的基础估计器来达到相同的拟合效果；每棵树中的最大叶节点数max_leaf_nodes，默认为31；每棵树的最大深度max_depth，默认为None，表示树的深度不受限制；指定损失函数loss，可选的损失函数包括“least_squares”和“least_absolute_deviation”，默认为“least_absolute_deviation”。

步骤5.3、评估代理模型性能，评估代理模型的指标包括表示样本时间序列数据拟合精度的决定系数和表示最终累计数据拟合精度的决定系数/>，协调/>和/>比例，获得综合决定系数/>。本发明基于综合决定系数/>优选细分任务代理模型的流程如图2所示，本质上依物理意义细分任务，比如图2中共包含任务1至任务/>的/>个细分任务，包含代理1至代理/>的/>个代理模型。针对任务1代理，计算/>个代理模型综合决定系数/>至/>，依次类推，针对任务/>代理，计算/>个代理模型综合决定系数/>至/>。使用决策树模型、随机森林模型、线性回归模型、支持向量机模型和梯度提升回归模型，共5个代理模型，代理模型数量/>，根据研究问题可确定任务总数量/>。针对每个细分任务，计算第/>个代理模型的综合决定系数/>，/>，选择各细分任务基于当前数据库综合决定系数/>最高的代理模型，作为下一阶段该任务的代理模型，共记选择/>个代理模型（），对每一细分任务，都可通过如下公式计算综合决定系数：

(22)；

式中，为二氧化碳水气交替注入策略优化的综合决定系数，/>为决策变量，/>为真实时间序列数据，/>为代理模型预测的时间序列数据，/>为代理模型真实时间序列数据的平均值；/>为样本时间序列数据拟合精度的决定系数/>的权重，取值范围为0.0~1.0；/>为累计数据拟合精度的决定系数/>的权重，取值范围为0.0~1.0，且/>；为数据样本数量；/>为时间步数，表示油田总的开发周期；/>为样本/>第/>个时间步的预测值；/>为样本/>第/>个时间步的真实值；/>为样本/>第/>个时间步真实值的平均值；为样本/>第/>个时间步的预测值；/>为样本/>第/>个时间步的真实值；/>为样本/>第/>个时间步真实值的平均值。

步骤6、基于给定的初始种群大小、优化种群大小、迭代次数和目标函数执行差分进化算法，扩充细分任务数据库。具体过程如下：

步骤6.1、变异操作，在第次寻优迭代中，从种群中随机选择最优个体/>和2个不同个体/>、/>，生成变异个体/>：/>

(23)；

式中，为缩放因子；

步骤6.2、交叉操作，对步骤6.1变异生成的种群进行交叉操作，获取交叉后种群：

(24)；

(25)；

式中，为交叉概率因子；/>为目标个体/>对应的变异个体，表示样本/>的变异值；/>为取随机数；/>是/>的目标函数值；/>为当前种群中最优个体的目标函数值；/>为当前种群中最差个体的目标函数值；/>是当前种群目标函数值的平均值；/>为交叉概率因子下限；/>为交叉概率因子上限。

步骤6.3、选择操作，根据种群个体的目标函数值，从目标个体中选择最优进行数值模拟，并将数据添加到当前细分任务的数据库/>，更新细分任务数据库，循环进化直至迭代次数达到预定值：

(26)；

步骤7、给定代理更新条件，优选阶段性代理，本发明阶段性自适应细分任务代理模型的流程如图3所示。

步骤7.1、定义最大迭代次数，代理更新条件/>，根据研究问题确定任务总数量/>，整合初始数据库，构建细分任务数据库，共构建了/>个任务数据库。基于进化算法生成子代种群，使用当前阶段代理评估，择优数模，将数据添加到对应细分任务的数据库/>，然后迭代次数加1，并判断迭代次数是否能整除代理更新条件/>，满足时，更新代理1至代理/>的/>个代理。每次代理更新均会比上次更新增加/>个数据样本，基于给定的最大迭代次数/>，则整个优化过程代理模型更新次数/>满足：

(27)；

式中，为向下取整计算；

为了证明本发明的可行性，给出如下实施例。本实施例研究区块为23*58*3的网格构成，使用Eclipse 300构建组分模型，模拟油气水三相驱动，该模型有6口注入井，中间1口水平井定压生产，计划生产1800天。水气交替周期、注水速率、注气速率和生产井井底压力均为CO₂-WAG策略优化变量，其中水气交替以月为单位，上限为12，下限为1；单井注水速率的上限和下限分别为200m³和500m³；单井注气速率的上限和下限分别为100m³和300m³；生产井井底压力的上限和下限分别为280bar和320bar。

本实施例结合本发明的考虑时序性及细分任务的自适应代理二氧化碳水气交替注入策略优化方法，算法最大迭代次数，阶段性优选代理的条件/>，具体步骤如下：

步骤1、获取油田地质信息，利用油藏地质建模软件Petrol建立油田的地质模型，获取油田生产信息，利用数值模拟软件Eclipse 300建立油藏流体高压物性、油气水相渗曲线，结合地质建模和数值模拟建立二氧化碳水气交替注入组分模型。

步骤2、首先，依据油田生产状况，确定二氧化碳水气交替注入策略优化的决策变量包括时间序列的注采制度和强约束注采周期，每口井注水速率的上界/>和下界分别为500m³和200m³，注气速率/>的上界/>和下界/>分别为300m³和100m³，注气周期/>和注水周期/>的上界/>和下界/>分别为12个月和1个月；生产井井底压力/>的上界/>和下界/>分别为320bar和280bar；为更好地阐述发明创新，周期循环总次数/>设置为1；决策变量的维度/>为25。然后，确定初始决策变量种群/>大小为110，基于拉丁超立方采样生成满足约束条件的二氧化碳水气交替注入策略优化的决策变量样本。

步骤3、首先，设置注入井数为6；生产井数/>为1；时间步数/>设置为60，时间步长/>=30天，则生产周期为1800天；每桶原油收益/>设置为7，单位体积二氧化碳注入潜在收益/>为0.001，单位体积二氧化碳处理成本/>为0.001，每桶注水成本/>为0.8，每桶产出水处理成本/>为2。然后，根据公式(8)计算油田收益。

步骤4、首先，设置任务数量，/>，则获取的初始决策变量种群/>，获取的细分任务的时间序列矩阵，/>的维度为/>，展开得。然后，编写Python清洗数据样本代码。最后，将某一样本的注采制度按照格式要求写入制度文件，将优化周期按照要求写入周期文件；调用组分模拟器Eclipse 300加载模型，完成当前样本的数值模拟，获得该样本的时间序列数据；读取多个子任务对应的时间序列数据，并将数据添加至对应任务的数据库。

步骤5、按照公式(9)至公式(21)建立决策树、随机森林、线性回归、支持向量机和梯度提升回归5种代理模型；经过调整后，各模型参数如下，未定义的参数均取默认值：

决策树模型的参数min_samples_split=2，max_depth=10，in_samples_leaf=3；

随机森林模型的参数n_estimators=500，max_depth=10，min_samples_split=3；

线性回归模型的参数fit_intercept=True，n_jobs=1，positive=False；

支持向量机模型的参数C=1.0，kernel=’rbf’，gamma=’auto’，max_iter=-1；

梯度提升回归模型的参数max_iter=1000，learning_rate=0.01，max_leaf_nodes=31，max_depth=5，loss=’least_absolute_deviation’。

然后，评估代理模型性能，设置样本时间序列数据拟合的决定系数的权重/>为0.2；累计数据拟合的决定系数/>的权重/>为0.8；时间步数/>为60；

步骤6、基于给定的初始种群大小、优化种群大小、迭代次数和目标函数执行差分进化算法，扩充细分任务数据库。算法的交叉概率因子下限/>为0.33；交叉概率因子上限/>为0.67。

步骤7、首先，整合多任务数据库，设置代理更新满足条件为100，最大迭代次数为1000，则整个优化过程代理模型更新次数/>为10次。然后，基于当前数据库综合决定系数/>优选各任务下一阶段的代理模型。

步骤8、基于当前阶段代理评估算法生成的子代种群，保留最优子代进行数值模拟，记录并添加至数据库，直至寻优结束，保存二氧化碳水气交替注入的最佳策略方案及最佳策略方案的数模结果。

为了验证本发明的效果和优势，对比了使用常规在线更新单代理模型寻优（简称为单任务代理寻优）、本发明方法寻优在研究区找寻二氧化碳水气交替注入最佳策略方案（简称为细分任务代理寻优）的结果。两种方案均使用差分进化算法，循环迭代1000次，使用带约束条件的拉丁超立方采样。寻优结束后，油田效益随迭代次数的变化曲线如图4所示，从图4可以看出，考虑时序性及细分任务的自适应代理寻优能力比单任务代理寻优强，考虑时序性及细分任务的自适应代理结合差分进化算法寻得的二氧化碳水气交替注入最佳策略方案效益比单任务代理结合差分进化算法有大幅度提升。真实评估样本效益随迭代次数的变化曲线如图5所示，从图5可以看出，基于考虑时序性及细分任务的自适应代理方法的种群质量高于单任务代理的种群质量，使多任务代理更加精确，加速寻优。

图6为实施例最佳策略方案的累计产油量随生产时间变化曲线，从图6中可以看出，基于考虑时序性及细分任务的自适应代理的最佳策略方案累产油量明显较多，为油田带来的实际经济效益高；图7为实施例最佳策略方案的累计CO₂埋存量随生产时间变化曲线，从图7中可以看出，基于考虑时序性及细分任务的自适应代理的最佳策略方案累计CO₂埋存量明显较多，为油田带来的潜在经济效益高。综合图6和图7可以发现，本发明一种考虑时序性及细分任务的自适应代理二氧化碳水气交替注入策略优化方法寻优能力强，找寻的最佳策略方案最大化油田经济效益的同时也最大化CO₂埋存量。

实施例寻优过程中累计产油量阶段性优选代理结果如表1所示，具体如下：

表1 实施例寻优过程中累计产油量阶段性优选代理结果；

。

从表1可以看出，累产油代理的综合决定系数后期较高，说明代理模型的稳健性随数据的增多而增强，多选用梯度提升回归模型代理。

实施例寻优过程中累计CO₂储量阶段性优选代理结果如表2所示，具体如下：

表2实施例寻优过程中累计CO₂储量阶段性优选代理结果；

。

从表2可以看出，累计CO₂储量代理的综合决定系数为0.99，代理多选用支持向量机和线性回归模型，说明在累计CO₂储量代理问题上支持向量机和线性回归模型表现较佳。

当然，上述说明并非是对本发明的限制，本发明也并不仅限于上述举例，本技术领域的技术人员在本发明的实质范围内所做出的变化、改型、添加或替换，也应属于本发明的保护范围。

Claims

1.一种考虑时序性及细分任务的自适应代理策略优化方法，其特征在于，包括如下步骤：

步骤3、建立油田收益目标函数，确定需代理的细分任务；

步骤4、构建考虑时序性及细分任务的自适应多代理；

所述步骤4具体包括建立考虑时序性的细分任务数据库、清洗数据样本和调用数值模拟软件；

建立考虑时序性的细分任务数据库的过程为：首先，设步骤2.2确定的初始决策变量种群为，其中/>为初始种群中包含的决策变量总数，/>为决策变量，/>为初始种群中第/>个决策变量；然后，基于步骤1建立的二氧化碳水气交替注入组分模型开展数值模拟，获取细分任务的时间序列矩阵，其中/>为任务总数量，/>的维度为/>，/>表示/>个种群任务/>的开发全周期序列数据，展开得，定义，表示任务/>第/>个决策变量/>对应的时间序列，/>为任务/>第/>个时间步对应的目标值；最后，划分不同任务的数据库，/>为任务/>的数据库，；

调用数值模拟软件的过程为：首先，将某一样本的注采制度按照格式要求写入制度文件，将优化周期按照要求写入周期文件；然后，调用组分模拟器加载模型，完成当前样本的数值模拟，获得当前样本的时间序列数据；最后，读取当前细分任务对应的时间序列数据，并将数据添加至当前细分任务的数据库；

步骤5、基于建立的细分任务数据库，调整多代理模型参数；

步骤7、给定代理更新条件，优选阶段性代理；

步骤8、优选结束后，保存二氧化碳水气交替注入的最佳策略方案及最佳策略方案的数值模拟结果。

2.根据权利要求1所述考虑时序性及细分任务的自适应代理策略优化方法，其特征在于，所述步骤2的具体过程如下：

(1)；

式中，为周期循环次数的序号，/>为周期循环总次数；/>为注入井数量；为生产井数量；

(2)；

(3)；

(4)；

(5)；

(6)；

或 /> (7)；

式中，为注入井注气周期，/>为注入井注水周期，/>为油田总生产周期；/>为注入井注水速率，/>为注水速率的下界，/>为注水速率的上界；/>为注入井注气速率，/>为注气速率的下界，/>为注气速率的上界；/>为周期下界；/>为周期上界；/>为生产井井底压力，/>为生产井井底压力的下界，/>为生产井井底压力的上界；为生产井产液量，/>为生产井产液量的下界，/>为生产井产液量的上界；

3.根据权利要求2所述考虑时序性及细分任务的自适应代理策略优化方法，其特征在于，所述步骤3的具体过程如下：

(8)；

其中，为油田收益；/>为油藏生产状态；/>为油藏生产时间；/>为时间步序号，/>为时间步数；/>为时间步长；/>为第/>个时间步原油产量；/>为每桶原油收益；/>为第/>个时间步二氧化碳注入量；/>为单位体积二氧化碳注入潜在收益；/>为第/>个时间步二氧化碳产出量；/>为单位体积二氧化碳处理成本；/>为第/>个时间步油田注水量；/>为每桶注水成本；/>为第/>个时间步油田产水量；/>为每桶产出水处理成本；/>为第/>个时间步累计生产时间；/>为资产折现率；/>为生产井数；/>为注入井数；/>为钻生产井成本；/>为钻注入井成本；

4.根据权利要求1所述考虑时序性及细分任务的自适应代理策略优化方法，其特征在于，所述步骤5的具体过程如下：

步骤5.3、评估代理模型性能。

5.根据权利要求4所述考虑时序性及细分任务的自适应代理策略优化方法，其特征在于，所述步骤5.1中，决策树代理模型的公式为：

(9)；

(10)；

(11)；

式中，为决策变量/>对数据库/>的信息增益；/>为数据库/>的信息熵；/>为决策变量/>给定条件下的条件熵；/>为样本种类总数；/>为数据库/>中第/>类样本所占比例；/>为决策变量/>给定条件下第/>个分支节点样本数；/>为决策变量/>给定条件下第/>个分支节点处第/>类样本所占比例；

线性回归代理模型的公式为：

(12)；

(13)；

(14)；

支持向量机代理模型公式为：

(16)；

(17)；

(18)；

(19)；

(20)；

最后，得到最终的梯度提升回归模型：

(21)；

式中，为最终模型对样本/>的输出；/>为循环迭代次数。

6.根据权利要求4所述考虑时序性及细分任务的自适应代理策略优化方法，其特征在于，所述步骤5.2中，决策树模型可调节参数包括：节点分裂所需的最小样本数、树的最大深度、叶节点所需的最小样本数；随机森林代理模型可调节参数包括：决策树的数量、决策树分裂时的评估标准、决策树的最大深度、一个节点在分裂之前所需的最小样本数、一个叶子节点所需的最小样本数；线性回归代理模型可调节参数包括：是否计算截距项、是否对特征进行归一化、是否在拟合过程中复制特征矩阵、在拟合和预测过程中要使用的CPU数量、是否要求系数为正；支持向量机代理模型可调节的参数包括：正则化参数、内核类型、核系数、多项式内核的阶数、求解器的最大迭代次数；梯度提升回归代理模型可调节的参数包括：最大迭代次数、学习率、每棵树中的最大叶节点数、每棵树的最大深度、指定损失函数。

7.根据权利要求4所述考虑时序性及细分任务的自适应代理策略优化方法，其特征在于，所述步骤5.3中，使用决策树、随机森林、线性回归、支持向量机和梯度提升回归共5个代理模型，针对每个细分任务，计算第个代理模型的综合决定系数/>，选择各细分任务基于当前数据库综合决定系数/>最高的代理模型，作为下一阶段该任务的代理模型，对每一细分任务，通过如下公式计算综合决定系数：

(22)；

式中，为二氧化碳水气交替注入策略优化的综合决定系数，/>为决策变量，/>为真实时间序列数据，/>为代理模型预测的时间序列数据，/>为代理模型真实时间序列数据的平均值；/>为样本时间序列数据拟合精度的决定系数/>的权重；/>为累计数据拟合精度的决定系数/>的权重；/>为数据样本数量；/>为时间步数；/>为样本/>第/>个时间步的预测值；/>为样本/>第/>个时间步的真实值；/>为样本/>第/>个时间步真实值的平均值；/>为样本/>第/>个时间步的预测值；/>为样本/>第/>个时间步的真实值；/>为样本/>第个时间步真实值的平均值。

8.根据权利要求1所述考虑时序性及细分任务的自适应代理策略优化方法，其特征在于，所述步骤6的具体过程如下：

步骤6.1、在第次寻优迭代中，从种群中随机选择最优个体/>和2个不同个体、/>，生成变异个体/>：

(23)；

式中，为缩放因子；

(24)；

(25)；

式中，为交叉概率因子；/>为目标个体/>对应的变异个体，表示样本/>的变异值；/>为取随机数；/>是/>的目标函数值；/>为当前种群中最优个体的目标函数值；/>为当前种群中最差个体的目标函数值；/>是当前种群目标函数值的平均值；为交叉概率因子下限；/>为交叉概率因子上限；

(26)；

9.根据权利要求1所述考虑时序性及细分任务的自适应代理策略优化方法，其特征在于，所述步骤7的具体过程如下：

步骤7.1、定义最大迭代次数为，代理更新条件为/>，根据研究问题确定任务总数量/>，整合初始数据库，构建细分任务数据库；基于进化算法生成子代种群，使用当前阶段代理评估，择优进行数值模拟，将数据添加到对应细分任务的数据库/>，并判断是否更新代理；每次代理更新均会比上次更新增加/>个数据样本，基于给定的最大迭代次数，则整个优化过程代理模型更新次数/>满足：

(27)；

式中，为向下取整计算；