CN109740661B - 一种基于模糊评估的油井动液面自适应预测方法 - Google Patents

一种基于模糊评估的油井动液面自适应预测方法 Download PDF

Info

Publication number
CN109740661B
CN109740661B CN201811621143.9A CN201811621143A CN109740661B CN 109740661 B CN109740661 B CN 109740661B CN 201811621143 A CN201811621143 A CN 201811621143A CN 109740661 B CN109740661 B CN 109740661B
Authority
CN
China
Prior art keywords
model
data
production
working condition
clustering
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811621143.9A
Other languages
English (en)
Other versions
CN109740661A (zh
Inventor
王通
段泽文
罗真伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenyang University of Technology
Original Assignee
Shenyang University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenyang University of Technology filed Critical Shenyang University of Technology
Priority to CN201811621143.9A priority Critical patent/CN109740661B/zh
Publication of CN109740661A publication Critical patent/CN109740661A/zh
Application granted granted Critical
Publication of CN109740661B publication Critical patent/CN109740661B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供一种基于模糊评估的油井动液面自适应预测方法,涉及石油生产技术领域。首先根据油田的生产工况建立多工况预测模型,对不同工况采用强化学习的算法建立子模型,根据其不同的生产特性匹配最佳的工况输出模型;动态确定集成子模型的加权权重;利用在线测量输出模型的动液面数据和泵效参数建立关于产液量波动变化趋势推理的模糊专家系统,对工况模型进行评估;利用模糊评估新的模型性能评价指标在线自适应更新建模,通过判断产液量波动变化趋势与实际值的拟合优度来动态更新模型。本发明提供的基于模糊评估的油井动液面自适应预测方法,有效改善了单一模型算法在进行动液面预测时存在的预测精度不高、泛化性差以及容易发生过拟合等不足。

Description

一种基于模糊评估的油井动液面自适应预测方法
技术领域
本发明涉及石油生产技术领域,尤其涉及一种基于模糊评估的油井动液面自适应预测方法。
背景技术
在油田的实际生产过程中,为了实现产液量的最大化,抽油机需要根据油井不断变化的参数来调整其抽油频率,使其达到合理的工作状态。油井的动液面是生产过程中油井油套管环形空间的液面深度,它直观地反映了油层的供液能力与井下的供排关系,是指导生产措施合理调整与反映抽油机工作状态的一个重要参数。目前,大多数油井动液面的测量依然采用传统的人工测量方法,例如回声测量、压力测量法和浮筒法等,传统的人工测量存在着误差大,效率低、实时性差等缺点,不能满足现场的生产要求。近年来,随着数据驱动软测量技术的发展应用,用于动液面软测量的智能算法也逐渐增多,由于油田生产是一个工况动态多变的复杂生产过程,采用常规的单一模型算法存在着生产过程特性匹配不佳、预测精度不高等缺点,且由历史数据建立的全局模型训练时间长,泛化能力弱,易出现过拟合现象等。随着生产的动态运行,在生产工况生改变后模型会逐渐面临预测精度下降的问题,需要对模型进行更新,提高模型的动态性能。传统根据误差指标评价更新的方法,由于动液面数据获取的时滞性,不能对模型进行及时有效的校正,不能满足油田的实际生产需求。
发明内容
本发明要解决的技术问题是针对上述现有技术的不足,提供一种基于模糊评估的油井动液面自适应预测方法,实现对油井动液面进行预测。
为解决上述技术问题,本发明所采取的技术方案是:一种基于模糊评估的油井动液面自适应预测方法,包括离线建模、在线测量和自适应更新三部分,具体包括以下步骤:
步骤1:采集油田生产过程不同的生产参数历史数据及对应的动液面数据,记为X0∈Rn×m,n为样本个数,m为生产参数个数;并对采集的数据X0进行预处理,去除离群点异常数据得到特征参数X′0;所述生产参数作为动液面数据的辅助变量,包括油井的套压、流量、泵效和电流;
步骤2:根据不同工生产参数数据特性,利用工况聚类算法将样本数据划分为Cst个工况,具体方法为:
步骤2.1:结合生产运行的数据变化特性选取窗口长度H对特征参数X′0沿采样时间轴方向进行等距切割,将n个样本分割为K个窗口样本数据子集并作为聚类单元,n=H×K+d0≤d<H;按采样时间间隔对窗口样本数据子集进行排序,记为X′0,u∈RH×m,u=1,2,…,K;初始化设置聚类算法的聚类中心以及不同聚类中心之间的相似性阈值;
步骤2.2:计算不同窗口样本之间的相似因子
Figure BDA0001926882280000026
根据相似度最大原则对聚类单元按不同聚类中心进行聚类,具体方法为:
步骤2.2.1:从K个聚类单元中均匀选取C0个单元作为初始聚类中心Wi,j,j=1,2,…,C0
步骤2.2.2:计算每个聚类单元X′0,u与各聚类中心的相似因子
Figure BDA0001926882280000021
并根据相似度最大原则对K个聚类单元进行对应聚类中心的归类;
步骤2.2.3:若两个聚类中心的相似因子
Figure BDA0001926882280000022
大于预定的阈值
Figure BDA0001926882280000023
则将两个聚类结果进行合并,并剔除其中的一个聚类中心,更新子类数量Cst,否则,执行步骤2.3;
步骤2.2.4:根据聚类单元对不同子类的隶属关系重新计算新的聚类中心wi+1,j′,j′=1,2,…,Cst
步骤2.3:判断两次迭代聚类中心的相似因子差值是否小于一个阈值δ,若是,则完成样本数据的划分,执行步骤3,否则,重新执行步骤2.2.2对样本数据进行聚类划分;
步骤3:根据生产参数工况划分结果,构成不同工况的样本历史数据(Xs,ys),其中,Xs为辅助变量,ys为动液面数据,s=1,2,…,n,n为历史数据样本个数,并为历史数据(Xs,ys)分配初始权重中间值
Figure BDA0001926882280000024
将历史数据分为模型训练集TRt和测试集TEt,其中,TRt+TEt=n,t为弱学习机个数;
步骤4:设置弱学习机个数T、样本预测误差阈值e0和误差超限率指标阈值ε0
步骤5:计算历史数据(Xs,ys)的权重
Figure BDA0001926882280000025
并依据历史数据权重对训练集样本进行排序;
步骤6:利用黑洞优化算法对最小二乘支持向量机模型参数进行寻优赋值,并将排序后的训练样本进行模型训练,模型训练完成后得到子模型HtXs→ys,利用测试集及训练集计算子模型的样本预测误差,并计算误差超限率指标εt是否超过阈值ε0,若是,则舍弃该子模型Ht,执行步骤5,否则,计算子模型对应的权重即模型预测水平指标βt,并令t=t+1,计算更新样本权重中间值wt+1(s);
所述子模型的样本预测误差AREt(s)计算方法为:
Figure BDA0001926882280000031
计算误差超限率指标εt,即对于每个样本通过该模型进行测试,将预测误差超过阈值的样本的权重进行累计,如下公式所示:
Figure BDA0001926882280000032
所述模型预测水平指标βt的计算方法为:
Figure BDA0001926882280000033
其中,
Figure BDA0001926882280000034
为模型均方根误差,λ为模型调整因子;
所述更新样本权重中间值采用如下公式计算:
Figure BDA0001926882280000035
步骤7:判断弱学习机即子模型的个数是否达到设置值T,若是,则完成了模型的训练,将所有子模型加权输出得到对应工况的集成模型,否则,执行步骤5;
所述将所有子模型加权输出得到相应工况集成模型如下公式所示:
Figure BDA0001926882280000036
步骤8:针对不同工况样本数据,重复执行步骤4至步骤7,直至完成所有工况集成模型的建立,集成模型个数达到Cst;将所有工况集成模型进行组合,构成多模型预测集φ{·};
步骤9:根据生产参数测试数据进行工况识别,计算当前工况的生产数据特征与各标准工况特征库的灰度关联分析,作为所属对应工况的隶属度,匹配最佳的工况模型;
所述的不同工况的隶属度计算如下公式所示:
Figure BDA0001926882280000037
Figure BDA0001926882280000041
Figure BDA0001926882280000042
其中,γg(v)表示当前生产参数特征与标准工况特征库中第g种工况的隶属度,k=1,2,L,m,m为生产参数中特征变量的个数;vk表示当前生产参数中的第k个特征变量的取值;
Figure BDA0001926882280000043
表示标准工况特征库中第g种工况的第k个特征变量的取值;
Figure BDA0001926882280000044
Figure BDA0001926882280000045
分别表示
Figure BDA0001926882280000046
取值的最小值和最大值;
Figure BDA0001926882280000047
表示特征变量取值
Figure BDA0001926882280000048
的取值范围;Ψ=[0,20]为节域;
步骤10:根据步骤9各工况的隶属度计算结果,选择相应的输出模型进行动液面预测,具体为:当某一工况的隶属度超过阈值θthre时,选择对应的集成模型进行输出;若所有工况对应的隶属度均小于阈值θthre时,则采用多模型的加权融合输出;
具体输出模型的切换方式如下:
Figure BDA0001926882280000049
其中,q+1表示系统当前时刻;
在生产正常运行所处工况稳定时,有隶属度γg(v)大于阈值θthre时,模型切换开关Sq+1=1,采用当前工况对应的集成模型
Figure BDA00019268822800000410
进行输出;在发生工况过渡过程时,所有工况隶属度γ(v)均小于阈值θthre时,Sq+1=0,输出模型切换为所有集成模型的加权融合输出,
Figure BDA00019268822800000411
为子模型的权值
Figure BDA00019268822800000412
步骤11:利用生产参数动液面数据和泵效数据建立关于产液量波动变化趋势推理的模糊专家系统,记为Fcom(·);以模糊评估产液量的波动变化趋势来进行动液面预测模型评估,如下公式所示:
Figure BDA00019268822800000413
其中,usq+1为模糊输出值,
Figure BDA00019268822800000414
为模型预测的动液面波动值,
Figure BDA00019268822800000415
为实际泵效参数的波动值;对usq+1采用重心法进行去模糊化处理,得到预测的产液量波动变化趋势
Figure BDA0001926882280000051
计算预测的产液量波动变化趋势与实际产液量波动变化趋势的拟合程度,利用拟合优度作为模型新的性能评价指标FGOF;设定指标控制限εGOF,计算是否有连续的12个拟合优度指标超过控制限εGOF,若是,则判定当前模型失效,动液面输出故障;执行步骤12,否则,执行步骤16;
所述的拟合优度指标计算如下:
Figure BDA0001926882280000052
其中,N为设定的检查步数,
Figure BDA0001926882280000053
是产液量测量真实值的波动趋势,
Figure BDA0001926882280000054
为产液量预测值的波动趋势,
Figure BDA0001926882280000055
为真实值的期望。
步骤12:在动液面输出预测模型失效后,重新执行步骤9,判断是否发生工况切换,若是,执行步骤10,切换相应输出模型,否则,执行步骤13;
步骤13:根据辅助变量测试数据利用相似度原理在历史数据库中寻找相似的样本数据构成更新子集,部分替换掉原训练集中不相似的样本,构成新的样本训练集(X′s,y′s);
步骤14:利用新的样本训练集(X′s,y′s)对当前工况集成模型进行更新,赋予新的训练集样本权重
Figure BDA0001926882280000056
将新训练样本数据加入到子模型中重新进行训练,执行步骤4到步骤7,直至完成模型更新;
步骤15:对更新后的工况集成模型,再次进行动液面输出预测模型评估,判断产液量预测值波动变化趋势与产液量真实值波动变化趋势的拟合优度指标FGOF是否超过控制限εGOF,若是,执行步骤12,否则,执行步骤16;
步骤16:在油田实际生产过程中,通过实时采集辅助变量生产数据,输入相应工况的集成模型进行油井动液面的预测输出。
采用上述技术方案所产生的有益效果在于:本发明提供的一种基于模糊评估的油井动液面自适应预测方法,能够克服传统方法存在的误差大、实时性差和效率低等问题,有效改善了单一模型算法在进行动液面预测时存在的预测精度不高、泛化性差以及容易发生过拟合等不足;根据油田的生产工况建立多工况预测模型,对不同工况采用强化学习的算法建立子模型,根据其不同的生产特性匹配最佳的工况输出模型,提高模型的预测精度;动态确定集成子模型的加权权重,使输出最大化的减少由于生产波动影响个体样本预测误差大而对模型整体预测精度产生的影响,使得模型的泛化能力显著增强,模型预测输出更具科学性;利用在线测量输出模型的动液面数据和泵效参数建立关于产液量波动变化趋势推理的模糊专家系统,对动液面预测模型进行评估,提高判断当前模型适应度的准确性;利用模糊评估新的模型性能评价指标在线自适应更新建模,通过判断产液量波动变化趋势与实际波动变化趋势的拟合优度来动态更新模型,相比于传统方法能够及时、有效的对模型进行校正;这种新的更新方法,对生产波动的自适应能力强,能够满足油田现场的生产需求。
附图说明
图1为本发明实施例提供的一种基于模糊评估的油井动液面自适应预测方法的自适应更新建模策略图;
图2为本发明实施例提供的基于单个样本传统K-means算法的聚类结果图;
图3为本发明实施例提供的基于窗口分析改进K-means算法的聚类结果图;
图4为本发明实施例提供的对比不同算法模型预测精度的油井动液面预测结果图;
图5为本发明实施例提供的检验不同算法模型泛化能力的油井动液面预测结果图;
图6为本发明实施例提供的产液量波动变化趋势结果图;
图7为本发明实施例提供的动液面预测输出错误结果图;
图8为本发明实施例提供的模型自适应更新后的油井动液面预测结果图。
具体实施方式
下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。
本实施例以某油田采油平台的现场生产历史数据作为样本,采用本发明的基于模糊评估的油井动液面自适应预测方法对该油田的动液面数据进行预测输出。
一种基于模糊评估的油井动液面自适应预测方法,如图1所示,包括离线建模、在线测量和自适应更新三部分,具体包括以下步骤:
步骤1:采集油田生产过程不同的生产参数历史数据及对应的动液面数据,记为X0∈Rn×m,n为样本个数,m为生产参数个数;并对采集的数据X0进行预处理,去除离群点异常数据得到特征参数X′0;所述生产参数作为动液面数据的辅助变量,包括油井的套压、流量、泵效和电流;
步骤2:根据不同工生产参数数据特性,利用工况聚类算法将样本数据划分为Cst个工况,具体方法为:
步骤2.1:结合生产运行的数据变化特性选取窗口长度H对特征参数X′0沿采样时间轴方向进行等距切割,将n个样本分割为K个窗口样本数据子集并作为聚类单元,n=H×K+d,0≤d<H;按采样时间间隔对窗口样本数据子集进行排序,记为X′0,u∈RH×m,u=1,2,…,K;初始化设置聚类算法的聚类中心以及不同聚类中心之间的相似性阈值;
步骤2.2:计算不同窗口样本之间的相似因子
Figure BDA0001926882280000071
根据相似度最大原则对聚类单元按不同聚类中心进行聚类,具体方法为:
步骤2.2.1:从K个聚类单元中均匀选取C0个单元作为初始聚类中心w0,j,j=1,2,…,C0;为了保证能够选取到合适的聚类中心,一般C0的取值为K/3~K/2。
步骤2.2.2:计算每个聚类单元X′0,u与各聚类中心的相似因子
Figure BDA0001926882280000072
根据相似度最大原则对K个聚类单元进行对应聚类中心的归类;
聚类单元与聚类中心的相似因子
Figure BDA0001926882280000073
的计算方法为:对数据集Xl,Xh∈RH×m进行PCA分解,取前p个主元向量进行计算,如下公式所示:
Figure BDA0001926882280000074
其中,
Figure BDA0001926882280000075
Figure BDA0001926882280000076
分别为不同批次l、h数据集对应主元矩阵第a个和第b个主元向量的特征值所对应的特征值;θab表示这两个主成分分量之间的夹角;
Figure BDA0001926882280000077
的取值范围为[0,1]。
步骤2.2.3:若两个聚类中心的相似因子
Figure BDA0001926882280000078
大于预定的阈值
Figure BDA0001926882280000079
则将两个聚类结果进行合并,并剔除其中的一个聚类中心,更新子类数量Cst,否则,执行步骤2.3;
步骤2.2.4:根据聚类单元对不同子类的隶属关系重新计算新的聚类中心wi+1,j,j′=1,2,…,Cst
步骤2.3:判断两次迭代聚类中心的相似因子差值是否小于一个阈值δ,若是,则完成样本数据的划分,执行步骤3,否则,重新执行步骤2.2.2对样本数据进行聚类划分;
步骤3:根据生产参数工况划分结果,构成不同工况的样本历史数据(Xs,ys),其中,Xs为辅助变量,ys为动液面数据,s=1,2,…,n,n为历史数据样本个数,并为历史数据(Xs,ys)分配初始权重中间值
Figure BDA00019268822800000710
将历史数据分为模型训练集TRt和测试集TEt,其中,TRt+TEt=n,t为弱学习机个数;
步骤4:设置弱学习机个数T、样本预测误差阈值e0和误差超限率指标阈值ε0
步骤5:计算历史数据(Xs,ys)的权重
Figure BDA0001926882280000081
并依据历史数据权重对训练集样本进行排序;
步骤6:利用黑洞优化算法对最小二乘支持向量机(Least Squares SupportVector Machine,即LSSVM)模型参数进行寻优赋值,并将排序后的训练样本进行模型训练,模型训练完成后得到子模型Ht:Xs→ys,利用测试集及训练集计算子模型的样本预测误差,并计算误差超限率指标εt是否超过阈值ε0,若是,则舍弃该子模型Ht,执行步骤5,否则,计算子模型对应的权重即模型预测水平指标βt,并令t=t+1,计算更新样本权重中间值wt+1(s);
所述子模型的样本预测误差AREt(S)计算方法为:
Figure BDA0001926882280000082
计算误差超限率指标εt,即对于每个样本通过该模型进行测试,将预测误差超过阈值的样本的权重进行累计,如下公式所示:
Figure BDA0001926882280000083
所述模型预测水平指标βt的计算方法为:
Figure BDA0001926882280000084
其中,
Figure BDA0001926882280000085
为模型均方根误差,λ为模型调整因子;
所述更新样本权重中间值采用如下公式计算:
Figure BDA0001926882280000086
步骤7:判断弱学习机即子模型的个数是否达到设置值T,若是,则完成了模型的训练,将所有子模型加权输出得到对应工况的集成模型,否则,执行步骤5;
所述将所有子模型加权输出得到相应工况集成模型如下公式所示:
Figure BDA0001926882280000087
步骤8:针对不同工况样本数据,重复执行步骤4至步骤7,直至完成所有工况集成模型的建立,集成模型个数达到Cst;将所有工况集成模型进行组合,构成多模型预测集φ{·};
步骤9:根据生产参数测试数据进行工况识别,计算当前工况的生产数据特征与各标准工况特征库的灰度关联分析(Grey CorrelationAnalysis,即GCA),作为所属对应工况的隶属度,匹配最佳的工况模型;
所述的不同工况的隶属度计算如下公式所示:
Figure BDA0001926882280000091
Figure BDA0001926882280000092
Figure BDA0001926882280000093
其中,γg(v)表示当前生产参数特征与标准工况特征库中第g种工况的隶属度,k=1,2,L,m,m为生产参数中特征变量的个数;vk表示当前生产参数中第k个特征变量的取值;
Figure BDA0001926882280000094
表示标准工况特征库中第g种工况的第k个特征变量的取值;
Figure BDA0001926882280000095
Figure BDA0001926882280000096
分别表示
Figure BDA0001926882280000097
取值的最小值和最大值;
Figure BDA0001926882280000098
表示特征变量取值
Figure BDA0001926882280000099
的取值范围;Ψ=[0,20]为节域;
步骤10:根据步骤9各工况的隶属度计算结果,选择相应的输出模型进行动液面预测,具体为:当某一工况的隶属度超过阈值θthre时,选择对应的集成模型进行输出;若所有工况对应的隶属度均小于阈值θthre时,则采用多模型的加权融合输出;
具体输出模型的切换方式如下:
Figure BDA00019268822800000910
其中,q+1表示系统当前时刻;
在生产正常运行所处工况稳定时,有隶属度γg(v)大于阈值θthre时,模型切换开关Sq+1=1,采用当前工况对应的集成模型
Figure BDA00019268822800000911
进行输出;在发生工况过渡过程时,所有工况隶属度γ(v)均小于阈值θthre时,Sq+1=0,输出模型切换为所有集成模型的加权融合输出,
Figure BDA00019268822800000912
为子模型的权值
Figure BDA0001926882280000101
步骤11:利用生产参数动液面(Dynamic Liquid Level,即DLL)和泵效(PumpEfficiency,即PE)数据建立关于产液量波动变化趋势推理的模糊专家系统,记为Fcom(·);以模糊评估产液量的波动变化趋势来进行动液面预测输出模型的评估,如下公式所示:
Figure BDA0001926882280000102
其中,usq+1为模糊输出值,
Figure BDA0001926882280000103
为模型预测的动液面波动值,
Figure BDA0001926882280000104
为实际泵效参数的波动值;对usq+1采用重心法进行去模糊化处理,得到预测的产液量波动变化趋势
Figure BDA0001926882280000105
计算预测的产液量波动变化趋势与实际产液量波动变化趋势的拟合程度,利用拟合优度(Goodness of Fit,即GOF)作为模型新的性能评价指标FGOF;设定指标控制限εGOF,计算是否有连续的12个拟合优度指标超过控制限εGOF,若是,则判定当前模型失效,动液面输出故障;执行步骤12,否则,执行步骤16;
所述的拟合优度指标计算如下:
Figure BDA0001926882280000106
其中,N为设定的检查步数,
Figure BDA0001926882280000107
是产液量测量真实值的波动趋势,
Figure BDA0001926882280000108
为产液量预测值的波动趋势,
Figure BDA0001926882280000109
为真实值的期望。
步骤12:在动液面预测模型失效后,重新执行步骤9,判断是否发生工况切换,若是,执行步骤10,切换相应输出模型,否则,执行步骤13;
步骤13:根据辅助变量测试数据利用相似度原理在历史数据库中寻找相似的样本数据构成更新子集,部分替换掉原训练集中不相似的样本,构成新的样本训练集(X′s,y′s);
步骤14:利用新的样本训练集(X′s,y′s)对当前工况集成模型进行更新,赋予新的训练集样本权重
Figure BDA00019268822800001010
将新训练样本数据加入到子模型中重新进行训练,执行步骤4到步骤7,直至完成模型更新;
步骤15:对更新后的工况集成模型,再次进行动液面预测模型评估,判断产液量预测值波动变化趋势与产液量真实值波动变化趋势的拟合优度指标FGOF是否超过控制限εGOF,若是,执行步骤12,否则,执行步骤16;
步骤16:在油田实际生产过程中,通过实时采集辅助变量生产数据,输入相应工况的集成模型进行油井动液面的预测输出。
本实施例中,整理实际生产过程中的生产参数历史数据和动液面数据,选择生产参数中的油井的套压、电流、泵效和流量作为辅助变量,实现对被测主导变量动液面数据的预测。选取同一井组下不同生产工况的300组历史生产数据,包括地面掺水、正常和“游漏”三种工况,各100组样本数据。第一组实验采用窗口相似因子的聚类算法与传统K-means算法对不同工况样本数据进行聚类划分,验证本发明方法的有效性;第二组实验分别选取上述三种工况各50组样本数据作为训练集,另50组作为测试集,验证集成模型的预测有效性。另外取不同井组相邻工况下的150组样本数据,检验集成模型的泛化性;第三组实验在原工况集成模型上选取生产措施改变前后的200组样本数据,采用模糊评估动态更新集成模型和静态集成模型对动液面进行预测,验证模型对于生产波动的自适应能力。实验中以平均绝对误差(Mean Absolute Error,MAE)和均方根误差(Root Mean Squared Error,RMSE)指标来评价模型的预测水平。
第一组实验选取不同的窗口长度H,根据窗口数据特性采用窗口相似因子聚类算法进行不同工况的聚类划分。选取H=1,即采用传统K-means算法针对单个样本点进行聚类分析,聚类单元为300个,根据聚类结果按样本连续采样时间轴方向进行划分,最终的工况划分结果如图2所示。结合实际生产参数的采样频率,选取H=4,以4小时内的生产数据特征变化来反映实际的生产工况变化情况。将生产数据分割为75个窗口样本,即聚类单元为75个,采用窗口相似因子聚类算法对特征参数进行聚类分析,初始聚类中心C0为25个,相似性阈值设为
Figure BDA0001926882280000111
阈值ε=0.15,最终的工况划分结果如图3所示。采用两种不同聚类算法的工况划分结果对比如表1所示:
表1不同聚类算法的工况划分结果对比分析
Index 地面掺水 正常 “游漏” 正确率/%
传统K-means算法 84 67 85 79.7
窗口相似因子聚类算法 92 88 96 92.6
通过表1及对比图2和图3可知,在同一稳态工况中由于生产波动数据异常带来工况误判的情况得到了明显改善;不同稳态工况之间过渡过程的复杂性显著降低。图3将生产样本数据划分为3类(即k=3),样本数目分别为92,88,和120,分类正确率为94.4%,而传统聚类方法的正确率为81.7%,表明了该方法能够减小单一时刻样本数据在描述工况特性时的不准确性对工况聚类效果的影响。
第二组实验选取上述3种不同工况下的样本数据作为初始子模型的建模样本数据,各工况训练集TRt和测试集TEt均为50组,弱学习机个数为5,样本预测误差阈值e0=0.03,误差超限率指标阈值ε0=0.6。采用LSSVM模型作为训练模型,利用黑洞优化算法(BH)对模型参数进行寻优赋值,提高模型的预测水平。不同于与单一模型算法,多工况集成模型的思想是针对不同工况样本数据分别采用集成学习算法建立相应的工况子模型,最终组合为多模型预测集。集成建模通过迭代训练多个弱学习机,依据不同弱学习机的预测水平对所有的弱学习机进行加权输出得到最后的输出模型。根据预测误差赋予建模样本和弱学习机新的权重,突出预测误差在样本权重及弱学习机权重更新中的作用;增加预测误差大的样本进入训练集的机会,然后下一个模型不断地继续对其训练,增加模型的泛化能力。为验证本发明方法的预测有效性,本实施例将其预测结果与BH-LSSVM单一模型算法和TL-PSO-LSSVM传统多工况模型算法进行对比,结果如图4所示。
为检验改进多工况模型的泛化性,另选取不同井组相近工况下的150组样本数据进行模型动液面的预测输出,其结果为图5所示,最后计算各模型的均方根误差(RMSE)和平均绝对误差(MAE),如表2所示。
表2不同模型算法的动液面预测误差
Figure BDA0001926882280000121
通过对比图4和表2中不同算法模型的预测误差指标可知,在面对油田复杂的生产工况时,BH-LSSVM单一模型算法显然不能有效跟随生产工况的变化而变化,模型的预测误差指标较大。传统TL-PSO-LSSVM算法模型相对于单一模型算法的预测性能有所改善,而本发明方法中的多工况集成模型对比之前的方法,其预测曲线更接近于样本数据的真实曲线,数据之间的误差很小,模型的预测精度更高。其原因是,首先针对不同工况样本数据进行有效划分,使得模型能够最大程度的涵盖不同工况生产过程的特征;对于每个工况样本数据进行集成建模,通过预测误差样本权重的更新排序增加其进入训练集的机会,增加模型的泛化能力;根据不同子模型的预测误差水平进行子模型权重的分配,让预测误差小的模型对应的权重大,预测误差大的模型对应的权重小的方法,对误差整体进行平衡,使得集成模型的预测误差就很小。本实施例中,采用不同算法模型的油井动液面预测结果如图5所示,从图5可知,多工况集成模型无论是在同一井组不同工况或者不同井组的相邻工况下,相较于其他模型算法,其样本的预测误差明显减小,预测精度有效提升,证明模型有较好的泛化能力。
随着实际生产的进行,油井相关参数会跟随井况或生产工艺的变化而改变,导致原有测量模型输出会逐渐恶化。第三组实验,利用同一油井不同生产措施前后的200组数据,进行模型的动态更新验证。采用动液面预测数据与泵效参数模糊推理得到产液量的波动变化趋势如图6所示,相应的拟合优度指标FGOF计算结果如图7所示。由图7可知样本数据点在86处,预测的产液量波动变化趋势与实际趋势发生较大偏离,出现连续的FGOF值超过控制限εGOF,当即判定动液面输出错误,测量模型失效。采用本发明方法中利用生产测试数据完成模型的动态自适应更新,进行工况切换或者从历史数据库中寻找相似数据,建立局部模型更新多工况模型,对比工况发生改变后自适应动态更新模型与传统静态模型的预测性能,预测效果如图8所示,动态模型与静态模型动液面预测的误差指标如表4所示:
表4动态模型与静态模型动液面预测的误差指标
Index MAE RMSE
动态模型 44.5780 57.5668
静态模型 34.6773 46.8661
通过模型的预测误差指标的对比,可以明显的看出,动态集成模型的预测误差指标比静态模型对应的误差指标要小很多,直观的反应出动态更新的有效性。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明权利要求所限定的范围。

Claims (7)

1.一种基于模糊评估的油井动液面自适应预测方法,包括离线建模、在线测量和自适应更新三部分,其特征在于:具体包括以下步骤:
步骤1:采集油田生产过程不同的生产参数历史数据及对应的动液面数据,记为X0∈Rn ×m,n为样本个数,m为生产参数个数;并对采集的数据X0进行预处理,去除离群点异常数据得到特征参数X′0;所述生产参数作为动液面数据的辅助变量,包括油井的套压、流量、泵效和电流;
步骤2:根据不同工生产参数数据特性,利用工况聚类算法将样本数据划分为Cst个工况;
步骤3:根据生产参数工况划分结果,构成不同工况的样本历史数据(Xs,ys),其中,Xs为辅助变量,ys为动液面数据,s=1,2,…,n,n为历史数据样本个数,并为历史数据(Xs,ys)分配初始权重中间值
Figure FDA0001926882270000011
将历史数据分为模型训练集TRt和测试集TEt,其中,TRt+TEt=n,t为弱学习机个数;
步骤4:设置弱学习机个数T、样本预测误差阈值e0和误差超限率指标阈值ε0
步骤5:计算历史数据(Xs,ys)的权重
Figure FDA0001926882270000012
并依据历史数据权重对训练集样本进行排序;
步骤6:利用黑洞优化算法对最小二乘支持向量机模型参数进行寻优赋值,并将排序后的训练样本进行模型训练,模型训练完成后得到子模型Ht:Xs→ys,利用测试集及训练集计算子模型的样本预测误差,并计算误差超限率指标εt是否超过阈值ε0,若是,则舍弃该子模型Ht,执行步骤5,否则,计算子模型对应的权重即模型预测水平指标βt,并令t=t+1,计算更新样本权重中间值wt+1(s);
步骤7:判断弱学习机即子模型的个数是否达到设置值T,若是,则完成了模型的训练,将所有子模型加权输出得到对应工况的集成模型,否则,执行步骤5;
步骤8:针对不同工况样本数据,重复执行步骤4至步骤7,直至完成所有工况集成模型的建立,集成模型个数达到Cst;将所有工况集成模型进行组合,构成多模型预测集φ{·};
步骤9:根据生产参数测试数据进行工况识别,计算当前工况的生产数据特征与各标准工况特征库的灰度关联分析,作为所属对应工况的隶属度,匹配最佳的工况模型;
步骤10:根据步骤9各工况的隶属度计算结果,选择相应的输出模型进行动液面预测,具体为:当某一工况的隶属度超过阈值θthre时,选择对应的集成模型进行输出;若所有工况对应的隶属度均小于阈值θthre时,则采用多模型的加权融合输出;
步骤11:利用生产参数动液面数据和泵效数据建立关于产液量波动变化趋势推理的模糊专家系统,以模糊评估产液量的波动变化趋势来进行动液面预测模型的评估,如下公式所示:
Figure FDA0001926882270000021
其中,Fcom(·)为模糊专家系统,usq+1为模糊输出值,
Figure FDA0001926882270000022
为模型预测的动液面波动值,
Figure FDA0001926882270000023
为实际泵效参数的波动值;对usq+1采用重心法进行去模糊化处理,得到预测的产液量波动变化趋势
Figure FDA0001926882270000024
计算预测的产液量波动变化趋势
Figure FDA0001926882270000025
与实际产液量波动变化趋势的拟合程度,利用拟合优度作为模型新的性能评价指标FGOF;设定指标控制限εGOF,计算是否有连续的12个拟合优度指标超过控制限εGOF,若是,则判定当前模型失效,动液面输出错误;执行步骤12,否则,执行步骤16;
步骤12:在动液面输出错误后,重新执行步骤9,判断是否发生工况切换,若是,执行步骤10,切换相应输出模型,否则,执行步骤13;
步骤13:根据辅助变量测试数据利用相似度原理在历史数据库中寻找相似的样本数据构成更新子集,部分替换掉原训练集中不相似的样本,构成新的样本训练集(Xs′,y′s);
步骤14:利用新的样本训练集(Xs′,y′s)对当前工况集成模型进行更新,赋予新的训练集样本权重
Figure FDA0001926882270000026
将新训练样本数据加入到子模型中重新进行训练,执行步骤4到步骤7,直至完成模型更新;
步骤15:对更新后的工况集成模型,再次进行动液面预测模型评估,判断产液量预测值波动变化趋势与产液量真实值波动变化趋势的拟合优度指标FGOF是否超过控制限εGOF,若是,执行步骤12,否则,执行步骤16;
步骤16:在油田实际生产过程中,通过实时采集辅助变量生产数据,输入相应工况的集成模型进行油井动液面的预测输出。
2.根据权利要求1所述的一种基于模糊评估的油井动液面自适应预测方法,其特征在于:所述步骤2的具体方法为:
步骤2.1:结合生产运行的数据变化特性选取窗口长度H对特征参数X′0沿采样时间轴方向进行等距切割,将n个样本分割为K个窗口样本数据子集并作为聚类单元,n=H×K+d,0≤d<H;按采样时间间隔对窗口样本数据子集进行排序,记为X′0,u∈RH×m,u=1,2,…,K;初始化设置聚类算法的聚类中心以及不同聚类中心之间的相似性阈值;
步骤2.2:计算不同窗口样本之间的相似因子
Figure FDA0001926882270000031
根据相似度最大原则对聚类单元按不同聚类中心进行聚类,具体方法为:
步骤2.2.1:从K个聚类单元中均匀选取C0个单元作为初始聚类中心Wi,j,j=1,2,…,C0
步骤2.2.2:计算每个聚类单元X′0,u与各聚类中心的相似因子
Figure FDA0001926882270000032
并根据相似度最大原则对K个聚类单元进行对应聚类中心的归类;
步骤2.2.3:若两个聚类中心的相似因子
Figure FDA0001926882270000033
大于预定的阈值
Figure FDA0001926882270000034
则将两个聚类结果进行合并,并剔除其中的一个聚类中心,更新子类数量Cst,否则,执行步骤2.3;
步骤2.2.4:根据聚类单元对不同子类的隶属关系重新计算新的聚类中心wi+1,j′,j′=1,2,…,Cst
步骤2.3:判断两次迭代聚类中心的相似因子差值是否小于一个阈值δ,若是,则完成样本数据的划分,执行步骤3,否则,重新执行步骤2.2.2对样本数据进行聚类划分。
3.根据权利要求2所述的一种基于模糊评估的油井动液面自适应预测方法,其特征在于:步骤6所述子模型的样本预测误差AREt(s)计算方法为:
Figure FDA0001926882270000035
计算误差超限率指标εt,即对于每个样本通过该模型进行测试,将预测误差超过阈值的样本的权重进行累计,如下公式所示:
Figure FDA0001926882270000036
所述模型预测水平指标βt的计算方法为:
Figure FDA0001926882270000037
其中,
Figure FDA0001926882270000038
为模型均方根误差,λ为模型调整因子;
所述更新样本权重中间值采用如下公式计算:
Figure FDA0001926882270000041
4.根据权利要求3所述的一种基于模糊评估的油井动液面自适应预测方法,其特征在于:步骤7所述将所有子模型加权输出得到相应工况集成模型,如下公式所示:
Figure FDA0001926882270000042
5.根据权利要求4所述的一种基于模糊评估的油井动液面自适应预测方法,其特征在于:步骤9所述的不同工况的隶属度计算,如下公式所示:
Figure FDA0001926882270000043
Figure FDA0001926882270000044
Figure FDA0001926882270000045
其中,γg(v)表示当前生产参数特征与标准工况特征库中第g种工况的隶属度,k=1,2,L,m,m为生产参数中特征变量的个数;vk表示当前生产参数中的第k个特征变量的取值;vgk表示标准工况特征库中第g种工况的第k个特征变量的取值;vgka和vgkb分别表示vgk取值的最小值和最大值;|vgk|表示特征变量取值vgk的取值范围;Ψ=[0,20]为节域。
6.根据权利要求5所述的一种基于模糊评估的油井动液面自适应预测方法,其特征在于:步骤10具体输出模型的切换方式如下:
Figure FDA0001926882270000046
其中,q+1表示系统当前时刻;
在生产正常运行所处工况稳定时,有隶属度γg(v)大于阈值θthre时,模型切换开关Sq+1=1,采用当前工况对应的集成模型
Figure FDA0001926882270000048
进行输出;在发生工况过渡过程时,所有工况隶属度γ(v)均小于阈值θthre时,Sq+1=0,输出模型切换为所有集成模型的加权融合输出,
Figure FDA0001926882270000047
为子模型的权值
Figure FDA0001926882270000051
7.根据权利要求1所述的一种基于模糊评估的油井动液面自适应预测方法,其特征在于:步骤11所述的拟合优度指标计算如下:
Figure FDA0001926882270000052
其中,N为设定的检查步数,
Figure FDA0001926882270000053
是产液量测量真实值的波动趋势,
Figure FDA0001926882270000054
为产液量预测值的波动趋势,
Figure FDA0001926882270000055
为真实值的期望。
CN201811621143.9A 2018-12-28 2018-12-28 一种基于模糊评估的油井动液面自适应预测方法 Active CN109740661B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811621143.9A CN109740661B (zh) 2018-12-28 2018-12-28 一种基于模糊评估的油井动液面自适应预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811621143.9A CN109740661B (zh) 2018-12-28 2018-12-28 一种基于模糊评估的油井动液面自适应预测方法

Publications (2)

Publication Number Publication Date
CN109740661A CN109740661A (zh) 2019-05-10
CN109740661B true CN109740661B (zh) 2022-10-28

Family

ID=66361697

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811621143.9A Active CN109740661B (zh) 2018-12-28 2018-12-28 一种基于模糊评估的油井动液面自适应预测方法

Country Status (1)

Country Link
CN (1) CN109740661B (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112395730A (zh) * 2019-08-12 2021-02-23 北京国双科技有限公司 一种确定抽油机井的动液面深度参数的方法及装置
CN110954657B (zh) * 2019-12-02 2022-03-25 浙江中烟工业有限责任公司 一种烟叶化学品质的评价方法
CN112943224B (zh) * 2019-12-11 2023-02-07 中国石油化工股份有限公司 稠油井动液面的计算方法
US20210209488A1 (en) * 2019-12-20 2021-07-08 Boe Technology Group Co., Ltd. Inference computing apparatus, model training apparatus, inference computing system
CN111027638B (zh) * 2019-12-23 2022-03-01 燕山大学 一种基于流量的抽油机冲次及动液面信息监测方法及系统
CN113128734A (zh) * 2019-12-30 2021-07-16 北京国双科技有限公司 一种油田产量的预测方法及装置
CN111308337A (zh) * 2020-03-31 2020-06-19 张铭源 一种离心风机入口导叶调节阀门性能评价方法
CN112329619B (zh) * 2020-11-04 2022-06-14 济南博观智能科技有限公司 一种人脸识别方法、装置、电子设备及可读存储介质
CN112699946B (zh) * 2020-12-31 2022-06-21 湖南工商大学 一种针对传感监测数据的异常检测方法、装置及相关设备
CN116303626B (zh) * 2023-05-18 2023-08-04 西南石油大学 一种基于特征优化和在线学习的固井泵压预测方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102146791A (zh) * 2011-05-24 2011-08-10 中国科学院声学研究所 一种油井动液面测量方法及其测量装置
CN106677763A (zh) * 2016-12-29 2017-05-17 沈阳工业大学 一种基于动态集成建模的油井动液面预测方法
CN106777709A (zh) * 2016-12-21 2017-05-31 中国石油大学(华东) 基于地面实测电参数的潜油电泵井动液面计算的方法
CN106869914A (zh) * 2017-03-09 2017-06-20 长江大学 一种油层中渗流与井筒内流动相耦合的产能预测方法
CN108705058A (zh) * 2018-05-22 2018-10-26 大连理工大学 一种基于K-Means聚类预报结晶器漏钢的方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102146791A (zh) * 2011-05-24 2011-08-10 中国科学院声学研究所 一种油井动液面测量方法及其测量装置
CN106777709A (zh) * 2016-12-21 2017-05-31 中国石油大学(华东) 基于地面实测电参数的潜油电泵井动液面计算的方法
CN106677763A (zh) * 2016-12-29 2017-05-17 沈阳工业大学 一种基于动态集成建模的油井动液面预测方法
CN106869914A (zh) * 2017-03-09 2017-06-20 长江大学 一种油层中渗流与井筒内流动相耦合的产能预测方法
CN108705058A (zh) * 2018-05-22 2018-10-26 大连理工大学 一种基于K-Means聚类预报结晶器漏钢的方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
"基于改进AdaBoost的油井动液面自适应集成建模";王通,段泽文,李琨;《电子测量与仪器学报》;20170831;第31卷(第8期);全文 *
"基于软测量的油田动液面测量方法的研究";蒋子健;《中国优秀硕士学位论文全文数据库》;20141031;全文 *

Also Published As

Publication number Publication date
CN109740661A (zh) 2019-05-10

Similar Documents

Publication Publication Date Title
CN109740661B (zh) 一种基于模糊评估的油井动液面自适应预测方法
CN106677763B (zh) 一种基于动态集成建模的油井动液面预测方法
CN108595803B (zh) 基于递归神经网络的页岩气井生产压力预测方法
CN111768000A (zh) 在线自适应微调深度学习的工业过程数据建模方法
CN112557034B (zh) 一种基于pca_cnns的轴承故障诊断方法
CN113297787B (zh) 一种基于迁移学习的航空发动机剩余寿命预测方法
CN110222387B (zh) 基于混合漏积分crj网络的多元钻井时间序列预测方法
CN109635337B (zh) 一种基于块增量随机配置网络的工业过程软测量建模方法
CN110889085A (zh) 基于复杂网络多元在线回归的废水智能监控方法及系统
CN112364560B (zh) 矿山凿岩装备作业工时智能预测方法
CN101863088A (zh) 一种橡胶混炼过程中门尼粘度的预报方法
CN110264079A (zh) 基于CNN算法和Lasso回归模型的热轧产品质量预测方法
CN113780420B (zh) 基于gru-gcn的变压器油中溶解气体浓度预测方法
CN112308298B (zh) 一种面向半导体生产线的多场景性能指标预测方法及系统
CN116520772A (zh) 基于多任务迁移学习的薄板零件数控加工质量预测方法
CN116303626B (zh) 一种基于特征优化和在线学习的固井泵压预测方法
CN112819087A (zh) 一种基于模块化神经网络的出水bod传感器异常检测方法
CN111863153A (zh) 一种基于数据挖掘的废水中悬浮固体总量的预测方法
CN114871000B (zh) 一种浮选加药自适应调控方法
CN116381510A (zh) 一种锂电池剩余寿命的预测方法、系统及存储介质
CN115963420A (zh) 一种电池soh影响因素分析方法
CN115631804A (zh) 基于数据协调的蒸发过程铝酸钠溶液出口浓度预测方法
CN108875961A (zh) 一种基于预界机制的在线加权极限学习机方法
CN115049041A (zh) 基于woa-bp神经网络的湿气管道持液率预测方法
CN114444392A (zh) 动液面预测方法和装置、电子设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant