CN111539616A - 一种基于混合型特征选择的新钻井潜力评价方法 - Google Patents

一种基于混合型特征选择的新钻井潜力评价方法 Download PDF

Info

Publication number
CN111539616A
CN111539616A CN202010315618.2A CN202010315618A CN111539616A CN 111539616 A CN111539616 A CN 111539616A CN 202010315618 A CN202010315618 A CN 202010315618A CN 111539616 A CN111539616 A CN 111539616A
Authority
CN
China
Prior art keywords
historical data
population
oil field
new
evaluation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010315618.2A
Other languages
English (en)
Inventor
李克文
张震涛
肖武
张海燕
张超
雷永秀
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Petroleum and Chemical Corp
Original Assignee
China University of Petroleum East China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China University of Petroleum East China filed Critical China University of Petroleum East China
Priority to CN202010315618.2A priority Critical patent/CN111539616A/zh
Publication of CN111539616A publication Critical patent/CN111539616A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/12Computing arrangements based on biological models using genetic models
    • G06N3/126Evolutionary algorithms, e.g. genetic algorithms or genetic programming
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/02Agriculture; Fishing; Forestry; Mining

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Strategic Management (AREA)
  • Biophysics (AREA)
  • General Physics & Mathematics (AREA)
  • Economics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Marketing (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Tourism & Hospitality (AREA)
  • General Health & Medical Sciences (AREA)
  • General Business, Economics & Management (AREA)
  • Educational Administration (AREA)
  • Development Economics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Game Theory and Decision Science (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Genetics & Genomics (AREA)
  • Physiology (AREA)
  • Agronomy & Crop Science (AREA)
  • Animal Husbandry (AREA)
  • Marine Sciences & Fisheries (AREA)
  • Mining & Mineral Resources (AREA)

Abstract

本发明公开了一种基于混合型特征选择的新钻井潜力评价方法,其特征在于计算历史区间内新投产井数,标记油藏开发历史数据;使用皮尔森积矩相关系数分析油藏开发历史数据中每维特征的相关性影响,计算个体适应度值,采用精英选择机制将适应度值较大的个体与随机选择交叉后产生的个体加入至子种群,保持种群数目稳定,迭代直到得到油田历史数据最优特征组合;采用支持向量回归机挖掘油田历史数据深层信息,实现新钻井潜力评价。本发明通过皮尔森积矩相关系数计算特征的相关性影响,指导油田历史数据最优特征组合的选择,加快特征选择的执行速度;加入精英选择机制,增加油田历史数据特征组合的搜索精度,提高新钻井潜力评价的准确度。

Description

一种基于混合型特征选择的新钻井潜力评价方法
技术领域
本发明属于地球物理勘探领域和人工智能领域,具体涉及一种基于混合型特征选择的新钻井潜力评价方法。
背景技术
分析已开发油田历史的数据信息,对油田的新钻井潜力进行评价,可以指导未来几年的新井投产状况,显著提高老油田的采收率和扩大已探明资源的利用率。与油田新钻井潜力评价相关的历史数据特征繁多,且关系复杂,使用单一属性无法反映新钻井潜力变化规律,多属性之间存在冗余等状况无法直接使用。利用属性分析技术能够有效地分析多种属性之间的相互关系,提取与新钻井潜力评价相关度高的特征组合,进而利用多属性反映新钻井潜力变化规律。
传统新钻井潜力评价一般仅考虑累产油量等几种相关因素进行估量,难以充分考虑影响新钻井潜力评价的诸多因素,在地质状况复杂的区域下,评价的结果存在偏差。随着计算机技术的高速发展,引入特征选择的相关知识分析属性之间的相关性已经越来越普遍,通过对油田开发历史数据进行特征选择,去除与新钻井潜力评价不相关以及冗余的油田开发历史数据特征,保留相关度大的数据特征。在充分考虑影响新钻井潜力评价的诸多因素情况下,采用支持向量回归机方法挖掘油田开发历史数据深层信息,实现新钻井潜力评价。
发明内容
为了克服传统新钻井潜力评价方法无法充分考虑影响因素,导致评价结果存在偏差的问题,本发明提出了一种基于混合型特征选择的新钻井潜力评价方法,通过过滤式选择算子分析油田开发历史数据每维特征对新钻井潜力评价相关性影响,指导遗传算法对油田历史数据中最优特征组合的选择,并加入精英选择机制,增加对相关度大的油田历史数据特征组合的搜索精度,结合支持向量回归机进行深层信息挖掘,实现新钻井潜力评价。
为实现上述目的,本发明技术方案主要包括如下步骤:
从地震数据库、油藏历史数据库等数据源中提取油藏开发历史数据以及区块新投产井数据。根据区块新投产井数据中历史区间内新投产井数,计算区块新钻井潜力评价值。合并油藏历史数据和区块新钻井潜力评价值,预处理后得到带有标记的新钻井潜力初始数据集。
A.采用混合型特征选择方法提取最优特征组合:
(1)利用皮尔森积矩相关系数计算新钻井潜力初始数据集中每维特征对新钻井潜力评价影响的相关程度,记为r值,r值介于-1到1之间,绝对值越大代表相关性越强,根据皮尔森积矩相关系数对每维属性赋予权重,权重大小与相关系数呈正比;
(2)新钻井潜力初始数据集中特征维数为N,设置遗传算法中种群个数为m,变异概率为P,最大迭代次数为t,采用长度为D的染色体X对特征组合进行编码,其中编码为0表示油藏历史数据中对应位置的特征被选中,编码为1表示油藏历史数据中对应位置的特征未被选中。采用轮盘赌方式对加权属性进行抽取,生成初始种群S。将个体X所代表的特征组合作为输入,以深度信念网络的评价结果的平均绝对误差的修正值MAE(X)作为适应度函数F;
(3)计算种群中全部个体的适应度值Fi,将种群中的个体按照其适应度值大小进行降序排序。选择种群中适应度值较大的一半个体构成子种群A,适应度值小的一半个体构成子种群B;
(4)采用单点交叉的方式,对选择出的种群A和种群B进行交叉操作构成种群C,将A和C中的个体混合到一起,生成子代种群S′;
(5)按照变异概率P随机选择种群中个体进行变异操作;
(6)重复步骤(3)-(5),直到满足最大迭代次数或者达到设置的阈值。选取适应度值最大的个体Xmax,Xmax对应的染色体编码值为油田历史数据最优特征组合,按照油田历史数据最优特征组合提取对应特征,得到新钻井潜力最优数据集。
B.采用支持向量回归机评价新钻井潜力
(1)将新钻井潜力最优数据集随机划分训练样本集、测试样本集与验证样本集,划分的比例为7:2:1。
(2)采用支持向量回归机方法挖掘训练样本集数据深层信息,直到效果稳定收敛,以平均绝对误差作为评价标准,在测试样本集上测试支持向量回归机的评价效果;
(3)保留验证样本集,重新划分训练样本集与测试样本集,重复(2)过程。对比多个支持向量回归机评价效果,保留平均绝对误差最小的支持向量回归机,将支持向量回归机处理待评价区块数据,实现新钻井潜力评价。
本发明的有益效果是:过滤式选择算子计算每维特征对新钻井潜力评价相关性影响,加快特征选择的执行速度,并指导油田历史数据最优特征组合的选择;在遗传算法中加入精英选择机制,每次迭代过程中保留一部分适应度值较大的个体,增加对相关度大的油田历史数据特征组合的搜索精度,增加新钻井潜力评价的准确度。
附图说明
图1是本发明的模型结构图
具体实施方式
下面结合图1对本发明作进一步详细的描述:
从地震数据库、油藏历史数据库等数据源中提取油藏开发历史数据以及区块新投产井数据,油藏开发历史数据包括油藏地质参数和开发状况数据。根据区块新投产井数据中历史区间内新投产井数,标记区块新钻井潜力评价值。合并油藏历史数据和区块新钻井潜力评价值,预处理后得到带有标记的新钻井潜力初始数据集。
A.采用混合型特征选择方法提取最优特征组合:
(1)特征相关性预分析
利用皮尔森积矩相关系数计算新钻井潜力初始数据集中特征对新钻井潜力评价影响的相关程度,记为r值,r值介于-1到1之间,绝对值越大代表相关性越强。根据皮尔森积矩相关系数的绝对值对每维属性赋予权重,权重大小与相关系数呈正比,r值计算公式:
Figure BDA0002459463290000041
其中,Mi为特征值,
Figure BDA0002459463290000042
为特征均值,Yi为对应的新钻井潜力评价值,Y为新钻井潜力评价均值;
(2)种群初始化
油藏历史数据中特征维数为N,设置遗传算法中种群个数为m,变异概率为P,最大迭代次数为t,采用长度为D的染色体X对特征组合进行编码,其中编码为0表示油藏历史数据中对应位置的特征被选中,编码为1表示油藏历史数据中对应位置的特征未被选中。采用轮盘赌方式对加权属性进行抽取,初始化种群S={X1,X2,…,Xm}。将个体X代表的特征组合作为输入,以深度信念网络的评价结果的平均绝对误差的修正值MAE(X)作为适应度函数F;
(3)选择操作
计算种群中全部个体的适应度值Fi,Fi=MAE(Xi),f=1,2,...,m,将种群中的个体按照其适应度值大小进行降序排序{X′1,X′2,…,X′m},X′i表示排序数为i的个体。选择种群中适应度值较大的一半个体构成子种群A={X′1,X′2,…,X′m/2},适应度值小的一半个体构成子种群B={Y′1,Y′2,…,Y′m/2};
(4)交叉操作
交叉操作以设置的交叉概率为基准,交换任意两个染色体的部分基因。本发明在迭代过程中保留当次迭代中较优个体作为下代种群,并选择较差个体的子种群与最优个体的子种群进行交叉操作,将交叉产生的新个体与较优个体的子种群重新构成新种群,从而在保留较优个体的同时,提高了算法全局搜索能力。
具体步骤如下:
采用单点交叉的方式,对选择出的种群A和种群B进行交叉操作构成种群C={Z′1,Z′2,…,Z′m/2},将A和C中的个体混合到一起,生成子代种群S’={X′1,X′2,…X′m/2,Z′1,Z′2,…Z′m/2};
(5)变异操作
变异操作是以设置的变异概率为基准,对某个染色体或者染色体上某段基因进行突变,本发明按照变异概率P使得个体发生变异,形成新个体;
(6)重复步骤(3)-(5),直到满足最大迭代次数或者达到设置的阈值,说明目前种群已趋于稳定不再进化,停止运算。选择适应度值最大的个体Xmax,Xmax对应的染色体编码值为油田历史数据的最优特征组合,按照油田历史数据最优特征组合提取对应特征,得到新钻井潜力最优数据集。
B.采用支持向量回归机评价新钻井潜力
(1)将新钻井潜力最优数据集以区块为单位随机划分训练样本集、测试样本集与验证样本集,划分的比例为7∶2∶1;
(2)采用支持向量回归机挖掘训练样本集数据深层信息,直到效果稳定收敛,以平均绝对误差作为评价标准,在测试样本集上测试支持向量回归机评价效果;
(3)保留验证样本集,重新划分训练样本集与测试样本集,重复(2)过程。对比多个支持向量回归机评价效果,保留平均绝对误差最小的支持向量回归机,将支持向量回归机处理验证样本集,实现区块的新钻井潜力评价。
以上所述,仅是本发明的较佳实施例,任何熟悉本专业的技术人员可能利用上述阐述的技术方案加以改型或变更为等同变化的等同实例。凡未脱离本发明技术方案内容,依据发明的技术方案对上述实施例进行的任何简单修改、变更或改型,均属于发明技术方案的保护范围。

Claims (1)

1.一种基于混合型特征选择的新钻井潜力评价方法,其特征在于,包括以下步骤:
从地震数据库、油藏历史数据库等数据源中提取油藏开发历史数据以及区块新投产井数据,根据区块历史区间内的新投产井数进行标记,得到带有标记的油田历史数据;利用皮尔森积矩相关系数分析油田开发历史数据每维特征对新钻井潜力评价相关性影响,按照每维特征的相关性大小赋予权重,采用长度为油田历史数据特征个数的染色体对特征组合进行编码,以深度信念网络预测的平均绝对误差修正值作为适应度函数,依据特征加权值生成初始种群,计算种群中全部个体的适应度值,保留适应度值较大的一半个体保留至子种群,将适应度值较小的一半个体与适应度值较大的一半个体进行交叉操作,随机选择交叉后产生的新个体加入至子种群,保持子种群数目稳定,按照变异概率对随机个体进行变异操作,迭代直到得到油田历史数据最优特征组合;采用支持向量回归机挖掘油田历史数据深层信息,直到效果稳定,重复多次,保留评价效果最好的支持向量回归机,将支持向量回归机处理油田历史数据,实现新钻井潜力评价。
CN202010315618.2A 2020-04-21 2020-04-21 一种基于混合型特征选择的新钻井潜力评价方法 Pending CN111539616A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010315618.2A CN111539616A (zh) 2020-04-21 2020-04-21 一种基于混合型特征选择的新钻井潜力评价方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010315618.2A CN111539616A (zh) 2020-04-21 2020-04-21 一种基于混合型特征选择的新钻井潜力评价方法

Publications (1)

Publication Number Publication Date
CN111539616A true CN111539616A (zh) 2020-08-14

Family

ID=71975109

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010315618.2A Pending CN111539616A (zh) 2020-04-21 2020-04-21 一种基于混合型特征选择的新钻井潜力评价方法

Country Status (1)

Country Link
CN (1) CN111539616A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112330064A (zh) * 2020-11-26 2021-02-05 中国石油大学(华东) 一种基于集成学习的新钻井工作量预测方法
WO2023173402A1 (zh) * 2022-03-15 2023-09-21 中国科学院深圳先进技术研究院 特征选择方法、特征选择装置、存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112330064A (zh) * 2020-11-26 2021-02-05 中国石油大学(华东) 一种基于集成学习的新钻井工作量预测方法
WO2023173402A1 (zh) * 2022-03-15 2023-09-21 中国科学院深圳先进技术研究院 特征选择方法、特征选择装置、存储介质

Similar Documents

Publication Publication Date Title
CN109635461B (zh) 一种应用随钻参数来自动识别围岩级别的方法和系统
Punch III et al. Further Research on Feature Selection and Classification Using Genetic Algorithms.
Martín et al. QAR-CIP-NSGA-II: A new multi-objective evolutionary algorithm to mine quantitative association rules
CN110346831B (zh) 一种基于随机森林算法的智能化地震流体识别方法
CN110674841A (zh) 一种基于聚类算法的测井曲线识别方法
CN107341497A (zh) 结合选择性升采样的不均衡数据流加权集成分类预测方法
CN107729716A (zh) 一种基于长短时记忆神经网络的煤矿突水预测方法
CN112199670B (zh) 一种基于深度学习改进iforest对行为异常检测的日志监控方法
CN103617147A (zh) 一种矿井突水水源层识别方法
CN111582325B (zh) 一种基于自动特征编码的多阶特征组合方法
EP2271954A2 (en) System and method for interpretation of well data
CN112215278B (zh) 一种遗传算法和蜻蜓算法相结合的多维数据特征选择方法
CN111539616A (zh) 一种基于混合型特征选择的新钻井潜力评价方法
CN109669210B (zh) 基于多种地震属性评价准则的有利区预测方法
CN109633748B (zh) 一种基于改进遗传算法的地震属性优选方法
Qin et al. Evaluation of goaf stability based on transfer learning theory of artificial intelligence
CN110412662A (zh) 基于地震多属性深度学习的薄互层储层预测方法
CN110633868A (zh) 遗传算法优化神经网络进行探井试油层油气性质预测方法
CN117272841B (zh) 一种基于混合神经网络的页岩气甜点预测方法
Kumar et al. Application of genetic algorithms for the prioritization of association rules
Nikafshan Rad et al. Modification of rock mass rating system using soft computing techniques
CN114093426B (zh) 基于基因调控网络构建的标志物筛选方法
Yuan et al. Application of Active Learning in Carbonate Lithologic Identification
CN117236195B (zh) 一种降低开发风险的机器学习离线代理模型生产优化方法
Emery et al. The Pitfalls and insights of log facies classification using machine learning

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20230712

Address after: 257000 No. 125 Ji'nan Road, Dongying District, Dongying, Shandong.

Applicant after: CHINA PETROLEUM & CHEMICAL Corp.

Address before: 266580 No. 66 Changjiang West Road, Huangdao District, Qingdao, Shandong.

Applicant before: CHINA University OF PETROLEUM (EAST CHINA)

TA01 Transfer of patent application right
CB02 Change of applicant information

Address after: 100728 No. 22 North Main Street, Chaoyang District, Beijing, Chaoyangmen

Applicant after: CHINA PETROLEUM & CHEMICAL Corp.

Address before: 257000 No. 125 Ji'nan Road, Dongying District, Dongying, Shandong.

Applicant before: CHINA PETROLEUM & CHEMICAL Corp.

CB02 Change of applicant information