CN112489736A - 一种矿物含量分析方法、装置、设备及存储介质 - Google Patents

一种矿物含量分析方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN112489736A
CN112489736A CN202011426848.2A CN202011426848A CN112489736A CN 112489736 A CN112489736 A CN 112489736A CN 202011426848 A CN202011426848 A CN 202011426848A CN 112489736 A CN112489736 A CN 112489736A
Authority
CN
China
Prior art keywords
mineral
random forest
curve
regression model
content
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011426848.2A
Other languages
English (en)
Inventor
赵建国
孙朗秋
刘欣泽
李智
欧阳芳
肖增佳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huanqing Branch Of Yumen Oilfield Petrochina
China University of Petroleum Beijing
Original Assignee
Huanqing Branch Of Yumen Oilfield Petrochina
China University of Petroleum Beijing
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huanqing Branch Of Yumen Oilfield Petrochina, China University of Petroleum Beijing filed Critical Huanqing Branch Of Yumen Oilfield Petrochina
Priority to CN202011426848.2A priority Critical patent/CN112489736A/zh
Publication of CN112489736A publication Critical patent/CN112489736A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/20Identification of molecular entities, parts thereof or of chemical compositions
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/70Machine learning, data mining or chemometrics

Landscapes

  • Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Geophysics And Detection Of Objects (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Databases & Information Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Software Systems (AREA)

Abstract

本文提供了一种矿物含量分析方法、装置、设备及存储介质,所述方法包括:确定不同矿物对不同测井曲线的敏感度;针对每种矿物,将满足预设敏感度的测井曲线的第一训练集数据输入随机森林回归模型,得到所述矿物的第一随机森林回归模型;将待测矿物的测井曲线特征数据输入所述待测矿物对应的第一随机森林回归模型中,得到所述待测矿物的含量分布曲线,本文充分利用工区已知的矿物含量分布信息,减小不同测井曲线的响应经验值对不同矿物含量预测所带来的误差,提高测井矿物解释的精确性。

Description

一种矿物含量分析方法、装置、设备及存储介质
技术领域
本发明涉及含油气田测井矿物预测领域,特别涉及一种矿物含量分析方法、装置、设备及存储介质。
背景技术
随着中国陆相含油气盆地勘探开发技术的日益成熟,油气勘探的总体发展趋势正在从构造油气藏转向岩性油气藏。而除碳酸盐岩储层外,其余不同岩性的储层其矿物种类繁多、分布非常复杂。如何通过测井数据精确预测各种矿物的含量,对此后的测井解释评价、横波预测、储层及含油气性预测及通过测井信息指导地震储层预测及反演工作有重要意义。
目前得到井中矿物含量的方法主要有两类:第一类为测井综合解释法(Statmin),使用各种类型的测井曲线,按照一定的经验公式、不同测井曲线对各种矿物成分敏感程度的不同,设定针对每种矿物的不同测井曲线数值响应范围,随后构建矿物成分骨架矩阵,通过不同测井曲线及骨架矩阵来计算相应的矿物含量;第二类为直接测量法,随着技术的进步,在测井方法上,人们通过岩性扫描(Lithoscanner)高分辨率能谱测井获得全井段各种元素的含量,再通过一定的解释手段,可以将全井段各种矿物的含量计算出来,并且该种测量方法非常准确。除此之外,通过钻井时得到的岩芯,使用实验室XRD(X射线衍射)矿物分析的方法,也同样可以得到较为精确的矿物含量,但是这种方法受到岩芯样品数量的限制,仅能测量出整个井段中很小一部分深度的矿物含量信息,对全井段整体矿物分布进行分析较为困难。
全井段元素扫描测井方法,通常不会对每口井都使用这种测井方法进行测量,因此对大多数井,就需要使用测井曲线对矿物含量进行解释的方法,但是在不同的地质条件下,测井曲线对矿物成分的响应数值存在巨大差异,在此情况下通过经验响应数值构建的骨架矩阵并不能准确地反映该地区地层中的矿物含量,因此求出的矿物含量有时会存在较大误差,因此如何避免矿物含量预测所带来的误差,提高测井矿物解释的精确性成为亟需解决的技术问题。
发明内容
针对现有技术的上述问题,本文的目的在于,提供一种矿物含量分析方法、装置、设备及存储介质,以提高现有技术中矿物含量预测准确性不高的问题。
为了解决上述技术问题,本文的具体技术方案如下:
一方面,本文提供一种矿物含量分析方法,所述方法包括以下步骤:
确定不同矿物对不同测井曲线的敏感度;
针对每种矿物,将满足预设敏感度的测井曲线的第一训练集数据输入随机森林回归模型,得到所述矿物的第一随机森林回归模型;
将待测矿物的测井曲线特征数据输入所述第一随机森林回归模型,得到所述待测矿物的含量分布曲线
第二方面,本文还提供一种矿物含量分析装置,所述装置适应于上述所述的方法,所述装置包括:
敏感度确定模块,用于确定不同矿物对不同测井曲线的敏感度;
第一随机森林回归模型获得模块,用于针对每种矿物,将满足预设敏感度的测井曲线的第一训练集数据输入随机森林回归模型,得到所述矿物的第一随机森林回归模型;
矿物含量曲线确定模块,用于将待测矿物的测井曲线特征数据输入所述第一随机森林回归模型,得到所述待测矿物的含量分布曲线。
第三方面,本文还提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述所述的方法的步骤。
第四方面,本文还提供一种计算机可读存储介质,所述计算机可读存储介质存储有执行计算机程序,所述计算机程序被处理器执行时实现如上述所述的方法的步骤。
采用上述技术方案,本文所述一种矿物含量分析方法、装置、设备及存储介质,通过确定不同矿物对不同测井曲线的敏感度,进而确定对每种矿物含量检测敏感度较高的测井曲线,然后通过模型训练得到测井曲线和矿物含量之间的随机森林模型训练,进而可以通过待测矿物测井曲线预测相应的矿物含量,本文充分利用工区已知的矿物含量分布信息,减小不同测井曲线的响应经验值对不同矿物含量预测所带来的误差,提高测井矿物解释的精确性。
为让本文的上述和其他目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附图式,作详细说明如下。
附图说明
为了更清楚地说明本文实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本文的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出了本文实施例所述的一种矿物含量分析方法步骤示意图;
图2示出了本文实施例中确定矿物敏感度的步骤示意图;
图3示出了本文实施例中确定矿物敏感度之前的步骤示意图;
图4示出了本文实施例中得到第一随机森林回归模型的步骤示意图;
图5示出了本文实施例中随机森林回归模型训练过程示意图;
图6示出了本文实施例中第一随机森林回归模型验证步骤示意图;
图7示出了本文实施例中测量误差计算步骤示意图;
图8示出了本文实施例中矿物含量分析流程示意图;
图9示出了本文实施例中预处理后测井曲线和矿物含量曲线示意图;
图10示出了本文实施例中不同测井曲线对矿物的敏感度顺序示意图;
图11示出了本文实施例中第一随机森林回归模型矿物含量预测示意图;
图12示出了本文实施例中不同方法得到的矿物含量示意图;
图13示出了本文实施例所述的一种矿物含量分析装置结构示意图;
图14示出了本文实施例中计算机设备的机构示意图。
附图符号说明:
100、矿物敏感度确定模块;
200、第一随机森林回归模型获得模块;
300、矿物含量曲线确定模块;
1402、计算机设备;
1404、处理器;
1406、存储器;
1408、驱动机构;
1410、输入/输出模块;
1412、输入设备;
1414、输出设备;
1416、呈现设备;
1418、图形用户接口;
1420、网络接口;
1422、通信链路;
1424、通信总线。
具体实施方式
下面将结合本文实施例中的附图,对本文实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本文一部分实施例,而不是全部的实施例。基于本文中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本文保护的范围。
需要说明的是,本文的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本文的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、装置、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
现有技术中,井中矿物含量预测的成本和准确度一直是很难平衡的因素,其中全井段元素扫描测井方法可以获得准确的测井矿物含量,但是成本较高,很难进行工区测井全部展开,因此对大多数井,就需要使用测井曲线对矿物含量进行解释的方法,但是在不同的地质条件下,测井曲线对矿物成分的响应数值存在巨大差异,在此情况下通过经验响应数值构建的骨架矩阵并不能准确地反映该地区地层中的矿物含量,因此求出的矿物含量有时会存在较大误差。
需要说明的是,本文实施例技术方案是基于随机森林回归算法实现的,如图5所示,为随机森林训练过程示意图,随机森林回归算法实际上是在决策树算法中加入集成学习思想的结果,算法具体流程如图5所示,其中决策树回归算法是直观运用概率分析的一种图解法,训练数据一般为D={(x1,y1),(x2,y2),…,(xM,yM)},M为训练样本个数。其中xi代表特征(为一向量
Figure BDA0002825239670000051
n为特征个数,),yi代表输出。决策树使用全部的特征,采用启发式最优化方法,每次划分时逐一考察当前集合中所有特征的所有取值,根据平方误差最小化准则选择其中最优的一个划分特征及其取值作为划分标准,如对第j个特征变量及其取值s作为划分点和划分变量将训练样本划分为:R1={x|xj≤s},R2={x|xj>s}。平方误差最小化公式可以表示为:
Figure BDA0002825239670000052
c1,c2为两个划分区域的固定输出值,设定为各自区域内输出值yi的均值。
然后选取另外一个特征,对两个子区域继续进行划分,每划分一次的固定输出值作为一个树节点值,接下来需要不断的选择特征持续对子区域进行划分,直到达到停止条件或用完所有特征为止(划分后计算结果与输出结果间误差足够小),最终根据选取的多个特征将训练样本划分成K个区域R1,R2,…,RK,决策结果的计算方式为:
Figure BDA0002825239670000053
Figure BDA0002825239670000054
为了减小决策树方法过拟合的现象,增强模型的泛化能力,对决策树的构建增加了两个采样过程:首先对于原始训练集,进行有放回的随机抽样,组成训练子集,每个训练子集将用来训练一颗子决策树;在每个训练子集中,再随机的抽取一定数量的特征,这个数量要小于总特征数量,然后再执行决策树的训练过程,最终得到多棵训练好的决策树。最后使用所有的决策树共同的结果中出现最多的结果作为输出,这就是随机森林方法。除了防止过拟合、模型泛化能力强等优点,随机森林算法还易于找到较为重要的特征,较少特征个数。
本文实施例提供了一种矿物含量分析方法,所述方法能够基于矿物对不同测井曲线的敏感度,从而能够只根据测井曲线预测工区内矿物的含量分布。图1是本文实施例提供的一种矿物含量分析方法的步骤示意图,本说明书提供了如实施例或流程图所述的方法操作步骤,但基于常规或者无创造性的劳动可以包括更多或者更少的操作步骤。实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种方式,不代表唯一的执行顺序。在实际中的系统或装置产品执行时,可以按照实施例或者附图所示的方法顺序执行或者并行执行。具体的如图1所示,所述方法可以包括:
S101:确定不同矿物对不同测井曲线的敏感度;
S102:针对每种矿物,将满足预设敏感度的测井曲线的第一训练集数据输入随机森林回归模型,得到所述矿物的第一随机森林回归模型;
S103:将待测矿物的测井曲线特征数据输入所述待测矿物对应的第一随机森林回归模型中,得到所述待测矿物的含量分布曲线。
本文实施例通过确定不同矿物对不同测井曲线的敏感度,从而可以选出针对不同矿物较好敏感度相应的测井曲线,从而能够根据矿物含量和测井曲线训练出相应的训练模型,进而得到工区内不同测井曲线上对应的矿物含量,本文根据已有矿物含量和测井曲线进行预测,大大降低了传统计算方法中由于不同矿物成分的测井响应经验值对矿物含量预测所带来的误差,提高了预测的准确度。
随机森林回归方法在构建模型过程中,需要大量的数据进行训练,因此首先需要已知测井的真实而精确的矿物含量分析情况,取样岩芯的实验室XRD矿物分析可以得到某位置精确的矿物含量信息,但是取样岩芯的样品总体较少,相对整个测井井段的长度,其范围非常小,数据量用来完成随机森林回归模型的训练过程明显太少,因此可以将用岩芯实验室XRD矿物分析的结果来验证随机森林回归模型预测的矿物含量。在模型训练时,使用了全井段矿物扫描的测井数据,即测井曲线对应的矿物含量,该种测井方法可以对整个井段的各种元素的含量信息进行测量,然后通过一定的解释方法分析得到各种矿物的含量,信息准确,数据量大,足以支撑随机森林回归算法的模型训练,但是该种测井方法较为昂贵,在具体应用实例中,该工区可以设置一口测井有全井段矿物扫描的矿物分析曲线,在使用该井段中80%的数据作为训练数据,20%的数据作为测试数据,在一些其他实施例中,也可以选择多口井的全井段矿物扫描的矿物分析曲线选择作为训练数据,在本文实施例不做限定,而验证数据使用了含有取样岩芯的井数据,将岩芯的XRD矿物分析作为验证。
在本文实施例中,测井曲线类型可以为:
1.纵波速度曲线,
2.横波速度曲线,
3.自然伽马曲线,
4.中子孔隙度曲线,
5.光电效应曲线,
6.孔隙度曲线,
7.密度曲线。
每种测井曲线对不同的矿物敏感程度不一样,有的测井曲线可能几乎不会表现某几种矿物的特征,如果在该种矿物的预测中使用对该矿物不敏感的测井曲线,就会出现数据冗余的问题,基于上述原因,如果得到每条测井曲线对不同矿物成分的敏感程度,并进行排序,从而针对不同的矿物成分,优选出对该矿物比较敏感的几条曲线来进行该矿物预测模型的训练,就可以得到针对每种矿物含量预测较高的训练模型,具体地,如图2所示,确定不同矿物对不同测井曲线的敏感度可以包括以下步骤:
针对每种矿物:
S1011:将所述矿物的第二训练集数据输入随机森林回归模型进行训练,得到所述矿物的第二随机森林回归模型,所述第二训练集数据包括测井曲线特征数据和矿物含量曲线特征数据;
S1012:获取所述矿物的测试集数据;作为可选地,所述测试集数据可以包括测井曲线特征数据和矿物含量曲线特征数据,其中所述第二训练集数据和所述测试集数据无交集,可以为同一口井的测井曲线的部分,也可以为不同井的测井曲线。
S1013:将测试集数据中的测井曲线特征数据输入到所述第二随机森林回归模型,计算得到第一矿物预测含量;
S1014:根据所述第一矿物预测含量和所述测试集数据中的矿物含量特征,计算得到第一预测误差;
S1015:测试集数据中的测井曲线特征数据进行噪声处理,并输入到所述第二随机森林回归模型,计算得到第二矿物预测含量;
S1016:根据所述第二矿物预测含量和所述测试集数据中的矿物含量特征,计算得到第二预测误差;
S1017:根据所述第一预测误差和所述第二预测误差,确定所述矿物对不同测井曲线的敏感度。
可以理解为,通过测试集数据对训练出的第二随机森林回归模型进行测试,可以得到第二随机森林回归模型的初始预测误差,即第一预测误差err1,为了验证不同测井曲线对矿物的敏感度,可以对每种测井曲线依次增加随机噪声,并将处理后的测井曲线输入到第二随机森林回归模型得到第二次预测的含量,再和真实值比较得到第一预测误差err2,将err1-err2的绝对值作为每种特征敏感性的衡量标准,将某个特征(测井曲线)随机加入噪声之后,预测准确率大幅度降低,则说明这个特征预测结果影响很大,也就表明它的敏感性较高,在得到全部的测井曲线的针对每种矿物的敏感度之后,进行敏感度排序,从而可以得到敏感度较大的测井曲线。
在实际工作中,如图10所示,为一具体实施例中测井曲线对不同矿物进行训练和加噪处理得到的敏感度分布图。
其中,方解石:分析得对方解石较为敏感的测井曲线有密度曲线以及孔隙度曲线,因此选择密度曲线与孔隙度曲线重新建立训练集中的参数数据,使用新建立的数据进行训练。
泥岩:分析得对泥岩较为敏感的测井曲线有自然伽马曲线、密度曲线、光电效应曲线以及中子孔隙度曲线,因此选择自然伽马曲线与密度曲线重新建立训练集中的参数数据,使用新建立的数据进行训练。
正长石:分析得对正长石较为敏感的测井曲线有自然伽马曲线、密度曲线、纵波速度曲线以及孔隙度曲线,因此选择自然伽马曲线、密度曲线、纵波速度曲线和孔隙度曲线重新建立训练集中的参数数据,使用新建立的数据进行训练。
石英:分析得对石英较为敏感的测井曲线有密度曲线、孔隙度曲线以及自然伽马曲线,因此选择密度曲线、孔隙度曲线以及自然伽马曲线重新建立训练集中的参数数据,使用新建立的数据进行训练。
针对不同的工区,由于地质环境不同,储藏的矿物类型也会不同,因此在确定不同矿物对不同测井曲线的敏感度之前还可以确定矿物类型,同时上述训练集和测试集的数据均可以包括测井曲线特征数据和矿物含量曲线特征数据,需要说明的是,所述测井曲线特征数据与所述矿物含量曲线特征数据相对应。为了保证数据使用的统一以及减少异常数据的误差,如图3所示,在上述步骤之前还可以包括:
S011:确定矿物类型;
S012:对训练集数据的预处理。
其中,所述确定矿物类型包括根据测井地质信息和岩芯矿物学分析,确定测井中的矿物类型,具体可以为工作人员通过获取的岩石样本通过岩石学矿物学分析得到具体的矿物类型,比如为方解石、正长石、石英和斜长石等,在一些其他实施例中,除了造岩矿物,也可以包括造矿矿物,比如磁铁矿、黄铁矿、铅锌矿等等,具体矿物类型在本文实施例不做限定。
对数据的预处理可以包括多井一致性处理、归一化处理和删除测井曲线和矿物含量曲线中的空值与异常值(部分0值,异常值或-999),在保证数据正确的基础上,使得所有的数据保持的相同的数量级上,便于处理和对比,在一具体实施例中,如图9所示,为经过预处理之后的测井曲线,其中测井曲线的特征数据和与所述测井曲线对应的矿物含量数据作为模型训练的数据,具体地,以测井曲线的特征数据为模型训练的输入值,以矿物含量数据为模型训练的输出值。
如图4所示,为本文实施例中获得第一随机森林模型的具体步骤,具体为:
针对每种矿物:
S1021:确定所述矿物对应的满足预设敏感度的至少一个测井曲线;
S1022:根据所述至少一个测井曲线,确定第一训练集数据;
S1023:将所述第一训练集数据输入随机森林回归模型进行训练,直到第一随机森林回归模型的损失函数达到最小值,得到第一随机森林回归模型。
可以理解为,第一随机森林回归模型的训练依据上述提供的随机森林回归算法实现,损失函数对应上述随机森林回归算法中的平方误差最小化公式得到,此处不做赘述,其中第一训练集数据可以为第二训练集数据子集,可以减少过多的数据采集,从而减少了成本,在一些其他实施例中,所述第二训练集数据可以是所述第二训练集数据的非子集,这样可以采集更多的数据保证第一随机森林回归模型的训练数据的量,在足够多数据训练的情况下,从而保证第一随机森林回归模型预测的准确度。
通过上述步骤的得到的第一随机森林训练模型可以实现对其他测井曲线的矿物含量预测,如图11所示,为不同矿物的含量预测,通过确定不同矿物的第一随机森林训练模型,然后将测井曲线的特征数据输入到所述第一随机森林训练模型中得到相应的矿物预测含量。
进一步实施例中,在得到第一随机森林训练模型的基础上,还可以验证所述第一随机森林训练模型矿物含量预测的准确性,从而提高对整个工区矿物含量预测的准确性,具体地,可以在得到矿物预测含量的基础上,结合已有的取样岩芯在实验室XRD矿物分析结果,来验证训练模型矿物预测的准确性,其中实验室XRD矿物分析是对岩芯准确可靠的含量分析结果,可以当做真实值进行对比。
在本文实施例中,如图6所示,为第一随机森林回归模型验证的步骤,所述步骤可以包括:
S1024:获取所述矿物的验证集数据,所述验证集数据包括矿物真实含量、所述矿物所在测井的测井曲线特征和经测井曲线解释得到的矿物含量;
S1025:将所述矿物所在测井的测井曲线特征输入到所述第一随机森林回归模型,得到不同矿物的预测含量曲线;
S1026:根据所述矿物真实含量、经测井曲线解释得到的矿物含量和所述矿物的预测含量曲线,计算得到第一随机森林回归模型预测误差和所述测井曲线解释误差;
S1027:根据所述第一随机森林回归模型预测误差和所述测井曲线解释误差,判断所述第一随机森林回归模型矿物含量预测的准确性。
可以理解为,上述步骤是通过预测含量和常规测井曲线矿物解释方法得到的矿物含量进行比较,得到训练模型预测方法和常规方法(测井曲线综合矿物解释方法)的准确性对比,具体是以矿物真实含量作为参考值,所述矿物含量为通过实验室XRD矿物分析得到的结果,需要说明的是,所述实验室XRD矿物分析可以是测井曲线中的单点数据,即不同深度的岩芯矿物含量,也可以为预设长度的岩芯矿物含量分布。进一步地,如图7所示,步骤S1026中进行测量误差可以包括:
S0261:确定所述矿物真实含量所对应岩芯深度信息;
S0262:根据所述岩芯深度信息,确定所述测井曲线对应位置解释得到的矿物含量和预测含量曲线对应位置的矿物含量;
S0263:根据所述矿物真实含量、所述测井曲线对应位置解释得到的矿物含量和预测含量曲线对应位置的矿物含量,计算得到第一随机森林回归模型预测误差和所述测井曲线解释误差。
可以理解为,通过同一深度的三种矿物含量计算方法进行比较从而判断不同方法的准确性,所述测量误差可以为均方差,通过确定多个岩芯XRD矿物分析得到的各矿物含量数据作为真实参考值,以训练模型矿物预测和常规测井曲线的矿物含量解释方法作为两种预测(计算)方法进行对比,从而得到两种预测方法的准确性。
在实际工作中,如图12所示,为本文一具体实施例中,不同方法得到的矿物含量对比分析图,其中RF所在列曲线为通过第一随机森林回归模型预测得到的各矿物含量,RF所在列右侧列曲线为常规测井曲线的矿物解释方法得到的各矿物含量,黑色点为通过岩芯XRD矿物分析得到不同深度的矿物含量真实值,进行均方根误差分析可以得到下表1的结果:
表1均方根误差分析表
均方根误差 随机森林回归预测 常规方法
方解石 0.05234 0.1926
泥质含量 0.075 0.227
正长石 0.09 0.12
石英 0.212 0.351
从均方根误差分析可以发现随机森林回归预测的各矿物含量,都比常规方法解释得到的各矿物含量相比真实值误差更小一些,表明基于随机森林回归的矿物含量预测方法比常规方法更加准确,同时本文实施例能够充分的与已有的矿物含量信息联系起来,针对不同工区建立不同的模型,并且较为方便加入与减少这些信息,这使该种方法能够针对不同工区随时做出调整,具有普遍适用性。
如图8所示,为本文实施例中矿物分析的流程示意图,首先需要获得已知测井曲线及其对应的矿物含量曲线作为训练数据以及测试数据,以及岩芯实验室XRD矿物分析数据作为验证数据,经上述数据进行预处理得到均一化的数据,然后进行测井曲线敏感度的确定,即如图8中的第一次随机森林回归训练得到的第二随机森林回归模型,并通过加躁处理以及矿物含量测试,得到不同测井曲线的对不同矿物的敏感度,然后针对不同矿物选择敏感度较高的测井曲线进行第二次随机森林回归训练得到第一随机森林回归模型,得到的模型就能实现矿物含量的预测,为了确定训练模型矿物含量预测的准确性,还可以进行训练模型矿物含量的预测,本文实施例基于随机森林模型对已有的测井数据及矿物含量曲线进行训练,对工区其他井的矿物含量曲线进行预测,大大降低了传统计算方法中由于不同矿物成分的测井响应经验值对矿物含量预测所带来的误差,通过验证表明该方法能够使得预测出的各矿物含量更加精确。
本文实施例使用的随机森林回归机器学习算法,相对于其它机器学习算法来说,具有对多元线性不敏感的特性,针对非平衡数据及缺失数据也能够产生比较稳定的回归效果,这很适合与处理测井曲线数据,另外该方法泛化能力强,不易产生过拟合,并且在特征选取时是随机的,因此便于进行特征优选;相对于神经网络方法,其模型简单、训练速度较快。
在上述实施例提供的一种矿物含量分析方法基础上,本文实施例还提供一种矿物含量分析装置,如图13所示,所述装置包括:
矿物敏感度确定模块100,用于确定不同矿物对不同测井曲线的敏感度;
第一随机森林回归模型获得模块200,用于针对每种矿物,将满足预设敏感度的测井曲线的第一训练集数据输入随机森林回归模型,得到所述矿物的第一随机森林回归模型;
矿物含量曲线确定模块300,用于将待测矿物的测井曲线特征数据输入所述待测矿物对应的第一随机森林回归模型中,得到所述待测矿物的含量分布曲线。
通过上述装置首先确定不同矿物对不同测井曲线的敏感度,从而可以选出针对不同矿物较好敏感度相应的测井曲线,从而能够根据矿物含量和测井曲线训练出相应的训练模型,进而得到工区内不同测井曲线上对应的矿物含量,本文根据已有矿物含量和测井曲线进行预测,大大降低了传统计算方法中由于不同矿物成分的测井响应经验值对矿物含量预测所带来的误差,提高了预测的准确度。
如图14所示,为本文实施例提供的一种计算机设备,计算机设备1402可以包括一个或多个处理器1404,诸如一个或多个中央处理单元(CPU),每个处理单元可以实现一个或多个硬件线程。计算机设备1402还可以包括任何存储器1406,其用于存储诸如代码、设置、数据等之类的任何种类的信息。非限制性的,比如,存储器1406可以包括以下任一项或多种组合:任何类型的RAM,任何类型的ROM,闪存设备,硬盘,光盘等。更一般地,任何存储器都可以使用任何技术来存储信息。进一步地,任何存储器可以提供信息的易失性或非易失性保留。进一步地,任何存储器可以表示计算机设备1402的固定或可移除部件。在一种情况下,当处理器1404执行被存储在任何存储器或存储器的组合中的相关联的指令时,计算机设备1402可以执行相关联指令的任一操作。计算机设备1402还包括用于与任何存储器交互的一个或多个驱动机构1408,诸如硬盘驱动机构、光盘驱动机构等。
计算机设备1402还可以包括输入/输出模块1410(I/O),其用于接收各种输入(经由输入设备1412)和用于提供各种输出(经由输出设备1414))。一个具体输出机构可以包括呈现设备1416和相关联的图形用户接口(GUI)1418。在其他实施例中,还可以不包括输入/输出模块1410(I/O)、输入设备1412以及输出设备1414,仅作为网络中的一台计算机设备。计算机设备1402还可以包括一个或多个网络接口1420,其用于经由一个或多个通信链路1422与其他设备交换数据。一个或多个通信总线1424将上文所描述的部件耦合在一起。
通信链路1422可以以任何方式实现,例如,通过局域网、广域网(例如,因特网)、点对点连接等、或其任何组合。通信链路1422可以包括由任何协议或协议组合支配的硬连线链路、无线链路、路由器、网关功能、名称服务器等的任何组合。
对应于图2至图7中的方法,本文实施例还提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述方法的步骤。
本文实施例还提供一种计算机可读指令,其中当处理器执行所述指令时,其中的程序使得处理器执行如图2至图7所示的方法。
应理解,在本文的各种实施例中,上述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本文实施例的实施过程构成任何限定。
还应理解,在本文实施例中,术语“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系。例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本文的范围。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本文所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口、装置或单元的间接耦合或通信连接,也可以是电的,机械的或其它的形式连接。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本文实施例方案的目的。
另外,在本文各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本文的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本文各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
本文中应用了具体实施例对本文的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本文的方法及其核心思想;同时,对于本领域的一般技术人员,依据本文的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本文的限制。

Claims (10)

1.一种矿物含量分析方法,其特征在于,所述方法包括:
确定不同矿物对不同测井曲线的敏感度;
针对每种矿物,将满足预设敏感度的测井曲线的第一训练集数据输入随机森林回归模型,得到所述矿物的第一随机森林回归模型;
将待测矿物的测井曲线特征数据输入所述待测矿物对应的第一随机森林回归模型中,得到所述待测矿物的含量分布曲线。
2.根据权利要求1所述的方法,其特征在于,所述确定不同矿物对不同测井曲线的敏感度进一步包括:
针对每种矿物:
将所述矿物的第二训练集数据输入随机森林回归模型进行训练,得到所述矿物的第二随机森林回归模型,所述第二训练集数据包括测井曲线特征数据和矿物含量曲线特征数据;
获取所述矿物的测试集数据;
将测试集数据中的测井曲线特征数据输入到所述第二随机森林回归模型,计算得到第一矿物预测含量;
根据所述第一矿物预测含量和所述测试集数据中的矿物含量特征,计算得到第一预测误差;
测试集数据中的测井曲线特征数据进行噪声处理,并输入到所述第二随机森林回归模型,计算得到第二矿物预测含量;
根据所述第二矿物预测含量和所述测试集数据中的矿物含量特征,计算得到第二预测误差;
根据所述第一预测误差和所述第二预测误差,确定所述矿物对不同测井曲线的敏感度。
3.根据权利要求2所述的方法,其特征在于,所述将所述矿物的第二训练集数据输入随机森林回归模型进行训练之前包括:确定矿物类型和对训练集数据的预处理,所述训练集数据包括第一训练集数据和第二训练集数据;
所述确定矿物类型包括:根据测井地质信息和岩芯矿物学分析,确定测井中的矿物类型;
所述预处理包括多井一致性处理、归一化处理和删除测井曲线和矿物含量曲线中的空值与异常值。
4.根据权利要求1所述的方法,其特征在于,所述测井曲线包括:
纵波速度曲线、横波速度曲线、自然伽马曲线、中子孔隙度曲线、光电效应曲线、孔隙度曲线和密度曲线。
5.根据权利要求2所述的方法,其特征在于,所述将满足预设敏感度的测井曲线的第一训练集数据输入随机森林回归模型,得到所述矿物的第一随机森林回归模型进一步包括:
针对每种矿物:
确定所述矿物对应的满足预设敏感度的至少一个测井曲线;
根据所述至少一个测井曲线,确定第一训练集数据;
将所述第一训练集数据输入随机森林回归模型进行训练,直到第一随机森林回归模型的损失函数达到最小值,得到第一随机森林回归模型。
6.根据权利要求1所述的方法,其特征在于,所述得到所述矿物的第一随机森林回归模型之后还包括:
获取所述矿物的验证集数据,所述验证集数据包括矿物真实含量、所述矿物所在测井的测井曲线特征和经测井曲线解释得到的矿物含量;
将所述矿物所在测井的测井曲线特征输入到所述第一随机森林回归模型,得到不同矿物的预测含量曲线;
根据所述矿物真实含量、经测井曲线解释得到的矿物含量和所述矿物的预测含量曲线,计算得到第一随机森林回归模型预测误差和所述测井曲线解释误差;
根据所述第一随机森林回归模型预测误差和所述测井曲线解释误差,判断所述第一随机森林回归模型矿物含量预测的准确性。
7.根据权利要求6所述的方法,其特征在于,所述根据所述矿物真实含量、经测井曲线解释得到的矿物含量和所述矿物的预测含量曲线,计算得到第一随机森林回归模型预测误差和所述测井曲线解释误差进一步包括:
确定所述矿物真实含量所对应岩芯深度信息;
根据所述岩芯深度信息,确定所述测井曲线对应位置解释得到的矿物含量和预测含量曲线对应位置的矿物含量;
根据所述矿物真实含量、所述测井曲线对应位置解释得到的矿物含量和预测含量曲线对应位置的矿物含量,计算得到第一随机森林回归模型预测误差和所述测井曲线解释误差。
8.一种矿物含量分析装置,所述装置适应于权利要求1至7任一项所述的方法,其特征在于,所述装置包括:
矿物敏感度确定模块,用于确定不同矿物对不同测井曲线的敏感度;
第一随机森林回归模型获得模块,用于针对每种矿物,将满足预设敏感度的测井曲线的第一训练集数据输入随机森林回归模型,得到所述矿物的第一随机森林回归模型;
矿物含量曲线确定模块,用于将待测矿物的测井曲线特征数据输入所述待测矿物对应的第一随机森林回归模型中,得到所述待测矿物的含量分布曲线。
9.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述的方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有执行计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的方法的步骤。
CN202011426848.2A 2020-12-09 2020-12-09 一种矿物含量分析方法、装置、设备及存储介质 Pending CN112489736A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011426848.2A CN112489736A (zh) 2020-12-09 2020-12-09 一种矿物含量分析方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011426848.2A CN112489736A (zh) 2020-12-09 2020-12-09 一种矿物含量分析方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN112489736A true CN112489736A (zh) 2021-03-12

Family

ID=74940635

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011426848.2A Pending CN112489736A (zh) 2020-12-09 2020-12-09 一种矿物含量分析方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN112489736A (zh)

Citations (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106950347A (zh) * 2017-03-03 2017-07-14 中国石油大学(华东) 一种评价泥页岩各组分体积的方法
CN108231201A (zh) * 2018-01-25 2018-06-29 华中科技大学 一种疾病数据分析处理模型的构建方法、系统及应用
CN108665109A (zh) * 2018-05-15 2018-10-16 中国地质大学(北京) 一种基于回归委员会机器的储层参数测井解释方法
CN108843312A (zh) * 2018-06-04 2018-11-20 西南石油大学 油田储层层内非均质性综合评价方法
CN109543203A (zh) * 2017-09-22 2019-03-29 山东建筑大学 一种基于随机森林的建筑冷热负荷预测方法
CN109711597A (zh) * 2018-11-14 2019-05-03 东莞理工学院 一种基于分层随机森林模型的铜镍硫化物矿床成矿预测方法
CN109919184A (zh) * 2019-01-28 2019-06-21 中国石油大学(北京) 一种基于测井数据的多井复杂岩性智能识别方法及系统
CN110346831A (zh) * 2019-07-19 2019-10-18 同济大学 一种基于随机森林算法的智能化地震流体识别方法
CN110344824A (zh) * 2019-06-25 2019-10-18 中国矿业大学(北京) 一种基于随机森林回归的声波曲线生成方法
CN110852527A (zh) * 2019-11-20 2020-02-28 成都理工大学 一种结合深度学习的储层物性参数预测方法
CN110988997A (zh) * 2019-12-27 2020-04-10 中国海洋石油集团有限公司 一种基于机器学习的烃源岩三维空间展布定量预测技术
CN111028095A (zh) * 2019-12-19 2020-04-17 中国地质大学(武汉) 一种基于测井曲线的定量识别页岩岩相的方法
CN111027882A (zh) * 2019-12-18 2020-04-17 延安大学 一种基于高阶神经网络利用常规测井资料评价脆性指数的方法
CN111058837A (zh) * 2019-11-26 2020-04-24 中国石油天然气股份有限公司大港油田分公司 一种基于多元逐步回归的页岩油岩性评价方法
CN111382472A (zh) * 2020-01-16 2020-07-07 华中科技大学 随机森林融合svm预测盾构引起近接结构变形方法及装置
CN111507518A (zh) * 2020-04-14 2020-08-07 中铁隧道局集团有限公司 一种基于随机森林的小波神径网络混凝土抗渗预测的方法
CN111554358A (zh) * 2020-04-22 2020-08-18 中国人民大学 一种重金属毒性终点和海洋水质基准阈值的预测方法
CN111738478A (zh) * 2019-12-24 2020-10-02 上海海事大学 基于随机森林算法和Adam神经网络波浪补偿预测方法
CN111985796A (zh) * 2020-08-07 2020-11-24 华中科技大学 基于随机森林和智能算法预测混凝土结构耐久性的方法

Patent Citations (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106950347A (zh) * 2017-03-03 2017-07-14 中国石油大学(华东) 一种评价泥页岩各组分体积的方法
CN109543203A (zh) * 2017-09-22 2019-03-29 山东建筑大学 一种基于随机森林的建筑冷热负荷预测方法
CN108231201A (zh) * 2018-01-25 2018-06-29 华中科技大学 一种疾病数据分析处理模型的构建方法、系统及应用
CN108665109A (zh) * 2018-05-15 2018-10-16 中国地质大学(北京) 一种基于回归委员会机器的储层参数测井解释方法
CN108843312A (zh) * 2018-06-04 2018-11-20 西南石油大学 油田储层层内非均质性综合评价方法
CN109711597A (zh) * 2018-11-14 2019-05-03 东莞理工学院 一种基于分层随机森林模型的铜镍硫化物矿床成矿预测方法
CN109919184A (zh) * 2019-01-28 2019-06-21 中国石油大学(北京) 一种基于测井数据的多井复杂岩性智能识别方法及系统
CN110344824A (zh) * 2019-06-25 2019-10-18 中国矿业大学(北京) 一种基于随机森林回归的声波曲线生成方法
CN110346831A (zh) * 2019-07-19 2019-10-18 同济大学 一种基于随机森林算法的智能化地震流体识别方法
CN110852527A (zh) * 2019-11-20 2020-02-28 成都理工大学 一种结合深度学习的储层物性参数预测方法
CN111058837A (zh) * 2019-11-26 2020-04-24 中国石油天然气股份有限公司大港油田分公司 一种基于多元逐步回归的页岩油岩性评价方法
CN111027882A (zh) * 2019-12-18 2020-04-17 延安大学 一种基于高阶神经网络利用常规测井资料评价脆性指数的方法
CN111028095A (zh) * 2019-12-19 2020-04-17 中国地质大学(武汉) 一种基于测井曲线的定量识别页岩岩相的方法
CN111738478A (zh) * 2019-12-24 2020-10-02 上海海事大学 基于随机森林算法和Adam神经网络波浪补偿预测方法
CN110988997A (zh) * 2019-12-27 2020-04-10 中国海洋石油集团有限公司 一种基于机器学习的烃源岩三维空间展布定量预测技术
CN111382472A (zh) * 2020-01-16 2020-07-07 华中科技大学 随机森林融合svm预测盾构引起近接结构变形方法及装置
CN111507518A (zh) * 2020-04-14 2020-08-07 中铁隧道局集团有限公司 一种基于随机森林的小波神径网络混凝土抗渗预测的方法
CN111554358A (zh) * 2020-04-22 2020-08-18 中国人民大学 一种重金属毒性终点和海洋水质基准阈值的预测方法
CN111985796A (zh) * 2020-08-07 2020-11-24 华中科技大学 基于随机森林和智能算法预测混凝土结构耐久性的方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
卞凯;周孟然;胡锋;来文豪;闫鹏程;宋红萍;戴荣英;胡天羽;: "RF-CARS结合LIF光谱用于矿井涌水的预测评估", 光谱学与光谱分析, no. 07, pages 20 *
周雪晴;张占松;张超谟;聂昕;朱林奇;张宏悦;: "基于粗糙集――随机森林算法的复杂岩性识别", 大庆石油地质与开发, no. 06 *
钟庆良等: "《石油物探》", 潜江凹陷潜江组盐间页岩油岩石物理建模研究, vol. 59, no. 4, pages 509 *

Similar Documents

Publication Publication Date Title
Mishra et al. Applied statistical modeling and data analytics: A practical guide for the petroleum geosciences
US8374974B2 (en) Neural network training data selection using memory reduced cluster analysis for field model development
US10969323B2 (en) Systems and methods for special core analysis sample selection and assessment
US9176255B2 (en) Permeability prediction systems and methods using quadratic discriminant analysis
US11966828B2 (en) Estimating permeability values from well logs using a depth blended model
US11880776B2 (en) Graph neural network (GNN)-based prediction system for total organic carbon (TOC) in shale
US20180267204A1 (en) Rock Type Based Free Water Level Inversion
US11892581B2 (en) Methods and systems for characterizing clay content of a geological formation
CN113065279A (zh) 预测总有机碳含量的方法、装置、设备及存储介质
CN113835138B (zh) 基于深度编码解码网络预测页岩总有机碳含量的方法
Leung et al. Sample truncation strategies for outlier removal in geochemical data: the MCD robust distance approach versus t-SNE ensemble clustering
Wang et al. Lithology identification technology using BP neural network based on XRF
CN113216945B (zh) 一种致密砂岩储层渗透性定量评价方法
CN112862139A (zh) 流体类型预测模型的构建方法、流体类型预测方法和装置
WO2022087332A1 (en) Reservoir characterization using rock geochemistry for lithostratigraphic interpretation of a subterranean formation
CN111580179B (zh) 一种有机碳含量确定方法、装置及系统
CN112489736A (zh) 一种矿物含量分析方法、装置、设备及存储介质
US20230029072A1 (en) Systems and methods for subsurface formation modelling
Li et al. A rapid updating method to predict grade heterogeneity at smaller scales
Asedegbega et al. Application of machine learniing for reservoir facies classification in port field, Offshore Niger Delta
US11953647B2 (en) System and method for radioactivity prediction to evaluate formation productivity
Xin et al. Integrated Carbonate Lithofacies Modeling Based on the Deep Learning and Seismic Inversion and its Application
CN112147711A (zh) 野外快速获取海相页岩总有机碳方法及系统
Yusefi et al. ProxInLAS, a software program for detecting coal layers and estimating parameters of layers, using geophysical well-logs
Yusefi et al. COALINLAS, a software for detecting coal beds in well-logs

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination