CN113065279A - 预测总有机碳含量的方法、装置、设备及存储介质 - Google Patents

预测总有机碳含量的方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN113065279A
CN113065279A CN202110277013.3A CN202110277013A CN113065279A CN 113065279 A CN113065279 A CN 113065279A CN 202110277013 A CN202110277013 A CN 202110277013A CN 113065279 A CN113065279 A CN 113065279A
Authority
CN
China
Prior art keywords
logging
organic carbon
carbon content
samples
total organic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110277013.3A
Other languages
English (en)
Inventor
刘小平
叶文辉
孙彪
舒红林
王高成
罗瑀峰
许磊
化祖献
刘天
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China University of Petroleum Beijing
Original Assignee
China University of Petroleum Beijing
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China University of Petroleum Beijing filed Critical China University of Petroleum Beijing
Priority to CN202110277013.3A priority Critical patent/CN113065279A/zh
Publication of CN113065279A publication Critical patent/CN113065279A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01VGEOPHYSICS; GRAVITATIONAL MEASUREMENTS; DETECTING MASSES OR OBJECTS; TAGS
    • G01V11/00Prospecting or detecting by methods combining techniques covered by two or more of main groups G01V1/00 - G01V9/00
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/10Machine learning using kernel methods, e.g. support vector machines [SVM]

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Geometry (AREA)
  • Computer Hardware Design (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Life Sciences & Earth Sciences (AREA)
  • Geophysics (AREA)
  • Data Mining & Analysis (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Geophysics And Detection Of Objects (AREA)

Abstract

本申请提供一种预测总有机碳含量的方法、装置、设备及存储介质,该方法通过获取待预测区域的测井参数;将测井参数输入至预设预测模型中,得到待预测区域的总有机碳含量,其中,预设预测模型通过多个测井参数样本和多个测井参数样本对应的总有机碳含量样本训练得到,预设预测模型通过模型核函数建立,模型核函数根据多个测井参数样本与多个测井参数样本对应的总有机碳含量样本的皮尔森系数确定;根据待预测区域的总有机碳含量,对待预测区域的油气资源丰度进行分析,降低了预测成本及油气勘探成本,总有机碳含量的预测结果更加准确,提高了湖相泥页岩总有机碳含量预测精度。

Description

预测总有机碳含量的方法、装置、设备及存储介质
技术领域
本发明涉及石油技术领域,尤其涉及一种预测总有机碳含量的方法、装置、设备及存储介质。
背景技术
总有机碳(Total Organic Carbon,TOC)含量是评价烃源岩生烃能力的主要指标之一,其大小直接关系到研究区油气来源的判别和资源潜力的计算,是油气勘探领域中生烃研究和资源评价的一项重要参数。
相关技术中,计算总有机碳含量的方法主要有以下几种:△logR法、改进的△logR法、多元回归法和MLP神经网络法等,在获取测井数据后,将测井数据带入现有公式,计算总有机碳含量。
然而现有技术难以准确预测总有机碳含量,油气勘探的准确性低,而且需要大量测井数据样本,预测成本高,油气勘探成本高。
发明内容
本申请提供一种预测总有机碳含量的方法、装置、设备及存储介质,从而解决现有技术难以准确预测总有机碳含量,油气勘探的准确性低,而且需要大量测井数据样本,预测成本高,油气勘探成本高的技术问题。
第一方面,本申请提供一种预测总有机碳含量的方法,包括:
获取待预测区域的测井参数;
将所述测井参数输入至预设预测模型中,得到所述待预测区域的总有机碳含量,其中,所述预设预测模型通过多个测井参数样本和所述多个测井参数样本对应的总有机碳含量样本训练得到,所述预设预测模型通过模型核函数建立,所述模型核函数根据所述多个测井参数样本与所述多个测井参数样本对应的总有机碳含量样本的皮尔森系数确定;
根据所述待预测区域的总有机碳含量,对所述待预测区域的油气资源丰度进行分析。
这里,本申请实施例在通过总有机碳含量进行油气勘探时,首先获取待预测区域的测井参数,通过将测井参数输入至预设预测模型,即可得到待预测区域的有机碳含量预测结果,无需获取大量的测井样品及测井参数,降低了预测成本及油气勘探成本,本申请实施例的预设预测模型在建立时引入了模型核函数,将低维度的训练样本映射到高维空间中,使得预设预测模型更能够准确地反映出非均质的油井中总有机碳含量与测井参数之间复杂的关系,总有机碳含量的预测结果更加的准确,提高了油气资源确定的准确性,提高了湖相泥页岩总有机碳含量预测精度,提高了油气勘探的效率。
可选的,在所述将所述测井参数输入至预设预测模型中,得到所述待预测区域的总有机碳含量之前,还包括:
获取测井资料数据,所述测井资料数据包括多个测井参数样本和所述多个测井参数样本对应的总有机碳含量样本;
计算所述多个测井参数样本与所述多个测井参数样本对应的总有机碳含量样本的皮尔森系数;
根据皮尔森系数确定模型核函数;
通过所述模型核函数,建立初始预测模型;
将所述多个测井参数样本和所述多个总有机碳含量样本输入至所述初始预测模型进行训练,得到预设预测模型。
这里,本申请实施例提供了一种建立预测总有机碳含量的预设预测模型的方法,通过测井参数样本与测井参数样本对应的总有机碳含量样本的皮尔森系数确定了模型核函数,通过反映测井参数样本与测井参数样本对应的总有机碳含量样本的相关性的皮尔森系数,确定的模型核函数更能准确反映总有机碳含量与测井参数之间复杂的关系,总有机碳含量的预测结果更加的准确,进一步地提高了油气资源确定的准确性,提高了油气勘探的效率。
可选的,所述根据皮尔森系数确定模型核函数包括:
若皮尔森系数的绝对值大于皮尔森系数阈值的测井参数样本的数量,大于总测井参数样本数量的二分之一,则确定模型核函数为线性核函数;
若皮尔森系数的绝对值大于皮尔森系数阈值的测井参数样本的数量,小于总测井参数样本数量的二分之一,则确定模型核函数为高斯核函数。
这里,本申请实施例根据皮尔森系数的绝对值是否大于皮尔森系数阈值的测井参数样本的数量,确定模型核函数的类型,即根据测井样品的测井参数与总有机碳含量的相关性确定模型核函数的类型,使得预设预测模型的权重更加准确,进一步地提高了总有机碳含量的预测结果的准确性,提高了油气资源确定的准确性,提高了油气勘探的效率。
可选的,所述获取测井资料数据包括:
获取多个测井样品的历史测井资料数据,其中,所述多个测井样品来自于相同或者不同的油井;
根据同一油井的测井样品数和所述多个测井样品的历史测井资料数据中的不同参数的数量,确定建立模型所需的测井参数;
根据所述建立模型所需的测井参数,获取测井参数样本和所述多个测井参数样本对应的总有机碳含量样本。
这里,本申请实施例在获取测井资料数据时,首先可以获取大量的测井样品的历史测井资料数据,这里的历史资料数据包括多种参数,本申请实施例结合测井参数与其对应测井样品数的多寡,以及TOC对测井参数的敏感程度,确立建立模型所需的测井参数;确定建立模型所需的测井参数,将对总有机碳含量影响较小的参数和获取困难的参数进行筛选,确定了对总有机碳含量预测密切相关的测井参数,从而在总有机碳含量预测时,减少了无用参数的获取,减少了成本,同时,也提高了总有机碳含量的预测结果的准确性,进一步地提高了油气勘探的效率。
可选的,在所述将所述多个测井参数样本和所述多个总有机碳含量样本输入至所述初始预测模型进行训练,得到预设预测模型之前,还包括:
对所述多个测井参数样本和所述多个总有机碳含量样本进行异常数据筛选,得到多个优选测井参数样本和所述多个优选测井参数样本对应的总有机碳含量样本;
相应的,所述将所述多个测井参数样本和所述多个总有机碳含量样本输入至所述初始预测模型进行训练,得到预设预测模型包括:
将所述多个优选测井参数样本和所述多个优选测井参数样本对应的总有机碳含量样本输入至所述初始预测模型进行训练,得到预设预测模型。
这里,本申请实施例在训练预设预测模型时,将大量的训练样本输入至初始预测模型之前,首次对训练样本中的异常数据进行了筛选,减少了获取样本时的数据采集误差、计算误差等误差对预设预测模型预测准确度的影响,进一步地提高了总有机碳含量的预测结果的准确性,进而提高了油气勘探的效率。
可选的,在所述将所述多个测井参数样本和所述多个总有机碳含量样本输入至所述初始预测模型进行训练,得到预设预测模型之后,还包括:
计算所述预设预测模型的决定系数;
根据所述决定系数,对所述预设预测模型进行优化。
这里,本申请实施例在确定预设预测模型之后,还可以计算预设预测模型的决定系数,通过决定系数,对预设预测模型进行进一步地优化,以提高总有机碳含量的预测结果准确度。
第二方面,本申请实施例提供一种预测总有机碳含量的装置,包括:
第一获取模块,用于获取待预测区域的测井参数;
第一处理模块,用于将所述测井参数输入至预设预测模型中,得到所述待预测区域的总有机碳含量,其中,所述预设预测模型通过多个测井参数样本和所述多个测井参数样本对应的总有机碳含量样本训练得到,所述预设预测模型通过模型核函数建立,所述模型核函数根据所述多个测井参数样本与所述多个测井参数样本对应的总有机碳含量样本的皮尔森系数确定;
判断模块,用于根据所述待预测区域的总有机碳含量,对所述待预测区域的油气资源丰度进行分析。
可选的,在所述第一处理模块将所述测井参数输入至预设预测模型中,得到所述待预测区域的总有机碳含量之前,上述装置还包括:
第二获取模块,用于获取测井资料数据,所述测井资料数据包括多个测井参数样本和所述多个测井参数样本对应的总有机碳含量样本;
计算模块,用于计算所述多个测井参数样本与所述多个测井参数样本对应的总有机碳含量样本的皮尔森系数;
确定模块,用于根据皮尔森系数确定模型核函数;
建立模块,用于通过所述模型核函数,建立初始预测模型;
第二处理模块,用于将所述多个测井参数样本和所述多个总有机碳含量样本输入至所述初始预测模型进行训练,得到预设预测模型。
可选的,所述确定模块具体用于:
若皮尔森系数的绝对值大于皮尔森系数阈值的测井参数样本的数量,大于总测井参数样本数量的二分之一,则确定模型核函数为线性核函数;
若皮尔森系数的绝对值大于皮尔森系数阈值的测井参数样本的数量,小于总测井参数样本数量的二分之一,则确定模型核函数为高斯核函数。
可选的,所述第二获取模块具体用于:
获取多个测井样品的历史测井资料数据,其中,所述多个测井样品来自于相同或者不同的油井;
根据测井参数与其对应测井样品数的多寡,以及TOC对测井参数的敏感程度,确立建立模型所需的测井参数;
根据所述建立模型所需的测井参数,获取测井参数样本和所述多个测井参数样本对应的总有机碳含量样本。
可选的,在所述第二处理模块将所述多个测井参数样本和所述多个总有机碳含量样本输入至所述初始预测模型进行训练,得到预设预测模型之前,上述装置还包括:
筛选模块,用于对所述多个测井参数样本和所述多个总有机碳含量样本进行异常数据筛选,得到多个优选测井参数样本和所述多个优选测井参数样本对应的总有机碳含量样本;
相应的,所述第二处理模块具体用于:
将所述多个优选测井参数样本和所述多个优选测井参数样本对应的总有机碳含量样本输入至所述初始预测模型进行训练,得到预设预测模型。
可选的,在所述第二处理模块将所述多个测井参数样本和所述多个总有机碳含量样本输入至所述初始预测模型进行训练,得到预设预测模型之后,上述装置还包括优化模块,用于:
计算所述预设预测模型的决定系数;
根据所述决定系数,对所述预设预测模型进行优化。
第三方面,本申请实施例提供一种预测总有机碳含量的设备,包括:至少一个处理器和存储器;
所述存储器存储计算机执行指令;
所述至少一个处理器执行所述存储器存储的计算机执行指令,使得所述至少一个处理器执行如上第一方面以及第一方面各种可能的设计所述的预测总有机碳含量的方法。
第四方面,本发明实施例提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如上第一方面以及第一方面各种可能的设计所述的预测总有机碳含量的方法。
第五方面,本发明实施例提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时,实现如上第一方面以及第一方面各种可能的设计所述的预测总有机碳含量的方法。
本申请实施例提供的预测总有机碳含量的方法、装置、设备及存储介质,其中该方法在通过总有机碳含量进行油气勘探时,首先获取待预测区域的测井参数,通过将测井参数输入至预设预测模型,即可得到待预测区域的有机碳含量预测结果,无需获取大量的测井样品及测井参数,降低了预测成本及油气勘探成本,本申请实施例的预设预测模型在建立时引入了模型核函数,将低维度的训练样本映射到高维空间中,使得预设预测模型更能够准确地反映出非均质的地层中总有机碳含量与测井参数之间复杂的关系,总有机碳含量的预测结果更加的准确,提高了油气资源确定的准确性,提高了油气勘探的效率。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种预测总有机碳含量的系统架构示意图;
图2为本申请实施例提供的一种预测总有机碳含量的方法的流程示意图;
图3为本申请实施例提供的一种测井资料数据的参数示意图;
图4为本申请实施例提供的一种预设预测模型的预测结果示意图;
图5为本申请实施例提供的一种预测总有机碳含量的装置的结构示意图;
图6为本申请实施例提供的一种预测总有机碳含量的设备的结构示意图。
通过上述附图,已示出本公开明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本公开构思的范围,而是通过参考特定实施例为本领域技术人员说明本公开的概念。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”及“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
总有机碳含量是评价烃源岩生烃能力的主要指标之一,其大小直接关系到研究区油气来源的判别和资源潜力的计算,是油气勘探领域中生烃研究和资源评价的一项重要参数。
相关技术中,计算总有机碳含量的方法主要有以下几种:△logR法、改进的△logR法、多元回归法和MLP神经网络法等,在获取测井数据后,将测井数据带入上述现有公式,计算总有机碳含量。虽然基于测井数据预测TOC取得了很大成就,但是总体预测精读不高,并且受测井数据误差的影响很大,TOC含量与测井数据之间的复杂关系也加剧了预测的不确定性。油气勘探人工智能领域拟采用多参数预测TOC,期望降低页岩的有机非均质性对预测模型的影响,以提高页岩油勘探开发的效益。
然而现有技术存在难以准确预测总有机碳含量,油气勘探的准确性低,而且需要大量测井数据样本,预测成本高,油气勘探成本高的技术问题。
为了解决上述问题,本申请实施例提供一种预测总有机碳含量的方法、装置、设备及存储介质,在通过总有机碳含量进行油气勘探时,首先获取待预测区域的测井参数,通过将测井参数输入至预设预测模型,即可得到待预测区域的有机碳含量预测结果,无需获取大量的测井样品及测井参数,降低了预测成本及油气勘探成本,本申请实施例的预设预测模型在建立时引入了模型核函数,将低维度的训练样本映射到高维空间中,使得预设预测模型更能够准确地反映出非均质的油井中总有机碳含量与测井参数之间复杂的关系。
可选的,图1为本申请实施例提供的一种预测总有机碳含量的系统架构示意图。在图1中,上述架构包括接收装置101、处理器102和显示装置103中至少一种。
可以理解的是,本申请实施例示意的结构并不构成对预测总有机碳含量的系统架构的具体限定。在本申请另一些可行的实施方式中,上述架构可以包括比图示更多或更少的部件,或者组合某些部件,或者拆分某些部件,或者不同的部件布置,具体可根据实际应用场景确定,在此不做限制。图1所示的部件可以以硬件,软件,或软件与硬件的组合实现。
在具体实现过程中,接收装置101可以是输入/输出接口,也可以是通信接口。
处理器102可以在通过总有机碳含量进行油气勘探时,首先获取待预测区域的测井参数,通过将测井参数输入至预设预测模型,即可得到待预测区域的有机碳含量预测结果,无需获取大量的测井样品及测井参数,降低了预测成本及油气勘探成本,本申请实施例的预设预测模型在建立时引入了模型核函数,将低维度的训练样本映射到高维空间中,使得预设预测模型更能够准确地反映出非均质的油井中总有机碳含量与测井参数之间复杂的关系。
显示装置103可以用于对上述结果等进行显示。
显示装置还可以是触摸显示屏,用于在显示的上述内容的同时接收用户指令,以实现与用户的交互。
应理解,上述处理器可以通过处理器读取存储器中的指令并执行指令的方式实现,也可以通过芯片电路实现。
另外,本申请实施例描述的网络架构以及业务场景是为了更加清楚的说明本申请实施例的技术方案,并不构成对于本申请实施例提供的技术方案的限定,本领域普通技术人员可知,随着网络架构的演变和新业务场景的出现,本申请实施例提供的技术方案对于类似的技术问题,同样适用。
下面结合具体的实施例对本申请的技术方案进行详细的说明:
可选的,图2为本申请实施例提供的一种预测总有机碳含量的方法的流程示意图。本申请实施例的执行主体可以为图1中的处理器102,具体执行主体可以根据实际应用场景确定。如图2所示,该方法包括如下步骤:
S201:获取待预测区域的测井参数。
可选的,这里的测井参数可以包括自然电位(SP)、自然伽马(GR)、补偿中子(CN)、声波时差(AC)、补偿密度(DEN)、深感应电阻率(RILD)、中感应电阻率(RILM)和电阻率测井(RT)等中的一个或多个。
可选的,本申请实施例可以结合测井样品的历史测井资料数据确定进行总有机碳含量预测需要的测井参数种类。
S202:将测井参数输入至预设预测模型中,得到待预测区域的总有机碳含量。
其中,预设预测模型通过多个测井参数样本和多个测井参数样本对应的总有机碳含量样本训练得到,预设预测模型通过模型核函数建立,模型核函数根据多个测井参数样本与多个测井参数样本对应的总有机碳含量样本的皮尔森系数确定。
可选的,在将测井参数输入至预设预测模型中,得到待预测区域的总有机碳含量之前,还需要预先建立预设预测模型,建立预设预测模型的具体步骤包括:
步骤一:获取测井资料数据,测井资料数据包括多个测井参数样本和多个测井参数样本对应的总有机碳含量样本。
具体的,获取测井资料数据包括:
获取多个测井样品的历史测井资料数据,其中,多个测井样品来自于相同或者不同的油井;根据测井参数与其对应测井样品数的多寡,以及总有机碳对测井参数的敏感程度,确立建立模型所需的测井参数,或根据同一油井的测井样品数和多个测井样品的历史测井资料数据中的不同参数的数量,确定建立模型所需的测井参数;根据建立模型所需的测井参数,获取测井参数样本和多个测井参数样本对应的总有机碳含量样本。
如图3所示,图3为本申请实施例提供的一种测井资料数据的参数示意图,本申请实施例可以通过图3所示的测井资料数据的参数示意图中的数据,综合考虑测井资料的丰富程度、TOC的测井响应敏感程度和实测TOC样品数,优选出建模所需的测井参数,进行测井参数的筛选。例如图3中多个油井的RT参数平均较少,因此不将RT参数确定为测井参数。
本申请实施例在获取测井资料数据时,首先可以获取大量的测井样品的历史测井资料数据,这里的历史资料数据包括多种参数,本申请实施例结合同一油井的测井样品数和历史测井资料数据中的不同参数的数量,确定建立模型所需的测井参数,将对总有机碳含量影响较小的参数和获取困难的参数进行筛选,确定了对总有机碳含量预测密切相关的测井参数,从而在总有机碳含量预测时,减少了无用参数的获取,减少了成本,同时,也提高了总有机碳含量的预测结果的准确性,进一步的提高了油气勘探的效率。
步骤二:计算多个测井参数样本与多个测井参数样本对应的总有机碳含量样本的皮尔森系数。
其中,计算皮尔森系数的公式如下:
Figure BDA0002977048310000101
其中,ρ为皮尔森系数,上述公式中X,Y表示两个变量,σXσY表示两个变量的标准差,两个变量之间的协方差和两者标准差乘积的比值即为两个变量的皮尔森系数,将多个测井参数样本与多个测井参数样本对应的总有机碳含量样本带入上式X,Y即可求得两者之间的皮尔森系数。
步骤三:根据皮尔森系数确定模型核函数。
可选的,根据皮尔森系数确定模型核函数包括:
若皮尔森系数的绝对值大于皮尔森系数阈值的测井参数样本的数量,大于总测井参数样本数量的二分之一,则确定模型核函数为线性核函数;
若皮尔森系数的绝对值大于皮尔森系数阈值的测井参数样本的数量,小于总测井参数样本数量的二分之一,则确定模型核函数为高斯核函数。
可以理解的是,这里的皮尔森系数阈值可以根据实际情况确定,本申请实施例对此不作具体限制。
例如,皮尔森系数强线性相关阈值为0.6,则若皮尔森系数绝对值大于0.6的测井参数多于一半,则优选这些与TOC强相关的测井参数进行建模,模型核函数采用线性核函数,若皮尔森系数绝对值大于0.6的测井参数小于一半,则无需进一步优选,测井参数进行建模,模型核函数采用高斯核函数,若皮尔森系数绝对值大于0.6的测井参数恰好为一半,则需比对两种模型的预测效果。
这里,本申请实施例根据皮尔森系数的绝对值是否大于皮尔森系数阈值的测井参数样本的数量,确定模型核函数的类型,即根据测井样品的测井参数与总有机碳含量的相关性确定模型核函数的类型,使得预设预测模型的权重更加准确,进一步地提高了总有机碳含量的预测结果的准确性,提高了油气资源确定的准确性,提高了油气勘探的效率。
步骤四:通过模型核函数,建立初始预测模型。
可选的,这里的初始预测模型,采用支持向量回归算法进行预测,其公式如下:
Figure BDA0002977048310000111
其中,x为测井数据构成的多维空间;
Figure BDA0002977048310000112
αi为拉格朗日乘子;κ(x,xi)为高斯核函数,b为常数项。
步骤五:将多个测井参数样本和多个总有机碳含量样本输入至初始预测模型进行训练,得到预设预测模型。
可选的,在将多个测井参数样本和多个总有机碳含量样本输入至初始预测模型进行训练,得到预设预测模型之前,还包括:
对多个测井参数样本和多个总有机碳含量样本进行异常数据筛选,得到多个优选测井参数样本和多个优选测井参数样本对应的总有机碳含量样本;
相应的,将多个测井参数样本和多个总有机碳含量样本输入至初始预测模型进行训练,得到预设预测模型包括:
将多个优选测井参数样本和多个优选测井参数样本对应的总有机碳含量样本输入至初始预测模型进行训练,得到预设预测模型。
由于地质条件的复杂性,或者数据测量和计算的误差,测井参数可能存在异常值,需删除异常数据。此异常数据的筛选可以通过预设阈值进行确定,也可以通过现有数据的平均值等进行概率的选择。
这里,本申请实施例在训练预设预测模型时,将大量的训练样本输入至初始预测模型之前,首次对训练样本中的异常数据进行了筛选,减少了获取样本时的数据采集误差及计算误差等误差对预设预测模型预测准确度的影响,进一步地提高了总有机碳含量的预测结果的准确性,进一步的提高了油气勘探的效率。
可选的,在将样本数据输入至初始预测模型训练之前,可以首先对样本数据进行归一化处理,从而便于处理,提高准确性。
可选的,在将多个测井参数样本和多个总有机碳含量样本输入至初始预测模型进行训练,得到预设预测模型之后,还包括:
计算预设预测模型的决定系数;
根据决定系数,对预设预测模型进行优化。
具体的,决定系数评估模型性能的公式如下:
Figure BDA0002977048310000121
其中,R2为决定系数,y为模型的输出,
Figure BDA0002977048310000122
为所有输出值的平均值。
若训练集和测试集的决定系数均小于预设评估阈值,可以重新训练模型以优化模型的系数。
这里,本申请实施例在确定预设预测模型之后,还可以计算预设预测模型的决定系数,通过决定系数,对预设预测模型进行进一步地优化,以提高总有机碳含量的预测结果准确度。
示范性的,图4为本申请实施例提供的一种预设预测模型的预测结果示意图,图中点表示实测总有机碳含量,折线为预测的总有机碳含量的回归曲线,由图4所示,预设的回归曲线与实测总有机碳含量基本吻合。
这里,本申请实施例提供了一种建立预测总有机碳含量的预设预测模型的方法,通过测井参数样本与测井参数样本对应的总有机碳含量样本的皮尔森系数确定了模型核函数,通过反映测井参数样本与测井参数样本对应的总有机碳含量样本的相关性的皮尔森系数,确定的模型核函数更能准确反映总有机碳含量与测井参数之间复杂的关系,总有机碳含量的预测结果更加的准确,进一步地提高了油气资源确定的准确性,提高了油气勘探的效率。
S203:根据待预测区域的总有机碳含量,对待预测区域的油气资源丰度进行分析。
本申请实施例在通过总有机碳含量进行油气勘探时,首先获取待预测区域的测井参数,通过将测井参数输入至预设预测模型,即可得到待预测区域的有机碳含量预测结果,无需获取大量的测井样品及测井参数,降低了预测成本及油气勘探成本,本申请实施例的预设预测模型在建立时引入了模型核函数,将低维度的训练样本映射到高维空间中,使得预设预测模型更能够准确地反映出非均质的油井中总有机碳含量与测井参数之间复杂的关系,总有机碳含量的预测结果更加的准确,提高了油气资源确定的准确性,提高了油气勘探的效率。
图5为本申请实施例提供的一种预测总有机碳含量的装置的结构示意图,如图5所示,本申请实施例的装置包括:第一获取模块501、第一处理模块502、和判断模块503。这里的预测总有机碳含量的装置可以是上述处理器102本身,或者是实现处理器102的功能的芯片或者集成电路。这里需要说明的是,第一获取模块501、第一处理模块502、和判断模块503的划分只是一种逻辑功能的划分,物理上两者可以是集成的,也可以是独立的。
其中,第一获取模块501,用于获取待预测区域的测井参数;
第一处理模块502,用于将测井参数输入至预设预测模型中,得到待预测区域的总有机碳含量,其中,预设预测模型通过多个测井参数样本和多个测井参数样本对应的总有机碳含量样本训练得到,预设预测模型通过模型核函数建立,模型核函数根据多个测井参数样本与多个测井参数样本对应的总有机碳含量样本的皮尔森系数确定;
判断模块503,用于根据待预测区域的总有机碳含量,对待预测区域的油气资源丰度进行分析。
可选的,在第一处理模块502将测井参数输入至预设预测模型中,得到待预测区域的总有机碳含量之前,上述装置还包括:
第二获取模块,用于获取测井资料数据,测井资料数据包括多个测井参数样本和多个测井参数样本对应的总有机碳含量样本;
计算模块,用于计算多个测井参数样本与多个测井参数样本对应的总有机碳含量样本的皮尔森系数;
确定模块,用于根据皮尔森系数确定模型核函数;
建立模块,用于通过模型核函数,建立初始预测模型;
第二处理模块,用于将多个测井参数样本和多个总有机碳含量样本输入至初始预测模型进行训练,得到预设预测模型。
可选的,确定模块具体用于:
若皮尔森系数的绝对值大于皮尔森系数阈值的测井参数样本的数量,大于总测井参数样本数量的二分之一,则确定模型核函数为线性核函数;
若皮尔森系数的绝对值大于皮尔森系数阈值的测井参数样本的数量,小于总测井参数样本数量的二分之一,则确定模型核函数为高斯核函数。
可选的,第二获取模块具体用于:
获取多个测井样品的历史测井资料数据,其中,多个测井样品来自于相同或者不同的油井;
根据测井参数与其对应测井样品数的多寡,以及总有机碳对测井参数的敏感程度,确立建立模型所需的测井参数;
根据建立模型所需的测井参数,获取测井参数样本和多个测井参数样本对应的总有机碳含量样本。
可选的,在第二处理模块将多个测井参数样本和多个总有机碳含量样本输入至初始预测模型进行训练,得到预设预测模型之前,上述装置还包括:
筛选模块,用于对多个测井参数样本和多个总有机碳含量样本进行异常数据筛选,得到多个优选测井参数样本和多个优选测井参数样本对应的总有机碳含量样本;
相应的,第二处理模块具体用于:
将多个优选测井参数样本和多个优选测井参数样本对应的总有机碳含量样本输入至初始预测模型进行训练,得到预设预测模型。
可选的,在第二处理模块将多个测井参数样本和多个总有机碳含量样本输入至初始预测模型进行训练,得到预设预测模型之后,上述装置还包括优化模块,用于:
计算预设预测模型的决定系数;
根据决定系数,对预设预测模型进行优化。
图6为本申请实施例提供的一种预测总有机碳含量的设备的结构示意图。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不限制本文中描述的和/或者要求的本申请的实现。
如图6所示,该预测总有机碳含量的设备包括:处理器601和存储器602,各个部件利用不同的总线互相连接,并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器601可以对在预测总有机碳含量的设备内执行的指令进行处理,包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如,耦合至接口的显示设备)上显示的图形信息的指令。在其它实施方式中,若需要,可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。图6中以一个处理器601为例。
存储器602作为一种非瞬时计算机可读存储介质,可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块,如本申请实施例中的预测总有机碳含量的设备的方法对应的程序指令/模块(例如,附图5所示的第一获取模块501、第一处理模块502和判断模块503)。处理器601通过运行存储在存储器602中的非瞬时软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例中的预测总有机碳含量的设备的方法。
预测总有机碳含量的设备还可以包括:输入装置603和输出装置604。处理器601、存储器602、输入装置603和输出装置604可以通过总线或者其他方式连接,图6中以通过总线连接为例。
输入装置603可接收输入的数字或字符信息,以及产生与预测总有机碳含量的设备的用户设置以及功能控制有关的键信号输入,例如触摸屏、小键盘、鼠标、或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置604可以是预测总有机碳含量的设备的显示设备等输出设备。该显示设备可以包括但不限于,液晶显示器(LCD)、发光二极管(LED)显示器和等离子体显示器。在一些实施方式中,显示设备可以是触摸屏。
本申请实施例的预测总有机碳含量的设备,可以用于执行本申请上述各方法实施例中的技术方案,其实现原理和技术效果类似,此处不再赘述。
本申请实施例还提供一种计算机可读存储介质,该计算机可读存储介质中存储有计算机执行指令,计算机执行指令被处理器执行时用于实现上述任一项所述的预测总有机碳含量的方法。
本申请实施例还提供一种计算机程序产品,包括计算机程序,计算机程序被处理器执行时,用于实现上述任一项所述的预测总有机碳含量的方法。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求书指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求书来限制。

Claims (10)

1.一种预测总有机碳含量的方法,其特征在于,包括:
获取待预测区域的测井参数;
将所述测井参数输入至预设预测模型中,得到所述待预测区域的总有机碳含量,其中,所述预设预测模型通过多个测井参数样本和所述多个测井参数样本对应的总有机碳含量样本训练得到,所述预设预测模型通过模型核函数建立,所述模型核函数根据所述多个测井参数样本与所述多个测井参数样本对应的总有机碳含量样本的皮尔森系数确定;
根据所述待预测区域的总有机碳含量,对所述待预测区域的油气资源丰度进行分析。
2.根据权利要求1所述的方法,其特征在于,在将所述测井参数输入至预设预测模型中,得到所述待预测区域的总有机碳含量之前,还包括:
获取测井资料数据,所述测井资料数据包括多个测井参数样本和所述多个测井参数样本对应的总有机碳含量样本;
计算所述多个测井参数样本与所述多个测井参数样本对应的总有机碳含量样本的皮尔森系数;
根据皮尔森系数确定模型核函数;
通过所述模型核函数,建立初始预测模型;
将所述多个测井参数样本和所述多个总有机碳含量样本输入至所述初始预测模型进行训练,得到预设预测模型。
3.根据权利要求2所述的方法,其特征在于,所述根据皮尔森系数确定模型核函数包括:
若皮尔森系数的绝对值大于皮尔森系数阈值的测井参数样本的数量,大于总测井参数样本数量的二分之一,则确定模型核函数为线性核函数;
若皮尔森系数的绝对值大于皮尔森系数阈值的测井参数样本的数量,小于总测井参数样本数量的二分之一,则确定模型核函数为高斯核函数。
4.根据权利要求2所述的方法,其特征在于,所述获取测井资料数据包括:
获取多个测井样品的历史测井资料数据,其中,所述多个测井样品来自于相同或者不同的油井;
根据测井参数与其对应测井样品数的多寡,以及总有机碳对测井参数的敏感程度,确立建立模型所需的测井参数;
根据所述建立模型所需的测井参数,获取测井参数样本和所述多个测井参数样本对应的总有机碳含量样本。
5.根据权利要求2所述的方法,其特征在于,在所述将所述多个测井参数样本和所述多个总有机碳含量样本输入至所述初始预测模型进行训练,得到预设预测模型之前,还包括:
对所述多个测井参数样本和所述多个总有机碳含量样本进行异常数据筛选,得到多个优选测井参数样本和所述多个优选测井参数样本对应的总有机碳含量样本;
相应的,所述将所述多个测井参数样本和所述多个总有机碳含量样本输入至所述初始预测模型进行训练,得到预设预测模型包括:
将所述多个优选测井参数样本和所述多个优选测井参数样本对应的总有机碳含量样本输入至所述初始预测模型进行训练,得到预设预测模型。
6.根据权利要求2至5任一项所述的方法,其特征在于,在所述将所述多个测井参数样本和所述多个总有机碳含量样本输入至所述初始预测模型进行训练,得到预设预测模型之后,还包括:
计算所述预设预测模型的决定系数;
根据所述决定系数,对所述预设预测模型进行优化。
7.一种预测总有机碳含量的装置,其特征在于,包括:
第一获取模块,用于获取待预测区域的测井参数;
第一处理模块,用于将所述测井参数输入至预设预测模型中,得到所述待预测区域的总有机碳含量,其中,所述预设预测模型通过多个测井参数样本和所述多个测井参数样本对应的总有机碳含量样本训练得到,所述预设预测模型通过模型核函数建立,所述模型核函数根据所述多个测井参数样本与所述多个测井参数样本对应的总有机碳含量样本的皮尔森系数确定;
判断模块,用于根据所述待预测区域的总有机碳含量,对所述待预测区域的油气资源丰度进行分析。
8.一种预测总有机碳含量的设备,其特征在于,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1至6任一项所述的预测总有机碳含量的方法。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如权利要求1至6任一项所述的预测总有机碳含量的方法。
10.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6任一项所述的预测总有机碳含量的方法。
CN202110277013.3A 2021-03-15 2021-03-15 预测总有机碳含量的方法、装置、设备及存储介质 Pending CN113065279A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110277013.3A CN113065279A (zh) 2021-03-15 2021-03-15 预测总有机碳含量的方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110277013.3A CN113065279A (zh) 2021-03-15 2021-03-15 预测总有机碳含量的方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN113065279A true CN113065279A (zh) 2021-07-02

Family

ID=76560875

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110277013.3A Pending CN113065279A (zh) 2021-03-15 2021-03-15 预测总有机碳含量的方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN113065279A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113738353A (zh) * 2021-09-28 2021-12-03 中国石油大学(北京) 一种含油页岩可动油量预测方法、系统、设备和存储介质
CN114492757A (zh) * 2022-01-29 2022-05-13 中国石油化工股份有限公司 模型训练方法、测井信息预测方法、装置和设备
CN115796350A (zh) * 2022-11-23 2023-03-14 长江大学 一种海域内少井区烃源岩总有机碳含量预测方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110390419A (zh) * 2019-05-20 2019-10-29 重庆大学 基于pso-lssvm模型的高速公路收费站流量预测方法
CN111580179A (zh) * 2019-01-30 2020-08-25 中国石油天然气股份有限公司 一种有机碳含量确定方法、装置及系统
CN111931307A (zh) * 2020-08-11 2020-11-13 西北工业大学 一种零件质量预测和评估优化方法及系统
CN112183676A (zh) * 2020-11-10 2021-01-05 浙江大学 一种基于混合降维与核函数极限学习机的水质软测量方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111580179A (zh) * 2019-01-30 2020-08-25 中国石油天然气股份有限公司 一种有机碳含量确定方法、装置及系统
CN110390419A (zh) * 2019-05-20 2019-10-29 重庆大学 基于pso-lssvm模型的高速公路收费站流量预测方法
CN111931307A (zh) * 2020-08-11 2020-11-13 西北工业大学 一种零件质量预测和评估优化方法及系统
CN112183676A (zh) * 2020-11-10 2021-01-05 浙江大学 一种基于混合降维与核函数极限学习机的水质软测量方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
崔海波;杨浩楠;耿向瑾;李斌;邓煜;: "基于支持向量机的脱硝效率预测模型研究", 电力科学与工程 *
陈亚琳: ""涪陵页岩气田焦石坝地区含气量定量预测技术"", 《海洋地质前沿》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113738353A (zh) * 2021-09-28 2021-12-03 中国石油大学(北京) 一种含油页岩可动油量预测方法、系统、设备和存储介质
CN114492757A (zh) * 2022-01-29 2022-05-13 中国石油化工股份有限公司 模型训练方法、测井信息预测方法、装置和设备
CN114492757B (zh) * 2022-01-29 2023-11-10 中国石油化工股份有限公司 模型训练方法、测井信息预测方法、装置和设备
CN115796350A (zh) * 2022-11-23 2023-03-14 长江大学 一种海域内少井区烃源岩总有机碳含量预测方法及系统

Similar Documents

Publication Publication Date Title
CN113065279A (zh) 预测总有机碳含量的方法、装置、设备及存储介质
CN109115987B (zh) 一种基于岩石物理模型的流体因子的评价方法及装置
AU2011283109A1 (en) Systems and methods for predicting well performance
CA3109021C (en) Facilitating hydrocarbon exploration by applying a machine-learning model to basin data
NO20211138A1 (en) System and methods for determining grid cell count for reservoir simulation
Anyosa et al. Assessing the value of seismic monitoring of CO2 storage using simulations and statistical analysis
CN113537702A (zh) 地质甜点评价方法、装置、设备及存储介质
US9864354B2 (en) Hierarchical modeling of physical systems and their uncertainties
CN112112618A (zh) 一种基于流程化的压裂选井选层方法及系统
CN110226109B (zh) 增强的地质服务表征
CN113327070B (zh) 智能勘查煤系气的方法、装置及电子设备
AU2022293890A1 (en) Systems and methods for mapping seismic data to reservoir properties for reservoir modeling
US11681072B2 (en) Method and system for ranking reactivities for kinetics assignment in basin modeling
US11434757B2 (en) Direct hydrocarbon indicators analysis informed by machine learning processes
CN113887076A (zh) 基于数学模型对页岩地质条件进行综合评价与分析的方法及装置
CN112253101A (zh) 油气资源勘探方法、装置、设备及计算机可读存储介质
Conde et al. Use of Double Machine Learning for Microseismic Data Analysis: What Factors Influence Microseismic Events?
CN112780267B (zh) 一种成藏可能性确定方法、装置和设备
Kapageridis et al. Integration of a neural ore grade estimation tool in a 3D resource modeling package
US11953647B2 (en) System and method for radioactivity prediction to evaluate formation productivity
US11942190B2 (en) Method and system for evaluating reactivity in source rock evaluation
CN115526017A (zh) 油藏剩余油饱和度确定方法、装置、电子设备及介质
CN117908156A (zh) 一种基于参数耦合评价模型评价页岩油地质的方法及系统
Song et al. Probabilistic classification of surrounding rock mass of tunnels based on fully Bayesian Gaussian process classification (fB‐GPC) with consideration of influencing factors selection
Cai et al. Modifying the Tailored Clustering Enabled Regionalization (TCER) framework for outlier site detection and inference efficiency

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination