CN111949945B - 一种确定烃源岩总有机碳含量的方法、装置、设备及系统 - Google Patents

一种确定烃源岩总有机碳含量的方法、装置、设备及系统 Download PDF

Info

Publication number
CN111949945B
CN111949945B CN202010738235.6A CN202010738235A CN111949945B CN 111949945 B CN111949945 B CN 111949945B CN 202010738235 A CN202010738235 A CN 202010738235A CN 111949945 B CN111949945 B CN 111949945B
Authority
CN
China
Prior art keywords
curve
carbon content
preset
organic carbon
total organic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010738235.6A
Other languages
English (en)
Other versions
CN111949945A (zh
Inventor
谢然红
王宵宇
徐陈昱
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China University of Petroleum Beijing
Original Assignee
China University of Petroleum Beijing
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China University of Petroleum Beijing filed Critical China University of Petroleum Beijing
Priority to CN202010738235.6A priority Critical patent/CN111949945B/zh
Publication of CN111949945A publication Critical patent/CN111949945A/zh
Application granted granted Critical
Publication of CN111949945B publication Critical patent/CN111949945B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/24Earth materials
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01VGEOPHYSICS; GRAVITATIONAL MEASUREMENTS; DETECTING MASSES OR OBJECTS; TAGS
    • G01V11/00Prospecting or detecting by methods combining techniques covered by two or more of main groups G01V1/00 - G01V9/00
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/30Assessment of water resources

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Mathematical Optimization (AREA)
  • Software Systems (AREA)
  • Chemical & Material Sciences (AREA)
  • General Life Sciences & Earth Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Computational Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Geophysics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Algebra (AREA)
  • Probability & Statistics with Applications (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Operations Research (AREA)
  • Databases & Information Systems (AREA)
  • Environmental & Geological Engineering (AREA)
  • Geology (AREA)
  • Remote Sensing (AREA)
  • Evolutionary Biology (AREA)
  • Food Science & Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • Immunology (AREA)

Abstract

本说明书提供了一种确定烃源岩总有机碳含量的方法、装置、设备及系统。所述方法包括获取常规测井数据;利用预设叠合面积模型对所述常规测井数据进行重叠处理,获得叠合面积曲线;所述叠合面积曲线随测井深度连续变化;将所述叠合面积曲线输入总有机碳含量计算模型,获得烃源岩总有机碳含量;其中,所述总有机碳含量计算模型的超参数信息基于叠合面积曲线、粒子群优化算法以及预设总有机碳含量数据预先训练获得,所述预设总有机碳含量数据基于对烃源岩的岩芯样本分析获得。利用本说明书实施例可以提高对烃源岩总有机碳含量预测的准确度。

Description

一种确定烃源岩总有机碳含量的方法、装置、设备及系统
技术领域
本申请涉及石油勘探开发技术领域,特别涉及一种确定烃源岩总有机碳含量的方法、装置、设备及系统。
背景技术
随着油气勘探开发的不断发展,非常规油气藏日益重要,页岩油气正逐渐成为常规油气的重要接替能源。总有机碳含量是评价烃源岩储层质量和生烃潜力的重要参数之一,对于总有机碳含量的准确评价十分重要。
目前,常用的烃源岩的总有机碳含量(TOC)的预测方法有多元统计回归方法和ΔlogR方法。然而,多元统计回归方法存在较强的地域性,在不同的地区需要选取不同的测井曲线计算TOC。ΔlogR方法需要人为确定曲线的基线值和成熟度参数,且应用地区的电阻率值不宜过小,当地层由于含气而导致测井曲线出现异常时,ΔlogR方法会失效。
发明内容
本说明书实施例提供了一种确定烃源岩总有机碳含量的方法、装置、设备及系统,可以更加准确的确定烃源岩总有机碳含量。
本说明书提供的一种确定烃源岩总有机碳含量的方法、装置、设备及系统是包括以下方式实现的。
一种确定烃源岩总有机碳含量的方法,包括:获取常规测井数据;利用预设叠合面积模型对所述常规测井数据进行重叠处理,获得叠合面积曲线;所述叠合面积曲线随测井深度连续变化;将所述叠合面积曲线输入总有机碳含量计算模型,获得烃源岩总有机碳含量;其中,所述总有机碳含量计算模型的超参数信息基于叠合面积曲线、粒子群优化算法以及预设总有机碳含量数据预先训练获得,所述预设总有机碳含量数据基于对烃源岩的岩芯样本分析获得。
一种总有机碳含量计算模型的训练方法,包括:构建预设支持向量回归模型;所述预设支持向量回归模型包括超参数信息;获取常规测井数据和预设总有机碳含量数据,所述预设总有机碳含量数据基于对烃源岩的岩芯样本分析获得;利用预设叠合面积模型对所述常规测井数据进行重叠处理,获得叠合面积曲线;所述叠合面积曲线随测井深度连续变化;基于所述叠合面积曲线、粒子群优化算法以及所述预设总有机碳含量数据对所述预设支持向量回归模型的超参数信息进行训练,获得总有机碳含量计算模型。
一种确定烃源岩总有机碳含量的装置,包括:测井数据获取模块,用于获取常规测井数据;叠合面积曲线获得模块,用于利用预设叠合面积模型对所述常规测井数据进行重叠处理,获得叠合面积曲线;所述叠合面积曲线随测井深度连续变化;总有机碳含量获得模块,用于将所述叠合面积曲线输入总有机碳含量计算模型,获得烃源岩总有机碳含量;其中,所述总有机碳含量计算模型的超参数信息基于叠合面积曲线、粒子群优化算法以及预设总有机碳含量数据预先训练获得,所述预设总有机碳含量数据基于对烃源岩的岩芯样本分析获得。
一种总有机碳含量计算模型的训练装置,包括:构建模块,用于构建预设支持向量回归模型;所述预设支持向量回归模型包括超参数信息;数据获取模块,用于获取常规测井数据和预设总有机碳含量数据,所述预设总有机碳含量数据基于对烃源岩的岩芯样本分析获得;重叠处理模块,用于利用预设叠合面积模型对所述常规测井数据进行重叠处理,获得叠合面积曲线;所述叠合面积曲线随测井深度连续变化;训练模块,用于基于所述叠合面积曲线、粒子群优化算法以及所述预设总有机碳含量数据对所述预设支持向量回归模型的超参数信息进行训练,获得总有机碳含量计算模型。
一种确定烃源岩总有机碳含量的设备,包括处理器及用于存储处理器可执行指令的存储器,所述指令被所述处理器执行时实现包括以下步骤:获取常规测井数据;利用预设叠合面积模型对所述常规测井数据进行重叠处理,获得叠合面积曲线;所述叠合面积曲线随测井深度连续变化;将所述叠合面积曲线输入总有机碳含量计算模型,获得烃源岩总有机碳含量;其中,所述总有机碳含量计算模型的超参数信息基于叠合面积曲线、粒子群优化算法以及预设总有机碳含量数据预先训练获得,所述预设总有机碳含量数据基于对烃源岩的岩芯样本分析获得。
一种确定烃源岩总有机碳含量的系统,包括至少一个处理器以及存储计算机可执行指令的存储器,所述处理器执行所述指令时实现本说明书实施例中任意一个实施例方法的步骤。
本说明书提供的一种确定烃源岩总有机碳含量的方法、装置、设备及系统。一些实施例中通过利用预设叠合面积模型将常规测井数据转化为叠合面积曲线,可以使获得的叠合面积曲线与岩芯分析的总有机碳含量的相关性相比于原始测井响应值更高,从而可以为后续提高预测准确度提供基础。通过预先基于叠合面积曲线与岩芯样本分析的总有机碳含量,利用粒子群优化算法确定预设支持向量回归模型的超参数,可以获得优化的总有机碳含量计算模型,从而可以使确定的烃源岩总有机碳含量的准确度更高。采用本说明书提供的实施方案,可以更加准确的确定烃源岩总有机碳含量。
附图说明
此处所说明的附图用来提供对本说明书的进一步理解,构成本说明书的一部分,并不构成对本说明书的限定。在附图中:
图1是本说明书提供的一种确定烃源岩总有机碳含量的方法的一个实施例的流程示意图;
图2是本说明书提供的确定烃源岩总有机碳含量的方法的一个具体实施例的流程示意图;
图3是本说明书提供的叠合面积模型应用效果的一个实施例的示意图;
图4(a)是本说明书提供的原始测井曲线与岩芯分析的总有机碳含量的相关性分析示意图;
图4(b)是本说明书提供的叠合面积曲线与岩芯分析的总有机碳含量的相关性分析示意图;
图5是本说明书提供的利用不同方法确定的烃源岩总有机碳含量与岩芯分析获得的总有机碳含量相关性对比示意图;
图6是本说明书提供的一种确定烃源岩总有机碳含量的装置的一个实施例的模块结构示意图;
图7是本说明书提供的一种总有机碳含量计算模型的训练装置的一个实施例的模块结构示意图;
图8是本说明书提供的一种确定烃源岩总有机碳含量的服务器的一个实施例的硬件结构框图。
具体实施方式
为了使本技术领域的人员更好地理解本说明书中的技术方案,下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书中的一部分实施例,而不是全部的实施例。基于本说明书中的一个或多个实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本说明书实施例保护的范围。
下面以一个具体的应用场景为例对本说明书实施方案进行说明。具体的,图1是本说明书提供的一种确定烃源岩总有机碳含量的方法的一个实施例的流程示意图。虽然本说明书提供了如下述实施例或附图所示的方法操作步骤或装置结构,但基于常规或者无需创造性的劳动在所述方法或装置中可以包括更多或者部分合并后更少的操作步骤或模块单元。
本说明书提供的一种实施方案可以应用到客户端、服务器等中。所述客户端可以包括终端设备,如智能手机、平板电脑等。所述服务器可以包括单台计算机设备,也可以包括多个服务器组成的服务器集群,或者分布式系统的服务器结构等。
需要说明的是,下述实施例描述并不对基于本说明书的其他可扩展到的应用场景中的技术方案构成限制。具体的一种实施例如图1所示,本说明书提供的一种确定烃源岩总有机碳含量的方法的一种实施例中,所述方法可以包括以下步骤。
S0:获取常规测井数据。
本说明书实施例中,常规测井数据可以理解为常规测井中岩芯样本的测井响应值。一些实施场景中,所述常规测井曲线可以包括声波时差曲线(AC)、补偿中子曲线(CNL)、密度曲线(DEN)、电阻率曲线(RT)和自然伽马曲线(GR)。本说明书一些实施例中,常规测井数据可以通过测井仪器在井下测量得到,也可以通过其他方式获得,本说明书对此不作限定。
本说明书一些实施例中,可以先将岩芯样本进行岩芯归位,然后获取岩芯样本的测井响应值。
一些实施场景中,在获取岩芯样本的测井响应值后,可以通过计算对应的标准偏差(Standard Deviation,SD),删除预设范围外的数据,从而减少异常数据对预测精度的影响。例如一些实施场景中,将314块岩芯样本进行岩芯归位,获取岩芯样本的测井响应值后,可以利用计算标准偏差(SD)的方法,删除±3.0×SD范围外的数据,保留310块岩芯,移除4块,从而减少异常数据对预测精度的影响。
S2:利用预设叠合面积模型对所述常规测井数据进行重叠处理,获得叠合面积曲线;所述叠合面积曲线随测井深度连续变化。
本说明书实施例中,在获取常规测井数据后,可以将常规测井数据基于预设叠合面积模型计算叠合面积曲线,作为初始输入数据。一些实施场景中,也可以将叠合面积曲线进行归一化处理后作为初始输入数据。本说明书实施例中,预设叠合面积模型可以用于将不同测井曲线进行叠加。叠合面积曲线可以由叠合面积模型计算得到。叠合面积参数可以更好的表征相对应地层的总有机碳含量。
本说明书一些实施例中,所述利用预设叠合面积模型对所述常规测井数据进行重叠处理,获得叠合面积曲线,可以包括:将所述常规测井曲线进行分组,获得预设数量的分组曲线;其中,每一分组曲线中包括两条不同曲线,所述常规测井曲线包括声波时差曲线、补偿中子曲线、密度曲线、电阻率曲线和自然伽马曲线;基于所述预设叠合面积模型,将所述每一分组曲线中的两条曲线进行重叠,获得叠合面积曲线。其中,预设数量可以根据实际场景确定,本说明书对此不作限定。
本说明书实施例中,可以优选AC和CNL、AC和GR、RT和GR、DEN和CNL、AC和DEN、AC和RT六种组合的叠合面积曲线。需要说明的是,一些实施例中,对常规测井曲线进行分组的方式还可以包括其他方式,例如可以选择三条曲线进行组合、选择除上述曲线外的其他曲线进行组合等。
本说明书一些实施例中,可以选AC和CNL、AC和GR、RT和GR、DEN和CNL、AC和DEN、AC和RT分别在贫有机页岩层段重叠,这样在富含有机质的烃源岩层段由测井响应差异形成的叠合面积可以表征相应深度的总有机碳含量。需要说明的是,在富含有机质的烃源岩层段,由于地层富含的烃类物质会导致测井曲线出现明显的响应变化,从而可以使得两条曲线出现明显的幅度差异。通过利用每组中2条测井曲线的幅度差异,可以构造一个叠合面积参数。其中,利用构造的叠合面积参数计算的值,由于是随测井深度连续变化的曲线,所以可以被称为叠合面积曲线。
本说明书一些实施例中,可以基于下述预设叠合面积模型获得6种组合的叠合面积曲线值:
其中,AC、CNL、GR、RT和DEN分别表示声波时差曲线(单位:us/m)、补偿中子曲线(单位:%)、自然伽马曲线(单位:API)、电阻率曲线(单位:Ω·m)和密度曲线(单位:g/cm3),ACleft、CNLleft、GRleft、RTleft、DENleft分别表示声波时差曲线、补偿中子曲线、自然伽马曲线、电阻率曲线和密度曲线的左刻度值,ACright、CNLright、GRright、RTright、DENright分别表示声波时差曲线、补偿中子曲线、自然伽马曲线、电阻率曲线和密度曲线的右刻度值,ΔS1、ΔS2、ΔS3、ΔS4、ΔS5和ΔS6分别表示6种组合的叠合面积曲线值。其中,曲线的左刻度值和右刻度值可以表示曲线的范围值,在曲线的左边称为左刻度值,右边称为右刻度值。
本说明书实施例中,由于叠合面积模型相比常规测井曲线可以更好的表征烃源岩中总有机碳含量,所以通过利用预设叠合面积模型将常规测井数据转化为叠合面积曲线,可以使获得的叠合面积曲线与岩芯分析的总有机碳含量的相关性相比于原始测井响应值更高,即具有更高的相关系数,从而可以为后续更加准确的确定烃源岩总有机碳含量提供基础。
S4:将所述叠合面积曲线输入总有机碳含量计算模型,获得烃源岩总有机碳含量;其中,所述总有机碳含量计算模型的超参数信息基于叠合面积曲线、粒子群优化算法以及预设总有机碳含量数据预先训练获得,所述预设总有机碳含量数据基于对烃源岩的岩芯样本分析获得。
本说明书实施例中,在获得叠合面积曲线后,可以将其输入总有机碳含量计算模型进行预测,从而获得烃源岩总有机碳含量。
本说明书一些实施例中,总有机碳含量计算模型可以是基于叠合面积曲线、粒子群优化算法以及预设总有机碳含量数据预先训练获得超参数信息的一种支持向量回归模型。其中,粒子群优化算法(Particle Swarm optimization,PSO)可以理解为是通过模拟鸟群觅食行为而发展起来的一种基于群体协作的随机搜索算法。PSO可以初始化为一群随机粒子(随机解),然后通过迭代找到最优解,在每一次迭代中,粒子通过跟踪两个“极值”来更新自己。第一个就是粒子本身所找到的最优解,这个解叫做个体极值pbest,另一个极值是整个种群找到的最优解,这个极值是全局极值gbest。
本说明书一些实施例中,预设总有机碳含量数据可以是利用岩石热解分析仪器对烃源岩的岩芯样本分析获得。其中,岩石热解分析仪器可以为ROCK-EVAL 6。对烃源岩的岩芯样本分析获得的总有机碳含量可以理解为是地球化学资料。由于岩芯分析实验通常需要很高的费用以及很长的周期,从而无法获得随测量深度连续变化的总有机碳含量。需要说明的是,总有机碳含量计算模型还可以是基于叠合面积曲线、粒子群优化算法以及预设总有机碳含量数据预先训练获得超参数信息的其他回归模型。
由于支持向量回归机的超参数对回归预测的精度影响很大,因此,在进行回归计算时,需要根据训练数据调整超参数值。
本说明书一些实施例中,所述总有机碳含量计算模型可以通过下述方式获得:构建预设支持向量回归模型;所述预设支持向量回归模型包括超参数信息;获取常规测井数据和预设总有机碳含量数据,所述预设总有机碳含量数据基于对烃源岩的岩芯样本分析获得;利用预设叠合面积模型对所述常规测井数据进行重叠处理,获得叠合面积曲线;所述叠合面积曲线随测井深度连续变化;基于所述叠合面积曲线、粒子群优化算法以及所述预设总有机碳含量数据对所述预设支持向量回归模型的超参数信息进行训练,获得总有机碳含量计算模型。一些实施场景中,总有机碳含量计算模型可以理解为是基于预设数据集和粒子群优化算法,对预设支持向量回归模型进行优化获得的支持向量回归机。其中,模型优化可以包括误差最小、预测效果较好等。预设支持向量回归模型可以理解为是一种支持向量回归机,其具体可以根据实际场景选择,支持向量回归机(Support Vector Regression,SVR)是支持向量机(Support Vector Machine,SVM)中的一个重要的应用分支。SVR回归与SVM分类的区别在于,SVR的样本点最终只有一类,它所寻求的最优超平面不是SVM使两类或多类样本点分的最开,而是使所有的样本点离超平面的总偏差最小。
本说明书一些实施例中,可以获取常规测井数据和预设总有机碳含量数据,然后利用预设叠合面积模型对常规测井数据进行重叠处理,获得叠合面积曲线,最后利用叠合面积曲线和预设总有机碳含量数据构建预设数据集。一些实施场景中,在构建预设数据集后,可以将所述预设数据集划分为训练数据和测试数据。其中,训练数据可以用于对模型进行训练。测试数据可以用于对训练获得的模型进行测试,从而确定性能较优模型。一些实施场景中,为了使训练获得的模型性能更好、更稳定,一些实施场景中,通常可以将预设数据集中的大部分数据作为训练数据,剩余的小部分作为测试数据。例如,采用K折交叉验证,可以将K-1折作为训练数据,剩余1折作为测试数据。其中,交叉验证可以在给定的建模样本中,利用大部分样本进行建模型,利用剩余的小部分样本和建立的模型进行预测。
本说明书一些实施例中,所述基于所述叠合面积曲线、粒子群优化算法以及所述预设总有机碳含量数据对所述预设支持向量回归模型的超参数信息进行训练,获得总有机碳含量计算模型,可以包括:确定第k次迭代过程中每个粒子的位置信息;将所述位置信息作为第k次迭代过程中所述预设支持向量回归模型的超参数信息,基于预设适应度函数获得每个粒子的适应度值;其中,预设适应度函数为交叉验证法中每次迭代过程中测试集误差的平均值,所述测试集中包括叠合面积曲线和预设总有机碳含量数据;根据k次迭代过程中相同粒子对应的适应度值,确定第k次迭代过程中每个粒子的最优适应度值;其中,所述最优适应度值为k次迭代过程中相同粒子对应的适应度值中的最小值;根据k次迭代过程中所有粒子对应的所有适应度值,确定第k次迭代过程中的目标适应度值;其中,所述目标适应度值为所有粒子对应的所有适应度值中的最小值;根据第k次迭代过程中的所述目标适应度值和每个粒子的最优适应度值,更新每个粒子的速度信息和位置信息;判断是否达到预设迭代次数,确定达到时,获取每个迭代过程对应的目标适应度值,并计算相邻迭代过程对应的目标适应度值的差,获得目标适应度值的变化信息;根据所述变化信息与预设阈值的关系,确定目标粒子的位置信息;将所述目标粒子对应的位置信息作为所述预设支持向量回归模型的超参数信息,获得总有机碳含量计算模型。
上述实施例中,在确定没有达到预设迭代次数时,可以将更新后位置信息作为第k+1次迭代过程中所述预设支持向量回归模型的超参数信息,基于预设适应度函数获得每个粒子的适应度值;根据相同粒子对应的k+1个适应度值,确定第k+1次迭代过程中每个粒子的最优适应度值;根据k+1次迭代过程中所有粒子对应的所有适应度值,确定第k+1次迭代过程中目标适应度值;根据第k+1次迭代过程中的所述目标适应度值和每个粒子的最优适应度值,更新每个粒子的位置信息,重复上述步骤,直至确定达到预设迭代次数。
上述实施例中,每个粒子的最优适应度值也可以称为每个粒子的局部最优适应度值或者个体极值(pbest)。目标适应度值可以称为全局最优解(gbest)。
上述实施例中,利用交叉验证法获得每个粒子对应的适应度值过程中利用的是预设测试集。其中,预设测试集中包括的叠合面积曲线作为输入变量,对应深度的总有机碳含量作为输出变量。在粒子群优化算法中,每个粒子都可以对应一个由适应度函数确定的适应值,然后每个粒子在搜索空间中单独搜寻最优解,并将其作为当前的个体极值(pbest),将个体极值与粒子群的其他粒子共享,可以找到当前全局最优解(gbest),所有粒子可以根据当前的个体极值和全局最优解更新速度信息和位置信息。
上述实施例中,粒子群优化算法的初始信息中可以包括粒子的数量、预设迭代次数、预设非负惯性因子w、预设加速常数c1和c2、预设寻优范围和预设适应度函数等。其中,粒子的数量、预设迭代次数、预设非负惯性因子w、预设加速常数c1和c2、预设寻优范围、预设适应度函数分别可以根据实际场景进行设定。适应度函数可以用于获取相应的适应度值。适应度函数也可以称为评价函数。一些实施场景中,可以选择计算误差、相关性等函数作为适应度函数。本实施例中,以预设适应度函数为交叉验证法中每次迭代过程中测试集误差的平均值为例进行说明。
上述实施例中,基于叠合面积曲线、粒子群优化算法以及预设总有机碳含量数据对预设支持向量回归模型的超参数信息进行训练初始时,每个粒子的速度信息为零,每个粒子的位置信息可以从预设寻优范围内随机确定。其中,位置信息和速度信息可以通过位置矢量表示,例如,某个粒子的位置矢量可以表示为Xi=(x1,x2,...,xN),速度矢量可以表示为Vi=(v1,v2,...,vN),i表示第i个粒子,x1、x2、...、xN分别表示位置参数,v1、v2、...、vN分别表示速度参数,1、2、…、N分别表示参数数量。其中,每个粒子的位置信息中包括的参数数量与预设支持向量回归模型的超参数信息中包括的参数数量相同。其中,位置信息可以基于速度信息更新。
一些实施场景中,在获得某次迭代过程中每个粒子对应的最优适应度值后,可以将每个粒子对应的最优适应度值放到一个集合中,从而获得对应的最优适应度值集合。其中,在最优适应度值集合中,粒子与最优适应度值相互对应。
一些实施场景中,可以根据下述公式更新每个粒子的速度信息和位置信息:
式中,和/>是在第k+1次迭代中,第i个粒子的第j个变量的速度矢量和位置矢量,/>和/>是在第k次迭代中,第i个粒子的第j个变量的速度矢量和位置矢量,c1和c2为加速常数,控制局部学习速率和全局学习速率,ω为非负惯性因子,对ω进行调整,可以对全局寻优性能和局部寻优性能进行调整,/>为第k次迭代中,第i个粒子的第j个变量的最优适应度值,/>为第k次迭代中,所有粒子的第j个变量的目标适应度值。
一些实施场景中,在达到预设迭代次数后,可以获取每个迭代过程对应的目标适应度值,并计算相邻迭代过程对应的目标适应度值的差,获得目标适应度值的变化信息。一些实施场景中,在获得变化信息后,可以将变化信息与预设阈值进行比较,获取第一个小于所述预设阈值时所对应的变化信息作为目标变化信息,最后将与目标变化信息对应的迭代过程中最大迭代次数对应的目标适应度值作为全局最优适应度值。其中,由于变化信息是相邻迭代过程对应的目标适应度值的差,所以一个变化信息可以对应两个迭代过程,每个迭代过程对应一个目标适应度值。例如,第1次迭代和第2次迭代对应变化信息1,第2次迭代和第3次迭代对应变化信息2,第3次迭代和第4次迭代对应变化信息3等。目标变化信息可以为变化信息1、变化信息2、变化信息3等中第一个小于预设阈值时的变化信息。预设阈值可以根据实际场景设置,例如0.01、0.03等。在获得目标变化信息后,可以将目标变化信息中靠后的迭代次数对应的迭代过程中的目标适应度值作为全局最优适应度值,例如,目标变化信息为变化信息3,则全局最优适应度值是第4次迭代过程中的目标适应度值。
一些实施场景中,在确定全局最优适应度值后,可以确定该全局最优适应度值对应粒子的位置信息,然后将该粒子对应的位置信息作为预设支持向量回归模型的超参数信息,从而获得总有机碳含量计算模型。
需要说明的是,每次迭代中,确定目标适应度值和每个粒子的最优适应度值的过程相似,可以相互参照,对此不作赘述。
例如一些实施场景中,包括粒子1和粒子2,粒子1的位置信息为X1=(x1,x2),粒子2的位置信息为X2=(x3,x4)。第1次迭代过程中,可以分别将X1=(x1,x2)、X2=(x3,x4)作为预设支持向量回归机的超参数,利用10折交叉验证法计算得到超参数为X1=(x1,x2)的10次测试数据的均方误差值和超参数为X2=(x3,x4)的10次测试数据的均方误差值,将X1=(x1,x2)对应的10次测试数据的均方误差值的平均值作为粒子1的适应度值,将X2=(x3,x4)对应的10次测试数据的均方误差值的平均值作为粒子2的适应度值,由于第1次迭代前没有迭代,相应的第1次迭代前没有粒子对应的适应度值,所以第1次迭代过程中粒子1的最优适应度值为粒子1的适应度值,第1次迭代过程中粒子2的最优适应度值为粒子2的适应度值,第1次迭代过程中的目标适应度值为粒子1和粒子2的适应度值中的最小值。进一步地,可以基于粒子1、粒子2的最优适应度值以及目标适应度值,利用公式(7)、(8)更新粒子1、粒子2的位置信息。
进一步地,第2次迭代过程中,可以分别将粒子1、粒子2更新后的位置信息作为预设支持向量回归机的超参数,利用10折交叉验证法获得粒子1、粒子2的适应度值,然后将第1次迭代过程中粒子1对应的适应度值和第2次迭代过程中粒子1对应的适应度值中的最小值作为第2次迭代过程中粒子1的最优适应度值,将第1次迭代过程中粒子2对应的适应度值和第2次迭代过程中粒子2对应的适应度值中的最小值作为第2次迭代过程中粒子2的最优适应度值,将第1次迭代过程中粒子1、粒子2对应的适应度值和第2次迭代过程中粒子1、粒子2对应的适应度值中的最小值作为第2次迭代过程中的目标适应度值。相应的,可以基于第2次迭代过程中粒子1、粒子2的最优适应度值以及目标适应度值,利用公式(7)、(8)更新粒子1、粒子2的位置信息。如此循环,直至达到预设迭代次数,停止迭代。
例如一些实施场景中,预设迭代次数为100,由于每次迭代对应一个目标适应度值,这样迭代截至时就有100个目标适应度值,可以将100个目标适应度值按照迭代次数的顺序排列,然后计算相邻目标适应度值的差值,获得表示目标适应度值变化的信息,最后,可以从这些变化信息中选择开始收敛时对应的迭代次数,将该迭代次数中目标适应度值对应的粒子的位置信息作为预设支持向量回归机的最优超参数,从而获得总有机碳含量计算模型。
本说明书实施例中,由于叠合面积曲线与岩芯分析的总有机碳含量的相关性相比于原始测井响应值更高,所以预先基于叠合面积曲线与岩芯分析的总有机碳含量,利用粒子群优化算法确定预设支持向量回归模型的超参数,可以获得性能较优的总有机碳含量计算模型,从而可以提高对烃源岩总有机碳含量预测的准确性。需要说明的是,回归模型预测效果主要基于输入变量和输出变量的相关性,两者的相关性越高,回归模型的预测效果越好。
下面结合一个具体实施例对上述方法进行说明,然而,值得注意的是,该具体实施例仅是为了更好地说明本申请,并不构成对本申请的不当限定。如图2所示,图2是本说明书提供的确定烃源岩总有机碳含量的方法的一个具体实施例的流程示意图。在本具体实施例中,可以包括以下步骤。
S201:获取常规测井数据及地球化学资料。
本实施例中,获取常规测井数据后,可以将常规测井数据基于叠合面积模型计算叠合面积曲线,并将叠合面积曲线归一化处理,作为初始输入数据。
例如,首先将314块岩芯样本进行岩芯归位,获取岩芯样本的测井响应值,然后利用SD方法,删除±3.0×SD范围外的数据,保留310块岩芯,移除4块。其次,选取AC和CNL、AC和GR、RT和GR、DEN和CNL、AC和DEN、AC和RT曲线分别基于公式(1)-(6)在贫有机页岩层段重叠,获得叠合面积曲线。
其中,地球化学资料可以理解为是对烃源岩的岩芯样本分析获得的与叠合面积曲线对应深度的总有机碳含量。
本实施例中,叠合面积模型的应用效果和左右刻度值如图3所示。其中,AC、CNL、GR、RT和DEN分别表示声波时差曲线(单位:us/m)、补偿中子曲线(单位:%)、自然伽马曲线(单位:API)、电阻率曲线(单位:Ω·m)和密度曲线(单位:g/cm3)。第一列Depth表示深度,单位m,XX50、XX75等表示深度;第二列表示AC和CNL对应的叠合面积曲线,第三列表示AC和GR对应的叠合面积曲线,第四列表示RT和GR对应的叠合面积曲线,第五列表示DEN和CNL对应的叠合面积曲线,第六列表示AC和DEN对应的叠合面积曲线,第七列表示AC和RT对应的叠合面积曲线,第八列Tmax表示最高热解峰温,单位℃,利用Tmax可以确定烃源岩成熟度。第二到第八列图头中的左右刻度可以用于表示曲线的取值范围,例如,第二列的AC曲线:左刻度值为25us/m,右刻度值为405us/m,CNL左刻度值为80%,右刻度值为-50%。需要说明的是,由于Tmax随着埋深是线性关系,受到地温、压力、埋深等影响,因此可以将Tmax作为大致评判烃源岩成熟度范围的指标。根据SYT 5735-1995陆相烃源岩地球化学评价方法中的规定,未成熟的烃源岩:Tmax<435℃,低成熟的烃源岩:435℃<Tmax<440℃,成熟的烃源岩:440℃<Tmax<450℃。
在图3中,从上至下,深度小于XX50m的部分表示贫有机页岩层段,XX50m~XX00m对应的部分表示低成熟烃源岩,XX00m~XX75m对应的部分表示成熟烃源岩,XX75m~XX80m对应的部分表示砂泥岩薄互层。可见,叠合面积曲线在未成熟的烃源岩中曲线重叠,在低成熟和成熟烃源岩层段中叠合面积逐渐增加,曲线具有明显的差异,在砂泥岩薄互层中曲线叠合面积差异较小,但仍有较好地识别效果。
如图4(a)、4(b)所示,图4(a)是本说明书提供的原始测井曲线与岩芯分析的总有机碳含量的相关性分析示意图,图4(b)是本说明书提供的叠合面积曲线与岩芯分析的总有机碳含量的相关性分析示意图。其中,纵坐标Core TOC表示总有机碳含量,R2表示相关系数。可见,叠合面积曲线与岩芯分析的总有机碳含量的相关性相比于原始测井响应值具有更高的相关系数,平均相关系数的平方提高了约32%。
S202:确定支持向量回归机的超参数。
本实施例中,将叠合面积曲线作为预设支持向量回归机的输入,将岩芯分析的总有机碳含量作为输出,利用粒子群优化算法求取预设支持向量回归机的超参数。
具体的,首先,构造一个Epsilon-SVR形式、高斯核函数的支持向量回归模型,不敏感损失函数ε=0.01。其次,确定粒子群优化算法的粒子数、迭代次数、非负惯性因子w、加速常数c1和c2、寻优范围和适应度函数。在本实施例中,粒子数为50,迭代次数为100,非负惯性因子为0.8,加速常数c1和c2均为0.5,惩罚系数C和核函数参数gamma的寻优范围分别设置为[1,30]和[0.0001,1],适应度函数为10折交叉验证法中测试集的平均均方误差。粒子群优化算法初始化一群随机粒子,每个粒子i在N维空间中被赋予一个位置矢量Xi=(x1,x2,...,xN)和速度矢量Vi=(v1,v2,...,vN),将每个粒子的位置矢量作为预设支持向量回归机的超参数,经过10折交叉验证计算得到10次测试集的均方误差值,将10次测试集的均方误差值的平均值作为每个粒子的适应度值,即个体极值pbest,将所有粒子的适应度值中最小值作为全局最小适应度值,即全局最优解gbest,然后根据个体极值和全局最优解调整速度和位置,直至完成所有迭代。最后,获取所有迭代过程对应的全局最优解,从中选取最小的全局最优解对应的迭代次数,相应的获取最小的全局最优解对应的位置信息。
本实施例中,最小的全局最优解对应的迭代次数为第59次,第59次迭代过程中,全局最优解对应的位置信息为(19.24,0.05),此时,可以将(19.24,0.05)作为预设支持向量回归机的最优超参数,从而获得总有机碳含量计算模型,即基于叠合面积曲线的粒子群优化支持向量回归机。
S203:预测烃源岩总有机碳含量。
本实施例中,利用基于叠合面积曲线的粒子群优化支持向量回归机预测烃源岩总有机碳含量。
本实施例中,将归一化处理后的叠合面积曲线输入总有机碳含量计算模型,获得烃源岩总有机碳含量的预测结果。
为了验证本说明书提供方法的有效性,利用方法一、方法二、本方法分别预测烃源岩总有机碳含量。其中,在方法一中,将原始测井曲线按照与岩芯分析的总有机碳含量的相关性进行排序,分为四组输入变量,将四组输入变量作为支持向量回归机的输入。在方法二中,利用ΔlogR方法的三种形式对岩芯分析的总有机碳含量进行预测。方法一和本方法的对比结果如表1所示,其中,RMSE(Root Mean Square Error)表示均方根误差、MSE(MeanSquare Error)表示均方误差、MAE(Mean Absolute Error)表示平均绝对误差。方法二和本方法的对比结果如图5所示,其中,纵坐标表示岩芯分析获得的总有机碳含量。ΔlogR(AC)表示将孔隙度曲线中的声波时差曲线作为ΔlogR方法的输入获得的烃源岩总有机碳含量,ΔlogR(CNL)表示将孔隙度曲线中的补偿中子曲线作为ΔlogR方法的输入获得的烃源岩总有机碳含量,ΔlogR(DEN)表示将孔隙度曲线中的密度曲线作为ΔlogR方法的输入获得的烃源岩总有机碳含量,SVR TOC表示利用本说明书中优化的支持向量回归机模型获得的烃源岩总有机碳含量,R表示相关系数,可以用于反映预测结果(即不同方法确定的烃源岩总有机碳含量)与实际值(即岩芯分析获得的总有机碳含量)的相关性,R值越高,代表预测效果越好。
表1方法一和本方法的对比结果
由表1和图5可知,叠合面积曲线与岩芯分析的总有机碳含量的相关性相比于原始测井响应值来说,具有更高的相关系数,因此相比于原始测井曲线,叠合面积模型更能表征烃源岩中总有机碳含量。相比于原始测井曲线作为输入变量,在相同的条件下,叠合面积模型得到训练数据和测试数据的误差值均小于原始测井曲线,说明将叠合面积模型作为输入变量,得到的预测结果的精确性高、泛化性好。综上,利用本说明书提供的方法可以更准确的确定烃源岩总有机碳含量。
本说明书提供的一种确定烃源岩总有机碳含量的方法,通过利用预设叠合面积模型将常规测井数据转化为叠合面积曲线,可以使获得的叠合面积曲线与岩芯分析的总有机碳含量的相关性相比于原始测井响应值更高,从而可以为后续提高预测准确度提供基础。通过预先基于叠合面积曲线与岩芯分析的总有机碳含量,利用粒子群优化算法确定预设支持向量回归模型的超参数,可以使获得的总有机碳含量计算模型的性能较好,从而可以有效提高烃源岩总有机碳含量的预测准确度。
本说明书中上述方法的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参加即可,每个实施例重点说明的都是与其他实施例的不同之处。相关之处参见方法实施例的部分说明即可。
基于上述所述一种确定烃源岩总有机碳含量的方法,本说明书一个或多个实施例还提供一种确定烃源岩总有机碳含量的装置。由于装置解决问题的实现方案与方法相似,因此本说明书实施例具体的装置的实施可以参见前述方法的实施,重复之处不再赘述。以下所使用的,术语“单元”或者“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
具体地,图6是本说明书提供的一种确定烃源岩总有机碳含量的装置的一个实施例的模块结构示意图,如图6所示,本说明书提供的一种确定烃源岩总有机碳含量的装置可以包括:测井数据获取模块120,叠合面积曲线获得模块122,总有机碳含量获得模块124。
测井数据获取模块120,可以用于获取常规测井数据;
叠合面积曲线获得模块122,可以用于利用预设叠合面积模型对所述常规测井数据进行重叠处理,获得叠合面积曲线;所述叠合面积曲线随测井深度连续变化;
总有机碳含量获得模块124,可以用于将所述叠合面积曲线输入总有机碳含量计算模型,获得烃源岩总有机碳含量;其中,所述总有机碳含量计算模型的超参数信息基于叠合面积曲线、粒子群优化算法以及预设总有机碳含量数据预先训练获得,所述预设总有机碳含量数据基于对烃源岩的岩芯样本分析获得。
图7是本说明书提供的一种总有机碳含量计算模型的训练装置的一个实施例的模块结构示意图,如图7所示,本说明书提供的一种总有机碳含量计算模型的训练装置可以包括:构建模块210,数据获取模块212,重叠处理模块214,训练模块216。
构建模块210,可以用于构建预设支持向量回归模型;所述预设支持向量回归模型包括超参数信息;
数据获取模块212,可以用于获取常规测井数据和预设总有机碳含量数据,所述预设总有机碳含量数据基于对烃源岩的岩芯样本分析获得;
重叠处理模块214,可以用于利用预设叠合面积模型对所述常规测井数据进行重叠处理,获得叠合面积曲线;所述叠合面积曲线随测井深度连续变化;
训练模块216,可以用于基于所述叠合面积曲线、粒子群优化算法以及所述预设总有机碳含量数据对所述预设支持向量回归模型的超参数信息进行训练,获得总有机碳含量计算模型。
基于前述方法所述实施例的描述,本说明书所述装置的另一个实施例中,训练模块216,可以包括:
位置信息确定单元,可以用于确定第k次迭代过程中每个粒子的位置信息;
超参数信息确定单元,可以用于将所述位置信息作为第k次迭代过程中所述预设支持向量回归模型的超参数信息,基于预设适应度函数获得每个粒子的适应度值;其中,预设适应度函数为交叉验证法中测试集误差的平均值,所述测试集中包括叠合面积曲线和预设总有机碳含量数据;
粒子最优适应度值确定单元,可以用于根据k次迭代过程中相同粒子对应的适应度值,确定第k次迭代过程中每个粒子的最优适应度值;其中,所述最优适应度值为k次迭代过程中相同粒子对应的适应度值中的最小值;
目标适应度值确定单元,可以用于根据k次迭代过程中所有粒子对应的所有适应度值,确定第k次迭代过程中的目标适应度值;其中,所述目标适应度值为k次迭代过程中所有粒子对应的所有适应度值中的最小值;
信息更新单元,可以用于根据第k次迭代过程中的所述目标适应度值和每个粒子的最优适应度值,更新每个粒子的速度信息和位置信息;
变化信息获得单元,可以用于判断是否达到预设迭代次数,确定达到时,获取每个迭代过程对应的目标适应度值,并计算相邻迭代过程对应的目标适应度值的差,获得目标适应度值的变化信息;
目标位置信息确定单元,可以用于根据所述变化信息与预设阈值的关系,确定目标粒子的位置信息;
模型获得单元,可以用于将所述目标粒子对应的位置信息作为所述预设支持向量回归模型的超参数信息,获得所述总有机碳含量计算模型。
需要说明的,上述所述的装置根据方法实施例的描述还可以包括其他的实施方式,具体的实现方式可以参照相关方法实施例的描述,在此不作一一赘述。
本说明书还提供一种确定烃源岩总有机碳含量的设备的实施例,包括处理器及用于存储处理器可执行指令的存储器,所述指令被所述处理器执行时实现包括以下步骤:获取常规测井数据;利用预设叠合面积模型对所述常规测井数据进行重叠处理,获得叠合面积曲线;所述叠合面积曲线随测井深度连续变化;将所述叠合面积曲线输入总有机碳含量计算模型,获得烃源岩总有机碳含量;其中,所述总有机碳含量计算模型的超参数信息基于叠合面积曲线、粒子群优化算法以及预设总有机碳含量数据预先训练获得,所述预设总有机碳含量数据基于对烃源岩的岩芯样本分析获得。
需要说明的,上述所述的设备根据方法或装置实施例的描述还可以包括其他的实施方式。具体的实现方式可以参照相关方法实施例的描述,在此不作一一赘述。
本说明书还提供一种确定烃源岩总有机碳含量的系统的实施例,包括至少一个处理器以及存储计算机可执行指令的存储器,所述处理器执行所述指令时实现上述任意一个或者多个实施例中所述方法的步骤。所述的系统可以为单独的服务器,也可以包括使用了本说明书的一个或多个所述方法或一个或多个实施例装置的服务器集群、系统(包括分布式系统)、软件(应用)、实际操作装置、逻辑门电路装置、量子计算机等并结合必要的实施硬件的终端装置。
本说明书所提供的方法实施例可以在移动终端、计算机终端、服务器或者类似的运算装置中执行。以运行在服务器上为例,图8是本说明书提供的一种确定烃源岩总有机碳含量的服务器的一个实施例的硬件结构框图,该服务器可以是上述实施例中的确定烃源岩总有机碳含量的装置或确定烃源岩总有机碳含量的系统。如图8所示,服务器10可以包括一个或多个(图中仅示出一个)处理器100(处理器100可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)、用于存储数据的存储器200、以及用于通信功能的传输模块300。本领域普通技术人员可以理解,图8所示的结构仅为示意,其并不对上述电子装置的结构造成限定。例如,服务器10还可包括比图8中所示更多或者更少的组件,例如还可以包括其他的处理硬件,如数据库或多级缓存、GPU,或者具有与图8所示不同的配置。
存储器200可用于存储应用软件的软件程序以及模块,如本说明书实施例中的确定烃源岩总有机碳含量的方法对应的程序指令/模块,处理器100通过运行存储在存储器200内的软件程序以及模块,从而执行各种功能应用以及数据处理。存储器200可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器200可进一步包括相对于处理器100远程设置的存储器,这些远程存储器可以通过网络连接至计算机终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
传输模块300用于经由一个网络接收或者发送数据。上述的网络具体实例可包括计算机终端的通信供应商提供的无线网络。在一个实例中,传输模块300包括一个网络适配器(Network Interface Controller,NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输模块300可以为射频(Radio Frequency,RF)模块,其用于通过无线方式与互联网进行通讯。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。
本申请中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于硬件+程序类实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。本领域技术人员应明白,本说明书一个或多个实施例可提供为方法、系统或计算机程序产品。因此,本说明书一个或多个实施例可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。
以上所述仅为本说明书一个或多个实施例的实施例而已,并不用于限制本本说明书一个或多个实施例。对于本领域技术人员来说,本说明书一个或多个实施例可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在权利要求范围之内。

Claims (9)

1.一种确定烃源岩总有机碳含量的方法,其特征在于,包括:
获取常规测井数据;
利用预设叠合面积模型对所述常规测井数据进行重叠处理,获得叠合面积曲线;所述叠合面积曲线随测井深度连续变化;
将所述叠合面积曲线输入总有机碳含量计算模型,获得烃源岩总有机碳含量;其中,所述总有机碳含量计算模型的超参数信息基于叠合面积曲线、粒子群优化算法以及预设总有机碳含量数据预先训练获得,所述预设总有机碳含量数据基于对烃源岩的岩芯样本分析获得;
其中,所述预设叠合面积模型为:
其中,AC、CNL、GR、RT和DEN分别表示声波时差曲线、补偿中子曲线、自然伽马曲线、电阻率曲线和密度曲线,ACleft、CNLleft、GRleft、RTleft、DENleft分别表示声波时差曲线、补偿中子曲线、自然伽马曲线、电阻率曲线和密度曲线的左刻度值,ACright、CNLright、GRright、RTright、DENright分别表示声波时差曲线、补偿中子曲线、自然伽马曲线、电阻率曲线和密度曲线的右刻度值,ΔS1、ΔS2、ΔS3、ΔS4、ΔS5和ΔS6分别表示6种组合的叠合面积曲线值。
2.根据权利要求1所述的方法,其特征在于,所述利用预设叠合面积模型对所述常规测井数据进行重叠处理,获得叠合面积曲线,包括:
将常规测井曲线进行分组,获得预设数量的分组曲线;其中,每一分组曲线中包括两条不同曲线,所述常规测井曲线包括声波时差曲线、补偿中子曲线、密度曲线、电阻率曲线和自然伽马曲线;
基于所述预设叠合面积模型,将所述每一分组曲线中的两条曲线进行重叠,获得叠合面积曲线。
3.一种总有机碳含量计算模型的训练方法,其特征在于,包括:
构建预设支持向量回归模型;所述预设支持向量回归模型包括超参数信息;
获取常规测井数据和预设总有机碳含量数据,所述预设总有机碳含量数据基于对烃源岩的岩芯样本分析获得;
利用预设叠合面积模型对所述常规测井数据进行重叠处理,获得叠合面积曲线;所述叠合面积曲线随测井深度连续变化;
基于所述叠合面积曲线、粒子群优化算法以及所述预设总有机碳含量数据对所述预设支持向量回归模型的超参数信息进行训练,获得总有机碳含量计算模型;
其中,所述预设叠合面积模型为:
其中,AC、CNL、GR、RT和DEN分别表示声波时差曲线、补偿中子曲线、自然伽马曲线、电阻率曲线和密度曲线,ACleft、CNLleft、GRleft、RTleft、DENleft分别表示声波时差曲线、补偿中子曲线、自然伽马曲线、电阻率曲线和密度曲线的左刻度值,ACright、CNLright、GRright、RTright、DENright分别表示声波时差曲线、补偿中子曲线、自然伽马曲线、电阻率曲线和密度曲线的右刻度值,ΔS1、ΔS2、ΔS3、ΔS4、ΔS5和ΔS6分别表示6种组合的叠合面积曲线值。
4.根据权利要求3所述的方法,其特征在于,所述基于所述叠合面积曲线、粒子群优化算法以及所述预设总有机碳含量数据对所述预设支持向量回归模型的超参数信息进行训练,获得总有机碳含量计算模型,包括:
确定第k次迭代过程中每个粒子的位置信息;
将所述位置信息作为第k次迭代过程中所述预设支持向量回归模型的超参数信息,基于预设适应度函数获得每个粒子的适应度值;其中,预设适应度函数为交叉验证法中测试集误差的平均值,所述测试集中包括叠合面积曲线和预设总有机碳含量数据;
根据k次迭代过程中相同粒子对应的适应度值,确定第k次迭代过程中每个粒子的最优适应度值;其中,所述最优适应度值为k次迭代过程中相同粒子对应的适应度值中的最小值;
根据k次迭代过程中所有粒子对应的所有适应度值,确定第k次迭代过程中的目标适应度值;其中,所述目标适应度值为k次迭代过程中所有粒子对应的所有适应度值中的最小值;
根据第k次迭代过程中的所述目标适应度值和每个粒子的最优适应度值,更新每个粒子的速度信息和位置信息;
判断是否达到预设迭代次数,确定达到时,获取每个迭代过程对应的目标适应度值,并计算相邻迭代过程对应的目标适应度值的差,获得目标适应度值的变化信息;
根据所述变化信息与预设阈值的关系,确定目标粒子的位置信息;
将所述目标粒子对应的位置信息作为所述预设支持向量回归模型的超参数信息,获得所述总有机碳含量计算模型。
5.一种确定烃源岩总有机碳含量的装置,其特征在于,包括:
测井数据获取模块,用于获取常规测井数据;
叠合面积曲线获得模块,用于利用预设叠合面积模型对所述常规测井数据进行重叠处理,获得叠合面积曲线;所述叠合面积曲线随测井深度连续变化;
总有机碳含量获得模块,用于将所述叠合面积曲线输入总有机碳含量计算模型,获得烃源岩总有机碳含量;其中,所述总有机碳含量计算模型的超参数信息基于叠合面积曲线、粒子群优化算法以及预设总有机碳含量数据预先训练获得,所述预设总有机碳含量数据基于对烃源岩的岩芯样本分析获得;
其中,所述预设叠合面积模型为:
其中,AC、CNL、GR、RT和DEN分别表示声波时差曲线、补偿中子曲线、自然伽马曲线、电阻率曲线和密度曲线,ACleft、CNLleft、GRleft、RTleft、DENleft分别表示声波时差曲线、补偿中子曲线、自然伽马曲线、电阻率曲线和密度曲线的左刻度值,ACright、CNLright、GRright、RTright、DENright分别表示声波时差曲线、补偿中子曲线、自然伽马曲线、电阻率曲线和密度曲线的右刻度值,ΔS1、ΔS2、ΔS3、ΔS4、ΔS5和ΔS6分别表示6种组合的叠合面积曲线值。
6.一种总有机碳含量计算模型的训练装置,其特征在于,包括:
构建模块,用于构建预设支持向量回归模型;所述预设支持向量回归模型包括超参数信息;
数据获取模块,用于获取常规测井数据和预设总有机碳含量数据,所述预设总有机碳含量数据基于对烃源岩的岩芯样本分析获得;
重叠处理模块,用于利用预设叠合面积模型对所述常规测井数据进行重叠处理,获得叠合面积曲线;所述叠合面积曲线随测井深度连续变化;
训练模块,用于基于所述叠合面积曲线、粒子群优化算法以及所述预设总有机碳含量数据对所述预设支持向量回归模型的超参数信息进行训练,获得总有机碳含量计算模型;
其中,所述预设叠合面积模型为:
其中,AC、CNL、GR、RT和DEN分别表示声波时差曲线、补偿中子曲线、自然伽马曲线、电阻率曲线和密度曲线,ACleft、CNLleft、GRleft、RTleft、DENleft分别表示声波时差曲线、补偿中子曲线、自然伽马曲线、电阻率曲线和密度曲线的左刻度值,ACright、CNLright、GRright、RTright、DENright分别表示声波时差曲线、补偿中子曲线、自然伽马曲线、电阻率曲线和密度曲线的右刻度值,ΔS1、ΔS2、ΔS3、ΔS4、ΔS5和ΔS6分别表示6种组合的叠合面积曲线值。
7.根据权利要求6所述的装置,其特征在于,所述训练模块,包括:
位置信息确定单元,用于确定第k次迭代过程中每个粒子的位置信息;
超参数信息确定单元,用于将所述位置信息作为第k次迭代过程中所述预设支持向量回归模型的超参数信息,基于预设适应度函数获得每个粒子的适应度值;其中,预设适应度函数为交叉验证法中测试集误差的平均值,所述测试集中包括叠合面积曲线和预设总有机碳含量数据;
粒子最优适应度值确定单元,用于根据k次迭代过程中相同粒子对应的适应度值,确定第k次迭代过程中每个粒子的最优适应度值;其中,所述最优适应度值为k次迭代过程中相同粒子对应的适应度值中的最小值;
目标适应度值确定单元,用于根据k次迭代过程中所有粒子对应的所有适应度值,确定第k次迭代过程中的目标适应度值;其中,所述目标适应度值为k次迭代过程中所有粒子对应的所有适应度值中的最小值;
信息更新单元,用于根据第k次迭代过程中的所述目标适应度值和每个粒子的最优适应度值,更新每个粒子的速度信息和位置信息;
变化信息获得单元,用于判断是否达到预设迭代次数,确定达到时,获取每个迭代过程对应的目标适应度值,并计算相邻迭代过程对应的目标适应度值的差,获得目标适应度值的变化信息;
目标位置信息确定单元,用于根据所述变化信息与预设阈值的关系,确定目标粒子的位置信息;
模型获得单元,用于将所述目标粒子对应的位置信息作为所述预设支持向量回归模型的超参数信息,获得所述总有机碳含量计算模型。
8.一种确定烃源岩总有机碳含量的设备,其特征在于,包括处理器及用于存储处理器可执行指令的存储器,所述指令被所述处理器执行时实现包括以下步骤:
获取常规测井数据;
利用预设叠合面积模型对所述常规测井数据进行重叠处理,获得叠合面积曲线;所述叠合面积曲线随测井深度连续变化;
将所述叠合面积曲线输入总有机碳含量计算模型,获得烃源岩总有机碳含量;其中,所述总有机碳含量计算模型的超参数信息基于叠合面积曲线、粒子群优化算法以及预设总有机碳含量数据预先训练获得,所述预设总有机碳含量数据基于对烃源岩的岩芯样本分析获得;
其中,所述预设叠合面积模型为:
其中,AC、CNL、GR、RT和DEN分别表示声波时差曲线、补偿中子曲线、自然伽马曲线、电阻率曲线和密度曲线,ACleft、CNLleft、GRleft、RTleft、DENleft分别表示声波时差曲线、补偿中子曲线、自然伽马曲线、电阻率曲线和密度曲线的左刻度值,ACright、CNLright、GRright、RTright、DENright分别表示声波时差曲线、补偿中子曲线、自然伽马曲线、电阻率曲线和密度曲线的右刻度值,ΔS1、ΔS2、ΔS3、ΔS4、ΔS5和ΔS6分别表示6种组合的叠合面积曲线值。
9.一种确定烃源岩总有机碳含量的系统,其特征在于,包括至少一个处理器以及存储计算机可执行指令的存储器,所述处理器执行所述指令时实现权利要求1-4中任意一项所述方法的步骤。
CN202010738235.6A 2020-07-28 2020-07-28 一种确定烃源岩总有机碳含量的方法、装置、设备及系统 Active CN111949945B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010738235.6A CN111949945B (zh) 2020-07-28 2020-07-28 一种确定烃源岩总有机碳含量的方法、装置、设备及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010738235.6A CN111949945B (zh) 2020-07-28 2020-07-28 一种确定烃源岩总有机碳含量的方法、装置、设备及系统

Publications (2)

Publication Number Publication Date
CN111949945A CN111949945A (zh) 2020-11-17
CN111949945B true CN111949945B (zh) 2023-10-17

Family

ID=73338351

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010738235.6A Active CN111949945B (zh) 2020-07-28 2020-07-28 一种确定烃源岩总有机碳含量的方法、装置、设备及系统

Country Status (1)

Country Link
CN (1) CN111949945B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113027419A (zh) * 2021-03-26 2021-06-25 中国石油大学(北京) 一种基于测井数据的残留烃率确定模型构建方法及残留烃率确定方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0751092A2 (de) * 1995-06-28 1997-01-02 MANNESMANN Aktiengesellschaft Vorrichtung zum Greifen und gewichtsabhängigen Klemmen von relativ zu einer Ortslage zu bewegenden oder zu haltenden Schienenführungen o.dgl.
WO2017024530A1 (zh) * 2015-08-11 2017-02-16 深圳朝伟达科技有限公司 一种计算烃源岩中有机碳含量的方法
CN107422377A (zh) * 2017-07-10 2017-12-01 中国石油天然气集团公司 利用地震数据预测烃源岩总有机碳含量的方法及装置
CN107437229A (zh) * 2016-05-26 2017-12-05 中国石油化工股份有限公司 烃源岩有机碳含量预测模型的构建方法及预测方法
CN107765335A (zh) * 2016-08-18 2018-03-06 中国石油化工股份有限公司 一种识别陆相页岩气储层的方法
CN110442951A (zh) * 2019-07-30 2019-11-12 西北大学 一种考虑密度因素的烃源岩总有机碳含量预测方法
CN111042811A (zh) * 2020-01-13 2020-04-21 中国石油天然气股份有限公司大港油田分公司 一种基于敏感参数叠合的页岩油产能评价方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0751092A2 (de) * 1995-06-28 1997-01-02 MANNESMANN Aktiengesellschaft Vorrichtung zum Greifen und gewichtsabhängigen Klemmen von relativ zu einer Ortslage zu bewegenden oder zu haltenden Schienenführungen o.dgl.
WO2017024530A1 (zh) * 2015-08-11 2017-02-16 深圳朝伟达科技有限公司 一种计算烃源岩中有机碳含量的方法
CN107437229A (zh) * 2016-05-26 2017-12-05 中国石油化工股份有限公司 烃源岩有机碳含量预测模型的构建方法及预测方法
CN107765335A (zh) * 2016-08-18 2018-03-06 中国石油化工股份有限公司 一种识别陆相页岩气储层的方法
CN107422377A (zh) * 2017-07-10 2017-12-01 中国石油天然气集团公司 利用地震数据预测烃源岩总有机碳含量的方法及装置
CN110442951A (zh) * 2019-07-30 2019-11-12 西北大学 一种考虑密度因素的烃源岩总有机碳含量预测方法
CN111042811A (zh) * 2020-01-13 2020-04-21 中国石油天然气股份有限公司大港油田分公司 一种基于敏感参数叠合的页岩油产能评价方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
A practical model for organic richness from porosity and resistivity logs;Q.R.Passey等;《The American association of petroleum geologists bulletin》;1777-1794 *
Jianhua He.Logging identification andcharacteristicanalysisofthelacustrine organic-rich shalelithofacies:AcasestudyfromtheEs3 L shale in theJiyangDepression,BohaiBayBasin,EasternChina.《Journal ofPetroleumScienceandEngineering》.2016,238-255. *
应用测井资料预测致密油有利区方法研究;钟淑敏等;《测井技术》;第40卷(第1期);85-90 *

Also Published As

Publication number Publication date
CN111949945A (zh) 2020-11-17

Similar Documents

Publication Publication Date Title
CN109611087B (zh) 一种火山岩油藏储层参数智能预测方法及系统
EP3535607A1 (en) Seismic data processing artificial intelligence
CN113919219A (zh) 基于测井大数据的地层评价方法及系统
CN113109874B (zh) 一种使用神经网络的波阻抗反演方法和神经网络系统
CN107451528A (zh) 基于深度学习的地表覆盖图片自动识别方法及系统
CN110879412A (zh) 地下横波速度反演方法、装置、计算设备及存储介质
CN111949945B (zh) 一种确定烃源岩总有机碳含量的方法、装置、设备及系统
CN116305850A (zh) 一种基于随机森林模型的地层热导率预测方法
CN116299665A (zh) Lstm面波反演方法、装置及介质
CN114091333A (zh) 一种基于机器学习的页岩含气量人工智能预测方法
Razak et al. Embedding physical flow functions into deep learning predictive models for improved production forecasting
CN113705110A (zh) 一种基于双重随机森林回归方法的爆破振动速度预测方法
CN113486591A (zh) 一种卷积神经网络结果的重力多参量数据密度加权反演方法
CN113406695A (zh) 基于层速度地震地质模型的地震反演方法及系统
WO2020231918A1 (en) Training a machine learning system using hard and soft constraints
WO2021013322A1 (en) Method and system for constructing statistical emulators for reservoir simulation models with uncertain inputs
Zhang et al. PSO-BP neural network in reservoir parameter dynamic prediction
CN114881171A (zh) 基于卷积神经网络的陆相页岩油岩相类型识别方法及系统
CN114021700A (zh) 基于岩石物理约束神经网络的渗透率计算方法及装置
CN113608258A (zh) 一种构建高分辨率波阻抗反演标签的自洽深度学习方法
Wang et al. On the Feasibility of An Ensemble Multi-Fidelity Neural Network for Fast Data Assimilation for Subsurface Flow in Porous Media
CN111723526A (zh) 动态回归委员会机器测井储层参数预测方法及系统
CN117633658B (zh) 岩石储层岩性识别方法及系统
CN117574269B (zh) 陆相页岩储层天然裂缝智能识别方法及系统
CN115828072B (zh) 不可通约测井曲线缺失段重构方法及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant