CN109919184A - 一种基于测井数据的多井复杂岩性智能识别方法及系统 - Google Patents

一种基于测井数据的多井复杂岩性智能识别方法及系统 Download PDF

Info

Publication number
CN109919184A
CN109919184A CN201910078669.5A CN201910078669A CN109919184A CN 109919184 A CN109919184 A CN 109919184A CN 201910078669 A CN201910078669 A CN 201910078669A CN 109919184 A CN109919184 A CN 109919184A
Authority
CN
China
Prior art keywords
data
lithology
well
log data
coring
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910078669.5A
Other languages
English (en)
Inventor
魏周城
王志章
王如意
裴升杰
杨笑
王伟方
夏小健
李冰涛
雷祥辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China University of Petroleum Beijing
Original Assignee
China University of Petroleum Beijing
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China University of Petroleum Beijing filed Critical China University of Petroleum Beijing
Priority to CN201910078669.5A priority Critical patent/CN109919184A/zh
Publication of CN109919184A publication Critical patent/CN109919184A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及了一种基于测井数据的多井复杂岩性智能识别方法及系统,该方法首先确定目标测井数据文件并进行格式转换以及归一化预处理,然后根据全区关键取芯井在取芯井段的已知岩性对测井曲线数据进行特征筛选和/或特征组合扩展获得对岩性敏感的测井曲线数据,再给对岩性响应敏感的测井曲线数据进行打标签标定组成样本数据库同时将全区未打标签的测井曲线数据组成待测数据库,进而利用样本数据库的数据并结合若干机器学习算法进行机器学习训练后自动建立若干岩性识别模型,通过分类性能评价法则选出最优的模型,并利用最优的模型对待测数据库中的数据进行岩性预测以实现全区多井复杂岩性智能识别,高效方便、全区适用且自动智能预测结果非常精准。

Description

一种基于测井数据的多井复杂岩性智能识别方法及系统
技术领域
本发明涉及地质工程岩性识别技术领域,具体涉及一种基于测井数据的多井复杂岩性智能识别方法及系统。
背景技术
岩性识别一直是地质工程研究重点分析的问题,而对于油藏描述,最基础的问题也是要解决工区多井的岩性问题。现有技术中进行岩性识别主要有地质研究法、交汇图法和利用数学算法进行岩性识别这几种方法,其中,地质法主要是通过取芯手段进行岩性识别,根据已知的取芯井段通过观察取芯样品进行分析后就可以获得取芯处的岩性,但取芯手段成本高且难度大,并且现有技术做岩性识别只是做单一的关键井,每次也只能有极少量取芯,这也就导致全区大部分井的岩性数据还是未知的,所以地质法对全区的岩性识别没有普遍适用性,取芯后通常还是人工手动解释获得岩性,岩性识别结果受人为因素影响大、准确性低;交汇图法主要是利用特征测井曲线两两组合扩展来绘制交汇图,其缺点是利用的特征测井曲线太过单一,准确率较低,并且实现全区多井岩性识别难度很大;利用数学算法进行岩性识别相较前两种方法有了很大改进,比如利用决策树算法、支持向量机算法等识别岩性,但是只能分别单独应用某一种数学算法,也就是方法上比较单一,也没有综合对比,且在全区多井的岩性识别上仍然比较困难。
发明内容
本发明针对现有技术中对全区取芯成本过高、全区岩性识别难度大、特征测井曲线太过单一导致岩性识别结果准确率低等缺陷提供了一种基于测井数据的多井复杂岩性智能识别方法,该方法合理有效地引入人工智能机器学习训练、智能分析比较以及根据模型自动预测结果等技术原理,高效、快速、可靠的完成全区多井复杂岩性的智能识别,大大提高了岩性识别的速度与准确度。本发明还提供了一种基于测井数据的多井复杂岩性智能识别系统。
本发明的技术方案如下:
一种基于测井数据的多井复杂岩性智能识别方法,首先确定目标测井数据文件并进行格式转换以及归一化预处理,然后根据全区关键取芯井在取芯井段的已知岩性对各关键取芯井的测井曲线数据进行特征筛选和/或特征组合扩展获得对岩性敏感的测井曲线数据,再根据取芯井段的已知岩性给对岩性响应敏感的测井曲线数据进行打标签标定组成样本数据库同时将全区除关键取芯井外的其余井的未打标签的测井曲线数据组成待测数据库,进而利用样本数据库的数据并结合若干机器学习算法进行机器学习训练后自动建立若干岩性识别模型,再通过分类性能评价法则选出最优的模型,并利用最优的模型对待测数据库中的数据进行岩性预测以实现全区多井复杂岩性智能识别。
优选地,上述的基于测井数据的全区多井复杂岩性智能识别方法,具体包括以下步骤:
第一步骤:根据全区各井的测井信息资料确定LAS或XLS格式的原始测井曲线文件并统一将原始测井曲线文件格式转换为CSV格式,再进行归一化预处理;
第二步骤:根据全区所有关键取芯井在取芯井段的已知岩性对各关键取芯井的测井曲线数据进行特征筛选,通过比较各测井曲线数据的变化趋势筛选出若干条对岩性响应敏感的测井曲线数据,
和/或,根据全区所有关键取芯井在取芯井段的已知岩性对各关键取芯井的测井曲线数据进行特征组合扩展,通过将两个以上的特征组合扩展后根据组合特征的变化趋势绘制出对岩性响应敏感的组合测井曲线数据且全区所有井都绘制与其相对应的组合测井曲线数据;
第三步骤:分别根据各关键取芯井在取芯井段的已知岩性给各关键取芯井相对应的各条对岩性响应敏感的测井曲线数据和/或组合测井曲线数据进行打标签标定组成样本数据库,同时全区除关键取芯井外的余井的未进行打标签标定的测井曲线数据和/或组合测井曲线数据组成待测数据库;
第四步骤:将样本数据库的数据进行分类,形成训练数据集和测试数据集,所述训练数据集用于机器学习训练及自动建立模型,所述测试数据集用于检验模型的好坏;
第五步骤:利用若干机器学习算法对训练数据集的数据进行机器学习训练后分别自动建立相应的岩性识别模型,所述若干机器学习算法包括但不限于决策树算法、随机森林算法、 adaboost算法、梯度提升树算法、逻辑回归算法、支持向量机算法和贝叶斯算法中的任意算法的组合;
第六步骤:基于测试数据集并利用分类性能评价法则对建立的各种不同的岩性识别模型进行评价比较,选出分类性能最优的岩性识别模型;
第七步骤:利用最优的岩性识别模型对待测数据库中的各测井曲线数据和/或组合测井曲线数据进行岩性预测获得全区除关键取芯井外的全部余井的岩性识别结果,再结合各关键取芯井的已知岩性形成全区多井复杂岩性识别结果;
第八步骤:对全区多井复杂岩性识别结果的数据格式进行统一的顶底深格式转换后加载到显示界面以展示岩性智能识别效果。
优选地,第一步骤所述归一化预处理过程针对不同来源的测井数据,首先分别提取各来源测井数据中占比95%的数据作为最大值、占比5%的数据作为最小值,再结合归一化计算公式分别获得各来源测井数据的归一化结果,使得各来源测井数据的数值范围均分布在[0,1] 之间。
优选地,第二步骤的特征筛选和/或特征组合扩展中涉及的所述特征包括但不限于自然伽马、自然电位、井径、声波时差、密度、补偿中子、深侧向电阻率及浅侧向电阻率,同时所述特征组合扩展形式包括但不限于特征加和、特征作差的方式。
优选地,第三步骤选取部分关键取芯井进行打标签标定组成样本数据库,同时余下的关键取芯井的已知岩性及相对应的各条对岩性响应敏感的测井曲线数据和/或组合测井曲线数据用于验证在第六步骤得到的最优的岩性识别模型的可靠性,当验证可靠时,进入第七步骤;当验证不可靠时,返回到第二步骤重新筛选对岩性敏感的测井曲线数据。
优选地,第六步骤所述分类性能评价法则为结合分类准确率评价法、ROC评价法及AUC 评价法的综合评价法则,通过分析比较不同模型对测试数据集结果预测的准确度、数据分类正确概率、AUC值的大小从而评价选出最优的岩性识别模型。
一种基于测井数据的多井复杂岩性智能识别系统,包括依次连接的数据处理单元、关键取芯井测井数据判定单元、特征筛选单元、数据标定单元、样本数据库、机器学习训练单元、模型建立单元、模型评价优选单元和岩性识别预测单元,所述关键取芯井测井数据判定单元和所述特征筛选单元还连接至待测数据库同时待测数据库连接至岩性识别预测单元,所述数据处理单元对确定的目标测井数据文件进行格式转换以及归一化预处理,所述关键取芯井测井数据判定单元判断数据是否为关键取芯井测井数据,判定结果为是则将数据传递给特征筛选单元,否则直接将数据归入待测数据库,所述特征筛选单元根据全区关键取芯井在取芯井段的已知岩性对各关键取芯井的测井曲线数据进行特征筛选和/或特征组合扩展获得对岩性敏感的测井曲线数据,所述数据标定单元根据取芯井段的已知岩性给对岩性敏感的测井曲线数据进行打标签标定组成样本数据库,同时全区除关键取芯井外的其余井的未打标签的测井曲线数据直接从所述特征筛选单元传输归入待测数据库,所述机器学习训练单元利用样本数据库的数据并结合若干机器学习算法进行机器学习训练后利用所述模型建立单元自动建立若干岩性识别模型,所述模型评价优选单元再通过分类性能评价法则选出最优的模型,岩性识别预测单元并利用最优的模型对待测数据库中的数据进行岩性预测。
优选地,所述若干机器学习算法包括但不限于决策树算法、随机森林算法、adaboost算法、梯度提升树算法、逻辑回归算法、支持向量机算法和贝叶斯算法中的任意算法的组合;
和/或,所述归一化预处理的过程针对不同来源的测井数据,首先分别提取各来源测井数据中占比95%的数据作为最大值、占比5%的数据作为最小值,再结合归一化计算公式分别获得各来源测井数据的归一化结果,使得各来源测井数据的数值范围均分布在[0,1]之间。
优选地,所述特征筛选和/或特征组合扩展过程中涉及的所述特征包括但不限于自然伽马、自然电位、井径、声波时差、密度、补偿中子、深侧向电阻率及浅侧向电阻率,同时所述特征组合扩展形式包括但不限于特征加和、特征作差的方式。
优选地,所述分类性能评价法则为结合分类准确率评价法、ROC评价法及AUC评价法的综合评价法则,通过分析比较不同模型对测试数据集结果预测的准确度、数据分类正确概率、 AUC值的大小从而评价选出最优的岩性识别模型。
本发明的技术效果如下:
本发明涉及了一种基于测井数据的多井复杂岩性智能识别方法,利用全区多井为大的整体并在格式转换以及归一化预处理后,再对测井曲线特征优选和/或特征扩展,将取芯井段的已知岩性给对岩性响应敏感的测井曲线数据进行打标签标定组成样本数据库同时将全区除关键取芯井外的其余井的未打标签的测井曲线数据组成待测数据库,也就是说,提取取芯数据,利用取芯数据,用岩芯标定测井,然后对测井数据打标签利用关键取芯井的数据组成样本数据库并据此利用多种机器学习训练方法训练学习后建立岩性识别模型,并对比分析选择最优模型后利用最优模型实现全区未取芯井的岩心预测从而实现全区多井复杂岩性的智能识别,该方法不再单单局限于单个井的识别,从而具有普遍适用性,无需全区各井取芯,解决了全区取芯成本过高、全区岩性识别难度大、特征测井曲线太过单一导致岩性识别结果准确率低等缺陷,且该方法利用人工智能机器学习训练的方法,结合智能分析比较以及根据模型自动预测结果等技术原理,高效方便、准确度高的完成全区多井复杂岩性的智能识别,大大提高了岩性识别的速度与准确度且大大减少了人力和降低了成本。
本发明还涉及了一种基于测井数据的多井复杂岩性智能识别系统,包括依次连接的数据处理单元、关键取芯井测井数据判定单元、特征筛选单元、数据标定单元、样本数据库、机器学习训练单元、模型建立单元、模型评价优选单元和岩性识别预测单元,所述关键取芯井测井数据判定单元和所述特征筛选单元还连接至待测数据库同时待测数据库连接至岩性识别预测单元,所述数据处理单元对确定的目标测井数据文件进行格式转换以及归一化预处理,所述关键取芯井测井数据判定单元判断数据是否为关键取芯井测井数据,判定结果为是则将数据传递给特征筛选单元,否则直接将数据归入待测数据库,所述特征筛选单元根据全区关键取芯井在取芯井段的已知岩性对各关键取芯井的测井曲线数据进行特征筛选和/或特征组合扩展获得对岩性敏感的测井曲线数据,所述数据标定单元根据取芯井段的已知岩性给对岩性敏感的测井曲线数据进行打标签标定组成样本数据库,同时全区除关键取芯井外的其余井的未打标签的测井曲线数据直接从所述特征筛选单元传输归入待测数据库,所述机器学习训练单元利用样本数据库的数据并结合若干机器学习算法进行机器学习训练后利用所述模型建立单元自动建立若干岩性识别模型,所述模型评价优选单元再通过分类性能评价法则选出最优的模型,岩性识别预测单元并利用最优的模型对待测数据库中的数据进行岩性预测,该系统结构简单、操作方便,彻底解决了全区取芯成本过高、全区岩性识别难度大、特征测井曲线太过单一导致岩性识别结果准确率低等缺陷,且创新性地利用了若干基于人工智能机器学习训练技术的算法,结合智能分析比较以及根据模型自动预测结果等技术原理,高效方便、准确度高的完成全区多井复杂岩性的智能识别,大大提高了岩性识别结果的准确度和效果。
附图说明
图1为本发明一种基于测井数据的多井复杂岩性智能识别方法的优选流程图。
图2为本方法第二步骤中进行特征筛选的优选实施例示意图。
图3a-3g为本方法第六步骤中进行模型评价比较的优选实施例示意图。
图4为本方法第八步骤中全区岩性识别预测结果的可视化结果示意图。
图5为本发明一种基于测井数据的多井复杂岩性智能识别系统的优选结构示意图。
具体实施方式
本发明涉及了一种基于测井数据的多井复杂岩性智能识别方法,首先确定目标测井数据文件并进行格式转换以及归一化预处理,然后根据全区关键取芯井在取芯井段的已知岩性对各关键取芯井的测井曲线数据进行特征筛选和/或特征组合扩展获得对岩性敏感的测井曲线数据,再根据取芯井段的已知岩性给对岩性响应敏感的测井曲线数据进行打标签标定组成样本数据库同时将全区除关键取芯井外的其余井的未打标签的测井曲线数据组成待测数据库,进而利用样本数据库的数据并结合若干机器学习算法进行机器学习训练后自动建立若干岩性识别模型,再通过分类性能评价法则选出最优的模型,并利用最优的模型对待测数据库中的数据进行岩性预测以实现全区多井复杂岩性智能识别,利用全区多井为大的整体并在格式转换以及归一化预处理后,再对测井曲线特征优选和/或特征扩展,将取芯井段的已知岩性给对岩性响应敏感的测井曲线数据进行打标签标定组成样本数据库同时将全区除关键取芯井外的其余井的未打标签的测井曲线数据组成待测数据库,也就是说,提取取芯数据,利用取芯数据,用岩芯标定测井,然后对测井数据打标签利用关键取芯井的数据组成样本数据库并据此利用多种机器学习训练方法训练学习后建立岩性识别模型,并对比分析选择最优模型后利用最优模型实现全区未取芯井的岩心预测从而实现全区多井复杂岩性的智能识别,该方法不再单单局限于单个井的识别,从而具有普遍适用性,无需全区各井取芯,解决了全区取芯成本过高、全区岩性识别难度大、特征测井曲线太过单一导致岩性识别结果准确率低等缺陷,且该方法利用人工智能机器学习训练的方法,结合智能分析比较以及根据模型自动预测结果等技术原理,高效方便、准确度高的完成全区多井复杂岩性的智能识别,大大提高了岩性识别的速度与准确度且大大减少了人力和降低了成本。
下面结合附图进行详细说明。
优选地,上述基于测井数据的全区多井复杂岩性智能识别方法,利用测井信息资料来识别岩性,具体包括如图1所示的以下步骤:
第一步骤:首先要进行测井资料的处理,根据全区各井的测井信息资料确定LAS或XLS 格式的原始测井曲线文件作为目标测井数据文件并统一将原始测井曲线文件格式转换为CSV 格式以方便后续用Python读取文件,然后对其进行归一化预处理,归一化预处理主要是为了解决不同仪器所测得的测井数据结果的数值范围会不一样而造成的对后续全区岩性预测影响过大、误差过大的问题,具体的归一化预处理要针对不同来源的测井数据,让所有测井数据均分布在[0,1]范围之间,归一化的过程中不是取整个数据的最大值和最小值,而是针对所有数据做一个累计概率分布图,比如优选地首先分别提取各来源所有的测井数据中占比为95%的数作为最大值,然后提取占比5%的数作为最小值(当然,也可以提取其它占比比例进行概率分布),再结合归一化计算公式利用这个最大值和最小值对所有测井曲线数据进行归一化处理分别获得各来源测井数据的归一化结果,使得各来源测井数据的数值范围均分布在[0,1] 之间,所述归一化预处理的计算公式如下:
其中X表示要进行归一化的测井曲线数据,X'表示归一化后的该测井曲线数据,计算过程会遍历所有测井曲线数据。
第二步骤:根据全区所有关键取芯井在取芯井段的已知岩性对各关键取芯井的测井曲线数据进行特征筛选,通过比较各测井曲线数据的变化趋势筛选出若干条对岩性响应敏感的测井曲线数据,和/或,根据全区所有关键取芯井在取芯井段的已知岩性对各关键取芯井的测井曲线数据进行特征组合扩展,通过将两个以上的特征组合扩展后根据组合特征的变化趋势绘制出对岩性响应敏感的组合测井曲线数据且全区所有井都绘制与其相对应的组合测井曲线数据,进一步优选地,特征筛选和/或特征组合扩展中涉及的所述特征包括但不限于自然伽马、自然电位、井径、声波时差、密度、补偿中子、深侧向电阻率及浅侧向电阻率,同时所述特征组合扩展形式包括但不限于特征加和、特征作差的方式,本实施例具体优选对各关键取芯井的测井曲线数据进行特征筛选和特征组合扩展且优选特征有自然伽马GR、自然电位SP、井径CAL、声波时差AC、密度DEN、补偿中子CNL、深侧向电阻率RLLD及浅侧向电阻率RLLS, 对测井曲线特征的特征筛选和特征扩展的过程也叫做特征工程,根据自然伽马GR、自然电位 SP、井径CAL、声波时差AC、密度DEN、补偿中子CNL、深侧向电阻率RLLD及浅侧向电阻率 RLLS这些特征在各关键取芯井的测井曲线数据中筛选出若干条对岩性响应敏感的测井曲线数据如图2所示的特征优选实施例所示,也可以理解为建立然伽马GR、自然电位SP、井径CAL、声波时差AC、密度DEN、补偿中子CNL、深侧向电阻率RLLD及浅侧向电阻率RLLS这些特征对应的岩性识别图谱并用不同颜色标示出来(图中颜色未示出),通过颜色观察能够得到在哪种特征曲线下判断出来的井段岩性是什么样的,此处特征筛选就是反向利用岩性识别图谱,根据已知岩性筛选出对泥岩、粉砂岩、细砂岩、含砾砂岩4种岩性(图中0代表泥岩,1代表粉砂岩,2代表细砂岩,3代表含砾砂岩)表现敏感的特征/特征曲线,当然特征筛选过程是灵活的,如果某井不具有其中某个表现敏感的特征,那就可以去掉该特征或者再找到别的敏感特征,获得对岩性响应敏感的特征测井曲线后再同时根据特征组合扩展结果通过组合构造出一条对岩性响应敏感的组合测井曲线,同时全区所有井都绘制与其相对应的组合测井曲线数据,特征组合扩展比如采用深侧向电阻率RLLD和浅侧向电阻率RLLS作差得到差值的组合形式作为反映岩性的一个组合特征,这种特征筛选及特征组合扩展的方法可以为后续工作提供更精准的数据基础使得后续工作的准确率更高、效果更好。
第三步骤:分别根据各关键取芯井在取芯井段的已知岩性给各关键取芯井相对应的各条对岩性响应敏感的测井曲线数据和/或组合测井曲线数据进行打标签标定组成样本数据库,具体优选地,分别根据各关键取芯井在取芯井段的已知岩性给各关键取芯井相对应(可以理解为相应深度段)的各条对岩性响应敏感的测井曲线数据(根据自然伽马GR、自然电位SP、井径CAL、声波时差AC、密度DEN、补偿中子CNL、深侧向电阻率RLLD及浅侧向电阻率RLLS这些特征进行特征筛选得到)和组合测井曲线数据(根据自然伽马GR、自然电位SP、井径CAL、声波时差AC、密度DEN、补偿中子CNL、深侧向电阻率RLLD及浅侧向电阻率RLLS这些特征的任意组合形式进行特征组合扩展得到,比如采用深侧向电阻率RLLD和浅侧向电阻率RLLS 作差得到差值的组合形式作为反映岩性的一个组合特征得到)进行打标签标定组成样本数据库,同时全区除关键取芯井外的余井的未进行打标签标定的测井曲线数据和/或组合测井曲线数据组成待测数据库。
第四步骤:将样本数据库的数据进行分类,形成训练数据集和测试数据集,具体优选地,比如在样本数据库中随机抽取70%的样本库数据归为训练数据集,余下30%的样本库数据归为测试数据集,当然也可以随机抽取其它比例的样本库数据,所述训练数据集的数据用于机器学习训练及自动建立模型,所述测试数据集的数据用于检验建立的模型的好坏。
第五步骤:利用若干机器学习算法对训练数据集的数据进行机器学习训练后分别自动建立相应的岩性识别模型,所述若干机器学习算法包括但不限于决策树算法、随机森林算法、 adaboost算法、梯度提升树算法、逻辑回归算法、支持向量机算法和贝叶斯算法中的任意算法的组合,优选地,如图1所示,本实施例采用决策树算法、随机森林算法、adaboost算法、梯度提升树算法、逻辑回归算法、支持向量机算法和贝叶斯算法分别单独进行对训练数据集的数据进行机器学习训练后分别自动建立相应的岩性识别模型,也即建立出7中岩性识别模型,具体各算法分别的学习过程如下:
(1)决策树算法
决策树代表的是对象属性与对象值之间的一种映射关系,树中每个节点表示某一个对象,而每个分叉路径则代表的某个可能的属性值,而每个叶结点则对应从根节点到该叶节点所经历的路径所表示的对象的值,决策树算法主要包括ID3算法,C4.5算法和CATR算法:当采用ID3算法时,是决策树算法的代表,其采用分治策略,在决策树各级结点上选择属性时,用信息增益作为属性的选择标准,以便在每一个非叶结点上进行测试时,能获得关于被测试记录最大的类别信息,具体方法是:检测所有的属性,选择信息增益最大的属性产生决策树结点,由该属性的不同取值建立分支,再对各分支的子集递归调用该方法建立决策树结点的分支,直到所有子集仅包含同一类别的数据为止,也即最后得到一棵决策树,它可以对新的样本进行分类;采用C4.5算法时,是根据ID3算法演变而来,继承了ID3算法的优点,C4.5 算法引入了新的方法和功能,①用信息增益率的概念,克服了用信息增益选择属性时偏向多值属性的不足,②在树构造过程中进行剪枝,以避免树的过度拟合,③能够对连续属性的离散化处理,④可以处理具有缺少属性值的训练样本集,⑤能够对不完整数据进行处理;当采用CATR算法时,选择具有最小基尼指数值的属性作为测试属性,并采用一种二分递归分割的技术,是将当前样本集分为两个子样本集,使得生成的决策树的每一个非叶节点都有两个分枝,最后生成的决策树是结构简洁的二叉树,使用后剪枝算法,也即理解为通过CATR算法对训练数据集数据进行学习建立出岩性识别模型后,再采用剪枝算法使用测试数据集对已建立的岩性识别模型中子树的分类错误进行计算,找出分类错误最小的子树作为最终的分类模型;
优选地,决策树建立分类数的关键是选择一个好的划分标准,一般用统计度量的方法选择属性对节点进行划分,这个划分标准主要是利用信息论的观点来阐述,比如假设训练数据集D={(x1,y1),(x2,y2)…(xN,yN)},其中为输入实例,n为特征个数,yi∈{1,2,...,K}为类标记,i=1,2,…,N为样本容量,A表示某一属性,假设X是一个取有限个值的离散随机变量,其概率分布为:
P(X=xi)=pi,i=1,2,...,n (2)
其中对信息量(Intormation)和嫡(Entropy)的定义为
Information=-log2 pi (3)
Entropy=-∑pi log2 pi (4)
信息增益:
信息增益率:
基尼指数:
Gini(D)=1-∑pi2 (7)
如果用属性A将数据集D分成两部分D1,D2,那么这个划分的基尼指数就是:
也就是决策树算法过程中要根据信息增益或信息增益率计算结果进行相应选择后产生确定的决策树,进而建立出确定的岩性识别模型。
(2)随机森林算法
随机森林算法(RF算法)可以理解为一种组合分类器,它利用bootstrap重抽样方法从原始样本中抽取多个样本,对每个bootstrap样本进行决策树建模,然后将这些决策树组合在一起,通过投票得出最终分类或预测的结果,具体的,随机森林算法为每一个训练子集分别建立一棵决策树,生成N棵决策树从而形成“森林”,每棵决策树任其生长,不需要剪枝处理,其中涉及的一个重要过程就是随机特征变量F的选取,这个过程增加了决策树构建时的随机性,在进行节点属性选择时,并不是全体属性都参与选择的过程,而是从全体属性中随机的选择F个属性进行节点属性的选择过程,这里F的值即为随机特征变量,随机特征变量是随机森林算法为了提高分类精度,减小森林中树之间的相关系数,而引入的一种随机性,由于为随机特征变量的引入,使在每棵子树的生长过程中,不是将样本的全部M个属性参与节点分裂,而是随机抽取F(F≤M)个属性,比较这F个属性上分裂规则最优的属性对节点进行分裂,由于抽取的F个属性具有随机性,从而使得每棵决策树在生成的过程中,都有区别的其他的决策树,这就为随机森林引入了另一个随机因素,随机森林算法的随机性体现在产生决策树的训练样本是随机的,树中节点分裂时选择的最优属性也是随机的,有了这两点随机性,由此能够有效保证利用随机森林算法进行建模的过程中不产生过拟合现象,保证了模型的可靠性。
(3)adaboost算法
adaboost算法是一种迭代算法,其核心思想是针对同一个训练集训练不同的分类器(弱分类器),然后把这些adaboost弱分类器集合起来,构成一个更强的最终分类器(强分类器),其算法本身是通过改变数据分布来实现的,它根据每次训练集之中每个样本的分类是否正确,以及上次的总体分类的准确率,来确定每个样本的权值,将修改过权值的新数据集送给下层分类器进行训练,最后将每次训练得到的分类器最后融合起来,作为最后的决策分类器,使用adaboost分类器可以排除一些不必要的训练数据特征,并将关键放在关键的训练数据上面,具体计算过程为:
给定一个训练集D={(x1,y1),(x2,y2)…(xN,yN)},其中实例x∈X,而实例空间X属于R,yi属于标记集合{-1,1};
首先初始化训练数据的权值分布,每一个训练样本最开始都赋予相同的权值,1/N;
D1=(w11,w12…w1N),w1N=1/N,i=1.2…N;
进行多轮迭代,用m=1.2...M表示迭代的第几轮;
使用相同权值分布的训练集学习,得到基分类器如下:
Gm(x):X→{-1,1};
然后计算Gm(x)在训练集上的分类误差率如下:
由上式可知,Gm(x)在训练数据集上的误差率em就是Gm(x)误分类样本的权值之和;
计算Gm(x)的权系数:
权值更新,用于下一轮迭代:
Dm+1=(wm+1,1,wm+1,2…wm+1,N) (11)
组合各个弱分类器:
组合后最终得到一个更强的最终分类器,也即建立出岩性识别模型。
(4)梯度提升树算法
在实际训练过程中,训练数据的属性类别有可能较多,导致单棵决策树学习预测出的类别(建立出的模型)出现错误,且出现学习效果无法提高的情况,这时候就可以通过训练许多棵决策树来生成预测,再将这些多棵决策树通过不同的方式组合起来生成最终的预测这种方式即为梯度提升树算法,有效减少了单棵树预测出错的情况,同时提高整体的训练结果,具体的比如GBDT算法就是将训练好的大量的决策树组合起来生成预测结果的算法,其在训练好的决策树上融入了boosting的思想,从而组合成GBDT算法:
提升方法实际采用加法模型(即基函数的线性组合)与前向分步算法,模型为
其中,T(x;φm)表示决策树;φm为决策树参数,M为树的个数。
提升树算法采用前向分步算法,首先确定初始提升树f0(x)=0,第m步的模型是
fm(x)=fm-1(x)+T(x;φm) (16)
其中fm-1(x)为当前模型,通过经验风险极小化确定下一颗决策树的参数φm
下一棵决策树的决策树参数为:
梯度提升树算法的算法过程为:
输入训练数据集D={(x1,y1),(x2,y2),...,(xn,yn)},损失函数L(y,F(x)),迭代的次数为M,然后使用常量值初始化模型其中γ是常数,再然后迭代训练模型For m=1:M
计算伪残差:
其中i=1,2,…,n
将残差rim拟合到回归树hm(x)中,即hm(x)的训练集为{(xi,rim)}
计算乘数γ
更新模型
Fm(x)=Fm-1(x)+γmhm(x) (20)
最终获得岩性识别模型。
(5)逻辑回归算法
假设有数据集D={(x1,y1),(x2,y2)…(xN,yN)},i=1,2,…,N,xi∈Rn,yi∈{0,1},输入向量为x=(x(1),…,x(n)),类标签y为二值函数:y为0或1,逻辑回归(LR)为基于如下的概率模型:
w是需要被学习的特征的权重值,而φ(x)定义了特征向量的转换函数,φ0=1代表常数项。
对于每一个i,定义bi=p(yi=1|xi)如上式逻辑回归最大化训练集的似然概率:
其中,w=(w0,...,wn)T是系数向量;
该函数被被称为逻辑回归的似然函数,可以作为损失函数使用,在实际应用中由于需要使用对数损失,因此对其使用对数函数进行化简,得到:
可以理解为这就是最终形式的损失函数,也就是计算中使用的目标函数,逻辑回归中主要的计算就是针对此函数求解最小值,也就是得到最终的岩性识别模型。
(6)支持向量机算法
支持向量机算法是一种通用的机器学习算法,是数据挖掘中的一项新技术,其核心问题是对一个大规模凸二次规划问题进行求解,假设有数据集D={(x1,y1),(x2,y2)…(xN,yN)}, xi∈Rn yi∈{-1,1},i=1,2,…,N,xi为第i个特征向量,也称为实例,yi为xi的类标记,学习目标是在特征空间中找到一个分离超平面,能将实例分到不同的类,分离超平面对应于方程w×x+b=0,它由法向量和截距b决定,满足两类样本点间间隔最大原则,这样就把问题转化为寻求法方向w的问题,进而求解下列对变量w和b的最优化问题:
其中,s.t.yi((w×xi)+b)≥1,i=1,2....l,为使得问题的求解更简单易行,将原始问题转化为对偶问题进行研究,首先引入原始问题的拉格朗日(Lagrange)函数:
其中α=(α12,...,αl,)T为拉格朗日乘子,根据wolfe对偶原理,先求拉格朗日函数关于 w,b的偏导数.由极值条件可以得到:
将其带入拉格朗日函数中,即得原始优化问题的对偶问题为:
其中αi≥0,i=1,2...l,如果对应的αj≥0,i=1,2...l的训练集T中输入xi,称为支持向量(support Vector,SV),设a*=(a1 *,,,al *)T是对偶问题的任意解,则可按下式计算出原始问题的解:
进而得到决策函数,最终建立出岩性识别模型。
(7)贝叶斯算法
根据著名的贝叶斯公式通过待分类的实例的一些特征的先验概率来计算该实例属于某分类的后验概率,从而预测该实例的类标,它假设文本中单词的分布遵循某个特定的参数模型,并且可通过训练集中的数据样本来估计这些参数,设输入空间χ属于Rn为n维向量的集合,输出空间为类标记集合m={c1,c2,…ck}输入为特征向量x属于χ,输出类标记y属于m,X 是定义在输入空间χ上的随机向量,Y是定义在输出空间m上的随机变量,P(X,Y)是X和 Y的联合概率分布,训练数据集D={(x1,y1),(x2,y2),…(xN,yN)}由P(X,Y)独立同分布产生,然后朴素贝叶斯算法通过训练数据集学习联合概率分布P(X,Y),具体地,学习以下先验概率分布及条件概率分布,如:
先验概率分布:P(Y=ck),k=1,2..K
条件概率分布:
P(X=x|Y=ck)=P(X(1)=x(1),...,X(n)=x(n)|Y=ck),k=1,2...,k (32)
朴素贝叶斯法对条件概率分布作了条件独立性的假设,由于这是一个较强的假设,条件独立性假设是
朴素贝叶斯法实际上学习到生成数据的机制,所以属于生成模型,条件独立假设等于是说用于分类的特征在类确定的条件下都是条件独立的,这一假设使朴素贝叶斯法变的简单,但有时会牺牲一定的分类准确率,
朴素贝叶斯法分类时,给定的输入x,通过学习到的模型计算后验概率分布P(Y=ck|X=x),将后验概率最大的类作为x的类输出,后验概率计算根据贝叶斯定理进行:
则朴素贝叶斯法分类的基本公式:
上式中分母对所有ck都是相同的,所以得到分类器为:
最终建立出岩性识别模型。
第六步骤:基于测试数据集并利用分类性能评价法则对建立的各种不同的岩性识别模型进行评价比较,选出分类性能最优的岩性识别模型,具体的优选地,所述分类性能评价法则为结合分类准确率评价法、ROC评价法及AUC评价法的综合评价法则,通过分析比较不同模型对测试数据集结果预测的准确度、数据分类正确概率、AUC值的大小从而评价选出最优的岩性识别模型,对三种评价法分别进行如下说明:
(1)分类准确率评价法
分类准确率(accuracy)的定义为:给定的测试数据集,分类器正确分类的样本数与总样本数之比,还有精确率(precision)和召回率(recall)的定义,通常以关注的类为正类,其他类为负类,分类器在测试数据集上的预测或正确或不正确,假设4种情况的情况出现的总数分别记作:
TP:将正类预测为正类数;
FN:将正类预测为负类数;
FP:将负类预测为正类数;
TN:将负类预测为负类数;
则精确率定义为:
召回率定义为:
将精确率和召回率的均值记为F1值,则F1值满足:
通过分析比较第五步骤中建立的七种不同的岩性识别模型对测试数据集结果预测的分类准确率、精确率及召回率参数的比较,进而评价出最优的模型。
(2)ROC评价法
ROC曲线(Receiver Operating Characteristic,受试者工作特征曲线)关注两个指标true positive rate(真阳性概率)和false positive rate(假阳性概率),truepositive rate定义:
false positive rate定义:
其中,TPR代表将正类样本分对的概率,FPR代表将负类样本错分为正类的概率,ROC 曲线空间中,每个点的横坐标是FPR,纵坐标是TPR,在一个两类判别问题中,样本值一般情况下是连续的,可以通过设定一个阀值作为作为临界点,将样本判别为负类或正类,因而可以首先改变阀值,接着按照不同的阀值对样本进行分类,然后根据分类结果得到ROC空间中相应的点,连接这些点就形成了ROC曲线,(0,0)代表所有样本全部被判定为负类,(1,1)代表所有样本被判定为正类,(0,1)代表最完美分类,通过二维ROC曲线图形,能很直观的比较不同分类器模型的分类性能,故而可以根据计算结果或者直接根据ROC曲线图形评价比较各岩性识别模型进而找出最优的岩性识别模型。
(3)AUC评价法
AUC代表ROC曲线下方与坐标轴围成的面积值,AUC值能更加定量的判定各种模型的分类性能,其计算公式为:
此方法中,当AUC值在0.5到1之间时,AUC值越大,代表分类器性能越好也就是该AUC值对应的岩性识别模型的分类性能最优,即得到最优的岩性识别模型。
本实施例优选采用结合分类准确率评价法、ROC评价法及AUC评价法的综合评价法则-- 分类性能评价法则,然后通过分析比较不同模型对测试数据集结果预测的准确度、数据分类正确概率、AUC值的大小等等各项相关参数,从而在七种岩性识别模型中评价选出最优的岩性识别模型,具体地,如图3a-3g所示,针对于七种模型(七种算法下分别建立的岩性识别模型)的ROC评价曲线列示如图,图中0代表泥岩,1代表粉砂岩,2代表细砂岩,3代表含砾砂岩,分别建立以将正类样本分对的概率FPR为横坐标,以将负类样本错分为正类的概率TPR为纵坐标的曲线图,从图中可以看出,七种模型下的ROC评价曲线当中,梯度提升树算法(也称GBDT算法)下建立的岩性识别模型的四条岩性曲线最接近单位1,也就是分类性能最优,再结合auc值的计算结果,梯度提升树算法模型下四种岩性对应的auc值分别能达到0.99、0.95、0.91、0.97,其余算法模型的计算结果值均比这个结果值要小,所以还是梯度提升树算法建立的岩性识别模型性能最优,再进一步还可以随机选取总样数后多次进行准确率计算,结合如下表1的准确率计算结果来看(也可以结合准确率、ROC值、AUC值综合比较),仍然是梯度提升树算法建立的模型的性能最优。
表1
第七步骤:利用第六步骤得出的最优的岩性识别模型对待测数据库中的各测井曲线数据和/或组合测井曲线数据进行岩性预测获得全区除关键取芯井外的全部余井的岩性识别结果,再结合各关键取芯井的已知岩性形成全区多井复杂岩性识别结果,也即利用最优的岩性识别模型对所有未取芯的数据进行全部智能预测。
第八步骤:对全区多井复杂岩性识别结果的数据格式进行统一的顶底深格式转换后加载到显示界面以展示岩性智能识别效果,如图4所示为岩性智能识别效果较好的岩性识别结果的图像展示,针对贝叶斯算法、梯度提升树算法、决策树算法、逻辑回归算法、随机森林算法等若干算法分类模的岩性识别模型并针对多井复杂岩性进行识别的结果,且还将不同深度段的岩性识别结果统一展示出来,通过对图像观察能够迅速获得某井的某深度段的岩性结果,然后对所有的岩性识别结果进行统一的顶底深格式转换也即对预测后的全区岩性数据批量进行格式转换,尤其是要进行顶底深转化,避免了预测的岩性数据与加载的岩性数据格式不一致的问题,以便后期加载到显示界面/软件界面等出进行可视化进行整理预测效果的判断观察,方便可靠。
综上,第一步骤-第八步骤的整体的基于测井数据的全区多井复杂岩性智能识别方法,是不再只是局限于单井的识别,解决了现有技术中对一个工区几百口井的情况也只能单一关键井进行岩性识别、取芯井有限并且都是人工手动解释费事费力的问题,将全区所有井作为一个大的整体,利用取芯井数据建立样本数据库,利用多种机器学习算法基于人工智能原理进行训练学习自动建立岩性识别模型,并对比分析,选择最优模型,避免了单一方法的局限性,通过该最优模型即可对全区井的岩性自动智能识别预测,大大减少了人力,更加方便高效,岩性识别预测结果也更为准确。
本实施例优选地,在第六步骤后、第七步骤前还要根据测试数据集的数据对第六步骤得出的最优的岩性识别模型进行可靠性的验证,也即检验模型的好坏,当验证可靠时(模型为好时),进入第七步骤;当验证不可靠时(模型为坏时),返回到第二步骤重新筛选对岩性敏感的测井曲线数据,其中所述测试数据集主要来源于第三步骤中余下30%的样本库数据(也可直接理解为提取70%样本数据库数据后余下的关键取芯井的已知岩性及相对应的各条对岩性响应敏感的测井曲线数据和/或组合测井曲线数据)。
本发明还涉及了一种基于测井数据的多井复杂岩性智能识别系统,该系统与上述基于测井数据的多井复杂岩性智能识别方法相对应,可理解为是实现上述方法的系统,该系统结构如图5所示,包括依次连接的数据处理单元、关键取芯井测井数据判定单元、特征筛选单元、数据标定单元、样本数据库、机器学习训练单元、模型建立单元、模型评价优选单元和岩性识别预测单元,所述关键取芯井测井数据判定单元和所述特征筛选单元还连接至待测数据库同时待测数据库连接至岩性识别预测单元,所述数据处理单元对确定的目标测井数据文件进行格式转换以及归一化预处理,所述关键取芯井测井数据判定单元判断数据是否为关键取芯井测井数据,判定结果为是则将数据传递给特征筛选单元,否则直接将数据归入待测数据库,所述特征筛选单元根据全区关键取芯井在取芯井段的已知岩性对各关键取芯井的测井曲线数据进行特征筛选和/或特征组合扩展获得对岩性敏感的测井曲线数据,所述数据标定单元根据取芯井段的已知岩性给对岩性敏感的测井曲线数据进行打标签标定组成样本数据库,同时全区除关键取芯井外的其余井的未打标签的测井曲线数据直接从所述特征筛选单元传输归入待测数据库,所述机器学习训练单元利用样本数据库的数据并结合若干机器学习算法进行机器学习训练后利用所述模型建立单元自动建立若干岩性识别模型,所述模型评价优选单元再通过分类性能评价法则选出最优的模型,岩性识别预测单元并利用最优的模型对待测数据库中的数据进行岩性预测,该系统结果简单、操作方便,并且是提取取芯数据后利用取芯数据,用岩芯标定测井数据,然后对测井数据打标签利用关键取芯井的数据组成样本数据库并据此利用多种机器学习训练方法训练学习后建立岩性识别模型,并对比分析选择最优模型后利用最优模型实现全区未取芯井的岩心预测从而实现全区多井复杂岩性的智能识别,该方法不再单单局限于单个井的识别,无需全区各井取芯,解决了全区取芯成本过高、全区岩性识别难度大、特征测井曲线太过单一导致岩性识别结果准确率低等缺陷,且该方法利用人工智能机器学习训练的方法,结合智能分析比较以及根据模型自动预测结果等技术原理,高效方便、准确度高的完成全区多井复杂岩性的智能识别,大大提高了岩性识别的速度与准确度且大大减少了人力和降低了成本。
优选地,上述系统中所述若干机器学习算法包括但不限于决策树算法、随机森林算法、 adaboost算法、梯度提升树算法、逻辑回归算法、支持向量机算法和贝叶斯算法中的任意算法的组合;
和/或,所述归一化预处理的过程针对不同来源的测井数据,首先分别提取各来源测井数据中占比95%的数据作为最大值、占比5%的数据作为最小值,再结合归一化计算公式分别获得各来源测井数据的归一化结果,使得各来源测井数据的数值范围均分布在[0,1]之间,解决了不同仪器所测得的测井数据结果的数值范围会不一样而造成的对后续全区岩性预测影响过大、误差过大的问题,方便后续读取数据。
优选地,上述系统中所述特征筛选和/或特征组合扩展过程中涉及的所述特征包括但不限于自然伽马、自然电位、井径、声波时差、密度、补偿中子、深侧向电阻率及浅侧向电阻率,同时所述特征组合扩展形式包括但不限于特征加和、特征作差的方式。
优选地,所述分类性能评价法则为结合分类准确率评价法、ROC评价法及AUC评价法的综合评价法则,通过分析比较不同模型对测试数据集结果预测的准确度、数据分类正确概率、 AUC值的大小从而评价选出最优的岩性识别模型,综合的分类性能评价法则使得系统能够更精准、更快速、更高效地找出最优的岩性识别模型,为后续的全区复杂岩性识别提供了有利条件。
应当指出,以上所述具体实施方式可以使本领域的技术人员更全面地理解本发明创造,但不以任何方式限制本发明创造。因此,尽管本说明书参照附图和实施例对本发明创造已进行了详细的说明,但是,本领域技术人员应当理解,仍然可以对本发明创造进行修改或者等同替换,总之,一切不脱离本发明创造的精神和范围的技术方案及其改进,其均应涵盖在本发明创造专利的保护范围当中。

Claims (10)

1.一种基于测井数据的多井复杂岩性智能识别方法,其特征在于,首先确定目标测井数据文件并进行格式转换以及归一化预处理,然后根据全区关键取芯井在取芯井段的已知岩性对各关键取芯井的测井曲线数据进行特征筛选和/或特征组合扩展获得对岩性敏感的测井曲线数据,再根据取芯井段的已知岩性给对岩性响应敏感的测井曲线数据进行打标签标定组成样本数据库同时将全区除关键取芯井外的其余井的未打标签的测井曲线数据组成待测数据库,进而利用样本数据库的数据并结合若干机器学习算法进行机器学习训练后自动建立若干岩性识别模型,再通过分类性能评价法则选出最优的模型,并利用最优的模型对待测数据库中的数据进行岩性预测以实现全区多井复杂岩性智能识别。
2.根据权利要求1所述的基于测井数据的全区多井复杂岩性智能识别方法,其特征在于,具体包括以下步骤:
第一步骤:根据全区各井的测井信息资料确定LAS或XLS格式的原始测井曲线文件并统一将原始测井曲线文件格式转换为CSV格式,再进行归一化预处理;
第二步骤:根据全区所有关键取芯井在取芯井段的已知岩性对各关键取芯井的测井曲线数据进行特征筛选,通过比较各测井曲线数据的变化趋势筛选出若干条对岩性响应敏感的测井曲线数据,
和/或,根据全区所有关键取芯井在取芯井段的已知岩性对各关键取芯井的测井曲线数据进行特征组合扩展,通过将两个以上的特征组合扩展后根据组合特征的变化趋势绘制出对岩性响应敏感的组合测井曲线数据且全区所有井都绘制与其相对应的组合测井曲线数据;
第三步骤:分别根据各关键取芯井在取芯井段的已知岩性给各关键取芯井相对应的各条对岩性响应敏感的测井曲线数据和/或组合测井曲线数据进行打标签标定组成样本数据库,同时全区除关键取芯井外的余井的未进行打标签标定的测井曲线数据和/或组合测井曲线数据组成待测数据库;
第四步骤:将样本数据库的数据进行分类,形成训练数据集和测试数据集,所述训练数据集用于机器学习训练及自动建立模型,所述测试数据集用于检验模型的好坏;
第五步骤:利用若干机器学习算法对训练数据集的数据进行机器学习训练后分别自动建立相应的岩性识别模型,所述若干机器学习算法包括但不限于决策树算法、随机森林算法、adaboost算法、梯度提升树算法、逻辑回归算法、支持向量机算法和贝叶斯算法中的任意算法的组合;
第六步骤:基于测试数据集并利用分类性能评价法则对建立的各种不同的岩性识别模型进行评价比较,选出分类性能最优的岩性识别模型;
第七步骤:利用最优的岩性识别模型对待测数据库中的各测井曲线数据和/或组合测井曲线数据进行岩性预测获得全区除关键取芯井外的全部余井的岩性识别结果,再结合各关键取芯井的已知岩性形成全区多井复杂岩性识别结果;
第八步骤:对全区多井复杂岩性识别结果的数据格式进行统一的顶底深格式转换后加载到显示界面以展示岩性智能识别效果。
3.根据权利要求2所述的基于测井数据的多井复杂岩性智能识别方法,其特征在于,第一步骤所述归一化预处理过程针对不同来源的测井数据,首先分别提取各来源测井数据中占比95%的数据作为最大值、占比5%的数据作为最小值,再结合归一化计算公式分别获得各来源测井数据的归一化结果,使得各来源测井数据的数值范围均分布在[0,1]之间。
4.根据权利要求2或3所述的基于测井数据的多井复杂岩性智能识别方法,其特征在于,第二步骤的特征筛选和/或特征组合扩展中涉及的所述特征包括但不限于自然伽马、自然电位、井径、声波时差、密度、补偿中子、深侧向电阻率及浅侧向电阻率,同时所述特征组合扩展形式包括但不限于特征加和、特征作差的方式。
5.根据权利要求2所述的基于测井数据的多井复杂岩性智能识别方法,其特征在于,第三步骤选取部分关键取芯井进行打标签标定组成样本数据库,同时余下的关键取芯井的已知岩性及相对应的各条对岩性响应敏感的测井曲线数据和/或组合测井曲线数据用于验证在第六步骤得到的最优的岩性识别模型的可靠性,当验证可靠时,进入第七步骤;当验证不可靠时,返回到第二步骤重新筛选对岩性敏感的测井曲线数据。
6.根据权利要求2或5所述的基于测井数据的多井复杂岩性智能识别方法,其特征在于,第六步骤所述分类性能评价法则为结合分类准确率评价法、ROC评价法及AUC评价法的综合评价法则,通过分析比较不同模型对测试数据集结果预测的准确度、数据分类正确概率、AUC值的大小从而评价选出最优的岩性识别模型。
7.一种基于测井数据的多井复杂岩性智能识别系统,其特征在于,包括依次连接的数据处理单元、关键取芯井测井数据判定单元、特征筛选单元、数据标定单元、样本数据库、机器学习训练单元、模型建立单元、模型评价优选单元和岩性识别预测单元,所述关键取芯井测井数据判定单元和所述特征筛选单元还连接至待测数据库同时待测数据库连接至岩性识别预测单元,所述数据处理单元对确定的目标测井数据文件进行格式转换以及归一化预处理,所述关键取芯井测井数据判定单元判断数据是否为关键取芯井测井数据,判定结果为是则将数据传递给特征筛选单元,否则直接将数据归入待测数据库,所述特征筛选单元根据全区关键取芯井在取芯井段的已知岩性对各关键取芯井的测井曲线数据进行特征筛选和/或特征组合扩展获得对岩性敏感的测井曲线数据,所述数据标定单元根据取芯井段的已知岩性给对岩性敏感的测井曲线数据进行打标签标定组成样本数据库,同时全区除关键取芯井外的其余井的未打标签的测井曲线数据直接从所述特征筛选单元传输归入待测数据库,所述机器学习训练单元利用样本数据库的数据并结合若干机器学习算法进行机器学习训练后利用所述模型建立单元自动建立若干岩性识别模型,所述模型评价优选单元再通过分类性能评价法则选出最优的模型,岩性识别预测单元并利用最优的模型对待测数据库中的数据进行岩性预测。
8.根据权利要求7所述的基于测井数据的多井复杂岩性智能识别系统,其特征在于,所述若干机器学习算法包括但不限于决策树算法、随机森林算法、adaboost算法、梯度提升树算法、逻辑回归算法、支持向量机算法和贝叶斯算法中的任意算法的组合;
和/或,所述归一化预处理的过程针对不同来源的测井数据,首先分别提取各来源测井数据中占比95%的数据作为最大值、占比5%的数据作为最小值,再结合归一化计算公式分别获得各来源测井数据的归一化结果,使得各来源测井数据的数值范围均分布在[0,1]之间。
9.根据权利要求8所述的基于测井数据的多井复杂岩性智能识别系统,其特征在于,所述特征筛选和/或特征组合扩展过程中涉及的所述特征包括但不限于自然伽马、自然电位、井径、声波时差、密度、补偿中子、深侧向电阻率及浅侧向电阻率,同时所述特征组合扩展形式包括但不限于特征加和、特征作差的方式。
10.根据权利要求9所述的基于测井数据的多井复杂岩性智能识别系统,其特征在于,所述分类性能评价法则为结合分类准确率评价法、ROC评价法及AUC评价法的综合评价法则,通过分析比较不同模型对测试数据集结果预测的准确度、数据分类正确概率、AUC值的大小从而评价选出最优的岩性识别模型。
CN201910078669.5A 2019-01-28 2019-01-28 一种基于测井数据的多井复杂岩性智能识别方法及系统 Pending CN109919184A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910078669.5A CN109919184A (zh) 2019-01-28 2019-01-28 一种基于测井数据的多井复杂岩性智能识别方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910078669.5A CN109919184A (zh) 2019-01-28 2019-01-28 一种基于测井数据的多井复杂岩性智能识别方法及系统

Publications (1)

Publication Number Publication Date
CN109919184A true CN109919184A (zh) 2019-06-21

Family

ID=66960850

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910078669.5A Pending CN109919184A (zh) 2019-01-28 2019-01-28 一种基于测井数据的多井复杂岩性智能识别方法及系统

Country Status (1)

Country Link
CN (1) CN109919184A (zh)

Cited By (52)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110286141A (zh) * 2019-07-15 2019-09-27 中国石油集团渤海钻探工程有限公司 一种基于逻辑回归的自动岩性定名方法
CN110344824A (zh) * 2019-06-25 2019-10-18 中国矿业大学(北京) 一种基于随机森林回归的声波曲线生成方法
CN110516733A (zh) * 2019-08-23 2019-11-29 西南石油大学 一种基于改进多分类孪生支持向量机的测井岩性识别方法
CN110674841A (zh) * 2019-08-22 2020-01-10 中国石油天然气集团有限公司 一种基于聚类算法的测井曲线识别方法
CN110824563A (zh) * 2019-10-21 2020-02-21 中国海洋石油集团有限公司 一种基于Xgboost算法的储层岩性预测方法
CN110852144A (zh) * 2019-08-23 2020-02-28 中国石油大学(北京) 一种基于dtw的智能地层对比方法和系统
CN111079783A (zh) * 2019-11-11 2020-04-28 东北石油大学 一种基于多核集成学习识别地层岩性参数的方法
CN111206922A (zh) * 2020-01-13 2020-05-29 中国石油天然气股份有限公司大港油田分公司 一种自然伽马和电阻率组合的页岩油含油丰度评价方法
CN111241056A (zh) * 2019-12-31 2020-06-05 国网浙江省电力有限公司电力科学研究院 一种基于决策树模型的电力用能数据存储优化方法
CN111489034A (zh) * 2020-04-10 2020-08-04 华中科技大学 一种油气储层渗透率预测模型的构建方法及其应用
CN111695635A (zh) * 2020-06-15 2020-09-22 中国地质大学(北京) 动态分类委员会机器测井流体识别方法及系统
CN111767674A (zh) * 2020-05-29 2020-10-13 中国科学技术大学 一种基于主动域适应的测井岩性识别方法
CN111832636A (zh) * 2020-06-30 2020-10-27 中国石油大学(北京) 基于特征组合的朴素贝叶斯岩相分类方法及装置
CN111997585A (zh) * 2020-07-15 2020-11-27 中煤科工集团西安研究院有限公司 一种基于穿层孔测井的煤矿透明工作面构建方法
CN112132182A (zh) * 2020-08-20 2020-12-25 上海大学 一种基于机器学习快速预测三元金合金电阻率的方法
CN112200459A (zh) * 2020-10-12 2021-01-08 贵州电网有限责任公司 一种配电网数据质量分析评价方法及系统
CN112329804A (zh) * 2020-06-30 2021-02-05 中国石油大学(北京) 基于特征随机的朴素贝叶斯岩相分类集成学习方法及装置
CN112464964A (zh) * 2019-09-06 2021-03-09 北京国双科技有限公司 钻井层段信息的确定方法、装置及电子设备
CN112489736A (zh) * 2020-12-09 2021-03-12 中国石油大学(北京) 一种矿物含量分析方法、装置、设备及存储介质
CN112576238A (zh) * 2020-12-02 2021-03-30 中国石油大学(华东) 一种低渗透油藏剩余油位置与含量测定系统、方法及应用
CN112784980A (zh) * 2021-01-05 2021-05-11 中国石油天然气集团有限公司 一种智能化测井层位划分方法
CN112862139A (zh) * 2019-11-27 2021-05-28 北京国双科技有限公司 流体类型预测模型的构建方法、流体类型预测方法和装置
CN112862140A (zh) * 2019-11-27 2021-05-28 北京国双科技有限公司 相对吸水量预测模型的构建方法和相对吸水量预测方法
CN112859192A (zh) * 2019-11-28 2021-05-28 北京国双科技有限公司 岩心饱和度预测模型构建方法与岩心饱和度预测方法
CN112861890A (zh) * 2019-11-26 2021-05-28 中国石油化工股份有限公司 一种储层评价模型构建方法及储层识别方法
CN112861061A (zh) * 2019-11-27 2021-05-28 北京国双科技有限公司 地质分层方法及系统、处理设备
CN112943224A (zh) * 2019-12-11 2021-06-11 中国石油化工股份有限公司 稠油井动液面的计算方法
CN113033637A (zh) * 2021-03-16 2021-06-25 电子科技大学 一种基于岩石物理样本增强的集成学习岩相预测方法
CN113050189A (zh) * 2019-12-27 2021-06-29 北京国双科技有限公司 一种测井曲线的重构方法、装置、设备及存储介质
CN113052195A (zh) * 2019-12-27 2021-06-29 北京国双科技有限公司 测井曲线异常值标注方法、装置、计算机设备和存储介质
CN113130018A (zh) * 2021-04-20 2021-07-16 东北石油大学 基于储层元目标不变特征描述的岩性识别方法
CN113159136A (zh) * 2021-03-30 2021-07-23 中铁第四勘察设计院集团有限公司 一种孔内数据融合的地层划分方法、装置、设备和存储介质
CN113257000A (zh) * 2021-02-19 2021-08-13 中用科技有限公司 一种道路黑冰智能化检测预警系统及方法
CN113361741A (zh) * 2020-12-14 2021-09-07 中海油能源发展股份有限公司 基于油藏工程理论和数据挖掘算法的产液能力预测方法
US11131184B1 (en) 2020-04-29 2021-09-28 Saudi Arabian Oil Company Method and system for determining a drilling hazard condition using well logs
CN113538021A (zh) * 2020-04-09 2021-10-22 上海丙晟科技有限公司 一种商场门店存续预测机器学习算法
CN113570021A (zh) * 2021-06-10 2021-10-29 江苏安派客物联科技有限公司 无源计数系统及方法
CN113642772A (zh) * 2021-07-13 2021-11-12 重庆科技学院 基于机器学习的测井储层识别预测方法
CN113792936A (zh) * 2021-09-28 2021-12-14 中海石油(中国)有限公司 一种随钻岩性智能识别方法、系统、设备和存储介质
NO20210792A1 (en) * 2020-07-17 2022-01-18 Landmark Graphics Corp Classifying downhole test data
CN114280689A (zh) * 2021-12-20 2022-04-05 中国石油大学(北京) 基于岩石物理知识确定储层孔隙度的方法、装置及设备
CN114371270A (zh) * 2021-12-03 2022-04-19 中铁第四勘察设计院集团有限公司 原位测试方法及系统
CN114492627A (zh) * 2022-01-25 2022-05-13 成都理工大学 一种基于改进knn算法的页岩脆性指数预测方法
CN114579635A (zh) * 2022-03-04 2022-06-03 北京三月雨文化传播有限责任公司 基于云计算的大数据信息分析处理系统
CN114764423A (zh) * 2022-05-23 2022-07-19 合肥综合性国家科学中心人工智能研究院(安徽省人工智能实验室) 一种测井智能解释系统
CN115270959A (zh) * 2022-07-27 2022-11-01 中国石油大学(北京) 基于递归特征消除融合随机森林的页岩岩性识别法及装置
CN115506783A (zh) * 2021-06-21 2022-12-23 中国石油化工股份有限公司 一种岩性识别方法
CN115659245A (zh) * 2022-10-24 2023-01-31 东华理工大学 一种基于机器学习的砂岩型铀矿岩层类型识别方法及装置
CN116821770A (zh) * 2023-07-17 2023-09-29 中国矿业大学 断层区巷道围岩变形智能预测及分类方法
CN117235628A (zh) * 2023-11-10 2023-12-15 天津花栗鼠软件科技有限公司 一种基于混合贝叶斯深度网络测井曲线预测方法及系统
US11891882B2 (en) 2020-07-17 2024-02-06 Landmark Graphics Corporation Classifying downhole test data
WO2024077538A1 (en) * 2022-10-13 2024-04-18 Saudi Arabian Oil Company Methods and systems for predicting lithology and formation boundary ahead of the bit

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010039342A1 (en) * 2008-10-03 2010-04-08 Halliburton Energy Services Inc. Method and system for predicting performance of a drilling system
CN101881153A (zh) * 2010-06-04 2010-11-10 中国石油天然气股份有限公司 一种常规测井信息融合可视化方法及系统
CN101906965A (zh) * 2010-07-14 2010-12-08 中国矿业大学(北京) Vr地质环境下的地层识别与分析技术
CN104989392A (zh) * 2015-07-10 2015-10-21 中国石油天然气股份有限公司 一种岩性识别方法
CN105569648A (zh) * 2014-11-07 2016-05-11 中国石油化工股份有限公司 基于测井数据的储层自动识别方法
CN106094052A (zh) * 2016-06-01 2016-11-09 中国地质大学(武汉) 一种致密白云岩储层的裂缝发育程度识别方法
CN106089191A (zh) * 2016-06-12 2016-11-09 中国石油大学(华东) 一种压性断裂带结构测井识别方法
CN106370814A (zh) * 2016-09-09 2017-02-01 中国海洋石油总公司 基于成分‑结构分类的湖相混积岩类储层测井识别方法
CN107956465A (zh) * 2017-10-12 2018-04-24 中国石油天然气集团公司 基于关联井的全区多井测井曲线标准化方法及装置
CN108596251A (zh) * 2018-04-25 2018-09-28 中国地质大学(北京) 一种基于委员会机器利用测井数据进行储层流体识别方法
CN109113729A (zh) * 2018-06-20 2019-01-01 中国石油天然气集团有限公司 基于测井曲线的岩性识别方法及装置

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010039342A1 (en) * 2008-10-03 2010-04-08 Halliburton Energy Services Inc. Method and system for predicting performance of a drilling system
CN101881153A (zh) * 2010-06-04 2010-11-10 中国石油天然气股份有限公司 一种常规测井信息融合可视化方法及系统
CN101906965A (zh) * 2010-07-14 2010-12-08 中国矿业大学(北京) Vr地质环境下的地层识别与分析技术
CN105569648A (zh) * 2014-11-07 2016-05-11 中国石油化工股份有限公司 基于测井数据的储层自动识别方法
CN104989392A (zh) * 2015-07-10 2015-10-21 中国石油天然气股份有限公司 一种岩性识别方法
CN106094052A (zh) * 2016-06-01 2016-11-09 中国地质大学(武汉) 一种致密白云岩储层的裂缝发育程度识别方法
CN106089191A (zh) * 2016-06-12 2016-11-09 中国石油大学(华东) 一种压性断裂带结构测井识别方法
CN106370814A (zh) * 2016-09-09 2017-02-01 中国海洋石油总公司 基于成分‑结构分类的湖相混积岩类储层测井识别方法
CN107956465A (zh) * 2017-10-12 2018-04-24 中国石油天然气集团公司 基于关联井的全区多井测井曲线标准化方法及装置
CN108596251A (zh) * 2018-04-25 2018-09-28 中国地质大学(北京) 一种基于委员会机器利用测井数据进行储层流体识别方法
CN109113729A (zh) * 2018-06-20 2019-01-01 中国石油天然气集团有限公司 基于测井曲线的岩性识别方法及装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
张鑫: "测井储层评价数据挖掘方法研究", 《中国优秀硕士学位论文全文数据库信息科技辑》 *
李洪奇等: "复杂储层测井评价数据挖掘方法研究", 《石油学报》 *

Cited By (73)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110344824A (zh) * 2019-06-25 2019-10-18 中国矿业大学(北京) 一种基于随机森林回归的声波曲线生成方法
CN110286141B (zh) * 2019-07-15 2022-04-12 中国石油集团渤海钻探工程有限公司 一种基于逻辑回归的自动岩性定名方法
CN110286141A (zh) * 2019-07-15 2019-09-27 中国石油集团渤海钻探工程有限公司 一种基于逻辑回归的自动岩性定名方法
CN110674841A (zh) * 2019-08-22 2020-01-10 中国石油天然气集团有限公司 一种基于聚类算法的测井曲线识别方法
CN110674841B (zh) * 2019-08-22 2022-03-29 中国石油天然气集团有限公司 一种基于聚类算法的测井曲线识别方法
CN110516733A (zh) * 2019-08-23 2019-11-29 西南石油大学 一种基于改进多分类孪生支持向量机的测井岩性识别方法
CN110852144A (zh) * 2019-08-23 2020-02-28 中国石油大学(北京) 一种基于dtw的智能地层对比方法和系统
CN112464964A (zh) * 2019-09-06 2021-03-09 北京国双科技有限公司 钻井层段信息的确定方法、装置及电子设备
CN110824563A (zh) * 2019-10-21 2020-02-21 中国海洋石油集团有限公司 一种基于Xgboost算法的储层岩性预测方法
CN111079783A (zh) * 2019-11-11 2020-04-28 东北石油大学 一种基于多核集成学习识别地层岩性参数的方法
CN111079783B (zh) * 2019-11-11 2022-11-08 东北石油大学 一种基于多核集成学习识别地层岩性参数的方法
CN112861890B (zh) * 2019-11-26 2024-01-12 中国石油化工股份有限公司 一种储层评价模型构建方法及储层识别方法
CN112861890A (zh) * 2019-11-26 2021-05-28 中国石油化工股份有限公司 一种储层评价模型构建方法及储层识别方法
CN112861061A (zh) * 2019-11-27 2021-05-28 北京国双科技有限公司 地质分层方法及系统、处理设备
CN112862140A (zh) * 2019-11-27 2021-05-28 北京国双科技有限公司 相对吸水量预测模型的构建方法和相对吸水量预测方法
CN112862139A (zh) * 2019-11-27 2021-05-28 北京国双科技有限公司 流体类型预测模型的构建方法、流体类型预测方法和装置
CN112859192A (zh) * 2019-11-28 2021-05-28 北京国双科技有限公司 岩心饱和度预测模型构建方法与岩心饱和度预测方法
CN112943224B (zh) * 2019-12-11 2023-02-07 中国石油化工股份有限公司 稠油井动液面的计算方法
CN112943224A (zh) * 2019-12-11 2021-06-11 中国石油化工股份有限公司 稠油井动液面的计算方法
CN113050189A (zh) * 2019-12-27 2021-06-29 北京国双科技有限公司 一种测井曲线的重构方法、装置、设备及存储介质
CN113052195A (zh) * 2019-12-27 2021-06-29 北京国双科技有限公司 测井曲线异常值标注方法、装置、计算机设备和存储介质
CN111241056B (zh) * 2019-12-31 2024-03-01 国网浙江省电力有限公司营销服务中心 一种基于决策树模型的电力用能数据存储优化方法
CN111241056A (zh) * 2019-12-31 2020-06-05 国网浙江省电力有限公司电力科学研究院 一种基于决策树模型的电力用能数据存储优化方法
CN111206922B (zh) * 2020-01-13 2022-12-13 中国石油天然气股份有限公司大港油田分公司 一种自然伽马和电阻率组合的页岩油含油丰度评价方法
CN111206922A (zh) * 2020-01-13 2020-05-29 中国石油天然气股份有限公司大港油田分公司 一种自然伽马和电阻率组合的页岩油含油丰度评价方法
CN113538021B (zh) * 2020-04-09 2023-11-10 上海丙晟科技有限公司 一种商场门店存续预测机器学习方法
CN113538021A (zh) * 2020-04-09 2021-10-22 上海丙晟科技有限公司 一种商场门店存续预测机器学习算法
CN111489034A (zh) * 2020-04-10 2020-08-04 华中科技大学 一种油气储层渗透率预测模型的构建方法及其应用
US11131184B1 (en) 2020-04-29 2021-09-28 Saudi Arabian Oil Company Method and system for determining a drilling hazard condition using well logs
CN111767674A (zh) * 2020-05-29 2020-10-13 中国科学技术大学 一种基于主动域适应的测井岩性识别方法
CN111767674B (zh) * 2020-05-29 2024-03-29 中国科学技术大学 一种基于主动域适应的测井岩性识别方法
CN111695635B (zh) * 2020-06-15 2023-08-08 中国地质大学(北京) 动态分类委员会机器测井流体识别方法及系统
CN111695635A (zh) * 2020-06-15 2020-09-22 中国地质大学(北京) 动态分类委员会机器测井流体识别方法及系统
CN111832636A (zh) * 2020-06-30 2020-10-27 中国石油大学(北京) 基于特征组合的朴素贝叶斯岩相分类方法及装置
CN112329804A (zh) * 2020-06-30 2021-02-05 中国石油大学(北京) 基于特征随机的朴素贝叶斯岩相分类集成学习方法及装置
CN111832636B (zh) * 2020-06-30 2024-04-12 中国石油大学(北京) 基于特征组合的朴素贝叶斯岩相分类方法及装置
CN111997585B (zh) * 2020-07-15 2023-10-27 中煤科工集团西安研究院有限公司 一种基于穿层孔测井的煤矿透明工作面构建方法
CN111997585A (zh) * 2020-07-15 2020-11-27 中煤科工集团西安研究院有限公司 一种基于穿层孔测井的煤矿透明工作面构建方法
US11891882B2 (en) 2020-07-17 2024-02-06 Landmark Graphics Corporation Classifying downhole test data
NO20210792A1 (en) * 2020-07-17 2022-01-18 Landmark Graphics Corp Classifying downhole test data
NO346481B1 (en) * 2020-07-17 2022-09-05 Landmark Graphics Corp Classifying downhole test data
CN112132182A (zh) * 2020-08-20 2020-12-25 上海大学 一种基于机器学习快速预测三元金合金电阻率的方法
CN112132182B (zh) * 2020-08-20 2024-03-22 上海大学 一种基于机器学习快速预测三元金合金电阻率的方法
CN112200459A (zh) * 2020-10-12 2021-01-08 贵州电网有限责任公司 一种配电网数据质量分析评价方法及系统
CN112200459B (zh) * 2020-10-12 2023-08-29 贵州电网有限责任公司 一种配电网数据质量分析评价方法及系统
CN112576238A (zh) * 2020-12-02 2021-03-30 中国石油大学(华东) 一种低渗透油藏剩余油位置与含量测定系统、方法及应用
CN112489736A (zh) * 2020-12-09 2021-03-12 中国石油大学(北京) 一种矿物含量分析方法、装置、设备及存储介质
CN113361741A (zh) * 2020-12-14 2021-09-07 中海油能源发展股份有限公司 基于油藏工程理论和数据挖掘算法的产液能力预测方法
CN112784980B (zh) * 2021-01-05 2024-05-28 中国石油天然气集团有限公司 一种智能化测井层位划分方法
CN112784980A (zh) * 2021-01-05 2021-05-11 中国石油天然气集团有限公司 一种智能化测井层位划分方法
CN113257000B (zh) * 2021-02-19 2022-10-25 中用科技有限公司 一种道路黑冰智能化检测预警系统及方法
CN113257000A (zh) * 2021-02-19 2021-08-13 中用科技有限公司 一种道路黑冰智能化检测预警系统及方法
CN113033637A (zh) * 2021-03-16 2021-06-25 电子科技大学 一种基于岩石物理样本增强的集成学习岩相预测方法
CN113159136A (zh) * 2021-03-30 2021-07-23 中铁第四勘察设计院集团有限公司 一种孔内数据融合的地层划分方法、装置、设备和存储介质
CN113130018A (zh) * 2021-04-20 2021-07-16 东北石油大学 基于储层元目标不变特征描述的岩性识别方法
CN113570021A (zh) * 2021-06-10 2021-10-29 江苏安派客物联科技有限公司 无源计数系统及方法
CN115506783A (zh) * 2021-06-21 2022-12-23 中国石油化工股份有限公司 一种岩性识别方法
CN113642772A (zh) * 2021-07-13 2021-11-12 重庆科技学院 基于机器学习的测井储层识别预测方法
CN113792936A (zh) * 2021-09-28 2021-12-14 中海石油(中国)有限公司 一种随钻岩性智能识别方法、系统、设备和存储介质
CN114371270B (zh) * 2021-12-03 2024-03-15 中铁第四勘察设计院集团有限公司 原位测试方法及系统
CN114371270A (zh) * 2021-12-03 2022-04-19 中铁第四勘察设计院集团有限公司 原位测试方法及系统
CN114280689A (zh) * 2021-12-20 2022-04-05 中国石油大学(北京) 基于岩石物理知识确定储层孔隙度的方法、装置及设备
CN114492627A (zh) * 2022-01-25 2022-05-13 成都理工大学 一种基于改进knn算法的页岩脆性指数预测方法
CN114579635A (zh) * 2022-03-04 2022-06-03 北京三月雨文化传播有限责任公司 基于云计算的大数据信息分析处理系统
CN114764423B (zh) * 2022-05-23 2024-05-07 合肥综合性国家科学中心人工智能研究院(安徽省人工智能实验室) 一种测井智能解释系统
CN114764423A (zh) * 2022-05-23 2022-07-19 合肥综合性国家科学中心人工智能研究院(安徽省人工智能实验室) 一种测井智能解释系统
CN115270959A (zh) * 2022-07-27 2022-11-01 中国石油大学(北京) 基于递归特征消除融合随机森林的页岩岩性识别法及装置
CN115270959B (zh) * 2022-07-27 2023-08-22 中国石油大学(北京) 基于递归特征消除融合随机森林的页岩岩性识别法及装置
WO2024077538A1 (en) * 2022-10-13 2024-04-18 Saudi Arabian Oil Company Methods and systems for predicting lithology and formation boundary ahead of the bit
CN115659245A (zh) * 2022-10-24 2023-01-31 东华理工大学 一种基于机器学习的砂岩型铀矿岩层类型识别方法及装置
CN116821770A (zh) * 2023-07-17 2023-09-29 中国矿业大学 断层区巷道围岩变形智能预测及分类方法
CN117235628B (zh) * 2023-11-10 2024-01-26 天津花栗鼠软件科技有限公司 一种基于混合贝叶斯深度网络测井曲线预测方法及系统
CN117235628A (zh) * 2023-11-10 2023-12-15 天津花栗鼠软件科技有限公司 一种基于混合贝叶斯深度网络测井曲线预测方法及系统

Similar Documents

Publication Publication Date Title
CN109919184A (zh) 一种基于测井数据的多井复杂岩性智能识别方法及系统
DeFries et al. Multiple criteria for evaluating machine learning algorithms for land cover classification from satellite data
CN103489005B (zh) 一种基于多分类器融合的高分辨率遥感影像分类方法
CN112785450B (zh) 一种土壤环境质量分区方法及系统
CN107766933A (zh) 一种解释卷积神经网络的可视化方法
CN112756759B (zh) 点焊机器人工作站故障判定方法
CN109165672A (zh) 一种基于渐进式学习的集成分类方法
CN114139819B (zh) 基于地统计加权随机森林的地球化学变量空间预测方法
CN115471739A (zh) 基于自监督对比学习的跨域遥感场景分类与检索方法
Ibrahim et al. A novel XRF-based lithological classification in the Tarkwaian paleo placer formation using SMOTE-XGBoost
Ye et al. Drilling formation perception by supervised learning: Model evaluation and parameter analysis
CN111079783A (zh) 一种基于多核集成学习识别地层岩性参数的方法
CN117272841B (zh) 一种基于混合神经网络的页岩气甜点预测方法
Gharavi et al. Application of machine learning techniques for identifying productive zones in unconventional reservoir
CN104850862B (zh) 一种基于单位代价收益敏感决策树的分类方法
CN111105041B (zh) 一种用于智慧数据碰撞的机器学习方法及装置
Gu et al. Classification pattern of lacustrine carbonate diagenetic facies and logging-based data-driven prediction via a generalized and robust ensemble learning: A demonstration of pre-salt profile, santos basin
CN117093922A (zh) 一种基于改进svm的不平衡样本油藏复杂流体识别方法
Vikström A comparison of different machine learning algorithms applied to hyperspectral data analysis
Vecchio et al. Pulse identification and shape analysis by derivative-based peak detection using a Convolutional Neural Network
Kaltenborn et al. Automatic classification and segmentation of Snow Micro Penetrometer profiles with machine learning algorithms
CN109886340A (zh) 一种遥感影像分类方法
Bhattacharjee et al. A leukocyte detection technique in blood smear images using plant growth simulation algorithm
CN117574269B (zh) 陆相页岩储层天然裂缝智能识别方法及系统
CN117766068B (zh) 基于锆石成分预测斑岩型矿床类型和储量的机器学习方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190621