CN111582292B - 夹层识别方法和装置 - Google Patents
夹层识别方法和装置 Download PDFInfo
- Publication number
- CN111582292B CN111582292B CN201910122815.XA CN201910122815A CN111582292B CN 111582292 B CN111582292 B CN 111582292B CN 201910122815 A CN201910122815 A CN 201910122815A CN 111582292 B CN111582292 B CN 111582292B
- Authority
- CN
- China
- Prior art keywords
- interlayer
- support vector
- vector machine
- data
- identification
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 169
- 238000012706 support-vector machine Methods 0.000 claims abstract description 272
- 239000011229 interlayer Substances 0.000 claims description 425
- 238000012549 training Methods 0.000 claims description 171
- 238000012360 testing method Methods 0.000 claims description 163
- 230000006870 function Effects 0.000 claims description 144
- 239000010410 layer Substances 0.000 claims description 52
- 238000002790 cross-validation Methods 0.000 claims description 38
- 238000003860 storage Methods 0.000 claims description 22
- 238000004590 computer program Methods 0.000 claims description 18
- 238000012545 processing Methods 0.000 claims description 16
- 238000010606 normalization Methods 0.000 claims description 10
- 238000000605 extraction Methods 0.000 claims description 7
- 230000006698 induction Effects 0.000 claims description 7
- 238000012216 screening Methods 0.000 claims description 4
- 238000011161 development Methods 0.000 abstract description 22
- 238000009826 distribution Methods 0.000 abstract description 18
- 238000004422 calculation algorithm Methods 0.000 abstract description 16
- 238000011160 research Methods 0.000 abstract description 15
- 238000011084 recovery Methods 0.000 abstract description 4
- 239000000523 sample Substances 0.000 description 173
- 238000010586 diagram Methods 0.000 description 25
- 230000008569 process Effects 0.000 description 23
- 230000000694 effects Effects 0.000 description 12
- 238000004519 manufacturing process Methods 0.000 description 10
- 239000013598 vector Substances 0.000 description 10
- 238000012795 verification Methods 0.000 description 9
- 230000008901 benefit Effects 0.000 description 8
- 238000005553 drilling Methods 0.000 description 8
- 238000004891 communication Methods 0.000 description 7
- 238000013507 mapping Methods 0.000 description 7
- 239000011435 rock Substances 0.000 description 7
- 230000035945 sensitivity Effects 0.000 description 7
- 238000002474 experimental method Methods 0.000 description 6
- 238000005457 optimization Methods 0.000 description 6
- 230000008859 change Effects 0.000 description 5
- 238000010835 comparative analysis Methods 0.000 description 5
- 238000011156 evaluation Methods 0.000 description 5
- 230000004044 response Effects 0.000 description 5
- 238000004088 simulation Methods 0.000 description 5
- 238000000540 analysis of variance Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 4
- 238000007796 conventional method Methods 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 230000000704 physical effect Effects 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 238000007689 inspection Methods 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 239000004005 microsphere Substances 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000012530 fluid Substances 0.000 description 2
- 230000007786 learning performance Effects 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000035699 permeability Effects 0.000 description 2
- 238000004062 sedimentation Methods 0.000 description 2
- 238000007619 statistical method Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 241000239290 Araneae Species 0.000 description 1
- OYPRJOBELJOOCE-UHFFFAOYSA-N Calcium Chemical compound [Ca] OYPRJOBELJOOCE-UHFFFAOYSA-N 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 229910052791 calcium Inorganic materials 0.000 description 1
- 239000011575 calcium Substances 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 239000004927 clay Substances 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 238000012856 packing Methods 0.000 description 1
- 239000003208 petroleum Substances 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 239000004576 sand Substances 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供一种夹层识别方法和装置,根据取心井资料获取测井曲线作为输入特征,然后将所述输入特征作为预测样本,输入预设的支持向量机,该支持向量机的输出表征该取心井资料的夹层识别结果,即通过支持向量机实现夹层识别,在定量研究已知井夹层规模大小、厚度、产状及发育分布规律的基础上,实现运用数学算法对整个研究区的夹层开展识别,快速识别层内夹层,正确认识夹层对精细描述油藏地质特征,砂岩油藏开发中后期剩余油分布预测提供基础,同时为提高油田采收率进而采取有效的工程措施具有重要意义。
Description
技术领域
本发明涉及碎屑岩油藏开发技术领域,尤其涉及一种夹层识别方法和装置。
背景技术
夹层是指分散在单砂体之间和内部、横向上不稳定、厚度较小的非渗透或低渗透层。在石油开发中,夹层因其渗透性差而对流体的运移起到封隔、阻挡作用,因此夹层改变了流体的分布规律,增加了储量合理动用的难度,尤其是油田进入开发后期,储层内部夹层对油水运动具有重要影响,一定程度上控制了剩余油的分布,此时,需要对储层进行精细剖析,以便识别夹层并确定夹层类型、成因以及分布,以便指导油田开发后期剩余油。
目前,国内外学者对夹层的识别多为定性识别,利用岩心标定测井,建立取心井的夹层测井识别标准,进而识别非取心井的夹层。因为不同类型的夹层在各种测井曲线上有不同的表现特征,所以若想综合各类夹层在多种测井曲线的特征、做出不同类型夹层的测井响应交会图版或蛛网模式、有效识别夹层,难度非常大,不能适应油田开发的需要。
定量表征夹层的常用方法为厚油层细分对比法,通过对小层层内夹层统计夹层厚度、夹层频率、夹层密度和不同微相夹层频率等,以此对夹层进行井间预测,但是现有方法采用统计学方法,受限于统计数据的数量和质量,容易导致预测精度低甚至预测错误等情况发生,不利于指导油田开发生产。
发明内容
有鉴于此,本发明提供一种夹层识别方法、装置、电子设备以及计算机可读存储介质,在定量研究已知井夹层规模大小、厚度、产状及发育分布规律的基础上,运用数学算法对整个研究区的夹层开展识别,能够快速定量识别夹层,为油藏高效开发提供技术指导与借鉴。
为了实现上述目的,本发明采用如下技术方案:
第一方面,提供一种夹层识别方法,包括:
根据取心井资料获取测井曲线作为输入特征;
将该输入特征作为预测样本,输入预设的支持向量机,该支持向量机的输出表征该取心井资料的夹层识别结果。
进一步地,该测井曲线包括:微电极曲线;该根据取心井资料获取测井曲线作为输入特征,包括:
获取取心井的测井曲线数据;
从该测井曲线数据中筛选出微电极曲线作为该输入特征。
进一步地,该根据取心井资料获取输入特征,包括:
获取取心井的测井曲线数据;
将该测井曲线数据中的自然伽马测井曲线、声波测井曲线以及微电极曲线组合成该输入特征。
进一步地,该输入特征还包括:Δ(Rmn-Rmg)测井曲线和/或Δ(Rmn-Rmg)夹层/Δ(Rmn-Rmg)砂岩。
进一步地,在将该输入特征作为预测样本,输入预设的支持向量机,并将该支持向量机的输出作为该取心井资料的夹层识别结果之前,还包括:
对该输入特征进行归一化处理。
进一步地,夹层识别方法还包括:
根据历史取心井资料得到该支持向量机的训练样本集;
应用该训练样本集对该支持向量机进行训练。
进一步地,在该应用该训练样本集对该支持向量机进行训练之前,还包括:
采用交叉验证法选取该支持向量机的核函数。
进一步地,该应用该训练样本集该支持向量机进行训练,包括:结合网格搜索法和交叉验证法,应用该训练样本集该支持向量机进行训练。
进一步地,夹层识别方法还包括:
根据至少一个测试用历史取心井资料得到测试样本;
应用该测试样本对该支持向量机进行测试,并将该支持向量机的输出作为测试结果;
基于该测试结果及已知识别结果,判断该支持向量机是否符合预设要求;
若是,则将当前支持向量机作为用于夹层识别的目标支持向量机。
进一步地,夹层识别方法还包括:
若当前支持向量机不符合预设要求,则对当前支持向量机进行优化和/或应用更新后的训练样本集重新对该支持向量机进行训练。
第二方面,提供一种夹层识别装置,包括:
输入特征获取模块,根据取心井资料获取测井曲线作为输入特征;
识别模块,将该输入特征作为预测样本,输入预设的支持向量机,该支持向量机的输出表征该取心井资料的夹层识别结果。
进一步地,所述测井曲线包括:微电极曲线;该输入特征获取模块包括:
第一数据获取单元,获取取心井的测井曲线数据;
第一输入特征提取单元,从该测井曲线数据中筛选出微电极曲线作为该输入特征。
进一步地,该输入特征获取模块包括:
第二数据获取单元,获取取心井的测井曲线数据;
第二输入特征提取单元,将该测井曲线数据中的自然伽马测井曲线、声波测井曲线以及微电极曲线组合成该输入特征。
进一步地,该输入特征还包括:Δ(Rmn-Rmg)测井曲线和/或Δ(Rmn-Rmg)夹层/Δ(Rmn-Rmg)砂岩。
进一步地,夹层识别装置还包括:
归一化模块,对该输入特征进行归一化处理。
进一步地,夹层识别装置还包括:
训练样本获取模块,根据历史取心井资料得到该支持向量机的训练样本集;
训练模块,应用该训练样本集对该支持向量机进行训练。
进一步地,夹层识别装置还包括:
核函数选取模块,采用交叉验证法选取该支持向量机的核函数。
进一步地,该训练模块包括:
训练单元,结合网格搜索法和交叉验证法,应用该训练样本集该支持向量机进行训练。
进一步地,夹层识别装置还包括:
测试样本获取模块,根据至少一个测试用历史取心井资料得到测试样本;
测试模块,应用该测试样本对该支持向量机进行测试,并将该支持向量机的输出作为测试结果;
判断模块,基于该测试结果及已知识别结果,判断该支持向量机是否符合预设要求;
输出模块,在支持向量机符合预设要求时,将当前支持向量机作为用于夹层识别的目标支持向量机。
进一步地,夹层识别装置还包括:
优化模块,在该支持向量机不符合预设要求时,对当前支持向量机进行优化和/或应用更新后的训练样本集重新对该支持向量机进行训练。
第三方面,提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,该处理器执行该程序时实现上述的夹层识别方法的步骤。
第四方面,提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述夹层识别方法的步骤。
本发明提供的夹层识别方法、装置、电子设备以及计算机可读存储介质,根据取心井资料获取测井曲线作为输入特征,然后将所述输入特征作为预测样本,输入预设的支持向量机,该支持向量机的输出表征该取心井资料的夹层识别结果,即通过支持向量机实现夹层识别,在定量研究已知井夹层规模大小、厚度、产状及发育分布规律的基础上,实现运用数学算法对整个研究区的夹层开展识别,快速识别层内夹层,正确认识夹层对精细描述油藏地质特征,砂岩油藏开发中后期剩余油分布预测提供基础,同时为提高油田采收率进而采取有效的工程措施具有重要意义。
为让本发明的上述和其他目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附图式,作详细说明如下。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1为本发明实施例中的服务器S1与客户端设备B1之间的架构示意图;
图2为本发明实施例中的服务器S1、客户端设备B1及数据库服务器S2之间的架构示意图;
图3是本发明实施例中的夹层识别方法的流程示意图一;
图4示出了本发明实施例中采用的支持向量机的非线性映射示意图;
图5是本发明实施例中的夹层识别方法的流程示意图二;
图6是本发明实施例中的夹层识别方法的流程示意图三;
图7是本发明实施例中的夹层识别方法的流程示意图四;
图8是本发明实施例中的夹层识别方法的流程示意图五;
图9是本发明实施例中的夹层识别方法的流程示意图六;
图10示出了本发明实施例中的基于4个输入特征的夹层识别方法的夹层检验样本SVM识别结果图;
图11示出了本发明实施例中的基于5个输入特征的夹层识别方法的夹层检验样本SVM识别结果图;
图12示出了本发明实施例中的基于6个输入特征的夹层识别方法的夹层检验样本SVM识别结果图;
图13示出了本发明实施例中的SVM对钙质夹层进行识别时的训练结果图;
图14示出了本发明实施例中的SVM对钙质夹层进行识别时的预测结果图;
图15是本发明实施例中的夹层识别装置的结构框图一;
图16是本发明实施例中的夹层识别装置的结构框图二;
图17是本发明实施例中的夹层识别装置的结构框图三;
图18是本发明实施例中的夹层识别装置的结构框图四;
图19是本发明实施例中的夹层识别装置的结构框图五;
图20是本发明实施例中的夹层识别装置的结构框图六;
图21是本发明实施例中的夹层识别装置中测试机构的结构框图;
图22为本发明实施例电子设备的结构图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
定量表征夹层的常用方法为厚油层细分对比法,通过对小层层内夹层统计夹层厚度、夹层频率、夹层密度和不同微相夹层频率等,以此对夹层进行井间预测,但是现有方法采用统计学方法,受限于统计数据的数量和质量,容易导致预测精度低甚至预测错误等情况发生,不利于指导油田开发生产。
为解决现有技术中的问题,本发明实施例提供一种夹层识别方法、装置、电子设备以及计算机可读存储介质,根据取心井资料获取测井曲线作为输入特征,然后将所述输入特征作为预测样本,输入预设的支持向量机,该支持向量机的输出表征该取心井资料的夹层识别结果,即通过支持向量机实现夹层识别,在定量研究已知井夹层规模大小、厚度、产状及发育分布规律的基础上,实现运用数学算法对整个研究区的夹层开展识别,快速识别层内夹层,正确认识夹层对精细描述油藏地质特征,砂岩油藏开发中后期剩余油分布预测提供基础,同时为提高油田采收率进而采取有效的工程措施具有重要意义。
有鉴于此,本申请提供了一种基于支持向量机的夹层识别装置,该装置可以为一种服务器S1,参见图1,该服务器S1可以与至少一个客户端设备B1通信连接,所述客户端设备B1可以将取心井资料发送至所述服务器S1,所述服务器S1可以在线接收所述取心井资料。所述服务器S1可以在线或者离线对获取取心井资料进行预处理,根据取心井资料获取测井曲线作为输入特征,并将该输入特征作为预测样本,输入预设的支持向量机,该支持向量机的输出表征该取心井资料的夹层识别结果。而后,所述服务器S1可以将该夹层识别结果在线发送至所述客户端设备B1。所述客户端设备B1可以在线接收所述该夹层识别结果。
另外,参见图2,所述服务器S1还可以与至少一个数据库服务器S2通信连接,所述数据库服务器S2用于存储历史取心井资料。所述数据库服务器S2在线将所述历史取心井资料发送至所述服务器S1,所述服务器S1可以在线接收所述历史取心井资料,而后根据多个历史取心井资料获取该支持向量机的训练样本集,应用所述训练样本集对所述支持向量机进行训练。
基于上述内容,所述数据库服务器S2还可以用于存储测试用历史取心井资料。所述数据库服务器S2在线将所述测试用历史取心井资料发送至所述服务器S1,所述服务器S1可以在线接收所述测试用历史取心井资料,而后根据至少一个测试用历史取心井资料得到测试样本,并应用所述测试样本对所述支持向量机进行测试,并将该支持向量机的输出作为测试结果,再基于所述测试结果及至少一个测试用历史取心井资料的已知评价结果,判断当前支持向量机是否符合预设要求,若是,则将当前支持向量机作为用于夹层识别的目标支持向量机;若当前支持向量机不符合所述预设要求,则对当前支持向量机进行优化和/或应用更新后的训练样本集重新对该支持向量机进行训练。
基于上述内容,所述客户端设备B1可以具有显示界面,使得用户能够根据界面查看所述服务器S1发送的所述夹层识别结果。
可以理解的是,所述客户端设备B1可以包括智能手机、平板电子设备、网络机顶盒、便携式计算机、台式电脑、个人数字助理(PDA)、车载设备、智能穿戴设备等。其中,所述智能穿戴设备可以包括智能眼镜、智能手表、智能手环等。
在实际应用中,进行夹层识别的部分可以在如上述内容所述的服务器S1侧执行,即,如图1所示的架构,也可以所有的操作都在所述客户端设备B1中完成,且该所述客户端设备B1可以直接与数据库服务器S2进行通信连接。具体可以根据所述客户端设备B1的处理能力,以及用户使用场景的限制等进行选择。本申请对此不作限定。若所有的操作都在所述客户端设备B1中完成,所述客户端设备B1还可以包括处理器,用于进行夹层识别的具体处理。
所述服务器与所述客户端设备之间可以使用任何合适的网络协议进行通信,包括在本申请提交日尚未开发出的网络协议。所述网络协议例如可以包括TCP/IP协议、UDP/IP协议、HTTP协议、HTTPS协议等。当然,所述网络协议例如还可以包括在上述协议之上使用的RPC协议(Remote Procedure Call Protocol,远程过程调用协议)、REST协议(Representational State Transfer,表述性状态转移协议)等。
在本申请的一个或多个实施例中,所述测试用历史取心井资料为未包含在用于模型训练的历史取心井资料中的,且针对所述测试用历史取心井资料,需获取其已知识别结果。
本申请采用基于支持向量机的夹层识别方法,根据取心井资料获取测井曲线作为输入特征,然后将所述输入特征作为预测样本,输入预设的支持向量机,该支持向量机的输出表征该取心井资料的夹层识别结果,即通过支持向量机实现夹层识别,在定量研究已知井夹层规模大小、厚度、产状及发育分布规律的基础上,实现运用数学算法对整个研究区的夹层开展识别,快速识别层(指含油层)内夹层,正确认识夹层对精细描述油藏地质特征。具体通过下述实施例及应用场景进行具体说明。
为了能够快速定量识别夹层,本申请实施例提供一种夹层识别方法,参见图3,所述夹层识别方法具体包括如下内容:
步骤S100:根据取心井资料获取测井曲线作为输入特征。
其中,取心井主要为钻取地下岩心,供作观测鉴定、分析实验的样品,以直接获取有关地层的岩性、岩相、物性、生油性、含油性等多方面的资料或参数,使用取心钻头和取心钻具所钻的井。
取心井资料为钻井后由专业测井公司进行检测得到,是最真实可靠的地下岩层的资料。
步骤S200:将该输入特征作为预测样本,输入预设的支持向量机,该支持向量机的输出表征该取心井资料的夹层识别结果。
具体地,通过大量的研究试验,申请人发现,夹层识别主要应用取心井资料建立识别模式,进而应用在其他开发井中,但是在实际工作中取心井数量有限,且地质资料难以获得,数据常表现为小样本的特征。
支持向量机(Support Vector Machine,SVM)是一类按监督学习方式对数据进行二元分类的广义线性分类器,其决策边界是对学习样本求解的最大边距超平面,SVM在求解非线性问题及处理小样本数据上具有较大的优势,因此,SVM对于解决夹层识别问题上有很好的实用性。
SVM建立在统计学理论中的VC维理论和结构风险最小化原则基础上,能较好地解决小样本、非线性、高维数和局部极小点等实际问题。它的实质是寻找一个最优分类超平面,以最大化分类间隔产生良好的泛化能力。SVM使用了核替换的思想,利用核函数可以建立较好的学习模型。另外,SVM的求解过程最终将转化为二次规划问题的求解。
具体地,支持向量机基本思想是运用核函数将样本空间映射到特征空间,在特征空间中求出原样本的最优分类面,得到输入变量和输出结果之间的一种线性或非线性关系,即寻找支持向量机进行模式分类。实际工作中多遇到非线性可分问题,此时可以通过一个非线性函数映射Φ:Rd→H将训练样本从输入空间R映射到高维的特征空间H中,再在高维特征空间H中构造超平面将两类点分开,其原理如图4所示。
使用空间中的内积构造核函数,核函数可以通过原空间中的函数在高维空间上实现。满足Mercer条件(即核函数的必要条件:设K是有效的核函数,则核函数矩阵K是对称半正定的,这个条件也是充分的,由Mercer定理来表达,Mercer定理表明为了证明K是有效的核函数,那么不用去寻找Φ,而只需要在训练集上求出各个K,然后判断矩阵K是否是半正定即可)的函数都可以作为核函数。因此,运用适当的核函数,最优分类面就可以实现从非线性变换后的线性分类,而不增加算法的计算复杂度;即:将本来在输入空间中规律复杂的样本,映射到高维特征空间H后,就可以找到一种线性的关系。
在低维输入空间向高维特征空间映射过程中,空间维数急速增长,支持向量机通过定义核函数,巧妙地利用了原空间的核函数取代高维特征空间中的内积运算,避免了维数灾难。
另外,按照目前比较成熟且常用的夹层分类方法,同时考虑沉积作用、成岩作用以及其他地质作用的差异,根据岩心观察和测井响应特征,夹层主要划分为泥质夹层、物性夹层、钙质夹层三类。
该支持向量机输出3种基层识别结果,即将夹层类型划分为3个等级作为输出类别,即Y={1,2,3};其中1代表泥质夹层,2代表钙质夹层,3代表物性夹层。
通过上述技术方案可知,该夹层识别方法根据取心井资料获取测井曲线作为输入特征,然后将所述输入特征作为预测样本,输入预设的支持向量机,并将该支持向量机的输出作为该取心井资料的夹层识别结果,即通过支持向量机实现夹层识别,有效利用了SVM在求解非线性问题及处理小样本数据上的优势,适于夹层识别中地质资料难以获得、数据常表现为小样本的特征的特性,实现运用数学算法对整个研究区的夹层开展识别,快速识别层内夹层,正确认识夹层对精细描述油藏地质特征。
在一个可选的实施例中,该步骤S100具体包括如下内容,参见图5:
步骤S100a:获取取心井的测井曲线数据。
其中,取心井资料中包含测井曲线数据,且该测井曲线数据包括:自然伽马测井曲线、声波测井曲线、微电极曲线(RMN和RMG)、Δ(Rmn-Rmg)测井曲线、Δ(Rmn-Rmg)夹层/Δ(Rmn-Rmg)砂岩、电阻率曲线、声波曲线、自然电位SP曲线、感应测井曲线、中子测井曲线、三侧向测井曲线、微球形聚焦测井曲线、井径CAL曲线等。
步骤S100b:将该测井曲线数据中的自然伽马测井曲线、声波测井曲线以及微电极曲线组合成该输入特征。
具体地,根据测井参数值识别夹层时,在分析研究区内夹层和测井参数的对应关系的基础上,划分研究区岩心的岩石类型,并确定能够较好地反映岩性的测井曲线,通过选用自然伽马(GR)、声波(AC)、微电极(RMN和RMG)四条测井曲线组合成输入特征X1:
X1={GR,AC,RMN,RMG}
在一个可选的实施例中,该输入特征还可以包括:Δ(Rmn-Rmg)测井曲线和/或Δ(Rmn-Rmg)夹层/Δ(Rmn-Rmg)砂岩。
举例来说,可以通过选用自然伽马(GR)、声波(AC)、微电极(RMN和RMG)以及Δ(Rmn-Rmg)测井曲线五条测井曲线组合成输入特征X2:
X2={GR,AC,RMN,RMG,Δ(Rmn-Rmg)};
或者,通过选用自然伽马(GR)、声波(AC)、微电极(RMN和RMG)、Δ(Rmn-Rmg)夹层/Δ(Rmn-Rmg)砂岩五条测井曲线组合成输入特征X3:
X3={GR,AC,RMN,RMG,Δ(Rmn-Rmg)夹层/Δ(Rmn-Rmg)砂岩}。
在另一个可选的实施例中,该步骤S100具体包括如下内容:
获取取心井的测井曲线数据;
筛选该测井曲线数据中的微电极曲线作为该输入特征。
具体地,通过选用微电极(RMN和RMG)测井曲线作为输入特征X:
X={RMN,RMG}。
值得说明的是,钙质夹层测井曲线的典型特征是微电极曲线呈高值尖峰状,较泥质和物性夹层可以明显区分识别,因此,选用微电极(RMN和RMG)测井曲线作为输入特征,对支持向量机进行训练和应用,可以有效增加钙质夹层的识别精度。
当然,本领域技术人员可以理解的是,上述输入特征的选择不应理解为对本发明实施例的限制,只是本发明实施例的一种优选的实施方式,应用时可以根据不同夹层测井曲线的典型特征来选取。
为了能够进一步快速识别层内夹层,本申请实施例提供一种夹层识别方法,参见图6,该夹层识别方法在包含图3所示夹层识别方法的基础上,在步骤S200之前,还包括:
步骤S110:对该输入特征进行归一化处理。
其中,为避免各参数量纲差异导致核函数内积计算困难,对预测结果造成负面影响,数据在进入支持向量机之前需进行归一化处理,使其转化为分布在[0,1]区间内,以保证该支持向量机核函数运行的稳定性。
具体地,采用如下公式(5)将数据的特征值映射到[0,1]区间,从而减小SVM模型的计算量,提高识别精度。
其中,x*表示归一化之前的数值,x表示归一化之后的数值,表示输入数据中的最小值,/>表示输入数据中的最大值。
为了能够进一步快速识别层内夹层,本申请实施例提供一种夹层识别方法,参见图7,该夹层识别方法在包含图3所示夹层识别方法的基础上,在步骤S100之前,还包括:
步骤S10:根据历史取心井资料得到该支持向量机的训练样本集。
具体地,在已知夹层类别的历史取心井资料中选取训练样本集,该训练样本集不仅包含历史取心井资料,还包含该历史取心井资料对应的夹层类别,作为评价该支持向量机识别精度的标签。
在一个可选的实施例中,该训练样本集中的每一个训练样本均含有由微电极曲线组合成的输入特征X。
即:通过选用微电极(RMN和RMG)测井曲线组合成输入特征X:
X={RMN,RMG}
在另一个可选的实施例中,该训练样本集中的每一个训练样本均含有由取心井的测井曲线数据中的自然伽马测井曲线、声波测井曲线以及微电极曲线组合成的输入特征X1。
即:通过选用自然伽马(GR)、声波(AC)、微电极(RMN和RMG)四条测井曲线组合成输入特征X1:
X1={GR,AC,RMN,RMG}
再一个可选的实施例中,该输入特征还可以包括:Δ(Rmn-Rmg)测井曲线和/或Δ(Rmn-Rmg)夹层/Δ(Rmn-Rmg)砂岩。
举例来说,可以通过选用自然伽马(GR)、声波(AC)、微电极(RMN和RMG)以及Δ(Rmn-Rmg)测井曲线五条测井曲线组合成输入特征X2:
X2={GR,AC,RMN,RMG,Δ(Rmn-Rmg)};
或者,通过选用自然伽马(GR)、声波(AC)、微电极(RMN和RMG)、Δ(Rmn-Rmg)夹层/Δ(Rmn-Rmg)砂岩五条测井曲线组合成输入特征X3:
X3={GR,AC,RMN,RMG,Δ(Rmn-Rmg)夹层/Δ(Rmn-Rmg)砂岩}。
值得说明的是,利用该训练样本训练得到的支持向量机,在应用该支持向量机进行夹层识别时,预测样本所包含的测井曲线与该训练样本所包含的测井曲线应该一致,比如,若训练样本采用X1,则在应用基于该训练样本X1训练得到的支持向量机进行夹层识别时,输入至该支持向量机的预测样本也应该采用X1类型。
步骤S20:应用该训练样本集对该支持向量机进行训练。
在支持向量机的问题表达和求解算法中包含几个待定的设计参数:一是核函数的参数;一是惩罚因子C。核函数间接地描述了支持向量机的高维特征空间,惩罚因子C用来平衡模型复杂度和经验风险值。这些参数的确定对支持向量机的学习性能和计算复杂性有很大的影响。
核函数确定后,还需选出能使该支持向量机获得最佳性能的核参数g和惩罚因子C。
其中,SVM的性能随参数g从0到∞呈规律性变化。当g→0时,所有样本都将成为支持向量,从而产生“过拟合”现象;当g→∞时,所有样本都被判为同一类,对新样本的正确分类能力几乎为零;当g大于0且充分小时,任意给定的样本都可以被正确划分。
而惩罚因子C决定了对误判样本的惩罚程度,它的大小对最优分类面的位置有很大影响。在确定的特征子空间中,C的取值小表示对经验误差的惩罚小,学习机器的复杂度小但经验风险值较大;当C→∞时,所有的约束条件都必须满足,算法必须对所有的训练样本准确分类。每个特征子空间都能找到一个合适的C,使得SVM推广能力最好。
惩罚因子C和核参数g的寻优过程也就是SVM的训练过程。
最优参数确定后,便可以用训练好的SVM进行夹层识别。
为了能够进一步快速识别层内夹层,本申请实施例提供一种夹层识别方法,参见图8,该夹层识别方法在包含图7所示夹层识别方法的基础上,在步骤S20之前,还包括:
步骤S15:采用交叉验证法选取该支持向量机的核函数。
其中,核函数的改变实际上是隐含地改变映射函数,从而改变样本数据子空间分布的复杂程度(维数)。如果数据子空间维数很高,则得到的最优分类面可能比较复杂、经验风险小且置信范围大;反之亦然。因此只有选择合适的核函数将数据映射到合适的特征空间,才能得到具有较好识别能力的支持向量机结构。
目前常用的核函数有:线性核(Linear Kernel)函数、多项式核(PolynomialKernel)函数、径向基核函数(Radial Basis Function)/高斯核(Gaussian Kernel)函数、幂指数核(Exponential Kernel)函数、拉普拉斯核(Laplacian Kernel)函数、ANOVA核(ANOVA Kernel)函数、二次有理核(Rational Quadratic Kernel)函数、多元二次核(Multiquadric Kernel)函数、逆多元二次核(Inverse Multiquadric Kernel)函数、Sigmoid核(Sigmoid Kernel)函数、字符串核函数等。
线性核函数主要适于线性可分的情况,其从特征空间到输入空间的维度是一样的,在原始空间中寻找最优线性分类器,具有参数少速度快的优势。
多项式核函数可以实现将低维的输入空间映射到高维的特征空间,适合于正交归一化(向量正交且模为1)数据,该多项式核函数属于全局核函数,允许相距很远的数据点对核函数的值有影响,参数d越大,映射的维度越高,计算量就会越大。
高斯径向基核函数是个可适用于任意分布样本的普适函数,且仅有一个参数σ,能较好地反映模型选择的复杂度,其表达式如下:
其中,x和xi分别表示两个特征向量,即定量评价的参数,σ为高斯核的宽度,它的取值对学习机器的性能起决定作用。径向基核函数是典型的局部性核函数,它只在测试点附近小范围内对数据点有影响。只要核参数σ选择恰当,径向基核函数可以适用于任意分布的样本。
具体地,采用交叉验证(Cross-Validation)法选取该支持向量机的核函数指在进行核函数选取时,分别试用不同的核函数,归纳误差最小的核函数就是最好的核函数.如针对径向基核函数、Sigmoid核函数,结合信号处理问题中的函数回归问题,通过仿真实验,对比分析在相同数据条件下,采用哪种核函数的SVM误差小,则选用该种核函数进行夹层识别。
在一个可选的实施例中,在确定了核函数之后,应用该训练样本集对该核函数进行参数寻优时,采用网格搜索法和交叉验证法相结合的方式进行,具体如下:
交叉验证过程:将训练样本随机地分成k个大小相同的子集,利用k-1个子集,对给定的一组C和g建立SVM模型,并利用建议的SVM模型对剩下的一个子集进行预测,以上过程重复k次,根据k次迭代后得到的均方差平均值来估计期望泛化误差,最终选择泛化误差最小的一组C和g,作为最优参数。
网格搜索是一种能够同时从不同的增长方向并行搜索多维数组的数据搜索方法,其过程为:首先,大致选定一个搜索范围,如C区间为[2-10,210],g区间为[2-15,215],步长为1,在选定区间内让C和g呈指数增长,比较选取不同参数数值时的交叉验证精度,选取一组交叉验证精度最高(即泛化误差最低)的参数;然后,再以该参数为中心缩小搜索范围,并逐步缩短步长重复搜索,直至交叉验证精度变化不大时为止,最后所得结果即为最优参数。
下面,举例运用上述方法确定参数的过程如下:
1.选定一组惩罚因子C和核参数g的范围,如C和g的搜索区间均设为[2-10,210],搜索步长为3;
2.采用10折交叉验证法,即:将训练样本集分成10份,即k=10,轮流将其中9份数据作为训练数据,1份数据作为测试数据,训练支持向量机并开展检验,以上过程重复10次,根据10次迭代后得到的均方差平均值来估计期望泛化误差,最终选择泛化误差最小的一组C和g,作为最优参数,得到一组最优参数C=31,g=0.5,交叉验证精度为80.12%;
3.对步骤1中所选范围不断调整,并逐步减小步长进行实验,最终确定C的区间为[2-4,28],g的区间为[2-6,210],步长为0.5,得到最优参数C=45.1,g=1,交叉验证精度达到81.92%。
为了能够进一步快速识别层内夹层,本申请实施例提供一种夹层识别方法,参见图9,该夹层识别方法在包含图7所示夹层识别方法的基础上,在步骤S20之后,还包括:
步骤S40:根据至少一个测试用历史取心井资料得到测试样本。
其中,测试用历史取心井资料为未包含在用于支持向量机训练的历史取心井资料中的,且针对所述测试用历史取心井资料,需获取其已知识别结果。
步骤S50:应用该测试样本对该支持向量机进行测试,并将该支持向量机的输出作为测试结果。
即:利用已知识别结果的测试用历史取心井资料来验证训练后的支持向量机的评价效果。
步骤S60:基于该测试结果及已知识别结果,判断该支持向量机是否符合预设要求。
若是,执行步骤S80;若否,执行步骤S70。
其中,判断该支持向量机是否符合预设要求的标准为:该测试结果与该测试用历史取心井资料的已知识别结果相同或误差在一定范围内。
步骤S80:将当前支持向量机作为用于夹层识别的目标支持向量机。
步骤S70:对训练样本集进行更新,然后返回步骤S20重新对该支持向量机进行训练。
基于上述内容,本申请提供一种基于自然伽马测井曲线、声波测井曲线以及微电极曲线组合成的输入特征实现夹层识别的场景,具体内容如下:
(1)根据历史取心井资料得到该支持向量机的训练样本集。
通过对某工区内的历史取心井资料进行统计,共得到141个训练样本,各训练样本已知其夹层类别,本例中将夹层类型划分为3个等级作为输出类别,即Y={1,2,3};其中,1代表泥质夹层,2代表钙质夹层,3代表物性夹层。
141个训练样本数据中,80个为1类样本、10个为2类样本以及51个为3类样本。
获取各样本的测井曲线数据中的自然伽马(GR)测井曲线、声波测井曲线(AC)以及微电极(RMN和RMG)曲线组合成所述输入特征,形成训练样本集,如表1所示:
表1 X1训练样本集
(2)采用交叉验证法选取该支持向量机的核函数。
本例中分别试用了Sigmoid核函数、高斯径向基核函数,通过仿真实验和对比分析后,选定高斯径向基函数作为核函数。
(3)结合网格搜索法和交叉验证法,应用所述训练样本集对该支持向量机进行训练,获得最优的核函数参数。
参照上述的网格搜索法和交叉验证法的示例,确定X1训练样本集对应的SVM的最优参数为C=1.32,g=0.7071。
(4)根据至少一个测试用历史取心井资料得到测试样本。
在工区的历史取心井资料中,获取40个1类样本、6个2类样本和24个三类样本作为测试样本集,如表2所示:
表2 X1测试样本集
(5)应用所述测试样本对所述支持向量机进行测试,并将该支持向量机的输出作为测试结果。
将该X1测试样本集输入该支持向量机中,得到的输出作为测试结果。
(6)基于所述测试结果及已知识别结果,判断该支持向量机是否符合预设要求。
具体地,可以将该测试结果及至少一个测试用历史取心井资料的已知识别结果进行比较,当二者相同或者基本相同或者相差在预设范围内时,则认为该支持向量机符合预设要求,适于实际应用的需求。
需要说明的是,在实际应用中,不要求支持向量机的识别精度达到百分之百,一般要求精度在80%以上即可,有些应用场合甚至要求更低的精度,具体需要根据具体的应用需求确定。
(7)若当前支持向量机符合预设要求,则将当前支持向量机作为用于夹层识别的目标支持向量机;若当前支持向量机不符合预设要求,更新训练样本集,返回步骤3重新对该支持向量机进行训练,重复执行步骤3至步骤6,直至该支持向量机符合预设要求。
具体地,运用141个训练样本训练得到的SVM,其训练准确率为82.98%;对70个测试样本进行夹层类型识别,错判数为13,预测准确率81.43%,如图10所示。
由此可知,该SVM的精度满足要求,泛化能力强,适于夹层识别。
(8)获取取心井资料中的测井曲线数据。
(9)将该测井曲线数据中的自然伽马测井曲线、声波测井曲线以及微电极曲线组合成所述输入特征。
(10)对所述输入特征进行归一化处理。
(11)将所述输入特征作为预测样本,输入预设的支持向量机,该支持向量机的输出表征该取心井资料的夹层识别结果。
综上所述,本发明实施例提供的夹层识别方法,通过支持向量机实现夹层识别,有效利用了SVM在求解非线性问题及处理小样本数据上的优势,适于夹层识别中地质资料难以获得、数据常表现为小样本的特征的特性,实现运用数学算法对整个研究区的夹层开展识别,快速识别层内夹层,正确认识夹层对精细描述油藏地质特征。
基于上述内容,本申请还提供一种基于自然伽马测井曲线、声波测井曲线、微电极曲线以及Δ(Rmn-Rmg)测井曲线组合成的输入特征实现夹层识别的场景,具体内容如下:
首先,值得说明的是,本例中的选取的训练样本和测试样本与上述实施例中的训练样本和测试样本相同,区别在于本例中获取各样本的测井曲线数据中的自然伽马(GR)测井曲线、声波测井曲线(AC)、微电极(RMN和RMG)曲线以及Δ(Rmn-Rmg)曲线组合成所述输入特征,比上述实施例中多选取了一条Δ(Rmn-Rmg)曲线。
(1)根据历史取心井资料得到该支持向量机的训练样本集。
训练样本集如表3所示:
表3 X2训练样本集
/>
(2)采用交叉验证法选取该支持向量机的核函数。
本例中分别试用了Sigmoid核函数、高斯径向基核函数,通过仿真实验和对比分析后,选定高斯径向基函数作为核函数。
(3)结合网格搜索法和交叉验证法,应用所述训练样本集对该支持向量机进行训练,获得最优的核函数参数。
步骤1:凭经验选定一组惩罚因子C和核参数g的范围,如C和g的搜索区间均设为[2-10,210],搜索步长为3;
步骤2:采用10折交叉验证法,训练支持向量机并开展检验,得到一组最优参数C=32,g=0.5,交叉验证精度为80.25%;
步骤3:对所选范围不断调整,并逐步减小步长进行实验,最终确定C的区间为[2-4,28],g的区间为[2-6,210],步长为0.5,得到最优参数C=45.3,g=1,交叉验证精度达到82.17%。
(4)根据至少一个测试用历史取心井资料得到测试样本。
该测试样本集如表4所示:
表4 X2测试样本集
/>
(5)应用所述测试样本对所述支持向量机进行测试,并将该支持向量机的输出作为测试结果。
将该X2测试样本集输入该支持向量机中,得到的输出作为测试结果。
(6)基于所述测试结果及已知识别结果,判断该支持向量机是否符合预设要求。
具体地,可以将该测试结果及至少一个测试用历史取心井资料的已知识别结果进行比较,当二者相同或者基本相同或者相差在预设范围内时,则认为该支持向量机符合预设要求,适于实际应用的需求。
需要说明的是,在实际应用中,不要求支持向量机的识别精度达到百分之百,一般要求精度在80%以上即可,有些应用场合甚至要求更低的精度,具体需要根据具体的应用需求确定。
(7)若当前支持向量机符合预设要求,则将当前支持向量机作为用于夹层识别的目标支持向量机;若当前支持向量机不符合预设要求,更新训练样本集,返回步骤3重新对该支持向量机进行训练,重复执行步骤3至步骤6,直至该支持向量机符合预设要求。
具体地,运用141个训练样本训练得到的SVM,其训练准确率为79.43%;对70个测试样本进行夹层类型识别,错判数为14,预测准确率80%,如图11所示。
由此可知,该SVM的精度满足要求,泛化能力强,适于夹层识别。
(8)获取取心井资料中的测井曲线数据。
(9)将该测井曲线数据中的自然伽马测井曲线、声波测井曲线、微电极曲线以及Δ(Rmn-Rmg)曲线组合成所述输入特征。
(10)对所述输入特征进行归一化处理。
(11)将所述输入特征作为预测样本,输入预设的支持向量机,该支持向量机的输出表征该取心井资料的夹层识别结果。
综上所述,本发明实施例提供的夹层识别方法,通过支持向量机实现夹层识别,有效利用了SVM在求解非线性问题及处理小样本数据上的优势,适于夹层识别中地质资料难以获得、数据常表现为小样本的特征的特性,实现运用数学算法对整个研究区的夹层开展识别,快速识别层内夹层,正确认识夹层对精细描述油藏地质特征。
基于上述内容,本申请又提供一种基于自然伽马测井曲线、声波测井曲线、微电极曲线以及Δ(Rmn-Rmg)夹层/Δ(Rmn-Rmg)砂岩组合成的输入特征实现夹层识别的场景,具体内容如下:
(1)根据历史取心井资料得到该支持向量机的训练样本集。
通过对某工区内的历史取心井资料进行统计,共得到157个训练样本,各训练样本已知其夹层类别,本例中将夹层类型划分为3个等级作为输出类别,即Y={1,2,3};其中,1代表泥质夹层,2代表钙质夹层,3代表物性夹层。
157个训练样本数据中,88个为1类样本、9个为2类样本以及60个为3类样本。
获取各样本的测井曲线数据中的自然伽马(GR)测井曲线、声波测井曲线(AC)、微电极(RMN和RMG)曲线以及Δ(Rmn-Rmg)夹层/Δ(Rmn-Rmg)砂岩组合成所述输入特征,形成训练样本集,如表5所示:
表5 X3训练样本集
(2)采用交叉验证法选取该支持向量机的核函数。
本例中分别试用了Sigmoid核函数、高斯径向基核函数,通过仿真实验和对比分析后,选定高斯径向基函数作为核函数。
(3)结合网格搜索法和交叉验证法,应用所述训练样本集对该支持向量机进行训练,获得最优的核函数参数。
参照上述的网格搜索法和交叉验证法的示例,确定X3训练样本集对应的SVM的最优参数为C=2.83,g=4。
(4)根据至少一个测试用历史取心井资料得到测试样本。
在工区的历史取心井资料中,获取22个1类样本、6个2类样本和15个三类样本作为测试样本集,如表6所示:
表6 X3测试样本集
(5)应用所述测试样本对所述支持向量机进行测试,并将该支持向量机的输出作为测试结果。
将该X3测试样本集输入该支持向量机中,得到的输出作为测试结果。
(6)基于所述测试结果及已知识别结果,判断该支持向量机是否符合预设要求。
具体地,可以将该测试结果及至少一个测试用历史取心井资料的已知识别结果进行比较,当二者相同或者基本相同或者相差在预设范围内时,则认为该支持向量机符合预设要求,适于实际应用的需求。
需要说明的是,在实际应用中,不要求支持向量机的识别精度达到百分之百,一般要求精度在80%以上即可,有些应用场合甚至要求更低的精度,具体需要根据具体的应用需求确定。
(7)若当前支持向量机符合预设要求,则将当前支持向量机作为用于夹层识别的目标支持向量机;若当前支持向量机不符合预设要求,更新训练样本集,返回步骤3重新对该支持向量机进行训练,重复执行步骤3至步骤6,直至该支持向量机符合预设要求。
具体地,运用157个训练样本训练得到的SVM,其训练准确率为80.89%;对43个测试样本进行夹层类型识别,错判数为8,预测准确率81.4%,如图12所示。
由此可知,该SVM的精度满足要求,泛化能力强,适于夹层识别。
(8)获取取心井资料中的测井曲线数据。
(9)将该测井曲线数据中的自然伽马测井曲线、声波测井曲线以及微电极曲线组合成所述输入特征。
(10)对所述输入特征进行归一化处理。
(11)将所述输入特征作为预测样本,输入预设的支持向量机,该支持向量机的输出表征该取心井资料的夹层识别结果。
从实验结果来看,基于支持向量机的夹层的定量识别具有较好的学习能力和泛化性能,训练精度和预测精度均可达到80%左右,模型效果良好,如表7所示:
表7夹层X1、X2和X3检验样本SVM识别结果
参数集 | 参数集X1 | 参数集X2 | 参数集X3 |
样本总数 | 211 | 211 | 200 |
预测样本数 | 70 | 70 | 43 |
错判样本数 | 13 | 14 | 8 |
预测精度 | 81.4% | 80% | 81.4% |
结合地质与数学,制约模型准确率主要有两方面:一方面,地质的问题本身是非线性的问题,模型复杂,样本内存在噪点,无法训练出准确率高的模型;再者,泥质夹层、钙质夹层和物性夹层对五种影响因素本身的灵敏度不一,例如:在实际人为识别中,主要应用RMN和RMG这两种影响因素进行识别钙质夹层。
因此,在一个可选的实施例中,利用钙质夹层对RMN和RMG这两种影响因素的灵敏度较高的特性,可以选用取心井资料中的微电极(RMN和RMG)测井曲线作为输入特征,对支持向量机进行训练和应用,可以有效增加钙质夹层的识别精度。该实施例示出的方法尤其适于仅需要识别钙质夹层的场合。
在另一个实施例中,也可以不同类型夹层对不同的特征参数反应的灵敏度差异较大,利用钙质夹层测井曲线的典型特征是微电极曲线呈高值尖峰状,较泥质和物性夹层可以明显区分识别这一特性,提供一种夹层识别方法,可以高效准确识别钙质夹层、泥质夹层和物性夹层。
具体地,可以采用“二步法”来定量识别夹层类型:
步骤1:根据RMN和RMG参数识别钙质夹层。
具体地:针对训练数据集A1和测试数据集A2,选用每个数据的微电极(RMN和RMG)测井曲线作为输入特征X,对用于识别钙质夹层的支持向量机采用上文所述的训练方法和测试方法进行训练、测试,得到用于评价钙质夹层的支持向量机,然后将待识别取心井资料的微电极(RMN和RMG)测井曲线输入该用于评价钙质夹层的SVM,得到识别结果,并提取识别结果为钙质夹层的结果,作为第一结果。其中,训练数据集A1和测试数据集A2中均包含标签为钙质夹层、泥质夹层和物性夹层的数据。
步骤2:然结合其他测井参数识别泥质夹层和物性夹层。
具体地,针对训练数据集B1和测试数据集B2,选用每个数据的输入特征X1或X2或X3(X1、X2、X3所包含的曲线参见上文),对用于识别泥质夹层和物性夹层的支持向量机采用上述的训练方法和测试方法进行训练、测试,得到用于评价泥质夹层和物性夹层的SVM,然后将待识别取心井资料的输入特征X1或X2或X3输入该用于评价泥质夹层和物性夹层的SVM,得到第二结果。其中,该训练数据集B1和测试数据集B2不包含标签为钙质夹层的数据。
最后综合步骤1得到的第一结果和步骤2的第二结果,得到最终的识别结果,实现夹层分步识别。
基于上述内容,本申请又提供一种基于采用“二步法”来定量识别夹层的场景,具体内容如下:
(1)根据历史取心井资料得到用于识别钙质夹层的支持向量机的训练样本集。
泥质夹层与物性夹层为A类,钙质夹层为2类。
本例共选用157个样本,其中,145个为A类样本、12个为2类样本。
获取各样本的微电极(RMN和RMG)曲线作为输入特征,形成训练样本集。
(2)采用交叉验证法选取该用于识别钙质夹层的支持向量机的核函数。
本例中分别试用了Sigmoid核函数、高斯径向基核函数,通过仿真实验和对比分析后,选定高斯径向基函数作为核函数。
(3)结合网格搜索法和交叉验证法,应用所述训练样本集对该用于识别钙质夹层的支持向量机进行训练,获得最优的核函数参数。
参照上述的网格搜索法和交叉验证法的示例,确定该用于识别钙质夹层的SVM的最优参数为C=8,g=1。
(4)根据至少一个测试用历史取心井资料得到测试样本。
在工区的历史取心井资料中,获取54个测试样本。
(5)应用所述测试样本对所述用于识别钙质夹层的支持向量机进行测试,并将该用于识别钙质夹层的支持向量机的输出作为测试结果。
(6)基于所述测试结果及已知识别结果,判断该用于识别钙质夹层的支持向量机是否符合预设要求。
具体地,可以将该测试结果及至少一个测试用历史取心井资料的已知识别结果进行比较,当二者相同或者基本相同或者相差在预设范围内时,则认为该用于识别钙质夹层的支持向量机符合预设要求,适于实际应用的需求。
需要说明的是,在实际应用中,不要求用于识别钙质夹层的支持向量机的识别精度达到百分之百,一般要求精度在80%以上即可,有些应用场合甚至要求更低的精度,具体需要根据具体的应用需求确定。
(7)若当前用于识别钙质夹层的支持向量机符合预设要求,则将当前用于识别钙质夹层的支持向量机作为用于钙质夹层识别的目标支持向量机;若当前用于识别钙质夹层的支持向量机不符合预设要求,更新训练样本集,返回步骤3重新对该用于识别钙质夹层的支持向量机进行训练,重复执行步骤3至步骤6,直至该用于识别钙质夹层的支持向量机符合预设要求。
具体地,运用157个训练样本训练得到的用于识别钙质夹层的SVM,其训练准确率为98.73%;对54个测试样本进行夹层类型识别,预测准确率98.15%,如图13所示,对钙质夹层的识别准确率为100%,如图14所示。
由此可知,该用于识别钙质夹层的SVM的精度满足要求,泛化能力强,适于识别钙质夹层。
(8)获取待识别取心井资料中的测井曲线数据。
(9)将该测井曲线数据中的微电极曲线作为所述输入特征。
(10)对所述输入特征进行归一化处理。
(11)将所述输入特征作为预测样本,输入该用于识别钙质夹层的支持向量机,该用于识别钙质夹层的支持向量机的输出表征该待识别取心井资料的钙质夹层识别结果。
(12)根据历史取心井资料得到该用于识别泥质夹层和物性夹层的支持向量机的训练样本集。
本例共选用145个样本(已去除钙质夹层数据),各样本已知其夹层类别,本例中泥质夹层为1类,物质夹层为3类。
获取各样本的自然伽马(GR)、声波(AC)、微电极(RMN和RMG)组合成输入特征,形成训练样本集。
(13)采用交叉验证法选取该用于识别泥质夹层和物性夹层的支持向量机的核函数。
本例中分别试用了Sigmoid核函数、高斯径向基核函数,通过仿真实验和对比分析后,选定高斯径向基函数作为核函数。
(14)结合网格搜索法和交叉验证法,应用所述训练样本集对该用于识别泥质夹层和物性夹层的支持向量机进行训练,获得最优的核函数参数。
参照上述的网格搜索法和交叉验证法的示例,确定该用于识别泥质夹层和物性夹层的SVM的最优参数为C=4.59,g=8。
(15)根据至少一个测试用历史取心井资料得到测试样本。
在工区的历史取心井资料中,获取45个测试样本。
(16)应用所述测试样本对所述用于识别泥质夹层和物性夹层的支持向量机进行测试,并将该用于识别泥质夹层和物性夹层的支持向量机的输出作为测试结果。
(17)基于所述测试结果及已知识别结果,判断该用于识别泥质夹层和物性夹层的支持向量机是否符合预设要求。
具体地,可以将该测试结果及至少一个测试用历史取心井资料的已知识别结果进行比较,当二者相同或者基本相同或者相差在预设范围内时,则认为该用于识别钙质夹层的支持向量机符合预设要求,适于实际应用的需求。
需要说明的是,在实际应用中,不要求用于识别钙质夹层的支持向量机的识别精度达到百分之百,一般要求精度在80%以上即可,有些应用场合甚至要求更低的精度,具体需要根据具体的应用需求确定。
(18)若当前用于识别泥质夹层和物性夹层的支持向量机符合预设要求,则将当前用于识别泥质夹层和物性夹层的支持向量机作为用于识别泥质夹层和物性夹层的目标支持向量机;若当前用于识别泥质夹层和物性夹层的支持向量机不符合预设要求,更新训练样本集,返回步骤15重新对该用于识别泥质夹层和物性夹层的支持向量机进行训练,重复执行步骤15至步骤18,直至该用于识别泥质夹层和物性夹层的支持向量机符合预设要求。
具体地,运用145个训练样本训练得到的用于识别泥质夹层和物性夹层的SVM,其训练准确率为83.45%;对50个测试样本进行夹层类型识别,有6个出现错判,预测准确率88%。
由此可知,该用于识别泥质夹层和物性夹层的SVM的精度满足要求,泛化能力强,适于识别泥质夹层和物性夹层。
(19)获取待识别取心井资料中的测井曲线数据。
(20)将该测井曲线数据中的自然伽马(GR)、声波(AC)、微电极(RMN和RMG)组合成所述输入特征。
(21)对所述输入特征进行归一化处理。
(22)将所述输入特征作为预测样本,输入该用于识别泥质夹层和物性夹层的支持向量机,该用于识别泥质夹层和物性夹层的支持向量机的输出表征该取心井资料的泥质夹层和物性夹层的识别结果。
(23)将钙质夹层的识别结果和泥质夹层和物性夹层的识别结果进行组合,得到该取心井资料的识别结果。
综上,“二步法”夹层定量识别结果表明,相较于直接对三类夹层进行识别,“二步法”的识别准确度更高,效果如表8所示:
表8夹层X1、X2、X3和“二步法”检验样本SVM识别结果
参数集 | 参数集X1 | 参数集X2 | 参数集X3 | 两步法 |
样本总数 | 211 | 211 | 200 | 211 |
预测样本数 | 70 | 70 | 43 | 54 |
错判样本数 | 13 | 14 | 8 | 7 |
预测精度 | 81.4% | 80% | 81.4% | 86.4% |
通过上述分析可以得知,本发明实施例采用分步的方法实现夹层的识别,利用不同类型夹层对不同的特征参数反应的灵敏度差异较大的特性。
首先,基于部分曲线作为输入特征对用于评价特定夹层的SVM进行训练、测试和应用(对待测数据A进行应用),能够得到精度更高的特定夹层的识别结果。
然后,再利用去除了该特定夹层的训练数据,对用于评价除特定夹层之外的其它夹层的SVM进行训练,利用测试数据对训练后的SVM进行测试,然后应用测试后的该SVM对该待测数据A进行识别,得到该其它夹层的识别结果。
最后,将该特定夹层的识别结果和该其它夹层的识别进行组合,得到该待测数据A的夹层识别结果。
当然,本领域技术人员可以理解的是,在实际应用中,不需要每次对进行训练和测试步骤,只需要预先训练和测试好用于评价特定夹层的SVM和用于评价其它夹层的SVM,将待测数据分别输入两个SVM进行评价,再对结果进行组合即可。
通过采用上述分布识别的方式,能够提高夹层识别的精度,有利于指导生产。
基于同一发明构思,本申请实施例还提供了一种夹层识别装置,可以用于实现上述实施例所描述的方法,如下面的实施例所述。由于夹层识别装置解决问题的原理与上述方法相似,因此夹层识别装置的实施可以参见上述方法的实施,重复之处不再赘述。以下所使用的,术语“单元”或者“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
图15是本发明实施例中的夹层识别装置的结构框图一。如图15所示,该夹层识别装置具体包括:输入特征获取模块10以及识别模块20。
输入特征获取模块10根据取心井资料获取测井曲线作为输入特征。
其中,取心井主要为钻取地下岩心,供作观测鉴定、分析实验的样品,以直接获取有关地层的岩性、岩相、物性、生油性、含油性等多方面的资料或参数,使用取心钻头和取心钻具所钻的井。
取心井资料为钻井后由专业测井公司进行检测得到,是最真实可靠的地下岩层的资料。
识别模块20将该输入特征作为预测样本,输入预设的支持向量机,该支持向量机的输出表征该取心井资料的夹层识别结果。
按照目前比较成熟且常用的夹层分类方法,同时考虑沉积作用、成岩作用以及其他地质作用的差异,根据岩心观察和测井响应特征,夹层主要划分为泥质夹层、物性夹层、钙质夹层三类。
该支持向量机输出3种基层识别结果,即将夹层类型划分为3个等级作为输出类别,即Y={1,2,3};其中1代表泥质夹层,2代表钙质夹层,3代表物性夹层。
通过上述技术方案可知,该夹层识别装置根据取心井资料获取输入特征,然后将所述输入特征作为预测样本,输入预设的支持向量机,并将该支持向量机的输出作为该取心井资料的夹层识别结果,即通过支持向量机实现夹层识别,有效利用了SVM在求解非线性问题及处理小样本数据上的优势,适于夹层识别中地质资料难以获得、数据常表现为小样本的特征的特性,实现运用数学算法对整个研究区的夹层开展识别,快速识别层内夹层,正确认识夹层对精细描述油藏地质特征。
在一个可选的实施例中,如图16所示,该输入特征获取模块10可以包括:
第一数据获取单元10a获取取心井的测井曲线数据。
其中,取心井资料中包含测井曲线数据,且该测井曲线数据包括:自然伽马测井曲线、声波测井曲线、微电极曲线(RMN和RMG)、Δ(Rmn-Rmg)测井曲线、Δ(Rmn-Rmg)夹层/Δ(Rmn-Rmg)砂岩、电阻率曲线、声波曲线、自然电位SP曲线、感应测井曲线、中子测井曲线、三侧向测井曲线、微球形聚焦测井曲线、井径CAL曲线等。
第一输入特征提取单元10a筛选该测井曲线数据中的微电极曲线作为该输入特征。
具体地,通过选用微电极(RMN和RMG)测井曲线作为输入特征X:
X={RMN,RMG}。
值得说明的是,钙质夹层测井曲线的典型特征是微电极曲线呈高值尖峰状,较泥质和物性夹层可以明显区分识别,因此,选用微电极(RMN和RMG)测井曲线作为输入特征,对支持向量机进行训练和应用,可以有效增加钙质夹层的识别精度。
在另一个可选的实施例中,如图17所示,该输入特征获取模块10可以包括:第二数据获取单元10c以及第二输入特征提取单元10d。
第二数据获取单元10c获取取心井的测井曲线数据。
其中,取心井资料中包含测井曲线数据,且该测井曲线数据包括:自然伽马测井曲线、声波测井曲线、微电极曲线(RMN和RMG)、Δ(Rmn-Rmg)测井曲线、Δ(Rmn-Rmg)夹层/Δ(Rmn-Rmg)砂岩、电阻率曲线、声波曲线、自然电位SP曲线、感应测井曲线、中子测井曲线、三侧向测井曲线、微球形聚焦测井曲线、井径CAL曲线等。
第二输入特征提取单元10d将该测井曲线数据中的自然伽马测井曲线、声波测井曲线以及微电极曲线组合成该输入特征。
具体地,根据测井参数值识别夹层时,在分析研究区内夹层和测井参数的对应关系的基础上,划分研究区岩心的岩石类型,并确定能够较好地反映岩性的测井曲线,通过选用自然伽马(GR)、声波(AC)、微电极(RMN和RMG)四条测井曲线组合成输入特征X1:
X1={GR,AC,RMN,RMG}
在一个可选的实施例中,该输入特征还可以包括:Δ(Rmn-Rmg)测井曲线和/或Δ(Rmn-Rmg)夹层/Δ(Rmn-Rmg)砂岩。
举例来说,可以通过选用自然伽马(GR)、声波(AC)、微电极(RMN和RMG)以及Δ(Rmn-Rmg)测井曲线五条测井曲线组合成输入特征X2:
X2={GR,AC,RMN,RMG,Δ(Rmn-Rmg)};
或者,通过选用自然伽马(GR)、声波(AC)、微电极(RMN和RMG)、Δ(Rmn-Rmg)夹层/Δ(Rmn-Rmg)砂岩五条测井曲线组合成输入特征X3:
X3={GR,AC,RMN,RMG,Δ(Rmn-Rmg)夹层/Δ(Rmn-Rmg)砂岩}。
当然,本领域技术人员可以理解的是,上述输入特征的选择不应理解为对本发明实施例的限制,只是本发明实施例的一种优选的实施方式,应用时可以根据不同夹层测井曲线的典型特征来选取。
图18是本发明实施例中的夹层识别装置的结构框图四。如图18所示,该夹层识别装置在包含图15所示夹层识别装置的基础上,还包括:归一化模块30。
归一化模块30对该输入特征进行归一化处理。
其中,为避免各参数量纲差异导致核函数内积计算困难,对预测结果造成负面影响,数据在进入支持向量机之前需进行归一化处理,使其转化为分布在[0,1]区间内,以保证该支持向量机核函数运行的稳定性。
具体地,采用如下公式(5)将数据的特征值映射到[0,1]区间,从而减小SVM模型的计算量,提高识别精度。
其中,x*表示归一化之前的数值,x表示归一化之后的数值,表示输入数据中的最小值,/>表示输入数据中的最大值。
图19是本发明实施例中的夹层识别装置的结构框图五。如图19所示,该夹层识别装置在包含图18所示夹层识别装置的基础上,还包括:
训练样本获取模块40根据历史取心井资料得到该支持向量机的训练样本集。
具体地,在已知夹层类别的历史取心井资料中选取训练样本集,该训练样本集不仅包含历史取心井资料,还包含该历史取心井资料对应的夹层类别,作为评价该支持向量机识别精度的标签。
在一可选的实施例中,该训练样本集中的每一个训练样本均含有由微电极曲线组合成的输入特征X。
即:通过选用微电极(RMN和RMG)测井曲线组合成输入特征X:
X={RMN,RMG}
在另一可选的实施例中,该训练样本集中的每一个训练样本均含有由取心井的测井曲线数据中的自然伽马测井曲线、声波测井曲线以及微电极曲线组合成的输入特征X1。
即:通过选用自然伽马(GR)、声波(AC)、微电极(RMN和RMG)四条测井曲线组合成输入特征X1:
X1={GR,AC,RMN,RMG}
再一个可选的实施例中,该输入特征还可以包括:Δ(Rmn-Rmg)测井曲线和/或Δ(Rmn-Rmg)夹层/Δ(Rmn-Rmg)砂岩。
举例来说,可以通过选用自然伽马(GR)、声波(AC)、微电极(RMN和RMG)以及Δ(Rmn-Rmg)测井曲线五条测井曲线组合成输入特征X2:
X2={GR,AC,RMN,RMG,Δ(Rmn-Rmg)};
或者,通过选用自然伽马(GR)、声波(AC)、微电极(RMN和RMG)、Δ(Rmn-Rmg)夹层/Δ(Rmn-Rmg)砂岩五条测井曲线组合成输入特征X3:
X3={GR,AC,RMN,RMG,Δ(Rmn-Rmg)夹层/Δ(Rmn-Rmg)砂岩}。
值得说明的是,利用该训练样本训练得到的支持向量机,在应用该支持向量机进行夹层识别时,预测样本所包含的测井曲线与该训练样本所包含的测井曲线应该一致,比如,若训练样本采用X1,则在应用基于该训练样本X1训练得到的支持向量机进行夹层识别时,输入至该支持向量机的预测样本也应该采用X1类型。
训练模块50应用该训练样本集对该支持向量机进行训练。
在支持向量机的问题表达和求解算法中包含几个待定的设计参数:一是核函数的参数;一是惩罚因子C。核函数间接地描述了支持向量机的高维特征空间,惩罚因子C用来平衡模型复杂度和经验风险值。这些参数的确定对支持向量机的学习性能和计算复杂性有很大的影响。
核函数确定后,还需选出能使该支持向量机获得最佳性能的核参数g和惩罚因子C。
其中,SVM的性能随参数g从0到∞呈规律性变化。当g→0时,所有样本都将成为支持向量,从而产生“过拟合”现象;当g→∞时,所有样本都被判为同一类,对新样本的正确分类能力几乎为零;当g大于0且充分小时,任意给定的样本都可以被正确划分。
而惩罚因子C决定了对误判样本的惩罚程度,它的大小对最优分类面的位置有很大影响。在确定的特征子空间中,C的取值小表示对经验误差的惩罚小,学习机器的复杂度小但经验风险值较大;当C→∞时,所有的约束条件都必须满足,算法必须对所有的训练样本准确分类。每个特征子空间都能找到一个合适的C,使得SVM推广能力最好。
惩罚因子C和核参数g的寻优过程也就是SVM的训练过程。
最优参数确定后,便可以用训练好的SVM进行夹层识别。
图20是本发明实施例中的夹层识别装置的结构框图六。如图20所示,该夹层识别装置在包含图19所示夹层识别装置的基础上,还包括:
核函数选取模块60采用交叉验证法选取该支持向量机的核函数。
其中,核函数的改变实际上是隐含地改变映射函数,从而改变样本数据子空间分布的复杂程度(维数)。如果数据子空间维数很高,则得到的最优分类面可能比较复杂、经验风险小且置信范围大;反之亦然。因此只有选择合适的核函数将数据映射到合适的特征空间,才能得到具有较好识别能力的支持向量机结构。
目前常用的核函数有:线性核(Linear Kernel)函数、多项式核(PolynomialKernel)函数、径向基核函数(Radial Basis Function)/高斯核(Gaussian Kernel)函数、幂指数核(Exponential Kernel)函数、拉普拉斯核(Laplacian Kernel)函数、ANOVA核(ANOVA Kernel)函数、二次有理核(Rational Quadratic Kernel)函数、多元二次核(Multiquadric Kernel)函数、逆多元二次核(Inverse Multiquadric Kernel)函数、Sigmoid核(Sigmoid Kernel)函数、字符串核函数等。
线性核函数主要适于线性可分的情况,其从特征空间到输入空间的维度是一样的,在原始空间中寻找最优线性分类器,具有参数少速度快的优势。
多项式核函数可以实现将低维的输入空间映射到高维的特征空间,适合于正交归一化(向量正交且模为1)数据,该多项式核函数属于全局核函数,允许相距很远的数据点对核函数的值有影响,参数d越大,映射的维度越高,计算量就会越大。
高斯径向基核函数是个可适用于任意分布样本的普适函数,且仅有一个参数σ,能较好地反映模型选择的复杂度,其表达式如下:
其中,x和xi分别表示两个特征向量,即定量评价的参数,σ为高斯核的宽度,它的取值对学习机器的性能起决定作用。径向基核函数是典型的局部性核函数,它只在测试点附近小范围内对数据点有影响。只要核参数σ选择恰当,径向基核函数可以适用于任意分布的样本。
具体地,采用交叉验证(Cross-Validation)法选取该支持向量机的核函数指在进行核函数选取时,分别试用不同的核函数,归纳误差最小的核函数就是最好的核函数.如针对径向基核函数、Sigmoid核函数,结合信号处理问题中的函数回归问题,通过仿真实验,对比分析在相同数据条件下,采用哪种核函数的SVM误差小,则选用该种核函数进行夹层识别。
在一个可选的实施例中,该训练模块还50包括训练单元,该训练单元在核函数选取模块60确定了核函数之后,应用该训练样本集对该核函数进行参数寻优时,采用网格搜索法和交叉验证法相结合的方式进行,具体如下:
交叉验证过程:将训练样本随机地分成k个大小相同的子集,利用k-1个子集,对给定的一组C和g建立SVM模型,并利用建议的SVM模型对剩下的一个子集进行预测,以上过程重复k次,根据k次迭代后得到的均方差平均值来估计期望泛化误差,最终选择泛化误差最小的一组C和g,作为最优参数。
网格搜索是一种能够同时从不同的增长方向并行搜索多维数组的数据搜索方法,其过程为:首先,大致选定一个搜索范围,如C区间为[2-10,210],g区间为[2-15,215],步长为1,在选定区间内让C和g呈指数增长,比较选取不同参数数值时的交叉验证精度,选取一组交叉验证精度最高(即泛化误差最低)的参数;然后,再以该参数为中心缩小搜索范围,并逐步缩短步长重复搜索,直至交叉验证精度变化不大时为止,最后所得结果即为最优参数。
下面,举例运用上述方法确定参数的过程如下:
1.选定一组惩罚因子C和核参数g的范围,如C和g的搜索区间均设为[2-10,210],搜索步长为3;
2.采用10折交叉验证法,即:将训练样本集分成10份,即k=10,轮流将其中9份数据作为训练数据,1份数据作为测试数据,训练支持向量机并开展检验,以上过程重复10次,根据10次迭代后得到的均方差平均值来估计期望泛化误差,最终选择泛化误差最小的一组C和g,作为最优参数,得到一组最优参数C=31,g=0.5,交叉验证精度为80.12%;
3.对步骤1中所选范围不断调整,并逐步减小步长进行实验,最终确定C的区间为[2-4,28],g的区间为[2-6,210],步长为0.5,得到最优参数C=45.1,g=1,交叉验证精度达到81.92%。
为了能够进一步提高夹层识别精度,在本申请的一实施例中,本申请还提供一种夹层识别装置,参见图21,该夹层识别装置还包括:SVM测试机构。
该SVM测试机构具体包括:测试样本获取模块70、测试模块80、判断模块90、输出模块91以及优化模块92。
测试样本获取模块70根据至少一个测试用历史取心井资料得到测试样本。
其中,测试用历史取心井资料为未包含在用于支持向量机训练的历史取心井资料中的,且针对所述测试用历史取心井资料,需获取其已知识别结果
测试模块80应用该测试样本对该支持向量机进行测试,并将该支持向量机的输出作为测试结果。
即:利用已知识别结果的测试用历史取心井资料来验证训练后的支持向量机的评价效果。
判断模块90基于该测试结果及已知识别结果,判断该支持向量机是否符合预设要求。
其中,判断该支持向量机是否符合预设要求的标准为:该测试结果与该测试用历史取心井资料的已知识别结果相同或误差在一定范围内。
输出模块91在支持向量机符合预设要求时,将当前支持向量机作为用于夹层识别的目标支持向量机。
优化模块92在该支持向量机不符合预设要求时,对当前支持向量机进行优化和/或应用更新后的训练样本集重新对该支持向量机进行训练。
因此,在一个可选的实施例中,利用钙质夹层对RMN和RMG这两种影响因素的灵敏度较高的特性,可以选用取心井资料中的微电极(RMN和RMG)测井曲线作为输入特征,对支持向量机进行训练和应用,可以有效增加钙质夹层的识别精度。本实施例示出的装置尤其适于仅需要识别钙质夹层的场合。
在另一个实施例中,也可以不同类型夹层对不同的特征参数反应的灵敏度差异较大,利用钙质夹层测井曲线的典型特征是微电极曲线呈高值尖峰状,较泥质和物性夹层可以明显区分识别这一特性,提供一种夹层识别装置,可以高效准确识别钙质夹层、泥质夹层和物性夹层。具体包括:钙质夹层识别模块、泥质夹层和物性夹层识别模块。
钙质夹层识别模块根据RMN和RMG参数识别钙质夹层。
具体地:针对训练数据集A1和测试数据集A2,选用每个数据的微电极(RMN和RMG)测井曲线作为输入特征X,对用于识别钙质夹层的支持向量机采用上文所述的训练方法和测试方法进行训练、测试,得到用于评价钙质夹层的支持向量机,然后将待识别取心井资料的微电极(RMN和RMG)测井曲线输入该用于评价钙质夹层的SVM,得到识别结果,并提取识别结果为钙质夹层的结果,作为第一结果。其中,训练数据集A1和测试数据集A2中均包含标签为钙质夹层、泥质夹层和物性夹层的数据。
泥质夹层和物性夹层识别模块结合其他测井参数识别泥质夹层和物性夹层。
具体地,针对训练数据集B1和测试数据集B2,选用每个数据的输入特征X1或X2或X3(X1、X2、X3所包含的曲线参见上文),对用于识别泥质夹层和物性夹层的支持向量机采用上述的训练方法和测试方法进行训练、测试,得到用于评价泥质夹层和物性夹层的SVM,然后将待识别取心井资料的输入特征X1或X2或X3输入该用于评价泥质夹层和物性夹层的SVM,得到第二结果。其中,该训练数据集B1和测试数据集B2不包含标签为钙质夹层的数据。
最后综合步骤1得到的第一结果和步骤2的第二结果,得到最终的识别结果,实现夹层分步识别。
本发明实施例提供一种夹层识别装置,采用分步的方法实现夹层的识别,利用不同类型夹层对不同的特征参数反应的灵敏度差异较大的特性。
首先,基于部分曲线作为输入特征对用于评价特定夹层的SVM进行训练、测试和应用(对待测数据A进行应用),能够得到精度更高的特定夹层的识别结果。
然后,再利用去除了该特定夹层的训练数据,对用于评价除特定夹层之外的其它夹层的SVM进行训练,利用测试数据对训练后的SVM进行测试,然后应用测试后的该SVM对该待测数据A进行识别,得到该其它夹层的识别结果。
最后,将该特定夹层的识别结果和该其它夹层的识别进行组合,得到该待测数据A的夹层识别结果。
当然,本领域技术人员可以理解的是,在实际应用中,不需要每次对进行训练和测试步骤,只需要预先训练和测试好用于评价特定夹层的SVM和用于评价其它夹层的SVM,将待测数据分别输入两个SVM进行评价,再对结果进行组合即可。
通过采用上述分布识别的方式,能够提高夹层识别的精度,有利于指导生产。
上述实施例阐明的装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为电子设备,具体的,电子设备例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
在一个典型的实例中电子设备具体包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现下述步骤:
根据取心井资料获取测井曲线作为输入特征;
将所述输入特征作为预测样本,输入预设的支持向量机,该支持向量机的输出表征该取心井资料的夹层识别结果。
从上述描述可知,本发明实施例提供的电子设备,可用于识别夹层,根据取心井资料获取输入特征,然后将所述输入特征作为预测样本,输入预设的支持向量机,该支持向量机的输出表征该取心井资料的夹层识别结果,即通过支持向量机实现夹层识别,在定量研究已知井夹层规模大小、厚度、产状及发育分布规律的基础上,实现运用数学算法对整个研究区的夹层开展识别,快速识别层内夹层,正确认识夹层对精细描述油藏地质特征,砂岩油藏开发中后期剩余油分布预测提供基础,同时为提高油田采收率进而采取有效的工程措施具有重要意义。
下面参考图22,其示出了适于用来实现本申请实施例的电子设备600的结构示意图。
如图22所示,电子设备600包括中央处理单元(CPU)601,其可以根据存储在只读存储器(ROM)602中的程序或者从存储部分608加载到随机访问存储器(RAM))603中的程序而执行各种适当的工作和处理。在RAM603中,还存储有系统600操作所需的各种程序和数据。CPU601、ROM602、以及RAM603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。
以下部件连接至I/O接口605:包括键盘、鼠标等的输入部分606;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分607;包括硬盘等的存储部分608;以及包括诸如LAN卡,调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至I/O接口606。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器610上,以便于从其上读出的计算机程序根据需要被安装如存储部分608。
特别地,根据本发明的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本发明的实施例包括一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现下述步骤:
根据取心井资料获取测井曲线作为输入特征;
将所述输入特征作为预测样本,输入预设的支持向量机,该支持向量机的输出表征该取心井资料的夹层识别结果。
从上述描述可知,本发明实施例提供的计算机可读存储介质,可用于识别夹层,根据取心井资料获取输入特征,然后将所述输入特征作为预测样本,输入预设的支持向量机,该支持向量机的输出表征该取心井资料的夹层识别结果,即通过支持向量机实现夹层识别,在定量研究已知井夹层规模大小、厚度、产状及发育分布规律的基础上,实现运用数学算法对整个研究区的夹层开展识别,快速识别层内夹层,正确认识夹层对精细描述油藏地质特征,砂岩油藏开发中后期剩余油分布预测提供基础,同时为提高油田采收率进而采取有效的工程措施具有重要意义。
在这样的实施例中,该计算机程序可以通过通信部分609从网络上被下载和安装,和/或从可拆卸介质611被安装。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。
Claims (14)
1.一种夹层识别方法,其特征在于,包括:
根据取心井资料获取测井曲线作为输入特征;
将所述输入特征作为预测样本,输入预设的支持向量机,该支持向量机的输出表征该取心井资料的夹层识别结果;
其中,所述方法还包括:
根据历史取心井资料得到用于该支持向量机的训练样本集;
应用所述训练样本集对该支持向量机进行训练;
其中,在所述应用所述训练样本集对该支持向量机进行训练之前,还包括:采用交叉验证法选取该支持向量机的核函数,其中,采用交叉验证法选取该支持向量机的核函数指在进行核函数选取时,分别试用不同的核函数,归纳误差最小的核函数就是最好的核函数,并选用该种函数进行夹层识别;
其中,用于识别钙质夹层、泥质夹层和物性夹层的夹层识别方法,包括:
步骤1:根据微电极曲线的RMN和RMG参数识别钙质夹层;
步骤2:结合其他测井参数识别泥质夹层和物性夹层;
其中,所述根据取心井资料获取输入特征,包括:
获取取心井的测井曲线数据;
将该测井曲线数据中的自然伽马测井曲线、声波测井曲线以及微电极曲线组合成所述输入特征,其中,所述输入特征还包括:Δ(Rmn-Rmg)测井曲线和/或Δ(Rmn-Rmg)夹层/Δ(Rmn-Rmg)砂岩。
2.根据权利要求1所述的夹层识别方法,其特征在于,所述测井曲线包括:微电极曲线;所述根据取心井资料获取测井曲线作为输入特征,包括:
获取取心井的测井曲线数据;
从该测井曲线数据中筛选出微电极曲线作为所述输入特征。
3.根据权利要求1所述的夹层识别方法,其特征在于,在将所述输入特征作为预测样本,输入预设的支持向量机,并将该支持向量机的输出作为该取心井资料的夹层识别结果之前,还包括:
对所述输入特征进行归一化处理。
4.根据权利要求1所述的夹层识别方法,其特征在于,所述应用所述训练样本集该支持向量机进行训练,包括:结合网格搜索法和交叉验证法,应用所述训练样本集该支持向量机进行训练。
5.根据权利要求1所述的夹层识别方法,其特征在于,还包括:
根据至少一个测试用历史取心井资料得到测试样本;
应用所述测试样本对所述支持向量机进行测试,并将该支持向量机的输出作为测试结果;
基于所述测试结果及已知识别结果,判断该支持向量机是否符合预设要求;
若是,则将当前支持向量机作为用于夹层识别的目标支持向量机。
6.根据权利要求5所述的夹层识别方法,其特征在于,还包括:
若当前支持向量机不符合预设要求,则对当前支持向量机进行优化和/或应用更新后的训练样本集重新对该支持向量机进行训练。
7.一种夹层识别装置,其特征在于,包括:
输入特征获取模块,根据取心井资料获取测井曲线作为输入特征;
识别模块,将所述输入特征作为预测样本,输入预设的支持向量机,该支持向量机的输出表征该取心井资料的夹层识别结果;
其中,所述装置还包括:
训练样本获取模块,根据历史取心井资料得到该支持向量机的训练样本集;
训练模块,应用所述训练样本集对该支持向量机进行训练;
核函数选取模块,采用交叉验证法选取该支持向量机的核函数,其中,采用交叉验证法选取该支持向量机的核函数指在进行核函数选取时,分别试用不同的核函数,归纳误差最小的核函数就是最好的核函数,并选用该种函数进行夹层识别;
其中,用于识别钙质夹层、泥质夹层和物性夹层的夹层识别装置被配置为:
步骤1:根据微电极曲线的RMN和RMG参数识别钙质夹层;
步骤2:结合其他测井参数识别泥质夹层和物性夹层;
其中,所述输入特征获取模块包括:
第二数据获取单元,获取取心井的测井曲线数据;
第二输入特征提取单元,将该测井曲线数据中的自然伽马测井曲线、声波测井曲线以及微电极曲线组合成所述输入特征,其中,所述输入特征还包括:Δ(Rmn-Rmg)测井曲线和/或Δ(Rmn-Rmg)夹层/Δ(Rmn-Rmg)砂岩。
8.根据权利要求7所述的夹层识别装置,其特征在于,所述测井曲线包括:微电极曲线;所述输入特征获取模块包括:
第一数据获取单元,获取取心井的测井曲线数据;
第一输入特征提取单元,从该测井曲线数据中筛选出微电极曲线作为所述输入特征。
9.根据权利要求7所述的夹层识别装置,其特征在于,还包括:
归一化模块,对所述输入特征进行归一化处理。
10.根据权利要求7所述的夹层识别装置,其特征在于,所述训练模块包括:
训练单元,结合网格搜索法和交叉验证法,应用所述训练样本集该支持向量机进行训练。
11.根据权利要求7所述的夹层识别装置,其特征在于,还包括:
测试样本获取模块,根据至少一个测试用历史取心井资料得到测试样本;
测试模块,应用所述测试样本对所述支持向量机进行测试,并将该支持向量机的输出作为测试结果;
判断模块,基于所述测试结果及已知识别结果,判断该支持向量机是否符合预设要求;
输出模块,在支持向量机符合预设要求时,将当前支持向量机作为用于夹层识别的目标支持向量机。
12.根据权利要求11所述的夹层识别装置,其特征在于,还包括:
优化模块,在该支持向量机不符合预设要求时,对当前支持向量机进行优化和/或应用更新后的训练样本集重新对该支持向量机进行训练。
13.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1至6任一项所述的夹层识别方法的步骤。
14.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至6任一项所述的夹层识别方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910122815.XA CN111582292B (zh) | 2019-02-18 | 2019-02-18 | 夹层识别方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910122815.XA CN111582292B (zh) | 2019-02-18 | 2019-02-18 | 夹层识别方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111582292A CN111582292A (zh) | 2020-08-25 |
CN111582292B true CN111582292B (zh) | 2024-03-05 |
Family
ID=72124190
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910122815.XA Active CN111582292B (zh) | 2019-02-18 | 2019-02-18 | 夹层识别方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111582292B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113378469B (zh) * | 2021-06-21 | 2022-04-08 | 大庆油田有限责任公司 | 一种基于卡尔曼滤波与支持向量机的测井曲线预测方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104251137A (zh) * | 2013-06-28 | 2014-12-31 | 中国石油化工股份有限公司 | 河流相厚油层层内夹层识别预测方法 |
WO2016161914A1 (zh) * | 2015-04-07 | 2016-10-13 | 四川行之智汇知识产权运营有限公司 | 一种利用地质和测井信息预测储层成岩相的方法 |
CN106545337A (zh) * | 2016-11-25 | 2017-03-29 | 西南石油大学 | 一种基于支持向量机的沉积微相测井识别方法 |
-
2019
- 2019-02-18 CN CN201910122815.XA patent/CN111582292B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104251137A (zh) * | 2013-06-28 | 2014-12-31 | 中国石油化工股份有限公司 | 河流相厚油层层内夹层识别预测方法 |
WO2016161914A1 (zh) * | 2015-04-07 | 2016-10-13 | 四川行之智汇知识产权运营有限公司 | 一种利用地质和测井信息预测储层成岩相的方法 |
CN106545337A (zh) * | 2016-11-25 | 2017-03-29 | 西南石油大学 | 一种基于支持向量机的沉积微相测井识别方法 |
Non-Patent Citations (1)
Title |
---|
张银德 ; 童凯军 ; 郑军 ; 王道串 ; .支持向量机方法在低阻油层流体识别中的应用.石油物探.2008,(第03期),正文第2-5页. * |
Also Published As
Publication number | Publication date |
---|---|
CN111582292A (zh) | 2020-08-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20180247156A1 (en) | Machine learning systems and methods for document matching | |
CN105760673B (zh) | 一种河流相储层地震敏感参数模板分析方法 | |
Silva et al. | Petrofacies classification using machine learning algorithms | |
Chan et al. | Parametrization of stochastic inputs using generative adversarial networks with application in geology | |
CN111665560B (zh) | 油气层识别方法、装置、计算机设备及可读存储介质 | |
WO2019232224A1 (en) | Systems and methods for special core analysis sample selection and assessment | |
Zhou et al. | Fast prediction of reservoir permeability based on embedded feature selection and LightGBM using direct logging data | |
EP3935470A1 (en) | System and method for supervised learning of permeability of earth formations | |
Mohammadian et al. | A case study of petrophysical rock typing and permeability prediction using machine learning in a heterogenous carbonate reservoir in Iran | |
Xiongyan et al. | Computational intelligent methods for predicting complex ithologies and multiphase fluids | |
CN111766635A (zh) | 砂体连通程度分析方法和系统 | |
Song et al. | Potential for vertical heterogeneity prediction in reservoir basing on machine learning methods | |
Dong et al. | Fracture identification in tight reservoirs by multiple kernel Fisher discriminant analysis using conventional logs | |
CN111582292B (zh) | 夹层识别方法和装置 | |
Gholami et al. | Support vector regression for prediction of gas reservoirs permeability | |
Kasha et al. | Machine learning for capillary pressure estimation | |
Luo et al. | Kernel Fisher discriminant analysis based on a regularized method for multiclassification and application in lithological identification | |
Rastegarnia et al. | Prediction of electrofacies based on flow units using NMR data and svm method: A case study in cheshmeh khush field, southern iran | |
Sun et al. | Optimization of models for rapid identification of oil and water layers during drilling-a win-win strategy based on machine learning | |
Korovin et al. | Hybrid method of dynamograms wavelet analysis for oil-production equipment state identification | |
He et al. | Adaptive Material Balance Method for Reserve Evaluation: A Combination of Machine Learning and Reservoir Engineering | |
Tewari et al. | A novel automatic detection and diagnosis module for quantitative lithofacies modeling | |
Barros et al. | Automated clustering based scenario reduction to accelerate robust life-cycle optimization | |
Gudmundsdottir et al. | Reservoir characterization and prediction modeling using statistical techniques | |
Lu et al. | Prediction of the pore structure by machine learning techniques in the carbonate reservoirs in Iraq H oilfield |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |