一种致密气藏自动识别方法
技术领域
本发明属于地质勘探技术领域,尤其涉及一种致密气藏自动识别方法。
背景技术
致密砂岩气是全球非常规天然气勘探的重要领域,属典型连续性致密砂岩气藏,具有低孔、低渗、低丰度、大面积分布的特征,具有勘探难度大、技术要求高的特点。储层评价和识别目前主要采用地质、地震、岩心和测井资料结合的方法进行,鄂尔多斯盆地位于黄土高原,地表以下数百米均为黄土层,采用地震手段进行地层精细探测与储层含气性预测的成本高、难度大;致密砂岩储层具有复杂的岩性、孔隙结构和流体性质,测井信号含气性显示不明显,导致含气性识别准确率低,因常规的测井数据处理手段较为简单,测井数据利用率低,无法进行储层精细解释。
目前,储层流体性质识别的小波分析方法总结为两类:一是直接对某条测井信号实施小波分解,用小波分解能量谱进行流体识别,二是对于单个测井曲线特征不明显的复杂储层,将多条测井信号合并为一条信号后再进行小波分解。
因此,小波分解提取信号特征的方法均为对单条信号的分析,而致密砂岩气藏流体性质比常规储层更加复杂,其储层特征广泛、分布式地隐藏于多条测井信号的组合中,通过单条测井信号难以准确识别复杂储层流体,目前也没有对多测井信号进行合并处理的统一标准方法,而且对多测井信号进行准确分析需要大量人工经验,难以自动完成。
发明内容
根据以上现有技术的不足,本发明提供了一种致密气藏自动识别方法,采用样本预处理后的所有的测井曲线,将其分别考虑,分别进行小波分解,再采用支持向量机算法实现致密砂岩气藏流体性质的准确、快速识别。
本发明解决的技术问题采用的技术方案为:一种致密气藏自动识别方法,包括如下步骤:
步骤1、对实际储层样本的多条测井信号进行预处理得到特征信号组,所述特征信号组为与实际储层含气性识别相关性最大的测井信号组合;在对实际储层样本进行预处理之前,可以先对样本的测井信号做归一化处理,以使得后续计算过程更加便捷;
步骤2、将步骤1中预处理后的实际储层样本按照一定比例随机分成训练集和测试集;
步骤3、采用自适应遗传算法对训练集的小波基函数的参数组合进行优化,利用训练集对支持向量机进行训练,得到特征信号组对应的小波基函数参数的最佳组合,以及相对应的最佳支持向量机分类模型;
步骤4、使用该支持向量机分类模型进行储层的含气性识别。
进一步地,步骤3的具体实现包括如下步骤:
3(a)以测井特征信号组的小波基函数的参数组合确定优化变量,对小波基函数的可调参数确定取值范围,并进行离散和编码,得到优化变量的搜索空间;优化的目标函数设为储层含气性识别符合率;
进一步地,步骤3(a)中优化的目标函数为储层含气性识别符合率,构造目标函数;
其中,ICR为目标函数,SWi为第i条测井信号的小波基函数优选参数范围,1≦i≦N,N为测井信号数。3(b)在优化变量的搜索空间范围内随机生成初始种群,即测井特征信号组中N条信号的15种小波基函数的参数组合;
3(c)采用种群中每1个个体(也就是不同参数组合的小波基函数)分别对训练集中每1个样本的中测井特征信号组实施小波分解,得到小波分解能量谱特征矩阵;
3(d)以小波分解能量谱特征矩阵作为输入,实际储层样本实际试气结果为输出,进行支持向量机分类模型的训练,得到最优分类超平面;
3(e)使用最优分类超平面计算测试集样本符合率,即当前个体下的目标函数值;遍历整个测试集样本,计算种群中所有个体的目标函数值的平均值;
3(f)给定一个小的阈值,判断本代种群的小波基函数参数组合下测试集样本符合率与上一代测试集样本符合率差值是否满足小于给定阈值;
若满足,则此时储层含气性识别符合率达到最大,终止计算,同时得到训练集样本符合率最大时对应的小波基函数参数的最佳组合以及相对应的最佳支持向量机分类模型,进入步骤4;
若不满足,则使用自适应遗传算法确定的交叉概率和变异概率生成下一代种群,返回步骤3(c)继续进行;
进一步地,步骤3(d)的具体实现包括如下步骤:
Step1:定义训练集为(TR)M,M为样本数,对样本trm,m=1,2,...,M的N条测井信号分别进行小波分解得到小波分解能量谱组成的特征矩阵,即:
其中,
将样本trm对应的特征矩阵展开为长度是J*N的一维向量Xm,
Step2:将一维向量Xm作为输入,采用基于核的支持向量机,选择合适的核函数,在训练集上进行支持向量机分类模型的训练,得到一个最优分类超平面,用于测试集样本符合率的计算。
本发明具有以下有益效果:
本发明对实际储层样本分成测试集和训练集,并对训练集中的样本的每条测井特征信号均实施小波分解,并进一步得到小波分解能量谱特征矩阵,并进一步对支持向量机进行训练,同时使用自适应遗传算法对整个过程进行优化,最后得到特征信号组对应的小波基函数参数的最佳组合,以及相对应的最佳支持向量机分类模型,用于储层含气识别,相比于现有技术大大提高了致密砂岩气藏储层含气性识别的准确度,避免了现有技术中人工方法需要大量经验和时间,提高了识别过程的效率。
附图说明
图1是本发明所提供实施例的方法流程示意图;
图2是本发明所提供实施例中自适应遗传算法迭代次数与相对误差图。
具体实施方式
下面结合附图对本发明做进一步描述。
实施例一:
现有技术识别致密气藏包括采用交会图法和机器学习法。其中交会图方法应用于常规储层时方便有效,鄂尔多斯致密砂岩储层具有岩性复杂、低孔低渗、孔隙结构复杂的特点,储层流体分布复杂,无统一流体界面,重叠法或交会图法作为传统方法,能够同时考虑到的因素有限,导致数据严重混叠而得不到有效的重叠或交会图。测井作为距离地层最近的测量手段,具有测量信息丰富、分辨率高、成本低的优点,测井解释无疑是致密砂岩储层识别的首选。
目前国内外利用小波分析技术研究地质数据大多集中在对地震数据的去噪、特征提取等,达到了较好的处理效果,地震资料适合于粗粒度的数据处理,因本身精度有限与现实原因,使得鄂尔多斯盆地地震资料获取成本高、解释数据难、识别储层含气性准确率低。
目前利用小波分析技术研究测井曲线的文献,主要是先选定某个测井曲线或把多个曲线合并成一个,然后人工选定某种小波基函数进行小波(包)分解,再人工分析小波能量谱进行含油气性识别。本方案对多条测井曲线实施小波分解,使用自适应遗传算法优化小波基函数的参数组合、支持向量机进行储层含气性识别,大大提升了识别的准确度和识别过程的效率。
如图1所示,本发明所述的一种致密气藏自动识别方法,包括如下步骤:
步骤1、对实际储层样本的所有常规测井信号(包括自然伽马、自然电位、声波、密度、中子、深侧向电阻率、浅侧向电阻率等)采用合适的预处理算法进行筛选得到测井特征信号组,从而削减特征,减小后续运算量,可选预处理方法有决策树或核主成分分析;
在对实际储层样本进行预处理之前,可以先对样本的测井信号做归一化处理,以使得后续计算过程更加便捷。
采用决策树法处理:先采用决策树对实际储层样本进行无监督分类,对每类储层样本的测井信号按决策树的分支(即子树)的熵值大小进行测井信号初选,筛选出与实际储层含气性识别相关性最大的测井信号组合,作为特征信号组;
储层样本可分为气井和无气井,气井分为高产(大于1万立方米)、低产(小于1万立方米),无气井有水层、干层;地球物理测井信号包括:自然电位曲线(SP)、密度曲线(DEN)、中子曲线(CNL)、自然伽马曲线(GR)、电阻率曲线(LLD、LLS)、声波时差曲线(AC)等。
或者采用核主成分分析:采用核主成分分析法对实际储层样本的测井信号提取主要特征成分,根据测井信号的主要特征成分与实际储层产气量分类的符合情况,筛选出与实际储层含气性识别相关性最大的测井信号组合,作为特征信号组;
不同的测井信号从不同的角度反映储层特征,因此对测井特征信号组中的每条信号实施小波分解时采用的小波基函数也将有所不同,通过优化方法得到测井特征信号组所对应小波基函数参数的最佳组合,使得目标函数值最大。
这样通过对每条信号实施小波分解得到相对应的小波分解能量谱,再将这些小波分解能量谱组合成特征矩阵,采用分类算法识别储层含气性,整个过程更快速、准确。
步骤2、将步骤1中预处理后的实际储层样本按照一定比例随机分成训练集和测试集;其中的比例是根据需要按照经验进行设置,比如比例可以是9:1或者8:2等等,训练集用于训练支持向量机,得到最优分类超平面;
步骤3、利用训练集对支持向量机进行训练,得到特征信号组对应的小波基函数参数的最佳组合,以及相对应的最佳支持向量机分类模型;过程中,采用自适应遗传算法对小波基函数的参数组合进行优化,利用优化后的最佳参数组合使得支持向量机分类符合率最高。
具体可以为:
3(a)以测井特征信号组的小波基函数的参数组合确定优化变量,对小波基函数的可调参数确定取值范围,并进行离散和编码,得到优化变量的搜索空间;优化的目标函数设为储层含气性识别符合率;
可选用的15种小波基函数分别是:Haar、Daubechies、Biorthogonal、Coiflets、Symlets、Morlet、Mexican Hat、Meyer、Gaus、Dmeyer ReverseBior、Cgau、Cmor、Fbsp、Shan,可根据支撑长度、滤波器长度、消失矩阶数等参数进行细分,但情况不一。例如,Daubechies、Biorthogonal、Coiflets、Symlets等小波基函数可根据支撑长度、滤波器长度、消失矩阶数等参数(可取大于零的整数值)进行细分,Morlet、Mexican Hat、Meyer等小波(基函数)可根据滤波器长度(可取连续实数值)进行细分,Haar小波只有一种,不可再细分,等等。
确定优化变量:针对具有N条信号的测井特征信号组,以15种小波基函数的可调参数(支撑长度、滤波器长度和消失矩阶数等)综合确定出优化变量,优化变量维数为:
其中Ci为第i种小波基函数的可调参数数量;
离散:对优化变量在其取值范围内进行离散,整数参数步长为1,实数参数需根据参数情况确定步长,从而得到优化变量的搜索空间If;
编码:对优化变量离散点位置进行二进制编码,表1列出了搜索空间离散时的取值间隔及对应的编码位数,每个测井信号的所有码对应一个基因,N个基因组成1个染色体,也就是1个个体;
表1.优化变量搜索空间
优化的目标函数设为储层含气性识别符合率,构造目标函数如下:
其中,ICR为目标函数,SWi为第i条测井信号的小波基函数优选参数范围,1≦i≦N,N为测井信号数。
需要求解的优化问题即是在优化变量的搜索空间If内求解一组小波基函数的参数组合使得目标函数值达到最大;
3(b)在优化变量的搜索空间范围内随机生成初始种群,即测井特征信号组中N条信号的15种小波基函数的参数组合;
3(c)采用种群中每1个个体(即不同参数组合的小波基函数)分别对训练集中的每1个样本中的测井特征信号组实施小波分解,得到小波分解能量谱特征矩阵;
具体实现为:测井信号f(t)的小波变换Wf(a,b)为:
其中,
是小波基函数,
表示
的共轭运算,a是尺度因子,b是平移因子。通过逐渐改变尺度因子和平移因子,得到在不同因子下的小波系数。可设a=2
j,j=1,2,…,J,J为分解尺度,b=k,k=1,2,…,K
j,K
j为尺度j下信号小波分解长度,从而采用正交二进小波变换对测井信号f(t)进行小波分解:
其中,
与
分别是尺度空间V
j和小波空间W
j的标准正交基,c
j,k和d
j,k分别是信号在尺度j的第k个平滑逼近系数和细节小波系数,使用Mallet算法进行快速小波分解便可以逐尺度得到细节小波系数:
即j尺度空间的cj,k和dj,k可由j-1尺度空间的cj-1,k和dj-1,k经滤波器系数h和g进行加权求和得到,进而可将尺度空间Vj继续分解,一直到尺度空间VJ。由此得到:
其中,夈j是j尺度下信号的小波能量,Kj是信号小波分解长度,dj,k是j尺度下的第k个细节小波系数,J为信号分解尺度。
对N条测井信号分别进行J个尺度的小波分解可获得小波能量谱特征矩阵:
其中夈i,n表示第n条测井信号的第j个尺度的小波能量,1≦n≦N,1≦i≦J。
3(d)以小波分解能量谱特征矩阵作为输入,实际储层样本实际试气结果为输出,进行支持向量机分类模型的训练,得到最优分类超平面;
具体实现包括如下步骤:
Step1:定义训练集为(TR)M,M为样本数,对样本trm,m=1,2,...,M的N条测井信号分别进行小波分解得到小波分解能量谱组成的特征矩阵,即:
其中,
将样本trm对应的特征矩阵展开为长度是J*N的一维向量Xm,
Step2:将一维向量Xm作为输入,采用基于核的支持向量机,选择合适的核函数,在训练集上进行支持向量机分类模型的训练,得到一个最优分类超平面,用于测试集样本符合率的计算;
这里Xm对应的实际输出为Ym,Ym∈{+1,-1},则样本trm=(Xm,Ym),其中+1为气层,-1为非气层;通过一维向量Xm对应的最优分类超平面计算的结果与一维向量Xm对应的实际输出Ym两者的符合情况用于确定储层含气性识别符合率;
3(e)使用最优分类超平面计算测试集样本符合率,即当前个体下的目标函数值;遍历整个测试集样本,计算种群中所有个体的目标函数值的平均值;
3(f)给定一个小的阈值,判断本代种群的小波基函数参数组合下测试集样本符合率与上一代测试集样本符合率差值是否满足小于给定阈值;
若满足,则此时储层含气性识别符合率达到最大,终止计算,同时得到训练集样本符合率最大时对应的小波基函数参数的最佳组合以及相对应的最佳支持向量机分类模型,进入步骤4;
若不满足,则使用自适应遗传算法确定的交叉概率和变异概率生成下一代种群,返回步骤3(c)继续进行;
步骤4、得到小波基函数参数的最佳组合以及相对应的最佳支持向量机分类模型;将最佳支持向量机分类模型用于新的储层进行含气性识别。
在步骤3(c)中采用自适应遗传算法,其优势在于根据适应度值的变化动态调整交叉概率Pc和变异概率Pm;根据适应度值的变化动态调整交叉概率和变异概率,比标准遗传算法更快速、准确地得到最优解。
标准遗传算法先将待优化问题的参数编码成二进制位串的形式,然后由若干个位串形成一个初始种群作为待优化问题的候选解,在优化迭代过程中使用选择、交叉和变异算子进行操作,直到找到最优解为止。多信号小波基函数参数组合的优选问题中优化变量较多、搜索空间大,且包括连续变量和离散变量,使得标准遗传算法在应用中容易陷入局部最优解从而引发早熟,特别是在处理多峰值适应度函数时,无法保证算法以概率1收敛到全局最优解。
而自适应遗传算法,在算法初期,种群具有较好的多样性,因此选取较小的交叉概率和变异概率,可保证优化过程的连续性;在算法后期,种群的多样性将会被抑制,应选择较大的交叉概率与变异概率,以维持种群的多样性,防止发生算法的搜索停滞。同时,对高于种群平均适应度的个体,应采用较低的交叉概率与变异概率,从而使得这些解尽量被保护而进入下一代;反之,对于低于种群平均适应度的个体,可以采用较大的交叉概率与变异概率,从而使得这些解容易被淘汰掉。
自适应遗传算法的交叉概率Pc和变异概率Pm的计算过程如下:
设X(t)为第t代种群,Xi(t)为第i个个体,i=1,2,3,…,N,N为种群规模。若每个个体的编码字符串长度为L,则Xi(t)的第k位基因可表示为xik(t),Xj(t)的第k位基因可表示为xjk(t),k=1,2,3,…,L。个体Xi(t)与个体Xj(t)之间的海明距离定义为:
第t代种群X(t)的平均海明距离定义为:
则种群X(t)的多样性度量函数D(t)定义为:
D(t)=Havg(t)/L (3-13),
研究表明,当算法种群具有较好的多样性时,则D(t)值就相对较大;而当种群的多样性较差时,则D(t)值较小,因此采用度量函数D(t)表征种群多样性的大小,进而可得到第t代种群交叉概率Pc和变异概率Pm:
其中,favg是种群的平均适应度值,fmax是种群中的最大个体适应度值,f是待交叉的两个个体中适应度较大值,Pc1最高的交叉概率和Pc2为最低的交叉概率,Pm1和Pm2分别为最高和最低的变异概率。
以下是本发明所述方法在某实际场景中的具体应用。
鄂尔多斯盆地中部二叠系发育一套完整的致密砂岩气藏,沉积环境包括湖泊相和河流相,岩性复杂,孔隙度为3%-13%,渗透率为0.04mD-2.00mD,2019年以前共试气228井399层,其中225层试气产量超10000m3属于高产层,123层产气量不足10000m3属于低产层,51层为无气层。2019年新试气层数79层,拟采用2019年之前的试气层测井数据及试气结果为训练样本,训练出最佳的支持向量机分类模型,对2019年的79层试气结果进行预测和验证。
初步筛选出自然伽马、密度、中子、深侧向电阻率这4条测井曲线作为特征信号组;
将实际储层样本集(共399层,包括气层348层、无气层51层)按照8:2的比例分成训练集(319层)和测试集(80层);
初始种群个体数设为500,小波分解尺度设为10,对每1个样本经过每个个体(不同参数组合的小波分解)得到1个10行4列的小波能量谱特征矩阵,最终得到500种训练集和测试集小波能量谱特征矩阵的组合,每一种组合中特征矩阵的数量与训练集(319层)和测试集(80层)大小相同;
对每1种训练集和测试集小波能量谱特征矩阵组合,进行支持向量机分类模型的训练,核函数选用高斯函数,最终得到500个支持向量机最优分类超平面;
设定优化阈值为0.01%,即本代种群与上一代种群得出的目标函数值的差值小于0.01%的时候,算法收敛停止;
经过自适应遗传算法,迭代43次后误差0.01%,在300次内稳定,如图2,认为算法收敛,计算测试集符合率为98.75%,即80层测试集中有79层识别正确,此时最佳参数组合的小波基函数分别是haar、db-2、symlets-4、coiflets-3,分别作为自然伽马、密度、中子、深侧向电阻率这4条测井曲线的小波分解的基函数,并同时得到最佳支持向量机分类模型;
使用最佳参数组合的小波基函数及最佳支持向量机分类模型对2019年的79层新的储层进行识别,结果见表2。
表2三种方法结果对比
表2中包含了采用本方法识别的结果,同时也给出了用目前最常使用的两种方法对储层进行识别的结果,并放在一起进行比较,由表2可见,测井综合解释方法准确率为81.01%,只用深侧向电阻率曲线进行小波分解的识别方法的准确率为74.68%,本专利方法识别气层准确率为92.41%,可见本专利方法的优越性。
以上所述为本发明的实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书以及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。