CN117216676A - 一种基于钻进碎岩过程声振信号特征实时预测岩性的方法和系统 - Google Patents

一种基于钻进碎岩过程声振信号特征实时预测岩性的方法和系统 Download PDF

Info

Publication number
CN117216676A
CN117216676A CN202310799393.6A CN202310799393A CN117216676A CN 117216676 A CN117216676 A CN 117216676A CN 202310799393 A CN202310799393 A CN 202310799393A CN 117216676 A CN117216676 A CN 117216676A
Authority
CN
China
Prior art keywords
model
drilling
frequency
lithology
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310799393.6A
Other languages
English (en)
Inventor
王胜
张拯
柏君
赖昆
张洁
李冰乐
王文杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengdu Univeristy of Technology
Original Assignee
Chengdu Univeristy of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chengdu Univeristy of Technology filed Critical Chengdu Univeristy of Technology
Priority to CN202310799393.6A priority Critical patent/CN117216676A/zh
Publication of CN117216676A publication Critical patent/CN117216676A/zh
Pending legal-status Critical Current

Links

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T90/00Enabling technologies or technologies with a potential or indirect contribution to GHG emissions mitigation

Landscapes

  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Abstract

本发明提供了一种基于钻进碎岩过程声振信号特征实时预测岩性的方法和系统,属于钻探技术领域,本发明通过分析声振信号中含有的岩性特征与钻进状态特征,结合深度学习卷积神经网络,构建了基于声振信号的岩性识别模型,并对模型的决策进行了解释,又针对各个模型识别岩性能力不同的情况,结合模型共同决策的思想,提供了一种多模型集成学习的岩性智能识别方法及其系统。

Description

一种基于钻进碎岩过程声振信号特征实时预测岩性的方法和 系统
技术领域
本发明属于钻探技术领域,具体涉及一种基于钻进碎岩过程声振信号特征实时预测岩性的方法和系统。
背景技术
地质勘探是经济社会的发展基础之一,它对我国经济发展具有重要意义。钻探作为地质勘探中应用广泛且可靠的勘探技术,它可以直接获取区域内的地质实体样本,但当前钻探施工面临着工程环境恶劣、地质条件复杂、钻进效率不足等问题,钻探技术亟需加快发展以满足工程需求。
智能钻探技术是当前钻探技术的主要发展方向,它将人工智能与钻探技术进行结合,从而智能优化钻进参数、控制钻孔轨迹、识别钻探风险,最终提高钻进进效率、降低施工成本。而发展智能钻探技术,离不开对岩性识别技术的研究。钻探领域传统的岩性识别方法以分析岩芯或岩屑为主,是由技术人员凭借经验辅以物理或化学手段判断岩芯岩性,这种岩性识别方法不仅存在主观性而且具有很大的滞后性。随钻岩性识别可以实现钻探过程中实时识别钻头处的岩性,这直接为勘探作业提供了地质资料成果,此外以地层岩性为依据还可以及时优选钻头类型、优化钻进参数和控制钻孔轨迹,从而提高钻进效率。
随钻岩性识别技术的研究主要基于随钻测量和随钻测井数据,随钻测量与随钻测井主要采集钻压、扭矩和转速等钻进参数,以及电阻率、自然伽马和中子密度等岩石物理信息。使用这些随钻信息识别地层岩性已经取得一定成效,但随着当前钻探面临的地质条件越来越复杂,随钻岩性识别技术对数据可采集性、数据可获取量、岩性识别及时性提等出了更高的要求,常规的随钻信息已然难以满足需求。
声振信号具有传播性能好、数据特征丰富等特性,在钻进过程中,岩石在与钻头的相互作用下发生破碎,在破碎过程中激发的声振信号含有岩性特征信息。因此,研究基于声振信号的随钻岩性识别技术无疑具有十分重要的价值,这对提高钻探技术水平意义重大,有利于为解决工程问题提供参考与依据。
虽然基于声振信号的岩性识别方法开始受到学者们的关注,但有关研究较少。当前研究主要是从声音或振动单一角度分析对比信号特征进而人为区分岩性,鲜有构建岩性识别模型。即使在部分已构建岩性识别模型的研究中,模型准确率与泛化性较低,且未考虑声音信号与振动信号的综合特征信息。
发明内容
本发明的目的在于提供一种基于钻进碎岩过程声振信号特征实时预测岩性的方法和系统。
本发明提供了一种基于钻进碎岩过程声振信号特征实时预测岩性模型的构建方法,它包括如下步骤:
1)获得钻进碎岩的声音信号和振动信号,振动信号包括x轴振动信号、y轴振动信号和z轴振动信号;
2)将前述声音信号、振动信号分别进行预处理,预处理包括预加重、小波阈值降噪、带通滤波和时频域分析,得到声音信号、x轴振动信号、y轴振动信号和z轴振动信号的时频图像;
3)在AlexNet的基础上加入CBAM注意力机制和残差结构,搭建出AlexNet-RCBAM卷积神经网络,以步骤2)得到的时频图像为数据集,进行数据增强,拆分数据集,输入AlexNet-RCBAM卷积神经网络,进行训练,调优,构建出声音、x轴振动、y轴振动、z轴振动四个信号的基础模型;
4)将步骤3)的四个基础模型进行集成,得到集成模型。
步骤2)中,所述预加重是用一阶FIR高通滤波器将声振信号进行滤波处理,该滤波器z域的传递函数如下式:
H(z)=1-az-1 (公式1)
式中,a为预加重系数,通常取值范围为0.9<a<1,优选a=0.95;
和/或,步骤2)中,所述小波阈值降噪选择Sym8小波基函数进行滤波降噪,分解层数为9层,阈值量化方法以软硬折中阈值函数处理小波系数,公式如下:
式中,wj为第j层的小波系数;wjn为第j层阈值函数处理后的小波系数;α∈[0,1],取α=0.5;T为阈值,计算公式如下:
式中,w1为第一层的小波系数;N为信号的长度;
和/或,步骤2)中,所述带通滤波处理是以六阶巴特沃斯带通滤波器过滤声振信号,其z域的传递函数如下式:
式中,a(m)和b(n)为系数向量;N为带通滤波的阶数;
其中,处理声音信号的带通滤波器的下限频率100Hz、上限频率20000Hz;处理振动信号的带通滤波器以及下限频率3000Hz、上限频率10000Hz;
和/或,步骤2)中,所述时频域分析采用STFT进行时频分析:分析时选择窗长为NFFT的海明窗w(n)对原始信号x(n)截取,并对加窗后的信号进行傅里叶变换,之后每次将窗口移动Hop Size的长度,同时使两相邻窗口以Overlap的长度重叠,并在加窗后继续进行傅里叶变换,最后得到一个二维矩阵S(ω,τ),计算公式如下:
由于声振信号属于功率信号,应以功率谱密度衡量其能量大小,故相应时间和频率下的幅值S(ω,τ)应转换为功率谱密度P(ω,τ),计算公式如下:
式中,fr为频率分辨率;fs为采样率;NFFT为海明窗的窗长;
优选地,分析窗长NFFT分别为512、1024或2048。
步骤3)中,所述数据增强是采用色彩抖动、噪声扰动和模糊处理三种方法依次处理。
步骤3)中,所述训练和调优是基于Tensorflow架构进行训练和调优;所述调优是调优超参数,调整对象包括权重初始化方式、学习率衰减策略、学习率衰减因子、学习率和迭代次数。
步骤4)中,以加权平均法进行集成,加权方式为基分类器输出类概率加权,以均方倒数法分配权重;
优选地,AlexNet-RCBAM网络输出的向量经过Softmax函数处理即转换为每个类别对应的概率,如下式:
式中,n为识别任务对象数量;ai为输入Softmax的向量的第i个元素;pi为模型识别数据为第i类的概率;
以加权调和平均数FR综合基分类器上的查准率与查全率,其计算公式如下:
式中,P为查准率;R为查全率;β为P与R之间的权重。
FR值表示了基分类器准确识别某类岩性的能力,因此1-FR的值则可表示相对于完美识别时的预测误差,基于误差大应赋值小权重而误差小则赋值大权重的原则,以均方倒数法的方式分配权重,计算公式如下:
式中,Fβij为第j个基分类器识别第i类对象的加权调和平均数;Wij为第j个基分类器识别第i类对象时分配的权重,且满足
集成后强分类器识别数据为第i类的概率为Pwi=Wi1pi1+Wi2pi2+…+Wimpim
进一步优选地,β选自1.0或1.5时。
本发明还提供了所述方法构建得到的基于钻进碎岩过程声振信号特征实时预测岩性模型。
本发明还提供了一种基于钻进碎岩过程声振信号特征实时预测岩性的系统,它包括:
输入模块,用于输入声音信号和振动信号,振动信号包括x轴振动信号、y轴振动信号和z轴振动信号;
计算模块,按照实现权利要求1~5任意一项方法构建的模型模块和根据所述输入模块的信息计算得到最终的岩体特征的预测结果;
输出模块,用于输出最终的岩体特征预测结果。
本发明还提供了一种基于钻进碎岩过程声振信号特征实时预测岩性的方法,步骤如下:
(1)获得待检钻进碎岩的声音信号和振动信号,振动信号包括x轴振动信号、y轴振动信号和z轴振动信号;
(2)将前述声音信号、振动信号分别进行预处理,预处理包括预加重、小波阈值降噪、带通滤波和时频域分析,得到声音信号、x轴振动信号、y轴振动信号和z轴振动信号的时频图像;
(3)将步骤2)得到的时频图像输入权利要求1~5任意一项方法构建的模型,比较得出结论。
本发明还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序用于实现权利要求9所述的钻进碎岩过程声振信号特征实时预测岩性预测方法。
实验结果表明本发明实时收集了钻进碎岩中声振信号的采集方式以及七类岩性的基本信息,接着分析了转速、钻速、钻头直径和钻孔深度对试验设备与钻进过程的影响,为提高后续模型的泛化性,在三因素三水平的全面试验下钻进七类岩石并采集声振信号。
本发明采用对所测信号进行了预加重以补偿高频段的能量损耗,进行了小波阈值降噪和带通滤波以过滤设备内部噪声和环境噪声,降低了声振信号在空气、岩石中传播时以及在仪器采集传输过程中,其高频段会受到严重的能量损耗,且最终所测信号中含有环境噪声、电路缺陷和信号传输产生的噪声等,提高了信号处理与分析时的可靠度和准确性。
本发明系统地分析声振信号的岩性特征与钻进状态特征。本发明以七类岩性为对象,设计多因素多水平的全面实验采集各种条件下的声振信号,从时域角度以时域特征参数分析岩性特征和钻进状态特征,从频域角度以功率谱密度等信息进一步分析岩性特征和钻进状态特征,最后通过时频分析生成特征信息丰富的时频图像以满足模型构建所需。
本发明构建各信号方向上的基分类器并结合为具有高准确率强泛化性的集成模型。本发明搭建用于岩性识别的卷积神经网络,在各信号方向上以深度学习的方式构建基分类器并解释决策依据,确定基分类器结合策略后,通过集成学习综合基分类器的决策实现岩性特征互补,可有效提升集成模型的准确率与泛化性。
显然,根据本发明的上述内容,按照本领域的普通技术知识和惯用手段,在不脱离本发明上述基本技术思想前提下,还可以做出其它多种形式的修改、替换或变更。
以下通过实施例形式的具体实施方式,对本发明的上述内容再作进一步的详细说明。但不应将此理解为本发明上述主题的范围仅限于以下的实例。凡基于本发明上述内容所实现的技术均属于本发明的范围。
附图说明
图1为钻进碎岩声振信号采集系统
图2为声音聚焦装置
图3为钻进碎岩岩石试样
图4影响因素的主要作用
图5一阶FIR高通滤波器幅频和相频特性
图6预加重前后的时域声振信号
图7小波阈值降噪前后的时域声振信号
图8巴特沃斯带通滤波器的幅频特性和相频特性
图9带通滤波前后的时域声振信号
图10时频分析过程
图11不同窗口长度下的时频图
图12三维与二维时频图像
图13七类岩性的声振信号时频图(注:钻进条件为钻头直径30mm、转速400RPM、钻速3mm/min、钻孔深度20mm)
图14人工神经网络结构图
图15卷积神经网络结构
图16卷积层与池化层
图17全连接层
图18CBAM注意力机制
图19残差结构
图20AlexNet-RCBAM网络结构
图21岩性识别模型构建流程
图22时频图像数据增强:(a)花岗岩声音时频图像;(b)色彩抖动;(c)噪声扰动;(d)模糊处理
图23各类情况下模型训练的损失值与准确率变化:(a)学习率1×10-4、Batch_size256;(b)学习率1×10-4、Batch_size128;(c)学习率1×10-4、Batch_size64;(d)学习率5×10-5、Batch_size256;(e)学习率5×10-5、Batch_size128;(f)学习率5×10-5、Batch_size64
图24模型在振动数据集上训练时的损失值与准确率变化:(a)基于x轴数据集训练;(b)基于y轴数据集训练;(c)基于z轴数据集训练
图25测试集在对应模型上预测的混淆矩阵:(a)基于声音信号的模型识别效果;(b)基于x轴振动信号的模型识别效果;(c)基于y轴振动信号的模型识别效果;(d)基于z轴振动信号的模型识别效果
图26融合概率加权机制的EM-AlexNet-RCBAM集成模型
图27各β取值时的EM-AlexNet-RCBAM集成模型性能表现
图28钻孔岩性预测情况
具体实施方式
本发明所用原料与设备均为已知产品,通过购买市售产品所得。
实施例1、
一、声振信号的采集与预处理
(一)声振信号采集系统
本发明使用钻进碎岩基于微钻试验台,其型号为ZK5040BS/2型立式数控钻机,用于分析钻进因素对模型性能的影响。
试验过程中,微钻试验台的电机驱动钻杆以设定转速回转,钻杆的回转带动底部孕镶金刚石钻头回转。与此同时,钻头在给进机构的驱使下切入岩石,在岩石内以回转钻进的方式钻进到指定深度,整个钻进过程中由冷却系统的喷嘴喷射清水实现钻头的冷却和孔内岩屑的清除。钻头破碎岩石时,振动和声音信号分别通过预先安装好的加速度传感器和传声器采集,并由数据采集卡的A/D变换将模拟信号转换为数字信号后,保存数据至上位机。
钻进碎岩声振信号采集系统如图1所示。
钻进时岩石的振动具有空间随机性,为完整采集碎岩振动信号,传感器为三轴加速度传感器,其量程范围为50g,灵敏度为95.528mV/g,响应频率为20~10000Hz,采集振动信号时钻头回转方向为x轴和y轴,钻杆给进方向为z轴。对于碎岩声音信号的采集,所选传声器动态范围为16~140dB,灵敏度为51.28mV/Pa,响应频率为10~20000Hz,同时传声器还配备有前置放大器以进行阻抗变换和前置放大。由于声音信号易受噪声干扰,故除传声器与前置放大器外,设计了一个声音聚焦装置。声波反射遵从反射定律,当入射声波接触凹形抛物线界面时声波产生反射并形成声聚焦,因此在采集信号时,将声音聚焦装置贴合在岩石表面,使声音信号在装置内聚焦并由传声器采集,这种采集方式可降低环境噪声的干扰以提高信噪比,声音聚焦装置如图2所示。
连接传感器的数据采集卡为四通道,分别用于接收来自四根传感器线缆的模拟信号。基于奈奎斯特采样定律,数据采集卡的采样频率设置为51200Hz。
(二)岩石基本信息
本发明岩性智能识别方法的研究以大理岩、泥灰岩、石灰岩、石英砂岩、花岗岩、长石砂岩和页岩共七类岩性为识别对象,每类岩性的信息如表1所示。
表1各类岩性的基本信息
根据成因不同,七类岩性中有属于沉积岩的泥灰岩、石灰岩、石英砂岩、长石砂岩和页岩,以及分别属于岩浆岩与变质岩的花岗岩和大理岩。在此之中,有些岩性具有相同的矿物类型,而有些岩性的矿物组成差异显著。除主要矿物外,岩性的岩石力学参数也各不相同,泥灰岩、石灰岩和页岩具有最大的抗压强度和抗拉强度,且三者的数值较为接近;大理岩和花岗岩的抗压强度和抗拉强度其水平居中,二者数值极为接近;而石英砂岩和长石砂岩的抗压强度和抗拉强度明显偏低。因而,此七类岩性具有相似处也有差异点,对于研究岩性智能识别方法具有一定的意义。
为使微钻试验台稳固夹持试样减小相对振动,每类岩石试样的尺寸加工为20cm×20cm×10cm,如图3所示。
(三)钻进试验设计
钻头与岩石的相互作用是个复杂的力学过程,而声音和振动是在这个过程中激发出的物理信息,因此声振信号是搭载综合信息的载体。在采集声振信号时,需要同时考虑岩性不同带来的差异,和钻进参数等因素的影响,保证本发明岩性识别模型的泛化能力。
为提高模型的泛化性,在基于微钻条件的情况下,本发明选择加入转速、钻速和钻头直径三类因素进行探究。
除转速、钻速和钻头直径三类钻进参数外,由于每类岩石的均质情况不同,矿物的分布情况也不尽相同,且随着钻头与传感器的距离改变采集条件也会受到影响,因此钻孔深度也可加入考虑,各类因素的影响如图4。
对钻头直径、转速和钻速每类因素设置三个水平,在3×3×3的全面试验中钻进每类岩石并采集相应的声振信号。钻孔深度将在钻头破碎岩石时随时间不断加深,因此该因素无需特意设置不同的水平组,但为了采集到钻头吃入和稳定钻进时的声振信号以使声振信号具有代表性,基于试验所用钻头的高度为10mm的情况,设置钻孔的最终深度为20mm,后续特征分析以不同孔深处的声振信号对比分析。钻进试验方案的设计如表2所示。
表2每类岩性各因素的水平设计
每类岩性设计了27个试验组别,在多个组别下采集声振信号不仅可以有效增加模型构建所需的样本,其数据的多样性还能提高模型的泛化性。
(四)信号滤波降噪(预处理)
按照前述步骤获得声振信号,具体是声音信号和振动信号,振动信号包括x轴振动信号、y轴振动信号和z轴振动信号,分别进行预处理,预处理具体是依次采用预加重、小波阈值降噪、带通滤波和时频域分析进行预处理。
1、预加重
预加重对噪声不会产生影响,因此补偿高频分量可有效提高信号信噪比。预加重可用一阶FIR高通滤波器将声振信号进行滤波处理,该滤波器z域的传递函数如下式:
H(z)=1-az-1 (公式1)
式中,a为预加重系数,通常取值范围为0.9<a<1,为方便后续分析声振信号的特征信息取a=0.95,此滤波器的幅频特性与相频特性如图5所示,滤波器处理前后的一段时域声振信号效果如图6所示。
2、小波阈值降噪
本发明小波阈值降噪选择Sym8小波基函数用于声振信号的滤波降噪,分解层数为9层;
在阈值量化方法上,以软硬折中阈值函数处理小波系数,公式如下:
式中,wj为第j层的小波系数;wjn为第j层阈值函数处理后的小波系数;α∈[0,1],取α=0.5;T为阈值,计算公式如下:
式中,w1为第一层的小波系数;N为信号的长度。
每层的小波系数经阈值处理后将信号重构,小波阈值降噪前后的时域声振信号如图7所示。
3、带通滤波
本发明设计下限频率100Hz、上限频率20000Hz的带通滤波器以及下限频率3000Hz、上限频率10000Hz的带通滤波器分别处理声音信号和振动信号。
以六阶巴特沃斯带通滤波器过滤声振信号,其z域的传递函数如下式:
式中,a(m)和b(n)为系数向量;N为带通滤波的阶数。
两个带通滤波器的幅频特性与相频特性如图8所示,带通滤波前后的时域声振信号如图9所示。
4、时频域分析
本发明采用以时间-频率-功率三个物理量结合的方式描述信号,即时频分析。
1)时频分析方法
本发明采用短时傅里叶变换(STFT)进行时频分析并优选分辨率较好的时频图。
本发明时频分析过程如图10,本发明选择窗长为NFFT的海明窗w(n)对原始信号x(n)截取,并对加窗后的信号进行傅里叶变换,之后每次将窗口移动Hop Size的长度,同时使两相邻窗口以Overlap的长度重叠,并在加窗后继续进行傅里叶变换,最后得到一个二维矩阵s(ω,τ),来减小频谱泄露和吉布斯现象,其每列向量代表对应窗口下的频谱,计算公式如下:
由于声振信号属于功率信号,应以功率谱密度衡量其能量大小,故相应时间和频率下的幅值S(ω,τ)应转换为功率谱密度p(ω,τ),计算公式如下:
式中,fr为频率分辨率;fs为采样率;NFFT为海明窗的窗长。
因STFT存在时间分辨率和频率分辨率难以同时兼顾的问题,为满足岩性识别的需求,对比分析窗长NFFT分别为512、1024和2048时所得时频图的显示效果,如图11所示。由图可知,当NFFT为512时,由于窗口过小使频率分辨率偏低,时频图上出现了沿频率方向的条纹,图像整体显示效果撕裂;当NFFT为2048时,由于窗口过大使时间分辨率偏低,时频图显示出沿时间方向的像素格,图像整体显示效果模糊。综合来看,NFFT为1024的时频图上对应频率和时间下的功率谱密度显示清晰,其时间分辨率和频率分辨率具有较好的综合表现。
2)声振信号时频图像
时频图可形象解释为由代表时间、频率和功率谱密度的三维空间沿竖直方向投影在水平面上所得,并由颜色深浅代表功率谱密度的数值大小,如图12。时频图从信号时频域的角度表现了频率随时间变化的关系,同时展现了对应频率和时间下的功率谱密度,可同时搭载时域和频域的信息。
由图可知,时频图沿频率方向的颜色变化与频域分析所得功率谱密度图的曲线变化完全吻合,且沿时间方向的颜色变化与时域信号波形的走势也十分一致,因此本发明以时频图为对象提取特征可以更完整的反映钻进状态与岩性。
图13为特定钻进条件时的七类岩性声振信号时频图。由时频图可知七类岩性声振信号的主频分布和功率大小等各不相同,具备识别岩性的条件,但时频图所含特征信息冗杂,人为提取难以发挥数据特征优势且具有主观性,使用深度学习处理非结构化的图像数据能更好地完成岩性识别任务。
二、基于深度学习的岩性识别模型研究
(一)搭建神经网络模型
1、深度学习基本原理
深度学习是神经网络的特殊形式,其基本模型框架基于人工神经网络(Artificial Neural Network,ANN)。ANN启发于人类大脑结构,模拟了生物神经系统对复杂信息的处理机制,具有强大的学习能力。ANN的结构如图14所示,其为高度复杂的非线性模型,由大量相互连接的神经元构成,结构上分为输入层、隐藏层和输出层。
ANN通过前向传播将上一层信息传向下一层,图中各个节点皆为神经元,两个神经元之间的连接代表权重。信息输入ANN后,每个神经元接受来自上层神经元的刺激,在权重ωn决定刺激强度和偏置b决定激活能力后,由激活函数function输出信息Z并继续传向下一层,计算公式如下:
Z=function(ω1a12a2+…+ωnan+b) (公式7)
经多个隐藏层神经元传递信息后,信息特征被充分提取,输出层给出最终预测。由于网络训练时常通过随机权重初始化神经网络,故ANN给出的最终预测与真实情况之间存在一定差异,差异的大小由损失函数度量。本发明通过反向传播法将误差反向传递,逐层求出神经元的偏导数以调整权重,使损失函数收敛到局部最小值。因此,ANN通过前向传播学习特征给出预测,同时通过反向传播调整网络权重提高模型准确率,从而使在整个训练集上的平均损失函数最小。
ANN以隐藏层神经元分解特征,通过组合低层特征表示更高层级的复杂特征,具有优秀的学习能力和智能水平。
2、卷积神经网络结构
卷积神经网络(Convolutional Neural Networks,CNN)是在处理图像任务上具有优越性能表现的深度学习的代表算法之一。CNN的结构同样由输入层、隐藏层和输出层组成,其中隐藏层包含卷积层、池化层和全连接层,如图15所示。
经典神经网络传递信息基于全连接模式,即下一层的任意神经元和上一层的每个神经元进行连接,并由对应权重决定连接强度。当网络结构复杂时,经典神经网络的连接参数量将会十分庞大,从而导致训练速度变慢、空间信息丢失和网络过拟合等问题。基于人类视觉认知模式是由局部到整体的这一特点,CNN通过卷积层与池化层的局部感受野提取局部信息,并在卷积运算时使用共享权重和共享偏置,有效降低了网络参数量。
CNN的信息提取过程如图16所示,输入数据的局部感受野与卷积核相乘后由激活函数function激活得到一个数值,然后依次将其位置移动指定步数继续卷积与激活,便得到由多个数值组成的输出特征图B。整个卷积过程实现了输入数据层A到下一层B的特征映射,映射的权重ω和偏置b为共享权重和共享偏置,卷积过程计算如下:
经过特征映射后的输出特征图的尺寸计算如下式:
式中,As为0或1,分别代表长和宽方向;S为感受野移动步数;D为输入数据尺寸;K为卷积核大小;Pad为输入数据填充大小;D′为输出特征图尺寸。
为减小过拟合、提高模型鲁棒性,卷积后的特征图B需进行池化处理,以降低数据维度和减少参数量。池化处理方式主要分为平均池化和最大池化,处理时以局部感受野为对象,依次移动指定步数并计算范围内数据的平均值或选择最大值,最后得到特征降维后的输出特征图C。
卷积层和池化层提取的局部信息将在全连接层处综合成整体信息,如图17所示。全连接层采用全连接的方式进行特征映射,其每个神经元都与上一层的所有神经元连接,每个连接都有对应权重,因此全连接层是在整个网络中参数最多的层位。全连接层神经元输出的特征信息重复性极高,使得模型在训练时十分容易过拟合,随机失活函数dropout可使部分神经元的激活函数停止工作(如图中虚线部分),从而降低神经元之间的重复性,提高模型的泛化性。
CNN以前向传播学习特征,在网络输出层计算损失函数,并反向传播误差计算偏导数以更新权重,从而实现网络在特征学习与权重调整的过程中训练模型至拟合。
3、网络搭建
CNN训练岩性识别模型时,时频图像所载的特征信息由隐藏层神经元提取,故神经网络的表达能力直接影响模型的准确率与泛化性。搭建CNN网络时,为提高模型准确率与泛化性、加快模型训练速度,且防止模型易于过拟合,选择以AlexNet为主体,并加入CBAM注意力机制和残差结构。
1)CBAM注意力机制
在人类的视觉注意力机制中,视觉会锁定全局图像中的局部目标投入更多注意力资源以获取细节信息,这种聚焦目标处而忽略其它的机制高效利用了有限的注意力资源,提高了人类大脑对视觉信息的分析效率。在深度学习领域,神经网络的表达能力取决于隐藏层神经元的个数,隐藏层神经元越多神经网络的表达能力越强,随之模型需要储存的信息也越多,故而容易造成信息过载。但网络输入数据其重要性不尽相同,通过加入注意力机制可以使神经网络聚焦数据中的关键信息,从而解决信息过载,并提高网络计算效率和增强模型表达能力。
注意力机制CBAM可以加入任意卷积层中,具有极高的可移植性,其结构由通道注意力模块(Channel attention module,CAM)和空间注意力模块(Spatial AttentionModule,SAM)组成,加入岩性识别模型训练网络的CBAM具体结构如图18。
神经网络卷积层输出的特征图M首先由CAM分析重要特征在通道维度上的分布。在此过程中,尺寸为H×W×C的特征图M沿高度H和宽度W方向分别通过Maxpool和Avgpool的方式池化为两个1×1×C的特征图。特征图分别输入所构建的深度为两层且神经元数量为C/4和C的全连接神经网络MLP,分析特征图的通道权重,输出的两个特征图相加并由函数F激活后得到Wc,Wc再与原特征图M相乘后得到CAM输出特征图M',计算过程如下式:
Wc=F(MLP(Maxpool(M))+MLP(Avgpool(M))) (公式10)
CAM输出特征图M'接着由SAM分析重要特征在空间维度上的分布。特征图M'沿通道C方向分别通过Maxpool和Avapool的方式池化为两个H×W×1的特征图,经过Concat方法拼接为H×W×2的特征图后,以7×7的卷积核降维并激活得到Ws,Ws最终与特征图M'相乘得到CBAM输出特征图M",计算过程如下式:
Ws=F(f7×7([Maxpool(M');Avgpool(M')])) (公式12)
2)残差结构
神经网络理论上深度越深则表达能力也越好,但在实际情况中神经网络的深度越深,训练难度将会变大,网络也更容易退化。同时,网络过深也会导致梯度消失和梯度爆炸等问题,即在误差反向传播时,神经网络输入附近的网络层权重难以更新或新权重过大。为解决此类问题,可以在神经网络中加入恒等映射(输入与输出相等)的网络层,但实际处理时并非直接训练网络层至恒等映射,而是通过残差结构的方式间接实现恒等映射。
为训练岩性识别模型所设置的残差结构如图19,输入特征图M经过两层3×3的卷积处理后得到特征图M',原特征图M通过快捷连接直接与特征图M'相加并激活,最后得到输出特征图M"。残差结构的分析过程可反映为M"=M+M',过程中残差函数M'=M"-M不断学习并逼近于0,最终实现输入特征图M和输出特征图M"的恒等映射。综合来看,残差结构一方面加深了神经网络深度以提高模型表达能力,另一方面训练网络层至恒等映射,防止了网络退化、梯度消失和梯度爆炸等问题。
3)AlexNet-RCBAM网络结构
AlexNet是2012年提出的深度卷积神经网络,它的出现是计算机视觉发展的重要里程碑。AlexNet使用Relu激活函数加快网络训练和防止梯度消失,使用LRN标准化提高模型泛化能力,最后在全连接层中使用Droupt避免模型过拟合,具有极佳的性能表现。考虑到声振信号时频图像信息复杂、模型泛化能力需求较大等特点,搭建网络时选择在AlexNet的基础上加入CBAM注意力机制和残差结构,以解决信息过载、梯度消失和梯度爆炸等问题,同时提升网络深度。另外,由于本发明所用显卡GeForce RTX 2060满足网络训练的资源需求,故设计基于单个GPU的网络结构。搭建的AlexNet-RCBAM网络结构如图20。
如图所示,原始时频图像输入网络前先提取B、G、R三个通道的图像,经Resize后组合成227×227×3的输入图像。AlexNet-RCBAM共有7个卷积层,每层所设卷积核的大小不尽相同,且最后3个卷积层属于残差结构;共有3个池化层,池化方式皆为Maxpool,池化核大小为3×3;共有一个CBAM模块,其中CAM模块含有两层MLP,SAM含有一层7×7卷积运算;共有三个全连接层,前两层大小为4096,最后一层大小为7,经Softmax处理后的输出向量代表时频图像属于各类岩石的可能性。AlexNet-RCBAM各层详细配置如表3。
表3AlexNet-RCBAM网络详细配置
如表所示,AlexNet-RCBAM共含有15层网络,包含参数计算的共有12层。该网络有关权重和偏置的参数量共计59556457,其中来自于全连接层的参数占总体的91.61%,而相对于加入残差结构和CBAM注意力机制前,网络的参数量仅增加了2.14%。基于AlexNet-RCBAM训练模型时由于同时进行前向传播和反向传播,模型需使用显存454MB,而输出需使用的显存取决于批处理量Batch_size,模型训练完时占用内存约227MB。因此,AlexNet-RCBAM的表达能力强,且对计算机资源的需求较小。
综上,在AlexNet的基础上加入CBAM注意力机制和残差结构,搭建出AlexNet-RCBAM卷积神经网络。
(二)模型构建
1、模型构建流程
取步骤一得到的声音信号、x轴振动信号、y轴振动信号和z轴振动信号的的时频图像构建模型。
岩性识别模型的构建基于深度学习框架Tensorflow-gpu 2.5.0,所用操作系统为Windows,CPU型号为i5-9300H,GPU型号为GeForce RTX 2060。模型构建包括数据生成、数据集构建、模型训练、模型评估四个流程,详细过程如图21所示。
2、数据集构建
1)数据增强:
声振信号经过滤波降噪和时频分析后,在声音、x轴振动、y轴振动和z轴振动四类数据上分别获得七类岩性共3780张的时频图像。与摄影图像不同,时频图像由数字信号处理得到,不会发生图像内容翻转、偏移等情况,但图像的色彩分布与清晰程度等可能会受到检测方式、仪器性能和分析手段等因素影响,故以像素变换类的方式进行数据增强。
时频图像以色彩抖动、噪声扰动和模糊处理三种方法分别进行数据增强,数据增强前后的效果如图22。进行色彩抖动时,随机调整图像的饱和度、亮度或对比度,三者分别影响图像的明亮程度、鲜艳程度和明暗对比;噪声扰动时,选择添加均值为0、方差为0.03的高斯噪声,实现在不改变原图像亮度的情况下添加噪声;模糊处理选择中值滤波的方法,滤波核大小为9×9,处理时将滤波核与像素重合处的灰度值排序,取中间值赋予像素中心处,之后不断移动滤波核并继续赋值以使图像模糊。四类数据的时频图像经过数据增强后,各自的数据集大小达到15120,数量为原始数据集的四倍,显著扩充了数据集。
2)数据拆分:
根据训练模型、调优超参数和评估模型三种用途,每类数据集都需要划分为训练集、验证集和测试集。由于在每类数据集上所构建的基分类器后续将集成为强分类器,故测试集需进一步划分为基分类器测试集和强分类器测试集,二者分别用于评估单一模型性能和集成模型性能。另外,为使同时输入强分类器的四类时频图像皆源自同一时刻的声振信号,四类数据集上划分的强分类器测试集应保证图像时刻对应。训练集、验证集、基分类器测试集和强分类器测试集划分比例为6:2:1:1,每类数据集的划分策略如表4。
表4每类数据集的划分策略
3、模型训练调优
模型训练是更新参数与调整超参数使模型性能至最优的动态过程,模型的参数通过迭代自动更新,而超参数则需在模型训练前人为设置。因此,在模型训练的过程中,调优超参数是优化模型表现的必要步骤。超参数的调整对象主要包括权重初始化方式、批处理量(Batch_size)、训练周期(epoch)、学习率、迭代次数、学习率衰减策略、学习率衰减因子。
根据神经网络的结构特点可首先确定权重初始化方式、学习率衰减策略和学习率衰减因子。模型的权重是在初始值的基础上不断迭代更新,因此权重初始化的方式影响着模型的梯度传播和收敛速度。由于AlexNet-RCBAM激活函数为非线性函数Relu,故权重初始化方式应选择Kaiming He所提出的He高斯分布,可使每层输出的激活值平均分布,以避免梯度消失,He高斯分布如下式:
式中,l为初始化权重的神经网络层位;nl为第l-1层神经元数量。
学习率衰减可以使模型在训练前期跳出局部最优解,并在后期稳定收敛。指数衰减为最常用且最有效的学习率衰减策略,衰减因子选择范围为0.96~1,本发明设置为0.96。学习率衰减基于epoch,每个epoch的学习率如下式:
α=α0×0.96Num (公式15)
式中,α为每个epoch的学习率;α0为初始学习率;Num为当前epoch的次数。
超参数Batch_size、epoch、学习率和迭代次数需以模型的实际训练效果而确定。Batch_size为每次迭代所用的训练样本数量,数量过大时训练需求的内存资源大且模型泛化性差,过小则模型收敛速度慢;Epoch为整个训练集在模型中训练的次数,次数过大或过小将导致模型过拟合或欠拟合;学习率为反向传播时更新权重矩阵的步长,数值过大模型难以跳出局部最优解,过小则模型收敛变慢;迭代次数为使用批次样本训练模型的次数,数值由Batch_size、epoch和训练集大小确定,如下式:
式中,iter为迭代次数;D为训练集大小。
根据研究经验与本发明数据集的规模,epoch选择为50次;学习率初选1×10-4、5×10-5;Batch_size初选64、128、256。基于声音数据集,模型分别在超参数的6种组合情况下训练,训练过程的损失值与准确率变化如图23所示。
由图可知,在相同学习率下,随着Batch_size减小,模型的收敛速度加快,且验证集准确率明显提升;在相同Batch_size下,随着学习率减小,模型的收敛速度变慢,且验证集准确率降低。通过对比不同子图的损失值和准确率的变化趋势,确定1×10-4为最优学习率、64为最优Batch_size。同时,为使模型训练至拟合即停止训练,由子图c确定20为最优epoch,此时对应的迭代次数为2835。
由于振动数据集与声音数据集规模相同,且数据形式相似,故在最优学习率和最优Batch_size的设置下,分别基于x轴振动数据集、y轴振动数据集和z轴振动数据集训练其余模型,损失值与准确率变化如图24。
由图可知,在三个方向的振动数据集上训练时,模型在约第20次epoch处达到最优,继续训练则损失值开始振荡且无减小趋势,故基于振动数据集训练时其最优epoch也可确定为20。
模型最终在最优超参数的设置下分别基于四类数据集重新训练四个模型,最优超参数的各项数值如表5。
表5超参数调优表
4、模型评估指标
评价岩性识别模型的性能首先采用查准率P和查全率R两类指标,查准率表示模型识别为某类岩性的样本里真正为该类岩性的比例,查全率表示某类岩性的样本有多少比例被模型准确识别,两类指标计算公式如下:
式中,TP为真阳,表示识别为正例,实际也为正例;TN为真阴,表示识别为负例,实际也为负例;FP为假阳,表示识别为正例,实际为负例;FN为假阴,表示识别为负例,实际为正例。
此外,还可以使用混淆矩阵对模型进行详细评价,混淆矩阵由各类岩性对应的TP、TN、FP、FN所组成,本发明模型所需预测岩性共有7类,故其为一个7×7的反映真实值与预测值差异的矩阵。
针对多分类的岩性识别任务,可进一步采用准确率Accuracy、宏查准率Macro_P和宏查全率Macro_R整体评价模型识别岩性的能力。在这些指标中,准确率反映模型识别岩性时预测成功的结果占整体的比例,而宏查准率和宏查全率分别是每类岩性的查准率P和查全率R的平均值,各指标计算如下式:
式中,n为模型所需识别岩性的数量。
5、模型性能评估
模型的评估基于测试集,作为基分类器的四个最优岩性识别模型分别用于预测各自的基分类器测试集以评价模型的准确率与泛化性,测试结果经归一化后所得混淆矩阵如图25所示。
由图25可知,四个模型整体上对各类岩性具有良好的识别效果,但大理岩、泥灰岩、石灰岩和页岩在四个模型上的识别效果相比于其他岩性的较低。其中,大理岩在基于声音信号的模型上被识别的效果最差,分别有16%和9%的大理岩时频图像被识别为泥灰岩和石灰岩;泥灰岩和石灰岩在基于声音信号的模型上识别时相互混淆的比例较大,分别为10%和7%;在四个模型中,页岩的识别效果总体来看相对一般,在四个模型上分别有28%、8%、7%和7%的页岩时频图像被识别到大理岩、泥灰岩和石灰岩三者之中。导致此四类岩性相互区分的效果不佳的原因可从不同角度分析解释:从岩石矿物来看,此四类岩石均具含有方解石成分;从岩石形成来看,大理岩常由石灰岩经变质作用形成,泥灰岩为过渡类型岩石,常产出于石灰岩与粘土岩的过渡带中;而从岩石强度来看,石灰岩、泥灰岩和页岩的岩石力学参数均较大,钻头钻进时均产生了极高的能量水平和冲击特性。因此,基于这些可能的因素使得钻进这些岩石时产生的声振信号其特征具有一定的相似性,从而导致模型的识别结果产生偏差。
表6为在四个模型上各类岩石的查准率和查全率。由表中宏值和准确率可知,四个模型识别岩性的综合性能不同,基于x轴振动信号和z轴振动信号的两类模型识别岩性的综合性能最强,而基于声音信号的模型其综合性能相对最差。另外,各类岩性的查准率与查全率差异明显,长石砂岩在四个模型上的整体查全率最大,而石英砂岩的整体查准率最大,且尽管基于声音信号的模型综合性能相对最差,但石英砂岩在该模型上具有高达0.95的查准率。综合来看,四个模型对各类岩性具备不同水平的查准与查全能力,因此为综合模型的性能表现,将进一步集成四个模型以对各自性能取长补短。
表6模型测试指标
由混淆矩阵和性能指标可知,四个模型对各类岩性的预测效果总体表现良好,具有较强的泛化性能。
为进一步衡量AlexNet-RCBAM模型相对于其他算法的性能提升水平,选择KNN和SVM两类图像识别常用的传统机器学习算法、以及AlexNet深度学习算法进行对比,各类算法模型经调参优化后在对应数据集上训练,最终在测试集上的准确率如表7。
表7各类算法的模型准确率对比
由表7可知,相对于传统机器学习模型,深度学习模型识别岩性的准确率具有显著提高,提升幅度在6%~19%,说明深度学习比传统机器学习更适合图像识别的任务。另外,在AlexNet的基础上加入残差结构和CBAM注意力机值,模型准确率提高了1%~5%,说明本发明岩性识别,AlexNet-RCBAM相比于AlexNet其性能得到了进一步提升。
本发明提出了一种基于钻进碎岩过程声振信号时频图像深度学习的岩性识别方法。首先,在AlexNet的基础上加入CBAM注意力机制和残差结构,从而搭建出应用于构建岩性识别模型的AlexNet-RCBAM卷积神经网络。之后将声振信号各自的数据集进行数据增强并划分,在经过模型训练调优后得到四个岩性识别模型(分别是声音、x轴振动、y轴振动、z轴振动四个信号的基础模型),通过模型评估发现模型整体具有良好的性能表现,且在岩性识别的任务中AlexNet-RCBAM的性能优于传统机器学习算法和AlexNet。
三、多模型集成学习的岩性智能识别方法
1、模型集成方法
传统投票法对基分类器的决策选择以少数服从多数的原则做出最终判断,这种方法默认每个基分类器模型具有同等地位,忽略了基分类器训练时所用数据集、所选择算法以及所设置超参数不同带来的模型性能差异。以基分类器的性能为依据对输出类概率加权可以使集成模型的综合性能更优。但除基分类器之间的性能差异外,单一基分类器对每个类别的识别能力也不同,因此加权不能直接基于基分类器,而应该对应到每个类别的概率上。
岩性识别模型的集成基于输出类概率,而AlexNet-RCBAM网络输出的向量经过Softmax函数处理即转换为每个类别对应的概率,如下式:
式中,n为识别任务对象数量;ai为输入Softmax的向量的第i个元素;pi为模型识别数据为第i类的概率。
衡量识别某类岩性时的每个基分类器的可靠度是实现岩性识别模型集成的关键,在此之前首先需要确定每个基分类器对每类岩性的识别能力,在模型性能评估中以查准率和查全率分别表示了识别为某类岩性的样本里真正为该类岩性的比例和某类岩性的样本有多少比例被模型准确识别,此两类指标的描述角度不同,但都真实反映了基分类器对每类岩性的识别能力,因此本发明以加权调和平均数FR综合基分类器上的查准率与查全率,其计算公式如下:
/>
式中,P为查准率;R为查全率;β为P与R之间的权重。
FR值表示了基分类器准确识别某类岩性的能力,因此1-FR的值则可表示相对于完美识别时的预测误差,基于误差大应赋值小权重而误差小则赋值大权重的原则,以均方倒数法的方式分配权重,计算公式如下:
式中,Fβij为第j个基分类器识别第i类对象的加权调和平均数;Wij为第j个基分类器识别第i类对象时分配的权重,且满足
集成后强分类器识别数据为第i类的概率为Pwi=Wi1pi1+Wi2pi2+…+Wimpim,EM-AlexNet-RCBAM集成模型的结构如图26所示。
2、集成模型选择
各基分类器类别的FR值将影响对应类别概率的权重,而β值决定了所得的FR值,从而影响到模型对查准率和查全率的重视程度。当β<1时,模型更重视查准率;当β=1时,模型对二者同等重视;当β>1时,模型更重视查全率。因此,有必要分析β取值对EM-AlexNet-RCBAM集成模型的影响,不同β值下所得集成模型在强分类器测试集上的测试结果如图27所示。
以PE表示集成模型的性能表现,由图27分析可知在不同β取值时集成模型满足PEβ=0.5<PEβ=2.0<PEβ=1.5=PEβ=1.0,即集成模型的性能表现随β取值的变大先增后减。β取1.0和1.5时,集成模型的性能差异甚微,但为使集成模型有更高的查全率以保证钻进某类岩性时样本尽可能被完全识别,因此β最终取1.5,此时基分类器的类别概率权重和集成模型的性能指标分别如表9和表10所示。
表9基分类器各类别概率权重(%)
表10集成模型的性能指标(%)
各类模型的准确率如表11所示,无论采用何种集成方法,模型集成后的准确率均有提升,说明集成学习的确能有效提升模型识别岩性的综合性能。此外,在三种集成方法中,EM-AlexNet-RCBAM集成模型具有最高的准确率,相比于其它两种方法提升了1%~3%,因此为基分类器的输出类概率加权更具集成优势。集成模型最终相比于单个基分类器提升了5%~19%的准确率,很好地实现了综合每个基分类器性能的目的,提升了模型的泛化性。
表11各类模型的准确率(%)
3、集成模型泛化性分析
EM-AlexNet-RCBAM集成模型在测试集上表现出了极佳的性能,满足识别岩性的基本需求,但整个过程中基分类器与集成模型的构建都是在已有钻进条件下的声振信号时频图像库的基础上进行,而岩性智能识别旨在识别岩性以此指导钻进参数的优化,故需要模型具备在钻进条件改变后依旧可以准确识别岩性的能力。
为进一步分析集成模型在未知钻进条件下识别岩性的能力,更换新的孕镶金刚石钻头,并以未设置过的转速与钻速重新钻进七类岩石试样,除此之外,二次试验选择了更大的钻孔深度,详细信息如表12。
表12二次试验的钻进条件
钻进岩石时,以51200Hz的采样频率采集全过程的声振信号,声振信号经过处理转换为时频图像输入集成模型的四个通道,识别结果按对应孔深有序排列,形成的钻孔岩性预测如图28所示。
图28中每个钻孔的白色条带代表在该位置时模型预测错误,同时图中给出了对应钻孔的岩性预测准确率。由前文声振信号的特征分析可知,改变钻进条件将会影响声振信号中的钻进状态特征,因此模型预测岩性的准确率难免会受到影响。
由图28可知,在大理岩、花岗岩和长石砂岩的钻孔上模型预测的准确率极高,而在石灰岩的钻孔上预测效果相对较差,因此可知钻进条件的改变为岩性识别任务带来了影响,且各类岩性受到的影响程度不同。但从模型的整体预测效果来看,模型在新的钻进条件下识别岩性的表现依旧较好,整体上准确率达92.06%,表现出较强的泛化性,能够一定程度上完成未知钻进条件下的岩性识别任务。
实验结果表明,四个岩性识别模型识别各类岩性的能力不同,但由于每个模型提取时频图像特征信息的角度不同,本发明综合分析了各个模型的决策。本发明以加权每个基分类器的输出类概率为集成策略,基于FR值以均方倒数法计算相应类别的权重,同时分析了β取值对集成模型性能的影响。最后,以二次试验的方式测试了集成模型在未知钻进条件下的表现,发现模型性能在钻进条件改变时受到了较小的影响,整体上可以看出集成模型具有较强的泛化性。
综上,本发明通过分析声振信号中含有的岩性特征与钻进状态特征,结合深度学习卷积神经网络,构建了基于声振信号的岩性识别模型,并对模型的决策进行了解释,又针对各个模型识别岩性能力不同的情况,结合模型共同决策的思想,提供了一种多模型集成学习的岩性智能识别方法及其系统:
(1)获取了声振信号的特征信息。采用图检验和游程检验分析了声振信号的平稳性,并以2s的观测尺度对声振信号进行特征分析。时域分析中,利用有量纲特征参数和无量纲特征参数两类指标,分析出钻进条件对能量水平和冲击特性的影响,以及每类岩性在能量水平和冲击特性上的表现;频域分析中,分析出钻进条件对功率谱密度和重心频率的影响,以及岩性与功率谱密度的曲线形状和主频分布的关系。时域和频域的特征分析说明了声振信号的特征信息可以反映岩性和钻进状态。最后使用STFT对声振信号进行时频分析,且时频分析得出的时频图所含特征丰富,为复杂的非结构化数据,可以作为岩性识别模型构建所需的数据集。
(2)构建了岩性识别模型并进行了模型解释。在卷积神经网络中加入CBAM注意力机制和残差结构后搭建出AlexNet-RCBAM,经过数据集划分和超参数调优后分别训练出了基于声音信号和三轴振动信号的四个最优岩性识别模型,各模型由混淆矩阵和性能指标评估后可说明其准确性和泛化性良好,模型准确率分别为0.78、0.92、0.87和0.92,较KNN和SVM算法提高了6%~19%,较AlexNet算法提高了1%~5%,因此AlexNet-RCBAM的性能优于其余对比算法,有效提升了模型识别岩性的能力。在模型解释时,利用Grad-CAM分析了七类岩性时频图像的类激活热力图,热力图上热力区域的分布与岩石性质表现出相关性,而分布差异的显著程度越大使得模型的性能表现越好。此外,在相同声音数据集规模下,随着转速样本的增加,训练所得模型的准确率升高且其热力区域的分布范围缩窄,说明了增加钻进条件对提升模型泛化性的具有作用。
(3)提出了多模型集成学习的岩性智能识别方法。基于多个模型共同决策的思想,以各个模型每个类别的输出类概率加权平均为结合策略,利用β值为1.5时的预测误差通过均方倒数法分配权重,集成后EM-AlexNet-RCBAM集成模型在测试集上的准确率为97.43%,较单个基分类器提升了5%~19%,较其余集成方法提升了1%~3%。以集成模型预测在新钻进条件下二次试验时的钻孔岩性,准确率仍有92.06%,该集成模型具有较强的泛化性。

Claims (9)

1.一种基于钻进碎岩过程声振信号特征实时预测岩性模型的构建方法,其特征在于:它包括如下步骤:
1)获得钻进碎岩的声音信号和振动信号,振动信号包括x轴振动信号、y轴振动信号和z轴振动信号;
2)将前述声音信号、振动信号分别进行预处理,预处理包括预加重、小波阈值降噪、带通滤波和时频域分析,得到声音信号、x轴振动信号、y轴振动信号和z轴振动信号的时频图像;
3)在AlexNet的基础上加入CBAM注意力机制和残差结构,搭建出AlexNet-RCBAM卷积神经网络,以步骤2)得到的时频图像为数据集,进行数据增强,拆分数据集,输入AlexNet-RCBAM卷积神经网络,进行训练,调优,构建出声音、x轴振动、y轴振动、z轴振动四个信号的基础模型;
4)将步骤3)的四个基础模型进行集成,得到集成模型。
2.根据权利要求1所述的构建方法,其特征在于:步骤2)中,所述预加重是用一阶FIR高通滤波器将声振信号进行滤波处理,该滤波器z域的传递函数如下式:
H(z)=1-az-1 (公式1)
式中,a为预加重系数,通常取值范围为0.9<a<1,优选a=0.95;
和/或,步骤2)中,所述小波阈值降噪选择Sym8小波基函数进行滤波降噪,分解层数为9层,阈值量化方法以软硬折中阈值函数处理小波系数,公式如下:
式中,wj为第j层的小波系数;wjn为第j层阈值函数处理后的小波系数;α∈[0,1],取α=0.5;T为阈值,计算公式如下:
式中,w1为第一层的小波系数;N为信号的长度;
和/或,步骤2)中,所述带通滤波处理是以六阶巴特沃斯带通滤波器过滤声振信号,其z域的传递函数如下式:
式中,a(m)和b(n)为系数向量;N为带通滤波的阶数;
其中,处理声音信号的带通滤波器的下限频率100Hz、上限频率20000Hz;处理振动信号的带通滤波器以及下限频率3000Hz、上限频率10000Hz;
和/或,步骤2)中,所述时频域分析采用STFT进行时频分析:分析时选择窗长为NFFT的海明窗w(n)对原始信号x(n)截取,并对加窗后的信号进行傅里叶变换,之后每次将窗口移动Hop Size的长度,同时使两相邻窗口以Overlap的长度重叠,并在加窗后继续进行傅里叶变换,最后得到一个二维矩阵s(ω,τ),计算公式如下:
由于声振信号属于功率信号,应以功率谱密度衡量其能量大小,故相应时间和频率下的幅值S(ω,τ)应转换为功率谱密度P(ω,τ),计算公式如下:
式中,fr为频率分辨率;fs为采样率;NFFT为海明窗的窗长;
优选地,分析窗长NFFT分别为512、1024或2048。
3.如权利要求1所述的方法,其特征在于:步骤3)中,所述数据增强是采用色彩抖动、噪声扰动和模糊处理三种方法依次处理。
4.根据权利要求1所述的构建方法,其特征在于:步骤3)中,所述训练和调优是基于Tensorflow架构进行训练和调优;所述调优是调优超参数,调整对象包括权重初始化方式、学习率衰减策略、学习率衰减因子、学习率和迭代次数。
5.根据权利要求1所述的构建方法,其特征在于:步骤4)中,以加权平均法进行集成,加权方式为基分类器输出类概率加权,以均方倒数法分配权重;
优选地,AlexNet-RCBAM网络输出的向量经过Softmax函数处理即转换为每个类别对应的概率,如下式:
式中,n为识别任务对象数量;ai为输入Softmax的向量的第i个元素;pi为模型识别数据为第i类的概率;
以加权调和平均数Fβ综合基分类器上的查准率与查全率,其计算公式如下:
式中,P为查准率;R为查全率;β为P与R之间的权重。
Fβ值表示了基分类器准确识别某类岩性的能力,因此1-Fβ的值则可表示相对于完美识别时的预测误差,基于误差大应赋值小权重而误差小则赋值大权重的原则,以均方倒数法的方式分配权重,计算公式如下:
式中,Fβij为第j个基分类器识别第i类对象的加权调和平均数;Wij为第j个基分类器识别第i类对象时分配的权重,且满足
集成后强分类器识别数据为第i类的概率为Pwi=Wi1pi1+Wi2pi2+…+Wimpim
进一步优选地,β选自1.0或1.5时。
6.权利要求1~9任意一项方法构建得到的基于钻进碎岩过程声振信号特征实时预测岩性模型。
7.一种基于钻进碎岩过程声振信号特征实时预测岩性的系统,其特征在于,它包括:
输入模块,用于输入声音信号和振动信号,振动信号包括x轴振动信号、y轴振动信号和z轴振动信号;
计算模块,按照实现权利要求1~5任意一项方法构建的模型模块和根据所述输入模块的信息计算得到最终的岩体特征的预测结果;
输出模块,用于输出最终的岩体特征预测结果。
8.一种基于钻进碎岩过程声振信号特征实时预测岩性的方法,其特征在于:步骤如下:
(1)获得待检钻进碎岩的声音信号和振动信号,振动信号包括x轴振动信号、y轴振动信号和z轴振动信号;
(2)将前述声音信号、振动信号分别进行预处理,预处理包括预加重、小波阈值降噪、带通滤波和时频域分析,得到声音信号、x轴振动信号、y轴振动信号和z轴振动信号的时频图像;
(3)将步骤2)得到的时频图像输入权利要求1~5任意一项方法构建的模型,比较得出结论。
9.一种计算机可读存储介质,其特征在于:其上存储有计算机程序,所述计算机程序用于实现权利要求8所述的钻进碎岩过程声振信号特征实时预测岩性预测方法。
CN202310799393.6A 2023-06-30 2023-06-30 一种基于钻进碎岩过程声振信号特征实时预测岩性的方法和系统 Pending CN117216676A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310799393.6A CN117216676A (zh) 2023-06-30 2023-06-30 一种基于钻进碎岩过程声振信号特征实时预测岩性的方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310799393.6A CN117216676A (zh) 2023-06-30 2023-06-30 一种基于钻进碎岩过程声振信号特征实时预测岩性的方法和系统

Publications (1)

Publication Number Publication Date
CN117216676A true CN117216676A (zh) 2023-12-12

Family

ID=89037699

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310799393.6A Pending CN117216676A (zh) 2023-06-30 2023-06-30 一种基于钻进碎岩过程声振信号特征实时预测岩性的方法和系统

Country Status (1)

Country Link
CN (1) CN117216676A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117454256A (zh) * 2023-12-26 2024-01-26 长春工程学院 基于人工智能的地质勘测方法及系统

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117454256A (zh) * 2023-12-26 2024-01-26 长春工程学院 基于人工智能的地质勘测方法及系统

Similar Documents

Publication Publication Date Title
Valentín et al. A deep residual convolutional neural network for automatic lithological facies identification in Brazilian pre-salt oilfield wellbore image logs
AU2011371570B2 (en) Apparatus and methods of analysis of pipe and annulus in a wellbore
Wang et al. On a new method of estimating shear wave velocity from conventional well logs
Shi et al. Brittleness index prediction in shale gas reservoirs based on efficient network models
CN110609320B (zh) 一种基于多尺度特征融合的叠前地震反射模式识别方法
CN108897975A (zh) 基于深度信念网络的煤层气测井含气量预测方法
CN111596978A (zh) 用人工智能进行岩相分类的网页显示方法、模块和系统
CN105259572A (zh) 基于地震多属性参数非线性自动分类的地震相计算方法
Wang et al. S-wave velocity inversion and prediction using a deep hybrid neural network
Konaté et al. Application of dimensionality reduction technique to improve geophysical log data classification performance in crystalline rocks
Hsu et al. Onsite early prediction of PGA using CNN with multi-scale and multi-domain P-waves as input
CN117216676A (zh) 一种基于钻进碎岩过程声振信号特征实时预测岩性的方法和系统
Ouadfeul et al. Lithofacies classification using the multilayer perceptron and the self-organizing neural networks
Zahmatkesh et al. Estimation of DSI log parameters from conventional well log data using a hybrid particle swarm optimization–adaptive neuro-fuzzy inference system
CN113792685A (zh) 一种基于多尺度卷积神经网络的微地震事件检测方法
CN116168224A (zh) 基于成像砾石含量的机器学习岩相自动识别方法
Si et al. A Novel coal-gangue recognition method for top coal caving face based on IALO-VMD and improved MobileNetV2 network
Sarkar et al. Seismic intensity estimation using multilayer perceptron for onsite earthquake early warning
He et al. Enhancing seismic p-wave arrival picking by target-oriented detection of the local windows using faster-rcnn
You et al. Explainable convolutional neural networks driven knowledge mining for seismic facies classification
Shi et al. Brittleness index prediction from conventional well logs in unconventional reservoirs using artificial intelligence
St-Charles et al. A deep learning benchmark for first break detection from hardrock seismic reflection data
Wang et al. Auto recognition of carbonate microfacies based on an improved back propagation neural network
Chen et al. A Conventional Neural Network Lithology Classification Method Based on Vibration Data
Wang et al. Multi-scale spatiotemporal feature lithology identification method based on split-frequency weighted reconstruction

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination