CN112906626A - 一种基于人工智能断层识别方法 - Google Patents

一种基于人工智能断层识别方法 Download PDF

Info

Publication number
CN112906626A
CN112906626A CN202110273316.8A CN202110273316A CN112906626A CN 112906626 A CN112906626 A CN 112906626A CN 202110273316 A CN202110273316 A CN 202110273316A CN 112906626 A CN112906626 A CN 112906626A
Authority
CN
China
Prior art keywords
network
layer
fault
classification
fault identification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110273316.8A
Other languages
English (en)
Inventor
李辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN202110273316.8A priority Critical patent/CN112906626A/zh
Publication of CN112906626A publication Critical patent/CN112906626A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/08Feature extraction
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01VGEOPHYSICS; GRAVITATIONAL MEASUREMENTS; DETECTING MASSES OR OBJECTS; TAGS
    • G01V1/00Seismology; Seismic or acoustic prospecting or detecting
    • G01V1/28Processing seismic data, e.g. for interpretation or for event detection
    • G01V1/282Application of seismic models, synthetic seismograms
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01VGEOPHYSICS; GRAVITATIONAL MEASUREMENTS; DETECTING MASSES OR OBJECTS; TAGS
    • G01V1/00Seismology; Seismic or acoustic prospecting or detecting
    • G01V1/28Processing seismic data, e.g. for interpretation or for event detection
    • G01V1/30Analysis
    • G01V1/301Analysis for determining seismic cross-sections or geostructures
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01VGEOPHYSICS; GRAVITATIONAL MEASUREMENTS; DETECTING MASSES OR OBJECTS; TAGS
    • G01V1/00Seismology; Seismic or acoustic prospecting or detecting
    • G01V1/28Processing seismic data, e.g. for interpretation or for event detection
    • G01V1/30Analysis
    • G01V1/307Analysis for determining seismic attributes, e.g. amplitude, instantaneous phase or frequency, reflection strength or polarity
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/12Classification; Matching

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Remote Sensing (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Molecular Biology (AREA)
  • General Life Sciences & Earth Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Geophysics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computing Systems (AREA)
  • Geology (AREA)
  • Environmental & Geological Engineering (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Acoustics & Sound (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Geophysics And Detection Of Objects (AREA)
  • Probability & Statistics with Applications (AREA)
  • Signal Processing (AREA)

Abstract

针对如何从地震数据中精确识别出断层并提高计算效率的问题,本发明公开了一种基于人工智能断层识别方法。通过对传统AlexNet神经网络一系列改进,包括用批量归一化(BN)代替原来的局部响应归一化(LRN),增加了训练速度。把断层识别看作是二分类问题,用Sigmoid替代Softmax来作为分类函数。同时由于在断层识别问题中,正、负样本(断层与非断层)比例严重不均衡,所以在二分类交叉熵损失函数的基础上引入平衡交叉熵损失函数来解决此问题。最后使用1×1的卷积层替代了传统AlexNet网络的3层全连接层,极大减少了网络结构的参数数量。通过对理论数据以及实际数据的预测结果分析可以得出,通过此改进的AlexNet网络训练的模型在断层识别领域有着很好的性能。

Description

一种基于人工智能断层识别方法
技术领域
本发明涉及地震勘探数据处理技术领域,更具体的说是涉及一种人工智能卷积神经网络对地震数据断层的自动识别方法。
背景技术
断层识别在地震勘探解释过程中起着至关重要的作用。断层是地壳内部运动所形成的一种常见的地质现象,是指底层沿破裂面发生相对位移的现象,它是构造活动位移的伴生产物,与油气藏的形成、分布、富集有着非常密切的联系。要对断层进行解释,首要的问题就是在地震剖面上把它识别出来,根据实践,断层在地震剖面上主要有以下标志:①反射波同相轴错断。由于断层的规模、级别大小不同,可表现为反射标准层的错断和波组、波系的错断。若断层两侧波组关系是相对稳定的、特征是清楚的,则一般是中、小型断层的反应。它的特点是断距不大,延伸较短,破碎带较窄。②标椎反射波同相轴发生包括同相轴的分叉、合并、扭曲、强相位转换等局部变化。③反射波同相轴突然增加或消失,波组间隔突然变化。对于拉张式构造模式,断层上升盘由于沉积地层少,甚至未接受沉积,因而在地震剖面上反射波同相轴减少、埋深变浅甚至缺失。④由于断层错动引起的两侧底层产状突变,或由于断层面的屏蔽作用和对射线的畸变造成的反射零乱或出现空白带。⑤在水平叠加剖面上出现了特殊波。在反射层错断处,往往伴随出现断面波、绕射波等。鉴于我国目前多数含油气盆地内的含油气构造都伴随极发育的断层,它对石油和天然气的储集或破坏起着控制作用。所以在地震剖面上分析和确定断层是地震资料解释中很重要的内容。
断层的解释实际上就是确定断层的性质,包括断层的位置、错开层位、断面产状、升降盘、落差等。这些断层要素的确定通常要依据地质规律和特点对研究区地质情况的分析,同时要结合地震剖面上的断层标志来进行。解释断层的方法有很多,效果也有很大的差别。常规的断层识别方法主要有:①通过地震剖面识别断层(吕双兵,2015);地震剖面识别在断层解释发展初期起着至关重要的作用。根据上述的断层特征通过肉眼直接观察地震数据上面的断层。②井断点引导断层识别技术(陈国飞,2005);在准确的断点时深转换前提下,井点处断层位置严格对应井断点信息,井断点引导断层识别技术就是利用井的钻遇断点信息对断层进一步解释的一种技术。此外还有基于地震属性断层识别方法。主要包括:①相干体技术(Farmer,1995);相干体技术被称为是近几十年来三维地震资料解释方面最重要的突破。相干体特有算法是通过三维数据体来比较局部地震波形的相似性。相干值较低的点与地质不连续性密切相关。②曲率属性;根据曲面的曲率特征,可以提取等值线曲率、走向曲率、倾向曲率、形态指数、最小负曲率、最大正曲率、极小曲率、极大曲率、平均曲率、高斯曲率和弯曲度等他多种曲率。曲率是单位弧长段上切线旋转角度大小的极限,可描述曲线上任意一点的弯曲程度,利用过该点内切圆半径的倒数来表示,曲率越大线性形变越强。曲率与地质构造之间的几何联系使得曲率成为定量描述构造特征的重要手段。③方差体技术。方差体是一种加权移动方差算法,计算数据体中每个采样点的方差值。方差体参数根据所要预测的断层走向选择加法模式或乘法模式。
通过地震剖面识别断层,容易受到人主观意识以及地震资料分辨率的影响,容易出现较大的错误。同时对于断距较小的断层无法精确的识别,通常在地震剖面上无法准确识别断距为5m以下的断层,从而需要借助一些其他方法辅助识别断层。通过井断点引导断层识别技术可以准确识别出地震剖面所不能识别出的小断距断层,但其对于井网密度要求较高,在井断点信息较少的稀井网地区,指导识别断层的效果不佳,目前通常采用地震剖面与井断点引导技术相结合的方式进行。通过相干体技术进行断层识别能够从三维地震资料中定量地识别出断层,避免了解释误差的影响,从而极大提高了断层解释精度。但是C1相干体技术计算速度较快,但相对噪声对其干扰明显。C2相干体技术的速度以及抗噪性都有提升,但分辨率较低。C3相干体技术分辨率明显高于C1,C2相干体技术,对于断层的边界及走向的刻画更精细,但速度较慢。通过曲率属性识别断层,兼具了较高的抗噪性和较好的三维可视化解释功能。基于二维空间的曲面曲率和基于三维空间的体曲率都对断层有着较好的识别效果,但曲面曲率相对于直接从地震数据体中提取的体曲率还存在着较大的局限性。通过方差体技术识别断层,尽可能的减少了人为因素或其他外界因素对断层识别的影响,进一步提升了断层识别的精度,但是也出现了一系列的问题,比如参与的运算量巨大,运算速度稍慢。参与运算的道数多少要根据所要预测断层的大小来确定,太多太少都会影响结果。
因此,如何研究出一种能满足断层识别高精度需求并能提升运算速度的方法是本领域技术人员所急需解决的问题。
近几年,卷积神经网络(Convolutional Neural Networks,CNN)在图像识别方面大放异彩,几乎所有的图像识别方面的突破都是卷积神经网络取得的。卷积神经网络是一类包含卷积计算且具有深度结构的前馈神经网络(Feedforward Neural Networks),是深度学习(deep learning)的代表算法之一。卷积神经网络具有表征学习(representationlearning)能力,能够按其阶层结构对输入信息进行平移不变分类(shift-invariantclassification),因此也被称为“平移不变人工神经网络(Shift-Invariant ArtificialNeural Networks,SIANN)”。卷积神经网络采用原始图像作为输入,可以有效的从大量样本中学习到相应地特征,避免了复杂的特征提取过程。由于卷积神经网络可以直接对二维图像进行处理,不需要在训练之前对图像进行前期复杂的预处理因此,在图像处理方面得到了广泛的应用,并取得了较多的研究成果。该网络通过简单的非线性模型从原始图像中提取出更加抽象的特征,并且在整个过程中只需少量的人工参与,因此,在图像识别方面卷积神经网络是最热门的神经网络之一。
发明内容
关于卷积网络模型的设置,目前较热门的网络模型有LetNet-5、AlexNet、ZFNet、VGG-16、GoogLenet、ResNet等。其中在2012年的lmageNet竞赛中,AlexNet网络相对于使用传统的人工提取特征的方法,错误率降低了将近10%,由此可以看出,AlexNet网络在图像识别领域所占据的独特的优势。AlexNet网络作为深度学习中的一种经典网络,目前在图像分类任务中仍被大量使用。相比于其他大型网络而言,AlexNet深度卷积神经网络复杂度低、参数量少,相比现在的轻量级网络深度深,训练难度不会很大,表征能力强,可以节省大量模型训练时间,进行快速预测。因此更适合于本领域中的地震数据断层识别问题。
基于此,本发明提出一种基于改进AlexNet卷积神经网络模型方法自动识别断层,在传统的AlexNet网络基础上根据,把断层识别看作是图像识别二分类问题,有断层的地方为1,非断层的地方为0。机器学习算法的优势在于寻找隐藏在数据内部间的规律,并且能够高效率地找到输入数据与目标输出之间的映射关系,这使得机器学习算法非常适合在多种地震属性组合的条件下提取关键信息(Zheng et al.,2013;Jahan et al.,2017)。因此,利用机器学习方法进行断层识别能够打破传统识别方法的局限性,是智能化地震解释的研究热点和重点之一。
传统的AlexNet网络分为上下两部分,分别利用两块GPU来提高运算效率,其有8层深度神经网络,其中包括5层卷积和3层全连接层,不计激活层和池化层。第一层:卷积层1,输入为224×224×3的图像,卷积核的数量为96,论文中两片GPU分别计算48个核;卷积核的大小为11×11×3;stride=4,stride表示的是步长,pad=0,表示不扩充边缘;卷积后的图形大小为:
wide=(224+2*padding-kernel_size)/stride+1=54 公式(1)
height=(224+2*padding-kernel_size)/stride+1=54 公式(2)
dimention=96
然后进行局部响应归一化(Local Response Normalized),后面跟着池化pool_size=(3,3),stride=2,pad=0最终获得第一层卷积的feature map。
第二层:卷积层2,输入为上一层卷积的feature map,卷积的个数为256个,论文中的两个GPU分别有128个卷积核。卷积核的大小为:5×5×48;pad=2,stride=1;然后做LRN,最后max_pooling,pool_size=(3,3),stride=2;
第三层:卷积3,输入为第二层的输出,卷积核个数为384,kernel_size=(3×3×256),padding=1,第三层没有做LRN和Pool。
第四层:卷积4,输入为第三层的输出,卷积核个数为384,kernel_size=(3×3),padding=1,和第三层一样,没有LRN和Pool。
第五层:卷积5,输入为第四层的输出,卷积核个数为256,kernel_size=(3×3),padding=1。然后直接进行max_pooling,pool_size=(3,3),stride=2;
第6,7,8层是全连接层,每一层的神经元的个数为4096,最终输出softmax为1000,因为上面介绍过,ImageNet这个比赛的分类个数为1000。全连接层中使用了RELU和Dropout。
考虑到此网络耗费的训练时间较长,以及为了进一步提升识别精度,本发明对此神经网络做出了改进。
S1:网络结构分别使用3×3、5×5的卷积核64个和32个;然后采用批量归一化(BN)层代替原来的LRN层。
S2:在网络最后一层采用Sigmoid替代Softmax作为分类函数,同时引进平衡交叉熵损失作为损失函数。
S3:使用一层1×1的卷积替代网络最后的3层全连接层。
首先本发明改进的网络结构分别使用3×3、5×5的卷积核64个和32个,保留最大池化层来减少模型大小,提高计算精度,同时提高所提取特征的鲁棒性。然后采用批量归一化(BN)层代替原来的LRN层。LRN使得局部较大的响应值更大,而小的会变得更小,从而抑制了小的神经元,增强了模型的泛化能力。BN在此基础上,还加快了模型收敛,打乱了训练数据,大大减少了训练的时间。在网络的每一层输入x的时候,又插入了一个归一化层,也就是先做一个归一化处理(归一化至均值0、方差1),然后进入网络的下一层。设输入x是d维,则
x=(x1x2...xd) 公式(3)
对每一维进行归一化,则
Figure BSA0000235847110000041
如果是仅仅使用上面的归一化公式,对网络某一层的输出数据做归一化,然后送入下一层,这样会影响到本层网络所学习到的特征。于是进行变换重构,引入可学习参数γ、β,这是算法的关键之处,可以表示为
Figure BSA0000235847110000042
Figure BSA0000235847110000043
β(k)=E[x(k)]。 公式(7)
在实际测试中,依然采用下面的公式:
Figure BSA0000235847110000044
这里的均值和方差不再是针对某一个批量,而是面向整个数据集。因此在训练过程中除了正常的前向传播和方向求导之外,还要记录每一个批量的均值和方差,以便训练完成之后计算整体的均值和方差,即
E[x]←EBB], 公式(9)
Figure BSA0000235847110000045
式中:x表示一层d维的输入数据;B表示一个尺寸为m的小批量,B={x1...m};y为x的线性变换;ε表示一个常数;μB表示小批量平均值,
Figure BSA0000235847110000046
然后本发明考虑到在地震数据断层识别问题中,是一个二分类问题,即断层和非断层,所以在网络最后一层采用Sigmoid替代Softmax作为分类函数,同时用Binary_crossentropy作为损失函数。sigmoid函数针对两点分布提出。神经网络的输出经过它的转换,可以将数值压缩到(0,1)之间,得到的结果可以理解成“分类成目标类别的概率P”。而不分类到该类别的概率,就是(1-P),这也是典型的两点分布的形式;softmax本身针对多项分布提出,当类别数是2时,它退化为二项分布,而它和sigmoid真正的区别就在这儿——二项分布包含两个分类类别(姑且分别称为A和B);而两点分布其实是针对一个类别的概率分布,其对应的那个类别的分布,直接由1-P粗暴得出。Sigmoid函数形式为:
Figure BSA0000235847110000051
Softmax函数形式为:
Figure BSA0000235847110000052
对于一个长度为K的任意实数矢量,Softmax可以把它压缩为一个长度为K的、取值在(0,1)区间的实数矢量,且矢量中各元素之和为1。它在多元分类(MulticlassClass43ication)和神经网络中也有很多应用。
在二元分类的情况下,对于Sigmoid,有:
Figure BSA0000235847110000053
Figure BSA0000235847110000054
而对K=2的Softmax,有:
Figure BSA0000235847110000055
Figure BSA0000235847110000056
其中
Figure BSA0000235847110000057
可见在二元分类的情况下,Softmax退化为了Sigmoid。
二分类交叉熵损失在二值分类问题研究中被广泛应用,该函数在平常的图像二值分类的问题中有着较好的效果,因为在普通的图像中,零和非零的样本的分布或多或少是均衡的,但在本文的断层识别问题中,因为在一张地震数据图像中,断层和非断层高度不平衡,如果我们在此断层识别问题中使用此损失函数训练网络,很容易造成网络朝着错误的方向收敛,会造成网络容易将预测结果判定为非断层,从而造成误判率较高。因此本文考虑使用平衡交叉熵损失来解决样本的高度不平衡问题。主要是通过增加惩罚系数,对数量少的类别增加权重,对数量多的类别减少权重的方法,来减少这种样本之间的不平衡。从而使网络模型朝着正确的方向收敛。二分类交叉熵损失公式为:
Figure BSA0000235847110000058
pi表示的是样本在该类别中预测的概率,yi表示样本标签。
平衡交叉熵损失公式为:
Figure BSA0000235847110000061
Figure BSA0000235847110000062
β在本文中表示在一张地震图像中非断层像素点与地震图像总像素点的比值,而1-β表示断层像素点与图像总像素点的比值。
最后在网络中使用全连接层的话,一是存储开销很大。二是计算效率低下。为了进一步减少网络的计算量,本发明把最后的3层全连接层使用了一层1×1的卷积替代,在很大程度上减少了神经网络的参数,让网络更易训练。同时因为全连接层的输入尺寸是固定的,替换全连接层为卷积层之后,那么我们对于输入图片的大小是没有任何限制的,大图小图一样都经过卷积池化激活。因为卷积核的参数个数与图像大小无关。而且全连接层会破坏图像的空间结构,而使用1×1卷积层替代全连接层后,不会破坏图像的空间结构。
本发明一种基于人工智能断层识别方法实现应用包括以下步骤:
SS1:根据本发明做出的改进构建神经网络结构。
SS2:输入地震数据到神经网络结构中训练,计算出网络模型的准确率和损失值曲线。
SS3:把需要预测的数据输入到训练好的网络模型中去。得到预测结果。
附图说明
为了更清楚地说明本发明实施例或现有技术中的方案,下面将对实施例或现有技术描述中所需要使用的附图做简单介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动前提下,还可以根据提供的附图获得其他的附图。
图1附图为传统AlexNet网络结构
图2附图(1)为原始地震数据,图2附图(2)是原始数据水平翻转后得到的地震数据,图2附图(3)是原始数据垂直翻转得到的地震数据,图2附图(4)是原始数据进行水平、垂直同时翻转得到的地震数据。
图3附图训练模型准确率曲线。train为训练集,test为验证集。
图4附图训练模型损失值曲线。train为训练集,test为验证集。
图5附图为训练模型预测理论数据结果,上图为理论地震数据,下图为预测出的断层位置,白色表示断层。
图6附图为训练模型预测实际数据结果,上图为实际地震数据,下图为预测出的断层位置,白色表示断层。
图7附图为Sigmoid函数图像。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例公开了一种人工智能断层识别方法,包括以下步骤:
输入训练数据,神经网络训练结果的好坏在很大程度上取决于训练数据,考虑到实际数据中可能有其他的地质特征影响神经网络对断层的识别。同时,在对实际数据进行标标签的过程中依赖人的主观判断,一反面工作量巨大,另一方面可能产生错误的识别标签。所以,综上考虑,本文采用的训练数据集是人工合成理论数据集(Wu,2017),此数据集包含200个样本的训练数据集和20个样本的测试数据集,样本的大小为128*128*128,为了可以方便地调整模型的网络结构,我们对3维数据进行了裁剪,数据的尺寸变为112×112×112。因为训练需要输入二维数据,所以本文对每个样本进行垂直切片,从每个3维数据体中获得一个2维数据,因为训练样本的数据有限,容易使网络模型过拟合,从而影响识别效果,同时为了增强样本的多样性,包含更多类别的地震断层,增加样本数量,本文对数据采取了水平翻转,垂直反转和水平、垂直同时反转处理。考虑到旋转会产生垂直地震构造和平断层从而导致断层和层位的区别不清楚,而且这在地质上不不合实际的,所以没有对数据进行旋转处理,只进行了翻转。比如原先N30°W走向的断层,通过数据增强,可以得到N30°E,S30°E,S30°W走向的断层。如图2附图所示。
地震数据图像按照设计的网络结构依次输入到网络中。评估指标是机器学习算法中用于评估算法学习能力好与坏的一类参数指标,也可以反映学习任务的需求,不同的评估指标能够在不同的角度上体现模型的学习能力。分类任务中最常用的几种评估指标有:错误率,准确率,查准率(precision),查全率(recall),损失值(loss)与F1,在本此研究中选择了准确率与损失值指标来综合评估模型的表现。损失函数是的作用是用来衡量一组参数好坏,其衡量方式是比较网络输出和真实输出的差异。Loss layer在网络的最后一层接收两个参数作为输入值,一个是网络运算预测的的结果,一个是真实的断层标签。损失函数是在前向传播计算中得到的,同时也被作为反向传播的起点。损失函数并不使用测试数据来衡量网络的性能,而是用来指导训练过程,使得网络的参数向损失降低的方向改变。当网络的计算预测断层结果和真实断层标签一致时,损失为0,预测断层结果和真实断层标签越不一致时值越大。AlexNet网络有5层卷积和3层全连接,本发明把最后3层全连接用一层1×1的卷积层替代,经过25次迭代训练之后,模型的准确率已经达到了较高的水平,损失值也降到了到了可以接受的范围。如图3附图和图4附图所示。保存训练好的模型,用来预测需要预测的数据。
本发明先用训练的模型预测理论数据,验证一下训练模型在理论数据上的表现。从图5附图可以看出对于理论数据样本中的断裂均能有效识别。为进一步验证模型的泛化能力,使用了模型在训练过程中没有遇到过的新数据进行测试。新数据为实际地震资料,相比于训练使用的合成地震数据有着更加复杂的地质构造,而且存在各种噪音,对于模型的泛化能力与抗噪能力有着很大的考验。
图5附图可以表明,此网络模型在理论数据中表现良好,有了可以从理论地震数据中识别断层的能力,但在实际数据中的表现,还需要进一步的验证。因此,本文选用实际的地震数据进行测试。实际数据我们选取的是某地区的海洋地震资料。图6附图上图表示实际资料原始的地震剖面,图6附图下图表示网络识别预测的断层结果。从图6附图我们可以看出,此网络很好的预测出了断层位置,验证了模型的泛化能力。此外,因为测试数据中还含有一定的噪音,所以测试结果可以证明,此网络也具有一定的抗噪能力。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (4)

1.一种基于人工智能断层识别方法,其特征在于,考虑到传统AlexNet网络耗费的训练时间较长,以及为了进一步提升断层识别精度,本发明在传统AlexNet网络基础上,做出了包括以下改进:
S1:网络结构分别使用3×3、5×5的卷积核64个和32个;然后采用批量归一化(BN)层代替原来的LRN层,
S2:在网络最后一层采用Sigmoid替代Softmax作为分类函数,同时引进平衡交叉熵损失作为损失函数,
S3:使用一层1×1的卷积替代网络最后的3层全连接层,
首先本发明改进的网络结构分别使用3×3、5×5的卷积核64个和32个,保留最大池化层来减少模型大小,提高计算精度,同时提高所提取特征的鲁棒性,然后采用批量归一化(BN)层代替原来的LRN层,LRN使得局部较大的响应值更大,而小的会变得更小,从而抑制了小的神经元,增强了模型的泛化能力,BN在此基础上,还加快了模型收敛,打乱了训练数据,大大减少了训练的时间,在网络的每一层输入x的时候,又插入了一个归一化层,也就是先做一个归一化处理(归一化至均值0、方差1),然后进入网络的下一层。设输入x是d维,则
x=(x1x2...xd) 公式(3)
对每一维进行归一化,则
Figure FSA0000235847100000011
如果是仅仅使用上面的归一化公式,对网络某一层的输出数据做归一化,然后送入下一层,这样会影响到本层网络所学习到的特征,于是进行变换重构,引入可学习参数γ、β,这是算法的关键之处,可以表示为
Figure FSA0000235847100000012
Figure FSA0000235847100000013
β(k)=E[x(k)] 公式(7)
在实际测试中,依然采用下面的公式:
Figure FSA0000235847100000014
这里的均值和方差不再是针对某一个批量,而是面向整个数据集,因此在训练过程中除了正常的前向传播和方向求导之外,还要记录每一个批量的均值和方差,以便训练完成之后计算整体的均值和方差,即
E[x]←EBB] 公式(9)
Figure FSA0000235847100000015
式中:x表示一层d维的输入数据,B表示一个尺寸为m的小批量,B={x1...m};y为x的线性变换,ε表示一个常数,μB表示小批量平均值。
Figure FSA0000235847100000021
2.根据权利要求1所述的一种基于人工智能断层识别方法,其特征在于,S2包括以下内容:
本发明考虑到在地震数据断层识别问题中,是一个二分类问题,即断层和非断层,所以在网络最后一层采用Sigmoid替代Softmax作为分类函数,同时用Binary_crossentropy作为损失函数,sigmoid函数针对两点分布提出,神经网络的输出经过它的转换,可以将数值压缩到(0,1)之间,得到的结果可以理解成“分类成目标类别的概率P”,而不分类到该类别的概率,就是(1-P),这也是典型的两点分布的形式,softmax本身针对多项分布提出,当类别数是2时,它退化为二项分布,而它和sigmoid真正的区别就在这儿——二项分布包含两个分类类别(姑且分别称为A和B),而两点分布其实是针对一个类别的概率分布,其对应的那个类别的分布,直接由1-P粗暴得出,Sigmoid函数形式为:
Figure FSA0000235847100000022
Softmax函数形式为:
Figure FSA0000235847100000023
对于一个长度为K的任意实数矢量,Softmax可以把它压缩为一个长度为K的、取值在(0,1)区间的实数矢量,且矢量中各元素之和为1,它在多元分类(MulticlassClassification)和神经网络中也有很多应用,
在二元分类的情况下,对于Sigmoid,有:
Figure FSA0000235847100000024
P(y=0|x)=1-P(y=1|x)=e^(-θ^Tx)/(1+e^(-θ^Tx))公式(15)
而对K=2的Softmax,有:
Figure FSA0000235847100000025
Figure FSA0000235847100000026
其中
Figure FSA0000235847100000027
可见在二元分类的情况下,Softmax退化为了Sigmoid,
二分类交叉熵损失在二值分类问题研究中被广泛应用,该函数在平常的图像二值分类的问题中有着较好的效果,因为在普通的图像中,零和非零的样本的分布或多或少是均衡的,但在本文的断层识别问题中,因为在一张地震数据图像中,断层和非断层高度不平衡,如果我们在此断层识别问题中使用此损失函数训练网络,很容易造成网络朝着错误的方向收敛,会造成网络容易将预测结果判定为非断层,从而造成误判率较高,因此本文考虑使用平衡交叉熵损失来解决样本的高度不平衡问题。主要是通过增加惩罚系数,对数量少的类别增加权重,对数量多的类别减少权重的方法,来减少这种样本之间的不平衡,从而使网络模型朝着正确的方向收敛,二分类交叉熵损失公式为:
Figure FSA0000235847100000031
pi表示的是样本在该类别中预测的概率,yi表示样本标签,
平衡交叉熵损失公式为:
Figure FSA0000235847100000032
Figure FSA0000235847100000033
β在本文中表示在一张地震图像中非断层像素点与地震图像总像素点的比值,而1-β表示断层像素点与图像总像素点的比值。
3.根据权利要求1所述的一种基于人工智能断层识别方法,其特征在于,S3包括以下内容:
最后在网络中使用全连接层的话,一是存储开销很大,二是计算效率低下,为了进一步减少网络的计算量,本发明把最后的3层全连接层使用了一层1×1的卷积替代,在很大程度上减少了神经网络的参数,让网络更易训练,同时因为全连接层的输入尺寸是固定的,替换全连接层为卷积层之后,那么我们对于输入图片的大小是没有任何限制的,大图小图一样都经过卷积池化激活,因为卷积核的参数个数与图像大小无关,而且全连接层会破坏图像的空间结构,而使用1×1卷积层替代全连接层后,不会破坏图像的空间结构。
4.根据权利要求1所述的一种基于人工智能断层识别方法,其特征在于,实现此方法应用包括以下步骤:
SS1:根据本发明做出的改进构建神经网络结构,
SS2:输入地震数据到神经网络结构中训练,计算出网络模型的准确率和损失值曲线,
SS3:把需要预测的数据输入到训练好的网络模型中去,得到预测结果。
CN202110273316.8A 2021-03-12 2021-03-12 一种基于人工智能断层识别方法 Pending CN112906626A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110273316.8A CN112906626A (zh) 2021-03-12 2021-03-12 一种基于人工智能断层识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110273316.8A CN112906626A (zh) 2021-03-12 2021-03-12 一种基于人工智能断层识别方法

Publications (1)

Publication Number Publication Date
CN112906626A true CN112906626A (zh) 2021-06-04

Family

ID=76104992

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110273316.8A Pending CN112906626A (zh) 2021-03-12 2021-03-12 一种基于人工智能断层识别方法

Country Status (1)

Country Link
CN (1) CN112906626A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113703048A (zh) * 2021-08-30 2021-11-26 中国科学院地质与地球物理研究所 对抗神经网络高分辨率地震断层检测方法和系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106599827A (zh) * 2016-12-09 2017-04-26 浙江工商大学 一种基于深度卷积神经网络的小目标快速检测方法
CN108334843A (zh) * 2018-02-02 2018-07-27 成都国铁电气设备有限公司 一种基于改进AlexNet的燃弧识别方法
CN109086773A (zh) * 2018-08-29 2018-12-25 电子科技大学 基于全卷积神经网络的断层面识别方法
CN109086799A (zh) * 2018-07-04 2018-12-25 江苏大学 一种基于改进卷积神经网络模型AlexNet的作物叶片病害识别方法
CN109117858A (zh) * 2017-06-26 2019-01-01 北京金风科创风电设备有限公司 监测风力发电机叶片结冰的方法及装置
CN111553193A (zh) * 2020-04-01 2020-08-18 东南大学 一种基于轻量级深层神经网络的视觉slam闭环检测方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106599827A (zh) * 2016-12-09 2017-04-26 浙江工商大学 一种基于深度卷积神经网络的小目标快速检测方法
CN109117858A (zh) * 2017-06-26 2019-01-01 北京金风科创风电设备有限公司 监测风力发电机叶片结冰的方法及装置
CN108334843A (zh) * 2018-02-02 2018-07-27 成都国铁电气设备有限公司 一种基于改进AlexNet的燃弧识别方法
CN109086799A (zh) * 2018-07-04 2018-12-25 江苏大学 一种基于改进卷积神经网络模型AlexNet的作物叶片病害识别方法
CN109086773A (zh) * 2018-08-29 2018-12-25 电子科技大学 基于全卷积神经网络的断层面识别方法
CN111553193A (zh) * 2020-04-01 2020-08-18 东南大学 一种基于轻量级深层神经网络的视觉slam闭环检测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
石翠萍: "基于改进 AlexNet 卷积神经网络的人脸表情识别", 《电讯技术》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113703048A (zh) * 2021-08-30 2021-11-26 中国科学院地质与地球物理研究所 对抗神经网络高分辨率地震断层检测方法和系统
CN113703048B (zh) * 2021-08-30 2022-08-23 中国科学院地质与地球物理研究所 对抗神经网络高分辨率地震断层检测方法和系统

Similar Documents

Publication Publication Date Title
CN111091105B (zh) 基于新的边框回归损失函数的遥感图像目标检测方法
WO2021139069A1 (zh) 自适应注意力指导机制的一般性目标检测方法
CN110472627B (zh) 一种端到端的sar图像识别方法、装置及存储介质
CN112766087A (zh) 一种基于知识蒸馏的光学遥感图像舰船检测方法
CN109934200A (zh) 一种基于改进M-Net的RGB彩色遥感图像云检测方法及系统
CN111626993A (zh) 一种基于嵌入式FEFnet网络的图像自动检测计数方法及系统
CN109932708A (zh) 一种基于干涉条纹和深度学习的水面水下分类目标的方法
CN110991257B (zh) 基于特征融合与svm的极化sar溢油检测方法
CN106611193A (zh) 一种基于特征变量算法的图像内容信息分析方法
CN111597751B (zh) 基于自扩展深度置信网络的原油油膜绝对厚度反演方法
CN116110022B (zh) 基于响应知识蒸馏的轻量化交通标志检测方法及系统
CN111709386B (zh) 一种水下浅地层剖面图像底质分类方法及系统
CN110472572A (zh) 一种复杂环境下海上目标的快速识别和分类方法
CN113920400A (zh) 一种基于改进YOLOv3的金属表面缺陷检测方法
CN112102322A (zh) 一种基于多模态U-Net的断层识别方法
CN111381275A (zh) 一种地震数据的初至拾取方法和装置
CN114463643A (zh) 多模型决策级融合的滑坡识别方法及装置
CN112731522A (zh) 地震地层智能识别方法、装置、设备及存储介质
CN111145145A (zh) 一种基于MobileNets的图像表面缺陷检测方法
CN109871792A (zh) 行人检测方法和装置
CN111815680A (zh) 基于恒等快捷映射的深层卷积神经网络自动层位追踪方法
CN114676733A (zh) 一种基于稀疏自编码辅助分类生成式对抗网络的复杂供输机构故障诊断方法
Zhang et al. SaltISCG: Interactive salt segmentation method based on CNN and graph cut
CN112906626A (zh) 一种基于人工智能断层识别方法
CN113505712B (zh) 基于类平衡损失函数的卷积神经网络的海面溢油检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20210604

WD01 Invention patent application deemed withdrawn after publication