CN115937568B - 一种玄武岩构造背景分类方法、系统、装置及存储介质 - Google Patents

一种玄武岩构造背景分类方法、系统、装置及存储介质 Download PDF

Info

Publication number
CN115937568B
CN115937568B CN202211212450.8A CN202211212450A CN115937568B CN 115937568 B CN115937568 B CN 115937568B CN 202211212450 A CN202211212450 A CN 202211212450A CN 115937568 B CN115937568 B CN 115937568B
Authority
CN
China
Prior art keywords
basalt
data set
data
neural network
deep neural
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202211212450.8A
Other languages
English (en)
Other versions
CN115937568A (zh
Inventor
牛云云
薛胜超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China University of Geosciences Beijing
Original Assignee
China University of Geosciences Beijing
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China University of Geosciences Beijing filed Critical China University of Geosciences Beijing
Priority to CN202211212450.8A priority Critical patent/CN115937568B/zh
Publication of CN115937568A publication Critical patent/CN115937568A/zh
Application granted granted Critical
Publication of CN115937568B publication Critical patent/CN115937568B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种玄武岩构造背景分类方法、系统、装置及存储介质,获取玄武岩数据集,对玄武岩数据集进行数据预处理,得到目标数据集;构建深度神经网络;通过目标数据集对深度神经网络进行参数优化;获取待判别数据,通过降维算法对待判别数据进行降维压缩处理,得到二维压缩数据;根据二维压缩数据,通过完成参数优化的深度神经网络绘制二维决策边界。本发明能够缓解数据不平衡并减少数据使用量;通过深度神经网络能够避免了耗时耗力的特征工程阶段,进而结合对深度神经网络的参数优化,提高了分类准确率;最终绘制出二维决策边界,从而更加直观有效的观察分类效果,可广泛应用于数据技术领域。

Description

一种玄武岩构造背景分类方法、系统、装置及存储介质
技术领域
本发明涉及数据处理技术领域,尤其是一种玄武岩构造背景分类方法、系统、装置及存储介质。
背景技术
玄武岩是岩浆经火山口喷出到地表后在大气圈和水圈中冷却结晶形成的,是一种具有重要经济价值的矿产资源,在建筑、净水、铁路等行业有着重要的应用。玄武岩的形成环境决定了玄武岩的性质。在地球化学上区分不同构造环境中的岩浆活动,是理解地幔内岩浆生成过程的基本要求,是恢复造山带构造演化的关键,对划分构造旋回有着重要意义。此外,在地球科学中,对任何地质作用的属性、形成及发展过程的研究都必须考虑其所处的区域地质构造背景。对玄武岩的构造背景进行准确判别,是研究玄武岩地球科学的重要工作,对玄武岩形成环境的研究具有重要意义。以往的研究中往往通过分析玄武岩中所含元素浓度并绘制二元图或者三元图区分玄武岩的形成环境。但这种分类方法很难准确地对玄武岩进行分类。
20世纪70年代由Pearce等人提出了的微量元素判别图,作为一种对玄武岩及其他玄武岩的构造背景的判别方法。通过对少量元素类型进行X射线荧光光谱法(XBF)或仪器中子活化分析(INAA)进行测量,在当时也能得当相对精确的判别结果,并采用二元判别图或三元判别图对结果进行绘制,如图1所示。但由于判别图的维度限制,导致基于判别图的分析方法不能很好地利用玄武岩所有的元素特征。Li等人又进一步说明判别图作为玄武岩构造背景的判别工具的不精确性,第一,由于玄武岩构造背景种类的增多,使得仅使用数量非常有限的地球化学参数识别构造环境变得复杂;第二,俯冲相关玄武岩在地球化学上与地壳污染玄武岩相似,使得通过判别图分析方法难以将二者进行区分;第三,来自大洋中脊的大多数玄武岩中不共享、不相容的元素的明显缺乏,导致来自大洋中脊的玄武岩只拥有少量作为区分其构造背景的元素特征,而难以对其构造背景进行判别。上述这些原因导致了判别图作为玄武岩构造环境的判别工具表现不佳,该判别方法现在并不占优。
随着人工智能的发展,利用传统机器学习算法求解分类问题进入大众的视野,Petrelli等人使用机器学习算法——带有径向基函数核(RBF)的支持向量机(SVM),对玄武岩的8个构造背景进行判别,打破了维度的限制,并通过对比使用OVO(one vs one)和OVR(one vs rest)策略,使得SVM在该分类问题中表现良好,在最佳的配置环境下,除弧后盆地(BAB)外,其他构造背景的分类准确率都能达到84%以上,BAB构造环境的分类准确率只有65%,其分类精度混淆矩阵如图2所示。2018年,Ueki等人分别使用传统机器学习算法SVM、随机森林(RF)和稀疏多项式(SMR)对玄武岩的8个构造背景进行判别,并对分类结果均采用10倍交叉验证,其使用SVM得到的结论与Petrelli等人类似,在BAB样本上分类精确度仍不高,为74%,而其余都高于91%,如图3所示。如图4所示,基于RF(左)和SMR(右)方法得到的分类分数(classification score,CS)都低于SVM,但RF和SMR可以产生有关个别构造背景的一定的地球化学信息,如RF可以在识别过程中确定特征的重要程度、SMR提供了可以确定给定样本来自特定构造设置的可能性。
传统机器学习算法在解决玄武岩构造背景分类问题时避免不了复杂繁琐的特征工程,不能对所有的玄武岩构造背景进行很好的判别,如BAB。但是,先前的工作都需要借助玄武岩的常量+微量+同位素的复杂多元的数据组合,才能对玄武岩构造背景做出良好的判别。
发明内容
有鉴于此,本发明实施例提供了一种检测精度高,部署成本低的,一种玄武岩构造背景分类方法、系统、装置及存储介质。
一方面,本发明实施例提供了一种玄武岩构造背景分类方法,包括:
获取玄武岩数据集,对所述玄武岩数据集进行数据预处理,得到目标数据集;其中,所述数据预处理包括标准化处理、高斯变换处理和数据增强处理;
构建深度神经网络;
通过所述目标数据集对所述深度神经网络进行参数优化;
获取待判别数据,通过降维算法对所述待判别数据进行降维压缩处理,得到二维压缩数据;
根据所述二维压缩数据,通过完成参数优化的深度神经网络绘制二维决策边界。
可选地,所述对所述玄武岩数据集进行数据预处理,得到目标数据集,包括:
对所述玄武岩数据集进行标准化处理,得到尺寸统一的第一数据集;
对所述第一数据集进行高斯变换处理,得到高斯分布的第二数据集;
通过Smote算法对所述第二数据集进行数据增强处理,通过插值的方式产生额外的样本,得到目标数据集。
可选地,所述构建深度神经网络,包括:
根据输入层、隐藏层和输出层构建深度神经网络;
其中,部分所述隐藏层中加入了弃权层。
可选地,所述通过所述目标数据集对所述深度神经网络进行参数优化,包括:
初始化所述深度神经网络的权重参数;
基于所述目标数据集,通过损失函数和参数选择器迭代更新权重参数,直至达到预设的迭代次数和/或网络模型的误差和精度达到预设的阈值范围。
可选地,所述通过损失函数和参数选择器迭代更新权重参数,包括:
基于前向传播,通过损失函数计算损失值;
基于反向传播,根据所述损失值,通过参数选择器采用自适应矩估计算法进行权重优化;
根据所述前向传播和所述反向传播,进行迭代更新权重参数。
可选地,所述通过损失函数计算损失值,包括:
通过交叉熵损失函数计算损失值;
其中,所述交叉熵损失函数的公式为:
其中,loss(x,class)表示损失值,x[class]表示真实标签的预测值,x[j]表示玄武岩第j个类别的预测值。
可选地,所述通过参数选择器进行权重优化,包括:
通过参数选择器,采用自适应矩估计算法进行权重优化;
其中,所述自适应矩估计算法的公式为:
t←t+1
mt←β1·mt-1+(1-β1)·gt
其中,t表示更新步数,gt表示损失函数对权重的梯度,表示梯度计算,ft()为损失函数,wt-1表示第t-1步的网络权重,wt表示第t步的网络权重,mt表示一阶矩估计,β1表示一阶矩指数衰减系数,vt表示二阶矩估计,β2表示二阶矩指数衰减系数,/>表示mt的偏置矫正,/>表示vt的偏置矫正,α表示学习率,ε表示防除零参数。
第二方面,本发明实施例提供了一种玄武岩构造背景分类系统,包括:
第一模块,用于获取玄武岩数据集,对所述玄武岩数据集进行数据预处理,得到目标数据集;其中,所述数据预处理包括标准化处理、高斯变换处理和数据增强处理;
第二模块,用于构建深度神经网络;
第三模块,用于通过所述目标数据集对所述深度神经网络进行参数优化;
第四模块,用于获取待判别数据,通过降维算法对所述待判别数据进行降维压缩处理,得到二维压缩数据;
第五模块,用于根据所述二维压缩数据,通过完成参数优化的深度神经网络绘制二维决策边界。
另一方面,本发明实施例提供了一种玄武岩构造背景分类装置,包括处理器以及存储器;
所述存储器用于存储程序;
所述处理器执行所述程序实现如前面所述的方法。
另一方面,本发明实施例提供了一种计算机可读存储介质,所述存储介质存储有程序,所述程序被处理器执行实现如前面所述的方法。
本发明实施例还公开了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器可以从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行前面的方法。
本发明的实施例首先获取玄武岩数据集,对所述玄武岩数据集进行数据预处理,得到目标数据集;其中,所述数据预处理包括标准化处理、高斯变换处理和数据增强处理;随后构建深度神经网络;之后通过所述目标数据集对所述深度神经网络进行参数优化;然后获取待判别数据,通过降维算法对所述待判别数据进行降维压缩处理,得到二维压缩数据;最终根据所述二维压缩数据,通过完成参数优化的深度神经网络绘制二维决策边界。本发明通过数据预处理,基于标准化处理、高斯变换处理和数据增强处理能够缓解数据不平衡并减少数据使用量;深度神经网络相比于传统方法和基于机器学习算法的玄武岩分类器,避免了耗时耗力的特征工程阶段,进而结合对深度神经网络的参数优化,提高了分类准确率;最终利用降维算法能够将高维特征数据压缩为二维数据,根据压缩后的数据用深度神经网络绘制出二维决策边界,从而更加直观有效的观察分类效果。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为利用二元图和三元图对玄武岩构造背景进行分类的示意图;
图2为使用常量元素+微量元素+同位素(29D)、非线性核RBF和OVO方法进行LOO交叉校准的分类精度混淆矩阵示意图;
图3为使用SVM算法并进行10倍交叉验证的分类精度混淆矩阵示意图;
图4为使用RF和SMR并进行10倍交叉验证的分类精度混淆矩阵的示意图;
图5为本发明实施例提供的玄武岩构造背景分类方法的整体流程示意图;
图6为本发明实施例提供的玄武岩构造背景分类方法的总体流程示意图;
图7为本发明实施例提供的深度神经网络的结构示意图;
图8为本发明实施例提供的深度神经网络训练的流程示意图;
图9为本发明实施例提供的基于不同降维算法绘制的决策边界的示意图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
针对现有技术存在的问题,一方面,本发明提供了一种玄武岩构造背景分类方法,如图5和图6所示,方法包括以下步骤:
S100、获取玄武岩数据集,对玄武岩数据集进行数据预处理,得到目标数据集;
需要说明的是,其中,数据预处理包括标准化处理、高斯变换处理和数据增强处理;一些实施例中,对玄武岩数据集进行标准化处理,得到尺寸统一的第一数据集;对第一数据集进行高斯变换处理,得到高斯分布的第二数据集;通过Smote算法对第二数据集进行数据增强处理,通过插值的方式产生额外的样本,得到目标数据集;其中,目标数据集按照8:1:1的比例划分为训练集、验证集和测试集。
具体地,如图6所示,数据预处理包括数据标准化,对数据进行高斯变换,并利用smote算法进行数据增强,缓解数据不平衡,最后,将数据集以8:1:1的比例划分为训练集、验证集和测试集。将玄武岩数据集按照8:1:1的比例划分为训练集、验证集和测试集。训练集的作用是训练分类器模型,验证集的作用是优化模型的超参数,测试集的作用是验证分类器在新数据下的效果。为了更好地解决玄武岩构造背景分类问题,需对数据进行标准化处理,将数据按其属性减去其均值,然后除以其方差,可以使得不同的特征变量具有相同的尺度,从而消除特征之间的差异性,加快收敛速度,提高分类的准确性。除此之外,对数据进行数据变换,获得高斯分布,目的是缓解数据分布倾斜的影响,使原本密集的区间的值,尽可能变得分散。玄武岩数据集中的样本分布不平衡可能会影响最终的玄武岩分类效果,因此利用Smote算法缓解数据集的不平衡,Smote算法可以充分利用已有数据集,挖掘更多信息,在少数类样本之间通过插值的方法产生额外的样本。
其中,本发明使用了玄武岩的常量+微量元素的数据组合。相较于之前的研究,本发明无需使用玄武岩的同位素数据,并且能达到更好的判别效果。之前的工作都需要借助玄武岩的常量(SiO2、TiO2、Al2O3、Fe2O3、CaO、MgO、Na2O、K2O等)+微量(Sr、Ba、Rb、Zr、Nb、La、Ce、Nd、Hf、Sm、Gd等)+同位素元素(206Pb/204Pb、207Pb/204Pb、208Pb/204Pb、87Sr/86Sr、143Nd/144Nd等)的数据组合,才能对玄武岩构造背景做出判别。本发明只需使用玄武岩的常量(SiO2、TiO2、Al2O3、Fe2O3、CaO、MgO、Na2O、K2O等)+微量(Sr、Ba、Rb、Zr、Nb、La、Ce、Nd、Hf、Sm、Gd等)的数据组合。
S200、构建深度神经网络;
需要说明的是,一些实施例中,根据输入层、隐藏层和输出层构建深度神经网络;其中,部分隐藏层中加入了弃权层。
具体地,本发明选择利用深度神经网络构建玄武岩构造背景分类模型。深度学习是近年来比较火热的一个机器学习领域,区别于传统的浅层学习,深度学习强调模型的深度,明确了特征的重要性,通过设计建立适量的神经元计算节点和多层运算层次结构,选择合适的输入层和输出层,通过网络的学习和调优,建立起输入到输出的函数关系,以实现对复杂事务的处理。本发明构建具有7层隐藏层的深度神经网络,均为全连接层,选择非线性激活函数以打破特征线性变换。由于训练样本有限,为了防止模型过拟合,在隐藏层中加入3个弃权层(Dropout),Dropout能够在模型训练时以概率p“丢弃”一些神经元,可以有效减少层与层之间元素的依赖程度。
其中,网络结构如图7所示,深度神经网络包括三层结构,包括输入层、隐藏层、输出层,输入层负责接收输入数据,在隐藏层和输出层进行计算和输出,构建深度神经网络的重点在于确定输入层和输出层中的节点数(神经元数)、网络层的层数和隐藏层的节点数,即网络的拓扑结构。显然,玄武岩数据集中,包含39个特征,为了接收这些特征量,网络的输入层需要39个节点。由于分类器需要完成的是8分类任务,网络的输出层则需要8个输出节点。经过多次实验,本发明最终使用了7层的隐藏层,每层有100个网络节点,由于网络较深且训练样本有限,为了防止模型过拟合,在隐藏层中加入了三个弃权层(Dropout),Dropout能够在模型训练时以概率p“丢弃”一些神经元,可以有效减少层与层之间元素的依赖程度,Dropout层只在模型训练阶段使用。
S300、通过目标数据集对深度神经网络进行参数优化;
需要说明的是,初始化深度神经网络的权重参数;基于目标数据集,通过损失函数和参数选择器迭代更新权重参数,直至达到预设的迭代次数和/或网络模型的误差和精度达到预设的阈值范围;其中,通过损失函数和参数选择器迭代更新权重参数,包括:基于前向传播,通过损失函数计算损失值;基于反向传播,根据损失值,通过参数选择器采用自适应矩估计算法进行权重优化;根据前向传播和反向传播,进行迭代更新权重参数。
具体地,设计好深度神经网络的网络模型后,参照图6,选择使用损失函数来判断模型训练效果,并通过参数优化器更新网络权重。模型训练开始前,先初始化网络权重参数,设置好网络超参数以及训练轮数,即可开始训练,可以通过观察损失值和模型在验证集上的准确率变化来不断调整超参数。重复以上训练操作,直到模型的训练误差和分类精度在允许范围内,此时模型具有良好的分类效果。
其中,深度神经网络的优化训练流程如图8所示,深度学习归根到底,是利用层到层的函数的复杂组合,从而找到定义从输入到输出的映射函数,而训练的过程其实就是函数参数优化的过程。参数优化过程分为两步,前向传播计算损失函数,反向传播求梯度下降,也就是BP(Back-Propagation)算。前向传播包括数据传递和数据处理,即每层的神经元为一个激活函数,处理上层传来的数据,并传递给下一层。其神经元的计算公式如公式(1)所示:
式中,W(l)表示第l层网络的权重矩阵;b(l)表示第l层的偏置单元,增加偏置单元可以给网络分类增加平移的能力;z(l)表示第l-1层网络的输出,也即第l层网络的输入表示;σ()表示非线性激活函数,增加网络模型的非线性,激活函数给神经元引入了非线性因素,使得神经网络可以任意逼近任何非线性函数,从而找到定义从输入到输出的映射函数;a(l)表示z(l)经过非线性变换后的结果,其中,a(0)表示神经网络输入层的输入数据。本发明的激活函数采用ReLU(),如公式(2)所示:
σ(x)=max(0,x)(2)
ReLU()激活函数不涉及指数等高成本的复杂计算,计算速度更快,此外,ReLU()可以对抗梯度消失。网络权重初始化后,便可以通过前向传播计算得到预测值,至此,模型还不具备分类的能力,还需要通过反向传播求梯度去更新权重,权重的更新需要损失函数的指导,通过利用损失函数计算出预测值与真实值的误差,本发明为多分类任务,选择使用交叉熵损失函数,如公式(3)所示:
式中,loss(x,class)表示损失值,x[class]表示真实标签的预测值,x[j]表示玄武岩第j个类别的预测值,j是属于[0,7]的整数。在本发明中,j取8(8个预测值),由上式可以看出,交叉熵损失函数用于多分类任务时,加入了归一化指数函数,它使得网络输出的8个预测值非负,并可以让所有的输出是以概率的形式呈现出来,即所有的输出加起来等于1。当真实标签的预测值越高时,loss越接近0,相反,loss越大。有了损失函数计算损失值后,再根据损失函数的导数,沿梯度最小方向将误差回传,利用优化器进行权重更新。在进行反向传播更新权重时,需要先根据损失函数算出输出层的梯度,因为loss是关于和的复合函数,并且loss可微,则可以利用链式法则分别去求解loss关于W和b的微分,如公式(4)所示:
将公共部分记作δ(l)
计算出l层(输出层)的梯度后,根据链式法则和数学归纳法,就可以得到δ(l)的递推关系式,如(6)所示:
式中,σ′(z(l))表示σ()关于z(l)的导数,由上式可知,只要求出了某一层的δ(l),就可以求出W(l)和b(l)对应的梯度,如公式(7)所示:
求出每层的梯度后,通过参数优化器更新网络权重,本发明采用自适应矩估计算法(Adaptive Moment Estimation,Adam)优化参数,Adam是一种自适应学习率的随机优化算法,它利用计算梯度的一阶矩估计和二阶矩估计动态地调整每个参数的学习率,根据公式(8)进行权重优化:
t←t+1
mt←β1·mt-1+(1-β1)·gt
式中,t表示更新步数,gt表示损失函数对权重的梯度,表示梯度计算,ft()为损失函数,wt-1表示第t-1步的网络权重,wt表示第t步的网络权重,mt表示一阶矩估计,β1表示一阶矩指数衰减系数,vt表示二阶矩估计,β2表示二阶矩指数衰减系数,/>表示mt的偏置矫正,/>表示vt的偏置矫正,ε表示防除零参数。
t为更新的步数(steps);α为学习率,用于控制步幅(stepsize);w为神经网络的权重,也就是要更新的参数,wt-1表示第t-1步的网络权重,wt表示第t步的网络权重;ft()为损失函数;gt为损失函数对权重的梯度;β1为一阶矩指数衰减系数,一般取0.9,β2为二阶矩指数衰减系数,一般取0.999,β1、β2∈[0,1);mt为一阶矩估计,即gt的期望,而vt为二阶矩估计,即的期望,/>两者初始值为0。/>和/>分别为mt和vt的偏置矫正(biascorrection),一般取10-8。公式(8)第一步首先更新步数,第二步求出梯度,第三步计算梯度的一阶矩,也即历史梯度与当前梯度的均值,类似平滑操作,第四步计算梯度的二阶矩,也即历史梯度的平滑与当前梯度平方的均值,接下来两步是对一阶矩和二阶矩的矫正,随着的逐渐增大,衰减系数逐渐减小,一阶矩和二阶矩逐渐减小,最后一步优化神经网络的权重,ε是一个防止除0的参数。至此,反向传播结束,网络模型完成了一次参数优化,反复迭代,不断调整网络超参数。最终在训练500轮的情况下,学习率取0.003时,可以使得目标函数达到最优。模型训练结束后,可将验证集输入到模型中检验模型质量。
S400、获取待判别数据,通过降维算法对待判别数据进行降维压缩处理,得到二维压缩数据;
S500、根据二维压缩数据,通过完成参数优化的深度神经网络绘制二维决策边界;
具体地,本发明提出了利用降维算法将数据从高维压缩为二维,并利用压缩后的数据和深度神经网络算法绘制二维决策边界,从而提供了玄武岩分类器的可视化工具;其中,一些实施例中,对基于不同降维算法的二维决策边界进行了对比。
其中,本方发明提出基于降维算法并利用深度神经网络绘制玄武岩分类器的二维决策边界,实现了本文提出的玄武岩分类器的可视化,并且对比了基于不同降维算法绘制的决策边界的可视化效果。绘制决策平面首先将高维特征数据通过降维算法压缩为二维数据,利用压缩后的数据对基于深度神经网络的玄武岩分类模型进行训练,之后在二维平面上等距离选取坐标点,将选取的坐标点作为新的数据,利用训练好的分类模型完成分类,最后将所有数据投射到二维平面上。图9表示利用不同的降维算法将玄武岩样本数据从高维映射到二维,并利用深度神经网络画出的决策边界图。表1表示利用不同的降维算法将玄武岩样本数据从高维映射到二维,并利用深度神经网络画出的决策边界图的分类准确率,可以看出基于T-SNE降维算法的决策边界可视化效果较好,判别精度为0.92。
表1
另一方面,本发明实施例提供了一种玄武岩构造背景分类系统,包括:
第一模块,用于获取玄武岩数据集,对玄武岩数据集进行数据预处理,得到目标数据集;其中,数据预处理包括标准化处理、高斯变换处理和数据增强处理;
第二模块,用于构建深度神经网络;
第三模块,用于通过目标数据集对深度神经网络进行参数优化;
第四模块,用于获取待判别数据,通过降维算法对待判别数据进行降维压缩处理,得到二维压缩数据;
第五模块,用于根据二维压缩数据,通过完成参数优化的深度神经网络绘制二维决策边界。
本发明方法实施例的内容均适用于本系统实施例,本系统实施例所具体实现的功能与上述方法实施例相同,并且达到的有益效果与上述方法达到的有益效果也相同。
本发明实施例的另一方面还提供了一种玄武岩构造背景分类装置,包括处理器以及存储器;
存储器用于存储程序;
处理器执行程序实现如前面所述的方法。
本发明方法实施例的内容均适用于本装置实施例,本装置实施例所具体实现的功能与上述方法实施例相同,并且达到的有益效果与上述方法达到的有益效果也相同。
本发明实施例的另一方面还提供了一种计算机可读存储介质,所述存储介质存储有程序,所述程序被处理器执行实现如前面所述的方法。
本发明方法实施例的内容均适用于本计算机可读存储介质实施例,本计算机可读存储介质实施例所具体实现的功能与上述方法实施例相同,并且达到的有益效果与上述方法达到的有益效果也相同。
本发明实施例还公开了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器可以从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行前面的方法。
综上所述,本发明利用深度学习技术实现了对玄武岩构造背景的分类,区别于传统的分类方法,本发明不再需要耗时耗力的特征工程阶段,而是可以将全部特征输入到网络当中,打破了输入维度的限制,并且能够有效利用所有的特征,更好地对玄武岩构造背景进行分类。本发明打破了先前的工作都需要借助玄武岩的常量+微量+同位素元素的数据组合要求,只需要常量+微量元素的数据组合即可对玄武岩构造背景进行良好的判别。本发明通过Smote对数据集进行数据增强,有效缓解了数据不平衡的问题,进一步提升了分类器判别效果。过去通过绘制二元图或者三元图无法直观的区分不同种类的玄武岩样本,选择特定的样本特征并基于传统机器学习算法绘制决策边界也无法可靠的区分玄武岩样本。本发明提出利用降维算法将高维特征数据压缩为二维数据,根据压缩后的数据用深度神经网络算法绘制二维(2D)决策边界,从而更加直观有效的观察分类模型的分类效果。在分类精度上,过去不管是传统方法还是基于传统机器学习算法的分类器都不能对所有的玄武岩构造背景进行很好的判别,而基于深度学习的玄武岩的构造背景分类器,在测试集上的分类效果优良,所有构造背景的分类准确率不低于94%。
在一些可选择的实施例中,在方框图中提到的功能/操作可以不按照操作示图提到的顺序发生。例如,取决于所涉及的功能/操作,连续示出的两个方框实际上可以被大体上同时地执行或所述方框有时能以相反顺序被执行。此外,在本发明的流程图中所呈现和描述的实施例以示例的方式被提供,目的在于提供对技术更全面的理解。所公开的方法不限于本文所呈现的操作和逻辑流程。可选择的实施例是可预期的,其中各种操作的顺序被改变以及其中被描述为较大操作的一部分的子操作被独立地执行。
此外,虽然在功能性模块的背景下描述了本发明,但应当理解的是,除非另有相反说明,所述的功能和/或特征中的一个或多个可以被集成在单个物理装置和/或软件模块中,或者一个或多个功能和/或特征可以在单独的物理装置或软件模块中被实现。还可以理解的是,有关每个模块的实际实现的详细讨论对于理解本发明是不必要的。更确切地说,考虑到在本文中公开的装置中各种功能模块的属性、功能和内部关系的情况下,在工程师的常规技术内将会了解该模块的实际实现。因此,本领域技术人员运用普通技术就能够在无需过度试验的情况下实现在权利要求书中所阐明的本发明。还可以理解的是,所公开的特定概念仅仅是说明性的,并不意在限制本发明的范围,本发明的范围由所附权利要求书及其等同方案的全部范围来决定。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,“计算机可读介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。
计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管已经示出和描述了本发明的实施例,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同物限定。
以上是对本发明的较佳实施进行了具体说明,但本发明并不限于所述实施例,熟悉本领域的技术人员在不违背本发明精神的前提下还可做出种种的等同变形或替换,这些等同的变形或替换均包含在本申请权利要求所限定的范围内。

Claims (5)

1.一种玄武岩构造背景分类方法,其特征在于,包括:
获取玄武岩数据集,对所述玄武岩数据集进行数据预处理,得到目标数据集;其中,所述数据预处理包括标准化处理、高斯变换处理和数据增强处理;所述玄武岩数据集使用玄武岩的常量+微量的数据组合;所述玄武岩的常量包括SiO2、TiO2、Al2O3、Fe2O3、CaO、MgO、Na2O、K2O;所述玄武岩的微量包括Sr、Ba、Rb、Zr、Nb、La、Ce、Nd、Hf、Sm、Gd;所述对所述玄武岩数据集进行数据预处理,得到目标数据集,包括:
对所述玄武岩数据集进行标准化处理,得到尺寸统一的第一数据集;
对所述第一数据集进行高斯变换处理,得到高斯分布的第二数据集;
通过Smote算法对所述第二数据集进行数据增强处理,通过插值的方式产生额外的样本,得到目标数据集;
构建深度神经网络;所述构建深度神经网络,包括:
根据输入层、隐藏层和输出层构建深度神经网络;
其中,所述深度神经网络使用了7层的所述隐藏层,每层有100个网络节点,在所述隐藏层中加入了三个弃权层,弃权层只在模型训练阶段使用;
通过所述目标数据集对所述深度神经网络进行参数优化;所述通过所述目标数据集对所述深度神经网络进行参数优化,包括:
初始化所述深度神经网络的权重参数;
基于所述目标数据集,通过损失函数和参数选择器迭代更新权重参数,直至达到预设的迭代次数和/或网络模型的误差和精度达到预设的阈值范围;所述通过损失函数和参数选择器迭代更新权重参数,包括:
基于前向传播,通过损失函数计算损失值;
基于反向传播,根据所述损失值,通过参数选择器采用自适应矩估计算法进行权重优化;
根据所述前向传播和所述反向传播,进行迭代更新权重参数;
所述通过损失函数计算损失值,包括:
通过交叉熵损失函数计算损失值;
其中,所述交叉熵损失函数的公式为:
其中,loss(x,class)表示损失值,x[class]表示真实标签的预测值,x[j]表示玄武岩第j个类别的预测值;
获取待判别数据,通过降维算法对所述待判别数据进行降维压缩处理,得到二维压缩数据;
根据所述二维压缩数据,通过完成参数优化的深度神经网络绘制二维决策边界。
2.根据权利要求1所述的一种玄武岩构造背景分类方法,其特征在于,所述通过参数选择器进行权重优化,包括:
通过参数选择器,采用自适应矩估计算法进行权重优化;
其中,所述自适应矩估计算法的公式为:
t←t+1
mt←β1·mt-1+(1-β1)·gt
其中,t表示更新步数,gt表示损失函数对权重的梯度,表示梯度计算,ft()表示损失函数,wt-1表示第t-1步的网络权重,wt表示第t步的网络权重,mt表示一阶矩估计,β1表示一阶矩指数衰减系数,vt表示二阶矩估计,β2表示二阶矩指数衰减系数,/>表示mt的偏置矫正,/>表示vt的偏置矫正,α表示学习率,ε表示防除零参数。
3.一种玄武岩构造背景分类系统,其特征在于,包括:
第一模块,用于获取玄武岩数据集,对所述玄武岩数据集进行数据预处理,得到目标数据集;其中,所述数据预处理包括标准化处理、高斯变换处理和数据增强处理;所述玄武岩数据集使用玄武岩的常量+微量的数据组合;所述玄武岩的常量包括SiO2、TiO2、Al2O3、Fe2O3、CaO、MgO、Na2O、K2O;所述玄武岩的微量包括Sr、Ba、Rb、Zr、Nb、La、Ce、Nd、Hf、Sm、Gd;所述对所述玄武岩数据集进行数据预处理,得到目标数据集,包括:
对所述玄武岩数据集进行标准化处理,得到尺寸统一的第一数据集;
对所述第一数据集进行高斯变换处理,得到高斯分布的第二数据集;
通过Smote算法对所述第二数据集进行数据增强处理,通过插值的方式产生额外的样本,得到目标数据集;
第二模块,用于构建深度神经网络;所述构建深度神经网络,包括:
根据输入层、隐藏层和输出层构建深度神经网络;
其中,所述深度神经网络使用了7层的所述隐藏层,每层有100个网络节点,在所述隐藏层中加入了三个弃权层,弃权层只在模型训练阶段使用;
第三模块,用于通过所述目标数据集对所述深度神经网络进行参数优化;所述通过所述目标数据集对所述深度神经网络进行参数优化,包括:
初始化所述深度神经网络的权重参数;
基于所述目标数据集,通过损失函数和参数选择器迭代更新权重参数,直至达到预设的迭代次数和/或网络模型的误差和精度达到预设的阈值范围;所述通过损失函数和参数选择器迭代更新权重参数,包括:
基于前向传播,通过损失函数计算损失值;
基于反向传播,根据所述损失值,通过参数选择器采用自适应矩估计算法进行权重优化;
根据所述前向传播和所述反向传播,进行迭代更新权重参数;
所述通过损失函数计算损失值,包括:
通过交叉熵损失函数计算损失值;
其中,所述交叉熵损失函数的公式为:
其中,loss(x,class)表示损失值,x[class]表示真实标签的预测值,x[j]表示玄武岩第j个类别的预测值;
第四模块,用于获取待判别数据,通过降维算法对所述待判别数据进行降维压缩处理,得到二维压缩数据;
第五模块,用于根据所述二维压缩数据,通过完成参数优化的深度神经网络绘制二维决策边界。
4.一种玄武岩构造背景分类装置,其特征在于,包括处理器以及存储器;
所述存储器用于存储程序;
所述处理器执行所述程序实现如权利要求1至2中任一项所述的方法。
5.一种计算机可读存储介质,其特征在于,所述存储介质存储有程序,所述程序被处理器执行实现如权利要求1至2中任一项所述的方法。
CN202211212450.8A 2022-09-29 2022-09-29 一种玄武岩构造背景分类方法、系统、装置及存储介质 Active CN115937568B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211212450.8A CN115937568B (zh) 2022-09-29 2022-09-29 一种玄武岩构造背景分类方法、系统、装置及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211212450.8A CN115937568B (zh) 2022-09-29 2022-09-29 一种玄武岩构造背景分类方法、系统、装置及存储介质

Publications (2)

Publication Number Publication Date
CN115937568A CN115937568A (zh) 2023-04-07
CN115937568B true CN115937568B (zh) 2024-05-07

Family

ID=86654734

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211212450.8A Active CN115937568B (zh) 2022-09-29 2022-09-29 一种玄武岩构造背景分类方法、系统、装置及存储介质

Country Status (1)

Country Link
CN (1) CN115937568B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117113162B (zh) * 2023-05-23 2024-02-02 南华大学 一种融合机器学习的埃达克质岩构造背景判别图解方法

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110826458A (zh) * 2019-10-31 2020-02-21 河海大学 一种基于深度学习的多光谱遥感图像变化检测方法及系统
CN111191741A (zh) * 2020-01-15 2020-05-22 中国地质调查局发展研究中心 一种岩石识别深度学习模型岩石分类约束继承性损失方法
CN111967576A (zh) * 2020-07-22 2020-11-20 长春工程学院 一种基于深度学习的地球化学数据处理方法和系统
CN112766309A (zh) * 2020-12-30 2021-05-07 中国地质调查局成都地质调查中心 一种岩性识别方法及系统
CN112989708A (zh) * 2021-04-08 2021-06-18 重庆科技学院 一种基于lstm神经网络的测井岩性识别方法及系统
CN113111927A (zh) * 2021-04-01 2021-07-13 中国地质大学(北京) 一种基于地球物理数据使用堆叠法的三维地质建模方法
CN113177919A (zh) * 2021-04-28 2021-07-27 成都艾立本科技有限公司 Libs与深度学习结合的岩性分类及主量元素含量检测方法
CN114529110A (zh) * 2020-11-03 2022-05-24 中国石油天然气集团有限公司 一种基于深度神经网络模型的岩相反演方法及系统
CN114972913A (zh) * 2022-05-25 2022-08-30 盘锦中录油气技术服务有限公司 结合深度学习与xrf的岩屑识别方法、系统、介质及设备

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11668853B2 (en) * 2019-08-06 2023-06-06 ExxonMobil Technology and Engineering Company Petrophysical inversion with machine learning-based geologic priors

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110826458A (zh) * 2019-10-31 2020-02-21 河海大学 一种基于深度学习的多光谱遥感图像变化检测方法及系统
CN111191741A (zh) * 2020-01-15 2020-05-22 中国地质调查局发展研究中心 一种岩石识别深度学习模型岩石分类约束继承性损失方法
CN111967576A (zh) * 2020-07-22 2020-11-20 长春工程学院 一种基于深度学习的地球化学数据处理方法和系统
CN114529110A (zh) * 2020-11-03 2022-05-24 中国石油天然气集团有限公司 一种基于深度神经网络模型的岩相反演方法及系统
CN112766309A (zh) * 2020-12-30 2021-05-07 中国地质调查局成都地质调查中心 一种岩性识别方法及系统
CN113111927A (zh) * 2021-04-01 2021-07-13 中国地质大学(北京) 一种基于地球物理数据使用堆叠法的三维地质建模方法
CN112989708A (zh) * 2021-04-08 2021-06-18 重庆科技学院 一种基于lstm神经网络的测井岩性识别方法及系统
CN113177919A (zh) * 2021-04-28 2021-07-27 成都艾立本科技有限公司 Libs与深度学习结合的岩性分类及主量元素含量检测方法
CN114972913A (zh) * 2022-05-25 2022-08-30 盘锦中录油气技术服务有限公司 结合深度学习与xrf的岩屑识别方法、系统、介质及设备

Non-Patent Citations (7)

* Cited by examiner, † Cited by third party
Title
Iyas, MR et al..Mask R-CNN for rock-forming minerals identification on petrography, case study at Monterado, West Kalimantan.1ST GEOSCIENCES AND ENVIRONMENTAL SCIENCES SYMPOSIUM (ICST 2020).2021,全文. *
Zhong, RC et al..Multi-layer perceptron-based tectonic discrimination of basaltic rocks and an application on the Paleoproterozoic Xiong'er volcanic province in the North China Craton.COMPUTERS & GEOSCIENCES.2021,全文. *
基于GEOROC数据库的全球辉长岩大数据的大地构造环境智能判别研究;焦守涛等;岩石学报;20181115;第34卷(第11期);全文 *
基于改进遗传算法-神经网络的玄武岩构造环境判别及对比实验;任秋兵等;地学前缘;20190715;全文 *
基于机器学习的矿物智能识别方法研究进展与展望;郝慧珍等;地球科学;20210126;第46卷(第09期);全文 *
张涛.用人工神经网络研究元素与岩浆岩、沉积岩岩性及沉积岩矿物的关系.中国优秀硕士学位论文全文数据库 (工程科技Ⅰ辑).2017,全文. *
张雨维.基于多源数据协同的集宁浅覆盖区玄武岩提取方法研究.中国优秀硕士学位论文全文数据库 (工程科技Ⅰ辑).2020,全文. *

Also Published As

Publication number Publication date
CN115937568A (zh) 2023-04-07

Similar Documents

Publication Publication Date Title
CN111127385B (zh) 基于生成式对抗网络的医学信息跨模态哈希编码学习方法
Korenevskii et al. Generation of fuzzy network models taught on basis of data structure for medical expert systems
Guan et al. An adaptive neuro-fuzzy inference system based approach to real estate property assessment
CN112435363B (zh) 一种刀具磨损状态实时监测方法
CN105760673B (zh) 一种河流相储层地震敏感参数模板分析方法
US20120059790A1 (en) Method for providing with a score an object, and decision-support system
CN107240097B (zh) 基于mkl-svm-pso算法的肺结节图像处理方法
CN111160473A (zh) 一种分类标签的特征挖掘方法及装置
CN115080764B (zh) 基于知识图谱及聚类算法的医学相似实体分类方法及系统
CN111667035B (zh) 一种基于高频rfid的物品定位方法及装置
CN112835570A (zh) 一种基于机器学习的可视化数学建模方法和系统
CN107679368A (zh) 基于遗传算法和变精度粗糙集的pet/ct高维特征级选择方法
CN115937568B (zh) 一种玄武岩构造背景分类方法、系统、装置及存储介质
Hosseini et al. A genetic type-2 fuzzy logic system for pattern recognition in computer aided detection systems
CN112101574B (zh) 一种机器学习有监督模型解释方法、系统及设备
CN114154557A (zh) 癌症组织分类方法、装置、电子设备及存储介质
CN116187835A (zh) 一种基于数据驱动的台区理论线损区间估算方法及系统
CN110503148B (zh) 一种具有尺度不变性的点云对象识别方法
Thamm et al. Random matrix analysis of deep neural network weight matrices
JP3896868B2 (ja) パターンの特徴選択方法及び分類方法及び判定方法及びプログラム並びに装置
CN113095501A (zh) 一种基于深度强化学习的不平衡分类决策树生成方法
Qian et al. Application of data mining technology and wireless network sensing technology in sports training index analysis
Delima An enhanced K-nearest neighbor predictive model through metaheuristic optimization
CN111353525A (zh) 一种不均衡不完整数据集的建模及缺失值填补方法
CN113656707A (zh) 一种理财产品推荐方法、系统、存储介质及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant