CN111582387A - 一种岩石光谱特征融合分类方法及系统 - Google Patents

一种岩石光谱特征融合分类方法及系统 Download PDF

Info

Publication number
CN111582387A
CN111582387A CN202010391327.1A CN202010391327A CN111582387A CN 111582387 A CN111582387 A CN 111582387A CN 202010391327 A CN202010391327 A CN 202010391327A CN 111582387 A CN111582387 A CN 111582387A
Authority
CN
China
Prior art keywords
model
rock
fusion
classification
fusion classification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010391327.1A
Other languages
English (en)
Inventor
贺金鑫
李文庆
陈圣波
任小玉
肖志强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jilin University
Original Assignee
Jilin University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jilin University filed Critical Jilin University
Priority to CN202010391327.1A priority Critical patent/CN111582387A/zh
Publication of CN111582387A publication Critical patent/CN111582387A/zh
Priority to AU2021101918A priority patent/AU2021101918A4/en
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/254Fusion techniques of classification results, e.g. of results related to same input data
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/47Scattering, i.e. diffuse reflection
    • G01N21/4738Diffuse reflection, e.g. also for testing fluids, fibrous materials

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Pathology (AREA)
  • Immunology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Analytical Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Investigating Or Analysing Materials By Optical Means (AREA)

Abstract

本发明公开了一种岩石光谱特征融合分类方法及系统。所述方法包括:获取ADS便携式光谱仪测得的待测岩石光谱反射率;待测岩石光谱反射率为类别未知的岩石的光谱反射率数据;将待测岩石光谱反射率输入至训练好的融合分类模型中,得到类别未知的岩石的所属类别;训练好的融合分类模型是采用训练数据对融合分类模型进行训练得到的;融合分类模型是将支持向量机模型、K‑最近邻模型和随机森林模型进行融合得到的;训练数据包括类别已知的岩石的光谱反射率数据和对应的类标签。本发明能够提高岩石光谱分类的分类效率和分类的准确度。

Description

一种岩石光谱特征融合分类方法及系统
技术领域
本发明涉及岩石分类技术领域,特别是涉及一种岩石光谱特征融合分类方法及系统。
背景技术
在遥感地质领域,岩石光谱一直是热门研究方向之一,其主要包括成像光谱岩矿识别、岩石光谱特征分析、影响岩石光谱的因素以及岩石光谱分类。
在岩石光谱分类方面,吴辉等人基于AVIRIS航空高光谱遥感数据,首先将预处理后的数据进行最小噪声分离,然后用PPI算法选择研究对象,最后用线性光谱混合分类模型进行岩性分类研究;张翠芬等人将岩石单元的图形纹理特征及光谱特征进行协同分类研究,用面对对象方法进行图谱指数分割,然后用光谱指数提取岩石信息,划分精度较好;徐清俊等人使用ASD光谱仪测量钻孔岩心数据,利用ViewSpecpro软件进行格式转换,输入到ENVI软件里建成光谱库,与美国USGS光谱库中典型矿物光谱曲线进行对比分析,进而识别岩性得出结论;周江将ASD光谱仪的光谱曲线与遥感影像通过ENVI软件相结合对岩石等地物进行分类,与用神经网络进行监督分类的结果相对比。
总之,该领域目前的主要问题在于要么是将数据进行一系列复杂预处理后利用传统模型进行分类,使得分类效率低;要么因为岩石光谱的特殊性,没有统一的光谱曲线标准,使得分类结果不够准确。
发明内容
基于此,有必要提供一种岩石光谱特征融合分类方法及系统,以解决日常地质活动中对于部分岩石分类时存在的工作繁琐、误差大的问题,从而提高分类效率和分类的准确度。
为实现上述目的,本发明提供了如下方案:
一种岩石光谱特征融合分类方法,包括:
获取ADS便携式光谱仪测得的待测岩石光谱反射率;所述待测岩石光谱反射率为类别未知的岩石的光谱反射率数据;
将所述待测岩石光谱反射率输入至训练好的融合分类模型中,得到类别未知的岩石的所属类别;所述训练好的融合分类模型是采用训练数据对融合分类模型进行训练得到的;所述融合分类模型是将支持向量机模型、K-最近邻模型和随机森林模型进行融合得到的;所述训练数据包括类别已知的岩石的光谱反射率数据和对应的类标签。
可选的,所述训练好的融合分类模型的确定方法为:
获取训练数据;
将所述训练数据按照设定比例划分为训练集和测试集;
分别构建支持向量机模型、K-最近邻模型和随机森林模型;
采用投票法将所述支持向量机模型、所述K-最近邻模型和所述随机森林模型融合,得到融合分类模型;
将所述训练集作为所述融合分类模型的输入,对所述融合分类模型进行训练,得到训练后的融合分类模型;
将所述测试集作为所述训练后的融合分类模型的输入,对所述训练后的融合分类模型进行调整,得到训练好的融合分类模型。
可选的,所述融合分类模型为:
Figure BDA0002485880720000021
其中,H(x)表示融合分类模型的分类结果;
Figure BDA0002485880720000022
表示第i种模型对样本x进行分类的分类结果为第j类的类标记;
Figure BDA0002485880720000023
当第i种模型对样本x进行分类的分类结果为第j类时,
Figure BDA0002485880720000024
取值为1,否则取值为0;i=1,2,3,j=1,2,3;第1种模型为支持向量机模型,第2种模型为K-最近邻模型,第3种模型为随机森林模型。
可选的,所述获取训练数据,具体包括:
获取ADS便携式光谱仪测得的类别已知的岩石的光谱反射率数据;
将所述类别已知的岩石的光谱反射率数据和对应的类标签确定为训练数据。
可选的,所述获取ADS便携式光谱仪测得的类别已知的岩石的光谱反射率数据,具体包括:
采用白板对ADS便携式光谱仪进行定标,得到定标后的ADS便携式光谱仪;
在设定测试时间段、设定天空云量和设定测试场地视场角下,采用所述定标后的ADS便携式光谱仪对各类别已知的岩石均进行多次光谱反射率的采集,得到各类别已知的岩石对应的多个光谱反射率;
对每个类别已知的岩石对应的多个光谱反射率求平均,得到每个类别已知的岩石的光谱反射率数据。
可选的,所述将所述训练数据按照设定比例划分为训练集和测试集,具体包括:
将所述训练数据按照0.65:0.35的比例划分为训练集和测试集。
可选的,所述采用投票法将所述支持向量机模型、所述K-最近邻模型和所述随机森林模型融合,得到融合分类模型,具体包括:
采用硬投票将所述支持向量机模型、所述K-最近邻模型和所述随机森林模型融合,得到融合分类模型。
本发明还提供了一种岩石光谱特征融合分类系统,包括:
待分类数据获取模块,用于获取ADS便携式光谱仪测得的待测岩石光谱反射率;所述待测岩石光谱反射率为类别未知的岩石的光谱反射率数据;
分类模块,用于将所述待测岩石光谱反射率输入至训练好的融合分类模型中,得到类别未知的岩石的所属类别;所述训练好的融合分类模型是采用训练数据对融合分类模型进行训练得到的;所述融合分类模型是将支持向量机模型、K-最近邻模型和随机森林模型进行融合得到的;所述训练数据包括类别已知的岩石的光谱反射率数据和对应的类标签。
可选的,所述岩石光谱特征融合分类系统还包括:融合模型确定模块,用于确定模块用于确定所述训练好的融合分类模型;所述融合模型确定模块具体包括:
训练数据获取单元,用于获取训练数据;
数据划分单元,用于将所述训练数据按照设定比例划分为训练集和测试集;
单一模型构建单元,用于分别构建支持向量机模型、K-最近邻模型和随机森林模型;
融合模型构建单元,用于采用投票法将所述支持向量机模型、所述K-最近邻模型和所述随机森林模型融合,得到融合分类模型;
融合模型训练单元,用于将所述训练集作为所述融合分类模型的输入,对所述融合分类模型进行训练,得到训练后的融合分类模型;
融合模型调整单元,用于将所述测试集作为所述训练后的融合分类模型的输入,对所述训练后的融合分类模型进行调整,得到训练好的融合分类模型。
可选的,所述分类模块中的所述融合分类模型为:
Figure BDA0002485880720000041
其中,H(x)表示融合分类模型的分类结果;
Figure BDA0002485880720000042
表示第i种模型对样本x进行分类的分类结果为第j类的类标记;
Figure BDA0002485880720000043
当第i种模型对样本x进行分类的分类结果为第j类时,则
Figure BDA0002485880720000044
取值为1,否则取值为0;i=1,2,3,j=1,2,3;第1种模型为支持向量机模型,第2种模型为K-最近邻模型,第3种模型为随机森林模型。
与现有技术相比,本发明的有益效果是:
本发明提出了一种岩石光谱特征融合分类方法及系统,所述方法包括:获取ADS便携式光谱仪测得的待测岩石光谱反射率;将支持向量机模型、K-最近邻模型和随机森林模型进行融合得到融合分类模型;采用训练数据对融合分类模型进行训练得到训练好的融合分类模型;将待测岩石光谱反射率输入至训练好的融合分类模型中,得到类别未知的岩石的所属类别。本发明解决了日常地质活动中对于部分岩石分类时存在的工作繁琐、误差大的问题,依靠计算机软件和ASD便携式光谱仪对图像进行自动分类,能够在保证岩石分类成本低的基础上,排除个人因素和环境因素的干扰,从而提高分类效率和分类的准确度,且使用范围广。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例1一种岩石光谱特征融合分类方法的流程图;
图2为本发明实施例3一种岩石光谱特征融合分类系统的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
图1为本发明实施例1一种岩石光谱特征融合分类方法的流程图。
参见图1,本实施例的岩石光谱特征融合分类方法,包括:
步骤101:获取ADS便携式光谱仪测得的待测岩石光谱反射率;所述待测岩石光谱反射率为类别未知的岩石的光谱反射率数据。
步骤102:将所述待测岩石光谱反射率输入至训练好的融合分类模型中,得到类别未知的岩石的所属类别;所述训练好的融合分类模型是采用训练数据对融合分类模型进行训练得到的;所述融合分类模型是将支持向量机模型、K-最近邻模型和随机森林模型进行融合得到的;所述训练数据包括类别已知的岩石的光谱反射率数据和对应的类标签。
其中,步骤102中所述训练好的融合分类模型的确定方法为:
1)获取训练数据。具体包括:
获取ADS便携式光谱仪测得的类别已知的岩石的光谱反射率数据。具体的,采用白板对ADS便携式光谱仪进行定标,得到定标后的ADS便携式光谱仪;在设定测试时间段、设定天空云量和设定测试场地视场角下,采用所述定标后的ADS便携式光谱仪对各类别已知的岩石均进行多次光谱反射率的采集,得到各类别已知的岩石对应的多个光谱反射率;对每个类别已知的岩石对应的多个光谱反射率求平均,得到每个类别已知的岩石的光谱反射率数据。
将所述类别已知的岩石的光谱反射率数据和对应的类标签确定为训练数据。
在实际应用中,可以选定设定测试时间段为每天12:00-14:00,设定天空云量为天空云量小于10%,设定测试场地视场角为25°左右。在野外每次进行岩石光谱测试前,需要在半小时之前对ADS便携式光谱仪进行开机预热和软件标准化调试,并用白板进行定标。测试时,每个类别已知的岩石(样品)测试10次求平均得到样品的反射率,最终获取ADS便携式光谱仪测得的类别已知的岩石的光谱反射率数据。
2)将所述训练数据按照设定比例划分为训练集和测试集。具体的,首先将所述训练数据选择常用8:2比例划分训练集和测试集,利用分好组的数据输入模型迭代,结果准确率较低,调整划分比例,多次迭代后确定划分比例选择0.65:0.35结果准确率较好。因此,本实施例中将所述训练数据按照0.65:0.35的比例划分为训练集和测试集。
3)构建常见的单一分类模型-决策树,为了提高分类准确率,利用决策树的升级模型—随机森林(Random Forest,RF),但当数据噪音较大时会使随机森林陷入过拟合,所以接下来用基于对异常值不敏感的K-最近邻(K-Nearest Neighbor,KNN)建模,但KNN需要对每个样本都考虑,当数据量大时计算量会很大,效率不高,所以通过支持向量机(SupportVector Machine,SVM)来提升准确率。从实验结果可以看出,在4种不同的分类模型中,准确率排序为SVM>KNN>随机森林>决策树。所以选择构建准确率较高的支持向量机、K-最近邻、随机森林模型三个模型融合得到融合模型。
4)采用投票法将所述支持向量机模型、所述K-最近邻模型和所述随机森林模型融合,得到融合分类模型。具体的,由于硬投票可在一定程度上减少过拟合现象的发生,更加适合分类模型,因此选择投票法中的硬投票将所述支持向量机模型、所述K-最近邻模型和所述随机森林模型融合,得到融合分类模型。
5)将所述训练集作为所述融合分类模型的输入,对所述融合分类模型进行训练,得到训练后的融合分类模型。
6)将所述测试集作为所述训练后的融合分类模型的输入,对所述训练后的融合分类模型进行调整,当分类结果大于99%时,得到训练好的融合分类模型。
其中,步骤102中所述融合分类模型为:
Figure BDA0002485880720000071
其中,H(x)表示融合分类模型的分类结果;
Figure BDA0002485880720000072
表示第i种模型对样本x进行分类的分类结果为第j类的类标记;
Figure BDA0002485880720000073
当第i种模型对样本x进行分类的分类结果为第j类时,
Figure BDA0002485880720000074
取值为1,否则取值为0;i=1,2,3,j=1,2,3;第1种模型为支持向量机模型,第2种模型为K-最近邻模型,第3种模型为随机森林模型。
下面提供了一个更为具体的实施例。
实施例2
首先对识别原理进行介绍。
1、决策树模型
决策树(Decision Tree,DT)是一个自上而下构建的树形模型,包括根节点、父节点和子节点,一个分支就代表一个测试输出。本实施例采用了决策树模型中的CART算法,相比传统数学统计方法分类更准确,且数据量越大越容易显现其优越性。CART算法通过计算基尼系数来评判数据划分前后的分类效果,基尼系数越小证明数据纯度越高;所以选择能使分类后得到的基尼系数最小的特征,将其作为树中节点。采用CART决策树对三类岩石光谱数据的训练集建模,然后用测试集检验分类效果。将树的深度设置为10;节点划分最不小纯度设置为0.02;节点再划分所需最小样本数设为2。
2、随机森林模型
为提高分类准确率,又选取了决策树的升级模型——随机森林(Random Forest,RF),它是基于bagging策略的集成学习,通过多棵树对数据样本分类。其包含两个随机过程:一是输入数据随机;二是分类特征随机选取。这样就得到了多颗CART决策树弱分类器,再将多个分类器采取投票法的策略,投出票数最多的作为最终结果。RF的参数也分为两部分:一是随机森林的Bagging框架参数,其中CART决策树的最大迭代次数设置为1000,划分CART决策树特征的评价标准选用基尼系数;二是决策树参数,深度25,划分最大特征数为45,节点再划分所需最小样本数设为2。
3、K-最近邻模型
随机森林模型在数据噪音较大时易陷入过拟合,且数据特征过多时也会对模型准确率造成较大影响。而K-最近邻模型(K-Nearest Neighbor,KNN)依据不同特征值间的距离进行分类,不存在训练过程,只是将最近的划分为一类。先将数据标准化;然后算出输入的数据与测试集的数据的距离,本次实验采取的计算距离方法为闵可夫斯基距离;找出距离最近的k个,这里k设置为1;将出现最多的类别作为输入数据的类别。但KNN需要对每个样本都予以考虑,当数据量大时计算量会很大,效率不高。
3、支持向量机模型
支持向量机模型(Support Vector Machine,SVM)是通过在数据间找到距离最大处来工作的,而数据是否线性可分决定着是用硬间隔最大化还是软间隔最大化。由于岩石光谱数据非线性可分,因而将数据映射到新空间,使之线性可分。核函数选高斯核函数;惩罚系数设为10;gamma值设定为1。
4、多种模型相融合
为进一步提高岩石光谱特征自动分类的准确率,采取了融合多个不同模型的办法,即对不同模型的分类结果进行投票,选择投票最多的作为最后分类结果。在此基础上又分为硬投票和软投票,硬投票是直接对模型投票而软投票加入了权重,可以区分不同模型的重要度,但二者的基本原则都是少数服从多数。由于硬投票可在一定程度上减少过拟合现象的发生,更加适合分类模型,所以选用硬投票方法。
基于以上原理,本实施例提供的岩石光谱特征融合分类方法主要包括以下步骤。
步骤一:数据采集。
测定时间为每天12:00-14:00,天空云量小于10%,测试场地的视场角为25°左右。在野外每次进行岩石光谱测试前,需要在半小时之前对仪器进行开机预热和软件标准化调试,并用白板进行定标。测试时,每个样品测试10次求平均得到样品的反射率。对每个测试点进行GPS经纬度定位,同时用相机拍摄采样环境和样品特征。在野外记录本上详细记录采样岩石的命名、经纬度、地质背景以及环境情况等信息。
样本集(yij)608*2500,y表示反射率,波长x也就是特征点从0到2500,共有608组数据。
步骤二:基于融合学习模型的训练。
以0.65:0.35的比例将岩石光谱分为训练集和测试集。
测试集D=(y1j,Ct),(y2j,Ct),……,(y395j,Ct)。
j=1,2,……2500,t=1,2,3,Ct代表所属类别,本实施例将数据共分为三类,C1表示属于第一类,C2表示属于第二类,C3表示属于第三类。
a.决策树
1、训练数据集为D,计算每一个特征x对其可能取得的每一个y,根据此值将训练样本分为D1,D2。计算xj=yij时的基尼指数(i=1,2,……,395,j=1,2,……2500)。
Figure BDA0002485880720000091
其中,J为类的个数,Pj为样本属于第j类的概率。
Figure BDA0002485880720000092
2、选择基尼指数最小的特征点xj作为最优特征及切分点。
3、对两个子节点递归调用1、2步,直到树的深度到达10或基尼系数小于0.02或内部节点样本数小于2。
4、停止计算,决策树生成。
b.随机森林
1、在395个样本的数据集中,有放回抽样选择395个样本构成中间数据集,在中间数据集中随机选择45个特征作为最终数据集,以上述方式构成1000个最终数据集D’。
2、为每个最终数据集分别建立完全分裂的CART决策树,构建过程见上文。
3、根据分类决策规则,计算新数据的类别。
Figure BDA0002485880720000101
上式中,I为指示函数,表示当ci=Ct时,I为1,否则I为0;ci表示1000颗CART决策树的输出类别。
c.K-最近邻
1、根据测试集中给定数据点x的距离度量(这里为闵可夫斯基距离)在训练集中找出与之最近的一个数据点y。距离计算公式如下:
Figure BDA0002485880720000102
其中,n=2500,xn和yn分别表示数据点x和数据点y的第n个反射率;p取4。
2、将与数据点x距离最近的数据点y的类别Ct作为数据点x的类别。
d.支持向量机
1、超平面方程与分类间隔
ωTx+γ=0
ω=[ω1,ω2,......ωn]T,x=[x1,x2,......xn]T
Figure BDA0002485880720000103
x表示样本点,n表示n维空间的超平面,向量ω表示垂直于超平面的向量,标量γ仍表示截距。d表示样本点到超平面也就是决策面的距离,W表示分类间隔。
此时,问题就变成了求解W最大化。
2、对于任意支持向量上的样本点(支持向量也称作支持样本点,表示使W最大的样本点),有|ωTxi+γ|=1,有
Figure BDA0002485880720000111
等效于
Figure BDA0002485880720000112
以便于计算。
3、最终目标函数和约束条件
Figure BDA0002485880720000113
yi为类别标签,n表示样本点个数,s.t.表示subject to(服从与)。
4、构造拉格朗日目标函数
Figure BDA0002485880720000114
其中αi是拉格朗日乘子,αi≥0。令
Figure BDA0002485880720000115
现问题变为求解新目标函数最小值(这里γ写为b)。
Figure BDA0002485880720000116
利用对偶性:
Figure BDA0002485880720000117
5、首先固定α,分别对w和b求偏导数,使其为0。
Figure BDA00024858807200001111
Figure BDA0002485880720000118
代回目标函数有:
Figure BDA0002485880720000119
s.t.αi≥0,i=1,2,......n
Figure BDA00024858807200001110
此时只有一个变量αi,超平面方程变为
Figure BDA0002485880720000121
对于线性不可分数据,将数据映射到特征空间,有
Figure BDA0002485880720000122
Figure BDA0002485880720000123
计算内积引入高斯核函数
Figure BDA0002485880720000124
通过对偶问题的转化将最开始求w,b的问题转化为求α的问题。只要能找到所有的α,就能求出w、b,然后就可通过计算距离而判断该点类别。
e.融合模型
将分类准确率较高的三种模型支持向量机、随机森林、k最近邻形成融合模型。使用投票法中的硬投票来进行模型融合,公式如下:
Figure BDA0002485880720000125
其中,H(x)表示融合分类模型的分类结果;
Figure BDA0002485880720000126
表示第i种模型对样本x进行分类的分类结果为第j类的类标记;
Figure BDA0002485880720000127
当第i种模型对样本x进行分类的分类结果为第j类时,
Figure BDA0002485880720000128
取值为1,否则取值为0;i=1,2,3,j=1,2,3;第1种模型为支持向量机模型,第2种模型为K-最近邻模型,第3种模型为随机森林模型。
最后,利用测试集数据进行测试准确率。训练完毕后,将测试集作为参数输入到上述训练后的融合模型中,研究其输出结果的正确率。例如,输入花岗岩的测试数据,观察其输出是否为花岗岩。如果准确率低,则重复训练与测试。
步骤三:将数据输入到训练好的融合学习模型中,实现岩石分类。
实施例3
本实施例提供了一种岩石光谱特征融合分类系统,图2为本发明实施例3一种岩石光谱特征融合分类系统的结构示意图。
参见图2,本实施例的岩石光谱特征融合分类系统包括:
待分类数据获取模块201,用于获取ADS便携式光谱仪测得的待测岩石光谱反射率;所述待测岩石光谱反射率为类别未知的岩石的光谱反射率数据。
分类模块202,用于将所述待测岩石光谱反射率输入至训练好的融合分类模型中,得到类别未知的岩石的所属类别;所述训练好的融合分类模型是采用训练数据对融合分类模型进行训练得到的;所述融合分类模型是将支持向量机模型、K-最近邻模型和随机森林模型进行融合得到的;所述训练数据包括类别已知的岩石的光谱反射率数据和对应的类标签。
作为一种可选的实施方式,所述岩石光谱特征融合分类系统还包括:融合模型确定模块,用于确定模块用于确定所述训练好的融合分类模型;所述融合模型确定模块具体包括:
训练数据获取单元,用于获取训练数据。
数据划分单元,用于将所述训练数据按照设定比例划分为训练集和测试集。
单一模型构建单元,用于分别构建支持向量机模型、K-最近邻模型和随机森林模型。
融合模型构建单元,用于采用投票法将所述支持向量机模型、所述K-最近邻模型和所述随机森林模型融合,得到融合分类模型。
融合模型训练单元,用于将所述训练集作为所述融合分类模型的输入,对所述融合分类模型进行训练,得到训练后的融合分类模型。
融合模型调整单元,用于将所述测试集作为所述训练后的融合分类模型的输入,对所述训练后的融合分类模型进行调整,得到训练好的融合分类模型。
作为一种可选的实施方式,所述分类模块中的所述融合分类模型为:
Figure BDA0002485880720000131
其中,H(x)表示融合分类模型的分类结果;
Figure BDA0002485880720000132
表示第i种模型对样本x进行分类的分类结果为第j类的类标记;
Figure BDA0002485880720000133
当第i种模型对样本x进行分类的分类结果为第j类时,则
Figure BDA0002485880720000141
取值为1,否则取值为0;i=1,2,3,j=1,2,3;第1种模型为支持向量机模型,第2种模型为K-最近邻模型,第3种模型为随机森林模型。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。

Claims (10)

1.一种岩石光谱特征融合分类方法,其特征在于,包括:
获取ADS便携式光谱仪测得的待测岩石光谱反射率;所述待测岩石光谱反射率为类别未知的岩石的光谱反射率数据;
将所述待测岩石光谱反射率输入至训练好的融合分类模型中,得到类别未知的岩石的所属类别;所述训练好的融合分类模型是采用训练数据对融合分类模型进行训练得到的;所述融合分类模型是将支持向量机模型、K-最近邻模型和随机森林模型进行融合得到的;所述训练数据包括类别已知的岩石的光谱反射率数据和对应的类标签。
2.根据权利要求1所述的一种岩石光谱特征融合分类方法,其特征在于,所述训练好的融合分类模型的确定方法为:
获取训练数据;
将所述训练数据按照设定比例划分为训练集和测试集;
分别构建支持向量机模型、K-最近邻模型和随机森林模型;
采用投票法将所述支持向量机模型、所述K-最近邻模型和所述随机森林模型融合,得到融合分类模型;
将所述训练集作为所述融合分类模型的输入,对所述融合分类模型进行训练,得到训练后的融合分类模型;
将所述测试集作为所述训练后的融合分类模型的输入,对所述训练后的融合分类模型进行调整,得到训练好的融合分类模型。
3.根据权利要求1所述的一种岩石光谱特征融合分类方法,其特征在于,所述融合分类模型为:
Figure FDA0002485880710000011
其中,H(x)表示融合分类模型的分类结果;
Figure FDA0002485880710000012
表示第i种模型对样本x进行分类的分类结果为第j类的类标记;
Figure FDA0002485880710000013
当第i种模型对样本x进行分类的分类结果为第j类时,
Figure FDA0002485880710000014
取值为1,否则取值为0;i=1,2,3,j=1,2,3;第1种模型为支持向量机模型,第2种模型为K-最近邻模型,第3种模型为随机森林模型。
4.根据权利要求2所述的一种岩石光谱特征融合分类方法,其特征在于,所述获取训练数据,具体包括:
获取ADS便携式光谱仪测得的类别已知的岩石的光谱反射率数据;
将所述类别已知的岩石的光谱反射率数据和对应的类标签确定为训练数据。
5.根据权利要求4所述的一种岩石光谱特征融合分类方法,其特征在于,所述获取ADS便携式光谱仪测得的类别已知的岩石的光谱反射率数据,具体包括:
采用白板对ADS便携式光谱仪进行定标,得到定标后的ADS便携式光谱仪;
在设定测试时间段、设定天空云量和设定测试场地视场角下,采用所述定标后的ADS便携式光谱仪对各类别已知的岩石均进行多次光谱反射率的采集,得到各类别已知的岩石对应的多个光谱反射率;
对每个类别已知的岩石对应的多个光谱反射率求平均,得到每个类别已知的岩石的光谱反射率数据。
6.根据权利要求2所述的一种岩石光谱特征融合分类方法,其特征在于,所述将所述训练数据按照设定比例划分为训练集和测试集,具体包括:
将所述训练数据按照0.65:0.35的比例划分为训练集和测试集。
7.根据权利要求2所述的一种岩石光谱特征融合分类方法,其特征在于,所述采用投票法将所述支持向量机模型、所述K-最近邻模型和所述随机森林模型融合,得到融合分类模型,具体包括:
采用硬投票将所述支持向量机模型、所述K-最近邻模型和所述随机森林模型融合,得到融合分类模型。
8.一种岩石光谱特征融合分类系统,其特征在于,包括:
待分类数据获取模块,用于获取ADS便携式光谱仪测得的待测岩石光谱反射率;所述待测岩石光谱反射率为类别未知的岩石的光谱反射率数据;
分类模块,用于将所述待测岩石光谱反射率输入至训练好的融合分类模型中,得到类别未知的岩石的所属类别;所述训练好的融合分类模型是采用训练数据对融合分类模型进行训练得到的;所述融合分类模型是将支持向量机模型、K-最近邻模型和随机森林模型进行融合得到的;所述训练数据包括类别已知的岩石的光谱反射率数据和对应的类标签。
9.根据权利要求8所述的一种岩石光谱特征融合分类系统,其特征在于,还包括:融合模型确定模块,用于确定模块用于确定所述训练好的融合分类模型;所述融合模型确定模块具体包括:
训练数据获取单元,用于获取训练数据;
数据划分单元,用于将所述训练数据按照设定比例划分为训练集和测试集;
单一模型构建单元,用于分别构建支持向量机模型、K-最近邻模型和随机森林模型;
融合模型构建单元,用于采用投票法将所述支持向量机模型、所述K-最近邻模型和所述随机森林模型融合,得到融合分类模型;
融合模型训练单元,用于将所述训练集作为所述融合分类模型的输入,对所述融合分类模型进行训练,得到训练后的融合分类模型;
融合模型调整单元,用于将所述测试集作为所述训练后的融合分类模型的输入,对所述训练后的融合分类模型进行调整,得到训练好的融合分类模型。
10.根据权利要求8所述的一种岩石光谱特征融合分类系统,其特征在于,所述分类模块中的所述融合分类模型为:
Figure FDA0002485880710000031
其中,H(x)表示融合分类模型的分类结果;
Figure FDA0002485880710000032
表示第i种模型对样本x进行分类的分类结果为第j类的类标记;
Figure FDA0002485880710000033
当第i种模型对样本x进行分类的分类结果为第j类时,则
Figure FDA0002485880710000034
取值为1,否则取值为0;i=1,2,3,j=1,2,3;第1种模型为支持向量机模型,第2种模型为K-最近邻模型,第3种模型为随机森林模型。
CN202010391327.1A 2020-05-11 2020-05-11 一种岩石光谱特征融合分类方法及系统 Pending CN111582387A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202010391327.1A CN111582387A (zh) 2020-05-11 2020-05-11 一种岩石光谱特征融合分类方法及系统
AU2021101918A AU2021101918A4 (en) 2020-05-11 2021-04-14 Method and system of fusion classification of rock spectral signature

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010391327.1A CN111582387A (zh) 2020-05-11 2020-05-11 一种岩石光谱特征融合分类方法及系统

Publications (1)

Publication Number Publication Date
CN111582387A true CN111582387A (zh) 2020-08-25

Family

ID=72124811

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010391327.1A Pending CN111582387A (zh) 2020-05-11 2020-05-11 一种岩石光谱特征融合分类方法及系统

Country Status (2)

Country Link
CN (1) CN111582387A (zh)
AU (1) AU2021101918A4 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112990320A (zh) * 2021-03-19 2021-06-18 中国矿业大学(北京) 一种岩性的分类方法、装置、电子设备及存储介质
CN112991370A (zh) * 2021-04-08 2021-06-18 重庆大学 一种岩心ct裂纹识别与分割方法
CN113062734A (zh) * 2021-05-17 2021-07-02 上海联创燃气技术发展有限公司 基于非开挖泥浆流变参数弱监督机器学习的地层识别方法
CN116883852A (zh) * 2023-08-29 2023-10-13 北京建工环境修复股份有限公司 一种基于高光谱的岩芯数据获取方法及系统

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090256412A1 (en) * 2008-03-04 2009-10-15 Nieto Juan Scanning system for 3d mineralogy modelling
US7763820B1 (en) * 2003-01-27 2010-07-27 Spectramet, Llc Sorting pieces of material based on photonic emissions resulting from multiple sources of stimuli
CN107341521A (zh) * 2017-07-10 2017-11-10 东北大学 一种基于煤炭光谱数据对煤炭分类的方法
CN108182449A (zh) * 2017-12-25 2018-06-19 南京信息工程大学 一种高光谱图像分类方法
CN109870421A (zh) * 2019-03-27 2019-06-11 东北林业大学 一种基于可见光/近红外光谱分析的递增式木材树种分类识别方法
CN109975273A (zh) * 2019-03-07 2019-07-05 四川大学 一种基于激光诱导击穿光谱的岩石分类方法
CN110043267A (zh) * 2019-04-04 2019-07-23 山东大学 基于岩性与不良地质前兆特征识别的tbm搭载式超前地质预报系统及方法
CN110837808A (zh) * 2019-11-11 2020-02-25 安徽理工大学 一种基于改进的胶囊网络模型的高光谱图像分类方法
CN110852227A (zh) * 2019-11-04 2020-02-28 中国科学院遥感与数字地球研究所 高光谱图像深度学习分类方法、装置、设备及存储介质

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7763820B1 (en) * 2003-01-27 2010-07-27 Spectramet, Llc Sorting pieces of material based on photonic emissions resulting from multiple sources of stimuli
US20090256412A1 (en) * 2008-03-04 2009-10-15 Nieto Juan Scanning system for 3d mineralogy modelling
CN107341521A (zh) * 2017-07-10 2017-11-10 东北大学 一种基于煤炭光谱数据对煤炭分类的方法
CN108182449A (zh) * 2017-12-25 2018-06-19 南京信息工程大学 一种高光谱图像分类方法
CN109975273A (zh) * 2019-03-07 2019-07-05 四川大学 一种基于激光诱导击穿光谱的岩石分类方法
CN109870421A (zh) * 2019-03-27 2019-06-11 东北林业大学 一种基于可见光/近红外光谱分析的递增式木材树种分类识别方法
CN110043267A (zh) * 2019-04-04 2019-07-23 山东大学 基于岩性与不良地质前兆特征识别的tbm搭载式超前地质预报系统及方法
CN110852227A (zh) * 2019-11-04 2020-02-28 中国科学院遥感与数字地球研究所 高光谱图像深度学习分类方法、装置、设备及存储介质
CN110837808A (zh) * 2019-11-11 2020-02-25 安徽理工大学 一种基于改进的胶囊网络模型的高光谱图像分类方法

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
MAHENDRA PAL等: "Optimized Lithological Mapping from Multispectral and Hyperspectral Remote Sensing Images Using Fused Multi-Classifiers", 《REMOTE SENSING》 *
朱冰雪: "辽西地质走廊带地面与影像光谱岩石分类", 《中国优秀博硕士学位论文全文数据库(硕士) 基础科学辑》 *
李凯: "近红外光谱和多分类器融合的葡萄酒品种判别研究", 《光谱学与光谱分析》 *
贺金鑫等: "一种基于朴素贝叶斯分类模型的高光谱矿物精确识别方法", 《光谱学与光谱分析》 *
闫梦鸽: "LIBS光谱识别典型岩石水风化物方法研究", 《中国优秀博硕士学位论文全文数据库(硕士) 基础科学辑》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112990320A (zh) * 2021-03-19 2021-06-18 中国矿业大学(北京) 一种岩性的分类方法、装置、电子设备及存储介质
CN112991370A (zh) * 2021-04-08 2021-06-18 重庆大学 一种岩心ct裂纹识别与分割方法
CN113062734A (zh) * 2021-05-17 2021-07-02 上海联创燃气技术发展有限公司 基于非开挖泥浆流变参数弱监督机器学习的地层识别方法
CN116883852A (zh) * 2023-08-29 2023-10-13 北京建工环境修复股份有限公司 一种基于高光谱的岩芯数据获取方法及系统
CN116883852B (zh) * 2023-08-29 2024-03-08 北京建工环境修复股份有限公司 一种基于高光谱的岩芯数据获取方法及系统

Also Published As

Publication number Publication date
AU2021101918A4 (en) 2021-06-03

Similar Documents

Publication Publication Date Title
US11783569B2 (en) Method for classifying hyperspectral images on basis of adaptive multi-scale feature extraction model
CN111582387A (zh) 一种岩石光谱特征融合分类方法及系统
CN108447057B (zh) 基于显著性和深度卷积网络的sar图像变化检测方法
CN107895136B (zh) 一种煤矿区域识别方法及系统
CN104809471B (zh) 一种基于空间光谱信息的高光谱图像残差融合分类方法
CN115828140A (zh) 邻域互信息与随机森林相融合故障检测方法、系统及应用
Fayyad et al. Image database exploration: Progress and challenges
CN107316296A (zh) 一种基于对数变换的遥感图像变化检测方法及装置
Weidner et al. An algorithm for measuring landslide deformation in terrestrial lidar point clouds using trees
CN114139819A (zh) 基于地统计加权随机森林的地球化学变量空间预测方法
CN116863341B (zh) 基于时间序列卫星遥感影像的作物分类和识别方法和系统
CN117093890A (zh) 一种能源资源开发区域生态环境综合评价方法
CN116451081A (zh) 数据漂移的检测方法、装置、终端及存储介质
Wibowo et al. Anomaly detection on displacement rates and deformation pattern features using tree-based algorithm in Japan and Indonesia
CN105954206B (zh) 紫玉米叶片花色苷含量的测量方法及系统
CN108108758A (zh) 面向工业大数据的多层增量特征提取方法
CN110135280B (zh) 一种基于稀疏表征分类的多视图sar自动目标识别方法
Dahiya et al. Comparative analysis and implication of Hyperion hyperspectral and landsat-8 multispectral dataset in land classification
Otele et al. Design and Implementation of an Automatic Deep Stacked Sparsely Connected Auto-encoder (ADSSCA) Neural Network Architecture for Lithological Mapping under thick Vegetation using Remote Sensing
Filzmoser Robust statistics
Su et al. Active learning based on SVM and representativity in a coal mining environment
Yang et al. Predicting the suitability for scene matching using SVM
Attanasi et al. Random forest
CN114580064B (zh) 一种用于地质建模的数据分析方法、装置及存储介质
CN117423013B (zh) 基于地质大数据的成矿潜力预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20200825

RJ01 Rejection of invention patent application after publication