CN111191741A

CN111191741A - 一种岩石识别深度学习模型岩石分类约束继承性损失方法

Info

Publication number: CN111191741A
Application number: CN202010029404.9A
Authority: CN
Inventors: 李超岭; 孙钰; 刘园园; 李丰丹; 韩雪; 刘畅; 于杲彤; 袁明帅; 吕霞; 刘璇昕
Original assignee: Development & Research Center Of China Geological Survey Bureau
Current assignee: Command Center Of Natural Resources Comprehensive Survey Of China Geological Survey
Priority date: 2020-01-15
Filing date: 2020-01-15
Publication date: 2020-05-22

Abstract

本申请公开了一种岩石识别深度学习模型岩石分类约束继承性损失方法，包括：根据岩石样本的多级标签构建岩石样本数据集D，构建深度神经网络，将待训练岩石样本图像输入深度神经网络，网络输出针对分类树各层级的最后一级标签预测；计算分类树各层级的预测概率P_i；将所述分类树各层级的预测概率P_i分别对照对应的层级标签进行逐级计算，获得各层级交叉熵损失；将各层级交叉熵损失相加，得到输入的岩石样本图像的岩石分类约束继承性损失；对所述岩石分类约束继承性损失进行判断是否满足收敛条件。本发明的优点是：实现简单，充分利用岩石分类树中包含的层间从属关系和类间异同信息，优化岩石识别模型的精度。

Description

一种岩石识别深度学习模型岩石分类约束继承性损失方法

技术领域

本发明涉及一种岩石识别深度学习模型岩石分类约束继承性损失方法。

背景技术

在地质行业中，区域地质调查是地质工作的先行步骤，又是地质工作的基础工作。它是指在选定地区的范围内或按照不同比例尺精度(如：1∶50000、1∶200000、1∶250000等)，在充分研究和运用已有资料的基础上，采用必要的手段，进行全面系统的综合性的野外实地地质调查研究工作。其主要任务是，通过地质填图、找矿和综合研究，阐明区域内的岩石、地层、构造、地貌、水文地质等基本地质特征及其相互关系，研究矿产的形成条件和分布规律。为进一步的地质找矿工作提供基础地质资料。要实现上述目标，最基本最主要的工作方法是野外实地勘查和观测研究，而岩石学矿物学是地质学最基础的知识，一到野外首先遇到的就是矿物岩石。因此，认识岩石是每一个地质工作者最基本的专业能力。目前，据大多专业地质人员提供经验数据表明，一个专业人员在野外正确识别标本的能力，准确率达60-80％算是较高至高的水平了。因此，在野外准确的识别岩石和定名，不仅是对专业人员最大的挑战，也是体现一个专业人员水平的尺子。因此随着人工智能的兴起，，如何把高专业人员识别岩石的能力转成人工智能模型，让专业人员、地学爱好者或者一般非专业人员也能准确的识别基本岩石成了地质行业最基本技能服务的最大的需求了。

目前的现有技术存在以下问题：第一，现有所涉及的岩石识别模型建模，均在项目级别或实验室内，因而都是小样本的方法试验，多数文章的样本均在千张数量级上，分类的数据也在都限于3-6类，属于初级学习阶段的产物，对于这么小的样本和分类数目不会涉及也不需要涉及岩石分类知识加入模型计算的问题。第二，在野外实际应用中，有关国标关于的三大岩类的分类和命名的一般规则在基本名称上给出了比较细的分类规定，但在附加修饰词上只能给出原则性的规定，这也是因为地球上岩石的复杂性和多样性所决定的，因此要给出完全标准化的分类命名也就非常困难。第三，目前，大多数基于深度学习的岩石识别算法，仅受限与一般的分类任务用的都是交叉熵损失特点，针对分类体系的单一层级标签进行预测，忽略了岩石分类树中蕴含的丰富层级信息，同时目前采用的类通常分类粒度偏大(如花岗岩、角砾岩、砂岩等)，分类种类偏少，难以满足实际需求。虽然单一层级标签预测也可能给出较高的模型精度，但由于岩石的复杂性和多样性，模型很难突破泛化能力，一旦模型跳出训练样本本身的范围，就失去了相应的识别能力，这就是人们通常称为只有3岁孩子的认知能力。第四，传统的交叉熵损失计算仅支持单一层级标签，无法充分利用多级标签之间的分类信息，对模型的优化具有局限性，不足以满足类间仅有细微差距的细粒度图像分类任务。

发明内容

本发明的目的在于克服上述不足，提供一种岩石识别深度学习模型岩石分类约束继承性损失方法，充分利用岩石分类树中包含的层间从属关系和类间异同信息，解决优化岩石识别模型的精度的问题。

为了实现上述目的，本发明采用的技术本发明为：一种岩石识别深度学习模型岩石分类约束继承性损失方法，其特征在于，包括：

第一步，根据岩石样本的多级标签构建岩石样本数据集D，岩石样本数据集D的各层级标签所构成的分类树共计n级，第i(1≤i≤n)级的标签数量记作N_i；

第二步，构建深度神经网络，将待训练岩石样本图像输入深度神经网络，网络输出针对分类树各层级的最后一级标签预测；

第三步，按照岩石样本数据集D的各层级标签所构成的分类树的层间从属关系，通过分组和相加操作，计算分类树各层级的预测概率P_i；

第四步，将所述分类树各层级的预测概率P_i分别对照对应的层级标签进行逐级计算，获得各层级交叉熵损失；

第五步，将各层级交叉熵损失相加，得到输入的岩石样本图像的岩石分类约束继承性损失；

第六步，对所述岩石分类约束继承性损失进行判断是否满足收敛条件，如果满足，结束，否则，结合优化策略更新网络参数，返回第三步，进入新一轮迭代，直到满足收敛条件。

进一步地，所述第一步还包括根据岩石样本增多，动态增加分类树结构和树叶的步骤。

进一步地，所述岩石样本数据集D的各层级标签所构成的分类树根据末级动态再分类法，对新增和原有的岩石样本细化和优化层级分类。

进一步地，将待训练岩石样本图像输入深度神经网络，网络输出针对分类树各层级的最后一级标签预测，包括：通过softmax函数计算后，逐位归一化为分类树最后一级各类别的预测概率。

进一步地，所述第一步中，

使用字典来存放数据集标签的分类树结构，生成各级间映射关系：tax_mapping。其中，字典元素个数为N_n，各项元素的键为第n层的数据标签，值为键所对应的上层各级标签构成的列表，各项元素其形式如下：

第n级标签：[第n-1级标签，第n-2级标签，......，第1级标签]。

进一步地，包括：根据上述tax_mapping，生成用于继承性损失计算的掩膜：tax_mask，该tax_mask为由n-1个N_n×N_n二维矩阵组成的三维01矩阵，其中，每个二维矩阵表示上层各级标签与第n级标签的对应关系。

进一步地，包括：

首先，使用fluid.layers.create_var()方法来构建一个参数层，并指定名称为mask_layer；

接下来，执行startup_program()，在训练块(block)中使用fluid.global_scope().find_var()方法寻找上述mask_layer；

最后，传入tax_mask参数，并使用set()方法对掩膜进行赋值。

进一步地，所述收敛条件包括：损失曲线是否趋于平稳，或测试准确率是否达到要求。

本发明的有益效果为：

第一，实现简单，针对如何大幅度提高岩石识别精度问题，避免模型过度依赖实验室样本，提高岩石识别精度和泛化能力的问题，本发明提出基于深度学习的特点，把岩石分类的知识融入模型中，建立了岩石分类约束继承性损失方法。该方法把现有模型最细6级分类(手标本分类级)准确率达从80％提高到94.3％。

第二，针对靠近末级的岩石上下层级类具有明显的共性和继承性的特点，提出了“末级动态再分类法”，不但为满足手标本级别的动态再分类、细粒度识别能力奠定基础，而且为岩石分类约束继承性损失方法提供了优化资源。目前所有开展岩石识别模型的研究，基本都是针对分类体系的单一层级标签进行建模，所以不需要层级分类的概念。

第三，借鉴岩石层级分类体系的结构特征，提出了一种用于深度神经网络训练的损失函数——“岩石分类约束继承性损失”函数。该损失函数通过简单的“分组”和“相加”操作，将岩石分类树的层级结构融入神经网络的训练过程中，为网络的训练提供更多的监督信息，有助于进一步提升岩石识别模型的精度。

附图说明

此处所说明的附图用来提供对本申请的进一步理解，构成本申请的一部分，本申请的示意性实施例及其说明用于解释本申请，并不构成对本申请的不当限定。在附图中：

图1是本发明的岩石识别深度学习模型岩石分类约束继承性损失方法的流程图；

图2是本发明的岩石识别深度学习模型岩石分类约束继承性损失方法的实施例示意图；

图3是本发明的岩石识别深度学习模型岩石分类约束继承性损失方法的应用流程图；、

图4是本发明的末级动态再分类法示例---样本不足归入上一层级分类目录(框)示意图；

图5是本发明的从碎屑组成和与熔岩相应的岩性对凝灰岩的进一步划分示例图；

具体实施方式

如在说明书及权利要求当中使用了某些词汇来指称特定组件。本领域技术人员应可理解，硬件制造商可能会用不同名词来称呼同一个组件。本说明书及权利要求并不以名称的差异来作为区分组件的方式，而是以组件在功能上的差异来作为区分的准则。如在通篇说明书及权利要求当中所提及的“包含”为一开放式用语，故应解释成“包含但不限定于”。“大致”是指在可接收的误差范围内，本领域技术人员能够在一定误差范围内解决所述技术问题，基本达到所述技术效果。说明书后续描述为实施本申请的较佳实施方式，然所述描述乃以说明本申请的一般原则为目的，并非用以限定本申请的范围。本申请的保护范围当视所附权利要求所界定者为准。

请参照图1至图3，本发明的一种岩石识别深度学习模型岩石分类约束继承性损失方法，包括：

在一个实施例中，所述第一步还包括根据岩石样本增多，动态增加分类树结构和树叶的步骤。

在一个实施例中，所述岩石样本数据集D的各层级标签所构成的分类树根据末级动态再分类法，对新增和原有的岩石样本细化和优化层级分类。

在一个实施例中，将待训练岩石样本图像输入深度神经网络，网络输出针对分类树各层级的最后一级标签预测，包括：通过softmax函数计算后，逐位归一化为分类树最后一级各类别的预测概率。

在一个实施例中，所述第一步中，

第n级标签：[第n-1级标签，第n-2级标签，......，第1级标签]。

在一个实施例中，包括：根据上述tax_mapping，生成用于继承性损失计算的掩膜：tax_mask，该tax_mask为由n-1个N_n×N_n二维矩阵组成的三维01矩阵，其中，每个二维矩阵表示上层各级标签与第n级标签的对应关系。

在一个实施例中，包括：

最后，传入tax_mask参数，并使用set()方法对掩膜进行赋值。

在一个实施例中，所述收敛条件包括：损失曲线是否趋于平稳，或测试准确率是否达到要求。

本发明中，损失函数是衡量模型预测值和样本真实值之间差异程度的方法。交叉熵(cross entropy，CE)常与softmax函数组合使用，作为神经网络中处理多分类问题的损失函数。对于单个样本，假设神经网络的预测输出为[z1，z2，...，zn]，n为网络预测的类别数，则该样本属于类别i的概率为：

经过softmax函数计算，网络预测为各类的概率为[p1，p2，...，pn]。若该样本对应标签为[t1，t2，...，tn]，则该样本的交叉熵损失为：

作为具体的实施例，本发明根据“末级动态再分类法”，对新增和原有的样本细化和优化层级分类。

假设目标岩石数据集D的各级类别标签所构成的分类树共计n级，第i(1≤i≤n)级的标签(类别)数量记作N_i。

将待训练岩石图像输入深度神经网络，经过输入层、卷积层、全连接层等多层抽象计算后，网络输出针对分类树最后一级(第n级)各类别的预测，记作logits。

网络输出的logits经过softmax函数计算后(参照公式(1))，逐位归一化为分类树最后一级(第n级)各类别的预测概率，记作P_n。

按照数据集D的岩石分类树的层间从属关系，通过“分组”和“相加”操作，计算分类树其余各层级的预测概率，计算方式如下：

对于第i级(i∈[1，n-1])标签，其第k位的位概率为：

其中，第n级的第j类是第i级第k类的子类。依次计算第i级各位的位概率(即输入图像属于第i级各类的概率)，即可得到该输入图像在第i级的预测概率P_i。

按照上一步骤，将第n级预测概率P_n依次转换为第n-1级概率P_n-1、......、第2级概率P₂以及第1级概率P₁。

各级概率P_i分别对照对应的层级标签计算各级交叉熵损失l_CE[i](参照公式(2))；

最后，将各级交叉熵的值相加：

即得到该输入图像的“岩石分类约束继承性损失”。

损失曲线是否趋于平稳(即损失值不再下降)，或测试准确率达到要求后，不过不满足，反馈到第3步，结合优化策略更新网络参数，进入新一轮迭代。

当损失曲线趋于平稳(即损失值不再下降)，或测试准确率达到要求后，即可停止训练。

下面以一个岩石三级岩石分类树作为本发明的具体实例：

该数据集所有岩石标签构成的分类树共三级，第一级为“变质岩”(其余类未在图中画出)，其子类(即第二级)包含：“片麻岩”、“板岩”、“千枚岩”等(其余子类未在图中画出)，其中，“板岩”的子类为：“泥质板岩”、“粉砂质板岩”、“碳质板岩”、“千枚状板岩”等(其余子类未在图中画出)。

假设某输入图像三级标签为“变质岩-板岩-粉砂质板岩”；

图像输入网络后经过多层抽象计算和softmax函数归一化，输出第三级预测概率为[...，0.05，0.52，0.08，0.06，...]，分别对应[...，泥质板岩，粉砂质板岩，碳质板岩，千枚状板岩，...]；

由于上述四类同属于“板岩”这一二级类，将这四类的位概率相加，即可得到第二级“板岩”的位概率：0.71。同理，将第三级其他位按照二三级的层间关系相加分组，即可得到第二级所有类的层级概率：[...，0.15，0.71，0.11，...]，分别对应[...，片麻岩，板岩，千枚岩，...]；

以此类推，可得到第一级各类的预测概率：[...，0.97，...]，变质岩对应概率为0.97；

分别对照三级标签转换后的编码，参照公式(2)计算各级交叉熵损失；

将三级交叉熵的值相加，即可得到该图像的继承性损失。

作为具体的实施例，本发明基于PaddlePaddle框架的继承性损失具体实现过程：

通过目录结构构建tax数据结构；

首先需要根据数据存放的目录结构构建级间映射关系：tax_mapping，再据此生成用于继承性损失计算的掩膜：tax_mask。

由数据目录结构构建级间映射关系；

使用字典来存放数据集标签的分类树结构，生成各级间映射关系：tax_mapping。其中，字典元素个数为N_n(即第n层层级数)，各项元素的键(key)为第n层的数据标签，值(value)为键所对应的上层各级标签构成的列表(list)，各项元素其形式如下：

第n级标签：[第n-1级标签，第n-2级标签，......，第1级标签]

由级间映射关系构建计算掩膜；

根据上述tax_mapping，生成用于继承性损失计算的掩膜：tax_mask。该tax_mask为由n-1个N_n×N_n二维矩阵组成的三维01矩阵。其中，每个二维矩阵表示上层各级(共n-1层)标签与第n级标签的对应关系。如图2所示，二维矩阵的每行表示上层某级单个标签和第n级所有标签的对应关系，若某n级标签属于该上级类，则对应位置1，否则置为0。

模型构建及掩膜赋值

此处使用PaddlePaddle的静态图模式。首先，在构建计算图的过程中使用fluid.layers.create_var()方法来构建一个参数层，并指定名称为mask_layer。接下来，执行startup_program()，在训练块(block)中使用fluid.global_scope().find_var()方法寻找上述mask_layer。最后，传入tax_mask参数，并使用set()方法对其进行赋值。

继承性损失计算过程

对于每个输入样本，神经网络对其进行学习预测后，会输出对应logits，经过softmax函数计算后，被归一化为1×N_n的行向量P_n，即最后一层各类的预测概率。

在神经网络的训练过程中，使用批训练的方法将训练数据划分为多个批次，假设每个训练批次的样本数为batch_num，则对于每个批次，网络输出经softmax计算后，生成batch_num×N_n的二维矩阵P_batch。

对P_batch进行转置，由batch_num×N_n的二维矩阵P_batch转置为N_n×batch_num的二维矩阵P′_batch；

使用上述掩膜tax_mask左乘P′_batch，则可得到(n-1)×N_n×batch_num的三维矩阵，记作P_list；

将P_list的第二维和第三维进行转置，生成(n-1)×batch_num×N_n的三维矩阵，并将此矩阵按照第一维分割(n-1)次，即可得到(n-1)个batch_num×N_n的二维矩阵，即为该批次数据上层各级的预测概率；

对照样本原始标签，逐级计算交叉熵损失，并将各级交叉熵损失的值相加，即可得到该批次所有图的继承性损失值；

损失曲线是否趋于平稳(即损失值不再下降)，或测试准确率达到要求后，不过不满足，反馈到第2步，使用fluid.layers.mean()方法计算该批次继承性损失的平均值，传递给优化器，用于实现网络参数的优化，进入新一轮迭代。

请参照图4，“末级动态再分类法”岩石分类命名方法，在强调严格遵循国标基本名称分类的原则(这一点全国应用标注基本一致)的基础上，为满足手标本复杂性和多样性的分类实际需求，保证不同省份、不同定名方法均可在保持“原汁原味”的基础上都能纳入本分类的一种分类体系。

目前，岩石分类和命名都遵循一下四个国家标准：①GB/T 17412.1-1998岩石分类和命名方案火成岩岩石分类和命名方案；②GB/T 17412.2-1998岩石分类和命名方案沉积岩岩石分类和命名方案③GB/T 17412.3-1998岩石分类和命名方案变质岩岩石分类和命名方案④GB/T 958-2105区域地质图图例。根据上述国家标准，三大岩类的分类和命名的一般规则如下：

附加修饰词+基本名称

①岩石的基本名称是岩石分类命名的基本单元，它反映岩石的基本属性及在分类系统中的位置和特点，具有一定的矿物组成、含量及结构、构造特征。如辉长岩、闪长岩、花岗岩等。

②附加修饰词是用以说明岩石的某些重要附加特征的修饰词。可作为附加修饰词的有次要矿物、主要矿物、特征(变质)矿物、结构、构造、颜色及粒度等。如矿物名称(如黑云母花岗岩、培长辉长岩、蓝晶黑云片麻岩。)、结构术语(如斑状花岗岩)、化学术语(如富鳃花岗岩)、成因术语(如深熔花岗岩)、构造术语(如造山期后花岗岩)、粒度术语(巨块、巨粒、粗粒、中粒、细粒、微粒、隐晶质)，或者使用者认为是有用的或合适的并能为普遍认可的其他术语。总之，附加修饰词要视研究地区的具体情况而定，以能区分不同岩石种属，有利于地质调查及找矿等为原则。

在野外实际应用中，上述国标关于的三大岩类的分类和命名的一般规则在基本名称上给出了比较细的分类规定，但在附加修饰词上只能给出原则性的规定，这也是因为地球上岩石的复杂性和多样性所决定的，因此要给出完全标准化的分类命名也就非常困难。所以不可能给出一个事先预定好的分类框架。而“末级动态再分类法”就是在国标基本名称的基础上，根据以下情况末级再动态分类：

(1)由于用于岩石识别模型的训练样本不可能同时的全面收集各种分门别类样本，而是在建模与应用中不断逐步递增各类样本的过程。因此，岩石分类的框架也是动态完善的。这就有可能部分岩石分类一开始样本还比较少，比如就3-5块标本(每个标本的照片都会超过24张以上)，从训练的角度，该样本的数量还不足代表该类样本的特征，因此，在这个等级粒度上，还不足与单独划出类，这时，就应该把这个类先暂时划分上一个层级的分类。这样分类既能避免个别类由于样本偏少，造成样本的不均衡，影响建模精度。其次，根据岩石分类末2级分类具有类的共性和继承性的特点，可以提供稍粗一级的分类定名服务，也能满足业务需求。

如，GB/T 17412.1-1998岩石分类和命名方案火成岩岩石分类和命名方案重正常火山碎屑岩类的凝灰岩，国标中给出了晶屑、岩屑、玻屑凝灰岩的分类和名规则，在实际的手标本凝灰岩分类与命名中，就要复杂的多，如①还要考虑与熔岩相应的岩性，是流纹质还是英安质还是安山质或是二者的结合，如流纹英安质等；②晶屑、岩屑、玻屑含量的组合，可能是流纹质晶屑凝灰岩或流纹质晶屑岩屑凝灰岩或是流纹质岩屑晶屑凝灰岩，组合方式繁杂。③部分还有含有角砾等，就需和上述两种情况组合定名；上述三种情况只是部分类的要素内容，因此，到手标本级别的分类就会现几十种。

图4展示的目录就是开始样本还没有达到一定数量是，先暂时把凝灰岩的样本都放在一个类目中。如果满足分类的样本数量后，就可单独提出分类。目前，该类别细分已达77个子类。

(2)如果具有相同附加修饰词的同一类样本数量的增加到一定的量时(如超过10个以上)，即可增加一个新的末二级和末一级分类。

仍然采用图4示例说明。随着凝灰岩的样本的增多，岩性粒度越来越细、越来越丰富，这样就可以从凝灰岩(未分)目录中分离出更细一级的分类，如流纹质玻屑凝灰岩就分出一个可满足训练样本的类。具体分类目录如图5所示。

“末级动态再分类法”大大增加了分类的灵活性，避免了末级分类，在国家标准不可能全部枚举的情况下，可以根据实际应用的情况，准确的落入国家上层岩石分类目录树的合适位置上。同时，又保障了分类样本数量的平衡性原则(如保证每一个岩石样本的数量基本控制在一个数量级别上)，降低了识别模型对大数量级别岩石的归属概率倾向。目前，通过本方法建立的岩石训练样本库已超过66万张照片，手标本分类超过9000类。

“末级动态再分类法”与岩石分类约束继承性损失计算模型自适应性，自动由样本的多级标签构建级间映射关系字典，不需重构模型结构和算法。

通常在岩石识别深度学习模型建模时，一般做法就是根据国家标准建立起一个全国的岩石分类与定名体系，用于模型计算或最后给出一个该岩石的分类信息链。如果分类体系变化，可能就要导致建模相关框架的调整，导致效率低下。另一个方面，手标本级别的分类级别，在实际应用，很难做到分类体系在附加修饰词的相关内容方面一致，也就是会更复杂更丰富，国家标准不可能全部枚举。随着训练样本的增加，可以动态的增加分类类目，不需要事先构造好所有的分类体系，就可以进行建模计算，大大提高了建模效率，也保证了训练样本与模型样本分类的一致性。

极大突出了岩石“分类树”中蕴含的丰富层级信息，增强了子类间差异及类内相似性，大大提高了岩石识别模型的优化的能力，提高了岩石识别模型的精度。

从上述岩石分类的体系来看，岩石的分类体系及其识别难度比通常流行的识别对象要复杂的多，因此按照一般的深度学习模型方法，很难满足岩石识别的要求。这是因为在常见的分类任务中，图像的标签是单一的且处于分类体系的同一层级，例如，汽车、飞机、轮船等。在这类通用图像分类任务中，目标对象无论从轮廓、颜色等方面，都具有显著的差异。神经网络的输出仅需要对照单一层级标签来计算交叉熵损失，用于神经网络的优化，就可以满足通用图像分类任务的要求。

试验

本发明做了在没有层级岩石分类的情况下(即一级分类)，采用VGG-19和VGG-16算法进行了测试，岩石分类数19类(没有目录树)，训练样本数33071张，测试样本数7896张，结果见表1。表1的训练精度指标都比较低，最大都在60％左右，证明了传统的交叉熵损失计算仅支持单一层级标签，无法充分利用多级标签之间的分类信息，对模型的优化具有局限性，不足以满足类间仅有细微差距的细粒度图像分类任务。

表1未采用分类树结构(仅一级分类)VGG19/VGG16建模精度

模型	训练精度	测试	备注
				VGG-19	62.82％	44.64％	224*224切片
VGG-16	55.22％	63.0％	224*224切片

在三大岩石分类中，从国家标准看出顶层的1-2级的分类基本是从科学上或成因上进行划分，大部分内容属于概念的范畴(如火成岩-深成岩类-花岗岩或火成岩-火山熔岩类-流纹岩类)。但从第3级上，也就是实体标本的内容，从这个分类级往更细的分类，岩石分类的特点有特别明显继承的特点，即上级标签是下级标签的概括，下级标签是上级标签的细化。换句话说主要岩性或主要特点是相同的，不同的是其他微细特征。如果能够把某一级下一级分类的总体或公共特征“贡献”到上一级的监督信息，就可以充分利用分类信息来优化岩石识别模型和进一步提升岩石识别模型的精度。

为了测试本方法提高精度的能力，在同一批样本(近30万个原始样本，训练样本可达3000万，近6000个手标本分类)，进行了常规监督学习的模型训方法(如独热码)以及与本方法实验结果的对比。在样本数量、照片输入方式都相同的情况下，证明了本方法在提高模型的识别精度有了大幅度的提高。岩石分类约束继承性损失方法与独热码方法模型精度对比表见表2。该结果也从另一个角度证明了，如果不考虑岩石分类树中包含的层间从属关系和类间异同信息，要大幅度突破模型的泛化能力是比较困难的。

表2岩石分类约束继承性损失方法与独热码方法模型精度对比表

本发明提出的“岩石分类约束继承性损失”将岩石层级分类体系的结构特征融入深度神经网络的训练过程中，结合样本的多级标签信息，为网络的参数优化提高更多的监督信息，突出了岩石样本不同分类级别的特点，极大的降低了样本在相对上一级分类级别或粗级粒度的分类的错误性，极有利于岩石识别的泛化能力的大幅度提高。为实际应用奠定了基础。

为了测试本方法提高泛化的能力，在同一批样本(近30万个原始样本，训练样本可达3000万和1500万，近6000个手标本分类)，进行了常规监督学习的模型训方法(如独热码)以及与本方法建立的模型，然后对福建中生代火山岩样本(完全不在训练样本空间中)进行测试对比。表3是岩石分类约束继承性损失方法与独热码方法模型在泛化能力方面的对比表。实验结果的对比，本方法泛化能力比一般模型的泛化能力从28.8％提高到57％，证明了“岩石分类约束继承性损失”充分利用岩石分类树中包含的层间从属关系和类间异同信息，进一步优化岩石识别模型，在泛化能力上也有了大幅度的提高。

表3岩石分类约束继承性损失方法与独热码方法模型泛化能力对比表

本发明提出的“岩石分类约束继承性损失”具有良好的可迁移性，不局限于某种特定神经网络结构，能够促进多种神经网络的训练优化；

本发明提出的“岩石分类约束继承性损失”充分利用GPU并行计算的能力，充分利用计算资源，避免计算量增加带来的效率下降问题；

本发明提出的“岩石分类约束继承性损失”易于实现，操作简单，不仅可用于岩石识别模型的训练，更可推广至多种实际应用场景中。

本发明的有益效果为：

第三，借鉴岩石层级分类体系的结构特征，提出了一种用于深度神经网络训练的损失函数——“岩石分类约束继承性损失”函数。该损失函数通过简单的“分组”和“相加”操作，将岩石分类树的层级结构融入神经网络的训练过程中，为网络的训练提供更多的监督信息，有助于进一步提升岩石识别模型的精度。本发明的目的在于充分利用岩石分类树中包含的层间从属关系和类间异同信息，进一步优化岩石识别模型的精度。

上述说明示出并描述了本申请的若干优选实施例，但如前所述，应当理解本申请并非局限于本文所披露的形式，不应看作是对其他实施例的排除，而可用于各种其他组合、修改和环境，并能够在本文所述申请构想范围内，通过上述教导或相关领域的技术或知识进行改动。而本领域人员所进行的改动和变化不脱离本申请的精神和范围，则都应在本申请所附权利要求的保护范围内。

Claims

1.一种岩石识别深度学习模型岩石分类约束继承性损失方法，其特征在于，包括：

2.根据权利要求1所述的岩石识别深度学习模型岩石分类约束继承性损失方法，其特征在于，所述第一步还包括根据岩石样本增多，动态增加分类树结构和树叶的步骤。

3.根据权利要求2所述的岩石识别深度学习模型岩石分类约束继承性损失方法，其特征在于，所述岩石样本数据集D的各层级标签所构成的分类树根据末级动态再分类法，对新增和原有的岩石样本细化和优化层级分类。

4.根据权利要求3所述的岩石识别深度学习模型岩石分类约束继承性损失方法，其特征在于，将待训练岩石样本图像输入深度神经网络，网络输出针对分类树各层级的最后一级标签预测，包括：通过softmax函数计算后，逐位归一化为分类树最后一级各类别的预测概率。

5.根据权利要求1所述的岩石识别深度学习模型岩石分类约束继承性损失方法，其特征在于，所述第一步中，

第n级标签：[第n-1级标签，第n-2级标签，......，第1级标签]。

6.根据权利要求5所述的岩石识别深度学习模型岩石分类约束继承性损失方法，其特征在于，进一步包括：根据上述tax_mapping，生成用于继承性损失计算的掩膜：tax_mask，该tax_mask为由n-1个N_n×N_n二维矩阵组成的三维01矩阵，其中，每个二维矩阵表示上层各级标签与第n级标签的对应关系。

7.根据权利要求6所述的岩石识别深度学习模型岩石分类约束继承性损失方法，其特征在于，进一步包括：

最后，传入tax_mask参数，并使用set()方法对掩膜进行赋值。

8.根据权利要求1所述的岩石识别深度学习模型岩石分类约束继承性损失方法，其特征在于，所述收敛条件包括：损失曲线是否趋于平稳，或测试准确率是否达到要求。