CN111564188B

CN111564188B - 一种基于变分自编码矿物信息定量分析方法

Info

Publication number: CN111564188B
Application number: CN202010356591.1A
Authority: CN
Inventors: 秦凯; 朱玲; 赵宁博; 杨越超; 崔鑫; 李明
Original assignee: Beijing Research Institute of Uranium Geology
Current assignee: Beijing Research Institute of Uranium Geology
Priority date: 2020-04-29
Filing date: 2020-04-29
Publication date: 2023-09-12
Anticipated expiration: 2040-04-29
Also published as: CN111564188A

Abstract

本发明属于地质勘查技术领域，具体涉及一种基于变分自编码矿物信息定量分析方法，包括以下步骤：步骤一：采集研究区高光谱数据，读取多种矿物混合的光谱作为训练样本光谱；步骤二：根据光谱波段数、矿物种类、构建五层全连接神经网络；步骤三：将每一条样本光谱转化为一个列向量，并进行光谱归一化处理；输入到全连接神经网络进行训练，获得矿物端元光谱的初始值；步骤四：构建变分自编码神经网络；步骤五：训练变分自编码神经网络，将变分自编码神经网络第二隐含层映射到变分自编码神经网络重构样本输出层的权重系数矩阵参数设置为步骤三中矿物端元光谱的初始值。

Description

一种基于变分自编码矿物信息定量分析方法

技术领域

本发明属于地质勘查技术领域，具体涉及一种基于变分自编码矿物信息定量分析方法。

背景技术

大量观测地球系统的高光谱数据已经变得可用，这些数据来自于多平台传感器，包括从地球上几米-几百米的地面光谱仪、无人机高光谱测量系统到几千米-几百公里的航空及卫星遥感系统，我国高五卫星的成功发射也推动了高光谱可用数据的进一步扩展。矿物填图是高光谱技术最成功的,也是最能发挥其优势的应用领域。在地质调查、矿产勘查和行星探测中，存在许多复杂地质应用场景，一个关键的挑战是从这些复杂地质背景的高光谱数据中定量反演矿物信息。

限于目前的卫星高光谱分辨率和地质场景中矿物的紧致、非线性混合，混合光谱分解是高光谱矿物定量分析的重要方法。为此，需要提出一种基于变分深度自编码的矿物混合光谱定量分析方法，实现对地表矿物定量信息的获取，及提升高光谱遥感地质应用定量化研究的意义。

发明内容

本发明针对上述现有技术的不足，提供一种基于变分自编码矿物信息定量分析方法，用于解决原有技术中高光谱数据处理定量反演矿物信息较弱的技术问题，确定地表岩石土壤矿物含量技术问题。

本发明的技术方案：

一种基于变分自编码矿物信息定量分析方法，包括以下步骤：

步骤一：采集研究区高光谱数据，读取多种矿物混合的光谱作为训练样本光谱；

步骤二：根据光谱波段数、矿物种类、构建五层全连接神经网络；所述五层全连接神经网络，包括：全连接神经网络输入层、全连接神经网络第一隐含层、全连接神经网络第二隐含层、全连接神经网络第三隐含层和全连接神经网络输出层；

步骤2.1：计算每条训练样本光谱对应的全连接神经网络第一隐含层特征；

步骤2.2：计算全连接神经网络第二隐含层特征；

步骤2.3：计算每个训练样本光谱对应的全连接神经网络重构样本光谱；

步骤2.4：构建全连接神经网络的损失函数；

步骤三：将每一条样本光谱转化为一个列向量，并进行光谱归一化处理；输入到全连接神经网络进行训练，获得矿物端元光谱的初始值；

步骤四：构建变分自编码神经网络；变分自编码神经网络包括：变分自编码神经网络输入层、变分自编码神经网络第一隐含层、变分自编码神经网络特征层、变分自编码神经网络第二隐含层和变分自编码神经网络输出层；

步骤4.1：计算步骤一中每条训练样本光谱对应特征的均值；

步骤4.2：计算步骤一中每条训练样本光谱对应特征的标准差；

步骤4.3：计算步骤一中每条训练样本光谱对应的特征值；

步骤4.4：计算步骤一中每条训练样本光谱对应的重构样本光谱；

步骤4.5：构建变分自编码神经网络的损失函数；

步骤五：训练变分自编码神经网络，将变分自编码神经网络第二隐含层映射到变分自编码神经网络重构样本输出层的权重系数矩阵参数设置为步骤三中矿物端元光谱的初始值；

步骤5.1：对变分自编码神经网络的参数初始化赋值，隐含层映射到重构样本输出层的权重系数矩阵参数设置为步骤3获得的矿物端元光谱的初始值；

步骤5.2：将步骤一中每一条训练样本光谱转化为一个列向量输入到对变分自编码神经网络进行训练，获得更新后的对变分自编码神经网络参数；

步骤5.3：判断循环次数是否为50次，如果循环次数为是，则执行步骤5.4，如果循环次数为否，则训练次数加1次后执行步骤5.2；

步骤5.4：获得变分自编码神经网络隐含层映射到重构样本输出层的权重系数矩阵为矿物端元光谱，获得变分自编码神经网络特征层为矿物含量值。

所述步骤一中还包括：从高光谱数据中，读取10000条以上多种矿物混合的光谱作为训练样本光谱。

所述步骤二中全连接神经网络输入层的神经元个数为光谱波段数，每个波段的反射率为全连接神经网络输入层的神经元；设置全连接神经网络第三隐含层神经元数为矿物种类数，全连接神经网络输出层为重构光谱；

所述步骤2.1中，计算每条训练样本光谱对应的全连接神经网络第一隐含层特征公式如下：

其中，为第i个训练样本光谱对应的第一隐含层特征，Relu表示修正线性单元Rectified linear Units，W¹为输入层映射到第一隐含层的权重系数矩阵，b₁为输入层映射到第一隐含层的偏置向量；x_i为第i个训练样本光谱；

所述的步骤2.2中，计算全连接神经网络第二隐含层特征的公式如下式(2)：

其中，为第i个训练样本光谱对应的第二层隐含层特征，W²为第一隐含层映射到第二隐含层的权重系数矩阵，b²为第一隐含层映射到第二隐含层的偏置向量；/>为第i个训练样本光谱对应的第一隐含层特征；

所述的步骤2.3中，计算每个训练样本光谱对应的全连接神经网络重构样本光谱，计算公式如下式(3)：

其中，为第i个训练样本光谱对应的重构样本，sigmoid为输出层激活函数，W ³为第二隐含层映射到第三隐含层的权重系数矩阵，b³为第二隐含层映射到第三隐含层的偏置向量；/>为第i个训练样本光谱对应的第二隐含层特征，W⁴为第三隐含层映射到重构样本输出层的权重系数矩阵，b⁴为第三隐含层映射到重构样本输出层的偏置向量；

所述的步骤2.4中，构建全连接神经网络的损失函数如下式(4)：

其中，L为全连接神经网络的损失函数，||||表示取模值操作，arccos表示的是反三角函数中的反余弦，为第i个训练样本光谱对应的重构样本；x_i为第i个训练样本光谱。

所述步骤三还包括：

步骤3.1:对全连接神经网络的参数初始化赋值；

步骤3.2：将每一条步骤一中的训练样本光谱转化为一个列向量输入到全连接神经网络进行训练，获得更新后的全连接神经网络参数；

步骤3.3：判断循环次数是否为50次，如果循环次数为是，则执行步骤3.4；如果循环次数为否，则训练次数加1次后执行步骤3.2；

步骤3.4：获得全连接神经网络隐含层映射到全连接神经网络重构样本输出层的权重系数矩阵为矿物端元光谱的初始值。

所述步骤四还包括：变分自编码神经网络输入层神经元个数为光谱的波段数，每个波段的反射率为变分自编码神经网络输入层的神经元；变分自编码神经网络特征层计算出每个样本的特征的均值和标准差，并进行重参数处理，变分自编码神经网络输出层为重构光谱。

所述步骤4.1中，计算步骤一中每条训练样本光谱变分自编码神经网络特征层对应特征的均值的公式，如下式(5)：

μ_i＝Relu(w^1v*x_i+b^1v)*w^2v+b^2v………………(5)

其中，μ_i为第i个训练样本光谱对应的特征的均值，Relu表示修正线性单元Rectified linear Units，w^1v为输入层映射到第一隐含层的权重系数矩阵，b^1v为输入层映射到第一隐含层的偏置向量；w^2v为第一隐含层到特征层均值的权重系数矩阵，b^2v为第一隐含层映射到特征层均值的偏置向量；x_i为第i个训练样本光谱。

所述步骤4.2中，计算步骤一中每条训练样本光谱变分自编码神经网络特征层对应特征的标准差的公式，如下式(6)：

σ_i＝Relu(w^1v*x_i+b^1v)*w^3v+b^3v………………(6)

其中，σ_i为第i个训练样本光谱对应的特征的标准差，Relu表示修正线性单元Rectified linear Units，w^1v为输入层映射到第一隐含层的权重系数矩阵，b^1v为输入层映射到第一隐含层的偏置向量；w^3v为第一隐含层到特征层标准差的权重系数矩阵，b^2v为第一隐含层映射到特征层标准差的偏置向量；x_i为第i个训练样本光谱。

所述步骤4.3中，计算步骤一中每个训练样本光谱变分自编码神经网络特征层对应的特征值的公式如下式(7)：

Z_i＝μ_i+ε*σ_i…………………………(7)

其中，Z_i为第i个训练样本光谱对应的特征值，ε为服从标准正态分布的一个采样值。

所述步骤4.4中，计算步骤一中每个训练样本光谱变分自编码神经网络输出层对应的重构样本光谱的公式如下式(8)：

其中，为第i个训练样本光谱对应的重构样本，sigmoid为输出层激活函数，w^4v为变分自编码特征层映射到第二隐含层的权重系数矩阵，b^4v为变分自编码特征层映射到第二隐含层的偏置向量；w^5v为第二隐含层映射到重构样本输出层的权重系数矩阵，b^5v第二隐含层映射到重构样本输出层的偏置向量。

所述步骤4.5中，构建变分自编码神经网络的损失函数，如下式(9)：

其中，L为全连接神经网络的损失函数，||||表示取模值操作，arccos表示的是反三角函数中的反余弦，log表示以自然对数为底的取对数操作，为第i个训练样本光谱对应的重构样本；x_i为第i个训练样本光谱。

本发明的有益效果：

本发明提出的基于变分自编码矿物信息定量分析方法，针对热液环境常见矿物，如：橄榄石、黄钾铁矾、赤铁矿、针铁矿、铁氢化物、白云母、蒙脱石、高岭石、绿泥石、石膏、菱铁矿、白云石、方解石均做过大量实验研究，能够有效提取上述矿物的端元光谱和含量，适用性较强，对于其他矿物的识别和分析工作也具有借鉴意义。

具体实施方式

步骤一：采集研究区高光谱数据，读取多种矿物混合的光谱作为训练样本光谱；从高光谱数据中，读取10000条以上多种矿物混合的光谱作为训练样本光谱。

全连接神经网络输入层的神经元个数为光谱波段数，每个波段的反射率为全连接神经网络输入层的神经元；设置全连接神经网络第三隐含层神经元数为矿物种类数，全连接神经网络输出层为重构光谱；

步骤2.1：计算每条训练样本光谱对应的全连接神经网络第一隐含层特征，公式如下式(1)：

步骤2.2：计算全连接神经网络第二隐含层特征；

计算全连接神经网络第二隐含层特征的公式如下式(2)：

步骤2.3：计算每个训练样本光谱对应的全连接神经网络重构样本光谱；计算每个训练样本光谱对应的全连接神经网络重构样本光谱，计算公式如下式(3)：

其中，为第i个训练样本光谱对应的重构样本，sigmoid为输出层激活函数，W³为第二隐含层映射到第三隐含层的权重系数矩阵，b³为第二隐含层映射到第三隐含层的偏置向量；/>为第i个训练样本光谱对应的第二隐含层特征，W⁴为第三隐含层映射到重构样本输出层的权重系数矩阵，b⁴为第三隐含层映射到重构样本输出层的偏置向量；

步骤2.4：构建全连接神经网络的损失函数；

构建全连接神经网络的损失函数如下式(4)：

步骤3.1:对全连接神经网络的参数初始化赋值；

变分自编码神经网络输入层神经元个数为光谱的波段数，每个波段的反射率为变分自编码神经网络输入层的神经元；变分自编码神经网络特征层计算出每个样本的特征的均值和标准差，并进行重参数处理，变分自编码神经网络输出层为重构光谱。

步骤4.1：计算步骤一中每条训练样本光谱对应特征的均值；

计算步骤一中每条训练样本光谱变分自编码神经网络特征层对应特征的均值的公式，如下式(5)：

μ_i＝Relu(w^1v*x_i+b^1v)*w^2v+b^2v………………(5)

计算步骤一中每条训练样本光谱变分自编码神经网络特征层对应特征的标准差的公式，如下式(6)：

σ_i＝Relu(w^1v*x_i+b^1v)*w^3v+b^3v………………(6)

步骤4.3：计算步骤一中每条训练样本光谱对应的特征值；

计算步骤一中每个训练样本光谱变分自编码神经网络特征层对应的特征值的公式如下式(7)：

Z_i＝μ_i+ε*σ_i…………………………(7)

计算步骤一中每个训练样本光谱变分自编码神经网络输出层对应的重构样本光谱的公式如下式(8)：

步骤4.5：构建变分自编码神经网络的损失函数；

构建变分自编码神经网络的损失函数，如下式(9)：

实施例：下面结合实施例对本发明设计的一种基于变分自编码矿物信息定量分析方法进一步进行详细说明：

本实施例中选择白云母、方解石、白云石、长石四种矿物进行含量反演，其它矿物可参考此方法。

步骤一：选择白云母、方解石、白云石、长石四种矿物进行试验，端元光谱取自美国地质勘探局光谱库。根据Dirichlet分布生成随机丰度。模拟出10000条四种矿物混合的光谱。

步骤二：根据样本数量、矿物种类、初始化一个五层的全连接神经网络，全连接神经网络输入神经元为波段数420，全连接神经网络第一层隐含层神经元为100个，全连接神经网络第二层隐含层神经元为25个，全连接神经网络第三层隐含层神经元为4个(矿物种类)，全连接神经网络输出层重建样本光谱输出神经元为420。

全连接神经网络输入层和全连接神经网络隐含层激活函数为Relu，全连接神经网络输出层激活函数为sigmoid，学习率为0.001。

步骤三：将本实施例中10000条样本光谱转化为列向量，输入到全连接神经网络，设置最大迭代次数为50，通过最小化全连接神经网络的损失函数，采用梯度下降算法，不断迭代更新全连接神经网络系数，存储获取白云母、方解石、白云石、长石四种矿物端元光谱初始值。

步骤四：构建变分自编码神经网络，变分自编码神经网络输入神经元为波段数420，变分自编码神经网络第一层隐含层神经元为100个，变分自编码神经网络特征层神经元为4个，变分自编码神经网络第二隐含层神经元为4个，计算出每个样本的特征的均值和标准差，并进行重参数处理，变分自编码神经网络输出层为重构光谱。

变分自编码神经网络输入层和变分自编码神经网络隐含层激活函数为Relu，变分自编码神经网络输出层激活函数为sigmoid，学习率为0.001。

步骤五：将10000条样本光谱列向量，输入到变分自编码神经网络，设置最大迭代次数为50，通过最小化变分自编码神经网络的损失函数，采用梯度下降算法，不断迭代更新神经网络系数，变分自编码神经网络第二隐含层映射到变分自编码神经网络重构样本输出层的权重系数矩阵为获取的白云母、方解石、白云石、长石矿物端元光谱。特征层为白云母、方解石、白云石、长石矿物的含量值。

上面对本发明的实施例作了详细说明，本发明并不限于上述实例，在本领域普通技术人员所具备的知识范围内，还可以在不脱离本发明宗旨的前提下做出各种变化。

Claims

1.一种基于变分自编码矿物信息定量分析方法，其特征在于：包括以下步骤：

步骤二：根据光谱波段数、矿物种类构建五层全连接神经网络；所述五层全连接神经网络，包括：全连接神经网络输入层、全连接神经网络第一隐含层、全连接神经网络第二隐含层、全连接神经网络第三隐含层和全连接神经网络输出层；

步骤2.2：计算全连接神经网络第二隐含层特征；

步骤2.4：构建全连接神经网络的损失函数；

其中，为第i个训练样本光谱对应的第一隐含层特征，Relu表示修正线性单元RectifiedlinearUnits，W¹为输入层映射到第一隐含层的权重系数矩阵，b¹为输入层映射到第一隐含层的偏置向量；x_i为第i个训练样本光谱；

其中，L为全连接神经网络的损失函数，|| ||表示取模值操作，arccos表示的是反三角函数中的反余弦，为第i个训练样本光谱对应的重构样本；x_i为第i个训练样本光谱；

步骤4.1：计算步骤一中每条训练样本光谱对应特征的均值；

步骤4.3：计算步骤一中每条训练样本光谱对应的特征值；

步骤4.5：构建变分自编码神经网络的损失函数；

所述步骤四还包括：变分自编码神经网络输入层神经元个数为光谱的波段数，每个波段的反射率为变分自编码神经网络输入层的神经元；变分自编码神经网络特征层计算出每个样本的特征的均值和标准差，并进行重参数处理，变分自编码神经网络输出层为重构光谱；

步骤5.1：对变分自编码神经网络的参数初始化赋值，隐含层映射到重构样本输出层的权重系数矩阵参数设置为步骤三获得的矿物端元光谱的初始值；

2.根据权利要求1所述的一种基于变分自编码矿物信息定量分析方法，其特征在于：所述步骤一中还包括：从高光谱数据中，读取10000条以上多种矿物混合的光谱作为训练样本光谱。

3.根据权利要求2所述的一种基于变分自编码矿物信息定量分析方法，其特征在于：所述步骤三还包括：

步骤3.1:对全连接神经网络的参数初始化赋值；

4.根据权利要求3所述的一种基于变分自编码矿物信息定量分析方法，其特征在于；所述步骤4.1中，计算步骤一中每条训练样本光谱变分自编码神经网络特征层对应特征的均值的公式，如下式(5)：

μ_i＝Relu(w^1v*x_i+b^1v)*w^2v+b^2v………………(5)

其中，μ_i为第i个训练样本光谱对应的特征的均值，Relu表示修正线性单元Rectifiedlinear Units，w^1v为输入层映射到第一隐含层的权重系数矩阵，b^1v为输入层映射到第一隐含层的偏置向量；w^2v为第一隐含层到特征层均值的权重系数矩阵，b^2v为第一隐含层映射到特征层均值的偏置向量；x_i为第i个训练样本光谱。

5.根据权利要求4所述的一种基于变分自编码矿物信息定量分析方法，其特征在于：所述步骤4.2中，计算步骤一中每条训练样本光谱变分自编码神经网络特征层对应特征的标准差的公式，如下式(6)：

σ_i＝Relu(w^1v*x_i+b^1v)*w^3v+b^3v………………(6)

其中，σ_i为第i个训练样本光谱对应的特征的标准差，Relu表示修正线性单元Rectifiedlinear Units，w^1v为输入层映射到第一隐含层的权重系数矩阵，b^1v为输入层映射到第一隐含层的偏置向量；w^3v为第一隐含层到特征层标准差的权重系数矩阵，b^3v为第一隐含层映射到特征层标准差的偏置向量；x_i为第i个训练样本光谱。

6.根据权利要求5所述的一种基于变分自编码矿物信息定量分析方法，其特征在于：所述步骤4.3中，计算步骤一中每个训练样本光谱变分自编码神经网络特征层对应的特征值的公式如下式(7)：

Z_i＝μ_i+ε*σ_i…………………………(7)

7.根据权利要求6所述的一种基于变分自编码矿物信息定量分析方法，其特征在于：所述步骤4.4中，计算步骤一中每个训练样本光谱变分自编码神经网络输出层对应的重构样本光谱的公式如下式(8)：

8.根据权利要求7所述的一种基于变分自编码矿物信息定量分析方法，其特征在于：所述步骤4.5中，构建变分自编码神经网络的损失函数，如下式(9)：

其中，L为全连接神经网络的损失函数，|| ||表示取模值操作，arccos表示的是反三角函数中的反余弦，log表示以自然对数为底的取对数操作，为第i个训练样本光谱对应的重构样本；X_i为第i个训练样本光谱。