CN111564188A - 一种基于变分自编码矿物信息定量分析方法 - Google Patents

一种基于变分自编码矿物信息定量分析方法 Download PDF

Info

Publication number
CN111564188A
CN111564188A CN202010356591.1A CN202010356591A CN111564188A CN 111564188 A CN111564188 A CN 111564188A CN 202010356591 A CN202010356591 A CN 202010356591A CN 111564188 A CN111564188 A CN 111564188A
Authority
CN
China
Prior art keywords
neural network
layer
spectrum
hidden layer
coding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010356591.1A
Other languages
English (en)
Other versions
CN111564188B (zh
Inventor
秦凯
朱玲
赵宁博
杨越超
崔鑫
李明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Research Institute of Uranium Geology
Original Assignee
Beijing Research Institute of Uranium Geology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Research Institute of Uranium Geology filed Critical Beijing Research Institute of Uranium Geology
Priority to CN202010356591.1A priority Critical patent/CN111564188B/zh
Publication of CN111564188A publication Critical patent/CN111564188A/zh
Application granted granted Critical
Publication of CN111564188B publication Critical patent/CN111564188B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/70Machine learning, data mining or chemometrics
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/20Identification of molecular entities, parts thereof or of chemical compositions
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2201/00Features of devices classified in G01N21/00
    • G01N2201/12Circuits of general importance; Signal processing
    • G01N2201/129Using chemometrical methods
    • G01N2201/1296Using chemometrical methods using neural networks
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A40/00Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
    • Y02A40/10Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Chemical & Material Sciences (AREA)
  • Molecular Biology (AREA)
  • Mathematical Physics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Databases & Information Systems (AREA)
  • Medical Informatics (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Investigating Or Analysing Materials By Optical Means (AREA)

Abstract

本发明属于地质勘查技术领域,具体涉及一种基于变分自编码矿物信息定量分析方法,包括以下步骤:步骤一:采集研究区高光谱数据,读取多种矿物混合的光谱作为训练样本光谱;步骤二:根据光谱波段数、矿物种类、构建五层全连接神经网络;步骤三:将每一条样本光谱转化为一个列向量,并进行光谱归一化处理;输入到全连接神经网络进行训练,获得矿物端元光谱的初始值;步骤四:构建变分自编码神经网络;步骤五:训练变分自编码神经网络,将变分自编码神经网络第二隐含层映射到变分自编码神经网络重构样本输出层的权重系数矩阵参数设置为步骤三中矿物端元光谱的初始值。

Description

一种基于变分自编码矿物信息定量分析方法
技术领域
本发明属于地质勘查技术领域,具体涉及一种基于变分自编码矿物信息定量分析方法。
背景技术
大量观测地球系统的高光谱数据已经变得可用,这些数据来自于多平台传感器,包括从地球上几米-几百米的地面光谱仪、无人机高光谱测量系统到几千米-几百公里的航空及卫星遥感系统,我国高五卫星的成功发射也推动了高光谱可用数据的进一步扩展。矿物填图是高光谱技术最成功的,也是最能发挥其优势的应用领域。在地质调查、矿产勘查和行星探测中,存在许多复杂地质应用场景,一个关键的挑战是从这些复杂地质背景的高光谱数据中定量反演矿物信息。
限于目前的卫星高光谱分辨率和地质场景中矿物的紧致、非线性混合,混合光谱分解是高光谱矿物定量分析的重要方法。为此,需要提出一种基于变分深度自编码的矿物混合光谱定量分析方法,实现对地表矿物定量信息的获取,及提升高光谱遥感地质应用定量化研究的意义。
发明内容
本发明针对上述现有技术的不足,提供一种基于变分自编码矿物信息定量分析方法,用于解决原有技术中高光谱数据处理定量反演矿物信息较弱的技术问题,确定地表岩石土壤矿物含量技术问题。
本发明的技术方案:
一种基于变分自编码矿物信息定量分析方法,包括以下步骤:
步骤一:采集研究区高光谱数据,读取多种矿物混合的光谱作为训练样本光谱;
步骤二:根据光谱波段数、矿物种类、构建五层全连接神经网络;所述五层全连接神经网络,包括:全连接神经网络输入层、全连接神经网络第一隐含层、全连接神经网络第二隐含层、全连接神经网络第三隐含层和全连接神经网络输出层;
步骤2.1:计算每条训练样本光谱对应的全连接神经网络第一隐含层特征;
步骤2.2:计算全连接神经网络第二隐含层特征;
步骤2.3:计算每个训练样本光谱对应的全连接神经网络重构样本光谱;
步骤2.4:构建全连接神经网络的损失函数;
步骤三:将每一条样本光谱转化为一个列向量,并进行光谱归一化处理;输入到全连接神经网络进行训练,获得矿物端元光谱的初始值;
步骤四:构建变分自编码神经网络;变分自编码神经网络包括:变分自编码神经网络输入层、变分自编码神经网络第一隐含层、变分自编码神经网络特征层、变分自编码神经网络第二隐含层和变分自编码神经网络输出层;
步骤4.1:计算步骤一中每条训练样本光谱对应特征的均值;
步骤4.2:计算步骤一中每条训练样本光谱对应特征的标准差;
步骤4.3:计算步骤一中每条训练样本光谱对应的特征值;
步骤4.4:计算步骤一中每条训练样本光谱对应的重构样本光谱;
步骤4.5:构建变分自编码神经网络的损失函数;
步骤五:训练变分自编码神经网络,将变分自编码神经网络第二隐含层映射到变分自编码神经网络重构样本输出层的权重系数矩阵参数设置为步骤三中矿物端元光谱的初始值;
步骤5.1:对变分自编码神经网络的参数初始化赋值,隐含层映射到重构样本输出层的权重系数矩阵参数设置为步骤3获得的矿物端元光谱的初始值;
步骤5.2:将步骤一中每一条训练样本光谱转化为一个列向量输入到对变分自编码神经网络进行训练,获得更新后的对变分自编码神经网络参数;
步骤5.3:判断循环次数是否为50次,如果循环次数为是,则执行步骤5.4,如果循环次数为否,则训练次数加1次后执行步骤5.2;
步骤5.4:获得变分自编码神经网络隐含层映射到重构样本输出层的权重系数矩阵为矿物端元光谱,获得变分自编码神经网络特征层为矿物含量值。
所述步骤一中还包括:从高光谱数据中,读取10000条以上多种矿物混合的光谱作为训练样本光谱。
所述步骤二中全连接神经网络输入层的神经元个数为光谱波段数,每个波段的反射率为全连接神经网络输入层的神经元;设置全连接神经网络第三隐含层神经元数为矿物种类数,全连接神经网络输出层为重构光谱;
所述步骤2.1中,计算每条训练样本光谱对应的全连接神经网络第一隐含层特征公式如下:
Figure BDA0002473692210000031
其中,
Figure BDA0002473692210000032
为第i个训练样本光谱对应的第一隐含层特征,Relu表示修正线性单元Rectified linear Units,W1为输入层映射到第一隐含层的权重系数矩阵,b1为输入层映射到第一隐含层的偏置向量;xi为第i个训练样本光谱;
所述的步骤2.2中,计算全连接神经网络第二隐含层特征的公式如下式(2):
Figure BDA0002473692210000033
其中,
Figure BDA0002473692210000034
为第i个训练样本光谱对应的第二层隐含层特征,W2为第一隐含层映射到第二隐含层的权重系数矩阵,b2为第一隐含层映射到第二隐含层的偏置向量;
Figure BDA0002473692210000041
为第i个训练样本光谱对应的第一隐含层特征;
所述的步骤2.3中,计算每个训练样本光谱对应的全连接神经网络重构样本光谱,计算公式如下式(3):
Figure BDA0002473692210000042
其中,
Figure BDA0002473692210000043
为第i个训练样本光谱对应的重构样本,sigmoid为输出层激活函数,W 3为第二隐含层映射到第三隐含层的权重系数矩阵,b3为第二隐含层映射到第三隐含层的偏置向量;
Figure BDA0002473692210000044
为第i个训练样本光谱对应的第二隐含层特征,W4为第三隐含层映射到重构样本输出层的权重系数矩阵,b4为第三隐含层映射到重构样本输出层的偏置向量;
所述的步骤2.4中,构建全连接神经网络的损失函数如下式(4):
Figure BDA0002473692210000045
其中,L为全连接神经网络的损失函数,||||表示取模值操作,arccos表示的是反三角函数中的反余弦,
Figure BDA0002473692210000046
为第i个训练样本光谱对应的重构样本;xi为第i个训练样本光谱。
所述步骤三还包括:
步骤3.1:对全连接神经网络的参数初始化赋值;
步骤3.2:将每一条步骤一中的训练样本光谱转化为一个列向量输入到全连接神经网络进行训练,获得更新后的全连接神经网络参数;
步骤3.3:判断循环次数是否为50次,如果循环次数为是,则执行步骤3.4;如果循环次数为否,则训练次数加1次后执行步骤3.2;
步骤3.4:获得全连接神经网络隐含层映射到全连接神经网络重构样本输出层的权重系数矩阵为矿物端元光谱的初始值。
所述步骤四还包括:变分自编码神经网络输入层神经元个数为光谱的波段数,每个波段的反射率为变分自编码神经网络输入层的神经元;变分自编码神经网络特征层计算出每个样本的特征的均值和标准差,并进行重参数处理,变分自编码神经网络输出层为重构光谱。
所述步骤4.1中,计算步骤一中每条训练样本光谱变分自编码神经网络特征层对应特征的均值的公式,如下式(5):
μi=Relu(w1v*xi+b1v)*w2v+b2v………………(5)
其中,μi为第i个训练样本光谱对应的特征的均值,Relu表示修正线性单元Rectified linear Units,w1v为输入层映射到第一隐含层的权重系数矩阵,b1v为输入层映射到第一隐含层的偏置向量;w2v为第一隐含层到特征层均值的权重系数矩阵,b2v为第一隐含层映射到特征层均值的偏置向量;xi为第i个训练样本光谱。
所述步骤4.2中,计算步骤一中每条训练样本光谱变分自编码神经网络特征层对应特征的标准差的公式,如下式(6):
σi=Relu(w1v*xi+b1v)*w3v+b3v………………(6)
其中,σi为第i个训练样本光谱对应的特征的标准差,Relu表示修正线性单元Rectified linear Units,w1v为输入层映射到第一隐含层的权重系数矩阵,b1v为输入层映射到第一隐含层的偏置向量;w3v为第一隐含层到特征层标准差的权重系数矩阵,b2v为第一隐含层映射到特征层标准差的偏置向量;xi为第i个训练样本光谱。
所述步骤4.3中,计算步骤一中每个训练样本光谱变分自编码神经网络特征层对应的特征值的公式如下式(7):
Zi=μi+ε*σi…………………………(7)
其中,Zi为第i个训练样本光谱对应的特征值,ε为服从标准正态分布的一个采样值。
所述步骤4.4中,计算步骤一中每个训练样本光谱变分自编码神经网络输出层对应的重构样本光谱的公式如下式(8):
Figure BDA0002473692210000061
其中,
Figure BDA0002473692210000062
为第i个训练样本光谱对应的重构样本,sigmoid为输出层激活函数,w4v为变分自编码特征层映射到第二隐含层的权重系数矩阵,b4v为变分自编码特征层映射到第二隐含层的偏置向量;w5v为第二隐含层映射到重构样本输出层的权重系数矩阵,b5v第二隐含层映射到重构样本输出层的偏置向量。
所述步骤4.5中,构建变分自编码神经网络的损失函数,如下式(9):
Figure BDA0002473692210000063
其中,L为全连接神经网络的损失函数,||||表示取模值操作,arccos表示的是反三角函数中的反余弦,log表示以自然对数为底的取对数操作,
Figure BDA0002473692210000071
为第i个训练样本光谱对应的重构样本;xi为第i个训练样本光谱。
本发明的有益效果:
本发明提出的基于变分自编码矿物信息定量分析方法,针对热液环境常见矿物,如:橄榄石、黄钾铁矾、赤铁矿、针铁矿、铁氢化物、白云母、蒙脱石、高岭石、绿泥石、石膏、菱铁矿、白云石、方解石均做过大量实验研究,能够有效提取上述矿物的端元光谱和含量,适用性较强,对于其他矿物的识别和分析工作也具有借鉴意义。
具体实施方式
一种基于变分自编码矿物信息定量分析方法,包括以下步骤:
步骤一:采集研究区高光谱数据,读取多种矿物混合的光谱作为训练样本光谱;从高光谱数据中,读取10000条以上多种矿物混合的光谱作为训练样本光谱。
步骤二:根据光谱波段数、矿物种类、构建五层全连接神经网络;所述五层全连接神经网络,包括:全连接神经网络输入层、全连接神经网络第一隐含层、全连接神经网络第二隐含层、全连接神经网络第三隐含层和全连接神经网络输出层;
全连接神经网络输入层的神经元个数为光谱波段数,每个波段的反射率为全连接神经网络输入层的神经元;设置全连接神经网络第三隐含层神经元数为矿物种类数,全连接神经网络输出层为重构光谱;
步骤2.1:计算每条训练样本光谱对应的全连接神经网络第一隐含层特征,公式如下式(1):
Figure BDA0002473692210000081
其中,
Figure BDA0002473692210000082
为第i个训练样本光谱对应的第一隐含层特征,Relu表示修正线性单元Rectified linear Units,W1为输入层映射到第一隐含层的权重系数矩阵,b1为输入层映射到第一隐含层的偏置向量;xi为第i个训练样本光谱;
步骤2.2:计算全连接神经网络第二隐含层特征;
计算全连接神经网络第二隐含层特征的公式如下式(2):
Figure BDA0002473692210000083
其中,
Figure BDA0002473692210000084
为第i个训练样本光谱对应的第二层隐含层特征,W2为第一隐含层映射到第二隐含层的权重系数矩阵,b2为第一隐含层映射到第二隐含层的偏置向量;
Figure BDA0002473692210000085
为第i个训练样本光谱对应的第一隐含层特征;
步骤2.3:计算每个训练样本光谱对应的全连接神经网络重构样本光谱;计算每个训练样本光谱对应的全连接神经网络重构样本光谱,计算公式如下式(3):
Figure BDA0002473692210000086
其中,
Figure BDA0002473692210000087
为第i个训练样本光谱对应的重构样本,sigmoid为输出层激活函数,W3为第二隐含层映射到第三隐含层的权重系数矩阵,b3为第二隐含层映射到第三隐含层的偏置向量;
Figure BDA0002473692210000088
为第i个训练样本光谱对应的第二隐含层特征,W4为第三隐含层映射到重构样本输出层的权重系数矩阵,b4为第三隐含层映射到重构样本输出层的偏置向量;
步骤2.4:构建全连接神经网络的损失函数;
构建全连接神经网络的损失函数如下式(4):
Figure BDA0002473692210000091
其中,L为全连接神经网络的损失函数,||||表示取模值操作,arccos表示的是反三角函数中的反余弦,
Figure BDA0002473692210000092
为第i个训练样本光谱对应的重构样本;xi为第i个训练样本光谱。
步骤三:将每一条样本光谱转化为一个列向量,并进行光谱归一化处理;输入到全连接神经网络进行训练,获得矿物端元光谱的初始值;
步骤3.1:对全连接神经网络的参数初始化赋值;
步骤3.2:将每一条步骤一中的训练样本光谱转化为一个列向量输入到全连接神经网络进行训练,获得更新后的全连接神经网络参数;
步骤3.3:判断循环次数是否为50次,如果循环次数为是,则执行步骤3.4;如果循环次数为否,则训练次数加1次后执行步骤3.2;
步骤3.4:获得全连接神经网络隐含层映射到全连接神经网络重构样本输出层的权重系数矩阵为矿物端元光谱的初始值。
步骤四:构建变分自编码神经网络;变分自编码神经网络包括:变分自编码神经网络输入层、变分自编码神经网络第一隐含层、变分自编码神经网络特征层、变分自编码神经网络第二隐含层和变分自编码神经网络输出层;
变分自编码神经网络输入层神经元个数为光谱的波段数,每个波段的反射率为变分自编码神经网络输入层的神经元;变分自编码神经网络特征层计算出每个样本的特征的均值和标准差,并进行重参数处理,变分自编码神经网络输出层为重构光谱。
步骤4.1:计算步骤一中每条训练样本光谱对应特征的均值;
计算步骤一中每条训练样本光谱变分自编码神经网络特征层对应特征的均值的公式,如下式(5):
μi=Relu(w1v*xi+b1v)*w2v+b2v………………(5)
其中,μi为第i个训练样本光谱对应的特征的均值,Relu表示修正线性单元Rectified linear Units,w1v为输入层映射到第一隐含层的权重系数矩阵,b1v为输入层映射到第一隐含层的偏置向量;w2v为第一隐含层到特征层均值的权重系数矩阵,b2v为第一隐含层映射到特征层均值的偏置向量;xi为第i个训练样本光谱。
步骤4.2:计算步骤一中每条训练样本光谱对应特征的标准差;
计算步骤一中每条训练样本光谱变分自编码神经网络特征层对应特征的标准差的公式,如下式(6):
σi=Relu(w1v*xi+b1v)*w3v+b3v………………(6)
其中,σi为第i个训练样本光谱对应的特征的标准差,Relu表示修正线性单元Rectified linear Units,w1v为输入层映射到第一隐含层的权重系数矩阵,b1v为输入层映射到第一隐含层的偏置向量;w3v为第一隐含层到特征层标准差的权重系数矩阵,b2v为第一隐含层映射到特征层标准差的偏置向量;xi为第i个训练样本光谱。
步骤4.3:计算步骤一中每条训练样本光谱对应的特征值;
计算步骤一中每个训练样本光谱变分自编码神经网络特征层对应的特征值的公式如下式(7):
Zi=μi+ε*σi…………………………(7)
其中,Zi为第i个训练样本光谱对应的特征值,ε为服从标准正态分布的一个采样值。
步骤4.4:计算步骤一中每条训练样本光谱对应的重构样本光谱;
计算步骤一中每个训练样本光谱变分自编码神经网络输出层对应的重构样本光谱的公式如下式(8):
Figure BDA0002473692210000111
其中,
Figure BDA0002473692210000112
为第i个训练样本光谱对应的重构样本,sigmoid为输出层激活函数,w4v为变分自编码特征层映射到第二隐含层的权重系数矩阵,b4v为变分自编码特征层映射到第二隐含层的偏置向量;w5v为第二隐含层映射到重构样本输出层的权重系数矩阵,b5v第二隐含层映射到重构样本输出层的偏置向量。
步骤4.5:构建变分自编码神经网络的损失函数;
构建变分自编码神经网络的损失函数,如下式(9):
Figure BDA0002473692210000113
其中,L为全连接神经网络的损失函数,||||表示取模值操作,arccos表示的是反三角函数中的反余弦,log表示以自然对数为底的取对数操作,
Figure BDA0002473692210000114
为第i个训练样本光谱对应的重构样本;Xi为第i个训练样本光谱。
步骤五:训练变分自编码神经网络,将变分自编码神经网络第二隐含层映射到变分自编码神经网络重构样本输出层的权重系数矩阵参数设置为步骤三中矿物端元光谱的初始值;
步骤5.1:对变分自编码神经网络的参数初始化赋值,隐含层映射到重构样本输出层的权重系数矩阵参数设置为步骤3获得的矿物端元光谱的初始值;
步骤5.2:将步骤一中每一条训练样本光谱转化为一个列向量输入到对变分自编码神经网络进行训练,获得更新后的对变分自编码神经网络参数;
步骤5.3:判断循环次数是否为50次,如果循环次数为是,则执行步骤5.4,如果循环次数为否,则训练次数加1次后执行步骤5.2;
步骤5.4:获得变分自编码神经网络隐含层映射到重构样本输出层的权重系数矩阵为矿物端元光谱,获得变分自编码神经网络特征层为矿物含量值。
实施例:下面结合实施例对本发明设计的一种基于变分自编码矿物信息定量分析方法进一步进行详细说明:
本实施例中选择白云母、方解石、白云石、长石四种矿物进行含量反演,其它矿物可参考此方法。
步骤一:选择白云母、方解石、白云石、长石四种矿物进行试验,端元光谱取自美国地质勘探局光谱库。根据Dirichlet分布生成随机丰度。模拟出10000条四种矿物混合的光谱。
步骤二:根据样本数量、矿物种类、初始化一个五层的全连接神经网络,全连接神经网络输入神经元为波段数420,全连接神经网络第一层隐含层神经元为100个,全连接神经网络第二层隐含层神经元为25个,全连接神经网络第三层隐含层神经元为4个(矿物种类),全连接神经网络输出层重建样本光谱输出神经元为420。
全连接神经网络输入层和全连接神经网络隐含层激活函数为Relu,全连接神经网络输出层激活函数为sigmoid,学习率为0.001。
步骤三:将本实施例中10000条样本光谱转化为列向量,输入到全连接神经网络,设置最大迭代次数为50,通过最小化全连接神经网络的损失函数,采用梯度下降算法,不断迭代更新全连接神经网络系数,存储获取白云母、方解石、白云石、长石四种矿物端元光谱初始值。
步骤四:构建变分自编码神经网络,变分自编码神经网络输入神经元为波段数420,变分自编码神经网络第一层隐含层神经元为100个,变分自编码神经网络特征层神经元为4个,变分自编码神经网络第二隐含层神经元为4个,计算出每个样本的特征的均值和标准差,并进行重参数处理,变分自编码神经网络输出层为重构光谱。
变分自编码神经网络输入层和变分自编码神经网络隐含层激活函数为Relu,变分自编码神经网络输出层激活函数为sigmoid,学习率为0.001。
步骤五:将10000条样本光谱列向量,输入到变分自编码神经网络,设置最大迭代次数为50,通过最小化变分自编码神经网络的损失函数,采用梯度下降算法,不断迭代更新神经网络系数,变分自编码神经网络第二隐含层映射到变分自编码神经网络重构样本输出层的权重系数矩阵为获取的白云母、方解石、白云石、长石矿物端元光谱。特征层为白云母、方解石、白云石、长石矿物的含量值。
上面对本发明的实施例作了详细说明,本发明并不限于上述实例,在本领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下做出各种变化。

Claims (10)

1.一种基于变分自编码矿物信息定量分析方法,其特征在于:包括以下步骤:
步骤一:采集研究区高光谱数据,读取多种矿物混合的光谱作为训练样本光谱;
步骤二:根据光谱波段数、矿物种类、构建五层全连接神经网络;所述五层全连接神经网络,包括:全连接神经网络输入层、全连接神经网络第一隐含层、全连接神经网络第二隐含层、全连接神经网络第三隐含层和全连接神经网络输出层;
步骤2.1:计算每条训练样本光谱对应的全连接神经网络第一隐含层特征;
步骤2.2:计算全连接神经网络第二隐含层特征;
步骤2.3:计算每个训练样本光谱对应的全连接神经网络重构样本光谱;
步骤2.4:构建全连接神经网络的损失函数;
步骤三:将每一条样本光谱转化为一个列向量,并进行光谱归一化处理;输入到全连接神经网络进行训练,获得矿物端元光谱的初始值;
步骤四:构建变分自编码神经网络;变分自编码神经网络包括:变分自编码神经网络输入层、变分自编码神经网络第一隐含层、变分自编码神经网络特征层、变分自编码神经网络第二隐含层和变分自编码神经网络输出层;
步骤4.1:计算步骤一中每条训练样本光谱对应特征的均值;
步骤4.2:计算步骤一中每条训练样本光谱对应特征的标准差;
步骤4.3:计算步骤一中每条训练样本光谱对应的特征值;
步骤4.4:计算步骤一中每条训练样本光谱对应的重构样本光谱;
步骤4.5:构建变分自编码神经网络的损失函数;
步骤五:训练变分自编码神经网络,将变分自编码神经网络第二隐含层映射到变分自编码神经网络重构样本输出层的权重系数矩阵参数设置为步骤三中矿物端元光谱的初始值;
步骤5.1:对变分自编码神经网络的参数初始化赋值,隐含层映射到重构样本输出层的权重系数矩阵参数设置为步骤3获得的矿物端元光谱的初始值;
步骤5.2:将步骤一中每一条训练样本光谱转化为一个列向量输入到对变分自编码神经网络进行训练,获得更新后的对变分自编码神经网络参数;
步骤5.3:判断循环次数是否为50次,如果循环次数为是,则执行步骤5.4,如果循环次数为否,则训练次数加1次后执行步骤5.2;
步骤5.4:获得变分自编码神经网络隐含层映射到重构样本输出层的权重系数矩阵为矿物端元光谱,获得变分自编码神经网络特征层为矿物含量值。
2.根据权利要求1所述的一种基于变分自编码矿物信息定量分析方法,其特征在于:所述步骤一中还包括:从高光谱数据中,读取10000条以上多种矿物混合的光谱作为训练样本光谱。
3.根据权利要求2所述的一种基于变分自编码矿物信息定量分析方法,其特征在于:所述步骤二中全连接神经网络输入层的神经元个数为光谱波段数,每个波段的反射率为全连接神经网络输入层的神经元;设置全连接神经网络第三隐含层神经元数为矿物种类数,全连接神经网络输出层为重构光谱;
所述步骤2.1中,计算每条训练样本光谱对应的全连接神经网络第一隐含层特征公式如下:
Figure FDA0002473692200000021
其中,
Figure FDA0002473692200000031
为第i个训练样本光谱对应的第一隐含层特征,Relu表示修正线性单元Rectified linear Units,W1为输入层映射到第一隐含层的权重系数矩阵,b1为输入层映射到第一隐含层的偏置向量;xi为第i个训练样本光谱;
所述的步骤2.2中,计算全连接神经网络第二隐含层特征的公式如下式(2):
Figure FDA0002473692200000032
其中,
Figure FDA0002473692200000033
为第i个训练样本光谱对应的第二层隐含层特征,W2为第一隐含层映射到第二隐含层的权重系数矩阵,b2为第一隐含层映射到第二隐含层的偏置向量;
Figure FDA0002473692200000034
为第i个训练样本光谱对应的第一隐含层特征;
所述的步骤2.3中,计算每个训练样本光谱对应的全连接神经网络重构样本光谱,计算公式如下式(3):
Figure FDA0002473692200000035
其中,
Figure FDA0002473692200000036
为第i个训练样本光谱对应的重构样本,sigmoid为输出层激活函数,W3为第二隐含层映射到第三隐含层的权重系数矩阵,b3为第二隐含层映射到第三隐含层的偏置向量;
Figure FDA0002473692200000037
为第i个训练样本光谱对应的第二隐含层特征,W4为第三隐含层映射到重构样本输出层的权重系数矩阵,b4为第三隐含层映射到重构样本输出层的偏置向量;
所述的步骤2.4中,构建全连接神经网络的损失函数如下式(4):
Figure FDA0002473692200000041
其中,L为全连接神经网络的损失函数,|| ||表示取模值操作,arccos表示的是反三角函数中的反余弦,
Figure FDA0002473692200000042
为第i个训练样本光谱对应的重构样本;xi为第i个训练样本光谱。
4.根据权利要求3所述的一种基于变分自编码矿物信息定量分析方法,其特征在于:所述步骤三还包括:
步骤3.1:对全连接神经网络的参数初始化赋值;
步骤3.2:将每一条步骤一中的训练样本光谱转化为一个列向量输入到全连接神经网络进行训练,获得更新后的全连接神经网络参数;
步骤3.3:判断循环次数是否为50次,如果循环次数为是,则执行步骤3.4;如果循环次数为否,则训练次数加1次后执行步骤3.2;
步骤3.4:获得全连接神经网络隐含层映射到全连接神经网络重构样本输出层的权重系数矩阵为矿物端元光谱的初始值。
5.根据权利要求4所述的一种基于变分自编码矿物信息定量分析方法,其特征在于:所述步骤四还包括:变分自编码神经网络输入层神经元个数为光谱的波段数,每个波段的反射率为变分自编码神经网络输入层的神经元;变分自编码神经网络特征层计算出每个样本的特征的均值和标准差,并进行重参数处理,变分自编码神经网络输出层为重构光谱。
6.根据权利要求5所述的一种基于变分自编码矿物信息定量分析方法,其特征在于;所述步骤4.1中,计算步骤一中每条训练样本光谱变分自编码神经网络特征层对应特征的均值的公式,如下式(5):
μi=Relu(w1v*xi+b1v)*w2v+b2v………………(5)
其中,μi为第i个训练样本光谱对应的特征的均值,Relu表示修正线性单元Rectifiedlinear Units,w1v为输入层映射到第一隐含层的权重系数矩阵,b1v为输入层映射到第一隐含层的偏置向量;w2v为第一隐含层到特征层均值的权重系数矩阵,b2v为第一隐含层映射到特征层均值的偏置向量;xi为第i个训练样本光谱。
7.根据权利要求6所述的一种基于变分自编码矿物信息定量分析方法,其特征在于:所述步骤4.2中,计算步骤一中每条训练样本光谱变分自编码神经网络特征层对应特征的标准差的公式,如下式(6):
σi=Relu(w1v*xi+b1v)*w3v+b3v………………(6)
其中,σi为第i个训练样本光谱对应的特征的标准差,Relu表示修正线性单元Rectifiedlinear Units,w1v为输入层映射到第一隐含层的权重系数矩阵,b1v为输入层映射到第一隐含层的偏置向量;w3v为第一隐含层到特征层标准差的权重系数矩阵,b2v为第一隐含层映射到特征层标准差的偏置向量;xi为第i个训练样本光谱。
8.根据权利要求7所述的一种基于变分自编码矿物信息定量分析方法,其特征在于:所述步骤4.3中,计算步骤一中每个训练样本光谱变分自编码神经网络特征层对应的特征值的公式如下式(7):
Zi=μi+ε*σi…………………………(7)
其中,Zi为第i个训练样本光谱对应的特征值,ε为服从标准正态分布的一个采样值。
9.根据权利要求8所述的一种基于变分自编码矿物信息定量分析方法,其特征在于:所述步骤4.4中,计算步骤一中每个训练样本光谱变分自编码神经网络输出层对应的重构样本光谱的公式如下式(8):
Figure FDA0002473692200000061
其中,
Figure FDA0002473692200000062
为第i个训练样本光谱对应的重构样本,sigmoid为输出层激活函数,w4v为变分自编码特征层映射到第二隐含层的权重系数矩阵,b4v为变分自编码特征层映射到第二隐含层的偏置向量;w5v为第二隐含层映射到重构样本输出层的权重系数矩阵,b5v第二隐含层映射到重构样本输出层的偏置向量。
10.根据权利要求9所述的一种基于变分自编码矿物信息定量分析方法,其特征在于:所述步骤4.5中,构建变分自编码神经网络的损失函数,如下式(9):
Figure FDA0002473692200000063
其中,L为全连接神经网络的损失函数,|| ||表示取模值操作,arccos表示的是反三角函数中的反余弦,log表示以自然对数为底的取对数操作,
Figure FDA0002473692200000071
为第i个训练样本光谱对应的重构样本;xi为第i个训练样本光谱。
CN202010356591.1A 2020-04-29 2020-04-29 一种基于变分自编码矿物信息定量分析方法 Active CN111564188B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010356591.1A CN111564188B (zh) 2020-04-29 2020-04-29 一种基于变分自编码矿物信息定量分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010356591.1A CN111564188B (zh) 2020-04-29 2020-04-29 一种基于变分自编码矿物信息定量分析方法

Publications (2)

Publication Number Publication Date
CN111564188A true CN111564188A (zh) 2020-08-21
CN111564188B CN111564188B (zh) 2023-09-12

Family

ID=72074494

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010356591.1A Active CN111564188B (zh) 2020-04-29 2020-04-29 一种基于变分自编码矿物信息定量分析方法

Country Status (1)

Country Link
CN (1) CN111564188B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112597826A (zh) * 2020-12-08 2021-04-02 核工业北京地质研究院 一种对高光谱sasi数据进行岩性分类的方法
CN113707331A (zh) * 2021-07-30 2021-11-26 电子科技大学 一种中医辨证数据生成方法与系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107609579A (zh) * 2017-08-25 2018-01-19 西安电子科技大学 基于稳健变分自编码器的雷达目标分类方法
CN109886388A (zh) * 2019-01-09 2019-06-14 平安科技(深圳)有限公司 一种基于变分自编码器的训练样本数据扩充方法和装置
CN110008948A (zh) * 2019-04-15 2019-07-12 西安电子科技大学 基于变分自编码网络的高光谱图像目标检测方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107609579A (zh) * 2017-08-25 2018-01-19 西安电子科技大学 基于稳健变分自编码器的雷达目标分类方法
CN109886388A (zh) * 2019-01-09 2019-06-14 平安科技(深圳)有限公司 一种基于变分自编码器的训练样本数据扩充方法和装置
CN110008948A (zh) * 2019-04-15 2019-07-12 西安电子科技大学 基于变分自编码网络的高光谱图像目标检测方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
XICHUAN ZHOU等: "Deep Learning With Grouped Features for Spatial Spectral Classification of Hyperspectral Images", IEEE *
徐朋磊;薛朝辉;车子杰;: "一种基于变分自编码器的高光谱图像分类方法", 现代测绘 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112597826A (zh) * 2020-12-08 2021-04-02 核工业北京地质研究院 一种对高光谱sasi数据进行岩性分类的方法
CN113707331A (zh) * 2021-07-30 2021-11-26 电子科技大学 一种中医辨证数据生成方法与系统
CN113707331B (zh) * 2021-07-30 2023-04-07 电子科技大学 一种中医辨证数据生成方法与系统

Also Published As

Publication number Publication date
CN111564188B (zh) 2023-09-12

Similar Documents

Publication Publication Date Title
Chang Hyperspectral data processing: algorithm design and analysis
Pawlowsky-Glahn et al. Compositional data and their analysis: an introduction
Casas et al. Linear and non-linear Modified Gravity forecasts with future surveys
Cheng Generalized binomial multiplicative cascade processes and asymmetrical multifractal distributions
Behrens et al. Multiscale contextual spatial modelling with the Gaussian scale space
CN108564606B (zh) 基于图像转换的异源图像块匹配方法
CN110008948B (zh) 基于变分自编码网络的高光谱图像目标检测方法
CN101866424A (zh) 基于独立分量分析的高光谱遥感图像混合像元分解方法
CN111564188B (zh) 一种基于变分自编码矿物信息定量分析方法
CN103413292B (zh) 基于约束最小二乘的高光谱图像非线性丰度估计方法
CN108734199A (zh) 基于分段深度特征及低秩表示的高光谱图像鲁棒分类方法
Ayhan et al. On the use of a linear spectral unmixing technique for concentration estimation of APXS spectrum
CN113392871A (zh) 一种基于散射机制多通道扩张卷积神经网络的极化sar地物分类方法
CN114863209B (zh) 类别比例引导的无监督领域适应建模方法、系统、设备及介质
CN114139819A (zh) 基于地统计加权随机森林的地球化学变量空间预测方法
CN107563420B (zh) 基于散射能量和堆栈自编码的极化sar图像分类方法
Kasraei et al. A framework for optimizing environmental covariates to support model interpretability in digital soil mapping
CN105354584B (zh) 基于波段不相似性的高光谱数据波段表征选择方法
Thannoun Mapping lithological and mineralogical units using hyperspectral imagery
CN100561145C (zh) 一种高光谱矿物填图方法
CN110956221A (zh) 基于深度递归网络下小样本极化合成孔径雷达图像分类方法
Song et al. Ensemble Alignment Subspace Adaptation Method for Cross-Scene Classification
CN112819813A (zh) 一种地下管线智能识别方法、装置及存储介质
Driba et al. Predicting wetland soil properties using machine learning, geophysics, and soil measurement data
Van Der Meer Geophysical inversion of imaging spectrometer data for geologic modelling

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant