CN111639067B - 多特征融合卷积自编码的多元地球化学异常识别方法 - Google Patents
多特征融合卷积自编码的多元地球化学异常识别方法 Download PDFInfo
- Publication number
- CN111639067B CN111639067B CN202010439756.1A CN202010439756A CN111639067B CN 111639067 B CN111639067 B CN 111639067B CN 202010439756 A CN202010439756 A CN 202010439756A CN 111639067 B CN111639067 B CN 111639067B
- Authority
- CN
- China
- Prior art keywords
- self
- encoder
- anomaly
- feature fusion
- geochemical
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/215—Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/90—Programming languages; Computing architectures; Database systems; Data warehousing
Abstract
本发明公开了多特征融合卷积自编码的多元地球化学异常识别方法,包括以下步骤:数据预处理;地球化学特征学习;模型耦合和微调;多元异常得分计算与成图。本发明构建了多特征融合卷积自编码,通过子自编码器A和子自编码器B分别提取地球化学空间分布和多元素相互作用特征,并通过栈式级联的方式实现了子编码器的耦合。充分融合了多元地球化学数据中的空间分布和多元素相互作用特征,避免了仅考虑单一特征所造成的特征损失和学习能力不足。对现有神经网络模型进行了扩展,大大提高了化探背景的学习性能和异常识别的准确性,为复杂地质条件提供了实用可靠的化探异常识别方法。
Description
技术领域
本发明涉及多元地球化探异常识别领域、人工智能应用领域,尤其涉及一种多特征融合卷积自编码的多元地球化学异常识别方法。
背景技术
多元地球化学异常的识别是矿产资源勘探的重要内容之一,其异常信息有助于地质学家进行潜在矿藏的判断。但如何基于区域化探数据进行高精度的化探异常识别和异常图绘制仍需要不断探索。箱线图、均值法、多元数据分析和分形/多重分析等传统方法,对于地球化学异常识别具有较好的效果。但因其依靠先验知识的人工特征提取使得难以在复杂地质和成矿环境下取得较高识别精度和效果。随着人工智能和机器学习的发展,神经网络对于复杂特征的良好学习能力使其在化探异常识别领域受到广泛关注。已有研究表明,深度自编码模型和多卷积自编码模型可以分别基于多元素成分关系和空间分布特征来进行地球化学背景的拟合和异常发现。然而,它们未能兼顾元素的空间分布结构和组成关系,其异常识别能力还有进一步提升空间,因此需要对现有自编码结构进行扩展以提高其多元化探背景学习和异常识别的能力。
发明内容
有鉴于此,本发明提供了一种多特征融合卷积自编码的多元地球化学异常识别方法。
多特征融合卷积自编码的多元地球化学异常识别方法,包括以下步骤:
步骤1:通过规则网格采样获取原始化探数据,每个采样网格获得多种元素浓度值,利用插值算法对原始化探数据进行插值补全;
步骤2:对步骤1处理后的化探数据进行对数变换和归一化,减少因闭合效应引起元素浓度之间的伪相关;
步骤3:将步骤2进行对数变化和归一化处理后的化探数据输入至空间特征提取自编码器A,训练得到多元地球化学元素的空间特征和子自编码器A;
步骤4:将多元地球化学元素的空间特征输入至元素关系特征提取自编码器B中进行模型训练,得到子自编码器B;
步骤5:将步骤3训练得到的子自编码器A和步骤4得到的子自编码器B采用栈式级联的方式耦合得到多特征融合卷积自编码,将步骤2中处理得到的化探数据作为多特征融合卷积自编码的输入,对多特征融合卷积自编码进行整体微调;
步骤6:计算多特征融合卷积自编码的输入数据和输出数据之间的欧式距离作为异常得分,并将异常得分映射到地理空间,生成多元化探异常图。
进一步地,步骤1中,将原始化探异常数据插值补全的算法为反距离加权插值算法。
进一步地,步骤3中对于空间特征提取的自编码器A为卷积自编码器,其编码器由卷积和最大池化层构成,解码器由反池化和反卷积构成;整个编码器结构对称,采用多个并行独立的编码来提取化探元素中的空间分布特征。
进一步地,步骤4中对于元素关系特征提取自编码器B,为全连接自编码模型的变体,将原有的全连接层改为窗口为1×1的卷积层,便于模型耦合与连贯。
进一步地,步骤3、步骤4和步骤5对于多特征融合卷积自编码采用了逐子编码器预训练和整体耦合微调的训练策略。
进一步地,步骤6中,异常得分计算公式如下:
di表示异常得分,xik表示样本i的第k个元素输入值,x′ik代表输出重建值,将异常得分di投影到相应的地理位置以生成异常地图。
本发明提供的技术方案带来的有益效果是:
(1)本发明基于多特征融合卷积自编码神经网络,提出了顾及元素空间结构特征和相互作用关系的化探异常识别模型;使得网络模型可以充分学习并挖掘多元地球化探的深层非线性特征,提高了地球化学背景拟合和化探异常识别的精度,避免了仅考虑单一特征从而对复杂环境下背景和异常识别效果不理想的问题,为复杂地质和成矿环境下利用多元化探数据进行异常识别和矿藏判别提供了高效的方法。
(2)本发明利用自编码神经网络进行对多元地球化学元素背景进行自监督学习,有效的解决了矿点和非矿点样本不均衡所导致的模型迁移效果差的问题;同时避免了现有基于监督学习方法化探异常识别“根据已知矿点找寻已知矿点”的问题,为真实矿产资源勘探提供了可行性高的方法。
附图说明
图1是本发明的方法流程图;
图2是本发明实施示例的闽西铁矿带5种化学元素数据分布图;
图3是本发明所提出的多特征融合卷积自编码模型的化探异常识别示意图;
图4是本发明所提出的多特征融合卷积自编码模型的结构图;
图5是本发明实施示例中的最终异常结果图;
图6是本发明的模型性能评价图。
具体实施方式
为了对本发明的技术特征、目的和效果有更加清楚的理解,现对照附图详细说明本发明的具体实施方式。
参考图1,本发明的多特征融合卷积自编码的多元地球化学异常识别方法包括以下步骤:
步骤1:采用反距离加权算法将规则格网所采集的化探异常数据中因采样困难导致的缺数数据补全;并根据研究区的地质和成矿环境,选择与铁(Fe)成矿相关的地球化学元素浓度数据,作为化探异常发现的指示数据,其中化学元素包括铜(Cu)、锌(Zn)、锰(Mn)、铅(pb)、三氧化二铁(Fe2o3);
步骤2:由于化探数据为地球元素成分数据,对步骤1选取的相关化探数据进行对数变换和归一化,以减小因闭合效应引起元素浓度之间的伪相关,最终处理结果如图2所示;
步骤3:将步骤2处理后的数据,依次输入到提取空间关系的卷积自编码器A中进行训练,当输入数据和输出重构数据之间的误差不再变化时停止训练,得到地球化学元素的空间分布特征以及子自编码器A的模型;
步骤4:如图3,将步骤3中学习得到的空间特征输入到提取元素关系特征的自编码器B中,进一步学习地球化学元素的相互关系,当输入数据和输出数据之间的误差不再变化时停止,得到子自编码器B的模型;
步骤5:如图4,将子自编码器A和子自编码器B进行栈式级联耦合,得到多特征融合卷积自编码模型;并将步骤2中处理得到的化探数据作为输入,对模型进行整体微调,最终重构得到此地区的多元地球化探背景值,步骤3、步骤4和步骤5对于多特征融合卷积自编码采用了逐子编码器预训练和整体耦合微调的训练策略,避免了因模型结构复杂导致的误差反向传播消失的问题,使得整体模型训练速度更快速,模型性能更好;
步骤6:计算每个化探样本原始数据和重构背景值之间的欧式距离作为异常得分,公式如下:
di表示异常得分,xik表示样本i的第k个元素输入值,x′ik代表输出重建值,将异常得分di投影到相应的地理位置以生成异常地图,如图5所示。
采用ROC曲线对已知矿点区域的异常地图进行评价;当ROC曲线下方面积与整图面积比AUC大于0.5时,证明模型可用,AUC越接近1模型性能越好。本研究中,AUC值为0.917,见图6,优于全局单一自编码模型AUC=0.863和多卷积自编码AUC=0.888。
上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,这些均属于本发明的保护范围之内。
Claims (3)
1.多特征融合卷积自编码的多元地球化学异常识别方法,其特征在于,包括以下步骤:
步骤1:通过规则网格采样获取原始化探数据,每个采样网格获得多种元素浓度值,利用插值算法对原始化探数据进行插值补全;
步骤2:对步骤1处理后的化探数据进行对数变换和归一化,减少因闭合效应引起元素浓度之间的伪相关;
步骤3:将步骤2进行对数变化和归一化处理后的化探数据输入至空间特征提取自编码器A,训练得到多元地球化学元素的空间特征和子自编码器A;具体的,步骤3中对于空间特征提取的自编码器A为卷积自编码器,其编码器由卷积和最大池化层构成,解码器由反池化和反卷积构成;整个编码器结构对称,采用多个并行独立的编码来提取化探元素中的空间分布特征;
步骤4:将多元地球化学元素的空间特征输入至元素关系特征提取自编码器B中进行模型训练,得到子自编码器B;步骤4中对于元素关系特征提取自编码器B,为全连接自编码模型的变体,将原有的全连接层改为窗口为1×1的卷积层,便于模型耦合与连贯;
步骤5:将步骤3训练得到的子自编码器A和步骤4得到的子自编码器B采用栈式级联的方式耦合得到多特征融合卷积自编码,将步骤2中处理得到的化探数据作为多特征融合卷积自编码的输入,对多特征融合卷积自编码进行整体微调;
步骤6:计算多特征融合卷积自编码的输入数据和输出数据之间的欧式距离作为异常得分,并将异常得分映射到地理空间,生成多元化探异常图;
具体的,步骤3、步骤4和步骤5对于多特征融合卷积自编码采用了逐子编码器预训练和整体耦合微调的训练策略。
2.根据权利要求1所述的多特征融合卷积自编码的多元地球化学异常识别方法,其特征在于,步骤1中,将原始化探异常数据插值补全的算法为反距离加权插值算法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010439756.1A CN111639067B (zh) | 2020-05-21 | 2020-05-21 | 多特征融合卷积自编码的多元地球化学异常识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010439756.1A CN111639067B (zh) | 2020-05-21 | 2020-05-21 | 多特征融合卷积自编码的多元地球化学异常识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111639067A CN111639067A (zh) | 2020-09-08 |
CN111639067B true CN111639067B (zh) | 2023-05-30 |
Family
ID=72333254
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010439756.1A Active CN111639067B (zh) | 2020-05-21 | 2020-05-21 | 多特征融合卷积自编码的多元地球化学异常识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111639067B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112446415B (zh) * | 2020-10-09 | 2024-04-30 | 山东中医药大学 | 一种用于图像特征提取的融减自动编码器的方法 |
CN112927767B (zh) * | 2021-02-22 | 2022-05-13 | 中国地质大学(武汉) | 基于图注意力自编码的多元地球化学异常识别方法 |
CN112990322A (zh) * | 2021-03-23 | 2021-06-18 | 中国地质调查局发展研究中心 | 一种确定地球化学异常识别临界值的方法、装置及设备 |
CN117517335B (zh) * | 2023-12-27 | 2024-03-29 | 国网辽宁省电力有限公司电力科学研究院 | 变电设备绝缘子污秽监测系统及方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107798340A (zh) * | 2017-09-29 | 2018-03-13 | 中国地质大学(武汉) | 基于空间约束多自编码器的多元地球化学异常识别方法 |
CN108710777A (zh) * | 2018-05-21 | 2018-10-26 | 中国地质大学(武汉) | 基于多卷积自编码神经网络的多元化探异常识别方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160125628A1 (en) * | 2014-11-05 | 2016-05-05 | Geologis Ltd. | Geographical information systems |
US10257211B2 (en) * | 2016-05-20 | 2019-04-09 | Informatica Llc | Method, apparatus, and computer-readable medium for detecting anomalous user behavior |
US11205103B2 (en) * | 2016-12-09 | 2021-12-21 | The Research Foundation for the State University | Semisupervised autoencoder for sentiment analysis |
-
2020
- 2020-05-21 CN CN202010439756.1A patent/CN111639067B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107798340A (zh) * | 2017-09-29 | 2018-03-13 | 中国地质大学(武汉) | 基于空间约束多自编码器的多元地球化学异常识别方法 |
CN108710777A (zh) * | 2018-05-21 | 2018-10-26 | 中国地质大学(武汉) | 基于多卷积自编码神经网络的多元化探异常识别方法 |
Non-Patent Citations (1)
Title |
---|
陈丽蓉."顾及空间约束的多元地球化学异常识别自编码神经网络方法研究".《中国博士学位论文全文数据库基础科学辑》.2020,A011-257. * |
Also Published As
Publication number | Publication date |
---|---|
CN111639067A (zh) | 2020-09-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111639067B (zh) | 多特征融合卷积自编码的多元地球化学异常识别方法 | |
Parsa | A data augmentation approach to XGboost-based mineral potential mapping: an example of carbonate-hosted ZnPb mineral systems of Western Iran | |
Moeini et al. | Comparing compositional multivariate outliers with autoencoder networks in anomaly detection at Hamich exploration area, east of Iran | |
CN108710777B (zh) | 基于多卷积自编码神经网络的多元化探异常识别方法 | |
CN111080021B (zh) | 一种基于地质信息库的砂体构型cmm神经网络预测方法 | |
Liu et al. | Maximum entropy modeling for orogenic gold prospectivity mapping in the Tangbale-Hatu belt, western Junggar, China | |
CN104537375A (zh) | 一种基于卫星遥感数据的褐铁矿化信息提取方法 | |
Kord et al. | Spatial analysis of Ardabil plain aquifer potable groundwater using fuzzy logic | |
CN113312993B (zh) | 一种基于PSPNet的遥感数据土地覆盖分类方法 | |
Yang et al. | Quantification of uncertainty associated with evidence layers in mineral prospectivity mapping using direct sampling and convolutional neural network | |
Chudasama et al. | Target-scale prospectivity modeling for gold mineralization within the rajapalot Au-Co project area in northern Fennoscandian Shield, Finland. Part 1: application of knowledge-driven-and machine learning-based-hybrid-expert systems for exploration targeting and addressing model-based uncertainties | |
Liu et al. | Developments in quantitative assessment and modeling of mineral resource potential: an overview | |
CN114997501A (zh) | 基于样本失衡的深度学习矿产资源分类预测方法及系统 | |
Chen et al. | Global oceanic eddy identification: A deep learning method from argo profiles and altimetry data | |
Aryafar et al. | Application of continuous restricted Boltzmann machine to detect multivariate anomalies from stream sediment geochemical data, Korit, East of Iran | |
CN112927767B (zh) | 基于图注意力自编码的多元地球化学异常识别方法 | |
ZHANG et al. | Bedrock mapping based on terrain weighted directed graph convolutional network using stream sediment geochemical samplings | |
CN116611697A (zh) | 一种基于机器学习的多源异构信息圈定找矿靶区的方法 | |
Williams et al. | A predictive geospatial exploration model for Mississippi valley type Pb–Zn mineralization in the southeast Missouri lead district | |
CN115293024A (zh) | 整合多源协同变量的场地土壤污染物浓度三维空间插值方法 | |
Ribeiro et al. | Geochemical multifractal modeling of soil and stream sediment data applied to gold prospectivity mapping of the Pitangui Greenstone Belt, northwest of Quadrilátero Ferrífero, Brazil | |
Chung et al. | Mineral potential evaluation based on airborne geophysical data | |
Han et al. | Automatic Classification Method of Quaternary Lithology in Vegetation Cover Area Combining Spectral, Textural, Topographic, Geothermal, and Vegetation | |
Chudasama et al. | Target-scale prospectivity modeling for gold mineralization within the Rajapalot Au-Co project area in northern Fennoscandian Shield, Finland. Part 2: Application of self-organizing maps and artificial neural networks for exploration targeting | |
Koike et al. | New indices for characterizing spatial models of ore deposits by the use of a sensitivity vector and an influence factor |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |