CN111639067A - 多特征融合卷积自编码的多元地球化学异常识别方法 - Google Patents
多特征融合卷积自编码的多元地球化学异常识别方法 Download PDFInfo
- Publication number
- CN111639067A CN111639067A CN202010439756.1A CN202010439756A CN111639067A CN 111639067 A CN111639067 A CN 111639067A CN 202010439756 A CN202010439756 A CN 202010439756A CN 111639067 A CN111639067 A CN 111639067A
- Authority
- CN
- China
- Prior art keywords
- self
- encoder
- feature fusion
- geochemical
- coding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/215—Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/90—Programming languages; Computing architectures; Database systems; Data warehousing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computing Systems (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Software Systems (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Biophysics (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Quality & Reliability (AREA)
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Crystallography & Structural Chemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Geophysics And Detection Of Objects (AREA)
Abstract
本发明公开了多特征融合卷积自编码的多元地球化学异常识别方法,包括以下步骤:数据预处理;地球化学特征学习;模型耦合和微调;多元异常得分计算与成图。本发明构建了多特征融合卷积自编码,通过子自编码器A和子自编码器B分别提取地球化学空间分布和多元素相互作用特征,并通过栈式级联的方式实现了子编码器的耦合。充分融合了多元地球化学数据中的空间分布和多元素相互作用特征,避免了仅考虑单一特征所造成的特征损失和学习能力不足。对现有神经网络模型进行了扩展,大大提高了化探背景的学习性能和异常识别的准确性,为复杂地质条件提供了实用可靠的化探异常识别方法。
Description
技术领域
本发明涉及多元地球化探异常识别领域、人工智能应用领域,尤其涉及一种多特征融合卷积自编码的多元地球化学异常识别方法。
背景技术
多元地球化学异常的识别是矿产资源勘探的重要内容之一,其异常信息有助于地质学家进行潜在矿藏的判断。但如何基于区域化探数据进行高精度的化探异常识别和异常图绘制仍需要不断探索。箱线图、均值法、多元数据分析和分形/多重分析等传统方法,对于地球化学异常识别具有较好的效果。但因其依靠先验知识的人工特征提取使得难以在复杂地质和成矿环境下取得较高识别精度和效果。随着人工智能和机器学习的发展,神经网络对于复杂特征的良好学习能力使其在化探异常识别领域受到广泛关注。已有研究表明,深度自编码模型和多卷积自编码模型可以分别基于多元素成分关系和空间分布特征来进行地球化学背景的拟合和异常发现。然而,它们未能兼顾元素的空间分布结构和组成关系,其异常识别能力还有进一步提升空间,因此需要对现有自编码结构进行扩展以提高其多元化探背景学习和异常识别的能力。
发明内容
有鉴于此,本发明提供了一种多特征融合卷积自编码的多元地球化学异常识别方法。
多特征融合卷积自编码的多元地球化学异常识别方法,包括以下步骤:
步骤1:通过规则网格采样获取原始化探数据,每个采样网格获得多种元素浓度值,利用插值算法对原始化探数据进行插值补全;
步骤2:对步骤1处理后的化探数据进行对数变换和归一化,减少因闭合效应引起元素浓度之间的伪相关;
步骤3:将步骤2进行对数变化和归一化处理后的化探数据输入至空间特征提取自编码器A,训练得到多元地球化学元素的空间特征和子自编码器A;
步骤4:将多元地球化学元素的空间特征输入至元素关系特征提取自编码器B中进行模型训练,得到子自编码器B;
步骤5:将步骤3训练得到的子自编码器A和步骤4得到的子自编码器B采用栈式级联的方式耦合得到多特征融合卷积自编码,将步骤2中处理得到的化探数据作为多特征融合卷积自编码的输入,对多特征融合卷积自编码进行整体微调;
步骤6:计算多特征融合卷积自编码的输入数据和输出数据之间的欧式距离作为异常得分,并将异常得分映射到地理空间,生成多元化探异常图。
进一步地,步骤1中,将原始化探异常数据插值补全的算法为反距离加权插值算法。
进一步地,步骤3中对于空间特征提取的自编码器A为卷积自编码器,其编码器由卷积和最大池化层构成,解码器由反池化和反卷积构成;整个编码器结构对称,采用多个并行独立的编码来提取化探元素中的空间分布特征。
进一步地,步骤4中对于元素关系特征提取自编码器B,为全连接自编码模型的变体,将原有的全连接层改为窗口为1×1的卷积层,便于模型耦合与连贯。
进一步地,步骤3、步骤4和步骤5对于多特征融合卷积自编码采用了逐子编码器预训练和整体耦合微调的训练策略。
进一步地,步骤6中,异常得分计算公式如下:
di表示异常得分,xik表示样本i的第k个元素输入值,x′ik代表输出重建值,将异常得分di投影到相应的地理位置以生成异常地图。
本发明提供的技术方案带来的有益效果是:
(1)本发明基于多特征融合卷积自编码神经网络,提出了顾及元素空间结构特征和相互作用关系的化探异常识别模型;使得网络模型可以充分学习并挖掘多元地球化探的深层非线性特征,提高了地球化学背景拟合和化探异常识别的精度,避免了仅考虑单一特征从而对复杂环境下背景和异常识别效果不理想的问题,为复杂地质和成矿环境下利用多元化探数据进行异常识别和矿藏判别提供了高效的方法。
(2)本发明利用自编码神经网络进行对多元地球化学元素背景进行自监督学习,有效的解决了矿点和非矿点样本不均衡所导致的模型迁移效果差的问题;同时避免了现有基于监督学习方法化探异常识别“根据已知矿点找寻已知矿点”的问题,为真实矿产资源勘探提供了可行性高的方法。
附图说明
图1是本发明的方法流程图;
图2是本发明实施示例的闽西铁矿带5种化学元素数据分布图;
图3是本发明所提出的多特征融合卷积自编码模型的化探异常识别示意图;
图4是本发明所提出的多特征融合卷积自编码模型的结构图;
图5是本发明实施示例中的最终异常结果图;
图6是本发明的模型性能评价图。
具体实施方式
为了对本发明的技术特征、目的和效果有更加清楚的理解,现对照附图详细说明本发明的具体实施方式。
参考图1,本发明的多特征融合卷积自编码的多元地球化学异常识别方法包括以下步骤:
步骤1:采用反距离加权算法将规则格网所采集的化探异常数据中因采样困难导致的缺数数据补全;并根据研究区的地质和成矿环境,选择与铁(Fe)成矿相关的地球化学元素浓度数据,作为化探异常发现的指示数据,其中化学元素包括铜(Cu)、锌(Zn)、锰(Mn)、铅(pb)、三氧化二铁(Fe2o3);
步骤2:由于化探数据为地球元素成分数据,对步骤1选取的相关化探数据进行对数变换和归一化,以减小因闭合效应引起元素浓度之间的伪相关,最终处理结果如图2所示;
步骤3:将步骤2处理后的数据,依次输入到提取空间关系的卷积自编码器A中进行训练,当输入数据和输出重构数据之间的误差不再变化时停止训练,得到地球化学元素的空间分布特征以及子自编码器A的模型;
步骤4:如图3,将步骤3中学习得到的空间特征输入到提取元素关系特征的自编码器B中,进一步学习地球化学元素的相互关系,当输入数据和输出数据之间的误差不再变化时停止,得到子自编码器B的模型;
步骤5:如图4,将子自编码器A和子自编码器B进行栈式级联耦合,得到多特征融合卷积自编码模型;并将步骤2中处理得到的化探数据作为输入,对模型进行整体微调,最终重构得到此地区的多元地球化探背景值,步骤3、步骤4和步骤5对于多特征融合卷积自编码采用了逐子编码器预训练和整体耦合微调的训练策略,避免了因模型结构复杂导致的误差反向传播消失的问题,使得整体模型训练速度更快速,模型性能更好;
步骤6:计算每个化探样本原始数据和重构背景值之间的欧式距离作为异常得分,公式如下:
di表示异常得分,xik表示样本i的第k个元素输入值,x′ik代表输出重建值,将异常得分di投影到相应的地理位置以生成异常地图,如图5所示。
采用ROC曲线对已知矿点区域的异常地图进行评价;当ROC曲线下方面积与整图面积比AUC大于0.5时,证明模型可用,AUC越接近1模型性能越好。本研究中,AUC值为0.917,见图6,优于全局单一自编码模型AUC=0.863和多卷积自编码AUC=0.888。
上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,这些均属于本发明的保护范围之内。
Claims (6)
1.多特征融合卷积自编码的多元地球化学异常识别方法,其特征在于,包括以下步骤:
步骤1:通过规则网格采样获取原始化探数据,每个采样网格获得多种元素浓度值,利用插值算法对原始化探数据进行插值补全;
步骤2:对步骤1处理后的化探数据进行对数变换和归一化,减少因闭合效应引起元素浓度之间的伪相关;
步骤3:将步骤2进行对数变化和归一化处理后的化探数据输入至空间特征提取自编码器A,训练得到多元地球化学元素的空间特征和子自编码器A;
步骤4:将多元地球化学元素的空间特征输入至元素关系特征提取自编码器B中进行模型训练,得到子自编码器B;
步骤5:将步骤3训练得到的子自编码器A和步骤4得到的子自编码器B采用栈式级联的方式耦合得到多特征融合卷积自编码,将步骤2中处理得到的化探数据作为多特征融合卷积自编码的输入,对多特征融合卷积自编码进行整体微调;
步骤6:计算多特征融合卷积自编码的输入数据和输出数据之间的欧式距离作为异常得分,并将异常得分映射到地理空间,生成多元化探异常图。
2.根据权利要求1所述的多特征融合卷积自编码的多元地球化学异常识别方法,其特征在于,步骤1中,将原始化探异常数据插值补全的算法为反距离加权插值算法。
3.根据权利要求1所述的多特征融合卷积自编码的多元地球化学异常识别方法,其特征在于,步骤3中对于空间特征提取的自编码器A为卷积自编码器,其编码器由卷积和最大池化层构成,解码器由反池化和反卷积构成;整个编码器结构对称,采用多个并行独立的编码来提取化探元素中的空间分布特征。
4.根据权利要求1所述的多特征融合卷积自编码的多元地球化学异常识别方法,其特征在于,步骤4中对于元素关系特征提取自编码器B,为全连接自编码模型的变体,将原有的全连接层改为窗口为1×1的卷积层,便于模型耦合与连贯。
5.根据权利要求1所述的多特征融合卷积自编码的多元地球化学异常识别方法,其特征在于,步骤3、步骤4和步骤5对于多特征融合卷积自编码采用了逐子编码器预训练和整体耦合微调的训练策略。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010439756.1A CN111639067B (zh) | 2020-05-21 | 2020-05-21 | 多特征融合卷积自编码的多元地球化学异常识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010439756.1A CN111639067B (zh) | 2020-05-21 | 2020-05-21 | 多特征融合卷积自编码的多元地球化学异常识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111639067A true CN111639067A (zh) | 2020-09-08 |
CN111639067B CN111639067B (zh) | 2023-05-30 |
Family
ID=72333254
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010439756.1A Active CN111639067B (zh) | 2020-05-21 | 2020-05-21 | 多特征融合卷积自编码的多元地球化学异常识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111639067B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112446415A (zh) * | 2020-10-09 | 2021-03-05 | 山东中医药大学 | 一种用于图像特征提取的融减自动编码器算法 |
CN112927767A (zh) * | 2021-02-22 | 2021-06-08 | 中国地质大学(武汉) | 基于图注意力自编码的多元地球化学异常识别方法 |
CN112990322A (zh) * | 2021-03-23 | 2021-06-18 | 中国地质调查局发展研究中心 | 一种确定地球化学异常识别临界值的方法、装置及设备 |
CN117517335A (zh) * | 2023-12-27 | 2024-02-06 | 国网辽宁省电力有限公司电力科学研究院 | 变电设备绝缘子污秽监测系统及方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160125628A1 (en) * | 2014-11-05 | 2016-05-05 | Geologis Ltd. | Geographical information systems |
US20170339168A1 (en) * | 2016-05-20 | 2017-11-23 | Informatica Llc | Method, apparatus, and computer-readable medium for detecting anomalous user behavior |
CN107798340A (zh) * | 2017-09-29 | 2018-03-13 | 中国地质大学(武汉) | 基于空间约束多自编码器的多元地球化学异常识别方法 |
US20180165554A1 (en) * | 2016-12-09 | 2018-06-14 | The Research Foundation For The State University Of New York | Semisupervised autoencoder for sentiment analysis |
CN108710777A (zh) * | 2018-05-21 | 2018-10-26 | 中国地质大学(武汉) | 基于多卷积自编码神经网络的多元化探异常识别方法 |
-
2020
- 2020-05-21 CN CN202010439756.1A patent/CN111639067B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160125628A1 (en) * | 2014-11-05 | 2016-05-05 | Geologis Ltd. | Geographical information systems |
US20170339168A1 (en) * | 2016-05-20 | 2017-11-23 | Informatica Llc | Method, apparatus, and computer-readable medium for detecting anomalous user behavior |
US20180165554A1 (en) * | 2016-12-09 | 2018-06-14 | The Research Foundation For The State University Of New York | Semisupervised autoencoder for sentiment analysis |
CN107798340A (zh) * | 2017-09-29 | 2018-03-13 | 中国地质大学(武汉) | 基于空间约束多自编码器的多元地球化学异常识别方法 |
CN108710777A (zh) * | 2018-05-21 | 2018-10-26 | 中国地质大学(武汉) | 基于多卷积自编码神经网络的多元化探异常识别方法 |
Non-Patent Citations (1)
Title |
---|
陈丽蓉: ""顾及空间约束的多元地球化学异常识别自编码神经网络方法研究"" * |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112446415A (zh) * | 2020-10-09 | 2021-03-05 | 山东中医药大学 | 一种用于图像特征提取的融减自动编码器算法 |
CN112446415B (zh) * | 2020-10-09 | 2024-04-30 | 山东中医药大学 | 一种用于图像特征提取的融减自动编码器的方法 |
CN112927767A (zh) * | 2021-02-22 | 2021-06-08 | 中国地质大学(武汉) | 基于图注意力自编码的多元地球化学异常识别方法 |
CN112927767B (zh) * | 2021-02-22 | 2022-05-13 | 中国地质大学(武汉) | 基于图注意力自编码的多元地球化学异常识别方法 |
CN112990322A (zh) * | 2021-03-23 | 2021-06-18 | 中国地质调查局发展研究中心 | 一种确定地球化学异常识别临界值的方法、装置及设备 |
CN117517335A (zh) * | 2023-12-27 | 2024-02-06 | 国网辽宁省电力有限公司电力科学研究院 | 变电设备绝缘子污秽监测系统及方法 |
CN117517335B (zh) * | 2023-12-27 | 2024-03-29 | 国网辽宁省电力有限公司电力科学研究院 | 变电设备绝缘子污秽监测系统及方法 |
Also Published As
Publication number | Publication date |
---|---|
CN111639067B (zh) | 2023-05-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Parsa | A data augmentation approach to XGboost-based mineral potential mapping: an example of carbonate-hosted ZnPb mineral systems of Western Iran | |
CN111639067B (zh) | 多特征融合卷积自编码的多元地球化学异常识别方法 | |
US20170058666A1 (en) | Systems and Methods Employing Cooperative Optimization-Based Dimensionality Reduction | |
EP2310880B1 (en) | Systems and methods employing cooperative optimization-based dimensionality reduction | |
CN108710777B (zh) | 基于多卷积自编码神经网络的多元化探异常识别方法 | |
CN114994759B (zh) | 基于gan网络的碳封存箱智能识别方法和系统 | |
CN111080021B (zh) | 一种基于地质信息库的砂体构型cmm神经网络预测方法 | |
CN104537375A (zh) | 一种基于卫星遥感数据的褐铁矿化信息提取方法 | |
CN112731522B (zh) | 地震地层智能识别方法、装置、设备及存储介质 | |
CN116665067B (zh) | 基于图神经网络的找矿靶区优选系统及其方法 | |
Nikitin et al. | Hybrid and automated machine learning approaches for oil fields development: The case study of Volve field, North Sea | |
CN114997501A (zh) | 基于样本失衡的深度学习矿产资源分类预测方法及系统 | |
Juliani et al. | Deep learning of terrain morphology and pattern discovery via network-based representational similarity analysis for deep-sea mineral exploration | |
CN116168224A (zh) | 基于成像砾石含量的机器学习岩相自动识别方法 | |
Martins et al. | Cu–Au exploration target generation in the eastern Carajás Mineral Province using random forest and multi-class index overlay mapping | |
Friedel et al. | Hybrid modeling of spatial continuity for application to numerical inverse problems | |
CN112927767B (zh) | 基于图注意力自编码的多元地球化学异常识别方法 | |
CN115690772A (zh) | 基于深度学习的重力断层自动识别方法 | |
CN115880505B (zh) | 一种目标边缘检测神经网络的低序级断层智能识别方法 | |
Costanzo-Alvarez et al. | Combining a geoelectrical survey with integrated groundwater quality data to map the spatial distribution and temporal variations of a leachate plume in a closed landfill (Southern Ontario, Canada) | |
ZHANG et al. | Bedrock mapping based on terrain weighted directed graph convolutional network using stream sediment geochemical samplings | |
CN115964667A (zh) | 基于深度学习和重采样的河流-湖泊岩相测井识别方法 | |
CN113688901A (zh) | 一种基于膨胀卷积神经网络的储层不连续界线识别方法 | |
Chung et al. | Mineral potential evaluation based on airborne geophysical data | |
Liu et al. | Identifying geochemical anomalies using a new method of Yang Chizhong-spatial scan statistic |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |