CN116307123B - 一种基于知识图谱驱动的矿产资源预测方法、存储介质 - Google Patents

一种基于知识图谱驱动的矿产资源预测方法、存储介质 Download PDF

Info

Publication number
CN116307123B
CN116307123B CN202310157590.8A CN202310157590A CN116307123B CN 116307123 B CN116307123 B CN 116307123B CN 202310157590 A CN202310157590 A CN 202310157590A CN 116307123 B CN116307123 B CN 116307123B
Authority
CN
China
Prior art keywords
ore
prediction
forming
knowledge graph
formation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310157590.8A
Other languages
English (en)
Other versions
CN116307123A (zh
Inventor
王成彬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China University of Geosciences
Original Assignee
China University of Geosciences
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China University of Geosciences filed Critical China University of Geosciences
Priority to CN202310157590.8A priority Critical patent/CN116307123B/zh
Publication of CN116307123A publication Critical patent/CN116307123A/zh
Application granted granted Critical
Publication of CN116307123B publication Critical patent/CN116307123B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/02Agriculture; Fishing; Forestry; Mining
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Development Economics (AREA)
  • Tourism & Hospitality (AREA)
  • Data Mining & Analysis (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Educational Administration (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Game Theory and Decision Science (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Animal Behavior & Ethology (AREA)
  • Mining & Mineral Resources (AREA)
  • Marine Sciences & Fisheries (AREA)
  • Databases & Information Systems (AREA)
  • Animal Husbandry (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Agronomy & Crop Science (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及一种基于知识图谱驱动的矿产资源预测方法、存储介质,包括以下步骤:以成矿系统和地质异常成矿预测理论为指导,构建面向矿产资源定量预测的本体模型,在所述本体模型的指导下,构建面向资源定量预测的完整的领域知识图谱;利用聚类归纳和逻辑推理方法对所述领域知识图谱中的领域知识进挖掘,构建基于完整的领域知识图谱的成矿预测模型;利用基于知识图谱的成矿预测模型中包含的成矿预测数据需求驱动从成矿预测空间数据库中提取并构建成矿预测变量数据集;利用基于知识图谱的成矿模型中包含的成矿预测方法驱动机器学习算法从成矿预测变量数据集中筛选成矿预测指示变量,并对成矿预测指示变量进行集成,获取成矿预测结果。

Description

一种基于知识图谱驱动的矿产资源预测方法、存储介质
技术领域
本发明涉及矿产资源预测领域,具体指有一种基于知识图谱驱动的矿产资源预测方法、存储介质。
背景技术
矿物资源,又名矿产资源,是指经过地质成矿作用而形成的,天然赋存于地壳内部或地表埋藏于地下或出露于地表,呈固态、液态或气态的,并具有开发利用价值的矿物或有用元素的集合体。
资源定量预测工作经过了矿床统计预测阶段、基于求异理论的资源定量预测阶段和数字找矿与资源定量预测阶段,发展出了三联式、三步式、综合信息、非线性、基于数据科学的资源定量预测等一系列成矿预测理论。现有的资源定量预测研究侧重于找矿信息提取与融合的数学模型,即依托于地质、地球物理、地球化学和遥感等GIS空间数据及其结构化的衍生变量,利用数学模型预测矿产成矿潜力。目前资源定量预测数字找矿模型的构建主要依靠专业地质找矿人员人为地定义找矿预测变量,进而构建找矿预测模型;对于地质大数据中隐含深层次找矿信息和矿床模型缺乏有效的利用,阻碍了资源定量预测过程中的智能化和自动化发展。
针对上述的现有技术存在的问题设计一种基于知识图谱驱动的矿产资源预测方法、存储介质是本发明研究的目的。
发明内容
针对上述现有技术存在的问题,本发明在于提供一种基于知识图谱驱动的矿产资源预测方法、存储介质,能够有效解决上述现有技术存在的问题。
本发明的技术方案是:
一种基于知识图谱驱动的矿产资源预测方法,包括以下步骤:
以成矿系统和地质异常成矿预测理论为指导,采用用例驱动的方法构建面向矿产资源定量预测的本体模型,在所述本体模型的指导下,利用结构性关系数据映射和基于深度学习的非结构性地质文本实体及语义关系识别的方法构建面向资源定量预测的领域知识图谱;
利用聚类归纳和逻辑推理方法对所述领域知识图谱中的领域知识进挖掘,得到与矿床成矿预测相关的控矿要素、找矿标志、地质异常变量、找矿评价方法、数据基础等相关信息,构建基于知识图谱的成矿预测模型;
利用基于知识图谱的成矿预测模型中包含的成矿预测数据需求驱动从成矿预测空间数据库中提取并构建成矿预测变量数据集,在构建成矿预测变量数据集的过程中加强深层次找矿异常描述信息的空间变量化表达;
利用基于知识图谱的成矿模型中包含的成矿预测方法驱动机器学习算法从成矿预测变量数据集中筛选成矿预测指示变量,并对成矿预测指示变量进行集成,获取成矿预测结果。
进一步地,所述以成矿系统和地质异常理论为指导,采用用例驱动的方法构建面向矿产资源定量预测的本体模型包括:
确定面向矿产资源定量预测本体模型的领域边界;
利用自上而下和自下而上的方法,以用例为驱动构建所述本体模型。
进一步地,在所述本体模型的指导下,利用结构性关系数据映射和基于深度学习的非结构性地质文本实体及语义关系识别的方法构建面向资源定量预测的领域知识图谱包括:
以所述本体模型为指导,利用D2RQ平台将关系数据库中的关系数据映射成RDF三元组数据;
利用自然语言处理、深度学习、字典匹配、半监督学习其中的一种或多种方法,对与矿床相关的非结构的文本报告进行实体及语义关系的抽取;
将所述实体及语义关系融合,构建面向矿产资源定量预测的领域知识图谱。
进一步地,所述利用聚类归纳和逻辑推理方法对所述领域知识图谱中的领域知识进挖掘包括:
基于构建的面向资源定量预测的领域知识图谱,利用聚类算法对知识图谱中的数据知识进行聚类分析;
根据所述领域知识图谱聚类的结果,归纳总结该矿种包含的主要的成矿预测类型(P1,P2…Pn),并总结其核心、共性的成矿控制要素、预测要素,建立成矿预测指标体系。
进一步地,所述构建基于知识图谱的成矿预测模型包括:
将基于勘查区数据所构建的知识图谱与面向资源定量预测的知识图谱和所述的知识图谱聚类产生的成矿预测类型进行相似性计算和关联分析,根据相似性计算的结果,推荐相应的成矿预测指标体系,构建基于知识图谱的成矿预测模型。
进一步地,所述利用基于知识图谱的成矿预测模型中包含的成矿预测数据需求驱动从成矿预测空间数据库中提取并构建成矿预测变量数据集,在构建成矿预测变量数据集的过程中加强深层次找矿异常描述信息的空间变量化表达包括:
获取勘查区的成矿预测数据库,将所述成矿预测数据库中的数据类型分为地质、地球物理、地球化学和遥感四类数据类型,根据数据类型构建成矿预测变量数据集;
将所述成矿预测模型中涉及到的数据类型为地质的数据,进行空间变量的表达;
将所述成矿预测模型中涉及到的数据类型为地球物理的数据,根据基于所述领域知识图谱的所述成矿预测模型所揭示的有利的地球物理勘查方法和数据处理方法,构建相应的地球物理变量;
将所述成矿预测模型中涉及到的数据类型为地球化学的数据,基于所述领域知识图谱的成矿预测模型所揭示的指示地球化学元素和元素组合,构建地球化学元素变量和综合变量;
将所述成矿预测模型中涉及到的数据类型为遥感的数据,基于知识图谱的成矿预测模型所揭示的遥感找矿标志,从遥感数据中解译线环构建和蚀变信息。
进一步地,所述进行空间变量的表达包括:
根据地质图信息,针对断层信息,构建断层缓冲区、断层优益度、断层交点数、断层方位等空间变量;和/或
针对地层信息,构建地层组合熵、地层种类数等空间变量;和/或
针对岩体信息,构建岩体内、外缓冲区等空间变量;和/或
对于所述领域知识图谱揭示的深层次的成矿预测信息,在地质要素编辑的基础上进行相应的构建。
进一步地,所述利用基于知识图谱的成矿模型中包含的成矿预测方法驱动机器学习算法从成矿预测变量数据集中筛选成矿预测指示变量包括:
基于所述成矿预测变量数据集,根据已知的矿床(点)和所述领域知识图谱中揭示的成矿控制要素,利用GIS空间分析的方法,随机构建包含已知矿床点的正负训练样本,构建训练数据集;
利用非监督学习稀疏主成分方法和监督学习代递归消除的方法分别对成矿预测变量数据集中的变量重要性进行排序,选择对成矿预测具有指示作用的成矿预测指示变量。
进一步地,所述对成矿预测指示变量进行集成,获取成矿预测结果包括:
利用基于知识图谱的成矿预测模型所推荐的信息集成方法,基于所述成矿预测指标变量和训练数据集,训练成矿预测信息集成模型;
根据训练的成矿预测信息集成模型,基于所述成矿预测指标计算研究区的成矿概率,获得成矿预测结果,用于衡量矿产成矿潜力的大小;
利用GIS空间分析,获得训练样本所在空间位置的成矿概率,分别计算其ROC曲线和AUC值,根据ROC曲线和AUC值筛选出最优的成矿预测结果,利用约登指数确定成矿概率分隔阈值,进而将大于阈值的区域划定成矿远景区。
进一步提供一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时实现所述的一种基于知识图谱驱动的矿产资源预测方法。
因此,本发明提供以下的效果和/或优点:
本申请通过构建面向资源定量预测的领域知识图谱、基于知识图谱的成矿预测模型,再根据成矿预测数据需求驱动从成矿预测空间数据库中提取并构建成矿预测变量数据集,从而能够获得成矿预测结果。本申请为资源定量预测找矿模型的构建提供了基于知识图谱的构建新方法。以及,本申请可以从海量地质大数据中筛选出特定地质属性来优化地质预测。
本申请利用知识图谱的推理、知识关联和聚类方法挖掘与矿床有关的深层次成矿预测信息,构建基于知识图谱的找矿预测模型,为资源定量预测找矿模型的构建提供了新的思路。
本申请基于矿床领域的知识图谱所蕴含的专家知识驱动机器学习和深度学习算法进行成矿预测变量的自动筛选和集成,从而实现资源定量预测和评价的自动化,为资源定量预测和评价的智能化和自动化发展提供了新的技术方法体系。
本申请根据成矿预测数据库中的数据类型进行不同的变量表达、变量映射,能够在构建成矿预测变量数据集的过程中加强深层次找矿异常描述信息的空间变量化表达。
应当明白,本发明的上文的概述和下面的详细说明是示例性和解释性的,并且意在提供对如要求保护的本发明的进一步的解释。
附图说明
图1为本发明实施例提供的方法的流程示意图。
图2为本发明实施例提供的方法的逻辑示意图。
图3为本发明实施例提供的本体模型的示意图。
图4为不同数据集成结果获得的找矿前景预测ROC曲线及AUC值。
具体实施方式
为了便于本领域技术人员理解,现将实施例对本发明作进一步详细描述:应了解到,在本实施例中所提及的步骤,除特别说明其顺序的,均可依实际需要调整其前后顺序,甚至可同时或部分同时执行。
参考图1-2,一种基于知识图谱驱动的矿产资源预测方法,包括以下步骤:
S1,以成矿系统和地质异常成矿预测理论为指导,采用用例驱动的方法构建面向矿产资源定量预测的本体模型,在所述本体模型的指导下,利用结构性关系数据映射和基于深度学习的非结构性地质文本实体及语义关系识别的方法构建面向资源定量预测的领域知识图谱;
本步骤中,在深入理解矿床的基础上,以成矿系列、地质异常、非线性地球科学其中的一种或多种地质资源理论为指导。采用用例驱动的方法构建面向矿产资源定量预测的本体模型。在领域本体模型的指导下,综合利用结构性关系数据映射和基于深度学习的非结构性地质文本实体及语义关系识别的方法构建面向资源定量预测的领域知识图谱。本实施例中,用例驱动的方法为现有技术,具体地,用例驱动整个过程的每个阶段环环相扣,形成一个迭代周期。
本步骤中,生成的是一个完整的领域知识图谱。本实施例中,矿床的领域知识图谱中以三元组的形式组织与矿床相关的多学科的知识,三元组可以例如“矿床-位于-省份”组成。
S2,利用聚类归纳和逻辑推理方法对所述领域知识图谱中的领域知识进挖掘,得到与矿床成矿预测相关的控矿要素、找矿标志、地质异常变量、找矿评价方法、数据基础等相关信息;
本实施例在步骤S1获得的完整的领域知识图谱研究利用知识推理、聚类和归纳算法,挖掘与矿床成矿有关的深层次找矿异常信息,构建基于完整的领域知识图谱的成矿预测模型。面向资源定量预测的完整的领域知识图谱中所包含的知识以及基于知识图谱构建的成矿预测模型主要以描述性信息为主。
S3,利用基于知识图谱的成矿预测模型中包含的成矿预测数据需求驱动从成矿预测空间数据库中提取并构建成矿预测变量数据集,在构建成矿预测变量数据集的过程中加强深层次找矿异常描述信息的空间变量化表达;
本步骤的资源定量预测工作数据基础为成矿预测空间数据库;为实现资源定量预测评价工作,需要在成矿预测数据库的基础上,根据勘查区的成矿预测模型驱动勘查区成矿预测数据集构建、找矿异常信息的自动提取和深层次与成矿密切相关的描述性找矿异常信息的空间映射,从而基于知识图谱的成矿预测模型来驱动变量提取并构建成矿预测变量数据集。
S4,利用基于知识图谱的成矿模型中包含的成矿预测方法驱动机器学习算法从成矿预测变量数据集中筛选成矿预测指示变量,并对成矿预测指示变量进行集成,获取成矿预测结果。
在资源定量预测中,并非成矿预测变量越多越好。在驱动机制构建成矿预测数据集和成矿预测变量基础上,需要对成矿预测指标变量进行筛选和集成。因此本实施例通过本步骤驱动机器学习算法,从步骤S3得到的成矿预测变量数据集中筛选出相应的数据,作为成矿预测指示变量,再进行集成、筛选得到最优的成矿预测结果。
进一步地,所述以成矿系统和地质异常成矿预测理论为指导,采用用例驱动的方法构建面向矿产资源定量预测的本体模型包括:
S1.1,确定面向矿产资源定量预测本体模型的领域边界;
本步骤确定面向矿产资源定量预测本体模型和知识图谱的边界,面向矿产资源定量预测的本体模型涵盖的范围主要包括矿床的成矿系统与勘探系统相关的知识;
S1.2,利用自上而下和自下而上的方法,以用例为驱动构建所述本体模型。
本步骤综合利用自上而下和自下而上方法优点,以用例为驱动构建本体模型。首先梳理某类矿床相关的专业术语知识体系,例如可以选择某一典型矿床;根据相关的数据库信息和文本描述,确定与典型矿床相关的实体,作为本体模型的实例,然后根据实例实体推理其实体类;根据专家知识梳理实体类之间的语义关系,进而构建完成的本体模型,作为知识图谱构建的知识概念模型,如“矿床-位于-省份”,得到如图3所示的示例性的本体模型。
进一步地,在所述本体模型的指导下,利用结构性关系数据映射和基于深度学习的非结构性地质文本实体及语义关系识别的方法构建面向资源定量预测的完整的领域知识图谱包括:
S1.3,以所述本体模型为指导,利用D2RQ平台将关系数据库中的关系数据映射成RDF三元组数据;
S1.4,利用自然语言处理、深度学习、字典匹配、半监督学习其中的一种或多种方法,对与矿床相关的非结构的文本报告进行实体及语义关系的抽取;
将所述实体及语义关系融合,构建面向矿产资源定量预测评价的领域知识图谱。
本步骤通过将结构数据映射和非结构性地质文本数据挖掘产生的知识图谱进行融合,构建统一的面向矿产资源定量预测的领域知识图谱。
进一步地,所述利用聚类归纳和逻辑推理方法对所述领域知识图谱中的领域知识进挖掘包括:
S2.1,基于构建的面向资源定量预测的领域知识图谱,利用聚类算法对知识图谱中的数据知识进行聚类分析;
S2.2,根据所述领域知识图谱聚类的结果,归纳总结该矿种包含的主要的成矿预测类型(P1,P2…Pn),并总结其核心、共性的成矿控制要素、预测要素,建立成矿预测指标体系。
进一步地,所述构建基于知识图谱的成矿预测模型包括:
S2.3,将基于勘查区数据所构建的知识图谱与面向资源定量预测的知识图谱和所述的知识图谱聚类产生的成矿预测类型进行相似性计算和关联分析,根据相似性计算的结果,推荐相应的成矿预测指标体系,构建基于知识图谱的成矿预测模型。
进一步地,所述利用基于知识图谱的成矿预测模型中包含的成矿预测数据需求驱动从成矿预测空间数据库中提取并构建成矿预测变量数据集,在构建成矿预测变量数据集的过程中加强深层次找矿异常描述信息的空间变量化表达包括:
S3.1,获取勘查区的成矿预测数据库,将所述成矿预测数据库中的数据类型分为地质、地球物理、地球化学和遥感四类数据类型,根据数据类型构建成矿预测变量数据集;
数据类型为地质的数据可以是地质图信息、断层信息、岩体等;
数据类型为地球物理的数据可以是地球物理重力和磁测数据等;
数据类型为地球化学的数据可以是地球化学元素和元素组合等;
数据类型为遥感的数据可以是反射、辐射或散射的电磁波数据等。
S3.2,将所述成矿预测模型中涉及到的数据类型为地质的数据,进行空间变量的表达;
本步骤将成矿预测模型中涉及到的地质信息进行空间变量的表达,如根据地质图信息,针对断层信息,构建断层缓冲区、断层优益度、断层交点数、断层方位等空间变量;针对地层,可以构架地层组合熵、地层种类数等空间变量;针对岩体,可以构建岩体内、外缓冲区等空间变量;对于知识图谱揭示的深层次的成矿预测信息,比如含矿建造,在地质要素编辑的基础上进行相应的构建。
S3.3,将所述成矿预测模型中涉及到的数据类型为地球物理的数据,根据基于所述领域知识图谱的所述成矿预测模型所揭示的有利的地球物理勘查方法和数据处理方法,构建相应的地球物理变量;
本步骤针对地球物理重力和磁测数据,根据基于知识图谱的成矿预测模型所揭示的有利的地球物理勘查方法和数据处理方法,构建相应的地球物理变量,如重磁数据的延拓、求导、导数模、Title斜导数等空间变量。
S3.4,将所述成矿预测模型中涉及到的数据类型为地球化学的数据,基于所述领域知识图谱的成矿预测模型所揭示的指示地球化学元素和元素组合,构建地球化学元素变量和综合变量;
本步骤基于领域知识图谱的成矿预测模型所揭示的指示地球化学元素和元素组合,构建地球化学元素变量和综合变量。
S3.5,将所述成矿预测模型中涉及到的数据类型为遥感的数据,基于知识图谱的成矿预测模型所揭示的遥感找矿标志,从遥感数据中解译线环构建和蚀变信息。
本步骤基于知识图谱的成矿预测模型所揭示的遥感找矿标志,从遥感数据中解译线环构建和蚀变信息。
进一步地,所述进行空间变量的表达包括:
根据地质图信息,针对断层信息,构建断层缓冲区、断层优益度、断层交点数、断层方位等空间变量;和/或
针对地层信息,构建地层组合熵、地层种类数等空间变量;和/或
针对岩体信息,构建岩体内、外缓冲区等空间变量;和/或
对于所述领域知识图谱揭示的深层次的成矿预测信息,在地质要素编辑的基础上进行相应的构建。
进一步地,所述利用基于知识图谱的成矿模型中包含的成矿预测方法驱动机器学习算法从成矿预测变量数据集中筛选成矿预测指示变量包括:
S4.1,基于所述成矿预测变量数据集,根据已知的矿床点和所述领域知识图谱中揭示的成矿控制要素,利用GIS空间分析的方法,随机构建包含已知矿床点的正负训练样本,构建训练数据集;
在步骤S3中构建了成矿预测变量数据集,本步骤基于成矿预测变量数据集展开。
S4.2,利用非监督学习稀疏主成分方法和监督学习代递归消除的方法分别对成矿预测变量数据集中的变量重要性进行排序,选择对成矿预测具有指示作用的成矿预测指示变量。
本步骤利用非监督学习稀疏主成分方法(SPCA)和监督学习代递归消除(RFE)的方法分别对成矿预测变量数据集中的变量重要性进行排序,选择对成矿预测具有指示作用的成矿预测变量,分别形成基于非监督学习的成矿预测指标标量数据集和基于监督学习的成矿预测指标变量数据集。
进一步地,所述对成矿预测指示变量进行集成,获取成矿预测结果包括:
S4.3,利用基于知识图谱的成矿预测模型所推荐的信息集成方法,基于所述成矿预测指标变量和训练数据集,训练成矿预测信息集成模型;
本步骤利用证据权方法和随机森林的方法,基于筛选出的成矿预测指标标量数据集,利用训练数据集,训练成矿预测证据权模型和随机森林模型。
S4.4,根据训练的成矿预测信息集成模型,比如证据权模型和随机森林模型,基于所述成矿预测指标计算研究区的成矿概率,获得成矿预测结果,用于衡量矿产资源成矿潜力的大小;
本步骤根据训练的成矿预测证据权模型和随机森林模型,基于筛选出的成矿预测指标标量数据集计算研究区的成矿概率,获得多种成矿预测结果,用来衡量矿产资源成矿潜力的大小。
S4.5,利用GIS空间分析,获得训练样本所在空间位置的成矿概率,分别计算其ROC曲线和AUC值,根据ROC曲线和AUC值筛选出最优的成矿预测结果,获取成矿预测结果,利用约登指数确定成矿概率分隔阈值,进而将大于阈值的区域划定成矿远景区。
本步骤利用GIS空间分析,获得训练样本所在空间位置的后验概率和概率值,分别计算其ROC曲线和AUC值;根据ROC曲线和AUC值筛选出最优的成矿预测结果;利用Youdenindex来确定后验概率和成矿概率的阈值,进而划定成矿远景区。
进一步提供一种基于知识图谱驱动的矿产资源预测系统,包含以下模块:
完整的领域知识图谱构建模块,用于以成矿系统和地质异常成矿预测理论为指导,采用用例驱动的方法构建面向矿产资源定量预测的本体模型,在所述本体模型的指导下,利用结构性关系数据映射和基于深度学习的非结构性地质文本实体及语义关系识别的方法构建面向资源定量预测的完整的领域知识图谱;
成矿预测模型构建模块,用于利用聚类归纳和逻辑推理方法对所述领域知识图谱中的领域知识进挖掘,得到与矿床成矿有关的深层次找矿异常信息,构建基于知识图谱的成矿预测模型;
成矿预测变量数据集构建模块,用于利用基于知识图谱的成矿预测模型中包含的成矿预测数据需求驱动从成矿预测空间数据库中提取并构建成矿预测变量数据集,在构建成矿预测变量数据集的过程中加强深层次找矿异常描述信息的空间变量化表达;
成矿预测结果集成模块,用于利用基于知识图谱的成矿模型中包含的成矿预测方法驱动机器学习算法从成矿预测变量数据集中筛选成矿预测指示变量,并对成矿预测指示变量进行集成,获取成矿预测结果。
进一步提供一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时实现所述的一种基于知识图谱驱动的矿产资源预测方法。
实验数据
通过本实施例提供的方法,对江西某地铜钨多金属勘查区进行成矿预测案例研究,说明了本实施例提供的方法可行或具有优益的效果。在对江西朱溪式铜钨矿利用专家系统驱动算法,基于矿床模型,建立十二个地质变量,利用递归特征消除(RFE)和稀疏主成分分析(SPCA)确定矿产远景区预测的主成分值,在大数据和证据权、随机森林等方法的应用下,生成成矿远景区概率图,如图4所示,在针对预测变量(PV)的设定条件下,使用了递归特征消除与随机森林的方法生成的ROC曲线下面积(AUC)最大,AUC=0.943,相比较无PV判定的随机森林找矿前景预测结果为AUC=0.669;
与背景技术提及的利用数学模型预测矿产成矿潜力、基于数据科学的资源定量预测等一系列成矿预测理论、基于求异理论的资源定量预测与评价阶段和数字找矿与资源定量预测与评价阶段等方法相比,本实施例提供的方法为资源定量预测提供了一套智能化和自动化的方案,首先利用地质领域的结构性和非结构性数据构建资源定量预测领域知识图谱,进而构建基于知识图谱的成矿预测模型,代替以往基于地质专家的成矿预测模型的构建方法,本质上是利用大数据和计算机技术构建资源定量评价领域的“专家系统”,通过“专家系统”驱动算法模型从GIS空间数据库中获取地质要素和计算相应的成矿预测变量,利用机器学习算法对成矿预测变量进行筛选和集成,并利用ROC曲线和Youdex指数对成矿预测结果进行优选和圈定找矿靶区。该发明为资源定量预测和评价提供了一种智能化和自动化的方案。
本领域内的技术人员应明白,本发明的实施例可提供为方法、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
应当注意的是,在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的部件或步骤。位于部件之前的单词“一”或“一个”不排除存在多个这样的部件。本发明可以借助于包括有若干不同部件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
在本发明中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”、“固定”等术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或成一体;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通或两个元件的相互作用关系。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不应理解为必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

Claims (5)

1.一种基于知识图谱驱动的矿产资源预测方法,其特征在于:包括以下步骤:
以成矿系统和地质异常成矿预测理论为指导,采用用例驱动的方法构建面向矿产资源定量预测的本体模型,在所述本体模型的指导下,利用结构性关系数据映射和基于深度学习的非结构性地质文本实体及语义关系识别的方法构建面向资源定量预测的领域知识图谱;
利用聚类归纳和逻辑推理方法对所述领域知识图谱中的领域知识进挖掘,得到与矿床成矿预测相关的控矿要素、找矿标志、地质异常变量、找矿评价方法、数据基础相关信息,构建基于知识图谱的成矿预测模型;
利用基于知识图谱的成矿预测模型中包含的成矿预测数据需求驱动从成矿预测空间数据库中提取并构建成矿预测变量数据集,在构建成矿预测变量数据集的过程中加强深层次找矿异常描述信息的空间变量化表达;
利用基于知识图谱的成矿预测模型中包含的成矿预测方法驱动机器学习算法从成矿预测变量数据集中筛选成矿预测指标变量,并对成矿预测指标变量进行集成,获取成矿预测结果;
所述利用聚类归纳和逻辑推理方法对所述领域知识图谱中的领域知识进挖掘包括:
基于构建的面向资源定量预测的领域知识图谱,利用聚类算法对知识图谱中的数据知识进行聚类分析;
根据所述领域知识图谱聚类的结果,归纳总结矿种包含的主要的成矿预测类型P1,P2…Pn,并总结其核心、共性的成矿控制要素、预测要素,建立成矿预测指标体系;
所述构建基于知识图谱的成矿预测模型包括:
将基于勘查区数据所构建的知识图谱与面向资源定量预测的知识图谱和所述的知识图谱聚类产生的成矿预测类型进行相似性计算和关联分析,根据相似性计算的结果,推荐相应的成矿预测指标体系,构建基于知识图谱的成矿预测模型;
所述利用基于知识图谱的成矿预测模型中包含的成矿预测数据需求驱动从成矿预测空间数据库中提取并构建成矿预测变量数据集,在构建成矿预测变量数据集的过程中加强深层次找矿异常描述信息的空间变量化表达包括:
获取勘查区的成矿预测数据库,将所述成矿预测数据库中的数据类型分为地质、地球物理、地球化学和遥感四类数据类型,根据数据类型构建成矿预测变量数据集;
将所述成矿预测模型中涉及到的数据类型为地质的数据,进行空间变量的表达,所述进行空间变量的表达包括:
根据地质图信息,针对断层信息,构建断层缓冲区、断层优益度、断层交点数、断层方位空间变量;和/或
针对地层信息,构建地层组合熵、地层种类数空间变量;和/或
针对岩体信息,构建岩体内、外缓冲区空间变量;和/或
对于所述领域知识图谱揭示的深层次的成矿预测信息,在地质要素编辑的基础上进行相应的构建;
所述利用基于知识图谱的成矿预测模型中包含的成矿预测方法驱动机器学习算法从成矿预测变量数据集中筛选成矿预测指标变量包括:
基于所述成矿预测变量数据集,根据已知的矿床点和所述领域知识图谱中揭示的成矿控制要素,利用GIS空间分析的方法,随机构建包含已知矿床点的正负训练样本,构建训练数据集;
利用非监督学习稀疏主成分方法和监督学习代递归消除的方法分别对成矿预测变量数据集中的变量重要性进行排序,选择对成矿预测具有指示作用的成矿预测指标变量;
所述对成矿预测指标变量进行集成,获取成矿预测结果包括:
利用基于知识图谱的成矿预测模型所推荐的信息集成方法,基于所述成矿预测指标变量和训练数据集,训练多个成矿预测信息集成模型;
根据训练的成矿预测信息集成模型,基于所述成矿预测指标计算研究区的成矿概率,获得对应的多个成矿预测结果,用于衡量矿产成矿潜力的大小;
利用GIS空间分析,获得所在空间位置的成矿概率,分别计算其ROC曲线和AUC值,根据ROC曲线和AUC值筛选出最优的成矿预测结果,利用约登指数确定成矿概率分隔阈值,进而将大于阈值的区域划定成矿远景区。
2.根据权利要求1所述的一种基于知识图谱驱动的矿产资源预测方法,其特征在于:
所述以成矿系统和地质异常理论为指导,采用用例驱动的方法构建面向矿产资源定量预测的本体模型包括:
确定面向矿产资源定量预测本体模型的领域边界;
利用自上而下和自下而上的方法,以用例为驱动构建所述本体模型。
3.根据权利要求1或2所述的一种基于知识图谱驱动的矿产资源预测方法,其特征在于:在所述本体模型的指导下,利用结构性关系数据映射和基于深度学习的非结构性地质文本实体及语义关系识别的方法构建面向资源定量预测的领域知识图谱包括:
以所述本体模型为指导,利用D2RQ平台将关系数据库中的关系数据映射成RDF三元组数据;
利用自然语言处理、深度学习、字典匹配、半监督学习其中的一种或多种方法,对与矿床相关的非结构的文本报告进行实体及语义关系的抽取;
将所述实体及语义关系融合,构建面向矿产资源定量预测的领域知识图谱。
4.根据权利要求1所述的一种基于知识图谱驱动的矿产资源预测方法,其特征在于:所述利用基于知识图谱的成矿预测模型中包含的成矿预测数据需求驱动从成矿预测空间数据库中提取并构建成矿预测变量数据集,在构建成矿预测变量数据集的过程中加强深层次找矿异常描述信息的空间变量化表达包括:
将所述成矿预测模型中涉及到的数据类型为地球物理的数据,根据基于所述领域知识图谱的所述成矿预测模型所揭示的有利的地球物理勘查方法和数据处理方法,构建相应的地球物理变量;
将所述成矿预测模型中涉及到的数据类型为地球化学的数据,基于所述领域知识图谱的成矿预测模型所揭示的指示地球化学元素和元素组合,构建地球化学元素变量和综合变量;
将所述成矿预测模型中涉及到的数据类型为遥感的数据,基于知识图谱的成矿预测模型所揭示的遥感找矿标志,从遥感数据中解译线环构建和蚀变信息。
5.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至4中任一项所述的一种基于知识图谱驱动的矿产资源预测方法。
CN202310157590.8A 2023-02-23 2023-02-23 一种基于知识图谱驱动的矿产资源预测方法、存储介质 Active CN116307123B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310157590.8A CN116307123B (zh) 2023-02-23 2023-02-23 一种基于知识图谱驱动的矿产资源预测方法、存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310157590.8A CN116307123B (zh) 2023-02-23 2023-02-23 一种基于知识图谱驱动的矿产资源预测方法、存储介质

Publications (2)

Publication Number Publication Date
CN116307123A CN116307123A (zh) 2023-06-23
CN116307123B true CN116307123B (zh) 2023-11-14

Family

ID=86778969

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310157590.8A Active CN116307123B (zh) 2023-02-23 2023-02-23 一种基于知识图谱驱动的矿产资源预测方法、存储介质

Country Status (1)

Country Link
CN (1) CN116307123B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117370899B (zh) * 2023-12-08 2024-02-20 中国地质大学(武汉) 一种基于主成分-决策树模型的控矿因素权重确定方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111611404A (zh) * 2020-05-20 2020-09-01 中国地质调查局发展研究中心 一种基于地质文本语料预测目标区矿产的方法
CN114138923A (zh) * 2021-12-03 2022-03-04 吉林大学 一种构建地质图知识图谱的方法
CN114218333A (zh) * 2021-11-26 2022-03-22 西南交通大学 一种地质知识图谱构建方法、装置、电子设备及存储介质
CN114898109A (zh) * 2022-04-14 2022-08-12 中国自然资源航空物探遥感中心 一种基于深度学习的斑岩浅成低温热液型矿产预测方法及系统
WO2022257930A1 (zh) * 2021-06-07 2022-12-15 中国地质大学(北京) 成矿研究区的成矿模拟方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111611404A (zh) * 2020-05-20 2020-09-01 中国地质调查局发展研究中心 一种基于地质文本语料预测目标区矿产的方法
WO2022257930A1 (zh) * 2021-06-07 2022-12-15 中国地质大学(北京) 成矿研究区的成矿模拟方法及装置
CN114218333A (zh) * 2021-11-26 2022-03-22 西南交通大学 一种地质知识图谱构建方法、装置、电子设备及存储介质
CN114138923A (zh) * 2021-12-03 2022-03-04 吉林大学 一种构建地质图知识图谱的方法
CN114898109A (zh) * 2022-04-14 2022-08-12 中国自然资源航空物探遥感中心 一种基于深度学习的斑岩浅成低温热液型矿产预测方法及系统

Also Published As

Publication number Publication date
CN116307123A (zh) 2023-06-23

Similar Documents

Publication Publication Date Title
Knox‐Robinson et al. Towards a holistic exploration strategy: using geographic information systems as a tool to enhance exploration
Tadeusiewicz Neural networks in mining sciences–general overview and some representative examples
US8090538B2 (en) System and method for interpretation of well data
Rostamian et al. Evaluation of different machine learning frameworks to predict CNL-FDC-PEF logs via hyperparameters optimization and feature selection
CA3109021C (en) Facilitating hydrocarbon exploration by applying a machine-learning model to basin data
CN116307123B (zh) 一种基于知识图谱驱动的矿产资源预测方法、存储介质
Gu et al. Data-driven lithology prediction for tight sandstone reservoirs based on new ensemble learning of conventional logs: A demonstration of a Yanchang member, Ordos Basin
Ali et al. A novel machine learning approach for detecting outliers, rebuilding well logs, and enhancing reservoir characterization
Chudasama et al. Target-scale prospectivity modeling for gold mineralization within the rajapalot Au-Co project area in northern Fennoscandian Shield, Finland. Part 1: application of knowledge-driven-and machine learning-based-hybrid-expert systems for exploration targeting and addressing model-based uncertainties
Brown et al. Machine learning on Crays to optimize petrophysical workflows in oil and gas exploration
Leung et al. Sample truncation strategies for outlier removal in geochemical data: the MCD robust distance approach versus t-SNE ensemble clustering
Hossain et al. Lithology prediction using well logs: A granular computing approach
Zhang et al. An integrated framework for data-driven mineral prospectivity mapping using bagging-based positive-unlabeled learning and bayesian cost-sensitive logistic regression
Temizel et al. A thorough review of machine learning applications in oil and gas industry
US20230176242A1 (en) Framework for integration of geo-information extraction, geo-reasoning and geologist-responsive inquiries
Li et al. Research and application of an intelligent prediction of rock bursts based on a Bayes-optimized convolutional neural network
Qiu et al. Geological profile-text information association model of mineral exploration reports for fast analysis of geological content
Bigdeli et al. A comparative study of the XGBoost ensemble learning and multilayer perceptron in mineral prospectivity modeling: a case study of the Torud-Chahshirin belt, NE Iran
Gao et al. Seismic predictions of fluids via supervised deep learning: Incorporating various class-rebalance strategies
Song et al. Reservoir lithology identification based on improved adversarial learning
Kazemi et al. Application of genetic and K-means algorithms in clustering Babakoohi Anticline joints north of Shiraz, Iran
Yang et al. Mineralized-Anomaly Identification Based on Convolutional Sparse Autoencoder Network and Isolated Forest
Cheng et al. Fuzzy weights of evidence method implemented in GeoDAS GIS for information extraction and integration for prediction of point events
Ma et al. Unlocking Completion Design Optimization Using an Augmented AI Approach
Liu et al. The edge-guided FPN model for automatic stratigraphic correlation of well logs

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant