CN112652066A - 一种基于三维地质模型的地质表征情况的评价方法及系统 - Google Patents

一种基于三维地质模型的地质表征情况的评价方法及系统 Download PDF

Info

Publication number
CN112652066A
CN112652066A CN202011580495.1A CN202011580495A CN112652066A CN 112652066 A CN112652066 A CN 112652066A CN 202011580495 A CN202011580495 A CN 202011580495A CN 112652066 A CN112652066 A CN 112652066A
Authority
CN
China
Prior art keywords
model
dimensional
geological
data
information source
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011580495.1A
Other languages
English (en)
Other versions
CN112652066B (zh
Inventor
李楠
肖克炎
李苍柏
楚文楷
曹瑞
范建福
阴江宁
徐旸
樊铭静
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Mineral Resources of Chinese Academy of Geological Sciences
Original Assignee
Institute of Mineral Resources of Chinese Academy of Geological Sciences
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Mineral Resources of Chinese Academy of Geological Sciences filed Critical Institute of Mineral Resources of Chinese Academy of Geological Sciences
Priority to CN202011580495.1A priority Critical patent/CN112652066B/zh
Publication of CN112652066A publication Critical patent/CN112652066A/zh
Application granted granted Critical
Publication of CN112652066B publication Critical patent/CN112652066B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T17/00Three dimensional [3D] modelling, e.g. data description of 3D objects
    • G06T17/05Geographic models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Geometry (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Software Systems (AREA)
  • Remote Sensing (AREA)
  • Computer Graphics (AREA)
  • Computer Hardware Design (AREA)
  • Geophysics And Detection Of Objects (AREA)

Abstract

本发明涉及一种基于三维地质模型的地质表征情况的评价方法及系统。该方法包括:获取地层和构造原始测量数据并生成三维地质测量模型;对地层和构造原始测量数据进行扰动生成三维扰动模型;将三维地质模型转换为三维矿块模型,并将三维矿块模型按照坐标展开成一维数组,形成地质模型评价数据集;根据地质模型评价数据集,利用真值发现算法对三维矿块模型进行处理,确定三维矿块模型的不确定性,并确定三维矿块模型的不确定性过程中的每个信息源的真值点和每个信息源的权重;基于每个信息源的真值点以及每个信息源的权重对三维矿块模型进行定性评价和定量评价,构建用于定量评价的三维地质模型。本发明能够准确评价地质表征情况,准确预测矿产资源。

Description

一种基于三维地质模型的地质表征情况的评价方法及系统
技术领域
本发明涉及矿产资源预测领域,特别是涉及一种基于三维地质模型的地质表征情况的评价方法及系统。
背景技术
据统计,2013年中国21种矿产消费量位居世界首位,约占全球消费总量的1/3。未来的10到15年间,中国矿产资源的刚性需求仍将持续,大宗金属矿产需求峰值将陆续来临,对外依存度将大幅攀升,严重超越国家资源安全警戒线。如果未来10年探明资源储量不能大幅度增加,几乎所有的大宗金属矿产将面临消耗殆尽的危险局面,形势危急,前景堪忧。立足国内,寻找找矿战略新区,开辟第二找矿空间,实现找矿重大突破,提高资源保障程度,已成为中国一项紧迫、艰巨而又长期的重大战略任务。
无论是国外还是国内的找矿实践都证明,深部探矿是破解能源、资源困局的有效途径。随着找矿深度的不断加大,找矿工作也将从二维平面转向三维空间,传统的基于二维地理信息系统(Geographic Information System,GIS)图件开展的矿产资源预测评价已不再适应当代发展的需求,急需一种新的手段来表达地下存在的地质情况。因此,利用计算机三维地质建模技术与科学计算可视化定量表征地质模型、找矿勘探模型、预测模型,成为当前矿产资源预测领域的一大热点。
当前,大深度地质数据难识别、难获取是一个普遍难题,导致大量三维地质建模应用存在输入数据稀疏的情况,此外,在三维地质模型构建的过程中,受客观地质构造的复杂性、地质建模人员认识的主观性以及人工误差等,三维地质模型不可避免地存在着不确定性,缺乏实用性,导致地质表征情况准确性差,无法准确预测矿产资源。
发明内容
本发明的目的是提供一种基于三维地质模型的地质表征情况的评价方法及系统,以解决大深度地质数据难识别、难获取且在三维地质模型构建的过程中,受客观地质构造的复杂性、地质建模人员认识的主观性以及人工误差等,三维地质模型不可避免地存在着不确定性,缺乏实用性,导致地质表征情况准确性差,无法准确预测矿产资源的问题。
为实现上述目的,本发明提供了如下方案:
一种基于三维地质模型的地质表征情况的评价方法,包括:
获取地层和构造原始测量数据,根据所述地层和构造原始测量数据生成三维地质测量模型;
对所述地层和构造原始测量数据进行扰动,生成扰动数据,并根据所述扰动数据生成三维扰动模型;所述三维地质测量模型以及所述三维扰动模型为三维地质模型;
将所述三维地质模型转换为三维矿块模型,并将所述三维矿块模型按照坐标展开成一维数组,完成预处理,形成地质模型评价数据集;
根据所述地层和构造的测量数据集,利用真值发现算法对所述三维地质模型进行处理,运用所述三维地质模型,确定所述三维地质模型的不确定性,并获取利用真值发现算法确定的所述三维矿块模型的不确定性过程中的每个信息源的真值点和每个信息源的权重;
基于所述每个信息源的真值点以及所述每个信息源的权重对所述三维矿块模型进行定性评价和定量评价,构建用于定量评价的三维地质模型;所述定性评价用于评价所述三维地质测量模型或所述三维扰动模型的质量;所述定量评价用于评价所述三维地质测量模型或所述三维扰动模型中观测值的不确定性;所述用于定量评价的三维地质模型用于评价地质表征情况。
可选的,所述对所述地层和构造原始测量数据进行扰动,生成扰动数据,并根据所述扰动数据生成三维扰动模型,具体包括:
基于蒙特卡洛模拟的不确定性传播方法对所述地层和构造原始测量数据进行扰动,生成扰动数据,并根据所述扰动数据生成三维扰动模型;
其中,所述蒙特卡洛模拟的不确定性传播方法中的两种标准分布包括位置的正态分布以及方向的vMF分布;
所述位置的正态分布的概率密度函数为:
Figure RE-GDA0002969463020000031
其中,N(x|ε,σ)为位置的正态分布的概率密度;x为三维地质模型;ε为算数平均值,σ为标准差;
所述方向的vMF分布的概率密度函数为:
Figure RE-GDA0002969463020000032
Figure RE-GDA0002969463020000033
κ>0且||γ||=1;其中,vMF(x|ε,σ)为方向的vMF分布的概率密度;γT为转置的平均方向向量;κ为球的中心;||||为欧几里得范数;Cp(κ)为归一化常数;p为维数。
可选的,所述根据所述地层和构造的测量数据集,利用真值发现算法对所述三维地质模型进行处理,运用所述三维地质模型,确定所述三维地质模型的不确定性,并获取利用真值发现算法确定的所述三维矿块模型的不确定性过程中的每个信息源的真值点和每个信息源的权重,之后还包括:基于地质拓扑知识,利用所述三维地质模型反推地质构造的空间拓扑结构,形成地质拓扑坐标系,并与已知地质拓扑进行对比分析,验证所述三维地质模型的不确定性。
可选的,所述根据所述地层和构造的测量数据集,利用真值发现算法对所述三维地质模型进行处理,运用所述三维地质模型,确定所述三维地质模型的不确定性,并获取利用真值发现算法确定的所述三维矿块模型的不确定性过程中的每个信息源的真值点和每个信息源的权重,具体包括:
利用k-means聚类法将所述地质模型评价数据集P分成k个子集,并将k个所述子集的中心点放入集合U;
以所述集合U中的k个中心点{u1,u2,···,uk}作为单纯形的顶点,在单纯形中构建网格并确定网格点集G;
遍历所述网格点集G的所有顶点{g1,g2,···,gm},使得目标函数最小化的顶点确定为每个信息源的真值点,并获取每个信息源的权重。
可选的,所述目标函数为:
Figure RE-GDA0002969463020000034
其中,pi为第i个信息源的真值向量;n为信息源的数量;p*为使得目标函数最小化的真值向量;wi为第i个信息源的权重。
可选的,所述根据所述地层和构造的测量数据集,利用真值发现算法对所述三维地质模型进行处理,运用所述三维地质模型,确定所述三维地质模型的不确定性,并获取利用真值发现算法确定的所述三维矿块模型的不确定性过程中的每个信息源的真值点和每个信息源的权重,之后还包括:
在所述原始测量数据上添加构造边界数据;所述构造边界数据包括钻孔、剖面以及地球物理数据;
根据所述构造边界数据修正所述三维地质测量模型,确定修正后的三维地质测量模型;
根据所述修正后的三维地质测量模型依次经过扰动以及转换,确定修正后的三维矿块模型;
对比所述三维矿块模型以及所述修正后的三维矿块模型;
若所述修正后的三维矿块模型内的格子数小于所述三维矿块模型,确定所述三维矿块模型的可靠性增加;
若所述修正后的三维矿块模型内的格子数大于所述三维矿块模型,确定所述三维矿块模型的可靠性降低。
可选的,基于所述每个信息源的真值点以及所述每个信息源的权重对所述三维矿块模型进行定性评价和定量评价,构建用于定量评价的三维地质模型,具体包括:
基于所述每个信息源的真值点以及所述每个信息源的权重,利用正态分布法或累积分布函数法对所述三维矿块模型进行定性评价和定量评价,构建用于定量评价的三维地质模型。
一种基于三维地质模型的地质表征情况的评价系统,包括:
三维地质测量模型生成模块,用于获取地层和构造原始测量数据,根据所述地层和构造原始测量数据生成三维地质测量模型;
三维扰动模型生成模块,用于对所述地层和构造原始测量数据进行扰动,生成扰动数据,并根据所述扰动数据生成三维扰动模型;所述三维地质测量模型以及所述三维扰动模型为三维地质模型;
地质模型评价数据集形成模块,用于将所述三维地质模型转换为三维矿块模型,并将所述三维矿块模型按照坐标展开成一维数组,完成预处理,形成地质模型评价数据集;
不确定性确定模块,用于根据所述地层和构造的测量数据集,利用真值发现算法对所述三维地质模型进行处理,运用所述三维地质模型,确定所述三维地质模型的不确定性,并获取利用真值发现算法确定的所述三维矿块模型的不确定性过程中的每个信息源的真值点和每个信息源的权重;
用于定量评价的三维地质模型构建模块,用于基于所述每个信息源的真值点以及所述每个信息源的权重对所述三维矿块模型进行定性评价和定量评价,构建用于定量评价的三维地质模型;所述定性评价用于评价所述三维地质测量模型或所述三维扰动模型的质量;所述定量评价用于评价所述三维地质测量模型或所述三维扰动模型中观测值的不确定性;所述用于定量评价的三维地质模型用于评价地质表征情况。
可选的,所述三维扰动模型生成模块,具体包括:
三维扰动模型单元,用于基于蒙特卡洛模拟的不确定性传播方法对所述地层和构造原始测量数据进行扰动,生成扰动数据,并根据所述扰动数据生成三维扰动模型;
其中,所述蒙特卡洛模拟的不确定性传播方法中的两种标准分布包括位置的正态分布以及方向的vMF分布;
所述位置的正态分布的概率密度函数为:
Figure RE-GDA0002969463020000051
其中,N(x|ε,σ)为位置的正态分布的概率密度;x为三维地质模型;ε为算数平均值,σ为标准差;
所述方向的vMF分布的概率密度函数为:
Figure RE-GDA0002969463020000052
Figure RE-GDA0002969463020000053
κ>0且||γ||=1;其中,vMF(x|ε,σ)为方向的vMF分布的概率密度;γT为转置的平均方向向量;κ为球的中心;||||为欧几里得范数;Cp(κ)为归一化常数;p为维数。
可选的,所述不确定性确定模块,具体包括:
聚类单元,用于利用k-means聚类法将所述地质模型评价数据集 P分成k个子集,并将k个所述子集的中心点放入集合U;
网格点集确定单元,用于以所述集合U中的k个中心点 {u1,u2,···,uk}作为单纯形的顶点,在单纯形中构建网格并确定网格点集G;
每个信息源的真值点确定单元,用于遍历所述网格点集G的所有顶点{g1,g2,···,gm},使得目标函数最小化的顶点确定为每个信息源的真值点,并获取每个信息源的权重。
根据本发明提供的具体实施例,本发明公开了以下技术效果:本发明提供了一种基于三维地质模型的地质表征情况的评价方法及系统,首先,通过对真值发现结果的真值研究,优化了三维地质模型的不确定性的定量表达研究;其次,探索了减少三维地质模型不确定性有效途径;最后,通过对真值发现结果的权重研究,实现了基于全局最优解的三维地质模型可靠性的定量评价,解决了三维地质模型不确定性的整合和定量表达问题,实现了随机测量模型与扰动模型的可靠性评价,不受客观地质构造的复杂性、地质建模人员认识的主观性以及人工误差等影响,建立的用于定量评价的三维地质模型用于评价地质表征情况,能够准确评价地质表征情况,从而准确预测矿产资源。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明所提供的基于三维地质模型的地质表征情况的评价方法流程图;
图2为总体技术流程图;
图3为κ值的大小对vMF的影响示意图;
图4为累积分布法示意图,横坐标代表权重值的倒数,纵坐标代表累积概率值;
图5为本发明所提供的基于三维地质模型的地质表征情况的评价系统结构图;
图6为扬子板块大地构造分区图;
图7为随机扰动模型示意图;
图8为矿块扰动模型的转化示意图;
图9为三维地质模型的不确定性示意图;其中,图9(a)为三维地质模型总的不确定性示意图;图9(b)为三维地质模型向年轻地质年代变化的不确定性示意图;图9(c)为三维地质模型向年老地质年代变化的不确定性示意图;图9(d)为不确定性与断层和部分地层的叠加示意图;
图10为数据集1、数据集2和数据集3的不确定性可视化示意图;其中,图10(a)为第一组数据的不确定性结果;图10(b)为第二组数据的不确定性结果;图10(c)为第三组数据的不确定性结果;图10(d)为第一组数据的不确定性结果的主干剖面与断层和牛蹄塘组的叠加图;图10(e)为第二组数据的不确定性结果的主干剖面与断层和牛蹄塘组的叠加图;图10(f)为第三组数据的不确定性结果的主干剖面与断层和牛蹄塘组的叠加图;
图11为模型格子变化程度直方图;其中,直方图柱子上的数字代表着该范围对应的格子个数;图11(a)为模型1格子变化程度直方图;图11(b)为模型2格子变化程度直方图;图11(c)为模型3 格子变化程度直方图;图11(d)为模型1、2、3格子变化程度直方图的比较图;
图12为正态分布法结果示意图;
图13为数据集1,数据集2和数据集3的正态分布曲线的示意图;其中,图13(a)为数据集1的正态分布曲线图;图13(b)为数据集2的正态分布曲线图;图13(c)为数据集3的正态分布曲线图;图13(d)为数据集1、数据集2、数据集3正态分布曲线的比较图;
图14为累积分布函数法结果示意图;
图15为三组数据权重集的累积分布函数法比较图;
图16为地质拓扑构建技术流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的目的是提供一种基于三维地质模型的地质表征情况的评价方法及系统,能够准确评价地质表征情况,从而准确预测矿产资源。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
图1为本发明所提供的基于三维地质模型的地质表征情况的评价方法流程图,如图1所示,一种基于三维地质模型的地质表征情况的评价方法,包括:
步骤101:获取地层和构造原始测量数据,根据所述地层和构造原始测量数据生成三维地质测量模型。
步骤102:对所述地层和构造原始测量数据进行扰动,生成扰动数据,并根据所述扰动数据生成三维扰动模型;所述三维地质测量模型以及所述三维扰动模型为三维地质模型。
所述步骤102具体包括:基于蒙特卡洛模拟的不确定性传播方法对所述地层和构造原始测量数据进行扰动,生成扰动数据,并根据所述扰动数据生成三维扰动模型;其中,所述蒙特卡洛模拟的不确定性传播方法中的两种标准分布包括位置的正态分布以及方向的vMF分布;所述位置的正态分布的概率密度函数为:
Figure RE-GDA0002969463020000081
其中,N(x|ε,σ)为位置的正态分布的概率密度;x为三维地质模型;ε为算数平均值,σ为标准差;所述方向的vMF分布的概率密度函数为:
Figure RE-GDA0002969463020000091
κ>0且||γ||=1;其中,vMF(x|ε,σ)为方向的 vMF分布的概率密度;γT为转置的平均方向向量;κ为球的中心;|||| 为欧几里得范数;Cp(κ)为归一化常数;p为维数。
步骤103:将所述三维地质模型转换为三维矿块模型,并将所述三维矿块模型按照坐标展开成一维数组,完成预处理,形成地质模型评价数据集。
步骤104:根据所述地层和构造的测量数据集,利用真值发现算法对所述三维地质模型进行处理,运用所述三维地质模型,确定所述三维地质模型的不确定性,并获取利用真值发现算法确定的所述三维矿块模型的不确定性过程中的每个信息源的真值点和每个信息源的权重。
三维地质模型交叉验证(仿真实验)的方法如下:基于地质拓扑知识,由三维地质模型反推地质构造的空间拓扑结构,形成地质拓扑坐标系,并于已知地质拓扑进行对比分析,验证三维地质模型的可靠性,图16为地质拓扑构建技术流程图,如图16所示。
所述步骤104具体包括:利用k-means聚类法将所述地质模型评价数据集P分成k个子集,并将k个所述子集的中心点放入集合U;以所述集合U中的k个中心点{u1,u2,···,uk}作为单纯形的顶点,在单纯形中构建网格并确定网格点集G;遍历所述网格点集G的所有顶点 {g1,g2,···,gm},使得目标函数最小化的顶点确定为每个信息源的真值点,并获取每个信息源的权重。
所述目标函数为:
Figure RE-GDA0002969463020000092
其中,pi为第i个信息源的真值向量;n为信息源的数量;p*为使得目标函数最小化的真值向量;wi为第i个信息源的权重。
所述步骤104之后还包括:在所述原始测量数据上添加构造边界数据;所述构造边界数据包括钻孔、剖面以及地球物理数据;根据所述构造边界数据修正所述三维地质测量模型,确定修正后的三维地质测量模型;根据所述修正后的三维地质测量模型依次经过扰动以及转换,确定修正后的三维矿块模型;对比所述三维矿块模型以及所述修正后的三维矿块模型;若所述修正后的三维矿块模型内的格子数小于所述三维矿块模型,确定所述三维矿块模型的可靠性增加;若所述修正后的三维矿块模型内的格子数大于所述三维矿块模型,确定所述三维矿块模型的可靠性降低。
步骤105:基于所述每个信息源的真值点以及所述每个信息源的权重对所述三维矿块模型进行定性评价和定量评价,构建用于定量评价的三维地质模型;所述定性评价用于评价所述三维地质测量模型或所述三维扰动模型的质量;所述定量评价用于评价所述三维地质测量模型或所述三维扰动模型中观测值的不确定性;所述用于定量评价的三维地质模型用于评价地质表征情况。
所述步骤105具体包括:基于所述每个信息源的真值点以及所述每个信息源的权重,利用正态分布法或累积分布函数法对所述三维矿块模型进行定性评价和定量评价,构建用于定量评价的三维地质模型。
基于本发明上述的基于三维地质模型的地质表征情况的评价方法,在实际操作过程中,本发明的详细步骤如下:
图2为总体技术路线图,如图2所示,首先预处理阶段主要是构建研究所需的数据,包含收集原始数据、利用概率分布进行随机扰动、生成批处理数据;第二,应用隐式三维地质建模的方法将预处理的数据构建为N个可能性模型,同时为了方便处理,需要将这些可能性模型变为矿块模型;第三,结合权重和真值发现,求得各模块新旧变化的情况;第四,整合对照组,降低模型不确定性;第五,利用正态分布法和累积概率函数法进行可靠性评价。
第一步:预处理模块的主要功能是构建研究所需的数据。其主要包含3个部分:收集原始数据、利用概率分布进行随机扰动、生成批处理数据。
(1)原始数据的收集
基于蒙特卡罗模拟的不确定性传播方法(下文均使用简称MCUE) 通过对输入的原始数据进行扰动产生许多模型来传播输入数据的不确定性,然后将输出模型进行整合,用可视化的方式分析模型的不确定性。隐式建模方法是MCUE的首选方法,在建模过程中,主要使用三种类型的数据作为输入:构造边界上的控制点(三维点)、方向(倾向和倾角)和地质单元与地质单元之间的拓扑关系。因此,在本过程中,需要收集产状数据用来提供构造边界上的控制点以及方向,以及构造和侵入用来判断地质单元与地质单元之间的拓扑关系。此外,在这一步,也将利用上述数据构建研究区的初始模型。
(2)概率分布的确定
MCUE中的两种标准分布:
如果每个不确定源的方差总是确定的,则中心极限定理(CLT)对这些数据是成立的。不确定性可以更好地用与CLT一致的扰动分布来表示,即位置的正态分布(笛卡尔标量数据)和方向的von Mises-Fisher(vMF)分布。然而,MCUE并没有禁止使用任何类型的分布。其中,正态分布的概率密度函数记为:
Figure RE-GDA0002969463020000111
其中ε为算数平均值,σ为标准差。
如图3所示,vMF分布()为球面数据的CLT分布;它是正态分布的超球面对应项,并且是p维单位超球面Sp-1上的单位向量。vMF 分布最重要的性质是数据在平均方向上的轴对称。vMF分布也是球面数据的最大熵分布,在似然函数为vMF分布的情况下,与自身共轭。这些特性使得vMF分布适合于球面数据的不确定性分析。超球面Sp-1的vMF分布的概率密度函数表示为
Figure RE-GDA0002969463020000112
κ>0且||γ||=1
其中,γT为转置的平均方向向量,κ为球的中心。||||代表欧几里得范数。κ类似于正态分布中σ的倒数。高κ值意味着该分布的方差较低,如图3所示,最终导致p维超球面为Dirac分布,且κ=0意味着 vMF分布的概率密度函数具有完全随机性。特别的是,κ系数使得vMF分布的形状呈指数增长。因此,置信区间与κ为非线性相关关系。例如,95%下的半孔径置信区间在κ=1时是150°,κ=10时为37°,κ=100 时为11°。Cp(κ)是一种归一化常数,其定义如vMF分布的概率密度函数所示:
Figure RE-GDA0002969463020000121
其中,Iv(κ)代表在v阶第一类贝塞尔函数,p代表S的维数。
在MCUE中的两种标准分布,即位置的正态分布和方向的(von Mises-Fisher,vMF)分布。事实上,在实际应用中,如何确定分布范围这需要一定的经验(地质经验或数学经验),因此需要使用者来判定分布范围的大小。
(3)批处理数据的生成
结合步骤(1)中的原始数据和(2)中给出的概率分布范围,会生成数以千计的模型。这为实验提供了数据基础。
第二步:在预处理模块中,可以生成数以千计的输入数据,这些数据应用隐式三维地质建模的方法可以构建N个可能性模型(这其中也包括初始模型),为了方便处理,需要将这些可能性模型变为矿块模型。为了可视化最终的不确定性,实验需要将所有的模型都作为初始模型,来计算剩余模型与该初始模型的差异。计算变化模型要通过以下标准:(1)当剩余模型与初始模型对应位置相同时,变化模型对应位置取0;(2)当剩余模型对应位置大于初始模型时,变化模型对应位置取1;(3)当剩余模型对应位置小于初始模型时,变化模型对应位置取-1。
应用此方法,便生成了以初始模型为中心的N-1个变化模型。接下来将这些模型展开成向量,作为真值发现算法的输入。
真值发现:
真值发现问题进行建模,则来自每个源的数据可以表示为一个 (可能是高维的)向量,其中每个维对应于一个属性。此外,需要一个变量来表示每个源的可靠性。则定义如下:
令P={p1,p2,···,pn}是
Figure RE-GDA0002969463020000122
中的一组向量,其中,pi代表第i个信息源(共有n个信息源)。则真值发现问题则为寻找使得目标函数最小化的真值向量
Figure RE-GDA0002969463020000131
和每个源的可靠性(权重)wi
目标函数:
Figure RE-GDA0002969463020000132
在上述优化问题中,p*和权重wi均为变量。很容易可以得出,当求得所有的权重wi,p*是所有源的加权平均值
Figure RE-GDA0002969463020000133
这意味着,pi的权重越高,其离p*越近,这与上述真值发现的原则是一致的。
输入:
Figure RE-GDA0002969463020000134
(1)利用k-means聚类法将数据集P分成k个子集,并将得到的k个中心点放入集合U;
(2)以U中的k个中心点{u1,u2,···,uk}作为单纯形的顶点,在单纯形中构建网格并得到网格点集G;
(3)遍历网格点集G的所有顶点{g1,g2,···,gm},使得目标函数公式 (2-4)最小化的顶点即真值(TruthValue)点。
相较于之前的方法,主要在第一步中做了改动,这里有两个原因: (1)在实际应用中,数据量并未达到一定的数值,因此若使用该算法进行抽样,将会使得数据的抽样误差增大;(2)将数据集分成子集采用了k-means聚类法,该聚类方法有着速度快、效率高等特点,但却有着收敛到最优解难的缺点,因此,在实验中多运行几次该算法,取其中的最优解,从而使最终结果更加可靠。以此便得到了以第i个扰动模型为初始模型为变化的真值模型
Figure RE-GDA0002969463020000135
第三步:在真值发现中求得所有的权重wi,p*是所有源的加权平均值
Figure RE-GDA0002969463020000136
因此,p*能够反应上述变化模型的综合情况,换言之, p*是上述模型的加权整合。由此可以看出,相较于以往的不确定性评价与表达方法,此方法通过加权的概念,突出了关键少数,能让这些更接近真实模型的模型发挥更大的作用,从而使得模型的不确定性更加准确且客观。此外,通过第二步得到的模型改变了以往只能单纯刻画不确定性的缺点,此方法可以表达这些不确定性是向新地层延伸的还是向着老地层延伸的。
因此,为了得到最终的不确定性,该步骤需要对第二步得到的N 个
Figure RE-GDA0002969463020000141
再做一次真值发现算法,得到最终的p*和权重集合W。p*是一组向量,向量中的每个值的取值范围是[-1,1],其中,0代表着在该地质单元中,完全不存在不确定性,[-1,0)代表不确定性是向着老的地质单元发生变化的,(0,1]代表不确定性是向着新的地质单元发生变化的,且这两种变化,随着绝对值越靠近1,代表不确定性变化越大。权重集合W代表了模型集合P={p1,p2,···,pn}的重要性,wi值越大,代表着该模型的重要性越高,反之,代表模型的重要性越低。第四步:三维地质模型的不确定性主要来源于构造边界的数据稀疏性。那么是否可以通过增加构造边界上的数据,从而使得三维地质模型的不确定性降低。这便引出了本发明的前提假设:假设增加某一条或某几条构造边界的数据,则模型的不确定性降低。
为了验证此假设,需要设计对照实验:(1)通过原始数据进行建模;(2)在原始数据的基础上,增加可靠的钻孔、剖面或地球物理数据,修正该模型;(3)对两组数据分别扰动若干次,对两组数据进行整合;(4)通过可视化的方法直观的比较两组数据发生的变化,并通过格子数来定量的表征这样的变化,来与假设进行对比,若数据发生变化的格子数降低,则说明模型的可靠性增加,假设成立;反之,若数据发生变化的格子数升高,则说明模型的可靠性降低,假设不成立。
第五步:在进行此步骤之前,需要做一个模拟实验:实验含随机扰动数据,通过真值发现算法,得到其符合正态分布规律的权重,为了证实这一点,本方法运用了卡方拟合优度检验。
在保证数据量足够大的时候,权重集服从正态分布,则可以使用正态分布法对测量模型进行可靠性评价。(1)正态分布法:地球化学异常求解中,有一种求解方法是用背景值加或减两倍标准差作为异常的上限和下限。正态分布法将该方法的核心思想纳入其中,将均值加或减一倍标准差和均值加或减两倍标准差作为临界点,将正态分布构成的区域划分为了5个区域,通过这种分级的方式来定性的评价模型的质量。
通过此方法,能够一定意义上评价测量模型或扰动模型的等级,可以对其进行定性分析。此外,本方法还对其进行定量分析,首先要将服从正态分布的模型权重转变为标准正态分布,通过查标准正态分布表的方式来确定该模型所对应的概率值,从而可以给出该模型的置信程度。
Figure RE-GDA0002969463020000151
其中,μ是数据的均值,σ是数据的方差。
置信程度越大,意味着模型的可靠性越高;反之,置信程度越小意味着模型的可靠性越低。但此方法必须使得权重集W服从正态分布,因此有一定的局限性。而概率分布法既可以定量的评价测量模型和扰动,由不局限于正态分布的前提,因此可以应用此方法进行可靠性评价。
(2)累积分布函数法:累积分布函数(Cumulative Distribution Function),又叫分布函数,是概率密度函数的积分,能完整描述一个实随机变量X的概率分布。一般以大写CDF标记,与概率密度函数 probability density function(小写pdf)相对。对于所有实数x,累积分布函数定义如下:
FX(x)=P(X≤x)
因此,可使用CDF确定取自总体的随机观测值将小于或等于特定值的概率,继而可以定量的确定该观测值的不确定性,如图4。
图5为本发明所提供的基于三维地质模型的地质表征情况的评价系统结构图,如图5所示,一种基于三维地质模型的地质表征情况的评价系统,包括:
三维地质测量模型生成模块501,用于获取地层和构造原始测量数据,根据所述地层和构造原始测量数据生成三维地质测量模型。
三维扰动模型生成模块502,用于对所述地层和构造原始测量数据进行扰动,生成扰动数据,并根据所述扰动数据生成三维扰动模型;所述三维地质测量模型以及所述三维扰动模型为三维地质模型。
地质模型评价数据集形成模块503,用于将所述三维地质模型转换为三维矿块模型,并将所述三维矿块模型按照坐标展开成一维数组,完成预处理,形成地质模型评价数据集。
不确定性确定模块504,用于根据所述地层和构造的测量数据集,利用真值发现算法对所述三维地质模型进行处理,运用所述三维地质模型,确定所述三维地质模型的不确定性,并获取利用真值发现算法确定的所述三维矿块模型的不确定性过程中的每个信息源的真值点和每个信息源的权重。
用于定量评价的三维地质模型构建模块505,用于基于所述每个信息源的真值点以及所述每个信息源的权重对所述三维矿块模型进行定性评价和定量评价,构建用于定量评价的三维地质模型;所述定性评价用于评价所述三维地质测量模型或所述三维扰动模型的质量;所述定量评价用于评价所述三维地质测量模型或所述三维扰动模型中观测值的不确定性;所述用于定量评价的三维地质模型用于评价地质表征情况。
以湖南花垣MVT铅锌矿矿集区为例,对湖南花垣MVT铅锌矿矿集区建模验证本发明的技术方案。
数据收集与整理:
花垣-渔塘铅锌矿自20世纪以来,进行了多次勘查工作,取得了海量的勘查数据,如钻孔数据、探槽数据、坑道工程数据、物化探数据、相关勘查报告等。研究区通过1:5万的区调和矿调工作,积累了花垣县幅和麻栗场幅等基础地质资料,为重点区域的区域三维地质建模提供了数据基础。
通过对相关资料进行收集、整理发现,随着数字化建设的不断深入,近年来的相关资料和图件基本采用电子文档和计算机制图,而早期的勘查资料大多为纸质资料。电子版资料需要按照研究区三维空间数据库的格式要求进行格式转换,或重新录入,经检查通过后进入数据库。而纸质文档和图件则首先要进行数字化,信息提取与重新录入,经格式检查后进入数据库,表1为花垣地质调查数据集示意表。
表1
Figure RE-GDA0002969463020000161
Figure RE-GDA0002969463020000171
以此为基础,获取隐式三维地质建模所需的三种数据:构造边界上的控制点(三维点)、方向(倾向和倾角)和地质单元与地质单元之间的拓扑关系。在此基础之上,应用Intrepid的GeoModeller软件,构建测量模型。
研究区地质背景:
如图6,花垣MVT铅锌矿矿集区位于扬子陆块东南缘与雪峰造山带的过渡区,花垣-张家界深大断裂与麻栗场断裂之间,总体走向北北东。矿集区内主要出露了从青白口系至寒武系的一系列地层,从下到上依次为青白口系板溪群、南华系大塘坡组、南沱组、震旦系陡山沱组、灯影组、寒武系牛蹄塘组、石牌组、清虚洞组、高台组、娄山关组。少量主体由灰岩组成的奥陶系地层分布于矿集区西北角,第四系零星分布于沟谷中。青白口系板溪群岩性为浅灰绿色绢云母板岩、粉砂质板岩,南华系大塘坡组为重要含锰矿层位,地层中夹菱锰矿层,岩性为黑色薄层炭质泥岩灰岩透镜体。南沱组为深灰色厚层状冰碛砾岩、含砾砂屑泥岩。陡山沱组为黑色薄层炭质泥岩与灰色厚层粉晶白云岩互层,灯影组为灰色厚层粉晶-细晶白云岩。寒武系地层在本区出露最广,寒武系底部牛蹄塘组为黑色薄层含炭泥岩,石牌组岩性为灰色薄-中厚层状粉砂质泥岩、粉砂岩夹岩屑细砂岩,清虚洞组下部为灰色中厚层状藻灰岩、泥质灰岩、泥晶灰岩,上部为浅灰、灰白色中厚层状白云质灰岩,高台组为灰白色薄-中层状粉细晶白云岩,娄山关组为灰白色厚层块状粉细晶白云岩。
具体流程:
总结并提出的真值发现出发,开展与MVT铅锌矿床深部少数据三维地质模型可靠性的评价技术工作。
(1)预处理。
预处理模块的主要功能是构建研究所需的数据,将早期的勘查纸质资料按照研究区三维空间数据库的格式要求进行格式转换,或重新录入。此外,根据这些实地测量数据,建立测量模型,具体过程包括①建立地层序列,添加断层;②创建地表,添加地表线和产状;③创建剖面,添加产状和地质界线等信息;④添加三维地质模型的相关信息;⑤生成三维地质模型。
(2)扰动数据的生成与扰动模型建立。
通过蒙特卡罗模拟对原始测量数据进行扰动,设置系数κ,并建立地层错断关系和顺序关系,生成扰动数据,最后利用扰动数据建立 50个扰动模型,如图7所示。
自此,已经得到了包含测量模型在内的51个三维地质模型。为了方便接下来的工作,需要将模型进行变换。事实上,应用 GeoModeller构建的模型是一种三角网格构成的曲面模型,这很难用于接下来的计算,这是因为曲面模型更像是一种矢量模型,不同模型之间很难进行比较。此外,对于真值发现算法,每条输入数据均为一维数组(向量)。因此,需要将矢量模型栅格化。
矿块模型可以说是二维GIS栅格模型的三维表示,每个格子具有不同的地质属性,从而可以方便的计算矿石含量。在这一步中,将 51个三维地质模型应用中国地质科学院矿产资源研究所自行研发的探矿者软件转化为大小为50×50×50的三维矿块模型,如图8所示。
最后,将上述矿块模型按照坐标展开成125000的一维数组,形成数据集P存储在data.csv中,表2为数据集P节选示意表,如表2 所示,其中1-13代表从老到新的地层需要,14代表地表以上的空白区域,15-17代表断层。自此,便得到了方法所用的数据。接下来,将应用真值发现方法对三维地质模型的不确定性进行评价。
表2
Figure RE-GDA0002969463020000181
Figure RE-GDA0002969463020000191
(3)三维地质模型的不确定性评价与表达。
本次实验将以测量模型p_50为初始模型,其它模型为比较模型。此环节将要用到Python数据分析中一个很重要的库:Pandas。其步骤如下所示:
第一步:应用Pandas中的read_csv方法读入data.csv存储在 models变量中。
第二步:将数据集中的p_50作为初始数据存储在initial_model 变量中。
第三步:将models中的p_50删除。
第四步:循环读入models中的数据放入temp,与initial_model 进行比较。若temp中的格子数字大于initial_model中的格子,则将该格子赋值1;若temp中的格子数字小于initial_model中的格子,则将该格子赋值-1;若temp中的格子数字等于initial_model中的格子,则将该格子赋值0,将结果存在列表list中。最后,将素有的list存储在二维列表list_whole中并应用model.to_csv函数输出成文件 input_data50.csv。
这便是真值发现算法所应用的第一个数据。遍历数据集P,将所有的p_i作为初始数据,循环计算上述步骤,即可得到所有的 input_datai.csv文件。
在应用input_data50.csv之前,首先需要将真值发现中几个重要的函数进行实现,在这里,主要应用的程序库有。首先是目标函数 object_function:
输入:数据集P、权重集W以及真值向量p*
第一步:应用Numpy中的linalg.norm函数循环计算数据集P中 pi与p*之间的距离,并与wi相乘,将结果存储在列表object中。
第二步:将列表object中的所有值进行求和,存储在add中。
输出:输出add。
其次要对求解权重值函数weights进行实现:
输入:数据集P、真值向量p*
第一步:应用Numpy中的linalg.norm函数和math.pow函数循环计算pi与p*距离的平方,并对这些平方进行求和存储在sum_result 中。
第二步:以求解权重w1举例。应用Numpy中的linalg.norm函数和math.pow函数计算p1与p*距离的平方,并用sum_result比上该平方值得到中间值t,最后用math.log10函数对t取对数即为w1。遍历数据集P,将求得的wi存到权重集W中。
输出:权重集W。
接下来,将应用Pandas、math和Scikit-learn库对整个算法进行实现,为了方便说明,以得到的input_data50.csv作为输入数据:
第一步:用Pandas的read_csv方法读入input_data50.csv;
第二步:计算分组所需的k值,其计算公式为:
Figure RE-GDA0002969463020000211
其中n代表数据集个数,Δ代表了数据集任意两两之间最大值与最小值之间的比值,ε代表误差系数。由公式可见,在n和Δ一定的情况下,ε越大,k越小。值得注意的是,k值的大小将影响格子数字的大小,从而影响整个实验的计算效率,在第四步中详细探讨这个情况。这里选择ε为0.1,即误差系数为10%。则k值为13。
第三步:应用Scikit-learn中的Kmeans函数将数据聚为13类。聚类算法有其固有缺陷,即不能有效的收敛到全局最优解,因此需要在此多做几次Kmeans,将其中最好的一组解挑出,得到其聚类中心点存储在U中,作为单纯形的顶点。
第四步:在单纯形U中构建网格。以往的网格化方式是对每个轴之间进行分割,然后将分割的结果进行组合从而生成网格。例如,在二维笛卡尔坐标系下,将x1到x2之间分成10份,将y1到y2之间分成 10份,则形成的网格数就是10×10=100个;三维坐标系还要增加一个Z轴,将z1到z2之间分成10份,则网格数为1000个;以此类推,假设数据有n维,则网格数应为10n个。这大大增加了数据的密度,从而使得算法的结果能无限逼近全局最优解。但这种方法存在着一个很大的缺点,特别依赖数据的维度n,时间复杂度(o(nn))会随着维度n的增加呈指数倍增长,空间复杂度也是如此。
因此,本发明提出了一个新的网格化算法:
Step1:计算单纯形顶点U中任意两点的中值,与原有顶点一起存在U1中。
Step2:对Step1进行迭代,直到网格点足够多的时候停止迭代。
Step3:去除重复的网格点。
这种方法规避了数据维度,也能够有效的增加格子,以本发明的 13个顶点为例,第一次迭代,能够生成91个新格子;第二次迭代,能够生5460个新格子;第三次迭代就可以生成15409576个新格子。因此该方法也能无限逼近最优解。
事实上,当该方法迭代到第四次时,实验所用的计算机已经很难进行计算。因此,本发明将三次迭代生成的格子放入Grid中。
第五步:遍历Grid中的网格点,作为
Figure RE-GDA0002969463020000223
将其和数据集P带入到权重值函数weights中,得到权重集Wi;将
Figure RE-GDA0002969463020000221
Wi和数据集P带入到目标函数object_function中,得到addi。最后,比较所有的addi,将最小的addi对应的
Figure RE-GDA0002969463020000222
作为真值p*,权重集Wi作为最终的权重。
循环重复一到五步,直到带入最后一个input_datai.csv文件生成结果。
最后,将上述生成的51个p*在做一次真值发现,得到的最终结果即为三维地质模型的不确定性。
本发明将基于探矿者软件二次开发的方式,可视化三维地质模型的不确定性。该工作的本质便是在探矿者开发程序中找到可视化矿块的模块,通过以下规则更改该模块:(1)不确定性为0的区域为第一颜色,代表该区域不存在不确定性;(2)不确定性大于0的区域为第二颜色,代表该区域的不确定性有着向年轻地质年代变化的趋势;(3) 不确定性小于0的区域为第三颜色,代表该区域的不确定性有着向年老地质年代变化的趋势。最终的结果如图9所示,其中,按照颜色由深至浅排列,第二颜色>第一颜色>第三颜色,通常情况下,在可视化显示时,第一颜色为蓝色,第二颜色为红色,第三颜色为绿色。由图 9可以看出,这组数据的不确定性很高。这是因为,本发明在扰动过程中,构造边界中提供的产状点数据略为稀疏。接下来,将通过在构造边界增加数据点的方式,减少隐式三维地质建模过程中的不确定性。
(4)三维地质模型不确定性的降低。
本阶段将设计两组数据来与上一步的结果进行对比。相较于第一组数据,第二组数据在牛蹄塘组增加了产状数据。第三组数据则在除错断关系外的构造边界增加了产状数据。通过真值发现的算法得到结果。首先对三组数据的不确定性进行可视化,如图10所示,可以清晰的看到,图10a、图10b到图10c有着明显的差距,图10a、图10b 的不确定性明显更高,然而图10a到图10b的变化似乎不那么明显。但从图10d到图10e可以清晰的看出,牛蹄塘组附近的不确定性明显降低了。
为了更加明确相比第一组数据,第二组数据的不确定性有着明显的降低,实验对三个模型125000个格子的变化程度做了统计,如图 11所示。由图11可以看出,从模型1到模型3,不确定性为0或几乎为0的格子数是递增的。由此可以确定,随着构造边界产状数据的增加,隐式三维地质建模中产生的不确定性是降低的。由此可以引出三维地质模型不确定性评价与表达工作的其中一个意义:为下一步勘察工作指明了方向。
(5)测量模型的可靠性评价。
①正态分布法应用与结果分析:
既然权重集W服从正态分布,那么就可以先应用正态分布法对权重w50进行评价。其方法如下:
第一步:应用Pandas库中的read_csv函数读入权重集W存入 weights变量中。
第二步:求weights变量的均值mean,标准差std,求得正态分布函数normfun。
第三步:应用正态分布函数计算均值加减一倍方差的坐标 (downx1,downy1)、(upx1,upy1);计算均值加减一倍方差的坐标 (downx2,downy2)、(upx2,upy2)。
第四步:应用正态分布函数normfun计算权重w50的y值。
第五步:应用matplotlib库可视化第二、三、四步的信息,如图 12所示。
第六步:对权重w50运用公式
Figure RE-GDA0002969463020000241
进行标准正态化,存储在 w50中。
第七步:应用scipy中的stats.norm.cdf函数,求出w50所对应的概率值。
由图12可知,w_50的概率位于正态分布曲线中间靠左侧的位置,属于C级,可以认为测量模型的可靠性一般。此外,通过将w_50进行标准正态分布化,通过累计概率密度函数可以得知,w_50的概率为0.308,因此,该模型的置信度为30.8%,可靠性也就是30.8%。
为了探究不确定性对测量模型可靠性的影响,还做了数据集1,数据集2和数据集3的正态分布曲线的比较,如图13。
从图13可以首先可以看出,三组数据的均值基本一致,方差有着一定的差异。第一组数据的方差较大,正态分布曲线的范围相对分散,与之相对,第三组数据的方差较小,分布范围相对集中。此外,第一组数据中,测量模型位于曲线偏右的位置;第二组数据中,测量模型位于曲线略偏左的位置;第三组数据中,测量模型更靠向右侧的底部。通过查表,第一组数据测量模型可靠性为30.8%,第二组数据测量模型可靠性为58.0%,第二组数据测量模型可靠性为97.0%。从而可以得出,随着不确定性的降低,权重集的分布范围会不断集中,测量模型的可靠性也会不断上升。
②累积分布函数法应用与结果分析:
可以说,累积分布函数法是正态分布法的改进。应用此方法,可以在定性的基础上给出定量的可靠性值。其方法如下所示:
第一步:应用Pandas库中的read_csv函数读入权重集W存入 weights变量中。
第二步:应用statsmodels.api中的distributions.ECDF求解累积分布函数ecdf。
第三步:对weights进行排序存储在x中,用ecdf对x求解得到 y。
第四步:对w_50进行排序存储在x1中,用ecdf对w_50求解得到y1。
第五步:应用matplotlib库可视化第二、三、四步的信息,如图 14所示。
最终结果表明,权重w_50处在累积分布函数的中间偏下的位置,与正态分布法类似,表明测量模型的可靠性一般。但不同于正态分布法,累积分布函数的纵坐标为累积概率和,经结果表明,权重w_50 的累积概率和为33.3%,从而可以定量的表达其可靠性高达33.3%。
此外,还做了模型1,模型2和模型3累计概率函数曲线的比较,如图15所示。结果表明:与正态分布法类似,从图15可以看出,第一组数据集的测量模型在中间下方的位置,其累积概率值为33.3%;第二组数据集的测量模型在靠近中间的位置,其累积概率值约为51.0%;第三组数据在左上方,其累积概率值约为82.0%。因此,也可以得出与正态分布法类似的结论,测量模型的可靠性也会不断上升。
事实上,这样的结果也符合三维地质模型不确定性存在的规律。随着模型越来越精确,势必会造成模型中存在的不确定性区域越来越少,使得扰动模型发生的变化越来越小,从而使得权重集的分布越来越集中。此外,随着模型越来越精确,由原始数据构成的测量模型就越来越可信,从而可靠性也会越来越高。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。

Claims (10)

1.一种基于三维地质模型的地质表征情况的评价方法,其特征在于,包括:
获取地层和构造原始测量数据,根据所述地层和构造原始测量数据生成三维地质测量模型;
对所述地层和构造原始测量数据进行扰动,生成扰动数据,并根据所述扰动数据生成三维扰动模型;所述三维地质测量模型以及所述三维扰动模型为三维地质模型;
将所述三维地质模型转换为三维矿块模型,并将所述三维矿块模型按照坐标展开成一维数组,完成预处理,形成地质模型评价数据集;
根据所述地层和构造的测量数据集,利用真值发现算法对所述三维地质模型进行处理,运用所述三维地质模型,确定所述三维地质模型的不确定性,并获取利用真值发现算法确定的所述三维矿块模型的不确定性过程中的每个信息源的真值点和每个信息源的权重;
基于所述每个信息源的真值点以及所述每个信息源的权重对所述三维矿块模型进行定性评价和定量评价,构建用于定量评价的三维地质模型;所述定性评价用于评价所述三维地质测量模型或所述三维扰动模型的质量;所述定量评价用于评价所述三维地质测量模型或所述三维扰动模型中观测值的不确定性;所述用于定量评价的三维地质模型用于评价地质表征情况。
2.根据权利要求1所述的基于三维地质模型的地质表征情况的评价方法,其特征在于,所述对所述地层和构造原始测量数据进行扰动,生成扰动数据,并根据所述扰动数据生成三维扰动模型,具体包括:
基于蒙特卡洛模拟的不确定性传播方法对所述地层和构造原始测量数据进行扰动,生成扰动数据,并根据所述扰动数据生成三维扰动模型;
其中,所述蒙特卡洛模拟的不确定性传播方法中的两种标准分布包括位置的正态分布以及方向的vMF分布;
所述位置的正态分布的概率密度函数为:
Figure FDA0002865133630000011
其中,N(x|ε,σ)为位置的正态分布的概率密度;x为三维地质模型;ε为算数平均值,σ为标准差;
所述方向的vMF分布的概率密度函数为:
Figure FDA0002865133630000012
且||γ||=1;其中,vMF(x|ε,σ)为方向的vMF分布的概率密度;γT为转置的平均方向向量;κ为球的中心;||||为欧几里得范数;Cp(κ)为归一化常数;p为维数。
3.根据权利要求1所述的基于三维地质模型的地质表征情况的评价方法,其特征在于,所述根据所述地层和构造的测量数据集,利用真值发现算法对所述三维地质模型进行处理,运用所述三维地质模型,确定所述三维地质模型的不确定性,并获取利用真值发现算法确定的所述三维矿块模型的不确定性过程中的每个信息源的真值点和每个信息源的权重,之后还包括:
基于地质拓扑知识,利用所述三维地质模型反推地质构造的空间拓扑结构,形成地质拓扑坐标系,并与已知地质拓扑进行对比分析,验证所述三维地质模型的不确定性。
4.根据权利要求1所述的基于三维地质模型的地质表征情况的评价方法,其特征在于,所述根据所述地层和构造的测量数据集,利用真值发现算法对所述三维地质模型进行处理,运用所述三维地质模型,确定所述三维地质模型的不确定性,并获取利用真值发现算法确定的所述三维矿块模型的不确定性过程中的每个信息源的真值点和每个信息源的权重,具体包括:
利用k-means聚类法将所述地质模型评价数据集P分成k个子集,并将k个所述子集的中心点放入集合U;
以所述集合U中的k个中心点{u1,u2,…,uk}作为单纯形的顶点,在单纯形中构建网格并确定网格点集G;
遍历所述网格点集G的所有顶点{g1,g2,…,gm},使得目标函数最小化的顶点确定为每个信息源的真值点,并获取每个信息源的权重。
5.根据权利要求4所述的基于三维地质模型的地质表征情况的评价方法,其特征在于,所述目标函数为:
Figure FDA0002865133630000021
其中,pi为第i个信息源的真值向量;n为信息源的数量;p*为使得目标函数最小化的真值向量;wi为第i个信息源的权重。
6.根据权利要求1所述的基于三维地质模型的地质表征情况的评价方法,其特征在于,所述根据所述地层和构造的测量数据集,利用真值发现算法对所述三维地质模型进行处理,运用所述三维地质模型,确定所述三维地质模型的不确定性,并获取利用真值发现算法确定的所述三维矿块模型的不确定性过程中的每个信息源的真值点和每个信息源的权重,之后还包括:
在所述原始测量数据上添加构造边界数据;所述构造边界数据包括钻孔、剖面以及地球物理数据;
根据所述构造边界数据修正所述三维地质测量模型,确定修正后的三维地质测量模型;
根据所述修正后的三维地质测量模型依次经过扰动以及转换,确定修正后的三维矿块模型;
对比所述三维矿块模型以及所述修正后的三维矿块模型;
若所述修正后的三维矿块模型内的格子数小于所述三维矿块模型,确定所述三维矿块模型的可靠性增加;
若所述修正后的三维矿块模型内的格子数大于所述三维矿块模型,确定所述三维矿块模型的可靠性降低。
7.根据权利要求1所述的基于三维地质模型的地质表征情况的评价方法,其特征在于,基于所述每个信息源的真值点以及所述每个信息源的权重对所述三维矿块模型进行定性评价和定量评价,构建用于定量评价的三维地质模型,具体包括:
基于所述每个信息源的真值点以及所述每个信息源的权重,利用正态分布法或累积分布函数法对所述三维矿块模型进行定性评价和定量评价,构建用于定量评价的三维地质模型。
8.一种基于三维地质模型的地质表征情况的评价系统,其特征在于,包括:
三维地质测量模型生成模块,用于获取地层和构造原始测量数据,根据所述地层和构造原始测量数据生成三维地质测量模型;
三维扰动模型生成模块,用于对所述地层和构造原始测量数据进行扰动,生成扰动数据,并根据所述扰动数据生成三维扰动模型;所述三维地质测量模型以及所述三维扰动模型为三维地质模型;
地质模型评价数据集形成模块,用于将所述三维地质模型转换为三维矿块模型,并将所述三维矿块模型按照坐标展开成一维数组,完成预处理,形成地质模型评价数据集;
不确定性确定模块,用于根据所述地层和构造的测量数据集,利用真值发现算法对所述三维地质模型进行处理,运用所述三维地质模型,确定所述三维地质模型的不确定性,并获取利用真值发现算法确定的所述三维矿块模型的不确定性过程中的每个信息源的真值点和每个信息源的权重;
用于定量评价的三维地质模型构建模块,用于基于所述每个信息源的真值点以及所述每个信息源的权重对所述三维矿块模型进行定性评价和定量评价,构建用于定量评价的三维地质模型;所述定性评价用于评价所述三维地质测量模型或所述三维扰动模型的质量;所述定量评价用于评价所述三维地质测量模型或所述三维扰动模型中观测值的不确定性;所述用于定量评价的三维地质模型用于评价地质表征情况。
9.根据权利要求8所述的基于三维地质模型的地质表征情况的评价系统,其特征在于,所述三维扰动模型生成模块,具体包括:
三维扰动模型单元,用于基于蒙特卡洛模拟的不确定性传播方法对所述地层和构造原始测量数据进行扰动,生成扰动数据,并根据所述扰动数据生成三维扰动模型;
其中,所述蒙特卡洛模拟的不确定性传播方法中的两种标准分布包括位置的正态分布以及方向的vMF分布;
所述位置的正态分布的概率密度函数为:
Figure FDA0002865133630000041
其中,N(x|ε,σ)为位置的正态分布的概率密度;x为三维地质模型;ε为算数平均值,σ为标准差;
所述方向的vMF分布的概率密度函数为:
Figure FDA0002865133630000042
且||γ||=1;其中,vMF(x|ε,σ)为方向的vMF分布的概率密度;γT为转置的平均方向向量;κ为球的中心;||||为欧几里得范数;Cp(κ)为归一化常数;p为维数。
10.根据权利要求8所述的基于三维地质模型的地质表征情况的评价系统,其特征在于,所述不确定性确定模块,具体包括:
聚类单元,用于利用k-means聚类法将所述地质模型评价数据集P分成k个子集,并将k个所述子集的中心点放入集合U;
网格点集确定单元,用于以所述集合U中的k个中心点{u1,u2,…,uk}作为单纯形的顶点,在单纯形中构建网格并确定网格点集G;
每个信息源的真值点确定单元,用于遍历所述网格点集G的所有顶点{g1,g2,…,gm},使得目标函数最小化的顶点确定为每个信息源的真值点,并获取每个信息源的权重。
CN202011580495.1A 2020-12-28 2020-12-28 一种基于三维地质模型的地质表征情况的评价方法及系统 Active CN112652066B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011580495.1A CN112652066B (zh) 2020-12-28 2020-12-28 一种基于三维地质模型的地质表征情况的评价方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011580495.1A CN112652066B (zh) 2020-12-28 2020-12-28 一种基于三维地质模型的地质表征情况的评价方法及系统

Publications (2)

Publication Number Publication Date
CN112652066A true CN112652066A (zh) 2021-04-13
CN112652066B CN112652066B (zh) 2021-09-28

Family

ID=75363564

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011580495.1A Active CN112652066B (zh) 2020-12-28 2020-12-28 一种基于三维地质模型的地质表征情况的评价方法及系统

Country Status (1)

Country Link
CN (1) CN112652066B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113641775A (zh) * 2021-08-16 2021-11-12 中国人民武装警察部队黄金第一总队 一种基于gis平台的三维、实时地球物理剖面解释方法
CN114626230A (zh) * 2022-03-18 2022-06-14 杨邦会 一种地质矿产资源储量的模拟方法
CN115965764A (zh) * 2022-11-21 2023-04-14 中国地质大学(北京) 计算地表沉降的复杂地质模型四面体网格划分方法及装置

Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102279980A (zh) * 2010-06-13 2011-12-14 中国地质科学院矿产资源研究所 地质勘探矿体三维建模方法及其装置
CN102609986A (zh) * 2012-03-14 2012-07-25 中国矿业大学(北京) 数字矿山中矿体建模系统及其建模和检测方法
US8600708B1 (en) * 2009-06-01 2013-12-03 Paradigm Sciences Ltd. Systems and processes for building multiple equiprobable coherent geometrical models of the subsurface
CN104881360A (zh) * 2015-06-10 2015-09-02 合肥工业大学 一种基于云模型和模糊聚合的软件质量综合评价方法
CN105653815A (zh) * 2016-01-19 2016-06-08 中国海洋石油总公司 一种基于岩石物理模型理论的定量解释油藏流体分布方法
CN106920176A (zh) * 2017-03-14 2017-07-04 中国地质科学院矿产资源研究所 一种矿集区尺度矿产资源估算方法及系统
CN106934860A (zh) * 2017-01-12 2017-07-07 天津大学 一种基于t样条的三维地质建模方法
CN108665544A (zh) * 2018-05-09 2018-10-16 中冶北方(大连)工程技术有限公司 三维地质模型建模方法
CN109116428A (zh) * 2018-07-02 2019-01-01 中国石油天然气股份有限公司 一种缝洞型碳酸盐岩油藏不确定性建模方法及其装置
CN109919944A (zh) * 2018-12-29 2019-06-21 武汉大学 一种复杂场景建筑物变化检测的联合超像素图割优化方法
CN110334882A (zh) * 2019-07-17 2019-10-15 中国地质大学(北京) 一种隐伏矿体定量预测方法及装置
CN111339691A (zh) * 2020-04-27 2020-06-26 南京智慧岩土工程技术研究院有限公司 一种基于voxler软件的智慧岩土工程参数三维分析与评价系统及方法
CN111553981A (zh) * 2020-04-30 2020-08-18 山东省地质矿产勘查开发局八〇一水文地质工程地质大队 一种基于建模区域分类的三维地质建模方法及系统
CN111764895A (zh) * 2020-08-12 2020-10-13 重庆地质矿产研究院 一种适用于页岩气储层地质模型的测井评价方法
CN111832227A (zh) * 2020-07-17 2020-10-27 中国石油大学(北京) 基于深度学习的页岩气饱和度确定方法、装置和设备
CN111859811A (zh) * 2020-07-30 2020-10-30 中国地质科学院矿产资源研究所 一种基于模糊逻辑和机器学习的成矿预测方法及系统

Patent Citations (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8600708B1 (en) * 2009-06-01 2013-12-03 Paradigm Sciences Ltd. Systems and processes for building multiple equiprobable coherent geometrical models of the subsurface
US9052413B1 (en) * 2009-06-01 2015-06-09 Paradigm Sciences Ltd. Systems and processes for building multiple equiprobable coherent geometrical models of the subsurface
CN102279980A (zh) * 2010-06-13 2011-12-14 中国地质科学院矿产资源研究所 地质勘探矿体三维建模方法及其装置
CN102609986A (zh) * 2012-03-14 2012-07-25 中国矿业大学(北京) 数字矿山中矿体建模系统及其建模和检测方法
CN104881360A (zh) * 2015-06-10 2015-09-02 合肥工业大学 一种基于云模型和模糊聚合的软件质量综合评价方法
CN105653815A (zh) * 2016-01-19 2016-06-08 中国海洋石油总公司 一种基于岩石物理模型理论的定量解释油藏流体分布方法
CN106934860A (zh) * 2017-01-12 2017-07-07 天津大学 一种基于t样条的三维地质建模方法
CN106920176A (zh) * 2017-03-14 2017-07-04 中国地质科学院矿产资源研究所 一种矿集区尺度矿产资源估算方法及系统
CN108665544A (zh) * 2018-05-09 2018-10-16 中冶北方(大连)工程技术有限公司 三维地质模型建模方法
CN109116428A (zh) * 2018-07-02 2019-01-01 中国石油天然气股份有限公司 一种缝洞型碳酸盐岩油藏不确定性建模方法及其装置
CN109919944A (zh) * 2018-12-29 2019-06-21 武汉大学 一种复杂场景建筑物变化检测的联合超像素图割优化方法
CN110334882A (zh) * 2019-07-17 2019-10-15 中国地质大学(北京) 一种隐伏矿体定量预测方法及装置
CN111339691A (zh) * 2020-04-27 2020-06-26 南京智慧岩土工程技术研究院有限公司 一种基于voxler软件的智慧岩土工程参数三维分析与评价系统及方法
CN111553981A (zh) * 2020-04-30 2020-08-18 山东省地质矿产勘查开发局八〇一水文地质工程地质大队 一种基于建模区域分类的三维地质建模方法及系统
CN111832227A (zh) * 2020-07-17 2020-10-27 中国石油大学(北京) 基于深度学习的页岩气饱和度确定方法、装置和设备
CN111859811A (zh) * 2020-07-30 2020-10-30 中国地质科学院矿产资源研究所 一种基于模糊逻辑和机器学习的成矿预测方法及系统
CN111764895A (zh) * 2020-08-12 2020-10-13 重庆地质矿产研究院 一种适用于页岩气储层地质模型的测井评价方法

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
JIN XING 等: "3D geological modelling and uncertainty analysis for 3D targeting in Shanggong gold deposit (China)", 《JOURNAL OF GEOCHEMICAL EXPLORATION》 *
周杏: "架空线路热定值和导体温度的不确定度研究", 《中国优秀硕士学位论文全文数据库 工程科技Ⅱ辑》 *
曾红坤: "生产矿山矿床三维矿体地质实体模型的建立", 《科技风》 *
李楠 等: "一种三维地质几何模型不确定性评价方法", 《中国地球科学联合学术年会2018》 *
潘君: "基于统计模型的DTI神经纤维追踪算法研究", 《中国优秀硕士学位论文全文数据库 医药卫生科技辑》 *
谭学群 等: "复杂断块油藏三维地质模型多参数定量评", 《石油勘探与开发》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113641775A (zh) * 2021-08-16 2021-11-12 中国人民武装警察部队黄金第一总队 一种基于gis平台的三维、实时地球物理剖面解释方法
CN114626230A (zh) * 2022-03-18 2022-06-14 杨邦会 一种地质矿产资源储量的模拟方法
CN114626230B (zh) * 2022-03-18 2022-11-04 杨邦会 一种地质矿产资源储量的模拟方法
CN115965764A (zh) * 2022-11-21 2023-04-14 中国地质大学(北京) 计算地表沉降的复杂地质模型四面体网格划分方法及装置

Also Published As

Publication number Publication date
CN112652066B (zh) 2021-09-28

Similar Documents

Publication Publication Date Title
Yousefi et al. Exploration information systems–A proposal for the future use of GIS in mineral exploration targeting
CN112652066B (zh) 一种基于三维地质模型的地质表征情况的评价方法及系统
Xu et al. Deep learning of rock images for intelligent lithology identification
Agterberg Geomathematics: theoretical foundations, applications and future developments
Xiang et al. 3D mineral prospectivity mapping with random forests: A case study of Tongling, Anhui, China
Li et al. Prospectivity mapping for tungsten polymetallic mineral resources, Nanling metallogenic belt, south China: Use of random forest algorithm from a perspective of data imbalance
CN104866653A (zh) 一种获取地下三维密度结构的方法
Li et al. An improved buffer analysis technique for model-based 3D mineral potential mapping and its application
Li et al. GeoCube: A 3D mineral resources quantitative prediction and assessment system
CN110060173A (zh) 一种深部金矿床成矿找矿方法
Yang et al. Quantification of uncertainty associated with evidence layers in mineral prospectivity mapping using direct sampling and convolutional neural network
CN116665067B (zh) 基于图神经网络的找矿靶区优选系统及其方法
Liu et al. Developments in quantitative assessment and modeling of mineral resource potential: an overview
Wang et al. Recognition of significant surface soil geochemical anomalies via weighted 3D shortest-distance field of subsurface orebodies: a case study in the Hongtoushan copper mine, NE China
Hajihosseinlou et al. Stacking: A novel data-driven ensemble machine learning strategy for prediction and mapping of Pb-Zn prospectivity in Varcheh district, west Iran
CN109118004A (zh) 一种工程构筑选址适宜区预测方法
Sadeghi Spectrum-area method
Ferrer et al. Modeling the uncertainty in the layout of geological units by implicit boundary simulation accounting for a preexisting interpretive geological model
Chatterjee et al. Ore grade estimation of a limestone deposit in India using an artificial neural network
Mwakapesa et al. Landslide susceptibility mapping using O-CURE and PAM clustering algorithms
CN112818603B (zh) 自适应选择最优成矿预测要素的方法、终端及存储介质
ZHANG et al. Bedrock mapping based on terrain weighted directed graph convolutional network using stream sediment geochemical samplings
Talesh Hosseini et al. An Optimum Selection of Simulated Geological Models by Multi-Point Geostatistics and Multi-Criteria Decision-Making Approaches; a Case Study in Sungun Porphyry-Cu deposit, Iran
Huang et al. Landslide susceptibility evaluation using different slope units based on BP neural network
Hamzeh et al. An ABC-optimized fuzzy ELECTRE approach for assessing petroleum potential at the petroleum system level

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant